TW202229555A

TW202229555A - 用於ａ型血友病基因治療之編碼表現增加之重組ｆｖｉｉｉ變異體之病毒載體

Info

Publication number: TW202229555A
Application number: TW110136356A
Authority: TW
Inventors: 法科－甘特福克諾; 法蘭西斯卡霍林; 喬安斯藍格勒; 漢斯彼得羅騰史戴納; 弗利茲許夫利格
Original assignee: 日商武田藥品工業股份有限公司
Priority date: 2015-11-13
Filing date: 2016-11-11
Publication date: 2022-08-01
Also published as: SG11201804064WA; BR112018009732A8; US20170226188A1; EA202092049A1; JP6695426B2; KR102404550B1; CO2018005380A2; AU2016354550A1; US10189889B2; CN108602876B; CL2020001611A1; NZ742555A; ZA201803442B; IL259295B1; CA3005565A1; AU2016354550B2; MX2018005969A; EP3374388A1; KR20180070700A; EA201891138A1

Abstract

本發明尤其提供編碼因子VIII變異體之密碼子經改變聚核苷酸以在哺乳動物細胞中表現。在一些實施例中，本發明亦提供用於治療A型血友病之哺乳動物基因治療載體及方法。

Description

用於Ａ型血友病基因治療之編碼表現增加之重組ＦＶＩＩＩ變異體之病毒載體

血液凝固經由稱作凝固級聯之相互依賴生物化學反應之複雜及動態生物路徑進行。在級聯中凝血因子VIII (FVIII)為一關鍵組分。因子VIII經招募至出血位點，且形成具有活化因子IX (FIXa)及因子X (FX)之Xase複合物。Xase複合物活化FX，其反過來將凝血酶原活化成凝血酶，該凝血酶隨後活化凝固級聯中之其他組分以產生穩定凝塊(綜述於Saenko等人, Trends Cardiovasc. Med., 9:185-192 (1999)；Lenting等人, Blood, 92:3983-3996 (1998)中)。 A型血友病為先天性X連鎖出血病症，其特徵在於缺乏因子VIII活性。減弱之因子VIII活性抑制凝固級聯中之正反饋迴路。此造成不完全凝固，其顯示為持續時間增加之出血發作、廣泛擦傷、口腔及鼻自發性出血、關節僵硬及慢性疼痛，且在嚴重情況下可能顯示為內部出血及貧血(Zhang等人, Clinic. Rev. Allerg. Immunol., 37:114-124 (2009))。習知地，A型血友病由因子VIII替代治療來治療，該治療由向患有A型血友病之個體投與因子VIII蛋白(例如，血漿衍生或重組產生之因子VIII)組成。因子VIII經預防性投與以回應於急性出血發作而預防或減少出血發作之頻率，及/或在手術前後投與以處理手術期間之出血。然而，因子VIII替代治療存在若干非所要特徵。首先，因子VIII替代治療用以治療或處理A型血友病，但不治癒基本之因子VIII缺乏。歸因於此，患有A型血友病之個體在其生命週期裏需要因子VIII替代治療。連續治療為昂貴的且需要個體維持嚴格的順應性，因為對於患有嚴重A型血友病之個體而言，僅少許預防性劑量之缺失就可具有嚴重後果。第二，因為因子VIII在活體內具有相對短之半衰期，習知預防性因子VIII替代治療需要每兩天或三天投與。此為個體帶來在其全部生命中維持順應性之負擔。雖然第三代「長效」因子VIII藥物可減少投與頻率，但使用此等藥物之預防性因子FVIII替代治療仍然需要永久地每月、每週或更頻繁地投與。舉例而言，使用ELOCTATE™ [抗血友病因子(重組型)，Fc融合蛋白]之預防性治療需要每三至五天投與(ELOCTATE™ Prescribing Information, Biogen Idec Inc., (2015))。此外，尚未完全理解化學改性生物製品(例如，聚乙二醇化多肽)之長期作用。第三，15%與30%之間的接受因子VIII替代治療之所有個體形成抗因子VIII抑制劑抗體，顯示該治療效率低下。因子VIII繞道治療(例如，投與血漿衍生或重組產生之凝血酶原複合物濃縮物)可用以治療形成抑制劑抗體之個體之血友病。然而，因子VIII繞道治療不如因子VIII替代治療有效(Mannucci P.M., J Thromb Haemost., 1(7):1349-55 (2003))，且可能與增加之心臟血管併發症風險相關(Luu及Ewenstein, Haemophilia, 增刊10 2:10-16(2004))。體細胞基因治療對於治療A型血友病具有較大前景，因為其修補基本表現不足之功能因子VIII活性(例如，歸因於錯義或無義突變)，而非向個體提供因子VIII活性之單次劑量。由於此相較於因子VIII替代治療在作用機制方面存在差異，因此單次投與因子VIII基因治療載體可為個體提供因子VIII若干年，降低了治療成本且排除持續患者順應性之需要。已有效地使用凝血因子IX (FIX)基因治療來治療患有B型血友病之個體，該B型血友病為相關血液凝固病狀，其特徵在於因子IX活性減弱(Manno C.S.等人, Nat Med., 12(3):342-47 (2006))。然而，因子VIII基因治療呈現若干獨特之難題。舉例而言，全長野生型因子VIII多肽(2351個胺基酸；UniProt寄存編號P00451)比全長野生型因子IX多肽(461個胺基酸；UniProt寄存編號P00740)大五倍。因而，野生型因子VIII之編碼序列為7053個鹼基對，其太大而不能封裝於習知AAV基因治療載體中。此外，據報導因子VIII之B域缺失變異體(BDD-FVIII)之重組表現較差。因而，若干小組已嘗試改變BDD-FVIII構築體之密碼子使用，但成功有限。

因此，需要因子VIII變異體，其編碼序列更有效封裝於基因治療載體中且經由基因治療載體傳遞。亦需要更有效表現因子VIII的合成之密碼子經改變核酸。此類因子VIII變異體及密碼子經改變核酸使得可改良因子VIII缺乏(例如，A型血友病)之治療。上文缺乏及與因子VIII缺乏(例如，A型血友病)之治療相關之其他問題由所揭示密碼子經改變因子VIII變異體降低或消除。根據一些實施例，本發明提供編碼因子VIII變異體之核酸，其與因子VIII重鏈(例如，CS01-HC-NA、CS04-HC-NA或CS23-HC-NA)及輕鏈(CS01-LC-NA、CS04-LC-NA或CS23-LC-NA)之所揭示密碼子經改變序列具有高序列一致性。在一些實施例中，此等核酸在編碼因子VIII重鏈及輕鏈之序列之間進一步包括編碼替代天然因子VIII B域之連接子序列(例如，包含弗林蛋白酶(furin)裂解位點之連接子序列)的序列。在一個態樣中，本發明提供一種包括編碼因子VIII多肽之核苷酸序列之聚核苷酸。因子VIII多肽包括輕鏈、重鏈及接合重鏈C端與輕鏈N端之多肽連接子。因子VIII多肽之重鏈由與CS04-HC-NA (SEQ ID NO: 3)具有至少95%一致性之第一核苷酸序列編碼。因子FVIII多肽之輕鏈由與CS04-LC-NA (SEQ ID NO: 4)具有至少95%一致性之第二核苷酸序列編碼。多肽連接子包含弗林蛋白酶裂解位點。在上文所描述之聚核苷酸之一個實施例中，多肽連接子由與BDLO04 (SEQ ID NO: 6)具有至少95%一致性之第三核苷酸序列編碼。在一個態樣中，本發明提供一種包括編碼因子VIII多肽之核苷酸序列之聚核苷酸。因子VIII多肽包括輕鏈、重鏈及接合重鏈C端與輕鏈N端之多肽連接子。因子VIII多肽之重鏈由與CS01-HC-NA (SEQ ID NO: 24)具有至少95%一致性之第一核苷酸序列編碼。因子FVIII多肽之輕鏈由與CS01-LC-NA (SEQ ID NO: 25)具有至少95%一致性之第二核苷酸序列編碼。多肽連接子包含弗林蛋白酶裂解位點。在上文所描述之聚核苷酸之一個實施例中，多肽連接子由與BDLO01 (SEQ ID NO: 5)具有至少95%一致性之第三核苷酸序列編碼。在一個態樣中，本發明提供一種包括編碼因子VIII多肽之核苷酸序列之聚核苷酸。因子VIII多肽包括輕鏈、重鏈及接合重鏈C端與輕鏈N端之多肽連接子。因子VIII多肽之重鏈由與CS23-HC-NA (SEQ ID NO: 22)具有至少95%一致性之第一核苷酸序列編碼。因子FVIII多肽之輕鏈由與CS23-LC-NA (SEQ ID NO: 23)具有至少95%一致性之第二核苷酸序列編碼。多肽連接子包含弗林蛋白酶裂解位點。在上文所描述之聚核苷酸之一個實施例中，多肽連接子由與BDLO23 (SEQ ID NO: 7)具有至少95%一致性之第三核苷酸序列編碼。在上文所描述之聚核苷酸之一個實施例中，編碼因子VIII多肽之重鏈之第一核苷酸序列與各別重鏈序列(例如，CS04-HC-NA (SEQ ID NO: 3)、CS01-HC-NA (SEQ ID NO: 24)或CS23-HC-NA (SEQ ID NO: 22))具有至少96%一致性，且編碼因子FVIII多肽之輕鏈之第二核苷酸序列與各別輕鏈序列(例如，CS04-LC-NA (SEQ ID NO: 4)、CS01-LC-NA (SEQ ID NO: 25)或CS23-LC-NA (SEQ ID NO: 23))具有至少96%一致性。在上文所描述之聚核苷酸之一個實施例中，編碼因子VIII多肽之重鏈之第一核苷酸序列與各別重鏈序列(例如，CS04-HC-NA (SEQ ID NO: 3)、CS01-HC-NA (SEQ ID NO: 24)或CS23-HC-NA (SEQ ID NO: 22))具有至少97%一致性，且編碼因子FVIII多肽之輕鏈之第二核苷酸序列與各別輕鏈序列(例如，CS04-LC-NA (SEQ ID NO: 4)、CS01-LC-NA (SEQ ID NO: 25)或CS23-LC-NA (SEQ ID NO: 23))具有至少97%一致性。在上文所描述之聚核苷酸之一個實施例中，編碼因子VIII多肽之重鏈之第一核苷酸序列與各別重鏈序列(例如，CS04-HC-NA (SEQ ID NO: 3)、CS01-HC-NA (SEQ ID NO: 24)或CS23-HC-NA (SEQ ID NO: 22))具有至少98%一致性，且編碼因子FVIII多肽之輕鏈之第二核苷酸序列與各別輕鏈序列(例如，CS04-LC-NA (SEQ ID NO: 4)、CS01-LC-NA (SEQ ID NO: 25)或CS23-LC-NA (SEQ ID NO: 23))具有至少98%一致性。在上文所描述之聚核苷酸之一個實施例中，編碼因子VIII多肽之重鏈之第一核苷酸序列與各別重鏈序列(例如，CS04-HC-NA (SEQ ID NO: 3)、CS01-HC-NA (SEQ ID NO: 24)或CS23-HC-NA (SEQ ID NO: 22))具有至少99%一致性，且編碼因子FVIII多肽之輕鏈之第二核苷酸序列與各別輕鏈序列(例如，CS04-LC-NA (SEQ ID NO: 4)、CS01-LC-NA (SEQ ID NO: 25)或CS23-LC-NA (SEQ ID NO: 23))具有至少99%一致性。在上文所描述之聚核苷酸之一個實施例中，編碼因子VIII多肽之重鏈之第一核苷酸序列與各別重鏈序列(例如，CS04-HC-NA (SEQ ID NO: 3)、CS01-HC-NA (SEQ ID NO: 24)或CS23-HC-NA (SEQ ID NO: 22))具有至少99.5%一致性，且編碼因子FVIII多肽之輕鏈之第二核苷酸序列與各別輕鏈序列(例如，CS04-LC-NA (SEQ ID NO: 4)、CS01-LC-NA (SEQ ID NO: 25)或CS23-LC-NA (SEQ ID NO: 23))具有至少99.5%一致性。在上文所描述之聚核苷酸之一個實施例中，編碼因子VIII多肽之重鏈之第一核苷酸序列與各別重鏈序列(例如，CS04-HC-NA (SEQ ID NO: 3)、CS01-HC-NA (SEQ ID NO: 24)或CS23-HC-NA (SEQ ID NO: 22))具有至少99.9%一致性，且編碼因子FVIII多肽之輕鏈之第二核苷酸序列與各別輕鏈序列(例如，CS04-LC-NA (SEQ ID NO: 4)、CS01-LC-NA (SEQ ID NO: 25)或CS23-LC-NA (SEQ ID NO: 23))具有至少99.9%一致性。在上文所描述之聚核苷酸之一個實施例中，編碼因子VIII多肽之重鏈之第一核苷酸序列為CS04-HC-NA (SEQ ID NO: 3)，且編碼因子FVIII多肽之輕鏈之第二核苷酸序列為CS04-LC-NA (SEQ ID NO: 4)。在上文所描述之聚核苷酸之一個實施例中，編碼因子VIII多肽之重鏈之第一核苷酸序列為CS01-HC-NA (SEQ ID NO: 24)，且編碼因子FVIII多肽之輕鏈之第二核苷酸序列為CS01-LC-NA (SEQ ID NO:25)。在上文所描述之聚核苷酸之一個實施例中，編碼因子VIII多肽之重鏈之第一核苷酸序列為CS23-HC-NA (SEQ ID NO: 22)，且編碼因子FVIII多肽之輕鏈之第二核苷酸序列為CS23-LC-NA (SEQ ID NO: 23)。在一個態樣中，本發明提供一種包含與CS04-FL-NA具有至少95%一致性之核苷酸序列之聚核苷酸，其中聚核苷酸編碼因子VIII多肽。在一個態樣中，本發明提供一種包含與CS01-FL-NA具有至少95%一致性之核苷酸序列之聚核苷酸，其中聚核苷酸編碼因子VIII多肽。在一個態樣中，本發明提供一種包含與CS23-FL-NA具有至少95%一致性之核苷酸序列之聚核苷酸，其中聚核苷酸編碼因子VIII多肽。在上文所描述之聚核苷酸之一個實施例中，核苷酸序列與各別全長聚核苷酸序列(例如，CS04-FL-NA (SEQ ID NO: 1)、CS01-FL-NA (SEQ ID NO: 13)或CS23-FL-NA (SEQ ID NO: 20))具有至少96%一致性。在上文所描述之聚核苷酸之一個實施例中，核苷酸序列與各別全長聚核苷酸序列(例如，CS04-FL-NA (SEQ ID NO: 1)、CS01-FL-NA (SEQ ID NO: 13)或CS23-FL-NA (SEQ ID NO: 20))具有至少97%一致性。在上文所描述之聚核苷酸之一個實施例中，核苷酸序列與各別全長聚核苷酸序列(例如，CS04-FL-NA (SEQ ID NO: 1)、CS01-FL-NA (SEQ ID NO: 13)或CS23-FL-NA (SEQ ID NO: 20))具有至少98%一致性。在上文所描述之聚核苷酸之一個實施例中，核苷酸序列與各別全長聚核苷酸序列(例如，CS04-FL-NA (SEQ ID NO: 1)、CS01-FL-NA (SEQ ID NO: 13)或CS23-FL-NA (SEQ ID NO: 20))具有至少99%一致性。在上文所描述之聚核苷酸之一個實施例中，核苷酸序列與各別全長聚核苷酸序列(例如，CS04-FL-NA (SEQ ID NO: 1)、CS01-FL-NA (SEQ ID NO: 13)或CS23-FL-NA (SEQ ID NO: 20))具有至少99.5 %一致性。在上文所描述之聚核苷酸之一個實施例中，核苷酸序列具有與各別全長聚核苷酸序列(例如，CS04-FL-NA (SEQ ID NO: 1)、CS01-FL-NA (SEQ ID NO: 13)或CS23-FL-NA (SEQ ID NO: 20))至少99.9%一致性。在上文所描述之聚核苷酸之一個實施例中，核苷酸序列為CS04-FL-NA (SEQ ID NO: 1)。在上文所描述之聚核苷酸之一個實施例中，核苷酸序列CS01-FL-NA (SEQ ID NO: 13)。在上文所描述之聚核苷酸之一個實施例中，核苷酸序列為CS23-FL-NA (SEQ ID NO: 20)。在上文所描述之聚核苷酸之一個實施例中，聚核苷酸編碼包含與CS04-FL-AA (SEQ ID NO: 2)具有至少95%一致性之胺基酸序列之因子VIII多肽。在上文所描述之聚核苷酸之一個實施例中，聚核苷酸編碼包含與CS04-FL-AA (SEQ ID NO: 2)具有至少96%一致性之胺基酸序列之因子VIII多肽。在上文所描述之聚核苷酸之一個實施例中，聚核苷酸編碼包含與CS04-FL-AA (SEQ ID NO: 2)具有至少97%一致性之胺基酸序列之因子VIII多肽。在上文所描述之聚核苷酸之一個實施例中，聚核苷酸編碼包含與CS04-FL-AA (SEQ ID NO: 2)具有至少98%一致性之胺基酸序列之因子VIII多肽。在上文所描述之聚核苷酸之一個實施例中，聚核苷酸編碼包含與CS04-FL-AA (SEQ ID NO: 2)具有至少99%一致性之胺基酸序列之因子VIII多肽。在上文所描述之聚核苷酸之一個實施例中，聚核苷酸編碼包含與CS04-FL-AA (SEQ ID NO: 2)具有至少99.5%一致性之胺基酸序列之因子VIII多肽。在上文所描述之聚核苷酸之一個實施例中，聚核苷酸編碼包含與CS04-FL-AA (SEQ ID NO: 2)具有至少99.9%一致性之胺基酸序列之因子VIII多肽。在上文所描述之聚核苷酸之一個實施例中，聚核苷酸編碼包含CS04-FL-AA (SEQ ID NO: 2)之胺基酸序列的因子VIII多肽。在一個態樣中，本發明提供一種包含與CS04-SC1-NA (SEQ ID NO: 9)具有至少95%一致性之核苷酸序列之聚核苷酸，其中聚核苷酸編碼單鏈因子VIII多肽。在一個態樣中，本發明提供一種包含與CS04-SC2-NA (SEQ ID NO: 11)具有至少95%一致性之核苷酸序列之聚核苷酸，其中聚核苷酸編碼單鏈因子VIII多肽。在一個態樣中，本發明提供一種包含與CS01-SC1-NA (SEQ ID NO: 26)具有至少95%一致性之核苷酸序列之聚核苷酸，其中聚核苷酸編碼單鏈因子VIII多肽。在一個態樣中，本發明提供一種包含與CS01-SC2-NA (SEQ ID NO: 27)具有至少95%一致性之核苷酸序列之聚核苷酸，其中聚核苷酸編碼單鏈因子VIII多肽。在一個態樣中，本發明提供一種包含與CS23-SC1-NA (SEQ ID NO: 28)具有至少95%一致性之核苷酸序列之聚核苷酸，其中聚核苷酸編碼單鏈因子VIII多肽。在一個態樣中，本發明提供一種包含與CS23-SC2-NA (SEQ ID NO: 29)具有至少95%一致性之核苷酸序列之聚核苷酸，其中聚核苷酸編碼單鏈因子VIII多肽。在上文所描述之聚核苷酸之一個實施例中，核苷酸序列與各別全長聚核苷酸序列(例如，CS04-SC1-NA (SEQ ID NO: 9)、CS04-SC2-NA (SEQ ID NO: 11)、CS01-SC1-NA (SEQ ID NO: 26)、CS01-SC2-NA (SEQ ID NO: 27)、CS23-SC1-NA (SEQ ID NO: 28)或CS23-SC2-NA (SEQ ID NO: 29))具有至少96%一致性。在上文所描述之聚核苷酸之一個實施例中，核苷酸序列與各別全長聚核苷酸序列(例如，CS04-SC1-NA (SEQ ID NO: 9)、CS04-SC2-NA (SEQ ID NO: 11)、CS01-SC1-NA (SEQ ID NO: 26)、CS01-SC2-NA (SEQ ID NO: 27)、CS23-SC1-NA (SEQ ID NO: 28)或CS23-SC2-NA (SEQ ID NO: 29))具有至少97%一致性。在上文所描述之聚核苷酸之一個實施例中，核苷酸序列與各別全長聚核苷酸序列(例如，CS04-SC1-NA (SEQ ID NO: 9)、CS04-SC2-NA (SEQ ID NO: 11)、CS01-SC1-NA (SEQ ID NO: 26)、CS01-SC2-NA (SEQ ID NO: 27)、CS23-SC1-NA (SEQ ID NO: 28)或CS23-SC2-NA (SEQ ID NO: 29))具有至少98%一致性。在上文所描述之聚核苷酸之一個實施例中，核苷酸序列與各別全長聚核苷酸序列(例如，CS04-SC1-NA (SEQ ID NO: 9)、CS04-SC2-NA (SEQ ID NO: 11)、CS01-SC1-NA (SEQ ID NO: 26)、CS01-SC2-NA (SEQ ID NO: 27)、CS23-SC1-NA (SEQ ID NO: 28)或CS23-SC2-NA (SEQ ID NO: 29))具有至少99%一致性。在上文所描述之聚核苷酸之一個實施例中，核苷酸序列與各別全長聚核苷酸序列(例如，CS04-SC1-NA (SEQ ID NO: 9)、CS04-SC2-NA (SEQ ID NO: 11)、CS01-SC1-NA (SEQ ID NO: 26)、CS01-SC2-NA (SEQ ID NO: 27)、CS23-SC1-NA (SEQ ID NO: 28)或CS23-SC2-NA (SEQ ID NO: 29))具有至少99.5%一致性。在上文所描述之聚核苷酸之一個實施例中，核苷酸序列與各別全長聚核苷酸序列(例如，CS04-SC1-NA (SEQ ID NO: 9)、CS04-SC2-NA (SEQ ID NO: 11)、CS01-SC1-NA (SEQ ID NO: 26)、CS01-SC2-NA (SEQ ID NO: 27)、CS23-SC1-NA (SEQ ID NO: 28)或CS23-SC2-NA (SEQ ID NO: 29))具有至少99.9%一致性。在上文所描述之聚核苷酸之一個實施例中，核苷酸序列為CS04-SC1-NA (SEQ ID NO: 9)。在上文所描述之聚核苷酸之一個實施例中，核苷酸序列為CS04-SC2-NA (SEQ ID NO: 11)。在上文所描述之聚核苷酸之一個實施例中，核苷酸序列為CS01-SC1-NA (SEQ ID NO: 26)。在上文所描述之聚核苷酸之一個實施例中，核苷酸序列為CS01-SC2-NA (SEQ ID NO: 27)。在上文所描述之聚核苷酸之一個實施例中，核苷酸序列為CS23-SC1-NA (SEQ ID NO: 28)。在上文所描述之聚核苷酸之一個實施例中，核苷酸序列為CS23-SC2-NA (SEQ ID NO: 29)。在上文所描述之聚核苷酸之一個實施例中，核苷酸序列與選自由以下各者組成之群之序列具有至少95%一致性：CS01-FL-NA、CS01-HC-NA、CS01-LC-NA、CS04-FL-NA、CS04-HC-NA、CS04-LC-NA、CS23-FL-NA、CS23-HC-NA、CS23-LC-NA、CS01-SC1-NA、CS04-SC1-NA、CS23-SC1-NA、CS01-SC2-NA、CS04-SC2-NA及CS23-SC2-NA。在上文所描述之聚核苷酸之一個實施例中，核苷酸序列與選自由以下各者組成之群之序列具有至少96%一致性： CS01-FL-NA、CS01-HC-NA、CS01-LC-NA、CS04-FL-NA、CS04-HC-NA、CS04-LC-NA、CS23-FL-NA、CS23-HC-NA、CS23-LC-NA、CS01-SC1-NA、CS04-SC1-NA、CS23-SC1-NA、CS01-SC2-NA、CS04-SC2-NA及CS23-SC2-NA。在上文所描述之聚核苷酸之一個實施例中，核苷酸序列與選自由以下各者組成之群之序列具有至少97%一致性：CS01-FL-NA、CS01-HC-NA、CS01-LC-NA、CS04-FL-NA、CS04-HC-NA、CS04-LC-NA、CS23-FL-NA、CS23-HC-NA、CS23-LC-NA、CS01-SC1-NA、CS04-SC1-NA、CS23-SC1-NA、CS01-SC2-NA、CS04-SC2-NA及CS23-SC2-NA。在上文所描述之聚核苷酸之一個實施例中，核苷酸序列與選自由以下各者組成之群之序列具有至少98%一致性： CS01-FL-NA、CS01-HC-NA、CS01-LC-NA、CS04-FL-NA、CS04-HC-NA、CS04-LC-NA、CS23-FL-NA、CS23-HC-NA、CS23-LC-NA、CS01-SC1-NA、CS04-SC1-NA、CS23-SC1-NA、CS01-SC2-NA、CS04-SC2-NA及CS23-SC2-NA。在上文所描述之聚核苷酸之一個實施例中，核苷酸序列與選自由以下各者組成之群之序列具有至少99%一致性：CS01-FL-NA、CS01-HC-NA、CS01-LC-NA、CS04-FL-NA、CS04-HC-NA、CS04-LC-NA、CS23-FL-NA、CS23-HC-NA、CS23-LC-NA、CS01-SC1-NA、CS04-SC1-NA、CS23-SC1-NA、CS01-SC2-NA、CS04-SC2-NA及CS23-SC2-NA。在上文所描述之聚核苷酸之一個實施例中，核苷酸序列與選自由以下各者組成之群之序列具有至少99.5%一致性：CS01-FL-NA、CS01-HC-NA、CS01-LC-NA、CS04-FL-NA、CS04-HC-NA、CS04-LC-NA、CS23-FL-NA、CS23-HC-NA、CS23-LC-NA、CS01m1-FL-NA、CS01m2-FL-NA、CS01m3-FL-NA、CS01m4-FL-NA、CS01-SC1-NA、CS04-SC1-NA、CS23-SC1-NA、CS01-SC2-NA、CS04-SC2-NA及CS23-SC2-NA。在上文所描述之聚核苷酸之一個實施例中，核苷酸序列與選自由以下各者組成之群之序列具有至少99.5%一致性：CS01-FL-NA、CS01-HC-NA、CS01-LC-NA、CS04-FL-NA、CS04-HC-NA、CS04-LC-NA、CS23-FL-NA、CS23-HC-NA、CS23-LC-NA、CS01-SC1-NA、CS04-SC1-NA、CS23-SC1-NA、CS01-SC2-NA、CS04-SC2-NA及CS23-SC2-NA。在上文所描述之聚核苷酸之一個實施例中，核苷酸序列選自由以下各者組成之群：CS01-FL-NA、CS01-HC-NA、CS01-LC-NA、CS04-FL-NA、CS04-HC-NA、CS04-LC-NA、CS23-FL-NA、CS23-HC-NA、CS23-LC-NA、CS01-SC1-NA、CS04-SC1-NA、CS23-SC1-NA、CS01-SC2-NA、CS04-SC2-NA及CS23-SC2-NA。在上文所描述之聚核苷酸之一個實施例中，經編碼因子VIII多肽包含安置於兩種連續胺基酸之間的糖基化多肽。在上文所描述之聚核苷酸之一個實施例中，聚核苷酸亦包括可操作地連接至編碼因子VIII多肽之聚核苷酸的啟動子元件。在上文所描述之聚核苷酸之一個實施例中，聚核苷酸亦包括可操作地連接至編碼因子VIII多肽之聚核苷酸的強化子元件。在上文所描述之聚核苷酸之一個實施例中，聚核苷酸亦包括可操作地連接至編碼因子VIII多肽之聚核苷酸的聚腺苷酸化元件。在上文所描述之聚核苷酸之一個實施例中，聚核苷酸亦包括以操作方式連接至編碼因子VIII多肽之核苷酸序列的內含子。在上文所描述之聚核苷酸之一個實施例中，內含子安置於編碼因子VIII多肽之核苷酸序列的啟動子元件與轉譯起始位點(例如，第一編碼ATG)之間。在另一態樣中，本發明提供一種包括如上文所描述之聚核苷酸之哺乳動物基因治療載體。在上文所描述之哺乳動物基因治療載體之一個實施例中，哺乳動物基因治療載體為腺相關病毒(AAV)載體。在上文所描述之哺乳動物基因治療載體之一個實施例中，AAV載體為AAV-8載體。在另一態樣中，本發明提供一種用於治療A型血友病之方法，其包括向有需要之患者投與如上文所描述之哺乳動物基因治療載體。在另一態樣中，本發明提供一種用於治療A型血友病之如上文所描述之哺乳動物基因治療載體。在另一態樣中，本發明提供如上文所描述之哺乳動物基因治療載體之用途，其用於製造供治療A型血友病用之藥劑。

相關申請案之交叉引用本申請案主張2015年11月13日提交之美國臨時專利申請案第62/255,323號之優先權，其內容出於所有目的特此以全文引用之方式併入。序列表本申請案含有序列表，該序列表已以ASCII格式以電子方式提交且以全文引用的方式併入本文中。2016年11月7日產生之該ASCII複本命名為008073-5115-WO_SL.txt且大小為183,311個位元組。 I. 引言基於AAV之基因治療對於治療血友病患者具有較大前景。對於B型血友病，第一臨床資料令人鼓舞的為約10%之FIX水準可維持於至少一些患者中超過1年。然而對於A型血友病，出於多種原因獲得AAV載體之5-10%治療表現水準仍然具挑戰性。首先，因子VIII編碼序列太大而不能用於習知基於AAV之載體。第二，工程改造之B域缺失或截短之因子VIII構築體在活體內有較差表現，即使當密碼子最佳化時亦如此。第三，此等B域缺失或截短之因子VIII變異體構築體在活體內具有短半衰期，加重了較差表現之影響。第四，即使當表現時，FVIII亦不如其他凝血因子(諸如因子IX)般有效地自細胞分泌。此外，此等難題不能藉由簡單地投與基因治療構築體之更高劑量來解決。根據當前知識，基於AAV之基因治療載體之載體劑量應增加高於2 × 10 ¹²vg/kg體重。此係由於在此類高劑量下，T細胞免疫反應經觸發，其破壞經轉導細胞且因此轉基因表現降低或甚至消除。因此，對於A型血友病患者而言，需要改良FVIII表現之策略來使得FVIII基因治療成為切實可行之治療選擇。本發明係關於對解決此等及與因子VIII基因治療相關之其他問題之密碼子經改變因子VIII變異體編碼序列的發現。舉例而言，本文中所揭示之聚核苷酸在哺乳動物細胞中提供明顯改良之表現，且歸因於穩定化之填充相互作用，呈現改良之病毒粒子封裝。在一些實施方案中，此等優勢藉由使用與密碼子經改變CS01、CS04及CS23構築體具有高序列一致性(例如，與CS01-HC、CS04-HC及CS23-HC重鏈編碼序列中之一者具有高序列一致性，且與CS01-LC、CS04-LC及CS23-LC輕鏈編碼序列中之一者具有高序列一致性)之用於因子VIII之重鏈及輕鏈的編碼序列來實現。在一些實施方案中，由本文中所描述之聚核苷酸編碼之因子VIII分子已藉由截短、刪除或替換野生型B域而縮短。因而，聚核苷酸更適合於經由習知基因治療載體表現因子VIII，該等習知基因治療載體低效地表現更大之多肽，諸如野生型因子VIII。有利地，本文中顯示CS01、CS04及CS23密碼子經改變因子VIII變異體編碼序列在活體內提供B域缺失之因子VIII構築體的優異表現。舉例而言，在實例2及表4中顯示在因子VIII基因敲除小鼠中，相對於用野生型聚核苷酸序列(SEQ ID NO: 17)編碼之相對應CS40構築體，靜脈內投與具有CS01 (SEQ ID NO: 13)、CS04 (SEQ ID NO: 1)及CS23 (SEQ ID NO: 20)編碼序列之基於AAV之基因治療載體使得因子VIII之表現增加18倍、74倍及30倍 ( 表 4)。此外，本文中亦展示CS01及CS04密碼子經改變因子VIII變異體編碼序列提供優異之病毒粒子封裝及病毒產生。舉例而言，在實例1中，當自相同量之細胞集結粒分離時，相對於用野生型聚核苷酸序列編碼之相對應CS40構築體，顯示含有CS01及CS04構築體之AAV載體構築體提供大5至7倍之病毒產量。 II. 定義如本文中所使用，除非另外規定，否則以下術語具有歸屬於其之含義。如本文中所使用，術語「因子VIII」及「FVIII」可互換使用，且係指具有因子VIII活性之任何蛋白質(例如，活性FVIII，常常稱作FVIIIa)或具有因子VIII活性、尤其因子IXa輔因子活性之蛋白質之蛋白質前體(例如，原蛋白或前原蛋白)。在一例示性實施例中，因子VIII多肽係指序列與野生型因子VIII多肽之重鏈及輕鏈具有高序列一致性(例如，至少70%、75%、80%、85%、90%、95%、99%或更高)之多肽。在一些實施例中，因子VIII多肽之B域用連接子多肽缺失、截短或替換以減小編碼因子VIII多肽之聚核苷酸的大小。在一例示性實施例中，CS04-FL-AA之胺基酸20-1457構成因子VIII多肽。野生型因子VIII多肽之非限制性實例包括人類前原因子VIII(例如，GenBank寄存編號AAA52485、CAA25619、AAA58466、AAA52484、AAA52420、AAV85964、BAF82636、BAG36452、CAI41660、CAI41666、CAI41672、CAI43241、CAO03404、EAW72645、AAH22513、AAH64380、AAH98389、AAI11968、AAI11970或AAB61261)、相對應原因子VIII及其天然變異體；豬前原因子VIII(例如，UniProt寄存編號F1RZ36或K7GSZ5)、相對應原因子VIII及其天然變異體；小鼠前原因子VIII(例如，GenBank寄存編號AAA37385、CAM15581、CAM26492或EDL29229)、相對應原因子VIII及其天然變異體；大鼠前原因子VIII (例如，Genbank寄存編號AAQ21580)、相對應原因子VIII及其天然變異體；大鼠前原因子VIII；及其他哺乳動物因子VIII同系物(例如，猴、猿、倉鼠、天竺鼠等)。如本文中所使用，因子VIII多肽包括具有因子IX輔因子活性之天然變異體及人工構築體。如本發明中所使用，因子VIII涵蓋保留一些基本因子IX輔因子活性(例如，相對應野生型活性之至少5%、10%、25%、50%、75%或更大)之任何天然變異體、替代序列、同功異構物或突變蛋白質。發現於人類群體中之因子VIII胺基酸變型(相對於FVIII-FL-AA (SEQ ID NO: 19))之實例包括(但不限於)S19R、R22T、Y24C、Y25C、L26P/R、E30V、W33G、Y35C/H、G41C、R48C/K、K67E/N、L69P、E72K、D75E/V/Y、P83R、G89D/V、G92A/V、A97P、E98K、V99D、D101G/H/V、V104D、K108T、M110V、A111T/V、H113R/Y、L117F/R、G121S、E129V、G130R、E132D、Y133C、D135G/Y、T137A/I、S138R、E141K、D145H、V147D、Y155H、V159A、N163K、G164D/V、P165S、C172W、S176P、S179P、V181E/M、K185T、D186G/N/Y、S189L、L191F、G193R、L195P、C198G、S202N/R、F214V、L217H、A219D/T、V220G、D222V、E223K、G224W、T252I、V253F、N254I、G255V、L261P、P262L、G263S、G266F、C267Y、W274C、H275L、G278R、G280D、E284K、V285G、E291G/K、T294I、F295L、V297A、N299I、R301C/H/L、A303E/P、I307S、S308L、F312S、T314A/I、A315V、G323E、L326P、L327P/V、C329F、I331V、M339T、E340K、V345A/L、C348R/S/Y、Y365C、R391C/H/P、S392L/P、A394S、W401G、I405F/S、E409G、W412G/R、K427I、L431F/S、R437P/W、I438F、G439D/S/V、Y442C、K444R、Y450D/N、T454I、F455C、G466E、P470L/R/T、G474E/R/V、E475K、G477V、D478N、T479R、F484C、A488G、R490G、Y492C/H、Y492H、I494T、P496R、G498R、R503H、G513S/V、I522Y、K529E、W532G、P540T、T541S、D544N、R546W、R550C/G/H、S553P、S554C/G、V556D、R560T、D561G/H/Y、I567T、P569R、S577F、V578A、D579A/H、N583S、Q584H/K/R、I585R/T、M586V、D588G/Y、L594Q、S596P、N601D/K、R602G、S603I/R、W604C、Y605H/S、N609I、R612C、N631K/S、M633I、S635N、N637D/I/S、Y639C、L644V、L650F、V653A/M、L659P、A663V、Q664P、F677L、M681I、V682F、Y683C/N、T686R、F698L、M699T/V、M701I、G705V、G710W、N713I、R717L/W、G720D/S、M721I/L、A723T、L725Q、V727F、E739K、Y742C、R795G、P947R、V1012L、E1057K、H1066Y、D1260E、K1289Q、Q1336K、N1460K、L1481P、A1610S、I1698T、Y1699C/F、E1701K、Q1705H、R1708C/H、T1714S、R1715G、A1720V、E1723K、D1727V、Y1728C、R1740G、K1751Q、F1762L、R1768H、G1769R、L1771P、L1775F/V、L1777P、G1779E/R、P1780L、I1782R、D1788H、M1791T、A1798P、S1799H、R1800C/G/H、P1801A、Y1802C、S1803Y、F1804S、L1808F、M1842I、P1844S、T1845P、E1848G、A1853T/V、S1858C、K1864E、D1865N/Y、H1867P/R、G1869D/V、G1872E、P1873R、L1875P、V1876L、C1877R/Y、L1882P、R1888I、E1894G、I1901F、E1904D/K、S1907C/R、W1908L、Y1909C、A1939T/V、N1941D/S、G1942A、M1945V、L1951F、R1960L/Q、L1963P、S1965I、M1966I/V、G1967D、S1968R、N1971T、H1973L、G1979V、H1980P/Y、F1982I、R1985Q、L1994P、Y1998C、G2000A、T2004R、M2007I、G2013R、W2015C、R2016P/W、E2018G、G2022D、G2028R、S2030N、V2035A、Y2036C、N2038S、2040Y、G2045E/V、I2051S、I2056N、A2058P、W2065R、P2067L、A2070V、S2082N、S2088F、D2093G/Y、H2101D、T2105N、Q2106E/P/R、G2107S、R2109C、I2117F/S、Q2119R、F2120C/L、Y2124C、R2135P、S2138Y、T2141N、M2143V、F2145C、N2148S、N2157D、P2162L、R2169C/H、P2172L/Q/R、T2173A/I、H2174D、R2178C/H/L、R2182C/H/P、M2183R/V、L2185S/W、S2192I、C2193G、P2196R、G2198V、E2200D、I2204T、I2209N、A2211P、A2220P、P2224L、R2228G/L/P/Q、L2229F、V2242M、W2248C/S、V2251A/E、M2257V、T2264A、Q2265R、F2279C/I、I2281T、D2286G、W2290L、G2304V、D2307A、P2319L/S、R2323C/G/H/L、R2326G/L/P/Q、Q2330P、W2332R、I2336F、R2339T、G2344C/D/S及C2345S/Y。因子VIII蛋白亦包括含有轉譯後修飾之多肽。一般而言，編碼因子VIII之聚核苷酸編碼非活性單鏈多肽(例如，前原蛋白)，其經歷轉譯後處理以形成活性因子VIII蛋白(例如，FVIIIa)。舉例而言，參看圖1，野生型人類因子VIII前原蛋白首先經裂解以釋放經編碼信號肽(未展示)，形成第一單鏈原蛋白(展示為「人類野生型FVIII」)。隨後原蛋白在B域與A3域之間裂解以形成包括因子VIII重鏈(例如，A1及A2域)及B域之第一多肽，及包括因子VIII輕鏈(例如，包括A3、C1及C3域)之第二多肽。第一多肽進一步裂解以移除B域，且亦分離A1及A2域，其在成熟因子VIIIa蛋白中保持與因子VIII輕鏈相締合。對於因子VIII成熟方法之評述，參見Graw等人, Nat Rev Genet., 6(6):488-501 (2005)，其內容出於所有目的以全文引用之方式併入本文中。然而，在一些實施例中，因子VIII多肽為單鏈因子VIII多肽。單鏈因子VIII多肽經工程改造以移除天然裂解位點，且視情況移除、截短或替換因子VIII之B域。因而，其因裂解(不為視情況選用之信號及/或前導肽之裂解)而不成熟，且作為單鏈為活性的。單鏈因子VIII多肽之非限制性實例描述於Zollner等人 (Thromb Res, 134(1):125-31 (2014))及Donath等人(Biochem J., 312(1):49-55 (1995))中，其揭示內容出於所有目的特此以全文引用之方式併入。如本文中所使用，術語「因子VIII重鏈」或簡單地「重鏈」係指因子VIII多肽之A1及A2域之聚集體。在一例示性實施例中，CS04-FL-AA (SEQ ID NO: 2)之胺基酸20-759構成因子VIII重鏈。如本文中所使用，術語「因子VIII輕鏈」或簡單地「輕鏈」係指因子VIII多肽之A3、C1及C2域之聚集體。在一例示性實施例中，CS04-FL-AA (SEQ ID NO: 2)之胺基酸774-1457構成因子VIII輕鏈。在一些實施例中，因子VIII輕鏈排除在活體內在成熟期間釋放之酸性a3肽。一般而言，因子VIII重鏈及輕鏈表現為單一多肽鏈，例如連同視情況選用之B域或B域經取代連接子一起。然而在一些實施例中，因子VIII重鏈及因子VIII輕鏈表現為單獨的多肽鏈(例如，共表現)，且經重建以形成因子VIII蛋白(例如，活體內或活體外)。如本文中所使用，術語「B域經取代連接子」及「因子VIII連接子」可互換使用，且係指野生型因子VIII B域之截短型式(例如，FVIII-FL-AA (SEQ ID NO: 19)之胺基酸760-1667)，或經工程改造來替換因子VIII多肽之B域之肽。如本文中所使用，在根據一些實施例之因子VIII變異體多肽中，因子VIII連接子安置於因子VIII重鏈之C端與因子VIII輕鏈之N端之間。B域經取代連接子之非限制性實例揭示於以下各者中：美國專利第4,868,112號、第5,112,950號、第5,171,844號、第5,543,502號、第5,595,886號、第5,610,278號、第5,789,203號、第5,972,885號、第6,048,720號、第6,060,447號、第6,114,148號、第6,228,620號、第6,316,226號、第6,346,513號、第6,458,563號、第6,924,365號、第7,041,635號及第7,943,374號；美國專利申請公開案第2013/024960號、第2015/0071883號及第2015/0158930號；及PCT公開案第WO 2014/064277號及第WO 2014/127215號，以上者之揭示內容出於所有目的以全文引用之方式併入本文中。除非本文中另外規定，否則因子VIII胺基酸之編號係指全長野生型人類因子VIII序列(FVIII-FL-AA) (在圖18中呈現為SEQ ID NO: 19)中之相對應胺基酸。因而，當提及本文中所揭示之因子VIII變異體蛋白中之胺基酸取代時，所敍述胺基酸編號係指全長野生型因子VIII序列中之類似(例如，結構上或功能上等效)及/或同源(例如，在一級胺基酸序列中進化保守的)胺基酸。舉例而言，T2105N胺基酸取代係指在全長野生型人類因子VIII序列(FVIII-FL-AA；SEQ ID NO: 19)之位置2105處的T至N取代及在由CS04編碼之因子VIII變異體蛋白(CS04-FL-AA；SEQ ID NO: 2)之位置1211處的T至N取代。如本文中所描述，因子VIII胺基酸編號系統視是否包括因子VIII信號肽(例如，全長野生型人類因子VIII序列之胺基酸1至19)而定。在包括信號肽時，編號稱作「信號肽入選」或「SPI」。在不包括信號肽時，編號稱作「信號肽排除」或「SPE」。舉例而言，對於與SPE編號中之F309S相同之胺基酸，F328S為SPI編號。除非另有指示，否則所有胺基酸編號係指全長野生型人類因子VIII序列(FVIII-FL-AA) (在圖18中呈現為SEQ ID NO: 19)中之相對應胺基酸。如本文中所描述，相較於由天然編碼之因子VIII構築體(例如，使用野生型人類密碼子編碼相同因子VIII構築體之聚核苷酸)提供之因子VIII表現水準，密碼子經改變聚核苷酸提供活體內轉基因因子VIII之增加之表現(例如，當作為基因治療載體之部分投與時)。如本文中所使用，術語「增加之表現」係指相較於投與天然編碼之因子VIII構築體之動物血液中的轉基因因子VIII活性水準，投與編碼因子VIII之密碼子經改變聚核苷酸之動物血液中的轉基因因子VIII活性的增加水準。可使用此項技術中已知之任何因子VIII活性量測活性水準。用於確定因子VIII活性之一例示性分析為Technochrome FVIII分析(Technoclone, Vienna, Austria)。在一些實施例中，增加之表現係指相較於投與天然編碼之因子VIII聚核苷酸之動物血液中的轉基因因子VIII活性水準，投與密碼子經改變因子VIII聚核苷酸之動物血液中的大至少25%之轉基因因子VIII活性。在一些實施例中，增加之表現係指相較於投與天然編碼之因子VIII聚核苷酸之動物血液中的轉基因因子VIII活性水準，投與密碼子經改變因子VIII聚核苷酸之動物血液中的大至少50%、大至少75%、大至少100%、大至少3倍、大至少4倍、大至少5倍、大至少6倍、大至少7倍、大至少8倍、大至少9倍、大至少10倍、大至少15倍、大至少20倍、大至少25倍、大至少30倍、大至少40倍、大至少50倍、大至少60倍、大至少70倍、大至少80倍、大至少90倍、大至少100倍、大至少125倍、大至少150倍、大至少175倍、大至少200倍、大至少225倍或大至少250倍之轉基因因子VIII活性。如本文中所描述，相較於由天然編碼之因子VIII構築體(例如，使用野生型人類密碼子編碼相同因子VIII構築體之聚核苷酸)提供之載體產生水準，密碼子經改變聚核苷酸提供增加之載體產生。如本文中所使用，術語「增加之病毒產生」係指相較於接種有天然編碼之因子VIII構築體之細胞培養物中的載體產量，接種有編碼因子VIII之密碼子經改變聚核苷酸之細胞培養物中的增加之載體產量(例如，效價/公升培養物)。可使用此項技術中已知之任何載體效價分析量測載體產量。用於確定載體產量(例如，AAV載體之載體產量)之一例示性分析為靶向AAV2反向末端重複之qPCR (Aurnhammer, Human Gene Therapy Methods: 部分B 23:18-28 (2012))。在一些實施例中，增加之病毒產生係指在相同類型培養物中，相較於天然編碼之因子VIII構築體之產量，大至少25%之密碼子經改變載體產量。在一些實施例中，增加之載體產生係指在相同類型之培養物中，相較於天然編碼之因子VIII構築體之產量，大至少50%、大至少75%、大至少100%、大至少3倍、大至少4倍、大至少5倍、大至少6倍、大至少7倍、大至少8倍、大至少9倍、大至少10倍、大至少15倍或大至少20倍之密碼子經改變載體產量。如本文中所使用，術語「血友病」係指廣泛藉由降低之血液凝結或凝固表徵之疾病病況之群。血友病可指類型A、類型B或類型C血友病，或指所有三種疾病類型之複合。類型A血友病(A型血友病(hemophilia A))由因子VIII (FVIII)活性之降低或損失造成且為最重要之血友病子型。類型B血友病(B型血友病(hemophilia B))由因子IX (FIX)凝結功能之損失或降低造成。類型C血友病(C型血友病(hemophilia C))為因子XI (FXI)凝結活性之損失或降低之後果。A型及B型血友病為X連鎖疾病，而C型血友病為常染色體的。針對血友病之習知治療包括預防性及按需求投與凝結因子，諸如FVIII、FIX (包括Bebulin®-VH)及FXI，以及FEIBA-VH、去胺加壓素及血漿輸注。如本文中所使用，術語「FVIII基因治療」包括向患者提供編碼因子VIII之核酸以減輕、減弱或預防與血友病相關之一或多種症狀(例如，臨床因素)的復發之任何治療方法。該術語涵蓋投與包含編碼因子VIII分子、包括因子VIII之任何修飾形式(例如，因子VIII變異體)之核酸的任何化合物、藥物、程序或方案，以維持或改善患有血友病之個體之健康。熟習此項技術者將瞭解可例如基於根據本發明獲得之結果來改變FVIII治療之過程或FVIII治療劑之劑量。如本文中所使用，術語「繞道治療」包括向患者提供非因子VIII止血劑、化合物或凝血因子以減輕、減弱或預防與血友病相關之一或多種症狀(例如，臨床因素)的復發之任何治療方法。非因子VIII化合物及凝血因子包括(但不限於)因子VIII抑制劑繞道活性(FEIBA)、重組活化之因子VII (FVIIa)、凝血酶原複合物濃縮物及活化之凝血酶原複合物濃縮物。此等非因子VIII化合物及凝血因子可為重組或血漿衍生的。熟習此項技術者將瞭解可例如基於根據本發明獲得之結果改變繞道治療之過程或繞道治療之劑量。如本文中所使用，「組合治療」包括投與編碼因子VIII分子之核酸及習知A型血友病治療劑，包括向患者提供編碼因子VIII分子之核酸與因子VIII分子及/或非因子VIII止血劑(例如，繞道治療劑)以減輕、減弱或預防與血友病相關之一或多種症狀(例如，臨床因素)的復發之任何治療方法。該術語涵蓋投與包括編碼因子VIII分子(包括因子VIII之任何修飾形式)之核酸的任何化合物、藥物、程序或方案，其適用於維持或改善患有血友病之個體之健康，且包括本文中所描述之治療劑中之任一者。術語「治療有效量或劑量」或「治療足夠量或劑量」或「有效或足夠量或劑量」係指產生其投與所欲產生的治療作用之劑量。舉例而言，適用於治療血友病之藥物之治療有效量可為能夠預防或減輕與血友病相關之一或多種症狀的量。準確劑量將視治療目的而定，且可將藉由熟習此項技術者使用已知技術確定(參見例如，Lieberman, Pharmaceutical Dosage Forms(第1-3卷, 1992)；Lloyd, The Art, Science and Technology of Pharmaceutical Compounding(1999)；Pickar, Dosage Calculations(1999)；及 Remington: The Science and Practice of Pharmacy, 第20版, 2003, Gennaro, 編, Lippincott, Williams & Wilkins)。如本文中所使用，術語「基因」係指編碼多肽鏈之DNA分子之片段(例如，編碼區)。在一些實施例中，基因藉由立即在編碼區之前、之後及/或介入編碼區之區域安置，該等區域涉及產生多肽鏈(例如，調節元件，諸如啟動子、強化子、聚腺苷酸化序列、5'非轉譯區、3'非轉譯區域或內含子)。如本文中所使用，術語「調節元件」係指提供細胞中編碼序列之表現之核苷酸序列，諸如啟動子、強化子、終止子、聚腺苷酸化序列、內含子等。如本文中所使用，術語「啟動子元件」係指幫助控制編碼序列之表現之核苷酸序列。一般而言，啟動子元件位於基因轉譯起始位點之5'。然而，在某些實施例中，啟動子元件可位於內含子序列內或編碼序列之3'。在一些實施例中，適用於基因治療載體之啟動子來源於靶蛋白之內源基因(例如，因子VIII啟動子)。在一些實施例中，適用於基因治療載體之啟動子對目標生物體之特定細胞或組織中之表現具有特異性(例如，肝特異性啟動子)。在又其他實施例中，複數個充分表徵之啟動子元件中之一者用於本文中所描述之基因治療載體。充分表徵之啟動子元件之非限制性實例包括CMV早期啟動子、β-肌動蛋白啟動子及甲基CpG結合蛋白2 (MeCP2)啟動子。在一些實施例中，啟動子為組成型啟動子，其實質上驅動靶蛋白之恆定表現。在其他實施例中，啟動子為誘導型啟動子，其回應於特定刺激物(例如，暴露於特定治療劑或藥劑)驅動靶蛋白之表現。針對AAV介導之基因治療之設計啟動子的綜述，參見Gray等人(Human Gene Therapy 22:1143-53 (2011))，其內容出於所有目的明確地以全文引用之方式併入。如本文中所使用，術語「載體」係指用以將核酸(例如，編碼因子VIII基因治療構築體)轉移於宿主細胞中之任何媒介。在一些實施例中，載體包括複製子，其用於連同靶核酸一起複製媒介。適用於基因治療之載體之非限制性實例包括質體、噬菌體、黏質體、人工染色體及病毒，其在活體內充當複製之自主單元。在一些實施例中，載體為用於引入靶核酸(例如，編碼因子VIII變異體之密碼子經改變聚核苷酸)之病毒媒介。許多適用於基因治療之經修飾真核病毒在此項技術中已知。舉例而言，腺相關病毒(AAV)尤其較適用於人類基因治療，因為人類為病毒之天然宿主，天然病毒促成任何疾病不為人所知，且病毒激發輕度免疫反應。如本文中所使用，術語「CpG島」係指具有統計學上升高密度之CpG二核苷酸之聚核苷酸內的區域。如本文中所使用，若在200個鹼基對窗內：(i)區域之GC含量大於50%，及(ii)如藉由以下關係所定義，所觀測CpG二核苷酸與預期CpG二核苷酸之比為至少0.6，則聚核苷酸(例如，編碼密碼子經改變因子VIII蛋白之聚核苷酸)之區域為CpG島：

。針對鑑別CpG島之方法之額外資訊，參見Gardiner-Garden M.等人, J Mol Biol., 196(2):261-82 (1987)，其內容出於所有目的明確地以全文引入之方式併入本文中。如本文中所使用，術語「核酸」係指呈單鏈或雙鏈形式之去氧核糖核苷酸或核糖核苷酸及其聚合物及其互補序列。該術語涵蓋含有合成的、天然存在的及非天然存在的已知核苷酸類似物或經修飾主鏈殘基或鍵之核酸，其具有與參考核酸類似之結合特性，且其以與參考核苷酸類似之方式代謝。此類類似物之實例包括(但不限於)硫代磷酸酯、胺基磷酸酯、膦酸甲酯、對掌性膦酸甲酯、2-O-甲基核糖核苷酸及肽核酸(PNA)。術語「胺基酸」係指天然存在及非天然之胺基酸，包括以類似於天然存在之胺基酸的方式發揮功能之胺基酸類似物及胺基酸模擬物。天然存在之胺基酸包括由遺傳密碼編碼之胺基酸，以及稍後經修飾之胺基酸，例如羥基脯胺酸、y-羧基麩胺酸及O-磷絲胺酸。天然存在之胺基酸可包括例如D-胺基酸及L-胺基酸。本文中所使用之胺基酸亦可包括非天然胺基酸。胺基酸類似物係指基本化學結構與天然存在之胺基酸相同(亦即任何碳與氫、羧基、胺基及R基團結合)的化合物，例如高絲胺酸、正白胺酸、甲硫胺酸亞碸或甲硫胺酸甲基鋶。此類類似物具有經修飾R基團(例如，正白胺酸)或經修飾肽主鏈，但保留與天然存在之胺基酸相同之基本化學結構。胺基酸模擬物係指結構不同於胺基酸之一般化學結構，但以類似於天然存在之胺基酸的方式發揮功能之化學化合物。胺基酸在本文中可由其通常已知之三字母符號或由IUPAC-IUB生物化學命名法委員會(Biochemical Nomenclature Commission)所推薦之單字母符號來提及。同樣，核苷酸可由其通常可接受之單字母密碼來提及。關於胺基酸序列，一般熟習此項技術者將認識到改變、添加或缺失編碼序列中之單個胺基酸或較小百分比之胺基酸之核酸或肽序列的個別取代、缺失或添加為「經保守修飾之變異體」，其中該改變引起一胺基酸經化學上類似之胺基酸取代。提供功能上類似之胺基酸的保守取代表在此項技術中已熟知。此類經保守修飾之變異體另外為且不排除本發明之多晶型變異體、種間同源物及對偶基因。提供功能上類似之胺基酸之保守胺基酸取代在此項技術中已熟知。視特定胺基酸(例如催化、結構或空間重要之胺基酸)之功能性而定，胺基酸之不同分組可視為彼此保守取代的。基於胺基酸之電荷及極性、胺基酸之疏水性、胺基酸之表面暴露/結構性質及胺基酸之二級結構傾向，表 1提供視為保守取代之胺基酸之分組。表 1.基於蛋白質中之殘基功能性的保守胺基酸取代之分組

重要特徵	保守分組
電荷/極性	1. H、R及K 2. D及E 3. C、T、S、G、N、Q及Y 4. A、P、M、L、I、V、F及W
疏水性	1. D、E、N、Q、R及K 2. C、S、T、P、G、H及Y 3. A、M、I、L、V、F及W
結構/表面暴露	1. D、E、N、Q、H、R及K 2. C、S、T、P、A、G、W及Y 3. M、I、L、V及F
二級結構傾向	1. A、E、Q、H、K、M、L及R 2. C、T、I、V、F、Y及W 3. S、G、P、D及N
進化保守	1. D及E 2. H、K及R 3. N及Q 4. S及T 5. L、I及V 6. F、Y及W 7. A及G 8. M及C

在兩個或多於兩個核酸或肽序列的情形下，術語「一致」或百分比「一致性」係指相同或具有指定百分比之相同胺基酸殘基或核苷酸(亦即當在比較窗或指定區域內針對最大對應性進行比較且比對時，在指定區域內約60%一致性，較佳65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的一致性)之兩個或多於兩個序列或子序列，如使用例如具有預設參數之下文所描述之BLAST或BLAST 2.0序列比較演算法量測或藉由人工比對及目視檢查量測。如此項技術中已知，許多不同程式可用以鑑別蛋白質(或如下文所論述之核酸)與已知序列是否具有序列一致性或相似性。使用此項技術中已知之標準技術、較佳使用預設設定或藉由檢查來確定序列一致性及/或相似性，該等標準技術包括(但不限於)Smith & Waterman, Adv. Appl. Math., 2:482 (1981)之局部序列一致性演算法；Needleman & Wunsch, J. Mol. Biol., 48:443 (1970)之序列一致性比對演算法；Pearson & Lipman, Proc. Natl. Acad. Sci. U.S.A., 85:2444 (1988)之相似性方法之檢索；此等演算法之電腦化實施方案(Wisconsin Genetics套裝軟體, Genetics Computer Group, 575 Science Drive, Madison, WI中之GAP、BESTFIT、FASTA及TFASTA)；由Devereux等人, Nucl. Acid Res., 12:387-395 (1984)所描述之最好擬合序列程式。較佳地，藉由FastDB基於以下參數計算百分比一致性：錯配罰分1；空隙罰分1；空隙大小罰分0.33；及接合罰分30，「Current Methods in Sequence Comparison and Analysis,」 Macromolecule Sequencing and Synthesis, Selected Methods and Applications, 第127-149頁(1988), Alan R. Liss, Inc,以上所有者以引用之方式併入。適用演算法之一實例為PILEUP。PILEUP使用漸進式成對比對來產生一組相關序列之多序列比對。其亦可繪製展示用以產生比對之叢集關係之樹形圖。PILEUP使用Feng & Doolittle, J. Mol. Evol. 35:351-360 (1987)之漸進式比對方法之簡化形式；該方法類似於由Higgins & Sharp CABIOS 5:151-153 (1989)所描述之方法，以上者均以引用之方式併入。適用PILEUP參數包括預設空隙權重3.00、預設空隙長度權重0.10及加權末端空隙。適用演算法之另一實例為BLAST演算法，其描述於以下者中：Altschul等人, J. Mol. Biol. 215, 403-410, (1990)；Altschul等人, Nucleic Acids Res. 25:3389-3402 (1997)；及Karlin等人, Proc. Natl. Acad. Sci. U.S.A. 90:5873-5787 (1993)，以上者均以引用之方式併入。尤其適用之BLAST程式為WU-BLAST-2程式，其獲自Altschul等人, Methods in Enzymology, 266:460-480 (1996)；[http://blast.wustl/edu/blast/ README.html]。WU-BLAST-2使用數個檢索參數，其中之大多數設定成預設值。使用以下值設定可調節參數：重疊間隔=1、重疊分數=0.125、詞臨限值(T)=11。HSP S及HSP S2參數為動態值且藉由本身程式視特定序列之組成及相關序列檢索之特定資料庫之組成而確立；然而可調節該等值以提高敏感性。如由以引用之方式併入之Altschul等人, Nucl. Acids Res., 25:3389-3402所報導，一額外適用之演算法為空隙BLAST。空隙BLAST使用BLOSUM-62取代得分；臨限值T參數設定為9；雙擊法用於觸發無空隙延伸部分，電荷空隙長度k，代價為10+k；Xu設定為16，且Xg對於資料庫檢索階段設定為40且對於演算法之輸出階段設定為67。空隙比對藉由對應於~22比特之得分觸發。藉由匹配之一致殘基之數目除以比對區域中「更長」序列之殘基總數來確定%胺基酸序列一致性值。「更長」序列為比對區域中具有大多數實際殘基之一者(忽略藉由WU-Blast-2引入以最大化比對得分之空隙)。以類似方式，關於所鑑別多肽之編碼序列，「百分比(%)核酸序列一致性」定義為與細胞循環蛋白之編碼序列中之核苷酸殘基一致的候選序列中之核苷酸殘基之百分比。較佳方法使用設定為預設參數之WU-BLAST-2之BLASTN模組，其中重疊間隔及重疊分數分別設定為1及0.125。比對可包括將空隙引入待比對之序列中。另外，針對含有比由圖2之序列(SEQ ID NO: 1)編碼之蛋白更多或更少胺基酸的序列，應理解在一個實施例中，序列一致性之百分比將基於相關於胺基酸或核苷酸之總數的一致胺基酸或核苷酸之數目確定。因此舉例而言，在一個實施例中，如下文所論述比圖2中所展示序列(SEQ ID NO: 1)更短之序列之序列一致性將使用更短序列中之核苷酸之數目確定。在百分比一致性計算中，相對權重不經賦予序列變型之多種表現形式，諸如插入、缺失、取代等。在一個實施例中，僅一致性打正分(+1)且包括空隙之序列變型之所有形式經指定「0」值，其避免用於序列相似性計算之如下文所描述之加權刻度或參數的需要。可例如藉由匹配之一致殘基之數目除以比對區域中「更短」序列之殘基總數且乘以100來計算百分比序列一致性。「更長」序列為比對區域中具有大多數實際殘基之一者。術語「對偶基因變異體」係指特定基因座處基因以及來源於基因之mRNA轉錄物之cDNA及由其編碼之多肽的多晶型形式。術語「較佳之哺乳動物密碼子」係指自編碼最常用於哺乳動物細胞中所表現之蛋白質之胺基酸的密碼子集合當中之密碼子子集，如選自以下清單：Gly (GGC、GGG)；Glu (GAG)；Asp (GAC)；Val (GTG、GTC)；Ala (GCC、GCT)；Ser (AGC、TCC)；Lys (AAG)；Asn (AAC)；Met (ATG)；Ile (ATC)；Thr (ACC)；Trp (TGG)；Cys (TGC)；Tyr (TAT、TAC)；Leu (CTG)；Phe (TTC)；Arg (CGC、AGG、AGA)；Gln (CAG)；His (CAC)；及Pro (CCC)。如本文中所使用，術語密碼子經改變係指編碼多肽(例如，因子VIII變異體蛋白)之聚核苷酸序列，其中編碼多肽之天然聚核苷酸之至少一個密碼子已經變化以改良聚核苷酸序列之特性。在一些實施例中，經改良特性促進編碼多肽之mRNA之轉錄增加，mRNA之穩定性增加(例如，改良之mRNA半衰期)、多肽之轉譯增加及/或聚核苷酸於載體內之封裝增加。可用以獲得經改良特性之更改之非限制性實例包括改變用於特定胺基酸之密碼子之用法及/或分佈；調節總體及/或局部GC含量；移除富AT序列；移除重複序列元件，調節總體及/或局部CpG二核苷酸含量；移除隱藏的調節元件(例如，TATA框及CCAAT框元件)；移除內含子/外顯子剪接位點，改良調節序列(例如，引入Kozak共同序列)；及移除能夠在經轉錄mRNA中形成二級結構(例如，莖環)之序列元件。如本文所論述，本文中存在多種命名法來係指本發明之組分。「CS-號」(例如，「CS04」、「CS01」、「CS23」等)係指編碼FVIII多肽之密碼子經改變聚核苷酸及/或經編碼多肽，包括變異體。舉例而言，CS01-FL係指全長密碼子經改變CS01聚核苷酸序列或由CS01聚核苷酸序列編碼之胺基酸序列(在本文中有時稱作「CS01-FL-AA」(針對 胺基酸序列)及「CS01-FL-NA」(針對核酸序列))。類似地，「CS01-LC」係指編碼FVIII多肽之輕鏈之密碼子經改變核酸序列(「CS01-LC-NA」)，或由CS01聚核苷酸序列編碼之FVIII輕鏈之胺基酸序列(有時在本文中亦稱作「CS01-LC-AA」)。同樣，對於FVIII重鏈，CS01-HC、CS01-HC-AA及CS01-HC-NA相同。如將由此項技術者所瞭解，對於僅密碼子經改變之構築體，諸如CS01、CS04、CS23等(例如，其相較於Refacto不含有額外胺基酸取代)，胺基酸序列將一致，因為胺基酸序列不因密碼子最佳化而改變。因此，本發明之序列構築體包括(但不限於)CS01-FL-NA、CS01-FL-AA、CS01-LC-NA、CS01-LC-AA、CS01-HC-AA、CS01-HC-NA、CS04-FL-NA、CS04-FL-AA、CS04-LC-NA、CS04-LC-AA、CS04-HC-AA、CS04-HC-NA、CS23-FL-NA、CS23-FL-AA、CS23-LC-NA、CS23-LC-AA、CS23-HC-AA及CS23-HC-NA。 III. 密碼子經改變因子VIII變異體在一些實施例中，本發明提供編碼因子VIII變異體之密碼子經改變聚核苷酸。當在基於AAV之基因治療構築體中投與時，此等密碼子經改變聚核苷酸提供明顯改良之因子VIII表現。相較於習知之密碼子最佳化構築體，密碼子經改變聚核苷酸亦顯示改良之AAV病毒粒子封裝。如實例2及表 4中所顯示，申請者已經由發現編碼因子VIII多肽之三種密碼子經改變聚核苷酸(CS01-FL-NA、CS04-FL-NA及CS23-FL-NA)而獲得此等優勢，該因子VIII多肽具有人類野生型因子VIII重鏈及輕鏈，及含有弗林蛋白酶裂解位點以促進活性FVIIIa蛋白在活體內成熟之短的14個胺基酸之B域經取代連接子(「SQ」連接子)。在一個實施例中，本文中所提供之密碼子經改變聚核苷酸的核苷酸序列與至少編碼因子VIII重鏈及因子VIII輕鏈之CS01、CS04或CS23 (分別為SEQ ID NO 13、1及20)內之序列具有高序列一致性。如此項技術中已知，因子VIII之B域對於活體內活性非必需。因此，在一些實施例中，本文中所提供之密碼子經改變聚核苷酸完全缺乏因子VIII B域。在一些實施例中，天然因子VIII B域用含有弗林蛋白酶裂解位點之短胺基酸連接子替換，該短胺基酸連接子例如由CS01、CS04或CS23 (分別為SEQ ID NO 2、2及21)構築體之胺基酸760-773組成之「SQ」連接子。「SQ」連接子亦稱作BDLO04 (針對胺基酸序列為BDLO04-AA，且針對核苷酸序列為BDLO04-NA)。在一個實施例中，由密碼子經改變聚核苷酸編碼之因子VIII重鏈及輕鏈分別為人類因子VIII重鏈及輕鏈。在其他實施例中，由密碼子經改變聚核苷酸編碼之因子VIII重鏈及輕鏈為來自另一哺乳動物之重鏈及輕鏈序列(例如，豬因子VIII)。在又其他實施例中，因子VIII重鏈及輕鏈為嵌合重鏈及輕鏈(例如，人類及第二哺乳動物序列之組合)。在又其他實施例中，因子VIII重鏈及輕鏈為來自另一哺乳動物之重鏈及輕鏈之人類化型式，例如來自其中人類殘基在選擇位置處經取代以在投與人類時減少所得肽之免疫原性的另一哺乳動物之重鏈及輕鏈序列。人類基因之GC含量自小於25%至大於90%廣泛變化。然而一般而言，具有更高GC含量之人類基因以更高水準表現。舉例而言，Kudla等人(PLoS Biol., 4(6):80 (2006))證實增加基因之GC含量主要藉由增加轉錄且實現更高穩態水準之mRNA轉錄增加了經編碼多肽之表現。一般而言，密碼子最佳化基因構築體之所需GC含量等於或大於60%。然而，天然AAV基因組之GC含量大約為56%。因此，在一些實施例中，本文中所提供之密碼子經改變聚核苷酸之CG含量更接近地符合天然AAV病毒粒子之GC含量(例如，大約56% GC)，其低於密碼子習知經最佳化以用於在哺乳動物細胞中表現之聚核苷酸的較佳CG含量(例如，處於或高於60% GC)。如實例1中所概述，相較於具有更高GC含量之類似的密碼子經改變編碼序列，GC含量為約56%之CS04-FL-NA (SEQ ID NO: 1)具有改良之病毒粒子封裝。因此，在一些實施例中，編碼因子VIII多肽之密碼子經改變聚核苷酸之總GC含量小於60%。在一些實施例中，編碼因子VIII多肽之密碼子經改變聚核苷酸之總GC含量小於59%。在一些實施例中，編碼因子VIII多肽之密碼子經改變聚核苷酸之總GC含量小於58%。在一些實施例中，編碼因子VIII多肽之密碼子經改變聚核苷酸之總GC含量小於57%。在一些實施例中，編碼因子VIII多肽之密碼子經改變聚核苷酸之總GC含量不大於56%。在一些實施例中，編碼因子VIII多肽之密碼子經改變聚核苷酸之總GC含量為54%至59%。在一些實施例中，編碼因子VIII多肽之密碼子經改變聚核苷酸之總GC含量為55%至59%。在一些實施例中，編碼因子VIII多肽之密碼子經改變聚核苷酸之總GC含量為56%至59%。在一些實施例中，編碼因子VIII多肽之密碼子經改變聚核苷酸之總GC含量為54%至58%。在一些實施例中，編碼因子VIII多肽之密碼子經改變聚核苷酸之總GC含量為55%至58%。在一些實施例中，編碼因子VIII多肽之密碼子經改變聚核苷酸之總GC含量為56%至58%。在一些實施例中，編碼因子VIII多肽之密碼子經改變聚核苷酸之總GC含量為54%至57%。在一些實施例中，編碼因子VIII多肽之密碼子經改變聚核苷酸之總GC含量為55%至57%。在一些實施例中，編碼因子VIII多肽之密碼子經改變聚核苷酸之總GC含量為56%至57%。在一些實施例中，編碼因子VIII多肽之密碼子經改變聚核苷酸之總GC含量為54%至56%。在一些實施例中，編碼因子VIII多肽之密碼子經改變聚核苷酸之總GC含量為55%至56%。在一些實施例中，編碼因子VIII多肽之密碼子經改變聚核苷酸之總GC含量為56±0.5%。在一些實施例中，編碼因子VIII多肽之密碼子經改變聚核苷酸之總GC含量為56±0.4%。在一些實施例中，編碼因子VIII多肽之密碼子經改變聚核苷酸之總GC含量為56±0.3%。在一些實施例中，編碼因子VIII多肽之密碼子經改變聚核苷酸之總GC含量為56±0.2%。在一些實施例中，編碼因子VIII多肽之密碼子經改變聚核苷酸之總GC含量為56±0.1%。在一些實施例中，編碼因子VIII多肽之密碼子經改變聚核苷酸之總GC含量為56%。 A. 因子VIII B域經取代連接子在一些實施例中，進一步改變FVIII重鏈與輕鏈之間的連接(例如，野生型因子VIII中之B域)。歸因於AAV封裝能力之大小限制，B域缺失、截短及或連接子經取代之變異體應改良FVIII基因治療構築體之功效。最習知使用之B域經取代連接子為SQ FVIII之連接子，其僅保留B域之14個胺基酸作為連接子序列。豬VIII之另一變異體(描述於美國專利第6,458,563號中之「OBI-1」)在CHO細胞中良好表現，且具有24個胺基酸之稍微更長的連接子。在一些實施例中，由本文中所描述之密碼子經改變聚核苷酸編碼之因子VIII構築體包括SQ型B域連接子序列。在其他實施例中，由本文中所描述之密碼子經改變聚核苷酸編碼之因子VIII構築體包括OBI-1-型B域連接子序列。在一些實施例中，本文中所描述之經編碼因子VIII多肽包括SQ型B域連接子(SFSQNPPVLKRHQR; BDL-SQ-AA; SEQ ID NO: 30)，包括野生型人類因子VIII B域(FVIII-FL-AA；SEQ ID NO: 19)之胺基酸760-762/1657-1667(Sandberg等人 Thromb. Haemost. 85:93 (2001))。在一些實施例中，相對於相對應野生型序列，SQ型B域連接子具有一個胺基酸取代。在一些實施例中，相對於相對應野生型序列，SQ型B域連接子具有兩個胺基酸取代。在一些實施例中，本文中所描述之經編碼因子VIII多肽包括Greengene型B域連接子，包括野生型人類因子VIII B域(FVIII-FL-AA；SEQ ID NO: 19)之胺基酸760/1582-1667(Oh等人, Biotechnol. Prog., 17:1999 (2001))。在一些實施例中，相對於相對應野生型序列，Greengene型B域連接子具有一個胺基酸取代。在一些實施例中，相對於相對應野生型序列，Greengene型B域連接子具有兩個胺基酸取代。在一些實施例中，本文中所描述之經編碼因子VIII多肽包括延長之SQ型B域連接子，包括野生型人類因子VIII B域(FVIII-FL-AA；SEQ ID NO: 19)之胺基酸760-769/1657-1667(Thim等人, Haemophilia, 16:349 (2010))。在一些實施例中，相對於相對應野生型序列，延長之SQ型B域連接子具有一個胺基酸取代。在一些實施例中，相對於相對應野生型序列，延長之SQ型B域連接子具有兩個胺基酸取代。在一些實施例中，本文中所描述之經編碼因子VIII多肽包括豬OBI-1-型B域連接子，包括來自野生型豬因子VIII B域之胺基酸SFAQNSRPPSASAPKPPVLRRHQR (SEQ ID NO: 31) (Toschi等人, Curr. Opin. Mol. Ther. 12:517 (2010))。在一些實施例中，相對於相對應野生型序列，豬OBI-1型B域連接子具有一個胺基酸取代。在一些實施例中，相對於相對應野生型序列，豬OBI-1型B域連接子具有兩個胺基酸取代。在一些實施例中，本文中所描述之經編碼因子VIII多肽包括人類OBI-1型B域連接子，包括野生型人類因子VIII B域(FVIII-FL-AA；SEQ ID NO: 19)之胺基酸760-772/1655-1667。在一些實施例中，相對於相對應野生型序列，人類OBI-1型B域連接子具有一個胺基酸取代。在一些實施例中，相對於相對應野生型序列，人類OBI-1型B域連接子具有兩個胺基酸取代。在一些實施例中，本文中所描述之經編碼因子VIII多肽包括O8型B域連接子，包括來自野生型豬因子VIII B域之胺基酸SFSQNSRHQAYRYRRG (SEQ ID NO: 32) (Toschi等人, Curr. Opin. Mol. Ther. 12:517 (2010))。在一些實施例中，相對於相對應野生型序列，豬OBI-1型B域連接子具有一個胺基酸取代。在一些實施例中，相對於相對應野生型序列，豬OBI-1型B域連接子具有兩個胺基酸取代。 B域自因子VIII構築體之移除似乎不影響活化酶(例如，FVIIIa)之活性，此大概因為B域在活化期間移除。然而，因子VIII之B域含有例如藉由N-或O-連接之糖基化而轉譯後修飾之若干殘基。野生型因子VIII B域之電子雜交分析(Prediction of N-glycosylation sites in human proteins, R. Gupta, E. Jung and S. Brunak, in preparation (2004))預測此等位點中之至少四者在活體內經糖基化。認為B域內之此等修飾有助於活體內因子VIII之轉譯後調節及/或半衰期。雖然因子VIII B域在成熟因子VIIIa蛋白中不存在，但前體因子VIII分子之B域內之糖基化可在活化之前增加蛋白質的循環半衰期。因此在一些實施例中，本文中所描述之經編碼因子VIII構築體之多肽連接子包括一或多個糖基化序列以允許活體內之糖基化。在一些實施例中，多肽連接子包括至少一個共同糖基化序列(例如，N-或O-連接之糖基化共同序列)。在一些實施例中，多肽連接子包括至少兩個共同糖基化序列。在一些實施例中，多肽連接子包括至少三個共同糖基化序列。在一些實施例中，多肽連接子包括至少四個共同糖基化序列。在一些實施例中，多肽連接子包括至少五個共同糖基化序列。在一些實施例中，多肽連接子包括至少6、7、8、9、10個或更多個共同糖基化序列。在一些實施例中，多肽連接子含有至少一個N-連接之糖基化序列N-X-S/T，其中X為不為P、S或T之任何胺基酸。在一些實施例中，多肽連接子含有至少兩個N-連接之糖基化序列N-X-S/T，其中X為不為P、S或T之任何胺基酸。在一些實施例中，多肽連接子含有至少三個N-連接之糖基化序列N-X-S/T，其中X為不為P、S或T之任何胺基酸。在一些實施例中，多肽連接子含有至少四個N-連接之糖基化序列N-X-S/T，其中X為不為P、S或T之任何胺基酸。在一些實施例中，多肽連接子含有至少五個N-連接之糖基化序列N-X-S/T，其中X為不為P、S或T之任何胺基酸。在一些實施例中，多肽連接子含有至少6、7、8、9、10個或更多個N-連接之糖基化序列N-X-S/T，其中X為不為P、S或T之任何胺基酸。 B. 編碼具有可裂解連接子之因子VIII變異體之密碼子經改變聚核苷酸 CS04 密碼子經改變聚核苷酸在一個實施例中，本文中所提供之密碼子經改變聚核苷酸包括編碼具有連接子(活體內可斷裂)之因子VIII變異體多肽之核苷酸序列。因子VIII多肽包括因子VIII輕鏈、因子VIII重鏈及接合重鏈C端與輕鏈N端之多肽連接子。因子VIII多肽之重鏈由與CS04-HC-NA (SEQ ID NO: 3)具有高序列一致性之第一核苷酸序列編碼，該CS04-HC-NA (SEQ ID NO: 3)為編碼因子VIII重鏈之CS04-FL-NA (SEQ ID NO: 1)之部分。因子VIII多肽之輕鏈由與CS04-LC-NA (SEQ ID NO: 4)具有高序列一致性之第二核苷酸序列編碼，該CS04-LC-NA (SEQ ID NO: 4)為編碼因子VIII輕鏈之CS04-FL-NA (SEQ ID NO: 1)之部分。多肽連接子包括弗林蛋白酶裂解位點，其允許活體內成熟(例如，在活體內表現或投與前體多肽後)。在一些實施例中，第一及第二核苷酸序列分別與CS04-HC-NA及CS04-LC-NA (SEQ ID NO 3及4)具有至少95%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS04-HC-NA及CS04-LC-NA (SEQ ID NO 3及4)具有至少96%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS04-HC-NA及CS04-LC-NA (SEQ ID NO 3及4)具有至少97%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS04-HC-NA及CS04-LC-NA (SEQ ID NO 3及4)具有至少98%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS04-HC-NA及CS04-LC-NA (SEQ ID NO 3及4)具有至少99%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS04-HC-NA及CS04-LC-NA (SEQ ID NO 3及4)具有至少99.5%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS04-HC-NA及CS04-LC-NA (SEQ ID NO 3及4)具有至少99.9%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS04-HC-NA及CS04-LC-NA (SEQ ID NO 3及4)一致。在一些實施例中，因子VIII構築體之多肽連接子由與BDLO04 (SEQ ID NO: 6)具有高序列一致性之第三核苷酸序列編碼，該BDLO04 (SEQ ID NO: 6)編碼對應於CS04-FL-AA (SEQ ID NO: 2)之胺基酸760-773之14-胺基酸連接子。在一些實施例中，第三核苷酸序列與BDLO04 (SEQ ID NO: 6)具有至少95%一致性。在一些實施例中，第三核苷酸序列與BDLO04 (SEQ ID NO: 6)具有至少96%一致性。在一些實施例中，第三核苷酸序列與BDLO04 (SEQ ID NO: 6)具有至少97%一致性。在一些實施例中，第三核苷酸序列與BDLO04 (SEQ ID NO: 6)具有至少98%一致性。在一些實施例中，第三核苷酸序列與BDLO04 (SEQ ID NO: 6)一致。在一些實施例中，密碼子經改變聚核苷酸具有與CS04-FL-NA (SEQ ID NO: 1)具有高序列一致性之核苷酸序列。在一些實施例中，核苷酸序列與CS04-FL-NA (SEQ ID NO: 1)具有至少95%一致性。在一些實施例中，核苷酸序列與CS04-FL-NA (SEQ ID NO: 1)具有至少96%一致性。在一些實施例中，核苷酸序列與CS04-FL-NA (SEQ ID NO: 1)具有至少97%一致性。在一些實施例中，核苷酸序列與CS04-FL-NA (SEQ ID NO: 1)具有至少98%一致性。在一些實施例中，核苷酸序列與CS04-FL-NA (SEQ ID NO: 1)具有至少99%一致性。在一些實施例中，核苷酸序列與CS04-FL-NA (SEQ ID NO: 1)具有至少99.5%一致性。在一些實施例中，核苷酸序列與CS04-FL-NA (SEQ ID NO: 1)具有至少99.9%一致性。在一些實施例中，核苷酸序列與CS04-FL-NA (SEQ ID NO: 1)一致。在一些實施例中，由密碼子經改變聚核苷酸編碼之因子VIII變異體具有與CS04-FL-AA (SEQ ID NO: 2)具有高序列一致性之胺基酸序列。在一些實施例中，胺基酸序列與CS04-FL-AA (SEQ ID NO: 2)具有至少97%一致性。在一些實施例中，胺基酸序列與CS04-FL-AA (SEQ ID NO: 2)具有至少98%一致性。在一些實施例中，胺基酸序列與CS04-FL-AA (SEQ ID NO: 2)具有至少99%一致性。在一些實施例中，胺基酸序列與CS04-FL-AA (SEQ ID NO: 2)具有至少99.5%一致性在一些實施例中，胺基酸序列與CS04-FL-AA (SEQ ID NO: 2)具有至少99.9%一致性。在一些實施例中，胺基酸序列與CS04-FL-AA (SEQ ID NO: 2)一致。 CS01 密碼子經改變聚核苷酸在一個實施例中，本文中所提供之密碼子經改變聚核苷酸包括編碼具有連接子(活體內可斷裂)之因子VIII變異體多肽之核苷酸序列。因子VIII多肽包括因子VIII輕鏈、因子VIII重鏈及接合重鏈C端與輕鏈N端之多肽連接子。因子VIII多肽之重鏈由與CS01-HC-NA (SEQ ID NO: 24)具有高序列一致性之第一核苷酸序列編碼，該CS01-HC-NA (SEQ ID NO: 24)為編碼因子VIII重鏈之CS01-FL-NA (SEQ ID NO: 13)之部分。因子VIII多肽之輕鏈由與CS01-LC-NA (SEQ ID NO: 25)具有高序列一致性之第二核苷酸序列編碼，該CS01-LC-NA (SEQ ID NO: 25)為編碼因子VIII輕鏈之CS01-FL-NA (SEQ ID NO: 13)之部分。多肽連接子包括弗林蛋白酶裂解位點，其允許活體內成熟(例如，在活體內表現或投與前體多肽後)。在一些實施例中，第一及第二核苷酸序列分別與CS01-HC-NA及CS01-LC-NA (SEQ ID NO 24及25)具有至少95%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS01-HC-NA及CS01-LC-NA (SEQ ID NO 24及25)具有至少96%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS01-HC-NA及CS01-LC-NA (SEQ ID NO 24及25)具有至少97%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS01-HC-NA及CS01-LC-NA (SEQ ID NO 24及25)具有至少98%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS01-HC-NA及CS01-LC-NA (SEQ ID NO 24及25)具有至少99%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS01-HC-NA及CS01-LC-NA (SEQ ID NO 24及25)具有至少99.5%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS01-HC-NA及CS01-LC-NA (SEQ ID NO 24及25)具有至少99.9%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS01-HC-NA及CS01-LC-NA (SEQ ID NO 24及25)一致。在一些實施例中，因子VIII構築體之多肽連接子由與BDLO04 (SEQ ID NO: 6)具有高序列一致性之第三核苷酸序列編碼，該BDLO04 (SEQ ID NO: 6)編碼對應於CS01-FL-AA (SEQ ID NO: 2)之胺基酸760-773之14-胺基酸連接子。在一些實施例中，第三核苷酸序列與BDLO04 (SEQ ID NO: 6)具有至少95%一致性。在一些實施例中，第三核苷酸序列與BDLO04 (SEQ ID NO: 6)具有至少96%一致性。在一些實施例中，第三核苷酸序列與BDLO04 (SEQ ID NO: 6)具有至少97%一致性。在一些實施例中，第三核苷酸序列與BDLO04 (SEQ ID NO: 6)具有至少98%一致性。在一些實施例中，第三核苷酸序列與BDLO04 (SEQ ID NO: 6)一致。在一些實施例中，密碼子經改變聚核苷酸具有與CS01-FL-NA (SEQ ID NO: 13)具有高序列一致性之核苷酸序列。在一些實施例中，核苷酸序列與CS01-FL-NA (SEQ ID NO: 13)具有至少95%一致性。在一些實施例中，核苷酸序列與CS01-FL-NA (SEQ ID NO: 13)具有至少96%一致性。在一些實施例中，核苷酸序列與CS01-FL-NA (SEQ ID NO: 13)具有至少97%一致性。在一些實施例中，核苷酸序列與CS01-FL-NA (SEQ ID NO: 13)具有至少98%一致性。在一些實施例中，核苷酸序列與CS01-FL-NA (SEQ ID NO: 13)具有至少99%一致性。在一些實施例中，核苷酸序列與CS01-FL-NA (SEQ ID NO: 13)具有至少99.5%一致性。在一些實施例中，核苷酸序列與CS01-FL-NA (SEQ ID NO: 13)具有至少99.9%一致性。在一些實施例中，核苷酸序列與CS01-FL-NA (SEQ ID NO: 13)一致。在一些實施例中，由密碼子經改變聚核苷酸編碼之因子VIII變異體具有與CS01-FL-AA (SEQ ID NO: 2)具有高序列一致性之胺基酸序列。在一些實施例中，胺基酸序列與CS01-FL-AA (SEQ ID NO: 2)具有至少97%一致性。在一些實施例中，胺基酸序列與CS01-FL-AA (SEQ ID NO: 2)具有至少98%一致性。在一些實施例中，胺基酸序列與CS01-FL-AA (SEQ ID NO: 2)具有至少99%一致性。在一些實施例中，胺基酸序列與CS01-FL-AA (SEQ ID NO: 2)具有至少99.5%一致性。在一些實施例中，胺基酸序列與CS01-FL-AA (SEQ ID NO: 2)具有至少99.9%一致性。在一些實施例中，胺基酸序列與CS01-FL-AA (SEQ ID NO: 2)一致。 CS23 密碼子經改變聚核苷酸在一個實施例中，本文中所提供之密碼子經改變聚核苷酸包括編碼具有連接子(活體內可斷裂)之因子VIII變異體多肽之核苷酸序列。因子VIII多肽包括因子VIII輕鏈、因子VIII重鏈及接合重鏈C端與輕鏈N端之多肽連接子。因子VIII多肽之重鏈由與CS23-HC-NA (SEQ ID NO: 22)具有高序列一致性之第一核苷酸序列編碼，該CS23-HC-NA (SEQ ID NO: 22)為編碼因子VIII重鏈之CS23-FL-NA (SEQ ID NO: 20)之部分。因子VIII多肽之輕鏈由與CS23-LC-NA (SEQ ID NO: 23)具有高序列一致性之第二核苷酸序列編碼，該CS23-LC-NA (SEQ ID NO: 23)為編碼因子VIII輕鏈之CS23-FL-NA (SEQ ID NO: 20)之部分。多肽連接子包括弗林蛋白酶裂解位點，其允許活體內成熟(例如，在活體內表現或投與前體多肽後)。在一些實施例中，第一及第二核苷酸序列分別與CS23-HC-NA及CS23-LC-NA (SEQ ID NO 22及23)具有至少95%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS23-HC-NA及CS23-LC-NA (SEQ ID NO 22及23)具有至少96%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS23-HC-NA及CS23-LC-NA (SEQ ID NO 22及23)具有至少97%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS23-HC-NA及CS23-LC-NA (SEQ ID NO 22及23)具有至少98%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS23-HC-NA及CS23-LC-NA (SEQ ID NO 22及23)具有至少99%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS23-HC-NA及CS23-LC-NA (SEQ ID NO 22及23)具有至少99.5%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS23-HC-NA及CS23-LC-NA (SEQ ID NO 22及23)具有至少99.9%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS23-HC-NA及CS23-LC-NA (SEQ ID NO 22及23)一致。在一些實施例中，因子VIII構築體之多肽連接子由與BDLO04 (SEQ ID NO: 6)具有高序列一致性之第三核苷酸序列編碼，該BDLO04 (SEQ ID NO: 6)編碼對應於CS23-FL-AA (SEQ ID NO:21)之胺基酸760-773的14-胺基酸連接子。在一些實施例中，第三核苷酸序列與BDLO04 (SEQ ID NO: 6)具有至少95%一致性。在一些實施例中，第三核苷酸序列與BDLO04 (SEQ ID NO: 6)具有至少96%一致性。在一些實施例中，第三核苷酸序列與BDLO04 (SEQ ID NO: 6)具有至少97%一致性。在一些實施例中，第三核苷酸序列與BDLO04 (SEQ ID NO: 6)具有至少98%一致性。在一些實施例中，第三核苷酸序列與BDLO04 (SEQ ID NO: 6)一致。在一些實施例中，密碼子經改變聚核苷酸具有與CS23-FL-NA (SEQ ID NO: 20)具有高序列一致性之核苷酸序列。在一些實施例中，核苷酸序列與CS23-FL-NA (SEQ ID NO: 20)具有至少95%一致性。在一些實施例中，核苷酸序列與CS23-FL-NA (SEQ ID NO: 20)具有至少96%一致性。在一些實施例中，核苷酸序列與CS23-FL-NA (SEQ ID NO: 20)具有至少97%一致性。在一些實施例中，核苷酸序列與CS23-FL-NA (SEQ ID NO: 20)具有至少98%一致性。在一些實施例中，核苷酸序列與CS23-FL-NA (SEQ ID NO: 20)具有至少99%一致性。在一些實施例中，核苷酸序列與CS23-FL-NA (SEQ ID NO: 20)具有至少99.5%一致性。在一些實施例中，核苷酸序列與CS23-FL-NA (SEQ ID NO: 20)具有至少99.9%一致性。在一些實施例中，核苷酸序列與CS23-FL-NA (SEQ ID NO: 20)一致。在一些實施例中，由密碼子經改變聚核苷酸編碼之因子VIII變異體具有與CS23-FL-AA (SEQ ID NO: 21)具有高序列一致性之胺基酸序列。在一些實施例中，胺基酸序列與CS23-FL-AA (SEQ ID NO: 21)具有至少97%一致性。在一些實施例中，胺基酸序列與CS23-FL-AA (SEQ ID NO: 21)具有至少98%一致性。在一些實施例中，胺基酸序列與CS23-FL-AA (SEQ ID NO: 21)具有至少99%一致性。在一些實施例中，胺基酸序列與CS23-FL-AA (SEQ ID NO: 21)具有至少99.5%一致性。在一些實施例中，胺基酸序列與CS23-FL-AA (SEQ ID NO: 21)具有至少99.9%一致性。在一些實施例中，胺基酸序列與CS23-FL-AA (SEQ ID NO: 21)一致。 C. 編碼單鏈因子VIII蛋白之密碼子經改變聚核苷酸儘管不能出現正常成熟之因子VIII分子，但位於B域C末端處之弗林蛋白酶裂解位點經移除之因子VIII構築體作為單鏈多肽保留活性(Leyte等人(1991))。類似地，具有減毒弗林蛋白酶位點之B域經缺失因子VIII構築體(含有R1664H胺基酸取代)比具有野生型弗林蛋白酶裂解位點之相對應因子VIII構築體更具有生物學活性(Siner等人(2013))。因此在一些實施例中，本文中所提供之密碼子經改變聚核苷酸包括編碼單鏈因子VIII變異體多肽之核苷酸序列。單鏈因子VIII多肽包括因子VIII輕鏈、因子VIII重鏈及接合重鏈C端與輕鏈N端之多肽連接子。多肽連接子不包括弗林蛋白酶裂解位點。單鏈 CS04 密碼子經改變聚核苷酸在一個實施例中，本文中所提供之密碼子經改變聚核苷酸包括編碼單鏈因子VIII變異體多肽之核苷酸序列。因子VIII多肽包括因子VIII輕鏈、因子VIII重鏈及視情況選用之接合重鏈C端與輕鏈N端之多肽連接子。因子VIII多肽之重鏈由與CS04-HC-NA (SEQ ID NO: 3)具有高序列一致性之第一核苷酸序列編碼，該CS04-HC-NA (SEQ ID NO: 3)為編碼因子VIII重鏈之CS04-FL-NA (SEQ ID NO: 1)之部分。因子VIII多肽之輕鏈由與CS04-LC-NA (SEQ ID NO: 4)具有高序列一致性之第二核苷酸序列編碼，該CS04-LC-NA (SEQ ID NO: 4)為編碼因子VIII輕鏈之CS04-FL-NA (SEQ ID NO: 1)之部分。視情況選用之多肽連接子不包括弗林蛋白酶裂解位點。在一些實施例中，第一及第二核苷酸序列分別與CS04-HC-NA及CS04-LC-NA (SEQ ID NO 3及4)具有至少95%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS04-HC-NA及CS04-LC-NA (SEQ ID NO 3及4)具有至少96%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS04-HC-NA及CS04-LC-NA (SEQ ID NO 3及4)具有至少97%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS04-HC-NA及CS04-LC-NA (SEQ ID NO 3及4)具有至少98%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS04-HC-NA及CS04-LC-NA (SEQ ID NO 3及4)具有至少99%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS04-HC-NA及CS04-LC-NA (SEQ ID NO 3及4)具有至少99.5%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS04-HC-NA及CS04-LC-NA (SEQ ID NO 3及4)具有至少99.9%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS04-HC-NA及CS04-LC-NA (SEQ ID NO 3及4)一致。在一些實施例中，密碼子經改變聚核苷酸具有與CS04-SC1-NA (SEQ ID NO: 9)具有高序列一致性之核苷酸序列。在一些實施例中，核苷酸序列與CS04-SC1-NA (SEQ ID NO: 9)具有至少95%一致性。在一些實施例中，核苷酸序列與CS04-SC1-NA (SEQ ID NO: 9)具有至少96%一致性。在一些實施例中，核苷酸序列與CS04-SC1-NA (SEQ ID NO: 9)具有至少97%一致性。在一些實施例中，核苷酸序列與CS04-SC1-NA (SEQ ID NO: 9)具有至少98%一致性。在一些實施例中，核苷酸序列與CS04-SC1-NA (SEQ ID NO: 9)具有至少99%一致性。在一些實施例中，核苷酸序列與CS04-SC1-NA (SEQ ID NO: 9)具有至少99.5%一致性。在一些實施例中，核苷酸序列與CS04-SC1-NA (SEQ ID NO: 9)具有至少99.9%一致性。在一些實施例中，核苷酸序列與CS04-SC1-NA (SEQ ID NO: 9)一致。在一些實施例中，密碼子經改變聚核苷酸具有與CS04-SC2-NA (SEQ ID NO: 11)具有高序列一致性之核苷酸序列。在一些實施例中，核苷酸序列與CS04-SC2-NA (SEQ ID NO: 11)具有至少95%一致性。在一些實施例中，核苷酸序列與CS04-SC2-NA (SEQ ID NO: 11)具有至少96%一致性。在一些實施例中，核苷酸序列與CS04-SC2-NA (SEQ ID NO: 11)具有至少97%一致性。在一些實施例中，核苷酸序列與CS04-SC2-NA (SEQ ID NO: 11)具有至少98%一致性。在一些實施例中，核苷酸序列與CS04-SC2-NA (SEQ ID NO: 11)具有至少99%一致性。在一些實施例中，核苷酸序列與CS04-SC2-NA (SEQ ID NO: 11)具有至少99.5%一致性。在一些實施例中，核苷酸序列與CS04-SC2-NA (SEQ ID NO: 11)具有至少99.9%一致性。在一些實施例中，核苷酸序列與CS04-SC2-NA (SEQ ID NO: 11)一致。在一些實施例中，由密碼子經改變聚核苷酸編碼之單鏈因子VIII變異體具有與CS04-SC1-AA (SEQ ID NO: 10；人類因子VIII∆(760-1667) (SPI； HsFVIII∆(741-1648), SPE))具有高序列一致性之胺基酸序列。在一些實施例中，由密碼子經改變聚核苷酸編碼之因子VIII變異體具有與CS04-SC1-AA (SEQ ID NO: 10)具有高序列一致性之胺基酸序列。在一些實施例中，胺基酸序列與CS04-SC1-AA (SEQ ID NO: 10)具有至少97%一致性。在一些實施例中，胺基酸序列與CS04-SC1-AA (SEQ ID NO: 10)具有至少98%一致性。在一些實施例中，胺基酸序列與CS04-SC1-AA (SEQ ID NO: 10)具有至少99%一致性。在一些實施例中，胺基酸序列與CS04-SC1-AA (SEQ ID NO: 10)具有至少99.5%一致性。在一些實施例中，胺基酸序列與CS04-SC1-AA (SEQ ID NO: 10)具有至少99.9%一致性。在一些實施例中，胺基酸序列與CS04-SC1-AA (SEQ ID NO: 10)一致。在一些實施例中，由密碼子經改變聚核苷酸編碼之單鏈因子VIII變異體具有與CS04-SC2-AA (SEQ ID NO: 12；人類因子VIII∆(772-1667) (SPI； HsFVIII∆ (753-1648), SPE))具有高序列一致性之胺基酸序列。在一些實施例中，由密碼子經改變聚核苷酸編碼之因子VIII變異體具有與CS04-SC2-AA (SEQ ID NO: 12)具有高序列一致性之胺基酸序列。在一些實施例中，胺基酸序列與CS04-SC2-AA (SEQ ID NO: 12)具有至少97%一致性。在一些實施例中，胺基酸序列與CS04-SC2-AA (SEQ ID NO: 12)具有至少98%一致性。在一些實施例中，胺基酸序列與CS04-SC2-AA (SEQ ID NO: 12)具有至少99%一致性。在一些實施例中，胺基酸序列與CS04-SC2-AA (SEQ ID NO: 12)具有至少99.5%一致性。在一些實施例中，胺基酸序列與CS04-SC2-AA (SEQ ID NO: 12)具有至少99.9%一致性。在一些實施例中，胺基酸序列與CS04-SC2-AA (SEQ ID NO: 12)一致。單鏈 CS01 密碼子經改變聚核苷酸在一個實施例中，本文中所提供之密碼子經改變聚核苷酸包括編碼單鏈因子VIII變異體多肽之核苷酸序列。因子VIII多肽包括因子VIII輕鏈、因子VIII重鏈及視情況選用之接合重鏈C端與輕鏈N端之多肽連接子。因子VIII多肽之重鏈由與CS01-HC-NA (SEQ ID NO: 24)具有高序列一致性之第一核苷酸序列編碼，該CS01-HC-NA (SEQ ID NO: 24)為編碼因子VIII重鏈之CS01-FL-NA (SEQ ID NO: 13)之部分。因子VIII多肽之輕鏈由與CS01-LC-NA (SEQ ID NO: 25)具有高序列一致性之第二核苷酸序列編碼，該CS01-LC-NA (SEQ ID NO: 25)為編碼因子VIII輕鏈之CS01-FL-NA (SEQ ID NO: 13)之部分。視情況選用之多肽連接子不包括弗林蛋白酶裂解位點。在一些實施例中，第一及第二核苷酸序列分別與CS01-HC-NA及CS01-LC-NA (SEQ ID NO 24及25)具有至少95%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS01-HC-NA及CS01-LC-NA (SEQ ID NO 24及25)具有至少96%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS01-HC-NA及CS01-LC-NA (SEQ ID NO 24及25)具有至少97%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS01-HC-NA及CS01-LC-NA (SEQ ID NO 24及25)具有至少98%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS01-HC-NA及CS01-LC-NA (SEQ ID NO 24及25)具有至少99%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS01-HC-NA及CS01-LC-NA (SEQ ID NO 24及25)具有至少99.5%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS01-HC-NA及CS01-LC-NA (SEQ ID NO 24及25)具有至少99.9%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS01-HC-NA及CS01-LC-NA (SEQ ID NO 24及25)一致。在一些實施例中，密碼子經改變聚核苷酸具有與CS01-SC1-NA (SEQ ID NO: 26)具有高序列一致性之核苷酸序列。在一些實施例中，核苷酸序列與CS01-SC1-NA (SEQ ID NO: 26)具有至少95%一致性。在一些實施例中，核苷酸序列與CS01-SC1-NA (SEQ ID NO: 26)具有至少96%一致性。在一些實施例中，核苷酸序列與CS01-SC1-NA (SEQ ID NO: 26)具有至少97%一致性。在一些實施例中，核苷酸序列與CS01-SC1-NA (SEQ ID NO: 26)具有至少98%一致性。在一些實施例中，核苷酸序列與CS01-SC1-NA (SEQ ID NO: 26)具有至少99%一致性。在一些實施例中，核苷酸序列與CS01-SC1-NA (SEQ ID NO: 26)具有至少99.5%一致性。在一些實施例中，核苷酸序列與CS01-SC1-NA (SEQ ID NO: 26)具有至少99.9%一致性。在一些實施例中，核苷酸序列與CS01-SC1-NA (SEQ ID NO: 26)一致。在一些實施例中，密碼子經改變聚核苷酸具有與CS01-SC2-NA (SEQ ID NO: 27)具有高序列一致性之核苷酸序列。在一些實施例中，核苷酸序列與CS01-SC2-NA (SEQ ID NO: 27)具有至少95%一致性。在一些實施例中，核苷酸序列與CS01-SC2-NA (SEQ ID NO: 27)具有至少96%一致性。在一些實施例中，核苷酸序列與CS01-SC2-NA (SEQ ID NO: 27)具有至少97%一致性。在一些實施例中，核苷酸序列與CS01-SC2-NA (SEQ ID NO: 27)具有至少98%一致性。在一些實施例中，核苷酸序列與CS01-SC2-NA (SEQ ID NO: 27)具有至少99%一致性。在一些實施例中，核苷酸序列與CS01-SC2-NA (SEQ ID NO: 27)具有至少99.5%一致性。在一些實施例中，核苷酸序列與CS01-SC2-NA (SEQ ID NO: 27)具有至少99.9%一致性。在一些實施例中，核苷酸序列與CS01-SC2-NA (SEQ ID NO: 27)一致。在一些實施例中，由密碼子經改變聚核苷酸編碼之單鏈因子VIII變異體具有與CS01-SC1-AA (SEQ ID NO: 10；人類因子VIII∆(760-1667) (SPI； HsFVIII∆(741-1648), SPE))具有高序列一致性之胺基酸序列。在一些實施例中，由密碼子經改變聚核苷酸編碼之因子VIII變異體具有與CS01-SC1-AA (SEQ ID NO: 10)具有高序列一致性之胺基酸序列。在一些實施例中，胺基酸序列與CS01-SC1-AA (SEQ ID NO: 10)具有至少97%一致性。在一些實施例中，胺基酸序列與CS01-SC1-AA (SEQ ID NO: 10)具有至少98%一致性。在一些實施例中，胺基酸序列與CS01-SC1-AA (SEQ ID NO: 10)具有至少99%一致性。在一些實施例中，胺基酸序列與CS01-SC1-AA (SEQ ID NO: 10)具有至少99.5%一致性。在一些實施例中，胺基酸序列與CS01-SC1-AA (SEQ ID NO: 10)具有至少99.9%一致性。在一些實施例中，胺基酸序列與CS01-SC1-AA (SEQ ID NO: 10)一致。在一些實施例中，由密碼子經改變聚核苷酸編碼之單鏈因子VIII變異體具有與CS01-SC2-AA (SEQ ID NO: 12；人類因子VIII∆(772-1667) (SPI； HsFVIII∆(753-1648), SPE))具有高序列一致性之胺基酸序列。在一些實施例中，由密碼子經改變聚核苷酸編碼之因子VIII變異體具有與CS01-SC2-AA (SEQ ID NO: 12)具有高序列一致性之胺基酸序列。在一些實施例中，胺基酸序列與CS01-SC2-AA (SEQ ID NO: 12)具有至少97%一致性。在一些實施例中，胺基酸序列與CS01-SC2-AA (SEQ ID NO: 12)具有至少98%一致性。在一些實施例中，胺基酸序列與CS01-SC2-AA (SEQ ID NO: 12)具有至少99%一致性。在一些實施例中，胺基酸序列與CS01-SC2-AA (SEQ ID NO: 12)具有至少99.5%一致性。在一些實施例中，胺基酸序列與CS01-SC2-AA (SEQ ID NO: 12)具有至少99.9%一致性。在一些實施例中，胺基酸序列與CS01-SC2-AA (SEQ ID NO: 12)一致。單鏈 CS23 密碼子經改變聚核苷酸在一個實施例中，本文中所提供之密碼子經改變聚核苷酸包括編碼單鏈因子VIII變異體多肽之核苷酸序列。因子VIII多肽包括因子VIII輕鏈、因子VIII重鏈及視情況選用之接合重鏈C端與輕鏈N端之多肽連接子。因子VIII多肽之重鏈由與CS23-HC-NA (SEQ ID NO: 22)具有高序列一致性之第一核苷酸序列編碼，該CS23-HC-NA (SEQ ID NO: 22)為編碼因子VIII重鏈之CS23-FL-NA (SEQ ID NO: 20)之部分。因子VIII多肽之輕鏈由與CS23-LC-NA (SEQ ID NO: 23)具有高序列一致性之第二核苷酸序列編碼，該CS23-LC-NA (SEQ ID NO: 23)為編碼因子VIII輕鏈之CS23-FL-NA (SEQ ID NO: 20)之部分。視情況選用之多肽連接子不包括弗林蛋白酶裂解位點。在一些實施例中，第一及第二核苷酸序列分別與CS23-HC-NA及CS23-LC-NA (SEQ ID NO 22及23)具有至少95%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS23-HC-NA及CS23-LC-NA (SEQ ID NO 22及23)具有至少96%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS23-HC-NA及CS23-LC-NA (SEQ ID NO 22及23)具有至少97%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS23-HC-NA及CS23-LC-NA (SEQ ID NO 22及23)具有至少98%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS23-HC-NA及CS23-LC-NA (SEQ ID NO 22及23)具有至少99%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS23-HC-NA及CS23-LC-NA (SEQ ID NO 22及23)具有至少99.5%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS23-HC-NA及CS23-LC-NA (SEQ ID NO 22及23)具有至少99.9%序列一致性。在一些實施例中，第一及第二核苷酸序列分別與CS23-HC-NA及CS23-LC-NA (SEQ ID NO 22及23)一致。在一些實施例中，密碼子經改變聚核苷酸具有與CS23-SC1-NA (SEQ ID NO: 28)具有高序列一致性之核苷酸序列。在一些實施例中，核苷酸序列與CS23-SC1-NA (SEQ ID NO: 28)具有至少95%一致性。在一些實施例中，核苷酸序列與CS23-SC1-NA (SEQ ID NO: 28)具有至少96%一致性。在一些實施例中，核苷酸序列與CS23-SC1-NA (SEQ ID NO: 28)具有至少97%一致性。在一些實施例中，核苷酸序列與CS23-SC1-NA (SEQ ID NO: 28)具有至少98%一致性。在一些實施例中，核苷酸序列與CS23-SC1-NA (SEQ ID NO: 28)具有至少99%一致性。在一些實施例中，核苷酸序列與CS23-SC1-NA (SEQ ID NO: 28)具有至少99.5%一致性。在一些實施例中，核苷酸序列與CS23-SC1-NA (SEQ ID NO: 28)具有至少99.9%一致性。在一些實施例中，核苷酸序列與CS23-SC1-NA (SEQ ID NO: 28)一致。在一些實施例中，密碼子經改變聚核苷酸具有與CS23-SC2-NA (SEQ ID NO: 29)具有高序列一致性之核苷酸序列。在一些實施例中，核苷酸序列與CS23-SC2-NA (SEQ ID NO: 29)具有至少95%一致性。在一些實施例中，核苷酸序列與CS23-SC2-NA (SEQ ID NO: 29)具有至少96%一致性。在一些實施例中，核苷酸序列與CS23-SC2-NA (SEQ ID NO: 29)具有至少97%一致性。在一些實施例中，核苷酸序列與CS23-SC2-NA (SEQ ID NO: 29)具有至少98%一致性。在一些實施例中，核苷酸序列與CS23-SC2-NA (SEQ ID NO: 29)具有至少99%一致性。在一些實施例中，核苷酸序列與CS23-SC2-NA (SEQ ID NO: 29)具有至少99.5%一致性。在一些實施例中，核苷酸序列與CS23-SC2-NA (SEQ ID NO: 29)具有至少99.9%一致性。在一些實施例中，核苷酸序列與CS23-SC2-NA (SEQ ID NO: 29)一致。在一些實施例中，由密碼子經改變聚核苷酸編碼之單鏈因子VIII變異體具有與CS23-SC1-AA (SEQ ID NO: 10；人類因子VIII∆(760-1667) (SPI； HsFVIII∆(741-1648), SPE))具有高序列一致性之胺基酸序列。在一些實施例中，由密碼子經改變聚核苷酸編碼之因子VIII變異體具有與CS23-SC1-AA (SEQ ID NO: 10)具有高序列一致性之胺基酸序列。在一些實施例中，胺基酸序列與CS23-SC1-AA (SEQ ID NO: 10)具有至少97%一致性。在一些實施例中，胺基酸序列與CS23-SC1-AA (SEQ ID NO: 10)具有至少98%一致性。在一些實施例中，胺基酸序列與CS23-SC1-AA (SEQ ID NO: 10)具有至少99%一致性。在一些實施例中，胺基酸序列與CS23-SC1-AA (SEQ ID NO: 10)具有至少99.5%一致性。在一些實施例中，胺基酸序列與CS23-SC1-AA (SEQ ID NO: 10)具有至少99.9%一致性。在一些實施例中，胺基酸序列與CS23-SC1-AA (SEQ ID NO: 10)一致。在一些實施例中，由密碼子經改變聚核苷酸編碼之單鏈因子VIII變異體具有與CS23-SC2-AA (SEQ ID NO: 12；人類因子VIII∆(772-1667) (SPI； HsFVIII∆(753-1648), SPE))具有高序列一致性之胺基酸序列。在一些實施例中，由密碼子經改變聚核苷酸編碼之因子VIII變異體具有與CS23-SC2-AA (SEQ ID NO: 12)具有高序列一致性之胺基酸序列。在一些實施例中，胺基酸序列與CS23-SC2-AA (SEQ ID NO: 12)具有至少97%一致性。在一些實施例中，胺基酸序列與CS23-SC2-AA (SEQ ID NO: 12)具有至少98%一致性。在一些實施例中，胺基酸序列與CS23-SC2-AA (SEQ ID NO: 12)具有至少99%一致性。在一些實施例中，胺基酸序列與CS23-SC2-AA (SEQ ID NO: 12)具有至少99.5%一致性。在一些實施例中，胺基酸序列與CS23-SC2-AA (SEQ ID NO: 12)具有至少99.9%一致性。在一些實施例中，胺基酸序列與CS23-SC2-AA (SEQ ID NO: 12)一致。 D. 因子VIII表現載體在一些實施例中，本文中所描述之密碼子經改變聚核苷酸整合於表現載體中。表現載體之非限制性實例包括病毒載體(例如，適用於基因治療之載體)、質體載體、噬菌體載體、黏質體、噬菌粒、人工染色體及其類似物。病毒載體之非限制性實例包括：反轉錄病毒，例如莫洛尼(Moloney)鼠白血病病毒(MMLV)、哈維(Harvey)鼠肉瘤病毒、鼠乳腺腫瘤病毒及勞斯(Rous)肉瘤病毒；腺病毒、腺相關病毒；SV40型病毒；多瘤病毒；艾巴氏(Epstein-Barr)病毒；乳頭瘤病毒；疱疹病毒；牛痘病毒及脊髓灰質炎病毒。在一些實施例中，本文中所描述之密碼子經改變聚核苷酸整合於基因治療載體中。在一些實施例中，基因治療載體為反轉錄病毒，且特定言之複製缺陷型反轉錄病毒。用於產生複製缺陷型反轉錄病毒之方案在此項技術中已知。針對綜述，參見Kriegler, M., Gene Transfer and Expression, A Laboratory Manual, W.H. Freeman Co., New York (1990)及Murry, E. J., Methods in Molecular Biology, 第7卷, Humana Press, Inc., Cliffton, N.J. (1991)。在一個實施例中，基因治療載體為基於腺相關病毒(AAV)之基因治療載體。AAV系統先前已經描述且一般在此項技術中熟知(Kelleher及Vos, Biotechniques, 17(6):1110-17 (1994)；Cotten等人, Proc Natl Acad Sci USA, 89(13):6094-98 (1992)；Curiel, Nat Immun, 13(2-3):141-64 (1994)；Muzyczka, Curr Top Microbiol Immunol, 158:97-129 (1992)；及Asokan A,等人, Mol. Ther., 20(4):699-708 (2012)，各者出於所有目的以全文引用之方式併入本文中)。關於產生及使用rAAV載體之細節描述於例如美國專利第5,139,941號及第4,797,368號中，各者出於所有目的以全文引用之方式併入本文中。在特定實施例中，AAV載體為AAV-8載體。在一些實施例中，本文中所描述之密碼子經改變聚核苷酸整合於反轉錄病毒表現載體中。此等系統先前已經描述且一般在此項技術中熟知(Mann等人, Cell, 33:153-159, 1983；Nicolas及Rubinstein, 於Vectors: A survey of molecular cloning vectors and their uses, Rodriguez及Denhardt編, Stoneham: Butterworth, 第494-513頁, 1988中；Temin, 於Gene Transfer, Kucherlapati (編), New York: Plenum Press, 第149-188頁, 1986中)。在一具體實施例中，反轉錄病毒載體為豆狀病毒載體(參見例如Naldini等人, Science, 272(5259):263-267, 1996；Zufferey等人, Nat Biotechnol, 15(9):871-875, 1997；Blomer等人, J Virol., 71(9):6641-6649, 1997；美國專利第6,013,516號及第5,994,136號)。廣泛多種載體可用於在細胞培養物中自密碼子經改變多肽表現因子VIII多肽，包括真核及原核表現載體。在某些實施例中，涵蓋質體載體以用於在細胞培養物中表現因子VIII多肽。一般而言，將含有衍生自與宿主細胞相容之物種之複製子及控制序列的質體載體結合此等宿主使用。載體可攜帶複製位點以及能夠在轉型細胞中提供表型選擇之標記序列。質體將包括可操作地連接至一或多個控制序列(例如啟動子)之編碼因子VIII多肽之密碼子經改變聚核苷酸。用於原核表現之載體之非限制性實例包括質體，諸如pRSET、pET、pBAD等，其中用於原核表現載體之啟動子包括lac、trc、trp、recA、araBAD等。用於真核表現之載體之實例包括：(i)針對酵母中之表現，使用諸如AOX1、GAP、GAL1、AUG1等之啟動子之載體，諸如pAO、pPIC、pYES、pMET；(ii)針對昆蟲細胞中之表現，使用諸如PH、p10、MT、Ac5、OpIE2、gp64、polh等之啟動子之載體，諸如pMT、pAc5、pIB、pMIB、pBAC等；及(iii)針對哺乳動物細胞中之表現，使用諸如CMV、SV40、EF-1、UbC、RSV、ADV、BPV及β-肌動蛋白之啟動子之諸如pSVL、pCMV、pRc/RSV、pcDNA3、pBPV等的載體及來源於病毒系統之載體，諸如牛痘病毒、腺相關病毒、疱疹病毒、反轉錄病毒等。 IV. 實例實例1-構築密碼子經改變因子VIII變異體表現序列必須解決兩個障礙以便產生對A型血友病之基因治療有效之因子VIII編碼序列。第一，歸因於習知基因治療遞送載體(例如，AAV病毒粒子)之基因組大小限制，必須大大縮短經編碼因子VIII多肽。第二，必須改變編碼序列以：(i)穩定化遞送載體內之封裝相互作用，(ii)穩定化mRNA中間物，及(iii)改良mRNA之轉錄/轉譯之穩固性。為實現第一目標，申請者自在本文中稱作「FVIII-BDD-SQ」之B域經缺失因子VIII變異體構築體開始。在此構築體中，用稱作「SQ」序列之十四個胺基酸序列替換B域。重組型FVIII-BDD-SQ以商標名REFACTO®出售，且已經展示對控制A型血友病有效。然而，FVIII-BDD-SQ之天然編碼序列，其包括用於因子VIII重鏈及輕鏈之人類野生型核酸序列，不能在基因治療載體中有效地表現。為解決天然FVIII-BDD-SQ之較差表現，將描述於Fath等人(PLoS ONE, 6:e17596 (2011))中之密碼子最佳化演算法，其如Ward等人(Blood, 117:798 (2011))及麥金托什等人(Blood, 121, 3335-3344 (2013))中所描述經修改，應用於FVIII-BDD-SQ序列，以產生第一中間編碼序列CS04a。然而，申請者認識到使用經修改演算法產生之CS04a序列可藉由進一步修飾該序列而改良。因此，申請者重新引入CpG二核苷酸，重新引入用於精胺酸之CGC密碼子，改變白胺酸及絲胺酸密碼子分佈，重新引入高度保守之密碼子對，且移除隱藏TATA框、CCAAT框及剪接位點元件，同時避免CpG島且避免富AT及富GC延伸部之局部比例過高。第一，經修改演算法用非CpG二核苷酸密碼子系統地替換含有CpG二核苷酸之密碼子(例如，精胺酸密碼子)，且消除/避免由相鄰密碼子產生之CpG二核苷酸。通常進行對CpG二核苷酸之此嚴格避免以防止肌肉內注射DNA疫苗後之TLR誘導免疫。然而，如此限制了密碼子最佳化之可能性。舉例而言，經修改演算法排除使用CGX精胺酸密碼子之完整集合。此在用於人類細胞中之表現之基因編碼中尤其具有破壞性，因為在高度表現之人類基因中CGC為最常使用的精胺酸密碼子。另外，避免由相鄰密碼子形成CpG進一步限制了最佳化可能性(例如，限制可共同使用之密碼子對的數目)。由於不預期TLR誘導免疫為與基於AAV之肝定向基因治療相關的問題，因此將包括CpG之密碼子及產生CpG之相鄰密碼子重新引入中間編碼序列CS04a中，優先引入編碼因子VIII輕鏈之序列(例如，在FVIII-BDD-SQ編碼序列之3'端處)中。此允許更頻繁地使用較佳人類密碼子，尤其用於精胺酸之密碼子。然而注意避免形成CpG島，其為具有高頻率CpG位點之編碼序列之區域。此與Krinner等人(Nucleic Acids Res., 42(6):3551-64 (2014))之教示內容相反，Krinner等人提出轉錄起始位點下游之CpG域促進高水準之基因表現。第二，經修改演算法排他性地應用某些密碼子，諸如用於白胺酸之CTG、用於纈胺酸之GTG及用於麩醯胺酸之CAG。然而，例如如Haas等人(Current Biology, 6(3):315-24 (1996))所提議，此冒犯了平衡密碼子使用之原則。為對經修改演算法過度使用較佳密碼子做出解釋，在由應用於密碼子更改(例如，CpG頻率及GC含量)之其他法則允許時重新引入交替白胺酸密碼子。第三，當符合某些準則(例如，存在CG二核苷酸)時，經修改演算法替換密碼子對而不考慮其在自然界中有多麼保守。為對可能已因進化而保守之有益特性做出解釋，在由應用於密碼子更改(例如，CpG頻率及GC含量)之其他法則允許時，分析且調節由演算法替換之最保守密碼子對及最保守之較佳密碼子對，例如如Tats等人(BMC Genomics 9:463(2008))中所描述。第四，亦重新工程改造用於中間編碼序列之絲胺酸密碼子。具體而言，將AGC、TCC及TCT絲胺酸密碼子以更高頻率引入經修飾編碼序列中以更好地整體匹配來用於人類密碼子使用(Haas等人，前述)。第五，篩選且自經修飾編碼序列移除TATA框、CCAAT框元件及內含子/外顯子剪接位點。當修飾編碼序列時，注意避免富AT或富GC延伸部之局部比例過高。最後，除在編碼序列內最佳化密碼子使用以外，當進一步改進中間編碼序列CS04a時考慮基本AAV病毒粒子之結構要求。AAV載體(例如，AAV病毒粒子之核酸部分)作為單股DNA分子封裝於其衣殼中(針對綜述，參見Daya及Berns, Clin. Microbiol Rev., 21(4):583-93 (2008))。因而載體之GC含量有可能影響基因組之封裝且因此在產生期間影響載體產量。如同許多演算法，此處使用之經修改演算法產生GC含量為至少60%之最佳化基因序列(參見Fath等人, PLoS One, 6(3):e17596 (2011) (勘誤表在PLoS One, (6)3 (2011)中)。然而，AAV8衣殼蛋白由具有約56%之更低GC含量之核苷酸序列編碼。因此，為更好地模仿天然AAV8衣殼蛋白編碼序列，將中間編碼序列CS04a之GC含量減少至56%。圖2中所展示之所得CS04編碼序列之總GC含量為56%。該序列之CpG二核苷酸含量為中等的。然而，CpG二核苷酸主要在編碼序列之部分(例如編碼因子VIII輕鏈之部分)的下游中。CS04序列與野生型因子VIII (Genbank寄存號M14113)中之相對應編碼序列具有79.77%核苷酸序列一致性。針對比較目的，製備若干其他密碼子最佳化ReFacto構築體。如針對CS04所進行，藉由應用Fath等人之密碼子最佳化演算法-如由Ward等人修改-來構築CS01。然而，不同於CS04，CS01構築體不含有任何CpG島。如Radcliff P.M.等人, Gene Therapy, 15:289-97 (2008)中所描述，對CS08 ReFacto構築體進行密碼子最佳化，該文獻之內容出於所有目的特此明確地以全文引用之方式併入本文中。CS10密碼子最佳化ReFacto構築體獲自Eurofins Genomics (Ebersberg, Germany)。CS11密碼子最佳化ReFacto構築體獲自Integrated DNA Technologies, Inc. (Coralville, USA)。CH25密碼子最佳化ReFacto構築體獲自ThermoFischer Scientific之GeneArt服務(Regensburg, Germany)。CS40 ReFacto構築體由野生型因子VIII編碼序列組成。用以構築體CS23之演算法係基於JCAT工具(www.jcat.de)，一種用於密碼子最佳化之在線工具(Grote等人, 2005; Nucl. Acids Res. W526-31)。進一步修飾序列以更加反映白蛋白超家族之密碼子使用(Mirsafian等人 2014: Sc. Word Journal 2014, ID 639682)。在每一ReFacto編碼序列之間共用之序列一致性展示於下表 2中。表 2-密碼子經改變因子VIII構築體之百分比一致性矩陣

	CS01	CS04	CS08	CS10	CS11	CS40	CH25	CS23
CS01	100%
CS04	93.0%	100%
CS08	80.7%	82.2.%	100%
CS10	79.1%	79.4%	78.4%	100%
CS11	78.3%	78.3%	78.1%	77.5%	100%
CS40	79.6%	79.8%	76.7%	77.6%	75.4%	100%
CH25	81.3%	85.1%	85.0%	79.9%	79.4%	75.8%	100%
CS23	84.3%	89.2%	85.1%	80.3%	79.9%	76.5%	93.2%	100%

各構築體之質體藉由將不同合成DNA片段選殖於相同載體主鏈質體(pCh-BB01)中來構築。由ThermoFischer Scientific (Regensburg, Germany)進行具有側接AscI及NotI酶限制位點之Refacto型BDD-FVIII片段之DNA合成。載體主鏈含有兩個側接之AAV2衍生反向末端重複(ITR)，其涵蓋來源於肝特異性鼠甲狀腺素運載蛋白基因之啟動子/強化子序列；用於插入各別Refacto型BDD-FVIII之AscI及NotI酶限制位點及合成多聚腺苷酸位點。連接所製備載體主鏈且經由AscI及NotI位點插入後，以毫克規模擴增所得質體。藉由直接定序(Microsynth, Balgach， Switzerland)檢驗構築體之Refacto型BDD-FVIII序列。選殖產生命名為pCS40、pCS01、pCS04、pCS08、pCS10、pCS11、pCh25及pCS23之七種不同的質體構築體(圖19)。構築體具有相同載體主鏈且編碼相同B域經缺失FVIII蛋白(Refacto型BDD-FVIII)，但其FVIII編碼序列不同。如Grieger JC等人(Virus Vectors Using Suspension HEK293 Cells and Continuous Harvest of Vector From the Culture Media for GMP FIX and FLT1 Clinical Vector, Mol Ther., Oct 6. (2015) doi: 10.1038/mt.2015.187. [列印之前以電子文檔出版])中所描述，藉由三種質體轉染方法製備基於AAV8之載體，該文獻之內容出於所有目的特此明確地以全文引用之方式併入本文中。將HEK293懸浮液細胞用於使用相對應FVIII載體質體、輔助質體pXX6-80(攜帶腺病毒輔助基因)及封裝質體pGSK2/8 (貢獻rep2及cap8基因)的質體轉染。為分離AAV8構築體，如Grieger等人(2015，前述)中所描述，使用碘克沙醇梯度處理一公升培養物之細胞集結粒。程序產生稱作vCS01、vCS04、vCS08、vCS10、vCS11及vCH25之載體製備物。藉由qPCR使用靶向AAV2反向末端重複之通用qPCR程序定量載體(Aurnhammer, Human Gene Therapy Methods:部分B 23:18-28 (2012))。攜帶AAV2反向末端重複之對照載體質體用於製備標準曲線。所得vCS04構築體在圖7A-7C中呈現為SEQ ID NO: 8。藉由AAV瓊脂糖凝膠電泳分析載體基因組之完整性。如Fagone等人, Human Gene Therapy Methods 23:1-7 (2012)中所描述，進行電泳。簡言之，在75℃下在0.5% SDS存在下培育AAV載體製備物10分鐘且隨後將其冷卻至室溫。在1% 1×TAE瓊脂糖凝膠上每色帶負載大約1.5E10載體基因組(vg)，且在7 V/cm凝膠長度下電泳60分鐘。隨後將凝膠在2× GelRed (Biotium目錄號41003)溶液中染色且藉由ChemiDocTMMP (Biorad)成像。藉由5kb範圍內之相異條帶所指示，圖20中所展示之結果顯示vCS01、vCS04及vCS40病毒載體具有相同大小之基因組(圖20，色帶2-4)。儘管載體大小為大約5.2 kb，但基因組為均勻條帶，確認略微過大基因組(相對於4.7 kb之AAV野生型基因組)之正確封裝。所有其他vCS載體製備物展示相同的基因組大小(資料未展示)。為了確認衣殼蛋白之預期模式，銀染色後用載體vCS01、vCS04及vCS40進行SDS PAGE(圖21)。如圖中所展示，下游純化程序產生呈現VP1、VP2及VP3之預期蛋白模式之高度純化物質(圖21，色帶2-4)。在所有其他病毒製備物下看到相同模式(未展示)。根據標準程序進行AAV製備物之SDS-PAGE程序。各色帶含有1E10 vg之各別病毒構築體，且在4-12% Bis-Tris (NuPAGE® Novex, Life Technologies)凝膠上按照製造商之說明書分離。用SilverQuestTM套組(Novex, Life Technologies)根據製造商之說明書進行銀染色。出人意料地，相較於vCS40野生型編碼構築體及其他密碼子最佳化構築體，藉由AAV病毒產生中之更高產量來量測，AAV載體vCS01及vCS04具有更高之病毒粒子封裝。如表 3中所展示，vCS01及vCS04載體實質上比vCS40複製地更好，在AAV效價方面提供5-7倍的產量增加。表 3-如自細胞集結粒所純化，用AAV載體構築體vCS01、vCS04及vCD40獲得之產量/公升細胞培養物。

構築體	載體濃度 [vg/ml] ×10E12	產量 [vg/ 公升 ] ×10E12	相較於 wt 之增加倍數
vCS40	2.0	11.0	-
vCS01	9.2	51.4	4.7
vCS04-樣品1	17.6	79.2	7.2
vCS04-樣品2	15.9	58.8	5.4

實例2-密碼子經改變因子VIII變異體表現序列之活體內表現為測試密碼子經改變因子VIII變異體序列之生物效能，向缺乏因子VIII之小鼠投與實例1中所描述之ReFacto型FVIII構築體。簡言之，在C57BL/6 FVIII基因敲除(ko)小鼠(每組具有6-8隻動物)中藉由對每公斤體重之小鼠尾靜脈注射4E12載體基因組(vg)來進行分析。注射後14天藉由眶後穿刺抽出血液，且使用標準程序製備並冷凍血漿。選擇第14天時之表現水準，因為在此時在稍後時間見於此小鼠模型之一些動物中的抑制性抗體之影響最小。如製造商(Technoclone, Vienna, Austria)所提出，使用僅有微小修改之所進行Technochrome FVIII分析確定小鼠血漿中之FVIII活性。針對分析，將血漿樣品適當稀釋且與含有凝血酶、活化因子IX (FIXa)、磷脂、因子X及鈣之分析試劑混合。藉由凝血酶之FVIII活化後，形成具有FIXa、磷脂及鈣之複合物。此複合物將FX活化成活化FX (FXa)，其反過來自顯色受質裂解對硝基苯胺(pNA)。在405 nm下量測pNA形成之動力學。速率與樣品中之FVIII濃度成正比。自參考曲線讀取FVIII濃度且結果以IU FVIII/毫升給出。呈現於下表 4中之結果顯示相較於野生型BDD-因子VIII構築體(CS40)，使用商業演算法設計之密碼子經改變序列(CS10、CS11及CH25)僅使BDD-因子VIII適度增加(3-4倍)。類似地，如Radcliffe等人中所描述製備之密碼子經改變BDD-因子VIII構築體(CS08)僅使BDD-FVIII表現增加3-4倍。此結果與Radcliff等人中所報導之結果一致。出人意料地，在活體內生物效能分析中，CS01、CS04及CS23構築體提供高得多的BDD-FVIII表現(分別為18、74及30倍的增加)。表 4-藉由不同AAV載體構築體誘導之FVIII-基因敲除小鼠之血漿中的FVIII表現。

構築體	密碼子演算法	在第 14 天時之平均 FVIII 表現 [IU/ml]	標準差	小鼠數目	相較於 wt 之增加倍數
vCS40	人類野生型	0.03	0.03	12	-
vCS01	申請者的	0.55	0.28	22	18.3
vCS04	申請者的	2.21	1.20	55	73.7
vCS08	Radcliffe等人	0.11	0.01	6	3.6
vCS10	Eurofins	0.09	0.01	7	3.0
vCS11	IDT	0.08	0.02	8	2.7
vCH25	GeneArt	0.13	0.12	18	4.3
vCS23	申請者的	0.91	0.32	5	30.3

應理解，本文中所描述之實例及實施例僅用於說明之目的，且根據其之各種修改或變化將由熟習此項技術者提出且包括在本申請案之精神及範圍內及所附申請專利範圍之範疇內。本文中所引用之所有公開案、專利及專利申請案出於所有目的以全文引用之方式併入本文中。

圖1展示野生型及ReFacto型人類因子VIII蛋白構築體之示意性說明。圖2A及2B展示根據一些實施例之編碼因子VIII變異體之CS04密碼子經改變核苷酸序列(SEQ ID NO: 1)(針對全長編碼序列，「CS04-FL-NA」)。圖3展示根據一些實施例之由CS04密碼子經改變核苷酸序列編碼之因子VIII變異體胺基酸序列(SEQ ID NO: 2) (針對全長胺基酸序列，「CS04-FL-AA」)。圖4展示根據一些實施例之編碼因子VIII變異體之重鏈的CS04密碼子經改變核苷酸序列之部分(SEQ ID NO: 3) (「CS04-HC-NA」)。圖5展示根據一些實施例之編碼因子VIII變異體之輕鏈的CS04密碼子經改變核苷酸序列之部分(SEQ ID NO: 4) (「CS04-LC-NA」)。圖6展示根據一些實施例之用於B域經取代連接子之例示性編碼序列(SEQ ID NO: 5-7)。BDLO01 (SEQ ID NO: 5)、BDLO04 (SEQ ID NO: 6)及BDLO23 (SEQ ID NO: 7)分別為編碼B域經取代連接子之CS01、CS04及CS23密碼子經改變核苷酸序列的各別部分。圖7A、7B及7C展示根據一些實施例之含有CS04密碼子經改變核苷酸序列之AAV載體序列(SEQ ID NO: 8)(「CS04-AV-NA」)。圖8A及8B展示根據一些實施例之編碼單鏈因子VIII變異體之CS04∆(760-1667) (SPI (信號肽入選)；CS04∆(741-1648), SPE (信號肽排除))密碼子經改變核苷酸序列(SEQ ID NO: 9) (「CS04-SC1-NA」)。圖9展示根據一些實施例之由CS01∆(760-1667) (SPI；CS01∆(741-1648), SPE)、CS04∆(760-1667) (SPI；CS04∆(741-1648), SPE)及CS23∆(760-1667) (SPI；CS23∆(741-1648), SPE)密碼子經改變核苷酸序列編碼的因子VIII變異體胺基酸序列(SEQ ID NO: 10) (分別為「CS01-SC1-AA」、「CS04-SC1-AA」及「CS23-SC1-AA」)。圖10A及10B展示根據一些實施例之編碼單鏈因子VIII變異體之CS04∆(772-1667) (SPI；CS04∆ (753-1648), SPE)密碼子經改變核苷酸序列(SEQ ID NO: 11) (「CS04-SC2-NA」)。圖11展示根據一些實施例之由CS01∆(772-1667) (SPI；CS01∆(753-1648), SPE)、CS04∆(772-1667) (SPI；CS04∆(753-1648), SPE)及CS23∆(772-1667) (SPI；CS23∆(753-1648), SPE)密碼子經改變核苷酸序列編碼之因子VIII變異體胺基酸序列(SEQ ID NO: 12) (分別為「CS01-SC2-AA」、「CS04-SC2-AA」及「CS23-SC2-AA」)。圖12A及12B展示根據一些實施例之編碼因子VIII變異體之CS01密碼子經改變核苷酸序列(SEQ ID NO: 13) (「CS01-FL-NA」)。圖13A及13B展示根據一些實施例之編碼因子VIII變異體之CS08密碼子經改變核苷酸序列(SEQ ID NO: 14) (「CS08-FL-NA」)。圖14A及14B展示根據一些實施例之編碼因子VIII變異體之CS10密碼子經改變核苷酸序列(SEQ ID NO: 15) (「CS10-FL-NA」)。圖15A及15B展示根據一些實施例之編碼因子VIII變異體之CS11密碼子經改變核苷酸序列(SEQ ID NO: 16) (「CS11-FL-NA」)。圖16A及16B展示根據一些實施例之CS40野生型ReFacto編碼序列(SEQ ID NO: 17) (「CS40-FL-NA」)。圖17A及17B展示根據一些實施例之編碼因子VIII變異體之CH25密碼子經改變核苷酸序列(SEQ ID NO: 18) (「CH25-FL-NA」)。圖18展示根據一些實施例之野生型人類因子VIII胺基酸序列(SEQ ID NO: 19) (「FVIII-FL-AA」)。圖19說明藉由將合成Refacto型BDD-FVIII DNA序列經由AscI及NotI限制位點插入載體主鏈pCh-BB01中，選殖pCS40、pCS01、pCS04、pCS08、pCS10、pCS11及pCh25構築體之方案。圖20展示如藉由瓊脂糖凝膠電泳分析，AAV載體基因組製備物之完整性。色帶1，DNA標記；色帶2，vCS40；色帶3，vCS01；色帶4，vCS04。AAV載體均具有相同大小之基因組，遷移於大約5 kb處(右側箭頭)。左側上之刻度指示以千鹼基(kb)為單位之DNA片段之大小。圖21展示藉由PAGE及銀染色對AAV載體製備物之蛋白質分析。色帶1，蛋白質標記(M)；色帶2，vCS40，色帶3，vCS01；及色帶4，vCS04。構築體均具有相同之由VP1、VP2及VP3(右側箭頭)組成之AAV8衣殼。左側上之刻度指示以千道爾頓(kDa)為單位之蛋白質標記之大小。圖22A及22B展示根據一些實施例之編碼因子VIII變異體之CS23密碼子經改變核苷酸序列(SEQ ID NO: 20) (「CS23-FL-NA」)。圖23展示根據一些實施例之由CS23密碼子經改變核苷酸序列編碼之因子VIII變異體胺基酸序列(SEQ ID NO: 21) (「CS23-FL-AA」)。圖24展示根據一些實施例之編碼因子VIII變異體之重鏈的CS23密碼子經改變核苷酸序列之部分(SEQ ID NO: 22) (「CS23-HC-NA」)。圖25展示根據一些實施例之編碼因子VIII變異體之輕鏈的CS23密碼子經改變核苷酸序列之部分(SEQ ID NO: 23) (「CS23-LC-NA」)。圖26展示根據一些實施例之編碼因子VIII變異體之重鏈的CS01密碼子經改變核苷酸序列之部分(SEQ ID NO: 24) (「CS01-HC-NA」)。圖27展示根據一些實施例之編碼因子VIII變異體之輕鏈的CS01密碼子經改變核苷酸序列之部分(SEQ ID NO: 25) (「CS01-LC-NA」)。圖28A及28B展示根據一些實施例之編碼單鏈因子VIII變異體的CS01∆(760-1667) (SPI；CS01∆(741-1648), SPE)密碼子經改變核苷酸序列(SEQ ID NO: 26) (「CS01-SC1-NA」)。圖29A及29B展示根據一些實施例之編碼單鏈因子VIII變異體的CS01∆(772-1667) (SPI；CS01∆(753-1648), SPE)密碼子經改變核苷酸序列(SEQ ID NO: 27) (「CS01-SC2-NA」)。圖30A及30B展示根據一些實施例之編碼單鏈因子VIII變異體的CS23∆(760-1667) (SPI；CS23∆(741-1648), SPE)密碼子經改變核苷酸序列(SEQ ID NO: 28) (「CS23-SC1-NA」)。圖31A及31B展示根據一些實施例之編碼單鏈因子VIII變異體的CS23∆(772-1667) (SPI；CS23∆ (753-1648), SPE)密碼子經改變核苷酸序列(SEQ ID NO: 29) (「CS23-SC2-NA」)。

<![CDATA[<110> 日商武田藥品工業股份有限公司(TAKEDA PHARMACEUTICAL COMPANY LIMITED)]]>
          <![CDATA[<120> 用於Ａ型血友病基因治療之編碼表現增加之重組ＦＶＩＩＩ變異體之病毒載體 ]]>
          <![CDATA[<140> ]]>
          <![CDATA[<141> ]]>
          <![CDATA[<150> US62/255,323]]>
          <![CDATA[<151> 2015-11-13]]>
          <![CDATA[<160> 32    ]]>
          <![CDATA[<170> PatentIn version 3.5]]>
          <![CDATA[<210> 1]]>
          <![CDATA[<211> 4374]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成聚核苷酸]]>
          <![CDATA[<400> 1]]>
          atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc       60
          accaggagat actacctggg ggctgtggag ctttcttggg actacatgca gtctgacctg      120
          ggggagctgc ctgtggatgc caggttccca cccagagtgc ccaaatcctt cccattcaac      180
          acctctgtgg tctacaagaa gaccctcttt gtggagttca ctgaccacct gttcaacatt      240
          gccaaaccca ggccaccctg gatgggactc ctgggaccca ccattcaggc tgaggtgtat      300
          gacactgtgg tcatcaccct caagaacatg gcctcccacc ctgtgagcct gcatgctgtg      360
          ggggtcagct actggaaggc ctctgagggg gctgagtatg atgaccagac ctcccagagg      420
          gagaaggagg atgacaaagt gttccctggg ggcagccaca cctatgtgtg gcaggtcctc      480
          aaggagaatg gccccatggc ctctgaccca ctctgcctga cctactccta cctttctcat      540
          gtggacctgg tcaaggacct caactctgga ctgattgggg ccctgctggt gtgcagggag      600
          ggctccctgg ccaaagagaa gacccagacc ctgcacaagt tcattctcct gtttgctgtc      660
          tttgatgagg gcaagagctg gcactctgaa accaagaact ccctgatgca ggacagggat      720
          gctgcctctg ccagggcctg gcccaagatg cacactgtga atggctatgt gaacaggagc      780
          ctgcctggac tcattggctg ccacaggaaa tctgtctact ggcatgtgat tggcatgggg      840
          acaacccctg aggtgcactc cattttcctg gagggccaca ccttcctggt caggaaccac      900
          agacaggcca gcctggagat cagccccatc accttcctca ctgcccagac cctgctgatg      960
          gacctcggac agttcctgct gttctgccac atcagctccc accagcatga tggcatggag     1020
          gcctatgtca aggtggacag ctgccctgag gagccacagc tcaggatgaa gaacaatgag     1080
          gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt ccgctttgat     1140
          gatgacaaca gcccatcctt cattcagatc aggtctgtgg ccaagaaaca ccccaagacc     1200
          tgggtgcact acattgctgc tgaggaggag gactgggact atgccccact ggtcctggcc     1260
          cctgatgaca ggagctacaa gagccagtac ctcaacaatg gcccacagag gattggacgc     1320
          aagtacaaga aagtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc     1380
          attcagcatg agtctggcat cctgggccca ctcctgtatg gggaggtggg ggacaccctg     1440
          ctcatcatct tcaagaacca ggcctccagg ccctacaaca tctacccaca tggcatcact     1500
          gatgtcaggc ccctgtacag ccgcaggctg ccaaaggggg tgaaacacct caaggacttc     1560
          cccattctgc ctggggagat cttcaagtac aagtggactg tcactgtgga ggatggacca     1620
          accaaatctg accccaggtg cctcaccaga tactactcca gctttgtgaa catggagagg     1680
          gacctggcct ctggcctgat tggcccactg ctcatctgct acaaggagtc tgtggaccag     1740
          aggggaaacc agatcatgtc tgacaagagg aatgtgattc tgttctctgt ctttgatgag     1800
          aacaggagct ggtacctgac tgagaacatt cagcgcttcc tgcccaaccc tgctggggtg     1860
          cagctggagg accctgagtt ccaggccagc aacatcatgc actccatcaa tggctatgtg     1920
          tttgacagcc tccagctttc tgtctgcctg catgaggtgg cctactggta cattctttct     1980
          attggggccc agactgactt cctttctgtc ttcttctctg gctacacctt caaacacaag     2040
          atggtgtatg aggacaccct gaccctcttc ccattctctg gggagactgt gttcatgagc     2100
          atggagaacc ctggcctgtg gattctggga tgccacaact ctgacttccg caacaggggc     2160
          atgactgccc tgctcaaagt ctcctcctgt gacaagaaca ctggggacta ctatgaggac     2220
          agctatgagg acatctctgc ctacctgctc agcaagaaca atgccattga gcccaggagc     2280
          ttcagccaga atccacctgt cctgaaacgc caccagaggg agatcaccag gaccaccctc     2340
          cagtctgacc aggaggagat tgactatgat gacaccattt ctgtggagat gaagaaagag     2400
          gactttgaca tctatgacga ggacgagaac cagagcccaa ggagcttcca gaagaagacc     2460
          aggcactact tcattgctgc tgtggagcgc ctgtgggact atggcatgag ctccagcccc     2520
          catgtcctca ggaacagggc ccagtctggc tctgtgccac agttcaagaa agtggtcttc     2580
          caagagttca ctgatggcag cttcacccag cccctgtaca gaggggagct gaatgagcac     2640
          ctgggactcc tgggcccata catcagggct gaggtggagg acaacatcat ggtgaccttc     2700
          cgcaaccagg cctccaggcc ctacagcttc tacagctccc tcatcagcta tgaggaggac     2760
          cagaggcagg gggctgagcc acgcaagaac tttgtgaaac ccaatgaaac caagacctac     2820
          ttctggaaag tccagcacca catggccccc accaaggatg agtttgactg caaggcctgg     2880
          gcctacttct ctgatgtgga cctggagaag gatgtgcact ctggcctgat tggcccactc     2940
          ctggtctgcc acaccaacac cctgaaccct gcccatggaa ggcaagtgac tgtgcaggag     3000
          tttgccctct tcttcaccat ctttgatgaa accaagagct ggtacttcac tgagaacatg     3060
          gagcgcaact gcagggcccc atgcaacatt cagatggagg accccacctt caaagagaac     3120
          taccgcttcc atgccatcaa tggctacatc atggacaccc tgcctgggct tgtcatggcc     3180
          caggaccaga ggatcaggtg gtacctgctt tctatgggct ccaatgagaa cattcactcc     3240
          atccacttct ctgggcatgt cttcactgtg cgcaagaagg aggagtacaa gatggccctg     3300
          tacaacctct accctggggt ctttgagact gtggagatgc tgccctccaa agctggcatc     3360
          tggagggtgg agtgcctcat tggggagcac ctgcatgctg gcatgagcac cctgttcctg     3420
          gtctacagca acaagtgcca gacccccctg ggaatggcct ctggccacat cagggacttc     3480
          cagatcactg cctctggcca gtatggccag tgggccccca agctggccag gctccactac     3540
          tctggatcca tcaatgcctg gagcaccaag gagccattca gctggatcaa agtggacctg     3600
          ctggccccca tgatcatcca tggcatcaag acccaggggg ccaggcagaa gttctccagc     3660
          ctgtacatca gccagttcat catcatgtac agcctggatg gcaagaaatg gcagacctac     3720
          agaggcaact ccactggaac actcatggtc ttctttggca atgtggacag ctctggcatc     3780
          aagcacaaca tcttcaaccc cccaatcatc gccagataca tcaggctgca ccccacccac     3840
          tacagcatcc gcagcaccct caggatggag ctgatgggct gtgacctgaa ctcctgcagc     3900
          atgcccctgg gcatggagag caaggccatt tctgatgccc agatcactgc ctccagctac     3960
          ttcaccaaca tgtttgccac ctggagccca agcaaggcca ggctgcacct ccagggaagg     4020
          agcaatgcct ggaggcccca ggtcaacaac ccaaaggagt ggctgcaggt ggacttccag     4080
          aagaccatga aggtcactgg ggtgaccacc cagggggtca agagcctgct caccagcatg     4140
          tatgtgaagg agttcctgat cagctccagc caggatggcc accagtggac cctcttcttc     4200
          cagaatggca aggtcaaggt gttccagggc aaccaggaca gcttcacccc tgtggtgaac     4260
          agcctggacc cccccctcct gaccagatac ctgaggattc acccccagag ctgggtccac     4320
          cagattgccc tgaggatgga ggtcctggga tgtgaggccc aggacctgta ctga           4374
          <![CDATA[<210> 2]]>
          <![CDATA[<211> 1457]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成多肽]]>
          <![CDATA[<400> 2]]>
          Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe 
          1               5                   10                  15      
          Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser 
                      20                  25                  30          
          Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg 
                  35                  40                  45              
          Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val 
              50                  55                  60                  
          Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile 
          65                  70                  75                  80  
          Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln 
                          85                  90                  95      
          Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser 
                      100                 105                 110         
          His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser 
                  115                 120                 125             
          Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp 
              130                 135                 140                 
          Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu 
          145                 150                 155                 160 
          Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser 
                          165                 170                 175     
          Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile 
                      180                 185                 190         
          Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr 
                  195                 200                 205             
          Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly 
              210                 215                 220                 
          Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp 
          225                 230                 235                 240 
          Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr 
                          245                 250                 255     
          Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val 
                      260                 265                 270         
          Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile 
                  275                 280                 285             
          Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser 
              290                 295                 300                 
          Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met 
          305                 310                 315                 320 
          Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His 
                          325                 330                 335     
          Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro 
                      340                 345                 350         
          Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp 
                  355                 360                 365             
          Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser 
              370                 375                 380                 
          Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr 
          385                 390                 395                 400 
          Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro 
                          405                 410                 415     
          Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn 
                      420                 425                 430         
          Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met 
                  435                 440                 445             
          Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu 
              450                 455                 460                 
          Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu 
          465                 470                 475                 480 
          Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro 
                          485                 490                 495     
          His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys 
                      500                 505                 510         
          Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe 
                  515                 520                 525             
          Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp 
              530                 535                 540                 
          Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg 
          545                 550                 555                 560 
          Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu 
                          565                 570                 575     
          Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val 
                      580                 585                 590         
          Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu 
                  595                 600                 605             
          Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp 
              610                 615                 620                 
          Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val 
          625                 630                 635                 640 
          Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp 
                          645                 650                 655     
          Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe 
                      660                 665                 670         
          Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr 
                  675                 680                 685             
          Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro 
              690                 695                 700                 
          Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly 
          705                 710                 715                 720 
          Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp 
                          725                 730                 735     
          Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys 
                      740                 745                 750         
          Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu 
                  755                 760                 765             
          Lys Arg His Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln 
              770                 775                 780                 
          Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu 
          785                 790                 795                 800 
          Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe 
                          805                 810                 815     
          Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp 
                      820                 825                 830         
          Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln 
                  835                 840                 845             
          Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr 
              850                 855                 860                 
          Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His 
          865                 870                 875                 880 
          Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile 
                          885                 890                 895     
          Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser 
                      900                 905                 910         
          Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg 
                  915                 920                 925             
          Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val 
              930                 935                 940                 
          Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp 
          945                 950                 955                 960 
          Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu 
                          965                 970                 975     
          Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His 
                      980                 985                 990         
          Gly Arg Gln Val Thr Val Gln Glu  Phe Ala Leu Phe Phe  Thr Ile Phe 
                  995                 1000                 1005             
          Asp Glu  Thr Lys Ser Trp Tyr  Phe Thr Glu Asn Met  Glu Arg Asn 
              1010                 1015                 1020             
          Cys Arg  Ala Pro Cys Asn Ile  Gln Met Glu Asp Pro  Thr Phe Lys 
              1025                 1030                 1035             
          Glu Asn  Tyr Arg Phe His Ala  Ile Asn Gly Tyr Ile  Met Asp Thr 
              1040                 1045                 1050             
          Leu Pro  Gly Leu Val Met Ala  Gln Asp Gln Arg Ile  Arg Trp Tyr 
              1055                 1060                 1065             
          Leu Leu  Ser Met Gly Ser Asn  Glu Asn Ile His Ser  Ile His Phe 
              1070                 1075                 1080             
          Ser Gly  His Val Phe Thr Val  Arg Lys Lys Glu Glu  Tyr Lys Met 
              1085                 1090                 1095             
          Ala Leu  Tyr Asn Leu Tyr Pro  Gly Val Phe Glu Thr  Val Glu Met 
              1100                 1105                 1110             
          Leu Pro  Ser Lys Ala Gly Ile  Trp Arg Val Glu Cys  Leu Ile Gly 
              1115                 1120                 1125             
          Glu His  Leu His Ala Gly Met  Ser Thr Leu Phe Leu  Val Tyr Ser 
              1130                 1135                 1140             
          Asn Lys  Cys Gln Thr Pro Leu  Gly Met Ala Ser Gly  His Ile Arg 
              1145                 1150                 1155             
          Asp Phe  Gln Ile Thr Ala Ser  Gly Gln Tyr Gly Gln  Trp Ala Pro 
              1160                 1165                 1170             
          Lys Leu  Ala Arg Leu His Tyr  Ser Gly Ser Ile Asn  Ala Trp Ser 
              1175                 1180                 1185             
          Thr Lys  Glu Pro Phe Ser Trp  Ile Lys Val Asp Leu  Leu Ala Pro 
              1190                 1195                 1200             
          Met Ile  Ile His Gly Ile Lys  Thr Gln Gly Ala Arg  Gln Lys Phe 
              1205                 1210                 1215             
          Ser Ser  Leu Tyr Ile Ser Gln  Phe Ile Ile Met Tyr  Ser Leu Asp 
              1220                 1225                 1230             
          Gly Lys  Lys Trp Gln Thr Tyr  Arg Gly Asn Ser Thr  Gly Thr Leu 
              1235                 1240                 1245             
          Met Val  Phe Phe Gly Asn Val  Asp Ser Ser Gly Ile  Lys His Asn 
              1250                 1255                 1260             
          Ile Phe  Asn Pro Pro Ile Ile  Ala Arg Tyr Ile Arg  Leu His Pro 
              1265                 1270                 1275             
          Thr His  Tyr Ser Ile Arg Ser  Thr Leu Arg Met Glu  Leu Met Gly 
              1280                 1285                 1290             
          Cys Asp  Leu Asn Ser Cys Ser  Met Pro Leu Gly Met  Glu Ser Lys 
              1295                 1300                 1305             
          Ala Ile  Ser Asp Ala Gln Ile  Thr Ala Ser Ser Tyr  Phe Thr Asn 
              1310                 1315                 1320             
          Met Phe  Ala Thr Trp Ser Pro  Ser Lys Ala Arg Leu  His Leu Gln 
              1325                 1330                 1335             
          Gly Arg  Ser Asn Ala Trp Arg  Pro Gln Val Asn Asn  Pro Lys Glu 
              1340                 1345                 1350             
          Trp Leu  Gln Val Asp Phe Gln  Lys Thr Met Lys Val  Thr Gly Val 
              1355                 1360                 1365             
          Thr Thr  Gln Gly Val Lys Ser  Leu Leu Thr Ser Met  Tyr Val Lys 
              1370                 1375                 1380             
          Glu Phe  Leu Ile Ser Ser Ser  Gln Asp Gly His Gln  Trp Thr Leu 
              1385                 1390                 1395             
          Phe Phe  Gln Asn Gly Lys Val  Lys Val Phe Gln Gly  Asn Gln Asp 
              1400                 1405                 1410             
          Ser Phe  Thr Pro Val Val Asn  Ser Leu Asp Pro Pro  Leu Leu Thr 
              1415                 1420                 1425             
          Arg Tyr  Leu Arg Ile His Pro  Gln Ser Trp Val His  Gln Ile Ala 
              1430                 1435                 1440             
          Leu Arg  Met Glu Val Leu Gly  Cys Glu Ala Gln Asp  Leu Tyr 
              1445                 1450                 1455         
          <![CDATA[<210> 3]]>
          <![CDATA[<211> 2220]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成聚核苷酸]]>
          <![CDATA[<400> 3]]>
          gccaccagga gatactacct gggggctgtg gagctttctt gggactacat gcagtctgac       60
          ctgggggagc tgcctgtgga tgccaggttc ccacccagag tgcccaaatc cttcccattc      120
          aacacctctg tggtctacaa gaagaccctc tttgtggagt tcactgacca cctgttcaac      180
          attgccaaac ccaggccacc ctggatggga ctcctgggac ccaccattca ggctgaggtg      240
          tatgacactg tggtcatcac cctcaagaac atggcctccc accctgtgag cctgcatgct      300
          gtgggggtca gctactggaa ggcctctgag ggggctgagt atgatgacca gacctcccag      360
          agggagaagg aggatgacaa agtgttccct gggggcagcc acacctatgt gtggcaggtc      420
          ctcaaggaga atggccccat ggcctctgac ccactctgcc tgacctactc ctacctttct      480
          catgtggacc tggtcaagga cctcaactct ggactgattg gggccctgct ggtgtgcagg      540
          gagggctccc tggccaaaga gaagacccag accctgcaca agttcattct cctgtttgct      600
          gtctttgatg agggcaagag ctggcactct gaaaccaaga actccctgat gcaggacagg      660
          gatgctgcct ctgccagggc ctggcccaag atgcacactg tgaatggcta tgtgaacagg      720
          agcctgcctg gactcattgg ctgccacagg aaatctgtct actggcatgt gattggcatg      780
          gggacaaccc ctgaggtgca ctccattttc ctggagggcc acaccttcct ggtcaggaac      840
          cacagacagg ccagcctgga gatcagcccc atcaccttcc tcactgccca gaccctgctg      900
          atggacctcg gacagttcct gctgttctgc cacatcagct cccaccagca tgatggcatg      960
          gaggcctatg tcaaggtgga cagctgccct gaggagccac agctcaggat gaagaacaat     1020
          gaggaggctg aggactatga tgatgacctg actgactctg agatggatgt ggtccgcttt     1080
          gatgatgaca acagcccatc cttcattcag atcaggtctg tggccaagaa acaccccaag     1140
          acctgggtgc actacattgc tgctgaggag gaggactggg actatgcccc actggtcctg     1200
          gcccctgatg acaggagcta caagagccag tacctcaaca atggcccaca gaggattgga     1260
          cgcaagtaca agaaagtcag gttcatggcc tacactgatg aaaccttcaa gaccagggag     1320
          gccattcagc atgagtctgg catcctgggc ccactcctgt atggggaggt gggggacacc     1380
          ctgctcatca tcttcaagaa ccaggcctcc aggccctaca acatctaccc acatggcatc     1440
          actgatgtca ggcccctgta cagccgcagg ctgccaaagg gggtgaaaca cctcaaggac     1500
          ttccccattc tgcctgggga gatcttcaag tacaagtgga ctgtcactgt ggaggatgga     1560
          ccaaccaaat ctgaccccag gtgcctcacc agatactact ccagctttgt gaacatggag     1620
          agggacctgg cctctggcct gattggccca ctgctcatct gctacaagga gtctgtggac     1680
          cagaggggaa accagatcat gtctgacaag aggaatgtga ttctgttctc tgtctttgat     1740
          gagaacagga gctggtacct gactgagaac attcagcgct tcctgcccaa ccctgctggg     1800
          gtgcagctgg aggaccctga gttccaggcc agcaacatca tgcactccat caatggctat     1860
          gtgtttgaca gcctccagct ttctgtctgc ctgcatgagg tggcctactg gtacattctt     1920
          tctattgggg cccagactga cttcctttct gtcttcttct ctggctacac cttcaaacac     1980
          aagatggtgt atgaggacac cctgaccctc ttcccattct ctggggagac tgtgttcatg     2040
          agcatggaga accctggcct gtggattctg ggatgccaca actctgactt ccgcaacagg     2100
          ggcatgactg ccctgctcaa agtctcctcc tgtgacaaga acactgggga ctactatgag     2160
          gacagctatg aggacatctc tgcctacctg ctcagcaaga acaatgccat tgagcccagg     2220
          <![CDATA[<210> 4]]>
          <![CDATA[<211> 2052]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成聚核苷酸]]>
          <![CDATA[<400> 4]]>
          gagatcacca ggaccaccct ccagtctgac caggaggaga ttgactatga tgacaccatt       60
          tctgtggaga tgaagaaaga ggactttgac atctatgacg aggacgagaa ccagagccca      120
          aggagcttcc agaagaagac caggcactac ttcattgctg ctgtggagcg cctgtgggac      180
          tatggcatga gctccagccc ccatgtcctc aggaacaggg cccagtctgg ctctgtgcca      240
          cagttcaaga aagtggtctt ccaagagttc actgatggca gcttcaccca gcccctgtac      300
          agaggggagc tgaatgagca cctgggactc ctgggcccat acatcagggc tgaggtggag      360
          gacaacatca tggtgacctt ccgcaaccag gcctccaggc cctacagctt ctacagctcc      420
          ctcatcagct atgaggagga ccagaggcag ggggctgagc cacgcaagaa ctttgtgaaa      480
          cccaatgaaa ccaagaccta cttctggaaa gtccagcacc acatggcccc caccaaggat      540
          gagtttgact gcaaggcctg ggcctacttc tctgatgtgg acctggagaa ggatgtgcac      600
          tctggcctga ttggcccact cctggtctgc cacaccaaca ccctgaaccc tgcccatgga      660
          aggcaagtga ctgtgcagga gtttgccctc ttcttcacca tctttgatga aaccaagagc      720
          tggtacttca ctgagaacat ggagcgcaac tgcagggccc catgcaacat tcagatggag      780
          gaccccacct tcaaagagaa ctaccgcttc catgccatca atggctacat catggacacc      840
          ctgcctgggc ttgtcatggc ccaggaccag aggatcaggt ggtacctgct ttctatgggc      900
          tccaatgaga acattcactc catccacttc tctgggcatg tcttcactgt gcgcaagaag      960
          gaggagtaca agatggccct gtacaacctc taccctgggg tctttgagac tgtggagatg     1020
          ctgccctcca aagctggcat ctggagggtg gagtgcctca ttggggagca cctgcatgct     1080
          ggcatgagca ccctgttcct ggtctacagc aacaagtgcc agacccccct gggaatggcc     1140
          tctggccaca tcagggactt ccagatcact gcctctggcc agtatggcca gtgggccccc     1200
          aagctggcca ggctccacta ctctggatcc atcaatgcct ggagcaccaa ggagccattc     1260
          agctggatca aagtggacct gctggccccc atgatcatcc atggcatcaa gacccagggg     1320
          gccaggcaga agttctccag cctgtacatc agccagttca tcatcatgta cagcctggat     1380
          ggcaagaaat ggcagaccta cagaggcaac tccactggaa cactcatggt cttctttggc     1440
          aatgtggaca gctctggcat caagcacaac atcttcaacc ccccaatcat cgccagatac     1500
          atcaggctgc accccaccca ctacagcatc cgcagcaccc tcaggatgga gctgatgggc     1560
          tgtgacctga actcctgcag catgcccctg ggcatggaga gcaaggccat ttctgatgcc     1620
          cagatcactg cctccagcta cttcaccaac atgtttgcca cctggagccc aagcaaggcc     1680
          aggctgcacc tccagggaag gagcaatgcc tggaggcccc aggtcaacaa cccaaaggag     1740
          tggctgcagg tggacttcca gaagaccatg aaggtcactg gggtgaccac ccagggggtc     1800
          aagagcctgc tcaccagcat gtatgtgaag gagttcctga tcagctccag ccaggatggc     1860
          caccagtgga ccctcttctt ccagaatggc aaggtcaagg tgttccaggg caaccaggac     1920
          agcttcaccc ctgtggtgaa cagcctggac ccccccctcc tgaccagata cctgaggatt     1980
          cacccccaga gctgggtcca ccagattgcc ctgaggatgg aggtcctggg atgtgaggcc     2040
          caggacctgt ac                                                         2052
          <![CDATA[<210> 5]]>
          <![CDATA[<211> 42]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成寡核苷酸]]>
          <![CDATA[<400> 5]]>
          agcttctctc agaatccacc tgtcctgaag agacaccaga ga                          42
          <![CDATA[<210> 6]]>
          <![CDATA[<211> 42]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成寡核苷酸]]>
          <![CDATA[<400> 6]]>
          agcttcagcc agaatccacc tgtcctgaaa cgccaccaga gg                          42
          <![CDATA[<210> 7]]>
          <![CDATA[<211> 42]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成寡核苷酸]]>
          <![CDATA[<400> 7]]>
          agcttcagcc agaacccccc cgtgctgaag aggcaccaga gg                          42
          <![CDATA[<210> 8]]>
          <![CDATA[<211> 7827]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成聚核苷酸]]>
          <![CDATA[<400> 8]]>
          tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca       60
          cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg      120
          ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc      180
          accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc      240
          attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat      300
          tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt      360
          tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cctcgagatt taaatgacgt      420
          tggccactcc ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc      480
          gacgcccggg ctttgcccgg gcggcctcag tgagcgagcg agcgcgcaga gagggagtgg      540
          ccaactccat cactaggggt tcctgagttt aaacttcgtc gacgattcga gcttgggctg      600
          caggtcgagg gcactgggag gatgttgagt aagatggaaa actactgatg acccttgcag      660
          agacagagta ttaggacatg tttgaacagg ggccgggcga tcagcaggta gctctagagg      720
          atccccgtct gtctgcacat ttcgtagagc gagtgttccg atactctaat ctccctaggc      780
          aaggttcata tttgtgtagg ttacttattc tccttttgtt gactaagtca ataatcagaa      840
          tcagcaggtt tggagtcagc ttggcaggga tcagcagcct gggttggaag gagggggtat      900
          aaaagcccct tcaccaggag aagccgtcac acagactagg cgcgccaccg ccaccatgca      960
          gattgagctg agcacctgct tcttcctgtg cctgctgagg ttctgcttct ctgccaccag     1020
          gagatactac ctgggggctg tggagctttc ttgggactac atgcagtctg acctggggga     1080
          gctgcctgtg gatgccaggt tcccacccag agtgcccaaa tccttcccat tcaacacctc     1140
          tgtggtctac aagaagaccc tctttgtgga gttcactgac cacctgttca acattgccaa     1200
          acccaggcca ccctggatgg gactcctggg acccaccatt caggctgagg tgtatgacac     1260
          tgtggtcatc accctcaaga acatggcctc ccaccctgtg agcctgcatg ctgtgggggt     1320
          cagctactgg aaggcctctg agggggctga gtatgatgac cagacctccc agagggagaa     1380
          ggaggatgac aaagtgttcc ctgggggcag ccacacctat gtgtggcagg tcctcaagga     1440
          gaatggcccc atggcctctg acccactctg cctgacctac tcctaccttt ctcatgtgga     1500
          cctggtcaag gacctcaact ctggactgat tggggccctg ctggtgtgca gggagggctc     1560
          cctggccaaa gagaagaccc agaccctgca caagttcatt ctcctgtttg ctgtctttga     1620
          tgagggcaag agctggcact ctgaaaccaa gaactccctg atgcaggaca gggatgctgc     1680
          ctctgccagg gcctggccca agatgcacac tgtgaatggc tatgtgaaca ggagcctgcc     1740
          tggactcatt ggctgccaca ggaaatctgt ctactggcat gtgattggca tggggacaac     1800
          ccctgaggtg cactccattt tcctggaggg ccacaccttc ctggtcagga accacagaca     1860
          ggccagcctg gagatcagcc ccatcacctt cctcactgcc cagaccctgc tgatggacct     1920
          cggacagttc ctgctgttct gccacatcag ctcccaccag catgatggca tggaggccta     1980
          tgtcaaggtg gacagctgcc ctgaggagcc acagctcagg atgaagaaca atgaggaggc     2040
          tgaggactat gatgatgacc tgactgactc tgagatggat gtggtccgct ttgatgatga     2100
          caacagccca tccttcattc agatcaggtc tgtggccaag aaacacccca agacctgggt     2160
          gcactacatt gctgctgagg aggaggactg ggactatgcc ccactggtcc tggcccctga     2220
          tgacaggagc tacaagagcc agtacctcaa caatggccca cagaggattg gacgcaagta     2280
          caagaaagtc aggttcatgg cctacactga tgaaaccttc aagaccaggg aggccattca     2340
          gcatgagtct ggcatcctgg gcccactcct gtatggggag gtgggggaca ccctgctcat     2400
          catcttcaag aaccaggcct ccaggcccta caacatctac ccacatggca tcactgatgt     2460
          caggcccctg tacagccgca ggctgccaaa gggggtgaaa cacctcaagg acttccccat     2520
          tctgcctggg gagatcttca agtacaagtg gactgtcact gtggaggatg gaccaaccaa     2580
          atctgacccc aggtgcctca ccagatacta ctccagcttt gtgaacatgg agagggacct     2640
          ggcctctggc ctgattggcc cactgctcat ctgctacaag gagtctgtgg accagagggg     2700
          aaaccagatc atgtctgaca agaggaatgt gattctgttc tctgtctttg atgagaacag     2760
          gagctggtac ctgactgaga acattcagcg cttcctgccc aaccctgctg gggtgcagct     2820
          ggaggaccct gagttccagg ccagcaacat catgcactcc atcaatggct atgtgtttga     2880
          cagcctccag ctttctgtct gcctgcatga ggtggcctac tggtacattc tttctattgg     2940
          ggcccagact gacttccttt ctgtcttctt ctctggctac accttcaaac acaagatggt     3000
          gtatgaggac accctgaccc tcttcccatt ctctggggag actgtgttca tgagcatgga     3060
          gaaccctggc ctgtggattc tgggatgcca caactctgac ttccgcaaca ggggcatgac     3120
          tgccctgctc aaagtctcct cctgtgacaa gaacactggg gactactatg aggacagcta     3180
          tgaggacatc tctgcctacc tgctcagcaa gaacaatgcc attgagccca ggagcttcag     3240
          ccagaatcca cctgtcctga aacgccacca gagggagatc accaggacca ccctccagtc     3300
          tgaccaggag gagattgact atgatgacac catttctgtg gagatgaaga aagaggactt     3360
          tgacatctat gacgaggacg agaaccagag cccaaggagc ttccagaaga agaccaggca     3420
          ctacttcatt gctgctgtgg agcgcctgtg ggactatggc atgagctcca gcccccatgt     3480
          cctcaggaac agggcccagt ctggctctgt gccacagttc aagaaagtgg tcttccaaga     3540
          gttcactgat ggcagcttca cccagcccct gtacagaggg gagctgaatg agcacctggg     3600
          actcctgggc ccatacatca gggctgaggt ggaggacaac atcatggtga ccttccgcaa     3660
          ccaggcctcc aggccctaca gcttctacag ctccctcatc agctatgagg aggaccagag     3720
          gcagggggct gagccacgca agaactttgt gaaacccaat gaaaccaaga cctacttctg     3780
          gaaagtccag caccacatgg cccccaccaa ggatgagttt gactgcaagg cctgggccta     3840
          cttctctgat gtggacctgg agaaggatgt gcactctggc ctgattggcc cactcctggt     3900
          ctgccacacc aacaccctga accctgccca tggaaggcaa gtgactgtgc aggagtttgc     3960
          cctcttcttc accatctttg atgaaaccaa gagctggtac ttcactgaga acatggagcg     4020
          caactgcagg gccccatgca acattcagat ggaggacccc accttcaaag agaactaccg     4080
          cttccatgcc atcaatggct acatcatgga caccctgcct gggcttgtca tggcccagga     4140
          ccagaggatc aggtggtacc tgctttctat gggctccaat gagaacattc actccatcca     4200
          cttctctggg catgtcttca ctgtgcgcaa gaaggaggag tacaagatgg ccctgtacaa     4260
          cctctaccct ggggtctttg agactgtgga gatgctgccc tccaaagctg gcatctggag     4320
          ggtggagtgc ctcattgggg agcacctgca tgctggcatg agcaccctgt tcctggtcta     4380
          cagcaacaag tgccagaccc ccctgggaat ggcctctggc cacatcaggg acttccagat     4440
          cactgcctct ggccagtatg gccagtgggc ccccaagctg gccaggctcc actactctgg     4500
          atccatcaat gcctggagca ccaaggagcc attcagctgg atcaaagtgg acctgctggc     4560
          ccccatgatc atccatggca tcaagaccca gggggccagg cagaagttct ccagcctgta     4620
          catcagccag ttcatcatca tgtacagcct ggatggcaag aaatggcaga cctacagagg     4680
          caactccact ggaacactca tggtcttctt tggcaatgtg gacagctctg gcatcaagca     4740
          caacatcttc aaccccccaa tcatcgccag atacatcagg ctgcacccca cccactacag     4800
          catccgcagc accctcagga tggagctgat gggctgtgac ctgaactcct gcagcatgcc     4860
          cctgggcatg gagagcaagg ccatttctga tgcccagatc actgcctcca gctacttcac     4920
          caacatgttt gccacctgga gcccaagcaa ggccaggctg cacctccagg gaaggagcaa     4980
          tgcctggagg ccccaggtca acaacccaaa ggagtggctg caggtggact tccagaagac     5040
          catgaaggtc actggggtga ccacccaggg ggtcaagagc ctgctcacca gcatgtatgt     5100
          gaaggagttc ctgatcagct ccagccagga tggccaccag tggaccctct tcttccagaa     5160
          tggcaaggtc aaggtgttcc agggcaacca ggacagcttc acccctgtgg tgaacagcct     5220
          ggaccccccc ctcctgacca gatacctgag gattcacccc cagagctggg tccaccagat     5280
          tgccctgagg atggaggtcc tgggatgtga ggcccaggac ctgtactgat gacgagcggc     5340
          cgctcttagt agcagtatcg ataataaaag atctttattt tcattagatc tgtgtgttgg     5400
          ttttttgtgt gttaattaag ctcgcgaagg aacccctagt gatggagttg gccactccct     5460
          ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggct     5520
          ttgcccgggc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aagacgattt     5580
          aaatgacaag cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc     5640
          tcacaattcc acacaacata cgagccggaa gcataaagtg taaagcctgg ggtgcctaat     5700
          gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc     5760
          tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg     5820
          ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag     5880
          cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag     5940
          gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc     6000
          tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc     6060
          agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc     6120
          tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt     6180
          cgggaagcgt ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg     6240
          ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat     6300
          ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag     6360
          ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt     6420
          ggtggcctaa ctacggctac actagaagaa cagtatttgg tatctgcgct ctgctgaagc     6480
          cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta     6540
          gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag     6600
          atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga     6660
          ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa     6720
          gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa     6780
          tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc     6840
          ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga     6900
          taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa     6960
          gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt     7020
          gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg     7080
          ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc     7140
          aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg     7200
          gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag     7260
          cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt     7320
          actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt     7380
          caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac     7440
          gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac     7500
          ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag     7560
          caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa     7620
          tactcatact cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga     7680
          gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc     7740
          cccgaaaagt gccacctgac gtctaagaaa ccattattat catgacatta acctataaaa     7800
          ataggcgtat cacgaggccc tttcgtc                                         7827
          <![CDATA[<210> 9]]>
          <![CDATA[<211> 4332]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成聚核苷酸]]>
          <![CDATA[<400> 9]]>
          atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc       60
          accaggagat actacctggg ggctgtggag ctttcttggg actacatgca gtctgacctg      120
          ggggagctgc ctgtggatgc caggttccca cccagagtgc ccaaatcctt cccattcaac      180
          acctctgtgg tctacaagaa gaccctcttt gtggagttca ctgaccacct gttcaacatt      240
          gccaaaccca ggccaccctg gatgggactc ctgggaccca ccattcaggc tgaggtgtat      300
          gacactgtgg tcatcaccct caagaacatg gcctcccacc ctgtgagcct gcatgctgtg      360
          ggggtcagct actggaaggc ctctgagggg gctgagtatg atgaccagac ctcccagagg      420
          gagaaggagg atgacaaagt gttccctggg ggcagccaca cctatgtgtg gcaggtcctc      480
          aaggagaatg gccccatggc ctctgaccca ctctgcctga cctactccta cctttctcat      540
          gtggacctgg tcaaggacct caactctgga ctgattgggg ccctgctggt gtgcagggag      600
          ggctccctgg ccaaagagaa gacccagacc ctgcacaagt tcattctcct gtttgctgtc      660
          tttgatgagg gcaagagctg gcactctgaa accaagaact ccctgatgca ggacagggat      720
          gctgcctctg ccagggcctg gcccaagatg cacactgtga atggctatgt gaacaggagc      780
          ctgcctggac tcattggctg ccacaggaaa tctgtctact ggcatgtgat tggcatgggg      840
          acaacccctg aggtgcactc cattttcctg gagggccaca ccttcctggt caggaaccac      900
          agacaggcca gcctggagat cagccccatc accttcctca ctgcccagac cctgctgatg      960
          gacctcggac agttcctgct gttctgccac atcagctccc accagcatga tggcatggag     1020
          gcctatgtca aggtggacag ctgccctgag gagccacagc tcaggatgaa gaacaatgag     1080
          gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt ccgctttgat     1140
          gatgacaaca gcccatcctt cattcagatc aggtctgtgg ccaagaaaca ccccaagacc     1200
          tgggtgcact acattgctgc tgaggaggag gactgggact atgccccact ggtcctggcc     1260
          cctgatgaca ggagctacaa gagccagtac ctcaacaatg gcccacagag gattggacgc     1320
          aagtacaaga aagtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc     1380
          attcagcatg agtctggcat cctgggccca ctcctgtatg gggaggtggg ggacaccctg     1440
          ctcatcatct tcaagaacca ggcctccagg ccctacaaca tctacccaca tggcatcact     1500
          gatgtcaggc ccctgtacag ccgcaggctg ccaaaggggg tgaaacacct caaggacttc     1560
          cccattctgc ctggggagat cttcaagtac aagtggactg tcactgtgga ggatggacca     1620
          accaaatctg accccaggtg cctcaccaga tactactcca gctttgtgaa catggagagg     1680
          gacctggcct ctggcctgat tggcccactg ctcatctgct acaaggagtc tgtggaccag     1740
          aggggaaacc agatcatgtc tgacaagagg aatgtgattc tgttctctgt ctttgatgag     1800
          aacaggagct ggtacctgac tgagaacatt cagcgcttcc tgcccaaccc tgctggggtg     1860
          cagctggagg accctgagtt ccaggccagc aacatcatgc actccatcaa tggctatgtg     1920
          tttgacagcc tccagctttc tgtctgcctg catgaggtgg cctactggta cattctttct     1980
          attggggccc agactgactt cctttctgtc ttcttctctg gctacacctt caaacacaag     2040
          atggtgtatg aggacaccct gaccctcttc ccattctctg gggagactgt gttcatgagc     2100
          atggagaacc ctggcctgtg gattctggga tgccacaact ctgacttccg caacaggggc     2160
          atgactgccc tgctcaaagt ctcctcctgt gacaagaaca ctggggacta ctatgaggac     2220
          agctatgagg acatctctgc ctacctgctc agcaagaaca atgccattga gcccagggag     2280
          atcaccagga ccaccctcca gtctgaccag gaggagattg actatgatga caccatttct     2340
          gtggagatga agaaagagga ctttgacatc tatgacgagg acgagaacca gagcccaagg     2400
          agcttccaga agaagaccag gcactacttc attgctgctg tggagcgcct gtgggactat     2460
          ggcatgagct ccagccccca tgtcctcagg aacagggccc agtctggctc tgtgccacag     2520
          ttcaagaaag tggtcttcca agagttcact gatggcagct tcacccagcc cctgtacaga     2580
          ggggagctga atgagcacct gggactcctg ggcccataca tcagggctga ggtggaggac     2640
          aacatcatgg tgaccttccg caaccaggcc tccaggccct acagcttcta cagctccctc     2700
          atcagctatg aggaggacca gaggcagggg gctgagccac gcaagaactt tgtgaaaccc     2760
          aatgaaacca agacctactt ctggaaagtc cagcaccaca tggcccccac caaggatgag     2820
          tttgactgca aggcctgggc ctacttctct gatgtggacc tggagaagga tgtgcactct     2880
          ggcctgattg gcccactcct ggtctgccac accaacaccc tgaaccctgc ccatggaagg     2940
          caagtgactg tgcaggagtt tgccctcttc ttcaccatct ttgatgaaac caagagctgg     3000
          tacttcactg agaacatgga gcgcaactgc agggccccat gcaacattca gatggaggac     3060
          cccaccttca aagagaacta ccgcttccat gccatcaatg gctacatcat ggacaccctg     3120
          cctgggcttg tcatggccca ggaccagagg atcaggtggt acctgctttc tatgggctcc     3180
          aatgagaaca ttcactccat ccacttctct gggcatgtct tcactgtgcg caagaaggag     3240
          gagtacaaga tggccctgta caacctctac cctggggtct ttgagactgt ggagatgctg     3300
          ccctccaaag ctggcatctg gagggtggag tgcctcattg gggagcacct gcatgctggc     3360
          atgagcaccc tgttcctggt ctacagcaac aagtgccaga cccccctggg aatggcctct     3420
          ggccacatca gggacttcca gatcactgcc tctggccagt atggccagtg ggcccccaag     3480
          ctggccaggc tccactactc tggatccatc aatgcctgga gcaccaagga gccattcagc     3540
          tggatcaaag tggacctgct ggcccccatg atcatccatg gcatcaagac ccagggggcc     3600
          aggcagaagt tctccagcct gtacatcagc cagttcatca tcatgtacag cctggatggc     3660
          aagaaatggc agacctacag aggcaactcc actggaacac tcatggtctt ctttggcaat     3720
          gtggacagct ctggcatcaa gcacaacatc ttcaaccccc caatcatcgc cagatacatc     3780
          aggctgcacc ccacccacta cagcatccgc agcaccctca ggatggagct gatgggctgt     3840
          gacctgaact cctgcagcat gcccctgggc atggagagca aggccatttc tgatgcccag     3900
          atcactgcct ccagctactt caccaacatg tttgccacct ggagcccaag caaggccagg     3960
          ctgcacctcc agggaaggag caatgcctgg aggccccagg tcaacaaccc aaaggagtgg     4020
          ctgcaggtgg acttccagaa gaccatgaag gtcactgggg tgaccaccca gggggtcaag     4080
          agcctgctca ccagcatgta tgtgaaggag ttcctgatca gctccagcca ggatggccac     4140
          cagtggaccc tcttcttcca gaatggcaag gtcaaggtgt tccagggcaa ccaggacagc     4200
          ttcacccctg tggtgaacag cctggacccc cccctcctga ccagatacct gaggattcac     4260
          ccccagagct gggtccacca gattgccctg aggatggagg tcctgggatg tgaggcccag     4320
          gacctgtact ga                                                         4332
          <![CDATA[<210> 10]]>
          <![CDATA[<211> 1443]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成多肽]]>
          <![CDATA[<400> 10]]>
          Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe 
          1               5                   10                  15      
          Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser 
                      20                  25                  30          
          Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg 
                  35                  40                  45              
          Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val 
              50                  55                  60                  
          Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile 
          65                  70                  75                  80  
          Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln 
                          85                  90                  95      
          Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser 
                      100                 105                 110         
          His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser 
                  115                 120                 125             
          Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp 
              130                 135                 140                 
          Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu 
          145                 150                 155                 160 
          Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser 
                          165                 170                 175     
          Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile 
                      180                 185                 190         
          Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr 
                  195                 200                 205             
          Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly 
              210                 215                 220                 
          Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp 
          225                 230                 235                 240 
          Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr 
                          245                 250                 255     
          Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val 
                      260                 265                 270         
          Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile 
                  275                 280                 285             
          Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser 
              290                 295                 300                 
          Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met 
          305                 310                 315                 320 
          Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His 
                          325                 330                 335     
          Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro 
                      340                 345                 350         
          Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp 
                  355                 360                 365             
          Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser 
              370                 375                 380                 
          Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr 
          385                 390                 395                 400 
          Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro 
                          405                 410                 415     
          Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn 
                      420                 425                 430         
          Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met 
                  435                 440                 445             
          Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu 
              450                 455                 460                 
          Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu 
          465                 470                 475                 480 
          Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro 
                          485                 490                 495     
          His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys 
                      500                 505                 510         
          Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe 
                  515                 520                 525             
          Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp 
              530                 535                 540                 
          Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg 
          545                 550                 555                 560 
          Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu 
                          565                 570                 575     
          Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val 
                      580                 585                 590         
          Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu 
                  595                 600                 605             
          Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp 
              610                 615                 620                 
          Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val 
          625                 630                 635                 640 
          Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp 
                          645                 650                 655     
          Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe 
                      660                 665                 670         
          Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr 
                  675                 680                 685             
          Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro 
              690                 695                 700                 
          Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly 
          705                 710                 715                 720 
          Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp 
                          725                 730                 735     
          Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys 
                      740                 745                 750         
          Asn Asn Ala Ile Glu Pro Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser 
                  755                 760                 765             
          Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys 
              770                 775                 780                 
          Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg 
          785                 790                 795                 800 
          Ser Phe Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg 
                          805                 810                 815     
          Leu Trp Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg 
                      820                 825                 830         
          Ala Gln Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu 
                  835                 840                 845             
          Phe Thr Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn 
              850                 855                 860                 
          Glu His Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp 
          865                 870                 875                 880 
          Asn Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe 
                          885                 890                 895     
          Tyr Ser Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu 
                      900                 905                 910         
          Pro Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp 
                  915                 920                 925             
          Lys Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys 
              930                 935                 940                 
          Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser 
          945                 950                 955                 960 
          Gly Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro 
                          965                 970                 975     
          Ala His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr 
                      980                 985                 990         
          Ile Phe Asp Glu Thr Lys Ser Trp  Tyr Phe Thr Glu Asn  Met Glu Arg 
                  995                 1000                 1005             
          Asn Cys  Arg Ala Pro Cys Asn  Ile Gln Met Glu Asp  Pro Thr Phe 
              1010                 1015                 1020             
          Lys Glu  Asn Tyr Arg Phe His  Ala Ile Asn Gly Tyr  Ile Met Asp 
              1025                 1030                 1035             
          Thr Leu  Pro Gly Leu Val Met  Ala Gln Asp Gln Arg  Ile Arg Trp 
              1040                 1045                 1050             
          Tyr Leu  Leu Ser Met Gly Ser  Asn Glu Asn Ile His  Ser Ile His 
              1055                 1060                 1065             
          Phe Ser  Gly His Val Phe Thr  Val Arg Lys Lys Glu  Glu Tyr Lys 
              1070                 1075                 1080             
          Met Ala  Leu Tyr Asn Leu Tyr  Pro Gly Val Phe Glu  Thr Val Glu 
              1085                 1090                 1095             
          Met Leu  Pro Ser Lys Ala Gly  Ile Trp Arg Val Glu  Cys Leu Ile 
              1100                 1105                 1110             
          Gly Glu  His Leu His Ala Gly  Met Ser Thr Leu Phe  Leu Val Tyr 
              1115                 1120                 1125             
          Ser Asn  Lys Cys Gln Thr Pro  Leu Gly Met Ala Ser  Gly His Ile 
              1130                 1135                 1140             
          Arg Asp  Phe Gln Ile Thr Ala  Ser Gly Gln Tyr Gly  Gln Trp Ala 
              1145                 1150                 1155             
          Pro Lys  Leu Ala Arg Leu His  Tyr Ser Gly Ser Ile  Asn Ala Trp 
              1160                 1165                 1170             
          Ser Thr  Lys Glu Pro Phe Ser  Trp Ile Lys Val Asp  Leu Leu Ala 
              1175                 1180                 1185             
          Pro Met  Ile Ile His Gly Ile  Lys Thr Gln Gly Ala  Arg Gln Lys 
              1190                 1195                 1200             
          Phe Ser  Ser Leu Tyr Ile Ser  Gln Phe Ile Ile Met  Tyr Ser Leu 
              1205                 1210                 1215             
          Asp Gly  Lys Lys Trp Gln Thr  Tyr Arg Gly Asn Ser  Thr Gly Thr 
              1220                 1225                 1230             
          Leu Met  Val Phe Phe Gly Asn  Val Asp Ser Ser Gly  Ile Lys His 
              1235                 1240                 1245             
          Asn Ile  Phe Asn Pro Pro Ile  Ile Ala Arg Tyr Ile  Arg Leu His 
              1250                 1255                 1260             
          Pro Thr  His Tyr Ser Ile Arg  Ser Thr Leu Arg Met  Glu Leu Met 
              1265                 1270                 1275             
          Gly Cys  Asp Leu Asn Ser Cys  Ser Met Pro Leu Gly  Met Glu Ser 
              1280                 1285                 1290             
          Lys Ala  Ile Ser Asp Ala Gln  Ile Thr Ala Ser Ser  Tyr Phe Thr 
              1295                 1300                 1305             
          Asn Met  Phe Ala Thr Trp Ser  Pro Ser Lys Ala Arg  Leu His Leu 
              1310                 1315                 1320             
          Gln Gly  Arg Ser Asn Ala Trp  Arg Pro Gln Val Asn  Asn Pro Lys 
              1325                 1330                 1335             
          Glu Trp  Leu Gln Val Asp Phe  Gln Lys Thr Met Lys  Val Thr Gly 
              1340                 1345                 1350             
          Val Thr  Thr Gln Gly Val Lys  Ser Leu Leu Thr Ser  Met Tyr Val 
              1355                 1360                 1365             
          Lys Glu  Phe Leu Ile Ser Ser  Ser Gln Asp Gly His  Gln Trp Thr 
              1370                 1375                 1380             
          Leu Phe  Phe Gln Asn Gly Lys  Val Lys Val Phe Gln  Gly Asn Gln 
              1385                 1390                 1395             
          Asp Ser  Phe Thr Pro Val Val  Asn Ser Leu Asp Pro  Pro Leu Leu 
              1400                 1405                 1410             
          Thr Arg  Tyr Leu Arg Ile His  Pro Gln Ser Trp Val  His Gln Ile 
              1415                 1420                 1425             
          Ala Leu  Arg Met Glu Val Leu  Gly Cys Glu Ala Gln  Asp Leu Tyr 
              1430                 1435                 1440             
          <![CDATA[<210> 11]]>
          <![CDATA[<211> 4368]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成聚核苷酸]]>
          <![CDATA[<400> 11]]>
          atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc       60
          accaggagat actacctggg ggctgtggag ctttcttggg actacatgca gtctgacctg      120
          ggggagctgc ctgtggatgc caggttccca cccagagtgc ccaaatcctt cccattcaac      180
          acctctgtgg tctacaagaa gaccctcttt gtggagttca ctgaccacct gttcaacatt      240
          gccaaaccca ggccaccctg gatgggactc ctgggaccca ccattcaggc tgaggtgtat      300
          gacactgtgg tcatcaccct caagaacatg gcctcccacc ctgtgagcct gcatgctgtg      360
          ggggtcagct actggaaggc ctctgagggg gctgagtatg atgaccagac ctcccagagg      420
          gagaaggagg atgacaaagt gttccctggg ggcagccaca cctatgtgtg gcaggtcctc      480
          aaggagaatg gccccatggc ctctgaccca ctctgcctga cctactccta cctttctcat      540
          gtggacctgg tcaaggacct caactctgga ctgattgggg ccctgctggt gtgcagggag      600
          ggctccctgg ccaaagagaa gacccagacc ctgcacaagt tcattctcct gtttgctgtc      660
          tttgatgagg gcaagagctg gcactctgaa accaagaact ccctgatgca ggacagggat      720
          gctgcctctg ccagggcctg gcccaagatg cacactgtga atggctatgt gaacaggagc      780
          ctgcctggac tcattggctg ccacaggaaa tctgtctact ggcatgtgat tggcatgggg      840
          acaacccctg aggtgcactc cattttcctg gagggccaca ccttcctggt caggaaccac      900
          agacaggcca gcctggagat cagccccatc accttcctca ctgcccagac cctgctgatg      960
          gacctcggac agttcctgct gttctgccac atcagctccc accagcatga tggcatggag     1020
          gcctatgtca aggtggacag ctgccctgag gagccacagc tcaggatgaa gaacaatgag     1080
          gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt ccgctttgat     1140
          gatgacaaca gcccatcctt cattcagatc aggtctgtgg ccaagaaaca ccccaagacc     1200
          tgggtgcact acattgctgc tgaggaggag gactgggact atgccccact ggtcctggcc     1260
          cctgatgaca ggagctacaa gagccagtac ctcaacaatg gcccacagag gattggacgc     1320
          aagtacaaga aagtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc     1380
          attcagcatg agtctggcat cctgggccca ctcctgtatg gggaggtggg ggacaccctg     1440
          ctcatcatct tcaagaacca ggcctccagg ccctacaaca tctacccaca tggcatcact     1500
          gatgtcaggc ccctgtacag ccgcaggctg ccaaaggggg tgaaacacct caaggacttc     1560
          cccattctgc ctggggagat cttcaagtac aagtggactg tcactgtgga ggatggacca     1620
          accaaatctg accccaggtg cctcaccaga tactactcca gctttgtgaa catggagagg     1680
          gacctggcct ctggcctgat tggcccactg ctcatctgct acaaggagtc tgtggaccag     1740
          aggggaaacc agatcatgtc tgacaagagg aatgtgattc tgttctctgt ctttgatgag     1800
          aacaggagct ggtacctgac tgagaacatt cagcgcttcc tgcccaaccc tgctggggtg     1860
          cagctggagg accctgagtt ccaggccagc aacatcatgc actccatcaa tggctatgtg     1920
          tttgacagcc tccagctttc tgtctgcctg catgaggtgg cctactggta cattctttct     1980
          attggggccc agactgactt cctttctgtc ttcttctctg gctacacctt caaacacaag     2040
          atggtgtatg aggacaccct gaccctcttc ccattctctg gggagactgt gttcatgagc     2100
          atggagaacc ctggcctgtg gattctggga tgccacaact ctgacttccg caacaggggc     2160
          atgactgccc tgctcaaagt ctcctcctgt gacaagaaca ctggggacta ctatgaggac     2220
          agctatgagg acatctctgc ctacctgctc agcaagaaca atgccattga gcccaggagc     2280
          ttcagccaga attccagaca ccccagcacc agggagatca ccaggaccac cctccagtct     2340
          gaccaggagg agattgacta tgatgacacc atttctgtgg agatgaagaa agaggacttt     2400
          gacatctatg acgaggacga gaaccagagc ccaaggagct tccagaagaa gaccaggcac     2460
          tacttcattg ctgctgtgga gcgcctgtgg gactatggca tgagctccag cccccatgtc     2520
          ctcaggaaca gggcccagtc tggctctgtg ccacagttca agaaagtggt cttccaagag     2580
          ttcactgatg gcagcttcac ccagcccctg tacagagggg agctgaatga gcacctggga     2640
          ctcctgggcc catacatcag ggctgaggtg gaggacaaca tcatggtgac cttccgcaac     2700
          caggcctcca ggccctacag cttctacagc tccctcatca gctatgagga ggaccagagg     2760
          cagggggctg agccacgcaa gaactttgtg aaacccaatg aaaccaagac ctacttctgg     2820
          aaagtccagc accacatggc ccccaccaag gatgagtttg actgcaaggc ctgggcctac     2880
          ttctctgatg tggacctgga gaaggatgtg cactctggcc tgattggccc actcctggtc     2940
          tgccacacca acaccctgaa ccctgcccat ggaaggcaag tgactgtgca ggagtttgcc     3000
          ctcttcttca ccatctttga tgaaaccaag agctggtact tcactgagaa catggagcgc     3060
          aactgcaggg ccccatgcaa cattcagatg gaggacccca ccttcaaaga gaactaccgc     3120
          ttccatgcca tcaatggcta catcatggac accctgcctg ggcttgtcat ggcccaggac     3180
          cagaggatca ggtggtacct gctttctatg ggctccaatg agaacattca ctccatccac     3240
          ttctctgggc atgtcttcac tgtgcgcaag aaggaggagt acaagatggc cctgtacaac     3300
          ctctaccctg gggtctttga gactgtggag atgctgccct ccaaagctgg catctggagg     3360
          gtggagtgcc tcattgggga gcacctgcat gctggcatga gcaccctgtt cctggtctac     3420
          agcaacaagt gccagacccc cctgggaatg gcctctggcc acatcaggga cttccagatc     3480
          actgcctctg gccagtatgg ccagtgggcc cccaagctgg ccaggctcca ctactctgga     3540
          tccatcaatg cctggagcac caaggagcca ttcagctgga tcaaagtgga cctgctggcc     3600
          cccatgatca tccatggcat caagacccag ggggccaggc agaagttctc cagcctgtac     3660
          atcagccagt tcatcatcat gtacagcctg gatggcaaga aatggcagac ctacagaggc     3720
          aactccactg gaacactcat ggtcttcttt ggcaatgtgg acagctctgg catcaagcac     3780
          aacatcttca accccccaat catcgccaga tacatcaggc tgcaccccac ccactacagc     3840
          atccgcagca ccctcaggat ggagctgatg ggctgtgacc tgaactcctg cagcatgccc     3900
          ctgggcatgg agagcaaggc catttctgat gcccagatca ctgcctccag ctacttcacc     3960
          aacatgtttg ccacctggag cccaagcaag gccaggctgc acctccaggg aaggagcaat     4020
          gcctggaggc cccaggtcaa caacccaaag gagtggctgc aggtggactt ccagaagacc     4080
          atgaaggtca ctggggtgac cacccagggg gtcaagagcc tgctcaccag catgtatgtg     4140
          aaggagttcc tgatcagctc cagccaggat ggccaccagt ggaccctctt cttccagaat     4200
          ggcaaggtca aggtgttcca gggcaaccag gacagcttca cccctgtggt gaacagcctg     4260
          gacccccccc tcctgaccag atacctgagg attcaccccc agagctgggt ccaccagatt     4320
          gccctgagga tggaggtcct gggatgtgag gcccaggacc tgtactga                  4368
          <![CDATA[<210> 12]]>
          <![CDATA[<211> 1455]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成多肽]]>
          <![CDATA[<400> 12]]>
          Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe 
          1               5                   10                  15      
          Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser 
                      20                  25                  30          
          Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg 
                  35                  40                  45              
          Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val 
              50                  55                  60                  
          Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile 
          65                  70                  75                  80  
          Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln 
                          85                  90                  95      
          Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser 
                      100                 105                 110         
          His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser 
                  115                 120                 125             
          Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp 
              130                 135                 140                 
          Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu 
          145                 150                 155                 160 
          Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser 
                          165                 170                 175     
          Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile 
                      180                 185                 190         
          Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr 
                  195                 200                 205             
          Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly 
              210                 215                 220                 
          Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp 
          225                 230                 235                 240 
          Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr 
                          245                 250                 255     
          Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val 
                      260                 265                 270         
          Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile 
                  275                 280                 285             
          Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser 
              290                 295                 300                 
          Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met 
          305                 310                 315                 320 
          Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His 
                          325                 330                 335     
          Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro 
                      340                 345                 350         
          Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp 
                  355                 360                 365             
          Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser 
              370                 375                 380                 
          Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr 
          385                 390                 395                 400 
          Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro 
                          405                 410                 415     
          Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn 
                      420                 425                 430         
          Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met 
                  435                 440                 445             
          Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu 
              450                 455                 460                 
          Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu 
          465                 470                 475                 480 
          Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro 
                          485                 490                 495     
          His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys 
                      500                 505                 510         
          Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe 
                  515                 520                 525             
          Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp 
              530                 535                 540                 
          Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg 
          545                 550                 555                 560 
          Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu 
                          565                 570                 575     
          Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val 
                      580                 585                 590         
          Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu 
                  595                 600                 605             
          Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp 
              610                 615                 620                 
          Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val 
          625                 630                 635                 640 
          Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp 
                          645                 650                 655     
          Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe 
                      660                 665                 670         
          Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr 
                  675                 680                 685             
          Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro 
              690                 695                 700                 
          Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly 
          705                 710                 715                 720 
          Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp 
                          725                 730                 735     
          Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys 
                      740                 745                 750         
          Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro 
                  755                 760                 765             
          Ser Thr Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu 
              770                 775                 780                 
          Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe 
          785                 790                 795                 800 
          Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys 
                          805                 810                 815     
          Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr 
                      820                 825                 830         
          Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly 
                  835                 840                 845             
          Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly 
              850                 855                 860                 
          Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly 
          865                 870                 875                 880 
          Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val 
                          885                 890                 895     
          Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu 
                      900                 905                 910         
          Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn 
                  915                 920                 925             
          Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His 
              930                 935                 940                 
          His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr 
          945                 950                 955                 960 
          Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly 
                          965                 970                 975     
          Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg 
                      980                 985                 990         
          Gln Val Thr Val Gln Glu Phe Ala  Leu Phe Phe Thr Ile  Phe Asp Glu 
                  995                 1000                 1005             
          Thr Lys  Ser Trp Tyr Phe Thr  Glu Asn Met Glu Arg  Asn Cys Arg 
              1010                 1015                 1020             
          Ala Pro  Cys Asn Ile Gln Met  Glu Asp Pro Thr Phe  Lys Glu Asn 
              1025                 1030                 1035             
          Tyr Arg  Phe His Ala Ile Asn  Gly Tyr Ile Met Asp  Thr Leu Pro 
              1040                 1045                 1050             
          Gly Leu  Val Met Ala Gln Asp  Gln Arg Ile Arg Trp  Tyr Leu Leu 
              1055                 1060                 1065             
          Ser Met  Gly Ser Asn Glu Asn  Ile His Ser Ile His  Phe Ser Gly 
              1070                 1075                 1080             
          His Val  Phe Thr Val Arg Lys  Lys Glu Glu Tyr Lys  Met Ala Leu 
              1085                 1090                 1095             
          Tyr Asn  Leu Tyr Pro Gly Val  Phe Glu Thr Val Glu  Met Leu Pro 
              1100                 1105                 1110             
          Ser Lys  Ala Gly Ile Trp Arg  Val Glu Cys Leu Ile  Gly Glu His 
              1115                 1120                 1125             
          Leu His  Ala Gly Met Ser Thr  Leu Phe Leu Val Tyr  Ser Asn Lys 
              1130                 1135                 1140             
          Cys Gln  Thr Pro Leu Gly Met  Ala Ser Gly His Ile  Arg Asp Phe 
              1145                 1150                 1155             
          Gln Ile  Thr Ala Ser Gly Gln  Tyr Gly Gln Trp Ala  Pro Lys Leu 
              1160                 1165                 1170             
          Ala Arg  Leu His Tyr Ser Gly  Ser Ile Asn Ala Trp  Ser Thr Lys 
              1175                 1180                 1185             
          Glu Pro  Phe Ser Trp Ile Lys  Val Asp Leu Leu Ala  Pro Met Ile 
              1190                 1195                 1200             
          Ile His  Gly Ile Lys Thr Gln  Gly Ala Arg Gln Lys  Phe Ser Ser 
              1205                 1210                 1215             
          Leu Tyr  Ile Ser Gln Phe Ile  Ile Met Tyr Ser Leu  Asp Gly Lys 
              1220                 1225                 1230             
          Lys Trp  Gln Thr Tyr Arg Gly  Asn Ser Thr Gly Thr  Leu Met Val 
              1235                 1240                 1245             
          Phe Phe  Gly Asn Val Asp Ser  Ser Gly Ile Lys His  Asn Ile Phe 
              1250                 1255                 1260             
          Asn Pro  Pro Ile Ile Ala Arg  Tyr Ile Arg Leu His  Pro Thr His 
              1265                 1270                 1275             
          Tyr Ser  Ile Arg Ser Thr Leu  Arg Met Glu Leu Met  Gly Cys Asp 
              1280                 1285                 1290             
          Leu Asn  Ser Cys Ser Met Pro  Leu Gly Met Glu Ser  Lys Ala Ile 
              1295                 1300                 1305             
          Ser Asp  Ala Gln Ile Thr Ala  Ser Ser Tyr Phe Thr  Asn Met Phe 
              1310                 1315                 1320             
          Ala Thr  Trp Ser Pro Ser Lys  Ala Arg Leu His Leu  Gln Gly Arg 
              1325                 1330                 1335             
          Ser Asn  Ala Trp Arg Pro Gln  Val Asn Asn Pro Lys  Glu Trp Leu 
              1340                 1345                 1350             
          Gln Val  Asp Phe Gln Lys Thr  Met Lys Val Thr Gly  Val Thr Thr 
              1355                 1360                 1365             
          Gln Gly  Val Lys Ser Leu Leu  Thr Ser Met Tyr Val  Lys Glu Phe 
              1370                 1375                 1380             
          Leu Ile  Ser Ser Ser Gln Asp  Gly His Gln Trp Thr  Leu Phe Phe 
              1385                 1390                 1395             
          Gln Asn  Gly Lys Val Lys Val  Phe Gln Gly Asn Gln  Asp Ser Phe 
              1400                 1405                 1410             
          Thr Pro  Val Val Asn Ser Leu  Asp Pro Pro Leu Leu  Thr Arg Tyr 
              1415                 1420                 1425             
          Leu Arg  Ile His Pro Gln Ser  Trp Val His Gln Ile  Ala Leu Arg 
              1430                 1435                 1440             
          Met Glu  Val Leu Gly Cys Glu  Ala Gln Asp Leu Tyr  
              1445                 1450                 1455 
          <![CDATA[<210> 13]]>
          <![CDATA[<211> 4374]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成聚核苷酸]]>
          <![CDATA[<400> 13]]>
          atgcagattg agctgtccac ctgcttcttt ctgtgcctgc tgagattctg cttctctgcc       60
          accaggagat actacctggg ggctgtggaa ctttcttggg actacatgca gtctgacctg      120
          ggagagctgc ctgtggatgc caggttccca cccagagtgc ccaagtcctt cccattcaac      180
          acctctgtgg tctacaagaa gacactcttt gtggaattca ctgaccacct gttcaacatt      240
          gcaaaaccca gaccaccctg gatgggactc ctgggaccca ccattcaggc tgaggtgtat      300
          gacactgtgg tcatcaccct caagaacatg gcatcccacc ctgtgtctct gcatgctgtg      360
          ggagtctcat actggaaagc ctctgaaggg gctgagtatg atgaccagac atcccagaga      420
          gagaaagagg atgacaaggt gttccctggg ggatctcaca cctatgtgtg gcaagtcctc      480
          aaggagaatg gacccatggc atctgaccca ctctgcctga catactccta cctttctcat      540
          gtggacctgg tcaaggacct caactctgga ctgattgggg cactgctggt gtgcagggaa      600
          ggatccctgg ccaaggagaa aacccagaca ctgcacaagt tcattctcct gtttgctgtc      660
          tttgatgagg gcaagtcttg gcactctgaa acaaagaact ccctgatgca agacagggat      720
          gctgcctctg ccagggcatg gcccaagatg cacactgtga atggctatgt gaacagatca      780
          ctgcctggac tcattggctg ccacaggaaa tctgtctact ggcatgtgat tggcatgggg      840
          acaacccctg aagtgcactc cattttcctg gagggacaca ccttcctggt caggaaccac      900
          agacaagcct ctctggagat ctctcccatc accttcctca ctgcacagac actgctgatg      960
          gaccttggac agttcctgct gttctgccac atctcttccc accagcatga tggcatggaa     1020
          gcctatgtca aggtggactc atgccctgag gaaccacagc tcaggatgaa gaacaatgag     1080
          gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt cagatttgat     1140
          gatgacaact ctccatcctt cattcagatc aggtctgtgg caaagaaaca ccccaagaca     1200
          tgggtgcact acattgctgc tgaggaagag gactgggact atgcaccact ggtcctggcc     1260
          cctgatgaca ggagctacaa gtctcagtac ctcaacaatg gcccacaaag aattggaaga     1320
          aagtacaaga aagtcagatt catggcctac actgatgaaa ccttcaagac aagagaagcc     1380
          attcagcatg agtctggcat tctgggacca ctcctgtatg gggaagtggg agacaccctg     1440
          ctcatcatct tcaagaacca ggcctccagg ccctacaaca tctacccaca tggcatcact     1500
          gatgtcaggc ccctgtacag caggagactg ccaaaagggg tgaaacacct caaggacttc     1560
          cccattctgc ctggagagat cttcaagtac aagtggactg tcactgtgga ggatggacca     1620
          acaaagtctg accccaggtg cctcaccaga tactactcct cttttgtgaa catggagaga     1680
          gacctggcat ctggactgat tggaccactg ctcatctgct acaaggagtc tgtggaccag     1740
          agaggcaacc agatcatgtc tgacaagaga aatgtgattc tgttctctgt ctttgatgag     1800
          aacagatcat ggtacctgac tgagaacatt cagagattcc tgcccaaccc tgctggggtg     1860
          caactggaag accctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg     1920
          tttgactctc tccagctttc tgtctgcctg catgaggtgg cctactggta cattctttct     1980
          attggggcac aaactgactt cctttctgtc ttcttctctg gatacacctt caagcacaag     2040
          atggtgtatg aggacaccct gacactcttc ccattctctg gggaaactgt gttcatgagc     2100
          atggagaacc ctggactgtg gattctggga tgccacaact ctgacttcag aaacagggga     2160
          atgactgcac tgctcaaagt ctcctcctgt gacaagaaca ctggggacta ctatgaggac     2220
          tcttatgagg acatctctgc ctacctgctc agcaagaaca atgccattga gcccagaagc     2280
          ttctctcaga atccacctgt cctgaagaga caccagagag agatcaccag gacaaccctc     2340
          cagtctgacc aggaagagat tgactatgat gacaccattt ctgtggagat gaagaaggag     2400
          gactttgaca tctatgatga ggacgagaac cagtctccaa gatcattcca gaagaagaca     2460
          agacactact tcattgctgc tgtggaaaga ctgtgggact atggcatgtc ttcctctccc     2520
          catgtcctca ggaacagggc acagtctggc tctgtgccac agttcaagaa agtggtcttc     2580
          caggagttca ctgatggctc attcacccag cccctgtaca gaggggaact gaatgagcac     2640
          ctgggactcc tgggaccata catcagggct gaggtggaag acaacatcat ggtgacattc     2700
          agaaaccagg cctccaggcc ctacagcttc tactcttccc tcatcagcta tgaggaagac     2760
          cagagacaag gggctgagcc aagaaagaac tttgtgaaac ccaatgaaac caagacctac     2820
          ttctggaaag tccagcacca catggcaccc accaaggatg agtttgactg caaggcctgg     2880
          gcatacttct ctgatgtgga cctggagaaa gatgtgcact ctggcctgat tggcccactc     2940
          ctggtctgcc acaccaacac cctgaaccct gcacatggaa ggcaagtgac tgtgcaggag     3000
          tttgccctct tcttcaccat ctttgatgaa accaagtcat ggtacttcac tgagaacatg     3060
          gagagaaact gcagagcacc atgcaacatt cagatggaag accccacctt caaggagaac     3120
          tacaggttcc atgccatcaa tggctacatc atggacaccc tgcctgggct tgtcatggca     3180
          caggaccaga gaatcagatg gtacctgctt tctatgggat ccaatgagaa cattcactcc     3240
          atccacttct ctgggcatgt cttcactgtg agaaagaagg aggaatacaa gatggccctg     3300
          tacaacctct accctggggt ctttgagact gtggagatgc tgccctccaa agctggcatc     3360
          tggagggtgg aatgcctcat tggggagcac ctgcatgctg gcatgtcaac cctgttcctg     3420
          gtctacagca acaagtgcca gacacccctg ggaatggcct ctggccacat cagggacttc     3480
          cagatcactg cctctggcca gtatggccag tgggcaccca aactggccag gctccactac     3540
          tctggctcca tcaatgcatg gtcaaccaag gagccattct cttggatcaa ggtggacctg     3600
          ctggcaccca tgatcattca tggcatcaag acacaggggg caagacagaa attctcctct     3660
          ctgtacatct cacagttcat catcatgtac tctctggatg gcaagaagtg gcagacatac     3720
          agaggcaact ccactggcac cctcatggtc ttctttggca atgtggacag ctctggcatc     3780
          aagcacaaca tcttcaaccc tcccatcatt gccagataca tcaggctgca ccccacccac     3840
          tactcaatca gatcaaccct caggatggaa ctgatgggat gtgacctgaa ctcctgctca     3900
          atgcccctgg gaatggagag caaggccatt tctgatgccc agatcactgc atcctcttac     3960
          ttcaccaaca tgtttgccac ctggtcacca tcaaaagcca ggctgcacct ccagggaaga     4020
          agcaatgcct ggagacccca ggtcaacaac ccaaaggaat ggctgcaagt ggacttccag     4080
          aagacaatga aagtcactgg ggtgacaacc cagggggtca agtctctgct cacctcaatg     4140
          tatgtgaagg agttcctgat ctcttcctca caggatggcc accagtggac actcttcttc     4200
          cagaatggca aagtcaaggt gttccagggc aaccaggact ctttcacacc tgtggtgaac     4260
          tcactggacc cccccctcct gacaagatac ctgagaattc acccccagtc ttgggtccac     4320
          cagattgccc tgagaatgga agtcctggga tgtgaggcac aagacctgta ctga           4374
          <![CDATA[<210> 14]]>
          <![CDATA[<211> 4374]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成聚核苷酸]]>
          <![CDATA[<400> 14]]>
          atgcagatcg aactgagcac ttgcttcttc ctgtgtctcc tgcgcttttg cttctccgcc       60
          acaaggagat actatctcgg tgccgtggag ctcagctggg actacatgca gagcgacttg      120
          ggtgaactgc ctgtggacgc caggtttcca ccccgcgtgc ccaagagttt cccgttcaac      180
          accagtgtcg tgtacaagaa aaccctcttc gtggaattca ccgaccacct gttcaacatc      240
          gccaaaccgc gccctccctg gatggggctg ctcggcccga cgatccaggc tgaggtctat      300
          gacacggtgg tgattaccct caagaacatg gctagccacc cggtgagcct gcacgccgtg      360
          ggcgtgtcct attggaaagc gtccgagggt gcggagtacg atgaccagac ttcacagcgg      420
          gagaaggaag acgacaaagt gttccccggg ggttcccaca cctatgtctg gcaggtcctg      480
          aaggagaatg gtcctatggc ctccgaccca ttgtgcctca cctactctta cctaagccat      540
          gtggatctcg tcaaggacct gaactcgggg ctgatcggcg ccctgctcgt gtgccgggag      600
          ggctcactgg ccaaggagaa gacccaaact ctgcacaagt tcatcctgct gttcgcggta      660
          ttcgacgagg ggaagtcctg gcactccgag accaagaaca gcctgatgca ggaccgcgac      720
          gcagcctcgg cccgtgcgtg gccaaagatg cacaccgtga acggctacgt taacaggagc      780
          ctacccggcc tgatcggctg ccaccgcaaa tcggtctact ggcatgtgat cggaatgggc      840
          acaacgcccg aggtccacag tatcttcctc gagggccaca ctttcctggt ccggaatcac      900
          cgccaggcca gcctggagat cagccccata acctttctga cggcgcagac cttactcatg      960
          gatctcggcc agttcctcct gttctgccac atttcgtccc accagcacga tgggatggaa     1020
          gcatatgtga aagtggactc ctgccccgag gaaccccagc ttaggatgaa gaacaatgag     1080
          gaggccgagg actacgacga tgaccttacc gattcagaaa tggacgtagt acgctttgac     1140
          gacgacaact ctccatcctt catacagatt cgctccgtcg ccaagaagca ccctaagact     1200
          tgggtgcact acatcgcggc cgaggaggag gactgggatt atgctcccct ggtgctggcc     1260
          cccgacgacc gcagctacaa gagccagtac ctgaataacg ggccccagcg catcggccgg     1320
          aagtacaaga aagtgcggtt catggcttac acggacgaga ccttcaagac ccgggaggct     1380
          atccagcatg agagcggcat cttggggccc ctcctgtacg gcgaagttgg agacacactg     1440
          ctgatcatct tcaagaacca ggcgagcagg ccctacaaca tctaccccca cggcattacc     1500
          gatgtccggc cgttgtacag ccgacggctg cccaagggcg tgaagcacct gaaggacttt     1560
          ccgatcctgc cgggcgagat cttcaagtac aagtggactg tgaccgtgga ggatgggccg     1620
          accaagagcg atccgcgctg cctgacccgt tactactcca gctttgtcaa tatggagcgc     1680
          gacctcgcta gcggcttgat tggccctctg ctgatctgct acaaggagtc cgtggaccag     1740
          agggggaatc agatcatgag tgacaagagg aacgtgatcc tgttctccgt gttcgacgaa     1800
          aaccgcagct ggtatctcac cgagaatatc cagcgcttcc tgcccaaccc ggccggtgtg     1860
          cagctggagg accccgagtt tcaggccagc aacatcatgc attctatcaa cggatatgtg     1920
          tttgattccc tgcagctctc agtgtgtctg cacgaggtcg cctactggta tatcctcagc     1980
          attggggcac agaccgactt cctgagcgtg ttcttctccg ggtatacctt caagcacaag     2040
          atggtgtacg aggataccct gaccctgttc ccctttagcg gcgaaaccgt gtttatgtct     2100
          atggagaacc ccgggctctg gatccttggc tgccataact ccgacttccg caaccgcgga     2160
          atgaccgcgc tcctgaaagt gtcgagttgt gacaagaaca ccggcgacta ttacgaggac     2220
          agttacgagg acatctctgc gtacctcctt agcaagaata acgccatcga gccaagatcc     2280
          ttcagccaga accccccagt gctgaagagg catcagcggg agatcacccg cacgaccctg     2340
          cagtcggatc aggaggagat tgattacgac gacacgatca gtgtggagat gaagaaggag     2400
          gacttcgaca tctacgacga agatgaaaac cagtcccctc ggtccttcca aaagaagacc     2460
          cggcactact tcatcgccgc tgtggaacgc ctgtgggact atggaatgtc ttctagccct     2520
          cacgttttga ggaaccgcgc ccagtcgggc agcgtgcccc agttcaagaa agtggtgttc     2580
          caggagttca ccgacggctc cttcacccag ccactttacc ggggcgagct caatgaacat     2640
          ctgggcctgc tgggacccta catcagggct gaggtggagg acaacatcat ggtgacattc     2700
          cggaatcagg ccagcagacc atacagtttc tacagttcac tcatctccta cgaggaggac     2760
          cagcgccagg gggctgaacc ccgtaagaac ttcgtgaagc caaacgaaac aaagacctac     2820
          ttctggaagg tccagcacca catggcacct accaaggacg agttcgattg caaggcctgg     2880
          gcctacttct ccgacgtgga cctggagaaa gatgtgcaca gcggcctgat tggccctctg     2940
          ctggtgtgtc acacgaacac actcaaccct gcacacgggc ggcaggtcac tgtgcaggaa     3000
          ttcgccctgt tctttaccat ctttgatgag acgaagtcct ggtatttcac cgaaaacatg     3060
          gagaggaact gccgcgcacc ctgcaacatc cagatggaag atccgacatt caaggagaac     3120
          taccggttcc atgccatcaa tggctacatc atggacaccc tgcctggcct cgtgatggcc     3180
          caagaccagc gtatccgctg gtatctgctg tcgatgggct ccaacgagaa catccatagt     3240
          atccacttca gcgggcatgt cttcacggtg aggaaaaagg aggagtacaa gatggcactg     3300
          tacaacctct atcccggcgt gttcgagacc gtggagatgc tgccctccaa ggccggcatc     3360
          tggagagtgg aatgcctgat cggcgagcac ctccacgctg ggatgtccac gctgttcctc     3420
          gtttacagca ataagtgcca gacccctctg ggcatggcga gcggccacat ccgcgacttc     3480
          cagattacag ccagcggcca gtacggtcag tgggctccaa agctggcccg tctgcactac     3540
          tccggatcca tcaacgcctg gtccaccaag gaaccgttct cctggatcaa agtagacctg     3600
          ctagccccca tgatcattca cggcatcaag acacaaggcg cccgacagaa gttctcgagc     3660
          ctctatatct cccagttcat catcatgtat agcctggacg gaaagaagtg gcagacttac     3720
          cgcggaaact cgacagggac cctgatggta ttcttcggta acgtggacag ctccggaatc     3780
          aagcacaaca tcttcaaccc acccattatc gcccgctaca tccgcctgca ccccactcac     3840
          tatagcatta ggtccaccct gcgaatggag ctcatgggct gtgacctgaa cagctgtagc     3900
          atgcccctcg gcatggagtc taaggcgatc tccgacgcac agataacggc atcatcctac     3960
          tttaccaaca tgttcgctac ctggtccccc tccaaggccc gactccacct gcaagggaga     4020
          tccaacgcct ggcggccaca ggtcaacaat cccaaggagt ggctgcaagt ggactttcag     4080
          aaaactatga aagtcaccgg agtgaccaca cagggagtga agtctctgct gaccagcatg     4140
          tacgtgaagg agttcctcat ctccagttcg caggatggcc accagtggac gttgttcttc     4200
          caaaacggta aagtcaaagt cttccaaggg aaccaggaca gctttacacc cgtcgtgaac     4260
          tccctggacc ccccgcttct cactagatac ctccgcatcc accctcagag ctgggtgcac     4320
          cagattgccc tgcgcatgga ggttctgggg tgtgaagccc aggacctgta ctaa           4374
          <![CDATA[<210> 15]]>
          <![CDATA[<211> 4374]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成聚核苷酸]]>
          <![CDATA[<400> 15]]>
          atgcagattg agctctccac ctgcttcttt ctctgccttc ttcgcttctg cttttctgcc       60
          acacgcaggt actatttggg agcagtggaa ctgagctggg attacatgca gagtgacctt      120
          ggtgaacttc ctgtggacgc tcgttttcca cctagagttc ccaagtcctt ccccttcaac      180
          acctcagtgg tctacaagaa aacgctgttt gtggagttca ctgaccacct cttcaacatt      240
          gccaaaccaa gacccccttg gatgggattg ctgggaccca caatacaagc agaagtctac      300
          gacacggtgg tgattaccct gaagaacatg gcgtcacacc ctgtttcact tcacgctgtt      360
          ggggtcagtt attggaaagc ctcagagggt gcggaatacg atgatcaaac cagccagagg      420
          gagaaggaag atgacaaggt ctttcctggg ggtagccata cctatgtttg gcaggtgctg      480
          aaagagaatg ggcctatggc ctctgatccc ttgtgcctca catactctta cctgagtcac      540
          gtcgacctgg tgaaagacct gaatagcggt ctgattggtg cactgcttgt ttgtagagag      600
          gggagtttgg ccaaggagaa aactcagact ctccacaagt ttatcctcct gtttgctgtg      660
          ttcgacgagg gcaagtcttg gcactctgaa acaaagaact ccctgatgca ggacagagat      720
          gctgcatctg caagggcttg gccaaaaatg cacacagtga acggctatgt gaatcgatca      780
          ctgccaggac tgataggctg tcatcgcaag tcagtgtatt ggcacgttat cgggatggga      840
          acaactccag aagtgcacag catcttcctt gagggccaca ctttcctggt tcggaatcat      900
          agacaggcca gccttgagat cagcccaatc acctttctga ctgcccaaac cttgctgatg      960
          gatctgggac agttcctcct gttttgtcac atctcctccc accaacatga cgggatggag     1020
          gcttatgtga aggtcgatag ctgtccggag gaaccacaac tgaggatgaa gaacaacgaa     1080
          gaggcagagg actatgacga cgatctgact gacagtgaaa tggacgtggt tcggttcgac     1140
          gatgacaatt ctccttcatt tatccagatc cgttccgtgg ccaagaagca ccccaagact     1200
          tgggttcatt acatcgctgc tgaggaggag gattgggact acgcgccctt ggtgttggcc     1260
          ccagacgatc gctcatacaa gagccagtac cttaacaatg gtccacaaag gatcggccgg     1320
          aagtacaaga aggttagatt tatggcttat accgacgaga cttttaaaac tagggaagca     1380
          attcagcatg aaagtggcat tcttggaccc ctgctgtatg gcgaggttgg cgacaccctg     1440
          ctgattatct ttaagaacca ggcaagccgg ccctacaaca tctacccgca cggcataacc     1500
          gatgtacgac ccctgtacag tcgcagactt cctaaagggg tgaaacacct gaaggacttc     1560
          ccaattctgc ccggggagat cttcaagtat aaatggaccg tgacggttga ggatggtccc     1620
          acaaagtccg atccgagatg ccttacccga tattattcca gcttcgtgaa catggaaagg     1680
          gacctggcca gcgggctgat tggcccactg ctgatttgtt acaaggagtc tgtcgatcaa     1740
          agaggaaacc aaataatgag cgacaaacgt aacgtcatcc tgttcagcgt ctttgatgag     1800
          aatagaagct ggtacctcac agaaaatatt cagcggtttc tgcctaaccc cgcaggcgtc     1860
          cagctggaag atcccgagtt ccaagcctca aacatcatgc atagcatcaa cggatacgta     1920
          ttcgatagcc tgcagctgtc cgtctgtctc catgaagtgg catattggta catcctgagt     1980
          atcggggcgc agaccgactt cctgagcgtg ttcttttctg gatacacgtt caaacacaaa     2040
          atggtctatg aagataccct gactctgttt ccattctcag gagagacagt ctttatgagt     2100
          atggaaaatc ctggactgtg gatcctgggc tgtcacaatt ctgattttcg gaacagaggc     2160
          atgacagccc tgcttaaagt gagctcatgc gacaagaaca ccggtgatta ctacgaagat     2220
          agctatgagg acatcagtgc gtatttgctc tccaagaaca acgctatcga gccacggtct     2280
          ttcagtcaga atcctcccgt tctgaagcgg catcagcgcg aaataacacg cacaaccctt     2340
          cagtcagacc aagaggaaat cgactacgat gatactatct ctgtggagat gaagaaggag     2400
          gatttcgaca tttacgacga ggacgagaat cagtccccaa ggagctttca gaagaaaaca     2460
          agacactatt tcattgccgc cgtggagcga ctgtgggact acggcatgtc tagctctccg     2520
          catgtactta gaaatagggc acaaagcgga tccgtgcctc agtttaagaa agttgtcttt     2580
          caggagttta cagatggctc cttcacccag cccttgtatc gcggggaact caatgaacac     2640
          ctgggcctcc tgggtcctta tattagggcc gaagtcgagg acaatatcat ggtgaccttt     2700
          aggaaccagg catctagacc ttactctttc tactcctccc tgatatccta tgaggaggac     2760
          cagcggcaag gcgctgagcc tcggaagaac tttgtgaagc caaatgaaac caaaacatac     2820
          ttttggaaag ttcagcacca catggctccc acgaaggacg aatttgactg taaagcctgg     2880
          gcctacttct cagatgtaga tctcgagaaa gacgtgcact cagggctcat tggtcccctc     2940
          ctggtctgtc atactaatac cctcaatcca gcacacggac gtcaggtaac cgtccaggaa     3000
          tttgccctgt tctttaccat tttcgatgag actaaatcct ggtactttac cgaaaacatg     3060
          gagaggaatt gcagagcccc atgcaacatc cagatggagg accctacctt caaagagaac     3120
          tatcgcttcc atgccattaa cggttacatt atggatactc tcccaggact tgtgatggca     3180
          caggatcagc ggataagatg gtatctgttg agcatgggct ccaacgagaa tattcacagc     3240
          atccatttct ccggtcacgt gtttacagtg agaaagaaag aagagtacaa gatggctctg     3300
          tataatctct atccaggcgt attcgaaacg gtggagatgt tgcctagcaa ggccggcatt     3360
          tggcgagtag aatgccttat cggggaacat ctgcatgccg gaatgagcac gctcttcctg     3420
          gtgtatagta acaagtgcca gactccgctg ggcatggcat ctggccatat acgggacttt     3480
          cagattacgg ctagcgggca gtatgggcag tgggcaccca aacttgcgcg actgcactat     3540
          tcaggctcta tcaatgcatg gtccaccaag gaacccttct cttggattaa ggtggacctt     3600
          ttggcgccca tgataatcca tgggatcaaa acccagggcg ctcgtcagaa attctcatca     3660
          ctctacatct ctcagttcat aataatgtat tcactggatg ggaagaaatg gcagacttac     3720
          agaggaaaca gcaccgggac gctgatggtg ttctttggca acgtggacag cagcggcatc     3780
          aaacacaaca tcttcaatcc tcccattatt gcccgttata ttagactgca tcccactcac     3840
          tactctatac gcagcacact taggatggag ctcatgggat gcgacctgaa cagttgtagt     3900
          atgcccttgg ggatggagtc caaagctata agcgacgcac aaattacagc tagctcttac     3960
          tttacgaata tgttcgccac gtggagccca agcaaagccc ggctgcattt gcagggtcgg     4020
          agtaatgctt ggcgcccaca ggtgaataac cctaaggaat ggttgcaagt agatttccag     4080
          aaaactatga aggtaaccgg cgtcactaca cagggagtca agtccctctt gacctctatg     4140
          tacgtcaagg agttcctgat tagcagcagt caggatgggc accaatggac actgttcttc     4200
          cagaatggga aagttaaagt atttcagggt aaccaggact cctttacacc tgtggtgaat     4260
          agcctcgacc cacccctgct gacacgatac ctccgcatcc accctcagtc ttgggtgcat     4320
          caaattgccc tgcgaatgga ggtgttggga tgcgaagctc aggacctcta ctga           4374
          <![CDATA[<210> 16]]>
          <![CDATA[<211> 4374]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成聚核苷酸]]>
          <![CDATA[<400> 16]]>
          atgcagatcg aactctctac ttgcttcttc ctgtgccttc tgaggttctg cttctctgcc       60
          actcgccgat attacctcgg ggccgtggag ttgagttggg actacatgca atcagatctg      120
          ggcgaactcc ctgtggatgc ccgattccca ccgcgcgtgc ccaagtcttt cccatttaat      180
          acttctgtgg tgtacaagaa gacattgttt gtggagttta ccgatcacct gttcaacatc      240
          gccaaaccgc ggcccccatg gatgggtctg cttgggccca ccattcaagc ggaggtctat      300
          gatacagtgg tgataacgct taagaacatg gcgagccacc cagtgtctct gcatgccgtt      360
          ggtgtatcat attggaaggc cagcgaagga gcggagtacg atgaccagac ctctcagaga      420
          gagaaggaag acgataaggt ttttcctggc ggaagtcata catatgtatg gcaggtcctg      480
          aaagagaatg ggccgatggc ttctgacccc ctttgtctta cctatagtta tctgagccac      540
          gtggacctgg tcaaggacct caacagtggt ctgattgggg ctctgcttgt ttgtagagag      600
          ggtagcttgg ctaaggagaa aacccaaaca ctccataagt tcattttgct gttcgcggtg      660
          ttcgacgagg gaaagagttg gcacagcgaa acaaagaatt cactgatgca agacagggac      720
          gccgcttccg caagggcttg gcctaagatg catacggtga atgggtatgt gaaccggagc      780
          ctcccggggc tgatcgggtg ccatcgcaag tctgtttact ggcacgtcat tggaatgggg      840
          acaacgccag aggtacatag tatatttctt gaaggccaca cgttcctcgt acggaaccac      900
          cgacaggctt ccctggagat aagccccatt acctttctga ccgctcagac tctgctgatg      960
          gaccttggcc agtttctcct gttctgccat attagcagcc accagcacga cggtatggaa     1020
          gcatacgtga aagtcgatag ctgtcctgag gagcctcagc tcagaatgaa gaacaacgag     1080
          gaggccgaag actatgacga tgaccttaca gattccgaga tggacgtggt gcgctttgac     1140
          gacgataaca gtcctagttt cattcaaatc agatccgtag ccaaaaagca tccaaagaca     1200
          tgggtgcatt acattgcagc cgaagaggag gattgggatt atgcgcccct tgttctggct     1260
          ccagatgaca ggagctataa gtcccagtac ttgaacaacg ggccacagcg aatcggtaga     1320
          aaatataaga aggtaagatt catggcctac actgacgaaa catttaaaac cagggaagct     1380
          atccaacacg aatctggaat tctcggccct ctgctctacg gtgaggtggg ggacaccttg     1440
          ctgatcattt tcaaaaatca ggcatccagg ccttacaaca tataccccca tggcatcacc     1500
          gatgtccgcc cgctgtattc cagaagactc cccaagggag tgaaacatct gaaagatttt     1560
          cccatcctgc cgggcgagat ctttaaatac aaatggactg tgactgtaga ggacgggcct     1620
          acaaaatcag acccacggtg cctgacaagg tattacagta gcttcgtcaa catggaacgc     1680
          gacctcgcca gcggactcat tggcccactg ttgatctgtt acaaagagtc agtggatcag     1740
          aggggaaatc agatcatgag cgataagaga aacgttatcc tgtttagtgt cttcgacgag     1800
          aaccggtctt ggtaccttac tgagaacatc cagaggttcc tgccgaatcc ggctggcgtt     1860
          cagctcgagg acccagagtt ccaggccagt aatataatgc actcaatcaa cggttatgtg     1920
          ttcgatagcc tgcagctgag cgtctgcctc cacgaggtag cctattggta catattgtcc     1980
          atcggggctc agaccgattt tctgtccgtg ttctttagcg ggtatacctt taaacataaa     2040
          atggtctatg aagacaccct gaccctgttc ccattctccg gtgagactgt gttcatgtcc     2100
          atggagaacc cagggctgtg gatcctgggg tgtcacaata gtgactttag gaatcgggga     2160
          atgacggcac tgctgaaggt gagttcttgc gataaaaata caggagatta ctatgaggat     2220
          agttacgagg atatcagtgc ctatctgctt tcaaaaaaca acgcaattga gccccggtct     2280
          ttctcacaaa accccccggt gctgaagcgc caccagcgcg aaattacccg gacaaccttg     2340
          cagtccgacc aggaggaaat cgattatgac gatactatca gtgtagaaat gaaaaaggag     2400
          gattttgata tttacgacga agacgagaac cagtctccgc gaagttttca gaagaaaacg     2460
          cgacactact ttatagctgc cgtggaacga ctctgggatt atggcatgtc ctccagccct     2520
          catgtcctta ggaatcgagc gcagagtggc tctgtgcctc agttcaaaaa ggttgtgttc     2580
          caggaattca ccgacggctc atttacccag ccgctgtaca gaggcgaact caacgaacac     2640
          cttgggctgc ttgggccata tattcgagca gaggtggaag ataatatcat ggtaaccttt     2700
          agaaaccagg cgtcaagacc ctattccttc tacagttctc tgatcagcta cgaggaggac     2760
          caaagacagg gagctgaacc caggaagaac tttgtgaaac ctaatgagac caagacctac     2820
          ttctggaagg tccagcacca tatggcccca actaaagatg aattcgattg caaggcctgg     2880
          gcttatttca gcgacgtgga tctcgaaaag gatgtgcaca gcgggttgat cggaccgctt     2940
          ttggtgtgcc acacaaatac cctcaatcct gcccacgggc ggcaggtcac agttcaagag     3000
          tttgcactct tctttacaat atttgacgag acaaagtcat ggtattttac agagaatatg     3060
          gagagaaatt gtcgcgcacc ttgcaacatt cagatggagg accccacatt taaggagaat     3120
          tacagatttc atgctatcaa tgggtacatt atggatactc tgcctggtct ggtcatggcc     3180
          caggatcagc gcataaggtg gtacttgctg agcatgggat ctaatgagaa tatacacagc     3240
          attcacttca gtggccacgt ttttactgtt agaaagaagg aggagtacaa aatggcgctc     3300
          tacaaccttt acccgggtgt gtttgagaca gtggagatgc tgccaagcaa ggcaggcatc     3360
          tggagggttg agtgtcttat tggggagcat ctgcatgctg gaatgtccac cctctttctt     3420
          gtgtacagca ataagtgcca gacaccgctt ggcatggcca gcggccacat tagggacttt     3480
          cagataactg ccagtggaca gtacggccag tgggctccca agcttgcaag actccactac     3540
          tccggaagca taaacgcatg gagcaccaag gaacccttct cttggattaa ggtggacctg     3600
          ctggcgccaa tgatcattca cggcataaaa acccaagggg cacgacagaa attttcatct     3660
          ttgtatatta gtcagtttat catcatgtac agcttggatg gaaagaagtg gcagacgtac     3720
          aggggcaatt ctacaggaac acttatggtg ttttttggga atgtcgattc cagcgggatc     3780
          aaacataaca tcttcaatcc tcctattatc gcccgatata tccgcctgca ccctacgcat     3840
          tactccatca ggtccacatt gagaatggaa ctgatggggt gcgacctgaa tagttgtagt     3900
          atgccactgg gcatggagtc taaagccatc agcgatgcac agatcactgc cagctcttac     3960
          ttcaccaaca tgtttgcaac ttggtccccc tctaaagctc gcctgcatct gcagggacgc     4020
          tcaaatgcat ggcgaccaca ggtgaacaat ccaaaagagt ggctccaggt cgactttcag     4080
          aagacaatga aggtaacagg agtgacaacc cagggtgtaa aaagcctcct tacgagtatg     4140
          tacgttaagg agtttctgat ttctagctcc caggacggac accagtggac tctgttcttc     4200
          cagaacggca aagtgaaggt atttcaggga aaccaggatt cttttacccc ggtagtgaat     4260
          agcctggatc caccgttgct gacccgctat ctgagaattc atccacaatc ctgggtgcat     4320
          cagattgccc tccggatgga agtgctcggc tgtgaagctc aggatctgta ttag           4374
          <![CDATA[<210> 17]]>
          <![CDATA[<211> 4374]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成聚核苷酸]]>
          <![CDATA[<400> 17]]>
          atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc       60
          accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc      120
          ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac      180
          acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc      240
          gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat      300
          gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt      360
          ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg      420
          gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg      480
          aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat      540
          gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa      600
          gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta      660
          tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat      720
          gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct      780
          ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc      840
          accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat      900
          cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg      960
          gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa     1020
          gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa     1080
          gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat     1140
          gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact     1200
          tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc     1260
          cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg     1320
          aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct     1380
          attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg     1440
          ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact     1500
          gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt     1560
          ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca     1620
          actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga     1680
          gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa     1740
          agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag     1800
          aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg     1860
          cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt     1920
          tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc     1980
          attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa     2040
          atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg     2100
          atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc     2160
          atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac     2220
          agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc     2280
          ttctcccaga atccaccagt cttgaaacgc catcaacggg aaataactcg tactactctt     2340
          cagtcagatc aagaggaaat tgactatgat gataccatat cagttgaaat gaagaaggaa     2400
          gattttgaca tttatgatga ggatgaaaat cagagccccc gcagctttca aaagaaaaca     2460
          cgacactatt ttattgctgc agtggagagg ctctgggatt atgggatgag tagctcccca     2520
          catgttctaa gaaacagggc tcagagtggc agtgtccctc agttcaagaa agttgttttc     2580
          caggaattta ctgatggctc ctttactcag cccttatacc gtggagaact aaatgaacat     2640
          ttgggactcc tggggccata tataagagca gaagttgaag ataatatcat ggtaactttc     2700
          agaaatcagg cctctcgtcc ctattccttc tattctagcc ttatttctta tgaggaagat     2760
          cagaggcaag gagcagaacc tagaaaaaac tttgtcaagc ctaatgaaac caaaacttac     2820
          ttttggaaag tgcaacatca tatggcaccc actaaagatg agtttgactg caaagcctgg     2880
          gcttatttct ctgatgttga cctggaaaaa gatgtgcact caggcctgat tggacccctt     2940
          ctggtctgcc acactaacac actgaaccct gctcatggga gacaagtgac agtacaggaa     3000
          tttgctctgt ttttcaccat ctttgatgag accaaaagct ggtacttcac tgaaaatatg     3060
          gaaagaaact gcagggctcc ctgcaatatc cagatggaag atcccacttt taaagagaat     3120
          tatcgcttcc atgcaatcaa tggctacata atggatacac tacctggctt agtaatggct     3180
          caggatcaaa ggattcgatg gtatctgctc agcatgggca gcaatgaaaa catccattct     3240
          attcatttca gtggacatgt gttcactgta cgaaaaaaag aggagtataa aatggcactg     3300
          tacaatctct atccaggtgt ttttgagaca gtggaaatgt taccatccaa agctggaatt     3360
          tggcgggtgg aatgccttat tggcgagcat ctacatgctg ggatgagcac actttttctg     3420
          gtgtacagca ataagtgtca gactcccctg ggaatggctt ctggacacat tagagatttt     3480
          cagattacag cttcaggaca atatggacag tgggccccaa agctggccag acttcattat     3540
          tccggatcaa tcaatgcctg gagcaccaag gagccctttt cttggatcaa ggtggatctg     3600
          ttggcaccaa tgattattca cggcatcaag acccagggtg cccgtcagaa gttctccagc     3660
          ctctacatct ctcagtttat catcatgtat agtcttgatg ggaagaagtg gcagacttat     3720
          cgaggaaatt ccactggaac cttaatggtc ttctttggca atgtggattc atctgggata     3780
          aaacacaata tttttaaccc tccaattatt gctcgataca tccgtttgca cccaactcat     3840
          tatagcattc gcagcactct tcgcatggag ttgatgggct gtgatttaaa tagttgcagc     3900
          atgccattgg gaatggagag taaagcaata tcagatgcac agattactgc ttcatcctac     3960
          tttaccaata tgtttgccac ctggtctcct tcaaaagctc gacttcacct ccaagggagg     4020
          agtaatgcct ggagacctca ggtgaataat ccaaaagagt ggctgcaagt ggacttccag     4080
          aagacaatga aagtcacagg agtaactact cagggagtaa aatctctgct taccagcatg     4140
          tatgtgaagg agttcctcat ctccagcagt caagatggcc atcagtggac tctctttttt     4200
          cagaatggca aagtaaaggt ttttcaggga aatcaagact ccttcacacc tgtggtgaac     4260
          tctctagacc caccgttact gactcgctac cttcgaattc acccccagag ttgggtgcac     4320
          cagattgccc tgaggatgga ggttctgggc tgcgaggcac aggacctcta ctga           4374
          <![CDATA[<210> 18]]>
          <![CDATA[<211> 4374]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成聚核苷酸]]>
          <![CDATA[<400> 18]]>
          atgcagatcg agctgtccac atgctttttt ctgtgcctgc tgcggttctg cttcagcgcc       60
          acccggcggt actacctggg cgccgtggag ctgtcctggg actacatgca gagcgacctg      120
          ggcgagctgc ccgtggacgc ccggttcccc cccagagtgc ccaagagctt ccccttcaac      180
          accagcgtgg tgtacaagaa aaccctgttc gtggagttca ccgaccacct gttcaacatc      240
          gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac      300
          gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg      360
          ggcgtgagct actggaaggc ctccgagggc gccgagtacg acgaccagac cagccagcgg      420
          gagaaagagg acgacaaagt ctttcctggc ggcagccaca cctacgtgtg gcaggtcctg      480
          aaagaaaacg gccccatggc ctccgacccc ctgtgcctga cctacagcta cctgagccac      540
          gtggacctgg tgaaggacct gaacagcggg ctgattgggg ccctgctggt ctgccgggag      600
          ggcagcctgg ccaaagagaa aacccagacc ctgcacaagt tcatcctgct gttcgccgtg      660
          ttcgacgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggaccgggac      720
          gccgcctctg ccagagcctg gcccaagatg cacaccgtga acggctacgt gaacagaagc      780
          ctgcccggcc tgattggctg ccaccggaag agcgtgtact ggcacgtgat cggcatgggc      840
          accacacccg aggtgcacag catctttctg gaagggcaca cctttctggt gcggaaccac      900
          cggcaggcca gcctggaaat cagccctatc accttcctga ccgcccagac actgctgatg      960
          gacctgggcc agttcctgct gttttgccac atcagctctc accagcacga cggcatggaa     1020
          gcctacgtga aggtggactc ctgccccgag gaaccccagc tgcggatgaa gaacaacgag     1080
          gaagccgagg actacgacga cgacctgacc gacagcgaga tggacgtggt gcggttcgac     1140
          gacgacaaca gccccagctt catccagatc agaagcgtgg ccaagaagca ccccaagacc     1200
          tgggtgcact acatcgccgc cgaggaagag gactgggact acgcccccct ggtgctggcc     1260
          cccgacgaca gaagctacaa gagccagtac ctgaacaatg gcccccagcg gatcggccgg     1320
          aagtacaaga aagtgcggtt catggcctac accgacgaga ccttcaagac ccgggaggcc     1380
          atccagcacg agagcggcat cctgggcccc ctgctgtacg gcgaagtggg cgacacactg     1440
          ctgatcatct tcaagaacca ggccagccgg ccctacaaca tctaccccca cggcatcacc     1500
          gacgtgcggc ccctgtacag caggcggctg cccaagggcg tgaagcacct gaaggacttc     1560
          cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggacggcccc     1620
          accaagagcg accccagatg cctgacccgg tactacagca gcttcgtgaa catggaacgg     1680
          gacctggcct ccgggctgat cggacctctg ctgatctgct acaaagaaag cgtggaccag     1740
          cggggcaacc agatcatgag cgacaagcgg aacgtgatcc tgttcagcgt gttcgatgag     1800
          aaccggtcct ggtatctgac cgagaacatc cagcggtttc tgcccaaccc tgccggggtg     1860
          cagctggaag atcccgagtt ccaggccagc aacatcatgc actccatcaa tggctacgtg     1920
          ttcgacagcc tgcagctgtc cgtgtgtctg cacgaggtgg cctactggta catcctgagc     1980
          atcggcgccc agaccgactt cctgagcgtg ttcttcagcg gctacacctt caagcacaag     2040
          atggtgtacg aggacaccct gaccctgttc cctttcagcg gcgagaccgt gttcatgagc     2100
          atggaaaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttccg gaaccggggc     2160
          atgaccgccc tgctgaaggt gtccagctgc gacaagaaca ccggcgacta ctacgaggac     2220
          agctacgagg atatcagcgc ctacctgctg tccaagaaca acgccatcga gcccagaagc     2280
          ttcagccaga acccccctgt gctgaagcgg caccagagag agatcacccg gaccaccctg     2340
          cagtccgacc aggaagagat cgattacgac gacaccatca gcgtggagat gaaaaaagaa     2400
          gatttcgaca tctacgacga ggacgagaac cagagccccc ggtccttcca gaagaaaacc     2460
          cggcactact ttatcgccgc cgtggagcgg ctgtgggact acggcatgag cagcagcccc     2520
          cacgtgctgc ggaaccgggc ccagagcggc agcgtgcccc agttcaagaa agtggtgttc     2580
          caggaattca ccgacggcag cttcacccag cccctgtacc ggggcgagct gaacgagcac     2640
          ctggggctgc tggggcccta catcagggcc gaagtggagg acaacatcat ggtgaccttc     2700
          cggaatcagg ccagcagacc ctactccttc tacagcagcc tgatcagcta cgaagaggac     2760
          cagcggcagg gcgctgaacc ccggaagaac ttcgtgaagc ccaatgagac caagacctac     2820
          ttctggaaag tgcagcacca catggccccc accaaggacg agttcgactg caaggcctgg     2880
          gcctacttca gcgacgtgga tctggaaaag gacgtgcact ctggactgat tggccctctg     2940
          ctggtgtgcc acaccaacac cctgaacccc gcccacggcc ggcaggtgac cgtgcaggaa     3000
          ttcgccctgt tcttcaccat cttcgacgag accaagtcct ggtacttcac cgagaatatg     3060
          gaacggaact gcagagcccc ctgcaacatc cagatggaag atcctacctt caaagagaac     3120
          taccggttcc acgccatcaa cggctacatc atggacaccc tgcctggcct ggtgatggcc     3180
          caggaccaga ggatccggtg gtatctgctg tccatgggca gcaacgagaa tatccacagc     3240
          atccacttca gcggccacgt gttcaccgtg aggaagaaag aagagtacaa gatggccctg     3300
          tacaacctgt accccggcgt gttcgagacc gtggagatgc tgcccagcaa ggccggcatc     3360
          tggcgggtgg agtgtctgat cggcgagcac ctgcatgccg ggatgagcac cctgtttctg     3420
          gtgtacagca acaagtgcca gacccccctg ggcatggcca gcggccacat ccgggacttc     3480
          cagatcaccg cctccggcca gtacggccag tgggccccca agctggcccg gctgcactac     3540
          agcggcagca tcaacgcctg gtccaccaaa gagcccttca gctggatcaa ggtggacctg     3600
          ctggccccta tgatcatcca cggcattaag acccagggcg ccaggcagaa gttcagcagc     3660
          ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac     3720
          cggggcaaca gcaccggcac cctgatggtg ttcttcggca acgtggacag cagcggcatc     3780
          aagcacaaca tcttcaaccc ccccatcatc gcccggtaca tccggctgca ccccacccac     3840
          tacagcatca gatccaccct gcggatggaa ctgatgggct gcgacctgaa ctcctgcagc     3900
          atgcctctgg gcatggaaag caaggccatc agcgacgccc agatcacagc cagcagctac     3960
          ttcaccaaca tgttcgccac ctggtccccc tccaaggcca ggctgcacct gcagggccgg     4020
          tccaacgcct ggcggcctca ggtgaacaac cccaaagaat ggctgcaggt ggactttcag     4080
          aaaaccatga aggtgaccgg cgtgaccacc cagggcgtga aaagcctgct gaccagcatg     4140
          tacgtgaaag agtttctgat cagcagcagc caggacggcc accagtggac cctgttcttt     4200
          cagaacggca aggtgaaagt gttccagggc aaccaggact ccttcacccc cgtggtgaac     4260
          tccctggacc cccccctgct gacccgctac ctgcggatcc acccccagtc ttgggtgcac     4320
          cagatcgccc tgaggatgga agtgctggga tgtgaggccc aggatctgta ctga           4374
          <![CDATA[<210> 19]]>
          <![CDATA[<211> 2351]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 智人]]>
          <![CDATA[<400> 19]]>
          Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe 
          1               5                   10                  15      
          Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser 
                      20                  25                  30          
          Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg 
                  35                  40                  45              
          Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val 
              50                  55                  60                  
          Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile 
          65                  70                  75                  80  
          Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln 
                          85                  90                  95      
          Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser 
                      100                 105                 110         
          His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser 
                  115                 120                 125             
          Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp 
              130                 135                 140                 
          Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu 
          145                 150                 155                 160 
          Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser 
                          165                 170                 175     
          Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile 
                      180                 185                 190         
          Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr 
                  195                 200                 205             
          Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly 
              210                 215                 220                 
          Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp 
          225                 230                 235                 240 
          Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr 
                          245                 250                 255     
          Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val 
                      260                 265                 270         
          Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile 
                  275                 280                 285             
          Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser 
              290                 295                 300                 
          Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met 
          305                 310                 315                 320 
          Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His 
                          325                 330                 335     
          Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro 
                      340                 345                 350         
          Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp 
                  355                 360                 365             
          Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser 
              370                 375                 380                 
          Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr 
          385                 390                 395                 400 
          Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro 
                          405                 410                 415     
          Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn 
                      420                 425                 430         
          Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met 
                  435                 440                 445             
          Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu 
              450                 455                 460                 
          Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu 
          465                 470                 475                 480 
          Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro 
                          485                 490                 495     
          His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys 
                      500                 505                 510         
          Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe 
                  515                 520                 525             
          Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp 
              530                 535                 540                 
          Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg 
          545                 550                 555                 560 
          Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu 
                          565                 570                 575     
          Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val 
                      580                 585                 590         
          Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu 
                  595                 600                 605             
          Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp 
              610                 615                 620                 
          Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val 
          625                 630                 635                 640 
          Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp 
                          645                 650                 655     
          Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe 
                      660                 665                 670         
          Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr 
                  675                 680                 685             
          Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro 
              690                 695                 700                 
          Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly 
          705                 710                 715                 720 
          Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp 
                          725                 730                 735     
          Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys 
                      740                 745                 750         
          Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro 
                  755                 760                 765             
          Ser Thr Arg Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp 
              770                 775                 780                 
          Ile Glu Lys Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys 
          785                 790                 795                 800 
          Ile Gln Asn Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser 
                          805                 810                 815     
          Pro Thr Pro His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr 
                      820                 825                 830         
          Glu Thr Phe Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn 
                  835                 840                 845             
          Ser Leu Ser Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly 
              850                 855                 860                 
          Asp Met Val Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu 
          865                 870                 875                 880 
          Lys Leu Gly Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys 
                          885                 890                 895     
          Val Ser Ser Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn 
                      900                 905                 910         
          Leu Ala Ala Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met 
                  915                 920                 925             
          Pro Val His Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys 
              930                 935                 940                 
          Ser Ser Pro Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu 
          945                 950                 955                 960 
          Asn Asn Asp Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu 
                          965                 970                 975     
          Ser Ser Trp Gly Lys Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe 
                      980                 985                 990         
          Lys Gly Lys Arg Ala His Gly Pro  Ala Leu Leu Thr Lys  Asp Asn Ala 
                  995                 1000                 1005             
          Leu Phe  Lys Val Ser Ile Ser  Leu Leu Lys Thr Asn  Lys Thr Ser 
              1010                 1015                 1020             
          Asn Asn  Ser Ala Thr Asn Arg  Lys Thr His Ile Asp  Gly Pro Ser 
              1025                 1030                 1035             
          Leu Leu  Ile Glu Asn Ser Pro  Ser Val Trp Gln Asn  Ile Leu Glu 
              1040                 1045                 1050             
          Ser Asp  Thr Glu Phe Lys Lys  Val Thr Pro Leu Ile  His Asp Arg 
              1055                 1060                 1065             
          Met Leu  Met Asp Lys Asn Ala  Thr Ala Leu Arg Leu  Asn His Met 
              1070                 1075                 1080             
          Ser Asn  Lys Thr Thr Ser Ser  Lys Asn Met Glu Met  Val Gln Gln 
              1085                 1090                 1095             
          Lys Lys  Glu Gly Pro Ile Pro  Pro Asp Ala Gln Asn  Pro Asp Met 
              1100                 1105                 1110             
          Ser Phe  Phe Lys Met Leu Phe  Leu Pro Glu Ser Ala  Arg Trp Ile 
              1115                 1120                 1125             
          Gln Arg  Thr His Gly Lys Asn  Ser Leu Asn Ser Gly  Gln Gly Pro 
              1130                 1135                 1140             
          Ser Pro  Lys Gln Leu Val Ser  Leu Gly Pro Glu Lys  Ser Val Glu 
              1145                 1150                 1155             
          Gly Gln  Asn Phe Leu Ser Glu  Lys Asn Lys Val Val  Val Gly Lys 
              1160                 1165                 1170             
          Gly Glu  Phe Thr Lys Asp Val  Gly Leu Lys Glu Met  Val Phe Pro 
              1175                 1180                 1185             
          Ser Ser  Arg Asn Leu Phe Leu  Thr Asn Leu Asp Asn  Leu His Glu 
              1190                 1195                 1200             
          Asn Asn  Thr His Asn Gln Glu  Lys Lys Ile Gln Glu  Glu Ile Glu 
              1205                 1210                 1215             
          Lys Lys  Glu Thr Leu Ile Gln  Glu Asn Val Val Leu  Pro Gln Ile 
              1220                 1225                 1230             
          His Thr  Val Thr Gly Thr Lys  Asn Phe Met Lys Asn  Leu Phe Leu 
              1235                 1240                 1245             
          Leu Ser  Thr Arg Gln Asn Val  Glu Gly Ser Tyr Asp  Gly Ala Tyr 
              1250                 1255                 1260             
          Ala Pro  Val Leu Gln Asp Phe  Arg Ser Leu Asn Asp  Ser Thr Asn 
              1265                 1270                 1275             
          Arg Thr  Lys Lys His Thr Ala  His Phe Ser Lys Lys  Gly Glu Glu 
              1280                 1285                 1290             
          Glu Asn  Leu Glu Gly Leu Gly  Asn Gln Thr Lys Gln  Ile Val Glu 
              1295                 1300                 1305             
          Lys Tyr  Ala Cys Thr Thr Arg  Ile Ser Pro Asn Thr  Ser Gln Gln 
              1310                 1315                 1320             
          Asn Phe  Val Thr Gln Arg Ser  Lys Arg Ala Leu Lys  Gln Phe Arg 
              1325                 1330                 1335             
          Leu Pro  Leu Glu Glu Thr Glu  Leu Glu Lys Arg Ile  Ile Val Asp 
              1340                 1345                 1350             
          Asp Thr  Ser Thr Gln Trp Ser  Lys Asn Met Lys His  Leu Thr Pro 
              1355                 1360                 1365             
          Ser Thr  Leu Thr Gln Ile Asp  Tyr Asn Glu Lys Glu  Lys Gly Ala 
              1370                 1375                 1380             
          Ile Thr  Gln Ser Pro Leu Ser  Asp Cys Leu Thr Arg  Ser His Ser 
              1385                 1390                 1395             
          Ile Pro  Gln Ala Asn Arg Ser  Pro Leu Pro Ile Ala  Lys Val Ser 
              1400                 1405                 1410             
          Ser Phe  Pro Ser Ile Arg Pro  Ile Tyr Leu Thr Arg  Val Leu Phe 
              1415                 1420                 1425             
          Gln Asp  Asn Ser Ser His Leu  Pro Ala Ala Ser Tyr  Arg Lys Lys 
              1430                 1435                 1440             
          Asp Ser  Gly Val Gln Glu Ser  Ser His Phe Leu Gln  Gly Ala Lys 
              1445                 1450                 1455             
          Lys Asn  Asn Leu Ser Leu Ala  Ile Leu Thr Leu Glu  Met Thr Gly 
              1460                 1465                 1470             
          Asp Gln  Arg Glu Val Gly Ser  Leu Gly Thr Ser Ala  Thr Asn Ser 
              1475                 1480                 1485             
          Val Thr  Tyr Lys Lys Val Glu  Asn Thr Val Leu Pro  Lys Pro Asp 
              1490                 1495                 1500             
          Leu Pro  Lys Thr Ser Gly Lys  Val Glu Leu Leu Pro  Lys Val His 
              1505                 1510                 1515             
          Ile Tyr  Gln Lys Asp Leu Phe  Pro Thr Glu Thr Ser  Asn Gly Ser 
              1520                 1525                 1530             
          Pro Gly  His Leu Asp Leu Val  Glu Gly Ser Leu Leu  Gln Gly Thr 
              1535                 1540                 1545             
          Glu Gly  Ala Ile Lys Trp Asn  Glu Ala Asn Arg Pro  Gly Lys Val 
              1550                 1555                 1560             
          Pro Phe  Leu Arg Val Ala Thr  Glu Ser Ser Ala Lys  Thr Pro Ser 
              1565                 1570                 1575             
          Lys Leu  Leu Asp Pro Leu Ala  Trp Asp Asn His Tyr  Gly Thr Gln 
              1580                 1585                 1590             
          Ile Pro  Lys Glu Glu Trp Lys  Ser Gln Glu Lys Ser  Pro Glu Lys 
              1595                 1600                 1605             
          Thr Ala  Phe Lys Lys Lys Asp  Thr Ile Leu Ser Leu  Asn Ala Cys 
              1610                 1615                 1620             
          Glu Ser  Asn His Ala Ile Ala  Ala Ile Asn Glu Gly  Gln Asn Lys 
              1625                 1630                 1635             
          Pro Glu  Ile Glu Val Thr Trp  Ala Lys Gln Gly Arg  Thr Glu Arg 
              1640                 1645                 1650             
          Leu Cys  Ser Gln Asn Pro Pro  Val Leu Lys Arg His  Gln Arg Glu 
              1655                 1660                 1665             
          Ile Thr  Arg Thr Thr Leu Gln  Ser Asp Gln Glu Glu  Ile Asp Tyr 
              1670                 1675                 1680             
          Asp Asp  Thr Ile Ser Val Glu  Met Lys Lys Glu Asp  Phe Asp Ile 
              1685                 1690                 1695             
          Tyr Asp  Glu Asp Glu Asn Gln  Ser Pro Arg Ser Phe  Gln Lys Lys 
              1700                 1705                 1710             
          Thr Arg  His Tyr Phe Ile Ala  Ala Val Glu Arg Leu  Trp Asp Tyr 
              1715                 1720                 1725             
          Gly Met  Ser Ser Ser Pro His  Val Leu Arg Asn Arg  Ala Gln Ser 
              1730                 1735                 1740             
          Gly Ser  Val Pro Gln Phe Lys  Lys Val Val Phe Gln  Glu Phe Thr 
              1745                 1750                 1755             
          Asp Gly  Ser Phe Thr Gln Pro  Leu Tyr Arg Gly Glu  Leu Asn Glu 
              1760                 1765                 1770             
          His Leu  Gly Leu Leu Gly Pro  Tyr Ile Arg Ala Glu  Val Glu Asp 
              1775                 1780                 1785             
          Asn Ile  Met Val Thr Phe Arg  Asn Gln Ala Ser Arg  Pro Tyr Ser 
              1790                 1795                 1800             
          Phe Tyr  Ser Ser Leu Ile Ser  Tyr Glu Glu Asp Gln  Arg Gln Gly 
              1805                 1810                 1815             
          Ala Glu  Pro Arg Lys Asn Phe  Val Lys Pro Asn Glu  Thr Lys Thr 
              1820                 1825                 1830             
          Tyr Phe  Trp Lys Val Gln His  His Met Ala Pro Thr  Lys Asp Glu 
              1835                 1840                 1845             
          Phe Asp  Cys Lys Ala Trp Ala  Tyr Phe Ser Asp Val  Asp Leu Glu 
              1850                 1855                 1860             
          Lys Asp  Val His Ser Gly Leu  Ile Gly Pro Leu Leu  Val Cys His 
              1865                 1870                 1875             
          Thr Asn  Thr Leu Asn Pro Ala  His Gly Arg Gln Val  Thr Val Gln 
              1880                 1885                 1890             
          Glu Phe  Ala Leu Phe Phe Thr  Ile Phe Asp Glu Thr  Lys Ser Trp 
              1895                 1900                 1905             
          Tyr Phe  Thr Glu Asn Met Glu  Arg Asn Cys Arg Ala  Pro Cys Asn 
              1910                 1915                 1920             
          Ile Gln  Met Glu Asp Pro Thr  Phe Lys Glu Asn Tyr  Arg Phe His 
              1925                 1930                 1935             
          Ala Ile  Asn Gly Tyr Ile Met  Asp Thr Leu Pro Gly  Leu Val Met 
              1940                 1945                 1950             
          Ala Gln  Asp Gln Arg Ile Arg  Trp Tyr Leu Leu Ser  Met Gly Ser 
              1955                 1960                 1965             
          Asn Glu  Asn Ile His Ser Ile  His Phe Ser Gly His  Val Phe Thr 
              1970                 1975                 1980             
          Val Arg  Lys Lys Glu Glu Tyr  Lys Met Ala Leu Tyr  Asn Leu Tyr 
              1985                 1990                 1995             
          Pro Gly  Val Phe Glu Thr Val  Glu Met Leu Pro Ser  Lys Ala Gly 
              2000                 2005                 2010             
          Ile Trp  Arg Val Glu Cys Leu  Ile Gly Glu His Leu  His Ala Gly 
              2015                 2020                 2025             
          Met Ser  Thr Leu Phe Leu Val  Tyr Ser Asn Lys Cys  Gln Thr Pro 
              2030                 2035                 2040             
          Leu Gly  Met Ala Ser Gly His  Ile Arg Asp Phe Gln  Ile Thr Ala 
              2045                 2050                 2055             
          Ser Gly  Gln Tyr Gly Gln Trp  Ala Pro Lys Leu Ala  Arg Leu His 
              2060                 2065                 2070             
          Tyr Ser  Gly Ser Ile Asn Ala  Trp Ser Thr Lys Glu  Pro Phe Ser 
              2075                 2080                 2085             
          Trp Ile  Lys Val Asp Leu Leu  Ala Pro Met Ile Ile  His Gly Ile 
              2090                 2095                 2100             
          Lys Thr  Gln Gly Ala Arg Gln  Lys Phe Ser Ser Leu  Tyr Ile Ser 
              2105                 2110                 2115             
          Gln Phe  Ile Ile Met Tyr Ser  Leu Asp Gly Lys Lys  Trp Gln Thr 
              2120                 2125                 2130             
          Tyr Arg  Gly Asn Ser Thr Gly  Thr Leu Met Val Phe  Phe Gly Asn 
              2135                 2140                 2145             
          Val Asp  Ser Ser Gly Ile Lys  His Asn Ile Phe Asn  Pro Pro Ile 
              2150                 2155                 2160             
          Ile Ala  Arg Tyr Ile Arg Leu  His Pro Thr His Tyr  Ser Ile Arg 
              2165                 2170                 2175             
          Ser Thr  Leu Arg Met Glu Leu  Met Gly Cys Asp Leu  Asn Ser Cys 
              2180                 2185                 2190             
          Ser Met  Pro Leu Gly Met Glu  Ser Lys Ala Ile Ser  Asp Ala Gln 
              2195                 2200                 2205             
          Ile Thr  Ala Ser Ser Tyr Phe  Thr Asn Met Phe Ala  Thr Trp Ser 
              2210                 2215                 2220             
          Pro Ser  Lys Ala Arg Leu His  Leu Gln Gly Arg Ser  Asn Ala Trp 
              2225                 2230                 2235             
          Arg Pro  Gln Val Asn Asn Pro  Lys Glu Trp Leu Gln  Val Asp Phe 
              2240                 2245                 2250             
          Gln Lys  Thr Met Lys Val Thr  Gly Val Thr Thr Gln  Gly Val Lys 
              2255                 2260                 2265             
          Ser Leu  Leu Thr Ser Met Tyr  Val Lys Glu Phe Leu  Ile Ser Ser 
              2270                 2275                 2280             
          Ser Gln  Asp Gly His Gln Trp  Thr Leu Phe Phe Gln  Asn Gly Lys 
              2285                 2290                 2295             
          Val Lys  Val Phe Gln Gly Asn  Gln Asp Ser Phe Thr  Pro Val Val 
              2300                 2305                 2310             
          Asn Ser  Leu Asp Pro Pro Leu  Leu Thr Arg Tyr Leu  Arg Ile His 
              2315                 2320                 2325             
          Pro Gln  Ser Trp Val His Gln  Ile Ala Leu Arg Met  Glu Val Leu 
              2330                 2335                 2340             
          Gly Cys  Glu Ala Gln Asp Leu  Tyr 
              2345                 2350     
          <![CDATA[<210> 20]]>
          <![CDATA[<211> 4374]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成聚核苷酸]]>
          <![CDATA[<400> 20]]>
          atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc       60
          accaggagat actacctggg cgccgtggag ctgagctggg actacatgca gtctgacctg      120
          ggcgagctgc ctgtggacgc caggttcccc cccagagtgc ccaagagctt ccccttcaac      180
          acctcagtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc      240
          gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac      300
          gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg      360
          ggcgtgagct actggaaggc ctctgagggc gccgagtatg acgaccagac cagccagagg      420
          gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg      480
          aaggagaacg gccccatggc cagcgacccc ctgtgcctga cctacagcta cctgagccac      540
          gtggacctgg tgaaggacct gaactctggc ctgatcggcg ccctgctggt gtgcagggag      600
          ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg      660
          ttcgatgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggacagggat      720
          gccgcctctg ccagggcctg gcccaagatg cacaccgtga acggctacgt gaacaggagc      780
          ctgcccggcc tgatcggctg ccacaggaag tctgtgtact ggcacgtgat cggcatgggc      840
          accacccccg aggtgcacag catcttcctg gagggccaca ccttcctggt gaggaaccac      900
          aggcaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg      960
          gacctgggcc agttcctgct gttctgccac atcagcagcc accagcacga cggcatggag     1020
          gcctacgtga aggtggacag ctgccccgag gagccccagc tgaggatgaa gaacaacgag     1080
          gaggccgagg actatgatga tgacctgacc gactctgaga tggacgtggt gaggtttgat     1140
          gatgacaaca gccccagctt catccagatc aggtctgtgg ccaagaagca ccccaagacc     1200
          tgggtgcact acatcgccgc cgaggaggag gactgggact acgcccccct ggtgctggcc     1260
          cccgacgaca ggagctacaa gagccagtac ctgaacaacg gcccccagag gatcggcagg     1320
          aagtacaaga aggtcagatt catggcctac accgacgaga ccttcaagac cagggaggcc     1380
          atccagcacg agtctggcat cctgggcccc ctgctgtacg gcgaggtggg cgacaccctg     1440
          ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca cggcatcacc     1500
          gatgtgaggc ccctgtacag caggaggctg cccaagggcg tgaagcacct gaaggacttc     1560
          cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggatggcccc     1620
          accaagtctg accccaggtg cctgaccagg tactacagca gcttcgtgaa catggagagg     1680
          gacctggcct ctggcctgat cggccccctg ctgatctgct acaaggagag cgtggaccag     1740
          aggggcaacc agatcatgtc tgacaagagg aacgtgatcc tgttctctgt gttcgatgag     1800
          aacaggagct ggtatctgac cgagaacatc cagaggttcc tgcccaaccc cgccggcgtg     1860
          cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg     1920
          ttcgacagcc tgcagctgtc tgtgtgcctg cacgaggtgg cctactggta catcctgagc     1980
          atcggcgccc agaccgactt cctgtctgtg ttcttctctg gctacacctt caagcacaag     2040
          atggtgtacg aggacaccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc     2100
          atggagaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttcag gaacaggggc     2160
          atgaccgccc tgctgaaagt cagcagctgc gacaagaaca ccggcgacta ctacgaggac     2220
          agctacgagg acatcagcgc ctacctgctg agcaagaaca acgccatcga gcccaggagc     2280
          ttcagccaga acccccccgt gctgaagagg caccagaggg agatcaccag gaccaccctg     2340
          cagagcgacc aggaggagat cgactatgat gacaccatca gcgtggagat gaagaaggag     2400
          gacttcgaca tctacgacga ggacgagaac cagagcccca ggagcttcca gaagaagacc     2460
          aggcactact tcatcgccgc cgtggagagg ctgtgggact atggcatgag cagcagcccc     2520
          cacgtgctga ggaacagggc ccagagcggc agcgtgcccc agttcaagaa ggtggtgttc     2580
          caggagttca ccgacggcag cttcacccag cccctgtaca gaggcgagct gaacgagcac     2640
          ctgggcctgc tgggccccta catcagggcc gaggtggagg acaacatcat ggtgaccttc     2700
          aggaaccagg ccagcaggcc ctacagcttc tacagcagcc tgatcagcta cgaggaggac     2760
          cagaggcagg gcgccgagcc caggaagaac ttcgtgaagc ccaacgagac caagacctac     2820
          ttctggaagg tgcagcacca catggccccc accaaggacg agttcgactg caaggcctgg     2880
          gcctacttct ctgatgtgga cctggagaag gacgtgcaca gcggcctgat cggccccctg     2940
          ctggtgtgcc acaccaacac cctgaacccc gcccacggca ggcaggtgac cgtgcaggag     3000
          ttcgccctgt tcttcaccat cttcgacgag accaagagct ggtacttcac cgagaacatg     3060
          gagaggaact gcagggcccc ctgcaacatc cagatggagg accccacctt caaggagaac     3120
          tacaggttcc acgccatcaa cggctacatc atggacaccc tgcccggcct ggtgatggcc     3180
          caggaccaga ggatcaggtg gtatctgctg agcatgggca gcaacgagaa catccacagc     3240
          atccacttca gcggccacgt gttcaccgtg aggaagaagg aggagtacaa gatggccctg     3300
          tacaacctgt accccggcgt gttcgagacc gtggagatgc tgcccagcaa ggccggcatc     3360
          tggagggtgg agtgcctgat cggcgagcac ctgcacgccg gcatgagcac cctgttcctg     3420
          gtgtacagca acaagtgcca gacccccctg ggcatggcca gcggccacat cagggacttc     3480
          cagatcaccg cctctggcca gtacggccag tgggccccca agctggccag gctgcactac     3540
          agcggcagca tcaacgcctg gagcaccaag gagcccttca gctggatcaa ggtggacctg     3600
          ctggccccca tgatcatcca cggcatcaag acccagggcg ccaggcagaa gttcagcagc     3660
          ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac     3720
          aggggcaaca gcaccggcac cctgatggtg ttcttcggca acgtggacag cagcggcatc     3780
          aagcacaaca tcttcaaccc ccccatcatc gccaggtaca tcaggctgca ccccacccac     3840
          tacagcatca ggagcaccct gcggatggaa ctgatgggct gcgacctgaa cagctgcagc     3900
          atgcccctgg gcatggagag caaggccatc tctgacgccc agatcaccgc cagcagctac     3960
          ttcaccaaca tgttcgccac ctggagcccc agcaaggcca ggctgcacct gcagggcagg     4020
          agcaacgcct ggaggcccca ggtgaacaac cccaaggagt ggctgcaggt ggacttccag     4080
          aagaccatga aggtgaccgg cgtgaccacc cagggcgtga agagcctgct gaccagcatg     4140
          tacgtgaagg agttcctgat cagcagcagc caggacggcc accagtggac cctgttcttc     4200
          cagaacggca aagtgaaggt gttccagggc aaccaggaca gcttcacccc cgtggtgaac     4260
          agcctggacc cccccctgct gaccaggtat ctgaggatcc acccccagag ctgggtgcac     4320
          cagatcgccc tgagaatgga agtgctggga tgcgaggccc aggacctgta ctga           4374
          <![CDATA[<210> 21]]>
          <![CDATA[<211> 1457]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成多肽]]>
          <![CDATA[<400> 21]]>
          Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe 
          1               5                   10                  15      
          Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser 
                      20                  25                  30          
          Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg 
                  35                  40                  45              
          Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val 
              50                  55                  60                  
          Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile 
          65                  70                  75                  80  
          Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln 
                          85                  90                  95      
          Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser 
                      100                 105                 110         
          His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser 
                  115                 120                 125             
          Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp 
              130                 135                 140                 
          Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu 
          145                 150                 155                 160 
          Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser 
                          165                 170                 175     
          Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile 
                      180                 185                 190         
          Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr 
                  195                 200                 205             
          Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly 
              210                 215                 220                 
          Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp 
          225                 230                 235                 240 
          Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr 
                          245                 250                 255     
          Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val 
                      260                 265                 270         
          Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile 
                  275                 280                 285             
          Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser 
              290                 295                 300                 
          Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met 
          305                 310                 315                 320 
          Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His 
                          325                 330                 335     
          Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro 
                      340                 345                 350         
          Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp 
                  355                 360                 365             
          Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser 
              370                 375                 380                 
          Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr 
          385                 390                 395                 400 
          Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro 
                          405                 410                 415     
          Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn 
                      420                 425                 430         
          Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met 
                  435                 440                 445             
          Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu 
              450                 455                 460                 
          Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu 
          465                 470                 475                 480 
          Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro 
                          485                 490                 495     
          His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys 
                      500                 505                 510         
          Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe 
                  515                 520                 525             
          Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp 
              530                 535                 540                 
          Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg 
          545                 550                 555                 560 
          Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu 
                          565                 570                 575     
          Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val 
                      580                 585                 590         
          Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu 
                  595                 600                 605             
          Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp 
              610                 615                 620                 
          Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val 
          625                 630                 635                 640 
          Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp 
                          645                 650                 655     
          Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe 
                      660                 665                 670         
          Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr 
                  675                 680                 685             
          Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro 
              690                 695                 700                 
          Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly 
          705                 710                 715                 720 
          Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp 
                          725                 730                 735     
          Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys 
                      740                 745                 750         
          Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu 
                  755                 760                 765             
          Lys Arg His Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln 
              770                 775                 780                 
          Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu 
          785                 790                 795                 800 
          Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe 
                          805                 810                 815     
          Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp 
                      820                 825                 830         
          Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln 
                  835                 840                 845             
          Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr 
              850                 855                 860                 
          Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His 
          865                 870                 875                 880 
          Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile 
                          885                 890                 895     
          Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser 
                      900                 905                 910         
          Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg 
                  915                 920                 925             
          Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val 
              930                 935                 940                 
          Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp 
          945                 950                 955                 960 
          Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu 
                          965                 970                 975     
          Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His 
                      980                 985                 990         
          Gly Arg Gln Val Thr Val Gln Glu  Phe Ala Leu Phe Phe  Thr Ile Phe 
                  995                 1000                 1005             
          Asp Glu  Thr Lys Ser Trp Tyr  Phe Thr Glu Asn Met  Glu Arg Asn 
              1010                 1015                 1020             
          Cys Arg  Ala Pro Cys Asn Ile  Gln Met Glu Asp Pro  Thr Phe Lys 
              1025                 1030                 1035             
          Glu Asn  Tyr Arg Phe His Ala  Ile Asn Gly Tyr Ile  Met Asp Thr 
              1040                 1045                 1050             
          Leu Pro  Gly Leu Val Met Ala  Gln Asp Gln Arg Ile  Arg Trp Tyr 
              1055                 1060                 1065             
          Leu Leu  Ser Met Gly Ser Asn  Glu Asn Ile His Ser  Ile His Phe 
              1070                 1075                 1080             
          Ser Gly  His Val Phe Thr Val  Arg Lys Lys Glu Glu  Tyr Lys Met 
              1085                 1090                 1095             
          Ala Leu  Tyr Asn Leu Tyr Pro  Gly Val Phe Glu Thr  Val Glu Met 
              1100                 1105                 1110             
          Leu Pro  Ser Lys Ala Gly Ile  Trp Arg Val Glu Cys  Leu Ile Gly 
              1115                 1120                 1125             
          Glu His  Leu His Ala Gly Met  Ser Thr Leu Phe Leu  Val Tyr Ser 
              1130                 1135                 1140             
          Asn Lys  Cys Gln Thr Pro Leu  Gly Met Ala Ser Gly  His Ile Arg 
              1145                 1150                 1155             
          Asp Phe  Gln Ile Thr Ala Ser  Gly Gln Tyr Gly Gln  Trp Ala Pro 
              1160                 1165                 1170             
          Lys Leu  Ala Arg Leu His Tyr  Ser Gly Ser Ile Asn  Ala Trp Ser 
              1175                 1180                 1185             
          Thr Lys  Glu Pro Phe Ser Trp  Ile Lys Val Asp Leu  Leu Ala Pro 
              1190                 1195                 1200             
          Met Ile  Ile His Gly Ile Lys  Thr Gln Gly Ala Arg  Gln Lys Phe 
              1205                 1210                 1215             
          Ser Ser  Leu Tyr Ile Ser Gln  Phe Ile Ile Met Tyr  Ser Leu Asp 
              1220                 1225                 1230             
          Gly Lys  Lys Trp Gln Thr Tyr  Arg Gly Asn Ser Thr  Gly Thr Leu 
              1235                 1240                 1245             
          Met Val  Phe Phe Gly Asn Val  Asp Ser Ser Gly Ile  Lys His Asn 
              1250                 1255                 1260             
          Ile Phe  Asn Pro Pro Ile Ile  Ala Arg Tyr Ile Arg  Leu His Pro 
              1265                 1270                 1275             
          Thr His  Tyr Ser Ile Arg Ser  Thr Leu Arg Met Glu  Leu Met Gly 
              1280                 1285                 1290             
          Cys Asp  Leu Asn Ser Cys Ser  Met Pro Leu Gly Met  Glu Ser Lys 
              1295                 1300                 1305             
          Ala Ile  Ser Asp Ala Gln Ile  Thr Ala Ser Ser Tyr  Phe Thr Asn 
              1310                 1315                 1320             
          Met Phe  Ala Thr Trp Ser Pro  Ser Lys Ala Arg Leu  His Leu Gln 
              1325                 1330                 1335             
          Gly Arg  Ser Asn Ala Trp Arg  Pro Gln Val Asn Asn  Pro Lys Glu 
              1340                 1345                 1350             
          Trp Leu  Gln Val Asp Phe Gln  Lys Thr Met Lys Val  Thr Gly Val 
              1355                 1360                 1365             
          Thr Thr  Gln Gly Val Lys Ser  Leu Leu Thr Ser Met  Tyr Val Lys 
              1370                 1375                 1380             
          Glu Phe  Leu Ile Ser Ser Ser  Gln Asp Gly His Gln  Trp Thr Leu 
              1385                 1390                 1395             
          Phe Phe  Gln Asn Gly Lys Val  Lys Val Phe Gln Gly  Asn Gln Asp 
              1400                 1405                 1410             
          Ser Phe  Thr Pro Val Val Asn  Ser Leu Asp Pro Pro  Leu Leu Thr 
              1415                 1420                 1425             
          Arg Tyr  Leu Arg Ile His Pro  Gln Ser Trp Val His  Gln Ile Ala 
              1430                 1435                 1440             
          Leu Arg  Met Glu Val Leu Gly  Cys Glu Ala Gln Asp  Leu Tyr 
              1445                 1450                 1455         
          <![CDATA[<210> 22]]>
          <![CDATA[<211> 2220]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成聚核苷酸]]>
          <![CDATA[<400> 22]]>
          gccaccagga gatactacct gggcgccgtg gagctgagct gggactacat gcagtctgac       60
          ctgggcgagc tgcctgtgga cgccaggttc ccccccagag tgcccaagag cttccccttc      120
          aacacctcag tggtgtacaa gaagaccctg ttcgtggagt tcaccgacca cctgttcaac      180
          atcgccaagc ccaggccccc ctggatgggc ctgctgggcc ccaccatcca ggccgaggtg      240
          tacgacaccg tggtgatcac cctgaagaac atggccagcc accccgtgag cctgcacgcc      300
          gtgggcgtga gctactggaa ggcctctgag ggcgccgagt atgacgacca gaccagccag      360
          agggagaagg aggacgacaa ggtgttcccc ggcggcagcc acacctacgt gtggcaggtg      420
          ctgaaggaga acggccccat ggccagcgac cccctgtgcc tgacctacag ctacctgagc      480
          cacgtggacc tggtgaagga cctgaactct ggcctgatcg gcgccctgct ggtgtgcagg      540
          gagggcagcc tggccaagga gaagacccag accctgcaca agttcatcct gctgttcgcc      600
          gtgttcgatg agggcaagag ctggcacagc gagaccaaga acagcctgat gcaggacagg      660
          gatgccgcct ctgccagggc ctggcccaag atgcacaccg tgaacggcta cgtgaacagg      720
          agcctgcccg gcctgatcgg ctgccacagg aagtctgtgt actggcacgt gatcggcatg      780
          ggcaccaccc ccgaggtgca cagcatcttc ctggagggcc acaccttcct ggtgaggaac      840
          cacaggcagg ccagcctgga gatcagcccc atcaccttcc tgaccgccca gaccctgctg      900
          atggacctgg gccagttcct gctgttctgc cacatcagca gccaccagca cgacggcatg      960
          gaggcctacg tgaaggtgga cagctgcccc gaggagcccc agctgaggat gaagaacaac     1020
          gaggaggccg aggactatga tgatgacctg accgactctg agatggacgt ggtgaggttt     1080
          gatgatgaca acagccccag cttcatccag atcaggtctg tggccaagaa gcaccccaag     1140
          acctgggtgc actacatcgc cgccgaggag gaggactggg actacgcccc cctggtgctg     1200
          gcccccgacg acaggagcta caagagccag tacctgaaca acggccccca gaggatcggc     1260
          aggaagtaca agaaggtcag attcatggcc tacaccgacg agaccttcaa gaccagggag     1320
          gccatccagc acgagtctgg catcctgggc cccctgctgt acggcgaggt gggcgacacc     1380
          ctgctgatca tcttcaagaa ccaggccagc aggccctaca acatctaccc ccacggcatc     1440
          accgatgtga ggcccctgta cagcaggagg ctgcccaagg gcgtgaagca cctgaaggac     1500
          ttccccatcc tgcccggcga gatcttcaag tacaagtgga ccgtgaccgt ggaggatggc     1560
          cccaccaagt ctgaccccag gtgcctgacc aggtactaca gcagcttcgt gaacatggag     1620
          agggacctgg cctctggcct gatcggcccc ctgctgatct gctacaagga gagcgtggac     1680
          cagaggggca accagatcat gtctgacaag aggaacgtga tcctgttctc tgtgttcgat     1740
          gagaacagga gctggtatct gaccgagaac atccagaggt tcctgcccaa ccccgccggc     1800
          gtgcagctgg aggaccccga gttccaggcc agcaacatca tgcacagcat caacggctac     1860
          gtgttcgaca gcctgcagct gtctgtgtgc ctgcacgagg tggcctactg gtacatcctg     1920
          agcatcggcg cccagaccga cttcctgtct gtgttcttct ctggctacac cttcaagcac     1980
          aagatggtgt acgaggacac cctgaccctg ttccccttca gcggcgagac cgtgttcatg     2040
          agcatggaga accccggcct gtggatcctg ggctgccaca acagcgactt caggaacagg     2100
          ggcatgaccg ccctgctgaa agtcagcagc tgcgacaaga acaccggcga ctactacgag     2160
          gacagctacg aggacatcag cgcctacctg ctgagcaaga acaacgccat cgagcccagg     2220
          <![CDATA[<210> 23]]>
          <![CDATA[<211> 2052]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成聚核苷酸]]>
          <![CDATA[<400> 23]]>
          gagatcacca ggaccaccct gcagagcgac caggaggaga tcgactatga tgacaccatc       60
          agcgtggaga tgaagaagga ggacttcgac atctacgacg aggacgagaa ccagagcccc      120
          aggagcttcc agaagaagac caggcactac ttcatcgccg ccgtggagag gctgtgggac      180
          tatggcatga gcagcagccc ccacgtgctg aggaacaggg cccagagcgg cagcgtgccc      240
          cagttcaaga aggtggtgtt ccaggagttc accgacggca gcttcaccca gcccctgtac      300
          agaggcgagc tgaacgagca cctgggcctg ctgggcccct acatcagggc cgaggtggag      360
          gacaacatca tggtgacctt caggaaccag gccagcaggc cctacagctt ctacagcagc      420
          ctgatcagct acgaggagga ccagaggcag ggcgccgagc ccaggaagaa cttcgtgaag      480
          cccaacgaga ccaagaccta cttctggaag gtgcagcacc acatggcccc caccaaggac      540
          gagttcgact gcaaggcctg ggcctacttc tctgatgtgg acctggagaa ggacgtgcac      600
          agcggcctga tcggccccct gctggtgtgc cacaccaaca ccctgaaccc cgcccacggc      660
          aggcaggtga ccgtgcagga gttcgccctg ttcttcacca tcttcgacga gaccaagagc      720
          tggtacttca ccgagaacat ggagaggaac tgcagggccc cctgcaacat ccagatggag      780
          gaccccacct tcaaggagaa ctacaggttc cacgccatca acggctacat catggacacc      840
          ctgcccggcc tggtgatggc ccaggaccag aggatcaggt ggtatctgct gagcatgggc      900
          agcaacgaga acatccacag catccacttc agcggccacg tgttcaccgt gaggaagaag      960
          gaggagtaca agatggccct gtacaacctg taccccggcg tgttcgagac cgtggagatg     1020
          ctgcccagca aggccggcat ctggagggtg gagtgcctga tcggcgagca cctgcacgcc     1080
          ggcatgagca ccctgttcct ggtgtacagc aacaagtgcc agacccccct gggcatggcc     1140
          agcggccaca tcagggactt ccagatcacc gcctctggcc agtacggcca gtgggccccc     1200
          aagctggcca ggctgcacta cagcggcagc atcaacgcct ggagcaccaa ggagcccttc     1260
          agctggatca aggtggacct gctggccccc atgatcatcc acggcatcaa gacccagggc     1320
          gccaggcaga agttcagcag cctgtacatc agccagttca tcatcatgta cagcctggac     1380
          ggcaagaagt ggcagaccta caggggcaac agcaccggca ccctgatggt gttcttcggc     1440
          aacgtggaca gcagcggcat caagcacaac atcttcaacc cccccatcat cgccaggtac     1500
          atcaggctgc accccaccca ctacagcatc aggagcaccc tgcggatgga actgatgggc     1560
          tgcgacctga acagctgcag catgcccctg ggcatggaga gcaaggccat ctctgacgcc     1620
          cagatcaccg ccagcagcta cttcaccaac atgttcgcca cctggagccc cagcaaggcc     1680
          aggctgcacc tgcagggcag gagcaacgcc tggaggcccc aggtgaacaa ccccaaggag     1740
          tggctgcagg tggacttcca gaagaccatg aaggtgaccg gcgtgaccac ccagggcgtg     1800
          aagagcctgc tgaccagcat gtacgtgaag gagttcctga tcagcagcag ccaggacggc     1860
          caccagtgga ccctgttctt ccagaacggc aaagtgaagg tgttccaggg caaccaggac     1920
          agcttcaccc ccgtggtgaa cagcctggac ccccccctgc tgaccaggta tctgaggatc     1980
          cacccccaga gctgggtgca ccagatcgcc ctgagaatgg aagtgctggg atgcgaggcc     2040
          caggacctgt ac                                                         2052
          <![CDATA[<210> 24]]>
          <![CDATA[<211> 2220]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成聚核苷酸]]>
          <![CDATA[<400> 24]]>
          gccaccagga gatactacct gggggctgtg gaactttctt gggactacat gcagtctgac       60
          ctgggagagc tgcctgtgga tgccaggttc ccacccagag tgcccaagtc cttcccattc      120
          aacacctctg tggtctacaa gaagacactc tttgtggaat tcactgacca cctgttcaac      180
          attgcaaaac ccagaccacc ctggatggga ctcctgggac ccaccattca ggctgaggtg      240
          tatgacactg tggtcatcac cctcaagaac atggcatccc accctgtgtc tctgcatgct      300
          gtgggagtct catactggaa agcctctgaa ggggctgagt atgatgacca gacatcccag      360
          agagagaaag aggatgacaa ggtgttccct gggggatctc acacctatgt gtggcaagtc      420
          ctcaaggaga atggacccat ggcatctgac ccactctgcc tgacatactc ctacctttct      480
          catgtggacc tggtcaagga cctcaactct ggactgattg gggcactgct ggtgtgcagg      540
          gaaggatccc tggccaagga gaaaacccag acactgcaca agttcattct cctgtttgct      600
          gtctttgatg agggcaagtc ttggcactct gaaacaaaga actccctgat gcaagacagg      660
          gatgctgcct ctgccagggc atggcccaag atgcacactg tgaatggcta tgtgaacaga      720
          tcactgcctg gactcattgg ctgccacagg aaatctgtct actggcatgt gattggcatg      780
          gggacaaccc ctgaagtgca ctccattttc ctggagggac acaccttcct ggtcaggaac      840
          cacagacaag cctctctgga gatctctccc atcaccttcc tcactgcaca gacactgctg      900
          atggaccttg gacagttcct gctgttctgc cacatctctt cccaccagca tgatggcatg      960
          gaagcctatg tcaaggtgga ctcatgccct gaggaaccac agctcaggat gaagaacaat     1020
          gaggaggctg aggactatga tgatgacctg actgactctg agatggatgt ggtcagattt     1080
          gatgatgaca actctccatc cttcattcag atcaggtctg tggcaaagaa acaccccaag     1140
          acatgggtgc actacattgc tgctgaggaa gaggactggg actatgcacc actggtcctg     1200
          gcccctgatg acaggagcta caagtctcag tacctcaaca atggcccaca aagaattgga     1260
          agaaagtaca agaaagtcag attcatggcc tacactgatg aaaccttcaa gacaagagaa     1320
          gccattcagc atgagtctgg cattctggga ccactcctgt atggggaagt gggagacacc     1380
          ctgctcatca tcttcaagaa ccaggcctcc aggccctaca acatctaccc acatggcatc     1440
          actgatgtca ggcccctgta cagcaggaga ctgccaaaag gggtgaaaca cctcaaggac     1500
          ttccccattc tgcctggaga gatcttcaag tacaagtgga ctgtcactgt ggaggatgga     1560
          ccaacaaagt ctgaccccag gtgcctcacc agatactact cctcttttgt gaacatggag     1620
          agagacctgg catctggact gattggacca ctgctcatct gctacaagga gtctgtggac     1680
          cagagaggca accagatcat gtctgacaag agaaatgtga ttctgttctc tgtctttgat     1740
          gagaacagat catggtacct gactgagaac attcagagat tcctgcccaa ccctgctggg     1800
          gtgcaactgg aagaccctga gttccaggca agcaacatca tgcactccat caatggctat     1860
          gtgtttgact ctctccagct ttctgtctgc ctgcatgagg tggcctactg gtacattctt     1920
          tctattgggg cacaaactga cttcctttct gtcttcttct ctggatacac cttcaagcac     1980
          aagatggtgt atgaggacac cctgacactc ttcccattct ctggggaaac tgtgttcatg     2040
          agcatggaga accctggact gtggattctg ggatgccaca actctgactt cagaaacagg     2100
          ggaatgactg cactgctcaa agtctcctcc tgtgacaaga acactgggga ctactatgag     2160
          gactcttatg aggacatctc tgcctacctg ctcagcaaga acaatgccat tgagcccaga     2220
          <![CDATA[<210> 25]]>
          <![CDATA[<211> 2052]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成聚核苷酸]]>
          <![CDATA[<400> 25]]>
          gagatcacca ggacaaccct ccagtctgac caggaagaga ttgactatga tgacaccatt       60
          tctgtggaga tgaagaagga ggactttgac atctatgatg aggacgagaa ccagtctcca      120
          agatcattcc agaagaagac aagacactac ttcattgctg ctgtggaaag actgtgggac      180
          tatggcatgt cttcctctcc ccatgtcctc aggaacaggg cacagtctgg ctctgtgcca      240
          cagttcaaga aagtggtctt ccaggagttc actgatggct cattcaccca gcccctgtac      300
          agaggggaac tgaatgagca cctgggactc ctgggaccat acatcagggc tgaggtggaa      360
          gacaacatca tggtgacatt cagaaaccag gcctccaggc cctacagctt ctactcttcc      420
          ctcatcagct atgaggaaga ccagagacaa ggggctgagc caagaaagaa ctttgtgaaa      480
          cccaatgaaa ccaagaccta cttctggaaa gtccagcacc acatggcacc caccaaggat      540
          gagtttgact gcaaggcctg ggcatacttc tctgatgtgg acctggagaa agatgtgcac      600
          tctggcctga ttggcccact cctggtctgc cacaccaaca ccctgaaccc tgcacatgga      660
          aggcaagtga ctgtgcagga gtttgccctc ttcttcacca tctttgatga aaccaagtca      720
          tggtacttca ctgagaacat ggagagaaac tgcagagcac catgcaacat tcagatggaa      780
          gaccccacct tcaaggagaa ctacaggttc catgccatca atggctacat catggacacc      840
          ctgcctgggc ttgtcatggc acaggaccag agaatcagat ggtacctgct ttctatggga      900
          tccaatgaga acattcactc catccacttc tctgggcatg tcttcactgt gagaaagaag      960
          gaggaataca agatggccct gtacaacctc taccctgggg tctttgagac tgtggagatg     1020
          ctgccctcca aagctggcat ctggagggtg gaatgcctca ttggggagca cctgcatgct     1080
          ggcatgtcaa ccctgttcct ggtctacagc aacaagtgcc agacacccct gggaatggcc     1140
          tctggccaca tcagggactt ccagatcact gcctctggcc agtatggcca gtgggcaccc     1200
          aaactggcca ggctccacta ctctggctcc atcaatgcat ggtcaaccaa ggagccattc     1260
          tcttggatca aggtggacct gctggcaccc atgatcattc atggcatcaa gacacagggg     1320
          gcaagacaga aattctcctc tctgtacatc tcacagttca tcatcatgta ctctctggat     1380
          ggcaagaagt ggcagacata cagaggcaac tccactggca ccctcatggt cttctttggc     1440
          aatgtggaca gctctggcat caagcacaac atcttcaacc ctcccatcat tgccagatac     1500
          atcaggctgc accccaccca ctactcaatc agatcaaccc tcaggatgga actgatggga     1560
          tgtgacctga actcctgctc aatgcccctg ggaatggaga gcaaggccat ttctgatgcc     1620
          cagatcactg catcctctta cttcaccaac atgtttgcca cctggtcacc atcaaaagcc     1680
          aggctgcacc tccagggaag aagcaatgcc tggagacccc aggtcaacaa cccaaaggaa     1740
          tggctgcaag tggacttcca gaagacaatg aaagtcactg gggtgacaac ccagggggtc     1800
          aagtctctgc tcacctcaat gtatgtgaag gagttcctga tctcttcctc acaggatggc     1860
          caccagtgga cactcttctt ccagaatggc aaagtcaagg tgttccaggg caaccaggac     1920
          tctttcacac ctgtggtgaa ctcactggac ccccccctcc tgacaagata cctgagaatt     1980
          cacccccagt cttgggtcca ccagattgcc ctgagaatgg aagtcctggg atgtgaggca     2040
          caagacctgt ac                                                         2052
          <![CDATA[<210> 26]]>
          <![CDATA[<211> 4332]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成聚核苷酸]]>
          <![CDATA[<400> 26]]>
          atgcagattg agctgtccac ctgcttcttt ctgtgcctgc tgagattctg cttctctgcc       60
          accaggagat actacctggg ggctgtggaa ctttcttggg actacatgca gtctgacctg      120
          ggagagctgc ctgtggatgc caggttccca cccagagtgc ccaagtcctt cccattcaac      180
          acctctgtgg tctacaagaa gacactcttt gtggaattca ctgaccacct gttcaacatt      240
          gcaaaaccca gaccaccctg gatgggactc ctgggaccca ccattcaggc tgaggtgtat      300
          gacactgtgg tcatcaccct caagaacatg gcatcccacc ctgtgtctct gcatgctgtg      360
          ggagtctcat actggaaagc ctctgaaggg gctgagtatg atgaccagac atcccagaga      420
          gagaaagagg atgacaaggt gttccctggg ggatctcaca cctatgtgtg gcaagtcctc      480
          aaggagaatg gacccatggc atctgaccca ctctgcctga catactccta cctttctcat      540
          gtggacctgg tcaaggacct caactctgga ctgattgggg cactgctggt gtgcagggaa      600
          ggatccctgg ccaaggagaa aacccagaca ctgcacaagt tcattctcct gtttgctgtc      660
          tttgatgagg gcaagtcttg gcactctgaa acaaagaact ccctgatgca agacagggat      720
          gctgcctctg ccagggcatg gcccaagatg cacactgtga atggctatgt gaacagatca      780
          ctgcctggac tcattggctg ccacaggaaa tctgtctact ggcatgtgat tggcatgggg      840
          acaacccctg aagtgcactc cattttcctg gagggacaca ccttcctggt caggaaccac      900
          agacaagcct ctctggagat ctctcccatc accttcctca ctgcacagac actgctgatg      960
          gaccttggac agttcctgct gttctgccac atctcttccc accagcatga tggcatggaa     1020
          gcctatgtca aggtggactc atgccctgag gaaccacagc tcaggatgaa gaacaatgag     1080
          gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt cagatttgat     1140
          gatgacaact ctccatcctt cattcagatc aggtctgtgg caaagaaaca ccccaagaca     1200
          tgggtgcact acattgctgc tgaggaagag gactgggact atgcaccact ggtcctggcc     1260
          cctgatgaca ggagctacaa gtctcagtac ctcaacaatg gcccacaaag aattggaaga     1320
          aagtacaaga aagtcagatt catggcctac actgatgaaa ccttcaagac aagagaagcc     1380
          attcagcatg agtctggcat tctgggacca ctcctgtatg gggaagtggg agacaccctg     1440
          ctcatcatct tcaagaacca ggcctccagg ccctacaaca tctacccaca tggcatcact     1500
          gatgtcaggc ccctgtacag caggagactg ccaaaagggg tgaaacacct caaggacttc     1560
          cccattctgc ctggagagat cttcaagtac aagtggactg tcactgtgga ggatggacca     1620
          acaaagtctg accccaggtg cctcaccaga tactactcct cttttgtgaa catggagaga     1680
          gacctggcat ctggactgat tggaccactg ctcatctgct acaaggagtc tgtggaccag     1740
          agaggcaacc agatcatgtc tgacaagaga aatgtgattc tgttctctgt ctttgatgag     1800
          aacagatcat ggtacctgac tgagaacatt cagagattcc tgcccaaccc tgctggggtg     1860
          caactggaag accctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg     1920
          tttgactctc tccagctttc tgtctgcctg catgaggtgg cctactggta cattctttct     1980
          attggggcac aaactgactt cctttctgtc ttcttctctg gatacacctt caagcacaag     2040
          atggtgtatg aggacaccct gacactcttc ccattctctg gggaaactgt gttcatgagc     2100
          atggagaacc ctggactgtg gattctggga tgccacaact ctgacttcag aaacagggga     2160
          atgactgcac tgctcaaagt ctcctcctgt gacaagaaca ctggggacta ctatgaggac     2220
          tcttatgagg acatctctgc ctacctgctc agcaagaaca atgccattga gcccagagag     2280
          atcaccagga caaccctcca gtctgaccag gaagagattg actatgatga caccatttct     2340
          gtggagatga agaaggagga ctttgacatc tatgatgagg acgagaacca gtctccaaga     2400
          tcattccaga agaagacaag acactacttc attgctgctg tggaaagact gtgggactat     2460
          ggcatgtctt cctctcccca tgtcctcagg aacagggcac agtctggctc tgtgccacag     2520
          ttcaagaaag tggtcttcca ggagttcact gatggctcat tcacccagcc cctgtacaga     2580
          ggggaactga atgagcacct gggactcctg ggaccataca tcagggctga ggtggaagac     2640
          aacatcatgg tgacattcag aaaccaggcc tccaggccct acagcttcta ctcttccctc     2700
          atcagctatg aggaagacca gagacaaggg gctgagccaa gaaagaactt tgtgaaaccc     2760
          aatgaaacca agacctactt ctggaaagtc cagcaccaca tggcacccac caaggatgag     2820
          tttgactgca aggcctgggc atacttctct gatgtggacc tggagaaaga tgtgcactct     2880
          ggcctgattg gcccactcct ggtctgccac accaacaccc tgaaccctgc acatggaagg     2940
          caagtgactg tgcaggagtt tgccctcttc ttcaccatct ttgatgaaac caagtcatgg     3000
          tacttcactg agaacatgga gagaaactgc agagcaccat gcaacattca gatggaagac     3060
          cccaccttca aggagaacta caggttccat gccatcaatg gctacatcat ggacaccctg     3120
          cctgggcttg tcatggcaca ggaccagaga atcagatggt acctgctttc tatgggatcc     3180
          aatgagaaca ttcactccat ccacttctct gggcatgtct tcactgtgag aaagaaggag     3240
          gaatacaaga tggccctgta caacctctac cctggggtct ttgagactgt ggagatgctg     3300
          ccctccaaag ctggcatctg gagggtggaa tgcctcattg gggagcacct gcatgctggc     3360
          atgtcaaccc tgttcctggt ctacagcaac aagtgccaga cacccctggg aatggcctct     3420
          ggccacatca gggacttcca gatcactgcc tctggccagt atggccagtg ggcacccaaa     3480
          ctggccaggc tccactactc tggctccatc aatgcatggt caaccaagga gccattctct     3540
          tggatcaagg tggacctgct ggcacccatg atcattcatg gcatcaagac acagggggca     3600
          agacagaaat tctcctctct gtacatctca cagttcatca tcatgtactc tctggatggc     3660
          aagaagtggc agacatacag aggcaactcc actggcaccc tcatggtctt ctttggcaat     3720
          gtggacagct ctggcatcaa gcacaacatc ttcaaccctc ccatcattgc cagatacatc     3780
          aggctgcacc ccacccacta ctcaatcaga tcaaccctca ggatggaact gatgggatgt     3840
          gacctgaact cctgctcaat gcccctggga atggagagca aggccatttc tgatgcccag     3900
          atcactgcat cctcttactt caccaacatg tttgccacct ggtcaccatc aaaagccagg     3960
          ctgcacctcc agggaagaag caatgcctgg agaccccagg tcaacaaccc aaaggaatgg     4020
          ctgcaagtgg acttccagaa gacaatgaaa gtcactgggg tgacaaccca gggggtcaag     4080
          tctctgctca cctcaatgta tgtgaaggag ttcctgatct cttcctcaca ggatggccac     4140
          cagtggacac tcttcttcca gaatggcaaa gtcaaggtgt tccagggcaa ccaggactct     4200
          ttcacacctg tggtgaactc actggacccc cccctcctga caagatacct gagaattcac     4260
          ccccagtctt gggtccacca gattgccctg agaatggaag tcctgggatg tgaggcacaa     4320
          gacctgtact ga                                                         4332
          <![CDATA[<210> 27]]>
          <![CDATA[<211> 4368]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成聚核苷酸]]>
          <![CDATA[<400> 27]]>
          atgcagattg agctgtccac ctgcttcttt ctgtgcctgc tgagattctg cttctctgcc       60
          accaggagat actacctggg ggctgtggaa ctttcttggg actacatgca gtctgacctg      120
          ggagagctgc ctgtggatgc caggttccca cccagagtgc ccaagtcctt cccattcaac      180
          acctctgtgg tctacaagaa gacactcttt gtggaattca ctgaccacct gttcaacatt      240
          gcaaaaccca gaccaccctg gatgggactc ctgggaccca ccattcaggc tgaggtgtat      300
          gacactgtgg tcatcaccct caagaacatg gcatcccacc ctgtgtctct gcatgctgtg      360
          ggagtctcat actggaaagc ctctgaaggg gctgagtatg atgaccagac atcccagaga      420
          gagaaagagg atgacaaggt gttccctggg ggatctcaca cctatgtgtg gcaagtcctc      480
          aaggagaatg gacccatggc atctgaccca ctctgcctga catactccta cctttctcat      540
          gtggacctgg tcaaggacct caactctgga ctgattgggg cactgctggt gtgcagggaa      600
          ggatccctgg ccaaggagaa aacccagaca ctgcacaagt tcattctcct gtttgctgtc      660
          tttgatgagg gcaagtcttg gcactctgaa acaaagaact ccctgatgca agacagggat      720
          gctgcctctg ccagggcatg gcccaagatg cacactgtga atggctatgt gaacagatca      780
          ctgcctggac tcattggctg ccacaggaaa tctgtctact ggcatgtgat tggcatgggg      840
          acaacccctg aagtgcactc cattttcctg gagggacaca ccttcctggt caggaaccac      900
          agacaagcct ctctggagat ctctcccatc accttcctca ctgcacagac actgctgatg      960
          gaccttggac agttcctgct gttctgccac atctcttccc accagcatga tggcatggaa     1020
          gcctatgtca aggtggactc atgccctgag gaaccacagc tcaggatgaa gaacaatgag     1080
          gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt cagatttgat     1140
          gatgacaact ctccatcctt cattcagatc aggtctgtgg caaagaaaca ccccaagaca     1200
          tgggtgcact acattgctgc tgaggaagag gactgggact atgcaccact ggtcctggcc     1260
          cctgatgaca ggagctacaa gtctcagtac ctcaacaatg gcccacaaag aattggaaga     1320
          aagtacaaga aagtcagatt catggcctac actgatgaaa ccttcaagac aagagaagcc     1380
          attcagcatg agtctggcat tctgggacca ctcctgtatg gggaagtggg agacaccctg     1440
          ctcatcatct tcaagaacca ggcctccagg ccctacaaca tctacccaca tggcatcact     1500
          gatgtcaggc ccctgtacag caggagactg ccaaaagggg tgaaacacct caaggacttc     1560
          cccattctgc ctggagagat cttcaagtac aagtggactg tcactgtgga ggatggacca     1620
          acaaagtctg accccaggtg cctcaccaga tactactcct cttttgtgaa catggagaga     1680
          gacctggcat ctggactgat tggaccactg ctcatctgct acaaggagtc tgtggaccag     1740
          agaggcaacc agatcatgtc tgacaagaga aatgtgattc tgttctctgt ctttgatgag     1800
          aacagatcat ggtacctgac tgagaacatt cagagattcc tgcccaaccc tgctggggtg     1860
          caactggaag accctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg     1920
          tttgactctc tccagctttc tgtctgcctg catgaggtgg cctactggta cattctttct     1980
          attggggcac aaactgactt cctttctgtc ttcttctctg gatacacctt caagcacaag     2040
          atggtgtatg aggacaccct gacactcttc ccattctctg gggaaactgt gttcatgagc     2100
          atggagaacc ctggactgtg gattctggga tgccacaact ctgacttcag aaacagggga     2160
          atgactgcac tgctcaaagt ctcctcctgt gacaagaaca ctggggacta ctatgaggac     2220
          tcttatgagg acatctctgc ctacctgctc agcaagaaca atgccattga gcccagaagc     2280
          ttctctcaga attccagaca ccccagcacc agggagatca ccaggacaac cctccagtct     2340
          gaccaggaag agattgacta tgatgacacc atttctgtgg agatgaagaa ggaggacttt     2400
          gacatctatg atgaggacga gaaccagtct ccaagatcat tccagaagaa gacaagacac     2460
          tacttcattg ctgctgtgga aagactgtgg gactatggca tgtcttcctc tccccatgtc     2520
          ctcaggaaca gggcacagtc tggctctgtg ccacagttca agaaagtggt cttccaggag     2580
          ttcactgatg gctcattcac ccagcccctg tacagagggg aactgaatga gcacctggga     2640
          ctcctgggac catacatcag ggctgaggtg gaagacaaca tcatggtgac attcagaaac     2700
          caggcctcca ggccctacag cttctactct tccctcatca gctatgagga agaccagaga     2760
          caaggggctg agccaagaaa gaactttgtg aaacccaatg aaaccaagac ctacttctgg     2820
          aaagtccagc accacatggc acccaccaag gatgagtttg actgcaaggc ctgggcatac     2880
          ttctctgatg tggacctgga gaaagatgtg cactctggcc tgattggccc actcctggtc     2940
          tgccacacca acaccctgaa ccctgcacat ggaaggcaag tgactgtgca ggagtttgcc     3000
          ctcttcttca ccatctttga tgaaaccaag tcatggtact tcactgagaa catggagaga     3060
          aactgcagag caccatgcaa cattcagatg gaagacccca ccttcaagga gaactacagg     3120
          ttccatgcca tcaatggcta catcatggac accctgcctg ggcttgtcat ggcacaggac     3180
          cagagaatca gatggtacct gctttctatg ggatccaatg agaacattca ctccatccac     3240
          ttctctgggc atgtcttcac tgtgagaaag aaggaggaat acaagatggc cctgtacaac     3300
          ctctaccctg gggtctttga gactgtggag atgctgccct ccaaagctgg catctggagg     3360
          gtggaatgcc tcattgggga gcacctgcat gctggcatgt caaccctgtt cctggtctac     3420
          agcaacaagt gccagacacc cctgggaatg gcctctggcc acatcaggga cttccagatc     3480
          actgcctctg gccagtatgg ccagtgggca cccaaactgg ccaggctcca ctactctggc     3540
          tccatcaatg catggtcaac caaggagcca ttctcttgga tcaaggtgga cctgctggca     3600
          cccatgatca ttcatggcat caagacacag ggggcaagac agaaattctc ctctctgtac     3660
          atctcacagt tcatcatcat gtactctctg gatggcaaga agtggcagac atacagaggc     3720
          aactccactg gcaccctcat ggtcttcttt ggcaatgtgg acagctctgg catcaagcac     3780
          aacatcttca accctcccat cattgccaga tacatcaggc tgcaccccac ccactactca     3840
          atcagatcaa ccctcaggat ggaactgatg ggatgtgacc tgaactcctg ctcaatgccc     3900
          ctgggaatgg agagcaaggc catttctgat gcccagatca ctgcatcctc ttacttcacc     3960
          aacatgtttg ccacctggtc accatcaaaa gccaggctgc acctccaggg aagaagcaat     4020
          gcctggagac cccaggtcaa caacccaaag gaatggctgc aagtggactt ccagaagaca     4080
          atgaaagtca ctggggtgac aacccagggg gtcaagtctc tgctcacctc aatgtatgtg     4140
          aaggagttcc tgatctcttc ctcacaggat ggccaccagt ggacactctt cttccagaat     4200
          ggcaaagtca aggtgttcca gggcaaccag gactctttca cacctgtggt gaactcactg     4260
          gacccccccc tcctgacaag atacctgaga attcaccccc agtcttgggt ccaccagatt     4320
          gccctgagaa tggaagtcct gggatgtgag gcacaagacc tgtactga                  4368
          <![CDATA[<210> 28]]>
          <![CDATA[<211> 4332]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成聚核苷酸]]>
          <![CDATA[<400> 28]]>
          atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc       60
          accaggagat actacctggg cgccgtggag ctgagctggg actacatgca gtctgacctg      120
          ggcgagctgc ctgtggacgc caggttcccc cccagagtgc ccaagagctt ccccttcaac      180
          acctcagtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc      240
          gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac      300
          gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg      360
          ggcgtgagct actggaaggc ctctgagggc gccgagtatg acgaccagac cagccagagg      420
          gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg      480
          aaggagaacg gccccatggc cagcgacccc ctgtgcctga cctacagcta cctgagccac      540
          gtggacctgg tgaaggacct gaactctggc ctgatcggcg ccctgctggt gtgcagggag      600
          ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg      660
          ttcgatgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggacagggat      720
          gccgcctctg ccagggcctg gcccaagatg cacaccgtga acggctacgt gaacaggagc      780
          ctgcccggcc tgatcggctg ccacaggaag tctgtgtact ggcacgtgat cggcatgggc      840
          accacccccg aggtgcacag catcttcctg gagggccaca ccttcctggt gaggaaccac      900
          aggcaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg      960
          gacctgggcc agttcctgct gttctgccac atcagcagcc accagcacga cggcatggag     1020
          gcctacgtga aggtggacag ctgccccgag gagccccagc tgaggatgaa gaacaacgag     1080
          gaggccgagg actatgatga tgacctgacc gactctgaga tggacgtggt gaggtttgat     1140
          gatgacaaca gccccagctt catccagatc aggtctgtgg ccaagaagca ccccaagacc     1200
          tgggtgcact acatcgccgc cgaggaggag gactgggact acgcccccct ggtgctggcc     1260
          cccgacgaca ggagctacaa gagccagtac ctgaacaacg gcccccagag gatcggcagg     1320
          aagtacaaga aggtcagatt catggcctac accgacgaga ccttcaagac cagggaggcc     1380
          atccagcacg agtctggcat cctgggcccc ctgctgtacg gcgaggtggg cgacaccctg     1440
          ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca cggcatcacc     1500
          gatgtgaggc ccctgtacag caggaggctg cccaagggcg tgaagcacct gaaggacttc     1560
          cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggatggcccc     1620
          accaagtctg accccaggtg cctgaccagg tactacagca gcttcgtgaa catggagagg     1680
          gacctggcct ctggcctgat cggccccctg ctgatctgct acaaggagag cgtggaccag     1740
          aggggcaacc agatcatgtc tgacaagagg aacgtgatcc tgttctctgt gttcgatgag     1800
          aacaggagct ggtatctgac cgagaacatc cagaggttcc tgcccaaccc cgccggcgtg     1860
          cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg     1920
          ttcgacagcc tgcagctgtc tgtgtgcctg cacgaggtgg cctactggta catcctgagc     1980
          atcggcgccc agaccgactt cctgtctgtg ttcttctctg gctacacctt caagcacaag     2040
          atggtgtacg aggacaccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc     2100
          atggagaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttcag gaacaggggc     2160
          atgaccgccc tgctgaaagt cagcagctgc gacaagaaca ccggcgacta ctacgaggac     2220
          agctacgagg acatcagcgc ctacctgctg agcaagaaca acgccatcga gcccagggag     2280
          atcaccagga ccaccctgca gagcgaccag gaggagatcg actatgatga caccatcagc     2340
          gtggagatga agaaggagga cttcgacatc tacgacgagg acgagaacca gagccccagg     2400
          agcttccaga agaagaccag gcactacttc atcgccgccg tggagaggct gtgggactat     2460
          ggcatgagca gcagccccca cgtgctgagg aacagggccc agagcggcag cgtgccccag     2520
          ttcaagaagg tggtgttcca ggagttcacc gacggcagct tcacccagcc cctgtacaga     2580
          ggcgagctga acgagcacct gggcctgctg ggcccctaca tcagggccga ggtggaggac     2640
          aacatcatgg tgaccttcag gaaccaggcc agcaggccct acagcttcta cagcagcctg     2700
          atcagctacg aggaggacca gaggcagggc gccgagccca ggaagaactt cgtgaagccc     2760
          aacgagacca agacctactt ctggaaggtg cagcaccaca tggcccccac caaggacgag     2820
          ttcgactgca aggcctgggc ctacttctct gatgtggacc tggagaagga cgtgcacagc     2880
          ggcctgatcg gccccctgct ggtgtgccac accaacaccc tgaaccccgc ccacggcagg     2940
          caggtgaccg tgcaggagtt cgccctgttc ttcaccatct tcgacgagac caagagctgg     3000
          tacttcaccg agaacatgga gaggaactgc agggccccct gcaacatcca gatggaggac     3060
          cccaccttca aggagaacta caggttccac gccatcaacg gctacatcat ggacaccctg     3120
          cccggcctgg tgatggccca ggaccagagg atcaggtggt atctgctgag catgggcagc     3180
          aacgagaaca tccacagcat ccacttcagc ggccacgtgt tcaccgtgag gaagaaggag     3240
          gagtacaaga tggccctgta caacctgtac cccggcgtgt tcgagaccgt ggagatgctg     3300
          cccagcaagg ccggcatctg gagggtggag tgcctgatcg gcgagcacct gcacgccggc     3360
          atgagcaccc tgttcctggt gtacagcaac aagtgccaga cccccctggg catggccagc     3420
          ggccacatca gggacttcca gatcaccgcc tctggccagt acggccagtg ggcccccaag     3480
          ctggccaggc tgcactacag cggcagcatc aacgcctgga gcaccaagga gcccttcagc     3540
          tggatcaagg tggacctgct ggcccccatg atcatccacg gcatcaagac ccagggcgcc     3600
          aggcagaagt tcagcagcct gtacatcagc cagttcatca tcatgtacag cctggacggc     3660
          aagaagtggc agacctacag gggcaacagc accggcaccc tgatggtgtt cttcggcaac     3720
          gtggacagca gcggcatcaa gcacaacatc ttcaaccccc ccatcatcgc caggtacatc     3780
          aggctgcacc ccacccacta cagcatcagg agcaccctgc ggatggaact gatgggctgc     3840
          gacctgaaca gctgcagcat gcccctgggc atggagagca aggccatctc tgacgcccag     3900
          atcaccgcca gcagctactt caccaacatg ttcgccacct ggagccccag caaggccagg     3960
          ctgcacctgc agggcaggag caacgcctgg aggccccagg tgaacaaccc caaggagtgg     4020
          ctgcaggtgg acttccagaa gaccatgaag gtgaccggcg tgaccaccca gggcgtgaag     4080
          agcctgctga ccagcatgta cgtgaaggag ttcctgatca gcagcagcca ggacggccac     4140
          cagtggaccc tgttcttcca gaacggcaaa gtgaaggtgt tccagggcaa ccaggacagc     4200
          ttcacccccg tggtgaacag cctggacccc cccctgctga ccaggtatct gaggatccac     4260
          ccccagagct gggtgcacca gatcgccctg agaatggaag tgctgggatg cgaggcccag     4320
          gacctgtact ga                                                         4332
          <![CDATA[<210> 29]]>
          <![CDATA[<211> 4368]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成聚核苷酸]]>
          <![CDATA[<400> 29]]>
          atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc       60
          accaggagat actacctggg cgccgtggag ctgagctggg actacatgca gtctgacctg      120
          ggcgagctgc ctgtggacgc caggttcccc cccagagtgc ccaagagctt ccccttcaac      180
          acctcagtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc      240
          gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac      300
          gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg      360
          ggcgtgagct actggaaggc ctctgagggc gccgagtatg acgaccagac cagccagagg      420
          gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg      480
          aaggagaacg gccccatggc cagcgacccc ctgtgcctga cctacagcta cctgagccac      540
          gtggacctgg tgaaggacct gaactctggc ctgatcggcg ccctgctggt gtgcagggag      600
          ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg      660
          ttcgatgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggacagggat      720
          gccgcctctg ccagggcctg gcccaagatg cacaccgtga acggctacgt gaacaggagc      780
          ctgcccggcc tgatcggctg ccacaggaag tctgtgtact ggcacgtgat cggcatgggc      840
          accacccccg aggtgcacag catcttcctg gagggccaca ccttcctggt gaggaaccac      900
          aggcaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg      960
          gacctgggcc agttcctgct gttctgccac atcagcagcc accagcacga cggcatggag     1020
          gcctacgtga aggtggacag ctgccccgag gagccccagc tgaggatgaa gaacaacgag     1080
          gaggccgagg actatgatga tgacctgacc gactctgaga tggacgtggt gaggtttgat     1140
          gatgacaaca gccccagctt catccagatc aggtctgtgg ccaagaagca ccccaagacc     1200
          tgggtgcact acatcgccgc cgaggaggag gactgggact acgcccccct ggtgctggcc     1260
          cccgacgaca ggagctacaa gagccagtac ctgaacaacg gcccccagag gatcggcagg     1320
          aagtacaaga aggtcagatt catggcctac accgacgaga ccttcaagac cagggaggcc     1380
          atccagcacg agtctggcat cctgggcccc ctgctgtacg gcgaggtggg cgacaccctg     1440
          ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca cggcatcacc     1500
          gatgtgaggc ccctgtacag caggaggctg cccaagggcg tgaagcacct gaaggacttc     1560
          cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggatggcccc     1620
          accaagtctg accccaggtg cctgaccagg tactacagca gcttcgtgaa catggagagg     1680
          gacctggcct ctggcctgat cggccccctg ctgatctgct acaaggagag cgtggaccag     1740
          aggggcaacc agatcatgtc tgacaagagg aacgtgatcc tgttctctgt gttcgatgag     1800
          aacaggagct ggtatctgac cgagaacatc cagaggttcc tgcccaaccc cgccggcgtg     1860
          cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg     1920
          ttcgacagcc tgcagctgtc tgtgtgcctg cacgaggtgg cctactggta catcctgagc     1980
          atcggcgccc agaccgactt cctgtctgtg ttcttctctg gctacacctt caagcacaag     2040
          atggtgtacg aggacaccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc     2100
          atggagaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttcag gaacaggggc     2160
          atgaccgccc tgctgaaagt cagcagctgc gacaagaaca ccggcgacta ctacgaggac     2220
          agctacgagg acatcagcgc ctacctgctg agcaagaaca acgccatcga gcccaggagc     2280
          ttcagccaga actccagaca ccccagcacc agggagatca ccaggaccac cctgcagagc     2340
          gaccaggagg agatcgacta tgatgacacc atcagcgtgg agatgaagaa ggaggacttc     2400
          gacatctacg acgaggacga gaaccagagc cccaggagct tccagaagaa gaccaggcac     2460
          tacttcatcg ccgccgtgga gaggctgtgg gactatggca tgagcagcag cccccacgtg     2520
          ctgaggaaca gggcccagag cggcagcgtg ccccagttca agaaggtggt gttccaggag     2580
          ttcaccgacg gcagcttcac ccagcccctg tacagaggcg agctgaacga gcacctgggc     2640
          ctgctgggcc cctacatcag ggccgaggtg gaggacaaca tcatggtgac cttcaggaac     2700
          caggccagca ggccctacag cttctacagc agcctgatca gctacgagga ggaccagagg     2760
          cagggcgccg agcccaggaa gaacttcgtg aagcccaacg agaccaagac ctacttctgg     2820
          aaggtgcagc accacatggc ccccaccaag gacgagttcg actgcaaggc ctgggcctac     2880
          ttctctgatg tggacctgga gaaggacgtg cacagcggcc tgatcggccc cctgctggtg     2940
          tgccacacca acaccctgaa ccccgcccac ggcaggcagg tgaccgtgca ggagttcgcc     3000
          ctgttcttca ccatcttcga cgagaccaag agctggtact tcaccgagaa catggagagg     3060
          aactgcaggg ccccctgcaa catccagatg gaggacccca ccttcaagga gaactacagg     3120
          ttccacgcca tcaacggcta catcatggac accctgcccg gcctggtgat ggcccaggac     3180
          cagaggatca ggtggtatct gctgagcatg ggcagcaacg agaacatcca cagcatccac     3240
          ttcagcggcc acgtgttcac cgtgaggaag aaggaggagt acaagatggc cctgtacaac     3300
          ctgtaccccg gcgtgttcga gaccgtggag atgctgccca gcaaggccgg catctggagg     3360
          gtggagtgcc tgatcggcga gcacctgcac gccggcatga gcaccctgtt cctggtgtac     3420
          agcaacaagt gccagacccc cctgggcatg gccagcggcc acatcaggga cttccagatc     3480
          accgcctctg gccagtacgg ccagtgggcc cccaagctgg ccaggctgca ctacagcggc     3540
          agcatcaacg cctggagcac caaggagccc ttcagctgga tcaaggtgga cctgctggcc     3600
          cccatgatca tccacggcat caagacccag ggcgccaggc agaagttcag cagcctgtac     3660
          atcagccagt tcatcatcat gtacagcctg gacggcaaga agtggcagac ctacaggggc     3720
          aacagcaccg gcaccctgat ggtgttcttc ggcaacgtgg acagcagcgg catcaagcac     3780
          aacatcttca acccccccat catcgccagg tacatcaggc tgcaccccac ccactacagc     3840
          atcaggagca ccctgcggat ggaactgatg ggctgcgacc tgaacagctg cagcatgccc     3900
          ctgggcatgg agagcaaggc catctctgac gcccagatca ccgccagcag ctacttcacc     3960
          aacatgttcg ccacctggag ccccagcaag gccaggctgc acctgcaggg caggagcaac     4020
          gcctggaggc cccaggtgaa caaccccaag gagtggctgc aggtggactt ccagaagacc     4080
          atgaaggtga ccggcgtgac cacccagggc gtgaagagcc tgctgaccag catgtacgtg     4140
          aaggagttcc tgatcagcag cagccaggac ggccaccagt ggaccctgtt cttccagaac     4200
          ggcaaagtga aggtgttcca gggcaaccag gacagcttca cccccgtggt gaacagcctg     4260
          gacccccccc tgctgaccag gtatctgagg atccaccccc agagctgggt gcaccagatc     4320
          gccctgagaa tggaagtgct gggatgcgag gcccaggacc tgtactga                  4368
          <![CDATA[<210> 30]]>
          <![CDATA[<211> 14]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> 人工序列之描述：合成肽]]>
          <![CDATA[<400> 30]]>
          Ser Phe Ser Gln Asn Pro Pro Val Leu Lys Arg His Gln Arg 
          1               5                   10                  
          <![CDATA[<210> 31]]>
          <![CDATA[<211> 24]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 野豬種(Sus sp.)]]>
          <![CDATA[<400> 31]]>
          Ser Phe Ala Gln Asn Ser Arg Pro Pro Ser Ala Ser Ala Pro Lys Pro 
          1               5                   10                  15      
          Pro Val Leu Arg Arg His Gln Arg 
                      20                  
          <![CDATA[<210> 32]]>
          <![CDATA[<211> 16]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 野豬種(Sus sp.)]]>
          <![CDATA[<400> 32]]>
          Ser Phe Ser Gln Asn Ser Arg His Gln Ala Tyr Arg Tyr Arg Arg Gly 
          1               5                   10                  15

Claims

一種聚核苷酸，其包含與CS01-FL-NA具有至少95%一致性之核苷酸序列，其中該聚核苷酸編碼因子VIII多肽。
如請求項1之聚核苷酸，其中該核苷酸序列與CS01-FL-NA (SEQ ID NO: 13)具有至少99%一致性。
如請求項1之聚核苷酸，其中該核苷酸序列為CS01-FL-NA (SEQ ID NO: 13)。
一種聚核苷酸，其包含編碼因子VIII多肽之核苷酸序列，該因子VIII多肽包含輕鏈、重鏈及接合該重鏈之C端與該輕鏈之N端的多肽連接子，其中該因子VIII多肽之該重鏈由與CS01-HC-NA (SEQ ID NO: 24)具有至少95%一致性之第一核苷酸序列編碼；其中該因子FVIII多肽之該輕鏈由與CS01-LC-NA (SEQ ID NO: 25)具有至少95%一致性之第二核苷酸序列編碼；且其中該多肽連接子包含弗林蛋白酶裂解位點。
如請求項4之聚核苷酸，其中該多肽連接子由與BDLO01 (SEQ ID NO: 5)具有至少95%一致性之第三核苷酸序列編碼。
如請求項4或5之聚核苷酸，其中：該第一核苷酸序列與CS01-HC-NA (SEQ ID NO: 24)具有至少99%一致性；且該第二核苷酸序列與CS01-LC-NA (SEQ ID NO: 25)具有至少99%一致性。
如請求項4或5之聚核苷酸，其中：該第一核苷酸序列為CS01-HC-NA (SEQ ID NO: 24)；且該第二核苷酸序列為CS01-LC-NA (SEQ ID NO: 25)。
一種聚核苷酸，其包含與CS04-FL-NA (SEQ ID NO: 1)具有至少95%一致性之核苷酸序列，其中該聚核苷酸編碼因子VIII多肽。
如請求項8之聚核苷酸，其中該核苷酸序列與CS04-FL-NA (SEQ ID NO: 1)具有至少99%一致性。
如請求項8之聚核苷酸，其中該核苷酸序列為CS04-FL-NA (SEQ ID NO: 1)。
一種聚核苷酸，其包含編碼因子VIII多肽之核苷酸序列，該因子VIII多肽包含輕鏈、重鏈及接合該重鏈之C端與該輕鏈之N端的多肽連接子，其中該因子VIII多肽之該重鏈由與CS04-HC-NA (SEQ ID NO: 3)具有至少95%一致性之第一核苷酸序列編碼；其中該因子FVIII多肽之該輕鏈由與CS04-LC-NA (SEQ ID NO: 4)具有至少95%一致性之第二核苷酸序列編碼；且其中該多肽連接子包含弗林蛋白酶裂解位點。
如請求項11之聚核苷酸，其中該多肽連接子由與BDLO04 (SEQ ID NO: 6)具有至少95%一致性之第三核苷酸序列編碼。
如請求項11或12之聚核苷酸，其中：該第一核苷酸序列與CS04-HC-NA (SEQ ID NO: 3)具有至少99%一致性；且該第二核苷酸序列與CS04-LC-NA (SEQ ID NO: 4)具有至少99%一致性。
如請求項11或12之聚核苷酸，其中：該第一核苷酸序列為CS04-HC-NA (SEQ ID NO: 3)；且該第二核苷酸序列為CS04-LC-NA (SEQ ID NO: 4)。
一種聚核苷酸，其包含與CS23-FL-NA (SEQ ID NO:20)具有至少95%一致性之核苷酸序列，其中該聚核苷酸編碼因子VIII多肽。
如請求項15之聚核苷酸，其中該核苷酸序列與CS23-FL-NA (SEQ ID NO: 20)具有至少99%一致性。
如請求項15之聚核苷酸，其中該核苷酸序列為CS23-FL-NA (SEQ ID NO: 20)。
一種聚核苷酸，其包含編碼因子VIII多肽之核苷酸序列，該因子VIII多肽包含輕鏈、重鏈及接合該重鏈之C端與該輕鏈之N端的多肽連接子，其中該因子VIII多肽之該重鏈由與CS23-HC-NA (SEQ ID NO: 22)具有至少95%一致性之第一核苷酸序列編碼；其中該因子FVIII多肽之該輕鏈由與CS23-LC-NA (SEQ ID NO: 23)具有至少95%一致性之第二核苷酸序列編碼；且其中該多肽連接子包含弗林蛋白酶裂解位點。
如請求項11之聚核苷酸，其中該多肽連接子由與BDLO23 (SEQ ID NO: 7)具有至少95%一致性之第三核苷酸序列編碼。
如請求項18或19之聚核苷酸，其中：該第一核苷酸序列與CS23-HC-NA (SEQ ID NO: 22)具有至少99%一致性；且該第二核苷酸序列與CS23-LC-NA (SEQ ID NO: 23)具有至少99%一致性。
如請求項18或19之聚核苷酸，其中：該第一核苷酸序列為CS23-HC-NA (SEQ ID NO: 22)；且該第二核苷酸序列為CS23-LC-NA (SEQ ID NO: 23)。
如請求項1至21中任一項之聚核苷酸，其中該聚核苷酸編碼包含與CS01-FL-NA (SEQ ID NO: 13)具有至少95%一致性之胺基酸序列之因子VIII多肽。
如請求項1至21中任一項之聚核苷酸，其中該聚核苷酸編碼包含CS01-FL-AA (SEQ ID NO: 2)之胺基酸序列之因子VIII多肽。
一種聚核苷酸，其包含與CS01-SC1-NA (SEQ ID NO: 26)具有至少95%一致性之核苷酸序列，其中該聚核苷酸編碼單鏈因子VIII多肽。
一種聚核苷酸，其包含與CS04-SC1-NA (SEQ ID NO: 9)具有至少95%一致性之核苷酸序列，其中該聚核苷酸編碼單鏈因子VIII多肽。
如請求項24或25之聚核苷酸，其中該聚核苷酸編碼包含與CS01-SC1-AA (SEQ ID NO: 10)具有至少95%一致性之胺基酸序列之單鏈因子VIII多肽。
如請求項24或25之聚核苷酸，其中該聚核苷酸編碼包含CS01-SC1-AA (SEQ ID NO: 10)之胺基酸序列之單鏈因子VIII多肽。
一種聚核苷酸，其包含與CS01-SC2-NA (SEQ ID NO: 27)具有至少95%一致性之核苷酸序列，其中該聚核苷酸編碼單鏈因子VIII多肽。
一種聚核苷酸，其包含與CS04-SC2-NA (SEQ ID NO: 11)具有至少95%一致性之核苷酸序列，其中該聚核苷酸編碼單鏈因子VIII多肽。
如請求項28或29之聚核苷酸，其中該聚核苷酸編碼包含與CS01-SC2-AA (SEQ ID NO: 12)具有至少95%一致性之胺基酸序列之單鏈因子VIII多肽。
如請求項28或29之聚核苷酸，其中該聚核苷酸編碼包含CS01-SC2-AA (SEQ ID NO: 12)之胺基酸序列之單鏈因子VIII多肽。
一種聚核苷酸，其包含與選自由以下各者組成之群的序列具有至少95%一致性之序列：CS01-HC-NA、CS01-LC-NA、CS04-HC-NA、CS04-LC-NA、CS23-HC-NA、CS23-LC-NA。
一種聚核苷酸，其包含與選自由以下各者組成之群的序列具有至少99%一致性之序列：CS01-HC-NA、CS01-LC-NA、CS04-HC-NA、CS04-LC-NA、CS23-HC-NA、CS23-LC-NA。
一種聚核苷酸，其包含選自由以下各者組成之群的序列：CS01-HC-NA、CS01-LC-NA、CS04-HC-NA、CS04-LC-NA、CS23-HC-NA、CS23-LC-NA。
如請求項32至34中任一項之聚核苷酸，其中該聚核苷酸編碼包含與CS01-FL-NA (SEQ ID NO: 13)具有至少95%一致性之胺基酸序列之因子VIII多肽。
如請求項32至34中任一項之聚核苷酸，其中該聚核苷酸編碼包含CS01-FL-AA (SEQ ID NO: 2)之胺基酸序列之因子VIII多肽。
如請求項1至36中任一項之聚核苷酸，其中該經編碼因子VIII多肽包含置於兩個連續胺基酸之間的糖基化多肽。
如請求項1至37中任一項之聚核苷酸，其進一步包含可操作地連接至編碼該因子VIII多肽之該聚核苷酸的啟動子元件。
如請求項38之聚核苷酸，其中該啟動子元件為在編碼該因子VIII多肽之該核苷酸序列上游的肝特異性啟動子序列。
如請求項39之聚核苷酸，其進一步包含安置於該肝特異性啟動子序列與編碼該因子VIII多肽之該核苷酸序列之間的內含子序列。
一種腺相關病毒(AAV)載體，其包含如請求項1至40中任一項之聚核苷酸。
一種腺相關病毒(AAV)顆粒，其包含如請求項1至40中任一項之聚核苷酸。
一種宿主細胞，其感染有包含如請求項1至40中任一項之聚核苷酸之腺相關病毒(AAV)顆粒。
一種用於產生腺相關病毒(AAV)顆粒之方法，其包含將如請求項1至40中任一項之聚核苷酸引入哺乳動物宿主細胞中，其中該聚核苷酸能夠在該哺乳動物宿主細胞中複製。
一種用於治療A型血友病之方法，其包含向有需要之患者投與如請求項42之腺相關病毒(AAV)顆粒。
一種用於轉導宿主細胞之方法，其包含使該宿主細胞與如請求項42之腺相關病毒(AAV)顆粒接觸。
如請求項42之腺相關病毒(AAV)顆粒，其係用於治療A型血友病。
如請求項42之腺相關病毒(AAV)顆粒，其係用於轉導宿主細胞。
一種如請求項42之腺相關病毒(AAV)顆粒之用途，其係用於製造用於治療A型血友病之藥物。