CN1678632A

CN1678632A - 一种从硬骨鱼中鉴定新的广谱抗菌肽的基因组途径

Info

Publication number: CN1678632A
Application number: CNA038199246A
Authority: CN
Inventors: 苏珊·道格拉斯; 杰弗里·加朗特; 亚历山大·帕特里凯特
Original assignee: National Research Council of Canada
Current assignee: National Research Council of Canada
Priority date: 2002-08-22
Filing date: 2003-08-22
Publication date: 2005-10-05
Also published as: JP2005536209A; MXPA05001947A; WO2004018706A3; AU2003260224A1; US20060093596A1; EP1534745A2; CA2495794A1; AU2003260224A2; WO2004018706A2

Abstract

本发明提供了一种鉴定编码抗菌肽的候选核酸序列的方法。该方法包括：鉴定感兴趣的起始肽；鉴定编码所述起始肽的基因组DNA；鉴定位于所述起始肽每一侧的侧翼序列；获得与所述侧翼序列互补的引物；及大范围筛选核酸序列来鉴定能够使用步骤e)的引物来扩增的候选序列。在一些例子中，所述抗菌肽为hepcidin或pleurocidin。

Description

一种从硬骨鱼中鉴定新的广谱抗菌肽的基因组途径

技术背景

目前已从多种植物、动物中分离了抗菌肽，其在防御微生物入侵中发挥重要作用。根据其二级结构和氨基酸序列的相似性它们主要分为三类：α-螺旋结构、高二硫键结合(富含半胱氨酸)β-片层及含高百分比单氨基酸(诸如脯氨酸或精氨酸)。

大多数分子为两性的并含有阳离子和疏水表面，使其能够插入生物膜中。尽管抗菌肽的作用方式之一被描述为溶解病原体，但它们也可以通过与细胞内靶标的结合来发挥作用。有报道表明它们还具有多种作用，例如介导炎症和调节免疫反应。

已经从硬骨鱼(teleost)中分离了少量的天然抗菌肽，包括从美洲拟鲽(winter flounder)皮肤中分离的pleurocidin(Cole，Weis et al.1997)、从红海Moses sole中分离的pardaxin(Oren and Shai 1996)、从泥鳅中分离的misgurnin(Park，Lee et al.1997)、从八目鳗鱼中分离的HFA-l(Hwang，Seoet al.1999)、从杂交条纹石鮨嗜酸性粒细胞中分离的piscidin(Silphaduangand Noga 2001)、从杂交条纹石鮨分离的moronecidin(Lauth，Shike et al.2002)、鲶鱼的组蛋白2A降解产物parasin(Park，Park et al.1998)以及一些鲤鱼(LeMaitre，Orange et al.1996)和鲑鱼(Smith，Fernandes et al.2000)的未进行特征鉴定的黏液性分泌物。此外，还有从鲨鱼(海绿角鲨)中分离的阳离子类固醇抗生素角鲨胺(squalamine)(Moore，Wehrli et al.1993)。

已经在昆虫的脂肪体和软体动物和甲壳类动物的血淋巴中发现了defensin家族的富含半胱氨酸的抗菌肽。它们同样可从各种哺乳动物的上皮细胞以及诸如中性粒细胞和巨嗜细胞的循环细胞中分离。最近，从血液的超滤液(Krause，Neitz et al.2000)、人的尿道(Park，Valore et al.2001)以及细菌刺激(challenged)的杂交条纹石鮨的鳃(Shike et al.2002)中分离了小分子富含半胱氨酸的肽，其表现出抗各种真菌、革兰氏阳性及革兰氏阴性菌的抗菌特性。这些称为hepcidin或LEAP-1(肝表达抗菌肽)的肽已被认为是在脂肪体中由感染诱导的昆虫肽的脊椎动物对应体(Park，Valore et al.2001)。

抗菌肽具有多种潜在的用途(参见例如Hancock的US 6,288,212)。鉴定抗菌肽的常规方法包括从组织或分泌物中进行生物化学提纯。对组分进行抗菌活性的检测，并随后对具有活性的纯化的肽进行测序。这种方法费时费钱并且不适合鉴定低含量或难以纯化的抗菌肽。

因此，本发明的目的是提供一种鉴定潜在的抗菌肽的方法。

发明概述

一方面，本发明提供一种鉴定编码抗菌肽的候选核酸序列的方法，所述的方法包括：

a)鉴定感兴趣的起始肽；

b)鉴定编码所述起始肽的基因组DNA；

c)鉴定位于所述起始肽的每一侧的侧翼序列(flanking sequence)；

d)获得与所述侧翼序列互补的引物；及

e)大范围筛选核酸序列来鉴定能够通过使用步骤d)的所述引物来扩增的候选序列。

一方面，本发明提供hepcidin样肽的核苷酸及推导的氨基酸序列。

另一方面，本发明提供pleurocidin样肽的核苷酸及推导的氨基酸序列。

另一方面，本发明提供适合用于鉴定、分离和/或扩增编码新的微生物肽的核酸序列的引物。

另一方面，本发明提供鉴定编码抗菌肽的核酸序列家族的方法。

附图的简要说明

图1所示为美洲拟鲽的pleurocidin WF2 cDNA的文本与图解描述(A)，预测的肽WF2疏水区(plot)的图示(B)及预测的WF2的螺旋结构的示意图(C)。

图2所示为某些hepcidin样cDNA扩增结果。

图3所示为某些对齐的pleurocidin样肽序列。

图4所示为某些pleurocidin样基因组序列的PCR扩增结果。

图5所示为延伸的WF4基因组序列。

图6所示为某些对齐比较的pleurocidin样多肽序列。

图7所示为在不同美洲拟鲽组织中的某些pleurocidin样基因表达的结果。

图8所示为美洲拟鲽发育中某些pleurocidin表达的RT-PCR结果。

图9所示为美洲拟鲽发育中某些pleurocidin样基因表达的研究结果。

图10所示为美洲拟鲽的某些pleurocidin基因的Southern分析结果。

图11所示为美洲拟鲽的某些pleurocidin基因的基因组构成示意图。

图12所示为位于美洲拟鲽的pleurocidin基因上游的某些转录因子结合位点的示意图。

图13所示为显示肽NRC-15对细菌活存影响的结果。

图14所示为显示肽NRC-13对细菌活存影响的结果。

图15所示为显示肽NRC-12对酵母活存影响的结果。

图16所示为编码I型hepcidin的未拼接(A)和部分拼接(B)cDNA核苷酸序列以及人、小鼠和鲑鱼中的hepcidin基因内含子/外显子的结构示意图(C)。

图17所示为对齐比较的来自不同物种的某些hepcidin序列。

图18所示为对齐比较的美洲拟鲽(A)和大西洋鲑鱼(B)的hepcidin基因的某些3′非翻译区。

图19所示为不同鱼类的某些hepcidin的Southern杂交分析结果。

图20所示为在美洲拟鲽的不同组织中的某些hepcidin和肌动蛋白(actin)基因表达的分析结果。

图21所示为在对照和感染的鲑鱼的不同组织中的某些I型(a)和II型(b)hepcidin和肌动蛋白基因表达的分析结果。

图22所示为发育中的美洲拟鲽幼鱼中的某些I型(A)、II型(B)、III型(C)hepcidin和肌动蛋白(actin)基因表达的分析结果。

图23所示为所述鉴定pleurocidin的方法的实施方案中采用的步骤的示意图。

图24所示为所述鉴定hepcidin的方法的实施方案中采用的步骤的示意图。

图25所示为在150mM NaCe存在下使用抗菌肽NRC-13的试验结果。

发明的详细说明

本发明方法建立在如下惊人的发现之上，即抗菌肽(包括但不限于pleurocidin和hepcidin)周围的侧翼序列是保守的。本发明的方法提供了鉴定编码pleurocidin和hepcidin的核苷酸序列以及鉴定被编码的多肽序列的手段。

在一个实施方案中，一般来说，所述的方法提供了一旦鉴定了一个家族成员，就能鉴定该抗菌肽家族多个成员的途径。起始的家族成员可以是感兴趣的起始肽。能够根据已知或是报道的抗菌活性或根据与其它已知抗菌肽的序列相似性来鉴定感兴趣的起始肽。一旦鉴定了起始肽，就可鉴定编码该起始肽的基因组DNA，且可确定其侧翼序列。

本文所用术语“侧翼序列”是指位于或接近(at or near)编码抗菌肽的靶核酸序列的一个或两个末端的核酸序列。

本文所用的核酸序列“位于或接近”靶序列的末端，如果所述序列部分位于所述基因末端的50个核酸之内(无论在编码区之内或之外)。

当根据与具有已知抗菌活性的另一个肽的相似性，鉴定感兴趣的起始肽时，所述的起始肽优选具有两性结构和净电荷。在一些例子中，所述的电荷优选至少为2的净正电荷。在一些例子中，所述的肽与具有已知抗菌活性的肽有至少75％、85％或95％的序列同一性。在一些例子中，鉴定得到的序列相似性可与编码所述已知肽的核酸序列与编码所述感兴趣肽的核酸序列间的相似性有关。在这些例子中，可根据预测的电荷和两性结构来考虑所述感兴趣肽的预测肽。

例如，pleurocidin和hepcidin的前原(prepro-)序列倾向于保守。因此，通过使用对这种序列特异的核酸引物，可鉴定潜在的pleurocidin-和hepcidin-编码序列。可选择地或另外地，可检查其它种类的抗菌肽的已知基因序列来鉴定表现为编码保守前原序列的区域，并可使用相似的策略来鉴定这一肽家族的其它成员。由这种序列编码的对应的抗菌肽可使用在多数pleurocidin和hepcidin中发现的普遍特性来预测，例如，至少为2的净正电荷和两性结构。

对于本文所用的抗菌肽的前(pre-)、原(pro-)及前原(prepro)序列，“前”和“原”具有以下的含义：“前”指所述肽的信号肽部分(或其功能部分)。“原”指原片段(propiece)。在pleurocidin中，所述的原片段为位于羧基末端的阴离子区域。在hepcidin中，所述的原片段指成熟肽的上游区域。在本文公开的非限制性实施例中，根据其前和原区域设计pleurocidin引物，以及根据其前区域和3’非翻译区(UTR)设计hepcidin引物。

可通过PCR来扩增编码潜在pleurocidin或hepcidin的核酸序列。这可常规地通过使用一对PCR引物来实现，其中一个引物识别与编码氨基末端前原序列的多核苷酸序列互补的核酸序列，其中所述前原序列在所述感兴趣的肽类型中保守，另一个引物与编码所述感兴趣的肽类型的核苷酸的3’保守区互补。应该理解，可以存在其它前原序列，并对其进行特别地考虑。例如，遗传密码的冗余使得多种核酸序列可编码一种特定的氨基酸序列。如对5’前原序列的论述中所述，可存在其它的3’保守序列并可对其进行特别地考虑。当设计引物时，参考预对其序列进行序列扩增种类的已知密码子使用信息是有用的。

本发明的一个实施方案中，提供了信号序列I或编码此序列的核酸序列在鉴定或扩增潜在的pleurocidin中的用途。

信号序列I

MKFTATFL(X)_n(L)_o(F)_pI(F)_q(X)_yVLM(X)_z(V)_r(E)_s(D)_t(P)_u(L)_vGE(C)_w(G)_x

其中：

n为1-3 u为0或1

o为0-2 v为0或1

p为0或1 w为0或1

r为0或1

s为0或1 x为0或1

t为0或1 y为0或1

z为0或1

并有如下的限定：

x+o+p＝3， s+t＝1，

u+v＝1， w+x＝1，及

q+＝1。

本发明的实施方案中，提供了序列PL1或PL2中一个或两个或者编码该序列的核酸序列在鉴定或扩增潜在的pleurocidin中的用途。

PL1 GCCCACTTTGTATTCGCAAG

PL2 CTGAAGGCTCCTTCAAGGCG

本发明的实施方案中，提供了酸性序列I或编码该序列的核酸序列在鉴定或扩增潜在的pleurocidin中的用途。

酸性序列I

(Y)_a(X)_b(X)_c(E)_d(X)_e(Q)_f(E)_gL(N/D)KR(A/S)VD(D/E)

其中：

a为0或1 e为1-3

b为0或1 f为0或1

c为1或2 g为0或1

d为0或1

并具有如下限定：

a+b＝1，

c+d＝2，及

e+f+g＝3。

本文所述序列中所使用的“X”指任意氨基酸。特别考虑编码信号序列I和酸性序列I的核酸序列，同时也考虑与这类核酸序列互补的核酸序列。

本发明的实施方案中，提供了信号肽II、III、IV、V或编码所述肽的核酸序列在鉴定或扩增hepcidin中的用途。

信号肽II

MKXXXXAXXVXXVL

信号肽III

MKTFSVAV

信号肽IV

MKTFSVAVTVAVVLXFICIQQSSA

信号肽V

MKTFSVAVAV(T/V)(L/V)VLA(F)_n(V/C)(C/M)(I/F)(Q/I)X(X)_mS(S/T)AVPFXXV，

其中n为0或1以及m为0或1。

本发明的实施方案中，提供了原序列I、原序列II或编码所述序列的核酸序列在鉴定或扩增hepcidin中的用途。

原序列I

PEVQXLEEAXSXDNAAAEHQE

原序列II

PFXXVX(X)_n(L/T)EEV(E/G)(G/S)XD(T/S)PV(A/G)XHQ，

其中n为0或1，

本发明的一个实施方案中，提供了HcPA3b3’和/或HcSal3’序列或编码所述序列的核苷酸序列或与编码所述序列的核酸序列互补的序列在鉴定或扩增hepcidin中的用途。

HcPa3b3’ 3’ACAACCTCGTCCTTAGG5’

HcSal3’ 3’ACGCCCGTCCAGGAAT5’

用途的非限定性示例

抗菌肽可用于对多种个体的感染进行治疗和/或预防，这些个体包括鱼、爬行类、鸟类、哺乳动物、两栖类及昆虫。

抗菌肽同样还可用于减少细菌在表面的生长和/或积累。这对食品工业特别有益，其中抗菌肽可用于包被食品加工、制备和/或包装中使用的各种表面。

本文公开的抗菌肽可以各种途径给药。在一些例子中，口服给药是较理想的。通过包被所述的肽来改进一些类型的口服给药，从而使其在特定的消化阶段优先释放。在一些例子中，在给药的肽中包括前和/或原序列是较理想的(例如改进稳定性或调节活性)。所述的前和/或原序列在适当的阶段能够被内源性蛋白酶降解。当所述个体呼吸空气或对有鳃个体通过加入到水中，肽可通过吸入途径给药。在一些情况下注射给药是较理想的。肽可注射到任何数量的位点中。在一些情况下，静脉内注射是较理想的。在一些例子中，直接注射到感染或潜在感染位点或其附近是较理想的。在一些例子中，局部给药是较理想的。当抗菌肽最好位于远处或特定的位点时，或当所述肽最好能持续一段时间时，可采用基因治疗提供一种或多种抗菌肽在相关组织中的表达。

当所述的个体是饲养或驯养生物例如鱼、鸟类或非人哺乳动物时，生产可表达一种或多种抗菌肽的转基因品种是较理想的。生产转基因动物的方法是公知的(参见例如Mar.Biotechnol.4：338，2002)。

本发明涉及了多种抗菌肽，并且这些抗菌肽均属于本发明的保护范围。作为非限定性的例子，特别考虑包括下列氨基酸序列或与其具有至少80％或90％同源性的序列的肽，以及编码它们的核酸序列：

i)GW(G/K)XXFXK

ii)GXXXXXXXHXGXXIH

iii)FKCKFCCGCCXXGVCGXCC

iv)CXXCCNCC(K/H)XKGCGFCCKF

v)FKCKFCCGCRCGXXCGLCCKF

vi)XXXCXXCCNXXGCGXCCKX

其它的感兴趣的抗菌序列的特定的非限定性的例子可参见表4和表11。

可对本发明的抗菌肽进行修饰。在一些例子中，这种修饰可改进所述肽的稳定性或活性。可特别考虑的修饰的例子包括：

-保守氨基酸的替代(酸性替代酸性、碱性替代碱性、中性替代中性、极性替代极性、疏水替代疏水等等)

-在一端或两端加入带正电的氨基酸(赖氨酸、精氨酸、组氨酸)

-用其它不太可能引起结构变化的氨基酸进行氨基酸替代，包括D-氨基酸和缩氨酸拟态物(peptidemimetics)

-一个或多个氨基酸的缺失

-C-末端或N-末端的修饰，包括甲酯和酰胺化

-所述肽的环化形式(其可导致稳定性增加但对活性没有负面影响)

实施例-方法

鱼的饲养

如所述(Douglas，Gawlicka et al.1999)对美洲拟鲽进行饲养，该公开在此引用作为参考。在Halifax，Nova Scotia的Dalhousie大学的Aquatron设备(facility)中，将圣约翰河血统(stock)的大西洋鲑鱼(Salmo salar L.)维持在单程、加热、脱氯的12℃新鲜水中。在取样前，所有的鱼用过量的三卡因(tricaine)甲磺酸盐(MS 222，0.1g L^-1，Argent Chemical Laboratories，Inc.，Redmond，WA，USA)安乐死(euthanised)。所有的动物处理过程均经Dalhousie大学实验室动物委员会、国家研究理事会-Halifax地区动物关怀理事会批准。

细菌的刺激

在17℃、胰酶大豆肉汤(Tryptic Soy Broth，TSB)中，将杀鲑气单胞菌杀鲑亚种(Aeromonas salmonicida subsp salmonicida)株A449(Trust et al.1983)培养到对数生长中期。检测细菌悬液600nm处的光吸收并在无菌Hanks平衡盐溶液(HBSS)中将该细菌重悬至约5×10⁷cfu mL^-1。用50mgL^-1 TMS麻醉3条鲑鱼(每条200g)，用50μL HBSS中的2.5×10⁶cfu细菌腹腔注射并使其在新鲜的水中恢复。来自相同种群的未注射的鱼维持在分开的池子中作为对照。注射后3天，如上述将对照和注射的鲑鱼实施安乐死并采集组织样本。从臀静脉采集血液并放入肝素化的容器中。为了肯定所述的鱼为杀鲑气单胞菌阳性，对感染和对照鱼的肾脏后叶(posterior kidney)进行擦拭并接种于胰酶大豆琼脂(tryptic soy agar，TSA)，在室温下培养过夜。从Dartmouth，Nova Scotia Bedford海洋学研究所进行的细菌刺激研究中获得大西洋大比目鱼(halibut)的组织样本。

采样

采集组织(食管、胃、幽门盲肠、肝、脾脏、肠、肾脏前叶(anteriorkidney)、肾脏后叶、鳃、皮肤、卵巢、直肠、心、肌肉及脑)并放入RNALater(Ambion，Austin，TX，USA)中，保存在-80℃直到使用。在RNALater(Ambion，Austin，TX，USA)中漂洗不同阶段的幼年期美洲拟鲽和青少年期美洲拟鲽的样本，然后转移至含有0.5-1.25ml RNALater的1.5mlEppendorf管中，保存在-80℃直到使用。

Pleurocidins

以下的常规方法如图24所示。

pleurocidin cDNA的分离

使用简并寡核苷酸(PleuroA，PleuroB；表1)来筛选构建自美洲拟鲽皮肤的cDNA文库(Gong et al 1996)。将该文库以80,000噬菌体/板进行接种，并且由8块板中的每一块构成HyBond过滤器上的复制本。利用常规的步骤在50℃将放射性末端标记的PleuroA和PleuroB探针的混合物与所述的滤器杂交，并将所述的过滤器以1XSSC/0.1％SDS在50℃洗涤45min。在两个重复的过滤器中显示匹配杂交信号的斑块被选取，并重新筛查所述文库直到获得100％纯度的重组斑块。使用ABI373延伸自动测序仪和AmpliTaqF S Dye Terminator Cycle S equencing Ready反应试剂盒(Perkin-Elmer，Foster City，CA，USA)对两种重组体进行完全测序。利用Sequencher(Gene Codes，Inc.，Ann Arbor，MI，USA)和DNA Strider对序列资料进行分析。利用SignalP(http：//www.cbs.dtu.dk/services/SignalP)对氨基末端信号序列进行预测。用GCG包(http：//www.gcg.com)的螺旋轮规则(Helical Wheel routine)来模建所预测的抗菌肽序列的螺旋结构。

基因组PCR

使用对美洲拟鲽pleurocidin cDNA特异的两组引物(PL1/PL2和PL5’/PL3’；见表1；图1)来扩增基因组序列。扩增的条件为：94℃、1min；94℃、30s，52℃、30s，72℃、90s，共35循环；及72℃、2min，将产物加到1％琼脂糖凝胶中。从所述的凝胶中切下条带，根据厂商提供的说明书利用Gene-Clean(Bio101，La Jolla，CA，USA)对其进行提取并克隆至Topo TA2.1载体(Invitrogen，Carlsbad，CA，USA)上。如上所述，对来自每个转化的多个分离进行测序和分析。通过与所述的cDNA序列比较来确定内含子的位置。

通过RT-PCR鉴定其它的美洲拟鲽pleurocidin样序列

基本上根据Douglas，Gawlicka等(1999)所述，从美洲拟鲽皮肤和肠中分离总RNA。根据厂商提供的说明书，利用RETROScript试剂盒(Ambion，Austin，TX，USA)进行2μg总RNA的反转录。使用PL3’和对应所述前驱多肽氨基末端的引物(PL5’；表1)来进行PCR。所述扩增的条件为：94℃、1min；94℃、30s，50℃、30s，72℃、90s，共32循环；及72℃、2min，将产物加到2％ NuSeive凝胶中。如上所述进行条带的切胶、克隆和测序。

不同组织的其它的pleurocidin样序列的鉴定

利用来自成年皮肤、肝、卵巢、肌肉、脾、幽门盲肠、胃和肠的多聚腺苷酸RNA(500ng)，通过Northern分析对pleurocidin的组织特异性表达进行了研究。来自对应WF2的cDNA克隆的全部插入被放射性标记并与印记在60℃和UltraHyb杂交溶液(Ambion，Austin，TX，USA)中孵育过夜。在暴露于X光底片之前，将该印记在50℃和1X SSC/0.1％ SDS中的严格条件下洗涤1h。使用对WF1、WF1a、WF2、WF3、WF4、WFYT和WFX(表2)特异的引物，采用RT-PCR来分析各种组织中不同pleurocidin样变体的表达。除退火温度为52℃外，所用的条件如前一段落所述。不同发育阶段的其它的pleurocidin样序列的鉴定

利用两套幼年期时间系列来评价发育过程中Pleurocidin样基因的表达。在第一系列中，从20条全幼鱼(5和13dph)、10条全变态(metamorphosing)幼鱼(20dph)及新变态幼鱼(27dph)的联合(pooled)样本，两条青少年期鱼(41dph)的内脏组织，成年鱼上下侧的皮肤以及成年鱼上下肠组织中分离RNA。根据所述(Douglas，Gawlicka et al.1999)分离RNA，该公开在此引用作为本文的参考，并且使用引物PL5’和PL2以及上述RT-PCR的条件进行分析。为确认看家基因表达的稳定水平及提供pleurocidin表达的内对照，根据前述(Douglas，Bullerwell et al.1999)来扩增肌动蛋白mRNA，该公开在此引用作为本文的参考。在第二幼鱼时间系列中，从20条全幼鱼(孵化，5和9dph)、10条全幼鱼(15、20、25、30及36dph)的联合(pooled)样本，两条青少年期鱼(41dph)的内脏组织中分离RNA。使用对WF1、WF1a、WF2、WF3、WF4、WFYT及WFX(表2)特异的引物进行分析来检测不同发育阶段的不同pleurocidin样变体的表达。其条件如上段所述。

Southern分析

对美洲拟鲽、三种其它比目鱼(拟庸鲽Hippoglossoides platessoidesFabricius，大西洋大比目鱼Hippoglossus hippoglossus L.及美洲黄盖鲽Pleuronectes ferruginea Storer)、黑线鳕鱼(Melanogrammus aeglefinus L.)、鳕鱼(Pollachius virens L.)及胡瓜鱼(Osmerus mordax Mitchill)的BamHI-和SstI-酶切的基因组DNA，使用源自对应WF1、WF2、WF3和WF4的基因组克隆的全插入作为探针，顺序进行Southern分析。如前所述(Douglas，Gallant et al.1998)，在65℃杂交过夜，该公开在此引用作为本文的参考，并将印记在65℃和0.5X SSC/0.1％ SDS中洗涤1h，随后暴露于X光底片。通过在沸腾的0.5％ SDS中孵育两次对印记进行剥离，并通过暴露于X光底片过夜来检查残余的信号。

其它鱼类其它的pleurocidin样序列的鉴定

从美洲黄盖鲽、美首鲽(witch flounder)、大西洋大比目鱼的皮肤和肠中分离总RNA，并如上所述进行反转录(RT-PCR分析)。从美洲黄盖鲽、美首鲽、拟庸鲽(American plaice)、大西洋大比目鱼的雄鱼生殖腺，及Petrale鲽鱼、C-O鲽、英吉利鲽、箭齿鲽(Starry flounder)、欧洲鲽鱼(plaice)、格陵兰大比目鱼及太平洋大比目鱼组织样本中分离总基因组DNA。使用对美洲拟鲽pleurocidin cDNA特异的两组引物(PL1/PL2和PL5’/PL3’；见表1；图1)，且扩增的条件为：94℃、1min；94℃、30s，50℃、30s，72℃、90s，共32循环；及72℃、2min。将产物加到2％ NuSeive凝胶中，如上所述进行条带的切胶、克隆和测序。

图1为美洲拟鲽的pleurocidin WF2的文本和图解描述。图A为从皮肤库中分离来自美洲拟鲽的pleurocidin的cDNA核酸序列。用于PCR的引物位置用下划线给出，推导的氨基酸序列在核酸序列下方用大写字母显示。箭头显示为pleurocidin肽的成熟的5’和3’末端、菱形显示内含子位置。粗体显示单一的SstI限制性内切酶位点(GAGCTC)和假定的多聚腺苷酸位点(aataaa)。图b为使用DNA Strider(Marck 1992)的Kyte-Doolittle选项构建的预测pleurocidin多肽WF2的疏水区(plot)。由垂直的箭头显示了所述成熟的pleurocidin的边缘。图c.为通过GCG的螺旋轮法则构建的预测pleurocidin多肽WF2的螺旋结构的示意图。疏水残基和甘氨酸残基为盒状(boxed)而极性残基不是。发现所述成熟多肽的第一氨基酸(G)位于轮的顶端。

美洲拟鲽基因组中pleurocidin样序列的鉴定

使用对pleurocidin(WF2；Douglas et al.，2001)的放射性标记探针来筛查美洲拟鲽基因组λ-GEM文库。收集四个克隆并不断重复直到获得100％纯度。使用BamHI、SstI、XhoI及EcoRI对克隆作图，选择两个限制性图形不同的克隆(λ1.1和λ5.1)进行测序。使用ABI373延伸自动测序仪和AmpliTaqFS Dye Terminator Cycle Sequencing Ready反应试剂盒(Perkin-Elmer，Foster City，CA，USA)对两个克隆进行完全测序。利用WWW Signal Scan(http：//bimas.dcrt.nih.gov/molbio/signal/)结合TransFac和TFD数据库对转录因子结合位点进行鉴定，并且通过Baylor医学院(http：//searchlauncher.bcm.tmc.edu/seq-search/gene-search.html)提供的神经网络软件的真核启动子预测来检测启动子。

Hepcidins

以下的常规方法如图24所示。

Hepcidin cDNA的分子特性化

从美洲拟鲽EST数据库(Douglas，Gallant et al.1999)中鉴定了8条，从大西洋鲑鱼数据库(Douglas，Tsoi et al.2002)中鉴定了4条与人hepcidin具有高度相似性的EST序列。使用这些序列筛查dbEST，BLASTX分析显示来自日本牙鲽的两条相关序列(C23298.1和C23432.1)，来自彩虹鳟鱼(rainbow trout)的一条序列(AF281354_1)和5条来自青鳉(medaka)的相同序列(AU178966、AU179222、AU179314、AU179768及AU180044)。使用Sequencher(Gene Codes，Inc.，Ann Arbor，MI，USA)和DNA Strider(Marck 1992)进行序列分析。使用ClustalW(Thompson，Higgins et al.1994)计算对齐和相似性矩阵(matrices)，并使用SeqVu(Garvan 1996)进行图形可视化。使用在线服务器PSORT(http：//PSORT.nibb.ac.jp)、Compute PI(http：//expasy.hcuge.ch/cgi-bin/pitool)、及网络蛋白序列分析(http：//npsa-pbil.ibcp.fr/cgi-bin/secpred consensus.pl)来分别预测N末端信号序列、pI和二级结构。所述的二级结构预测程序使用七种不同的算法(详细资料参见相关网站)并根据这些结果提供一致预测。

Southern杂交

从美洲拟鲽(Pleurofzectes americanus)、美洲黄盖鲽，(Pleuronectesferruginea)、美首鲽(Glyptocephalus cynoglossus)、日本牙鲽，(Paralichtllysolivaceus)、拟庸鲽(Hippoglossoides platessoides)、大西洋鲑鱼(Salmosalar)、黑线鳕鱼(Melanogrammus aeglfinus)、胡瓜鱼(Osmerus mordax)、八目鳗鱼(Eptatretus burgeri)、虎鲨(Scyliorhinus torazame)及高首鲟(Acipenser transmontanus)中根据前述(Douglas，Bullerwell et al.1999)制备总基因组DNA，该公开在此引用作为本文的参考。根据厂商的说明书利用SstI消化DNA(7.5μg)，将所得片段加入到1％琼脂糖凝胶上。使用DIG标记试剂盒(Roche Applied Science，Laval，PQ，Canada)来标记对应I型美洲拟鲽hepcidin的WMENPT....GCGFCC氨基酸残基的104bp探针，并使用Easy Hyb试剂盒(Roche Applied Science，Laval，PQ，Canada)将其与膜在42℃杂交2h。该膜在0.2X SSC，65℃洗涤并用DIG发光检测试剂盒(Roche Applied Science，Laval，PQ，Canada)检测信号。

通过RT-PCR鉴定其它的hepcidin样序列

根据本研究确定的cDNA序列(表3)来设计引物。为确认看家基因表达的稳定水平及提供hepcidin基因表达分析的内对照，对肌动蛋白mRNA进行了扩增。使用单引物进行对照来排除单一引物的假象及不用反转录来排除从污染的基因组DNA中产生的扩增产物。

根据厂商提供的说明书，利用RNAWiz试剂盒(Ambion，Austin，TX，USA)从未感染的成年美洲拟鲽及未感染和感染的成年鲑鱼和大比目鱼组织中分离总RNA。使用7mm发电机将组织在Polytron标准转子(rotor)定子(stator)研磨器(Kinematica)研磨。此外，从20条全幼鱼(孵化，5和9dph)、10条全幼鱼(15、20、25、30及36dph)的联合样本、两条青少年期鱼(41dph)的内脏组织和成年美洲拟鲽肝脏中分离RNA。为排除污染的DNA，根据指导使用Ambion DNA-freeTM方案。简而言之，将4单位的DNaseI加入到重悬的RNA中，并在37℃孵育1小时。孵育后，加入DNAse失活剂来去除酶，并使用Beckman DU-64分光光度计来检测RNA浓度。

从1μg总RNA中，利用RetroScript试剂盒(Ambion，Austin，TX，USA)合成第一条cDNA链，利用rTaq聚合酶(Amersham Pharmacia Biotech AB，Uppsala，Sweden)或Advantage2PCR试剂盒(Clontech，Palo Alto，CA，USA)对所述反应产物的组分进行PCR。引物和退火温度在表3中列出。扩增条件是：95℃、1min；95℃、15s，所述的退火温度、30s，68℃、30s，共32循环；4℃保存。以100bp梯状物为标准(Gibco BRL，Gaithersburg，MD，USA)，将扩增产物加到2％ NuSeive琼脂糖凝胶中，并利用GelDoc1000影像凝胶记录(documentation)系统(BioRad，Mississauga，ONT.，Canada)和Multianalyst软件来定量每种产物的含量。

其它鱼类其它的hepcidin样序列的鉴定

从细菌刺激的大西洋大比目鱼和大西洋鲑鱼肝脏和脾脏中分离总RNA，并如上所述进行反转录(RT-PCR分析)。使用两组引物(参见legend，表2)，扩增的条件为：94℃、2min；94℃、30s，52℃、30s，72℃、30s，共32循环；及72℃、2min。将产物加到2％ NuSeive凝胶中，如上所述进行条带的切胶、克隆和测序。

活性阳离子肽的预测

图3中的成熟肽序列(由从鱼组织扩增的基因和PCR产物的核酸序列推导的pleurocidin样肽序列)构成了序列选择的基础。通常，根据广泛的序列分析，可产生具有净正电荷及模型中有较好分离的亲水和疏水残基的那些肽。尽管有一些假基因包含在成员中，通常还是可使用那些可能被表达的肽基因(具有启动子)。根据以下列出的几种因素来决定准确的起始/终止残基。在多数情况下，由于其直接跟随保守的信号肽区域并与其它成熟肽对齐较好，可较好地确定成熟肽的N-末端。一旦不能对N末端进行直接确定，可在N末端处进行GW或GF的搜寻尝试，因为其常出现在阳离子肽中。此外，可产生两种版本的WF1a(NRC-2和NRC-3)：一种含有N末端GRRKRK，而另一种不含有。在某些情况下，因为其后直接跟随有保守的酸性原片段，也可较好地确定成熟肽的C末端。但在许多肽中C末端氨基酸明显不准确。通常确定C末端氨基酸须遵循以下两条法则：(1)一旦甘氨酸出现在C末端或其附近，就认为其是羧基末端酰胺化合物的前体；(2)在C末端附近有大量的负电荷氨基酸通常认为是原片段的一部分而不是成熟的活性肽，而且不包括在所述序列中。

本研究使用的所有的抗菌肽是在英属哥伦比亚大学核酸蛋白服务中心(NAPS)通过N-(9-芴基)甲氧基羰基(Fmoc)化学合成的。肽序列如表4所示。在每种情况下通过HPLC和质谱分析来确定肽的纯度。对NRC-7通过RP-HPLC作进一步纯化直到获得同质的样品。

菌株和白色念珠菌(Candida albicans)

本研究使用的菌株全部列在表5中。大多数非鱼类菌株和Candidaalbicans在37℃生长在Mueller-Hinton肉汤(MHB；Difco Laboratories，Detroit)中，而鱼类细菌保存在16℃胰酶大豆肉汤(TSB；Difco，5g/l NaCl)中。所有菌株储存在-70℃直到融化使用，并每天进行次培养。以下菌株由英属哥伦比亚大学的R.E.W.Hancock教授惠赠：铜绿假单胞菌(Pseudomonas aeruginosa)K799(Z61的母体)、铜绿假单胞菌Z61(抗生素超级易感)，伤寒沙门菌(Salmonella typhimurium)14028s(MS7953s的母体)、伤寒沙门菌MS7953s(defensin超级易感)、以及表皮葡萄球菌(Staphylococcus epidermidis)(人类临床分离)和耐甲氧西林金黄色葡萄球菌(methicillin-resistant Staphylococcus aureus)(MRSA；由英属哥伦比亚大学A.Chow博士分离)。

大肠埃希菌(Escherichia coli)株CGSC4908(his-67，thyA43，pyr-37)，胸苷、尿苷和L-组氨酸营养缺陷型(Cohen et al.，1963)由E.coli遗传储存中心(耶鲁大学，New Haven，CT)免费提供。除非特别声明，用补充5mg/L胸苷、10mg/L尿苷和20mg/LL-组氨酸的MHB(Sigma Chemical Co.，St.Louis，MO)来生长E.coli CGSC 4908。

鲑鱼(salmonid)病原体Aeromonas salmonicida的两种区域隔离种群(field isolate)来自IMB菌株贮藏中心。

最小的抑制浓度

利用由Wu和Hancock(1999)改进的Amsterdam(Amsterdam，1996)的微滴定肉汤稀释方法，通过测定最小抑制浓度(MIC)来确定所述抗菌肽的活性。在96孔聚丙烯(Costar，Coming Incorporated，Coming，New York)微滴定板中进行肽的系列稀释。如上所述，将细菌或C.albicans生长过夜达到中期对数生长阶段，并稀释形成10⁶cfu/ml的最终接种体浓度。向96孔板中每孔加入细菌或酵母的悬浮液，并在适合的温度下孵育过夜。对于E.coli CGSC 4908，使用附加成分的MHB。将抑制定义为生长少于或等于在对照孔(没有肽加入)中观察到的生长状态的一半。每一MIC测定重复三次。

杀灭分析

通过标准方法学，检测暴露于最小抑制浓度(MIC)和10倍其MIC的所选择肽的细菌和C.albicans的活存。试验的生物体生长在MHB中并暴露在所述的肽中。在特定的时间间隔从培养物中取出相等的份数，接种在含MHB培养板，计数所产生的克隆。将百分比活存对时间以对数刻度作图。每个试验重复两次。

合成的抗菌肽的制备

活性阳离子肽序列的预测

图3(由从鱼类组织中扩增的基因和PCR产物的核酸序列推导的pleurocidin样肽序列)中的成熟肽序列构成了序列选择的基础。

针对肽作出的序列选择，所述肽具有净正电荷且在模型中含有空间分离较好的亲水和疏水残基，所述模型通过如下特别制备：

a)为估计正电荷，设K和R值为+1、H为+1/2、D和E为-1，并且C末端酰胺化合物计数为附加+1。

b)用NRC镜像网址(http：//bioinfo.pbi.nrc.ca：8090/EMBOSS/index.html)提供的EMBOSS Pepwheel和Pepnet互联网工具来分析螺旋轮和螺旋网模型中亲水和疏水残基的分离。

此外，尽管假基因也包括在这些成员中，通常产生可能被表达(具有启动子、可被转录等)的那些肽基因。

根据几个因素来决定准确的起始/终止残基：

a)在多数情况下，由于其直接跟随保守的信号肽区域并与其它成熟肽对齐较好，可较好地确定成熟肽的N-末端。

b)一旦不能直接确定N末端，可在N末端处进行GW或GF的搜寻尝试，因为其常出现在阳离子肽中。

c)此外，产生了两种版本的WF1a(NRC-2和NRC-3)：一种含有N末端GRRKRK，而另一种不含有；因为有假说认为带高度正电荷的GRRKRK可改进活性，因此进行该步骤。

d)尽管在某些情况下，因为其后直接跟随有保守的酸性原片段，因此也可较好地确定成熟肽的C末端，但在许多肽中C末端氨基酸存在明显的不准确性。通常在确定C末端氨基酸时须遵循以下两条法则：

(1)一旦甘氨酸出现在C末端或其附近，就认为其是羧基末端酰胺化合物的前体；

(2)在C末端附近有大量的负电荷氨基酸通常认为其是原片段的一部分而不是成熟的活性肽，而且不包括在所述序列中。

通过标准方法，体外筛查根据上述步骤产生的肽的抗菌活性。在体外表现抗菌活性的那些肽可用作体内使用和用于表面治疗等的抗菌肽。

实施例-结果

Pleurocidins

cDNA序列

从所述的皮肤cDNA文库中分离的2个克隆其序列相互一致，并在去除内含子后与基因组PCR产物WF2一致(如下)。它们含有356bp并编码68个氨基酸的开放读码框架(图1a)。除了polyA尾，存在26bp的5′-非翻译区和84bp的3′-非翻译区。在polyA尾上游22bp发现规范的(canonical)多聚腺苷化信号AATAAA。所述的开放读码框架的前22个氨基酸形成高度疏水区(图1b)，预测为有切除位点的信号肽，其准确地与所述的成熟pleurocidin的氨基末端匹配。所预测的23-47个残基氨基酸序列准确地与发表的成熟pleurocidin氨基酸序列匹配(箭头，图1a)。所述的成熟肽能够呈现两性螺旋，其在一个表面以带正电荷的氨基酸为主，而另一面以疏水氨基酸为主(图1c)。

羧基末端21个氨基酸形成负电荷区，其不出现在成熟的pleurocidin中，肯定了Cole et al.(2000)最近的报道。

基因组PCR

使用引物PL5′和PL3′扩增了四条不同的条带(WF1-4)(图4)。每种产物的序列分析结果与条带的大小一致并证实每种扩增产物是不同的(表6)。使用引物PL1和PL2扩增了两条不同的条带分别对应WF2和WF4，其含有附加的上游和下游序列(数据未显示)。当去除内含子序列后，WF2序列可准确地与分离自所述皮肤文库的pleurocidin cDNA克隆匹配(图1a)。

图4为美洲拟鲽基因组DNA的pleurocidin样序列PCR扩增结果的描述。将扩增产物(P)加到1％琼脂糖凝胶并使用100bp梯状带作为分子量标准(M)。可见的不同条带产物标为WF1(00bp)、WF2(810bp)、WF3(650bp)和WF4(510bp)。

所有四种pleurocidin样基因在编码序列中含有两个内含子，并且三个基因显示一致的内含子位置(WF1、WF2和WF4)。然而，WF3中的第二内含子位置出现在其它基因的内含子位置上游，产生较短的第二外显子和较长的第三外显子。四种pleurocidin基因中的内含子大小和序列各不相同(表6)。使用引物PL1和PL2从两个更广泛的基因组序列WF2和WF4获得的证据表明第三内含子紧靠并位于起始密码子上游也是这一基因家族的特征(图5)。这也证明了Cole et al(Cole，Darouiche et al.2000)报道的基因组序列。

对齐的预测氨基酸序列如图6所示。通过与对应的RT-PCR和cDNA衍生序列比较确定了内含子的位置(垂直箭头所示)。通过与发表的pleurocidin氨基酸序列(Cole，Weis et al.1997)比较，确定了成熟肽的位置。与图1c所示相似，所有预测的成熟肽呈现两性α螺旋结构，尽管WF1和WF3中的带正电荷部分不如WF2和WF4中的那样明显(数据未显示)。

图5描述了使用引物PL1/PL2通过PCR获得的WF4扩展基因组序列。内含子以小写字母显示而编码序列以大写字母显示。下划线部分为用于PCR的引物PL1和PL2的位置。

图6描述了对齐的5种美洲拟鲽pleurocidin家族成员预测的多肽序列。大的垂直箭头显示为在基因组序列中发现的内含子位置。由小的垂直箭头显示的WF3的第二内含子，比其它基因的那些更位于上游。dermaseptin B1(Amiche et al.1994)和ceratotoxin B(Marchini et al.1995)的预测多肽序列显示在pleurocidin家族成员的下面。框中的氨基酸由一半的序列共享。

从不同组织中来源的其它pleurocidin样序列的鉴定

Northern分析只能测定皮肤中的pleurocidin转录本(数据未显示)。但更加敏感的RT-PCR分析表明pleurocidin还表达在其它组织中，特别是鳃和内脏中。使用引物PL5′和PL3’，可从美洲拟鲽皮肤中获得两条带(265和175bp)，从肠中获得两条(215和175bp)。每种大小的多个克隆的序列分析显示当去除内含子序列后，265bp美洲拟鲽皮肤克隆对应WF1基因组序列(表7)。从皮肤来源的5个175bp的克隆和从肠来源的两个175bp克隆对应WF2基因组序列。这与使用对应WF2探针的cDNA克隆的Northern分析结果一致，所述探针只对来自皮肤的200-核苷酸的mRNA显示杂交(数据未显示)。另一方面，来自肠中的9个175bp克隆和来自皮肤的4个175bp克隆对应WF3的基因组序列。没有获得对应WF4的RT-PCR产物。所有7个215bp肠克隆对应新的家族成员(WF1a)，其不能由任何该研究所确定的美洲拟鲽基因组序列表示。

使用对每种如上述报道的pleurocidin样变体以及在Lambda克隆中鉴定的其它pleurocidin样变体特异的引物，可证明在不同组织中有不同的变体表达(图7)。WF2、WF3和WFYT的表达在组织中分布最广，而WF1和WF4主要在内脏和皮肤中表达，WFX只在皮肤中表达。不能在任何组织中检测到WF1a的转录本。

图7描述了不同美洲拟鲽组织中特异pleurocidin样基因的表达。组织为食管(E)、幽门胃(PS)、心脏胃(CS)、幽门盲肠(PC)、肝(L)、脾脏(SP)、肠(I)、直肠(R)、鳃(G)、脑(B)和皮肤(SK)。分子量标准(M)为100bp梯状带。引物对每种pleurocidin变体均特异(表2)。

不同发育阶段的其它的pleurocidin样序列的鉴定

使用来自pleurocidin样肽的高度保守区的引物PL5′和PL2(表1)，显示在5dph时有低水平的转录并在发育中增加(图8)。从成年皮肤中获得较强的信号而在肠组织中信号较弱。看家基因actin的表达在整个发育过程中相对不变。

使用对每种如上述报道的pleurocidin样变体以及在Lambda克隆中鉴定的其它的pleurocidin样变体特异的引物，证明在发育过程中的不同时间有不同变体的表达(图9)。只在20dph时检测到WFX转录本，在变态前(premetamorphic)幼鱼和变态青少年期鱼中检测到WF2、WF3和WFYT，在发育的任何阶段均没有检测到WF1和WF4。

图8所示为pleurocidin表达的反转录聚合酶链式反应分析。样本来自幼鱼(5和13dph)、变态(metamorphosing)幼鱼(20dph)及新变态幼鱼(27dph)、青少年期鱼(41dph)，皮肤来自鱼的下侧(LS)和上侧(US)，组织来自鱼的上(UI)下(LI)肠。使用pleurocidin(组A)和actin(组B)特异引物。

图9描述了在美洲拟鲽幼鱼发育中的特异pleurocidin样基因的表达。样本来自幼鱼(5、9和15dph)、变态幼鱼(20dph)及新变态幼鱼(25、30和36dph)、青少年期鱼(41dph)。也显示了单独使用5’或3’引物并且没有模板(NT)的对照。引物为对每种pleurocidin变体特异(表2)。

Southern分析

使用WF1、WF2、WF3及WF4基因组探针，对比目鱼(flatfish)DNA特异的阳性信号如图10所示。用黑线鳕鱼、狭鳕鱼(pollock)或胡瓜鱼DNA没有检测到信号(数据未显示)。所有四种探针均显示能够与四种比目鱼DNA的共用BamHI和SstI酶切条带杂交，这表明所述的基因簇集在这些基因组中。美洲拟鲽消化产物的杂交片段大小如表8所示。

图10描述了美洲拟鲽(WF)、美洲黄盖鲽(YF)、拟庸鲽(AP)和大西洋大比目鱼(AH)的pleurocidin基因的Southern分析结果。通过BamHI(B)或SstI(S)来消化总基因组DNA(7.5μg)，将其片段加到1.0％琼脂糖凝胶上。随后用对应WF1、WF2、WF3及WF4的探针对印记进行杂交。分子量标准(M)为用StyI消化的lambda DNA(24.0，7.7，6.2，3.4，2.7，1.9，1.4，0.9Kb)。

其它鱼类其它的pleurocidin样序列的鉴定

对齐的从拟庸鲽、美洲黄盖鲽、美首鲽、大西洋大比目鱼推导的pleurocidin样肽氨基酸序列如图3所示。从Petrale鲽、C-O鲽、英吉利鲽、箭齿鲽、欧洲欧鲽、格陵兰大比目鱼及太平洋大比目鱼的基因组DNA中获得序列。高度保守区出现在信号肽和酸性原片段区域中，而对应成熟肽的部分则显示更多的可变性。

图3描述了对齐的从以下种类的皮肤和/或肠中扩增的PCR产物和基因的核苷酸序列推导的pleurocidin样肽序列：美洲拟鲽(WF)、美洲黄盖鲽(YF)、美首鲽(GC)、拟庸鲽(AP)和大西洋大比目鱼(AH)。鉴定的pleurocidin样序列的特异非限定性的例子如表4所示。cDNA和/或基因组序列的非限定性的例子见附件I。

美洲拟鲽基因组中pleurocidin样序列的鉴定

从美洲拟鲽基因组文库中分离分别含有12.5和15.6kb片段的两个克隆。所述的12.5kb片段编码对应WF2的基因和两个假基因。所述的15.6kb片段编码对应WF1的基因、1个假基因和两个未曾描述过的pleurocidin样序列，将其称为WFX和WFYT。基因排列的示意图如图11所示。搜寻编码序列的序列上游发现一个经典的真核细胞启动子，TATA和CAAT框以及对多个转录因子高度保守的位点，所述转录因子包括NF-IL6、AP1及α-干扰素(图12)。在假基因的上游没有鉴定出启动子序列。

图12描述了pleurocidin基因和假基因上游的转录因子结合位点的位置。启动子用阴影框、内含子用实心框、外显子用点框表示。

抗菌活性肽序列的预测和评价

测定了化学制备的肽抗各种细菌病原体和C.albicans的最小抑制浓度，结果如表9所示。一般说来，许多肽都表现出抑制广谱细菌病原体和C.albicans生长的能力。具有广谱抗菌活性的肽的特别好的例子是来源自拟庸鲽的三种肽(NRC-11、NRC-12及NRC-13)以及来源自美首鲽的三种肽(NRC-15、NRC-16和NRC-17)。其中NRC-15、NRC-13及NRC-12分别具有杀灭耐甲氧西林金黄色葡萄球菌(图13)、铜绿假单胞菌(图14)及C.albicans(图15)能力。

图13描述了暴露于最小抑制浓度(MIC)和10倍MIC的NRC-15后，革兰氏阳性细菌(耐甲氧西林金黄色葡萄球菌-MRSA)的活存率。金黄色葡萄球菌生长在Mueller-Hinton肉汤中并暴露于MIC和10倍MIC的NRC-15中。在特定的时间间隔从培养物中取出等份，并接种在含MHB培养板，计数所产生的克隆。

图14描述了暴露于最小抑制浓度(MIC)和10倍MIC的NRC-13后，革兰氏阴性细菌(铜绿假单胞菌)的活存率。铜绿假单胞菌生长在Mueller-Hinton肉汤中并暴露于MIC和10倍MIC的NRC-13中。在特定的时间间隔从培养物中取出等份，并接种在含MHB的培养板，计数所产生的克隆。

图15描述了暴露于最小抑制浓度(MIC)和10倍MIC的NRC-12后，酵母(Candida albicans)的活存率。C.albicans生长在Mueller-Hinton肉汤中并暴露于MIC和10倍MIC的NRC-12中。在特定的时间间隔从培养物中取出等份，并接种在含MHB培养板，计数所产生的克隆。

除证明pleurocidin样肽具有广泛的抗细菌和C.albicans活性外，该结果表明从基因组序列中选择抗菌活性肽时，哪些因素应优先考虑。

首先，一组明显的很少或没有观察到活性的肽来自假基因(NRC-8、NRC-9、NRC-10)。这些结果表明，能够在宿主体中表达的肽可能是较好的抗菌肽候选者。

其次，前述的WF1a中N末端GRRKRK(图2)被证明是NRC-3中抗菌活性的决定因素，而NRC-2(与NRC-3相同但缺少上述片段)显示只有少量活性(表9)。这些结果强调了在成熟肽中仔细选择起始/终止残基的重要性，即使其在最初的前-原-序列中不明显。

因此在本发明的实施方案中，提供了具有GRRKRK氨基酸序列的一组pleurocidin相关抗菌肽。应当理解，也存在缺少这一序列的pleurocidin样抗菌肽，并在本文中特别考虑。

前述的原则在选择抗菌活性肽中是有效的，所述原则包括：选择在螺旋轮模型中具有较好分离的亲水和疏水残基的带正电荷的肽，保存N末端的GW或GF，酰胺化具有甘氨酸的C末端，及裁剪下酸性C末端氨基酸簇。

本发明中的肽可在多种pH值、盐浓度及温度下使用。这些肽可用于对抗生长在生物膜中的病原体或其它条件下的病原体生长或培养。参见例如图25，其中显示了NRC-13在50mM NaCl中的杀灭铜绿假单胞菌K799的能力。将NRC-13加入到附加了150mM NaCl的铜绿假单胞菌培养物中，使其最终浓度为4μg/ml(□)或40μg/ml(△)，分别表示MIC和10XMIC。同时显示了没有加入肽的对照(◆)。

可单独使用肽或与其前和原序列的一种或两种同时联合使用。

本发明的肽具有多种用途，包括抗细菌、抗真菌、抗病毒、抗癌及抗寄生虫剂，并包括与其它抗生素、抗感染剂和化疗剂联合使用以及它们之间的联合使用。

肽可用作免疫调节剂，例如伤口愈合、组织再生、抗败血症、免疫促进剂等等。也包括与其它试剂联合使用。

所述的肽可局部给药(包括例如，特别用于CF患者呼吸道感染的气雾剂、软膏、乳液、冲洗剂、眼部洗涤剂等等)，系统给药(包括例如iv、ip、im、皮下、腔内或透皮给药)及口服给药(例如丸剂、液体药剂、胶囊等等)。

当用于包括农业动物和/或植物的转基因系统给药时，通过包囊(包括在脂质体中)、类蛋白(proteinoid)给药也是可以考虑的。

肽可用作医疗设备(包括货物等等)、食品制备和包装机械中的保护性包被。

能够与本发明公开的肽在养殖作业中一起使用的抗生素的例子包括：Terramycin Aqua(土霉素)、Romet(磺胺间二甲氧嘧啶和ormetroprim)及Tribrissen(三甲氧苄氨嘧啶和磺胺嘧啶)。在养鸡场中，甲醛浸泡能够与本发明的肽一起使用。在本文所述的任何用途中，肽可相互组合和/或与常规抗生素联合使用。

Hepcidin

鉴定的hepcidin序列的特别的非限定性的例子如表11所示。cDNA或基因组序列的例子如附件II所示。

细菌刺激

注射后3天，使感染的大西洋鲑鱼昏睡和厌食。在取样中，注射后的鱼的肾脏后叶为杀鲑气单胞菌阳性，而对照鱼的肾脏后叶不是。

Hepcidin cDNA的分子特性

尽管美洲拟鲽EST数据库含有来自肝、卵巢、胃、肠、脾及幽门盲肠的cDNA文库的序列，大西洋鲑鱼EST数据库含有来自肝、头肾及脾的序列，只在两种鱼的脾和肝cDNA文库中检测到了hepcidin样序列。美洲拟鲽肝脏文库中135个EST中的4个(3.0％)和美洲拟鲽脾脏文库中281个EST中的2个(0.7％)编码hepcidin。大西洋鲑鱼肝脏文库中982个EST中3个(0.3％)编码hepcidin。还发现在扣除的脾脏大西洋鲑鱼cDNA库中有5个(1.8％)以及扣除的肝脏大西洋鲑鱼cDNA文库中有3个(0.6％)hepcidin序列，所述文库中在杀鲑气单胞菌感染过程中上调的转录本中增多。但是，由于它们是扣除文库，因而插入的仅仅是完全转录本的部分。

大西洋鲑鱼hepcidin cDNA核苷酸序列的分析表明，一个鲑鱼的EST(SL1-0412)约为300个核苷酸，长于另外两个。此外该hepcidin编码序列是不完全的。此克隆的完全测序表明存在有2个具有标准GT/AG拼接连接的内含子(图16a)。当去除内含子，可获得编码完全hepcidin样肽的开放读码框架。类似地，可扩增仍含有第二内含子的不完全拼接大比目鱼转录本(图16b)。与哺乳动物比较，鲑鱼的内含子和可能的大比目鱼位置相似但长度略短(图16c)。除这些不完全拼接的cDNA，我们还鉴定了美洲拟鲽EST(WF4)，其相对于其它序列(密切对应鲑鱼和人hepcidin的第二外显子)含有较大的缺失。在植物中出现的内含子位置是保守的，此缺失可与外显子2的去除有关，从而产生与WF3a和WF3b不同的肽(在其保留的肽中只有5个氨基酸位置不同)。

图16描述了编码I型鲑鱼hepcidin的未拼接的肝脏cDNA核酸序列。外显子序列用大写字母表示而推导的氨基酸序列在核酸序列的下方。gt/ag内含子/外显子交界用粗体标出，用下划线给出多聚腺苷酸信号(aataaa)。为编码I型鲑鱼hepcidin的来自大比目鱼脾脏的部分拼接cDNA核酸序列。c为人、小鼠及鲑鱼的内含子/外显子结构比较。用阴影框表示外显子，用单线表示内含子(大小用bp表示在下方)。

为了与提取自对应于日本牙鲽(两种)、青鳉(一种)、彩虹鳟鱼(一种)dbEST的hepcidin，以及最近报道的杂交条纹石鮨(Shike et al.2002)和两种大西洋大比目鱼(Hb 17 and Hb 357)的hepcidin的氨基酸序列进行对比，对齐列出了5种不同的美洲拟鲽hepcidin cDNA和两种不同的大西洋鲑鱼hepcidin推导的氨基酸序列。通过PCR从大西洋鲑鱼(Sal2.1和Sal8.6)和大西洋比目鱼(HB1.1、HB5.3和HB7.5)脾脏和肝获得的序列也包括在内(图17)。人的hepcidin作为哺乳动物的代表也包括在内。通过PSORT预测了信号肽酶的裂解位置，并鉴定了原肽转变酶(Nakayama 1997)典型的RX(K/)R基序(motif)(垂直箭头；图17)。信号肽序列为22-24个氨基酸并且在所有的鱼类序列中高度保守。根据特定的hepcidin变体，阴离子原片段(anionic propiece)为38-40氨基酸。加工后的hepcidin含有19-27个氨基酸，并除WF2外在中性pH下均带正电荷(表10)。在成熟肽中，来自比目鱼的I型和III型hepcidin和鲑鱼型hepcidin含有8个半胱氨酸残基，预计其可形成4对二硫键。II型美洲拟鲽hepcidin缺少2个半胱氨酸残基，表明最多可形成3对二硫键。Hb357含有5个半胱氨酸残基且与其它的hepcidin样序列明显不同。尽管通过某些方法预测了延伸链存在有短的伸展，二级结构预测方法的结果表明鱼类hepcidin的一致结构大部分为随机卷曲。

图17描述了美洲拟鲽(WF1、WF2、WF3a、WF3b、WF4)、大西洋比目鱼(Hb1.1、Hb5.3、Hb7.5、Hb17、Hb357)及大西洋鲑鱼(Sal1、Sal2、Sal2.1、Sal8.6)hepcidin与日本牙鲽(JFL4、JFL6)、青鳉、杂交条纹石鮨和人hepcidin的对齐比较。也显示了彩虹鳟鱼的部分序列(GenBank登录号AF281354_1)。用箭头表示信号肽酶和前蛋白裂解的预测位置。

从图17可见，非常明显所有比目鱼型hepcidin具有非常相似的信号肽，其某种程度上不同于鲑鱼型和人的hepcidin。鉴定的其它新的特征包括hepcidin不同的分组，其根据为：(1)半胱氨酸残基数目，(2)比目鱼III型中独特的插入FKC，(3)可能含有独特插入的两个其它位点，(4)截短的版本(比目鱼IV型)，(5)氨基末端较长的版本。

根据对齐比较，非常明显有至少3组不同的比目鱼hepcidin其共有的插入和缺失不同。WF2和JFL6(比目鱼II型)在靠近KR裂解位点共有一个7个氨基酸的缺失，产生19个氨基酸的加工后的肽，而WF3a、WF3b、WF4、Hb1.1、Hbl7、Hb5.3及Sal8.6(比目鱼III型)仅有4个氨基酸缺失(排除对应WF4缺失外显子的部分)，产生22个氨基酸的加工后肽。WF1和JFL4(比目鱼I型)不含这些缺失，但相对所有其它报道的hepcidin在临近信号肽酶裂解位点处含有插入。此外，相对所有其它报道的hepcidin，石鮨和青鳉的WF1在成熟的肽中共有一个氨基酸的插入，产生26-27氨基酸的肽。尽管其在5′和3′非翻译区含有一些沉默的取代和差异，WF3a和WF3b之间只有一个氨基酸的不同。Hb357代表可能的第四类比目鱼hepcidin。WF2和WF1的3′非翻译区非常不同于其它的hepcidin转录本。与其它比较，WF2含有较长的附加部分，WF1较短且保守性略差(图18A)。

所述的鲑鱼hepcidin样肽只有一组；4个报道的序列均共有两个缺失，彼此间在成熟肽中有四个氨基酸不同，且在上游前蛋白部分有4个氨基酸不同。鲑鱼hepcidin的3’非翻译区仅为中度保守(图18b)。

图18描述了(a)美洲拟鲽(WF1、WF2、WF3a、WF3b、WF4)与(b)大西洋鲑鱼(Sal1、Sal2)hepcidin cDNA的3’非翻译区的对齐比较。框内为保守的核苷酸。用箭头表示用于从大比目鱼和鲑鱼中扩增hepcidin同源物的引物位置。

美洲拟鲽Hepcidin基因的基因组组成

通过对应I型hepcidin的探针对多种鱼的基因组DNA进行Southern杂交分析，鉴定了在所有检测的比目鱼中存在而在其它鱼类中没有的条带(图19)。在美洲拟鲽中，有两个4.3和4.5kb片段与探针杂交。有两个相同大小的美洲黄盖鲽片段(4.3kb)和两个美首鲽基因组DNA片段(4.3和20kb)也被杂交，而仅有一个拟庸鲽片段(4.3kb)和一个日本牙鲽基因组DNA片段(5.5kb)被杂交。

图19描述了不同鱼类中hepcidin的Southern杂交分析结果。八目鳗鱼(Hg)、鲨鱼(Sh)、高首鲟(St)、美洲拟鲽(WF)、美洲黄盖鲽(YF)、拟庸鲽(AP)、美首鲽(Wi)、日本牙鲽(JF)、大西洋鲑鱼(AS)、胡瓜鱼(SM)及黑线鳕鱼(Hd)的基因组DNA的SstI消化产物(7.5μg)与美洲拟鲽的I型hepcidin杂交。分子量标准(M)为Lambda DNA的StyI消化产物。

通过RT-PCR对Hepcidin样序列的鉴定

图2描述了从大比目鱼和鲑鱼肝脏和脾脏hepcidin cDNA的扩增。从用细菌病原体感染来诱导抗菌肽基因表达的鱼组织中制备RNA，用如下列出的引物反转录和PCR。Actin作为对照来显示看家基因的表达。图中的标记为：HL-大比目鱼肝脏；SL-鲑鱼肝脏；HS-大比目鱼脾脏；SS-鲑鱼脾脏；M-分子量标准。引物5’U为所有反应使用的通用5′引物，Sal为Hc Sal(如下)，WF为HcPA3b(如下)。

Hep通用5’：AAGATGAAGACATTCAGTGTTGCA

HcPA33’B2：GTTGTTGGAGCAGGAATCC

HcSal：TGCTGGCAGGTCCTCAGAATTTGC

三种美洲拟鲽hepcidin的组织特异表达的RT-PCR分析结果如图20所示。在肝脏中I型hepcidin表达丰富，在心脏胃中相对较少。在任何组织中都检测不到II型hepcidin的表达，而在食道、心脏胃和肝脏中III型hepcidin中度表达。

在未感染的大西洋鲑鱼中，在肝脏、血液和肌肉中I型hepcidin以相当高的水平表达，而鳃和皮肤中表达水平较低，在肾脏前叶和肾脏后叶中几乎不表达(图21a，表10)。II型仅在鳃和皮肤中以几乎检测不到的水平表达(图21b)。然而，用杀鲑气单胞菌感染的鱼在大多数检测的组织中两种hepcidin均可表达(参见如下)。

不同年龄的美洲拟鲽幼鱼hepcidin基因表达的RT-PCR分析结果如图22所示。II型hepcidin转录产物在发育的任何阶段均不能检测到，而I型和III型hepcidin在变态前的幼鱼中能够被检测到。I型hepcidin比II型hepcidin的表达更丰富并在较早的时间表达(5dph vs.9dph.)。

图20描述美洲拟鲽不同组织中hepcidin和actin基因表达的反转录PCR分析。使用对比目鱼I型(组A)、II型(组B)和III型(组C)hepcidin和actin(310bp)的基因特异引物来进行成年美洲拟鲽扩增产物的扩增，将产物加入2％琼脂糖凝胶中进行电泳。分子量标准(M)为100bp梯状带(BRL)。

图21描述了对照大西洋鲑鱼(c)和其它用杀鲑气单胞菌(I)感染的鲑鱼的不同组织中的hepcidin和actin基因表达的反转录PCR分析结果。使用对鲑鱼I型(组A)、II型(组B)hepcidin(163bp)和actin(400bp)的基因特异引物得到扩增产物，将其加入2％琼脂糖凝胶中进行电泳。分子量标准(M)为100bp梯状带(BRL)。

图22描述了发育中的美洲拟鲽幼鱼的hepcidin和actin表达的反转录PCR分析结果。样本为5dph(泳道1)、12dph(泳道2)、19dph(泳道3)、27dph(泳道4)及41dph(泳道5)的幼鱼和成年鱼(泳道6)。使用对比目鱼I型(组A)、II型(组B)和III型(组C)hepcidin和actin(400bp)的基因特异引物获得扩增产物，将其加入2％琼脂糖凝胶中进行电泳，并使用100bp梯状带(Pharmacia)(泳道M)作为分子量标准。

对其它鱼类的其它hepcidin样序列的鉴定

使用根据所有报道的hepcidin的信号肽的高度保守序列设计的引物(Hep通用5’)结合根据鲑鱼(HcSal 3’)和比目鱼(HcPA3b 3’)的3’UTR的高度保守的序列设计的引物，从大比目鱼和鲑鱼的肝脏和脾脏中扩增hepcidin样序列是可能的(图2)。推导的美洲拟鲽、大西洋大比目鱼和大西洋鲑鱼的hepcidin样肽的氨基酸序列的对齐比较如图17所示。有意思的是，可以从鲑鱼(S8.6)中扩增比目鱼-型hepcidin，同时也可从比目鱼(Hb7.5)中扩增鲑鱼-型hepcidin。从Petrale鲽、C-O鲽、英吉利鲽、箭齿鲽、欧洲欧鲽、格陵兰大比目鱼and太平洋大比目鱼的基因组DNA中可获得其它序列。

图17显示了某些美洲拟鲽(WF1、WF2、WF3a、WF3b、WF4)、大西洋大比目鱼(Hb1.1、HB5.3、Hb7.5、Hb17、Hb357)及大西洋鲑鱼(Sal1、Sal2、Sal2.1、Sal8.6)hepcidin与日本牙鲽(JFL4、JFL6)、青鳉、杂交条纹石鮨及人的序列的对齐比较。也显示了彩虹鳟鱼的部分序列(Genbank登陆号AF281354_1)。信号肽酶和前蛋白裂解物的预测位置如箭头所示。

对论

Pleurocidin

大多数抗菌肽，包括cecropin和dermaseptin由多基因家族编码，其可能由连续的基因复制产生。我们证明美洲拟鲽以及可能的其它比目鱼具有编码与pleurocidin相似的抗菌化合物的基因家族。使用PL1/2与所述cDNA序列获得的基因组扩增产物(图1a)的比较表明WF2与WF4含有三个内含子，其第一个仅位于起始甲硫(蛋)氨酸的上游1bp。第二和第三个内含子均位于成熟肽的之中。GLa、xenopsin、levitide及caerulein的基因(所有来自非洲爪蟾的皮肤肽)还含有位于起始甲硫氨酸上游1bp的内含子(Kuchler et al 1989)。除WF3外，在所有基因中内含子的位置是保守的(图6)，但其大小有显著的差异(表5)，表明从复制事件的发生开始经历了相当长的进化阶段，或内含子序列可相对自由的漂移。

Southern分析表明WF1-4探针能够与其它比目鱼DNA包括美洲黄盖鲽、大西洋大比目鱼和拟庸鲽杂交，但不与黑线鳕鱼、胡瓜鱼或狭鳕鱼杂交。此杂交可能是由于高度保守的信号序列和我们已经证明在分离自比目鱼的序列中保守的阴离子部分而引起。比目鱼可提供用于养殖业的潜在治疗剂的丰富储备。针对不同pleurocidin家族成员的探针常可识别美洲拟鲽DNA中相同的限制性区域，表明它们可能在基因组中集簇在单一的位置上。与pleurocidin杂交的两个Lambda克隆的全测序证明这种集簇确实存在(图11)。除其它外，抗菌肽基因的集簇也在昆虫cecropins(Gudmundson et al.1991)和apidaecins(Casteels-Jossen et al.1993)中发现。

图11描述了美洲拟鲽pleurocidin样基因和假基因(Ψ)基因组组成的实施方案的示意图，内含子由实心框表示，外显子由点框表示。

Pleurocidin家族的所有成员编码为前原多肽，其由跟随有活性肽并由酸性部分结尾的氨基末端信号序列构成。信号和酸性序列的推导氨基酸序列高度保守，而预测的成熟抗菌肽序列较为可变(图6)。但是全部都折叠成两性α螺旋。这种序列保守性使我们不但可以利用基因组手段从美洲拟鲽中，而且还可以从多种其它的比目鱼中鉴定pleurocidin基因家族中许多不同的成员(图3，表4，附件I)。

Pleurocidin前原多肽结构与蛙的dermaseptin前体具有某种相似性，其也含有相似长度(22个氨基酸)的信号序列和16-25个氨基酸的酸性部分。从全长cDNA克隆来看(图1a)，该pleurocidin的酸性部分显示含有21个残基。Pleurocidin和dermaseptin前原多肽的主要区别为pleurocidin中酸性部分位于成熟肽的下游，而dermaseptin中位于成熟肽的上游。已认为Defensin的酸性原部分通过中和正电荷可防止抗菌肽与膜的相互作用(Valore et al.1996)，这可能也是其在pleurocidin中的功能。这一特性对于释放直到特异切除后才活化的肽特别实用。

pleurocidin家族成员的信号序列和酸性羧基末端序列极端地高度保守。前者，也许还有后者推测能够靶定前体分子到细胞膜表明来进行分泌。已经被dermaseptin家族(Valore et al.1996)及Gla、xenopsin、levitide和caerulein(所有这些为来自非洲爪蟾的皮肤肽(Kuchler et al.1989))所描述的具有不同生物活性的末端产物跟随含有高度保守的信号肽抗菌肽基因家族(常由第一外显子编码)。这些作者认为此模块化(modular)基因结构通过通常的途径使得可以实现对显著差异的肽为了分泌而实施靶定。在pleurocidin基因家族中，模块化结构也以编码信号序列和抗菌肽第一半的外显子2，编码抗菌肽的后续10个氨基酸的外显子3，以及编码抗菌肽最后3个氨基酸和酸性羧基末端的外显子4出现。

由WF2和WF4编码的成熟肽相互间有60％相同(图6)，而与dermaseptin B1和ceratotoxin B相似以较少(Cole et al.1997)。WF1与WF1a有64％相同，但在信号序列与成熟肽间含有明显的18个氨基酸的阳离子延伸，而其在WF1a中不存在。当pleurocidin WF1加工时是否存在这种潜在的抗菌18-mer肽还需鉴定。相对WF2、WF3和WF4在成熟肽和酸性羧基末端间，WF1和WF1a都含有附加的10-11氨基酸。WF3与WF2/4和WF1/1a均有相似性。已证明与WF2中间部分相同的合成pleurocidin能够防止由鳗弧菌(Vibrio anguillarum)引起的Coho鲑鱼感染，根据pleurocidin、dermaseptin和ceratotoxin得到的杂交肽也具有这种作用(Jia etal.2000)。

通过Northern印记分析和RT-PCR来评价pleurocidin基因的组织特异表达。对于美洲拟鲽mRNA中存在的低水平转录，已证明Northern分析不够敏感。只有在皮肤中有足够的转录量可用此方法来测定，因此使用更加敏感的RT-PCR分析。使用此方法发现在皮肤和肠中均有Pleurocidin转录，这与最近报道的这些组织中pleurocidin的超结构定位一致(Cole，Darouiche et al.2000)，并且支持了pleurocidin在粘膜免疫中的作用。转录大小(约200bp)与RT-PCR得到的产物大小一致(表7)，表明pleurocidin基因是分别转录的。

RT-PCR分析表明不同pleurocidin样肽的基因以组织特异形式表达，其中WF2主要在皮肤和鳃中表达，而肌肉、肠、胃和肝脏中表达量较少，而WF1和WF4主要在鳃和皮肤中检测到(图7)。WF3和WFYT在多数组织样本中表达，WFX只在皮肤中检测到，而WF1a在任何组织样本中不表达。可能地，在两种组织中，需要不同的抗菌肽控制不同菌群的生长。因为对于WF4没有检测到RT-PCR产物，因此可能这种基因只在成年皮肤或肠中以低水平表达或者在不同的生命阶段或在不同的组织中表达。

使用在不同的pleurocidin样基因转录产物中没有区别的引物，表达首先在5dph中检测到并随着其不断成长而呈现不断增加的趋势。但是在使用对WF1、WF1a、WF2、WF3、WF4、WFX和WFYT特异的引物的近期试验中，可在不同的发育阶段检测到转录本(图9)。WFX仅在20dph时检测到，而WFYT、WF3和WF2可在5dph检测到，并且在25-36dph之间具有更高的水平。有趣的是，在任何幼鱼阶段均不能检测到WF1，并且其可能只在特定环境条件下对特定的细菌病原体反应才有表达，如对Drosophila所示的(Rivas and Ganz 1999)。这是第一次证明了鱼类中抗菌肽的发育中表达，并且表明这种天生的免疫成分至少存在于美洲拟鲽的早期幼鱼阶段。变态前幼鱼的死亡受到了极大的关注，尽管其死亡原因仍不清楚，有推测可能是由内脏中的高细菌刺激导致的(Padros，Minkoffet al.1993)。已证明比目鱼的适应性免疫系统发育晚于其它硬骨鱼的免疫系统(Padros，Sala et al.1991)。因此，在此阶段幼鱼产生抗菌肽的能力对其活存是至关重要的，鉴定可增加此种化合物产生的因素对养殖业者有极大的好处。

合成肽抗多种细菌病原体和真菌病原体Candida albicans的检测结果表明了具有广谱抗菌活性的有前景的候选者。特别感兴趣的是NRC-13和NRC-15肽以4μg/ml的低浓度抑制耐甲氧西林金黄色葡萄球菌生长的能力。NRC-13还可在4μg/ml抑制C.albicans的生长，在1μg/ml抑制铜绿假单胞菌的生长(及在此浓度杀灭铜绿假单胞菌)以及在2μg/ml浓度抑制杀鲑气单胞菌。这意味着NRC-13有高度抗鱼类病原体、革兰氏阴性人细菌、耐药物革兰氏阳性人细菌及酵母的活性。NRC-13的例子展示了阳性抗菌肽潜在的靶标和应用范围。

这些结果还验证了我们用于从大量序列资料中选择抗菌活性肽的方法。准确预测哪种肽可能具有活性的能力是基因组和治疗学间连接的关键。虽然在这个领域中还有大量工作需要进行，但我们对前述规则的合理应用的清楚地展示将有助于活性肽的选择。

因此，已经分离了多种cDNA和基因组序列，其编码与多种比目鱼类中pleurocidin相同或类似的抗菌肽前体。Northern杂交和RT-PCR产物的序列分析表明其表达是组织特异的。最重要的是，测定了发育中的美洲拟鲽幼鱼中不同pleurocidin变体的表达时间性，使得可以对此种鱼的天生免疫系统的发生进行评估。这些pleurocidin表达的分析可用于指导在特定组织和/或发育阶段中分离表达的新的肽序列的筛选策略。还可分析影响pleurocidin产生的环境因素。

这项工作为进一步研究奠定了基础，这些研究致力于作为养殖鱼的治疗剂的pleurocidin的过量表达以及通过转基因技术(其已在表达抗菌肽的转基因烟草中证实(Jach et al.1995)并建议用于鱼类(Jia et al.2000))产生抗疾病的鱼。此外，由于许多鱼生活在含盐的环境中，因此其抗菌肽的特性可能与陆地动物产生的不同，且可在独特的情况下应用。例如，具有胞囊纤维化的患者的肺粘膜含有升高的NaCl浓度，其可抑制由肺分泌的天然阳离子肽(Goldman et al.1997)。来自海洋鱼类的盐适应性阳离子肽可应用于这类患者的肺部感染。

Hepcidins

一种鲑鱼EST(SL1-0412)和一种大比目鱼克隆(Hb7.5)的序列分析显示了未拼接转录产物的存在，且使得可确定某些内含子的位置(图16)。与小鼠、人和杂交条纹石鮨相似，鲑鱼hepcidin由3个外显子和两个内含子组成(Park，Valore et al.2001；Shike et al.2002；Pigeon，Ilyin et al.2001)。鲑鱼与石鮨第一内含子的位置相同，并对应小鼠和人的该序列的两个5’氨基酸位置。但是第二鲑鱼内含子和第二大比目鱼内含子Hb7.5对应人和小鼠的该序列的两个3’氨基酸位置和石鮨的多个5’氨基酸位置。这可能是由于“内含子滑动”，从而在经过一段进化后其内含子的位置发生了几个核苷酸的漂移。有趣的是，WF4中的缺失准确对应在第一鲑鱼内含子及第二小鼠/人内含子位置，表明一种内含子/外显子的中间结构。

小鼠含有两个hepcidin基因，其集簇在基因组上(Pigeon，Ilyin et al.2001)但在人类(Park，Valore et al.2001)和杂交条纹石鮨(Shike et al.2002)中只鉴定到一个hepcidin基因。尽管还需对美洲拟鲽和大西洋鲑鱼的hepcidin基因数目进行鉴定，但是至少在美洲拟鲽中有5个基因，在大西洋大比目鱼中有5个，在大西洋鲑鱼中有4个基因。由于在Southern杂交分析中使用的hepcidin探针中没有SstI酶切位点，因此本文报道的5个美洲拟鲽hepcidin基因极有可能集簇在两个基因组片段上。同样存在pleurocidin的多基因(Douglas，Gallant et al.2001)并集簇在基因组上(图11)。有趣的是，检测的来自大西洋的所有小蝶鱼均出现较小的4.3kb杂交条带，表明它们在基因组水平共有相似性。在太平洋中发现的日本牙蝶表现出单一的5.5kb的杂交条带。

鱼类前原hepcidin的推导氨基酸序列可与哺乳动物的全长序列进行对齐但只在对应加工后的肽的部分表现高度的相似性(图17)。但是，鱼类中的信号肽和原片段同样非常高度保守。在pleurocidin家族中也发现这些片段的保守性(Douglas，Gallant et al.2001)。加工后的肽的氨基末端根据人hepcidin的氨基酸序列(Krause，Neitz et al.2000；Park，Valore et al.2001)及与加工位点的RX(K/R)R基序特性的相似性(Nakayama 1997)进行分配。美洲拟鲽和大西洋鲑鱼的加工后的hepcidin分子量范围为1992Da(WF2)至3066(WF1)，与从小鼠、人和石鮨中分离的hepcidin相当。除具有酸性pI(5.54)的WF2外，hepcidin的pI在7.73-8.76。

与pleurocidin相似，hepcidin变体的氨基酸序列在种类间高度相似，表明一个祖先基因的相对较近的复制。有可能与陆生哺乳动物相比，在鱼生存的水生环境中需要更多不同组抗菌肽存在。此外，这种天生免疫系统的成分在鱼中比在哺乳动物中发挥更主要的作用，哺乳动物具有更高级的进化适应免疫系统。

人类hepcidin分子被认为可以形成含有一系列β折叠、环及弯曲的β-片层的二级结构(Park，Valore et al.2001)。鱼hepcidin的一致二级结构预测表明其含有基本上自由的卷曲结构及一些延伸的链(strand)结构。因而除WF2、JFL6和Hb357外，所有报道的hepcidin含有8个半胱氨酸残基，其可形成4个二硫键(Krause，Neitz et al.2000；Park，Valore et al.2001)并以以下的方式连接：1-4、2-8、3-7、5-6(Park，Valore et al.2001)。WF2中半胱氨酸残基1和3的缺失表明至少有1个二硫键不能形成。

使用基因特异引物，我们能够证明在美洲拟鲽(图20)和大西洋鲑鱼(图21)的不同组织中均可表达不同的hepcidin基因。在大西洋鲑鱼中在正常的未感染的鱼中，主要在肝脏、血液和肌肉中可检测到hepcidin(I型)，而在鳃和皮肤中量较少(两种类型)。这与cDNA文库(该文库构建自未感染的肝脏)中存在I型hepcidin的3个EST一致，以及与cDNA文库(该文库构建自未感染的肝脏、脾脏和头肾)中不存在II型hepcidin的EST一致。II型hepcidin的表达表现为限定在与水生环境接触的外部上皮表面，而I型hepcidin表达更加广泛，其可在肝脏、血液和肌肉以及外部上皮表面表达。在未感染的美洲拟鲽中，在任何组织中不能检测到II型hepcidin的转录产物，但在肝脏和心胃中存在I和III型hepcidin的转录产物。III型hepcidin转录产物还可出现在食道中。

也有报道，使用一种小鼠hepcidin序列作为探针，通过Northern分析发现小鼠hepcidin主要在肝脏中表达，而在胃、肠、结肠、肺、心和胸腺中表达较弱(Pigeon，Ilyin et al.2001)。但是，本研究不能区分两种hepcidin基因，而且不清楚此两种小鼠基因在小鼠不同的组织表达是否不同。相似地，使用人hepcidin cDNA作为探针对人组织和细胞株进行的斑点印记(dot-blot)分析显示，在成年和胎肝中表达较强，而在成年心、胎心和成年脊髓索中表达较弱(Pigeon，Ilyin et al.2001)。在使用实时定量RT-PCR的在先研究(Krause，Neitz et al.2000)中显示在人肝脏、心和脑中hepcidin的表达较强，而在其它的各种组织中表达较弱。有趣的是，我们在正常的大西洋鲑鱼或美洲拟鲽的脑中、或正常大西洋鲑鱼的心中检测不到型I和II型hepcidin的表达。但是在感染的动物中，II型hepcidin可在两种组织中表达，表明此形式是应激条件下表达的主要的一种。

有趣的是，我们发现在大西洋鲑鱼的血细胞中组成型表达的I型hepcidin的转录产物。据报道在鱼类的血液中很少有组成型表达的非酶抗菌分子；只在彩虹鳟鱼的粘膜中发现有小的疏水性阳离子肽(Smith et al.，2000)及在未感染的动物血液中表达moronecidin(石鮨的抗菌肽)(Lauth etal.2002)。有趣的是，相对于未感染的对照动物，感染的鲑鱼血液中没有hepcidin的表达增加。可能的原因是，在对照动物中hepcidin发挥铁离子内环境稳定及抗菌的作用。其在未感染的动物血液中出现是对临近的感染发挥预防作用。

在杀鲑气单胞菌感染过程中大西洋鲑鱼I型和II型hepcidin表达上调，但在不同的组织中表达量不同。在食道、胃、幽门盲肠、肝脏、脾脏、肠、肾脏后叶、直肠和肌肉中I型hepcidin表达明显上调，而在肾脏前叶和皮肤中表达较低。II型hepcidin在胃、幽门盲肠、肝脏、脾脏、肠、脑、心脏和肌肉中表达明显增加。而在食道、肾脏前叶和肾脏后叶、皮肤及直肠中表达只有较弱的上调。这些结果与细菌刺激的杂交条纹石鮨的报道一致，其中在肝脏中表达明显上调，而在皮肤、鳃、肠、脾脏、肾脏前叶和血液中也证明有表达(Shike et al.2002)。并不清楚，在杂交条纹石鮨中是否有多种hepcidin，如果有，其表达是否与大西洋鲑鱼和美洲拟鲽中一样具有表达差异。

对小鼠的研究表明注射LPS的小鼠的肝脏中hepcidin表达增加4.3倍，暴露于LPS的原代肝细胞有7倍的增加(Pigeon，Ilyin et al.2001)。这些研究以使用小鼠hepcidin序列作为探针进行的Northern分析为基础，因此不能区分两种小鼠变体可能的表达差异。对铁的超负载可在小鼠肝脏中发现相似的增加，但对暴露于柠檬酸铁后的原代肝细胞没有增加，其可能是由培养的肝细胞的分化状态不同而导致的。铁负载和LPS暴露均可引起hepcidin表达增加的事实表明这两种因素在宿主对病原体反应中的重要性。

在感染中，通过各种机制将铁从系统中去除，使得其不能被侵入的病原体使用。有人认为，最近发现的转铁蛋白受体2介导了肝细胞对铁的摄取并增加了hepcidin的表达(Fleming and Sly 2001；Nicolas，Bennounet al.2001)。Hepcidin依次增加了巨嗜细胞中铁的积累，并通过β2微球蛋白、HFE和转铁蛋白受体1增加十二指肠隐窝(crypt)细胞中饮食(dietary)铁的吸收。这些隐窝细胞分化为含有铁转运蛋白量下降的肠隐窝(enterocyte)，由此减少饮食铁的摄取。因此Hepcidin可在炎症反应中对铁稳态发挥关键作用，并作为抗菌肽发挥作用。也可能Hepcidin可调节肝来源的急性阶段蛋白的表达，并与免疫系统的其它成分一起展现出协同作用。

已证明抗菌肽可在小鼠巨嗜细胞中调节基因表达(Scott，Rosenbergeret al.2000)，并且有可能其可在鱼巨嗜细胞或肝细胞中表现相似的作用。小鼠和人prohepcidin中存在功能性核定位信号(连续4个K/R残基)表明hepcidin可作为信号分子在维持这些生物体的铁稳态中发挥作用(Pigeon，Ilyin et al.2001)。有趣的是，该核定位信号还含有用于加工prohepcidin的识别信号，表明核定位只在原片段去除前发生、或该原片段本身被局限于所述核中。硬骨鱼hepcidin只含有4个K/R残基中的3个，其不能满足核定位的需要；还需要进行合成的或离体表达的肽的检测来确定hepcidin在细胞内信号产生的作用。

总之，通过Southern杂交确定了来自不同鱼类的新的hepcidin样肽的序列和多种比目鱼类中相关序列的存在。此外，已证明不同型的鱼hepcidin在正常鱼(细菌感染的结果)以及在幼鱼的发育中，以组织特异的形式不同地表达，因此提供了鉴定新肽的其它序列的策略。非常明显，在鱼中不同组织以组成或诱导方式产生hepcidin，表明hepcidin变体在不同的环境中可发挥不同的作用。由于它们在哺乳动物的铁稳态中发挥作用，因此有可能鱼hepcidin变体可实现这种功能以及杀灭特异病原体的功能。Hepcidin变体的体外表达可使其抗菌活性范围及其对天生免疫反应的作用得到鉴定。

因此，本发明提供了鉴定潜在抗菌肽的方法。表

表1.用于分离pleurocidin样序列的寡核苷酸的核酸序列。

表2.用于检测美洲拟鲽不同组织和不同发育阶段的pleurocidin样基因表达的寡核苷酸的核酸序列。

表3.在RT-PCR检测中用来分析hepcidin基因表达的引物的核酸序列。给出了5′引物设计基础的氨基酸序列。3′引物位于3′翻译区(3′UTR)。表中列出了PCR反应中的退火温度及扩增产物的大小。

表4.基于基因组和表达数据的pleurocidin单字母氨基酸序列。

表4a.本研究采用的细菌与念珠菌株。

表5.使用PL5′和PL3′扩增的基因组序列中内含子的大小(bp)。

表6.来自皮肤和肠的对应不同的pleurocidin基因的RT-PCR产物。

表7.美洲拟鲽DNA的BamHI和SstI消化产物中用pleurocidin探针杂交的条带大小(kb)。

表8.针对广谱的细菌病原体和Candida Albicans的pleurocidin样阳离子抗菌肽的最小抑制浓度。

表9.美洲拟鲽和大西洋大比目鱼hepcidin样肽的特性。

表10.hepcidin表达的PCR分析结果。

表11.基于基因组和表达数据的某些hepcidin单字母氨基酸序列，包括NRC参考号。

表12.对应表11和表13所列的氨基酸序列的核酸序列。

表13.基于基因组和表达数据的某些hepcidin单字母氨基酸序列，包括克隆名称。

附件

附件I.参照表4的pleurocidin样基因和cDNA的核酸序列。

附件II.参照表11的hepcidin样基因和cDNA的核酸序列。

参考文献

引用的参考文献不是承认或暗示其与本文所公开的任何发明的专利性有关。

Amsterdam，D.1996.Susceptibility Testing of Antimicrobials in LiquidMedia.In V.Lorian (ed.)，Antibiotics in Laboratory Medicine.Williams andWilkins，Baltimore.

Casteels-Jossen，K.，T.Capaci，et al.(1993).″Apidaecin multipeptideprecursor structure：a putative mechanism for amplification of the insectantibacterial response.″EMBO J.12：1569-78.

Cohen，S.，M.Skiguchi，J.Stern，and H.Barner.1963.The synthesis ofmessenger RNA without protein synthesis in normal and phage-infectedthymineless strains of Eschericliia Coli.Proc.Natl.Acad.Sci.U.S.ABiochem.49：699-706.

Cole，A.M.，R.O.Darouiche，et al.(2000).″Characterization of a fishantimicrobial peptide：gene expression，subcellular localization，andspectrum of activity.″Antimic.Ag Chemotherapy.44：2039-45.

Cole，A.M.，P.Weis，et al.(1997).″Isolation and characterization ofpleurocidin，an antimicrobial peptide in the skin secretions of winter flounder.″J.Biol.Chem.272(18)：12008-12013.

Douglas，S.E.，C.E.Bullerwell，et al.(1999).″Molecular investigationof aminopeptidase N expression in the winter flounder，PleuronectesAMERICANUS.″J.Appl.Ichtyol.15：80-86.

Douglas，S.E.，J.W.Gallant，et al.(1999).″Winter flounder expressedsequence tags：establishment of an EST database and identification of novelfish genes.″Mar.Biotechnol.1：458-464.

Douglas，S.E.，J.W.Gallant，et al.(1998).″Isolation of cDNAs fortrypsinogen from the winter flounder，Pleuronectes americanus.″J.Mar.Biotechnol.6：214-9.

Douglas，S.E.，J.W.Gallant，et al.(2001).″Cloning and developmentalexpression of A family of pleurocidin-like antimicrobial peptides from winterflounder，Pleuronectes americanus(Walbaum).″Dev.Comp.ImmunoL 25：137-147.

Douglas，S.E.，A.Gawlicka，et al.(1999).″Ontogeny of the stomach inwinter flounder：characterisation and expression of the pepsinogen andproton pump genes and determination of pepsin activity.″J.Fish Biol. 55：897-915.

Douglas，S.E.，S.C.M.Tsoi，et al.(2002).Expressed sequence tags-asnapshot of the fish genome.A Step Toward the Great Future of AquaticGenomics，Tokyo，Japan.

Fleming，R.E.and W.S.Sly(2001).″Hepcidin：A putativeiron-regulatory hormone relevant to hereditary hemochromatosis and theanemia of chronic disease.″Proc.Natl.Acad.Sci.USA98(15)：8160-8162.

Garvan，J.(1996).SeqVu.Sydney，Australia，The Garvan Institute ofMedical Research.

Goldman，M.J.，G.M.Anderson，et al.(1997).″HumanBETA-DEFENSIN-1 is a salt-sensitive antibiotic in lung that is inactivatedin cystic fibrosis.″Cell.88：553-60.

Gong，Z.，K.V.Ewart，et al.(1996).″Skin antifreeze protein genes ofthe winter flounder，PLEURONECTES AMERICANUS，encode distinct andactive polypeptides without the secretory signal and prosequences.″J.Biol.Chem.271：4106-12.

Gudmundsson，G.H.，D.A.Lidholm，et al.(1991).″The cecropin locus.Cloning and expression of a gene cluster encoding three antibacterialpeptides in Hyalophora cecropla.″J.Biol.Chem.166：11510-7.

Hwang，E.-Y.，J.-K.Seo，et al.(1999).″Purification andcharacterization of a novel antimicrobial peptide from the skin of the hagfish，Eptatretus burgeri.″J.Food Sci.Nutr.4(1)：28-32.

Jach，G.，B.Gornhardt，et al.(1995).″Enhanced quantitative resistanceagainst fungal disease by combinatorial expression of different barleyantifungal proteins in transgenic tobacco.″Plant J.8：97-109.

Jia，X.，A.Patrzykat，et al.(2000).″Antimicrobial peptides protect cohosalmon from Vibria anguillarium infections.″APPL.Environ.Mirobiol.66：1928-32.

Krause，A.，S.Neitz，et al.(2000).″LEAP-1，a novel highlydisulfide-bonded human peptide，exhibits antimicrobial activity. ″FEBS Lett.480：147-150.

Kuchler，K.，G.Kreil，et al.(1989).″The genes for the frog skinpeptides GLAA，xexopsin，levitide，and caerulin contain a homologousexport exon encoding a signal sequence and part of an amphiphilic peptide.″Eur.J.Biochem.179：281-5.

Lauth，X.，H.Shike，et al.(2002).″Discovery and characterization oftwo isoforms of moronecidin，a novel antimicrobial peptide from hybridstriped bass.″J.Biol.Chem.277：5030-5039.

LeMaitre，C.，N.Orange，et al.(1996).″Characterization and ionchannel activities of novel antibacterial proteins from the skin mucosa ofcarp (Cyprinus carpio).″EUR.J.Biochem.240：143-149.

Marck，C.(1992).DNA Strider Version 1.2.Service de Biochimie-Bat142，Centre d′Etudes Nucleares de Sacray.Gif-sur-Yvette，France.

Moore，K.S.，S.Wehrli，et al.(1993).″Squalamine：an aminosterolantibiotic from the shark.″Proc.Natl.Acad.Sci.USA.90：134-1358.

Nakayama，K.(1997).″Furin ：a mammalian subtilisin/Kex2p-likeendoprotease involved in processing of a wide variety of precursor proteins.″Biochemical J.327：625-635.

Nicolas，G.，M.Bennoun，et al.(2001).″Lack of hepcidin geneexpression and severe tissue iron overload in upstream stimulatory factor 2(USF2) knockout mice.″Proc.Natl.Acad.Sci.USA.98(15)：8780-8785.

Oren，Z.and Y.Shai(1996).″A class of highly potent antibacterialpeptides derived from pardaxin，a pore-forming peptide isolated from Mosessole fish Pardachirus marnioratus.″Eur.J.Biochem.237(1)：303-310.

Padros，F.，G.Minkoff，et al.(1993).″Histopathological eventsthroughout the development of turbot(Scophthalmus maximus L.).″J.Comp.Pathol.109：321-4.

Padros，F.，R.Sala，et al.(1991).Organogenesis in turbot，Scophthalnius maxinius，larvae related to the main developmental stages：inLarvi′91.Fish and Crustacean Larviculture Symposium.Ghent，Belgium：European Aquaculture Society.

Park，C.B.，J.H.Lee，et al.(1997).″A novel antimicrobial peptidefrom the loach，Misgurnus anguillicandatus.″FEBS Lett.411：173-178.

Park，C.H.，E.V.Valore，et al.(2001).″Hepcidin，a urinaryantimicrobial peptide synthesized in the liver.″J.Biol.Chem. 276(11)：7806-7810.

Park，I.Y.，C.B.Park，et al.(1998).″Parasin I，an antimicrobial peptidederived from histone H2A in the catfish，Parasilurus asotus.″FEBS Lett.437(3)：258-262.

Pigeon，C.，G.Ilyin，et al.(2001).″A new mouse liver-specific gene，encoding a protein homologous to human antimicrobial peptide hepcidin，isoverexpressed during iron overload.″J.Biol.Chem.276(11)：7811-7819.

Rivas，L.and T.Ganz.(1999).″EUKARYOTIC antibiotic peptides：notonly a membrane business.″Drug Discovery Today.4：254-6.

Scott，M.G.，C.M.Rosenberger，et al.(2000).″An a-helical cationicantimicrobial peptide selectively modulates macrophage responses tolipopolysaccharide and directly alters macrophage gene expression.″J.Immunol.165：3358-3365.

Shike H，Lauth X，Westerman ME，Ostland VE，Carlberg JM，Van OlstJC，Shimizu C，Bums JC(2002).″Bass hepcidin is a novel antimicrobialpeptide induced by bacterial challenge.″Eur J Biochem：269：2232-2237.

Silphaduang，U.and E.J.Noga(2001).″Peptide antibiotics in mast cellsof fish.″Nature 414：268-9.

Smith，V.J.，J.M.O.Fernandes，et al.(2000).″Antibacterial proteins inrainbow trout，Oncorhynchus mykiss.″Fish Shellfish Immunol.10：243-260.

Thompson，J.，D.Higgins，et al.(1994).″CLUSTAL W：improving thesensitivity of progressive multiple sequence alignment through sequenceweighting，position specific gap penalties and weight matrix choice.″NucleicAcids Res.22：4673-4680.

Trust T.J.，Ishiguro，E.E.，Chart，H.and Kay W.W.(1983)Virulenceproperties of Aeromonas salmonicida.J.World Maricul.Soc.14：193-200.

Valore，E.V.，E.Martin，et al.(1996).″INTRAMOLECULAR inhibitionof human defensin HNP-1 by its propiece.″J.Clin.Invest.97：1624-9.

Wu，M.，E.Maier，R.Benz，and R.E.W.Hancock.1999.Mechanism ofinteraction of different classes of cationic antimicrobial peptides with planarbilayers and with the cytoplasmic membrane of Escherichia coli. Biochem.38：7235-7242.

表1.用于分离pleurocidin样序列的寡核苷酸的核酸序列

引物氨基酸序列核酸序列(5′_3′)

筛选cDNA文库

PleuroA FFKKAAHVGKH TTCTTCAAGAAGGCYGCYCAYG

T[C/G]GG[C/A]AAGCA

PleuroB HVGKAALTHYL¹ CAYGT[C/G]GG[C/A]AAGGCYGC

YCT[C/G]AA[C/T/A]CAYTACCT

基因组PCR与RT-PCR

PL1 5′非翻译区 GCCCACTTTGTATTCGCAAG

PL2 3′非翻译区 CTGAAGGCTCCTTCAAGGCG

PL5′ MKFTATF ATGAAGTTCACTGCCACCTTC

PL3′ KRAVDE¹ TCATCGACTGCGCGCTT

1互补

表2.用于检测美洲拟鲽不同组织和不同发育阶段的pleurocidin样基因表达的寡核苷酸的核酸序列

基因引物氨基酸序列核酸序列(5′_3′)

WF1 RTWF1 KGRWLER AAGGGCAGGTGGTTGGAAAGG

RTWF1/3′ YQEGEE¹ CCCTCCCCCTCCTGGTA

WF1a RTWF1a RKRKWLR CGTAAGAGAAAGTGGTTGAGA

RTWF1a/3′YQEGEE¹ CCCTCCCCCTCCTGGTA

WF2 RTWF2 KAAHVG AAGGCTGCTCACGTTGGC

PL2 3′非翻译 CTGAAGGCTCCTTCAAGGCG

WF3 RTWF3 FLGALIK TTCTTAGGAGCCCTTATCAAA

RTWF3/3′ YDEQQE¹ CTCCTGCTGCTCGTCATA

WF4 RTWF4 HGRHAA CATGGTCGTCATGCTGCC

PL2 3′非翻译 CTGAAGGCTCCTTCAAGGCG

WFYT RTWFYT GFLFHG GGGATTTCTTTTTCATGG

RTWFYT/3′SFDDNP¹ GGGTTGTCATCGAATGAG

WFX RTWFX RSTEDI CGTTCTACAGAGGACATC

RTWFX/3′ DDDDSP¹ GGGGCTGTCATCATCATC

表3.在RT-PCR检测中用来分析hepcidin基因表达的引物的核酸序列。给出了5′引物设计基础的氨基酸序列。3′引物位于3′非翻译区(3′UTR)。表中列出了PCR反应中的退火温度及扩增产物的大小。

类型(大小)(bp)	引物产物	氨基酸序列	核酸序列(5′_3′)	退火温度
类型(大小)(bp)	引物产物	氨基酸序列	核酸序列(5′_3′)	退火温度	美洲拟鲽I型II型III型Actin大西洋鲑鱼I型II型Actin	HcPA15′137HcPA1b3′HcPA25′180HcPA2b3′HcPA35′118HcPA3b3′ActF(WF)312ActR(WF)^*ActinFI194ActinR1HCSS5′163HepLivRHepSpF163HepSpRAct400F400Act400R	WMENPT3′UTRGMMPNN3′UTRWMMPNN3′UTRAALVVDVLLTEAP^*VFPSIVHTFYNELMHLPEP3′UTRMNLPMH3′UTRIVGRPRHQGYALPHAI	TGGATGGAGAATCCCACCGTGAGGTTGTGTTGCGGGGGGATGATGCCAAACAACACTTGGACTATGGGCTGAGTGGATGATGCCATACAACGTTGTTGGAGCAGGAATCCTCGCTGCCCTCGTTGTTGACGGAGCCTCGGTCAGCAGGAGTGTTCCATCCATCGTCGAGCTCGTTGTAGAAGGTGTATGCATCTGCCGGAGCCTCATTGCAAACATGTACAAACTAGATGAATCTGCCGATGCAGGGCAAATTAAAGGCGTCGTCGGTCGTCCCAGGCATCAGATGGCGTGGGGCAGAGCGTAACC	50℃50℃50℃50℃50℃55℃52℃52℃

^*互补

表4.用于活性试验的pleurocidin样肽序列。依据文中所述的原则，根据分析得到的翻译后的核酸序列选择最终的肽序列和c-末端酰胺化形式。

来源	氨基酸序列	编号
来源	氨基酸序列	编号	美洲拟鲽(1)美洲拟鲽(1a)美洲拟鲽(1a-1)美洲拟鲽(2)2.1美洲拟鲽(3)美洲拟鲽(4)1.1美洲黄盖鲽YT2美洲拟鲽X美洲拟鲽Y美洲拟鲽Z拟庸鲽AP1拟庸鲽AP2拟庸鲽AP3美首鲽GcSc4C5美首鲽GcSc4B7美首鲽GC3.8-t美首鲽GC3.8美首鲽GC3.2大比目鱼Hb26大比目鱼Hb18	GKGRWLERIGKAGGIIIGGALDHL-NH₂WLRRIGKGVKIIGGAALDHL-NH₂GRRKRKWLRRIGKGVKIIGGAALDHL-NH₂GWGSFFKKAAHVGKHVGKAALTHYL-NH₂FLGALIKGAIHGGRFIHGMIQNHH-NH₂GWGSIFKHGRHAAKHIGHAAVNHYL-NH₂RWGKWFKKATHVGKHVGKAALTAYL-NH₂RSTEDIIKSISGGGFLNAMNA-NH₂FFRLLFHGVHHGGGYLNAA-NH₂FFRLLFHGVHHVGKIKPRA-NH₂GWKSVFRKAKKVGKTVGGLALDHYL-NH₂GWKKWFNRADDVGKTVGGLAVDHYL-NH₂GWRTLLKKAEVKTVGKLALKHYL-NH₂AGWGSIFKHIFKAGKFIHGAIQAHND-NH₂GFWGKLFKLGLHGIGLLHLHL-NH₂GWKKWLRKGAKHLGQAAIK-NH₂GWKKWLRKGAKHLGQAAIKGLASGWKKWFTKGERLSQRHFAFLGLLFHGVHHVGKWIHGLIHGHH-NH₂GFLGILFHGVHHGRKKALHMNSERRS	NRC-01^aNRC-02^a，dNRC-03^a，dNRC-04^aNRC-05^aNRC-06^aNRC-07^bNRC-08^b，cNRC-09^b，cNRC-10^b，cNRC-11^bNRC-12^bNRC-13^bNRC-14^bNRC-15^bNRC-16^bNRC-17^bNRC-18^bNRC-19^bNRC-20^b

^a从表达标签和/或由RT-PCR和/或原位杂交验证的表达预测的肽

^b从基因组序列预测的肽

^c假基因

^dNRC-2和NRC-3均来源于相同序列，并且后者包括附加的N末端片段。

表4a.本研究采用的细菌与念珠菌株

种类	ID号	评述
种类	ID号	评述	Escherichia coliEscherichia coliEscherichia coliSalmonella entericas.TyphimuriumSalmonella entericas.TyphimuriumPseudomonas aeruginosaPseudomonas aeruginosaEnterococcus faecalisStaphylococcus aureusStaphylococcus aureusStaphylococcus epidermidisStaphylococcus epidermidisBacillus subtilisAeromonsa salmonicidaAeromonas salmonicidaCandida albicans	C498，UB1005C500，DC2C786，CGSC4908C587，14028SC610，MS4252SH187，K799H188，Z61C625，ATCC29212C622，ATCC25923C623，SAP017C960，ATCC14990C621C971，ATCC663399-1，A44997-4C627，CALB105	DC2的母体外膜-通透变异三重营养缺陷(thy，uri，L-his)C610的母体超易感株H188母体超易感株标准株(ATCC)标准株(ATCC)MRSA临床分离(来自TonyChow-VGH)标准株(ATCC)临床分离(来自David Speert-Children’s)标准株(ATCC)在IMB测序的区域分离种群区域分离种群酵母试验株

表5.使用PL5′和PL3′扩增的基因组序列中内含子的大小(bp)

基因	外显子	内含子	外显子	内含子	外显子	总数
基因	外显子	内含子	外显子	内含子	外显子	总数	WF1WF1a¹WF2²WF3WF4²	154103100100100	539？525374230	3131311931	95？10897101	8282496449	901？813654511

¹由于该序列只能由RT-PCR产物表示，因而不能检测到内含子的大小

²也使用引物PL1和PL2的扩增序列

表6.来自皮肤和肠的对应不同的pleurocidin基因的RT-PCR产物

皮肤条带	肠	大小
皮肤条带	肠	大小		4WF15WF24WF3n/d¹WF4n/d¹	n/d¹29n/d¹7	265bp175bp175bp215bp	n/d²

¹未检出

²基因组PCR未检测出(对应WF1a)

表7.美洲拟鲽DNA的BamHI和SstI消化产物中用pleurocidin探针杂交的条带大小(kb)

探针	BamHI	SstI
探针	BamHI	SstI	WF1xWF2xWF3WF4	＞24,66＞2417,6	19，17，4.5，4.4，3.0，2.9，2.2，1.3，19，17，4.5，4.4，2.9，x 1.3，19，17，4.5，x 2.9，x 2.2，1.3，x19，17，4.5，4.4，2.9，x 2.2，1.3，1.2

x＝没有杂交条带证据

表8.针对广谱的细菌和Camdoda Albicans的pleurocidin样阳离子抗菌肽的最小抑制浓度。病原体生长在Mueller-Hinton肉汤中并暴露于一定浓度范围的所述特定肽。抑制至少50％细菌生长的最低肽浓度记录为最小抑制浓度。

	A.sal99-1	A.sal97-4	S.typhMS4252s	S.typh14028s	P.aeruK799	P.aeruZ61	E.coilC786	E.coilUB1005	E.coilDC2	S.epiC621	MRSAC623	C.albC627
	A.sal99-1	A.sal97-4	S.typhMS4252s	S.typh14028s	P.aeruK799	P.aeruZ61	E.coilC786	E.coilUB1005	E.coilDC2	S.epiC621	MRSAC623	C.albC627	NRC-1	64	64	16	＞64	＞64	32	32	32	32	＞64	＞64	64
NRC-2	＞128	128	64	＞64	64	32	64	64	64	＞64	＞64	＞64	NRC-1	64	64	16	＞64	＞64	32	32	32	32	＞64	＞64	64
NRC-2	＞128	128	64	＞64	64	32	64	64	64	＞64	＞64	＞64	NRC-3	2	4	2	8	2	1	2	8	2	8	8	4
NRC-4	2	2	2	16	8	4	2	4	2	8	8	8	NRC-3	2	4	2	8	2	1	2	8	2	8	8	4
NRC-4	2	2	2	16	8	4	2	4	2	8	8	8	NRC-5	＞64	＞64	64	＞64	＞64	32	64	64	＞64	32	32	＞64
NRC-6	4	4	4	64	16	4	4	4	2	＞64	32	32	NRC-5	＞64	＞64	64	＞64	＞64	32	64	64	＞64	32	32	＞64
NRC-6	4	4	4	64	16	4	4	4	2	＞64	32	32	NRC-7	N/A	N/A	N/A	N/A	N/A	N/A	N/A	N/A	N/A	N/A	N/A	N/A
NRC-8	＞64	＞64	＞64	＞64	＞64	＞64	＞64	＞64	＞64	＞64	＞64	＞64	NRC-7	N/A	N/A	N/A	N/A	N/A	N/A	N/A	N/A	N/A	N/A	N/A	N/A
NRC-8	＞64	＞64	＞64	＞64	＞64	＞64	＞64	＞64	＞64	＞64	＞64	＞64	NRC-9	＞64	＞64	64	＞64	＞64	64	64	＞64	＞64	＞64	＞64	＞64
NRC-10	＞64	32	16	＞64	32	8	32	32	32	32	64	＞64	NRC-9	＞64	＞64	64	＞64	＞64	64	64	＞64	＞64	＞64	＞64	＞64
NRC-10	＞64	32	16	＞64	32	8	32	32	32	32	64	＞64	NRC-11	8	8	4	32	32	4	4	16	4	64	＞64	32
NRC-12	2	2	2	8	4	1	2	8	2	8	16	4	NRC-11	8	8	4	32	32	4	4	16	4	64	＞64	32
NRC-12	2	2	2	8	4	1	2	8	2	8	16	4	NRC-13	4	2	2	8	4	1	2	4	2	4	4	4
NRC-14	32	16	16	＞64	32	8	16	16	16	16	16	＞64	NRC-13	4	2	2	8	4	1	2	4	2	4	4	4
NRC-14	32	16	16	＞64	32	8	16	16	16	16	16	＞64	NRC-15	8	16	4	16	8	4	8	8	8	4	4	16
NRC-16	2	1	0.5	16	4	1	1	2	0.5	16	32	8	NRC-15	8	16	4	16	8	4	8	8	8	4	4	16
NRC-16	2	1	0.5	16	4	1	1	2	0.5	16	32	8	NRC-17	2	1	1	8	4	2	1	4	1	32	16	8
NRC-18	＞64	128	32	＞64	＞64	64	64	64	64	＞64	＞64	＞64	NRC-17	2	1	1	8	4	2	1	4	1	32	16	8
NRC-18	＞64	128	32	＞64	＞64	64	64	64	64	＞64	＞64	＞64	NRC-19	64	＞64	16	64	32	8	32	16	32	8	8	64
NRC-20	＞64	＞64	＞64	＞64	＞64	64	＞64	＞64	＞64	＞64	＞64	＞64	NRC-19	64	＞64	16	64	32	8	32	16	32	8	8	64

表9.美洲拟鲽和大西洋大比目鱼hepcidin样肽的特性

名称	总氨基酸	总半胱氨酸	分子量	pI
名称	总氨基酸	总半胱氨酸	分子量	pI	WF1WF2WF3WF4Hb5.3Sa18.6Hb17Hb1.1Hb357Hb7.5Sal2.1Sal1Sal2	278.751922222222222222252525258.53	8688888858788	3066199223672256236323312391239123972881292527202881	5.548.748.528.758.768.768.767.848.538.607.73

表10.细菌刺激过程中大西洋鲑鱼中hepcidin表达的半定量RT-PCR分析

组织	对照	I型Hepcidin感染	比值	对照	II型Hepcidin感染	比值
组织	对照	I型Hepcidin感染	比值	对照	II型Hepcidin感染	比值	食管胃幽门盲肳肝脾肠脑血液肾脏前叶肾脏后叶鳃皮肤卵巢直肠心肌肉	ndndnd1.19ndndnd0.820.060.070.130.14nd0.07nd0.38	0.080.090.142.360.180.21nd0.840.070.140.120.18nd0.13nd0.8	↑↑↑2↑↑011.2211.30202.1	ndndndndndndndndndnd0.080.07ndndndnd	0.090.270.371.450.410.330.50nd0.080.110.070.09nd0.080.430.60	↑↑↑↑↑↑↑↑↑↑↑↑↑↑～↑↑11.30↑↑↑↑↑

密度测量的象素密度以相对actin信号表示。感染的比值为：当两种状态下均获得数值时，可计算出对照。nd，未检测出；↑轻度上调；↑↑强烈上调

表11基于基因组和表达数据的hepcidin单字母氨基酸序列

表11(续)

表12.参照表 11的pleurocidin样基因和cDNA的核酸序列

美洲拟鲽WF1

ATGAAGTTCACTGCCACCTTCCTCCTGTTGTTCATCTTCGTCCTCATGGTTGATCTCGGAGAGGGTCGTCGTAAGAAAAAGGGGTC

GAAGAGAAAGGGGTCCAAGGGAAAGGGGTCCAAGGGAAAGGGCAGGTGGTTGGAAAGGATTGGTAAAGGTAGAGTCACGGAATTAA

TTTGCTTTTTACATTGCAAATATTTTTCATATAACATTGCTGGAAAATCACAAAAATAAGTAGTCAATATATTTGGCCAAATAGAA

TCACTTTGATTTCAATAATAATCAAAATAACAACCTAAAAGGCCTTTGATTAGCATGTTCCTTCAATGAAATGGACATTGTAATTT

ACTTTGATTCTCACATGCTACGACCTGCTGCAGCAACATTTGAAAATAAATTTGTCCCAGAAGATTTTAAAGTACATTGTTATAGG

CGATTTATCTTTCTATTACTCAGATATTTGTTCAAACCAATAGAATAACTGGATCTCTATGCTAAAATAATAAAACACACATTCAG

ATGTTACCAGTCAAGATTGAACGCTGTTTAAAAGTAAGTATGAAACATCCTCTGTATGTATAATTGTTTAACTGGTAACTTATAGT

CCTAATAATTGCGTTATGGAAATGTATTAATTGTCATTTAATATAATTTGACTGGAATTTATCACTGTGTGTTTTGTTTGTTTTTA

CACAGCTGGCGGGATAATTATCGGGGGGGCCCTTGAGTAAGGACTTCTACCATCATTACTGTGTAATATTTATAGTTATGATCAGT

ACAGTTATTAACAACTTCTCTTGTCTCGCTGAACTTCTCCATCAGTCACCTCGGGGCAGGGGAGGTGCAGGGGCCGGATTACGACT

ACCAGGAGGGGGAGGAGCTCAACAAGCGCGCAGTCGATGAA

//

美洲拟鲽WF1A

ATGAAGTTCACTGCCACCTTCCTCCTGTTGTTCATCTTCGTCCTCATGGTTGATCTCGGAGAGGGTCGTCGTAAGAGAAAGTGGTT

GAGAAGGATTGGTAAAGGTGTCAAGATAATTGGCGGGGCGGCCCTTGATCACCTCGGGCAGGGGCAGGTGCAGGGGCAGGATTACG

ACTACCAGGAGGGGCAGGAGCTCAACAAGCGCGCAGTCGATGAAA

//

美洲拟鲽WF2

GCCCACTTTGTATTCGCAAGGTAATATTGATATTTTTCATATTCATTTAGACAAATGTGCTCAGCTTGTTACTGTATAATGCAAAA

GTTAATGATCTTTATTTTTCTGTTTTTTTTTGTAGAATGAAGTTCACTGCCACCTTCCTCATGATTGCCATCTTCGTCCTCATGGT

TGAACCTGGAGAGTGTGGCTGGGGAAGCTTTTTTAAAAAGGCTGCTCACGGTAGAGTCACAGAATTAATTAGCTTTTTGCTTTGCA

AATATTTTTTTTATAACAGCTGGAAAATCACAAAAATAAATAGTATATATATTTGGCCAATAAAATCACTTTGATTTCAATAATAA

TCTAAATAACCAACCTAAAAGGCCTTTGATTAGCATGTTCCTTCAATGAAATGTACGTTGAGGTTTATTTTGATTCTCACAAGCAC

CAACCTGCTGCGTCAACAATTGAATTCAAATTTGTCCCAAAGGAATTCAAAGTAAATTTTTCTAGGCGATTTAATCTTTCCATTAC

TCTGATTTGTTTTAAAAATATAGAATAACTCAATCTCTATGATAAAACAATTACACATACATTCAGATTTTTATAGGACAAGATTG

AAAACTTCTTACAAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACATGTAACAACTAGTCCTACTAATTGTGTTAAAT

TGTCATTTAATATCAATTGCTTGAGTTTATCATTATGTGTTTTGTTTTTTTTTACACAGTTGGCAAGCATGTTGGCAAGGCGGCCC

TTACGTAAGGACTTCTACCATTTTACTGTATAATTTTGATAGTGTTATCACCAGTACTGTTTTTGACAACTTCTCTATTCCTGCTG

ACTCTCTCCATCCGACTCATCCGCAGTCATTACCTTGGCGATAAGCAGGAGCTCAACAAGCGTGCAGTCGATGAAGACCCAAATGT

TATTGTTTTTGAATGAAGAAAT

//

美洲拟鲽WF3

ATGAAGTTCACTGCCACCTTCCTGGTGCTGTCCCTGGTCGTCCTAATGGCTGAGCCTGGAGAGTGTTTCTTAGGAGCCCTTATCAA

AGGGGCCATACATGGTAGAGTCAAGGAATTAATTAGATTTTTACATGTCAAATAATGTAGTAGAACGTATATAAGTAGTCAATATA

TTTGACCAAGTAGAATCATTTTGATTTCAATAATAATCAAAATAACAATCTCCAGGCGATTTAATATTTGCAATAATTGGATTTTA

TAGAATACGGAACAACTGGATCTTAATGCTAAAATAATCCAACATACATTCTGATTTTGCCAGGCAAAATTAAACACTACTTTAAA

GTATGTATAAAACATAATCTGTATGTTATAACAAATACTCCAAGCAATTGTGTGATGGAAATGTATTCATTGTCATTTAATATAAT

TTGCTTGAGTTTATCATCTTGTGTTTTTGTTTGTTTTTTCACAGGTGGCAGGTTTATCCATGGGTAAGGACTTCTACCATCATGAC

TGTGTATTTTTAATATTATTATCATCAGTACTGTTATTGACAACTTCACTTGTCTCGCTGACTCTCTCCATCAGAATGATCCAAAA

CCATCACGGTTATGACGAGCAGCAGGAGCTCAACAAGCGCGCAGTCGATGAA

//

美洲拟鲽WF4

GCCCACTTTGTATTCGCAAGGTAATATCAATATTTTTCAAATTCATTTAGACGAGACCAACCTTTTGGGAAATCTGCTCAGCTTAT

TACTGTATAATGCAAATGTTAATGATCTTTATTTTTCTGTTTTTTTTTTGTAGAATGAAGTTCACTGCCACCTTCCTCATGATGTT

CATCTTCGTCCTCATGGTTGAACCTGGAGAGTGTGGTTGGGGAAGCATTTTTAAGCATGGTCGTCATGGTAAAGTCACGGAATTAA

TTAGCTTTTAACTTTGCAAATATTGTTTTTTTTTTTAACAGCTGGAAACTCACAAAAATAAATAGCCGATATATTTGGCCAATTAT

AATCACTTTGATCTAAATAACAACCTAAAAGGCCTTTGATTAGCATGTTTCTTCAATAAAATGATTGAACACTACTTAAAGGTATG

TATAAAACATCATCATGTGTTTTTGTTTGTTTTTACACAGCTGCCAAGCATATTGGCCATGCAGCCGTTAAGTAAGGACTTCTACC

ATTATTACTGTATAATTTTGATAGTATTATCACCAGTATTGTTATTGACAACTTCTCTTTTTCCTGCTGATCCGACTCATCCGCAG

TCATTACCTTGGCGAGCAGCAAGATCTCGACAAGCGCGCAGTCGATGAAGACCCAAATGTTATTGTTTTTGAATGAAGAAAT

美洲黄鲽YT2

ATGAAGTTCACTGCCACCTTCCTCATGATGTGCATCTTCGTCCTCATGGTTGAACCTGGAGAGTGTCGTTGGGGGAAATGGTTTAA

AAAGGCCACACACGGTAGAGTCACAGAATTAATTAGCTTTTTGCTTTGCAAATATTTTTTTATAACAGCTGGAAAATCACAAAAAT

AAATAGTCTATATATTTGGCCAATTAGAATCACTTTGCTTTCAATAAAAATCTAAATAACAACCTAAAAGTCCTTTGATTAGCATT

TTCCATCAATGAAATGGACGTTGAGGTTTATTTTGATTCTCACATGCACCGACCTGCTATGTCAACAATTGAATACAAATTTGTCC

CAGAGGAATTCAAAGGAAATTTTTCTAGGCGATCTAATCTTTCCATTACTCGGATTTGTTTTTAAATATATAGAATAACTCAATCT

CTATGATAAAATAATAACACATACGTAAAGATTTTTACAAGACAAGATTGAAAACTTCTTAAAAGTACGTATAAAACATCATCTGT

ATTTATAATTGTTTAACATTTAACAAATAGCCCTACTAATTGTGTTATGGAAATGTATAAATTGTCATTTAACATAACTTGTTTGA

GTTTATCATTATTTGTTTTTGTTTGTTTTTACACAGTTGGCAAGCATGTTGGCAAGGCOGCCCTTACGTAAGGACTTCTACCATCA

TTACTGTATAATTTTGATAGTATTATCACCAGTACTGTTATTGACAACTTCTCTTGTCCTGCTGACTCTCTCCATCCGACTCATCC

ATAGTGCTTACCTTGGCGACAAGCAAGAACTCGACAAGCGCGCAGTCGATGA

//

美洲拟鲽 WFX

TAATAAAACTAATGTGTAAAGTCTTCCACTTTTTTTACTGTATTTACTTAAACAGAAAATTATTCTCACGATTCTGGAGCTGCAGC

CACTAAGTGTTGCTTCATGAAGTGAATACACAATTGTTCTAACAACCACTCACCCAATTAACCAGAATCTACAAAGTGAGGAAGTG

AGAGGAGTCGTCCTGTGTTTTCAAATTTTTTGAATGATCTACCACTATGTGAGCTCCTCCTGTTATAGCTCTAAATGTTACACAAT

GAATGTGAAGTCAGTTCTGTGTATATAAAGAGTTGCCTCTGTAGAGCATACAACAGATTTCACCTTTGAATCTCACAAACCTCACT

TTGTATTCGACAGGTAAGATCGATATTTTTCAAACTCATTTAGACGAGACCAAGTATTTGGGAAATGTGCTCAGCTTGTCAATGTA

TAATGCAAATGTTAACAATCGTTTTGTTCTTATGTTGTGTTTGTAGGATGAAGTTCGCTACTGCCTTCCTGATGTTGTCCATGGTC

GTCCTCATGGCTGAACCTGGAGAGTGTCGTTCTACAGAGGACATCATCAAGTCTATCTCGGGTAGAGTCCAGGAATTAATTATTAT

CAATAACAATGAAATAACAACCAAAAGGCCTCTGATTAGCATGTTCCTTCAATGAAATGGTCGTTTTTTATCTATTTTGATTCTCA

CATGCAACGACCTGCTGCGGCAACATTTGAAAATCAATCTTTTTTACACAAATTCAAAGTACATTGATTTATTCGATTTAATCTTA

ACATTAATCAGATTTGTTTTTGTTTAAATATATCGAATAACTGGATCTCTATGATAAAATAATTAAACATACATTCTTATTTTACC

AATCAAGATTGAACACTTCTTAAAAGTACGTATAAAACATCATCTGTATGTATAATTGTTTGATTGTTAAGTAATATTTCCAATAA

TTGTGTAATGGAAATGTATTAATTGTCATTTAATATAATTTGCTTGAATTTATCACCATGTGTTTTTTGTTTGTTTTTAAACAGGT

GGAGGTTTTCTCAATGCGTAAGGACTTCTATCATCATTACTGTGTAATTTTTATAGTATTATCATCAGTACTGTTATTAACAGCTT

CTCTTGTCTCACTGACTCTCTCCATCAGAATGAACGCCGGTTACAATGAGCAGCAGGAGCTCAACAAGCGCTCAGATGATGATGAC

AGCCCCAGTCTTATTGTTTTTGACTGAAGAAGTCGCCCTGAAGGAGCCTTCAGATGATATATTATGCTTCTTGCTCTTCATTGAAA

TAAATCAAAC

//

美洲拟鲽WFY和WFZ(来自相同假基因的可选择拼接产物)

GAGCTCGATCAAACCAGACAAAGTTGCCTTCCTTCACAACAATAGAGTGGAAGAGAAAACAGGAGAGGACTTGTATCCTCCTGATG

CTGAGAAGAAGAAATAAGAAAGACTTGCAGCATTGATACTTTTACTTATACAGAAAACCTATAAACATGACGGGAGCATAAGTTAA

AGTCACAATACAGAAGAGAACCAGAAGCCAAACTGCAGCAAATTTACTGGTATTCATATGATACTGGAGCCAAAGCAACGCAGAGA

CTCAGCAGCAGTGAACCAAAGAGTTTAACTGTACTTGTGTCCAGGTTGAATGAAAGTATTGAATAAAAAAAACCTAGACAGAACAT

GCATATTTTTTTGGAATGGAATATAAGTCAGGAGAATATGTGTTGTTGTGGTGGCAGGATCCATCACTCTGTCAAGTTAACACAAG

AACTTTTAGAAACATAGATACGATCTCAAGTAAACTTCCATTTACTATTTGACTTTTTTTAAATACTTACAAATTATATTTTAAAA

AGCAACAATAAATCAGAGATAACTTCATGGAGAAGTCTATATTCATATTTGTGAGCTGAACATTCATGCTGCCTGTTCTATCACAT

CTGAGTGTGGAGGCCACTGACGTTTACTGACCTCAACGTCTACCGCTCTAATGCATTTGGAGTTAAAGGTAAGCATTTTGTTATTT

GTCTTCACTGTATTGATACTAAATATACAGGGTTACAAATACAGTTAAAACAAGAGAGACGAGGTGTCGAAAGCTTCAGCATCAAT

GTGCTGAACGCTGATAGCTGATCTTACCCGACACCGGTGACATGGCATCAAAATGACCACCTCTTTTTTCTTCTCTTTTTTTTGTA

GGACGAAGTTCGCTGCCGCCTTCCTCGTGTTGTTCATGGTCATCGTCATGTTTGAACCTGGAGAGTGTTTTTTTAGATTGCTTTTT

GACGGGGTCCACCATGGTAGGGTCCCGGAAGTAATTTGATTATTACATGCCAAATATTTTAATGAAACATACCTTATGAGTAGTTG

TATTATTTGGACAAGTAGAATCTCTATGATTTCAGTAGTAATTAGAATAACAATCAAAAAGGCCTTTGATTAGCATGTTTCTTCAA

TGAAATGGACATTGAGGTTTATTTTGATTCTCACATGCTACAGCAACAATTGAAATCAAATTTTTCGCAGAAGAAACTTAATTAAC

ATTGTTGTGCAATAGTGCTTAAAAAGTGTTACCATGGAATGGTGTGCGTTTAGGCACTCAATAAATTTGGTTATCAAAATTAAATT

AAAAAAATTAATATTTAAAATATTAATATTAAATCATAACTTTAATTGTTTAAAGTTCTCGCGGGGAACCACCCTTCTTCTGAAGG

TAAAGGATAGCCAATTTATTGATTAAGATCAGTCTCATTTAGATCTAGTTCAAATAGAAATCTCAATATTTTACCATCGAAGATTT

TATAATGAACACTGAAGGTTATGGAGTTCTAAACAGTGTAACAGTTGGCAAAGTTCACTATTGCAATATTAATGACAGACCATTTG

TGAAAGAAGAACATTTATTATGAGCATAATAAAGTATGAAAGCACGAATTACTAAACAATCAAAGCTAACRAACAAGGACGTGTGT

GGGTGTGTGTGTGAATGTAAATAAGGGGGGGGCTCAAACTGGTGGCCTACAAGAAGAGCCTTAAGATAGCAACCACAAGGGCTGTA

CCATAAATGTTGTAGTAAAAAGAGTTATTAAAATGAGTTAGAATAACTAATGACTAATTAGTAGACAAACTAGTAGACAAACTAAA

CAACTAACAATAACAAGGAAGTGTGTGTGAGTGTGTTTGTGTGTAAATGTTAATTAGGGGCTCTCAAACTGGTGTCTTACCAGAAG

AGTAAGATAACAATTCCCCCCCTTCTTCTGAGGTTGTTTTACGACTGTTGCTTTATGGCCGTGAGGGAAGGTTTAACTCGGTGACA

TGCTATACGTGTCTGTGTAGATGTTAATCAGAGAATGCCAGAGTCAGAGAGACCTACGGAGGAAGTCTGTGAAGGGCCTATCTAAC

ATTAGCTTTCCTTTAACTTATAACACAATATCAGAAACACATATCAACCTTATAAACACACACAGAATCAAATAAACAGTCTTGCT

TAGCATGTATAATTATTAAGCCCAGATTATGTTACCAGTCCGAGGGAAAGAGTTCAGTTGCAGTTCTGTGACGTCTCCTGGCTTTG

TGGTCGTAGAGTTCTGCATTCGCGATTCTGTCGAGCCGTGTGCTCAGATGCAGGTTGAAGTTCTCCTGCAGGACATCGCGTCGCTG

CGAGGATTTTGTAGAGCTTGAAGGGCGAGGAGATTTCCTTGAGTGGTGAGCTGGAAGCTGGACCTCTGACCTCTGGTTGTTGGTTG

GAAGAGAAGAAAGCTGGAGCGGCGTGGTTTCTCCCTCTAGCCGATGCAGGAGGAGAAGCCGGCAGCCCCACTCCTTGAAGAGTTGT

GGAGAGAGATGGGAGCAAAGAGCTAGATTTTGGGGAGACCTCTCCTTATATTGGCCCCGATGACCTCACAGGCCTTGGAACGGAGT

GACCAATAGGAGTTGACCCTGGTAATTCTTGACACCTTTGTGGGACATTGTCAAGACCCCAGGACATGCAGCATCCTGTTACAATC

TGGGAGACGGAGTTCCTTGACTGTCTCAGAACAATGAGAACCTGTGGCATCTTGGGGGATTGAGTCCACTCGAGCACATGCGGCAT

GTTTGTTCCAAGTTTGACTGAAAGGAGGCCTGTGGTTTGCACAAAAACCATGTCCCAACAACATTTTCTAGGCCATTTAATCTTTA

CATAAATTGGATTTGTTTTAAAAAATATATAGAATAACTCGATCTTTCTGCGTAAATAATAAAAAATAAATTCAAATTTGACCAGT

CAAGATTGAACACTAATGAAAAGTACCTATAAAACATAATCTGTATGTATAGTTGTTTGACTGTTAAATAGTAGTCCTAACAATTG

TGTAATGGAAATGTATTCATTGTCTTTTAATACTATTTGCTTATCATAATGTGTTTGTTTGTTTTTTAGCAGGTGGAGGTTATCTC

AATGCGTAAGGACTTCTACCATCATTACTGTGTAATTGTATTAGTTTTATCATCAGTACTGTTATTGACAACGTCTCTTGTCTTGC

TGACTTGACTCTCTTCATCAGATTAAACCCAGGGCCGGTTACAATGAGCAGCAGGAGCTCGACAAGCGCGCAGTCGATGACAACCT

CAGTGCTATTGTTTTTTACTGAAGAAGTCGACCTGAAGAATCTTTTGAAATGATATGAAATGTTTGCCTTTCAATGAAATAAATCA

AACATGACTGGATATTTGTTCTTTTGCATTGATGTATTGTTGAGTGACAGTTGAATAATTTTGGAAAACTTATAACAGATCTCAAT

TTTAGGATGTCAAATCATTTCTCTGTGTCTTATTCAAATATGAGATTTAACAATGACAAT

//

拟庸鲽AP1

GCCCACTTTGTATTCGCAAGGTAAGATCAATATTTTTCAAATTCATTTAGACGAGACCAACCGTTTGCGAAATGTGCTCAGCTTGT

TATTGTATAATAACAAAGTTAACGATCTTTATTTTTCTGTTTTTTTGTAGAATGAAGTTCACTGCCACCTTCCTGATGTTGTTCAT

CTTCGTCCTCATGGTTGAACCTGGAGAGTGTGGATGGAAAAGTGTGTTTCGTAAGGCTAAGAAAGGTAGAGTCACGGAATTAATTA

GCTTTTTACATTGCAAATAGATTTTTTATAACAGCTGGAAAATCACAAAAATAAATAGTCGATATATTTGGCCAATTAGAATCACT

TTAATTTCAATAATAATCTAAATAACAACCTAAAAGGCCTTTGATTAGCATGTTTCTTCAATGAAATGGACATTGAGGTTTATTTT

GATTCTCACATGCACCGACCTGTGCGGCAACCATTGAATTCAGATTTGTCCCAGAAGAATTCAAAGTACATTTTTCCAGGCGATTA

AATCTTTCCATTACTCAGATTCAAAAATAAATAAATGGAATAATTGAAGCACTATGATAAAATAATTACACATTCACTCTGACTTT

ACAAGTCAAGATTGAACACTATTAAAAAGTGTGTATAAAACAACATCTGTATGCATAATTGTTTAACTGTTAATAGTCCTAATAAT

TGTTTTATGGAAATGTATTAATTTACATTTAATATTATTTGCTTGAGTTTACCATCATGTGTTTTTGTTTGTTTTTACACAGTTGG

CAAGACTGTTGGCGGCTTGGCCCTTGAGTAAGGACTTCTACCATCATTACTGTATAATTTTGATAGTATTATCACCAGTACTGTTA

TTAACTACTTCTCTTGTCRGCTGACTCTCTCCATCCGACTCATCTGCAGTCATTACCTTGGCGAGCAGCAGGAGCTTGACAGCGCG

CAGTCGATGAGGACCCCAGTGCTATTGTCTTTGACTGAAGAAGTCGCCTTGAAGGAG

//

拟庸鲽AP2

ACTTTGTATTCGCAAGGTAAGATCAATATTTTTCAAATTCATTTAGACGAGACCAACCGTTGGCGAAATGTGCTCAACTTGTTATT

GTATAATAACAAAGTTAACGATCTTTATTTTTCTGTTTTTTTGTAGAATGAAGTTCACTGCCACCTTCCTGATGTTGTTCATCTTC

GTCCTCATGGTTGAACCTGGAGAGTGTGGATGGAAAAAATGGTTTAATAGGGCTAAGAAAGGTAGAGTCACGGAATTAATTACCTT

TTTACATTGCAAATAGATTTTTTATAACAGCTGGAAAATCACAAAAATAAATAGTCGATATATTTGGCCAATTAGAATCACTTTAA

TTTCAATAATCTAAATAACAACCTAAAAGGCCTTTGATTAGCATGTTTCTTCAATGAAATGGACATTGAGGTTTATTTTGATTCTC

ACATGCACCGACCTGTGCGGCAACCATTGAATTCAGATTTGTCCCAGAAGAATTCAAAGTACATTTTTCCAGGCGATTAAATCTTT

CCATTACTCAGATTCAAAAATAAATAAATAGAATAATTGAAGCACTATGATAAAATAATTACACATTCACTCTGATTTTACAAGTC

AAGATTGAACACTATTAAAAACTGTGTATAGAACATCATCTGTATGTGTAATTGTTTAACTGTTAATAGTCCTAATAATTGTTTTA

TGGAAATGTATTAATTTACATTTAATATTATTTGCTTGAGTTTACCATCATGTGGTTTTGTTTGTTTTTACACAGTTGGCAAGACT

GTTGGCGGCTTGGCCGTTGAGTAAGGACTTCTACCATCATTACTGTATAATTTTGATAGTATTATCACCAGTACTGTTATTAACTA

CTTCTCTTGTCTCGCTGACTCTCTCCATCCGACTCCTCTGCAGTCATTACCTTGGCAAGCAGCCGGAGCTCGACAAGCGCGCAGTC

GATGAGGACCCCAGTGCTATTGTCTTTGACTGAAGAAGTCGCCTTGAAGGAGCCTTCAGAA

//

拟庸鲽AP3

TTGCCCACTTTGTATTCGCAAGGTAAGATCAATATTTTTCAAATTCATTTAGACGAGACCAACCATTTGGGAAATGTGCTCAGCTT

GTTACTGTATAATGCAAAAGTTAAGTATCTTTATTTTTCTGTTTTTTTTTGTAGAATGAAGTTCACTGCCAACTTCCTCATGTTGT

TCATCTTCGTCCTCATGTTTGAACCTGGAGAGTGTGGTTGGCCAACATTGCTTAAAAAAGCTGGTCACGGAATTAATACGCTTTTT

ACATTGCAAATAGATTTTTTATAACAGCTGGAAAATGACAAAAATAAATAGTCGATATATTTGGCCAATTAGAATTATTTTGATTT

CAATAATAATCTAAATAACAACCTAAAAGGTCTTTGATTAGCATGTTTCTTCAATGAAATGGACATTQAGGTTTATTTTGATTCTC

ACATGACCGACCTGCTGCGGCAACAATTGAATTCAGATTTGTCCCAGAAGAATTCAAAGTAAATTTTCCAGGGGATTAAATCTTTC

CATTACTCGGATTTAAAAAAAAAAAAAATAGAATAACTGAATTGCCATGAAAAAATAATTACACATACTGTCTGATTTTACAAGTC

AAGATTGAACACTACTTAAAAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACTGTTAACAAATAGTCCAAATAATTGT

GTTATGGAAATGTATTAATTGTCATTAAATATAATTTGCTTGAGTTTATCATCATGTGTTTTTTTTTTTTTTTTACACAGAGGTTA

AGACTGTTGGCAAGTTGGCCCTTAAGTAAGGACTTCTACCATCATTACTGTATAATTTTGATAGTATTATCACCAGTACTGTAGTA

CTGACAACTTCTCTCTCCACCCAACTCATCCGCAGACATTACCTTGGCAAGCAGCCGGAGCTCGACAAGCGCGCAATTGATGACGA

CCCCAGTATTATTGTTTTTGACTGAAGAAGTCGCCTTGAAGGAGCCTTCAGAA

//

美首鲽GcSc4C5

ATGAAGTTCACTGCCACCTTCCTCATGATGTTCATGGTCGTCCTCATGGCTGAACCCGGAGAGGCTGGTTGGGGAAGTATTTTCAA

ACATATTTTCAAAGCTGGAAAGTTCATCCATGGTGCGATCCAGGCACACAATGACGGCCAGGAGCAGGATCTCGACAAGCGCGCAG

TCGATGA

//

美首鲽GcSc4B7

ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTTTGGGGAAAGCTTTTGAA

ATTGGGCATGCATGGAATCGGGCTGCTCCATCAGCATTTGGGTGCTGACGAGCAGCAGGAGCTCGACGAGCGCTCAGAGGAGGACG

AGCCCAATGTTATTGTTTTTGAATGAAGAAGTCGCATTGAAGGAGCCTTCAG

//

美首鲽GC3.8

ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGGATCCGGAGAGTGTGGTTGGAAAAAGTGGCTCCG

TAAAGGTAGAGTCATGGATTTAATTTGCTTTTTACATTGCAAATACTTTAATATAACATAGTTGGAAAACCACAAAAATAAGTAGT

CGATATATTTGGCCATATAGAATCACTTTGATTTCAATAATAATCAAAACAACAATCAAAAAGCCCATTGATTAGCATGTCCCTTC

ACTAAAATGGACATTGTAATTTATTTTGATTCTCACAGGCACCAACCTGCTGCGGCAACAATTGAAATCAAATTTGTCTCAGAAGA

ATTCAAAGTACATTGTTCTAGGCGATTTAATCTTTCCATTCATCGGATCTGTTTTTAAAAATATAGAATAACTGGATCTCTATGTT

AAAATAATAAAACACACATTCTGATTTTACCTGTCAAGATTGAACACGACTTAAAAGTATGTATAAAACATCATCTGTATGTATAA

TTGTTTAACTGTCAACTAATAGTCCAAATAATTGTGTTATGGAAATGTATTCATTGTCATATAATATCATTTGCTTGAATTTATCA

CCATGTGTTTTTGTTTGTTTTTACACAGGTGCCAAGCACCTTGGCCAGGCGGCCATTAAGTAAGGACTTCTACCATCATTACTGTG

TAATTTTAACAGTATTATCATCAGTACTGTTATTGACAACTACTCTTGTCTCTGTTACTCTCTCCAGGGGTTTGGCCTCTTGCGAA

GAGCAGCAGGAGCTCGACAAGCGCTCAATGGATGACGAGCCCAGTGCTATTGTTTTTGACTGAAGAAGTCGCCTTGAAGGAGCCTT

CA

//

美首鲽GC3.2

ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGGATCCGGAGAGTGTGGTTGGAAAAAGTGGTTCAC

TAAAGGTAGAGTCATGGATTTAATTTGCTTTTTACATTGCAAATACTTTAATATAACAAAGCTGGAAAATCACAAAAATAACTAGT

CGATATATTTGGCCATATAGAATCACTTTGATTTCAATAATAATCAAAACAATAATCAAAAAGCCTATTGATTAGCATGTTCCTTC

ACTAAAATGGACATTGTAATTTATTTTGATTCTCACAGGCACCAACCTGCTGTGGCAACAATTGAAATCAAATTTGTCTCAGAAGA

ATTCAAAGTACATTGTTCTAGGCGATTTAATCTTTCCATTCATCGGATTTGTTTTCAAAAATATAGAATAACTGGATCTCTATGTT

AAAATAATAAAACACATTCTGATTTTATCTGTCAAGATTGAACACGACTTAAAAGTATGAATAAAACATCATCTGTATGTATAATT

TTTTAACTGTCAACTAATAGTCCAAATAATTGTGTTATGGAAATGTATTCATTGTCATATAATATCATTTGCTTGAATTTATCACC

ATGTGTCTTTGTTTGTTTTTACACAGGTGAAAGGTTATCCCAGAGGTAAGGACTTCTACCATCATTACTGTATAATTTTAATAGTA

TTATCATCAGTACTGTTATTGATAACTTCTCTTGTCTCGCTGACTCTCTCCATCAGGCATTTCGCTGACGTCGAGCAGCAGGAGCT

CGACAAGCGCTCAGTGGATGACGAGCCCAGTTCTATTGCTTTTGACTGAAGAAGTCGCCTTGAAGGAGCCTTCAG

//

大比目鱼HB26

TTATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAGCCTGGAGAGTGTTTTTTGGGATTGCTTTTT

CACGGGGTCCACCATGGTAGGGTCACGGAAGTAATTCGATTTTTACATGGCAAATATTTTAAGATAACACACCATATGAGTAGTCG

ATATATTTGACCAATTAGAATCACTTTAATTTCAATAATAATCACAATAACAATCTCTAGGCCATTTAATCTTTCCATTAATCGGA

TTTGTTTTTTTAAATATAGAATAACTGGATCTCTATGTTAAAATAATAAAACATACATTCTGATTTTACCAGTCAAGATTGTACGC

TACTTAAAAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACTGTTAACTAATAGTCCAAATAATTGTGTAATGGAAATG

TATTAATTGTCATTTAATATCATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTACACAGTTGGAAAGTGGATCCATGG

GTAAGGACTTCTACCATCATTACTGTGTATTTTTAATAGTATTATCATCAGTACTGTTATTGATATTTTCTCTTGTCTCGCTGACT

CTCTCCATCAGACTCATCCATGGGCATCACGGTTACGACGAGCAGCAGGAGCTCGACAAGCGCGCAGTCGATGAAA

//

大比目鱼HB18

TTATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTTTTGGGAATTCTTTTT

CACGGGGTCCACCATGGTAGAGTCACGGAATTAATTCGATTTTTACATGGCAAATATTTTAAGATAACACACCATATGAGTAGTCG

TTTGTTTTTTTAAATATAGAATAACTGGATCTCTATGTTAAAATAATAAAACATACATTCTGATTTTACCAGTCAAGATTGAACAC

TACTTAAAAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACTGTTAACAATAGTCCAAATAATTGTGTTATGGAAATGT

ATTAATTGTCATTTAATATCATTTGCTTGAATTTATCACCATGAGTTTTTTGTTTGTTTTTACACAGGTAGAAAGAAGGCCTTGCA

GTAAGGACTTCTACCATCATTACTTTGTAATTTTTATAGTATTATCATCAGTACTGTTATTGACAACTTCTCTTGTCTCGCTGACT

CTCTCCATCAGGATGAACTCAGAGCGTCGCAGTTACGACGAGCGGCAGCAGCAGCAGCAGGAGCTCGACAAGCGCGCAGTCGATGA

AA

//

美洲黄盖鲽YT2

GCCCACTTTGTATTCGCAAGGTAAGATCGATATTTTTCAAACTCATTTAGACGAGACCAAGCATTTGTTGAAATGTGATAAGCTTC

TAACTTTATAATGCAAATGTTAACAATCTTTTTGTTCTGTTGTTTTTGTAGGATGAAGTTGGCTGCCGCCTTCCTGGTGCTGTTCC

TGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTCTTGGGATTTCTTTTTCACGGTATCCACCATGGTAAAGTCACTCATTTAATA

CATTTTTACATGGCAAATATTTGAATATAACATACTATATGAGTTGTCAATATATGTGGCCAAGTAGAAGCACTTTGATTTCAATA

ATAATCAAAATAACAATCACTAAGCCATTTAATAATTGAATTAATTACATTTGTTTTAAAAAAATATAGAATAACTGGATCTTTAT

GCTAAAATAATTAAACCTAAATTCAGATTTTACCACTCAAGATTGAACACTACTTAAAAGTATGTAAAAAAAACATCATCTGTATG

TATAATTAAATACTAGTCCAGTTAATTGTTTTATGGAAATGTGTTAATTGACATATATCATTTGCTTGAACTTATAATGTGCTTTG

TTTGTTTTTACACAGGTATCAGGGCGATCCATCAGTAAGGACTTCTACCATCATGACTGTGTATTTTTAATAGTATTATCATCAGT

ACTTTTATTAACAACTTCTCTTGTCTCGCTGACTCTCTCCATCAGTCTCATCCATGGTCAAAGATACGACGAGCAGCAGGAGCTTG

ACAAGCGCTCAGTCGATGAVAACCCCGGTGCTATTGTTTTTGACTGAAGACGTCGCCTTGAAGGAGCCTTCAG

//

美洲黄盖鲽YT3

ATGAAGTTCACTGCCACCTTCCTGGTGTTGTCCATGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTCTTTGGAGCCCTTATCAA

AGGGGCCATCCATGGTGGCAAGTTGCTCCATAAACTCATCAAAAAAAAACATGAACATCACGGTTATGGCAAGCATTGGGGGCTTG

ACAAGCGCGCAGTCGATGA

//

美洲拟鲽WF-YT

TTGAAAGTGAGGAAGTGAGAGGAGGACTAGGTCCTGTGTTTTCAGTCGTTGAATTATCTAACACTATCTGAGCCCCTCCTGCAATA

ACTCTAAATGTTACACAGTGACTAGGAAGTCAGTCCTGTGTATATAAAGAGTTGCATCTGTTGTTATCAGTAGACAACAGATTACA

CCTTTGAATCTCACAAAGCTCATTTTGTATTCGACAGGTAAGATCGATATGTTTCAAACTCATTTAGATGAGACCAAGCATTTGGG

AAATGTGCTCAGCTTCTAACTGTATGATGCAAATGTTAACAATCTTTTTGTTCTGTTGTTTTGTAGGATGAAGTTGGCTGCCGCCT

TCCTGGTGCTGTTCTGGTCGTCCTCATGGCTGAACCTGGAGAGAGTTTTTTGGGATTTCTTTTTTCATGGTATCCGCCATGGTAGG

GTCACTGAATTGATACATTTTTACATGGCAAATATTTGAATGTAACATACTATATGAGTTGTCAATATATGTGGCCAAGTAGAAGC

ACTTTGATTTCAGTAATAATCAAAATAACAATCACTAGGCCATTTAATAATTGCATTAATTACACTTGTTTTTATATAGAATATAG

AATAACTGGATCTTTATGCTAAAATTAATAAACATGAATTCAGATTTTAAGATTTTTCAAGATTGAAAACTACTTAAAAGTATGTA

AAAAAACATCATCTGTATGTATAATTAAATACTTGTCCAGATAATTGTGTTGTGGAAATGTGTTAATTGACATATATCATTTGCTT

GAATTTATCATTATCTGCTTTGTTTGTTTTTACACAGGTATCAAGGCGATCCATGGGTAAGGACTTCTACCTTCATGACTGTGTAT

TTTTAATAGTATTATATTCAGTACTGTTATTGAAAACTTCTCTTGTCTCGCTGACTCTCTCCATCAGAATGATCCATGGTAACAGT

TTAGACGAGATGCAGGAGCTCGACAAGCGCTCATTCGATGACAACCCCAACGCAATTGTTTTTGACTGAAGAAGTCGCCCTGAAGG

AGCCTTCAGATGATATATAATGCTTCTTGCTTTTCAATGAAATAAATTGAATAATTACCCGCAACAGC

//

美洲拟鲽WF1-样

TACTTTTATCTACCACTATGTGAGCTCCTCCTGTTATAACTCTAAATGTTACACAATGAAGATGAGGTCAATTCTGAGTATATAAA

GAGTTGCCTCTGTATAGTAGACAACATATTTCACCTTTGAATCCCACAAAGCTCACTTTGTACTCAACAGGTAAGATCGATATTTA

AAAACTAATTTAGACGAAACCAAGCATTTTGGGGAATTTGCTCAACTTCTAAATGTATGATACAAATGTTAACAATCTTTTATTTC

TGTTGTTGTTTTTTGTAGGATGAAGTTCACTGCCACCCTCCTCCTGTTGTTCATCTTCGTCCTCATGGTTGATCTCGGAGAGGGTC

GTCGTAAGAAAAAGGGGTCGAAGAGAAAGGGGTCCAAGGGAAAGGGGTCCAAGGGAAAGGGCAGGTGGTTGGACAGGATTGGTAAA

GGTAGAGTCACGGAATTAATTTGCTTTTTACATTGCAAATATTTTTCATATAACATTGCTGGAAAATCACAAAAATAAGTAGTCAA

TATATTTGGCCAAATAGAATCACTTTGATTTCAATAATAATCAAAATAACAACCTAAAAGGCCTTTGATTAGCATGTTCCTTCAAT

GAAATGGACATTGTAATTTACTTTGATTCTCACATGCTACGACCTGCTGCAGCAACATTTGAAAATAAATTTGTCCCAGAAGATTT

TAAAGTACATTGTTATAGGCGATTTATCTTTCTATTACTCAGATATTTGTTCAAACCAATAGAATAACTGGATCTCTATGCTAAAA

TAATAAAACACACATTCAGATGTTACCAGTCAAGATTGAACGCTGTTTAAAAGTAAGTATGAAACATCCTCTGTATGTATAATTGT

TTAACTGGTAACTTATAGTCCTAATAATTGCGTTATGGAAATGTATTAATTGTCATTTAATATAATTTGCTGGAATTTATCACTGT

GTGTTTTTGTTTGTTTTTACACAGCTGGCGGGATAATTATCGGGGGGGCCCTTGAGTAAGGACTTCTACCATCATTACTGTGTAAT

ATTTATAGTTATGATCAGTACAGTTATTAACAACTTCTCTTGTCTCGCTGAACTTCTCCATCAGTCACCTCGGGCAGGGGCAGGTG

CAGGGGCCGGATTACGACTACCAGGAGGGGGAGGAGCTCAACAAGCGCTCAGACGATGATGACAGCCCCAGTCTTATTTTTTTTGA

CTGAAGAAGTCGCCCTGAAGGAGCCTTCAGATGATATATAATGCTTCTGGCTTTTCATTGAAATAAATAATACGTTTACCTGCAAC

AGCAACCATG

//

大比目鱼Hb29

TTATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTGGGAAATTGGATGGGG

CCCCATATCAGCGGTAGAGTCACGGAATTAATTTGCTTTTTCCATTGCAAATATTTTAATATTGCATAGCTGGAAAATCACGAAAT

AAGTAGTCGATATATTTGGCCAAATAGAATCACTTTGATTTCAATAATAATCAAAATAACAATCAAAAAGGCCTTTGATTAGCATG

TTCCTTCAATAAAATGGACATTGAAGTTTATTTTGATGCTCACATGCACCGACCTGCTGGGGCAACAATTGAAATCAAATTTGTCT

CAGAATTTAAAGTACATTTTTCTAGGTGATTTAATCTTTCCATTAACTTGATTTGTTTTTATAAATATAGAATAACTGGATCTTTA

TGCCAAAATAATAAAACACACATTCTGATTTTACCAGTCAAGATTGAACACTACTTAAAAGTAATATAAAACATCATCTGTATGTA

TAATTGTTTAACTGTTAACAAAAGTCCAAATAATTGTGTTATGGAAATGTATTAATTATCATTTAATATCATTTGCTTGAATTCAT

CACCATGTGTTTTTTGTTTGTTTTTACACAGGTGAAAAGAAGGCCTTGCAGTAAGGACTTCTACCATCATTACTTTGTAATTTTTA

TAGTATTATCATCAGTACTGTTATTGACAACTTCTCTTGTCTCGCTGACTCTCTCCATCAGGATGAACTCAGAGCGTCGCAGTTAC

GACGAGCGGCAGCAGCAGCAGCAGGAGCTCGACAAGCGCGCAGTCGATGA

//

大比目鱼HbSc1A13

ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTGGGAAATTGGATCGTGCG

CCCTATCGGAGGTGAAAAGAAGGCCTTGCAGATGAACTCAGAGCGTCGCAGTTACGACGAGCGGCAGCAGCAGCAGCAGGAGCTCG

ACAAGCGCGCAGTCGATGAAA

//

大比目鱼HbSc1A24

ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATAGCTGAACCTGGAGAGAGTCTTTTTGGAAAGTTCCTCAA

GAAAGTTGTCCATGCTGGCACGTCAATTGGCGAGACAGCCTTGCATGTCGCCGCAGAGCATCACGGGCTTCATGCGCATCACGGGT

GTCACGGGCGTCACGGGGGTCACAGGCGTCAGGGGGGTCACAGGCGTCACGGGCGTCGCGGTTACGACGAGCAGCAGCAGGAGGAG

CTCGACAAGCGCGCATTCGATGA

//

大比目鱼HbSc1B34

TATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTGGGAAATTGGATGGGGC

CCCATATCAGCGGTAGAAAGAAGGCCTTGCACATGAACTCAGAGCGTCGCAGTTACGACGAGCGGCAGCAGCAGCAGCAGGAGCTC

GACAAGCGCGCAGTCGATGAAA

//

大比目鱼Hb17

ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGAGTGTTTTTTGGGATTGCTTTTTCA

CGGGGTCCACCATGGTAGGGTCACGGAAGTAATTCGATTTTTACATGGCAAATATTTTAAGATAACACACCATATGAGTAGTCGAT

ATATTTGGCCAATTAGAATCACTTTGATTTCAATAATAATCAAAATAACAATCTCTAGGCGATTTAATATTTGCATTAATTGGATT

TGTTTTTAAAAATATAGAATAACTGGATCTTTATGGTAAAATAATTAAACATACATTCTGATTTTACCAGTCAAGATTGAACACTA

CTTAGAAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACTGTTAACGAATAGTCCAAATAATTGTGTTATGGAAATGTA

TTAATTGTCATTTAATATCATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTACACAGTTGGAAAGTTGATCCATGGGT

AAGGACTTCTACCATCATTACTGTGTATTTTTAATAGTATTATCATCAGTACTATTATTGACAACTTCTCTTGTCTCGCTGACTCT

CTCCATCAGACTCATCCATGGCGGTTACGACGAGCAGCAGGAGCTCGACAAGCGCGCAGTCGATGAA

//

美首鲽 GC1.2

GCCCACTTTGTATTCGCAAGGTAAGAGCGATATATTTCAAATTCATTCGGATGAGACCAAGCATTTGGGAAATGTGCTCAGCTTGT

TACTGTTTAATGCAAATGTTAACAATATCCTTTTTCTGTTGTTTTTGTAGAATGAAGTTCGCTGCCGCCTTCCTCATGATGTTCAT

GGTCGTCCTCATGGCTGAACCCGGAGAGGCTCGTTGGGGAACGTTCTTCAAACATATTTTCAAAGGTAGAGTCACAGAATTAATTT

GCTTTTTACATTGCAAATATTTTCATATAACATAGCTGGAAAATCACAAAAATAAGGGCTTGATATATTTGGCAAAGTAGAATCCC

TTTGATTTCAATAATAATCAAAATAAAAATCAGAAAGGCCTTTGATTAGCATGTTCCTTCAATAAAATGGACATTGTAGTTTATTT

TGATTCTCAAATGCACCAACCTGCTGCGGCAACAATTGAAATCAAATTTGTCTCCGAAACATTTAAAGTACATTTTTCGAGGCAAT

TTAATCTTTCCTTTGATCGAATTCGTTTTTAAAAATATAGAATAACTGGATCTTTATGCTAAAATAATAAATCATACATTCTGATT

TTACCAGTCAAGATTGAACGCTACTTAAAAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACTTTTAACTAATAGTCCT

AATAATTGTGTTATGGAAATGTATTCATTGTCATTTAATATCATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTACAC

AGCTGGAAGGTTCATCCATGGGTAAGGACTTCTACCATCATTACTGTGTATTTTTAATAGTATTATCATCAGTACTGTTATTGATA

ACTTCTCTTGTCTCGCTGACTCTCTCCATCAGTGCGATCCAGGCACACAATGACGGCGAGCAGCAGGATCTCGACAAGCGCTCAGT

GGATGATGAGCCCAGTGTTATTGTTTTTGAATGAAGAAGTCGCCTTGAAGGAGCCTTCAG

//

美首鲽 GC1.3

GCCCACTTTGTATTCGCAAGGTAAGAGCAATATATTTCAAATTCATTTAGACGAGACCAAGCATTTGGGATCTGTGCTCAACTTGT

AACTGTATAATGCAAATGTTAACAATATTCTTTTTCTGTTGTTTTTGTAGAATGAAGTTCGCTGCCGCCTTCCTCATGATGTTCAT

GGTCGTCCTCATGGCTGAACCCGGAGAGGGTGCTTGGATACCTGCCTTGAATAGGATCTATCATGGTAGAGTCACAGAGTTAATTT

GCTTTTTACATTGCAAATATTTTAATATAACATGGCTGGAAAATCACAAAAATGAGTACTCGATATATTTGGCAAAGTAGAATCCC

TTTGATTTCAATAATAATCAAAAACACAATCAAAAAGGCCATTGATTAGCATGTTCCTTCAATGAAATGGACATTGTAGTTTATTT

TGATTCTGACATGCACCAACTTGCTGCGGCAACAATTGAATTCAAATTTGTCTCAGAAAAATTTAAAGTACATTTTTCTTTCCATT

AGTCGGATTTGTTTTAAAAAATACAGAATAACTGGATCTTTATGCTAAAATAATAAATCATACATTCTGATTTTACCAGTCAAGAT

TGAACGCTACTTAAAAGTATGTATAAAACATCATCTGTATTGATAATTGTTTAACTTTTAACTAATAGTCCTAATAATTGTGTTAT

GGAAATGTATTCATTGTCATTTAATATCATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTACACAGCTCTACTGAGGA

TCAATCGGTAAGGACTTCTACCATCATTACTGTGTAATTTTAATAGTATTATCATCAGTACTGTTATTGATAACTTCTCTTGTCTT

GCTGGCTCTCTCCATCAGCCAAATGGTGTATTATCGTCGGCACTGGCACGGTGACGTCGAGCAGCAGGCTCTCGACAAGCGCTCAG

TGGAGGACCAGCCCAGTTCTATTGCTTCTGCCTGAAGAAGTCGCCTTGAAGGAGCCTTCAG

//

美首鲽 GC1.4

AACTGTATAATGCAAATGTTAACAATATTCTTCTTCTGTTGTTTTTGTAGAATGAAGTTCGCTGCCGCCTTCCTCATGATGTTCAT

GGTCGTCCTCATGGCTGAACCCGGAGAGGGTGCTTGGATGCCTGCCTTGAATAGGATCTATCATGGTAGAGTCACAGAGTTAATTT

AATCGGATTTGTTTTAAAAAATACAGAATAACTGGATCTTTATGCTAAAATAATAAATCATACATTCTGATTTTACCAGTCAAGAT

GCTGACTCTCTCCATCAGCCAAATGGTGTATTATCGTAGGCACTGGCACGGTGACGTCGAGCAGCAGGCTCTCGACAAGCGCTCAG

TGGAGGACCAGCCCAGTTCTATTGCTTCTGCCTGAAGAAGTCGCCTTGAAGGAGCCTTCAG

//

美首鲽 GcSc4B35

TAAAGGTGCCAAGCACCTTGGCCAGGCGGCCATTAACGGTTTGGCCTCTTGCGAAGAGCAGCAAGAGCTCGACAAGCGCTCAGAGG

ATGACGAGCCCAGTGCTATTGTTTTTGAA

//

美首鲽 GC3.6

TAAAGGTAGAGTCATGGATTTAATTTGCTTTTTACATTGCAAATACTTTAATATAACATAGTTGGAAAATCACAAAAATAAGTAGT

CGATATATTTGGCCATATAGAATCACTTTGATTTCAATAATAATCAAAACAACAATCAAAAAGCCCATTGATTAGCATGTTCCTTC

ACTAAAATGGACATTGTCATTTATTTTGATTCTCACAGGCACCAACCTGCTGCGGCAACAATTGAAATCAAATTTGTCTCAGAAGA

ATTCAAAGTACATTGTTCTAGGCGATTTAATCTTTCCATTCATCGGATTTGTTTTTAAAAATATAGAATAACTGGATCTCTATGTT

TAATTTTAACAGTATTATCATCAGTACTGTTATTGACAACTACTCTTGTCTCTGTGACTCTCTCCAGGGGTTTGGCCTCTTGCGAA

GAGCAGCAGGAGCTCGACAAGCGCTCAATGGATGACGAGCCCAGTGCTATTGTTTTTGACTGAAGAAGTCGCCTTGAAGAGCCTTC

AG

//

美首鲽 GC2.2

GCCCACTTTGTATTCGCAAGGTAAGAGCGATATATTTCAAACTCATATAGACGAGACCAAGCATTTGGGAAATGTGCTCAGCTTGT

TACTGTATAATGCAAATGTTAACAATGTTTTTGTTCTGTTGTTTTTGCAGAATGAAGCTCGCTGCTGCCTTCCTGGTGTTGTTCAT

GGTCGTCCTCATGGCTGAACATGGAGAGGGTTTTGGGGATTTCTATATGAAGCCTGGTAGAGTCACGGAATTAATTCGATTTTAAC

ATGGCAAATATTTTACTATAACATACCATATGAGAGTCGTTAATTAATTGGATTGGATTTGTTTTTAAAAATATAGAATTGGATCT

TTATGCTAAAATAATTAAACATACATTCTGATTTTACCAGTTAAGATTGAACCCTACTTAAAAGTATGTATAAAACATCATCTGTA

CATATAATTGTTTAACTGTTAACCAATAGTCCAAATAATTGTGTTGTGGAAATGTATTAATTGTCATTTAATATCATTTGCTTGAA

TTTGTCACCATGTGTTGTTGTTTGTTTTTACACAGGTAGAAAGATTTCCCATGGGTAAGGACTTCTACCATCATTACTGTGTATTT

TTAGCAGTATTATCATCAGTACTGTTATTGATTAACTTCTCTTGTCTCGCTGACTCTAGGTACATCAGAAGTCCTTATTATGGTTA

CGACGAGCAGCAGGAGGTCGACAAGCGCTCAGTCGATGACAACCCCAGTGCCATTGCTTCTGACTGAAGAAGTCGCCTTGAAGGAG

CCTTCAGA

//

美首鲽 GcSc4B28

ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGCGAGGGTTATTGGCGCTTCCGCAACCA

CCGTGGTGAAAGGTTATCCCAGAGGCATTTCGCTGACGTCGAGCAGCAGGAGCTCGACAAGCGCTGTGGAGATGACGAGCCCAGTT

CTATTGCTTTTGA

//

美首鲽 GC3.7

ATGAAGTTCACTGCCACCTTCCTCGTGTTGTTCATCGTCATGTTTGAACCTGGAGAGTGTTTTTGGAATGCTTTTTCACCGGGTCC

ACCATGGTCGGGTCACGGAAGTAGTTCGATTTTTACATGGCAAATATTTAAATGAAACATACCTAATGAGTAGTCGATATATTTGG

CCAAGTAGAATCACTCACTTTGACTTCAATAATAATCAAAAACATAATCAAAAACATTGATTAGCTGTTCCTTCAATGAAATGGAC

ATTGAGGTTTATTTTGATTCTCACAGGCACCAACCTGCTGCGGCAACAATTGCATTCAAATTTGTCCCAAAGAAACTTAATTAACA

TTTTCTGGCGATTTAATCTTTGCATAAATTGGATTTGTTTTTAAAAATATAGAATATGGATCTTTATGCTCTCAAATAATTAATCA

TACATTCTTATTTTATCAGTCAAGATTGAACGCTACTTAAAAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACTTTTA

ACTAAAAGTCCTAATAATTGTGTTATGGAAATGTATTAATTGTCATTTAATATCATTTCCTTGAATTTATCACCATGTGTTTTTGT

TTGGTTTTTACACAGCTGGAAGGTTGATCCATAGGTAAGGACTTCTACCATCATTACTGTATAATGTTAATAATAGCATTATCATC

AGTACTGTTATTGATAACTTCTCTTGTCTCGCTGACTCTCTCCATCAGATTCATCAAACGTCACGGTGACGTCGAGCAGCAGGAGC

TCGACAAGCGCTCAGTGGATGACGAGCCCAGTTCTATTGCTTTTGCCTGAAGAAGTCGCCTTG

//

美首鲽 GC3.1

ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGACTGTATTTTTGGATTGATTGCGAC

TGCGGTCCACAATGGTAAGTCAAGGAATTAATTCGATTTTTACGTGGCAAATATTTTAGTATAACATACCTTATGAGTAGTCGATA

TATTTGACCAAGTAGAATCATTTTGACTTCAATAATAATCAAAATAACAATCTCTAGGCAATTTAATATTTGCATTAATTGGATTT

GTTTTTAAAAATATAGAATAACTGGATCTTAATGCTAAAATAATTAAACATACATTCTGATATTACCAGTCAAGATTGAACGCTAC

TTAAAAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACTGTCGACTAATAGTCCTAATAATTGTGTTATGGAAATGTAT

TCATTGTCATATAATATCATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTACACAGCTGGAAGGTTGATCCATAGGTA

AGGACTTCTACCATCATTACTGTATAATTTTAAGAGCATTATCATCAGTACTGTTATTGATAACTTCTCTTGTCTCGCTGACTCTC

TCCATCAGACTACTCGGCTTTCATCATGGGCCTCCCGGGTTCTGGCACGGTGACGTCGAGCAGCAGGAGCTCGACAAGCGCTCAGT

GGATGAGGAGCCCAGTGCTATTGTTTTTGAATGAAGAAGTCGCCTTGAAGGAGCCTTCAG

//

美首鲽 GC4.1

TGCGGTCCACAATGGTAAGTCAAGGAATTAATTCGATTTTTACTTGGCAAATATTTTAGTATAACATACCTTATGTGTAGTCGATA

TATTTGACCAAGCAGAATCATTTTGATTTCAATAATAATCAAAATAACAATCTCTAGGCAATTTAATATTTGCATTAATTGGATTT

TCATTGTCATATAATATCATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTACACAGTTGGAAGGTTGGTCCATGGGTA

TCCATCAGACTACTCGGCTTTCATCATGGGCCTCCCGGGTTCTGGCACGGTGACGTCGTGCAGCAGGAGCTCGACAAGCGCTCAGT

GGATGAGGAGCCCAGTGCTATTGTTTTTGAATGAAGAAGTCGCCTTGAAGGAGCCTTCAG

//

美首鲽GC4.4

TATTTGACCAAGTAGAATCATTTTGGTTTCAATAATAATCAAAATAACAATCTCTAGGCAATTTAATATTTGCATTAATTGGATTT

TCCATCAGACTACTCGGCTTTCATCATGGGCCTCCCAGGTTCTGGCACGGTGACGTCGAGCAGCAGGAGCTCGACAAGCGCTCAGT

GGATGAGGAGCCCAGTGCTATTGTTTTTGAATGAAGAAGTCGCCTTGAAGGAGCCTTCAG

//

Petrale 鲽 02A(3)

ATGAAGTTCACTGCCACCTTCCTCGTGTTGTTCATGGTCATCGTCATGTTTGAACCTGGAGAGTGTTTTTTTGGAATGCGTTTTCA

CGGGGTCCACCATGGTAGGGTCACAAAAGTGATTTGATTATTACATGCCAAATATGTTAATGAAACATACCATATGAGCAGTCGTA

TTATTTGGACAAGTAGAATCACTTTGATTTCAATAGTAATTAAAATAACAATCAAAAAGGCCTTTGATTAGCATGTTCCTTCAATG

AAATGGACATTGAGGTTTATTTTGATTCTCACCTGCATCGACCTGCTGCGGCAACTATTGAAATCAAATTTGTCCCAGAAGAAACT

AAATTAACATTTTCTAGGCCATCTAATCTTTGCATGAATTGGATTTGCTTTCAAAAATATATAGAATAACTGGATTTATGCTAAAA

TAATAAAAACACACATTCTGATTTTACCAGRCAAGATTGAACACTACTTAAAAGTACGTATAAAACATCATCTGTATGTATAATTG

TGTTTGTTTGTTTTTTAGCAGGTGGAGGTTTTCTCAATGCGCAAGGACTTCTACCATCATTACTGTGTAATTTTAATAGTATTARC

ATCAGTACTCTTATTGACAACGTCTCTTGTCTCGCTGACTCTCTCTATCAGATTAAACCCAGGGTATCGCGGTTACGACGAGCAGC

AGGAGCTCGACAAGCGCGCAGTCGATGA

//

Petrale 鲽 02B

ATGAAGTTCACTGCCACCTTCCTGGTGTTGTCCTTGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTCTTTGGAGCCCTTCTCAA

AGGTAGAGTCACGGAATTAATTTGATTGTTACATGGCAAATAATTTTGTATAACATATCATATGAGCAGTCGATGTATTTGACCAA

GAAGAATCATTTTGATTTCAATAATAATCAAAATAACAATCTCTTGGAGATTATATATTTGCAATAATTGGATTTTATAAAATATA

GAACAACTGGATCTTAATGCTAAAATAATTAAACATACATTCTGATTTTACCAGTCAAAATTAACCACTACTTTAAAGTATGTATA

AAACATCATCTGTATGTTTAATTGTTTAACTTTTAACAAATAGTCCAAATAATTGTGTAATGGAAATGTATTCATTGTCATATAAT

ATAGTTTGCTTGACTTTATCACCGTGTGTTTTTGTTTGTTTTTTCACAGGTGCCCAGGCGCTCCATGGGTAAGGACTTCTACCATC

ATGACTGTGTAAGTTTAATAATATTATCATCAGTACTGTTATTAACGACTTCTCTTGTCTCGCTGACTCTCTCCATCAGAATCATC

CACAATGCTCGTCACGGTTACGACGAGCAGCAGCAGGAACAAGCGCGCAGTCGATGA

//

Petrale 鲽 PL1/2/2.1

CTTCGTCCTCATGGTTGAACCTGGAGAGTGTGGTTGGAAAGATTGGTTTCGTAAGGCTAAGAAAGGTAGAARCACGGAATTAATTA

GCTTTTTACATTGCAAATAGATTTTTTATAACAGCTGGAAATCACAAAAATAAATAGTCGATATATTTGGCCAATTAGAATCACTT

TAATTTCAATAATAATCTAAATAACAACCTAAAAGGCCTTTGATTAGCATGTTCCTTCAATGAAAAGGACATTGAGGTTTATTTTG

ATTCTCACATGCACCGACCTGTGCGGCAACAATTGAATTCAGATTTGTCCCAGAAGAATTCAAAGTACATTTTTCCAGGCGATTAA

ATCTTTCCATTACTCGGATTTAAAAATAAATAAATAGAATAACTGAAGCGCTATGATAAAATAATTACACATTCATTCTGATTTTA

CAAGTCAAGATTGAACACTATTAAAAAGTGTGTATAAAACATCATCTGTATGTATAATTGTTTAACTGTTAATAGTCTTAATAATT

GTGTTATGGAAATGTATTAATTTACATTTAATATCATTTGCTTGAGTTTACCATCATGTGTTTTTGTTTGTTTTTACACAGTTGGC

AAGACTGTTGGCGGCTTGGCCCTTAAGTAAGAACTTCTACCATCATTACTGTATAATTTTGATAGTATTATCACCAGTACTGTTAT

TAACTACTTCTCTTGTCTCGCTGACTCTCTCCATCCGACTCATCCGCAGTCATTACCTTGGCGAGCAGCAGGAGCTTGCCAAGCGC

GCAGTCFATGACGACCCCAGTGTTATTGTCTTTGACTGAAGAAGTCGCCTTGAAGGAGCCTTCAG

//

英吉利鲽 05A

ATGAAGTTCACTGCCACCTTCCTCATGATTTTAATCTTCGTCCTCATGGTCGAACCTGGAGAGTGTGGTATTAGGAAATGGTTTAA

AAAGGCTGCTCACGGTAAAGTCACGGAATTAATTTGCTTTTTGCTTTACAAATATTTTTTTATAGCAGCTGGAAAATCACAAAAAT

AAATAGTCGATGTATTTGGCCAATTAGAATCACTTTGATTTCAAATAATAATCTAAATAGCAACCTAAAAGGCCTTTGATTAGCAT

GTTCCTTCAATGAAATGGATGTTGAGGTTTATTTTGATTCTCACATGCACCFACCTGCTGCGGCAACAATTGAATTCAAATTTGTC

CCAAAGGAATTCAAAGTAAACTTTTCTAGATGATTTAATCTTTCCATAACTCGGCTTTGTTTTTAAAAATATARAARAACTCAATC

ACTATGATAAAATAATAACACATACATTCTGATTTATACAAGACAAGATTGAAAACTTCTTAAAAGTATGTATAAAACATCATCTG

TTTGTATAATTGTTTATCATTTCACAAAAAGTCCAACTAATTGTGTTATGGAATTGTATAAATTGTCATTTAATATAATTTTTTTG

AGTTTATCAATATGTGTTTTTGTTTGTTTTACACAGTTGGCAAGGAAGTTGGCAAGGTGGCCCTTAAGTAAGGACTTCTACCATTA

TTACTGTATAATTTTGATAGTATTATCACCCGTACTGTTATTGACAACTTCTCTTTTCCTGCTGACTCTCTCCATCTGACTCATCT

GCAGTGCTTGCCTTGACAAGCAGCAGCAGCTCGACAAGCGCGCAGTCGATGA

//

英吉利鲽 PL1/2/5

GCCCACTTTGTATTCGCAAGGTAATATCGATATTTTTCAACTCATTTAGAGCGAGACCAAGCATTTGGGAAATGTGCTAAGGTTGT

TACTGTATAATGCAAAATTAATGATCTTTATTTTTCTGTTTTTTTTTGCAGAATGAAGTTCACTGCCACCTTCCTCATGATTTTAA

TCTTCGTCCTCATGGTCGAACCTGGAGAGTGTGGTTTGAAGAAATGGTTTAAAAAGGCTGTTCACGGTAGAGTCACGGAATTAATT

TGCTTTTTGCTTTACAAATATTTTTTTATAGCAGCTGGAAAATCACAAAAATAAATAGTCGATGTATTTGGCCAATTAGAATCACT

TTGATTTCAATAATAATCTAAATAGCAACCTAAAAGGCCTTTGATTAGCATGTTCCTTCAATGAAATGGATGTTGAGGTTTATTTT

GATTCTCACATGCACCGACCTGCTGCGGCAACAATTGAATTCCAATTTGTCCCAAAGGAATTCAAAGTAAACTTTTCTAGGCGATT

TAATCTTTCCATAACTCGGCTTTGTTTTTAAAAATATATAATAACTCAATCCCTATGATAAAATAATAACACATACATTCTGATTT

ATACAAGACAAGATTGAAAACTTCTTGAAAGTATGTATCAAACATCATCTGTTTGTATAATTGTTTAACAGTTCACAAAAAGTCCA

ACTAATTGTGTTATGGAATTGTATAAATTGTCATTTAATATAATTTTTTTGAGTTTATCAATATGTGTTTTTGTTTGTTTTACACA

GTTGGCAAGAAAGTTGGCAAGGTGGCCCTTAAGTAAGGACTTCTACCATTATTACTGTGTAATTTTGATAGTATTATCACCAGTAC

TGTTATTGACAACTTCTCTTTTCCTGCTGACTCTCTCCATCCGACTCATCTGCAGTGCTTACCTTGGCGAGCAGCAGCAGCTCGAC

AAGCGTGCAGTCGATGAAGAGCCCAGTGTTATTGCTTTTGACTGAAGAAGTCGCCTTGAAGGAGCCTTCAG

//

箭齿鲽 09A

ATGAAGTTCACTGCCACCTTCCTCATGATGTTCATCTTCGTCCTCATGGTTGAACCTGGAGAGTGTGGTTGGAGGAAATGGATTAA

AAAGGCTACTCACGGTAAAGTCACGGAATTAATTCGTTTTTTGCTTTGCAAATATTTTTTTTATAACAGCTGGAAAGTCACAAAAA

TAAATAGTCAATATATTTGGCCAATTAGAATCACTTTGAGTTCAATAATAATCTAAATAACAACCAAAAAGGCCTTTCCTTTAATG

AAATGTACGTTGAAGTTTATTTTGAATCTCACATGCACCGACCTGCTGCGGCAACAATTGAATTCAAATTTCTCCCAGAGGAATTC

AAAGTAAATTTTTCTAGGCGATTTAATCTTTCCATTACTCTGATTTGTTTTAAATATATAGAATGACTCAATTGCTATGATAAAAT

AATAAGCCATACATTCTGATTTTTACAAGACAAGATTGAAAACTTCTTAAAAGTACGTATAAAACATCATCTGTATTTATAATTGT

TTAACATTTAACAAATTGTCCTACTAATTGTGTTATGGAAATGTATAAATTGTCATTTAATATCATTTGCTTGAGTTTATCATTAT

TTGTTTTTGTTTGTTTTTACACAGTTGGCAAGCATATTGGCAAGGCGGCCCTTGAGTAAGAACTTCTACCATCATTACTGTATAAT

TTTGATAGTATTATCACCAGTACTGTTATTGACAACTTCTCTTGTCCTGATGACTCTGTTCATCCAACTCATCTGCAGTGCTTACA

TTGGCGGGAAGCAAGAACTCGACAAGCGCGCAGTCGATGA

//

格陵兰大比目鱼 12B

ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTTTTCGGATTGCTTTTTCA

CGGGATCCACCATGGTAGGGTCACGGAATTAATTAGATGTTTACATGGCAAATATTTTAAGATAACACACCATATGAGTAGTCGAT

ATATTTGACCAATTAGAATCACTTTAATTTCAATAATAATCACAATAACAATCTCTAGGCCATTTAATCTTTCCATTAATCGGATT

TGTTTTTTTAAATATAGAATAACTGGATCTTTATGCTAAAATAATGAAACATACATTCTGATTTTACCAGTCAAGATTGAACGTTA

CTTAAAAGTATGTTTAAAACATCATCTGTATGTATAATTGTTTAGCTGTAAACAAATAGTCCAAATAATTGTGTTATGGAAATGTA

TTAATTGTCATATAATATAATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTTAACACAGCTGGAAAGTTGATCCATGG

GTAAGGACTTCTACCATCATTACTGTGTATTTTTAATAGTATTATCATCAGTACTGTTATTAACAACTTCTCTTCTATCGCTGACT

CTCTCCATCAGACTCATCCATCATGGTTACGACGAGCAGCAGGAGCTCGACAAGCGCGCAGTCGATGA

//

太平洋大比目鱼 15A

ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTGGGAAATTGGATGGGGCC

CCATATCAGCGGTAGAGTCACGGAATTAATTTGCTTTTTCCATTGCAAATATTTTAATATTGCATAGCTGGAAAATCACGAAATAA

GTAGTCGATATATTTGGCCAAATAGAATAACTTTGATTTCAATAATAATCAAAATTACAATCAAAAAGGCCTTTGATTAGCATGTT

CCTTCAATAAAATGGACATTGAAGTTTATTTTGATGCTCACATGCACCGACCTGCTGCGGCAACAATTGAAATCAAATTTGTCTCA

GAATTTAAAGTACATTTTTCTAGGTGATTTAATCTTTCCATTCATCTGATTTATTTTATAAATATAGAATAACTGGATCTTTCTGC

TAAAATAATAAAACACACATTCTGATTTTACCAGTCAAGATTGAACACTACTTAAAAGTATGTATAAAACATCATCTGTATGTATA

ATTGTTTAACTGTTAACAATAGTCCAAATAATTGTGTTAAGGAAATGTATTAATTGTCATTTAATATCATTTGCTTGAATTTATCA

CCATGAGTTTTTTGTTTGTTTTTACACAGGTAGAAAGAAGGCCTTGCAGTAAGGACTTCTACCATCATTACTTTGTAATTTTTATA

GTATTATCATCAGTACTGTTATTGACAACTTCTCTTGTCTCGCTGACTCTCTCCATCAGGATGAACTCAGAGCGTCGCAGTTACGA

CGAGTAGCAGCAGAAGCTCGACAAGCGCGCAGTCGATGA

//

太平洋大比目鱼 15B

ATATTTGATATATTAGAATCACTTTGATTTCAATAATAATCAAAATAACAATCTCTAGGCGATTTAATATTTGCATTAATTGGATT

CTTAGAAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACTGTTAACTAATAGTCCAAATAATTGTGTTATGGAAATGTA

TTAATTGTCATTTAATATCATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTACACAGTTGGAAATTTGATCCATGGGT

AAGGACTTCTACCATCATTACTGTGTATTTTTAATAGTATTATCATCAGTACTGTTATTGACAACTTCTCTTGTCTCGCTGACTCT

CTCCATCAGACTCATCCATCACGGTTACGACGAGCAGCAGGAGCTCGACAAGCGCGCAGTCGATGA

//

C-O 鲽 PL1/2/6

GCCCACTTTGTATTCGCAAGGTAATATCGATATTTTTCAAACTCATTTAGACGAGACCAGGCATTTGGGAAACGTGCTAAGGTTGTTACTG

TATAATGCAAAATTAATGATCTTTATTTTTCTGTTTTTTTTTGCAGAATGAAGTTCACTGCCACCTTCCTCATGATTTTAATCTTCGTCCT

CATGGTCGAACCTGGAGAGTGTGGTATTAGGAAATGGTTTAAAAAGGCTGCTCACGGTAAAGTCACGGAATTAATTTGCTTTTTGCTTTAC

AAATATTTTTTTACAGCAGCTGGAAAATCACAAAAATAAATAGTCGATGTATTTGGCCAATTAGAATCACTTTGATTTCAATAATAATCTA

AATAGCAACCTAAAAGGCCTTTGATTAGCATGTTCCTTCAATGAAATGGGTGTTGAGGTTTATTTTGATTCTCACATGCACCGACCTGCTG

CGGCAACAATTGAATTCAAATTTGTCCCAAAGGAATTCAAAGTAAACTTTTCTAGGCGATTTAATCTTTCCATAACTCGGCTTTGTTTTTA

AAAATATATAATAACTCAATCGCTATGATAAAATAATAACACATACATTCTGATTTATACAAGACAAGATTGAAAACTTCTTGAAAGTATG

TATCAAACATCATCTGTTTATATAATTGTTTAACATTTCACAAAAAGTCCAACTAATTGTGTTATGGAATTGTATAAATTGTCATTTAATA

TAATTTTTTTGAGTTTATCAATATGTGTTTTTGTTTGTTTTACACAGTTGGCAAGAAAGTTGGCAAGGTGGCCCTTAAGTAAGGACTTCTA

CCATTATTACTGTATAATTTTGATAGTATTATCACCAGTACTGTTATTGACAACTTCTCTTTTCCTGCTGACTCTCTCCATCCGACTCATC

TGCAGTGCTTACCTTGGCGAGCAGCAGCAGCTCGACAAGCGTGCAGTCGATGAAGAGCCCAGTGTTATTGCTTTTGACTGAAGGAGTCGCC

TTGAAGGAGCCTTC

//

表13

附件I.参照表4的pleurocidin样基因和cDNA的核酸序列

NRC-01

ATGAAGTTCACTGCCACCTTCCTCCTGTTGTTCATCTTCGTCCTCATGGTTGATCTCGGAGAGGGTCGTCGTAAGAAAAAGGGGTCG

AAGAGAAAGGGGTCCAAGGGAAAGGGGTCCAAGGGAAAGGGCAGGTGGTTGGAAAGGATTGGTAAAGGTAGAGTCACGGAATTAATT

TGCTTTTTACATTGCAAATATTTTTCATATAACATTGCTGGAAAATCACAAAAATAAGTAGTCAATATATTTGGCCAAATAGAATCA

CTTTGATTTCAATAATAATCAAAATAACAACCTAAAAGGCCTTTGATTAGCATGTTCCTTCAATGAAATGGACATTGTAATTTACTT

TGATTCTCACATGCTACGACCTGCTGCAGCAACATTTGAAAATAAATTTGTCCCAGAAGATTTTAAAGTACATTGTTATAGGCGATT

TATCTTTCTATTACTCAGATATTTGTTCAAACCAATAGAATAACTGGATCTCTATGCTAAAATAATAAAACACACATTCAGATGTTA

CCAGTCAAGATTGAACGCTGTTTAAAAGTAAGTATGAAACATCCTCTGTATGTATAATTGTTTAACTGGTAACTTATAGTCCTAATA

ATTGCGTTATGGAAATGTATTAATTGTCATTTAATATAATTTGCTGGAATTTATCACTGTGTGTTTTTGTTTGTTTTTACACAGCTG

GCGGGATAATTATCGGGGGGGCCCTTGAGTAAGGACTTCTACCATCATTACTGTGTAATATTTATAGTTATGATCAGTACAGTTATT

AACAACTTCTCTTGTCTCGCTGAACTTCTCCATCAGTCACCTCGGGCAGGGGCAGGTGCAGGGGCCGGATTACGACTACCAGGAGGG

GGAGGAGCTCAACAAGCGCGCAGTCGATGAA

//

NRC-02 和 NRC-03

ATGAAGTTCACTGCCACCTTCCTCCTGTTGTTCATCTTCGTCCTCATGGTTGATCTCGGAGAGGGTCGTCGTAAGAGAAAGTGGTTG

AGAAGGATTGGTAAAGGTGTCAAGATAATTGGCGGGGCGGCCCTTGATCACCTCGGGCAGGGGCAGGTGCAGGGGCAGGATTACGAC

TACCAGGAGGGGCAGGAGCTCAACAAGCGCGCAGTCGATGAAA

//

NRC-04

GCCCACTTTGTATTCGCAAGGTAATATTGATATTTTTCATATTCATTTAGACAAATGTGCTCAGCTTGTTACTGTATAATGCAAAAG

TTAATGATCTTTATTTTTCTGTTTTTTTTTGTAGAATGAAGTTCACTGCCACCTTCCTCATGATTGCCATCTTCGTCCTCATGGTTG

AACCTGGAGAGTGTGGCTGGGGAAGCTTTTTTAAAAAGGCTGCTCACGGTAGAGTCACAGAATTAATTAGCTTTTTGCTTTGCAAAT

ATTTTTTTTATAACAGCTGGAAAATCACAAAAATAAATAGTATATATATTTGGCCAATAAAATCACTTTGATTTCAATAATAATCTA

AATAACCAACCTAAAAGGCCTTTGATTAGCATGTTCCTTCAATGAAATGTACGTTGAGGTTTATTTTGATTCTCACAAGCACCAACC

TGCTGCGTCAACAATTGAATTCAAATTTGTCCCAAAGGAATTCAAAGTAAATTTTTCTAGGCGATTTAATCTTTCCATTACTCTGAT

TTGTTTTAAAAATATAGAATAACTCAATCTCTATGATAAAACAATTACACATACATTCAGATTTTTATAGGACAAGATTGAAAACTT

CTTACAAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACATGTAACAACTAGTCCTACTAATTGTGTTAAATTGTCATTT

AATATCAATTGCTTGAGTTTATCATTATGTGTTTTGTTTTTTTTTACACAGTTGGCAAGCATGTTGGCAAGGCGGCCCTTACGTAAG

GACTTCTACCATTTTACTGTATAATTTTGATAGTGTTATCACCAGTACTGTTTTTGACAACTTCTCTATTCCTGCTGACTCTCTCCA

TCCGACTCATCCGCAGTCATTACCTTGGCGATAAGCAGGAGCTCAACAAGCGTGCAGTCGATGAAGACCCAAATGTTATTGTTTTTG

AATGAAGAAAT

//

NRC-05

ATGAAGTTCACTGCCACCTTCCTGGTGCTGTCCCTGGTCGTCCTAATGGCTGAGCCTGGAGAGTGTTTCTTAGGAGCCCTTATCAAA

GGGGCCATACATGGTAGAGTCAAGGAATTAATTAGATTTTTACATGTCAAATAATGTAGTAGAACATATATAAGTAGTCAATATATT

TGACCAAGTAGAATCATTTTGATTTCAATAATAATCAAAATAACAATCTCCAGGCGATTTAATATTTGCAATAATTGGATTTTATAG

AATACGGAACAACTGGATCTTAATGCTAAAATAATCCAACATACATTCTGATTTTGCCAGGCAAAATTAAACACTACTTTAAAGTAT

GTATAAAACATAATCTGTATGTTATAACAAATACTCCAAGCAATTGTGTGATGGAAATGTATTCATTGTCATTTAATATAATTTGCT

TGAGTTTATCATCTTGTGTTTTTGTTTGTTTTTTCACAGGTGGCAGGTTTATCCATGGGTAAGGACTTCTACCATCATGACTGTGTA

TTTTTAATATTATTATCTACAGTACTGTTATTGACAACTTCACTTGTCTCGCTGACTCTCTCCATCAGAATGATCCAAAACCATCAC

GGTTATGACGAGCAGCAGGAGCTCAACAAGCGCGCAGTCGATGAA

//

NRC-06

GCCCACTTTGTATTCGCAAGGTAATATCAATATTTTTCAAATTCATTTAGACGAGACCAACCTTTTGGGAAATCTGCTCAGCTTATT

ACTGTATAATGCAAATGTTAATGATCTTTATTTTTCTGTTTTTTTTTTGTAGAATGAAGTTCACTGCCACCTTCCTCATGATGTTCA

TCTTCGTCCTCATGGTTGAACCTGGAGAGTGTGGTTGGGGAAGCATTTTTAAGCATGGTCGTCATGGTAAAGTCACGGAATTAATTA

GCTTTTAACTTTGCAAATATTGTTTTTTTTTTTAACAGCTGGAAACTCACAAAAATAAATAGCCGATATATTTGGCCAATTATAATC

ACTTTGATCTAAATAACAACCTAAAAGGCCTTTGATTAGCATGTTTCTTCAATAAAATGATTGAACACTACTTAAAGGTATGTATAA

AACATCATCATGTGTTTTTGTTTGTTTTTACACAGCTGCCAAGCATATTGGCCATGCAGCCGTTAAGTAAGGACTTCTACCATTATT

ACTGTATAATTTTGATAGTATTATCACCAGTATTGTTATTGACAACTTCTCTTTTTCCTGCTGATCCGACTCATCCGCAGTCATTAC

CTTGGCGAGCAGCAAGATCTCGACAAGCGCGCAGTCGATGAAGACCCAAATGTTATTGTTTTTGAATGAAGAAAT

//

NRC-07

ATGAAGTTCACTGCCACCTTCCTCATGATGTGCATCTTCGTCCTCATGGTTGAACCTGGAGAGTGTCGTTGGGGGAAATGGTTTAAA

AAGGCCACACACGGTAGAGTCACAGAATTAATTAGCTTTTTGCTTTGCAAATATTTTTTTATAACAGCTGGAAAATCACAAAAATAA

ATAGTCTATATATTTGGCCAATTAGAATCACTTTGCTTTCAATAAAAATCTAAATAACAACCTAAAAGTCCTTTGATTAGCATTTTC

CATCAATGAAATGGACGTTGAGGTTTATTTTGATTCTCACATGCACCGACCTGCTATGTCAACAATTGAATACAAATTTGTCCCAGA

GGAATTCAAAGGAAATTTTTCTAGGCGATCTAATCTTTCCATTACTCGGATTTGTTTTTAAATATATAGAATAACTCAATCTCTATG

ATAAAATAATAACACATACGTAAAGATTTTTACAAGACAAGATTGAAAACTTCTTAAAAGTACGTATAAAACATCATCTGTATTTAT

AATTGTTTAACATTTAACAAATAGCCCTACTAATTGTGTTATGGAAATGTATAAATTGTCATTTAACATAACTTGTTTGAGTTTATC

ATTATTTGTTTTTGTTTGTTTTTACACAGTTGGCAAGCATGTTGGCAAGGCGGCCCTTACGTAAGGACTTCTACCATCATTACTGTA

TAATTTTGATAGTATTATCACCAGTACTGTTATTGACAACTTCTCTTGTCCTGCTGACTCTCTCCATCCGACTCATCCATAGTGCTT

ACCTTGGCGACAAGCAAGAACTCGACAAGCGCGCAGTCGATGA

//

NRC-08

TAATAAAACTAATGTGTAAAGTCTTCCACTTTTTTTACTGTATTTACTTAAACAGAAAATTATTCTCACGATTCTGGAGCTGCAGCC

ACTAAGTGTTGCTTCATGAAGTGAATACACAATTGTTCTAACAACCACTCACCCAATTAACCAGAATCTACAAAGTGAGGAAGTGAG

AGGAGTCGTCCTGTGTTTTCAAATTTTTTGAATGATCTACCACTATGTGAGCTCCTCCTGTTATAGCTCTAAATGTTACACAATGAA

TGTGAAGTCAGTTCTGTGTATATAAAGAGTTGCCTCTGTAGAGCATACAACAGATTTCACCTTTGAATCTCACAAACCTCACTTTGT

ATTCGACAGGTAAGATCGATATTTTTCAAACTCATTTAGACGAGACCAAGTATTTGGGAAATGTGCTCAGCTTGTCAATGTATAATG

CAAATGTTAACAATCGTTTTGTTCTTATGTTGTGTTTGTAGGATGAAGTTCGCTACTGCCTTCCTGATGTTGTCCATGGTCGTCCTC

ATGGCTGAACCTGGAGAGTGTCGTTCTACAGAGGACATCATCAAGTCTATCTCGGGTAGAGTCCAGGAATTAATTATTATCAATAAC

AATGAAATAACAACCAAAAGGCCTCTGATTAGCATGTTCCTTCAATGAAATGGTCGTTTTTTATCTATTTTGATTCTCACATGCAAC

GACCTGCTGCGGCAACATTTGAAAATCAATCTTTTTTACACAAATTCAAAGTACATTGATTTATTCGATTTAATCTTAACATTAATC

AGATTTGTTTTTGTTTAAATATATCGAATAACTGGATCTCTATGATAAAATAATTAAACATACATTCTTATTTTACCAATCAAGATT

GAACACTTCTTAAAAGTACGTATAAAACATCATCTGTATGTATAATTGTTTGATTGTTAAGTAATATTTCCAATAATTGTGTAATGG

AAATGTATTAATTGTCATTTAATATAATTTGCTTGAATTTATCACCATGTGTTTTTTGTTTGTTTTTAAACAGGTGGAGGTTTTCTC

AATGCGTAAGGACTTCTATCATCATTACTGTGTAATTTTTATAGTATTATCATCAGTACTGTTATTAACAGCTTCTCTTGTCTCACT

GACTCTCTCCATCAGAATGAACGCCGGTTACAATGAGCAGCAGGAGCTCAACAAGCGCTCAGATGATGATGACAGCCCCAGTCTTAT

TGTTTTTGACTGAAGAAGTCGCCCTGAAGGAGCCTTCAGATGATATATTATGCTTCTTGCTCTTCATTGAAATAAATCAAAC

//

NRC-09和NRC-10(来自相同假基因的可选择拼接产物)

GAGCTCGATCAAACCAGACAAAGTTGCCTTCCTTCACAACAATAGAGTGGAAGAGAAAACAGGAGAGGACTTGTATCCTCCTGATGC

TGAGAAGAAGAAATAAGAAAGACTTGCAGCATTGATACTTTTACTTATACAGAAAACCTATAAACATGACGGGAGCATAAGTTAAAG

TCACAATACAGAAGAGAACCAGAAGCCAAACTGCAGCAAATTTACTGGTATTCATATGATACTGGAGCCAAAGCAACGCAGAGACTC

AGCAGCAGTGAACCAAAGAGTTTAACTGTACTTGTGTCCAGGTTGAATGAAAGTATTGAATAAAAAAAACCAAGACAGAACATGCAT

ATTTTTTTGGAATGGAATATAAGTCAGGAGAATATGTGTTGTTGTGGTGGCAGGATCCATCACTCTCTCAAGTTAACACAAGAACTT

TTAGAAACATAGATACGATCTCAAGTAAACTTCCATTTACTATTTGACTTTTTTTAAATACTTACAAATTATATTTTAAAAAGCAAC

AATAAATCAGAGATAACTTCATGGAGAAGTCTATATTCATATTTGTGAGCTGAACATTCATGCTGCCTGTTCTATCACATCTGAGTG

TGGAGGCCACTGACGTTTACTGACCTCAACGTCTACCGCTCTAATGCATTTGGAGTTAAAGGTAAGCATTTTGTTATTTGTCTTCAC

TGTATTGATACTAAATATACAGGGTTACAAATACAGTTAAAACAAGAGAGACGAGGTGTCGAAAGCTTCAGCATCAATGTGCTGATC

GCTGATAGCTGATCTTACCCGACACCGGTGACATGGCATCAAAATGACCACCTCTTTTTTCTTCTCTTTTTTTTGTAGGACGAAGTT

CGCTGCCGCCTTCCTCGTGTTGTTCATGGTCATCGTCATGTTTGAACCTGGAGAGTGTTTTTTTAGATTGCTTTTTCACGGGGTCCA

CCATGGTAGGGTCCCGGAAGTAATTTGATTATTACATGCCAAATATTTTAATGAAACATACCTTATGAGTAGTTGTATTATTTGGAC

AAGTAGAATCTCTATGATTTCAGTAGTAATTAGAATAACAATCAAAAAGGCCTTTGATTAGCATGTTTCTTCAATGAAATGGACATT

GAGGTTTATTTTGATTCTCACATGCTACAGCAACAATTGAAATCAAATTTTTCGCAGAAGAAACTTAATTAACATTGTTGTGCAATA

GTGCTTAAAAAGTGTTACCATGGAATGGTGTGCGTTTAGGCACTCAATAAATTTGGTTATCAAAATTAAATTAAAAAAATTAATATT

TAAAATATTAATATTAAATCATAACTTTAATTGTTTAAAGTTCTCGCGGGGAACCACCCTTCTTCTGAAGGTAAAGGATAGCCAATT

TATTGATTAAGATCAGTCTCATTTAGATCTAGTTCAAATAGAAATCTCAATATTTTACCATCGAAGATTTTATAATGAACAGTGAAG

GTTATGGAGTTCTAAACAGTGTAACAGTTGGCAAAGTTCACTATTGCAATATTAATGACAGACCATTTGTGAAAGAAGAACATTTAT

TATGAGCATAATAAAGTATGAAAGCACGAATTACTAAACAATCAAAGCTAACTAACAAGGACGTGTGTGGGTGTGTGTGTGAATGTA

AATAAGGGGGGGGCTCAAACTGGTGGCCTACAAGAAGAGCCTTAAGATAGCAACCACAAGGGCTGTACCATAAATGTTGTAGTAAAA

AGAGTTATTAAAATGAGTTAGAATAACTAATGACTAATTAGTAGACAAACTAGTAGACAAACTAAACAACTAACAATAACAAGGAAG

TGTGTGTGAGTGTGTTTGTGTGTAAATGTTAATTAGGGGCTCTCAAACTGGTGTCTTACCAGAAGAGTAAGATAACAATTCCCCCCC

TTCTTCTGAGGTTGTTTTACGACTGTTGCTTTATGGCCGTGAGGGAAGGTTTAACTCGGTGACATGCTATACGTGTCTGTGTAGATG

TTAATCAGAGAATGCCAGAGTCAGAGAGACCTACGGAGGAAGTCTGTGAAGGGCCTATCTAACATTAGCTTTCCTTTAACTTATAAC

ACAATATCAGAAACACATATCAACCTTATAAACACACACAGAATCAAATAAACAGTCTTGCTTAGCATGTATAATTATTAAGCCCAG

ATTATGTTACCAGTCCGAGGGAAAGAGTTCAGTTGCAGTTCTGTGACGTCTCCTGGCTTTGTGGTCGTAGAGTTCTGCATTCGCGAT

TCTGTCGAGCCGTGTGCTCAGATGCAGGTTGAAGTTCTCCTGCAGGACATCGCGTCGCTGCGAGGATTTTGTAGAGCTTGAAGGGCG

AGGAGATTTCCTTGAGTGGTGAGCTGGAAGCTGGACCTCTGACCTCTGGTTGTTGGTTGGAAGAGAAGAAAGCTGGAGCGGCGTGGT

TTCTCCCTCTAGCCGATGCAGGAGGAGAAGCCGGCAGCCCCACTCCTTGAAGAGTTGTGGAGAGAGATGGGAGCAAAGAGCTAGATT

TTGGGGAGACCTCTCCTTATATTGGCCCCGATGACCTCACAGGCCTTGGAACGGAGTGACCAATAGGAGTTGACCCTGGTAATTCTT

GACACCTTTGTGGGACATTGTCAAGACCCCAGGACATGCAGCATCCTGTTACAATCTGGGAGACGGAGTTCCTTGACTGTCTCAGAA

CAATGAGAACCTGTGGCATCTTGGGGGATTGAGTCCACTCGAGCACATGCGGCATGTTTGTTCCAAGTTTGACTGAAAGGAGGCCTG

TGGTTTGCACAAAAACCATGTCCCAACAACATTTTCTAGGCCATTTAATCTTTACATAAATTGGATTTGTTTTAAAAAATATATAGA

ATAACTCGATCTTTCTGCGTAAATAATAAAAAATAAATTCAAATTTGACCAGTCAAGATTGAACACTAATGAAAAGTACCTATAAAA

CATAATCTGTATGTATAGTTGTTTGACTGTTAAATAGTAGTCCTAACAATTGTGTAATGGAAATGTATTCATTGTCTTTTAATACTA

TTTGCTTATCATAATGTGTTTGTTTGTTTTTTAGCAGGTGGAGGTTATCTCAATGCGTAAGGACTTCTACCATCATTACTGTGTAAT

TGTATTAGTTTTATCATCAGTACTGTTATTGACAACGTCTCTTGTCTTGCTGACTTGACTCTCTTCATCAGATTAAACCCAGGGCCG

GTTACAATGAGCAGCAGGAGCTCGACAAGCGCGCAGTCGATGACAACCTCAGTGCTATTGTTTTTTACTGAAGAAGTCGACCTGAAG

AATCTTTTGAAATGATATGAAATGTTTGCCTTTCAATGAAATAAATCAAACATGACTGGATATTTGTTCTTTTGCATTGATGTATTG

TTGAGTGACAGTTGAATAATTTTGGAAAACTTATAACAGATCTCAATTTTAGGATGTCAAATCATTTCTCTGTGTCTTATTCAAATA

TGAGATTTAACAATGACAAT

//

NRC-11

GCCCACTTTGTATTCGCAAGGTAAGATCAATATTTTTCAAATTCATTTAGACGAGACCAACGTTTGCGTAAATGTGCTCAGCTTGTT

ATTGTATAATAACAAAGTTAACGATCTTTATTTTTCTGTTTTTTTGTAGAATGAAGTTCACTGCCACCTTCCTGATGTTGTTCATCT

TCGTCCTCATGGTTGAACCTGGAGAGTGTGGATGGAAAAGTGTGTTTCGTAAGGCTAAGAAAGGTAGAGTCACGGAATTAATTAGCT

TTTTACATTGCAAATAGATTTTTTATAACAGCTGGAAAATCACAAAAATAAATAGTCGATATATTTGGCCAATTAGAATCACTTTAA

TTTCAATAATAATCTAAATAACAACCTAAAAGGCCTTTGATTAGCATGTTTCTTCAATGAAATGGACATTGAGGTTTATTTTGATTC

TCACATGCACCGACCTGTGCGGCAACCATTGAATTCAGATTTGTCCCAGAAGAATTCAAAGTACATTTTTCCAGGCGATTAAATCTT

TCCATTACTCAGATTCAAAAATAAATAAATGGAATAATTGAAGCACTATGATAAAATAATTACACATTCACTCTGACTTTACAAGTC

AAGATTGAACACTATTAAAAAGTGTGTATAAAACAACATCTGTATGCATAATTGTTTAACTGTTAATAGTCCTAATAATTGTTTTAT

GGAAATGTATTAATTTACATTTAATATTATTTGCTTGAGTTTACCATCATGTGTTTTTGTTTGTTTTTACACAGTTGGCAAGACTGT

TGGCGGCTTGGCCCTTGAGTAAGGACTTCTACCATCATTACTGTATAATTTTGATAGTATTATCACCAGTACTGTTATTAACTACTT

CTCTTGTCTGCTGACTCTCTCCATCCGACTCATCTGCAGTCATTACCTTGGCGAGCAGCAGGAGCTTGACAGCGCGCAGTCGATGAG

GACCCCAGTGCTATTGTCTTTGACTGAAGAAGTCGCCTTGAAGGAG

//

NRC-12

ACTTTGTATTCGCAAGGTAAGATCAATATTTTTCAAATTCATTTAGACGAGACCAACCGTTGGCGAAATGTGCTCAACTTGTTATTG

TATAATAACAAAGTTAACGATCTTTATTTTTCTGTTTTTTTGTAGAATGAAGTTCACTGCCACCTTCCTGATGTTGTTCATCTTCGT

CCTCATGGTTGAACCTGGAGAGTGTGGATGGAAAAAATGGTTTAATAGGGCTAAGAAAGGTAGAGTCACGGAATTAATTAGCTTTTT

ACATTGCAAATAGATTTTTTATAACAGCTGGAAAATCACAAAAATAAATAGTCGATATATTTGGCCAATTAGAATCACTTTAATTTC

AATAATCTAAATAACAACCTAAAAGGCCTTTGATTAGCATGTTTCTTCAATGAAATGGACATTGAGGTTTATTTTGATTCTCACATG

CACCGACCTGTGCGGCAACCATTGAATTCAGATTTGTCCCAGAAGAATTCAAAGTACATTTTTCCAGGCGATTAAATCTTTCCATTA

CTCAGATTCAAAAATAAATAAATAGAATAATTGAAGCACTATGATAAAATAATTACACATTCACTCTGATTTTACAAGTCAAGATTG

AACACTATTAAAAACTGTGTATAGAACATCATCTGTATGTGTAATTGTTTAACTGTTAATAGTCCTAATAATTGTTTTATGGAAATG

TATTAATTTACATTTAATATTATTTGCTTGAGTTTACCATCATGTGGTTTTGTTTGTTTTTACACAGTTGGCAAGACTGTTGGCGGC

TTGGCCGTTGAGTAAGGACTTCTACCATCATTACTGTATAATTTTGATAGTATTATCACCAGTACTGTTATTAACTACTTCTCTTGT

CTCGCTGACTCTCTCCATCCGACTCCTCTGCAGTCATTACCTTGGCAAGCAGCCGGAGCTCGACAAGCGCGCAGTCGATGAGGACCC

CAGTGCTATTGTCTTTGACTGAAGAAGTCGCCTTGAAGGAGCCTTCAGAA

//

NRC-13

TTGCCCACTTTGTATTCGCAAGGTAAGATCAATATTTTTCAAATTCATTTAGACGAGACCAACCATTTGGGAAATGTGCTCAGCTTG

TTACTGTATAATGCAAAAGTTAAGTATCTTTATTTTTCTGTTTTTTTTTGTAGAATGAAGTTCACTGCCAACTTCCTCATGTTGTTC

ATCTTCGTCCTCATGTTTGAACCTGGAGAGTGTGGTTGGCGAACATTGCTTAAAAAAGCTGGTCACGGAATTAATACGCTTTTTACA

TTGCAAATAGATTTTTTATAACAGCTGGAAAATGACAAAAATAAATAGTCGATATATTTGGCCAATTAGAATTATTTTGATTTCAAT

AATAATCTAAATAACAACCTAAAAGGTCTTTGATTAGCATGTTTCTTCAATGAAATGGACATTGAGGTTTATTTTGATTCTCACATG

ACCGACCTGCTGCGGCAACAATTGAATTCAGATTTGTCCCAGAAGAATTCAAAGTAAATTTTCCAGGGGATTAAATCTTTCCATTAC

TCGGATTTAAAAAAAAAAAAAATAGAATAACTGAATTGCCATGAAAAAATAATTACACATACTGTCTGATTTTACAAGTCAAGATTG

AACACTACTTAAAAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACTGTTAACAAATAGTCCAAATAATTGTGTTATGGA

AATGTATTAATTGTCATTAAATATAATTTGCTTGAGTTTATCATCATGTGTTTTTTTTTTTTTTTTACACAGAGGTTAAGACTGTTG

GCAAGTTGGCCCTTAAGTAAGGACTTCTACCATCATTACTGTATAATTTTGATAGTATTATCACCAGTACTGTAGTACTGACAACTT

CTCTCTCCACCCAACTCATCCGCAGACATTACCTTGGCAAGCAGCCGGAGCTCGACAAGCGCGCAATTGATGACGACCCCAGTATTA

TTGTTTTTGACTGAAGAAGTCGCCTTGAAGGAGCCTTCAGAA

//

NRC-14

ATGAAGTTCACTGCCACCTTCCTCATGATGTTCATGGTCGTCCTCATGGCTGAACCCGGAGAGGCTGGTTGGGGAAGTATTTTCAAA

CATATTTTCAAAGCTGGAAAGTTCATCCATGGTGCGATCCAGGCACACAATGACGGCGAGGAGCAGGATCTCGACAAGCGCGCAGTC

GATGA

//

NRC-15

ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTTTGGGGAAAGCTTTTGAAA

TTGGGCATGCATGGAATCGGGCTGCTCCATCAGCATTTGGGTGCTGACGAGCAGCAGGAGCTCGACGAGCGCTCAGAGGAGGACGAG

CCCAATGTTATTGTTTTTGAATGAAGAAGTCGCATTGAAGGAGCCTTCAG

//

NRC-16和NRC-17

ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGGATCCGGAGAGTGTGGTTGGAAAAAGTGGCTCCGT

AAAGGTAGAGTCATGGATTTAATTTGCTTTTTACATTGCAAATACTTTAATATAACATAGTTGGAAAACCACAAAAATAAGTAGTCG

ATATATTTGGCCATATAGAATCACTTTGATTTCAATAATAATCAAAACAACAATCAAAAAGCCCATTGATTAGCATGTCCCTTCACT

AAAATGGACATTGTAATTTATTTTGATTCTCACAGGCACCAACCTGCTGCGGCAACAATTGAAATCAAATTTGTCTCAGAAGAATTC

AAAGTACATTGTTCTAGGCGATTTAATCTTTCCATTCATCGGATCTGTTTTTAAAAATATAGAATAACTGGATCTCTATGTTAAAAT

AATAAAACACACATTCTGATTTTACCTGTCAAGATTGAACACGACTTAAAAGTATGTATAAAACATCATCTGTATGTATAATTGTTT

AACTGTCAACTAATAGTCCAAATAATTGTGTTATGGAAATGTATTCATTGTCATATAATATCATTTGCTTGAATTTATCACCATGTG

TTTTTGTTTGTTTTTACACAGGTGCCAAGCACCTTGGCCAGGCGGCCATTAAGTAAGGACTTCTACCATCATTACTGTGTAATTTTA

ACAGTATTATCATCAGTACTGTTATTGACAACTACTCTTGTCTCTGTTACTCTCTCCAGGGGTTTGGCCTCTTGCGAAGAGCAGCAG

GAGCTCGACAAGCGTCAATGGATGACGAGCCCAGTGCTATTGTTTTTGACTGAAGAAGTCGCCTTGAAGGAGCCTTCA

//

NRC-18

ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGGATCCGGAGAGTGTGGTTGGAAAAAGTGGTTCACT

AAAGGTAGAGTCATGGATTTAATTTGCTTTTTACATTGCAAATACTTTAATATAACATAGCTGGAAAATCACAAAAATAAGTAGTCG

ATATATTTGGCCATATAGAATCACTTTGATTTCAATAATAATCAAAACAATAATCAAAAAGCCTATTGATTAGCATGTTCCTTCACT

AAAATGGACATTGTAATTTATTTTGATTCTCACAGGCACCAACCTGCTGTGGCAACAATTGAAATCAAATTTGTCTCAGAAGAATTC

AAAGTACATTGTTCTAGGCGATTTAATCTTTCCATTCATCGGATTTGTTTTCAAAAATATAGAATAACTGGATCTCTATGTTAAAAT

AATAAAACACATTCTGATTTTATCTGTCAAGATTGAACACGACTTAAAAGTATGAATAAAACATCATCTGTATGTATAATTTTTTAA

CTGTCAACTAATAGTCCAAATAATTGTGTTATGGAAATGTATTCATTGTCATATAATATCATTTGCTTGAATTTATCACCATGTGTC

TTTGTTTGTTTTTACACAGGTGAAAGGTTATCCCAGAGGTAAGGACTTCTACCATCATTACTGTATAATTTTAATAGTATTATCATC

AGTACTGTTATTGATAACTTCTCTTGTCTCGCTGACTCTCTCCATCAGGCATTTCGCTGACGTCGAGCAGCAGGAGCTCGACAAGCG

CTCAGTGGATGACGAGCCCAGTTCTATTGCTTTTGACTGAAGAAGTCGCCTTGAAGGAGCCTTCAG

//

NRC-19

TTATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAGCCTGGAGAGTGTTTTTTGGGATTGCTTTTTC

ACGGGGTCCACCATGGTAGGGTCACGGTTGTAATTCGATTTTTACATGGCAAATATTTTAAGATAACACACCATATGAGTAGTCGAT

ATATTTGACCAATTAGAATCACTTTAATTTCAATAATAATCACAATAACAATCTCTAGGCCATTTAATCTTTCCATTAATCGGATTT

GTTTTTTTAAATATAGAATAACTGGATCTCTATGTTAAAATAATAAAACATACATTCTGATTTTACCAGTCAAGATTGTACGCTACT

TAAAAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACTGTTAACTAATAGTCCAAATAATTGTGTAATGGAAATGTATTA

ATTGTCATTTAATATCATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTACACAGTTGGAAAGTGGATCCATGGGTAAGG

ACTTCTACCATCATTACTGTGTATTTTTAATAGTATTATCATCAGTACTGTTATTGATATTTTCTCTTGTCTCGCTGACTCTCTCCA

TCAGACTCATCCATGGGCATCACGGTTACGACGAGCAGCAGGAGCTCGACAAGCGCGCAGTCGATGAAA

//

NRC-20

TTATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTTTTGGGAATTCTTTTTC

ACGGGGTCCACCATGGTAGAGTCACGGAATTAATTCGATTTTTACATGGCAAATATTTTAAGATAACACACCATATGAGTAGTCGAT

GTTTTTTTAAATATAGAATAACTGGATCTCTATGTTAAAATAATAAAACATACATTCTGATTTTACCAGTCAAGATTGAACACTACT

TAAAAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACTGTTAACAATAGTCCAAATAATTGTGTTATGGAAATGTATTAA

TTGTCATTTAATATCATTTGCTTGAATTTATCACCATGAGTTTTTTGTTTGTTTTTACACAGGTAGAAAGAAGGCCTTGCAGTAAGG

ACTTCTACCATCATTACTTTGTAATTTTTATAGTATTATCATCAGTACTGTTATTGACAACTTCTCTTGTCTCGCTGACTCTCTCCA

TCAGGATGAACTCAGAGCGTCGCAGTTACGACGAGCGGCAGCAGCAGCAGCAGGAGCTCGACAAGCGCGCAGTCTATGAAA

//

NRC-101

GCCCACTTTGTATTCGCAAGGTAAGATCGATATTTTTCAAACTCATTTAGACGAGACCAAGCATTTGTTGAAATGTGATAAGCTTCT

AACTTTATAATGCAAATGTTAACAATCTTTTTGTTCTGTTGTTTTTGTAGGATGAAGTTGGCTGCCGCCTTCCTGGTGCTGTTCCTG

GTCGTCCTCATGGCTGAACCTGGAGAGGGTTTCTTGGGATTTCTTTTTCACGGTATCCACCATGGTAAAGTCACTCATTTAATACAT

TTTTACATGGCAAATATTTGAATATAACATACTATATGAGTTGTCAATATATGTGGCCAAGTAGAAGCACTTTGATTTCAATAATAA

AATAATTAAACCTAAATTCAGATTTTACCACTCAAGATTGAACACTACTTAAAAGTATGTAAAAAAAACATCATCTGTATGTATAAT

TAAATACTAGTCCAGTTAATTGTTTTATGGAAATGTGTTAATTGACATATATCATTTGCTTGAACTTATAATGTGCTTTGTTTGTTT

TTACACAGGTATCAGGGCGATCCATCAGTAAGGACTTCTACCATCATGACTGTGTATTTTTAATAGTATTATCATCAGTACTTTTAT

TAACAACTTCTCTTGTCTCGCTGACTCTCTCCATCAGTCTCATCCATGGTCAAAGATACGACGAGCAGCAGGAGCTTGACAAGCGCT

CAGTCGATGACAACCCCGGTGCTATTGTTTTTGACTGAAGACGTCGCCTTGAAGGAGCCTTCAG

//

NRC-102

ATGAAGTTCACTGCCACCTTCCTGGTGTTGTCCATGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTCTTTGGAGCCCTTATCAAA

GGGGCCATCCATGGTGGCAAGTTGCTCCATAAACTCATCAAAAAAAAACATGAACATCACGGTTATGGCAAGCATTGGGGGCTTGAC

AAGCGCGCAGTCGATGA

//

NRC-103

TTGAAAGTGAGGAAGTGAGAGGAGGACTAGGTCCTGTGTTTTCAGTCGTTGAATTATCTAACACTATCTGAGCCCCTCCTGCAATAA

CTCTAAATGTTACACAGTGACTAGGAAGTCAGTCCTGTGTATATAAAGAGTTGCATCTGTTGTTATCAGTAGACAACAGATTACACC

TTTGAATCTCACAAAGCTCATTTTGTATTCGACAGGTAAGATCGATATGTTTCAAACTCATTTAGATGAGACCAAGCATTTGGGAAA

TGTGCTCAGCTTCTAACTGTATGATGCAAATGTTAACAATCTTTTTGTTCTGTTGTTTTGTAGGATGAAGTTGGCTGCCGCCTTCCT

GGTGCTGTTCCTGGTCGTCCTCATGGCTGAACCTGGAGAGAGTTTTTTGGGATTTCTTTTTCATGGTATCCGCCATGGTAGGGTCAC

TGAATTGATACATTTTTACATGGCAAATATTTGAATGTAACATACTATATGAGTTGTCAATATATGTGGCCAAGTAGAAGCACTTTG

ATTTCAGTAATAATCAAAATAACAATCACTAGGCCATTTAATAATTGCATTAATTACACTTGTTTTTATATAGAATATAGAATAACT

GGATCTTTATGCTAAAATTAATAAACATGAATTCAGATTTTAAGATTTTTCAAGATTGAAAACTACTTAAAAGTATGTAAAAAAACA

TCATCTGTATGTATAATTAAATACTTGTCCAGATAATTGTGTTGTGGAAATGTGTTAATTGACATATATCATTTGCTTGAATTTATC

ATTATCTGCTTTGTTTGTTTTTACACAGGTATCAAGGCGATCCATGGGTAAGGACTTCTACCTTCATGACTGTGTATTTTTAATAGT

ATTATATTCAGTACTGTTATTGAAAACTTCTCTTGTCTCGCTGACTCTCTCCATCAGAATGATCCATGGTAACAGTTTAGACGAGAT

GCAGGAGCTCGACAAGCGCTCATTCGATGACAACCCCAACGCAATTGTTTTTGACTGAAGAAGTCGCCCTGAAGGAGCCTTCAGATG

ATATATAATGCTTCTTGCTTTTCAATGAAATAAATTGAATAATTACCCGCAACAGC

//

NRC-104

TACTTTTATCTACCACTATGTGAGCTCCTCCTGTTATAACTCTAAATGTTACACAATGAAGATGAGGTCAATTCTGTGTATATAAAG

AGTTGCCTCTGTATAGTAGACAACATATTTCACCTTTGAATCCCACAAAGCTCACTTTCTACTCAACAGGTAAGATCGATATTTAAA

AACTAATTTAGACGAAACCAAGCATTTTGGGGAATTTGCTCAACTTCTAAATGTATGATACAAATGTTAACAATCTTTTATTTCTGT

TGTTGTTTTTTGTAGGATGAAGTTCACTGCCACCCTCCTCCTGTTGTTCATCTTCGTCCTCATGGTTGATCTCGGAGAGGGTCGTCG

TAAGAAAAAGGGGTCGAAGAGAAAGGGGTCCAAGGGAAAGGGGTCCAAGGGAAAGGGCAGGTGGTTGGACAGGATTGGTAAAGGTAG

AGTCACGGAATTAATTTGCTTTTTACATTGCAAATATTTTTCATATAACATTGCTGGAAAATCACAAAAATAAGTAGTCAATATATT

TGGCCAAATAGAATCACTTTGATTTCAATAATAATCAAAATAACAACCTAAAAGGCCTTTGATTAGCATGTTCCTTCAATGAAATGG

ACATTGTAATTTACTTTGATTCTCACATGCTACGACCTGCTGCAGCAACATTTGAAAATAAATTTGTCCCAGAAGATTTTAAAGTAC

ATTGTTATAGGCGATTTATCTTTCTATTACTCAGATATTTGTTCAAACCAATAGAATAACTGGATCTCTATGCTAAAATAATAAAAC

ACACATTCAGATGTTACCAGTCAAGATTGAACGCTGTTTAAAAGTAAGTATGAAACATCCTCTGTATGTATAATTGTTTAACTGGTA

ACTTATAGTCCTAATAATTGCGTTATGGAAATGTATTAATTGTCATTTAATATAATTTGCTGGAATTTATCACTGTGTGTTTTTGTT

TGTTTTTACACAGCTGGCGGGATAATTATCGGGGGGGCCCTTGAGTAAGGACTTCTACCATCATTACTGTGTAATATTTATAGTTAT

GATCACTACAGTTATTAACAACTTCTCTTGTCTCGCTGAACTTCTCCATCAGTCACCTCGGGCAGGGGCAGGTGCAGGGGCCGGATT

ACGACTACCAGGAGGGGGAGGAGCTCAACAAGCGCTCAGACGATGATGACAGCCCCAGTCTTATTTTTTTTGACTGAAGAAGTCGCC

CTGAAGGAGCCTTCAGATGATATATAATGCTTCTGGCTTTTCATTGAAATAAATAATACGTTTACCTGCAACAGCAACCATG

//

NRC-105

TTATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTGGGAAATTGGATGGGGC

CCCATATCAGCGGTAGAGTCACGGAATTAATTTGCTTTTTCCATTGCAAATATTTTAATATTGCATAGCTGGAAAATCACGAAATAA

GTAGTCGATATATTTGGCCAAATAGAATCACTTTGATTTCAATAATAATCAAAATAACAATCAAAAAGGCCTTTGATTAGCATGTTC

CTTCAATAAAATGGACATTGAAGTTTATTTTGATGCTCACATGCACCGACCTGCTGCGGCAACAATTGAAATCAAATTTGTCTCAGA

ATTTAAAGTACATTTTTCTAGGTGATTTAATCTTTCCATTAACTTGATTTGTTTTTATAAATATAGAATAACTGGATCTTTATGCCA

AAATAATAAAACACACATTCTGATTTTACCAGTCAAGATTGAACACTACTTAAAAGTAATATAAAACATCATCTGTATGTATAATTG

TTTAACTGTTAACAAAAGTCCAAATAATTGTGTTATGGAAATGTATTAATTGTCATTTAATATCATTTGCTTGAATTCATCACCATG

TGTTTTTTGTTTGTTTTTACACAGGTGAAAAGAAGGCCTTGCAGTAAGGACTTCTACCATCATTACTTTGTAATTTTTATAGTATTA

TCATCAGTACTGTTATTGACAACTTCTCTTGTCTCGCTGACTCTCTCCATCAGGATGAACTCAGAGCGTCGCAGTTACGACGAGCGG

CAGCAGCAGCAGCAGGAGCTCGACAAGCGCGCAGTCGATGA

//

NRC-106

ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTGGGAAATTGGATCGTGCGC

CCTATCGGAGGTGAAAAGAAGGCCTTGCAGATGAACTCAGAGCGTCGCAGTTACGACGAGCGGCAGCAGCAGCAGCAGGAGCTCGAC

AAGCGCGCAGTCGATGAAA

//

NRC-107

ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATAGCTGAACCTGGAGAGAGTCTTTTTGGAAAGTTCCTCAAG

AAAGTTGTCCATGCTGGCACGTCAATTGGCGAGACAGCCTTGCATGTCGCCGCAGAGCATCACGGGCTTCATGCGCATCACGGGTGT

CACGGGCGTCACGGGGGTCACAGGCGTCACGGGGGTCACAGGCGTCACGGGCGTCGCGGTTACGACGAGCAGCAGCAGGAGGAGCTC

GACAAGCGCGCATTCGATGA

//

NRC-108

TATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTGGGAAATTGGATGGGGCC

CCATATCAGCGGTAGAAAGAAGGCCTTGCACATGAACTCAGAGCGTCGCAGTTACGACGAGCGGCAGCAGCAGCAGCAGGAGCTCGA

CAAGCGCGCAGTCGATGAAA

//

NRC-109

ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGAGTGTTTTTTGGGATTGCTTTTTCAC

GGGGTCCACCATGGTAGGGTCACGGAAGTAATTCGATTTTTACATGGCAAATATTTTAAGATAACACACCATATGAGTAGTCGATAT

ATTTGGCCAATTAGAATCACTTTGATTTCAATAATAATCAAAATAACAATCTCTAGGCGATTTAATATTTGCATTAATTGGATTTGT

TTTTAAAAATATAGAATAACTGGATCTTTATGGTAAAATAATTAAACATACATTCTGATTTTACCAGTCAAGATTGAACACTACTTA

GAAGTATGTATAAAAGATCATCTGTATGTATAATTGTTTAACTGTTAACGAATAGTCCAAATAATTGTGTTATGGAAATGTATTAAT

TGTCATTTAATATCATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTACACAGTTGGAAAGTTGATCCATGGGTAAGGAC

TTCTACCATCATTACTGTGTATTTTTAATAGTATTATCATCAGTACTATTATTGACAACTTCTCTTGTCTCGCTGACTCTCTCCATC

AGACTCATCCATGGCGGTTACGACGAGCAGCAGGAGCTCGACAAGCGCGCAGTCGATGAA

//

NRC-110

GCCCACTTTGTATTCGCAAGGTAAGAGCGATATATTTCAAATTCATTCGGATGAGACCAAGCATTTGGGAAATGTGCTCAGCTTGTT

ACTGTTTAATGCAAATGTTAACAATATCCTTTTTCTGTTGTTTTTGTAGAATGAAGTTCGCTGCCGCCTTCCTCATGATGTTCATGG

TCGTCCTCATGGCTGAACCCGGAGAGGCTCGTTGGGGAACGTTCTTCAAACATATTTTCAAAGGTAGAGTCACAGAATTAATTTGCT

TTTTACATTGCAAATATTTTCATATAACATAGCTGGAAAATCACAAAAATAAGGGCTTGATATATTTGGCAAAGTAGAATCCCTTTG

ATTTCAATAATAATCAAAATAAAAATCAGAAAGGCCTTTGATTAGCATGTTCCTTCAATAAAATGGACATTGTAGTTTATTTTGATT

CTCAAATGCACCAACCTGCTGCGGCAACAATTGAAATCAAATTTGTCTCCGAAACATTTAAAGTACATTTTTCGAGGCAATTTAATC

TTTCCTTTGATCGAATTCGTTTTTAAAAATATAGAATAACTGGATCTTTATGCTAAAATAATAAATCATACATTCTGATTTTACCAG

TCAAGATTGAACGCTACTTAAAAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACTTTTAACTAATAGTCCTAATAATTG

TGTTATGGAAATGTATTCATTGTCATTTAATATCATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTACACAGCTGGAAG

GTTCATCCATGGGTAAGGACTTCTACCATCATTACTGTGTATTTTTAATAGTATTATCATCAGTACTGTTATTGATAACTTCTCTTG

TCTCGCTCACTCTCTCCATCAGTGCGATCCAGGCACACAATGACGGCGAGCAGCAGGATCTCGACAAGCGCTCAGTGGATGATGAGC

CCAGTGTTATTGTTTTTGAATGAAGAAGTCGCCTTGAAGGAGCCTTCAG

//

NRC-111

GCCCACTTTGTATTCGCAAGGTAAGAGCAATATATTTCAAATTCATTTAGACGAGACCAAGCATTTGGGATCTGTGCTCAACTTGTA

ACTGTATAATGCAAATGTTAACAATATTCTTTTTCTGTTGTTTTTGTAGAATGAAGTTCGCTGCCGCCTTCCTCATGATGTTCATGG

TCGTCCTCATGGCTGAACCCGGAGAGGGTGCTTGGATACCTGCCTTGAATAGGATCTATCATGGTAGAGTCACAGAGTTAATTTGCT

TTTTACATTGCAAATATTTTAATATAACATGGCTGGAAAATCACAAAAATGAGTACTCGATATATTTGGCAAAGTAGAATCCCTTTG

ATTTCAATAATAATCAAAAACACAATCAAAAAGGCCATTGATTAGCATGTTCCTTCAATGAAATGGACATTGTAGTTTATTTTGATT

CTGACATGCACCAACTTGCTGCGGCAACAATTGAATTCAAATTTGTCTCAGAAAAATTTAAAGTACATTTTTCTTTCCATTAGTCAA

ATTTGTTTTAAAAAATACAGAATAACTGGATCTTTATGCTAAAATAATAAATCATACATTCTGATTTTACCAGTCAAGATTGAACGC

TACTTAAAAGTATGTATAAAACATCATCTGTATTGATAATTGTTTAACTTTTAACTAATAGTCCTAATAATTGTGTTATGGAAATGT

ATTCATTGTCATTTAATATCATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTACACAGCTCTACTGAGGATCAATCGGT

AAGGTCTTCTACCATCATTACTGTGTAATTTTAATAGTATTATCATCAGTACTGTTATTGATAACTTCTCTTGTCTTGCTGGCTCTC

TCCATCAGCCAAATGGTGTATTATCGTCGGCACTGGCACGGTGACGTCGAGCAGCAGGCTCTCGACAAGCGCTCAGTGGAGGACCAG

CCCAGTTCTATTGCTTCTGCCTGAAGAAGTCGCCTTGAAGGAGCCTTCAG

//

NRC-112

ACTGTATAATGCAAATGTTAACAATATTCTTCTTCTGTTGTTTTTGTAGAATGAAGTTCGCTGCCGCCTTCCTCATGATGTTCATGG

TCGTCCTCATGGCTGAACCCGGAGAGGGTGCTTGGATGCCTGCCTTGAATAGGATCTATCATGGTAGAGTCACAGAGTTAATTTGCT

CTGACATGCACCAACTTGCTGCGGCAACAATTGAATTCAAATTTGTCTCAGAAAAATTTAAAGTACATTTTTCTTTCCATTAATCGG

AAGGACTTCTACCATCATTACTGTGTAATTTTAATAGTATTATCATCAGTACTGTTATTGATAACTTCTCTTGTCTTGCTGACTCTC

TCCATCAGCCAAATGGTGTATTATCGTAGGCACTGGCACGGTGACGTCGAGCAGCAGGCTCTCGACAAGCGCTCAGTGGAGGACCAG

CCCAGTTCTATTGCTTCTGCCTGAAGAAGTCGCCTTGAAGGAGCCTTCAG

//

NRC-113

AAAGGTGCCAAGCACCTTGGCCAGGCGGCCATTAACGGTTTGGCCTCTTGCGAAGAGCAGCAAGAGCTCGACAAGCGCTCAGAGGAT

GACGAGCCCAGTGCTATTGTTTTTGAA

//

NRC-114

AAAGGTAGAGTCATGGATTTAATTTGCTTTTTACATTGCAAATACTTTAATATAACATAGTTGGAAAATCACAAAAATAAGTAGTCG

ATATATTTGGCCATATAGAATCACTTTGATTTCAATAATAATCAAAACAACAATCAAAAAGCCCATTGATTAGCATGTTCCTTCACT

AAAATGGACATTGTCATTTATTTTGATTCTCACAGGCACCAACCTGCTGCGGCAACAATTGAAATCAAATTTGTCTCAGAAGAATTC

AAAGTACATTGTTCTAGGCGATTTAATCTTTCCATTCATCGGATTTGTTTTTAAAAATATAGAATAACTGGATCTCTATGTTAAAAT

ACAGTATTATCATCAGTACTGTTATTGACAACTACTCTTGTCTCTGTGACTCTCTCCAGGGGTTTGGCCTCTTGCGAAGAGCAGCAG

GAGCTCGACAAGCGCTCAATGGATGACGAGCCCAGTGCTATTGTTTTTGACTGAAGAAGTCGCCTTGAAGAGCCTTCAG

//

NRC-115

GCCCACTTTGTATTCGCAAGGTAAGAGCGATATATTTCAAACTCATATAGACGAGACCAAGCATTTGGGAAATGTGCTCAGCTTGTT

ACTGTATAATGCAAATGTTAACAATGTTTTTGTTCTGTTGTTTTTGCAGAATGAAGCTCGCTGCTGCCTTCCTGGTGTTGTTCATGG

TCGTCCTCATGGCTGAACATGGAGAGGGTTTTGGGGATTTCTATATGAAGCCTGGTAGAGTCACGGAATTAATTCGATTTTAACATG

GCAAATATTTTACTATAACATACCATATGAGTAGTCGATTAATTAATTGGATTTGTTTTTAAAAATATAGAATAATTGGATCTTTAT

GCTAAAATAATTAAACATACATTCTGATTTTACCAGTTAAGATTGAACGCTACTTAAAAGTATGTATAAAACATCATCTGTACATAT

AATTGTTTAACTGTTAACCAATAGTCCAAATAATTGTGTTGTGGAAATGTATTAATTGTCATTTAATATCATTTGCTTGAATTTGTC

ACCATGTGTTGTTGTTTGTTTTTACACAGGTAGAAAGATTTCCCATGGGTAAGGACTTCTACCATCATTACTGTGTATTTTTAGCAG

TATTATCATCAGTACTGTTATTGATAACTTCTCTTGTCTCGCTGACTCTCTACAGGTACATCAGAAGTCCTTATGGTTACGACGAGC

AGCAGGAGGTCGACAAGCGCTCAGTCGATGACAACCCCAGTGCCATTGCTTCTGACTGAAGAAGTCGCCTTGAAGGAGCCTTCAGA

//

NRC-116

ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGCGAGGGTTATTGGCGCTTCCGCAACCAC

CGTGGTGAAAGGTTATCCCAGAGGCATTTCGCTGACGTCGAGCAGCAGGCGCTCGACAAGCGCTCAGTGGATGACGAGCCCAGTTCT

ATTGCTTTTGA

//

NRC-117

ATGAAGTTCACTGCCACCTTCCTCGTGTTGTTCATCGTCATGTTTGAACCTGGAGAGTGTTTTTGGAATGCTTTTTCACCGGGTCCA

CCATGGTCGGGTCACGGAAGTAGTTCGATTTTTACATGGCAAATATTTAAATGAAACATACCATATGAGTAGTCGATATATTTGGCC

AAGTAGAATCACTTTGACTTCAATAATAATCAAAAACATAATCAAAAAGCCCATTGATTAGCATGTTCCTTCAATGAAATGGACATT

GAGGTTTATTTTGATTCTCACAGGCACCAACCTGCTGCGGCAACAATTGCATTCAAATTTGTCCCAAAGAAACTTAATTAACATTTT

CTGGCGATTTAATCTTTGCATAAATTGGATTTGTTTTTAAAAATATAGAATAACTGGATCTTTATGCTCAAATAATTAATCATACAT

TCTTATTTTATCAGTCAACATTGAACGCTACTTAAAAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACTTTTAACTAAA

AGTCCTAATAATTGTGTTATGGAAATGTATTAATTGTCATTTAATATCATTTCCTTGAATTTATCACCATGTGTTTTTGTTTGGTTT

TTACACAGCTGGAAGGTTGATCCATAGGTAAGGACTTCTACCATCATTACTGTATAATGTTAATAATAGCATTATCATCAGTACTGT

TATTGATAACTTCTCTTGTCTCGCTGACTCTCTCCATCAGATTCATCAAACGTCACGGTGACGTCGAGCAGCAGGAGCTCGACAAGC

GCTCAGTGGATGACGAGCCCAGTTCTATTGCTTTTGCCTGAAGAAGTCGCCTTG

//

NRC-118

ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGACTGTATTTTTGGATTGATTGCGACT

GCGGTCCACAATGGTAAGTCAAGGAATTAATTCGATTTTTACGTGGCAAATATTTTAGTATAACATACCTTATGAGTAGTCGATATA

TTTGACCAAGTAGAATCATTTTGACTTCAATAATAATCAAAATAACAATCTCTAGGCAATTTAATATTTGCATTAATTGGATTTGTT

TTTAAAAATATAGAATAACTGGATCTTAATGCTAAAATAATTAAACATACATTCTGATATTACCAGTCAAGATTGAACGCTACTTAA

AAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACTGTCGACTAATAGTCCTAATAATTGTGTTATGGAAATGTATTCATT

GTCATATAATATCATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTACACAGCTGGAAGGTTGATCCATAGGTAAGGACT

TCTACCATCATTACTGTATAATTTTAAGAGCATTATCATCAGTACTGTTATTGATAACTTCTCTTGTCTCGCTGACTCTCTCCATCA

GACTACTCGGCTTTCATCATGGGCCTCCCGGGTTCTGGCACGGTGACGTCGAGCAGCAGGAGCTCGACAAGCGCTCAGTGGATGAGG

AGCCCAGTTCTATTGCTTTTGACTGAAGAAGTCGCCTTGAAGGAGCCTTCAG

//

NRC-119

ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGACTGTATTTTTGGATTGATTGCGAGT

GCGGTCCACAATGGTAAGTCAAGGAATTAATTCGATTTTTACTTGGCAAATATTTTAGTATAACATACCTTATGAGTAGTCGATATA

TTTGACCAAGCAGAATCATTTTGATTTCAATAATAATCAAAATAACAATCTCTAGGCAATTTAATATTTGCATTAATTGGATTTGTT

GTCATATAATATCATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTACACAGTTGGAAGGTTGGTCCATGGGTAAGGACT

GACTACTCGGCTTTCATCATGGGCCTCCCGGGTTCTGGCACGGTGACGTCGTGCAGCAGGAGCTCGACAAGCGCTCAGTGGATGAGG

AGCCCAGTGCTATTGTTTTTGAATGAAGAAGTCGCCTTGAAGGAGCCTTCAG

//

NRC-120

TTTGACCAAGTAGAATCATTTTGGTTTCAATAATAATCAAAATAACAATCTCTAGGCAATTTAATATTTGCATTAATTGGATTTGTT

GACTACTCGGCTTTCATCATGGGCCTCCCAGGTTCTGGCACGGTGACGTCGAGCAGCAGGAGCTCGACAAGCGCTCAGTGGATGAGG

AGCCCAGTGCTATTGTTTTTGAATGAAGAAGTCGCCTTGAAGGAGCCTTCAG

//

NRC-121

ATGAAGTTCACTGCCACCTTCCTCGTGTTGTTCATGGTCATCGTCATGTTTGAACCTGGAGAGTGTTTTTTTGGAATGCGTTTTCAC

GGGGTCCACCATGGTAGGGTCACAAAAGTGATTTGATTATTACATGCCAAATATGTTAATGAAACATACCATATGAGCAGTCGTATT

ATTTGGACAAGTAGAATCACTTTGATTTCAATAGTAATTAAAATAACAATCAAAAAGGCCTTTGATTAGCATGTTCCTTCAATGAAA

TGGACATTGAGGTTTATTTTGATTCTCACCTGCATCGACCTGCTGCGGCAACTATTGAAATCAAATTTGTCCCAGAAGAAACTAAAT

TAACATTTTCTAGGCCATCTAATCTTTGCATGAATTGGATTTGCTTTCAAAAATATAGAATAACTGGATATTTATGCTAAAATAATA

AAAACACACATTCTGATTTTACCAGTCAAGATTGAACACTACTTAAAAGTACGTATAAAACATCATCTGTATGTATAATTGTTTGAC

TTTTAACAAATAGTCAAAATGATTGTTATGGAAATGCATTAATTGTCATTTAATATCATTTACTTGAATTTATCACCATGTGTTTGT

TTGTTTTTTAGCAGGTGGAGGTTTTCTCAATGCGCAAGGACTTCTACCATCATTACTGTGTAATTTTAATAGTATTATCATCAGTAC

TCTTATTGACAACGTCTCTTGTCTCGCTGACTCTCTCTATCAGATTAAACCCAGGGTATCGCGGTTACGACGAGCAGCAGGAGCTCG

ACAAGCGCGCAGTCGATGA

//

NRC-122

ATGAAGTTCACTGCCACCTTCCTGGTGTTGTCCTTGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTCTTTGGAGCCCTTCTCAAA

GGTAGAGTCACGGAATTAATTTGATTGTTACATGGCAAATAATTTTGTATAACATATCATATGAGCAGTCGATGTATTTGACCAAGA

AGAATCATTTTGATTTCAATAATAATCAAAATAACAATCTCTTGGAGATTATATATTTGCAATAATTGGATTTTATAAAATATAGAA

CAACTGGATCTTAATGCTAAAATAATTAAACATACATTCTGATTTTACCAGTCAAAATTAACCTCTACTTTAAAGTATGTATAAAAC

ATCATCTGTATGTTTAATTGTTTAACTTTTAACAAATAGTCCAAATAATTGTGTAATGGAAATGTATTCATTGTCATATAATATAGT

TTGCTTGACTTTATCACCGTGTGTTTTTGTTTGTTTTTTCACAGGTGCCCAGGCGCTCCATGGGTAAGGACTTCTACCATCATGACT

GTGTAAGTTTAATAATATTATCATCAGTACTGTTATTAACGACTTCTCTTGTCTCGCTGACTCTCTCCATCAGAATCATCCACAATG

CTCGTCACGGTTACGACGAGCAGCAGGAACTCAACAAGCGCGCAGTCGATGA

//

NRC-123

GCCCACTTTGTATTCGCAAGGTAAGATCAATATTTTTCAAATTCATTTAGACGAGACCAACCGTTTGCGAAATGTGCTCAGCTTGTT

TCGTCCTCATGGTTGAACCTGGAGAGTGTGGTTGGAAAGATTGGTTTCGTAAGGCTAAGAAAGGTAGAATCACGGAATTAATTAGCT

TTTTACATTGCAAATAGATTTTTTATAACAGCTGGAAATCACAAAAATAAATAGTCGATATATTTGGCCAATTAGAATCACTTTAAT

TTCAATAATAATCTAAATAACAACCTAAAAGGCCTTTGATTAGCATGTTCCTTCAATGAAAAGGACATTGAGGTTTATTTTGATTCT

CACATGCACCGACCTGTGCGGCAACAATTGAATTCAGATTTGTCCCAGAAGAATTCAAAGTACATTTTTCCAGGCGATTAAATCTTT

CCATTACTCGGATTTAAAAATAAATAAATAGAATAACTGAAGCGCTATGATAAAATAATTACACATTCATTCTGATTTTACAAGTCA

AGATTGAACACTATTAAAAAGTGTGTATAAAACATCATCTGTATGTATAATTGTTTAACTGTTAATAGTCTTAATAATTGTGTTATG

GAAATGTATTAATTTACATTTAATATCATTTGCTTGAGTTTACCATCATGTGTTTTTGTTTGTTTTTACACAGTTGGCAAGACTGTT

GGCGGCTTGGCCCTTAAGTAAGAACTTCTACCATCATTACTGTATAATTTTGATAGTATTATCACCAGTACTGTTATTAACTACTTC

TCTTGTCTCGCTGACTCTCTCCATCCGACTCATCCGCAGTCATTACCTTGGCGAGCAGCAGGAGCTTGCCAAGCGCGCAGTCGATGA

CGACCCCAGTGTTATTGTCTTTGACTGAAGAAGTCGCCTTGAAGGAGCCTTCAG

//

NRC-124

ATGAAGTTCACTGCCACCTTCCTCATGATTTTAATCTTCGTCCTCATGGTCGAACCTGGAGAGTGTGGTATTAGGAAATGGTTTAAA

AAGGCTGCTCACGGTAAAGTCACGGAATTAATTTGCTTTTTGCTTTACAAATATTTTTTTATAGCAGCTGGAAAATCACAAAAATAA

ATAGTCGATGTATTTGGCCAATTAGAATCACTTTGATTTCAAATAATAATCTAAATAGCAACCTAAAAGGCCTTTGATTAGCATGTT

CCTTCAATGAAATGGATGTTGAGGTTTATTTTGATTCTCACATGCACCGACCTGCTGCGGCAACAATTGAATTCAAATTTGTCCCAA

AGGAATTCAAAGTAAACTTTTCTAGATGATTTAATCTTTCCATAACTCGGCTTTGTTTTTAAAAATATATAATAACTCAATCACTAT

GATAAAATAATAACACATACATTCTGATTTATACAAGACAAGATTGAAAACTTCTTAAAAGTATGTATAAAACATCATCTGTTTGTA

TAATTGTTTATCATTTCACAAAAAGTCCAACTAATTGTGTTATGGAATTGTATAAATTGTCATTTAATATAATTTTTTTGAGTTTAT

CAATATGTGTTTTTGTTTGTTTTACACAGTTGGCAAGGAAGTTGGCAAGGTGGCCCTTAAGTAAGGACTTCTACCATTATTACTGTA

TAATTTTGATAGTATTATCACCCGTACTGTTATTGACAACTTCTCTTTTCCTGCTGACTCTCTCCATCTGACTCATCTGCAGTGCTT

GCCTTGACAAGCAGCAGCAGCTCGACAAGCGCGCAGTCGATGA

//

NRC-125

GCCCACTTTGTATTCGCAAGGTAATATCGATATTTTTCAAACTCATTTAGACGAGACCAAGCATTTGGGAAATGTGCTAAGGTTGTT

ACTGTATAATGCAAAATTAATGATCTTTATTTTTCTGTTTTTTTTTGCAGAATGAAGTTCACTGCCACCTTCCTCATGATTTTAATC

TTCGTCCTCATGGTCGAACCTGGAGAGTGTGGTTTGAAGAAATGGTTTAAAAAGGCTGTTCACGGTAGAGTCACGGAATTAATTTGC

TTTTTGCTTTACAAATATTTTTTTATAGCAGCTGGAAAATCACAAAAATAAATAGTCGATGTATTTGGCCAATTAGAATCACTTTGA

TTTCAATAATAATCTAAATAGCAACCTAAAAGGCCTTTGATTAGCATGTTCCTTCAATGAAATGGATGTTGAGGTTTATTTTGATTC

TCACATGCACCGACCTGCTGCGGCAACAATTGAATTCCAATTTGTCCCAAAGGAATTCAAAGTAAACTTTTCTAGGCGATTTAATCT

TTCCATAACTCGGCTTTGTTTTTAAAAATATATAATAACTCAATCCCTATGATAAAATAATAACACATACATTCTGATTTATACAAG

ACAAGATTGAAAACTTCTTGAAAGTATGTATCAAACATCATCTGTTTGTATAATTGTTTAACAGTTCACAAAAAGTCCAACTAATTG

TGTTATGGAATTGTATAAATTGTCATTTAATATAATTTTTTTGAGTTTATCAATATGTGTTTTTGTTTGTTTTACACAGTTGGCAAG

AAAGTTGGCAAGGTGGCCCTTAAGTAAGGACTTCTACCATTATTACTGTGTAATTTTGATAGTATTATCACCAGTACTGTTATTGAC

AACTTCTCTTTTCCTGCTGACTCTCTCCATCCGACTCATCTGCAGTGCTTACCTTGGCGAGCAGCAGCAGCTCGACAAGCGTGCAGT

CGATGAAGAGCCCAGTGTTATTGCTTTTGACTGAAGAAGTCGCCTTGAAGGAGCCTTCAG

//

NRC-126

ATGAAGTTCACTGCCACCTTCCTCATGATGTTCATCTTCGTCCTCATGGTTGAACCTGGAGAGTGTGGTTGGAGGAAATGGATTAAA

AAGGCTACTCACGGTAAAGTCACGGAATTAATTCGTTTTTTGCTTTGCAAATATTTTTTTTATAACAGCTGGAAAGTCACAAAAATA

AATAGTCAATATATTTGGCCAATTAGAATCACTTTGAGTTCAATAATAATCTAAATAACAACCAAAAAGGCCTTTCCTTTAATGAAA

TGTACGTTGAAGTTTATTTTGAATCTCACATGCACCGACCTGCTGCGGCAACAATTGAATTCAAATTTCTCCCAGAGGAATTCAAAG

TAAATTTTTCTAGGCGATTTAATCTTTCCATTACTCTGATTTGTTTTAAATATATAGAATGACTCAATTGCTATGATAAAATAATAA

GCCATACATTCTGATTTTTACAAGACAAGATTGAAAACTTCTTAAAAGTACGTATAAAACATCATCTGTATTTATAATTGTTTAACA

TTTAACAAATTGTCCTACTAATTGTGTTATGGAAATGTATAAATTGTCATTTAATATCATTTGCTTGAGTTTATCATTATTTGTTTT

TGTTTGTTTTTACACAGTTGGCAAGCATATTGGCAAGGCGGCCCTTGAGTAAGAACTTCTACCATCATTACTGTATAATTTTGATAG

TATTATCACCAGTACTGTTATTGACAACTTCTCTTGTCCTGATGACTCTGTTCATCCAACTCATCTGCAGTGCTTACATTGGCGGGA

AGCAAGAACTCGACAAGCGCGCAGTCGATGA

//

NRC-127

ATGAAGTTCACTGCCACCTTCCTCATGATTTTAATCTTCGTCCTCATGGTCGAACCTGGAGAGTGTGGTTGTAAGAAATG

GTTTAAAAAGGCTGCTCACGGTAGAGTCACGGAATTAATTTGCTTTTTGCTTTACAAATATTTTTTTATAGCAGCTGGAA

AATCACAAAAATAAATAGTCGATGTATTTGGCCAATTAGAATCACTTTCATTTCAATAATAATCTAAATAGCAACCTAAA

AGGCCTTTGATTAGCATGTTCCTTCAATGAAATGGATGTTGAGGTTTATTTTGATTCTCACATGCACCGACCTGCTGCGG

CAACAATTGAATTCCAATTTGTCCCAAAGGAATTCAAAGTAAACTTTTCTAGGCGATTTAATCTTTCCATAACTCGGCTT

TGTTTTTAAAAATATATAATAACTCAATCCCTATGATAAAATAATAACACATACATTCTGATTTATACAAGACAAGATTG

AAAACTTCTTGAAAGTATGTATCAAACATCATCTGTTTGTATAATTGTTTAACATTTCACAAAAAGTCCAACTAATTGTG

TTATGGAATTGTATAAATTGTCATTTAATATAATTTTTTTGAGTTTATCAATATGTGTTTTTGTTTGTTTTACACAGTTG

GCAAGAACGTTGGCAAGGTGGCCCTTAAGTAAGGACTTCTACCATTATTACTGTATAATTTTGATAGTATTATCACCAGT

ACTGTTATTGACAACTTCTCTTTTCCTGCTGACTCTCTCCATCCGACTCATCTGCAGTGCTTACCTTGGTGAGCAGCAGC

AGCTCGACAAGCGTGCAGTCGATGAAGAGCCCAGTGTTATTGCTTTTGACTGAAGAAGTCGCCTTGAAGGAGCCTTCAG

//

NRC-128

GCCCACTTTGTATTCGCAAGGTAATATCGATATTTTTCAAACTCATTTAGACGAGACCAAGCATTTGGGAAACGTGCTAA

GGTTGTTACTGTATAATGCAAAATTAATGATCTTTATTTTTCTGTTTTTTTTTGCAGAATGAAGTTCACTGCCACCTTCC

TCATGATTTTAATCTTCGTCCTCATGGTCGAACCTGGAGAGTGTGGTATTAGGAAATGGTTTAAAAAGGCTGCTCACGGT

AAAGTCACGGAATTAATTTGCTTTTTGCTTTACAAAATATTTTTTTATAGCAGCTGGAAAATCACAAAAATAAATAGTCG

ATGTATTTGGCCAATTAGAATCACTTTGATTTCAATAATAATCTAAATAGCAACCTAAAAGGCCTTTGATTAGCATGTTC

CTTCAATGAAATGGATGTTGAGGTTTATTTTGATTCTCACATGCACCGACCTGCTGCGGCAACAATTGAATTCAAATTTG

TCCCAAAGGAATTCAAAGTAAACTTTTCTAGGCGATTTAATCTTTCCATAACTCGGGCTTTGTTTTTAAAAATATATAAT

AACTCAATCCCTATGATAAAATAATAACACATACATTCTGATTTATACAAGACAAGATTGAAAACTTCTTGAAAGTATGT

ATCAAACATCATCTGTTTGTATAATTGTTTAACATTTCACAAAAAGTCCAACTAGTTGTGTTATGGAATTGTATAAATTG

TCATTTAATATAATTTTTTTGAGTTTATCAATATGTGTTTTTGTTTGTTTTACACAGTTGGCAAGAAAGTTGGCAAGGTG

GCCCTTAAGTAAGGACTTCTACCATTATTACTGTATAATTTTGATAGTATTATCACCAGTACTGTTATTGACAACTTCTC

TTTTCCTGCTGACTCTCTCCATCCGACTCATCTGCAGTGCTTACCTTGGCGAGCAGCAGCAGCTCGACAAGCGTGCAGTC

GATGAAGAGCCCAGTGTTATTGCTTTTGACTGAAGAAGTCGCCTTGAAGGAGCCTTCAG

//

NRC-129

AATGAAGTTCACTGCCACCTTCCTCATAGAATGGTTCATCTTCGTCCTCAATGGGTTGAAACCTGAAGAAGTGTGGTTGG

AAAGAAAGTGGTTTAAAAAGGCTACTCACGGTAAAGTCACGGAATTAATTAGCATTTTTCTTTGCAAATATTTTTTTTAT

ACAGCTCGAAAATTCACAAAAATAAATAGTCGATATATTTGGCCAATTAGAATCACTTTGATTTCAATAATAATCTAAAT

AACAACCTAAAAGGCCTTTGATTAGCATGTTCCTTCAATGAAATGGACGTTGAGGTTTATATTGATTCTCACATGCACCG

ACCTGCTGCGTCAACAATTGAATTCAAATTTGAGAGGAATTCAGCGTAAATTTTTCTAGGCGATTTAATCTTTCCATTAC

TCGGATTTGTTTTTAAATATATAGAATAACTCAATTGCTATGATAAAATAATAACACATACATTCAGATTTTTACAAGAC

AAGATTGAAAACTTCTTAAAGGTACGATATAAAACATCATCTGATTTATAATTGTTTAACATTTAACAAATAATCCTACT

AATTGTGTTATGGAAATGTATAAATTGTAATTTAATATAATTTGGTTTAGTTTATCATTATTTGTTTTTGTTTGTTTTTA

CACAGTTGGCAAGCATGTTGGCAAGGCGGCCCTTGAGTAAGAACTTCTACCATCATTACTGTATAATTTTGATAGTGTTA

TCACCAGTACTGTTATTGACAACTTCTCTTGTCCTGCTGACTCTCTCCATCCGACTCATCCGCAGTGCTTACCTCGGCGA

GAAGCAAGAACTCGACAAGCGCGCAGTCGATG

//

NRC-130

ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCCTCCTCATGGCTGAACCTGGAGAGGGTTTTTTCGGATTGCTTTTTCAC

GGGATCCACCATGGTAGGGTCACGGAATTAATTAGATGTTTACATGGCAAATATTTTAAGATAACACACCATATGAGTAGTCGATAT

ATTTGACCAATTAGAATCACTTTAATTTCAATAATAATCACAATAACAATCTCTAGGCCATTTAATCTTTCCATTAATCGGATTTGT

TTTTTTAAATATAGAATAACTGGATCTTTATGCTAAAATAATGAAACATACATTCTGATTTTACCAGTCAAGATTGAACGTTACTTA

AAAGTATGTTTAAAACATCATCTGTATGTATAATTGTTTAGCTGTAAACAAATAGTCCAAATAATTGTGTTATGGAAATGTATTAAT

TGTCATATAATATAATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTTAACACAGCTGGAAAGTTGATCCATGGGTAAGG

ACTTCTACCATCATTACTGTGTAIIIIIAATAGTATTATCATCAGTACTGTTATTAACAACTTCTCTTCTATCGCTGACTCTCTCCA

TCAGACTCATCCATCATGGTTACGACGAGCAGCAGGAGCTCGACAAGCGCGCAGTCGATGA

//

NRC-131

ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTGGGAAATTGGATGGGGCCC

CATATCAGCGGTAGAGTCACGGAATTAATTTGCTTTTTCCATTGCAAATATTTTAATATTGCATAGCTGGAAAATCACGAAATAAGT

AGTCGATATATTTGGCCAAATAGAATAACTTTGATTTCAATAATAATCAAAATTACAATCAAAAAGGCCTTTGATTAGCATGTTCCT

TCAATAAAATGGACATTGAAGTTTATTTTGATGCTCACATGCACCGACCTGCTGCGGCAACAATTGAAATCAAATTTGTCTCAGAAT

TTAAAGTACATTTTTCTAGGTGATTTAATCTTTCCATTCATCTGATTTATTTTATAAATATAGAATAACTGGATCTTTCTGCTAAAA

TAATAAAACACACATTCTGATTTTACCAGTCAAGATTGAACACTACTTAAAAGTATGTATAAAACATCATCTGTATGTATAATTGTT

TAACTGTTAACAATAGTCCAAATAATTGTGTTAAGGAAATGTATTAATTGTCATTTAATATCATTTGCTTGAATTTATCACCATGAG

TTTTTTGTTTGTTTTTACACAGGTAGAAAGAAGGCCTTGCAGTAAGGACTTCTACCATCATTACTTTGTAATTTTTATAGTATTATC

ATCAGTACTGTTATTGACAACTTCTCTTGTCTCGCTGACTCTCTCCATCAGGATGAACTCAGAGCGTCGCAGTTACGACGAGTAGCA

GCAGAAGCTCGACAAGCGCGCAGTCGATGA

//

NRC-132

ATTTGATATATTAGAATCACTTTGATTTCAATAATAATCAAAATAACAATCTCTAGGCGATTTAATATTTGCATTAATTGGATTTGT

GAAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACTGTTAACTAATAGTCCAAATAATTGTGTTATGGAAATGTATTAAT

TGTCATTTAATATCATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTACACAGTTGGAAATTTGATCCATGGGTAAGGAC

TTCTACCATCATTACTGTGTATTTTTAATAGTATTATCATCAGTACTGTTATTGACAACTTCTCTTGTCTCGCTGACTCTCTCCATC

AGACTCATCCATCACGGTTACGACGAGCAGCAGGAGCTCGACAAGCGCGCAGTCGATGA

//

NRC-133

GCCCACTTTGTATTCGCAAGGTAATATCGATATTTTTCAAACTCATTTAGACGAGACCAGGCATTTGGGAAACGTGCTAAGGTTGTTACT

ATGCAAAATTAATGATCTTTATTTTTCTGTTTTTTTTTGCAGAATGAAGTTCACTGCCACCTTCCTCATGATTTTAATCTTCGTCCTCAT

AACCTGGAGAGTGTGGTATTAGGAAATGGTTTAAAAAGGCTGCTCACGGTAAAGTCACGGAATTAATTTGCTTTTTGCTTTACAAATATT

ACAGCAGCTGGAAAATCACAAAAATAAATAGTCGATGTATTTGGCCAATTAGAATCACTTTGATTTCAATAATAATCTAAATAGCAACCT

GCCTTTGATTAGCATGTTCCTTCAATGAAATGGGTGTTGAGGTTTATTTTGATTCTCACATGCACCGACCTGCTGGGGCAACAATTGAAT

TTTGTCCCAAAGGAATTCAAAGTAAACTTTTCTAGGCGATTTAATCTTTCCATAACTCGGCTTTGTTTTTAAAAATATATAATAACTCAA

ATGATAAAATAATAACACATACATTCTGATTTATACAAGACAAGATTGAAAACTTCTTGAAAGTATGTATCAAACATCATCTGTTTATAT

TTTAACATTTCACAAAAAGTCCAACTAATTGTGTTATGGAATTGTATAAATTGTCATTTAATATAATTTTTTTGAGTTTATCAATATGTG

GTTTGTTTTACACAGTTGGCAAGAAAGTTGGCAAGGTGGCCCTTAAGTAAGGACTTCTACCATTATTACTGTATAATTTTGATAGTATTA

AGTACTGTTATTGACAACTTCTCTTTTCCTGCTGACTCTCTCCATCCGACTCATCTGCAGTGCTTACCTTGGCGAGCAGCAGCAGCTCGA

GTGCAGTCGATGAAGAGCCCAGTGTTATTGCTTTTGACTGAAGGAGTCGCCTTGAAGGAGCCTTC

//

附件II.参照表11的hepcidin样基因和cDNA的核苷酸序列

NRC201

CGCCCTTAAGATGAAGACATTCAGTGTTGCAGTTGCAGTGGTGGTCGTCCTCGCATGTATGTTCATCCTTGAAAGCACCGCTGTTCC

TTTCTCCGAGGTGCGAACGGAGGAGGTTGAAAGCATTGACAGTCCAGTTGGGGAACATCAACAGCCGGGCGGCACGTCCATGAATCT

GCCGGTACGTTCAATTTAGTGAATGAATTAAGTAATTACCTTTAGCAAATTAACATCTAAGTGGTTGCGTTTCACCCTTGGAATTGA

ATTAGCCCACTAGCGCTAGTTGTTAACCATTTGATTGTGAGCCGGTAGAGAGGGCTTCAGGGCGAGTAGTGTGAATACTTGTGAAGT

GGAGACTTGGACAAAAATACTTACCATGTGCTTGTTCCCACCTTTTTCATTTTCTTTTCTTGGCTGAGATACAGATGCATTTCAGGT

TCAAGCGTCAGAGCCACCTCTCCCTGTGCCGTTGGTGCTGCAACTGCTGTCACAACAAGGGCTGTGGCTTCTGCTGCAAATTCTGAG

GACCTGCCAGCAAAGGGCGAATTCGTTTAAAACAC

//

NRC202

AGATGAAGACATTCAGTGTTGCAGTTGCAGTGGTGGTCGTCCTCGCATGTATGTTCATCCTTGAAAGCACCGCTGTTCCTTTCTCCG

AGGTGCGAACGGAGGAGGTTGAAAGCATTGACAGTCCAGTTGGGGAACATCAACAGCCGGGCGGCACGTCCATGAATCTGCCGATGC

ATTTCAGGTTCAAGCGTCAGAGCCACCTCTCCCTGTGCCGTTGGTGCTGCAACTGCTGTCACAACAAGGGCTGTGGCTTCTGCTGCA

AATTCTGAGGACCTGCCAGCA

//

NRC203

ACGAGGTCCCTCATCCGCTGACACCAAAAGAACAATCAATCAACTTTGGACTCGTCTTAGTGCATTGAAAATTGTGCGTT

GGAGAGCGTCGCTTTTTGGGAACATTGAAGAGTTCTGATCTTCCTCATAAACTGTCACTTCAATTTCAACTGATTTCAAC

AGGACTTTTAAATAGGCTATAAACTTCCTAAAAAAAACGAGAATGAAGGCCTTTAGTGTTGCAGTGGTACTCGTCATTGC

ATGTATGTTCATCCTTGAAAGCACCGCTGTTCCTTTCTCCGAGGTGCGAACGGAGGAGGTTGGAAGCTTTGACAGTCCAG

TTGGGGAACATCAACAGCCGGGCGGCGAGTCCATGCATCTGCCGGAGCCTTTCAGGTTCAAGCGTCAGATCCACCTCTCC

CTGTGCGGTTTGTGCTGCAACTGCTGTCACAACATTGGCTGTGGCTTCTGCTGCAAATTCTAAGGACCTGCCCGCAACAT

TTTCTAGTTTGTACATGTTTGCAATGTTTTCTTTCTGAGATGTTGTTTTTGTGACTATGATAATGATTTATAAAAACACT

TCTTATTGTGACACTTTAAAAAAAATAAACACATTCTTTGAATACAAAAAAAAAAAAAAAAAA

//

NRC204

CGAACGGAGGAGGTTGAAAGCATTGACAGTCCAGTTGGGGAACATCAACAGCCGGGCGGCACGTCCATGAATCTGCCGAT

GCATTTCAGGTTCAAACGTCAGAGCCACCTCTCCCTGTGCCGTTGGTGCTGCAACTGCTGTCACAACAAGGGCTGTGGCT

TCTGCTGCAAATTCTGAGGACCTGCCAGCACTAAAGCCATTTTATTAACTTATCGCCTTTAATTTGCCCCTATTCTTCTA

TGTTTCTTTTGGACTCTGTGGAGAAGATGCAATCTCATTGACGTCTTTATCACTGCACAACCTCAATCTTGT

//

NRC205

AAGATGAAGACATTCAGTGTTGCAGTGGTACCCGTCATTGCATGTATGTTCATCCTTGAAAGCACCGCTGTTCCTTTCTCCGAGGTG

CGAACGGAGGAGGTTGGAAGCTTTGACAGTCCAGTTGGGGAACATCAACAGCCGGGCGGCACGTCCATGAATCTGCCGATGCATTTC

AGGTTCAAGCGTCAGAGCCACCTCTCCCTGTGCCGTTGGTGCTTCAACTGCTGTCACAACAAAGGCTGTGGCTTCTGCTGCAAATTC

TGAGGACCTGCCAGCA

//

NRC206

TAAGATGAAGCAATTCAGTGTGGCAGTGGTACTCGTCATGGCATGTATGTTCATCGTGGAAAGCACCGCTGTTCCTTTCTCCGAGGT

GCGAACGGAGGAGGTTGGAAGCTTGGACAGTCCAGTTGGGGAACATCAACAGCCGGGCGGCGAGTCCATGCATCTGCCGGAGCCTTT

CAGGTTCAAGCGTCAGATCCACCTCTCCCTGTGCGGTTTGTGCTGCAACTGCTGTCACAACATTGGCTGTGGCTTCTGCTGCAAATT

CTGAGACTGCCAGCA

//

NRC207

ACGAGGCACACGCTGACCAGGGGGTCACCACAACTTCTGAAGAGACCCAGGTTCCTAGAGAGCCACTAGAGAATCACCCG

GGAGCCCGAAGAACACAGGACGCTGCGGTGCTCGTCGGTGGCCGGACACCCATGAGACAGAAGACCTACAAGCCTCTCAG

CTTCAGAAGGATTTCCTGACTCAGCATCTAAAACCTCCCTCAAAATGAAGGCATTCAGCATTGCAGTTGCAGTGACACTC

GTGCTCGCCTTTGTTTGCATTCAGTGCAGCTCTGCCGTCCCATTCCAAGGGGTGCAGGAGCTGGAGGAGGCCGGGGGCAA

TGACACTCCAGTTGCGGAACATCAAGTGATGTCAATGGAATCCTGGATGGAGAATCCCACCAGGCAGAAGCGCCACATCA

GCCACATCTCCCTGTGCCGCTGGTGCTGCAACTGCTGCAAGGCCAACAAGGGCTGTGGCTTCTGCTGCAAGTTCTGAGGA

TTCCCGCAACACAACCTCACAATGTATTAATTTATTACACTTTTTGTCGAGAAATGTCCTTTTTCTTGACCTCTTTTGTA

ATTTTGTATAATCTTTTAAATAAAACGGGGTACGATTCATGGAAAAAACCCTTTGAATAAAATAAAAAAAAAAAAAAAAA

AAAAAAC

//

NRC208

AAGATGAAGACATTCAGTGTTGCAGTTGCAGTGACACTCGTGCTCGCCTTTGTTTGCATTCAGGACAGCTCTGCCGTCCCATTCCAG

GGGGTAAGAACGCAACTTTAACTCGCTTCATTTGCTTATTAGCCATAAATGTTTTGTCAGGATGCTGAGACACGGCTCCTAAATGTG

TATAATTCATTAACAGGTGCAGGAGCTGGAGGAGGCAGGGGGCAATGACACTCCAGTTGCGGCACATCAAATGATGTCAATGGAATC

GTGGATGGTATGTTCAATCTGTTCAATCGACTGGATGAATTAAGCCAATTACTGTGAGCGCGTTAACATTTAAGTGGCTGTGTTCCA

GCCCGGTGCTGTAGGGAATAAAACCCCTCGTTCATGTGTCTTGTCCGTCCACAGGAGAGTCCCGTCAGGCAGAAGCGTCACATCAGC

CACATCTCCATGTGCCGCTGGTGCTGCAACTGCTGCAAGGCCAAGGGCTGTGGCCCCTGCTGCAAATTCTGAGGACCTGCCCAGCA

//

NRC209

AAGATGAAGACATTCAGTGTTGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCTGGCACCTTTCCTGAG

GTAAGCTCCTGACTTCAGATCGTTTCATTTTGCTTGTTATCCATGAATCTCTCATCAACAGACTGAGACTTGATTCCTTCTTTATCA

GGTACAAGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCTGCTGAACATCAGGAGACATCAGTGGACTCATGGATGGTAGGTTC

AGTTCACTGAATGGATCAAACCAATTCACATCAGACCTTTCAGATGGAAGTGAATGTGTTTTAGTCTCAAAGGTGCCCTGAAGCTCA

GTTTACACAAGCAGTGAAAACAAACACAGAAAGTTATGATGATGCTGATGAACTTCTCCTCATGTCTCATGTCTCTCACACAGATGC

CATACAACAGACAGAAGCGTGCCTTCAAGTGTAAGTTCTGCTGCGGCTGCTGCAGAGCTGGTGTCTGTGGACTGTGCTGCAACTTCT

GAGGATTCCTGCTCCAACAAC

//

NRC210

ACGAGCTGACAGGAGCTGACAGGAGTCACCAGCAGAGTCAAAGAACTAAACAACTTAACTCAGTCAAACTCTCAAAGATG

AAGACATTCAGTGTTGCAGTCACAGTGGCCGTCGTCCTCGTCTTTATTTGTATCCAGCAGAGCTCTGCCTCCTTTCCTGA

GGCACAAGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCTGCTGAGCATCAGGAGACACCAGTGGACTCGTGGATGA

TGCCATACAACAGACAGAAGCGTAGCTTTAAGTGTAAGTTCTGCTGCGGCTGCTGCAGAGCTGGTGTCTGTGGACTGTGC

TGCAAGTTCTGAGGATTCCTGCTCCAACAACCATCAAATATTCATTTGTTTTGCCTTTTGTCTTAAAGTTCATTGAACTA

TAAACATATTTCTGGTTGAGCATGTGATAGTTTAATGGTGTTACTCATTGGTTCATGGTATAGTCAAGTGTTCAGAGATG

TGATTGTATCACCCACATATTTTCTCTGTTAGGTGTATTTTCAATAAATGCCAATGATCCTTTGAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAA

//

NRC211

ACGAGCGGCACGAGGTGAACTGACAGGAGCTGACAGGAGTCACCAGCAGAGTCAAAGAACTAAACAACTTAACTCAGTCA

AACTCTCAAAGATGAAGACATTCAGTGTTGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCT

GCCTCCTTTCCTGAGGCACAAGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCTGCTGAACATCAGGAGACACCAGT

TGACTCGTGGATGATGCCAAACAACAGACAGAAGCGTGGCTTTAAGTGTAAGTTCTGCTGCGGCTGCTGCAGAGCTGGTG

TCTGTGGACTGTGCTGCAAGTTCTGAGGATTCCTGCTCCAACAACCATCAAATATTCATTTGTTTTGCCTTTTGTTTTAA

AGTTCATTGAACTATATACATATTTCTGGTAGAGCATGTGATAGTTTAATGGTGCTACTCCTTGGTTCATGGTGTAGTTA

AAAAAAAAAAAAAAAAAAA

//

NRC212

ACGAGACTGACAGGAGCTGACAGGAGTCACCAGCAGAGTCAAAGAACTAAACAACTTAACTCAGTCAAACTCTCAAAGAT

GAAGACATTCAGTGTTGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCTGCCACCTTTCCTG

AGATGCCATACAACAGACAGAAGCGTGGCTTTAAGTGTAAGTTCTGCTGCGGCTGCTGCGGAGCTGGTGTCTGTGGAATG

TGCTGCAAGTTCTGAGGATTCCTGCTCCAACAACAATCAAATATTCATTTGTTTTGCCTTTTGTCTTAAAGTTCATTGAA

CTATAAACATATTTCTGGTTGAGCATGTGATAGTTTAATGGTGTTACTCATTGGTTCATGGTATAGTCAAGTGTTCAGAG

ATGTGATTGTATCACCCACATATTTTCTCTGTTAGGTGTATTTTCAATAAATGCCAATGATCCTTTGAAAAAAAAAA

//

NRC213

AAGATGAAGACATTCAGTGTTGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCTGCCTCCTT

TCCTGAGGTAAGCACCTGACTTCAGATCGTTTCATTTGCTTGTTATCCATGAATCTCTCATCATCATACTGAGACTTGAT

TCCTTCTTTATCAGGCACAAGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCTGCTGAGCATCAGGAGACACCAGTG

GACTCCAGGAGTGAATGTGTTTTAGTCACAAAAGTGCCCTGAAGCTCAGTTTACACAAGCAGAGAAAACAAACAGAGTAA

GTTATGATGATGCTGATGAAGGTCTCCTCATGTCTCATGTCTCTCACACAGATTCCATACAACAGACAGAAGCGTAGCTT

TAAGTGTAAGTTCTGCTGCGGCTGCTGCAGAGCTGGTGTCTGTGGACTGTGCTGCAAGTTCTGAGGATTCCTGCTCCAAC

AAC

//

NRC214

AGATGAAGACATGCAGTGTTGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCTGCCTCCTTT

CCTGAGGTAAGCACCTGACTTCAGATCGTTTCATTTGCTTGTTATCCATGAATCTCTCATCATCATACTGAGACTTGATT

CCTTCTTTATCAGGTACAAGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCTGCTGAACATCAGGAGACACCAGTTG

ACTCGTGGATGGTAGGTTCAGTTCACTGAATGGATCAATCCATTTCACATCAGATCTTTCAGATGGAAGTGAATGTGTTT

TAGTCACAAAAGTGCCCCTGAAGCTCAGTTTACACAAGCAGAGAAAACAAACAGAGTAAGTTATGATGATGCTGATGAAG

GTCTCCTCATGTCTCATGTCTCTCACACAGATGCCAAACAACAGACAGAAGCGTGGCTTTAAGTGTAAGTTCTGCTGCGG

CTGCTGCAGAGCTGGTGTCTGTGGACTGTGCTGCAAGTTCTGAGGATTCCTGCTCCGGACAA

//

NRC215

AAGATGAAGACAATCAGTGTTGCAGTCACAGTGGCCGTCGTCCTCGTCTTTATTTGTATCCAGCAGAGCTCTCCCTCCTT

TCCTGAGGTAAGCACCTGACTTCAGATCGTTTAATTTGCTTGTTATCCATGAATCTCTCATCAACATACTGAGACTTGAT

GACTCAGGGATGGTAGGTTCAGTTCACTGAATGGATCAATCCATTTCACATCAGATCTTTCAGATTGAAGTGAATGTGTT

TTAGTCACAAAAGTGCCCTGAAGCTCAGTTTACACAAGCAGAGAAAACAAACAGAGTAAGTTATGATGATGCTGATGAAG

GTCTCCTCATGTCTCATGTCTCTCACACAGATTCCATACAACAGACAGAAGCGTAGCTTTAAGTGTAAGTTCTGCTGCGG

CTGCTGCAGAGCTGGTGTCTGTGGACTGTGCTGCAAATTCTGAGGACCTGCCAGCA

//

NRC216

AAGATGAAGACATTCAGTGGTGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCTGCCTCCTT

TCCTTCTTTATCAGGTACAAGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCTGCTGAACATCAGGAGACACCAGTT

GACTCGTGGATGGTAGGTTCAGTTCACTGAATGGATCAATCCATTTCACATCAGATCTTTCAGATGGAAGTGAATGTGTT

CTGCTGCAGAGCTGGTGTCTGTGGACTGTGCTGCAAATTCTGAGGACCTGCCAGCA

//

NRC217

AAGATGAAGACATCAGTGGTTGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCTGCCACCTTTCCTGAG

GTAAGCACCTGACTTCAGATAGCTTCATTTGCTTGTTATCCATGAATCTCTCATCAACATACTGAGACTTTATTCCTTCTTTATCAG

GTACAAGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCTGCTGCGCATCAGGAGACATCAGTGGACTCGTGGATGGTAGGTTCA

GTTCACTCAATGGATCAAACCAATTCACATCAGATCTTTCAGATGGAAGCGAATGTGTTTTAGTCAAAAAAGTGACCTGATGCTCAG

TTTACACAAGCAGAGAAAACAAGCAGAGTAAGTTATGATGATGCTGATGAACGTGTCCTCATGTCTCATGTCTCTCACACAGATGCC

ATACAACAGACCGAAGCGTAGCTTTAAGTGTAAGTTCTGCTGCGGCTGCTGCAGAGCTGGTGTCTGTGGACTGTGCTGCAAATTCTG

AGGATTCCTGCTCCAACAAC

//

NRC218

AAGATGAAGACATTCAGTGTGGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCTGCCACCTTTCCTGAG

GTAAGCACCTGACTTCAGATAGCTTCATTTGCTTGTTATCCATGAATCTCTCATCAACATACTGAGACTTGATTTCTTCTTTATCAG

GTACAAGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCCGCTGAACATCAGGAGACATCAGTGGACTCGTGGATGGTAGGTTCA

GTTCACTCAATGGATCAAACCAATTCACATCAGATCTTTCAGATGGAAGTGAATGTGTTTTAGTCACAGAAGTGCCCTGATGCTCAG

ATACAACAGACCGAAGCGTAGCTTTAAGTGTAAGTTCTGCTGCGGCTGCTGTAGAGCTGGTGTCTGTGGACTGTGCTGCAAATTCTG

AGGATTCCTGCTCCAACAAC

//

NRC219

AAGATGAAGACATTCGTGGTTGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCTGCCACCTTTCCTGAG

GTAAGCACCTGACTTCAGATAGCTTCATTTGCTTGTTATCCATGAATCTCTCATCAACATACTGAGACTTGATTCCTTCTTTATCAG

GTTCACTCAATGGATCAAACCAATTCACATCAGATCTTTCAGATGGAAGTGACTGTGTTTTAGTCACAAAAGTGCCCTGATGCTCAG

TTTACACAAGCAGAGAAAACAAGCAGAGTAAGTTATGATGATGCTGATGAACGTCTCCTCATGTCTCATGTCTCTCACACAGATGCC

ATACAACAGACAGAAGCGTAGCTTTAAGTGTAAGTTCTGCTGCGGCTGCTGCAGAGCTGGTGTCTGTGGACTGTGCTGCAAATTCTG

AGGATTCCTGCTCCAACAAC

//

NRC220

GTACAAGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCTGCTGCACATCAGGAGACATCAGTGGACTCGTGGATGGTGGGTTCA

GTTCACTCAATGGATCAAACCAATTCACATCAGATCTTTCAGATGAAGTGACTGTGTTTTAGTCACAAAAGTGCCCTGATGCTCAGT

TTACACAAGCAGAGAAAACAAGCAGAGTAAGTTATGATGATGCTGATGAACGTGTCCTCATGTCTCATGTCTCTCACACAGATGCCA

TACAACAGACATAAGCGTAGCTTTAAGTGTAAGTTCTGCTGCGGCTGCTGCAGAGCTGGTGTCTGTGGACTGTGCTGCAAATTCTGA

GGATTCCTGCT

//NRC221

AAGATAAGACATTCAGTGTTGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCTGCCACCTTTCCTGAGG

TAAGCACCTGACTTCAGATCGTTTCATTTGCTTGTTAGCCTTGAATCTCTCATCAACATACTGAGACTTGATTTCTTCTTTATCAGG

TACAAGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCTGCTGAACATCAGGAGACATCAGTGGACTTGTGGATGGTAGGTTCAG

TTCACTGAATGGATCAAACCAATTCACATCAGATCTTTCAGATGGAAGTGAATGTGTTTTAGTCACAAAAGTGCCCTGAAGCTCAGT

TTACACGAGCAGAGAAAACCAACACAGTAAGTTATGATGATGCTGATGAACGTCTCCTCATGTCTCATGTCTCTCACACAGATGCCA

TACAACAGACAGAAGCGTGGCTTTAAGTGTAAGTTCTGCTGCGGCTGCTGCAGCCCTGGTGTCTGTGGACTTTGCTGCAGATTCTGA

GGATTCCTGCTCCAACAAC

//

NRC222

AAGATGAAGACATTCAGTGTTGCAGTCGCAGTGGCCGTCGTGCTCATCTTTATTTGTATCCAGCAGAGCTCTGCCACCTTTCCTGAG

GTAAGCACCTGACTTCAGATAGTTTCATTTGCTTGTTATCCATGAATCTCTCATCAACATACTGAGACTTTATTCCTTCTTTATCAG

GTACAAGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCTGCTGAACATCAGGAGACATCATTGGACTCATGGATGGTAGGTTCA

ATACAACAGACAGAAGCGTGGCTTTAAGTGTAAGTTCTGCTGCGGCTGCTGCAGAGCTGGTGTCTGTGGACTGTGCTGCAAATTCTG

AGGACCTGCCAGCA

//

NRC223

AAGATGAAGACATTCAGTGTTGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCTGCCACCTTTCCTGAG

GTTCACTCAATGGATCAAACCAATTCACATCAGATCTTTCAGATGGAAGTGAATGTGTTTTAGTCACAAAAGTGCCCTGATGCTCAG

ATACAACAGACATAAGCGTAGCTTTAAGTGTAAGTTCTGCTGCGGCTGCTGCAGAGCTGGTGTCTGTGGACTGTGCTGCAAATTCTG

AGGACCTGCCAGCA

//

NRC224

AGATGAAGACATTCAGTGTTGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCTGCCACCTTTCCTGAGG

TAAGCACCTGACTTCAGATAGTTTCATTTGCTTGTTATCCATGAATCTCTCATCAACATACTGAGACTTGATTTCTTCTTTATCAGG

TACAAGAGCTGGGGGAGGCAGTGAGCAATGACAATGCAGCCGCTGAACATCAGGAGACATCAGTGGACTCGTGGATGGTAGGTTCAG

TTCACTCAATGGATCAAACCAATTCACATCAGATCTTTCAGATGGAAGTGAATGTGTTTTAGTCACAAAAGTGCCCTGATGCTCAGT

TACAACAGACCGAAGCGTAGCTTTAAGTGTAAGTTCTGCTGCGGCTGCTGCAGAGCTGGTGTCTGTGGACTGTGCTGCAAATTCTGA

GGACCTGCCAGCA

//

NRC225

AAGATGAAGACATTCAGTGTTGCAGTCACAGTGGCCGTCGTGCTCATCTTTATTTGTATCCAGCAGAGCTCTGCCACCTCTCCTGAG

GTACAAGGGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCTGCTGAACATCAGGAGACATCAGTGGACTCGTGGATGATGCCATAC

AACAGACAGAAGCGTGGCTTTAAGTGTAAGTTCTGCTGCGGCTGCTGCAGGCCTGGTGTCTGTGGACTTTGCTGCAGATCCTGAGGA

TTCCTGCTCCAACAAC

//

NRC226

GTAAGCACCTGACTTCAGATCGTTTCATTTGCTTGTTAGCCTTGAATCTCTCATCAACATACTGAGACTTGATTTCTTCTTTATCAG

GTACAAGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCTGCTGAACATCAGGAGACATCAGTGGACTTGTGGATGGTAGGTTCA

GTTCACTGAATGGATCAAACCAATTCACATCAGATCTTTCAGATGGAAGTGAATGTGTTTTAGTCACAAAAGTGCCCTGAAGCTCAG

TTTACACGAGCAGAGAAAACCAACACAGTAAGTTATGATGATGCTGATGAACGTCTCCTCATGTCTCATGTCTCTCACACAGATGCC

ATACAACAGACAGAAGCGTGGCTTTAAGTGTAAGTTCTGCTGCGGCTGCTGCAGACCTGGTGTCTGTGGACTTTGCTGCAGATTCTG

AGGATTCCTGCTCCAACAAC

//

NRC227

ATACAACAGACAGAAGCGTGGCTTTAAGTGTAAGTTCTGCTGCGGCTGCTGCAGTCCTGGTGTCTGTGGACTTTGCTGCAGATTCTG

AGGATTCCTGCTCCAAC

//

NRC228

GTACAAGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCTGCTGAACATCAGGAGACATCAGTGGACTCGTGGATGGTAGGTTCA

GTTCACTGAATGGATCAAACCAATTCACATCAGATCCTTCAGATGGAAGTGAATGTGTTTTAGTCACAAAAGTGCCCTGAAGCTCAG

TTTACACGAGCAGAGAAAACAAACACAGTAAGTTATGATGATGCTGATGAACGTCTCCTCATGTCTCATGTCTCTCACACAGATGCC

ATACAACAGACAGAAGCGTGGCTTTAAGTGTAAGTTCTGCTGCGGCTGCTGCAGTCCTGGTGTCTGTGGACTTTGCTGCAAATTCTG

AGGACCTGCCAGCA

//

NRC229

ATACAACAGACAGAAGCGTGGCTTTAAGTGTAAGTTCTGCTGCGGCTGCTGCAGACCTGGTGTCTGTGGACTTTGCTGCAAATTCTG

AGGACCTGCCAGCA

//

NRC230

GTACAAGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCTGCTGAACATCAGGAGACATCAGTGGACTCGTGGATGATGCCATAC

AACAGACAGAAGCGTGGCTTTAAGTGTAAGTTCTGCTGCGGCTGCTGCAGACCTGGTGTCTGTGGACTTTGCTGCAAATTCTGAGGA

CCTGCCAGCA

//

NRC231

AACAGACAGAAGCGTGGCTTTAAGTGTAACTTCTGCTGCGGCTGCTGCAGGCCTGGTGTCTGTGGACTTTGCTGCAGATTCTGAGGA

TTCCTGCTCCAACAAC

//

NRC232

AAGATGAAGACATTCAGTGTTGCAGTCACAGTGGCCGTCGTGCTCGTCTTCATTTGTATCCAGCAGAGCTCTGCCACCTTTCCTGAG

GTACAAGAGCTGGAGGAGGCAGTGAGCAGTGACAATGCAGCTGCTGAACATCAGGAGACATCAGTGGACTCGTGGATGGTAGGTTCA

GTTCACTGAATGTGTTTTAGTCACAAAAGTGCCCTGAAGCTCAGTTTACACAAGCAGAGAAAACAAACAGAGTAAGTTATGATGATG

CTGATGAACGTCTCCTCATGTCTCATGTCTCTCACACAGATGCCATACAACAGACAGAAGCGTAGCTTTAAGTGCAAGTTCTGCTGC

GGCTGCTGCAGACGTGGTGTCTGTGGACTGTGCTGCAAATTCTGAGGATTCCTGCTCCAACAAC

//

NRC233

AAGATGAAGACTATCAGTGTTGCAGTCACAGTGGCCGTCGTGCTCCTCTTCATTTGTACCCAGCAGAGCTCTGCCACCTTTCCTGAG

GTACAAGAGCTGGAGGAGGCAGTGAGCAGTGACAATGCGGCTGCTGAACATCAGGAGACATCAGTGGACTCGTGGATGGTAGGTTCA

TTTACACAAGCAGAGAAAACAAACACAGTAAGTTATGATGATGCTGATGAACGTCTCCTCATGTCTCATGTCTCATGTCTCTCACAC

AGATGCCATACAACAGACAGAAGCGTGGCTTTAAGTGCAAGTTCTGCTGCGGCTGCCGCTGTGGTGCTCTCTGTGGACTGTGCTGCA

AATTCTGAGGATTCCTGCTCCAACAAC

//

NRC234

GTAAGCACCTGACTTCAGATCGTTTCATTTGCTTGTTAGCCTTGAATCTCTCATCAACGTACTGAGACTTGATTTCTTCTTTATCAG

GTACAAGAGCTGGAGGAGCCAGTGAGCAGTGACAATGCAGCTGCTGAACATCAGGAGACATCGGTGGACTCGTGGATGGTAGGTTCA

AATTCTGAGGACCTGCCAGCA

//

NRC235

AAGATGAAGACATTCAGTGTTGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTTCCAGCAGAGCTCTGCCACCTTTCCTGAGG

TACAAGAGCTGGAGGAGGCAGTGAGCAGTGACAATGCAGCTGCTGAACATCAGGAGACATCAGTGGACTCGTGGATGGTAGGTTCAG

TTCCCTGAATGGATCAAACCAATTCACATCAGATCTTTCAGATGGAAGTGAATGTGTTTTAGTCACAAAAGTGCCCTGAAGCTCAGT

TTACACAAGCAGAGAAAACAAACACAGTAAGTTATGATGATGCTGATGAACATCTCCTCATGTCTCATGTCTCATGTCTCTCACACA

GATGCCATACAACAGACAGAAGCGTGGCTTTAAGTGCAAGTTCTGCTGCGGCTGCCGCTGTGGTGCTCTCTGTGGACTGTGCTGCAA

ATTCTGAGGACCTGCCAGCA

//

NRC236

ACGAGCTGACAGGAGCTGACAGGAGTCACCAGCAGACTCAAAGAACTAAACAACTTAACTCAGTCAAACTCTCAAAGATGAAGACAT

TCAGTGTTGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCTGCCACCTTTCCTGAGGTACAAGAGCTGG

AGGAGGCAGTGAGCAATGACAATGCAGCTGCTGAGCATCAGGAGACACCAGTGGACTCAGGGATGATGCCAAACAACAGACAGAAGC

GCAGCGCCGATTGTTGGCCATGTTGCAATCAAAATGGCTGTGGAACTTGCTGCAAGGTCTAAACAGACTCTTGGGCAGATCAATCCA

GGTTCGTCTTTCGTTGTCTCTCCGTGGAGTCGAACCAGAGACCTTCTCAGCCCATAGTCCAAGTTTCTGCCACTAGACCACCGCCTC

TCCCTCATCAAATACTCAATGTTTTTCATTTTGTCTTAAAGTTCATTGAACTATAAACATATTTCTGGTAGAGCATGTGATAGTTTA

ATGGTGTTACTCATTGGTTCATGGTATAGTCAGATGTTCAGAGATGTGATTATATCATCCACATATTTTCTCTGTTAAGGTGTACTG

TCAATAAATGTCAATGCTCCTTTGAAAAAAAAAAAAAAAAAAAAAC

//

NRC237

CGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCTGCCACCTTTCCTGAGGTGAGCTCCTGACTTCAGATCGTTTCATTTAGCTTGTT

ATCCATGAATCTCTCATCAACATACTGAGACTTGAATCCTTCTTTATCAGGTACAGGAGCTGGAGGAGGCAGTGAGCAATGACAATG

CAGCTGCTGAACATCAGGAGACATCAGTGGACTCATGGATGGTATGTTCAGTTCACTG ATGGATCAAACCAATTCACATCAGATCT

TTCAGATGGAAGTGAATTTGTTTTAGTCCCAAAAGTGCCCTGAAGCTCAGTTTACACA GCAGAGAAAAACAAAACACAGTAAGTTA

TGATGATGCTGATGAACGTCTCCTCATGTCTCATGTCTCTCACACAGATGCCATACAACAGACAGAAGCGCAGCGCCGAGTGTAGCT

TCTGCTGCAATGAATCTGGCTGTGGAATTTGCTGCAAATTCTGAGGATTCCTGCTCCAACAACAAGGGCGAATTC

//

NRC238

GTGAGCTCCTGACTTCAGATCGTTTCATTTAGCTTGTTATCCATGAATCTCTCATCAACATACTGAGACTTGAATCCTTCTTTATCA

GGTACAGGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCTGCTGAACATCAGGAGACATCAGTGGACTCATGGATGGTATGTTC

AGTTCACTGAATGGATCAAACCAATTCACATCAGATCTTTCAGATGGAAGTGAATTTGTTTTAGTCCCAAAAGTGCCCTGAAGCTCA

GTTTACACAAGCAGAGAAAAACAAAACACAGTAAGTTATGATGATGCTGATGAACGTCTCCTCATGTCTCATGTCTCTCACACAGAT

GCCATACAACAGACAGAAGCGCAGCGCCGAGTGTAGCTTCTGCTGCAATGAATCTGGCTGTGGAATTTGCTGCAAATTCTGAGGACC

TGCCAGCA

//

NRC239

GTGGAGGAGCCAGTGAGCAGTGAGAATGGAGCAAATGAACACACATAAGATCTTTCGGATGGAAGTGTATGTGTTTTAGTCACATGA

GTGGCTCGAAGCTCAGTACACACGAGCAGAGAGAACGAACACAGTGTGTTTTATTCTGCTTGTGTAAACTGAGCTTCAGTTTACACA

AGCAGAGAAAACAAACACAGTAAGTTATGATGATGCTGATGAACGTCTCCTCATGTCTCATATCTCTCACACAGATGCCAAACAACA

GACAGAAGCGTGGCTCTAATTGCAAACCATGCTGCAATCATAATGGCTGTGGAACGTGCTGCGAAGTCTGAGGATTCCTGCTCCACA

//

Claims

1.一种鉴定编码抗菌肽的候选核酸序列的方法，所述方法包括：

a)鉴定感兴趣的起始肽；

b)鉴定编码所述起始肽的基因组DNA；

c)鉴定位于所述起始肽每一侧的侧翼序列；

d)获得与所述侧翼序列互补的引物；及

e)大范围筛选核酸序列来鉴定能够使用步骤d)的引物来扩增的候选序列。

2.如权利要求1所述的方法，其中所述的感兴趣的起始肽具有至少两个单位的正电荷并含有两性结构。

3.如权利要求1所述的方法，其中所述的感兴趣的起始肽为hepcidin、pleurocidin、pardaxin、misgurin、HFA-1、piscidin、moronecidin、parasin或鲶鱼组蛋白2A的裂解产物。

4.如权利要求1所述的方法，其中所述的感兴趣的起始肽为hepcidin或pleurocidin。

5.如权利要求1、2或3所述的方法，还包括预测所述候选序列编码的氨基酸序列以及选择核酸序列的步骤g)，所述的核酸序列被预测为编码含有两性结构和净电荷的肽。

6.如权利要求5所述的方法，还包括获取对应所述候选核酸序列的肽及检测所述肽序列的抗菌活性的附加步骤。

7.如权利要求1所述的方法，还包括验证所述的感兴趣的起始肽具有抗菌活性的附加步骤(a’)。

8.能使用上述任一权利要求所述的方法鉴定的分离的核酸序列。

9.能由权利要求8所述的核酸序列编码的分离的多肽。

10.含有侧翼序列的分离的核酸序列。

11.一种试剂盒包括：

a.与第一侧翼序列具有至少95％同一性的第一核酸序列，其位于或接近编码抗菌肽的靶序列的5’末端；

b.与第二侧翼序列具有至少95％同一性的第二核酸序列，其位于或接近编码抗菌肽的靶序列的3’末端；及

c.实施如权利要求1所述的方法的说明书。

12.信号序列I、酸性序列I、信号肽II、信号肽III、信号肽IV、信号肽V、原序列I、原序列II、编码上述序列的核酸序列及基本与这些编码核酸序列互补的核酸序列中的至少一种在抗菌肽的鉴定和扩增中的用途。

13.与肽a、b、c或d中的一种至少有80％同源的分离的抗菌肽：

肽a GW(G/K)XXFXK

肽b GXXXXXXXHXGXXIH

肽c FKCKFCCGCCXXGVCGXCC

肽d CXXCCNCC(K/H)XKGCGFCCKF

肽e FKCKFCCGCRCGXXCGLCCKF

肽f XXXCXXCCNXXGCGXCCKX。

14.如权利要求13所述的抗菌肽，其与肽a、b、c或d中的一种至少有90％同源。

15.如权利要求13所述的抗菌肽，其为肽a、b、c或d中的一种。

16.如附件I或附件II中所示的分离的核酸序列。

17.如表4或表13中所示的分离的核酸序列。

18.一种鉴定编码抗菌肽的候选核酸序列的方法，所述方法包括：

a)鉴定编码感兴趣的起始肽的核酸序列；

b)鉴定编码所述起始肽的基因组DNA；

c)鉴定位于所述起始肽每一侧的侧翼序列；

d)获取与所述侧翼序列互补的引物；及