CN1678632A - 一种从硬骨鱼中鉴定新的广谱抗菌肽的基因组途径 - Google Patents
一种从硬骨鱼中鉴定新的广谱抗菌肽的基因组途径 Download PDFInfo
- Publication number
- CN1678632A CN1678632A CNA038199246A CN03819924A CN1678632A CN 1678632 A CN1678632 A CN 1678632A CN A038199246 A CNA038199246 A CN A038199246A CN 03819924 A CN03819924 A CN 03819924A CN 1678632 A CN1678632 A CN 1678632A
- Authority
- CN
- China
- Prior art keywords
- peptide
- sequence
- hepcidin
- pleurocidin
- nrc
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/461—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from fish
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Physics & Mathematics (AREA)
- Analytical Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Plant Pathology (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- Toxicology (AREA)
- Immunology (AREA)
- Peptides Or Proteins (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
本发明提供了一种鉴定编码抗菌肽的候选核酸序列的方法。该方法包括:鉴定感兴趣的起始肽;鉴定编码所述起始肽的基因组DNA;鉴定位于所述起始肽每一侧的侧翼序列;获得与所述侧翼序列互补的引物;及大范围筛选核酸序列来鉴定能够使用步骤e)的引物来扩增的候选序列。在一些例子中,所述抗菌肽为hepcidin或pleurocidin。
Description
技术背景
目前已从多种植物、动物中分离了抗菌肽,其在防御微生物入侵中发挥重要作用。根据其二级结构和氨基酸序列的相似性它们主要分为三类:α-螺旋结构、高二硫键结合(富含半胱氨酸)β-片层及含高百分比单氨基酸(诸如脯氨酸或精氨酸)。
大多数分子为两性的并含有阳离子和疏水表面,使其能够插入生物膜中。尽管抗菌肽的作用方式之一被描述为溶解病原体,但它们也可以通过与细胞内靶标的结合来发挥作用。有报道表明它们还具有多种作用,例如介导炎症和调节免疫反应。
已经从硬骨鱼(teleost)中分离了少量的天然抗菌肽,包括从美洲拟鲽(winter flounder)皮肤中分离的pleurocidin(Cole,Weis et al.1997)、从红海Moses sole中分离的pardaxin(Oren and Shai 1996)、从泥鳅中分离的misgurnin(Park,Lee et al.1997)、从八目鳗鱼中分离的HFA-l(Hwang,Seoet al.1999)、从杂交条纹石鮨嗜酸性粒细胞中分离的piscidin(Silphaduangand Noga 2001)、从杂交条纹石鮨分离的moronecidin(Lauth,Shike et al.2002)、鲶鱼的组蛋白2A降解产物parasin(Park,Park et al.1998)以及一些鲤鱼(LeMaitre,Orange et al.1996)和鲑鱼(Smith,Fernandes et al.2000)的未进行特征鉴定的黏液性分泌物。此外,还有从鲨鱼(海绿角鲨)中分离的阳离子类固醇抗生素角鲨胺(squalamine)(Moore,Wehrli et al.1993)。
已经在昆虫的脂肪体和软体动物和甲壳类动物的血淋巴中发现了defensin家族的富含半胱氨酸的抗菌肽。它们同样可从各种哺乳动物的上皮细胞以及诸如中性粒细胞和巨嗜细胞的循环细胞中分离。最近,从血液的超滤液(Krause,Neitz et al.2000)、人的尿道(Park,Valore et al.2001)以及细菌刺激(challenged)的杂交条纹石鮨的鳃(Shike et al.2002)中分离了小分子富含半胱氨酸的肽,其表现出抗各种真菌、革兰氏阳性及革兰氏阴性菌的抗菌特性。这些称为hepcidin或LEAP-1(肝表达抗菌肽)的肽已被认为是在脂肪体中由感染诱导的昆虫肽的脊椎动物对应体(Park,Valore et al.2001)。
抗菌肽具有多种潜在的用途(参见例如Hancock的US 6,288,212)。鉴定抗菌肽的常规方法包括从组织或分泌物中进行生物化学提纯。对组分进行抗菌活性的检测,并随后对具有活性的纯化的肽进行测序。这种方法费时费钱并且不适合鉴定低含量或难以纯化的抗菌肽。
因此,本发明的目的是提供一种鉴定潜在的抗菌肽的方法。
发明概述
一方面,本发明提供一种鉴定编码抗菌肽的候选核酸序列的方法,所述的方法包括:
a)鉴定感兴趣的起始肽;
b)鉴定编码所述起始肽的基因组DNA;
c)鉴定位于所述起始肽的每一侧的侧翼序列(flanking sequence);
d)获得与所述侧翼序列互补的引物;及
e)大范围筛选核酸序列来鉴定能够通过使用步骤d)的所述引物来扩增的候选序列。
一方面,本发明提供hepcidin样肽的核苷酸及推导的氨基酸序列。
另一方面,本发明提供pleurocidin样肽的核苷酸及推导的氨基酸序列。
另一方面,本发明提供适合用于鉴定、分离和/或扩增编码新的微生物肽的核酸序列的引物。
另一方面,本发明提供鉴定编码抗菌肽的核酸序列家族的方法。
附图的简要说明
图1所示为美洲拟鲽的pleurocidin WF2 cDNA的文本与图解描述(A),预测的肽WF2疏水区(plot)的图示(B)及预测的WF2的螺旋结构的示意图(C)。
图2所示为某些hepcidin样cDNA扩增结果。
图3所示为某些对齐的pleurocidin样肽序列。
图4所示为某些pleurocidin样基因组序列的PCR扩增结果。
图5所示为延伸的WF4基因组序列。
图6所示为某些对齐比较的pleurocidin样多肽序列。
图7所示为在不同美洲拟鲽组织中的某些pleurocidin样基因表达的结果。
图8所示为美洲拟鲽发育中某些pleurocidin表达的RT-PCR结果。
图9所示为美洲拟鲽发育中某些pleurocidin样基因表达的研究结果。
图10所示为美洲拟鲽的某些pleurocidin基因的Southern分析结果。
图11所示为美洲拟鲽的某些pleurocidin基因的基因组构成示意图。
图12所示为位于美洲拟鲽的pleurocidin基因上游的某些转录因子结合位点的示意图。
图13所示为显示肽NRC-15对细菌活存影响的结果。
图14所示为显示肽NRC-13对细菌活存影响的结果。
图15所示为显示肽NRC-12对酵母活存影响的结果。
图16所示为编码I型hepcidin的未拼接(A)和部分拼接(B)cDNA核苷酸序列以及人、小鼠和鲑鱼中的hepcidin基因内含子/外显子的结构示意图(C)。
图17所示为对齐比较的来自不同物种的某些hepcidin序列。
图18所示为对齐比较的美洲拟鲽(A)和大西洋鲑鱼(B)的hepcidin基因的某些3′非翻译区。
图19所示为不同鱼类的某些hepcidin的Southern杂交分析结果。
图20所示为在美洲拟鲽的不同组织中的某些hepcidin和肌动蛋白(actin)基因表达的分析结果。
图21所示为在对照和感染的鲑鱼的不同组织中的某些I型(a)和II型(b)hepcidin和肌动蛋白基因表达的分析结果。
图22所示为发育中的美洲拟鲽幼鱼中的某些I型(A)、II型(B)、III型(C)hepcidin和肌动蛋白(actin)基因表达的分析结果。
图23所示为所述鉴定pleurocidin的方法的实施方案中采用的步骤的示意图。
图24所示为所述鉴定hepcidin的方法的实施方案中采用的步骤的示意图。
图25所示为在150mM NaCe存在下使用抗菌肽NRC-13的试验结果。
发明的详细说明
本发明方法建立在如下惊人的发现之上,即抗菌肽(包括但不限于pleurocidin和hepcidin)周围的侧翼序列是保守的。本发明的方法提供了鉴定编码pleurocidin和hepcidin的核苷酸序列以及鉴定被编码的多肽序列的手段。
在一个实施方案中,一般来说,所述的方法提供了一旦鉴定了一个家族成员,就能鉴定该抗菌肽家族多个成员的途径。起始的家族成员可以是感兴趣的起始肽。能够根据已知或是报道的抗菌活性或根据与其它已知抗菌肽的序列相似性来鉴定感兴趣的起始肽。一旦鉴定了起始肽,就可鉴定编码该起始肽的基因组DNA,且可确定其侧翼序列。
本文所用术语“侧翼序列”是指位于或接近(at or near)编码抗菌肽的靶核酸序列的一个或两个末端的核酸序列。
本文所用的核酸序列“位于或接近”靶序列的末端,如果所述序列部分位于所述基因末端的50个核酸之内(无论在编码区之内或之外)。
当根据与具有已知抗菌活性的另一个肽的相似性,鉴定感兴趣的起始肽时,所述的起始肽优选具有两性结构和净电荷。在一些例子中,所述的电荷优选至少为2的净正电荷。在一些例子中,所述的肽与具有已知抗菌活性的肽有至少75%、85%或95%的序列同一性。在一些例子中,鉴定得到的序列相似性可与编码所述已知肽的核酸序列与编码所述感兴趣肽的核酸序列间的相似性有关。在这些例子中,可根据预测的电荷和两性结构来考虑所述感兴趣肽的预测肽。
例如,pleurocidin和hepcidin的前原(prepro-)序列倾向于保守。因此,通过使用对这种序列特异的核酸引物,可鉴定潜在的pleurocidin-和hepcidin-编码序列。可选择地或另外地,可检查其它种类的抗菌肽的已知基因序列来鉴定表现为编码保守前原序列的区域,并可使用相似的策略来鉴定这一肽家族的其它成员。由这种序列编码的对应的抗菌肽可使用在多数pleurocidin和hepcidin中发现的普遍特性来预测,例如,至少为2的净正电荷和两性结构。
对于本文所用的抗菌肽的前(pre-)、原(pro-)及前原(prepro)序列,“前”和“原”具有以下的含义:“前”指所述肽的信号肽部分(或其功能部分)。“原”指原片段(propiece)。在pleurocidin中,所述的原片段为位于羧基末端的阴离子区域。在hepcidin中,所述的原片段指成熟肽的上游区域。在本文公开的非限制性实施例中,根据其前和原区域设计pleurocidin引物,以及根据其前区域和3’非翻译区(UTR)设计hepcidin引物。
可通过PCR来扩增编码潜在pleurocidin或hepcidin的核酸序列。这可常规地通过使用一对PCR引物来实现,其中一个引物识别与编码氨基末端前原序列的多核苷酸序列互补的核酸序列,其中所述前原序列在所述感兴趣的肽类型中保守,另一个引物与编码所述感兴趣的肽类型的核苷酸的3’保守区互补。应该理解,可以存在其它前原序列,并对其进行特别地考虑。例如,遗传密码的冗余使得多种核酸序列可编码一种特定的氨基酸序列。如对5’前原序列的论述中所述,可存在其它的3’保守序列并可对其进行特别地考虑。当设计引物时,参考预对其序列进行序列扩增种类的已知密码子使用信息是有用的。
本发明的一个实施方案中,提供了信号序列I或编码此序列的核酸序列在鉴定或扩增潜在的pleurocidin中的用途。
信号序列I
MKFTATFL(X)n(L)o(F)pI(F)q(X)yVLM(X)z(V)r(E)s(D)t(P)u(L)vGE(C)w(G)x
其中:
n为1-3 u为0或1
o为0-2 v为0或1
p为0或1 w为0或1
r为0或1
s为0或1 x为0或1
t为0或1 y为0或1
z为0或1
并有如下的限定:
x+o+p=3, s+t=1,
u+v=1, w+x=1,及
q+=1。
本发明的实施方案中,提供了序列PL1或PL2中一个或两个或者编码该序列的核酸序列在鉴定或扩增潜在的pleurocidin中的用途。
PL1 GCCCACTTTGTATTCGCAAG
PL2 CTGAAGGCTCCTTCAAGGCG
本发明的实施方案中,提供了酸性序列I或编码该序列的核酸序列在鉴定或扩增潜在的pleurocidin中的用途。
酸性序列I
(Y)a(X)b(X)c(E)d(X)e(Q)f(E)gL(N/D)KR(A/S)VD(D/E)
其中:
a为0或1 e为1-3
b为0或1 f为0或1
c为1或2 g为0或1
d为0或1
并具有如下限定:
a+b=1,
c+d=2,及
e+f+g=3。
本文所述序列中所使用的“X”指任意氨基酸。特别考虑编码信号序列I和酸性序列I的核酸序列,同时也考虑与这类核酸序列互补的核酸序列。
本发明的实施方案中,提供了信号肽II、III、IV、V或编码所述肽的核酸序列在鉴定或扩增hepcidin中的用途。
信号肽II
MKXXXXAXXVXXVL
信号肽III
MKTFSVAV
信号肽IV
MKTFSVAVTVAVVLXFICIQQSSA
信号肽V
MKTFSVAVAV(T/V)(L/V)VLA(F)n(V/C)(C/M)(I/F)(Q/I)X(X)mS(S/T)AVPFXXV,
其中n为0或1以及m为0或1。
本发明的实施方案中,提供了原序列I、原序列II或编码所述序列的核酸序列在鉴定或扩增hepcidin中的用途。
原序列I
PEVQXLEEAXSXDNAAAEHQE
原序列II
PFXXVX(X)n(L/T)EEV(E/G)(G/S)XD(T/S)PV(A/G)XHQ,
其中n为0或1,
本发明的一个实施方案中,提供了HcPA3b3’和/或HcSal3’序列或编码所述序列的核苷酸序列或与编码所述序列的核酸序列互补的序列在鉴定或扩增hepcidin中的用途。
HcPa3b3’ 3’ACAACCTCGTCCTTAGG5’
HcSal3’ 3’ACGCCCGTCCAGGAAT5’
用途的非限定性示例
抗菌肽可用于对多种个体的感染进行治疗和/或预防,这些个体包括鱼、爬行类、鸟类、哺乳动物、两栖类及昆虫。
抗菌肽同样还可用于减少细菌在表面的生长和/或积累。这对食品工业特别有益,其中抗菌肽可用于包被食品加工、制备和/或包装中使用的各种表面。
本文公开的抗菌肽可以各种途径给药。在一些例子中,口服给药是较理想的。通过包被所述的肽来改进一些类型的口服给药,从而使其在特定的消化阶段优先释放。在一些例子中,在给药的肽中包括前和/或原序列是较理想的(例如改进稳定性或调节活性)。所述的前和/或原序列在适当的阶段能够被内源性蛋白酶降解。当所述个体呼吸空气或对有鳃个体通过加入到水中,肽可通过吸入途径给药。在一些情况下注射给药是较理想的。肽可注射到任何数量的位点中。在一些情况下,静脉内注射是较理想的。在一些例子中,直接注射到感染或潜在感染位点或其附近是较理想的。在一些例子中,局部给药是较理想的。当抗菌肽最好位于远处或特定的位点时,或当所述肽最好能持续一段时间时,可采用基因治疗提供一种或多种抗菌肽在相关组织中的表达。
当所述的个体是饲养或驯养生物例如鱼、鸟类或非人哺乳动物时,生产可表达一种或多种抗菌肽的转基因品种是较理想的。生产转基因动物的方法是公知的(参见例如Mar.Biotechnol.4:338,2002)。
本发明涉及了多种抗菌肽,并且这些抗菌肽均属于本发明的保护范围。作为非限定性的例子,特别考虑包括下列氨基酸序列或与其具有至少80%或90%同源性的序列的肽,以及编码它们的核酸序列:
i)GW(G/K)XXFXK
ii)GXXXXXXXHXGXXIH
iii)FKCKFCCGCCXXGVCGXCC
iv)CXXCCNCC(K/H)XKGCGFCCKF
v)FKCKFCCGCRCGXXCGLCCKF
vi)XXXCXXCCNXXGCGXCCKX
其它的感兴趣的抗菌序列的特定的非限定性的例子可参见表4和表11。
可对本发明的抗菌肽进行修饰。在一些例子中,这种修饰可改进所述肽的稳定性或活性。可特别考虑的修饰的例子包括:
-保守氨基酸的替代(酸性替代酸性、碱性替代碱性、中性替代中性、极性替代极性、疏水替代疏水等等)
-在一端或两端加入带正电的氨基酸(赖氨酸、精氨酸、组氨酸)
-用其它不太可能引起结构变化的氨基酸进行氨基酸替代,包括D-氨基酸和缩氨酸拟态物(peptidemimetics)
-一个或多个氨基酸的缺失
-C-末端或N-末端的修饰,包括甲酯和酰胺化
-所述肽的环化形式(其可导致稳定性增加但对活性没有负面影响)
实施例-方法
鱼的饲养
如所述(Douglas,Gawlicka et al.1999)对美洲拟鲽进行饲养,该公开在此引用作为参考。在Halifax,Nova Scotia的Dalhousie大学的Aquatron设备(facility)中,将圣约翰河血统(stock)的大西洋鲑鱼(Salmo salar L.)维持在单程、加热、脱氯的12℃新鲜水中。在取样前,所有的鱼用过量的三卡因(tricaine)甲磺酸盐(MS 222,0.1g L-1,Argent Chemical Laboratories,Inc.,Redmond,WA,USA)安乐死(euthanised)。所有的动物处理过程均经Dalhousie大学实验室动物委员会、国家研究理事会-Halifax地区动物关怀理事会批准。
细菌的刺激
在17℃、胰酶大豆肉汤(Tryptic Soy Broth,TSB)中,将杀鲑气单胞菌杀鲑亚种(Aeromonas salmonicida subsp salmonicida)株A449(Trust et al.1983)培养到对数生长中期。检测细菌悬液600nm处的光吸收并在无菌Hanks平衡盐溶液(HBSS)中将该细菌重悬至约5×107cfu mL-1。用50mgL-1 TMS麻醉3条鲑鱼(每条200g),用50μL HBSS中的2.5×106cfu细菌腹腔注射并使其在新鲜的水中恢复。来自相同种群的未注射的鱼维持在分开的池子中作为对照。注射后3天,如上述将对照和注射的鲑鱼实施安乐死并采集组织样本。从臀静脉采集血液并放入肝素化的容器中。为了肯定所述的鱼为杀鲑气单胞菌阳性,对感染和对照鱼的肾脏后叶(posterior kidney)进行擦拭并接种于胰酶大豆琼脂(tryptic soy agar,TSA),在室温下培养过夜。从Dartmouth,Nova Scotia Bedford海洋学研究所进行的细菌刺激研究中获得大西洋大比目鱼(halibut)的组织样本。
采样
采集组织(食管、胃、幽门盲肠、肝、脾脏、肠、肾脏前叶(anteriorkidney)、肾脏后叶、鳃、皮肤、卵巢、直肠、心、肌肉及脑)并放入RNALater(Ambion,Austin,TX,USA)中,保存在-80℃直到使用。在RNALater(Ambion,Austin,TX,USA)中漂洗不同阶段的幼年期美洲拟鲽和青少年期美洲拟鲽的样本,然后转移至含有0.5-1.25ml RNALater的1.5mlEppendorf管中,保存在-80℃直到使用。
Pleurocidins
以下的常规方法如图24所示。
pleurocidin cDNA的分离
使用简并寡核苷酸(PleuroA,PleuroB;表1)来筛选构建自美洲拟鲽皮肤的cDNA文库(Gong et al 1996)。将该文库以80,000噬菌体/板进行接种,并且由8块板中的每一块构成HyBond过滤器上的复制本。利用常规的步骤在50℃将放射性末端标记的PleuroA和PleuroB探针的混合物与所述的滤器杂交,并将所述的过滤器以1XSSC/0.1%SDS在50℃洗涤45min。在两个重复的过滤器中显示匹配杂交信号的斑块被选取,并重新筛查所述文库直到获得100%纯度的重组斑块。使用ABI373延伸自动测序仪和AmpliTaqF S Dye Terminator Cycle S equencing Ready反应试剂盒(Perkin-Elmer,Foster City,CA,USA)对两种重组体进行完全测序。利用Sequencher(Gene Codes,Inc.,Ann Arbor,MI,USA)和DNA Strider对序列资料进行分析。利用SignalP(http://www.cbs.dtu.dk/services/SignalP)对氨基末端信号序列进行预测。用GCG包(http://www.gcg.com)的螺旋轮规则(Helical Wheel routine)来模建所预测的抗菌肽序列的螺旋结构。
基因组PCR
使用对美洲拟鲽pleurocidin cDNA特异的两组引物(PL1/PL2和PL5’/PL3’;见表1;图1)来扩增基因组序列。扩增的条件为:94℃、1min;94℃、30s,52℃、30s,72℃、90s,共35循环;及72℃、2min,将产物加到1%琼脂糖凝胶中。从所述的凝胶中切下条带,根据厂商提供的说明书利用Gene-Clean(Bio101,La Jolla,CA,USA)对其进行提取并克隆至Topo TA2.1载体(Invitrogen,Carlsbad,CA,USA)上。如上所述,对来自每个转化的多个分离进行测序和分析。通过与所述的cDNA序列比较来确定内含子的位置。
通过RT-PCR鉴定其它的美洲拟鲽pleurocidin样序列
基本上根据Douglas,Gawlicka等(1999)所述,从美洲拟鲽皮肤和肠中分离总RNA。根据厂商提供的说明书,利用RETROScript试剂盒(Ambion,Austin,TX,USA)进行2μg总RNA的反转录。使用PL3’和对应所述前驱多肽氨基末端的引物(PL5’;表1)来进行PCR。所述扩增的条件为:94℃、1min;94℃、30s,50℃、30s,72℃、90s,共32循环;及72℃、2min,将产物加到2% NuSeive凝胶中。如上所述进行条带的切胶、克隆和测序。
不同组织的其它的pleurocidin样序列的鉴定
利用来自成年皮肤、肝、卵巢、肌肉、脾、幽门盲肠、胃和肠的多聚腺苷酸RNA(500ng),通过Northern分析对pleurocidin的组织特异性表达进行了研究。来自对应WF2的cDNA克隆的全部插入被放射性标记并与印记在60℃和UltraHyb杂交溶液(Ambion,Austin,TX,USA)中孵育过夜。在暴露于X光底片之前,将该印记在50℃和1X SSC/0.1% SDS中的严格条件下洗涤1h。使用对WF1、WF1a、WF2、WF3、WF4、WFYT和WFX(表2)特异的引物,采用RT-PCR来分析各种组织中不同pleurocidin样变体的表达。除退火温度为52℃外,所用的条件如前一段落所述。不同发育阶段的其它的pleurocidin样序列的鉴定
利用两套幼年期时间系列来评价发育过程中Pleurocidin样基因的表达。在第一系列中,从20条全幼鱼(5和13dph)、10条全变态(metamorphosing)幼鱼(20dph)及新变态幼鱼(27dph)的联合(pooled)样本,两条青少年期鱼(41dph)的内脏组织,成年鱼上下侧的皮肤以及成年鱼上下肠组织中分离RNA。根据所述(Douglas,Gawlicka et al.1999)分离RNA,该公开在此引用作为本文的参考,并且使用引物PL5’和PL2以及上述RT-PCR的条件进行分析。为确认看家基因表达的稳定水平及提供pleurocidin表达的内对照,根据前述(Douglas,Bullerwell et al.1999)来扩增肌动蛋白mRNA,该公开在此引用作为本文的参考。在第二幼鱼时间系列中,从20条全幼鱼(孵化,5和9dph)、10条全幼鱼(15、20、25、30及36dph)的联合(pooled)样本,两条青少年期鱼(41dph)的内脏组织中分离RNA。使用对WF1、WF1a、WF2、WF3、WF4、WFYT及WFX(表2)特异的引物进行分析来检测不同发育阶段的不同pleurocidin样变体的表达。其条件如上段所述。
Southern分析
对美洲拟鲽、三种其它比目鱼(拟庸鲽Hippoglossoides platessoidesFabricius,大西洋大比目鱼Hippoglossus hippoglossus L.及美洲黄盖鲽Pleuronectes ferruginea Storer)、黑线鳕鱼(Melanogrammus aeglefinus L.)、鳕鱼(Pollachius virens L.)及胡瓜鱼(Osmerus mordax Mitchill)的BamHI-和SstI-酶切的基因组DNA,使用源自对应WF1、WF2、WF3和WF4的基因组克隆的全插入作为探针,顺序进行Southern分析。如前所述(Douglas,Gallant et al.1998),在65℃杂交过夜,该公开在此引用作为本文的参考,并将印记在65℃和0.5X SSC/0.1% SDS中洗涤1h,随后暴露于X光底片。通过在沸腾的0.5% SDS中孵育两次对印记进行剥离,并通过暴露于X光底片过夜来检查残余的信号。
其它鱼类其它的pleurocidin样序列的鉴定
从美洲黄盖鲽、美首鲽(witch flounder)、大西洋大比目鱼的皮肤和肠中分离总RNA,并如上所述进行反转录(RT-PCR分析)。从美洲黄盖鲽、美首鲽、拟庸鲽(American plaice)、大西洋大比目鱼的雄鱼生殖腺,及Petrale鲽鱼、C-O鲽、英吉利鲽、箭齿鲽(Starry flounder)、欧洲鲽鱼(plaice)、格陵兰大比目鱼及太平洋大比目鱼组织样本中分离总基因组DNA。使用对美洲拟鲽pleurocidin cDNA特异的两组引物(PL1/PL2和PL5’/PL3’;见表1;图1),且扩增的条件为:94℃、1min;94℃、30s,50℃、30s,72℃、90s,共32循环;及72℃、2min。将产物加到2% NuSeive凝胶中,如上所述进行条带的切胶、克隆和测序。
图1为美洲拟鲽的pleurocidin WF2的文本和图解描述。图A为从皮肤库中分离来自美洲拟鲽的pleurocidin的cDNA核酸序列。用于PCR的引物位置用下划线给出,推导的氨基酸序列在核酸序列下方用大写字母显示。箭头显示为pleurocidin肽的成熟的5’和3’末端、菱形显示内含子位置。粗体显示单一的SstI限制性内切酶位点(GAGCTC)和假定的多聚腺苷酸位点(aataaa)。图b为使用DNA Strider(Marck 1992)的Kyte-Doolittle选项构建的预测pleurocidin多肽WF2的疏水区(plot)。由垂直的箭头显示了所述成熟的pleurocidin的边缘。图c.为通过GCG的螺旋轮法则构建的预测pleurocidin多肽WF2的螺旋结构的示意图。疏水残基和甘氨酸残基为盒状(boxed)而极性残基不是。发现所述成熟多肽的第一氨基酸(G)位于轮的顶端。
美洲拟鲽基因组中pleurocidin样序列的鉴定
使用对pleurocidin(WF2;Douglas et al.,2001)的放射性标记探针来筛查美洲拟鲽基因组λ-GEM文库。收集四个克隆并不断重复直到获得100%纯度。使用BamHI、SstI、XhoI及EcoRI对克隆作图,选择两个限制性图形不同的克隆(λ1.1和λ5.1)进行测序。使用ABI373延伸自动测序仪和AmpliTaqFS Dye Terminator Cycle Sequencing Ready反应试剂盒(Perkin-Elmer,Foster City,CA,USA)对两个克隆进行完全测序。利用WWW Signal Scan(http://bimas.dcrt.nih.gov/molbio/signal/)结合TransFac和TFD数据库对转录因子结合位点进行鉴定,并且通过Baylor医学院(http://searchlauncher.bcm.tmc.edu/seq-search/gene-search.html)提供的神经网络软件的真核启动子预测来检测启动子。
Hepcidins
以下的常规方法如图24所示。
Hepcidin cDNA的分子特性化
从美洲拟鲽EST数据库(Douglas,Gallant et al.1999)中鉴定了8条,从大西洋鲑鱼数据库(Douglas,Tsoi et al.2002)中鉴定了4条与人hepcidin具有高度相似性的EST序列。使用这些序列筛查dbEST,BLASTX分析显示来自日本牙鲽的两条相关序列(C23298.1和C23432.1),来自彩虹鳟鱼(rainbow trout)的一条序列(AF281354_1)和5条来自青鳉(medaka)的相同序列(AU178966、AU179222、AU179314、AU179768及AU180044)。使用Sequencher(Gene Codes,Inc.,Ann Arbor,MI,USA)和DNA Strider(Marck 1992)进行序列分析。使用ClustalW(Thompson,Higgins et al.1994)计算对齐和相似性矩阵(matrices),并使用SeqVu(Garvan 1996)进行图形可视化。使用在线服务器PSORT(http://PSORT.nibb.ac.jp)、Compute PI(http://expasy.hcuge.ch/cgi-bin/pitool)、及网络蛋白序列分析(http://npsa-pbil.ibcp.fr/cgi-bin/secpred consensus.pl)来分别预测N末端信号序列、pI和二级结构。所述的二级结构预测程序使用七种不同的算法(详细资料参见相关网站)并根据这些结果提供一致预测。
Southern杂交
从美洲拟鲽(Pleurofzectes americanus)、美洲黄盖鲽,(Pleuronectesferruginea)、美首鲽(Glyptocephalus cynoglossus)、日本牙鲽,(Paralichtllysolivaceus)、拟庸鲽(Hippoglossoides platessoides)、大西洋鲑鱼(Salmosalar)、黑线鳕鱼(Melanogrammus aeglfinus)、胡瓜鱼(Osmerus mordax)、八目鳗鱼(Eptatretus burgeri)、虎鲨(Scyliorhinus torazame)及高首鲟(Acipenser transmontanus)中根据前述(Douglas,Bullerwell et al.1999)制备总基因组DNA,该公开在此引用作为本文的参考。根据厂商的说明书利用SstI消化DNA(7.5μg),将所得片段加入到1%琼脂糖凝胶上。使用DIG标记试剂盒(Roche Applied Science,Laval,PQ,Canada)来标记对应I型美洲拟鲽hepcidin的WMENPT....GCGFCC氨基酸残基的104bp探针,并使用Easy Hyb试剂盒(Roche Applied Science,Laval,PQ,Canada)将其与膜在42℃杂交2h。该膜在0.2X SSC,65℃洗涤并用DIG发光检测试剂盒(Roche Applied Science,Laval,PQ,Canada)检测信号。
通过RT-PCR鉴定其它的hepcidin样序列
根据本研究确定的cDNA序列(表3)来设计引物。为确认看家基因表达的稳定水平及提供hepcidin基因表达分析的内对照,对肌动蛋白mRNA进行了扩增。使用单引物进行对照来排除单一引物的假象及不用反转录来排除从污染的基因组DNA中产生的扩增产物。
根据厂商提供的说明书,利用RNAWiz试剂盒(Ambion,Austin,TX,USA)从未感染的成年美洲拟鲽及未感染和感染的成年鲑鱼和大比目鱼组织中分离总RNA。使用7mm发电机将组织在Polytron标准转子(rotor)定子(stator)研磨器(Kinematica)研磨。此外,从20条全幼鱼(孵化,5和9dph)、10条全幼鱼(15、20、25、30及36dph)的联合样本、两条青少年期鱼(41dph)的内脏组织和成年美洲拟鲽肝脏中分离RNA。为排除污染的DNA,根据指导使用Ambion DNA-freeTM方案。简而言之,将4单位的DNaseI加入到重悬的RNA中,并在37℃孵育1小时。孵育后,加入DNAse失活剂来去除酶,并使用Beckman DU-64分光光度计来检测RNA浓度。
从1μg总RNA中,利用RetroScript试剂盒(Ambion,Austin,TX,USA)合成第一条cDNA链,利用rTaq聚合酶(Amersham Pharmacia Biotech AB,Uppsala,Sweden)或Advantage2PCR试剂盒(Clontech,Palo Alto,CA,USA)对所述反应产物的组分进行PCR。引物和退火温度在表3中列出。扩增条件是:95℃、1min;95℃、15s,所述的退火温度、30s,68℃、30s,共32循环;4℃保存。以100bp梯状物为标准(Gibco BRL,Gaithersburg,MD,USA),将扩增产物加到2% NuSeive琼脂糖凝胶中,并利用GelDoc1000影像凝胶记录(documentation)系统(BioRad,Mississauga,ONT.,Canada)和Multianalyst软件来定量每种产物的含量。
其它鱼类其它的hepcidin样序列的鉴定
从细菌刺激的大西洋大比目鱼和大西洋鲑鱼肝脏和脾脏中分离总RNA,并如上所述进行反转录(RT-PCR分析)。使用两组引物(参见legend,表2),扩增的条件为:94℃、2min;94℃、30s,52℃、30s,72℃、30s,共32循环;及72℃、2min。将产物加到2% NuSeive凝胶中,如上所述进行条带的切胶、克隆和测序。
活性阳离子肽的预测
图3中的成熟肽序列(由从鱼组织扩增的基因和PCR产物的核酸序列推导的pleurocidin样肽序列)构成了序列选择的基础。通常,根据广泛的序列分析,可产生具有净正电荷及模型中有较好分离的亲水和疏水残基的那些肽。尽管有一些假基因包含在成员中,通常还是可使用那些可能被表达的肽基因(具有启动子)。根据以下列出的几种因素来决定准确的起始/终止残基。在多数情况下,由于其直接跟随保守的信号肽区域并与其它成熟肽对齐较好,可较好地确定成熟肽的N-末端。一旦不能对N末端进行直接确定,可在N末端处进行GW或GF的搜寻尝试,因为其常出现在阳离子肽中。此外,可产生两种版本的WF1a(NRC-2和NRC-3):一种含有N末端GRRKRK,而另一种不含有。在某些情况下,因为其后直接跟随有保守的酸性原片段,也可较好地确定成熟肽的C末端。但在许多肽中C末端氨基酸明显不准确。通常确定C末端氨基酸须遵循以下两条法则:(1)一旦甘氨酸出现在C末端或其附近,就认为其是羧基末端酰胺化合物的前体;(2)在C末端附近有大量的负电荷氨基酸通常认为是原片段的一部分而不是成熟的活性肽,而且不包括在所述序列中。
本研究使用的所有的抗菌肽是在英属哥伦比亚大学核酸蛋白服务中心(NAPS)通过N-(9-芴基)甲氧基羰基(Fmoc)化学合成的。肽序列如表4所示。在每种情况下通过HPLC和质谱分析来确定肽的纯度。对NRC-7通过RP-HPLC作进一步纯化直到获得同质的样品。
菌株和白色念珠菌(Candida albicans)
本研究使用的菌株全部列在表5中。大多数非鱼类菌株和Candidaalbicans在37℃生长在Mueller-Hinton肉汤(MHB;Difco Laboratories,Detroit)中,而鱼类细菌保存在16℃胰酶大豆肉汤(TSB;Difco,5g/l NaCl)中。所有菌株储存在-70℃直到融化使用,并每天进行次培养。以下菌株由英属哥伦比亚大学的R.E.W.Hancock教授惠赠:铜绿假单胞菌(Pseudomonas aeruginosa)K799(Z61的母体)、铜绿假单胞菌Z61(抗生素超级易感),伤寒沙门菌(Salmonella typhimurium)14028s(MS7953s的母体)、伤寒沙门菌MS7953s(defensin超级易感)、以及表皮葡萄球菌(Staphylococcus epidermidis)(人类临床分离)和耐甲氧西林金黄色葡萄球菌(methicillin-resistant Staphylococcus aureus)(MRSA;由英属哥伦比亚大学A.Chow博士分离)。
大肠埃希菌(Escherichia coli)株CGSC4908(his-67,thyA43,pyr-37),胸苷、尿苷和L-组氨酸营养缺陷型(Cohen et al.,1963)由E.coli遗传储存中心(耶鲁大学,New Haven,CT)免费提供。除非特别声明,用补充5mg/L胸苷、10mg/L尿苷和20mg/LL-组氨酸的MHB(Sigma Chemical Co.,St.Louis,MO)来生长E.coli CGSC 4908。
鲑鱼(salmonid)病原体Aeromonas salmonicida的两种区域隔离种群(field isolate)来自IMB菌株贮藏中心。
最小的抑制浓度
利用由Wu和Hancock(1999)改进的Amsterdam(Amsterdam,1996)的微滴定肉汤稀释方法,通过测定最小抑制浓度(MIC)来确定所述抗菌肽的活性。在96孔聚丙烯(Costar,Coming Incorporated,Coming,New York)微滴定板中进行肽的系列稀释。如上所述,将细菌或C.albicans生长过夜达到中期对数生长阶段,并稀释形成106cfu/ml的最终接种体浓度。向96孔板中每孔加入细菌或酵母的悬浮液,并在适合的温度下孵育过夜。对于E.coli CGSC 4908,使用附加成分的MHB。将抑制定义为生长少于或等于在对照孔(没有肽加入)中观察到的生长状态的一半。每一MIC测定重复三次。
杀灭分析
通过标准方法学,检测暴露于最小抑制浓度(MIC)和10倍其MIC的所选择肽的细菌和C.albicans的活存。试验的生物体生长在MHB中并暴露在所述的肽中。在特定的时间间隔从培养物中取出相等的份数,接种在含MHB培养板,计数所产生的克隆。将百分比活存对时间以对数刻度作图。每个试验重复两次。
合成的抗菌肽的制备
活性阳离子肽序列的预测
图3(由从鱼类组织中扩增的基因和PCR产物的核酸序列推导的pleurocidin样肽序列)中的成熟肽序列构成了序列选择的基础。
针对肽作出的序列选择,所述肽具有净正电荷且在模型中含有空间分离较好的亲水和疏水残基,所述模型通过如下特别制备:
a)为估计正电荷,设K和R值为+1、H为+1/2、D和E为-1,并且C末端酰胺化合物计数为附加+1。
b)用NRC镜像网址(http://bioinfo.pbi.nrc.ca:8090/EMBOSS/index.html)提供的EMBOSS Pepwheel和Pepnet互联网工具来分析螺旋轮和螺旋网模型中亲水和疏水残基的分离。
此外,尽管假基因也包括在这些成员中,通常产生可能被表达(具有启动子、可被转录等)的那些肽基因。
根据几个因素来决定准确的起始/终止残基:
a)在多数情况下,由于其直接跟随保守的信号肽区域并与其它成熟肽对齐较好,可较好地确定成熟肽的N-末端。
b)一旦不能直接确定N末端,可在N末端处进行GW或GF的搜寻尝试,因为其常出现在阳离子肽中。
c)此外,产生了两种版本的WF1a(NRC-2和NRC-3):一种含有N末端GRRKRK,而另一种不含有;因为有假说认为带高度正电荷的GRRKRK可改进活性,因此进行该步骤。
d)尽管在某些情况下,因为其后直接跟随有保守的酸性原片段,因此也可较好地确定成熟肽的C末端,但在许多肽中C末端氨基酸存在明显的不准确性。通常在确定C末端氨基酸时须遵循以下两条法则:
(1)一旦甘氨酸出现在C末端或其附近,就认为其是羧基末端酰胺化合物的前体;
(2)在C末端附近有大量的负电荷氨基酸通常认为其是原片段的一部分而不是成熟的活性肽,而且不包括在所述序列中。
通过标准方法,体外筛查根据上述步骤产生的肽的抗菌活性。在体外表现抗菌活性的那些肽可用作体内使用和用于表面治疗等的抗菌肽。
实施例-结果
Pleurocidins
cDNA序列
从所述的皮肤cDNA文库中分离的2个克隆其序列相互一致,并在去除内含子后与基因组PCR产物WF2一致(如下)。它们含有356bp并编码68个氨基酸的开放读码框架(图1a)。除了polyA尾,存在26bp的5′-非翻译区和84bp的3′-非翻译区。在polyA尾上游22bp发现规范的(canonical)多聚腺苷化信号AATAAA。所述的开放读码框架的前22个氨基酸形成高度疏水区(图1b),预测为有切除位点的信号肽,其准确地与所述的成熟pleurocidin的氨基末端匹配。所预测的23-47个残基氨基酸序列准确地与发表的成熟pleurocidin氨基酸序列匹配(箭头,图1a)。所述的成熟肽能够呈现两性螺旋,其在一个表面以带正电荷的氨基酸为主,而另一面以疏水氨基酸为主(图1c)。
羧基末端21个氨基酸形成负电荷区,其不出现在成熟的pleurocidin中,肯定了Cole et al.(2000)最近的报道。
基因组PCR
使用引物PL5′和PL3′扩增了四条不同的条带(WF1-4)(图4)。每种产物的序列分析结果与条带的大小一致并证实每种扩增产物是不同的(表6)。使用引物PL1和PL2扩增了两条不同的条带分别对应WF2和WF4,其含有附加的上游和下游序列(数据未显示)。当去除内含子序列后,WF2序列可准确地与分离自所述皮肤文库的pleurocidin cDNA克隆匹配(图1a)。
图4为美洲拟鲽基因组DNA的pleurocidin样序列PCR扩增结果的描述。将扩增产物(P)加到1%琼脂糖凝胶并使用100bp梯状带作为分子量标准(M)。可见的不同条带产物标为WF1(00bp)、WF2(810bp)、WF3(650bp)和WF4(510bp)。
所有四种pleurocidin样基因在编码序列中含有两个内含子,并且三个基因显示一致的内含子位置(WF1、WF2和WF4)。然而,WF3中的第二内含子位置出现在其它基因的内含子位置上游,产生较短的第二外显子和较长的第三外显子。四种pleurocidin基因中的内含子大小和序列各不相同(表6)。使用引物PL1和PL2从两个更广泛的基因组序列WF2和WF4获得的证据表明第三内含子紧靠并位于起始密码子上游也是这一基因家族的特征(图5)。这也证明了Cole et al(Cole,Darouiche et al.2000)报道的基因组序列。
对齐的预测氨基酸序列如图6所示。通过与对应的RT-PCR和cDNA衍生序列比较确定了内含子的位置(垂直箭头所示)。通过与发表的pleurocidin氨基酸序列(Cole,Weis et al.1997)比较,确定了成熟肽的位置。与图1c所示相似,所有预测的成熟肽呈现两性α螺旋结构,尽管WF1和WF3中的带正电荷部分不如WF2和WF4中的那样明显(数据未显示)。
图5描述了使用引物PL1/PL2通过PCR获得的WF4扩展基因组序列。内含子以小写字母显示而编码序列以大写字母显示。下划线部分为用于PCR的引物PL1和PL2的位置。
图6描述了对齐的5种美洲拟鲽pleurocidin家族成员预测的多肽序列。大的垂直箭头显示为在基因组序列中发现的内含子位置。由小的垂直箭头显示的WF3的第二内含子,比其它基因的那些更位于上游。dermaseptin B1(Amiche et al.1994)和ceratotoxin B(Marchini et al.1995)的预测多肽序列显示在pleurocidin家族成员的下面。框中的氨基酸由一半的序列共享。
从不同组织中来源的其它pleurocidin样序列的鉴定
Northern分析只能测定皮肤中的pleurocidin转录本(数据未显示)。但更加敏感的RT-PCR分析表明pleurocidin还表达在其它组织中,特别是鳃和内脏中。使用引物PL5′和PL3’,可从美洲拟鲽皮肤中获得两条带(265和175bp),从肠中获得两条(215和175bp)。每种大小的多个克隆的序列分析显示当去除内含子序列后,265bp美洲拟鲽皮肤克隆对应WF1基因组序列(表7)。从皮肤来源的5个175bp的克隆和从肠来源的两个175bp克隆对应WF2基因组序列。这与使用对应WF2探针的cDNA克隆的Northern分析结果一致,所述探针只对来自皮肤的200-核苷酸的mRNA显示杂交(数据未显示)。另一方面,来自肠中的9个175bp克隆和来自皮肤的4个175bp克隆对应WF3的基因组序列。没有获得对应WF4的RT-PCR产物。所有7个215bp肠克隆对应新的家族成员(WF1a),其不能由任何该研究所确定的美洲拟鲽基因组序列表示。
使用对每种如上述报道的pleurocidin样变体以及在Lambda克隆中鉴定的其它pleurocidin样变体特异的引物,可证明在不同组织中有不同的变体表达(图7)。WF2、WF3和WFYT的表达在组织中分布最广,而WF1和WF4主要在内脏和皮肤中表达,WFX只在皮肤中表达。不能在任何组织中检测到WF1a的转录本。
图7描述了不同美洲拟鲽组织中特异pleurocidin样基因的表达。组织为食管(E)、幽门胃(PS)、心脏胃(CS)、幽门盲肠(PC)、肝(L)、脾脏(SP)、肠(I)、直肠(R)、鳃(G)、脑(B)和皮肤(SK)。分子量标准(M)为100bp梯状带。引物对每种pleurocidin变体均特异(表2)。
不同发育阶段的其它的pleurocidin样序列的鉴定
使用来自pleurocidin样肽的高度保守区的引物PL5′和PL2(表1),显示在5dph时有低水平的转录并在发育中增加(图8)。从成年皮肤中获得较强的信号而在肠组织中信号较弱。看家基因actin的表达在整个发育过程中相对不变。
使用对每种如上述报道的pleurocidin样变体以及在Lambda克隆中鉴定的其它的pleurocidin样变体特异的引物,证明在发育过程中的不同时间有不同变体的表达(图9)。只在20dph时检测到WFX转录本,在变态前(premetamorphic)幼鱼和变态青少年期鱼中检测到WF2、WF3和WFYT,在发育的任何阶段均没有检测到WF1和WF4。
图8所示为pleurocidin表达的反转录聚合酶链式反应分析。样本来自幼鱼(5和13dph)、变态(metamorphosing)幼鱼(20dph)及新变态幼鱼(27dph)、青少年期鱼(41dph),皮肤来自鱼的下侧(LS)和上侧(US),组织来自鱼的上(UI)下(LI)肠。使用pleurocidin(组A)和actin(组B)特异引物。
图9描述了在美洲拟鲽幼鱼发育中的特异pleurocidin样基因的表达。样本来自幼鱼(5、9和15dph)、变态幼鱼(20dph)及新变态幼鱼(25、30和36dph)、青少年期鱼(41dph)。也显示了单独使用5’或3’引物并且没有模板(NT)的对照。引物为对每种pleurocidin变体特异(表2)。
Southern分析
使用WF1、WF2、WF3及WF4基因组探针,对比目鱼(flatfish)DNA特异的阳性信号如图10所示。用黑线鳕鱼、狭鳕鱼(pollock)或胡瓜鱼DNA没有检测到信号(数据未显示)。所有四种探针均显示能够与四种比目鱼DNA的共用BamHI和SstI酶切条带杂交,这表明所述的基因簇集在这些基因组中。美洲拟鲽消化产物的杂交片段大小如表8所示。
图10描述了美洲拟鲽(WF)、美洲黄盖鲽(YF)、拟庸鲽(AP)和大西洋大比目鱼(AH)的pleurocidin基因的Southern分析结果。通过BamHI(B)或SstI(S)来消化总基因组DNA(7.5μg),将其片段加到1.0%琼脂糖凝胶上。随后用对应WF1、WF2、WF3及WF4的探针对印记进行杂交。分子量标准(M)为用StyI消化的lambda DNA(24.0,7.7,6.2,3.4,2.7,1.9,1.4,0.9Kb)。
其它鱼类其它的pleurocidin样序列的鉴定
对齐的从拟庸鲽、美洲黄盖鲽、美首鲽、大西洋大比目鱼推导的pleurocidin样肽氨基酸序列如图3所示。从Petrale鲽、C-O鲽、英吉利鲽、箭齿鲽、欧洲欧鲽、格陵兰大比目鱼及太平洋大比目鱼的基因组DNA中获得序列。高度保守区出现在信号肽和酸性原片段区域中,而对应成熟肽的部分则显示更多的可变性。
图3描述了对齐的从以下种类的皮肤和/或肠中扩增的PCR产物和基因的核苷酸序列推导的pleurocidin样肽序列:美洲拟鲽(WF)、美洲黄盖鲽(YF)、美首鲽(GC)、拟庸鲽(AP)和大西洋大比目鱼(AH)。鉴定的pleurocidin样序列的特异非限定性的例子如表4所示。cDNA和/或基因组序列的非限定性的例子见附件I。
美洲拟鲽基因组中pleurocidin样序列的鉴定
从美洲拟鲽基因组文库中分离分别含有12.5和15.6kb片段的两个克隆。所述的12.5kb片段编码对应WF2的基因和两个假基因。所述的15.6kb片段编码对应WF1的基因、1个假基因和两个未曾描述过的pleurocidin样序列,将其称为WFX和WFYT。基因排列的示意图如图11所示。搜寻编码序列的序列上游发现一个经典的真核细胞启动子,TATA和CAAT框以及对多个转录因子高度保守的位点,所述转录因子包括NF-IL6、AP1及α-干扰素(图12)。在假基因的上游没有鉴定出启动子序列。
图12描述了pleurocidin基因和假基因上游的转录因子结合位点的位置。启动子用阴影框、内含子用实心框、外显子用点框表示。
抗菌活性肽序列的预测和评价
测定了化学制备的肽抗各种细菌病原体和C.albicans的最小抑制浓度,结果如表9所示。一般说来,许多肽都表现出抑制广谱细菌病原体和C.albicans生长的能力。具有广谱抗菌活性的肽的特别好的例子是来源自拟庸鲽的三种肽(NRC-11、NRC-12及NRC-13)以及来源自美首鲽的三种肽(NRC-15、NRC-16和NRC-17)。其中NRC-15、NRC-13及NRC-12分别具有杀灭耐甲氧西林金黄色葡萄球菌(图13)、铜绿假单胞菌(图14)及C.albicans(图15)能力。
图13描述了暴露于最小抑制浓度(MIC)和10倍MIC的NRC-15后,革兰氏阳性细菌(耐甲氧西林金黄色葡萄球菌-MRSA)的活存率。金黄色葡萄球菌生长在Mueller-Hinton肉汤中并暴露于MIC和10倍MIC的NRC-15中。在特定的时间间隔从培养物中取出等份,并接种在含MHB培养板,计数所产生的克隆。
图14描述了暴露于最小抑制浓度(MIC)和10倍MIC的NRC-13后,革兰氏阴性细菌(铜绿假单胞菌)的活存率。铜绿假单胞菌生长在Mueller-Hinton肉汤中并暴露于MIC和10倍MIC的NRC-13中。在特定的时间间隔从培养物中取出等份,并接种在含MHB的培养板,计数所产生的克隆。
图15描述了暴露于最小抑制浓度(MIC)和10倍MIC的NRC-12后,酵母(Candida albicans)的活存率。C.albicans生长在Mueller-Hinton肉汤中并暴露于MIC和10倍MIC的NRC-12中。在特定的时间间隔从培养物中取出等份,并接种在含MHB培养板,计数所产生的克隆。
除证明pleurocidin样肽具有广泛的抗细菌和C.albicans活性外,该结果表明从基因组序列中选择抗菌活性肽时,哪些因素应优先考虑。
首先,一组明显的很少或没有观察到活性的肽来自假基因(NRC-8、NRC-9、NRC-10)。这些结果表明,能够在宿主体中表达的肽可能是较好的抗菌肽候选者。
其次,前述的WF1a中N末端GRRKRK(图2)被证明是NRC-3中抗菌活性的决定因素,而NRC-2(与NRC-3相同但缺少上述片段)显示只有少量活性(表9)。这些结果强调了在成熟肽中仔细选择起始/终止残基的重要性,即使其在最初的前-原-序列中不明显。
因此在本发明的实施方案中,提供了具有GRRKRK氨基酸序列的一组pleurocidin相关抗菌肽。应当理解,也存在缺少这一序列的pleurocidin样抗菌肽,并在本文中特别考虑。
前述的原则在选择抗菌活性肽中是有效的,所述原则包括:选择在螺旋轮模型中具有较好分离的亲水和疏水残基的带正电荷的肽,保存N末端的GW或GF,酰胺化具有甘氨酸的C末端,及裁剪下酸性C末端氨基酸簇。
本发明中的肽可在多种pH值、盐浓度及温度下使用。这些肽可用于对抗生长在生物膜中的病原体或其它条件下的病原体生长或培养。参见例如图25,其中显示了NRC-13在50mM NaCl中的杀灭铜绿假单胞菌K799的能力。将NRC-13加入到附加了150mM NaCl的铜绿假单胞菌培养物中,使其最终浓度为4μg/ml(□)或40μg/ml(△),分别表示MIC和10XMIC。同时显示了没有加入肽的对照(◆)。
可单独使用肽或与其前和原序列的一种或两种同时联合使用。
本发明的肽具有多种用途,包括抗细菌、抗真菌、抗病毒、抗癌及抗寄生虫剂,并包括与其它抗生素、抗感染剂和化疗剂联合使用以及它们之间的联合使用。
肽可用作免疫调节剂,例如伤口愈合、组织再生、抗败血症、免疫促进剂等等。也包括与其它试剂联合使用。
所述的肽可局部给药(包括例如,特别用于CF患者呼吸道感染的气雾剂、软膏、乳液、冲洗剂、眼部洗涤剂等等),系统给药(包括例如iv、ip、im、皮下、腔内或透皮给药)及口服给药(例如丸剂、液体药剂、胶囊等等)。
当用于包括农业动物和/或植物的转基因系统给药时,通过包囊(包括在脂质体中)、类蛋白(proteinoid)给药也是可以考虑的。
肽可用作医疗设备(包括货物等等)、食品制备和包装机械中的保护性包被。
能够与本发明公开的肽在养殖作业中一起使用的抗生素的例子包括:Terramycin Aqua(土霉素)、Romet(磺胺间二甲氧嘧啶和ormetroprim)及Tribrissen(三甲氧苄氨嘧啶和磺胺嘧啶)。在养鸡场中,甲醛浸泡能够与本发明的肽一起使用。在本文所述的任何用途中,肽可相互组合和/或与常规抗生素联合使用。
Hepcidin
鉴定的hepcidin序列的特别的非限定性的例子如表11所示。cDNA或基因组序列的例子如附件II所示。
细菌刺激
注射后3天,使感染的大西洋鲑鱼昏睡和厌食。在取样中,注射后的鱼的肾脏后叶为杀鲑气单胞菌阳性,而对照鱼的肾脏后叶不是。
Hepcidin cDNA的分子特性
尽管美洲拟鲽EST数据库含有来自肝、卵巢、胃、肠、脾及幽门盲肠的cDNA文库的序列,大西洋鲑鱼EST数据库含有来自肝、头肾及脾的序列,只在两种鱼的脾和肝cDNA文库中检测到了hepcidin样序列。美洲拟鲽肝脏文库中135个EST中的4个(3.0%)和美洲拟鲽脾脏文库中281个EST中的2个(0.7%)编码hepcidin。大西洋鲑鱼肝脏文库中982个EST中3个(0.3%)编码hepcidin。还发现在扣除的脾脏大西洋鲑鱼cDNA库中有5个(1.8%)以及扣除的肝脏大西洋鲑鱼cDNA文库中有3个(0.6%)hepcidin序列,所述文库中在杀鲑气单胞菌感染过程中上调的转录本中增多。但是,由于它们是扣除文库,因而插入的仅仅是完全转录本的部分。
大西洋鲑鱼hepcidin cDNA核苷酸序列的分析表明,一个鲑鱼的EST(SL1-0412)约为300个核苷酸,长于另外两个。此外该hepcidin编码序列是不完全的。此克隆的完全测序表明存在有2个具有标准GT/AG拼接连接的内含子(图16a)。当去除内含子,可获得编码完全hepcidin样肽的开放读码框架。类似地,可扩增仍含有第二内含子的不完全拼接大比目鱼转录本(图16b)。与哺乳动物比较,鲑鱼的内含子和可能的大比目鱼位置相似但长度略短(图16c)。除这些不完全拼接的cDNA,我们还鉴定了美洲拟鲽EST(WF4),其相对于其它序列(密切对应鲑鱼和人hepcidin的第二外显子)含有较大的缺失。在植物中出现的内含子位置是保守的,此缺失可与外显子2的去除有关,从而产生与WF3a和WF3b不同的肽(在其保留的肽中只有5个氨基酸位置不同)。
图16描述了编码I型鲑鱼hepcidin的未拼接的肝脏cDNA核酸序列。外显子序列用大写字母表示而推导的氨基酸序列在核酸序列的下方。gt/ag内含子/外显子交界用粗体标出,用下划线给出多聚腺苷酸信号(aataaa)。为编码I型鲑鱼hepcidin的来自大比目鱼脾脏的部分拼接cDNA核酸序列。c为人、小鼠及鲑鱼的内含子/外显子结构比较。用阴影框表示外显子,用单线表示内含子(大小用bp表示在下方)。
为了与提取自对应于日本牙鲽(两种)、青鳉(一种)、彩虹鳟鱼(一种)dbEST的hepcidin,以及最近报道的杂交条纹石鮨(Shike et al.2002)和两种大西洋大比目鱼(Hb 17 and Hb 357)的hepcidin的氨基酸序列进行对比,对齐列出了5种不同的美洲拟鲽hepcidin cDNA和两种不同的大西洋鲑鱼hepcidin推导的氨基酸序列。通过PCR从大西洋鲑鱼(Sal2.1和Sal8.6)和大西洋比目鱼(HB1.1、HB5.3和HB7.5)脾脏和肝获得的序列也包括在内(图17)。人的hepcidin作为哺乳动物的代表也包括在内。通过PSORT预测了信号肽酶的裂解位置,并鉴定了原肽转变酶(Nakayama 1997)典型的RX(K/)R基序(motif)(垂直箭头;图17)。信号肽序列为22-24个氨基酸并且在所有的鱼类序列中高度保守。根据特定的hepcidin变体,阴离子原片段(anionic propiece)为38-40氨基酸。加工后的hepcidin含有19-27个氨基酸,并除WF2外在中性pH下均带正电荷(表10)。在成熟肽中,来自比目鱼的I型和III型hepcidin和鲑鱼型hepcidin含有8个半胱氨酸残基,预计其可形成4对二硫键。II型美洲拟鲽hepcidin缺少2个半胱氨酸残基,表明最多可形成3对二硫键。Hb357含有5个半胱氨酸残基且与其它的hepcidin样序列明显不同。尽管通过某些方法预测了延伸链存在有短的伸展,二级结构预测方法的结果表明鱼类hepcidin的一致结构大部分为随机卷曲。
图17描述了美洲拟鲽(WF1、WF2、WF3a、WF3b、WF4)、大西洋比目鱼(Hb1.1、Hb5.3、Hb7.5、Hb17、Hb357)及大西洋鲑鱼(Sal1、Sal2、Sal2.1、Sal8.6)hepcidin与日本牙鲽(JFL4、JFL6)、青鳉、杂交条纹石鮨和人hepcidin的对齐比较。也显示了彩虹鳟鱼的部分序列(GenBank登录号AF281354_1)。用箭头表示信号肽酶和前蛋白裂解的预测位置。
从图17可见,非常明显所有比目鱼型hepcidin具有非常相似的信号肽,其某种程度上不同于鲑鱼型和人的hepcidin。鉴定的其它新的特征包括hepcidin不同的分组,其根据为:(1)半胱氨酸残基数目,(2)比目鱼III型中独特的插入FKC,(3)可能含有独特插入的两个其它位点,(4)截短的版本(比目鱼IV型),(5)氨基末端较长的版本。
根据对齐比较,非常明显有至少3组不同的比目鱼hepcidin其共有的插入和缺失不同。WF2和JFL6(比目鱼II型)在靠近KR裂解位点共有一个7个氨基酸的缺失,产生19个氨基酸的加工后的肽,而WF3a、WF3b、WF4、Hb1.1、Hbl7、Hb5.3及Sal8.6(比目鱼III型)仅有4个氨基酸缺失(排除对应WF4缺失外显子的部分),产生22个氨基酸的加工后肽。WF1和JFL4(比目鱼I型)不含这些缺失,但相对所有其它报道的hepcidin在临近信号肽酶裂解位点处含有插入。此外,相对所有其它报道的hepcidin,石鮨和青鳉的WF1在成熟的肽中共有一个氨基酸的插入,产生26-27氨基酸的肽。尽管其在5′和3′非翻译区含有一些沉默的取代和差异,WF3a和WF3b之间只有一个氨基酸的不同。Hb357代表可能的第四类比目鱼hepcidin。WF2和WF1的3′非翻译区非常不同于其它的hepcidin转录本。与其它比较,WF2含有较长的附加部分,WF1较短且保守性略差(图18A)。
所述的鲑鱼hepcidin样肽只有一组;4个报道的序列均共有两个缺失,彼此间在成熟肽中有四个氨基酸不同,且在上游前蛋白部分有4个氨基酸不同。鲑鱼hepcidin的3’非翻译区仅为中度保守(图18b)。
图18描述了(a)美洲拟鲽(WF1、WF2、WF3a、WF3b、WF4)与(b)大西洋鲑鱼(Sal1、Sal2)hepcidin cDNA的3’非翻译区的对齐比较。框内为保守的核苷酸。用箭头表示用于从大比目鱼和鲑鱼中扩增hepcidin同源物的引物位置。
美洲拟鲽Hepcidin基因的基因组组成
通过对应I型hepcidin的探针对多种鱼的基因组DNA进行Southern杂交分析,鉴定了在所有检测的比目鱼中存在而在其它鱼类中没有的条带(图19)。在美洲拟鲽中,有两个4.3和4.5kb片段与探针杂交。有两个相同大小的美洲黄盖鲽片段(4.3kb)和两个美首鲽基因组DNA片段(4.3和20kb)也被杂交,而仅有一个拟庸鲽片段(4.3kb)和一个日本牙鲽基因组DNA片段(5.5kb)被杂交。
图19描述了不同鱼类中hepcidin的Southern杂交分析结果。八目鳗鱼(Hg)、鲨鱼(Sh)、高首鲟(St)、美洲拟鲽(WF)、美洲黄盖鲽(YF)、拟庸鲽(AP)、美首鲽(Wi)、日本牙鲽(JF)、大西洋鲑鱼(AS)、胡瓜鱼(SM)及黑线鳕鱼(Hd)的基因组DNA的SstI消化产物(7.5μg)与美洲拟鲽的I型hepcidin杂交。分子量标准(M)为Lambda DNA的StyI消化产物。
通过RT-PCR对Hepcidin样序列的鉴定
图2描述了从大比目鱼和鲑鱼肝脏和脾脏hepcidin cDNA的扩增。从用细菌病原体感染来诱导抗菌肽基因表达的鱼组织中制备RNA,用如下列出的引物反转录和PCR。Actin作为对照来显示看家基因的表达。图中的标记为:HL-大比目鱼肝脏;SL-鲑鱼肝脏;HS-大比目鱼脾脏;SS-鲑鱼脾脏;M-分子量标准。引物5’U为所有反应使用的通用5′引物,Sal为Hc Sal(如下),WF为HcPA3b(如下)。
Hep通用5’:AAGATGAAGACATTCAGTGTTGCA
HcPA33’B2:GTTGTTGGAGCAGGAATCC
HcSal:TGCTGGCAGGTCCTCAGAATTTGC
三种美洲拟鲽hepcidin的组织特异表达的RT-PCR分析结果如图20所示。在肝脏中I型hepcidin表达丰富,在心脏胃中相对较少。在任何组织中都检测不到II型hepcidin的表达,而在食道、心脏胃和肝脏中III型hepcidin中度表达。
在未感染的大西洋鲑鱼中,在肝脏、血液和肌肉中I型hepcidin以相当高的水平表达,而鳃和皮肤中表达水平较低,在肾脏前叶和肾脏后叶中几乎不表达(图21a,表10)。II型仅在鳃和皮肤中以几乎检测不到的水平表达(图21b)。然而,用杀鲑气单胞菌感染的鱼在大多数检测的组织中两种hepcidin均可表达(参见如下)。
不同年龄的美洲拟鲽幼鱼hepcidin基因表达的RT-PCR分析结果如图22所示。II型hepcidin转录产物在发育的任何阶段均不能检测到,而I型和III型hepcidin在变态前的幼鱼中能够被检测到。I型hepcidin比II型hepcidin的表达更丰富并在较早的时间表达(5dph vs.9dph.)。
图20描述美洲拟鲽不同组织中hepcidin和actin基因表达的反转录PCR分析。使用对比目鱼I型(组A)、II型(组B)和III型(组C)hepcidin和actin(310bp)的基因特异引物来进行成年美洲拟鲽扩增产物的扩增,将产物加入2%琼脂糖凝胶中进行电泳。分子量标准(M)为100bp梯状带(BRL)。
图21描述了对照大西洋鲑鱼(c)和其它用杀鲑气单胞菌(I)感染的鲑鱼的不同组织中的hepcidin和actin基因表达的反转录PCR分析结果。使用对鲑鱼I型(组A)、II型(组B)hepcidin(163bp)和actin(400bp)的基因特异引物得到扩增产物,将其加入2%琼脂糖凝胶中进行电泳。分子量标准(M)为100bp梯状带(BRL)。
图22描述了发育中的美洲拟鲽幼鱼的hepcidin和actin表达的反转录PCR分析结果。样本为5dph(泳道1)、12dph(泳道2)、19dph(泳道3)、27dph(泳道4)及41dph(泳道5)的幼鱼和成年鱼(泳道6)。使用对比目鱼I型(组A)、II型(组B)和III型(组C)hepcidin和actin(400bp)的基因特异引物获得扩增产物,将其加入2%琼脂糖凝胶中进行电泳,并使用100bp梯状带(Pharmacia)(泳道M)作为分子量标准。
对其它鱼类的其它hepcidin样序列的鉴定
使用根据所有报道的hepcidin的信号肽的高度保守序列设计的引物(Hep通用5’)结合根据鲑鱼(HcSal 3’)和比目鱼(HcPA3b 3’)的3’UTR的高度保守的序列设计的引物,从大比目鱼和鲑鱼的肝脏和脾脏中扩增hepcidin样序列是可能的(图2)。推导的美洲拟鲽、大西洋大比目鱼和大西洋鲑鱼的hepcidin样肽的氨基酸序列的对齐比较如图17所示。有意思的是,可以从鲑鱼(S8.6)中扩增比目鱼-型hepcidin,同时也可从比目鱼(Hb7.5)中扩增鲑鱼-型hepcidin。从Petrale鲽、C-O鲽、英吉利鲽、箭齿鲽、欧洲欧鲽、格陵兰大比目鱼and太平洋大比目鱼的基因组DNA中可获得其它序列。
图17显示了某些美洲拟鲽(WF1、WF2、WF3a、WF3b、WF4)、大西洋大比目鱼(Hb1.1、HB5.3、Hb7.5、Hb17、Hb357)及大西洋鲑鱼(Sal1、Sal2、Sal2.1、Sal8.6)hepcidin与日本牙鲽(JFL4、JFL6)、青鳉、杂交条纹石鮨及人的序列的对齐比较。也显示了彩虹鳟鱼的部分序列(Genbank登陆号AF281354_1)。信号肽酶和前蛋白裂解物的预测位置如箭头所示。
对论
Pleurocidin
大多数抗菌肽,包括cecropin和dermaseptin由多基因家族编码,其可能由连续的基因复制产生。我们证明美洲拟鲽以及可能的其它比目鱼具有编码与pleurocidin相似的抗菌化合物的基因家族。使用PL1/2与所述cDNA序列获得的基因组扩增产物(图1a)的比较表明WF2与WF4含有三个内含子,其第一个仅位于起始甲硫(蛋)氨酸的上游1bp。第二和第三个内含子均位于成熟肽的之中。GLa、xenopsin、levitide及caerulein的基因(所有来自非洲爪蟾的皮肤肽)还含有位于起始甲硫氨酸上游1bp的内含子(Kuchler et al 1989)。除WF3外,在所有基因中内含子的位置是保守的(图6),但其大小有显著的差异(表5),表明从复制事件的发生开始经历了相当长的进化阶段,或内含子序列可相对自由的漂移。
Southern分析表明WF1-4探针能够与其它比目鱼DNA包括美洲黄盖鲽、大西洋大比目鱼和拟庸鲽杂交,但不与黑线鳕鱼、胡瓜鱼或狭鳕鱼杂交。此杂交可能是由于高度保守的信号序列和我们已经证明在分离自比目鱼的序列中保守的阴离子部分而引起。比目鱼可提供用于养殖业的潜在治疗剂的丰富储备。针对不同pleurocidin家族成员的探针常可识别美洲拟鲽DNA中相同的限制性区域,表明它们可能在基因组中集簇在单一的位置上。与pleurocidin杂交的两个Lambda克隆的全测序证明这种集簇确实存在(图11)。除其它外,抗菌肽基因的集簇也在昆虫cecropins(Gudmundson et al.1991)和apidaecins(Casteels-Jossen et al.1993)中发现。
图11描述了美洲拟鲽pleurocidin样基因和假基因(Ψ)基因组组成的实施方案的示意图,内含子由实心框表示,外显子由点框表示。
Pleurocidin家族的所有成员编码为前原多肽,其由跟随有活性肽并由酸性部分结尾的氨基末端信号序列构成。信号和酸性序列的推导氨基酸序列高度保守,而预测的成熟抗菌肽序列较为可变(图6)。但是全部都折叠成两性α螺旋。这种序列保守性使我们不但可以利用基因组手段从美洲拟鲽中,而且还可以从多种其它的比目鱼中鉴定pleurocidin基因家族中许多不同的成员(图3,表4,附件I)。
Pleurocidin前原多肽结构与蛙的dermaseptin前体具有某种相似性,其也含有相似长度(22个氨基酸)的信号序列和16-25个氨基酸的酸性部分。从全长cDNA克隆来看(图1a),该pleurocidin的酸性部分显示含有21个残基。Pleurocidin和dermaseptin前原多肽的主要区别为pleurocidin中酸性部分位于成熟肽的下游,而dermaseptin中位于成熟肽的上游。已认为Defensin的酸性原部分通过中和正电荷可防止抗菌肽与膜的相互作用(Valore et al.1996),这可能也是其在pleurocidin中的功能。这一特性对于释放直到特异切除后才活化的肽特别实用。
pleurocidin家族成员的信号序列和酸性羧基末端序列极端地高度保守。前者,也许还有后者推测能够靶定前体分子到细胞膜表明来进行分泌。已经被dermaseptin家族(Valore et al.1996)及Gla、xenopsin、levitide和caerulein(所有这些为来自非洲爪蟾的皮肤肽(Kuchler et al.1989))所描述的具有不同生物活性的末端产物跟随含有高度保守的信号肽抗菌肽基因家族(常由第一外显子编码)。这些作者认为此模块化(modular)基因结构通过通常的途径使得可以实现对显著差异的肽为了分泌而实施靶定。在pleurocidin基因家族中,模块化结构也以编码信号序列和抗菌肽第一半的外显子2,编码抗菌肽的后续10个氨基酸的外显子3,以及编码抗菌肽最后3个氨基酸和酸性羧基末端的外显子4出现。
由WF2和WF4编码的成熟肽相互间有60%相同(图6),而与dermaseptin B1和ceratotoxin B相似以较少(Cole et al.1997)。WF1与WF1a有64%相同,但在信号序列与成熟肽间含有明显的18个氨基酸的阳离子延伸,而其在WF1a中不存在。当pleurocidin WF1加工时是否存在这种潜在的抗菌18-mer肽还需鉴定。相对WF2、WF3和WF4在成熟肽和酸性羧基末端间,WF1和WF1a都含有附加的10-11氨基酸。WF3与WF2/4和WF1/1a均有相似性。已证明与WF2中间部分相同的合成pleurocidin能够防止由鳗弧菌(Vibrio anguillarum)引起的Coho鲑鱼感染,根据pleurocidin、dermaseptin和ceratotoxin得到的杂交肽也具有这种作用(Jia etal.2000)。
通过Northern印记分析和RT-PCR来评价pleurocidin基因的组织特异表达。对于美洲拟鲽mRNA中存在的低水平转录,已证明Northern分析不够敏感。只有在皮肤中有足够的转录量可用此方法来测定,因此使用更加敏感的RT-PCR分析。使用此方法发现在皮肤和肠中均有Pleurocidin转录,这与最近报道的这些组织中pleurocidin的超结构定位一致(Cole,Darouiche et al.2000),并且支持了pleurocidin在粘膜免疫中的作用。转录大小(约200bp)与RT-PCR得到的产物大小一致(表7),表明pleurocidin基因是分别转录的。
RT-PCR分析表明不同pleurocidin样肽的基因以组织特异形式表达,其中WF2主要在皮肤和鳃中表达,而肌肉、肠、胃和肝脏中表达量较少,而WF1和WF4主要在鳃和皮肤中检测到(图7)。WF3和WFYT在多数组织样本中表达,WFX只在皮肤中检测到,而WF1a在任何组织样本中不表达。可能地,在两种组织中,需要不同的抗菌肽控制不同菌群的生长。因为对于WF4没有检测到RT-PCR产物,因此可能这种基因只在成年皮肤或肠中以低水平表达或者在不同的生命阶段或在不同的组织中表达。
使用在不同的pleurocidin样基因转录产物中没有区别的引物,表达首先在5dph中检测到并随着其不断成长而呈现不断增加的趋势。但是在使用对WF1、WF1a、WF2、WF3、WF4、WFX和WFYT特异的引物的近期试验中,可在不同的发育阶段检测到转录本(图9)。WFX仅在20dph时检测到,而WFYT、WF3和WF2可在5dph检测到,并且在25-36dph之间具有更高的水平。有趣的是,在任何幼鱼阶段均不能检测到WF1,并且其可能只在特定环境条件下对特定的细菌病原体反应才有表达,如对Drosophila所示的(Rivas and Ganz 1999)。这是第一次证明了鱼类中抗菌肽的发育中表达,并且表明这种天生的免疫成分至少存在于美洲拟鲽的早期幼鱼阶段。变态前幼鱼的死亡受到了极大的关注,尽管其死亡原因仍不清楚,有推测可能是由内脏中的高细菌刺激导致的(Padros,Minkoffet al.1993)。已证明比目鱼的适应性免疫系统发育晚于其它硬骨鱼的免疫系统(Padros,Sala et al.1991)。因此,在此阶段幼鱼产生抗菌肽的能力对其活存是至关重要的,鉴定可增加此种化合物产生的因素对养殖业者有极大的好处。
合成肽抗多种细菌病原体和真菌病原体Candida albicans的检测结果表明了具有广谱抗菌活性的有前景的候选者。特别感兴趣的是NRC-13和NRC-15肽以4μg/ml的低浓度抑制耐甲氧西林金黄色葡萄球菌生长的能力。NRC-13还可在4μg/ml抑制C.albicans的生长,在1μg/ml抑制铜绿假单胞菌的生长(及在此浓度杀灭铜绿假单胞菌)以及在2μg/ml浓度抑制杀鲑气单胞菌。这意味着NRC-13有高度抗鱼类病原体、革兰氏阴性人细菌、耐药物革兰氏阳性人细菌及酵母的活性。NRC-13的例子展示了阳性抗菌肽潜在的靶标和应用范围。
这些结果还验证了我们用于从大量序列资料中选择抗菌活性肽的方法。准确预测哪种肽可能具有活性的能力是基因组和治疗学间连接的关键。虽然在这个领域中还有大量工作需要进行,但我们对前述规则的合理应用的清楚地展示将有助于活性肽的选择。
因此,已经分离了多种cDNA和基因组序列,其编码与多种比目鱼类中pleurocidin相同或类似的抗菌肽前体。Northern杂交和RT-PCR产物的序列分析表明其表达是组织特异的。最重要的是,测定了发育中的美洲拟鲽幼鱼中不同pleurocidin变体的表达时间性,使得可以对此种鱼的天生免疫系统的发生进行评估。这些pleurocidin表达的分析可用于指导在特定组织和/或发育阶段中分离表达的新的肽序列的筛选策略。还可分析影响pleurocidin产生的环境因素。
这项工作为进一步研究奠定了基础,这些研究致力于作为养殖鱼的治疗剂的pleurocidin的过量表达以及通过转基因技术(其已在表达抗菌肽的转基因烟草中证实(Jach et al.1995)并建议用于鱼类(Jia et al.2000))产生抗疾病的鱼。此外,由于许多鱼生活在含盐的环境中,因此其抗菌肽的特性可能与陆地动物产生的不同,且可在独特的情况下应用。例如,具有胞囊纤维化的患者的肺粘膜含有升高的NaCl浓度,其可抑制由肺分泌的天然阳离子肽(Goldman et al.1997)。来自海洋鱼类的盐适应性阳离子肽可应用于这类患者的肺部感染。
Hepcidins
一种鲑鱼EST(SL1-0412)和一种大比目鱼克隆(Hb7.5)的序列分析显示了未拼接转录产物的存在,且使得可确定某些内含子的位置(图16)。与小鼠、人和杂交条纹石鮨相似,鲑鱼hepcidin由3个外显子和两个内含子组成(Park,Valore et al.2001;Shike et al.2002;Pigeon,Ilyin et al.2001)。鲑鱼与石鮨第一内含子的位置相同,并对应小鼠和人的该序列的两个5’氨基酸位置。但是第二鲑鱼内含子和第二大比目鱼内含子Hb7.5对应人和小鼠的该序列的两个3’氨基酸位置和石鮨的多个5’氨基酸位置。这可能是由于“内含子滑动”,从而在经过一段进化后其内含子的位置发生了几个核苷酸的漂移。有趣的是,WF4中的缺失准确对应在第一鲑鱼内含子及第二小鼠/人内含子位置,表明一种内含子/外显子的中间结构。
小鼠含有两个hepcidin基因,其集簇在基因组上(Pigeon,Ilyin et al.2001)但在人类(Park,Valore et al.2001)和杂交条纹石鮨(Shike et al.2002)中只鉴定到一个hepcidin基因。尽管还需对美洲拟鲽和大西洋鲑鱼的hepcidin基因数目进行鉴定,但是至少在美洲拟鲽中有5个基因,在大西洋大比目鱼中有5个,在大西洋鲑鱼中有4个基因。由于在Southern杂交分析中使用的hepcidin探针中没有SstI酶切位点,因此本文报道的5个美洲拟鲽hepcidin基因极有可能集簇在两个基因组片段上。同样存在pleurocidin的多基因(Douglas,Gallant et al.2001)并集簇在基因组上(图11)。有趣的是,检测的来自大西洋的所有小蝶鱼均出现较小的4.3kb杂交条带,表明它们在基因组水平共有相似性。在太平洋中发现的日本牙蝶表现出单一的5.5kb的杂交条带。
鱼类前原hepcidin的推导氨基酸序列可与哺乳动物的全长序列进行对齐但只在对应加工后的肽的部分表现高度的相似性(图17)。但是,鱼类中的信号肽和原片段同样非常高度保守。在pleurocidin家族中也发现这些片段的保守性(Douglas,Gallant et al.2001)。加工后的肽的氨基末端根据人hepcidin的氨基酸序列(Krause,Neitz et al.2000;Park,Valore et al.2001)及与加工位点的RX(K/R)R基序特性的相似性(Nakayama 1997)进行分配。美洲拟鲽和大西洋鲑鱼的加工后的hepcidin分子量范围为1992Da(WF2)至3066(WF1),与从小鼠、人和石鮨中分离的hepcidin相当。除具有酸性pI(5.54)的WF2外,hepcidin的pI在7.73-8.76。
与pleurocidin相似,hepcidin变体的氨基酸序列在种类间高度相似,表明一个祖先基因的相对较近的复制。有可能与陆生哺乳动物相比,在鱼生存的水生环境中需要更多不同组抗菌肽存在。此外,这种天生免疫系统的成分在鱼中比在哺乳动物中发挥更主要的作用,哺乳动物具有更高级的进化适应免疫系统。
人类hepcidin分子被认为可以形成含有一系列β折叠、环及弯曲的β-片层的二级结构(Park,Valore et al.2001)。鱼hepcidin的一致二级结构预测表明其含有基本上自由的卷曲结构及一些延伸的链(strand)结构。因而除WF2、JFL6和Hb357外,所有报道的hepcidin含有8个半胱氨酸残基,其可形成4个二硫键(Krause,Neitz et al.2000;Park,Valore et al.2001)并以以下的方式连接:1-4、2-8、3-7、5-6(Park,Valore et al.2001)。WF2中半胱氨酸残基1和3的缺失表明至少有1个二硫键不能形成。
使用基因特异引物,我们能够证明在美洲拟鲽(图20)和大西洋鲑鱼(图21)的不同组织中均可表达不同的hepcidin基因。在大西洋鲑鱼中在正常的未感染的鱼中,主要在肝脏、血液和肌肉中可检测到hepcidin(I型),而在鳃和皮肤中量较少(两种类型)。这与cDNA文库(该文库构建自未感染的肝脏)中存在I型hepcidin的3个EST一致,以及与cDNA文库(该文库构建自未感染的肝脏、脾脏和头肾)中不存在II型hepcidin的EST一致。II型hepcidin的表达表现为限定在与水生环境接触的外部上皮表面,而I型hepcidin表达更加广泛,其可在肝脏、血液和肌肉以及外部上皮表面表达。在未感染的美洲拟鲽中,在任何组织中不能检测到II型hepcidin的转录产物,但在肝脏和心胃中存在I和III型hepcidin的转录产物。III型hepcidin转录产物还可出现在食道中。
也有报道,使用一种小鼠hepcidin序列作为探针,通过Northern分析发现小鼠hepcidin主要在肝脏中表达,而在胃、肠、结肠、肺、心和胸腺中表达较弱(Pigeon,Ilyin et al.2001)。但是,本研究不能区分两种hepcidin基因,而且不清楚此两种小鼠基因在小鼠不同的组织表达是否不同。相似地,使用人hepcidin cDNA作为探针对人组织和细胞株进行的斑点印记(dot-blot)分析显示,在成年和胎肝中表达较强,而在成年心、胎心和成年脊髓索中表达较弱(Pigeon,Ilyin et al.2001)。在使用实时定量RT-PCR的在先研究(Krause,Neitz et al.2000)中显示在人肝脏、心和脑中hepcidin的表达较强,而在其它的各种组织中表达较弱。有趣的是,我们在正常的大西洋鲑鱼或美洲拟鲽的脑中、或正常大西洋鲑鱼的心中检测不到型I和II型hepcidin的表达。但是在感染的动物中,II型hepcidin可在两种组织中表达,表明此形式是应激条件下表达的主要的一种。
有趣的是,我们发现在大西洋鲑鱼的血细胞中组成型表达的I型hepcidin的转录产物。据报道在鱼类的血液中很少有组成型表达的非酶抗菌分子;只在彩虹鳟鱼的粘膜中发现有小的疏水性阳离子肽(Smith et al.,2000)及在未感染的动物血液中表达moronecidin(石鮨的抗菌肽)(Lauth etal.2002)。有趣的是,相对于未感染的对照动物,感染的鲑鱼血液中没有hepcidin的表达增加。可能的原因是,在对照动物中hepcidin发挥铁离子内环境稳定及抗菌的作用。其在未感染的动物血液中出现是对临近的感染发挥预防作用。
在杀鲑气单胞菌感染过程中大西洋鲑鱼I型和II型hepcidin表达上调,但在不同的组织中表达量不同。在食道、胃、幽门盲肠、肝脏、脾脏、肠、肾脏后叶、直肠和肌肉中I型hepcidin表达明显上调,而在肾脏前叶和皮肤中表达较低。II型hepcidin在胃、幽门盲肠、肝脏、脾脏、肠、脑、心脏和肌肉中表达明显增加。而在食道、肾脏前叶和肾脏后叶、皮肤及直肠中表达只有较弱的上调。这些结果与细菌刺激的杂交条纹石鮨的报道一致,其中在肝脏中表达明显上调,而在皮肤、鳃、肠、脾脏、肾脏前叶和血液中也证明有表达(Shike et al.2002)。并不清楚,在杂交条纹石鮨中是否有多种hepcidin,如果有,其表达是否与大西洋鲑鱼和美洲拟鲽中一样具有表达差异。
对小鼠的研究表明注射LPS的小鼠的肝脏中hepcidin表达增加4.3倍,暴露于LPS的原代肝细胞有7倍的增加(Pigeon,Ilyin et al.2001)。这些研究以使用小鼠hepcidin序列作为探针进行的Northern分析为基础,因此不能区分两种小鼠变体可能的表达差异。对铁的超负载可在小鼠肝脏中发现相似的增加,但对暴露于柠檬酸铁后的原代肝细胞没有增加,其可能是由培养的肝细胞的分化状态不同而导致的。铁负载和LPS暴露均可引起hepcidin表达增加的事实表明这两种因素在宿主对病原体反应中的重要性。
在感染中,通过各种机制将铁从系统中去除,使得其不能被侵入的病原体使用。有人认为,最近发现的转铁蛋白受体2介导了肝细胞对铁的摄取并增加了hepcidin的表达(Fleming and Sly 2001;Nicolas,Bennounet al.2001)。Hepcidin依次增加了巨嗜细胞中铁的积累,并通过β2微球蛋白、HFE和转铁蛋白受体1增加十二指肠隐窝(crypt)细胞中饮食(dietary)铁的吸收。这些隐窝细胞分化为含有铁转运蛋白量下降的肠隐窝(enterocyte),由此减少饮食铁的摄取。因此Hepcidin可在炎症反应中对铁稳态发挥关键作用,并作为抗菌肽发挥作用。也可能Hepcidin可调节肝来源的急性阶段蛋白的表达,并与免疫系统的其它成分一起展现出协同作用。
已证明抗菌肽可在小鼠巨嗜细胞中调节基因表达(Scott,Rosenbergeret al.2000),并且有可能其可在鱼巨嗜细胞或肝细胞中表现相似的作用。小鼠和人prohepcidin中存在功能性核定位信号(连续4个K/R残基)表明hepcidin可作为信号分子在维持这些生物体的铁稳态中发挥作用(Pigeon,Ilyin et al.2001)。有趣的是,该核定位信号还含有用于加工prohepcidin的识别信号,表明核定位只在原片段去除前发生、或该原片段本身被局限于所述核中。硬骨鱼hepcidin只含有4个K/R残基中的3个,其不能满足核定位的需要;还需要进行合成的或离体表达的肽的检测来确定hepcidin在细胞内信号产生的作用。
总之,通过Southern杂交确定了来自不同鱼类的新的hepcidin样肽的序列和多种比目鱼类中相关序列的存在。此外,已证明不同型的鱼hepcidin在正常鱼(细菌感染的结果)以及在幼鱼的发育中,以组织特异的形式不同地表达,因此提供了鉴定新肽的其它序列的策略。非常明显,在鱼中不同组织以组成或诱导方式产生hepcidin,表明hepcidin变体在不同的环境中可发挥不同的作用。由于它们在哺乳动物的铁稳态中发挥作用,因此有可能鱼hepcidin变体可实现这种功能以及杀灭特异病原体的功能。Hepcidin变体的体外表达可使其抗菌活性范围及其对天生免疫反应的作用得到鉴定。
因此,本发明提供了鉴定潜在抗菌肽的方法。表
表1.用于分离pleurocidin样序列的寡核苷酸的核酸序列。
表2.用于检测美洲拟鲽不同组织和不同发育阶段的pleurocidin样基因表达的寡核苷酸的核酸序列。
表3.在RT-PCR检测中用来分析hepcidin基因表达的引物的核酸序列。给出了5′引物设计基础的氨基酸序列。3′引物位于3′翻译区(3′UTR)。表中列出了PCR反应中的退火温度及扩增产物的大小。
表4.基于基因组和表达数据的pleurocidin单字母氨基酸序列。
表4a.本研究采用的细菌与念珠菌株。
表5.使用PL5′和PL3′扩增的基因组序列中内含子的大小(bp)。
表6.来自皮肤和肠的对应不同的pleurocidin基因的RT-PCR产物。
表7.美洲拟鲽DNA的BamHI和SstI消化产物中用pleurocidin探针杂交的条带大小(kb)。
表8.针对广谱的细菌病原体和Candida Albicans的pleurocidin样阳离子抗菌肽的最小抑制浓度。
表9.美洲拟鲽和大西洋大比目鱼hepcidin样肽的特性。
表10.hepcidin表达的PCR分析结果。
表11.基于基因组和表达数据的某些hepcidin单字母氨基酸序列,包括NRC参考号。
表12.对应表11和表13所列的氨基酸序列的核酸序列。
表13.基于基因组和表达数据的某些hepcidin单字母氨基酸序列,包括克隆名称。
附件
附件I.参照表4的pleurocidin样基因和cDNA的核酸序列。
附件II.参照表11的hepcidin样基因和cDNA的核酸序列。
参考文献
引用的参考文献不是承认或暗示其与本文所公开的任何发明的专利性有关。
Amsterdam,D.1996.Susceptibility Testing of Antimicrobials in LiquidMedia.In V.Lorian (ed.),Antibiotics in Laboratory Medicine.Williams andWilkins,Baltimore.
Casteels-Jossen,K.,T.Capaci,et al.(1993).″Apidaecin multipeptideprecursor structure:a putative mechanism for amplification of the insectantibacterial response.″EMBO J.12:1569-78.
Cohen,S.,M.Skiguchi,J.Stern,and H.Barner.1963.The synthesis ofmessenger RNA without protein synthesis in normal and phage-infectedthymineless strains of Eschericliia Coli.Proc.Natl.Acad.Sci.U.S.ABiochem.49:699-706.
Cole,A.M.,R.O.Darouiche,et al.(2000).″Characterization of a fishantimicrobial peptide:gene expression,subcellular localization,andspectrum of activity.″Antimic.Ag Chemotherapy.44:2039-45.
Cole,A.M.,P.Weis,et al.(1997).″Isolation and characterization ofpleurocidin,an antimicrobial peptide in the skin secretions of winter flounder.″J.Biol.Chem.272(18):12008-12013.
Douglas,S.E.,C.E.Bullerwell,et al.(1999).″Molecular investigationof aminopeptidase N expression in the winter flounder,PleuronectesAMERICANUS.″J.Appl.Ichtyol.15:80-86.
Douglas,S.E.,J.W.Gallant,et al.(1999).″Winter flounder expressedsequence tags:establishment of an EST database and identification of novelfish genes.″Mar.Biotechnol.1:458-464.
Douglas,S.E.,J.W.Gallant,et al.(1998).″Isolation of cDNAs fortrypsinogen from the winter flounder,Pleuronectes americanus.″J.Mar.Biotechnol.6:214-9.
Douglas,S.E.,J.W.Gallant,et al.(2001).″Cloning and developmentalexpression of A family of pleurocidin-like antimicrobial peptides from winterflounder,Pleuronectes americanus(Walbaum).″Dev.Comp.ImmunoL 25:137-147.
Douglas,S.E.,A.Gawlicka,et al.(1999).″Ontogeny of the stomach inwinter flounder:characterisation and expression of the pepsinogen andproton pump genes and determination of pepsin activity.″J.Fish Biol. 55:897-915.
Douglas,S.E.,S.C.M.Tsoi,et al.(2002).Expressed sequence tags-asnapshot of the fish genome.A Step Toward the Great Future of AquaticGenomics,Tokyo,Japan.
Fleming,R.E.and W.S.Sly(2001).″Hepcidin:A putativeiron-regulatory hormone relevant to hereditary hemochromatosis and theanemia of chronic disease.″Proc.Natl.Acad.Sci.USA98(15):8160-8162.
Garvan,J.(1996).SeqVu.Sydney,Australia,The Garvan Institute ofMedical Research.
Goldman,M.J.,G.M.Anderson,et al.(1997).″HumanBETA-DEFENSIN-1 is a salt-sensitive antibiotic in lung that is inactivatedin cystic fibrosis.″Cell.88:553-60.
Gong,Z.,K.V.Ewart,et al.(1996).″Skin antifreeze protein genes ofthe winter flounder,PLEURONECTES AMERICANUS,encode distinct andactive polypeptides without the secretory signal and prosequences.″J.Biol.Chem.271:4106-12.
Gudmundsson,G.H.,D.A.Lidholm,et al.(1991).″The cecropin locus.Cloning and expression of a gene cluster encoding three antibacterialpeptides in Hyalophora cecropla.″J.Biol.Chem.166:11510-7.
Hwang,E.-Y.,J.-K.Seo,et al.(1999).″Purification andcharacterization of a novel antimicrobial peptide from the skin of the hagfish,Eptatretus burgeri.″J.Food Sci.Nutr.4(1):28-32.
Jach,G.,B.Gornhardt,et al.(1995).″Enhanced quantitative resistanceagainst fungal disease by combinatorial expression of different barleyantifungal proteins in transgenic tobacco.″Plant J.8:97-109.
Jia,X.,A.Patrzykat,et al.(2000).″Antimicrobial peptides protect cohosalmon from Vibria anguillarium infections.″APPL.Environ.Mirobiol.66:1928-32.
Krause,A.,S.Neitz,et al.(2000).″LEAP-1,a novel highlydisulfide-bonded human peptide,exhibits antimicrobial activity. ″FEBS Lett.480:147-150.
Kuchler,K.,G.Kreil,et al.(1989).″The genes for the frog skinpeptides GLAA,xexopsin,levitide,and caerulin contain a homologousexport exon encoding a signal sequence and part of an amphiphilic peptide.″Eur.J.Biochem.179:281-5.
Lauth,X.,H.Shike,et al.(2002).″Discovery and characterization oftwo isoforms of moronecidin,a novel antimicrobial peptide from hybridstriped bass.″J.Biol.Chem.277:5030-5039.
LeMaitre,C.,N.Orange,et al.(1996).″Characterization and ionchannel activities of novel antibacterial proteins from the skin mucosa ofcarp (Cyprinus carpio).″EUR.J.Biochem.240:143-149.
Marck,C.(1992).DNA Strider Version 1.2.Service de Biochimie-Bat142,Centre d′Etudes Nucleares de Sacray.Gif-sur-Yvette,France.
Moore,K.S.,S.Wehrli,et al.(1993).″Squalamine:an aminosterolantibiotic from the shark.″Proc.Natl.Acad.Sci.USA.90:134-1358.
Nakayama,K.(1997).″Furin :a mammalian subtilisin/Kex2p-likeendoprotease involved in processing of a wide variety of precursor proteins.″Biochemical J.327:625-635.
Nicolas,G.,M.Bennoun,et al.(2001).″Lack of hepcidin geneexpression and severe tissue iron overload in upstream stimulatory factor 2(USF2) knockout mice.″Proc.Natl.Acad.Sci.USA.98(15):8780-8785.
Oren,Z.and Y.Shai(1996).″A class of highly potent antibacterialpeptides derived from pardaxin,a pore-forming peptide isolated from Mosessole fish Pardachirus marnioratus.″Eur.J.Biochem.237(1):303-310.
Padros,F.,G.Minkoff,et al.(1993).″Histopathological eventsthroughout the development of turbot(Scophthalmus maximus L.).″J.Comp.Pathol.109:321-4.
Padros,F.,R.Sala,et al.(1991).Organogenesis in turbot,Scophthalnius maxinius,larvae related to the main developmental stages:inLarvi′91.Fish and Crustacean Larviculture Symposium.Ghent,Belgium:European Aquaculture Society.
Park,C.B.,J.H.Lee,et al.(1997).″A novel antimicrobial peptidefrom the loach,Misgurnus anguillicandatus.″FEBS Lett.411:173-178.
Park,C.H.,E.V.Valore,et al.(2001).″Hepcidin,a urinaryantimicrobial peptide synthesized in the liver.″J.Biol.Chem. 276(11):7806-7810.
Park,I.Y.,C.B.Park,et al.(1998).″Parasin I,an antimicrobial peptidederived from histone H2A in the catfish,Parasilurus asotus.″FEBS Lett.437(3):258-262.
Pigeon,C.,G.Ilyin,et al.(2001).″A new mouse liver-specific gene,encoding a protein homologous to human antimicrobial peptide hepcidin,isoverexpressed during iron overload.″J.Biol.Chem.276(11):7811-7819.
Rivas,L.and T.Ganz.(1999).″EUKARYOTIC antibiotic peptides:notonly a membrane business.″Drug Discovery Today.4:254-6.
Scott,M.G.,C.M.Rosenberger,et al.(2000).″An a-helical cationicantimicrobial peptide selectively modulates macrophage responses tolipopolysaccharide and directly alters macrophage gene expression.″J.Immunol.165:3358-3365.
Shike H,Lauth X,Westerman ME,Ostland VE,Carlberg JM,Van OlstJC,Shimizu C,Bums JC(2002).″Bass hepcidin is a novel antimicrobialpeptide induced by bacterial challenge.″Eur J Biochem:269:2232-2237.
Silphaduang,U.and E.J.Noga(2001).″Peptide antibiotics in mast cellsof fish.″Nature 414:268-9.
Smith,V.J.,J.M.O.Fernandes,et al.(2000).″Antibacterial proteins inrainbow trout,Oncorhynchus mykiss.″Fish Shellfish Immunol.10:243-260.
Thompson,J.,D.Higgins,et al.(1994).″CLUSTAL W:improving thesensitivity of progressive multiple sequence alignment through sequenceweighting,position specific gap penalties and weight matrix choice.″NucleicAcids Res.22:4673-4680.
Trust T.J.,Ishiguro,E.E.,Chart,H.and Kay W.W.(1983)Virulenceproperties of Aeromonas salmonicida.J.World Maricul.Soc.14:193-200.
Valore,E.V.,E.Martin,et al.(1996).″INTRAMOLECULAR inhibitionof human defensin HNP-1 by its propiece.″J.Clin.Invest.97:1624-9.
Wu,M.,E.Maier,R.Benz,and R.E.W.Hancock.1999.Mechanism ofinteraction of different classes of cationic antimicrobial peptides with planarbilayers and with the cytoplasmic membrane of Escherichia coli. Biochem.38:7235-7242.
表1.用于分离pleurocidin样序列的寡核苷酸的核酸序列
引物 氨基酸序列 核酸序列(5′_3′)
筛选cDNA文库
PleuroA FFKKAAHVGKH TTCTTCAAGAAGGCYGCYCAYG
T[C/G]GG[C/A]AAGCA
PleuroB HVGKAALTHYL1 CAYGT[C/G]GG[C/A]AAGGCYGC
YCT[C/G]AA[C/T/A]CAYTACCT
基因组PCR与RT-PCR
PL1 5′非翻译区 GCCCACTTTGTATTCGCAAG
PL2 3′非翻译区 CTGAAGGCTCCTTCAAGGCG
PL5′ MKFTATF ATGAAGTTCACTGCCACCTTC
PL3′ KRAVDE1 TCATCGACTGCGCGCTT
1互补
表2.用于检测美洲拟鲽不同组织和不同发育阶段的pleurocidin样基因表达的寡核苷酸的核酸序列
基因 引物 氨基酸序列 核酸序列(5′_3′)
WF1 RTWF1 KGRWLER AAGGGCAGGTGGTTGGAAAGG
RTWF1/3′ YQEGEE1 CCCTCCCCCTCCTGGTA
WF1a RTWF1a RKRKWLR CGTAAGAGAAAGTGGTTGAGA
RTWF1a/3′YQEGEE1 CCCTCCCCCTCCTGGTA
WF2 RTWF2 KAAHVG AAGGCTGCTCACGTTGGC
PL2 3′非翻译 CTGAAGGCTCCTTCAAGGCG
WF3 RTWF3 FLGALIK TTCTTAGGAGCCCTTATCAAA
RTWF3/3′ YDEQQE1 CTCCTGCTGCTCGTCATA
WF4 RTWF4 HGRHAA CATGGTCGTCATGCTGCC
PL2 3′非翻译 CTGAAGGCTCCTTCAAGGCG
WFYT RTWFYT GFLFHG GGGATTTCTTTTTCATGG
RTWFYT/3′SFDDNP1 GGGTTGTCATCGAATGAG
WFX RTWFX RSTEDI CGTTCTACAGAGGACATC
RTWFX/3′ DDDDSP1 GGGGCTGTCATCATCATC
表3.在RT-PCR检测中用来分析hepcidin基因表达的引物的核酸序列。给出了5′引物设计基础的氨基酸序列。3′引物位于3′非翻译区(3′UTR)。表中列出了PCR反应中的退火温度及扩增产物的大小。
类型(大小)(bp) | 引物产物 | 氨基酸序列 | 核酸序列(5′_3′) | 退火温度 |
美洲拟鲽I型II型III型Actin大西洋鲑鱼I型II型Actin | HcPA15′137HcPA1b3′HcPA25′180HcPA2b3′HcPA35′118HcPA3b3′ActF(WF)312ActR(WF)*ActinFI194ActinR1HCSS5′163HepLivRHepSpF163HepSpRAct400F400Act400R | WMENPT3′UTRGMMPNN3′UTRWMMPNN3′UTRAALVVDVLLTEAP*VFPSIVHTFYNELMHLPEP3′UTRMNLPMH3′UTRIVGRPRHQGYALPHAI | TGGATGGAGAATCCCACCGTGAGGTTGTGTTGCGGGGGGATGATGCCAAACAACACTTGGACTATGGGCTGAGTGGATGATGCCATACAACGTTGTTGGAGCAGGAATCCTCGCTGCCCTCGTTGTTGACGGAGCCTCGGTCAGCAGGAGTGTTCCATCCATCGTCGAGCTCGTTGTAGAAGGTGTATGCATCTGCCGGAGCCTCATTGCAAACATGTACAAACTAGATGAATCTGCCGATGCAGGGCAAATTAAAGGCGTCGTCGGTCGTCCCAGGCATCAGATGGCGTGGGGCAGAGCGTAACC | 50℃50℃50℃50℃50℃55℃52℃52℃ |
*互补
表4.用于活性试验的pleurocidin样肽序列。依据文中所述的原则,根据分析得到的翻译后的核酸序列选择最终的肽序列和c-末端酰胺化形式。
来源 | 氨基酸序列 | 编号 |
美洲拟鲽(1)美洲拟鲽(1a)美洲拟鲽(1a-1)美洲拟鲽(2)2.1美洲拟鲽(3)美洲拟鲽(4)1.1美洲黄盖鲽YT2美洲拟鲽X美洲拟鲽Y美洲拟鲽Z拟庸鲽AP1拟庸鲽AP2拟庸鲽AP3美首鲽GcSc4C5美首鲽GcSc4B7美首鲽GC3.8-t美首鲽GC3.8美首鲽GC3.2大比目鱼Hb26大比目鱼Hb18 | GKGRWLERIGKAGGIIIGGALDHL-NH2WLRRIGKGVKIIGGAALDHL-NH2GRRKRKWLRRIGKGVKIIGGAALDHL-NH2GWGSFFKKAAHVGKHVGKAALTHYL-NH2FLGALIKGAIHGGRFIHGMIQNHH-NH2GWGSIFKHGRHAAKHIGHAAVNHYL-NH2RWGKWFKKATHVGKHVGKAALTAYL-NH2RSTEDIIKSISGGGFLNAMNA-NH2FFRLLFHGVHHGGGYLNAA-NH2FFRLLFHGVHHVGKIKPRA-NH2GWKSVFRKAKKVGKTVGGLALDHYL-NH2GWKKWFNRADDVGKTVGGLAVDHYL-NH2GWRTLLKKAEVKTVGKLALKHYL-NH2AGWGSIFKHIFKAGKFIHGAIQAHND-NH2GFWGKLFKLGLHGIGLLHLHL-NH2GWKKWLRKGAKHLGQAAIK-NH2GWKKWLRKGAKHLGQAAIKGLASGWKKWFTKGERLSQRHFAFLGLLFHGVHHVGKWIHGLIHGHH-NH2GFLGILFHGVHHGRKKALHMNSERRS | NRC-01aNRC-02a,dNRC-03a,dNRC-04aNRC-05aNRC-06aNRC-07bNRC-08b,cNRC-09b,cNRC-10b,cNRC-11bNRC-12bNRC-13bNRC-14bNRC-15bNRC-16bNRC-17bNRC-18bNRC-19bNRC-20b |
a从表达标签和/或由RT-PCR和/或原位杂交验证的表达预测的肽
b从基因组序列预测的肽
c假基因
dNRC-2和NRC-3均来源于相同序列,并且后者包括附加的N末端片段。
表4a.本研究采用的细菌与念珠菌株
种类 | ID号 | 评述 |
Escherichia coliEscherichia coliEscherichia coliSalmonella entericas.TyphimuriumSalmonella entericas.TyphimuriumPseudomonas aeruginosaPseudomonas aeruginosaEnterococcus faecalisStaphylococcus aureusStaphylococcus aureusStaphylococcus epidermidisStaphylococcus epidermidisBacillus subtilisAeromonsa salmonicidaAeromonas salmonicidaCandida albicans | C498,UB1005C500,DC2C786,CGSC4908C587,14028SC610,MS4252SH187,K799H188,Z61C625,ATCC29212C622,ATCC25923C623,SAP017C960,ATCC14990C621C971,ATCC663399-1,A44997-4C627,CALB105 | DC2的母体外膜-通透变异三重营养缺陷(thy,uri,L-his)C610的母体超易感株H188母体超易感株标准株(ATCC)标准株(ATCC)MRSA临床分离(来自TonyChow-VGH)标准株(ATCC)临床分离(来自David Speert-Children’s)标准株(ATCC)在IMB测序的区域分离种群区域分离种群酵母试验株 |
表5.使用PL5′和PL3′扩增的基因组序列中内含子的大小(bp)
基因 | 外显子 | 内含子 | 外显子 | 内含子 | 外显子 | 总数 |
WF1WF1a1WF22WF3WF42 | 154103100100100 | 539?525374230 | 3131311931 | 95?10897101 | 8282496449 | 901?813654511 |
1由于该序列只能由RT-PCR产物表示,因而不能检测到内含子的大小
2也使用引物PL1和PL2的扩增序列
表6.来自皮肤和肠的对应不同的pleurocidin基因的RT-PCR产物
皮肤条带 | 肠 | 大小 | |
4WF15WF24WF3n/d1WF4n/d1 | n/d129n/d17 | 265bp175bp175bp215bp | n/d2 |
1未检出
2基因组PCR未检测出(对应WF1a)
表7.美洲拟鲽DNA的BamHI和SstI消化产物中用pleurocidin探针杂交的条带大小(kb)
探针 | BamHI | SstI |
WF1xWF2xWF3WF4 | >24,66>2417,6 | 19,17,4.5,4.4,3.0,2.9,2.2,1.3,19,17,4.5,4.4,2.9,x 1.3,19,17,4.5,x 2.9,x 2.2,1.3,x19,17,4.5,4.4,2.9,x 2.2,1.3,1.2 |
x=没有杂交条带证据
表8.针对广谱的细菌和Camdoda Albicans的pleurocidin样阳离子抗菌肽的最小抑制浓度。病原体生长在Mueller-Hinton肉汤中并暴露于一定浓度范围的所述特定肽。抑制至少50%细菌生长的最低肽浓度记录为最小抑制浓度。
A.sal99-1 | A.sal97-4 | S.typhMS4252s | S.typh14028s | P.aeruK799 | P.aeruZ61 | E.coilC786 | E.coilUB1005 | E.coilDC2 | S.epiC621 | MRSAC623 | C.albC627 | |
NRC-1 | 64 | 64 | 16 | >64 | >64 | 32 | 32 | 32 | 32 | >64 | >64 | 64 |
NRC-2 | >128 | 128 | 64 | >64 | 64 | 32 | 64 | 64 | 64 | >64 | >64 | >64 |
NRC-3 | 2 | 4 | 2 | 8 | 2 | 1 | 2 | 8 | 2 | 8 | 8 | 4 |
NRC-4 | 2 | 2 | 2 | 16 | 8 | 4 | 2 | 4 | 2 | 8 | 8 | 8 |
NRC-5 | >64 | >64 | 64 | >64 | >64 | 32 | 64 | 64 | >64 | 32 | 32 | >64 |
NRC-6 | 4 | 4 | 4 | 64 | 16 | 4 | 4 | 4 | 2 | >64 | 32 | 32 |
NRC-7 | N/A | N/A | N/A | N/A | N/A | N/A | N/A | N/A | N/A | N/A | N/A | N/A |
NRC-8 | >64 | >64 | >64 | >64 | >64 | >64 | >64 | >64 | >64 | >64 | >64 | >64 |
NRC-9 | >64 | >64 | 64 | >64 | >64 | 64 | 64 | >64 | >64 | >64 | >64 | >64 |
NRC-10 | >64 | 32 | 16 | >64 | 32 | 8 | 32 | 32 | 32 | 32 | 64 | >64 |
NRC-11 | 8 | 8 | 4 | 32 | 32 | 4 | 4 | 16 | 4 | 64 | >64 | 32 |
NRC-12 | 2 | 2 | 2 | 8 | 4 | 1 | 2 | 8 | 2 | 8 | 16 | 4 |
NRC-13 | 4 | 2 | 2 | 8 | 4 | 1 | 2 | 4 | 2 | 4 | 4 | 4 |
NRC-14 | 32 | 16 | 16 | >64 | 32 | 8 | 16 | 16 | 16 | 16 | 16 | >64 |
NRC-15 | 8 | 16 | 4 | 16 | 8 | 4 | 8 | 8 | 8 | 4 | 4 | 16 |
NRC-16 | 2 | 1 | 0.5 | 16 | 4 | 1 | 1 | 2 | 0.5 | 16 | 32 | 8 |
NRC-17 | 2 | 1 | 1 | 8 | 4 | 2 | 1 | 4 | 1 | 32 | 16 | 8 |
NRC-18 | >64 | 128 | 32 | >64 | >64 | 64 | 64 | 64 | 64 | >64 | >64 | >64 |
NRC-19 | 64 | >64 | 16 | 64 | 32 | 8 | 32 | 16 | 32 | 8 | 8 | 64 |
NRC-20 | >64 | >64 | >64 | >64 | >64 | 64 | >64 | >64 | >64 | >64 | >64 | >64 |
表9.美洲拟鲽和大西洋大比目鱼hepcidin样肽的特性
名称 | 总氨基酸 | 总半胱氨酸 | 分子量 | pI |
WF1WF2WF3WF4Hb5.3Sa18.6Hb17Hb1.1Hb357Hb7.5Sal2.1Sal1Sal2 | 278.751922222222222222252525258.53 | 8688888858788 | 3066199223672256236323312391239123972881292527202881 | 5.548.748.528.758.768.768.767.848.538.607.73 |
表10.细菌刺激过程中大西洋鲑鱼中hepcidin表达的半定量RT-PCR分析
组织 | 对照 | I型Hepcidin感染 | 比值 | 对照 | II型Hepcidin感染 | 比值 |
食管胃幽门盲肳肝脾肠脑血液肾脏前叶肾脏后叶鳃皮肤卵巢直肠心肌肉 | ndndnd1.19ndndnd0.820.060.070.130.14nd0.07nd0.38 | 0.080.090.142.360.180.21nd0.840.070.140.120.18nd0.13nd0.8 | ↑↑↑2↑↑011.2211.30202.1 | ndndndndndndndndndnd0.080.07ndndndnd | 0.090.270.371.450.410.330.50nd0.080.110.070.09nd0.080.430.60 | ↑↑↑↑↑↑↑↑↑↑↑↑↑↑~↑↑11.30↑↑↑↑↑ |
密度测量的象素密度以相对actin信号表示。感染的比值为:当两种状态下均获得数值时,可计算出对照。nd,未检测出;↑轻度上调;↑↑强烈上调
表11基于基因组和表达数据的hepcidin单字母氨基酸序列
表11(续)
表12.参照表 11的pleurocidin样基因和cDNA的核酸序列
美洲拟鲽WF1
ATGAAGTTCACTGCCACCTTCCTCCTGTTGTTCATCTTCGTCCTCATGGTTGATCTCGGAGAGGGTCGTCGTAAGAAAAAGGGGTC
GAAGAGAAAGGGGTCCAAGGGAAAGGGGTCCAAGGGAAAGGGCAGGTGGTTGGAAAGGATTGGTAAAGGTAGAGTCACGGAATTAA
TTTGCTTTTTACATTGCAAATATTTTTCATATAACATTGCTGGAAAATCACAAAAATAAGTAGTCAATATATTTGGCCAAATAGAA
TCACTTTGATTTCAATAATAATCAAAATAACAACCTAAAAGGCCTTTGATTAGCATGTTCCTTCAATGAAATGGACATTGTAATTT
ACTTTGATTCTCACATGCTACGACCTGCTGCAGCAACATTTGAAAATAAATTTGTCCCAGAAGATTTTAAAGTACATTGTTATAGG
CGATTTATCTTTCTATTACTCAGATATTTGTTCAAACCAATAGAATAACTGGATCTCTATGCTAAAATAATAAAACACACATTCAG
ATGTTACCAGTCAAGATTGAACGCTGTTTAAAAGTAAGTATGAAACATCCTCTGTATGTATAATTGTTTAACTGGTAACTTATAGT
CCTAATAATTGCGTTATGGAAATGTATTAATTGTCATTTAATATAATTTGACTGGAATTTATCACTGTGTGTTTTGTTTGTTTTTA
CACAGCTGGCGGGATAATTATCGGGGGGGCCCTTGAGTAAGGACTTCTACCATCATTACTGTGTAATATTTATAGTTATGATCAGT
ACAGTTATTAACAACTTCTCTTGTCTCGCTGAACTTCTCCATCAGTCACCTCGGGGCAGGGGAGGTGCAGGGGCCGGATTACGACT
ACCAGGAGGGGGAGGAGCTCAACAAGCGCGCAGTCGATGAA
//
美洲拟鲽WF1A
ATGAAGTTCACTGCCACCTTCCTCCTGTTGTTCATCTTCGTCCTCATGGTTGATCTCGGAGAGGGTCGTCGTAAGAGAAAGTGGTT
GAGAAGGATTGGTAAAGGTGTCAAGATAATTGGCGGGGCGGCCCTTGATCACCTCGGGCAGGGGCAGGTGCAGGGGCAGGATTACG
ACTACCAGGAGGGGCAGGAGCTCAACAAGCGCGCAGTCGATGAAA
//
美洲拟鲽WF2
GCCCACTTTGTATTCGCAAGGTAATATTGATATTTTTCATATTCATTTAGACAAATGTGCTCAGCTTGTTACTGTATAATGCAAAA
GTTAATGATCTTTATTTTTCTGTTTTTTTTTGTAGAATGAAGTTCACTGCCACCTTCCTCATGATTGCCATCTTCGTCCTCATGGT
TGAACCTGGAGAGTGTGGCTGGGGAAGCTTTTTTAAAAAGGCTGCTCACGGTAGAGTCACAGAATTAATTAGCTTTTTGCTTTGCA
AATATTTTTTTTATAACAGCTGGAAAATCACAAAAATAAATAGTATATATATTTGGCCAATAAAATCACTTTGATTTCAATAATAA
TCTAAATAACCAACCTAAAAGGCCTTTGATTAGCATGTTCCTTCAATGAAATGTACGTTGAGGTTTATTTTGATTCTCACAAGCAC
CAACCTGCTGCGTCAACAATTGAATTCAAATTTGTCCCAAAGGAATTCAAAGTAAATTTTTCTAGGCGATTTAATCTTTCCATTAC
TCTGATTTGTTTTAAAAATATAGAATAACTCAATCTCTATGATAAAACAATTACACATACATTCAGATTTTTATAGGACAAGATTG
AAAACTTCTTACAAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACATGTAACAACTAGTCCTACTAATTGTGTTAAAT
TGTCATTTAATATCAATTGCTTGAGTTTATCATTATGTGTTTTGTTTTTTTTTACACAGTTGGCAAGCATGTTGGCAAGGCGGCCC
TTACGTAAGGACTTCTACCATTTTACTGTATAATTTTGATAGTGTTATCACCAGTACTGTTTTTGACAACTTCTCTATTCCTGCTG
ACTCTCTCCATCCGACTCATCCGCAGTCATTACCTTGGCGATAAGCAGGAGCTCAACAAGCGTGCAGTCGATGAAGACCCAAATGT
TATTGTTTTTGAATGAAGAAAT
//
美洲拟鲽WF3
ATGAAGTTCACTGCCACCTTCCTGGTGCTGTCCCTGGTCGTCCTAATGGCTGAGCCTGGAGAGTGTTTCTTAGGAGCCCTTATCAA
AGGGGCCATACATGGTAGAGTCAAGGAATTAATTAGATTTTTACATGTCAAATAATGTAGTAGAACGTATATAAGTAGTCAATATA
TTTGACCAAGTAGAATCATTTTGATTTCAATAATAATCAAAATAACAATCTCCAGGCGATTTAATATTTGCAATAATTGGATTTTA
TAGAATACGGAACAACTGGATCTTAATGCTAAAATAATCCAACATACATTCTGATTTTGCCAGGCAAAATTAAACACTACTTTAAA
GTATGTATAAAACATAATCTGTATGTTATAACAAATACTCCAAGCAATTGTGTGATGGAAATGTATTCATTGTCATTTAATATAAT
TTGCTTGAGTTTATCATCTTGTGTTTTTGTTTGTTTTTTCACAGGTGGCAGGTTTATCCATGGGTAAGGACTTCTACCATCATGAC
TGTGTATTTTTAATATTATTATCATCAGTACTGTTATTGACAACTTCACTTGTCTCGCTGACTCTCTCCATCAGAATGATCCAAAA
CCATCACGGTTATGACGAGCAGCAGGAGCTCAACAAGCGCGCAGTCGATGAA
//
美洲拟鲽WF4
GCCCACTTTGTATTCGCAAGGTAATATCAATATTTTTCAAATTCATTTAGACGAGACCAACCTTTTGGGAAATCTGCTCAGCTTAT
TACTGTATAATGCAAATGTTAATGATCTTTATTTTTCTGTTTTTTTTTTGTAGAATGAAGTTCACTGCCACCTTCCTCATGATGTT
CATCTTCGTCCTCATGGTTGAACCTGGAGAGTGTGGTTGGGGAAGCATTTTTAAGCATGGTCGTCATGGTAAAGTCACGGAATTAA
TTAGCTTTTAACTTTGCAAATATTGTTTTTTTTTTTAACAGCTGGAAACTCACAAAAATAAATAGCCGATATATTTGGCCAATTAT
AATCACTTTGATCTAAATAACAACCTAAAAGGCCTTTGATTAGCATGTTTCTTCAATAAAATGATTGAACACTACTTAAAGGTATG
TATAAAACATCATCATGTGTTTTTGTTTGTTTTTACACAGCTGCCAAGCATATTGGCCATGCAGCCGTTAAGTAAGGACTTCTACC
ATTATTACTGTATAATTTTGATAGTATTATCACCAGTATTGTTATTGACAACTTCTCTTTTTCCTGCTGATCCGACTCATCCGCAG
TCATTACCTTGGCGAGCAGCAAGATCTCGACAAGCGCGCAGTCGATGAAGACCCAAATGTTATTGTTTTTGAATGAAGAAAT
美洲黄鲽YT2
ATGAAGTTCACTGCCACCTTCCTCATGATGTGCATCTTCGTCCTCATGGTTGAACCTGGAGAGTGTCGTTGGGGGAAATGGTTTAA
AAAGGCCACACACGGTAGAGTCACAGAATTAATTAGCTTTTTGCTTTGCAAATATTTTTTTATAACAGCTGGAAAATCACAAAAAT
AAATAGTCTATATATTTGGCCAATTAGAATCACTTTGCTTTCAATAAAAATCTAAATAACAACCTAAAAGTCCTTTGATTAGCATT
TTCCATCAATGAAATGGACGTTGAGGTTTATTTTGATTCTCACATGCACCGACCTGCTATGTCAACAATTGAATACAAATTTGTCC
CAGAGGAATTCAAAGGAAATTTTTCTAGGCGATCTAATCTTTCCATTACTCGGATTTGTTTTTAAATATATAGAATAACTCAATCT
CTATGATAAAATAATAACACATACGTAAAGATTTTTACAAGACAAGATTGAAAACTTCTTAAAAGTACGTATAAAACATCATCTGT
ATTTATAATTGTTTAACATTTAACAAATAGCCCTACTAATTGTGTTATGGAAATGTATAAATTGTCATTTAACATAACTTGTTTGA
GTTTATCATTATTTGTTTTTGTTTGTTTTTACACAGTTGGCAAGCATGTTGGCAAGGCOGCCCTTACGTAAGGACTTCTACCATCA
TTACTGTATAATTTTGATAGTATTATCACCAGTACTGTTATTGACAACTTCTCTTGTCCTGCTGACTCTCTCCATCCGACTCATCC
ATAGTGCTTACCTTGGCGACAAGCAAGAACTCGACAAGCGCGCAGTCGATGA
//
美洲拟鲽 WFX
TAATAAAACTAATGTGTAAAGTCTTCCACTTTTTTTACTGTATTTACTTAAACAGAAAATTATTCTCACGATTCTGGAGCTGCAGC
CACTAAGTGTTGCTTCATGAAGTGAATACACAATTGTTCTAACAACCACTCACCCAATTAACCAGAATCTACAAAGTGAGGAAGTG
AGAGGAGTCGTCCTGTGTTTTCAAATTTTTTGAATGATCTACCACTATGTGAGCTCCTCCTGTTATAGCTCTAAATGTTACACAAT
GAATGTGAAGTCAGTTCTGTGTATATAAAGAGTTGCCTCTGTAGAGCATACAACAGATTTCACCTTTGAATCTCACAAACCTCACT
TTGTATTCGACAGGTAAGATCGATATTTTTCAAACTCATTTAGACGAGACCAAGTATTTGGGAAATGTGCTCAGCTTGTCAATGTA
TAATGCAAATGTTAACAATCGTTTTGTTCTTATGTTGTGTTTGTAGGATGAAGTTCGCTACTGCCTTCCTGATGTTGTCCATGGTC
GTCCTCATGGCTGAACCTGGAGAGTGTCGTTCTACAGAGGACATCATCAAGTCTATCTCGGGTAGAGTCCAGGAATTAATTATTAT
CAATAACAATGAAATAACAACCAAAAGGCCTCTGATTAGCATGTTCCTTCAATGAAATGGTCGTTTTTTATCTATTTTGATTCTCA
CATGCAACGACCTGCTGCGGCAACATTTGAAAATCAATCTTTTTTACACAAATTCAAAGTACATTGATTTATTCGATTTAATCTTA
ACATTAATCAGATTTGTTTTTGTTTAAATATATCGAATAACTGGATCTCTATGATAAAATAATTAAACATACATTCTTATTTTACC
AATCAAGATTGAACACTTCTTAAAAGTACGTATAAAACATCATCTGTATGTATAATTGTTTGATTGTTAAGTAATATTTCCAATAA
TTGTGTAATGGAAATGTATTAATTGTCATTTAATATAATTTGCTTGAATTTATCACCATGTGTTTTTTGTTTGTTTTTAAACAGGT
GGAGGTTTTCTCAATGCGTAAGGACTTCTATCATCATTACTGTGTAATTTTTATAGTATTATCATCAGTACTGTTATTAACAGCTT
CTCTTGTCTCACTGACTCTCTCCATCAGAATGAACGCCGGTTACAATGAGCAGCAGGAGCTCAACAAGCGCTCAGATGATGATGAC
AGCCCCAGTCTTATTGTTTTTGACTGAAGAAGTCGCCCTGAAGGAGCCTTCAGATGATATATTATGCTTCTTGCTCTTCATTGAAA
TAAATCAAAC
//
美洲拟鲽WFY和WFZ(来自相同假基因的可选择拼接产物)
GAGCTCGATCAAACCAGACAAAGTTGCCTTCCTTCACAACAATAGAGTGGAAGAGAAAACAGGAGAGGACTTGTATCCTCCTGATG
CTGAGAAGAAGAAATAAGAAAGACTTGCAGCATTGATACTTTTACTTATACAGAAAACCTATAAACATGACGGGAGCATAAGTTAA
AGTCACAATACAGAAGAGAACCAGAAGCCAAACTGCAGCAAATTTACTGGTATTCATATGATACTGGAGCCAAAGCAACGCAGAGA
CTCAGCAGCAGTGAACCAAAGAGTTTAACTGTACTTGTGTCCAGGTTGAATGAAAGTATTGAATAAAAAAAACCTAGACAGAACAT
GCATATTTTTTTGGAATGGAATATAAGTCAGGAGAATATGTGTTGTTGTGGTGGCAGGATCCATCACTCTGTCAAGTTAACACAAG
AACTTTTAGAAACATAGATACGATCTCAAGTAAACTTCCATTTACTATTTGACTTTTTTTAAATACTTACAAATTATATTTTAAAA
AGCAACAATAAATCAGAGATAACTTCATGGAGAAGTCTATATTCATATTTGTGAGCTGAACATTCATGCTGCCTGTTCTATCACAT
CTGAGTGTGGAGGCCACTGACGTTTACTGACCTCAACGTCTACCGCTCTAATGCATTTGGAGTTAAAGGTAAGCATTTTGTTATTT
GTCTTCACTGTATTGATACTAAATATACAGGGTTACAAATACAGTTAAAACAAGAGAGACGAGGTGTCGAAAGCTTCAGCATCAAT
GTGCTGAACGCTGATAGCTGATCTTACCCGACACCGGTGACATGGCATCAAAATGACCACCTCTTTTTTCTTCTCTTTTTTTTGTA
GGACGAAGTTCGCTGCCGCCTTCCTCGTGTTGTTCATGGTCATCGTCATGTTTGAACCTGGAGAGTGTTTTTTTAGATTGCTTTTT
GACGGGGTCCACCATGGTAGGGTCCCGGAAGTAATTTGATTATTACATGCCAAATATTTTAATGAAACATACCTTATGAGTAGTTG
TATTATTTGGACAAGTAGAATCTCTATGATTTCAGTAGTAATTAGAATAACAATCAAAAAGGCCTTTGATTAGCATGTTTCTTCAA
TGAAATGGACATTGAGGTTTATTTTGATTCTCACATGCTACAGCAACAATTGAAATCAAATTTTTCGCAGAAGAAACTTAATTAAC
ATTGTTGTGCAATAGTGCTTAAAAAGTGTTACCATGGAATGGTGTGCGTTTAGGCACTCAATAAATTTGGTTATCAAAATTAAATT
AAAAAAATTAATATTTAAAATATTAATATTAAATCATAACTTTAATTGTTTAAAGTTCTCGCGGGGAACCACCCTTCTTCTGAAGG
TAAAGGATAGCCAATTTATTGATTAAGATCAGTCTCATTTAGATCTAGTTCAAATAGAAATCTCAATATTTTACCATCGAAGATTT
TATAATGAACACTGAAGGTTATGGAGTTCTAAACAGTGTAACAGTTGGCAAAGTTCACTATTGCAATATTAATGACAGACCATTTG
TGAAAGAAGAACATTTATTATGAGCATAATAAAGTATGAAAGCACGAATTACTAAACAATCAAAGCTAACRAACAAGGACGTGTGT
GGGTGTGTGTGTGAATGTAAATAAGGGGGGGGCTCAAACTGGTGGCCTACAAGAAGAGCCTTAAGATAGCAACCACAAGGGCTGTA
CCATAAATGTTGTAGTAAAAAGAGTTATTAAAATGAGTTAGAATAACTAATGACTAATTAGTAGACAAACTAGTAGACAAACTAAA
CAACTAACAATAACAAGGAAGTGTGTGTGAGTGTGTTTGTGTGTAAATGTTAATTAGGGGCTCTCAAACTGGTGTCTTACCAGAAG
AGTAAGATAACAATTCCCCCCCTTCTTCTGAGGTTGTTTTACGACTGTTGCTTTATGGCCGTGAGGGAAGGTTTAACTCGGTGACA
TGCTATACGTGTCTGTGTAGATGTTAATCAGAGAATGCCAGAGTCAGAGAGACCTACGGAGGAAGTCTGTGAAGGGCCTATCTAAC
ATTAGCTTTCCTTTAACTTATAACACAATATCAGAAACACATATCAACCTTATAAACACACACAGAATCAAATAAACAGTCTTGCT
TAGCATGTATAATTATTAAGCCCAGATTATGTTACCAGTCCGAGGGAAAGAGTTCAGTTGCAGTTCTGTGACGTCTCCTGGCTTTG
TGGTCGTAGAGTTCTGCATTCGCGATTCTGTCGAGCCGTGTGCTCAGATGCAGGTTGAAGTTCTCCTGCAGGACATCGCGTCGCTG
CGAGGATTTTGTAGAGCTTGAAGGGCGAGGAGATTTCCTTGAGTGGTGAGCTGGAAGCTGGACCTCTGACCTCTGGTTGTTGGTTG
GAAGAGAAGAAAGCTGGAGCGGCGTGGTTTCTCCCTCTAGCCGATGCAGGAGGAGAAGCCGGCAGCCCCACTCCTTGAAGAGTTGT
GGAGAGAGATGGGAGCAAAGAGCTAGATTTTGGGGAGACCTCTCCTTATATTGGCCCCGATGACCTCACAGGCCTTGGAACGGAGT
GACCAATAGGAGTTGACCCTGGTAATTCTTGACACCTTTGTGGGACATTGTCAAGACCCCAGGACATGCAGCATCCTGTTACAATC
TGGGAGACGGAGTTCCTTGACTGTCTCAGAACAATGAGAACCTGTGGCATCTTGGGGGATTGAGTCCACTCGAGCACATGCGGCAT
GTTTGTTCCAAGTTTGACTGAAAGGAGGCCTGTGGTTTGCACAAAAACCATGTCCCAACAACATTTTCTAGGCCATTTAATCTTTA
CATAAATTGGATTTGTTTTAAAAAATATATAGAATAACTCGATCTTTCTGCGTAAATAATAAAAAATAAATTCAAATTTGACCAGT
CAAGATTGAACACTAATGAAAAGTACCTATAAAACATAATCTGTATGTATAGTTGTTTGACTGTTAAATAGTAGTCCTAACAATTG
TGTAATGGAAATGTATTCATTGTCTTTTAATACTATTTGCTTATCATAATGTGTTTGTTTGTTTTTTAGCAGGTGGAGGTTATCTC
AATGCGTAAGGACTTCTACCATCATTACTGTGTAATTGTATTAGTTTTATCATCAGTACTGTTATTGACAACGTCTCTTGTCTTGC
TGACTTGACTCTCTTCATCAGATTAAACCCAGGGCCGGTTACAATGAGCAGCAGGAGCTCGACAAGCGCGCAGTCGATGACAACCT
CAGTGCTATTGTTTTTTACTGAAGAAGTCGACCTGAAGAATCTTTTGAAATGATATGAAATGTTTGCCTTTCAATGAAATAAATCA
AACATGACTGGATATTTGTTCTTTTGCATTGATGTATTGTTGAGTGACAGTTGAATAATTTTGGAAAACTTATAACAGATCTCAAT
TTTAGGATGTCAAATCATTTCTCTGTGTCTTATTCAAATATGAGATTTAACAATGACAAT
//
拟庸鲽AP1
GCCCACTTTGTATTCGCAAGGTAAGATCAATATTTTTCAAATTCATTTAGACGAGACCAACCGTTTGCGAAATGTGCTCAGCTTGT
TATTGTATAATAACAAAGTTAACGATCTTTATTTTTCTGTTTTTTTGTAGAATGAAGTTCACTGCCACCTTCCTGATGTTGTTCAT
CTTCGTCCTCATGGTTGAACCTGGAGAGTGTGGATGGAAAAGTGTGTTTCGTAAGGCTAAGAAAGGTAGAGTCACGGAATTAATTA
GCTTTTTACATTGCAAATAGATTTTTTATAACAGCTGGAAAATCACAAAAATAAATAGTCGATATATTTGGCCAATTAGAATCACT
TTAATTTCAATAATAATCTAAATAACAACCTAAAAGGCCTTTGATTAGCATGTTTCTTCAATGAAATGGACATTGAGGTTTATTTT
GATTCTCACATGCACCGACCTGTGCGGCAACCATTGAATTCAGATTTGTCCCAGAAGAATTCAAAGTACATTTTTCCAGGCGATTA
AATCTTTCCATTACTCAGATTCAAAAATAAATAAATGGAATAATTGAAGCACTATGATAAAATAATTACACATTCACTCTGACTTT
ACAAGTCAAGATTGAACACTATTAAAAAGTGTGTATAAAACAACATCTGTATGCATAATTGTTTAACTGTTAATAGTCCTAATAAT
TGTTTTATGGAAATGTATTAATTTACATTTAATATTATTTGCTTGAGTTTACCATCATGTGTTTTTGTTTGTTTTTACACAGTTGG
CAAGACTGTTGGCGGCTTGGCCCTTGAGTAAGGACTTCTACCATCATTACTGTATAATTTTGATAGTATTATCACCAGTACTGTTA
TTAACTACTTCTCTTGTCRGCTGACTCTCTCCATCCGACTCATCTGCAGTCATTACCTTGGCGAGCAGCAGGAGCTTGACAGCGCG
CAGTCGATGAGGACCCCAGTGCTATTGTCTTTGACTGAAGAAGTCGCCTTGAAGGAG
//
拟庸鲽AP2
ACTTTGTATTCGCAAGGTAAGATCAATATTTTTCAAATTCATTTAGACGAGACCAACCGTTGGCGAAATGTGCTCAACTTGTTATT
GTATAATAACAAAGTTAACGATCTTTATTTTTCTGTTTTTTTGTAGAATGAAGTTCACTGCCACCTTCCTGATGTTGTTCATCTTC
GTCCTCATGGTTGAACCTGGAGAGTGTGGATGGAAAAAATGGTTTAATAGGGCTAAGAAAGGTAGAGTCACGGAATTAATTACCTT
TTTACATTGCAAATAGATTTTTTATAACAGCTGGAAAATCACAAAAATAAATAGTCGATATATTTGGCCAATTAGAATCACTTTAA
TTTCAATAATCTAAATAACAACCTAAAAGGCCTTTGATTAGCATGTTTCTTCAATGAAATGGACATTGAGGTTTATTTTGATTCTC
ACATGCACCGACCTGTGCGGCAACCATTGAATTCAGATTTGTCCCAGAAGAATTCAAAGTACATTTTTCCAGGCGATTAAATCTTT
CCATTACTCAGATTCAAAAATAAATAAATAGAATAATTGAAGCACTATGATAAAATAATTACACATTCACTCTGATTTTACAAGTC
AAGATTGAACACTATTAAAAACTGTGTATAGAACATCATCTGTATGTGTAATTGTTTAACTGTTAATAGTCCTAATAATTGTTTTA
TGGAAATGTATTAATTTACATTTAATATTATTTGCTTGAGTTTACCATCATGTGGTTTTGTTTGTTTTTACACAGTTGGCAAGACT
GTTGGCGGCTTGGCCGTTGAGTAAGGACTTCTACCATCATTACTGTATAATTTTGATAGTATTATCACCAGTACTGTTATTAACTA
CTTCTCTTGTCTCGCTGACTCTCTCCATCCGACTCCTCTGCAGTCATTACCTTGGCAAGCAGCCGGAGCTCGACAAGCGCGCAGTC
GATGAGGACCCCAGTGCTATTGTCTTTGACTGAAGAAGTCGCCTTGAAGGAGCCTTCAGAA
//
拟庸鲽AP3
TTGCCCACTTTGTATTCGCAAGGTAAGATCAATATTTTTCAAATTCATTTAGACGAGACCAACCATTTGGGAAATGTGCTCAGCTT
GTTACTGTATAATGCAAAAGTTAAGTATCTTTATTTTTCTGTTTTTTTTTGTAGAATGAAGTTCACTGCCAACTTCCTCATGTTGT
TCATCTTCGTCCTCATGTTTGAACCTGGAGAGTGTGGTTGGCCAACATTGCTTAAAAAAGCTGGTCACGGAATTAATACGCTTTTT
ACATTGCAAATAGATTTTTTATAACAGCTGGAAAATGACAAAAATAAATAGTCGATATATTTGGCCAATTAGAATTATTTTGATTT
CAATAATAATCTAAATAACAACCTAAAAGGTCTTTGATTAGCATGTTTCTTCAATGAAATGGACATTQAGGTTTATTTTGATTCTC
ACATGACCGACCTGCTGCGGCAACAATTGAATTCAGATTTGTCCCAGAAGAATTCAAAGTAAATTTTCCAGGGGATTAAATCTTTC
CATTACTCGGATTTAAAAAAAAAAAAAATAGAATAACTGAATTGCCATGAAAAAATAATTACACATACTGTCTGATTTTACAAGTC
AAGATTGAACACTACTTAAAAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACTGTTAACAAATAGTCCAAATAATTGT
GTTATGGAAATGTATTAATTGTCATTAAATATAATTTGCTTGAGTTTATCATCATGTGTTTTTTTTTTTTTTTTACACAGAGGTTA
AGACTGTTGGCAAGTTGGCCCTTAAGTAAGGACTTCTACCATCATTACTGTATAATTTTGATAGTATTATCACCAGTACTGTAGTA
CTGACAACTTCTCTCTCCACCCAACTCATCCGCAGACATTACCTTGGCAAGCAGCCGGAGCTCGACAAGCGCGCAATTGATGACGA
CCCCAGTATTATTGTTTTTGACTGAAGAAGTCGCCTTGAAGGAGCCTTCAGAA
//
美首鲽GcSc4C5
ATGAAGTTCACTGCCACCTTCCTCATGATGTTCATGGTCGTCCTCATGGCTGAACCCGGAGAGGCTGGTTGGGGAAGTATTTTCAA
ACATATTTTCAAAGCTGGAAAGTTCATCCATGGTGCGATCCAGGCACACAATGACGGCCAGGAGCAGGATCTCGACAAGCGCGCAG
TCGATGA
//
美首鲽GcSc4B7
ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTTTGGGGAAAGCTTTTGAA
ATTGGGCATGCATGGAATCGGGCTGCTCCATCAGCATTTGGGTGCTGACGAGCAGCAGGAGCTCGACGAGCGCTCAGAGGAGGACG
AGCCCAATGTTATTGTTTTTGAATGAAGAAGTCGCATTGAAGGAGCCTTCAG
//
美首鲽GC3.8
ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGGATCCGGAGAGTGTGGTTGGAAAAAGTGGCTCCG
TAAAGGTAGAGTCATGGATTTAATTTGCTTTTTACATTGCAAATACTTTAATATAACATAGTTGGAAAACCACAAAAATAAGTAGT
CGATATATTTGGCCATATAGAATCACTTTGATTTCAATAATAATCAAAACAACAATCAAAAAGCCCATTGATTAGCATGTCCCTTC
ACTAAAATGGACATTGTAATTTATTTTGATTCTCACAGGCACCAACCTGCTGCGGCAACAATTGAAATCAAATTTGTCTCAGAAGA
ATTCAAAGTACATTGTTCTAGGCGATTTAATCTTTCCATTCATCGGATCTGTTTTTAAAAATATAGAATAACTGGATCTCTATGTT
AAAATAATAAAACACACATTCTGATTTTACCTGTCAAGATTGAACACGACTTAAAAGTATGTATAAAACATCATCTGTATGTATAA
TTGTTTAACTGTCAACTAATAGTCCAAATAATTGTGTTATGGAAATGTATTCATTGTCATATAATATCATTTGCTTGAATTTATCA
CCATGTGTTTTTGTTTGTTTTTACACAGGTGCCAAGCACCTTGGCCAGGCGGCCATTAAGTAAGGACTTCTACCATCATTACTGTG
TAATTTTAACAGTATTATCATCAGTACTGTTATTGACAACTACTCTTGTCTCTGTTACTCTCTCCAGGGGTTTGGCCTCTTGCGAA
GAGCAGCAGGAGCTCGACAAGCGCTCAATGGATGACGAGCCCAGTGCTATTGTTTTTGACTGAAGAAGTCGCCTTGAAGGAGCCTT
CA
//
美首鲽GC3.2
ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGGATCCGGAGAGTGTGGTTGGAAAAAGTGGTTCAC
TAAAGGTAGAGTCATGGATTTAATTTGCTTTTTACATTGCAAATACTTTAATATAACAAAGCTGGAAAATCACAAAAATAACTAGT
CGATATATTTGGCCATATAGAATCACTTTGATTTCAATAATAATCAAAACAATAATCAAAAAGCCTATTGATTAGCATGTTCCTTC
ACTAAAATGGACATTGTAATTTATTTTGATTCTCACAGGCACCAACCTGCTGTGGCAACAATTGAAATCAAATTTGTCTCAGAAGA
ATTCAAAGTACATTGTTCTAGGCGATTTAATCTTTCCATTCATCGGATTTGTTTTCAAAAATATAGAATAACTGGATCTCTATGTT
AAAATAATAAAACACATTCTGATTTTATCTGTCAAGATTGAACACGACTTAAAAGTATGAATAAAACATCATCTGTATGTATAATT
TTTTAACTGTCAACTAATAGTCCAAATAATTGTGTTATGGAAATGTATTCATTGTCATATAATATCATTTGCTTGAATTTATCACC
ATGTGTCTTTGTTTGTTTTTACACAGGTGAAAGGTTATCCCAGAGGTAAGGACTTCTACCATCATTACTGTATAATTTTAATAGTA
TTATCATCAGTACTGTTATTGATAACTTCTCTTGTCTCGCTGACTCTCTCCATCAGGCATTTCGCTGACGTCGAGCAGCAGGAGCT
CGACAAGCGCTCAGTGGATGACGAGCCCAGTTCTATTGCTTTTGACTGAAGAAGTCGCCTTGAAGGAGCCTTCAG
//
大比目鱼HB26
TTATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAGCCTGGAGAGTGTTTTTTGGGATTGCTTTTT
CACGGGGTCCACCATGGTAGGGTCACGGAAGTAATTCGATTTTTACATGGCAAATATTTTAAGATAACACACCATATGAGTAGTCG
ATATATTTGACCAATTAGAATCACTTTAATTTCAATAATAATCACAATAACAATCTCTAGGCCATTTAATCTTTCCATTAATCGGA
TTTGTTTTTTTAAATATAGAATAACTGGATCTCTATGTTAAAATAATAAAACATACATTCTGATTTTACCAGTCAAGATTGTACGC
TACTTAAAAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACTGTTAACTAATAGTCCAAATAATTGTGTAATGGAAATG
TATTAATTGTCATTTAATATCATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTACACAGTTGGAAAGTGGATCCATGG
GTAAGGACTTCTACCATCATTACTGTGTATTTTTAATAGTATTATCATCAGTACTGTTATTGATATTTTCTCTTGTCTCGCTGACT
CTCTCCATCAGACTCATCCATGGGCATCACGGTTACGACGAGCAGCAGGAGCTCGACAAGCGCGCAGTCGATGAAA
//
大比目鱼HB18
TTATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTTTTGGGAATTCTTTTT
CACGGGGTCCACCATGGTAGAGTCACGGAATTAATTCGATTTTTACATGGCAAATATTTTAAGATAACACACCATATGAGTAGTCG
ATATATTTGACCAATTAGAATCACTTTAATTTCAATAATAATCACAATAACAATCTCTAGGCCATTTAATCTTTCCATTAATCGGA
TTTGTTTTTTTAAATATAGAATAACTGGATCTCTATGTTAAAATAATAAAACATACATTCTGATTTTACCAGTCAAGATTGAACAC
TACTTAAAAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACTGTTAACAATAGTCCAAATAATTGTGTTATGGAAATGT
ATTAATTGTCATTTAATATCATTTGCTTGAATTTATCACCATGAGTTTTTTGTTTGTTTTTACACAGGTAGAAAGAAGGCCTTGCA
GTAAGGACTTCTACCATCATTACTTTGTAATTTTTATAGTATTATCATCAGTACTGTTATTGACAACTTCTCTTGTCTCGCTGACT
CTCTCCATCAGGATGAACTCAGAGCGTCGCAGTTACGACGAGCGGCAGCAGCAGCAGCAGGAGCTCGACAAGCGCGCAGTCGATGA
AA
//
美洲黄盖鲽YT2
GCCCACTTTGTATTCGCAAGGTAAGATCGATATTTTTCAAACTCATTTAGACGAGACCAAGCATTTGTTGAAATGTGATAAGCTTC
TAACTTTATAATGCAAATGTTAACAATCTTTTTGTTCTGTTGTTTTTGTAGGATGAAGTTGGCTGCCGCCTTCCTGGTGCTGTTCC
TGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTCTTGGGATTTCTTTTTCACGGTATCCACCATGGTAAAGTCACTCATTTAATA
CATTTTTACATGGCAAATATTTGAATATAACATACTATATGAGTTGTCAATATATGTGGCCAAGTAGAAGCACTTTGATTTCAATA
ATAATCAAAATAACAATCACTAAGCCATTTAATAATTGAATTAATTACATTTGTTTTAAAAAAATATAGAATAACTGGATCTTTAT
GCTAAAATAATTAAACCTAAATTCAGATTTTACCACTCAAGATTGAACACTACTTAAAAGTATGTAAAAAAAACATCATCTGTATG
TATAATTAAATACTAGTCCAGTTAATTGTTTTATGGAAATGTGTTAATTGACATATATCATTTGCTTGAACTTATAATGTGCTTTG
TTTGTTTTTACACAGGTATCAGGGCGATCCATCAGTAAGGACTTCTACCATCATGACTGTGTATTTTTAATAGTATTATCATCAGT
ACTTTTATTAACAACTTCTCTTGTCTCGCTGACTCTCTCCATCAGTCTCATCCATGGTCAAAGATACGACGAGCAGCAGGAGCTTG
ACAAGCGCTCAGTCGATGAVAACCCCGGTGCTATTGTTTTTGACTGAAGACGTCGCCTTGAAGGAGCCTTCAG
//
美洲黄盖鲽YT3
ATGAAGTTCACTGCCACCTTCCTGGTGTTGTCCATGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTCTTTGGAGCCCTTATCAA
AGGGGCCATCCATGGTGGCAAGTTGCTCCATAAACTCATCAAAAAAAAACATGAACATCACGGTTATGGCAAGCATTGGGGGCTTG
ACAAGCGCGCAGTCGATGA
//
美洲拟鲽WF-YT
TTGAAAGTGAGGAAGTGAGAGGAGGACTAGGTCCTGTGTTTTCAGTCGTTGAATTATCTAACACTATCTGAGCCCCTCCTGCAATA
ACTCTAAATGTTACACAGTGACTAGGAAGTCAGTCCTGTGTATATAAAGAGTTGCATCTGTTGTTATCAGTAGACAACAGATTACA
CCTTTGAATCTCACAAAGCTCATTTTGTATTCGACAGGTAAGATCGATATGTTTCAAACTCATTTAGATGAGACCAAGCATTTGGG
AAATGTGCTCAGCTTCTAACTGTATGATGCAAATGTTAACAATCTTTTTGTTCTGTTGTTTTGTAGGATGAAGTTGGCTGCCGCCT
TCCTGGTGCTGTTCTGGTCGTCCTCATGGCTGAACCTGGAGAGAGTTTTTTGGGATTTCTTTTTTCATGGTATCCGCCATGGTAGG
GTCACTGAATTGATACATTTTTACATGGCAAATATTTGAATGTAACATACTATATGAGTTGTCAATATATGTGGCCAAGTAGAAGC
ACTTTGATTTCAGTAATAATCAAAATAACAATCACTAGGCCATTTAATAATTGCATTAATTACACTTGTTTTTATATAGAATATAG
AATAACTGGATCTTTATGCTAAAATTAATAAACATGAATTCAGATTTTAAGATTTTTCAAGATTGAAAACTACTTAAAAGTATGTA
AAAAAACATCATCTGTATGTATAATTAAATACTTGTCCAGATAATTGTGTTGTGGAAATGTGTTAATTGACATATATCATTTGCTT
GAATTTATCATTATCTGCTTTGTTTGTTTTTACACAGGTATCAAGGCGATCCATGGGTAAGGACTTCTACCTTCATGACTGTGTAT
TTTTAATAGTATTATATTCAGTACTGTTATTGAAAACTTCTCTTGTCTCGCTGACTCTCTCCATCAGAATGATCCATGGTAACAGT
TTAGACGAGATGCAGGAGCTCGACAAGCGCTCATTCGATGACAACCCCAACGCAATTGTTTTTGACTGAAGAAGTCGCCCTGAAGG
AGCCTTCAGATGATATATAATGCTTCTTGCTTTTCAATGAAATAAATTGAATAATTACCCGCAACAGC
//
美洲拟鲽WF1-样
TACTTTTATCTACCACTATGTGAGCTCCTCCTGTTATAACTCTAAATGTTACACAATGAAGATGAGGTCAATTCTGAGTATATAAA
GAGTTGCCTCTGTATAGTAGACAACATATTTCACCTTTGAATCCCACAAAGCTCACTTTGTACTCAACAGGTAAGATCGATATTTA
AAAACTAATTTAGACGAAACCAAGCATTTTGGGGAATTTGCTCAACTTCTAAATGTATGATACAAATGTTAACAATCTTTTATTTC
TGTTGTTGTTTTTTGTAGGATGAAGTTCACTGCCACCCTCCTCCTGTTGTTCATCTTCGTCCTCATGGTTGATCTCGGAGAGGGTC
GTCGTAAGAAAAAGGGGTCGAAGAGAAAGGGGTCCAAGGGAAAGGGGTCCAAGGGAAAGGGCAGGTGGTTGGACAGGATTGGTAAA
GGTAGAGTCACGGAATTAATTTGCTTTTTACATTGCAAATATTTTTCATATAACATTGCTGGAAAATCACAAAAATAAGTAGTCAA
TATATTTGGCCAAATAGAATCACTTTGATTTCAATAATAATCAAAATAACAACCTAAAAGGCCTTTGATTAGCATGTTCCTTCAAT
GAAATGGACATTGTAATTTACTTTGATTCTCACATGCTACGACCTGCTGCAGCAACATTTGAAAATAAATTTGTCCCAGAAGATTT
TAAAGTACATTGTTATAGGCGATTTATCTTTCTATTACTCAGATATTTGTTCAAACCAATAGAATAACTGGATCTCTATGCTAAAA
TAATAAAACACACATTCAGATGTTACCAGTCAAGATTGAACGCTGTTTAAAAGTAAGTATGAAACATCCTCTGTATGTATAATTGT
TTAACTGGTAACTTATAGTCCTAATAATTGCGTTATGGAAATGTATTAATTGTCATTTAATATAATTTGCTGGAATTTATCACTGT
GTGTTTTTGTTTGTTTTTACACAGCTGGCGGGATAATTATCGGGGGGGCCCTTGAGTAAGGACTTCTACCATCATTACTGTGTAAT
ATTTATAGTTATGATCAGTACAGTTATTAACAACTTCTCTTGTCTCGCTGAACTTCTCCATCAGTCACCTCGGGCAGGGGCAGGTG
CAGGGGCCGGATTACGACTACCAGGAGGGGGAGGAGCTCAACAAGCGCTCAGACGATGATGACAGCCCCAGTCTTATTTTTTTTGA
CTGAAGAAGTCGCCCTGAAGGAGCCTTCAGATGATATATAATGCTTCTGGCTTTTCATTGAAATAAATAATACGTTTACCTGCAAC
AGCAACCATG
//
大比目鱼Hb29
TTATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTGGGAAATTGGATGGGG
CCCCATATCAGCGGTAGAGTCACGGAATTAATTTGCTTTTTCCATTGCAAATATTTTAATATTGCATAGCTGGAAAATCACGAAAT
AAGTAGTCGATATATTTGGCCAAATAGAATCACTTTGATTTCAATAATAATCAAAATAACAATCAAAAAGGCCTTTGATTAGCATG
TTCCTTCAATAAAATGGACATTGAAGTTTATTTTGATGCTCACATGCACCGACCTGCTGGGGCAACAATTGAAATCAAATTTGTCT
CAGAATTTAAAGTACATTTTTCTAGGTGATTTAATCTTTCCATTAACTTGATTTGTTTTTATAAATATAGAATAACTGGATCTTTA
TGCCAAAATAATAAAACACACATTCTGATTTTACCAGTCAAGATTGAACACTACTTAAAAGTAATATAAAACATCATCTGTATGTA
TAATTGTTTAACTGTTAACAAAAGTCCAAATAATTGTGTTATGGAAATGTATTAATTATCATTTAATATCATTTGCTTGAATTCAT
CACCATGTGTTTTTTGTTTGTTTTTACACAGGTGAAAAGAAGGCCTTGCAGTAAGGACTTCTACCATCATTACTTTGTAATTTTTA
TAGTATTATCATCAGTACTGTTATTGACAACTTCTCTTGTCTCGCTGACTCTCTCCATCAGGATGAACTCAGAGCGTCGCAGTTAC
GACGAGCGGCAGCAGCAGCAGCAGGAGCTCGACAAGCGCGCAGTCGATGA
//
大比目鱼HbSc1A13
ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTGGGAAATTGGATCGTGCG
CCCTATCGGAGGTGAAAAGAAGGCCTTGCAGATGAACTCAGAGCGTCGCAGTTACGACGAGCGGCAGCAGCAGCAGCAGGAGCTCG
ACAAGCGCGCAGTCGATGAAA
//
大比目鱼HbSc1A24
ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATAGCTGAACCTGGAGAGAGTCTTTTTGGAAAGTTCCTCAA
GAAAGTTGTCCATGCTGGCACGTCAATTGGCGAGACAGCCTTGCATGTCGCCGCAGAGCATCACGGGCTTCATGCGCATCACGGGT
GTCACGGGCGTCACGGGGGTCACAGGCGTCAGGGGGGTCACAGGCGTCACGGGCGTCGCGGTTACGACGAGCAGCAGCAGGAGGAG
CTCGACAAGCGCGCATTCGATGA
//
大比目鱼HbSc1B34
TATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTGGGAAATTGGATGGGGC
CCCATATCAGCGGTAGAAAGAAGGCCTTGCACATGAACTCAGAGCGTCGCAGTTACGACGAGCGGCAGCAGCAGCAGCAGGAGCTC
GACAAGCGCGCAGTCGATGAAA
//
大比目鱼Hb17
ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGAGTGTTTTTTGGGATTGCTTTTTCA
CGGGGTCCACCATGGTAGGGTCACGGAAGTAATTCGATTTTTACATGGCAAATATTTTAAGATAACACACCATATGAGTAGTCGAT
ATATTTGGCCAATTAGAATCACTTTGATTTCAATAATAATCAAAATAACAATCTCTAGGCGATTTAATATTTGCATTAATTGGATT
TGTTTTTAAAAATATAGAATAACTGGATCTTTATGGTAAAATAATTAAACATACATTCTGATTTTACCAGTCAAGATTGAACACTA
CTTAGAAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACTGTTAACGAATAGTCCAAATAATTGTGTTATGGAAATGTA
TTAATTGTCATTTAATATCATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTACACAGTTGGAAAGTTGATCCATGGGT
AAGGACTTCTACCATCATTACTGTGTATTTTTAATAGTATTATCATCAGTACTATTATTGACAACTTCTCTTGTCTCGCTGACTCT
CTCCATCAGACTCATCCATGGCGGTTACGACGAGCAGCAGGAGCTCGACAAGCGCGCAGTCGATGAA
//
美首鲽 GC1.2
GCCCACTTTGTATTCGCAAGGTAAGAGCGATATATTTCAAATTCATTCGGATGAGACCAAGCATTTGGGAAATGTGCTCAGCTTGT
TACTGTTTAATGCAAATGTTAACAATATCCTTTTTCTGTTGTTTTTGTAGAATGAAGTTCGCTGCCGCCTTCCTCATGATGTTCAT
GGTCGTCCTCATGGCTGAACCCGGAGAGGCTCGTTGGGGAACGTTCTTCAAACATATTTTCAAAGGTAGAGTCACAGAATTAATTT
GCTTTTTACATTGCAAATATTTTCATATAACATAGCTGGAAAATCACAAAAATAAGGGCTTGATATATTTGGCAAAGTAGAATCCC
TTTGATTTCAATAATAATCAAAATAAAAATCAGAAAGGCCTTTGATTAGCATGTTCCTTCAATAAAATGGACATTGTAGTTTATTT
TGATTCTCAAATGCACCAACCTGCTGCGGCAACAATTGAAATCAAATTTGTCTCCGAAACATTTAAAGTACATTTTTCGAGGCAAT
TTAATCTTTCCTTTGATCGAATTCGTTTTTAAAAATATAGAATAACTGGATCTTTATGCTAAAATAATAAATCATACATTCTGATT
TTACCAGTCAAGATTGAACGCTACTTAAAAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACTTTTAACTAATAGTCCT
AATAATTGTGTTATGGAAATGTATTCATTGTCATTTAATATCATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTACAC
AGCTGGAAGGTTCATCCATGGGTAAGGACTTCTACCATCATTACTGTGTATTTTTAATAGTATTATCATCAGTACTGTTATTGATA
ACTTCTCTTGTCTCGCTGACTCTCTCCATCAGTGCGATCCAGGCACACAATGACGGCGAGCAGCAGGATCTCGACAAGCGCTCAGT
GGATGATGAGCCCAGTGTTATTGTTTTTGAATGAAGAAGTCGCCTTGAAGGAGCCTTCAG
//
美首鲽 GC1.3
GCCCACTTTGTATTCGCAAGGTAAGAGCAATATATTTCAAATTCATTTAGACGAGACCAAGCATTTGGGATCTGTGCTCAACTTGT
AACTGTATAATGCAAATGTTAACAATATTCTTTTTCTGTTGTTTTTGTAGAATGAAGTTCGCTGCCGCCTTCCTCATGATGTTCAT
GGTCGTCCTCATGGCTGAACCCGGAGAGGGTGCTTGGATACCTGCCTTGAATAGGATCTATCATGGTAGAGTCACAGAGTTAATTT
GCTTTTTACATTGCAAATATTTTAATATAACATGGCTGGAAAATCACAAAAATGAGTACTCGATATATTTGGCAAAGTAGAATCCC
TTTGATTTCAATAATAATCAAAAACACAATCAAAAAGGCCATTGATTAGCATGTTCCTTCAATGAAATGGACATTGTAGTTTATTT
TGATTCTGACATGCACCAACTTGCTGCGGCAACAATTGAATTCAAATTTGTCTCAGAAAAATTTAAAGTACATTTTTCTTTCCATT
AGTCGGATTTGTTTTAAAAAATACAGAATAACTGGATCTTTATGCTAAAATAATAAATCATACATTCTGATTTTACCAGTCAAGAT
TGAACGCTACTTAAAAGTATGTATAAAACATCATCTGTATTGATAATTGTTTAACTTTTAACTAATAGTCCTAATAATTGTGTTAT
GGAAATGTATTCATTGTCATTTAATATCATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTACACAGCTCTACTGAGGA
TCAATCGGTAAGGACTTCTACCATCATTACTGTGTAATTTTAATAGTATTATCATCAGTACTGTTATTGATAACTTCTCTTGTCTT
GCTGGCTCTCTCCATCAGCCAAATGGTGTATTATCGTCGGCACTGGCACGGTGACGTCGAGCAGCAGGCTCTCGACAAGCGCTCAG
TGGAGGACCAGCCCAGTTCTATTGCTTCTGCCTGAAGAAGTCGCCTTGAAGGAGCCTTCAG
//
美首鲽 GC1.4
GCCCACTTTGTATTCGCAAGGTAAGAGCAATATATTTCAAATTCATTTAGACGAGACCAAGCATTTGGGATCTGTGCTCAACTTGT
AACTGTATAATGCAAATGTTAACAATATTCTTCTTCTGTTGTTTTTGTAGAATGAAGTTCGCTGCCGCCTTCCTCATGATGTTCAT
GGTCGTCCTCATGGCTGAACCCGGAGAGGGTGCTTGGATGCCTGCCTTGAATAGGATCTATCATGGTAGAGTCACAGAGTTAATTT
TTTGATTTCAATAATAATCAAAAACACAATCAAAAAGGCCATTGATTAGCATGTTCCTTCAATGAAATGGACATTGTAGTTTATTT
TTTGATTTCAATAATAATCAAAAACACAATCAAAAAGGCCATTGATTAGCATGTTCCTTCAATGAAATGGACATTGTAGTTTATTT
TGATTCTGACATGCACCAACTTGCTGCGGCAACAATTGAATTCAAATTTGTCTCAGAAAAATTTAAAGTACATTTTTCTTTCCATT
AATCGGATTTGTTTTAAAAAATACAGAATAACTGGATCTTTATGCTAAAATAATAAATCATACATTCTGATTTTACCAGTCAAGAT
TGAACGCTACTTAAAAGTATGTATAAAACATCATCTGTATTGATAATTGTTTAACTTTTAACTAATAGTCCTAATAATTGTGTTAT
GGAAATGTATTCATTGTCATTTAATATCATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTACACAGCTCTACTGAGGA
TCAATCGGTAAGGACTTCTACCATCATTACTGTGTAATTTTAATAGTATTATCATCAGTACTGTTATTGATAACTTCTCTTGTCTT
GCTGACTCTCTCCATCAGCCAAATGGTGTATTATCGTAGGCACTGGCACGGTGACGTCGAGCAGCAGGCTCTCGACAAGCGCTCAG
TGGAGGACCAGCCCAGTTCTATTGCTTCTGCCTGAAGAAGTCGCCTTGAAGGAGCCTTCAG
//
美首鲽 GcSc4B35
ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGGATCCGGAGAGTGTGGTTGGAAAAAGTGGTTCAC
TAAAGGTGCCAAGCACCTTGGCCAGGCGGCCATTAACGGTTTGGCCTCTTGCGAAGAGCAGCAAGAGCTCGACAAGCGCTCAGAGG
ATGACGAGCCCAGTGCTATTGTTTTTGAA
//
美首鲽 GC3.6
ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGGATCCGGAGAGTGTGGTTGGAAAAAGTGGCTCCG
TAAAGGTAGAGTCATGGATTTAATTTGCTTTTTACATTGCAAATACTTTAATATAACATAGTTGGAAAATCACAAAAATAAGTAGT
CGATATATTTGGCCATATAGAATCACTTTGATTTCAATAATAATCAAAACAACAATCAAAAAGCCCATTGATTAGCATGTTCCTTC
ACTAAAATGGACATTGTCATTTATTTTGATTCTCACAGGCACCAACCTGCTGCGGCAACAATTGAAATCAAATTTGTCTCAGAAGA
ATTCAAAGTACATTGTTCTAGGCGATTTAATCTTTCCATTCATCGGATTTGTTTTTAAAAATATAGAATAACTGGATCTCTATGTT
AAAATAATAAAACACACATTCTGATTTTACCTGTCAAGATTGAACACGACTTAAAAGTATGTATAAAACATCATCTGTATGTATAA
TTGTTTAACTGTCAACTAATAGTCCAAATAATTGTGTTATGGAAATGTATTCATTGTCATATAATATCATTTGCTTGAATTTATCA
CCATGTGTTTTTGTTTGTTTTTACACAGGTGCCAAGCACCTTGGCCAGGCGGCCATTAAGTAAGGACTTCTACCATCATTACTGTG
TAATTTTAACAGTATTATCATCAGTACTGTTATTGACAACTACTCTTGTCTCTGTGACTCTCTCCAGGGGTTTGGCCTCTTGCGAA
GAGCAGCAGGAGCTCGACAAGCGCTCAATGGATGACGAGCCCAGTGCTATTGTTTTTGACTGAAGAAGTCGCCTTGAAGAGCCTTC
AG
//
美首鲽 GC2.2
GCCCACTTTGTATTCGCAAGGTAAGAGCGATATATTTCAAACTCATATAGACGAGACCAAGCATTTGGGAAATGTGCTCAGCTTGT
TACTGTATAATGCAAATGTTAACAATGTTTTTGTTCTGTTGTTTTTGCAGAATGAAGCTCGCTGCTGCCTTCCTGGTGTTGTTCAT
GGTCGTCCTCATGGCTGAACATGGAGAGGGTTTTGGGGATTTCTATATGAAGCCTGGTAGAGTCACGGAATTAATTCGATTTTAAC
ATGGCAAATATTTTACTATAACATACCATATGAGAGTCGTTAATTAATTGGATTGGATTTGTTTTTAAAAATATAGAATTGGATCT
TTATGCTAAAATAATTAAACATACATTCTGATTTTACCAGTTAAGATTGAACCCTACTTAAAAGTATGTATAAAACATCATCTGTA
CATATAATTGTTTAACTGTTAACCAATAGTCCAAATAATTGTGTTGTGGAAATGTATTAATTGTCATTTAATATCATTTGCTTGAA
TTTGTCACCATGTGTTGTTGTTTGTTTTTACACAGGTAGAAAGATTTCCCATGGGTAAGGACTTCTACCATCATTACTGTGTATTT
TTAGCAGTATTATCATCAGTACTGTTATTGATTAACTTCTCTTGTCTCGCTGACTCTAGGTACATCAGAAGTCCTTATTATGGTTA
CGACGAGCAGCAGGAGGTCGACAAGCGCTCAGTCGATGACAACCCCAGTGCCATTGCTTCTGACTGAAGAAGTCGCCTTGAAGGAG
CCTTCAGA
//
美首鲽 GcSc4B28
ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGCGAGGGTTATTGGCGCTTCCGCAACCA
CCGTGGTGAAAGGTTATCCCAGAGGCATTTCGCTGACGTCGAGCAGCAGGAGCTCGACAAGCGCTGTGGAGATGACGAGCCCAGTT
CTATTGCTTTTGA
//
美首鲽 GC3.7
ATGAAGTTCACTGCCACCTTCCTCGTGTTGTTCATCGTCATGTTTGAACCTGGAGAGTGTTTTTGGAATGCTTTTTCACCGGGTCC
ACCATGGTCGGGTCACGGAAGTAGTTCGATTTTTACATGGCAAATATTTAAATGAAACATACCTAATGAGTAGTCGATATATTTGG
CCAAGTAGAATCACTCACTTTGACTTCAATAATAATCAAAAACATAATCAAAAACATTGATTAGCTGTTCCTTCAATGAAATGGAC
ATTGAGGTTTATTTTGATTCTCACAGGCACCAACCTGCTGCGGCAACAATTGCATTCAAATTTGTCCCAAAGAAACTTAATTAACA
TTTTCTGGCGATTTAATCTTTGCATAAATTGGATTTGTTTTTAAAAATATAGAATATGGATCTTTATGCTCTCAAATAATTAATCA
TACATTCTTATTTTATCAGTCAAGATTGAACGCTACTTAAAAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACTTTTA
ACTAAAAGTCCTAATAATTGTGTTATGGAAATGTATTAATTGTCATTTAATATCATTTCCTTGAATTTATCACCATGTGTTTTTGT
TTGGTTTTTACACAGCTGGAAGGTTGATCCATAGGTAAGGACTTCTACCATCATTACTGTATAATGTTAATAATAGCATTATCATC
AGTACTGTTATTGATAACTTCTCTTGTCTCGCTGACTCTCTCCATCAGATTCATCAAACGTCACGGTGACGTCGAGCAGCAGGAGC
TCGACAAGCGCTCAGTGGATGACGAGCCCAGTTCTATTGCTTTTGCCTGAAGAAGTCGCCTTG
//
美首鲽 GC3.1
ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGACTGTATTTTTGGATTGATTGCGAC
TGCGGTCCACAATGGTAAGTCAAGGAATTAATTCGATTTTTACGTGGCAAATATTTTAGTATAACATACCTTATGAGTAGTCGATA
TATTTGACCAAGTAGAATCATTTTGACTTCAATAATAATCAAAATAACAATCTCTAGGCAATTTAATATTTGCATTAATTGGATTT
GTTTTTAAAAATATAGAATAACTGGATCTTAATGCTAAAATAATTAAACATACATTCTGATATTACCAGTCAAGATTGAACGCTAC
TTAAAAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACTGTCGACTAATAGTCCTAATAATTGTGTTATGGAAATGTAT
TCATTGTCATATAATATCATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTACACAGCTGGAAGGTTGATCCATAGGTA
AGGACTTCTACCATCATTACTGTATAATTTTAAGAGCATTATCATCAGTACTGTTATTGATAACTTCTCTTGTCTCGCTGACTCTC
TCCATCAGACTACTCGGCTTTCATCATGGGCCTCCCGGGTTCTGGCACGGTGACGTCGAGCAGCAGGAGCTCGACAAGCGCTCAGT
GGATGAGGAGCCCAGTGCTATTGTTTTTGAATGAAGAAGTCGCCTTGAAGGAGCCTTCAG
//
美首鲽 GC4.1
ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGACTGTATTTTTGGATTGATTGCGAC
TGCGGTCCACAATGGTAAGTCAAGGAATTAATTCGATTTTTACTTGGCAAATATTTTAGTATAACATACCTTATGTGTAGTCGATA
TATTTGACCAAGCAGAATCATTTTGATTTCAATAATAATCAAAATAACAATCTCTAGGCAATTTAATATTTGCATTAATTGGATTT
GTTTTTAAAAATATAGAATAACTGGATCTTAATGCTAAAATAATTAAACATACATTCTGATATTACCAGTCAAGATTGAACGCTAC
TTAAAAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACTGTCGACTAATAGTCCTAATAATTGTGTTATGGAAATGTAT
TCATTGTCATATAATATCATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTACACAGTTGGAAGGTTGGTCCATGGGTA
AGGACTTCTACCATCATTACTGTATAATTTTAAGAGCATTATCATCAGTACTGTTATTGATAACTTCTCTTGTCTCGCTGACTCTC
TCCATCAGACTACTCGGCTTTCATCATGGGCCTCCCGGGTTCTGGCACGGTGACGTCGTGCAGCAGGAGCTCGACAAGCGCTCAGT
GGATGAGGAGCCCAGTGCTATTGTTTTTGAATGAAGAAGTCGCCTTGAAGGAGCCTTCAG
//
美首鲽GC4.4
ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGACTGTATTTTTGGATTGATTGCGAC
TGCGGTCCACAATGGTAAGTCAAGGAATTAATTCGATTTTTACGTGGCAAATATTTTAGTATAACATACCTTATGAGTAGTCGATA
TATTTGACCAAGTAGAATCATTTTGGTTTCAATAATAATCAAAATAACAATCTCTAGGCAATTTAATATTTGCATTAATTGGATTT
GTTTTTAAAAATATAGAATAACTGGATCTTAATGCTAAAATAATTAAACATACATTCTGATATTACCAGTCAAGATTGAACGCTAC
TTAAAAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACTGTCGACTAATAGTCCTAATAATTGTGTTATGGAAATGTAT
TCATTGTCATATAATATCATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTACACAGTTGGAAGGTTGGTCCATGGGTA
AGGACTTCTACCATCATTACTGTATAATTTTAAGAGCATTATCATCAGTACTGTTATTGATAACTTCTCTTGTCTCGCTGACTCTC
TCCATCAGACTACTCGGCTTTCATCATGGGCCTCCCAGGTTCTGGCACGGTGACGTCGAGCAGCAGGAGCTCGACAAGCGCTCAGT
GGATGAGGAGCCCAGTGCTATTGTTTTTGAATGAAGAAGTCGCCTTGAAGGAGCCTTCAG
//
Petrale 鲽 02A(3)
ATGAAGTTCACTGCCACCTTCCTCGTGTTGTTCATGGTCATCGTCATGTTTGAACCTGGAGAGTGTTTTTTTGGAATGCGTTTTCA
CGGGGTCCACCATGGTAGGGTCACAAAAGTGATTTGATTATTACATGCCAAATATGTTAATGAAACATACCATATGAGCAGTCGTA
TTATTTGGACAAGTAGAATCACTTTGATTTCAATAGTAATTAAAATAACAATCAAAAAGGCCTTTGATTAGCATGTTCCTTCAATG
AAATGGACATTGAGGTTTATTTTGATTCTCACCTGCATCGACCTGCTGCGGCAACTATTGAAATCAAATTTGTCCCAGAAGAAACT
AAATTAACATTTTCTAGGCCATCTAATCTTTGCATGAATTGGATTTGCTTTCAAAAATATATAGAATAACTGGATTTATGCTAAAA
TAATAAAAACACACATTCTGATTTTACCAGRCAAGATTGAACACTACTTAAAAGTACGTATAAAACATCATCTGTATGTATAATTG
TGTTTGTTTGTTTTTTAGCAGGTGGAGGTTTTCTCAATGCGCAAGGACTTCTACCATCATTACTGTGTAATTTTAATAGTATTARC
ATCAGTACTCTTATTGACAACGTCTCTTGTCTCGCTGACTCTCTCTATCAGATTAAACCCAGGGTATCGCGGTTACGACGAGCAGC
AGGAGCTCGACAAGCGCGCAGTCGATGA
//
Petrale 鲽 02B
ATGAAGTTCACTGCCACCTTCCTGGTGTTGTCCTTGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTCTTTGGAGCCCTTCTCAA
AGGTAGAGTCACGGAATTAATTTGATTGTTACATGGCAAATAATTTTGTATAACATATCATATGAGCAGTCGATGTATTTGACCAA
GAAGAATCATTTTGATTTCAATAATAATCAAAATAACAATCTCTTGGAGATTATATATTTGCAATAATTGGATTTTATAAAATATA
GAACAACTGGATCTTAATGCTAAAATAATTAAACATACATTCTGATTTTACCAGTCAAAATTAACCACTACTTTAAAGTATGTATA
AAACATCATCTGTATGTTTAATTGTTTAACTTTTAACAAATAGTCCAAATAATTGTGTAATGGAAATGTATTCATTGTCATATAAT
ATAGTTTGCTTGACTTTATCACCGTGTGTTTTTGTTTGTTTTTTCACAGGTGCCCAGGCGCTCCATGGGTAAGGACTTCTACCATC
ATGACTGTGTAAGTTTAATAATATTATCATCAGTACTGTTATTAACGACTTCTCTTGTCTCGCTGACTCTCTCCATCAGAATCATC
CACAATGCTCGTCACGGTTACGACGAGCAGCAGCAGGAACAAGCGCGCAGTCGATGA
//
Petrale 鲽 PL1/2/2.1
GCCCACTTTGTATTCGCAAGGTAAGATCAATATTTTTCAAATTCATTTAGACGAGACCAACCGTTTGCGAAATGTGCTCAGCTTGT
TATTGTATAATAACAAAGTTAACGATCTTTATTTTTCTGTTTTTTTGTAGAATGAAGTTCACTGCCACCTTCCTGATGTTGTTCAT
CTTCGTCCTCATGGTTGAACCTGGAGAGTGTGGTTGGAAAGATTGGTTTCGTAAGGCTAAGAAAGGTAGAARCACGGAATTAATTA
GCTTTTTACATTGCAAATAGATTTTTTATAACAGCTGGAAATCACAAAAATAAATAGTCGATATATTTGGCCAATTAGAATCACTT
TAATTTCAATAATAATCTAAATAACAACCTAAAAGGCCTTTGATTAGCATGTTCCTTCAATGAAAAGGACATTGAGGTTTATTTTG
ATTCTCACATGCACCGACCTGTGCGGCAACAATTGAATTCAGATTTGTCCCAGAAGAATTCAAAGTACATTTTTCCAGGCGATTAA
ATCTTTCCATTACTCGGATTTAAAAATAAATAAATAGAATAACTGAAGCGCTATGATAAAATAATTACACATTCATTCTGATTTTA
CAAGTCAAGATTGAACACTATTAAAAAGTGTGTATAAAACATCATCTGTATGTATAATTGTTTAACTGTTAATAGTCTTAATAATT
GTGTTATGGAAATGTATTAATTTACATTTAATATCATTTGCTTGAGTTTACCATCATGTGTTTTTGTTTGTTTTTACACAGTTGGC
AAGACTGTTGGCGGCTTGGCCCTTAAGTAAGAACTTCTACCATCATTACTGTATAATTTTGATAGTATTATCACCAGTACTGTTAT
TAACTACTTCTCTTGTCTCGCTGACTCTCTCCATCCGACTCATCCGCAGTCATTACCTTGGCGAGCAGCAGGAGCTTGCCAAGCGC
GCAGTCFATGACGACCCCAGTGTTATTGTCTTTGACTGAAGAAGTCGCCTTGAAGGAGCCTTCAG
//
英吉利鲽 05A
ATGAAGTTCACTGCCACCTTCCTCATGATTTTAATCTTCGTCCTCATGGTCGAACCTGGAGAGTGTGGTATTAGGAAATGGTTTAA
AAAGGCTGCTCACGGTAAAGTCACGGAATTAATTTGCTTTTTGCTTTACAAATATTTTTTTATAGCAGCTGGAAAATCACAAAAAT
AAATAGTCGATGTATTTGGCCAATTAGAATCACTTTGATTTCAAATAATAATCTAAATAGCAACCTAAAAGGCCTTTGATTAGCAT
GTTCCTTCAATGAAATGGATGTTGAGGTTTATTTTGATTCTCACATGCACCFACCTGCTGCGGCAACAATTGAATTCAAATTTGTC
CCAAAGGAATTCAAAGTAAACTTTTCTAGATGATTTAATCTTTCCATAACTCGGCTTTGTTTTTAAAAATATARAARAACTCAATC
ACTATGATAAAATAATAACACATACATTCTGATTTATACAAGACAAGATTGAAAACTTCTTAAAAGTATGTATAAAACATCATCTG
TTTGTATAATTGTTTATCATTTCACAAAAAGTCCAACTAATTGTGTTATGGAATTGTATAAATTGTCATTTAATATAATTTTTTTG
AGTTTATCAATATGTGTTTTTGTTTGTTTTACACAGTTGGCAAGGAAGTTGGCAAGGTGGCCCTTAAGTAAGGACTTCTACCATTA
TTACTGTATAATTTTGATAGTATTATCACCCGTACTGTTATTGACAACTTCTCTTTTCCTGCTGACTCTCTCCATCTGACTCATCT
GCAGTGCTTGCCTTGACAAGCAGCAGCAGCTCGACAAGCGCGCAGTCGATGA
//
英吉利鲽 PL1/2/5
GCCCACTTTGTATTCGCAAGGTAATATCGATATTTTTCAACTCATTTAGAGCGAGACCAAGCATTTGGGAAATGTGCTAAGGTTGT
TACTGTATAATGCAAAATTAATGATCTTTATTTTTCTGTTTTTTTTTGCAGAATGAAGTTCACTGCCACCTTCCTCATGATTTTAA
TCTTCGTCCTCATGGTCGAACCTGGAGAGTGTGGTTTGAAGAAATGGTTTAAAAAGGCTGTTCACGGTAGAGTCACGGAATTAATT
TGCTTTTTGCTTTACAAATATTTTTTTATAGCAGCTGGAAAATCACAAAAATAAATAGTCGATGTATTTGGCCAATTAGAATCACT
TTGATTTCAATAATAATCTAAATAGCAACCTAAAAGGCCTTTGATTAGCATGTTCCTTCAATGAAATGGATGTTGAGGTTTATTTT
GATTCTCACATGCACCGACCTGCTGCGGCAACAATTGAATTCCAATTTGTCCCAAAGGAATTCAAAGTAAACTTTTCTAGGCGATT
TAATCTTTCCATAACTCGGCTTTGTTTTTAAAAATATATAATAACTCAATCCCTATGATAAAATAATAACACATACATTCTGATTT
ATACAAGACAAGATTGAAAACTTCTTGAAAGTATGTATCAAACATCATCTGTTTGTATAATTGTTTAACAGTTCACAAAAAGTCCA
ACTAATTGTGTTATGGAATTGTATAAATTGTCATTTAATATAATTTTTTTGAGTTTATCAATATGTGTTTTTGTTTGTTTTACACA
GTTGGCAAGAAAGTTGGCAAGGTGGCCCTTAAGTAAGGACTTCTACCATTATTACTGTGTAATTTTGATAGTATTATCACCAGTAC
TGTTATTGACAACTTCTCTTTTCCTGCTGACTCTCTCCATCCGACTCATCTGCAGTGCTTACCTTGGCGAGCAGCAGCAGCTCGAC
AAGCGTGCAGTCGATGAAGAGCCCAGTGTTATTGCTTTTGACTGAAGAAGTCGCCTTGAAGGAGCCTTCAG
//
箭齿鲽 09A
ATGAAGTTCACTGCCACCTTCCTCATGATGTTCATCTTCGTCCTCATGGTTGAACCTGGAGAGTGTGGTTGGAGGAAATGGATTAA
AAAGGCTACTCACGGTAAAGTCACGGAATTAATTCGTTTTTTGCTTTGCAAATATTTTTTTTATAACAGCTGGAAAGTCACAAAAA
TAAATAGTCAATATATTTGGCCAATTAGAATCACTTTGAGTTCAATAATAATCTAAATAACAACCAAAAAGGCCTTTCCTTTAATG
AAATGTACGTTGAAGTTTATTTTGAATCTCACATGCACCGACCTGCTGCGGCAACAATTGAATTCAAATTTCTCCCAGAGGAATTC
AAAGTAAATTTTTCTAGGCGATTTAATCTTTCCATTACTCTGATTTGTTTTAAATATATAGAATGACTCAATTGCTATGATAAAAT
AATAAGCCATACATTCTGATTTTTACAAGACAAGATTGAAAACTTCTTAAAAGTACGTATAAAACATCATCTGTATTTATAATTGT
TTAACATTTAACAAATTGTCCTACTAATTGTGTTATGGAAATGTATAAATTGTCATTTAATATCATTTGCTTGAGTTTATCATTAT
TTGTTTTTGTTTGTTTTTACACAGTTGGCAAGCATATTGGCAAGGCGGCCCTTGAGTAAGAACTTCTACCATCATTACTGTATAAT
TTTGATAGTATTATCACCAGTACTGTTATTGACAACTTCTCTTGTCCTGATGACTCTGTTCATCCAACTCATCTGCAGTGCTTACA
TTGGCGGGAAGCAAGAACTCGACAAGCGCGCAGTCGATGA
//
格陵兰大比目鱼 12B
ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTTTTCGGATTGCTTTTTCA
CGGGATCCACCATGGTAGGGTCACGGAATTAATTAGATGTTTACATGGCAAATATTTTAAGATAACACACCATATGAGTAGTCGAT
ATATTTGACCAATTAGAATCACTTTAATTTCAATAATAATCACAATAACAATCTCTAGGCCATTTAATCTTTCCATTAATCGGATT
TGTTTTTTTAAATATAGAATAACTGGATCTTTATGCTAAAATAATGAAACATACATTCTGATTTTACCAGTCAAGATTGAACGTTA
CTTAAAAGTATGTTTAAAACATCATCTGTATGTATAATTGTTTAGCTGTAAACAAATAGTCCAAATAATTGTGTTATGGAAATGTA
TTAATTGTCATATAATATAATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTTAACACAGCTGGAAAGTTGATCCATGG
GTAAGGACTTCTACCATCATTACTGTGTATTTTTAATAGTATTATCATCAGTACTGTTATTAACAACTTCTCTTCTATCGCTGACT
CTCTCCATCAGACTCATCCATCATGGTTACGACGAGCAGCAGGAGCTCGACAAGCGCGCAGTCGATGA
//
太平洋大比目鱼 15A
ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTGGGAAATTGGATGGGGCC
CCATATCAGCGGTAGAGTCACGGAATTAATTTGCTTTTTCCATTGCAAATATTTTAATATTGCATAGCTGGAAAATCACGAAATAA
GTAGTCGATATATTTGGCCAAATAGAATAACTTTGATTTCAATAATAATCAAAATTACAATCAAAAAGGCCTTTGATTAGCATGTT
CCTTCAATAAAATGGACATTGAAGTTTATTTTGATGCTCACATGCACCGACCTGCTGCGGCAACAATTGAAATCAAATTTGTCTCA
GAATTTAAAGTACATTTTTCTAGGTGATTTAATCTTTCCATTCATCTGATTTATTTTATAAATATAGAATAACTGGATCTTTCTGC
TAAAATAATAAAACACACATTCTGATTTTACCAGTCAAGATTGAACACTACTTAAAAGTATGTATAAAACATCATCTGTATGTATA
ATTGTTTAACTGTTAACAATAGTCCAAATAATTGTGTTAAGGAAATGTATTAATTGTCATTTAATATCATTTGCTTGAATTTATCA
CCATGAGTTTTTTGTTTGTTTTTACACAGGTAGAAAGAAGGCCTTGCAGTAAGGACTTCTACCATCATTACTTTGTAATTTTTATA
GTATTATCATCAGTACTGTTATTGACAACTTCTCTTGTCTCGCTGACTCTCTCCATCAGGATGAACTCAGAGCGTCGCAGTTACGA
CGAGTAGCAGCAGAAGCTCGACAAGCGCGCAGTCGATGA
//
太平洋大比目鱼 15B
ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGAGTGTTTTTTGGGATTGCTTTTTCA
CGGGGTCCACCATGGTAGGGTCACGGAAGTAATTCGATTTTTACATGGCAAATATTTTAAGATAACACACCATATGAGTAGTCGAT
ATATTTGATATATTAGAATCACTTTGATTTCAATAATAATCAAAATAACAATCTCTAGGCGATTTAATATTTGCATTAATTGGATT
TGTTTTTAAAAATATAGAATAACTGGATCTTTATGGTAAAATAATTAAACATACATTCTGATTTTACCAGTCAAGATTGAACACTA
CTTAGAAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACTGTTAACTAATAGTCCAAATAATTGTGTTATGGAAATGTA
TTAATTGTCATTTAATATCATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTACACAGTTGGAAATTTGATCCATGGGT
AAGGACTTCTACCATCATTACTGTGTATTTTTAATAGTATTATCATCAGTACTGTTATTGACAACTTCTCTTGTCTCGCTGACTCT
CTCCATCAGACTCATCCATCACGGTTACGACGAGCAGCAGGAGCTCGACAAGCGCGCAGTCGATGA
//
C-O 鲽 PL1/2/6
GCCCACTTTGTATTCGCAAGGTAATATCGATATTTTTCAAACTCATTTAGACGAGACCAGGCATTTGGGAAACGTGCTAAGGTTGTTACTG
TATAATGCAAAATTAATGATCTTTATTTTTCTGTTTTTTTTTGCAGAATGAAGTTCACTGCCACCTTCCTCATGATTTTAATCTTCGTCCT
CATGGTCGAACCTGGAGAGTGTGGTATTAGGAAATGGTTTAAAAAGGCTGCTCACGGTAAAGTCACGGAATTAATTTGCTTTTTGCTTTAC
AAATATTTTTTTACAGCAGCTGGAAAATCACAAAAATAAATAGTCGATGTATTTGGCCAATTAGAATCACTTTGATTTCAATAATAATCTA
AATAGCAACCTAAAAGGCCTTTGATTAGCATGTTCCTTCAATGAAATGGGTGTTGAGGTTTATTTTGATTCTCACATGCACCGACCTGCTG
CGGCAACAATTGAATTCAAATTTGTCCCAAAGGAATTCAAAGTAAACTTTTCTAGGCGATTTAATCTTTCCATAACTCGGCTTTGTTTTTA
AAAATATATAATAACTCAATCGCTATGATAAAATAATAACACATACATTCTGATTTATACAAGACAAGATTGAAAACTTCTTGAAAGTATG
TATCAAACATCATCTGTTTATATAATTGTTTAACATTTCACAAAAAGTCCAACTAATTGTGTTATGGAATTGTATAAATTGTCATTTAATA
TAATTTTTTTGAGTTTATCAATATGTGTTTTTGTTTGTTTTACACAGTTGGCAAGAAAGTTGGCAAGGTGGCCCTTAAGTAAGGACTTCTA
CCATTATTACTGTATAATTTTGATAGTATTATCACCAGTACTGTTATTGACAACTTCTCTTTTCCTGCTGACTCTCTCCATCCGACTCATC
TGCAGTGCTTACCTTGGCGAGCAGCAGCAGCTCGACAAGCGTGCAGTCGATGAAGAGCCCAGTGTTATTGCTTTTGACTGAAGGAGTCGCC
TTGAAGGAGCCTTC
//
表13
附件I.参照表4的pleurocidin样基因和cDNA的核酸序列
NRC-01
ATGAAGTTCACTGCCACCTTCCTCCTGTTGTTCATCTTCGTCCTCATGGTTGATCTCGGAGAGGGTCGTCGTAAGAAAAAGGGGTCG
AAGAGAAAGGGGTCCAAGGGAAAGGGGTCCAAGGGAAAGGGCAGGTGGTTGGAAAGGATTGGTAAAGGTAGAGTCACGGAATTAATT
TGCTTTTTACATTGCAAATATTTTTCATATAACATTGCTGGAAAATCACAAAAATAAGTAGTCAATATATTTGGCCAAATAGAATCA
CTTTGATTTCAATAATAATCAAAATAACAACCTAAAAGGCCTTTGATTAGCATGTTCCTTCAATGAAATGGACATTGTAATTTACTT
TGATTCTCACATGCTACGACCTGCTGCAGCAACATTTGAAAATAAATTTGTCCCAGAAGATTTTAAAGTACATTGTTATAGGCGATT
TATCTTTCTATTACTCAGATATTTGTTCAAACCAATAGAATAACTGGATCTCTATGCTAAAATAATAAAACACACATTCAGATGTTA
CCAGTCAAGATTGAACGCTGTTTAAAAGTAAGTATGAAACATCCTCTGTATGTATAATTGTTTAACTGGTAACTTATAGTCCTAATA
ATTGCGTTATGGAAATGTATTAATTGTCATTTAATATAATTTGCTGGAATTTATCACTGTGTGTTTTTGTTTGTTTTTACACAGCTG
GCGGGATAATTATCGGGGGGGCCCTTGAGTAAGGACTTCTACCATCATTACTGTGTAATATTTATAGTTATGATCAGTACAGTTATT
AACAACTTCTCTTGTCTCGCTGAACTTCTCCATCAGTCACCTCGGGCAGGGGCAGGTGCAGGGGCCGGATTACGACTACCAGGAGGG
GGAGGAGCTCAACAAGCGCGCAGTCGATGAA
//
NRC-02 和 NRC-03
ATGAAGTTCACTGCCACCTTCCTCCTGTTGTTCATCTTCGTCCTCATGGTTGATCTCGGAGAGGGTCGTCGTAAGAGAAAGTGGTTG
AGAAGGATTGGTAAAGGTGTCAAGATAATTGGCGGGGCGGCCCTTGATCACCTCGGGCAGGGGCAGGTGCAGGGGCAGGATTACGAC
TACCAGGAGGGGCAGGAGCTCAACAAGCGCGCAGTCGATGAAA
//
NRC-04
GCCCACTTTGTATTCGCAAGGTAATATTGATATTTTTCATATTCATTTAGACAAATGTGCTCAGCTTGTTACTGTATAATGCAAAAG
TTAATGATCTTTATTTTTCTGTTTTTTTTTGTAGAATGAAGTTCACTGCCACCTTCCTCATGATTGCCATCTTCGTCCTCATGGTTG
AACCTGGAGAGTGTGGCTGGGGAAGCTTTTTTAAAAAGGCTGCTCACGGTAGAGTCACAGAATTAATTAGCTTTTTGCTTTGCAAAT
ATTTTTTTTATAACAGCTGGAAAATCACAAAAATAAATAGTATATATATTTGGCCAATAAAATCACTTTGATTTCAATAATAATCTA
AATAACCAACCTAAAAGGCCTTTGATTAGCATGTTCCTTCAATGAAATGTACGTTGAGGTTTATTTTGATTCTCACAAGCACCAACC
TGCTGCGTCAACAATTGAATTCAAATTTGTCCCAAAGGAATTCAAAGTAAATTTTTCTAGGCGATTTAATCTTTCCATTACTCTGAT
TTGTTTTAAAAATATAGAATAACTCAATCTCTATGATAAAACAATTACACATACATTCAGATTTTTATAGGACAAGATTGAAAACTT
CTTACAAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACATGTAACAACTAGTCCTACTAATTGTGTTAAATTGTCATTT
AATATCAATTGCTTGAGTTTATCATTATGTGTTTTGTTTTTTTTTACACAGTTGGCAAGCATGTTGGCAAGGCGGCCCTTACGTAAG
GACTTCTACCATTTTACTGTATAATTTTGATAGTGTTATCACCAGTACTGTTTTTGACAACTTCTCTATTCCTGCTGACTCTCTCCA
TCCGACTCATCCGCAGTCATTACCTTGGCGATAAGCAGGAGCTCAACAAGCGTGCAGTCGATGAAGACCCAAATGTTATTGTTTTTG
AATGAAGAAAT
//
NRC-05
ATGAAGTTCACTGCCACCTTCCTGGTGCTGTCCCTGGTCGTCCTAATGGCTGAGCCTGGAGAGTGTTTCTTAGGAGCCCTTATCAAA
GGGGCCATACATGGTAGAGTCAAGGAATTAATTAGATTTTTACATGTCAAATAATGTAGTAGAACATATATAAGTAGTCAATATATT
TGACCAAGTAGAATCATTTTGATTTCAATAATAATCAAAATAACAATCTCCAGGCGATTTAATATTTGCAATAATTGGATTTTATAG
AATACGGAACAACTGGATCTTAATGCTAAAATAATCCAACATACATTCTGATTTTGCCAGGCAAAATTAAACACTACTTTAAAGTAT
GTATAAAACATAATCTGTATGTTATAACAAATACTCCAAGCAATTGTGTGATGGAAATGTATTCATTGTCATTTAATATAATTTGCT
TGAGTTTATCATCTTGTGTTTTTGTTTGTTTTTTCACAGGTGGCAGGTTTATCCATGGGTAAGGACTTCTACCATCATGACTGTGTA
TTTTTAATATTATTATCTACAGTACTGTTATTGACAACTTCACTTGTCTCGCTGACTCTCTCCATCAGAATGATCCAAAACCATCAC
GGTTATGACGAGCAGCAGGAGCTCAACAAGCGCGCAGTCGATGAA
//
NRC-06
GCCCACTTTGTATTCGCAAGGTAATATCAATATTTTTCAAATTCATTTAGACGAGACCAACCTTTTGGGAAATCTGCTCAGCTTATT
ACTGTATAATGCAAATGTTAATGATCTTTATTTTTCTGTTTTTTTTTTGTAGAATGAAGTTCACTGCCACCTTCCTCATGATGTTCA
TCTTCGTCCTCATGGTTGAACCTGGAGAGTGTGGTTGGGGAAGCATTTTTAAGCATGGTCGTCATGGTAAAGTCACGGAATTAATTA
GCTTTTAACTTTGCAAATATTGTTTTTTTTTTTAACAGCTGGAAACTCACAAAAATAAATAGCCGATATATTTGGCCAATTATAATC
ACTTTGATCTAAATAACAACCTAAAAGGCCTTTGATTAGCATGTTTCTTCAATAAAATGATTGAACACTACTTAAAGGTATGTATAA
AACATCATCATGTGTTTTTGTTTGTTTTTACACAGCTGCCAAGCATATTGGCCATGCAGCCGTTAAGTAAGGACTTCTACCATTATT
ACTGTATAATTTTGATAGTATTATCACCAGTATTGTTATTGACAACTTCTCTTTTTCCTGCTGATCCGACTCATCCGCAGTCATTAC
CTTGGCGAGCAGCAAGATCTCGACAAGCGCGCAGTCGATGAAGACCCAAATGTTATTGTTTTTGAATGAAGAAAT
//
NRC-07
ATGAAGTTCACTGCCACCTTCCTCATGATGTGCATCTTCGTCCTCATGGTTGAACCTGGAGAGTGTCGTTGGGGGAAATGGTTTAAA
AAGGCCACACACGGTAGAGTCACAGAATTAATTAGCTTTTTGCTTTGCAAATATTTTTTTATAACAGCTGGAAAATCACAAAAATAA
ATAGTCTATATATTTGGCCAATTAGAATCACTTTGCTTTCAATAAAAATCTAAATAACAACCTAAAAGTCCTTTGATTAGCATTTTC
CATCAATGAAATGGACGTTGAGGTTTATTTTGATTCTCACATGCACCGACCTGCTATGTCAACAATTGAATACAAATTTGTCCCAGA
GGAATTCAAAGGAAATTTTTCTAGGCGATCTAATCTTTCCATTACTCGGATTTGTTTTTAAATATATAGAATAACTCAATCTCTATG
ATAAAATAATAACACATACGTAAAGATTTTTACAAGACAAGATTGAAAACTTCTTAAAAGTACGTATAAAACATCATCTGTATTTAT
AATTGTTTAACATTTAACAAATAGCCCTACTAATTGTGTTATGGAAATGTATAAATTGTCATTTAACATAACTTGTTTGAGTTTATC
ATTATTTGTTTTTGTTTGTTTTTACACAGTTGGCAAGCATGTTGGCAAGGCGGCCCTTACGTAAGGACTTCTACCATCATTACTGTA
TAATTTTGATAGTATTATCACCAGTACTGTTATTGACAACTTCTCTTGTCCTGCTGACTCTCTCCATCCGACTCATCCATAGTGCTT
ACCTTGGCGACAAGCAAGAACTCGACAAGCGCGCAGTCGATGA
//
NRC-08
TAATAAAACTAATGTGTAAAGTCTTCCACTTTTTTTACTGTATTTACTTAAACAGAAAATTATTCTCACGATTCTGGAGCTGCAGCC
ACTAAGTGTTGCTTCATGAAGTGAATACACAATTGTTCTAACAACCACTCACCCAATTAACCAGAATCTACAAAGTGAGGAAGTGAG
AGGAGTCGTCCTGTGTTTTCAAATTTTTTGAATGATCTACCACTATGTGAGCTCCTCCTGTTATAGCTCTAAATGTTACACAATGAA
TGTGAAGTCAGTTCTGTGTATATAAAGAGTTGCCTCTGTAGAGCATACAACAGATTTCACCTTTGAATCTCACAAACCTCACTTTGT
ATTCGACAGGTAAGATCGATATTTTTCAAACTCATTTAGACGAGACCAAGTATTTGGGAAATGTGCTCAGCTTGTCAATGTATAATG
CAAATGTTAACAATCGTTTTGTTCTTATGTTGTGTTTGTAGGATGAAGTTCGCTACTGCCTTCCTGATGTTGTCCATGGTCGTCCTC
ATGGCTGAACCTGGAGAGTGTCGTTCTACAGAGGACATCATCAAGTCTATCTCGGGTAGAGTCCAGGAATTAATTATTATCAATAAC
AATGAAATAACAACCAAAAGGCCTCTGATTAGCATGTTCCTTCAATGAAATGGTCGTTTTTTATCTATTTTGATTCTCACATGCAAC
GACCTGCTGCGGCAACATTTGAAAATCAATCTTTTTTACACAAATTCAAAGTACATTGATTTATTCGATTTAATCTTAACATTAATC
AGATTTGTTTTTGTTTAAATATATCGAATAACTGGATCTCTATGATAAAATAATTAAACATACATTCTTATTTTACCAATCAAGATT
GAACACTTCTTAAAAGTACGTATAAAACATCATCTGTATGTATAATTGTTTGATTGTTAAGTAATATTTCCAATAATTGTGTAATGG
AAATGTATTAATTGTCATTTAATATAATTTGCTTGAATTTATCACCATGTGTTTTTTGTTTGTTTTTAAACAGGTGGAGGTTTTCTC
AATGCGTAAGGACTTCTATCATCATTACTGTGTAATTTTTATAGTATTATCATCAGTACTGTTATTAACAGCTTCTCTTGTCTCACT
GACTCTCTCCATCAGAATGAACGCCGGTTACAATGAGCAGCAGGAGCTCAACAAGCGCTCAGATGATGATGACAGCCCCAGTCTTAT
TGTTTTTGACTGAAGAAGTCGCCCTGAAGGAGCCTTCAGATGATATATTATGCTTCTTGCTCTTCATTGAAATAAATCAAAC
//
NRC-09和NRC-10(来自相同假基因的可选择拼接产物)
GAGCTCGATCAAACCAGACAAAGTTGCCTTCCTTCACAACAATAGAGTGGAAGAGAAAACAGGAGAGGACTTGTATCCTCCTGATGC
TGAGAAGAAGAAATAAGAAAGACTTGCAGCATTGATACTTTTACTTATACAGAAAACCTATAAACATGACGGGAGCATAAGTTAAAG
TCACAATACAGAAGAGAACCAGAAGCCAAACTGCAGCAAATTTACTGGTATTCATATGATACTGGAGCCAAAGCAACGCAGAGACTC
AGCAGCAGTGAACCAAAGAGTTTAACTGTACTTGTGTCCAGGTTGAATGAAAGTATTGAATAAAAAAAACCAAGACAGAACATGCAT
ATTTTTTTGGAATGGAATATAAGTCAGGAGAATATGTGTTGTTGTGGTGGCAGGATCCATCACTCTCTCAAGTTAACACAAGAACTT
TTAGAAACATAGATACGATCTCAAGTAAACTTCCATTTACTATTTGACTTTTTTTAAATACTTACAAATTATATTTTAAAAAGCAAC
AATAAATCAGAGATAACTTCATGGAGAAGTCTATATTCATATTTGTGAGCTGAACATTCATGCTGCCTGTTCTATCACATCTGAGTG
TGGAGGCCACTGACGTTTACTGACCTCAACGTCTACCGCTCTAATGCATTTGGAGTTAAAGGTAAGCATTTTGTTATTTGTCTTCAC
TGTATTGATACTAAATATACAGGGTTACAAATACAGTTAAAACAAGAGAGACGAGGTGTCGAAAGCTTCAGCATCAATGTGCTGATC
GCTGATAGCTGATCTTACCCGACACCGGTGACATGGCATCAAAATGACCACCTCTTTTTTCTTCTCTTTTTTTTGTAGGACGAAGTT
CGCTGCCGCCTTCCTCGTGTTGTTCATGGTCATCGTCATGTTTGAACCTGGAGAGTGTTTTTTTAGATTGCTTTTTCACGGGGTCCA
CCATGGTAGGGTCCCGGAAGTAATTTGATTATTACATGCCAAATATTTTAATGAAACATACCTTATGAGTAGTTGTATTATTTGGAC
AAGTAGAATCTCTATGATTTCAGTAGTAATTAGAATAACAATCAAAAAGGCCTTTGATTAGCATGTTTCTTCAATGAAATGGACATT
GAGGTTTATTTTGATTCTCACATGCTACAGCAACAATTGAAATCAAATTTTTCGCAGAAGAAACTTAATTAACATTGTTGTGCAATA
GTGCTTAAAAAGTGTTACCATGGAATGGTGTGCGTTTAGGCACTCAATAAATTTGGTTATCAAAATTAAATTAAAAAAATTAATATT
TAAAATATTAATATTAAATCATAACTTTAATTGTTTAAAGTTCTCGCGGGGAACCACCCTTCTTCTGAAGGTAAAGGATAGCCAATT
TATTGATTAAGATCAGTCTCATTTAGATCTAGTTCAAATAGAAATCTCAATATTTTACCATCGAAGATTTTATAATGAACAGTGAAG
GTTATGGAGTTCTAAACAGTGTAACAGTTGGCAAAGTTCACTATTGCAATATTAATGACAGACCATTTGTGAAAGAAGAACATTTAT
TATGAGCATAATAAAGTATGAAAGCACGAATTACTAAACAATCAAAGCTAACTAACAAGGACGTGTGTGGGTGTGTGTGTGAATGTA
AATAAGGGGGGGGCTCAAACTGGTGGCCTACAAGAAGAGCCTTAAGATAGCAACCACAAGGGCTGTACCATAAATGTTGTAGTAAAA
AGAGTTATTAAAATGAGTTAGAATAACTAATGACTAATTAGTAGACAAACTAGTAGACAAACTAAACAACTAACAATAACAAGGAAG
TGTGTGTGAGTGTGTTTGTGTGTAAATGTTAATTAGGGGCTCTCAAACTGGTGTCTTACCAGAAGAGTAAGATAACAATTCCCCCCC
TTCTTCTGAGGTTGTTTTACGACTGTTGCTTTATGGCCGTGAGGGAAGGTTTAACTCGGTGACATGCTATACGTGTCTGTGTAGATG
TTAATCAGAGAATGCCAGAGTCAGAGAGACCTACGGAGGAAGTCTGTGAAGGGCCTATCTAACATTAGCTTTCCTTTAACTTATAAC
ACAATATCAGAAACACATATCAACCTTATAAACACACACAGAATCAAATAAACAGTCTTGCTTAGCATGTATAATTATTAAGCCCAG
ATTATGTTACCAGTCCGAGGGAAAGAGTTCAGTTGCAGTTCTGTGACGTCTCCTGGCTTTGTGGTCGTAGAGTTCTGCATTCGCGAT
TCTGTCGAGCCGTGTGCTCAGATGCAGGTTGAAGTTCTCCTGCAGGACATCGCGTCGCTGCGAGGATTTTGTAGAGCTTGAAGGGCG
AGGAGATTTCCTTGAGTGGTGAGCTGGAAGCTGGACCTCTGACCTCTGGTTGTTGGTTGGAAGAGAAGAAAGCTGGAGCGGCGTGGT
TTCTCCCTCTAGCCGATGCAGGAGGAGAAGCCGGCAGCCCCACTCCTTGAAGAGTTGTGGAGAGAGATGGGAGCAAAGAGCTAGATT
TTGGGGAGACCTCTCCTTATATTGGCCCCGATGACCTCACAGGCCTTGGAACGGAGTGACCAATAGGAGTTGACCCTGGTAATTCTT
GACACCTTTGTGGGACATTGTCAAGACCCCAGGACATGCAGCATCCTGTTACAATCTGGGAGACGGAGTTCCTTGACTGTCTCAGAA
CAATGAGAACCTGTGGCATCTTGGGGGATTGAGTCCACTCGAGCACATGCGGCATGTTTGTTCCAAGTTTGACTGAAAGGAGGCCTG
TGGTTTGCACAAAAACCATGTCCCAACAACATTTTCTAGGCCATTTAATCTTTACATAAATTGGATTTGTTTTAAAAAATATATAGA
ATAACTCGATCTTTCTGCGTAAATAATAAAAAATAAATTCAAATTTGACCAGTCAAGATTGAACACTAATGAAAAGTACCTATAAAA
CATAATCTGTATGTATAGTTGTTTGACTGTTAAATAGTAGTCCTAACAATTGTGTAATGGAAATGTATTCATTGTCTTTTAATACTA
TTTGCTTATCATAATGTGTTTGTTTGTTTTTTAGCAGGTGGAGGTTATCTCAATGCGTAAGGACTTCTACCATCATTACTGTGTAAT
TGTATTAGTTTTATCATCAGTACTGTTATTGACAACGTCTCTTGTCTTGCTGACTTGACTCTCTTCATCAGATTAAACCCAGGGCCG
GTTACAATGAGCAGCAGGAGCTCGACAAGCGCGCAGTCGATGACAACCTCAGTGCTATTGTTTTTTACTGAAGAAGTCGACCTGAAG
AATCTTTTGAAATGATATGAAATGTTTGCCTTTCAATGAAATAAATCAAACATGACTGGATATTTGTTCTTTTGCATTGATGTATTG
TTGAGTGACAGTTGAATAATTTTGGAAAACTTATAACAGATCTCAATTTTAGGATGTCAAATCATTTCTCTGTGTCTTATTCAAATA
TGAGATTTAACAATGACAAT
//
NRC-11
GCCCACTTTGTATTCGCAAGGTAAGATCAATATTTTTCAAATTCATTTAGACGAGACCAACGTTTGCGTAAATGTGCTCAGCTTGTT
ATTGTATAATAACAAAGTTAACGATCTTTATTTTTCTGTTTTTTTGTAGAATGAAGTTCACTGCCACCTTCCTGATGTTGTTCATCT
TCGTCCTCATGGTTGAACCTGGAGAGTGTGGATGGAAAAGTGTGTTTCGTAAGGCTAAGAAAGGTAGAGTCACGGAATTAATTAGCT
TTTTACATTGCAAATAGATTTTTTATAACAGCTGGAAAATCACAAAAATAAATAGTCGATATATTTGGCCAATTAGAATCACTTTAA
TTTCAATAATAATCTAAATAACAACCTAAAAGGCCTTTGATTAGCATGTTTCTTCAATGAAATGGACATTGAGGTTTATTTTGATTC
TCACATGCACCGACCTGTGCGGCAACCATTGAATTCAGATTTGTCCCAGAAGAATTCAAAGTACATTTTTCCAGGCGATTAAATCTT
TCCATTACTCAGATTCAAAAATAAATAAATGGAATAATTGAAGCACTATGATAAAATAATTACACATTCACTCTGACTTTACAAGTC
AAGATTGAACACTATTAAAAAGTGTGTATAAAACAACATCTGTATGCATAATTGTTTAACTGTTAATAGTCCTAATAATTGTTTTAT
GGAAATGTATTAATTTACATTTAATATTATTTGCTTGAGTTTACCATCATGTGTTTTTGTTTGTTTTTACACAGTTGGCAAGACTGT
TGGCGGCTTGGCCCTTGAGTAAGGACTTCTACCATCATTACTGTATAATTTTGATAGTATTATCACCAGTACTGTTATTAACTACTT
CTCTTGTCTGCTGACTCTCTCCATCCGACTCATCTGCAGTCATTACCTTGGCGAGCAGCAGGAGCTTGACAGCGCGCAGTCGATGAG
GACCCCAGTGCTATTGTCTTTGACTGAAGAAGTCGCCTTGAAGGAG
//
NRC-12
ACTTTGTATTCGCAAGGTAAGATCAATATTTTTCAAATTCATTTAGACGAGACCAACCGTTGGCGAAATGTGCTCAACTTGTTATTG
TATAATAACAAAGTTAACGATCTTTATTTTTCTGTTTTTTTGTAGAATGAAGTTCACTGCCACCTTCCTGATGTTGTTCATCTTCGT
CCTCATGGTTGAACCTGGAGAGTGTGGATGGAAAAAATGGTTTAATAGGGCTAAGAAAGGTAGAGTCACGGAATTAATTAGCTTTTT
ACATTGCAAATAGATTTTTTATAACAGCTGGAAAATCACAAAAATAAATAGTCGATATATTTGGCCAATTAGAATCACTTTAATTTC
AATAATCTAAATAACAACCTAAAAGGCCTTTGATTAGCATGTTTCTTCAATGAAATGGACATTGAGGTTTATTTTGATTCTCACATG
CACCGACCTGTGCGGCAACCATTGAATTCAGATTTGTCCCAGAAGAATTCAAAGTACATTTTTCCAGGCGATTAAATCTTTCCATTA
CTCAGATTCAAAAATAAATAAATAGAATAATTGAAGCACTATGATAAAATAATTACACATTCACTCTGATTTTACAAGTCAAGATTG
AACACTATTAAAAACTGTGTATAGAACATCATCTGTATGTGTAATTGTTTAACTGTTAATAGTCCTAATAATTGTTTTATGGAAATG
TATTAATTTACATTTAATATTATTTGCTTGAGTTTACCATCATGTGGTTTTGTTTGTTTTTACACAGTTGGCAAGACTGTTGGCGGC
TTGGCCGTTGAGTAAGGACTTCTACCATCATTACTGTATAATTTTGATAGTATTATCACCAGTACTGTTATTAACTACTTCTCTTGT
CTCGCTGACTCTCTCCATCCGACTCCTCTGCAGTCATTACCTTGGCAAGCAGCCGGAGCTCGACAAGCGCGCAGTCGATGAGGACCC
CAGTGCTATTGTCTTTGACTGAAGAAGTCGCCTTGAAGGAGCCTTCAGAA
//
NRC-13
TTGCCCACTTTGTATTCGCAAGGTAAGATCAATATTTTTCAAATTCATTTAGACGAGACCAACCATTTGGGAAATGTGCTCAGCTTG
TTACTGTATAATGCAAAAGTTAAGTATCTTTATTTTTCTGTTTTTTTTTGTAGAATGAAGTTCACTGCCAACTTCCTCATGTTGTTC
ATCTTCGTCCTCATGTTTGAACCTGGAGAGTGTGGTTGGCGAACATTGCTTAAAAAAGCTGGTCACGGAATTAATACGCTTTTTACA
TTGCAAATAGATTTTTTATAACAGCTGGAAAATGACAAAAATAAATAGTCGATATATTTGGCCAATTAGAATTATTTTGATTTCAAT
AATAATCTAAATAACAACCTAAAAGGTCTTTGATTAGCATGTTTCTTCAATGAAATGGACATTGAGGTTTATTTTGATTCTCACATG
ACCGACCTGCTGCGGCAACAATTGAATTCAGATTTGTCCCAGAAGAATTCAAAGTAAATTTTCCAGGGGATTAAATCTTTCCATTAC
TCGGATTTAAAAAAAAAAAAAATAGAATAACTGAATTGCCATGAAAAAATAATTACACATACTGTCTGATTTTACAAGTCAAGATTG
AACACTACTTAAAAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACTGTTAACAAATAGTCCAAATAATTGTGTTATGGA
AATGTATTAATTGTCATTAAATATAATTTGCTTGAGTTTATCATCATGTGTTTTTTTTTTTTTTTTACACAGAGGTTAAGACTGTTG
GCAAGTTGGCCCTTAAGTAAGGACTTCTACCATCATTACTGTATAATTTTGATAGTATTATCACCAGTACTGTAGTACTGACAACTT
CTCTCTCCACCCAACTCATCCGCAGACATTACCTTGGCAAGCAGCCGGAGCTCGACAAGCGCGCAATTGATGACGACCCCAGTATTA
TTGTTTTTGACTGAAGAAGTCGCCTTGAAGGAGCCTTCAGAA
//
NRC-14
ATGAAGTTCACTGCCACCTTCCTCATGATGTTCATGGTCGTCCTCATGGCTGAACCCGGAGAGGCTGGTTGGGGAAGTATTTTCAAA
CATATTTTCAAAGCTGGAAAGTTCATCCATGGTGCGATCCAGGCACACAATGACGGCGAGGAGCAGGATCTCGACAAGCGCGCAGTC
GATGA
//
NRC-15
ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTTTGGGGAAAGCTTTTGAAA
TTGGGCATGCATGGAATCGGGCTGCTCCATCAGCATTTGGGTGCTGACGAGCAGCAGGAGCTCGACGAGCGCTCAGAGGAGGACGAG
CCCAATGTTATTGTTTTTGAATGAAGAAGTCGCATTGAAGGAGCCTTCAG
//
NRC-16和NRC-17
ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGGATCCGGAGAGTGTGGTTGGAAAAAGTGGCTCCGT
AAAGGTAGAGTCATGGATTTAATTTGCTTTTTACATTGCAAATACTTTAATATAACATAGTTGGAAAACCACAAAAATAAGTAGTCG
ATATATTTGGCCATATAGAATCACTTTGATTTCAATAATAATCAAAACAACAATCAAAAAGCCCATTGATTAGCATGTCCCTTCACT
AAAATGGACATTGTAATTTATTTTGATTCTCACAGGCACCAACCTGCTGCGGCAACAATTGAAATCAAATTTGTCTCAGAAGAATTC
AAAGTACATTGTTCTAGGCGATTTAATCTTTCCATTCATCGGATCTGTTTTTAAAAATATAGAATAACTGGATCTCTATGTTAAAAT
AATAAAACACACATTCTGATTTTACCTGTCAAGATTGAACACGACTTAAAAGTATGTATAAAACATCATCTGTATGTATAATTGTTT
AACTGTCAACTAATAGTCCAAATAATTGTGTTATGGAAATGTATTCATTGTCATATAATATCATTTGCTTGAATTTATCACCATGTG
TTTTTGTTTGTTTTTACACAGGTGCCAAGCACCTTGGCCAGGCGGCCATTAAGTAAGGACTTCTACCATCATTACTGTGTAATTTTA
ACAGTATTATCATCAGTACTGTTATTGACAACTACTCTTGTCTCTGTTACTCTCTCCAGGGGTTTGGCCTCTTGCGAAGAGCAGCAG
GAGCTCGACAAGCGTCAATGGATGACGAGCCCAGTGCTATTGTTTTTGACTGAAGAAGTCGCCTTGAAGGAGCCTTCA
//
NRC-18
ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGGATCCGGAGAGTGTGGTTGGAAAAAGTGGTTCACT
AAAGGTAGAGTCATGGATTTAATTTGCTTTTTACATTGCAAATACTTTAATATAACATAGCTGGAAAATCACAAAAATAAGTAGTCG
ATATATTTGGCCATATAGAATCACTTTGATTTCAATAATAATCAAAACAATAATCAAAAAGCCTATTGATTAGCATGTTCCTTCACT
AAAATGGACATTGTAATTTATTTTGATTCTCACAGGCACCAACCTGCTGTGGCAACAATTGAAATCAAATTTGTCTCAGAAGAATTC
AAAGTACATTGTTCTAGGCGATTTAATCTTTCCATTCATCGGATTTGTTTTCAAAAATATAGAATAACTGGATCTCTATGTTAAAAT
AATAAAACACATTCTGATTTTATCTGTCAAGATTGAACACGACTTAAAAGTATGAATAAAACATCATCTGTATGTATAATTTTTTAA
CTGTCAACTAATAGTCCAAATAATTGTGTTATGGAAATGTATTCATTGTCATATAATATCATTTGCTTGAATTTATCACCATGTGTC
TTTGTTTGTTTTTACACAGGTGAAAGGTTATCCCAGAGGTAAGGACTTCTACCATCATTACTGTATAATTTTAATAGTATTATCATC
AGTACTGTTATTGATAACTTCTCTTGTCTCGCTGACTCTCTCCATCAGGCATTTCGCTGACGTCGAGCAGCAGGAGCTCGACAAGCG
CTCAGTGGATGACGAGCCCAGTTCTATTGCTTTTGACTGAAGAAGTCGCCTTGAAGGAGCCTTCAG
//
NRC-19
TTATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAGCCTGGAGAGTGTTTTTTGGGATTGCTTTTTC
ACGGGGTCCACCATGGTAGGGTCACGGTTGTAATTCGATTTTTACATGGCAAATATTTTAAGATAACACACCATATGAGTAGTCGAT
ATATTTGACCAATTAGAATCACTTTAATTTCAATAATAATCACAATAACAATCTCTAGGCCATTTAATCTTTCCATTAATCGGATTT
GTTTTTTTAAATATAGAATAACTGGATCTCTATGTTAAAATAATAAAACATACATTCTGATTTTACCAGTCAAGATTGTACGCTACT
TAAAAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACTGTTAACTAATAGTCCAAATAATTGTGTAATGGAAATGTATTA
ATTGTCATTTAATATCATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTACACAGTTGGAAAGTGGATCCATGGGTAAGG
ACTTCTACCATCATTACTGTGTATTTTTAATAGTATTATCATCAGTACTGTTATTGATATTTTCTCTTGTCTCGCTGACTCTCTCCA
TCAGACTCATCCATGGGCATCACGGTTACGACGAGCAGCAGGAGCTCGACAAGCGCGCAGTCGATGAAA
//
NRC-20
TTATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTTTTGGGAATTCTTTTTC
ACGGGGTCCACCATGGTAGAGTCACGGAATTAATTCGATTTTTACATGGCAAATATTTTAAGATAACACACCATATGAGTAGTCGAT
ATATTTGACCAATTAGAATCACTTTAATTTCAATAATAATCACAATAACAATCTCTAGGCCATTTAATCTTTCCATTAATCGGATTT
GTTTTTTTAAATATAGAATAACTGGATCTCTATGTTAAAATAATAAAACATACATTCTGATTTTACCAGTCAAGATTGAACACTACT
TAAAAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACTGTTAACAATAGTCCAAATAATTGTGTTATGGAAATGTATTAA
TTGTCATTTAATATCATTTGCTTGAATTTATCACCATGAGTTTTTTGTTTGTTTTTACACAGGTAGAAAGAAGGCCTTGCAGTAAGG
ACTTCTACCATCATTACTTTGTAATTTTTATAGTATTATCATCAGTACTGTTATTGACAACTTCTCTTGTCTCGCTGACTCTCTCCA
TCAGGATGAACTCAGAGCGTCGCAGTTACGACGAGCGGCAGCAGCAGCAGCAGGAGCTCGACAAGCGCGCAGTCTATGAAA
//
NRC-101
GCCCACTTTGTATTCGCAAGGTAAGATCGATATTTTTCAAACTCATTTAGACGAGACCAAGCATTTGTTGAAATGTGATAAGCTTCT
AACTTTATAATGCAAATGTTAACAATCTTTTTGTTCTGTTGTTTTTGTAGGATGAAGTTGGCTGCCGCCTTCCTGGTGCTGTTCCTG
GTCGTCCTCATGGCTGAACCTGGAGAGGGTTTCTTGGGATTTCTTTTTCACGGTATCCACCATGGTAAAGTCACTCATTTAATACAT
TTTTACATGGCAAATATTTGAATATAACATACTATATGAGTTGTCAATATATGTGGCCAAGTAGAAGCACTTTGATTTCAATAATAA
AATAATTAAACCTAAATTCAGATTTTACCACTCAAGATTGAACACTACTTAAAAGTATGTAAAAAAAACATCATCTGTATGTATAAT
TAAATACTAGTCCAGTTAATTGTTTTATGGAAATGTGTTAATTGACATATATCATTTGCTTGAACTTATAATGTGCTTTGTTTGTTT
TTACACAGGTATCAGGGCGATCCATCAGTAAGGACTTCTACCATCATGACTGTGTATTTTTAATAGTATTATCATCAGTACTTTTAT
TAACAACTTCTCTTGTCTCGCTGACTCTCTCCATCAGTCTCATCCATGGTCAAAGATACGACGAGCAGCAGGAGCTTGACAAGCGCT
CAGTCGATGACAACCCCGGTGCTATTGTTTTTGACTGAAGACGTCGCCTTGAAGGAGCCTTCAG
//
NRC-102
ATGAAGTTCACTGCCACCTTCCTGGTGTTGTCCATGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTCTTTGGAGCCCTTATCAAA
GGGGCCATCCATGGTGGCAAGTTGCTCCATAAACTCATCAAAAAAAAACATGAACATCACGGTTATGGCAAGCATTGGGGGCTTGAC
AAGCGCGCAGTCGATGA
//
NRC-103
TTGAAAGTGAGGAAGTGAGAGGAGGACTAGGTCCTGTGTTTTCAGTCGTTGAATTATCTAACACTATCTGAGCCCCTCCTGCAATAA
CTCTAAATGTTACACAGTGACTAGGAAGTCAGTCCTGTGTATATAAAGAGTTGCATCTGTTGTTATCAGTAGACAACAGATTACACC
TTTGAATCTCACAAAGCTCATTTTGTATTCGACAGGTAAGATCGATATGTTTCAAACTCATTTAGATGAGACCAAGCATTTGGGAAA
TGTGCTCAGCTTCTAACTGTATGATGCAAATGTTAACAATCTTTTTGTTCTGTTGTTTTGTAGGATGAAGTTGGCTGCCGCCTTCCT
GGTGCTGTTCCTGGTCGTCCTCATGGCTGAACCTGGAGAGAGTTTTTTGGGATTTCTTTTTCATGGTATCCGCCATGGTAGGGTCAC
TGAATTGATACATTTTTACATGGCAAATATTTGAATGTAACATACTATATGAGTTGTCAATATATGTGGCCAAGTAGAAGCACTTTG
ATTTCAGTAATAATCAAAATAACAATCACTAGGCCATTTAATAATTGCATTAATTACACTTGTTTTTATATAGAATATAGAATAACT
GGATCTTTATGCTAAAATTAATAAACATGAATTCAGATTTTAAGATTTTTCAAGATTGAAAACTACTTAAAAGTATGTAAAAAAACA
TCATCTGTATGTATAATTAAATACTTGTCCAGATAATTGTGTTGTGGAAATGTGTTAATTGACATATATCATTTGCTTGAATTTATC
ATTATCTGCTTTGTTTGTTTTTACACAGGTATCAAGGCGATCCATGGGTAAGGACTTCTACCTTCATGACTGTGTATTTTTAATAGT
ATTATATTCAGTACTGTTATTGAAAACTTCTCTTGTCTCGCTGACTCTCTCCATCAGAATGATCCATGGTAACAGTTTAGACGAGAT
GCAGGAGCTCGACAAGCGCTCATTCGATGACAACCCCAACGCAATTGTTTTTGACTGAAGAAGTCGCCCTGAAGGAGCCTTCAGATG
ATATATAATGCTTCTTGCTTTTCAATGAAATAAATTGAATAATTACCCGCAACAGC
//
NRC-104
TACTTTTATCTACCACTATGTGAGCTCCTCCTGTTATAACTCTAAATGTTACACAATGAAGATGAGGTCAATTCTGTGTATATAAAG
AGTTGCCTCTGTATAGTAGACAACATATTTCACCTTTGAATCCCACAAAGCTCACTTTCTACTCAACAGGTAAGATCGATATTTAAA
AACTAATTTAGACGAAACCAAGCATTTTGGGGAATTTGCTCAACTTCTAAATGTATGATACAAATGTTAACAATCTTTTATTTCTGT
TGTTGTTTTTTGTAGGATGAAGTTCACTGCCACCCTCCTCCTGTTGTTCATCTTCGTCCTCATGGTTGATCTCGGAGAGGGTCGTCG
TAAGAAAAAGGGGTCGAAGAGAAAGGGGTCCAAGGGAAAGGGGTCCAAGGGAAAGGGCAGGTGGTTGGACAGGATTGGTAAAGGTAG
AGTCACGGAATTAATTTGCTTTTTACATTGCAAATATTTTTCATATAACATTGCTGGAAAATCACAAAAATAAGTAGTCAATATATT
TGGCCAAATAGAATCACTTTGATTTCAATAATAATCAAAATAACAACCTAAAAGGCCTTTGATTAGCATGTTCCTTCAATGAAATGG
ACATTGTAATTTACTTTGATTCTCACATGCTACGACCTGCTGCAGCAACATTTGAAAATAAATTTGTCCCAGAAGATTTTAAAGTAC
ATTGTTATAGGCGATTTATCTTTCTATTACTCAGATATTTGTTCAAACCAATAGAATAACTGGATCTCTATGCTAAAATAATAAAAC
ACACATTCAGATGTTACCAGTCAAGATTGAACGCTGTTTAAAAGTAAGTATGAAACATCCTCTGTATGTATAATTGTTTAACTGGTA
ACTTATAGTCCTAATAATTGCGTTATGGAAATGTATTAATTGTCATTTAATATAATTTGCTGGAATTTATCACTGTGTGTTTTTGTT
TGTTTTTACACAGCTGGCGGGATAATTATCGGGGGGGCCCTTGAGTAAGGACTTCTACCATCATTACTGTGTAATATTTATAGTTAT
GATCACTACAGTTATTAACAACTTCTCTTGTCTCGCTGAACTTCTCCATCAGTCACCTCGGGCAGGGGCAGGTGCAGGGGCCGGATT
ACGACTACCAGGAGGGGGAGGAGCTCAACAAGCGCTCAGACGATGATGACAGCCCCAGTCTTATTTTTTTTGACTGAAGAAGTCGCC
CTGAAGGAGCCTTCAGATGATATATAATGCTTCTGGCTTTTCATTGAAATAAATAATACGTTTACCTGCAACAGCAACCATG
//
NRC-105
TTATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTGGGAAATTGGATGGGGC
CCCATATCAGCGGTAGAGTCACGGAATTAATTTGCTTTTTCCATTGCAAATATTTTAATATTGCATAGCTGGAAAATCACGAAATAA
GTAGTCGATATATTTGGCCAAATAGAATCACTTTGATTTCAATAATAATCAAAATAACAATCAAAAAGGCCTTTGATTAGCATGTTC
CTTCAATAAAATGGACATTGAAGTTTATTTTGATGCTCACATGCACCGACCTGCTGCGGCAACAATTGAAATCAAATTTGTCTCAGA
ATTTAAAGTACATTTTTCTAGGTGATTTAATCTTTCCATTAACTTGATTTGTTTTTATAAATATAGAATAACTGGATCTTTATGCCA
AAATAATAAAACACACATTCTGATTTTACCAGTCAAGATTGAACACTACTTAAAAGTAATATAAAACATCATCTGTATGTATAATTG
TTTAACTGTTAACAAAAGTCCAAATAATTGTGTTATGGAAATGTATTAATTGTCATTTAATATCATTTGCTTGAATTCATCACCATG
TGTTTTTTGTTTGTTTTTACACAGGTGAAAAGAAGGCCTTGCAGTAAGGACTTCTACCATCATTACTTTGTAATTTTTATAGTATTA
TCATCAGTACTGTTATTGACAACTTCTCTTGTCTCGCTGACTCTCTCCATCAGGATGAACTCAGAGCGTCGCAGTTACGACGAGCGG
CAGCAGCAGCAGCAGGAGCTCGACAAGCGCGCAGTCGATGA
//
NRC-106
ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTGGGAAATTGGATCGTGCGC
CCTATCGGAGGTGAAAAGAAGGCCTTGCAGATGAACTCAGAGCGTCGCAGTTACGACGAGCGGCAGCAGCAGCAGCAGGAGCTCGAC
AAGCGCGCAGTCGATGAAA
//
NRC-107
ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATAGCTGAACCTGGAGAGAGTCTTTTTGGAAAGTTCCTCAAG
AAAGTTGTCCATGCTGGCACGTCAATTGGCGAGACAGCCTTGCATGTCGCCGCAGAGCATCACGGGCTTCATGCGCATCACGGGTGT
CACGGGCGTCACGGGGGTCACAGGCGTCACGGGGGTCACAGGCGTCACGGGCGTCGCGGTTACGACGAGCAGCAGCAGGAGGAGCTC
GACAAGCGCGCATTCGATGA
//
NRC-108
TATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTGGGAAATTGGATGGGGCC
CCATATCAGCGGTAGAAAGAAGGCCTTGCACATGAACTCAGAGCGTCGCAGTTACGACGAGCGGCAGCAGCAGCAGCAGGAGCTCGA
CAAGCGCGCAGTCGATGAAA
//
NRC-109
ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGAGTGTTTTTTGGGATTGCTTTTTCAC
GGGGTCCACCATGGTAGGGTCACGGAAGTAATTCGATTTTTACATGGCAAATATTTTAAGATAACACACCATATGAGTAGTCGATAT
ATTTGGCCAATTAGAATCACTTTGATTTCAATAATAATCAAAATAACAATCTCTAGGCGATTTAATATTTGCATTAATTGGATTTGT
TTTTAAAAATATAGAATAACTGGATCTTTATGGTAAAATAATTAAACATACATTCTGATTTTACCAGTCAAGATTGAACACTACTTA
GAAGTATGTATAAAAGATCATCTGTATGTATAATTGTTTAACTGTTAACGAATAGTCCAAATAATTGTGTTATGGAAATGTATTAAT
TGTCATTTAATATCATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTACACAGTTGGAAAGTTGATCCATGGGTAAGGAC
TTCTACCATCATTACTGTGTATTTTTAATAGTATTATCATCAGTACTATTATTGACAACTTCTCTTGTCTCGCTGACTCTCTCCATC
AGACTCATCCATGGCGGTTACGACGAGCAGCAGGAGCTCGACAAGCGCGCAGTCGATGAA
//
NRC-110
GCCCACTTTGTATTCGCAAGGTAAGAGCGATATATTTCAAATTCATTCGGATGAGACCAAGCATTTGGGAAATGTGCTCAGCTTGTT
ACTGTTTAATGCAAATGTTAACAATATCCTTTTTCTGTTGTTTTTGTAGAATGAAGTTCGCTGCCGCCTTCCTCATGATGTTCATGG
TCGTCCTCATGGCTGAACCCGGAGAGGCTCGTTGGGGAACGTTCTTCAAACATATTTTCAAAGGTAGAGTCACAGAATTAATTTGCT
TTTTACATTGCAAATATTTTCATATAACATAGCTGGAAAATCACAAAAATAAGGGCTTGATATATTTGGCAAAGTAGAATCCCTTTG
ATTTCAATAATAATCAAAATAAAAATCAGAAAGGCCTTTGATTAGCATGTTCCTTCAATAAAATGGACATTGTAGTTTATTTTGATT
CTCAAATGCACCAACCTGCTGCGGCAACAATTGAAATCAAATTTGTCTCCGAAACATTTAAAGTACATTTTTCGAGGCAATTTAATC
TTTCCTTTGATCGAATTCGTTTTTAAAAATATAGAATAACTGGATCTTTATGCTAAAATAATAAATCATACATTCTGATTTTACCAG
TCAAGATTGAACGCTACTTAAAAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACTTTTAACTAATAGTCCTAATAATTG
TGTTATGGAAATGTATTCATTGTCATTTAATATCATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTACACAGCTGGAAG
GTTCATCCATGGGTAAGGACTTCTACCATCATTACTGTGTATTTTTAATAGTATTATCATCAGTACTGTTATTGATAACTTCTCTTG
TCTCGCTCACTCTCTCCATCAGTGCGATCCAGGCACACAATGACGGCGAGCAGCAGGATCTCGACAAGCGCTCAGTGGATGATGAGC
CCAGTGTTATTGTTTTTGAATGAAGAAGTCGCCTTGAAGGAGCCTTCAG
//
NRC-111
GCCCACTTTGTATTCGCAAGGTAAGAGCAATATATTTCAAATTCATTTAGACGAGACCAAGCATTTGGGATCTGTGCTCAACTTGTA
ACTGTATAATGCAAATGTTAACAATATTCTTTTTCTGTTGTTTTTGTAGAATGAAGTTCGCTGCCGCCTTCCTCATGATGTTCATGG
TCGTCCTCATGGCTGAACCCGGAGAGGGTGCTTGGATACCTGCCTTGAATAGGATCTATCATGGTAGAGTCACAGAGTTAATTTGCT
TTTTACATTGCAAATATTTTAATATAACATGGCTGGAAAATCACAAAAATGAGTACTCGATATATTTGGCAAAGTAGAATCCCTTTG
ATTTCAATAATAATCAAAAACACAATCAAAAAGGCCATTGATTAGCATGTTCCTTCAATGAAATGGACATTGTAGTTTATTTTGATT
CTGACATGCACCAACTTGCTGCGGCAACAATTGAATTCAAATTTGTCTCAGAAAAATTTAAAGTACATTTTTCTTTCCATTAGTCAA
ATTTGTTTTAAAAAATACAGAATAACTGGATCTTTATGCTAAAATAATAAATCATACATTCTGATTTTACCAGTCAAGATTGAACGC
TACTTAAAAGTATGTATAAAACATCATCTGTATTGATAATTGTTTAACTTTTAACTAATAGTCCTAATAATTGTGTTATGGAAATGT
ATTCATTGTCATTTAATATCATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTACACAGCTCTACTGAGGATCAATCGGT
AAGGTCTTCTACCATCATTACTGTGTAATTTTAATAGTATTATCATCAGTACTGTTATTGATAACTTCTCTTGTCTTGCTGGCTCTC
TCCATCAGCCAAATGGTGTATTATCGTCGGCACTGGCACGGTGACGTCGAGCAGCAGGCTCTCGACAAGCGCTCAGTGGAGGACCAG
CCCAGTTCTATTGCTTCTGCCTGAAGAAGTCGCCTTGAAGGAGCCTTCAG
//
NRC-112
GCCCACTTTGTATTCGCAAGGTAAGAGCAATATATTTCAAATTCATTTAGACGAGACCAAGCATTTGGGATCTGTGCTCAACTTGTA
ACTGTATAATGCAAATGTTAACAATATTCTTCTTCTGTTGTTTTTGTAGAATGAAGTTCGCTGCCGCCTTCCTCATGATGTTCATGG
TCGTCCTCATGGCTGAACCCGGAGAGGGTGCTTGGATGCCTGCCTTGAATAGGATCTATCATGGTAGAGTCACAGAGTTAATTTGCT
TTTTACATTGCAAATATTTTAATATAACATGGCTGGAAAATCACAAAAATGAGTACTCGATATATTTGGCAAAGTAGAATCCCTTTG
ATTTCAATAATAATCAAAAACACAATCAAAAAGGCCATTGATTAGCATGTTCCTTCAATGAAATGGACATTGTAGTTTATTTTGATT
CTGACATGCACCAACTTGCTGCGGCAACAATTGAATTCAAATTTGTCTCAGAAAAATTTAAAGTACATTTTTCTTTCCATTAATCGG
ATTTGTTTTAAAAAATACAGAATAACTGGATCTTTATGCTAAAATAATAAATCATACATTCTGATTTTACCAGTCAAGATTGAACGC
TACTTAAAAGTATGTATAAAACATCATCTGTATTGATAATTGTTTAACTTTTAACTAATAGTCCTAATAATTGTGTTATGGAAATGT
ATTCATTGTCATTTAATATCATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTACACAGCTCTACTGAGGATCAATCGGT
AAGGACTTCTACCATCATTACTGTGTAATTTTAATAGTATTATCATCAGTACTGTTATTGATAACTTCTCTTGTCTTGCTGACTCTC
TCCATCAGCCAAATGGTGTATTATCGTAGGCACTGGCACGGTGACGTCGAGCAGCAGGCTCTCGACAAGCGCTCAGTGGAGGACCAG
CCCAGTTCTATTGCTTCTGCCTGAAGAAGTCGCCTTGAAGGAGCCTTCAG
//
NRC-113
ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGGATCCGGAGAGTGTGGTTGGAAAAAGTGGTTCACT
AAAGGTGCCAAGCACCTTGGCCAGGCGGCCATTAACGGTTTGGCCTCTTGCGAAGAGCAGCAAGAGCTCGACAAGCGCTCAGAGGAT
GACGAGCCCAGTGCTATTGTTTTTGAA
//
NRC-114
ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGGATCCGGAGAGTGTGGTTGGAAAAAGTGGCTCCGT
AAAGGTAGAGTCATGGATTTAATTTGCTTTTTACATTGCAAATACTTTAATATAACATAGTTGGAAAATCACAAAAATAAGTAGTCG
ATATATTTGGCCATATAGAATCACTTTGATTTCAATAATAATCAAAACAACAATCAAAAAGCCCATTGATTAGCATGTTCCTTCACT
AAAATGGACATTGTCATTTATTTTGATTCTCACAGGCACCAACCTGCTGCGGCAACAATTGAAATCAAATTTGTCTCAGAAGAATTC
AAAGTACATTGTTCTAGGCGATTTAATCTTTCCATTCATCGGATTTGTTTTTAAAAATATAGAATAACTGGATCTCTATGTTAAAAT
AATAAAACACACATTCTGATTTTACCTGTCAAGATTGAACACGACTTAAAAGTATGTATAAAACATCATCTGTATGTATAATTGTTT
AACTGTCAACTAATAGTCCAAATAATTGTGTTATGGAAATGTATTCATTGTCATATAATATCATTTGCTTGAATTTATCACCATGTG
TTTTTGTTTGTTTTTACACAGGTGCCAAGCACCTTGGCCAGGCGGCCATTAAGTAAGGACTTCTACCATCATTACTGTGTAATTTTA
ACAGTATTATCATCAGTACTGTTATTGACAACTACTCTTGTCTCTGTGACTCTCTCCAGGGGTTTGGCCTCTTGCGAAGAGCAGCAG
GAGCTCGACAAGCGCTCAATGGATGACGAGCCCAGTGCTATTGTTTTTGACTGAAGAAGTCGCCTTGAAGAGCCTTCAG
//
NRC-115
GCCCACTTTGTATTCGCAAGGTAAGAGCGATATATTTCAAACTCATATAGACGAGACCAAGCATTTGGGAAATGTGCTCAGCTTGTT
ACTGTATAATGCAAATGTTAACAATGTTTTTGTTCTGTTGTTTTTGCAGAATGAAGCTCGCTGCTGCCTTCCTGGTGTTGTTCATGG
TCGTCCTCATGGCTGAACATGGAGAGGGTTTTGGGGATTTCTATATGAAGCCTGGTAGAGTCACGGAATTAATTCGATTTTAACATG
GCAAATATTTTACTATAACATACCATATGAGTAGTCGATTAATTAATTGGATTTGTTTTTAAAAATATAGAATAATTGGATCTTTAT
GCTAAAATAATTAAACATACATTCTGATTTTACCAGTTAAGATTGAACGCTACTTAAAAGTATGTATAAAACATCATCTGTACATAT
AATTGTTTAACTGTTAACCAATAGTCCAAATAATTGTGTTGTGGAAATGTATTAATTGTCATTTAATATCATTTGCTTGAATTTGTC
ACCATGTGTTGTTGTTTGTTTTTACACAGGTAGAAAGATTTCCCATGGGTAAGGACTTCTACCATCATTACTGTGTATTTTTAGCAG
TATTATCATCAGTACTGTTATTGATAACTTCTCTTGTCTCGCTGACTCTCTACAGGTACATCAGAAGTCCTTATGGTTACGACGAGC
AGCAGGAGGTCGACAAGCGCTCAGTCGATGACAACCCCAGTGCCATTGCTTCTGACTGAAGAAGTCGCCTTGAAGGAGCCTTCAGA
//
NRC-116
ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGCGAGGGTTATTGGCGCTTCCGCAACCAC
CGTGGTGAAAGGTTATCCCAGAGGCATTTCGCTGACGTCGAGCAGCAGGCGCTCGACAAGCGCTCAGTGGATGACGAGCCCAGTTCT
ATTGCTTTTGA
//
NRC-117
ATGAAGTTCACTGCCACCTTCCTCGTGTTGTTCATCGTCATGTTTGAACCTGGAGAGTGTTTTTGGAATGCTTTTTCACCGGGTCCA
CCATGGTCGGGTCACGGAAGTAGTTCGATTTTTACATGGCAAATATTTAAATGAAACATACCATATGAGTAGTCGATATATTTGGCC
AAGTAGAATCACTTTGACTTCAATAATAATCAAAAACATAATCAAAAAGCCCATTGATTAGCATGTTCCTTCAATGAAATGGACATT
GAGGTTTATTTTGATTCTCACAGGCACCAACCTGCTGCGGCAACAATTGCATTCAAATTTGTCCCAAAGAAACTTAATTAACATTTT
CTGGCGATTTAATCTTTGCATAAATTGGATTTGTTTTTAAAAATATAGAATAACTGGATCTTTATGCTCAAATAATTAATCATACAT
TCTTATTTTATCAGTCAACATTGAACGCTACTTAAAAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACTTTTAACTAAA
AGTCCTAATAATTGTGTTATGGAAATGTATTAATTGTCATTTAATATCATTTCCTTGAATTTATCACCATGTGTTTTTGTTTGGTTT
TTACACAGCTGGAAGGTTGATCCATAGGTAAGGACTTCTACCATCATTACTGTATAATGTTAATAATAGCATTATCATCAGTACTGT
TATTGATAACTTCTCTTGTCTCGCTGACTCTCTCCATCAGATTCATCAAACGTCACGGTGACGTCGAGCAGCAGGAGCTCGACAAGC
GCTCAGTGGATGACGAGCCCAGTTCTATTGCTTTTGCCTGAAGAAGTCGCCTTG
//
NRC-118
ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGACTGTATTTTTGGATTGATTGCGACT
GCGGTCCACAATGGTAAGTCAAGGAATTAATTCGATTTTTACGTGGCAAATATTTTAGTATAACATACCTTATGAGTAGTCGATATA
TTTGACCAAGTAGAATCATTTTGACTTCAATAATAATCAAAATAACAATCTCTAGGCAATTTAATATTTGCATTAATTGGATTTGTT
TTTAAAAATATAGAATAACTGGATCTTAATGCTAAAATAATTAAACATACATTCTGATATTACCAGTCAAGATTGAACGCTACTTAA
AAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACTGTCGACTAATAGTCCTAATAATTGTGTTATGGAAATGTATTCATT
GTCATATAATATCATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTACACAGCTGGAAGGTTGATCCATAGGTAAGGACT
TCTACCATCATTACTGTATAATTTTAAGAGCATTATCATCAGTACTGTTATTGATAACTTCTCTTGTCTCGCTGACTCTCTCCATCA
GACTACTCGGCTTTCATCATGGGCCTCCCGGGTTCTGGCACGGTGACGTCGAGCAGCAGGAGCTCGACAAGCGCTCAGTGGATGAGG
AGCCCAGTTCTATTGCTTTTGACTGAAGAAGTCGCCTTGAAGGAGCCTTCAG
//
NRC-119
ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGACTGTATTTTTGGATTGATTGCGAGT
GCGGTCCACAATGGTAAGTCAAGGAATTAATTCGATTTTTACTTGGCAAATATTTTAGTATAACATACCTTATGAGTAGTCGATATA
TTTGACCAAGCAGAATCATTTTGATTTCAATAATAATCAAAATAACAATCTCTAGGCAATTTAATATTTGCATTAATTGGATTTGTT
TTTAAAAATATAGAATAACTGGATCTTAATGCTAAAATAATTAAACATACATTCTGATATTACCAGTCAAGATTGAACGCTACTTAA
AAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACTGTCGACTAATAGTCCTAATAATTGTGTTATGGAAATGTATTCATT
GTCATATAATATCATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTACACAGTTGGAAGGTTGGTCCATGGGTAAGGACT
TCTACCATCATTACTGTATAATTTTAAGAGCATTATCATCAGTACTGTTATTGATAACTTCTCTTGTCTCGCTGACTCTCTCCATCA
GACTACTCGGCTTTCATCATGGGCCTCCCGGGTTCTGGCACGGTGACGTCGTGCAGCAGGAGCTCGACAAGCGCTCAGTGGATGAGG
AGCCCAGTGCTATTGTTTTTGAATGAAGAAGTCGCCTTGAAGGAGCCTTCAG
//
NRC-120
ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGACTGTATTTTTGGATTGATTGCGACT
GCGGTCCACAATGGTAAGTCAAGGAATTAATTCGATTTTTACGTGGCAAATATTTTAGTATAACATACCTTATGAGTAGTCGATATA
TTTGACCAAGTAGAATCATTTTGGTTTCAATAATAATCAAAATAACAATCTCTAGGCAATTTAATATTTGCATTAATTGGATTTGTT
TTTAAAAATATAGAATAACTGGATCTTAATGCTAAAATAATTAAACATACATTCTGATATTACCAGTCAAGATTGAACGCTACTTAA
AAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACTGTCGACTAATAGTCCTAATAATTGTGTTATGGAAATGTATTCATT
GTCATATAATATCATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTACACAGTTGGAAGGTTGGTCCATGGGTAAGGACT
TCTACCATCATTACTGTATAATTTTAAGAGCATTATCATCAGTACTGTTATTGATAACTTCTCTTGTCTCGCTGACTCTCTCCATCA
GACTACTCGGCTTTCATCATGGGCCTCCCAGGTTCTGGCACGGTGACGTCGAGCAGCAGGAGCTCGACAAGCGCTCAGTGGATGAGG
AGCCCAGTGCTATTGTTTTTGAATGAAGAAGTCGCCTTGAAGGAGCCTTCAG
//
NRC-121
ATGAAGTTCACTGCCACCTTCCTCGTGTTGTTCATGGTCATCGTCATGTTTGAACCTGGAGAGTGTTTTTTTGGAATGCGTTTTCAC
GGGGTCCACCATGGTAGGGTCACAAAAGTGATTTGATTATTACATGCCAAATATGTTAATGAAACATACCATATGAGCAGTCGTATT
ATTTGGACAAGTAGAATCACTTTGATTTCAATAGTAATTAAAATAACAATCAAAAAGGCCTTTGATTAGCATGTTCCTTCAATGAAA
TGGACATTGAGGTTTATTTTGATTCTCACCTGCATCGACCTGCTGCGGCAACTATTGAAATCAAATTTGTCCCAGAAGAAACTAAAT
TAACATTTTCTAGGCCATCTAATCTTTGCATGAATTGGATTTGCTTTCAAAAATATAGAATAACTGGATATTTATGCTAAAATAATA
AAAACACACATTCTGATTTTACCAGTCAAGATTGAACACTACTTAAAAGTACGTATAAAACATCATCTGTATGTATAATTGTTTGAC
TTTTAACAAATAGTCAAAATGATTGTTATGGAAATGCATTAATTGTCATTTAATATCATTTACTTGAATTTATCACCATGTGTTTGT
TTGTTTTTTAGCAGGTGGAGGTTTTCTCAATGCGCAAGGACTTCTACCATCATTACTGTGTAATTTTAATAGTATTATCATCAGTAC
TCTTATTGACAACGTCTCTTGTCTCGCTGACTCTCTCTATCAGATTAAACCCAGGGTATCGCGGTTACGACGAGCAGCAGGAGCTCG
ACAAGCGCGCAGTCGATGA
//
NRC-122
ATGAAGTTCACTGCCACCTTCCTGGTGTTGTCCTTGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTCTTTGGAGCCCTTCTCAAA
GGTAGAGTCACGGAATTAATTTGATTGTTACATGGCAAATAATTTTGTATAACATATCATATGAGCAGTCGATGTATTTGACCAAGA
AGAATCATTTTGATTTCAATAATAATCAAAATAACAATCTCTTGGAGATTATATATTTGCAATAATTGGATTTTATAAAATATAGAA
CAACTGGATCTTAATGCTAAAATAATTAAACATACATTCTGATTTTACCAGTCAAAATTAACCTCTACTTTAAAGTATGTATAAAAC
ATCATCTGTATGTTTAATTGTTTAACTTTTAACAAATAGTCCAAATAATTGTGTAATGGAAATGTATTCATTGTCATATAATATAGT
TTGCTTGACTTTATCACCGTGTGTTTTTGTTTGTTTTTTCACAGGTGCCCAGGCGCTCCATGGGTAAGGACTTCTACCATCATGACT
GTGTAAGTTTAATAATATTATCATCAGTACTGTTATTAACGACTTCTCTTGTCTCGCTGACTCTCTCCATCAGAATCATCCACAATG
CTCGTCACGGTTACGACGAGCAGCAGGAACTCAACAAGCGCGCAGTCGATGA
//
NRC-123
GCCCACTTTGTATTCGCAAGGTAAGATCAATATTTTTCAAATTCATTTAGACGAGACCAACCGTTTGCGAAATGTGCTCAGCTTGTT
ATTGTATAATAACAAAGTTAACGATCTTTATTTTTCTGTTTTTTTGTAGAATGAAGTTCACTGCCACCTTCCTGATGTTGTTCATCT
TCGTCCTCATGGTTGAACCTGGAGAGTGTGGTTGGAAAGATTGGTTTCGTAAGGCTAAGAAAGGTAGAATCACGGAATTAATTAGCT
TTTTACATTGCAAATAGATTTTTTATAACAGCTGGAAATCACAAAAATAAATAGTCGATATATTTGGCCAATTAGAATCACTTTAAT
TTCAATAATAATCTAAATAACAACCTAAAAGGCCTTTGATTAGCATGTTCCTTCAATGAAAAGGACATTGAGGTTTATTTTGATTCT
CACATGCACCGACCTGTGCGGCAACAATTGAATTCAGATTTGTCCCAGAAGAATTCAAAGTACATTTTTCCAGGCGATTAAATCTTT
CCATTACTCGGATTTAAAAATAAATAAATAGAATAACTGAAGCGCTATGATAAAATAATTACACATTCATTCTGATTTTACAAGTCA
AGATTGAACACTATTAAAAAGTGTGTATAAAACATCATCTGTATGTATAATTGTTTAACTGTTAATAGTCTTAATAATTGTGTTATG
GAAATGTATTAATTTACATTTAATATCATTTGCTTGAGTTTACCATCATGTGTTTTTGTTTGTTTTTACACAGTTGGCAAGACTGTT
GGCGGCTTGGCCCTTAAGTAAGAACTTCTACCATCATTACTGTATAATTTTGATAGTATTATCACCAGTACTGTTATTAACTACTTC
TCTTGTCTCGCTGACTCTCTCCATCCGACTCATCCGCAGTCATTACCTTGGCGAGCAGCAGGAGCTTGCCAAGCGCGCAGTCGATGA
CGACCCCAGTGTTATTGTCTTTGACTGAAGAAGTCGCCTTGAAGGAGCCTTCAG
//
NRC-124
ATGAAGTTCACTGCCACCTTCCTCATGATTTTAATCTTCGTCCTCATGGTCGAACCTGGAGAGTGTGGTATTAGGAAATGGTTTAAA
AAGGCTGCTCACGGTAAAGTCACGGAATTAATTTGCTTTTTGCTTTACAAATATTTTTTTATAGCAGCTGGAAAATCACAAAAATAA
ATAGTCGATGTATTTGGCCAATTAGAATCACTTTGATTTCAAATAATAATCTAAATAGCAACCTAAAAGGCCTTTGATTAGCATGTT
CCTTCAATGAAATGGATGTTGAGGTTTATTTTGATTCTCACATGCACCGACCTGCTGCGGCAACAATTGAATTCAAATTTGTCCCAA
AGGAATTCAAAGTAAACTTTTCTAGATGATTTAATCTTTCCATAACTCGGCTTTGTTTTTAAAAATATATAATAACTCAATCACTAT
GATAAAATAATAACACATACATTCTGATTTATACAAGACAAGATTGAAAACTTCTTAAAAGTATGTATAAAACATCATCTGTTTGTA
TAATTGTTTATCATTTCACAAAAAGTCCAACTAATTGTGTTATGGAATTGTATAAATTGTCATTTAATATAATTTTTTTGAGTTTAT
CAATATGTGTTTTTGTTTGTTTTACACAGTTGGCAAGGAAGTTGGCAAGGTGGCCCTTAAGTAAGGACTTCTACCATTATTACTGTA
TAATTTTGATAGTATTATCACCCGTACTGTTATTGACAACTTCTCTTTTCCTGCTGACTCTCTCCATCTGACTCATCTGCAGTGCTT
GCCTTGACAAGCAGCAGCAGCTCGACAAGCGCGCAGTCGATGA
//
NRC-125
GCCCACTTTGTATTCGCAAGGTAATATCGATATTTTTCAAACTCATTTAGACGAGACCAAGCATTTGGGAAATGTGCTAAGGTTGTT
ACTGTATAATGCAAAATTAATGATCTTTATTTTTCTGTTTTTTTTTGCAGAATGAAGTTCACTGCCACCTTCCTCATGATTTTAATC
TTCGTCCTCATGGTCGAACCTGGAGAGTGTGGTTTGAAGAAATGGTTTAAAAAGGCTGTTCACGGTAGAGTCACGGAATTAATTTGC
TTTTTGCTTTACAAATATTTTTTTATAGCAGCTGGAAAATCACAAAAATAAATAGTCGATGTATTTGGCCAATTAGAATCACTTTGA
TTTCAATAATAATCTAAATAGCAACCTAAAAGGCCTTTGATTAGCATGTTCCTTCAATGAAATGGATGTTGAGGTTTATTTTGATTC
TCACATGCACCGACCTGCTGCGGCAACAATTGAATTCCAATTTGTCCCAAAGGAATTCAAAGTAAACTTTTCTAGGCGATTTAATCT
TTCCATAACTCGGCTTTGTTTTTAAAAATATATAATAACTCAATCCCTATGATAAAATAATAACACATACATTCTGATTTATACAAG
ACAAGATTGAAAACTTCTTGAAAGTATGTATCAAACATCATCTGTTTGTATAATTGTTTAACAGTTCACAAAAAGTCCAACTAATTG
TGTTATGGAATTGTATAAATTGTCATTTAATATAATTTTTTTGAGTTTATCAATATGTGTTTTTGTTTGTTTTACACAGTTGGCAAG
AAAGTTGGCAAGGTGGCCCTTAAGTAAGGACTTCTACCATTATTACTGTGTAATTTTGATAGTATTATCACCAGTACTGTTATTGAC
AACTTCTCTTTTCCTGCTGACTCTCTCCATCCGACTCATCTGCAGTGCTTACCTTGGCGAGCAGCAGCAGCTCGACAAGCGTGCAGT
CGATGAAGAGCCCAGTGTTATTGCTTTTGACTGAAGAAGTCGCCTTGAAGGAGCCTTCAG
//
NRC-126
ATGAAGTTCACTGCCACCTTCCTCATGATGTTCATCTTCGTCCTCATGGTTGAACCTGGAGAGTGTGGTTGGAGGAAATGGATTAAA
AAGGCTACTCACGGTAAAGTCACGGAATTAATTCGTTTTTTGCTTTGCAAATATTTTTTTTATAACAGCTGGAAAGTCACAAAAATA
AATAGTCAATATATTTGGCCAATTAGAATCACTTTGAGTTCAATAATAATCTAAATAACAACCAAAAAGGCCTTTCCTTTAATGAAA
TGTACGTTGAAGTTTATTTTGAATCTCACATGCACCGACCTGCTGCGGCAACAATTGAATTCAAATTTCTCCCAGAGGAATTCAAAG
TAAATTTTTCTAGGCGATTTAATCTTTCCATTACTCTGATTTGTTTTAAATATATAGAATGACTCAATTGCTATGATAAAATAATAA
GCCATACATTCTGATTTTTACAAGACAAGATTGAAAACTTCTTAAAAGTACGTATAAAACATCATCTGTATTTATAATTGTTTAACA
TTTAACAAATTGTCCTACTAATTGTGTTATGGAAATGTATAAATTGTCATTTAATATCATTTGCTTGAGTTTATCATTATTTGTTTT
TGTTTGTTTTTACACAGTTGGCAAGCATATTGGCAAGGCGGCCCTTGAGTAAGAACTTCTACCATCATTACTGTATAATTTTGATAG
TATTATCACCAGTACTGTTATTGACAACTTCTCTTGTCCTGATGACTCTGTTCATCCAACTCATCTGCAGTGCTTACATTGGCGGGA
AGCAAGAACTCGACAAGCGCGCAGTCGATGA
//
NRC-127
ATGAAGTTCACTGCCACCTTCCTCATGATTTTAATCTTCGTCCTCATGGTCGAACCTGGAGAGTGTGGTTGTAAGAAATG
GTTTAAAAAGGCTGCTCACGGTAGAGTCACGGAATTAATTTGCTTTTTGCTTTACAAATATTTTTTTATAGCAGCTGGAA
AATCACAAAAATAAATAGTCGATGTATTTGGCCAATTAGAATCACTTTCATTTCAATAATAATCTAAATAGCAACCTAAA
AGGCCTTTGATTAGCATGTTCCTTCAATGAAATGGATGTTGAGGTTTATTTTGATTCTCACATGCACCGACCTGCTGCGG
CAACAATTGAATTCCAATTTGTCCCAAAGGAATTCAAAGTAAACTTTTCTAGGCGATTTAATCTTTCCATAACTCGGCTT
TGTTTTTAAAAATATATAATAACTCAATCCCTATGATAAAATAATAACACATACATTCTGATTTATACAAGACAAGATTG
AAAACTTCTTGAAAGTATGTATCAAACATCATCTGTTTGTATAATTGTTTAACATTTCACAAAAAGTCCAACTAATTGTG
TTATGGAATTGTATAAATTGTCATTTAATATAATTTTTTTGAGTTTATCAATATGTGTTTTTGTTTGTTTTACACAGTTG
GCAAGAACGTTGGCAAGGTGGCCCTTAAGTAAGGACTTCTACCATTATTACTGTATAATTTTGATAGTATTATCACCAGT
ACTGTTATTGACAACTTCTCTTTTCCTGCTGACTCTCTCCATCCGACTCATCTGCAGTGCTTACCTTGGTGAGCAGCAGC
AGCTCGACAAGCGTGCAGTCGATGAAGAGCCCAGTGTTATTGCTTTTGACTGAAGAAGTCGCCTTGAAGGAGCCTTCAG
//
NRC-128
GCCCACTTTGTATTCGCAAGGTAATATCGATATTTTTCAAACTCATTTAGACGAGACCAAGCATTTGGGAAACGTGCTAA
GGTTGTTACTGTATAATGCAAAATTAATGATCTTTATTTTTCTGTTTTTTTTTGCAGAATGAAGTTCACTGCCACCTTCC
TCATGATTTTAATCTTCGTCCTCATGGTCGAACCTGGAGAGTGTGGTATTAGGAAATGGTTTAAAAAGGCTGCTCACGGT
AAAGTCACGGAATTAATTTGCTTTTTGCTTTACAAAATATTTTTTTATAGCAGCTGGAAAATCACAAAAATAAATAGTCG
ATGTATTTGGCCAATTAGAATCACTTTGATTTCAATAATAATCTAAATAGCAACCTAAAAGGCCTTTGATTAGCATGTTC
CTTCAATGAAATGGATGTTGAGGTTTATTTTGATTCTCACATGCACCGACCTGCTGCGGCAACAATTGAATTCAAATTTG
TCCCAAAGGAATTCAAAGTAAACTTTTCTAGGCGATTTAATCTTTCCATAACTCGGGCTTTGTTTTTAAAAATATATAAT
AACTCAATCCCTATGATAAAATAATAACACATACATTCTGATTTATACAAGACAAGATTGAAAACTTCTTGAAAGTATGT
ATCAAACATCATCTGTTTGTATAATTGTTTAACATTTCACAAAAAGTCCAACTAGTTGTGTTATGGAATTGTATAAATTG
TCATTTAATATAATTTTTTTGAGTTTATCAATATGTGTTTTTGTTTGTTTTACACAGTTGGCAAGAAAGTTGGCAAGGTG
GCCCTTAAGTAAGGACTTCTACCATTATTACTGTATAATTTTGATAGTATTATCACCAGTACTGTTATTGACAACTTCTC
TTTTCCTGCTGACTCTCTCCATCCGACTCATCTGCAGTGCTTACCTTGGCGAGCAGCAGCAGCTCGACAAGCGTGCAGTC
GATGAAGAGCCCAGTGTTATTGCTTTTGACTGAAGAAGTCGCCTTGAAGGAGCCTTCAG
//
NRC-129
AATGAAGTTCACTGCCACCTTCCTCATAGAATGGTTCATCTTCGTCCTCAATGGGTTGAAACCTGAAGAAGTGTGGTTGG
AAAGAAAGTGGTTTAAAAAGGCTACTCACGGTAAAGTCACGGAATTAATTAGCATTTTTCTTTGCAAATATTTTTTTTAT
ACAGCTCGAAAATTCACAAAAATAAATAGTCGATATATTTGGCCAATTAGAATCACTTTGATTTCAATAATAATCTAAAT
AACAACCTAAAAGGCCTTTGATTAGCATGTTCCTTCAATGAAATGGACGTTGAGGTTTATATTGATTCTCACATGCACCG
ACCTGCTGCGTCAACAATTGAATTCAAATTTGAGAGGAATTCAGCGTAAATTTTTCTAGGCGATTTAATCTTTCCATTAC
TCGGATTTGTTTTTAAATATATAGAATAACTCAATTGCTATGATAAAATAATAACACATACATTCAGATTTTTACAAGAC
AAGATTGAAAACTTCTTAAAGGTACGATATAAAACATCATCTGATTTATAATTGTTTAACATTTAACAAATAATCCTACT
AATTGTGTTATGGAAATGTATAAATTGTAATTTAATATAATTTGGTTTAGTTTATCATTATTTGTTTTTGTTTGTTTTTA
CACAGTTGGCAAGCATGTTGGCAAGGCGGCCCTTGAGTAAGAACTTCTACCATCATTACTGTATAATTTTGATAGTGTTA
TCACCAGTACTGTTATTGACAACTTCTCTTGTCCTGCTGACTCTCTCCATCCGACTCATCCGCAGTGCTTACCTCGGCGA
GAAGCAAGAACTCGACAAGCGCGCAGTCGATG
//
NRC-130
ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCCTCCTCATGGCTGAACCTGGAGAGGGTTTTTTCGGATTGCTTTTTCAC
GGGATCCACCATGGTAGGGTCACGGAATTAATTAGATGTTTACATGGCAAATATTTTAAGATAACACACCATATGAGTAGTCGATAT
ATTTGACCAATTAGAATCACTTTAATTTCAATAATAATCACAATAACAATCTCTAGGCCATTTAATCTTTCCATTAATCGGATTTGT
TTTTTTAAATATAGAATAACTGGATCTTTATGCTAAAATAATGAAACATACATTCTGATTTTACCAGTCAAGATTGAACGTTACTTA
AAAGTATGTTTAAAACATCATCTGTATGTATAATTGTTTAGCTGTAAACAAATAGTCCAAATAATTGTGTTATGGAAATGTATTAAT
TGTCATATAATATAATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTTAACACAGCTGGAAAGTTGATCCATGGGTAAGG
ACTTCTACCATCATTACTGTGTAIIIIIAATAGTATTATCATCAGTACTGTTATTAACAACTTCTCTTCTATCGCTGACTCTCTCCA
TCAGACTCATCCATCATGGTTACGACGAGCAGCAGGAGCTCGACAAGCGCGCAGTCGATGA
//
NRC-131
ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGAGGGTTTGGGAAATTGGATGGGGCCC
CATATCAGCGGTAGAGTCACGGAATTAATTTGCTTTTTCCATTGCAAATATTTTAATATTGCATAGCTGGAAAATCACGAAATAAGT
AGTCGATATATTTGGCCAAATAGAATAACTTTGATTTCAATAATAATCAAAATTACAATCAAAAAGGCCTTTGATTAGCATGTTCCT
TCAATAAAATGGACATTGAAGTTTATTTTGATGCTCACATGCACCGACCTGCTGCGGCAACAATTGAAATCAAATTTGTCTCAGAAT
TTAAAGTACATTTTTCTAGGTGATTTAATCTTTCCATTCATCTGATTTATTTTATAAATATAGAATAACTGGATCTTTCTGCTAAAA
TAATAAAACACACATTCTGATTTTACCAGTCAAGATTGAACACTACTTAAAAGTATGTATAAAACATCATCTGTATGTATAATTGTT
TAACTGTTAACAATAGTCCAAATAATTGTGTTAAGGAAATGTATTAATTGTCATTTAATATCATTTGCTTGAATTTATCACCATGAG
TTTTTTGTTTGTTTTTACACAGGTAGAAAGAAGGCCTTGCAGTAAGGACTTCTACCATCATTACTTTGTAATTTTTATAGTATTATC
ATCAGTACTGTTATTGACAACTTCTCTTGTCTCGCTGACTCTCTCCATCAGGATGAACTCAGAGCGTCGCAGTTACGACGAGTAGCA
GCAGAAGCTCGACAAGCGCGCAGTCGATGA
//
NRC-132
ATGAAGTTCACTGCCACCTTCCTGGTGTTGTTCATGGTCGTCCTCATGGCTGAACCTGGAGAGTGTTTTTTGGGATTGCTTTTTCAC
GGGGTCCACCATGGTAGGGTCACGGAAGTAATTCGATTTTTACATGGCAAATATTTTAAGATAACACACCATATGAGTAGTCGATAT
ATTTGATATATTAGAATCACTTTGATTTCAATAATAATCAAAATAACAATCTCTAGGCGATTTAATATTTGCATTAATTGGATTTGT
TTTTAAAAATATAGAATAACTGGATCTTTATGGTAAAATAATTAAACATACATTCTGATTTTACCAGTCAAGATTGAACACTACTTA
GAAGTATGTATAAAACATCATCTGTATGTATAATTGTTTAACTGTTAACTAATAGTCCAAATAATTGTGTTATGGAAATGTATTAAT
TGTCATTTAATATCATTTGCTTGAATTTATCACCATGTGTTTTTGTTTGTTTTTACACAGTTGGAAATTTGATCCATGGGTAAGGAC
TTCTACCATCATTACTGTGTATTTTTAATAGTATTATCATCAGTACTGTTATTGACAACTTCTCTTGTCTCGCTGACTCTCTCCATC
AGACTCATCCATCACGGTTACGACGAGCAGCAGGAGCTCGACAAGCGCGCAGTCGATGA
//
NRC-133
GCCCACTTTGTATTCGCAAGGTAATATCGATATTTTTCAAACTCATTTAGACGAGACCAGGCATTTGGGAAACGTGCTAAGGTTGTTACT
ATGCAAAATTAATGATCTTTATTTTTCTGTTTTTTTTTGCAGAATGAAGTTCACTGCCACCTTCCTCATGATTTTAATCTTCGTCCTCAT
AACCTGGAGAGTGTGGTATTAGGAAATGGTTTAAAAAGGCTGCTCACGGTAAAGTCACGGAATTAATTTGCTTTTTGCTTTACAAATATT
ACAGCAGCTGGAAAATCACAAAAATAAATAGTCGATGTATTTGGCCAATTAGAATCACTTTGATTTCAATAATAATCTAAATAGCAACCT
GCCTTTGATTAGCATGTTCCTTCAATGAAATGGGTGTTGAGGTTTATTTTGATTCTCACATGCACCGACCTGCTGGGGCAACAATTGAAT
TTTGTCCCAAAGGAATTCAAAGTAAACTTTTCTAGGCGATTTAATCTTTCCATAACTCGGCTTTGTTTTTAAAAATATATAATAACTCAA
ATGATAAAATAATAACACATACATTCTGATTTATACAAGACAAGATTGAAAACTTCTTGAAAGTATGTATCAAACATCATCTGTTTATAT
TTTAACATTTCACAAAAAGTCCAACTAATTGTGTTATGGAATTGTATAAATTGTCATTTAATATAATTTTTTTGAGTTTATCAATATGTG
GTTTGTTTTACACAGTTGGCAAGAAAGTTGGCAAGGTGGCCCTTAAGTAAGGACTTCTACCATTATTACTGTATAATTTTGATAGTATTA
AGTACTGTTATTGACAACTTCTCTTTTCCTGCTGACTCTCTCCATCCGACTCATCTGCAGTGCTTACCTTGGCGAGCAGCAGCAGCTCGA
GTGCAGTCGATGAAGAGCCCAGTGTTATTGCTTTTGACTGAAGGAGTCGCCTTGAAGGAGCCTTC
//
附件II.参照表11的hepcidin样基因和cDNA的核苷酸序列
NRC201
CGCCCTTAAGATGAAGACATTCAGTGTTGCAGTTGCAGTGGTGGTCGTCCTCGCATGTATGTTCATCCTTGAAAGCACCGCTGTTCC
TTTCTCCGAGGTGCGAACGGAGGAGGTTGAAAGCATTGACAGTCCAGTTGGGGAACATCAACAGCCGGGCGGCACGTCCATGAATCT
GCCGGTACGTTCAATTTAGTGAATGAATTAAGTAATTACCTTTAGCAAATTAACATCTAAGTGGTTGCGTTTCACCCTTGGAATTGA
ATTAGCCCACTAGCGCTAGTTGTTAACCATTTGATTGTGAGCCGGTAGAGAGGGCTTCAGGGCGAGTAGTGTGAATACTTGTGAAGT
GGAGACTTGGACAAAAATACTTACCATGTGCTTGTTCCCACCTTTTTCATTTTCTTTTCTTGGCTGAGATACAGATGCATTTCAGGT
TCAAGCGTCAGAGCCACCTCTCCCTGTGCCGTTGGTGCTGCAACTGCTGTCACAACAAGGGCTGTGGCTTCTGCTGCAAATTCTGAG
GACCTGCCAGCAAAGGGCGAATTCGTTTAAAACAC
//
NRC202
AGATGAAGACATTCAGTGTTGCAGTTGCAGTGGTGGTCGTCCTCGCATGTATGTTCATCCTTGAAAGCACCGCTGTTCCTTTCTCCG
AGGTGCGAACGGAGGAGGTTGAAAGCATTGACAGTCCAGTTGGGGAACATCAACAGCCGGGCGGCACGTCCATGAATCTGCCGATGC
ATTTCAGGTTCAAGCGTCAGAGCCACCTCTCCCTGTGCCGTTGGTGCTGCAACTGCTGTCACAACAAGGGCTGTGGCTTCTGCTGCA
AATTCTGAGGACCTGCCAGCA
//
NRC203
ACGAGGTCCCTCATCCGCTGACACCAAAAGAACAATCAATCAACTTTGGACTCGTCTTAGTGCATTGAAAATTGTGCGTT
GGAGAGCGTCGCTTTTTGGGAACATTGAAGAGTTCTGATCTTCCTCATAAACTGTCACTTCAATTTCAACTGATTTCAAC
AGGACTTTTAAATAGGCTATAAACTTCCTAAAAAAAACGAGAATGAAGGCCTTTAGTGTTGCAGTGGTACTCGTCATTGC
ATGTATGTTCATCCTTGAAAGCACCGCTGTTCCTTTCTCCGAGGTGCGAACGGAGGAGGTTGGAAGCTTTGACAGTCCAG
TTGGGGAACATCAACAGCCGGGCGGCGAGTCCATGCATCTGCCGGAGCCTTTCAGGTTCAAGCGTCAGATCCACCTCTCC
CTGTGCGGTTTGTGCTGCAACTGCTGTCACAACATTGGCTGTGGCTTCTGCTGCAAATTCTAAGGACCTGCCCGCAACAT
TTTCTAGTTTGTACATGTTTGCAATGTTTTCTTTCTGAGATGTTGTTTTTGTGACTATGATAATGATTTATAAAAACACT
TCTTATTGTGACACTTTAAAAAAAATAAACACATTCTTTGAATACAAAAAAAAAAAAAAAAAA
//
NRC204
CGAACGGAGGAGGTTGAAAGCATTGACAGTCCAGTTGGGGAACATCAACAGCCGGGCGGCACGTCCATGAATCTGCCGAT
GCATTTCAGGTTCAAACGTCAGAGCCACCTCTCCCTGTGCCGTTGGTGCTGCAACTGCTGTCACAACAAGGGCTGTGGCT
TCTGCTGCAAATTCTGAGGACCTGCCAGCACTAAAGCCATTTTATTAACTTATCGCCTTTAATTTGCCCCTATTCTTCTA
TGTTTCTTTTGGACTCTGTGGAGAAGATGCAATCTCATTGACGTCTTTATCACTGCACAACCTCAATCTTGT
//
NRC205
AAGATGAAGACATTCAGTGTTGCAGTGGTACCCGTCATTGCATGTATGTTCATCCTTGAAAGCACCGCTGTTCCTTTCTCCGAGGTG
CGAACGGAGGAGGTTGGAAGCTTTGACAGTCCAGTTGGGGAACATCAACAGCCGGGCGGCACGTCCATGAATCTGCCGATGCATTTC
AGGTTCAAGCGTCAGAGCCACCTCTCCCTGTGCCGTTGGTGCTTCAACTGCTGTCACAACAAAGGCTGTGGCTTCTGCTGCAAATTC
TGAGGACCTGCCAGCA
//
NRC206
TAAGATGAAGCAATTCAGTGTGGCAGTGGTACTCGTCATGGCATGTATGTTCATCGTGGAAAGCACCGCTGTTCCTTTCTCCGAGGT
GCGAACGGAGGAGGTTGGAAGCTTGGACAGTCCAGTTGGGGAACATCAACAGCCGGGCGGCGAGTCCATGCATCTGCCGGAGCCTTT
CAGGTTCAAGCGTCAGATCCACCTCTCCCTGTGCGGTTTGTGCTGCAACTGCTGTCACAACATTGGCTGTGGCTTCTGCTGCAAATT
CTGAGACTGCCAGCA
//
NRC207
ACGAGGCACACGCTGACCAGGGGGTCACCACAACTTCTGAAGAGACCCAGGTTCCTAGAGAGCCACTAGAGAATCACCCG
GGAGCCCGAAGAACACAGGACGCTGCGGTGCTCGTCGGTGGCCGGACACCCATGAGACAGAAGACCTACAAGCCTCTCAG
CTTCAGAAGGATTTCCTGACTCAGCATCTAAAACCTCCCTCAAAATGAAGGCATTCAGCATTGCAGTTGCAGTGACACTC
GTGCTCGCCTTTGTTTGCATTCAGTGCAGCTCTGCCGTCCCATTCCAAGGGGTGCAGGAGCTGGAGGAGGCCGGGGGCAA
TGACACTCCAGTTGCGGAACATCAAGTGATGTCAATGGAATCCTGGATGGAGAATCCCACCAGGCAGAAGCGCCACATCA
GCCACATCTCCCTGTGCCGCTGGTGCTGCAACTGCTGCAAGGCCAACAAGGGCTGTGGCTTCTGCTGCAAGTTCTGAGGA
TTCCCGCAACACAACCTCACAATGTATTAATTTATTACACTTTTTGTCGAGAAATGTCCTTTTTCTTGACCTCTTTTGTA
ATTTTGTATAATCTTTTAAATAAAACGGGGTACGATTCATGGAAAAAACCCTTTGAATAAAATAAAAAAAAAAAAAAAAA
AAAAAAC
//
NRC208
AAGATGAAGACATTCAGTGTTGCAGTTGCAGTGACACTCGTGCTCGCCTTTGTTTGCATTCAGGACAGCTCTGCCGTCCCATTCCAG
GGGGTAAGAACGCAACTTTAACTCGCTTCATTTGCTTATTAGCCATAAATGTTTTGTCAGGATGCTGAGACACGGCTCCTAAATGTG
TATAATTCATTAACAGGTGCAGGAGCTGGAGGAGGCAGGGGGCAATGACACTCCAGTTGCGGCACATCAAATGATGTCAATGGAATC
GTGGATGGTATGTTCAATCTGTTCAATCGACTGGATGAATTAAGCCAATTACTGTGAGCGCGTTAACATTTAAGTGGCTGTGTTCCA
GCCCGGTGCTGTAGGGAATAAAACCCCTCGTTCATGTGTCTTGTCCGTCCACAGGAGAGTCCCGTCAGGCAGAAGCGTCACATCAGC
CACATCTCCATGTGCCGCTGGTGCTGCAACTGCTGCAAGGCCAAGGGCTGTGGCCCCTGCTGCAAATTCTGAGGACCTGCCCAGCA
//
NRC209
AAGATGAAGACATTCAGTGTTGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCTGGCACCTTTCCTGAG
GTAAGCTCCTGACTTCAGATCGTTTCATTTTGCTTGTTATCCATGAATCTCTCATCAACAGACTGAGACTTGATTCCTTCTTTATCA
GGTACAAGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCTGCTGAACATCAGGAGACATCAGTGGACTCATGGATGGTAGGTTC
AGTTCACTGAATGGATCAAACCAATTCACATCAGACCTTTCAGATGGAAGTGAATGTGTTTTAGTCTCAAAGGTGCCCTGAAGCTCA
GTTTACACAAGCAGTGAAAACAAACACAGAAAGTTATGATGATGCTGATGAACTTCTCCTCATGTCTCATGTCTCTCACACAGATGC
CATACAACAGACAGAAGCGTGCCTTCAAGTGTAAGTTCTGCTGCGGCTGCTGCAGAGCTGGTGTCTGTGGACTGTGCTGCAACTTCT
GAGGATTCCTGCTCCAACAAC
//
NRC210
ACGAGCTGACAGGAGCTGACAGGAGTCACCAGCAGAGTCAAAGAACTAAACAACTTAACTCAGTCAAACTCTCAAAGATG
AAGACATTCAGTGTTGCAGTCACAGTGGCCGTCGTCCTCGTCTTTATTTGTATCCAGCAGAGCTCTGCCTCCTTTCCTGA
GGCACAAGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCTGCTGAGCATCAGGAGACACCAGTGGACTCGTGGATGA
TGCCATACAACAGACAGAAGCGTAGCTTTAAGTGTAAGTTCTGCTGCGGCTGCTGCAGAGCTGGTGTCTGTGGACTGTGC
TGCAAGTTCTGAGGATTCCTGCTCCAACAACCATCAAATATTCATTTGTTTTGCCTTTTGTCTTAAAGTTCATTGAACTA
TAAACATATTTCTGGTTGAGCATGTGATAGTTTAATGGTGTTACTCATTGGTTCATGGTATAGTCAAGTGTTCAGAGATG
TGATTGTATCACCCACATATTTTCTCTGTTAGGTGTATTTTCAATAAATGCCAATGATCCTTTGAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAA
//
NRC211
ACGAGCGGCACGAGGTGAACTGACAGGAGCTGACAGGAGTCACCAGCAGAGTCAAAGAACTAAACAACTTAACTCAGTCA
AACTCTCAAAGATGAAGACATTCAGTGTTGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCT
GCCTCCTTTCCTGAGGCACAAGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCTGCTGAACATCAGGAGACACCAGT
TGACTCGTGGATGATGCCAAACAACAGACAGAAGCGTGGCTTTAAGTGTAAGTTCTGCTGCGGCTGCTGCAGAGCTGGTG
TCTGTGGACTGTGCTGCAAGTTCTGAGGATTCCTGCTCCAACAACCATCAAATATTCATTTGTTTTGCCTTTTGTTTTAA
AGTTCATTGAACTATATACATATTTCTGGTAGAGCATGTGATAGTTTAATGGTGCTACTCCTTGGTTCATGGTGTAGTTA
AAAAAAAAAAAAAAAAAAA
//
NRC212
ACGAGACTGACAGGAGCTGACAGGAGTCACCAGCAGAGTCAAAGAACTAAACAACTTAACTCAGTCAAACTCTCAAAGAT
GAAGACATTCAGTGTTGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCTGCCACCTTTCCTG
AGATGCCATACAACAGACAGAAGCGTGGCTTTAAGTGTAAGTTCTGCTGCGGCTGCTGCGGAGCTGGTGTCTGTGGAATG
TGCTGCAAGTTCTGAGGATTCCTGCTCCAACAACAATCAAATATTCATTTGTTTTGCCTTTTGTCTTAAAGTTCATTGAA
CTATAAACATATTTCTGGTTGAGCATGTGATAGTTTAATGGTGTTACTCATTGGTTCATGGTATAGTCAAGTGTTCAGAG
ATGTGATTGTATCACCCACATATTTTCTCTGTTAGGTGTATTTTCAATAAATGCCAATGATCCTTTGAAAAAAAAAA
//
NRC213
AAGATGAAGACATTCAGTGTTGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCTGCCTCCTT
TCCTGAGGTAAGCACCTGACTTCAGATCGTTTCATTTGCTTGTTATCCATGAATCTCTCATCATCATACTGAGACTTGAT
TCCTTCTTTATCAGGCACAAGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCTGCTGAGCATCAGGAGACACCAGTG
GACTCCAGGAGTGAATGTGTTTTAGTCACAAAAGTGCCCTGAAGCTCAGTTTACACAAGCAGAGAAAACAAACAGAGTAA
GTTATGATGATGCTGATGAAGGTCTCCTCATGTCTCATGTCTCTCACACAGATTCCATACAACAGACAGAAGCGTAGCTT
TAAGTGTAAGTTCTGCTGCGGCTGCTGCAGAGCTGGTGTCTGTGGACTGTGCTGCAAGTTCTGAGGATTCCTGCTCCAAC
AAC
//
NRC214
AGATGAAGACATGCAGTGTTGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCTGCCTCCTTT
CCTGAGGTAAGCACCTGACTTCAGATCGTTTCATTTGCTTGTTATCCATGAATCTCTCATCATCATACTGAGACTTGATT
CCTTCTTTATCAGGTACAAGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCTGCTGAACATCAGGAGACACCAGTTG
ACTCGTGGATGGTAGGTTCAGTTCACTGAATGGATCAATCCATTTCACATCAGATCTTTCAGATGGAAGTGAATGTGTTT
TAGTCACAAAAGTGCCCCTGAAGCTCAGTTTACACAAGCAGAGAAAACAAACAGAGTAAGTTATGATGATGCTGATGAAG
GTCTCCTCATGTCTCATGTCTCTCACACAGATGCCAAACAACAGACAGAAGCGTGGCTTTAAGTGTAAGTTCTGCTGCGG
CTGCTGCAGAGCTGGTGTCTGTGGACTGTGCTGCAAGTTCTGAGGATTCCTGCTCCGGACAA
//
NRC215
AAGATGAAGACAATCAGTGTTGCAGTCACAGTGGCCGTCGTCCTCGTCTTTATTTGTATCCAGCAGAGCTCTCCCTCCTT
TCCTGAGGTAAGCACCTGACTTCAGATCGTTTAATTTGCTTGTTATCCATGAATCTCTCATCAACATACTGAGACTTGAT
TCCTTCTTTATCAGGCACAAGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCTGCTGAGCATCAGGAGACACCAGTG
GACTCAGGGATGGTAGGTTCAGTTCACTGAATGGATCAATCCATTTCACATCAGATCTTTCAGATTGAAGTGAATGTGTT
TTAGTCACAAAAGTGCCCTGAAGCTCAGTTTACACAAGCAGAGAAAACAAACAGAGTAAGTTATGATGATGCTGATGAAG
GTCTCCTCATGTCTCATGTCTCTCACACAGATTCCATACAACAGACAGAAGCGTAGCTTTAAGTGTAAGTTCTGCTGCGG
CTGCTGCAGAGCTGGTGTCTGTGGACTGTGCTGCAAATTCTGAGGACCTGCCAGCA
//
NRC216
AAGATGAAGACATTCAGTGGTGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCTGCCTCCTT
TCCTGAGGTAAGCACCTGACTTCAGATCGTTTCATTTGCTTGTTATCCATGAATCTCTCATCATCATACTGAGACTTGAT
TCCTTCTTTATCAGGTACAAGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCTGCTGAACATCAGGAGACACCAGTT
GACTCGTGGATGGTAGGTTCAGTTCACTGAATGGATCAATCCATTTCACATCAGATCTTTCAGATGGAAGTGAATGTGTT
TTAGTCACAAAAGTGCCCTGAAGCTCAGTTTACACAAGCAGAGAAAACAAACAGAGTAAGTTATGATGATGCTGATGAAG
GTCTCCTCATGTCTCATGTCTCTCACACAGATGCCAAACAACAGACAGAAGCGTGGCTTTAAGTGTAAGTTCTGCTGCGG
CTGCTGCAGAGCTGGTGTCTGTGGACTGTGCTGCAAATTCTGAGGACCTGCCAGCA
//
NRC217
AAGATGAAGACATCAGTGGTTGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCTGCCACCTTTCCTGAG
GTAAGCACCTGACTTCAGATAGCTTCATTTGCTTGTTATCCATGAATCTCTCATCAACATACTGAGACTTTATTCCTTCTTTATCAG
GTACAAGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCTGCTGCGCATCAGGAGACATCAGTGGACTCGTGGATGGTAGGTTCA
GTTCACTCAATGGATCAAACCAATTCACATCAGATCTTTCAGATGGAAGCGAATGTGTTTTAGTCAAAAAAGTGACCTGATGCTCAG
TTTACACAAGCAGAGAAAACAAGCAGAGTAAGTTATGATGATGCTGATGAACGTGTCCTCATGTCTCATGTCTCTCACACAGATGCC
ATACAACAGACCGAAGCGTAGCTTTAAGTGTAAGTTCTGCTGCGGCTGCTGCAGAGCTGGTGTCTGTGGACTGTGCTGCAAATTCTG
AGGATTCCTGCTCCAACAAC
//
NRC218
AAGATGAAGACATTCAGTGTGGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCTGCCACCTTTCCTGAG
GTAAGCACCTGACTTCAGATAGCTTCATTTGCTTGTTATCCATGAATCTCTCATCAACATACTGAGACTTGATTTCTTCTTTATCAG
GTACAAGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCCGCTGAACATCAGGAGACATCAGTGGACTCGTGGATGGTAGGTTCA
GTTCACTCAATGGATCAAACCAATTCACATCAGATCTTTCAGATGGAAGTGAATGTGTTTTAGTCACAGAAGTGCCCTGATGCTCAG
TTTACACAAGCAGAGAAAACAAGCAGAGTAAGTTATGATGATGCTGATGAACGTGTCCTCATGTCTCATGTCTCTCACACAGATGCC
ATACAACAGACCGAAGCGTAGCTTTAAGTGTAAGTTCTGCTGCGGCTGCTGTAGAGCTGGTGTCTGTGGACTGTGCTGCAAATTCTG
AGGATTCCTGCTCCAACAAC
//
NRC219
AAGATGAAGACATTCGTGGTTGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCTGCCACCTTTCCTGAG
GTAAGCACCTGACTTCAGATAGCTTCATTTGCTTGTTATCCATGAATCTCTCATCAACATACTGAGACTTGATTCCTTCTTTATCAG
GTACAAGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCCGCTGAACATCAGGAGACATCAGTGGACTCGTGGATGGTAGGTTCA
GTTCACTCAATGGATCAAACCAATTCACATCAGATCTTTCAGATGGAAGTGACTGTGTTTTAGTCACAAAAGTGCCCTGATGCTCAG
TTTACACAAGCAGAGAAAACAAGCAGAGTAAGTTATGATGATGCTGATGAACGTCTCCTCATGTCTCATGTCTCTCACACAGATGCC
ATACAACAGACAGAAGCGTAGCTTTAAGTGTAAGTTCTGCTGCGGCTGCTGCAGAGCTGGTGTCTGTGGACTGTGCTGCAAATTCTG
AGGATTCCTGCTCCAACAAC
//
NRC220
AAGATGAAGACATCAGTGGTTGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCTGCCACCTTTCCTGAG
GTAAGCACCTGACTTCAGATAGCTTCATTTGCTTGTTATCCATGAATCTCTCATCAACATACTGAGACTTTATTCCTTCTTTATCAG
GTACAAGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCTGCTGCACATCAGGAGACATCAGTGGACTCGTGGATGGTGGGTTCA
GTTCACTCAATGGATCAAACCAATTCACATCAGATCTTTCAGATGAAGTGACTGTGTTTTAGTCACAAAAGTGCCCTGATGCTCAGT
TTACACAAGCAGAGAAAACAAGCAGAGTAAGTTATGATGATGCTGATGAACGTGTCCTCATGTCTCATGTCTCTCACACAGATGCCA
TACAACAGACATAAGCGTAGCTTTAAGTGTAAGTTCTGCTGCGGCTGCTGCAGAGCTGGTGTCTGTGGACTGTGCTGCAAATTCTGA
GGATTCCTGCT
//NRC221
AAGATAAGACATTCAGTGTTGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCTGCCACCTTTCCTGAGG
TAAGCACCTGACTTCAGATCGTTTCATTTGCTTGTTAGCCTTGAATCTCTCATCAACATACTGAGACTTGATTTCTTCTTTATCAGG
TACAAGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCTGCTGAACATCAGGAGACATCAGTGGACTTGTGGATGGTAGGTTCAG
TTCACTGAATGGATCAAACCAATTCACATCAGATCTTTCAGATGGAAGTGAATGTGTTTTAGTCACAAAAGTGCCCTGAAGCTCAGT
TTACACGAGCAGAGAAAACCAACACAGTAAGTTATGATGATGCTGATGAACGTCTCCTCATGTCTCATGTCTCTCACACAGATGCCA
TACAACAGACAGAAGCGTGGCTTTAAGTGTAAGTTCTGCTGCGGCTGCTGCAGCCCTGGTGTCTGTGGACTTTGCTGCAGATTCTGA
GGATTCCTGCTCCAACAAC
//
NRC222
AAGATGAAGACATTCAGTGTTGCAGTCGCAGTGGCCGTCGTGCTCATCTTTATTTGTATCCAGCAGAGCTCTGCCACCTTTCCTGAG
GTAAGCACCTGACTTCAGATAGTTTCATTTGCTTGTTATCCATGAATCTCTCATCAACATACTGAGACTTTATTCCTTCTTTATCAG
GTACAAGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCTGCTGAACATCAGGAGACATCATTGGACTCATGGATGGTAGGTTCA
GTTCACTCAATGGATCAAACCAATTCACATCAGATCTTTCAGATGGAAGTGACTGTGTTTTAGTCACAAAAGTGCCCTGATGCTCAG
TTTACACAAGCAGAGAAAACAAGCAGAGTAAGTTATGATGATGCTGATGAACGTGTCCTCATGTCTCATGTCTCTCACACAGATGCC
ATACAACAGACAGAAGCGTGGCTTTAAGTGTAAGTTCTGCTGCGGCTGCTGCAGAGCTGGTGTCTGTGGACTGTGCTGCAAATTCTG
AGGACCTGCCAGCA
//
NRC223
AAGATGAAGACATTCAGTGTTGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCTGCCACCTTTCCTGAG
GTAAGCACCTGACTTCAGATAGTTTCATTTGCTTGTTATCCATGAATCTCTCATCAACATACTGAGACTTTATTCCTTCTTTATCAG
GTACAAGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCTGCTGAACATCAGGAGACATCATTGGACTCATGGATGGTAGGTTCA
GTTCACTCAATGGATCAAACCAATTCACATCAGATCTTTCAGATGGAAGTGAATGTGTTTTAGTCACAAAAGTGCCCTGATGCTCAG
TTTACACAAGCAGAGAAAACAAGCAGAGTAAGTTATGATGATGCTGATGAACGTGTCCTCATGTCTCATGTCTCTCACACAGATGCC
ATACAACAGACATAAGCGTAGCTTTAAGTGTAAGTTCTGCTGCGGCTGCTGCAGAGCTGGTGTCTGTGGACTGTGCTGCAAATTCTG
AGGACCTGCCAGCA
//
NRC224
AGATGAAGACATTCAGTGTTGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCTGCCACCTTTCCTGAGG
TAAGCACCTGACTTCAGATAGTTTCATTTGCTTGTTATCCATGAATCTCTCATCAACATACTGAGACTTGATTTCTTCTTTATCAGG
TACAAGAGCTGGGGGAGGCAGTGAGCAATGACAATGCAGCCGCTGAACATCAGGAGACATCAGTGGACTCGTGGATGGTAGGTTCAG
TTCACTCAATGGATCAAACCAATTCACATCAGATCTTTCAGATGGAAGTGAATGTGTTTTAGTCACAAAAGTGCCCTGATGCTCAGT
TTACACAAGCAGAGAAAACAAGCAGAGTAAGTTATGATGATGCTGATGAACGTGTCCTCATGTCTCATGTCTCTCACACAGATGCCA
TACAACAGACCGAAGCGTAGCTTTAAGTGTAAGTTCTGCTGCGGCTGCTGCAGAGCTGGTGTCTGTGGACTGTGCTGCAAATTCTGA
GGACCTGCCAGCA
//
NRC225
AAGATGAAGACATTCAGTGTTGCAGTCACAGTGGCCGTCGTGCTCATCTTTATTTGTATCCAGCAGAGCTCTGCCACCTCTCCTGAG
GTACAAGGGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCTGCTGAACATCAGGAGACATCAGTGGACTCGTGGATGATGCCATAC
AACAGACAGAAGCGTGGCTTTAAGTGTAAGTTCTGCTGCGGCTGCTGCAGGCCTGGTGTCTGTGGACTTTGCTGCAGATCCTGAGGA
TTCCTGCTCCAACAAC
//
NRC226
AAGATGAAGACATTCAGTGTTGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCTGCCACCTTTCCTGAG
GTAAGCACCTGACTTCAGATCGTTTCATTTGCTTGTTAGCCTTGAATCTCTCATCAACATACTGAGACTTGATTTCTTCTTTATCAG
GTACAAGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCTGCTGAACATCAGGAGACATCAGTGGACTTGTGGATGGTAGGTTCA
GTTCACTGAATGGATCAAACCAATTCACATCAGATCTTTCAGATGGAAGTGAATGTGTTTTAGTCACAAAAGTGCCCTGAAGCTCAG
TTTACACGAGCAGAGAAAACCAACACAGTAAGTTATGATGATGCTGATGAACGTCTCCTCATGTCTCATGTCTCTCACACAGATGCC
ATACAACAGACAGAAGCGTGGCTTTAAGTGTAAGTTCTGCTGCGGCTGCTGCAGACCTGGTGTCTGTGGACTTTGCTGCAGATTCTG
AGGATTCCTGCTCCAACAAC
//
NRC227
AAGATGAAGACATTCAGTGTTGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCTGCCACCTTTCCTGAG
GTAAGCACCTGACTTCAGATCGTTTCATTTGCTTGTTAGCCTTGAATCTCTCATCAACATACTGAGACTTGATTTCTTCTTTATCAG
GTACAAGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCTGCTGAACATCAGGAGACATCAGTGGACTTGTGGATGGTAGGTTCA
GTTCACTGAATGGATCAAACCAATTCACATCAGATCTTTCAGATGGAAGTGAATGTGTTTTAGTCACAAAAGTGCCCTGAAGCTCAG
TTTACACGAGCAGAGAAAACCAACACAGTAAGTTATGATGATGCTGATGAACGTCTCCTCATGTCTCATGTCTCTCACACAGATGCC
ATACAACAGACAGAAGCGTGGCTTTAAGTGTAAGTTCTGCTGCGGCTGCTGCAGTCCTGGTGTCTGTGGACTTTGCTGCAGATTCTG
AGGATTCCTGCTCCAAC
//
NRC228
AAGATGAAGACATTCAGTGTTGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCTGCCACCTTTCCTGAG
GTAAGCACCTGACTTCAGATCGTTTCATTTGCTTGTTAGCCTTGAATCTCTCATCAACATACTGAGACTTGATTTCTTCTTTATCAG
GTACAAGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCTGCTGAACATCAGGAGACATCAGTGGACTCGTGGATGGTAGGTTCA
GTTCACTGAATGGATCAAACCAATTCACATCAGATCCTTCAGATGGAAGTGAATGTGTTTTAGTCACAAAAGTGCCCTGAAGCTCAG
TTTACACGAGCAGAGAAAACAAACACAGTAAGTTATGATGATGCTGATGAACGTCTCCTCATGTCTCATGTCTCTCACACAGATGCC
ATACAACAGACAGAAGCGTGGCTTTAAGTGTAAGTTCTGCTGCGGCTGCTGCAGTCCTGGTGTCTGTGGACTTTGCTGCAAATTCTG
AGGACCTGCCAGCA
//
NRC229
AAGATGAAGACATTCAGTGTTGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCTGCCACCTTTCCTGAG
GTAAGCACCTGACTTCAGATCGTTTCATTTGCTTGTTAGCCTTGAATCTCTCATCAACATACTGAGACTTGATTTCTTCTTTATCAG
GTACAAGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCTGCTGAACATCAGGAGACATCAGTGGACTCGTGGATGGTAGGTTCA
GTTCACTGAATGGATCAAACCAATTCACATCAGATCTTTCAGATGGAAGTGAATGTGTTTTAGTCACAAAAGTGCCCTGAAGCTCAG
TTTACACGAGCAGAGAAAACAAACACAGTAAGTTATGATGATGCTGATGAACGTCTCCTCATGTCTCATGTCTCTCACACAGATGCC
ATACAACAGACAGAAGCGTGGCTTTAAGTGTAAGTTCTGCTGCGGCTGCTGCAGACCTGGTGTCTGTGGACTTTGCTGCAAATTCTG
AGGACCTGCCAGCA
//
NRC230
AAGATGAAGACATTCAGTGTTGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCTGCCACCTTTCCTGAG
GTACAAGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCTGCTGAACATCAGGAGACATCAGTGGACTCGTGGATGATGCCATAC
AACAGACAGAAGCGTGGCTTTAAGTGTAAGTTCTGCTGCGGCTGCTGCAGACCTGGTGTCTGTGGACTTTGCTGCAAATTCTGAGGA
CCTGCCAGCA
//
NRC231
AAGATGAAGACATTCAGTGTTGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCTGCCACCTTTCCTGAG
GTACAAGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCTGCTGAACATCAGGAGACATCAGTGGACTCGTGGATGATGCCATAC
AACAGACAGAAGCGTGGCTTTAAGTGTAACTTCTGCTGCGGCTGCTGCAGGCCTGGTGTCTGTGGACTTTGCTGCAGATTCTGAGGA
TTCCTGCTCCAACAAC
//
NRC232
AAGATGAAGACATTCAGTGTTGCAGTCACAGTGGCCGTCGTGCTCGTCTTCATTTGTATCCAGCAGAGCTCTGCCACCTTTCCTGAG
GTAAGCACCTGACTTCAGATCGTTTCATTTGCTTGTTAGCCTTGAATCTCTCATCAACATACTGAGACTTGATTTCTTCTTTATCAG
GTACAAGAGCTGGAGGAGGCAGTGAGCAGTGACAATGCAGCTGCTGAACATCAGGAGACATCAGTGGACTCGTGGATGGTAGGTTCA
GTTCACTGAATGTGTTTTAGTCACAAAAGTGCCCTGAAGCTCAGTTTACACAAGCAGAGAAAACAAACAGAGTAAGTTATGATGATG
CTGATGAACGTCTCCTCATGTCTCATGTCTCTCACACAGATGCCATACAACAGACAGAAGCGTAGCTTTAAGTGCAAGTTCTGCTGC
GGCTGCTGCAGACGTGGTGTCTGTGGACTGTGCTGCAAATTCTGAGGATTCCTGCTCCAACAAC
//
NRC233
AAGATGAAGACTATCAGTGTTGCAGTCACAGTGGCCGTCGTGCTCCTCTTCATTTGTACCCAGCAGAGCTCTGCCACCTTTCCTGAG
GTAAGCACCTGACTTCAGATCGTTTCATTTGCTTGTTAGCCTTGAATCTCTCATCAACATACTGAGACTTGATTTCTTCTTTATCAG
GTACAAGAGCTGGAGGAGGCAGTGAGCAGTGACAATGCGGCTGCTGAACATCAGGAGACATCAGTGGACTCGTGGATGGTAGGTTCA
GTTCACTGAATGGATCAAACCAATTCACATCAGATCTTTCAGATGGAAGTGAATGTGTTTTAGTCACAAAAGTGCCCTGAAGCTCAG
TTTACACAAGCAGAGAAAACAAACACAGTAAGTTATGATGATGCTGATGAACGTCTCCTCATGTCTCATGTCTCATGTCTCTCACAC
AGATGCCATACAACAGACAGAAGCGTGGCTTTAAGTGCAAGTTCTGCTGCGGCTGCCGCTGTGGTGCTCTCTGTGGACTGTGCTGCA
AATTCTGAGGATTCCTGCTCCAACAAC
//
NRC234
AAGATGAAGACATTCAGTGTTGCAGTCACAGTGGCCGTCGTGCTCGTCTTCATTTGTATCCAGCAGAGCTCTGCCACCTTTCCTGAG
GTAAGCACCTGACTTCAGATCGTTTCATTTGCTTGTTAGCCTTGAATCTCTCATCAACGTACTGAGACTTGATTTCTTCTTTATCAG
GTACAAGAGCTGGAGGAGCCAGTGAGCAGTGACAATGCAGCTGCTGAACATCAGGAGACATCGGTGGACTCGTGGATGGTAGGTTCA
GTTCACTGAATGGATCAAACCAATTCACATCAGATCTTTCAGATGGAAGTGAATGTGTTTTAGTCACAAAAGTGCCCTGAAGCTCAG
TTTACACAAGCAGAGAAAACAAACACAGTAAGTTATGATGATGCTGATGAACGTCTCCTCATGTCTCATGTCTCATGTCTCTCACAC
AGATGCCATACAACAGACAGAAGCGTGGCTTTAAGTGCAAGTTCTGCTGCGGCTGCCGCTGTGGTGCTCTCTGTGGACTGTGCTGCA
AATTCTGAGGACCTGCCAGCA
//
NRC235
AAGATGAAGACATTCAGTGTTGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTTCCAGCAGAGCTCTGCCACCTTTCCTGAGG
TAAGCACCTGACTTCAGATCGTTTCATTTGCTTGTTAGCCTTGAATCTCTCATCAACATACTGAGACTTGATTTCTTCTTTATCAGG
TACAAGAGCTGGAGGAGGCAGTGAGCAGTGACAATGCAGCTGCTGAACATCAGGAGACATCAGTGGACTCGTGGATGGTAGGTTCAG
TTCCCTGAATGGATCAAACCAATTCACATCAGATCTTTCAGATGGAAGTGAATGTGTTTTAGTCACAAAAGTGCCCTGAAGCTCAGT
TTACACAAGCAGAGAAAACAAACACAGTAAGTTATGATGATGCTGATGAACATCTCCTCATGTCTCATGTCTCATGTCTCTCACACA
GATGCCATACAACAGACAGAAGCGTGGCTTTAAGTGCAAGTTCTGCTGCGGCTGCCGCTGTGGTGCTCTCTGTGGACTGTGCTGCAA
ATTCTGAGGACCTGCCAGCA
//
NRC236
ACGAGCTGACAGGAGCTGACAGGAGTCACCAGCAGACTCAAAGAACTAAACAACTTAACTCAGTCAAACTCTCAAAGATGAAGACAT
TCAGTGTTGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCTGCCACCTTTCCTGAGGTACAAGAGCTGG
AGGAGGCAGTGAGCAATGACAATGCAGCTGCTGAGCATCAGGAGACACCAGTGGACTCAGGGATGATGCCAAACAACAGACAGAAGC
GCAGCGCCGATTGTTGGCCATGTTGCAATCAAAATGGCTGTGGAACTTGCTGCAAGGTCTAAACAGACTCTTGGGCAGATCAATCCA
GGTTCGTCTTTCGTTGTCTCTCCGTGGAGTCGAACCAGAGACCTTCTCAGCCCATAGTCCAAGTTTCTGCCACTAGACCACCGCCTC
TCCCTCATCAAATACTCAATGTTTTTCATTTTGTCTTAAAGTTCATTGAACTATAAACATATTTCTGGTAGAGCATGTGATAGTTTA
ATGGTGTTACTCATTGGTTCATGGTATAGTCAGATGTTCAGAGATGTGATTATATCATCCACATATTTTCTCTGTTAAGGTGTACTG
TCAATAAATGTCAATGCTCCTTTGAAAAAAAAAAAAAAAAAAAAAC
//
NRC237
CGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCTGCCACCTTTCCTGAGGTGAGCTCCTGACTTCAGATCGTTTCATTTAGCTTGTT
ATCCATGAATCTCTCATCAACATACTGAGACTTGAATCCTTCTTTATCAGGTACAGGAGCTGGAGGAGGCAGTGAGCAATGACAATG
CAGCTGCTGAACATCAGGAGACATCAGTGGACTCATGGATGGTATGTTCAGTTCACTG ATGGATCAAACCAATTCACATCAGATCT
TTCAGATGGAAGTGAATTTGTTTTAGTCCCAAAAGTGCCCTGAAGCTCAGTTTACACA GCAGAGAAAAACAAAACACAGTAAGTTA
TGATGATGCTGATGAACGTCTCCTCATGTCTCATGTCTCTCACACAGATGCCATACAACAGACAGAAGCGCAGCGCCGAGTGTAGCT
TCTGCTGCAATGAATCTGGCTGTGGAATTTGCTGCAAATTCTGAGGATTCCTGCTCCAACAACAAGGGCGAATTC
//
NRC238
AAGATGAAGACATTCAGTGTTGCAGTCACAGTGGCCGTCGTGCTCGTCTTTATTTGTATCCAGCAGAGCTCTGCCACCTTTCCTGAG
GTGAGCTCCTGACTTCAGATCGTTTCATTTAGCTTGTTATCCATGAATCTCTCATCAACATACTGAGACTTGAATCCTTCTTTATCA
GGTACAGGAGCTGGAGGAGGCAGTGAGCAATGACAATGCAGCTGCTGAACATCAGGAGACATCAGTGGACTCATGGATGGTATGTTC
AGTTCACTGAATGGATCAAACCAATTCACATCAGATCTTTCAGATGGAAGTGAATTTGTTTTAGTCCCAAAAGTGCCCTGAAGCTCA
GTTTACACAAGCAGAGAAAAACAAAACACAGTAAGTTATGATGATGCTGATGAACGTCTCCTCATGTCTCATGTCTCTCACACAGAT
GCCATACAACAGACAGAAGCGCAGCGCCGAGTGTAGCTTCTGCTGCAATGAATCTGGCTGTGGAATTTGCTGCAAATTCTGAGGACC
TGCCAGCA
//
NRC239
GTGGAGGAGCCAGTGAGCAGTGAGAATGGAGCAAATGAACACACATAAGATCTTTCGGATGGAAGTGTATGTGTTTTAGTCACATGA
GTGGCTCGAAGCTCAGTACACACGAGCAGAGAGAACGAACACAGTGTGTTTTATTCTGCTTGTGTAAACTGAGCTTCAGTTTACACA
AGCAGAGAAAACAAACACAGTAAGTTATGATGATGCTGATGAACGTCTCCTCATGTCTCATATCTCTCACACAGATGCCAAACAACA
GACAGAAGCGTGGCTCTAATTGCAAACCATGCTGCAATCATAATGGCTGTGGAACGTGCTGCGAAGTCTGAGGATTCCTGCTCCACA
//
Claims (18)
1.一种鉴定编码抗菌肽的候选核酸序列的方法,所述方法包括:
a)鉴定感兴趣的起始肽;
b)鉴定编码所述起始肽的基因组DNA;
c)鉴定位于所述起始肽每一侧的侧翼序列;
d)获得与所述侧翼序列互补的引物;及
e)大范围筛选核酸序列来鉴定能够使用步骤d)的引物来扩增的候选序列。
2.如权利要求1所述的方法,其中所述的感兴趣的起始肽具有至少两个单位的正电荷并含有两性结构。
3.如权利要求1所述的方法,其中所述的感兴趣的起始肽为hepcidin、pleurocidin、pardaxin、misgurin、HFA-1、piscidin、moronecidin、parasin或鲶鱼组蛋白2A的裂解产物。
4.如权利要求1所述的方法,其中所述的感兴趣的起始肽为hepcidin或pleurocidin。
5.如权利要求1、2或3所述的方法,还包括预测所述候选序列编码的氨基酸序列以及选择核酸序列的步骤g),所述的核酸序列被预测为编码含有两性结构和净电荷的肽。
6.如权利要求5所述的方法,还包括获取对应所述候选核酸序列的肽及检测所述肽序列的抗菌活性的附加步骤。
7.如权利要求1所述的方法,还包括验证所述的感兴趣的起始肽具有抗菌活性的附加步骤(a’)。
8.能使用上述任一权利要求所述的方法鉴定的分离的核酸序列。
9.能由权利要求8所述的核酸序列编码的分离的多肽。
10.含有侧翼序列的分离的核酸序列。
11.一种试剂盒包括:
a.与第一侧翼序列具有至少95%同一性的第一核酸序列,其位于或接近编码抗菌肽的靶序列的5’末端;
b.与第二侧翼序列具有至少95%同一性的第二核酸序列,其位于或接近编码抗菌肽的靶序列的3’末端;及
c.实施如权利要求1所述的方法的说明书。
12.信号序列I、酸性序列I、信号肽II、信号肽III、信号肽IV、信号肽V、原序列I、原序列II、编码上述序列的核酸序列及基本与这些编码核酸序列互补的核酸序列中的至少一种在抗菌肽的鉴定和扩增中的用途。
13.与肽a、b、c或d中的一种至少有80%同源的分离的抗菌肽:
肽a GW(G/K)XXFXK
肽b GXXXXXXXHXGXXIH
肽c FKCKFCCGCCXXGVCGXCC
肽d CXXCCNCC(K/H)XKGCGFCCKF
肽e FKCKFCCGCRCGXXCGLCCKF
肽f XXXCXXCCNXXGCGXCCKX。
14.如权利要求13所述的抗菌肽,其与肽a、b、c或d中的一种至少有90%同源。
15.如权利要求13所述的抗菌肽,其为肽a、b、c或d中的一种。
16.如附件I或附件II中所示的分离的核酸序列。
17.如表4或表13中所示的分离的核酸序列。
18.一种鉴定编码抗菌肽的候选核酸序列的方法,所述方法包括:
a)鉴定编码感兴趣的起始肽的核酸序列;
b)鉴定编码所述起始肽的基因组DNA;
c)鉴定位于所述起始肽每一侧的侧翼序列;
d)获取与所述侧翼序列互补的引物;及
e)大范围筛选核酸序列来鉴定能够使用步骤d)的引物来扩增的候选序列。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US40492202P | 2002-08-22 | 2002-08-22 | |
US60/404,922 | 2002-08-22 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1678632A true CN1678632A (zh) | 2005-10-05 |
Family
ID=31946784
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA038199246A Pending CN1678632A (zh) | 2002-08-22 | 2003-08-22 | 一种从硬骨鱼中鉴定新的广谱抗菌肽的基因组途径 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20060093596A1 (zh) |
EP (1) | EP1534745A2 (zh) |
JP (1) | JP2005536209A (zh) |
CN (1) | CN1678632A (zh) |
AU (1) | AU2003260224A1 (zh) |
CA (1) | CA2495794A1 (zh) |
MX (1) | MXPA05001947A (zh) |
WO (1) | WO2004018706A2 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100352841C (zh) * | 2005-11-03 | 2007-12-05 | 中山大学 | 一种抗菌肽及其编码序列和用途 |
CN102382176A (zh) * | 2011-11-26 | 2012-03-21 | 倪龙兴 | 一种抗口腔致龋菌的多肽Pm11及制备方法 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100954881B1 (ko) | 2004-12-07 | 2010-04-27 | 대한민국 | 넙치 유래의 항균성 펩타이드 헵시딘 |
JP5475411B2 (ja) * | 2009-11-25 | 2014-04-16 | 御木本製薬株式会社 | 皮膚外用剤 |
CU24076B1 (es) * | 2011-09-30 | 2015-01-29 | Ct De Ingeniería Genética Y Biotecnología | Composición para el control de patógenos |
CA2896073C (en) * | 2012-12-20 | 2021-10-19 | Mount Desert Island Biological Laboratory | Stimulation and enhancement of regeneration of tissues |
WO2018217882A1 (en) * | 2017-05-23 | 2018-11-29 | EMULATE, Inc. | Advanced pulmonary models |
CN108611347A (zh) * | 2018-05-08 | 2018-10-02 | 四川省农业科学院水产研究所 | 一种中华沙鳅黑黄条纹皮肤rna的提取方法 |
CN108467426B (zh) * | 2018-05-28 | 2020-08-04 | 苏州大学 | 一种太湖白鱼宿主防御肽及其应用 |
CN109486888A (zh) * | 2018-11-15 | 2019-03-19 | 铜仁市万山区水产站 | 一种从泥鳅中提取多功能活性肽的方法 |
CN110003318B (zh) * | 2019-01-30 | 2020-10-30 | 自然资源部第三海洋研究所 | 褐鲳鲉抗菌肽moronecidin及其应用 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5288212A (en) * | 1990-12-12 | 1994-02-22 | Goldstar Co., Ltd. | Cylinder head of hermetic reciprocating compressor |
US5654276A (en) * | 1995-06-07 | 1997-08-05 | Affymax Technologies N.V. | Peptides and compounds that bind to the IL-5 receptor |
US6288212B1 (en) * | 1998-08-28 | 2001-09-11 | The University Of British Columbia | Anti-endotoxic, antimicrobial cationic peptides and methods of use therefor |
-
2003
- 2003-08-22 CN CNA038199246A patent/CN1678632A/zh active Pending
- 2003-08-22 WO PCT/CA2003/001323 patent/WO2004018706A2/en active Application Filing
- 2003-08-22 EP EP03792082A patent/EP1534745A2/en not_active Ceased
- 2003-08-22 MX MXPA05001947A patent/MXPA05001947A/es not_active Application Discontinuation
- 2003-08-22 US US10/525,126 patent/US20060093596A1/en not_active Abandoned
- 2003-08-22 CA CA002495794A patent/CA2495794A1/en not_active Abandoned
- 2003-08-22 AU AU2003260224A patent/AU2003260224A1/en not_active Abandoned
- 2003-08-22 JP JP2004529630A patent/JP2005536209A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100352841C (zh) * | 2005-11-03 | 2007-12-05 | 中山大学 | 一种抗菌肽及其编码序列和用途 |
CN102382176A (zh) * | 2011-11-26 | 2012-03-21 | 倪龙兴 | 一种抗口腔致龋菌的多肽Pm11及制备方法 |
CN102382176B (zh) * | 2011-11-26 | 2013-12-18 | 倪龙兴 | 一种抗口腔致龋菌的多肽Pm11及制备方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2005536209A (ja) | 2005-12-02 |
MXPA05001947A (es) | 2005-09-08 |
WO2004018706A3 (en) | 2004-08-26 |
AU2003260224A1 (en) | 2004-03-11 |
US20060093596A1 (en) | 2006-05-04 |
EP1534745A2 (en) | 2005-06-01 |
CA2495794A1 (en) | 2004-03-04 |
AU2003260224A2 (en) | 2004-03-11 |
WO2004018706A2 (en) | 2004-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1310942C (zh) | 校正基因 | |
CN1197966C (zh) | 肿瘤坏死因子受体相关因子的调节剂、及其制备和用途 | |
CN1817901A (zh) | 治疗性肽和方法 | |
CN1871351A (zh) | 一种新的真菌蛋白及其编码核酸 | |
CN1167795C (zh) | 肽、dna及抗体 | |
CN1044820A (zh) | 胰岛素类似物 | |
CN1678632A (zh) | 一种从硬骨鱼中鉴定新的广谱抗菌肽的基因组途径 | |
CN1194090C (zh) | 一种新的生长因子和编码这种生长因子的基因序列 | |
Zhou et al. | Alternative complement pathway of channel catfish (Ictalurus punctatus): molecular characterization, mapping and expression analysis of factors Bf/C2 and Df | |
WO2004035535A2 (en) | Erythrocyte differentiation factor, gene encoding same, and methods of use thereof | |
CN1283793C (zh) | 具有骨骼肌刺激活性和免疫调节作用的趋化素样因子超家族 | |
Chen et al. | Molecular characterization and immune response expression of the QM gene from the scallop Chlamys farreri | |
Sellars et al. | A PL10 vasa-like gene in the kuruma shrimp, Marsupenaeus japonicus, expressed during development and in adult gonad | |
Wen et al. | Molecular cloning, characterization and expression analysis of QM gene from grass carp (Ctenopharyngodon idellus) homologous to Wilms' tumor suppressor | |
CN1390256A (zh) | 新型蛋白质及其dna | |
CN1249087C (zh) | 新的人g蛋白偶联受体 | |
CN1209843A (zh) | 新的鉴定刺激stf-1在胰岛细胞内表达的化合物的方法 | |
CN1708589A (zh) | Cns中crh应答基因 | |
CN1596264A (zh) | 有关肥胖及2型糖尿病的差异表达基因 | |
CN1932016A (zh) | 影响sre活性的多核苷酸及其编码多肽和用途 | |
CN1246457C (zh) | 人tsc403基因和人ing1l基因 | |
CN1708511A (zh) | 对促肾上腺皮质激素释放激素刺激的应答而表达增加的基因 | |
Nowacka-Woszuk et al. | Differentiated evolutionary conservatism and lack of polymorphism of crucial sex determination genes (SRY and SOX9) in four species of the family Canidae | |
CN1494592A (zh) | 在肥胖型动物下丘脑或肌肉组织中表达的核酸 | |
CN1231497C (zh) | 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Open date: 20051005 |