CN118147129A - 人工合成单链鲨鱼抗体基因、其制备方法及应用 - Google Patents
人工合成单链鲨鱼抗体基因、其制备方法及应用 Download PDFInfo
- Publication number
- CN118147129A CN118147129A CN202410078441.7A CN202410078441A CN118147129A CN 118147129 A CN118147129 A CN 118147129A CN 202410078441 A CN202410078441 A CN 202410078441A CN 118147129 A CN118147129 A CN 118147129A
- Authority
- CN
- China
- Prior art keywords
- shark
- ignar
- gene
- vnar
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 203
- 241000251730 Chondrichthyes Species 0.000 title claims abstract description 123
- 101100421450 Drosophila melanogaster Shark gene Proteins 0.000 title claims abstract description 103
- 238000002360 preparation method Methods 0.000 title claims description 14
- 108010076504 Protein Sorting Signals Proteins 0.000 claims abstract description 69
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 44
- 108700026244 Open Reading Frames Proteins 0.000 claims abstract description 21
- 239000003795 chemical substances by application Substances 0.000 claims abstract description 15
- 238000000034 method Methods 0.000 claims abstract description 15
- 238000012070 whole genome sequencing analysis Methods 0.000 claims abstract description 11
- 241000123599 Hemiscylliidae Species 0.000 claims description 41
- 108091092195 Intron Proteins 0.000 claims description 20
- 229940125644 antibody drug Drugs 0.000 claims description 13
- 239000000427 antigen Substances 0.000 claims description 13
- 108091007433 antigens Proteins 0.000 claims description 13
- 102000036639 antigens Human genes 0.000 claims description 13
- 239000002773 nucleotide Substances 0.000 claims description 13
- 125000003729 nucleotide group Chemical group 0.000 claims description 13
- 241000251206 Scyliorhinus canicula Species 0.000 claims description 12
- 241000423688 Chiloscyllium indicum Species 0.000 claims description 9
- 241000415292 Orectolobus maculatus Species 0.000 claims description 7
- 238000011830 transgenic mouse model Methods 0.000 claims description 7
- 241001416183 Ginglymostomatidae Species 0.000 claims description 6
- 206010028980 Neoplasm Diseases 0.000 claims description 6
- 230000008685 targeting Effects 0.000 claims description 5
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 claims description 4
- 238000012827 research and development Methods 0.000 claims description 3
- 238000011282 treatment Methods 0.000 claims description 3
- 230000003612 virological effect Effects 0.000 claims description 3
- 208000035473 Communicable disease Diseases 0.000 claims description 2
- 241000251129 Galeocerdo Species 0.000 claims 1
- 108091028043 Nucleic acid sequence Proteins 0.000 abstract description 5
- 238000003766 bioinformatics method Methods 0.000 abstract description 4
- 230000015572 biosynthetic process Effects 0.000 abstract description 3
- 238000003786 synthesis reaction Methods 0.000 abstract description 3
- 235000018102 proteins Nutrition 0.000 description 38
- 241000251774 Squalus Species 0.000 description 22
- 241000251152 Ginglymostoma cirratum Species 0.000 description 15
- 241000251128 Galeocerdo cuvier Species 0.000 description 13
- 238000012163 sequencing technique Methods 0.000 description 7
- 108060003951 Immunoglobulin Proteins 0.000 description 6
- 102000018358 immunoglobulin Human genes 0.000 description 6
- 238000012268 genome sequencing Methods 0.000 description 5
- 230000003053 immunization Effects 0.000 description 5
- 108010083359 Antigen Receptors Proteins 0.000 description 4
- 102000006306 Antigen Receptors Human genes 0.000 description 4
- 241000415294 Orectolobidae Species 0.000 description 4
- 241000251135 Scyliorhinidae Species 0.000 description 4
- 238000002649 immunization Methods 0.000 description 4
- 229940072221 immunoglobulins Drugs 0.000 description 4
- 241000699666 Mus <mouse, genus> Species 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000000338 in vitro Methods 0.000 description 3
- 241001124533 Chlamydoselachus anguineus Species 0.000 description 2
- 108010047041 Complementarity Determining Regions Proteins 0.000 description 2
- 241000699660 Mus musculus Species 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 2
- 238000002823 phage display Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000000392 somatic effect Effects 0.000 description 2
- 230000014616 translation Effects 0.000 description 2
- 108700026220 vif Genes Proteins 0.000 description 2
- 206010069754 Acquired gene mutation Diseases 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 108091008875 B cell receptors Proteins 0.000 description 1
- 241001489536 Chiloscyllium plagiosum Species 0.000 description 1
- 241000976811 Chiloscyllium punctatum Species 0.000 description 1
- 241000251784 Heterodontus francisci Species 0.000 description 1
- 102000006496 Immunoglobulin Heavy Chains Human genes 0.000 description 1
- 108010019476 Immunoglobulin Heavy Chains Proteins 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 108091007491 NSP3 Papain-like protease domains Proteins 0.000 description 1
- 241000251138 Scyliorhinus Species 0.000 description 1
- 241000251778 Squalus acanthias Species 0.000 description 1
- 241001415779 Triakis scyllium Species 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000009509 drug development Methods 0.000 description 1
- 238000012215 gene cloning Methods 0.000 description 1
- 108091008053 gene clusters Proteins 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 239000000710 homodimer Substances 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 229940125645 monoclonal antibody drug Drugs 0.000 description 1
- PGNXLDQQCINNPZ-BURFUSLBSA-N n-methyl-n-[(2s,3r,4r,5r)-2,3,4,5,6-pentahydroxyhexyl]undecanamide Chemical compound CCCCCCCCCCC(=O)N(C)C[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO PGNXLDQQCINNPZ-BURFUSLBSA-N 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 230000037439 somatic mutation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 229940126585 therapeutic drug Drugs 0.000 description 1
- 125000000430 tryptophan group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C2=C([H])C([H])=C([H])C([H])=C12 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K67/00—Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
- A01K67/027—New or modified breeds of vertebrates
- A01K67/0275—Genetically modified vertebrates, e.g. transgenic
- A01K67/0278—Knock-in vertebrates, e.g. humanised vertebrates
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K49/00—Preparations for testing in vivo
- A61K49/0004—Screening or testing of compounds for diagnosis of disorders, assessment of conditions, e.g. renal clearance, gastric emptying, testing for diabetes, allergy, rheuma, pancreas functions
- A61K49/0008—Screening agents using (non-human) animal models or transgenic animal models or chimeric hosts, e.g. Alzheimer disease animal model, transgenic model for heart failure
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2227/00—Animals characterised by species
- A01K2227/10—Mammal
- A01K2227/105—Murine
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/01—Animal expressing industrially exogenous proteins
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- Zoology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Wood Science & Technology (AREA)
- Animal Behavior & Ethology (AREA)
- Veterinary Medicine (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Environmental Sciences (AREA)
- Urology & Nephrology (AREA)
- Gastroenterology & Hepatology (AREA)
- Biodiversity & Conservation Biology (AREA)
- Animal Husbandry (AREA)
- Public Health (AREA)
- Medicinal Chemistry (AREA)
- Epidemiology (AREA)
- Toxicology (AREA)
- Rheumatology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Pathology (AREA)
- Immunology (AREA)
- Plant Pathology (AREA)
- Endocrinology (AREA)
- Microbiology (AREA)
- Diabetes (AREA)
- Analytical Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
Abstract
本发明公开了人工合成单链鲨鱼抗体基因的制备方法,包含:下载鲨鱼类的IgNAR的核苷酸序列和蛋白质序列并分析;将所述IgNAR的核苷酸序列和蛋白质序列作为查询序列,得到鲨鱼类的IgNAR全基因组测序序列、IgNAR基因位点和IgNAR基因位点中VNAR基因的范围;依据内含子的GT‑AG规则和编码信号肽的leader外显子exon1以ATG起始,确定步骤三中的IgNAR基因中的编码信号肽的exon1‑intron和VNAR基因中外显子exon2的范围;根据确定的IgNAR基因中确定的leader外显子exon1、内含子intron和外显子exon2的范围,去掉内含子intron,连接编码信号肽的leader外显子exon1和VANR基因中外显子exon2,得到鲨鱼类基因组VNAR开放阅读框序列,从而得到人工合成单链鲨鱼抗体基因。本发明利用操作简便的生物信息分析方法,可通过人工合成得到单链鲨鱼抗体基因。
Description
技术领域
本发明涉及基因工程领域,具体涉及人工合成单链鲨鱼抗体基因、其制备方法及应用。
背景技术
免疫球蛋白(Immunoglobulins,Ig)或抗体被广泛应用于许多生物技术和治疗中。在高等脊椎动物中,免疫球蛋白如IgG通常被认为是由两条轻链和两条重链组成的蛋白四聚体。重链和轻链可变结构域结合形成抗原结合区域。依据免疫球蛋白重链恒定区,人类免疫球蛋白分为五类,分别为IgM、IgG、IgA、IgD和IgE。IgG约占健康人血清中免疫球蛋白的75%,抗体结合域分子量约为50KDa。然而传统抗体尺寸大,难以穿越肿瘤组织以及人体屏障,限制了抗体药物的应用范围。其次,传统抗体结构复杂、稳定性差,导致其作为免疫试剂时易失效,从而限制了相关抗体试剂的应用领域。
1993年天然缺失轻链的重链抗体(Heavy chain antibodies,HCAbs)首先在骆驼科动物中被发现,随后1995年在护士鲨(Ginglymostoma cirratum)中发现了类似的新的重链抗体,被称为免疫球蛋白新抗原受体(Immunoglobulin new antigen receptors,IgNAR)。IgNAR存在于软骨鱼类中,鲨鱼属于软骨鱼类。与经典的B细胞受体一样,IgNAR以分泌型和膜结合型的形式存在。IgNAR是由两条重链组成的同型二聚体,缺乏轻链,每条重链结构包括一个新抗原受体可变区(VNAR)和五个恒定区(C1-C5)结构域。四次重排事件(在1V,3D和1J胚系基因)产生一个完整的VNAR基因序列。VNAR是目前天然存在的最小的抗原结合域,分子量约为12KDa。与传统的IgG相比,VNAR的高可变区只有两个互补决定区(complementarity-determining regions,CDRs),即CDR1和较长的CDR3,并通过HV2和HV4两个高变区(hypervariable region,HV)连接CDR1与CDR3,而在CDR2的缺失位点和HV4的环中也表现出较高的体细胞突变率。根据CDR区和框架区中非典型半胱氨酸残基及保守色氨酸残基的位置和数量可以将VNAR划分为不同的亚型。VNAR分子量小,具有高水溶性和稳定性,能够结合隐匿在抗原内部的表位和具有较强的组织穿透性,因此在抗体药物研发中具有独特的优势。同时VNAR可以人源化从而降低抗体的免疫原性。尽管有这些优点,但VNAR并没有得到广泛的应用。
VNAR作为免疫试剂或治疗药物时也存在诸多不可回避的问题。首先鲨鱼类生物目前无法大规模人工养殖及免疫鲨鱼存在较大困难,其次鲨鱼免疫周期较长(4–6个月),因此很难利用传统的抗原免疫的方法进行IgNAR抗体的研发。尽管有研究利用“噬菌体展示技术”建立鲨鱼IgNAR抗体基因文库,用于靶向特定抗原的IgNAR抗体的研发,但该筛选主要依赖体外体系,缺乏体内所特有的“体细胞超突变”(Somatic hypermutation),因此难以获得高亲和力的IgNAR抗体。
虽然近年来针对鲨鱼IgNAR抗体的研究日益增多,NCBI数据库中也有部分鲨鱼的基因组测序序列,但由于并未对全部鲨鱼的全基因组进行测序,导致NCBI数据库中大部分的鲨鱼类基因组序列信息都是杂乱未知和不完整的。同时国际上缺乏对鲨鱼IgNAR抗体的统一标准,因此有关鲨鱼VNAR基因组序列的信息很少。
发明内容
本发明的目的是克服现有技术中缺乏鲨鱼VNAR基因组序列,从而无法制备单链鲨鱼抗体基因的缺陷。
为了达到上述目的,本发明提供了人工合成单链鲨鱼抗体基因的制备方法,包含以下步骤:
步骤一,在NCBI数据库中分别检索和下载鲨鱼类的IgNAR的核苷酸序列和蛋白质序列;
步骤二,使用软件SnapGene6.0.2分析步骤一中得到的所述IgNAR的核苷酸序列和蛋白质序列;
步骤三,分别使用blastn和tblastn,将步骤一中得到的所述IgNAR的核苷酸序列和蛋白质序列作为查询序列,得到鲨鱼类的IgNAR全基因组测序序列、IgNAR基因位点和IgNAR基因位点中VNAR基因的范围;
步骤四,依据内含子的GT-AG规则和编码信号肽的leader外显子exon1以ATG起始,确定步骤三中的IgNAR基因中的编码信号肽的exon1-intron和VNAR基因中外显子exon2的范围;
步骤五,根据步骤四中确定的IgNAR基因中确定的leader外显子exon1、内含子intron和外显子exon2的范围,去掉内含子intron,连接编码信号肽的leader外显子exon1和VANR基因中外显子exon2,得到鲨鱼类基因组VNAR开放阅读框序列,根据鲨鱼类基因组VNAR开放阅读框序列得到人工合成单链鲨鱼抗体基因。
可选地,所述鲨鱼类具体是指条纹斑竹鲨、点纹斑竹鲨、护士鲨、佛氏虎鲨、斑纹须鲨、小点猫鲨、白斑角鲨和皱唇鲨。
可选地,步骤二中,所述分析具体是指验证步骤一中得到的所述IgNAR的核苷酸序列和蛋白质序列是否正确。
可选地,步骤五之后还包含:将步骤五中得到的所述人工合成单链鲨鱼抗体基因的序列翻译成氨基酸序列,与既往已发布的鲨鱼类VNAR氨基酸序列进行比对,验证是否正确。
本发明还提供了人工合成单链鲨鱼抗体基因,所述人工合成单链鲨鱼抗体基因由上述所述的制备方法制备得到。
可选地,所述人工合成单链鲨鱼抗体基因至少包含13条鲨鱼类基因组VNAR开放阅读框序列。
可选地,所述13条鲨鱼类基因组VNAR开放阅读框序列分别为SEQ ID No:1、SEQ IDNo:2、SEQ ID No:3、SEQ ID No:4、SEQ ID No:5、SEQ ID No:6、SEQ ID No:7、SEQ ID No:8、SEQ ID No:9、SEQ ID No:10、SEQ ID No:11、SEQ ID No:12、SEQ ID No:13。
本发明还提供了人工合成单链鲨鱼抗体基因的应用,所述人工合成单链鲨鱼抗体基因用于制备能够产生鲨类IgNAR抗体的转基因小鼠模型。
可选地,所述能够产生鲨类IgNAR抗体的转基因小鼠模型用于进行靶向肿瘤抗原以及病毒抗原IgNAR抗体药物的研发,用于肿瘤及传染病的临床治疗。
相较于现有技术,本发明至少包含以下有益效果:
本发明利用操作简便的生物信息分析方法,搜集鲨鱼类IgNAR基因组序列信息,并得到13条鲨鱼类基因组VNAR开放阅读框序列,根据得到的13条鲨鱼类基因组VNAR开放阅读框序列,可以人工合成制备鲨类IgNAR抗体基因。根据制备的鲨类IgNAR抗体基因可以制备能够产生鲨类IgNAR抗体的转基因小鼠模型,从而应用于靶向肿瘤抗原以及病毒抗原IgNAR抗体药物的研发。
附图说明
图1为本发明的鲨鱼类VNAR序列的比对。
具体实施方式
以下结合附图和实施例对本发明的技术方案做进一步的说明。
目前鲨类IgNAR抗体药物制备主要有免疫库制备、天然库制备。免疫库制备是目前鲨类IgNAR抗体药物制备的主要方法,制备免疫库首先需要对鲨类进行免疫,产生高亲和力IgNAR抗体的免疫方案已有报道。不过与哺乳动物相比,鲨类的免疫周期通常较长。其次鲨鱼类生物目前无法大规模人工养殖以及免疫鲨鱼也存在较大困难。因此很难利用传统的抗原免疫的方法进行IgNAR抗体的研发。天然库制备是目前鲨类IgNAR抗体药物制备的另一种方法。该方法主要利用“噬菌体展示技术”建立鲨鱼IgNAR抗体基因文库,用于靶向特定抗原的IgNAR抗体的研发。但该筛选主要依赖体外体系,缺乏体内所特有的“体细胞超突变”(Somatic hypermutation),因此难以获得高亲和力的IgNAR抗体。相比传统IgG抗体药物,鲨类IgNAR抗体药物有诸多优势,但鲨类IgNAR抗体药物并没有得到广泛的应用,原因在于鲨类IgNAR抗体药物的制备存在上述诸多不可回避的问题。因此亟需开发新的鲨类IgNAR抗体药物研发平台。
实验小鼠是单抗药物研发的重要工具,其免疫应答与抗体基因克隆等方法学都非常成熟。近年来合成生物学领域发展迅速,跨物种基因操作技术应用案例日益增多,使得制备产生鲨类IgNAR抗体的转基因小鼠成为可能。IgNAR小鼠制备过程中涉及合成含有鲨类IgNAR抗体基因簇的基因元件。虽然已有多种鲨类基因组完成了全基因组测序,但目前对这些公布的鲨类全基因组测序序列信息的了解很少,并不清楚哪些序列含有IgNAR基因以及IgNAR基因分布范围。因此很难利用合成生物学人工合成制备单链鲨类抗体基因。若要制备产生鲨类IgNAR抗体的转基因小鼠,能否体外合成制备单链鲨类抗体基因是目前要解决的关键问题。基于现有缺乏鲨类IgNAR基因组序列,本发明意在提供一种操作简便的生信分析方法,搜集鲨鱼类IgNAR基因组序列信息,并提供搜集到的13条鲨鱼类基因组VNAR开放阅读框,以便人工合成制备单链鲨类抗体基因。
一、搜集已报道过IgNAR的鲨鱼类
通过既往已发布的文献收集免疫球蛋白新抗原受体(IgNAR)在哪些鲨鱼类中报道过,最终发现报道过IgNAR的鲨鱼类包括条纹斑竹鲨(Chiloscyllium plagiosum)、点纹斑竹鲨(Chiloscyllium punctatum)、护士鲨(Ginglymostoma cirratum)、佛氏虎鲨(Heterodontus francisci)、斑纹须鲨(Orectolobus maculatus)、小点猫鲨(Scyliorhinus canicular)、白斑角鲨(Squalus acanthias)和皱唇鲨(Triakisscyllium)。故以下均以上述种类的鲨鱼类展开研究。
二、下载鲨鱼类IgNAR核苷酸序列和蛋白质序列,并对蛋白质进行分析
通过在NCBI数据库中分别检索和下载条纹斑竹鲨、点纹斑竹鲨、护士鲨、佛氏虎鲨、斑纹须鲨、小点猫鲨、白斑角鲨和皱唇鲨的IgNAR核苷酸序列和蛋白质序列,并在SnapGene6.0.2中对蛋白质序列进行分析,验证下载序列是否正确。
2.1条纹斑竹鲨
下载条纹斑竹鲨序列3条,GenBank分别为OQ065566.2、OQ065565.2和OQ065564.2。根据提供的对应protein_id下载蛋白质序列,并在SnapGene6.0.2中对蛋白质序列进行分析,验证下载序列是否正确。比对结果显示,新抗原受体可变区(Variabledomain of thenew antigen receptor,VNAR)包含四个高度可变环,CDR1、CDR3、HV2和HV4,以及框架区域。
2.2点纹斑竹鲨
下载点纹斑竹鲨序列8条,GenBank分别为MT701729.1、MT701728.1、MT701727.1、MT701726.1、MT701725.1、MT701724.1、MT701723.1和MT701722.1。根据提供的对应protein_id下载蛋白质序列,并在SnapGene6.0.2中对蛋白质序列进行分析,验证下载序列是否正确。比对结果显示,VNAR包含四个高度可变环,CDR1、CDR3、HV2和HV4,以及框架区域。
2.3护士鲨
通过搜索发现NCBI数据库中大部分上传的IgNAR核苷酸序列来自护士鲨,故下载部分护士鲨序列44条,GenBank分别为AY114792.1、AY114981.1、AY114795.1、AY115004.1、AY114994.1、AY114798.1、AY114802.1、AY114805.1、AY114793.1、AF447103.1、AY114984.1、AF447114.1、AY114784.1、AY114777.1、AY114775.1、AY114765.1、AY115016.1、AY115010.1、AY114993.1、U18720.1、AY114979.1、AY114982.1、AY114781.1、AY114986.1、AY114989.1、AY114996.1、AY115002.1、AY115009.1、AY115012.1、AY115006.1、AY115019.1、AY115017.1、AF447095.1、AF447117.1、AF447121.1、AF447098.1、AF447101.1、AF447107.1、AF447108.1、AF447110.1、AF447118.1、AF447124.1、AY115013.1和AF447116.1。根据提供的对应protein_id下载蛋白质序列,并在SnapGene6.0.2中对蛋白质序列进行分析,验证下载序列是否正确。比对结果显示,VNAR包含四个高度可变环,CDR1、CDR3、HV2和HV4,以及框架区域。
2.4佛氏虎鲨
下载佛氏虎鲨序列11条,GenBank分别为ON714496.1、AY925144.1、AY925146.1、AY925145.1、AY925143.1、AY925142.1、AY925141.1、AY925140.1、AY925139.1、AY925138.1和AY925137.1。根据提供的对应protein_id下载蛋白质序列,并在SnapGene6.0.2中对蛋白质序列进行分析,验证下载序列是否正确。比对结果显示,VNAR包含四个高度可变环,CDR1、CDR3、HV2和HV4,以及框架区域。
2.5斑纹须鲨
下载斑纹须鲨序列18条,GenBank分别为AY069988.1、AF466396.1、AF466395.1、EU213061.1、EU213060.1、DQ269923.1、DQ269922.1、DQ268538.1、AY261682.1、AY261681.1、AF336093.1、AF336092.1、AF336091.1、AF336090.1、AF336089.1、AF336088.1、AF336094.1和AF336087.1。根据提供的对应protein_id下载蛋白质序列,并在SnapGene6.0.2中对蛋白质序列进行分析,验证下载序列是否正确。比对结果显示,VNAR包含四个高度可变环,CDR1、CDR3、HV2和HV4,以及框架区域。
2.6小点猫鲨
下载小点猫鲨序列20条,GenBank分别为JX556091.1、JX556090.1、JX556011.1、JX556010.1、JX556009.1、JX556008.1、JX556007.1、JX556006.1、JX556005.1、JX556022.1、JX556021.1、JX556020.1、JX556019.1、JX556018.1、JX556017.1、JX556016.1、JX556015.1、JX556014.1、JX556013.1和JX556012.1。根据提供的对应protein_id下载蛋白质序列,并在SnapGene6.0.2中对蛋白质序列进行分析,验证下载序列是否正确。比对结果显示,VNAR包含四个高度可变环,CDR1、CDR3、HV2和HV4,以及框架区域。
2.7白斑角鲨
下载白斑角鲨序列7条,GenBank分别为JN419085.1、JN419084.1、JN419082.1、JN419081.1、JN419080.1、JN419055.1和JN419054.1。根据提供的对应protein_id下载蛋白质序列,并在SnapGene6.0.2中对蛋白质序列进行分析,验证下载序列是否正确。比对结果显示,VNAR包含四个高度可变环,CDR1、CDR3、HV2和HV4,以及框架区域。
2.8皱唇鲨
下载皱唇鲨序列4条,GenBank分别为AB557743.1、AB557742.1、AB557741.1和AB557740.1。根据提供的对应protein_id下载蛋白质序列,并在SnapGene6.0.2中对蛋白质序列进行分析,验证下载序列是否正确。比对结果显示,VNAR包含四个高度可变环,CDR1、CDR3、HV2和HV4,以及框架区域。
三、分别使用blastn和tblastn,将步骤一中得到的所述IgNAR的核苷酸序列和蛋白质序列作为查询序列,得到鲨鱼类的IgNAR全基因组测序序列、IgNAR基因位点和IgNAR基因位点中VNAR基因的范围
分别使用blastn和tblastn,以条纹斑竹鲨、点纹斑竹鲨、护士鲨、佛氏虎鲨、斑纹须鲨、小点猫鲨、白斑角鲨和皱唇鲨的IgNAR核苷酸序列和蛋白质序列作为查询序列得到条纹斑竹鲨、点纹斑竹鲨、护士鲨、佛氏虎鲨、斑纹须鲨、小点猫鲨、白斑角鲨和皱唇鲨的IgNAR全基因组测序序列、IgNAR基因位点和IgNAR基因位点中VNAR基因的范围。依据内含子的GT-AG规则和编码信号肽的leader外显子exon1以ATG起始,确定条纹斑竹鲨、点纹斑竹鲨、护士鲨、佛氏虎鲨、斑纹须鲨、小点猫鲨、白斑角鲨和皱唇鲨的IgNAR基因中的编码信号肽的exon1-intron和VNAR基因中外显子exon2的范围。
3.1条纹斑竹鲨
3.1.1使用blastn,以条纹斑竹鲨的IgNAR OQ065566.2、OQ065565.2和OQ065564.2作为查询序列,得到GenBank为QPFF01000039.1的条纹斑竹鲨IgNAR基因组测序序列。本研究使用tblastn,以条纹斑竹鲨的IgNAR OQ065566.2、OQ065565.2和OQ065564.2对应的蛋白质序列作为查询序列,得到GenBank为QPFF01000039.1的条纹斑竹鲨IgNAR基因组测序序列。BLAST结果显示,在条纹斑竹鲨QPFF01000039.1序列上有4个IgNAR基因位点,命名为IgNAR1、IgNAR2、IgNAR3和IgNAR4,其中VNAR基因的范围在562,704-562,952、687,141-687,389、980,295-980,543和1,218,474-1,218,743bp附近。
3.1.2依据内含子的GT-AG规则和编码信号肽的leader外显子exon1以ATG起始,确定QPFF01000039.1序列上4个IgNAR基因位点中编码信号肽的exon1-intron和VNAR基因中外显子exon2的范围。其中,IgNAR1中编码信号肽的exon1范围为562,518-562,560bp,intron范围为562,561-562,686bp,VNAR基因中exon2范围为562,687-562,958bp;IgNAR2中编码信号肽的exon1范围为686,954-686,996bp,intron范围为686,997-687,123bp,VNAR基因中exon2范围为687,124-687,395bp;IgNAR3中编码信号肽的exon1范围为980,108-980,150bp,intron范围为980,151-980,277bp,VNAR基因中exon2范围为980,278-980,549bp;IgNAR4中编码信号肽的exon1范围为1,218,929-1,218,887bp,intron范围为1,218,886-1,218,761bp,VNAR基因中exon2范围为1,218,760-1,218,489bp。
3.2点纹斑竹鲨
3.2.1使用blastn,以点纹斑竹鲨的IgNAR MT701729.1、MT701728.1、MT701727.1、MT701726.1、MT701725.1、MT701724.1、MT701723.1和MT701722.1作为查询序列,得到GenBank为BEZZ01233195.1、BEZZ01002545.1和BEZZ01157637.1的点纹斑竹鲨IgNAR基因组测序序列。本研究使用tblastn,以点纹斑竹鲨的IgNAR MT701729.1、MT701728.1、MT701727.1、MT701726.1、MT701725.1、MT701724.1、MT701723.1和MT701722.1对应的蛋白质序列作为查询序列,得到GenBank为BEZZ01233195.1、BEZZ01002545.1、BEZZ01002046.1和BEZZ01157637.1的点纹斑竹鲨IgNAR基因组测序序列。BLAST结果显示,在点纹斑竹鲨BEZZ01002046.1序列上有1个IgNAR基因位点,命名为IgNAR1,其中VNAR基因的范围在58,244-58,501bp附近。BLAST结果显示,在点纹斑竹鲨BEZZ01002545.1序列上有1个IgNAR基因位点,命名为IgNAR1,其中VNAR基因的范围在108,875-109,127bp附近。BLAST结果显示,在点纹斑竹鲨BEZZ01233195.1序列上有1个IgNAR基因位点,命名为IgNAR1,其中VNAR基因的范围在63-321bp附近。BLAST结果显示,在点纹斑竹鲨BEZZ01157637.1序列上有1个IgNAR基因位点,命名为IgNAR1,其中VNAR基因的范围在194-1bp附近。
3.2.2依据内含子的GT-AG规则和编码信号肽的leader外显子exon1以ATG起始,确定BEZZ01002046.1序列上1个IgNAR基因位点中编码信号肽的exon1-intron和VNAR基因中外显子exon2的范围。其中,IgNAR1中编码信号肽的exon1范围为58,687-58,645bp,intron范围为58,644-58,519bp,VNAR基因中exon2范围为58,518-58,247bp。
3.2.3依据内含子的GT-AG规则和编码信号肽的leader外显子exon1以ATG起始,确定BEZZ01002545.1序列上1个IgNAR基因位点中编码信号肽的exon1-intron和VNAR基因中外显子exon2的范围。其中,IgNAR1中编码信号肽的exon1的范围为108,694-108,736bp,intron范围为108,737-108,863bp,VNAR基因中exon2范围为108,864-109,135bp。
3.2.4依据内含子的GT-AG规则和编码信号肽的leader外显子exon1以ATG起始,确定BEZZ01233195.1序列上1个IgNAR基因位点中编码信号肽的exon1-intron和VNAR基因中外显子exon2的范围。因为BEZZ01233195.1序列全长只有591bp,只能确定IgNAR1中部分intron范围和VNAR基因中exon2范围,无法确定编码信号肽的exon1范围。其中,IgNAR1中部分intron范围为1-51bp,VNAR基因中exon2范围为52-323bp。在SnapGene6.0.2中对BEZZ01233195.1序列上IgNAR1中部分intron、QPFF01000039.1序列上IgNAR1、IgNAR2、IgNAR3和IgNAR4中intron、BEZZ01002046.1序列上IgNAR1中intron和BEZZ01002545.1序列上IgNAR1中intron进行分析,比对结果显示BEZZ01233195.1序列上IgNAR1中部分intron和其他序列上IgNAR基因位点中intron高度相似,表明BEZZ01233195.1序列上IgNAR1中部分intron正确性。我们使用blastn,以点纹斑竹鲨的BEZZ01233195.1作为查询序列,得到GenBank为BEZZ01002545.1的点纹斑竹鲨IgNAR基因组测序序列,其percent identity值为94.75%。因此,使用BEZZ01002545.1序列上IgNAR1中编码信号肽的exon1代替BEZZ01233195.1序列上IgNAR1中缺失的编码信号肽的exon1。
3.2.5依据内含子的GT-AG规则和编码信号肽的leader外显子exon1以ATG起始,确定BEZZ01157637.1序列上1个IgNAR基因位点中编码信号肽的exon1-intron和VNAR基因中外显子exon2的范围。因为BEZZ01157637.1序列全长只有866bp,只能确定IgNAR1中编码信号肽的exon1-intron范围和部分exon2范围。其中,IgNAR1中编码信号肽的exon1范围为378-336bp,intron范围为335-210bp,VNAR基因中部分exon2范围为209-1bp。因为QPFF01000039.1序列上IgNAR1、IgNAR2、IgNAR3和IgNAR4中VNAR基因的exon2、BEZZ01002046.1序列上IgNAR1中VNAR基因的exon2、BEZZ01002545.1序列上IgNAR1中VNAR基因的exon2和BEZZ01233195.1序列上IgNAR1中VNAR基因的exon2长度为272bp,BEZZ01157637.1序列上IgNAR1中VNAR基因的部分exon2长度为209bp,相差63bp,因此,我们舍弃BEZZ01157637.1这条序列。
3.3护士鲨
3.3.1使用blastn,以护士鲨的IgNAR AY114792.1、AY114981.1、AY114795.1、AY115004.1、AY114994.1、AY114798.1、AY114802.1、AY114805.1、AY114793.1、AF447103.1、AY114984.1、AF447114.1、AY114784.1、AY114777.1、AY114775.1、AY114765.1、AY115016.1、AY115010.1、AY114993.1、U18720.1、AY114979.1、AY114982.1、AY114781.1、AY114986.1、AY114989.1、AY114996.1、AY115002.1、AY115009.1、AY115012.1、AY115006.1、AY115019.1、AY115017.1、AF447095.1、AF447117.1、AF447121.1、AF447098.1、AF447101.1、AF447107.1、AF447108.1、AF447110.1、AF447118.1、AF447124.1、AY115013.1和AF447116.1作为查询序列,得到GenBank为JAHRHZ010000107.1的护士鲨IgNAR基因组测序序列。本研究使用tblastn,以护士鲨的IgNAR AY114792.1、AY114981.1、AY114795.1、AY115004.1、AY114994.1、AY114798.1、AY114802.1、AY114805.1、AY114793.1、AF447103.1、AY114984.1、AF447114.1、AY114784.1、AY114777.1、AY114775.1、AY114765.1、AY115016.1、AY115010.1、AY114993.1、U18720.1、AY114979.1、AY114982.1、AY114781.1、AY114986.1、AY114989.1、AY114996.1、AY115002.1、AY115009.1、AY115012.1、AY115006.1、AY115019.1、AY115017.1、AF447095.1、AF447117.1、AF447121.1、AF447098.1、AF447101.1、AF447107.1、AF447108.1、AF447110.1、AF447118.1、AF447124.1、AY115013.1和AF447116.1对应的蛋白质序列作为查询序列,得到GenBank为JAHRHZ010000107.1的护士鲨IgNAR基因组测序序列。BLAST结果显示,在护士鲨JAHRHZ010000107.1序列上有2个IgNAR基因位点,命名为IgNAR1和IgNAR2,其中VNAR基因的范围在60,233-60,505和163,173-163,445bp附近。
3.3.2依据内含子的GT-AG规则和编码信号肽的leader外显子exon1以ATG起始,确定JAHRHZ010000107.1序列上2个IgNAR基因位点中编码信号肽的exon1-intron和VNAR基因中外显子exon2的范围。其中,IgNAR1中编码信号肽的exon1范围为60,060-60,102bp,intron范围为60,103-60,236bp,VNAR基因中exon2范围为60,237-60,508bp;IgNAR2中编码信号肽的exon1范围为163,000-163,042bp,intron范围为163,043-163,176bp,VNAR基因中exon2范围为163,177-163,448bp。
3.4佛氏虎鲨
3.4.1使用blastn,以佛氏虎鲨的IgNAR ON714496.1、AY925144.1、AY925146.1、AY925145.1、AY925143.1、AY925142.1、AY925141.1、AY925140.1、AY925139.1、AY925138.1和AY925137.1作为查询序列,发现佛氏虎鲨没有全基因组测序序列。本研究使用tblastn,以佛氏虎鲨的IgNAR ON714496.1、AY925144.1、AY925146.1、AY925145.1、AY925143.1、AY925142.1、AY925141.1、AY925140.1、AY925139.1、AY925138.1和AY925137.1对应的蛋白质序列作为查询序列,发现佛氏虎鲨没有全基因组测序序列。
3.5斑纹须鲨
3.5.1使用blastn,以斑纹须鲨的IgNAR AY069988.1、AF466396.1、AF466395.1、EU213061.1、EU213060.1、DQ269923.1、DQ269922.1、DQ268538.1、AY261682.1、AY261681.1、AF336093.1、AF336092.1、AF336091.1、AF336090.1、AF336089.1、AF336088.1、AF336094.1和AF336087.1作为查询序列,发现斑纹须鲨没有全基因组测序序列。本研究使用tblastn,以斑纹须鲨的IgNAR AY069988.1、AF466396.1、AF466395.1、EU213061.1、EU213060.1、DQ269923.1、DQ269922.1、DQ268538.1、AY261682.1、AY261681.1、AF336093.1、AF336092.1、AF336091.1、AF336090.1、AF336089.1、AF336088.1、AF336094.1和AF336087.1对应的蛋白质序列作为查询序列,发现斑纹须鲨没有全基因组测序序列。
3.6小点猫鲨
3.6.1使用blastn,以小点猫鲨的IgNAR JX556091.1、JX556090.1、JX556011.1、JX556010.1、JX556009.1、JX556008.1、JX556007.1、JX556006.1、JX556005.1、JX556022.1、JX556021.1、JX556020.1、JX556019.1、JX556018.1、JX556017.1、JX556016.1、JX556015.1、JX556014.1、JX556013.1和JX556012.1作为查询序列,得到GenBank为CACTIS020001552.1的小点猫鲨IgNAR基因组测序序列。本研究使用tblastn,以小点猫鲨的IgNAR JX556091.1、JX556090.1、JX556011.1、JX556010.1、JX556009.1、JX556008.1、JX556007.1、JX556006.1、JX556005.1、JX556022.1、JX556021.1、JX556020.1、JX556019.1、JX556018.1、JX556017.1、JX556016.1、JX556015.1、JX556014.1、JX556013.1和JX556012.1对应的蛋白质序列作为查询序列,得到GenBank为CACTIS020001552.1的小点猫鲨IgNAR基因组测序序列。BLAST结果显示,在小点猫鲨CACTIS020001552.1序列上有1个IgNAR基因位点,命名为IgNAR1,其中VNAR基因的范围在180,558-182,165bp附近。
3.6.2依据内含子的GT-AG规则和编码信号肽的leader外显子exon1以ATG起始,确定CACTIS020001552.1序列上1个IgNAR基因位点中编码信号肽的exon1-intron和VNAR基因中外显子exon2的范围。其中,IgNAR1中编码信号肽的exon1范围为180,359-180,401bp,intron范围为180,402-180,546bp,VNAR基因中exon2范围为180,547-180,818bp。
3.7白斑角鲨
3.7.1使用blastn,以白斑角鲨的IgNAR JN419085.1、JN419084.1、JN419082.1、JN419081.1、JN419080.1、JN419055.1和JN419054.1作为查询序列,得到GenBank为JASTWF010000230.1、JASTWF010000028.1、JASTWF010000033.1和JASTWF010000235.1的白斑角鲨IgNAR基因组测序序列。本研究使用tblastn,以白斑角鲨的IgNAR JN419085.1、JN419084.1、JN419082.1、JN419081.1、JN419080.1、JN419055.1和JN419054.1对应的蛋白质序列作为查询序列,得到GenBank为JASTWF010000230.1、JASTWF010000028.1、JASTWF010000033.1和JASTWF010000235.1的白斑角鲨IgNAR基因组测序序列。BLAST结果显示,在白斑角鲨JASTWF010000230.1序列上有1个IgNAR基因位点,命名为IgNAR1,但是其中缺乏VNAR基因。BLAST结果显示,在白斑角鲨JASTWF010000028.1序列上有1个IgNAR基因位点,命名为IgNAR1,其中VNAR基因的范围在16,711,761-16,711,805和16,711,808-16,711,984bp附近。我们通过分析发现,白斑角鲨JASTWF010000028.1序列在16,711,805-16,711,806bp之间缺少一个碱基G,因此我们在此处人为添加一个碱基G,显示蛋白翻译正确。BLAST结果显示,在白斑角鲨JASTWF010000033.1序列上有1个IgNAR基因位点,命名为IgNAR1,其中VNAR基因的范围在254,259-254,471bp附近。BLAST结果显示,在白斑角鲨JASTWF010000235.1序列上有1个IgNAR基因位点,命名为IgNAR1,其中VNAR基因的范围在361,414-361,656bp附近。
3.7.2依据内含子的GT-AG规则和编码信号肽的leader外显子exon1以ATG起始,确定JASTWF010000028.1序列上1个IgNAR基因位点中编码信号肽的exon1-intron和VNAR基因中外显子exon2的范围。其中,IgNAR1中编码信号肽的exon1范围为16,711,525-16,711,567bp,intron范围为16,711,568-16,711,707bp,VNAR基因中exon2范围为16,711,708-16,711,979bp。
3.7.3依据内含子的GT-AG规则和编码信号肽的leader外显子exon1以ATG起始,确定JASTWF010000033.1序列上1个IgNAR基因位点中编码信号肽的exon1-intron和VNAR基因中外显子exon2的范围。其中,IgNAR1中编码信号肽的范围为254,023-254,065bp,intron范围为254,066-254,205bp,VNAR基因中exon2范围为254,206-254,477bp。
3.7.4依据内含子的GT-AG规则和编码信号肽的leader外显子exon1以ATG起始,确定JASTWF010000235.1序列上1个IgNAR基因位点中编码信号肽的exon1-intron和VNAR基因中外显子exon2的范围。其中,IgNAR1中编码信号肽的exon1范围为361,177-361,219bp,intron范围为361,220-361,360bp,VNAR基因中exon2范围为361,361-361,632bp。
3.8皱唇鲨
3.8.1使用blastn,以皱唇鲨的IgNAR AB557743.1、AB557742.1、AB557741.1和AB557740.1作为查询序列,发现皱唇鲨没有全基因组测序序列。本研究使用tblastn,以皱唇鲨的IgNAR AB557743.1、AB557742.1、AB557741.1和AB557740.1对应的蛋白质序列作为查询序列,发现皱唇鲨没有全基因组测序序列。
综上,一共得到13条鲨鱼类VNAR基因组序列,分别在条纹斑竹鲨QPFF01000039.1序列上,点纹斑竹鲨BEZZ01002046.1、BEZZ01002545.1和BEZZ01233195.1序列上,护士鲨JAHRHZ010000107.1序列上,小点猫鲨CACTIS020001552.1序列上,白斑角鲨JASTWF010000028.1、JASTWF010000033.1和JASTWF010000235.1序列上。因为关于鲨鱼类VNAR基因组序列起始位点的研究较少,我们无法确定VNAR基因组序列确切的起始位点,因此我们在13条鲨鱼类基因组VNAR开放阅读框序列中保留了编码信号肽的序列,所述13条鲨鱼类基因组VNAR开放阅读框序列分别为SEQ ID No:1、SEQ ID No:2、SEQ ID No:3、SEQ IDNo:4、SEQ ID No:5、SEQ ID No:6、SEQ ID No:7、SEQ ID No:8、SEQ ID No:9、SEQ ID No:10、SEQ ID No:11、SEQ ID No:12、SEQ ID No:13,如表1所示。
表1鲨鱼类VNAR开放阅读框序列
其中,在条纹斑竹鲨QPFF01000039.1序列上有4个IgNAR基因位点,命名为IgNAR1、IgNAR2、IgNAR3和IgNAR4。IgNAR1中编码信号肽的exon1的范围为562,518-562,560bp,intron范围为562,561-562,686bp,VNAR基因中exon2范围为562,687-562,958bp;IgNAR2中编码信号肽的exon1的范围为686,954-686,996bp,intron范围为686,997-687,123bp,VNAR基因中exon2范围为687,124-687,395bp;IgNAR3中编码信号肽的exon1的范围为980,108-980,150bp,intron范围为980,151-980,277bp,VNAR基因中exon2范围为980,278-980,549bp;IgNAR4中编码信号肽的exon1的范围为1,218,929-1,218,887bp,intron范围为1,218,886-1,218,761bp,VNAR基因中exon2范围为1,218,760-1,218,489bp。
在点纹斑竹鲨BEZZ01002046.1序列上有1个IgNAR基因位点,命名为IgNAR1。IgNAR1中编码信号肽的exon1的范围为58,687-58,645bp,intron范围为58,644-58,519bp,VNAR基因中exon2范围为58,518-58,247bp。
在点纹斑竹鲨BEZZ01002545.1序列上有1个IgNAR基因位点,命名为IgNAR1。IgNAR1中编码信号肽的exon1的范围为108,694-108,736bp,intron范围为108,737-108,863bp,VNAR基因中exon2范围为108,864-109,135bp。
在点纹斑竹鲨BEZZ01233195.1序列上有1个IgNAR基因位点,命名为IgNAR1。IgNAR1中部分intron范围为1-51bp,VNAR基因中exon2范围为52-323bp。我们使用BEZZ01002545.1序列上IgNAR1中编码信号肽的exon1代替BEZZ01233195.1序列上IgNAR1中缺失的编码信号肽的exon1。
在护士鲨JAHRHZ010000107.1序列上有2个IgNAR基因位点,命名为IgNAR1和IgNAR2。IgNAR1中编码信号肽的exon1的范围为60,060-60,102bp,intron范围为60,103-60,236bp,VNAR基因中exon2范围为60,237-60,508bp;IgNAR2中编码信号肽的exon1的范围为163,000-163,042bp,intron范围为163,043-163,176bp,VNAR基因中exon2范围为163,177-163,448bp。
在小点猫鲨CACTIS020001552.1序列上有1个IgNAR基因位点,命名为IgNAR1。IgNAR1中编码信号肽的exon1的范围为180,359-180,401bp,intron范围为180,402-180,546bp,VNAR基因中exon2范围为180,547-180,818bp。
在白斑角鲨JASTWF010000028.1序列上有1个IgNAR基因位点,命名为IgNAR1。我们通过分析发现,白斑角鲨JASTWF010000028.1序列在16,711,805-16,711,806bp之间缺少一个碱基G,因此我们在此处人为添加一个碱基G,显示蛋白翻译正确。IgNAR1中编码信号肽的exon1的范围为16,711,525-16,711,567bp,intron范围为16,711,568-16,711,707bp,VNAR基因中exon2范围为16,711,708-16,711,979bp。
在白斑角鲨JASTWF010000033.1序列上有1个IgNAR基因位点,命名为IgNAR1。IgNAR1中编码信号肽的exon1的范围为254,023-254,065bp,intron范围为254,066-254,205bp,VNAR基因中exon2范围为254,206-254,477bp。
在白斑角鲨JASTWF010000235.1序列上有1个IgNAR基因位点,命名为IgNAR1。IgNAR1中编码信号肽的exon1的范围为361,177-361,219bp,intron范围为361,220-361,360bp,VNAR基因中exon2范围为361,361-361,632bp。
最后,将筛选得到的13条鲨鱼类基因组去掉其中的内含子intron,将13条鲨鱼类基因组VNAR基因外显子exon2和对应的编码信号肽的外显子exon1连接起来,得到13条鲨鱼类基因组VNAR开放阅读框序列。并通过MEGA11和GeneDoc 2.7进行VNAR蛋白质序列比对。比对结果显示,VNAR包含高度可变环CDR1、HV2和HV4,以及框架区域FR1、FR2、FR3a和FR3b,且与既往发表的文献中的VNAR序列相似,如图1所示。
根据上述得到的13条鲨鱼类基因组VNAR开放阅读框序列,可用于构建人工合成单链鲨鱼抗体基因。单链鲨鱼抗体基因的结构由13个VNAR基因单元串联形成,其中每个VNAR基因单元的结构均由一个小鼠VH启动子、小鼠编码信号肽的外显子-内含子、鲨鱼类基因组VNAR开放阅读框和包含重组信号序列的小鼠下游序列组成。通过人工合成单链鲨鱼抗体基因的方法获得。
综上所述,本发明的人工合成单链鲨鱼抗体基因的制备方法包含以下步骤:步骤一,在NCBI数据库中分别检索和下载鲨鱼类的IgNAR的核苷酸序列和蛋白质序列;步骤二,使用软件SnapGene6.0.2分析步骤一中得到的所述IgNAR的核苷酸序列和蛋白质序列;步骤三,分别使用blastn和tblastn,将步骤一中得到的所述IgNAR的核苷酸序列和蛋白质序列作为查询序列,得到鲨鱼类的IgNAR全基因组测序序列、IgNAR基因位点和IgNAR基因位点中VNAR基因的范围;步骤四,依据内含子的GT-AG规则和编码信号肽的leader外显子exon1以ATG起始,确定步骤三中的IgNAR中的编码信号肽的exon1-intron和VNAR基因中外显子exon2的范围;步骤五,根据步骤四中确定的IgNAR中确定的编码信号肽的exon1-intron和VNAR基因中外显子exon2的范围,去掉内含子intron,连接编码信号肽的外显子exon1和VANR基因中外显子exon2,得到鲨鱼类基因组VNAR开放阅读框序列,根据所述鲨鱼类基因组VNAR开放阅读框序列得到人工合成单链鲨鱼抗体基因。本发明提供了一种操作简便的生物信息分析方法,通过搜集鲨鱼类IgNAR基因组序列信息,并提供13条鲨鱼类基因组VNAR开放阅读框,以便人工合成制备单链鲨鱼抗体基因。
尽管本发明的内容已经通过上述优选实施例作了详细介绍,但应当认识到上述的描述不应被认为是对本发明的限制。在本领域技术人员阅读了上述内容后,对于本发明的多种修改和替代都将是显而易见的。因此,本发明的保护范围应由所附的权利要求来限定。
Claims (9)
1.人工合成单链鲨鱼抗体基因的制备方法,其特征在于,包含以下步骤:
步骤一,在NCBI数据库中分别检索和下载鲨鱼类的IgNAR的核苷酸序列和蛋白质序列;
步骤二,使用软件SnapGene6.0.2分析步骤一中得到的所述IgNAR的核苷酸序列和蛋白质序列;
步骤三,分别使用blastn和tblastn,将步骤一中得到的所述IgNAR的核苷酸序列和蛋白质序列作为查询序列,得到鲨鱼类的IgNAR全基因组测序序列、IgNAR基因位点和IgNAR基因位点中VNAR基因的范围;
步骤四,依据内含子的GT-AG规则和编码信号肽的leader外显子exon1以ATG起始,确定步骤三中的IgNAR基因中的编码信号肽的exon1-intron和VNAR基因中外显子exon2的范围;
步骤五,根据步骤四中确定的IgNAR基因中确定的leader外显子exon1、内含子intron和外显子exon2的范围,去掉内含子intron,连接编码信号肽的leader外显子exon1和VANR基因中外显子exon2,得到鲨鱼类基因组VNAR开放阅读框序列,根据鲨鱼类基因组VNAR开放阅读框序列得到人工合成单链鲨鱼抗体基因。
2.如权利要求1所述的制备方法,其特征在于,所述鲨鱼类具体是指条纹斑竹鲨、点纹斑竹鲨、护士鲨、佛氏虎鲨、斑纹须鲨、小点猫鲨、白斑角鲨和皱唇鲨。
3.如权利要求1所述的制备方法,其特征在于,步骤二中,所述分析具体是指验证步骤一中得到的所述IgNAR的核苷酸序列和蛋白质序列是否正确。
4.如权利要求1所述的制备方法,其特征在于,步骤五之后还包含:将步骤五中得到的所述人工合成单链鲨鱼抗体基因的序列翻译成氨基酸序列,与既往已发布的鲨鱼类VNAR氨基酸序列进行比对,验证是否正确。
5.人工合成单链鲨鱼抗体基因,其特征在于,所述人工合成单链鲨鱼抗体基因由权利要求1~4中任意一项所述的制备方法制备得到。
6.如权利要求5所述的人工合成单链鲨鱼抗体基因,其特征在于,所述人工合成单链鲨鱼抗体基因至少包含13条鲨鱼类基因组VNAR开放阅读框序列。
7.如权利要求6所述的人工合成单链鲨鱼抗体基因,其特征在于,所述13条鲨鱼类基因组VNAR开放阅读框序列分别为SEQ ID No:1、SEQ IDNo:2、SEQ ID No:3、SEQ ID No:4、SEQID No:5、SEQ ID No:6、SEQ ID No:7、SEQ ID No:8、SEQ ID No:9、SEQ ID No:10、SEQIDNo:11、SEQ ID No:12、SEQ ID No:13。
8.如权利要求5~7中任意一项所述的人工合成单链鲨鱼抗体基因的应用,其特征在于,所述人工合成单链鲨鱼抗体基因用于制备能够产生鲨类IgNAR抗体的转基因小鼠模型。
9.如权利要求8所述的应用,其特征在于,所述能够产生鲨类IgNAR抗体的转基因小鼠模型用于进行靶向肿瘤抗原以及病毒抗原IgNAR抗体药物的研发,用于肿瘤及传染病的临床治疗。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410078441.7A CN118147129A (zh) | 2024-01-19 | 2024-01-19 | 人工合成单链鲨鱼抗体基因、其制备方法及应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410078441.7A CN118147129A (zh) | 2024-01-19 | 2024-01-19 | 人工合成单链鲨鱼抗体基因、其制备方法及应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118147129A true CN118147129A (zh) | 2024-06-07 |
Family
ID=91287477
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410078441.7A Pending CN118147129A (zh) | 2024-01-19 | 2024-01-19 | 人工合成单链鲨鱼抗体基因、其制备方法及应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118147129A (zh) |
-
2024
- 2024-01-19 CN CN202410078441.7A patent/CN118147129A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12291798B2 (en) | Generation of binding molecules | |
JP5054058B2 (ja) | ハイブリッド抗体 | |
JP4955185B2 (ja) | 二重特異性抗体ならびに作製方法および使用方法 | |
JP6391574B2 (ja) | 種間標的内交差反応性を有する抗体分子を産生する方法 | |
US20050033031A1 (en) | Methods for humanizing rabbit monoclonal antibodies | |
CN114126646B (zh) | 基于序列的高通量方法产生骆驼抗体以高分辨率覆盖广泛表位 | |
JP2009106280A (ja) | ヒトに適合したモノクローナル抗体における使用法 | |
JPH10501697A (ja) | インターロイキン−5特異的組換え抗体 | |
JP2017510273A (ja) | 異なる結合特性を示すvl抗原結合タンパク質 | |
AU2019418280B2 (en) | Mixed binding domains | |
CN118147129A (zh) | 人工合成单链鲨鱼抗体基因、其制备方法及应用 | |
CN111662385B (zh) | 全人源抗人gpc3单克隆抗体及其用途 | |
KR102480493B1 (ko) | 동일한 경쇄 i을 갖는 다양한 항체를 생산하기 위한 트랜스제닉 동물 | |
CN117587070B (zh) | 一种经遗传修饰的非人哺乳动物的制备方法及应用 | |
WO2025086545A1 (zh) | 一种制备抗体的方法 | |
CN120322678A (zh) | 使用序列特征筛选纳米抗体 | |
EP3760721A1 (en) | Nucleic acid molecule and application thereof in humanized antibody | |
Almagro et al. | Novel approaches in discovery and design of antibody-based therapeutics | |
Kuhlmann | Immunization, immune sera and the production of antibodies |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |