CN114560925A - Ccr6基因人源化非人动物的构建方法及应用 - Google Patents
Ccr6基因人源化非人动物的构建方法及应用 Download PDFInfo
- Publication number
- CN114560925A CN114560925A CN202210231740.0A CN202210231740A CN114560925A CN 114560925 A CN114560925 A CN 114560925A CN 202210231740 A CN202210231740 A CN 202210231740A CN 114560925 A CN114560925 A CN 114560925A
- Authority
- CN
- China
- Prior art keywords
- ccr6
- human
- gene
- humanized
- seq
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 101150102105 CCR6 gene Proteins 0.000 title claims abstract description 139
- 101100005653 Homo sapiens CCR6 gene Proteins 0.000 title claims abstract description 139
- 238000010276 construction Methods 0.000 title claims abstract description 30
- 101000716068 Homo sapiens C-C chemokine receptor type 6 Proteins 0.000 claims abstract description 210
- 239000002773 nucleotide Substances 0.000 claims abstract description 137
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 137
- 102000044238 human CCR6 Human genes 0.000 claims abstract description 48
- 239000013598 vector Substances 0.000 claims abstract description 44
- 239000003814 drug Substances 0.000 claims abstract description 28
- 241001465754 Metazoa Species 0.000 claims abstract description 25
- 238000012216 screening Methods 0.000 claims abstract description 16
- 238000011160 research Methods 0.000 claims abstract description 10
- 230000007246 mechanism Effects 0.000 claims abstract description 3
- 102100025074 C-C chemokine receptor-like 2 Human genes 0.000 claims abstract 10
- 108090000623 proteins and genes Proteins 0.000 claims description 76
- 210000004027 cell Anatomy 0.000 claims description 56
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 43
- 230000008685 targeting Effects 0.000 claims description 41
- 238000000034 method Methods 0.000 claims description 38
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 31
- 241000283984 Rodentia Species 0.000 claims description 30
- 201000010099 disease Diseases 0.000 claims description 29
- 108700024394 Exon Proteins 0.000 claims description 23
- 238000003780 insertion Methods 0.000 claims description 21
- 230000037431 insertion Effects 0.000 claims description 21
- 210000001519 tissue Anatomy 0.000 claims description 19
- 230000001105 regulatory effect Effects 0.000 claims description 14
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 12
- 230000000694 effects Effects 0.000 claims description 11
- 238000006467 substitution reaction Methods 0.000 claims description 11
- 108020004999 messenger RNA Proteins 0.000 claims description 10
- 238000011161 development Methods 0.000 claims description 9
- 238000010362 genome editing Methods 0.000 claims description 8
- 102000004169 proteins and genes Human genes 0.000 claims description 8
- 210000000056 organ Anatomy 0.000 claims description 7
- 102000008096 B7-H1 Antigen Human genes 0.000 claims description 6
- 108010074708 B7-H1 Antigen Proteins 0.000 claims description 6
- 101000998146 Homo sapiens Interleukin-17A Proteins 0.000 claims description 6
- 101001033312 Homo sapiens Interleukin-4 receptor subunit alpha Proteins 0.000 claims description 6
- 101000599048 Homo sapiens Interleukin-6 receptor subunit alpha Proteins 0.000 claims description 6
- 102100033461 Interleukin-17A Human genes 0.000 claims description 6
- 102000004388 Interleukin-4 Human genes 0.000 claims description 6
- 108090000978 Interleukin-4 Proteins 0.000 claims description 6
- 102100039078 Interleukin-4 receptor subunit alpha Human genes 0.000 claims description 6
- 102000004889 Interleukin-6 Human genes 0.000 claims description 6
- 108090001005 Interleukin-6 Proteins 0.000 claims description 6
- 102100037792 Interleukin-6 receptor subunit alpha Human genes 0.000 claims description 6
- 101710089372 Programmed cell death protein 1 Proteins 0.000 claims description 6
- 238000000338 in vitro Methods 0.000 claims description 6
- 102100023990 60S ribosomal protein L17 Human genes 0.000 claims description 5
- 108040004564 crotonyl-CoA reductase activity proteins Proteins 0.000 claims description 5
- 238000004519 manufacturing process Methods 0.000 claims description 5
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 4
- 150000007523 nucleic acids Chemical group 0.000 claims description 3
- 230000001225 therapeutic effect Effects 0.000 claims description 3
- 238000012356 Product development Methods 0.000 claims description 2
- 230000000259 anti-tumor effect Effects 0.000 claims description 2
- 230000004720 fertilization Effects 0.000 claims description 2
- 210000005260 human cell Anatomy 0.000 claims description 2
- 230000001900 immune effect Effects 0.000 claims description 2
- 230000037189 immune system physiology Effects 0.000 claims description 2
- 230000013011 mating Effects 0.000 claims description 2
- 230000002906 microbiologic effect Effects 0.000 claims description 2
- 230000000144 pharmacologic effect Effects 0.000 claims description 2
- 208000024172 Cardiovascular disease Diseases 0.000 claims 1
- 230000003110 anti-inflammatory effect Effects 0.000 claims 1
- 208000026106 cerebrovascular disease Diseases 0.000 claims 1
- 230000002526 effect on cardiovascular system Effects 0.000 claims 1
- 108091033319 polynucleotide Proteins 0.000 claims 1
- 102000040430 polynucleotide Human genes 0.000 claims 1
- 239000002157 polynucleotide Substances 0.000 claims 1
- 229920001184 polypeptide Polymers 0.000 claims 1
- 102000004196 processed proteins & peptides Human genes 0.000 claims 1
- 108090000765 processed proteins & peptides Proteins 0.000 claims 1
- 206010028980 Neoplasm Diseases 0.000 abstract description 28
- 238000010171 animal model Methods 0.000 abstract description 23
- 229940079593 drug Drugs 0.000 abstract description 20
- 208000023275 Autoimmune disease Diseases 0.000 abstract description 10
- 238000010363 gene targeting Methods 0.000 abstract description 4
- 239000002547 new drug Substances 0.000 abstract description 3
- 238000012827 research and development Methods 0.000 abstract description 3
- 238000002744 homologous recombination Methods 0.000 abstract description 2
- 230000006801 homologous recombination Effects 0.000 abstract description 2
- 102100036302 C-C chemokine receptor type 6 Human genes 0.000 description 88
- 108020004414 DNA Proteins 0.000 description 68
- 241000699670 Mus sp. Species 0.000 description 59
- 241000699666 Mus <mouse, genus> Species 0.000 description 52
- 108091027544 Subgenomic mRNA Proteins 0.000 description 39
- 239000012634 fragment Substances 0.000 description 23
- 206010061218 Inflammation Diseases 0.000 description 18
- 238000001514 detection method Methods 0.000 description 17
- 230000004054 inflammatory process Effects 0.000 description 17
- 241000700159 Rattus Species 0.000 description 15
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 12
- 101100005654 Mus musculus Ccr6 gene Proteins 0.000 description 11
- 230000006798 recombination Effects 0.000 description 11
- 238000005215 recombination Methods 0.000 description 11
- 108020004705 Codon Proteins 0.000 description 10
- 238000011577 humanized mouse model Methods 0.000 description 10
- 239000000523 sample Substances 0.000 description 10
- 238000012163 sequencing technique Methods 0.000 description 10
- 210000000952 spleen Anatomy 0.000 description 10
- 238000011740 C57BL/6 mouse Methods 0.000 description 9
- 108091081024 Start codon Proteins 0.000 description 9
- 241000282693 Cercopithecidae Species 0.000 description 8
- 241000283973 Oryctolagus cuniculus Species 0.000 description 8
- NKANXQFJJICGDU-QPLCGJKRSA-N Tamoxifen Chemical compound C=1C=CC=CC=1C(/CC)=C(C=1C=CC(OCCN(C)C)=CC=1)/C1=CC=CC=C1 NKANXQFJJICGDU-QPLCGJKRSA-N 0.000 description 8
- 210000003719 b-lymphocyte Anatomy 0.000 description 8
- 238000003209 gene knockout Methods 0.000 description 8
- 239000003550 marker Substances 0.000 description 8
- 210000004881 tumor cell Anatomy 0.000 description 8
- 241001529936 Murinae Species 0.000 description 7
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- 230000000857 drug effect Effects 0.000 description 6
- 235000013601 eggs Nutrition 0.000 description 6
- 230000014509 gene expression Effects 0.000 description 6
- 239000000411 inducer Substances 0.000 description 6
- 239000013612 plasmid Substances 0.000 description 6
- 238000011144 upstream manufacturing Methods 0.000 description 6
- 238000012795 verification Methods 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- 102000053602 DNA Human genes 0.000 description 5
- 238000003556 assay Methods 0.000 description 5
- 238000004113 cell culture Methods 0.000 description 5
- 210000000349 chromosome Anatomy 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000001976 enzyme digestion Methods 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 238000012239 gene modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 108010012236 Chemokines Proteins 0.000 description 4
- 102000019034 Chemokines Human genes 0.000 description 4
- 108091092195 Intron Proteins 0.000 description 4
- 241000699660 Mus musculus Species 0.000 description 4
- 238000011579 SCID mouse model Methods 0.000 description 4
- 238000002105 Southern blotting Methods 0.000 description 4
- 241000282898 Sus scrofa Species 0.000 description 4
- 210000001744 T-lymphocyte Anatomy 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000011580 nude mouse model Methods 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 229960001603 tamoxifen Drugs 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- 102100024222 B-lymphocyte antigen CD19 Human genes 0.000 description 3
- 102100037853 C-C chemokine receptor type 4 Human genes 0.000 description 3
- 101710149863 C-C chemokine receptor type 4 Proteins 0.000 description 3
- 102100036848 C-C motif chemokine 20 Human genes 0.000 description 3
- 108091033409 CRISPR Proteins 0.000 description 3
- 101000980825 Homo sapiens B-lymphocyte antigen CD19 Proteins 0.000 description 3
- 101000713099 Homo sapiens C-C motif chemokine 20 Proteins 0.000 description 3
- 101000738771 Homo sapiens Receptor-type tyrosine-protein phosphatase C Proteins 0.000 description 3
- 241000880493 Leptailurus serval Species 0.000 description 3
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 3
- 208000015914 Non-Hodgkin lymphomas Diseases 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- 206010035226 Plasma cell myeloma Diseases 0.000 description 3
- 102100037422 Receptor-type tyrosine-protein phosphatase C Human genes 0.000 description 3
- 206010039491 Sarcoma Diseases 0.000 description 3
- 210000002459 blastocyst Anatomy 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 210000001671 embryonic stem cell Anatomy 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 238000000684 flow cytometry Methods 0.000 description 3
- 238000011813 knockout mouse model Methods 0.000 description 3
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 3
- 208000032839 leukemia Diseases 0.000 description 3
- 239000003446 ligand Substances 0.000 description 3
- 238000000520 microinjection Methods 0.000 description 3
- 210000003101 oviduct Anatomy 0.000 description 3
- 230000003234 polygenic effect Effects 0.000 description 3
- 239000013641 positive control Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000003757 reverse transcription PCR Methods 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 210000001082 somatic cell Anatomy 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 208000024891 symptom Diseases 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 208000031261 Acute myeloid leukaemia Diseases 0.000 description 2
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 2
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 2
- 102100036305 C-C chemokine receptor type 8 Human genes 0.000 description 2
- 102000009410 Chemokine receptor Human genes 0.000 description 2
- 108050000299 Chemokine receptor Proteins 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 206010009900 Colitis ulcerative Diseases 0.000 description 2
- 206010009944 Colon cancer Diseases 0.000 description 2
- 241000699800 Cricetinae Species 0.000 description 2
- 102000004127 Cytokines Human genes 0.000 description 2
- 108090000695 Cytokines Proteins 0.000 description 2
- 102000016607 Diphtheria Toxin Human genes 0.000 description 2
- 108010053187 Diphtheria Toxin Proteins 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 101000716063 Homo sapiens C-C chemokine receptor type 8 Proteins 0.000 description 2
- 102000003839 Human Proteins Human genes 0.000 description 2
- 108090000144 Human Proteins Proteins 0.000 description 2
- 206010020751 Hypersensitivity Diseases 0.000 description 2
- JHNJNTMTZHEDLJ-NAKRPEOUSA-N Ile-Ser-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JHNJNTMTZHEDLJ-NAKRPEOUSA-N 0.000 description 2
- 241000581650 Ivesia Species 0.000 description 2
- 108010025815 Kanamycin Kinase Proteins 0.000 description 2
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 2
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 2
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 2
- 206010025323 Lymphomas Diseases 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- SODXFJOPSCXOHE-IHRRRGAJSA-N Met-Leu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O SODXFJOPSCXOHE-IHRRRGAJSA-N 0.000 description 2
- 208000034578 Multiple myelomas Diseases 0.000 description 2
- 206010061306 Nasopharyngeal cancer Diseases 0.000 description 2
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 2
- OLZVAVSJEUAOHI-UNQGMJICSA-N Phe-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O OLZVAVSJEUAOHI-UNQGMJICSA-N 0.000 description 2
- 206010060862 Prostate cancer Diseases 0.000 description 2
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 2
- 201000004681 Psoriasis Diseases 0.000 description 2
- 241000121210 Sigmodontinae Species 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- 108700019146 Transgenes Proteins 0.000 description 2
- 201000006704 Ulcerative Colitis Diseases 0.000 description 2
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 208000026935 allergic disease Diseases 0.000 description 2
- 230000007815 allergy Effects 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 150000001413 amino acids Chemical class 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 102000025171 antigen binding proteins Human genes 0.000 description 2
- 108091000831 antigen binding proteins Proteins 0.000 description 2
- 108010008355 arginyl-glutamine Proteins 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 210000001185 bone marrow Anatomy 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 238000013373 clone screening Methods 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 230000001086 cytosolic effect Effects 0.000 description 2
- 208000035475 disorder Diseases 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- MHMNJMPURVTYEJ-UHFFFAOYSA-N fluorescein-5-isothiocyanate Chemical compound O1C(=O)C2=CC(N=C=S)=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 MHMNJMPURVTYEJ-UHFFFAOYSA-N 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 230000005017 genetic modification Effects 0.000 description 2
- 235000013617 genetically modified food Nutrition 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 201000005202 lung cancer Diseases 0.000 description 2
- 208000020816 lung neoplasm Diseases 0.000 description 2
- 210000001165 lymph node Anatomy 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 201000002528 pancreatic cancer Diseases 0.000 description 2
- 208000008443 pancreatic carcinoma Diseases 0.000 description 2
- 108010051242 phenylalanylserine Proteins 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 150000003384 small molecules Chemical class 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000011816 wild-type C57Bl6 mouse Methods 0.000 description 2
- NCYCYZXNIZJOKI-IOUUIBBYSA-N 11-cis-retinal Chemical compound O=C/C=C(\C)/C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C NCYCYZXNIZJOKI-IOUUIBBYSA-N 0.000 description 1
- NHBKXEKEPDILRR-UHFFFAOYSA-N 2,3-bis(butanoylsulfanyl)propyl butanoate Chemical compound CCCC(=O)OCC(SC(=O)CCC)CSC(=O)CCC NHBKXEKEPDILRR-UHFFFAOYSA-N 0.000 description 1
- 208000030507 AIDS Diseases 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 208000024893 Acute lymphoblastic leukemia Diseases 0.000 description 1
- 208000014697 Acute lymphocytic leukaemia Diseases 0.000 description 1
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 1
- FRFDXQWNDZMREB-ACZMJKKPSA-N Ala-Cys-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(O)=O FRFDXQWNDZMREB-ACZMJKKPSA-N 0.000 description 1
- NJIFPLAJSVUQOZ-JBDRJPRFSA-N Ala-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C)N NJIFPLAJSVUQOZ-JBDRJPRFSA-N 0.000 description 1
- CSAHOYQKNHGDHX-ACZMJKKPSA-N Ala-Gln-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CSAHOYQKNHGDHX-ACZMJKKPSA-N 0.000 description 1
- LNNSWWRRYJLGNI-NAKRPEOUSA-N Ala-Ile-Val Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O LNNSWWRRYJLGNI-NAKRPEOUSA-N 0.000 description 1
- RUXQNKVQSKOOBS-JURCDPSOSA-N Ala-Phe-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RUXQNKVQSKOOBS-JURCDPSOSA-N 0.000 description 1
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 1
- QKHWNPQNOHEFST-VZFHVOOUSA-N Ala-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C)N)O QKHWNPQNOHEFST-VZFHVOOUSA-N 0.000 description 1
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 1
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 1
- SSQHYGLFYWZWDV-UVBJJODRSA-N Ala-Val-Trp Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O SSQHYGLFYWZWDV-UVBJJODRSA-N 0.000 description 1
- 201000003076 Angiosarcoma Diseases 0.000 description 1
- 208000031873 Animal Disease Models Diseases 0.000 description 1
- VXXHDZKEQNGXNU-QXEWZRGKSA-N Arg-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N VXXHDZKEQNGXNU-QXEWZRGKSA-N 0.000 description 1
- LLZXKVAAEWBUPB-KKUMJFAQSA-N Arg-Gln-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLZXKVAAEWBUPB-KKUMJFAQSA-N 0.000 description 1
- VENMDXUVHSKEIN-GUBZILKMSA-N Arg-Ser-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VENMDXUVHSKEIN-GUBZILKMSA-N 0.000 description 1
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 1
- JBQORRNSZGTLCV-WDSOQIARSA-N Arg-Trp-Lys Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N)=CNC2=C1 JBQORRNSZGTLCV-WDSOQIARSA-N 0.000 description 1
- QJWLLRZTJFPCHA-STECZYCISA-N Arg-Tyr-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O QJWLLRZTJFPCHA-STECZYCISA-N 0.000 description 1
- PIWWUBYJNONVTJ-ZLUOBGJFSA-N Asn-Asp-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N PIWWUBYJNONVTJ-ZLUOBGJFSA-N 0.000 description 1
- RRVBEKYEFMCDIF-WHFBIAKZSA-N Asn-Cys-Gly Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N)C(=O)N RRVBEKYEFMCDIF-WHFBIAKZSA-N 0.000 description 1
- QNJIRRVTOXNGMH-GUBZILKMSA-N Asn-Gln-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(N)=O QNJIRRVTOXNGMH-GUBZILKMSA-N 0.000 description 1
- VOGCFWDZYYTEOY-DCAQKATOSA-N Asn-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N VOGCFWDZYYTEOY-DCAQKATOSA-N 0.000 description 1
- PBFXCUOEGVJTMV-QXEWZRGKSA-N Asn-Met-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O PBFXCUOEGVJTMV-QXEWZRGKSA-N 0.000 description 1
- YXVAESUIQFDBHN-SRVKXCTJSA-N Asn-Phe-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O YXVAESUIQFDBHN-SRVKXCTJSA-N 0.000 description 1
- AMGQTNHANMRPOE-LKXGYXEUSA-N Asn-Thr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O AMGQTNHANMRPOE-LKXGYXEUSA-N 0.000 description 1
- QUCCLIXMVPIVOB-BZSNNMDCSA-N Asn-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)N)N QUCCLIXMVPIVOB-BZSNNMDCSA-N 0.000 description 1
- QRULNKJGYQQZMW-ZLUOBGJFSA-N Asp-Asn-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QRULNKJGYQQZMW-ZLUOBGJFSA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 1
- SFJUYBCDQBAYAJ-YDHLFZDLSA-N Asp-Val-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SFJUYBCDQBAYAJ-YDHLFZDLSA-N 0.000 description 1
- JGLWFWXGOINXEA-YDHLFZDLSA-N Asp-Val-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JGLWFWXGOINXEA-YDHLFZDLSA-N 0.000 description 1
- 206010003571 Astrocytoma Diseases 0.000 description 1
- 208000036170 B-Cell Marginal Zone Lymphoma Diseases 0.000 description 1
- 208000025324 B-cell acute lymphoblastic leukemia Diseases 0.000 description 1
- 208000010839 B-cell chronic lymphocytic leukemia Diseases 0.000 description 1
- 208000003950 B-cell lymphoma Diseases 0.000 description 1
- 208000032791 BCR-ABL1 positive chronic myelogenous leukemia Diseases 0.000 description 1
- 206010004593 Bile duct cancer Diseases 0.000 description 1
- 206010005003 Bladder cancer Diseases 0.000 description 1
- 206010005949 Bone cancer Diseases 0.000 description 1
- 208000018084 Bone neoplasm Diseases 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 238000010453 CRISPR/Cas method Methods 0.000 description 1
- 208000005243 Chondrosarcoma Diseases 0.000 description 1
- 208000010833 Chronic myeloid leukaemia Diseases 0.000 description 1
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 1
- 241000699679 Cricetulus migratorius Species 0.000 description 1
- AMRLSQGGERHDHJ-FXQIFTODSA-N Cys-Ala-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMRLSQGGERHDHJ-FXQIFTODSA-N 0.000 description 1
- SBORMUFGKSCGEN-XHNCKOQMSA-N Cys-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N)C(=O)O SBORMUFGKSCGEN-XHNCKOQMSA-N 0.000 description 1
- VFGADOJXRLWTBU-JBDRJPRFSA-N Cys-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N VFGADOJXRLWTBU-JBDRJPRFSA-N 0.000 description 1
- SSNJZBGOMNLSLA-CIUDSAMLSA-N Cys-Leu-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O SSNJZBGOMNLSLA-CIUDSAMLSA-N 0.000 description 1
- GGRDJANMZPGMNS-CIUDSAMLSA-N Cys-Ser-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O GGRDJANMZPGMNS-CIUDSAMLSA-N 0.000 description 1
- UGPCUUWZXRMCIJ-KKUMJFAQSA-N Cys-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CS)N UGPCUUWZXRMCIJ-KKUMJFAQSA-N 0.000 description 1
- 238000011765 DBA/2 mouse Methods 0.000 description 1
- 206010014733 Endometrial cancer Diseases 0.000 description 1
- 206010014759 Endometrial neoplasm Diseases 0.000 description 1
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 1
- 208000006168 Ewing Sarcoma Diseases 0.000 description 1
- 102100027280 Fanconi anemia group A protein Human genes 0.000 description 1
- 201000008808 Fibrosarcoma Diseases 0.000 description 1
- 102000003688 G-Protein-Coupled Receptors Human genes 0.000 description 1
- 108090000045 G-Protein-Coupled Receptors Proteins 0.000 description 1
- 241000699694 Gerbillinae Species 0.000 description 1
- XXLBHPPXDUWYAG-XQXXSGGOSA-N Gln-Ala-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XXLBHPPXDUWYAG-XQXXSGGOSA-N 0.000 description 1
- RMOCFPBLHAOTDU-ACZMJKKPSA-N Gln-Asn-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RMOCFPBLHAOTDU-ACZMJKKPSA-N 0.000 description 1
- XJKAKYXMFHUIHT-AUTRQRHGSA-N Gln-Glu-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N XJKAKYXMFHUIHT-AUTRQRHGSA-N 0.000 description 1
- RWQCWSGOOOEGPB-FXQIFTODSA-N Gln-Ser-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O RWQCWSGOOOEGPB-FXQIFTODSA-N 0.000 description 1
- ARYKRXHBIPLULY-XKBZYTNZSA-N Gln-Thr-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ARYKRXHBIPLULY-XKBZYTNZSA-N 0.000 description 1
- HLRLXVPRJJITSK-IFFSRLJSSA-N Gln-Thr-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HLRLXVPRJJITSK-IFFSRLJSSA-N 0.000 description 1
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 1
- GUOWMVFLAJNPDY-CIUDSAMLSA-N Glu-Ser-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O GUOWMVFLAJNPDY-CIUDSAMLSA-N 0.000 description 1
- WXONSNSSBYQGNN-AVGNSLFASA-N Glu-Ser-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WXONSNSSBYQGNN-AVGNSLFASA-N 0.000 description 1
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 1
- LSYFGBRDBIQYAQ-FHWLQOOXSA-N Glu-Tyr-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LSYFGBRDBIQYAQ-FHWLQOOXSA-N 0.000 description 1
- LERGJIVJIIODPZ-ZANVPECISA-N Gly-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)CN)C)C(O)=O)=CNC2=C1 LERGJIVJIIODPZ-ZANVPECISA-N 0.000 description 1
- XUORRGAFUQIMLC-STQMWFEESA-N Gly-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN)O XUORRGAFUQIMLC-STQMWFEESA-N 0.000 description 1
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 1
- YHYDTTUSJXGTQK-UWVGGRQHSA-N Gly-Met-Leu Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(C)C)C(O)=O YHYDTTUSJXGTQK-UWVGGRQHSA-N 0.000 description 1
- JPVGHHQGKPQYIL-KBPBESRZSA-N Gly-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 JPVGHHQGKPQYIL-KBPBESRZSA-N 0.000 description 1
- QSQXZZCGPXQBPP-BQBZGAKWSA-N Gly-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)CN)C(=O)N[C@@H](CS)C(=O)O QSQXZZCGPXQBPP-BQBZGAKWSA-N 0.000 description 1
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 1
- GBYYQVBXFVDJPJ-WLTAIBSBSA-N Gly-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)CN)O GBYYQVBXFVDJPJ-WLTAIBSBSA-N 0.000 description 1
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 1
- 208000001258 Hemangiosarcoma Diseases 0.000 description 1
- 208000035186 Hemolytic Autoimmune Anemia Diseases 0.000 description 1
- 208000027761 Hepatic autoimmune disease Diseases 0.000 description 1
- AWASVTXPTOLPPP-MBLNEYKQSA-N His-Ala-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWASVTXPTOLPPP-MBLNEYKQSA-N 0.000 description 1
- UVUIXIVPKVMONA-CIUDSAMLSA-N His-Cys-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CC1=CN=CN1 UVUIXIVPKVMONA-CIUDSAMLSA-N 0.000 description 1
- PGRPSOUCWRBWKZ-DLOVCJGASA-N His-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CN=CN1 PGRPSOUCWRBWKZ-DLOVCJGASA-N 0.000 description 1
- 208000017604 Hodgkin disease Diseases 0.000 description 1
- 208000021519 Hodgkin lymphoma Diseases 0.000 description 1
- 208000010747 Hodgkins lymphoma Diseases 0.000 description 1
- 101000914673 Homo sapiens Fanconi anemia group A protein Proteins 0.000 description 1
- 206010020850 Hyperthyroidism Diseases 0.000 description 1
- 206010021245 Idiopathic thrombocytopenic purpura Diseases 0.000 description 1
- QICVAHODWHIWIS-HTFCKZLJSA-N Ile-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N QICVAHODWHIWIS-HTFCKZLJSA-N 0.000 description 1
- AZEYWPUCOYXFOE-CYDGBPFRSA-N Ile-Arg-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C(C)C)C(=O)O)N AZEYWPUCOYXFOE-CYDGBPFRSA-N 0.000 description 1
- PPSQSIDMOVPKPI-BJDJZHNGSA-N Ile-Cys-Leu Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)O PPSQSIDMOVPKPI-BJDJZHNGSA-N 0.000 description 1
- IGJWJGIHUFQANP-LAEOZQHASA-N Ile-Gly-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N IGJWJGIHUFQANP-LAEOZQHASA-N 0.000 description 1
- BBQABUDWDUKJMB-LZXPERKUSA-N Ile-Ile-Ile Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C([O-])=O BBQABUDWDUKJMB-LZXPERKUSA-N 0.000 description 1
- PFPUFNLHBXKPHY-HTFCKZLJSA-N Ile-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)O)N PFPUFNLHBXKPHY-HTFCKZLJSA-N 0.000 description 1
- KTTMFLSBTNBAHL-MXAVVETBSA-N Ile-Phe-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N KTTMFLSBTNBAHL-MXAVVETBSA-N 0.000 description 1
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 1
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 1
- NJGXXYLPDMMFJB-XUXIUFHCSA-N Ile-Val-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N NJGXXYLPDMMFJB-XUXIUFHCSA-N 0.000 description 1
- 208000008839 Kidney Neoplasms Diseases 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- 102220470475 L-seryl-tRNA(Sec) kinase_C57L_mutation Human genes 0.000 description 1
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 1
- 208000031671 Large B-Cell Diffuse Lymphoma Diseases 0.000 description 1
- 208000018142 Leiomyosarcoma Diseases 0.000 description 1
- 206010024229 Leprosy Diseases 0.000 description 1
- XIRYQRLFHWWWTC-QEJZJMRPSA-N Leu-Ala-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XIRYQRLFHWWWTC-QEJZJMRPSA-N 0.000 description 1
- WGNOPSQMIQERPK-GARJFASQSA-N Leu-Asn-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N WGNOPSQMIQERPK-GARJFASQSA-N 0.000 description 1
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 1
- NHHKSOGJYNQENP-SRVKXCTJSA-N Leu-Cys-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N NHHKSOGJYNQENP-SRVKXCTJSA-N 0.000 description 1
- ZYLJULGXQDNXDK-GUBZILKMSA-N Leu-Gln-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ZYLJULGXQDNXDK-GUBZILKMSA-N 0.000 description 1
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 1
- QPXBPQUGXHURGP-UWVGGRQHSA-N Leu-Gly-Met Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCSC)C(=O)O)N QPXBPQUGXHURGP-UWVGGRQHSA-N 0.000 description 1
- DDEMUMVXNFPDKC-SRVKXCTJSA-N Leu-His-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CS)C(=O)O)N DDEMUMVXNFPDKC-SRVKXCTJSA-N 0.000 description 1
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 1
- PPQRKXHCLYCBSP-IHRRRGAJSA-N Leu-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N PPQRKXHCLYCBSP-IHRRRGAJSA-N 0.000 description 1
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 1
- QMKFDEUJGYNFMC-AVGNSLFASA-N Leu-Pro-Arg Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QMKFDEUJGYNFMC-AVGNSLFASA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- MVJRBCJCRYGCKV-GVXVVHGQSA-N Leu-Val-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MVJRBCJCRYGCKV-GVXVVHGQSA-N 0.000 description 1
- 208000031422 Lymphocytic Chronic B-Cell Leukemia Diseases 0.000 description 1
- RVOMPSJXSRPFJT-DCAQKATOSA-N Lys-Ala-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVOMPSJXSRPFJT-DCAQKATOSA-N 0.000 description 1
- GKFNXYMAMKJSKD-NHCYSSNCSA-N Lys-Asp-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GKFNXYMAMKJSKD-NHCYSSNCSA-N 0.000 description 1
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 1
- CBNMHRCLYBJIIZ-XUXIUFHCSA-N Lys-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCCN)N CBNMHRCLYBJIIZ-XUXIUFHCSA-N 0.000 description 1
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 1
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 1
- XFOAWKDQMRMCDN-ULQDDVLXSA-N Lys-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)CC1=CC=CC=C1 XFOAWKDQMRMCDN-ULQDDVLXSA-N 0.000 description 1
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 1
- VHTOGMKQXXJOHG-RHYQMDGZSA-N Lys-Thr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VHTOGMKQXXJOHG-RHYQMDGZSA-N 0.000 description 1
- XYLSGAWRCZECIQ-JYJNAYRXSA-N Lys-Tyr-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 XYLSGAWRCZECIQ-JYJNAYRXSA-N 0.000 description 1
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 1
- 208000025205 Mantle-Cell Lymphoma Diseases 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- SBSIKVMCCJUCBZ-GUBZILKMSA-N Met-Asn-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N SBSIKVMCCJUCBZ-GUBZILKMSA-N 0.000 description 1
- CAODKDAPYGUMLK-FXQIFTODSA-N Met-Asn-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CAODKDAPYGUMLK-FXQIFTODSA-N 0.000 description 1
- SQUTUWHAAWJYES-GUBZILKMSA-N Met-Asp-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SQUTUWHAAWJYES-GUBZILKMSA-N 0.000 description 1
- AXHNAGAYRGCDLG-UWVGGRQHSA-N Met-Lys-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O AXHNAGAYRGCDLG-UWVGGRQHSA-N 0.000 description 1
- ZACMJPCWVSLCNS-JYJNAYRXSA-N Met-Phe-Met Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCSC)C(O)=O)CC1=CC=CC=C1 ZACMJPCWVSLCNS-JYJNAYRXSA-N 0.000 description 1
- LXCSZPUQKMTXNW-BQBZGAKWSA-N Met-Ser-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O LXCSZPUQKMTXNW-BQBZGAKWSA-N 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 241000699669 Mus saxicola Species 0.000 description 1
- 201000003793 Myelodysplastic syndrome Diseases 0.000 description 1
- 208000033761 Myelogenous Chronic BCR-ABL Positive Leukemia Diseases 0.000 description 1
- 208000033776 Myeloid Acute Leukemia Diseases 0.000 description 1
- 208000009525 Myocarditis Diseases 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 108010066427 N-valyltryptophan Proteins 0.000 description 1
- 208000002454 Nasopharyngeal Carcinoma Diseases 0.000 description 1
- 208000001894 Nasopharyngeal Neoplasms Diseases 0.000 description 1
- 208000012902 Nervous system disease Diseases 0.000 description 1
- 108020004485 Nonsense Codon Proteins 0.000 description 1
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 1
- 206010033128 Ovarian cancer Diseases 0.000 description 1
- 206010061535 Ovarian neoplasm Diseases 0.000 description 1
- 238000010222 PCR analysis Methods 0.000 description 1
- AGYXCMYVTBYGCT-ULQDDVLXSA-N Phe-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O AGYXCMYVTBYGCT-ULQDDVLXSA-N 0.000 description 1
- UUWCIPUVJJIEEP-SRVKXCTJSA-N Phe-Asn-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N UUWCIPUVJJIEEP-SRVKXCTJSA-N 0.000 description 1
- KAHUBGWSIQNZQQ-KKUMJFAQSA-N Phe-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KAHUBGWSIQNZQQ-KKUMJFAQSA-N 0.000 description 1
- NHCKESBLOMHIIE-IRXDYDNUSA-N Phe-Gly-Phe Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 NHCKESBLOMHIIE-IRXDYDNUSA-N 0.000 description 1
- GXDPQJUBLBZKDY-IAVJCBSLSA-N Phe-Ile-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GXDPQJUBLBZKDY-IAVJCBSLSA-N 0.000 description 1
- CWFGECHCRMGPPT-MXAVVETBSA-N Phe-Ile-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O CWFGECHCRMGPPT-MXAVVETBSA-N 0.000 description 1
- OKQQWSNUSQURLI-JYJNAYRXSA-N Phe-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=CC=C1)N OKQQWSNUSQURLI-JYJNAYRXSA-N 0.000 description 1
- IWZRODDWOSIXPZ-IRXDYDNUSA-N Phe-Phe-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=CC=C1 IWZRODDWOSIXPZ-IRXDYDNUSA-N 0.000 description 1
- MGLBSROLWAWCKN-FCLVOEFKSA-N Phe-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MGLBSROLWAWCKN-FCLVOEFKSA-N 0.000 description 1
- YMIZSYUAZJSOFL-SRVKXCTJSA-N Phe-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O YMIZSYUAZJSOFL-SRVKXCTJSA-N 0.000 description 1
- DBNGDEAQXGFGRA-ACRUOGEOSA-N Phe-Tyr-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DBNGDEAQXGFGRA-ACRUOGEOSA-N 0.000 description 1
- VDTYRPWRWRCROL-UFYCRDLUSA-N Phe-Val-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 VDTYRPWRWRCROL-UFYCRDLUSA-N 0.000 description 1
- 208000006664 Precursor Cell Lymphoblastic Leukemia-Lymphoma Diseases 0.000 description 1
- KIGGUSRFHJCIEJ-DCAQKATOSA-N Pro-Asp-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O KIGGUSRFHJCIEJ-DCAQKATOSA-N 0.000 description 1
- KLSOMAFWRISSNI-OSUNSFLBSA-N Pro-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 KLSOMAFWRISSNI-OSUNSFLBSA-N 0.000 description 1
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 1
- WCNVGGZRTNHOOS-ULQDDVLXSA-N Pro-Lys-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O WCNVGGZRTNHOOS-ULQDDVLXSA-N 0.000 description 1
- YYARMJSFDLIDFS-FKBYEOEOSA-N Pro-Phe-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O YYARMJSFDLIDFS-FKBYEOEOSA-N 0.000 description 1
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 1
- 108010079005 RDV peptide Proteins 0.000 description 1
- 101100029566 Rattus norvegicus Rabggta gene Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 208000015634 Rectal Neoplasms Diseases 0.000 description 1
- 206010038389 Renal cancer Diseases 0.000 description 1
- 102100040756 Rhodopsin Human genes 0.000 description 1
- 108090000820 Rhodopsin Proteins 0.000 description 1
- 206010039710 Scleroderma Diseases 0.000 description 1
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 1
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 1
- KCFKKAQKRZBWJB-ZLUOBGJFSA-N Ser-Cys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O KCFKKAQKRZBWJB-ZLUOBGJFSA-N 0.000 description 1
- MOVJSUIKUNCVMG-ZLUOBGJFSA-N Ser-Cys-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N)O MOVJSUIKUNCVMG-ZLUOBGJFSA-N 0.000 description 1
- SQBLRDDJTUJDMV-ACZMJKKPSA-N Ser-Glu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQBLRDDJTUJDMV-ACZMJKKPSA-N 0.000 description 1
- UFKPDBLKLOBMRH-XHNCKOQMSA-N Ser-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)C(=O)O UFKPDBLKLOBMRH-XHNCKOQMSA-N 0.000 description 1
- JFWDJFULOLKQFY-QWRGUYRKSA-N Ser-Gly-Phe Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JFWDJFULOLKQFY-QWRGUYRKSA-N 0.000 description 1
- MOINZPRHJGTCHZ-MMWGEVLESA-N Ser-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N MOINZPRHJGTCHZ-MMWGEVLESA-N 0.000 description 1
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 1
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 1
- LRWBCWGEUCKDTN-BJDJZHNGSA-N Ser-Lys-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LRWBCWGEUCKDTN-BJDJZHNGSA-N 0.000 description 1
- KJKQUQXDEKMPDK-FXQIFTODSA-N Ser-Met-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O KJKQUQXDEKMPDK-FXQIFTODSA-N 0.000 description 1
- RXSWQCATLWVDLI-XGEHTFHBSA-N Ser-Met-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RXSWQCATLWVDLI-XGEHTFHBSA-N 0.000 description 1
- JAWGSPUJAXYXJA-IHRRRGAJSA-N Ser-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CC=CC=C1 JAWGSPUJAXYXJA-IHRRRGAJSA-N 0.000 description 1
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 1
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 1
- 108020004688 Small Nuclear RNA Proteins 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 208000021712 Soft tissue sarcoma Diseases 0.000 description 1
- 208000027520 Somatoform disease Diseases 0.000 description 1
- 208000005718 Stomach Neoplasms Diseases 0.000 description 1
- 208000029052 T-cell acute lymphoblastic leukemia Diseases 0.000 description 1
- 206010042971 T-cell lymphoma Diseases 0.000 description 1
- 208000027585 T-cell non-Hodgkin lymphoma Diseases 0.000 description 1
- 208000024313 Testicular Neoplasms Diseases 0.000 description 1
- 206010057644 Testis cancer Diseases 0.000 description 1
- JMZKMSTYXHFYAK-VEVYYDQMSA-N Thr-Arg-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O JMZKMSTYXHFYAK-VEVYYDQMSA-N 0.000 description 1
- PQLXHSACXPGWPD-GSSVUCPTSA-N Thr-Asn-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PQLXHSACXPGWPD-GSSVUCPTSA-N 0.000 description 1
- YOSLMIPKOUAHKI-OLHMAJIHSA-N Thr-Asp-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O YOSLMIPKOUAHKI-OLHMAJIHSA-N 0.000 description 1
- HJOSVGCWOTYJFG-WDCWCFNPSA-N Thr-Glu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O HJOSVGCWOTYJFG-WDCWCFNPSA-N 0.000 description 1
- ONNSECRQFSTMCC-XKBZYTNZSA-N Thr-Glu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ONNSECRQFSTMCC-XKBZYTNZSA-N 0.000 description 1
- BNGDYRRHRGOPHX-IFFSRLJSSA-N Thr-Glu-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O BNGDYRRHRGOPHX-IFFSRLJSSA-N 0.000 description 1
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 1
- SIMKLINEDYOTKL-MBLNEYKQSA-N Thr-His-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C)C(=O)O)N)O SIMKLINEDYOTKL-MBLNEYKQSA-N 0.000 description 1
- KRGDDWVBBDLPSJ-CUJWVEQBSA-N Thr-His-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O KRGDDWVBBDLPSJ-CUJWVEQBSA-N 0.000 description 1
- XSEPSRUDSPHMPX-KATARQTJSA-N Thr-Lys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O XSEPSRUDSPHMPX-KATARQTJSA-N 0.000 description 1
- HSQXHRIRJSFDOH-URLPEUOOSA-N Thr-Phe-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HSQXHRIRJSFDOH-URLPEUOOSA-N 0.000 description 1
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 1
- LXXCHJKHJYRMIY-FQPOAREZSA-N Thr-Tyr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O LXXCHJKHJYRMIY-FQPOAREZSA-N 0.000 description 1
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 1
- 208000031981 Thrombocytopenic Idiopathic Purpura Diseases 0.000 description 1
- 208000024770 Thyroid neoplasm Diseases 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- 206010052779 Transplant rejections Diseases 0.000 description 1
- KOVOKXBHGVXQMG-BPUTZDHNSA-N Trp-Cys-Met Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCSC)C(O)=O)=CNC2=C1 KOVOKXBHGVXQMG-BPUTZDHNSA-N 0.000 description 1
- NWQCKAPDGQMZQN-IHPCNDPISA-N Trp-Lys-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O NWQCKAPDGQMZQN-IHPCNDPISA-N 0.000 description 1
- IEESWNWYUOETOT-BVSLBCMMSA-N Trp-Val-Phe Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(=O)N[C@@H](Cc1ccccc1)C(O)=O IEESWNWYUOETOT-BVSLBCMMSA-N 0.000 description 1
- NSOMQRHZMJMZIE-GVARAGBVSA-N Tyr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NSOMQRHZMJMZIE-GVARAGBVSA-N 0.000 description 1
- XGEUYEOEZYFHRL-KKXDTOCCSA-N Tyr-Ala-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 XGEUYEOEZYFHRL-KKXDTOCCSA-N 0.000 description 1
- IIJWXEUNETVJPV-IHRRRGAJSA-N Tyr-Arg-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N)O IIJWXEUNETVJPV-IHRRRGAJSA-N 0.000 description 1
- ZNFPUOSTMUMUDR-JRQIVUDYSA-N Tyr-Asn-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZNFPUOSTMUMUDR-JRQIVUDYSA-N 0.000 description 1
- DANHCMVVXDXOHN-SRVKXCTJSA-N Tyr-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DANHCMVVXDXOHN-SRVKXCTJSA-N 0.000 description 1
- PGEFRHBWGOJPJT-KKUMJFAQSA-N Tyr-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O PGEFRHBWGOJPJT-KKUMJFAQSA-N 0.000 description 1
- OKDNSNWJEXAMSU-IRXDYDNUSA-N Tyr-Phe-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 OKDNSNWJEXAMSU-IRXDYDNUSA-N 0.000 description 1
- LDKDSFQSEUOCOO-RPTUDFQQSA-N Tyr-Thr-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LDKDSFQSEUOCOO-RPTUDFQQSA-N 0.000 description 1
- AGDDLOQMXUQPDY-BZSNNMDCSA-N Tyr-Tyr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O AGDDLOQMXUQPDY-BZSNNMDCSA-N 0.000 description 1
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 1
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 1
- VMRFIKXKOFNMHW-GUBZILKMSA-N Val-Arg-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N VMRFIKXKOFNMHW-GUBZILKMSA-N 0.000 description 1
- QGFPYRPIUXBYGR-YDHLFZDLSA-N Val-Asn-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N QGFPYRPIUXBYGR-YDHLFZDLSA-N 0.000 description 1
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 1
- KOPBYUSPXBQIHD-NRPADANISA-N Val-Cys-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KOPBYUSPXBQIHD-NRPADANISA-N 0.000 description 1
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 1
- WDIWOIRFNMLNKO-ULQDDVLXSA-N Val-Leu-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WDIWOIRFNMLNKO-ULQDDVLXSA-N 0.000 description 1
- VIKZGAUAKQZDOF-NRPADANISA-N Val-Ser-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VIKZGAUAKQZDOF-NRPADANISA-N 0.000 description 1
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 1
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 1
- WHNSHJJNWNSTSU-BZSNNMDCSA-N Val-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 WHNSHJJNWNSTSU-BZSNNMDCSA-N 0.000 description 1
- 208000033559 Waldenström macroglobulinemia Diseases 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000001154 acute effect Effects 0.000 description 1
- 208000038016 acute inflammation Diseases 0.000 description 1
- 230000006022 acute inflammation Effects 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 108010047495 alanylglycine Proteins 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 239000005557 antagonist Substances 0.000 description 1
- 239000002260 anti-inflammatory agent Substances 0.000 description 1
- 229940124599 anti-inflammatory drug Drugs 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 229940041181 antineoplastic drug Drugs 0.000 description 1
- 208000006673 asthma Diseases 0.000 description 1
- 201000000448 autoimmune hemolytic anemia Diseases 0.000 description 1
- 201000003710 autoimmune thrombocytopenic purpura Diseases 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 208000026900 bile duct neoplasm Diseases 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 101150038500 cas9 gene Proteins 0.000 description 1
- 230000012292 cell migration Effects 0.000 description 1
- 230000009087 cell motility Effects 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 108091092328 cellular RNA Proteins 0.000 description 1
- 239000002975 chemoattractant Substances 0.000 description 1
- 230000003399 chemotactic effect Effects 0.000 description 1
- 208000006990 cholangiocarcinoma Diseases 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 208000037976 chronic inflammation Diseases 0.000 description 1
- 230000006020 chronic inflammation Effects 0.000 description 1
- 208000032852 chronic lymphocytic leukemia Diseases 0.000 description 1
- 210000001728 clone cell Anatomy 0.000 description 1
- 238000013377 clone selection method Methods 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 108010004073 cysteinylcysteine Proteins 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 108010069495 cysteinyltyrosine Proteins 0.000 description 1
- 230000001461 cytolytic effect Effects 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000003412 degenerative effect Effects 0.000 description 1
- 210000004443 dendritic cell Anatomy 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 206010012818 diffuse large B-cell lymphoma Diseases 0.000 description 1
- 230000026058 directional locomotion Effects 0.000 description 1
- 230000005782 double-strand break Effects 0.000 description 1
- 238000009509 drug development Methods 0.000 description 1
- 238000007877 drug screening Methods 0.000 description 1
- 238000003255 drug test Methods 0.000 description 1
- 238000002651 drug therapy Methods 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 201000004101 esophageal cancer Diseases 0.000 description 1
- 230000001605 fetal effect Effects 0.000 description 1
- 201000003444 follicular lymphoma Diseases 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 235000012631 food intake Nutrition 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 206010017758 gastric cancer Diseases 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 208000005017 glioblastoma Diseases 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 201000010536 head and neck cancer Diseases 0.000 description 1
- 208000014829 head and neck neoplasm Diseases 0.000 description 1
- 230000002008 hemorrhagic effect Effects 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 210000001822 immobilized cell Anatomy 0.000 description 1
- 210000002865 immune cell Anatomy 0.000 description 1
- 230000000984 immunochemical effect Effects 0.000 description 1
- 238000011503 in vivo imaging Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000028709 inflammatory response Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 1
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- 201000010982 kidney cancer Diseases 0.000 description 1
- 108010076756 leucyl-alanyl-phenylalanine Proteins 0.000 description 1
- 108010034529 leucyl-lysine Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 206010024627 liposarcoma Diseases 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 201000007270 liver cancer Diseases 0.000 description 1
- 208000014018 liver neoplasm Diseases 0.000 description 1
- 210000005228 liver tissue Anatomy 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 201000005296 lung carcinoma Diseases 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 230000000527 lymphocytic effect Effects 0.000 description 1
- 210000005210 lymphoid organ Anatomy 0.000 description 1
- 210000003563 lymphoid tissue Anatomy 0.000 description 1
- 108010054155 lysyllysine Proteins 0.000 description 1
- 210000001161 mammalian embryo Anatomy 0.000 description 1
- 201000007924 marginal zone B-cell lymphoma Diseases 0.000 description 1
- 208000021937 marginal zone lymphoma Diseases 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 210000003071 memory t lymphocyte Anatomy 0.000 description 1
- 230000004066 metabolic change Effects 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 210000001616 monocyte Anatomy 0.000 description 1
- 238000010172 mouse model Methods 0.000 description 1
- 201000000050 myeloid neoplasm Diseases 0.000 description 1
- 201000011216 nasopharynx carcinoma Diseases 0.000 description 1
- 230000002956 necrotizing effect Effects 0.000 description 1
- 230000001613 neoplastic effect Effects 0.000 description 1
- 201000008383 nephritis Diseases 0.000 description 1
- 230000000324 neuroprotective effect Effects 0.000 description 1
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 201000008968 osteosarcoma Diseases 0.000 description 1
- 208000027753 pain disease Diseases 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 230000003285 pharmacodynamic effect Effects 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 208000031223 plasma cell leukemia Diseases 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 210000001243 pseudopodia Anatomy 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 206010038038 rectal cancer Diseases 0.000 description 1
- 201000001275 rectum cancer Diseases 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 201000009410 rhabdomyosarcoma Diseases 0.000 description 1
- 206010039073 rheumatoid arthritis Diseases 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- -1 scRNA Proteins 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 201000011549 stomach cancer Diseases 0.000 description 1
- 206010042863 synovial sarcoma Diseases 0.000 description 1
- 208000006379 syphilis Diseases 0.000 description 1
- 201000000596 systemic lupus erythematosus Diseases 0.000 description 1
- 238000010809 targeting technique Methods 0.000 description 1
- 201000003120 testicular cancer Diseases 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 210000001541 thymus gland Anatomy 0.000 description 1
- 201000002510 thyroid cancer Diseases 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
- 201000008827 tuberculosis Diseases 0.000 description 1
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 description 1
- 201000005112 urinary bladder cancer Diseases 0.000 description 1
- 108010000998 wheylin-2 peptide Proteins 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
- C07K14/715—Receptors; Cell surface antigens; Cell surface determinants for cytokines; for lymphokines; for interferons
- C07K14/7158—Receptors; Cell surface antigens; Cell surface determinants for cytokines; for lymphokines; for interferons for chemokines
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K67/00—Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
- A01K67/027—New or modified breeds of vertebrates
- A01K67/0275—Genetically modified vertebrates, e.g. transgenic
- A01K67/0278—Knock-in vertebrates, e.g. humanised vertebrates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/64—General methods for preparing the vector, for introducing it into the cell or for selecting the vector-containing host
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/8509—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/5005—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
- G01N33/5008—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/5005—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
- G01N33/5008—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
- G01N33/5011—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics for testing antineoplastic activity
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2207/00—Modified animals
- A01K2207/15—Humanized animals
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2227/00—Animals characterised by species
- A01K2227/10—Mammal
- A01K2227/105—Murine
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/03—Animal model, e.g. for test or diseases
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/03—Animal model, e.g. for test or diseases
- A01K2267/0331—Animal model for proliferative diseases
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/03—Animal model, e.g. for test or diseases
- A01K2267/035—Animal model for multifactorial diseases
- A01K2267/0356—Animal model for processes and diseases of the central nervous system, e.g. stress, learning, schizophrenia, pain, epilepsy
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/03—Animal model, e.g. for test or diseases
- A01K2267/035—Animal model for multifactorial diseases
- A01K2267/0368—Animal model for inflammation
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/03—Animal model, e.g. for test or diseases
- A01K2267/035—Animal model for multifactorial diseases
- A01K2267/0375—Animal model for cardiovascular diseases
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/03—Animal model, e.g. for test or diseases
- A01K2267/035—Animal model for multifactorial diseases
- A01K2267/0387—Animal model for diseases of the immune system
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2510/00—Genetically modified cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/10—Plasmid DNA
- C12N2800/106—Plasmid DNA for vertebrates
- C12N2800/107—Plasmid DNA for vertebrates for mammalian
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2500/00—Screening for compounds of potential therapeutic value
- G01N2500/10—Screening for compounds of potential therapeutic value involving cells
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- Genetics & Genomics (AREA)
- Biotechnology (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Molecular Biology (AREA)
- Wood Science & Technology (AREA)
- Biochemistry (AREA)
- Cell Biology (AREA)
- Microbiology (AREA)
- General Engineering & Computer Science (AREA)
- Hematology (AREA)
- Urology & Nephrology (AREA)
- Physics & Mathematics (AREA)
- Toxicology (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- General Physics & Mathematics (AREA)
- Veterinary Medicine (AREA)
- Food Science & Technology (AREA)
- Tropical Medicine & Parasitology (AREA)
- Pathology (AREA)
- Environmental Sciences (AREA)
- Analytical Chemistry (AREA)
- Plant Pathology (AREA)
- Animal Husbandry (AREA)
- Animal Behavior & Ethology (AREA)
- Biodiversity & Conservation Biology (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本发明提供了一种CCR6基因人源化的非人动物及其构建方法、一种人源化CCR6蛋白、一种人源化CCR6基因、一种CCR6基因的靶向载体和其在生物医药领域的应用,利用同源重组的方式将编码人CCR6蛋白的核苷酸序列导入非人动物基因组中,该动物体内能正常表达人或人源化CCR6蛋白,可以作为人CCR6信号机理研究、肿瘤及自身免疫性疾病药物筛选的动物模型,对免疫靶点的新药研发具有重要的应用价值。
Description
技术领域
本发明属于动物基因工程和基因遗传修饰领域,具体地说,涉及一种CCR6基因改造非人动物模型的构建方法及其在生物医药领域的应用。
背景技术
趋化因子(Chemoattractant Cytokine)是能够使细胞发生趋化运动的小分子细胞因子,所谓趋化运动是指细胞向高浓度刺激物方向的定向运动;趋化因子受体是能够特异性结合趋化因子的细胞膜蛋白,是细胞表面G蛋白偶联受体视紫红质家族的一大分支,通常具有七次跨膜结构域。趋化因子及其受体与炎症、肿瘤、自身免疫病、变态反应、获得性免疫缺陷综合征等疾病密切相关。人趋化因子受体6(Chemokine Receptor 6,CCR6)于1996年由Zaballos等人通过简并引物的方法克隆发现,在淋巴/非淋巴组织器官均有表达,主要表达于脾、淋巴结、胸腺、胎肝组织及记忆T细胞、B淋巴细胞和未成熟的树突状细胞等,其唯一趋化因子配体为CCL20,二者结合可引起细胞内肌动蛋白聚合和伪足形成,进而调节细胞的运动和迁移。研究发现,CCR6及其配体在胰腺癌、前列腺癌、结直肠癌、肺癌和血液系统恶性肿瘤细胞中表达上调,并且与肿瘤细胞的侵袭转移密切相关。此外,还有研究发现,CCR6及其配体在受损性银屑病皮肤高表达,使用CCR6小分子拮抗剂可以有效治疗小鼠银屑病;CCR6还参与了溃疡性结肠炎的发生和发展,以及在免疫细胞介导的炎症反应、移植排斥反应中发挥了重要作用。
实验动物疾病模型对于研究人类疾病发生的病因、发病机制、开发防治技术和开发药物是不可缺少的研究工具。但由于动物与人类的生理结构和代谢系统本身的差异,传统的动物模型并不能很好的反映人体的真实状况,在动物体内建立更接近人类的生理特征的疾病模型是生物医药行业的迫切需求。随着基因工程技术的不断发展和成熟,用人类基因替代或置换动物的同源性基因已经实现,通过这种方式开发人源化实验动物模型是动物模型未来的发展方向。其中基因人源化动物模型,即利用基因编辑技术,用人源正常或突变基因替换动物基因组的同源基因,可建立更接近人类生理或疾病特征的正常或突变基因动物模型。基因人源化动物不但本身具有重要应用价值,如通过基因人源化可改进和提升细胞或组织移植人源化动物模型,更重要的是,由于人类基因片段的插入,动物体内可表达或部分表达人源蛋白,可作为仅能识别人蛋白序列的药物的靶点,为在动物水平进行抗人抗体及其它药物的筛选提供了可能。然而,由于动物与人类在生理学及病理学方面存在差异,加上基因的复杂性,如何能构建出“有效”的人源化动物模型用于新药研发仍是最大的挑战。
鉴于CCR6/CCL20信号轴在肿瘤及自身免疫性疾病等治疗领域的巨大应用潜力,为进一步探索其相关生物学特性,提高临床前期药效试验的有效性,提高研发成功率,使临床前期的试验更有效并使研发失败最小化,本领域急需开发CCR6/CCL20信号通路的非人动物模型。此外,本方法得到的非人动物还可与其它基因人源化非人动物交配得到多基因人源化动物模型,用于筛选和评估针对该信号通路的人用药及联合用药的药效研究。本发明在学术和临床研究中具有广阔的应用前景。
发明内容
本发明的第一方面,提供了一种人源化CCR6基因,所述的人源化CCR6基因包含人CCR6基因的至少部分。
优选的,所述的人源化CCR6基因包含编码人CCR6蛋白的全部或部分核苷酸序列;进一步优选的,所述的人源化CCR6基因包含编码人CCR6蛋白的胞质区、胞外区和/或跨膜区的全部或部分核苷酸序列,更优选的,包含编码人CCR6蛋白的胞外区的全部或部分核苷酸序列。
优选的,所述的人源化CCR6基因包含与编码SEQ ID NO:2的核苷酸序列具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列或者包含编码SEQ IDNO:2的核苷酸序列。
优选的,所述的人源化CCR6基因编码人源化CCR6蛋白。
优选的,所述的人源化CCR6基因包含人CCR6基因的1号外显子至3号外显子的全部或部分,进一步优选的,包含人CCR6基因的2号至3号外显子的全部或部分,更优选的,包含人CCR6基因的2号和/或3号外显子的全部或部分,更进一步优选的,包含人CCR6基因的2号外显子的部分和3号外显子的部分,优选还包含2-3号内含子,其中,2号外显子的部分至少包含5bp的核苷酸序列,例如至少包含5、6、7、8、9、10、20、30、50、70、100、105、106bp的核苷酸序列;所述人CCR6基因的2号外显子的部分至少包含从起始密码子开始至2号外显子最后一个核苷酸为止,3号外显子的部分至少包含500bp的核苷酸序列,例如至少包含500、700、900、1000、1100、1110、1115、1116、1117、1118、1119、1120、1500、2000、2500、2700、2900、2902bp的核苷酸序列;3号外显子的部分至少包含从3号外显子第一个核苷酸开始至终止密码子为止。
在本发明的一个具体实施方式中,所述的人源化CCR6基因中包含的人CCR6基因选自下列组中的一种:
(A)包含SEQ ID NO:5所示核苷酸序列的全部或部分;
(B)包含与SEQ ID NO:5所示核苷酸序列的同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%的核苷酸序列;
(C)包含与SEQ ID NO:5示核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸的核苷酸序列;或,
(D)具有SEQ ID NO:5所示核苷酸序列的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
在本发明的一个具体实施方式中,所述的人源化CCR6基因转录的mRNA选自下列组中的一种:
(a)包含SEQ ID NO:12所示核苷酸序列的全部或部分;
(b)包含与SEQ ID NO:12所示核苷酸序列的同一性至少为75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%的核苷酸序列;
(c)包含与SEQ ID NO:12所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸的核苷酸序列;或
(d)包含SEQ ID NO:12所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
在本发明的一个具体实施方式中,所述的人源化CCR6基因还包括非人动物CCR6基因的1号外显子的全部和/或2号外显子的部分;优选的,所述的非人动物CCR6基因的1号外显子的全部和/或2号外显子的部分与NC_000083.7相应的1号外显子、2号外显子至少具有70%、80%、90%或至少95%的同一性;进一步优选的,所述的非人动物CCR6基因的1号外显子的全部、2号外显子的部分与NM_001190337.1相应的1号外显子、2号外显子一致。
优选的,所述的非人动物可以选自啮齿类动物、猪、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物,进一步优选的,所述的非人哺乳动物为啮齿类动物,更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物,进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子,更优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠,更进一步优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnull小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。
优选的,所述的人源化CCR6基因还包括特异性诱导物或阻遏物,进一步优选的,所述的特异性诱导物或阻遏物可以为常规可以诱导或阻遏的物质。
在本发明的一个具体实施方式中,所述的特异性诱导物选自四环素系统(Tet-OffSystem/Tet-On System)或他莫昔芬系统(Tamoxifen System)。
本发明的第二方面,提供了一种人源化CCR6蛋白,所述的人源化CCR6蛋白包含人CCR6蛋白的全部或部分。
优选的,所述的人源化CCR6蛋白包含人CCR6蛋白的胞质区、胞外区和/或跨膜区的全部或部分。
进一步优选的,所述的人源化CCR6蛋白包含人CCR6蛋白的胞外区的全部或部分。
优选的,所述的人源化CCR6蛋白是由上述的人源化CCR6基因编码的。
优选的,所述的人源化CCR6蛋白包含人CCR6基因的1号至3号外显子编码的氨基酸序列的全部或部分,进一步优选的,所述的人源化CCR6蛋白包含人CCR6基因的2号和/或3号外显子编码的氨基酸序列的全部或部分,更优选的,所述的人源化CCR6蛋白包含人CCR6基因的2号至3号外显子编码的氨基酸序列的全部或部分,更优选的,包含从人CCR6基因的起始密码子开始至终止密码子为止编码的氨基酸序列。
优选的,所述的人源化CCR6蛋白至少包含SEQ ID NO:5编码的氨基酸序列,或包含与SEQ ID NO:5编码的氨基酸序列具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%同一性的氨基酸序列。
在本发明的一个具体实施方式中,所述的人源化CCR6蛋白中包含的人CCR6蛋白的氨基酸序列包含下列组中的一种:
A)包含SEQ ID NO:2所示氨基酸序列的全部或部分;
B)包含SEQ ID NO:2所示氨基酸序列同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%的氨基酸序列;
C)包含SEQ ID NO:2所示所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸的氨基酸序列;或,
D)包含SEQ ID NO:2所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
本发明的第三方面,提供了一种靶向载体,所述的靶向载体包含人CCR6基因的至少部分。
优选的,所述的靶向载体包含人CCR6基因的部分;进一步优选的,所述的人CCR6基因的部分包含人CCR6基因的1号至3号外显子的全部或部分;更优选的,所述的人CCR6基因的部分包含人CCR6基因的2号至3号外显子的全部或部分,更进一步优选的,所述的人CCR6基因的部分包含人CCR6基因的2号和/或3号外显子的全部或部分,更进一步优选的,包含2号外显子的部分和3号外显子的部分,其中,2号外显子的部分至少包含5bp的核苷酸序列,例如至少包含5、6、7、8、9、10、20、30、50、70、100、105、106bp的核苷酸序列;所述人CCR6的基因的2号外显子的部分至少包含从起始密码子开始至2号外显子最后一个核苷酸为止,3号外显子的部分至少包含500bp的核苷酸序列,例如至少包含500、700、900、1000、1100、1110、1115、1116、1117、1118、1119、1120、1500、2000、2500、2700、2900、2902bp的核苷酸序列;3号外显子的部分至少包含从3号外显子第一个核苷酸开始至终止密码子为止,优选的,所述的靶向载体包含SEQ ID NO:5所示核苷酸序列。
优选的,所述的靶向载体还包含与待改变的转换区5’端同源的DNA片段,即5’臂(5’同源臂),其选自非人动物CCR6基因基因组DNA的100-10000个长度的核苷酸;优选的,所述的5’臂与NCBI登录号为NC_000083.7至少具有90%同源性的核苷酸;进一步优选的,所述5’臂序列与SEQ ID NO:3或SEQ ID NO:42至少具有90%同源性,或者如SEQ ID NO:3或SEQID NO:42所示。
优选的,所述的靶向载体还包含与待改变的转换区3’端同源的DNA片段,即3’臂(3’同源臂),其选自非人动物CCR6基因基因组DNA的100-10000个长度的核苷酸;优选的,所述的3’臂与NCBI登录号为NC_000083.7至少具有90%同源性的核苷酸;进一步优选的,所述的3’臂序列与SEQ ID NO:4或SEQ ID NO:43至少具有90%同源性,或者如SEQ ID NO:4或SEQ ID NO:43所示。
优选的,所述的靶向载体还包含标记基因,进一步优选的,所述标记基因为负筛选标记的编码基因,更进一步优选的,所述负筛选标记的编码基因为白喉毒素A亚基的编码基因(DTA)。
在本发明的一个具体实施方式中,所述的靶向载体中还包括阳性克隆筛选的抗性基因,进一步优选的,所述阳性克隆筛选的抗性基因为新霉素磷酸转移酶编码序列Neo。
在本发明的一个具体实施方式中,所述的靶向载体中还包括特异性重组系统,进一步优选的,所述特异性重组系统为Frt重组位点(也可选择常规的LoxP重组系统),所述的特异性重组系统为具有两个Frt重组位点,优选分别同向连接在抗性基因的两侧。
优选的,所述的待改变的转换区位于非人动物CCR6基因座上,进一步优选的,所述的待改变的转换区位于非人动物CCR6基因2号外显子上。优选的,所述的非人动物可以选自啮齿类动物、猪、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物,进一步优选的,所述的非人哺乳动物为啮齿类动物,更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物,进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子,更优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠,更进一步优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnull小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。
本发明的第四方面,提供了一种包含上述靶向载体的细胞。
本发明的第五方面,提供了上述靶向载体,或者上述的细胞在CCR6基因修饰中的应用,优选的,所述的应用包括但不限于插入、翻转、敲除或替换。
本发明的第六方面,提供了一种CCR6基因人源化的非人动物,所述的非人动物体内表达人或人源化CCR6蛋白。
优选的,所述的非人动物的内源CCR6蛋白表达降低或缺失。
优选的,所述的非人动物体内表达上述的人源化CCR6蛋白。
优选的,所述的人源化CCR6蛋白包含人CCR6基因的1号至3号外显子编码的氨基酸序列的全部或部分,进一步优选的,所述的人源化CCR6蛋白包含人CCR6基因的2号和/或3号外显子编码的氨基酸序列的全部或部分,更优选的,所述的人源化CCR6蛋白包含人CCR6基因的2号至3号外显子编码的氨基酸序列的全部或部分,更进一步优选的,所述的人源化CCR6蛋白包含从人CCR6基因的起始密码子开始至终止密码子为止编码的氨基酸序列。
优选的,所述的人源化CCR6蛋白至少包含SEQ ID NO:5编码的氨基酸序列,或包含与SEQ ID NO:5编码的氨基酸序列具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%同一性的氨基酸序列。
在本发明的一个具体实施方式中,所述的人源化CCR6蛋白中包含的人CCR6蛋白的氨基酸序列包含下列组中的一种:
A)包含SEQ ID NO:2所示氨基酸序列的全部或部分;
B)包含SEQ ID NO:2所示氨基酸序列同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%的氨基酸序列;
C)包含SEQ ID NO:2所示所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸的氨基酸序列;或
D)包含SEQ ID NO:2所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的非人动物体内的CCR6基因包含人或人源化CCR6基因。
优选的,所述的非人动物体内包含编码人CCR6蛋白的全部或部分核苷酸序列;进一步优选的,包含与编码SEQ ID NO:2的核苷酸序列具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列或者包含编码SEQ ID NO:2的核苷酸序列。
优选的,所述的非人动物体内包含人CCR6基因的1号外显子至3号外显子的全部或部分,进一步优选的,包含人CCR6基因的2号至3号外显子的全部或部分,更优选的,包含人CCR6基因的2号和/或3号外显子的全部或部分,更进一步优选的,包含人CCR6基因的2号外显子的部分和3号外显子的部分,优选还包含2-3号内含子,其中,2号外显子的部分至少包含5bp的核苷酸序列,例如至少包含5、6、7、8、9、10、20、30、50、70、100、105、106bp的核苷酸序列;所述人CCR6基因的2号外显子的部分至少包含从起始密码子开始至2号外显子最后一个核苷酸为止,3号外显子的部分至少包含500bp的核苷酸序列,例如至少包含500、700、900、1000、1100、1110、1115、1116、1117、1118、1119、1120、1500、2000、2500、2700、2900、2902bp的核苷酸序列;3号外显子的部分至少包含从3号外显子第一个核苷酸开始至终止密码子为止。
在本发明的一个具体实施方式中,所述的非人动物体内包含的人CCR6基因选自下列组中的一种:
(A)包含SEQ ID NO:5所示核苷酸序列的全部或部分;
(B)包含与SEQ ID NO:5所示核苷酸序列的同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%的核苷酸序列;
(C)包含与SEQ ID NO:5所示核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸的核苷酸序列;或,
(D)具有SEQ ID NO:5所示核苷酸序列的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
在本发明的一个具体实施方式中,所述的CCR6基因还包括非人动物CCR6基因的1号外显子的全部和/或2号外显子的部分;优选的,所述的非人动物CCR6基因的1号外显子的全部和/或2号外显子的部分与NC_000083.7相应的1号外显子、2号外显子至少具有70%、75%、80%、85%、90%或至少95%的同一性;进一步优选的,所述的非人动物CCR6基因的1号外显子的全部和/或2号外显子的部分与NM_001190337.1相应的1号外显子、2号外显子一致。
优选的,所述的非人动物的基因组中包含SEQ ID NO:44、45、46和/或47所示核苷酸序列。
优选的,所述的人源化CCR6基因还包括特异性诱导物或阻遏物,进一步优选的,所述的特异性诱导物或阻遏物可以为常规可以诱导或阻遏的物质。
在本发明的一个具体实施方式中,所述的特异性诱导物选自四环素系统(Tet-OffSystem/Tet-On System)或他莫昔芬系统(Tamoxifen System)。
优选的,所述人或人源化CCR6基因的核苷酸序列可操作地连接到至少一条染色体中内源性CCR6基因的内源调控元件。
根据本发明的一些实施例,所述的非人动物进一步包含其他基因修饰,所述其他基因选自PD-1、PD-L1、IL4、IL4R、IL6、IL6R、IL17、CCR4和CCR8中的至少一种。
根据本发明的一些实施例,所述人或人源化CCR6基因和/或所述其他基因对于内源被修饰基因座为纯合或杂合。
优选的,所述的非人动物可以选自啮齿类动物、猪、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物,进一步优选的,所述的非人哺乳动物为啮齿类动物,更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物,进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子,更优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠,更进一步优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnull小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。
本发明的第七方面,提供了一种CCR6基因人源化的非人动物的构建方法,所述的非人动物体内表达人或人源化CCR6蛋白,或者,所述的非人动物的基因组中包含人或人源化CCR6基因。
优选的,所述的人源化CCR6蛋白为上述的人源化CCR6蛋白,优选的,包含SEQ IDNO:2或与SEQ ID NO:2同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%的氨基酸序列。
优选的,所述的人源化CCR6基因为上述的人源化CCR6基因。
优选的,所述的非人动物为上述的CCR6基因人源化的非人动物。
优选的,所述的构建方法包括用包含人CCR6基因的1号至3号外显子的全部或部分导入非人动物CCR6基因座,进一步优选的,用包含人CCR6基因的2号至3号外显子的全部或部分导入非人动物CCR6基因座,更优选的,用包含人CCR6基因的2号和/或3号外显子的全部或部分导入非人动物CCR6基因座,更进一步优选的,用包含人CCR6的基因的2号外显子的部分和3号外显子的部分核苷酸序列导入非人动物基因座,进一步优选的,包含2-3号内含子;其中,2号外显子的部分至少包含5bp的核苷酸序列,例如至少包含5、6、7、8、9、10、20、30、50、70、100、105、106bp的核苷酸序列;所述人CCR6基因的2号外显子的部分至少包含从起始密码子开始至2号外显子最后一个核苷酸为止,3号外显子的部分至少包含500bp的核苷酸序列,例如至少包含500、700、900、1000、1100、1110、1115、1116、1117、1118、1119、1120、1500、2000、2500、2700、2900、2902bp的核苷酸序列;3号外显子的部分至少包含从3号外显子第一个核苷酸开始至终止密码子为止,优选的,用包含SEQ ID NO:5的核苷酸序列导入至非人动物基因座上。
优选的,本申请中所述的导入包括但不限于插入、替换或转基因。
优选的,所述的人或人源化CCR6基因可操作连接到至少一条染色体上内源CCR6基因的内源调控元件。
所述的人或人源化CCR6基因在非人动物中通过调控元件进行调控。所述的调控元件包括但不限于内源启动子,所述的调控元件可以是内源或者外源的。例如,所述的外源性调控元件可以来自人CCR6基因。
在本发明的一个具体实施方式中,所述的内源调控元件来自非人动物CCR6基因。
优选的,所述的导入的位置位于CCR6基因的内源调控元件之后。
优选的,所述的导入为替换或插入,在本发明的一个具体实施方式中,所述的导入非人动物CCR6基因座为替换非人动物相应区域,进一步优选的,非人动物CCR6基因的1号至2号外显子的全部或部分被替换,更进一步优选的,非人动物CCR6基因的2号外显子的部分被替换,其中,所述非人动物CCR6基因的2号外显子的部分至少包含从非人动物CCR6基因的起始密码子至终止密码子,优选至少包含2号外显子5’-3’的500-1179bp的核苷酸序列,具体为2号外显子长度为500、700、900、1000、1100、1101、1102、1103、1104、1105、1106、1107、1108、1109、1110或1179bp的核苷酸序列。
优选的,编码SEQ ID NO:1的核苷酸序列被替换。
优选的,所述的构建方法包括用包含编码人CCR6蛋白的全部或部分核苷酸序列导入非人动物CCR6基因座,进一步优选的,用包含与编码SEQ ID NO:2的核苷酸序列具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列或者包含编码SEQ IDNO:2的核苷酸序列插入或替换到非人动物CCR6基因座上。
优选的,所述的构建方法包括用包含所述人或人源化CCR6基因的核苷酸序列插入或替换到非人动物CCR6基因座上。
优选的,所述的插入为首先破坏非人动物内源CCR6基因的编码框,随后进行插入操作,或者所述的插入步骤既可给内源CCR6基因造成移码突变又可以实现插入人源序列的步骤。
优选的,所述的非人动物中至少一个细胞表达人CCR6蛋白或人源化CCR6蛋白。
优选的,使用上述的靶向载体进行非人动物的构建。
优选的,为提高重组效率,还可以使用靶向CCR6基因的sgRNA与上述靶向载体一起进行非人动物的构建。其中,所述的sgRNA靶向非人动物CCR6基因,同时所述sgRNA的序列在待改变的CCR6基因上的靶序列上。
优选的,所述sgRNA的5’端靶位点位于CCR6基因的2号外显子序列上。
优选的,所述sgRNA的3’端靶位点位于CCR6基因的2号外显子序列上。
优选的,所述的sgRNA的5’端靶位点序列如SEQ ID NO:6-11任一项所示。
优选的,所述的sgRNA的3’端靶位点序列如SEQ ID NO:13-17任一项所示。
在本发明的一个具体实施方式中,所述的构建方法包括将上述靶向载体、靶向CCR6基因的sgRNA及Cas9导入非人动物细胞中,培养该细胞(优选为受精卵),然后将培养后的细胞移植至雌性非人动物输卵管内,允许其发育,鉴定筛选获得CCR6基因人源化的非人动物。
根据本发明的一些实施例,该构建方法进一步包括:将CCR6基因人源化的非人动物与其他基因修饰的非人动物交配、体外受精或直接进行基因编辑,并进行筛选,得到多基因修饰的非人动物。
优选的,所述的其他基因为PD-1、PD-L1、IL4、IL4R、IL6、IL6R、IL17、CCR4和CCR8中的至少一种基因。
优选的,所述的非人动物还表达人或人源化的PD-1、PD-L1、IL4、IL4R、IL6、IL6R、IL17、CCR4和CCR8蛋白中的至少一种。
优选的,所述的多基因修饰的非人动物的基因组中修饰的多个基因中的每一个基因均对于内源被修饰基因座为纯合或杂合的。
本发明的第八方面,提供了一种CCR6基因敲除的非人动物,所述的非人动物缺失CCR6基因的全部或部分核苷酸序列。
优选的,所述的非人动物缺失CCR6基因的2号外显子的全部或部分,其中缺失的2号外显子的部分至少包含从非人动物CCR6基因的起始密码子至终止密码子,优选至少包含2号外显子5’-3’的500-1179bp的核苷酸序列具体为2号外显子5’端长度为500、700、900、1000、1100、1101、1102、1103、1104、1105、1106、1107、1108、1109、1110或1179bp的核苷酸序列。
优选的,所述的非人动物可以选自啮齿类动物、猪、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物。进一步优选的,所述的非人哺乳动物为啮齿类动物。更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物。进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子。更进一步优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠。最为优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnull小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。
本发明的第九方面,提供了一种CCR6基因敲除的非人动物的构建方法,使用sgRNA进行非人动物的构建。其中,所述的sgRNA靶向非人动物CCR6基因,同时所述sgRNA的序列在待改变的CCR6基因上的靶序列上是唯一的。
优选的,所述sgRNA的靶位点位于CCR6基因的1号外显子至2号外显子序列上。进一步优选的,所述sgRNA的5’端靶位点位于CCR6基因的2号外显子序列上,更优选的,所述sgRNA的3’端靶位点位于CCR6基因的2号外显子序列上。
优选的,所述的sgRNA的5’端靶位点序列如SEQ ID NO:6-11任一项所示。
优选的,所述的sgRNA的3’端靶位点序列如SEQ ID NO:13-17任一项所示。
本发明的第十方面,提供了一种sgRNA,所述的sgRNA靶向非人动物CCR6基因,同时所述sgRNA的序列在待改变的CCR6基因上的靶序列上。
优选的,所述sgRNA的靶位点位于CCR6基因的2号外显子上。进一步优选的,所述sgRNA的5’端靶位点位于CCR6基因的2号外显子序列上,更优选的,所述sgRNA的3’端靶位点位于CCR6基因的2号外显子序列上。
优选的,所述的sgRNA的5’端靶位点序列如SEQ ID NO:6-11任一项所示。
优选的,所述的sgRNA的3’端靶位点序列如SEQ ID NO:13-17任一项所示。
本发明的第十一方面,提供了一种编码上述sgRNA的DNA分子。优选的,所述的DNA分子双链分别为上述sgRNA的上下游序列,或者加入酶切位点后的正反向寡核苷酸序列。
在本发明的一个具体实施方式中,所述的DNA分子双链分别为SEQ ID NO:18和SEQID NO:20,SEQ ID NO:19和SEQ ID NO:21。
在本发明的一个具体实施方式中,所述的DNA分子双链分别为SEQ ID NO:22和SEQID NO:24,SEQ ID NO:23和SEQ ID NO:25。
本发明的第十二方面,提供了一种sgRNA载体,所述的sgRNA载体包含上述sgRNA。
本发明的第十三方面,提供了一种包含上述靶向载体、上述sgRNA、上述DNA分子或上述sgRNA载体的细胞。
本发明的第十四方面,提供了一种上述靶向载体、上述sgRNA、上述DNA分子、上述sgRNA载体或上述的细胞在CCR6基因修饰中的应用。优选包含在敲除、插入或替换CCR6基因中的应用。
本发明的第十五方面,提供了一种多基因修饰的非人动物的构建方法,包括如下步骤:
I)提供上述的CCR6基因人源化的非人动物或CCR6基因敲除的非人动物,或者采用上述的构建方法获得的CCR6基因人源化的非人动物;
II)将步骤I)提供的非人动物与其他基因修饰的非人动物交配、体外受精或直接进行基因编辑,并进行筛选,得到多基因修饰的非人动物。
优选的,所述的其他基因修饰的非人动物包括但不限于基因PD-1、PD-L1、IL4、IL4R、IL6、IL6R、IL17、CCR4或CCR8修饰的非人动物。
优选的,所述的多基因修饰的非人动物为双基因人源化非人动物、三基因人源化非人动物、四基因人源化非人动物、五基因人源化非人动物、六基因人源化非人动物、七基因人源化非人动物、八基因人源化非人动物或九基因人源化非人动物。
优选的,所述的多基因修饰的非人动物的基因组中人源化的多个基因中的每一个基因均可以是纯合或杂合的。
本发明的第十六方面,提供了一种上述构建方法获得的非人动物或其子代,所述的非人动物或其子代选自CCR6基因人源化的非人动物、CCR6基因敲除的非人动物或者多基因修饰的非人动物。
本发明的第十七方面,提供了一种疾病动物模型,所述的动物模型来源于上述的非人动物、上述的构建方法获得的非人动物,或者,上述的非人动物或其子代,优选的,所述的疾病包括自身免疫性疾病、肿瘤或炎症。
本发明的第十八方面,提供了一种疾病动物模型的制备方法,所述的制备方法包括上述CCR6基因人源化的非人动物、CCR6基因敲除的非人动物或多基因修饰的非人动物的步骤;优选的,所述的疾病包括自身免疫性疾病、肿瘤或炎症,进一步优选的,还包括植入肿瘤细胞的步骤。
本发明的第十九方面,提供了上述CCR6基因人源化的非人动物、上述CCR6基因敲除的非人动物、上述构建方法获得的CCR6基因人源化的非人动物、上述CCR6基因敲除的非人动物或多基因修饰的非人动物或其子代在制备疾病动物模型中的应用,优选的,所述的疾病包括自身免疫性疾病、肿瘤或炎症。
本发明的第二十方面,提供了上述的非人动物、上述的非人动物或其子代、上述的构建方法获得的非人动物或上述的疾病动物模型在制备治疗自身免疫性疾病、肿瘤和/或炎症的药物中的应用。
本发明的第二十一方面,提供了一种细胞或细胞系或原代细胞培养物,所述细胞或细胞系或原代细胞培养物来源于上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代或者上述的疾病动物模型。优选的,所述的细胞或细胞系或原代细胞培养物不能发育为动物个体。
本发明的第二十二方面,提供了一种组织或器官或其培养物,所述组织或器官或其培养物来源于上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代或者上述的疾病动物模型。优选的,所述的组织或器官或其培养物不能发育为动物个体。
优选的,所述组织为瘤组织。
本发明的第二十三方面,提供了一种荷瘤后的瘤组织,所述的瘤组织包含上述的人源化CCR6蛋白或上述的人源化CCR6基因。
优选的,所述的瘤组织来源于上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代,或者上述的疾病动物模型。优选的,所述的荷瘤后的瘤组织不能发育为动物个体。
本发明的第二十四方面,提供了一种CCR6基因人源化的细胞,所述的细胞表达人CCR6蛋白或人源化CCR6蛋白。
优选的,所述的人源化CCR6蛋白选自上述的人源化CCR6蛋白。
优选的,所述的细胞中内源CCR6蛋白的表达降低或缺失。
优选的,所述的细胞的基因组中包含人CCR6基因的部分,进一步优选的,所述的细胞包含上述的人源化CCR6基因。优选的,所述的细胞不能发育为动物个体。
本发明的第二十五方面,提供了一种CCR6基因敲除的细胞,所述的细胞中缺失CCR6基因的全部或部分核苷酸序列。
优选的,所述的细胞缺失CCR6基因的2号外显子的全部或部分核苷酸序列,其中缺失的2号外显子的部分至少包含从非人动物CCR6基因的起始密码子至终止密码子,优选至少包含2号外显子5’-3’的500-1179bp的核苷酸序列具体为2号外显子5’端开始至长度为500、700、900、1000、1100、1101、1102、1103、1104、1105、1106、1107、1108、1109、1110或1179bp的核苷酸序列。优选的,所述的细胞不能发育为动物个体。
本发明的第二十六方面,提供了一种表达上述的人源化CCR6蛋白的构建体,优选的,所述的构建体中包含上述人源化CCR6基因。
本发明的第二十七方面,提供了一种包含上述构建体的细胞。优选的,所述的细胞不能发育为动物个体。
本发明的第二十八方面,提供了一种包含上述细胞的组织。优选的,所述的组织不能发育为动物个体。
本发明的第二十九方面,提供了来源于上述的人源化CCR6蛋白、上述的人源化CCR6基因、上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代、上述的疾病动物模型、上述的细胞或细胞系或原代细胞培养物、上述的组织或器官或其培养物、上述的荷瘤后的瘤组织、上述的细胞、上述的构建体、上述的细胞或上述的组织的应用,所述的应用包括:
在需要涉及人类细胞的免疫过程的产品开发,制造抗体,或者作为药理学、免疫学、微生物学、医学研究的模型系统中的应用;
在生产和利用动物实验疾病模型,用于开发新的诊断策略和/或治疗策略中的应用;
或者,
在筛选、验证、评价或研究CCR6功能、人CCR6信号机理、靶向人的抗体、靶向人的药物、药效,免疫相关疾病药物以及抗肿瘤或抗炎症药物,筛选和评估人用药及药效研究方面的应用。优选的,所述应用不是疾病的治疗和/或诊断方法。
本发明的第三十方面,提供了上述CCR6基因人源化的非人动物、上述CCR6基因敲除的非人动物、上述构建方法获得的CCR6基因人源化的非人动物、上述CCR6基因敲除的非人动物或多基因修饰的非人动物或其子代在制备人CCR6特异性调节剂或者筛选人CCR6特异性调节剂的产品中的应用。
本发明的第三十一方面,提供了一种人CCR6特异性调节剂的筛选方法,所述的筛选方法包括向个体施加调节剂,检测调节效果;其中,所述的个体选自上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代,或者上述的疾病模型。
优选的,所述的调节剂选自CAR-T、药物,进一步优选的,所述的药物为抗体。
优选的,所述的调节剂为单抗或双特异性抗体或两种及两种以上药物的联合使用。
优选的,所述的筛选方法还包括向个体植入肿瘤的步骤。
优选的,所述检测包括测定肿瘤细胞的大小和/或增殖速率。
优选的,所述检测的方法包括游标卡尺测量、流式细胞检测和/或动物活体成像检测。
优选的,所述的检测包括评估个体体重、脂肪量、活化途径、神经保护活性或代谢变化,所述的代谢变化包括食物消耗或水消耗的变化。
优选的,所述的肿瘤细胞来源于人或非人动物。
优选的,所述人CCR6特异性调节剂的筛选方法不是治疗方法。该方法用来筛选或评价药物,对候选药物的药效进行检测和比较,以确定哪些候选药物可以作为药物,哪些不能作为药物,或者,比较不同药物的药效敏感程度,即治疗效果不是必然的,只是一种可能性。
本发明的第三十二方面,提供了一种干预方案的评价方法,所述的评价方法包括向个体施加干预方案,对施加干预方案后的个体进行调节效果检测和评价;其中,所述的个体选自上述的非人动物,上述的构建方法获得的非人动物,上述的非人动物或其子代,或者上述的疾病动物模型。
优选的,所述的评价方法还包括向个体植入肿瘤细胞。
优选的,所述的干预方案选自CAR-T、药物治疗,进一步优选的,所述的药物为抗原结合蛋白,所述的抗原结合蛋白为抗体。
优选的,所述的肿瘤细胞来源于人或非人动物。
优选的,所述干预方案的评价方法不是治疗方法,该评价方法对干预方案的效果进行检测和评价,以确定该干预方案是否有治疗效果,即治疗效果不是必然的,只是一种可能性。
本发明的第三十三方面,提供了一种来源于上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代或疾病动物模型在制备治疗肿瘤、炎症或自身免疫性疾病的药物中的用途。
本发明所述的“替换”指将外源遗传物质置于内源基因座处,从而用直系同源或同源核酸序列替换内源基因的全部或一部分。在一个实例中,用相应的人基因或其片段替换内源非人基因或其片段。相应的人基因或其片段是作为被替换的内源非人基因或其片段的直系同源物或同系物,或在结构和/或功能上与被替换的内源非人基因或其片段基本上同一或相同的人基因或片段。在另一个实施例中,在删除内源基因或使内源基因成为非功能性(诸如通过插入错义突变或过早终止密码子)并将相应的人基因或其片段在分开的位置处插入种系中时能发生基因替换。
本发明所述的“转基因”指通过人工干预将外源遗传物质插入细胞基因组内,诸如通过显微注射或通过用重组病毒感染直接或间接引入前体细胞内,在掺入外源遗传物质后,在细胞内诱导遗传改变,其中,在此过程中用于稳定整合的载体包括:质粒、逆转录病毒载体和其他动物病毒、YAC(酵母人工染色体)、BAC(细菌人工染色体)等。
本发明所述的“肿瘤”包括但不限于淋巴瘤、B细胞肿瘤、T细胞肿瘤、骨髓/单核细胞肿瘤、非小细胞肺癌、白血病、卵巢癌、鼻咽癌、乳腺癌、子宫内膜癌、结肠癌、直肠癌、胃癌、膀胱癌、肺癌、支气管癌、骨癌、前列腺癌、胰腺癌、肝和胆管癌、食管癌、肾癌、甲状腺癌、头颈部癌、睾丸癌、胶质母细胞瘤、星形细胞瘤、黑色素瘤、骨髓增生异常综合征、以及肉瘤。其中,所述的白血病选自急性淋巴细胞性(成淋巴细胞性)白血病、急性骨髓性白血病、髓性白血病、慢性淋巴细胞性白血病、多发性骨髓瘤、浆细胞白血病、以及慢性骨髓性白血病;所述淋巴瘤选自霍奇金淋巴瘤和非霍奇金淋巴瘤,包括B细胞淋巴瘤、弥漫性大B细胞淋巴瘤、滤泡性淋巴瘤、套细胞淋巴瘤、边缘区B细胞淋巴瘤、T细胞淋巴瘤、和瓦尔登斯特伦巨球蛋白血症;所述肉瘤选自骨肉瘤、尤文肉瘤、平滑肌肉瘤、滑膜肉瘤、软组织肉瘤、血管肉瘤、脂肪肉瘤、纤维肉瘤、横纹肌肉瘤、及软骨肉瘤。在本发明的一个具体实施方式中,所述的肿瘤选自B细胞肿瘤、T细胞肿瘤、骨髓/单核细胞肿瘤。优选包括B或T细胞急性淋巴细胞白血病(ALL)、急性髓细胞白血病(AML)、非霍奇金淋巴瘤(NHL)和多发性骨髓瘤(MM)、鼻咽癌、肺癌。
本发明所述的“自身免疫性疾病”包括但不限于过敏、哮喘、心肌炎、肾炎、肝炎、系统性红斑狼疮、类风湿性关节炎、硬皮病、甲状腺功能亢进、原发性血小板减少性紫癜、自身免疫性溶血性贫血、溃疡性结肠炎、自身免疫性肝病、糖尿病、疼痛或神经障碍等。
本发明所述的“炎症”包括急性炎症,也包括慢性炎症。具体的,包括但不限于变质性炎症、渗出性炎症(浆液性炎、纤维素性炎、化脓性炎、出血性炎、坏死性炎、卡他性炎)、增生性炎症、特异性炎症(结核、梅毒、麻疯、淋巴肉芽肿等)。
本发明保护的主题“细胞”、“细胞或细胞系或原代细胞培养物”、“组织”、“组织或器官或其培养物”均不能发育为动物,其中,所述的细胞不是干细胞或受精卵细胞,所述的细胞可以是体细胞、淋巴细胞(优选为T细胞或B细胞)或肿瘤细胞等等,所述的组织可以是脾脏、淋巴结、骨髓、肿瘤或其培养物等等。
本发明所述的CCR6基因人源化的非人动物体内可以正常表达人CCR6蛋白或人源化CCR6蛋白。可用于针对人CCR6靶位点的药物筛选、药效评估、炎症、自身免疫性疾病和肿瘤治疗,可以加快新药研发过程、节约时间和成本。对于研究CCR6蛋白功能及相关疾病药物筛选提供了有效的保障。
本发明所述的“全部或部分”,“全部”为整体,“部分”为整体中的局部,或者组成整体的个体。
本发明所述的“人源化CCR6蛋白”,包含来源于人CCR6蛋白的部分。其中,所述的“人CCR6蛋白”同“人CCR6蛋白的全部”,即其氨基酸序列与人CCR6蛋白的全长氨基酸序列一致。所述的“人CCR6蛋白的部分”,为连续或间隔的5-374个(优选为10-374个)氨基酸序列与人CCR6蛋白的氨基酸序列一致或与人CCR6蛋白的氨基酸序列具有70%以上同源性。
本发明所述的“人源化CCR6基因”,包含来源于人CCR6基因的部分和非人CCR6基因的部分。其中,所述的“人CCR6基因”同“人CCR6基因的全部”,即其核苷酸序列与人CCR6基因的全长核苷酸序列一致。所述的“人CCR6基因的部分”为连续或间隔的20-27347bp(优选为20-1125bp)个核苷酸序列与人CCR6基因一致或与人CCR6基因具有70%以上同源性。
本发明所述的“xx号至xxx号外显子”或“xx号至xxx号外显子的全部”包含外显子及其期间的内含子的核苷酸序列,例如所述的“2号至3号外显子”包含1号外显子、2-3号内含子、3号外显子的全部核苷酸序列。
本发明所述的“x-xx号内含子”表示x号外显子与xx号外显子之间的内含子。例如“2-3号内含子”表示2号外显子与3号外显子之间的内含子。
本发明所述的“外显子的部分”表示连续或间隔几个、几十个或几百个核苷酸序列与全部的外显子核苷酸序列一致。例如人CCR6基因的3号外显子的部分,包含连续或间隔的5-2325bp个,优选10-1116bp个核苷酸序列与人CCR6基因的3号外显子核苷酸序列一致。在本发明的一个具体实施方式中,所述的“人源化CCR6基因”中包含的“3号外显子的部分”至少包括从3号外显子第一个核苷酸开始至终止密码子为止。
本发明所述的“基因座”广义上讲代表基因在染色体上所占的位置,狭义上讲代表某一基因上的一段DNA片段,即可以是一个基因也可以是一个基因的一部分。例如所述的“CCR6基因座”表示CCR6基因1号至2号外显子上的任选一段的DNA片段。优选为1号外显子、2号外显子或其期间的内含子中的任一个或两个或多个的组合,或一个或两个或多个的全部或部分,更优选为CCR6基因的2号外显子上。
本发明所述的“核苷酸序列”包含天然的或经过修饰的核糖核苷酸序列、脱氧核糖核苷酸序列。优选为DNA、cDNA、pre-mRNA、mRNA、rRNA、hnRNA、miRNAs、scRNA、snRNA、siRNA、sgRNA、tRNA。
本发明所述的“治疗”表示减缓、中断、阻止、控制、停止、减轻、或逆转一种体征、症状、失调、病症、或疾病的进展或严重性,但不一定涉及所有疾病相关体征、症状、病症、或失调的完全消除,且是指在疾病已开始发展后改善疾病或病理状态的体征、症状等等的治疗干预。
本发明所述的“同源性”,是指在使用氨基酸序列或核苷酸序列的方面,本领域技术人员在保证与已知序列相似结构或功能的前提下,可以根据实际工作需要对序列进行调整,使使用序列与现有技术获得的序列相比,具有(包括但不限于)1%,2%,3%,4%,5%,6%,7%,8%,9%,10%,11%,12%,13%,14%,15%,16%,17%,18%,19%,20%,21%,22%,23%,24%,25%,26%,27%,28%,29%,30%,31%,32%,33%,34%,35%,36%,37%,38%,39%,40%,41%,42%,43%,44%,45%,46%,47%,48%,49%,50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,70%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.1%,99.2%,99.3%,99.4%,99.5%,99.6%,99.7%,99.8%,99.9%的同一性。
在一个方面,所述非人动物是哺乳动物。优选的,所述非人动物是小型哺乳动物,例如跳鼠科。
在一个实施方式中,所述非人动物是啮齿动物。在一个实施方式中,所述啮齿动物选自小鼠、大鼠和仓鼠。在一个实施方式中,所述啮齿动物选自鼠家族。在一个实施方式中,所述基因修饰的动物来自选自丽仓鼠科(例如小鼠样仓鼠)、仓鼠科(例如仓鼠、新世界大鼠和小鼠、田鼠)、鼠总科(真小鼠和大鼠、沙鼠、刺毛鼠、冠毛大鼠)、马岛鼠科(登山小鼠、岩小鼠、有尾大鼠、马达加斯加大鼠和小鼠)、刺睡鼠科(例如多刺睡鼠)和鼹形鼠科(例如摩尔大鼠、竹大鼠和鼢鼠)家族。在一个特定实施方式中,所述基因修饰的啮齿动物选自真小鼠或大鼠(鼠总科)、沙鼠、刺毛鼠和冠毛大鼠。在一个实施方式中,所述基因修饰的小鼠来自鼠科家族成员。在一个实施方式中,所述动物是啮齿动物。在一个特定实施方式中,所述啮齿动物选自小鼠和大鼠。在一个实施方式中,所述非人动物是小鼠。
在一个特定实施方式中,所述非人动物是啮齿动物,其为选自BALB/c、A、A/He、A/J、A/WySN、AKR、AKR/A、AKR/J、AKR/N、TA1、TA2、RF、SWR、C3H、C57BR、SJL、C57L、DBA/2、KM、NIH、ICR、CFW、FACA、C57BL/A、C57BL/An、C57BL/GrFa、C57BL/KaLwN、C57BL/6、C57BL/6J、C57BL/6ByJ、C57BL/6NJ、C57BL/10、C57BL/10ScSn、C57BL/10Cr和C57BL/Ola的C57BL、C58、CBA/Br、CBA/Ca、CBA/J、CBA/st、CBA/H品系的小鼠及NOD、NOD/SCID、NOD-Prkdcscid IL-2rgnull背景的小鼠。
本领域的技术人员能够确定并比较序列元件或同一性程度,以区分另外的小鼠和人序列。
除非特别说明,本发明的实践将采取细胞生物学、细胞培养、分子生物学、转基因生物学、微生物学、重组DNA和免疫学的传统技术。这些技术在以下文献中进行了详细的解释。例如:MolecularCloning A Laboratory Manual,2ndEd.,ed.By Sambrook,FritschandManiatis(Cold Spring Harbor Laboratory Press:1989);DNA Cloning,Volumes I and II(D.N.Glovered.,1985);OligonucleotideSynthesis(M.J.Gaited.,1984);Mullisetal.U.S.Pat.No.4,683,195;Nucleic Acid Hybridization(B.D.Hames&S.J.Higginseds.1984);Transcription And Translation(B.D.Hames&S.J.Higginseds.1984);Culture Of Animal Cells(R.I.Freshney,AlanR.Liss,Inc.,1987);Immobilized Cells And Enzymes(IRL Press,1986);B.Perbal,A PracticalGuide To Molecular Cloning(1984);the series,Methods In ENZYMOLOGY(J.Abelsonand M.Simon,eds.inchief,Academic Press,Inc.,New York),specifically,Vols.154and 155(Wuetal.eds.)and Vol.185,″Gene Expression Technology″(D.Goeddel,e d.);Gene Transfer Vectors For Mammalian Cells(J.H.Miller andM.P.Caloseds.,1987,Cold Spring Harbor Laboratory);Immunochemical Methods InCell And Molecular Biology(Mayer and Walker,eds.,Academic Press,London,1987);Handbook Of Experimental Immunology,Volumes V(D.M.Weir and C.C.Blackwell,eds.,1986);and Manipulating the Mouse Embryo,(Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,N.Y.,1986)。
以上只是概括了本发明的一些方面,不是也不应该认为是在任何方面限制本发明。
本说明书提到的所有专利和出版物都是通过参考文献作为整体而引入本发明的。本领域的技术人员应认识到,对本发明可作某些改变并不偏离本发明的构思或范围。
下面的实施例进一步详细说明本发明,不能认为是限制本发明或本发明所说明的具体方法的范围。
附图说明
以下,结合附图来详细说明本发明的实施例,其中:
图1:小鼠CCR6基因座和人CCR6基因座对比示意图(非按比例);
图2:小鼠CCR6基因人源化改造示意图(非按比例);
图3:CCR6基因打靶策略及靶向载体V1设计示意图(非按比例);
图4:Cas9/sgRNA活性检测结果,其中Con为空白对照,PC为阳性对照;
图5:F0代小鼠基因型鉴定结果,其中WT为野生型对照,H2O为水对照;
图6:F1代小鼠基因型鉴定结果,其中WT为野生型对照,PC为阳性对照,H2O为水对照;
图7:Southern blot检测结果,其中WT为野生型对照;
图8:C57BL/6野生型小鼠(+/+)和CCR6基因人源化纯合子小鼠(H/H)脾脏中CCR6mRNA检测结果,H2O为水对照;
图9:基因敲除小鼠鼠尾PCR鉴定结果,其中WT为野生型,PC为阳性对照,H2O为水对照。
图10:CCR6基因打靶策略及靶向载体V2设计示意图(非按比例);
图11:CCR6基因人源化小鼠FRT重组过程示意图(非按比例);
图12:F1代小鼠基因型鉴定结果,其中WT为野生型对照,H2O为水对照。
具体实施方式
下面结合具体实施例来进一步描述本发明,本发明的优点和特点将会随着描述而更为清楚。但这些实施例仅是范例性的,并不对本发明的范围构成任何限制。本领域技术人员应该理解的是,在不偏离本发明的精神和范围下可以对本发明技术方案的细节和形式进行修改或替换,但这些修改和替换均落入本发明的保护范围内。
在下述每一实施例中,设备和材料是从以下所指出的几家公司获得:
BbsI、EcoRI、BamHI、BclI、NcoI酶购自NEB,货号分别为R0539L、R0101M、R0136M、R0160S、R0193M;
C57BL/6小鼠购自中国食品药品检定研究院国家啮齿类实验动物种子中心;
Ambion体外转录试剂盒购自Ambion,货号AM1354;
Cas9mRNA来源SIGMA,货号CAS9MRNA-1EA;
UCA试剂盒来源百奥赛图公司,货号BCG-DX-001;
Brilliant Violet 510TM anti-mouse CD45 Antibody购自Biolegend,货号103138;
PerCP/Cy5.5 anti-mouse TCRβchain购自Biolegend,货号560455;
FITC anti-Mouse CD19 Antibody购自Biolegend,货号115506;
APC Armenian Hamster IgG Isotype Ctrl购自Biolegend,货号400912;
APC anti-mouse CD196(CCR6)Antibody购自Biolegend,货号129813;
PE anti-human CD196(CCR6)Antibody购自Biolegend,货号353409;
PE Rat IgG2b,κIsotype Ctrl Antibody购自Biolegend,货号400608。
实施例1 CCR6基因人源化小鼠
小鼠CCR6基因(NCBI Gene ID:12458,Primary source:MGI:1333797,UniProt:O54689,位于17号染色体NC_000083.7的第8454875至8477353位,基于转录本NM_001190337.1及其编码蛋白NP_001177266.1(SEQ ID NO:1))和人CCR6基因(NCBI Gene ID:1235,Primary source:HGNC:1607,UniProt ID:P51684,位于6号染色体NC_000006.12的第167111795至167139141位,基于转录本NM_031409.3及其编码蛋白NP_113597.2(SEQ IDNO:2))对比示意图如图1所示。
为了达到本发明的目的,可在小鼠内源CCR6基因座引入编码人CCR6蛋白的核苷酸序列,使得该小鼠表达人或人源化CCR6蛋白。具体来说,使用基因编辑技术在小鼠CCR6基因调节元件的控制下,用编码人CCR6蛋白的核苷酸序列替换小鼠相应序列,得到人源化CCR6基因座示意图如图2所示,实现对小鼠CCR6基因的人源化改造。
进一步设计如图3所示的打靶策略示意图,图中显示了靶向载体V1上含有小鼠CCR6基因的上游和下游的同源臂序列,以及包含编码人CCR6蛋白的核苷酸序列的A片段。其中,上游同源臂序列(5’同源臂,SEQ ID NO:42)与NCBI登录号为NC_000083.7的第8470856至8474796位核苷酸序列相同,下游同源臂序列(3’同源臂,SEQ ID NO:43)与NCBI登录号为NC_000083.7的第8476674至8480827位核苷酸序列相同;A片段上包含的人CCR6基因序列如SEQ ID NO:5所示;A片段中人CCR6序列上游与小鼠的连接设计为 其中序列“cagga”的最后一个“a”是小鼠的最后一个核苷酸,序列中的第一个“a”是人的第一个核苷酸;人CCR6序列下游与小鼠的连接设计为 其中序列“atgtga”的最后一个“a”是人的最后一个核苷酸,序列中的第一个“c”是小鼠的第一个核苷酸。
靶向载体V1上还包括用于阳性克隆筛选的抗性基因,即新霉素磷酸转移酶编码序列Neo,并在抗性基因的两侧装上两个同向排列的位点特异性重组系统Frt重组位点,组成Neo盒(Neocassett e)。其中Neo盒5’端与小鼠基因的连接设计为 其中序列“ggtcac”中的最后一个“c”是小鼠的最后一个核苷酸,序列中的“G”是Neo盒的第一个核苷酸;Neo盒3’端与小鼠基因的连接设计为 其中序列“GATCC”中的最后一个“C”是Neo盒的最后一个核苷酸,序列中的“c”是小鼠的第一个核苷酸。此外,还在靶向载体3’同源臂下游构建了具有负筛选标记的编码基因(白喉毒素A亚基的编码基因(DTA))。改造后的人源化小鼠CCR6的mRNA序列如SEQ ID NO:12所示,表达的蛋白序列如SEQ ID NO:2所示。
靶向载体构建可采用常规方法进行,如酶切连接等。构建好的靶向载体通过酶切进行初步验证后,再送测序公司进行测序验证。将测序验证正确的靶向载体电穿孔转染入C57BL/6小鼠的胚胎干细胞中,利用阳性克隆筛选标记基因对得到的细胞进行筛选,并利用PCR和Southern Blot技术进行检测确认外源基因的整合情况,筛选出正确的阳性克隆细胞。将筛选出的正确阳性克隆细胞(黑色鼠)按照本领域已知的技术导入已分离好的囊胚中(白色鼠),得到的嵌合囊胚转移至培养液中短暂培养后移植至受体母鼠(白色鼠)的输卵管,可生产F0代嵌合体鼠(黑白相间)。将F0代嵌合鼠与野生型鼠回交获得F1代鼠,再将F1代杂合小鼠互相交配即可获得F2代纯合子鼠。还可将阳性鼠与Flp工具鼠交配去除阳性克隆筛选标记基因(该过程示意图见图11)后,再通过互相交配即可得到CCR6基因人源化纯合子小鼠。可通过PCR引物对L-GT-F/L-GT-R鉴定子代小鼠体细胞的基因型(引物序列及目的片段长度见表3),示例性的F1代小鼠(已去除Neo标记基因)的鉴定结果见图12,其中,编号为F1-01、F1-02、F1-03的3只小鼠均为阳性杂合小鼠。这表明使用本方法能构建出可稳定传代且无随机插入的CCR6基因人源化小鼠。
此外,还可以引入CRISPR/Cas系统进行基因编辑,设计如图10所示的打靶策略,图中显示了靶向载体V2上含有小鼠CCR6基因上游和下游的同源臂序列,以及人CCR6核苷酸序列。其中,上游同源臂序列(5’同源臂,SEQ ID NO:3)与NCBI登录号为NC_000083.7的第8473879至8474796位核苷酸序列相同,下游同源臂序列(3’同源臂,SEQ ID NO:4)与NCBI登录号为NC_000083.7的第8475901至8477196位核苷酸序列相同,人CCR6核苷酸序列(SEQ IDNO:5)与NCBI登录号为NM_031409.3的第569至1693位核苷酸序列相同。改造后的人源化小鼠CCR6的mRNA序列如SEQ ID NO:12所示,其表达的蛋白的氨基酸序列如SEQ ID NO:2所示。
鉴于人CCR6和鼠CCR6具有多种亚型或转录本,本文所述的方法可应用于其它亚型或转录本。
靶向载体构建可采用常规方法进行,如酶切连接、直接合成等。构建好的靶向载体通过酶切进行初步验证后,再送测序公司进行测序验证。将测序验证正确的靶向载体用于后续实验。
靶序列决定了sgRNA的靶向特异性和诱导Cas9切割目的基因的效率。因此,高效特异的靶序列选择和设计是构建sgRNA表达载体的前提。设计并合成识别靶位点的sgRNA序列,各sgRNA在CCR6基因上的靶序列如下:
sgRNA1靶位点(SEQ ID NO:6):5’-ATAATCATCCGTTCCAAAGTAGG-3’
sgRNA2靶位点(SEQ ID NO:7):5’-CAACAGGTAGACGTCAGTCATGG-3’
sgRNA3靶位点(SEQ ID NO:8):5’-TGACGTCTACCTGTTGAACATGG-3’
sgRNA4靶位点(SEQ ID NO:9):5’-TGTCCTCACCCTACCGTTCTGGG-3’
sgRNA5靶位点(SEQ ID NO:10):5’-GAGTAACTGCCCAGAACGGTAGG-3’
sgRNA6靶位点(SEQ ID NO:11):5’-AGTAACTGCCCAGAACGGTAGGG-3’
sgRNA7靶位点(SEQ ID NO:13):5’-CAATAAACGCATACAACACGGGG-3’
sgRNA8靶位点(SEQ ID NO:14):5’-ACGCATACAACACGGGGTTGAGG-3’
sgRNA9靶位点(SEQ ID NO:15):5’-TCCAATAAACGCATACAACACGG-3’
sgRNA10靶位点(SEQ ID NO:16):5’-AGAAAGTCCTCGCCTACACCAGG-3’
sgRNA11靶位点(SEQ ID NO:17):5’-CGATGCATTATCATTTTCGACGG-3’
利用UCA试剂盒检测多个sgRNA的活性,从结果可见sgRNA具有不同活性,检测结果见表1和图4。从中选择sgRNA6和sgRNA7进行后续实验。在其5’端及互补链上分别加上酶切位点得到正向寡核苷酸和反向寡核苷酸序列(见表2),退火后将退火产物连接至pT7-sgRNA质粒(质粒先用BbsI线性化),获得表达载体pT7-CCR6-6和pT7-CCR6-7。
表1 sgRNA活性检测结果
表2 sgRNA6和sgRNA7序列列表
pT7-sgRNA载体由质粒合成公司合成含有T7启动子及sgRNA scaffold的片段DNA(SEQ ID NO:26)并依次通过酶切(EcoRI及BamHI)连接至骨架载体(来源Takara,货号3299)上,经专业测序公司测序验证,结果表明获得了目的质粒。
取小鼠的原核期受精卵,例如C57BL/6小鼠,利用显微注射仪将pT7-CCR6-6和pT7-CCR6-7质粒的体外转录产物(使用Ambion体外转录试剂盒,按照说明书方法进行转录)、靶向载体与Cas9mRNA预混好后注射至小鼠受精卵细胞质或细胞核中。按照《小鼠胚胎操作实验手册(第三版)》(安德拉斯·纳吉,化学工业出版社,2006)中的方法进行受精卵的显微注射,注射后的受精卵转移至培养液中短暂培养,然后移植至受体母鼠的输卵管中发育,将获得的小鼠(F0代)通过杂交和自交,扩大种群数量,建立稳定的CCR6基因人源化小鼠品系。
可通过常规检测方法(如PCR分析)鉴定F0代小鼠体细胞的基因型,使用5’端引物(L-GT-F/L-GT-R)检测结果和3’端引物(R-GT-F/R-GT-R)进行检测(PCR引物见表3),部分F0代小鼠的鉴定结果见图5。结合5’端引物检测结果和3’端引物检测结果,经测序进一步验证图5中编号为F0-01、F0-03、F0-04的3只小鼠均为阳性小鼠。
表3 PCR检测引物序列及重组片段大小
其中,引物L-GT-F位置位于5’同源臂左侧,R-GT-R位于3’同源臂右侧,L-GT-R、R-GT-F和Mut-R均位于人CCR6序列上,引物WT-F和Mut-F位置位于5’同源臂,WT-R位于小鼠2号外显子。
将F0鉴定为阳性的CCR6基因人源化小鼠与野生型小鼠交配得到F1代小鼠。可使用表2中引物对WT-F/WT-R和Mut-F/Mut-R对F1代小鼠进行基因型鉴定,示例性检测结果见图6,显示编号为F1-06、F1-07、F1-08、F1-10、F1-11、F1-17、F1-21、F1-24和F1-25的9只小鼠为阳性小鼠。
对F1代PCR鉴定为阳性的小鼠进行Southern blot检测,确认是否存在随机插入。剪取鼠尾提取基因组DNA,选用BclI酶或NcoI酶消化基因组,转膜,杂交。5’探针和3’探针分别位于5’同源臂上及3’同源臂外侧,具体探针及目的片段的长度见表4。Southern blot检测结果见图7,综合3’探针和5’探针的结果表明,除F1-04、F1-17、F1-27、F1-29外,编号为F1-06、F1-07、F1-08、F1-10、F1-11、F1-21、F1-24、F1-25的8只小鼠均无随机插入,证实这8只小鼠为阳性杂合小鼠且不存在随机插入。这表明使用本方法能构建出可稳定传代,且无随机插入的CCR6基因人源化的基因工程小鼠。
表4具体探针及目的片段的长度
限制性内切酶 | 探针 | 野生型片段大小 | 重组序列片段大小 |
EcoRV | 5’Probe | 6.0kb | 2.7kb |
BglII | 3’Probe | 4.3kb | 6.1kb |
探针合成引物如下:
5’Probe-F(SEQ ID NO:35):5’-CTTATGGCCATTTCCGAGTCACC-3’,
5’Probe-R(SEQ ID NO:36):5’-AGAAAGGGAAGTGGGCAGTTCAA-3’;
3’Probe-F(SEQ ID NO:37):5’-GAGTTTGGGAAGAAGAGGCCTGT-3’,
3’Probe-R(SEQ ID NO:38):5’-ACCTGTTCTGAATGTGGGTGG-3’;
可通过常规检测方法确认阳性小鼠体内人CCR6蛋白的表达情况,例如使用流式细胞术等。具体来说,分别选取6周龄野生型C57BL/6雌性小鼠和本实施例制备的CCR6基因人源化杂合子雄性小鼠各1只,脱颈安乐死后取脾脏组织,制备脾脏单细胞悬液后,使用抗鼠CD45抗体Brilliant Violet 510TM anti-mouse CD45、鼠T细胞特异性抗体PerCP/Cy5.5anti-mouse TCRβchain、抗鼠CD19抗体FITC anti-Mouse CD19(mCD19)、抗鼠CCR6抗体APCanti-mouse CD196(CCR6)Antibody或抗人CCR6抗体PE anti-human CD196(CCR6)Antibody识别染色后进行流式检测。检测结果显示:C57BL/6野生型小鼠脾脏B细胞(特征为mCD45+mCD19+)中mCCR6阳性细胞(特征为mC D45+mCD19+mCCR6+)比例为14.3%,未检测到hCCR6阳性细胞;CCR6基因人源化杂合子小鼠脾脏B细胞中hCCR6阳性细胞比例为7.67%(特征为mCD45+mCD19+hCCR6+),mCCR6阳性细胞(特征为mCD45+mCD19+mCCR6+)比例为5.4%。结果表明,在野生型C57BL/6小鼠体内只能检测到鼠CCR6蛋白,不能检测到人或人源化CCR6蛋白;在CCR6基因人源化杂合子小鼠体内既可以检测到鼠CCR6蛋白,也能检测到人CCR6蛋白。
此外,由于Cas9的切割造成基因组DNA的双链断裂,通过染色体同源重组的修复方式会随机产生插入/缺失突变,可能得到CCR6蛋白功能丧失的基因敲除小鼠。为此设计一对引物用于检测基因敲除小鼠,结果见图9,经测序进一步验证编号F0KO-01到F0KO-07的小鼠为CCR6基因敲除小鼠。引物分别位于5’端靶位点左侧和3’端靶位点右侧,引物序列及重组片段大小如表5所示。
表5 CCR6基因敲除鼠基因型鉴定PCR引物序列及重组片段大小
将F1代鉴定为阳性的杂合小鼠相互交配,获得F2代CCR6基因人源化纯合子小鼠。可通过常规检测方法确认阳性小鼠体内人源化CCR6 mRNA的表达情况,例如RT-PCR等。具体来说,分别取6周龄C57BL/6野生型小鼠和本实施例制得的CCR6基因人源化纯合子小鼠各1只,脱颈安乐死后取小鼠脾脏,按照Trizol试剂盒说明书抽提细胞RNA,反转录成cDNA后进行RT-PCR检测(引物见表6),检测结果如图8所示:在C57BL/6野生型小鼠体内仅检测到鼠CCR6 mRNA,没有检测到人CCR6 mRNA;仅在CCR6基因人源化纯合子小鼠体内检测到人CCR6mRNA。
表6 RT-PCR引物名称及具体序列
与上述方法类似,进一步通过流式细胞术检测CCR6基因人源化纯合子小鼠体内CCR6蛋白的表达情况,检测结果显示:C57BL/6野生型小鼠脾脏B细胞(特征为mCD45+mCD19+)中mCCR6阳性细胞(特征为mCD45+mCD19+mCCR6+)比例为15.5%,未检测到hCCR6阳性细胞;CCR6基因人源化纯合子小鼠脾脏B细胞中hCCR6阳性细胞比例为14.1%(特征为mCD45+mCD19+hCCR6+),未检测到mCCR6阳性细胞。结果表明,在野生型C57BL/6小鼠体内只能检测到鼠CCR6蛋白,不能检测到人或人源化CCR6蛋白;仅在CCR6基因人源化纯合子小鼠体内可以检测到人CCR6蛋白。
实施例2双重人源化或多重双人源化小鼠的制备
利用本方法或制得的CCR6基因人源化小鼠还可以制备双人源化或多人源化小鼠模型。如,前述实施例1中,囊胚显微注射使用的胚胎干细胞可选择来源于含有PD-1、PD-L1、IL4、IL4R、IL6、IL6R、IL17、CCR4、CCR8等其它基因修饰的小鼠,或者,也可在人源化CCR6小鼠的基础上,利用分离小鼠ES胚胎干细胞和基因重组打靶技术,获得CCR6与其它基因修饰的双基因或多基因修饰的小鼠模型。也可将本方法得到的CCR6小鼠纯合子或杂合子与其它基因修饰的纯合或杂合小鼠交配,对其后代进行筛选,根据孟德尔遗传规律,可有一定机率得到人源化CCR6与其它基因修饰的双基因或多基因修饰的杂合小鼠,再将杂合子相互交配可以得到双基因或多基因修饰的纯合子,利用这些双基因或多基因修饰的小鼠可以进行靶向人CCR6和其它基因调节剂的体内药效验证等。
以上详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。
此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。
序列表
<110> 百奥赛图(北京)医药科技股份有限公司
<120> CCR6基因人源化非人动物的构建方法及应用
<130> 1
<150> 2021102552764
<151> 2021-03-09
<160> 53
<170> SIPOSequenceListing 1.0
<210> 1
<211> 367
<212> PRT
<213> 小鼠(Mouse)
<400> 1
Met Asn Ser Thr Glu Ser Tyr Phe Gly Thr Asp Asp Tyr Asp Asn Thr
1 5 10 15
Glu Tyr Tyr Ser Ile Pro Pro Asp His Gly Pro Cys Ser Leu Glu Glu
20 25 30
Val Arg Asn Phe Thr Lys Val Phe Val Pro Ile Ala Tyr Ser Leu Ile
35 40 45
Cys Val Phe Gly Leu Leu Gly Asn Ile Met Val Val Met Thr Phe Ala
50 55 60
Phe Tyr Lys Lys Ala Arg Ser Met Thr Asp Val Tyr Leu Leu Asn Met
65 70 75 80
Ala Ile Thr Asp Ile Leu Phe Val Leu Thr Leu Pro Phe Trp Ala Val
85 90 95
Thr His Ala Thr Asn Thr Trp Val Phe Ser Asp Ala Leu Cys Lys Leu
100 105 110
Met Lys Gly Thr Tyr Ala Val Asn Phe Asn Cys Gly Met Leu Leu Leu
115 120 125
Ala Cys Ile Ser Met Asp Arg Tyr Ile Ala Ile Val Gln Ala Thr Lys
130 135 140
Ser Phe Arg Val Arg Ser Arg Thr Leu Thr His Ser Lys Val Ile Cys
145 150 155 160
Val Ala Val Trp Phe Ile Ser Ile Ile Ile Ser Ser Pro Thr Phe Ile
165 170 175
Phe Asn Lys Lys Tyr Glu Leu Gln Asp Arg Asp Val Cys Glu Pro Arg
180 185 190
Tyr Arg Ser Val Ser Glu Pro Ile Thr Trp Lys Leu Leu Gly Met Gly
195 200 205
Leu Glu Leu Phe Phe Gly Phe Phe Thr Pro Leu Leu Phe Met Val Phe
210 215 220
Cys Tyr Leu Phe Ile Ile Lys Thr Leu Val Gln Ala Gln Asn Ser Lys
225 230 235 240
Arg His Arg Ala Ile Arg Val Val Ile Ala Val Val Leu Val Phe Leu
245 250 255
Ala Cys Gln Ile Pro His Asn Met Val Leu Leu Val Thr Ala Val Asn
260 265 270
Thr Gly Lys Val Gly Arg Ser Cys Ser Thr Glu Lys Val Leu Ala Tyr
275 280 285
Thr Arg Asn Val Ala Glu Val Leu Ala Phe Leu His Cys Cys Leu Asn
290 295 300
Pro Val Leu Tyr Ala Phe Ile Gly Gln Lys Phe Arg Asn Tyr Phe Met
305 310 315 320
Lys Ile Met Lys Asp Val Trp Cys Met Arg Arg Lys Asn Lys Met Pro
325 330 335
Gly Phe Leu Cys Ala Arg Val Tyr Ser Glu Ser Tyr Ile Ser Arg Gln
340 345 350
Thr Ser Glu Thr Val Glu Asn Asp Asn Ala Ser Ser Phe Thr Met
355 360 365
<210> 2
<211> 374
<212> PRT
<213> 人(human)
<400> 2
Met Ser Gly Glu Ser Met Asn Phe Ser Asp Val Phe Asp Ser Ser Glu
1 5 10 15
Asp Tyr Phe Val Ser Val Asn Thr Ser Tyr Tyr Ser Val Asp Ser Glu
20 25 30
Met Leu Leu Cys Ser Leu Gln Glu Val Arg Gln Phe Ser Arg Leu Phe
35 40 45
Val Pro Ile Ala Tyr Ser Leu Ile Cys Val Phe Gly Leu Leu Gly Asn
50 55 60
Ile Leu Val Val Ile Thr Phe Ala Phe Tyr Lys Lys Ala Arg Ser Met
65 70 75 80
Thr Asp Val Tyr Leu Leu Asn Met Ala Ile Ala Asp Ile Leu Phe Val
85 90 95
Leu Thr Leu Pro Phe Trp Ala Val Ser His Ala Thr Gly Ala Trp Val
100 105 110
Phe Ser Asn Ala Thr Cys Lys Leu Leu Lys Gly Ile Tyr Ala Ile Asn
115 120 125
Phe Asn Cys Gly Met Leu Leu Leu Thr Cys Ile Ser Met Asp Arg Tyr
130 135 140
Ile Ala Ile Val Gln Ala Thr Lys Ser Phe Arg Leu Arg Ser Arg Thr
145 150 155 160
Leu Pro Arg Ser Lys Ile Ile Cys Leu Val Val Trp Gly Leu Ser Val
165 170 175
Ile Ile Ser Ser Ser Thr Phe Val Phe Asn Gln Lys Tyr Asn Thr Gln
180 185 190
Gly Ser Asp Val Cys Glu Pro Lys Tyr Gln Thr Val Ser Glu Pro Ile
195 200 205
Arg Trp Lys Leu Leu Met Leu Gly Leu Glu Leu Leu Phe Gly Phe Phe
210 215 220
Ile Pro Leu Met Phe Met Ile Phe Cys Tyr Thr Phe Ile Val Lys Thr
225 230 235 240
Leu Val Gln Ala Gln Asn Ser Lys Arg His Lys Ala Ile Arg Val Ile
245 250 255
Ile Ala Val Val Leu Val Phe Leu Ala Cys Gln Ile Pro His Asn Met
260 265 270
Val Leu Leu Val Thr Ala Ala Asn Leu Gly Lys Met Asn Arg Ser Cys
275 280 285
Gln Ser Glu Lys Leu Ile Gly Tyr Thr Lys Thr Val Thr Glu Val Leu
290 295 300
Ala Phe Leu His Cys Cys Leu Asn Pro Val Leu Tyr Ala Phe Ile Gly
305 310 315 320
Gln Lys Phe Arg Asn Tyr Phe Leu Lys Ile Leu Lys Asp Leu Trp Cys
325 330 335
Val Arg Arg Lys Tyr Lys Ser Ser Gly Phe Ser Cys Ala Gly Arg Tyr
340 345 350
Ser Glu Asn Ile Ser Arg Gln Thr Ser Glu Thr Ala Asp Asn Asp Asn
355 360 365
Ala Ser Ser Phe Thr Met
370
<210> 3
<211> 918
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
gttacatgca tgcctcacca cactttgctt ctagctttca gtttctatat tgtcttgcta 60
gggcagaatc attatggctt catgctcgag gcctgtgtct cttcaggatg ttcatcctag 120
taagcttata ccacacgcat gcagatgcct tcagaggcca gaatagggca ttgcatcccc 180
tggaactgga gttatcacta tgagtcccct gacatggtac tgtgtggttt ctgggaatca 240
aacccaggtc ctccagaaga gcagcgggtt ttcttaacct ctgagccatc tctccagtct 300
ttgaatcatg ggctttaatc cacatctaga tagctagcgc agatagattt ttgttctgtg 360
agattttctc atatacaatt aactggaatt ttgggtgaag acctatgcag atcatttttt 420
ttcttgatat gacttttctt aggccaaaga ttacaaactg gcaattaact gtcaatgcta 480
accagttcat ttacgtgttc cttatggcca tttccgagtc accgaagcca gactgtcact 540
gagaaagagc ccccagtgtt tgctctcagg ctcagaagtg accaggaaag cccgtgacgt 600
gggtattttc acattgagcg ccatgcattg cagtgtgttc tgatggggta gaatgttcca 660
gaacacagca tgactggggc acactttgcc ttttctttcc cccagcttca cctctgctct 720
cccgacatct gcactagtga gagtgtggtt gaactgccca cttccctttc tacaccagat 780
ctggctctcc catccacata gagaaccacg cctgcctggg gtgagaatct actttatctt 840
ggcagggact ctggcatggc taggtgtggt tgcttgaaat cacactgtca cgatttctat 900
tttcattatc attcagga 918
<210> 4
<211> 1296
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
cacgagagca caaagcaaca ttgccccaaa agccttggtg aaacttgcta ttacatatga 60
aaaaaaaaaa aaagccatgt ccaaatatgt acagtaacta tggaaattca gcaaagagtt 120
cctgcaagat cagaaccagc cgggaggtgg cactatcagc caaattcttc caggtgtggg 180
tgacaagaaa cattgtagct cctcccaggt tggttctaca aaataagatg ggaatgccag 240
attactgggt agtgcttatg aacataaaca tattcagaaa cgttcatgaa ggggtcacag 300
acctagtgac ccctaacacc catagcacaa aacaaggatg tagcttgaga aaccaacaaa 360
agccccctgt aactcatgtg aagcagatga caagtcaaag atcccatacc cagctccctt 420
ttatcttctc agcaagcagg aggctatgga ggaggaaggc aagagcatcc ataaactgga 480
acatcaacct gggtggagag aggccggaac caagtaggaa gtcgggtgcc tgggtttgct 540
actggcatgt gagcttgctt ccacaaatgg aaggagttct tggtgattcc cttttcccct 600
ctccagtggg tggagccaaa ggaagcaagc tgggatactg ttccaggctg ggctctgggt 660
ttagcagact ccagcacagt ttaacattca tccctcggat ggtaaacttg gcttgtctgt 720
agctgaaagt gctttccttc cagatctgga acggaggtga agatcctggt caccgagagt 780
ttcgtgttag cctctcaaca gtggccagca tgctggcctc tgagaccaag gggacttttt 840
tttgtccatt taaattggac attgaatcta gggtttcaca taatgttcgg caattgtgct 900
accactgtgc tatactccaa agcctttctg tatctttcat ttagagagag ggacccacta 960
aggtgttcag gcaggccttg aacttggcaa tcccagagcc tcaactctac aaatagttaa 1020
gattacaggc ctgtgccatt atgcctggct ctcagactgg tcttaaggta gctctataca 1080
aagccatagt tagatataaa aacaggtttc agtgagtctc ttctgccttg ttagaagctc 1140
atagtactct agttcttaaa gggctgctta agcagatggc aaatgtgtct ggagatgggg 1200
aaacacaaat ctcattacaa gaattgctgg tgtgaatgtc aagaaactga catgttctat 1260
tctgatacat ggtttggaag ctaaatggtt agtgag 1296
<210> 5
<211> 1125
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
atgagcgggg aatcaatgaa tttcagcgat gttttcgact ccagtgaaga ttattttgtg 60
tcagtcaata cttcatatta ctcagttgat tctgagatgt tactgtgctc cttgcaggag 120
gtcaggcagt tctccaggct atttgtaccg attgcctact ccttgatctg tgtctttggc 180
ctcctgggga atattctggt ggtgatcacc tttgcttttt ataagaaggc caggtctatg 240
acagacgtct atctcttgaa catggccatt gcagacatcc tctttgttct tactctccca 300
ttctgggcag tgagtcatgc caccggtgcg tgggttttca gcaatgccac gtgcaagttg 360
ctaaaaggca tctatgccat caactttaac tgcgggatgc tgctcctgac ttgcattagc 420
atggaccggt acatcgccat tgtacaggcg actaagtcat tccggctccg atccagaaca 480
ctaccgcgca gcaaaatcat ctgccttgtt gtgtgggggc tgtcagtcat catctccagc 540
tcaacttttg tcttcaacca aaaatacaac acccaaggca gcgatgtctg tgaacccaag 600
taccagactg tctcggagcc catcaggtgg aagctgctga tgttggggct tgagctactc 660
tttggtttct ttatcccttt gatgttcatg atattttgtt acacgttcat tgtcaaaacc 720
ttggtgcaag ctcagaattc taaaaggcac aaagccatcc gtgtaatcat agctgtggtg 780
cttgtgtttc tggcttgtca gattcctcat aacatggtcc tgcttgtgac ggctgcaaat 840
ttgggtaaaa tgaaccgatc ctgccagagc gaaaagctaa ttggctatac gaaaactgtc 900
acagaagtcc tggctttcct gcactgctgc ctgaaccctg tgctctacgc ttttattggg 960
cagaagttca gaaactactt tctgaagatc ttgaaggacc tgtggtgtgt gagaaggaag 1020
tacaagtcct caggcttctc ctgtgccggg aggtactcag aaaacatttc tcggcagacc 1080
agtgagaccg cagataacga caatgcgtcg tccttcacta tgtga 1125
<210> 6
<211> 23
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 6
ataatcatcc gttccaaagt agg 23
<210> 7
<211> 23
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 7
caacaggtag acgtcagtca tgg 23
<210> 8
<211> 23
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 8
tgacgtctac ctgttgaaca tgg 23
<210> 9
<211> 23
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 9
tgtcctcacc ctaccgttct ggg 23
<210> 10
<211> 23
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 10
gagtaactgc ccagaacggt agg 23
<210> 11
<211> 23
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 11
agtaactgcc cagaacggta ggg 23
<210> 12
<211> 1254
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 12
catttcctgg gacttgcttc ctggccaccg aggtgtgaac aacttcacag ttctgaatga 60
gcggggaatc aatgaatttc agcgatgttt tcgactccag tgaagattat tttgtgtcag 120
tcaatacttc atattactca gttgattctg agatgttact gtgctccttg caggaggtca 180
ggcagttctc caggctattt gtaccgattg cctactcctt gatctgtgtc tttggcctcc 240
tggggaatat tctggtggtg atcacctttg ctttttataa gaaggccagg tctatgacag 300
acgtctatct cttgaacatg gccattgcag acatcctctt tgttcttact ctcccattct 360
gggcagtgag tcatgccacc ggtgcgtggg ttttcagcaa tgccacgtgc aagttgctaa 420
aaggcatcta tgccatcaac tttaactgcg ggatgctgct cctgacttgc attagcatgg 480
accggtacat cgccattgta caggcgacta agtcattccg gctccgatcc agaacactac 540
cgcgcagcaa aatcatctgc cttgttgtgt gggggctgtc agtcatcatc tccagctcaa 600
cttttgtctt caaccaaaaa tacaacaccc aaggcagcga tgtctgtgaa cccaagtacc 660
agactgtctc ggagcccatc aggtggaagc tgctgatgtt ggggcttgag ctactctttg 720
gtttctttat ccctttgatg ttcatgatat tttgttacac gttcattgtc aaaaccttgg 780
tgcaagctca gaattctaaa aggcacaaag ccatccgtgt aatcatagct gtggtgcttg 840
tgtttctggc ttgtcagatt cctcataaca tggtcctgct tgtgacggct gcaaatttgg 900
gtaaaatgaa ccgatcctgc cagagcgaaa agctaattgg ctatacgaaa actgtcacag 960
aagtcctggc tttcctgcac tgctgcctga accctgtgct ctacgctttt attgggcaga 1020
agttcagaaa ctactttctg aagatcttga aggacctgtg gtgtgtgaga aggaagtaca 1080
agtcctcagg cttctcctgt gccgggaggt actcagaaaa catttctcgg cagaccagtg 1140
agaccgcaga taacgacaat gcgtcgtcct tcactatgtg acacgagagc acaaagcaac 1200
attgccccaa aagccttggt gaaacttgct attacatatg aaaaaaaaaa aaaa 1254
<210> 13
<211> 23
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 13
caataaacgc atacaacacg ggg 23
<210> 14
<211> 23
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 14
acgcatacaa cacggggttg agg 23
<210> 15
<211> 23
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 15
tccaataaac gcatacaaca cgg 23
<210> 16
<211> 23
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 16
agaaagtcct cgcctacacc agg 23
<210> 17
<211> 23
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 17
cgatgcatta tcattttcga cgg 23
<210> 18
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
agtaactgcc cagaacggta 20
<210> 19
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
taggagtaac tgcccagaac ggta 24
<210> 20
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
taccgttctg ggcagttact 20
<210> 21
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
aaactaccgt tctgggcagt tact 24
<210> 22
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
caataaacgc atacaacacg 20
<210> 23
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
taagcaataa acgcatacaa cacg 24
<210> 24
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
cgtgttgtat gcgtttattg 20
<210> 25
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
aaaccgtgtt gtatgcgttt attg 24
<210> 26
<211> 132
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
gaattctaat acgactcact atagggggtc ttcgagaaga cctgttttag agctagaaat 60
agcaagttaa aataaggcta gtccgttatc aacttgaaaa agtggcaccg agtcggtgct 120
tttaaaggat cc 132
<210> 27
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
gacagcctca ctatatatcc caac 24
<210> 28
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
cacagtaaca tctcagaatc aact 24
<210> 29
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
cggggaatca atgaatttca gcga 24
<210> 30
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
ctcactatag atggcaacaa aggc 24
<210> 31
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
ctagtgagag tgtggttgaa ctgcc 25
<210> 32
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
ggcccatggt ctggaggaat agaat 25
<210> 33
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
tcaggctcag aagtgaccag gaaag 25
<210> 34
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
cttcactgga gtcgaaaaca tcgct 25
<210> 35
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
cttatggcca tttccgagtc acc 23
<210> 36
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
agaaagggaa gtgggcagtt caa 23
<210> 37
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
gagtttggga agaagaggcc tgt 23
<210> 38
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
acctgttctg aatgtgggtg g 21
<210> 39
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
ttccacagag tcctactttg gaacg 25
<210> 40
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
agcatcccac agttaaagtt gaccg 25
<210> 41
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
gcttttgggg caatgttgct ttgtg 25
<210> 42
<211> 3941
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
gggtgctggc ccagcacatc atagcattgt gcagagacag gggcaactta caaatcctgg 60
gtctttcgga cttggttcgc cactctaatc agtaagagta agttaagaca ccctctcttg 120
aatataatat gcatccatat gattgtctgc ctctgctact gatgcccttg ggcctggcct 180
gagaaccagc cacataccca gaaccttcca accatgagga actgcatggc catcgctggc 240
cattccttca gcaggagctg tcagaagctg tacagacctg aactacattg tttaaggggg 300
tcgtgtttgc ctggtacctt cctgactgcc aggctcacca tcttacacta ggtcagtgcc 360
tagcctcagg agactttttt tttgttgttg ttgttttttg ttttttttcg agacagggtt 420
tctctgtgta gccctggctg tcctggaact cactttgtag accaggctga cctcaaactc 480
agaaatccgc ctgcctctgc ctcccaagtg ttgggattaa aggcgtgtgc caccatctcc 540
cggcttcagg agacttttta aagcttccat tcaagtggtt atacttgaat tcaaaaactg 600
tgactcatca tagtgcagat aaatatatgt cttacatgga gaatctagct ggtattggta 660
tacagtgcgg ttggctgacc ctcgtagtct ttaattccaa ccgttttccc caccaacaca 720
atgtacatgg gggaaaatca ccatgtccca tctcggctca accccctcca gctaaggagc 780
catcctgacc actcccctgc tttggtctca ctaatgatac acaatggtcc ccaacgcccc 840
ttgatcacct ctgcactacc ctgaactgtc acacctccta ctgtgctttc ctccacctgt 900
agcctcttcc cctccccaaa tctataccaa tcccgccctt cagggccacc tcagtcctac 960
tggctcatgc actttctgta gccgtccttt gatcttctct atcactacct gtcagtggaa 1020
ggacatttgt gtaaaagaac atttggcagt tttcaaggta gcgttactgg gcataatcac 1080
acacagttat tgaagccaac cattcacagg ttttgacata catgtagcca cgcatcaacg 1140
attctgctgt gtgggaacac gaggcactcg ggatccccct gggcatttac gttcttccca 1200
gtttagagct gttttagaag gaccttctct aaaaattcaa gttagttaga gtttttgcct 1260
cttgcctggg tgaatgctag cagccagtta ctggttcaca cagccagtgc acagccagtg 1320
ttacatgagg cgcacactct ttggtctaca tgctcgtgtg acctcctgtt cccccacagc 1380
cagccagtac atctgcagct gtcccaggtc tttgcagata ccctggcctt ccctgatcat 1440
ctttgtgttc atccattcac acatatgtca ggtatgtggt atgtcagggg ggttgtgact 1500
tagcctcccc aacaatggac agtggtcaac atcttgtgtg catattgacc atcccatatt 1560
ttctcgagtg tctttcaggt gtggactagt tgggattctt cgtaaggtct ggatgtgacc 1620
agatattagc ttgcaaatgt tattttccaa ttcaaatatt tttttcattt ctatgtattt 1680
tgcaaacagc agattaaata caagttatca ttattacttt acagtatatg ctctccccac 1740
tttttaaaat aattcatatt ttatgtgcat tgatgttttg cctgcatgta tgtctgagtg 1800
agggtgtcag atcccctgga actggggtta cagacagttg tgtgctgtgg tgtggattct 1860
gggaattgaa ctggggtcct ctggaagagt aaccagtgct cttaaccact gagccatctc 1920
tccagaccct gtttttcaca atttatgtag gaaaattctt ctgttccttg ggttaccaag 1980
gttgtcttat gttttccttt aaatgttgtc tgtctctgat cttgcattta gagctacaac 2040
cagtttgagt tcatttttct tgtggtggtg gggggggggt aaggcacagc tttttcacat 2100
aaaatccagc tgtatcagta ccattatttc aagacagttt ttccaccatg gactttcctt 2160
ggcactttgt tcaaaactca gctatttata tatggctcat ttctgggctt tgtgttggtc 2220
ccatggatgc tggctcttgc cttctccttc atcagcatcc cctgacctga cactgaggca 2280
tcctgatttt cacaaggagg ctgtgtgaat cctccaactc tgtttcctct cttgaattca 2340
ttgtagaatg agaatcagtt agccagctgc tctatgtaaa aacccccagg gctttgactt 2400
agtttgtggt atgcttacat aaacatttgt gaagaaatgt gtctgtccaa tgctagacat 2460
ctctctcctg aataccttct ctcagctatt aagatttttc agcatataaa tcttatttac 2520
aaatgtgtta tggttctttt taatctctcc ctccacccct ccccctctct ccctgttctc 2580
cctccctctc tctactgccc tccctccccc tctttcctcc tcttgccctt ttcttctagc 2640
ctccctccct tctgccctcc ttccctccct tcctccctct ctcttcttct tcctcctgtt 2700
ttctctccct tgctcccttc tgccttcctt ctttccaccc cctgttctcc ctacctcctg 2760
cccacctcct ctccctccct cccttccttc ctccctccct ccctctctcc ctcctctctt 2820
cctttcttcc ttctctcctt ccctctctcc ctccttctct ttctctctct ccctccctcc 2880
ctccctccct cctgctgtct tctttccttc aggatcttaa tttatctttt gctatttatt 2940
ttgatttttc aagacagcct cactatatat cccaactggt tttgaactca ctatcctcct 3000
gcctcagtct cctgagtgct aaggttacat gcatgcctca ccacactttg cttctagctt 3060
tcagtttcta tattgtcttg ctagggcaga atcattatgg cttcatgctc gaggcctgtg 3120
tctcttcagg atgttcatcc tagtaagctt ataccacacg catgcagatg ccttcagagg 3180
ccagaatagg gcattgcatc ccctggaact ggagttatca ctatgagtcc cctgacatgg 3240
tactgtgtgg tttctgggaa tcaaacccag gtcctccaga agagcagcgg gttttcttaa 3300
cctctgagcc atctctccag tctttgaatc atgggcttta atccacatct agatagctag 3360
cgcagataga tttttgttct gtgagatttt ctcatataca attaactgga attttgggtg 3420
aagacctatg cagatcattt tttttcttga tatgactttt cttaggccaa agattacaaa 3480
ctggcaatta actgtcaatg ctaaccagtt catttacgtg ttccttatgg ccatttccga 3540
gtcaccgaag ccagactgtc actgagaaag agcccccagt gtttgctctc aggctcagaa 3600
gtgaccagga aagcccgtga cgtgggtatt ttcacattga gcgccatgca ttgcagtgtg 3660
ttctgatggg gtagaatgtt ccagaacaca gcatgactgg ggcacacttt gccttttctt 3720
tcccccagct tcacctctgc tctcccgaca tctgcactag tgagagtgtg gttgaactgc 3780
ccacttccct ttctacacca gatctggctc tcccatccac atagagaacc acgcctgcct 3840
ggggtgagaa tctactttat cttggcaggg actctggcat ggctaggtgt ggttgcttga 3900
aatcacactg tcacgatttc tattttcatt atcattcagg a 3941
<210> 43
<211> 4154
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
cgagagtttc gtgttagcct ctcaacagtg gccagcatgc tggcctctga gaccaagggg 60
actttttttt gtccatttaa attggacatt gaatctaggg tttcacataa tgttcggcaa 120
ttgtgctacc actgtgctat actccaaagc ctttctgtat ctttcattta gagagaggga 180
cccactaagg tgttcaggca ggccttgaac ttggcaatcc cagagcctca actctacaaa 240
tagttaagat tacaggcctg tgccattatg cctggctctc agactggtct taaggtagct 300
ctatacaaag ccatagttag atataaaaac aggtttcagt gagtctcttc tgccttgtta 360
gaagctcata gtactctagt tcttaaaggg ctgcttaagc agatggcaaa tgtgtctgga 420
gatggggaaa cacaaatctc attacaagaa ttgctggtgt gaatgtcaag aaactgacat 480
gttctattct gatacatggt ttggaagcta aatggttagt gagctgttgc aatgcctttg 540
ttgccatcta tagtgagtgt gtgcattcgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt 600
gtgtgtgtgt gtttgctcaa gttttgaggc cagaggatag gatagcttcc agtatattcc 660
tcaggctgtg ggttttttta tttggggggg ggggttaggt ttttttgtgg ggtgggggtg 720
gggtgggagt gggggtaggg gttgggttgt tttttgtttt ttgtttttct tctttcttaa 780
gacaaagtct ctcagtgctt cagagctgaa tgagcagcaa gactggcagg ccggaggtgg 840
gggggggggg gaccttggct agcactggga ttaaaagcat gcaccaccac caagaggatt 900
tctttgtttt tttgtttttg tttttgttgt tgttacatag attctagctg ttgagctggt 960
ctttgcgctg caagctaagt gctttgctgc ctgaaccatc cccccagccc agcatttgaa 1020
acataactct ttagcttatt ccaatctttt cccacattaa aatataaact tatgtacaag 1080
ccttaataat tctgagtctt tttatttgcc tcgctttaag aaccattaag aaaaagagaa 1140
aggaaggaag aaaggaagga aagaaggaag gaaggaagga aggaaggaag gaaggaaaaa 1200
ggaaggaaag aaagaaagaa agaaagaaag aaagaaagaa agaaagaaag aaagaaagaa 1260
agaaagaaag aaagagggga acagactgtg cacttcgttt tcatggagtc ctggtttaat 1320
ttatgttgat gtaataaaac tcccagagtt tgggaagaag aggcctgtct cagtttgcga 1380
ttttaggtcc cacccattat tgtggtgctg aagtcagtga aggagaatca gcctcagcca 1440
ggagcagagg aagggggatg cacacagccc tgccgctcac ggctttctta gttttttttt 1500
aatacaattt ggccagttca taaaatgcta ccacccacat tcagaacagg tcttcacacc 1560
taactaacaa gacaccccca cctacacaca ccctcaggtc acccccatct agataactcc 1620
tcattaaagc tctgccccag tgatcatagg ctctgttggg actacagttc aaattaacag 1680
gcacacatgg tatccctaga gcgatgttag tattttctca atggaaaacg ctttgttcca 1740
aggctaaaat gactttgaaa tcattttggt tttaggtatt aattattctg tttctcgtta 1800
gataactaga aaagaaagtg gatcaatctt aggtgacaga ttccaccatt ctgtaaatga 1860
gcagaggtcc ttaaatcctc cactggcctc tcgaacatgg atccctctgc cagctgccca 1920
ctgcatgcag cccgggattt gtttgtttgt ttcaagtcta agtgttgccg atggcggaga 1980
aggacagact gtcttgctga gattctagca tccagagtga gagggagagg ggggcagcca 2040
gcagggaggg gaggggagca gagggagctg ctggcattgg ggcagaggag gaagcagagc 2100
acaaaccatg cctggtcctg cccctccaac agctgactca gcacctttat cctcttatcc 2160
atctgacccc ctttcatggc cagaaaccca tgatctaaga ggaaagagag agagagagag 2220
agagagagag agagagagag agagagaaag gaagaaagaa cagatgtgga ggatactggc 2280
acatgccctt agtcccagca acttgtaagc aatgatagaa caatgcccaa ggcaatgccc 2340
aagtgtctta gtcaggtttt ctattcctgc acaaacatca tgaccaagaa gcacttgggg 2400
aggaaagggt ttattcagct tactcttcca cattgctgtt catcaccaaa ggaagtcagg 2460
actggaactc aaacaggtca ggaagcagga gctgatgcag aggccatgga gggatgttct 2520
ttacaggctt gctcagcctg ctctcttatg gaaccaagac taccagccca gagatggcac 2580
cacccacaag gggacctccc cacttgatca ctaattgaga aaatgcctta cagttggatc 2640
tcatggaggc atttccccaa ctgaagctcc tttctttgtg ataactccag cctatgtcaa 2700
gttgacacaa aactagccag tataattgac cccttgtcta cttgacacac aaacacatca 2760
ctattaagcc tcagctgtta gtttcttatt catccccttt taaataactt taaggcagat 2820
ggcggaaatg gacctggtgg ctgagttgcc gcgtcccccg ggtgctgcgc gctgggccga 2880
ggttatggct cgctttgcgg ccaggctggg cgagcagggc cggcgggtgg tgctgatcac 2940
atctggaggc accaaggtcc cactggaagc gtgcgctttc tggacaactt cagtaacggg 3000
caacagggag ccgcgtcggc ggaggtcttc ctggctgccg gctatggagt cctgttcttg 3060
ttcggagggc actcagcctt cccctatacc catcgcttcc cgccccaggc ctggctgcca 3120
gccctccggc cttctggccc agcccagtcg ggcaagctga gtctggaggc ctaagagaat 3180
gcgctcccgg gctttgctac agcattgcag agcttccaag agactggtac cttcctggct 3240
gtagagttta ccactttggc ggattacctg catctgctgc aggctgctgc cttggctctc 3300
ggtccattag gctcttctgc gatgttttac ctggccgccg cagtgtcaga tttctatatt 3360
cctgtctccg aaatgcctga acacaagatc cactcatctg gtggcccact gcaggtgatg 3420
gactcttctc ttccagagat ctgaccccct ctaaccaatc ttgggttact ttcctcttga 3480
tctggatggc ttttcagcct tctgcatgag ctaggtactg ggaatacaga gatgaacaag 3540
acactgccct caaggatctc acagtctagc gagggcctgg acaccagcca taatcacaga 3600
tcagaatgat aaatgctgta gtggagataa caatgaagat gatgccaaag atgctttctc 3660
ctctggtcaa acactgggct cctaaagcat ttgtagtttc ctttaagctg gagacagacc 3720
cggacatcat aatcagtcgg gctcggaatg ctttggaagt ttaccagcat caagtggtgg 3780
tggccaacat cctggagtca ataaagtcct ttgtgattat tgtaaccaaa gactcggaga 3840
cagagttact gctgtccgag gaggaggtgg caaaaggctt ggtgatagaa gagaagatag 3900
tagatgacct tcagtctcga cacacagctt ttatacgtga caaaaactga aggaaatgct 3960
cctctaggat caaacaccag agctcttacc actgatagga actaagattg atcctctgtt 4020
aaggatcaac ccagtgaaga aatagtaaac gcggtgtgca ggcaagcgcc tgctgggact 4080
tcagttctga gagtgaaaca ctggacgctc tcctggatct ggaaagtgaa caggagttca 4140
caaagaggac tgtg 4154
<210> 44
<211> 80
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
atcacactgt cacgatttct attttcatta tcattcagga atgagcgggg aatcaatgaa 60
tttcagcgat gttttcgact 80
<210> 45
<211> 80
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
gaccgcagat aacgacaatg cgtcgtcctt cactatgtga cacgagagca caaagcaaca 60
ttgccccaaa agccttggtg 80
<210> 46
<211> 80
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
ttccttccag atctggaacg gaggtgaaga tcctggtcac gaattccgaa gttcctattc 60
tctagaaagt ataggaactt 80
<210> 47
<211> 80
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
gtataggaac ttcatcagtc aggtacataa tggtggatcc cgagagtttc gtgttagcct 60
ctcaacagtg gccagcatgc 80
<210> 48
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
cactaccgcg cagcaaaatc 20
<210> 49
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
aaagcgtaga gcacagggtt 20
<210> 50
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
ctgggcagtt actcatgcca 20
<210> 51
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
aacacgagaa ccacagcgat 20
<210> 52
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
tcaccatctt ccaggagcga ga 22
<210> 53
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
gaaggccatg ccagtgagct t 21
Claims (15)
1.一种人源化CCR6基因,其特征在于,所述的人源化CCR6基因包含人CCR6基因的至少部分。
2.根据权利要求1所述的人源化CCR6基因,其特征在于,所述的人源化CCR6基因包含编码人CCR6蛋白的全部或部分核苷酸序列;优选的,包含编码人CCR6蛋白胞外区的全部或部分核苷酸序列;更优选的,包含与编码SEQ ID NO:2的核苷酸序列具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列或者包含编码SEQ ID NO:2的核苷酸序列。
3.根据权利要求1或2所述的人源化CCR6基因,其特征在于,所述的人源化CCR6基因包含人CCR6基因的1号外显子至3号外显子的全部或部分;优选的,包含人CCR6基因的2号至3号外显子的全部或部分;更优选的,包含人CCR6基因的2号外显子的部分和/或3号外显子的部分,其中,所述人CCR6基因的2号外显子的部分至少包含5bp的核苷酸序列,3号外显子的部分至少包含500bp的核苷酸序列。
4.根据权利要求1-3任一所述的人源化CCR6基因,其特征在于,所述的人源化CCR6基因中包含的人CCR6基因选自下列组中的一种:
(A)包含SEQ ID NO:5所示核苷酸序列的全部或部分;
(B)包含与SEQ ID NO:5所示核苷酸序列的同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%的核苷酸序列;
(C)包含与SEQ ID NO:5示核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸的核苷酸序列;或,
(D)具有SEQ ID NO:5所示核苷酸序列的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
5.根据权利要求1-4任一所述的人源化CCR6基因,其特征在于,所述的人源化CCR6基因转录的mRNA选自下列组中的一种:
(a)包含SEQ ID NO:12所示核苷酸序列的全部或部分;
(b)包含与SEQ ID NO:12所示核苷酸序列的同一性至少为75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%的核苷酸序列;
(c)包含与SEQ ID NO:12所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸的核苷酸序列;或
(d)包含SEQ ID NO:12所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
6.一种靶向载体,其特征在于,所述的靶向载体包含人CCR6基因的至少部分,优选的,所述的人CCR6基因的部分包含人CCR6的1号至3号外显子的全部或部分;进一步优选的,所述的人CCR6基因包含2号外显子的部分和/或3号外显子的部分,其中,所述人CCR6基因的2号外显子的部分至少包含5bp的核苷酸序列,3号外显子的部分至少包含500bp的核苷酸序列;更优选的,所述的靶向载体包含SEQ ID NO:5所示核苷酸序列,
优选的,所述的靶向载体还包含5’臂;优选的,所述的5’臂与NCBI登录号为NC_000083.7至少具有90%同源性的核苷酸;进一步优选的,所述5’臂序列与SEQ ID NO:3或SEQ ID NO:42至少具有90%同源性,或者如SEQ ID NO:3或SEQ ID NO:42所示;和/或,所述的靶向载体还包含3’臂;优选的,所述的3’臂与NCBI登录号为NC_000083.7至少具有90%同源性的核苷酸;进一步优选的,所述的3’臂序列与SEQ ID NO:4或SEQ ID NO:43至少具有90%同源性,或者如SEQ ID NO:4或SEQ ID NO:43所示。
7.一种CCR6基因人源化的非人动物的构建方法,其特征在于,所述的非人动物体内表达人或人源化CCR6蛋白,或者,所述的非人动物的基因组中包含人或人源化CCR6基因。
8.根据权利要求7所述的构建方法,其特征在于,所述的人源化蛋白包含SEQ ID NO:2或与SEQ ID NO:2同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%的氨基酸序列,或者,所述的人源化CCR6基因为权利要求1-5任一所述的人源化CCR6基因。
9.根据权利要求7-8任一所述的构建方法,其特征在于,所述的构建方法包括用包含人CCR6基因的全部或部分导入非人动物CCR6基因座,优选的,所述的构建方法包括用包含人CCR6基因的1号至3号外显子的全部或部分导入非人动物CCR6基因座,进一步优选的,用包含人CCR6的基因的2号至3号外显子的全部或部分导入非人动物基因座,更优选的,用包含人CCR6基因的2号和/或3号外显子的全部或部分导入非人动物CCR6基因座,其中,所述人CCR6基因的2号外显子的部分至少包含5bp的核苷酸序列,3号外显子的部分至少包含500bp的核苷酸序列,优选的,用包含SEQ ID NO:5的核苷酸序列,或用包含与SEQ ID NO:5具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%同一性的核苷酸序列导入非人动物基因座上,
优选的,所述的导入为替换或插入,优选的,所述的导入非人动物CCR6基因座为替换非人动物相应区域,进一步优选的,非人动物CCR6基因的1号至2号外显子的全部或部分被替换,更优选的,非人动物的2号外显子的部分被替换。
10.根据权利要求7-9任一所述的构建方法,其特征在于,人或人源化CCR6基因在非人动物体内通过内源调控元件进行调控。
11.根据权利要求7-10任一所述的构建方法,其特征在于,使用权利要求6所述的靶向载体进行非人动物的构建。
12.根据权利要求7-11任一所述的构建方法,其特征在于,所述的构建方法还包括将CCR6基因人源化的非人动物与其他基因修饰的非人动物交配、体外受精或直接进行基因编辑,并进行筛选,得到多基因修饰的非人动物,
优选的,所述的其他基因选自PD-1、PD-L1、IL4、IL4R、IL6、IL6R、IL17、CCR4和CCR8中的至少一种。
13.一种细胞、组织或器官,其特征在于,所述的细胞、组织或者器官包含权利要求1-5任一所述的人源化CCR6基因,或者所述细胞、组织或者器官来源于权利要求7-12任一所述的构建方法获得的非人动物。
14.根据权利要求7-12任一所述的构建方法或者权利要求13所述的细胞、组织或器官,其特征在于,所述的非人动物为非人哺乳动物;优选的,所述的非人哺乳动物为啮齿类动物;进一步优选的,所述的啮齿类动物为小鼠或大鼠。
15.权利要求1-5任一所述的人源化CCR6基因、权利要求7-12、14任一所述的构建方法获得的非人动物或权利要求13-14任一所述的细胞、组织或器官的应用,所述应用包括:
在需要涉及人类细胞的免疫过程的产品开发,制造抗体,或者作为药理学、免疫学、微生物学、医学研究的模型系统中的应用;
在生产和利用动物实验疾病模型,用于开发新的诊断策略和/或治疗策略中的应用;
或者,
在筛选、验证、评价或研究CCR6功能、人CCR6信号机理、靶向人的抗体、靶向人的药物、药效,心脑血管疾病、神经精神类疾病、免疫相关疾病药物以及抗肿瘤或抗炎症药物,筛选和评估人用药及药效研究方面的应用。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2021102552764 | 2021-03-09 | ||
CN202110255276 | 2021-03-09 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114560925A true CN114560925A (zh) | 2022-05-31 |
Family
ID=81717087
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210231740.0A Withdrawn CN114560925A (zh) | 2021-03-09 | 2022-03-09 | Ccr6基因人源化非人动物的构建方法及应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114560925A (zh) |
-
2022
- 2022-03-09 CN CN202210231740.0A patent/CN114560925A/zh not_active Withdrawn
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107815466B (zh) | 人源化基因改造动物模型的制备方法及应用 | |
CN107815467B (zh) | 人源化基因改造动物模型的制备方法及应用 | |
CN111304246A (zh) | 一种人源化细胞因子动物模型、制备方法及应用 | |
CN111793647B (zh) | Cd226基因人源化非人动物的构建方法及应用 | |
CN113429472A (zh) | Cd94和nkg2a基因人源化的非人动物及其制备方法和应用 | |
CN107955817B (zh) | 人源化基因改造动物模型的制备方法及应用 | |
CN113651892A (zh) | Tlr8基因人源化的非人动物及其构建方法和应用 | |
CN113881681B (zh) | Ccr8基因人源化非人动物及其构建方法和应用 | |
CN114751973B (zh) | Siglec15基因人源化非人动物的构建方法和应用 | |
CN116479050A (zh) | 人源化il2rb和/或il2rg基因改造动物及其制备方法和应用 | |
CN115011606A (zh) | Cd37基因人源化非人动物的构建方法及应用 | |
CN112501205B (zh) | Ceacam1基因人源化非人动物的构建方法及应用 | |
CN112501206B (zh) | Psma基因人源化非人动物的构建方法及应用 | |
CN115785251A (zh) | Tfr1基因人源化非人动物及其构建方法和应用 | |
CN114134152A (zh) | Glp1r基因人源化的非人动物及其构建方法和应用 | |
CN113355355A (zh) | Il23a和/或il12b基因人源化非人动物的构建方法及应用 | |
CN114560925A (zh) | Ccr6基因人源化非人动物的构建方法及应用 | |
CN113388640B (zh) | Ccr4基因人源化的非人动物及其构建方法和应用 | |
CN116463376A (zh) | Baffr和/或baff基因人源化非人动物的构建方法及应用 | |
CN115010799A (zh) | Bcma基因人源化非人动物的构建方法及应用 | |
CN115786354A (zh) | Tgfb1、garp和/或lrrc33基因人源化非人动物的构建方法及应用 | |
CN115918611A (zh) | Tgfbr2基因人源化非人动物及其构建方法和应用 | |
CN115997729A (zh) | Nkp46基因人源化非人动物及其构建方法和应用 | |
CN115948464A (zh) | 一种trem1基因人源化的非人动物及其构建方法和应用 | |
CN115873876A (zh) | Fap基因人源化的非人动物的构建方法及应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20220531 |
|
WW01 | Invention patent application withdrawn after publication |