CN113774086A - A2ar基因人源化非人动物及其构建方法和应用 - Google Patents
A2ar基因人源化非人动物及其构建方法和应用 Download PDFInfo
- Publication number
- CN113774086A CN113774086A CN202110964703.6A CN202110964703A CN113774086A CN 113774086 A CN113774086 A CN 113774086A CN 202110964703 A CN202110964703 A CN 202110964703A CN 113774086 A CN113774086 A CN 113774086A
- Authority
- CN
- China
- Prior art keywords
- a2ar
- human
- seq
- gene
- nucleotide sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 101100215487 Sus scrofa ADRA2A gene Proteins 0.000 title claims abstract description 237
- 238000010276 construction Methods 0.000 title claims abstract description 30
- 239000002773 nucleotide Substances 0.000 claims abstract description 196
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 196
- 101000783751 Homo sapiens Adenosine receptor A2a Proteins 0.000 claims abstract description 107
- 102000055905 human ADORA2A Human genes 0.000 claims abstract description 95
- 230000008685 targeting Effects 0.000 claims abstract description 30
- 239000003814 drug Substances 0.000 claims abstract description 27
- 239000013598 vector Substances 0.000 claims abstract description 26
- 229940079593 drug Drugs 0.000 claims abstract description 24
- 241001465754 Metazoa Species 0.000 claims abstract description 18
- 208000026106 cerebrovascular disease Diseases 0.000 claims abstract description 13
- 208000024172 Cardiovascular disease Diseases 0.000 claims abstract description 12
- 208000012902 Nervous system disease Diseases 0.000 claims abstract description 12
- 208000025966 Neurological disease Diseases 0.000 claims abstract description 11
- 230000002526 effect on cardiovascular system Effects 0.000 claims abstract description 11
- 230000007246 mechanism Effects 0.000 claims abstract description 5
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 54
- 108090000623 proteins and genes Proteins 0.000 claims description 52
- 108020004414 DNA Proteins 0.000 claims description 47
- 210000004027 cell Anatomy 0.000 claims description 44
- 238000000034 method Methods 0.000 claims description 38
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 30
- 201000010099 disease Diseases 0.000 claims description 28
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 27
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 18
- 108700024394 Exon Proteins 0.000 claims description 15
- 210000001519 tissue Anatomy 0.000 claims description 14
- 108020004999 messenger RNA Proteins 0.000 claims description 13
- 238000012216 screening Methods 0.000 claims description 13
- 238000003780 insertion Methods 0.000 claims description 12
- 230000037431 insertion Effects 0.000 claims description 12
- 238000011161 development Methods 0.000 claims description 9
- 230000000857 drug effect Effects 0.000 claims description 8
- 238000006467 substitution reaction Methods 0.000 claims description 8
- 238000012239 gene modification Methods 0.000 claims description 7
- 108091026890 Coding region Proteins 0.000 claims description 6
- 210000000056 organ Anatomy 0.000 claims description 6
- 238000011160 research Methods 0.000 claims description 6
- 150000001413 amino acids Chemical class 0.000 claims description 5
- 238000004519 manufacturing process Methods 0.000 claims description 4
- 230000001225 therapeutic effect Effects 0.000 claims description 4
- 102100023990 60S ribosomal protein L17 Human genes 0.000 claims description 3
- 108010074708 B7-H1 Antigen Proteins 0.000 claims description 3
- 102000008096 B7-H1 Antigen Human genes 0.000 claims description 3
- 102100039498 Cytotoxic T-lymphocyte protein 4 Human genes 0.000 claims description 3
- 102100034458 Hepatitis A virus cellular receptor 2 Human genes 0.000 claims description 3
- 101000889276 Homo sapiens Cytotoxic T-lymphocyte protein 4 Proteins 0.000 claims description 3
- 101001068133 Homo sapiens Hepatitis A virus cellular receptor 2 Proteins 0.000 claims description 3
- 101001137987 Homo sapiens Lymphocyte activation gene 3 protein Proteins 0.000 claims description 3
- 102000017578 LAG3 Human genes 0.000 claims description 3
- 101710089372 Programmed cell death protein 1 Proteins 0.000 claims description 3
- 102100022153 Tumor necrosis factor receptor superfamily member 4 Human genes 0.000 claims description 3
- 101710165473 Tumor necrosis factor receptor superfamily member 4 Proteins 0.000 claims description 3
- 125000000539 amino acid group Chemical group 0.000 claims description 3
- 238000012217 deletion Methods 0.000 claims description 3
- 230000037430 deletion Effects 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 238000012356 Product development Methods 0.000 claims description 2
- 239000002260 anti-inflammatory agent Substances 0.000 claims description 2
- 229940124599 anti-inflammatory drug Drugs 0.000 claims description 2
- 230000000259 anti-tumor effect Effects 0.000 claims description 2
- 239000002246 antineoplastic agent Substances 0.000 claims description 2
- 229940041181 antineoplastic drug Drugs 0.000 claims description 2
- 230000005017 genetic modification Effects 0.000 claims description 2
- 235000013617 genetically modified food Nutrition 0.000 claims description 2
- 210000005260 human cell Anatomy 0.000 claims description 2
- 230000001900 immune effect Effects 0.000 claims description 2
- 230000002906 microbiologic effect Effects 0.000 claims description 2
- 230000000144 pharmacologic effect Effects 0.000 claims description 2
- 230000036039 immunity Effects 0.000 claims 1
- 206010028980 Neoplasm Diseases 0.000 abstract description 30
- 208000023275 Autoimmune disease Diseases 0.000 abstract description 9
- 239000002547 new drug Substances 0.000 abstract description 3
- 108700026220 vif Genes Proteins 0.000 abstract description 2
- 230000006801 homologous recombination Effects 0.000 abstract 1
- 238000002744 homologous recombination Methods 0.000 abstract 1
- 230000000926 neurological effect Effects 0.000 abstract 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 61
- 241000699670 Mus sp. Species 0.000 description 46
- 241000283984 Rodentia Species 0.000 description 23
- 238000001514 detection method Methods 0.000 description 22
- 238000011740 C57BL/6 mouse Methods 0.000 description 21
- 239000012634 fragment Substances 0.000 description 18
- 206010061218 Inflammation Diseases 0.000 description 16
- 238000011577 humanized mouse model Methods 0.000 description 16
- 210000001744 T-lymphocyte Anatomy 0.000 description 15
- 230000004054 inflammatory process Effects 0.000 description 15
- 230000014509 gene expression Effects 0.000 description 13
- 239000000523 sample Substances 0.000 description 13
- 241000700159 Rattus Species 0.000 description 12
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 12
- 210000004989 spleen cell Anatomy 0.000 description 12
- 108091081024 Start codon Proteins 0.000 description 11
- 108020004705 Codon Proteins 0.000 description 10
- 230000006798 recombination Effects 0.000 description 9
- 238000005215 recombination Methods 0.000 description 9
- 241001529936 Murinae Species 0.000 description 8
- NKANXQFJJICGDU-QPLCGJKRSA-N Tamoxifen Chemical compound C=1C=CC=CC=1C(/CC)=C(C=1C=CC(OCCN(C)C)=CC=1)/C1=CC=CC=C1 NKANXQFJJICGDU-QPLCGJKRSA-N 0.000 description 8
- 238000010171 animal model Methods 0.000 description 8
- 239000003550 marker Substances 0.000 description 8
- 210000000952 spleen Anatomy 0.000 description 8
- 210000000265 leukocyte Anatomy 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 238000003752 polymerase chain reaction Methods 0.000 description 7
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 6
- 241000282693 Cercopithecidae Species 0.000 description 6
- 241000283973 Oryctolagus cuniculus Species 0.000 description 6
- 238000002105 Southern blotting Methods 0.000 description 6
- 229960005305 adenosine Drugs 0.000 description 6
- 210000003719 b-lymphocyte Anatomy 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000001727 in vivo Methods 0.000 description 6
- 239000000411 inducer Substances 0.000 description 6
- 210000005259 peripheral blood Anatomy 0.000 description 6
- 239000011886 peripheral blood Substances 0.000 description 6
- 210000004881 tumor cell Anatomy 0.000 description 6
- 238000011816 wild-type C57Bl6 mouse Methods 0.000 description 6
- PAOANWZGLPPROA-RQXXJAGISA-N CGS-21680 Chemical compound O[C@@H]1[C@H](O)[C@@H](C(=O)NCC)O[C@H]1N1C2=NC(NCCC=3C=CC(CCC(O)=O)=CC=3)=NC(N)=C2N=C1 PAOANWZGLPPROA-RQXXJAGISA-N 0.000 description 5
- 101000738771 Homo sapiens Receptor-type tyrosine-protein phosphatase C Proteins 0.000 description 5
- 102100037422 Receptor-type tyrosine-protein phosphatase C Human genes 0.000 description 5
- 238000003556 assay Methods 0.000 description 5
- 210000001671 embryonic stem cell Anatomy 0.000 description 5
- 229920001184 polypeptide Polymers 0.000 description 5
- 102000004196 processed proteins & peptides Human genes 0.000 description 5
- 108090000765 processed proteins & peptides Proteins 0.000 description 5
- 102000004169 proteins and genes Human genes 0.000 description 5
- 230000001105 regulatory effect Effects 0.000 description 5
- 210000001266 CD8-positive T-lymphocyte Anatomy 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- 210000002798 bone marrow cell Anatomy 0.000 description 4
- 238000004113 cell culture Methods 0.000 description 4
- 210000000349 chromosome Anatomy 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- MHMNJMPURVTYEJ-UHFFFAOYSA-N fluorescein-5-isothiocyanate Chemical compound O1C(=O)C2=CC(N=C=S)=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 MHMNJMPURVTYEJ-UHFFFAOYSA-N 0.000 description 4
- 238000003209 gene knockout Methods 0.000 description 4
- 238000010362 genome editing Methods 0.000 description 4
- 210000001616 monocyte Anatomy 0.000 description 4
- 238000003757 reverse transcription PCR Methods 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 229960001603 tamoxifen Drugs 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 101150051188 Adora2a gene Proteins 0.000 description 3
- 102100024222 B-lymphocyte antigen CD19 Human genes 0.000 description 3
- KCPOQGRVVXYLAC-KKUMJFAQSA-N Cys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CS)N KCPOQGRVVXYLAC-KKUMJFAQSA-N 0.000 description 3
- 241000287828 Gallus gallus Species 0.000 description 3
- 101000980825 Homo sapiens B-lymphocyte antigen CD19 Proteins 0.000 description 3
- 101000917858 Homo sapiens Low affinity immunoglobulin gamma Fc region receptor III-A Proteins 0.000 description 3
- 101000917839 Homo sapiens Low affinity immunoglobulin gamma Fc region receptor III-B Proteins 0.000 description 3
- 102100022297 Integrin alpha-X Human genes 0.000 description 3
- 102100029185 Low affinity immunoglobulin gamma Fc region receptor III-B Human genes 0.000 description 3
- 241000699660 Mus musculus Species 0.000 description 3
- 208000015914 Non-Hodgkin lymphomas Diseases 0.000 description 3
- 206010035226 Plasma cell myeloma Diseases 0.000 description 3
- 206010063837 Reperfusion injury Diseases 0.000 description 3
- 238000011579 SCID mouse model Methods 0.000 description 3
- 206010039491 Sarcoma Diseases 0.000 description 3
- 241000282898 Sus scrofa Species 0.000 description 3
- 230000004913 activation Effects 0.000 description 3
- 239000000556 agonist Substances 0.000 description 3
- 210000002459 blastocyst Anatomy 0.000 description 3
- 238000013373 clone screening Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 210000002889 endothelial cell Anatomy 0.000 description 3
- 238000000684 flow cytometry Methods 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 3
- 210000002865 immune cell Anatomy 0.000 description 3
- 208000032839 leukemia Diseases 0.000 description 3
- 210000002540 macrophage Anatomy 0.000 description 3
- 210000000822 natural killer cell Anatomy 0.000 description 3
- 210000000440 neutrophil Anatomy 0.000 description 3
- 238000011580 nude mouse model Methods 0.000 description 3
- 230000037361 pathway Effects 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 208000024891 symptom Diseases 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 208000031261 Acute myeloid leukaemia Diseases 0.000 description 2
- 208000031873 Animal Disease Models Diseases 0.000 description 2
- HFPXZWPUVFVNLL-GUBZILKMSA-N Asn-Leu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFPXZWPUVFVNLL-GUBZILKMSA-N 0.000 description 2
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 2
- 108091033409 CRISPR Proteins 0.000 description 2
- 206010009944 Colon cancer Diseases 0.000 description 2
- 241000699800 Cricetinae Species 0.000 description 2
- TVYMKYUSZSVOAG-ZLUOBGJFSA-N Cys-Ala-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O TVYMKYUSZSVOAG-ZLUOBGJFSA-N 0.000 description 2
- SBDVXRYCOIEYNV-YUMQZZPRSA-N Cys-His-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N SBDVXRYCOIEYNV-YUMQZZPRSA-N 0.000 description 2
- 102000016607 Diphtheria Toxin Human genes 0.000 description 2
- 108010053187 Diphtheria Toxin Proteins 0.000 description 2
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 2
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 2
- 101001046686 Homo sapiens Integrin alpha-M Proteins 0.000 description 2
- 102000003839 Human Proteins Human genes 0.000 description 2
- 108090000144 Human Proteins Proteins 0.000 description 2
- QICVAHODWHIWIS-HTFCKZLJSA-N Ile-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N QICVAHODWHIWIS-HTFCKZLJSA-N 0.000 description 2
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 2
- 102100022338 Integrin alpha-M Human genes 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- 108010025815 Kanamycin Kinase Proteins 0.000 description 2
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 2
- JRJLGNFWYFSJHB-HOCLYGCPSA-N Leu-Gly-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JRJLGNFWYFSJHB-HOCLYGCPSA-N 0.000 description 2
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 2
- 206010025323 Lymphomas Diseases 0.000 description 2
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- LRALLISKBZNSKN-BQBZGAKWSA-N Met-Gly-Ser Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LRALLISKBZNSKN-BQBZGAKWSA-N 0.000 description 2
- 208000034578 Multiple myelomas Diseases 0.000 description 2
- 101100120552 Mus musculus Foxp3 gene Proteins 0.000 description 2
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 2
- 108010066427 N-valyltryptophan Proteins 0.000 description 2
- 206010061306 Nasopharyngeal cancer Diseases 0.000 description 2
- NQZFFLBPNDLTPO-DLOVCJGASA-N Ser-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CO)N NQZFFLBPNDLTPO-DLOVCJGASA-N 0.000 description 2
- ODRUTDLAONAVDV-IHRRRGAJSA-N Ser-Val-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ODRUTDLAONAVDV-IHRRRGAJSA-N 0.000 description 2
- 241000121210 Sigmodontinae Species 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- ZTPXSEUVYNNZRB-CDMKHQONSA-N Thr-Gly-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZTPXSEUVYNNZRB-CDMKHQONSA-N 0.000 description 2
- BDENGIGFTNYZSJ-RCWTZXSCSA-N Thr-Pro-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O BDENGIGFTNYZSJ-RCWTZXSCSA-N 0.000 description 2
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 2
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 2
- 238000011558 animal model by disease Methods 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 210000001185 bone marrow Anatomy 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 210000003169 central nervous system Anatomy 0.000 description 2
- 208000029742 colonic neoplasm Diseases 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 208000035475 disorder Diseases 0.000 description 2
- 210000003162 effector t lymphocyte Anatomy 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000001976 enzyme digestion Methods 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 2
- 108010050848 glycylleucine Proteins 0.000 description 2
- 210000003714 granulocyte Anatomy 0.000 description 2
- 108010040030 histidinoalanine Proteins 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 208000012947 ischemia reperfusion injury Diseases 0.000 description 2
- 108010027338 isoleucylcysteine Proteins 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 108010009298 lysylglutamic acid Proteins 0.000 description 2
- 210000001161 mammalian embryo Anatomy 0.000 description 2
- 230000013011 mating Effects 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 238000010172 mouse model Methods 0.000 description 2
- 108010084572 phenylalanyl-valine Proteins 0.000 description 2
- 230000003234 polygenic effect Effects 0.000 description 2
- 230000035755 proliferation Effects 0.000 description 2
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 108700019620 rat Foxp3 Proteins 0.000 description 2
- 210000003289 regulatory T cell Anatomy 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 230000019491 signal transduction Effects 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 210000001082 somatic cell Anatomy 0.000 description 2
- 230000000638 stimulation Effects 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000002054 transplantation Methods 0.000 description 2
- 108010080629 tryptophan-leucine Proteins 0.000 description 2
- NHBKXEKEPDILRR-UHFFFAOYSA-N 2,3-bis(butanoylsulfanyl)propyl butanoate Chemical compound CCCC(=O)OCC(SC(=O)CCC)CSC(=O)CCC NHBKXEKEPDILRR-UHFFFAOYSA-N 0.000 description 1
- PEZMQPADLFXCJJ-ZETCQYMHSA-N 2-[[2-[[(2s)-1-(2-aminoacetyl)pyrrolidine-2-carbonyl]amino]acetyl]amino]acetic acid Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(=O)NCC(O)=O PEZMQPADLFXCJJ-ZETCQYMHSA-N 0.000 description 1
- 102100022464 5'-nucleotidase Human genes 0.000 description 1
- 208000024893 Acute lymphoblastic leukemia Diseases 0.000 description 1
- 208000014697 Acute lymphocytic leukaemia Diseases 0.000 description 1
- 102000007471 Adenosine A2A receptor Human genes 0.000 description 1
- 108010085277 Adenosine A2A receptor Proteins 0.000 description 1
- 102100035990 Adenosine receptor A2a Human genes 0.000 description 1
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 1
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 1
- SDMAQFGBPOJFOM-GUBZILKMSA-N Ala-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SDMAQFGBPOJFOM-GUBZILKMSA-N 0.000 description 1
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 1
- IYCZBJXFSZSHPN-DLOVCJGASA-N Ala-Cys-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IYCZBJXFSZSHPN-DLOVCJGASA-N 0.000 description 1
- IFTVANMRTIHKML-WDSKDSINSA-N Ala-Gln-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O IFTVANMRTIHKML-WDSKDSINSA-N 0.000 description 1
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 1
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 1
- CBCCCLMNOBLBSC-XVYDVKMFSA-N Ala-His-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CBCCCLMNOBLBSC-XVYDVKMFSA-N 0.000 description 1
- CFPQUJZTLUQUTJ-HTFCKZLJSA-N Ala-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](C)N CFPQUJZTLUQUTJ-HTFCKZLJSA-N 0.000 description 1
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 1
- LNNSWWRRYJLGNI-NAKRPEOUSA-N Ala-Ile-Val Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O LNNSWWRRYJLGNI-NAKRPEOUSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- XAXHGSOBFPIRFG-LSJOCFKGSA-N Ala-Pro-His Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XAXHGSOBFPIRFG-LSJOCFKGSA-N 0.000 description 1
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 1
- UCDOXFBTMLKASE-HERUPUMHSA-N Ala-Ser-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N UCDOXFBTMLKASE-HERUPUMHSA-N 0.000 description 1
- 201000003076 Angiosarcoma Diseases 0.000 description 1
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 1
- VDBKFYYIBLXEIF-GUBZILKMSA-N Arg-Gln-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VDBKFYYIBLXEIF-GUBZILKMSA-N 0.000 description 1
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 1
- AIFHRTPABBBHKU-RCWTZXSCSA-N Arg-Thr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AIFHRTPABBBHKU-RCWTZXSCSA-N 0.000 description 1
- VYZBPPBKFCHCIS-WPRPVWTQSA-N Arg-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N VYZBPPBKFCHCIS-WPRPVWTQSA-N 0.000 description 1
- YNSCBOUZTAGIGO-ZLUOBGJFSA-N Asn-Asn-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N)C(=O)N YNSCBOUZTAGIGO-ZLUOBGJFSA-N 0.000 description 1
- RRVBEKYEFMCDIF-WHFBIAKZSA-N Asn-Cys-Gly Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N)C(=O)N RRVBEKYEFMCDIF-WHFBIAKZSA-N 0.000 description 1
- FJIRXKVEDFLLOQ-SRVKXCTJSA-N Asn-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)N)N FJIRXKVEDFLLOQ-SRVKXCTJSA-N 0.000 description 1
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 1
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 1
- UDSVWSUXKYXSTR-QWRGUYRKSA-N Asn-Gly-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UDSVWSUXKYXSTR-QWRGUYRKSA-N 0.000 description 1
- AITGTTNYKAWKDR-CIUDSAMLSA-N Asn-His-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O AITGTTNYKAWKDR-CIUDSAMLSA-N 0.000 description 1
- FTNRWCPWDWRPAV-BZSNNMDCSA-N Asn-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CC(N)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FTNRWCPWDWRPAV-BZSNNMDCSA-N 0.000 description 1
- SZNGQSBRHFMZLT-IHRRRGAJSA-N Asn-Pro-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SZNGQSBRHFMZLT-IHRRRGAJSA-N 0.000 description 1
- NJPLPRFQLBZAMH-IHRRRGAJSA-N Asn-Tyr-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCSC)C(O)=O NJPLPRFQLBZAMH-IHRRRGAJSA-N 0.000 description 1
- QUCCLIXMVPIVOB-BZSNNMDCSA-N Asn-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)N)N QUCCLIXMVPIVOB-BZSNNMDCSA-N 0.000 description 1
- LKIYSIYBKYLKPU-BIIVOSGPSA-N Asp-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O LKIYSIYBKYLKPU-BIIVOSGPSA-N 0.000 description 1
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 1
- WSXDIZFNQYTUJB-SRVKXCTJSA-N Asp-His-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O WSXDIZFNQYTUJB-SRVKXCTJSA-N 0.000 description 1
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 1
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 1
- 206010003571 Astrocytoma Diseases 0.000 description 1
- 206010003591 Ataxia Diseases 0.000 description 1
- 208000036170 B-Cell Marginal Zone Lymphoma Diseases 0.000 description 1
- 208000025324 B-cell acute lymphoblastic leukemia Diseases 0.000 description 1
- 208000010839 B-cell chronic lymphocytic leukemia Diseases 0.000 description 1
- 208000003950 B-cell lymphoma Diseases 0.000 description 1
- 208000032791 BCR-ABL1 positive chronic myelogenous leukemia Diseases 0.000 description 1
- 206010004593 Bile duct cancer Diseases 0.000 description 1
- 206010005003 Bladder cancer Diseases 0.000 description 1
- 206010005949 Bone cancer Diseases 0.000 description 1
- 208000018084 Bone neoplasm Diseases 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 238000011752 CBA/J (JAX™ mouse strain) Methods 0.000 description 1
- 102000017420 CD3 protein, epsilon/gamma/delta subunit Human genes 0.000 description 1
- 238000010354 CRISPR gene editing Methods 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 208000031229 Cardiomyopathies Diseases 0.000 description 1
- 208000005243 Chondrosarcoma Diseases 0.000 description 1
- 208000010833 Chronic myeloid leukaemia Diseases 0.000 description 1
- 206010009900 Colitis ulcerative Diseases 0.000 description 1
- 208000002330 Congenital Heart Defects Diseases 0.000 description 1
- MWZSCEAYQCMROW-GUBZILKMSA-N Cys-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CS)N MWZSCEAYQCMROW-GUBZILKMSA-N 0.000 description 1
- GCDLPNRHPWBKJJ-WDSKDSINSA-N Cys-Gly-Glu Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O GCDLPNRHPWBKJJ-WDSKDSINSA-N 0.000 description 1
- MBRWOKXNHTUJMB-CIUDSAMLSA-N Cys-Pro-Glu Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O MBRWOKXNHTUJMB-CIUDSAMLSA-N 0.000 description 1
- QUQHPUMRFGFINP-BPUTZDHNSA-N Cys-Trp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CS)N QUQHPUMRFGFINP-BPUTZDHNSA-N 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 238000011765 DBA/2 mouse Methods 0.000 description 1
- 206010051055 Deep vein thrombosis Diseases 0.000 description 1
- 101100364969 Dictyostelium discoideum scai gene Proteins 0.000 description 1
- 208000012661 Dyskinesia Diseases 0.000 description 1
- 206010014733 Endometrial cancer Diseases 0.000 description 1
- 206010014759 Endometrial neoplasm Diseases 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 1
- 208000006168 Ewing Sarcoma Diseases 0.000 description 1
- 102100027280 Fanconi anemia group A protein Human genes 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 201000008808 Fibrosarcoma Diseases 0.000 description 1
- 102000003688 G-Protein-Coupled Receptors Human genes 0.000 description 1
- 108090000045 G-Protein-Coupled Receptors Proteins 0.000 description 1
- 241000699694 Gerbillinae Species 0.000 description 1
- KCJJFESQRXGTGC-BQBZGAKWSA-N Gln-Glu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O KCJJFESQRXGTGC-BQBZGAKWSA-N 0.000 description 1
- LLRJEFPKIIBGJP-DCAQKATOSA-N Gln-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N LLRJEFPKIIBGJP-DCAQKATOSA-N 0.000 description 1
- VOLVNCMGXWDDQY-LPEHRKFASA-N Gln-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O VOLVNCMGXWDDQY-LPEHRKFASA-N 0.000 description 1
- ZNZPKVQURDQFFS-FXQIFTODSA-N Gln-Glu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZNZPKVQURDQFFS-FXQIFTODSA-N 0.000 description 1
- XKBASPWPBXNVLQ-WDSKDSINSA-N Gln-Gly-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XKBASPWPBXNVLQ-WDSKDSINSA-N 0.000 description 1
- HVQCEQTUSWWFOS-WDSKDSINSA-N Gln-Gly-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N HVQCEQTUSWWFOS-WDSKDSINSA-N 0.000 description 1
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 1
- TWIAMTNJOMRDAK-GUBZILKMSA-N Gln-Lys-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O TWIAMTNJOMRDAK-GUBZILKMSA-N 0.000 description 1
- HPCOBEHVEHWREJ-DCAQKATOSA-N Gln-Lys-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HPCOBEHVEHWREJ-DCAQKATOSA-N 0.000 description 1
- QMVCEWKHIUHTSD-GUBZILKMSA-N Gln-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N QMVCEWKHIUHTSD-GUBZILKMSA-N 0.000 description 1
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 1
- MFORDNZDKAVNSR-SRVKXCTJSA-N Gln-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O MFORDNZDKAVNSR-SRVKXCTJSA-N 0.000 description 1
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 1
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 1
- WATXSTJXNBOHKD-LAEOZQHASA-N Glu-Asp-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O WATXSTJXNBOHKD-LAEOZQHASA-N 0.000 description 1
- HTTSBEBKVNEDFE-AUTRQRHGSA-N Glu-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N HTTSBEBKVNEDFE-AUTRQRHGSA-N 0.000 description 1
- WRNAXCVRSBBKGS-BQBZGAKWSA-N Glu-Gly-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O WRNAXCVRSBBKGS-BQBZGAKWSA-N 0.000 description 1
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 1
- VGOFRWOTSXVPAU-SDDRHHMPSA-N Glu-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VGOFRWOTSXVPAU-SDDRHHMPSA-N 0.000 description 1
- DAHLWSFUXOHMIA-FXQIFTODSA-N Glu-Ser-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O DAHLWSFUXOHMIA-FXQIFTODSA-N 0.000 description 1
- ZALGPUWUVHOGAE-GVXVVHGQSA-N Glu-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZALGPUWUVHOGAE-GVXVVHGQSA-N 0.000 description 1
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 1
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 1
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 1
- HFXJIZNEXNIZIJ-BQBZGAKWSA-N Gly-Glu-Gln Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFXJIZNEXNIZIJ-BQBZGAKWSA-N 0.000 description 1
- YFGONBOFGGWKKY-VHSXEESVSA-N Gly-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)CN)C(=O)O YFGONBOFGGWKKY-VHSXEESVSA-N 0.000 description 1
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 1
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 1
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 1
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 1
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- 206010019280 Heart failures Diseases 0.000 description 1
- 208000001258 Hemangiosarcoma Diseases 0.000 description 1
- 208000035186 Hemolytic Autoimmune Anemia Diseases 0.000 description 1
- 208000027761 Hepatic autoimmune disease Diseases 0.000 description 1
- BIAKMWKJMQLZOJ-ZKWXMUAHSA-N His-Ala-Ala Chemical compound C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O BIAKMWKJMQLZOJ-ZKWXMUAHSA-N 0.000 description 1
- FIMNVXRZGUAGBI-AVGNSLFASA-N His-Glu-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FIMNVXRZGUAGBI-AVGNSLFASA-N 0.000 description 1
- MLZVJIREOKTDAR-SIGLWIIPSA-N His-Ile-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MLZVJIREOKTDAR-SIGLWIIPSA-N 0.000 description 1
- PYNPBMCLAKTHJL-SRVKXCTJSA-N His-Pro-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O PYNPBMCLAKTHJL-SRVKXCTJSA-N 0.000 description 1
- CWSZWFILCNSNEX-CIUDSAMLSA-N His-Ser-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CWSZWFILCNSNEX-CIUDSAMLSA-N 0.000 description 1
- 208000017604 Hodgkin disease Diseases 0.000 description 1
- 208000021519 Hodgkin lymphoma Diseases 0.000 description 1
- 208000010747 Hodgkins lymphoma Diseases 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000678236 Homo sapiens 5'-nucleotidase Proteins 0.000 description 1
- 101000914673 Homo sapiens Fanconi anemia group A protein Proteins 0.000 description 1
- 101100341519 Homo sapiens ITGAX gene Proteins 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- 206010020850 Hyperthyroidism Diseases 0.000 description 1
- 206010070511 Hypoxic-ischaemic encephalopathy Diseases 0.000 description 1
- 206010021245 Idiopathic thrombocytopenic purpura Diseases 0.000 description 1
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 1
- RSDHVTMRXSABSV-GHCJXIJMSA-N Ile-Asn-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N RSDHVTMRXSABSV-GHCJXIJMSA-N 0.000 description 1
- QZZIBQZLWBOOJH-PEDHHIEDSA-N Ile-Ile-Val Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)O QZZIBQZLWBOOJH-PEDHHIEDSA-N 0.000 description 1
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 1
- SNHYFFQZRFIRHO-CYDGBPFRSA-N Ile-Met-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)O)N SNHYFFQZRFIRHO-CYDGBPFRSA-N 0.000 description 1
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 1
- FGBRXCZYVRFNKQ-MXAVVETBSA-N Ile-Phe-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N FGBRXCZYVRFNKQ-MXAVVETBSA-N 0.000 description 1
- QHUREMVLLMNUAX-OSUNSFLBSA-N Ile-Thr-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)O)N QHUREMVLLMNUAX-OSUNSFLBSA-N 0.000 description 1
- DTPGSUQHUMELQB-GVARAGBVSA-N Ile-Tyr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 DTPGSUQHUMELQB-GVARAGBVSA-N 0.000 description 1
- 206010061216 Infarction Diseases 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 208000008839 Kidney Neoplasms Diseases 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- 102220470475 L-seryl-tRNA(Sec) kinase_C57L_mutation Human genes 0.000 description 1
- 208000031671 Large B-Cell Diffuse Lymphoma Diseases 0.000 description 1
- 208000018142 Leiomyosarcoma Diseases 0.000 description 1
- 206010024229 Leprosy Diseases 0.000 description 1
- 241000880493 Leptailurus serval Species 0.000 description 1
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 1
- QPRQGENIBFLVEB-BJDJZHNGSA-N Leu-Ala-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O QPRQGENIBFLVEB-BJDJZHNGSA-N 0.000 description 1
- GRZSCTXVCDUIPO-SRVKXCTJSA-N Leu-Arg-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRZSCTXVCDUIPO-SRVKXCTJSA-N 0.000 description 1
- UILIPCLTHRPCRB-XUXIUFHCSA-N Leu-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(C)C)N UILIPCLTHRPCRB-XUXIUFHCSA-N 0.000 description 1
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 1
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 1
- HQPHMEPBNUHPKD-XIRDDKMYSA-N Leu-Cys-Trp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N HQPHMEPBNUHPKD-XIRDDKMYSA-N 0.000 description 1
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 1
- XQXGNBFMAXWIGI-MXAVVETBSA-N Leu-His-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CN=CN1 XQXGNBFMAXWIGI-MXAVVETBSA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 1
- LQUIENKUVKPNIC-ULQDDVLXSA-N Leu-Met-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LQUIENKUVKPNIC-ULQDDVLXSA-N 0.000 description 1
- ZDBMWELMUCLUPL-QEJZJMRPSA-N Leu-Phe-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ZDBMWELMUCLUPL-QEJZJMRPSA-N 0.000 description 1
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 1
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 1
- ADJWHHZETYAAAX-SRVKXCTJSA-N Leu-Ser-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ADJWHHZETYAAAX-SRVKXCTJSA-N 0.000 description 1
- TUIOUEWKFFVNLH-DCAQKATOSA-N Leu-Val-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O TUIOUEWKFFVNLH-DCAQKATOSA-N 0.000 description 1
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 1
- 208000031422 Lymphocytic Chronic B-Cell Leukemia Diseases 0.000 description 1
- CKSBRMUOQDNPKZ-SRVKXCTJSA-N Lys-Gln-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O CKSBRMUOQDNPKZ-SRVKXCTJSA-N 0.000 description 1
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 1
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 1
- 208000025205 Mantle-Cell Lymphoma Diseases 0.000 description 1
- DLAFCQWUMFMZSN-GUBZILKMSA-N Met-Arg-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N DLAFCQWUMFMZSN-GUBZILKMSA-N 0.000 description 1
- QLESZRANMSYLCZ-CYDGBPFRSA-N Met-Pro-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O QLESZRANMSYLCZ-CYDGBPFRSA-N 0.000 description 1
- 101100341513 Mus musculus Itgam gene Proteins 0.000 description 1
- 101001065556 Mus musculus Lymphocyte antigen 6G Proteins 0.000 description 1
- 101100364971 Mus musculus Scai gene Proteins 0.000 description 1
- 241000699669 Mus saxicola Species 0.000 description 1
- 201000003793 Myelodysplastic syndrome Diseases 0.000 description 1
- 208000033761 Myelogenous Chronic BCR-ABL Positive Leukemia Diseases 0.000 description 1
- 208000033776 Myeloid Acute Leukemia Diseases 0.000 description 1
- 208000009525 Myocarditis Diseases 0.000 description 1
- 206010068871 Myotonic dystrophy Diseases 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 108010057466 NF-kappa B Proteins 0.000 description 1
- 102000003945 NF-kappa B Human genes 0.000 description 1
- 208000002454 Nasopharyngeal Carcinoma Diseases 0.000 description 1
- 208000001894 Nasopharyngeal Neoplasms Diseases 0.000 description 1
- 208000037212 Neonatal hypoxic and ischemic brain injury Diseases 0.000 description 1
- 101100290374 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) mcd-4 gene Proteins 0.000 description 1
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 1
- 206010033128 Ovarian cancer Diseases 0.000 description 1
- 206010061535 Ovarian neoplasm Diseases 0.000 description 1
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 1
- 208000018737 Parkinson disease Diseases 0.000 description 1
- 208000037273 Pathologic Processes Diseases 0.000 description 1
- 208000018262 Peripheral vascular disease Diseases 0.000 description 1
- MDHZEOMXGNBSIL-DLOVCJGASA-N Phe-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N MDHZEOMXGNBSIL-DLOVCJGASA-N 0.000 description 1
- BBDSZDHUCPSYAC-QEJZJMRPSA-N Phe-Ala-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BBDSZDHUCPSYAC-QEJZJMRPSA-N 0.000 description 1
- QMMRHASQEVCJGR-UBHSHLNASA-N Phe-Ala-Pro Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 QMMRHASQEVCJGR-UBHSHLNASA-N 0.000 description 1
- WFDAEEUZPZSMOG-SRVKXCTJSA-N Phe-Cys-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O WFDAEEUZPZSMOG-SRVKXCTJSA-N 0.000 description 1
- KXUZHWXENMYOHC-QEJZJMRPSA-N Phe-Leu-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUZHWXENMYOHC-QEJZJMRPSA-N 0.000 description 1
- DNAXXTQSTKOHFO-QEJZJMRPSA-N Phe-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 DNAXXTQSTKOHFO-QEJZJMRPSA-N 0.000 description 1
- PBWNICYZGJQKJV-BZSNNMDCSA-N Phe-Phe-Cys Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CS)C(O)=O PBWNICYZGJQKJV-BZSNNMDCSA-N 0.000 description 1
- BPIMVBKDLSBKIJ-FCLVOEFKSA-N Phe-Thr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BPIMVBKDLSBKIJ-FCLVOEFKSA-N 0.000 description 1
- 208000006664 Precursor Cell Lymphoblastic Leukemia-Lymphoma Diseases 0.000 description 1
- XROLYVMNVIKVEM-BQBZGAKWSA-N Pro-Asn-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O XROLYVMNVIKVEM-BQBZGAKWSA-N 0.000 description 1
- NGNNPLJHUFCOMZ-FXQIFTODSA-N Pro-Asp-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 NGNNPLJHUFCOMZ-FXQIFTODSA-N 0.000 description 1
- XUSDDSLCRPUKLP-QXEWZRGKSA-N Pro-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 XUSDDSLCRPUKLP-QXEWZRGKSA-N 0.000 description 1
- VYWNORHENYEQDW-YUMQZZPRSA-N Pro-Gly-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 VYWNORHENYEQDW-YUMQZZPRSA-N 0.000 description 1
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 1
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 1
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 1
- SRBFGSGDNNQABI-FHWLQOOXSA-N Pro-Leu-Trp Chemical compound N([C@@H](CC(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C(=O)[C@@H]1CCCN1 SRBFGSGDNNQABI-FHWLQOOXSA-N 0.000 description 1
- BLJMJZOMZRCESA-GUBZILKMSA-N Pro-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@@H]1CCCN1 BLJMJZOMZRCESA-GUBZILKMSA-N 0.000 description 1
- LGMBKOAPPTYKLC-JYJNAYRXSA-N Pro-Phe-Arg Chemical compound C([C@@H](C(=O)N[C@@H](CCCNC(=N)N)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 LGMBKOAPPTYKLC-JYJNAYRXSA-N 0.000 description 1
- MHBSUKYVBZVQRW-HJWJTTGWSA-N Pro-Phe-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MHBSUKYVBZVQRW-HJWJTTGWSA-N 0.000 description 1
- LEIKGVHQTKHOLM-IUCAKERBSA-N Pro-Pro-Gly Chemical compound OC(=O)CNC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 LEIKGVHQTKHOLM-IUCAKERBSA-N 0.000 description 1
- 208000028872 Progressive muscular dystrophy Diseases 0.000 description 1
- 206010060862 Prostate cancer Diseases 0.000 description 1
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 1
- 208000010378 Pulmonary Embolism Diseases 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 208000015634 Rectal Neoplasms Diseases 0.000 description 1
- 206010038389 Renal cancer Diseases 0.000 description 1
- 206010039710 Scleroderma Diseases 0.000 description 1
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 1
- FYUIFUJFNCLUIX-XVYDVKMFSA-N Ser-His-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O FYUIFUJFNCLUIX-XVYDVKMFSA-N 0.000 description 1
- ZUDXUJSYCCNZQJ-DCAQKATOSA-N Ser-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CO)N ZUDXUJSYCCNZQJ-DCAQKATOSA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 1
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 1
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 1
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 1
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 1
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 1
- 206010072170 Skin wound Diseases 0.000 description 1
- 108020004688 Small Nuclear RNA Proteins 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 208000021712 Soft tissue sarcoma Diseases 0.000 description 1
- 208000027520 Somatoform disease Diseases 0.000 description 1
- 208000005718 Stomach Neoplasms Diseases 0.000 description 1
- 108091027544 Subgenomic mRNA Proteins 0.000 description 1
- 230000006044 T cell activation Effects 0.000 description 1
- 208000029052 T-cell acute lymphoblastic leukemia Diseases 0.000 description 1
- 206010042971 T-cell lymphoma Diseases 0.000 description 1
- 208000027585 T-cell non-Hodgkin lymphoma Diseases 0.000 description 1
- 210000000662 T-lymphocyte subset Anatomy 0.000 description 1
- 238000010459 TALEN Methods 0.000 description 1
- 208000024313 Testicular Neoplasms Diseases 0.000 description 1
- 206010057644 Testis cancer Diseases 0.000 description 1
- CAGTXGDOIFXLPC-KZVJFYERSA-N Thr-Arg-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N CAGTXGDOIFXLPC-KZVJFYERSA-N 0.000 description 1
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 1
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 1
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 1
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 1
- JWQNAFHCXKVZKZ-UVOCVTCTSA-N Thr-Lys-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWQNAFHCXKVZKZ-UVOCVTCTSA-N 0.000 description 1
- 208000031981 Thrombocytopenic Idiopathic Purpura Diseases 0.000 description 1
- 208000007536 Thrombosis Diseases 0.000 description 1
- 208000024770 Thyroid neoplasm Diseases 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- BDWDMRSGCXEDMR-WFBYXXMGSA-N Trp-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N BDWDMRSGCXEDMR-WFBYXXMGSA-N 0.000 description 1
- NMCBVGFGWSIGSB-NUTKFTJISA-N Trp-Ala-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NMCBVGFGWSIGSB-NUTKFTJISA-N 0.000 description 1
- BIJDDZBDSJLWJY-PJODQICGSA-N Trp-Ala-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O BIJDDZBDSJLWJY-PJODQICGSA-N 0.000 description 1
- AZBIIKDSDLVJAK-VHWLVUOQSA-N Trp-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N AZBIIKDSDLVJAK-VHWLVUOQSA-N 0.000 description 1
- YLGQHMHKAASRGJ-WDSOQIARSA-N Trp-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N YLGQHMHKAASRGJ-WDSOQIARSA-N 0.000 description 1
- GWBWCGITOYODER-YTQUADARSA-N Trp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GWBWCGITOYODER-YTQUADARSA-N 0.000 description 1
- NMOIRIIIUVELLY-WDSOQIARSA-N Trp-Val-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)C(C)C)=CNC2=C1 NMOIRIIIUVELLY-WDSOQIARSA-N 0.000 description 1
- 102100040247 Tumor necrosis factor Human genes 0.000 description 1
- KDGFPPHLXCEQRN-STECZYCISA-N Tyr-Arg-Ile Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDGFPPHLXCEQRN-STECZYCISA-N 0.000 description 1
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 1
- 201000006704 Ulcerative Colitis Diseases 0.000 description 1
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 1
- WOCYUGQDXPTQPY-FXQIFTODSA-N Val-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N WOCYUGQDXPTQPY-FXQIFTODSA-N 0.000 description 1
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 1
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 1
- WANVRBAZGSICCP-SRVKXCTJSA-N Val-Pro-Met Chemical compound CSCC[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C)C(O)=O WANVRBAZGSICCP-SRVKXCTJSA-N 0.000 description 1
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 1
- IRAUYEAFPFPVND-UVBJJODRSA-N Val-Trp-Ala Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 IRAUYEAFPFPVND-UVBJJODRSA-N 0.000 description 1
- OWFGFHQMSBTKLX-UFYCRDLUSA-N Val-Tyr-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N OWFGFHQMSBTKLX-UFYCRDLUSA-N 0.000 description 1
- DFQZDQPLWBSFEJ-LSJOCFKGSA-N Val-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DFQZDQPLWBSFEJ-LSJOCFKGSA-N 0.000 description 1
- 206010047249 Venous thrombosis Diseases 0.000 description 1
- 208000033559 Waldenström macroglobulinemia Diseases 0.000 description 1
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 1
- 230000001154 acute effect Effects 0.000 description 1
- 208000038016 acute inflammation Diseases 0.000 description 1
- 230000006022 acute inflammation Effects 0.000 description 1
- 102000030621 adenylate cyclase Human genes 0.000 description 1
- 108060000200 adenylate cyclase Proteins 0.000 description 1
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 1
- 108010078114 alanyl-tryptophyl-alanine Proteins 0.000 description 1
- 108010047495 alanylglycine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 208000026935 allergic disease Diseases 0.000 description 1
- 230000007815 allergy Effects 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 230000008485 antagonism Effects 0.000 description 1
- 230000001093 anti-cancer Effects 0.000 description 1
- 102000025171 antigen binding proteins Human genes 0.000 description 1
- 108091000831 antigen binding proteins Proteins 0.000 description 1
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 108010077245 asparaginyl-proline Proteins 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 208000006673 asthma Diseases 0.000 description 1
- 201000000448 autoimmune hemolytic anemia Diseases 0.000 description 1
- 201000003710 autoimmune thrombocytopenic purpura Diseases 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 208000026900 bile duct neoplasm Diseases 0.000 description 1
- 102000023732 binding proteins Human genes 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 210000001772 blood platelet Anatomy 0.000 description 1
- 230000036772 blood pressure Effects 0.000 description 1
- 208000009973 brain hypoxia - ischemia Diseases 0.000 description 1
- 208000029028 brain injury Diseases 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 210000000748 cardiovascular system Anatomy 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 210000001638 cerebellum Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 208000006990 cholangiocarcinoma Diseases 0.000 description 1
- 208000037976 chronic inflammation Diseases 0.000 description 1
- 230000006020 chronic inflammation Effects 0.000 description 1
- 208000032852 chronic lymphocytic leukemia Diseases 0.000 description 1
- 210000001728 clone cell Anatomy 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 208000028831 congenital heart disease Diseases 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 239000013256 coordination polymer Substances 0.000 description 1
- 208000029078 coronary artery disease Diseases 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 108010060199 cysteinylproline Proteins 0.000 description 1
- 230000001461 cytolytic effect Effects 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- 230000003412 degenerative effect Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 206010012818 diffuse large B-cell lymphoma Diseases 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 210000005064 dopaminergic neuron Anatomy 0.000 description 1
- 238000009509 drug development Methods 0.000 description 1
- 238000007877 drug screening Methods 0.000 description 1
- 238000003255 drug test Methods 0.000 description 1
- 238000002651 drug therapy Methods 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 201000004101 esophageal cancer Diseases 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000004720 fertilization Effects 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 201000003444 follicular lymphoma Diseases 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 235000012631 food intake Nutrition 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 206010017758 gastric cancer Diseases 0.000 description 1
- 238000010363 gene targeting Methods 0.000 description 1
- 208000005017 glioblastoma Diseases 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 1
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 201000010536 head and neck cancer Diseases 0.000 description 1
- 208000014829 head and neck neoplasm Diseases 0.000 description 1
- 230000035876 healing Effects 0.000 description 1
- 210000002216 heart Anatomy 0.000 description 1
- 230000002008 hemorrhagic effect Effects 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 210000001320 hippocampus Anatomy 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 210000003016 hypothalamus Anatomy 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 230000006058 immune tolerance Effects 0.000 description 1
- 230000000984 immunochemical effect Effects 0.000 description 1
- 230000001506 immunosuppresive effect Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000011503 in vivo imaging Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000007574 infarction Effects 0.000 description 1
- 230000002757 inflammatory effect Effects 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- 230000031146 intracellular signal transduction Effects 0.000 description 1
- 230000000302 ischemic effect Effects 0.000 description 1
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 201000010982 kidney cancer Diseases 0.000 description 1
- 108010034529 leucyl-lysine Proteins 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 206010024627 liposarcoma Diseases 0.000 description 1
- 201000007270 liver cancer Diseases 0.000 description 1
- 208000014018 liver neoplasm Diseases 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 201000005296 lung carcinoma Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 210000001165 lymph node Anatomy 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 230000000527 lymphocytic effect Effects 0.000 description 1
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 1
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 1
- 201000007924 marginal zone B-cell lymphoma Diseases 0.000 description 1
- 208000021937 marginal zone lymphoma Diseases 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 230000004066 metabolic change Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 230000001394 metastastic effect Effects 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 210000000274 microglia Anatomy 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 238000002715 modification method Methods 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 210000000066 myeloid cell Anatomy 0.000 description 1
- 201000000050 myeloid neoplasm Diseases 0.000 description 1
- 208000010125 myocardial infarction Diseases 0.000 description 1
- 208000031225 myocardial ischemia Diseases 0.000 description 1
- 201000011216 nasopharynx carcinoma Diseases 0.000 description 1
- 230000002956 necrotizing effect Effects 0.000 description 1
- 210000001577 neostriatum Anatomy 0.000 description 1
- 201000008383 nephritis Diseases 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 210000000653 nervous system Anatomy 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000000324 neuroprotective effect Effects 0.000 description 1
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 210000001010 olfactory tubercle Anatomy 0.000 description 1
- 238000002515 oligonucleotide synthesis Methods 0.000 description 1
- 201000008968 osteosarcoma Diseases 0.000 description 1
- 210000003101 oviduct Anatomy 0.000 description 1
- 208000027753 pain disease Diseases 0.000 description 1
- 201000002528 pancreatic cancer Diseases 0.000 description 1
- 208000008443 pancreatic carcinoma Diseases 0.000 description 1
- 210000004738 parenchymal cell Anatomy 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000009054 pathological process Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 208000033300 perinatal asphyxia Diseases 0.000 description 1
- 208000029308 periodic paralysis Diseases 0.000 description 1
- 210000004976 peripheral blood cell Anatomy 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 239000002504 physiological saline solution Substances 0.000 description 1
- 208000031223 plasma cell leukemia Diseases 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 238000012910 preclinical development Methods 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 1
- 108010029020 prolylglycine Proteins 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 206010038038 rectal cancer Diseases 0.000 description 1
- 201000001275 rectum cancer Diseases 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 201000009410 rhabdomyosarcoma Diseases 0.000 description 1
- 208000004124 rheumatic heart disease Diseases 0.000 description 1
- 206010039073 rheumatoid arthritis Diseases 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- -1 scRNA Proteins 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 210000004988 splenocyte Anatomy 0.000 description 1
- 208000010110 spontaneous platelet aggregation Diseases 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 201000011549 stomach cancer Diseases 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 206010042863 synovial sarcoma Diseases 0.000 description 1
- 208000006379 syphilis Diseases 0.000 description 1
- 201000000596 systemic lupus erythematosus Diseases 0.000 description 1
- 238000010809 targeting technique Methods 0.000 description 1
- 201000003120 testicular cancer Diseases 0.000 description 1
- 201000002510 thyroid cancer Diseases 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 201000008827 tuberculosis Diseases 0.000 description 1
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 description 1
- 201000005112 urinary bladder cancer Diseases 0.000 description 1
- 230000002485 urinary effect Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/8509—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K67/00—Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
- A01K67/027—New or modified breeds of vertebrates
- A01K67/0275—Genetically modified vertebrates, e.g. transgenic
- A01K67/0278—Knock-in vertebrates, e.g. humanised vertebrates
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K49/00—Preparations for testing in vivo
- A61K49/0004—Screening or testing of compounds for diagnosis of disorders, assessment of conditions, e.g. renal clearance, gastric emptying, testing for diabetes, allergy, rheuma, pancreas functions
- A61K49/0008—Screening agents using (non-human) animal models or transgenic animal models or chimeric hosts, e.g. Alzheimer disease animal model, transgenic model for heart failure
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
- C07K14/70571—Receptors; Cell surface antigens; Cell surface determinants for neuromediators, e.g. serotonin receptor, dopamine receptor
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/5005—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
- G01N33/5008—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/5005—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
- G01N33/5008—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
- G01N33/5011—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics for testing antineoplastic activity
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2207/00—Modified animals
- A01K2207/15—Humanized animals
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/07—Animals genetically altered by homologous recombination
- A01K2217/072—Animals genetically altered by homologous recombination maintaining or altering function, i.e. knock in
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2227/00—Animals characterised by species
- A01K2227/10—Mammal
- A01K2227/105—Murine
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/03—Animal model, e.g. for test or diseases
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2500/00—Screening for compounds of potential therapeutic value
- G01N2500/10—Screening for compounds of potential therapeutic value involving cells
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Chemical & Material Sciences (AREA)
- Immunology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- Genetics & Genomics (AREA)
- Urology & Nephrology (AREA)
- Toxicology (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Hematology (AREA)
- Biochemistry (AREA)
- Pathology (AREA)
- Veterinary Medicine (AREA)
- Medicinal Chemistry (AREA)
- Cell Biology (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Environmental Sciences (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Animal Behavior & Ethology (AREA)
- General Physics & Mathematics (AREA)
- Tropical Medicine & Parasitology (AREA)
- Analytical Chemistry (AREA)
- Gastroenterology & Hepatology (AREA)
- Food Science & Technology (AREA)
- Endocrinology (AREA)
- Diabetes (AREA)
- Rheumatology (AREA)
- Epidemiology (AREA)
- Animal Husbandry (AREA)
- Biodiversity & Conservation Biology (AREA)
- Neurology (AREA)
Abstract
本发明提供了一种A2AR基因人源化的非人动物及其构建方法、一种人源化A2AR蛋白、一种人源化A2AR基因、一种A2AR基因的靶向载体和其在生物医药领域的应用,利用同源重组的方式将编码人A2AR蛋白的核苷酸序列导入非人动物基因组中,该动物体内能正常表达人或人源化A2AR蛋白,可以作为人A2AR信号机理研究、心脑血管疾病、神经性疾病、肿瘤及自身免疫性疾病药物筛选的动物模型,对免疫靶点、神经靶点以及防治心脑血管疾病靶点的新药研发具有重要的应用价值。
Description
技术领域
本发明属于动物基因工程和基因遗传修饰领域,具体地说,涉及一种A2AR基因人源化的非人动物及其构建方法和在生物医药领域的应用。
背景技术
A2AR全称Adenosine A2a Receptor,又称ADORA2A,属于G蛋白偶联受体家族,在机体中广泛分布,在中枢神经系统、外周、心、肝、肺、肾等组织均有表达;在细胞水平上,A2AR除了表达于γ氨基酸(GCBA)能神经元、多巴胺能神经元、外周组织实质细胞外,在T细胞、B细胞、中性粒细胞、小胶质细胞、单核巨噬细胞、血小板、内皮细胞、成纤维细胞、NK细胞等多种免疫细胞上呈现高水平表达,参与心血管系统、泌尿系统、免疫系统、神经系统等多种生理病理过程的调节。
在肿瘤微环境中,免疫细胞上的A2AR通过与免疫抑制代谢物——腺苷相结合,抑制免疫细胞响应能力,效应T细胞的A2AR被激活后阻断T细胞激活受体信号传递,抑制干扰素分泌和细胞毒作用;APC细胞表面的A2AR被激活后会抑制Th1型细胞因子分泌,诱导免疫耐受,效应T细胞和APC细胞的相互作用会抑制抗癌细胞的活化;Treg表面的A2AR被激活后会引起细胞增殖,抑制免疫反应。此外,腺苷还能促进癌细胞的增殖、存活和转移活性。
A2AR在腺苷介导的对抗心肌缺血再灌注损伤(IRI)机制中起重要作用,A2AR与腺苷结合后激活腺苷酸环化酶,促使环腺苷酸cAMP含量增加,细胞内游离钙减少,从而抑制多种因素诱发的血小板聚集释放反应,减少血栓形成。同时抑制中性粒细胞及内皮细胞,从而阻止IRI中性白细胞与内皮细胞相互作用所生成的炎性物质,降低TNFα、IL6 mRNA和NF-κB水平。
A2AR在中枢神经系统中主要表达于纹状体、听神经核和嗅结,在皮层、海马、下丘脑及小脑等部位也有少量表达。研究发现,阻断A2AR活性可以减少缺血性脑损伤,缩小梗死面积,改善神经功能。同时,拮抗或阻断A2AR能有效减轻运动障碍,还可明显减轻帕金森氏病的进展。
此外,A2AR同时广泛存在于关节、皮肤等部分,其激活还可以促进皮肤伤口愈合;还有研究表明,A2A受体激动剂可以降低器官移植中的排斥反应。大量临床研究和动物实验研究已经证实,A2AR是多种疾病治疗的重要靶标。
随着基因工程技术的不断发展和成熟,用人类基因替代或置换动物的同源性基因已经实现,通过这种方式开发人源化实验动物模型是动物模型未来的发展方向。其中基因人源化动物模型,即,利用基因编辑技术,用人源正常或突变基因替换动物基因组的同源基因,可建立更接近人类生理或疾病特征的正常或突变基因动物模型。基因人源化动物不但本身具有重要应用价值,如通过基因人源化可改进和提升细胞或组织移植人源化动物模型,更重要的是,由于人类基因片段的插入,动物体内可表达或部分表达人源蛋白,可作为仅能识别人蛋白氨基酸序列的药物的靶点,为在动物水平进行抗人抗体及其它药物的筛选提供了可能。然而,由于动物与人类在生理学及病理学方面存在差异,加上基因(即遗传因子)的复杂性,如何能构建出“有效”的人源化动物模型用于新药研发仍是最大的挑战(Scheer N,Snaith M,Wolf CR,Seibler J.Generation and utility of geneticallyhumanized mouse models,Drug Discov Today;18(23-24):1200-11,2013)。
目前关于A2AR基因的动物模型主要为基因敲除鼠,而且主要用于新生儿缺氧缺血性脑病相关疾病机制研究。鉴于A2AR在肿瘤、自身免疫性疾病、心脑血管疾病、神经性疾病等多种疾病发生过程中的广泛参与性以及靶向该信号通路的巨大应用价值,为了使临床前期的试验更有效并使研发失败最小化,本领域仍急需开发人源化A2AR信号通路相关的非人动物模型。
发明内容
本发明的第一方面,提供了一种A2AR基因人源化的非人动物,所述的非人动物体内表达人或人源化A2AR蛋白。
优选的,所述的非人动物的内源A2AR蛋白表达降低或缺失。
优选的,所述的人源化A2AR蛋白包含人A2AR蛋白的全部或部分。
优选的,所述的人A2AR蛋白的全部或部分由人A2AR基因的任一转录本翻译,进一步优选的,翻译自转录本NM_001278497.1。
优选的,所述的人源化A2AR蛋白包含与SEQ ID NO:2具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含与SEQ ID NO:2所示氨基酸序列一致的氨基酸序列。
优选的,所述的人源化A2AR蛋白包含人A2AR核苷酸序列的3号和/或4号外显子编码的氨基酸序列,进一步优选的,所述的人源化A2AR蛋白包含人A2AR核苷酸序列的3号至4号外显子编码的氨基酸序列,更优选的,包含从人A2AR核苷酸序列的起始密码子开始至终止密码子为止编码的氨基酸序列。
优选的,所述的人源化A2AR蛋白至少包含SEQ ID NO:5或SEQ ID NO:9编码的氨基酸序列,或包含与SEQ ID NO:5或SEQ ID NO:9具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%同一性的核苷酸编码的氨基酸序列。
在本发明的一个具体实施方式中,所述的人源化A2AR蛋白中包含的人A2AR蛋白的部分氨基酸序列包含下列组中的一种:
A)包含SEQ ID NO:2所示氨基酸序列的全部或部分;
B)包含SEQ ID NO:2所示氨基酸序列同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%的氨基酸序列;
C)包含SEQ ID NO:2所示所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸的氨基酸序列;或,
D)包含SEQ ID NO:2所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的非人动物体内包含人或人源化A2AR基因。
优选的,所述的非人动物体内包含编码人A2AR蛋白的全部或部分核苷酸序列;进一步优选的,包含编码与SEQ ID NO:2具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列或者包含编码SEQ ID NO:2的核苷酸序列。
优选的,所述的非人动物体内包含人A2AR核苷酸序列的1号外显子至4号外显子的全部或部分,进一步优选的,包含人A2AR核苷酸序列的3号至4号外显子的全部或部分,更优选的,包含人A2AR核苷酸序列的3号和/或4号外显子的全部或部分,优选还包含3-4号内含子,其中,所述人A2AR的核苷酸序列的3号外显子的部分至少包含从起始密码子开始至3号外显子最后一个核苷酸为止,4号外显子的部分至少包含从4号外显子第一个核苷酸开始至终止密码子为止。
在本发明的一个具体实施方式中,所述的人源化A2AR基因中至少包含SEQ ID NO:6、7、8所示核苷酸序列,或包含与SEQ ID NO:6、7、8具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%同一性的核苷酸序列。
在本发明的一个具体实施方式中,所述的非人动物体内包含的人A2AR核苷酸序列的部分选自下列组中的一种:
(A)包含SEQ ID NO:5所示核苷酸序列的全部或部分;
(B)包含与SEQ ID NO:5所示核苷酸序列的同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%的核苷酸序列;
(C)包含与SEQ ID NO:5所示核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸的核苷酸序列;或,
(D)具有SEQ ID NO:5所示核苷酸序列的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
在本发明的一个具体实施方式中,所述的人源化A2AR基因还包括非人动物A2AR基因的1号外显子的全部、2号外显子的部分和/或3号外显子的部分;优选的,所述的非人动物A2AR基因的1号外显子的全部、2号外显子的部分和/或3号外显子的部分与NC_000076.6相应的1号外显子、2号外显子、3号外显子至少具有70%、75%、80%、85%、90%或至少95%的同一性;进一步优选的,所述的非人动物A2AR基因的1号外显子的全部、2号外显子的部分和/或3号外显子的部分与SEQ ID NO:1相应的1号外显子、2号外显子、3号外显子一致。
在本发明的一个具体实施方式中,所述的人源化A2AR基因的核苷酸序列转录的mRNA选自下列组中的一种:
(a)包含SEQ ID NO:9所示核苷酸序列的全部或部分;
(b)包含与SEQ ID NO:9所示核苷酸序列的同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%的核苷酸序列;
(c)包含与SEQ ID NO:9所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸的核苷酸序列;或,
(d)包含SEQ ID NO:9所示的核苷酸序列,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,所述的人源化A2AR基因还包括特异性诱导物或阻遏物,进一步优选的,所述的特异性诱导物或阻遏物可以为常规可以诱导或阻遏的物质。
在本发明的一个具体实施方式中,所述的特异性诱导物选自四环素系统(Tet-OffSystem/Tet-On System)或他莫昔芬系统(Tamoxifen System)。
优选的,所述的人A2AR核苷酸序列的部分或人源化A2AR基因的核苷酸序列可操作的连接至内源调控元件后。
优选的,所述的非人动物可以选自啮齿类动物、猪、鸡、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物,进一步优选的,所述的非人哺乳动物为啮齿类动物,更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物,进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子,更优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠,更进一步优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnull小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。
本发明的第二方面,提供了一种A2AR基因人源化的非人动物的构建方法,所述的非人动物体内表达人或人源化A2AR蛋白。
优选的,所述的非人动物为上述的A2AR基因人源化的非人动物。
优选的,所述的人源化A2AR基因在非人动物体内通过内源或外源调控元件进行调控。进一步优选的,所述的调控元件为启动子。
优选的,所述的构建方法包括用包含人A2AR核苷酸序列的部分插入或替换到非人动物A2AR基因座上;进一步优选的,用包含人A2AR核苷酸序列的1号至4号外显子的全部或部分插入或替换到非人动物A2AR基因座上,更优选的,用包含人A2AR核苷酸序列的3号至4号外显子的全部或部分插入或替换到非人动物A2AR基因座上,更进一步优选的,用包含人A2AR核苷酸序列的3号和/或4号外显子的全部或部分插入或替换到非人动物A2AR基因座上,更进一步优选的,用包含人A2AR的基因的核苷酸序列的3号外显子的部分、4号外显子的部分核苷酸序列插入或替换至非人动物基因座上,进一步优选的,包含3-4号内含子;其中,所述人A2AR的核苷酸序列的3号外显子的部分至少包含从起始密码子开始至3号外显子最后一个核苷酸为止,4号外显子的部分至少包含从4号外显子第一个核苷酸开始至终止密码子为止,优选的,用包含SEQ ID NO:5或SEQ ID NO:9的核苷酸序列插入或替换至非人动物基因座上。
优选的,所述的构建方法包括用包含人A2AR的基因的核苷酸序列的3号至4号外显子全部或部分插入非人动物A2AR核苷酸序列的1号至3号外显子的全部或部分;其中,所述人A2AR的核苷酸序列的3号外显子的部分至少包含从起始密码子开始至3号外显子最后一个核苷酸为止,4号外显子的部分至少包含从4号外显子第一个核苷酸开始至终止密码子为止,进一步优选的,用包含SEQ ID NO:5或SEQ ID NO:9的核苷酸序列替换非人动物A2AR核苷酸序列的2号至3号外显子的全部或部分;所述非人动物A2AR核苷酸序列包含编码非人动物2号外显子的部分、3号外显子的部分核苷酸序列,优选的,包含2-3号内含子,其中,所述非人动物A2AR核苷酸序列的2号外显子的部分至少包含从非人动物A2AR核苷酸序列的起始密码子开始至2号外显子最后1个核苷酸为止,3号外显子的部分至少包含从3号外显子第一个核苷酸开始至终止密码子为止。
优选的,所述的构建方法包括用包含编码人A2AR蛋白的全部或部分核苷酸序列插入或替换到非人动物A2AR基因座上,进一步优选的,用包含编码与SEQ ID NO:2具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含编码与SEQ IDNO:2所示氨基酸序列一致的核苷酸序列插入或替换到非人动物A2AR基因座上。
优选的,所述的人A2AR蛋白的全部或部分由人A2AR基因的任一转录本翻译,进一步优选的,翻译自转录本NM_001278497.1。
所述的构建方法包括用包含人或人源化A2AR基因的核苷酸序列导入非人动物A2AR基因座,优选用包含人A2AR基因的1号至4号外显子的全部或部分导入非人动物A2AR基因座,进一步优选用3号至4号外显子的全部或部分导入非人动物A2AR基因座,进一步优选的,所述的构建方法包括用包含编码SEQ ID NO:5的核苷酸序列导入非人动物A2AR基因座。
优选的,所述的插入或替换位点为A2AR基因的内源调控元件之后。
优选的,所述的插入为首先破坏非人动物内源A2AR基因的编码框,随后进行插入操作,或者所述的插入步骤既可给内源A2AR基因造成移码突变又可以实现插入人源序列的步骤。
优选的,所述的非人动物是纯合或者杂合的。
优选的,所述非人动物的基因组中至少一个染色体上包含人源化A2AR基因。
优选的,所述的非人动物中至少一个细胞表达人A2AR蛋白或人源化A2AR蛋白。
优选的,使用基因编辑技术进行非人动物的构建,所述的基因编辑技术包括利用胚胎干细胞的基因打靶技术、CRISPR/Cas9技术、锌指核酸酶技术、转录激活子样效应因子核酸酶技术、归巢核酸内切酶或其他分子生物学技术。
优选的,使用靶向载体进行非人动物的构建,其中,所述的靶向载体包含人A2AR核苷酸序列的部分;进一步优选的,所述的人A2AR核苷酸序列的部分包含人A2AR的1号至4号外显子的全部或部分核苷酸序列;更优选的,所述的人A2AR核苷酸序列的部分包含人A2AR核苷酸序列的3号至4号外显子的全部或部分,更进一步优选的,所述的人A2AR核苷酸序列的部分包含人A2AR核苷酸序列的3号和/或4号外显子的全部或部分,更进一步优选的,包含3号外显子的部分和4号外显子的部分,其中,所述人A2AR的核苷酸序列的3号外显子的部分至少包含从起始密码子开始至3号外显子最后一个核苷酸为止,4号外显子的部分至少包含从4号外显子第一个核苷酸开始至终止密码子为止,更进一步优选的,包含SEQ ID NO:5所示核苷酸序列。
优选的,所述的靶向载体还包含与非人动物A2AR基因中的一段序列的5’端同源的DNA片段,即5’臂,其选自非人动物A2AR基因基因组DNA的100-10000个长度的核苷酸;优选的,所述的5’臂与NCBI登录号为NC_000076.6至少具有90%同源性的核苷酸;进一步优选的,所述5’臂序列与SEQ ID NO:3至少具有90%同源性,或者如SEQ ID NO:3所示。
优选的,所述的靶向载体还包含与非人动物A2AR基因中的一段序列的3’端同源的DNA片段,即3’臂,其选自非人动物A2AR基因基因组DNA的100-10000个长度的核苷酸;优选的,所述的3’臂与NCBI登录号为NC_000076.6至少具有90%同源性的核苷酸;进一步优选的,所述的3’臂序列与SEQ ID NO:4至少具有90%同源性,或者如SEQ ID NO:4所示。
本发明的第三方面,提供了一种靶向载体,所述的靶向载体包含人A2AR核苷酸序列的部分。
优选的,所述的人A2AR核苷酸序列的部分包含人A2AR核苷酸序列的1号至4号外显子的全部或部分;进一步优选的,所述的人A2AR核苷酸序列的部分包含人A2AR核苷酸序列的3号至4号外显子的全部或部分,更优选的,所述的人A2AR核苷酸序列的部分包含人A2AR核苷酸序列的3号和/或4号外显子的全部或部分,更进一步优选的,包含3号外显子的部分和4号外显子的部分,其中,所述人A2AR的核苷酸序列的3号外显子的部分至少包含从起始密码子开始至3号外显子最后一个核苷酸为止,4号外显子的部分至少包含从4号外显子第一个核苷酸开始至终止密码子为止,优选的,包含编码SEQ ID NO:2的核苷酸序列,进一步优选的,包含SEQ ID NO:5所示核苷酸序列。
优选的,所述的靶向载体还包含与非人动物A2AR基因中的一段序列的5’端同源的DNA片段,即5’臂,其选自非人动物A2AR基因基因组DNA的100-10000个长度的核苷酸;优选的,所述的5’臂与NCBI登录号为NC_000076.6至少具有90%同源性的核苷酸;进一步优选的,所述5’臂序列与SEQ ID NO:3至少具有90%同源性,或者如SEQ ID NO:3所示。
优选的,所述的靶向载体还包含与非人动物A2AR基因中的一段序列的3’端同源的DNA片段,即3’臂,其选自非人动物A2AR基因基因组DNA的100-10000个长度的核苷酸;优选的,所述的3’臂与NCBI登录号为NC_000076.6至少具有90%同源性的核苷酸;进一步优选的,所述的3’臂序列与SEQ ID NO:4至少具有90%同源性,或者如SEQ ID NO:4所示。
优选的,所述的非人动物A2AR基因中的一段序列位于非人动物A2AR基因座上,进一步优选的,所述的非人动物A2AR基因中的一段序列位于非人动物A2AR基因2号至3号外显子上。
优选的,所述的非人动物可以选自啮齿类动物、猪、鸡、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物,进一步优选的,所述的非人哺乳动物为啮齿类动物,更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物,进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子,更优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠,更进一步优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnull小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。
优选的,所述的靶向载体还包含标记基因,进一步优选的,所述标记基因为负筛选标记的编码基因,更进一步优选的,所述负筛选标记的编码基因为白喉毒素A亚基的编码基因(DTA)。
在本发明的一个具体实施方式中,所述的靶向载体中还包括阳性克隆筛选的抗性基因,进一步优选的,所述阳性克隆筛选的抗性基因为新霉素磷酸转移酶编码序列Neo。
在本发明的一个具体实施方式中,所述的靶向载体中还包括特异性重组系统,进一步优选的,所述特异性重组系统为Frt重组位点(也可选择常规的LoxP重组系统),所述的特异性重组系统为具有两个Frt重组位点,分别连接在抗性基因的两侧。
本发明的第四方面,提供了一种包含上述靶向载体的细胞。
本发明的第五方面,提供了上述靶向载体,或者上述的细胞在A2AR基因修饰中的应用,优选的,所述的应用包括但不限于敲除、插入或替换。
本发明的第六方面,提供了一种人源化A2AR蛋白,所述的人源化A2AR蛋白包含人A2AR蛋白的全部或部分。
优选的,所述的人A2AR蛋白的全部或部分由人A2AR基因的任一转录本翻译,进一步优选的,翻译自转录本NM_001278497.1。优选的,所述的人源化A2AR蛋白包含与SEQ IDNO:2具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含与SEQ ID NO:2所示氨基酸序列一致的氨基酸序列。
优选的,所述的人源化A2AR蛋白包含人A2AR核苷酸序列的3号和/或4号外显子编码的氨基酸序列,更优选的,所述的人源化A2AR蛋白包含人A2AR核苷酸序列的3号至4号外显子编码的氨基酸序列,进一步优选的包含从人A2AR核苷酸序列的起始密码子开始至终止密码子为止编码的氨基酸序列。
优选的,所述的人源化A2AR蛋白至少包含SEQ ID NO:5或SEQ ID NO:9编码的氨基酸序列,或包含与SEQ ID NO:5或SEQ ID NO:9具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%同一性的核苷酸编码的氨基酸序列。
在本发明的一个具体实施方式中,所述的人源化A2AR蛋白中包含的人A2AR蛋白的部分氨基酸序列包含下列组中的一种:
A)包含SEQ ID NO:2所示氨基酸序列的全部或部分;
B)包含SEQ ID NO:2所示氨基酸序列同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%的氨基酸序列;
C)包含SEQ ID NO:2所示所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸的氨基酸序列;或,
D)包含SEQ ID NO:2所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
本发明的第七方面,提供了一种人源化A2AR基因,所述的人源化A2AR基因包含人A2AR基因的部分。
优选的,所述的人源化A2AR基因包含编码人A2AR蛋白的全部或部分核苷酸序列;优选的,包含编码与SEQ ID NO:2具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列或者包含编码SEQ ID NO:2的核苷酸序列。
优选的,所述的人源化A2AR基因编码上述的人源化A2AR蛋白。
优选的,所述的人源化A2AR基因包含人A2AR核苷酸序列的1号外显子至4号外显子的全部或部分,进一步优选的,所述的人源化A2AR基因包含人A2AR核苷酸序列的3号至4号外显子的全部或部分,更优选的,所述的人源化A2AR基因包含人A2AR核苷酸序列的3号和/或4号外显子的全部或部分,其中,所述人A2AR的核苷酸序列的3号外显子的部分至少包含从起始密码子开始至3号外显子最后一个核苷酸为止,4号外显子的部分至少包含从4号外显子第一个核苷酸开始至终止密码子为止。
在本发明的一个具体实施方式中,所述的人源化A2AR基因中至少包含SEQ ID NO:6、7、8所示核苷酸序列,或包含与SEQ ID NO:6、7、8具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%同一性的核苷酸序列。
在本发明的一个具体实施方式中,所述的人源化A2AR基因中包含的人A2AR核苷酸序列的部分选自下列组中的一种:
(A)包含SEQ ID NO:5所示核苷酸序列的全部或部分;
(B)包含与SEQ ID NO:5所示核苷酸序列的同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%的核苷酸序列;
(C)包含与SEQ ID NO:5示核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸的核苷酸序列;或,
(D)具有SEQ ID NO:5所示核苷酸序列的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
在本发明的一个具体实施方式中,所述的人源化A2AR基因还包括非人动物A2AR基因的1号外显子的全部、2号外显子的部分和/或3号外显子的部分;优选的,所述的非人动物A2AR基因的1号外显子的全部、2号外显子的部分和/或3号外显子的部分与NC_000076.6相应的1号外显子、2号外显子、3号外显子至少具有70%、80%、90%或至少95%的同一性;进一步优选的,所述的非人动物A2AR基因的1号外显子的全部、2号外显子的部分和/或3号外显子的部分与SEQ ID NO:1相应的1号外显子、2号外显子、3号外显子一致。
优选的,所述的非人动物可以选自啮齿类动物、猪、鸡、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物,进一步优选的,所述的非人哺乳动物为啮齿类动物,更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物,进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子,更优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠,更进一步优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnull小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。
在本发明的一个具体实施方式中,所述的人源化A2AR基因的核苷酸序列转录的mRNA选自下列组中的一种:
(a)包含SEQ ID NO:9所示核苷酸序列的全部或部分;
(b)包含与SEQ ID NO:9所示核苷酸序列的同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%的核苷酸序列;
(c)包含与SEQ ID NO:9所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸的核苷酸序列;或,
(d)包含SEQ ID NO:9所示的核苷酸序列,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,所述的人源化A2AR基因还包括特异性诱导物或阻遏物,进一步优选的,所述的特异性诱导物或阻遏物可以为常规可以诱导或阻遏的物质。
在本发明的一个具体实施方式中,所述的特异性诱导物选自四环素系统(Tet-OffSystem/Tet-On System)或他莫昔芬系统(Tamoxifen System)。
本发明的第八方面,提供了一种多基因修饰的非人动物的构建方法,包括如下步骤:
I)提供上述的A2AR基因人源化的非人动物或A2AR基因敲除的非人动物,或者采用上述的构建方法获得的A2AR基因人源化的非人动物;
II)将步骤I)提供的非人动物与其他基因修饰的非人动物交配、体外受精或直接进行基因编辑,并进行筛选,得到多基因修饰的非人动物。
优选的,所述的其他基因修饰的非人动物包括但不限于基因PD-1、PD-L1、CTLA4、OX40、LAG3、TIM3或CD73修饰的非人动物。
优选的,所述的多基因修饰的非人动物为双基因人源化非人动物、三基因人源化非人动物、四基因人源化非人动物、五基因人源化非人动物、六基因人源化非人动物、七基因人源化非人动物、八基因人源化非人动物或九基因人源化非人动物。
优选的,所述的多基因修饰的非人动物的基因组中人源化的多个基因中的每一个基因均可以是纯合或杂合的。
本发明的第九方面,提供了一种上述构建方法获得的非人动物或其子代,所述的非人动物或其子代选自A2AR基因人源化的非人动物、A2AR基因敲除的非人动物或者多基因修饰的非人动物。
本发明的第十方面,提供了一种动物的疾病模型,所述的疾病模型来源于上述的非人动物、上述的构建方法获得的非人动物,或者,上述的非人动物或其子代,优选的,所述的疾病包括心脑血管疾病、神经性疾病、自身免疫性疾病、肿瘤或炎症。
本发明的第十一方面,提供了一种动物的疾病模型的制备方法,所述的制备方法包括上述A2AR基因人源化的非人动物、A2AR基因敲除的非人动物或多基因修饰的非人动物的步骤;优选的,所述的疾病包括心脑血管疾病、神经性疾病、自身免疫性疾病、肿瘤或炎症,进一步优选的,还包括植入肿瘤细胞的步骤。
本发明的第十二方面,提供了上述A2AR基因人源化的非人动物、上述A2AR基因敲除的非人动物、上述构建方法获得的A2AR基因人源化的非人动物、上述A2AR基因敲除的非人动物或多基因修饰的非人动物或其子代在制备动物的疾病模型中的应用,优选的,所述的疾病包括心脑血管疾病、神经性疾病、自身免疫性疾病、肿瘤或炎症。
本发明的第十三方面,提供了上述的非人动物或其子代、上述的构建方法获得的非人动物或上述的疾病模型在制备治疗心脑血管疾病、神经性疾病、自身免疫性疾病、肿瘤和/或炎症的药物中的应用。
本发明的第十四方面,提供了一种细胞或细胞系或原代细胞培养物,所述细胞或细胞系或原代细胞培养物来源于上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代或者上述的疾病模型。
本发明的第十五方面,提供了一种组织或器官或其培养物,所述组织或器官或其培养物来源于上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代或者上述的疾病模型。
本发明的第十六方面,提供了一种荷瘤后的瘤组织,所述的瘤组织来源于上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代,或者上述的疾病模型。
本发明的第十七方面,提供了一种A2AR基因人源化的细胞,所述的细胞表达人A2AR蛋白或人源化A2AR蛋白。
优选的,所述的人源化A2AR蛋白选自上述的人源化A2AR蛋白。
优选的,所述的细胞中内源A2AR蛋白的表达降低或缺失。
优选的,所述的细胞的基因组中包含人A2AR核苷酸序列的部分,进一步优选的,所述的细胞包含上述的人源化A2AR基因。
本发明的第十八方面,提供了一种A2AR基因敲除的细胞,所述的细胞中缺失A2AR基因的全部或部分核苷酸序列。
优选的,所述的细胞缺失A2AR基因的2号至3号外显子的全部或部分核苷酸序列。
本发明的第十九方面,提供了一种表达上述的人源化A2AR蛋白的构建体,优选的,所述的构建体中包含上述人源化A2AR基因。
本发明的第二十方面,提供了一种包含上述构建体的细胞。
本发明的第二十一方面,提供了一种包含上述细胞的组织。
本发明的第二十二方面,提供了来源于上述的人源化A2AR蛋白、上述的人源化A2AR基因、上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代、上述的疾病模型、上述的细胞或细胞系或原代细胞培养物、上述的组织或器官或其培养物、上述的荷瘤后的瘤组织、上述的细胞、上述的构建体、上述的细胞或上述的组织在需要涉及人类细胞的免疫过程的产品开发,制造抗体,或者作为药理学、免疫学、微生物学、医学研究的模型系统中的应用;或者在生产和利用动物实验疾病模型,用于开发新的诊断策略和/或治疗策略中的应用;或者在筛选、验证、评价或研究A2AR功能、人A2AR信号机理、靶向人的抗体、靶向人的药物、药效,心脑血管疾病、神经性疾病或免疫相关疾病药物以及抗肿瘤或抗炎症药物,筛选和评估人用药及药效研究方面的应用。
本发明的第二十三方面,提供了上述A2AR基因人源化的非人动物、上述A2AR基因敲除的非人动物、上述构建方法获得的A2AR基因人源化的非人动物、上述A2AR基因敲除的非人动物或多基因修饰的非人动物或其子代在制备人A2AR特异性调节剂或者筛选人A2AR特异性调节剂的产品中的应用。
本发明的第二十四方面,提供了一种人A2AR特异性调节剂的筛选方法,所述的筛选方法包括向个体施加调节剂,检测调节效果;其中,所述的个体选自上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代,或者上述的疾病模型。
优选的,所述的调节剂选自CAR-T、药物,进一步优选的,所述的药物为化学药、核苷类药物或抗体。
优选的,所述的调节剂为单抗或双特异性抗体或两种及两种以上药物的联合使用。
优选的,所述的筛选方法还包括向个体植入肿瘤的步骤。
优选的,所述检测包括测定肿瘤细胞的大小和/或增殖速率。
优选的,所述检测的方法包括游标卡尺测量、流式细胞检测和/或动物活体成像检测。
优选的,所述的检测包括评估个体体重、脂肪量、活化途径、神经保护活性或代谢变化,所述的代谢变化包括食物消耗或水消耗的变化。
优选的,所述的肿瘤细胞来源于人或非人动物。
优选的,所述人A2AR特异性调节剂的筛选方法不是治疗方法。该方法用来筛选或评价药物,对候选药物的药效进行检测和比较,以确定哪些候选药物可以作为药物,哪些不能作为药物,或者,比较不同药物的药效敏感程度,即治疗效果不是必然的,只是一种可能性。
本发明的第二十五方面,提供了一种干预方案的评价方法,所述的评价方法包括向个体施加干预方案,对施加干预方案后的个体进行调节效果检测和评价;其中,所述的个体选自上述的非人动物,上述的构建方法获得的非人动物,上述的非人动物或其子代,或者上述的疾病模型。
优选的,所述的评价方法还包括向个体植入肿瘤细胞。
优选的,所述的干预方案选自CAR-T、药物治疗,进一步优选的,所述的药物为抗原结合蛋白,所述的抗体结合蛋白为抗体。
优选的,所述的肿瘤细胞来源于人或非人动物。
优选的,所述干预方案的评价方法不是治疗方法,该评价方法对干预方案的效果进行检测和评价,以确定该干预方案是否有治疗效果,即治疗效果不是必然的,只是一种可能性。
本发明的第二十六方面,提供了一种来源于上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代或疾病模型在制备治疗心脑血管疾病、神经性疾病、肿瘤、炎症或自身免疫性疾病的药物中的用途。
本发明所述的“肿瘤”包括但不限于淋巴瘤、B细胞肿瘤、T细胞肿瘤、骨髓/单核细胞肿瘤、非小细胞肺癌、白血病、卵巢癌、鼻咽癌、乳腺癌、子宫内膜癌、结肠癌、直肠癌、胃癌、膀胱癌、肺癌、支气管癌、骨癌、前列腺癌、胰腺癌、肝和胆管癌、食管癌、肾癌、甲状腺癌、头颈部癌、睾丸癌、胶质母细胞瘤、星形细胞瘤、黑色素瘤、骨髓增生异常综合征、以及肉瘤。其中,所述的白血病选自急性淋巴细胞性(成淋巴细胞性)白血病、急性骨髓性白血病、髓性白血病、慢性淋巴细胞性白血病、多发性骨髓瘤、浆细胞白血病、以及慢性骨髓性白血病;所述淋巴瘤选自霍奇金淋巴瘤和非霍奇金淋巴瘤,包括B细胞淋巴瘤、弥漫性大B细胞淋巴瘤、滤泡性淋巴瘤、套细胞淋巴瘤、边缘区B细胞淋巴瘤、T细胞淋巴瘤、和瓦尔登斯特伦巨球蛋白血症;所述肉瘤选自骨肉瘤、尤文肉瘤、平滑肌肉瘤、滑膜肉瘤、软组织肉瘤、血管肉瘤、脂肪肉瘤、纤维肉瘤、横纹肌肉瘤、及软骨肉瘤。在本发明的一个具体实施方式中,所述的肿瘤选自B细胞肿瘤、T细胞肿瘤、骨髓/单核细胞肿瘤。优选包括B或T细胞急性淋巴细胞白血病(ALL)、急性髓细胞白血病(AML)、非霍奇金淋巴瘤(NHL)和多发性骨髓瘤(MM)、鼻咽癌、肺癌。
本发明所述的“自身免疫性疾病”包括但不限于过敏、哮喘、心肌炎、肾炎、肝炎、系统性红斑狼疮、类风湿性关节炎、硬皮病、甲状腺功能亢进、原发性血小板减少性紫癜、自身免疫性溶血性贫血、溃疡性结肠炎、自身免疫性肝病、糖尿病、疼痛或神经障碍等。
本发明所述的“炎症”包括急性炎症,也包括慢性炎症。具体的,包括但不限于变质性炎症、渗出性炎症(浆液性炎、纤维素性炎、化脓性炎、出血性炎、坏死性炎、卡他性炎)、增生性炎症、特异性炎症(结核、梅毒、麻疯、淋巴肉芽肿等)。
本发明所述的“心血管疾病”包括但不限于冠心病(心脏病发作)、脑血管疾病(中风)、高血压(血压升高)、周围血管疾病、风湿性心脏病、先天性心脏病、深静脉血栓和肺栓塞、心力衰竭以及心肌病。
本发明所述的“神经性疾病”包括但不限于脑血管疾病、周期性麻痹、进行性肌营养不良、强直性肌营养不良、共济失调。
本发明保护的主题“细胞”、“细胞或细胞系或原代细胞培养物”、“组织”、“组织或器官或其培养物”均不能发育为动物,其中,所述的细胞不是干细胞或受精卵细胞,所述的细胞可以是体细胞、淋巴细胞(优选为T细胞或B细胞)或肿瘤细胞等等,所述的组织可以是脾脏、淋巴结、骨髓、肿瘤或其培养物等等。
本发明所述的A2AR基因人源化的非人动物体内可以正常表达人A2AR蛋白或人源化A2AR蛋白。可用于针对人A2AR靶位点的药物筛选、药效评估、心脑血管疾病、神经性疾病、自身免疫性疾病和肿瘤治疗,可以加快新药研发过程、节约时间和成本。对于研究A2AR蛋白功能及相关疾病药物筛选提供了有效的保障。
本发明所述的“全部或部分”,“全部”为整体,“部分”为整体中的局部,或者组成整体的个体。
本发明所述的“人源化A2AR蛋白”,包含来源于人A2AR蛋白的部分。其中,所述的“人A2AR蛋白”同“人A2AR蛋白的全部”,即其氨基酸序列与人A2AR蛋白的全长氨基酸序列一致。所述的“人A2AR蛋白的部分”,为连续或间隔的5-412个氨基酸序列与人A2AR蛋白的氨基酸序列一致。优选为连续或间隔10-412,更优选为连续5、10、20、30、40、50、60、70、80、90、100、200、300、350、400、410、412个氨基酸序列与人A2AR蛋白的氨基酸序列一致。
本发明所述的“人源化A2AR基因”,包含来源于人A2AR核苷酸序列的部分和非人A2AR基因的部分。其中,所述的“人A2AR核苷酸序列”同“人A2AR核苷酸序列的全部”,即其核苷酸序列与人A2AR核苷酸序列的全长核苷酸序列一致。所述的“人A2AR核苷酸序列的部分”为连续或间隔的20-18764bp个核苷酸序列与人A2AR核苷酸序列一致,优选为20-8085个,更优选为20、50、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、8085、9000、10000、11000、12000、13000、14000、15000、16000、17000、18000、18500、18600、18700、18764bp个核苷酸序列与人A2AR核苷酸序列一致。
本发明所述的“xx号至xxx号外显子”或“xx号至xxx号外显子的全部”包含外显子及其期间的内含子的核苷酸序列,例如所述的“1号至4号外显子”包含1号外显子、1-2号内含子、2号外显子、2-3号内含子、3号外显子、3-4号内含子、4号外显子的全部核苷酸序列。
本发明所述的“x-xx号内含子”表示x号外显子与xx号外显子之间的内含子。例如“1-2号内含子”表示1号外显子与2号外显子之间的内含子。
本发明所述的“外显子的部分”表示连续或间隔几个、几十个或几百个核苷酸序列与全部的外显子核苷酸序列一致。例如人A2AR核苷酸序列的3号外显子的部分,包含连续或间隔的5-606bp个,优选10-332bp个核苷酸序列与人A2AR核苷酸序列的3号外显子核苷酸序列一致。在本发明的一个具体实施方式中,所述的“人源化A2AR基因”中包含的“3号外显子的部分”至少包括从3号外显子编码氨基酸序列的起始密码子开始至1号外显子的最后一个核苷酸序列为止。
本发明所述的“基因座”广义上讲代表基因在染色体上所占的位置,狭义上讲代表某一基因上的一段DNA片段,即可以是一个基因也可以是一个基因的一部分。例如所述的“A2AR基因座”表示A2AR基因1号至3号外显子上的任选一段的DNA片段。优选为1号外显子、2号外显子、3号外显子或其期间的内含子中的任一个或两个或多个的组合,或一个或两个或多个的全部或部分,更优选为A2AR基因的2号至3号外显子上。
本发明所述的“核苷酸序列”包含天然的或经过修饰的核糖核苷酸序列、脱氧核糖核苷酸序列。优选为DNA、cDNA、pre-mRNA、mRNA、rRNA、hnRNA、miRNAs、scRNA、snRNA、siRNA、sgRNA、tRNA。
本发明所述的“治疗”表示减缓、中断、阻止、控制、停止、减轻、或逆转一种体征、症状、失调、病症、或疾病的进展或严重性,但不一定涉及所有疾病相关体征、症状、病症、或失调的完全消除,且是指在疾病已开始发展后改善疾病或病理状态的体征、症状等等的治疗干预。
本发明所述的“同源性”,是指在使用氨基酸序列或核苷酸序列的方面,本领域技术人员在保证与已知序列相似结构或功能的前提下,可以根据实际工作需要对序列进行调整,使使用序列与现有技术获得的序列相比,具有(包括但不限于)1%,2%,3%,4%,5%,6%,7%,8%,9%,10%,11%,12%,13%,14%,15%,16%,17%,18%,19%,20%,21%,22%,23%,24%,25%,26%,27%,28%,29%,30%,31%,32%,33%,34%,35%,36%,37%,38%,39%,40%,41%,42%,43%,44%,45%,46%,47%,48%,49%,50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,70%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.1%,99.2%,99.3%,99.4%,99.5%,99.6%,99.7%,99.8%,99.9%的同一性。
在一个方面,所述非人动物是哺乳动物。优选的,所述非人动物是小型哺乳动物,例如跳鼠科。在一个实施方式中,所述非人动物是啮齿动物。在一个实施方式中,所述啮齿动物选自小鼠、大鼠和仓鼠。在一个实施方式中,所述啮齿动物选自鼠家族。在一个实施方式中,所述基因修饰的动物来自选自丽仓鼠科(例如小鼠样仓鼠)、仓鼠科(例如仓鼠、新世界大鼠和小鼠、田鼠)、鼠总科(真小鼠和大鼠、沙鼠、刺毛鼠、冠毛大鼠)、马岛鼠科(登山小鼠、岩小鼠、有尾大鼠、马达加斯加大鼠和小鼠)、刺睡鼠科(例如多刺睡鼠)和鼹形鼠科(例如摩尔大鼠、竹大鼠和鼢鼠)家族。在一个特定实施方式中,所述基因修饰的啮齿动物选自真小鼠或大鼠(鼠总科)、沙鼠、刺毛鼠和冠毛大鼠。在一个实施方式中,所述基因修饰的小鼠来自鼠科家族成员。在一个实施方式中,所述动物是啮齿动物。在一个特定实施方式中,所述啮齿动物选自小鼠和大鼠。在一个实施方式中,所述非人动物是小鼠。
在一个特定实施方式中,所述非人动物是啮齿动物,其为选自BALB/c、A、A/He、A/J、A/WySN、AKR、AKR/A、AKR/J、AKR/N、TA1、TA2、RF、SWR、C3H、C57BR、SJL、C57L、DBA/2、KM、NIH、ICR、CFW、FACA、C57BL/A、C57BL/An、C57BL/GrFa、C57BL/KaLwN、C57BL/6、C57BL/6J、C57BL/6ByJ、C57BL/6NJ、C57BL/10、C57BL/10ScSn、C57BL/10Cr和C57BL/Ola的C57BL、C58、CBA/Br、CBA/Ca、CBA/J、CBA/st、CBA/H品系的小鼠及NOD、NOD/SCID、NOD-Prkdcscid IL-2rgnull背景的小鼠。
本领域的技术人员能够确定并比较序列元件或同一性程度,以区分另外的小鼠和人序列。
除非特别说明,本发明的实践将采取细胞生物学、细胞培养、分子生物学、转基因生物学、微生物学、重组DNA和免疫学的传统技术。这些技术在以下文献中进行了详细的解释。例如:Molecular Cloning A Laboratory Manual,2ndEd.,ed.By Sa mbrook,FritschandManiatis(Cold Spring Harbor Laboratory Press:1989);DNA C loning,Volumes I and II(D.N.Glovered.,1985);Oligonucleotide Synthesis(M.J.G aited.,1984);Mullisetal.U.S.Pat.No.4,683,195;Nucleic Acid Hybridization(B.D.Hames&S.J.Higginseds.1984);Transcription And Translation(B.D.Hames&S.J.Higginseds.1984);Culture Of Animal Cells(R.I.Freshney,AlanR.Liss,Inc.,1987);Immobilized Cells And Enzymes(IRL Press,1986);B.Perbal,A Practical Guide ToMolecular Cloning(1984);the series,Methods In ENZYMOLOGY(J.Abelson andM.Simon,eds.inchief,Academic Press,Inc.,New York),specifically,Vols.154a nd155(Wuetal.eds.)and Vol.185,″Gene Expression Technology″(D.Goeddel,e d.);GeneTransfer Vectors For Mammalian Cells(J.H.Miller and M.P.Caloseds.,1987,ColdSpring Harbor Laboratory);Immunochemical Methods In Cell And Mole cularBiology(Mayer and Walker,eds.,Academic Press,London,1987);Handbo ok OfExperimental Immunology,Volumes V(D.M.Weir and C.C.Blackwell,eds.,1986);andManipulating the Mouse Embryo,(Cold Spring Harbor Laboratory Pres s,ColdSpring Harbor,N.Y.,1986)。
以上只是概括了本发明的一些方面,不是也不应该认为是在任何方面限制本发明。
本说明书提到的所有专利和出版物都是通过参考文献作为整体而引入本发明的。本领域的技术人员应认识到,对本发明可作某些改变并不偏离本发明的构思或范围。
下面的实施例进一步详细说明本发明,不能认为是限制本发明或本发明所说明的具体方法的范围。
附图说明
以下,结合附图来详细说明本发明的实施例,其中:
图1:人和小鼠A2AR基因对比示意图(非按比例);
图2:人源化A2AR基因座示意图,其中,chiExon1对应mExon1,chiExon2和chiExon3对应hExon4和mExon3(非按比例);
图3:A2AR打靶策略示意图(非按比例);
图4:F1代A2AR人源化小鼠基因型检测结果,其中PC为阳性对照,WT为野生型对照,H2O为水对照,F1-01、F1-02为小鼠编号;
图5:C57BL/6小鼠和A2AR基因人源化小鼠体内A2AR RT-PCR检测结果,其中+/+为C57BL/6小鼠,H/H为A2AR基因人源化纯合子小鼠,H2O为水对照,GAPDH为甘油醛-3-磷酸脱氢酶内参;
图6:C57BL/6小鼠和A2AR基因人源化小鼠体内A2AR流式检测结果,其中,WT为野生型C57BL/6小鼠,H/H为A2AR基因人源化纯合子小鼠;
图7:C57BL/6野生型小鼠和A2AR基因人源化纯合子小鼠脾脏中白细胞亚群占比的流式检测结果;
图8:C57BL/6野生型小鼠和A2AR基因人源化纯合子小鼠脾脏中T细胞亚群占比的流式检测结果;
图9:C57BL/6野生型小鼠和A2AR基因人源化纯合子小鼠外周血中白细胞亚群占比的流式检测结果;
图10:C57BL/6野生型小鼠和A2AR基因人源化纯合子小鼠外周血中T细胞亚群占比的流式检测结果;
图11:A2AR人源化小鼠和C57BL/6小鼠的cAMP检测结果,其中,G1组为C57BL/6脾细胞,G2组为C57BL/6骨髓细胞,G3组为A2AR人源化小鼠脾细胞,G4组为A2AR人源化小鼠骨髓细胞;
图12:A2AR重组后细胞Southern blot结果,其中WT为野生型对照。
具体实施方式
下面结合具体实施例来进一步描述本发明,本发明的优点和特点将会随着描述而更为清楚。但这些实施例仅是范例性的,并不对本发明的范围构成任何限制。本领域技术人员应该理解的是,在不偏离本发明的精神和范围下可以对本发明技术方案的细节和形式进行修改或替换,但这些修改和替换均落入本发明的保护范围内。
在下述每一实施例中,设备和材料是从以下所指出的几家公司获得:
C57BL/6小鼠和Flp工具鼠购自中国食品药品检定研究院国家啮齿类实验动物种子中心;
Brilliant Violet 510TManti-mouse CD45 Antibody购自Biolegend,货号103138;
PerCP/Cy5.5 anti-mouse TCRβchain Antibody购自Biolegend,货号109228;
Adenosine A2aR Antibody(7F6-G5-A2)(m/hA2AR-PE)购自Novus Biological,货号NBP1-39474;
Brilliant Violet 421TManti-mouse CD4(mCD4-BV421)购自Biolegend,货号100438;
Purified anti-mouse CD16/32Antibody(mCD4)购自Biolegend,货号101302;
FITC anti-mouse F4/80Antibody(mF4/80-FITC)购自Biolegend,货号123108;
PE anti-mouse CD8a Antibody(mCD8a-PE)购自Biolegend,货号100708;
PE/CyTM7Mouse anti-mouse NK1.1 Antibody(mNK1.1-PE)购自BD Pharminge n,货号552878;
APC anti-mouse/rat Foxp3 Antibody(mFoxp3-APC)购自eBioscience,货号17-5773-82;
FITC anti-Mouse CD19 Antibody(mCD19-FITC)购自Biolegend,货号115506;
PerCP/Cy5.5 anti-mouse TCRβchain Antibody(mTCRβ)购自Biolegend,货号109228;
APC Hamster Anti-Mouse TCRβChain Antibody(mTCRβ-APC)购自BD Pharmingen,货号553174;
Brilliant Violet 605TManti-mouse CD11c Antibody(mCD11c)购自Biolegend,货号117334;
PE anti-mouse/human CD11b Antibody(m/hCD11c-PE)购自Biolegend,货号101208;
实施例1 A2AR基因人源化小鼠的制备
小鼠A2AR基因(NCBI Gene ID:11540,Primary source:MGI:99402,UniProt I D:Q60613,位于10号染色体NC_000076.6的第75316877至75334792位,基于转录本NM_009630.3及其编码蛋白NP_033760.2(SEQ ID NO:1))和人A2AR基因(NCBI G ene ID:135,Primary source:HGNC:263,UniProt ID:P29274,位于22号染色体N C_000022.11的第24423597至24442360位,基于转录本NM_001278497.1及其编码蛋白NP_001265426.1(SEQID NO:2))对比示意图如图1所示。
为了达到本发明的目的,可在小鼠内源A2AR基因座引入编码人A2AR蛋白的基因序列,使得该小鼠表达人或人源化A2AR蛋白。具体来说,可以通过基因编辑技术在小鼠内源A2AR基因座上用人A2AR基因的核苷酸序列(例如DNA序列、cDNA序列等)替换小鼠相应序列,如将至少包含小鼠A2AR基因的起始密码子ATG至终止密码子TGA的约7.9kb的序列用对应的人DNA序列替换,得到人源化A2AR基因座(示意图如图2所示),实现对小鼠A2AR基因的人源化改造,其中,需要说明的是,该人源化改造方法适用于人A2AR基因任意转录本对小鼠A2AR基因的各转录本的改造。
进一步设计如图3所示的打靶策略示意图,图中显示了靶向载体上含有小鼠A2AR基因上游和下游的同源臂序列,以及包含人A2AR DNA序列的A片段。其中,上游同源臂序列(5’同源臂,SEQ ID NO:3)与NCBI登录号为NC_000076.6第75321789至75326028位核苷酸序列相同,下游同源臂序列(3’同源臂,SEQ ID NO:4)与NCBI登录号为NC_000076.6第75335143至75339958位核苷酸序列相同;人A2AR DNA片段(SEQ ID NO:5)与NCBI登录号为NC_000022.11的第24433405至24441489位核苷酸序列相同。A片段中人A2AR DNA片段上游与小鼠的连接设计为 其中序列“ccgcc”中的最后一个“c”是鼠的最后一个核苷酸,序列中的“a”是人的第一个核苷酸,人A2AR DNA片段下游与小鼠的连接设计为 其中序列“cctga”中的“a”是人的最后一个核苷酸,序列中的第一个“g”是小鼠的第一个核苷酸。
靶向载体上还包括用于阳性克隆筛选的抗性基因,即新霉素磷酸转移酶编码序列Neo,并在抗性基因的两侧装上两个同向排列的位点特异性重组系统Frt重组位点,组成Neo盒(Neo cassette)。其中Neo盒5’端与小鼠的连接设计为 内,其中序列“gcgcc”的最后一个“c”是小鼠的最后一个核苷酸,序列 的“C”是Neo盒的第一个核苷酸;Neo盒3’端与小鼠的连接设计为 内,其中序列“GATCC”的最后一个“C”是Neo盒的最后一个核苷酸,序列的第一个“c”是小鼠的第一个核苷酸。此外,还在靶向载体3’同源臂下游构建了具有负筛选标记的编码基因(白喉毒素A亚基的编码基因(DTA))。改造后的人源化小鼠A2AR的mRNA序列如SEQ ID NO:9所示,表达的蛋白序列如SEQ ID NO:2所示。
靶向载体构建可采用常规方法进行,如酶切连接等。构建好的靶向载体通过酶切进行初步验证后,再送测序公司进行测序验证。将测序验证正确的靶向载体电穿孔转染入野生型小鼠的胚胎干细胞中,利用阳性克隆筛选标记基因对得到的细胞进行筛选,并利用PCR检测外源基因的整合情况,筛选出正确的阳性克隆细胞。将筛选出的正确阳性克隆细胞(黑色鼠)按照本领域已知的技术(《小鼠胚胎操作实验手册(第三版)》)导入已分离好的囊胚中(白色鼠),得到的嵌合囊胚转移至培养液中短暂培养后移植至受体母鼠(白色鼠)的输卵管,可生产F0代嵌合体鼠(黑白相间)。将F0代嵌合鼠与野生型小鼠回交获得F1代鼠,再将F1代杂合小鼠互相交配即可获得F2代纯合子鼠。还可将阳性鼠与Flp工具鼠交配去除阳性克隆筛选标记基因后,再通过互相交配即可得到A2AR基因人源化纯合子小鼠。
可通过PCR鉴定子代小鼠体细胞的基因型(PCR检测引物序列及目的片段长度如表1所示)。示例性的F1代小鼠(已去除Neo标记基因)的鉴定结果见图4,其中,编号为F1-01、F1-02的2只小鼠为阳性杂合小鼠。
表1 PCR检测引物序列及目的片段长度
可通过常规检测方法确认阳性小鼠体内人A2AR的mRNA和蛋白表达情况,例如可以使用RT-PCR检测A2AR人源化小鼠体内A2AR mRNA的表达。具体来说,分别选取野生型C57BL/6小鼠和本方法制备的A2AR基因人源化纯合子小鼠各1只,脱颈安乐死后取脾脏细胞,设计如表2所示引物序列对C57BL/6小鼠和A2AR基因人源化纯合子小鼠脾脏细胞的mRNA表达情况进行检测。结果显示,在C57BL/6小鼠脾脏细胞中仅检测到鼠A2AR mRNA的表达;在A2AR基因人源化纯合子小鼠脾脏细胞中只能检测到人源化A2AR mRNA的表达,未检测到鼠A2ARmRNA的表达(图5)。
表2 RT-PCR检测引物序列及目的片段长度
经PCR鉴定为阳性的克隆再通过Southern Blot技术进行检测确认外源基因的整合情况,分别用AseI或ScaI或SspI消化细胞DNA并使用3个探针进行杂交,酶、探针及目的片段长度如表3所示)检测,Southern Blot检测结果如图4所示,分别用SacI、NcoI、HindIII或DraIII消化细胞DNA并使用3个探针进行杂交,酶、探针及目的片段长度如表3所示,Southern Blot检测结果如图12所示,实验结果表明9个经PCR验证为阳性的胚胎干细胞中,ES-01、ES-03、ES-04和ES-07为阳性克隆。
表3 Southern Blot酶和探针表
限制性内切酶 | 探针 | 野生型片段大小 | 重组序列片段大小 |
SacI | 3’Probe | 11.6kb | 9.7kb |
NcoI | 5’Probe | 5.5kb | 7.8kb |
HindIII | Neo Probe | -- | 17.4kb |
DraIII | Neo Probe | -- | 7.1kb |
Southern Blot检测包括如下探针引物:
5’探针(5’Probe):
5’Probe-F:5’-GGGGTTCTTCCTGCATCTCCAGTTAC-3’(SEQ ID NO:25),
5’Probe-R:5’-ACTAAACATCAAACCCACAGGAGAGGGA-3’(SEQ ID NO:26);
3’探针(3’Probe):
3’Probe-F:5’-TCAATCCTACACTTTCCCGTCTGT-3’(SEQ ID NO:27),
3’Probe-R:5’-TCTCTCCCAGGTCTTCTCCAGCA-3’(SEQ ID NO:28);
Neo探针(Neo Probe):
Neo Probe-F:5’-GGATCGGCCATTGAACAAGA-3’(SEQ ID NO:29),
Neo Probe-R:5’-CAGAAGAACTCGTCAAGAAG-3’(SEQ ID NO:30)。
进一步采用流式细胞术检测A2AR基因人源化小鼠体内A2AR蛋白的表达情况。选取8周龄野生型C57BL/6小鼠和13周龄A2AR基因人源化纯合子小鼠各1只,腹腔注射7.5ug/200uL抗鼠CD3抗体(mCD3)刺激24小时后取脾脏细胞,经固定和破膜后分别用抗鼠CD45抗体Brilliant Violet 510TManti-mouse CD45、鼠源T细胞表面抗体Per CP/Cy5.5 anti-mouseTCRβchain、抗鼠CD4抗体Brilliant Violet 421TManti-mouse CD 4(mCD4-BV421)以及抗鼠/人A2AR交叉抗体Adenosine A2aR Antibody(7F6-G5-A2)(m/hA2AR-PE)对小鼠的脾脏细胞识别染色后进行流式检测,检测结果如图6所示。从图中可以看出,在野生型C57BL/6小鼠(图6A)和A2AR基因人源化纯合子小鼠(图6B)脾脏中均能检测人或鼠A2AR蛋白的表达。结合图5的RT-PCR检测,可以确定图6的流式检测结果中,C57BL/6小鼠体内表达的只能是鼠A2AR蛋白,A2AR基因人源化纯合子小鼠体内表达的是人A2AR蛋白。以上表明本实施例成功构建出可表达人A2AR蛋白的A2AR基因人源化小鼠。
进一步对野生型C57BL/6小鼠和A2AR人源化纯合子小鼠脾脏和外周血中的白细胞和T细胞免疫分型情况进行流式检测。取6周龄野生型C57BL/6小鼠和A2AR基因人源化纯合子小鼠各3只,取外周血后,安乐死,取脾脏细胞。经固定和破膜后分别用抗鼠CD16/32抗体Purified anti-mouse CD16/32Antibody、抗鼠CD45抗体Brilliant Violet 510TManti-mouse CD45 Antibody、抗鼠Gr-1抗体PerCP anti-mouse Ly-6G/Ly-6C(Gr-1)Antibody、抗鼠CD4抗体Brilliant Violet 421TManti-mouse CD4 Antibody、抗鼠F4/80抗体FITC anti-mouse F4/80Antibody、抗鼠CD8a抗体PE anti-mouse CD8a Antibod y、抗鼠NK1.1抗体PE/CyTM7Mouse anti-mouse NK1.1 Antibody、抗鼠Foxp3抗体APC anti-mouse/rat Foxp3Antibody、抗鼠CD19抗体FITC anti-Mouse CD19 Antibod y、抗鼠TCRβ抗体PerCP/Cy5.5anti-mouse TCRβchain Antibody、抗鼠TCRβ抗体AP C Hamster Anti-Mouse TCRβChainAntibody、抗鼠CD11c抗体Brilliant Violet 605TMa nti-mouse CD11c Antibody、抗人/鼠CD11b抗体PE anti-mouse/human CD11b Antibody对小鼠的脾脏细胞和外周血细胞识别染色后进行流式检测,脾脏中白细胞亚型和T细胞亚型检测结果分别如图7和图8所示,外周血中白细胞亚型和T细胞亚型检测结果分别如图9和图10所示,从图中可以看出,A2AR基因人源化纯合子小鼠脾脏样本中B细胞(B Cell)、T细胞(T Cell)、NK细胞(NK Cell)、CD4+T细胞(CD4)、CD8+T细胞(CD8)、粒细胞(Granulocyte)、DC细胞(DC Cell)、巨噬细胞(Macrophage)和单核细胞(Monocyte)等白细胞亚型与C57BL/6野生型小鼠一致(图7和9),CD4+T细胞(CD4)、CD8+T细胞(CD8)和Tregs细胞(Treg cell)等T细胞亚型百分比与C57BL/6野生型小鼠一致(图8和10)。上述结果表明A2AR基因的人源化改造没有影响小鼠体内白细胞和T细胞的分化、发育和在脾脏和外周血中的分布。
进一步通过cAMP检测,验证A2AR基因人源化纯合子小鼠的胞内信号通路。CGS21680是诺华公司研制的A2AR激动剂,目前处于临床前开发阶段,该药物对人和鼠的A2AR均具有亲和性。取6周龄野生型C57BL/6小鼠和A2AR基因人源化纯合子小鼠各1只,安乐死,提取脾脏细胞和骨髓细胞,与不同浓度的A2AR激动剂CGS21680(0n M、0.5μM、5μM、50μM和500μM)进行孵育后,利用Ultra cAMP Kit试剂盒检测cAMP含量。检测结果如图11所示,在本底水平(CGS21680浓度为0nM、0.5μM、5μM和50μM),A2AR人源化纯合子小鼠脾细胞和骨髓细胞cAMP水平与C57BL/6小鼠无显著差异,A2AR基因人源化纯合子小鼠(G3和G4)与C57BL/6鼠(G1和G2)的A2AR对于介导cAMP通路功能无明显差异;在较强的刺激下(CGS21680浓度为500μM),相较于C57BL/6,A2AR人源化纯合子小鼠脾细胞和骨髓细胞cAMP水平显著高于C57BL/6小鼠,表明高浓度CGS21680下,A2AR人源化纯合子小鼠对C GS21680刺激的敏感性高于野生小鼠。说明本发明实施例的A2AR基因的人源化小鼠的A2AR蛋白能正常表达,并介导下游cAMP通路。
实施例2体内药效验证
利用本方法制得的A2AR人源化小鼠可以用于评估靶向人A2AR的调节剂的药效。例如,取A2AR人源化小鼠纯合子皮下接种小鼠结肠癌细胞MC38,待肿瘤体积生长到约100mm3后根据肿瘤体积分为对照组或治疗组,治疗组随机选择靶向人A2AR的化合物X、Y、Z等,对照组注射等体积的生理盐水。定期测量肿瘤体积并称量小鼠的体重,可通过比较小鼠体重变化和肿瘤大小即可有效评估化合物的体内安全性和体内药效。
实施例3双基因或多基因人源化小鼠
利用本方法或制得的A2AR基因人源化小鼠还可以制备双基因修饰或多基因修饰的小鼠模型。如,前述实施例1中,囊胚显微注射使用的胚胎干细胞可选择来源于含有PD-1、PD-L1、CTLA4、OX40、LAG3、TIM3、CD73等其它基因修饰的小鼠,或者,也可在人源化A2AR小鼠的基础上,利用分离小鼠ES胚胎干细胞和基因重组打靶技术,获得A2AR与其它基因修饰的双基因或多基因修饰的小鼠模型。也可将本方法得到的A2AR小鼠纯合子或杂合子与其它基因修饰的纯合或杂合小鼠交配,对其后代进行筛选,根据孟德尔遗传规律,可有一定机率得到A2AR基因与其它基因修饰的双基因或多基因修饰的杂合小鼠,再将杂合子相互交配可以得到双基因或多基因修饰的纯合子,利用这些双基因或多基因修饰的小鼠可以进行靶向人A2AR和其它基因调节剂的体内药效验证等。
以上详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。
此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。
序列表
<110> 百奥赛图(北京)医药科技股份有限公司
<120> A2AR基因人源化非人动物及其构建方法和应用
<130> 1
<150> 2020108489134
<151> 2020-08-21
<160> 30
<170> SIPOSequenceListing 1.0
<210> 1
<211> 410
<212> PRT
<213> Mouse
<400> 1
Met Gly Ser Ser Val Tyr Ile Met Val Glu Leu Ala Ile Ala Val Leu
1 5 10 15
Ala Ile Leu Gly Asn Val Leu Val Cys Trp Ala Val Trp Ile Asn Ser
20 25 30
Asn Leu Gln Asn Val Thr Asn Phe Phe Val Val Ser Leu Ala Ala Ala
35 40 45
Asp Ile Ala Val Gly Val Leu Ala Ile Pro Phe Ala Ile Thr Ile Ser
50 55 60
Thr Gly Phe Cys Ala Ala Cys His Gly Cys Leu Phe Phe Ala Cys Phe
65 70 75 80
Val Leu Val Leu Thr Gln Ser Ser Ile Phe Ser Leu Leu Ala Ile Ala
85 90 95
Ile Asp Arg Tyr Ile Ala Ile Arg Ile Pro Leu Arg Tyr Asn Gly Leu
100 105 110
Val Thr Gly Met Arg Ala Lys Gly Ile Ile Ala Ile Cys Trp Val Leu
115 120 125
Ser Phe Ala Ile Gly Leu Thr Pro Met Leu Gly Trp Asn Asn Cys Ser
130 135 140
Gln Lys Asp Glu Asn Ser Thr Lys Thr Cys Gly Glu Gly Arg Val Thr
145 150 155 160
Cys Leu Phe Glu Asp Val Val Pro Met Asn Tyr Met Val Tyr Tyr Asn
165 170 175
Phe Phe Ala Phe Val Leu Leu Pro Leu Leu Leu Met Leu Ala Ile Tyr
180 185 190
Leu Arg Ile Phe Leu Ala Ala Arg Arg Gln Leu Lys Gln Met Glu Ser
195 200 205
Gln Pro Leu Pro Gly Glu Arg Thr Arg Ser Thr Leu Gln Lys Glu Val
210 215 220
His Ala Ala Lys Ser Leu Ala Ile Ile Val Gly Leu Phe Ala Leu Cys
225 230 235 240
Trp Leu Pro Leu His Ile Ile Asn Cys Phe Thr Phe Phe Cys Ser Thr
245 250 255
Cys Gln His Ala Pro Pro Trp Leu Met Tyr Leu Ala Ile Ile Leu Ser
260 265 270
His Ser Asn Ser Val Val Asn Pro Phe Ile Tyr Ala Tyr Arg Ile Arg
275 280 285
Glu Phe Arg Gln Thr Phe Arg Lys Ile Ile Arg Thr His Val Leu Arg
290 295 300
Arg Gln Glu Pro Phe Arg Ala Gly Gly Ser Ser Ala Trp Ala Leu Ala
305 310 315 320
Ala His Ser Thr Glu Gly Glu Gln Val Ser Leu Arg Leu Asn Gly His
325 330 335
Pro Leu Gly Val Trp Ala Asn Gly Ser Ala Pro His Ser Gly Arg Arg
340 345 350
Pro Asn Gly Tyr Thr Leu Gly Pro Gly Gly Gly Gly Ser Thr Gln Gly
355 360 365
Ser Pro Gly Asp Val Glu Leu Leu Thr Gln Glu His Gln Glu Gly Gln
370 375 380
Glu His Pro Gly Leu Gly Asp His Leu Ala Gln Gly Arg Val Gly Thr
385 390 395 400
Ala Ser Trp Ser Ser Glu Phe Ala Pro Ser
405 410
<210> 2
<211> 412
<212> PRT
<213> Human
<400> 2
Met Pro Ile Met Gly Ser Ser Val Tyr Ile Thr Val Glu Leu Ala Ile
1 5 10 15
Ala Val Leu Ala Ile Leu Gly Asn Val Leu Val Cys Trp Ala Val Trp
20 25 30
Leu Asn Ser Asn Leu Gln Asn Val Thr Asn Tyr Phe Val Val Ser Leu
35 40 45
Ala Ala Ala Asp Ile Ala Val Gly Val Leu Ala Ile Pro Phe Ala Ile
50 55 60
Thr Ile Ser Thr Gly Phe Cys Ala Ala Cys His Gly Cys Leu Phe Ile
65 70 75 80
Ala Cys Phe Val Leu Val Leu Thr Gln Ser Ser Ile Phe Ser Leu Leu
85 90 95
Ala Ile Ala Ile Asp Arg Tyr Ile Ala Ile Arg Ile Pro Leu Arg Tyr
100 105 110
Asn Gly Leu Val Thr Gly Thr Arg Ala Lys Gly Ile Ile Ala Ile Cys
115 120 125
Trp Val Leu Ser Phe Ala Ile Gly Leu Thr Pro Met Leu Gly Trp Asn
130 135 140
Asn Cys Gly Gln Pro Lys Glu Gly Lys Asn His Ser Gln Gly Cys Gly
145 150 155 160
Glu Gly Gln Val Ala Cys Leu Phe Glu Asp Val Val Pro Met Asn Tyr
165 170 175
Met Val Tyr Phe Asn Phe Phe Ala Cys Val Leu Val Pro Leu Leu Leu
180 185 190
Met Leu Gly Val Tyr Leu Arg Ile Phe Leu Ala Ala Arg Arg Gln Leu
195 200 205
Lys Gln Met Glu Ser Gln Pro Leu Pro Gly Glu Arg Ala Arg Ser Thr
210 215 220
Leu Gln Lys Glu Val His Ala Ala Lys Ser Leu Ala Ile Ile Val Gly
225 230 235 240
Leu Phe Ala Leu Cys Trp Leu Pro Leu His Ile Ile Asn Cys Phe Thr
245 250 255
Phe Phe Cys Pro Asp Cys Ser His Ala Pro Leu Trp Leu Met Tyr Leu
260 265 270
Ala Ile Val Leu Ser His Thr Asn Ser Val Val Asn Pro Phe Ile Tyr
275 280 285
Ala Tyr Arg Ile Arg Glu Phe Arg Gln Thr Phe Arg Lys Ile Ile Arg
290 295 300
Ser His Val Leu Arg Gln Gln Glu Pro Phe Lys Ala Ala Gly Thr Ser
305 310 315 320
Ala Arg Val Leu Ala Ala His Gly Ser Asp Gly Glu Gln Val Ser Leu
325 330 335
Arg Leu Asn Gly His Pro Pro Gly Val Trp Ala Asn Gly Ser Ala Pro
340 345 350
His Pro Glu Arg Arg Pro Asn Gly Tyr Ala Leu Gly Leu Val Ser Gly
355 360 365
Gly Ser Ala Gln Glu Ser Gln Gly Asn Thr Gly Leu Pro Asp Val Glu
370 375 380
Leu Leu Ser His Glu Leu Lys Gly Val Cys Pro Glu Pro Pro Gly Leu
385 390 395 400
Asp Asp Pro Leu Ala Gln Asp Gly Ala Gly Val Ser
405 410
<210> 3
<211> 4240
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
ggtaaggctg ggattgtaga acccaggaag aaacccactg cagctgcaat gggcagtgtg 60
tgtactgccc tgtcccctct gcttggccgg agcaggagca gtgtgtgcag gcctgcctgt 120
gagctcgtag acacatctag cagggtctgg agccaccacc tgggcctgtg tacacagagc 180
ttcgggtggc tcaggagaga tgtgggttgg gattaaatga ttttaattaa agtggctggt 240
tcaggatggg agcgaatggg gacgaagagg cggcaatgct aaatctgaat gctgggcggc 300
cgagcggctg ttccttcaag gctctcgact catgttccac agtatgtgcc tggaggtgac 360
ctgggacagt gtctgtgctc taccctgtcc ccaacagtga cccatcataa ggaaatgtat 420
tattaatatt taatttcccc ccttggctag caacagatga ctcaaggatt agtccgatag 480
agccaacaga gagggatagg aaattgctag atcctggcgc tacactggcc ccttctcctg 540
ggccccaaac cttcctgtga ccctggagca gcggttctca accttcctaa tgctgtgacc 600
ctttaataca gttcctcatg ttggagtaac ctcccccctg caccccaacc ataaaatgat 660
ttccgttgct acttcataac taattttgtt cctgttatga atcacagtgt aaatattctg 720
ggagatagag gttttccaaa agagacccac aggttaagga caacctgtgc cgcgggagct 780
tcacgaggag gaaggtctcc cgcagcatcc cttggcattc cctagcggct aagccacgct 840
ttaacattcc cggtaaagcc gagagtcttt tcacctgttt gggttctggc ttctcctcta 900
aaagattgag ttcaccagga aatcaaggac atagctttca gccactttcc aaaatgccat 960
gagcatgcat gagttcctca gtggggccca gtgtagtctt ggtattcaga tcgacagcca 1020
cctggacaac accgggctta gtggttcagc cgcagctagc atctcttggc cctgagtgct 1080
gctcagtccg gtcagtgaaa ccttagtagg cttggattgt cccagtggga acgttcatac 1140
tacaaagaaa agctacacgt caaggtgccc tggccctgag ctatttagct gtgtgcctac 1200
agctagacag cctcagcctt ctgcctacag ggctcctccc tcctgtctgt cctgagaatg 1260
tctcagagct ctactgatct gccggacttg gggctgggga aggcacaaag gaaaagaaga 1320
tttgggtttg gcagctgccc aggtggcccc aggatcagag gagctttccc ctgggatgcg 1380
aagcaataac taagggcctg caggaatgtt gaaggaaggg cagaggaaag ggccctggga 1440
caggaacctc tagcgtgtct cagccaaagc aaggcggcct ggcaggaggg ccagctgtgt 1500
tgagactgga gatctgcaga acagcttcgg cgcagtcagg aagagtactg gggtccagaa 1560
atatccaaca tgggcccagc acggaacacg agaagccttg agaactggca atactcaggc 1620
aggtaccaga gcggctggga gagcttcagg gaaaaaaaaa aaaaggcctg ggttaggccc 1680
ctgcatagct ggtgtcctgg tggctatgga gtcagtggtg ttacttgggg gaaaatactg 1740
gtggtgtgac cagaagcagc agcagggctt taggctcagg gatggagcca tctcacctcg 1800
acagaaatgt ttatgctcca ctgtgttcca ctggggacac tgaggatgga aaaatgttaa 1860
ggcctgggtc agccttttag catgggctgg tctgattgca gactgcttca gtgccctcta 1920
gtgaagattc cactagagaa gccctaaggg acataggtgg ttatcctttg tcccgaggag 1980
acgccagtca ggagagtcag cattcagggg ctcactggga ctgatggggc ctgaatggac 2040
agtgagtccg ctgctgcttc aaattctgaa agctagaaca ggagctattt tagtcatgga 2100
cctgttgtgg ccagatggac ccctgatgaa tgctgctgta aacacagagg gacatggtat 2160
gtacctggag gtggcacccg taccagatct ggccattctg tccagaatgt gagttataaa 2220
cagctcgttg gcaagtagct tgtgcaaagc tgggactcac aaggacttag ccataggtgt 2280
ctctgcctga ccttaggagc aatggcatca cttagggaca gtaattccgt cagttgctgc 2340
agactttgtc ttctccttcc aaaccttcag tcagcctcgt aggtgacaaa ggacaagctg 2400
cagctgtagc cacgctgact ctagactgaa gcactggcaa catcgcagaa gcaagcgtgc 2460
ggttcatttc ctttagctct ccattttacc tctcggccaa tttcaggtgg agaggaccct 2520
tctccccagt cctcctgttc cactcatcca tcctgtcctt gaggagagaa ggaaagatgt 2580
gtctacatgc aggggtctga aaattagcct ctagcttctt gttcctagca ggcacatctg 2640
aggtcccatg caggtcaagt actgcaaagg atggactgga gggcgggggt aggggtgtcg 2700
tgggatcctt tggttcttgc ctggggaata acaggctatt gggagagtcc tgcttacgat 2760
gaagttttgc aagctcatgg agcataccct ggggagtttg ggctcagctg gggccctgct 2820
gcggagagag caggacttcc cctttccagg ggtctcagct cttcctgtga gctgacactg 2880
tgactctagg gtagcctttc caaatctacg gataagcgct gaaaggagcc ctcggtatca 2940
tctgggaccc aaaggtgtta cagtctgact ggagaaacgg aggcccggga acgaaaagca 3000
ttcttgccca cggtcctcca atgagtcctt actgagcacc tgtttttcta agctgcattc 3060
cctgcctcag ttaggtaggc agagggacag gagaggcgag gtgtgggagg aaagcgggag 3120
gcggatccct cagagaaggg aagcaatcgc agcgcctgcc ctgcctggct gtgcagcctg 3180
ctggcaggag cgctcttgct ctcggagcag tgggcttggc ttggaccctg ctcttgctgc 3240
ctacaagggt aaggatgctt acttgctgaa actggaggat agataggacg ggaaggctcc 3300
cagatctctc cagaaaggag ctctggggag tgtctgaggt gaccttaggg gcaggggtgt 3360
ctctcaggtg gggatggtag tatcctgaag ggatggagca aaataaactg ggcttggagg 3420
atggctcaat gcgagaaggc agggggcagg tgggatgggg aaaggccaga gaggaaagaa 3480
cattcctgga aggagggcct tacgggactg gtagtagtgt agcggcccag aggactggcc 3540
aggcggcttc aggaagtttg aaaaggtaca taagggatgt caacataacg tcaacttgcc 3600
ttgactttaa cttgctccca tagattaaaa caaagtaaag ccaacaacaa aatcttcagc 3660
cgctaatcct agctggaagg atgagtaact atagtgcctg gagtgagaac gatgtatctt 3720
tggtaatggg gacgggtcag caggaaatcc tggttctgtc tgtagtctct cctttgtctg 3780
ccctgaagag actggggaag gaatggtccc tgagaagggt tgggtgaaga tcttgatgag 3840
acttctttgg aaccagtgag ctccttgggc ctgtgtcctg actgacagat cgggcaagat 3900
gggagtcatt ctcagacaga cgcctggccc acaacggaca caaaatctga agtggccagg 3960
gtggttcagc tcttcaccgg gactctctct ttataggtat ctcagaaccc tgaagctgag 4020
tggagccagg cccggacccc ctgtagaagt catggtttcg ggagatgcag aattatccgt 4080
gagaaagcct ttgggaagct ctccctggga acgctcgcgg ctcttgtgag gaaagggctg 4140
cggggtttga gtgggtacac ggctgggctg cagctatgga ccgagagctg gcccaggccc 4200
gcatccttgc tgagcctgcc caagtgtggc ttctcccgcc 4240
<210> 4
<211> 4815
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
cccttccctt gtttcctttc acatgtgcta caaggaagac ctgtctgtaa gtccttccac 60
agctgtgtcc tcagtccttc ctcctgctcc actccttagc caagaggcga caaaggtccc 120
ggaaacagat ctgggctgag gccaagctgc cttcccttcc ttccaccaaa gaaacctatg 180
agatgccgtc ccttgctcca gtcttggttt ctgggcctcc atcgaggaga cactgctatc 240
tcactgtgat ggatagaggt gacagcttgg gatgggcaag gagccatggc gggctctgac 300
agggcctcag agggcagtgc agtatttctt gggctgtgat tcaggaaagg ggcgttagaa 360
cttaggagcc ttgctttaca tgtaattagc aatctcactg aggctaagtt cttgccctgg 420
gttacacagc taagcaagtg gaaagagatg aatctaaaat tccaggcctt cacgcttttt 480
aaaatcaatc gaccatgaac tctctcgatc aagccaaatt gtgtgaaata atgtttgtac 540
cttcaactta atcaaactca agttatttca agtggcgcag gcctttaatc ccagcactca 600
ggaagctgag gcaggcagat ctctgagttt gaggtcagcc tggtctacag agtgagttcc 660
aggacagcca gggctacata gagaaaccct gtcttgaaga aagaagggaa ggagggaggg 720
agggagggag ggagggaggg aggaagggag ggaggaagga aggaaggaag gaaggaagga 780
aggaaggaag gaaggaagga aggaaggaag gaaggaagga aggaaaaata gattacttgg 840
tctatttgac acttccatta cactctttaa gcattcctgt tacacagagg cagatacata 900
tgcaagttgc tgtagtcctc tttgaccgcg ccatcactca gaggtccttt tagctgactt 960
cagagaaaag ccgtctagga cccttctccg cagcagctcg gagccctgca cgaacagccc 1020
ctggcggttc tccagcagtg ttagtaacct aagcatcgca tggacagtgg ggccaagaag 1080
ggccgctatg aactcagagt gtcccctggt cctcatgggc tcctccctcc ttaggactgt 1140
gctggctgaa gacagaacag tgacccaggc tgtgtgtgag gtggcagaga agcagggaca 1200
ctggtggtgg tcacttggtt ccccaggtgg taggagaaga ccaggaagat gcacaagggt 1260
ggcagaaaag gaagaagtct cgctagccta gctttttctg ggaactgagc tatggggttg 1320
agctgcacag ggtaggctct gggattagga gagcagaaga aggggcttag gagggacttt 1380
caggggacag ctatggtact aatgacagag cagagagaaa aagccgagtg ggtgtggcca 1440
gcaggataaa cttgattagg aaatataaac caagtgcctt ctgtatcaaa taagaacgac 1500
agagacttac ccatcctctg gacagccagc ctgggagcct ccatggtgac atcaatggct 1560
ttgctggggg cagaggtcat ctgtctctgg ctgccagcaa cacaggaaag tataggtcct 1620
cggctgccag ccaggacagg tctgagagat tgtcccgtgg aggaggaact tgaaccagct 1680
actttaatga ggcagagtcg agcagttaac ccagtgttat ggcaagctct ggtaggggca 1740
aggcattaaa tgattctttg cccagtgtag tgaggtccag gaggagacca ttgctgccta 1800
tctgctttgg agagagcctc aagtgctgcc accaggggct ggaatttttg tctatcagga 1860
gaagcctttt tcattaaaca cattaaatac cgcctccaga tctccccgag ggtttgagga 1920
ccagggacta atctattacg gatacctgat ttgaaacaga ctaattgatt ttaggtactg 1980
cttcaagctt aaccctgaca acatactcag aaggctaaag cttattgtcc ctgtaaatca 2040
ccggtcctca acattcctaa tgccgagacc ctttaatgca gctcctcagg ttgtggtgac 2100
cgcccccacc ccctaaccat aaaattaatt ttgttgctgc atcataactg taattctgct 2160
actgtcagga atcggaatgt aagtgtttct ggagatagag ggttgacgaa tgtgttgtga 2220
gctgcaggtt gaaaatgctg ctgtggatga attacttttg cctcaagcat gactaagaac 2280
acgacacgag catagttctg agcgcgggaa ggaattcaat catttaccag gtgcctgacc 2340
attaactcgc atgtcccagg aatgatcttt aacacttcac aacaagctag tagctttgat 2400
agggttagga tcttgccgtg ttgtccctgt tgagtttgag cctgaaaaac ctgagcgaag 2460
atccttgagc atcattaaaa tgaaatttta aaccctgcat gcagtctgtg gagagattgg 2520
gaaccttctt tccccgatcc tttcataatg cgcccttaca gaagatcagt ctcttgtatg 2580
actcagttta cccaaataga taaagcttag caaatttgca aagacaaaga ggctagacag 2640
acttcttcaa gtcagttttt gcctcgagcg gaccttagga atctataaac cttgatcatg 2700
agacatgctg ttcctaagtc ctatttttca tgaacaagaa ttaaacccaa gatatatata 2760
taaaaaatgt tgtagcaaat taagattacc tatgtataga ttttttaact atcagttctt 2820
tctgttacaa gttttaagtt aacttttttg ttacagattt tacagatttt ctttttcaga 2880
accgcactca atgaatttat agatcctgag aaagagaaaa ttttaccaat ggtcttaaga 2940
gatttaaaaa aacgaaacaa acaaacaaaa aacccaaaat aaacaaaaga aaaacaaaca 3000
gaaagtgaag aaggctttga gataagagac ttttgagact ggagagtaga gcgagtttag 3060
agacaaagga ttttaagcca ggtggtggtg atggcgcaca cctttaatcc cagcactcag 3120
gaggccgagg gcaggcagat ctctgatttg aggccagcct ggtctataga ttgagtttca 3180
gttcagccag ggctacacag agaaacccct gtctcaaaaa taaataaata aatgaataaa 3240
caaacaaaca aacaaataaa taaagtatga ataaaaaggt tgagggaatc ctttgctggt 3300
gtggcagcag aagctgttac aattgaatgc acaggcaagt ggccacctca gcaggagtgc 3360
atgcccacgg caaagaggta atgaaggaca gagcctgtaa catgcaggtt ctgtccaagg 3420
gcctctctgc ccttgaaaac attttttttt gagacagggt ctcactatgt agttctggat 3480
gctggaatta cagggaccca cctgtctctg tttcctgagt gctagaatta aaggctgtac 3540
caccaagccc agctccaaag ggcctgttcc gagcatgtgt ccattcggtt tctggctgtc 3600
tccatggcaa gaatgtcagg gccacaggaa ggcccaagag aaaagatctg tcttgaattg 3660
gatatcagct ccctgagaga tgggcttcta gggcccctgc ttgttcttct ccttggctga 3720
tcagttaaac cttgccttca tcgccagctc cgttagcctg aggctcctga cctccctatg 3780
ggaggcatca tgaaagggga cctgtggagc ttgaggagtt gaggggagcc acaggtctgt 3840
gtgctgacca tggagttgca aaccacagga cacagaggaa gggcctcttg gggaggagaa 3900
atagcccact gatgcctcct gaattagttc ttcagaaaga ggaagttgac cttcttttaa 3960
actctgatgg gaagccaggc atagtagtgc ggacatttaa tcccagcact tgggaggcag 4020
aggcagacga ctctctgtga gttcaacgcc tggtctacat agatagttcc aggacagcca 4080
gggcaatgta gagaccccac cccccacccc ccttctcaag caaagcagaa caaaaccaac 4140
attaacaacg acaacaaaga ataaaataaa aaattaaccg tgatgggaac attggacccc 4200
tggaaggtcc acagaagcga aatgtccagg aagatgatgg tgctatgaag cctatacctg 4260
actcctgggc cgtaggaaaa gaaggtcaag accgcccagg aagagaatcc cttctctcct 4320
gacctacacc tctgtcttct ggttaactca ccaacatcta tggcgtaggg tatgaagagg 4380
ctctcccact gagatctcag ctgcataagg ctgttaccct ctgctgatgg gaagtgtctt 4440
tagagggggt attgctgagg agtcccagat gttccaagaa gcaaagtgac accatgcctc 4500
gccctatgtt gctcttcctg ctgtccatgc cagcatctcc tgcatcccca ggcatccctc 4560
cccgtggctg tattagcagt aactgtcagt gcttagggac agcgcctcag acctcaaaac 4620
caggtacgat gtcccctaaa gaggagctac agagaatatg tagccctggt atgggggtgc 4680
ctttctggac ctctggcttt tgtcttttct ttaaaaggaa gtctcactta tttatgtggg 4740
taaatgttct gcctgcctgc atgcctgtgt accacataca tgtgtgcctg gtacctgtga 4800
gggtgaggtg ctgga 4815
<210> 5
<211> 8085
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
atgcccatca tgggctcctc ggtgtacatc acggtggagc tggccattgc tgtgctggcc 60
atcctgggca atgtgctggt gtgctgggcc gtgtggctca acagcaacct gcagaacgtc 120
accaactact ttgtggtgtc actggcggcg gccgacatcg cagtgggtgt gctcgccatc 180
ccctttgcca tcaccatcag caccgggttc tgcgctgcct gccacggctg cctcttcatt 240
gcctgcttcg tcctggtcct cacgcagagc tccatcttca gtctcctggc catcgccatt 300
gaccgctaca ttgccatccg catcccgctc cggtgagcag ggccggggtt acatctgtgc 360
aaaggctgtt ggtgcccagg ctttggtctg tgcccggagc cagggtgagc ctgggatcag 420
ggcctggtct gcagtgtcag catggtgagc tggcgacggg gccccaggct cagcaggggc 480
tccccagggc cagcacgtgg ccagcagtca tgccgaactg actgacccct atgggcgcag 540
ggcagcctgg ccctcccagg cggcctgggt tcccctaggc tgcctgaggc caactgtgct 600
ctgctttttg gcagatgagt gtggccaggg tctggcattg ggcttagcag ggagctgtgg 660
tcccagtgac ccacgtgctg ccagcgggtg tgtctgggcc attcctcaca cacaagcaaa 720
acttcccgga tgatgctggg gtggagtggg gagccagggg aaaccatagg acctcagagt 780
taggagccgc ccgccacctg ccttccccca gatcctctgg gccagccttg cagtgtgcac 840
attaggaaaa tgacccagag aggggaagtg acttggttga atgccacagt gagtcacttg 900
gacctatatg caaattctgt tgctcctcaa gtcaccaagg actcatcgtc ttagaggcag 960
ccagtgtgct caggggctgg ctgttggagg ggatttttat ggtgaatctt ttgtgaagtg 1020
acttcagcca agtaattgtg caaatgaaga ttttcccaga ggctgaatta ctcggcatgg 1080
attccaccta cccaggccat agatgaggct agaaagtgca tccctccctt ggggacgtca 1140
gaggccttct gccccacctc ctggcccctc tgccacagag ctgggttcca cagcctgggt 1200
ggttgtgggc cctgaggcca tgtatgaggc ttgaggtggt gcctcttgag agtcagggag 1260
cagggtgcac catctctgcg gtgaattatc tgaaactggt gggtgcctat ctaaagagga 1320
agccacagca ggttgagggt gccccagcag gaaggaggac ccagctagat gagcaaatgg 1380
aaatttagag cgtcaaagcc aaggggccct tagaggtcat ttcctctcat cttcgggatg 1440
gaaaatgagc ctcagagaag acagccagct gtttccgggc cacacaacga gttggtagtg 1500
gagctggggc gagtcctgga aagaaatgtg gcctgatccc cactgtgact tcagtcactg 1560
gggagcggtc atgagcagcc tgtctcgcag agcctgcacc aggtggctgt ccctgtcacc 1620
tgggctctaa gtgggagcag gagctgcact gggctgctcc agggaagggg aggaatctgg 1680
acctcacact gccctgtcag atgctctcta tcccaggaga gtctagaacc ctcggcaaag 1740
gagaagggga ccctggccag ccctgagagg ggtggaatta gggattgtcg gactccaagt 1800
gcagtctctg gtgagcctcc atccattgct ctgcgacggg cagagcagag tttaggttcg 1860
tccagtggca gctcagaaca cggaggccca ggaggggccc tgtctgcagg tgcccaggtg 1920
ggccagagaa caaagcactg gaggggactt cagggaacca agctgagtct gcacactgat 1980
gggatgctct atggggaagc agaggccaag ctctcacttt tttctctgat tcaaagggta 2040
tgatcagggc tgccgttctc aatttaaagg agctcgactt tttttctctt ttgtctctcc 2100
ctttccttct ctgttttctg agagttgaga gaatgactcc ctatgtagta ggacaggatg 2160
tgctgtgtgg ctatggaaag ttagctgcct ctctctgggc ccatttcctc atccataaaa 2220
taggacaagt ctctctgccc ctctgagctc acaaaggtgt tctgaaggtc cagtgagtgg 2280
atggggtgac agggaccctg aggagggttg gaggcgtggg gagggtgggg attcagatct 2340
ttgggttcag agccatggac ctgcccccta tcctctaccc atctcatccc aacttccttg 2400
gagctggacc ttagttccac ccagaccttg agccatttga ctctgctcca tgaggctctg 2460
caaggcttag gctggtctct tctgcagggg gccctggaga ggatgacgac gatgatgttc 2520
atcctccctt gagggcagag agctttgcag ttgccaaagg atgtcagctc agcatctcct 2580
gtcatcctct tggcctgcat tgtggccagg cggatgttct gaccctcctg ttactcacaa 2640
actcatgggg aggccagagc agggaaggac atacgagtgt ctcctgatgt ggatggactc 2700
cagggccctt caggctgttc ctggcccgca ggtcccttcg ctttcctgtt cctcagggcc 2760
cctgggcctc tgggcatgtg gaggtgtcca tgtgggctcc cgagagcaag cggggtatga 2820
aaggaacttg gtgacactcc tggccggcgc tggagtcaca gcctgcctca ggatcctccc 2880
tcctcctttc tcagctggga atccagcctc ctctacgtgc cgtttcctgc tccactcaga 2940
aaggtccatt cggctagccc tgggtctagc ctcaggcctg ccccactctc cattaacttt 3000
ttttttaaaa aaaagaactc agttttggaa aaatctgtta ttttccaagt tcagggaacc 3060
tgttgggcta gcacagggcc tagtcgagga actctgtgag aaagacttca ggccagaggc 3120
agagatgtag ctctctgtgt tcccagagga tagggaattc agggtgagag acacaggctt 3180
ctttttccag ttcccagggg atttttgcct cactgtcccc tccctggctc tcacagcagc 3240
ccttggtgga tgttctcgct ggtttgagga acaggccaag gtgcaggtgg cagctggtgg 3300
tgaggcccga agtcctaaca cttctaagag ggcaggattg ggagagaggg ctccctggag 3360
gaggtgtcac ccagtgggtc ttgcaggacg ggcaggcagg gtctcactgg catgagtgtg 3420
ggggcaggtg tgtcaggagg ggggcaaagc ctgggacaag accctgagga aggaatgagc 3480
atgtgagcac tgggtaggga agggtggcct ggctgcctag tgacagagag agatgaacag 3540
agtgggcagg aaaggtggag gccaagtcag gcctgttcgt accaggggaa ggaatggagg 3600
tttccctgtg ggtccatggc tcttcaattc ttggatcaat gactcctttg gacaacttag 3660
gaaggctcca cctactcctc aggttgggac atgtgcacat aaagccccag ctggaatcat 3720
ggggcatatt cttggaccat agggtgagcc cccagtgtgg gtaatggaga tccccagaaa 3780
ggggcagcct gcaagccggg ggacacagag ctgcagaggg cacctccaca aagggtgggc 3840
agcagctctg ggacccacat tctctgacat gcctgggcac cccagagtgg tggtgtgtca 3900
cgctagacag ccttggcatc ccttccagct ggatggtcaa tgtttggggt ctaagacggc 3960
aagatgtgag tgtgttggtc acagatgcag cccaggatat gctgctgggc ctggctgagg 4020
ctcagctgtg attccatttg ggccctgatg ctgtccccac cccgtgggca ccagggtcca 4080
gggctctcag cctatggaga tttcttttga ataaacttag tctatttgca atttaagaaa 4140
aaaaaaagtc atgttttgcc cactctaaaa cattaaaaag gaacaaaaga gtatagtata 4200
gtagaaagtt gtcctccata ccccctgtcc cccaccctca gttccctgcc tgcaaggcca 4260
tgttaagaat ccttccagag atattctttg catatataag caagtgctat taatgtatgt 4320
tttgtttctg tccccacacg ggactttctt tgcagagtac ggtggaagac tccccttgtg 4380
ggttcccttt tctgtacaag tcaacaattg gacagaccag ggatttccat actgtgttcc 4440
cagaagcctt cgggttggct ctggtgtccc caccaattca ctgattcaat aaacatttaa 4500
taagcccctt cccttcccca gcagcttcac ctctgtgact gcctgggaat gtgggcgaca 4560
aggtttgctg ctgagaacag tttgaaaacc agcaaagcag gtggcccagg gcccaggcag 4620
ctctgcaaca cccctgtggc tgcttggctc tgctctgttg cctcaaatga caggaaactc 4680
actattgcct gaggcaggcc atctctcctg tgaacagctc agctgaaaaa ctcttaacct 4740
accctgagtt acaatctgcc tccctataat ttccacccac tgattctcca ttctgccctt 4800
agagggcaga gtgctgacag gtccacgact tggtcccatt ttacaaatga agaaactgag 4860
gctcagagag acaaagtttt aaaacattcc tgttaacagg gccagaaccc aggaagggat 4920
atgcttttct caggaataat gtcaaaatta atatagcttc ccagtcaatg aggactatat 4980
aaattactat ttgcaaagca ctaagaacag tgtccggcac agagtcagtg ctatgtaatg 5040
tagatgtgag aatgagagag cctgagattt tatgtttgcg agtcccacag gaggcagggc 5100
aatgccaact ccctgttgct tggaagcaat gggcaagtct atgaccctcc tgttgaggcc 5160
ctgttacagg taaccaagcc cccacggaat ggagctgagg agctcctgag aatgggcttg 5220
tccggttact gtttggattc agaactgacc taagagattc agaacagaca gactcgcctt 5280
ggcctgagtt gcctctgggc tcttggaatg tccacagcaa gtccattcct ctccttgggc 5340
ctcaatttac ccacctgtaa aacaagagga ttggaccaca taagagatcg gaagccacca 5400
gggtttctct ttttctcttt tatttgaatt agttgacaaa acttaaatct tgggagattt 5460
tacccagaaa atcatctccc cagccccacc tgagatctgg taatagcagg cgtacgtttt 5520
gcatggcgct gaagaccagg taaacgcccc accagctgcc tcctgtgtgt gctacctata 5580
ggcgcctgtt tgctacccgt gaatgagatg gtttctgtgg atgttcccag ctccgcagtt 5640
aagtagagca catccttccc cttgcacctt tttttttttt tttttttttt tttttttgga 5700
gactgagtct tgctctgtct cccaggctgg agtgcagtgg cgcgatcttg gctcactgca 5760
agctctgcct cctgggttca caccattctc ctgcctgtct cccaagtagc tgggattaca 5820
ggcccccgcc accacggccg gctagttttt tttattttta gtagagacaa ggtttctcca 5880
tctcctgacc tcgtgatccg cctgcctcgg cctcccaaag tgctgggatt acaggtgtga 5940
gccactgcgc ccggcctcct tgcaccttct gagtgtccct gtctcggagc tggcaatgca 6000
gagatggatg taggaaagcc ctgcccccga ggggcccaga tgtggtgggg atctgctgca 6060
cttcggtagg aaacttcttt gagatctcta tcctggactt gaaggatggg tagggtttct 6120
gccaggtaga ggggagtgta gtctggtctt gccagaatca aaactgttaa acagaagtca 6180
tccctcagtg atcatcaagg ttgccttcct aaattaggga gacttttttt ttttattgtc 6240
cattctttca tgaaatctag gccacctttc ctacagggct gaggtctgct tactggctgg 6300
cagatccagc catttcccga gtatgagact gggagtcggt aggcttggat ttctgtctgg 6360
ctctcactca ggaagactga gtgatttcgg gcagattact gtccccctgg acctcagtat 6420
ttccttgcaa atgttaagat ggccatgtaa atgttaacaa gtaattctct catttctctc 6480
cagagggctg tgggtgggtt tggaggggag aaatggcatc tcctttggcc tgggacctcc 6540
tcccctcttt taccctccat gctgcctctc ctcaagggct tctggagtcc ccaagtcaaa 6600
tggcaaatgg ggaagagaag acagggtatg gagtacaaga ggcctagatc ctctataggt 6660
ctgatctggc tggtgctgcc cctagccagt aaagccaccc tccagacccc ttcaagcctg 6720
ttgtagcctt aaccaagatc aaccaacatg gaggtgactg atcttggtta aggctgcgac 6780
caacatggag gtaattgatc ttggttaagg ctacgacacg tttcccttta gagaaaaatc 6840
atgttttccc cctcaaaaaa tcatgcgtta atttcctcca accaaactaa gtcccaggac 6900
tactccgaaa actactcaat gaccatctgg gcatttgtac atgggtttcc atttcttgga 6960
tgcctgctct cctgttacct cccagaagcc tgtgaaaaag gcaaggcata ttacttccac 7020
ttaacggaag aggatgctgg ggcgaggtgg caggaaatga ctggtccaag accttacagt 7080
caggaaatgt ggaaacgggt gctgctctgg ggttctgaac tcttggccct gcttaaccct 7140
ggcttctcag atctctgatg ctggtctctt ctccccaggt acaatggctt ggtgaccggc 7200
acgagggcta agggcatcat tgccatctgc tgggtgctgt cgtttgccat cggcctgact 7260
cccatgctag gttggaacaa ctgcggtcag ccaaaggagg gcaagaacca ctcccagggc 7320
tgcggggagg gccaagtggc ctgtctcttt gaggatgtgg tccccatgaa ctacatggtg 7380
tacttcaact tctttgcctg tgtgctggtg cccctgctgc tcatgctggg tgtctatttg 7440
cggatcttcc tggcggcgcg acgacagctg aagcagatgg agagccagcc tctgccgggg 7500
gagcgggcac ggtccacact gcagaaggag gtccatgctg ccaagtcact ggccatcatt 7560
gtggggctct ttgccctctg ctggctgccc ctacacatca tcaactgctt cactttcttc 7620
tgccccgact gcagccacgc ccctctctgg ctcatgtacc tggccatcgt cctctcccac 7680
accaattcgg ttgtgaatcc cttcatctac gcctaccgta tccgcgagtt ccgccagacc 7740
ttccgcaaga tcattcgcag ccacgtcctg aggcagcaag aacctttcaa ggcagctggc 7800
accagtgccc gggtcttggc agctcatggc agtgacggag agcaggtcag cctccgtctc 7860
aacggccacc cgccaggagt gtgggccaac ggcagtgctc cccaccctga gcggaggccc 7920
aatggctatg ccctggggct ggtgagtgga gggagtgccc aagagtccca ggggaacacg 7980
ggcctcccag acgtggagct ccttagccat gagctcaagg gagtgtgccc agagccccct 8040
ggcctagatg accccctggc ccaggatgga gcaggagtgt cctga 8085
<210> 6
<211> 80
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
agatgacccc ctggcccagg atggagcagg agtgtcctga gggaaagaca ttttaatatt 60
tttgggttgg ctggaccaat 80
<210> 7
<211> 80
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
cctcctgtcc taagaacaga aagtgagagg acctagcgcc catatggaat tccgaagttc 60
ctattctcta gaaagtatag 80
<210> 8
<211> 80
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
ataggaactt catcagtcag gtacataatt aggtggatcc cccttccctt gtttcctttc 60
acatgtgcta caaggaagac 80
<210> 9
<211> 2610
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
gagtggcgct ggaggaggcg gtcaggacgc gtggacctga agcgcccacg ttggggcgaa 60
gggtgctttg ctgccggacc catcaccacc tcgcccttcc agagacagtt tcccctggtt 120
cccgcctcga ggcctcggtt tcccccagca gcggggcggg gcgggagcag cgctggtttc 180
gaagtcgcct gcagggtgcg cccatgagcg gcgcggccgg agctggagcc cgagcggtcg 240
ctgagacggt gggagccaga gcaagaggca ggtatctcag aaccctgaag ctgagtggag 300
ccaggcccgg accccctgta gaagtcatgg tttcgggaga tgcagaatta tccgtgagaa 360
agcctttggg aagctctccc tgggaacgct cgcggctctt gtgaggaaag ggctgcgggg 420
tttgagtggg tacacggctg ggctgcagct atggaccgag agctggccca ggcccgcatc 480
cttgctgagc ctgcccaagt gtggcttctc ccgccatgcc catcatgggc tcctcggtgt 540
acatcacggt ggagctggcc attgctgtgc tggccatcct gggcaatgtg ctggtgtgct 600
gggccgtgtg gctcaacagc aacctgcaga acgtcaccaa ctactttgtg gtgtcactgg 660
cggcggccga catcgcagtg ggtgtgctcg ccatcccctt tgccatcacc atcagcaccg 720
ggttctgcgc tgcctgccac ggctgcctct tcattgcctg cttcgtcctg gtcctcacgc 780
agagctccat cttcagtctc ctggccatcg ccattgaccg ctacattgcc atccgcatcc 840
cgctccggta caatggcttg gtgaccggca cgagggctaa gggcatcatt gccatctgct 900
gggtgctgtc gtttgccatc ggcctgactc ccatgctagg ttggaacaac tgcggtcagc 960
caaaggaggg caagaaccac tcccagggct gcggggaggg ccaagtggcc tgtctctttg 1020
aggatgtggt ccccatgaac tacatggtgt acttcaactt ctttgcctgt gtgctggtgc 1080
ccctgctgct catgctgggt gtctatttgc ggatcttcct ggcggcgcga cgacagctga 1140
agcagatgga gagccagcct ctgccggggg agcgggcacg gtccacactg cagaaggagg 1200
tccatgctgc caagtcactg gccatcattg tggggctctt tgccctctgc tggctgcccc 1260
tacacatcat caactgcttc actttcttct gccccgactg cagccacgcc cctctctggc 1320
tcatgtacct ggccatcgtc ctctcccaca ccaattcggt tgtgaatccc ttcatctacg 1380
cctaccgtat ccgcgagttc cgccagacct tccgcaagat cattcgcagc cacgtcctga 1440
ggcagcaaga acctttcaag gcagctggca ccagtgcccg ggtcttggca gctcatggca 1500
gtgacggaga gcaggtcagc ctccgtctca acggccaccc gccaggagtg tgggccaacg 1560
gcagtgctcc ccaccctgag cggaggccca atggctatgc cctggggctg gtgagtggag 1620
ggagtgccca agagtcccag gggaacacgg gcctcccaga cgtggagctc cttagccatg 1680
agctcaaggg agtgtgccca gagccccctg gcctagatga ccccctggcc caggatggag 1740
caggagtgtc ctgagggaaa gacattttaa tatttttggg ttggctggac caatctcatt 1800
aagagaagag aagaaacgcc cacgccagga aacccactgg gtgcccggct cccactctgc 1860
gggagcatca agctggagca gcatgaagcc cagtaagaaa ggcctggggc ggaggaggcg 1920
atgcttcggt ctatagggcc ccgagttagg tcagggctac agcagcatct tcgaaggcag 1980
ggcccagttc ccctgctcca gaagcgtcca caagagctgc cttgccttgt agagcagctg 2040
tggcttagag gcctggcctg atgctggggt atggctgcct caggcctcct gctaatacac 2100
tactctcccc agaccgccga ggcctcaggg agctgctgac ctagaagtgg cacttggcta 2160
tttttttttt ccaagaagat aacaatgtga ggaaaccctt tctattttat tgacttcccc 2220
tccctggctg ctgggtctgt ggtcgatcct gctgtgactc tcccctccac accccaccca 2280
ccaaggaatt gcagacggtc ctctcgggtt agcccaagct gccatgcact cagtcacagg 2340
gctatctccc gctaataaag ctgggctgga agacagaaac tatgaaaggc agggtgccag 2400
agtgtgggct cacgtctcag gattgagttt agagacatca agtcatggac ccgagctgga 2460
tagttcagag ctgccctgtg gggaggccct gcctactgcc tttccttcgg gggtggggtg 2520
gggtgggggt ggggcttgtt tgtttgtttg tgttttattt tccccctgag ataaaataaa 2580
atgagccaca ctgtgtttta aatttgcctg 2610
<210> 10
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
gagcttctta cccaggagca cc 22
<210> 11
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
ccttcgaaga tgctgctgta gcc 23
<210> 12
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
agagagggga agtgacttgg ttga 24
<210> 13
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
acttagagcc caggtgacag ggaca 25
<210> 14
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
gtcattcctc acaggcgtca 20
<210> 15
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
agggacggca tctcataggt 20
<210> 16
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
gacaagcgtt agtaggcaca tatac 25
<210> 17
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
gctccaattt cccacaacat tagt 24
<210> 18
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
acgtcaccaa cttcttcgtg gta 23
<210> 19
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
cgggtccatg acttgatgtc tct 23
<210> 20
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
ctactttgtg gtgtcactgg cg 22
<210> 21
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
agtgccactt ctaggtcagc ag 22
<210> 22
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
tcaccatctt ccaggagcga ga 22
<210> 23
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
gaaggccatg ccagtgagct t 21
<210> 24
<211> 140
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
gaccgagagc tggcccaggc ccgcatcctt gctgagcctg cccaagtgtg gcttctcccg 60
ccatgcccat catgggctcc tcggtgtaca tcacggtgga gctggccatt gctgtgctgg 120
ccatcctggg caatgtgctg 140
<210> 25
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
ggggttcttc ctgcatctcc agttac 26
<210> 26
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
actaaacatc aaacccacag gagaggga 28
<210> 27
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
tcaatcctac actttcccgt ctgt 24
<210> 28
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
tctctcccag gtcttctcca gca 23
<210> 29
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
ggatcggcca ttgaacaaga 20
<210> 30
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
cagaagaact cgtcaagaag 20
Claims (15)
1.一种A2AR基因人源化的非人动物的构建方法,其特征在于,所述的非人动物基因组包含人或人源化A2AR基因,所述的非人动物体内表达人或人源化A2AR蛋白。
2.根据权利要求1所述的构建方法,其特征在于,所述的人源化A2AR基因包含人A2AR核苷酸序列的1号外显子至4号外显子的全部或部分,优选的,所述的人源化A2AR基因包含人A2AR核苷酸序列的3号至4号外显子的全部或部分,进一步优选的,所述的人源化A2AR基因包含人A2AR核苷酸序列的3号和4号外显子的编码区。
3.根据权利要求1所述的构建方法,其特征在于,所述的人源化A2AR基因包含下列组中的一种:
(A)包含SEQ ID NO:5所示核苷酸序列的全部或部分;
(B)包含与SEQ ID NO:5所示核苷酸序列的同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%的核苷酸序列;
(C)包含与SEQ ID NO:5所示核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸的核苷酸序列;或,
(D)具有SEQ ID NO:5所示核苷酸序列的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
4.根据权利要求1所述的构建方法,其特征在于,所述的人源化A2AR基因的核苷酸序列转录的mRNA选自下列组中的一种:
(a)包含SEQ ID NO:9所示核苷酸序列的全部或部分;
(b)包含与SEQ ID NO:9所示核苷酸序列的同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%的核苷酸序列;
(c)包含与SEQ ID NO:9所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸的核苷酸序列;或
(d)包含SEQ ID NO:9所示的核苷酸序列,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
5.根据权利要求3所述的构建方法,其特征在于,所述的人源化A2AR基因中包含SEQ IDNO:6和24所示核苷酸序列,或包含与SEQ ID NO:6和24具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%同一性的核苷酸序列。
6.根据权利要求1所述的构建方法,其特征在于,所述的人源化A2AR蛋白的氨基酸序列包含下列组中的一种:
A)包含SEQ ID NO:2所示氨基酸序列的全部或部分;
B)包含SEQ ID NO:2所示氨基酸序列同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%的氨基酸序列;
C)包含SEQ ID NO:2所示所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸的氨基酸序列;或,
D)包含SEQ ID NO:2所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
7.根据权利要求1所述的构建方法,其特征在于,所述的构建方法包括用包含人或人源化A2AR基因的核苷酸序列导入非人动物A2AR基因座,优选用包含人A2AR基因的1号至4号外显子的全部或部分导入非人动物A2AR基因座,进一步优选用3号至4号外显子的全部或部分导入非人动物A2AR基因座,进一步优选的,所述的构建方法包括用包含编码SEQ ID NO:2的核苷酸序列导入非人动物A2AR基因座。
8.根据权利要求1-7任一所述的构建方法,其特征在于,所述的非人动物还包括其他基因修饰,优选的,所述的其他基因包含PD-1、PD-L1、CTLA4、OX40、LAG3、TIM3和CD73中的至少一种。
9.一种靶向载体,其特征在于,所述的靶向载体包含人A2AR核苷酸序列的部分,所述的人A2AR核苷酸序列的部分包含人A2AR的1号至4号外显子的全部或部分;优选的,所述的人A2AR核苷酸序列的部分包含人A2AR的3号至4号外显子的全部或部分,进一步优选的,包含3号和4号外显子的编码区,优选的,包含编码SEQ ID NO:2的核苷酸序列,进一步优选的,包含SEQ ID NO:5所示核苷酸序列。
10.根据权利要求9所述的靶向载体,其特征在于,所述的靶向载体还包含5’臂,其选自非人动物A2AR基因基因组DNA的100-10000个长度的核苷酸;更优选的,所述的5’臂与NCBI登录号为NC_000076.6至少具有90%同源性的核苷酸;进一步优选的,所述5’臂序列与SEQID NO:3至少具有90%同源性,或者如SEQ ID NO:3所示;和/或,所述的靶向载体还包含3’臂,其选自非人动物A2AR基因基因组DNA的100-10000个长度的核苷酸;优选的,所述的3’臂与NCBI登录号为NC_000076.6至少具有90%同源性的核苷酸;进一步优选的,所述的3’臂序列与SEQ ID NO:4至少具有90%同源性,或者如SEQ ID NO:4所示。
11.一种人源化A2AR基因,其特征在于,所述的人源化A2AR基因包含人A2AR基因的部分,优选的,所述的人源化A2AR基因包含人A2AR核苷酸序列的1号外显子至4号外显子的全部或部分,优选的,所述的人源化A2AR基因包含人A2AR核苷酸序列的3号至4号外显子的全部或部分,进一步优选的,所述的人源化A2AR基因包含人A2AR核苷酸序列的3号和4号外显子的编码区。
12.根据权利要求11所述的人源化A2AR基因,其特征在于,所述的人源化A2AR基因中包含下列组中的一种:
(A)包含SEQ ID NO:5所示核苷酸序列的全部或部分;
(B)包含与SEQ ID NO:5所示核苷酸序列的同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%的核苷酸序列;
(C)包含与SEQ ID NO:5示核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸的核苷酸序列;或,
(D)具有SEQ ID NO:5所示核苷酸序列的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
13.根据权利要求11所述的人源化A2AR基因,其特征在于,所述的人源化A2AR基因的核苷酸序列转录的mRNA选自下列组中的一种:
(a)包含SEQ ID NO:9所示核苷酸序列的全部或部分;
(b)包含与SEQ ID NO:9所示核苷酸序列的同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%的核苷酸序列;
(c)包含与SEQ ID NO:9所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸的核苷酸序列;或
(d)包含SEQ ID NO:9所示的核苷酸序列,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
14.一种细胞、组织或器官,其特征在于,所述细胞、组织或器官来源于权利要求1-8任一所述的构建方法获得的非人动物或其子代、或者来自权利要求1-8任一所述的构建方法获得的非人动物或其子代制备的疾病模型,或者,所述的细胞、组织或者器官包含权利要求11-13任一所述的人源化A2AR基因。
15.权利要求1-8任一所述的构建方法获得的非人动物或其子代、或者权利要求1-8任一所述的构建方法获得的非人动物或其子代制备的疾病模型、权利要求11-13所述的人源化A2AR基因、权利要求14所述的细胞、组织或器官的应用,其特征在于,所述应用包括:
在人类细胞的免疫过程的产品开发,制造抗体中的应用;
作为药理学、免疫学、微生物学、医学研究的模型系统中的应用;
在生产和利用动物实验疾病模型,用于开发新的诊断策略和/或治疗策略中的应用;或者,
在筛选、验证、评价或研究A2AR功能、人A2AR信号机理、靶向人的抗体、靶向人的药物、药效,心脑血管疾病、神经性疾病或免疫相关疾病药物以及抗肿瘤或抗炎症药物,开发和测试治疗性抗体和其它相关生物大分子药物,筛选和评估人用药及药效研究方面的应用。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2020108489134 | 2020-08-21 | ||
CN202010848913 | 2020-08-21 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113774086A true CN113774086A (zh) | 2021-12-10 |
Family
ID=78838776
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110964703.6A Withdrawn CN113774086A (zh) | 2020-08-21 | 2021-08-20 | A2ar基因人源化非人动物及其构建方法和应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113774086A (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012064340A1 (en) * | 2009-11-13 | 2012-05-18 | Academia Sinica | Dual-action compounds targeting adenosine a2a receptor and adenosine transporter for prevention and treatment of neurodegenerative diseases |
CN109666701A (zh) * | 2017-10-13 | 2019-04-23 | 北京百奥赛图基因生物技术有限公司 | 一种pd-1基因修饰人源化动物模型的构建方法及其应用 |
-
2021
- 2021-08-20 CN CN202110964703.6A patent/CN113774086A/zh not_active Withdrawn
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012064340A1 (en) * | 2009-11-13 | 2012-05-18 | Academia Sinica | Dual-action compounds targeting adenosine a2a receptor and adenosine transporter for prevention and treatment of neurodegenerative diseases |
CN109666701A (zh) * | 2017-10-13 | 2019-04-23 | 北京百奥赛图基因生物技术有限公司 | 一种pd-1基因修饰人源化动物模型的构建方法及其应用 |
Non-Patent Citations (3)
Title |
---|
GENBANK: "Homo sapiens adenosine A2a receptor (ADORA2A), RefSeqGene on chromosome 22", 《NCBI》 * |
GENBANK: "Homo sapiens adenosine A2a receptor (ADORA2A), transcript variant 3, mRNA", 《NCBI》 * |
LEDENT C等: "Thyroid expression of an A2 adenosine receptor transgene induces thyroid hyperplasia and hyperthyroidism", 《EMBO J.》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111304246B (zh) | 一种人源化细胞因子动物模型、制备方法及应用 | |
CN111837036A (zh) | 具有人或嵌合基因的基因修饰的非人动物 | |
CN111197058A (zh) | 人源化cd73基因动物模型的制备方法及应用 | |
CN111218425B (zh) | 人源化转基因动物 | |
CN112779285B (zh) | 人源化il-10和il-10ra基因改造动物的构建方法和应用 | |
CN111793646B (zh) | Il1r1基因人源化改造的非人动物的构建方法及其应用 | |
CN114277055A (zh) | Il1b和il1a基因人源化的非人动物及其构建方法和应用 | |
CN113429486A (zh) | 基因修饰非人动物的构建方法及应用 | |
CN112725379A (zh) | 人源化cd40基因改造动物模型的构建方法及应用 | |
CN113881681B (zh) | Ccr8基因人源化非人动物及其构建方法和应用 | |
CN112501205B (zh) | Ceacam1基因人源化非人动物的构建方法及应用 | |
CN112553252B (zh) | Tnfr2基因人源化的非人动物的构建方法和应用 | |
CN112553213B (zh) | Cx3cr1基因人源化的非人动物及其构建方法和应用 | |
CN113046389B (zh) | 一种ccr2基因人源化的非人动物及其构建方法和应用 | |
CN111304247B (zh) | 人源化lag-3基因改造动物模型的制备方法及应用 | |
CN114751973A (zh) | Siglec15基因人源化非人动物的构建方法和应用 | |
CN115011606A (zh) | Cd37基因人源化非人动物的构建方法及应用 | |
CN113774086A (zh) | A2ar基因人源化非人动物及其构建方法和应用 | |
CN114134152A (zh) | Glp1r基因人源化的非人动物及其构建方法和应用 | |
CN113355355A (zh) | Il23a和/或il12b基因人源化非人动物的构建方法及应用 | |
CN112501204B (zh) | Il21r基因人源化非人动物及其构建方法和应用 | |
CN112481303B (zh) | Il15ra基因人源化非人动物及其构建方法和应用 | |
CN112501202B (zh) | Cxcr4基因人源化的非人动物及其构建方法和应用 | |
CN113388640B (zh) | Ccr4基因人源化的非人动物及其构建方法和应用 | |
CN112501203B (zh) | Il17rb基因人源化的非人动物的构建方法及应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20211210 |