CN114134152B - Glp1r基因人源化的非人动物及其构建方法和应用 - Google Patents
Glp1r基因人源化的非人动物及其构建方法和应用 Download PDFInfo
- Publication number
- CN114134152B CN114134152B CN202111094136.XA CN202111094136A CN114134152B CN 114134152 B CN114134152 B CN 114134152B CN 202111094136 A CN202111094136 A CN 202111094136A CN 114134152 B CN114134152 B CN 114134152B
- Authority
- CN
- China
- Prior art keywords
- glp1r
- human
- gene
- humanized
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 108010086246 Glucagon-Like Peptide-1 Receptor Proteins 0.000 title claims abstract description 267
- 241000282414 Homo sapiens Species 0.000 title claims abstract description 215
- 238000010276 construction Methods 0.000 title claims abstract description 37
- 102000007446 Glucagon-Like Peptide-1 Receptor Human genes 0.000 claims abstract description 125
- 101001015516 Homo sapiens Glucagon-like peptide 1 receptor Proteins 0.000 claims abstract description 124
- 239000002773 nucleotide Substances 0.000 claims abstract description 113
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 113
- 102000056448 human GLP1R Human genes 0.000 claims abstract description 59
- 230000008685 targeting Effects 0.000 claims abstract description 49
- 239000013598 vector Substances 0.000 claims abstract description 49
- 239000003814 drug Substances 0.000 claims abstract description 40
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 20
- 241001465754 Metazoa Species 0.000 claims abstract description 19
- 208000030159 metabolic disease Diseases 0.000 claims abstract description 19
- 201000010099 disease Diseases 0.000 claims abstract description 18
- 238000012216 screening Methods 0.000 claims abstract description 13
- 238000011160 research Methods 0.000 claims abstract description 7
- 208000024172 Cardiovascular disease Diseases 0.000 claims abstract description 6
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 62
- 238000000034 method Methods 0.000 claims description 57
- 108090000623 proteins and genes Proteins 0.000 claims description 52
- 210000004027 cell Anatomy 0.000 claims description 40
- 229940079593 drug Drugs 0.000 claims description 32
- 208000016097 disease of metabolism Diseases 0.000 claims description 15
- 230000014509 gene expression Effects 0.000 claims description 14
- 108020004999 messenger RNA Proteins 0.000 claims description 13
- 238000001727 in vivo Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 10
- 230000000857 drug effect Effects 0.000 claims description 8
- 238000004113 cell culture Methods 0.000 claims description 7
- 238000012239 gene modification Methods 0.000 claims description 7
- 102000008096 B7-H1 Antigen Human genes 0.000 claims description 6
- 102100039498 Cytotoxic T-lymphocyte protein 4 Human genes 0.000 claims description 6
- 101000889276 Homo sapiens Cytotoxic T-lymphocyte protein 4 Proteins 0.000 claims description 6
- 102000004388 Interleukin-4 Human genes 0.000 claims description 6
- 102000004889 Interleukin-6 Human genes 0.000 claims description 6
- 102000017578 LAG3 Human genes 0.000 claims description 6
- 230000005017 genetic modification Effects 0.000 claims description 6
- 235000013617 genetically modified food Nutrition 0.000 claims description 6
- 210000000056 organ Anatomy 0.000 claims description 6
- 230000001225 therapeutic effect Effects 0.000 claims description 6
- 108010074708 B7-H1 Antigen Proteins 0.000 claims description 5
- 101001137987 Homo sapiens Lymphocyte activation gene 3 protein Proteins 0.000 claims description 5
- 108090000978 Interleukin-4 Proteins 0.000 claims description 5
- 108090001005 Interleukin-6 Proteins 0.000 claims description 5
- 101710089372 Programmed cell death protein 1 Proteins 0.000 claims description 5
- 238000011161 development Methods 0.000 claims description 5
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 4
- 108040004564 crotonyl-CoA reductase activity proteins Proteins 0.000 claims description 4
- 230000002829 reductive effect Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 claims description 3
- 210000005260 human cell Anatomy 0.000 claims description 2
- 230000001900 immune effect Effects 0.000 claims description 2
- 230000002906 microbiologic effect Effects 0.000 claims description 2
- 230000000144 pharmacologic effect Effects 0.000 claims description 2
- 108091006146 Channels Proteins 0.000 claims 2
- 102100023990 60S ribosomal protein L17 Human genes 0.000 claims 1
- 108091036066 Three prime untranslated region Proteins 0.000 claims 1
- 230000007727 signaling mechanism Effects 0.000 claims 1
- 238000010171 animal model Methods 0.000 abstract description 7
- 230000007246 mechanism Effects 0.000 abstract description 2
- 201000011529 cardiovascular cancer Diseases 0.000 abstract 1
- 230000006801 homologous recombination Effects 0.000 abstract 1
- 238000002744 homologous recombination Methods 0.000 abstract 1
- 108700026220 vif Genes Proteins 0.000 abstract 1
- 241000699670 Mus sp. Species 0.000 description 94
- 241000699666 Mus <mouse, genus> Species 0.000 description 67
- 108020004414 DNA Proteins 0.000 description 56
- 108700024394 Exon Proteins 0.000 description 38
- 241000283984 Rodentia Species 0.000 description 33
- 238000011740 C57BL/6 mouse Methods 0.000 description 25
- 241000700159 Rattus Species 0.000 description 24
- 210000001744 T-lymphocyte Anatomy 0.000 description 24
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 22
- 206010028980 Neoplasm Diseases 0.000 description 20
- 108091027544 Subgenomic mRNA Proteins 0.000 description 20
- 239000008103 glucose Substances 0.000 description 20
- 238000003780 insertion Methods 0.000 description 20
- 230000037431 insertion Effects 0.000 description 20
- 238000006467 substitution reaction Methods 0.000 description 20
- 210000004369 blood Anatomy 0.000 description 19
- 239000008280 blood Substances 0.000 description 19
- 238000001514 detection method Methods 0.000 description 18
- 238000011816 wild-type C57Bl6 mouse Methods 0.000 description 18
- 238000012217 deletion Methods 0.000 description 17
- 230000037430 deletion Effects 0.000 description 17
- 239000012634 fragment Substances 0.000 description 17
- 210000001519 tissue Anatomy 0.000 description 17
- 108010005794 dulaglutide Proteins 0.000 description 15
- 229960005175 dulaglutide Drugs 0.000 description 14
- 101000738771 Homo sapiens Receptor-type tyrosine-protein phosphatase C Proteins 0.000 description 13
- 102100037422 Receptor-type tyrosine-protein phosphatase C Human genes 0.000 description 13
- 239000000523 sample Substances 0.000 description 13
- 238000011577 humanized mouse model Methods 0.000 description 12
- 102000035160 transmembrane proteins Human genes 0.000 description 12
- 108091005703 transmembrane proteins Proteins 0.000 description 12
- 108020004705 Codon Proteins 0.000 description 11
- 230000008488 polyadenylation Effects 0.000 description 11
- 230000006798 recombination Effects 0.000 description 11
- 238000005215 recombination Methods 0.000 description 11
- 241000282693 Cercopithecidae Species 0.000 description 10
- 241001529936 Murinae Species 0.000 description 10
- 241000283973 Oryctolagus cuniculus Species 0.000 description 10
- 238000002474 experimental method Methods 0.000 description 10
- 108091092195 Intron Proteins 0.000 description 9
- 150000001413 amino acids Chemical class 0.000 description 9
- 230000037396 body weight Effects 0.000 description 9
- 230000008859 change Effects 0.000 description 9
- 230000001086 cytosolic effect Effects 0.000 description 9
- 210000000265 leukocyte Anatomy 0.000 description 9
- 108020005345 3' Untranslated Regions Proteins 0.000 description 8
- 102000051325 Glucagon Human genes 0.000 description 8
- 108060003199 Glucagon Proteins 0.000 description 8
- DTHNMHAUYICORS-KTKZVXAJSA-N Glucagon-like peptide 1 Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC=1N=CNC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 DTHNMHAUYICORS-KTKZVXAJSA-N 0.000 description 8
- MASNOZXLGMXCHN-ZLPAWPGGSA-N glucagon Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 MASNOZXLGMXCHN-ZLPAWPGGSA-N 0.000 description 8
- 229960004666 glucagon Drugs 0.000 description 8
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 8
- 210000004072 lung Anatomy 0.000 description 8
- 239000003550 marker Substances 0.000 description 8
- 101800000224 Glucagon-like peptide 1 Proteins 0.000 description 7
- 108091028043 Nucleic acid sequence Proteins 0.000 description 7
- 102100040918 Pro-glucagon Human genes 0.000 description 7
- 108091081024 Start codon Proteins 0.000 description 7
- 230000007423 decrease Effects 0.000 description 7
- 238000003757 reverse transcription PCR Methods 0.000 description 7
- 102000053602 DNA Human genes 0.000 description 6
- 101100337057 Mus musculus Glp1r gene Proteins 0.000 description 6
- 210000003719 b-lymphocyte Anatomy 0.000 description 6
- 210000001671 embryonic stem cell Anatomy 0.000 description 6
- 230000037406 food intake Effects 0.000 description 6
- 210000001165 lymph node Anatomy 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 241000287828 Gallus gallus Species 0.000 description 5
- 229940089838 Glucagon-like peptide 1 receptor agonist Drugs 0.000 description 5
- 238000011579 SCID mouse model Methods 0.000 description 5
- 241000282887 Suidae Species 0.000 description 5
- 235000013330 chicken meat Nutrition 0.000 description 5
- 239000002299 complementary DNA Substances 0.000 description 5
- 210000005265 lung cell Anatomy 0.000 description 5
- 238000011580 nude mouse model Methods 0.000 description 5
- 210000004923 pancreatic tissue Anatomy 0.000 description 5
- 210000005259 peripheral blood Anatomy 0.000 description 5
- 239000011886 peripheral blood Substances 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 5
- 102000004169 proteins and genes Human genes 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 238000011144 upstream manufacturing Methods 0.000 description 5
- 206010015548 Euthanasia Diseases 0.000 description 4
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 4
- 102000004877 Insulin Human genes 0.000 description 4
- 108090001061 Insulin Proteins 0.000 description 4
- ZDBMWELMUCLUPL-QEJZJMRPSA-N Leu-Phe-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ZDBMWELMUCLUPL-QEJZJMRPSA-N 0.000 description 4
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 4
- 238000002105 Southern blotting Methods 0.000 description 4
- NKANXQFJJICGDU-QPLCGJKRSA-N Tamoxifen Chemical compound C=1C=CC=CC=1C(/CC)=C(C=1C=CC(OCCN(C)C)=CC=1)/C1=CC=CC=C1 NKANXQFJJICGDU-QPLCGJKRSA-N 0.000 description 4
- 125000000539 amino acid group Chemical group 0.000 description 4
- 210000000349 chromosome Anatomy 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- MHMNJMPURVTYEJ-UHFFFAOYSA-N fluorescein-5-isothiocyanate Chemical compound O1C(=O)C2=CC(N=C=S)=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 MHMNJMPURVTYEJ-UHFFFAOYSA-N 0.000 description 4
- 238000010363 gene targeting Methods 0.000 description 4
- 238000010362 genome editing Methods 0.000 description 4
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 4
- 229940125396 insulin Drugs 0.000 description 4
- 108010057821 leucylproline Proteins 0.000 description 4
- 230000002503 metabolic effect Effects 0.000 description 4
- 210000000822 natural killer cell Anatomy 0.000 description 4
- 230000003285 pharmacodynamic effect Effects 0.000 description 4
- 238000012163 sequencing technique Methods 0.000 description 4
- 210000002966 serum Anatomy 0.000 description 4
- 210000004989 spleen cell Anatomy 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 102000007469 Actins Human genes 0.000 description 3
- 108010085238 Actins Proteins 0.000 description 3
- 102100024222 B-lymphocyte antigen CD19 Human genes 0.000 description 3
- 241000283707 Capra Species 0.000 description 3
- 108010011459 Exenatide Proteins 0.000 description 3
- HTQBXNHDCUEHJF-XWLPCZSASA-N Exenatide Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(=O)NCC(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 HTQBXNHDCUEHJF-XWLPCZSASA-N 0.000 description 3
- 241000282412 Homo Species 0.000 description 3
- 101000980825 Homo sapiens B-lymphocyte antigen CD19 Proteins 0.000 description 3
- 208000008589 Obesity Diseases 0.000 description 3
- 206010039491 Sarcoma Diseases 0.000 description 3
- 210000004102 animal cell Anatomy 0.000 description 3
- 210000000227 basophil cell of anterior lobe of hypophysis Anatomy 0.000 description 3
- 238000013373 clone screening Methods 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 206010012601 diabetes mellitus Diseases 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 235000012631 food intake Nutrition 0.000 description 3
- 235000009200 high fat diet Nutrition 0.000 description 3
- 238000011532 immunohistochemical staining Methods 0.000 description 3
- 239000000411 inducer Substances 0.000 description 3
- 230000003914 insulin secretion Effects 0.000 description 3
- 206010022498 insulinoma Diseases 0.000 description 3
- 208000032839 leukemia Diseases 0.000 description 3
- 230000013011 mating Effects 0.000 description 3
- 235000020925 non fasting Nutrition 0.000 description 3
- 235000020824 obesity Nutrition 0.000 description 3
- 210000003101 oviduct Anatomy 0.000 description 3
- 208000021255 pancreatic insulinoma Diseases 0.000 description 3
- 229920001184 polypeptide Polymers 0.000 description 3
- 108090000765 processed proteins & peptides Proteins 0.000 description 3
- 102000004196 processed proteins & peptides Human genes 0.000 description 3
- 108010090894 prolylleucine Proteins 0.000 description 3
- 238000012827 research and development Methods 0.000 description 3
- 210000000952 spleen Anatomy 0.000 description 3
- 208000024891 symptom Diseases 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 2
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 2
- DUMYKLNEYCJLQK-UHFFFAOYSA-N Ala-Gln-Gln-His Chemical compound CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(=O)NC(C(O)=O)CC1=CN=CN1 DUMYKLNEYCJLQK-UHFFFAOYSA-N 0.000 description 2
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 2
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 2
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 2
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 2
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 2
- DNBMCNQKNOKOSD-DCAQKATOSA-N Arg-Pro-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O DNBMCNQKNOKOSD-DCAQKATOSA-N 0.000 description 2
- 206010003210 Arteriosclerosis Diseases 0.000 description 2
- DMLSCRJBWUEALP-LAEOZQHASA-N Asn-Glu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O DMLSCRJBWUEALP-LAEOZQHASA-N 0.000 description 2
- BEHQTVDBCLSCBY-CFMVVWHZSA-N Asn-Tyr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BEHQTVDBCLSCBY-CFMVVWHZSA-N 0.000 description 2
- QCLHLXDWRKOHRR-GUBZILKMSA-N Asp-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N QCLHLXDWRKOHRR-GUBZILKMSA-N 0.000 description 2
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 2
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 2
- 108091033409 CRISPR Proteins 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 241000699800 Cricetinae Species 0.000 description 2
- ZVNFONSZVUBRAV-CIUDSAMLSA-N Cys-Gln-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CS)N)CN=C(N)N ZVNFONSZVUBRAV-CIUDSAMLSA-N 0.000 description 2
- XAHWYEYOMSGKDA-CWRNSKLLSA-N Cys-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CS)N)C(=O)O XAHWYEYOMSGKDA-CWRNSKLLSA-N 0.000 description 2
- 101100193633 Danio rerio rag2 gene Proteins 0.000 description 2
- 102000016607 Diphtheria Toxin Human genes 0.000 description 2
- 108010053187 Diphtheria Toxin Proteins 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 2
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 2
- 102000003688 G-Protein-Coupled Receptors Human genes 0.000 description 2
- 108090000045 G-Protein-Coupled Receptors Proteins 0.000 description 2
- 241000699694 Gerbillinae Species 0.000 description 2
- LVSYIKGMLRHKME-IUCAKERBSA-N Gln-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N LVSYIKGMLRHKME-IUCAKERBSA-N 0.000 description 2
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 2
- OEIDWQHTRYEYGG-QEJZJMRPSA-N Gln-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N OEIDWQHTRYEYGG-QEJZJMRPSA-N 0.000 description 2
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 2
- PKYAVRMYTBBRLS-FXQIFTODSA-N Glu-Cys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O PKYAVRMYTBBRLS-FXQIFTODSA-N 0.000 description 2
- HNVFSTLPVJWIDV-CIUDSAMLSA-N Glu-Glu-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HNVFSTLPVJWIDV-CIUDSAMLSA-N 0.000 description 2
- DVLZZEPUNFEUBW-AVGNSLFASA-N Glu-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N DVLZZEPUNFEUBW-AVGNSLFASA-N 0.000 description 2
- GHHAMXVMWXMGSV-STQMWFEESA-N Gly-Cys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CS)NC(=O)CN)C(O)=O)=CNC2=C1 GHHAMXVMWXMGSV-STQMWFEESA-N 0.000 description 2
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 2
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 2
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 2
- PYFIQROSWQERAS-LBPRGKRZSA-N Gly-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)CN)C(=O)NCC(O)=O)=CNC2=C1 PYFIQROSWQERAS-LBPRGKRZSA-N 0.000 description 2
- UIQGJYUEQDOODF-KWQFWETISA-N Gly-Tyr-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 UIQGJYUEQDOODF-KWQFWETISA-N 0.000 description 2
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 2
- JENKOCSDMSVWPY-SRVKXCTJSA-N His-Leu-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JENKOCSDMSVWPY-SRVKXCTJSA-N 0.000 description 2
- 108091016366 Histone-lysine N-methyltransferase EHMT1 Proteins 0.000 description 2
- 208000031226 Hyperlipidaemia Diseases 0.000 description 2
- 206010020751 Hypersensitivity Diseases 0.000 description 2
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 2
- VOBYAKCXGQQFLR-LSJOCFKGSA-N Ile-Gly-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VOBYAKCXGQQFLR-LSJOCFKGSA-N 0.000 description 2
- KYLIZSDYWQQTFM-PEDHHIEDSA-N Ile-Ile-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N KYLIZSDYWQQTFM-PEDHHIEDSA-N 0.000 description 2
- RMNMUUCYTMLWNA-ZPFDUUQYSA-N Ile-Lys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RMNMUUCYTMLWNA-ZPFDUUQYSA-N 0.000 description 2
- 108010025815 Kanamycin Kinase Proteins 0.000 description 2
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 2
- OMHLATXVNQSALM-FQUUOJAGSA-N Leu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(C)C)N OMHLATXVNQSALM-FQUUOJAGSA-N 0.000 description 2
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 2
- DCGXHWINSHEPIR-SRVKXCTJSA-N Leu-Lys-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N DCGXHWINSHEPIR-SRVKXCTJSA-N 0.000 description 2
- FYPWFNKQVVEELI-ULQDDVLXSA-N Leu-Phe-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 FYPWFNKQVVEELI-ULQDDVLXSA-N 0.000 description 2
- YUTNOGOMBNYPFH-XUXIUFHCSA-N Leu-Pro-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YUTNOGOMBNYPFH-XUXIUFHCSA-N 0.000 description 2
- FPFOYSCDUWTZBF-IHPCNDPISA-N Leu-Trp-Leu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H]([NH3+])CC(C)C)C(=O)N[C@@H](CC(C)C)C([O-])=O)=CNC2=C1 FPFOYSCDUWTZBF-IHPCNDPISA-N 0.000 description 2
- SXOFUVGLPHCPRQ-KKUMJFAQSA-N Leu-Tyr-Cys Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(O)=O SXOFUVGLPHCPRQ-KKUMJFAQSA-N 0.000 description 2
- 108010019598 Liraglutide Proteins 0.000 description 2
- YSDQQAXHVYUZIW-QCIJIYAXSA-N Liraglutide Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCNC(=O)CC[C@H](NC(=O)CCCCCCCCCCCCCCC)C(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=C(O)C=C1 YSDQQAXHVYUZIW-QCIJIYAXSA-N 0.000 description 2
- XVVOERDUTLJJHN-UHFFFAOYSA-N Lixisenatide Chemical compound C=1NC2=CC=CC=C2C=1CC(C(=O)NC(CC(C)C)C(=O)NC(CCCCN)C(=O)NC(CC(N)=O)C(=O)NCC(=O)NCC(=O)N1C(CCC1)C(=O)NC(CO)C(=O)NC(CO)C(=O)NCC(=O)NC(C)C(=O)N1C(CCC1)C(=O)N1C(CCC1)C(=O)NC(CO)C(=O)NC(CCCCN)C(=O)NC(CCCCN)C(=O)NC(CCCCN)C(=O)NC(CCCCN)C(=O)NC(CCCCN)C(=O)NC(CCCCN)C(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)CC)NC(=O)C(NC(=O)C(CC(C)C)NC(=O)C(CCCNC(N)=N)NC(=O)C(NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(CCC(O)=O)NC(=O)C(CCC(O)=O)NC(=O)C(CCSC)NC(=O)C(CCC(N)=O)NC(=O)C(CCCCN)NC(=O)C(CO)NC(=O)C(CC(C)C)NC(=O)C(CC(O)=O)NC(=O)C(CO)NC(=O)C(NC(=O)C(CC=1C=CC=CC=1)NC(=O)C(NC(=O)CNC(=O)C(CCC(O)=O)NC(=O)CNC(=O)C(N)CC=1NC=NC=1)C(C)O)C(C)O)C(C)C)CC1=CC=CC=C1 XVVOERDUTLJJHN-UHFFFAOYSA-N 0.000 description 2
- 206010025323 Lymphomas Diseases 0.000 description 2
- KPJJOZUXFOLGMQ-CIUDSAMLSA-N Lys-Asp-Asn Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N KPJJOZUXFOLGMQ-CIUDSAMLSA-N 0.000 description 2
- SVJRVFPSHPGWFF-DCAQKATOSA-N Lys-Cys-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SVJRVFPSHPGWFF-DCAQKATOSA-N 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- IZLCDZDNZFEDHB-DCAQKATOSA-N Met-Cys-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N IZLCDZDNZFEDHB-DCAQKATOSA-N 0.000 description 2
- IRVONVRHHJXWTK-RWMBFGLXSA-N Met-Lys-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N IRVONVRHHJXWTK-RWMBFGLXSA-N 0.000 description 2
- YGNUDKAPJARTEM-GUBZILKMSA-N Met-Val-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O YGNUDKAPJARTEM-GUBZILKMSA-N 0.000 description 2
- 101001065556 Mus musculus Lymphocyte antigen 6G Proteins 0.000 description 2
- 101100193635 Mus musculus Rag2 gene Proteins 0.000 description 2
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 2
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 2
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 2
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 239000002033 PVDF binder Substances 0.000 description 2
- YYRCPTVAPLQRNC-ULQDDVLXSA-N Phe-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CC1=CC=CC=C1 YYRCPTVAPLQRNC-ULQDDVLXSA-N 0.000 description 2
- PSBJZLMFFTULDX-IXOXFDKPSA-N Phe-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=CC=C1)N)O PSBJZLMFFTULDX-IXOXFDKPSA-N 0.000 description 2
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 2
- MVIJMIZJPHQGEN-IHRRRGAJSA-N Phe-Ser-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@H](CO)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 MVIJMIZJPHQGEN-IHRRRGAJSA-N 0.000 description 2
- XNQMZHLAYFWSGJ-HTUGSXCWSA-N Phe-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XNQMZHLAYFWSGJ-HTUGSXCWSA-N 0.000 description 2
- GOUWCZRDTWTODO-YDHLFZDLSA-N Phe-Val-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O GOUWCZRDTWTODO-YDHLFZDLSA-N 0.000 description 2
- GNZCMRRSXOBHLC-JYJNAYRXSA-N Phe-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N GNZCMRRSXOBHLC-JYJNAYRXSA-N 0.000 description 2
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 2
- RMJZWERKFFNNNS-XGEHTFHBSA-N Pro-Thr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMJZWERKFFNNNS-XGEHTFHBSA-N 0.000 description 2
- NBDHWLZEMKSVHH-UVBJJODRSA-N Pro-Trp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@@H]3CCCN3 NBDHWLZEMKSVHH-UVBJJODRSA-N 0.000 description 2
- XNJVJEHDZPDPQL-BZSNNMDCSA-N Pro-Trp-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@H](Cc1c[nH]c2ccccc12)NC(=O)[C@@H]1CCCN1)C(O)=O XNJVJEHDZPDPQL-BZSNNMDCSA-N 0.000 description 2
- 102100040678 Programmed cell death protein 1 Human genes 0.000 description 2
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 2
- COAHUSQNSVFYBW-FXQIFTODSA-N Ser-Asn-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O COAHUSQNSVFYBW-FXQIFTODSA-N 0.000 description 2
- RFBKULCUBJAQFT-BIIVOSGPSA-N Ser-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CO)N)C(=O)O RFBKULCUBJAQFT-BIIVOSGPSA-N 0.000 description 2
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 2
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 2
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 2
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 2
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 2
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 2
- VEVYMLNYMULSMS-AVGNSLFASA-N Ser-Tyr-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VEVYMLNYMULSMS-AVGNSLFASA-N 0.000 description 2
- HNDMFDBQXYZSRM-IHRRRGAJSA-N Ser-Val-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HNDMFDBQXYZSRM-IHRRRGAJSA-N 0.000 description 2
- 241000121210 Sigmodontinae Species 0.000 description 2
- 238000010459 TALEN Methods 0.000 description 2
- JMZKMSTYXHFYAK-VEVYYDQMSA-N Thr-Arg-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O JMZKMSTYXHFYAK-VEVYYDQMSA-N 0.000 description 2
- GKMYGVQDGVYCPC-IUKAMOBKSA-N Thr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H]([C@@H](C)O)N GKMYGVQDGVYCPC-IUKAMOBKSA-N 0.000 description 2
- WPSDXXQRIVKBAY-NKIYYHGXSA-N Thr-His-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O WPSDXXQRIVKBAY-NKIYYHGXSA-N 0.000 description 2
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 2
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 2
- WYLAVUAWOUVUCA-XVSYOHENSA-N Thr-Phe-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WYLAVUAWOUVUCA-XVSYOHENSA-N 0.000 description 2
- WKGAAMOJPMBBMC-IXOXFDKPSA-N Thr-Ser-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WKGAAMOJPMBBMC-IXOXFDKPSA-N 0.000 description 2
- 208000024770 Thyroid neoplasm Diseases 0.000 description 2
- HYNAKPYFEYJMAS-XIRDDKMYSA-N Trp-Arg-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HYNAKPYFEYJMAS-XIRDDKMYSA-N 0.000 description 2
- PXYJUECTGMGIDT-WDSOQIARSA-N Trp-Arg-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 PXYJUECTGMGIDT-WDSOQIARSA-N 0.000 description 2
- PKUJMYZNJMRHEZ-XIRDDKMYSA-N Trp-Glu-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PKUJMYZNJMRHEZ-XIRDDKMYSA-N 0.000 description 2
- RZRDCZDUYHBGDT-BVSLBCMMSA-N Trp-Met-Tyr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RZRDCZDUYHBGDT-BVSLBCMMSA-N 0.000 description 2
- DVLHKUWLNKDINO-PMVMPFDFSA-N Trp-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DVLHKUWLNKDINO-PMVMPFDFSA-N 0.000 description 2
- HHFMNAVFGBYSAT-IGISWZIWSA-N Tyr-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N HHFMNAVFGBYSAT-IGISWZIWSA-N 0.000 description 2
- OLYXUGBVBGSZDN-ACRUOGEOSA-N Tyr-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 OLYXUGBVBGSZDN-ACRUOGEOSA-N 0.000 description 2
- JHDZONWZTCKTJR-KJEVXHAQSA-N Tyr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JHDZONWZTCKTJR-KJEVXHAQSA-N 0.000 description 2
- BXJQKVDPRMLGKN-PMVMPFDFSA-N Tyr-Trp-Leu Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(O)=O)C1=CC=C(O)C=C1 BXJQKVDPRMLGKN-PMVMPFDFSA-N 0.000 description 2
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 2
- ZEVNVXYRZRIRCH-GVXVVHGQSA-N Val-Gln-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N ZEVNVXYRZRIRCH-GVXVVHGQSA-N 0.000 description 2
- APEBUJBRGCMMHP-HJWJTTGWSA-N Val-Ile-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 APEBUJBRGCMMHP-HJWJTTGWSA-N 0.000 description 2
- NHXZRXLFOBFMDM-AVGNSLFASA-N Val-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C NHXZRXLFOBFMDM-AVGNSLFASA-N 0.000 description 2
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 2
- JXCOEPXCBVCTRD-JYJNAYRXSA-N Val-Tyr-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JXCOEPXCBVCTRD-JYJNAYRXSA-N 0.000 description 2
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 2
- 230000006907 apoptotic process Effects 0.000 description 2
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 2
- 108010094001 arginyl-tryptophyl-arginine Proteins 0.000 description 2
- 208000011775 arteriosclerosis disease Diseases 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 108010047857 aspartylglycine Proteins 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 210000004748 cultured cell Anatomy 0.000 description 2
- 238000012258 culturing Methods 0.000 description 2
- 108010060199 cysteinylproline Proteins 0.000 description 2
- 208000035475 disorder Diseases 0.000 description 2
- 238000001976 enzyme digestion Methods 0.000 description 2
- 201000004101 esophageal cancer Diseases 0.000 description 2
- 238000000684 flow cytometry Methods 0.000 description 2
- 230000002496 gastric effect Effects 0.000 description 2
- 230000030136 gastric emptying Effects 0.000 description 2
- 239000003877 glucagon like peptide 1 receptor agonist Substances 0.000 description 2
- 238000007446 glucose tolerance test Methods 0.000 description 2
- 108010078144 glutaminyl-glycine Proteins 0.000 description 2
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 2
- 230000002641 glycemic effect Effects 0.000 description 2
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 2
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 2
- 108010089804 glycyl-threonine Proteins 0.000 description 2
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 2
- 108010050848 glycylleucine Proteins 0.000 description 2
- 108010037850 glycylvaline Proteins 0.000 description 2
- 210000003714 granulocyte Anatomy 0.000 description 2
- 108010040030 histidinoalanine Proteins 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 2
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 2
- 108010091871 leucylmethionine Proteins 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 229960001093 lixisenatide Drugs 0.000 description 2
- 108010004367 lixisenatide Proteins 0.000 description 2
- 210000002540 macrophage Anatomy 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 108010022588 methionyl-lysyl-proline Proteins 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 210000001616 monocyte Anatomy 0.000 description 2
- 238000010172 mouse model Methods 0.000 description 2
- GNZCSGYHILBXLL-UHFFFAOYSA-N n-tert-butyl-6,7-dichloro-3-methylsulfonylquinoxalin-2-amine Chemical compound ClC1=C(Cl)C=C2N=C(S(C)(=O)=O)C(NC(C)(C)C)=NC2=C1 GNZCSGYHILBXLL-UHFFFAOYSA-N 0.000 description 2
- 239000002547 new drug Substances 0.000 description 2
- 208000008338 non-alcoholic fatty liver disease Diseases 0.000 description 2
- 150000007523 nucleic acids Chemical group 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 108010051242 phenylalanylserine Proteins 0.000 description 2
- 230000003234 polygenic effect Effects 0.000 description 2
- 229920002981 polyvinylidene fluoride Polymers 0.000 description 2
- 210000003289 regulatory T cell Anatomy 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 229960001603 tamoxifen Drugs 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 208000013076 thyroid tumor Diseases 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 108010038745 tryptophylglycine Proteins 0.000 description 2
- 108010079202 tyrosyl-alanyl-cysteine Proteins 0.000 description 2
- 108010073969 valyllysine Proteins 0.000 description 2
- NHBKXEKEPDILRR-UHFFFAOYSA-N 2,3-bis(butanoylsulfanyl)propyl butanoate Chemical compound CCCC(=O)OCC(SC(=O)CCC)CSC(=O)CCC NHBKXEKEPDILRR-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 208000031261 Acute myeloid leukaemia Diseases 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 1
- 206010002383 Angina Pectoris Diseases 0.000 description 1
- 201000003076 Angiosarcoma Diseases 0.000 description 1
- 208000031873 Animal Disease Models Diseases 0.000 description 1
- RCAUJZASOAFTAJ-FXQIFTODSA-N Arg-Asp-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)CN=C(N)N RCAUJZASOAFTAJ-FXQIFTODSA-N 0.000 description 1
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 1
- NVCIXQYNWYTLDO-IHRRRGAJSA-N Arg-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N NVCIXQYNWYTLDO-IHRRRGAJSA-N 0.000 description 1
- PZBSKYJGKNNYNK-ULQDDVLXSA-N Arg-Leu-Tyr Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCN=C(N)N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O PZBSKYJGKNNYNK-ULQDDVLXSA-N 0.000 description 1
- PHJPKNUWWHRAOC-PEFMBERDSA-N Asn-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PHJPKNUWWHRAOC-PEFMBERDSA-N 0.000 description 1
- ZJIFRAPZHAGLGR-MELADBBJSA-N Asn-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZJIFRAPZHAGLGR-MELADBBJSA-N 0.000 description 1
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 1
- POTCZYQVVNXUIG-BQBZGAKWSA-N Asp-Gly-Pro Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O POTCZYQVVNXUIG-BQBZGAKWSA-N 0.000 description 1
- PLNJUJGNLDSFOP-UWJYBYFXSA-N Asp-Tyr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PLNJUJGNLDSFOP-UWJYBYFXSA-N 0.000 description 1
- 206010003571 Astrocytoma Diseases 0.000 description 1
- 208000036170 B-Cell Marginal Zone Lymphoma Diseases 0.000 description 1
- 208000010839 B-cell chronic lymphocytic leukemia Diseases 0.000 description 1
- 208000003950 B-cell lymphoma Diseases 0.000 description 1
- 208000032791 BCR-ABL1 positive chronic myelogenous leukemia Diseases 0.000 description 1
- 235000017166 Bambusa arundinacea Nutrition 0.000 description 1
- 235000017491 Bambusa tulda Nutrition 0.000 description 1
- 206010004593 Bile duct cancer Diseases 0.000 description 1
- 206010005003 Bladder cancer Diseases 0.000 description 1
- 206010005949 Bone cancer Diseases 0.000 description 1
- 208000018084 Bone neoplasm Diseases 0.000 description 1
- 208000003174 Brain Neoplasms Diseases 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 101710149863 C-C chemokine receptor type 4 Proteins 0.000 description 1
- 238000011752 CBA/J (JAX™ mouse strain) Methods 0.000 description 1
- 102100032976 CCR4-NOT transcription complex subunit 6 Human genes 0.000 description 1
- 238000010453 CRISPR/Cas method Methods 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 206010008342 Cervix carcinoma Diseases 0.000 description 1
- 208000005243 Chondrosarcoma Diseases 0.000 description 1
- 208000010833 Chronic myeloid leukaemia Diseases 0.000 description 1
- 206010009900 Colitis ulcerative Diseases 0.000 description 1
- 206010009944 Colon cancer Diseases 0.000 description 1
- 102000008130 Cyclic AMP-Dependent Protein Kinases Human genes 0.000 description 1
- QDFBJJABJKOLTD-FXQIFTODSA-N Cys-Asn-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QDFBJJABJKOLTD-FXQIFTODSA-N 0.000 description 1
- BVFQOPGFOQVZTE-ACZMJKKPSA-N Cys-Gln-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O BVFQOPGFOQVZTE-ACZMJKKPSA-N 0.000 description 1
- HHABWQIFXZPZCK-ACZMJKKPSA-N Cys-Gln-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N HHABWQIFXZPZCK-ACZMJKKPSA-N 0.000 description 1
- YWEHYKGJWHPGPY-XGEHTFHBSA-N Cys-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CS)N)O YWEHYKGJWHPGPY-XGEHTFHBSA-N 0.000 description 1
- 238000011765 DBA/2 mouse Methods 0.000 description 1
- 201000004624 Dermatitis Diseases 0.000 description 1
- 208000001380 Diabetic Ketoacidosis Diseases 0.000 description 1
- 241001416488 Dipodidae Species 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 206010014733 Endometrial cancer Diseases 0.000 description 1
- 206010014759 Endometrial neoplasm Diseases 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 208000006168 Ewing Sarcoma Diseases 0.000 description 1
- 102100027280 Fanconi anemia group A protein Human genes 0.000 description 1
- 201000008808 Fibrosarcoma Diseases 0.000 description 1
- MWLYSLMKFXWZPW-ZPFDUUQYSA-N Gln-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCC(N)=O MWLYSLMKFXWZPW-ZPFDUUQYSA-N 0.000 description 1
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 1
- QMVCEWKHIUHTSD-GUBZILKMSA-N Gln-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N QMVCEWKHIUHTSD-GUBZILKMSA-N 0.000 description 1
- YMCPEHDGTRUOHO-SXNHZJKMSA-N Gln-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)N)N YMCPEHDGTRUOHO-SXNHZJKMSA-N 0.000 description 1
- IRDASPPCLZIERZ-XHNCKOQMSA-N Glu-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N IRDASPPCLZIERZ-XHNCKOQMSA-N 0.000 description 1
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 1
- HVKAAUOFFTUSAA-XDTLVQLUSA-N Glu-Tyr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O HVKAAUOFFTUSAA-XDTLVQLUSA-N 0.000 description 1
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 1
- TVUWMSBGMVAHSJ-KBPBESRZSA-N Gly-Leu-Phe Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TVUWMSBGMVAHSJ-KBPBESRZSA-N 0.000 description 1
- FXLVSYVJDPCIHH-STQMWFEESA-N Gly-Phe-Arg Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FXLVSYVJDPCIHH-STQMWFEESA-N 0.000 description 1
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 1
- 201000005569 Gout Diseases 0.000 description 1
- 206010019280 Heart failures Diseases 0.000 description 1
- 208000001258 Hemangiosarcoma Diseases 0.000 description 1
- 208000035186 Hemolytic Autoimmune Anemia Diseases 0.000 description 1
- 208000027761 Hepatic autoimmune disease Diseases 0.000 description 1
- 206010019668 Hepatic fibrosis Diseases 0.000 description 1
- UJWYPUUXIAKEES-CUJWVEQBSA-N His-Cys-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UJWYPUUXIAKEES-CUJWVEQBSA-N 0.000 description 1
- WJGSTIMGSIWHJX-HVTMNAMFSA-N His-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N WJGSTIMGSIWHJX-HVTMNAMFSA-N 0.000 description 1
- BPOHQCZZSFBSON-KKUMJFAQSA-N His-Leu-His Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1cnc[nH]1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O BPOHQCZZSFBSON-KKUMJFAQSA-N 0.000 description 1
- 208000017604 Hodgkin disease Diseases 0.000 description 1
- 208000021519 Hodgkin lymphoma Diseases 0.000 description 1
- 208000010747 Hodgkins lymphoma Diseases 0.000 description 1
- 101000738584 Homo sapiens C-C chemokine receptor type 4 Proteins 0.000 description 1
- 101000914673 Homo sapiens Fanconi anemia group A protein Proteins 0.000 description 1
- 101001002709 Homo sapiens Interleukin-4 Proteins 0.000 description 1
- 101001076408 Homo sapiens Interleukin-6 Proteins 0.000 description 1
- 101100510618 Homo sapiens LAG3 gene Proteins 0.000 description 1
- 101001117317 Homo sapiens Programmed cell death 1 ligand 1 Proteins 0.000 description 1
- 101000611936 Homo sapiens Programmed cell death protein 1 Proteins 0.000 description 1
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 1
- 102000003839 Human Proteins Human genes 0.000 description 1
- 108090000144 Human Proteins Proteins 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- 206010020850 Hyperthyroidism Diseases 0.000 description 1
- 208000013016 Hypoglycemia Diseases 0.000 description 1
- AKQFLPNANHNTLP-VKOGCVSHSA-N Ile-Pro-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N AKQFLPNANHNTLP-VKOGCVSHSA-N 0.000 description 1
- YHFPHRUWZMEOIX-CYDGBPFRSA-N Ile-Val-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(=O)O)N YHFPHRUWZMEOIX-CYDGBPFRSA-N 0.000 description 1
- 102100022297 Integrin alpha-X Human genes 0.000 description 1
- 208000008839 Kidney Neoplasms Diseases 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- 102220470475 L-seryl-tRNA(Sec) kinase_C57L_mutation Human genes 0.000 description 1
- 208000031671 Large B-Cell Diffuse Lymphoma Diseases 0.000 description 1
- 208000018142 Leiomyosarcoma Diseases 0.000 description 1
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 1
- UBZGNBKMIJHOHL-BZSNNMDCSA-N Leu-Leu-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 UBZGNBKMIJHOHL-BZSNNMDCSA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 208000031422 Lymphocytic Chronic B-Cell Leukemia Diseases 0.000 description 1
- 102000043136 MAP kinase family Human genes 0.000 description 1
- 108091054455 MAP kinase family Proteins 0.000 description 1
- 208000002720 Malnutrition Diseases 0.000 description 1
- 208000025205 Mantle-Cell Lymphoma Diseases 0.000 description 1
- CQRGINSEMFBACV-WPRPVWTQSA-N Met-Val-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O CQRGINSEMFBACV-WPRPVWTQSA-N 0.000 description 1
- 208000026680 Metabolic Brain disease Diseases 0.000 description 1
- 206010062190 Metabolic encephalopathy Diseases 0.000 description 1
- NTIZESTWPVYFNL-UHFFFAOYSA-N Methyl isobutyl ketone Chemical compound CC(C)CC(C)=O NTIZESTWPVYFNL-UHFFFAOYSA-N 0.000 description 1
- 208000034578 Multiple myelomas Diseases 0.000 description 1
- 241000699729 Muridae Species 0.000 description 1
- 241000699660 Mus musculus Species 0.000 description 1
- 101100120552 Mus musculus Foxp3 gene Proteins 0.000 description 1
- 241000699669 Mus saxicola Species 0.000 description 1
- 201000003793 Myelodysplastic syndrome Diseases 0.000 description 1
- 208000033761 Myelogenous Chronic BCR-ABL Positive Leukemia Diseases 0.000 description 1
- 208000033776 Myeloid Acute Leukemia Diseases 0.000 description 1
- 208000009525 Myocarditis Diseases 0.000 description 1
- 208000001894 Nasopharyngeal Neoplasms Diseases 0.000 description 1
- 206010061306 Nasopharyngeal cancer Diseases 0.000 description 1
- 208000012902 Nervous system disease Diseases 0.000 description 1
- 208000025966 Neurological disease Diseases 0.000 description 1
- 108010065395 Neuropep-1 Proteins 0.000 description 1
- 208000015914 Non-Hodgkin lymphomas Diseases 0.000 description 1
- 206010033128 Ovarian cancer Diseases 0.000 description 1
- 206010061535 Ovarian neoplasm Diseases 0.000 description 1
- 238000002944 PCR assay Methods 0.000 description 1
- 102000038030 PI3Ks Human genes 0.000 description 1
- 108091007960 PI3Ks Proteins 0.000 description 1
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 1
- 102000003992 Peroxidases Human genes 0.000 description 1
- OMHMIXFFRPMYHB-SRVKXCTJSA-N Phe-Cys-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OMHMIXFFRPMYHB-SRVKXCTJSA-N 0.000 description 1
- FXPZZKBHNOMLGA-HJWJTTGWSA-N Phe-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N FXPZZKBHNOMLGA-HJWJTTGWSA-N 0.000 description 1
- KZRQONDKKJCAOL-DKIMLUQUSA-N Phe-Leu-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZRQONDKKJCAOL-DKIMLUQUSA-N 0.000 description 1
- CMHTUJQZQXFNTQ-OEAJRASXSA-N Phe-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O CMHTUJQZQXFNTQ-OEAJRASXSA-N 0.000 description 1
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 1
- BONHGTUEEPIMPM-AVGNSLFASA-N Phe-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O BONHGTUEEPIMPM-AVGNSLFASA-N 0.000 description 1
- 244000082204 Phyllostachys viridis Species 0.000 description 1
- 235000015334 Phyllostachys viridis Nutrition 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 1
- 238000012356 Product development Methods 0.000 description 1
- 206010060862 Prostate cancer Diseases 0.000 description 1
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 1
- 208000003286 Protein-Energy Malnutrition Diseases 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 208000015634 Rectal Neoplasms Diseases 0.000 description 1
- 206010038389 Renal cancer Diseases 0.000 description 1
- 206010039710 Scleroderma Diseases 0.000 description 1
- MOVJSUIKUNCVMG-ZLUOBGJFSA-N Ser-Cys-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N)O MOVJSUIKUNCVMG-ZLUOBGJFSA-N 0.000 description 1
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 1
- AXOHAHIUJHCLQR-IHRRRGAJSA-N Ser-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CO)N AXOHAHIUJHCLQR-IHRRRGAJSA-N 0.000 description 1
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 1
- VVKVHAOOUGNDPJ-SRVKXCTJSA-N Ser-Tyr-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VVKVHAOOUGNDPJ-SRVKXCTJSA-N 0.000 description 1
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 1
- ODRUTDLAONAVDV-IHRRRGAJSA-N Ser-Val-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ODRUTDLAONAVDV-IHRRRGAJSA-N 0.000 description 1
- 108020004688 Small Nuclear RNA Proteins 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 1
- 208000021712 Soft tissue sarcoma Diseases 0.000 description 1
- 208000027520 Somatoform disease Diseases 0.000 description 1
- 208000005718 Stomach Neoplasms Diseases 0.000 description 1
- 206010042971 T-cell lymphoma Diseases 0.000 description 1
- 208000027585 T-cell non-Hodgkin lymphoma Diseases 0.000 description 1
- 208000024313 Testicular Neoplasms Diseases 0.000 description 1
- 206010057644 Testis cancer Diseases 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 1
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- SNJAPSVIPKUMCK-NWLDYVSISA-N Trp-Glu-Thr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SNJAPSVIPKUMCK-NWLDYVSISA-N 0.000 description 1
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 1
- 201000006704 Ulcerative Colitis Diseases 0.000 description 1
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 1
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 1
- MDYSKHBSPXUOPV-JSGCOSHPSA-N Val-Gly-Phe Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MDYSKHBSPXUOPV-JSGCOSHPSA-N 0.000 description 1
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 1
- PYPZMFDMCCWNST-NAKRPEOUSA-N Val-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N PYPZMFDMCCWNST-NAKRPEOUSA-N 0.000 description 1
- NSUUANXHLKKHQB-BZSNNMDCSA-N Val-Pro-Trp Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CNC2=CC=CC=C12 NSUUANXHLKKHQB-BZSNNMDCSA-N 0.000 description 1
- PGQUDQYHWICSAB-NAKRPEOUSA-N Val-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N PGQUDQYHWICSAB-NAKRPEOUSA-N 0.000 description 1
- 208000010011 Vitamin A Deficiency Diseases 0.000 description 1
- 206010047623 Vitamin C deficiency Diseases 0.000 description 1
- 206010047626 Vitamin D Deficiency Diseases 0.000 description 1
- 208000033559 Waldenström macroglobulinemia Diseases 0.000 description 1
- 210000000683 abdominal cavity Anatomy 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000001154 acute effect Effects 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 229960004733 albiglutide Drugs 0.000 description 1
- OGWAVGNOAMXIIM-UHFFFAOYSA-N albiglutide Chemical compound O=C(O)C(NC(=O)CNC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)CNC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)CNC(=O)C(NC(=O)CNC(=O)C(N)CC=1(N=CNC=1))CCC(=O)O)C(O)C)CC2(=CC=CC=C2))C(O)C)CO)CC(=O)O)C(C)C)CO)CO)CC3(=CC=C(O)C=C3))CC(C)C)CCC(=O)O)CCC(=O)N)C)C)CCCCN)CCC(=O)O)CC4(=CC=CC=C4))C(CC)C)C)CC=6(C5(=C(C=CC=C5)NC=6)))CC(C)C)C(C)C)CCCCN)CCCNC(=N)N OGWAVGNOAMXIIM-UHFFFAOYSA-N 0.000 description 1
- 208000026935 allergic disease Diseases 0.000 description 1
- 230000007815 allergy Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 102000025171 antigen binding proteins Human genes 0.000 description 1
- 108091000831 antigen binding proteins Proteins 0.000 description 1
- 206010003119 arrhythmia Diseases 0.000 description 1
- 230000006793 arrhythmia Effects 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 238000003149 assay kit Methods 0.000 description 1
- 208000006673 asthma Diseases 0.000 description 1
- 201000000448 autoimmune hemolytic anemia Diseases 0.000 description 1
- 201000003710 autoimmune thrombocytopenic purpura Diseases 0.000 description 1
- 239000011425 bamboo Substances 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 210000000941 bile Anatomy 0.000 description 1
- 208000026900 bile duct neoplasm Diseases 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 210000002459 blastocyst Anatomy 0.000 description 1
- 229940014641 bydureon Drugs 0.000 description 1
- 229940084891 byetta Drugs 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 201000010881 cervical cancer Diseases 0.000 description 1
- 208000006990 cholangiocarcinoma Diseases 0.000 description 1
- 208000032852 chronic lymphocytic leukemia Diseases 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 230000009194 climbing Effects 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- 210000001953 common bile duct Anatomy 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 208000029078 coronary artery disease Diseases 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 206010012818 diffuse large B-cell lymphoma Diseases 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- AMRJKAQTDDKMCE-UHFFFAOYSA-N dolastatin Chemical compound CC(C)C(N(C)C)C(=O)NC(C(C)C)C(=O)N(C)C(C(C)C)C(OC)CC(=O)N1CCCC1C(OC)C(C)C(=O)NC(C=1SC=CN=1)CC1=CC=CC=C1 AMRJKAQTDDKMCE-UHFFFAOYSA-N 0.000 description 1
- 229930188854 dolastatin Natural products 0.000 description 1
- 238000009509 drug development Methods 0.000 description 1
- 238000007877 drug screening Methods 0.000 description 1
- 238000002651 drug therapy Methods 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 206010014665 endocarditis Diseases 0.000 description 1
- 229960001519 exenatide Drugs 0.000 description 1
- 230000004720 fertilization Effects 0.000 description 1
- 201000003444 follicular lymphoma Diseases 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 206010017758 gastric cancer Diseases 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 238000012224 gene deletion Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 208000005017 glioblastoma Diseases 0.000 description 1
- 230000004153 glucose metabolism Effects 0.000 description 1
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 1
- 201000010536 head and neck cancer Diseases 0.000 description 1
- 208000014829 head and neck neoplasm Diseases 0.000 description 1
- 210000002216 heart Anatomy 0.000 description 1
- 210000004024 hepatic stellate cell Anatomy 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 230000013632 homeostatic process Effects 0.000 description 1
- 102000048362 human PDCD1 Human genes 0.000 description 1
- 230000003345 hyperglycaemic effect Effects 0.000 description 1
- 201000001421 hyperglycemia Diseases 0.000 description 1
- 230000002218 hypoglycaemic effect Effects 0.000 description 1
- 210000001822 immobilized cell Anatomy 0.000 description 1
- 210000002865 immune cell Anatomy 0.000 description 1
- 230000000984 immunochemical effect Effects 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 208000016245 inborn errors of metabolism Diseases 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000016507 interphase Effects 0.000 description 1
- 239000007928 intraperitoneal injection Substances 0.000 description 1
- 210000004153 islets of langerhan Anatomy 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 201000010982 kidney cancer Diseases 0.000 description 1
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 206010024627 liposarcoma Diseases 0.000 description 1
- 229960002701 liraglutide Drugs 0.000 description 1
- 238000010859 live-cell imaging Methods 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 201000007270 liver cancer Diseases 0.000 description 1
- 208000014018 liver neoplasm Diseases 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 210000001161 mammalian embryo Anatomy 0.000 description 1
- 201000007924 marginal zone B-cell lymphoma Diseases 0.000 description 1
- 208000021937 marginal zone lymphoma Diseases 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 230000007087 memory ability Effects 0.000 description 1
- 230000006993 memory improvement Effects 0.000 description 1
- 230000004066 metabolic change Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 229940126619 mouse monoclonal antibody Drugs 0.000 description 1
- 208000010125 myocardial infarction Diseases 0.000 description 1
- 201000008383 nephritis Diseases 0.000 description 1
- 210000000944 nerve tissue Anatomy 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000000324 neuroprotective effect Effects 0.000 description 1
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 238000002515 oligonucleotide synthesis Methods 0.000 description 1
- 230000000771 oncological effect Effects 0.000 description 1
- 201000008968 osteosarcoma Diseases 0.000 description 1
- 208000027753 pain disease Diseases 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 201000002528 pancreatic cancer Diseases 0.000 description 1
- 208000008443 pancreatic carcinoma Diseases 0.000 description 1
- 239000012188 paraffin wax Substances 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 208000008494 pericarditis Diseases 0.000 description 1
- 230000008855 peristalsis Effects 0.000 description 1
- 108040007629 peroxidase activity proteins Proteins 0.000 description 1
- 239000008363 phosphate buffer Substances 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 208000031223 plasma cell leukemia Diseases 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 1
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000002331 protein detection Methods 0.000 description 1
- 235000020826 protein-energy malnutrition Nutrition 0.000 description 1
- 108700027806 rGLP-1 Proteins 0.000 description 1
- 108700019620 rat Foxp3 Proteins 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 206010038038 rectal cancer Diseases 0.000 description 1
- 201000001275 rectum cancer Diseases 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 201000009410 rhabdomyosarcoma Diseases 0.000 description 1
- 206010039073 rheumatoid arthritis Diseases 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 230000036186 satiety Effects 0.000 description 1
- 235000019627 satiety Nutrition 0.000 description 1
- -1 scRNA Proteins 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 208000010233 scurvy Diseases 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 210000000813 small intestine Anatomy 0.000 description 1
- 229940126586 small molecule drug Drugs 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 230000010473 stable expression Effects 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 201000011549 stomach cancer Diseases 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 206010042863 synovial sarcoma Diseases 0.000 description 1
- 201000000596 systemic lupus erythematosus Diseases 0.000 description 1
- 238000010809 targeting technique Methods 0.000 description 1
- 201000003120 testicular cancer Diseases 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
- 229940013051 trulicity Drugs 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 description 1
- 208000001072 type 2 diabetes mellitus Diseases 0.000 description 1
- 201000005112 urinary bladder cancer Diseases 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 229940007428 victoza Drugs 0.000 description 1
- 230000004580 weight loss Effects 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P3/00—Drugs for disorders of the metabolism
- A61P3/08—Drugs for disorders of the metabolism for glucose homeostasis
- A61P3/10—Drugs for disorders of the metabolism for glucose homeostasis for hyperglycaemia, e.g. antidiabetics
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
- C07K14/72—Receptors; Cell surface antigens; Cell surface determinants for hormones
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K67/00—Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
- A01K67/027—New or modified breeds of vertebrates
- A01K67/0275—Genetically modified vertebrates, e.g. transgenic
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K67/00—Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
- A01K67/027—New or modified breeds of vertebrates
- A01K67/0275—Genetically modified vertebrates, e.g. transgenic
- A01K67/0278—Knock-in vertebrates, e.g. humanised vertebrates
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
- C07K14/72—Receptors; Cell surface antigens; Cell surface determinants for hormones
- C07K14/723—G protein coupled receptor, e.g. TSHR-thyrotropin-receptor, LH/hCG receptor, FSH receptor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/8509—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2207/00—Modified animals
- A01K2207/15—Humanized animals
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/07—Animals genetically altered by homologous recombination
- A01K2217/072—Animals genetically altered by homologous recombination maintaining or altering function, i.e. knock in
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/15—Animals comprising multiple alterations of the genome, by transgenesis or homologous recombination, e.g. obtained by cross-breeding
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2227/00—Animals characterised by species
- A01K2227/10—Mammal
- A01K2227/105—Murine
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/03—Animal model, e.g. for test or diseases
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/03—Animal model, e.g. for test or diseases
- A01K2267/035—Animal model for multifactorial diseases
- A01K2267/0362—Animal model for lipid/glucose metabolism, e.g. obesity, type-2 diabetes
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/03—Animal model, e.g. for test or diseases
- A01K2267/035—Animal model for multifactorial diseases
- A01K2267/0375—Animal model for cardiovascular diseases
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/03—Animal model, e.g. for test or diseases
- A01K2267/035—Animal model for multifactorial diseases
- A01K2267/0387—Animal model for diseases of the immune system
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Veterinary Medicine (AREA)
- Environmental Sciences (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Medicinal Chemistry (AREA)
- Animal Behavior & Ethology (AREA)
- Endocrinology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Immunology (AREA)
- Toxicology (AREA)
- Gastroenterology & Hepatology (AREA)
- Cell Biology (AREA)
- Animal Husbandry (AREA)
- Biodiversity & Conservation Biology (AREA)
- Diabetes (AREA)
- Plant Pathology (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Emergency Medicine (AREA)
- Hematology (AREA)
- Obesity (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Pharmacology & Pharmacy (AREA)
- Public Health (AREA)
Abstract
本发明提供了一种人源化GLP1R基因、靶向载体、GLP1R基因人源化的非人动物的构建方法及其在生物医药领域的应用,利用同源重组的方式将编码人GLP1R蛋白的核苷酸序列导入非人动物基因组中,该动物体内能正常表达人或人源化GLP1R蛋白,可以作为人GLP1R信号机理研究、代谢类疾病、心血管疾病、肿瘤及免疫相关疾病的药物筛选的动物模型,对免疫靶点的新药研发具有重要的应用价值。
Description
技术领域
本发明属于动物基因工程和基因遗传修饰领域,具体地说,涉及一种GLP1R基因人源化的非人动物及其构建方法和在生物医药领域的应用。
背景技术
GLP1R(Glucagon-like peptide-1 receptor,胰高血糖素样肽1受体)是B型GPCR(G protein-coupled receptor,G蛋白偶联受体)家族成员之一,广泛分布于胰岛、胃、小肠、心脏、肾脏及大脑等组织,通过与GLP-1(Glucagon-like peptide-1,胰高血糖素样肽1)结合,激活PKA、PI3K、MAPK等下游信号通路,参与胰岛素的释放、β细胞增生、胰高血糖素减少、胃排空延迟、增强记忆等重要生理过程。在胰岛细胞中,GLP1R主要发挥促进胰岛素释放、增加胰岛β细胞再生、抑制β细胞凋亡、降低胰高血糖素的释放等功能;在胃肠道组织中,可抑制胃肠道的蠕动和胃液分泌,延迟胃排空,增加饱腹感;在大脑神经组织中,则可保护神经细胞,减少其凋亡,增强学习记忆能力,以及控制食物摄取减轻体重,是国际公认的II型糖尿病的治疗靶标。目前已有多个靶向该受体的多肽药物上市,例如Exenatide(商品名Byetta/Bydureon)、Liraglutide(商品名Victoza)、Lixisenatide(商品名Lyxumia)、Albiglutide(商品名Tanzeu)、Dulaglutide(商品名Trulicity)等,它们的年销售总额超过百亿美元。此外,近年来的研究发现,GLP1R在部分肿瘤细胞中异常表达,例如胰岛素瘤、甲状腺乳头状瘤;还有研究发现,GLP1R激动剂能够显著抑制体外人肝星状细胞的活化,明显改善胆总管结扎术诱导的大鼠胆汁淤积性肝纤维化程度,可用于预防或治疗非酒精性脂肪肝病、高脂血症、动脉硬化等疾病。
实验动物疾病模型对于研究人类疾病发生的病因、发病机制、开发防治技术和开发药物是不可缺少的研究工具。但由于动物与人类的生理结构和代谢系统本身的差异,传统的动物模型并不能很好的反映人体的真实状况,在动物体内建立更接近人类的生理特征的疾病模型是生物医药行业的迫切需求。然而,由于动物与人类在生理学及病理学方面存在差异,加上基因的复杂性,如何能构建出“有效”的人源化动物模型使其接近人类的生理特征,用于新药研发仍是最大的挑战。
鉴于GLP1R在糖尿病等代谢类疾病、心血管疾病等治疗领域的巨大应用价值,为进一步探索其相关生物学特性,提高临床前期药效试验的有效性,提高研发成功率,使临床前期的试验更有效并使研发失败率最小化,本领域急需开发GLP1R及其信号通路的非人动物模型。此外,本方法得到的非人动物还可与其它基因人源化非人动物交配得到多基因人源化动物模型,用于筛选和评估针对该信号通路的人用药及联合用药的药效研究。本发明在学术和临床研究中具有广阔的应用前景。
发明内容
本发明利用基因编辑技术,用人源正常或突变基因替换动物基因组的同源基因,可建立更接近人类生理或疾病特征的正常或突变基因动物模型。通过基因人源化可改进和提升细胞或组织移植,更重要的是,由于人类基因片段的插入,动物体内可表达人或人源化蛋白,可作为仅能识别人蛋白序列的药物的靶点,为在动物水平进行抗人抗体及其它药物的筛选提供了可能。
本发明的第一方面,提供了一种人源化GLP1R基因,所述的人源化GLP1R基因包含人GLP1R基因的部分。
优选的,所述的人源化GLP1R基因包含编码人GLP1R蛋白的核苷酸序列。
优选的,所述的人源化GLP1R基因包含编码人GLP1R蛋白的跨膜区、胞质区和/或胞外区的全部或部分核苷酸序列。
在本发明的一个具体实施方式中,所述的人源化GLP1R基因包含编码人GLP1R蛋白的胞外区的全部或部分核苷酸序列。其中,所述的人GLP1R蛋白的胞外区可以包含一段连续的氨基酸序列或者包含几段连续的氨基酸序列的间隔排列。
在本发明的一个具体实施方式中,所述的人源化GLP1R基因包含编码人GLP1R蛋白的单次跨膜蛋白结构,或多次跨膜蛋白结构的全部或部分核苷酸序列。所述的多次跨膜蛋白结构包含两次、三次、四次、五次、六次或七次。所述的单次跨膜结构包含一次跨膜区、一次胞质区和一次胞外区。
在本发明的一个具体实施方式中,所述的人源化GLP1R基因包含编码上述的人源化GLP1R蛋白的核苷酸序列。
在本发明的一个具体实施方式中,所述的人源化GLP1R基因包含编码与SEQ IDNO:2具有至少60%、65%、70%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含编码与SEQ ID NO:2所示氨基酸序列一致的核苷酸序列。
优选的,所述的人源化GLP1R基因包含人GLP1R基因的部分,所述的人GLP1R基因的部分为人GLP1R基因的1号至13号外显子的全部或部分。进一步优选的,包含1号至13号外显子中的任一种、两种、三种以上、连续两种或连续三种以上外显子的组合;更进一步优选的,包含1号外显子的部分、2号至12号外显子的全部和13号外显子的部分,其中1号外显子的部分包含从起始密码子至1号外显子的最后一个核苷酸,13号外显子的部分包含从13号外显子的第一个核苷酸至终止密码子为止。
优选的,所述的人GLP1R基因的部分包含人GLP1R基因的cDNA序列。
优选的,所述的人GLP1R基因的部分包含人GLP1R基因的CDS序列。
在本发明的一个具体实施方式中,所述的人GLP1R基因的部分的核苷酸序列包含下列组中的一种:
(i)包含SEQ ID NO:5所示核苷酸序列的全部或部分;
(ii)包含与SEQ ID NO:5所示核苷酸序列的同一性至少为60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(iii)包含与SEQ ID NO:5所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或
(iv)包含与SEQ ID NO:5所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,所述的人源化GLP1R基因还包含辅助序列,所述辅助序列连接于人GLP1R基因之后。进一步优选的,所述的辅助序列选自终止密码子、翻转序列或敲除序列。更进一步优选的,所述的辅助序列为非人动物的3’UTR和/或polyA。
在本发明的一个具体实施方式中,所述的人源化GLP1R基因的核苷酸序列包含下列组中的一种:
(i)包含SEQ ID NO:6所示核苷酸序列的全部或部分;
(ii)包含与SEQ ID NO:6所示核苷酸序列的同一性至少为60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(iii)包含与SEQ ID NO:6所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或
(iv)包含与SEQ ID NO:6所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
在本发明的一个具体实施方式中,所述的人源化GLP1R基因的核苷酸序列包含下列组中的一种:
(i)包含SEQ ID NO:7所示核苷酸序列的全部或部分;
(ii)包含与SEQ ID NO:7所示核苷酸序列的同一性至少为60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(iii)包含与SEQ ID NO:7所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或
(iv)包含与SEQ ID NO:7所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,所述的人源化GLP1R基因还包含非人动物GLP1R基因。
优选的,所述的人源化GLP1R基因按照5’到3’方向顺序为非人动物1号外显子的部分、人GLP1R基因的部分、辅助序列和非人动物1号外显子的部分、2号至13号外显子的全部。
优选的,所述的非人动物可以选自啮齿类动物、猪、鸡、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物。进一步优选的,所述的非人哺乳动物为啮齿类动物。更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物。进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子。更进一步优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠。最为优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnull小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。
在本发明的一个具体实施方式中,所述的人源化GLP1R基因转录的mRNA序列包含下列组中的一种:
(i)包含SEQ ID NO:11所示核苷酸序列的全部或部分;
(ii)包含与SEQ ID NO:11所示核苷酸序列的同一性至少为60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(iii)包含与SEQ ID NO:11所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或
(iv)包含与SEQ ID NO:11所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,所述的人源化GLP1R基因还包括特异性诱导物或阻遏物。进一步优选的,所述的特异性诱导物或阻遏物可以为常规诱导或阻遏的物质。
在本发明的一个具体实施方式中,所述的特异性诱导物选自四环素系统(Tet-OffSystem/Tet-On System)或他莫昔芬系统(Tamoxifen System)。
本发明的第二方面,提供了一种靶向载体,所述的靶向载体包含人源化GLP1R基因的部分,所述人源化GLP1R基因的部分包括人GLP1R基因的部分。
优选的,所述的靶向载体包含的人GLP1R基因的部分包含人GLP1R基因的1号至13号外显子的全部或部分核苷酸序列。优选的,包含1号至13号外显子中的任一种、两种、三种以上、连续两种或连续三种以上外显子的组合。进一步优选的,包含1号外显子的部分、2号至12号外显子的全部和13号外显子的部分,其中1号外显子的部分包含从起始密码子至1号外显子的最后一个核苷酸,13号外显子的部分包含从13号外显子的第一个核苷酸至终止密码子为止。
优选的,所述的人GLP1R基因的部分包含人GLP1R基因的cDNA序列。
优选的,所述的靶向载体包含的人GLP1R基因的部分包含人GLP1R基因的CDS序列。
在本发明的一个具体实施方式中,所述的靶向载体包含的人GLP1R基因的部分核苷酸序列包含下列组中的一种:
(i)包含SEQ ID NO:5所示核苷酸序列的全部或部分;
(ii)包含与SEQ ID NO:5所示核苷酸序列的同一性至少为60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(iii)包含与SEQ ID NO:5所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或
(iv)包含与SEQ ID NO:5所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,所述的靶向载体包含的人源化GLP1R基因的部分为本发明的第一方面所述的人源化GLP1R基因的部分。
优选的,所述的靶向载体还包含辅助序列,所述辅助序列连接于人GLP1R基因之后。进一步优选的,所述的辅助序列选自终止密码子、翻转序列或敲除序列。更进一步优选的,所述的辅助序列为非人动物的3’UTR和/或polyA。
在本发明的一个具体实施方式中,所述的靶向载体的核苷酸序列包含下列组中的一种:
(i)包含SEQ ID NO:6所示核苷酸序列的全部或部分;
(ii)包含与SEQ ID NO:6所示核苷酸序列的同一性至少为60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(iii)包含与SEQ ID NO:6所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或
(iv)包含与SEQ ID NO:6所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
在本发明的一个具体实施方式中,所述的靶向载体的核苷酸序列包含下列组中的一种:
(i)包含SEQ ID NO:7所示核苷酸序列的全部或部分;
(ii)包含与SEQ ID NO:7所示核苷酸序列的同一性至少为60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(iii)包含与SEQ ID NO:7所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或
(iv)包含与SEQ ID NO:7所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
在本发明的一个具体实施方式中,所述的靶向载体的核苷酸序列包含与SEQ IDNO:10具有至少60%、65%、70%、80%、85%、90%、95%或至少99%同一性的核苷酸序列,或者包含SEQ ID NO:10所示的核苷酸序列。
优选的,所述的靶向载体还包含与待改变的转换区5’端同源的DNA片段,即5’臂,其选自非人动物GLP1R基因基因组DNA的100-10000个长度的核苷酸。进一步优选的,所述的5’臂与NCBI登录号为NC_000083.6至少具有90%同源性的核苷酸。更进一步优选的,所述5’臂序列与SEQ ID NO:3至少具有90%同源性,或者包含SEQ ID NO:3所示的核苷酸序列。和/或,所述的GLP1R基因靶向载体还包含与待改变的转换区3’端同源的DNA片段,即3’臂,其选自非人动物GLP1R基因基因组DNA的100-10000个长度的核苷酸。优选的,所述的3’臂与NCBI登录号为NC_000083.6至少具有90%同源性的核苷酸。进一步优选的,所述的3’臂序列与SEQ ID NO:4至少具有90%同源性,或者包含SEQ ID NO:4所示的核苷酸序列。
优选的,所述靶向载体的待改变的转换区位于非人动物GLP1R基因座上。进一步优选的,位于非人动物GLP1R基因的1号至13号外显子上。更进一步优选的,位于非人动物GLP1R基因的1号外显子上。
在本发明的一个具体实施方式中,位于非人动物GLP1R基因的编码信号肽的核苷酸序列之前。
优选的,所述的非人动物可以选自啮齿类动物、猪、鸡、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物。进一步优选的,所述的非人哺乳动物为啮齿类动物。更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物。进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子。更进一步优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠。最为优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnull小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。
优选的,所述的靶向载体还包含标记基因。进一步优选的,所述标记基因为负筛选标记的编码基因。更进一步优选的,所述负筛选标记的编码基因为白喉毒素A亚基的编码基因(DTA)。
在本发明的一个具体实施方式中,所述的靶向载体中还包括阳性克隆筛选的抗性基因。进一步优选的,所述阳性克隆筛选的抗性基因为新霉素磷酸转移酶编码序列Neo。
在本发明的一个具体实施方式中,所述的靶向载体中还包括特异性重组系统。进一步优选的,所述特异性重组系统为Frt重组位点(也可选择常规的LoxP重组系统)。所述的特异性重组系统为具有两个Frt重组位点,分别连接在抗性基因的两侧。
本发明的第三方面,提供了一种sgRNA,所述的sgRNA靶向非人动物GLP1R基因,同时所述sgRNA的序列在待改变的GLP1R基因上的靶序列上。
优选的,所述sgRNA的靶位点位于GLP1R基因的1号外显子至13号外显子序列上。
优选的,所述sgRNA的靶位点位于GLP1R基因的1号外显子序列上。
本发明的第四方面,提供了一种GLP1R基因人源化的非人动物,所述的非人动物体内表达人或人源化GLP1R蛋白。
优选的,所述的人源化GLP1R蛋白包含人GLP1R蛋白的全部或部分。
进一步优选的,所述的人源化GLP1R蛋白包含人GLP1R基因1号至13号外显子编码的氨基酸的全部或部分。
进一步优选的,所述的人源化GLP1R蛋白包含人GLP1R蛋白的跨膜区、胞质区和/或胞外区的全部或部分。
在本发明的一个具体实施方式中,所述的人源化GLP1R蛋白包含人GLP1R蛋白的胞外区的全部或部分。其中,所述的人GLP1R蛋白的胞外区可以包含一段连续的氨基酸序列或者包含几段连续的氨基酸序列的间隔排列。
在本发明的一个具体实施方式中,所述的人源化GLP1R蛋白包含人GLP1R蛋白的单次跨膜蛋白结构,或多次跨膜蛋白结构。所述的多次跨膜蛋白结构包含两次、三次、四次、五次、六次、七次或八次。所述的单次跨膜结构包含一次跨膜区、一次胞质区和一次胞外区。
优选的,所述的非人动物的内源GLP1R蛋白表达降低或缺失。
优选的,所述的非人动物包含人源化GLP1R基因。
优选的,所述的人源化GLP1R基因包含编码人GLP1R蛋白的跨膜区、胞质区和/或胞外区的全部或部分核苷酸序列,优选地,所述的人源化GLP1R基因包含编码胞外区至少10个连续氨基酸的核苷酸序列。
在本发明的一个具体实施方式中,所述的人源化GLP1R基因包含编码人GLP1R蛋白的胞外区的全部或部分核苷酸序列。其中,所述的人GLP1R蛋白的胞外区可以包含一段连续的氨基酸序列或者包含几段连续的氨基酸序列的间隔排列。
在本发明的一个具体实施方式中,所述的人源化GLP1R基因包含编码人GLP1R蛋白的单次跨膜蛋白结构,或多次跨膜蛋白结构的全部或部分核苷酸序列。所述的多次跨膜蛋白结构包含两次、三次、四次、五次、六次或七次。所述的单次跨膜结构包含一次跨膜区、一次胞质区和一次胞外区。
在本发明的一个具体实施方式中,所述的人源化GLP1R基因包含编码与SEQ IDNO:2具有至少60%、65%、70%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含编码与SEQ ID NO:2所示氨基酸序列一致的核苷酸序列。
优选的,所述的人源化GLP1R基因包含人GLP1R基因的部分。进一步优选的,所述的人源化GLP1R基因包含人GLP1R基因的1号至13号外显子的全部或部分。更进一步优选的,包含1号至13号外显子中的任一种、两种、三种以上、连续两种或连续三种以上外显子的组合。再进一步优选的,包含1号外显子的部分、2号至12号外显子的全部和13号外显子的部分,其中1号外显子的部分包含从起始密码子至1号外显子的最后一个核苷酸,13号外显子的部分包含从13号外显子的第一个核苷酸至终止密码子为止。
在本发明的一个具体实施方式中,所述的人源化GLP1R基因包含人GLP1R基因的cDNA序列。
在本发明的一个具体实施方式中,所述的人源化GLP1R基因包含人GLP1R基因的CDS序列。
在本发明的一个具体实施方式中,所述的人源化GLP1R基因的核苷酸序列包含下列组中的一种:
(i)包含SEQ ID NO:5所示核苷酸序列的全部或部分;
(ii)包含与SEQ ID NO:5所示核苷酸序列的同一性至少为60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(iii)包含与SEQ ID NO:5所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或
(iv)包含与SEQ ID NO:5所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,所述的人源化GLP1R基因还包含辅助序列。其中,所述辅助序列连接于人GLP1R基因之后。
优选的,所述的辅助序列选自终止密码子、翻转序列或敲除序列。进一步优选的,所述的辅助序列为非人动物的3’UTR和/或polyA。
在本发明的一个具体实施方式中,所述的人源化GLP1R基因的核苷酸序列包含下列组中的一种:
(i)包含SEQ ID NO:6所示核苷酸序列的全部或部分;
(ii)包含与SEQ ID NO:6所示核苷酸序列的同一性至少为60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(iii)包含与SEQ ID NO:6所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或
(iv)包含与SEQ ID NO:6所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
在本发明的一个具体实施方式中,所述的人源化GLP1R基因的核苷酸序列包含下列组中的一种:
(i)包含SEQ ID NO:7所示核苷酸序列的全部或部分;
(ii)包含与SEQ ID NO:7所示核苷酸序列的同一性至少为60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(iii)包含与SEQ ID NO:7所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或
(iv)包含与SEQ ID NO:7所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,所述的人源化GLP1R基因还包含非人动物GLP1R基因。
优选的,人GLP1R基因的部分或者人源化GLP1R基因的核苷酸序列可操作的连接至非人动物内源调控元件。
在本发明的一个具体实施方式中,所述的人源化GLP1R基因按照5’到3’方向顺序为非人动物1号外显子的部分、人GLP1R基因的部分、辅助序列和非人动物1号外显子的部分、2号至13号外显子的全部。
在本发明的一个具体实施方式中,所述的人源化GLP1R蛋白的氨基酸序列包含下列组中的一种:
a)所述人源化GLP1R蛋白中来源于人GLP1R蛋白的氨基酸序列包含SEQ ID NO:2所示氨基酸序列的全部或部分;
b)所述人源化GLP1R蛋白中来源于人GLP1R蛋白的氨基酸序列包含与SEQ ID NO:2所示氨基酸序列同一性至少为60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
c)所述人源化GLP1R蛋白中来源于人GLP1R蛋白的氨基酸序列包含与SEQ ID NO:2所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或
d)所述人源化GLP1R蛋白中来源于人GLP1R蛋白的氨基酸序列包含与SEQ ID NO:2所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
在本发明的一个具体实施方式中,所述的人源化GLP1R蛋白的氨基酸序列包含下列组中的一种:
a)所述人源化GLP1R蛋白中来源于非人动物GLP1R蛋白的氨基酸序列包含SEQ IDNO:1所示氨基酸序列的部分;
b)所述人源化GLP1R蛋白中来源于非人动物GLP1R蛋白的氨基酸序列包含与SEQID NO:1所示氨基酸序列同一性至少为60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
c)所述人源化GLP1R蛋白中来源于非人动物GLP1R蛋白的氨基酸序列包含与SEQID NO:1所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或
d)所述人源化GLP1R蛋白中来源于非人动物GLP1R蛋白的氨基酸序列包含与SEQID NO:1所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的非人动物可以选自啮齿类动物、猪、鸡、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物。进一步优选的,所述的非人哺乳动物为啮齿类动物。更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物。进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子。更进一步优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠。最为优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnul小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。
在本发明的一个具体实施方式中,所述的人源化GLP1R基因转录的mRNA序列包含下列组中的一种:
(i)包含SEQ ID NO:11所示核苷酸序列的全部或部分;
(ii)包含与SEQ ID NO:11所示核苷酸序列的同一性至少为60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
(iii)包含与SEQ ID NO:11所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;或
(iv)包含与SEQ ID NO:11所示的核苷酸序列所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,所述的非人动物基因组中还包含其他基因修饰,进一步优选的,所述的其他基因包含人PD-1、PD-L1、CTLA4、LAG3、IL4、IL6或CCR4基因中的一种或两种以上的组合。
本发明的第五方面,提供了一种上述的GLP1R基因人源化的非人动物的构建方法,所述的非人动物体内表达人或人源化GLP1R蛋白。优选的,所述的人源化GLP1R基因的部分为本发明的第一方面所述的人源化GLP1R基因的部分。
优选的,本申请中所述的导入包括但不限于插入、替换或转基因,所述的替换优选为原位替换。
优选的,所述的构建方法包括用包含人GLP1R基因的部分核苷酸序列导入至非人动物GLP1R基因座上。进一步优选的,用包含人GLP1R基因的1号至13号外显子的全部或部分导入至非人动物GLP1R基因座上。更进一步优选的,用包含人GLP1R基因的1号至13号外显子中的任一种、两种、三种以上、连续两种或连续三种以上外显子的组合导入至非人动物GLP1R基因座上。最为优选的,用包含人GLP1R基因的1号外显子的部分、2号至12号外显子的全部和13号外显子的部分导入至非人动物GLP1R基因座上,其中1号外显子的部分包含从起始密码子至1号外显子的最后一个核苷酸,13号外显子的部分包含从13号外显子的第一个核苷酸至终止密码子为止。
优选的,所述导入包括插入或替换。
在本发明的一个具体实施方式中,用包含与SEQ ID NO:5具有至少60%、65%、70%、80%、85%、90%、95%或至少99%同一性的核苷酸序列,或者包含SEQ ID NO:5所示的核苷酸序列插入或替换至非人动物GLP1R基因座上。
优选的,所述的构建方法包括用包含人GLP1R基因的cDNA序列插入或替换至非人动物GLP1R基因座上。
优选的,所述的构建方法包括用包含人GLP1R基因的CDS序列插入或替换至非人动物GLP1R基因座上。
优选的,所述的构建方法包括用包含编码人或人源化GLP1R蛋白的核苷酸序列插入或替换至非人动物GLP1R基因座上。进一步优选的,用包含编码与SEQ ID NO:2具有至少60%、65%、70%、80%、85%、90%、95%或至少99%同一性的核苷酸序列,或者编码包含SEQ ID NO:2所示的核苷酸序列插入或替换至非人动物GLP1R基因。
优选的,插入或替换的人GLP1R基因后还包含辅助序列,所述辅助序列连接于人GLP1R基因之后。进一步优选的,所述的辅助序列选自终止密码子、翻转序列或敲除序列。更进一步优选的,所述的辅助序列为非人动物的3’UTR和/或polyA。
优选的,所述的构建方法包括用包含人源化GLP1R基因的核苷酸序列插入或替换至非人动物GLP1R基因座上。
优选的,所述的插入或替换的位点为GLP1R基因的内源调控元件之后。进一步优选的,所述的导入的位点为1号外显子上。更进一步优选的,所述的导入的位点为编码信号肽的核苷酸序列之前。
优选的,所述的非人动物是纯合或者杂合的。
优选的,所述非人动物的基因组中至少一个染色体上包含人源化GLP1R基因。
优选的,所述的非人动物中至少一个细胞表达人或人源化GLP1R蛋白。
优选的,所述的非人动物基因组中还包含其他基因修饰,进一步优选的,所述的其他基因包含PD-1、PD-L1、CTLA4、LAG3、IL4、IL6和CCR4中的至少一种。
优选的,使用基因编辑技术进行非人动物的构建,所述的基因编辑技术包括利用胚胎干细胞的基因打靶技术、规律成簇间隔短回文重复(CRISPR/Cas9)技术、锌指核酸酶(ZFN)技术、转录激活子样效应因子核酸酶(TALEN)技术、归巢核酸内切酶(兆碱基大范围核酶)或其他分子生物学技术。
在本发明的一个具体实施方式中,使用靶向载体进行非人动物的构建,其中,所述的靶向载体包含人GLP1R基因的部分。
优选的,所述的靶向载体包含的人GLP1R基因的部分包含人GLP1R基因的1号至13号外显子的全部或部分核苷酸序列。进一步优选的,包含人GLP1R基因的1号至13号外显子中的任一种、两种、三种以上、连续两种或连续三种以上外显子的组合。更进一步优选的,包含1号外显子的部分、2号至12号外显子的全部和13号外显子的部分,其中1号外显子的部分包含从起始密码子至1号外显子的最后一个核苷酸,13号外显子的部分包含从13号外显子的第一个核苷酸至终止密码子为止。再进一步优选的,所述的靶向载体包含的人GLP1R基因的部分包含人GLP1R基因的CDS序列。更进一步优选的,包含与SEQ ID NO:5具有至少60%、65%、70%、80%、85%、90%、95%或至少99%同一性的核苷酸序列,或者包含SEQ ID NO:5所示的核苷酸序列。
优选的,所述的靶向载体还包含与待改变的转换区5’端同源的DNA片段,即5’臂,其选自非人动物GLP1R基因基因组DNA的100-10000个长度的核苷酸。进一步优选的,所述的5’臂与NCBI登录号为NC_000083.6至少具有90%同源性的核苷酸。更进一步优选的,所述5’臂序列与SEQ ID NO:3至少具有90%同源性,或者包含SEQ ID NO:3所示的核苷酸序列。和/或,所述的GLP1R基因靶向载体还包含与待改变的转换区3’端同源的DNA片段,即3’臂,其选自非人动物GLP1R基因基因组DNA的100-10000个长度的核苷酸。优选的,所述的3’臂与NCBI登录号为NC_000083.6至少具有90%同源性的核苷酸。进一步优选的,所述的3’臂序列与SEQ ID NO:4至少具有90%同源性,或者包含SEQ ID NO:4所示的核苷酸序列。
优选的,所述靶向载体的待改变的转换区位于非人动物GLP1R基因座上。进一步优选的,位于非人动物GLP1R基因的1号至13号外显子上。更进一步优选的,位于非人动物GLP1R基因的1号外显子上。
在本发明的一个具体实施方式中,位于非人动物GLP1R基因的编码信号肽的核苷酸序列之前。
在本发明的一个具体实施方式中,所述的构建方法包括将上述靶向载体导入非人动物细胞中,培养该细胞(优选为胚胎干细胞),然后将培养后的细胞移植至雌性非人动物输卵管内,允许其发育,鉴定筛选获得GLP1R基因人源化的非人动物。
优选的,为提高重组效率,还可以使用靶向GLP1R基因的sgRNA与上述靶向载体一起进行非人动物的构建。其中,所述的sgRNA靶向非人动物GLP1R基因,同时所述sgRNA的序列在待改变的GLP1R基因上的靶序列上。
优选的,所述sgRNA的靶位点位于GLP1R基因的1号外显子至13号外显子序列上。
优选的,所述sgRNA的靶位点位于GLP1R基因的1号外显子序列上。
在本发明的一个具体实施方式中,所述的构建方法包括将上述靶向载体、靶向GLP1R基因的sgRNA及Cas9导入非人动物细胞中,培养该细胞(优选为胚胎干细胞),然后将培养后的细胞移植至雌性非人动物输卵管内,允许其发育,鉴定筛选获得GLP1R基因人源化的非人动物。
优选的,所述的非人动物可以选自啮齿类动物、猪、鸡、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物。进一步优选的,所述的非人哺乳动物为啮齿类动物。更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物。进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子。更进一步优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠。最为优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnul小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。
本发明的第六方面,提供了一种人源化GLP1R蛋白,所述的人源化GLP1R蛋白包含人GLP1R蛋白的全部或部分。
优选的,所述的人源化GLP1R蛋白包含人GLP1R基因1号至13号外显子编码的氨基酸的全部或部分。
优选的,所述的人源化GLP1R蛋白包含人GLP1R蛋白的跨膜区、胞质区和/或胞外区的全部或部分。
在本发明的一个具体实施方式中,所述的人源化GLP1R蛋白包含人GLP1R蛋白的胞外区的全部或部分。其中,所述的人GLP1R蛋白的胞外区可以包含一段连续的氨基酸序列或者包含几段连续的氨基酸序列的间隔排列。
在本发明的一个具体实施方式中,所述的人源化GLP1R蛋白包含人GLP1R蛋白的单次跨膜蛋白结构,或多次跨膜蛋白结构。所述的多次跨膜蛋白结构包含两次、三次、四次、五次、六次、七次或八次。所述的单次跨膜结构包含一次跨膜区、一次胞质区和一次胞外区。
在本发明的一个具体实施方式中,所述的人源化GLP1R蛋白的氨基酸序列包含下列组中的一种:
a)所述人源化GLP1R蛋白中来源于人GLP1R蛋白的氨基酸序列包含SEQ ID NO:2所示氨基酸序列的全部或部分;
b)所述人源化GLP1R蛋白中来源于人GLP1R蛋白的氨基酸序列包含与SEQ ID NO:2所示氨基酸序列同一性至少为60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
c)所述人源化GLP1R蛋白中来源于人GLP1R蛋白的氨基酸序列包含与SEQ ID NO:2所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或
d)所述人源化GLP1R蛋白中来源于人GLP1R蛋白的氨基酸序列包含与SEQ ID NO:2所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
在本发明的一个具体实施方式中,所述的人源化GLP1R蛋白的氨基酸序列包含下列组中的一种:
a)所述人源化GLP1R蛋白中来源于非人动物GLP1R蛋白的氨基酸序列包含SEQ IDNO:1所示氨基酸序列的部分;
b)所述人源化GLP1R蛋白中来源于非人动物GLP1R蛋白的氨基酸序列包含与SEQID NO:1所示氨基酸序列同一性至少为60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
c)所述人源化GLP1R蛋白中来源于非人动物GLP1R蛋白的氨基酸序列包含与SEQID NO:1所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;或
d)所述人源化GLP1R蛋白中来源于非人动物GLP1R蛋白的氨基酸序列包含与SEQID NO:1所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
优选的,所述的非人动物可以选自啮齿类动物、猪、鸡、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物。进一步优选的,所述的非人哺乳动物为啮齿类动物。更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物。进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子。更进一步优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠。最为优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnul小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。
本发明的第七方面,提供了一种编码上述sgRNA的DNA分子。优选的,所述的DNA分子的双链为sgRNA的上下游序列,或者加入酶切位点后的正向寡核苷酸序列或反向寡核苷酸序列。
本发明的第八方面,提供了一种包含上述sgRNA或者上述DNA分子的sgRNA载体。
本发明的第九方面,提供了一种包含上述靶向载体、sgRNA、DNA分子和/或sgRNA载体的细胞。
本发明的第十方面,提供了上述靶向载体,sgRNA,DNA分子,sgRNA载体或者上述的包含靶向载体、sgRNA、DNA分子和/或sgRNA载体的细胞在GLP1R基因修饰中的应用。优选的,所述的应用包括但不限于敲除、插入或替换。
本发明的第十一方面,提供了一种多基因修饰的非人动物,所述的非人动物为上述的非人动物或上述的构建方法获得的非人动物,且所述的非人动物基因组中包含基因PD-1、PD-L1、CTLA4、LAG3、IL4、IL6或CCR4中的一种或两种以上的组合的修饰。
本发明的第十二方面,提供了一种多基因修饰的非人动物的构建方法,包括如下步骤:
(一)提供上述的非人动物或上述的构建方法获得的非人动物;
(二)将步骤(一)提供的非人动物与其他基因修饰的非人动物交配、体外受精或直接进行基因编辑,并进行筛选,得到多基因修饰的非人动物。
优选的,所述的其他基因修饰的非人动物包括基因PD-1、PD-L1、CTLA4、LAG3、IL4、IL6或CCR4中的一种或两种以上的组合人源化的非人动物。
优选的,所述的多基因修饰的非人动物为双基因人源化非人动物、三基因人源化非人动物、四基因人源化非人动物、五基因人源化非人动物、六基因人源化非人动物、七基因人源化非人动物、八基因人源化非人动物或九基因人源化非人动物。
优选的,所述的多基因修饰的非人动物的基因组中人源化的多个基因中的每一个基因均可以是纯合或杂合的。
本发明的第十三方面,提供了一种上述构建方法获得的多基因修饰的非人动物或其子代。
本发明的第十四方面,提供了一种GLP1R基因缺失的非人动物,所述的非人动物缺失GLP1R基因的全部或部分核苷酸序列。
优选的,所述的非人动物缺失GLP1R基因的1号至13号外显子的全部或部分。进一步优选的,缺失1号外显子的起始密码子开始至13号外显子终止密码子为止。
在本发明的一个具体实施方式中,采用上述sgRNA构建GLP1R基因缺失的非人动物。
本发明的第十五方面,提供了一种动物的荷瘤或代谢类疾病模型,所述的荷瘤或代谢类疾病模型来源于上述的非人动物或上述的构建方法获得的非人动物。
本发明的第十六方面,提供一种动物的荷瘤或代谢类疾病模型的构建方法,所述的构建方法包含获得上述的非人动物的步骤。
本发明的第十七方面,提供上述非人动物、上述构建方法获得的非人动物在制备动物的荷瘤或代谢类疾病模型中的应用
本发明的第十八方面,提供了一种细胞或细胞系或原代细胞培养物,所述细胞或细胞系或原代细胞培养物来源于上述的非人动物、上述的构建方法获得的非人动物或上述的荷瘤或代谢类疾病模型。
本发明的第十九方面,提供了一种组织或器官或其培养物,所述组织或器官或其培养物来源于上述的非人动物、上述的构建方法获得的非人动物或上述的荷瘤或代谢类疾病模型。
本发明的第二十方面,提供了一种荷瘤后的瘤组织,所述的瘤组织来源于上述的非人动物、上述的构建方法获得的非人动物或上述的荷瘤或代谢类疾病模型。
本发明的第二十一方面,提供了一种GLP1R基因人源化的细胞,所述的细胞表达人或人源化GLP1R蛋白;优选的,所述的细胞表达上述的人源化GLP1R蛋白。
优选的,所述的细胞的基因组中包含人GLP1R基因的部分。进一步优选的,所述的细胞包含上述的人源化GLP1R基因。
本发明的第二十二方面,提供了一种GLP1R基因缺失的细胞,所述的细胞缺失GLP1R基因的全部或部分核苷酸序列。
优选的,所述的细胞缺失GLP1R基因的1号至13号外显子的全部或部分。进一步优选的,缺失1号外显子的起始密码子开始至13号外显子终止密码子为止。
在本发明的一个具体实施方式中,采用上述sgRNA构建GLP1R基因缺失的细胞。
本发明的第二十三方面,提供了一种包含上述的人源化GLP1R基因的构建体。
本发明的第二十四方面,提供了一种包含上述构建体的细胞。
本发明的第二十五方面,提供了一种包含上述细胞的组织。
本发明的第二十六方面,提供了来源于上述的非人动物、上述的构建方法获得的非人动物、上述的人源化GLP1R蛋白、上述的人源化GLP1R基因、上述的荷瘤或代谢类疾病模型、上述的细胞或细胞系或原代细胞培养物、上述的组织或器官或其培养物、上述的荷瘤后的瘤组织、上述的细胞、上述的构建体、上述的细胞或上述的组织在需要涉及人类细胞的免疫过程的产品开发,制造抗体,或者作为药理学、免疫学、微生物学、医学研究的模型系统中的应用;或者在生产和利用动物实验疾病模型,用于开发新的诊断策略和/或治疗策略中的应用;或者在筛选、验证、评价或研究GLP1R通路功能、人GLP1R通路信号机理、靶向人的抗体、靶向人的药物、药效,免疫相关疾病药物、心血管疾病药物和代谢类疾病药物,筛选和评估人用药及药效研究方面的应用。
本发明的第二十七方面,提供了一种人GLP1R特异性调节剂的筛选方法,所述的筛选方法包括向个体施加调节剂,检测代谢参数;其中,所述的个体选自上述的非人动物、上述的构建方法获得的非人动物或者上述的荷瘤或代谢类疾病模型。
优选的,所述的调节剂选自CAR-T、药物。进一步优选的,所述的药物为抗体或小分子药物。
优选的,所述的调节剂为单抗或双特异性抗体或两种及两种以上药物的联合使用。
优选的,所述检测的方法包括游标卡尺测量、流式细胞检测和/或动物活体成像检测。
优选的,所述的检测包括评估个体体重、脂肪量、活化途径、神经保护活性或代谢变化,所述的代谢变化包括食物消耗或水消耗的变化。
优选的,所述人GLP1R特异性调节剂的筛选方法不是治疗方法。该方法用来筛选或评价药物,对候选药物的药效进行检测和比较,以确定哪些候选药物可以作为药物,哪些不能作为药物,或者,比较不同药物的药效敏感程度,即治疗效果不是必然的,只是一种可能性。
本发明的第二十八方面,提供了一种干预方案的评价方法,所述的评价方法包括向个体施加调节剂,检测代谢参数;其中,所述的个体选自上述的非人动物,上述的构建方法获得的非人动物,上述的非人动物或其子代,或者上述的荷瘤或代谢类疾病模型。
优选的,所述的干预方案选自CAR-T、药物治疗。进一步优选的,所述的药物为抗原结合蛋白。所述的抗体结合蛋白为抗体。
优选的,所述干预方案的评价方法不是治疗方法。该评价方法对干预方案的效果进行检测和评价,以确定该干预方案是否有治疗效果,即治疗效果不是必然的,只是一种可能性。
本发明的第二十九方面,提供了一种来源于上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代、上述的荷瘤或代谢类疾病模型在制备人GLP1R特异性调节剂中的用途。
本发明的第三十方面,提供了一种来源于上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代、上述的荷瘤或代谢类疾病模型在制备治疗心血管疾病、代谢类疾病和肿瘤药物或免疫相关疾病的药物中的用途。
本发明所述的GLP1R基因人源化的非人动物,其体内可正常表达人或人源化GLP1R蛋白,可用于针对人GLP1R通路靶位点的药物筛选、药效评估和免疫相关疾病和肿瘤治疗,可以加快新药研发过程、节约时间和成本。
本发明所述的“免疫相关疾病”包括但不限于过敏、哮喘、皮炎、心肌炎、肾炎、肝炎、系统性红斑狼疮、类风湿性关节炎、硬皮病、甲状腺功能亢进、原发性血小板减少性紫癜、自身免疫性溶血性贫血、溃疡性结肠炎、自身免疫性肝病、糖尿病、疼痛或神经障碍等。
本发明所述的“肿瘤”包括但不限于淋巴瘤、脑癌、非小细胞肺癌、宫颈癌、食道癌、白血病、卵巢癌、鼻咽癌、乳癌、子宫内膜癌、胰岛素瘤、结肠癌、直肠癌、胃癌、膀胱癌、肺癌、支气管癌、骨癌、前列腺癌、胰腺癌、肝和胆管癌、食管癌、肾癌、甲状腺瘤、头颈部癌、睾丸癌、胶质母细胞瘤、星形细胞瘤、黑色素瘤、骨髓增生异常综合征、以及肉瘤。其中,所述的白血病选自急性淋巴细胞性(成淋巴细胞性)白血病、急性骨髓性白血病、髓性白血病、慢性淋巴细胞性白血病、多发性骨髓瘤、浆细胞白血病、以及慢性骨髓性白血病;所述淋巴瘤选自霍奇金淋巴瘤和非霍奇金淋巴瘤,包括B细胞淋巴瘤、弥漫性大B细胞淋巴瘤、滤泡性淋巴瘤、套细胞淋巴瘤、边缘区B细胞淋巴瘤、T细胞淋巴瘤、和瓦尔登斯特伦巨球蛋白血症;所述肉瘤选自骨肉瘤、尤文肉瘤、平滑肌肉瘤、滑膜肉瘤、软组织肉瘤、血管肉瘤、脂肪肉瘤、纤维肉瘤、横纹肌肉瘤、以及软骨肉瘤。在本发明的一个具体实施方式中,所述的肿瘤为胰岛素瘤、甲状腺乳头状瘤。本发明所述的“心血管疾病”包括但不限于高血压、心绞痛、心肌梗死、冠心病、心力衰竭、心律失常、心内膜炎、心包炎、非酒精性脂肪肝病、高脂血症、动脉硬化等疾病。
本发明所述的“代谢类疾病”指因代谢问题引起的疾病,包括代谢障碍或代谢旺盛等原因引起的疾病,所述的代谢类疾病包括但不限于糖尿病、糖尿病酮症酸中毒、高血糖高渗综合征、低血糖症、痛风、蛋白质-能量营养不良症、维生素A缺乏病、坏血病或维生素D缺乏病。也可以为代谢性脑病或者先天性代谢障碍等等。
本发明所述的“小分子药物”可以为小分子靶向药物,通常分子量小于1000,一般为化学合成药物。
本发明所述的“全部或部分”,“全部”为整体,“部分”为整体中的局部,或者组成整体的个体。
本发明所述的“人源化GLP1R蛋白”,包含来源于人GLP1R蛋白的部分和非人GLP1R蛋白的部分。其中,所述的“人源化GLP1R蛋白”包含连续或间隔的5-463个氨基酸序列与人GLP1R蛋白的氨基酸序列一致。
本发明所述的“人源化GLP1R基因”,包含来源于人GLP1R基因的部分,优选还包含辅助序列,更优选还包含非人GLP1R基因的部分。其中,所述的“人源化GLP1R基因”包含连续或间隔的20-40000bp个核苷酸序列与人GLP1R基因的核苷酸序列一致,优选为连续或间隔的20-1392bp个,更优选为20、50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1392、1400、1500、1600、1700、1800、1900、2000、2500、3000、5000、10000、20000、30000或40000bp个核苷酸序列与人GLP1R基因的核苷酸序列一致。
本发明所述的“xx号至xxx号外显子”或“xx号至xxx号外显子的全部”包含外显子及其期间的内含子的核苷酸序列,例如“1号至13号外显子”或“1号至13号外显子的全部”包含外显子及其期间的内含子的核苷酸序列,即1号外显子、1-2号内含子、2号外显子、2-3号内含子、3号外显子、3-4号内含子、4号外显子、4-5号内含子、5号外显子、5-6号内含子、6号外显子、6-7号内含子、7号外显子、7-8号内含子、8号外显子、8-9号内含子、9号外显子、9-10号内含子、10号外显子、10-11号内含子、11号外显子、11-12号内含子、12号外显子、12-13号内含子和13号外显子的全部核苷酸序列。
本发明所述的“x-xx号内含子”表示x号外显子与xx号外显子之间的内含子。例如“1-2号内含子”表示1号外显子与2号外显子之间的内含子。
本发明所述的“基因座”广义上讲代表基因在染色体上所占的位置,狭义上讲代表某一基因上的一段DNA片段,即可以是一个基因也可以是一个基因的一部分。例如所述的“GLP1R基因座”表示GLP1R基因1号至13号外显子上的任选一段的DNA片段或任选两个核苷酸之间。在本发明的一个具体实施方式中,被插入或替换的GLP1R基因座可以是GLP1R基因1号至13号外显子上的任选一段的DNA片段;优选插入1号外显子上的任意两个核苷酸之间。
本发明所述的“核苷酸序列”包含天然的或经过修饰的核糖核苷酸序列、脱氧核糖核苷酸序列。优选为DNA、cDNA、pre-mRNA、mRNA、rRNA、hnRNA、miRNAs、scRNA、snRNA、siRNA、sgRNA、tRNA。
本发明所述的“三个以上”包括但不限于三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个、十三个或十四个等。
本发明所述的“连续三个以上”包括但不限于连续三个、连续四个、连续五个、连续六个、连续七个、连续八个、连续九个、连续十个、连续十一个、连续十二个、连续十三个或连续十四个等。其中“1号至13号外显子的连续三个以上”包括连续三个、连续四个、连续五个、连续六个、连续七个、连续八个、连续九个、连续十个、连续十一个、连续十二个、连续十三个或连续十四个等等外显子,还包括期间的内含子核苷酸序列。
本发明所述“治疗(treating)”(或“治疗(treat)”或“治疗(treatment)”)表示减缓、中断、阻止、控制、停止、减轻、或逆转一种体征、症状、失调、病症、或疾病的进展或严重性,但不一定涉及所有疾病相关体征、症状、病症、或失调的完全消除。术语“治疗(treating)”等是指在疾病已开始发展后改善疾病或病理状态的体征、症状等等的治疗干预。
本发明所述“同源性”,是指在使用氨基酸序列或核苷酸序列的方面,本领域技术人员在保证与已知序列相似结构或功能的前提下,可以根据实际工作需要对序列进行调整,使使用序列与现有技术获得的序列相比,具有(包括但不限于)1%,2%,3%,4%,5%,6%,7%,8%,9%,10%,11%,12%,13%,14%,15%,16%,17%,18%,19%,20%,21%,22%,23%,24%,25%,26%,27%,28%,29%,30%,31%,32%,33%,34%,35%,36%,37%,38%,39%,40%,41%,42%,43%,44%,45%,46%,47%,48%,49%,50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,70%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.1%,99.2%,99.3%,99.4%,99.5%,99.6%,99.7%,99.8%,99.9%的同一性。
本领域的技术人员能够确定并比较序列元件或同一性程度,以区分另外的小鼠和人序列。
在一个方面,所述非人动物是哺乳动物。在一个方面,所述非人动物是小型哺乳动物,例如跳鼠科。在一个实施方式中,所述基因人源化的非人动物是啮齿动物。在一个实施方式中,所述啮齿动物选自小鼠、大鼠和仓鼠。在一个实施方式中,所述啮齿动物选自鼠家族。在一个实施方式中,所述基因修饰的动物来自丽仓鼠科(例如小鼠样仓鼠)、仓鼠科(例如仓鼠、新世界大鼠和小鼠、田鼠)、鼠总科(真小鼠和大鼠、沙鼠、刺毛鼠、冠毛大鼠)、马岛鼠科(登山小鼠、岩小鼠、有尾大鼠、马达加斯加大鼠和小鼠)、刺睡鼠科(例如多刺睡鼠)和鼹形鼠科(例如摩尔大鼠、竹大鼠和鼢鼠)家族。在一个特定实施方式中,所述基因修饰的啮齿动物选自真小鼠或大鼠(鼠总科)、沙鼠、刺毛鼠和冠毛大鼠。在一个实施方式中,所述基因修饰的小鼠来自鼠科家族成员。在一个实施方式中,所述动物是啮齿动物。在一个特定实施方式中,所述啮齿动物选自小鼠和大鼠。在一个实施方式中,所述非人动物是小鼠。
在一个特定实施方式中,所述非人动物是啮齿动物,其为选自BALB/c、A、A/He、A/J、A/WySN、AKR、AKR/A、AKR/J、AKR/N、TA1、TA2、RF、SWR、C3H、C57BR、SJL、C57L、DBA/2、KM、NIH、ICR、CFW、FACA、C57BL/A、C57BL/An、C57BL/GrFa、C57BL/KaLwN、C57BL/6、C57BL/6J、C57BL/6ByJ、C57BL/6NJ、C57BL/10、C57BL/10ScSn、C57BL/10Cr和C57BL/Ola的C57BL、C58、CBA/Br、CBA/Ca、CBA/J、CBA/st、CBA/H品系的小鼠。
除非特别说明,本发明的实践将采取细胞生物学、细胞培养、分子生物学、转基因生物学、微生物学、重组DNA和免疫学的传统技术。这些技术在以下文献中进行了详细的解释。例如:Molecular Cloning A Laboratory Manual,2ndEd.,ed.By Sambrook,FritschandManiatis(Cold Spring Harbor Laboratory Press:1989);DNA Cloning,Volumes I and II(D.N.Glovered.,1985);Oligonucleotide Synthesis(M.J.Gaited.,1984);Mullisetal.U.S.Pat.No.4,683,195;Nucleic Acid Hybridization(B.D.Hames&S.J.Higginseds.1984);Transcription And Translation(B.D.Hames&S.J.Higginseds.1984);Culture Of Animal Cells(R.I.Freshney,AlanR.Liss,Inc.,1987);Immobilized Cells And Enzymes(IRL Press,1986);B.Perbal,A PracticalGuide To Molecular Cloning(1984);the series,Methods In ENZYMOLOGY(J.Abelsonand M.Simon,eds.inchief,Academic Press,Inc.,New York),specifically,Vols.154and 155(Wuetal.eds.)and Vol.185,″Gene Expression Technology″(D.Goeddel,ed.);Gene Transfer Vectors For Mammalian Cells(J.H.Miller and M.P.Caloseds.,1987,Cold Spring Harbor Laboratory);Immunochemical Methods In Cell And MolecularBiology(Mayer and Walker,eds.,Academic Press,London,1987);Handbook OfExperimental Immunology,Volumes V(D.M.Weir and C.C.Blackwell,eds.,1986);andManipulating the Mouse Embryo,(Cold Spring Harbor Laboratory Press,ColdSpring Harbor,N.Y.,1986)。
以上只是概括了本发明的一些方面,不是也不应该认为是在任何方面限制本发明。
本说明书提到的所有专利和出版物都是通过参考文献作为整体而引入本发明的。本领域的技术人员应认识到,对本发明可作某些改变并不偏离本发明的构思或范围。
下面的实施例进一步详细说明本发明,不能认为是限制本发明或本发明所说明的具体方法的范围。
附图说明
以下,结合附图来详细说明本发明的实施例,其中:
图1:小鼠GLP1R基因和人GLP1R基因座对比示意图(非按比例),其中mExon4-5为mExon4和mExon5,mExon8-11为mExon8、mExon9、mExon10和mExon11,hExon2-3为hExon2和hExon3,hExon4-5为hExon4和hExon5,hExon8-11为hExon8、hExon9、hExon10、hExon11;
图2:小鼠GLP1R基因人源化改造示意图(非按比例),其中,chiExon4-5为chiExon4和chiExon5,chiExon8-11为chiExon8、chiExon9、chiExon10,chiExon11;
图3:GLP1R基因打靶策略及靶向载体设计示意图(非按比例);
图4:GLP1R重组后细胞Southern Blot结果,其中WT为野生型对照,1-B02、1-B11、1-F08、1-G11、1-G12、1-H05、2-B01、2-C01、2-H01为克隆编号;
图5:GLP1R人源化小鼠F1代鼠尾基因型鉴定结果,其中,WT为野生型,H2O为水对照,PC为阳性对照,F1-01、F1-02为小鼠编号;
图6:C57BL/6小鼠和GLP1R基因人源化杂合子小鼠体内GLP1R RT-PCR检测结果,其中+/+为C57BL/6野生型小鼠,H/+为GLP1R基因人源化杂合子小鼠,H2O为水对照,GAPDH为甘油醛-3-磷酸脱氢酶内参;
图7:C57BL/6小鼠和GLP1R基因人源化纯合子小鼠体内GLP1R RT-PCR检测结果,其中+/+为C57BL/6野生型小鼠,H/H为GLP1R基因人源化纯合子小鼠,H2O为水对照,GAPDH为甘油醛-3-磷酸脱氢酶内参;
图8:C57BL/6小鼠和GLP1R基因人源化纯合子小鼠体内GLP1R蛋白检测结果,其中+/+为C57BL/6野生型小鼠,H/H为GLP1R基因人源化纯合子小鼠,β-actin为β-肌动蛋白内参;
图9:C57BL/6小鼠和GLP1R基因人源化纯合子小鼠胰腺组织IHC染色结果,其中+/+为C57BL/6小鼠,H/H为GLP1R基因人源化纯合子小鼠,ISO为同型对照;
图10:药效实验方案和分组及给药情况;
图11:实验过程中各组小鼠体重变化情况;
图12:实验过程中各组小鼠非空腹血糖变化情况;
图13:实验过程中各组小鼠空腹血糖变化情况;
图14:IPGTT血糖浓度变化情况;
图15:IPGTT的曲线下面积AUC;
图16:野生型C57BL/6小鼠(C57BL/6)和GLP1R基因人源化纯合子小鼠(GLP1R)脾脏中白细胞亚型百分比;
图17:野生型C57BL/6小鼠和GLP1R基因人源化纯合子小鼠脾脏中T细胞亚型百分比;
图18:野生型C57BL/6小鼠和GLP1R基因人源化纯合子小鼠淋巴结中白细胞亚型百分比;
图19:野生型C57BL/6小鼠和GLP1R基因人源化纯合子小鼠淋巴结中T细胞亚型百分比;
图20:野生型C57BL/6小鼠和GLP1R基因人源化纯合子小鼠外周血中白细胞亚型百分比;
图21:野生型C57BL/6小鼠和GLP1R基因人源化纯合子小鼠脾脏外周血中T细胞亚型百分比;
图22:药效实验方案和检测情况;
图23:实验过程中各组小鼠体重变化情况;
图24:实验过程中各组小鼠摄食量;
图25:实验过程中各组小鼠随机血糖变化情况;
图26:实验过程中各组小鼠IPGTT血糖变化情况;
图27:实验过程中各组小鼠血清中胰岛素含量;
图28:实验过程中各组小鼠血清中胰高血糖素含量;
图29:实验过程中各组小鼠血清中GLP-1含量。
具体实施方式
下面结合具体实施例来进一步描述本发明,本发明的优点和特点将会随着描述而更为清楚。但这些实施例仅是范例性的,并不对本发明的范围构成任何限制。本领域技术人员应该理解的是,在不偏离本发明的精神和范围下可以对本发明技术方案的细节和形式进行修改或替换,但这些修改和替换均落入本发明的保护范围内。
在下述每一实施例中,设备和材料是从以下所指出的几家公司获得:
SspI、BamHI、EcoRI酶购自NEB,货号分别为R0132M、R0136M、R0101M;
C57BL/6小鼠和Flp工具鼠购自中国食品药品检定研究院国家啮齿类实验动物种子中心;
BCA蛋白浓度测定试剂盒(增强型)购自碧云天,货号P0010S;
SDS-PAGE凝胶配制试剂盒购自碧云天,货号P0012A;
PVDF膜(进口分装,6.6×8.5cm,0.2μm)购自碧云天,货号FFP24;
GLP1R Polyclonal Antibody购自Abclonal,货号A13990;
β-Actin Mouse Monoclonal Antibody购自碧云天,货号AF0003;
辣根过氧化物酶标记山羊抗兔IgG(H+L)购自碧云天,货号A0208;
BeyoECL Star(特超敏ECL化学发光试剂盒)购自碧云天,货号P0018AS;
重组Anti-GLP-1R抗体[EPR23507-57]购自abcam,货号ab254352;
Goat Anti-Rabbit IgG(H+L)Biotinglated购自Vectorlab,货号BA-1000;
Zombie NIRTMFixable Viability Kit购自Biolegend,货号423106;
Brilliant Violet 510TManti-mouse CD45 Antibody购自Biolegend,货号103138;
PerCP anti-mouse Ly-6G/Ly-6C(Gr-1)Antibody购自Biolegend,货号108426;
Brilliant Violet 421TManti-mouse CD4 Antibody购自Biolegend,货号100438;
FITC anti-mouse F4/80 Antibody购自Biolegend,货号123108;
PE anti-mouse CD8a Antibody购自Biolegend,货号100708;
PE/CyTM7 Mouse anti-mouse NK1.1 Antibody购自BD Pharmingen,货号552878;
APC anti-mouse/rat Foxp3 Antibody购自eBioscience,货号17-5773-82;
FITC anti-Mouse CD19 Antibody购自Biolegend,货号115506;
PerCP/Cy5.5 anti-mouse TCRβchain Antibody购自Biolegend,货号109228;
APC Hamster Anti-Mouse TCRβChain Antibody购自BD Pharmingen,货号553174;
Brilliant Violet 605TManti-mouse CD11c Antibody购自Biolegend,货号117334;
PE anti-mouse/human CD11bAntibody购自Biolegend,货号101208。
实施例1 GLP1R基因人源化小鼠
小鼠GLP1R基因(NCBI Gene ID:14652,Primary source:MGI:99571,UniProt:O35659,位于17号染色体NC_000083.6的第30901867至30936510位,基于转录本NM_021332.2及其编码蛋白NP_067307.2(SEQ ID NO:1))和人GLP1R基因(NCBI Gene ID:2740,Primary source:HGNC:4324,UniProt ID:P43220,位于6号染色体NC_000006.12的第39048781至39091303位,基于转录本NM_002062.5及其编码蛋白NP_002053.3(SEQ ID NO:2))对比示意图如图1所示。
为了达到本发明的目的,可在小鼠内源GLP1R基因座引入编码人GLP1R蛋白的核苷酸序列,使得该小鼠表达人或人源化GLP1R蛋白。例如,可以使用基因编辑技术,在小鼠1号外显子插入编码人GLP1R蛋白的核苷酸序列。为了使人GLP1R蛋白在小鼠体内更稳定的表达,在人GLP1R核苷酸序列后插入小鼠3’UTR序列和polyA(多聚腺苷酸)。最终得到的改造后的人源化小鼠GLP1R基因座示意图如图2所示。
进一步设计了如图3所示的打靶策略,图中显示了靶向载体上含有小鼠GLP1R基因上游和下游的同源臂序列,以及包含人GLP1R序列、小鼠3’UTR序列、polyA和Neo盒的A片段。其中,上述上游同源臂序列(5’同源臂,SEQ ID NO:3)与NCBI登录号为NC_000083.6的第30897870至30901876位核苷酸序列相同,下游同源臂序列(3’同源臂,SEQ ID NO:4)与NCBI登录号为NC_000083.6的第30901880至30906647位核苷酸序列相同;人GLP1R序列(SEQ IDNO:5)与NCBI登录号为NM_002062.5的第61至1452位核苷酸序列相同;小鼠3’UTR如SEQ IDNO:6所示,polyA序列如SEQ ID NO:7所示。A片段上还包括用于阳性克隆筛选的抗性基因,即新霉素磷酸转移酶编码序列Neo,并在抗性基因的两侧装上两个同向排列的位点特异性重组系统Frt重组位点,组成Neo盒(Neo cassette)。其中,人GLP1R序列、小鼠3’UTR序列、polyA和Neo盒按5’到3’方向顺序排列,人GLP1R序列上游和小鼠5’同源臂序列直接相连;Neo盒上游与polyA序列的连接设计为
5’-GACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGGAATTCCGAAGTTCCTATTCTCTAGAAAGTATAGGAACTT-3’(SEQ ID NO:8),其中序列“TATGG”中最后一个“G”是polyA序列的最后一个核苷酸,序列“GAATT”中的“G”是Neo盒的第一个核苷酸;Neo盒下游与小鼠3’同源臂的连接设计为:
5’-ATAGGAACTTCATCAGTCAGGTACATAATTAGGTGGATCCgccagcaccccaagcctcctgcgcctggcgctcctgctgc-3’(SEQ ID NO:9),其中序列“GATCC”中最后一个“C”是Neo盒的最后一个核苷酸,序列“gccag”中第一个“g”是小鼠的第一个核苷酸。A片段的序列如SEQ ID NO:10所示。
此外,还在靶向载体3’同源臂下游构建了具有负筛选标记的编码基因(白喉毒素A亚基的编码基因(DTA))。改造后的人源化小鼠GLP1R的mRNA序列如SEQ ID NO:11所示。
靶向载体构建可采用常规方法进行,如酶切连接等。小鼠基因序列来自细菌人工染色体(BAC)克隆RP23-26M14,人GLP1R序列为直接合成。构建好的靶向载体通过酶切进行初步验证后,再送测序公司进行测序验证。将测序验证正确的靶向载体电穿孔转染入C57BL/6小鼠的胚胎干细胞中,利用阳性克隆筛选标记基因对得到的细胞进行筛选,并利用PCR和Southern Blot技术进行检测确认外源基因的整合情况,筛选出正确的阳性克隆细胞,经PCR鉴定为阳性的克隆再进行Southern Blot(分别用SspI或BamHI或EcoRI消化细胞DNA并使用3个探针进行杂交,探针及目的片段长度如表1所示)检测,结果如图4所示,检测结果表明9个经PCR验证为阳性的克隆均无随机插入,经测序进一步验证这9个克隆均为阳性克隆且无随机插入,具体编号为1-B02、1-B11、1-F08、1-G11、1-G12、1-H05、2-B01、2-C01、2-H01。
表1:具体探针及目的片段长度
限制性内切酶 | 探针 | 野生型片段大小 | 重组序列片段大小 |
SspI | 5’Probe | 19.4kb | 9.8kb |
BamHI | 3’Probe | 9.5kb | 6.1kb |
EcoRI | Neo Probe | — | 10.9kb |
其中,PCR测定包括下述引物:
F1:5’-CACATTCAGAGTGAGTCTTGTCATC-3’(SEQ ID NO:12),
R1:5’-CATTTCTGCACCGTCTCCCAGAGG-3’(SEQ ID NO:13);
F2:5’-CAGGACATAGCGTTGGCTAC-3’(SEQ ID NO:14),
R2:5’-CCAGAGCCCCGGAGTCTTA-3’(SEQ ID NO:15);
Southern Blot检测包括如下探针引物:
5’探针(5’Probe):
5’Probe-F:5’-TCTCTCTCCTTAGGGAGTCATCCTT-3’(SEQ ID NO:16),
5’Probe-R:5’-ATGGTCTATGCTCACAGATCCAATC-3’(SEQ ID NO:17);
3’探针(3’Probe):
3’Probe-F:5’-AGGCTAGCTAAAGGGAGCACTCAGA-3’(SEQ ID NO:18),
3’Probe-R:5’-GTTGCAGGATGTGGTCTCACAGAGG-3’(SEQ ID NO:19);
Neo探针(Neo Probe):
Neo Probe-F:5’-GGATCGGCCATTGAACAAGA-3’(SEQ ID NO:20),
Neo Probe-R:5’-CAGAAGAACTCGTCAAGAAG-3’(SEQ ID NO:21)。
将筛选出的正确阳性克隆细胞(黑色鼠)按照本领域已知的技术导入已分离好的囊胚中(白色鼠),得到的嵌合囊胚转移至培养液中短暂培养后移植至受体母鼠(白色鼠)的输卵管,可生产F0代嵌合体鼠(黑白相间)。将F0代嵌合鼠与野生型鼠回交获得F1代鼠,再将F1代杂合小鼠互相交配即可获得F2代纯合子鼠。还可将阳性鼠与Flp工具鼠交配去除阳性克隆筛选标记基因后,再通过互相交配即可得到人源化GLP1R基因纯合子小鼠。可通过PCR鉴定子代小鼠体细胞的基因型(引物如表2所示),示例性的F1代小鼠(已去除Neo标记基因)的鉴定结果见图5,其中,编号为F1-01、F1-02的2只小鼠均为阳性杂合小鼠。这表明使用本方法能构建出可稳定传代且无随机插入的人源化GLP1R基因工程小鼠。
表2:引物名称及具体序列
可通过RT-PCR方法检测GLP1R基因人源化小鼠体内人GLP1RmRNA的表达情况。具体来说,分别选取8周龄野生型C57BL/6小鼠和本方法制备的GLP1R基因人源化杂合子小鼠各1只,脱颈安乐死后取肺部组织,设计如表3所示引物序列对C57BL/6小鼠和GLP1R基因人源化杂合子小鼠肺部细胞的mRNA表达情况进行检测。结果显示,在C57BL/6小鼠肺部细胞中仅检测到鼠GLP1R mRNA的表达(图6A);在GLP1R基因人源化杂合子小鼠肺部细胞中既检测到人GLP1R mRNA的表达(图6A),也检测到鼠GLP1R mRNA的表达(图6B)。
表3 RT-PCR检测引物序列及目的片段长度
同样采用RT-PCR方法检测GLP1R基因人源化纯合子小鼠肺部GLP1R mRNA的表达情况,所用引物序列如表4所示,检测结果(如图7所示)显示,在C57BL/6野生型小鼠肺部细胞中仅检测到鼠GLP1R mRNA的表达(图7A);在GLP1R基因人源化纯合子小鼠肺部细胞中仅检测到人GLP1R mRNA的表达(图7B)。
表4 GLP1R基因人源化纯合子小鼠RT-PCR检测引物序列及目的片段长度
进一步通过Western Blot方法检测野生型C57BL/6小鼠和本方法制备的GLP1R基因人源化纯合子小鼠肺部组织中人GLP1R蛋白的表达。具体来说,分别选取8周龄野生型C57BL/6小鼠和GLP1R基因人源化纯合子小鼠各1只,脱颈安乐死后取肺部组织进行SDS-PAGE电泳并转移至PVDF膜,与一抗人鼠GLP1R交叉识别抗体GLP1R Polyclonal Antibody(Abclonal)和二抗辣根过氧化物酶标记山羊抗兔IgG(H+L)(碧云天)孵育后,经BeyoECLStar试剂盒显色检测GLP1R蛋白,结果如图8所示。从图中可以看出,在野生型C57BL/6小鼠和GLP1R基因人源化纯合子小鼠肺部组织中均检测到GLP1R蛋白的表达。结合图7的RT-PCR检测结果可知,GLP1R基因人源化纯合子小鼠肺部组织中检测到的蛋白为人GLP1R蛋白。证明本方法制备的GLP1R基因人源化小鼠体内可成功表达人GLP1R蛋白。
此外,通过免疫组化染色IHC检测GLP1R基因人源化纯合子小鼠胰腺组织中人GLP1R蛋白的表达情况。选取8周龄雌性野生型C57BL/6小鼠和GLP1R基因人源化纯合子小鼠,安乐死后取胰腺组织,福尔马林固定、石蜡包埋切片后分别使用特异性抗人GLP1R抗体(重组Anti-GLP-1R抗体,ab254352)或ISO对照抗体IgG进行IHC染色检测,观察组织病理学变化,结果如图9所示。从图中可以看出,在GLP1R基因人源化纯合子小鼠胰腺组织中观察到典型的细胞膜、胞质黄褐色着色(图9G、图9H、图9I),在ISO对照组(图9A、图9B、图9C)和野生型C57BL/6小鼠(图9D、图9E、图9F)胰腺组织中并未检测到该特征。表明GLP1R基因人源化纯合子小鼠体内可成功表达人GLP1R蛋白。
进一步采用流式细胞术对野生型C57BL/6小鼠和GLP1R基因人源化纯合子小鼠体内免疫细胞亚型进行分析。选取9周龄野生型C57BL/6小鼠和GLP1R基因人源化纯合子小鼠各3只,取脾脏细胞、淋巴结和外周血,用抗鼠CD45抗体Brilliant Violet 510TManti-mouseCD45(CD45)、抗鼠Gr-1抗体PerCP anti-mouse Ly-6G/Ly-6C(Gr-1)Antibody(Gr-1)、抗鼠CD4抗体Brilliant Violet 421TManti-mouse CD4 Antibody(CD4)、抗鼠F4/80抗体FITCanti-mouse F4/80 Antibody、抗鼠CD8a抗体PE anti-mouse CD8a Antibody、抗鼠NK1.1抗体PE/CyTM7 Mouse anti-mouseNK1.1 Antibody(NK1.1)、抗鼠Foxp3抗体APC anti-mouse/rat Foxp3 Antibody(Foxp3)、抗鼠CD19抗体FITC anti-Mouse CD19 Antibody(CD19)、抗鼠TCRβ抗体PerCP/Cy5.5anti-mouse TCR βchain Antibody(TCRβ)、抗鼠CD11c抗体Brilliant Violet 605TManti-mouse CD11c Antibody(CD11c)和抗鼠CD11b抗体PE anti-mouse/human CD11b Antibody(CD11b)进行染色,将染色后的细胞进行流式检测。
脾细胞中白细胞亚型和T细胞亚型检测结果分别如图16和图17所示,淋巴结中白细胞亚型和T细胞亚型检测结果分别如图18和图19所示,外周血中白细胞亚型和T细胞亚型检测结果分别如图20和图21所示,从图中可以看出,GLP1R基因人源化纯合子小鼠脾脏和外周血中B细胞(B Cells,特征为CD45+CD19+)、T细胞(T cells,特征为CD45+TCRβ+)、NK细胞(NK cell,特征为CD45+TCRβ-NK1.1+)、CD4+T细胞(CD4+Tcells,特征为CD45+CD4+)、CD8+T细胞(CD8+Tcells,特征为CD45+CD8+)、粒细胞(Granulocyte,特征为CD45+Gr-1+)、DC细胞(Dendritic cells,特征为CD45+TCRβ-CD11c+)、巨噬细胞(Macrophages,特征为CD45+Gr-1-CD11b+F4/8+)和单核细胞(Monocytes,特征为CD45+Gr-1-CD11b+F4/8-)等白细胞亚型与C57BL/6野生型小鼠基本一致(图16和图20),CD4+T细胞、CD8+T细胞和Treg细胞等T细胞亚型百分比与C57BL/6野生型小鼠基本一致(图17和图21);淋巴结中B细胞(B cells)、T细胞(Tcells)、NK细胞(NK cell)、CD4+T细胞(CD4+T cells)和CD8+T细胞(CD8+T cells)等白细胞亚型与C57BL/6野生型小鼠基本一致(图18),CD4+T细胞(CD4+T cells)、CD8+T细胞(CD8+Tcells)和Treg细胞(Tregs)T细胞亚型百分比与C57BL/6野生型小鼠基本一致(图19),表明GLP1R基因的人源化改造没有影响小鼠脾细胞、淋巴结和外周血中白细胞的分化、发育和分布。
实施例2 GLP1R基因人源化小鼠体内药效实验
分别选取7周龄雄性野生型C57BL/6小鼠(WT)和GLP1R基因人源化纯合子小鼠(H/H)各10只,按照体重随机分为对照组(G1、G3)和给药组(G2、G4),对照组皮下注射(s.c.)磷酸盐缓冲液PBS,给药组皮下注射10mg/kg GLP1R激动剂Dulaglutide,每两天给药一次,共给药5次,每次给药前测定小鼠体重和非空腹血糖浓度。第二次给药和第四次给药后,小鼠禁食过夜,通过腹腔注射葡萄糖耐量试验(IPGTT)评估小鼠对葡萄糖的耐受力,具体为:腹腔注射2g/kg葡萄糖D-Glucose,注射后15min、30min、60min、120min时间点分别采血测定血糖值,并计算曲线下面积(AUC)。具体药效实验方案和分组及给药情况分别如图10和表5所示。
表5药效实验分组及给药情况
实验过程中各组小鼠体重(如图11所示)保持平稳状态,未发生显著变化;与PBS对照组(G1、G3)相比,Dulaglutide给药均降低了野生型C57BL/6小鼠和GLP1R基因人源化纯合子小鼠的非空腹血糖(图12)和空腹血糖(图13);图14为IPGTT血糖浓度变化情况,从中可以看出,在给与葡萄糖负荷后,各组小鼠的血糖在15min内达到高峰,随后开始下降,GLP1R基因人源化纯合子小鼠体内的葡萄糖代谢表现出与野生型C57BL/6小鼠相似的葡萄糖耐受力;Dulaglutide给药组小鼠的AUC相较于PBS对照组均呈现出显著下降趋势(P≤0.05)(图15)。实验数据显示,GLP1R基因人源化纯合子小鼠具有与野生型C57BL/6小鼠相似的血糖调节能力,以保持体内血糖稳态。
实施例3体内药效验证
利用本方法制得的GLP1R人源化小鼠可以用于评估靶向人GLP1R的调节剂的药效,本实施例中采用杜拉鲁肽(Dulaglutide)为阳性药,该药(序列参考专利WO2009009562A2)是礼来公司研发的一款胰高血糖素样肽-1(GLP-1)受体激动剂,对人GLP1R和鼠GLP1R均具有亲和性。
分别选取7周龄雄性野生型C57BL/6小鼠(WT)和GLP1R基因人源化纯合子小鼠(H/H)各20只,对所有小鼠进行高脂饮食12周,诱导肥胖和高血糖模型。
1、实验方法
于第13周,按表5进行随机分组给药,分组当天记为D0,第二天记为D1,以此类推,进行计算。实验方案如图22所示,单只小鼠体重下降超过20%时执行安乐死结束实验。具体的给药、剂量、给药方式和频率如表5所示,实验组皮下注射(sc)给予1mg/kg Dulaglutide,对照组给相同剂量同型对照PBS,每两天给药1次,连续给药10天,共给药5次。检测方案如下:每次给药前测定随机血糖(RBG)浓度和体重;第二次给药后,禁食处理,第二天进行糖耐受实验(OGTT)(方案:小鼠测完禁食血糖后,腹腔注射2g/kg D-葡萄糖,在注射后15min、30min、60min和120min时间点测定血糖值,葡萄糖溶液配置方法为20%质量分数,给药剂量10ul/g体重,溶剂为生理盐水);第四次给药后,小鼠进行禁食处理,第二天测禁食血糖;最后一次给药后48小时内眦采血,离心获得上清后,ELISA测定血清中胰高血糖素和胰岛素含量。
表6给药、剂量、给药方式和频率
组别 | 动物信息 | 受试品 | 动物数量 | 剂量(mg/kg) | 给药方式 | 给药频率及次数 |
G1 | C57BL/6 | PBS | 10 | NA | s.c. | Q2d*5 |
G2 | C57BL/6 | Dulaglutide | 10 | 1 | s.c. | Q2d*5 |
G3 | GLP1R | PBS | 10 | NA | s.c. | Q2d*5 |
G4 | GLP1R | Dulaglutide | 10 | 1 | s.c. | Q2d*5 |
2、实验结果
对GLP1R人源化小鼠进行高脂饮食诱导肥胖模型,在实验过程中,小鼠体重普遍出现下降,在实验后期有小幅波动,其中给药组小鼠体重下降更明显(图23),对其第一次给药前24小时(图24A)和第一次给药后24小时(图24B)摄食量进行分析,发现第一次给药前24小时给药组小鼠24小时摄食量与对照组无显著差异,而第一次给药后24小时给药组小鼠摄食量显著低于对照组,推测给予Dulaglutide为造成小鼠摄食量降低,小鼠体重的降低。同时对血糖进行检测,发现Dulaglutide处理以后小鼠血糖明显降低(图25)。在糖耐受检测中,Dulaglutide能够显著改善肥胖模型小鼠的糖耐受能力(图26)。在第一次给药后第十天(Day10)对其胰岛素、胰高血糖素和胰高血糖素样肽-1水平进行分析,发现在15min时间点,给药组胰岛素水平与对照组相比有升高趋势(图27),在给药后24小时时间点,对小鼠血浆中胰高血糖素和胰高血糖素样肽-1的含量进行测定,发现Dulaglutide处理以后,小鼠血浆中胰高血糖素含量下降,并且G4组下降更明显(图28),而胰高血糖素样肽-1的含量明显升高(图29)。
以上结果说明,本发明实施例的GLP1R人源化小鼠用高脂饮食诱导肥胖模型,对GLP-1受体激动剂Dulaglutide表现出良好的药效响应,包括:例如体重下降,摄食量的减少;在血糖控制方面,能够降低血糖,改善糖耐受能力,同时刺激胰岛素的分泌,抑制胰高血糖素分泌。说明GLP-1受体激动剂Dulaglutide能与小鼠体内的人GLP1R蛋白结合,并激活GLP1R所在信号通路。实验结果表明,本发明实施例对小鼠GLP1R基因的人源化改造不影响GLP1R基因所在信号通路,该小鼠能够用于GLP-1类似物药物的药效评价。
实施例4:双重人源化或多重双人源化小鼠的制备
利用本方法或制得的GLP1R小鼠还可以制备双人源化或多人源化小鼠模型。如,前述实施例1中,囊胚显微注射使用的胚胎干细胞可选择来源于含有PD-1、PD-L1、CTLA4、LAG3、IL4、IL6或CCR4等其它基因修饰的小鼠,或者,也可在人源化GLP1R小鼠的基础上,利用分离小鼠ES胚胎干细胞和基因重组打靶技术,获得GLP1R与其它基因修饰的双基因或多基因修饰的小鼠模型。也可将本方法得到的GLP1R小鼠纯合子或杂合子与其它基因修饰的纯合或杂合小鼠交配,对其后代进行筛选,根据孟德尔遗传规律,可有一定机率得到人源化GLP1R与其它基因修饰的双基因或多基因修饰的杂合小鼠,再将杂合子相互交配可以得到双基因或多基因修饰的纯合子,利用这些双基因或多基因修饰的小鼠可以进行靶向人GLP1R和其它基因调节剂的体内药效验证等。
以上详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。
此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。
序列表
<110> 百奥赛图(北京)医药科技股份有限公司
<120> GLP1R基因人源化的非人动物及其构建方法和应用
<130> 1
<150> CN202010979260.3
<151> 2020-09-17
<150> CN202110714328.X
<151> 2021-06-25
<160> 38
<170> SIPOSequenceListing 1.0
<210> 1
<211> 463
<212> PRT
<213> Mus musculus
<400> 1
Met Ala Ser Thr Pro Ser Leu Leu Arg Leu Ala Leu Leu Leu Leu Gly
1 5 10 15
Ala Val Gly Arg Ala Gly Pro Arg Pro Gln Gly Thr Thr Val Ser Leu
20 25 30
Ser Glu Thr Val Gln Lys Trp Arg Glu Tyr Arg Arg Gln Cys Gln Arg
35 40 45
Phe Leu Thr Glu Ala Pro Leu Leu Ala Thr Gly Leu Phe Cys Asn Arg
50 55 60
Thr Phe Asp Asp Tyr Ala Cys Trp Pro Asp Gly Pro Pro Gly Ser Phe
65 70 75 80
Val Asn Val Ser Cys Pro Trp Tyr Leu Pro Trp Ala Ser Ser Val Leu
85 90 95
Gln Gly His Val Tyr Arg Phe Cys Thr Ala Glu Gly Leu Trp Leu His
100 105 110
Lys Asp Asn Ser Ser Leu Pro Trp Arg Asp Leu Ser Glu Cys Glu Glu
115 120 125
Ser Lys Arg Gly Glu Arg Asn Phe Pro Glu Glu Gln Leu Leu Ser Leu
130 135 140
Tyr Ile Ile Tyr Thr Val Gly Tyr Ala Leu Ser Phe Ser Ala Leu Val
145 150 155 160
Ile Ala Ser Ala Ile Leu Val Gly Phe Arg His Leu His Cys Thr Arg
165 170 175
Asn Tyr Ile His Leu Asn Leu Phe Ala Ser Phe Ile Leu Arg Ala Leu
180 185 190
Ser Val Phe Ile Lys Asp Ala Ala Leu Lys Trp Met Tyr Ser Thr Ala
195 200 205
Ala Gln Gln His Gln Trp Asp Gly Leu Leu Ser Tyr Gln Asp Ser Leu
210 215 220
Gly Cys Arg Leu Val Phe Leu Leu Met Gln Tyr Cys Val Ala Ala Asn
225 230 235 240
Tyr Tyr Trp Leu Leu Val Glu Gly Val Tyr Leu Tyr Thr Leu Leu Ala
245 250 255
Phe Ser Val Phe Ser Glu Gln Arg Ile Phe Lys Leu Tyr Leu Ser Ile
260 265 270
Gly Trp Gly Val Pro Leu Leu Phe Val Ile Pro Trp Gly Ile Val Lys
275 280 285
Tyr Leu Tyr Glu Asp Glu Gly Cys Trp Thr Arg Asn Ser Asn Met Asn
290 295 300
Tyr Trp Leu Ile Ile Arg Leu Pro Ile Leu Phe Ala Ile Gly Val Asn
305 310 315 320
Phe Leu Ile Phe Ile Arg Val Ile Cys Ile Val Val Ser Lys Leu Lys
325 330 335
Ala Asn Leu Met Cys Lys Thr Asp Ile Lys Cys Arg Leu Ala Lys Ser
340 345 350
Thr Leu Thr Leu Ile Pro Leu Leu Gly Thr His Glu Val Ile Phe Ala
355 360 365
Phe Val Met Asp Glu His Ala Arg Gly Thr Leu Arg Phe Ile Lys Leu
370 375 380
Phe Thr Glu Leu Ser Phe Thr Ser Phe Gln Gly Leu Met Val Ala Ile
385 390 395 400
Leu Tyr Cys Phe Val Asn Asn Glu Val Gln Met Glu Phe Arg Lys Cys
405 410 415
Trp Glu Arg Trp Arg Leu Glu His Leu Asn Ile Gln Arg Asp Cys Ser
420 425 430
Met Lys Pro Leu Lys Cys Pro Thr Ser Ser Val Ser Ser Gly Ala Thr
435 440 445
Val Gly Ser Ser Val Tyr Ala Ala Thr Cys Gln Ser Ser Tyr Ser
450 455 460
<210> 2
<211> 463
<212> PRT
<213> Homo sapiens
<400> 2
Met Ala Gly Ala Pro Gly Pro Leu Arg Leu Ala Leu Leu Leu Leu Gly
1 5 10 15
Met Val Gly Arg Ala Gly Pro Arg Pro Gln Gly Ala Thr Val Ser Leu
20 25 30
Trp Glu Thr Val Gln Lys Trp Arg Glu Tyr Arg Arg Gln Cys Gln Arg
35 40 45
Ser Leu Thr Glu Asp Pro Pro Pro Ala Thr Asp Leu Phe Cys Asn Arg
50 55 60
Thr Phe Asp Glu Tyr Ala Cys Trp Pro Asp Gly Glu Pro Gly Ser Phe
65 70 75 80
Val Asn Val Ser Cys Pro Trp Tyr Leu Pro Trp Ala Ser Ser Val Pro
85 90 95
Gln Gly His Val Tyr Arg Phe Cys Thr Ala Glu Gly Leu Trp Leu Gln
100 105 110
Lys Asp Asn Ser Ser Leu Pro Trp Arg Asp Leu Ser Glu Cys Glu Glu
115 120 125
Ser Lys Arg Gly Glu Arg Ser Ser Pro Glu Glu Gln Leu Leu Phe Leu
130 135 140
Tyr Ile Ile Tyr Thr Val Gly Tyr Ala Leu Ser Phe Ser Ala Leu Val
145 150 155 160
Ile Ala Ser Ala Ile Leu Leu Gly Phe Arg His Leu His Cys Thr Arg
165 170 175
Asn Tyr Ile His Leu Asn Leu Phe Ala Ser Phe Ile Leu Arg Ala Leu
180 185 190
Ser Val Phe Ile Lys Asp Ala Ala Leu Lys Trp Met Tyr Ser Thr Ala
195 200 205
Ala Gln Gln His Gln Trp Asp Gly Leu Leu Ser Tyr Gln Asp Ser Leu
210 215 220
Ser Cys Arg Leu Val Phe Leu Leu Met Gln Tyr Cys Val Ala Ala Asn
225 230 235 240
Tyr Tyr Trp Leu Leu Val Glu Gly Val Tyr Leu Tyr Thr Leu Leu Ala
245 250 255
Phe Ser Val Leu Ser Glu Gln Trp Ile Phe Arg Leu Tyr Val Ser Ile
260 265 270
Gly Trp Gly Val Pro Leu Leu Phe Val Val Pro Trp Gly Ile Val Lys
275 280 285
Tyr Leu Tyr Glu Asp Glu Gly Cys Trp Thr Arg Asn Ser Asn Met Asn
290 295 300
Tyr Trp Leu Ile Ile Arg Leu Pro Ile Leu Phe Ala Ile Gly Val Asn
305 310 315 320
Phe Leu Ile Phe Val Arg Val Ile Cys Ile Val Val Ser Lys Leu Lys
325 330 335
Ala Asn Leu Met Cys Lys Thr Asp Ile Lys Cys Arg Leu Ala Lys Ser
340 345 350
Thr Leu Thr Leu Ile Pro Leu Leu Gly Thr His Glu Val Ile Phe Ala
355 360 365
Phe Val Met Asp Glu His Ala Arg Gly Thr Leu Arg Phe Ile Lys Leu
370 375 380
Phe Thr Glu Leu Ser Phe Thr Ser Phe Gln Gly Leu Met Val Ala Ile
385 390 395 400
Leu Tyr Cys Phe Val Asn Asn Glu Val Gln Leu Glu Phe Arg Lys Ser
405 410 415
Trp Glu Arg Trp Arg Leu Glu His Leu His Ile Gln Arg Asp Ser Ser
420 425 430
Met Lys Pro Leu Lys Cys Pro Thr Ser Ser Leu Ser Ser Gly Ala Thr
435 440 445
Ala Gly Ser Ser Met Tyr Thr Ala Thr Cys Gln Ala Ser Cys Ser
450 455 460
<210> 3
<211> 4007
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
cagccagctc acacctatct ctaactctgg ctccagcagg tccttgaaca accccccccc 60
aacacacacc caaacaaaaa tctttataat actgcctctc tgaaaacatc ctcacagaca 120
tatgaaatta tttctaggtg tttctgaagc cagacatgtt gacaagatta atcacaacag 180
gcagattgct atgaacaggg gacctgacac tttaggagct gcagagatga gtcctcccaa 240
gtgccccatg gactcttatg ggaaatagcc atggctgcaa aagtgcagag gaccagagtc 300
tcacctatca ttctgagaca gaaactggaa ggaaccacat taggggcaga agtatgctat 360
gctaaaagtt tgcatctgga ccccaccttc ccagatgttg ctaagtccca tggtgatgtt 420
gttaagtccc agggtgatgt tgctaagtcc cagggtgatt ttgctaagtc ccagggtgat 480
gttgctaagt cccagggcga tgttgctaac aagtcccagg gtgatgcaca ctgagatgag 540
aggtagcatc acagcacaca gagaaacttc tggatcctca gattctaaag gagaaaccag 600
gcaccctgcc catacatacc cagacatatt gacaccccat gtacaagaac acaaatgctt 660
tattttcatt tgagaagtga gccccaagaa gctcttgccc ccaagccaca ctattagaaa 720
atgaaccaag aaaggaaaaa gagtcagcac tgggcacatg gttgagcaga catccactgt 780
gggaatctgg ggatctccgt gcgagtgcag cccccctcca catctgttcc attcaaaggg 840
ctgtgaacca tggcaactct tgcaaaagaa agcctttaac tggggcttgc ttgcagtttc 900
agagtgttag tatattatga cttagtgctg gagaaggagc tgagagttct atatcagatc 960
cttagaaagg agagagagag agagaaagag agagagagag agagagagag agagagagag 1020
agagagagag agagagagag agagagagcc agccagccac tgggcttggc ttgggctttt 1080
gaaacctcaa aacctgcccc cagtgactta cttcctctaa caaggccaag cctcccaatc 1140
cttctgaagt actgccactt cgtgataaca aaacatttaa atagatgagc ctatatgagg 1200
gttattctta ttcagaccac caagggttct ttctattgat tgggatacaa tgtaaccaac 1260
cacctgctgc tcttgagggc atgccccccc ccagggggcg gggtggcagc aatagattgt 1320
attctctcag tctatgagcc aaataacccc ttcctttcta aagttgcttc ttgtcaggat 1380
catgagacac aataatgagg gaaataacac acaattagtc atgaatgggt tggtagattc 1440
agttaggggt aaatgggtta gtggatgcag ttagggttgc atgaattaat agattacttc 1500
tgatgtgggt tctctctctg tactagtgtt ctctagagga atggaatgta tagaatgtat 1560
acatatatgt gtgtacatat atgtatacat atatggctga ctcacaccag agatgctgag 1620
aatctggtag atgctggaat ctcagtccat gagactgggt atctcaacag tcatggcctt 1680
agtcgtttac cctgaaggcc tgtaggattc ctggagagct tctggtcttc agtttgtgct 1740
gaaagcctaa agtttattct aatatcagca agggaacatg gcagtagcaa cagtagagta 1800
gacgaacttg ccagcaagag tgaagacaag caggcaaaaa tccaagcctt ccttctgcca 1860
tgctccttat ccaggctgcc accagaagat gccaccaaca tttagggtgg ggggtttcca 1920
tttcaaaaaa tctgaccaag aaagcccctg aagggaatgc tgattctatt caggttgaca 1980
aacaaggtta gccctcatac tcaaagccag tatggttagg tatattaaac cctgatggtc 2040
catgtaggat acccttcacc actccagaag tctgtgaagg atgcttctga ctgtagttct 2100
ttacctttac atcagaatca ggagcccaag taaaattttc ttcaaaatgt tcttagactt 2160
gctggacagt ggtggcgcac acctttaatt ccagtacttg ggaggcagag gcaggtggat 2220
ctctgtgagt tcaagaccag cctgatctac agagtgagtc ctagaatagc cagggctacg 2280
tagagagagc ttgtctaaca caacaaaaca cagtgctcag tctgtggagt ggtgttatta 2340
gctataaaaa gcagaataac gaaaggtaca ttgcttaact gtgcctgtga cagcccaaaa 2400
taaaaagtac cttttccagc ctctcttgaa actagggatg gccatgtgac taaattctga 2460
tgagcaggtg gggaattgat gattgctgtc ttcaggacag gtccctctgg gcaatcagct 2520
ggtccttccc tgcagctgga cttttgatgt cctgattggt tctaaagcga gccacttcgg 2580
gtcatttagg tagatgctgg taccagaaaa gcgaaaagat ctggagacct tgatgagcag 2640
agaatggcta ctcactccaa cctgggctga agttccagct ttgctttccg taaaagccct 2700
agttagatca tttatttgga tggatggtcc tgacagctaa acagccaagc ctgtgtggca 2760
cacaggggga acctgcttga cctcaggctg gggctaaaac aagggactca aaggcagagc 2820
tcaccagaag ggagcttctc tctctgagtg gagcgcgctc cgcacctctc ttggctgtct 2880
ccctccgcgg gattgagcac tggatgtata gacccacttc ctgcaggact ttgggaagtt 2940
ctgtaatctc taagagttgc agctatgcat ccaatctctc ttctcttcca gaatggtcca 3000
gactagccct aggcaggtcc agggctgagt agagccacac ccaacttcct tatactagtt 3060
catggtgggg ggggggtgca tcctcttgcc ttcctcaaga ggttagtggt acacctcggc 3120
ttgcctgtcc cacttattaa ctcacagaag aggtaggagt ctggagctct cccgacctgt 3180
actgcagcca agggcaaagg tgtggtgtag gaagacagac tgaagtgcat agggtaagct 3240
agtcagggca cacattgtag caggcccagg gacagcaagg ggtggacagg gaacatttgg 3300
aaagttctag aaaaacagaa tccagcctca accctcttca ccctgcaatt tctaaagttt 3360
tagatagaaa ggaccctaag gactcttctg ggatctcttg tcctgatccc taccaccttg 3420
actgctgtgc aggcccagaa ggctgggctt gggatgagga gaggattggg gaagtaggtg 3480
gcacccaact agtccgatct ttcttcccta gtaactagca gcttgtggga tactttccag 3540
aagtctgacc aacactatga ccttgtacca atcctacacc tttcctggcc tcagtttcct 3600
tttggaagca ctgactcggt gggggcgtgg ctttccttag ttgaggggga gccaggagga 3660
gatcggggtg cgggggtggg aggcgggctc cactggtcgc agcgagctgg ccaggcgcag 3720
gcaccacagg cgctcagagc tagaagctcc gctcctgcgg ctcttaaacc tgagtggagc 3780
ccgcggggag cacagcgccg aacatctcct ggcccgggac gctggaggcc ggtctggccc 3840
cgggcctcct gaaacccagg cggaagagga cagggacccc gcccgatccc tcctgcggac 3900
gggcggggcg gccccacgcc agctcctccc cccgcagccc ggcagggatc agtcgcggcg 3960
cgcggttccg caggtggcag ctatgaccca gtcctgagcg cccagcc 4007
<210> 4
<211> 4768
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
gccagcaccc caagcctcct gcgcctggcg ctcctgctgc tcggggcggt gggcagggcc 60
ggcccccgcc ctcaggtgag ccctgggaac cccggtgaca aatgggaggg ggacgctgcg 120
gtgttctgcg ggcacaagag ctagcggagg ggctcctgga cttgagcaga aactccggga 180
ccccagacag gggaagtgca aggctcaggc gaggaagaga cagaggagtt gaggagtcca 240
ggtggggatt ggacatgagg tgactaccct catcctgaag agctgcctca cttctcggct 300
ccagctgctc tgtcagggca ccagctgccc cagggttgcc ctgctctgac ttctgcgacc 360
cgtctttgtc ccttattact ttcccaactc cttttccaaa cccactggca ctctgccttc 420
cctctgtact cagaacccct gcggtgcctt cccctgcact cctcctgggc ttccttgtgt 480
atggggtacc caggaagctc tagaggaccg aaggggcctg gttgtagaaa tgcagcttcc 540
tcccatcacc tcatcacagt ctttgactca tagccccagg gaccctgcag cctgttgtcc 600
ttcctgatga cctcccaggt ggcactgact tgccacctcc accccagcct ctgcagcaaa 660
catgcagcag gttccctgtt tcttctggat cagccaggcc ctctcataca ctcggctaat 720
acccatccta gacccccttg gattaataac ccaccagaaa gaataccgag ggtcaccgga 780
acatccaacc tccttggtgt cgccaaagac taggtcgcag ctggactctt gtgggctctt 840
ctctgactct ctctgacctg cctgtgaatc ctgccccagg ctcctgccct ggccatgatg 900
gccagctgct tgtatggagg gcggttgttc aaatgtgcca ggataccctt gcatagaaga 960
ggcccaaggc tgggcagtgt tcctatagaa gggagtactt tacacatcat gtcttgtgtc 1020
cacctccaga gctaaagggc ttaaccgttg gggagtgggc ctgcatccgt ttgagcttgg 1080
tctgacatag gagggcacag acctcagccc tggctgagaa ccgagttgtg gacagaggtg 1140
cctccccagg aagtgcactg tctcagctcc caaacccttt cccagattaa tcctctccct 1200
gttctccagg gccaactgtc cccaagagat accttcccag tctctggcac tgcctctctg 1260
ttcccctgca ggccatggct ttcctggtga cattgggatc tttccagcca caaccgcaga 1320
ttcgctgctc agttccttct tgtgaggcag gatggtgggg atttgagcct tctggtccta 1380
ggctgctgtg ggtcacattt gcagattagg ttgagagtga ggggacagag ccaagcttga 1440
ggccttcctt tcttctccct gcaagactcc ctcctctaat gtcaagcatc ttgaccctta 1500
ctccagccct ggttcataag agcagaaatg caggtgctga agagacacac tggagctttg 1560
atggggtgcc cttgttatgg cgagtactaa tgtctccggt agccgcctgc agaggtgtgt 1620
gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtga caggcagctt taacgttaga 1680
ttgcaataat tacagcacaa ccgcatggac cctggaaaga ctcaagaata aattttgtat 1740
tttactttct gtctgtgaga tcaccttcct gtcattcgtg gtagggtgag tactcagaaa 1800
cagggttccc taggtggtag ggtacagcag cttagggatg ggggagcaaa gagagtggga 1860
ccccagctct tggcccatgc cttcctcctg cccggtgggc atgaaggcca agggagcagg 1920
tctggtgagg gcagaagttg cttccctgca aattaaggga tggttgagct aacttgtgcc 1980
aaacgtgacc taggctgttc cagtgtgctt tctgggaagg accactcctc tcaccctgtt 2040
cccttctacc catagaccct ctatgaggga gctgggctac tgagaagcta agcaagcatt 2100
tgacacttga cgttccaacc gggtggaact gggttctgag gtcaggtctg atctttgctg 2160
gaactcttta gcaggaccct cgatgatcct aaacccagtt tctctatcag taaaacaggg 2220
atcatagggt ctgacatgga gggatggagg gtccctaagg ggacccattt ctgaaatggc 2280
agcttgaggc ctctgggaga aatgtccttt ggaacctggt gtgtccccag gctgcagagt 2340
acagcctggt gcaggattgt tgcaagcccc tggcctctgt actccaacaa agggcagtgg 2400
gggctgaggc ttcggcttgg tctgggtaga ctttgtccct agctgggctt ccttccagac 2460
acagacccag catagggctg tccaggagca gccaagaaac cacatcctgt cttctagtgt 2520
ctggtgcacc tgtcctcggc aaattcttgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt 2580
gtgtgtgtgt gtgttgtgtg tgtgtgtgtg tgtgttacac agagatgcat atgagataga 2640
ttggagatag gtgtccaaga tataagaggc tccatttctt tttgtgtttg tttgggaccc 2700
tttgtgtcac agtggatcgg tgtcaccatg tatgcagcaa tgtattagca tataatcaca 2760
cgtccaacag ttcgtgcgct tgtgtgtact tgcatgtgtg tgtgtgtgcc ttgatatcct 2820
acctgttata ctgtgctttt gggaaggtat gggattgtat ataacagccc ggtgggtgaa 2880
tgggaatctc ctggtatgta accttgtagg ggaaaagtac agtgcttgtg gcagtgttta 2940
tatgtgtgat tgtatgggtc atgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt 3000
gtgtgtgtga gagagagaga gagagagaga gagagagaga gagaatgttt cggcaagtgc 3060
ctgtgcacct ggctgtctgt gtgtgttgat gtggggtcag gagaccccat gtcagggtct 3120
cagtgctagg aacatccctg agggggtgag ggatatagcc tgtgacagtg tgtctgtgag 3180
aggttccttg agtctggaag agttgcctgt accttgcctt gccccgtccg tctgggtcag 3240
ctatcttagg aatgacctta agaaaacaaa atgtagacaa aaaaaaaatc tagagctgag 3300
caatgggaaa cgtgacccag gctctgagag gggaccagga gaaaaagtct ggttgccagg 3360
aggaagggaa tctacagggc tgtgcctagc tgggaggctc tagagccctg tctgctcctg 3420
ctgaaagccc gccagccacc ctccttcctc ctcttataat caggtgagac tgggctctct 3480
tttctcctac ccctcaaccc aacagattgc cagaaaagga aaagctctgg cgtgcgttcg 3540
cgctcaggct gagccagtgg aggatgccct acgccatggt gcaggttgtg gatagagctt 3600
acggggcgca tcatcgctgg ctgtgaactc cttgatctta ttctcttagg acgcctcctc 3660
cttactgtcc cctccacctg ggcatcgtcc tcgcttgcct tgaccctcct tttccttttt 3720
caagatctct ggagcctcag gggtcctcat gtcccctcaa cttcctagca cagggactaa 3780
aagtatgtgc caccgtgccc agctttttat ctgggttccc ggtgtggaac ttaggccttc 3840
aagggtttgc agggcccact ttctggactg agccacctcc ccagcctgct cgccgtgaca 3900
ctattgtcct tactgtgcct tccttttgaa aggaccacct tccttgctag gccagcctcc 3960
atttcccttt cccatacctc ctttccccct cagtgacccc tcaggtcaac actgagacct 4020
ggcccgacca ctccctgagc tcatacaccc actgtcttct tacgacatct gtcctgcaag 4080
gctcttggcc ccaactccat tcagcctgaa gactcagcac agtctctacc catctctgga 4140
tttctcctct actcaccacc atggaaactt ggcaagctgt ggctttaggg tcttgtctta 4200
acagagcctc aagctagagt taagtttcct atcttcactc tgctcttcga gtcaaagcgt 4260
ctttgatgct ctcatggtag ctgggccatc caggtcctgt ctccagcccc cattccctct 4320
tcttcattgg gttcttgggc ctcttcctca ctccctgggt agacacctgc tgctccagtt 4380
cccagcagtg accttgcttt ctgccatttg tcctactaag aacagacatg gtgggggttc 4440
ctccccttat ccctgcctgc cctcacctgc tccactgcct tcagggcact gagactaaag 4500
aagggatata agaagaaagt gagaaggaag tgagggaggt ggtaccagtc caccatggct 4560
cagtccgatg agtgcgccac ctcacagcag tggctccaag aacaatccac cgttgctgtt 4620
gccacctctg gtttcctttt ctttattctc cgagtgaata ctgctgacct ttgctctcgg 4680
aaggacactc atctccagag atgttggtgg cattcagagc aagcttgacc caccttcccc 4740
accccaaccc cacttctgga actttcca 4768
<210> 5
<211> 1392
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
atggccggcg cccccggccc gctgcgcctt gcgctgctgc tgctcgggat ggtgggcagg 60
gccggccccc gcccccaggg tgccactgtg tccctctggg agacggtgca gaaatggcga 120
gaataccgac gccagtgcca gcgctccctg actgaggatc cacctcctgc cacagacttg 180
ttctgcaacc ggaccttcga tgaatacgcc tgctggccag atggggagcc aggctcgttc 240
gtgaatgtca gctgcccctg gtacctgccc tgggccagca gtgtgccgca gggccacgtg 300
taccggttct gcacagctga aggcctctgg ctgcagaagg acaactccag cctgccctgg 360
agggacttgt cggagtgcga ggagtccaag cgaggggaaa gaagctcccc ggaggagcag 420
ctcctgttcc tctacatcat ctacacggtg ggctacgcac tctccttctc tgctctggtt 480
atcgcctctg cgatcctcct cggcttcaga cacctgcact gcaccaggaa ctacatccac 540
ctgaacctgt ttgcatcctt catcctgcga gcattgtccg tcttcatcaa ggacgcagcc 600
ctgaagtgga tgtatagcac agccgcccag cagcaccagt gggatgggct cctctcctac 660
caggactctc tgagctgccg cctggtgttt ctgctcatgc agtactgtgt ggcggccaat 720
tactactggc tcttggtgga gggcgtgtac ctgtacacac tgctggcctt ctcggtctta 780
tctgagcaat ggatcttcag gctctacgtg agcataggct ggggtgttcc cctgctgttt 840
gttgtcccct ggggcattgt caagtacctc tatgaggacg agggctgctg gaccaggaac 900
tccaacatga actactggct cattatccgg ctgcccattc tctttgccat tggggtgaac 960
ttcctcatct ttgttcgggt catctgcatc gtggtatcca aactgaaggc caatctcatg 1020
tgcaagacag acatcaaatg cagacttgcc aagtccacgc tgacactcat ccccctgctg 1080
gggactcatg aggtcatctt tgcctttgtg atggacgagc acgcccgggg gaccctgcgc 1140
ttcatcaagc tgtttacaga gctctccttc acctccttcc aggggctgat ggtggccata 1200
ttatactgct ttgtcaacaa tgaggtccag ctggaatttc ggaagagctg ggagcgctgg 1260
cggcttgagc acttgcacat ccagagggac agcagcatga agcccctcaa gtgtcccacc 1320
agcagcctga gcagtggagc cacggcgggc agcagcatgt acacagccac ttgccaggcc 1380
tcctgcagct ga 1392
<210> 6
<211> 1000
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
gccccagtgc cggtcctcct gtggtccttg cttctggctg ggtggccatc ccaggtggga 60
gagatcctgg ggatagggaa tgtgaaggac acaggcacac cacacacaca cacacacaca 120
cacacacaca cacacacaca cacacaccat gctttctttc tctaaaccta tgaagcaggc 180
aagtgggcag tgcctcctgg gacctaaaca catgtcctcc aaggagaaca gcctgctaat 240
ttaatcaccg tggcaggaag agaggaagaa acaattgctg ctaagatgaa gaggacttct 300
tcctgtttaa agccgcaaga cccttggggt tccattggac agaacagcaa atcaacccgg 360
actcacactc aagggcaatt gctgatgggt ggaattgggg cttccgagaa gaggccatga 420
gagacctgcc cttggaacct cagccagtcc agagctcagc aaggtgagcc ggctgtgctg 480
tgtgcatggc tggggttgtc acctgcatca atcagccttc ctcccgacaa gaggctttct 540
ctgtgcatct ggattgctga cattccccca tctgcctgtt cttctgatat cctgttgttt 600
ccttggggag gggaatttgt tgaagtcata ccgtgcagct ctctctggtg ttgaggagat 660
gatgctcaga ggtgttcttt gcctggccct ttaagccact ttgctcttgg cctctgcagt 720
gcctagggta ctagggcagg tcccacggtg agaagcccag atgtggggtg tggaccctca 780
gttctgttgt aaagatgctc agataccctc tagggttcat ctaaaagatc ccctaggggg 840
tgctgctgac atgaatgact ctagagaacc aagggatcca ttgccaccac acctccacct 900
catctgtgac cagagtctat gacttggatg agaattaggg tacatcctct gacttcagag 960
gctatgatcc agaagagact cttccactga agccaacccc 1000
<210> 7
<211> 231
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
aatattctgt gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct 60
tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc 120
attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg 180
aggattggga agacaatagc aggcatgctg gggatgcggt gggctctatg g 231
<210> 8
<211> 80
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
gacaatagca ggcatgctgg ggatgcggtg ggctctatgg gaattccgaa gttcctattc 60
tctagaaagt ataggaactt 80
<210> 9
<211> 80
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
ataggaactt catcagtcag gtacataatt aggtggatcc gccagcaccc caagcctcct 60
gcgcctggcg ctcctgctgc 80
<210> 10
<211> 4487
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
atggccggcg cccccggccc gctgcgcctt gcgctgctgc tgctcgggat ggtgggcagg 60
gccggccccc gcccccaggg tgccactgtg tccctctggg agacggtgca gaaatggcga 120
gaataccgac gccagtgcca gcgctccctg actgaggatc cacctcctgc cacagacttg 180
ttctgcaacc ggaccttcga tgaatacgcc tgctggccag atggggagcc aggctcgttc 240
gtgaatgtca gctgcccctg gtacctgccc tgggccagca gtgtgccgca gggccacgtg 300
taccggttct gcacagctga aggcctctgg ctgcagaagg acaactccag cctgccctgg 360
agggacttgt cggagtgcga ggagtccaag cgaggggaaa gaagctcccc ggaggagcag 420
ctcctgttcc tctacatcat ctacacggtg ggctacgcac tctccttctc tgctctggtt 480
atcgcctctg cgatcctcct cggcttcaga cacctgcact gcaccaggaa ctacatccac 540
ctgaacctgt ttgcatcctt catcctgcga gcattgtccg tcttcatcaa ggacgcagcc 600
ctgaagtgga tgtatagcac agccgcccag cagcaccagt gggatgggct cctctcctac 660
caggactctc tgagctgccg cctggtgttt ctgctcatgc agtactgtgt ggcggccaat 720
tactactggc tcttggtgga gggcgtgtac ctgtacacac tgctggcctt ctcggtctta 780
tctgagcaat ggatcttcag gctctacgtg agcataggct ggggtgttcc cctgctgttt 840
gttgtcccct ggggcattgt caagtacctc tatgaggacg agggctgctg gaccaggaac 900
tccaacatga actactggct cattatccgg ctgcccattc tctttgccat tggggtgaac 960
ttcctcatct ttgttcgggt catctgcatc gtggtatcca aactgaaggc caatctcatg 1020
tgcaagacag acatcaaatg cagacttgcc aagtccacgc tgacactcat ccccctgctg 1080
gggactcatg aggtcatctt tgcctttgtg atggacgagc acgcccgggg gaccctgcgc 1140
ttcatcaagc tgtttacaga gctctccttc acctccttcc aggggctgat ggtggccata 1200
ttatactgct ttgtcaacaa tgaggtccag ctggaatttc ggaagagctg ggagcgctgg 1260
cggcttgagc acttgcacat ccagagggac agcagcatga agcccctcaa gtgtcccacc 1320
agcagcctga gcagtggagc cacggcgggc agcagcatgt acacagccac ttgccaggcc 1380
tcctgcagct gagccccagt gccggtcctc ctgtggtcct tgcttctggc tgggtggcca 1440
tcccaggtgg gagagatcct ggggataggg aatgtgaagg acacaggcac accacacaca 1500
cacacacaca cacacacaca cacacacaca cacacacacc atgctttctt tctctaaacc 1560
tatgaagcag gcaagtgggc agtgcctcct gggacctaaa cacatgtcct ccaaggagaa 1620
cagcctgcta atttaatcac cgtggcagga agagaggaag aaacaattgc tgctaagatg 1680
aagaggactt cttcctgttt aaagccgcaa gacccttggg gttccattgg acagaacagc 1740
aaatcaaccc ggactcacac tcaagggcaa ttgctgatgg gtggaattgg ggcttccgag 1800
aagaggccat gagagacctg cccttggaac ctcagccagt ccagagctca gcaaggtgag 1860
ccggctgtgc tgtgtgcatg gctggggttg tcacctgcat caatcagcct tcctcccgac 1920
aagaggcttt ctctgtgcat ctggattgct gacattcccc catctgcctg ttcttctgat 1980
atcctgttgt ttccttgggg aggggaattt gttgaagtca taccgtgcag ctctctctgg 2040
tgttgaggag atgatgctca gaggtgttct ttgcctggcc ctttaagcca ctttgctctt 2100
ggcctctgca gtgcctaggg tactagggca ggtcccacgg tgagaagccc agatgtgggg 2160
tgtggaccct cagttctgtt gtaaagatgc tcagataccc tctagggttc atctaaaaga 2220
tcccctaggg ggtgctgctg acatgaatga ctctagagaa ccaagggatc cattgccacc 2280
acacctccac ctcatctgtg accagagtct atgacttgga tgagaattag ggtacatcct 2340
ctgacttcag aggctatgat ccagaagaga ctcttccact gaagccaacc ccaatattct 2400
gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc cttgaccctg 2460
gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc gcattgtctg 2520
agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg ggaggattgg 2580
gaagacaata gcaggcatgc tggggatgcg gtgggctcta tgggaattcc gaagttccta 2640
ttctctagaa agtataggaa cttcaggtct gaagaggagt ttacgtccag ccaagctagc 2700
ttggctgcag gtcgtcgaaa ttctaccggg taggggaggc gcttttccca aggcagtctg 2760
gagcatgcgc tttagcagcc ccgctgggca cttggcgcta cacaagtggc ctctggcctc 2820
gcacacattc cacatccacc ggtaggcgcc aaccggctcc gttctttggt ggccccttcg 2880
cgccaccttc tactcctccc ctagtcagga agttcccccc cgccccgcag ctcgcgtcgt 2940
gcaggacgtg acaaatggaa gtagcacgtc tcactagtct cgtgcagatg gacagcaccg 3000
ctgagcaatg gaagcgggta ggcctttggg gcagcggcca atagcagctt tgctccttcg 3060
ctttctgggc tcagaggctg ggaaggggtg ggtccggggg cgggctcagg ggcgggctca 3120
ggggcggggc gggcgcccga aggtcctccg gaggcccggc attctgcacg cttcaaaagc 3180
gcacgtctgc cgcgctgttc tcctcttcct catctccggg cctttcgacc tgcagcctgt 3240
tgacaattaa tcatcggcat agtatatcgg catagtataa tacgacaagg tgaggaacta 3300
aaccatggga tcggccattg aacaagatgg attgcacgca ggttctccgg ccgcttgggt 3360
ggagaggcta ttcggctatg actgggcaca acagacaatc ggctgctctg atgccgccgt 3420
gttccggctg tcagcgcagg ggcgcccggt tctttttgtc aagaccgacc tgtccggtgc 3480
cctgaatgaa ctgcaggacg aggcagcgcg gctatcgtgg ctggccacga cgggcgttcc 3540
ttgcgcagct gtgctcgacg ttgtcactga agcgggaagg gactggctgc tattgggcga 3600
agtgccgggg caggatctcc tgtcatctca ccttgctcct gccgagaaag tatccatcat 3660
ggctgatgca atgcggcggc tgcatacgct tgatccggct acctgcccat tcgaccacca 3720
agcgaaacat cgcatcgagc gagcacgtac tcggatggaa gccggtcttg tcgatcagga 3780
tgatctggac gaagagcatc aggggctcgc gccagccgaa ctgttcgcca ggctcaaggc 3840
gcgcatgccc gacggcgatg atctcgtcgt gacccatggc gatgcctgct tgccgaatat 3900
catggtggaa aatggccgct tttctggatt catcgactgt ggccggctgg gtgtggcgga 3960
ccgctatcag gacatagcgt tggctacccg tgatattgct gaagagcttg gcggcgaatg 4020
ggctgaccgc ttcctcgtgc tttacggtat cgccgctccc gattcgcagc gcatcgcctt 4080
ctatcgcctt cttgacgagt tcttctgagg ggatcaattc tctagagctc gctgatcagc 4140
ctcgactgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt 4200
gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca 4260
ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga 4320
ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg cttctgaggc 4380
ggaaagaacc agctggggct cgactagagc ttgcggaacc cttcgaagtt cctattctct 4440
agaaagtata ggaacttcat cagtcaggta cataattagg tggatcc 4487
<210> 11
<211> 1480
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
gcgcccagcc atggccggcg cccccggccc gctgcgcctt gcgctgctgc tgctcgggat 60
ggtgggcagg gccggccccc gcccccaggg tgccactgtg tccctctggg agacggtgca 120
gaaatggcga gaataccgac gccagtgcca gcgctccctg actgaggatc cacctcctgc 180
cacagacttg ttctgcaacc ggaccttcga tgaatacgcc tgctggccag atggggagcc 240
aggctcgttc gtgaatgtca gctgcccctg gtacctgccc tgggccagca gtgtgccgca 300
gggccacgtg taccggttct gcacagctga aggcctctgg ctgcagaagg acaactccag 360
cctgccctgg agggacttgt cggagtgcga ggagtccaag cgaggggaaa gaagctcccc 420
ggaggagcag ctcctgttcc tctacatcat ctacacggtg ggctacgcac tctccttctc 480
tgctctggtt atcgcctctg cgatcctcct cggcttcaga cacctgcact gcaccaggaa 540
ctacatccac ctgaacctgt ttgcatcctt catcctgcga gcattgtccg tcttcatcaa 600
ggacgcagcc ctgaagtgga tgtatagcac agccgcccag cagcaccagt gggatgggct 660
cctctcctac caggactctc tgagctgccg cctggtgttt ctgctcatgc agtactgtgt 720
ggcggccaat tactactggc tcttggtgga gggcgtgtac ctgtacacac tgctggcctt 780
ctcggtctta tctgagcaat ggatcttcag gctctacgtg agcataggct ggggtgttcc 840
cctgctgttt gttgtcccct ggggcattgt caagtacctc tatgaggacg agggctgctg 900
gaccaggaac tccaacatga actactggct cattatccgg ctgcccattc tctttgccat 960
tggggtgaac ttcctcatct ttgttcgggt catctgcatc gtggtatcca aactgaaggc 1020
caatctcatg tgcaagacag acatcaaatg cagacttgcc aagtccacgc tgacactcat 1080
ccccctgctg gggactcatg aggtcatctt tgcctttgtg atggacgagc acgcccgggg 1140
gaccctgcgc ttcatcaagc tgtttacaga gctctccttc acctccttcc aggggctgat 1200
ggtggccata ttatactgct ttgtcaacaa tgaggtccag ctggaatttc ggaagagctg 1260
ggagcgctgg cggcttgagc acttgcacat ccagagggac agcagcatga agcccctcaa 1320
gtgtcccacc agcagcctga gcagtggagc cacggcgggc agcagcatgt acacagccac 1380
ttgccaggcc tcctgcagct gagccccagt gccggtcctc ctgtggtcct tgcttctggc 1440
tgggtggcca tcccaggtgg gagagatcct ggggataggg 1480
<210> 12
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
cacattcaga gtgagtcttg tcatc 25
<210> 13
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
catttctgca ccgtctccca gagg 24
<210> 14
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
caggacatag cgttggctac 20
<210> 15
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
ccagagcccc ggagtctta 19
<210> 16
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
tctctctcct tagggagtca tcctt 25
<210> 17
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
atggtctatg ctcacagatc caatc 25
<210> 18
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
aggctagcta aagggagcac tcaga 25
<210> 19
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
gttgcaggat gtggtctcac agagg 25
<210> 20
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
ggatcggcca ttgaacaaga 20
<210> 21
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
cagaagaact cgtcaagaag 20
<210> 22
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
ctcctgcggc tcttaaacct gagtg 25
<210> 23
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
acctggactc ctcaactcct ctgtc 25
<210> 24
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
catttctgca ccgtctccca gagg 24
<210> 25
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
tcttccactg aagccaaccc c 21
<210> 26
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
acctggactc ctcaactcct ctgtc 25
<210> 27
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
gacaagcgtt agtaggcaca tatac 25
<210> 28
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
gctccaattt cccacaacat tagt 24
<210> 29
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
gaactacatc cacctgaacc tgtttgcatc 30
<210> 30
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
acaaagcagt ataatatggc caccatcagc 30
<210> 31
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
tcttctgcaa ccggaccttt gatgactatg 30
<210> 32
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
agataagaaa gttgacgccg atagcaaaga 30
<210> 33
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
tcaccatctt ccaggagcga ga 22
<210> 34
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
gaaggccatg ccagtgagct t 21
<210> 35
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
ccttcgatga atacgcctgc 20
<210> 36
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
tgcacatgag attggccttc a 21
<210> 37
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
gctgagggtc tctggctaca 20
<210> 38
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
gtgttcgtcc atcacaaagg c 21
Claims (20)
1.一种GLP1R基因人源化的非人动物的构建方法,其特征在于,所述的非人动物体内表达人GLP1R蛋白,或所述非人动物基因组中包含人源化GLP1R基因;
所述的构建方法包括将人源化GLP1R基因插入至非人动物GLP1R基因座上编码信号肽的核苷酸序列之前;
所述的人源化GLP1R基因包含人GLP1R基因的部分,所述的人GLP1R基因的部分为人GLP1R基因的CDS序列;
所述的人源化GLP1R基因包含编码所述的人GLP1R蛋白的核苷酸序列;
所述的人GLP1R蛋白的氨基酸序列如SEQ ID NO:2所示;
所述的非人动物内源GLP1R蛋白表达降低或缺失。
2.根据权利要求1所述的构建方法,其特征在于,所述的人GLP1R基因的部分的核苷酸序列如SEQ ID NO:5所示。
3.根据权利要求1所述的构建方法,其特征在于,所述的人源化GLP1R基因还包含辅助序列,所述辅助序列连接于人GLP1R基因之后。
4.根据权利要求3所述的构建方法,其特征在于,所述的辅助序列为非人动物的3’UTR和/或polyA。
5.根据权利要求1所述的构建方法,其特征在于,所述的人源化GLP1R基因还包含非人动物GLP1R基因。
6.根据权利要求1所述的构建方法,其特征在于,所述的人源化GLP1R基因转录的mRNA序列如SEQ ID NO:11所示。
7.根据权利要求1所述的构建方法,其特征在于,使用靶向载体进行非人动物的构建,所述的靶向载体包含人GLP1R基因的部分;所述的人GLP1R基因的部分为人GLP1R基因的CDS序列。
8.根据权利要求7所述的构建方法,其特征在于,所述的人GLP1R基因的部分的核苷酸序列如SEQ ID NO:5所示。
9.根据权利要求7所述的构建方法,其特征在于,所述的靶向载体包含SEQ ID NO:10所示的核苷酸序列。
10.根据权利要求7所述的构建方法,其特征在于,所述的靶向载体还包含5’臂和/或3’臂,所述5’臂序列如SEQ ID NO:3所示,所述的3’臂序列如SEQ ID NO:4所示。
11.根据权利要求1所述的构建方法,其特征在于,所述的非人动物基因组中还包含其他基因修饰。
12.根据权利要求11所述的构建方法,其特征在于,所述的其他基因包含PD-1、PD-L1、CTLA4、LAG3、IL4、IL6和CCR4中的至少一种。
13.根据权利要求11所述的构建方法,其特征在于,所述的人源化GLP1R基因和/或所述其他基因对于被替换的内源基因座是纯合或者杂合。
14.根据权利要求1-13任一所述的构建方法,其特征在于,所述的非人动物为大鼠或小鼠。
15.一种靶向载体,其特征在于,所述的靶向载体包含人GLP1R基因的部分;
所述的人GLP1R基因的部分的核苷酸序列如SEQ ID NO:5所示;
所述的靶向载体还包含5’臂和/或3’臂,所述5’臂序列如SEQ ID NO:3所示,所述的3’臂序列如SEQ ID NO:4所示。
16.根据权利要求15所述的靶向载体,其特征在于,所述的靶向载体的核苷酸序列包含SEQ ID NO:10所示的核苷酸序列。
17.一种细胞、细胞系、原代细胞培养物、组织、器官或其培养物,其特征在于,所述细胞、细胞系、原代细胞培养物、组织、器官或其培养物来源于权利要求1-14任一所述的构建方法获得的非人动物,所述的细胞、细胞系、原代细胞培养物、组织、器官或其培养物不能发育为动物个体。
18.来源于权利要求1-14任一所述的构建方法获得的非人动物、权利要求17所述的细胞、细胞系、原代细胞培养物、组织、器官或其培养物的应用,其特征在于,所述的应用为非疾病的诊断和治疗目的,所述应用包括:
A)在需要涉及人类细胞的免疫过程的产品开发,制造抗体;
B)作为药理学、免疫学、微生物学、医学研究的模型系统中的应用;
C)在生产和利用动物实验疾病模型中的应用;
D)在筛选、验证、评价或研究GLP1R通路功能、人GLP1R通路信号机理中的应用;
E)在筛选、验证、评价或研究靶向人的药物、药效研究方面的应用。
19.根据权利要求18所述的应用,其特征在于,E)中所述的靶向人的药物包括靶向人的抗体。
20.根据权利要求18所述的应用,其特征在于,E)中所述的靶向人的药物包括免疫相关疾病药物、心血管疾病药物、代谢类疾病药物。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010979260 | 2020-09-17 | ||
CN2020109792603 | 2020-09-17 | ||
CN202110714328 | 2021-06-25 | ||
CN202110714328X | 2021-06-25 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114134152A CN114134152A (zh) | 2022-03-04 |
CN114134152B true CN114134152B (zh) | 2024-06-18 |
Family
ID=80394916
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111094136.XA Active CN114134152B (zh) | 2020-09-17 | 2021-09-17 | Glp1r基因人源化的非人动物及其构建方法和应用 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230363362A1 (zh) |
CN (1) | CN114134152B (zh) |
WO (1) | WO2022057903A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230417899A1 (en) * | 2022-06-27 | 2023-12-28 | Oshkosh Corporation | Position tracking for a lift device |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1772885B (zh) * | 2004-11-11 | 2010-12-01 | 中国人民解放军军事医学科学院野战输血研究所 | 诱导干细胞向胰岛样细胞分化的方法及胰岛样细胞的应用 |
WO2018121787A1 (en) * | 2016-12-30 | 2018-07-05 | Beijing Biocytogen Co., Ltd | Genetically modified non-human animal with human or chimeric cd137 |
WO2018233606A1 (en) * | 2017-06-19 | 2018-12-27 | Beijing Biocytogen Co., Ltd | GENETICALLY MODIFIED NON-HUMAN ANIMAL WITH HUMAN OR CHIMERIC GITR |
WO2018233608A1 (en) * | 2017-06-19 | 2018-12-27 | Beijing Biocytogen Co., Ltd | NON-HUMAN ANIMAL GENETICALLY MODIFIED TO CD28 HUMAN OR CHIMERIC |
WO2018233607A1 (en) * | 2017-06-19 | 2018-12-27 | Beijing Biocytogen Co., Ltd | NON-HUMAN ANIMAL GENETICALLY MODIFIED WITH HUMAN OR CHIMERIC CD40 |
WO2019072241A1 (en) * | 2017-10-13 | 2019-04-18 | Beijing Biocytogen Co., Ltd | NON-HUMAN ANIMAL GENETICALLY MODIFIED WITH PD-1 HUMAN OR CHIMERIC |
-
2021
- 2021-09-17 US US18/025,990 patent/US20230363362A1/en active Pending
- 2021-09-17 WO PCT/CN2021/119112 patent/WO2022057903A1/en active Application Filing
- 2021-09-17 CN CN202111094136.XA patent/CN114134152B/zh active Active
Non-Patent Citations (1)
Title |
---|
Lucy S. Jund等.A Novel Humanized GLP-1 Receptor Model Enables Both Affinity Purification and Cre-LoxP Deletion of the Receptor.PLOS ONE.2014,第第9卷卷(第第9卷期),e93746. * |
Also Published As
Publication number | Publication date |
---|---|
WO2022057903A1 (en) | 2022-03-24 |
US20230363362A1 (en) | 2023-11-16 |
CN114134152A (zh) | 2022-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111837036B (zh) | 具有人或嵌合基因的基因修饰的非人动物 | |
CN109913493B (zh) | 人源化cd3基因改造动物模型的制备方法及应用 | |
CN112779285B (zh) | 人源化il-10和il-10ra基因改造动物的构建方法和应用 | |
CN111793646B (zh) | Il1r1基因人源化改造的非人动物的构建方法及其应用 | |
CN109136275B (zh) | 人源化gitr基因改造动物模型的制备方法及应用 | |
CN113373178A (zh) | 一种tlr8基因人源化动物模型的构建方法及应用 | |
CN113429472A (zh) | Cd94和nkg2a基因人源化的非人动物及其制备方法和应用 | |
CN113429486A (zh) | 基因修饰非人动物的构建方法及应用 | |
CN114277055A (zh) | Il1b和il1a基因人源化的非人动物及其构建方法和应用 | |
CN111793647A (zh) | Cd226基因人源化非人动物的构建方法及应用 | |
CN113388640B (zh) | Ccr4基因人源化的非人动物及其构建方法和应用 | |
CN114134152B (zh) | Glp1r基因人源化的非人动物及其构建方法和应用 | |
CN113105555B (zh) | Mhc分子人源化的非人动物的构建方法及应用 | |
CN107955817B (zh) | 人源化基因改造动物模型的制备方法及应用 | |
CN113461802A (zh) | 一种cd276基因人源化的非人动物及其构建方法和应用 | |
CN114751973B (zh) | Siglec15基因人源化非人动物的构建方法和应用 | |
CN113881681B (zh) | Ccr8基因人源化非人动物及其构建方法和应用 | |
CN112501206B (zh) | Psma基因人源化非人动物的构建方法及应用 | |
CN112553252B (zh) | Tnfr2基因人源化的非人动物的构建方法和应用 | |
CN115011606A (zh) | Cd37基因人源化非人动物的构建方法及应用 | |
CN114835799A (zh) | Il1rap基因人源化非人动物的构建方法及应用 | |
CN113234139A (zh) | Tnfsf9基因人源化的非人动物及其构建方法和应用 | |
CN115010800B (zh) | Pvrig基因人源化非人动物的构建方法及应用 | |
CN113817770B (zh) | Cd73基因人源化的非人动物的构建方法及应用 | |
CN112501202B (zh) | Cxcr4基因人源化的非人动物及其构建方法和应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |