CN114134153A - Garp基因人源化非人动物及其构建方法和应用 - Google Patents
Garp基因人源化非人动物及其构建方法和应用 Download PDFInfo
- Publication number
- CN114134153A CN114134153A CN202111488968.XA CN202111488968A CN114134153A CN 114134153 A CN114134153 A CN 114134153A CN 202111488968 A CN202111488968 A CN 202111488968A CN 114134153 A CN114134153 A CN 114134153A
- Authority
- CN
- China
- Prior art keywords
- garp
- human
- gene
- humanized
- nucleotide sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000010276 construction Methods 0.000 title claims abstract description 29
- 101710093674 Cyclic nucleotide-gated cation channel beta-1 Proteins 0.000 title claims abstract 34
- 101710169732 Transforming growth factor beta activator LRRC32 Proteins 0.000 title claims abstract 34
- 239000003814 drug Substances 0.000 claims abstract description 38
- 239000013598 vector Substances 0.000 claims abstract description 28
- 102100025946 Transforming growth factor beta activator LRRC32 Human genes 0.000 claims abstract description 15
- 238000003881 globally optimized alternating phase rectangular pulse Methods 0.000 claims abstract 6
- 108090000623 proteins and genes Proteins 0.000 claims description 168
- 239000002773 nucleotide Substances 0.000 claims description 110
- 125000003729 nucleotide group Chemical group 0.000 claims description 110
- 101001004924 Homo sapiens Transforming growth factor beta activator LRRC32 Proteins 0.000 claims description 91
- 101000771075 Homo sapiens Cyclic nucleotide-gated cation channel beta-1 Proteins 0.000 claims description 64
- 210000004027 cell Anatomy 0.000 claims description 58
- 102000052917 human LRRC32 Human genes 0.000 claims description 45
- 238000000034 method Methods 0.000 claims description 44
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 39
- 201000010099 disease Diseases 0.000 claims description 37
- 241001465754 Metazoa Species 0.000 claims description 30
- 241000283984 Rodentia Species 0.000 claims description 29
- 230000008685 targeting Effects 0.000 claims description 25
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical group C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 20
- 210000001519 tissue Anatomy 0.000 claims description 19
- 108700024394 Exon Proteins 0.000 claims description 18
- 238000012216 screening Methods 0.000 claims description 16
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 14
- 208000026106 cerebrovascular disease Diseases 0.000 claims description 12
- 238000003780 insertion Methods 0.000 claims description 12
- 230000037431 insertion Effects 0.000 claims description 12
- 238000010362 genome editing Methods 0.000 claims description 11
- 208000024172 Cardiovascular disease Diseases 0.000 claims description 10
- 230000002526 effect on cardiovascular system Effects 0.000 claims description 10
- 230000000694 effects Effects 0.000 claims description 10
- 230000001105 regulatory effect Effects 0.000 claims description 10
- 238000006467 substitution reaction Methods 0.000 claims description 10
- 238000011161 development Methods 0.000 claims description 9
- 210000000056 organ Anatomy 0.000 claims description 9
- 101710089372 Programmed cell death protein 1 Proteins 0.000 claims description 8
- 108010074708 B7-H1 Antigen Proteins 0.000 claims description 6
- 102000008096 B7-H1 Antigen Human genes 0.000 claims description 6
- 102100039498 Cytotoxic T-lymphocyte protein 4 Human genes 0.000 claims description 6
- 102100034458 Hepatitis A virus cellular receptor 2 Human genes 0.000 claims description 6
- 101000889276 Homo sapiens Cytotoxic T-lymphocyte protein 4 Proteins 0.000 claims description 6
- 101001068133 Homo sapiens Hepatitis A virus cellular receptor 2 Proteins 0.000 claims description 6
- 101001137987 Homo sapiens Lymphocyte activation gene 3 protein Proteins 0.000 claims description 6
- 102000017578 LAG3 Human genes 0.000 claims description 6
- 102100022153 Tumor necrosis factor receptor superfamily member 4 Human genes 0.000 claims description 6
- 101710165473 Tumor necrosis factor receptor superfamily member 4 Proteins 0.000 claims description 6
- 108020004999 messenger RNA Proteins 0.000 claims description 6
- 230000000259 anti-tumor effect Effects 0.000 claims description 5
- 238000004519 manufacturing process Methods 0.000 claims description 5
- 238000011160 research Methods 0.000 claims description 5
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 4
- 230000001086 cytosolic effect Effects 0.000 claims description 4
- 238000000338 in vitro Methods 0.000 claims description 3
- 230000007246 mechanism Effects 0.000 claims description 3
- 230000000144 pharmacologic effect Effects 0.000 claims description 3
- 230000001225 therapeutic effect Effects 0.000 claims description 3
- 238000012356 Product development Methods 0.000 claims description 2
- 230000003110 anti-inflammatory effect Effects 0.000 claims description 2
- 230000004720 fertilization Effects 0.000 claims description 2
- 210000005260 human cell Anatomy 0.000 claims description 2
- 230000001900 immune effect Effects 0.000 claims description 2
- 230000037189 immune system physiology Effects 0.000 claims description 2
- 230000013011 mating Effects 0.000 claims description 2
- 230000002906 microbiologic effect Effects 0.000 claims description 2
- 150000007523 nucleic acids Chemical group 0.000 claims description 2
- 125000003275 alpha amino acid group Chemical group 0.000 claims 6
- 102100023990 60S ribosomal protein L17 Human genes 0.000 claims 1
- 238000010363 gene targeting Methods 0.000 abstract description 3
- 108700026220 vif Genes Proteins 0.000 abstract description 2
- 241000699666 Mus <mouse, genus> Species 0.000 description 61
- 206010028980 Neoplasm Diseases 0.000 description 50
- 241000699670 Mus sp. Species 0.000 description 48
- 102000004169 proteins and genes Human genes 0.000 description 37
- 235000018102 proteins Nutrition 0.000 description 36
- 108020004414 DNA Proteins 0.000 description 34
- 150000001413 amino acids Chemical group 0.000 description 34
- 229940079593 drug Drugs 0.000 description 21
- 238000001514 detection method Methods 0.000 description 20
- 241000700159 Rattus Species 0.000 description 19
- 206010061218 Inflammation Diseases 0.000 description 16
- 210000001744 T-lymphocyte Anatomy 0.000 description 15
- 230000004054 inflammatory process Effects 0.000 description 15
- 238000011740 C57BL/6 mouse Methods 0.000 description 12
- 239000012634 fragment Substances 0.000 description 12
- 238000005215 recombination Methods 0.000 description 11
- 230000006798 recombination Effects 0.000 description 11
- 239000000523 sample Substances 0.000 description 11
- 238000011816 wild-type C57Bl6 mouse Methods 0.000 description 11
- 238000010171 animal model Methods 0.000 description 10
- 210000003289 regulatory T cell Anatomy 0.000 description 10
- 210000000952 spleen Anatomy 0.000 description 10
- 101001004925 Mus musculus Transforming growth factor beta activator LRRC32 Proteins 0.000 description 9
- 230000014509 gene expression Effects 0.000 description 9
- 208000023275 Autoimmune disease Diseases 0.000 description 8
- 241000283973 Oryctolagus cuniculus Species 0.000 description 8
- 102100040678 Programmed cell death protein 1 Human genes 0.000 description 8
- NKANXQFJJICGDU-QPLCGJKRSA-N Tamoxifen Chemical compound C=1C=CC=CC=1C(/CC)=C(C=1C=CC(OCCN(C)C)=CC=1)/C1=CC=CC=C1 NKANXQFJJICGDU-QPLCGJKRSA-N 0.000 description 8
- 238000011577 humanized mouse model Methods 0.000 description 8
- 239000003550 marker Substances 0.000 description 8
- 241000282693 Cercopithecidae Species 0.000 description 7
- 210000004369 blood Anatomy 0.000 description 7
- 239000008280 blood Substances 0.000 description 7
- 108010050848 glycylleucine Proteins 0.000 description 7
- 238000001727 in vivo Methods 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 238000002105 Southern blotting Methods 0.000 description 6
- 210000002459 blastocyst Anatomy 0.000 description 6
- 210000000349 chromosome Anatomy 0.000 description 6
- 230000000857 drug effect Effects 0.000 description 6
- 210000001671 embryonic stem cell Anatomy 0.000 description 6
- 210000003743 erythrocyte Anatomy 0.000 description 6
- 238000012239 gene modification Methods 0.000 description 6
- 239000000411 inducer Substances 0.000 description 6
- 210000000265 leukocyte Anatomy 0.000 description 6
- 210000005259 peripheral blood Anatomy 0.000 description 6
- 239000011886 peripheral blood Substances 0.000 description 6
- 210000004881 tumor cell Anatomy 0.000 description 6
- 108020004705 Codon Proteins 0.000 description 5
- 206010009944 Colon cancer Diseases 0.000 description 5
- 102000004190 Enzymes Human genes 0.000 description 5
- 108090000790 Enzymes Proteins 0.000 description 5
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 5
- 241001529936 Murinae Species 0.000 description 5
- 108091081024 Start codon Proteins 0.000 description 5
- 210000003719 b-lymphocyte Anatomy 0.000 description 5
- 238000004113 cell culture Methods 0.000 description 5
- 208000029742 colonic neoplasm Diseases 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 238000003209 gene knockout Methods 0.000 description 5
- 108010057821 leucylproline Proteins 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 4
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 4
- 102000003839 Human Proteins Human genes 0.000 description 4
- 108090000144 Human Proteins Proteins 0.000 description 4
- 241000699660 Mus musculus Species 0.000 description 4
- 238000011579 SCID mouse model Methods 0.000 description 4
- 241000282898 Sus scrofa Species 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 4
- DDRJAANPRJIHGJ-UHFFFAOYSA-N creatinine Chemical compound CN1CC(=O)NC1=N DDRJAANPRJIHGJ-UHFFFAOYSA-N 0.000 description 4
- 108010078144 glutaminyl-glycine Proteins 0.000 description 4
- 210000001616 monocyte Anatomy 0.000 description 4
- 238000011580 nude mouse model Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 229960001603 tamoxifen Drugs 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 102100036475 Alanine aminotransferase 1 Human genes 0.000 description 3
- 108010082126 Alanine transaminase Proteins 0.000 description 3
- 108010003415 Aspartate Aminotransferases Proteins 0.000 description 3
- 102000004625 Aspartate Aminotransferases Human genes 0.000 description 3
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 3
- 102000001554 Hemoglobins Human genes 0.000 description 3
- 108010054147 Hemoglobins Proteins 0.000 description 3
- 101000738771 Homo sapiens Receptor-type tyrosine-protein phosphatase C Proteins 0.000 description 3
- 108091092195 Intron Proteins 0.000 description 3
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 3
- DPWGZWUMUUJQDT-IUCAKERBSA-N Leu-Gln-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O DPWGZWUMUUJQDT-IUCAKERBSA-N 0.000 description 3
- QDSKNVXKLPQNOJ-GVXVVHGQSA-N Leu-Gln-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QDSKNVXKLPQNOJ-GVXVVHGQSA-N 0.000 description 3
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 3
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 3
- 208000015914 Non-Hodgkin lymphomas Diseases 0.000 description 3
- 206010035226 Plasma cell myeloma Diseases 0.000 description 3
- 102100037422 Receptor-type tyrosine-protein phosphatase C Human genes 0.000 description 3
- 206010039491 Sarcoma Diseases 0.000 description 3
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 3
- 201000011510 cancer Diseases 0.000 description 3
- 210000001728 clone cell Anatomy 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000000684 flow cytometry Methods 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 230000001506 immunosuppresive effect Effects 0.000 description 3
- 230000005764 inhibitory process Effects 0.000 description 3
- 208000032839 leukemia Diseases 0.000 description 3
- 230000003234 polygenic effect Effects 0.000 description 3
- 108090000765 processed proteins & peptides Proteins 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 108010048818 seryl-histidine Proteins 0.000 description 3
- 238000010186 staining Methods 0.000 description 3
- 208000024891 symptom Diseases 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- 102100022464 5'-nucleotidase Human genes 0.000 description 2
- 208000031261 Acute myeloid leukaemia Diseases 0.000 description 2
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 2
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 2
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 2
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 2
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 2
- 208000031873 Animal Disease Models Diseases 0.000 description 2
- DNUKXVMPARLPFN-XUXIUFHCSA-N Arg-Leu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DNUKXVMPARLPFN-XUXIUFHCSA-N 0.000 description 2
- PZBSKYJGKNNYNK-ULQDDVLXSA-N Arg-Leu-Tyr Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCN=C(N)N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O PZBSKYJGKNNYNK-ULQDDVLXSA-N 0.000 description 2
- BZWRLDPIWKOVKB-ZPFDUUQYSA-N Asn-Leu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BZWRLDPIWKOVKB-ZPFDUUQYSA-N 0.000 description 2
- ORJQQZIXTOYGGH-SRVKXCTJSA-N Asn-Lys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ORJQQZIXTOYGGH-SRVKXCTJSA-N 0.000 description 2
- BYLSYQASFJJBCL-DCAQKATOSA-N Asn-Pro-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BYLSYQASFJJBCL-DCAQKATOSA-N 0.000 description 2
- RPUYTJJZXQBWDT-SRVKXCTJSA-N Asp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N RPUYTJJZXQBWDT-SRVKXCTJSA-N 0.000 description 2
- 108091033409 CRISPR Proteins 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 241000699800 Cricetinae Species 0.000 description 2
- 102000016607 Diphtheria Toxin Human genes 0.000 description 2
- 108010053187 Diphtheria Toxin Proteins 0.000 description 2
- DVLZZEPUNFEUBW-AVGNSLFASA-N Glu-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N DVLZZEPUNFEUBW-AVGNSLFASA-N 0.000 description 2
- UXJHNZODTMHWRD-WHFBIAKZSA-N Gly-Asn-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O UXJHNZODTMHWRD-WHFBIAKZSA-N 0.000 description 2
- WJZLEENECIOOSA-WDSKDSINSA-N Gly-Asn-Gln Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)O WJZLEENECIOOSA-WDSKDSINSA-N 0.000 description 2
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 2
- OOCFXNOVSLSHAB-IUCAKERBSA-N Gly-Pro-Pro Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OOCFXNOVSLSHAB-IUCAKERBSA-N 0.000 description 2
- LVWIJITYHRZHBO-IXOXFDKPSA-N His-Leu-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LVWIJITYHRZHBO-IXOXFDKPSA-N 0.000 description 2
- ALPXXNRQBMRCPZ-MEYUZBJRSA-N His-Thr-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ALPXXNRQBMRCPZ-MEYUZBJRSA-N 0.000 description 2
- 101000678236 Homo sapiens 5'-nucleotidase Proteins 0.000 description 2
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 2
- 108010025815 Kanamycin Kinase Proteins 0.000 description 2
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 2
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 2
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 2
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 2
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 2
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 2
- OHZIZVWQXJPBJS-IXOXFDKPSA-N Leu-His-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OHZIZVWQXJPBJS-IXOXFDKPSA-N 0.000 description 2
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 2
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 2
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 2
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 2
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 2
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 2
- 206010025323 Lymphomas Diseases 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 208000034578 Multiple myelomas Diseases 0.000 description 2
- 101100120552 Mus musculus Foxp3 gene Proteins 0.000 description 2
- 101100399890 Mus musculus Lrrc32 gene Proteins 0.000 description 2
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 2
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 2
- 206010061306 Nasopharyngeal cancer Diseases 0.000 description 2
- 208000012902 Nervous system disease Diseases 0.000 description 2
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 2
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 2
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 2
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 2
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 2
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 2
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 2
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 2
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 2
- 241000121210 Sigmodontinae Species 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 2
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 2
- MVFQLSPDMMFCMW-KKUMJFAQSA-N Tyr-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O MVFQLSPDMMFCMW-KKUMJFAQSA-N 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 2
- 108010081404 acein-2 Proteins 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 210000004102 animal cell Anatomy 0.000 description 2
- 238000011558 animal model by disease Methods 0.000 description 2
- 238000004820 blood count Methods 0.000 description 2
- 210000001185 bone marrow Anatomy 0.000 description 2
- 239000004202 carbamide Substances 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 238000013373 clone screening Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 229940109239 creatinine Drugs 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 208000035475 disorder Diseases 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000001976 enzyme digestion Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 230000005017 genetic modification Effects 0.000 description 2
- 235000013617 genetically modified food Nutrition 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- 210000003714 granulocyte Anatomy 0.000 description 2
- 238000005534 hematocrit Methods 0.000 description 2
- 108010025306 histidylleucine Proteins 0.000 description 2
- 238000007912 intraperitoneal administration Methods 0.000 description 2
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 210000004698 lymphocyte Anatomy 0.000 description 2
- 210000002540 macrophage Anatomy 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 238000010172 mouse model Methods 0.000 description 2
- 210000000822 natural killer cell Anatomy 0.000 description 2
- 239000002547 new drug Substances 0.000 description 2
- 210000003101 oviduct Anatomy 0.000 description 2
- 230000000149 penetrating effect Effects 0.000 description 2
- 230000035479 physiological effects, processes and functions Effects 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- 108010031719 prolyl-serine Proteins 0.000 description 2
- 108010004914 prolylarginine Proteins 0.000 description 2
- 108010029020 prolylglycine Proteins 0.000 description 2
- 108700019620 rat Foxp3 Proteins 0.000 description 2
- 238000010839 reverse transcription Methods 0.000 description 2
- 230000019491 signal transduction Effects 0.000 description 2
- 210000001082 somatic cell Anatomy 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- UFTFJSFQGQCHQW-UHFFFAOYSA-N triformin Chemical compound O=COCC(OC=O)COC=O UFTFJSFQGQCHQW-UHFFFAOYSA-N 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 1
- NHBKXEKEPDILRR-UHFFFAOYSA-N 2,3-bis(butanoylsulfanyl)propyl butanoate Chemical compound CCCC(=O)OCC(SC(=O)CCC)CSC(=O)CCC NHBKXEKEPDILRR-UHFFFAOYSA-N 0.000 description 1
- 208000024893 Acute lymphoblastic leukemia Diseases 0.000 description 1
- 208000014697 Acute lymphocytic leukaemia Diseases 0.000 description 1
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 1
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 1
- FBHOPGDGELNWRH-DRZSPHRISA-N Ala-Glu-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FBHOPGDGELNWRH-DRZSPHRISA-N 0.000 description 1
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 1
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- IVKWMMGFLAMMKJ-XVYDVKMFSA-N Ala-His-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N IVKWMMGFLAMMKJ-XVYDVKMFSA-N 0.000 description 1
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 1
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 1
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 1
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 1
- CNQAFFMNJIQYGX-DRZSPHRISA-N Ala-Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 CNQAFFMNJIQYGX-DRZSPHRISA-N 0.000 description 1
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 1
- YXXPVUOMPSZURS-ZLIFDBKOSA-N Ala-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@H](C)N)=CNC2=C1 YXXPVUOMPSZURS-ZLIFDBKOSA-N 0.000 description 1
- SFPRJVVDZNLUTG-OWLDWWDNSA-N Ala-Trp-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFPRJVVDZNLUTG-OWLDWWDNSA-N 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- 201000003076 Angiosarcoma Diseases 0.000 description 1
- DCGLNNVKIZXQOJ-FXQIFTODSA-N Arg-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DCGLNNVKIZXQOJ-FXQIFTODSA-N 0.000 description 1
- USNSOPDIZILSJP-FXQIFTODSA-N Arg-Asn-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O USNSOPDIZILSJP-FXQIFTODSA-N 0.000 description 1
- RWWPBOUMKFBHAL-FXQIFTODSA-N Arg-Asn-Cys Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(O)=O RWWPBOUMKFBHAL-FXQIFTODSA-N 0.000 description 1
- RRGPUNYIPJXJBU-GUBZILKMSA-N Arg-Asp-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O RRGPUNYIPJXJBU-GUBZILKMSA-N 0.000 description 1
- IYMAXBFPHPZYIK-BQBZGAKWSA-N Arg-Gly-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IYMAXBFPHPZYIK-BQBZGAKWSA-N 0.000 description 1
- NVCIXQYNWYTLDO-IHRRRGAJSA-N Arg-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N NVCIXQYNWYTLDO-IHRRRGAJSA-N 0.000 description 1
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 1
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 1
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 1
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 1
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 1
- GSUFZRURORXYTM-STQMWFEESA-N Arg-Phe-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 GSUFZRURORXYTM-STQMWFEESA-N 0.000 description 1
- UGZUVYDKAYNCII-ULQDDVLXSA-N Arg-Phe-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UGZUVYDKAYNCII-ULQDDVLXSA-N 0.000 description 1
- XSPKAHFVDKRGRL-DCAQKATOSA-N Arg-Pro-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XSPKAHFVDKRGRL-DCAQKATOSA-N 0.000 description 1
- JPAWCMXVNZPJLO-IHRRRGAJSA-N Arg-Ser-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JPAWCMXVNZPJLO-IHRRRGAJSA-N 0.000 description 1
- QTAIIXQCOPUNBQ-QXEWZRGKSA-N Arg-Val-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QTAIIXQCOPUNBQ-QXEWZRGKSA-N 0.000 description 1
- QLSRIZIDQXDQHK-RCWTZXSCSA-N Arg-Val-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QLSRIZIDQXDQHK-RCWTZXSCSA-N 0.000 description 1
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 1
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 1
- JEPNYDRDYNSFIU-QXEWZRGKSA-N Asn-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(N)=O)C(O)=O JEPNYDRDYNSFIU-QXEWZRGKSA-N 0.000 description 1
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 1
- ZPMNECSEJXXNBE-CIUDSAMLSA-N Asn-Cys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ZPMNECSEJXXNBE-CIUDSAMLSA-N 0.000 description 1
- PQAIOUVVZCOLJK-FXQIFTODSA-N Asn-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PQAIOUVVZCOLJK-FXQIFTODSA-N 0.000 description 1
- UPALZCBCKAMGIY-PEFMBERDSA-N Asn-Gln-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UPALZCBCKAMGIY-PEFMBERDSA-N 0.000 description 1
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 1
- PTSDPWIHOYMRGR-UGYAYLCHSA-N Asn-Ile-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O PTSDPWIHOYMRGR-UGYAYLCHSA-N 0.000 description 1
- HFPXZWPUVFVNLL-GUBZILKMSA-N Asn-Leu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFPXZWPUVFVNLL-GUBZILKMSA-N 0.000 description 1
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 1
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 1
- GMUOCGCDOYYWPD-FXQIFTODSA-N Asn-Pro-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O GMUOCGCDOYYWPD-FXQIFTODSA-N 0.000 description 1
- NPZJLGMWMDNQDD-GHCJXIJMSA-N Asn-Ser-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NPZJLGMWMDNQDD-GHCJXIJMSA-N 0.000 description 1
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 1
- CBHVAFXKOYAHOY-NHCYSSNCSA-N Asn-Val-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O CBHVAFXKOYAHOY-NHCYSSNCSA-N 0.000 description 1
- KVMPVNGOKHTUHZ-GCJQMDKQSA-N Asp-Ala-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KVMPVNGOKHTUHZ-GCJQMDKQSA-N 0.000 description 1
- ZELQAFZSJOBEQS-ACZMJKKPSA-N Asp-Asn-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZELQAFZSJOBEQS-ACZMJKKPSA-N 0.000 description 1
- UWOPETAWXDZUJR-ACZMJKKPSA-N Asp-Cys-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O UWOPETAWXDZUJR-ACZMJKKPSA-N 0.000 description 1
- ZEDBMCPXPIYJLW-XHNCKOQMSA-N Asp-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O ZEDBMCPXPIYJLW-XHNCKOQMSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- OEDJQRXNDRUGEU-SRVKXCTJSA-N Asp-Leu-His Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O OEDJQRXNDRUGEU-SRVKXCTJSA-N 0.000 description 1
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 1
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 1
- 206010003571 Astrocytoma Diseases 0.000 description 1
- 206010003591 Ataxia Diseases 0.000 description 1
- 208000036170 B-Cell Marginal Zone Lymphoma Diseases 0.000 description 1
- 208000025324 B-cell acute lymphoblastic leukemia Diseases 0.000 description 1
- 208000010839 B-cell chronic lymphocytic leukemia Diseases 0.000 description 1
- 208000003950 B-cell lymphoma Diseases 0.000 description 1
- 208000032791 BCR-ABL1 positive chronic myelogenous leukemia Diseases 0.000 description 1
- 206010004593 Bile duct cancer Diseases 0.000 description 1
- 206010005003 Bladder cancer Diseases 0.000 description 1
- 206010005949 Bone cancer Diseases 0.000 description 1
- 208000018084 Bone neoplasm Diseases 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 238000011752 CBA/J (JAX™ mouse strain) Methods 0.000 description 1
- 210000001266 CD8-positive T-lymphocyte Anatomy 0.000 description 1
- 208000016057 CHAND syndrome Diseases 0.000 description 1
- 238000010354 CRISPR gene editing Methods 0.000 description 1
- 208000031229 Cardiomyopathies Diseases 0.000 description 1
- 208000005243 Chondrosarcoma Diseases 0.000 description 1
- 208000010833 Chronic myeloid leukaemia Diseases 0.000 description 1
- 206010009900 Colitis ulcerative Diseases 0.000 description 1
- 208000002330 Congenital Heart Defects Diseases 0.000 description 1
- CPTUXCUWQIBZIF-ZLUOBGJFSA-N Cys-Asn-Ser Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CPTUXCUWQIBZIF-ZLUOBGJFSA-N 0.000 description 1
- MUZAUPFGPMMZSS-GUBZILKMSA-N Cys-Glu-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N MUZAUPFGPMMZSS-GUBZILKMSA-N 0.000 description 1
- BSFFNUBDVYTDMV-WHFBIAKZSA-N Cys-Gly-Asn Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BSFFNUBDVYTDMV-WHFBIAKZSA-N 0.000 description 1
- DZLQXIFVQFTFJY-BYPYZUCNSA-N Cys-Gly-Gly Chemical compound SC[C@H](N)C(=O)NCC(=O)NCC(O)=O DZLQXIFVQFTFJY-BYPYZUCNSA-N 0.000 description 1
- SBDVXRYCOIEYNV-YUMQZZPRSA-N Cys-His-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N SBDVXRYCOIEYNV-YUMQZZPRSA-N 0.000 description 1
- VFGADOJXRLWTBU-JBDRJPRFSA-N Cys-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N VFGADOJXRLWTBU-JBDRJPRFSA-N 0.000 description 1
- VTBGVPWSWJBERH-DCAQKATOSA-N Cys-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CS)N VTBGVPWSWJBERH-DCAQKATOSA-N 0.000 description 1
- OHLLDUNVMPPUMD-DCAQKATOSA-N Cys-Leu-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N OHLLDUNVMPPUMD-DCAQKATOSA-N 0.000 description 1
- LBSKYJOZIIOZIO-DCAQKATOSA-N Cys-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N LBSKYJOZIIOZIO-DCAQKATOSA-N 0.000 description 1
- RESAHOSBQHMOKH-KKUMJFAQSA-N Cys-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CS)N RESAHOSBQHMOKH-KKUMJFAQSA-N 0.000 description 1
- FCXJJTRGVAZDER-FXQIFTODSA-N Cys-Val-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O FCXJJTRGVAZDER-FXQIFTODSA-N 0.000 description 1
- 238000011765 DBA/2 mouse Methods 0.000 description 1
- 206010051055 Deep vein thrombosis Diseases 0.000 description 1
- 206010014733 Endometrial cancer Diseases 0.000 description 1
- 206010014759 Endometrial neoplasm Diseases 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 101710088235 Envelope glycoprotein C homolog Proteins 0.000 description 1
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 1
- 206010015548 Euthanasia Diseases 0.000 description 1
- 208000006168 Ewing Sarcoma Diseases 0.000 description 1
- 102100027280 Fanconi anemia group A protein Human genes 0.000 description 1
- 201000008808 Fibrosarcoma Diseases 0.000 description 1
- 241000699694 Gerbillinae Species 0.000 description 1
- NNQHEEQNPQYPGL-FXQIFTODSA-N Gln-Ala-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NNQHEEQNPQYPGL-FXQIFTODSA-N 0.000 description 1
- HHWQMFIGMMOVFK-WDSKDSINSA-N Gln-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O HHWQMFIGMMOVFK-WDSKDSINSA-N 0.000 description 1
- KWUSGAIFNHQCBY-DCAQKATOSA-N Gln-Arg-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O KWUSGAIFNHQCBY-DCAQKATOSA-N 0.000 description 1
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 1
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 1
- WLODHVXYKYHLJD-ACZMJKKPSA-N Gln-Asp-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N WLODHVXYKYHLJD-ACZMJKKPSA-N 0.000 description 1
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 1
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 1
- XKBASPWPBXNVLQ-WDSKDSINSA-N Gln-Gly-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XKBASPWPBXNVLQ-WDSKDSINSA-N 0.000 description 1
- QBLMTCRYYTVUQY-GUBZILKMSA-N Gln-Leu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QBLMTCRYYTVUQY-GUBZILKMSA-N 0.000 description 1
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 1
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 1
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 1
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 1
- PAOHIZNRJNIXQY-XQXXSGGOSA-N Gln-Thr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PAOHIZNRJNIXQY-XQXXSGGOSA-N 0.000 description 1
- VCUNGPMMPNJSGS-JYJNAYRXSA-N Gln-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O VCUNGPMMPNJSGS-JYJNAYRXSA-N 0.000 description 1
- VDMABHYXBULDGN-LAEOZQHASA-N Gln-Val-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O VDMABHYXBULDGN-LAEOZQHASA-N 0.000 description 1
- VEYGCDYMOXHJLS-GVXVVHGQSA-N Gln-Val-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VEYGCDYMOXHJLS-GVXVVHGQSA-N 0.000 description 1
- VYOILACOFPPNQH-UMNHJUIQSA-N Gln-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N VYOILACOFPPNQH-UMNHJUIQSA-N 0.000 description 1
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 1
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 1
- ATRHMOJQJWPVBQ-DRZSPHRISA-N Glu-Ala-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ATRHMOJQJWPVBQ-DRZSPHRISA-N 0.000 description 1
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 1
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 1
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 1
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 1
- HTTSBEBKVNEDFE-AUTRQRHGSA-N Glu-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N HTTSBEBKVNEDFE-AUTRQRHGSA-N 0.000 description 1
- GGJOGFJIPPGNRK-JSGCOSHPSA-N Glu-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)N)C(O)=O)=CNC2=C1 GGJOGFJIPPGNRK-JSGCOSHPSA-N 0.000 description 1
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 1
- ZHNHJYYFCGUZNQ-KBIXCLLPSA-N Glu-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O ZHNHJYYFCGUZNQ-KBIXCLLPSA-N 0.000 description 1
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 1
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 1
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 1
- UMZHHILWZBFPGL-LOKLDPHHSA-N Glu-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O UMZHHILWZBFPGL-LOKLDPHHSA-N 0.000 description 1
- MXJYXYDREQWUMS-XKBZYTNZSA-N Glu-Thr-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O MXJYXYDREQWUMS-XKBZYTNZSA-N 0.000 description 1
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- MZZSCEANQDPJER-ONGXEEELSA-N Gly-Ala-Phe Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MZZSCEANQDPJER-ONGXEEELSA-N 0.000 description 1
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 1
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 1
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 1
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 1
- PEZZSFLFXXFUQD-XPUUQOCRSA-N Gly-Cys-Val Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O PEZZSFLFXXFUQD-XPUUQOCRSA-N 0.000 description 1
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 1
- DENRBIYENOKSEX-PEXQALLHSA-N Gly-Ile-His Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 DENRBIYENOKSEX-PEXQALLHSA-N 0.000 description 1
- BHPQOIPBLYJNAW-NGZCFLSTSA-N Gly-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN BHPQOIPBLYJNAW-NGZCFLSTSA-N 0.000 description 1
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 1
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- DBJYVKDPGIFXFO-BQBZGAKWSA-N Gly-Met-Ala Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O DBJYVKDPGIFXFO-BQBZGAKWSA-N 0.000 description 1
- QAMMIGULQSIRCD-IRXDYDNUSA-N Gly-Phe-Tyr Chemical compound C([C@H](NC(=O)C[NH3+])C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C([O-])=O)C1=CC=CC=C1 QAMMIGULQSIRCD-IRXDYDNUSA-N 0.000 description 1
- SFOXOSKVTLDEDM-HOTGVXAUSA-N Gly-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)CN)=CNC2=C1 SFOXOSKVTLDEDM-HOTGVXAUSA-N 0.000 description 1
- 206010019280 Heart failures Diseases 0.000 description 1
- 208000001258 Hemangiosarcoma Diseases 0.000 description 1
- 208000035186 Hemolytic Autoimmune Anemia Diseases 0.000 description 1
- 208000027761 Hepatic autoimmune disease Diseases 0.000 description 1
- HTZKFIYQMHJWSQ-INTQDDNPSA-N His-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HTZKFIYQMHJWSQ-INTQDDNPSA-N 0.000 description 1
- MAABHGXCIBEYQR-XVYDVKMFSA-N His-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N MAABHGXCIBEYQR-XVYDVKMFSA-N 0.000 description 1
- QZAFGJNKLMNDEM-DCAQKATOSA-N His-Asn-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CN=CN1 QZAFGJNKLMNDEM-DCAQKATOSA-N 0.000 description 1
- FYVHHKMHFPMBBG-GUBZILKMSA-N His-Gln-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N FYVHHKMHFPMBBG-GUBZILKMSA-N 0.000 description 1
- HVCRQRQPIIRNLY-IUCAKERBSA-N His-Gln-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N HVCRQRQPIIRNLY-IUCAKERBSA-N 0.000 description 1
- VBOFRJNDIOPNDO-YUMQZZPRSA-N His-Gly-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N VBOFRJNDIOPNDO-YUMQZZPRSA-N 0.000 description 1
- JENKOCSDMSVWPY-SRVKXCTJSA-N His-Leu-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JENKOCSDMSVWPY-SRVKXCTJSA-N 0.000 description 1
- VFBZWZXKCVBTJR-SRVKXCTJSA-N His-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VFBZWZXKCVBTJR-SRVKXCTJSA-N 0.000 description 1
- SKOKHBGDXGTDDP-MELADBBJSA-N His-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N SKOKHBGDXGTDDP-MELADBBJSA-N 0.000 description 1
- ULRFSEJGSHYLQI-YESZJQIVSA-N His-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CN=CN3)N)C(=O)O ULRFSEJGSHYLQI-YESZJQIVSA-N 0.000 description 1
- UPJODPVSKKWGDQ-KLHWPWHYSA-N His-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O UPJODPVSKKWGDQ-KLHWPWHYSA-N 0.000 description 1
- WYKXJGWSJUULSL-AVGNSLFASA-N His-Val-Arg Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)Cc1cnc[nH]1)C(=O)N[C@@H](CCCNC(=N)N)C(=O)O WYKXJGWSJUULSL-AVGNSLFASA-N 0.000 description 1
- 208000017604 Hodgkin disease Diseases 0.000 description 1
- 208000021519 Hodgkin lymphoma Diseases 0.000 description 1
- 208000010747 Hodgkins lymphoma Diseases 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000914673 Homo sapiens Fanconi anemia group A protein Proteins 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- 206010020850 Hyperthyroidism Diseases 0.000 description 1
- 206010021245 Idiopathic thrombocytopenic purpura Diseases 0.000 description 1
- SJIGTGZVQGLMGG-NAKRPEOUSA-N Ile-Cys-Arg Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)O SJIGTGZVQGLMGG-NAKRPEOUSA-N 0.000 description 1
- ZDNORQNHCJUVOV-KBIXCLLPSA-N Ile-Gln-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O ZDNORQNHCJUVOV-KBIXCLLPSA-N 0.000 description 1
- WZDCVAWMBUNDDY-KBIXCLLPSA-N Ile-Glu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C)C(=O)O)N WZDCVAWMBUNDDY-KBIXCLLPSA-N 0.000 description 1
- KIMHKBDJQQYLHU-PEFMBERDSA-N Ile-Glu-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KIMHKBDJQQYLHU-PEFMBERDSA-N 0.000 description 1
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 1
- DSDPLOODKXISDT-XUXIUFHCSA-N Ile-Leu-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DSDPLOODKXISDT-XUXIUFHCSA-N 0.000 description 1
- OWSWUWDMSNXTNE-GMOBBJLQSA-N Ile-Pro-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N OWSWUWDMSNXTNE-GMOBBJLQSA-N 0.000 description 1
- JZNVOBUNTWNZPW-GHCJXIJMSA-N Ile-Ser-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N JZNVOBUNTWNZPW-GHCJXIJMSA-N 0.000 description 1
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 1
- 206010062016 Immunosuppression Diseases 0.000 description 1
- 102100022337 Integrin alpha-V Human genes 0.000 description 1
- 108010040765 Integrin alphaV Proteins 0.000 description 1
- 208000008839 Kidney Neoplasms Diseases 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- 102220470475 L-seryl-tRNA(Sec) kinase_C57L_mutation Human genes 0.000 description 1
- 208000031671 Large B-Cell Diffuse Lymphoma Diseases 0.000 description 1
- 208000018142 Leiomyosarcoma Diseases 0.000 description 1
- 206010024229 Leprosy Diseases 0.000 description 1
- DQPQTXMIRBUWKO-DCAQKATOSA-N Leu-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(C)C)N DQPQTXMIRBUWKO-DCAQKATOSA-N 0.000 description 1
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 1
- JUWJEAPUNARGCF-DCAQKATOSA-N Leu-Arg-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JUWJEAPUNARGCF-DCAQKATOSA-N 0.000 description 1
- REPPKAMYTOJTFC-DCAQKATOSA-N Leu-Arg-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O REPPKAMYTOJTFC-DCAQKATOSA-N 0.000 description 1
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 1
- RIMMMMYKGIBOSN-DCAQKATOSA-N Leu-Asn-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O RIMMMMYKGIBOSN-DCAQKATOSA-N 0.000 description 1
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 1
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 1
- ZYLJULGXQDNXDK-GUBZILKMSA-N Leu-Gln-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ZYLJULGXQDNXDK-GUBZILKMSA-N 0.000 description 1
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 1
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 1
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 1
- IWTBYNQNAPECCS-AVGNSLFASA-N Leu-Glu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IWTBYNQNAPECCS-AVGNSLFASA-N 0.000 description 1
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 1
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 1
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 1
- BKTXKJMNTSMJDQ-AVGNSLFASA-N Leu-His-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BKTXKJMNTSMJDQ-AVGNSLFASA-N 0.000 description 1
- XBCWOTOCBXXJDG-BZSNNMDCSA-N Leu-His-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 XBCWOTOCBXXJDG-BZSNNMDCSA-N 0.000 description 1
- OYQUOLRTJHWVSQ-SRVKXCTJSA-N Leu-His-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O OYQUOLRTJHWVSQ-SRVKXCTJSA-N 0.000 description 1
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 1
- ORWTWZXGDBYVCP-BJDJZHNGSA-N Leu-Ile-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(C)C ORWTWZXGDBYVCP-BJDJZHNGSA-N 0.000 description 1
- SEMUSFOBZGKBGW-YTFOTSKYSA-N Leu-Ile-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SEMUSFOBZGKBGW-YTFOTSKYSA-N 0.000 description 1
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 1
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 1
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 1
- WXZOHBVPVKABQN-DCAQKATOSA-N Leu-Met-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WXZOHBVPVKABQN-DCAQKATOSA-N 0.000 description 1
- NJMXCOOEFLMZSR-AVGNSLFASA-N Leu-Met-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O NJMXCOOEFLMZSR-AVGNSLFASA-N 0.000 description 1
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 1
- QMKFDEUJGYNFMC-AVGNSLFASA-N Leu-Pro-Arg Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QMKFDEUJGYNFMC-AVGNSLFASA-N 0.000 description 1
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 1
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 1
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 1
- UCXQIIIFOOGYEM-ULQDDVLXSA-N Leu-Pro-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCXQIIIFOOGYEM-ULQDDVLXSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- KIZIOFNVSOSKJI-CIUDSAMLSA-N Leu-Ser-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N KIZIOFNVSOSKJI-CIUDSAMLSA-N 0.000 description 1
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 1
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 1
- LINKCQUOMUDLKN-KATARQTJSA-N Leu-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(C)C)N)O LINKCQUOMUDLKN-KATARQTJSA-N 0.000 description 1
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 1
- FGZVGOAAROXFAB-IXOXFDKPSA-N Leu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N)O FGZVGOAAROXFAB-IXOXFDKPSA-N 0.000 description 1
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 1
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 1
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 1
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 1
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 1
- 208000031422 Lymphocytic Chronic B-Cell Leukemia Diseases 0.000 description 1
- LZWNAOIMTLNMDW-NHCYSSNCSA-N Lys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N LZWNAOIMTLNMDW-NHCYSSNCSA-N 0.000 description 1
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 1
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 1
- 208000025205 Mantle-Cell Lymphoma Diseases 0.000 description 1
- XMMWDTUFTZMQFD-GMOBBJLQSA-N Met-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCSC XMMWDTUFTZMQFD-GMOBBJLQSA-N 0.000 description 1
- UZWMJZSOXGOVIN-LURJTMIESA-N Met-Gly-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(=O)NCC(O)=O UZWMJZSOXGOVIN-LURJTMIESA-N 0.000 description 1
- PZUUMQPMHBJJKE-AVGNSLFASA-N Met-Leu-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCNC(N)=N PZUUMQPMHBJJKE-AVGNSLFASA-N 0.000 description 1
- 101100519207 Mus musculus Pdcd1 gene Proteins 0.000 description 1
- 241000699669 Mus saxicola Species 0.000 description 1
- 201000003793 Myelodysplastic syndrome Diseases 0.000 description 1
- 208000033761 Myelogenous Chronic BCR-ABL Positive Leukemia Diseases 0.000 description 1
- 208000033776 Myeloid Acute Leukemia Diseases 0.000 description 1
- 208000009525 Myocarditis Diseases 0.000 description 1
- 206010068871 Myotonic dystrophy Diseases 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 1
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 1
- 208000002454 Nasopharyngeal Carcinoma Diseases 0.000 description 1
- 208000001894 Nasopharyngeal Neoplasms Diseases 0.000 description 1
- 208000025966 Neurological disease Diseases 0.000 description 1
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 1
- 206010033128 Ovarian cancer Diseases 0.000 description 1
- 206010061535 Ovarian neoplasm Diseases 0.000 description 1
- 238000002944 PCR assay Methods 0.000 description 1
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 1
- 208000018262 Peripheral vascular disease Diseases 0.000 description 1
- UHRNIXJAGGLKHP-DLOVCJGASA-N Phe-Ala-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O UHRNIXJAGGLKHP-DLOVCJGASA-N 0.000 description 1
- VLZGUAUYZGQKPM-DRZSPHRISA-N Phe-Gln-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VLZGUAUYZGQKPM-DRZSPHRISA-N 0.000 description 1
- KAGCQPSEVAETCA-JYJNAYRXSA-N Phe-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N KAGCQPSEVAETCA-JYJNAYRXSA-N 0.000 description 1
- NKLDZIPTGKBDBB-HTUGSXCWSA-N Phe-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N)O NKLDZIPTGKBDBB-HTUGSXCWSA-N 0.000 description 1
- FIRWJEJVFFGXSH-RYUDHWBXSA-N Phe-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 FIRWJEJVFFGXSH-RYUDHWBXSA-N 0.000 description 1
- RGZYXNFHYRFNNS-MXAVVETBSA-N Phe-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RGZYXNFHYRFNNS-MXAVVETBSA-N 0.000 description 1
- DVOCGBNHAUHKHJ-DKIMLUQUSA-N Phe-Ile-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O DVOCGBNHAUHKHJ-DKIMLUQUSA-N 0.000 description 1
- KBVJZCVLQWCJQN-KKUMJFAQSA-N Phe-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KBVJZCVLQWCJQN-KKUMJFAQSA-N 0.000 description 1
- RSPUIENXSJYZQO-JYJNAYRXSA-N Phe-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RSPUIENXSJYZQO-JYJNAYRXSA-N 0.000 description 1
- BPCLGWHVPVTTFM-QWRGUYRKSA-N Phe-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O BPCLGWHVPVTTFM-QWRGUYRKSA-N 0.000 description 1
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 1
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 1
- MHNBYYFXWDUGBW-RPTUDFQQSA-N Phe-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O MHNBYYFXWDUGBW-RPTUDFQQSA-N 0.000 description 1
- 208000006664 Precursor Cell Lymphoblastic Leukemia-Lymphoma Diseases 0.000 description 1
- IWNOFCGBMSFTBC-CIUDSAMLSA-N Pro-Ala-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IWNOFCGBMSFTBC-CIUDSAMLSA-N 0.000 description 1
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 1
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 1
- BNBBNGZZKQUWCD-IUCAKERBSA-N Pro-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 BNBBNGZZKQUWCD-IUCAKERBSA-N 0.000 description 1
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 1
- SFECXGVELZFBFJ-VEVYYDQMSA-N Pro-Asp-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFECXGVELZFBFJ-VEVYYDQMSA-N 0.000 description 1
- AIZVVCMAFRREQS-GUBZILKMSA-N Pro-Cys-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AIZVVCMAFRREQS-GUBZILKMSA-N 0.000 description 1
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 1
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 1
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 1
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 1
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 1
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 1
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 1
- QKWYXRPICJEQAJ-KJEVXHAQSA-N Pro-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@@H]2CCCN2)O QKWYXRPICJEQAJ-KJEVXHAQSA-N 0.000 description 1
- 208000028872 Progressive muscular dystrophy Diseases 0.000 description 1
- 206010060862 Prostate cancer Diseases 0.000 description 1
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 1
- 208000010378 Pulmonary Embolism Diseases 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 208000015634 Rectal Neoplasms Diseases 0.000 description 1
- 206010038389 Renal cancer Diseases 0.000 description 1
- 206010039710 Scleroderma Diseases 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 1
- IYCBDVBJWDXQRR-FXQIFTODSA-N Ser-Ala-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O IYCBDVBJWDXQRR-FXQIFTODSA-N 0.000 description 1
- FCRMLGJMPXCAHD-FXQIFTODSA-N Ser-Arg-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O FCRMLGJMPXCAHD-FXQIFTODSA-N 0.000 description 1
- OOKCGAYXSNJBGQ-ZLUOBGJFSA-N Ser-Asn-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OOKCGAYXSNJBGQ-ZLUOBGJFSA-N 0.000 description 1
- TYYBJUYSTWJHGO-ZKWXMUAHSA-N Ser-Asn-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TYYBJUYSTWJHGO-ZKWXMUAHSA-N 0.000 description 1
- SNNSYBWPPVAXQW-ZLUOBGJFSA-N Ser-Cys-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N)O SNNSYBWPPVAXQW-ZLUOBGJFSA-N 0.000 description 1
- ZOHGLPQGEHSLPD-FXQIFTODSA-N Ser-Gln-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZOHGLPQGEHSLPD-FXQIFTODSA-N 0.000 description 1
- BQWCDDAISCPDQV-XHNCKOQMSA-N Ser-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N)C(=O)O BQWCDDAISCPDQV-XHNCKOQMSA-N 0.000 description 1
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 1
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 1
- RJHJPZQOMKCSTP-CIUDSAMLSA-N Ser-His-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O RJHJPZQOMKCSTP-CIUDSAMLSA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- IAORETPTUDBBGV-CIUDSAMLSA-N Ser-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N IAORETPTUDBBGV-CIUDSAMLSA-N 0.000 description 1
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 1
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- VXYQOFXBIXKPCX-BQBZGAKWSA-N Ser-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N VXYQOFXBIXKPCX-BQBZGAKWSA-N 0.000 description 1
- MQUZANJDFOQOBX-SRVKXCTJSA-N Ser-Phe-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O MQUZANJDFOQOBX-SRVKXCTJSA-N 0.000 description 1
- XQAPEISNMXNKGE-FXQIFTODSA-N Ser-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CS)C(=O)O XQAPEISNMXNKGE-FXQIFTODSA-N 0.000 description 1
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 1
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 1
- QNBVFKZSSRYNFX-CUJWVEQBSA-N Ser-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N)O QNBVFKZSSRYNFX-CUJWVEQBSA-N 0.000 description 1
- PQEQXWRVHQAAKS-SRVKXCTJSA-N Ser-Tyr-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CC=C(O)C=C1 PQEQXWRVHQAAKS-SRVKXCTJSA-N 0.000 description 1
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 1
- 108010071390 Serum Albumin Proteins 0.000 description 1
- 102000007562 Serum Albumin Human genes 0.000 description 1
- 108020004688 Small Nuclear RNA Proteins 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 208000021712 Soft tissue sarcoma Diseases 0.000 description 1
- 208000027520 Somatoform disease Diseases 0.000 description 1
- 208000005718 Stomach Neoplasms Diseases 0.000 description 1
- 108091027544 Subgenomic mRNA Proteins 0.000 description 1
- 208000029052 T-cell acute lymphoblastic leukemia Diseases 0.000 description 1
- 206010042971 T-cell lymphoma Diseases 0.000 description 1
- 208000027585 T-cell non-Hodgkin lymphoma Diseases 0.000 description 1
- 238000010459 TALEN Methods 0.000 description 1
- 208000024313 Testicular Neoplasms Diseases 0.000 description 1
- 206010057644 Testis cancer Diseases 0.000 description 1
- WLDUCKSCDRIVLJ-NUMRIWBASA-N Thr-Gln-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O WLDUCKSCDRIVLJ-NUMRIWBASA-N 0.000 description 1
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 1
- AYCQVUUPIJHJTA-IXOXFDKPSA-N Thr-His-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O AYCQVUUPIJHJTA-IXOXFDKPSA-N 0.000 description 1
- XIULAFZYEKSGAJ-IXOXFDKPSA-N Thr-Leu-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 XIULAFZYEKSGAJ-IXOXFDKPSA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 1
- NZRUWPIYECBYRK-HTUGSXCWSA-N Thr-Phe-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O NZRUWPIYECBYRK-HTUGSXCWSA-N 0.000 description 1
- BKIOKSLLAAZYTC-KKHAAJSZSA-N Thr-Val-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O BKIOKSLLAAZYTC-KKHAAJSZSA-N 0.000 description 1
- 208000031981 Thrombocytopenic Idiopathic Purpura Diseases 0.000 description 1
- 208000024770 Thyroid neoplasm Diseases 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- IJRXQJVGFBSKIV-ZFWWWQNUSA-N Trp-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N IJRXQJVGFBSKIV-ZFWWWQNUSA-N 0.000 description 1
- CXPJPTFWKXNDKV-NUTKFTJISA-N Trp-Leu-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 CXPJPTFWKXNDKV-NUTKFTJISA-N 0.000 description 1
- OGZRZMJASKKMJZ-XIRDDKMYSA-N Trp-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N OGZRZMJASKKMJZ-XIRDDKMYSA-N 0.000 description 1
- SUEGAFMNTXXNLR-WFBYXXMGSA-N Trp-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O SUEGAFMNTXXNLR-WFBYXXMGSA-N 0.000 description 1
- JTMZSIRTZKLBOA-NWLDYVSISA-N Trp-Thr-Gln Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O JTMZSIRTZKLBOA-NWLDYVSISA-N 0.000 description 1
- 108091005906 Type I transmembrane proteins Proteins 0.000 description 1
- PEVVXUGSAKEPEN-AVGNSLFASA-N Tyr-Asn-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PEVVXUGSAKEPEN-AVGNSLFASA-N 0.000 description 1
- JAGGEZACYAAMIL-CQDKDKBSSA-N Tyr-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JAGGEZACYAAMIL-CQDKDKBSSA-N 0.000 description 1
- LDKDSFQSEUOCOO-RPTUDFQQSA-N Tyr-Thr-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LDKDSFQSEUOCOO-RPTUDFQQSA-N 0.000 description 1
- 201000006704 Ulcerative Colitis Diseases 0.000 description 1
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 1
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 1
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 1
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 1
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 1
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 1
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 1
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 1
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 1
- UZFNHAXYMICTBU-DZKIICNBSA-N Val-Phe-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UZFNHAXYMICTBU-DZKIICNBSA-N 0.000 description 1
- VCIYTVOBLZHFSC-XHSDSOJGSA-N Val-Phe-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N VCIYTVOBLZHFSC-XHSDSOJGSA-N 0.000 description 1
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 1
- JQTYTBPCSOAZHI-FXQIFTODSA-N Val-Ser-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N JQTYTBPCSOAZHI-FXQIFTODSA-N 0.000 description 1
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 1
- 206010047249 Venous thrombosis Diseases 0.000 description 1
- 208000033559 Waldenström macroglobulinemia Diseases 0.000 description 1
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 1
- 230000001154 acute effect Effects 0.000 description 1
- 208000038016 acute inflammation Diseases 0.000 description 1
- 230000006022 acute inflammation Effects 0.000 description 1
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 108010047495 alanylglycine Proteins 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 208000026935 allergic disease Diseases 0.000 description 1
- 230000007815 allergy Effects 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 229940024606 amino acid Drugs 0.000 description 1
- 235000001014 amino acid Nutrition 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 229940125644 antibody drug Drugs 0.000 description 1
- 102000025171 antigen binding proteins Human genes 0.000 description 1
- 108091000831 antigen binding proteins Proteins 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 description 1
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 1
- 108010089442 arginyl-leucyl-alanyl-arginine Proteins 0.000 description 1
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 1
- 108010077245 asparaginyl-proline Proteins 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 108010092854 aspartyllysine Proteins 0.000 description 1
- 208000006673 asthma Diseases 0.000 description 1
- 201000000448 autoimmune hemolytic anemia Diseases 0.000 description 1
- 201000003710 autoimmune thrombocytopenic purpura Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 208000026900 bile duct neoplasm Diseases 0.000 description 1
- 102000023732 binding proteins Human genes 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 238000010876 biochemical test Methods 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 230000036772 blood pressure Effects 0.000 description 1
- 238000009534 blood test Methods 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 208000006990 cholangiocarcinoma Diseases 0.000 description 1
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 1
- 208000037976 chronic inflammation Diseases 0.000 description 1
- 230000006020 chronic inflammation Effects 0.000 description 1
- 208000032852 chronic lymphocytic leukemia Diseases 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000013377 clone selection method Methods 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 208000028831 congenital heart disease Diseases 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 208000029078 coronary artery disease Diseases 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 230000001461 cytolytic effect Effects 0.000 description 1
- 230000003412 degenerative effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 206010012818 diffuse large B-cell lymphoma Diseases 0.000 description 1
- 238000009509 drug development Methods 0.000 description 1
- 238000007877 drug screening Methods 0.000 description 1
- 238000002651 drug therapy Methods 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 201000004101 esophageal cancer Diseases 0.000 description 1
- 201000003444 follicular lymphoma Diseases 0.000 description 1
- 235000012631 food intake Nutrition 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 1
- 206010017758 gastric cancer Diseases 0.000 description 1
- 208000005017 glioblastoma Diseases 0.000 description 1
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 1
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- 230000036449 good health Effects 0.000 description 1
- 201000010536 head and neck cancer Diseases 0.000 description 1
- 208000014829 head and neck neoplasm Diseases 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 230000002008 hemorrhagic effect Effects 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 210000001822 immobilized cell Anatomy 0.000 description 1
- 210000002865 immune cell Anatomy 0.000 description 1
- 230000006058 immune tolerance Effects 0.000 description 1
- 230000000984 immunochemical effect Effects 0.000 description 1
- 238000013394 immunophenotyping Methods 0.000 description 1
- 238000011503 in vivo imaging Methods 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000008611 intercellular interaction Effects 0.000 description 1
- 201000010982 kidney cancer Diseases 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 108010091871 leucylmethionine Proteins 0.000 description 1
- 206010024627 liposarcoma Diseases 0.000 description 1
- 201000007270 liver cancer Diseases 0.000 description 1
- 208000014018 liver neoplasm Diseases 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 201000005296 lung carcinoma Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 210000001165 lymph node Anatomy 0.000 description 1
- 230000000527 lymphocytic effect Effects 0.000 description 1
- 108010064235 lysylglycine Proteins 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 1
- 210000001161 mammalian embryo Anatomy 0.000 description 1
- 201000007924 marginal zone B-cell lymphoma Diseases 0.000 description 1
- 208000021937 marginal zone lymphoma Diseases 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000004066 metabolic change Effects 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 201000000050 myeloid neoplasm Diseases 0.000 description 1
- 208000010125 myocardial infarction Diseases 0.000 description 1
- 201000011216 nasopharynx carcinoma Diseases 0.000 description 1
- 230000002956 necrotizing effect Effects 0.000 description 1
- 201000008383 nephritis Diseases 0.000 description 1
- 230000000324 neuroprotective effect Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 238000002515 oligonucleotide synthesis Methods 0.000 description 1
- 201000008968 osteosarcoma Diseases 0.000 description 1
- 208000027753 pain disease Diseases 0.000 description 1
- 201000002528 pancreatic cancer Diseases 0.000 description 1
- 208000008443 pancreatic carcinoma Diseases 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 208000029308 periodic paralysis Diseases 0.000 description 1
- 108010089198 phenylalanyl-prolyl-arginine Proteins 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 1
- 208000031223 plasma cell leukemia Diseases 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 206010038038 rectal cancer Diseases 0.000 description 1
- 201000001275 rectum cancer Diseases 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 201000009410 rhabdomyosarcoma Diseases 0.000 description 1
- 208000004124 rheumatic heart disease Diseases 0.000 description 1
- 206010039073 rheumatoid arthritis Diseases 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- -1 scRNA Proteins 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 210000004989 spleen cell Anatomy 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 201000011549 stomach cancer Diseases 0.000 description 1
- 206010042863 synovial sarcoma Diseases 0.000 description 1
- 208000006379 syphilis Diseases 0.000 description 1
- 201000000596 systemic lupus erythematosus Diseases 0.000 description 1
- 238000010809 targeting technique Methods 0.000 description 1
- 201000003120 testicular cancer Diseases 0.000 description 1
- 201000002510 thyroid cancer Diseases 0.000 description 1
- 238000007862 touchdown PCR Methods 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
- 108700004896 tripeptide FEG Proteins 0.000 description 1
- 201000008827 tuberculosis Diseases 0.000 description 1
- 230000004614 tumor growth Effects 0.000 description 1
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 description 1
- 201000005112 urinary bladder cancer Diseases 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4702—Regulators; Modulating activity
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K67/00—Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
- A01K67/027—New or modified breeds of vertebrates
- A01K67/0275—Genetically modified vertebrates, e.g. transgenic
- A01K67/0278—Knock-in vertebrates, e.g. humanised vertebrates
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K49/00—Preparations for testing in vivo
- A61K49/0004—Screening or testing of compounds for diagnosis of disorders, assessment of conditions, e.g. renal clearance, gastric emptying, testing for diabetes, allergy, rheuma, pancreas functions
- A61K49/0008—Screening agents using (non-human) animal models or transgenic animal models or chimeric hosts, e.g. Alzheimer disease animal model, transgenic model for heart failure
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/8509—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2207/00—Modified animals
- A01K2207/15—Humanized animals
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/07—Animals genetically altered by homologous recombination
- A01K2217/072—Animals genetically altered by homologous recombination maintaining or altering function, i.e. knock in
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2227/00—Animals characterised by species
- A01K2227/10—Mammal
- A01K2227/105—Murine
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/03—Animal model, e.g. for test or diseases
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/10—Plasmid DNA
- C12N2800/106—Plasmid DNA for vertebrates
- C12N2800/107—Plasmid DNA for vertebrates for mammalian
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Veterinary Medicine (AREA)
- Environmental Sciences (AREA)
- Biochemistry (AREA)
- Animal Behavior & Ethology (AREA)
- Gastroenterology & Hepatology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Toxicology (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Biodiversity & Conservation Biology (AREA)
- Physics & Mathematics (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- Urology & Nephrology (AREA)
- Plant Pathology (AREA)
- Rheumatology (AREA)
- Microbiology (AREA)
- Pathology (AREA)
- Endocrinology (AREA)
- Diabetes (AREA)
- Animal Husbandry (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本发明提供了一种人源化GARP基因、一种人源化GARP蛋白、一种GARP基因的靶向载体、一种GARP基因人源化的非人动物的构建方法和其在生物医药领域的应用,利用同源重组的方式将编码人GARP蛋白的核苷酸序列导入非人动物基因组中,该动物体内能正常表达人或人源化GARP蛋白,可以作为人GARP信号机理研究、心脑血管疾病、神经精神类疾病、肿瘤及自身免疫性疾病药物筛选的动物模型,对免疫靶点、神经靶点以及防治心脑血管疾病靶点的新药研发具有重要的应用价值。
Description
技术领域
本发明属于动物基因工程和基因遗传修饰领域,具体地说,涉及一种GARP基因人源化的非人动物及其构建方法和在生物医药领域的应用。
背景技术
调节性T细胞(Treg)是诱导免疫耐受性的主要细胞,所述免疫耐受性在癌症患者的肿瘤区域中观察到。即,在癌症患者中,使本质上作用于杀死肿瘤的免疫细胞群通过肿瘤中的活化Treg而成为免疫抑制状态,并且这导致肿瘤的恶性进展。
糖蛋白A重复主导序列(Glycoprotein-A Repetitions Predominant,GARP)是I型跨膜蛋白,胞外区与latent TGF-β(全长TGF-β,由潜伏期相关肽LAP和成熟的TGF-β组成)结合。免疫细胞和其他细胞表面的整合素αVβ8能够识别LAP中的RGD肽,从而介导成熟TGF-β从TGF-β/GARP复合物中的释放,因此GARP能够介导TGF-β活化。由于Treg与Treg对其诱导免疫抑制的靶细胞之间的细胞间相互作用,TGF-β通过在Treg的细胞表面上的GARP由潜伏TGF-β成熟且从Treg分泌,并且TGF-β的免疫抑制信号直接传送到靶细胞。
随着基因工程技术的不断发展和成熟,用人类基因替代或置换动物的同源性基因已经实现,通过这种方式开发人源化实验动物模型是动物模型未来的发展方向。其中基因人源化动物模型,即,利用基因编辑技术,用人源正常或突变基因替换动物基因组的同源基因,可建立更接近人类生理或疾病特征的正常或突变基因动物模型。基因人源化动物不但本身具有重要应用价值,如通过基因人源化可改进和提升细胞或组织移植人源化动物模型,更重要的是,由于人类基因片段的插入,动物体内可表达或部分表达人源蛋白,可作为仅能识别人蛋白氨基酸序列的药物的靶点,为在动物水平进行抗人抗体及其它药物的筛选提供了可能。然而,由于动物与人类在生理学及病理学方面存在差异,加上基因(即遗传因子)的复杂性,如何能构建出“有效”的人源化动物模型用于新药研发仍是最大的挑战(Scheer N,Snaith M,Wolf CR,Seibler J.Generation and utility of geneticallyhumanized mouse models,Drug Discov Today;18(23-24):1200-11,2013)。
目前关于GARP基因的动物模型主要为基因敲除鼠,而且主要用于肿瘤相关疾病机制研究。鉴于GARP在肿瘤、自身免疫性疾病、心脑血管疾病、神经精神类疾病等多种疾病发生过程中的广泛参与性以及靶向该信号通路的巨大应用价值,为了使临床前期的试验更有效并使研发失败最小化,本领域仍急需开发人源化GARP信号通路相关的非人动物模型。
发明内容
本发明的第一方面,提供了一种人源化GARP基因,所述的人源化GARP基因包含人GARP基因的部分。
优选的,所述的人源化GARP基因包含编码人GARP蛋白的全部或部分核苷酸序列;优选的,包含编码人GARP信号肽、跨膜区、胞质区和/或胞外区的全部或部分核苷酸序列;更优选的,所述的人源化GARP基因包含编码人GARP蛋白的胞外区的全部或部分核苷酸序列,进一步优选的,包含与编码SEQ ID NO:2第20-627位的核苷酸序列具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列或者包含编码SEQ ID NO:2第20-627位的核苷酸序列,更进一步优选的,包含与编码SEQ ID NO:2的核苷酸序列具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列或者包含编码SEQ IDNO:2的核苷酸序列。
优选的,所述的人源化GARP基因包含人GARP基因的1号外显子至3号外显子的全部或部分,进一步优选的,所述的人源化GARP基因包含人GARP基因的2号至3号外显子的全部或部分,更优选的,所述的人源化GARP基因包含人GARP基因的2号和/或3号外显子的全部或部分,优选还包含2-3号内含子,其中,2号外显子的部分至少包含50bp的核苷酸序列,例如至少包含50、60、70、80、81、82、83、84、85、86、87、88bp的核苷酸序列;优选的,所述人GARP基因的2号外显子的部分至少包含从起始密码子开始至2号外显子最后一个核苷酸为止,3号外显子的部分至少包含1000bp的核苷酸序列,例如至少包含1000、1500、1700、1900、1901、1902、1903、1904、1905、1910、2000、2500、3000、3500、3900、3985bp的核苷酸序列;优选的,3号外显子的部分至少包含从3号外显子第一个核苷酸开始至终止密码子为止。
在本发明的一个具体实施方式中,所述的人源化GARP基因中至少包含SEQ ID NO:6或SEQ ID NO:7所示核苷酸序列,或包含与SEQ ID NO:6或SEQ ID NO:7具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%同一性的核苷酸序列。
在本发明的一个具体实施方式中,所述的人源化GARP基因中包含的人GARP基因的部分选自下列组中的一种:
(A)包含SEQ ID NO:5所示核苷酸序列的全部或部分;
(B)包含与SEQ ID NO:5所示核苷酸序列的同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%的核苷酸序列;
(C)包含与SEQ ID NO:5所示核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸的核苷酸序列;
(D)具有SEQ ID NO:5所示核苷酸序列的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
在本发明的一个具体实施方式中,所述的人源化GARP基因还包括非人动物GARP基因的1号外显子的全部、2号外显子的部分和/或3号外显子的部分;优选的,所述的非人动物GARP基因的1号外显子的全部、2号外显子的部分和/或3号外显子的部分与NC_000073.7相应的1号外显子、2号外显子、3号外显子至少具有70%、80%、90%或至少95%的同一性;进一步优选的,所述的非人动物GARP基因的1号外显子的全部、2号外显子的部分和/或3号外显子的部分与NM_001113379.2相应的1号外显子、2号外显子、3号外显子一致。
在本发明的一个具体实施方式中,所述的人源化GARP基因转录的mRNA选自下列组中的一种:
(a)包含SEQ ID NO:8所示核苷酸序列的全部或部分;
(b)包含与SEQ ID NO:8所示核苷酸序列的同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%的核苷酸序列;
(c)包含与SEQ ID NO:8所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸的核苷酸序列;或
(d)包含SEQ ID NO:8所示的核苷酸序列,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
优选的,所述的人源化GARP基因还包括特异性诱导物或阻遏物,进一步优选的,所述的特异性诱导物或阻遏物可以为常规可以诱导或阻遏的物质。
在本发明的一个具体实施方式中,所述的特异性诱导物选自四环素系统(Tet-OffSystem/Tet-On System)或他莫昔芬系统(Tamoxifen System)。
优选的,所述的非人动物可以选自啮齿类动物、猪、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物,进一步优选的,所述的非人哺乳动物为啮齿类动物,更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物,进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子,更优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠,更进一步优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnull小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。
本发明的第二方面,提供了一种人源化GARP蛋白,所述的人源化GARP蛋白包含人GARP蛋白的全部或部分。
优选的,所述的人源化GARP蛋白是由上述的人源化GARP基因编码的。
优选的,所述的人源化GARP蛋白包含人GARP蛋白的信号肽、跨膜区、胞质区和/或胞外区的全部或部分,进一步优选的,所述的人源化GARP蛋白包含人GARP蛋白的胞外区的全部或部分,更优选的,包含与SEQ ID NO:2第20-627位具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含编码SEQ ID NO:2第20-627位所示的氨基酸序列,更进一步优选的,所述的人源化GARP蛋白包含与SEQ ID NO:2具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的氨基酸序列或者包含SEQ ID NO:2所示氨基酸序列。
优选的,所述的人源化GARP蛋白包含人GARP基因的2号和/或3号外显子编码的氨基酸序列,进一步优选的,所述的人源化GARP蛋白包含人GARP基因的2号至3号外显子编码的氨基酸序列,更优选的,包含从人GARP基因的起始密码子开始至终止密码子为止编码的氨基酸序列。
优选的,所述的人源化GARP蛋白至少包含SEQ ID NO:5或SEQ ID NO:8编码的氨基酸序列,或包含与SEQ ID NO:5或SEQ ID NO:8具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%同一性的核苷酸编码的氨基酸序列。
在本发明的一个具体实施方式中,所述的人源化GARP蛋白中包含的人GARP蛋白的部分氨基酸序列包含下列组中的一种:
A)包含SEQ ID NO:2所示氨基酸序列的全部或部分;
B)包含SEQ ID NO:2所示氨基酸序列同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%的氨基酸序列;
C)包含SEQ ID NO:2所示氨基酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸的氨基酸序列;或
D)包含SEQ ID NO:2所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列。
本发明的第三方面,提供了一种载体,所述载体包含上述的人源化GARP基因。
优选的,所述载体为靶向载体。
优选的,所述的靶向载体还包含与待改变的转换区5’端同源的DNA片段,即5’臂(5’同源臂),其选自非人动物GARP基因基因组DNA的100-10000个长度的核苷酸;优选的,所述的5’臂与NCBI登录号为NC_000073.7至少具有90%同源性的核苷酸;进一步优选的,所述5’臂序列与SEQ ID NO:3至少具有90%同源性,或者如SEQ ID NO:3所示。
优选的,所述的靶向载体还包含与待改变的转换区3’端同源的DNA片段,即3’臂(3’同源臂),其选自非人动物GARP基因基因组DNA的100-10000个长度的核苷酸;优选的,所述的3’臂与NCBI登录号为NC_000073.7至少具有90%同源性的核苷酸;进一步优选的,所述的3’臂序列与SEQ ID NO:4至少具有90%同源性,或者如SEQ ID NO:4所示。
更优选的,所述靶向载体还包含SEQ ID NO:6或SEQ ID NO:7所示核苷酸序列,或包含与SEQ ID NO:6或SEQ ID NO:7具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%同一性的核苷酸序列。
优选的,所述的待改变的转换区位于非人动物GARP基因座上,进一步优选的,所述的待改变的转换区位于非人动物GARP基因2号至3号外显子上。
优选的,所述的靶向载体还包含标记基因,进一步优选的,所述标记基因为负筛选标记的编码基因,更进一步优选的,所述负筛选标记的编码基因为白喉毒素A亚基的编码基因(DTA)。
在本发明的一个具体实施方式中,所述的靶向载体中还包括阳性克隆筛选的抗性基因,进一步优选的,所述阳性克隆筛选的抗性基因为新霉素磷酸转移酶编码序列Neo。
在本发明的一个具体实施方式中,所述的靶向载体中还包括特异性重组系统,进一步优选的,所述特异性重组系统为Frt重组位点(也可选择常规的LoxP重组系统),所述的特异性重组系统为具有两个Frt重组位点,分别连接在抗性基因的两侧。
优选的,所述的非人动物可以选自啮齿类动物、猪、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物,进一步优选的,所述的非人哺乳动物为啮齿类动物,更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物,进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子,更优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠,更进一步优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnull小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。
本发明的第四方面,提供了一种包含上述靶向载体的细胞。
本发明的第五方面,提供了上述靶向载体,或者上述的细胞在GARP基因修饰中的应用,优选的,所述的应用包括但不限于插入、翻转、敲除或替换。
本发明的第六方面,提供了一种GARP基因人源化的非人动物,所述的非人动物体内表达人或人源化GARP蛋白。
优选的,所述的非人动物的内源GARP蛋白表达降低或缺失。
优选的,所述的非人动物体内表达上述的人源化GARP蛋白。
优选的,所述的非人动物体内包含人或人源化GARP基因,更优选包含上述的人源化GARP基因。
优选的,所述的人源化GARP基因还包括特异性诱导物或阻遏物,进一步优选的,所述的特异性诱导物或阻遏物可以为常规可以诱导或阻遏的物质。
在本发明的一个具体实施方式中,所述的特异性诱导物选自四环素系统(Tet-OffSystem/Tet-On System)或他莫昔芬系统(Tamoxifen System)。
优选的,所述人或人源化GARP基因的核苷酸序列可操作地连接到至少一条染色体中内源性GARP基因座处的内源调控元件。
根据本发明的一些实施例,所述的非人动物进一步包含其他基因修饰,所述其他基因选自PD-1、PD-L1、CTLA4、OX40、LAG3、TIM3和CD73中的至少一种。
根据本发明的一些实施例,所述人或人源化GARP基因和/或所述其他基因对于内源被替换基因座为纯合或杂合。
优选的,所述的非人动物可以选自啮齿类动物、猪、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物,进一步优选的,所述的非人哺乳动物为啮齿类动物,更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物,进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子,更优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠,更进一步优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnull小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。
本发明的第七方面,提供了一种GARP基因人源化的非人动物的构建方法,所述的非人动物体内表达人或人源化GARP蛋白。
优选的,所述的非人动物体内表达上述的人源化GARP蛋白。
优选的,所述的非人动物至少一个细胞的基因组中包含人或人源化GARP基因,更优选包含上述的人源化GARP基因。
优选的,所述的非人动物为上述的GARP基因人源化的非人动物。
优选的,所述的人或人源化GARP基因可操作连接到至少一条染色体上内源GARP内源调控元件。
优选的,所述的人源化GARP基因在非人动物体内通过内源或外源调控元件进行调控,进一步优选的,所述的调控元件为启动子。
在本发明的一个具体实施方式中,所述的内源调控元件来自非人动物GARP基因。所述的外源性调控元件来自人GARP基因。
优选的,所述的构建方法包括将人GARP基因的全部或部分导入非人动物GARP基因座上。
优选的,所述的人GARP基因的部分包含人GARP基因的1号至3号外显子的全部或部分,进一步优选的,包含人GARP基因的2号至3号外显子的全部或部分,更优选的,包含人GARP基因的2号和/或3号外显子的全部或部分,更进一步优选的,包含人GARP的基因的2号外显子的部分、3号外显子的部分,进一步优选的,包含2-3号内含子;其中,2号外显子的部分至少包含50bp的核苷酸序列,例如至少包含50、60、70、80、81、82、83、84、85、86、87、88bp的核苷酸序列;优选的,所述人GARP基因的2号外显子的部分至少包含从起始密码子开始至2号外显子最后一个核苷酸为止,3号外显子的部分至少包含1000bp的核苷酸序列,例如至少包含1000、1500、1700、1900、1901、1902、1903、1904、1905、1910、2000、2500、3000、3500、3900、3985bp的核苷酸序列;优选的,3号外显子的部分至少包含从3号外显子第一个核苷酸开始至终止密码子为止,优选的,包含SEQ ID NO:5的核苷酸序列,或用包含与SEQ ID NO:5具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%同一性的核苷酸序列。
优选的,所述的构建方法包括用包含编码人GARP蛋白的全部或部分核苷酸序列导入非人动物GARP基因座上,进一步优选的,包括用包含编码人GARP蛋白的信号肽、跨膜区、胞质区和/或胞外区的全部或部分核苷酸序列导入非人动物GARP基因座上,更优选的,用包含与编码SEQ ID NO:2的核苷酸序列具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列或者包含编码SEQ ID NO:2的核苷酸序列导入非人动物GARP基因座上。
优选的,所述的构建方法包括用包含上述人或人源化GARP基因的核苷酸序列导入非人动物GARP基因座上。
优选的,所述的构建方法包括用包含编码上述人源化GARP蛋白的核苷酸序列导入非人动物GARP基因座上。
优选的,所述的构建方法包括用包含编码上述人源化GARP蛋白的cDNA序列导入非人动物GARP基因座上。
优选的,本申请中所述的导入包括但不限于插入、替换或转基因,所述的替换优选为原位替换或插入。
优选的,所述的导入的位置位于GARP基因的内源调控元件之后。
优选的,所述的导入为替换或插入,任选地,所述的导入非人动物GARP基因座为替换非人动物相应区域,进一步优选的,非人动物GARP基因的1号至3号外显子的全部或部分被替换,更优选地,非人动物的2号外显子的部分和3号外显子的部分被替换。
优选的,编码SEQ ID NO:1所示氨基酸的核苷酸序列被替换。
优选的,所述的插入为首先破坏非人动物内源GARP基因的编码框,随后进行插入操作,或者所述的插入步骤既可给内源GARP基因造成移码突变又可以实现插入人源序列的步骤。
优选的,所述的非人动物是纯合或者杂合的。
优选的,所述非人动物的基因组中至少一个染色体上包含人源化GARP基因。
优选的,所述的非人动物中至少一个细胞表达人GARP蛋白或人源化GARP蛋白。
优选的,使用基因编辑技术进行非人动物的构建,所述的基因编辑技术包括利用胚胎干细胞的基因打靶技术、CRISPR/Cas9技术、锌指核酸酶技术、转录激活子样效应因子核酸酶技术、归巢核酸内切酶或其他分子生物学技术。
优选的,所述的构建方法包括使用上述的靶向载体进行非人动物的构建。
在本发明的一个具体实施方式中,所述的构建方法包括将上述靶向载体导入非人动物细胞中(优选为胚胎干细胞),筛选出正确的阳性克隆细胞导入已分离好的囊胚中,培养该囊胚,然后将培养后的囊胚移植至雌性非人动物输卵管内,允许其发育,鉴定筛选获得GARP基因人源化的非人动物。
根据本发明的一些实施例,该构建方法进一步包括:将GARP基因人源化的非人动物与其他基因修饰的非人动物交配、体外受精或直接进行基因编辑,并进行筛选,得到多基因修饰的非人动物。
优选的,所述的其他基因为PD-1、PD-L1、CTLA4、OX40、LAG3、TIM3和CD73中的至少一种。
优选的,所述的非人动物还表达人或人源化的PD-1、PD-L1、CTLA4、OX40、LAG3、TIM3和CD73蛋白中的至少一种。
优选的,所述的多基因修饰的非人动物的基因组中修饰的多个基因中的每一个基因均对于内源被替换基因座为纯合或杂合的。
优选的,所述的非人动物可以选自啮齿类动物、猪、兔子、猴子等任何可以进行基因编辑制备基因人源化的非人动物。
优选的,所述的非人动物为非人哺乳动物。进一步优选的,所述的非人哺乳动物为啮齿类动物。更进一步优选的,所述的啮齿类动物为大鼠或小鼠。
优选的,所述的非人动物是免疫缺陷的非人哺乳动物。进一步优选的,所述的免疫缺陷的非人哺乳动物为免疫缺陷的啮齿类动物、免疫缺陷的猪、免疫缺陷的兔子或免疫缺陷的猴子。更进一步优选的,所述的免疫缺陷的啮齿类动物为免疫缺陷的小鼠或大鼠。最为优选的,所述免疫缺陷鼠是NOD-Prkdcscid IL-2rγnull小鼠、NOD-Rag 1-/--IL2rg-/-(NRG)小鼠、Rag 2-/--IL2rg-/-(RG)小鼠、NOD/SCID小鼠或者裸鼠。
本发明的第八方面,提供了一种多基因修饰的非人动物的构建方法,包括如下步骤:
I)提供上述的GARP基因人源化的非人动物或GARP基因敲除的非人动物,或者采用上述的构建方法获得的GARP基因人源化的非人动物;
II)将步骤I)提供的非人动物与其他基因修饰的非人动物交配、体外受精或直接进行基因编辑,并进行筛选,得到多基因修饰的非人动物。
优选的,所述的其他基因修饰的非人动物包括但不限于基因PD-1、PD-L1、CTLA4、OX40、LAG3、TIM3或CD73修饰的非人动物。
优选的,所述的多基因修饰的非人动物为双基因人源化非人动物、三基因人源化非人动物、四基因人源化非人动物、五基因人源化非人动物、六基因人源化非人动物、七基因人源化非人动物、八基因人源化非人动物或九基因人源化非人动物。
优选的,所述的多基因修饰的非人动物的基因组中人源化的多个基因中的每一个基因均可以是纯合或杂合的。
本发明的第九方面,提供了一种上述构建方法获得的非人动物或其子代,所述的非人动物或其子代选自GARP基因人源化的非人动物、GARP基因敲除的非人动物或者多基因修饰的非人动物。
本发明的第十方面,提供了一种动物的疾病模型,所述的疾病模型来源于上述的非人动物、上述的构建方法获得的非人动物,或者,上述的非人动物或其子代,优选的,所述的疾病包括心脑血管疾病、神经精神类疾病、自身免疫性疾病、肿瘤或炎症。
本发明的第十一方面,提供了一种动物的疾病模型的制备方法,所述的制备方法包括上述GARP基因人源化的非人动物、GARP基因敲除的非人动物或多基因修饰的非人动物的步骤;优选的,所述的疾病包括心脑血管疾病、神经精神类疾病、自身免疫性疾病、肿瘤或炎症,进一步优选的,还包括植入肿瘤细胞的步骤。
本发明的第十二方面,提供了上述GARP基因人源化的非人动物、上述GARP基因敲除的非人动物、上述构建方法获得的GARP基因人源化的非人动物、上述GARP基因敲除的非人动物或多基因修饰的非人动物或其子代在制备动物的疾病模型中的应用,优选的,所述的疾病包括心脑血管疾病、神经精神类疾病、自身免疫性疾病、肿瘤或炎症。
本发明的第十三方面,提供了上述的非人动物、上述的非人动物或其子代、上述的构建方法获得的非人动物或上述的疾病模型在制备治疗心脑血管疾病、神经精神类疾病、自身免疫性疾病、肿瘤和/或炎症的药物中的应用。
本发明的第十四方面,提供了一种细胞或细胞系或原代细胞培养物,所述细胞或细胞系或原代细胞培养物来源于上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代或者上述的疾病模型。优选的,所述的细胞或细胞系或原代细胞培养物不能发育为动物个体。
本发明的第十五方面,提供了一种组织或器官或其培养物,所述组织或器官或其培养物来源于上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代或者上述的疾病模型。优选的,所述的组织或器官或其培养物不能发育为动物个体。
本发明的第十六方面,提供了一种荷瘤后的瘤组织,所述的瘤组织来源于上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代,或者上述的疾病模型。优选的,所述的荷瘤后的瘤组织不能发育为动物个体。
本发明的第十七方面,提供了一种GARP基因人源化的细胞,所述的细胞表达人GARP蛋白或人源化GARP蛋白。
优选的,所述的人源化GARP蛋白选自上述的人源化GARP蛋白。
优选的,所述的细胞中内源GARP蛋白的表达降低或缺失。
优选的,所述的细胞的基因组中包含人GARP基因的部分,进一步优选的,所述的细胞包含上述的人源化GARP基因。优选的,所述的细胞不能发育为动物个体。
本发明的第十八方面,提供了一种GARP基因敲除的细胞,所述的细胞中缺失GARP基因的全部或部分核苷酸序列。
优选的,所述的细胞缺失GARP基因的2号至3号外显子的全部或部分核苷酸序列。优选的,所述的细胞不能发育为动物个体。
本发明的第十九方面,提供了一种表达上述的人源化GARP蛋白的构建体,优选的,所述的构建体中包含上述人源化GARP基因。
本发明的第二十方面,提供了一种包含上述构建体的细胞。优选的,所述的细胞不能发育为动物个体。
本发明的第二十一方面,提供了一种包含上述细胞的组织。优选的,所述的组织不能发育为动物个体。
本发明的第二十二方面,提供了来源于上述的人源化GARP蛋白、上述的人源化GARP基因、上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代、上述的疾病模型、上述的细胞或细胞系或原代细胞培养物、上述的组织或器官或其培养物、上述的荷瘤后的瘤组织、上述的细胞、上述的构建体、上述的细胞或上述的组织的应用,所述的应用包括:
在需要涉及人类细胞的免疫过程的产品开发,制造抗体,或者作为药理学、免疫学、微生物学、医学研究的模型系统中的应用;
在生产和利用动物实验疾病模型,用于开发新的诊断策略和/或治疗策略中的应用;
或者,
在筛选、验证、评价或研究GARP功能、人GARP信号机理、靶向人的抗体、靶向人的药物、药效,心脑血管疾病、神经精神类疾病、免疫相关疾病药物以及抗肿瘤或抗炎症药物,筛选和评估人用药及药效研究方面的应用。
本发明的第二十三方面,提供了上述GARP基因人源化的非人动物、上述GARP基因敲除的非人动物、上述构建方法获得的GARP基因人源化的非人动物、上述GARP基因敲除的非人动物或多基因修饰的非人动物或其子代在制备人GARP特异性调节剂或者筛选人GARP特异性调节剂的产品中的应用。
优选的,所述应用不是疾病的治疗和/或诊断方法。
本发明的第二十四方面,提供了一种人GARP特异性调节剂的筛选方法,所述的筛选方法包括向个体施加调节剂,检测调节效果;其中,所述的个体选自上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代,或者上述的疾病模型。
优选的,所述的调节剂选自CAR-T、药物,进一步优选的,所述的药物为抗体。
优选的,所述的调节剂为单抗或双特异性抗体或两种及两种以上药物的联合使用。
优选的,所述的筛选方法还包括向个体植入肿瘤的步骤。
优选的,所述检测包括测定肿瘤细胞的大小和/或增殖速率。
优选的,所述检测的方法包括游标卡尺测量、流式细胞检测和/或动物活体成像检测。
优选的,所述的检测包括评估个体体重、脂肪量、活化途径、神经保护活性或代谢变化,所述的代谢变化包括食物消耗或水消耗的变化。
优选的,所述的肿瘤细胞来源于人或非人动物。
优选的,所述人GARP特异性调节剂的筛选方法不是治疗方法。该方法用来筛选或评价药物,对候选药物的药效进行检测和比较,以确定哪些候选药物可以作为药物,哪些不能作为药物,或者,比较不同药物的药效敏感程度,即治疗效果不是必然的,只是一种可能性。
本发明的第二十五方面,提供了一种干预方案的评价方法,所述的评价方法包括向个体施加干预方案,对施加干预方案后的个体进行调节效果检测和评价;其中,所述的个体选自上述的非人动物,上述的构建方法获得的非人动物,上述的非人动物或其子代,或者上述的疾病模型。
优选的,所述的评价方法还包括向个体植入肿瘤细胞。
优选的,所述的干预方案选自CAR-T、药物治疗,进一步优选的,所述的药物为抗原结合蛋白,所述的抗体结合蛋白为抗体。
优选的,所述的肿瘤细胞来源于人或非人动物。
优选的,所述干预方案的评价方法不是治疗方法,该评价方法对干预方案的效果进行检测和评价,以确定该干预方案是否有治疗效果,即治疗效果不是必然的,只是一种可能性。
本发明的第二十六方面,提供了一种来源于上述的非人动物、上述的构建方法获得的非人动物、上述的非人动物或其子代或疾病模型在制备治疗心脑血管疾病、神经精神类疾病、肿瘤、炎症或自身免疫性疾病的药物中的用途。
优选的,所述应用不是疾病的治疗和/或诊断方法。
本发明所述的“肿瘤”包括但不限于淋巴瘤、B细胞肿瘤、T细胞肿瘤、骨髓/单核细胞肿瘤、非小细胞肺癌、白血病、卵巢癌、鼻咽癌、乳腺癌、子宫内膜癌、结肠癌、直肠癌、胃癌、膀胱癌、肺癌、支气管癌、骨癌、前列腺癌、胰腺癌、肝和胆管癌、食管癌、肾癌、甲状腺癌、头颈部癌、睾丸癌、胶质母细胞瘤、星形细胞瘤、黑色素瘤、骨髓增生异常综合征、以及肉瘤。其中,所述的白血病选自急性淋巴细胞性(成淋巴细胞性)白血病、急性骨髓性白血病、髓性白血病、慢性淋巴细胞性白血病、多发性骨髓瘤、浆细胞白血病、以及慢性骨髓性白血病;所述淋巴瘤选自霍奇金淋巴瘤和非霍奇金淋巴瘤,包括B细胞淋巴瘤、弥漫性大B细胞淋巴瘤、滤泡性淋巴瘤、套细胞淋巴瘤、边缘区B细胞淋巴瘤、T细胞淋巴瘤、和瓦尔登斯特伦巨球蛋白血症;所述肉瘤选自骨肉瘤、尤文肉瘤、平滑肌肉瘤、滑膜肉瘤、软组织肉瘤、血管肉瘤、脂肪肉瘤、纤维肉瘤、横纹肌肉瘤、及软骨肉瘤。在本发明的一个具体实施方式中,所述的肿瘤选自B细胞肿瘤、T细胞肿瘤、骨髓/单核细胞肿瘤。优选包括B或T细胞急性淋巴细胞白血病(ALL)、急性髓细胞白血病(AML)、非霍奇金淋巴瘤(NHL)和多发性骨髓瘤(MM)、鼻咽癌、肺癌。
本发明所述的“自身免疫性疾病”包括但不限于过敏、哮喘、心肌炎、肾炎、肝炎、系统性红斑狼疮、类风湿性关节炎、硬皮病、甲状腺功能亢进、原发性血小板减少性紫癜、自身免疫性溶血性贫血、溃疡性结肠炎、自身免疫性肝病、糖尿病、疼痛或神经障碍等。
本发明所述的“炎症”包括急性炎症,也包括慢性炎症。具体的,包括但不限于变质性炎症、渗出性炎症(浆液性炎、纤维素性炎、化脓性炎、出血性炎、坏死性炎、卡他性炎)、增生性炎症、特异性炎症(结核、梅毒、麻疯、淋巴肉芽肿等)。
本发明所述的“心脑血管疾病”包括但不限于冠心病(心脏病发作)、脑血管疾病(中风)、高血压(血压升高)、周围血管疾病、风湿性心脏病、先天性心脏病、深静脉血栓和肺栓塞、心力衰竭以及心肌病。
本发明所述的“神经精神类疾病”包括但不限于脑血管疾病、周期性麻痹、进行性肌营养不良、强直性肌营养不良、共济失调。
优选的,本发明保护的主题“细胞”、“细胞或细胞系或原代细胞培养物”、“组织”、“组织或器官或其培养物”均不能发育为动物,其中,所述的细胞不是干细胞或受精卵细胞,所述的细胞可以是体细胞、淋巴细胞(优选为T细胞或B细胞)或肿瘤细胞等等,所述的组织可以是脾脏、淋巴结、骨髓、肿瘤或其培养物等等。
本发明所述的GARP基因人源化的非人动物体内可以正常表达人GARP蛋白或人源化GARP蛋白。可用于针对人GARP靶位点的药物筛选、药效评估、心脑血管疾病、神经性疾病、自身免疫性疾病和肿瘤治疗,可以加快新药研发过程、节约时间和成本。对于研究GARP蛋白功能及相关疾病药物筛选提供了有效的保障。
本发明所述的“全部或部分”,“全部”为整体,“部分”为整体中的局部,或者组成整体的个体。
本发明所述的“人源化GARP蛋白”,包含来源于人GARP蛋白的部分。其中,所述的“人GARP蛋白”同“人GARP蛋白的全部”,即其氨基酸序列与人GARP蛋白的全长氨基酸序列一致。所述的“人GARP蛋白的部分”,为连续或间隔的5-662个(优选为10-662个)氨基酸序列与人GARP蛋白的氨基酸序列一致或与人GARP蛋白的氨基酸序列具有70%以上同源性。
本发明所述的“人源化GARP基因”,包含来源于人GARP基因的部分和非人GARP基因的部分。其中,所述的“人GARP基因”同“人GARP基因的全部”,即其核苷酸序列与人GARP基因的全长核苷酸序列一致。所述的“人GARP基因的部分”为连续或间隔的20-13224bp(优选为20-6351bp、20-4207bp或20-1989bp)个核苷酸序列与人GARP核苷酸序列一致或与人GARP核苷酸序列具有70%以上同源性。
本发明所述的“xx号至xxx号外显子”或“xx号至xxx号外显子的全部”包含外显子及其期间的内含子的核苷酸序列,例如所述的“2号至3号外显子”包含2号外显子、2-3号内含子、3号外显子的全部核苷酸序列。
本发明所述的“x-xx号内含子”表示x号外显子与xx号外显子之间的内含子。例如“2-3号内含子”表示2号外显子与3号外显子之间的内含子。
本发明所述的“外显子的部分”表示连续或间隔几个、几十个或几百个核苷酸序列与全部的外显子核苷酸序列一致。例如人GARP基因的2号外显子的部分,包含连续或间隔的5-88bp个,优选10-84bp个核苷酸序列与人GARP基因的2号外显子核苷酸序列一致。在本发明的一个具体实施方式中,所述的“人源化GARP基因”中包含的“2号外显子的部分”至少包括从2号外显子编码氨基酸序列的起始密码子至终止密码子。
本发明所述的“基因座”广义上讲代表基因在染色体上所占的位置,狭义上讲代表某一基因上的一段DNA片段,即可以是一个基因也可以是一个基因的一部分。例如所述的“GARP基因座”表示GARP基因1号至3号外显子上的任选一段的DNA片段。优选为1号外显子、2号外显子、3号外显子或其期间的内含子中的任一个或两个或多个的组合,或一个或两个或多个的全部或部分,更优选为GARP基因的2号至3号外显子上。
本发明所述的“核苷酸序列”包含天然的或经过修饰的核糖核苷酸序列、脱氧核糖核苷酸序列。优选为DNA、cDNA、pre-mRNA、mRNA、rRNA、hnRNA、miRNAs、scRNA、snRNA、siRNA、sgRNA、tRNA。
本发明所述的“治疗”表示减缓、中断、阻止、控制、停止、减轻、或逆转一种体征、症状、失调、病症、或疾病的进展或严重性,但不一定涉及所有疾病相关体征、症状、病症、或失调的完全消除,且是指在疾病已开始发展后改善疾病或病理状态的体征、症状等等的治疗干预。
本发明所述的“同源性”,是指在使用氨基酸序列或核苷酸序列的方面,本领域技术人员在保证与已知序列相似结构或功能的前提下,可以根据实际工作需要对序列进行调整,使使用序列与现有技术获得的序列相比,具有(包括但不限于)1%,2%,3%,4%,5%,6%,7%,8%,9%,10%,11%,12%,13%,14%,15%,16%,17%,18%,19%,20%,21%,22%,23%,24%,25%,26%,27%,28%,29%,30%,31%,32%,33%,34%,35%,36%,37%,38%,39%,40%,41%,42%,43%,44%,45%,46%,47%,48%,49%,50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,70%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.1%,99.2%,99.3%,99.4%,99.5%,99.6%,99.7%,99.8%,99.9%的同一性。
在一个方面,所述非人动物是哺乳动物。优选的,所述非人动物是小型哺乳动物,例如跳鼠科。在一个实施方式中,所述非人动物是啮齿动物。在一个实施方式中,所述啮齿动物选自小鼠、大鼠和仓鼠。在一个实施方式中,所述啮齿动物选自鼠家族。在一个实施方式中,所述基因修饰的动物来自选自丽仓鼠科(例如小鼠样仓鼠)、仓鼠科(例如仓鼠、新世界大鼠和小鼠、田鼠)、鼠总科(真小鼠和大鼠、沙鼠、刺毛鼠、冠毛大鼠)、马岛鼠科(登山小鼠、岩小鼠、有尾大鼠、马达加斯加大鼠和小鼠)、刺睡鼠科(例如多刺睡鼠)和鼹形鼠科(例如摩尔大鼠、竹大鼠和鼢鼠)家族。在一个特定实施方式中,所述基因修饰的啮齿动物选自真小鼠或大鼠(鼠总科)、沙鼠、刺毛鼠和冠毛大鼠。在一个实施方式中,所述基因修饰的小鼠来自鼠科家族成员。在一个实施方式中,所述动物是啮齿动物。在一个特定实施方式中,所述啮齿动物选自小鼠和大鼠。在一个实施方式中,所述非人动物是小鼠。
在一个特定实施方式中,所述非人动物是啮齿动物,其为选自BALB/c、A、A/He、A/J、A/WySN、AKR、AKR/A、AKR/J、AKR/N、TA1、TA2、RF、SWR、C3H、C57BR、SJL、C57L、DBA/2、KM、NIH、ICR、CFW、FACA、C57BL/A、C57BL/An、C57BL/GrFa、C57BL/KaLwN、C57BL/6、C57BL/6J、C57BL/6ByJ、C57BL/6NJ、C57BL/10、C57BL/10ScSn、C57BL/10Cr和C57BL/Ola的C57BL、C58、CBA/Br、CBA/Ca、CBA/J、CBA/st、CBA/H品系的小鼠及NOD、NOD/SCID、NOD-Prkdcscid IL-2rgnull背景的小鼠。
本领域的技术人员能够确定并比较序列元件或同一性程度,以区分另外的小鼠和人序列。
除非特别说明,本发明的实践将采取细胞生物学、细胞培养、分子生物学、转基因生物学、微生物学、重组DNA和免疫学的传统技术。这些技术在以下文献中进行了详细的解释。例如:Molecular Cloning A Laboratory Manual,2ndEd.,ed.By Sambrook,FritschandManiatis(Cold Spring Harbor Laboratory Press:1989);DNA Cloning,Volumes Iand II(D.N.Glovered.,1985);Oligonucleotide Synthesis(M.J.Gaited.,1984);Mullisetal.U.S.Pat.No.4,683,195;Nucleic Acid Hybridization(B.D.Hames&S.J.Higginseds.1984);Transcription And Translation(B.D.Hames&S.J.Higginseds.1984);Culture Of Animal Cells(R.I.Freshney,AlanR.Liss,Inc.,1987);Immobilized Cells And Enzymes(IRL Press,1986);B.Perbal,A PracticalGuide To Molecular Cloning(1984);the series,Methods In ENZYMOLOGY(J.Abelsonand M.Simon,eds.inchief,Academic Press,Inc.,New York),specifically,Vols.154and 155(Wuetal.eds.)and Vol.185,″Gene Expression Technology″(D.Goeddel,ed.);Gene Transfer Vectors For Mammalian Cells(J.H.Miller andM.P.Caloseds.,1987,Cold Spring Harbor Laboratory);Immunochemical Methods InCell And Molecular Biology(Mayer and Walker,eds.,Academic Press,London,1987);Handbook Of Experimental Immunology,Volumes V(D.M.Weir and C.C.Blackwell,eds.,1986);and Manipulating the Mouse Embryo,(Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,N.Y.,1986)。
本发明的有益技术效果在于:
利用基因编辑技术,用人源正常或突变基因替换动物基因组的同源基因,建立更接近人类生理或疾病特征的基因人源化动物模型,使其体内表达人源蛋白,作为仅能识别人蛋白序列的药物的靶点,为在动物水平进行抗人抗体及其它药物的筛选提供了可能。
利用基因人源化动物模型建立各种疾病模型,可以进行抗人抗体药物的药理药效评价。
进一步的,本发明设计的GARP基因人源化的技术方案,使得包含上述人源化GARP基因的非人动物能表达出人源化或人的相应蛋白,可以更好的模拟人体内信号通路,为筛选适合人的试剂提供更为人源化的微环境,从而筛选出的试剂效力更好。
进一步的,为便于人源化GARP基因的表达,本发明优化了导入的人的GARP基因的片段选择,以及导入位置的选择,人的GARP基因可以非随机插入的导入,并正确表达人源化或人的相应蛋白,可以稳定传代,同时不影响非人动物的其他功能。
以上只是概括了本发明的一些方面,不是也不应该认为是在任何方面限制本发明。
本说明书提到的所有专利和出版物都是通过参考文献作为整体而引入本发明的。本领域的技术人员应认识到,对本发明可作某些改变并不偏离本发明的构思或范围。
下面的实施例进一步详细说明本发明,不能认为是限制本发明或本发明所说明的具体方法的范围。
附图说明
以下,结合附图来详细说明本发明的实施例,其中:
图1:人和小鼠GARP基因座结构对比示意图(非按比例);
图2:人源化GARP基因座示意图(非按比例);
图3:GARP基因打靶策略示意图(非按比例);
图4:重组后ES细胞Southern blot结果,其中WT为野生型对照;
图5:人源化GARP小鼠FRT重组过程示意图(非按比例);
图6:人源化GARP F1代小鼠PCR结果,其中,M为Marker,WT为野生型对照,H2O为水对照,PC为阳性对照;
图7:脾脏RT-PCR结果示意图,+/+为野生型小鼠,H/H为人源化纯合子小鼠;
图8:人GARP和鼠GARP的流式检测结果,其中WT为野生型C57BL/6小鼠,H/+为GARP人源化杂合子小鼠;
图9:人GARP和鼠GARP的流式检测结果,其中WT为野生型C57BL/6小鼠,H/H为GARP人源化纯合子小鼠;
图10:野生型C57BL/6小鼠和GARP人源化纯合子小鼠脾脏中白细胞亚型检测结果;
图11:野生型C57BL/6小鼠和GARP人源化纯合子小鼠脾脏中T细胞亚型检测结果;
图12:野生型C57BL/6小鼠和GARP人源化纯合子小鼠外周血中白细胞亚型检测结果;
图13:野生型C57BL/6小鼠和GARP人源化纯合子小鼠外周血中T细胞亚型检测结果
图14:血常规检测结果;
图15:血生化检测结果;
图16:将小鼠结肠癌细胞MC38植入人源化GARP小鼠体内,进行抗肿瘤药效试验后小鼠的体重结果示意图;
图17:将小鼠结肠癌细胞MC38植入人源化GARP小鼠体内,进行抗肿瘤药效试验后小鼠的体重变化结果示意图;
图18:将小鼠结肠癌细胞MC38植入人源化GARP小鼠体内,进行抗肿瘤药效试验后小鼠体内肿瘤体积结果示意图。
具体实施方式
下面结合具体实施例来进一步描述本发明,本发明的优点和特点将会随着描述而更为清楚。但这些实施例仅是范例性的,并不对本发明的范围构成任何限制。本领域技术人员应该理解的是,在不偏离本发明的精神和范围下可以对本发明技术方案的细节和形式进行修改或替换,但这些修改和替换均落入本发明的保护范围内。
在下述每一实施例中,设备和材料是从以下所指出的几家公司获得:
Brilliant Violet 421TM anti-mouse CD45购自Biolegend,货号:103134;
PerCP/Cy5.5 anti-mouse TCRβchain购自Biolegend,货号:109228;
GARP Monoclonal Antibody(YGIC86),PE购自eBioscienceTM,货号:12-9891-80;
PE anti-human GARP(LRRC32)Antibody购自Biolegend,货号:352504;
APC anti-mouse/rat Foxp3购自eBioscience,货号:17-5773-82;
PE Rat IgG2a K Iso Control购自eBioscience,货号:12-4321-42;
PE Rat IgG2b,k isotype Ctrl购自eBioscience,货号:400608。
实施例1 GARP基因人源化小鼠的制备
本实施例对非人动物(如小鼠)进行改造,使该非人动物体内包含编码人源化GARP蛋白的核苷酸序列,得到经遗传修饰的非人动物体内可表达人源化GARP蛋白。小鼠GARP基因(NCBI Gene ID:434215,Primary source:MGI:93882,UniProt ID:G3XA59,位于7号染色体NC_000073.7的第98138515至98151038位,基于转录本NM_001113379.2及其编码蛋白NP_001106850.1(SEQ ID NO:1))和人GARP基因(NCBI Gene ID:2615,Primary source:HGNC:4161,UniProt ID:Q14392,位于11号染色体NC_000011.10的第76657524至76670747位,基于转录本NM_001128922.2及其编码蛋白NP_001122394.1(SEQ ID NO:2))。对比示意图如图1所示。
为了达到本发明的目的,可在小鼠内源GARP基因座引入编码人GARP蛋白的基因序列,使得该小鼠表达人或人源化GARP蛋白。具体来说,可以通过基因编辑技术在小鼠内源GARP基因座上用人GARP基因的核苷酸序列(例如DNA序列、cDNA序列等)替换小鼠相应序列,如将至少包含小鼠GARP基因的起始密码子ATG至终止密码子TAA的序列用对应的人DNA序列替换,得到人源化GARP基因座(示意图如图2所示),实现对小鼠GARP基因的人源化改造。
进一步设计如图3所示的打靶策略示意图,图中显示了靶向载体上含有小鼠GARP基因上游和下游的同源臂序列,以及包含人GARP DNA序列的A片段。其中,上游同源臂序列(5’同源臂,SEQ ID NO:3)与NCBI登录号为NC_000073.7第98137914至98143428位核苷酸序列相同,下游同源臂序列(3’同源臂,SEQ ID NO:4)与NCBI登录号为NC_000073.7第98149214至98152364位核苷酸序列相同;人GARP DNA序列(SEQ ID NO:5)与NCBI登录号为NC_000011.10的第76659604至76665954位核苷酸序列相同。
靶向载体上还包括用于阳性克隆筛选的抗性基因,即新霉素磷酸转移酶编码序列Neo,并在抗性基因的两侧装上两个同向排列的位点特异性重组系统Frt重组位点,组成Neo盒(Neo cassette)。其中,Neo盒5’端与人的连接设计为 其中,序列“CTGGCC”的最后一个“C”是人的最后一个核苷酸,序列 的第一个“T”是Neo盒的第一个核苷酸;Neo盒3’端与人的连接设计为 其中序列“GGATCC”的最后一个“C”是Neo盒的最后一个核苷酸,序列的第一个“C”是人的第一个核苷酸。此外,还在靶向载体3’同源臂下游构建了具有负筛选标记的编码基因(白喉毒素A亚基的编码基因(DTA))。改造后的人源化小鼠GARP的mRNA序列如SEQ ID NO:8所示,表达的蛋白序列如SEQ ID NO:2所示。
靶向载体构建可采用常规方法进行,如酶切连接等。构建好的靶向载体通过酶切进行初步验证后,再送测序公司进行测序验证。将测序验证正确的靶向载体电穿孔转染入C57BL/6小鼠的胚胎干细胞中,利用阳性克隆筛选标记基因对得到的细胞进行筛选,并利用PCR(PCR引物详见表1)和Southern Blot技术进行检测确认外源基因的整合情况,筛选出正确的阳性克隆细胞,经PCR鉴定为阳性的克隆再进行Southern Blot(分别用BclI或XmnI或AseI消化细胞DNA并使用3个探针进行杂交,酶、探针及目的片段长度如表2所示)检测,Southern Blot检测结果如图4所示,表明4个经PCR验证为阳性的胚胎干细胞(ES-01、ES-02、ES-03和ES-04)均为阳性的克隆,且无随机插入。
表1 PCR检测引物序列及目的片段长度
PCR条件如下:
Enzyme:2x Taq Plus Master Mix II(Dye Plus)
Program:2x Taq Plus Master Mix II(Dye Plus)progress
表2 Southern Blot酶和探针表
限制性内切酶 | 探针 | 野生型片段大小 | 重组序列片段大小 |
BclI | 5’Probe | 15.4kb | 9.7kb |
XmnI | 3’Probe | 11.4kb | 9.3kb |
AseI | Neo Probe | -- | 7.6kb |
Southern Blot检测包括如下探针引物:
5’探针(5’Probe):
5’Probe-F:5’-GGCTTTCCCAGAGGAAGATGACACC-3’(SEQ ID NO:13),
5’Probe-R:5’-AGCAGTGAGCACTTTGACTGATCCC-3’(SEQ ID NO:14);
3’探针(3’Probe):
3’Probe-F:5’-CCAACTAGGCCATCAGAGCATCAGG-3’(SEQ ID NO:15),
3’Probe-R:5’-CTTCAGAGTGGGAGTATCCTGGGGT-3’(SEQ ID NO:16);
Neo探针(Neo Probe):
Neo Probe-F:5’-GGATCGGCCATTGAACAAGAT-3’(SEQ ID NO:17),
Neo Probe-R:5’-CAGAAGAACTCGTCAAGAAGGC-3’(SEQ ID NO:18)。
将筛选出的正确阳性克隆细胞(黑色鼠)按照本领域已知的技术导入已分离好的囊胚中(白色鼠),得到的嵌合囊胚转移至培养液中短暂培养后移植至受体母鼠(白色鼠)的输卵管,可生产F0代嵌合体鼠(黑白相间)。将F0代嵌合鼠与野生型鼠回交获得F1代鼠,再将F1代杂合小鼠互相交配即可获得F2代纯合子鼠。还可将阳性鼠与Flp工具鼠交配去除阳性克隆筛选标记基因(该过程示意图见图5)后,再通过互相交配即可得到人源化GARP基因纯合子小鼠。
可通过常规检测方法确认阳性小鼠体内人GARP的基因或蛋白表达是否正确,例如,可以利用PCR(PCR引物详见表1)进行检测确认人源化杂合子和纯合子小鼠人源化基因是否正确。具体地,可以分别选取野生型C57BL/6小鼠和本方法制备的GARP基因人源化F1代杂合子小鼠,剪尾,设计如表3所示引物序列对C57BL/6小鼠和GARP基因人源化杂合子小鼠基因是否正确进行检测。PCR检测结果(图6)表明在C57BL/6小鼠和人源化杂合子小鼠的体细胞中检测到鼠GARP DNA的表达;仅在GARP基因人源化杂合子小鼠细胞中检测到人源化GARP DNA的表达,表明使用本方法能构建出人源化GARP基因工程小鼠。
其中,PCR的条件和参数如下,引物序列及目的片段长度见表3,PCR的反应条件如下:
Enzyme:KOD-FX
Program:Touchdown PCR
表3 PCR检测引物序列及目的片段长度
提取野生型C57BL/6小鼠和GARP基因人源化纯合小鼠脾脏组织RNA,利用逆转录试剂盒逆转录成cDNA,扩增鼠GARP片段和人GARP片段。实验结果显示(见图7),仅在野生型C57BL/6小鼠脾脏组织中检测到鼠GARP mRNA,仅在GARP基因人源化纯合子小鼠脾脏中检测到人源化GARP的mRNA。
进一步采用流式细胞术检测GARP基因人源化小鼠体内GARP蛋白的表达情况。选取9周龄野生型C57BL/6小鼠和GARP基因人源化杂合子小鼠各1只,取脾脏细胞,用抗鼠CD45抗体Brilliant Violet 510TM anti-mouse CD45、鼠源T细胞表面抗体PerCP/Cy5.5anti-mouse TCRβchain、GARP单克隆抗体GARP Monoclonal Antibody(YGIC86),PE,eBioscienceTM(mGARP)(以PE大鼠抗体IgG2a K同型对照抗体Rat IgG2a kap pa IsotypeControl(eBR2a),PE,eBioscienceTM(IgG 2a)抗体作参照),抗人GARP抗体PE anti-humanGARP(LRRC32)Antibody(hGARP)(以大鼠抗体Purified Mouse IgG2b,κIsotype CtrlAntibody(IgG 2b)抗体作参照)进行表染,再将表染后的细胞固定和穿膜后,用APC抗鼠抗体APC anti-mouse/rat Foxp3抗体再次进行染色标记Treg细胞,最后,将穿膜染色后的细胞进行流式检测,检测结果如图8所示,C57BL/6小鼠和GARP基因人源化杂合子小鼠体内均表达鼠GARP蛋白,而GARP基因人源化杂合子小鼠体内还同时表达人GARP蛋白。
进一步采用上述方法检测野生型C57BL/6小鼠和GARP基因人源化纯合子小鼠体内GARP蛋白的表达情况。检测结果如图9所示,C57BL/6小鼠体内仅检测到鼠GARP蛋白,不能检测到人GARP蛋白,人GARP蛋白只能在GARP人源化纯合子小鼠体内检测到。
进一步地,使用流式细胞术检测对C57BL/6野生型小鼠和GARP基因人源化纯合子小鼠的脾脏和外周血组织进行免疫分型检测,脾脏中白细胞亚型和T细胞亚型检测结果分别如图10和图11所示,外周血中白细胞亚型和T细胞亚型检测结果分别如图12和图13所示,从图中可以看出,GARP基因人源化纯合子小鼠脾脏和外周血中B细胞(B Cells)、T细胞(Tcells)、NK细胞(NK cells)、CD4+T细胞(CD4)、CD8+T细胞(CD8)、粒细胞(Granulocyte)、DC细胞(DC cell)、巨噬细胞(Macrophage)和单核细胞(Monocyte)等白细胞亚型与C57BL/6野生型小鼠一致(图10和图12),CD4+T细胞(CD4)、CD8+T(CD8)细胞和Tregs细胞(Treg cells)等T细胞亚型百分比与C57BL/6野生型小鼠一致(图11和图13),表明GARP基因的人源化改造没有影响小鼠体内白细胞和T细胞的分化、发育和分布。
更进一步分别对野生型C57BL/6小鼠和GARP人源化纯合子小鼠采血,进行血常规和血生化检测,血常规结果如图14所示,GARP基因人源化纯合子小鼠外周血样本中白细胞计数(WBC)、红细胞计数(RBC)、血红蛋白浓度(HGB)、红细胞压积(HCT)、平均红细胞体积(MCV)、平均红细胞血红蛋白含量(MCH)、平均红细胞血红蛋白浓度(MCHC)、血小板计数(PLT)、红细胞分布宽度(RDW-SD、RDW-CV)、平均血小板体积(MPV)、淋巴细胞计数(LYMPH#)、单核细胞计数(MONO#)和中性粒细胞计数(NEUT#)结果与C57BL/6野生型小鼠基本一致;血生化检测结果如图15所示,GARP基因人源化纯合子小鼠外周血样本中谷丙转氨酶(ALT)、谷草转氨酶(AST)、血清白蛋白(ALB)、血糖(GLU)、尿素(UREA)、肌酐(CREA)血清总胆固醇(TC)和甘油三脂(TG)结果与C57BL/6野生型小鼠基本一致。上述结果表明GARP基因的人源化改造没有影响血细胞的组成和形态,也没有改变AST和ALT水平及肝脏健康状态。
以上表明本实施例成功构建出可表达人GARP蛋白的GARP基因人源化小鼠。
实施例2体内药效验证
本实施例中使用的ABBV151是一种靶向人GAPR的人源化单克隆抗体,2018年由Argenx公司授权给Abbvie,目前在临床I期,主要用于治疗实体瘤。
利用本发明制备的GARP基因人源化小鼠构建肿瘤模型,可用于测试靶向人GARP的药物的药效。具体来说,选取实施例1制备的GARP基因人源化纯合子小鼠(7周龄、雌性),皮下接种小鼠结肠癌细胞MC38(5×105个),待肿瘤体积约50-70mm3后,按瘤体积分为对照组或治疗组(n=6/组)。对照组注射PBS,治疗组使用ABBV151(药物信息参见专利文本(公开号US20180327487A1))和/或Anti-mPD-1抗体(InVivoMabanti-mouse PD-1(CD279),购自BioX cell,货号:BE0146)。给药方式:腹腔注射(i.p.),分组当天开始给药,Anti-mPD-1每周给药2次,共给药6次,ABBV151每周给药3次,共给药9次,其中,ABBV151抗体为每周一、三、五给药;PBS、Anti-mPD-1抗体第一周是周三、周五给药,第二周、第三周是周二、周五给药;这三种药物均是从第一周的周三开始第一次给药,后面依次递推。每周测量肿瘤体积2次,接种后单只小鼠肿瘤体积达到3000mm3时执行安乐死。具体分组和给药情况见表4。实验周期内小鼠体重情况和肿瘤体积测量结果分别如图16-18所示。
表4:分组及给药情况
表5中列出了各个实验的主要数据和分析结果,具体包括分组时、分组后13天、分组后第27天时的肿瘤体积、小鼠存活情况、无肿瘤小鼠情况、肿瘤(体积)抑制率(TumorGrowth Inhibition value,TGITV)以及治疗组与对照组小鼠肿瘤体积的统计学差异(P值)。
表5:肿瘤体积、存活情况及肿瘤抑制率
如图16、17和表5所示,整体来看,各组实验过程中,动物健康状态良好,在第27天时,所有治疗组(G2、G3、G4、G5、G6)与对照组(G1)相比,动物体重呈增长趋势(图16和17),均无明显差异(P>0.05),表明动物对抗人GARP抗体ABBV151和抗鼠PD-1抗体Anti-mPD-1的耐受性良好,未对动物产生明显毒性作用,安全性较好。如图18和表5所示,从肿瘤体积结果上看,在各个时期,治疗组肿瘤体积均小于对照组,且在第27天,G2、G3、G4、G5和G6组小鼠肿瘤体积分别为1348±283mm3、1329±321mm3、420±103mm3、490±143mm3和285±119mm3,均小于对照组2022±440mm3,尤其是G4、G5和G6组与对照组相比具有显著差异(P<0.01)。G6组与G2、G4相比,抗人GARP抗体ABBV151和抗鼠PD-1抗体Anti-mPD-1联用的结果中有1只小鼠出现了无瘤情况。在实验结果表明本发明实施例的方法制备的GARP人源化小鼠可用于靶向人GARP的药物(如,抗体药物)的体内药效检测,也可用于GARP的药物与其它药物联合用药时体内药效检测。
实施例3双基因或多基因人源化小鼠
利用本方法或制得的GARP基因人源化小鼠还可以制备双基因修饰或多基因修饰的小鼠模型。如前述实施例1中,囊胚显微注射使用的胚胎干细胞可选择来源于含有PD-1、PD-L1、CTLA4、OX40、LAG3、TIM3、CD73等其它基因修饰的小鼠,或者,也可在人源化GARP小鼠的基础上,利用分离小鼠ES胚胎干细胞和基因重组打靶技术,获得GARP与其它基因修饰的双基因或多基因修饰的小鼠模型。也可将本方法得到的GARP小鼠纯合子或杂合子与其它基因修饰的纯合或杂合小鼠交配,对其后代进行筛选,根据孟德尔遗传规律,可有一定机率得到GARP基因与其它基因修饰的双基因或多基因修饰的杂合小鼠,再将杂合子相互交配可以得到双基因或多基因修饰的纯合子,利用这些双基因或多基因修饰的小鼠可以进行靶向人GARP和其它基因调节剂的体内药效验证等。
以上详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。
此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。
序列表
<110> 百奥赛图(北京)医药科技股份有限公司
<120> GARP基因人源化非人动物及其构建方法和应用
<130> 1
<150> CN202011419558.5
<151> 2020-12-07
<150> CN202110601632.3
<151> 2021-05-31
<160> 25
<170> SIPOSequenceListing 1.0
<210> 1
<211> 663
<212> PRT
<213> 小鼠(Mouse)
<400> 1
Met Ser His Gln Ile Leu Leu Leu Leu Ala Met Leu Thr Leu Gly Leu
1 5 10 15
Ala Ile Ser Gln Arg Arg Glu Gln Val Pro Cys Arg Thr Val Asn Lys
20 25 30
Glu Ala Leu Cys His Gly Leu Gly Leu Leu Gln Val Pro Ser Val Leu
35 40 45
Ser Leu Asp Ile Gln Ala Leu Tyr Leu Ser Gly Asn Gln Leu Gln Ser
50 55 60
Ile Leu Val Ser Pro Leu Gly Phe Tyr Thr Ala Leu Arg His Leu Asp
65 70 75 80
Leu Ser Asp Asn Gln Ile Ser Phe Leu Gln Ala Gly Val Phe Gln Ala
85 90 95
Leu Pro Tyr Leu Glu His Leu Asn Leu Ala His Asn Arg Leu Ala Thr
100 105 110
Gly Met Ala Leu Asn Ser Gly Gly Leu Gly Arg Leu Pro Leu Leu Val
115 120 125
Ser Leu Asp Leu Ser Gly Asn Ser Leu His Gly Asn Leu Val Glu Arg
130 135 140
Leu Leu Gly Glu Thr Pro Arg Leu Arg Thr Leu Ser Leu Ala Glu Asn
145 150 155 160
Ser Leu Thr Arg Leu Ala Arg His Thr Phe Trp Gly Met Pro Ala Val
165 170 175
Glu Gln Leu Asp Leu His Ser Asn Val Leu Met Asp Ile Glu Asp Gly
180 185 190
Ala Phe Glu Ala Leu Pro His Leu Thr His Leu Asn Leu Ser Arg Asn
195 200 205
Ser Leu Thr Cys Ile Ser Asp Phe Ser Leu Gln Gln Leu Gln Val Leu
210 215 220
Asp Leu Ser Cys Asn Ser Ile Glu Ala Phe Gln Thr Ala Pro Glu Pro
225 230 235 240
Gln Ala Gln Phe Gln Leu Ala Trp Leu Asp Leu Arg Glu Asn Lys Leu
245 250 255
Leu His Phe Pro Asp Leu Ala Val Phe Pro Arg Leu Ile Tyr Leu Asn
260 265 270
Val Ser Asn Asn Leu Ile Gln Leu Pro Ala Gly Leu Pro Arg Gly Ser
275 280 285
Glu Asp Leu His Ala Pro Ser Glu Gly Trp Ser Ala Ser Pro Leu Ser
290 295 300
Asn Pro Ser Arg Asn Ala Ser Thr His Pro Leu Ser Gln Leu Leu Asn
305 310 315 320
Leu Asp Leu Ser Tyr Asn Glu Ile Glu Leu Val Pro Ala Ser Phe Leu
325 330 335
Glu His Leu Thr Ser Leu Arg Phe Leu Asn Leu Ser Arg Asn Cys Leu
340 345 350
Arg Ser Phe Glu Ala Arg Gln Val Asp Ser Leu Pro Cys Leu Val Leu
355 360 365
Leu Asp Leu Ser His Asn Val Leu Glu Ala Leu Glu Leu Gly Thr Lys
370 375 380
Val Leu Gly Ser Leu Gln Thr Leu Leu Leu Gln Asp Asn Ala Leu Gln
385 390 395 400
Glu Leu Pro Pro Tyr Thr Phe Ala Ser Leu Ala Ser Leu Gln Arg Leu
405 410 415
Asn Leu Gln Gly Asn Gln Val Ser Pro Cys Gly Gly Pro Ala Glu Pro
420 425 430
Gly Pro Pro Gly Cys Val Asp Phe Ser Gly Ile Pro Thr Leu His Val
435 440 445
Leu Asn Met Ala Gly Asn Ser Met Gly Met Leu Arg Ala Gly Ser Phe
450 455 460
Leu His Thr Pro Leu Thr Glu Leu Asp Leu Ser Thr Asn Pro Gly Leu
465 470 475 480
Asp Val Ala Thr Gly Ala Leu Val Gly Leu Glu Ala Ser Leu Glu Val
485 490 495
Leu Glu Leu Gln Gly Asn Gly Leu Thr Val Leu Arg Val Asp Leu Pro
500 505 510
Cys Phe Leu Arg Leu Lys Arg Leu Asn Leu Ala Glu Asn Gln Leu Ser
515 520 525
His Leu Pro Ala Trp Thr Arg Ala Val Ser Leu Glu Val Leu Asp Leu
530 535 540
Arg Asn Asn Ser Phe Ser Leu Leu Pro Gly Asn Ala Met Gly Gly Leu
545 550 555 560
Glu Thr Ser Leu Arg Arg Leu Tyr Leu Gln Gly Asn Pro Leu Ser Cys
565 570 575
Cys Gly Asn Gly Trp Leu Ala Ala Gln Leu His Gln Gly Arg Val Asp
580 585 590
Val Asp Ala Thr Gln Asp Leu Ile Cys Arg Phe Gly Ser Gln Glu Glu
595 600 605
Leu Ser Leu Ser Leu Val Arg Pro Glu Asp Cys Glu Lys Gly Gly Leu
610 615 620
Lys Asn Val Asn Leu Ile Leu Leu Leu Ser Phe Thr Leu Val Ser Ala
625 630 635 640
Ile Val Leu Thr Thr Leu Ala Thr Ile Cys Phe Leu Arg Arg Gln Lys
645 650 655
Leu Ser Gln Gln Tyr Lys Ala
660
<210> 2
<211> 662
<212> PRT
<213> 人(human)
<400> 2
Met Arg Pro Gln Ile Leu Leu Leu Leu Ala Leu Leu Thr Leu Gly Leu
1 5 10 15
Ala Ala Gln His Gln Asp Lys Val Pro Cys Lys Met Val Asp Lys Lys
20 25 30
Val Ser Cys Gln Val Leu Gly Leu Leu Gln Val Pro Ser Val Leu Pro
35 40 45
Pro Asp Thr Glu Thr Leu Asp Leu Ser Gly Asn Gln Leu Arg Ser Ile
50 55 60
Leu Ala Ser Pro Leu Gly Phe Tyr Thr Ala Leu Arg His Leu Asp Leu
65 70 75 80
Ser Thr Asn Glu Ile Ser Phe Leu Gln Pro Gly Ala Phe Gln Ala Leu
85 90 95
Thr His Leu Glu His Leu Ser Leu Ala His Asn Arg Leu Ala Met Ala
100 105 110
Thr Ala Leu Ser Ala Gly Gly Leu Gly Pro Leu Pro Arg Val Thr Ser
115 120 125
Leu Asp Leu Ser Gly Asn Ser Leu Tyr Ser Gly Leu Leu Glu Arg Leu
130 135 140
Leu Gly Glu Ala Pro Ser Leu His Thr Leu Ser Leu Ala Glu Asn Ser
145 150 155 160
Leu Thr Arg Leu Thr Arg His Thr Phe Arg Asp Met Pro Ala Leu Glu
165 170 175
Gln Leu Asp Leu His Ser Asn Val Leu Met Asp Ile Glu Asp Gly Ala
180 185 190
Phe Glu Gly Leu Pro Arg Leu Thr His Leu Asn Leu Ser Arg Asn Ser
195 200 205
Leu Thr Cys Ile Ser Asp Phe Ser Leu Gln Gln Leu Arg Val Leu Asp
210 215 220
Leu Ser Cys Asn Ser Ile Glu Ala Phe Gln Thr Ala Ser Gln Pro Gln
225 230 235 240
Ala Glu Phe Gln Leu Thr Trp Leu Asp Leu Arg Glu Asn Lys Leu Leu
245 250 255
His Phe Pro Asp Leu Ala Ala Leu Pro Arg Leu Ile Tyr Leu Asn Leu
260 265 270
Ser Asn Asn Leu Ile Arg Leu Pro Thr Gly Pro Pro Gln Asp Ser Lys
275 280 285
Gly Ile His Ala Pro Ser Glu Gly Trp Ser Ala Leu Pro Leu Ser Ala
290 295 300
Pro Ser Gly Asn Ala Ser Gly Arg Pro Leu Ser Gln Leu Leu Asn Leu
305 310 315 320
Asp Leu Ser Tyr Asn Glu Ile Glu Leu Ile Pro Asp Ser Phe Leu Glu
325 330 335
His Leu Thr Ser Leu Cys Phe Leu Asn Leu Ser Arg Asn Cys Leu Arg
340 345 350
Thr Phe Glu Ala Arg Arg Leu Gly Ser Leu Pro Cys Leu Met Leu Leu
355 360 365
Asp Leu Ser His Asn Ala Leu Glu Thr Leu Glu Leu Gly Ala Arg Ala
370 375 380
Leu Gly Ser Leu Arg Thr Leu Leu Leu Gln Gly Asn Ala Leu Arg Asp
385 390 395 400
Leu Pro Pro Tyr Thr Phe Ala Asn Leu Ala Ser Leu Gln Arg Leu Asn
405 410 415
Leu Gln Gly Asn Arg Val Ser Pro Cys Gly Gly Pro Asp Glu Pro Gly
420 425 430
Pro Ser Gly Cys Val Ala Phe Ser Gly Ile Thr Ser Leu Arg Ser Leu
435 440 445
Ser Leu Val Asp Asn Glu Ile Glu Leu Leu Arg Ala Gly Ala Phe Leu
450 455 460
His Thr Pro Leu Thr Glu Leu Asp Leu Ser Ser Asn Pro Gly Leu Glu
465 470 475 480
Val Ala Thr Gly Ala Leu Gly Gly Leu Glu Ala Ser Leu Glu Val Leu
485 490 495
Ala Leu Gln Gly Asn Gly Leu Met Val Leu Gln Val Asp Leu Pro Cys
500 505 510
Phe Ile Cys Leu Lys Arg Leu Asn Leu Ala Glu Asn Arg Leu Ser His
515 520 525
Leu Pro Ala Trp Thr Gln Ala Val Ser Leu Glu Val Leu Asp Leu Arg
530 535 540
Asn Asn Ser Phe Ser Leu Leu Pro Gly Ser Ala Met Gly Gly Leu Glu
545 550 555 560
Thr Ser Leu Arg Arg Leu Tyr Leu Gln Gly Asn Pro Leu Ser Cys Cys
565 570 575
Gly Asn Gly Trp Leu Ala Ala Gln Leu His Gln Gly Arg Val Asp Val
580 585 590
Asp Ala Thr Gln Asp Leu Ile Cys Arg Phe Ser Ser Gln Glu Glu Val
595 600 605
Ser Leu Ser His Val Arg Pro Glu Asp Cys Glu Lys Gly Gly Leu Lys
610 615 620
Asn Ile Asn Leu Ile Ile Ile Leu Thr Phe Ile Leu Val Ser Ala Ile
625 630 635 640
Leu Leu Thr Thr Leu Ala Ala Cys Cys Cys Val Arg Arg Gln Lys Phe
645 650 655
Asn Gln Gln Tyr Lys Ala
660
<210> 3
<211> 5515
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
cgctacagag tagtcacaaa gccccttcct cgattgatac atgaccccat ggactccaac 60
ctggaaaagg tgtcctccta aagcagcaga tgaggaacgg tctctaacac ccatcgggtg 120
caggcccagg cctacatcga cttcatccaa aagagcggct cttgccattc tacacttggc 180
agagagggga actgaagttc agtctgacta gatagtacac acaagggctg aggtgggaga 240
gccacaaccc tgagagctcc cgagggtggg tgggggcagg aagctgggct actctgctgc 300
tctgactcct tatagcatca gaggatgcct ccttggtgaa cctttccctg accttaggtt 360
aggtcagggc tctagactgg agttgtcagg gactgtcctc tctgggttgt tcgcaccgca 420
tgggtccatc caaccactgt ggactagatg ggaggaaagg cccagctcag agcccagccc 480
tactctggct caccccgctt ggtgctgtta agatagggtg gatggccctc ctctaggcgc 540
tgtgaccacc agggagaaca ttatgaatac agaactagag actggaggac ggcagcaaca 600
ctcttcaccc atctttcagt ctagacccag cagggcacgg tgccagtgtc tgaggaggct 660
aagtaccttg taaaggcagc ggctttgggt aagttatgag actgtcatta tgcagtttaa 720
cctatcagag cctcaggtcc cccaaatgtc cgtggggacc tgacaagtct caaccagctg 780
gcttttccct catcccactc ctagcctcag cttctctatc agtaagcagg ggacactgac 840
aggcttggag atgacttaaa ggcaggatag ctgggggggg gggggggtgg atgggacccc 900
ctcagggcca tcccagggcc aaagaagggt cacttccttc cgtgccggtg gttgccagtc 960
acctctgggt ggccccctgc cttggtgcgg tggcgccagg atttcctccg cggacctgcg 1020
gctccctgca cccaagacct cgcgggccca cggctgcacg tgcggctgcc tcggcctagc 1080
ttcttttgtg atccttctcc ctccagtcgt ttttcggttt caagcgccgc cctagctggg 1140
tccgggcgat tccagagcag aggcgatgct cggttcctag gtccgcacgg ctggcagggc 1200
ggtgttagga ccccgcggct cagagtccca gggggcgtgg ccgggcggcc ggtgctattt 1260
aaaaggcggg cgccgccccc tcccggccgg ctggagcggc gctgcagcgg tccggcctcg 1320
gcgggccaga cccccggggt tgcgcgaacg atgcgcggag gagtcaggcg gcggcggcgg 1380
cgctgagcca ggtaggggcg gcggtcggcg gcggtgccta gagagctagg gccggaccct 1440
ccctcggcac ccgggtgtta gcagatctac ctaaggaagg gctcagatag gcgttcccat 1500
ttgacagctg ggaaaatcga ggcaggaagc tctgggtgtg cctaggagca cacagccaag 1560
caagcagatt aggatttgaa ttcaggtctg ccccaggcag acatgggctt tccacactac 1620
cactattatc tggaggggat acccagaact ctttggggag acttctttat gtgtgataga 1680
taggagggac ccccctaccc cacctccacc ctgacatttc acatcacaag cacattcctt 1740
tgggttaagg tctgattccc ctgagatgta ggatgtctct agaacgggct gcccctagtg 1800
agtgattcac tgcactgtga gccttgaagc tgctctccca ggcccccttt gacagtagtc 1860
ataacagact gagagcccta ccgctcagta tactcctggg cctggggctg taggctcctg 1920
agtaacttag gaaggaagtc ttggcagttg ctttggaggc acaggggctg gattctgata 1980
ccgactcttc gatttactgt acaagtgcct tagggtaagt catttctctg aatctcgtgg 2040
tctgggagag agatccacag ggtgcccgtg gggtctgcac tagtggagac cacccagcac 2100
taagggacta tagatctggc tgagtcccag ttgcagcaca cctaggggct aaggatcagg 2160
cactttgcct tcccaagcct cggtcctcca gtctgtaaat gggaattata gtaatcacct 2220
cacttggtgg ttgtgagagt taaaagacct gcagtcaacc tagggcttag aaaaattgta 2280
acctccttgc atagtagggg cagtcttatt tttattatag gtttgactcc actatctgtc 2340
tgtccccctc tgtcatgcac gcgcgagcac gcgtgcatgt gcacacacac atacaagcac 2400
atacagagat attctttgac acctctccaa tcagaatcca gctacctgcc tgcagagcca 2460
ggacctctat cctcagcatc gttggtatct gaaccatcag ggaaggacat ggaagggtcc 2520
cagtactttc ctggtcatgc tccacctgat ccatgctaag caaggatagc cagtgttgga 2580
atgggaactg gtgtgtcctg cagatgaatc acctaggcaa ggagagataa agaatttgcc 2640
ctgaggacca cactagccag tggtggggct tgacagtgag ccctgggttt gaatgcctct 2700
ggttgtccct ggggggctga gttctcactg ctgcagatgg ggcacagcag ggtgcttctt 2760
tccaccataa ttctgtgggg actgtctctt ctggatgtgc agaggaagga gagacagggt 2820
ccctttgggc atccctacct taaccccagg tcctaacttg tccttattgc agctgaattt 2880
gtgacatcat tcagccactt gttccctggg agaaatttag tgagcatata cttaaggaat 2940
gaagcaaatg agaaatgaga gcgggagggg ggatagaaca cccaggagcc tgagcaggaa 3000
cattctggac caggagggag cagccaagca gagtccttcc ccatccccca tccccctccc 3060
ccccacacac acccaccacc aggcagcagg gaaggtactg aggtgactga ggagtttgct 3120
gaggggaaga aggtggtagg tggagctgat gggagagagg gtgacgtctg aacgctactg 3180
gagatttcaa agtgatttgt aagatctggc atgtgatttt gaaacgtcac tgggtgccat 3240
gtatggggca gattgtcccg tcctagaggg aagcaagaag gcaaacagtg gagttggctg 3300
ttgcagtgaa ggtgggcggc tttgaacctg ctggactagg gcggggaggg gccaggggga 3360
cctctcctca cctgtatccc atagtggaga cttgcctgct gctgcgccat ctgacttccc 3420
tgtgtcataa ggtgggtccc cacgggtact tccttttcaa gaggtaggga atcacagtgg 3480
ggtgtgctgt gtgccccaca ctgagctgtc cgatgctcag caactgtgag agccctgaga 3540
acacagggta accgtgagaa ccagaggaag cttcctagag gacagggcat ctaagctcca 3600
cgggtgaaga gacattgagc tgcaggggag gcagaggaag ccaggggtcc agaggtccaa 3660
aggaagcaca ggtccgtaca tgtgctcagg gctcagagac agagcgagga caatgacaag 3720
tcaggtggga gacaagagct ggccgaggga gggatggttg cccagggcct ggacatgaag 3780
gctggcccag gaagggatag ctgctcagag cctggagatg aaggccaggg gctttcattt 3840
agctctgagg atgctgatgt taagcaggta gggactgcat ttgaaccaaa agaacaaaat 3900
ttcctgtgaa ttcatagcct gcagtgaaag cggagcactg tggggcaggg ctgggctctg 3960
ggggagccag gaaggagagt tgaaagggcc acactagccc ctgcgtgttt cagcaagata 4020
agcagccacg gcattgagag tcatccccag tgggttctga cagtcaaaag agccggcaca 4080
ggcctgcaga gctctcccaa ggccatcttt agagtggcaa ctctcattcc cttacccact 4140
gttggagacc ttcaagtgca gaggcgaagg gcacagagtc taccatgtag ctgtgttgtc 4200
ttagctgtat tttataacct ctctgagcct cggtgttgtt ttggtttggc tgtttgtctt 4260
ttcccttcta taaactaaga tgtgtaagga aacagagctg agtccttgag cgtcaggttt 4320
gatggtgagg tatgatatgc tgtaacacct tcatagaatg tctgttgtcc tcaacaaaac 4380
ctgacattta cccctggaaa caacgtcaga gagataacac ctgtgtaagg tcacacagca 4440
gatgcctagc agagatgaga gggagcgagt gctatggtct ctcctcgcaa gcacgctgcc 4500
gccgccatat ccacgcttcc gccgccatgt ccaggctgta atctccctgt ttcccagcat 4560
agaactagat gtgaggtgac attcagtatg ggaggaagtg aatgcattaa ttaattaatt 4620
aattaattaa ctaacaggtt gatctgtgtt tccccagcac atggctcaag tccacaggga 4680
ttcacccctg ctaagagcct ctgaggtccc catgggtccc tgtgctggct gcttacactg 4740
caatggagct ctggacctgg gcagctgtag ccttcagtga aagtagctgc ctggcagcct 4800
gctggggtgg ggcttcctgt cagcacccgg ccagcccctg acaatgacaa ggtctaagaa 4860
ttccaaccaa aagtaaaagg tcaaaaggaa ggatttgtgg agaatgaaac attccatttg 4920
gggctaagga cctgggatgg gggcctgcct ggggcctgga gggaaattga gtcagaggtt 4980
cactccccca cccaatccgg ccctgcccta gggtccctct gtcacctgag caccccttcc 5040
taactgtctt ctgccaggtg accctcttta gtttttttat tgcattttat ttattggaag 5100
ggaggtgtgc atgtgtagcg ggaagttgaa gtccaggagc cagctttctc cttccaccat 5160
gtgggtccca gagtcaaact caggcctaat ggcaagagcc tttacccctg ggccttttca 5220
atggcctgag gtgggcctta ggtaaacgca aagcagacgg tcatacattg ctttaaaagt 5280
cttgcttcct ctgagcaatg actcagctcg ccttcaaact tgcaatccct ggcctcctac 5340
ctcagcctct tgagttccag aataccacta ctctcagctc ccctgaggcc cgcgcacggc 5400
ccacgtggct cccgatttct gtcaggatcc ccgagggagg gcaagtgggt gctgctgtcg 5460
gtggggggag ccgtggtctc aacattgctc tcttctctcc accctaggca gagcc 5515
<210> 4
<211> 3151
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
caggctcggg aagccagagg ggcagagaag ttggggtcca actcaggtta ctcagtgacc 60
agggacttgg tgtcctgcac actgccgcgt gggcaggttc cttcccaggc tgcatctgtg 120
ggccagctgt gcagctcgaa gtggggcagt ttactgcaca gaggatgcca accgacagct 180
cgacgctgag tatctgtttc aggccacacc cgtctccggg tactagtaaa tgaaacacat 240
gcctatcctc aggcaagaga ggccgtcact gaaccacaca gtgaccacat aggcttgagg 300
tggggaagca gtaggctgga catggagaac ccaccctgac ttagagcagg agagccagcc 360
cgtgagagga tttgtctgag tcctttccac cccgagctct gtcgcatctg ctgataatga 420
ctttcagcct ctctggaaat gaagaacttg tgacctgaag agagagccag aacctctccc 480
cagaggtctt aagtctaggc tcctaggcta ggggctgcac cagcttaaag tgtgatcacc 540
taggcttcca cgcaggcctg ggccgtcctg tgtcctgctt tggacaggcc ttctctccag 600
tgcactcttg tatcacacac acactgaccc tggtgctgcc tgttccccaa ccccctgctc 660
aggcctcctt ctatcccagc cccaccctga cttttgagcc aagagggaga gcctcagcta 720
tctggttcag cttagcagct gcagaggcaa agtcaagcca actctcagag gtttctgtgt 780
tatctgggtt atacacaaga agaaaacaaa tttccttatg cattctcctt tgagagcctc 840
atggctcaga gagctgacga agccaaaatg aatcaagtcc atgtcctccc atctctgggg 900
ccaaagcttt gccagtgcgg tacctgcagg ctgtcaagtg gacaggaagt ggccctgccc 960
taaccaggat ccaagcacac ttgctacata taccccctcc ctctcagaca ggcgcccaca 1020
gaccctctgc ctctctgcct cagtgtccct tctttgcaga agagtatgaa ttcttccttt 1080
ctctttctgc tccccaaaat ctcattgagt gtaatctccc cactgaacag atagggaaag 1140
ttaggtgcag gccttgctca gaatcacgca agtcaatgga agaaaactgg gaacaaaagt 1200
agctgggcgg ttgcgccaag gcagagggtt tgctttgtgt gctcaaggcc ctgagctgga 1260
tgccagcggc tgtacccgtg tttccctacg ctcagcagtc acagcacgag acaaggccag 1320
ctaccatgcc agtcctcacc aggcatggaa aaataatagg gacacacaca cacacacaca 1380
cacacacaca cacacactgt ctccactcat tctccaggct tgtgggctgc agggaggaag 1440
gggagtcctg gacccagtca cagagcctgc tgcatcagat ccctgtgctc ggcccacagt 1500
cagccagagc ttccgtaatg tacaagaaga cgaaaacgcc attctctcta ccccactcta 1560
caggtgaggg gactgaggcc cagagaaggt taaaggctcc gaggaccaat aggcagatcc 1620
agacctagaa ccttccctca ctggtgctgc tgcgcacaca gctcttctcc tcggcctgga 1680
ggccaaggcg tggtggcccc tgggcctgaa ctctgaaaac actaatcaat gctgctctca 1740
cctcccagga ctggcctcta ccgggccctg ggacccgctc tttgtataac tcacatgaat 1800
gtattaaagt ataattttgg agaaactgtg gcctgccagc ctgcttactt cgggtatccc 1860
ataacctcat actggaatcc tgaccctgtt tccctcctca ggggctttta ttccttgtga 1920
ggtattgggg gggagggggg aaggacactg aagctcttag cctggcccac ccctggccag 1980
cctctactgt ggccacttca tacggaacat cacctatgcc ctaccccagc tctagaaaac 2040
agcggctgcg gctctttccc acctgtctgc ggccatgtgc ccactgcctt tctctgtatc 2100
cactcctcat cttaaaaccg gtgaaagacc cctgttgcca tctcaccatc cctcactctc 2160
actctcagag gcaggtccct tcccccaccc ccaaccctcc ccccatctcc ccagcccacc 2220
ctaccctgcc ttagctgaga tctcccaagg cctccttaca agatctccat acctttagac 2280
ctttgtccct ggactccacg gcccctcacc tcaccctcaa cctccctaac tccatccagg 2340
aagctgcctc ctccctctca agctactgtt ccccagccac tccgcctgct cctctttctc 2400
cagccacctc caagtgatgg atgcctcatc tgtccctcca gactgcttct gtggagacat 2460
ccaggcaccc tgcaccccag ccagagagtt acattgtctc ctaggggcta gagagtccag 2520
gcagaattta gtctgcaagc agtcaactta gggggggggg gggagaggga agagagaggg 2580
aggaggagag ggagagagag agagttaaga gttgaggaag ggagaggagc tgcctcacag 2640
gcggacatgg ggaaggttgt caagagggtc tcagtgaagg cgacatcagc tcagcacacc 2700
aacacctaga cccttgccct ctgcagctgc tagtcctcca cccagcctgc ttttccagca 2760
ggcttccccg aactctaagc accctggtca catctccata gctggagtgg cccctgggcc 2820
ctcctccctc cctggatgga cacccttgtc ttctcctaaa ggtccctttg aattgttttt 2880
ttctgcctcc agcctcttgc ccagcccctg ctcccagctc tctttctcca gaggaggacc 2940
tgagctatca ctagggatgg gaaagcacac agcgggggct cagggaaggc agagttagac 3000
tcggccatcg aatgggctgg gcttagccca gggtctggga gtctctcatc ccacaggaac 3060
ccagcaggcc cctgaccttc cttcctggca aacagcagag cctattcacc tggcctagac 3120
cctcagtgag acagaaattc ctgttttcag g 3151
<210> 5
<211> 6351
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
atgagacccc agatcctgct gctcctggcc ctgctgaccc taggcctggc tgcacaacac 60
caagacaaag tgccctgtaa gatggtaaga tgctctgccc agacagggtg aggaccaccc 120
ccacctccct gccctagggt gtgctagtgc cccagcccca gaagccagaa gttagaagag 180
tcaggagagg aaagggaatg taccttgcat ttaatgagca cctactagaa tgtttaaaca 240
ccttatttac ccacagtcct gccaggtaag caccattatt ctcattttgc aaaggaggag 300
actgaggctt ggagagattg ggccttgtcc aaggtcattc agctgggaac agtgaggctg 360
atattacact gtattccccc aagctgtccc cacagagcag taggcccagc taggggatct 420
agaatatata tatatgtgtg gggaatttgg ggtaggccag ctgggagggg ctcctctgtg 480
ctcatccctc ttggagacaa atccccttcc aagctgggct ccttgacttg ggactgcccg 540
ctggagtgcc tctcacttct tagtgcccag atcaaatgct gccatctcca ggaagcctcc 600
ccagcccctc ccaggctggc ctagtctgat cacaccttcc tctgggttcc tgcggtcccc 660
aggcttcccc ctatctcaat actgagaaga ctgaacatgt ggggtggttg gtgaaagggt 720
ccaagcctgt ctcacctgcc agaccatgaa cttccctagg gcaaggacca agtttgattt 780
gcttctattc ctttttcctg tcccaagcca gggaaactag ccctaaagtt cttgtgactc 840
tatgagatac agggcaaaga gaacacctag atccacttgt aaggccgggc agtcactgag 900
gccagagcct ggctggggaa agggcagggc ctccggaagc ccctcttgga cctgagactc 960
gaagaagctt atgacacaga accggcagct gcttcaggag gcaggaagtg caggcagctg 1020
cctgcccgca gcccttccct gggggtgcaa tgtctcctgt tgccaccacc tttcttgctc 1080
ttcagagccc ttctaagatt cccggagccc agaattgcgg gcagagaagg cctcagatgt 1140
caccaaatac aaacgcacat tctacctcag ggagacgagg ctcagagggg aaagtccttg 1200
actacccaac aggcagaggg gaagcgggtg aattttggag tctggggaaa tgagataaga 1260
gataggaaag cactttctga accagcatgg gaataataca cacgggaagt aaggagaaga 1320
tgtgtgaccc accagggacc tacaggattc gaacccagct gcctttgcca ctgttcactg 1380
cctggtgcct ctccctactc tgctttcctc ccatgatcag gtggtgaaat ggagttggat 1440
ggcaagtctt tgcttctgaa aaggaagctg ggcagtgggt gtcctgatag cccaggacag 1500
tgggtgggag ctctaaactc tggtcaaggg ccaattcctc caattccctc cgacggtaag 1560
tcaggcaatg ctgggagctc agagctgaag gaggcatgaa gaccctggaa gtggagctct 1620
gagcaccgcc ctggacttca agcttcttcc tggactggac tggagatctg ggcatcccag 1680
tgcagccctg cccaccatca ggcccccagg cttctagagc aggggtcttg ggcccctgaa 1740
tggaaagcca gtcttgggct gtgggcttgg caaactttgt gtcctggatc aagtctcagg 1800
ggctggtgcc ccagggagcc tttgcctatc cagaggcagt atgcctctgc acttgcccgg 1860
gggtaacacg cggggcacag cacggtgccc cccacactgt aacagtcagt aagtgggtcc 1920
atgatgctct ttgctgtgct gaccagctga gggcccagtg gtcagaactt ggctggcacc 1980
aataggaaaa ggaatttgca aatgggagtt ttgagcccct gactgtctga tcttgggcag 2040
cccactcccc ttagcctcag tttcgttagg ggtacaatag gaacagggtg aacaatgcct 2100
gggaagattt aatggggtag ggggtctctg cactcagcac gcagcctgac acagctgggg 2160
ctccatcaca ggtcattttg ttgtttctgc tttaagtaag gaatgcccca gggggtaagg 2220
gctgtgagga ggaggctatg tttagtggcc cctgcagaca gagaggttgt gagggaggaa 2280
gggcaaggat gggcaaggca gctgggcagg tttcaggttc acacaggtgc ccaactgacg 2340
gggcatccct gggcctcctg aggcccctgt gaagctgcct cccttggagg ctacatggag 2400
tcactgtgct gcatggagta agaagagcca cacggaggcc tgaggctggg caggtctctt 2460
cctcccccta ctcaccttgg ggctctcagg aggaagcgca gagctggacc aggggaggaa 2520
cacaccggct tgtgttccct ccctaccagc tcagccactg gctcactgtg aattcacgca 2580
agtcactgcc atcttcaggc ctcagtgttc acatctggga agtgggtcag ctgaactctt 2640
cttgctctac ccgtctttga ctatattttg aaaatatcaa ttatgcattt tctttcctcc 2700
tagagaagtg attgattcag tgcctcagac ctttactaaa ctgatgatgt ctgggactca 2760
ttcattagga aaaattgact tgctagtcag gtccaaggca tgcacatcca ccaaaccagt 2820
ccctgtttgc tctgagctcg ctgtctagca ggtcctcaca cacacagcca caattcagcg 2880
gggcaaagct ctgagaggaa gcacagtcag ggagggctcc ctggtggagg aggccctgaa 2940
gctcagtgtg aagagttcat gtgtggatct ggttggggat ggcataacca gctcagggag 3000
caggccccag cagtgggtgt gggagcgcat gatgggcagt ggtcagctgt ggtcactgca 3060
tgtgggctgg ggtgggaggt gggggacagg ttggcagggg ctacaaacag cctcgaaggc 3120
cctgctgggg atcctggact tcaccgtgga gaagtttaag ccaagctgcc tcattgtcag 3180
agtagagctt ttgagcagtt gtcaggcatt tagcagtgag tgggtcagaa cgggttggcg 3240
gagacagaag ctgggggcgg tgagcctgag cccggtgatt gtggaagtca gacctttttc 3300
tgggaaaggc tggggttcct ggaggcctgg aagagaagag ggagacctgc atttgcacag 3360
gaagaatttt ggtcccagaa ggcacatctg tggaagaaca agagttcggc cttttgttgt 3420
taaaaaacct gggttcaaat cccagctctg ctcctcacca gctgggcaat cctggcacct 3480
cccttcccct ccctgagcct agatttctgt aaataggggt gatcgtatca gatgggcagg 3540
ctgtggtaaa gaccaatggg accatgggcc tgaaagtatt aaccaagatg tcaaatgctg 3600
agtggctgct ggggaagaac gtaagaaaac agagtggtta tgtgacttcc tggaggtcgc 3660
acagcacaaa cacagtctca tcaccaaaga ctgtggattt ggctctggcc atcttttccc 3720
tggcccttcc cacctccagg ggcccggtcc cctgacccag cctgggaaga aagccacctc 3780
ctaggaggta acagcaacag agaggaagcc acatctcgga agcatccaca aggaaggcag 3840
gccccaggac ccaggctctg cccatgacac gagagcctga atgaggtctg aggcagggag 3900
gccaagataa aaactgatga cagagcacaa attacagttt tcccttttgg aaacatttct 3960
cccaaagtgg agaaattccc atctaccacc agaaatttaa ctatctgtgc ccatagaagg 4020
gacctaggac atagaatcag gagccctggg tcccagctct gccctgctgc tcactggctt 4080
ggggtcactc tgtgggatat atggctgttt cctgtaagag gggtaataat aagtacaggg 4140
tttctctttg ttagtttatt tgtccttcta tctgtctatc atctctccat ctgtccaccc 4200
atggaacctt catcgagttc cttccttaat gcccattact gcgctgggtg cccgagatgg 4260
ggcagggagc cggatgggtc atccaggcat ggggtgatca ggctgcggtg ggggaaagtt 4320
gagcattctg ggagtccatg ggagaagggt tccccagcca ggcagggttc ctggataaac 4380
atgtctggtt tcatccccta ccgtgcccac ttatgccagc tgtctcccca ccctacccct 4440
ccccaggtgg acaagaaggt ctcgtgccag gttctgggcc tgctccaggt cccctcggtg 4500
ctcccgccag acactgagac ccttgatcta tctgggaacc agctgcggag tatcctggcc 4560
tcacccctgg gcttctacac agcacttcgt cacctggacc tgagcaccaa tgagatcagc 4620
ttcctccagc caggagcctt ccaggccctg acccacctgg agcacctcag cctggctcac 4680
aaccggctgg cgatggccac tgcgctgagt gctggtggcc tgggccccct gccacgcgtg 4740
acctccctgg acctgtctgg gaacagcctg tacagcggcc tgctggagcg gctgctgggg 4800
gaggcaccca gcctgcatac cctctcactg gcggagaaca gtctgactcg cctcacccgc 4860
cacaccttcc gggacatgcc tgcgctggag cagcttgacc tgcatagcaa cgtgctgatg 4920
gacatcgagg atggcgcctt cgagggtctg ccccgcctga cccatctcaa cctctccagg 4980
aattccctca cctgcatctc cgacttcagc ctccagcagc tgcgggtgct agacctgagc 5040
tgcaacagca tcgaggcctt tcagacggcc tcccagcccc aggctgagtt ccagctcacc 5100
tggcttgacc tgcgggagaa caaactgctc catttccccg acctggccgc gctcccgaga 5160
ctcatctacc tgaacttgtc caacaacctc atccggctcc ccacagggcc accccaggac 5220
agcaagggca tccacgcacc ttccgagggc tggtcagccc tgcccctctc agcccccagc 5280
gggaatgcca gcggccgccc cctttcccag ctcttgaatc tggatttgag ctacaatgag 5340
attgagctca tccccgacag ctttcttgag cacctgacct ccctgtgctt cctgaacctc 5400
agcagaaact gcttgcggac ctttgaggcc cggcgcttag gctccctgcc ctgcctgatg 5460
ctccttgact taagccacaa tgccctggag acactggaac tgggcgccag agccctgggg 5520
tctctgcgga cgctgctcct acagggcaat gccctgcggg acctgccccc atacaccttt 5580
gccaatctgg ccagcctgca gcggctcaac ctgcagggga accgagtcag cccctgtggg 5640
gggccagatg agcctggccc ctccggctgt gtggccttct ccggcatcac ctccctccgc 5700
agcctgagcc tggtggataa tgagatagag ctgctcaggg caggggcctt cctccacacc 5760
ccactgactg agctggacct ttcttccaat cctgggctgg aggtggccac gggggccttg 5820
ggaggcctgg aggcctcctt ggaggtcctg gcactgcagg gcaacgggct gatggtcctg 5880
caggtggacc tgccctgctt catctgcctc aagcggctca atcttgccga gaaccgcctg 5940
agccaccttc ccgcctggac acaggctgtg tcactggagg tgctggacct gcgaaacaac 6000
agcttcagcc tcctgccagg cagtgccatg ggtggcctgg agaccagcct ccggcgcctc 6060
tacctgcagg ggaatccact cagctgctgc ggcaatggct ggctggcagc ccagctgcac 6120
cagggccgtg tggacgtgga cgccacccag gacctgatct gccgcttcag ctcccaggag 6180
gaggtgtccc tgagccacgt gcgtcccgag gactgtgaga aggggggact gaagaacatc 6240
aacctcatca tcatcctcac cttcatactg gtctctgcca tcctcctcac cacgctggcc 6300
gcctgctgct gcgtccgccg gcagaagttt aaccaacagt ataaagccta a 6351
<210> 6
<211> 128
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
gcacagcaca aacacagtct catcaccaaa gactgtggat ttggctctgg ccatcttttc 60
cctggcctca tgactcgagg tcgacggtat cgataagctt gatatcgaat tccgaagttc 120
ctattctc 128
<210> 7
<211> 134
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
actagagctt gcggaaccct tcgaagttcc tattctctag aaagtatagg aacttcatca 60
gtcaggtaca taatggtgga tcccttccca cctccagggg cccggtcccc tgacccagcc 120
tgggaagaaa gcca 134
<210> 8
<211> 3929
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 8
ggccggctgg agcggcgctg cagcggtccg gcctcggcgg gccagacccc cggggttgcg 60
cgaacgatgc gcggaggagt caggcggcgg cggcggcgct gagccaggca gagccatgag 120
accccagatc ctgctgctcc tggccctgct gaccctaggc ctggctgcac aacaccaaga 180
caaagtgccc tgtaagatgg tggacaagaa ggtctcgtgc caggttctgg gcctgctcca 240
ggtcccctcg gtgctcccgc cagacactga gacccttgat ctatctggga accagctgcg 300
gagtatcctg gcctcacccc tgggcttcta cacagcactt cgtcacctgg acctgagcac 360
caatgagatc agcttcctcc agccaggagc cttccaggcc ctgacccacc tggagcacct 420
cagcctggct cacaaccggc tggcgatggc cactgcgctg agtgctggtg gcctgggccc 480
cctgccacgc gtgacctccc tggacctgtc tgggaacagc ctgtacagcg gcctgctgga 540
gcggctgctg ggggaggcac ccagcctgca taccctctca ctggcggaga acagtctgac 600
tcgcctcacc cgccacacct tccgggacat gcctgcgctg gagcagcttg acctgcatag 660
caacgtgctg atggacatcg aggatggcgc cttcgagggt ctgccccgcc tgacccatct 720
caacctctcc aggaattccc tcacctgcat ctccgacttc agcctccagc agctgcgggt 780
gctagacctg agctgcaaca gcatcgaggc ctttcagacg gcctcccagc cccaggctga 840
gttccagctc acctggcttg acctgcggga gaacaaactg ctccatttcc ccgacctggc 900
cgcgctcccg agactcatct acctgaactt gtccaacaac ctcatccggc tccccacagg 960
gccaccccag gacagcaagg gcatccacgc accttccgag ggctggtcag ccctgcccct 1020
ctcagccccc agcgggaatg ccagcggccg ccccctttcc cagctcttga atctggattt 1080
gagctacaat gagattgagc tcatccccga cagctttctt gagcacctga cctccctgtg 1140
cttcctgaac ctcagcagaa actgcttgcg gacctttgag gcccggcgct taggctccct 1200
gccctgcctg atgctccttg acttaagcca caatgccctg gagacactgg aactgggcgc 1260
cagagccctg gggtctctgc ggacgctgct cctacagggc aatgccctgc gggacctgcc 1320
cccatacacc tttgccaatc tggccagcct gcagcggctc aacctgcagg ggaaccgagt 1380
cagcccctgt ggggggccag atgagcctgg cccctccggc tgtgtggcct tctccggcat 1440
cacctccctc cgcagcctga gcctggtgga taatgagata gagctgctca gggcaggggc 1500
cttcctccac accccactga ctgagctgga cctttcttcc aatcctgggc tggaggtggc 1560
cacgggggcc ttgggaggcc tggaggcctc cttggaggtc ctggcactgc agggcaacgg 1620
gctgatggtc ctgcaggtgg acctgccctg cttcatctgc ctcaagcggc tcaatcttgc 1680
cgagaaccgc ctgagccacc ttcccgcctg gacacaggct gtgtcactgg aggtgctgga 1740
cctgcgaaac aacagcttca gcctcctgcc aggcagtgcc atgggtggcc tggagaccag 1800
cctccggcgc ctctacctgc aggggaatcc actcagctgc tgcggcaatg gctggctggc 1860
agcccagctg caccagggcc gtgtggacgt ggacgccacc caggacctga tctgccgctt 1920
cagctcccag gaggaggtgt ccctgagcca cgtgcgtccc gaggactgtg agaagggggg 1980
actgaagaac atcaacctca tcatcatcct caccttcata ctggtctctg ccatcctcct 2040
caccacgctg gccgcctgct gctgcgtccg ccggcagaag tttaaccaac agtataaagc 2100
ctaacaggct cgggaagcca gaggggcaga gaagttgggg tccaactcag gttactcagt 2160
gaccagggac ttggtgtcct gcacactgcc gcgtgggcag gttccttccc aggctgcatc 2220
tgtgggccag ctgtgcagct cgaagtgggg cagtttactg cacagaggat gccaaccgac 2280
agctcgacgc tgagtatctg tttcaggcca cacccgtctc cgggtactag taaatgaaac 2340
acatgcctat cctcaggcaa gagaggccgt cactgaacca cacagtgacc acataggctt 2400
gaggtgggga agcagtaggc tggacatgga gaacccaccc tgacttagag caggagagcc 2460
agcccgtgag aggatttgtc tgagtccttt ccaccccgag ctctgtcgca tctgctgata 2520
atgactttca gcctctctgg aaatgaagaa cttgtgacct gaagagagag ccagaacctc 2580
tccccagagg tcttaagtct aggctcctag gctaggggct gcaccagctt aaagtgtgat 2640
cacctaggct tccacgcagg cctgggccgt cctgtgtcct gctttggaca ggccttctct 2700
ccagtgcact cttgtatcac acacacactg accctggtgc tgcctgttcc ccaaccccct 2760
gctcaggcct ccttctatcc cagccccacc ctgacttttg agccaagagg gagagcctca 2820
gctatctggt tcagcttagc agctgcagag gcaaagtcaa gccaactctc agaggtttct 2880
gtgttatctg ggttatacac aagaagaaaa caaatttcct tatgcattct cctttgagag 2940
cctcatggct cagagagctg acgaagccaa aatgaatcaa gtccatgtcc tcccatctct 3000
ggggccaaag ctttgccagt gcggtacctg caggctgtca agtggacagg aagtggccct 3060
gccctaacca ggatccaagc acacttgcta catatacccc ctccctctca gacaggcgcc 3120
cacagaccct ctgcctctct gcctcagtgt cccttctttg cagaagagta tgaattcttc 3180
ctttctcttt ctgctcccca aaatctcatt gagtgtaatc tccccactga acagataggg 3240
aaagttaggt gcaggccttg ctcagaatca cgcaagtcaa tggaagaaaa ctgggaacaa 3300
aagtagctgg gcggttgcgc caaggcagag ggtttgcttt gtgtgctcaa ggccctgagc 3360
tggatgccag cggctgtacc cgtgtttccc tacgctcagc agtcacagca cgagacaagg 3420
ccagctacca tgccagtcct caccaggcat ggaaaaataa tagggacaca cacacacaca 3480
cacacacaca cacacacaca ctgtctccac tcattctcca ggcttgtggg ctgcagggag 3540
gaaggggagt cctggaccca gtcacagagc ctgctgcatc agatccctgt gctcggccca 3600
cagtcagcca gagcttccgt aatgtacaag aagacgaaaa cgccattctc tctaccccac 3660
tctacaggtg aggggactga ggcccagaga aggttaaagg ctccgaggac caataggcag 3720
atccagacct agaaccttcc ctcactggtg ctgctgcgca cacagctctt ctcctcggcc 3780
tggaggccaa ggcgtggtgg cccctgggcc tgaactctga aaacactaat caatgctgct 3840
ctcacctccc aggactggcc tctaccgggc cctgggaccc gctctttgta taactcacat 3900
gaatgtatta aagtataatt ttggagaaa 3929
<210> 9
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
tcccaagaga cctctgtagt tgggg 25
<210> 10
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
cagggcactt tgtcttggtg ttgtg 25
<210> 11
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
ccggcagaag tttaaccaac agtat 25
<210> 12
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
cgggtggtct gagatggtga gacag 25
<210> 13
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
ggctttccca gaggaagatg acacc 25
<210> 14
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
agcagtgagc actttgactg atccc 25
<210> 15
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
ccaactaggc catcagagca tcagg 25
<210> 16
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
cttcagagtg ggagtatcct ggggt 25
<210> 17
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
ggatcggcca ttgaacaaga t 21
<210> 18
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
cagaagaact cgtcaagaag gc 22
<210> 19
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
gcaatgactc agctcgcctt caaac 25
<210> 20
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
gccccacggt ccctaactga ataac 25
<210> 21
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
gctccaattt cccacaacat tagt 24
<210> 22
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
ttctaacttc tggcttctgg ggctg 25
<210> 23
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
tcccctccct gagcctagat ttctg 25
<210> 24
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
ccgagatgtg gcttcctctc tgttg 25
<210> 25
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
gacaagcgtt agtaggcaca tatac 25
Claims (19)
1.一种人源化GARP基因,其特征在于,所述的人源化GARP基因包含人GARP基因的部分。
2.根据权利要求1所述的人源化GARP基因,其特征在于,所述的人源化GARP基因包含编码人GARP蛋白的全部或部分核苷酸序列;优选的,包含编码人GARP信号肽、跨膜区、胞质区和/或胞外区的全部或部分核苷酸序列;更优选的,所述的人源化GARP基因包含编码人GARP蛋白的胞外区的全部或部分核苷酸序列,进一步优选的,包含与编码SEQ ID NO:2第20-627位的核苷酸序列具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列或者包含编码SEQ ID NO:2第20-627位的核苷酸序列,更进一步优选的,包含与编码SEQID NO:2的核苷酸序列具有至少70%、75%、80%、85%、90%、95%或至少99%同一性的核苷酸序列或者包含编码SEQ ID NO:2的核苷酸序列。
3.根据权利要求1或2所述的人源化GARP基因,其特征在于,所述的人源化GARP基因包含人GARP基因的1号外显子至3号外显子的全部或部分,优选的,所述的人源化GARP基因包含人GARP基因的2号至3号外显子的全部或部分,更优选的,所述的人源化GARP基因包含人GARP基因的2号和/或3号外显子的全部或部分,其中,2号外显子的部分至少包含50bp的核苷酸序列,3号外显子的部分至少包含1000bp的核苷酸序列。
4.根据权利要求1-3任一所述的人源化GARP基因,其特征在于,所述的人源化GARP基因中包含的人GARP基因的部分选自下列组中的一种:
(A)包含SEQ ID NO:5所示核苷酸序列的全部或部分;
(B)包含与SEQ ID NO:5所示核苷酸序列的同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%的核苷酸序列;
(C)包含与SEQ ID NO:5所示核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸的核苷酸序列;
(D)具有SEQ ID NO:5所示核苷酸序列的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
5.根据权利要求1-4任一所述的人源化GARP基因,其特征在于,所述的人源化GARP基因转录的mRNA选自下列组中的一种:
(a)包含SEQ ID NO:8所示核苷酸序列的全部或部分;
(b)包含与SEQ ID NO:8所示核苷酸序列的同一性至少为70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%的核苷酸序列;
(c)包含与SEQ ID NO:8所示的核苷酸序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸的核苷酸序列;或
(d)包含SEQ ID NO:8所示的核苷酸序列,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
6.一种人源化GARP蛋白,其特征在于,所述人源化GARP蛋白由权利要求1-5任一所述的人源化GARP基因编码。
7.一种载体,其特征在于,所述载体为靶向载体,所述载体包含权利要求1-5任一所述的人源化GARP基因。
8.根据权利要求7所述的载体,其特征在于,所述载体还包含5’臂;优选的,所述的5’臂与NCBI登录号为NC_000073.7至少具有90%同源性的核苷酸;进一步优选的,所述5’臂序列与SEQ ID NO:3至少具有90%同源性,或者如SEQ ID NO:3所示;和/或,所述的靶向载体还包含3’臂;优选的,所述的3’臂与NCBI登录号为NC_000073.7至少具有90%同源性的核苷酸;进一步优选的,所述的3’臂序列与SEQ ID NO:4至少具有90%同源性,或者如SEQ IDNO:4所示。
9.一种GARP基因人源化的非人动物的构建方法,其特征在于,所述的非人动物体内表达人或人源化GARP蛋白,或者,所述的非人动物至少一个细胞的基因组中包含人或人源化GARP基因。
10.根据权利要求9所述的构建方法,其特征在于,所述的人源化GARP蛋白为权利要求6所述的人源化GARP蛋白。
11.根据权利要求9或10所述的构建方法,其特征在于,所述的人源化GARP基因为权利要求1-5任一所述的人源化GARP基因。
12.根据权利要求9-11任一所述的构建方法,其特征在于,所述的构建方法包括用包含人GARP基因的全部或部分导入非人动物GARP基因座上;优选的,所述的人GARP基因的部分包含人GARP基因的1号至3号外显子的全部或部分,进一步优选的,包含人GARP基因的2号至3号外显子的全部或部分,更优选的,包含人GARP基因的2号和/或3号外显子的全部或部分,更进一步优选的,包含人GARP的基因的2号外显子的部分、3号外显子的部分;其中,2号外显子的部分至少包含50bp的核苷酸序列,3号外显子的部分至少包含1000bp的核苷酸序列,优选的,用包含SEQ ID NO:5的核苷酸序列,或用包含与SEQ ID NO:5具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%同一性的核苷酸序列导入非人动物基因座上。
13.根据权利要求12所述的构建方法,其特征在于,所述的导入为替换或插入,优选的,所述的导入非人动物GARP基因座为替换非人动物相应区域,进一步优选的,非人动物GARP基因的1号至3号外显子的全部或部分被替换,更优选的,非人动物的2号外显子的部分和3号外显子的部分被替换。
14.根据权利要求9-13任一所述的构建方法,其特征在于,人或人源化GARP基因在非人动物体内通过内源调控元件进行调控。
15.根据权利要求9-14任一所述的构建方法,其特征在于,使用权利要求7-8任一所述的载体进行非人动物的构建。
16.根据权利要求9-15任一所述的构建方法,其特征在于,所述的构建方法还包括将GARP基因人源化的非人动物与其他基因修饰的非人动物交配、体外受精或直接进行基因编辑,并进行筛选,得到多基因修饰的非人动物,
优选的,所述的其他基因选自PD-1、PD-L1、CTLA4、OX40、LAG3、TIM3和CD73中的至少一种。
17.一种细胞、组织或器官,其特征在于,所述的细胞、组织或者器官包含权利要求1-5任一所述的人源化GARP基因,所述的细胞、组织或者器官表达权利要求6所述的人源化GARP蛋白,或者所述细胞、组织或者器官来源于权利要求9-16任一所述的构建方法获得的非人动物。
18.权利要求1-5任一所述的人源化GARP基因、权利要求6所述的人源化GARP蛋白、权利要求9-16任一所述的构建方法获得的非人动物或权利要求16所述的细胞、组织或器官的应用,所述应用包括:
在需要涉及人类细胞的免疫过程的产品开发,制造抗体,或者作为药理学、免疫学、微生物学、医学研究的模型系统中的应用;
在生产和利用动物实验疾病模型,用于开发新的诊断策略和/或治疗策略中的应用;
或者,
在筛选、验证、评价或研究GARP功能、人GARP信号机理、靶向人的抗体、靶向人的药物、药效,心脑血管疾病、神经精神类疾病、免疫相关疾病药物以及抗肿瘤或抗炎症药物,筛选和评估人用药及药效研究方面的应用。
19.根据权利要求9-16任一所述的构建方法获得的非人动物或权利要求17所述的细胞、组织或器官,其特征在于,所述的非人动物为非人哺乳动物;优选的,所述的非人哺乳动物为啮齿类动物;进一步优选的,所述的啮齿类动物为小鼠或大鼠。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2020114195585 | 2020-12-07 | ||
CN202011419558 | 2020-12-07 | ||
CN202110601632 | 2021-05-31 | ||
CN2021106016323 | 2021-05-31 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114134153A true CN114134153A (zh) | 2022-03-04 |
CN114134153B CN114134153B (zh) | 2024-08-02 |
Family
ID=80384712
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111488968.XA Active CN114134153B (zh) | 2020-12-07 | 2021-12-07 | Garp基因人源化非人动物及其构建方法和应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114134153B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111793646A (zh) * | 2020-09-08 | 2020-10-20 | 北京百奥赛图基因生物技术有限公司 | Il1r1基因人源化改造的非人动物的构建方法及其应用 |
CN111808882A (zh) * | 2020-09-01 | 2020-10-23 | 北京百奥赛图基因生物技术有限公司 | Il7r基因人源化改造的动物模型的构建方法及其应用 |
-
2021
- 2021-12-07 CN CN202111488968.XA patent/CN114134153B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111808882A (zh) * | 2020-09-01 | 2020-10-23 | 北京百奥赛图基因生物技术有限公司 | Il7r基因人源化改造的动物模型的构建方法及其应用 |
CN111793646A (zh) * | 2020-09-08 | 2020-10-20 | 北京百奥赛图基因生物技术有限公司 | Il1r1基因人源化改造的非人动物的构建方法及其应用 |
Non-Patent Citations (4)
Title |
---|
CAROLINE H. WALLACE 等: "B lymphocytes confer immune tolerance via cell surface GARP-TGF-β complex", JCI INSIGHT, vol. 3, no. 7 * |
ELIEN VERMEERSCH: "INVESTIGATION OF THE ROLE OF GARP BY USING CELL SPECIFIC KNOCKOUT MICE", Retrieved from the Internet <URL:https://lirias.kuleuven.be/1987949?limo=0> * |
GENBANK: "NCBI Reference Sequence: NC_000011.10", GENBANK * |
孙立平: "GARP在肺癌患者来源调节性T细胞中的表达及临床意义", 中国优秀硕士学位论文全文数据库医药卫生科技辑 * |
Also Published As
Publication number | Publication date |
---|---|
CN114134153B (zh) | 2024-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111837036B (zh) | 具有人或嵌合基因的基因修饰的非人动物 | |
CN111304246B (zh) | 一种人源化细胞因子动物模型、制备方法及应用 | |
CN109913493B (zh) | 人源化cd3基因改造动物模型的制备方法及应用 | |
CN108424928B (zh) | 人源化基因改造动物模型的制备方法及应用 | |
CN111793646B (zh) | Il1r1基因人源化改造的非人动物的构建方法及其应用 | |
CN111218425B (zh) | 人源化转基因动物 | |
CN113388640B (zh) | Ccr4基因人源化的非人动物及其构建方法和应用 | |
CN112779285A (zh) | 人源化il-10和il-10ra基因改造动物的构建方法和应用 | |
CN113429486A (zh) | 基因修饰非人动物的构建方法及应用 | |
CN113774086A (zh) | A2ar基因人源化非人动物及其构建方法和应用 | |
CN108070614B (zh) | 人源化基因改造动物模型的制备方法及应用 | |
CN113461802A (zh) | 一种cd276基因人源化的非人动物及其构建方法和应用 | |
CN113046390A (zh) | Csf1r基因人源化的非人动物及其构建方法和应用 | |
CN114751973B (zh) | Siglec15基因人源化非人动物的构建方法和应用 | |
CN112501204B (zh) | Il21r基因人源化非人动物及其构建方法和应用 | |
CN113881681B (zh) | Ccr8基因人源化非人动物及其构建方法和应用 | |
CN112501205B (zh) | Ceacam1基因人源化非人动物的构建方法及应用 | |
CN112553252B (zh) | Tnfr2基因人源化的非人动物的构建方法和应用 | |
CN112481303B (zh) | Il15ra基因人源化非人动物及其构建方法和应用 | |
CN112553213B (zh) | Cx3cr1基因人源化的非人动物及其构建方法和应用 | |
CN111304247B (zh) | 人源化lag-3基因改造动物模型的制备方法及应用 | |
CN114134153B (zh) | Garp基因人源化非人动物及其构建方法和应用 | |
CN115011606A (zh) | Cd37基因人源化非人动物的构建方法及应用 | |
CN113234139A (zh) | Tnfsf9基因人源化的非人动物及其构建方法和应用 | |
CN114853871B (zh) | Csf1和/或csf1r基因人源化的非人动物及其构建方法和应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |