KR20230068401A - 치료 단백질 생산을 위한 고 생산 재조합 차이니즈 햄스터 난소 세포주의 생성 - Google Patents
치료 단백질 생산을 위한 고 생산 재조합 차이니즈 햄스터 난소 세포주의 생성 Download PDFInfo
- Publication number
- KR20230068401A KR20230068401A KR1020237009323A KR20237009323A KR20230068401A KR 20230068401 A KR20230068401 A KR 20230068401A KR 1020237009323 A KR1020237009323 A KR 1020237009323A KR 20237009323 A KR20237009323 A KR 20237009323A KR 20230068401 A KR20230068401 A KR 20230068401A
- Authority
- KR
- South Korea
- Prior art keywords
- gene
- dhodh
- endogenous
- cell line
- sequence
- Prior art date
Links
- 210000004978 chinese hamster ovary cell Anatomy 0.000 title description 24
- 230000014616 translation Effects 0.000 title description 7
- 230000001225 therapeutic effect Effects 0.000 title description 3
- 108020002326 glutamine synthetase Proteins 0.000 claims abstract description 112
- 102000005396 glutamine synthetase Human genes 0.000 claims abstract description 111
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 84
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 claims abstract description 62
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 claims abstract description 62
- 108010089007 dehydroorotate dehydrogenase Proteins 0.000 claims description 118
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 claims description 114
- 239000013604 expression vector Substances 0.000 claims description 103
- 101150102768 Dhodh gene Proteins 0.000 claims description 97
- 101150074355 GS gene Proteins 0.000 claims description 97
- 230000014509 gene expression Effects 0.000 claims description 77
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 claims description 66
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 claims description 60
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 claims description 57
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 claims description 57
- 229940045145 uridine Drugs 0.000 claims description 57
- 239000001963 growth medium Substances 0.000 claims description 48
- 238000000034 method Methods 0.000 claims description 47
- 238000004519 manufacturing process Methods 0.000 claims description 28
- 239000002773 nucleotide Substances 0.000 claims description 28
- 125000003729 nucleotide group Chemical group 0.000 claims description 26
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 claims description 25
- 239000003112 inhibitor Substances 0.000 claims description 25
- 230000000415 inactivating effect Effects 0.000 claims description 24
- 241000699802 Cricetulus griseus Species 0.000 claims description 22
- 238000010362 genome editing Methods 0.000 claims description 18
- 239000013598 vector Substances 0.000 claims description 18
- 238000012258 culturing Methods 0.000 claims description 17
- 108700028369 Alleles Proteins 0.000 claims description 14
- 238000010367 cloning Methods 0.000 claims description 14
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 10
- 238000000338 in vitro Methods 0.000 claims description 6
- 210000001672 ovary Anatomy 0.000 claims description 4
- 239000008194 pharmaceutical composition Substances 0.000 claims description 3
- 108010052167 Dihydroorotate Dehydrogenase Proteins 0.000 abstract description 5
- 102100032823 Dihydroorotate dehydrogenase (quinone), mitochondrial Human genes 0.000 abstract description 5
- 210000004027 cell Anatomy 0.000 description 228
- 108020004414 DNA Proteins 0.000 description 74
- 239000002609 medium Substances 0.000 description 64
- 102000004169 proteins and genes Human genes 0.000 description 53
- 108020005004 Guide RNA Proteins 0.000 description 41
- 238000001890 transfection Methods 0.000 description 26
- 108091034117 Oligonucleotide Proteins 0.000 description 20
- 230000000694 effects Effects 0.000 description 20
- 229940024606 amino acid Drugs 0.000 description 19
- 150000001413 amino acids Chemical class 0.000 description 19
- 239000003550 marker Substances 0.000 description 17
- 239000013612 plasmid Substances 0.000 description 17
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 15
- 241000282414 Homo sapiens Species 0.000 description 14
- 230000002779 inactivation Effects 0.000 description 14
- 108010005233 alanylglutamic acid Proteins 0.000 description 13
- 230000004927 fusion Effects 0.000 description 13
- 102000004196 processed proteins & peptides Human genes 0.000 description 13
- 108090000765 processed proteins & peptides Proteins 0.000 description 13
- 241000701022 Cytomegalovirus Species 0.000 description 12
- 125000003275 alpha amino acid group Chemical group 0.000 description 12
- 229920001184 polypeptide Polymers 0.000 description 12
- 238000012217 deletion Methods 0.000 description 11
- 230000037430 deletion Effects 0.000 description 11
- 238000002360 preparation method Methods 0.000 description 11
- -1 uracil nucleic acid Chemical class 0.000 description 11
- 241000699800 Cricetinae Species 0.000 description 10
- 239000012634 fragment Substances 0.000 description 10
- 230000012010 growth Effects 0.000 description 10
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 9
- 101100246662 Homo sapiens DHODH gene Proteins 0.000 description 9
- 108010079364 N-glycylalanine Proteins 0.000 description 9
- 239000008188 pellet Substances 0.000 description 9
- UTNUDOFZCWSZMS-YFHOEESVSA-N teriflunomide Chemical compound C\C(O)=C(/C#N)C(=O)NC1=CC=C(C(F)(F)F)C=C1 UTNUDOFZCWSZMS-YFHOEESVSA-N 0.000 description 9
- 108010061238 threonyl-glycine Proteins 0.000 description 9
- 229940083266 Dihydroorotate dehydrogenase inhibitor Drugs 0.000 description 8
- 108091028113 Trans-activating crRNA Proteins 0.000 description 8
- 238000004520 electroporation Methods 0.000 description 8
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 8
- 230000035772 mutation Effects 0.000 description 8
- 238000006467 substitution reaction Methods 0.000 description 8
- 239000006228 supernatant Substances 0.000 description 8
- 229960000331 teriflunomide Drugs 0.000 description 8
- 238000010257 thawing Methods 0.000 description 8
- 108091033409 CRISPR Proteins 0.000 description 7
- 229930182816 L-glutamine Natural products 0.000 description 7
- SXTAYKAGBXMACB-DPVSGNNYSA-N L-methionine sulfoximine Chemical compound CS(=N)(=O)CC[C@H](N)C(O)=O SXTAYKAGBXMACB-DPVSGNNYSA-N 0.000 description 7
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 7
- 238000003780 insertion Methods 0.000 description 7
- 230000037431 insertion Effects 0.000 description 7
- 239000000203 mixture Substances 0.000 description 7
- 238000003199 nucleic acid amplification method Methods 0.000 description 7
- PXQPEWDEAKTCGB-UHFFFAOYSA-N orotic acid Chemical compound OC(=O)C1=CC(=O)NC(=O)N1 PXQPEWDEAKTCGB-UHFFFAOYSA-N 0.000 description 7
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 6
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 6
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 6
- 101000888841 Homo sapiens Glutamine synthetase Proteins 0.000 description 6
- 229960000723 ampicillin Drugs 0.000 description 6
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 6
- 230000003321 amplification Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 6
- 108010047857 aspartylglycine Proteins 0.000 description 6
- 239000000872 buffer Substances 0.000 description 6
- 238000005119 centrifugation Methods 0.000 description 6
- GYOZYWVXFNDGLU-XLPZGREQSA-N dTMP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 GYOZYWVXFNDGLU-XLPZGREQSA-N 0.000 description 6
- 108010081551 glycylphenylalanine Proteins 0.000 description 6
- 108010057821 leucylproline Proteins 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- 108010004914 prolylarginine Proteins 0.000 description 6
- 230000010076 replication Effects 0.000 description 6
- 238000001262 western blot Methods 0.000 description 6
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 5
- 108091093088 Amplicon Proteins 0.000 description 5
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 5
- 241000282465 Canis Species 0.000 description 5
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 5
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 5
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 5
- NKRJALPCDNXULF-BYULHYEWSA-N Ile-Asp-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O NKRJALPCDNXULF-BYULHYEWSA-N 0.000 description 5
- DPWGZWUMUUJQDT-IUCAKERBSA-N Leu-Gln-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O DPWGZWUMUUJQDT-IUCAKERBSA-N 0.000 description 5
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 5
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 5
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 5
- 238000010790 dilution Methods 0.000 description 5
- 239000012895 dilution Substances 0.000 description 5
- 108010078144 glutaminyl-glycine Proteins 0.000 description 5
- 238000011534 incubation Methods 0.000 description 5
- SXTAYKAGBXMACB-UHFFFAOYSA-N methionine sulfoximine Chemical compound CS(=N)(=O)CCC(N)C(O)=O SXTAYKAGBXMACB-UHFFFAOYSA-N 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000008685 targeting Effects 0.000 description 5
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 4
- 108020004705 Codon Proteins 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- GNRMAQSIROFNMI-IXOXFDKPSA-N Phe-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GNRMAQSIROFNMI-IXOXFDKPSA-N 0.000 description 4
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 4
- DJJCXFVJDGTHFX-UHFFFAOYSA-N Uridinemonophosphate Natural products OC1C(O)C(COP(O)(O)=O)OC1N1C(=O)NC(=O)C=C1 DJJCXFVJDGTHFX-UHFFFAOYSA-N 0.000 description 4
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 4
- 108010047495 alanylglycine Proteins 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 238000010353 genetic engineering Methods 0.000 description 4
- 108010049041 glutamylalanine Proteins 0.000 description 4
- 210000005260 human cell Anatomy 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 108010005942 methionylglycine Proteins 0.000 description 4
- 230000006780 non-homologous end joining Effects 0.000 description 4
- 108020004707 nucleic acids Proteins 0.000 description 4
- 102000039446 nucleic acids Human genes 0.000 description 4
- 239000000523 sample Substances 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 230000004083 survival effect Effects 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- DJJCXFVJDGTHFX-XVFCMESISA-N uridine 5'-monophosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 DJJCXFVJDGTHFX-XVFCMESISA-N 0.000 description 4
- 108010073969 valyllysine Proteins 0.000 description 4
- NCMVOABPESMRCP-SHYZEUOFSA-N 2'-deoxycytosine 5'-monophosphate Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 NCMVOABPESMRCP-SHYZEUOFSA-N 0.000 description 3
- XWTNPSHCJMZAHQ-QMMMGPOBSA-N 2-[[2-[[2-[[(2s)-2-amino-4-methylpentanoyl]amino]acetyl]amino]acetyl]amino]acetic acid Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(=O)NCC(O)=O XWTNPSHCJMZAHQ-QMMMGPOBSA-N 0.000 description 3
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 3
- YWWATNIVMOCSAV-UBHSHLNASA-N Ala-Arg-Phe Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YWWATNIVMOCSAV-UBHSHLNASA-N 0.000 description 3
- XYTNPQNAZREREP-XQXXSGGOSA-N Ala-Glu-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XYTNPQNAZREREP-XQXXSGGOSA-N 0.000 description 3
- LJFNNUBZSZCZFN-WHFBIAKZSA-N Ala-Gly-Cys Chemical compound N[C@@H](C)C(=O)NCC(=O)N[C@@H](CS)C(=O)O LJFNNUBZSZCZFN-WHFBIAKZSA-N 0.000 description 3
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 3
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 3
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 3
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 3
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 3
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 3
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 3
- GHNDBBVSWOWYII-LPEHRKFASA-N Arg-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GHNDBBVSWOWYII-LPEHRKFASA-N 0.000 description 3
- JSHVMZANPXCDTL-GMOBBJLQSA-N Arg-Asp-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JSHVMZANPXCDTL-GMOBBJLQSA-N 0.000 description 3
- DJAIOAKQIOGULM-DCAQKATOSA-N Arg-Glu-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O DJAIOAKQIOGULM-DCAQKATOSA-N 0.000 description 3
- OKKMBOSPBDASEP-CYDGBPFRSA-N Arg-Ile-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O OKKMBOSPBDASEP-CYDGBPFRSA-N 0.000 description 3
- GNYUVVJYGJFKHN-RVMXOQNASA-N Arg-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GNYUVVJYGJFKHN-RVMXOQNASA-N 0.000 description 3
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 3
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 3
- XRNXPIGJPQHCPC-RCWTZXSCSA-N Arg-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)O)C(O)=O XRNXPIGJPQHCPC-RCWTZXSCSA-N 0.000 description 3
- VLIJAPRTSXSGFY-STQMWFEESA-N Arg-Tyr-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 VLIJAPRTSXSGFY-STQMWFEESA-N 0.000 description 3
- GFFRWIJAFFMQGM-NUMRIWBASA-N Asn-Glu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFFRWIJAFFMQGM-NUMRIWBASA-N 0.000 description 3
- PTSDPWIHOYMRGR-UGYAYLCHSA-N Asn-Ile-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O PTSDPWIHOYMRGR-UGYAYLCHSA-N 0.000 description 3
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 3
- NYGILGUOUOXGMJ-YUMQZZPRSA-N Asn-Lys-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O NYGILGUOUOXGMJ-YUMQZZPRSA-N 0.000 description 3
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 3
- VWADICJNCPFKJS-ZLUOBGJFSA-N Asn-Ser-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O VWADICJNCPFKJS-ZLUOBGJFSA-N 0.000 description 3
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 3
- YNQIDCRRTWGHJD-ZLUOBGJFSA-N Asp-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(O)=O YNQIDCRRTWGHJD-ZLUOBGJFSA-N 0.000 description 3
- NYQHSUGFEWDWPD-ACZMJKKPSA-N Asp-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N NYQHSUGFEWDWPD-ACZMJKKPSA-N 0.000 description 3
- KTTCQQNRRLCIBC-GHCJXIJMSA-N Asp-Ile-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O KTTCQQNRRLCIBC-GHCJXIJMSA-N 0.000 description 3
- VSMYBNPOHYAXSD-GUBZILKMSA-N Asp-Lys-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O VSMYBNPOHYAXSD-GUBZILKMSA-N 0.000 description 3
- DJCAHYVLMSRBFR-QXEWZRGKSA-N Asp-Met-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(O)=O DJCAHYVLMSRBFR-QXEWZRGKSA-N 0.000 description 3
- QJHOOKBAHRJPPX-QWRGUYRKSA-N Asp-Phe-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 QJHOOKBAHRJPPX-QWRGUYRKSA-N 0.000 description 3
- RPUYTJJZXQBWDT-SRVKXCTJSA-N Asp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N RPUYTJJZXQBWDT-SRVKXCTJSA-N 0.000 description 3
- UAXIKORUDGGIGA-DCAQKATOSA-N Asp-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O UAXIKORUDGGIGA-DCAQKATOSA-N 0.000 description 3
- XUVTWGPERWIERB-IHRRRGAJSA-N Asp-Pro-Phe Chemical compound N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O XUVTWGPERWIERB-IHRRRGAJSA-N 0.000 description 3
- CUQDCPXNZPDYFQ-ZLUOBGJFSA-N Asp-Ser-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O CUQDCPXNZPDYFQ-ZLUOBGJFSA-N 0.000 description 3
- BIVLWXQGXJLGKG-BIIVOSGPSA-N Cys-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N)C(=O)O BIVLWXQGXJLGKG-BIIVOSGPSA-N 0.000 description 3
- UXUSHQYYQCZWET-WDSKDSINSA-N Cys-Glu-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O UXUSHQYYQCZWET-WDSKDSINSA-N 0.000 description 3
- WVLZTXGTNGHPBO-SRVKXCTJSA-N Cys-Leu-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O WVLZTXGTNGHPBO-SRVKXCTJSA-N 0.000 description 3
- JXVFJOMFOLFPMP-KKUMJFAQSA-N Cys-Leu-Tyr Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JXVFJOMFOLFPMP-KKUMJFAQSA-N 0.000 description 3
- MXZYQNJCBVJHSR-KATARQTJSA-N Cys-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N)O MXZYQNJCBVJHSR-KATARQTJSA-N 0.000 description 3
- 108700024394 Exon Proteins 0.000 description 3
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 3
- KCJJFESQRXGTGC-BQBZGAKWSA-N Gln-Glu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O KCJJFESQRXGTGC-BQBZGAKWSA-N 0.000 description 3
- JHPFPROFOAJRFN-IHRRRGAJSA-N Gln-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O JHPFPROFOAJRFN-IHRRRGAJSA-N 0.000 description 3
- YRWWJCDWLVXTHN-LAEOZQHASA-N Gln-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N YRWWJCDWLVXTHN-LAEOZQHASA-N 0.000 description 3
- HSHCEAUPUPJPTE-JYJNAYRXSA-N Gln-Leu-Tyr Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HSHCEAUPUPJPTE-JYJNAYRXSA-N 0.000 description 3
- UEILCTONAMOGBR-RWRJDSDZSA-N Gln-Thr-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UEILCTONAMOGBR-RWRJDSDZSA-N 0.000 description 3
- BPDVTFBJZNBHEU-HGNGGELXSA-N Glu-Ala-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 BPDVTFBJZNBHEU-HGNGGELXSA-N 0.000 description 3
- QQLBPVKLJBAXBS-FXQIFTODSA-N Glu-Glu-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QQLBPVKLJBAXBS-FXQIFTODSA-N 0.000 description 3
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 3
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 3
- BRKUZSLQMPNVFN-SRVKXCTJSA-N Glu-His-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BRKUZSLQMPNVFN-SRVKXCTJSA-N 0.000 description 3
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 3
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 3
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 3
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 3
- BPLNJYHNAJVLRT-ACZMJKKPSA-N Glu-Ser-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O BPLNJYHNAJVLRT-ACZMJKKPSA-N 0.000 description 3
- FVGOGEGGQLNZGH-DZKIICNBSA-N Glu-Val-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FVGOGEGGQLNZGH-DZKIICNBSA-N 0.000 description 3
- LLXVQPKEQQCISF-YUMQZZPRSA-N Gly-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN LLXVQPKEQQCISF-YUMQZZPRSA-N 0.000 description 3
- KTSZUNRRYXPZTK-BQBZGAKWSA-N Gly-Gln-Glu Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KTSZUNRRYXPZTK-BQBZGAKWSA-N 0.000 description 3
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 3
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 3
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 3
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 3
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 3
- SJLKKOZFHSJJAW-YUMQZZPRSA-N Gly-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)CN SJLKKOZFHSJJAW-YUMQZZPRSA-N 0.000 description 3
- DHNXGWVNLFPOMQ-KBPBESRZSA-N Gly-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)CN DHNXGWVNLFPOMQ-KBPBESRZSA-N 0.000 description 3
- VDCRBJACQKOSMS-JSGCOSHPSA-N Gly-Phe-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O VDCRBJACQKOSMS-JSGCOSHPSA-N 0.000 description 3
- OOCFXNOVSLSHAB-IUCAKERBSA-N Gly-Pro-Pro Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OOCFXNOVSLSHAB-IUCAKERBSA-N 0.000 description 3
- NVTPVQLIZCOJFK-FOHZUACHSA-N Gly-Thr-Asp Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O NVTPVQLIZCOJFK-FOHZUACHSA-N 0.000 description 3
- PASHZZBXZYEXFE-LSDHHAIUSA-N Gly-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)CN)C(=O)O PASHZZBXZYEXFE-LSDHHAIUSA-N 0.000 description 3
- SYMSVYVUSPSAAO-IHRRRGAJSA-N His-Arg-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O SYMSVYVUSPSAAO-IHRRRGAJSA-N 0.000 description 3
- HAPWZEVRQYGLSG-IUCAKERBSA-N His-Gly-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O HAPWZEVRQYGLSG-IUCAKERBSA-N 0.000 description 3
- RGPWUJOMKFYFSR-QWRGUYRKSA-N His-Gly-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O RGPWUJOMKFYFSR-QWRGUYRKSA-N 0.000 description 3
- IGBBXBFSLKRHJB-BZSNNMDCSA-N His-Lys-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 IGBBXBFSLKRHJB-BZSNNMDCSA-N 0.000 description 3
- PBVQWNDMFFCPIZ-ULQDDVLXSA-N His-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 PBVQWNDMFFCPIZ-ULQDDVLXSA-N 0.000 description 3
- FBVHRDXSCYELMI-PBCZWWQYSA-N His-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O FBVHRDXSCYELMI-PBCZWWQYSA-N 0.000 description 3
- TZCGZYWNIDZZMR-NAKRPEOUSA-N Ile-Arg-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C)C(=O)O)N TZCGZYWNIDZZMR-NAKRPEOUSA-N 0.000 description 3
- PNTWNAXGBOZMBO-MNXVOIDGSA-N Ile-Lys-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PNTWNAXGBOZMBO-MNXVOIDGSA-N 0.000 description 3
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 3
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 3
- REPPKAMYTOJTFC-DCAQKATOSA-N Leu-Arg-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O REPPKAMYTOJTFC-DCAQKATOSA-N 0.000 description 3
- FJUKMPUELVROGK-IHRRRGAJSA-N Leu-Arg-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N FJUKMPUELVROGK-IHRRRGAJSA-N 0.000 description 3
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 3
- VZBIUJURDLFFOE-IHRRRGAJSA-N Leu-His-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VZBIUJURDLFFOE-IHRRRGAJSA-N 0.000 description 3
- JKSIBWITFMQTOA-XUXIUFHCSA-N Leu-Ile-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O JKSIBWITFMQTOA-XUXIUFHCSA-N 0.000 description 3
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 3
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 3
- XWEVVRRSIOBJOO-SRVKXCTJSA-N Leu-Pro-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O XWEVVRRSIOBJOO-SRVKXCTJSA-N 0.000 description 3
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 3
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 3
- HQBOMRTVKVKFMN-WDSOQIARSA-N Leu-Trp-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O HQBOMRTVKVKFMN-WDSOQIARSA-N 0.000 description 3
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 3
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 3
- BRSGXFITDXFMFF-IHRRRGAJSA-N Lys-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N BRSGXFITDXFMFF-IHRRRGAJSA-N 0.000 description 3
- ZQCVMVCVPFYXHZ-SRVKXCTJSA-N Lys-Asn-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN ZQCVMVCVPFYXHZ-SRVKXCTJSA-N 0.000 description 3
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 3
- YUAXTFMFMOIMAM-QWRGUYRKSA-N Lys-Lys-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O YUAXTFMFMOIMAM-QWRGUYRKSA-N 0.000 description 3
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 3
- PELXPRPDQRFBGQ-KKUMJFAQSA-N Lys-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N)O PELXPRPDQRFBGQ-KKUMJFAQSA-N 0.000 description 3
- HGAJNEWOUHDUMZ-SRVKXCTJSA-N Met-Leu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O HGAJNEWOUHDUMZ-SRVKXCTJSA-N 0.000 description 3
- LNXGEYIEEUZGGH-JYJNAYRXSA-N Met-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCSC)CC1=CC=CC=C1 LNXGEYIEEUZGGH-JYJNAYRXSA-N 0.000 description 3
- LIIXIZKVWNYQHB-STECZYCISA-N Met-Tyr-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LIIXIZKVWNYQHB-STECZYCISA-N 0.000 description 3
- FZDOBWIKRQORAC-ULQDDVLXSA-N Met-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCSC)N FZDOBWIKRQORAC-ULQDDVLXSA-N 0.000 description 3
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 3
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 3
- 239000000020 Nitrocellulose Substances 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- CDNPIRSCAFMMBE-SRVKXCTJSA-N Phe-Asn-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CDNPIRSCAFMMBE-SRVKXCTJSA-N 0.000 description 3
- WIVCOAKLPICYGY-KKUMJFAQSA-N Phe-Asp-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N WIVCOAKLPICYGY-KKUMJFAQSA-N 0.000 description 3
- ABQFNJAFONNUTH-FHWLQOOXSA-N Phe-Gln-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N ABQFNJAFONNUTH-FHWLQOOXSA-N 0.000 description 3
- MMJJFXWMCMJMQA-STQMWFEESA-N Phe-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CC=CC=C1 MMJJFXWMCMJMQA-STQMWFEESA-N 0.000 description 3
- QTDBZORPVYTRJU-KKXDTOCCSA-N Phe-Tyr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O QTDBZORPVYTRJU-KKXDTOCCSA-N 0.000 description 3
- NHDVNAKDACFHPX-GUBZILKMSA-N Pro-Arg-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O NHDVNAKDACFHPX-GUBZILKMSA-N 0.000 description 3
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 3
- MTHRMUXESFIAMS-DCAQKATOSA-N Pro-Asn-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O MTHRMUXESFIAMS-DCAQKATOSA-N 0.000 description 3
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 3
- ZPPVJIJMIKTERM-YUMQZZPRSA-N Pro-Gln-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)N)NC(=O)[C@@H]1CCCN1 ZPPVJIJMIKTERM-YUMQZZPRSA-N 0.000 description 3
- ZTVCLZLGHZXLOT-ULQDDVLXSA-N Pro-Glu-Trp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O ZTVCLZLGHZXLOT-ULQDDVLXSA-N 0.000 description 3
- UUHXBJHVTVGSKM-BQBZGAKWSA-N Pro-Gly-Asn Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UUHXBJHVTVGSKM-BQBZGAKWSA-N 0.000 description 3
- LEBTWGWVUVJNTA-FKBYEOEOSA-N Pro-Trp-Phe Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CC4=CC=CC=C4)C(=O)O LEBTWGWVUVJNTA-FKBYEOEOSA-N 0.000 description 3
- MWMKFWJYRRGXOR-ZLUOBGJFSA-N Ser-Ala-Asn Chemical compound N[C@H](C(=O)N[C@H](C(=O)N[C@H](C(=O)O)CC(N)=O)C)CO MWMKFWJYRRGXOR-ZLUOBGJFSA-N 0.000 description 3
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 3
- BCKYYTVFBXHPOG-ACZMJKKPSA-N Ser-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N BCKYYTVFBXHPOG-ACZMJKKPSA-N 0.000 description 3
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 3
- CICQXRWZNVXFCU-SRVKXCTJSA-N Ser-His-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O CICQXRWZNVXFCU-SRVKXCTJSA-N 0.000 description 3
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 3
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 3
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 3
- 108091027544 Subgenomic mRNA Proteins 0.000 description 3
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 3
- PQLXHSACXPGWPD-GSSVUCPTSA-N Thr-Asn-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PQLXHSACXPGWPD-GSSVUCPTSA-N 0.000 description 3
- YAAPRMFURSENOZ-KATARQTJSA-N Thr-Cys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N)O YAAPRMFURSENOZ-KATARQTJSA-N 0.000 description 3
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 3
- WYLAVUAWOUVUCA-XVSYOHENSA-N Thr-Phe-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WYLAVUAWOUVUCA-XVSYOHENSA-N 0.000 description 3
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 3
- 108010022394 Threonine synthase Proteins 0.000 description 3
- 102000008579 Transposases Human genes 0.000 description 3
- 108010020764 Transposases Proteins 0.000 description 3
- MHNHRNHJMXAVHZ-AAEUAGOBSA-N Trp-Asn-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N MHNHRNHJMXAVHZ-AAEUAGOBSA-N 0.000 description 3
- OKAMOYTUQMIFJO-JBACZVJFSA-N Trp-Glu-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=CC=C1 OKAMOYTUQMIFJO-JBACZVJFSA-N 0.000 description 3
- HSVPZJLMPLMPOX-BPNCWPANSA-N Tyr-Arg-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O HSVPZJLMPLMPOX-BPNCWPANSA-N 0.000 description 3
- OGPKMBOPMDTEDM-IHRRRGAJSA-N Tyr-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N OGPKMBOPMDTEDM-IHRRRGAJSA-N 0.000 description 3
- ANHVRCNNGJMJNG-BZSNNMDCSA-N Tyr-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CS)C(=O)O)N)O ANHVRCNNGJMJNG-BZSNNMDCSA-N 0.000 description 3
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Natural products O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 3
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 3
- PMDOQZFYGWZSTK-LSJOCFKGSA-N Val-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C PMDOQZFYGWZSTK-LSJOCFKGSA-N 0.000 description 3
- CPGJELLYDQEDRK-NAKRPEOUSA-N Val-Ile-Ala Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O CPGJELLYDQEDRK-NAKRPEOUSA-N 0.000 description 3
- BZMIYHIJVVJPCK-QSFUFRPTSA-N Val-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N BZMIYHIJVVJPCK-QSFUFRPTSA-N 0.000 description 3
- GVJUTBOZZBTBIG-AVGNSLFASA-N Val-Lys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N GVJUTBOZZBTBIG-AVGNSLFASA-N 0.000 description 3
- VNGKMNPAENRGDC-JYJNAYRXSA-N Val-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 VNGKMNPAENRGDC-JYJNAYRXSA-N 0.000 description 3
- DFQZDQPLWBSFEJ-LSJOCFKGSA-N Val-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DFQZDQPLWBSFEJ-LSJOCFKGSA-N 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 3
- 108010070944 alanylhistidine Proteins 0.000 description 3
- 239000000427 antigen Substances 0.000 description 3
- 230000000890 antigenic effect Effects 0.000 description 3
- 108091007433 antigens Proteins 0.000 description 3
- 102000036639 antigens Human genes 0.000 description 3
- 108010013835 arginine glutamate Proteins 0.000 description 3
- 108010008355 arginyl-glutamine Proteins 0.000 description 3
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 3
- 108010068380 arginylarginine Proteins 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 108010016616 cysteinylglycine Proteins 0.000 description 3
- IERHLVCPSMICTF-XVFCMESISA-N cytidine 5'-monophosphate Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(O)=O)O1 IERHLVCPSMICTF-XVFCMESISA-N 0.000 description 3
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Natural products NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 3
- 102000004419 dihydrofolate reductase Human genes 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000003623 enhancer Substances 0.000 description 3
- 239000000499 gel Substances 0.000 description 3
- 108010073628 glutamyl-valyl-phenylalanine Proteins 0.000 description 3
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 3
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 3
- 108010077515 glycylproline Proteins 0.000 description 3
- 108010087823 glycyltyrosine Proteins 0.000 description 3
- 108010037850 glycylvaline Proteins 0.000 description 3
- 108010045383 histidyl-glycyl-glutamic acid Proteins 0.000 description 3
- 108010025306 histidylleucine Proteins 0.000 description 3
- 230000016784 immunoglobulin production Effects 0.000 description 3
- VHOGYURTWQBHIL-UHFFFAOYSA-N leflunomide Chemical compound O1N=CC(C(=O)NC=2C=CC(=CC=2)C(F)(F)F)=C1C VHOGYURTWQBHIL-UHFFFAOYSA-N 0.000 description 3
- 108010073093 leucyl-glycyl-glycyl-glycine Proteins 0.000 description 3
- 108010064235 lysylglycine Proteins 0.000 description 3
- 108010017391 lysylvaline Proteins 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 229920001220 nitrocellulos Polymers 0.000 description 3
- 150000007523 nucleic acids Chemical class 0.000 description 3
- 230000037361 pathway Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 210000001236 prokaryotic cell Anatomy 0.000 description 3
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 3
- 108010025826 prolyl-leucyl-arginine Proteins 0.000 description 3
- 108010031719 prolyl-serine Proteins 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 102200088125 rs267606767 Human genes 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 108010048818 seryl-histidine Proteins 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 108010051110 tyrosyl-lysine Proteins 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- LCPGTEQSMLUDHW-UHFFFAOYSA-N 2-amino-4-[hydroxy(phosphonomethyl)phosphoryl]butanoic acid Chemical compound OC(=O)C(N)CCP(O)(=O)CP(O)(O)=O LCPGTEQSMLUDHW-UHFFFAOYSA-N 0.000 description 2
- XEXJJJRVTFGWIC-FXQIFTODSA-N Ala-Asn-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XEXJJJRVTFGWIC-FXQIFTODSA-N 0.000 description 2
- PBAMJJXWDQXOJA-FXQIFTODSA-N Ala-Asp-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PBAMJJXWDQXOJA-FXQIFTODSA-N 0.000 description 2
- LZRNYBIJOSKKRJ-XVYDVKMFSA-N Ala-Asp-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LZRNYBIJOSKKRJ-XVYDVKMFSA-N 0.000 description 2
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 2
- NKJBKNVQHBZUIX-ACZMJKKPSA-N Ala-Gln-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKJBKNVQHBZUIX-ACZMJKKPSA-N 0.000 description 2
- CKLDHDOIYBVUNP-KBIXCLLPSA-N Ala-Ile-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O CKLDHDOIYBVUNP-KBIXCLLPSA-N 0.000 description 2
- MLNSNVLOEIYJIU-ZUDIRPEPSA-N Ala-Leu-Thr-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLNSNVLOEIYJIU-ZUDIRPEPSA-N 0.000 description 2
- NLOMBWNGESDVJU-GUBZILKMSA-N Ala-Met-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLOMBWNGESDVJU-GUBZILKMSA-N 0.000 description 2
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 2
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 2
- LYILPUNCKACNGF-NAKRPEOUSA-N Ala-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)N LYILPUNCKACNGF-NAKRPEOUSA-N 0.000 description 2
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 2
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 2
- NVCIXQYNWYTLDO-IHRRRGAJSA-N Arg-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N NVCIXQYNWYTLDO-IHRRRGAJSA-N 0.000 description 2
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 2
- VEAIMHJZTIDCIH-KKUMJFAQSA-N Arg-Phe-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VEAIMHJZTIDCIH-KKUMJFAQSA-N 0.000 description 2
- BSYKSCBTTQKOJG-GUBZILKMSA-N Arg-Pro-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BSYKSCBTTQKOJG-GUBZILKMSA-N 0.000 description 2
- XEOXPCNONWHHSW-AVGNSLFASA-N Arg-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N XEOXPCNONWHHSW-AVGNSLFASA-N 0.000 description 2
- WLVLIYYBPPONRJ-GCJQMDKQSA-N Asn-Thr-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O WLVLIYYBPPONRJ-GCJQMDKQSA-N 0.000 description 2
- IJHUZMGJRGNXIW-CIUDSAMLSA-N Asp-Glu-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IJHUZMGJRGNXIW-CIUDSAMLSA-N 0.000 description 2
- PLNJUJGNLDSFOP-UWJYBYFXSA-N Asp-Tyr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PLNJUJGNLDSFOP-UWJYBYFXSA-N 0.000 description 2
- NWAHPBGBDIFUFD-KKUMJFAQSA-N Asp-Tyr-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O NWAHPBGBDIFUFD-KKUMJFAQSA-N 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- ZWIADYZPOWUWEW-XVFCMESISA-N CDP Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O1 ZWIADYZPOWUWEW-XVFCMESISA-N 0.000 description 2
- 241000282461 Canis lupus Species 0.000 description 2
- 241000282693 Cercopithecidae Species 0.000 description 2
- PCDQPRRSZKQHHS-CCXZUQQUSA-N Cytarabine Triphosphate Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 PCDQPRRSZKQHHS-CCXZUQQUSA-N 0.000 description 2
- 230000033616 DNA repair Effects 0.000 description 2
- 230000007018 DNA scission Effects 0.000 description 2
- 230000006820 DNA synthesis Effects 0.000 description 2
- AHCYMLUZIRLXAA-SHYZEUOFSA-N Deoxyuridine 5'-triphosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 AHCYMLUZIRLXAA-SHYZEUOFSA-N 0.000 description 2
- 102100035102 E3 ubiquitin-protein ligase MYCBP2 Human genes 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- MLZRSFQRBDNJON-GUBZILKMSA-N Gln-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MLZRSFQRBDNJON-GUBZILKMSA-N 0.000 description 2
- BLOXULLYFRGYKZ-GUBZILKMSA-N Gln-Glu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BLOXULLYFRGYKZ-GUBZILKMSA-N 0.000 description 2
- XZLLTYBONVKGLO-SDDRHHMPSA-N Gln-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N)C(=O)O XZLLTYBONVKGLO-SDDRHHMPSA-N 0.000 description 2
- BJVBMSTUUWGZKX-JYJNAYRXSA-N Gln-Tyr-His Chemical compound N[C@@H](CCC(N)=O)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O BJVBMSTUUWGZKX-JYJNAYRXSA-N 0.000 description 2
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 2
- PXHABOCPJVTGEK-BQBZGAKWSA-N Glu-Gln-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O PXHABOCPJVTGEK-BQBZGAKWSA-N 0.000 description 2
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 2
- DVLZZEPUNFEUBW-AVGNSLFASA-N Glu-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N DVLZZEPUNFEUBW-AVGNSLFASA-N 0.000 description 2
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 2
- MXJYXYDREQWUMS-XKBZYTNZSA-N Glu-Thr-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O MXJYXYDREQWUMS-XKBZYTNZSA-N 0.000 description 2
- NTNUEBVGKMVANB-NHCYSSNCSA-N Glu-Val-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O NTNUEBVGKMVANB-NHCYSSNCSA-N 0.000 description 2
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 2
- QSTLUOIOYLYLLF-WDSKDSINSA-N Gly-Asp-Glu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QSTLUOIOYLYLLF-WDSKDSINSA-N 0.000 description 2
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 2
- 102000018251 Hypoxanthine Phosphoribosyltransferase Human genes 0.000 description 2
- 108010091358 Hypoxanthine Phosphoribosyltransferase Proteins 0.000 description 2
- QTUSJASXLGLJSR-OSUNSFLBSA-N Ile-Arg-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N QTUSJASXLGLJSR-OSUNSFLBSA-N 0.000 description 2
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 2
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 2
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 2
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 2
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 2
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 2
- OPTCSTACHGNULU-DCAQKATOSA-N Lys-Cys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCCCN OPTCSTACHGNULU-DCAQKATOSA-N 0.000 description 2
- SLQJJFAVWSZLBL-BJDJZHNGSA-N Lys-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN SLQJJFAVWSZLBL-BJDJZHNGSA-N 0.000 description 2
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 2
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 2
- HUKLXYYPZWPXCC-KZVJFYERSA-N Met-Ala-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HUKLXYYPZWPXCC-KZVJFYERSA-N 0.000 description 2
- PWPBGAJJYJJVPI-PJODQICGSA-N Met-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)CCSC)C(O)=O)=CNC2=C1 PWPBGAJJYJJVPI-PJODQICGSA-N 0.000 description 2
- LQMHZERGCQJKAH-STQMWFEESA-N Met-Gly-Phe Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 LQMHZERGCQJKAH-STQMWFEESA-N 0.000 description 2
- LUYURUYVNYGKGM-RCWTZXSCSA-N Met-Pro-Thr Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUYURUYVNYGKGM-RCWTZXSCSA-N 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 241001529936 Murinae Species 0.000 description 2
- 101710163270 Nuclease Proteins 0.000 description 2
- OTVDGCJCOXVJTF-UHFFFAOYSA-N OCP(=O)C(N)CCC(O)=O Chemical compound OCP(=O)C(N)CCC(O)=O OTVDGCJCOXVJTF-UHFFFAOYSA-N 0.000 description 2
- UHRNIXJAGGLKHP-DLOVCJGASA-N Phe-Ala-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O UHRNIXJAGGLKHP-DLOVCJGASA-N 0.000 description 2
- OPEVYHFJXLCCRT-AVGNSLFASA-N Phe-Gln-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O OPEVYHFJXLCCRT-AVGNSLFASA-N 0.000 description 2
- MPFGIYLYWUCSJG-AVGNSLFASA-N Phe-Glu-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MPFGIYLYWUCSJG-AVGNSLFASA-N 0.000 description 2
- NAXPHWZXEXNDIW-JTQLQIEISA-N Phe-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 NAXPHWZXEXNDIW-JTQLQIEISA-N 0.000 description 2
- MVIJMIZJPHQGEN-IHRRRGAJSA-N Phe-Ser-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@H](CO)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 MVIJMIZJPHQGEN-IHRRRGAJSA-N 0.000 description 2
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 2
- AJLVKXCNXIJHDV-CIUDSAMLSA-N Pro-Ala-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O AJLVKXCNXIJHDV-CIUDSAMLSA-N 0.000 description 2
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 2
- LNOWDSPAYBWJOR-PEDHHIEDSA-N Pro-Ile-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LNOWDSPAYBWJOR-PEDHHIEDSA-N 0.000 description 2
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 2
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 2
- 108010003201 RGH 0205 Proteins 0.000 description 2
- MEFKEPWMEQBLKI-AIRLBKTGSA-N S-adenosyl-L-methioninate Chemical compound O[C@@H]1[C@H](O)[C@@H](C[S+](CC[C@H](N)C([O-])=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 MEFKEPWMEQBLKI-AIRLBKTGSA-N 0.000 description 2
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 2
- UFKPDBLKLOBMRH-XHNCKOQMSA-N Ser-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)C(=O)O UFKPDBLKLOBMRH-XHNCKOQMSA-N 0.000 description 2
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 2
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- RZCIEJXAILMSQK-JXOAFFINSA-N TTP Chemical compound O=C1NC(=O)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 RZCIEJXAILMSQK-JXOAFFINSA-N 0.000 description 2
- SWIKDOUVROTZCW-GCJQMDKQSA-N Thr-Asn-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O SWIKDOUVROTZCW-GCJQMDKQSA-N 0.000 description 2
- FIFDDJFLNVAVMS-RHYQMDGZSA-N Thr-Leu-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O FIFDDJFLNVAVMS-RHYQMDGZSA-N 0.000 description 2
- XIHGJKFSIDTDKV-LYARXQMPSA-N Thr-Phe-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O XIHGJKFSIDTDKV-LYARXQMPSA-N 0.000 description 2
- DOBIBIXIHJKVJF-XKBZYTNZSA-N Thr-Ser-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DOBIBIXIHJKVJF-XKBZYTNZSA-N 0.000 description 2
- IEZVHOULSUULHD-XGEHTFHBSA-N Thr-Ser-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O IEZVHOULSUULHD-XGEHTFHBSA-N 0.000 description 2
- ILTXFANLDMJWPR-SIUGBPQLSA-N Tyr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N ILTXFANLDMJWPR-SIUGBPQLSA-N 0.000 description 2
- DAOREBHZAKCOEN-ULQDDVLXSA-N Tyr-Leu-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O DAOREBHZAKCOEN-ULQDDVLXSA-N 0.000 description 2
- XCCTYIAWTASOJW-XVFCMESISA-N Uridine-5'-Diphosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 XCCTYIAWTASOJW-XVFCMESISA-N 0.000 description 2
- KOPBYUSPXBQIHD-NRPADANISA-N Val-Cys-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KOPBYUSPXBQIHD-NRPADANISA-N 0.000 description 2
- YQMILNREHKTFBS-IHRRRGAJSA-N Val-Phe-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N YQMILNREHKTFBS-IHRRRGAJSA-N 0.000 description 2
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 2
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 2
- DLRZGNXCXUGIDG-KKHAAJSZSA-N Val-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O DLRZGNXCXUGIDG-KKHAAJSZSA-N 0.000 description 2
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 2
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 2
- BZDVTEPMYMHZCR-JGVFFNPUSA-N [(2s,5r)-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methyl phosphono hydrogen phosphate Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)CC1 BZDVTEPMYMHZCR-JGVFFNPUSA-N 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 229960001570 ademetionine Drugs 0.000 description 2
- 108010041407 alanylaspartic acid Proteins 0.000 description 2
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 108010093581 aspartyl-proline Proteins 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- PHEZJEYUWHETKO-UHFFFAOYSA-N brequinar Chemical compound N1=C2C=CC(F)=CC2=C(C(O)=O)C(C)=C1C(C=C1)=CC=C1C1=CC=CC=C1F PHEZJEYUWHETKO-UHFFFAOYSA-N 0.000 description 2
- 238000010370 cell cloning Methods 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 230000004663 cell proliferation Effects 0.000 description 2
- 239000013599 cloning vector Substances 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- IERHLVCPSMICTF-UHFFFAOYSA-N cytidine monophosphate Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(COP(O)(O)=O)O1 IERHLVCPSMICTF-UHFFFAOYSA-N 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- FTDHDKPUHBLBTL-SHYZEUOFSA-K dCDP(3-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 FTDHDKPUHBLBTL-SHYZEUOFSA-K 0.000 description 2
- RGWHQCVHVJXOKC-SHYZEUOFSA-N dCTP Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO[P@](O)(=O)O[P@](O)(=O)OP(O)(O)=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-N 0.000 description 2
- UJLXYODCHAELLY-XLPZGREQSA-N dTDP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 UJLXYODCHAELLY-XLPZGREQSA-N 0.000 description 2
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 2
- QHWZTVCCBMIIKE-SHYZEUOFSA-N dUDP Chemical compound O1[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 QHWZTVCCBMIIKE-SHYZEUOFSA-N 0.000 description 2
- JSRLJPSBLDHEIO-SHYZEUOFSA-N dUMP Chemical compound O1[C@H](COP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 JSRLJPSBLDHEIO-SHYZEUOFSA-N 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 2
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 2
- 108010050848 glycylleucine Proteins 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 229960000681 leflunomide Drugs 0.000 description 2
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 2
- 239000006166 lysate Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000007481 next generation sequencing Methods 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 2
- 108010053725 prolylvaline Proteins 0.000 description 2
- 229940021993 prophylactic vaccine Drugs 0.000 description 2
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 2
- 150000003230 pyrimidines Chemical class 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 239000012679 serum free medium Substances 0.000 description 2
- 239000013605 shuttle vector Substances 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 229940035893 uracil Drugs 0.000 description 2
- 229960005486 vaccine Drugs 0.000 description 2
- 239000011534 wash buffer Substances 0.000 description 2
- UBWYZDYRBXLPDX-UHFFFAOYSA-N (1,4-diamino-4-oxobutyl)phosphonic acid Chemical compound OP(=O)(O)C(N)CCC(N)=O UBWYZDYRBXLPDX-UHFFFAOYSA-N 0.000 description 1
- JNTMAZFVYNDPLB-PEDHHIEDSA-N (2S,3S)-2-[[[(2S)-1-[(2S,3S)-2-amino-3-methyl-1-oxopentyl]-2-pyrrolidinyl]-oxomethyl]amino]-3-methylpentanoic acid Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JNTMAZFVYNDPLB-PEDHHIEDSA-N 0.000 description 1
- LNRRYRBFQHQQKG-YFKPBYRVSA-N (2s)-2-amino-5-oxo-6-phosphonohexanoic acid Chemical compound OC(=O)[C@@H](N)CCC(=O)CP(O)(O)=O LNRRYRBFQHQQKG-YFKPBYRVSA-N 0.000 description 1
- DBJCKYLNABMIDC-VKHMYHEASA-N (2s)-2-azaniumyl-4-sulfamoylbutanoate Chemical compound OC(=O)[C@@H](N)CCS(N)(=O)=O DBJCKYLNABMIDC-VKHMYHEASA-N 0.000 description 1
- UFIVEPVSAGBUSI-REOHCLBHSA-N (S)-dihydroorotic acid Chemical compound OC(=O)[C@@H]1CC(=O)NC(=O)N1 UFIVEPVSAGBUSI-REOHCLBHSA-N 0.000 description 1
- ZGNLFUXWZJGETL-YUSKDDKASA-N (Z)-[(2S)-2-amino-2-carboxyethyl]-hydroxyimino-oxidoazanium Chemical compound N[C@@H](C\[N+]([O-])=N\O)C(O)=O ZGNLFUXWZJGETL-YUSKDDKASA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- VAPOCMQOROPOOD-UHFFFAOYSA-N 1,3-diazinane-4-carboxylic acid Chemical compound OC(=O)C1CCNCN1 VAPOCMQOROPOOD-UHFFFAOYSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- MXHRCPNRJAMMIM-SHYZEUOFSA-N 2'-deoxyuridine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-SHYZEUOFSA-N 0.000 description 1
- IQZIRNIZQHVBMB-UHFFFAOYSA-N 2-[4-[4-(2-carboxyanilino)-3-methoxyphenyl]-2-methoxyanilino]benzoic acid Chemical compound COC1=CC(C=2C=C(OC)C(NC=3C(=CC=CC=3)C(O)=O)=CC=2)=CC=C1NC1=CC=CC=C1C(O)=O IQZIRNIZQHVBMB-UHFFFAOYSA-N 0.000 description 1
- YAFHJNXECLHMKP-GRSHUZJTSA-N 2-amino-2-ethyl-4-(methylsulfonimidoyl)butanoic acid Chemical compound CCC(N)(C(O)=O)CC[S@@](C)(=N)=O YAFHJNXECLHMKP-GRSHUZJTSA-N 0.000 description 1
- HONKEGXLWUDTCF-UHFFFAOYSA-N 2-amino-2-methyl-4-phosphonobutanoic acid Chemical compound OC(=O)C(N)(C)CCP(O)(O)=O HONKEGXLWUDTCF-UHFFFAOYSA-N 0.000 description 1
- NNDIRXUEVHPTNF-ZSCNLULWSA-N 2-amino-4-(propylsulfonimidoyl)butanoic acid Chemical compound CCC[S@](=N)(=O)CCC(N)C(O)=O NNDIRXUEVHPTNF-ZSCNLULWSA-N 0.000 description 1
- DDOQBQRIEWHWBT-UHFFFAOYSA-N 2-azaniumyl-4-phosphonobutanoate Chemical compound OC(=O)C(N)CCP(O)(O)=O DDOQBQRIEWHWBT-UHFFFAOYSA-N 0.000 description 1
- IMOYJFBRHULUCZ-UHFFFAOYSA-N 2-methoxycarbonyl-4-phosphonobutanoic acid Chemical compound COC(=O)C(C(O)=O)CCP(O)(O)=O IMOYJFBRHULUCZ-UHFFFAOYSA-N 0.000 description 1
- XOQQVKDBGLYPGH-UHFFFAOYSA-N 2-oxo-1h-quinoline-3-carboxylic acid Chemical compound C1=CC=C2NC(=O)C(C(=O)O)=CC2=C1 XOQQVKDBGLYPGH-UHFFFAOYSA-N 0.000 description 1
- IDPWXVBDDIYDKT-UHFFFAOYSA-N 2-phenoxyquinoline Chemical compound C=1C=C2C=CC=CC2=NC=1OC1=CC=CC=C1 IDPWXVBDDIYDKT-UHFFFAOYSA-N 0.000 description 1
- CKTSBUTUHBMZGZ-ULQXZJNLSA-N 4-amino-1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-tritiopyrimidin-2-one Chemical compound O=C1N=C(N)C([3H])=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-ULQXZJNLSA-N 0.000 description 1
- SODXFOVXZATGPJ-UHFFFAOYSA-N 4-amino-4-phosphonobutanoic acid Chemical compound OP(=O)(O)C(N)CCC(O)=O SODXFOVXZATGPJ-UHFFFAOYSA-N 0.000 description 1
- KSBYEVVCFZZGDC-UHFFFAOYSA-N 4-amino-4-phosphonopentanoic acid Chemical compound OP(=O)(O)C(N)(C)CCC(O)=O KSBYEVVCFZZGDC-UHFFFAOYSA-N 0.000 description 1
- 229940117976 5-hydroxylysine Drugs 0.000 description 1
- 102100040131 60S ribosomal protein L37 Human genes 0.000 description 1
- ZXLMSTBJMZJAAH-UHFFFAOYSA-N 8-chloro-4-(2-chloro-4-fluorophenoxy)quinoline Chemical compound ClC1=CC(F)=CC=C1OC1=CC=NC2=C(Cl)C=CC=C12 ZXLMSTBJMZJAAH-UHFFFAOYSA-N 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- LGQPPBQRUBVTIF-JBDRJPRFSA-N Ala-Ala-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LGQPPBQRUBVTIF-JBDRJPRFSA-N 0.000 description 1
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 1
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 1
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 1
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 1
- MTDDMSUUXNQMKK-BPNCWPANSA-N Ala-Tyr-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N MTDDMSUUXNQMKK-BPNCWPANSA-N 0.000 description 1
- YYOVLDPHIJAOSY-DCAQKATOSA-N Arg-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N YYOVLDPHIJAOSY-DCAQKATOSA-N 0.000 description 1
- YWENWUYXQUWRHQ-LPEHRKFASA-N Arg-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O YWENWUYXQUWRHQ-LPEHRKFASA-N 0.000 description 1
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 1
- GRRXPUAICOGISM-RWMBFGLXSA-N Arg-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GRRXPUAICOGISM-RWMBFGLXSA-N 0.000 description 1
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 1
- XRLOBFSLPCHYLQ-ULQDDVLXSA-N Arg-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O XRLOBFSLPCHYLQ-ULQDDVLXSA-N 0.000 description 1
- ZCKYZTGLXIEOKS-CIUDSAMLSA-N Asp-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N ZCKYZTGLXIEOKS-CIUDSAMLSA-N 0.000 description 1
- KPNUCOPMVSGRCR-DCAQKATOSA-N Asp-His-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O KPNUCOPMVSGRCR-DCAQKATOSA-N 0.000 description 1
- BYLPQJAWXJWUCJ-YDHLFZDLSA-N Asp-Tyr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O BYLPQJAWXJWUCJ-YDHLFZDLSA-N 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 238000010354 CRISPR gene editing Methods 0.000 description 1
- 101000888808 Canis lupus familiaris Glutamine synthetase Proteins 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 108010047041 Complementarity Determining Regions Proteins 0.000 description 1
- 208000034657 Convalescence Diseases 0.000 description 1
- SBORMUFGKSCGEN-XHNCKOQMSA-N Cys-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N)C(=O)O SBORMUFGKSCGEN-XHNCKOQMSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 230000005778 DNA damage Effects 0.000 description 1
- 231100000277 DNA damage Toxicity 0.000 description 1
- 230000008265 DNA repair mechanism Effects 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- HHWQMFIGMMOVFK-WDSKDSINSA-N Gln-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O HHWQMFIGMMOVFK-WDSKDSINSA-N 0.000 description 1
- ODBLJLZVLAWVMS-GUBZILKMSA-N Gln-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N ODBLJLZVLAWVMS-GUBZILKMSA-N 0.000 description 1
- IKFZXRLDMYWNBU-YUMQZZPRSA-N Gln-Gly-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N IKFZXRLDMYWNBU-YUMQZZPRSA-N 0.000 description 1
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 1
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 1
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 1
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 1
- HQTDNEZTGZUWSY-XVKPBYJWSA-N Glu-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)NCC(O)=O HQTDNEZTGZUWSY-XVKPBYJWSA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- 102100036263 Glutamyl-tRNA(Gln) amidotransferase subunit C, mitochondrial Human genes 0.000 description 1
- XEJTYSCIXKYSHR-WDSKDSINSA-N Gly-Asp-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN XEJTYSCIXKYSHR-WDSKDSINSA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- QIVPRLJQQVXCIY-HGNGGELXSA-N His-Ala-Gln Chemical compound C[C@H](NC(=O)[C@@H](N)Cc1cnc[nH]1)C(=O)N[C@@H](CCC(N)=O)C(O)=O QIVPRLJQQVXCIY-HGNGGELXSA-N 0.000 description 1
- QMUHTRISZMFKAY-MXAVVETBSA-N His-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N QMUHTRISZMFKAY-MXAVVETBSA-N 0.000 description 1
- 101000671735 Homo sapiens 60S ribosomal protein L37 Proteins 0.000 description 1
- 101001001786 Homo sapiens Glutamyl-tRNA(Gln) amidotransferase subunit C, mitochondrial Proteins 0.000 description 1
- 108090000144 Human Proteins Proteins 0.000 description 1
- 102000003839 Human Proteins Human genes 0.000 description 1
- UNDGQKWQNSTPPW-CYDGBPFRSA-N Ile-Arg-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCSC)C(=O)O)N UNDGQKWQNSTPPW-CYDGBPFRSA-N 0.000 description 1
- CCHSQWLCOOZREA-GMOBBJLQSA-N Ile-Asp-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N CCHSQWLCOOZREA-GMOBBJLQSA-N 0.000 description 1
- VOBYAKCXGQQFLR-LSJOCFKGSA-N Ile-Gly-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VOBYAKCXGQQFLR-LSJOCFKGSA-N 0.000 description 1
- QQVXERGIFIRCGW-NAKRPEOUSA-N Ile-Ser-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)O)N QQVXERGIFIRCGW-NAKRPEOUSA-N 0.000 description 1
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 1
- MLFKVJCWGUZWNV-UHFFFAOYSA-N L-alanosine Natural products OC(=O)C(N)CN(O)N=O MLFKVJCWGUZWNV-UHFFFAOYSA-N 0.000 description 1
- 229930195714 L-glutamate Natural products 0.000 description 1
- FFFHZYDWPBMWHY-VKHMYHEASA-N L-homocysteine Chemical compound OC(=O)[C@@H](N)CCS FFFHZYDWPBMWHY-VKHMYHEASA-N 0.000 description 1
- UCUNFLYVYCGDHP-BYPYZUCNSA-N L-methionine sulfone Chemical compound CS(=O)(=O)CC[C@H](N)C(O)=O UCUNFLYVYCGDHP-BYPYZUCNSA-N 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 1
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 1
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 1
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 1
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 1
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 1
- KEVYYIMVELOXCT-KBPBESRZSA-N Leu-Gly-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KEVYYIMVELOXCT-KBPBESRZSA-N 0.000 description 1
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- ITWQLSZTLBKWJM-YUMQZZPRSA-N Lys-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCCN ITWQLSZTLBKWJM-YUMQZZPRSA-N 0.000 description 1
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 1
- NCZIQZYZPUPMKY-PPCPHDFISA-N Lys-Ile-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NCZIQZYZPUPMKY-PPCPHDFISA-N 0.000 description 1
- RMOKGALPSPOYKE-KATARQTJSA-N Lys-Thr-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMOKGALPSPOYKE-KATARQTJSA-N 0.000 description 1
- OLWAOWXIADGIJG-AVGNSLFASA-N Met-Arg-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(O)=O OLWAOWXIADGIJG-AVGNSLFASA-N 0.000 description 1
- VQILILSLEFDECU-GUBZILKMSA-N Met-Pro-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O VQILILSLEFDECU-GUBZILKMSA-N 0.000 description 1
- QYIGOFGUOVTAHK-ZJDVBMNYSA-N Met-Thr-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QYIGOFGUOVTAHK-ZJDVBMNYSA-N 0.000 description 1
- 101100107522 Mus musculus Slc1a5 gene Proteins 0.000 description 1
- 229930192627 Naphthoquinone Chemical class 0.000 description 1
- OMBMFTUITNFNAW-UHFFFAOYSA-N OCC(CO)(CO)N(P)CC(O)=O Chemical compound OCC(CO)(CO)N(P)CC(O)=O OMBMFTUITNFNAW-UHFFFAOYSA-N 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 108010077524 Peptide Elongation Factor 1 Proteins 0.000 description 1
- SEPNOAFMZLLCEW-UBHSHLNASA-N Phe-Ala-Val Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O SEPNOAFMZLLCEW-UBHSHLNASA-N 0.000 description 1
- HTKNPQZCMLBOTQ-XVSYOHENSA-N Phe-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N)O HTKNPQZCMLBOTQ-XVSYOHENSA-N 0.000 description 1
- MGBRZXXGQBAULP-DRZSPHRISA-N Phe-Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGBRZXXGQBAULP-DRZSPHRISA-N 0.000 description 1
- SWXSLPHTJVAWDF-VEVYYDQMSA-N Pro-Asn-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWXSLPHTJVAWDF-VEVYYDQMSA-N 0.000 description 1
- SKICPQLTOXGWGO-GARJFASQSA-N Pro-Gln-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O SKICPQLTOXGWGO-GARJFASQSA-N 0.000 description 1
- DCHQYSOGURGJST-FJXKBIBVSA-N Pro-Thr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O DCHQYSOGURGJST-FJXKBIBVSA-N 0.000 description 1
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 1
- 230000006819 RNA synthesis Effects 0.000 description 1
- 101100029566 Rattus norvegicus Rabggta gene Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 101150071661 SLC25A20 gene Proteins 0.000 description 1
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 1
- GRSLLFZTTLBOQX-CIUDSAMLSA-N Ser-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N GRSLLFZTTLBOQX-CIUDSAMLSA-N 0.000 description 1
- DJACUBDEDBZKLQ-KBIXCLLPSA-N Ser-Ile-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O DJACUBDEDBZKLQ-KBIXCLLPSA-N 0.000 description 1
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 1
- 108010003723 Single-Domain Antibodies Proteins 0.000 description 1
- DDPVJPIGACCMEH-XQXXSGGOSA-N Thr-Ala-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DDPVJPIGACCMEH-XQXXSGGOSA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 1
- OHDXOXIZXSFCDN-RCWTZXSCSA-N Thr-Met-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OHDXOXIZXSFCDN-RCWTZXSCSA-N 0.000 description 1
- PZSDPRBZINDEJV-HTUGSXCWSA-N Thr-Phe-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O PZSDPRBZINDEJV-HTUGSXCWSA-N 0.000 description 1
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 1
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 1
- LXXCHJKHJYRMIY-FQPOAREZSA-N Thr-Tyr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O LXXCHJKHJYRMIY-FQPOAREZSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 102100037116 Transcription elongation factor 1 homolog Human genes 0.000 description 1
- RSUXQZNWAOTBQF-XIRDDKMYSA-N Trp-Arg-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RSUXQZNWAOTBQF-XIRDDKMYSA-N 0.000 description 1
- DMWNPLOERDAHSY-MEYUZBJRSA-N Tyr-Leu-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DMWNPLOERDAHSY-MEYUZBJRSA-N 0.000 description 1
- HSCJRCZFDFQWRP-UHFFFAOYSA-N Uridindiphosphoglukose Natural products OC1C(O)C(O)C(CO)OC1OP(O)(=O)OP(O)(=O)OCC1C(O)C(O)C(N2C(NC(=O)C=C2)=O)O1 HSCJRCZFDFQWRP-UHFFFAOYSA-N 0.000 description 1
- DNOOLPROHJWCSQ-RCWTZXSCSA-N Val-Arg-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DNOOLPROHJWCSQ-RCWTZXSCSA-N 0.000 description 1
- XIFAHCUNWWKUDE-DCAQKATOSA-N Val-Cys-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N XIFAHCUNWWKUDE-DCAQKATOSA-N 0.000 description 1
- BMOFUVHDBROBSE-DCAQKATOSA-N Val-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N BMOFUVHDBROBSE-DCAQKATOSA-N 0.000 description 1
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 1
- RTJPAGFXOWEBAI-SRVKXCTJSA-N Val-Val-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RTJPAGFXOWEBAI-SRVKXCTJSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 108010084455 Zeocin Proteins 0.000 description 1
- PGAVKCOVUIYSFO-UHFFFAOYSA-N [[5-(2,4-dioxopyrimidin-1-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound OC1C(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)OC1N1C(=O)NC(=O)C=C1 PGAVKCOVUIYSFO-UHFFFAOYSA-N 0.000 description 1
- 230000033289 adaptive immune response Effects 0.000 description 1
- 239000002671 adjuvant Substances 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 229950005033 alanosine Drugs 0.000 description 1
- ZYVMPHJZWXIFDQ-LURJTMIESA-N alpha-methylmethionine Chemical compound CSCC[C@](C)(N)C(O)=O ZYVMPHJZWXIFDQ-LURJTMIESA-N 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000001093 anti-cancer Effects 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 230000010310 bacterial transformation Effects 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- AFYNADDZULBEJA-UHFFFAOYSA-N bicinchoninic acid Chemical class C1=CC=CC2=NC(C=3C=C(C4=CC=CC=C4N=3)C(=O)O)=CC(C(O)=O)=C21 AFYNADDZULBEJA-UHFFFAOYSA-N 0.000 description 1
- 239000012148 binding buffer Substances 0.000 description 1
- 238000005842 biochemical reaction Methods 0.000 description 1
- 229930189065 blasticidin Natural products 0.000 description 1
- 239000012888 bovine serum Substances 0.000 description 1
- 229950010231 brequinar Drugs 0.000 description 1
- 101150102633 cact gene Proteins 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000009833 condensation Methods 0.000 description 1
- 230000005494 condensation Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 239000013068 control sample Substances 0.000 description 1
- 230000002920 convulsive effect Effects 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- JSRLJPSBLDHEIO-SHYZEUOFSA-L dUMP(2-) Chemical compound O1[C@H](COP([O-])([O-])=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 JSRLJPSBLDHEIO-SHYZEUOFSA-L 0.000 description 1
- YSMODUONRAFBET-UHFFFAOYSA-N delta-DL-hydroxylysine Natural products NCC(O)CCC(N)C(O)=O YSMODUONRAFBET-UHFFFAOYSA-N 0.000 description 1
- MXHRCPNRJAMMIM-UHFFFAOYSA-N desoxyuridine Natural products C1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-UHFFFAOYSA-N 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 230000001079 digestive effect Effects 0.000 description 1
- UFIVEPVSAGBUSI-UHFFFAOYSA-M dihydroorotate Chemical compound [O-]C(=O)C1CC(=O)NC(=O)N1 UFIVEPVSAGBUSI-UHFFFAOYSA-M 0.000 description 1
- UFIVEPVSAGBUSI-UHFFFAOYSA-N dihydroorotic acid Chemical compound OC(=O)C1CC(=O)NC(=O)N1 UFIVEPVSAGBUSI-UHFFFAOYSA-N 0.000 description 1
- 108010054812 diprotin A Proteins 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 239000012149 elution buffer Substances 0.000 description 1
- YSMODUONRAFBET-UHNVWZDZSA-N erythro-5-hydroxy-L-lysine Chemical compound NC[C@H](O)CC[C@H](N)C(O)=O YSMODUONRAFBET-UHNVWZDZSA-N 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- HBDWQSHEVMSFGY-UHFFFAOYSA-N gamma-hydroxy-L-glutamic acid Natural products OC(=O)C(N)CC(O)C(O)=O HBDWQSHEVMSFGY-UHFFFAOYSA-N 0.000 description 1
- 101150110946 gatC gene Proteins 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- BRZYSWJRSDMWLG-CAXSIQPQSA-N geneticin Natural products O1C[C@@](O)(C)[C@H](NC)[C@@H](O)[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](C(C)O)O2)N)[C@@H](N)C[C@H]1N BRZYSWJRSDMWLG-CAXSIQPQSA-N 0.000 description 1
- 238000003205 genotyping method Methods 0.000 description 1
- 229940049906 glutamate Drugs 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 1
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 1
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 230000003394 haemopoietic effect Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 239000000833 heterodimer Substances 0.000 description 1
- 108010050343 histidyl-alanyl-glutamine Proteins 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 235000003642 hunger Nutrition 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 230000003053 immunization Effects 0.000 description 1
- 239000003018 immunosuppressive agent Substances 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 239000012212 insulator Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- CTAPFRYPJLPFDF-UHFFFAOYSA-N isoxazole Chemical compound C=1C=NOC=1 CTAPFRYPJLPFDF-UHFFFAOYSA-N 0.000 description 1
- 150000002545 isoxazoles Chemical class 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 1
- 108010034529 leucyl-lysine Proteins 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 150000002791 naphthoquinones Chemical class 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 229960005010 orotic acid Drugs 0.000 description 1
- 239000005022 packaging material Substances 0.000 description 1
- CWCMIVBLVUHDHK-ZSNHEYEWSA-N phleomycin D1 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC[C@@H](N=1)C=1SC=C(N=1)C(=O)NCCCCNC(N)=N)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C CWCMIVBLVUHDHK-ZSNHEYEWSA-N 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 231100000614 poison Toxicity 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 229920000136 polysorbate Polymers 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000000069 prophylactic effect Effects 0.000 description 1
- 229950010131 puromycin Drugs 0.000 description 1
- 229940083082 pyrimidine derivative acting on arteriolar smooth muscle Drugs 0.000 description 1
- 230000006824 pyrimidine synthesis Effects 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229910000162 sodium phosphate Inorganic materials 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 108010005652 splenotritin Proteins 0.000 description 1
- 230000037351 starvation Effects 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 125000005555 sulfoximide group Chemical group 0.000 description 1
- 238000004114 suspension culture Methods 0.000 description 1
- 229940021747 therapeutic vaccine Drugs 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 239000003440 toxic substance Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000010474 transient expression Effects 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 230000002477 vacuolizing effect Effects 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 230000003245 working effect Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
- C12N5/0681—Cells of the genital tract; Non-germinal cells from gonads
- C12N5/0682—Cells of the female genital tract, e.g. endometrium; Non-germinal cells from ovaries, e.g. ovarian follicle cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/001—Oxidoreductases (1.) acting on the CH-CH group of donors (1.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y103/00—Oxidoreductases acting on the CH-CH group of donors (1.3)
- C12Y103/05—Oxidoreductases acting on the CH-CH group of donors (1.3) with a quinone or related compound as acceptor (1.3.5)
- C12Y103/05002—Dihydroorotate dehydrogenase (1.3.5.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y603/00—Ligases forming carbon-nitrogen bonds (6.3)
- C12Y603/01—Acid-ammonia (or amine)ligases (amide synthases)(6.3.1)
- C12Y603/01002—Glutamate-ammonia ligase (6.3.1.2)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/10—Immunoglobulins specific features characterized by their source of isolation or production
- C07K2317/14—Specific host cells or culture conditions, e.g. components, pH or temperature
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/30—Immunoglobulins specific features characterized by aspects of specificity or valency
- C07K2317/31—Immunoglobulins specific features characterized by aspects of specificity or valency multispecific
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Immunology (AREA)
- Cell Biology (AREA)
- Mycology (AREA)
- Reproductive Health (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
본 발명은 부분적으로 또는 완전히 불활성화된 내인성 디히드로오로테이트 데히드로게나제 (DHODH) 및 글루타민 신테타제 (GS) 유전자를 포함하는 세포주 및 재조합 단백질을 생산하기 위한 그의 용도에 관한 것이다.
Description
본 발명은 단백질 생산을 위한 세포주 및 선택 마커에 관한 것이다.
재조합 단백질을 산업적 규모로 생산하는 것은 다량의 재조합 단백질을 생산하는 클론의 단리를 요구한다. 이종 유전자를 동물 숙주 세포 내로 도입하고, 첨가된 유전자의 발현에 대해 스크리닝하는 것은 길고 복잡한 과정이다. 이러한 과정은 형질감염 및 안정하게 장기간 발현되는 클론의 선택 및 상응하는 재조합 단백질에 대해 높은 발현율을 갖는 클론에 대한 스크리닝을 수반한다.
발현 벡터로부터 재조합 단백질을 발현하는 클론을 생성하는 경우에, 숙주 세포는 통상적으로 동일한 벡터 상의 관심 단백질 및 선택 마커 둘 다를 코딩하는 DNA 벡터로 형질감염된다. 따라서, 이러한 발현 벡터는 발현 벡터가 존재하는 클론의 선택을 가능하게 하는 선택 마커를 포함한다. 이러한 선택 마커는 또한 형질감염된 DNA의 공동-증폭을 유도하여, 고-생산자 클론의 단리를 가능하게 할 수 있다.
대부분의 선택 마커는 항생제 또는 다른 독성 물질에 대한 내성을 부여하는 단백질 또는 세포 생존에 필수적인 단백질이다. 예를 들어 G418, 히그로마이신, 퓨로마이신, 제오마이신, 디히드로폴레이트 리덕타제 (DHFR), 글루타민 신테타제 (GS) 및 하이포크산틴-구아닌 포스포리보실트랜스퍼라제 (HPRT)를 포함한 여러 이러한 선택 마커가 관련 기술분야에 공지되어 있다.
GS는 진핵 세포에서의 산업적 재조합 단백질 생산 분야에서 선택 마커로서 널리 사용된다. GS 유전자는 세포 성장에 필수적인 글루타민의 합성을 허용하고, MSX (L-메티오닌 술폭시민)에 의해 억제된다. MSX의 존재 하에서는, 단지 보다 많은 양의 GS를 발현하는 세포만이 생존한다. 적절한 스크리닝 후에, 외인성 단백질을 생산하는 세포를 선택하는 것이 가능하다.
이전 출원 WO2016/062837에서, 본 발명자들은 선택 마커로서 데히드로오로테이트 데히드로게나제 (DHODH)의 사용에 기초한 발현 시스템을 개발하였다. DHODH는 피리미딘 합성에 요구되는 효소이다. 따라서, DHODH를 억제하는 화합물은 DNA 합성 및 이에 따른 세포 증식을 억제한다. 따라서, 이러한 선택 마커는 DHODH 억제제, 예컨대 레플루노미드 및 테리플루노미드와 조합되어 사용되는 DHODH를 코딩하는 발현 벡터를 포함한다.
그러나, 상기 선택 마커와 함께 사용되는 대부분의 억제제는 독성이다. DHODH 선택 마커의 경우에, 테리플루노미드는, 예를 들어 강력한 면역-억제자이고, 특히 그의 대규모 취급은 안전성 이유로 어려울 수 있다. GS 선택 마커의 경우에, MSX는 고용량에서 경련성이고, 따라서 또한 취급 문제를 일으킬 수 있다. DHFR 선택 마커의 경우에, 메토트렉세이트는 조혈 및 소화 독성을 나타내고, 이에 의해 또한 취급 문제를 일으키는 것으로 공지되어 있다.
추가로, 복합 단백질, 예컨대 이중특이적 또는 삼중특이적 모노클로날 항체를 생산하기 위해, 단일 클론이 여러 별개의 발현 벡터로부터 여러 별개의 재조합 단백질을 생산하는 것이 필요하다. 이러한 경우에, 숙주 세포는 동일한 벡터 상의 관심 단백질 및 특이적 선택 마커 둘 다를 각각 코딩하는 여러 DNA 벡터로 형질감염되어야 한다. 따라서, 각각의 발현 벡터는 발현 벡터가 존재하는 클론의 선택을 가능하게 하는 별개의 선택 마커를 포함한다.
따라서, 취급하기 어려운 화합물의 첨가 없이 관심 단백질-생산 클론의 선택이 수행될 수 있는, 여러 별개의 선택 마커를 통한 여러 별개의 단백질의 생산을 가능하게 하는 발현 시스템이 필요하다.
본 발명은 이러한 필요를 충족시킨다.
본 발명은 관심 단백질-생산 세포가 세포주 내의 DHODH 유전자 및 GS 유전자의 부분 또는 완전 불활성화로 인해 우리딘 및 글루타민이 결여된 배지에서 선택될 수 있다는 본 발명자들의 상기 세포주 설계로부터 비롯된다. DHODH 유전자 및 GS 유전자가 부분적으로 또는 완전히 불활성화된 이러한 세포주는 전형적으로 우리딘 및 글루타민이 보충된 배지에서 성장하지만, 포유동물 DHODH를 코딩하는, 특히 돌연변이된 포유동물 DHODH를 코딩하는 뉴클레오티드 서열 및 제1 관심 단백질을 발현시키기 위한 발현 카세트를 포함하는 발현 벡터로, 및 포유동물 GS를 코딩하는 뉴클레오티드 서열 및 제2 관심 단백질을 발현시키기 위한 발현 카세트를 포함하는 발현 벡터로 형질감염된 경우에, 배양 배지는 전형적으로 우리딘 및 글루타민이 결여된 배양 배지에 의해 교체되고, 이에 의해 제1 및 제2 관심 단백질을 생산하는 세포를 선택한다.
이러한 발현 시스템은 선택 압력으로서 억제제의 사용을 피함으로써 생산 세포의 생존율을 증가시키기 때문에 특히 유리하다. 본 발명자들은 이러한 독성의 감소가 높은 생산성과 연관되었다는 것을 추가로 입증하였다. 추가로, 이러한 발현 시스템은 복합 재조합 단백질, 예컨대 이중특이적 또는 삼중특이적 모노클로날 항체의 생산을 가능하게 한다.
따라서, 본 발명은 하기를 포함하는 세포주에 관한 것이다:
- 부분적으로 또는 완전히 불활성화된 내인성 데히드로오로테이트 데히드로게나제 (DHODH) 유전자, 및
- 부분적으로 또는 완전히 불활성화된 내인성 글루타민 신테타제 (GS) 유전자.
특정한 실시양태에서, 상기 세포주는 차이니즈 햄스터 난소 (CHO) 세포주이다.
또 다른 특정한 실시양태에서, 세포주는 하기 단계에 의해 생산된다:
(a1) 내인성 DHODH 유전자 및 내인성 GS 유전자를 포함하는 세포 내의 내인성 DHODH 유전자를, 특히 유전자 편집 방법, 예컨대 CRISPR-Cas 방법, 예컨대 CRISPR-Cas9 방법에 의해 불활성화시키는 단계,
(b1) 세포를 우리딘을 포함하는 배양 배지에서 내인성 DHODH 유전자가 부분적으로 또는 완전히 불활성화된 세포주를 생성하는 데 적합한 조건 하에 배양하는 단계,
(c1) 내인성 DHODH 유전자가 부분적으로 또는 완전히 불활성화된 상기 세포를 회수하는 단계,
(d1) 상기 세포 내의 내인성 GS 유전자를, 특히 유전자 편집 방법, 예컨대 CRISPR-Cas 방법, 예컨대 CRISPR-Cas9 방법에 의해 불활성화시키는 단계, 및
(e1) 상기 세포를 글루타민을 포함하는 배양 배지에서 내인성 GS 유전자가 부분적으로 또는 완전히 불활성화된 세포주를 생성하는 데 적합한 조건 하에 배양하는 단계.
대안적인 특정한 실시양태에서, 세포주는 하기 단계에 의해 생산된다:
(a2) 내인성 GS 유전자 및 부분적으로 또는 완전히 불활성화된 내인성 DHODH 유전자를 포함하는 세포를 제공하는 단계,
(b2) 상기 세포 내의 내인성 GS 유전자를, 특히 유전자 편집 방법, 예컨대 CRISPR-Cas 방법, 예컨대 CRISPR-Cas9 방법에 의해 불활성화시키는 단계, 및
(c2) 세포를 글루타민을 포함하는 배양 배지에서 내인성 GS 유전자가 부분적으로 또는 완전히 불활성화된 세포주를 생성하는 데 적합한 조건 하에 배양하는 단계.
또 다른 특정한 실시양태에서, 세포주는 하기 단계에 의해 생산된다:
(a3) 내인성 DHODH 유전자 및 부분적으로 또는 완전히 불활성화된 내인성 GS 유전자를 포함하는 세포를 제공하는 단계,
(b3) 상기 세포 내의 내인성 DHODH 유전자를, 특히 유전자 편집 방법, 예컨대 CRISPR-Cas 방법, 예컨대 CRISPR-Cas9 방법에 의해 불활성화시키는 단계, 및
(c3) 세포를 우리딘을 포함하는 배양 배지에서 내인성 DHODH 유전자가 부분적으로 또는 완전히 불활성화된 세포주를 생성하는 데 적합한 조건 하에 배양하는 단계.
특정한 실시양태에서, 내인성 DHODH 유전자의 1개 이상의 또는 모든 대립유전자는 부분적으로 또는 완전히 불활성화되고/거나, 내인성 GS 유전자의 모든 대립유전자는 부분적으로 또는 완전히 불활성화된다.
추가 실시양태에서, 상기 세포주는 하기를 추가로 포함한다:
- 외인성 포유동물 DHODH를 코딩하는 뉴클레오티드 서열 (i) 및 재조합 단백질 (I)을 발현시키기 위한 적어도 1개의 발현 카세트를 포함하는 발현 벡터이며, 여기서 상기 외인성 DHODH는 서열식별번호: 2의 서열 또는 서열식별번호: 4의 서열에 대해 적어도 60% 동일한 서열을 포함하는 것인 발현 벡터, 및
- 외인성 포유동물 GS를 코딩하는 뉴클레오티드 서열 (ii) 및 재조합 단백질 (II)를 발현시키기 위한 적어도 1개의 발현 카세트를 포함하는 발현 벡터이며, 여기서 상기 외인성 GS는 서열식별번호: 6의 서열 또는 서열식별번호: 8의 서열에 대해 적어도 94.5% 동일한 서열을 포함하는 것인 발현 벡터.
그의 특정한 실시양태에서, 상기 뉴클레오티드 서열 (i)은 서열식별번호: 1의 서열 또는 서열식별번호: 3의 서열을 포함한다.
그의 또 다른 특정한 실시양태에서, 상기 뉴클레오티드 서열 (ii)는 서열식별번호: 5의 서열 또는 서열식별번호: 7의 서열을 포함한다.
그의 또 다른 특정한 실시양태에서, 상기 재조합 단백질 (I) 및 (II)는 모노클로날 항체의 별개의 아암이다.
그의 또 다른 특정한 실시양태에서, 상기 벡터는 각각 항체 경쇄의 클로닝에 적합한 제1 발현 카세트 및 항체 중쇄의 클로닝에 적합한 제2 발현 카세트를 포함한다.
본 발명의 또 다른 목적은 하기를 포함하는 발현 시스템이다:
(A) 상기 정의된 바와 같은 부분적으로 또는 완전히 불활성화된 내인성 DHODH 유전자 및 부분적으로 또는 완전히 불활성화된 내인성 GS 유전자를 포함하는 세포주,
(B) 포유동물 DHODH를 코딩하는 뉴클레오티드 서열 (i) 및 재조합 단백질 (I)을 발현시키기 위한 적어도 1개의 발현 카세트를 포함하는 발현 벡터이며, 여기서 상기 DHODH는 서열식별번호: 2의 서열 또는 서열식별번호: 4의 서열에 대해 적어도 60% 동일한 서열을 포함하는 것인 발현 벡터, 및
(C) 포유동물 GS를 코딩하는 뉴클레오티드 서열 (ii) 및 재조합 단백질 (II)를 발현시키기 위한 적어도 1개의 발현 카세트를 포함하는 발현 벡터이며, 여기서 GS는 서열식별번호: 6의 서열 또는 서열식별번호: 8의 서열에 대해 적어도 94.5% 동일한 서열을 포함하는 것인 발현 벡터.
특정한 실시양태에서, 상기 뉴클레오티드 서열 (i)은 서열식별번호: 1의 서열 또는 서열식별번호: 3의 서열을 포함한다.
또 다른 특정한 실시양태에서, 상기 뉴클레오티드 서열 (ii)는 서열식별번호: 5의 서열 또는 서열식별번호: 7의 서열을 포함한다.
또 다른 특정한 실시양태에서, 상기 재조합 단백질 (I) 및 (II)는 모노클로날 항체의 별개의 아암이다.
추가의 특정한 실시양태에서, 상기 벡터는 각각 항체 경쇄의 클로닝에 적합한 제1 발현 카세트 및 항체 중쇄의 클로닝에 적합한 제2 발현 카세트를 포함한다.
본 발명은 추가로 하기를 포함하는 키트에 관한 것이다:
- 상기 정의된 바와 같은 세포주 또는 상기 정의된 바와 같은 발현 시스템, 및
- 우리딘 및 글루타민이 결여된, 특히 추가로 DHODH 억제제 및 GS 억제제가 결여된 배양 배지.
본 발명의 또 다른 목적은 하기 단계를 포함하는, 재조합 단백질을 생산하는 시험관내 방법에 관한 것이다:
A)
a1) 상기 정의된 바와 같은 세포주이며,
- 외인성 포유동물 DHODH를 코딩하는 뉴클레오티드 서열 (i) 및 재조합 단백질 (I)을 발현시키기 위한 적어도 1개의 발현 카세트를 포함하는 발현 벡터이며, 여기서 상기 외인성 DHODH는 서열식별번호: 2의 서열 또는 서열식별번호: 4의 서열에 대해 적어도 60% 동일한 서열을 포함하는 것인 발현 벡터, 및
- 외인성 포유동물 GS를 코딩하는 뉴클레오티드 서열 (ii) 및 재조합 단백질 (II)를 발현시키기 위한 적어도 1개의 발현 카세트를 포함하는 발현 벡터이며, 여기서 상기 외인성 GS는 서열식별번호: 6의 서열 또는 서열식별번호: 8의 서열에 대해 적어도 94.5% 동일한 서열을 포함하는 것인 발현 벡터
를 추가로 포함하는 세포주를 제공하는 단계;
또는
a2) 상기 정의된 바와 같은 세포주를 제공하는 단계, 및
a2') 상기 정의된 바와 같은 발현 벡터를 단계 a2)에서 제공된 세포주 내로 도입하는 단계;
또는
a3) 내인성 DHODH 유전자 및 내인성 GS 유전자를 포함하는 세포주를 제공하는 단계,
a3') 단계 a3)에서 제공된 세포주 내의 내인성 DHODH 유전자 및 내인성 GS 유전자를 부분적으로 또는 완전히 불활성화시키는 단계, 및
a3") 상기 정의된 바와 같은 발현 벡터를 단계 a3')에서 수득된 부분적으로 또는 완전히 불활성화된 내인성 DHODH 유전자 및 부분적으로 또는 완전히 불활성화된 GS 유전자를 포함하는 세포주 내로 도입하는 단계;
또는
a4) 내인성 GS 유전자 및 부분적으로 또는 완전히 불활성화된 내인성 DHODH 유전자를 포함하는 세포주를 제공하는 단계,
a4') 단계 a4)에서 제공된 세포주 내의 내인성 GS 유전자를 부분적으로 또는 완전히 불활성화시키는 단계, 및
a4") 상기 정의된 바와 같은 발현 벡터를 부분적으로 또는 완전히 불활성화된 내인성 DHODH 유전자 및 단계 a4')에서 수득된 부분적으로 또는 완전히 불활성화된 GS 유전자를 포함하는 세포주 내로 도입하는 단계;
또는
a5) 내인성 DHODH 유전자 및 부분적으로 또는 완전히 불활성화된 내인성 GS 유전자를 포함하는 세포를 제공하는 단계,
a5') 단계 a5)에서 제공된 세포주 내의 내인성 DHODH 유전자를 부분적으로 또는 완전히 불활성화시키는 단계, 및
a5") 상기 정의된 바와 같은 발현 벡터를 단계 a5')에서 수득된 부분적으로 또는 완전히 불활성화된 내인성 DHODH 유전자 및 부분적으로 또는 완전히 불활성화된 GS 유전자를 포함하는 세포주 내로 도입하는 단계;
B)
상기 세포주를 재조합 단백질의 생산에 적합한 조건 하에 배양하는 단계; 및
C)
상기 재조합 단백질을 단리 및/또는 정제하는 단계.
특정한 실시양태에서, 상기 단계 B)는 우리딘 및 글루타민이 결여된, 특히 추가로 DHODH 억제제 및 GS 억제제가 결여된 배양 배지에서 수행된다.
또 다른 특정한 실시양태에서, 상기 방법은 상기 재조합 단백질을 제약 조성물로 제제화하는 단계 D)를 추가로 포함한다.
본 발명은 추가로 재조합 단백질을 생산하기 위한, 상기 정의된 바와 같은 세포주, 상기 정의된 바와 같은 발현 시스템 또는 상기 정의된 바와 같은 키트의 용도에 관한 것이다.
특정한 실시양태에서, 세포주, 발현 시스템 또는 키트는 우리딘 및 글루타민이 결여된, 특히 DHODH 억제제 및 GS 억제제가 부재하는 배양 배지와 조합되어 사용된다.
도 1은 진뱅크(Genebank) NCBI에서 2018년 12월 21일에 이용가능한 진 ID(Gene ID): 100756632 하에 언급된 인간 DHODH 유전자의 게놈 구조를 보여준다.
도 2는 인간 DHODH 및 인간 GS 선택 마커 및 DHODH/GS KO (녹아웃) 또는 야생형 CHO 세포를 사용한 제10일 및 제14일에서의 삼중특이적 항체 생산을 보여준다.
도 2는 인간 DHODH 및 인간 GS 선택 마커 및 DHODH/GS KO (녹아웃) 또는 야생형 CHO 세포를 사용한 제10일 및 제14일에서의 삼중특이적 항체 생산을 보여준다.
디히드로오로테이트 데히드로게나제
본원에 사용된 용어 "디히드로오로테이트 데히드로게나제" 또는 "DHODH"는 하기 반응에 의해 나타내어지는 바와 같이 디히드로오로테이트 (4,5-디히드로오로트산 또는 2,6-디옥소-1,3-디아지난-4-카르복실산)의 오로테이트 (오로트산 또는 1,2,3,6-테트라히드로-2,6-디옥소-4-피리미딘카르복실산)로의 전환을 촉매할 수 있는 폴리펩티드를 지칭한다:
(S)-디히드로오로테이트 + O2 ↔ 오로테이트 + H2O2
이러한 폴리펩티드는 효소 위원회 (EC) 번호 1.3.3.1 하에 분류된다. 상기 반응을 촉매할 수 있는 폴리펩티드는 "DHODH 활성"을 나타낸다.
상기 반응은 DNA 및 RNA의 합성에 요구되는 우리딘 모노포스페이트 (rUMP)의 신생 합성에서의 제4 단계이다. 따라서, DHODH의 억제 또는 불활성화는 DNA 및 RNA 합성을 억제하는 효과를 가지며, 이에 따라 세포 증식을 억제한다.
글루타민 신테타제
본원에 사용된 용어 "글루타민 신테타제" 또는 "GS"는 하기 생화학적 반응에 의해 나타내어지는 바와 같이 글루타메이트와 암모니아의 축합을 촉매하여 글루타민을 형성할 수 있는 폴리펩티드를 지칭한다:
ATP + L-글루타메이트 + NH3 ↔ ADP + 포스페이트 + L-글루타민
이러한 폴리펩티드는 효소 위원회 (EC) 번호 6.3.1.2 하에 분류된다. 상기 반응을 촉매할 수 있는 폴리펩티드는 "GS 활성"을 나타낸다.
세포주
본 발명은 부분적으로 또는 완전히 불활성화된 내인성 데히드로오로테이트 데히드로게나제 (DHODH) 유전자 및 부분적으로 또는 완전히 불활성화된 내인성 글루타민 신테타제 (GS) 유전자를 포함하는 세포주에 관한 것이다.
세포주는 진핵 세포주, 예를 들어 포유동물 세포주, 예컨대 차이니즈 햄스터 난소 (CHO) 세포주, 원숭이 세포주 또는 인간 세포주이다.
특정한 실시양태에서, 세포주는 CHO 세포주이다.
CHO 세포주는 산업적 단백질 생산에 통상적으로 사용되며, 많은 CHO 세포주가 관련 기술분야의 통상의 기술자에게 공지되어 있다. 예를 들어, 이러한 CHO 세포주는 아메리칸 타입 컬쳐 콜렉션으로부터 공개적으로 이용가능한 세포주, 예컨대 CHO-K1 세포주 (ATCC 번호: CCL-61), CHO-S 세포주 (예를 들어 인비트로젠(Invitrogen) 및 깁코(Gibco)에 의해 시판됨), CHO DP-12 세포주 (ATCC 번호 CRL-12444 및 12445) 및 CHO 1-15 세포주 (ATCC 번호 CRL-9606)를 포함한다. 산업적 단백질 생산에 적합한 또 다른 세포주는 CHO 9E4 세포주이다. 9E4 세포주는 CHO-K1 세포주의 클론으로부터 단일 세포 클로닝 과정을 통해 확립되었다. 9E4 세포주의 확립은 실시예 1에 보다 심도있게 제시된다. CHO-K1 세포주는 푹(Puck)에 의해 1957년에 수득되었고, ATCC에 번호 CCL-61 하에 기탁되었다.
인간 세포, 예컨대 HEK293 (ATCC 번호 CRL-1573), HKB11 (ATCC 번호 CRL-12568), PER-C6 (크루셀(Crucell)), HT1080 (ATCC 번호 CRL-121), Jurkat, Daudi, Raji 및 CAP (ATCC 번호 CRL-1098) 세포가 또한 재조합 인간 단백질에 대한 천연 글리코실화 패턴을 수득하기 위해 단백질 생산에 사용될 수 있다.
한 실시양태에서, 세포주는 무혈청 배지 (예를 들어, 화학적-한정 배지) 및/또는 현탁액에서 성장할 수 있다. 이러한 세포주는 모 세포주를 무혈청 배지 및/또는 현탁액에서 성장하도록 적응시킴으로써 (예를 들어, 단일 세포 클로닝을 통해, 점진적 적응을 통해 및/또는 "고갈 및 절약" 과정을 통해) 관련 기술분야의 통상의 기술자에 의해 용이하게 수득될 수 있다.
본 발명의 세포주는 부분적으로 또는 완전히 불활성화된 내인성 데히드로오로테이트 데히드로게나제 (DHODH) 유전자 및 부분적으로 또는 완전히 불활성화된 내인성 글루타민 신테타제 (GS) 유전자를 포함하는 세포주이다.
"내인성 DHODH 유전자"는 본원에서 특정한 환경 조건 하에 특정한 발생 단계에서 상기 특정한 세포에 정상적으로 존재하는 DHODH 유전자를 의미한다.
"내인성 DHODH 유전자"는 하기 정의된 "외인성 DHODH"와 구별되는데, 상기 외인성 DHODH는 하기 정의된 발현 벡터에 의해 제공되며, 이는 상기 발현 벡터가 본 발명의 세포주에 도입된 경우에 상기 세포주에 존재할 수 있다.
통상의 기술자로부터 이해되는 바와 같이, 내인성 DHODH 유전자는 세포주에 좌우될 것이다. 예를 들어, CHO 세포주에서, 내인성 DHODH 유전자는 차이니즈 햄스터 DHODH 유전자이고; 인간 세포주에서, 내인성 DHODH 유전자는 인간 DHODH 유전자이다.
전형적으로, 야생형 차이니즈 햄스터 DHODH는 서열식별번호: 2를 포함하거나 또는 그로 이루어진 서열, 뿐만 아니라 DHODH 활성을 나타내는 그의 변이체를 지칭한다. 이러한 변이체는, 예를 들어 햄스터 종에서 자연 발생하는 변이체 (예컨대 대립유전자 변이체 또는 스플라이스 변이체)에 상응할 수 있다.
전형적으로, 야생형 인간 DHODH는 서열식별번호: 4를 포함하거나 또는 그로 이루어진 서열, 뿐만 아니라 DHODH 활성을 나타내는 그의 변이체를 지칭한다. 이러한 변이체는, 예를 들어 인간 종에서 자연 발생하는 변이체 (예컨대 대립유전자 변이체 또는 스플라이스 변이체)에 상응할 수 있다.
"내인성 GS 유전자"는 본원에서 특정한 환경 조건 하에 특정한 발생 단계에서 상기 특정한 세포에 정상적으로 존재하는 GS 유전자를 의미한다.
"내인성 GS 유전자"는 하기 정의된 "외인성 GS"와 구별되는데, 상기 외인성 GS는 하기 정의된 발현 벡터에 의해 제공되며, 이는 상기 발현 벡터가 본 발명의 세포주에 도입된 경우에 상기 세포주에 존재할 수 있다.
통상의 기술자로부터 이해되는 바와 같이, 내인성 GS 유전자는 세포주에 좌우될 것이다. 예를 들어, CHO 세포주에서, 내인성 GS 유전자는 차이니즈 햄스터 GS 유전자이고; 인간 세포주에서, 내인성 GS 유전자는 인간 GS 유전자이다.
전형적으로, 야생형 차이니즈 햄스터 GS는 서열식별번호: 9를 포함하거나 또는 그로 이루어진 서열, 뿐만 아니라 GS 활성을 나타내는 그의 변이체를 지칭한다. 이러한 변이체는, 예를 들어 햄스터 종에서 자연 발생하는 변이체 (예컨대 대립유전자 변이체 또는 스플라이스 변이체)에 상응할 수 있다.
전형적으로, 야생형 인간 GS는 서열식별번호: 6을 포함하거나 또는 그로 이루어진 서열, 뿐만 아니라 GS 활성을 나타내는 그의 변이체를 지칭한다. 이러한 변이체는, 예를 들어 인간 종에서 자연 발생하는 변이체 (예컨대 대립유전자 변이체 또는 스플라이스 변이체)에 상응할 수 있다.
본원에 사용된 "유전자"는 유전자 생성물을 코딩하는 DNA 영역, 뿐만 아니라 유전자 생성물의 생산을 조절하는 모든 DNA 영역 (이러한 조절 서열이 코딩 및/또는 전사된 서열에 인접하든 그렇지 않든)을 포함한다. 따라서, 유전자는 프로모터 서열, 종결인자, 번역 조절 서열, 예컨대 리보솜 결합 부위 및 내부 리보솜 진입 부위, 인핸서, 사일런서, 인슐레이터, 경계 요소, 복제 기점, 매트릭스 부착 부위 및 유전자좌 제어 영역을 포함한다.
유전자 "불활성화"는 상응하는 야생형 세포와 비교하여 유전자 발현의 임의의 감소를 지칭한다. 유전자 불활성화는 완전할 수 있거나 (완전 불활성화 또는 녹아웃) 또는 부분적일 수 있다 (예를 들어, 유전자가 정상보다 더 낮은 발현 수준을 나타내는 하이포모르프(hypomorph), 또는 그것이 영향을 미치는 활성의 부분 감소를 나타내는 돌연변이체 유전자의 생성물).
특정한 실시양태에서, 내인성 DHODH 유전자의 1개 이상의 또는 모든 대립유전자는 부분적으로 또는 완전히 불활성화된다.
특정한 실시양태에서, 상기 내인성 DHODH 유전자는 완전히 불활성화된다.
보다 특정한 실시양태에서, 내인성 DHODH 유전자의 1개 이상의 또는 모든 대립유전자는 완전히 불활성화된다.
또 다른 특정한 실시양태에서, 내인성 GS 유전자의 1개 이상의 또는 모든 대립유전자는 부분적으로 또는 완전히 불활성화된다.
특정한 실시양태에서, 상기 내인성 GS 유전자는 완전히 불활성화된다.
보다 특정한 실시양태에서, 내인성 GS 유전자의 1개 이상 또는 모든 대립유전자는 완전히 불활성화된다.
추가의 특정한 실시양태에서, 내인성 DHODH 유전자의 1개 이상의 또는 모든 대립유전자 및 내인성 GS 유전자의 모든 대립유전자는 완전히 불활성화된다.
특정한 실시양태에서, 내인성 DHODH 유전자 및/또는 내인성 GS 유전자는 문헌 [Aga et al. (2015) BMC Proceedings 9(suppl 9):P2]에 기재된 바와 같이 CRISPR-Cas9 방법을 사용하여 불활성화된다.
통상의 기술자에게 널리 공지된 바와 같이, CRISPR-Cas9 시스템은 Cas9 뉴클레아제가 부위-특이적 DNA 절단을 유도하도록 가이드하는 비코딩 RNA를 사용하는 원핵 적응 면역 반응 시스템이다. 이러한 DNA 손상은 비-상동 말단 연결 DNA 복구 경로 (NHEJ) 또는 상동성-지정 복구 (HDR) 경로를 통한 세포 DNA 복구 메카니즘에 의해 복구된다. 유전자 파괴를 생성하기 위해, DNA 표적에 특이적인 crRNA 서열 및 Cas9 단백질과 상호작용하는 tracrRNA 서열로 이루어진 단일 가이드 RNA (gRNA)는 DNA 엔도뉴클레아제 활성을 갖는 Cas9 단백질의 재조합 형태에 결합한다. 생성된 복합체는 표적-특이적 이중-가닥 DNA 절단을 유발할 것이다. 절단 부위는 유전자 기능을 파괴할 수 있는 삽입/결실 (INDEL)을 생성할 수 있는 오류-유발 과정인 비상동 말단 연결 (NHEJ) DNA 복구 경로에 의해 복구될 것이다.
특정한 실시양태에서, DHODH 유전자의 적어도 1개의 엑손이, 특히 유전자 편집 방법, 예컨대 CRISPR-Cas9 방법에 의한 불활성화를 위해 표적화된다. 보다 특정한 실시양태에서, DHODH 단백질의 N-말단 부분을 코딩하는 DHODH 유전자의 부분이, 특히 유전자 편집 방법, 예컨대 CRISPR-Cas9 방법에 의한 불활성화를 위해 표적화된다. 또 다른 실시양태에서, DHODH 유전자의 제2 엑손이, 특히 유전자 편집 방법, 예컨대 CRISPR-Cas9 방법에 의한 불활성화를 위해 표적화된다.
한 실시양태에서, 서열 GGATGCAGCCATCATCCTTG (서열식별번호: 10)의 20개-뉴클레오티드 서열 또는 CHO 생존을 손상시키지 않으면서 DHODH 유전자의 녹아웃과 상용성인 임의의 서열이 DHODH 유전자의 제2 엑손을 표적화하는 gRNA를 생성하기 위한 상응하는 DNA 조각으로서 사용된다. 이러한 gRNA는 전형적으로 서열 GGATGCAGCCATCATCCTTGGTTTT (서열식별번호: 11) 및 CAAGGATGATGGCTGCATCCCGGTG (서열식별번호: 12)의 올리고뉴클레오티드를 사용하여 수득되며, 이들은 전형적으로 플라스미드의 고유한 제한 부위, 예컨대 pCM3561 플라스미드 (인비트로젠에 의해 상품화됨)의 BaeI 부위에서 클로닝되고, 이에 따라 클로닝된 DNA 서열은 U6 프로모터의 제어 하에 있으면서, 상기 플라스미드가 세포 내로 도입되었을 때, tracrRNA에 융합된 crRNA를 함유하는 단일 전사 단위로 전사되며, 여기서 crRNA 부분은 DHODH 유전자의 제2 엑손에 특이적이고 tracrRNA 부분은 Cas9 효소에 의해 인식된다.
또 다른 특정한 실시양태에서, GS 유전자의 적어도 1개의 엑손이, 특히 유전자 편집 방법, 예컨대 CRISPR-Cas9 방법에 의한 불활성화를 위해 표적화된다. 보다 특정한 실시양태에서, GS 유전자의 엑손 6이, 특히 유전자 편집 방법, 예컨대 CRISPR-Cas9 방법에 의한 불활성화를 위해 표적화된다. 또 다른 실시양태에서, GS 유전자의 엑손 6의 부근이, 특히 유전자 편집 방법, 예컨대 CRISPR-Cas9 방법에 의한 불활성화를 위해 표적화된다.
한 실시양태에서, 서열 GAGTATGTGAAGACTTTG (서열식별번호: 29)의 18개-뉴클레오티드 서열 또는 CHO 생존을 손상시키지 않으면서 GS 유전자의 녹아웃과 상용성인 임의의 서열이 GS 유전자의 엑손 6을 표적화하는 gRNA를 생성하기 위한 상응하는 DNA 조각으로서 사용된다. 또 다른 실시양태에서, 서열 CCATCTTTATTCTCATGGGG (서열식별번호: 30)의 뉴클레오티드 서열 또는 CHO 생존을 손상시키지 않으면서 GS 유전자의 녹아웃과 상용성인 임의의 서열이 GS 유전자의 엑손 6의 부근을 표적화하는 gRNA를 생성하기 위한 상응하는 DNA 조각으로서 사용된다.
DHODH 유전자 및 GS 유전자에 대해 불활성화된 세포주를 확인하기 위해, 단일 세포는 전형적으로 웰 플레이트에서 한계 희석에 의해 단리되고, 적절한 전면생장률, 예를 들어 90% 전면생장률에 도달한 후, 세포는 적어도 2가지 조건, 예컨대 하나의 조건인 우리딘 및 글루타민이 보충된 배양 배지로 및 또 다른 조건인 우리딘 및 우리딘이 결여된 배양 배지로 분할된다. 관심 클론은 전형적으로 우리딘 및 글루타민의 결여에 감수성인 클론이다.
일단 단리되면, 이들 관심 세포는 피리미딘 염기를 포함하는 배양 배지, 특히 우리딘을 포함하고 글루타민을 추가로 포함하는 배양 배지에서 배양될 수 있다.
"피리미딘 염기"는 본원에서 피리미딘 그 자체 및 골격으로서 피리미딘 핵을 갖는 다양한 피리미딘 유도체를 의미한다. 이러한 피리미딘 염기의 예는 우라실 핵산-관련 물질, 예컨대 우라실, 우리딘, 우리딘 포스페이트, 특히 우리딘 모노포스페이트 (UMP), 우리딘 디포스페이트 (UDP) 및 우리딘 트리포스페이트 (UTP), 데옥시우리딘, 데옥시우리딘 포스페이트, 특히 데옥시우리딘 모노포스페이트 (dUMP), 데옥시우리딘 디포스페이트 (dUDP) 및 데옥시우리딘 트리포스페이트 (dUTP); 시토신 핵산-관련 물질, 예컨대 시토신, 시티딘, 시티딘 포스페이트, 특히 시티딘 모노포스페이트 (CMP), 시티딘 디포스페이트 (CDP), 시티딘 트리포스페이트 (CTP), 데옥시시티딘, 2'-데옥시시티딘, 데옥시시티딘 포스페이트, 특히 데옥시시티딘 모노포스페이트 (dCMP), 데옥시시티딘 디포스페이트 (dCDP) 및 데옥시시티딘 트리포스페이트 (dCTP); 티민, 티미딘, 티미딘 포스페이트, 특히 티미딘 모노포스페이트 (TMP), 티미딘 디포스페이트 (TDP) 및 티미딘 트리포스페이트 (TTP), 데옥시티미딘, 데옥시티미딘 포스페이트, 특히 데옥시티미딘 모노포스페이트 (dTMP), 데옥시티미딘 디포스페이트 (dTDP) 및 데옥시티미딘 트리포스페이트 (dTTP) 및 오로테이트를 포함한다.
특정한 실시양태에서, 상기 피리미딘 염기는 우리딘이다.
"우리딘"은 본원에서 하기 화학식의 뉴클레오시드를 의미한다.
"글루타민"은 본원에서 하기 화학식의 아미노산을 의미한다.
"우리딘이 결여된 배양 배지"는 특정한 세포주의 성장에 적합한 임의의 기초 배양 배지로서, 여기서 상기 배지는 1 mM 미만의 우리딘을 포함하고, 특히 상기 배지는 어떠한 우리딘도 포함하지 않는 것을 의미한다.
"글루타민이 결여된 배양 배지"는 특정한 세포주의 성장에 적합한 임의의 기초 배양 배지로서, 여기서 상기 배지는 1 mM 미만의 글루타민을 포함하고, 특히 상기 배지는 어떠한 글루타민도 포함하지 않는 것을 의미한다.
"우리딘 및 글루타민이 결여된 배양 배지"는 본원에서 특정한 세포주의 성장에 적합한 임의의 기초 배양 배지로서, 여기서 상기 배지는 1 mM 미만의 우리딘 및 1 mM 미만의 글루타민을 포함하고, 특히 상기 배지는 어떠한 우리딘 및 어떠한 글루타민도 포함하지 않는 것을 의미한다.
"우리딘을 포함하는 배양 배지"는 특정한 세포주의 성장에 적합한 임의의 기초 배양 배지로서, 여기서 상기 배지는 1 mM 내지 25 mM의 우리딘, 특히 5 mM 내지 10 mM의 우리딘을 추가로 포함하는 것을 의미한다.
"글루타민을 포함하는 배양 배지"는 특정한 세포주의 성장에 적합한 임의의 기초 배양 배지로서, 여기서 상기 배지는 1 mM 내지 25 mM의 글루타민, 특히 4 mM 내지 6 mM의 글루타민을 추가로 포함하는 것을 의미한다.
"우리딘 및 글루타민을 포함하는 배양 배지"는 특정한 세포주의 성장에 적합한 임의의 기초 배양 배지로서, 여기서 상기 배지는 1 mM 내지 25 mM의 우리딘, 특히 5 mM 내지 10 mM의 우리딘 및 1 mM 내지 25 mM의 글루타민, 특히 4 mM 내지 6 mM의 글루타민을 추가로 포함하는 것을 의미한다.
"기초 배양 배지"는 본원에서 세포, 예를 들어 CHO 세포에 대한 노출에 적합한 비보충 배지를 의미한다. 통상의 기술자에 의해 이해될 바와 같이, 사용되는 기초 배양 배지는 사용되는 세포의 유형에 좌우될 것이다. 기초 배양 배지의 예는 CDCHO 배지, 옵티CHO(OPTiCHO)™ 배지, 펙토 CHO(Fecto CHO)™ 배지, 포르티CHO(FortiCHO)™ 배지, 엑스피CHO(ExpiCHO)™ 배지, 엑스-셀(Ex-Cell)™ 배지, 악티프로(ActiPRO)™ 배지, MAM PF77™ 배지 및 파워CHO(PowerCHO)™ 배지를 포함한다.
따라서, 특정한 실시양태에서, 본 발명의 세포주는 하기 단계에 의해 생산된다:
(a1) 내인성 DHODH 유전자 및 내인성 GS 유전자를 포함하는 세포 내의 내인성 DHODH 유전자를 불활성화시키는 단계,
(b1) 세포를 우리딘을 포함하는 배양 배지에서 내인성 DHODH 유전자가 부분적으로 또는 완전히 불활성화된 세포주를 생성하는 데 적합한 조건 하에 배양하는 단계,
(c1) 내인성 DHODH 유전자가 부분적으로 또는 완전히 불활성화된 상기 세포를 회수하는 단계,
(d1) 상기 세포 내의 내인성 GS 유전자를 불활성화시키는 단계, 및
(e1) 상기 세포를 글루타민을 포함하는 배양 배지에서 내인성 GS 유전자가 부분적으로 또는 완전히 불활성화된 세포주를 생성하는 데 적합한 조건 하에 배양하는 단계.
대안적 실시양태에서, 본 발명의 세포주는 하기 단계에 의해 생산된다:
(a2) 내인성 GS 유전자 및 부분적으로 또는 완전히 불활성화된 내인성 DHODH 유전자를 포함하는 세포를 제공하는 단계,
(b2) 상기 세포 내의 내인성 GS 유전자를 불활성화시키는 단계, 및
(c2) 세포를 글루타민을 포함하는 배양 배지에서 내인성 GS 유전자가 부분적으로 또는 완전히 불활성화된 세포주를 생성하는 데 적합한 조건 하에 배양하는 단계.
또 다른 실시양태에서, 본 발명의 세포주는 하기 단계에 의해 생산된다:
(a3) 내인성 DHODH 유전자 및 부분적으로 또는 완전히 불활성화된 내인성 GS 유전자를 포함하는 세포를 제공하는 단계,
(b3) 상기 세포 내의 내인성 DHODH 유전자를 불활성화시키는 단계, 및
(c3) 세포를 우리딘을 포함하는 배양 배지에서 내인성 DHODH 유전자가 부분적으로 또는 완전히 불활성화된 세포주를 생성하는 데 적합한 조건 하에 배양하는 단계.
CRISPR-Cas9 접근법에 의해 완전히 또는 부분적으로 불활성화된 내인성 DHODH 유전자를 포함하는 CHO 세포주의 생산은 실시예 2에 보다 심도있게 예시된다.
CRISPR-Cas9 접근법에 의해 완전히 또는 부분적으로 불활성화된 내인성 DHODH 유전자를 포함하고 완전히 또는 부분적으로 불활성화된 내인성 GS 유전자를 추가로 포함하는 CHO 세포주의 생산은 실시예 3에 예시된다.
완전히 또는 부분적으로 불활성화된 내인성 DHODH 유전자 및 완전히 또는 부분적으로 불활성화된 내인성 GS 유전자를 포함하는 세포주, 예컨대 CHO 세포주의 생산은 관련 기술분야에 공지된 다양한 다른 분자 생물학 기술에 의해 생성될 수 있다. 예를 들어, 완전히 또는 부분적으로 불활성화된 내인성 DHODH 유전자 및 완전히 또는 부분적으로 불활성화된 내인성 GS 유전자를 갖는 세포주를 생성하는 데 유용한 다른 유전자 편집 기술은 아연 핑거 뉴클레아제 (ZFN) 또는 전사 인자-유사 이펙터 뉴클레아제 (TALEN)의 사용을 포함한다. Cre/Lox 방법이 또한 DHODH 유전자 및 GS 유전자의 1개 이상의 또는 모든 대립유전자를 녹아웃시키는 데 사용될 수 있다.
특정한 실시양태에서, 본 발명의 세포주는 하기 섹션 "발현 벡터"에 정의된 바와 같은 발현 벡터를 추가로 포함한다.
상기 발현 벡터는 통상의 기술자에게 널리 공지된 임의의 적합한 기술, 예컨대 형질감염, 특히 전기천공 또는 화학적 형질감염 또는 형질도입에 의해 세포주 내로 도입될 수 있다.
외인성 DHODH 및 외인성 GS
본 발명에 사용된 발현 벡터 중 하나에 의해 코딩되는 DHODH (추가로 "외인성 DHODH"로 지칭됨)는 서열식별번호: 2 또는 서열식별번호: 4에 대해 적어도 60%, 62%, 65%, 70%, 75%, 80%, 85%, 90%, 91%; 92%; 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.5% 또는 100% 동일한 서열을 포함하거나 또는 그로 이루어질 수 있다. 이는 또한 단백질이 DHODH 활성을 보유하는 한, 서열식별번호: 2 또는 서열식별번호: 4의 적어도 100, 150, 200, 250, 300 또는 350개의 연속 아미노산의 단편을 포함하거나 또는 그로 이루어질 수 있다.
일부 실시양태에서, 본 발명에 따른 외인성 DHODH는 서열식별번호: 2의 서열 및 서열식별번호: 4의 서열 둘 다에 대해 적어도 60%, 62%, 65%, 70%, 75%, 80%, 85%, 90%, 91%; 92%; 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.5% 또는 100% 동일한 서열을 포함하거나 또는 그로 이루어진다.
일부 실시양태에서, 본 발명에 따른 외인성 DHODH는 인간 DHODH, 즉 인간 기원의 DHODH이다.
본원에 사용된 용어 "인간 DHODH"는 서열식별번호: 4를 포함하거나 또는 그로 이루어진 서열의 단백질, 뿐만 아니라 DHODH 활성을 나타내는 그의 변이체를 지칭한다. 이러한 변이체는, 예를 들어 인간 종에서 자연 발생하는 변이체 (예컨대 대립유전자 변이체 또는 스플라이스 변이체)에 상응할 수 있다. 대안적으로, 이러한 변이체는 유전자 조작에 의해 수득된 변이체에 상응할 수 있다. 한 실시양태에서, 이러한 변이체는 단지 서열식별번호: 4와 비교하여 최대 150, 140, 130, 120, 110, 100, 90, 80, 70, 60, 50, 40, 30, 25, 24, 23, 22, 21, 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1개의 아미노산 변이 (상기 변이는 치환, 삽입 및 결실을 포함함)의 존재만이 서열식별번호: 4의 서열과 상이하다.
특정한 실시양태에서, 상기 인간 DHODH는 야생형 서열과 비교하여 G202A 돌연변이를 포함하는 변이체, 전형적으로 아미노산 서열 서열식별번호: 28을 포함하거나 또는 그로 이루어진 단백질이다.
일부 실시양태에서, 외인성 DHODH는 햄스터 DHODH, 즉 햄스터 기원의 DHODH이다. 햄스터 DHODH는, 예를 들어 차이니즈 햄스터 (세툴루스 그리세우스(Cetulus griseus)) DHODH일 수 있다.
본원에 사용된 용어 "차이니즈 햄스터 DHODH"는 서열식별번호: 2를 포함하거나 또는 그로 이루어진 서열, 뿐만 아니라 DHODH 활성을 나타내는 그의 변이체를 지칭한다. 이러한 변이체는, 예를 들어 햄스터 종에서 자연 발생하는 변이체 (예컨대 대립유전자 변이체 또는 스플라이스 변이체)에 상응할 수 있다. 대안적으로, 이러한 변이체는 유전자 조작에 의해 수득된 변이체에 상응할 수 있다. 한 실시양태에서, 이러한 변이체는 단지 서열식별번호: 2와 비교하여 최대 150, 140, 130, 120, 110, 100, 90, 80, 70, 60, 50, 40, 30, 25, 24, 23, 22, 21, 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1개의 아미노산 변이 (상기 변이는 치환, 삽입 및 결실을 포함함)의 존재만이 서열식별번호: 2의 서열과 상이하다.
또 다른 실시양태에서, 변이체 DHODH는 DHODH 활성, 임의로 야생형 단백질과 동일한 수준의 활성, 또는 야생형 단백질의 50%, 60%, 70%, 80%, 90%, 100%, 110%, 120%, 130%, 140% 또는 그 초과의 수준의 활성을 가질 것이다.
본 발명에 사용된 다른 발현 벡터에 의해 코딩되는 GS (추가로 "외인성 GS"로 지칭됨)는 서열식별번호: 6 또는 서열식별번호: 8 중 적어도 하나에 대해 적어도 94.5%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.5% 또는 100% 동일한 서열을 포함하거나 또는 그로 이루어질 수 있다. 이는 또한 단백질이 그의 GS 활성을 보유하는 한, 서열식별번호: 6 또는 서열식별번호: 8의 적어도 100, 150, 200, 250, 300 또는 350개의 연속 아미노산의 단편을 포함하거나 또는 그로 이루어질 수 있다.
구체적 실시양태에서, 본 발명에 따른 외인성 GS는 서열식별번호: 6의 서열 및 서열식별번호: 8의 서열 둘 다에 대해 적어도 94.5%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.5% 또는 100% 동일한 서열을 포함하거나 또는 그로 이루어진다.
구체적 실시양태에서, 본 발명에 따른 외인성 GS는 서열식별번호: 6의 서열에 대해 적어도 97.5%, 98%, 98.5%, 99%, 99.5% 또는 100% 동일한 서열을 포함하거나 또는 그로 이루어진다. 국제 출원 WO2013/186371에 제시된 바와 같이, 이러한 GS는 CHO 세포, 특히 E94 CHO 세포주에서 선택 마커로서 사용하기에 특히 유리하다.
구체적 실시양태에서, 본 발명에 따른 외인성 GS는 인간 GS, 즉 인간 기원의 GS이다. 본원에 사용된 용어 "인간 GS"는 서열식별번호: 6을 포함하거나 또는 그로 이루어진 서열, 뿐만 아니라 GS 활성을 나타내는 그의 변이체를 지칭한다. 이러한 변이체는, 예를 들어 인간 종에서 자연 발생하는 변이체 (예컨대 대립유전자 변이체 또는 스플라이스 변이체)에 상응할 수 있다. 대안적으로, 이러한 변이체는 유전자 조작에 의해 수득된 변이체에 상응할 수 있다. 가장 바람직하게는, 이러한 변이체는 단지 서열식별번호: 6과 비교하여 최대 22, 20, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1개의 아미노산 변이 (상기 변이는 치환, 삽입 및 결실을 포함함)의 존재만이 서열식별번호: 6의 서열과 상이하다.
또 다른 구체적 실시양태에서, 본 발명에 따른 외인성 GS는 개 GS, 즉 개 기원의 GS이다. 본원에 사용된 용어 "개 GS"는 서열식별번호: 8을 포함하거나 또는 그로 이루어진 서열, 뿐만 아니라 GS 활성을 나타내는 그의 변이체를 지칭한다. 이러한 변이체는, 예를 들어 개 종에서 자연 발생하는 변이체 (예컨대 대립유전자 변이체 또는 스플라이스 변이체)에 상응할 수 있다. 대안적으로, 이러한 변이체는 유전자 조작에 의해 수득된 변이체에 상응할 수 있다. 가장 바람직하게는, 이러한 변이체는 단지 서열식별번호: 8과 비교하여 최대 22, 20, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1개의 아미노산 변이 (상기 변이는 치환, 삽입 및 결실을 포함함)의 존재만이 서열식별번호: 8의 서열과 상이하다.
구체적 실시양태에서, 본 발명에 따른 외인성 GS는 하기 아미노산: 12G, 16V, 18M, 19S, 33l, 49S, 80V, 82A, 91K, 116T, 191A, 269Y, 282Q, 35OS, 355L, 356l, 2T, 68L, 98L, 107R, 169R 및 2138 중 적어도 1, 2, 3, 4, 5, 6, 10, 15, 16, 20 또는 22개를 포함하며, 여기서 숫자는 서열식별번호: 6 및 서열식별번호: 8 상의 위치를 나타내고, 문자는 아미노산의 성질을 나타낸다 (1-문자 유전자 코드를 사용함). 보다 구체적인 실시양태에서, 본 발명에 따른 외인성 GS는 하기 아미노산: 2T, 68L, 98L, 107R, 169R 및 2138 중 적어도 1, 2, 3, 4, 5 또는 6개를 포함한다. 또 다른 보다 구체적인 실시양태에서, 본 발명에 따른 외인성 GS는 하기 아미노산: 12G, 16V, 18M, 19S, 33l, 49S, 80V, 82A, 91K, 116T, 191A, 269Y, 282Q, 35OS, 355L 및 356I 중 적어도 1, 2, 3, 4, 5, 6, 10, 15 또는 16개를 포함한다. 상기 아미노산은 CHO GS와 비교하여 인간 및/또는 개 GS에 특이적인 것으로 보인다.
본 발명의 질의 아미노산 서열에 대해 적어도, 예를 들어 95% "동일한" 아미노산 서열을 갖는 폴리펩티드에 의해, 대상 폴리펩티드 서열이 질의 아미노산 서열의 각각의 100개의 아미노산당 5개 이하의 아미노산 변경을 포함할 수 있다는 것을 제외하고는, 대상 폴리펩티드의 아미노산 서열이 질의 서열과 동일한 것으로 의도된다. 다시 말해서, 질의 아미노산 서열에 대해 적어도 95% 동일한 아미노산 서열을 갖는 폴리펩티드를 수득하기 위해, 대상 서열 내 아미노산 잔기의 5% (100개 중 5개) 이하가 삽입되거나, 결실되거나 또는 또 다른 아미노산으로 치환될 수 있다.
서열 동일성은 변이체 서열의 전장, 참조 서열의 전장 또는 둘 다에 걸쳐 결정될 수 있다. 예를 들어, 동일성의 백분율은 전반적 정렬을 사용하여 계산될 수 있다 (즉, 2개의 서열이 그의 전체 길이에 걸쳐 비교됨). 2개 이상의 서열의 동일성 및 상동성을 비교하는 방법은 관련 기술분야에 널리 공지되어 있다. 니들만-분쉬(Needleman-Wunsch)의 전반적 정렬 알고리즘 (Needleman and Wunsch (1970) J. Mol. Biol. 48:443-453)을 사용하여 2개 서열의 최적 정렬 (갭 포함)을 그의 전체 길이를 고려하면서 찾아내는 "니들" 프로그램이, 예를 들어 전반적 정렬을 수행하는 경우에 사용될 수 있다. 이러한 니들 프로그램은, 예를 들어 ebi.ac.uk 월드 와이드 웹 사이트에서 이용가능하다. 본 발명에 따른 동일성의 백분율은 바람직하게는 10.0인 "갭 개방(Gap Open)" 파라미터, 0.5인 "갭 연장(Gap Extend)" 파라미터, 블로섬(Blosum)62 매트릭스에 의한 EMBOSS::니들 (전반적) 프로그램을 사용하여 계산된다.
참조 서열의 변이체는 참조 서열과 비교하여 돌연변이, 예컨대 결실, 삽입 및/또는 치환을 포함할 수 있다. 치환의 경우에, 치환은 바람직하게는 하기 표에 나타낸 바와 같은 보존적 치환에 상응한다.
발현 벡터
본 발명의 문맥에 사용된 발현 벡터는 재조합 단백질의 생산에 적합하고, 디히드로오로테이트 데히드로게나제 (DHODH)를 코딩하는 서열 또는 글루타민 신테타제 (GS)를 코딩하는 서열을 포함한다.
발현 벡터는 바람직하게는 DNA 벡터이다.
본 발명의 문맥에 사용된 발현 벡터 중 하나는 상기 섹션 "외인성 DHODH 및 외인성 GS"에 정의된 바와 같은 외인성 DHODH를 코딩하는 서열 (i)을 포함한다.
구체적 실시양태에서, 발현 벡터가 도입될 세포주는 CHO 세포주이고, 외인성 DHODH는 이종 기원의 것이다 (즉, 외인성 DHODH는 햄스터 DHODH가 아님).
이러한 외인성 DHODH를 코딩하는 서열은 자연 발생 뉴클레오티드 서열일 수 있다. 대안적으로, 이러한 DHODH를 코딩하는 서열의 삼중 코돈은 CHO 세포에서의 발현을 위해 편향될 수 있다. 최적 발현을 수득하기 위해 서열을 편향시키기 위한 소프트웨어 및 알고리즘은 관련 기술분야에 공지되어 있고, 예를 들어 문헌 [Raab et al. (2010) Syst Synth Biol. 4:215-225]에 기재된 알고리즘을 포함한다. 이러한 알고리즘은 발현을 위한 최상의 이용가능한 코돈을 제공할 뿐만 아니라, GC 함량 및 비-목적 DNA 모티프의 부재를 고려한다.
예를 들어, 외인성 DHODH를 코딩하는 서열은 서열식별번호: 3의 서열 (즉, CHO 세포에서의 최적 발현을 위해 설계된 서열식별번호: 4의 인간 DHODH를 코딩하는 서열) 및/또는 서열식별번호: 1의 서열 (즉, CHO 세포에서의 최적 발현을 위해 설계된 서열식별번호: 2의 햄스터 DHODH를 코딩하는 서열)에 대해 적어도 60%, 62%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 서열을 포함하거나 또는 그로 이루어질 수 있다.
한 실시양태에서, 외인성 DHODH를 코딩하는 서열은 서열식별번호: 1 또는 서열식별번호: 3의 서열을 포함하거나 또는 그로 이루어진다.
본 발명의 문맥에 사용된 다른 발현 벡터는 상기 섹션 "외인성 DHODH 및 외인성 GS"에 정의된 바와 같은 외인성 GS를 코딩하는 서열 (ii)를 포함한다.
구체적 실시양태에서, 발현 벡터가 도입될 세포주는 CHO 세포주이고, 외인성 GS는 이종 기원의 것이다 (즉, 외인성 GS는 햄스터 GS가 아님).
이러한 외인성 GS를 코딩하는 서열은 자연 발생 뉴클레오티드 서열일 수 있다. 대안적으로, 이러한 GS를 코딩하는 서열의 삼중 코돈은 CHO 세포에서의 발현을 위해 편향될 수 있다. 최적 발현을 수득하기 위해 서열을 편향시키기 위한 소프트웨어 및 알고리즘은 관련 기술분야에 공지되어 있고, 예를 들어 문헌 [Raab et al. (2010) Syst Synth Biol. 4:215-225]에 기재된 알고리즘을 포함한다. 이러한 알고리즘은 발현을 위한 최상의 이용가능한 코돈을 제공할 뿐만 아니라, GC 함량 및 비-목적 DNA 모티프의 부재를 고려한다.
예를 들어, 외인성 GS를 코딩하는 서열은 서열식별번호: 5의 서열 (즉, CHO 세포에서의 최적 발현을 위해 설계된 서열식별번호: 6의 인간 GS를 코딩하는 서열) 및/또는 서열식별번호: 7의 서열 (즉, CHO 세포에서의 최적 발현을 위해 설계된 서열식별번호: 8의 개 GS를 코딩하는 서열)에 대해 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열을 포함하거나 또는 그로 이루어질 수 있다.
한 실시양태에서, GS를 코딩하는 서열은 서열식별번호: 5 또는 서열식별번호: 7의 서열을 포함하거나 또는 그로 이루어진다.
본 발명의 문맥에 사용되는 발현 벡터에서, 상기 정의된 외인성 DHODH를 코딩하는 서열 및/또는 상기 정의된 외인성 GS를 코딩하는 서열은 관련 기술분야의 통상의 기술자에게 공지된 임의의 프로모터의 제어 하에 놓일 수 있다.
예를 들어, 상기 정의된 외인성 DHODH를 코딩하는 서열 및/또는 상기 정의된 외인성 GS를 코딩하는 서열은, 예를 들어 DHODH 및 GS의 각각의 발현을 구동하는 데 적합한 프로모터, 예를 들어 원숭이 공포형성 바이러스 40 (SV40) 프로모터 (예를 들어 SV40의 후기 또는 초기 프로모터), CMV 프로모터, 신장 인자 1 프로모터, GAPDH 프로모터, RPL37 프로모터, 액틴 프로모터의 제어 하에 놓일 수 있다. 초기 SV40 프로모터는, 예를 들어 문헌 [Benoist and Chambon (1981) Nature 290:304-310 및 Moreau et al. (1981) Nucleic Acids Res. 9:6047-6068]에 기재되어 있다. 특히, 상기 SV40 프로모터는 전장 프로모터이다. 상기 SV40 프로모터는 또한 72bp 반복부를 함유하는 복제 기점을 가질 수 있다.
일부 실시양태에서, 상기 SV40 프로모터는 위치 128 내지 270이 제거된 SV40 프로모터가 아니며, 즉 상기 SV40 프로모터는 KIST 생물공학 연구소 유전자 은행(Gene Bank, Institute of Bioengineering, KIST)에 1997년 12월 17일에 기탁 번호: KCTC 8860 P 하에 기탁된 이. 콜라이(E. coli) 형질전환체를 형질전환시키는, 한국 특허 번호 10-0267720에 기재된 SV40 프로모터가 아니다.
다른 실시양태에서, 상기 정의된 외인성 DHODH를 코딩하는 서열 및/또는 상기 정의된 외인성 GS를 코딩하는 서열은 SV40 프로모터의 제어 하에 놓이지 않는다.
재조합 단백질의 생산에 적합한 발현 벡터는 관련 기술분야의 통상의 기술자에게 공지되어 있다. 이러한 벡터는 전형적으로 생산이 요망되는 재조합 단백질의 클로닝 및 발현을 가능하게 하는 적어도 1개의 발현 카세트 및 복제 기점을 포함하는 발현 벡터에 상응한다. 발현 카세트는 전형적으로 5' 비번역 영역 (프로모터 및 임의로 인핸서 서열을 포함하거나 또는 그로 이루어짐), 재조합 단백질을 코딩하는 서열의 클로닝을 가능하게 하는 1개 이상의 제한 부위, 3' 비번역 영역 (예를 들어 폴리A 신호) 및 임의로 1개 이상의 인트론을 포함한다. 프로모터 서열은 관련 기술분야에 널리 공지된 임의의 강한 프로모터, 예컨대, 예를 들어 인간 CMV 프로모터에 상응할 수 있다. 임의로, 본 발명의 문맥에 사용된 발현 벡터는 원핵 복제 기점 (예를 들어, 원핵 레플리콘, 예컨대 이. 콜라이 내의 ColE1) 및 적어도 원핵생물-선택적 마커 유전자 (원핵 선택 마커로도 또한 공지됨)를 포함하여, 벡터가 원핵 세포에서 복제되도록 한다. 벡터를 복제하는 세포는 또한 원핵생물-선택적 마커 유전자를 발현하고, 따라서 확인 및 선택될 수 있다. 원핵생물-선택적 마커 유전자는 관련 기술분야의 통상의 기술자에게 널리 공지되어 있다. 원핵생물-선택적 마커 유전자의 예는, 예를 들어 항생제 내성을 부여하는 단백질을 코딩하는 핵산 서열 (예를 들어 암피실린, 클로람페니콜, 블라스티시딘 또는 카나마이신에 대한 내성을 부여하는 단백질을 코딩하는 서열)이다.
본 발명의 발현 벡터에 의해 발현될 수 있는 재조합 단백질 (I) 및 (II)는 관련 기술분야의 통상의 기술자에게 관심있는 임의의 단백질에 상응할 수 있다.
본원에 사용된 용어 "단백질"은 펩티드 (즉, 50개 미만의 아미노산의 아미노산 쇄), 폴리펩티드 (즉, 적어도 50개의 아미노산의 아미노산 쇄), 단량체 단백질 (즉, 1개의 아미노산 쇄로 이루어진 단백질) 및 다량체 단백질 (즉, 2개 이상의 아미노산 쇄로 이루어진 단백질, 예컨대, 예를 들어 모노클로날 항체)을 포괄하는 것으로 의도된다.
본 발명의 문맥에 사용된 발현 벡터는 전형적으로 단백질을 구성하는 상이한 아미노산 쇄의 수와 동일한 수의 발현 카세트 (예를 들어, 단량체 단백질 또는 동종이량체 단백질의 경우에 1개의 발현 카세트, 이종이량체 단백질 또는 모노클로날 항체의 경우에 2개 등)를 포함한다.
대안적으로, 본 발명의 문맥에 사용된 발현 벡터는 이종이량체 단백질 또는 모노클로날 항체의 생산이 요망되는 경우에도 단지 1개의 발현 카세트만을 포함할 수 있다. 이러한 경우에, 단백질의 다른 아미노산 쇄(들)를 코딩하는 서열(들)은 본 발명의 다른 발현 벡터 상에 존재한다.
특정한 실시양태에서, 재조합 단백질 (I) 및 (II)는 모노클로날 항체의 별개의 아암이다.
따라서, 일부 실시양태에서, 본 발명의 문맥에 사용된 발현 벡터 중 하나는 하기를 포함한다:
- 초기 SV40 프로모터의 제어 하에 놓인, 상기 정의된 바와 같은 외인성 DHODH를 코딩하는 서열;
- 항체의 제1 아암의 경쇄를 코딩하는 서열이 CMV 프로모터의 제어 하에 놓인 제1 발현 카세트;
- 항체의 상기 제1 아암의 중쇄를 코딩하는 서열이 CMV 프로모터의 제어 하에 놓인 제2 발현 카세트;
- 원핵 복제 기점; 및
- 원핵 세포에서 사용하기 위한 선택 마커, 즉 그의 천연 프로모터의 제어 하에 놓인, 암피실린에 대한 내성을 부여하는 단백질을 코딩하는 서열.
이러한 실시양태에서, 본 발명의 문맥에 사용된 다른 발현 벡터는 하기를 포함한다:
- 초기 SV40 프로모터의 제어 하에 놓인, 상기 정의된 바와 같은 외인성 GS를 코딩하는 서열;
- 항체의 제2 아암의 경쇄를 코딩하는 서열이 CMV 프로모터의 제어 하에 놓인 제1 발현 카세트;
- 항체의 상기 제2 아암의 중쇄를 코딩하는 서열이 CMV 프로모터의 제어 하에 놓인 제2 발현 카세트;
- 원핵 복제 기점; 및
- 원핵 세포에서 사용하기 위한 선택 마커, 즉 그의 천연 프로모터의 제어 하에 놓인, 암피실린에 대한 내성을 부여하는 단백질을 코딩하는 서열.
본 명세서 전반에 걸쳐, 용어 "재조합 단백질"은 생산이 요망되는 임의의 재조합 단백질을 지칭한다. 이는, 예를 들어 치료 및/또는 예방 단백질, 즉 의약 (백신 포함)으로서 사용하기 위한 것으로 의도된 단백질에 상응할 수 있다. 구체적 실시양태에서, 생산이 요망되는 재조합 단백질은 DHODH도 아니고 GS도 아니다. 또 다른 구체적 실시양태에서, 생산이 요망되는 재조합 단백질은 항체, 예를 들어 모노클로날 항체이다. 또 다른 구체적 실시양태에서, 생산이 요망되는 재조합 단백질은 항원 단백질이다.
용어 "항체"는 본원에서 가장 넓은 의미로 사용되고, 구체적으로 임의의 이소형, 예컨대 IgG, IgM, IgA, IgD 및 IgE의 모노클로날 항체 (전장 모노클로날 항체 포함), 폴리클로날 항체, 다중특이적 항체 (이중특이적 및 삼중특이적 항체 포함), 항체 단편 (예컨대, 예를 들어 Fv, scFv, ds, Fab, Fab' 또는 F(ab')2 단편), 단일 도메인 항체 및 그의 단편, 및 항체 단편을 포함하는 융합 단백질을 포괄한다. 특이적 항원과 반응성인 항체는 재조합 방법, 예컨대 파지 또는 유사한 벡터 내의 재조합 항체의 라이브러리의 선택에 의해, 또는 항원 또는 항원-코딩 핵산으로 동물을 면역화시킴으로써 생성될 수 있다.
본원에 사용된 "모노클로날 항체"는 실질적으로 동종인 항체 집단으로부터 수득된 항체이며, 즉 이러한 집단을 형성하는 항체는 미량으로 존재할 수 있는 가능한 자연 발생 돌연변이를 제외하고는 본질적으로 동일하다. 이들 항체는 단일 에피토프 (또는 다중특이적 모노클로날 항체의 경우에 단일 에피토프 군)에 대해 지시되고, 따라서 고도로 특이적이다.
전형적 모노클로날 항체는 디술피드 결합에 의해 연결된 2개의 동일한 중쇄 및 2개의 동일한 경쇄로 구성된다. 각각의 중쇄 및 경쇄는 불변 영역 및 가변 영역을 함유한다. 각각의 가변 영역은 "상보성-결정 영역" ("CDR") 또는 "초가변 영역"으로 불리는 3개의 절편을 함유하며, 이는 주로 항원의 에피토프에 결합하는 것을 담당한다. 이들은 통상적으로 N-말단으로부터 순차적으로 넘버링하여 CDR1, CDR2 및 CDR3으로 지칭된다 (문헌 [Kabat et al., Sequences of Proteins of Immunological Interest, 5th edition, National Institute of Health, Bethesda, MD, 1991] 참조). 가변 영역의 보다 고도로 보존된 부분은 "프레임워크 영역"으로 불린다.
모노클로날 항체는, 예를 들어 뮤린 항체, 키메라 항체, 인간화 항체 또는 완전 인간 항체일 수 있다.
모노클로날 항체는 이중특이적 또는 삼중특이적 항체일 수 있다.
생산이 요망되는 재조합 단백질이 모노클로날 항체인 경우에, 본 발명에 따른 발현 벡터는 항체 경쇄의 클로닝에 적합한 제1 발현 카세트 및 항체 중쇄의 클로닝에 적합한 제2 발현 카세트를 포함할 수 있다.
구체적 실시양태에서, 상기 제1 및 제2 발현 카세트는 각각 시토메갈로바이러스 (CMV) 프로모터, 예를 들어 인간 또는 뮤린 CMV로부터의 CMV 프로모터를 포함한다. 보다 구체적으로, 상기 제1 및 제2 발현 카세트는 하기를 포함한다:
- CMV 극초기 인핸서 프로모터 (예를 들어, 문헌 [Teschendorf et al. (2002) Anticancer Res. 22:3325-3330]에 기재된 서열을 갖는 것); 또는
- 마우스 CMV로부터의 IE2 프로모터/인핸서 영역 (예를 들어, 문헌 [Chatellard et al. (2007) Biotechnol Bioeng. 96:106-117]에 기재된 서열을 갖는 것); 또는
- hCMV-MIE 조절 요소 (예를 들어, WO 89/01036에 기재된 서열을 갖는 것).
용어 "항원 단백질"은 본원에서 가장 넓은 의미로 사용되고, 단독으로 또는 아주반트와 조합하여 면역 반응을 생성할 수 있는 임의의 단백질을 포괄한다. 이는 예방 백신에서 또는 치료 백신에서 사용하기 위한 것으로 의도될 수 있다. 구체적 실시양태에서, 항원 단백질은 백신 단백질, 즉 예방 백신에 사용하기 위한 것으로 의도된 단백질이다.
발현 벡터는 관심 재조합 단백질을 코딩하는 적어도 1개의 서열 (예를 들어, 단량체 단백질을 코딩하는 1개의 서열, 항체 쇄를 코딩하는 1개의 서열, 또는 각각 항체 경쇄 및 항체 중쇄를 코딩하는 2개의 서열)을 포함할 수 있거나, 또는 비어있을 수 있다 (즉, 관심 재조합 단백질을 코딩하는 이러한 서열이 결여됨).
발현 시스템, 키트, 방법 및 용도
본 발명은 하기를 포함하는 발현 시스템을 제공한다:
(A) 상기 섹션 "세포주"에 정의된 바와 같은, 부분적으로 또는 완전히 불활성화된 내인성 DHODH 유전자 및 부분적으로 또는 완전히 불활성화된 내인성 GS 유전자를 포함하는 상기 섹션 "세포주"에 정의된 바와 같은 세포주,
(B) 포유동물 DHODH를 코딩하는 뉴클레오티드 서열 (i) 및 재조합 단백질 (I)을 발현시키기 위한 적어도 1개의 발현 카세트를 포함하는 발현 벡터이며, 여기서 상기 DHODH는 상기 섹션 "발현 벡터"에 정의된 바와 같은 서열식별번호: 2의 서열 또는 서열식별번호: 4의 서열에 대해 적어도 60% 동일한 서열을 포함하는 것인 발현 벡터, 및
(C) 포유동물 GS를 코딩하는 뉴클레오티드 서열 (ii) 및 재조합 단백질 (II)를 발현시키기 위한 적어도 1개의 발현 카세트를 포함하는 발현 벡터이며, 여기서 GS는 상기 섹션 "발현 벡터"에 정의된 바와 같은 서열식별번호: 6의 서열 또는 서열식별번호: 8의 서열에 대해 적어도 94.5% 동일한 서열을 포함하는 것인 발현 벡터.
본 발명은 (i) 상기 섹션 "발현 벡터"에 정의된 바와 같은 발현 벡터 또는 본 발명에 따른 발현 시스템을 포함하는 본 발명에 따른 세포주 및 (ii) 상기 정의된 바와 같은 우리딘 및 글루타민이 결여된 배양 배지를 포함하는 키트를 제공한다.
키트는 상기 기재된 바와 같은 외인성 DHODH-코딩 발현 벡터 및/또는 외인성 GS-코딩 발현 벡터 (발현 시스템 내)를 포함할 수 있다. 이러한 키트에서, 벡터는 바람직하게는 비어있는데, 이것이 관련 기술분야의 통상의 기술자에게 관심있는 단백질의 클로닝을 가능하게 하기 때문이다. 추가로, 발현 벡터는 바람직하게는 이러한 키트에서 세포주로부터 단리된다.
키트는 상기 섹션 "세포주"에 정의된 바와 같은 우리딘 및 글루타민이 결여된 배양 배지를 추가로 포함한다.
키트는 세포주의 배양에 적합한 배지, 벡터를 세포주 내로 형질감염시키는데 적합한 배지, 패키징 물질 및/또는 발현 시스템의 사용에 대한 지침서를 추가로 포함할 수 있다.
특정한 실시양태에서, 키트는 DHODH 억제제 및/또는 GS 억제제가 결여되어 있다.
DHODH 억제제의 예는 비신코닌산, 브레퀴나르 (6-플루오로-2-(2'-플루오로-1,1'-비페닐-4-일)-3-메틸-4-퀴놀린 카르복실산), 나프토퀴논 유도체, 예컨대 디클로로알릴 로손, 이속사졸 유도체, 예컨대 레플루노미드 (5-메틸-N-[4-(트리플루오로메틸)페닐]-이속사졸-4-카르복스아미드) 및 그의 활성 대사물 테리플루노미드 ((2Z)-2-시아노-3-히드록시-N-[4-(트리플루오로메틸)페닐]부트-2-엔아미드), 퀴놀론 카르복실산, 나프토퀴논, 이속사졸, 페녹시퀴놀린, 레독살 및 유도체, 로손, 라파콜, 아토바쿠온 및 (8-클로로-4-(2-클로로-4-플루오로-페녹시)퀴놀린)을 포함한다. DHODH의 억제제는 DHODH 활성을 적어도 20, 30, 40, 50, 60, 70, 80, 90, 95, 99 또는 100%만큼 억제할 수 있다.
특정한 실시양태에서, 키트는 테리플루노미드가 결여되어 있다.
GS 억제제의 예는 메티오닌 술폭시민, 메티오닌 술폰, 포스피노트리신, 타브톡시닌-β-락탐, α-메틸 메티오닌 술폭시민, α-에틸 메티오닌 술폭시민, 에티오닌 술폭시민, α-메틸 에티오닌 술폭시민, 프로티오닌 술폭시민, α-메틸 프로티오닌 술폭시민, γ-히드록시 포스피노트리신, γ-아세톡시 포스피노트리신, α-메틸 포스피노트리신, α-에틸 포스피노트리신, 시클로헥산 포스피노트리신, 시클로펜탄 포스피노트리신, 테트라히드로푸란 포스피노트리신, s-포스포노메틸 호모시스테인, s-포스포노메틸 호모시스테인 술폭시드, s-포스포노메틸 호모시스테인 술폰, 4-(포스포노아세틸)-L-α-아미노부티레이트, 트레오-4-히드록시-D-글루탐산, 트레오-4-플루오로-D,L-글루탐산, 에리트로-4-플루오로-D,L-글루탐산, 2-아미노-4-[(포스포노메틸)히드록시포스피닐] 부탄산, 알라노신, 2-아미노-4-포스포노 부탄산, 2-아미노-2-메틸-4-포스포노 부탄산, 4-아미노-4-포스포노 부탄산, 4-아미노-4-(히드록시메틸포스피닐) 부탄산, 4-아미노-4-메틸-4-포스포노 부탄산, 4-아미노-4-(히드록시메틸포스피닐)-4-메틸 부탄산, 4-아미노-4-포스포노 부탄아미드, 2-아미도-4-포스포노 부탄산, 2-메톡시카르보닐-4-포스포노 부탄산, 메틸 4-아미노-4-포스포노 부타노에이트, 옥세틴, IF7 및 IF17 폴리펩티드, (3-아미노 3-카르복시프로필)-(포스포노메틸) 포스핀산, N-히드록시-L-2,4-디아미노부티레이트, 3-아미노-3-카르복시프로판-술폰아미드 및 5-히드록시리신을 포함한다. GS의 억제제는 GS 활성을 적어도 20, 30, 40, 50, 60, 70, 80, 90, 95, 99 또는 100%만큼 억제할 수 있다.
특정한 실시양태에서, 키트는 메티오닌 술폭시민이 결여되어 있다.
본 발명은 시험관내에서 재조합 단백질을 생산하기 위한, 상기 섹션 "발현 벡터"에 정의된 바와 같은 발현 벡터를 포함하는 본 발명에 따른 세포주, 본 발명에 따른 발현 시스템 또는 본 발명에 따른 키트의 용도를 추가로 제공한다.
특정한 실시양태에서, 상기 세포주, 발현 시스템 또는 키트는 상기 정의된 바와 같은 우리딘 및 글루타민이 결여된, 보다 특히 DHODH 억제제 및/또는 GS 억제제가 부재하는 배양 배지와 조합되어 사용된다.
본 발명은 시험관내에서, 특히 DHODH 억제제 및/또는 GS 억제제의 부재 하에 높은 수준의 재조합 단백질을 생산하는 클론 세포 ("고 생산 클론")를 단리하기 위한, 본 발명에 따른 발현 시스템, 상기 섹션 "발현 벡터"에 정의된 바와 같은 발현 벡터를 포함하는 본 발명에 따른 세포주 또는 본 발명에 따른 키트의 용도를 추가로 제공한다.
본 발명의 문맥에서, 용어 "높은 수준의 재조합 단백질"은 배양 배지에서 재조합 단백질의 농도가 적어도 0.05 g/l, 바람직하게는 적어도 0.1 g/l, 보다 바람직하게는 적어도 0.2 g/l, 보다 바람직하게는 0.3 내지 1 g/l인 것을 의미하는 것으로 의도된다. 재조합 단백질의 농도는 특히 효소-연결 면역흡착 검정 (ELISA), 웨스턴 블롯, 캘리퍼 기술 및 재조합 단백질에 상응하는 정제된 단백질의 농도 범위를 포함한, 관련 기술분야의 통상의 기술자에게 널리 공지된 방법에 의해 결정될 수 있다.
본 발명은 하기 단계를 포함하는, 재조합 단백질을 생산하는 시험관내 방법을 추가로 제공한다:
A)
a1) 상기 섹션 "발현 벡터"에 정의된 바와 같은 발현 벡터를 포함하는 본 발명에 따른 세포주를 제공하는 단계;
또는
a2) 본 발명에 따른 세포주를 제공하는 단계, 및
a2') 상기 섹션 "발현 벡터"에 정의된 바와 같은 발현 벡터를 단계 a2)에서 제공된 세포주 내로 도입하는 단계;
또는
a3) 내인성 DHODH 유전자 및 내인성 GS 유전자를 포함하는 세포주를 제공하는 단계,
a3') 단계 a3)에서 제공된 세포주 내의 내인성 DHODH 유전자 및 내인성 GS 유전자를 부분적으로 또는 완전히 불활성화시키는 단계, 및
a3") 상기 섹션 "발현 벡터"에 정의된 바와 같은 발현 벡터를 단계 a3')에서 수득된 부분적으로 또는 완전히 불활성화된 내인성 DHODH 유전자 및 부분적으로 또는 완전히 불활성화된 GS 유전자를 포함하는 세포주 내로 도입하는 단계;
또는
a4) 내인성 GS 유전자 및 부분적으로 또는 완전히 불활성화된 내인성 DHODH 유전자를 포함하는 세포를 제공하는 단계,
a4') 단계 a4)에서 제공된 세포주 내의 내인성 GS 유전자를 부분적으로 또는 완전히 불활성화시키는 단계, 및
a4") 상기 섹션 "발현 벡터"에 정의된 바와 같은 발현 벡터를 부분적으로 또는 완전히 불활성화된 내인성 DHODH 유전자 및 단계 a4')에서 수득된 부분적으로 또는 완전히 불활성화된 GS 유전자를 포함하는 세포주 내로 도입하는 단계;
또는
a5) 내인성 DHODH 유전자 및 부분적으로 또는 완전히 불활성화된 내인성 GS 유전자를 포함하는 세포를 제공하는 단계,
a5') 단계 a5)에서 제공된 세포주 내의 내인성 DHODH 유전자를 부분적으로 또는 완전히 불활성화시키는 단계, 및
a5") 상기 섹션 "발현 벡터"에 정의된 바와 같은 발현 벡터를 단계 a5')에서 수득된 부분적으로 또는 완전히 불활성화된 내인성 DHODH 유전자 및 부분적으로 또는 완전히 불활성화된 GS 유전자를 포함하는 세포주 내로 도입하는 단계;
B)
상기 세포주를 재조합 단백질의 생산에 적합한 조건 하에 배양하는 단계; 및
C)
상기 재조합 단백질을 단리 및/또는 정제하는 단계.
특정한 실시양태에서, 상기 방법의 단계 B)는 우리딘 및 글루타민이 결여된, 보다 특히 또한 DHODH 억제제 및/또는 GS 억제제가 결여된 배양 배지에서 수행되고, 특히 우리딘 및 글루타민의 부재에도 불구하고, 특히 추가로 DHODH 억제제 및/또는 GS 억제제의 부재 하에 성장하는 형질감염된 세포를 선택하는 것으로 이루어진 하위-단계를 포함한다.
본 발명은 하기 단계를 포함하거나 또는 그로 이루어진, 높은 수준의 재조합 단백질을 생산하는 클론 세포를 단리하는 시험관내 방법을 추가로 제공한다:
A)
a1) 상기 섹션 "발현 벡터"에 정의된 바와 같은 발현 벡터를 포함하는 본 발명에 따른 세포주를 제공하는 단계;
또는
a2) 본 발명에 따른 세포주를 제공하는 단계, 및
a2') 상기 섹션 "발현 벡터"에 정의된 바와 같은 발현 벡터를 단계 a2)에서 제공된 세포주 내로 도입하는 단계;
또는
a3) 내인성 DHODH 유전자 및 내인성 GS 유전자를 포함하는 세포주를 제공하는 단계,
a3') 단계 a3)에서 제공된 세포주 내의 내인성 DHODH 유전자 및 내인성 GS 유전자를 부분적으로 또는 완전히 불활성화시키는 단계, 및
a3") 상기 섹션 "발현 벡터"에 정의된 바와 같은 발현 벡터를 단계 a3')에서 수득된 부분적으로 또는 완전히 불활성화된 내인성 DHODH 유전자 및 부분적으로 또는 완전히 불활성화된 GS 유전자를 포함하는 세포주 내로 도입하는 단계;
또는
a4) 내인성 GS 유전자 및 부분적으로 또는 완전히 불활성화된 내인성 DHODH 유전자를 포함하는 세포를 제공하는 단계,
a4') 단계 a4)에서 제공된 세포주 내의 내인성 GS 유전자를 부분적으로 또는 완전히 불활성화시키는 단계, 및
a4") 상기 섹션 "발현 벡터"에 정의된 바와 같은 발현 벡터를 부분적으로 또는 완전히 불활성화된 내인성 DHODH 유전자 및 단계 a4')에서 수득된 부분적으로 또는 완전히 불활성화된 GS 유전자를 포함하는 세포주 내로 도입하는 단계;
또는
a5) 내인성 DHODH 유전자 및 부분적으로 또는 완전히 불활성화된 내인성 GS 유전자를 포함하는 세포를 제공하는 단계,
a5') 단계 a5)에서 제공된 세포주 내의 내인성 DHODH 유전자를 부분적으로 또는 완전히 불활성화시키는 단계, 및
a5") 상기 섹션 "발현 벡터"에 정의된 바와 같은 발현 벡터를 단계 a5')에서 수득된 부분적으로 또는 완전히 불활성화된 내인성 DHODH 유전자 및 부분적으로 또는 완전히 불활성화된 GS 유전자를 포함하는 세포주 내로 도입하는 단계;
B)
상기 세포주를 재조합 단백질의 생산에 적합한 조건 하에 배양하는 단계; 및
C)
높은 수준의 재조합 단백질을 생산하는 클론을 단리하는 단계.
특정한 실시양태에서, 상기 방법의 단계 B)는 우리딘 및 글루타민이 결여된, 보다 특히 또한 DHODH 억제제 및/또는 GS 억제제가 결여된 배양 배지에서 수행되고, 특히 우리딘 및 글루타민의 부재에도 불구하고, 특히 추가로 DHODH 억제제 및/또는 GS 억제제의 부재 하에 성장하는 형질감염된 세포를 선택하는 것으로 이루어진 하위-단계를 포함한다.
상기 발현 벡터는 단계 a2'), a3"), a4") 또는 a5")에서 통상의 기술자에게 널리 공지된 임의의 기술, 예컨대 형질감염에 의해, 특히 전기천공 또는 화학적 형질감염 또는 형질도입에 의해 상기 세포주 내로 도입될 수 있다.
재조합 단백질의 생산에 적합한 조건은 관련 기술분야의 통상의 기술자에게 널리 공지되어 있다. 예를 들어 실시예에 기재된 프로토콜이 사용될 수 있다.
구체적 실시양태에서, 단계 B)에서 사용된 배양 배지는 감소하는 농도의 우리딘 및 감소하는 농도의 글루타민을 포함한다. 이는 벡터-유래 외인성 DHODH 유전자 및 벡터-유래 외인성 GS 유전자 (및 따라서 재조합 단백질을 코딩하는 서열)가 증폭된 클론을 선택하는 것을 가능하게 한다.
상기 방법은 재조합 단백질을 제약 조성물로 제제화하는 단계를 추가로 포함할 수 있다.
명세서 전반에 걸쳐, 용어, 예컨대 "포함한다", "포함된" 및 "포함하는"은 대부분의 특허 관할권에서, 바람직하게는 해당 관할권에서 이들에 기인하는 의미를 가지며; 예를 들어 이들은 "포함한다", "포함된", "포함한" 등을 의미할 수 있다. 용어, 예컨대 "이루어진", "본질적으로 이루어진" 및 "본질적으로 이루어진다"는 대부분의 특허 관할권에서, 바람직하게는 해당 관할권에서 이들에 기인하는 의미를 가지며; 예를 들어 이들은 모든, 대부분 또는 무시할만한 양을 제외한 모든 다른 요소의 배제를 암시하고, 이들은 명백하게 언급되지 않은 요소를 허용하지만, 선행 기술에서 발견되거나 또는 본 발명의 기초 또는 신규 특징에 영향을 미치는 요소는 배제한다.
여러 문헌이 본 명세서의 텍스트 전반에 걸쳐 인용된다. 본원에 인용된 각각의 문헌 (임의의 학술지 논문 또는 요약서, 공개 또는 비공개된 특허 출원, 허여된 특허, 제조업체의 명세서, 지침서 등 포함)은 본원에 참조로 포함된다. 그러나, 본원에 인용된 임의의 문헌이 실제로 본 발명에 관한 선행 기술임을 인정하는 것은 아니다.
본 발명은 하기 도면 및 실시예를 참조하여 추가로 기재될 것이며, 이는 단지 예시적이고, 본 발명을 제한하는 것으로 의도되지 않는다.
본 발명은 청구범위에 의해 정의되며, 이는 발명의 상세한 설명 및 도면의 보조 하에 해석되어야 한다.
서열의 간단한 설명
실시예
실시예 1: CHO 9E4 세포주의 수득
본 실시예는 ATCC로부터 번호 ATCC CCL-61 하에 상업적으로 입수가능한 CHO-K1 세포주로부터 CHO 9E4 세포주를 수득하는 것을 기재한다.
1. CHO-K1 세포주
1969년에 소 혈청의 존재 하에 동결된 CHO-K1 세포 (ATCC CCL-61)의 바이알을 ATCC로부터 입수하였다.
2. 엑스-셀™ 302 배지에서의 바이알의 해동 및 CHO-LG-APF 뱅크의 제조
CHO-K1 바이알을 4 mM 글루타민이 보충된 엑스-셀™ 302 배지 (SAFC)에서 직접 해동시키고, 정적 지지체 상에서, 이어서 스피너 내에서 증폭시켰다. 생성된 CHO-LG-APF 뱅크를 12 계대 및 17.3 세대 후에 엑스-셀™ 302 배지에서 동결시켰다.
3. 엑스-셀™ 302 배지에서의 CHO-LG-APF 뱅크의 해동 및 ABC-024 P22 뱅크의 제조
CHO-LG-APF 바이알을 엑스-셀™ 302 배지에서 해동시키고, 증폭시켰다. 생성된 ABC-024 P22 뱅크를 18.5 세대 후에 해동시켰다.
4. CMV07-024 뱅크의 CDCHO 융합 배지에의 적응 및 ABC-003 뱅크의 제조
CMV07-024 뱅크를 해동시키고, 4 mM 글루타민이 보충된 엑스-셀™ CDCHO 융합 배지 (SAFC)에 직접 적응시키고, 엑스-셀™ CDCHO 융합 배지에서 ABC-003 뱅크를 동결시킬 때까지 12.5 세대에 걸쳐 진탕기에서 적응시켰다.
5. CDCHO 융합 배지에서의 ABC-003 뱅크의 해동 및 CDCHO 융합 배지에서의 ABC-053 뱅크의 제조
ABC-003 바이알을 CDCHO 융합 배지에서 해동시키고, 희석 후, ABC-53 뱅크를 4.2 세대 후에 동결시켰다.
6. CDCHO 융합 배지에서의 ABC-053 뱅크의 해동, 선택, 클로닝 및 CDCHO 융합 배지에서의 P15A11 뱅크의 제조
ABC-053 뱅크를 4 mM 글루타민이 보충된 엑스-셀™ CDCHO 융합 배지 (SAFC)에서 해동시켰다. 배양물의 증폭 후에, 이를 플레이트에서 한계 희석에 의해 클로닝한 다음, CDCHO 융합 배지에서 증폭시켰다. 이러한 클로닝으로부터 생성된 클론 P15A11의 뱅크를 동결시켰다. 이러한 클로닝 및 증폭은 약 94 세대에 상응한다.
7. CDCHO 융합 배지에서의 P15A11 뱅크의 해동, CDCHO에서의 직접 계대에 의한 뱅크의 적응, 및 CDCHO 배지에서의 CHOSP10-002 뱅크의 제조
P15A11 뱅크를 4 mM 글루타민이 보충된 엑스-셀™ CDCHO 융합 배지 (SAFC)에서 해동시키고, CDCHO 융합 배지에서 2 계대 후, 세포를 CDCHO 배지 중에 희석하였다. CDCHO 배지에서 3 계대 후, CHOSP10-002 뱅크를 총 15.9 세대 후에 동결시켰다.
8. CDCHO 배지에서의 CHOSP10-002 뱅크의 해동, 증폭, 원심분리에 의한 덩어리의 제거 및 96-웰 플레이트에서의 덩어리의 부재 하에서의 계대배양에 의한 선택, 6-웰 플레이트 및 진탕기에서의 증폭에 의한 CDCHO 배지에서의 CHOSP10-012 뱅크의 제조
CHOSP10-002 뱅크를 6 mM 글루타민이 보충된 CDCHO 배지 (인비트로젠)에서 해동시킨 다음, 증폭시켰다. 배양물을 원심분리하여 세포 덩어리를 제거하고, 단지 상청액으로부터 단리된 세포만 배양을 계속하였다. 이 스테이지에서, 해동으로부터 11.3 세대가 생성되었다.
이 배양물을 96-웰 플레이트에서 웰당 10개 세포로 분할하였다. 현탁액 중에서 개별적으로 증대된 세포가 담긴 웰을 6-웰 플레이트에서, 이어서 진탕기에서 증폭시켰다. CHOSP10-012 뱅크가 동결될 때까지 추가의 23.2 세대가 존재하였다.
9. CHOSP10-012 뱅크의 해동, 증폭 및 CHOSP11-008 뱅크 (9E4 뱅크)의 제조
CHOSP10-012 뱅크를 6 mM 글루타민이 보충된 CDCHO 배지 (인비트로젠)에서 해동시킨 다음, 에를렌마이어(Erlenmeyer) 스테이지로부터 17 L 생물반응기로 증폭시켰다.
9E4 뱅크를 총 10 세대 후에 동결시켰다.
실시예 2: DHODH 유전자가 무효화된 CHO 세포주의 생산
A - CRISPR CAS9 가이드 RNA (gRNA)의 설계 및 구축
CHO 세포에서 DHDOH 유전자를 무효화하기 위해, 본 발명자들은 햄스터 DHODH 유전자 서열을 회수하고, CHO 게놈에서 CRISPR-Cas9로의 형질감염을 위한 상이한 가이드 RNA (gRNA)를 설계하기 위해 공개적으로 이용가능한 테포르(Tefor) 소프트웨어를 사용함으로써 시작하였다. 인트론 및 엑손을 갖는 전체 CHO DHODH 서열이 도 1에 제시된다.
소프트웨어는 DHODH 유전자를 표적화할 수 있는 8개의 서열을 결정하였다:
서열1'
GGATGCAGCCATCATCCTTGGTTTT (서열식별번호: 11)
CAAGGATGATGGCTGCATCCCGGTG (서열식별번호: 12)
서열2'
GATGCAGCCATCATCCTTGGGTTTT (서열식별번호: 13)
CCAAGGATGATGGCTGCATCCGGTG (서열식별번호: 14)
서열3'
GCAGCCATCATCCTTGGGGGGTTTT (서열식별번호: 15)
CCCCCAAGGATGATGGCTGCCGGTG (서열식별번호: 16)
서열4'
GCCATCATCCTTGGGGGAGGGTTTT (서열식별번호: 17)
CCCCCCAAGGATGATGGCCGGTG (서열식별번호: 18)
서열5'
GCTATTCGCTTCACGTCCCTGTTTT (서열식별번호: 19)
AGGGACGTGAAGCGAATAGCCGGTG (서열식별번호: 20)
서열6'
GCCTCTACAAACTGGGCTTTGTTTT (서열식별번호: 21)
AAAGCCCAGTTTGTAGAGGCCGGTG (서열식별번호: 22)
서열7'
GGCTTTGGGTTTGTCGAGGTGTTTT (서열식별번호: 23)
ACCTCGACAAACCCAAAGCCCGGTG (서열식별번호: 24)
서열8'
GCTGGTCTGAGGAGCCTACAGTTTT (서열식별번호: 25)
TGTAGGCTCCTCAGACCAGCCGGTG (서열식별번호: 26)
8개의 서열을 시험하고 클로닝하였지만, 8개의 서열 중에서 단지 4개의 클로닝된 서열만이 형질감염되었고, 단지 1개만이 DHODH 유전자의 녹아웃을 생성하는데 성공하였다. gRNA를 생성하기 위한 DNA의 상응하는 조각으로서 하기 20개의 뉴클레오티드 서열 GGATGCAGCCATCATCCTTG (서열식별번호: 10)를 사용하였다. 이는 DHODH 유전자의 제2 엑손을 표적화한다. 적절한 gRNA의 전사를 수득하기 위해, 2개의 올리고뉴클레오티드 GGATGCAGCCATCATCCTTGGTTTT (올리고1', 서열식별번호: 11) 및 CAAGGATGATGGCTGCATCCCGGTG (올리고2', 서열식별번호: 12)를 합성적으로 제조하고, 어닐링하고, pCM3561 (인비트로젠에 의해 상품화됨)의 고유한 BaeI 부위에서 클로닝하였다.
클로닝된 DNA 서열은 이에 의해 U6 프로모터의 제어 하에 있게 되었고, DNA로 CHO 세포를 형질감염시켰을 때, 이는 tracrRNA에 융합된 crRNA를 함유하는 단일 전사 유닛으로 전사되었다. crRNA 부분은 DHODH 유전자의 제2 엑손에 특이적인 한편, tracrRNA는 Cas9 효소 자체에 의해 인식되었다.
B - CRISPR-Cas9 유전자 편집을 위한 물질의 제조
실시예 1에 개시된 바와 같이 ATCC로부터 구입한 CHO K-1 세포로부터 CHO 9E4 세포를 단리 및 선택하고, 8% CO2 및 80% 습도를 갖는 인큐베이터에서 37℃에서 6 mM L-글루타민이 보충된, 차이니즈 햄스터 난소 (CHO) 세포의 성장을 위해 최적화된 CDCHO 무혈청 및 화학적-한정 배지에서 현탁 배양물로서 성장시키고 유지시켰다.
10 μg의 sgRNA 발현 벡터 (pCM3561)를 20 μM S-아데노실메티오닌 (SAM)이 보충된 5 유닛/μl의 BaeI 효소 1 μL로 25℃에서 1시간 동안 소화시킨 다음, 소화된 플라스미드를 1% 아가로스 겔을 사용하여 전기영동에 의해 분리하였다. 이어서, 생성된 sgRNA 클로닝 벡터를 겔 추출 키트 (퀴아젠(Qiagen) 키트)에 의해 회수하였다.
sgRNA 클로닝 벡터 및 어닐링된 가이드 올리고뉴클레오티드를 T4 DNA 리가제 효소 (바이오랩스(Biolabs))를 사용하여 라이게이션하고, 실온에서 10분 동안 인큐베이션하였다.
5 μL의 라이게이션 생성물을 50 μL의 이. 콜라이 DH5a 적격 세포 (인비트로젠)에 첨가하였다.
세포 및 DNA를 얼음 상에서 30분 인큐베이션한 다음, 42℃에서 45초 동안 열 쇼크를 가하였다. 500 mL S.O.C 배지를 첨가한 후, 37℃ (800 rpm)에서의 1-시간 인큐베이션은 박테리아에게 플라스미드 백본 상에 코딩된 항생제 내성 단백질을 생성할 시간을 제공하였다. 인큐베이션 후, 각각의 튜브를 100 μg/mL 암피실린이 보충된 1개의 코팅된 LB 상에 스프레딩하였다. 디쉬를 37℃에서 밤새 인큐베이션하였다. 음성 대조군 (삽입물 DNA 대신 물을 가짐)을 사용하여 형질전환의 성공을 평가하였다.
증폭 단계의 경우, 구축당 2개의 콜로니를 선택하고, (37℃, 700 rpm에서) 밤새 인큐베이터에 놓아둔 튜브 내의 100 μg/ml의 암피실린이 보충된 2 mL의 LB 배지에 시딩하였다. 밤새 인큐베이션된 배양물을 원심분리에 의해 수거하였다. 퀴아프렙 미니프렙 키트(QIAprep Miniprep Kit)™ (퀴아젠)를 사용하여 증폭된 DNA를 회수하였다 (EB 완충제 중 용리). 이어서, 관심 가이드 올리고뉴클레오티드의 서열을 생어 서열분석 (센스 및 안티센스 서열분석, GATC 캄파니(GATC Company))에 의해 체크하였다. 벡터 NTI 소프트웨어 (써모피셔 사이언티픽(Thermofisher Scientific)) 상에서 정렬에 의해 확인한 후, 상응하는 콜로니를 사용하여 100 μg/ml의 암피실린이 보충된 200 mL의 LB 배지에 시딩하였다. 24시간 인큐베이션 후에, 박테리아를 4℃에서 6000 g에서 15분 동안 원심분리함으로써 수거하였다. 엔도프리 플라스미드 맥시 키트(EndoFree Plasmid Maxi Kit)™ (퀴아젠)를 사용하여 맥시프렙을 제조하였다. 실온 이소프로판올을 첨가하여 DNA를 침전시켰다. (4℃, 8000 rpm에서) 1시간-원심분리 후, DNA 펠릿을 내독소-무함유 실온 70% 에탄올로 세척하였다. 짧은 새로운 원심분리 후, 펠릿을 1시간 동안 공기-건조시키고, 적합한 부피의 내독소-무함유 멸균수 중에 재용해시켜 5 mg/mL의 DNA 농도를 얻었다. 나노드롭 장치를 사용하여 DNA 농도를 측정하였다.
4개의 상이한 플라스미드, 즉 pBH6840 플라스미드 (KO DHODH 서열1'), pBH6841 플라스미드 (KO DHODH 서열2'), pBH6842 플라스미드 (KO DHODH 서열5') 및 pBH6843 플라스미드 (KO DHODH 서열7')를 제조하였다. CHO DHODH 유전자 내의 표적은 서열식별번호: 27의 서열 상에 제시된다.
C - CRISPR-Cas9 유전자 편집
맥스사이트(MaxCyte) STX 및 그의 CHO 정의된 프로토콜을 사용하여 전기천공에 의해 형질감염을 수행하였다. 이를 OC-100 (형질감염당 2천만개 세포) 프로세싱 어셈블리에서 수행하였다.
형질감염 전날, 세포를 6 mM L-글루타민이 보충된 CDCHO 배지에 1.5x106개 세포/mL로 시딩하였다.
형질감염 당일에, 세포를 바이셀(ViCell) 장치 (베크만 & 쿨터(Beckman & Coulter))로 계수하였다. 필요한 수의 세포를 250 g에서 10분 동안 원심분리하고, 상청액을 버렸다.
각각의 형질감염 조건에 대해, 20x106개의 세포를 250 g에서 10분 동안 원심분리하였다. 펠릿을 70 μL 맥스사이트 완충제로 재현탁시켰다. 30 μg의 DNA를 첨가하고, 믹스 (세포, 완충제 및 DNA)를 100 μL 맥스사이트 전기천공 카세트로 옮겼다. 사용된 프로세싱 어셈블리는 100 μL 카세트에 특이적인 OC-100이었고, CHO에 대해 최적화된 프로그램을 선택하였다.
하기 형질감염을 수행하였다.
전기천공 후, 세포를 25 mL 작업 에를렌마이어 플라스크로 옮겼다. 이들을 37℃, 5% CO2 정적 인큐베이터 내에 45분 동안 두었다. 이어서, 6 mM L-글루타민이 보충된 CDCHO 배지 25 mL를 첨가하여 세포를 재현탁시키고, 에를렌마이어 플라스크를 37℃, 5% CO2, 70% 습도, 110 rpm 진탕기에 두었다.
전기천공 다음날, 상기 기재된 CHO9E4 형질감염된 풀로부터의 한계 희석에 의해 웰당 단일 세포를 시딩하였다. 약 20일 후, 세포가 대략 90% 전면생장률이고 현미경 하에 검사하였을 때 건강한 것으로 보이면, 세포를 우리딘의 존재 또는 부재 하의 2개의 새로운 96 웰 플레이트로 분할하였다.
우리딘의 결여에 대한 감수성에 대해 여러 클론을 선택하였다. 이들 클론을 6 mM의 글루타민 및 5 mM의 우리딘이 보충된 CDCHO 배지에서의 성장에 적응시켰다.
유전자 편집이 성공했는지 확인하기 위해, 퀴아젠 DN이지 키트(DNeasy kit)™ (퀴아젠)를 사용하여 CRISPR-Cas9 클론 세포로부터 게놈 DNA를 추출하였다. 표적 유전자좌를 CRISPR-Cas9에 의해 표적화된 DHODH 유전자좌의 영역에 대한 적절한 프라이머를 사용하여 PCR에 의해 증폭시키고, PCR 생성물을 잠재적으로 결실된 영역을 커버하는 PCR 단편을 사용하여 NGS에 의해 서열분석하였다.
이에 의해 DHODH에 대한 클론 KO2 및 KO19 녹아웃을 생성하였다.
실시예 3: DHODH 유전자 및 GS 유전자가 무효화된 CHO 세포주의 생산
A - CRISPR-Cas9 가이드 RNA (gRNA)의 설계 및 구축
실시예 2에서 수득된 CHO KO DHODH KO2 및 KO19 세포주에서 GS 유전자를 무효화하기 위해, 본 발명자들은 차이니즈 햄스터 GS 유전자 서열을 회수하고, CHO 게놈에서 CRISPR-Cas9 단백질로의 형질감염을 위한 2종의 상이한 가이드 RNA (gRNA)를 설계하기 위해 공개적으로 이용가능한 테포르 소프트웨어를 사용함으로써 시작하였다.
소프트웨어는 GS 유전자를 표적화할 수 있는 2개의 최적 서열을 결정하였다. 2개의 표적화된 서열을 선택하였으며, 하나는 CHO GS 유전자의 엑손 6을 표적화하고 다른 것은 엑손 6의 부근을 표적화하였다.
GS-1 gRNA 서열은 CHO GS 게놈 서열 내의 gagtatgtgaagactttg (서열식별번호: 29)에 이어서 PAM 서열 (ngg)을 표적화한다.
GS-2 gRNA 서열은 CHO GS 게놈 서열 내의 ccatctttattctcatgggg (서열식별번호: 30)에 이어서 PAM 서열 (ngg)을 표적화한다.
CHO GS 유전자 내의 표적은 서열식별번호: 31의 서열 상에 제시된다.
B - CRISPR-Cas9 유전자 편집을 위한 물질의 제조
2개의 KO2 및 KO19 녹아웃 DHODH 클론을 형질감염 24시간 전에 6 mM 글루타민 및 5 mM 우리딘이 보충된 사전-가온된 CD CHO 배지 중에 희석하여 목적하는 최종 부피에서 1.5x106개 세포/mL의 최종 세포 밀도를 달성하였다. 플라스크를 115 rpm으로 회전하는 5 mm 오비탈 진탕기 플랫폼 상에서 공기 중 8% CO2의 가습 분위기를 함유하는 37℃ 인큐베이터에서 인큐베이션하였다.
분자 생물학 실험실의 전형적 조건 하에, crRNA::tracrRNA 복합체를 하기와 같이 제조하였으며: 각각의 crRNA에 대해 각각 - (GS-1 gRNA에 대해 1개 및 GS-2 gRNA에 대해 1개); 2종의 특이적 crRNA, 불변 tracRNA 및 정제된 spCAS9 단백질은 인티그레이티드 DNA 테크놀로지스(Integrated DNA Technologies; IDT, 벨기에 루벤)에 의해 제공되었다.
cr:tracrRNA 믹스
1. 믹스를 95℃에서 5분 동안 인큐베이션하였다.
a. 써모사이클러의 설정은 하기와 같다:
i. 95℃ 5분
ii. 20℃ 유지 (이어서 벤치탑 상에 놓음)
2. 복합체를 실온에서 냉각시키고, RNP를 하기와 같이 제조하였다:
RNP 복합체
모든 성분을 혼합하고, 실온에서 20분 동안 인큐베이션하고, 인큐베이션 동안 세포를 계수하였다. 형질감염 실험당 1백만개의 세포를 계수하여 충분한 수의 세포를 수거하였다. 배양된 세포를 실온에서 250 g에서 10분 동안 원심분리하고, 세포 펠릿을 건드리지 않으면서 상청액을 조심스럽게 제거하였다.
C - CRISPR-Cas9 유전자 편집
형질감염 믹스
각각의 형질감염 조건에 대해, 1x106개 세포 펠릿을 90 μl 형질감염 믹스 (RNP 복합체 및 crRNA::tracrRNA 복합체를 함유하는 맥스사이트 완충제)로 재현탁시키고, 100 μl 맥스사이트 전기천공 카세트로 옮겼다.
사용된 프로세싱 어셈블리는 100 μl 카세트에 특이적인 OC-100이었고, CHO에 대한 최적화된 프로그램을 선택하였다. 이 특이적 맥스사이트 설계된 프로그램을 사용하여 세포를 전기천공하였다.
회복기를 위해, 형질감염된 세포를 즉시 125 ml 플라스크에 교반 없이 37℃에서 40분 동안 옮겨두었다. 6 mM 글루타민 및 5 mM 우리딘이 보충된 25 ml 사전-가온된 CD CHO를 첨가하고, 형질감염된 배양물을 8% CO2 및 80% 습도를 갖는 인큐베이터에서 37℃에서 유지하였다.
형질감염 1일 후에, 상기 기재된 KO2 및 KO19 DHODH 클론 형질감염된 풀의 한계 희석에 의해 웰당 0.5개 세포에 상응하는 96 웰 플레이트에 웰당 단일 세포를 시딩하였다. 성장하는 잠재적 클론을 함유하는 96 웰 플레이트를 8% CO2 및 80% 습도를 갖는 인큐베이터에서 37℃에서 유지하였다.
15 내지 25일의 성장 후에, 세포 점유된 웰이 관찰되었고, 세포가 대략 90% 전면생장률이고 현미경 하에 검사하였을 때 건강한 것으로 보이면, 성장하는 세포를 글루타민의 존재 또는 부재 하의 2개의 새로운 96 웰 플레이트로 분할하여 그의 글루타민 영양요구성을 확인하였다.
글루타민의 결여에 대한 감수성에 대해 96개의 클론을 선택하였다. 이들 클론을 6 mM 글루타민 및 5 mM 우리딘이 보충된 CD CHO에서의 성장에 적응시켰다.
유전자 편집이 성공했는지 확인하기 위해, CRISPR-Cas9 클론 세포로부터 게놈 DNA를 추출하고, 표적화 NGS 서열분석에 의해 2개의 GS 유전자 대립유전자의 파괴를 확인하였다.
즉, 1 내지 5 x 106개의 클로닝된 CHO 세포를 사용하여 퓨어 링크(Pure Link)™ 게놈 DNA 미니 키트 (인비트로젠 카탈로그 번호 K1820-01)를 사용하여 게놈 DNA (gDNA)를 제조하였다.
보다 구체적으로, 5 x 106개의 세포를 실온에서 250 g에서 10분 동안 원심분리하고, 성장 배지를 조심스럽게 제거하였다. 펠릿을 200 μl PBS 중에 재현탁시켰다. 20 μl의 프로테이나제 K / RNase 및 200 μl의 용해 / 결합 완충제를 샘플에 첨가하고, 55℃에서 10분 동안 인큐베이션하였다. 샘플 튜브를 10,000 g에서 1분 동안 원심분리하였다. 200 μl의 95-100% 에탄올을 용해물에 첨가한 다음, 이를 볼텍싱하였다. 스핀 칼럼을 수집 튜브에 첨가하고, 제조된 용해물을 스핀 칼럼에 첨가하였다. 스핀 칼럼 및 수집 튜브 조합물을 실온에서 10,000 g에서 1분 동안 원심분리한 다음, 통과액을 폐기하였다. 이어서, 500 μl의 세척 완충제 1을 첨가하고, 스핀 칼럼 및 수집 튜브 조합물을 실온에서 10,000 g에서 1분 동안 원심분리하고, 통과액을 폐기하였다. 이어서, 500 μl의 세척 완충제 2를 첨가하고, 스핀 칼럼 및 수집 튜브 조합물을 실온에서 10,000 g에서 3분 동안 원심분리하고, 통과액을 폐기하였다. 스핀 칼럼을 새로운 미세원심분리 튜브에 첨가하고, 100 μl의 용리 완충제를 스핀 칼럼에 첨가하였다. 샘플을 실온에서 1분 동안 인큐베이션한 다음, 실온에서 최대 속도로 1분 동안 원심분리하였다. 추출된 DNA가 미세원심분리 튜브에 수집되었기 때문에 칼럼을 제거하고 폐기하였다.
50 ng의 게놈 DNA로부터 출발하여, 잠재적으로 변형된 영역에 상응하는 관심 영역을 NextSeq 500 미드 아웃풋 키트 v2.5 (300 사이클); Ref: 20024905에 의해 구동되는 일루미나 코포레이션(Illumina corporation) 기술을 사용하여 2개의 순차적 PCR을 사용하여 증폭시켰다. 제1 PCR은 하기 정방향 및 역방향 PCR 프라이머를 사용한 인용된 영역의 특이적 증폭에 상응한다.
이들 프라이머는 합성적으로 제조되었고, 5' 말단에 일반 어댑터인 F-어댑터 (Rd1SP, 33개 뉴클레오티드) 및 R-어댑터 (Rd2SP, 34개 뉴클레오티드)를 함유하였다. 증폭된 서열의 이론적 크기는 결실이 관찰되지 않은 경우에 399개 뉴클레오티드였다.
제2 PCR에서, 이 단편을 재증폭시켜 상기 기재된 일반 서열 Rd1SP 및 Rd2SP에 기초해 T5 i5 인덱싱된 프라이머 및 T7 i7 인덱싱된 프라이머를 사용하여 인덱싱하였다. 인덱싱은 다중 단편의 혼합을 허용하였다.
서열분석 후에, 2개의 대립유전자의 GS 게놈 서열 내의 결실을 확인하여, 2개의 GS 유전자 대립유전자의 파괴를 확인하였다.
실시예 4: 항체 생산 검정
실시예 3에서 수득된 이중 GS DHODH 녹아웃 세포를 사용하여 삼중특이적 항체를 생산하였다.
발현 벡터를 5 mg/ml의 농도로 설계하고, 구축하고, 생산하였다. 이들 벡터에서, 발현 카세트 및 선택 마커 (GS cDNA 또는 DHODH G202A cDNA)는 ITR (역전된 말단 반복부)와 경계를 접하고 있어, 발현 카세트 및 선택 마커의 CHO 생산 세포의 게놈 내로의 능동 통합을 위한 피기백 트랜스포손 시스템의 사용을 가능하게 한다.
돌연변이된 피기백 트랜스포사제에 대한 플라스미드 (Yusa et al. (2011) Proc. Natl. Acad. Sci. USA 108:1531-1536)를 공동 형질감염시켜 트랜스포사제의 일시적 발현을 허용하였다.
사용된 세포주는 CHO 9E4_SP11 (실시예 1에 개시됨) 및 실시예 3에 개시된 DHODH 및 GS 유전자에 대한 녹아웃 클론이었다.
CHO 9E4_SP11을 6 mM L-글루타민이 보충된 CDCHO 배지에서 배양하였다. 이중 KO 클론을 6 mM L-글루타민 및 5 mM 우리딘이 보충된 CDCHO 배지에서 배양하였다.
형질감염될 세포를 초기에 125 ml 에를렌마이어 플라스크에서 25 mL 작업으로 배양하고, 생존 세포의 수가 모든 형질감염을 수행하기에 충분할 때까지 증폭시켰다.
펙토프로(FectoPRO)® (폴리플러스(Polyplus)) 형질감염 1일 전에, 세포를 6 mM 글루타민 및 5 mM 우리딘이 보충된 CD CHO 배지 중에 1.5x106개 세포/ml로 희석하였다.
형질감염 당일에, 2.8 ml의 희석된 세포 현탁액을 6 mM L-글루타민 및 5 mM 우리딘이 보충된 CD CHO 중 1.1x106개 세포/ml로 24 DW 플레이트에 분배하였다. 제조업체의 권장 프로토콜에 따라, 펙토프로® 시약을 5초 동안 볼텍싱하고, 스핀 다운시킨 후, 웰당 6.2 μl를 비어있는 96 MTP 웰 플레이트에 첨가하였다. 제2의 96 MTP 웰 플레이트에서, 3.1 μg의 DNA (90%의 발현 카세트 DNA 및 10%의 트랜스포사제 발현 플라스미드 pBH6209)를 200 μl의 CD CHO 배지 중에 희석한 다음, 배양물 중 희석된 DNA를 각각의 웰에 대해 각각 순수한 펙토프로® 시약 내로 한 번에 분배하였다. 용액을 즉시 균질화하고, 실온에서 10분 동안 인큐베이션하였다. 펙토프로®/DNA 형질감염 믹스를 24 웰 플레이트에 사전 분배되어 있는 제조된 세포에 붓고, 배양물을 37℃, 190 rpm 및 8% CO2에서 인큐베이션하였다.
전기천공 24시간 후 (제1일), 세포를 바이셀 XR로 계수하였다. 전세포 배양물을 250 g, 10분, 25℃에서 원심분리하고, 배지를 조심스럽게 흡인하였다. CHO 9E4 WT 세포의 경우 30%의 FeedB 및 25 μM의 테리플루노미드가 보충되고 이중 KO GS/DHODH 세포의 경우 임의의 선택 압력 또는 글루타민/우리딘 첨가가 없는 사전-가온된 CD OPTiCHO 배지로 펠릿을 재현탁시켰다.
형질감염 후 제3일에, 세포를 인비트로젠™ 카운테스(Countess)™ 장치로 계수하였다. 전세포 배양물을 250 g, 10분, 25℃에서 원심분리하고, 상청액을 조심스럽게 폐기하였다. CHO 9E4 WT 세포의 경우 30%의 FeedB 및 25 μM의 테리플루노미드가 보충되고 이중 KO GS/DHODH 세포의 경우 임의의 선택 압력 또는 글루타민/우리딘 첨가가 없는 사전-가온된 CD OPTiCHO 배지로 펠릿을 재현탁시켰다.
형질감염 후 제14일에, 총 배양물을 250 g, 10분, 4℃에서 원심분리하고, 생산된 관심 단백질을 함유하는 상청액을 0.22 μm PES 필터를 통해 여과하고, 항체 표적 역가를 옥테트 로봇을 사용하여 측정하였다.
하기 표는 삼중특이적 항체에 대한 형질감염 조건을 요약한 것이다.
Gln: 글루타민, Uri: 우리딘, TNF: 테리플루노미드, MSX: L-메티오닌 술폭시민
하기 결과를 수득하였다.
제10일 및 제14일에서의 삼중특이적 항체 생산이 도 2에 제시된다.
도 2에 제시된 바와 같이, 10개의 클론은 임의의 선택 압력 테리플루노미드/L-메티오닌 술폭시민 또는 글루타민/우리딘 첨가 없이 우수한 생산을 나타냈다.
이들 이중 KO 클론은 선행 기술 선택 시스템과 동일한 범위, 즉 0.3 g/l 내지 0.5 g/l의 삼중특이적 항체를 생산하였으며, 특히 이중 KO20 클론이 높은 생산을 나타냈다.
실시예 5: 이중 KO20 클론의 표현형 및 유전자형 분석
이중 KO20 클론이 가장 유망하였기 때문에, 이 클론의 추가의 분석을 수행하였다.
A - 표현형 분석
이 클론에서 GS를 코딩하는 유전자의 불활성화를 웨스턴 블롯에 의해 추가로 조사하였다.
이중 KO GS/DHODH를 위한 CHO 배양 배지를 제조하였다. 이는 37℃ 인큐베이터에 놓아둠으로써 37℃에서 대략 30분 동안 사전 가온된 6 mM 글루타민 및 5 mM 우리딘을 함유한 CD-CHO 배지였다. CHO 세포의 제조를 위해, 세포를 바이셀 XR로 계수하고, 사전-가온된 보충 배지 중에 희석하였다. 이어서, 세포를 115 rpm으로 회전하는 5mm 오비탈 진탕기 플랫폼 상에서 공기 중 8% CO2의 가습 분위기를 함유하는 37℃ 인큐베이터에서 인큐베이션하였다.
1천만개의 세포를 15 ml 튜브에 800g로 5분 동안 수거하였다. 상청액을 제거하고, 1 ml의 M-PER 완충제를 공급업체의 권장사항에 따라 사용하여 펠릿을 재현탁시켰다. 4℃에서 30분의 인큐베이션 후에, 새로운 원심분리를 1.5mL 에펜도르프 튜브에서 12000 rpm으로 15분 동안 수행하였다. 이어서, 웨스턴 블롯 검정을 위해 800μL의 상청액을 수집하였다. 상청액의 단백질 농도를 BCA 검정에 의해 결정하였다.
4.4 μg의 샘플을 SDS-PAGE 상에 로딩하였다. 아이블롯(iBlot)® 겔 전달 도구 (라이프 테크놀로지스(Life Technologies))를 사용하여 니트로셀룰로스 막 상에서의 단백질 전달에 의해 웨스턴 블롯 분석을 수행하였다. 니트로셀룰로스 막을 PBS-T 완충제 (12 mM 인산나트륨, pH 7.4, 137 mM NaCl, 2.7 mM KCl, 0.05% 트윈®20) 중 BSA와 5% 밀크 파우더의 믹스로 차단하였다. 이어서, 니트로셀룰로스 막을 1차 항체 (시그마(Sigma)로부터의 항 글루타민 신테타제 (G2781))와 함께 실온에서 1시간 동안 인큐베이션한 다음, HRP 접합된 항-토끼 2차 항체와 함께 실온에서 1시간 동안 인큐베이션하였다. 이어서, 에피토프를 함유하는 단백질을 웨스턴 블롯 검출을 위해 ECL 시약을 사용하여 가시화하였다.
글루타민 신테타제에 대한 예상 분자량 (~ 45 kDa)에 상응하는 밴드가 대조군 샘플 (야생형 CHO)에 대해서는 관찰되었고, 이중 KO20 클론으로부터의 샘플에 대해서는 관찰되지 않았다. 따라서, 이러한 웨스턴 블롯팅 분석은 이중 KO20 클론으로부터의 샘플에서 글루타민 신테타제의 부재를 입증하였다. 이러한 결과는 이 생산성 클론에서의 내인성 글루타민 신테타제 (GS) 유전자의 완전한 불활성화를 확인시켜 준다.
추가의 분석에서, 이 클론의 유전자형을 추가로 조사하였다. 목적은 GS의 게놈 서열에서 KO의 원인이 되는 돌연변이를 확인하는 것이다. CRISPR 절단의 표적 서열은 GS 유전자의 엑손 6 부근에, 특히 엑손 6과 엑손 7 사이의 인트론에 위치하였다.
관심 서열을 증폭시키기 위해, PCR 프라이머를 경계 엑손 상에서 인트론의 어느 한 측면으로부터 설계하였다.
게놈 DNA를 실시예 3, 파트 C에 기재된 바와 같이 이중 KO20 클론으로부터 추출하였다. 이는 150ng/μl로 98μl의 DNA를 수득하는 것을 허용한다.
PCR을 수행하고, PCR 생성물들을 아가로스 겔 전기영동 상에서 대조하였다. 예상 분자량은 879 bp였다. 본 발명자들은 예상 분자량 주위의 약한 밴드 및 주요한 보다 작은 밴드 (약 400-500 bp)를 관찰하였으며, 이는 이중 KO20 클론으로부터의 샘플 중 gDNA의 여러 집단을 나타낸다. 따라서, 수행된 PCR 증폭은 2가지 유형의 앰플리콘을 수득하도록 하였다.
이어서, 수득된 앰플리콘을 셔틀 벡터 내로 클로닝하였다. 박테리아 형질전환 후, 일부 콜로니를 배양한 다음, 플라스미드 DNA를 미니프렙에 의해 정제하였다. DNA 미니프렙 후에, 앰플리콘을 함유하는 플라스미드를 셔틀 벡터 내의 삽입 부위에 경계를 접하고 있는 프라이머와 함께 서열분석하였다.
수득된 서열을 GS 유전자의 이론적 완전한 서열과 정렬하였다.
가장 큰 앰플리콘은 엑손 6과 7 사이의 인트론의 존재에 상응하며, 여기서 이 인트론은 약 39bp 결실된다.
보다 짧은 앰플리콘은 엑손 6과 7 사이의 인트론의 완전한 결실에 상응한다.
이들 분석에 관하여, 본 발명자들은 이중 KO20 클론이 2개의 gDNA 집단 (1개는 인트론의 완전 결실을 갖고 1개는 인트론에서 39bp 결실을 가짐)을 갖는 GS에 대한 KO인 것으로 결론내렸다. GS를 코딩하는 유전자에서의 이들 변형은 GS 발현의 완전 불활성화로 이어진다.
SEQUENCE LISTING
<110> SANOFI
<120> Generation of a high producing recombinant Chinese hamster ovary
cell line for therapeutic protein production
<130> BEX 21P1358
<150> EP20306068.6
<151> 2020-09-21
<160> 36
<170> PatentIn version 3.5
<210> 1
<211> 1188
<212> DNA
<213> Cricetulus griseus
<400> 1
atggcttggc ggcagatgcg gaagagagcc ctggacgccg ctatcatcct gggaggcgga 60
ggcctgctgt tcacctctta cctgacagcc accggcgacg accacttcta cgccgagtac 120
ctgatgcctg ccctgcagag actgctggac cctgagtctg cccaccggct ggccatcaga 180
ttcacctccc tgggcctgct gcccagagcc accttccagg actccgacat gctggaagtg 240
cgggtgctgg gccacaagtt cagaaacccc gtgggaatcg ccgctggctt cgacaagcac 300
ggcgaggctg tggacggcct gtacaagctg ggcttcggct tcgtggaagt gggctccgtg 360
acaccccagc cccaggaagg caaccccaga cctagagtgt tccggctgcc tgaggaccag 420
gccgtgatca acagatacgg cttcaactcc cacggcctgt ccgtggtgga acaccggctg 480
agagccagac agcagaagca gaacaagctg accgccgacg gcctgcccct gggcatcaat 540
ctgggcaaga acaagacctc cgaggacgct gccgccgact acgtggaagg cgtgcgagtg 600
ctgggacctc tggccgatta cctggtcgtg aacgtgtcct cccccaacac cgctggcctg 660
agaagcctgc agggaaaggc cgagctgaga aggctgctgg ccaaggtgct gcaggaacgg 720
gacgctctga agggcgccca gaaacctgcc gtgctcgtga agatcgcccc tgacctgacc 780
gcccaggaca aagaggatat cgcctccgtg gccagagagc tgggcatcga cggactgatc 840
gtgaccaaca ccaccgtgtc tcggcctacc ggactgcagg gcgctctgag atctgagatg 900
ggcggcctgt ctggcaagcc tctgagggac ctgtccaccc agaccatcag agagatgtac 960
accctgaccc agggccggat ccccatcatt ggagtgggcg gagtgtcctc tggccaggac 1020
gccctggaaa agatccaggc tggcgcctct ctggtgcagc tgtataccgc cctgaccttt 1080
ctgggccctc ccgtggtggt gcgagtgaag agagaactgg aagccctgct gaaagagcgg 1140
ggcttcaaca ccgtgaccga ggccatcggc gctgaccaca gaagatga 1188
<210> 2
<211> 395
<212> PRT
<213> Cricetulus griseus
<400> 2
Met Ala Trp Arg Gln Met Arg Lys Arg Ala Leu Asp Ala Ala Ile Ile
1 5 10 15
Leu Gly Gly Gly Gly Leu Leu Phe Thr Ser Tyr Leu Thr Ala Thr Gly
20 25 30
Asp Asp His Phe Tyr Ala Glu Tyr Leu Met Pro Ala Leu Gln Arg Leu
35 40 45
Leu Asp Pro Glu Ser Ala His Arg Leu Ala Ile Arg Phe Thr Ser Leu
50 55 60
Gly Leu Leu Pro Arg Ala Thr Phe Gln Asp Ser Asp Met Leu Glu Val
65 70 75 80
Arg Val Leu Gly His Lys Phe Arg Asn Pro Val Gly Ile Ala Ala Gly
85 90 95
Phe Asp Lys His Gly Glu Ala Val Asp Gly Leu Tyr Lys Leu Gly Phe
100 105 110
Gly Phe Val Glu Val Gly Ser Val Thr Pro Gln Pro Gln Glu Gly Asn
115 120 125
Pro Arg Pro Arg Val Phe Arg Leu Pro Glu Asp Gln Ala Val Ile Asn
130 135 140
Arg Tyr Gly Phe Asn Ser His Gly Leu Ser Val Val Glu His Arg Leu
145 150 155 160
Arg Ala Arg Gln Gln Lys Gln Asn Lys Leu Thr Ala Asp Gly Leu Pro
165 170 175
Leu Gly Ile Asn Leu Gly Lys Asn Lys Thr Ser Glu Asp Ala Ala Ala
180 185 190
Asp Tyr Val Glu Gly Val Arg Val Leu Gly Pro Leu Ala Asp Tyr Leu
195 200 205
Val Val Asn Val Ser Ser Pro Asn Thr Ala Gly Leu Arg Ser Leu Gln
210 215 220
Gly Lys Ala Glu Leu Arg Arg Leu Leu Ala Lys Val Leu Gln Glu Arg
225 230 235 240
Asp Ala Leu Lys Gly Ala Gln Lys Pro Ala Val Leu Val Lys Ile Ala
245 250 255
Pro Asp Leu Thr Ala Gln Asp Lys Glu Asp Ile Ala Ser Val Ala Arg
260 265 270
Glu Leu Gly Ile Asp Gly Leu Ile Val Thr Asn Thr Thr Val Ser Arg
275 280 285
Pro Thr Gly Leu Gln Gly Ala Leu Arg Ser Glu Met Gly Gly Leu Ser
290 295 300
Gly Lys Pro Leu Arg Asp Leu Ser Thr Gln Thr Ile Arg Glu Met Tyr
305 310 315 320
Thr Leu Thr Gln Gly Arg Ile Pro Ile Ile Gly Val Gly Gly Val Ser
325 330 335
Ser Gly Gln Asp Ala Leu Glu Lys Ile Gln Ala Gly Ala Ser Leu Val
340 345 350
Gln Leu Tyr Thr Ala Leu Thr Phe Leu Gly Pro Pro Val Val Val Arg
355 360 365
Val Lys Arg Glu Leu Glu Ala Leu Leu Lys Glu Arg Gly Phe Asn Thr
370 375 380
Val Thr Glu Ala Ile Gly Ala Asp His Arg Arg
385 390 395
<210> 3
<211> 1188
<212> DNA
<213> Homo sapiens
<400> 3
atggcttggc ggcacctgaa gaagagggcc caggacgccg tgatcatcct gggaggcgga 60
ggcctgctgt tcgcctctta cctgatggct accggcgacg agcggttcta cgccgagcat 120
ctgatgccca cactgcaggg cctgctggac cctgagtctg cccatagact ggccgtgcgg 180
ttcacctccc tgggactgct gcctagagcc cggttccagg actccgacat gctggaagtg 240
cgggtgctgg gccacaagtt cagaaacccc gtgggaatcg ccgctggctt cgacaagcac 300
ggcgaggctg tggacggcct gtacaagatg ggcttcggct tcgtggaaat cggctccgtg 360
acccccaagc cccaggaagg caaccccaga cctcgggtgt tcagactgcc tgaggaccag 420
gctgtgatca acagatacgg cttcaactcc cacggcctgt ccgtggtgga acaccggctg 480
agagccagac agcagaagca ggccaagctg accgaggatg gcctgcctct gggagtgaac 540
ctgggcaaga acaagacctc cgtggacgcc gccgaggatt acgctgaagg cgtgcgagtg 600
ctgggacccc tggctgatta cctggtcgtg aacgtgtcct cccccaacac cgctggcctg 660
agatctctgc agggcaaggc cgagctgcgg agactgctga caaaggtgct gcaggaacgc 720
gacggcctgc ggagagtgca tagacctgcc gtgctcgtga agatcgcccc cgacctgacc 780
agccaggaca aagaggatat cgcctccgtc gtgaaagagc tgggcatcga cggactgatc 840
gtgaccaaca ccaccgtgtc taggcctgcc ggactgcagg gggctctgag atctgaaacc 900
ggcggactgt ccggcaagcc tctgagggat ctgtccaccc agaccatcag agagatgtac 960
gccctgaccc agggccgggt gccaatcatt ggagtgggcg gagtgtcctc cggccaggat 1020
gccctggaaa agatcagagc cggcgcttcc ctggtgcagc tgtacaccgc tctgaccttt 1080
tggggccctc ccgtcgtggg caaagtgaag agagagctgg aagccctgct gaaagagcag 1140
ggatttggcg gcgtgaccga tgccatcggc gctgaccaca gaagatga 1188
<210> 4
<211> 395
<212> PRT
<213> Homo sapiens
<400> 4
Met Ala Trp Arg His Leu Lys Lys Arg Ala Gln Asp Ala Val Ile Ile
1 5 10 15
Leu Gly Gly Gly Gly Leu Leu Phe Ala Ser Tyr Leu Met Ala Thr Gly
20 25 30
Asp Glu Arg Phe Tyr Ala Glu His Leu Met Pro Thr Leu Gln Gly Leu
35 40 45
Leu Asp Pro Glu Ser Ala His Arg Leu Ala Val Arg Phe Thr Ser Leu
50 55 60
Gly Leu Leu Pro Arg Ala Arg Phe Gln Asp Ser Asp Met Leu Glu Val
65 70 75 80
Arg Val Leu Gly His Lys Phe Arg Asn Pro Val Gly Ile Ala Ala Gly
85 90 95
Phe Asp Lys His Gly Glu Ala Val Asp Gly Leu Tyr Lys Met Gly Phe
100 105 110
Gly Phe Val Glu Ile Gly Ser Val Thr Pro Lys Pro Gln Glu Gly Asn
115 120 125
Pro Arg Pro Arg Val Phe Arg Leu Pro Glu Asp Gln Ala Val Ile Asn
130 135 140
Arg Tyr Gly Phe Asn Ser His Gly Leu Ser Val Val Glu His Arg Leu
145 150 155 160
Arg Ala Arg Gln Gln Lys Gln Ala Lys Leu Thr Glu Asp Gly Leu Pro
165 170 175
Leu Gly Val Asn Leu Gly Lys Asn Lys Thr Ser Val Asp Ala Ala Glu
180 185 190
Asp Tyr Ala Glu Gly Val Arg Val Leu Gly Pro Leu Ala Asp Tyr Leu
195 200 205
Val Val Asn Val Ser Ser Pro Asn Thr Ala Gly Leu Arg Ser Leu Gln
210 215 220
Gly Lys Ala Glu Leu Arg Arg Leu Leu Thr Lys Val Leu Gln Glu Arg
225 230 235 240
Asp Gly Leu Arg Arg Val His Arg Pro Ala Val Leu Val Lys Ile Ala
245 250 255
Pro Asp Leu Thr Ser Gln Asp Lys Glu Asp Ile Ala Ser Val Val Lys
260 265 270
Glu Leu Gly Ile Asp Gly Leu Ile Val Thr Asn Thr Thr Val Ser Arg
275 280 285
Pro Ala Gly Leu Gln Gly Ala Leu Arg Ser Glu Thr Gly Gly Leu Ser
290 295 300
Gly Lys Pro Leu Arg Asp Leu Ser Thr Gln Thr Ile Arg Glu Met Tyr
305 310 315 320
Ala Leu Thr Gln Gly Arg Val Pro Ile Ile Gly Val Gly Gly Val Ser
325 330 335
Ser Gly Gln Asp Ala Leu Glu Lys Ile Arg Ala Gly Ala Ser Leu Val
340 345 350
Gln Leu Tyr Thr Ala Leu Thr Phe Trp Gly Pro Pro Val Val Gly Lys
355 360 365
Val Lys Arg Glu Leu Glu Ala Leu Leu Lys Glu Gln Gly Phe Gly Gly
370 375 380
Val Thr Asp Ala Ile Gly Ala Asp His Arg Arg
385 390 395
<210> 5
<211> 1122
<212> DNA
<213> Homo sapiens
<400> 5
atgaccacct ccgcctccag ccacctgaac aagggcatca aacaggtgta catgagcctg 60
ccccagggcg agaaggtgca ggccatgtac atctggatcg acggcaccgg cgagggactg 120
cggtgcaaga ccagaaccct ggactccgag cctaagtgcg tggaagaact gcccgagtgg 180
aacttcgacg gctcctccac cctgcagtcc gagggctcca actccgacat gtacctggtg 240
cctgccgcca tgttccggga ccctttccgg aaggacccca acaagctggt gctgtgcgag 300
gtgttcaagt acaacagacg gcctgccgag acaaacctgc ggcatacctg caagcggatc 360
atggacatgg tgtccaacca gcacccttgg tttggcatgg aacaggagta caccctgatg 420
ggcaccgacg gccacccctt cggctggcct tctaacggct tccctggccc ccagggcccc 480
tactattgtg gcgtgggcgc cgaccgggcc tacggcagag atatcgtgga agcccactac 540
cgggcctgcc tgtacgccgg agtgaagatc gccggcacca acgccgaagt gatgcccgcc 600
cagtgggagt tccagatcgg cccttgcgag ggcatctcca tgggcgatca cctgtgggtg 660
gcccggttca tcctgcacag agtgtgcgag gacttcggcg tgatcgccac cttcgacccc 720
aagcccatcc ccggcaactg gaacggcgct ggctgccaca ccaacttctc caccaaggcc 780
atgcgggaag agaacggcct gaagtacatc gaggaagcca tcgagaagct gtccaagcgg 840
caccagtacc acatcagagc ctacgaccct aagggcggcc tggacaacgc cagaaggctg 900
accggctttc acgagacatc caacatcaac gacttctctg ccggcgtggc caacagatcc 960
gcctccatcc ggatccctag aaccgtgggc caggaaaaga agggctactt cgaggacaga 1020
cggccctccg ccaactgcga cccctttagc gtgaccgagg ccctgatccg gacctgcctg 1080
ctgaacgaga caggcgacga gcccttccag tacaagaact ga 1122
<210> 6
<211> 373
<212> PRT
<213> Homo sapiens
<400> 6
Met Thr Thr Ser Ala Ser Ser His Leu Asn Lys Gly Ile Lys Gln Val
1 5 10 15
Tyr Met Ser Leu Pro Gln Gly Glu Lys Val Gln Ala Met Tyr Ile Trp
20 25 30
Ile Asp Gly Thr Gly Glu Gly Leu Arg Cys Lys Thr Arg Thr Leu Asp
35 40 45
Ser Glu Pro Lys Cys Val Glu Glu Leu Pro Glu Trp Asn Phe Asp Gly
50 55 60
Ser Ser Thr Leu Gln Ser Glu Gly Ser Asn Ser Asp Met Tyr Leu Val
65 70 75 80
Pro Ala Ala Met Phe Arg Asp Pro Phe Arg Lys Asp Pro Asn Lys Leu
85 90 95
Val Leu Cys Glu Val Phe Lys Tyr Asn Arg Arg Pro Ala Glu Thr Asn
100 105 110
Leu Arg His Thr Cys Lys Arg Ile Met Asp Met Val Ser Asn Gln His
115 120 125
Pro Trp Phe Gly Met Glu Gln Glu Tyr Thr Leu Met Gly Thr Asp Gly
130 135 140
His Pro Phe Gly Trp Pro Ser Asn Gly Phe Pro Gly Pro Gln Gly Pro
145 150 155 160
Tyr Tyr Cys Gly Val Gly Ala Asp Arg Ala Tyr Gly Arg Asp Ile Val
165 170 175
Glu Ala His Tyr Arg Ala Cys Leu Tyr Ala Gly Val Lys Ile Ala Gly
180 185 190
Thr Asn Ala Glu Val Met Pro Ala Gln Trp Glu Phe Gln Ile Gly Pro
195 200 205
Cys Glu Gly Ile Ser Met Gly Asp His Leu Trp Val Ala Arg Phe Ile
210 215 220
Leu His Arg Val Cys Glu Asp Phe Gly Val Ile Ala Thr Phe Asp Pro
225 230 235 240
Lys Pro Ile Pro Gly Asn Trp Asn Gly Ala Gly Cys His Thr Asn Phe
245 250 255
Ser Thr Lys Ala Met Arg Glu Glu Asn Gly Leu Lys Tyr Ile Glu Glu
260 265 270
Ala Ile Glu Lys Leu Ser Lys Arg His Gln Tyr His Ile Arg Ala Tyr
275 280 285
Asp Pro Lys Gly Gly Leu Asp Asn Ala Arg Arg Leu Thr Gly Phe His
290 295 300
Glu Thr Ser Asn Ile Asn Asp Phe Ser Ala Gly Val Ala Asn Arg Ser
305 310 315 320
Ala Ser Ile Arg Ile Pro Arg Thr Val Gly Gln Glu Lys Lys Gly Tyr
325 330 335
Phe Glu Asp Arg Arg Pro Ser Ala Asn Cys Asp Pro Phe Ser Val Thr
340 345 350
Glu Ala Leu Ile Arg Thr Cys Leu Leu Asn Glu Thr Gly Asp Glu Pro
355 360 365
Phe Gln Tyr Lys Asn
370
<210> 7
<211> 1122
<212> DNA
<213> Canis lupus
<400> 7
atggccacct ccgcctccag ccacctgaac aagggcatca aacaggtgta catgagcctg 60
ccccagggcg agaaggtgca ggccatgtac atctggatcg acggcaccgg cgagggactg 120
cggtgcaaga ccagaaccct ggactccgag cccaagggcg tggaagaact gcccgagtgg 180
aacttcgacg gctcctccac cttccagtcc gagggctcca actccgacat gtacctggtg 240
cctgccgcca tgttccggga ccctttccgg aaggacccca acaagctggt gttctgcgag 300
gtgttcaagt acaaccggaa gcccgccgag acaaacctgc ggcatacctg caagcggatc 360
atggacatgg tgtccaacca gcacccttgg tttggcatgg aacaggagta caccctgatg 420
ggcaccgacg gccacccctt cggctggcct tctaacggct tccctggccc ccagggcccc 480
tactattgtg gcgtgggcgc cgacaaggcc tacggcagag acatcgtgga agcccactac 540
cgggcctgcc tgtacgccgg catcaagatc gctggcacca acgccgaagt gatgcccgcc 600
cagtgggagt tccagatcgg cccttgcgag ggcatcgaca tgggcgatca cctgtgggtg 660
gcccggttca tcctgcacag agtgtgcgag gacttcggcg tgatcgccac cttcgacccc 720
aagcccatcc ccggcaactg gaacggcgct ggctgccaca ccaacttctc caccaaggcc 780
atgcgggaag agaacggcct gaagtacatc gaggaatcca tcgagaagct gtccaagcgg 840
caccagtacc acatccgggc ctacgacccc aagggcggcc tggataacgc cagacggctg 900
accggcttcc acgagacatc caacatcaac gacttctctg ccggcgtggc caacagaggc 960
gcctccatcc ggatcccccg gaccgtgggc caggaaaaga agggctactt cgaggacaga 1020
cggccctccg ccaactgcga cccctttagc gtgaccgagg ccctgatccg gacctgcctg 1080
ctgaacgaga caggcgacga gcccttccag tacaagaact ga 1122
<210> 8
<211> 373
<212> PRT
<213> Canis lupus
<400> 8
Met Ala Thr Ser Ala Ser Ser His Leu Asn Lys Gly Ile Lys Gln Val
1 5 10 15
Tyr Met Ser Leu Pro Gln Gly Glu Lys Val Gln Ala Met Tyr Ile Trp
20 25 30
Ile Asp Gly Thr Gly Glu Gly Leu Arg Cys Lys Thr Arg Thr Leu Asp
35 40 45
Ser Glu Pro Lys Gly Val Glu Glu Leu Pro Glu Trp Asn Phe Asp Gly
50 55 60
Ser Ser Thr Phe Gln Ser Glu Gly Ser Asn Ser Asp Met Tyr Leu Val
65 70 75 80
Pro Ala Ala Met Phe Arg Asp Pro Phe Arg Lys Asp Pro Asn Lys Leu
85 90 95
Val Phe Cys Glu Val Phe Lys Tyr Asn Arg Lys Pro Ala Glu Thr Asn
100 105 110
Leu Arg His Thr Cys Lys Arg Ile Met Asp Met Val Ser Asn Gln His
115 120 125
Pro Trp Phe Gly Met Glu Gln Glu Tyr Thr Leu Met Gly Thr Asp Gly
130 135 140
His Pro Phe Gly Trp Pro Ser Asn Gly Phe Pro Gly Pro Gln Gly Pro
145 150 155 160
Tyr Tyr Cys Gly Val Gly Ala Asp Lys Ala Tyr Gly Arg Asp Ile Val
165 170 175
Glu Ala His Tyr Arg Ala Cys Leu Tyr Ala Gly Ile Lys Ile Ala Gly
180 185 190
Thr Asn Ala Glu Val Met Pro Ala Gln Trp Glu Phe Gln Ile Gly Pro
195 200 205
Cys Glu Gly Ile Asp Met Gly Asp His Leu Trp Val Ala Arg Phe Ile
210 215 220
Leu His Arg Val Cys Glu Asp Phe Gly Val Ile Ala Thr Phe Asp Pro
225 230 235 240
Lys Pro Ile Pro Gly Asn Trp Asn Gly Ala Gly Cys His Thr Asn Phe
245 250 255
Ser Thr Lys Ala Met Arg Glu Glu Asn Gly Leu Lys Tyr Ile Glu Glu
260 265 270
Ser Ile Glu Lys Leu Ser Lys Arg His Gln Tyr His Ile Arg Ala Tyr
275 280 285
Asp Pro Lys Gly Gly Leu Asp Asn Ala Arg Arg Leu Thr Gly Phe His
290 295 300
Glu Thr Ser Asn Ile Asn Asp Phe Ser Ala Gly Val Ala Asn Arg Gly
305 310 315 320
Ala Ser Ile Arg Ile Pro Arg Thr Val Gly Gln Glu Lys Lys Gly Tyr
325 330 335
Phe Glu Asp Arg Arg Pro Ser Ala Asn Cys Asp Pro Phe Ser Val Thr
340 345 350
Glu Ala Leu Ile Arg Thr Cys Leu Leu Asn Glu Thr Gly Asp Glu Pro
355 360 365
Phe Gln Tyr Lys Asn
370
<210> 9
<211> 373
<212> PRT
<213> Cricetulus griseus
<400> 9
Met Ala Thr Ser Ala Ser Ser His Leu Asn Lys Gly Ile Lys Gln Met
1 5 10 15
Tyr Met Ser Leu Pro Gln Gly Glu Lys Val Gln Ala Met Tyr Ile Trp
20 25 30
Val Asp Gly Thr Gly Glu Gly Leu Arg Cys Lys Thr Arg Thr Leu Asp
35 40 45
Cys Glu Pro Lys Cys Val Glu Glu Leu Pro Glu Trp Asn Phe Asp Gly
50 55 60
Ser Ser Thr Phe Gln Ser Glu Ser Ser Asn Ser Asp Met Tyr Leu Ser
65 70 75 80
Pro Val Ala Met Phe Arg Asp Pro Phe Arg Lys Glu Pro Asn Lys Leu
85 90 95
Val Phe Cys Glu Val Phe Lys Tyr Asn Gln Lys Pro Ala Glu Thr Asn
100 105 110
Leu Arg His Thr Cys Lys Arg Ile Met Asp Met Val Ser Asn Gln His
115 120 125
Pro Trp Phe Gly Met Glu Gln Glu Tyr Thr Leu Leu Gly Thr Asp Gly
130 135 140
His Pro Phe Gly Trp Pro Ser Asp Gly Phe Pro Gly Pro Gln Gly Leu
145 150 155 160
Tyr Tyr Cys Gly Val Gly Ala Asp Lys Ala Tyr Arg Arg Asp Ile Met
165 170 175
Glu Ala His Tyr Arg Ala Cys Leu Tyr Ala Gly Val Lys Ile Thr Gly
180 185 190
Thr Tyr Ala Glu Val Lys His Ala Gln Trp Glu Phe Gln Ile Gly Pro
195 200 205
Cys Glu Gly Ile Arg Met Gly Asp His Leu Trp Val Ala Arg Phe Ile
210 215 220
Leu His Arg Val Cys Lys Asp Phe Gly Val Ile Ala Thr Phe Asp Ser
225 230 235 240
Lys Pro Ile Pro Gly Asn Trp Asn Gly Ala Gly Cys His Thr Asn Phe
245 250 255
Ser Thr Lys Thr Met Arg Glu Glu Asn Gly Leu Lys His Ile Lys Glu
260 265 270
Ala Ile Glu Lys Leu Ser Lys Arg His Arg Tyr His Ile Arg Ala Tyr
275 280 285
Asp Pro Lys Gly Gly Leu Asp Asn Ala Arg Arg Leu Thr Gly Phe His
290 295 300
Lys Thr Ser Asn Ile Asn Asp Phe Ser Ala Gly Val Ala Asp Arg Ser
305 310 315 320
Ala Ser Ile Arg Ile Pro Arg Thr Val Gly Gln Glu Lys Lys Gly Tyr
325 330 335
Phe Glu Ala Arg Cys Pro Ser Ala Asn Cys Asp Pro Phe Ala Val Thr
340 345 350
Glu Ala Ile Val Arg Thr Cys Leu Leu Asn Glu Thr Gly Asp Gln Pro
355 360 365
Phe Gln Tyr Lys Asn
370
<210> 10
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> corresponding piece of DNA for generating DHODH gRNA
<400> 10
ggatgcagcc atcatccttg 20
<210> 11
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide used for obtaining DHODH gRNA (Sequence1')
<400> 11
ggatgcagcc atcatccttg gtttt 25
<210> 12
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide used for obtaining DHODH gRNA (Sequence1')
<400> 12
caaggatgat ggctgcatcc cggtg 25
<210> 13
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide used for obtaining DHODH gRNA (Sequence2')
<400> 13
gatgcagcca tcatccttgg gtttt 25
<210> 14
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide used for obtaining DHODH gRNA (Sequence2')
<400> 14
ccaaggatga tggctgcatc cggtg 25
<210> 15
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide used for obtaining DHODH gRNA (Sequence3')
<400> 15
gcagccatca tccttggggg gtttt 25
<210> 16
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide used for obtaining DHODH gRNA (Sequence3')
<400> 16
cccccaagga tgatggctgc cggtg 25
<210> 17
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide used for obtaining DHODH gRNA (Sequence4')
<400> 17
gccatcatcc ttgggggagg gtttt 25
<210> 18
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide used for obtaining DHODH gRNA (Sequence4')
<400> 18
cctcccccaa ggatgatggc cggtg 25
<210> 19
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide used for obtaining DHODH gRNA (Sequence5')
<400> 19
gctattcgct tcacgtccct gtttt 25
<210> 20
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide used for obtaining DHODH gRNA (Sequence5')
<400> 20
agggacgtga agcgaatagc cggtg 25
<210> 21
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide used for obtaining DHODH gRNA (Sequence6')
<400> 21
gcctctacaa actgggcttt gtttt 25
<210> 22
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide used for obtaining DHODH gRNA (Sequence6')
<400> 22
aaagcccagt ttgtagaggc cggtg 25
<210> 23
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide used for obtaining DHODH gRNA (Sequence7')
<400> 23
ggctttgggt ttgtcgaggt gtttt 25
<210> 24
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide used for obtaining DHODH gRNA (Sequence7')
<400> 24
acctcgacaa acccaaagcc cggtg 25
<210> 25
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide used for obtaining DHODH gRNA (Sequence8')
<400> 25
gctggtctga ggagcctaca gtttt 25
<210> 26
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide used for obtaining DHODH gRNA (Sequence8')
<400> 26
tgtaggctcc tcagaccagc cggtg 25
<210> 27
<211> 14437
<212> DNA
<213> Cricetulus griseus
<220>
<221> misc_feature
<222> (1992)..(2015)
<223> target of plasmids pBH6840 KO DHODH SEQ1 and pBH6841 KO DHODH
SEQ4
<220>
<221> misc_feature
<222> (2129)..(2147)
<223> target of plasmids pBH6842 KO DHODH SEQ5
<220>
<221> misc_feature
<222> (4015)..(4047)
<223> target of plasmids pBH6843 KO DHODH SEQ7
<400> 27
ccgagcccac attctccaat ggagtggagg cagaggcggg cccagtggca gaaggagcat 60
ggcgtggaga cagatgagag tgagtctgtt gcgggtgctt acgcttgttc ggaaaacagg 120
ttgggagtgg acgaggctgg gagattgaaa ggctggggcc cttgcagtgt gggctgcatg 180
tgtgctcagc taggggcatg caaaaagcaa gcgtgctggg cagaggctga gttgattgtg 240
agagatcgcg ggcttttttt tttttttttt tcttaaactg agctagtatc gggcccctgt 300
gagcacatgg tggctagcat tatggaaagg atccagggcg gaatgaaata agacacgcag 360
ccacccttcc agataaagtg tggttagaat gggagtcccg tgcgaagagt ccgtagattg 420
tgtccctggc ttgggaaaga gtgcgcagat attgtttctt gacacgtgag aatttctccc 480
tccagaggag ggagaatgaa tacttggttt gctgtacagg caaatctgat cacatcctct 540
acttccttat ttagtggaca aatcccatta aaaatataat cactgattgt ggtgaggggt 600
tgtgctgtga catgggagct ggaaccgaac tctgcactta accactgaac catctccagc 660
ccccaaatct gtattttggc tgacaccccc acatttctcc taccttactt taagaaatgc 720
tttcctttta gttccaaaca gacctgtctt cctctacccc attctctggc ccttctcatt 780
ggcttcagcc acctagagat tccttctcca gctgcttcct cctctttagc ttttgtgtct 840
ccttggaaag tcaaccttag cctggaagga gcctcaagat ccttccatta cttatctctt 900
cgtgtcagtt ttcttgggtt tgtgtttaca tggccattaa tttctctctt cattagatag 960
attacacact tctgaaggac agggacctgg tgtggtttgc ttgcctttgg tgaaggattg 1020
aatgaatgca ttagccactt ggcatctggc agtgataatt atcaaaaagc attgtgagcc 1080
tcctttgaac tagggtagtg attctctacc cagagtgtga agctatgttt gtattacaac 1140
cacttttata ttatacacat aggacatttc aggccagtaa cttttctagg tataatttta 1200
aaatatagac accatgtcct aactacagta taaaggagaa atgaaaacat gtatttcagt 1260
atgtagaagt cagaacacag ttcacctaca tagatggcca ggtgtttaag cctctattta 1320
gaaggtgtgc gttggtatac aaacagcact gtataccctt tctggtgggg ttttaggaac 1380
agtgaccaag tcttagtaat gttttgtgca aactgtacaa ttgtccttaa attacaaggt 1440
atctttattt ctgtaaaagt caccctgtac atgtaaacca tgtggttgtg tggtgaacta 1500
tagcttgctt cttgcctctc ctattatcct cagataatag gaagttttcc tcacataaat 1560
agcaatagca agttcaaaca tcatacagta catagggaaa ctagtgtgtt agctttaatt 1620
aaagaagaat attgacagga ctgatttctc cacaccaaat gtattagcat cattccctca 1680
ttaactagta aaaattttcc catgtgaccc ctagggggca gtactgcctg tcttgaaaat 1740
tccctgcctg gtccttagga aaatattcag ggctagaacc catgtaagca gtgtaggtac 1800
tgcatctacc tttgtagatg tgtaagtggg caggatatga agggggacag tgtgagcagg 1860
gaaggactgt cactttgtgt agttgttatg tcctctgggc aggtgtgaag ggtcaggaag 1920
ggtactgcag gctggtctga tggggttccc catggggcct tttctctccc ccactagaag 1980
cgggccctgg atgcagccat catccttggg ggaggaggac ttctcttcac ctcttacctg 2040
acagccacgg gcgatgacca tttctatgct gaatatctga tgccggccct gcagaggctg 2100
ctagacccag aatcagccca ccggctagct attcgcttca cgtccctggg gctccttcct 2160
cgagctacat ttcaggactc tgacatgctg gtaggtcccc cggtcaccct gtgttacatt 2220
tgtgtttgta ggggaggtca catccttcag cacttcggta ttcctctgct gccactgggc 2280
ttttgaaaac cagagctgca ggttcacaag cagctgggac ctggagccca gcccgaggaa 2340
gggacttttc ttctgtgtta caccctgtac ttacagaaca gcactcagca tatagccggt 2400
gcttacagct ttaatcctca cagataccct ttgagggagg tcctatctca tctccatcta 2460
caaatcagga aactgaggta cagactaagt aagtgacttg cccaaggtca cacagctggg 2520
aggtggcagg accaggattc aaacctatag agtttgactc cagtgtccaa ccttggtcac 2580
tggcctgcct tgctgagatc cctctgctga acaggaacat cttctggagt cattaagcag 2640
ctactggatg caggggacag ggtcagcagg gaagggctgt cacttgtaga tactgtgtcc 2700
tctgtctgga taggtgtgaa gtctcagagt gggtgctgca gcctggcctg atgggtccgt 2760
cctttccccc catcagaagc agaccctggc tgtagtcatc accctgaggg gtggaggact 2820
taagtcctag gcaacctcct gccccagcca cattcagcca caactcactc ctgtggccca 2880
cctggcacca tttataacag agccagtgtg gcccttctac tgtctctctg aatgctcccc 2940
ttttgagatg ggcctaggtt gtccaggttg gtctcaaact tggggtccca aatgatttca 3000
gaatctcagc ttcctgagta agtgggatca cacagtatgc accactgtgc gcagtggtcc 3060
ctgttccccg atagccaggc cggttgatac tcttagcccg attcaccttt ctcggttttc 3120
taagtcttca gttttctatc atgacgagac tctcctgggg gagggggatg gctgggtgct 3180
tctggaatgc ttggctgacc cggtctcctg attgaccggt tttaccataa tctcaaagaa 3240
gcctgacatc aacaccccag gctctgtcac acagccaggg atgagaactg gcttgagggt 3300
agcctcaagg aaggcctgtt ctagctgaac ttctcgcctc atggttatga agtgctgcgt 3360
gcacattttt accttccttg tgctcattct cgtctcctgt ggattttgag agcatgtagc 3420
tttccccttg gggactggcc tctaagagct cactggcagc accattgcct gccagtgtcc 3480
acccttcagc tctccatggt gcccatgggc tggcttcttg acagttatgg aggaagggcc 3540
agctagggct tgtatgctag gctggctaca ggctacctca aggctggtga caccaaggac 3600
tccttctcct gcccaggttg agtagatagg aagatacaca gtaattgtgc aagacagcac 3660
ctgtctcctc ttcacttgtg gtgggacact atctttctct ccccactgcc ttgagacccc 3720
ctggtgacag actccagcag acatcagaag cacctgcaga atgctgatgc agatagatac 3780
cccagggtgt ccttcctccc aaagatccct attttctggg cccagtgatg cttagcaagc 3840
tccaggggaa ttcttataca gtatgctggg atccctgctg tgagaaccac ttggtatagc 3900
tgcttatacc tctgacctgt ctccttccca ggaagtgaga gtcctgggcc ataaattccg 3960
aaatccggta gggattgctg cgggatttga caagcacggg gaagctgtag atggcctcta 4020
caaactgggc tttgggtttg tcgaggtagg aagtgtgact ccccagcctc aggaaggaaa 4080
ccccagaccc agagtgttcc gcctcccgga ggaccaagct gtcattaaca ggtaggtggt 4140
ggctcaatgt catagggaca tctcctcccc tgctgggatc tctgagatgg aacctgtttt 4200
gtgcttttct catatgatca gtggacagtc tgtcctttgg gatagtcagg agcacctttg 4260
aacacctgtt gtgtactagg cagctctcgc cccaaccttg ggaaacagct gttaggattt 4320
taccaggtat tcccactgag gctctgagag ctggtgctgg ttgcaaagaa cagcttggga 4380
aggcttgggc tgttgggctt cagtgtgagc ttttttacat tgttgctcta ttgcctttgt 4440
ccaatgttgg ctaacaggaa tataatgatc tcacatgtaa tttgaaatat tctaatgatg 4500
cattaaaaac tagtgaactt gataatacat ttataattat tatattttta attattatga 4560
tttaattata aacagtgtgt tctaaagtca ttttaacctg cagtcaatgt aaaaatcatt 4620
ggttaactat cgtcctcttt ttattggttt ccggtccccc aatgccttta cttctggttc 4680
ctctcacttg gccagggctg gtggccacaa gcttcagcag cgttggtact gtacaggtga 4740
cccttgcttt caatgaacag ggacatggta ttcaaatgta cagctgctct taggaggaga 4800
atccttcgac tgtatgaagc cttgcggttt gttgttctgt atagttagta taactgcaaa 4860
gggaagacct tcgtactttt tgctaggaga tttttggaga acctccttgt ggggattttg 4920
gcaggcctgt ggcagtgctt cctactgctt gtttcaggaa actgatttac aagtcataga 4980
tctttctgtt acattacagg cagggactga tgtctttagg actggccaga caaaatactt 5040
gtgtttctga tttggctgtt acaagtgact tcgggtctta ggatgatggt acttgggaca 5100
gggagtggtg agggacaggc acctgtgctc ttgggcatgt gcgaacttag ccttcttgct 5160
catatacaca gtgtgtgttc agtataggca tgctaacgga tgggtattta cacctgcaga 5220
cccacatgcc acaatccatg cagtgttgct ctggctgcaa gcaacaaagt gatgtaacca 5280
gatctcattt gttatcattc ttgtcactag cacaaaataa ctgacagcag gcagcttaag 5340
gaatggggtc aggtattttg gctcacagtt tgaggggaca cgccctcccg gtggcaggag 5400
cctgaggcag agggtcactc tgtacctaca gtgaggaagc agcaagggaa ggatgctggt 5460
gcttgggtct ctttctccgt cttgctcagc tggggtgtga atccatggtg ctgcccatgt 5520
ttgcggtggg tcttccctgc tccattcaac cttcccagaa acagtcttcc agacacacaa 5580
caggtgtgtt tccatggtga ctctaagtca catctagttg acaatgaagc ataaccagtg 5640
gtgagagcat ggaaatggtc tcaggtacgt tttccaaact gccacctttt aattccaccc 5700
cttacctgtg ggtttatgtg ctccaggtac ggattcaaca gccacgggct ctcagtggtg 5760
gaacacaggc tacgggccag acagcagaag cagaacaagc tcactgcagg taaactcagg 5820
tgttgtggga gggacttact aactctatta caaagaaaca tggggagggc atgggattca 5880
gcaataagaa acaaatgagc aaacaattaa aaccccacag aacaactcag gggattgtcc 5940
agcttctacc acagcctcaa aggtctcaac cagatggcat aattcagcaa aaccttgctg 6000
gtctctggca tccatggaac ctgaattgtg tcttaactta ggggcttgaa gatcagcaga 6060
gagcatgtgt ggagctaaga tgcgccccga gttcatcttc ccacatcccg ccctgctgct 6120
gtccttctgt tcactgtgta aatagtgtgt attagttctg gaagagctac agaagagaat 6180
agagttgtca cactcctgtc cttccactca ggggaccagc tgtcctcaaa tctcacttcg 6240
gaaacaacct ttgcttttgg tggattctca tggagacgct ccagtttgtc ctctgtggtc 6300
tgcatggctc tctgaagtgc attttggggt caaagccctg ggtggtggcc cccctcccca 6360
tgtctccctg tgtggcttct gcagtccatg gagatttttc tcctttgcct ctggaatgtc 6420
tttcaggagg tcttagtctc atttgatgtc cccatagtgt gacaattaag ccaaggactt 6480
ctgcatttat ttgaggagct aaggaagaga gggctgaagc atttgacgag tttagagggt 6540
gggaacagga aatgacaatg tttaaaaaaa cccctggttt tgacggaacc gggtctgcca 6600
gccctgtaga accttgaaca caatgtttgt ggtttgtggc gttctcctgc ctcctgcctt 6660
ccgtttcttc gttttaatgc cttctgtggg ctaggtttat tgccattgtc ctgtgtccac 6720
ccttcatcct cattctgtgc cctcacagtc actggagtga ggccaagttc tgtgtctttg 6780
ccctgcctac atgtgtctgc tgacagctag cagcctcata gaaacttttc atcagcacca 6840
tgcctaggaa ccctagtgga tagaagagac tgtgctttgt gtaaagtgta gttcagcctt 6900
cctgactcca gaactgtgac tgtgggcagg tgaccactaa tgaaaggctc agttgcctct 6960
tggaagccat actctcaatc cagtttactt gtgctaaagc ttacagtgat cctggcttgc 7020
tgggtgctag acttgaagct ttgagacctt gttctgtata tagtctaatc cctggctcca 7080
cccagcccac ttaggaaatt agttacacaa atcttacttt taagttgatg acccagaaga 7140
tgacgggttg tgagagatgg actgtgagaa gggggctagc aatacagtgg gggatgttgc 7200
ccgtgtcctc cctggcctgg tatgggtgag ctgacttggt gttctaggtc tggctggatt 7260
ggcagatgga cagcagcctg ggccactgac atactaggag ttgtaagaaa gttgagttgt 7320
aataaagatg aatccaggaa actcctttct gccaaagaga acatgagtct gaaagagcat 7380
ttttctagag gcttggcctt ttgagagtga cagggggcag gtgtgagtaa ttacacccag 7440
gccccaggag tgtcttgagg ctacagagat gtatcatcac cctaattata agttcttttc 7500
tcagagaaca agaaagattt attacacact tccatctact ttttaggcat gatagttgaa 7560
aacatttcct agtgttttcc tgtgtagctc aggctggcct cagacttaca gcaatcctcc 7620
tgcagactaa atttccatgt gtggcctcca gtgttttata cttttgtttt taatcatttc 7680
acatacagtc ccttgaccaa ggctcatgag attcaggttg ttcttgctga catgcccatc 7740
aatacctgcc tactctctct tttgttatct ctcaaaccac tgatctgtga atatagcaag 7800
tgtcattggg agtcatttta ttgctacata cttcaagaag agcagtagta tttgtttttt 7860
tccccatgtc cctgatttgt ctggactcag atccttggcc acccatgcag tcagtgttgg 7920
ggatgggttc catctcatgg attgggcctt aaatacaatc agattctggt tggttactcc 7980
cgcagctttg tgctactgtt tcactagtgc atccagggca ggtcatcatt gtagatcaaa 8040
agatgtgtag cggggttggt gtttaccttt ctcctttggt aacatgcaga atacctccca 8100
gtaccatgga caccaccaga gggatgaagg ctgtaggtag gcaccagctc gacttctccc 8160
tatttaataa cttgtgtagg tgttgtcttt agcaatagag ccttgtcagt tttcagagag 8220
caaccaatat ccttgacaat agcctgggtt gtttgggtat tctcatgggg cccctttggc 8280
caacaacttc tttgaaagtc tggtcaaatt cttcactaaa accatctggc actgggcatt 8340
ttttggttgg gaggctttta tgactgcttc tattttacta ggggttataa gtttgtttac 8400
attgcttatc cgatcttgat ttaactttag tagatggtat gtatcaagaa aattattcat 8460
ttattttcaa ttttccattt aggtagagta taggttttta aaacacatcc ctatgattct 8520
ttggatttcc ttggtgtctg ttgttatgtc actcttttca tctctaattt tgttaatttg 8580
gatctttcct ctttgccttt taattaattt ggctaagggt ttgtcaatct tactggtttt 8640
ctcaaagaac caactcttcg tttcattgat tctttgcatt atttttgtct gtttctattt 8700
cattgatttc agccctgagt ttgattattt cctgccatct actcctcctg ggtgtgactt 8760
cttgttgttc tagagctttc aggtgtgcta gtatgaaatc tctctaattt atgtaggcac 8820
ttagtgctac ataaagtttt gggtttttgt tttgttttga cctatttttc attcagtagt 8880
gagttgttca gtttcagttg ttcagtttcc atgagtttgt aagctttctg ttgtttttgt 8940
aggtgttgat attcagcttt aatctgtggt ggtatgatag ggtattattt cagttttctt 9000
gtatcttttg agacttgctt tatggcctag tatatggtca gttttggaga aagttccatg 9060
aggtgctgag aagaaacgtt ttgtgtttgg gtgaaatgtt ctataaatta ggtccatttg 9120
gtttaacaca tcatttagct ccatcatttc tttgttcagt ttttgtctgg atgacctgtc 9180
tattgtcgag agttggggag tatcaaagta tcccactatg tgtgtgtgtg tgcggagggg 9240
tcaatatgtg atttaagcta tagtagagtt tcttttatga acttggatgc ctttgtgctt 9300
ggtgcataga tgtttagaat ttcaatatcc tcttggtggg tttttccttt gatgagtatg 9360
tagtttcctt ccctatctat ctcttgatta gatttgattt gaaatctatt ctgtcatata 9420
ttaaaatggc ttcacccatt tgctttcttg tccatttgct tggaatatct ttttccatcc 9480
ttttactctg aggtgatatc tatccttgat gttaaagtat gtttcttgga ttcagttaaa 9540
gaatgaatcc tatttttgaa cccaattttt tagtctgtgt cttatttatt gggaaattga 9600
ggccactgat atcagtgttt gttgattcct gttatattat tgttatggcg taggcccctt 9660
cccttttgat ttgctggtct gagattattt attcaggctg aagttttcct tgtagtacct 9720
tctatcaagc tggatttgta gacagaaacc acttaagttt cattttattg tagattgtca 9780
ttctttcttc atctctgtga ttaaatgttt tgctggctat agtagtctgg gctggcatct 9840
gtggtagaat gtctgcccag gacctttgac ttttagagtc tcgattgaag tcaggggtta 9900
ttctaatagg tttgtctgcc gttatatgtt atctggtctt tctctattgt ggcttttggt 9960
attctttctt tgttctgtac attctgtttt ttgattatta tgtgttgtgg ggaatttatt 10020
tttggcccag tccgtttggt gttctatttg tttcttatac catgataggc acttccttct 10080
ttaggttagg taacttttca tctgtgattt tgttgaaaat attttctgtg cctttgacct 10140
gggtttcttc tccttttgct atccctgtta cttatagatt tttggtgttt tcatagtatc 10200
ctagatttcc tggatgtttt gtgcctggat tttgttttct ttcttttttt gtagatttaa 10260
cattttcttt gactgcagta tccttgtctc ctatcttgtc ctcagtgctt gagactctgt 10320
cttccatttc ttgtatgatt ttggtgaggc ttgcttctaa gatttctgtt ctagttccta 10380
aatttttcat ttccagcttt acctcaattt gggttttctt tagcaattcc atttcctctt 10440
tcatgtgttg aacaattttc ttcatttcat tgcactgttt gtgttttcat taatgggttt 10500
attcatatct tctttaggga ccttgaacat attcataata gctattctga gagccttgtc 10560
ttatgcttcc ctgtattgca tttctcggag cctgctgtgg tagggttgct gggctctagt 10620
ggagacatgt cgttctggct gttactgggt ttttacactg gtgtctaggc gactgggttt 10680
gagaagattg taattctagg tgctgatatc tggtcttgtt tttgttgggg tgatgttcag 10740
ttccttggtt tctgttgccc ccccccctca gggggggtgt ggtaactgga ttggttgcct 10800
ggtagggaat gcttctgaga tcctgccaga accctgccac tggcagtctt gggtagaaag 10860
tgtttctagg tgttgggagc tgacactaat gattgaggat gggttagaag cagtggtggc 10920
gggagagtcc acaggaggag gagagctggg tgtgccacca gggtctgcac agaggcctgg 10980
gaatgagaac agagatgaag gtgaggcctc agcaggtagt ctgctacaag gttgggataa 11040
ggctgggaga ttggaacttg gggacaggag ggagagtgaa gatcgcagac ccatcccctg 11100
gccaggtggg ggaagcctgg aggagaagat ctgtgtgatc tgctggaaat gggtccctta 11160
gtaacttctt gaagtttctt tgattttgag gctgctgttg ggggtcccct gtatgccaag 11220
catgtggtat atcactgaga tagaatctcc atagccctgc ttcttttttg agactgggtc 11280
tcatatcggc caggttggcc ttgaactagc tatgttgacc ttgaactttt ccttacctat 11340
acctgagaac tgggattaca agtgcccatc acacccagct tcctattgtt tttgcttttt 11400
tcctagtatt taagcttctg gcttccccat taaaatttaa aagatgaaag gcttagtaca 11460
cgggaagcat ccttgaaggt gcacacactt gccatataga gaggatgaag tggttctaag 11520
tcatcaggca gcagccccag gatcagacag ttcacattct ccatcatctg gttcagggga 11580
gccccacctg tactctgaat gttgcctggg aaactgtggg gacacactct tgatatttac 11640
agatgggctg cctctgggaa taaacctggg gaagaataag acttcggagg atgctgctgc 11700
agactatgta gagggtgttc gtgtcctggg ccccttggct gactacctgg tggtgaatgt 11760
gtccagtccc aacactgctg gtctgaggag cctacaggga aaggctgagc tgcgccgcct 11820
gctggccaag gtgtgtcatt acaccatcac atgcctgttg tccttactcc ttttcattct 11880
tcaggtgaag attcaggaca actgaggaga aactgttctt cacagctggc ctaggagccc 11940
tcatcacaca ttttccaagt accctctcat gtctcacagc cccggtcata cacaatagac 12000
agttcactgc tttaaaacca caggcaagca gagcagagca ggcggggctc ccatgtatca 12060
ctctgtcccc agaactgtga atgctcagca cttgtgacac acctccttgt ttgttttcag 12120
gaacaaaatc aaaacccttg agcagttatc tcggcggggg gtgcgggggt gggggaattg 12180
ctggtgcttt agttgacctt aggtgaaaat gctggcctgc actgcggggc tatgggctgg 12240
gtccccatct ctggcttgtc aacctaggtg ctgcaggaga gggacgcttt gaagggagcg 12300
cagaagccag cagtgctggt gaagatcgcc cccgacctca cggcccagga caaggaggac 12360
attgccagtg tggcgagaga ggtttgagtt ggggtggtcc agggcagggt gggggtagcc 12420
ttcatcgtcc actgctgctg ggataacaca gaagggcatg attggtgact tcctctgtgt 12480
gaagtggaca gctggttgat tgtctgtcat tgtatagttc atctggtagc aaacagtgag 12540
tttgaaaatg tgtttggtga gtctttttct tgcttctgat ctgtcttcat ccagaaagtc 12600
tgaggcctgt gctagtctct gccagtctca cctgggactt agaatggtgt ctgtcccttt 12660
ccagcttgtg taaacaccag gcttctctgg ctaaaaaggt agtaggaaca cagtctgctg 12720
ttctggactt cagtcttgtt ctactgtgta ctccctgaga tactcacaga cagcttgttc 12780
taagggtcaa actctgtgta ggcactgtga tgggttcagc aggagatgct gctgtgtctt 12840
cagcattgag aggctaattc tgatggcttc tccaatcaag atgtaggtga ggcctgtgag 12900
ggtcttgctc tgcagagctg gcccctggcc tggtggctgc ttcaatcctc aaaagacagt 12960
ttccttgagt acttcagatc catggcttaa ggctcttttt ctgtcttgtg ctgcagctgg 13020
gcattgatgg attaattgtc acaaacacca cagtgagtcg cccgactggc ctccaaggtg 13080
ctctgcgttc tgagatggga ggactgagcg ggaagccact ccgagatctg tcgacccaga 13140
ccatccggga gatgtacacc ctcactcaag gtaaggcttt tttgtttgtt tgtttgaggc 13200
aggatttctc tgtttaacac ctctggctgt cctggaactc acttggtaga ccaggctggc 13260
ctggaactca cagcttccct agtgctggga ttaaaggcat gtgccaccat tgcctggcta 13320
aggcaagact tctttggaca aatgtgaggt cctggatctt ccctcattca ctgtgtttgc 13380
tgagaactct ggttctgccc tcatcggctg tgtttgctgg gactgaggcc tgatggagcc 13440
ctgggtcttt agccctccct tcccggcctt gctatgtgct tctctccagg caggattccc 13500
attatcgggg ttggtggtgt gagcagtggg caagatgcgc tggagaagat ccaggcaggg 13560
gcctccctgg tgcagctgta cacggccctc accttcctgg ggccacccgt cgtggtcagg 13620
gtcaagcgtg agctggaggc acttctaaag tgagtagggt tcgatgcagc tgagacgtag 13680
aaagtgacac ttgtcatcag tctattgtgt actcccagag ggccggaggg aacactgagg 13740
gcatggtggg acgatttctc tgctgcagct ttggccaagg acaaacagtg ccagaggaat 13800
tcagaatgct tctgaggcag ggctcattac aaggcaggac ttgccacttg cccaggggct 13860
gggcatggag gatgaagtag taatttacat tgactcagtg tctggaagct gcaggttata 13920
aagtcacttc ccttcctgca cagaaggcct ggctgtacat atgtgcaggg gcctgggtga 13980
gggcagagta gcagtggttg taaggtgtgt tgggtgggac ggtgtggtaa gcggtgtgct 14040
catggtgagt gtgggcttcc ttaggacagg ctatttgttt tctgtccaga gagcggggtt 14100
ttaacacagt cacagaagcc attggagcag atcatcggag gtgacggttc ctgccagatg 14160
ccccatccag aacgtgccca ccaactcaag caagccttgt ggctgcatca taagaggaag 14220
atctgtctca agctatgtcc cttgactgtg tgacctggct ggactgcata agccagtcac 14280
ggttatcact agacagtaaa ggctttctct aatgagacca tgaactctac agtcactttc 14340
tggatctaag tcctgggatc cctcagtatt ataaggacat tggctctttg ggaggaaaaa 14400
tcatggagaa aataaagcca tttcaatctg ttttcaa 14437
<210> 28
<211> 395
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid sequence of human DHODH G202A
<400> 28
Met Ala Trp Arg His Leu Lys Lys Arg Ala Gln Asp Ala Val Ile Ile
1 5 10 15
Leu Gly Gly Gly Gly Leu Leu Phe Ala Ser Tyr Leu Met Ala Thr Gly
20 25 30
Asp Glu Arg Phe Tyr Ala Glu His Leu Met Pro Thr Leu Gln Gly Leu
35 40 45
Leu Asp Pro Glu Ser Ala His Arg Leu Ala Val Arg Phe Thr Ser Leu
50 55 60
Gly Leu Leu Pro Arg Ala Arg Phe Gln Asp Ser Asp Met Leu Glu Val
65 70 75 80
Arg Val Leu Gly His Lys Phe Arg Asn Pro Val Gly Ile Ala Ala Gly
85 90 95
Phe Asp Lys His Gly Glu Ala Val Asp Gly Leu Tyr Lys Met Gly Phe
100 105 110
Gly Phe Val Glu Ile Gly Ser Val Thr Pro Lys Pro Gln Glu Gly Asn
115 120 125
Pro Arg Pro Arg Val Phe Arg Leu Pro Glu Asp Gln Ala Val Ile Asn
130 135 140
Arg Tyr Gly Phe Asn Ser His Gly Leu Ser Val Val Glu His Arg Leu
145 150 155 160
Arg Ala Arg Gln Gln Lys Gln Ala Lys Leu Thr Glu Asp Gly Leu Pro
165 170 175
Leu Gly Val Asn Leu Gly Lys Asn Lys Thr Ser Val Asp Ala Ala Glu
180 185 190
Asp Tyr Ala Glu Gly Val Arg Val Leu Ala Pro Leu Ala Asp Tyr Leu
195 200 205
Val Val Asn Val Ser Ser Pro Asn Thr Ala Gly Leu Arg Ser Leu Gln
210 215 220
Gly Lys Ala Glu Leu Arg Arg Leu Leu Thr Lys Val Leu Gln Glu Arg
225 230 235 240
Asp Gly Leu Arg Arg Val His Arg Pro Ala Val Leu Val Lys Ile Ala
245 250 255
Pro Asp Leu Thr Ser Gln Asp Lys Glu Asp Ile Ala Ser Val Val Lys
260 265 270
Glu Leu Gly Ile Asp Gly Leu Ile Val Thr Asn Thr Thr Val Ser Arg
275 280 285
Pro Ala Gly Leu Gln Gly Ala Leu Arg Ser Glu Thr Gly Gly Leu Ser
290 295 300
Gly Lys Pro Leu Arg Asp Leu Ser Thr Gln Thr Ile Arg Glu Met Tyr
305 310 315 320
Ala Leu Thr Gln Gly Arg Val Pro Ile Ile Gly Val Gly Gly Val Ser
325 330 335
Ser Gly Gln Asp Ala Leu Glu Lys Ile Arg Ala Gly Ala Ser Leu Val
340 345 350
Gln Leu Tyr Thr Ala Leu Thr Phe Trp Gly Pro Pro Val Val Gly Lys
355 360 365
Val Lys Arg Glu Leu Glu Ala Leu Leu Lys Glu Gln Gly Phe Gly Gly
370 375 380
Val Thr Asp Ala Ile Gly Ala Asp His Arg Arg
385 390 395
<210> 29
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> corresponding piece of DNA for generating GS gRNA
<400> 29
gagtatgtga agactttg 18
<210> 30
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> corresponding piece of DNA for generating GS gRNA
<400> 30
ccatctttat tctcatgggg 20
<210> 31
<211> 5562
<212> DNA
<213> Cricetulus griseus
<220>
<221> misc_feature
<222> (4467)..(4484)
<223> target of GS-1 gRNA
<220>
<221> misc_feature
<222> (4611)..(4630)
<223> target of GS-2 gRNA
<400> 31
accttccacc atggccacct cagcaagttc ccacttgaac aaaaacatca agcaaatgta 60
cttgtgcctg ccccagggtg agaaagtcca agccatgtat atctgggttg atggtactgg 120
agaaggactg cgctgcaaaa cccgcaccct ggactgtgag cccaagtgtg tagaaggtga 180
gcatgggcag gagcaggaca tgtgcctgga agtgggcaag cagcctgaga tttgaccttc 240
cttctgtttt gtttgcaaag tctttcaaaa gcaggtctct tcaggcctca gtcagtcacc 300
cgtaagctgc cgagtagtct ggaggcatag aaaacaatgg aggcctttat ttagatggaa 360
tcttgtgtgt gctggtacac tgaagaaaaa tattgggtca tatttgtagg gggtgggagg 420
ttggagtatt gctaacctag ccaaccccag gaacctagtt tgaaagacct gtaactagaa 480
tatgctatca agtttataga gcagtggttc tcaacctttc aaatgcttta cacttgaata 540
caactcctca tgttctggtg attaccccca tcccaaccat tgctaacttc ttaactgaaa 600
tttcactact gctacgaatc ataatgtatc tgtgtttttg gatggtctta ggtgacccct 660
gtgaaagggt tgtgagacca tcctcaaagg ggttgtgacc tacaggttga gacccttttg 720
agtgctgtgt ttattagtat ttatacagtg gaattctggg tgcaaagcac atgctccaaa 780
gtagtttctc tgggactggc catttgtttt cagatgggga tacttttaaa aacttgcaaa 840
ggaaccaaaa aaaaaaaaaa tgcagaaaaa aggagggggg ggagggcacg cctttaatcc 900
cagtacttgg gaggcagagg caggcggatc tctgtgagtt gaagcccagc ctggtctaca 960
agagctagtt ccaggacagc ctccaaagcc acagagaaac cctgtctcaa aacaaacaaa 1020
cacacaaaaa aattaaaaaa aaaaaaaaac tttcaaagga gacctgtttt attttagttg 1080
tggcctttgt tttggtagga agggcagcta gtttaggatg agtttttatt attctaagat 1140
gttgccgttt gagtgaatga atgaccagat gacagcatat aacatgtact tgttacttgg 1200
cagaagtagg taggtcgttc tgtttctgcc ttcagctcat aggtaactgg ggagacaaac 1260
tggccccaaa acaaggaaaa ggaacaagtg gtaggagagc aactgtttcc tcatctacaa 1320
gagcacagcc tgagctacaa cagtcaggcc cggagaggga tgagagaagg gaggggatga 1380
ggtggcctag tgagggagtc agttttgctc tgtgccatga gtgtctcact cactggaagt 1440
ggtgtcagaa tgactggtgc acagtagact tacagagagg actcatctgt ttgttgcttg 1500
ggtggttctt gtgatgcagt gctcttggga acctcagaag gaggaacata gggataggtg 1560
ggcatagaca tcaggttgtc cctaattaat gatgatacat ttacatacat gccactcaga 1620
agacacagta gattttcagt gatggaaata tgatgagagg ctagctgtct tgtgtgtata 1680
tttttaataa atttttaata aatttcatgt gtgtgagtca gtgcgtgtgt gcgtttgctc 1740
gcccagtgct gtgccagcag aggtctgagg agggtgtgag aatcccagga actgaagtta 1800
acagttgtgg ttaagagtac ttatcactcg ttaccagcac ctacatggtg gctcacaacc 1860
atctgtaact ccaatttcag gggctccaac cccctcttct gcaggcatac acttgcacag 1920
atatacatgc aagtaaaaca cccctacaca cataaaaata aatacgtctt cttaaaagtt 1980
aattttccat ctttatttgg cccagagtta cctgagtgga attttgatgg ctctagtacc 2040
tttcagtctg agggctccaa cagtgacatg tatctcagcc ctgttgccat gtttcgggac 2100
cccttccgca gagatcccaa caagctggtg ttctgtgaag ttttcaagta caaccggaag 2160
cctgcaggtg tgtatggggt gggcgtgaat gtcttaagaa tctagggatg gatgatcaga 2220
tgtccatcct tctaccctga acttgcctgc tgaaaaacag tgtggtccgc ccctccatgg 2280
tcccttttat tggttgtata aacagtgttg aatcttccat ctgtttgctg ataggggtcc 2340
ccagtgacag tcttgatctg cttctacatt taaaaagctg taattcgtac ttaagcgttt 2400
tggggtttaa ctactagatc tgccatttat tgccagtgac cttggcatac tttgccccat 2460
gcttctattt tgctgaatta tgtgtagaga gagacgagac agagcatgct tgaactgagg 2520
gcgtactgtg ctctgtgtgg aagtcaaccg acaacctgtg gaatcagttc tctcctgctg 2580
tatttgtaga ttctggaggt ggaactcagg ttgccatgag cattatgatt cctggctaag 2640
ctgtttgccc atgaagcctt ctgtacctgc tcatagaatt ttgtttatgc cgtgctatcc 2700
atactcagtt ttcagatagc ttcttaaacc cagggaactc taatttacat aaactctctt 2760
ccagtactgc cagtaaggct tggtggccct ataccttcag tacctctgtt ttgaaaagga 2820
agtattgttg gtcaagggta tgtacctcag catggcagcc atggggttcc tggctgtgcc 2880
gcttgcccta taacctgggc acgtcaccaa acaccctctc tcagggcttc attttctcat 2940
ttgtgaaagt gaagattgct aacactcatc tcaaactcag ttaaatgata aattgctttt 3000
ctagcttggg aattgttttc agttacactc acctctccct cgctttctct ctcttttttg 3060
taccagccaa tactgtgtaa tttagcactc agactcacct ggaatgtaaa cctaatggac 3120
aaattattct cagtaaaatg acagctctgg ccttaagtgc ctacgaaact agggaatacg 3180
tttgacaagc aggagcagct gtcttgtgaa tagagggtgg aagtgtctgg catgtggtac 3240
ttggaaagtg gccagcgtgc agataggatg aacacttgtt ttgctctcac tccattccca 3300
tgagatttca tagctgactt taattataaa aagtctctca gccttttcct gcaaatgtac 3360
tatcattgct tcttcacagt ggttgggcct gagtaggtcc agcctatgat gacttcagct 3420
gtgtaagagt tgaggacact actccttaca gcatgttgat gctttattcc tagagaccaa 3480
tttaaggcac tcgtgtaaac ggataatgga catggtgagc aaccagcacc cctggtttgg 3540
aatggaacag gagtatactc tgatgggaac agatgggcac ccttttggtt ggccttccaa 3600
tggctttcct gggccccaag gtaagttccc caggtgaaat aaaagcttcc tccccataag 3660
ttcttactgt ccagagacag gagcagctcc caaatcagca aacagactgg cagctgaaaa 3720
taacagactg tccttgcatc cctcaaatcc agatgtgctt tgaatttaaa gtgacaggat 3780
ggtgatgaga tggctcagtg ggtaaaggtg cttgccacca ggcttgacag cccgagttta 3840
tccctgagac ccatataagt tattctctga ccatctgcac atgcatgcat atacaaaaag 3900
tgaaaagcta ttcagagtgg gcagtagttc taccaaggct acagcaaaga ggaaagacct 3960
agcctcctac ctgcaggtga agacaggatg tgcgaaagca agtcttagga ccttgtcatt 4020
ttctggcttt ggggggttat ggactctgat tcttcactga ttgctcttga ttctccttca 4080
ggtccgtatt actgtggtgt gggcgcagac aaagcctatg gcagggatat cgtggaggct 4140
cactaccgcg cctgcttgta tgctggggtc aagattacag gaacaaatgc tgaggtcatg 4200
cctgcccagg taaatggcac tattctgttc cttttcctcc cctctgaaga cttggcacat 4260
ggggactttg gttaacaagg gtgatgactt aaaagtggtt cagggtagag gtaagtagaa 4320
caagctagga gcttgagttg gcctgaacag ttagttggcc ttattctaaa ggtcaacatg 4380
ttctttctag tgggaattcc aaataggacc ctgtgaagga atccgcatgg gagatcatct 4440
ctgggtggcc cgtttcatct tgcatcgagt atgtgaagac tttggggtaa tagcaacctt 4500
tgaccccaag cccattcctg ggaactggaa tggtgcaggc tgccatacca actttagcac 4560
caaggccatg cgggaggaga atggtctgaa gtaagtagct tcctctggag ccatctttat 4620
tctcatgggg tggaagggct ttgtgttagg gttgggaaag ttggacttct cacaaactac 4680
atgccatgct cttcgtgttt gtcataagcc tatcgttttg tacccgttgg agaagtgaca 4740
gtactctagg aatagaatta cagctgtgat atgggaaagt tgtcacgtag gttcaagcat 4800
ttaaaggtct ttagtaagaa ctaaatacac atacaagcaa gtgggtgact taattcttac 4860
tgatgggaag aggccagtga tgggggtctt cccatccaaa agataattgg tattacatgt 4920
tgaggactgg tctgaagcac ttgagacata ggtcacaagg cagacacagc ctgcatcaag 4980
tatttattgg tttcttatgg aactcatgcc tgctcctgcc cttgaaggac aggtttctag 5040
tgacaaggtc agaccctcac ctttactgct tccaccaggc acatcgagga ggccatcgag 5100
aaactaagca agcggcaccg gtaccacatt cgagcctacg atcccaaggg gggcctggac 5160
aatgcccgtc gtctgactgg gttccacgaa acgtccaaca tcaacgactt ttctgctggt 5220
gtcgccaatc gcagtgccag catccgcatt ccccggactg tcggccagga gaagaaaggt 5280
tactttgaag accgccgccc ctctgccaat tgtgacccct ttgcagtgac agaagccatc 5340
gtccgcacat gccttctcaa tgagactggc gacgagccct tccaatacaa aaactaatta 5400
gactttgagt gatcttgagc ctttcctagt tcatcccacc ccgccccagc tgtctcattg 5460
taactcaaag gatggaatat caaggtcttt ttattcctcg tgcccagtta atcttgcttt 5520
tattggtcag aatagaggag tcaagttctt aatccctata ca 5562
<210> 32
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> GS1_F primer
<400> 32
acactctttc cctacacgac gctcttccga tcttggcctt attctaaagg tcaaca 56
<210> 33
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> GS1_R primer
<400> 33
gtgactggag ttcagacgtg tgctcttccg atctcattct cctcccgcat gg 52
<210> 34
<211> 1417
<212> DNA
<213> Cricetulus griseus
<400> 34
ccgagccgag aatgggagta gagccgactg cttgattccc acaccaatct cctcgccgct 60
ctcacttcgc ctcgttctcg tggctcgtgg ccctgtccac cccgtccatc atcccgccgg 120
ccaccgctca gagcaccttc caccatggcc acctcagcaa gttcccactt gaacaaaaac 180
atcaagcaaa tgtacttgtg cctgccccag ggtgagaaag tccaagccat gtatatctgg 240
gttgatggta ctggagaagg actgcgctgc aaaacccgca ccctggactg tgagcccaag 300
tgtgtagaag agttacctga gtggaatttt gatggctcta gtacctttca gtctgagggc 360
tccaacagtg acatgtatct cagccctgtt gccatgtttc gggacccctt ccgcagagat 420
cccaacaagc tggtgttctg tgaagttttc aagtacaacc ggaagcctgc agagaccaat 480
ttaaggcact cgtgtaaacg gataatggac atggtgagca accagcaccc ctggtttgga 540
atggaacagg agtatactct gatgggaaca gatgggcacc cttttggttg gccttccaat 600
ggctttcctg ggccccaagg tccgtattac tgtggtgtgg gcgcagacaa agcctatggc 660
agggatatcg mggaggctca ctaccgcgcc tgcttgtatg ctggggtcaa gattacagga 720
acaaatgctg aggtcatgcc tgcccagtgg gaattccaaa taggaccctg tgaaggaatc 780
cgcaggagat catctctggg tggcccgttt catcttgcat cgagtatgtg aagactttgg 840
ggtaatagca acctttgacc ccaagcccat tcctgggaac tggaatggtg caggctgcca 900
taccaacttt agcaccaagg ccatgcggga ggagaatggt ctgaagcaca tcgaggaggc 960
catcgagaaa ctaagcaagc ggcaccggta ccacattcga gcctacgatc ccaagggggg 1020
cctggacaat gcccgtggtc tgactgggtt ccacgaaacg tccaacatca acgacttttc 1080
tgctggtgtc gccaatcgca gtgccagcat ccgcattccc cggactgtcg gccaggagaa 1140
gaaaggttac tttgaagacc gccgcccctc tgccaattgt gacccctttg cagtgacaga 1200
agccatcgtc cgcacatgcc ttctcaatga gactggcgac gagcccttcc aatacaaaaa 1260
ctaattagac tttgagtgat cttgagcctt tcctagttca tcccaccccg ccccagctgt 1320
ctcattgtaa ctcaaaggat ggaatatcaa ggtcttttta ttcctcgtgc ccagttaatc 1380
ttgcttttat tggtcagaat agaggagtca agttctt 1417
<210> 35
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> GS F primer
<400> 35
acctttgacc ccaagc 16
<210> 36
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> GS R primer
<400> 36
cgtcgccagt ctcattg 17
Claims (20)
- - 부분적으로 또는 완전히 불활성화된 내인성 데히드로오로테이트 데히드로게나제 (DHODH) 유전자, 및
- 부분적으로 또는 완전히 불활성화된 내인성 글루타민 신테타제 (GS) 유전자
를 포함하는 세포주. - 제1항에 있어서, 차이니즈 햄스터 난소 (CHO) 세포주인 세포주.
- 제1항 또는 제2항에 있어서,
(a1) 내인성 DHODH 유전자 및 내인성 GS 유전자를 포함하는 세포 내의 내인성 DHODH 유전자를 불활성화시키는 단계,
(b1) 세포를 우리딘을 포함하는 배양 배지에서 내인성 DHODH 유전자가 부분적으로 또는 완전히 불활성화된 세포주를 생성하는 데 적합한 조건 하에 배양하는 단계,
(c1) 내인성 DHODH 유전자가 부분적으로 또는 완전히 불활성화된 상기 세포를 회수하는 단계,
(d1) 상기 세포 내의 내인성 GS 유전자를 불활성화시키는 단계, 및
(e1) 상기 세포를 글루타민을 포함하는 배양 배지에서 내인성 GS 유전자가 부분적으로 또는 완전히 불활성화된 세포주를 생성하는 데 적합한 조건 하에 배양하는 단계
에 의해 생산된 세포주. - 제1항 또는 제2항에 있어서,
(a2) 내인성 GS 유전자 및 부분적으로 또는 완전히 불활성화된 내인성 DHODH 유전자를 포함하는 세포를 제공하는 단계,
(b2) 상기 세포 내의 내인성 GS 유전자를 불활성화시키는 단계, 및
(c2) 세포를 글루타민을 포함하는 배양 배지에서 내인성 GS 유전자가 부분적으로 또는 완전히 불활성화된 세포주를 생성하는 데 적합한 조건 하에 배양하는 단계
에 의해 생산된 세포주. - 제1항 또는 제2항에 있어서,
(a3) 내인성 DHODH 유전자 및 부분적으로 또는 완전히 불활성화된 내인성 GS 유전자를 포함하는 세포를 제공하는 단계,
(b3) 상기 세포 내의 내인성 DHODH 유전자를 불활성화시키는 단계, 및
(c3) 세포를 우리딘을 포함하는 배양 배지에서 내인성 DHODH 유전자가 부분적으로 또는 완전히 불활성화된 세포주를 생성하는 데 적합한 조건 하에 배양하는 단계
에 의해 생산된 세포주. - 제3항 내지 제5항 중 어느 한 항에 있어서, 내인성 DHODH 유전자 및/또는 내인성 GS 유전자가 유전자-편집 방법에 의해 불활성화된 것인 세포주.
- 제6항에 있어서, 내인성 DHODH 유전자 및/또는 내인성 GS 유전자가 CRISPR-Cas9 방법에 의해 불활성화된 것인 세포주.
- 제1항 내지 제7항 중 어느 한 항에 있어서,
- 내인성 DHODH 유전자의 1개 이상의 또는 모든 대립유전자가 부분적으로 또는 완전히 불활성화되고/거나,
- 내인성 GS 유전자의 1개 이상의 또는 모든 대립유전자가 부분적으로 또는 완전히 불활성화된 것인
세포주. - 제1항 내지 제8항 중 어느 한 항에 있어서,
- 외인성 포유동물 DHODH를 코딩하는 뉴클레오티드 서열 (i) 및 재조합 단백질 (I)을 발현시키기 위한 적어도 1개의 발현 카세트를 포함하는 발현 벡터이며, 여기서 상기 외인성 DHODH는 서열식별번호: 2의 서열 또는 서열식별번호: 4의 서열에 대해 적어도 60% 동일한 서열을 포함하는 것인 발현 벡터, 및
- 외인성 포유동물 GS를 코딩하는 뉴클레오티드 서열 (ii) 및 재조합 단백질 (II)를 발현시키기 위한 적어도 1개의 발현 카세트를 포함하는 발현 벡터이며, 여기서 상기 외인성 GS는 서열식별번호: 6의 서열 또는 서열식별번호: 8의 서열에 대해 적어도 94.5% 동일한 서열을 포함하는 것인 발현 벡터
를 추가로 포함하는 세포주. - (A) 제1항 내지 제9항 중 어느 한 항에 따른 세포주,
(B) 포유동물 DHODH를 코딩하는 뉴클레오티드 서열 (i) 및 재조합 단백질 (I)을 발현시키기 위한 적어도 1개의 발현 카세트를 포함하는 발현 벡터이며, 여기서 상기 DHODH는 서열식별번호: 2의 서열 또는 서열식별번호: 4의 서열에 대해 적어도 60% 동일한 서열을 포함하는 것인 발현 벡터, 및
(C) 포유동물 GS를 코딩하는 뉴클레오티드 서열 (ii) 및 재조합 단백질 (II)를 발현시키기 위한 적어도 1개의 발현 카세트를 포함하는 발현 벡터이며, 여기서 GS는 서열식별번호: 6의 서열 또는 서열식별번호: 8의 서열에 대해 적어도 94.5% 동일한 서열을 포함하는 것인 발현 벡터
를 포함하는 발현 시스템. - 제9항 또는 제10항에 있어서, 상기 뉴클레오티드 서열 (i)이 서열식별번호: 1의 서열 또는 서열식별번호: 3의 서열을 포함하는 것인 세포주 또는 발현 시스템.
- 제9항 내지 제11항 중 어느 한 항에 있어서, 상기 뉴클레오티드 서열 (ii)가 서열식별번호: 5의 서열 또는 서열식별번호: 7의 서열을 포함하는 것인 세포주 또는 발현 시스템.
- 제9항 내지 제12항 중 어느 한 항에 있어서, 상기 재조합 단백질 (I) 및 (II)가 모노클로날 항체의 별개의 아암인 세포주 또는 발현 시스템.
- 제9항 내지 제13항 중 어느 한 항에 있어서, 상기 벡터가 항체 경쇄의 클로닝에 적합한 제1 발현 카세트 및 항체 중쇄의 클로닝에 적합한 제2 발현 카세트를 포함하는 것인 세포주 또는 발현 시스템.
- - 제9항 및 제11항 내지 제14항 중 어느 한 항에 따른 세포주 또는 제10항 내지 제14항 중 어느 한 항에 따른 발현 시스템, 및
- 우리딘 및 글루타민이 결여된, 특히 추가로 DHODH 억제제 및 GS 억제제가 결여된 배양 배지
를 포함하는 키트. - A) a1) 제9항 및 제11항 내지 제14항 중 어느 한 항에 따른 세포주를 제공하는 단계;
또는
a2) 제1항 내지 제8항 중 어느 한 항에 따른 세포주를 제공하는 단계, 및
a2') 제10항 내지 제14항 중 어느 한 항에 정의된 바와 같은 발현 벡터를 단계 a2)에서 제공된 세포주 내로 도입하는 단계;
또는
a3) 내인성 DHODH 유전자 및 내인성 GS 유전자를 포함하는 세포주를 제공하는 단계,
a3') 단계 a3)에서 제공된 세포주 내의 내인성 DHODH 유전자 및 내인성 GS 유전자를 부분적으로 또는 완전히 불활성화시키는 단계, 및
a3") 제10항 내지 제14항 중 어느 한 항에 정의된 바와 같은 발현 벡터를 단계 a3')에서 수득된 부분적으로 또는 완전히 불활성화된 내인성 DHODH 유전자 및 부분적으로 또는 완전히 불활성화된 GS 유전자를 포함하는 세포주 내로 도입하는 단계;
또는
a4) 내인성 GS 유전자 및 부분적으로 또는 완전히 불활성화된 내인성 DHODH 유전자를 포함하는 세포를 제공하는 단계,
a4') 단계 a4)에서 제공된 세포주 내의 내인성 GS 유전자를 부분적으로 또는 완전히 불활성화시키는 단계, 및
a4") 제10항 내지 제14항 중 어느 한 항에 정의된 바와 같은 발현 벡터를 부분적으로 또는 완전히 불활성화된 내인성 DHODH 유전자 및 단계 a4')에서 수득된 부분적으로 또는 완전히 불활성화된 GS 유전자를 포함하는 세포주 내로 도입하는 단계;
또는
a5) 내인성 DHODH 유전자 및 부분적으로 또는 완전히 불활성화된 내인성 GS 유전자를 포함하는 세포를 제공하는 단계,
a5') 단계 a5)에서 제공된 세포주 내의 내인성 DHODH 유전자를 부분적으로 또는 완전히 불활성화시키는 단계, 및
a5") 제10항 내지 제14항 중 어느 한 항에 정의된 바와 같은 발현 벡터를 단계 a5')에서 수득된 부분적으로 또는 완전히 불활성화된 내인성 DHODH 유전자 및 부분적으로 또는 완전히 불활성화된 GS 유전자를 포함하는 세포주 내로 도입하는 단계;
B) 상기 세포주를 재조합 단백질의 생산에 적합한 조건 하에 배양하는 단계; 및
C) 상기 재조합 단백질을 단리 및/또는 정제하는 단계
를 포함하는, 재조합 단백질을 생산하는 시험관내 방법. - 제16항에 있어서, 단계 B)가 우리딘 및 글루타민이 결여된, 특히 추가로 DHODH 억제제 및 GS 억제제가 결여된 배양 배지에서 수행되는 것인 방법.
- 제16항 또는 제17항에 있어서, 상기 재조합 단백질을 제약 조성물로 제제화하는 단계 D)를 추가로 포함하는 방법.
- 재조합 단백질을 생산하기 위한, 제9항 및 제11항 내지 제14항 중 어느 한 항에 따른 세포주, 제10항 내지 제14항 중 어느 한 항에 따른 발현 시스템 또는 제15항에 따른 키트의 용도.
- 제19항에 있어서, 세포주, 발현 시스템 또는 키트가 우리딘 및 글루타민이 결여된, 특히 DHODH 억제제 및 GS 억제제가 부재하는 배양 배지와 조합되어 사용되는 것인 용도.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP20306068.6 | 2020-09-21 | ||
EP20306068 | 2020-09-21 | ||
PCT/EP2021/075864 WO2022058603A1 (en) | 2020-09-21 | 2021-09-21 | Generation of a high producing recombinant chinese hamster ovary cell line for therapeutic protein production |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230068401A true KR20230068401A (ko) | 2023-05-17 |
Family
ID=72840426
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237009323A KR20230068401A (ko) | 2020-09-21 | 2021-09-21 | 치료 단백질 생산을 위한 고 생산 재조합 차이니즈 햄스터 난소 세포주의 생성 |
Country Status (13)
Country | Link |
---|---|
US (1) | US20240043878A1 (ko) |
EP (1) | EP4214308A1 (ko) |
JP (1) | JP2023544267A (ko) |
KR (1) | KR20230068401A (ko) |
CN (1) | CN116457468A (ko) |
AU (1) | AU2021342718A1 (ko) |
BR (1) | BR112023005002A2 (ko) |
CA (1) | CA3195524A1 (ko) |
IL (1) | IL301442A (ko) |
MX (1) | MX2023003278A (ko) |
TW (1) | TW202227622A (ko) |
WO (1) | WO2022058603A1 (ko) |
ZA (1) | ZA202303597B (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR112021018124A2 (pt) * | 2019-03-19 | 2021-11-16 | Sanofi Sa | Linhagem celular compreendendo marcador de seleção e usos do mesmo para produção de proteína |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB8717430D0 (en) | 1987-07-23 | 1987-08-26 | Celltech Ltd | Recombinant dna product |
KR100267720B1 (ko) | 1997-12-29 | 2001-03-02 | 박호군 | 사람 글루타민 합성효소 유전자를 포함하는 발현벡터 및 이를 이용하여 동물세포에서 에리트로포이에틴을 고수율로 생산하는 방법 |
US20030166201A1 (en) * | 2001-04-30 | 2003-09-04 | Jensen Michael C. | Selection systems for genetically modified cells |
EP2674495A1 (en) | 2012-06-14 | 2013-12-18 | Sanofi | CHO expression system |
ES2769877T3 (es) | 2014-10-23 | 2020-06-29 | Sanofi Sa | Marcador de selección novedoso para la transfección celular y la producción de proteínas |
EP3821027A1 (en) * | 2018-07-13 | 2021-05-19 | Enzene Biosciences Ltd. | Double knock-out cho cell line method of its generation and producing therapeutic proteins therefrom |
BR112021018124A2 (pt) * | 2019-03-19 | 2021-11-16 | Sanofi Sa | Linhagem celular compreendendo marcador de seleção e usos do mesmo para produção de proteína |
WO2020243642A2 (en) * | 2019-05-31 | 2020-12-03 | The Trustees Of Columbia University In The City Of New York | Multiply auxotrophic cell line for the production of recombinant proteins and methods thereof |
-
2021
- 2021-09-17 TW TW110134938A patent/TW202227622A/zh unknown
- 2021-09-21 AU AU2021342718A patent/AU2021342718A1/en active Pending
- 2021-09-21 CN CN202180074963.4A patent/CN116457468A/zh active Pending
- 2021-09-21 US US18/245,872 patent/US20240043878A1/en active Pending
- 2021-09-21 CA CA3195524A patent/CA3195524A1/en active Pending
- 2021-09-21 MX MX2023003278A patent/MX2023003278A/es unknown
- 2021-09-21 BR BR112023005002A patent/BR112023005002A2/pt unknown
- 2021-09-21 KR KR1020237009323A patent/KR20230068401A/ko active Search and Examination
- 2021-09-21 WO PCT/EP2021/075864 patent/WO2022058603A1/en active Application Filing
- 2021-09-21 IL IL301442A patent/IL301442A/en unknown
- 2021-09-21 EP EP21777795.2A patent/EP4214308A1/en active Pending
- 2021-09-21 JP JP2023518094A patent/JP2023544267A/ja active Pending
-
2023
- 2023-03-15 ZA ZA2023/03597A patent/ZA202303597B/en unknown
Also Published As
Publication number | Publication date |
---|---|
IL301442A (en) | 2023-05-01 |
ZA202303597B (en) | 2024-08-28 |
TW202227622A (zh) | 2022-07-16 |
CN116457468A (zh) | 2023-07-18 |
WO2022058603A1 (en) | 2022-03-24 |
JP2023544267A (ja) | 2023-10-23 |
MX2023003278A (es) | 2023-04-12 |
AU2021342718A1 (en) | 2023-06-08 |
US20240043878A1 (en) | 2024-02-08 |
EP4214308A1 (en) | 2023-07-26 |
CA3195524A1 (en) | 2022-03-24 |
BR112023005002A2 (pt) | 2023-04-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2711505C2 (ru) | Улучшенные экспрессия и процессинг трансгена | |
WO2021030666A1 (en) | Base editing by transglycosylation | |
KR20200121782A (ko) | 아데노신 염기 편집제의 용도 | |
EA034039B1 (ru) | Клетка-хозяин, способная к сайт-специфической интеграции, способ ее получения и применение | |
CN114554841B (zh) | 转基因哺乳动物及其使用方法 | |
US20220089775A1 (en) | Multiply auxotrophic cell line for the production of recombinant proteins and methods thereof | |
AU2022331424A1 (en) | Persistent allogeneic modified immune cells and methods of use thereof | |
KR20230157387A (ko) | Cas 효소를 이용한 다중 편집 | |
US20230151392A1 (en) | Safe harbor loci | |
KR20230068401A (ko) | 치료 단백질 생산을 위한 고 생산 재조합 차이니즈 햄스터 난소 세포주의 생성 | |
KR20210141511A (ko) | 신규 선택 마커-포함 세포주 및 단백질 생산을 위한 그의 용도 | |
RU2820830C2 (ru) | Линия клеток, содержащая новый маркер отбора, и ее применение для продуцирования белков | |
US20240010714A1 (en) | Cell-free methods of recombinant antibody production | |
US20230416798A1 (en) | Methods of recombinant antibody production and related cell systems | |
WO2024211287A1 (en) | Production cell lines with targeted integration sites | |
CN117043327A (zh) | 用cas酶进行多重编辑 | |
CN118234865A (zh) | 持久性同种异体修饰免疫细胞及其使用方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |