CN111655296A - 编码肽接头的经改良核苷酸序列 - Google Patents
编码肽接头的经改良核苷酸序列 Download PDFInfo
- Publication number
- CN111655296A CN111655296A CN201980010133.8A CN201980010133A CN111655296A CN 111655296 A CN111655296 A CN 111655296A CN 201980010133 A CN201980010133 A CN 201980010133A CN 111655296 A CN111655296 A CN 111655296A
- Authority
- CN
- China
- Prior art keywords
- linker
- nucleic acid
- nucleotide sequence
- peptide
- peptide linker
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 171
- 239000002773 nucleotide Substances 0.000 title claims description 92
- 125000003729 nucleotide group Chemical group 0.000 title claims description 92
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 109
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 103
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 103
- 108020004705 Codon Proteins 0.000 claims abstract description 96
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 claims abstract description 60
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 51
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 51
- 229920001184 polypeptide Polymers 0.000 claims abstract description 46
- 230000004927 fusion Effects 0.000 claims abstract description 41
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 41
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 32
- 210000004027 cell Anatomy 0.000 claims description 68
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 claims description 41
- 238000000034 method Methods 0.000 claims description 35
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 claims description 13
- 230000002068 genetic effect Effects 0.000 claims description 12
- 239000004471 Glycine Substances 0.000 claims description 10
- 108020001507 fusion proteins Proteins 0.000 claims description 10
- 102000037865 fusion proteins Human genes 0.000 claims description 10
- 108060003951 Immunoglobulin Proteins 0.000 claims description 9
- 241000235058 Komagataella pastoris Species 0.000 claims description 9
- 102000018358 immunoglobulin Human genes 0.000 claims description 9
- 238000004519 manufacturing process Methods 0.000 claims description 9
- 241000235648 Pichia Species 0.000 claims description 6
- 210000004962 mammalian cell Anatomy 0.000 claims description 2
- 241000699802 Cricetulus griseus Species 0.000 claims 1
- 210000001672 ovary Anatomy 0.000 claims 1
- 235000018102 proteins Nutrition 0.000 description 34
- CKLJMWTZIZZHCS-REOHCLBHSA-N aspartic acid group Chemical group N[C@@H](CC(=O)O)C(=O)O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 32
- 125000000539 amino acid group Chemical group 0.000 description 15
- 230000002378 acidificating effect Effects 0.000 description 12
- 241000894007 species Species 0.000 description 10
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 9
- 239000013598 vector Substances 0.000 description 8
- 150000001413 amino acids Chemical group 0.000 description 7
- 108020004414 DNA Proteins 0.000 description 6
- 108010003723 Single-Domain Antibodies Proteins 0.000 description 6
- 239000013604 expression vector Substances 0.000 description 6
- 239000012634 fragment Substances 0.000 description 6
- HKZAAJSTFUZYTO-LURJTMIESA-N (2s)-2-[[2-[[2-[[2-[(2-aminoacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]-3-hydroxypropanoic acid Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O HKZAAJSTFUZYTO-LURJTMIESA-N 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 235000003704 aspartic acid Nutrition 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 4
- 230000002538 fungal effect Effects 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 241000320412 Ogataea angusta Species 0.000 description 3
- 235000001014 amino acid Nutrition 0.000 description 3
- 229940024606 amino acid Drugs 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000000855 fermentation Methods 0.000 description 3
- 230000004151 fermentation Effects 0.000 description 3
- 238000013467 fragmentation Methods 0.000 description 3
- 238000006062 fragmentation reaction Methods 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 238000004949 mass spectrometry Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000012510 peptide mapping method Methods 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- 241000228212 Aspergillus Species 0.000 description 2
- 241000193830 Bacillus <bacterium> Species 0.000 description 2
- 241000193764 Brevibacillus brevis Species 0.000 description 2
- 241000222511 Coprinus Species 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 2
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 2
- 241001138401 Kluyveromyces lactis Species 0.000 description 2
- 241000221960 Neurospora Species 0.000 description 2
- 241001452677 Ogataea methanolica Species 0.000 description 2
- 101710118538 Protease Proteins 0.000 description 2
- 241000588769 Proteus <enterobacteria> Species 0.000 description 2
- 241000588770 Proteus mirabilis Species 0.000 description 2
- 241000589540 Pseudomonas fluorescens Species 0.000 description 2
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- 241000235070 Saccharomyces Species 0.000 description 2
- 241000235346 Schizosaccharomyces Species 0.000 description 2
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 241000221948 Sordaria Species 0.000 description 2
- 241000191965 Staphylococcus carnosus Species 0.000 description 2
- 244000057717 Streptococcus lactis Species 0.000 description 2
- 235000014897 Streptococcus lactis Nutrition 0.000 description 2
- 241000223259 Trichoderma Species 0.000 description 2
- 241000499912 Trichoderma reesei Species 0.000 description 2
- 241000235013 Yarrowia Species 0.000 description 2
- 229940009098 aspartate Drugs 0.000 description 2
- 238000005341 cation exchange Methods 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 239000000356 contaminant Substances 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 210000005260 human cell Anatomy 0.000 description 2
- 238000001819 mass spectrum Methods 0.000 description 2
- 239000002609 medium Substances 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 210000000287 oocyte Anatomy 0.000 description 2
- 210000003463 organelle Anatomy 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 239000011347 resin Substances 0.000 description 2
- 229920005989 resin Polymers 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- SBKVPJHMSUXZTA-MEJXFZFPSA-N (2S)-2-[[(2S)-2-[[(2S)-1-[(2S)-5-amino-2-[[2-[[(2S)-1-[(2S)-6-amino-2-[[(2S)-2-[[(2S)-5-amino-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-amino-3-(1H-indol-3-yl)propanoyl]amino]-3-(1H-imidazol-4-yl)propanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-4-methylpentanoyl]amino]-5-oxopentanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]pyrrolidine-2-carbonyl]amino]acetyl]amino]-5-oxopentanoyl]pyrrolidine-2-carbonyl]amino]-4-methylsulfanylbutanoyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 SBKVPJHMSUXZTA-MEJXFZFPSA-N 0.000 description 1
- 102100036826 Aldehyde oxidase Human genes 0.000 description 1
- 235000002198 Annona diversifolia Nutrition 0.000 description 1
- 241001523626 Arxula Species 0.000 description 1
- 241000228245 Aspergillus niger Species 0.000 description 1
- 241000131386 Aspergillus sojae Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 241000680806 Blastobotrys adeninivorans Species 0.000 description 1
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 101000928314 Homo sapiens Aldehyde oxidase Proteins 0.000 description 1
- 101150108662 KAR2 gene Proteins 0.000 description 1
- 241000235649 Kluyveromyces Species 0.000 description 1
- 241000194036 Lactococcus Species 0.000 description 1
- 241000282838 Lama Species 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 108010038049 Mating Factor Proteins 0.000 description 1
- 125000000729 N-terminal amino-acid group Chemical group 0.000 description 1
- 241000221961 Neurospora crassa Species 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 241000256259 Noctuidae Species 0.000 description 1
- 241000364057 Peoria Species 0.000 description 1
- 108010033276 Peptide Fragments Proteins 0.000 description 1
- 102000007079 Peptide Fragments Human genes 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 1
- 102000007562 Serum Albumin Human genes 0.000 description 1
- 108010071390 Serum Albumin Proteins 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 241000187398 Streptomyces lividans Species 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 240000007591 Tilia tomentosa Species 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- 241000269370 Xenopus <genus> Species 0.000 description 1
- 241000269368 Xenopus laevis Species 0.000 description 1
- 241000235015 Yarrowia lipolytica Species 0.000 description 1
- 108010084455 Zeocin Proteins 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-L aspartate group Chemical group N[C@@H](CC(=O)[O-])C(=O)[O-] CKLJMWTZIZZHCS-REOHCLBHSA-L 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000005194 fractionation Methods 0.000 description 1
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 description 1
- 239000012510 hollow fiber Substances 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000006317 isomerization reaction Methods 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- CWCMIVBLVUHDHK-ZSNHEYEWSA-N phleomycin D1 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC[C@@H](N=1)C=1SC=C(N=1)C(=O)NCCCCNC(N)=N)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C CWCMIVBLVUHDHK-ZSNHEYEWSA-N 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 230000012743 protein tagging Effects 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 229940055033 proteus mirabilis Drugs 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000004366 reverse phase liquid chromatography Methods 0.000 description 1
- 239000013017 sartobind Substances 0.000 description 1
- 239000006152 selective media Substances 0.000 description 1
- 238000012807 shake-flask culturing Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000012437 strong cation exchange chromatography Methods 0.000 description 1
- 238000002305 strong-anion-exchange chromatography Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 238000001195 ultra high performance liquid chromatography Methods 0.000 description 1
- 238000013060 ultrafiltration and diafiltration Methods 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K47/00—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
- A61K47/50—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
- A61K47/51—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
- A61K47/62—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being a protein, peptide or polyamino acid
- A61K47/65—Peptidic linkers, binders or spacers, e.g. peptidic enzyme-labile linkers
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
- A61K31/713—Double-stranded nucleic acids or oligonucleotides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K47/00—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
- A61K47/50—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
- A61K47/51—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
- A61K47/68—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an antibody, an immunoglobulin or a fragment thereof, e.g. an Fc-fragment
- A61K47/6889—Conjugates wherein the antibody being the modifying agent and wherein the linker, binder or spacer confers particular properties to the conjugates, e.g. peptidic enzyme-labile linkers or acid-labile linkers, providing for an acid-labile immuno conjugate wherein the drug may be released from its antibody conjugated part in an acidic, e.g. tumoural or environment
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/46—Hybrid immunoglobulins
- C07K16/468—Immunoglobulins having two or more different antigen binding sites, e.g. multifunctional antibodies
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K7/00—Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
- C07K7/04—Linear peptides containing only normal peptide links
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/30—Immunoglobulins specific features characterized by aspects of specificity or valency
- C07K2317/35—Valency
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/50—Immunoglobulins specific features characterized by immunoglobulin fragments
- C07K2317/56—Immunoglobulins specific features characterized by immunoglobulin fragments variable (Fv) region, i.e. VH and/or VL
- C07K2317/569—Single domain, e.g. dAb, sdAb, VHH, VNAR or nanobody®
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- Immunology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Plant Pathology (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Animal Behavior & Ethology (AREA)
- Epidemiology (AREA)
- Pharmacology & Pharmacy (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Medicinal Preparation (AREA)
Abstract
本发明提供编码甘氨酸丝氨酸接头且使用过量GGA、GGG及GGT/GGU密码子以编码所述甘氨酸残基之经改良的核苷酸序列及核酸。本发明进一步涉及编码包含甘氨酸丝氨酸接头的(融合)蛋白质及多肽之核苷酸序列及核酸,所述核苷酸序列及核酸包含本发明此类经改良之核苷酸序列及核酸。
Description
本发明涉及编码肽接头的经改良核苷酸序列及核酸。
本发明还涉及编码含有肽接头的(融合)蛋白质及多肽之核苷酸序列及核酸,该等核苷酸序列及核酸含有此类编码肽接头的经改良核苷酸序列及核酸。
本发明还涉及用于表达/产生含有肽接头的(融合)蛋白质及多肽之方法,其涉及使用此类编码肽接头的经改良核苷酸序列及核酸。
本发明之其他方面、实施方案、用途及优势将自本文中之进一步描述而变得清楚。
使用肽接头以连接两个或更多个蛋白质、肽、肽部分、结合域或结合单元在此项技术中已熟知。一种常用类别之肽接头被称为”Gly-Ser”或”GS”接头。这些为基本上由甘氨酸(G)及丝氨酸(S)残基组成之接头,且通常包含诸如GGGGS基序之肽基序之一或多个重复序列(例如,具有式(Gly-Gly-Gly-Gly-Ser)n,其中n可为1、2、3、4、5、6、7或更多)。此类GS接头的一些常用实例为15GS接头(n=3)及35GS接头(n=7)。举例而言,参考Chen等人,Adv.DrugDeliv.Rev.2013年10月15日;65(10):1357-1369;及Klein等人,Protein Eng.Des.Sel.(2014)27(10):325-330。
多肽及包含此类GS接头的(融合)蛋白质通常是通过适合地表达包含两个或更多个编码待连接之相关肽部分之核苷酸序列的遗传构建体来产生,其中编码肽部分之此等核苷酸序列经一或多个编码一或多个GS接头的核苷酸序列适合且可操作地连接,以使得在适合的宿主细胞或宿主生物体中适合的表达之后,视情况在适用于分离和/或纯化之步骤之后获得所需融合蛋白质或多肽。此类基因构建体之一些优选但非限制性实例(使用Nanobodies作为待连接之肽之代表性实例,参见表III之图例)示意性地显示于图1中,其中NB1、NB2、NBA、NBB等指示编码待连接之肽部分的核苷酸序列,且L1、L2、L3等指示编码适合的GS接头的核苷酸序列。此类基因构建体可为DNA或RNA,且可例如呈适合载体,诸如表达载体之形式。此全部在蛋白质工程改造领域中为熟知的;例如参考标准手册,诸如本文中所提及之Sambrook等人及Ausubel等人。
通常亦已知,归因于基因密码的简并性,在编码GS接头的核苷酸序列中,四种不同密码子中之各者可用于编码甘氨酸残基,即GGU(或GGT)、GGC、GGA和/或GGG(类似地已知GS接头中之丝氨酸残基可由UCU(或TCT)、UCC(或TCC)、UCA(或TCA)、UCG(或TCG)、AGU(或AGT)和/或AGC密码子编码)。
现已发现,可藉由使用过量GGA及GGG密码子以编码GS接头中之甘氨酸残基(亦即与GGT/GGU和/或GGC密码子之量相比)来提供编码GS接头的经改良核苷酸序列。
已进一步发现,可藉由使用过量GGA、GGG及GGT/GGU密码子以编码GS接头中之甘氨酸残基(亦即与GGC密码子之量相比)来提供编码GS接头的经改良核苷酸序列。
因此,在第一方面中,本发明涉及一种编码GS接头的核苷酸序列和/或核酸(如进一步定义于本文中),其中超过70%、优选超过85%、更优选超过90%,诸如超过95%及高达99%及更多(包括100%)之编码GS接头中之甘氨酸残基的密码子为GGA、GGG或GGT/GGU。
在此方面中,本发明还涉及一种编码GS接头的核苷酸序列和/或核酸(如进一步定义于本文中),其中超过70%、优选超过85%、更优选超过90%,诸如超过95%及高达99%及更多(包括100%)之编码GS接头中之甘氨酸残基的密码子为GGA或GGG。
在此方面中,本发明还涉及一种编码GS接头的核苷酸序列和/或核酸(如进一步定义于本文中),其中少于30%、优选少于15%、更优选少于10%,诸如少于5%及高达少于1%或更低(包括0%)之编码GS接头中之甘氨酸残基的密码子为GGC。
在另一方面中,本发明涉及一种编码肽接头的核苷酸序列和/或核酸,其中超过70%、优选超过85%、更优选超过90%,诸如超过95%及高达99%及更多(包括100%)之编码该肽接头中之甘氨酸残基的密码子为GGA、GGG或GGT/GGU。
在此方面中,本发明还涉及一种编码肽接头的核苷酸序列和/或核酸(如进一步定义于本文中),其中由该核苷酸序列或核酸编码之肽接头包含甘氨酸及丝氨酸残基或基本上由甘氨酸及丝氨酸残基组成,其中超过70%、优选超过85%、更优选超过90%,诸如超过95%及高达99%及更多(包括100%)之编码该肽接头中之甘氨酸残基的密码子为GGA或GGG。
在此方面中,本发明还涉及一种编码肽接头的核苷酸序列和/或核酸,其中少于30%、优选少于15%、更优选少于10%,诸如少于5%及高达少于1%或更低(包括0%)之编码该肽接头中之甘氨酸残基的密码子为GGC。
如本文中进一步描述,由所述核苷酸序列或核酸编码之肽接头将一般包含至少5个氨基酸残基及高达50个或更多个氨基酸残基(但实际上将通常包含10个与40个之间的氨基酸残基,诸如约15个氨基酸残基至约35个氨基酸残基)。此外,如本文中进一步描述,由所述核苷酸序列或核酸编码之肽接头与丝氨酸残基之数目相比将通常含有过量甘氨酸残基,例如各丝氨酸残基之3个与6个之间的甘氨酸残基。此外,由所述核苷酸序列或核酸编码之肽接头通常将含有序列基序之一或多个(诸如两个或更多个)重复序列。
在另一方面中,本发明涉及一种编码肽接头的核苷酸序列和/或核酸(如本文中进一步描述),其中由该核苷酸序列或核酸编码之肽接头包含序列基序GGGGS(SEQ ID NO:1)之一或多个(诸如两个或更多个)重复序列或基本上由其组成,其中超过70%、优选超过85%、更优选超过90%,诸如超过95%及高达99%及更多(包括100%)之编码该肽接头中之甘氨酸残基的密码子为GGA、GGG或GGT/GGU。
在此方面中,本发明还涉及一种编码肽接头的核苷酸序列和/或核酸(如本文中进一步描述),其中由该核苷酸序列或核酸编码之肽接头包含序列基序GGGGS(SEQ ID NO:1)之一或多个(诸如两个或更多个)重复序列或基本上由其组成,其中超过70%、优选超过85%、更优选超过90%,诸如超过95%及高达99%及更多(包括100%)编码该肽接头中之甘氨酸残基的密码子为GGA或GGG。
在此方面中,本发明还涉及一种编码肽接头的核苷酸序列和/或核酸(如本文中进一步描述),其中由该核苷酸序列或核酸编码之肽接头包含序列基序GGGGS(SEQ ID NO:1)之一或多个(诸如两个或更多个)重复序列或基本上由其组成,其中少于30%、优选少于15%、更优选少于10%,诸如少于5%及高达少于1%或更低(包括0%)之编码该肽接头中之甘氨酸残基的密码子为GGC。
举例而言,在本发明之此方面中,由该核苷酸序列或核酸编码之肽接头可包含序列基序GGGGS之2、3、4、5、6、7、8、9或10个重复序列或基本上由其组成。
在另一方面中,本发明涉及一种编码肽接头的核苷酸序列和/或核酸(如本文中进一步描述),其中由该核苷酸序列或核酸编码之肽接头具有式(Gly-Gly-Gly-Gly-Ser)n(其中n可为1、2、3、4、5、6、7或更大),其中超过70%、优选超过85%、更优选超过90%,诸如超过95%及高达99%及更多(包括100%)之编码该肽接头中之甘氨酸残基的密码子为GGA、GGG或GGT/GGU。
在此方面中,本发明还涉及一种编码肽接头的核苷酸序列和/或核酸(如本文中进一步描述),其中由该核苷酸序列或核酸编码之肽接头具有式(Gly-Gly-Gly-Gly-Ser)n(其中n可为1、2、3、4、5、6、7或更大),其中超过70%、优选超过85%、更优选超过90%,诸如超过95%及高达99%及更多(包括100%)之编码该肽接头中之甘氨酸残基的密码子为GGA或GGG。
在此方面中,本发明还涉及一种编码肽接头的核苷酸序列和/或核酸(如本文中进一步描述),其中由该核苷酸序列或核酸编码之肽接头具有式(Gly-Gly-Gly-Gly-Ser)n(其中n可为1、2、3、4、5、6、7或更大),其中少于30%、优选少于15%、更优选少于10%,诸如少于5%及高达少于1%或更低(包括0%)之编码该肽接头中之甘氨酸残基的密码子为GGC。
举例而言,在本发明之此方面中,由该核苷酸序列或核酸编码之肽接头可包含序列基序GGGGS之2、3、4、5、6、7、8、9或10个重复序列或基本上由其组成。
在另一方面中,本发明涉及以下通式之核苷酸序列和/或核酸(Ax-Bp-Ay-Bq)n,
其中:
A表示编码甘氨酸残基之密码子,其可独立地为(选自)GGU(或GGT)、GGC、GGA和/或GGG密码子;且
B表示编码丝氨酸残基之密码子,其可独立地为(选自)UCU(或TCT)、UCC(或TCC)、UCA(或TCA)、UCG(或TCG)、AGU(或AGT)和/或AGC密码子;
x为0至10(且优选0至5)之整数,且y为0至10(且优选0至5)之整数,使得(x+y)之总和在1与10之间,且优选为3、4、5、6、7或8;
p为0或1,且q为0或1,使得(p+q)之总和为2或1且优选为1;
n为1至10之整数(亦即,使得核苷酸序列和/或核酸包含基序(Ax-Bp-Ay-Bq)之n个重复序列,其中A、B、p、q、x及y如本文中所描述);
在基序(Ax-Bp-Ay-Bq)之各重复序列中,各A、B、p、q、x及y可独立地如本文中所描述(但根据一优选方面,在基序(Ax-Bp-Ay-Bq)之各重复序列中,各A、B、p、q、x及y系相同的);
其限制条件为超过70%、优选超过85%、更优选超过90%,诸如超过95%及高达99%及更多(包括100%)之编码甘氨酸残基的密码子(如由表I之化学式中之A表示)为GGA、GGG或GGT/GGU;
其限制条件为超过70%、优选超过85%、更优选超过90%,诸如超过95%及高达99%及更多(包括100%)之编码甘氨酸残基的密码子(如由表I之化学式中之A表示)为GGA或GGG;和/或
其限制条件为少于30%、优选少于15%、更优选少于10%,诸如少于5%及高达少于1%或更低(包括0%)之编码甘氨酸残基的密码子(如由表I之化学式中之A表示)为GGC。
在另一方面中,本发明涉及以下通式之核苷酸序列和/或核酸(Ax-B)n,
其中:
A表示编码甘氨酸残基之密码子,其可独立地为(选自)GGU(或GGT)、GGC、GGA和/或GGG密码子;且
B表示编码丝氨酸残基之密码子,其可独立地为(选自)UCU(或TCT)、UCC(或TCC)、UCA(或TCA)、UCG(或TCG)、AGU(或AGT)和/或AGC密码子;
x为1至10之整数,且优选为3、4、5、6、7或8;
n为1至10之整数(亦即,使得核苷酸序列和/或核酸包含基序(Ax-B)之n个重复序列,其中各A、B及x如本文中所描述);
在基序(Ax-B)之各重复序列中,各A、B及x可独立地如本文中所描述(但根据一优选方面,在基序(Ax-B)之各重复序列中,各A、B及x是相同的);
其限制条件为超过70%、优选超过85%、更优选超过90%,诸如超过95%及高达99%及更多(包括100%)之编码甘氨酸残基的密码子(如由表I之化学式中之A表示)为GGA、GGG或GGT/GGU;
其限制条件为超过70%、优选超过85%、更优选超过90%,诸如超过95%及高达99%及更多(包括100%)之编码甘氨酸残基的密码子(如由表I之化学式中之A表示)为GGA或GGG;和/或
其限制条件为少于30%、优选少于15%、更优选少于10%,诸如少于5%及高达少于1%或更低(包括0%)之编码甘氨酸残基的密码子(如由表I之化学式中之A表示)为GGC。
在另一方面中,本发明涉及表I中所示之化学式中之一者的核苷酸序列和/或核酸,其中:
A表示编码甘氨酸残基之密码子,其可独立地为(选自)GGU(或GGT)、GGC、GGA和/或GGG密码子;且
B表示编码丝氨酸残基之密码子,其可独立地为(选自)UCU(或TCT)、UCC(或TCC)、UCA(或TCA)、UCG(或TCG)、AGU(或AGT)和/或AGC密码子;
其限制条件为超过70%、优选超过85%、更优选超过90%,诸如超过95%及高达99%及更多(包括100%)之编码甘氨酸残基的密码子(如由表I之化学式中之A表示)为GGA、GGG或GGT/GGU;
其限制条件为超过70%、优选超过85%、更优选超过90%,诸如超过95%及高达99%及更多(包括100%)之编码甘氨酸残基的密码子(如由表I之化学式中之A表示)为GGA或GGG;和/或
其限制条件为少于30%、优选少于15%、更优选少于10%,诸如少于5%及高达少于1%或更低(包括0%)之编码甘氨酸残基的密码子(如由表I之化学式中之A表示)为GGC。
一般而言,编码Gly-Ser接头且其中所述GS接头中之甘氨酸残基显著地或排他性地由GGA、GGG或GGT/GGU密码子编码之本文中所描述的核苷酸序列及核酸在本文中亦被称为”本发明之GS接头-编码序列”。一般而言,编码Gly-Ser接头且其中所述GS接头中之甘氨酸残基显著地或排他性地由GGA或GGG密码子编码之本文中所描述的核苷酸序列及核酸在本文中亦被称为”本发明之GS接头-编码序列”。一般而言,编码Gly-Ser接头且其中所述GS接头中之甘氨酸残基中之几乎无一者或非任一者由GGC密码子编码的本文中所描述之核苷酸序列及核酸在本文中亦被称为”本发明之GS接头-编码序列”。
在本发明之一个优选但非限制性方面中,超过95%及高达99%或更多(且包括100%)之在本发明之GS接头-编码序列中编码甘氨酸残基的密码子为GGA、GGG或GGT/GGU。
在本发明之一个优选但非限制性方面中,大于95%及高达99%或更多(且包括100%)之在本发明之GS接头-编码序列中编码甘氨酸残基的密码子为GGA或GGG。
在本发明之一个优选但非限制性方面中,少于5%及高达少于1%或更低(且包括0%)之在本发明GS接头-编码序列中编码甘氨酸残基的密码子为GGC。表II给出本发明之GS接头-编码序列之一些代表性但非限制性实例。本发明之GS接头-编码序列之其他实例将基于本文中之揭示内容为技术人员所清楚。
表I:
表II:
不限于任何特定解释、假设或机制,推断使用此类核苷酸序列(亦即,相比于使用编码含有较高量/比例之GGU和/或GGC密码子之GS接头的核苷酸序列;或相比于使用编码含有较高量/比例之GGC密码子之GS接头的核苷酸序列),会降低天冬氨酸残基被错误地包括于所需GS接头(而非预期的甘氨酸残基)中之风险和/或减少在合适宿主或宿主生物体中表达时被错误地包括于所需GS接头中之天冬氨酸残基的量。
因此,当用于表达和/或产生融合蛋白质或多肽时,本发明亦减少在表达之产物中获得之污染物(亦即,含有具有一或多个天冬氨酸残基而非预期甘氨酸残基之GS接头的污染物)的量,且亦减少与所需GS接头中不期望存在之天冬氨酸残基相关的有害作用(诸如不期望的异构化形成异天冬氨酸),以及增加对蛋白降解之易感性。
因此在另一方面中,本发明涉及一种编码(融合)蛋白质或融合多肽之核苷酸序列和/或核酸,其中由该核苷酸序列和/或核酸编码之融合蛋白质或多肽包含经一或多个GS接头适合地连接之两个或更多个肽部分,其中一或多个GS接头由一或多个本发明之GS接头-编码序列编码(亦即,藉由其中超过70%、优选超过85%、更优选超过90%,诸如超过95%及高达99%及更多(包括100%)之编码GS接头中之甘氨酸残基的密码子为GGG、GGG或GGT/GGU的核苷酸序列或核酸)。
在此方面中,本发明还涉及一种编码(融合)蛋白质或融合多肽之核苷酸序列和/或核酸,其中由该核苷酸序列和/或核酸编码之融合蛋白质或多肽包含经由一或多个GS接头适当连接之两个或更多个肽部分,其中一或多个GS接头由一或多个本发明之GS接头-编码序列编码(亦即,藉由其中超过70%、优选超过85%、更优选超过90%,诸如超过95%及高达99%及更多(包括100%)之编码GS接头中之甘氨酸残基的密码子为GGG或GGG的核苷酸序列或核酸)。
在此方面中,本发明还涉及一种编码(融合)蛋白质或融合多肽之核苷酸序列和/或核酸,其中由该核苷酸序列和/或核酸编码之融合蛋白质或多肽包含经由一或多个GS接头适合地连接之两个或更多个肽部分,其中一或多个GS接头由一或多个本发明之GS接头-编码序列编码(亦即,藉由其中少于30%、优选少于15%、更优选少于10%,诸如少于5%及高达少于1%或更低(包括0%)之编码GS接头中之甘氨酸残基的密码子为GGC的核苷酸序列或核酸)。
在另一方面中,本发明涉及一种编码(融合)蛋白质或融合多肽之核苷酸序列和/或核酸,其中由该核苷酸序列和/或核酸编码之融合蛋白质或多肽包含经由一或多个GS接头适合地连接之两个或更多个肽部分,其中编码GS接头的核苷酸序列或核酸的部分为一或多个本发明之GS接头-编码序列(亦即,其中超过70%、优选超过85%、更优选超过90%,诸如超过95%及高达99%及更多(包括100%)之编码GS接头中之甘氨酸残基的密码子为GGG、GGG或GGT/GGU的核苷酸序列或核酸)。
在此方面中,本发明还涉及一种编码(融合)蛋白质或融合多肽之核苷酸序列和/或核酸,其中由该核苷酸序列和/或核酸编码之融合蛋白质或多肽包含经由一或多个GS接头适合地连接之两个或更多个肽部分,其中编码GS接头的核苷酸序列或核酸的部分为一或多个本发明之GS接头-编码序列(亦即,其中超过70%、优选超过85%、更优选超过90%,诸如超过95%及高达99%及更多(包括100%)之编码GS接头中之甘氨酸残基的密码子为GGG或GGG的核苷酸序列或核酸)。
在此方面中,本发明涉及一种编码(融合)蛋白质或融合多肽之核苷酸序列和/或核酸,其中由该核苷酸序列和/或核酸编码之融合蛋白质或多肽包含经由一或多个GS接头适合地连接之两个或更多个肽部分,其中编码GS接头的核苷酸序列或核酸的部分为一或多个本发明之GS接头-编码序列(亦即,其中少于30%、优选少于15%、更优选少于10%,诸如少于5%及高达少于1%或更低(包括0%)之编码GS接头中之甘氨酸残基的密码子为GGC的核苷酸序列或核酸)。
更一般而言,在另一方面中,本发明涉及一种包含或含有一或多个本发明之GS接头-编码序列的核苷酸序列或核酸。此类核苷酸序列或核酸优选使得在适合的宿主细胞或宿主生物体中表达后,其表达包含至少一个GS接头(亦即由本发明之GS接头-编码序列编码之GS接头)之(融合)蛋白质或多肽。
在另一方面中,本发明涉及一种用于表达或产生(融合)蛋白质或多肽之方法,其中该(融合)蛋白质或多肽包含两个或更多个经由一或多个GS接头适合地连接之肽部分,该方法包含在适合的宿主细胞或宿主生物体中适合地表达编码该(融合)蛋白质或多肽之核苷酸序列和/或核酸,其中该核苷酸序列和/或核酸包含或含有一或多个本发明之GS接头-编码序列(且进一步描述于本文中)。该方法可进一步包含分离/纯化由此表达之(融合)蛋白质或多肽的任选步骤。
在另一方面中,本发明涉及一种宿主细胞或宿主生物体,其包含编码(融合)蛋白质或多肽之核苷酸序列和/或核酸,该(融合)蛋白质或多肽包含一或多个GS接头,其中该核苷酸序列和/或核酸包含或含有一或多个本发明之GS接头-编码序列(且进一步如本文中所描述)。
在另一方面中,本发明涉及一种用于表达或产生(融合)蛋白质或多肽之方法,其中该(融合)蛋白质或多肽包含两个或更多个经由一或多个GS接头适合地连接之肽部分,该方法包含在以下条件下培养包含核苷酸序列和/或核酸之适合的宿主细胞或宿主生物体,该核苷酸序列和/或核酸包含或含有一或多个本发明之GS接头-编码序列(且进一步如本文中所描述):使得该宿主细胞或宿主生物体表达/产生该(融合)蛋白质或多肽(其中该融合蛋白质或多肽包含一或多个GS接头,亦即如本发明之GS接头-编码序列编码)。该方法可进一步包含分离/纯化由此表达之(融合)蛋白质或多肽的任选步骤。
在另一方面中,本发明涉及一种(融合)蛋白质或多肽(且特定言之,涉及包含一或多个GS接头的(融合)蛋白质或多肽),其已藉由在适合的宿主细胞或宿主生物体中表达编码该(融合)蛋白质或多肽之核苷酸序列或核酸而获得,其中该核苷酸序列或核酸含有或包含一或多个本发明之GS接头-编码序列(且如本文中进一步描述)。
在另一方面中,本发明提供一种用于降低肽接头(诸如GS接头)中之Gly向Asp错误掺入水平的方法,该方法包含在编码该肽接头的核酸序列和/或核酸中用GGG、GGA或GGT/GGU密码子置换至少一个GGC密码子之步骤。
在此方面中,本发明亦提供一种用于降低肽接头(诸如GS接头)中Gly向Asp错误掺入水平的方法,该方法包含在编码该肽接头的核酸序列和/或核酸中用GGG或GGA置换至少一个GGC密码子之步骤。
在另一方面中,本发明提供一种用于降低存在于多价(诸如二价、三价、四价)免疫球蛋白单可变结构域或纳米抗体中之肽接头(诸如GS接头)中之Gly向Asp错误掺入水平的方法,该方法包含在编码该肽接头的核酸序列和/或核酸中用GGG、GGA或GGT/GGU密码子置换至少一个GGC密码子之步骤。
在此方面中,本发明亦提供一种用于降低存在于多价(诸如二价、三价、四价)免疫球蛋白单可变结构域或纳米抗体中之肽接头(诸如GS接头)中之Gly向Asp错误掺入水平的方法,该方法包含在编码该肽接头的核酸序列和/或核酸中用GGG或GGA置换至少一个GGC密码子之步骤。
本文中所描述之核苷酸序列及核酸可为DNA或RNA(且优选为双链DNA)且可呈基因构建体之形式(例如,呈适合载体,诸如表达载体之形式)。此类基因构建体可例如除编码(融合)蛋白质或多肽之核苷酸序列以外,包含一或多种适用于表达该核苷酸序列之组件,诸如适合启动子、适合的翻译起始序列(诸如核糖体结合位点及起始密码子)、适合的终止密码子及适合的转录终止序列、3'-或5'-UTR序列、前导序列、选择标记、表达标记/报导基因和/或可有助于或增加转化或整合(之效率)的元件,所有均适合地(且若适当、可操作地)连接至编码(融合)蛋白质或多肽之核苷酸序列。此类元件之适合实例将为技术人员所清楚且可例如视其中表达该(表达)载体之宿主或宿主细胞而定。
本文中所描述之基因构建体亦可呈适用于转化预期宿主细胞或宿主生物体之形式;呈适用于整合至预期宿主细胞之基因组DNA中之形式;或呈适用于预期宿主生物体中之独立复制、维持和/或遗传之形式。举例而言,本文中所描述之基因构建体可呈载体,诸如质粒、黏粒、YAC、病毒载体或转座子之形式。特定言之,载体可为表达载体,亦即可提供体外和/或体内表达之载体(例如在适合的宿主细胞、宿主生物体和/或表达系统中)。此类基因构建体及(表达)载体形成本发明之其他方面。
优选地,本文中所描述之基因构建体之调节及其他元件使得其能够在预期宿主细胞或宿主生物体中提供其预期生物功能。
举例而言,启动子、增强子或终止子在预期宿主细胞或宿主生物体中应为”可操作的”,其意谓(例如)该启动子应能够启动或以其他方式控制/调节其可操作地连接(如本文中所定义)之核苷酸序列(例如编码序列)之转录和/或表达。
一些尤其优选启动子包括但不限于本身已知用于在本文所提及之宿主细胞中表达之启动子;且尤其用于在细菌细胞,诸如本文所提及之彼等细菌细胞中表达之启动子。
选择标记应使得其允许(亦即,在适当选择条件下)已(成功地)用核苷酸序列(如本文中所描述之)转化之宿主细胞和/或宿主生物体区别于尚未(成功地)转化之宿主细胞/生物体。此类标记之一些优选但非限制性实例为提供对抗生素(诸如卡那霉素或氨苄西林)之抗性之基因、提供耐热性之基因或允许将宿主细胞或宿主生物体在不存在某些因素、化合物和/或(食物)组分之情况下维持于培养基中的基因,所述因素、化合物和/或(食物)组分为非转化细胞或生物体之存活所必需的。
前导序列应使得(在预期宿主细胞或宿主生物体中)其允许所需翻译后修饰和/或使得其将经转录之mRNA导引至细胞之所需部分或细胞器。前导序列亦可允许自该细胞分泌表达产物。如此,前导序列可为在宿主细胞或宿主生物体中可操作之任何原序列、前序列或前原序列。细菌细胞中之表达可能不需要前导序列。举例而言,本身已知用于表达及产生抗体及抗体片段(包括但不限于单结构域抗体及ScFv片段)之前导序列可以基本上类似之方式使用。
表达标记或报导基因应使得(在宿主细胞或宿主生物体中)其允许检测基因构建体(存在于其上之基因或核苷酸序列)之表达。表达标记可任选地允许所表达之产物,例如在细胞之特定部分或细胞器中和/或多细胞生物体之特定细胞、组织、器官或部分中定位。此类报导基因亦可表达为具有经编码之氨基酸序列之蛋白质融合物。一些优选但非限制性实例包括荧光蛋白质,诸如GFP。
适合的启动子、终止子及其他元件之一些优选但非限制性实例包括可用于在本文中所提及之宿主细胞中表达之彼等启动子、终止子及其他元件;且尤其适用于在细菌细胞中表达之彼等启动子、终止子及其他元件,诸如本文中所提及之彼等启动子、终止子及其他元件。对于启动子、选择标记、前导序列、表达标记及可存在/用于本文中所描述之基因构建体中之其他元件(诸如终止子、转录和/或翻译增强子和/或整合因子)的一些(其他)非限制性实例,参考通用手册,诸如Sambrook等人,“Molecular Cloning:A Laboratory Manual”(第2版),第1-3卷,Cold Spring Harbor Laboratory Press(1989);F.Ausubel等人,编,“Current protocols in molecular biology”,Green Publishing and WileyInterscience,New York(1987)以及参考WO 95/07463、WO 96/23810、WO 95/07463、WO 95/21191、WO 97/11094、WO 97/42320、WO 98/06737、WO 98/21355、US-A-7,207,410、US-A-5,693,492及EP 1 085 089中所给出之实例。亦参考上文所引用之一般背景技术及本文中所引用之其他参考文献。
用于产生本文所述之核苷酸序列、核酸及基因构建体之技术将为技术人员所清楚且可例如包括但不限于自动化DNA合成。本文中所描述之基因构建体一般亦可藉由将本文中所描述之核苷酸序列适合地连接至上文所描述之一或多种其他元件来提供。通常,本文中所描述之基因构建体将藉由将如本文中所描述核苷酸序列或核酸插入本身已知之适合(表达)载体中来获得。此等及其他技术将为技术人员所清楚,且再次参考标准手册,诸如上文所提及之Sambrook等人及Ausubel等人。
本文中所描述之核酸和/或本文中所描述之基因构建体可用以转化宿主细胞或宿主生物体,亦即用于表达和/或产生经编码之(融合)蛋白质或多肽。适合的宿主或宿主细胞将为技术人员所清楚,且可例如为任何适合的真菌、原核或真核细胞或细胞系或任何适合的真菌、原核或真核生物体,例如:
-细菌菌株,包括但不限于革兰氏阴性菌株(gram-negative strain),诸如大肠杆菌(Escherichia coli)之菌株;变形杆菌属(Proteus)之菌株,例如奇异变形杆菌(Proteusmirabilis)之菌株;假单胞菌之菌株,例如荧光假单胞菌(Pseudomonas fluorescens)之菌株;及革兰氏阳性菌株(gram-positive strain),诸如芽孢杆菌(Bacillus)之菌株,例如枯草杆菌之菌株或短芽孢杆菌(Bacillus brevis)之菌株;链霉菌之菌株,例如青紫链霉菌之菌株;葡萄球菌属之菌株,例如肉葡萄球菌(Staphylococcus carnosus)之菌株;及乳球菌属之菌株,例如乳乳球菌(Lactococcus lactis)之菌株;
-真菌细胞,包括但不限于来自木霉属(Trichoderma)之物种,例如来自里氏木霉(Trichoderma reesei)的细胞;例如来自链孢霉(Neurospora)之物种,例如来自粗糙链孢霉(Neurospora crassa)的细胞;来自粪壳菌属(Sordaria)之物种,例如来自大孢粪壳(Sordaria macrospora)的细胞;来自曲霉属(Aspergillus)之物种,例如来自黑曲霉(Aspergillus niger)或来自大豆曲霉(Aspergillus sojae)的细胞;或来自其他丝状真菌之物种的细胞;
-酵母细胞,包括但不限于来自酵母菌属(Saccharomyces),例如酿酒酵母之物种的细胞;裂殖酵母属(Schizosaccharomyces),例如栗酒裂殖酵母(Schizosaccharomycespombe)之物种的细胞;毕赤酵母(Pichia),例如巴斯德毕赤酵母(Pichia pastoris)或甲醇毕赤酵母(Pichia methanolica)之物种的细胞;汉逊酵母(Hansenula),例如多形汉逊酵母(Hansenula polymorpha)之物种的细胞;克鲁维酵母,例如乳酸克鲁维酵母(Kluyveromyces lactis)之物种的细胞;Arxula,例如Arxula adeninivorans之物种的细胞;耶氏酵母(Yarrowia),例如解脂耶氏酵母(Yarrowia lipolytica)之物种的细胞;
-两栖动物细胞或细胞株,诸如非洲爪蟾卵母细胞(Xenopus oocytes);
-源自昆虫之细胞或细胞株,诸如源自鳞翅目之细胞/细胞系,包括但不限于夜蛾SF9及Sf21细胞或源自果蝇之细胞/细胞系,诸如施奈德(Schneider)及Kc细胞;
-植物或植物细胞,例如烟草植物中之植物或植物细胞;和/或
-哺乳动物细胞或细胞系,例如源自人类之细胞或细胞系,包括但不限于CHO-细胞、BHK-细胞(例如BHK-21细胞)及人类细胞或细胞系,诸如HeLa、COS(例如COS-7)及PER.C6细胞;
-以及本身已知用于表达及产生抗体及抗体片段(包括但不限于(单)结构域抗体及ScFv片段)之所有其他宿主或宿主细胞,其将是技术人员了解的。亦参考上文所引用之一般背景技术,以及例如WO 94/29457;WO 96/34103;WO 99/42077;Frenken等人(1998,Res.Immunol.149(6):589-99);Riechmann及Muyldermans(1999,J.Immunol.Methods,231(1-2):25-38);van der Linden(2000,J.Biotechnol.80(3):261-70);Joosten等人(2003,Microb.Cell Fact.2(1):1);Joosten等人(2005,Appl.Microbiol.Biotechnol.66(4):384-92);及本文中所引用之其他参考文献。
一些优选表达宿主为巴斯德毕赤酵母及用于表达/产生治疗蛋白质之人类细胞系。
如本文中所使用之术语”GS接头”一般系指由甘氨酸及丝氨酸残基构成和/或基本上由甘氨酸及丝氨酸残基组成之肽接头。
一般而言,此类GS接头(以及本文中所提及之其他肽接头)将含有至少5个氨基酸残基,诸如约10个氨基酸残基、约15个氨基酸残基、约20个氨基酸残基、约25个氨基酸残基、约35个氨基酸残基及高达50个或更多个氨基酸残基(尽管如此,实践中仍经常使用包含约10至40个氨基酸残基,诸如约15至约35个氨基酸残基之接头)。
通常,与丝氨酸残基之数目相比,此类接头将含有过量甘氨酸残基,例如每个丝氨酸残基有3至6个之间的甘氨酸残基。亦通常,此类接头将含有序列基序之一或多个(诸如两个或更多个)重复序列。此外,尽管在本发明中在其最广泛意义上不排除存在一或多个其他氨基酸(诸如改用谷氨酸残基,或苏氨酸残基,而非丝氨酸残基),但本文中所使用之接头优选仅含有(或意欲仅含有)甘氨酸及丝氨酸残基。
如技术人员将清楚,在蛋白质工程改造之技术中最常用(且在本发明操作中亦优选)的GS接头为包含GGGGS(SEQ ID NO:1)基序之一或多个重复序列的接头,亦即通式(Gly-Gly-Gly-Gly-Ser)n之接头,其中n可为1、2、3、4、5、6、7或更大。一些实例为15GS接头(n=3)及35GS接头(n=7)。可参考例如:Chen等人,Adv Drug Deliv.Rev.2013年10月15日;65(10):1357-1369;及Klein等人,Protein Eng.Des.Sel.(2014)27(10):325-330。
由本发明之GS接头-编码序列编码之GS接头可用于以合适方式将任何所需蛋白质、肽、肽部分、结合结构域或结合单元连接在一起,以便形成其中此类蛋白质、肽、肽部分、结合域或结合单元中之两者或更多者是通过一或多个GS接头连接在一起的(融合)蛋白质或多肽。一般而言,且如技术人员将清楚,由本发明之GS接头-编码序列编码之GS接头可用于任何目的,此系由于所述GS接头可用于和/或已用现有技术中。本发明之GS接头-编码序列(及由其编码之GS接头)之此类用途及应用将为技术人员所清楚。
在一个特定方面中,由本发明之GS接头-编码序列编码之GS接头可适合地用于将两个或更多个免疫球蛋白单可变结构域(诸如两个或更多个纳米抗体,例如VHH之纳米抗体、人源化VHH之纳米抗体、序列优化VHH之纳米抗体或骆驼化VH之纳米抗体,诸如骆驼化人类VH之纳米抗体)连接在一起,以形成二价、三价、双特异性、三特异性、双互补位、四价或其他合适的ISVD构建体。举例而言,参考Ablynx N.V.之各种申请案,诸如且不限于WO 2004/062551、WO 2006/122825、WO 2008/020079及WO 2009/068627。GS接头亦可例如用于将一或多个针对治疗靶标之免疫球蛋白单可变结构域或纳米抗体连接至提供增加之半衰期(例如增加之t1/2-β)之免疫球蛋白单可变结构域或纳米抗体,诸如针对血清白蛋白之免疫球蛋白单可变结构域或纳米抗体。同样,在此等用途或应用中,本发明之GS接头-编码序列(及由其编码之GS接头)可以与编码GS接头的已知核苷酸序列基本上相同的方式使用。此类免疫球蛋白单可变结构域或纳米抗体构建体之一些特定但非限制性实例示意性地显示于表III中,且编码此等构建体之核酸亦示意性地显示于图I中(表III之图例适用)。技术人员基于本文中之揭示内容将清楚其他实例。
表II:
现将藉助于以下非限制性优选方面、实例附图进一步描述本发明。
附图简述
图1示意性地显示含有接头的纳米抗体构建体之一些非限制性实例;
图2示意性地显示实施例1中用以说明本发明之四价纳米抗体构建体。图2亦显示T10肽在此构建体中之定位;
图3显示肽T10之氨基酸序列(SEQ ID NO:10)及密码子选择(SEQ ID NO:11)。在该序列中,其中观测到与天冬氨酸错误掺入(misincorporation)之氨基酸残基及密码子以粗体/下划线指示(应注意,对于以斜体/下划线指示之残基/密码子,可能已预期到错误掺入,但未观测到)。
图4显示纳米抗体构建体A中之35个GS接头的氨基酸序列(SEQ ID NO:12)及编码序列(SEQ ID NO:13至15)。容易发生天冬氨酸错误掺入的甘氨酸之特异性密码子(GGT及GGC)以粗体/下划线指示。丝氨酸之密码子标注于小帽中。
图5显示在UV 254nm(红色(下部)迹线)及UV 280nm(蓝色(上部)迹线)下记录之源15S柱(GE Healthcare Life Sciences)上之经纯化纳米抗体构建体A及pH梯度(绿色迹线,CX-1pH梯度缓冲液A(pH 5.6)及B(pH 10.2),Thermo Scientific)之阳离子交换层析图。pH记录显示于灰色迹线中。预峰为纳米抗体构建体A之酸性变体。合并级分14、15、16及17以用于酸性变体之后续表征,且级分18用于主峰之表征;
图6显示自经纯化纳米抗体构建体A之阳离子交换分级分离收集之酸性变体(上图)及主峰(下图)获得之Max-ent解卷积质谱。酸性级分中所量测之最重要的质量为59689.4Da,其比在pH-IEX主峰级分(59630.9Da,参见下图)中所量测之纳米抗体构建体A之质量高58道尔顿;
图7列出由Asp-N消化物(在天冬氨酸之N端处裂解之内切蛋白酶)产生之胰蛋白酶肽T10之肽片段(SEQ ID NO:16至33)。各裂解位点对应于与天冬氨酸交换之甘氨酸;
图8显示在(a)纳米抗体构建体A之GS接头中三个位点(C1、C2及C3)之Gly到Asp错误掺入的相对水平;(b)在藉由pH-IEX消耗之具有Asp错误掺入之变体之后的纳米抗体构建体A;(c)其中100%之GGC密码子序列经GGG、GGA或GGT密码子序列置换之纳米抗体构建体A;
图9显示产生以研究价数及接头长度对如实施例3中所描述之Gly到Asp错误掺入之影响的十个构建体;
图10显示9GS接头中两个位点(C1及C2)之Gly到Asp错误掺入之相对程度;(A)二价构建体、(B)三价构建体、(C)四价构建体;
图11显示20GS接头中五个位点(C1、C2、C3、C4及C5)之Gly到Asp错误掺入之相对水平;(A)二价构建体、(B)三价构建体、(C)四价构建体;
图12显示35GS接头中九个位点(C1至C9)之Gly到Asp错误掺入之相对水平;(A)二价构建体、(B)三价构建体及(C)四价构建体、(D)无GGC密码子之四价构建体。
贯穿本申请案所引用之所有参考文献(包括文献参考、颁予之专利、公开之专利申请及共同待决的专利申请)的全部内容以引用之方式明确地并入本文中,尤其对于上文所提及之教示内容。
实验部分
实施例1:
构建四价纳米抗体构建体之表达载体
在此实施例中,作为非限制性实例,本发明将使用由重链美洲驼之四个序列优化可变结构域组成的四价纳米抗体构建体说明,所述结构域与35GS接头头尾融合(参见图2)。所用总构建体(在本文中亦被称为”纳米抗体构建体A”)可由下式示意性地表示:
[A]-[35GS接头]-[B]-[35GS接头]-[C]-[35GS接头]-[C]
其中[A]、[B]及[C]表示三种不同纳米抗体且[35GS接头]表示35GS接头(亦参见图2)。
将含有纳米抗体构建体A之编码信息之DNA片段克隆至含有zeocinTM抗性基因之毕赤酵母表达载体(由等人,PLoS One.2012;7(6):e39720所描述之原始pPpT4_Alpha_S表达载体之衍生物)的多个克隆位点中,使得序列在α交配因子(aMF)信号肽序列之下游且与其在框内。
纳米抗体构建体A编码序列的转化、构建体在巴斯德毕赤酵母中的表达及分泌
转化及表达研究执行于毕赤酵母菌株NRRL Y-11430(ARS Patent CultureCollection 1815North University St.,Peoria)中。此WT菌株用以制造过度表达内源毕赤酵母辅助蛋白质KAR2(基因ID:8198455)以及纳米抗体构建体A之衍生菌株。纳米抗体构建体A与Kar2两者皆处于AOX1甲醇诱导性启动子之控制下。转化是通过标准技术且根据标准手册执行(参见例如Methods In Molecular Biology 2007,Humana Press Inc.)。如已在毕赤酵母协议中描述(再次参见标准手册),使转化体生长于含有吉欧霉素(Zeocin)之选择性培养基上且选择多个个别菌落且评估纳米抗体构建体A于BMCM培养基中之5mL摇瓶培养物中之表达水平且藉由添加甲醇诱导。在标准分批进料发酵中使用最佳表达克隆。执行甘油进料批次且藉由添加甲醇起始诱导。在2L规模下在pH 6、30℃下于甲醇进料速率为4ml/L*h之复合培养基中执行生产。
在分批进料发酵之后纯化纳米抗体构建体A
如下纯化纳米抗体构建体A:在发酵之后,经由中空纤维750kDa使细胞培养液之部分澄清,随后使用CIEX Poros XS树脂进行捕捉步骤,使用CIEX Nuvia HR-S树脂进行精制步骤且在AIEX Sartobind STIC PA上进行流通步骤。最后,使用Hydrosart 10kD薄膜,经由UF/DF执行浓缩及缓冲液交换步骤。
基于离子交换层析法对经纯化纳米抗体构建体A之分析及酸性变体之分子量的测定
藉由强阳离子交换层析,使用pH梯度(pH-IEX)分析经纯化纳米抗体构建体A。图5中所示之层析图显示洗脱为相对于主峰之预峰之群组的A之酸性变体。在酸性峰及主峰级分收集之后,藉由用电喷雾Q-TOF质谱分析测定其分子量来研究酸性变体之性质。解卷积质谱显示于图6中。在酸性级分中所观测到之主要质量为59689.4Da,其比如在pH-IEX主峰级分中所测量之纳米抗体构建体A之质量高58道尔顿。针对主峰级分(59630.9Da)中之纳米抗体构建体A所测量之质量比纳米抗体构建体A之理论分子量高12ppm,亦即在仪器之测量误差内。
58道尔顿质量差可藉由甘氨酸与酸性氨基酸天冬氨酸之交换来解释。
藉由与质谱分析联合之肽图谱反相UHPLC(RP-UHPLC-MS)分析及鉴别酸性变体
纳米抗体构建体A之酸性变体级分之肽图分析(在胰蛋白酶消化物之后)产生对具有58道尔顿之质量增量之两种肽的鉴别。如图2中示意性地显示,此等两种肽中之一者(在本文中被称为”T10肽”)对应于涵盖构建体中之第一纳米抗体的少数C端氨基酸残基、第一35Gs接头及构建体中之第二纳米抗体的少数N端氨基酸残基之序列的一部分。T10肽之氨基酸序列(SEQ ID NO:10)及核苷酸序列(SEQ ID NO:11)显示于图3中。
由于质谱仪中之碰撞诱导之片段化仅导致T10肽之部分序列覆盖,因此胰蛋白酶消化物之T10肽是通过反向层析分级分离,且随后用酶Asp-N消化。酶Asp-N为水解天冬氨酸残基之N端侧上之肽键的内切蛋白酶。因为天冬氨酸残基不在此肽之序列中,因此仅在Gly->Asp错误掺入事件之情况下预期裂解。在藉由RP-UHPLC-MS之对T10肽之Asp-N消化物的分析中,用对应于质量增量为58道尔顿之T10肽之片段的质量鉴别不同片段。如图7中所示,总共鉴别9个Asp-N片段化位点。非常出乎意料地,观测到,尽管仅在GGC密码子处(亦参见图3)且不在GGT密码子处发生Asp错误掺入,但两个甘氨酸密码子原则上皆可由天冬氨酸tRNA(具有反密码子CUG及CUA)错误读取。在两种情况下皆存在G-(mRNA)/U-(tRNA)错配,亦即翻译期间最常见之错配,连同可引起氨基酸错误掺入之摇摆位置错配(C/U和/或U/U)。因此,更一般而言,根据本发明,当编码除GGA或GGG(亦即非GGA或GGG)以外的甘氨酸之密码子存在于本发明之核苷酸序列中时,可优选的系密码子为GGT或GGU,而非GGC。
如所提及,对纳米抗体构建体A之肽图谱分析亦产生对质量增量为58道尔顿之第二肽的鉴别。发现此肽对应于存在于纳米抗体构建体A中之纳米抗体中之一者的CDR中之一者。进一步分析(资料未示出)证实,亦针对此肽,所观测到之58道尔顿质量增量最可能归因于Asp错误掺入。
实施例2:35GS接头的核酸序列中之密码子优化
存在于纳米抗体构建体A之35GS接头序列中之GGC密码子序列经GGG、GGA或GGT密码子序列置换。
所获得之纳米抗体构建体表达于毕赤酵母菌株NRRL Y-11430中且如上文所描述地纯化。藉由与上文所描述之相同方法测量所获得之多肽中Asp错误掺入水平。设置质谱仪以定量9个错误掺入位点中之3个。
在用参考纳米抗体构建体A获得之多肽的35GS接头(无密码子优化)中Asp错误掺入及用密码子优化纳米抗体构建体A获得之多肽的35GS接头中Asp错误掺入之相对水平显示于图8中。
实施例3:对其他接头中Asp错误掺入之观察
在此实施例中,研究纳米抗体价数及接头长度对Gly向Asp错误掺入之影响。为此,产生各自具有9GS、20GS或35GS接头序列及纳米抗体构件序列(不同于存在于纳米抗体构建体A中之纳米抗体构件序列)之二价、三价及四价构建体。亦产生无任何GGC密码子之额外四价、35GS接头纳米抗体构建体。十个新构建体显示于图9中。9GS接头含有2个GGC密码子,20GS接头含有5个GGC密码子且35GS接头含有9个GGC密码子。
Gly向Asp错误掺入之后的各可能的新肽用如上文所描述之质谱分析方法追踪。进一步优化该方法以允许同时定量全部9个Asp-N片段化位点。错误掺入之结果显示于图10(9GS接头)、图11(20GS接头)及图12(35GS接头)中。
由这些结果可推断,价数或接头长度对Gly向Asp错误掺入水平不具有影响。移除或减少GGC密码子之数目明确降低Gly向Asp错误掺入水平。
最后,尽管在本文中主要在GS接头方面描述本发明,但技术人员应清楚,本发明一般可应用于含有甘氨酸残基之其他肽接头。
因此,在另一方面中,本发明涉及一种编码肽接头的核苷酸序列和/或核酸,其中由核苷酸序列和/或核酸编码之肽接头含有四个或更多个甘氨酸残基,其中超过70%、优选超过85%、更优选超过90%,诸如超过95%及高达99%及更多(包括100%)之编码GS接头中之甘氨酸残基的密码子为GGA、GGG或GGT/GGU。
在此方面中,本发明还涉及一种编码肽接头的核苷酸序列和/或核酸,其中由核苷酸序列和/或核酸编码之肽接头含有四个或更多个甘氨酸残基,其中超过70%、优选超过85%、更优选超过90%,诸如超过95%及高达99%及更多(包括100%)之编码GS接头中之甘氨酸残基的密码子为GGA或GGG。
在此方面中,本发明还涉及一种编码肽接头的核苷酸序列和/或核酸,其中由核苷酸序列和/或核酸编码之肽接头含有四个或更多个甘氨酸残基,其中少于30%、优选少于1%、更优选少于10%,诸如少于5%及高达小于1%及更低(包括0%)之编码GS接头中之甘氨酸残基的密码子为GGC。
Claims (25)
1.编码肽接头的核苷酸序列和/或核酸,其中由该核苷酸序列或核酸编码之该肽接头包含甘氨酸及丝氨酸残基或(基本上)由甘氨酸及丝氨酸残基组成,其中:
超过70%、优选超过85%、更优选超过90%,诸如超过95%及高达99%及更多(包括100%)的编码所述肽接头中的甘氨酸残基的密码子为GGA、GGG或GGT/GGU;
超过70%、优选超过85%、更优选超过90%,诸如超过95%及高达99%及更多(包括100%)的编码所述肽接头中的甘氨酸残基的密码子为GGA或GGG;和/或
少于30%、优选少于15%、更优选少于10%,诸如少于5%及至多少于1%及更低(包括0%)的编码所述肽接头中的甘氨酸残基的密码子为GGC。
2.根据权利要求1的核苷酸序列和/或核酸,其中超过70%、优选超过85%、更优选超过90%,诸如超过95%及至多99%或更多(包括100%)的编码所述肽接头中的甘氨酸残基的密码子为GGA、GGG或GGT/GGU。
3.根据权利要求1或2中任一项的核苷酸序列和/或核酸,其中超过70%、优选超过85%、更优选超过90%,诸如超过95%及高达99%或更高(包括100%)的编码所述肽接头中的甘氨酸残基的密码子为GGA或GGG。
4.根据权利要求1至3中任一项的核苷酸序列和/或核酸,其中少于30%、优选少于15%、更优选少于10%,诸如少于5%及至多少于1%或更低(包括0%)的编码所述肽接头中的甘氨酸残基的密码子为GGC。
5.根据权利要求1至4中任一项的核苷酸序列和/或核酸,其中所述肽接头包含序列基序GGGGS(SEQ ID NO:1)之一或多个(诸如两个或更多个)重复序列或(基本上)由其组成。
6.根据权利要求1至5中任一项的核苷酸序列和/或核酸,其中所述肽接头为9GS接头、15GS接头、20GS接头或35GS接头。
7.根据权利要求6的核苷酸序列和/或核酸,其中所述肽接头为35GS接头。
8.编码(融合)蛋白质或融合多肽的核苷酸序列和/或核酸,其中由所述核苷酸序列和/或核酸编码的所述融合蛋白质或多肽包含经一或多个肽接头适当连接的两个或更多个肽部分,其中所述一或多个肽接头由权利要求1至7中任一项的核苷酸序列或核酸编码。
9.根据权利要求8的核苷酸序列和/或核酸,其中所述两个或更多个肽部分均为免疫球蛋白单可变结构域。
10.根据权利要求9的核苷酸序列和/或核酸,其中所述两个或更多个肽部分均为VHH的肽部分、人源化VHH的肽部分、序列优化的VHH的肽部分或骆驼化VH的肽部分,诸如骆驼化人类VH的肽部分。
11.根据权利要求8至10中任一项的核苷酸序列和/或核酸,其编码二价、三价、双特异性、三特异性、双互补位或四价构建体。
12.基因构建体,其包含根据权利要求1至11中任一项的核苷酸序列和/或核酸。
13.一种用于表达或产生(融合)蛋白质或多肽的方法,其中所述方法至少包括在适合的宿主细胞或宿主生物体中表达权利要求8至11中任一项的核苷酸序列或核酸的步骤,且任选地还包括分离/纯化因此表达的所述(融合)蛋白质或多肽的步骤。
14.根据权利要求12的表达或产生(融合)蛋白质或多肽的方法,其中所述宿主为毕赤酵母属(Pichia),诸如巴斯德毕赤酵母(Pichia pastoris)。
15.根据权利要求12的表达或产生(融合)蛋白质或多肽的方法,其中所述宿主为哺乳动物细胞,诸如中国仓鼠卵巢(CHO)细胞。
16.一种宿主细胞或宿主生物体,其包含根据权利要求8至11中任一项的编码(融合)蛋白质或融合多肽的核苷酸序列和/或核酸。
17.降低肽接头中Gly到Asp错误掺入水平的方法,所述方法包括在编码所述肽接头的核酸序列和/或核酸中用GGG、GGA或GGT/GGU密码子置换至少一个GGC密码子的步骤。
18.根据权利要求17的降低肽接头中Gly到Asp错误掺入水平的方法,其中所述至少一个GGC密码子用GGG或GGA密码子置换。
19.根据权利要求17或18中任一项的降低肽接头中Gly到Asp错误掺入水平的方法,其中所述肽接头包含序列基序GGGGS(SEQ ID NO:1)之一或多个(诸如两个或更多个)重复序列或(基本上)由其组成。
20.根据权利要求17至19中任一项的降低肽接头中Gly到Asp错误掺入水平的方法,其中所述肽接头为9GS接头、15GS接头、20GS接头或35GS接头。
21.根据权利要求17至20中任一项的降低肽接头中Gly到Asp错误掺入水平的方法,其中所述肽接头为35GS接头。
22.根据权利要求17至21中任一项的降低肽接头中Gly到Asp错误掺入水平的方法,其中所述肽接头连接两个或更多个肽部分。
23.根据权利要求22的降低肽接头中Gly到Asp错误掺入水平的方法,其中所述肽部分为免疫球蛋白单可变结构域。
24.根据权利要求23的降低肽接头中Gly到Asp错误掺入水平的方法,其中所述肽部分为VHH的肽部分、人源化VHH的肽部分、序列优化的VHH的肽部分或骆驼化VH的肽部分,诸如骆驼化人类VH的肽部分。
25.根据权利要求22至24中任一项的降低肽接头中Gly到Asp错误掺入水平的方法,其中所述肽接头包含在二价、三价、双特异性、三特异性、双互补位或四价构建体中。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862634985P | 2018-02-26 | 2018-02-26 | |
US62/634,985 | 2018-02-26 | ||
PCT/EP2019/054697 WO2019162521A1 (en) | 2018-02-26 | 2019-02-26 | Improved nucleotide sequences encoding peptide linkers |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111655296A true CN111655296A (zh) | 2020-09-11 |
Family
ID=65635665
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980010133.8A Pending CN111655296A (zh) | 2018-02-26 | 2019-02-26 | 编码肽接头的经改良核苷酸序列 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20200392512A1 (zh) |
EP (1) | EP3758755A1 (zh) |
JP (1) | JP7266611B2 (zh) |
CN (1) | CN111655296A (zh) |
AR (1) | AR114269A1 (zh) |
TW (1) | TW202000238A (zh) |
WO (1) | WO2019162521A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MX2022002747A (es) | 2019-09-10 | 2022-04-06 | Obsidian Therapeutics Inc | Proteinas de fusion de ca2-il15 para regulacion ajustable. |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102311503A (zh) * | 2007-06-06 | 2012-01-11 | 天津溥瀛生物技术有限公司 | 对多种皮肤细胞修复具持续作用的重组人血清白蛋白/fgf融合蛋白 |
JP2013520974A (ja) * | 2010-03-03 | 2013-06-10 | ベーリンガー インゲルハイム インターナショナル ゲゼルシャフト ミット ベシュレンクテル ハフツング | ニパラトープ性a−ベータ結合ポリペプチド |
CN103619878A (zh) * | 2011-06-23 | 2014-03-05 | 埃博灵克斯股份有限公司 | 结合血清白蛋白的蛋白 |
JP2014525736A (ja) * | 2011-06-23 | 2014-10-02 | アブリンクス エン.ヴェー. | IgEに対する免疫グロブリン単一可変ドメイン |
US20150158948A9 (en) * | 2011-03-28 | 2015-06-11 | Francis Descamps | Bispecific anti-cxcr7 immunoglobulin single variable domains |
CN105274125A (zh) * | 2008-09-26 | 2016-01-27 | 托卡根公司 | 基因治疗载体和胞嘧啶脱氨酶 |
EP3037530A1 (en) * | 2014-12-22 | 2016-06-29 | Sandoz Ag | Sequence variants |
WO2016126213A1 (en) * | 2015-02-06 | 2016-08-11 | National University Of Singapore | Methods for enhancing efficacy of therapeutic immune cells |
WO2017186928A1 (en) * | 2016-04-29 | 2017-11-02 | Curevac Ag | Rna encoding an antibody |
CN107557341A (zh) * | 2017-09-30 | 2018-01-09 | 山东兴瑞生物科技有限公司 | 一种抗wt1增强型嵌合抗原受体修饰的免疫细胞及其应用 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK0702721T3 (da) | 1993-06-09 | 2001-05-21 | Unilever Nv | Fremgangsmåde til fremstilling af fusionsproteiner, der omfatter ScFv fragmenter, ved hjælp af en transformeret skimmelsvamp |
ATE400651T1 (de) | 1993-09-10 | 2008-07-15 | Univ Columbia | Verwendung von grünem fluoreszenzprotein |
WO1995021191A1 (en) | 1994-02-04 | 1995-08-10 | William Ward | Bioluminescent indicator based upon the expression of a gene for a modified green-fluorescent protein |
US5625048A (en) | 1994-11-10 | 1997-04-29 | The Regents Of The University Of California | Modified green fluorescent proteins |
EP0739981A1 (en) | 1995-04-25 | 1996-10-30 | Vrije Universiteit Brussel | Variable fragments of immunoglobulins - use for therapeutic or veterinary purposes |
US5693492A (en) | 1995-05-05 | 1997-12-02 | Merck & Co., Inc. | DNA encoding glutamate gated chloride channels |
DK0851874T3 (da) | 1995-09-22 | 2000-03-06 | Bioimage A S | Hidtil ukendte varianter af grønt fluorescerende protein, GFP |
US6027881A (en) | 1996-05-08 | 2000-02-22 | The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services | Mutant Aequorea victoria fluorescent proteins having increased cellular fluorescence |
US6124128A (en) | 1996-08-16 | 2000-09-26 | The Regents Of The University Of California | Long wavelength engineered fluorescent proteins |
WO1998021355A1 (en) | 1996-11-15 | 1998-05-22 | Life Technologies, Inc. | Mutants of green fluorescent protein |
BR9907950A (pt) | 1998-02-19 | 2001-12-18 | Xcyte Therapies Inc | Composições e processos para regulagem deativação de linfócitos |
GB9922124D0 (en) | 1999-09-17 | 1999-11-17 | Pfizer Ltd | Phosphodiesterase enzymes |
EP1373501A2 (en) | 2000-10-06 | 2004-01-02 | Novartis AG | Targeting molecules for adenoviral vectors |
RU2357974C2 (ru) | 2003-01-10 | 2009-06-10 | Аблинкс Н.В. | Терапевтические полипептиды, их гомологи, их фрагменты и их применение для модуляции агрегации, опосредованной тромбоцитами |
US7207410B2 (en) | 2004-04-29 | 2007-04-24 | Daimlerchrysler Corporation | Apparatus and method for enhanced impact sensing |
NZ563392A (en) | 2005-05-20 | 2009-12-24 | Ablynx Nv | Improved Nanobodies(TM) for the treatment of aggregation-mediated disorders |
EP2057191A1 (en) | 2006-08-18 | 2009-05-13 | Ablynx N.V. | Amino acid sequences directed against il-6r and polypeptides comprising the same for the treatment of deseases and disorders associated with il-6-mediated signalling |
US8975382B2 (en) | 2007-11-27 | 2015-03-10 | Ablynx N.V. | Amino acid sequences directed against HER2 and polypeptides comprising the same for the treatment of cancers and/or tumors |
AU2013243953A1 (en) | 2012-04-02 | 2014-10-30 | Modernatx, Inc. | Modified polynucleotides for the production of nuclear proteins |
WO2014012085A2 (en) | 2012-07-13 | 2014-01-16 | Zymeworks Inc. | Bispecific asymmetric heterodimers comprising anti-cd3 constructs |
CN104277118A (zh) | 2014-07-14 | 2015-01-14 | 天津科技大学 | 重组人骨形态发生蛋白异源二聚体蛋白及高效表达和复性方法 |
-
2019
- 2019-02-26 EP EP19708448.6A patent/EP3758755A1/en not_active Withdrawn
- 2019-02-26 JP JP2020544858A patent/JP7266611B2/ja active Active
- 2019-02-26 AR ARP190100462A patent/AR114269A1/es unknown
- 2019-02-26 CN CN201980010133.8A patent/CN111655296A/zh active Pending
- 2019-02-26 US US16/975,422 patent/US20200392512A1/en not_active Abandoned
- 2019-02-26 TW TW108106562A patent/TW202000238A/zh unknown
- 2019-02-26 WO PCT/EP2019/054697 patent/WO2019162521A1/en unknown
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102311503A (zh) * | 2007-06-06 | 2012-01-11 | 天津溥瀛生物技术有限公司 | 对多种皮肤细胞修复具持续作用的重组人血清白蛋白/fgf融合蛋白 |
CN105274125A (zh) * | 2008-09-26 | 2016-01-27 | 托卡根公司 | 基因治疗载体和胞嘧啶脱氨酶 |
JP2013520974A (ja) * | 2010-03-03 | 2013-06-10 | ベーリンガー インゲルハイム インターナショナル ゲゼルシャフト ミット ベシュレンクテル ハフツング | ニパラトープ性a−ベータ結合ポリペプチド |
US20150158948A9 (en) * | 2011-03-28 | 2015-06-11 | Francis Descamps | Bispecific anti-cxcr7 immunoglobulin single variable domains |
CN103619878A (zh) * | 2011-06-23 | 2014-03-05 | 埃博灵克斯股份有限公司 | 结合血清白蛋白的蛋白 |
JP2014525736A (ja) * | 2011-06-23 | 2014-10-02 | アブリンクス エン.ヴェー. | IgEに対する免疫グロブリン単一可変ドメイン |
EP3037530A1 (en) * | 2014-12-22 | 2016-06-29 | Sandoz Ag | Sequence variants |
WO2016126213A1 (en) * | 2015-02-06 | 2016-08-11 | National University Of Singapore | Methods for enhancing efficacy of therapeutic immune cells |
WO2017186928A1 (en) * | 2016-04-29 | 2017-11-02 | Curevac Ag | Rna encoding an antibody |
CN107557341A (zh) * | 2017-09-30 | 2018-01-09 | 山东兴瑞生物科技有限公司 | 一种抗wt1增强型嵌合抗原受体修饰的免疫细胞及其应用 |
Non-Patent Citations (4)
Title |
---|
RORY E. SALLACH,等: "Expression of a Recombinant Elastin-Like Protein in Pichia pastoris", vol. 25, no. 6, pages 1810 - 1818, XP002697124, DOI: 10.1002/btpr.208 * |
RYAN TRINH,等: "Optimization of codon pair use within the (GGGGS)3 linker sequence results in enhanced protein expression", vol. 40, no. 10, pages 717 - 722, XP008153821, DOI: 10.1016/j.molimm.2003.08.006 * |
XIAOYING CHEN,等: "Fusion protein linkers: Property, design and functionality", vol. 65, pages 1357 - 1369, XP028737352, DOI: 10.1016/j.addr.2012.09.039 * |
ZHONGQI ZHANG,等: "G/U and Certain Wobble Position Mismatches as Possible Main Causes of Amino Acid Misincorporations", vol. 52, pages 1 - 2 * |
Also Published As
Publication number | Publication date |
---|---|
AR114269A1 (es) | 2020-08-12 |
TW202000238A (zh) | 2020-01-01 |
JP7266611B2 (ja) | 2023-04-28 |
JP2021514638A (ja) | 2021-06-17 |
US20200392512A1 (en) | 2020-12-17 |
WO2019162521A1 (en) | 2019-08-29 |
EP3758755A1 (en) | 2021-01-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2010243551B2 (en) | Method for the production of domain antibodies | |
AU2017216864B2 (en) | Method for the production of immunoglobulin single variable domains | |
JP6545153B2 (ja) | 発現方法 | |
US20150023963A1 (en) | Method for the production of variable domains | |
EP2632946B1 (en) | Method for the production of immunoglobulin single variable domains | |
EP2912053A1 (en) | Expression sequences | |
JP6748061B2 (ja) | 二重シストロン細菌発現システム | |
CN111655296A (zh) | 编码肽接头的经改良核苷酸序列 | |
EP2990485B1 (en) | Fd chain gene or l chain gene each capable of increasing secretion amount of fab-type antibody | |
EP2489724A1 (en) | Hansenula polymorpha capable of producing antibody, process for production of antibody utilizing same, and antibody produced from same | |
JPWO2020045530A1 (ja) | ペプチドタグを利用したタンパク質の可溶性発現 | |
JP6188574B2 (ja) | 発現プロセス | |
JP6387345B2 (ja) | 新規ポリペプチド及びその用途 | |
JP6387346B2 (ja) | 新規ポリペプチド及びその用途 | |
US10655112B2 (en) | Polypeptide having endonuclease activity and method for producing the same | |
CN116615462A (zh) | 抗体构建体的表达技术 | |
CN117402885A (zh) | 编码泽贝妥单抗的核酸分子及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
AD01 | Patent right deemed abandoned |
Effective date of abandoning: 20240419 |
|
AD01 | Patent right deemed abandoned |