WO2016114567A1 - 신규 항체 라이브러리 제조방법 및 이로부터 제조된 라이브러리 - Google Patents

신규 항체 라이브러리 제조방법 및 이로부터 제조된 라이브러리 Download PDF

Info

Publication number
WO2016114567A1
WO2016114567A1 PCT/KR2016/000320 KR2016000320W WO2016114567A1 WO 2016114567 A1 WO2016114567 A1 WO 2016114567A1 KR 2016000320 W KR2016000320 W KR 2016000320W WO 2016114567 A1 WO2016114567 A1 WO 2016114567A1
Authority
WO
WIPO (PCT)
Prior art keywords
cdr
sequence
antibody
light chain
amino acid
Prior art date
Application number
PCT/KR2016/000320
Other languages
English (en)
French (fr)
Inventor
심현보
김지혜
백설련
Original Assignee
이화여자대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이화여자대학교 산학협력단 filed Critical 이화여자대학교 산학협력단
Priority to EP16737531.0A priority Critical patent/EP3246434A1/en
Publication of WO2016114567A1 publication Critical patent/WO2016114567A1/ko
Priority to US15/648,137 priority patent/US20170362306A1/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • G16B35/10Design of libraries
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/005Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies constructed by phage libraries
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1037Screening libraries presented on the surface of microorganisms, e.g. phage display, E. coli display
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/10Libraries containing peptides or polypeptides, or derivatives thereof
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • G16B35/20Screening of libraries
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/60In silico combinatorial chemistry
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/20Immunoglobulins specific features characterized by taxonomic origin
    • C07K2317/21Immunoglobulins specific features characterized by taxonomic origin from primates, e.g. man
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/54F(ab')2
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/55Fab or Fab'
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/56Immunoglobulins specific features characterized by immunoglobulin fragments variable (Fv) region, i.e. VH and/or VL
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/56Immunoglobulins specific features characterized by immunoglobulin fragments variable (Fv) region, i.e. VH and/or VL
    • C07K2317/565Complementarity determining region [CDR]
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/56Immunoglobulins specific features characterized by immunoglobulin fragments variable (Fv) region, i.e. VH and/or VL
    • C07K2317/567Framework region [FR]
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/60Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments
    • C07K2317/62Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments comprising only variable region components
    • C07K2317/622Single chain antibody (scFv)

Definitions

  • the present invention relates to novel antibody library preparation methods and libraries prepared therefrom.
  • Phage display is a technique that genetically manipulates bacterial bacteriophage to allow genotypes (genes) and phenotypes (proteins) to be linked through a single phage particle.
  • genotypes genes
  • phenotypes proteins
  • the gene as a genotype is inserted as part of a phage gene, and the protein as a phenotype is presented on the surface of the phage particle containing the gene of the protein.
  • Antibodies are particularly useful examples of phage surface presentation techniques.
  • By presenting an antibody library having a very high diversity on the surface of the phage and binding to the surface-adsorbed antigen it is possible to obtain genes of antibody clones that selectively bind to the antigen.
  • This is a very effective method of obtaining antibodies without going through an experimental animal, and in particular, since human antibodies to any antigen can be obtained, they have very high utility in the development of new therapeutic antibodies and the like with less immune response in the human body.
  • the quality of the library is important, especially the size and functional diversity of the library and the quality of the clone.
  • the size of the library is one of the most important factors in determining the quality of the antibody selected therefrom.
  • the antigen binding site of the antibody library theoretically has a random diversity that is not mild to any particular antigen, and antibodies that selectively bind to specific antigens by pure chance occur in random diversity. Therefore, as the size of the library increases, ie, the number of different antibodies in the library increases, the probability of finding antibodies with high selectivity and affinity by chance increases. In general, it is recognized that a minimum size of 10 8 or more is required, and a large number of antibody libraries have sizes of 10 9-10 11 .
  • the functional diversity of the library is the proportion of the clones that actually express the antibody among the clones that make up the library. Even if the size of the library is large, if the functional diversity is low, the actual library size is reduced. The lack of functional diversity is largely due to errors in DNA synthesis and amplification during library construction. Antibody libraries are constructed through multiple stages of polymerase chain reaction (PCR), which inevitably leads to low frequency errors due to the nature of enzymes and reactions, and when these errors accumulate, functional diversity of the final library is reduced. Also, especially in synthetic libraries, errors are more likely to be introduced due to efficiency problems of base synthesis. As such, the problem of functional diversity tends to be particularly prominent in synthetic libraries, and most synthetic libraries require design considerations to avoid these problems.
  • PCR polymerase chain reaction
  • the quality of the individual clones that make up the library is also one of the factors that determine the performance of the antibody library. These factors must be considered from the design stage of the synthetic antibody library in order to select an antibody engineering clone.
  • the resulting diversity should be designed to have compatibility with the antibody backbone, and the rapid change from the amino acid sequence of the natural antibody may result from the artificial synthetic antibody. There is a risk of impairing the suitability and stability. Therefore, when designing artificial diversity, effectively mimicking natural diversity is very important in the design and construction of synthetic antibody libraries.
  • antibody libraries composed of antibodies of various sequences may include sites that may cause unwanted protein modifications, such as glycosylation, oxidation, isomerization, and deamidation. Can adversely affect
  • each aging antibody in particular, the sequence of complementarity determining regions (CDRs) that bind to the antigen, is derived from the germline gene sequence, and various sequences different from the germline CDR sequences are generated through recombination and mutation.
  • CDRs complementarity determining regions
  • the present inventors have tried to construct a high-quality synthetic human antibody library of high functional diversity, consisting of antibodies similar to those of natural antibodies and having excellent physical properties through an efficient and rapid process.
  • the present invention was completed by analyzing the sequence, constructing the sequence, and then synthesizing and constructing a library composed of antibodies similar to those of natural antibodies and having excellent physical properties.
  • CDRs complementarity determining regions
  • Another object of the present invention is to provide an antibody library prepared by the method for producing the antibody library.
  • the antibody library prepared by the present invention can be usefully used as an antibody library including a plurality of unique sequences as well as functional diversity, including antibodies having excellent physical properties for many antigens.
  • 1 is a schematic diagram showing the concept of designing a CDR site.
  • FIG. 2 is a schematic diagram showing a method for preparing a scFv library using six non-combinatorially diversified CDRs.
  • a pool of oligonucleotides with the designed CDR sequences is sequenced and amplified by PCR.
  • FIG. 3 is a diagram showing the expression using the HA tag by randomly selecting the scFv clone before selection from the library to confirm whether the expression of the scFv in the antibody library of the present invention. Specifically, 92 clones were randomly selected, cultured and treated with IPTG, and the expression of full-length scFV in the eluate was confirmed by anti-HA antibody, and 58 out of 92 expression was confirmed (63%).
  • FIG. 4 is a schematic diagram illustrating the steps of producing an antibody library of the present invention.
  • Figure 5a is a diagram showing the results of the sequencing of the DNA after the purification of the randomly selected clones from the antibody library of the present invention OL (odd-lambda) library, amplified by the PCR technique.
  • Figure 5b is a diagram showing the results of the sequencing of the DNA after purification of any of the clones of the antibody library of the present invention, especially the EL (even-lambda) library, amplification of the scFv gene by PCR techniques.
  • Figure 5c is a diagram showing the results of the purification and sequencing of DNA after selecting any clones from the antibody library of the present invention in particular OK (odd-kappa) library, amplify the scFv gene by PCR technique.
  • FIG. 5D is a diagram illustrating the results of sequencing the DNA after selecting arbitrary clones from the antibody library of the present invention, especially the EK (even-kappa) library, amplifying the scFv gene by PCR, and then purifying the DNA.
  • FIG. 6 is a graph of the design of the library and the frequency of native CDR sequences of the actual CDR repertoire.
  • the CDR sequences found from the NGS analysis of the actually prepared scFv library and the frequency of occurrence of each unique CDR sequence in the designed CDR repertoire are shown in the XY distribution graph. Each point in the graph represents a unique CDR sequence.
  • CDR-H3 sequences, on the other hand, were not analyzed because most sequences only occur once in the designed repertoire.
  • FIG. 7 is a diagram showing various domain sequence overlaps of the prepared library.
  • 300 bp paired-end sequencing on the Illumina MiSeq platform yielded the various domain sequences of the unselected library and analyzed the number of overlaps (n) for the various domain sequences.
  • CDR-H2, L1 (kappa and lambda), and L3 (kappa and lambda) comprise sequences of various lengths. Comparing the length distribution in the designed repertoire with the length distribution analyzed in Next generation sequencing (NGS), the results suggest that short CDRs are preferred in the actual library.
  • NGS Next generation sequencing
  • the preference for short CDRs was particularly apparent in CDR-H3, which has a wide range of length diversity over other CDRs.
  • the blue bar (“design”) shows the frequency of each CDR length in the design repertoire
  • the orange bar (“check in library”) shows the next generation sequencing of the prepared library (Next). generation sequencing (NGS) shows the frequency of each CDR length.
  • FIG. 9 is a diagram showing the amino acid distribution of CDR-H3.
  • the amino acid distribution of each position of CDR-H3 of natural human antibody (N), designed repertoire (D), and actually prepared library (L) is shown.
  • Each overlapping bar represents the sum of the amino acid frequencies at each Kabat position of CDR-H3 of different lengths. For all CDR-H3s with different lengths, the last three amino acid residues were denoted 100j, 101 and 102, respectively.
  • one aspect of the present invention comprises the steps of individually designing the complementarity Determining Regions (CDRs) sequence of the antibody; And synthesizing an antibody comprising the complementarity determining regions having the designed sequence to prepare a library.
  • CDRs complementarity Determining Regions
  • the present invention provides a heavy chain complementarity determining region 1 (CDR-H1), heavy chain complementarity determining region 2 (CDR-H2), heavy chain complementarity determining region 3 ( CDR-H3), light chain complementarity determining region 1 (CDR-L1), light chain complementarity determining region 2 (CDR-L2) and light chain complementarity determining region 3 (CDR-L3) has a polymorphism, Provides a method of making.
  • CDR-H1 heavy chain complementarity determining region 1
  • CDR-H2 heavy chain complementarity determining region 2
  • CDR-H3 heavy chain complementarity determining region 3
  • CDR-L1 light chain complementarity determining region 1
  • CDR-L2 light chain complementarity determining region 2
  • CDR-L3 light chain complementarity determining region 3
  • the light chain when designing the light chain of the complementarity determining region sequence, the light chain may be a kappa light chain and / or lambda (lambda) light chain.
  • the present invention relates to i) germline of the complementarity determining region of an actual human-derived mature antibody with respect to CDR-H1, CDR-H2, CDR-L1 or CDR-L2 in the individual design of complementarity determining region sequences.
  • germline The frequency of use of immunoglobulin genes, ii) the frequency of mutation to each 20 amino acids by somatic hypermutation at each amino acid position, iii) the frequency by length of complementarity determining region sequences, or iv) a combination of these
  • a method of manufacturing an antibody library in which a simulated sequence is designed by reflecting the frequency of each amino acid position.
  • the present invention relates to CDR-L3 in the individual design of complementarity determining region sequences.
  • a) 7 to 8 amino acid sequences from the N terminus of the complementarity determining region are i) frequency of germline immunoglobulin gene use in the complementarity determining region of human-derived mature antibody, ii) somatic hypermutation at each amino acid position
  • the frequency of mutation to each 20 amino acids by iii) the frequency of each CDR-L3 sequence of the complementarity determining region, or iv) a combination of these to design a simulated sequence that reflects the frequency of each amino acid position calculated ;
  • the CDR-L3 is composed of 9 to 11 amino acids, the frequency analysis is analyzed by dividing each length, the design of the CDR-L3 sequence is human-derived having the same amino acid length as the length of the CDR-L3 to be designed Provided is a method for producing an antibody library, which is designed based on the analysis result of the complementarity determining region CDR-L3 of a mature antibody.
  • the present invention provides a method for preparing an antibody library, wherein when the light chain of the complementarity determining region sequence is designed, the light chain is a kappa light chain or a lambda light chain. .
  • the present invention relates to CDR-H3 in the individual design of complementarity determining region sequences.
  • sequences excluding three amino acids from the C terminus of the complementarity determining region design a simulated sequence reflecting the frequency of each amino acid position of the complementarity determining region of an actual human-derived antibody
  • the three amino acid sequences from the C terminus of the complementarity determining region are designed to simulate the sequence reflecting the calculated frequency by analyzing the frequency of the corresponding three amino acid sequences of the complementarity determining region of the human-derived mature antibody. ;
  • the CDR-H3 is composed of 9 to 20 amino acids, the frequency analysis is analyzed by dividing each length, the design of the CDR-H3 sequence is human-derived having the same amino acid length as the length of the CDR-H3 to be designed
  • the present invention further comprises the step of designing the complementarity determining region amino acid sequence and then excluding the sequence in which the N-glycosylation, isomerization, deamidation, cleavage, oxidation can occur in the designed sequence.
  • a method of producing an antibody library is provided.
  • the present invention is designed for the complementarity determining region amino acid sequence, and then reverse translation of the designed sequence into a polynucleotide, and then the human antibody reproduction corresponding to the translated polynucleotide 5 'and 3' terminal, respectively It provides a method for producing an antibody library, further comprising the step of designing an oligonucleotide sequence connecting the variable region framework region of the germline gene.
  • the present invention is the antibody coding for VH3-23 (Genebank accession No. Z12347), VK3-A27 (Genebank accession No. X93639), VL1g (GenBank accession No. Z73663) or fragments thereof It provides a method for producing an antibody library comprising an amino acid sequence.
  • the present invention provides a method for preparing an antibody library, wherein, in the individual design of the complementarity determining region sequence, CDRs are designed for kappa light and lambda light chains respectively in designing the light chain complementarity determining region. to provide.
  • the present invention when designing each light chain variable region for the kappa light and lambda light chain, the CDR of the kappa light chain is assembled by connecting to the kappa light chain framework region of VK3-A27, the CDR of the lambda light chain Provided is a method for producing an antibody library, which is assembled by linking with a lambda light chain framework region of VL1g.
  • the antibody is a group consisting of IgA, IgD, IgE, IgM, IgG, Fc fragment, Fab, Fab ', F (ab') 2 , scFv, single variable domain antibody and Fv
  • the present invention provides a method for preparing an antibody library, which corresponds to any one or more of the following 1) to 6):
  • the germline CDR sequence for CDR-H1 of the heavy chain uses the amino acid sequence of SEQ ID NOs: 54 to 84;
  • the germline CDR sequences for CDR-H2 of the heavy chain use the amino acid sequences of SEQ ID NOs: 85 to 121;
  • the kappa light chain is used as the germline CDR sequence used for the light chain CDR design, and the germline CDR sequence for CDR-L1 of the kappa light chain uses the amino acid sequence of SEQ ID NOs: 122-145;
  • the kappa light chain is used as the germline CDR sequence used for the light chain CDR design, and the germline CDR sequence for CDR-L2 of the kappa light chain uses the amino acid sequence of SEQ ID NOs: 146 to 165;
  • the lambda light chain is used as the germline CDR sequence used for the light chain CDR design, and the germline CDR sequence for CDR-L2 of the lambda light chain uses the amino acid sequence of SEQ ID NOs: 190 to 209.
  • the present invention provides a method for preparing an antibody library, which corresponds to any one or more of the following 1) to 2):
  • the kappa light chain is used as the germline CDR sequence for use in light chain CDR design, and the germline CDR sequence for CDR-L3 of the kappa light chain uses the amino acid sequence of SEQ ID NOs: 210 to 236;
  • the lambda light chain is used as the germline CDR sequence used for light chain CDR design, and the germline CDR sequence for CDR-L3 of the lambda light chain uses the amino acid sequence of SEQ ID NOs: 237-252.
  • the present invention is that the frequency of use of each germline CDR sequence simulates the frequency of use of each germline CDR sequence in a natural human antibody found through analysis of the antibody sequence database, Provides a way to build a library.
  • Another aspect of the present invention provides an antibody library produced by the method for producing the antibody library.
  • the present invention provides an antibody library, wherein the antibody library corresponds to one or more of the following 1) to 9):
  • the germline CDR sequences for CDR-H1 of the heavy chain use the amino acid sequences of SEQ ID NOs: 54 to 84;
  • the germline CDR sequences for CDR-H2 of the heavy chain use the amino acid sequences of SEQ ID NOs: 85 to 121;
  • CDR-H3 of heavy chain is 9-20 amino acids in length, frequency of each amino acid and frequency of amino acid use at each position is frequency of CDR-H3 of natural human antibody sequences and amino acid use frequency at each position Form to simulate;
  • the kappa light chain is used as the germline CDR sequence for use in light chain CDR design, and the germline CDR sequence for CDR-L1 of the kappa light chain uses the amino acid sequence of SEQ ID NOs: 122-145;
  • the kappa light chain is used as the germline CDR sequence for use in light chain CDR design, and the germline CDR sequence for CDR-L3 of the kappa light chain uses the amino acid sequence of SEQ ID NOs: 210 to 236;
  • the lambda light chain is used as the germline CDR sequence used for light chain CDR design, and the germline CDR sequence for CDR-L3 of the lambda light chain uses the amino acid sequence of SEQ ID NOs: 237-252.
  • the present invention provides the reproductive frequency of each germline CDR sequence in the case of 1) to 2) and 4) to 9) in each natural human antibody determined through analysis of an antibody sequence database.
  • An antibody library is provided that simulates the frequency of use of a series of CDR sequences.
  • the phage display manipulates the genes of the M13 bacteriophage to fuse the foreign protein gene to one of the surface proteins, and the external protein is fused to the surface protein of the produced phage and presented on the surface of the phage. Is a technique. Surface presentation of proteins often fuses exogenous genes to the 5 'side of the gIII gene.
  • Antibody refers to a protein that specifically binds to a target antigen and includes both polyclonal and monoclonal antibodies.
  • the term also includes forms produced by genetic engineering such as chimeric antibodies (eg, humanized murine antibodies) and heterologous antibodies (eg, bispecific antibodies).
  • the antibody is a heterotetramer composed of two light chains and a heavy chain, and each chain has a variable domain having a variable amino acid sequence and a constant domain having a constant sequence. ), But is not limited to the above form.
  • the antibody includes IgA, IgD, IgE, IgM and IgG, and IgG is a subtype, and includes IgG1, IgG2, IgG3 and IgG4, and may include an antibody fragment.
  • Antibody fragments refer to fragments possessing antigen binding function and include Fc fragments, Fab, Fab ', F (ab') 2 , scFv, single variable domain antibodies and Fv, and the like, and include antigen binding forms of antibodies .
  • the Fc fragment refers to a terminal region of an antibody capable of binding to a cell surface receptor such as an Fc receptor, and is composed of the second or third constant domains of two heavy chains of the antibody.
  • the Fab has one antigen binding site in a structure having a variable region of the light and heavy chains, a constant region of the light chain and a first constant region of the heavy chain (CH1).
  • F (ab ') 2 antibodies are produced when the cysteine residues of the hinge region of Fab' form disulfide bonds.
  • Fv (variable fragment) means a minimum antibody fragment having only the heavy chain variable region and light chain variable region.
  • the double chain Fv (dsFv, disulfide-stabilized variable frament) is a disulfide bond that connects the heavy chain variable region and the light chain variable region
  • the single chain Fv (scFv, single chain variable frament) is generally a peptide linker (VH) )
  • the variable region (VL) of the light chain are covalently linked.
  • a single variable domain antibody refers to an antibody fragment consisting of only one heavy or light chain variable domain.
  • Antibodies of the invention include recombinant single chain Fv fragments (scFv) and include, without limitation, all bivalent or bispecific molecules, diabodies, triabodies and tetrabodies.
  • scFv single chain Fv fragments
  • Complementarity determining region is a region that exists in each of the light and heavy chains of the variable domain and is particularly highly variable in the amino acid sequence among the variable domains. Antibodies can be found.
  • the three complementarity determining regions of the heavy chain are called CDR-H1, CDR-H2, CDR-H3 in order from the amino terminus to the carboxyl terminus, and the three complementarity determining regions of the light chain are sequentially ordered from the amino terminus to the carboxyl terminus.
  • the "skeleton site” refers to a site other than the complementarity determining site in the variable domain sequence, and refers to a site having low variability and diversity of the sequence compared to the complementarity determining site and generally not participating in an antigen-antibody reaction.
  • Immunoglobulin is a concept including antibody-like molecules and antibodies having the same structural characteristics as antibodies and having no antigen specificity.
  • a "germline immunoglobulin gene” is an antibody gene that has been differentiated into B cells in the germline of an animal and has not undergone recombination or somatic hypermutation of the immunoglobulin gene, and the number is depending on the species of the animal. It is different but usually tens to hundreds.
  • a “matured antibody” is an antibody protein expressed from an antibody gene produced through recombination of germline immunoglobulin genes through B cell differentiation, or through recombination and somatic hypermutation.
  • a "single-chain Fv” is a protein that connects the variable domains of the light and heavy chains of an antibody with a linker consisting of peptide chains of about 15 amino acids.
  • Light chain variable domains-linking sites-heavy chain variable domains, or heavy chain variable domains-linking sites-light chain variable domains can be in any order and have the same or similar antigenicity as the original antibody.
  • the linking site is a hydrophilic flexible peptide chain consisting mainly of glycine and serine, and 15 amino acid sequences or similar sequences of "(Gly-Gly-Gly-Gly-Ser) 3 " may be mainly used.
  • an “antibody library” is a collection of various antibody genes with different sequences. Very high diversity is required to isolate antibodies specific for any antigen from the antibody library, and libraries of 10 9 to 10 11 different antibody clones are generally constructed and used. The antibody gene constituting such an antibody library is cloned into a phagemid vector and transformed into E. coli.
  • a "phagemid" vector is a plasmid DNA having a phage origin of replication.
  • the antibiotic resistance gene has a selection marker.
  • the phagemid vector used for phage surface expression includes the gIII gene of M13 phage or a part thereof, and the library gene is ligated at the 5 'end of the gIII gene to be expressed as a fusion protein in E. coli.
  • helper phage is a phage that provides the genetic information needed for phagemids to be assembled into phage particles. Since phagemid contains only gIII or a part of phage gene, E. coli transformed with phagemid is infected with an auxiliary phage to supply the remaining phage gene. There are M13K07 or VCSM13, and most of them contain antibiotic resistance genes such as kanamycin, which allows you to select E. coli infected with auxiliary phage. In addition, since there is a defect in the packaging signal, the phagemid gene is selectively assembled into the phage particle rather than the auxiliary phage gene.
  • “Panning” refers to the process of selectively amplifying only clones that bind to specific molecules from a library of proteins, such as antibodies displayed on the phage surface.
  • Phage library is added to target molecules immobilized on the surface to induce binding, and unbound phage clones are washed and removed, and only the bound phage clones are eluted to infect the E. coli host, and target binding phage clones using auxiliary phage. Amplify them. In most cases, this process is repeated three to four times or more to maximize the proportion of binding clones.
  • the present invention comprises the steps of individually designing the complementarity Determining Regions (CDRs) sequence of the antibody; And synthesizing an antibody comprising the complementarity determining regions having the designed sequence to prepare a library.
  • CDRs complementarity Determining Regions
  • Antibody libraries can be constructed by obtaining their diversity from B cells contained in bone marrow, spleen, blood, etc., and by gaining diversity through artificial design and synthesis.
  • the present invention provides for the construction and validation of synthetic human antibody libraries. .
  • Phage surface-presenting antibody libraries are constructed in the form of Fab or scFv fragments that are part of an immunoglobulin molecule. Because these fragments are smaller than immunoglobulins of 150 kDa size, they allow for the efficiency of protein engineering manipulations and have the same antigen selectivity as immunoglobulin molecules.
  • a library using a scFv fragment having a size of 25 kDa was constructed. Specifically, the VH domain and VL domain of an immunoglobulin were linked by a chain of 15 amino acids, that is, (Gly-Gly-Gly-Gly-Ser) 3 . One polypeptide chain.
  • synthetic antibody libraries are constructed based on one or a limited number of skeletal sequences.
  • the antibody library prepared in one specific embodiment of the present invention has two backbones. Specifically, all the clones of the library were constructed to have scFv, which is a linkage between the VH3-23 and VK3-A27 genes of human immunoglobulin, or scFv, which is the linkage between the VH3-23 and VL1g genes. Among them, a library was constructed by introducing artificial diversity into the complementarity determining region. In other words, scFv antibody libraries were prepared by inserting various complementarity determining region (CDR) sequences into the backbone of the library.
  • CDR complementarity determining region
  • the antibody library of the present invention heavy chain complementarity determining region 1 (CDR-H1), heavy chain complementarity determining region 2 (CDR-H2), heavy chain complementarity determining region 3 (CDR-H) that forms the complementarity determining region of the antibody constituting the antibody library. H3), light chain complementarity determining region 1 (CDR-L1), light chain complementarity determining region 2 (CDR-L2) and light chain complementarity determining region 3 (CDR-L3) may have polymorphism.
  • complementarity determining regions sequence i) germline immunoglobulin of complementary determining regions of actual human-derived antibodies to CDR-H1, CDR-H2, CDR-L1 or CDR-L2.
  • Gene usage frequency ii) frequency of mutation to each 20 amino acids by somatic hypermutation at each amino acid position, iii) frequency by length of complementarity determining region sequence, or iv) by each amino acid position calculated It may be to design the sequence to reflect the frequency.
  • a) 7 to 8 amino acid sequences from the N terminus of the CDR-L3 complementarity determining region are selected from the complementarity determining regions of actual human-derived mature antibodies.
  • the CDR-L3 is composed of 9 to 11 amino acids, the frequency analysis is analyzed by dividing each length, the design of the CDR-L3 sequence is human-derived having the same amino acid length as the length of the CDR-L3 to be designed Complementarity determining region of the aging antibody CDR-L3 may be designed based on the results of analysis.
  • the present invention when designing the complementarity determining region sequence, for CDR-H3 a) sequences except for three amino acids from the C terminus of the complementarity determining region, each amino acid position of the complementarity determining region of the human-derived mature antibody Design a simulated sequence to reflect frequency;
  • the three amino acid sequences from the C terminus of the complementarity determining region are designed to simulate the sequence reflecting the calculated frequency by analyzing the frequency of the corresponding three amino acid sequences of the complementarity determining region of the human-derived mature antibody. ;
  • the CDR-H3 is composed of 9 to 20 amino acids, the frequency analysis is analyzed by dividing each length, the design of the CDR-H3 sequence is human-derived having the same amino acid length as the length of the CDR-H3 to be designed Complementarity determining region of the aging antibody CDR-H3 may be designed based on the results of analysis.
  • the germline CDR sequence for CDR-H1 is the amino acid sequence of SEQ ID NO: 54 to 84
  • the germline CDR sequence for CDR-H2 is the sequence Amino acid sequence of Nos. 85 to 121.
  • the germline CDR sequence is not used and its length is set to 9 to 20 amino acids, and the frequency of each amino acid and the frequency of amino acid use at each position are used to determine the CDR-H3 of natural human antibody sequences. The frequency and length of amino acid usage at each position can be simulated.
  • the germline CDR sequences used in the library light chain CDR design of the present invention may have a lambda light chain or a kappa light chain
  • the germline CDR sequences for CDR-L1 of the kappa light chain are amino acid sequences of SEQ ID NOs: 122-145.
  • the germline CDR sequence for CDR-L2 of a kappa light chain may be the amino acid sequence of SEQ ID NOs: 146-165.
  • the germline CDR sequence for CDR-L3 of the kappa light chain may be the amino acid sequence of SEQ ID NO: 210 to 236.
  • the germline CDR sequence for the CDR-L1 of the lambda light chain of the present invention is the amino acid sequence of SEQ ID NOs: 166 to 189
  • the germline CDR sequence for the CDR-L2 of the lambda light chain is the amino acid sequence of SEQ ID NOs: 190 to 209 Can be.
  • the germline CDR sequence for the CDR-L3 of the lambda light chain may be the amino acid sequence of SEQ ID NOs: 237 to 252.
  • the method for producing the antibody library in particular the method for designing the CDR-H1, CDR-H2, CDR-L1 and CDR-L2 included in the antibody library of the present invention in any one or more of the following 1) to 6) May correspond to:
  • the germline CDR sequence for CDR-H1 of the heavy chain uses the amino acid sequence of SEQ ID NOs: 54 to 84;
  • the germline CDR sequences for CDR-H2 of the heavy chain use the amino acid sequences of SEQ ID NOs: 85 to 121;
  • the kappa light chain is used as the germline CDR sequence used for the light chain CDR design, and the germline CDR sequence for CDR-L1 of the kappa light chain uses the amino acid sequence of SEQ ID NOs: 122-145;
  • the kappa light chain is used as the germline CDR sequence used for the light chain CDR design, and the germline CDR sequence for CDR-L2 of the kappa light chain uses the amino acid sequence of SEQ ID NOs: 146 to 165;
  • the lambda light chain is used as the germline CDR sequence used for the light chain CDR design, and the germline CDR sequence for CDR-L2 of the lambda light chain uses the amino acid sequence of SEQ ID NOs: 190 to 209.
  • the method for preparing the antibody library in particular, the method for designing CDR-L3 included in the antibody library of the present invention may correspond to any one or more of the following 1) to 2):
  • the kappa light chain is used as the germline CDR sequence for use in light chain CDR design, and the germline CDR sequence for CDR-L3 of the kappa light chain uses the amino acid sequence of SEQ ID NOs: 210 to 236;
  • the lambda light chain is used as the germline CDR sequence used for light chain CDR design, and the germline CDR sequence for CDR-L3 of the lambda light chain uses the amino acid sequence of SEQ ID NOs: 237-252.
  • the frequency of use of each germline CDR sequence may be simulated the frequency of use of each germline CDR sequence in a natural human antibody found through analysis of the antibody sequence database.
  • the germline CDR sequences used in the library heavy chain CDR design of the invention are the amino acid sequences of SEQ ID NOs: 54-84, and the germline for CDR-H2
  • the CDR sequence was the amino acid sequence of SEQ ID NOs: 85-121.
  • the length is set to 9 to 20 amino acids, and the frequency by length and the frequency of amino acid use at each position are the frequency by length and the amino acid at each position of CDR-H3 of natural human antibody sequences. It is designed to simulate the frequency of use.
  • the germline CDR sequence used in the library light chain CDR design of the present invention among the lambda light chain or kappa light chain, the germline CDR sequence for CDR-L1 of the kappa light chain is the amino acid sequence of SEQ ID NOs: 122 to 145, and the kappa light chain
  • the germline CDR sequence for CDR-L2 of was the amino acid sequence of SEQ ID NOs: 146-165.
  • the germline CDR sequence for CDR-L3 of the kappa light chain was the amino acid sequence of SEQ ID NO: 210 to 236.
  • the germline CDR sequences for the CDR-L1 of the lambda light chain of the present invention were the amino acid sequences of SEQ ID NOs: 166 to 189
  • the germline CDR sequences for the CDR-L2 of the lambda light chain were the amino acid sequences of SEQ ID NOs: 190 to 209
  • the germline CDR sequence for the CDR-L3 of the lambda light chain was the amino acid sequence of SEQ ID NOs: 237 to 252.
  • CDRs in designing the light chain complementarity determining region, can be designed for the kappa light and the lambda light chains, and the light chains are variable for the kappa light and the lambda light chains.
  • the CDR of the kappa light chain may be assembled by linking with the kappa light chain framework region of VK3-A27
  • the CDR of the lambda light chain may be assembled by connecting with the lambda light chain framework region of VL1g.
  • stimulation means designing a sequence by randomly reflecting the expression frequency or variation frequency of amino acid sequences and the like, and simulating the expression frequency or variation frequency of amino acids of natural antibodies, particularly human-derived mature antibodies. It has a meaning.
  • the diversity of complementarity determining regions is designed to have a similar sequence diversity to human antibody CDRs by analyzing and simulating the characteristics of the CDR sequences of known human antibodies. Specifically, first download 8,846 human immunoglobulin heavy chain variable regions (VH), 3,110 kappa light chain variable regions (V ⁇ ) and 2,440 lambda light chain variable regions (V ⁇ ) sequences from the IMGT database (http://imgt.org) CDR sequences were extracted.
  • VH human immunoglobulin heavy chain variable regions
  • V ⁇ 3,110 kappa light chain variable regions
  • V ⁇ 2,440 lambda light chain variable regions
  • the CDR sequences of the human antibody germline immunoglobulin gene at V-base http://www2.mrc-lmb.cam.ac.uk/vbase/alignments2.php
  • V-base http://www2.mrc-lmb.cam.ac.uk/vbase/alignments2.php
  • IMGT database By comparing and analyzing the extracted mature CDR sequences, i) find the germline CDR sequences closest to each mature CDR sequence, from which the location, type, and frequency of mutations in each mature CDR are identified; The frequency of series CDRs used in mature human antibodies was calculated and used.
  • CDR sequences were designed to have a series of CDR usage. 1,500 simulated sequences were designed for each CDR.
  • the same operation as for CDR1 and CDR2 is performed for the first 7 amino acids, and the two or three amino acid sequences at the end are aged human antibodies.
  • the sequence frequency of the kappa light chain CDR3 was designed to simulate 1,500 sequences consisting of 9 or 10 amino acids in total.
  • the same operations as in CDR1 and CDR2 are performed for the first 7 or 8 amino acids, and the two or three amino acid sequences at the ends are used to simulate the sequence frequency in lambda light chain CDR3 of a mature human antibody. 1,500 sequences of dog, 10, or 11 amino acids were designed.
  • the frequency and length of amino acid CDR-H3 of natural human antibodies can be determined by analyzing the antibody sequence database, and representative IMGT database (http: / /www.imgt.org) can be used to analyze the antibody sequence.
  • the method for preparing the antibody library of the present invention further comprises the step of designing the complementarity determining region amino acid sequence and then excluding the sequence from which the N-glycosylation, isomerization, deamidation, cleavage, and oxidation can occur. It may be to include as.
  • the design of the CDR sequences excludes the following post translational modification sequences.
  • Post-translational modification of the protein can affect the function and properties of the protein, so it is advantageous to exclude it as much as possible in the design of the antibody library.
  • the post-translational modification sequence includes an N-glycosylation sequence, namely Asp-Xaa-Ser / Thr (Asp: aspartic acid, Xaa: cysteine, any 19 amino acids, Ser / Thr: serine or threonine) Sequences, isomerization sequences, deamidation sequences, cleavage sequences and oxidation sequences were excluded.
  • the method for producing an antibody library of the present invention after designing the amino acid sequence of the complementarity determining region, the reversed translation of the designed sequence into a polynucleotide, and then a human antibody corresponding to the translated polynucleotide 5 'and 3' ends, respectively It may further comprise the step of designing an oligonucleotide sequence connecting the variable region framework region of the germline gene.
  • the amino acid sequence of the designed CDR was inversely translated into a nucleotide sequence, and oligonucleotide sequences consisting of 100 nucleotides were finally designed by adding a framework region of an antibody variable region to both sides of the CDR sequence.
  • a total of 19,836 sequences were designed and synthesized in the form of oligonucleotide mixtures by array synthesis (LC Sciences, Houston, TX).
  • the antibody may be one containing an amino acid sequence encoded from VH3-23, VK3-A27, VL1g or fragments thereof as a backbone of antibody library construction.
  • the VH3-23 is Genebank accession No. Z12347
  • VK3-A27 may be a genebank accession no. X93639
  • VL1g is the GenBank accession No. It may correspond to Z73663.
  • the present invention synthesized codon-optimized scFv genes for use as a framework for antibody library construction (Genscript, Piscataway, NJ), these genes are VH3-23 and VK3 germline genes -A27, or VH3-23 and VL1g are cloned into the pUC57 vector with scFv genes linked to the junction of (Gly-Gly-Gly-Gly-Ser) 3 and compatible with the pComb3X vector for cloning to phagemid vectors Two SfiI restriction enzyme sites are included.
  • these genes cloned into the pUC57 vector were also cloned into the pComb3X vector and used as a template for PCR.
  • These genes are single sequences without sequence diversity because they are intended to be used as a backbone, and codons have been optimized for improved expression in mammalian cells, but have no change in amino acid sequence to prevent nonspecific annealing during PCR. Some optimization DNA sequences were changed in the range (SEQ ID NO: 19 and SEQ ID NO: 20).
  • the antibody is selected from the group consisting of IgA, IgD, IgE, IgM, IgG, Fc fragment, Fab, Fab ', F (ab') 2 , scFv, single variable domain antibody and Fv It may be.
  • scFv antibody libraries were prepared, and expression of scFv was confirmed from the prepared libraries (FIG. 2).
  • the sequence of the scFv was also analyzed. Random clones were selected from the library, the scFv gene was amplified by PCR technique, and the DNA was purified for sequencing. As a result of the sequencing, CDRs having various sequences and lengths, as designed, were introduced into scFv clones constituting the library (FIG. 3).
  • the present invention provides an antibody library produced by the method for producing the antibody library of the present invention.
  • the antibody library of the present invention may use the amino acid sequence of SEQ ID NO: 54 to 84 as the germline CDR sequence for CDR-H1, the germline CDR sequence for CDR-H2 may use the amino acid sequence of SEQ ID NOs: 85 to 121 have.
  • the length is set to 9 to 20 amino acids, and the frequency by length and the frequency of amino acid use at each position are the frequency by length and the amino acid at each position of CDR-H3 of natural human antibody sequences. It may be designed to simulate the frequency of use.
  • the antibody library of the present invention may use a lambda light chain or a kappa light chain as a germline CDR sequence used for light chain CDR design, and the germline CDR sequence for CDR-L1 of a kappa light chain may use amino acid sequences of SEQ ID NOs: 122 to 145.
  • the germline CDR sequences for CDR-L2 of the kappa light chain may be prepared using the amino acid sequences of SEQ ID NOs: 146-165.
  • the germline CDR sequences for CDR-L3 of the kappa light chain may be prepared using the amino acid sequence of SEQ ID NO: 210 to 236.
  • the antibody library of the present invention may use the amino acid sequence of SEQ ID NOs: 166 to 189 as the germline CDR sequence for the CDR-L1 of the lambda light chain
  • the germline CDR sequence for CDR-L2 of the lambda light chain is SEQ ID NO: 190 It may be produced using the amino acid sequence of to 209.
  • the germline CDR sequences for the CDR-L3 of the lambda light chain may be prepared using the amino acid sequence of SEQ ID NOs: 237 to 252.
  • the antibody library of the present invention may be an antibody library, which corresponds to one or more of the following 1) to 9):
  • the germline CDR sequences for CDR-H1 of the heavy chain use the amino acid sequences of SEQ ID NOs: 54 to 84;
  • the germline CDR sequences for CDR-H2 of the heavy chain use the amino acid sequences of SEQ ID NOs: 85 to 121;
  • CDR-H3 of heavy chain is 9-20 amino acids in length, frequency of each amino acid and frequency of amino acid use at each position is frequency of CDR-H3 of natural human antibody sequences and amino acid use frequency at each position Form to simulate;
  • the kappa light chain is used as the germline CDR sequence for use in light chain CDR design, and the germline CDR sequence for CDR-L1 of the kappa light chain uses the amino acid sequence of SEQ ID NOs: 122-145;
  • the kappa light chain is used as the germline CDR sequence for use in light chain CDR design, and the germline CDR sequence for CDR-L3 of the kappa light chain uses the amino acid sequence of SEQ ID NOs: 210 to 236;
  • the lambda light chain is used as the germline CDR sequence used for light chain CDR design, and the germline CDR sequence for CDR-L3 of the lambda light chain uses the amino acid sequence of SEQ ID NOs: 237-252.
  • the use frequency of each germline CDR sequence in the case of 1) to 2) and 4) to 9) is the frequency of use of each germline CDR sequence in a natural human antibody determined through analysis of an antibody sequence database. It may be an antibody library that mimics.
  • the transformed E. coli library was cultured and infected with VCSM13 helper phage to obtain an antibody phage library on which a scFv clone was presented.
  • a panning experiment to select antigen-specific antibodies against lysozyme (HEWL) and AIMP1 (101-192) antigens demonstrated the functionality of the antibody phage library.
  • the clones were screened by ELISA to identify 150 ELISA positive clones showing more than three times binding signal compared to background signal, and 16 of them were sequenced to find 5 unique sequences.
  • screening 94 clones with ELISA for AIMP1 (101-192) we identified 18 ELISA-positive clones that showed binding signals more than three times the background signal, and five of them were sequenced to identify two unique sequences. Found.
  • an improved library can be constructed that is based on a plurality of human germline immunoglobulin variable region genes.
  • the antibody library described in the present invention is derived from various germline immunoglobulin genes using one skeleton (VH3-23, VK3-A27, VL1g, respectively) per heavy, kappa light, and lambda light chain. Not only can be prepared according to the design method of inserting the synthetic CDRs in which mutations are introduced into the CDRs, but also based on the skeletons of a plurality of various germline immunoglobulin variable regions through improved design, By introducing each of the synthetic CDRs in which mutations are introduced into CDRs derived from germline immunoglobulin genes of the same gene group, a library in which a linkage combination of a skeleton and a CDR is similar to a natural human-derived antibody can be obtained.
  • the present invention provides an antibody produced from the antibody library produced by the method for producing the antibody library of the present invention.
  • antibodies, antibody libraries and the like are as described above.
  • the present invention aims to construct a synthetic human antibody library, and in particular, in the present invention, an antibody library using an scFv fragment having a size of 25 kDa was constructed.
  • the antibody of the present invention comprises 15 VH and VL domains of an immunoglobulin. It was produced by linking with a chain consisting of amino acids (Gly-Gly-Gly-Gly-Ser) 3 .
  • antibody libraries are constructed based on one or a limited number of skeletal sequences.
  • antibody libraries were prepared using two antibody backbones.
  • all the clones of the antibody library of the present invention have a scFv having a linkage between a VH3-23 gene and a VK3-A27 gene of a human immunoglobulin or a scFv having a linkage between a VH3-23 gene and a VL1g gene.
  • the library was constructed by introducing artificial diversity into the complementarity determining region.
  • the framework sequences used therein are shown in Table 1 below.
  • N means any nucleic acid
  • X means any amino acid in the amino acid sequence
  • the underlined region is CDR
  • the portion indicated in bold is a linker (linking site).
  • ScFv antibody libraries were prepared by inserting various complementarity determining region (CDR) sequences into the backbone of the antibody library.
  • CDR complementarity determining region
  • the diversity of complementarity determining regions was designed to have similar sequence diversity to human antibody CDRs by analyzing and simulating the CDR sequences of known human antibodies. The specific method is as follows.
  • V H human immunoglobulin heavy chain variable regions
  • V ⁇ 3,110 kappa light chain variable regions
  • V ⁇ 2,440 lambda light chain variable regions
  • the downloaded variable region sequences are sequences that are not identical to each other in which all three CDRs of each variable region exist.
  • the rules at http://www.bioinf.org.uk/abs/index.html#cdrid were used to extract the CDRs.
  • the germline CDR sequence for CDR-H1 is an amino acid sequence of SEQ ID NOs: 54 to 84
  • the germline CDR sequence for CDR-H2 is SEQ ID NOs: 85 to The amino acid sequence of 121 was used.
  • the germline CDR sequence is not used and its length is set to 9 to 20 amino acids, and the frequency of each amino acid and the frequency of amino acid use at each position are used to determine the CDR-H3 of natural human antibody sequences. Frequency and length of amino acid usage at each position were simulated.
  • the germline CDR sequence used in the library light chain CDR design of the present invention may have a lambda light chain or a kappa light chain
  • the germline CDR sequence for CDR-L1 of the kappa light chain is an amino acid sequence of SEQ ID NOs: 122 to 145
  • the germline CDR sequence for CDR-L2 of the kappa light chain was the amino acid sequence of SEQ ID NOs: 146-165.
  • the germline CDR sequence for CDR-L3 of the kappa light chain is the amino acid sequence of SEQ ID NOs: 210 to 236.
  • the germline CDR sequences for the CDR-L1 of the lambda light chain of the present invention were the amino acid sequences of SEQ ID NOs: 166 to 189
  • the germline CDR sequences for the CDR-L2 of the lambda light chain were the amino acid sequences of SEQ ID NOs: 190 to 209
  • the germline CDR sequence for CDR-L3 of the lambda light chain is the amino acid sequence of SEQ ID NOs: 237 to 252.
  • CDR1 and CDR2 of heavy and light chains were designed to introduce virtual mutations into the human germline CDR sequences to have sequences similar to those of human-derived mature antibodies and to use germline CDRs. 1,500 simulated sequences were designed for each CDR.
  • CDR3 of the light chain where recombinant and somatic hypermutation occurs
  • CDR1 and CDR2 the same operation as for CDR1 and CDR2 is performed for the first 7 amino acids, and the two or three amino acid sequences at the end are kappa of the mature human antibody.
  • Amino acid frequency in the light chain CDR3 was simulated to design 1,500 sequences of 9 or 10 amino acids in total.
  • the same operations as in CDR1 and CDR2 are performed for the first 7 or 8 amino acids, and the two or three amino acid sequences at the ends are used to simulate the amino acid frequency in lambda light chain CDR3 of the mature human antibody. 1,500 sequences of dog, 10, or 11 amino acids were designed.
  • the first 7 amino acid sequences (8 in the case of lambda light chain CDR-L3 having a length of 11) are selected based on the germline CDR sequence, and then 2 or 3 amino acids are selected. Based on the frequency in Table 2. This is because the sequence of the C-terminal region of CDR-L3 often does not originate from the germline sequence according to V-J recombination and has high uncertainty.
  • CDR-H3 Since the contribution of CDR-H3 in the antigen-antibody reaction is greater than the other CDRs, a larger number of CDR-H3 sequences were designed than the other CDRs. Since 3,918 oligonucleotide sequences could be synthesized in one sequence synthesis, a total of 7,836 sequences were designed, each having 3,918 divided into even and odd numbers according to the length of CDR-H3. That is, the CDR-H3 9, 11, 13, 15, 17, 19 lengths were synthesized together, and 10, 12, 14, 16, 18, 20 individuals were designed to synthesize together.
  • the number of designed CDRs does not take into account overlapping sequences, and the actual native CDRs are measured as shown in Table 3 except that the same sequences are actually overlapped.
  • FIG. 1 A conceptual description of the design of the CDR sites is presented in FIG. 1.
  • CDR-H1 first CDR of the heavy chain
  • CDR-L2 second CDRs of the kappa and lambda light chains
  • CDR-H2 of heavy chain is 16 or 17 amino acids
  • CDR-L1 of kappa light chain is 11,12,16 amino acids
  • CDR-L1 of lambda light chain is 11,13,14 amino acids
  • CDR- of kappa light chain L3 is designed to have 9,10 amino acids
  • CDR-L3 of the lambda light chain 9,10,11 amino acids
  • CDR-H3 of the heavy chain is 9 to 20 amino acids
  • post translational modification sequences those including the following post translational modification sequences were excluded.
  • Post-translational modification of the protein can affect the function and properties of the protein, so it is advantageous to exclude it as much as possible in the design of the antibody library.
  • N-glycosylation sequence ie Asp-Xaa-Ser / Thr (Asp: aspartic acid, Xaa: any 19 amino acids except cysteine, Ser / Thr: serine or threonine) sequence was excluded.
  • the isomerization sequence was excluded. It is known that aspartic acid in proteins can spontaneously slow down to isoaspartic acid in aqueous solution, and the rate of this reaction is particularly affected by amino acid residues located at the C-terminus of aspartic acid. Since the residue is known to have a particularly rapid rate of isomerization when glycine, CDR sequences having aspartic acid-glycine sequences were excluded.
  • Deamidation sequences were excluded. It is known that asparagine in proteins can be spontaneously deamidated to asparagine acid in aqueous solution, and the rate of this reaction is particularly affected by amino acid residues located at the C-terminus of asparagine. Since this residue is known to be particularly fast in deamidation when glycine, CDR sequences with asparagine-glycine sequences are excluded.
  • Cleavage sequences were excluded. Peptide bonds that make up the protein are cleaved slowly in aqueous solution, and in particular, such cleavage occurs more rapidly in the aspartic acid-proline sequence, thus excluding CDR sequences with aspartic acid-proline sequence.
  • Oxidation sequence was excluded. It is known that several of the 20 amino acids constituting the protein can cause oxidative modification, and among them, cysteine and methionine including sulfur are relatively easily oxidized. Therefore, the CDR sequences including cysteine and methionine are basically excluded, but the case of methionine already predominantly present in the CDRs of the germline gene is not excluded. Specifically, this corresponds to residue 34 of CDR-H1 or residue 100 of CDR-H3 of the heavy chain.
  • the amino acid sequence of the designed CDR was reverse translated into the nucleotide sequence and the oligonucleotide sequences of 100 nucleotides were finalized by adding the framework sequences of the antibody variable regions to both sides of the CDR sequence.
  • a total of 19,836 sequences were designed and synthesized in the form of oligonucleotide mixtures by array synthesis (LC Sciences, Houston, TX).
  • PCR polymerase chain reaction
  • primer combinations used at this time are shown in Table 4 below.
  • Table 4 PCR conditions were as follows: 94 degrees Celsius, 2 minutes; 25 repetitions (94 degrees Celsius, 30 seconds / 56 degrees Celsius, 30 seconds / 72 degrees Celsius, 30 seconds); 72 degrees Celsius, 7 minutes.
  • 1.6 nanograms of oligonucleotide mixtures were used as templates for the PCR reactions, the primers each had a concentration of 600 nM, dNTP 0.8 mM, polymerase Taq (2.5 units) and reaction volume 100 microliters.
  • electrophoresis was performed on a 2% agarose gel, followed by extraction and purification of DNA from a DNA band corresponding to about 100 base pairs (bp) in size.
  • CDR primer Sequence (5 '-> 3') CDR-H1 OPALS-h1-f (SEQ ID NO: 1) CAGCGGATTCACCTTCAGC OPALS-h1-b (SEQ ID NO: 2) AGGTGCTTGGCGAACCCA CDR-H2 OPALS-h2-f (SEQ ID NO: 3) GGCCTGGAATGGGTGAGC OPALS-h2-b (SEQ ID NO: 4) GCGGCTGATGGTAAAGCG CDR-H3-odd / even OPALS-h3-f (SEQ ID NO: 5) GGACACCGCAGTCTACTACT OPALS-h3-b (SEQ ID NO: 6) CACCAGAGTACCTTGTCCC CDR-L1 kappa OPALS-k1-f (SEQ ID NO: 7) CGCGCAACACTGTCATGC OPALS-k1-b (SEQ ID NO: 8) TGGAGCCTGACCTGGTTTC CDR-L2 kappa
  • Codon-optimized scFv genes were synthesized for use as a framework for antibody library construction (Genscript, Piscataway, NJ). These genes were derived from the germline genes VH3-23 and VK3-A27, or VH3-23. VL1g is cloned into the pUC57 vector with scFv genes linked to the junction of (Gly-Gly-Gly-Gly-Ser) 3 and contains two SfiI restriction sites compatible with the pComb3X vector for cloning to phagemid vectors do. For the convenience of library construction, these genes cloned into the pUC57 vector were also cloned into the pComb3X vector and used as a template for PCR.
  • PCR conditions were the same as above, except that the extension time at 72 ° C. was adjusted to 30 seconds, 1 minute, or 1 minute 30 seconds, depending on the length of the DNA fragment expected. Specifically, when the predicted length was 500 base pairs or less, an extension time of 30 minutes, an extension time of 1 minute 30 seconds between 500 and 1,000 base pairs, and 1 minute 30 seconds between 1,000 and 1,500 base pairs was used.
  • the prepared single CDR library was isolated and purified by 1% agarose gel electrophoresis, which was digested with SfiI restriction enzyme for more than 12 hours at 50 ° C., and also pComb3X phagemid was digested in the same manner with SfiI restriction enzyme.
  • Ligation with vector 1 ⁇ g of vector and 1 ⁇ g of scFv DNA were reacted at room temperature in 50 ⁇ l of T4 ligase buffer solution containing 1,000 units of T4 ligase for 16 hours. To the reaction, 5 ⁇ l of 3M sodium acetate (pH 5.2) and 110 ⁇ l of ethanol were added to precipitate DNA at 20 ° C. for at least 1 hour.
  • the precipitated DNA was centrifuged, washed with cold 70% ethanol, and 20 ⁇ l of Dissolved in sterile pure water. This was transformed into ER2537 Escherichia coli by electroporation and cultured for 12 to 16 hours in a medium containing ampicillin antibiotics to obtain a single CDR library.
  • the purpose of constructing a single CDR library is to remove CDR sequences that cause inaccurate and premature translational termination resulting from insertion / deletion / substitution of nucleotides present in the synthesized CDR oligonucleotides.
  • E. coli transformed with a single CDR library was cultured, and in log phase, a phage library was obtained by adding auxiliary phage and kanamycin sequentially and then overnight. This was panned once against the anti-HA antibody adsorbed on the immunotube surface to select only phage clones expressing HA-tags.
  • the HA-tag is a short peptide sequence consisting of nine amino acids (YPYDVPDYA), located at the 3 'end of the SfiI cloning position of the pComb3X phagemid vector and thus is present at the C-terminus of the expressed scFv protein. Since the stepwise efficiency of the oligonucleotide chemical synthesis is not perfect, there are many inserted / deleted / substituted sequences in the synthesized CDR oligonucleotides that cause premature translation termination, and phage clones containing them may have HA-tags. It is removed by panning. As a result, this procedure allows the selection of defective CDR sequences.
  • the scFv gene library was digested with SfiI restriction enzyme as described above, ligated to the pComb3X vector, and transformed into ER2537 Escherichia coli to complete the scFv library. Specifically, since the number of amino acids (length) of CDR-H3 was even and odd, and kappa light and lambda light chains were separately prepared, and the PCR-translation was performed, four sub libraries were made. These were referred to as OL (odd-lambda), EL (even-lambda), OK (odd-kappa), and EK (even-kappa) libraries, respectively.
  • scFv 24 clones were randomly selected from each sub library to culture the bacteria, induction of scFv antibody expression with IPTG, followed by overnight incubation at 30 ° C. From this, a periplasmic extract was obtained by osmotic shock using sucrose buffer solution, and then 1 ⁇ l was added to the nitrocellulose thin film. After drying, the thin film was immersed in 3% skim milk milk buffer and blocked, and the anti-HA antibody-HRP (horseradish peroxidase) was bound for 1 hour and washed. The expression of scFv was confirmed by detecting the presence of HA-tag using luminol (FIG. 3).
  • FIG. 4 shows the results of the antibody library preparation step of Example 1.
  • NGS Next generation sequencing
  • Non-functional CDR sequences were removed by proofreading panning of single-CDR libraries with anti-HA antibodies, and the ratio of active inframe CDR sequences prior to proofreading panning was between 31 and 86%, whereas approximately 90 to 93 after proofreading panning. It was confirmed that the percent. Only 79% of CDR-L2 was considered to be due to incorrect annealing of overlapping PCR. The proportion of CDR sequences compared to the designed length was about 82-91% (CDR-L2 was about 56%).
  • V H , V ⁇ , and V ⁇ sequences were various functional domains without termination codons, and the functional scFv clone in the library was estimated to reach about 55%. This estimation was consistent with the dot-blot assay results for randomly selected library clones.
  • Periplasmic extracts of scFv clones randomly selected from the libraries not selected for dot-blotting were blotted onto nitrocellulose membranes, and the presence of water-soluble expressing scFv on the extracts was confirmed by measuring the C-terminal HA tag. .
  • approximately 60% of the water-soluble expressing scFv clones were present (FIG. 3).
  • CDR lengths in particular the CDR-H3 lengths, in the prepared libraries was different from the design, with shorter CDRs having a significantly higher frequency compared to the longer CDRs (FIG. 8). This may be due to inaccuracies such as frame shifts or early stop codons introduced during the production of oligonucleotide arrays. Since these errors occur more frequently during the manufacture of long CDRs and most of them are eliminated during single CDR library proofreading panning with anti-HA-tagged antibodies, it is believed that this is the cause of more long CDRs being removed from the library. It is also possible that scFvs with short CDRs were preferentially selected and amplified by panning against anti-HA-tag antibodies.
  • the similarity between the library CDR sequences and the native CDR sequences was determined by analyzing the number of amino acid mutations in each CDR sequence from the closest reproductive CDR sequences. Because the CDRs were designed by simulating natural somatic hypermutation (SHM) patterns, the design sequences were expected to be very high in natural similarity. Accordingly, the average number of mutations per CDR sequence between the design CDRs and the native CDR sequences was compared (Table 10).
  • the prepared library was panned against four antigens to verify its functionality. After repeating panning four times for antigens immobilized on the plastic surface, multiple target-binding scFv clones were isolated. Colonies isolated from the third or fourth panning were screened by ELISA and some of the clones showing positive signals were sequenced (Table 12).
  • Dissociation constants ( K d) for 10 scFvs for three different antigens were determined in the range of 10 ⁇ 9 to 10 ⁇ 7 M.
  • the NGS results of the unselected library were compared with the sequences of native scFv selected from the library after panning.
  • the panning process did not appear to significantly alter the proportion of designed CDR sequences or the average number of mutations per CDR residue (Table 14).
  • Example 1-5 To verify the construction of the antibody library through Example 1-5, the sequence of the scFv was analyzed. Random clones were selected from each sub library, the scFv gene was amplified by PCR technique, and the DNA was purified for sequencing. The sequencing results are shown in FIG. 5, and as designed, CDRs having various sequences and lengths were introduced into scFv clones constituting the library.
  • the transformed E. coli library was cultured and infected with VCSM13 helper phage to obtain an antibody phage library surfaced with scFv clones (HYYang et al., Mol. Cells 2009, 27, 225-235).
  • This library contains at least 10 12 colony forming units (CFU) per ml.
  • CFU colony forming units
  • the antibody phage library of 10 12 CFU dispersed in skim milk powder 3% buffer was added to the antigen for 1-2 hours.
  • Nonspecifically bound phages were washed three times with TBST (tris buffered saline-tween20) solution, and the remaining antigen-specific phage antibodies were eluted with 100 mM triethylamine solution.
  • the eluted phage was neutralized with 1.0M Tris-HCl buffer (pH 7.8), and then infected with ER2537 Escherichia coli at 37 ° C for 1 hour, and the infected E. coli LB (Luria-Bertani) agar containing ampicillin and 2% glucose. It was applied to the medium and incubated at 37 °C.
  • Escherichia coli cultured the next day was suspended in 5 mL of super broth (SB) culture, 15% glycerol was added and stored at -80 ° C, 50 ⁇ l was inoculated in 20 mL of SB- ampicillin solution and incubated at 37 ° C.
  • SB super broth
  • the phage solution was centrifuged again to take only the clear supernatant, and the antigen-specific clones were concentrated by mixing 700 microliters of 3% skim milk powder buffer solution and repeating the panning process using the same. After repeated panning about 3 to 4 times, E. coli containing the antibody gene was applied to LB agar medium containing ampicillin and 2% glucose and cultured to obtain single colonies, which were inoculated and incubated in 200 ⁇ l SB-ampicillin solution. After induction by IPTG, scFv protein was induced in E. coli periplasm (periplasm).
  • Periplasmic extracts were obtained from E. coli by osmotic shock using sucrose buffer, and then used to confirm the binding of antigen to scFv using ELISA (HYYang et al. , Mol. Cells 2009, 27, 225-235). Bound scFv was detected using anti-HA antibody-HRP and tetramethylbenzidine (TMB) substrate. Antigen-specific antibody clones identified therefrom were analyzed by sequencing.
  • HEWL antigen 188 clones of HEWL antigen were screened by ELISA to identify 150 ELISA positive clones showing binding signal more than 3 times of background signal and 16 of them were sequenced to find 5 unique sequences.
  • Eighteen clones of AIMP1 (101-192) were screened by ELISA to identify 18 ELISA positive clones that showed binding signals more than three times the background signal, and five of them were sequenced to find two unique sequences.
  • the antibody library prepared by the present invention may be useful as an antibody library including a plurality of unique sequences as well as functional diversity, including antibodies having excellent physical properties for a large number of antigens. It was confirmed.

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Library & Information Science (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Medicinal Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Immunology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Virology (AREA)
  • General Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Peptides Or Proteins (AREA)

Abstract

본 발명은 신규 항체 라이브러리 제조방법 및 이로부터 제조된 라이브러리에 관한 것이다. 본 발명에 의해 제조된 항체 라이브러리는 다수의 항원에 대해 우수한 물성을 가지는 항체들을 포함하여, 기능적 다양성을 가질 뿐 아니라 고유서열을 다수 포함하는 등 항체 라이브러리로써 유용하게 사용될 수 있다.

Description

신규 항체 라이브러리 제조방법 및 이로부터 제조된 라이브러리
본 발명은 신규 항체 라이브러리 제조방법 및 이로부터 제조된 라이브러리에 관한 것이다.
파지 표면제시 (phage display) 기법은 박테리아를 숙주로 하는 박테리오파지(bacteriophage)를 유전적으로 조작하여 유전형(유전자)와 표현형(단백질)이 하나의 파지 입자를 통해 연결되도록 만드는 기법이다. 이 경우 유전형으로서의 유전자는 파지 유전자의 일부로 삽입되며, 표현형으로서의 단백질은 그 단백질의 유전자가 들어있는 파지 입자의 표면에 제시된다. 이러한 유전형과 표현형의 물리적 결합은 단백질 공학에서 매우 중요한 개념이며, 표현형으로 나타나는 성질에 의해 선택된 단백질 클론의 유전자를 쉽게 획득하여 복제, 증폭, 분석 및 조작할 수 있도록 해 준다.
항체는 특별히 파지 표면제시 기법이 매우 유용하게 적용된 예이다. 매우 높은 다양성을 가지는 항체 라이브러리를 파지의 표면에 제시한 후 표면흡착된 항원과 결합시키면, 항원에 선택적으로 결합하는 항체 클론의 유전자를 획득할 수 있다. 이는 실험동물을 거치지 않고 항체를 얻는 매우 효과적인 방법이며, 특히 임의의 항원에 대한 인간항체를 얻을 수 있으므로 인체에서의 면역반응이 적은 치료용 항체 신약 등의 개발에 매우 높은 활용성을 가진다. 높은 결합친화도를 가지는 좋은 항체를 획득하기 위해서는 라이브러리의 품질이 중요하며, 특히 라이브러리의 크기와 기능적 다양성 및 클론의 품질이 중요하다.
라이브러리의 크기는 그로부터 선택되는 항체의 품질을 결정하는 가장 중요한 요소 중 하나이다. 항체 라이브러리의 항원 결합부위는 이론적으로 어떤 특정 항원에도 경도되지 않은 무작위적 다양성을 가지며, 순전히 우연에 의해 특정 항원에 선택적으로 결합하는 항체가 무작위적 다양성 중에서 나타나게 된다. 따라서 라이브러리의 크기가 커질수록, 즉 라이브러리 내의 서로 다른 항체의 숫자가 증가할수록, 우연에 의해 높은 선택성 및 친화도를 가지는 항체가 발견될 확률이 높아지는 것이다. 일반적으로 최소 108 이상의 크기가 필요한 것으로 인식되고 있으며, 많은 수의 항체 라이브러리가 109 - 1011 정도의 크기를 가지고 있다.
라이브러리의 기능적 다양성은, 라이브러리를 이루는 클론들 중 실제로 항체를 발현할 수 있는 클론의 비율이다. 라이브러리의 크기가 크더라도 기능적 다양성이 낮으면 실질적인 라이브러리 크기는 줄어들게 된다. 기능적 다양성이 낮아지는 이유는 대부분 라이브러리 구축 과정에서 DNA 합성 및 증폭의 오류로 인한 것이다. 항체 라이브러리는 여러 단계의 중합효소 연쇄반응(PCR)을 통해 구축되는데, 이 때 효소 및 반응의 특성상 필연적으로 낮은 빈도의 오류가 발생하게 되며 이러한 오류가 축적이 되면 최종 라이브러리의 기능적 다양성이 떨어지게 된다. 또한 특히 합성 라이브러리의 경우, 염기 합성반응의 효율성 문제 때문에 오류가 도입될 가능성이 높아지기도 한다. 이렇듯 기능적 다양성의 문제는 특히 합성 라이브러리에서 두드러지는 경향이 있으며 대부분의 합성 라이브러리는 이러한 문제점을 회피하기 위한 설계상의 고려를 해야만 한다.
라이브러리를 이루는 개별 클론들의 품질, 즉 발현성과 안정성 및 면역유발성(immunogenicity) 등도 항체 라이브러리의 성능을 결정하는 요소 중 하나이다. 항체공학적으로 우수한 클론을 선별하기 위해서는 합성 항체라이브러리의 설계단계에서부터 이러한 요소들이 고려되어야 한다. 특히 인공적 다양성을 기존의 항체유전자에 도입하는 단계에서, 생성된 다양성이 항체 골격과의 적합성(compatibility)을 가지도록 설계하여야 하며, 자연 항체(natural antibody)의 아미노산 서열로부터의 급격한 변화는 인공합성 항체의 적합성과 안정성 등을 저해할 위험이 있다. 따라서 인공적 다양성을 설계할 때 자연적 다양성을 효율적으로 모방하는 것은 합성 항체 라이브러리의 설계와 구축에 있어 매우 중요하다. 또한 다양한 서열의 항체들로 이루어진 항체 라이브러리에는, 당화(glycosylation)이나 산화, 이성질체화, 탈아미드화 등의 원치 않는 단백질의 변형을 일으킬 수 있는 부위가 포함될 수 있으며, 이는 항체의 물성과 산업적 개발과정에 나쁜 영향을 줄 수 있다.
동물의 체내에서 항체가 만들어질 때, 유전체 내에 존재하는 수십~수백개의 생식계열(germline) 면역글로불린 유전자의 재조합을 통해 매우 큰 다양성을 가지는 항체 서열들이 생성되며, 이들 중에서 특정 항원에 반응하는 항체가 선택된다. 선택된 항체는 초돌연변이 (hypermutation) 과정을 거쳐 항원에 대한 결합력이 향상되며, 최종적으로 숙성 (mature) 항체가 도출된다. 따라서 각 숙성 항체의 서열, 특히 항원과 결합하는 상보성 결정부위 (CDR)의 서열은 생식계열 유전자 서열로부터 유래하되, 재조합 및 돌연변이 과정을 통해 생식계열 CDR 서열과는 다른 다양한 서열들이 만들어지게 된다. 합성 항체 라이브러리의 설계에서는 이러한 과정을 통해 만들어진 CDR 서열을 모사하여 자연유래 항체서열과 유사하게 제작하는 전략의 수립이 필요하다.
자연유래 항체 제작방법은 하나의 항체를 만드는데 과한 노력과 시간이 요구됨에 따라 합성 항체 라이브러리를 이용하고자 하는 시도가 최근에 주목받고 있다. 그러나, 기존 합성 항체 라이브러리는 CDR에 해당하는 변이 구역을 무작위로 합성하여 제작하였는바 실질적으로 항체로서 기능하는 비율이 낮거나 그 효율이 보장되지 않는 문제점이 있었다.
본 발명자들은 효율적이고 빠른 과정을 통해 자연항체의 서열과 유사하고 우수한 물성을 가지는 항체들로 이루어진, 기능적 다양성이 높은 고품질의 합성 인간항체 라이브러리를 구축하고자 노력한 결과, 합성 항체 라이브러리를 자연유래 항체의 CDR 서열을 분석하여 서열을 구성한 다음 합성하여 자연항체의 서열과 유사하고 우수한 물성을 가지는 항체들로 이루어진 라이브러리 구축하였음을 확인함에 따라, 본 발명을 완성하였다.
본 발명의 목적은 항체의 상보성 결정부위(complementarity Determining Regions, CDRs) 서열을 개별적으로 설계하는 단계; 및 상기 설계한 서열을 가지는 상보성 결정부위들을 포함하는 항체를 합성하여 라이브러리를 제조하는 단계를 포함하는, 항체 라이브러리를 제작하는 방법을 제공하는 것이다.
본 발명의 다른 목적은 상기 항체 라이브러리를 제작하는 방법에 의해 제조된 항체 라이브러리를 제공하는 것이다.
본 발명에 의해 제조된 항체 라이브러리는 다수의 항원에 대해 우수한 물성을 가지는 항체들을 포함하여, 기능적 다양성을 가질 뿐 아니라 고유서열을 다수 포함하는 등 항체 라이브러리로써 유용하게 사용될 수 있다.
도 1은 CDR 부위의 설계에 대한 개념을 나타낸 모식도이다.
도 2는 6개의 비조합 다양화 CDR(non-combinatorially diversified CDRs)을 이용한 scFv 라이브러리 제조방법을 나타낸 모식도이다. 설계된 CDR 서열이 있는 올리고뉴클레오티드의 풀(pool)이 배열 생성되고 PCR을 통해 증폭된다. 각 CDR 위치에 대한 단일 CDR 라이브러리(6개의 CDR 중 하나만 다양화된 scFv 라이브러리)를 제조하고, CDR 레퍼토리가 in-frame 서열인 것을 확인하기 위한 scFv의 C 말단 HA-태그에 결합하는 항-HA 항체를 이용하여 패닝하였다.
도 3은 본 발명의 항체 라이브러리에 scFv가 발현되는지 여부를 확인하기 위하여, 라이브러리로부터 셀렉션 전 scFv 클론을 무작위로 선택하여 HA 태그를 이용하여 발현을 확인한 도면이다. 구체적으로 92개의 클론을 무작위로 선택하여 배양 및 IPTG 처리하고 용출물에서 전장 scFV 발현 여부를 항-HA 항체로 확인한 결과이며, 총 92개 중 58개에서 발현이 확인되었다 (63%).
도 4는 본 발명의 항체 라이브러리 제조 단계를 도식화한 모식도이다.
도 5a는 본 발명의 항체 라이브러리 중 특히 OL (odd-lambda) 라이브러리로부터 임의의 클론들을 선택하고 scFv 유전자를 PCR 기법으로 증폭한 후, DNA를 정제하여 서열분석한 결과를 개시하고 있는 도이다.
도 5b는 본 발명의 항체 라이브러리 중 특히 EL (even-lambda) 라이브러리로부터 임의의 클론들을 선택하고 scFv 유전자를 PCR 기법으로 증폭한 후, DNA를 정제하여 서열분석한 결과를 개시하고 있는 도이다.
도 5c는 본 발명의 항체 라이브러리중 특히 OK (odd-kappa) 라이브러리로부터 임의의 클론들을 선택하고 scFv 유전자를 PCR 기법으로 증폭한 후, DNA를 정제하여 서열분석한 결과를 개시하고 있는 도이다.
도 5d는 본 발명의 항체 라이브러리중 특히 EK (even-kappa) 라이브러리로부터 임의의 클론들을 선택하고 scFv 유전자를 PCR 기법으로 증폭한 후, DNA를 정제하여 서열분석한 결과를 개시하고 있는 도이다.
도 6은 라이브러리의 설계 및 실제 CDR 레퍼토리의 고유 CDR 서열의 빈도에 관한 그래프이다. 실제 제조된 scFv 라이브러리의 NGS 분석으로부터 발견한 CDR 서열과 설계된 CDR 레파토리에서 각 고유 CDR 서열이 발생한 빈도를 XY 분포 그래프로 표시하였다. 그래프 내의 각 점은 고유 CDR 서열을 의미한다. 한편, CDR-H3 서열은 대부분의 서열이 설계된 레퍼토리에서 오직 한번만 발생하기 때문에 분석하지 않았다.
도 7은 제조된 라이브러리의 다양한 도메인 서열 중복도를 나타낸 도이다. Illumina MiSeq 플랫폼 상의 300 bp paired-end 서열분석을 통해 셀렉션되지 않은 라이브러리의 다양한 도메인 서열을 수득하고, 다양한 도메인 서열에 대한 중복회수(n)를 분석하였다. VΗ 및 Vλ의 약 98% 및 Vκ의 약 88.5% 서열이 단 한번 발견되었다 (n = 1).
도 8은 설계된 CDR 및 실제 CDR의 길이 분포를 나타낸 도이다. (a) CDR-H2, L1 (kappa 및 lambda), 및 L3 (kappa 및 lambda)은 다양한 길이의 서열을 포함한다. 설계된 레파토리에서의 길이 분포와 차세대 서열분석(Next generation sequencing, NGS)에서 분석된 길이 분포의 비교를 통하여, 짧은 CDR이 실제 라이브러리에서 선호됨을 시사하는 결과를 얻었다. (b) 짧은 CDR에 대한 선호성은 다른 CDR에 비해 넓은 길이 다양성 범위를 가지는 CDR-H3에서 특히 분명하게 보여졌다. (a) 및 (b) 둘 모두에서, 청색 막대("설계")는 설계 레파토리에서 각 CDR 길이의 빈도수를 보여주며, 주황색 막대("라이브러리 내 확인")는 제조된 라이브러리의 차세대 서열분석(Next generation sequencing, NGS)을 통해 확인된 각 CDR 길이의 빈도수를 보여준다.
도 9는 CDR-H3의 아미노산 분포를 나타낸 도이다. 자연 인간 항체(N), 설계된 레파토리 (D), 및 실제 제조된 라이브러리 (L)의 CDR-H3의 각 위치별 아미노산 분포를 나타내고 있다. 각 중첩막대는 각기 다른 길이의 CDR-H3의 각 Kabat 위치에서의 아미노산 빈도의 총합을 나타내고 있다. 각기 다른 길이를 가지는 모든 CDR-H3에 대해서, 마지막 세 개의 아미노산 잔기를 각각 100j, 101 및 102로 표시하였다.
상기 목적을 달성하기 위하여, 본 발명의 일 양태는 항체의 상보성 결정부위(complementarity Determining Regions, CDRs) 서열을 개별적으로 설계하는 단계; 및 상기 설계한 서열을 가지는 상보성 결정부위들을 포함하는 항체를 합성하여 라이브러리를 제조하는 단계를 포함하는, 항체 라이브러리를 제작하는 방법을 제공한다.
하나의 구체예로서, 본 발명은 상기 항체 라이브러리를 구성하는 항체의 상보성 결정부위를 이루는 중쇄 상보성 결정부위 1(CDR-H1), 중쇄 상보성 결정부위 2(CDR-H2), 중쇄 상보성 결정부위 3(CDR-H3), 경쇄 상보성 결정부위 1(CDR-L1), 경쇄 상보성 결정부위 2(CDR-L2) 및 경쇄 상보성 결정부위 3(CDR-L3)은 다양성(polymorphism)을 가지는 것인, 항체 라이브러리를 제작하는 방법을 제공한다.
한편, 상기 상보성 결정부위 서열 중 경쇄를 설계하는 경우에 해당 경쇄는 카파(kappa) 경쇄 및/또는 람다(lambda) 경쇄일 수 있다.
다른 하나의 구체예로서, 본 발명은 상보성 결정부위 서열의 개별적인 설계시, CDR-H1, CDR-H2, CDR-L1 또는 CDR-L2에 대하여 실제 인간유래 숙성 항체의 상보성 결정부위의 i) 생식계열(germline) 면역글로불린 유전자 사용빈도, ii) 각 아미노산 위치별로 체세포 초돌연변이에 의한 각 20종의 아미노산으로의 변이 빈도, iii) 상보성 결정부위 서열의 길이별 빈도 또는 iv) 이들의 조합을 분석하여 계산된 각 아미노산 위치별 빈도를 반영하여 모사한 서열을 설계하는 것인, 항체 라이브러리를 제작하는 방법을 제공한다.
또 다른 하나의 구체예로서, 본 발명은 상보성 결정부위 서열의 개별적인 설계시, CDR-L3에 대하여
a) 상기 상보성 결정부위의 N 말단으로부터 7개 내지 8개의 아미노산 서열은 실제 인간유래 숙성 항체의 상보성 결정부위의 i) 생식계열(germline) 면역글로불린 유전자 사용빈도, ii) 각 아미노산 위치별로 체세포 초돌연변이에 의한 각 20종의 아미노산으로의 변이 빈도, iii) 상보성 결정부위 CDR-L3 서열의 길이별 빈도 또는 iv) 이들의 조합을 분석하여 계산된 각 아미노산 위치별 빈도를 반영하여 모사한 서열을 설계하고;
b) 상기 상보성 결정부위의 C 말단으로부터 2개 내지 3개의 아미노산 서열은 실제 인간유래 숙성 항체의 상보성 결정부위의 각 아미노산 위치별 빈도를 분석하여 계산된 빈도를 반영하여 모사한 서열을 설계하는 것이며;
상기 CDR-L3는 9개 내지 11개의 아미노산으로 이루어지고, 상기 빈도 분석은 각 길이별로 나누어 분석하며, 상기 CDR-L3 서열의 설계는 설계하고자 하는 CDR-L3의 길이와 동일한 아미노산 길이를 가지는 인간유래 숙성 항체의 상보성 결정부위 CDR-L3를 분석한 결과를 기반으로 설계하는 것인, 항체 라이브러리를 제작하는 방법을 제공한다.
또 다른 하나의 구체예로서, 본 발명은 상기 상보성 결정부위 서열 중 경쇄를 설계하는 경우에 해당 경쇄는 카파(kappa) 경쇄 또는 람다(lambda) 경쇄인 것인, 항체 라이브러리를 제작하는 방법을 제공한다.
또 다른 하나의 구체예로서, 본 발명은 상보성 결정부위 서열의 개별적인 설계시, CDR-H3에 대하여
a) 상기 상보성 결정부위의 C 말단으로부터 3개의 아미노산을 제외한 서열들은 실제 인간유래 숙성 항체의 상보성 결정부위의 각 아미노산 위치별 빈도를 반영하여 모사한 서열을 설계하고;
b) 상기 상보성 결정부위의 C 말단으로부터 3개의 아미노산 서열은 실제 인간유래 숙성 항체의 상보성 결정부위의 해당 3개의 아미노산 서열의 위치별 빈도를 분석하여 계산된 빈도를 반영하여 모사한 서열을 설계하는 것이며;
상기 CDR-H3는 9개 내지 20개의 아미노산으로 이루어지고, 상기 빈도 분석은 각 길이별로 나누어 분석하며, 상기 CDR-H3 서열의 설계는 설계하고자 하는 CDR-H3의 길이와 동일한 아미노산 길이를 가지는 인간유래 숙성 항체의 상보성 결정부위 CDR-H3를 분석한 결과를 기반으로 설계하는 것인, 항체 라이브러리를 제작하는 방법을 제공한다.
또 다른 하나의 구체예로서, 본 발명은 상기 상보성 결정부위 아미노산 서열을 설계한 후 설계된 서열에서 N-당화, 이성질체화, 탈아미드화, 절단, 산화가 일어날 수 있는 서열을 배제하는 단계를 추가로 포함하는 것인, 항체 라이브러리를 제작하는 방법을 제공한다.
또 다른 하나의 구체예로서, 본 발명은 상기 상보성 결정부위 아미노산 서열을 설계한 후 설계한 서열을 폴리뉴클레오티드로 역번역한 후, 번역된 폴리뉴클레오티드 5' 및 3' 말단에 각각 해당하는 인간항체 생식계열(germline) 유전자의 가변영역 골격부위 서열을 연결한 올리고뉴클레오티드 서열을 설계하는 단계를 추가로 포함하는 것인, 항체 라이브러리를 제작하는 방법을 제공한다.
또 다른 하나의 구체예로서, 본 발명은 상기 항체는 VH3-23 (Genebank accession No. Z12347), VK3-A27 (Genebank accession No. X93639), VL1g(GenBank accession No. Z73663) 또는 이들의 단편으로부터 코딩되는 아미노산 서열을 포함하는 것인, 항체 라이브러리를 제작하는 방법을 제공한다.
또 다른 하나의 구체예로서, 본 발명은 상보성 결정부위 서열의 개별적인 설계시, 경쇄 상보성 결정부위를 설계함에 있어 카파 경쇄와 람다 경쇄에 대하여 각각 CDR을 설계하는 것인, 항체 라이브러리를 제작하는 방법을 제공한다.
또 다른 하나의 구체예로서, 본 발명은 카파 경쇄와 람다 경쇄에 대하여 각 경쇄 가변영역을 설계시, 카파 경쇄의 CDR은 VK3-A27의 카파 경쇄 골격부위와 연결하여 조립하고, 람다 경쇄의 CDR은 VL1g의 람다 경쇄 골격부위와 연결하여 조립하는 것인, 항체 라이브러리를 제작하는 방법을 제공한다.
또 다른 하나의 구체예로서, 본 발명은 상기 항체는 IgA, IgD, IgE, IgM, IgG, Fc 단편, Fab, Fab', F(ab')2, scFv, 단일 가변도메인 항체 및 Fv로 이루어진 군에서 선택된 것인, 항체 라이브러리를 제작하는 방법을 제공한다.
또 다른 하나의 구체예로서, 본 발명은 하기 1) 내지 6) 중 어느 하나 이상에 해당하는 것인, 항체 라이브러리를 제작하는 방법을 제공한다:
1) 상기 중쇄의 CDR-H1에 대한 생식계열 CDR 서열은 서열번호 54 내지 84의 아미노산 서열을 사용;
2) 상기 중쇄의 CDR-H2에 대한 생식계열 CDR 서열은 서열번호 85 내지 121의 아미노산 서열을 사용;
3) 상기 경쇄 CDR 설계에 사용하는 생식계열 CDR 서열로 카파 경쇄를 사용하고, 카파 경쇄의 CDR-L1에 대한 생식계열 CDR 서열은 서열번호 122 내지 145의 아미노산 서열을 사용;
4) 상기 경쇄 CDR 설계에 사용하는 생식계열 CDR 서열로 카파 경쇄를 사용하고, 카파 경쇄의 CDR-L2에 대한 생식계열 CDR 서열은 서열번호 146 내지 165의 아미노산 서열을 사용;
5) 상기 경쇄 CDR 설계에 사용하는 생식계열 CDR 서열로 람다 경쇄를 사용하고, 람다 경쇄의 CDR-L1에 대한 생식계열 CDR 서열로써 서열번호 166 내지 189의 아미노산 서열을 사용; 및
6) 상기 경쇄 CDR 설계에 사용하는 생식계열 CDR 서열로 람다 경쇄를 사용하고, 람다 경쇄의 CDR-L2에 대한 생식계열 CDR 서열은 서열번호 190 내지 209의 아미노산 서열을 사용.
또 다른 하나의 구체예로서, 본 발명은 하기 1) 내지 2) 중 어느 하나 이상에 해당하는 것인, 항체 라이브러리를 제작하는 방법을 제공한다:
1) 경쇄 CDR 설계에 사용하는 생식계열 CDR 서열로 카파 경쇄를 사용하고, 카파 경쇄의 CDR-L3에 대한 생식계열 CDR 서열은 서열번호 210 내지 236의 아미노산 서열을 사용; 및
2) 경쇄 CDR 설계에 사용하는 생식계열 CDR 서열로 람다 경쇄를 사용하고, 람다 경쇄의 CDR-L3에 대한 생식계열 CDR 서열은 서열번호 237 내지 252의 아미노산 서열을 사용.
또 다른 하나의 구체예로서, 본 발명은 상기 각 생식계열 CDR 서열의 사용빈도는 항체서열 데이터베이스의 분석을 통해 알아낸 자연인간항체에서의 각 생식계열 CDR 서열의 사용빈도를 모사한 것인, 항체 라이브러리를 제작하는 방법을 제공한다.
본 발명의 다른 양태는, 상기 항체 라이브러리를 제작하는 방법에 의해 제조된 항체 라이브러리를 제공한다.
하나의 구체예로서, 본 발명은 상기 항체 라이브러리는 하기 1) 내지 9) 중 하나 이상에 해당하는 것인, 항체 라이브러리를 제공한다:
1) 중쇄의 CDR-H1에 대한 생식계열 CDR 서열은 서열번호 54 내지 84의 아미노산 서열을 사용;
2) 중쇄의 CDR-H2에 대한 생식계열 CDR 서열은 서열번호 85 내지 121의 아미노산 서열을 사용;
3) 중쇄의 CDR-H3는 길이가 아미노산 9개 내지 20개이며, 길이별 빈도 및 각 위치에서의 아미노산 사용빈도가 자연인간항체 서열들의 CDR-H3의 길이별 빈도 및 각 위치에서의 아미노산 사용빈도를 모사한 형태;
4) 경쇄 CDR 설계에 사용하는 생식계열 CDR 서열로 카파 경쇄를 사용하고, 카파 경쇄의 CDR-L1에 대한 생식계열 CDR 서열은 서열번호 122 내지 145의 아미노산 서열을 사용;
5) 경쇄 CDR 설계에 사용하는 생식계열 CDR 서열로 카파 경쇄를 사용하고, 카파 경쇄의 CDR-L2에 대한 생식계열 CDR 서열은 서열번호 146 내지 165의 아미노산 서열을 사용;
6) 경쇄 CDR 설계에 사용하는 생식계열 CDR 서열로 카파 경쇄를 사용하고, 카파 경쇄의 CDR-L3에 대한 생식계열 CDR 서열은 서열번호 210 내지 236의 아미노산 서열을 사용;
7) 경쇄 CDR 설계에 사용하는 생식계열 CDR 서열로 람다 경쇄를 사용하고, 람다 경쇄의 CDR-L1에 대한 생식계열 CDR 서열은 서열번호 166 내지 189의 아미노산 서열을 사용;
8) 경쇄 CDR 설계에 사용하는 생식계열 CDR 서열로 람다 경쇄를 사용하고, 람다 경쇄의 CDR-L2에 대한 생식계열 CDR 서열은 서열번호 190 내지 209의 아미노산 서열을 사용; 및
9) 경쇄 CDR 설계에 사용하는 생식계열 CDR 서열로 람다 경쇄를 사용하고, 람다 경쇄의 CDR-L3에 대한 생식계열 CDR 서열은 서열번호 237 내지 252의 아미노산 서열을 사용.
또 다른 하나의 구체예로서, 본 발명은 상기 1) 내지 2) 및 4) 내지 9)의 경우 각 생식계열 CDR 서열의 사용빈도는 항체서열 데이터베이스의 분석을 통해 알아낸 자연인간항체에서의 각 생식계열 CDR 서열의 사용빈도를 모사한, 항체 라이브러리를 제공한다.
상기 본 발명을 설명함에 있어, 사용되는 용어를 하기 정의하였다.
A. 정의
"파지표면제시 (phage display)"는 M13 박테리오파지의 유전자를 조작하여 그 표면단백질 중 하나의 유전자에 외부단백질의 유전자를 융합하고, 생산된 파지의 표면단백질에 외부단백질이 융합되어 파지의 표면에 제시되는 기법이다. 단백질을 표면제시하는 경우 흔히 gIII 유전자의 5' 쪽에 외부유전자를 융합한다.
"항체"는 목표항원에 특이적으로 결합하는 단백질을 의미하며, 다클론 항체 및 단일클론항체를 모두 포함한다. 또한, 상기 용어는 키메라성 항체(예를 들면, 인간화 뮤린 항체) 및 이종결합항체(예를 들면, 양특이성 항체)와 같은 유전공학에 의해 생산된 형태를 포함한다. 특히, 항체는 경쇄(light chain)과 중쇄(heavy chain)이 각각 2개씩 모여 이루어지는 헤테로테트라머이며 각각의 사슬은 아미노산 서열이 가변적인 가변도메인(variable domain)과 일정한 서열을 가지는 고정도메인(constant domain)으로 이루어질 수 있으나, 상기 형태에 제한되지 않는다.
본 발명에서 항체는 IgA, IgD, IgE, IgM 및 IgG를 포함하며, IgG는 아형(subtype)으로, IgG1, IgG2, IgG3 및 IgG4를 포함하며, 항체 단편을 포함할 수 있다. 항체 단편은 항원 결합 기능을 보유하고 있는 단편을 의미하며, Fc 단편, Fab, Fab', F(ab')2, scFv, 단일 가변도메인 항체 및 Fv 등을 포함하며 항체의 항원 결합 형태를 포함한다. 상기 Fc 단편은 Fc 수용체와 같은 세포 표면 수용체와 결합할 수 있는 항체의 말단 부위를 의미하며, 항체의 두 개의 중쇄의 2번 또는 3번째 보존 도메인(constant domain)으로 구성된다. 상기 Fab는 경쇄 및 중쇄의 가변영역과 경쇄의 불변 영역 및 중쇄의 첫 번째 불변 영역(CH1)을 가지는 구조로 1개의 항원 결합 부위를 가진다. Fab'는 중쇄 CH1 도메인의 C 말단에 하나 이상의 시스테인 잔기를 포함하는 힌지 영역(hinge region)을 가진다는 점에서 Fab와 차이가 있다. F(ab')2 항체는 Fab'의 힌지 영역의 시스테인 잔기가 디설파이드 결합을 이루면서 생성된다. Fv(variable fragment)는 중쇄 가변부위 및 경쇄 가변부위만을 가지고 있는 최소의 항체조각을 의미한다. 이중쇄 Fv(dsFv, disulfide-stabilized variable frament)는 디설파이드 결합으로 중쇄 가변부위와 경쇄 가변부위가 연결되어 있고 단쇄 Fv(scFv, single chain variable frament)는 일반적으로 펩타이드 링커를 통하여 중쇄의 가변 영역(VH)과 경쇄의 가변 영역(VL)이 공유 결합으로 연결되어 있다. 단일 가변도메인 항체는 중쇄 또는 경쇄 가변도메인 하나만으로 이루어진 항체조각을 의미한다.
본 발명의 항체는 재조합 단일 사슬 Fv 단편 (scFv)을 포함하며, 이가(bivalent) 또는 양특이성 분자, 디아바디 (Diabody), 트리아바디(Triabody) 및 테트라바디 (Tetrabody)를 모두 제한없이 포함한다.
"상보성 결정부위" (Complementarity determining region, CDR)는 가변도메인의 경쇄와 중쇄에 각각 3개씩 존재하는 부위이며 가변도메인 중에서도 아미노산 서열의 가변성이 특히 높은 부분으로 이러한 높은 가변성에 의해 다양한 항원에 대해 특이적 항체가 찾아질 수 있다. 중쇄의 상보성 결정부위 3개를 아미노 말단부터 카르복실 말단방향으로 차례로 CDR-H1, CDR-H2, CDR-H3라 하며, 경쇄의 상보성 결정부위 3개를 아미노 말단부터 카르복실 말단방향으로 차례로 CDR-L1, CDR-L2, CDR-L3라 한다. 하나의 항체에서 이 여섯 개의 상보성 결정부위가 모여 항원 결합부위를 형성한다.
"골격 부위"는 가변도메인 서열 중 상보성 결정부위를 제외한 나머지 부위를 말하며, 상보성 결정부위에 비해 서열의 가변성 및 다양성이 낮고 일반적으로 항원-항체 반응에 참여하지 않는 부위를 의미한다.
"면역글로불린"은 항체와 구조적 특성이 동일하며, 항원특이성이 없는 항체유사분자와 항체를 포함하는 개념이다.
"생식계열 면역글로불린 유전자"는 동물의 생식세포에 존재하는, B 세포로 분화되어 면역글로불린 유전자의 재조합이나 체세포 초돌연변이(somatic hypermutation) 과정을 거치지 않은 항체 유전자이며, 그 수는 동물의 종에 따라 다르나 보통 수십 내지 수백개이다.
"숙성 항체"는 B 세포 분화를 통해 생식계열 면역글로불린 유전자들의 재조합, 또는 재조합과 체세포 초돌연변이 과정을 거쳐 만들어진 항체 유전자로부터 발현된 항체 단백질이다.
"단일사슬단편항체(single-chain Fv, scFv)"는 항체의 경쇄 및 중쇄의 가변도메인을 15개 내외의 아미노산이 연결된 펩타이드 사슬로 이루어진 연결부위(linker)로 연결한 단백질이다. 경쇄가변도메인 - 연결부위 - 중쇄가변도메인, 또는 중쇄가변도메인 - 연결부위 - 경쇄가변도메인의 순서 모두 가능하며, 원 항체와 동일 혹은 유사한 항원특이성을 가진다. 연결부위는 주로 글리신(glycine)과 세린(serine)으로 이루어진 친수성의 유연한 펩타이드 사슬로서 "(Gly-Gly-Gly-Gly-Ser)3"의 15개의 아미노산 서열 혹은 유사한 서열이 주로 사용될 수 있다.
"항체 라이브러리"는 서로 다른 서열을 가지는 다양한 항체 유전자들의 집합이다. 항체라이브러리로부터 임의의 항원에 대해 특이적 항체를 분리하기 위해서는 매우 높은 다양성이 요구되며, 일반적으로 109 내지 1011 개의 서로 다른 항체 클론들로 이루어진 라이브러리가 구축되어 사용된다. 이러한 항체라이브러리를 이루는 항체 유전자는 파지미드(phagemid) 벡터에 클로닝되어 대장균에 트랜스폼 된다.
"파지미드(phagemid)" 벡터는 파지복제시작점(phage origin of replication)을 가지는 플라스미드 DNA이다. 통상적으로 항생제내성유전자를 선택 마커(selection marker)로 가지고 있다. 파지표면제시에 사용되는 파지미드 벡터의 경우 M13 파지의 gIII 유전자 혹은 그 일부가 포함되어 있으며, 라이브러리 유전자는 gIII 유전자의 5' 말단에 라이게이션(ligation)되어 대장균에서 융합단백질로서 발현된다.
"보조파지(helper phage)"는 파지미드가 파지 입자로 조립되도록 필요한 유전정보를 제공하는 파지이다. 파지미드에는 파지 유전자 중 gIII 혹은 그 일부만이 존재하므로 파지미드로 형질전환된 대장균을 보조파지로 감염시켜 나머지 파지 유전자를 공급하게 된다. M13K07 혹은 VCSM13 등의 종류가 있으며 대부분 카나마이신(kanamycin) 등 항생제 내성 유전자를 포함하여 보조파지에 감염된 대장균을 선택할 수 있도록 하고 있다. 또한 조립신호(packaging signal)에 결함이 있으므로 보조파지 유전자보다 파지미드 유전자가 선별적으로 파지입자 속으로 조립된다.
"패닝"은 파지 표면에 디스플레이된 항체 등 단백질의 라이브러리로부터 특정 분자에 결합하는 클론만을 선택적으로 증폭시키는 과정을 뜻한다. 표면에 고정된 표적분자에 파지 라이브러리를 가하여 결합을 유도하고, 결합하지 않은 파지 클론을 세척하여 제거한 후, 결합된 파지 클론들만을 용출하여 다시 대장균 숙주에 감염시키고 보조 파지를 이용하여 표적 결합 파지 클론들을 증폭하는 절차를 거친다. 대부분 이러한 과정을 3 내지 4회 혹은 그 이상 반복하여 결합 클론의 비율을 최대한 높이게 된다.
B. 라이브러리의 설계, 구축 및 검증
상기 목적을 달성하기 위한 하나의 양태로서, 본 발명은 항체의 상보성 결정부위(complementarity Determining Regions, CDRs) 서열을 개별적으로 설계하는 단계; 및 상기 설계한 서열을 가지는 상보성 결정부위들을 포함하는 항체를 합성하여 라이브러리를 제조하는 단계를 포함하는, 항체 라이브러리를 제작하는 방법을 제공한다.
본 발명에 기술된 방법을 이용해 인간항체 라이브러리를 구축하고 그로부터 임의의 항원에 대한 인간항체를 얻을 수 있다. 항체 라이브러리는 골수, 비장, 혈액 등에 포함된 B 세포로부터 그 다양성을 얻는 방법과 인공적인 설계와 합성을 통해 다양성을 얻는 방법으로 구축될 수 있으며 본 발명은 합성 인간항체 라이브러리의 구축 및 검증을 제공한다.
파지 표면제시 항체라이브러리는 면역 글로불린 분자의 일부인 Fab 혹은 scFv 단편의 형태로 구축되어 진다. 이들 단편은 150 kDa 크기의 면역 글로불린보다 작기 때문에 단백질 공학적인 조작의 효율성을 기할 수 있으며, 면역 글로불린 분자와 동일한 항원선택성을 가진다. 본 발명에서는 25 kDa 크기를 가지는 scFv 단편을 이용한 라이브러리를 구축하였으며, 구체적으로 면역 글로불린의 VH 도메인과 VL 도메인을 15개의 아미노산으로 이루어진 사슬 즉 (Gly-Gly-Gly-Gly-Ser)3 로 연결한 하나의 폴리펩티드 사슬이다.
합성 라이브러리의 구축을 위해서는 라이브러리 서열의 설계가 선행되어야 한다. 비교적 높은 골격 다양성을 가지는 B세포 유래 항체 라이브러리 혹은 자연항체 라이브러리(natural antibody library)와 달리, 합성 항체라이브러리는 한 개 혹은 제한된 개수의 골격 서열을 기반으로 구축된다.
본 발명의 구체적인 일 실시예에서 제작된 항체 라이브러리는 두 개의 골격을 가진다. 구체적으로 라이브러리를 이루는 모든 클론들이 인간 면역글로불린의 VH3-23 유전자와 VK3-A27 유전자가 연결부위로 이어진 scFv, 혹은 VH3-23 유전자와 VL1g 유전자가 연결부위로 이어진 scFv를 골격으로 가지도록 구축하였으며, 이 중 상보성 결정부위에 인공적 다양성을 도입하여 라이브러리를 구축하였다. 즉 상기 라이브러리의 골격에 다양한 상보성 결정부위(CDR) 서열을 삽입하여 scFv 항체 라이브러리를 제작하였다.
구체적으로 본 발명의 항체 라이브러리는 항체 라이브러리를 구성하는 항체의 상보성 결정부위를 이루는 중쇄 상보성 결정부위 1(CDR-H1), 중쇄 상보성 결정부위 2(CDR-H2), 중쇄 상보성 결정부위 3(CDR-H3), 경쇄 상보성 결정부위 1(CDR-L1), 경쇄 상보성 결정부위 2(CDR-L2) 및 경쇄 상보성 결정부위 3(CDR-L3)은 다양성(polymorphism)을 가지는 것일 수 있다.
특히, 본 발명에서 상보성 결정부위 서열의 개별적인 설계시, CDR-H1, CDR-H2, CDR-L1 또는 CDR-L2에 대하여 실제 인간유래 숙성 항체의 상보성 결정부위의 i) 생식계열(germline) 면역글로불린 유전자 사용빈도, ii) 각 아미노산 위치별로 체세포 초돌연변이에 의한 각 20종의 아미노산으로의 변이 빈도, iii) 상보성 결정부위 서열의 길이별 빈도 또는 iv) 이들의 조합을 분석하여 계산된 각 아미노산 위치별 빈도를 반영하여 모사한 서열을 설계하는 것일 수 있다.
한편, 본 발명은 상보성 결정부위 서열의 개별적인 설계시, CDR-L3에 대하여 a) 상기 CDR-L3 상보성 결정부위의 N 말단으로부터 7개 내지 8개의 아미노산 서열은 실제 인간유래 숙성 항체의 상보성 결정부위의 i) 생식계열(germline) 면역글로불린 유전자 사용빈도, ii) 각 아미노산 위치별로 체세포 초돌연변이에 의한 각 20종의 아미노산으로의 변이 빈도, iii) 상보성 결정부위 CDR-L3 서열의 길이별 빈도 또는 iv) 이들의 조합을 분석하여 계산된 각 아미노산 위치별 빈도를 반영하여 모사한 서열을 설계하고;
b) 상기 CDR-L3 상보성 결정부위의 C 말단으로부터 2개 내지 3개의 아미노산 서열은 실제 인간유래 숙성 항체의 상보성 결정부위의 각 아미노산 위치별 빈도를 분석하여 계산된 빈도를 반영하여 모사한 서열을 설계하는 것이며;
상기 CDR-L3는 9개 내지 11개의 아미노산으로 이루어지고, 상기 빈도 분석은 각 길이별로 나누어 분석하며, 상기 CDR-L3 서열의 설계는 설계하고자 하는 CDR-L3의 길이와 동일한 아미노산 길이를 가지는 인간유래 숙성 항체의 상보성 결정부위 CDR-L3를 분석한 결과를 기반으로 설계하는 것일 수 있다.
아울러, 본 발명은 상보성 결정부위 서열의 개별적인 설계시, CDR-H3에 대하여 a) 상기 상보성 결정부위의 C 말단으로부터 3개의 아미노산을 제외한 서열들은 실제 인간유래 숙성 항체의 상보성 결정부위의 각 아미노산 위치별 빈도를 반영하여 모사한 서열을 설계하고;
b) 상기 상보성 결정부위의 C 말단으로부터 3개의 아미노산 서열은 실제 인간유래 숙성 항체의 상보성 결정부위의 해당 3개 아미노산 서열의 위치별 빈도를 분석하여 계산된 빈도를 반영하여 모사한 서열을 설계하는 것이며;
상기 CDR-H3는 9개 내지 20개의 아미노산으로 이루어지고, 상기 빈도 분석은 각 길이별로 나누어 분석하며, 상기 CDR-H3 서열의 설계는 설계하고자 하는 CDR-H3의 길이와 동일한 아미노산 길이를 가지는 인간유래 숙성 항체의 상보성 결정부위 CDR-H3를 분석한 결과를 기반으로 설계하는 것일 수 있다.
본 발명에서 본 발명의 라이브러리 중쇄 CDR 설계에 사용하는 생식계열 CDR 서열로써, CDR-H1에 대한 생식계열 CDR 서열은 서열번호 54 내지 84의 아미노산 서열이며, CDR-H2에 대한 생식계열 CDR 서열은 서열번호 85 내지 121의 아미노산 서열일 수 있다. 한편, CDR-H3의 설계에 있어서는 생식계열 CDR 서열을 사용하지 않고, 그 길이를 아미노산 9개 내지 20개로 하여, 길이별 빈도 및 각 위치에서의 아미노산 사용빈도가 자연인간항체 서열들의 CDR-H3의 길이별 빈도 및 각 위치에서의 아미노산 사용빈도를 모사하도록 할 수 있다.
또한, 본 발명의 라이브러리 경쇄 CDR 설계에 사용하는 생식계열 CDR 서열로, 람다 경쇄 또는 카파 경쇄를 가질 수 있으며, 카파 경쇄의 CDR-L1에 대한 생식계열 CDR 서열은 서열번호 122 내지 145의 아미노산 서열이고, 카파 경쇄의 CDR-L2에 대한 생식계열 CDR 서열은 서열번호 146 내지 165의 아미노산 서열일 수 있다. 한편, 카파 경쇄의 CDR-L3에 대한 생식계열 CDR 서열은 서열번호 210 내지 236의 아미노산 서열일 수 있다.
한편, 본 발명의 람다 경쇄의 CDR-L1에 대한 생식계열 CDR 서열은 서열번호 166 내지 189의 아미노산 서열이고, 람다 경쇄의 CDR-L2에 대한 생식계열 CDR 서열은 서열번호 190 내지 209의 아미노산 서열일 수 있다. 한편, 람다 경쇄의 CDR-L3에 대한 생식계열 CDR 서열은 서열번호 237 내지 252의 아미노산 서열일 수 있다.
상기 항체 라이브러리를 제작하는 방법, 특히 본 발명의 항체 라이브러리에 포함되는 CDR-H1, CDR-H2, CDR-L1 및 CDR-L2에 대한 설계를 하는 방법은 하기 1) 내지 6) 중 어느 하나 이상에 해당할 수 있다:
1) 상기 중쇄의 CDR-H1에 대한 생식계열 CDR 서열은 서열번호 54 내지 84의 아미노산 서열을 사용;
2) 상기 중쇄의 CDR-H2에 대한 생식계열 CDR 서열은 서열번호 85 내지 121의 아미노산 서열을 사용;
3) 상기 경쇄 CDR 설계에 사용하는 생식계열 CDR 서열로 카파 경쇄를 사용하고, 카파 경쇄의 CDR-L1에 대한 생식계열 CDR 서열은 서열번호 122 내지 145의 아미노산 서열을 사용;
4) 상기 경쇄 CDR 설계에 사용하는 생식계열 CDR 서열로 카파 경쇄를 사용하고, 카파 경쇄의 CDR-L2에 대한 생식계열 CDR 서열은 서열번호 146 내지 165의 아미노산 서열을 사용;
5) 상기 경쇄 CDR 설계에 사용하는 생식계열 CDR 서열로 람다 경쇄를 사용하고, 람다 경쇄의 CDR-L1에 대한 생식계열 CDR 서열로써 서열번호 166 내지 189의 아미노산 서열을 사용; 및
6) 상기 경쇄 CDR 설계에 사용하는 생식계열 CDR 서열로 람다 경쇄를 사용하고, 람다 경쇄의 CDR-L2에 대한 생식계열 CDR 서열은 서열번호 190 내지 209의 아미노산 서열을 사용.
또한, 상기 항체 라이브러리를 제작하는 방법, 특히 본 발명의 항체 라이브러리에 포함되는 CDR-L3에 대한 설계를 하는 방법은 하기 1) 내지 2) 중 어느 하나 이상에 해당할 수 있다:
1) 경쇄 CDR 설계에 사용하는 생식계열 CDR 서열로 카파 경쇄를 사용하고, 카파 경쇄의 CDR-L3에 대한 생식계열 CDR 서열은 서열번호 210 내지 236의 아미노산 서열을 사용; 및
2) 경쇄 CDR 설계에 사용하는 생식계열 CDR 서열로 람다 경쇄를 사용하고, 람다 경쇄의 CDR-L3에 대한 생식계열 CDR 서열은 서열번호 237 내지 252의 아미노산 서열을 사용.
상기 각 생식계열 CDR 서열의 사용빈도는 항체서열 데이터베이스의 분석을 통해 알아낸 자연인간항체에서의 각 생식계열 CDR 서열의 사용빈도를 모사한 것일 수 있다.
본 발명의 구체적인 실시예에서 본 발명의 라이브러리 중쇄 CDR 설계에 사용된 생식계열 CDR 서열은, CDR-H1에 대한 생식계열 CDR 서열은 서열번호 54 내지 84의 아미노산 서열이며, CDR-H2에 대한 생식계열 CDR 서열은 서열번호 85 내지 121의 아미노산 서열이었다. 중쇄의 CDR-H3의 설계에 있어 그 길이를 아미노산 9개 내지 20개로 하여, 길이별 빈도 및 각 위치에서의 아미노산 사용빈도가 자연인간항체 서열들의 CDR-H3의 길이별 빈도 및 각 위치에서의 아미노산 사용빈도를 모사하도록 설계하였다.
또한, 본 발명의 라이브러리 경쇄 CDR 설계에 사용된 생식계열 CDR 서열로, 람다 경쇄 또는 카파 경쇄 중에서 먼저 카파 경쇄의 CDR-L1에 대한 생식계열 CDR 서열은 서열번호 122 내지 145의 아미노산 서열이고, 카파 경쇄의 CDR-L2에 대한 생식계열 CDR 서열은 서열번호 146 내지 165의 아미노산 서열이었다. 한편, 카파 경쇄의 CDR-L3에 대한 생식계열 CDR 서열은 서열번호 210 내지 236의 아미노산 서열이었다.
한편, 본 발명의 람다 경쇄의 CDR-L1에 대한 생식계열 CDR 서열은 서열번호 166 내지 189의 아미노산 서열이고, 람다 경쇄의 CDR-L2에 대한 생식계열 CDR 서열은 서열번호 190 내지 209의 아미노산 서열이었다. 한편, 람다 경쇄의 CDR-L3에 대한 생식계열 CDR 서열은 서열번호 237 내지 252의 아미노산 서열이었다.
본 발명의 항체 라이브러리 제조방법에서 상보성 결정부위 서열의 개별적인 설계시, 경쇄 상보성 결정부위를 설계함에 있어 카파 경쇄와 람다 경쇄에 대하여 각각 CDR을 설계할 수 있으며, 카파 경쇄와 람다 경쇄에 대하여 각 경쇄 가변영역을 설계시, 카파 경쇄의 CDR은 VK3-A27의 카파 경쇄 골격부위와 연결하여 조립하고, 람다 경쇄의 CDR은 VL1g의 람다 경쇄 골격부위와 연결하여 조립하는 것일 수 있다.
본 발명에서 "모사"란 아미노산 서열 등의 발현 빈도 또는 변이 빈도 등을 반영하여 랜덤으로 시뮬레이션하여 서열을 설계하는 것을 의미하며, 자연항체, 특히 인간유래 숙성 항체의 아미노산의 발현 빈도 또는 변이 빈도를 모사한다는 의미를 내포하고 있다.
본 발명의 구체적인 일 실시예에서 상보성 결정부위의 다양성은 알려진 인간항체들의 CDR 서열의 특성을 분석하고 시뮬레이션하여 인간항체 CDR과 유사한 서열적 다양성을 가지도록 설계하였다. 구체적으로, 먼저 IMGT 데이터베이스 (http://imgt.org)로부터 8,846개의 인간 면역글로불린 중쇄 가변부위 (VH), 3,110개의 카파 경쇄 가변부위 (Vκ), 2,440개의 람다 경쇄 가변부위 (Vλ) 서열을 다운로드하여 CDR 서열을 추출하였다. 다음으로, V-base (http://www2.mrc-lmb.cam.ac.uk/vbase/alignments2.php)에 있는 인간항체 생식계열(germline) 면역글로불린 유전자의 CDR 서열들과 상기 IMGT 데이터베이스에서 추출된 숙성(mature) CDR 서열들을 비교 분석하여, i) 각 숙성 CDR서열에 가장 가까운 생식계열 CDR 서열을 찾고, 이로부터 각 숙성 CDR에 일어난 돌연변이의 위치, 종류, 빈도를 확인하고 ii) 각 생식계열 CDR이 숙성 인간항체에서 사용되는 빈도를 계산하여 이용하였다.
먼저, 재조합이 일어나지 않고 체세포 초돌연변이만 일어나는 중쇄 및 경쇄의 CDR1과 CDR2에 대해서는 컴퓨터를 이용한 시뮬레이션을 통하여, 인간 생식계열 CDR 서열에 가상의 돌연변이를 도입하여 인간유래 숙성 항체의 CDR과 유사한 서열 및 생식계열 CDR 사용빈도를 가지도록 CDR 서열들을 설계하였다. 각 CDR 별로 1,500개의 시뮬레이션된 서열들이 설계되었다.
다음으로, 재조합 및 체세포 초돌연변이가 일어나는 경쇄의 CDR3에 대하여, 카파 경쇄의 경우 첫 7개의 아미노산에 대해서 CDR1 및 CDR2에서와 동일한 작업을 수행하고, 끝의 2개 혹은 3개의 아미노산 서열은 숙성 인간항체의 카파 경쇄 CDR3에서의 서열빈도를 모사하여 총 9개 혹은 10개 아미노산으로 이루어진 1,500개의 서열들을 설계하였다. 람다 경쇄의 경우 첫 7개 혹은 8개의 아미노산에 대하여 CDR1 및 CDR2에서와 동일한 작업을 수행하고, 끝의 2개 혹은 3개의 아미노산 서열은 숙성 인간항체의 람다 경쇄 CDR3에서의 서열빈도를 모사하여 총 9개, 10개, 혹은 11개 아미노산으로 이루어진 1,500개의 서열들을 설계하였다.
마지막으로, 재조합 및 체세포 초돌연변이가 일어나는 중쇄의 CDR3에서는 VDJ 재조합 및 접합부위 유연성(junctional flexibility), P-첨가 (P-addition), N-첨가 (N-addition) 등의 기전에 의하여 생식계열 서열의 확인이 어려운 경우가 많으므로 다른 CDR 같은 분석이 곤란함에 따라, 우선 길이별로 9개에서 20개의 아미노산 길이의 숙성 인간항체 CDR-H3 서열을 나누어 분석하여, 각 길이의 각 위치에서의 아미노산 사용빈도를 분석하여 시뮬레이션 하였다. 다만 마지막 3개의 아미노산 서열은 J 유전자로부터 유래하는 경우가 대부분이므로 각 CDR-H3 길이별로 자주 사용되는 최대 8개의 삼(3)아미노산 서열을 숙성항체에서의 사용빈도를 고려하여 설계하였다 (도 1).
특히, 중쇄의 CDR-H3를 설계하는데 있어 자연인간항체의 CDR-H3의 길이별 빈도 및 각 위치에서의 아미노산 사용빈도는 항체서열 데이터베이스의 분석을 통해 알아낼 수 있으며, 대표적으로 IMGT database (http://www.imgt.org)에 취합된 항체서열을 분석할 수 있다.
한편, 본 발명의 항체 라이브러리를 제조하는 방법은 상기 상보성 결정부위 아미노산 서열을 설계한 후 설계된 서열에서 N-당화, 이성질체화, 탈아미드화, 절단, 산화가 일어날 수 있는 서열을 배제하는 단계를 추가로 포함하는 것일 수 있다.
본 발명의 구체적인 일 실시예에서는, CDR 서열의 설계시, 다음의 번역후 변형(post translational modification) 서열을 포함하는 것들을 배제하였다. 단백질의 번역후 변형은 단백질의 기능 및 물성에 영향을 줄 수 있으므로 항체 라이브러리의 설계시 가능한 한 배제하는 것이 유리하다. 상기 번역 후 변형 서열에는, N-당화 (N-glycosylation) 서열, 즉 Asp-Xaa-Ser/Thr (Asp: 아스파라긴산, Xaa: 시스테인을 제외한 임의의 19종의 아미노산, Ser/Thr: 세린 혹은 트레오닌) 서열, 이성질체화 (isomerization) 서열, 탈아미드화 (deamidation) 서열, 절단(cleavage) 서열 및 산화(oxidation) 서열을 제외하였다.
한편, 본 발명의 항체 라이브러리를 제조하는 방법은 상기 상보성 결정부위 아미노산 서열을 설계한 후 설계한 서열을 폴리뉴클레오티드로 역번역한 후, 번역된 폴리뉴클레오티드 5' 및 3' 말단에 각각 해당하는 인간항체 생식계열(germline) 유전자의 가변영역 골격부위 서열을 연결한 올리고뉴클레오티드 서열을 설계하는 단계를 추가로 포함하는 것일 수 있다.
본 발명의 구체적인 일 실시예에서는 상기 설계된 CDR의 아미노산 서열은 뉴클레오티드 서열로 역번역하였으며 CDR 서열의 양 옆에 항체 가변부위의 골격부위 서열을 더하여 100개의 뉴클레오티드로 이루어진 올리고뉴클레오티드 서열들을 최종설계하였다. 총 19,836개의 서열을 설계하고, 이를 배열 합성(array synthesis)법을 통하여 올리고뉴클레오티드 혼합물의 형태로 합성하였다 (미국 텍사스주 휴스턴 소재 LC Sciences사).
본 발명의 항체 라이브러리를 제조하는 방법에서 항체는 항체 라이브러리 제작의 골격으로 VH3-23, VK3-A27, VL1g 또는 이들의 단편으로부터 코딩되는 아미노산 서열을 포함하는 것일 수 있다. 상기 VH3-23는 Genebank accession No. Z12347에 해당하는 것일 수 있고, VK3-A27는 Genebank accession No. X93639에 해당하는 것일 수 있으며, VL1g는 GenBank accession No. Z73663에 해당하는 것일 수 있다.
구체적인 일 실시예로 본 발명에서는 항체 라이브러리 제작의 골격으로 사용하기 위하여 코돈 최적화된 scFv 유전자들을 합성하였으며 (미국 뉴저지 주 피스카타웨이 시 소재 Genscript 사), 이 유전자들은 생식계열 유전자인 VH3-23와 VK3-A27, 또는 VH3-23과 VL1g가 (Gly-Gly-Gly-Gly-Ser)3의 연결부위로 연결된 scFv 유전자들로 pUC57 벡터에 클로닝되어있으며 파지미드 벡터로의 클로닝을 위해 pComb3X 벡터와 호환되는 두 개의 SfiI 제한효소 부위가 포함된다. 라이브러리 제작의 편의를 위하여, pUC57 벡터에 클로닝된 이 유전자들을 pComb3X 벡터로도 클로닝하여 PCR의 주형으로 사용하였다. 골격으로 사용하기 위한 용도이므로 이 유전자들은 서열적 다양성이 없는 단일서열들이며, 포유동물세포에서 발현이 향상되도록 코돈이 최적화되었으나 PCR 과정에서의 비특이적 어닐링(annealing)을 방지하기 위하여 아미노산 서열에 변화가 없는 범위에서 일부 최적화 DNA서열에 변화를 가하였다(서열번호 19 및 서열번호 20).
본 발명의 항체 라이브러리를 제조하는 방법에서 항체는 IgA, IgD, IgE, IgM, IgG, Fc 단편, Fab, Fab', F(ab')2, scFv, 단일 가변도메인 항체 및 Fv로 이루어진 군에서 선택된 것일 수 있다.
특히, 본 발명의 구체적인 일 실시예에서는 scFv 항체 라이브러리를 제작하였으며, 제작한 라이브러리로부터 scFv의 발현을 확인하였다 (도 2). 항체 라이브러리의 구축을 검증하기 위하여, 또한 scFv의 서열을 분석하였다. 라이브러리로부터 임의의 클론들을 선택하고 scFv 유전자를 PCR 기법으로 증폭한 후, DNA를 정제하여 서열분석을 의뢰하였다. 서열분석 결과, 설계한 대로 다양한 서열과 길이를 가지는 CDR들이 라이브러리를 이루는 scFv 클론들에 도입되어 있음을 확인할 수 있다(도 3). 구체적인 서열분석 결과, 18개의 scFv 서열들 중 절단(아스파라긴산-프롤린)서열이 PCR 오류로 도입된 1건을 제외하면 배제하고자 하였던 번역후 변형 서열들이 존재하지 않는 것을 확인하였다. 이에 비하여 인간 유래 숙성항체의 각 CDR에서의 이러한 번역후 변형을 유발할 수 있는 서열들의 존재비율을 분석한 결과 중쇄의 CDR-H1에서 5.7%, CDR-H2에서 39.7%, CDR-H3에서 34.5%, 카파 경쇄의 CDR-L1에서 12.6%, CDR-L2에서 0.6%, CDR-L3에서 15.9%, 람다 경쇄의 CDR-L1에서 8.3%, CDR-L2에서 6.4%, CDR-L3에서 24.0% 발견되었다. 이로부터 설계의도대로 번역후 변형이 최소화될 수 있는 항체 라이브러리가 구축되었음을 확인하였다.
또 하나의 양태로서, 본 발명은 본 발명의 항체 라이브러리를 제작하는 방법에 의해 제조된 항체 라이브러리를 제공한다.
본 발명의 항체 라이브러리는 CDR-H1에 대한 생식계열 CDR 서열로써 서열번호 54 내지 84의 아미노산 서열을 사용할 수 있으며, CDR-H2에 대한 생식계열 CDR 서열은 서열번호 85 내지 121의 아미노산 서열을 사용할 수 있다. 한편, CDR-H3의 설계에 있어 그 길이를 아미노산 9개 내지 20개로 하여, 길이별 빈도 및 각 위치에서의 아미노산 사용빈도가 자연인간항체 서열들의 CDR-H3의 길이별 빈도 및 각 위치에서의 아미노산 사용빈도를 모사하여 설계된 것일 수 있다.
본 발명의 항체 라이브러리는 경쇄 CDR 설계에 사용하는 생식계열 CDR 서열로 람다 경쇄 또는 카파 경쇄를 사용할 수 있으며, 카파 경쇄의 CDR-L1에 대한 생식계열 CDR 서열은 서열번호 122 내지 145의 아미노산 서열을 사용할 수 있고, 카파 경쇄의 CDR-L2에 대한 생식계열 CDR 서열은 서열번호 146 내지 165의 아미노산 서열을 사용하여 제작된 것일 수 있다. 아울러, 카파 경쇄의 CDR-L3에 대한 생식계열 CDR 서열은 서열번호 210 내지 236의 아미노산 서열을 사용하여 제작된 것일 수 있다.
한편, 본 발명의 항체 라이브러리는 람다 경쇄의 CDR-L1에 대한 생식계열 CDR 서열로써 서열번호 166 내지 189의 아미노산 서열을 사용할 수 있고, 람다 경쇄의 CDR-L2에 대한 생식계열 CDR 서열은 서열번호 190 내지 209의 아미노산 서열을 사용하여 제작된 것일 수 있다. 아울러, 람다 경쇄의 CDR-L3에 대한 생식계열 CDR 서열은 서열번호 237 내지 252의 아미노산 서열을 사용하여 제작된 것일 수 있다.
구체적으로, 본 발명의 항체 라이브러리는 하기 1) 내지 9) 중 하나 이상에 해당하는 것인, 항체 라이브러리일 수 있다:
1) 중쇄의 CDR-H1에 대한 생식계열 CDR 서열은 서열번호 54 내지 84의 아미노산 서열을 사용;
2) 중쇄의 CDR-H2에 대한 생식계열 CDR 서열은 서열번호 85 내지 121의 아미노산 서열을 사용;
3) 중쇄의 CDR-H3는 길이가 아미노산 9개 내지 20개이며, 길이별 빈도 및 각 위치에서의 아미노산 사용빈도가 자연인간항체 서열들의 CDR-H3의 길이별 빈도 및 각 위치에서의 아미노산 사용빈도를 모사한 형태;
4) 경쇄 CDR 설계에 사용하는 생식계열 CDR 서열로 카파 경쇄를 사용하고, 카파 경쇄의 CDR-L1에 대한 생식계열 CDR 서열은 서열번호 122 내지 145의 아미노산 서열을 사용;
5) 경쇄 CDR 설계에 사용하는 생식계열 CDR 서열로 카파 경쇄를 사용하고, 카파 경쇄의 CDR-L2에 대한 생식계열 CDR 서열은 서열번호 146 내지 165의 아미노산 서열을 사용;
6) 경쇄 CDR 설계에 사용하는 생식계열 CDR 서열로 카파 경쇄를 사용하고, 카파 경쇄의 CDR-L3에 대한 생식계열 CDR 서열은 서열번호 210 내지 236의 아미노산 서열을 사용;
7) 경쇄 CDR 설계에 사용하는 생식계열 CDR 서열로 람다 경쇄를 사용하고, 람다 경쇄의 CDR-L1에 대한 생식계열 CDR 서열은 서열번호 166 내지 189의 아미노산 서열을 사용;
8) 경쇄 CDR 설계에 사용하는 생식계열 CDR 서열로 람다 경쇄를 사용하고, 람다 경쇄의 CDR-L2에 대한 생식계열 CDR 서열은 서열번호 190 내지 209의 아미노산 서열을 사용; 및
9) 경쇄 CDR 설계에 사용하는 생식계열 CDR 서열로 람다 경쇄를 사용하고, 람다 경쇄의 CDR-L3에 대한 생식계열 CDR 서열은 서열번호 237 내지 252의 아미노산 서열을 사용.
특히, 본 발명은 상기 1) 내지 2) 및 4) 내지 9)의 경우 각 생식계열 CDR 서열의 사용빈도는 항체서열 데이터베이스의 분석을 통해 알아낸 자연인간항체에서의 각 생식계열 CDR 서열의 사용빈도를 모사한, 항체 라이브러리일 수 있다.
본 발명의 구체적인 일 실시예에서는 형질전환된 대장균 라이브러리를 배양하고 VCSM13 보조 파지(helper phage)로 감염시켜 scFv 클론이 표면제시된 항체파지 라이브러리를 얻었다. 이 라이브러리를 통하여 라이소자임(Hen egg white lysozyme, HEWL) 및 AIMP1(101-192) 항원에 대하여 항원특이적 항체를 선별하는 패닝 실험을 통해 항체파지 라이브러리의 기능성을 검증한 결과, HEWL 항원에 대하여 188개의 클론들을 ELISA로 스크리닝하여 배경신호 대비 3배 이상의 결합신호를 보이는 ELISA 양성 클론들을 150개 확인하였으며 이 중 16개를 서열분석하여 5개의 고유 서열을 발견하였다. 또한, AIMP1(101-192)에 대하여 94개의 클론글을 ELISA로 스크리닝하여 배경신호 대비 3배 이상의 결합신호를 보이는 ELISA양성 클론들을 18개 확인하였으며 이 중 5개를 서열분석하여 2개의 고유 서열을 발견하였다.
본 항체 라이브러리 설계 및 구축기술을 이용하여, 복수의 인간 생식계열 면역글로불린 가변부위 유전자를 골격으로 하는 개선된 라이브러리를 제작할 수 있다.
즉, 본 발명에 기술된 항체 라이브러리가 중쇄, 카파 경쇄, 람다 경쇄당 각 1개씩의 골격 (각각 VH3-23, VK3-A27, VL1g)을 사용하면서 여기에 서로 다른 다양한 생식계열 면역글로불린 유전자로부터 유래하는 CDR에 돌연변이를 도입한 합성 CDR을 삽입한 설계방식을 따라 제조될 수 있을 뿐만 아니라, 개선된 설계를 통하여 복수의 다양한 생식계열 면역글로불린 가변부위의 골격 유전자를 기반으로 하여 여기에 각 해당 골격과 동일한 유전자군의 생식계열 면역글로불린 유전자로부터 유래하는 CDR에 돌연변이를 도입한 합성 CDR을 각각 도입함으로써 골격과 CDR의 연결 조합이 자연 인간유래 항체와 유사하게 제작된 라이브러리를 얻을 수 있다.
또한 항체 라이브러리 제작과정에서 CDR의 길이에 따른 합성 및 증폭효율의 차이로 인하여 짧은 CDR이 선호되는 편향성을 해결하기 위하여, CDR 길이별로 서브 라이브러리를 각각 제작한 후 자연 인간항체에서 발견되는 CDR 길이분포와 유사한 비율로 혼합하여 최종 라이브러리를 제작하는 것이 가능하다.
또 하나의 양태로서, 본 발명은 본 발명의 항체 라이브러리를 제작하는 방법에 의해 제조된 항체 라이브러리로부터 제작된 항체를 제공한다.
본 발명에서 항체, 항체 라이브러리 등은 상기 설명한 바와 같다.
이하 본 발명을 실시예를 통하여 보다 상세하게 설명한다. 그러나 이들 실시예는 본 발명을 예시적으로 설명하기 위한 것으로, 본 발명의 범위가 이들 실시예에 한정되는 것은 아니다.
실시예 1: 항체 라이브러리 구축
본 발명은 합성 인간항체 라이브러리를 구축하고자 하였으며, 특히, 본 발명에서는 25 kDa 크기를 가지는 scFv 단편을 이용한 항체 라이브러리를 구축하였으며, 구체적으로 본 발명의 항체는 면역글로불린의 VH 도메인과 VL 도메인을 15개의 아미노산으로 이루어진 사슬 즉 (Gly-Gly-Gly-Gly-Ser)3 로 연결하여 제작하였다.
합성 라이브러리의 구축을 위해서는 라이브러리 서열의 설계가 선행되어야 함에 따라 본 발명자들은 하기와 같이 서열을 설계하였다.
1-1. 항체 라이브러리 골격 서열 설계
비교적 높은 골격 다양성을 가지는 B세포 유래 항체 라이브러리 혹은 자연항체 라이브러리(natural antibody library)와 달리, 합성 항체라이브러리는 한 개 혹은 제한된 개수의 골격 서열을 기반으로 구축된다. 본 발명에서는 두 개의 항체 골격을 이용하여 항체 라이브러리를 제조하였다.
구체적으로 본 발명의 항체 라이브러리를 이루는 모든 클론들이 인간 면역글로불린의 VH3-23 유전자와 VK3-A27 유전자가 연결부위로 이어진 scFv, 혹은 VH3-23 유전자와 VL1g 유전자가 연결부위로 이어진 scFv를 골격으로 가지며, 이 중 상보성 결정부위에 인공적 다양성을 도입하여 라이브러리를 구축하였다. 이에 사용한 골격 서열은 하기 표 1과 같다.
골격형태 서열
(VH3-23)-linker-(Vk3-A27) 5'-gaagtgcagctgctggaaagtggaggtggactggtgcagcctggcggcagcctgcgcctgagctgtgccgccagcggattcaccttcagcNNNNNNNNNNNNNNNtgggttcgccaagcacctggcaaaggcctggaatgggtgNNNNNNNNNNNNNNNcgctttaccatcagccgcgataacagcaaaaacaccctgtatctgcagatgaacagcctgcgcgccgaggacaccgcagtctactactgtNNNNNNNNNNNNNNNtggggacaaggtactctggtgaccgtgagcagcggtggaggaggtagcggaggtggtggatctggaggtggaggtagtgaaatcgtgctgacccagagccctggcaccctgagcctgagccctggcgaacgcgcaacactgtcatgcNNNNNNNNNNNNNNNtggtatcagcagaaaccaggtcaggctccacgtctgctgatctatNNNNNNNNNNNNNNNggcatccctgatcgcttctcaggatctggaagcggtaccgattttaccctgaccatcagccgcctggaacctgaggactttgccgtgtattattgtNNNNNNNNNNNNNNNttcggtcagggcactaaagtggaaatcaaa-3'(서열번호 50)
N'-EVQLLESGGGLVQPGGSLRLSCAASGFTFSXXXXXWVRQAPGKGLEWVXXXXXRFTISRDNSKNTLYLQMNSLRAEDTAVYYCAKXXXXXWGQGTLVTVSSGGGGSGGGGSGGGGSEIVLTQSPGTLSLSPGERATLSCXXXXXWYQQKPGQAPRLLIYXXXXXGIPDRFSGSGSGTDFTLTISRLEPEDFAVYYCXXXXXFGQGTKVEIK-C'(서열번호 51)
(VH3-23)-linker-(Vl1g) 5'-gaagtgcagctgctggaaagtggaggtggactggtgcagcctggcggcagcctgcgcctgagctgtgccgccagcggattcaccttcagcNNNNNNNNNNNNNNNtgggttcgccaagcacctggcaaaggcctggaatgggtgNNNNNNNNNNNNNNNcgctttaccatcagccgcgataacagcaaaaacaccctgtatctgcagatgaacagcctgcgcgccgaggacaccgcagtctactactgtNNNNNNNNNNNNNNNtggggacaaggtactctggtgaccgtgagcagcggtggaggaggtagcggaggtggtggatctggaggtggaggtagtcagagcgtgctgacccagcctcctagcgcctccggtacaccaggacagcgcgtgactattagctgtNNNNNNNNNNNNNNNtggtaccagcaactgcctggaactgcacctaagctgctgatctatNNNNNNNNNNNNNNNggcgtgcctgatcgctttagcggtagcaaatcaggcaccagcgccagcctggccatcagcggccttcgctccgaagatgaagccgattattattgtNNNNNNNNNNNNNNNtttggtggcggtaccaagctgaccgtgctg-3'(서열번호 52)
N'-EVQLLESGGGLVQPGGSLRLSCAASGFTFSXXXXXWVRQAPGKGLEWVXXXXXRFTISRDNSKNTLYLQMNSLRAEDTAVYYCAKXXXXXWGQGTLVTVSSGGGGSGGGGSGGGGSQSVLTQPPSASGTPGQRVTISCXXXXXWYQQLPGTAPKLLIYXXXXXGVPDRFSGSKSGTSASLAISGLRSEDEADYYCXXXXXFGGGTKLTVL-C'(서열번호 53)
상기 표의 핵산서열에서 N는 임의의 핵산, 아미노산 서열에서 X는 임의의 아미노산을 의미하고 밑줄친 부위가 CDR이고, 볼드체로 표시된 부위가 링커(연결부위)이다.
1-2. 항체 라이브러리 상보성 결정부위( CDR ) 서열 설계
상기의 항체 라이브러리의 골격에 다양한 상보성 결정부위(CDR) 서열을 삽입하여 scFv 항체 라이브러리를 제작하였다. 상보성 결정부위의 다양성은 알려진 인간항체들의 CDR 서열의 특성을 분석하고 시뮬레이션하여 인간항체 CDR과 유사한 서열적 다양성을 가지도록 설계되었다. 그 구체적인 방법은 다음과 같다.
- IMGT 데이터베이스 (http://imgt.org)로부터 8,846개의 인간 면역글로불린 중쇄 가변부위 (VH), 3,110개의 카파 경쇄 가변부위 (Vκ), 2,440개의 람다 경쇄 가변부위 (Vλ) 서열을 다운로드하여 CDR 서열을 추출하였다.
다운로드한 가변부위 서열들은 각 가변부위의 3개의 CDR이 모두 존재하는, 서로 동일하지 않은 서열들이다. CDR을 추출하기 위하여 http://www.bioinf.org.uk/abs/index.html#cdrid 에 있는 규칙을 사용하였다.
- V-base(http://www2.mrc-lmb.cam.ac.uk/vbase/alignments2.php)에 있는 인간항체 생식계열(germline) 면역글로불린 유전자의 CDR 서열들과 상기 IMGT 데이터베이스에서 추출된 숙성(mature) CDR 서열들을 비교 분석하여,
(i) 각 숙성 CDR서열에 가장 가까운 생식계열 CDR 서열을 찾고, 이로부터 각 숙성 CDR에 일어난 돌연변이의 위치, 종류, 빈도를 확인하고 (ii) 각 생식계열 CDR이 숙성 인간항체에서 사용되는 빈도를 확인하였다.
본 발명의 라이브러리 중쇄 CDR 설계에 사용된 생식계열 CDR 서열로써, CDR-H1에 대한 생식계열 CDR 서열은 서열번호 54 내지 84의 아미노산 서열이며, CDR-H2에 대한 생식계열 CDR 서열은 서열번호 85 내지 121의 아미노산 서열을 사용하였다. 한편, CDR-H3의 설계에 있어서는 생식계열 CDR 서열을 사용하지 않고, 그 길이를 아미노산 9개 내지 20개로 하여, 길이별 빈도 및 각 위치에서의 아미노산 사용빈도가 자연인간항체 서열들의 CDR-H3의 길이별 빈도 및 각 위치에서의 아미노산 사용빈도를 모사하도록 하였다.
한편, 본 발명의 라이브러리 경쇄 CDR 설계에 사용된 생식계열 CDR 서열로, 람다 경쇄 또는 카파 경쇄를 가질 수 있으며, 카파 경쇄의 CDR-L1에 대한 생식계열 CDR 서열은 서열번호 122 내지 145의 아미노산 서열이고, 카파 경쇄의 CDR-L2에 대한 생식계열 CDR 서열은 서열번호 146 내지 165의 아미노산 서열이었다. 한편, 카파 경쇄의 CDR-L3에 대한 생식계열 CDR 서열은 서열번호 210 내지 236의 아미노산 서열이다.
한편, 본 발명의 람다 경쇄의 CDR-L1에 대한 생식계열 CDR 서열은 서열번호 166 내지 189의 아미노산 서열이고, 람다 경쇄의 CDR-L2에 대한 생식계열 CDR 서열은 서열번호 190 내지 209의 아미노산 서열이었다. 한편, 람다 경쇄의 CDR-L3에 대한 생식계열 CDR 서열은 서열번호 237 내지 252의 아미노산 서열이다.
- 재조합이 일어나지 않고 체세포 초돌연변이만 일어나는 중쇄 및 경쇄의 CDR1과 CDR2에 대해서 다음과 같은 작업을 수행하였다. 즉 컴퓨터를 이용한 시뮬레이션을 통하여, 인간 생식계열 CDR 서열에 가상의 돌연변이를 도입하여 인간유래 숙성 항체의 CDR과 유사한 서열 및 생식계열 CDR 사용빈도를 가지도록 CDR 서열들을 설계하였다. 각 CDR 별로 1,500개의 시뮬레이션된 서열들이 설계되었다.
- 재조합 및 체세포 초돌연변이가 일어나는 경쇄의 CDR3에 대하여, 카파 경쇄의 경우 첫 7개의 아미노산에 대해서 CDR1 및 CDR2에서와 동일한 작업을 수행하고, 끝의 2개 혹은 3개의 아미노산 서열은 숙성 인간항체의 카파 경쇄 CDR3에서의 아미노산 빈도를 모사하여 총 9개 혹은 10개 아미노산으로 이루어진 1,500개의 서열들을 설계하였다. 람다 경쇄의 경우 첫 7개 혹은 8개의 아미노산에 대하여 CDR1 및 CDR2에서와 동일한 작업을 수행하고, 끝의 2개 혹은 3개의 아미노산 서열은 숙성 인간항체의 람다 경쇄 CDR3에서의 아미노산 빈도를 모사하여 총 9개, 10개, 혹은 11개 아미노산으로 이루어진 1,500개의 서열들을 설계하였다.
-구체적으로, 대표적으로 수행했던 상기 CDR-L3 상보성 결정부위의 C 말단으로부터 2개 내지 3개의 아미노산 서열의 빈도수는 하기 표 2와 같았다.
아미노산 CDR-L3(%)
카파 CDR-L3길이 9 카파 CDR-L3길이 10 람다 CDR-L3길이 9 람다 CDR-L3길이 10 람다 CDR-L3길이 11
8번째 9번째 8번째 9번째 10번째 8번째 9번째 8번째 9번째 10번째 9번째 10번째 11번째
A 0.4 2.5 1.2 0.0 0.4 12.8 0.6 3.7 2.5 1.0 13.2 1.2 0.6
C 0.7 0.0 0.2 1.8 0.0 0.0 0.0 0.0 1.2 0.0 0.0 0.3 0.0
D 0.4 0.1 0.2 0.8 0.0 0.6 0.0 2.9 0.2 0.0 0.8 0.5 0.0
E 0.2 0.0 0.2 0.4 0.0 1.1 0.0 0.2 1.0 0.0 0.5 1.9 0.0
F 7.2 0.0 0.4 10.1 0.0 0.0 0.0 1.2 3.4 0.0 2.9 0.8 0.0
G 1.5 0.3 2.8 1.8 0.2 5.6 0.0 2.9 4.9 0.0 32.9 5.7 0.0
H 2.1 0.1 0.4 1.4 0.2 0.6 0.0 4.7 0.7 0.0 26.5 0.2 0.0
I 6.2 0.2 0.6 9.3 0.4 1.7 6.7 2.7 0.2 6.9 0.2 0.0 2.8
K 0.2 0.0 0.2 0.4 0.0 1.7 0.0 0.7 0.0 0.0 0.1 0.3 0.0
L 22.7 0.3 7.5 14.1 0.2 2.8 3.9 3.2 16.4 3.9 6.8 6.5 5.2
M 0.1 0.1 2.8 0.0 0.2 0.6 0.0 0.0 0.5 0.0 0.0 0.4 0.0
N 1.7 0.1 0.0 1.2 0.2 0.6 0.0 14.7 0.0 0.0 0.3 0.5 0.0
P 7.6 0.3 59.4 0.0 0.0 1.1 0.0 2.2 0.5 0.0 2.5 8.9 0.0
Q 4.9 0.0 2.0 0.0 0.0 6.7 0.0 0.7 1.2 0.0 1.3 1.7 0.0
R 16.2 0.1 14.7 1.6 0.0 4.5 0.0 1.5 7.8 0.0 1.4 7.0 0.0
S 0.8 2.8 4.4 1.2 4.0 0.6 0.0 8.1 0.7 0.0 2.9 2.7 0.0
T 0.4 92.8 2.0 0.6 94.1 1.7 0.0 47.5 0.2 0.0 1.3 0.0 0.0
V 1.1 0.3 0.6 3.8 0.0 42.5 88.8 0.5 25.2 88.2 2.3 29.7 91.4
W 10.9 0.0 0.2 27.5 0.0 9.5 0.0 0.0 22.8 0.0 0.1 18.4 0.0
Y 14.9 0.0 0.0 23.8 0.0 5.6 0.0 2.5 10.3 0.0 4.2 13.1 0.0
이에 따라, CDR-L3의 경우에는 생식계열 CDR 서열을 기반으로 앞쪽 7개(길이 11을 가지는 람다 경쇄 CDR-L3의 경우는 8개) 아미노산 서열을 고른 후, 그 후에 2 또는 3개의 아미노산을 상기 표 2의 빈도수를 기반으로 덧붙였다. 이는 V-J 재조합에 따라 CDR-L3의 C-말단 부위의 서열이 생식계열 서열에서 유래하지 않는 경우가 많고 불확정성이 높기 때문이다.
- 재조합 및 체세포 초돌연변이가 일어나는 중쇄의 CDR3에서는 VDJ 재조합 및 접합부위 유연성(junctional flexibility), P-첨가 (P-addition), N-첨가 (N-addition) 등의 기전에 의하여 생식계열 서열의 확인이 어려운 경우가 많으므로 다른 CDR 같은 분석이 불가하다.
이에 따라 길이별로 9개에서 20개의 아미노산 길이의 CDR-H3 서열을 분석하여, 각 길이의 각 위치에서의 아미노산 사용빈도를 분석하여 시뮬레이션하였다. 다만 마지막 3개의 아미노산 서열은 J 유전자로부터 유래하는 경우가 대부분이므로 각 CDR-H3 길이별로 자주 사용되는 최대 8개의 삼(3)아미노산 서열을 숙성항체에서의 사용빈도를 고려하여 설계하였다.
항원-항체반응에서 CDR-H3의 기여도는 다른 CDR들보다 더 크므로, 다른 CDR보다 많은 수의 CDR-H3 서열을 설계하였다. 한 번의 배열합성에 3,918개의 올리고뉴클레오티드 서열을 합성할 수 있어서, CDR-H3의 길이에 따라 짝수와 홀수로 나누어 각각 3,918개씩 총 7,836개의 서열을 설계하였다. 즉 CDR-H3의 길이가 9,11,13,15,17,19개인 것들을 함께 합성하고, 10,12,14,16,18,20개인 것들을 함께 합성하도록 설계하였다.
상기 서술한, 설계된 CDR들의 가짓수는 중복서열을 고려하지 않은 것으로, 실제 동일한 서열들이 중복되는 것을 제외하면 실제 고유 CDR은 하기 표 3와 같이 측정되었다.
scFv 라이브러리
CDR H1 H2 H3 K1 K2 K3 L1 L2 L3
전체 1,500 1,500 1,500 1,500 1,500 1,500 1,500 1,500 1,500
고유 502 1,300 7,526 657 202 920 678 279 1,015
상기 CDR 부위의 설계에 대한 개념설명이 도 1에 제시되어 있다.
- 중쇄, 카파 경쇄, 람다 경쇄에 각각 3개씩의 CDR이 있으며, 총합 9개의 CDR이 있다. 이 중에 중쇄의 첫 번째 CDR (CDR-H1)과 카파 및 람다 경쇄의 두 번째 CDR (CDR-L2)를 제외한 나머지 CDR들은 인간유래 항체에서의 길이의 다양성이 크기 때문에, 다양한 길이를 가지도록 설계되었다. 구체적으로 중쇄의 CDR-H2는 16개 혹은 17개의 아미노산, 카파 경쇄의 CDR-L1은 11,12,16개의 아미노산, 람다 경쇄의 CDR-L1은 11,13,14개의 아미노산, 카파 경쇄의 CDR-L3은 9,10개의 아미노산, 람다 경쇄의 CDR-L3은 9,10,11개의 아미노산, 중쇄의 CDR-H3은 9개에서 20개의 아미노산을 가질 수 있도록 설계하였으며, 각 길이를 가지는 CDR 수의 비율은 인간유래항체에서의 각 길이의 비율을 따랐다.
1-3. 항체 라이브러리 상보성 결정부위( CDR ) 서열 배제 서열
CDR 서열의 설계시, 다음의 번역후 변형(post translational modification) 서열을 포함하는 것들을 배제하였다. 단백질의 번역후 변형은 단백질의 기능 및 물성에 영향을 줄 수 있으므로 항체 라이브러리의 설계시 가능한 한 배제하는 것이 유리하다.
- N-당화 (N-glycosylation) 서열, 즉 Asp-Xaa-Ser/Thr (Asp: 아스파라긴산, Xaa: 시스테인을 제외한 임의의 19종의 아미노산, Ser/Thr: 세린 혹은 트레오닌) 서열을 배제하였다.
- 이성질체화 (isomerization) 서열을 제외하였다. 단백질 내의 아스파라긴산은 수용액 상태에서 자발적으로 느리게 이소아스파라긴산(isoaspartic acid)으로 이성질체화할 수 있음이 알려져 있으며, 이 반응의 속도는 특히 아스파라긴산의 C-말단에 위치하는 아미노산 잔기에 의해 영향을 받는다. 이 잔기가 글리신일 경우 특히 이성질체화 속도가 빨라짐이 알려져 있으므로, 아스파라긴산-글리신 서열을 가지는 CDR 서열들을 배제하였다.
- 탈아미드화 (deamidation) 서열을 제외하였다. 단백질 내의 아스파라긴은 수용액 상태에서 자발적으로 느리게 아스파라긴산으로 탈아미드화할 수 있음이 알려져 있으며, 이 반응의 속도는 특히 아스파라긴의 C-말단에 위치하는 아미노산 잔기에 의해 영향을 받는다. 이 잔기가 글리신일 경우 특히 탈아미드화 속도가 빨라짐이 알려져 있으므로, 아스파라긴-글리신 서열을 가지는 CDR 서열들을 배제하였다.
- 절단(cleavage) 서열을 제외하였다. 단백질을 이루는 펩타이드 결합은 수용액 상태에서 서서히 절단되며, 특히 아스파라긴산-프롤린 서열에서 이러한 절단이 더 빠르게 일어나므로 아스파라긴산-프롤린 서열을 가지는 CDR 서열들을 배제하였다.
- 산화(oxidation) 서열을 제외하였다. 단백질을 이루는 아미노산 20종 중 여러 개가 산화적 변형을 일으킬 수 있음이 알려져 있으며, 특히 이 중에서 황을 포함하는 시스테인과 메티오닌이 상대적으로 쉽게 산화된다. 따라서 기본적으로 시스테인과 메티오닌이 포함된 CDR 서열들을 배제하되, 생식계열 유전자의 CDR 내에 이미 우세하게 존재하는 메티오닌의 경우는 배제하지 않았다. 구체적으로 중쇄의 CDR-H1의 34번 잔기나 CDR-H3의 100번 잔기가 이에 해당한다.
- 설계된 CDR의 아미노산 서열은 뉴클레오티드 서열로 역번역하였으며 CDR 서열의 양 옆에 항체 가변부위의 프레임워크 서열을 더하여 100개의 뉴클레오티드로 이루어진 올리고뉴클레오티드 서열들을 최종설계하였다. 총 19,836개의 서열을 설계하고, 이를 배열 합성(array synthesis)법을 통하여 올리고뉴클레오티드 혼합물의 형태로 합성하였다 (미국 텍사스주 휴스턴 소재 LC Sciences사).
합성된 올리고뉴클레오티드 혼합물에서 각 CDR들을 중합효소 연쇄반응(PCR)을 통해 증폭하였으며, 이 때 사용된 프라이머 조합을 하기 표 4에 개시하였다. PCR 조건은 다음과 같다: 섭씨 94도, 2분; (섭씨 94도, 30초/섭씨 56도, 30초/섭씨 72도, 30초) 25회 반복; 섭씨 72도, 7분. PCR 반응의 주형으로 1.6 나노그램의 올리고뉴클레오티드 혼합물이 사용되었으며, 프라이머는 각각 600 nM 농도이고 dNTP는 0.8 mM, 중합효소는 Taq (2.5 유닛), 반응 부피는 100마이크로리터이다. 반응 완료후 2% 아가로즈 젤에서 전기영동으로 분리한 후 약 100 염기쌍 (base pair, bp) 크기에 해당하는 DNA 밴드로부터 DNA를 추출, 정제한다.
CDR 프라이머 서열 (5' -> 3')
CDR-H1 OPALS-h1-f(서열번호 1) CAGCGGATTCACCTTCAGC
OPALS-h1-b(서열번호 2) AGGTGCTTGGCGAACCCA
CDR-H2 OPALS-h2-f(서열번호 3) GGCCTGGAATGGGTGAGC
OPALS-h2-b(서열번호 4) GCGGCTGATGGTAAAGCG
CDR-H3-odd/even OPALS-h3-f(서열번호 5) GGACACCGCAGTCTACTACT
OPALS-h3-b(서열번호 6) CACCAGAGTACCTTGTCCC
CDR-L1 카파 OPALS-k1-f(서열번호 7) CGCGCAACACTGTCATGC
OPALS-k1-b(서열번호 8) TGGAGCCTGACCTGGTTTC
CDR-L2 카파 OPALS-k2-f(서열번호 9) CCAGGTCAGGCTCCACGT
OPALS-k2-b(서열번호 10) ACCGCTTCCAGATCCTGAG
CDR-L3 카파 OPALS-k3-f(서열번호 11) CTGGAACCTGAGGACTTTG
OPALS-k3-b(서열번호 12) ACTTTAGTGCCCTGACCG
CDR-L1 람다 OPALS-l1-f(서열번호 13) GCGCGTGACTATTAGCTGT
OPALS-l1-b(서열번호 14) AGGTGCAGTTCCAGGCAGT
CDR-L2 람다 OPALS-l2-f(서열번호 15) GCCTGGAACTGCACCTAAG
OPALS-l2-b(서열번호 16) GCCTGATTTGCTACCGCTA
CDR-L3 람다 OPALS-l3-f(서열번호 17) CTTCGCTCCGAAGATGAAG
OPALS-l3-b(서열번호 18) GTCAGCTTGGTACCGCCA
항체 라이브러리 제작의 골격으로 사용하기 위하여 코돈 최적화된 scFv 유전자들을 합성하였으며 (미국 뉴저지 주 피스카타웨이 시 소재 Genscript 사), 이 유전자들은 생식계열 유전자인 VH3-23와 VK3-A27, 또는 VH3-23과 VL1g가 (Gly-Gly-Gly-Gly-Ser)3의 연결부위로 연결된 scFv 유전자들로 pUC57 벡터에 클로닝되어있으며 파지미드 벡터로의 클로닝을 위해 pComb3X 벡터와 호환되는 두 개의 SfiI 제한효소 부위가 포함된다. 라이브러리 제작의 편의를 위하여, pUC57 벡터에 클로닝된 이 유전자들을 pComb3X 벡터로도 클로닝하여 PCR의 주형으로 사용하였다. 골격으로 사용하기 위한 용도이므로 이 유전자들은 서열적 다양성이 없는 단일서열들이며, 포유동물세포에서 발현이 향상되도록 코돈이 최적화되었으나 PCR 과정에서의 비특이적 어닐링(annealing)을 방지하기 위하여 아미노산 서열에 변화가 없는 범위에서 일부 최적화 DNA서열에 변화를 가하였다. 이들(cFv VH3-23_linker_VK3-A27, scFv VH3-23_linker_VL1g)의 서열은 각각 서열번호 19 및 서열번호 20에 개시하였다.
1-4. CDR 라이브러리 제작
코돈 최적화된 scFv 골격의 다양한 절편들을 PCR을 통하여 증폭하고, 이를 역시 PCR 증폭된 CDR 부위 DNA와 중첩연장(overlap extension) PCR을 통하여 연결함으로써 하나의 CDR에만 다양성을 가지는 단일 CDR 라이브러리들을 제작하였다.
PCR 조건은 위와 동일하며, 다만 섭씨 72 ℃에서의 연장 시간은 예측되는 DNA 절편 결과물의 길이에 따라 30초, 1분, 혹은 1분 30초로 조정하였다. 구체적으로 예측되는 길이가 500 염기쌍 이하인 경우는 30초, 500에서 1,000 염기쌍 사이인 경우는 1분, 1,000에서 1,500 염기쌍 사이인 경우에는 1분 30초의 연장 시간을 사용하였다. 이 과정들 및 이에 사용된 프라이머 서열들을 하기 표 5 및 표 6에 정리하였다.
산출물명 DNA 주형 프라이머
단일 CDR 라이브러리 제작을 위한 골격부위 PCR
1 VH3-23/VL1g-pUC57 pUC57-b OPALS-H1-rc-b
2 VH3-23/VL1g-pUC57 pUC57-b OPALS-H2-rc-b
3 VH3-23/VL1g-pUC57 pUC57-b OPALS-H3-rc-b
4 VH3-23/VL1g-pUC57 pUC57-b OPALS-L1-rc-b
5 VH3-23/VL1g-pUC57 pUC57-b OPALS-L2-rc-b
6 VH3-23/VL1g-pUC57 pUC57-b OPALS-L3-rc-b
7 VH3-23/VL1g-pComb3X OPALS-H1-rc-f pC3X-b
8 VH3-23/VL1g-pComb3X OPALS-H2-rc-f pC3X-b
9 VH3-23/VL1g-pComb3X OPALS-H3-rc-f pC3X-b
10 VH3-23/VL1g-pComb3X OPALS-L1-rc-f pC3X-b
11 VH3-23/VL1g-pComb3X OPALS-L2-rc-f pC3X-b
12 VH3-23/VL1g-pComb3X OPALS-L3-rc-f pC3X-b
13 VH3-23/VK3-A27-pComb3X OPALS-K1-rc-f pC3X-b
14 VH3-23/VK3-A27-pComb3X OPALS-K2-rc-f pC3X-b
15 VH3-23/VK3-A27-pComb3X OPALS-K3-rc-f pC3X-b
26 VH3-23/VK3-A27-pUC57 pUC57-b OPALS-K1-rc-b
27 VH3-23/VK3-A27-pUC57 pUC57-b OPALS-K2-rc-b
28 VH3-23/VK3-A27-pUC57 pUC57-b OPALS-K3-rc-b
단일 CDR 라이브러리 제작
H1 1 + CDR-H1 + 7 pC3x-b pUC57-b
H2 2 + CDR-H2 + 8
Odd 3 + CDR-H3-odd + 9
Even 3 + CDR-H3-even + 9
λ1 4 + CDR-L1-람다 + 10
λ2 5 + CDR-L2-람다 + 11
λ3 6 + CDR-L3-람다 + 12
κ1 26 + CDR-L1-카파 + 13
κ2 27 + CDR-L2-카파 + 14
κ3 28 + CDR-L3-카파 + 15
프라이머 서열(5'->3')
OPALS-H1-rc-f (서열번호 21) TGGGTTCGCCAAGCACCT
OPALS-H2-rc-f (서열번호 22) CGCTTTACCATCAGCCGC
OPALS-H3-rc-f (서열번호 23) GGGACAAGGTACTCTGGTG
OPALS-L1-rc-f (서열번호 24) ACTGCCTGGAACTGCACCT
OPALS-L2-rc-f (서열번호 25) TAGCGGTAGCAAATCAGGC
OPALS-L3-rc-f (서열번호 26) TGGCGGTACCAAGCTGAC
OPALS-K1-rc-f (서열번호 27) GAAACCAGGTCAGGCTCCA
OPALS-K2-rc-f (서열번호 28) CTCAGGATCTGGAAGCGGT
OPALS-K3-rc-f (서열번호 29) CGGTCAGGGCACTAAAGT
OPALS-H1-rc-b (서열번호 30) GCTGAAGGTGAATCCGCTG
OPALS-H2-rc-b (서열번호 31) GCTCACCCATTCCAGGCC
OPALS-H3-rc-b (서열번호 32) AGTAGTAGACTGCGGTGTCC
OPALS-L1-rc-b (서열번호 33) ACAGCTAATAGTCACGCGC
OPALS-L2-rc-b (서열번호 34) CTTAGGTGCAGTTCCAGGC
OPALS-L3-rc-b (서열번호 35) CTTCATCTTCGGAGCGAAG
OPALS-K1-rc-b (서열번호 36) GCATGACAGTGTTGCGCG
OPALS-K2-rc-b (서열번호 37) ACGTGGAGCCTGACCTGG
OPALS-K3-rc-b (서열번호 38) CAAAGTCCTCAGGTTCCAG
pC3x-b (서열번호 39) AACCATCGATAGCAGCACCG
pUC57-b (서열번호 40) TTCGCCATTCAGGCTGCG
제작된 단일 CDR 라이브러리는 1% 아가로즈 젤 전기영동을 통해 분리 정제하였고, 이를 SfiI 제한효소로 섭씨 50 ℃에서 12시간 이상 처리하여 절단한 후, 역시 SfiI 제한효소로 같은 방식으로 절단한 pComb3X 파지미드 벡터와 라이게이션 하였다. 1 ㎍의 벡터와 1 ㎍의 scFv DNA를 T4 라이게이즈 1,000 유닛이 첨가된 50 ㎕의 T4 라이게이즈 완충용액에서 16시간 상온 반응하였다. 반응물에는 5 ㎕의 3M 아세트산 소듐 (pH 5.2)과 110 ㎕의 에탄올을 첨가하여 섭씨 영하 20 ℃에서 1시간 이상 DNA를 침전시키고, 침전된 DNA를 원심분리하여 차가운 70% 에탄올로 세척하고 20 ㎕의 멸균순수에 용해하였다. 이것을 ER2537 대장균에 전기천공법으로 트랜스폼하고 암피실린 항생제를 함유하는 배지에서 12 내지 16시간 배양하여 단일 CDR 라이브러리를 획득하였다.
단일 CDR 라이브러리를 제작한 목적은 합성된 CDR 올리고뉴클레오티드 내에 존재하는 뉴클레오티드의 삽입/결손/치환 등으로 일어나는 부정확하고 번역 조기종결(premature translational termination)을 일으키는 CDR 서열들을 제거하기 위해서이다. 단일 CDR 라이브러리가 형질전환된 대장균을 배양하고, 대수기(log phase)일 때 보조 파지와 카나마이신을 차례로 첨가 후 밤새 배양하여 파지 라이브러리를 얻었다. 이를 면역시험관(immunotube) 표면에 흡착된 항-HA 항체에 대하여 1회 패닝하여 HA-태그를 발현하는 파지 클론만을 선별하였다. HA-태그는 9개의 아미노산(YPYDVPDYA)으로 이루어진 짧은 펩타이드 서열로 pComb3X 파지미드 벡터의 SfiI 클로닝 위치의 3' 말단에 위치하며, 따라서 발현된 scFv 단백질의 C-말단에 존재하게 된다. 올리고뉴클레오티드의 화학적 합성법의 단계적 효율성은 완벽하지 않으므로, 합성된 CDR 올리고뉴클레오티드 중에는 번역 조기종결을 일으키는 삽입/결손/치환이 생긴 서열들이 다수 존재하게 되고, 이들을 포함하는 파지 클론들은 HA-태그를 가질 수 없으므로 패닝에 의해 제거된다. 결과적으로 이 과정을 통해 결함이 없는 CDR 서열들을 선별할 수 있다.
1-5. scFv 항체 라이브러리 제작
선별된 CDR 서열들은 전술한 조건에 따라 PCR을 통해 증폭되었고, 증폭된 DNA 단편들은 다시 중첩 연장 PCR을 통해 경쇄와 중쇄 가변부위로 조합되었다. 경쇄 가변부위에 연결부위를 중첩연장 PCR로 연결하고, 이를 다시 중쇄 가변부위와 중첩연장 PCR로 조합하여 최종적으로 scFv 유전자 라이브러리를 획득하였다. 본 최종 CDR 라이브러리를 제작하기 위한 PCR 과정을 도 2에 도식화하였다(도 2). 이 과정들 및 이에 사용된 프라이머 서열들을 하기 표 7 및 표 8에 정리하였다.
산출물명 주형 프라이머
선택된 CDR과 연결부위의 증폭
VH-CDR1 H1 pC3x-f OPALS-H2-rc-b
VH-CDR2 H2 OPALS-H1-rc-f OPALS-H3-rc-b
VH-CDR3-odd Odd OPALS-H2-rc-f OPALS-FR4-b
VH-CDR3-even Even
VL-CDRλ1 λ1 OPALS-L1-f OPALS-L2-rc-b
VL-CDRλ2 λ2 OPALS-L1-rc-f lFR3-b
VL-CDRλ3 λ3 lFR3-f pC3x-b
Linker-λ OPALS-lambda OPALS-FR4-f OPALS-L1-rc-b
VL-CDRκ1 κ1 kFR1-f OPALS-K2-rc-b
VL-CDRκ2 κ2 OPALS-K1-rc-f OPALS-K3-rc-b
VL-CDRκ3 κ3 OPALS-K2-rc-f pC3x-b
Linker-κ OPALS-kappa OPALS-FR4-f kFR1-b
경쇄 및 중쇄 가변부위의 증폭
VH-Odd VH-(CDR1+CDR2+CDR3-odd) pC3x-f OPALS-FR4-b
VH-Even VH-(CDR1+CDR2+CDR3-even)
VL-Lambda VL-(CDRλ1+λ2+λ3) OPALS-L1-f pC3x-b
VL-Kappa VL-(CDRκ1+κ2+κ3) OPALS-K1-f
경쇄 가변부위와 연결부위의 연결
λ VL-Lambda+linker-λ OPALS-FR4-f pC3x-b
κ VL-Kappa+linker-κ
ScFv 라이브러리 제작을 위한 최종 PCR
VH-Odd+λ pC3-seq dp-seq
VH-Even+λ
VH-Odd+κ
VH-Even+κ
프라이머 서열(5'->3')
pC3x-f (서열번호 41) GCACGACAGGTTTCCCGAC
lFR3-f (서열번호 42) CTGGCCATCAGCGGCCTTC
lFR3-b (서열번호 43) CTGGGTCAGCACGATTTC
kFR1-f (서열번호 44) GAAATCGTGCTGACCCAG
kFR1-b (서열번호 45) CTGGGTCAGCACGATTTC
OPALS-FR4-f (서열번호 46) CTGGTGACCGTGAGCAGC
OPALS-FR4-b (서열번호 47) GCTGCTCACGGTCACCAG
pC3-seq (서열번호 48) GTGAGCGGATAACAATTGA
dp-seq (서열번호 49) AGAAGCGTAGTCCGGAACG
scFv 유전자 라이브러리는 전술한 방법대로 SfiI 제한효소로 절단하고 pComb3X 벡터에 라이게이션한 후 ER2537 대장균에 트랜스폼하여 scFv 라이브러리를 완성하였다. 구체적으로 CDR-H3의 아미노산 개수(길이)가 짝수인 것과 홀수인 것을 따로 제작하고, 카파 경쇄와 람다 경쇄를 따로 제작하여 이들을 PCR 조합하여 라이게이션-트랜스폼하였으므로 총 4개의 서브 라이브러리가 만들어졌다. 이를 각각 OL (odd-lambda), EL (even-lambda), OK (odd-kappa), EK (even-kappa) 라이브러리로 칭하였으며, 각각의 라이브러리로 형질전환된 박테리아 역가(titer), 즉 라이브러리의 크기가 1.3x108, 1.4x108, 1.9x108, 3.7x108 로 총합 8.3x108 크기인 1차 라이브러리, 총합 1010에 이르른 2차 라이브러리를 제작하였다. 제작된 OL 라이브러리, EL 라이브러리의 서열비교를 도 5a에 표시하였으며, OK 라이브러리, EK 라이브러리의 서열비교를 도 5b에 표시하였다.
각 서브 라이브러리로부터 24개씩의 클론을 임의로 선택하여 그 박테리아를 배양하고, IPTG로 scFv 항체의 발현을 유도한 후 섭씨 30 ℃에서 밤새 배양하였다. 이로부터 수크로즈 완충용액을 이용한 삼투 충격법(osmotic shock)으로 페리플라즘 추출물(periplasmic extract)를 얻은 후 이것을 1 ㎕씩 니트로셀룰로즈 박막에 가하였다. 박막을 건조시킨 후 3% 탈지분유 완충용액에 담가 블로킹하고, 항 HA 항체-HRP(horseradish peroxidase)를 1시간 동안 결합시킨 후 세척하였다. 루미놀을 이용하여 HA-태그의 존재여부를 검출함으로써 scFv의 발현을 확인하였다 (도 3).
본 실시예 1의 항체 라이브러리 제조 단계를 도식화한 결과는 도 4에 정리하였다.
실시예 2: 서열 분석
제조된 라이브러리에 반영된 CDR 설계의 정확도를 측정하기 위해, 상기 라이브러리의 차세대 서열분석(Next generation sequencing, NGS)을 수행하였다. 수백만 개의 CDR 서열을 분석하고 설계 서열과 비교하였다(표 9).
CDR 라이브러리의 차세대 서열분석
CDR H1 H2 H3 K1 K2 K3 L1 L2 L3
제조된 서열 수(x 106) 4.75 4.70 4.53 2.58 2.31 2.52 2.14 2.12 2.09
인프레임 % 91.3 89.7 90.3 92.2 91.6 93.2 91.5 78.7 90.7
설계 길이 % 89.4 88.4 85.6 87.1 82.3 90.7 84.6 56.2 89.4
설계 서열 % 80.9 52.0 51.8 62.4 70.3 74.3 56.2 47.6 67.2
proofreading 전인프레임% 85.7 50.0 67.9 53.3 44.4 66.7 38.5 31.3 66.7
설계 커버리지 % 100 100 97.3 99.8 100 99.9 100 100 100
비록 긴 CDR에 대해서는 고유 서열의 대부분이 전체 설계서열 중 오직 한번 또는 두번만 반복되도록 설계되어 정량 계수(r2)가 상대적으로 낮으나, 제조된 라이브러리에는 설계된 서열의 거의 전부가 커버된 것을 확인하였으며, 각 설계된 CDR 서열의 발생 빈도 또한 실제 라이브러리에 나타났다(도 6). 당연하게도, 해당 라이브러리는 제조 오류에 따라 어느 설계 서열과도 매칭되지 않은 저-빈도 CDR 서열을 많이 포함하고 있는 것으로 확인되었다. 이 중에는 핵산 첨가 또는 결실 등에 의해서 프레임 시프트가 일어난 비-기능(non-functional) 서열이 포함되어 있었다. 항-HA 항체를 이용한 단일-CDR 라이브러리의 proofreading 패닝을 통해서 비-기능 CDR 서열을 제거하였으며, proofreading 패닝 전에 활성 인프레임 CDR 서열의 비율은 31 내지 86 %인데 비하여, proofreading 패닝 이후에는 대략 90에서 93% 정도임을 확인하였다. 다만, CDR-L2만 약 79%에 불과했으나 이는 중첩 PCR의 부정확한 어닐링 때문이었던 것으로 사료된다. 설계된 길이에 비교한 CDR 서열의 비율은 약 82 내지 91 %(CDR-L2는 약 56%)였다.
종합적으로, VH, Vκ, 및 Vλ 서열의 약 75%는 종결 코돈없는 다양한 기능 도메인들이었고, 라이브러리에서 기능성 scFv 클론은 약 55%에 이르는 것으로 추정되었다. 이러한 추정은 무작위적으로 선택한 라이브러리 클론에 대한 닷-블랏 어세이 결과와 일치하였다. 닷-블랏을 위하여 셀렉션되지 않은 라이브러리로부터 무작위적으로 선택된 scFv 클론의 페리플라즘 추출물을 니트로셀룰로즈 막에 블랏팅을 하였고, 및 추출물 상의 수용성 발현 scFv의 존재를 C 말단의 HA 태그를 측정하여 확인하였다. 그 결과 수용성 발현 scFv 클론은 대략 60% 가량되었다(도 3).
NGS 데이터로부터 다양한 도메인 중에서 고유한 도메인이 분석되었다. 종결 코돈을 포함하지 않는 각 heavy, 카파 및 람다의 다양한 도메인 서열 약 1.3 x 106개를 분석하였으며, VH의 98%, Vκ의 89% 및 Vλ의 98%이 반복되지 않았다(도 7).
전체 서열 중에서 상이한 다양한 도메인 서열의 수의 %는 VH, Vκ, 및 Vλ 각각이 99%, 92% 및 99%였다. 한편, 이러한 수치를 기 보고된 다른 항체 라이브러리들의 CDR-H3에서의 고유도(uniqueness)인 97 내지 98%에 비교하였을 때, 셀렉션되지 않은 라이브러리 내의 scFv 클론 중에서 중복도는 그다지 심각하지 않음을 시사한다.
제조된 라이브러리에서 CDR 길이의 분포, 특히 CDR-H3 길이의 분포는 설계와 상이하였고, 긴 CDR에 비교해서 짧은 길이의 CDR이 현저히 높은 빈도로 나타났다(도 8). 이는 일부분 올리고뉴클레오티드 어레이 제조 과정에서 프레임 시프트가 일어나거나 조기 스탑 코돈이 도입되는 등의 부정확함 때문인 것으로 사료된다. 이러한 오류는 긴 CDR을 제조하는 동안에 더 자주 발생하고 그들 중 대부분은 항-HA-태그 항체를 이용한 단일 CDR 라이브러리 proofreading 패닝 동안에 제거되기 때문에, 라이브러리에서 긴 CDR이 더 많이 제거되는 원인일 것으로 사료된다. 또한, 짧은 CDR을 가진 scFv가 항-HA-태그 항체에 대한 패닝에 의해서 우선적으로 선별 및 증폭되었을 가능성도 있다.
라이브러리 CDR 서열과 자연 CDR 서열간의 유사도를 가장 가까운 생식 CDR 서열로부터 각 CDR 서열의 아미노산 변이 수를 분석하여 측정하였다. CDR을 자연 체세포 초돌연변이(SHM) 패턴을 시뮬레이션하여 설계되었기 때문에, 설계 서열은 자연 유사도가 매우 높을 것이 예상되었다. 이에 따라, 설계 CDR 서열과 자연 CDR 서열 간에 CDR 서열 당 평균 변이 횟수를 비교하였다(표 10).
CDR 서열의 유사 인간 생식 CDR 서열로부터 평균 아미노산 변이수
CDR H1 H2 K1 K2 K3 L1 L2 L3
길이 5 16 17 11 12 16 7 9 10 11 13 14 7 9 10 11
설계 0.75 2.14 2.55 1.0 1.18 1.85 0.47 0.73 0.65 1.03 1.10 0.98 0.61 0.83 1.18 0.70
비-설계 1.84 4.30 3.67 2.77 3.44 3.82 2.01 1.55 1.45 2.82 3.22 2.75 1.85 1.67 2.11 1.45
자연 0.82 2.09 2.37 1.08 1.29 0.93 0.49 0.72 0.54 0.95 1.10 1.00 0.66 0.88 1.14 0.75
제조 오류에 의하여 설계 서열 중 어느 것과도 매치되지 않는 라이브러리 CDR(비-설계 CDR) 서열을 분석할 때, 가장 유사한 생식계열 CDR 서열로부터의 평균 아미노산 변이 수는 설계 CDR 서열의 평균 아미노산 변이 수에 비해서 평균 1 내지 2 아미노산만 차이났다. 이러한 결과는 라이브러리의 CDR 서열이 인간 생식 CDR 서열로부터 오직 적은 수의 변이만을 포함하고 있으며, 자연 인간 항체의 CDR 서열과 매우 유사함을 시사한다. CDR-H3에 대해, 각 위치의 아미노산 분포를 분석하였다 (도 9). 자연 인간 항체, 시뮬레이션된 레파토리 및 제조 라이브러리의 CDR-H3 사이에서 아미노산 분포 패턴이 유사함이 확인되었으며, 이는 라이브러리 CDR의 높은 자연-유사도를 보여주고 있다.
예측한 대로, 상기 CDR에서 바람직하지 않은 번역-후 수식(Post-translation modification, PTM) 모티프의 발생 빈도가 자연 인간 항체 CDR보다 현저히 낮았다. 다만, 각각 5개 및 7개의 아미노산으로 이루어져 짧고 자연 인간 항체에서 상대적으로 적은 PTM 모티프를 가지고 있는 CDR-H1 및 CDR-L2는 예외였다 (표 11).
라이브러리 및 자연 인간 항체의 CDR에서 번역-후 수식 비율
모티프 CDR H1 H2 H3 K1 K2 K3 L1 L2 L3
Asp-Gly 라이브러리 0.05 0.31 0.66 0.03 0.34 0.10 0.32 3.41 0.34
자연 0.08 10.79 6.45 6.03 0.32 0.09 0.28 0.30 1.98
Asn-Gly 라이브러리 0.04 0.62 0.32 0.05 0.63 0.12 0.60 4.51 0.32
자연 0.02 5.96 3.03 4.54 0.53 0.50 0.06 0.12 7.61
Asp-Pro 라이브러리 0.01 0.16 0.25 0.04 0.08 0.10 0.04 0.20 0.05
자연 0.00 2.40 10.13 0.00 0.04 0.14 0.11 0.00 0.66
N-glyc 라이브러리 0.66 1.91 2.77 1.35 1.46 1.00 1.97 0.94 1.30
자연 0.59 0.78 7.73 0.61 0.07 1.69 6.74 0.30 8.20
Met 라이브러리 0.35 1.03 1.80 0.90 0.55 0.29 1.78 0.70 1.70
자연 0.06 2.72 9.04 0.88 0.11 12.36 0.39 0.18 0.86
Cys 라이브러리 0.30 1.96 0.49 1.30 0.64 0.77 2.10 0.87 1.29
자연 0.35 17.50 1.46 0.92 0.18 1.19 0.61 0.24 1.98
총 PTM 라이브러리 1.36 5.44 5.87 3.60 3.58 2.32 6.16 10.48 4.81
자연 1.09 36.70 32.92 12.55 1.23 15.56 8.08 1.13 20.70
상이한 CDR에서 PTM 모티프는 독립적으로 발생하는 것으로 가정했을 때, 라이브러리의 scFv 서열에서 최소한 하나의 PTM 모티프 발생 확률이 대략 20 내지 30 %이고 70 내지 80%의 클론은 PTM 모티프 없는 것으로 추정된다. 이에 반해, 자연 유래의 경우에는 PTM 모티프를 가지지 않은 scFv의 비율이 24 내지 27 %에 불과하다.
실시예 3: 항원을 이용한 라이브러리 패닝 및 스크리닝
제조된 라이브러리는 이의 기능성을 확인하기 위하여, 4가지 항원에 대해서 패닝을 수행하였다. 플라스틱 표면에 고정된 항원에 대한 패닝을 4번 반복한 후 다수의 타겟-결합 scFv 클론들을 분리하였다. 3번째 또는 4번째 패닝으로부터 분리된 콜로니들을 ELISA를 통해 스크리닝하고, 양성 신호를 보이는 클론 중 일부를 서열분석하였다(표 12).
항원에 대한 라이브러리의 패닝 및 스크리닝
항원 패닝 횟수 ELISA 양성 수/스크리닝 수 고유 서열/전체 분석 서열 Kappa/lambda
AIMP1 3 10/94 6/6 1/5
SerRS 4 16/94 3/14 0/14
hEpCAM-ECD 4 18/94 3/15 3/12
HER3-ECD 4 46/188 6/16 8/8
HEW Lysozyme 4 151/188 6/13 1/12
테스트된 항원의 숫자와 서열분석된 클론의 수가 경쇄 클래스 선호성을 일반화하기에는 충분하지 않았으나, 분리된 클론의 대부분은 람다 경쇄 클래스(lambda light chain class)였다. 파지 항체 라이브러리로부터 특정 경쇄 패밀리/클래스를 가지는 클론에 대한 우선 셀렉션(preferential selection)이 기존에 알려졌으며, 특정 VH-VL 도메인의 선호 우선 쌍(preferential pairing)과 서브-라이브러리의 기능 길이상 차이에 기여하였다. 커다란 자연 scFv 라이브러리의 항원-유래 파지 표시 셀렉션 이후에 람다 경쇄 강한 선호성도 알려졌으며, 이는 람다 쇄 선호성이 특정 항체 라이브러리의 특징이라기 보다 scFv 라이브러리의 파지 표시 셀렉션의 보편적인 현상임을 시사한다.
라이브러리로부터 분리된 ELISA-양성 scFv 클론 중 일부의 결합 에너지를 SPR을 이용하여 분석하였다 (표 13).
SPR에 의해 측정된 셀렉션된 목적-특이적 scFv 클론의 결합 동력학 상수
항원-클론 Kon(M-1s-1) Koff(s-1) KD(M)
HER3-G3 6.8 x 105 2.8 x 10-3 4.2 x 10-9
HER3-C5 1.2 x 105 1.0 x 10-3 8.1 x 10-9
HER3-D11 7.8 x 104 5.3 x 10-3 6.8 x 10-8
HEWL-B6 1.1 x 105 5.3 x 10-3 4.8 x 10-8
HEWL-F8 5.8 x 104 1.9 x 10-3 3.3 x 10-8
HEWL-B2 1.1 x 106 3.0 x 10-3 2.8 x 10-9
HEWL-G7 1.4 x 105 3.2 x 10-3 2.4 x 10-8
SRS-A3 2.7 x 104 1.8 x 10-3 6.7 x 10-8
SRS-C4 9.5 x 104 1.3 x 10-3 1.4 x 10-8
SRS-D8 6.5 x 104 1.4 x 10-3 2.2 x 10-8
3개의 상이한 항원에 대한 10개의 scFv들에 대한 해리 상수 (Kd)가 10-9 내지 10-7 M 범위로 측정되었다.
셀렉션되지 않은 라이브러리의 NGS 결과를 패닝 이후에 라이브러리로부터 선택된 고유 scFv의 서열과 비교하였다. 패닝 과정이 설계된 CDR 서열의 비율 또는 CDR 잔기당 평균 변이 횟수를 현저히 바꿔주는 것은 아닌 것으로 나타났다 (표 14).
패닝 셀렉션 전후의 CDR 및 FR(framework region, 골격부위)의 변이
CDR 또는 FR H1 H2 H3 K1 K2 K3 L1 L2 L3 VHFR VκFR VλFR
셀렉션 전 서열 중 설계된 서열의 비율(%) 80.9 52.0 51.8 62.4 70.3 74.3 56.2 47.6 67.2
셀렉션 후 서열 중 설계된 서열의 비율(%) 92.0 48.3 64.5 57.1 60.0 83.3 60.0 60.0 60.0
잔기당 평균변이수 셀렉션 전 0.21 0.18 N/A 0.13 0.11 0.06 0.11 0.12 0.13 0.0067 0.0144 0.0187
잔기당 평균변이수,셀렉션 후 0.17 0.17 N/A 0.14 0.10 0.09 0.14 0.11 0.10 0.0018 0.0019 0.0046
올리고뉴클레오티드 합성 또는 PCR 과정에서의 오류에 의한 추가적인 CDR 다양성은 라이브러리의 다양성에 큰 영향을 주지 않음을 확인할 수 있다. 한편, 골격부위(framework region, FR)에서 변이 빈도가 패닝 셀렉션 이후에 감소하는 것을 확인하였다.
실시예 4: 라이브러리 구체적 구축 확인
상기 실시예 1-5을 통한 항체 라이브러리의 구축을 검증하기 위하여, scFv의 서열을 분석하였다. 각 서브 라이브러리로부터 임의의 클론들을 선택하고 scFv 유전자를 PCR 기법으로 증폭한 후, DNA를 정제하여 서열분석을 의뢰하였다. 서열분석 결과가 도 5에 제시되어 있으며, 설계한 대로 다양한 서열과 길이를 가지는 CDR들이 라이브러리를 이루는 scFv 클론들에 도입되어 있음을 확인할 수 있다.
구체적인 서열분석 결과, 18개의 scFv 서열들 중 절단(아스파라긴산-프롤린)서열이 PCR 오류로 도입된 1건을 제외하면 배제하고자 하였던 번역후 변형 서열들이 존재하지 않는 것을 확인하였다. 이에 비하여 인간유래 숙성항체의 각 CDR에서의 이러한 번역 후 변형을 유발할 수 있는 서열들의 존재비율을 분석한 결과 중쇄의 CDR-H1에서 5.7%, CDR-H2에서 39.7%, CDR-H3에서 34.5%, 카파 경쇄의 CDR-L1에서 12.6%, CDR-L2에서 0.6%, CDR-L3에서 15.9%, 람다 경쇄의 CDR-L1에서 8.3%, CDR-L2에서 6.4%, CDR-L3에서 24.0% 발견되었다. 이로부터 설계의도대로 번역후 변형이 최소화될 수 있는 항체 라이브러리가 구축되었음을 확인하였다.
형질전환된 대장균 라이브러리를 배양하고 VCSM13 보조 파지(helper phage)로 감염시켜 scFv 클론이 표면제시된 항체파지 라이브러리를 얻었다 (H.Y.Yang et al., Mol. Cells 2009, 27, 225-235). 이 라이브러리는 1 ㎖ 당 1012 이상의 콜로니형성단위 (colony forming unit, CFU)를 포함한다. 이를 사용하여 라이소자임(Hen egg white lysozyme, HEWL) 및 AIMP1(101-192) 항원에 대하여 항원특이적 항체를 선별하는 패닝 실험을 통해 아래와 같이 항체파지 라이브러리의 기능성을 검증하였다. 이후 면역시험관(immunotube)에 10 μg/ml 농도의 항원 용액을 첨가하여 1시간동안 시험관 표면에 단백질을 흡착시킨 후 탈지분유 3% 완충용액을 시험관에 첨가하여 항원이 흡착되지 않은 표면을 보호하였다.
상기 시험관을 비운 후 여기에 탈지분유 3% 완충용액에 분산된 1012 CFU의 항체파지 라이브러리를 넣어 1-2 시간 동안 항원과 결합시켰다. 비특이적으로 결합한 파지를 TBST (tris buffered saline - tween20) 용액으로 3회 씻어낸 후, 남아있는 항원특이적 파지 항체를 100 mM 트리에틸아민 용액을 이용하여 용리하였다.
상기 용리된 파지를 1.0M 농도의 Tris-HCl 버퍼 (pH 7.8)로 중화시킨 후 ER2537 대장균에 37 ℃에서 1시간 감염시키고, 감염된 대장균을 암피실린과 2% 포도당을 함유하는 LB (Luria-Bertani) 한천배지에 도포하여 37 ℃에서 배양하였다.
다음날 배양된 대장균을 5 mL의 SB (super broth) 배양액에 현탁하고 15% 글리세롤을 첨가하여 -80 ℃에 보관하고, 50 ㎕를 20 mL의 SB-암피실린 용액에 접종하여 37 ℃에서 배양하였다.
상기 배양액의 600 나노미터 광선의 흡광도가 0.5가 되면 1011 PFU (플라크 형성단위)의 VCSM13 보조파지를 넣고 서서히 교반하며 37 ℃에서 배양하였다. 1시간 후 카나마이신 70 μg/ml을 첨가하고 30 ℃에서 빠르게 교반하며 (220 rpm) 밤새 배양하였다. 다음날 배양액을 원심분리한 후, 상층액에 5 ㎖의 5x PEG 침전용액 (20% w/v PEG8000, 15% w/v NaCl)을 넣어 혼합하였다. 혼합액을 얼음에서 30분 이상 두어 파지를 침전시키고, 이를 원심분리하여 300 ㎕의 PBS에 분산시켰다. 다시 파지 용액을 원심분리하여 맑은 상층액만 취하고, 여기에 700 마이크로리터의 3% 탈지분유 완충용액을 섞고 이를 이용하여 위의 패닝 과정을 반복함으로써 항원특이적 클론을 농축시켰다. 3 내지 4회 정도의 반복적인 패닝 후 항체유전자를 포함하는 대장균을 암피실린과 2% 포도당을 함유하는 LB 한천배지에 도포, 배양하여 단일 콜로니들을 얻고, 이를 200 ㎕ SB-암피실린 용액에 접종, 배양한 후 IPTG로 유도하여 scFv 단백질을 대장균의 페리플라즘(periplasm)에서 발현유도하였다.
대장균으로부터 수크로즈 완충용액을 이용한 삼투 충격법(osmotic shock)으로 페리플라즘 추출물(periplasmic extract)를 얻은 후, 이를 ELISA 기법을 사용하여 항원과 scFv와의 결합을 확인하는 데 사용하였다 (H.Y.Yang et al., Mol. Cells 2009, 27, 225-235). 결합한 scFv는 항-HA 항체-HRP와 테트라메틸벤지딘(TMB) 기질을 이용하여 검출하였다. 이로부터 확인된 항원특이적 항체 클론은 염기서열 분석법을 통해 분석하였다.
HEWL 항원에 대하여 188개의 클론들을 ELISA로 스크리닝하여 배경신호 대비 3배 이상의 결합신호를 보이는 ELISA 양성 클론들을 150개 확인하였으며 이 중 16개를 서열분석하여 5개의 고유 서열을 발견하였다. AIMP1(101-192)에 대하여 94개의 클론들을 ELISA로 스크리닝하여 배경신호 대비 3배 이상의 결합신호를 보이는 ELISA양성 클론들을 18개 확인하였으며 이 중 5개를 서열분석하여 2개의 고유 서열을 발견하였다.
상기 내용을 종합하면, 본 발명에 의해 제조된 항체 라이브러리는 다수의 항원에 대해 우수한 물성을 가지는 항체들을 포함하여, 기능적 다양성을 가질 뿐 아니라 고유서열을 다수 포함하는 등 항체 라이브러리로써 유용하게 사용될 수 있음을 확인하였다.
이상의 설명으로부터, 본 발명이 속하는 기술분야의 당 업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 이와 관련하여, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허 청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

Claims (15)

  1. 항체의 상보성 결정부위(complementarity Determining Regions, CDRs) 서열을 개별적으로 설계하는 단계; 및 상기 설계한 서열을 가지는 상보성 결정부위들을 포함하는 항체를 합성하여 라이브러리를 제조하는 단계를 포함하는, 항체 라이브러리를 제작하는 방법.
  2. 제1항에 있어서, 상기 항체 라이브러리를 구성하는 항체의 상보성 결정부위를 이루는 중쇄 상보성 결정부위 1(CDR-H1), 중쇄 상보성 결정부위 2(CDR-H2), 중쇄 상보성 결정부위 3(CDR-H3), 경쇄 상보성 결정부위 1(CDR-L1), 경쇄 상보성 결정부위 2(CDR-L2) 및 경쇄 상보성 결정부위 3(CDR-L3)은 다양성(polymorphism)을 가지는 것인, 항체 라이브러리를 제작하는 방법.
  3. 제1항에 있어서, 상보성 결정부위 서열의 개별적인 설계시, CDR-H1, CDR-H2, CDR-L1 또는 CDR-L2에 대하여 실제 인간유래 숙성 항체의 상보성 결정부위의 i) 생식계열(germline) 면역글로불린 유전자 사용빈도, ii) 각 아미노산 위치별로 체세포 초돌연변이에 의한 각 20종의 아미노산으로의 변이 빈도, iii) 상보성 결정부위 서열의 길이별 빈도 또는 iv) 이들의 조합을 분석하여 계산된 각 아미노산 위치별 빈도를 반영하여 모사한 서열을 설계하는 것인, 항체 라이브러리를 제작하는 방법.
  4. 제1항에 있어서, 상보성 결정부위 서열의 개별적인 설계시, CDR-L3에 대하여
    a) 상기 상보성 결정부위의 N 말단으로부터 7개 내지 8개의 아미노산 서열은 실제 인간유래 숙성 항체의 상보성 결정부위의 i) 생식계열(germline) 면역글로불린 유전자 사용빈도, ii) 각 아미노산 위치별로 체세포 초돌연변이에 의한 각 20종의 아미노산으로의 변이 빈도, iii) 상보성 결정부위 CDR-L3 서열의 길이별 빈도 또는 iv) 이들의 조합을 분석하여 계산된 각 아미노산 위치별 빈도를 반영하여 모사한 서열을 설계하고;
    b) 상기 상보성 결정부위의 C 말단으로부터 2개 내지 3개의 아미노산 서열은 실제 인간유래 숙성 항체의 상보성 결정부위의 각 아미노산 위치별 빈도를 분석하여 계산된 빈도를 반영하여 모사한 서열을 설계하는 것이며;
    상기 CDR-L3는 9개 내지 11개의 아미노산으로 이루어지고, 상기 빈도 분석은 각 길이별로 나누어 분석하며, 상기 CDR-L3 서열의 설계는 설계하고자 하는 CDR-L3의 길이와 동일한 아미노산 길이를 가지는 인간유래 숙성 항체의 상보성 결정부위 CDR-L3를 분석한 결과를 기반으로 설계하는 것인, 항체 라이브러리를 제작하는 방법.
  5. 제1항에 있어서, 상기 상보성 결정부위 서열 중 경쇄를 설계하는 경우에 해당 경쇄는 카파(kappa) 경쇄 또는 람다(lambda) 경쇄인 것인, 항체 라이브러리를 제작하는 방법.
  6. 제1항에 있어서, 상보성 결정부위 서열의 개별적인 설계시, CDR-H3에 대하여
    a) 상기 상보성 결정부위의 C 말단으로부터 3개의 아미노산을 제외한 서열들은 실제 인간유래 숙성 항체의 상보성 결정부위의 각 아미노산 위치별 빈도를 반영하여 모사한 서열을 설계하고;
    b) 상기 상보성 결정부위의 C 말단으로부터 3개의 아미노산 서열은 실제 인간유래 숙성 항체의 상보성 결정부위의 해당 3개 아미노산 서열의 위치별 빈도를 분석하여 계산된 빈도를 반영하여 모사한 서열을 설계하는 것이며;
    상기 CDR-H3는 9개 내지 20개의 아미노산으로 이루어지고, 상기 빈도 분석은 각 길이별로 나누어 분석하며, 상기 CDR-H3 서열의 설계는 설계하고자 하는 CDR-H3의 길이와 동일한 아미노산 길이를 가지는 인간유래 숙성 항체의 상보성 결정부위 CDR-H3를 분석한 결과를 기반으로 설계하는 것인, 항체 라이브러리를 제작하는 방법.
  7. 제1항에 있어서, 상기 상보성 결정부위 아미노산 서열을 설계한 후 설계된 서열에서 N-당화, 이성질체화, 탈아미드화, 절단, 산화가 일어날 수 있는 서열을 배제하는 단계를 추가로 포함하는 것인, 항체 라이브러리를 제작하는 방법.
  8. 제1항에 있어서, 상기 상보성 결정부위 아미노산 서열을 설계한 후 설계한 서열을 폴리뉴클레오티드로 역번역한 후, 번역된 폴리뉴클레오티드 5' 및 3' 말단에 각각 해당하는 인간항체 생식계열(germline) 유전자의 가변영역 골격부위 서열을 연결한 올리고뉴클레오티드 서열을 설계하는 단계를 추가로 포함하는 것인, 항체 라이브러리를 제작하는 방법.
  9. 제1항에 있어서, 상기 항체는 VH3-23 (Genebank accession No. Z12347), VK3-A27 (Genebank accession No. X93639), VL1g(GenBank accession No. Z73663) 또는 이들의 단편으로부터 코딩되는 아미노산 서열을 포함하는 것인, 항체 라이브러리를 제작하는 방법.
  10. 제1항에 있어서, 상기 항체는 IgA, IgD, IgE, IgM, IgG, Fc 단편, Fab, Fab', F(ab')2 및 Fv로 이루어진 군에서 선택된 것인, 항체 라이브러리를 제작하는 방법.
  11. 제3항에 있어서, 하기 1) 내지 6) 중 어느 하나 이상에 해당하는 것인, 항체 라이브러리를 제작하는 방법:
    1) 상기 중쇄의 CDR-H1에 대한 생식계열 CDR 서열은 서열번호 54 내지 84의 아미노산 서열을 사용;
    2) 상기 중쇄의 CDR-H2에 대한 생식계열 CDR 서열은 서열번호 85 내지 121의 아미노산 서열을 사용;
    3) 상기 경쇄 CDR 설계에 사용하는 생식계열 CDR 서열로 카파 경쇄를 사용하고, 카파 경쇄의 CDR-L1에 대한 생식계열 CDR 서열은 서열번호 122 내지 145의 아미노산 서열을 사용;
    4) 상기 경쇄 CDR 설계에 사용하는 생식계열 CDR 서열로 카파 경쇄를 사용하고, 카파 경쇄의 CDR-L2에 대한 생식계열 CDR 서열은 서열번호 146 내지 165의 아미노산 서열을 사용;
    5) 상기 경쇄 CDR 설계에 사용하는 생식계열 CDR 서열로 람다 경쇄를 사용하고, 람다 경쇄의 CDR-L1에 대한 생식계열 CDR 서열로써 서열번호 166 내지 189의 아미노산 서열을 사용; 및
    6) 상기 경쇄 CDR 설계에 사용하는 생식계열 CDR 서열로 람다 경쇄를 사용하고, 람다 경쇄의 CDR-L2에 대한 생식계열 CDR 서열은 서열번호 190 내지 209의 아미노산 서열을 사용.
  12. 제4항에 있어서, 하기 1) 내지 2) 중 어느 하나 이상에 해당하는 것인, 항체 라이브러리를 제작하는 방법:
    1) 경쇄 CDR 설계에 사용하는 생식계열 CDR 서열로 카파 경쇄를 사용하고, 카파 경쇄의 CDR-L3에 대한 생식계열 CDR 서열은 서열번호 210 내지 236의 아미노산 서열을 사용; 및
    2) 경쇄 CDR 설계에 사용하는 생식계열 CDR 서열로 람다 경쇄를 사용하고, 람다 경쇄의 CDR-L3에 대한 생식계열 CDR 서열은 서열번호 237 내지 252의 아미노산 서열을 사용.
  13. 제11항에 있어서, 상기 각 생식계열 CDR 서열의 사용빈도는 항체서열 데이터베이스의 분석을 통해 알아낸 자연인간항체에서의 각 생식계열 CDR 서열의 사용빈도를 모사한 것인, 항체 라이브러리를 제작하는 방법.
  14. 제12항에 있어서, 상기 각 생식계열 CDR 서열의 사용빈도는 항체서열 데이터베이스의 분석을 통해 알아낸 자연인간항체에서의 각 생식계열 CDR 서열의 사용빈도를 모사한 것인, 항체 라이브러리를 제작하는 방법.
  15. 제1항 내지 제14항 중 어느 한 항에 따른 방법에 의해 제조된 항체 라이브러리.
PCT/KR2016/000320 2015-01-13 2016-01-13 신규 항체 라이브러리 제조방법 및 이로부터 제조된 라이브러리 WO2016114567A1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
EP16737531.0A EP3246434A1 (en) 2015-01-13 2016-01-13 Method for preparing novel antibody library and library prepared thereby
US15/648,137 US20170362306A1 (en) 2015-01-13 2017-07-12 Method for preparing novel antibody library and library prepared thereby

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2015-0006358 2015-01-13
KR20150006358 2015-01-13

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US15/648,137 Continuation-In-Part US20170362306A1 (en) 2015-01-13 2017-07-12 Method for preparing novel antibody library and library prepared thereby

Publications (1)

Publication Number Publication Date
WO2016114567A1 true WO2016114567A1 (ko) 2016-07-21

Family

ID=56406057

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2016/000320 WO2016114567A1 (ko) 2015-01-13 2016-01-13 신규 항체 라이브러리 제조방법 및 이로부터 제조된 라이브러리

Country Status (4)

Country Link
US (1) US20170362306A1 (ko)
EP (1) EP3246434A1 (ko)
KR (2) KR20160087766A (ko)
WO (1) WO2016114567A1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107955071A (zh) * 2016-10-18 2018-04-24 上海赛远生物科技有限公司 人源抗人cd47抗体及其编码基因与应用
EP3510187B1 (en) * 2016-09-08 2023-09-06 Italfarmaco SpA Hc-cdr3-only libraries with reduced combinatorial redundancy and optimized loop length distribution
US11866492B2 (en) 2018-03-14 2024-01-09 Alteogen, Inc. Antibody specifically binding to FOLR1 and uses thereof

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11015188B2 (en) * 2017-11-20 2021-05-25 NantBio Inc. MRNA display antibody library and methods
US11034951B2 (en) 2017-11-20 2021-06-15 Nantbio, Inc. mRNA display antibody library and methods
EP3728705A4 (en) * 2017-12-18 2022-01-19 Charles River Laboratories, Inc. RADICALLY DIVERSE HUMAN ANTIBODY BANK
WO2020014143A1 (en) * 2018-07-08 2020-01-16 Specifica Inc. Antibody libraries with maximized antibody developability characteristics
CA3124941A1 (en) * 2019-01-31 2020-08-06 Nantbio, Inc. Mrna display antibody library and methods
US20230027822A1 (en) * 2019-12-13 2023-01-26 Nanjing GenScript Biotech Co., Ltd. Method for Constructing Antibody Complementarity Determining Region Library
KR102507515B1 (ko) * 2020-08-26 2023-03-08 이화여자대학교 산학협력단 신규 항체 라이브러리 제조방법 및 이로부터 제조된 라이브러리
WO2023283383A1 (en) * 2021-07-07 2023-01-12 Specifica Inc. Antibody affinity maturation using natural liability-free cdrs
CN114381472B (zh) * 2021-12-30 2024-04-12 华南农业大学 一种纳米抗体全合成文库及其构建方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060057632A1 (en) * 2001-11-22 2006-03-16 Keio University Artificial antibody library with super-repertory
US20090318297A1 (en) * 2005-11-14 2009-12-24 Pfizer, Inc. Antibody Ultrahumanization by Predicted Mature CDR Blasting and Cohort Library Generation and Screening
US20100099103A1 (en) * 2008-09-30 2010-04-22 Abbott Laboratories Antibody Libraries
US20110245108A1 (en) * 2004-07-06 2011-10-06 Roberto Crea Universal Antibody Libraries
US20120058906A1 (en) * 2008-11-07 2012-03-08 Vaughn Smider Combinatorial antibody libraries and uses thereof

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040010376A1 (en) 2001-04-17 2004-01-15 Peizhi Luo Generation and selection of protein library in silico
DE102007011912A1 (de) * 2007-03-13 2008-09-18 Sanofi-Aventis Verfahren für das Erzeugen von Peptidbibliotheken und deren Verwendung
EP2564340B1 (en) * 2010-04-29 2020-01-08 The Regents of The University of California Pathway recognition algorithm using data integration on genomic models (paradigm)

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060057632A1 (en) * 2001-11-22 2006-03-16 Keio University Artificial antibody library with super-repertory
US20110245108A1 (en) * 2004-07-06 2011-10-06 Roberto Crea Universal Antibody Libraries
US20090318297A1 (en) * 2005-11-14 2009-12-24 Pfizer, Inc. Antibody Ultrahumanization by Predicted Mature CDR Blasting and Cohort Library Generation and Screening
US20100099103A1 (en) * 2008-09-30 2010-04-22 Abbott Laboratories Antibody Libraries
US20120058906A1 (en) * 2008-11-07 2012-03-08 Vaughn Smider Combinatorial antibody libraries and uses thereof

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3510187B1 (en) * 2016-09-08 2023-09-06 Italfarmaco SpA Hc-cdr3-only libraries with reduced combinatorial redundancy and optimized loop length distribution
CN107955071A (zh) * 2016-10-18 2018-04-24 上海赛远生物科技有限公司 人源抗人cd47抗体及其编码基因与应用
CN107955071B (zh) * 2016-10-18 2021-03-26 上海赛远生物科技有限公司 人源抗人cd47抗体及其编码基因与应用
US11866492B2 (en) 2018-03-14 2024-01-09 Alteogen, Inc. Antibody specifically binding to FOLR1 and uses thereof

Also Published As

Publication number Publication date
KR102290949B1 (ko) 2021-08-23
KR20180077144A (ko) 2018-07-06
US20170362306A1 (en) 2017-12-21
EP3246434A1 (en) 2017-11-22
KR20160087766A (ko) 2016-07-22

Similar Documents

Publication Publication Date Title
WO2016114567A1 (ko) 신규 항체 라이브러리 제조방법 및 이로부터 제조된 라이브러리
WO2014030780A1 (en) Screening and engineering method of super-stable immunoglobulin variable domains and their uses
WO2014084607A1 (ko) 항체 중쇄불변부위의 이종이중체 고효율 형성을 유도하는 ch3 도메인 변이체 쌍, 이의 제조방법, 및 용도
WO2020096381A1 (ko) 인간 il-4 수용체 알파에 대한 고친화도 인간 항체 및 이의 용도
WO2017052241A1 (en) Novel anti-mesothelin antibody and composition comprising the same
He et al. Selection of a human anti-progesterone antibody fragment from a transgenic mouse library by ARM ribosome display
WO2014077648A1 (ko) 인간 및 마우스 l1cam 단백질에 특이적으로 결합하는 항체 및 이의 용도
WO2015058573A1 (zh) 拮抗抑制程序性死亡受体pd-1与其配体结合的单克隆抗体及其编码序列与用途
WO2016137108A1 (en) Novel antibody binding to tfpi and composition comprising the same
CN101573378A (zh) 结合分子
WO2015133882A1 (ko) ScFv 항체 라이브러리, 이의 제조방법 및 이를 이용한 ScFv 항체 스크리닝 방법
JP2013234201A (ja) 抗体代替軽鎖配列を含む構築物およびライブラリー
KR20110028543A (ko) 항체 대용물 카파 경쇄 서열을 포함하는 구축물 및 라이브러리
WO2014090053A1 (zh) 拮抗抑制血管内皮细胞生长因子与其受体结合的单克隆抗体及其编码序列与用途
WO2017065484A1 (ko) 효모접합을 이용한 항체 ch3 도메인 이종이중체 돌연변이쌍 제조방법 및 이에 의하여 제조된 ch3 돌연변이체 쌍
WO2022039490A1 (en) Anti-b7-h4/anti-4-1bb bispecific antibodies and use thereof
Bai et al. A novel human scFv library with non-combinatorial synthetic CDR diversity
EP2478136A2 (en) Libraries of genetic packages comprising novel hc cdr3 designs
WO2022177394A1 (ko) Pd-l1 및 cd47에 대한 이중특이적 단일 도메인 항체 및 이의 용도
WO2020101365A1 (ko) 안정성이 향상된 항 c-met 항체 또는 그의 항원 결합 단편
WO2022045777A1 (ko) 신규 항체 라이브러리 제조방법 및 이로부터 제조된 라이브러리
Nelson et al. A universal phage display system for the seamless construction of Fab libraries
WO2020251316A1 (ko) α-SYN/IGF1R에 대한 이중 특이 항체 및 그 용도
WO2014116051A1 (ko) 단백질 조합 기반의 Fv 라이브러리 및 이의 제조 방법
WO2019231276A1 (ko) 항체 라이브러리 및 이를 이용한 항체 스크리닝 방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 16737531

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

REEP Request for entry into the european phase

Ref document number: 2016737531

Country of ref document: EP