WO2001096558A1 - Sequence de base polyfonctionnelle et gene artificiel contenant ladite sequence - Google Patents

Sequence de base polyfonctionnelle et gene artificiel contenant ladite sequence Download PDF

Info

Publication number
WO2001096558A1
WO2001096558A1 PCT/JP2001/005116 JP0105116W WO0196558A1 WO 2001096558 A1 WO2001096558 A1 WO 2001096558A1 JP 0105116 W JP0105116 W JP 0105116W WO 0196558 A1 WO0196558 A1 WO 0196558A1
Authority
WO
WIPO (PCT)
Prior art keywords
function
multifunctional
artificial
protein
functions
Prior art date
Application number
PCT/JP2001/005116
Other languages
English (en)
French (fr)
Inventor
Kiyotaka Shiba
Original Assignee
Japan Science And Technology Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Science And Technology Corporation filed Critical Japan Science And Technology Corporation
Priority to EP01938687A priority Critical patent/EP1291423A4/en
Publication of WO2001096558A1 publication Critical patent/WO2001096558A1/ja

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • A61P31/18Antivirals for RNA viruses for HIV
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins

Definitions

  • the present invention provides a multifunctional nucleotide sequence having two or more functions when the reading frame of the nucleotide sequence is different, an artificial gene in which the multifunctional nucleotide sequence is linked so that a plurality of reading frames appear,
  • the present invention relates to an artificial protein or a derivative thereof, which is a translation product of the artificial gene.
  • RNA population with 13 diversity was prepared, and an RNA molecule that specifically binds to a specific dye was selected from this RNA population, and an RNA molecule having any sequence structure was given. It reports whether the function is satisfied (Nature, 346: 818-822, 1990).
  • the group of Szostak et al. Broaches have successfully created RNA molecules with more complex activities, such as ligase activity (Science, 261: 1411-1418, 1993).
  • the present inventors have proposed a method for efficiently and simply producing a repetitive polymer of a microphone-mouth gene, in which DNA polymerase is used for oligonucleotide A and oligonucleotide B, at least a part of which are complementary to each other.
  • a Mike mouth gene polymerization method Japanese Patent Application Laid-Open No. 9-322775 has been proposed in which a polymerization reaction is carried out by acting.
  • DNA encoding an amino acid polymer having a repeating unit similar to that of a natural protein such as silk protein or elastin Japanese Patent Application Laid-Open No. H10-14886
  • an artificial tamper having a repeating amino acid sequence and the like.
  • a gene cassette encoding a protein US Pat. No. 5,089,046) and a synthetic repetitive DNA for producing a large polypeptide having a repetitive sequence of amino acids (US Pat. No. 5,614,468) Specification
  • a DNA sequence encoding a peptide having an amino acid repeating unit US Pat. No. 5,770,09
  • synthesis for producing a large polypeptide containing an amino acid repetitive sequence Repetitive DNA (US Pat. No.
  • An object of the present invention is to provide a multifunctional base sequence having two or more functions when the reading frame of a base sequence is different, which is required for creating an industrially useful artificial protein.
  • An object of the present invention is to provide an artificial gene whose sequence is linked so that a plurality of reading frames appear, and a human protein or a derivative thereof which is a translation product of the artificial gene. Disclosure of the invention
  • Polymers have a combinatorial nature of multiple reading frames and will have a very large variety. Moreover, in this micro-gene polymerization method, a micro genes used are, can also translational stop codon in advance how readings frame to Dezain so as not to appear Yes, it was found that the above-mentioned translation stop codon problem frequently encountered with DNA having a random sequence can be avoided.
  • the present inventor thought that it would be possible to create an artificial gene capable of expressing a functional artificial protein by the microgene polymerization method, and used the AIDS virus neutralizing antigen protein as a basic biological function.
  • a single microgene with multiple biological functions that encodes peptides with different biological reading frames that have the biological function of easily forming a secondary structure, such as the property of easily forming a helical structure, etc.
  • the AIDS virus neutralizing antigen protein and the helix-forming ability were selected as two biological functions because some antibodies against a region called loop 3 of the gp120 protein of AIDS virus have virus neutralizing activity.
  • loop 3 region is usually hidden inside the g120 protein, making it difficult to obtain antibodies against the loop 3, and the synthesized loop 3 neutralizing antigen peptide is weakly immunogenic. It is well known that antibodies are not obtained as expected, By creating a highly immunogenic artificial protein that has a loop 3-peptide sequence in at least some parts and is entirely supported by an ⁇ -helical skeleton, and by using such an artificial protein as an immunogen, This is because anti-loop antibodies that are candidates for neutralizing antibodies may be obtained.
  • the first R Corresponds to the six codons of “C GT”, “C GC”, “C GAJ”, “C GG”, “AGA”, and “AGG”. Select specific codons from these, and the next (lysine) Two codons, AAA and AAG, correspond to each other.Select a specific codon from these, and then select specific codons in the same manner to design a microgene.Read the neutralizing antigen peptide above.
  • nucleotide sequences Approximately 165.1 billion types of nucleotide sequences are encoded in one of the frames due to the degeneracy of codons. Also, since a single microgene has three reading frames on each of the plus and minus strands, it can encode six different peptides.For example, for two different reading frames in the same direction, Two peptides completely different from the neutralizing antigen peptide are encoded. Therefore, a nucleotide sequence encoding a peptide having the property of “easy to form a secondary structure” in one of the two other reading frames in the same direction was selected from the above approximately 161 billion types of nucleotide sequences. We decided to search by computer.
  • This microgene, Design-1 25 encodes a neutralizing antigen sequence in one of its reading frames, has no stop codons in the other two reading frames, and has an alpha in one of the reading frames. It encodes a peptide that has the property of easily forming helices, and can be said to be a micro-oral gene in which two biological functional structures such as “AIDS virus neutralizing antigen” and “structure-forming ability” are latent.
  • the microgene “design one 25” was polymerized using the microgene polymerization method (JP-A-9-322775) disclosed by the present inventor, and the “neutralizing antigen sequence” was obtained.
  • an “artificial gene library” composed of various artificial genes in which “a sequence that easily forms a helix” is intricately combined.
  • various artificial proteins are expressed in Escherichia coli, and As a result, it was confirmed that an artificial protein having a virus-neutralizing antigen sequence could be obtained in some places, supported by the structure of the helix, thus completing the present invention.
  • the present invention provides a multifunctional base sequence (claim 1) characterized in that the base sequence has two or more functions when the reading frame of the base sequence is different, 3.
  • the multifunctional base sequence according to claim 1 or 2 wherein the base sequence is RNA, and the base sequence is a linear base sequence.
  • the multifunctional nucleotide sequence according to any one of claims 1 to 5 (claim 6) or the nucleotide sequence The multifunctional base sequence according to any one of claims 2 to 6, wherein a stop codon is not present in all of the six reading frames (claim 7), or a linking portion when the multifunctional base sequence is polymerized.
  • the multifunctional base sequence according to any one of claims 1 to 8 (claim 9), a biological function, a function that easily forms a secondary structure, an antigen function to induce a neutralizing antibody, and a function to activate immunity Function of promoting or suppressing cell proliferation, function of specifically recognizing cancer cells, function of protein transduction, function of inducing cell death, function of presenting antigenic residues, metal binding function, coenzyme binding function, catalytic activity Function, Fluorescent activity Ability, ability to activate the receptor by binding to specific receptors, the ability to modulate their functions by binding to specific factors involved in signal transduction, biopolymers specifically Recognition function, cell adhesion function, function of localizing proteins outside the cell, function of targeting to specific organelles, function of embedding in cell membrane, function of amyloid fibril formation, function of fibrous protein formation, protein A gel-forming function, a proteinaceous film-forming function, a monomolecular film-forming function, a self-assembly function, a particle-forming function, or a function of
  • the present invention provides a method according to the present invention, wherein, among all combinations of base sequences encoding an amino acid sequence having a predetermined function, in a reading frame different from the reading frame of the amino acid sequence having the predetermined function, Alternatively, a method for producing a multifunctional nucleotide sequence having two or more functions characterized by selecting a nucleotide sequence having a different function (Claim 14), or a nucleotide sequence having a function identical or different from a predetermined function The method for producing a multifunctional nucleotide sequence having two or more functions according to claim 14 (claim 15), which is characterized in that the method is selected by a computational science method.
  • the sequence according to any one of claims 14 to 17, wherein the sequence is DNA.
  • the method for producing a functional base sequence having two or more functions according to any one of claims 14 to 17, wherein the method for producing a functional base sequence (Claim 18) and the base sequence are RNA.
  • the method (Claim 24), the biological function, the function of easily forming a secondary structure, the function of inducing neutralizing antibodies, the function of activating immunity, the function of promoting or suppressing cell proliferation, the function of promoting cancer cells, Specific Recognition Function, Protein, Transduction Function, Cell Death Induction Function, Antigen Determination Residue Display Function, Metal Binding Function, Coenzyme Binding Function, Catalytic Activity Function, Fluorescent Activity, Specific Receptor That activates its receptor by binding to Function, modulates the function by binding to specific factors involved in signal transmission, the function of specifically recognizing biopolymers, the function of cell adhesion, the function of localizing extracellular proteins, Function to target specific organelles, function to be embedded in cell membrane, function to form amyloid fiber, function to form fibrous protein, function to form protein gel, function to form protein film 25.A function as a monomolecular film forming function, a self-assembling function, a particle forming function, or a function to assist the formation of a higher-order
  • the method for producing a multifunctional base sequence having two or more functions (Claim 26), and further performing a modification for polymerizing the multifunctional base sequence.
  • the present invention provides that one or more of the multifunctional nucleotide sequences according to any one of claims 1 to 13 or claim 29 are linked so that a plurality of reading frames appear.
  • the artificial gene according to claim 30 (claim 30) or the artificial gene according to claim 30 comprising a base or base pair of 30 to 100000 (claim 31).
  • the method for producing a gene (Claim 32), or adding a specific DNA sequence “A” to one end of a double-stranded multifunctional base sequence and a specific DNA sequence “B” to the other end, DNA sequences “a” and “b” containing at least a part of a sequence complementary to Aj and “B” respectively are prepared, and the DNA sequences “a” and “b” are prepared.
  • 33. The method for producing an artificial gene according to claim 32, wherein the ligase reaction of the double-stranded multifunctional nucleotide sequence is performed using a single-stranded DNA linked to “b”.
  • a method for producing an artificial gene according to claim 32 (claim 34), or an artificial gene expression characterized in that the artificial gene according to claim 30 or 31 is incorporated into an expression vector.
  • the artificial gene expression vector according to claim 35 wherein the vector (claim 35) or the artificial gene is an artificial gene linked to a natural gene.
  • An artificial gene expression vector-containing cell (Claim 37), wherein the artificial gene expression vector according to 35 or 36 has been introduced into a host cell, or the host cell is E. coli.
  • the artificial remains according to claim 37, characterized in that: A cell containing an expression vector (claim 38), an artificial protein or a derivative thereof obtained as a translation product of the artificial gene according to claim 30 or 31 (claim 39), The human protein or a derivative thereof according to claim 39, wherein the translation is performed in a cell-free expression system (claim 40), and the translation is performed in a cell expression system.
  • the artificial protein or the derivative thereof (claim 42) or the artificial protein derivative described above is a human glycoprotein, an artificial phospholipid protein, an artificial polyethylene glycol-modified protein, an artificial vorfilin binding protein.
  • a method for producing a human E-protein or a derivative thereof which comprises screening a functional molecule from a gene translation product (Claim 44), or the artificial protein according to any one of Claims 39 to 43.
  • a transgenic non-human animal having an ability (claim 46), a transgenic plant having an ability to express a human eprotein or a derivative thereof according to any one of claims 39 to 43 (claim 47), A therapeutic agent for various diseases characterized by containing the artificial protein or a derivative thereof according to any one of claims 39 to 43 as an active ingredient (claim 48), and a therapeutic agent for claims 39 to 43
  • Biological tissue (Claim 50) characterized by containing a substance or a derivative thereof as an active ingredient, or the artificial protein or a derivative thereof according to any one of Claims 39 to 43 as an active ingredient
  • the present invention relates to an artificial proteinaceous polymer material (Claim 51).
  • FIG. 1 is a diagram showing an example of a flow of an operation for calculating an automatic design of microgenes.
  • FIG. 2 is a diagram showing a designed microphone gene comprising a double-stranded multifunctional DNA sequence of the present invention and an amino acid sequence encoded by the gene.
  • FIG. 3 is a diagram showing an example of the designed artificial gene of the present invention.
  • FIG. 4 shows an example of the designed artificial protein of the present invention.
  • Fig. 5 shows the results of SDS polyacrylamide gel electrophoresis of a crude extract of Escherichia coli expressing an artificial protein derived from the designed artificial gene of the present invention. It is a figure showing a result.
  • FIG. 6 is a view showing the results of SDS polyacrylamide gel electrophoresis of the purified artificial protein derived from the artificial gene of the present invention, which is the best mode for carrying out the invention.
  • the multifunctional base sequence of the present invention is not particularly limited as long as the base sequence has two or more functions when the reading frame of the base sequence is different, and as the base sequence, Specific examples of a single-stranded or double-stranded DNA or RNA sequence can be given.These may have either a linear structure or a cyclic structure. Structures are preferred. Further, as the multifunctional nucleotide sequence of the present invention, the absence of a stop codon in all three reading frames in which the reading frame of the nucleotide sequence is shifted by one, especially in the case of a nucleotide sequence consisting of two strands Preferably, no stop codon is present in all six reading frames of the base sequence. Further, a base sequence in which stop codon does not occur at a connecting part (bonding part) when such a multifunctional base sequence is polymerized is particularly preferable.
  • the functions of the multifunctional base sequence of the present invention can be broadly classified into functions of all or a part of the translation product of the base sequence and functions of the whole or part of the base sequence itself.
  • the functions of the above translation products include the function of easily forming secondary structures such as helix formation, the antigen function of inducing neutralizing antibodies such as viruses, and the function of activating immunity (Nature Medicine) , 3: 1266-1270, 1997) Function of promoting or suppressing cell proliferation, function of specifically recognizing cancer cells, function of protein transduction, function of inducing cell death, function of presenting antigen-determining residues, metal Binding function, coenzyme binding function, catalytic activity function, fluorescence activity, binding to a specific receptor to activate that receptor, binding to specific factors involved in signal transduction
  • Three Modulating function function of specifically recognizing macromolecules such as proteins, DNA, RNA, and sugar, cell adhesion function, function of localizing protein outside the cell, specific organelles (mitochondria) , Chloroplasts, ER, etc.), embedded in cell membrane, amyloid fibril forming function, fibrous protein forming function, proteinaceous gel forming function, proteinaceous film forming function, monomolecular film forming function
  • specific examples include a function, a self-assembly function, a particle forming function, and a function of assisting the formation of higher-order structures of other proteins.
  • biological function means these "functions of all or part of the base sequence translation product".
  • the functions of the base sequence itself include a metal binding function, a coenzyme binding function, a catalytic activity function, a function of binding to a specific receptor to activate the receptor, and a specific factor relating to signal transmission.
  • Function to bind to and modulate its function to specifically recognize biological macromolecules such as proteins, DNA, RNA, and sugar; to stabilize RNA; to modulate translation efficiency; Examples of the function include a function of suppressing gene expression.
  • the method for producing a multifunctional base sequence having two or more functions according to the present invention includes, among all combinations of base sequences encoding amino acid sequences having a predetermined function, an amino acid sequence having the predetermined function.
  • an amino acid sequence having the predetermined function There is no particular limitation on a method for producing a multifunctional nucleotide sequence that selects a nucleotide sequence having the same or different function as the predetermined function in a reading frame different from the predetermined reading frame.
  • the above-mentioned biological function is preferable, and a biological function different from the predetermined function is preferable because diversity can be provided.
  • the amino acid sequence having the predetermined function includes all amino acid sequences having the predetermined function, and is not limited to a single amino acid sequence.For example, three amino acid sequences having the predetermined function may be used.
  • said 3 A multifunctional nucleotide sequence will be selected from all combinations of nucleotide sequences encoding one amino acid sequence.
  • the amino acid sequence having such a predetermined function include a sequence of the AIDS virus neutralizing antigen and a motif structure such as G1u-Leu-Arg of a chemokine which is a cytokine for leukocytes.
  • a sequence in which one or more amino acids are deleted, substituted or added to the known sequence and having a function similar to that of the known sequence, or a specific sequence well conserved between organisms An unknown sequence such as a consensus sequence related to the biological function of the protein or a sequence that may pass through the monitoring of the human immune system consisting of an amino acid sequence repelled by existing human proteins can be exemplified.
  • the size of the multifunctional base sequence of the present invention is not particularly limited, it may be 15 to 500 bases or base pairs, particularly 15 to 200 bases or base pairs, and A base sequence having a size of 5 to 100 bases or base pairs is preferable in that DNA synthesis can be performed stably.
  • a method for producing a random polymer of the microgene Japanese Patent Application Laid-Open No. Hei 9-154585
  • a method for microgene polymerization Japanese Patent Application Laid-Open No. Hei 9-132277
  • a multifunctional base sequence modified for polymerization or a multifunctional base sequence to which a naturally derived base sequence is bonded can also be used.
  • a base sequence having the same or different biological function as the predetermined function can be selected by a computational science method using a computer, and more specifically, a score when a biological function prediction program is used.
  • Examples of the above-mentioned biological function prediction program include a program created by statistically processing the correlation between the biological functions of proteins and peptides and the secondary structure of proteins and peptides. The secondary structure formation ability of is described in the literature (Struc tur e, Funtion, and Genetics 27: 36-46, 1997). By using this method, the possible formation of the ⁇ -helix and ⁇ -strand at each residue position of a given peptide sequence is quantified (the higher the possibility, the larger the value).
  • the ⁇ -helix of all the residues in a given peptide sequence, and the sum of the potentials of formation of] 3 strands, respectively, are calculated as the helix formation of the helix of the given peptide sequence, It can be calculated as a value of the formality and used for evaluation.
  • a function prediction program for example, the “Motiffind program” (Protein) for detecting similarity with known motifs registered in “PROSITE” (Nucleic Acids Res., 27: 215-219, 1999) Sci., 5: 1991-1999, 1996), and a similarity search program “blast” (J. Mol.
  • the multifunctional nucleotide sequence of the present invention can be obtained by combining two or more different types of multifunctional nucleotide sequences using a ligase or the like, or by combining the multifunctional nucleotide sequence and a naturally occurring nucleotide sequence using a ligase or the like. It can also be a base sequence. Alternatively, a part of the multifunctional nucleotide sequence of the present invention may be individually prepared, and then these may be combined using a ligase or the like to obtain the multifunctional nucleotide sequence of the present invention. And the multifunctional nucleotide sequence having two or more functions produced by the method for producing a multifunctional nucleotide sequence of the present invention is also
  • the artificial gene of the present invention can be produced by polymerizing one or more of the above multifunctional nucleotide sequences into combinatorial ones so that a plurality of reading frames appear.
  • a method of polymerizing into a combinatorial so that a plurality of reading frames appear a method described in Japanese Patent Application Laid-Open No. 9-154585 / developed by the inventor described above, that is, a double-stranded multifunctional base A specific DNA sequence different from each other is added to both ends of the sequence, a DNA sequence containing at least a part of a sequence complementary to the specific DNA sequence is prepared, and the prepared DNA sequences are ligated.
  • the artificial gene expression vector of the present invention is not particularly limited as long as it is an expression vector capable of expressing the incorporated artificial gene in a target cell or the like.
  • the expression vector include pKC30, p T rc 99 A, p B luescript IL p SV 2— neo, p CAGG S, pc DL-SR «29 6, p G—1, pA c 373, p QE-9 p ET— 3 a And the like.
  • the vector may have a replication origin, a selection marker, a promoter, and an RNA splice site, a polyadenylation signal, and the like, as necessary.
  • the origin of replication includes those derived from SV40, adenovirus, ⁇ sipapi-mavirus, ColEl, R-factor, F-factor, ARS1, etc.
  • promoters include promoters derived from viruses such as retrovirus, poliovirus, adenovirus, and SV40; chromosome-derived EF1- ⁇ promoter; Examples include phage ⁇ -derived promoters and promoters such as trp, 1 ⁇ ⁇ , lac, and tac.
  • the selection gene may be any gene as long as the cell containing the artificial gene expression vector of the present invention can be screened.
  • a neomycin resistance gene for example, a pumamycin resistance gene, hygromycin resistance gene, the diphtheria toxin resistance gene, fusion gene ( ⁇ _ ge ⁇ ) of 0 _ ga 1 and neo R, kanamycin resistance gene, ampicillin resistance gene, mention may be made of tetracycline resistance gene specifically.
  • a natural gene such as a gene encoding a peptide having a biological activity or a gene encoding a labeling substance such as GF ⁇ may be appropriately located, for example, in an upstream region, a downstream region, or an intermediate region, in an appropriate proportion It is also possible to use those joined by.
  • the artificial gene expression vector-containing cells can also be t present invention to use a native gene is incorporated in advance in the calling expression vector used, the artificial gene expression base Kuta one has been introduced
  • the host cell is not particularly limited as long as it is a host cell, and examples of such a host cell include animal cells, plant cells, and microbial cells.
  • animal cells examples include insect cells such as Drosophila S2 and Spodoptera Sf9, L cells, CHO cells, COS cells, HeLa cells, C127 cells, BAL BZc3T3 cells ( (Including mutants deficient in dihydrofolate reductase thymidine kinase), BHK21 cells, HEK293 cells, Bowes melanoma cells, and the like.
  • plant cells include: Examples include plant cells established from Arabidopsis, tobacco, corn, wheat, rice, carrot, soybean, etc. be able to.
  • microbial cells examples include bacterial prokaryotic cells such as Escherichia coli, actinomycetes, Bacillus subtilis, Streptococcus, and Staphylococcus, and fungal cells such as yeast and Aspergillus.
  • E. coli having a sublesser mutation (supD, supE, supF) that translates one of the codons, amber codon (TAG), as serine, glutamine or tyrosine is preferred.
  • the artificial protein or derivative thereof of the present invention is not particularly limited as long as it is a protein or a derivative thereof obtained as a translation product of the above-mentioned artificial gene. Translation of such an artificial gene can be performed in a cell-free expression system or in a cell expression system. Can be performed in the system. Examples of the cell-free expression system include a cell-free protein synthesis system using an Escherichia coli S30 extract, a wheat germ cell-free protein synthesis system, and the like.
  • t also can be carried out by culturing the gene expression base Kuta one containing cells, derivatives of the artificial protein, glycoprotein, Hosuhori pitch de protein, polyethylene glycol-modified proteins, porphyrin Phosphorus-bound protein, flavin-bound protein and the like can be mentioned.
  • the fusion protein of the present invention or a derivative thereof may be any protein as long as the artificial protein or its derivative is bound to a protein and a Z or peptide tag, and a marker protein.
  • the marker is not particularly limited as long as it is a conventionally known marker protein, and specific examples thereof include alkaline phosphatase, the Fc region of an antibody, HRP, and GFP. Specific examples thereof include conventionally known peptide tags such as Myc tag, His tag, FLAG tag, and GST tag.
  • Such a fusion protein or a derivative thereof can be produced by a conventional method, such as purification of an artificial protein or the like utilizing the affinity of Ni-NTA and His tag, detection of artificial protein, human protein It is also useful as a marker for quantification of ligands, etc., as a marker for diagnosis of diseases related to artificial proteins, and as a research reagent in the field.
  • Artificial gene expression vector, artificial gene expression vector The containing cells are useful as therapeutic agents for various diseases.
  • the transgenic non-human animal of the present invention is not particularly limited as long as it is a non-human animal capable of expressing an artificial protein or a derivative thereof.
  • the plant is not particularly limited as long as it is a plant capable of expressing a protein or a derivative thereof.
  • Examples of the non-human animal of the present invention include non-human animals such as rodents such as mice and rats, and the transgenic plants of the present invention include rice and wheat. , corn, Plants such as crops such as soybeans, tobacco, and carrots can be specifically mentioned, but are not limited thereto.
  • a method for producing a non-human animal in which a gene encoding an artificial protein or a derivative thereof is expressed on a chromosome will be described using a transgenic mouse of the artificial protein or a derivative thereof as an example.
  • a transgenic mouse of an artificial protein or a derivative thereof can be obtained by adding a chicken jS-actin, a mouse lipophilic filament, a promoter such as SV40, and a rabbit to a DNA encoding an artificial protein or a derivative thereof.
  • a transgene was constructed by fusing globin, SV40 or other poly A or intron, and the transgene was microinjected into the pronucleus of a mouse fertilized egg, and the resulting egg cells were cultured.
  • transgenic mice can be created by transplanting the cells into an oviduct, breeding the recipient animal, and selecting pups having the DNA from the pups born.
  • selection of offspring mice having DNA can be carried out by extracting crude DNA from the tail of the mouse, etc., and using the dot-hybridization method using DNA encoding the introduced artificial protein or its derivative as a probe, or a specific primer. Can be performed by a PCR method or the like.
  • homozygous non-human animals born according to Mendel's law include the artificial protein or its derivative-expressed form and its littermate wild-type, and the expression in these homozygous non-human animals. By simultaneously using the wild type and its litter, it is possible to carry out accurate comparison experiments at the individual level for various diagnoses.
  • a method for producing a transgenic plant of the artificial protein or a derivative thereof will be described.
  • a plant expression vector in which the artificial gene of the present invention has been integrated is transformed into a plant cell line established from Arabidopsis, tobacco, corn mouth, wheat, rice, carrot, soybean, and the like.
  • the transgenic plant can be obtained by introducing the gene and regenerating the transfected cell line into a plant.
  • Examples of the form of the transgenic plant include, in addition to the plant, protoplasts, calli, and parts of the plant (leaf disk, hypocotyl, etc.).
  • the agrobacterium method is suitable, but in addition, for example, a polyethylene glycol method, an electo-portion method, a particle gun method, or the like is used. (Experimental protocol for model plants, Shujunsha (1996)).
  • a polyethylene glycol method for example, an electo-portion method, a particle gun method, or the like is used.
  • a particle gun method or the like is used.
  • the use of the transgenic plant seeds, tubers, cuttings, rice clones and the like of the present invention enables mass production of the target plant.
  • transgenic rice plant will be described more specifically by way of example.
  • Callus induction is performed from the ripe seeds, and this is infected with an artificial protein or an Agrobacterium into which the cDNA cDNA has been introduced. After co-culturing these proteins and agrobacterium, the cells are transferred to a selection medium and cultured. After about 3 weeks, the calli are transferred to a regeneration medium and cultured until regeneration.
  • Transformants can be regenerated by transferring them to pots after acclimation for 4 or 5 days (Experimental protocol for model plants, Shujunsha (1996)).
  • the methods for regenerating carrots, tobacco, etc. the methods of Dr. Kato and Dr.
  • Shono plant tissue culture technology, Asakura Shoten (1983)
  • the selection of transgenic plants into which DNA encoding the artificial protein or its derivative has been introduced is carried out by extracting crude DNA from such a plant body and subjecting it to the Northern blot method or the introduced artificial protein or its derivative.
  • the human protein or its derivative as an active ingredient
  • it can be used as a therapeutic or diagnostic agent for various diseases.
  • the artificial protein or its derivative can also be used in a form existing in a cell or a cell membrane.For example, as a method for obtaining a cell membrane, F. Pietri-Rouxel (Eur. J. Biochem. , 247: 1 1174-1 179, 1997).
  • an artificial protein or its derivative from a cell culture
  • ammonium sulfate or ethanol precipitation acid extraction, anion or cation exchange chromatography, phosphocellulose chromatography, hydrophobic interaction chromatography
  • Known methods including affinity mouth chromatography, hide mouth xiapatite chromatography and lectin chromatography, preferably high performance liquid chromatography are used.
  • columns used for affinity chromatography include, for example, a column to which a ligand for an artificial protein is bound, and a case where a normal peptide tag is added to the artificial protein of the present invention as described later.
  • An artificial protein can be obtained by using a column to which a substance having high affinity is bound.
  • Example 1
  • SEQ ID NO: 1 is a partial sequence of the gp120 protein of a group of subspecies of the HIV virus.
  • the 20 amino acid residues shown in SEQ ID NO: 1 are three amino acid sequences that are partial sequences that partially overlap each other, that is, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO:
  • the peptide was divided into peptides consisting of the three amino acid sequences shown in Fig. 4, and calculations were performed for each.
  • the nucleotide sequence shown in SEQ ID NO: 6, SEQ ID NO: 8, or SEQ ID NO: 10 obtained by the above operation is linked with consideration of duplication, and the microgene having the nucleotide sequence shown in SEQ ID NO: 11 is obtained.
  • "Design 1 2 5" was obtained.
  • the designed microgene encodes a partial sequence of the gp120 protein of a group of HIV virus in the first reading frame and a helical structure in the second reading frame, as shown in Figure 2. Encodes a peptide sequence that is easy to form.
  • the minus strand of the micromouth gene (sequence complementary to the base sequence shown in SEQ ID NO: 11) is subject to additional restrictions such as avoidance of a stop codon.
  • the micro gene A polymer library was prepared.
  • the oligonucleotide A which is the basis for polymerization, KY-1197 consisting of the nucleotide sequence shown in SEQ ID NO: 12 was used as an oligonucleotide ⁇ , and —-1198 consisting of the nucleotide sequence shown in SEQ ID NO: 13 was synthesized and used.
  • the 10 nucleotides on the 3 'side of the oligonucleotide 34 consisting of 34 nucleotides and the 10 residues on the 3' side of oligonucleotide B consisting of 36 nucleotides are complementary to each other except for the 3 'end. It is configured as a typical arrangement.
  • the conditions for the polymerization reaction using oligonucleotide A and oligonucleotide B are as follows for a reaction volume of 50 L.
  • DNA polymerase (“Vent R ” manufactured by New England Biolabs) was added for 5.2 units.
  • the polymerization reaction was carried out using a Perkin-Elma 2400 GeneAmp PCR system.
  • the reaction conditions were as follows: heat denaturation at 94 ° C for 10 seconds; cycle at 66 ° C for 60 seconds to perform chaining and elongation; repeat 55 cycles, last elongation at 66 ° C For 7 minutes.
  • the artificial gene of the present invention obtained as a polymerization reaction product was cloned into the plasmid vector pTZ19R (Protein Eng., 1: 67-74, 1986), and the nucleotide sequence of the inserted D ⁇ fragment was sequenced. Decision using one quencher (Perkin Elma) Was. Some of the cloned DNA fragments are shown in FIG.
  • the inserted base sequence of PTH127 shown in FIG. 3 is shown in SEQ ID NO: 14, the inserted base sequence of pTH145 is shown in SEQ ID NO: 15, and the inserted base sequence of pTH171 is shown in SEQ ID NO: 1.
  • 6 shows the inserted base sequence of pTH176 in SEQ ID NO: 17, respectively.
  • SEQ ID NO: 1 was obtained by culturing Escherichia coli into which the expression plasmid vector pTH177 to pTH200 into which the artificial gene was inserted under the presence of IPTG as an expression inducing agent.
  • SEQ ID NO: 1 was obtained. Human proteins having all or a part of the amino acid sequence shown were obtained.
  • amino acid sequence of the protein produced from pTH184 thus obtained was cloned into SEQ ID NO: 20 and the artificial gene inserted into pTH176 was recloned into pKS601 to obtain pTH1 SEQ ID NO: 21 shows the amino acid sequence of the protein produced from 85.
  • the expression vector pTH177-pTH200 into which the 24 artificial genes were inserted was introduced into Escherichia coli XL1B1ue strain, and after induction with IPTG, 15-25% gradient
  • the cell extract was analyzed by SDS polyacrylamide gel electrophoresis.
  • Fig. 5 shows the results.
  • the molecular weight markers in Fig. 5 are 97,400, 66,267, 42,400, 30,000, 0,100, 0,14,40 0, and the artificial protein that is a translation product of the human gene is indicated by a “Hata” mark.
  • the expression vectors pKS600-pKS605 are of the type that adds a polyhistidine residue to the N-terminus, and uses a resin that has an affinity for this polyhistidine region. By doing so, purification is possible.
  • FIG. 6 shows the results of purifying pTH184 and pTH185 from the human protein observed in FIG. 5 using TALON resin manufactured by Kokutech.
  • Example 2
  • the gene product called HIV tat has a protein transduction (protein transduction) activity that is introduced into cells when it is brought into contact with cells.
  • the N-terminal sequence is a protein transduction. It has been reported that this amino acid sequence is fused to the N-terminus of various proteins, and that the protein is introduced into cells (Science, 285: 1569-1572, 1999), which is involved in the activity of the protein. So, the array number Using the amino acid sequence at the N-terminus shown in No. 22 as starting information, the microgene was designed in the same manner as in Example 1 according to the flow of FIG.
  • the second reading frame forms the amino acid sequence represented by SEQ ID NO: 22 having protein transduction activity, and the first reading frame forms an ⁇ -helix structure.
  • the amino acid sequence represented by SEQ ID NO: 24 is easily encoded.
  • Noxa protein with a “ ⁇ ⁇ 3” motif which is known as a motif of several proteins in the apoptotic signal transduction system, is artificially introduced into cells using an adenovirus vector, cell death occurs. It is known to be induced (Science, 288: 1053-1058, 2000).
  • This Noxa protein is composed of 100 amino acid residues, has low conservation between species in regions other than the “BH3” motif, and is a protein rich in splice helix.
  • the “BH 3” motif was used as an amino acid sequence having a cell death inducing activity.
  • the microgene was designed in the same manner as in Example 1 according to the flow of FIG.
  • the microgene having the nucleotide sequence represented by SEQ ID NO: 26 has the amino acid sequence represented by SEQ ID NO: 25 in which the first reading frame is considered to have cell death inducing activity, and the third reading frame has the helix structure. Each of them encodes an amino acid sequence represented by SEQ ID NO: 27 which is easily formed.
  • the gene "design-26" was designed.
  • the first reading frame (SEQ ID NO: 29) of Mike mouth gene “Design-26” is composed of an amino acid sequence that easily forms an ⁇ -helix structure and a “ ⁇ ⁇ 3” motif, and It is likely to have similar activity.
  • the second reading frame (SEQ ID NO: 30) contains an amino acid sequence having a protein transduction activity
  • the third reading frame (SEQ ID NO: 31) has an amino acid sequence that easily forms a helical structure. It is included.
  • a microgene “Design-27” having different reading frames for protein transduction activity and cell death-inducing activity was constructed in the same manner as in Example 2.
  • the first reading frame (SEQ ID NO: 33) of the microgene “Design—27” having the nucleotide sequence represented by SEQ ID NO: 32 has an amino acid sequence that easily forms a helical structure and a “BH 3” motif. It is likely to have similar activity to the above Noxa protein.
  • the third reading frame (SEQ ID NO: 34) is composed of an amino acid sequence having a protein transduction activity and an amino acid sequence that easily forms a helical structure.
  • the multifunctional base sequence having two or more functions when the reading frame of the base sequence is different according to the present invention ⁇ using an artificial gene in which the multifunctional base sequence is linked so that a plurality of reading frames appear. Then, we can find (create) an industrially useful human protein that does not exist in nature.
  • the present invention also relates to the field of material engineering, such as the production of protein-stimulated responsive gels and nanoscale protein structures capable of self-assembly, and the motifs of adhered proteins. It can be applied in the field of regenerative medicine, such as creation of artificial matrix proteins that serve as the basis for growth.

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Virology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Oncology (AREA)
  • Communicable Diseases (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • AIDS & HIV (AREA)
  • Immunology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Description

明 細 書 多機能塩基配列及びそれを含む人工遺伝子 技術分野
本発明は、 塩基配列の読み枠を異にした場合に 2以上の機能を有する 多機能塩基配列や、 該多機能塩基配列が複数の読み枠が出現するように 結合している人工遺伝子や、 該人工遺伝子の翻訳産物である人工タンパ ク質又はその誘導体等に関する。 背景技術
分子進化工学の誕生により、 生命反応の根幹を形成するタンパク質あ るいはそれらをコードする遺伝子 DNAを、 実験室の中で人工的に創り 出すことが行われている。 この技術により、 自然には存在しない新たな 活性を持った酵素 · タンパク質や、 天然のタンパク質とは大きく構造の 異なるタンパク質を産み出すことが可能となり、 医療領域や工学領域へ の様々な応用が期待されている。 分子進化工学では、 タンパク質又はそ れをコ一ドする遺伝子を構成するアミノ酸又はヌクレオチドのブロック 単位のランダムな重合体プールの中から、 目的とする活性を持つ分子を 選び出す操作が行われる。 例えば、 Szostak らのグループは、 1 0 0塩 基の長さをもつランダムな配列をもった DN A集団を DN A合成機で作 製し、 この DNA集団をインビトロで RNAに転写し、 1 013の多様性 をもつ RNA集団を用意し、 この RN A集団の中から特定の色素に特異 的に結合する RN A分子を選択し、 どのような配列構造を有する RN A 分子が与え ら れた機能を満足する か につ いて報告 してい る (Nature, 346:818-822, 1990)。 Szostakらのグループはさらに同様のァ ブローチで、 リガーゼ活性といったより複雑な活性をもつ R N A分子を 創出することに成功している (Science, 261: 1411-1418, 1993)。
一方、 遺伝子は小さな遺伝子が繰り返し重合して誕生したのではない 力、とレ う仮説が、あり (Proc.Natl.Acad.Sci.USA,80:3391-3395,1983)、 また、 単純な繰り返し構造に富むポリペプチドは安定な二次構造を取り やすいと考えられるので、 大きなタンパク質や遺伝子を対象とする分子 進化工学では、 短い構造単位を繰り返し重合させ巨大分子を合成する技 術が要求されている (Nature, 367:323-324, 1994)。 短い D N A単位の繰 り返し重合体を得る方法として、 ローリング,サークル合成法が報告さ れている (Proc,Natl,Acad.Sci.USA,92:4641-4645, 1995) S、 この方法は リン酸化反応、 連結反応、 重合反応、 二本鎖形成反応などのステップを 何段階も経なければならないため、 反応系が複雑である。
そこで本発明者らは、 効率的かつ単純にマイク口遺伝子の繰り返し重 合体を作製する方法として、 少なくとも一部の配列が互いに相補してい るオリゴヌクレオチド A及びオリゴヌクレオチド Bに、 D N Aポリメラ ーゼを作用させて重合反応を行うことを特徴とするマイク口遺伝子重合 法 (特開平 9 - 3 2 2 7 7 5号公報) を提案している。
また、 絹タンパク質やエラスチン等の天然タンパク質の反復単位に類 似する反復単位を有するアミノ酸ポリマーをコードする D N A (特開平 1 0 - 1 4 5 8 6号公報) や、 繰返しアミノ酸配列を有する人工タンパ ク質をコードする遺伝子カセット(米国特許第 5 0 8 9 4 0 6号明細書) や、 アミノ酸の繰返し配列を有する大ポリベプチド作製用の合成反復 D N A (米国特許第 5 6 4 1 6 4 8号明細書) や、 アミノ酸の繰返し単位 を有するぺプチドをコ一ドする D N A配列 (米国特許第 5 7 7 0 6 9 7 号明細書) や、 アミノ酸の反復配列を含む大ポリペプチド作製用の合成 反復 D N A (米国特許第 5 8 3 0 7 1 3号明細書) が知られている。 ま た、 6つの読み枠の 1つが αヘリックス構造を形成しやすい D N Α断片 をデザインし、 そこから作成したライブラリーが高頻度に安定なタンパ ク質をコードすることや、 同様に、 6つの読み枠の中の 1つが) 3ストラ ン ド構造を形成しやすい D N A断片をデザイ ンする こ とが報告 (Proc,Natl,Acad.Sci.USA,94:3805-3810,1997) されてレ る。
本発明の課題は、 産業上有用な人工タンパク質を創出する上で必要と される、 塩基配列の読み枠を異にした場合に 2以上の機能を有する多機 能塩基配列や、 該多機能塩基配列が複数の読み枠が出現するように結合 している人工遺伝子や、 かかる人工遺伝子の翻訳産物である人エタンパ ク質又はその誘導体等を提供することにある。 発明の開示
D N Aや R N Aといった核酸、 あるいは短いぺプチドを対象とした、 機能性人工分子の創出は、 ランダムな配列をもった D N A集団 (ライブ ラリー) を出発点として、 その中から目的とする機能をもった分子を選 択してくるという基本戦略が採用されるが、 このシステムをそのまま高 分子のタンパク質の創出に用いると、 ランダムな配列をもつた D N Aに 翻訳停止コドン (T A A、 T A G、 T G A ) が高頻度に生じ、 結果的に は短いぺプチドしか産生しないライブラリ一が得られるにすぎず、 夕ン パク質の創出には実際上使用することができない。 しかし、 前記本発明 者によるマイク口遺伝子重合法 (特開平 9 一 3 2 2 7 7 5号公報) によ ると、 マイクロ遺伝子に乱雑さを加えながらタンデムに重合することに より、 得られた重合体は複数の読み枠のコンビナトリアル (組み合わせ 的) な性質をもち、 非常に大きな多様性を有することになる。 しかも、 このマイクロ遺伝子重合法では、 用いるマイクロ遺伝子が、 予めどの読 み枠にも翻訳停止コドンが出現しないようにデザィンすることが可能で あり、 前述した、 ランダムな配列をもった D N Aが高頻度にもつ翻訳停 止コドン問題を回避することができることがわかった。
マイクロ遺伝子重合法で作成されたライブラリーの場合、 分子多様性 をもっとはいうものの、 その全体の性質は、 最初に用いるマイクロ遺伝 子の配列に大きく依存することから、 ブロック単位に用いるマイクロ遺 伝子のデザィンの仕方によっては、 作成される人工遺伝子ライブラリー をある方向に特化することが可能となる。 しかし、 例えば、 免疫活性が 十分強いエイズウイルス中和抗原タンパク質、 基本免疫を賦活化する活 性のある人工タンパク質、 単核ファゴサイ トから T N F—ひの放出を誘 導しかっ血中で安定な人工タンパク質、 ヒトの免疫系の監視をすり抜け るような人工タンパク質骨格等の生物機能を有する人工タンパク質を作 製するのに必要なマイクロ遺伝子をデザィンするためには、 高速計算機 やゲノム情報を十分に利用することが必要であることもわかった。
以上の知見に基づいて、 本発明者は、 機能性人工タンパク質を発現す ることができる人工遺伝子をマイクロ遺伝子重合法により創出すること ができないかと考え、 エイズウイルス中和抗原タンパク質を基本生物機 能として有し、 これに加えてひヘリックス構造を形成しやすい性質など 二次構造を形成しやすいという生物機能を有するぺプチドを異なる読み 枠にコードする複数生物機能を有する単一マイクロ遺伝子を計算科学的 手法によりデザインすることを試みた。 なお、 エイズウイルス中和抗原 タンパク質と《ヘリックス形成能力を 2つの生物機能として選んだのは, エイズウイルスのもつ g p 1 2 0タンパク質のループ 3と呼ばれる領域 に対する抗体のいくつかがウィルス中和活性をもつことや、 通常該ル一 プ 3領域が g 1 2 0タンパク質の内部に隠れており該ループ 3に対す る抗体が得にくいことや、 合成したループ 3中和抗原ペプチドでは免疫 原性が弱く抗体が期待したようには得られないことがよく知られており, 少なくともいくつかの部分でループ 3ぺプチド配列を有し、 全体が αへ リックス骨格で安定に支えられている免疫原性の強い人工タンパク質を 創出し、 かかる人工タンパク質を免疫源として用いることにより、 中和 抗体の候補となる抗ループ抗体が得られる可能性があるということによ る。
まず、 エイズウイルスの中和抗原として知られているペプチド 「RK S I R I QR GP GRTFVT I GK I j を読み枠の 1つにコードする マイクロ遺伝子をデザインすることとした。 例えば、 最初の R (アルギ ニン) には 「C GT」 「C GC」 「C GAJ 「C GG」 「AGA」 「AGG」 の 6つのコドンが対応するがこの中から特定のコドンを選択し、 次の (リシン) には 「AAA」 「AAG」 の 2つのコドンが対応するがこの中 から特定のコ ドンを選択し、 以下同様にして特定のコドンを順次選択し マイクロ遺伝子をデザィンする場合、 上記中和抗原べプチドを読み枠の 1つにコードする塩基配列は、 コドンの縮重から約 1, 6 5 1億種ある ことになる。 また、 単一マイクロ遺伝子はプラス鎖及びマイナス鎖に各 3種の読み枠をもつことから、 6種の異なるペプチドをコードすること ができることになり、 例えば、 同じ方向の異なる 2つの読み枠では、 上 記中和抗原べプチドとは全く異なる 2つのペプチドがコードされること になる。 そこで、 同じ方向の他の読み枠 2つのいずれかで 「二次構造を 形成しやすい」 という性質を有するペプチドをコードする塩基配列を、 上記約 1, 6 5 1億種の塩基配列の中から計算機により検索することに した。
計算機として S u nの E n t e r p r i s e 2 5 0を用いて実行した ところ、 約 1, 6 5 1億種の塩基配列全てを同時に計算するには無理が あることがわかったので、 上記中和抗原ペプチドの両端を削除した 「 I R I QR GP GRTFVTJ の 1 3個のアミノ酸からなるぺプチドにつ いて計算することとした。 1つの読み枠でこのべプチドをコードする可 能性のある塩基配列を全て計算機内に書き出したところ、 約 5億種の塩 基配列が作成された。 これら 5億種の塩基配列の、 同じ方向の他の 2つ の読み枠を翻訳し、 終止コドンが現れて翻訳が途中でストップするもの や、 ペプチド配列として重複するものを除いた、 約 1, 5 0 6万種のぺ プチド配列の集団を計算機の中に作成した。 次に、 この約 1, 5 0 6万 種のペプチドの中から 「二次構造を形成しやすい」 という性質をもつぺ プチドを、 二次構造予測プログラムを用いて個別に計算してスコアづけ を行った。 この計算に 1週間以上要したが、 得られた結果をスコアの高 い順にソートしたところ、 第 2読み枠で αヘリックスを非常に形成しや すい塩基配列として、 「ATAC GCATT CAGAGAGG C C C T GGC C GCACTTTTGTTACTJ を選択することができた。 上記計算は、 エイズウイルス中和抗原べプチド 2 0アミノ酸残基の真 ん中部分 1 3アミノ酸残基について実施したので、 未計算の両端部分に ついても同様の計算をおこない、 それらの結果を合わせてマイクロ遺伝 子 「デザイン一 2 5」 を得ることができた。 このマイクロ遺伝子 「デザ イン一 2 5」 は、 その読み枠の 1つに中和抗原配列をコードし、 他の読 み枠 2つに終止コドンをもたず、 さらに、 そのうちの 1つに αヘリック スを形成しやすい性質のぺプチドをコードし、 「エイズウイルス中和抗 原性」 と 「構造形成能力」 といった 2つの生物機能構造が潜源化したマ イク口遺伝子ということができる。 次に、 かかるマイクロ遺伝子 「デザ イン一 2 5」 を、 前記本発明者によるマイクロ遺伝子重合法 (特開平 9 - 3 2 2 7 7 5号公報) を利用して重合し、 「中和抗原配列」 と 「ひヘリ ックスを形成しやすい配列」 とが複雑に組み合わさった種々の人工遺伝 子からなる人工遺伝子ライブラリーを作製した。 これら人工遺伝子ライ ブラリーを用いて種々の人工タンパク質を大腸菌で発現させ、 全体とし てはひヘリックスの構造に支えられながら、 その中のところどころにェ ィズウィルス中和抗原配列をもつ人工夕ンパク質が得られることを確認 し、 本発明を完成するに至った。
すなわち本発明は、 塩基配列の読み枠を異にした場合、 該塩基配列が 2以上の機能を有することを特徴とする多機能塩基配列(請求項 1 )や、 塩基配列が、 2本鎖の塩基配列であることを特徴とする請求項 1記載の 多機能塩基配列 (請求項 2 ) や、 塩基配列が、 D N Aであることを特徴 とする請求項 1又は 2記載の多機能塩基配列 (請求項 3 ) や、 塩基配列 が、 R N Aであることを特徴とする請求項 1又は 2記載の多機能塩基配 列 (請求項 4 ) や、 塩基配列が、 線状の塩基配列であることを特徴とす る請求項 1〜4のいずれか記載の多機能塩基配列 (請求項 5 ) や、 塩基 配列の読み枠が、 1つずつずれた 3つの読み枠のすべてにストップコド ンが存在しないことを特徴とする請求項 1〜 5のいずれか記載の多機能 塩基配列 (請求項 6 ) や、 塩基配列の 6つの読み枠のすべてにストップ コドンが存在しないことを特徴とする請求項 2〜 6のいずれか記載の多 機能塩基配列 (請求項 7 ) や、 多機能塩基配列を重合したときの連結部 にストップコドンが生起することがないことを特徴とする請求項 6又は 7記載の多機能塩基配列 (請求項 8 ) や、 2以上の機能が、 2以上の生 物機能であることを特徴とする請求項 1〜 8のいずれか記載の多機能塩 基配列 (請求項 9 ) や、 生物機能が、 二次構造を形成しやすい機能、 中 和抗体を誘導する抗原機能、 免疫を賦活化する機能、 細胞増殖を促進又 は抑制する機能、 癌細胞を特異的に認識する機能、 プロテイン · トラン スダクシヨン機能、 細胞死誘導機能、 抗原決定残基呈示機能、 金属結合 機能、 補酵素結合機能、 触媒活性機能、 蛍光発色活性機能、 特定の受容 体に結合してその受容体を活性化する機能、 信号伝達に関わる特定の因 子に結合してその働きをモジュレートする機能、 生体高分子を特異的に 認識する機能、 細胞接着機能、細胞外へタンパク質を局在化させる機能、 特定の細胞内小器官にターゲッ トする機能、細胞膜に埋め込まれる機能、 アミロイド繊維形成機能、 繊維性タンパク質の形成機能、 タンパク質性 ゲル形成機能、 タンパク質性フィルム形成機能、 単分子膜形成機能、 自 己集合機能、 粒子形成機能、 又は、 他のタンパク質の高次構造形成を補 助する機能であることを特徴とする請求項 9記載多機能塩基配列 (請求 項 1 0 ) や、 塩基配列が、 1 5〜 5 0 0の塩基又は塩基対からなること を特徴とする請求項 1〜 1 0のいずれか記載の多機能塩基配列 (請求項 1 1 ) や、 多機能塩基配列を重合するための修飾が施されていることを 特徴とする請求項 1〜 1 1のいずれか記載の多機能塩基配列 (請求項 1 2 ) や、 天然由来の塩基配列が結合されていることを特徴とする請求項 1〜 1 2のいずれか記載の多機能塩基配列 (請求項 1 3 ) に関する。 また本発明は、 所定の機能を有するアミノ酸配列をコードする塩基配 列のすべての組合せの中から、 前記所定の機能を有するアミノ酸配列の 読み枠とは異なる読み枠において、 前記所定の機能と同一又は異なる機 能を有する塩基配列を選択することを特徴とする 2以上の機能を有する 多機能塩基配列の製造方法 (請求項 1 4 ) や、 所定の機能と同一又は異 なる機能を有する塩基配列を、 計算科学的手法により選択することを特 徴とする請求項 1 4記載の 2以上の機能を有する多機能塩基配列の製造 方法 (請求項 1 5 ) や、 計算科学的手法が、 生物機能予測プログラムを 用いたときのスコア一によって評価 ·選択する手法であることを特徴と する請求項 1 5記載の 2以上の機能を有する多機能塩基配列の製造方法 (請求項 1 6 ) や、 塩基配列が、 2本鎖の塩基配列であることを特徴と する請求項 1 4〜 1 6のいずれか記載の 2以上の機能を有する多機能塩 基配列の製造方法 (請求項 1 7 ) や、 塩基配列が、 D N Aであることを 特徴とする請求項 1 4〜 1 7のいずれか記載の 2以上の機能を有する多 機能塩基配列の製造方法 (請求項 1 8 ) や、 塩基配列が、 R N Aである ことを特徴とする請求項 1 4〜 1 7のいずれか記載の 2以上の機能を有 する多機能塩基配列の製造方法 (請求項 1 9 ) や、 塩基配列が、 線状の 塩基配列であることを特徴とする請求項 1 4〜 1 9のいずれか記載の 2 以上の機能を有する多機能塩基配列の製造方法 (請求項 2 0 ) や、 塩基 配列の読み枠が、 1つずつずれた 3つの読み枠のすべてにストップコド ンが存在しないことを特徴とする請求項 1 4〜2 0のいずれか記載の 2 以上の機能を有する多機能塩基配列の製造方法 (請求項 2 1 ) や、 塩基 配列の 6つの読み枠のすべてにストップコドンが存在しないことことを 特徴とする請求項 1 7〜 2 1のいずれか記載の 2以上の機能を有する多 機能塩基配列の製造方法 (請求項 2 2 ) や、 多機能塩基配列を重合した ときの連結部にストップコドンが生起することがないことを特徴とする 請求項 2 1又は 2 2記載の 2以上の機能を有する多機能塩基配列の製造 方法 (請求項 2 3 ) や、 2以上の機能が、 2以上の生物機能を有するこ とを特徴とする請求項 1 4〜 2 3のいずれか記載の 2以上の機能を有す る多機能塩基配列の製造方法 (請求項 2 4 ) や、 生物機能が、 二次構造 を形成しやすい機能、 中和抗体を誘導する抗原機能、 免疫を賦活化する 機能、 細胞増殖を促進又は抑制する機能、 癌細胞を特異的に認識する機 能、 プロテイン, トランスダクシヨン機能、 細胞死誘導機能、 抗原決定 残基呈示機能、 金属結合機能、 補酵素結合機能、 触媒活性機能、 蛍光発 色活性機能、 特定の受容体に結合してその受容体を活性化する機能、 信 号伝達に関わる特定の因子に結合してその働きをモジユレ一トする機能, 生体高分子を特異的に認識する機能、 細胞接着機能、 細胞外へタンパク 質を局在化させる機能、 特定の細胞内小器官にターゲッ トする機能、 細 胞膜に埋め込まれる機能、 アミロイ ド繊維形成機能、 繊維性タンパク質 の形成機能、 タンパク質性ゲル形成機能、 タンパク質性フィルム形成機 能、 単分子膜形成機能、 自己集合機能、 粒子形成機能、 又は、 他のタン パク質の高次構造形成を補助する機能であることを特徴とする請求項 2 4記載の 2以上の機能を有する多機能塩基配列の製造方法(請求項 2 5 ) や、 塩基配列が、 1 5〜 5 0 0の塩基又は塩基対からなることを特徴と する請求項 1 4〜 2 5のいずれか記載の 2以上の機能を有する多機能塩 基配列の製造方法 (請求項 2 6) や、 さらに多機能塩基配列を重合する ための修飾を施すことを特徴とする請求項 1 4〜 2 6のいずれか記載の 2以上の機能を有する多機能塩基配列の製造方法 (請求項 2 7) や、 さ らに天然由来の塩基配列を結合することを特徴とする請求項 1 4〜 2 7 のいずれか記載の 2以上の機能を有する多機能塩基配列の製造方法 (請 求項 2 8 ) や、 請求項 1 4〜 2 8のいずれか記載の 2以上の機能を有す る多機能塩基配列の製造方法により製造することができる 2以上の機能 を有する多機能塩基配列 (請求項 2 9) に関する。
さらに本発明は、 請求項 1〜 1 3のいずれか記載又は請求項 2 9記載 の多機能塩基配列の 1種又は 2種以上が、 複数の読み枠が出現するよう に結合していることを特徵とする人工遺伝子 (請求項 3 0) や、 3 0〜 1 0 0 0 0 0の塩基又は塩基対からなることを特徴とする請求項 3 0記 載の人工遺伝子 (請求項 3 1 ) や、 請求項 1〜 1 3のいずれか記載又は 請求項 2 9記載の多機能塩基配列の 1種又は 2種以上を、 複数の読み枠 が出現するようにコンビナトリアルに重合することを特徴とする人工遺 伝子の製造方法 (請求項 3 2) や、 2本鎖多機能塩基配列の一端に特定 の DNA配列 「A」、 他端に特定の DNA配列 「B」 を付加し、 DNA配 列 「Aj 及び 「B」 にそれぞれ相補的な配列を少なくとも一部含む DN A配列 「a」 及び 「b」 を調製し、 該 DNA配列 「 a」 と 「b」 とが連 結した一本鎖 DN Aを用いて前記 2本鎖多機能塩基配列のリガーゼ反応 を行うことを特徴とする請求項 3 2記載の人工遺伝子の製造方法 (請求 項 3 3 ) や、 多機能塩基配列の全部又は一部からなり、 少なくとも一部 の配列が互いに相補している 2つの塩基配列にポリメラーゼを作用させ てポリメラ一ゼ連鎖反応を行うことを特徴とする請求項 3 2記載の人工 遺伝子の製造方法 (請求項 3 4 ) や、 請求項 3 0又は 3 1記載の人工遺 伝子が発現ベクターに組み込まれていることを特徴とする人工遺伝子発 現ベクター (請求項 3 5 ) や、 人工遺伝子が、 天然遺伝子と結合された 人工遺伝子であることを特徴とする請求項 3 5記載の人工遺伝子発現べ クタ一 (請求項 3 6 ) や、 請求項 3 5又は 3 6記載の人工遺伝子発現べ クタ一が宿主細胞に導入されていることを特徴とする人工遺伝子発現べ クタ一含有細胞 (請求項 3 7 ) や、 宿主細胞が大腸菌であることを特徴 とする請求項 3 7記載の人工遺伝子発現べクタ一含有細胞(請求項 3 8 ) や、 請求項 3 0又は 3 1記載の人工遺伝子の翻訳産物として得られるこ とを特徴とする人工タンパク質又はその誘導体 (請求項 3 9 ) や、 翻訳 が、 無細胞発現系で行われることを特徴とする請求項 3 9記載の人エタ ンパク質又はその誘導体 (請求項 4 0 ) や、 翻訳が、 細胞発現系で行わ れることを特徴とする請求項 3 9記載の人工タンパク質又はその誘導体 (請求項 4 1 ) や、 細胞が、 請求項 3 7又は 3 8記載の人工遺伝子発現 ベクタ一含有細胞であることを特徴とする請求項 4 1記載の人工タンパ ク質又はその誘導体 (請求項 4 2 ) や、 人工タンパク質の誘導体が、 人 ェ糖タンパク質、 人工ホスホリピッドプロテイン、 人工ポリエチレング リコール修飾タンパク質、 人工ボルフイ リン結合タンパク質又は人エフ ラビン結合タンパク質であることを特徴とする請求項 3 9〜4 2のいず れか記載の人工タンパク質又はその誘導体 (請求項 4 3 ) や、 請求項 3 0又は 3 1記載の人工遺伝子の翻訳産物の中から機能性分子をスクリー ニングすることを特徴とする人エタンパク質又はその誘導体の製造方法 (請求項 4 4 ) や、 請求項 3 9〜4 3のいずれか記載の人工タンパク質 又はその誘導体と、 マーカ一タンパク質及び Z又はべプチドタグとを結 合させた融合タンパク質又はその誘導体 (請求項 4 5 ) や、 請求項 3 9 〜4 3のいずれか記載の人工タンパク質又はその誘導体発現能を有する トランスジエニック非ヒト動物 (請求項 4 6 ) や、 請求項 3 9〜 4 3の いずれか記載の人エタンパク質又はその誘導体発現能を有するトランス ジエニック植物 (請求項 4 7 ) や、 請求項 3 9〜 4 3のいずれか記載の 人工タンパク質又はその誘導体を有効成分として含有することを特徴と する各種疾病に対する治療薬 (請求項 4 8 ) や、 請求項 3 9〜4 3のい ずれか記載の人工夕ンパク質又はその誘導体を有効成分として含有する ことを特徴とする各種疾病に対する診断薬 (請求項 4 9 ) や、 請求項 3 9〜 4 3のいずれか記載の人エタンパク質又はその誘導体を有効成分と して含有することを特徴とする人工生体組織 (請求項 5 0 ) や、 請求項 3 9〜 4 3のいずれか記載の人工タンパク質又はその誘導体を有効成分 として含有することを特徴とする人工夕ンパク質性高分子材料 (請求項 5 1 ) に関する。 図面の簡単な説明
第 1図は、 マイクロ遺伝子の自動デザィンの計算作業のフローの一例 を示す図である。
第 2図は、 デザインされた本発明の 2本鎖多機能 D N A配列からなる マイク口遺伝子とそれがコ一ドするアミノ酸配列を示す図である。
第 3図は、デザインされた本発明の人工遺伝子の一例を示す図である。 第 4図は、 デザィンされた本発明の人工タンパク質の一例を示す図で める。
第 5図は、 デザインされた本発明の人工遺伝子由来の人工タンパク質 を発現する大腸菌粗抽出液の S D Sポリアクリルアミ ドゲル電気泳動の 結果を示す図である。
第 6図は、 デザィンされた本発明の人工遺伝子由来の人工夕ンパク質 精製物の S D Sポリアクリルアミ ドゲル電気泳動の結果を示す図である, 発明を実施するための最良の形態
本発明の多機能塩基配列としては、塩基配列の読み枠を異にした場合、 該塩基配列が 2以上の機能を有する塩基配列であれば特に制限されるも のではなく、 塩基配列としては、 1本鎖又は 2本鎖の D N A配列又は R N A配列を具体的に例示することができ、 また、 これらは線状構造ある いは環状構造のどちらでもよいが、 重合方法が確立されている線状構造 のものが好ましい。 また、 本発明の多機能塩基配列としては、 塩基配列 の読み枠が 1つずつずれた 3つの読み枠のすべてにストップコドンが存 在しないことが、 特に 2本鎖からなる塩基配列の場合は塩基配列の 6つ の読み枠のすべてにストップコドンが存在しないことが好ましい。 さら に、 かかる多機能塩基配列を重合したときの連結部 (結合部) にストツ プコドンが生起することがない塩基配列が特に好ましい。
本発明の多機能塩基配列が有する機能は、 その塩基配列の全部又は一 部の翻訳産物が有する機能と、 その全部又は一部の塩基配列自体が有す る機能に大別することができ、 上記翻訳産物が有する機能としては、 ひ ヘリックス形成等の二次構造を形成しやすい機能、 ウィルス等の中和抗 体 を 誘 導 す る 抗原機 能 、 免 疫 賦活 化 す る 機 能 ( Nature Medicine, 3: 1266-1270, 1997) 細胞増殖を促進又は抑制する機能、 癌細 胞を特異的に認識する機能、 プロテイン · トランスダクシヨン機能、 細 胞死誘導機能、 抗原決定残基呈示機能、 金属結合機能、 補酵素結合機能、 触媒活性機能、 蛍光発色活性機能、 特定の受容体に結合してその受容体 を活性化する機能、 信号伝達に関わる特定の因子に結合してその働きを
3 モジユレ一トする機能、 タンパク質, D N A , R N A , 糖などの生体高 分子を特異的に認識する機能、 細胞接着機能、 細胞外へタンパク質を局 在化させる機能、 特定の細胞内小器官 (ミ トコンドリア、 葉緑体、 E R など) にターゲッ トする機能、 細胞膜に埋め込まれる機能、 アミロイ ド 繊維形成機能、 繊維性タンパク質の形成機能、 タンパク質性ゲル形成機 能、 タンパク質性フィルム形成機能、 単分子膜形成機能、 自己集合機能、 粒子形成機能、 他のタンパク質の高次構造形成を補助する機能等を具体 的に例示することができる。 なお、 本発明において 「生物機能」 という 用語は、 これら 「塩基配列の全部又は一部の翻訳産物が有する機能」 を 意味する。 また、 上記塩基配列そのものが有する機能としては、 金属結 合機能、 補酵素結合機能、 触媒活性機能、 特定の受容体に結合してその 受容体を活性化する機能、 信号伝達に関わる特定の因子に結合してその 働きをモジュレートする機能、 タンパク質, D N A , R N A , 糖などの 生体高分子を特異的に認識する機能、 R N Aを安定化させる機能、 翻訳 の効率をモジユレ一卜する機能、 特定遺伝子の発現を抑制する機能など を例示することができる。
本発明の 2以上の機能を有する多機能塩基配列の製造方法としては、 所定の機能を有するアミノ酸配列をコ一ドする塩基配列のすべての組合 せの中から、 前記所定の機能を有するアミノ酸配列の読み枠とは異なる 読み枠において、 前記所定の機能と同一又は異なる機能を有する塩基配 列を選択する多機能塩基配列の製造方法であれば特に制限されるもので はないが、 所定の機能としては前記の生物機能が好ましく、 また所定の 機能と異なる生物機能が多様性を与えうる点で好ましい。 上記所定の機 能を有するアミノ酸配列としては、 所定の機能を有するアミノ酸配列で あれば全て包含され、 単一のアミノ酸配列に限定されるものではなく、 例えば所定の機能を有するアミノ酸配列が 3つ存在する場合には、 該 3 つのアミノ酸配列をコードする塩基配列のすべての組合せの中から、 多 機能塩基配列が選択されることになる。 かかる所定の機能を有するアミ ノ酸配列としては、 例えば前記エイズウイルス中和抗原の配列や、 白血 球に対するサイ トカインであるひケモカインがもつ G 1 u - L e u - A r g等のモチーフ構造などの既知の配列の他に、 該既知配列に 1又は 2 以上のアミノ酸が欠失、 置換又は付加され、 かつ該既知配列と同様な機 能を有する配列や、 各生物間でよく保存されている特定の生物機能に関 する共通配列や、 既存のヒトタンパク質に忌避されているアミノ酸配列 からなるヒト免疫系の監視をすり抜ける可能性がある配列など未知の配 列を例示することができる。
本発明の多機能塩基配列の大きさとしては特に制限されるものではな いが、 1 5〜 5 0 0の塩基又は塩基対、 特に 1 5〜 2 0 0の塩基又は塩 基対、 さらに 1 5〜 1 0 0の塩基又は塩基対の大きさの塩基配列が、 D N A合成を安定して行えるという点で好ましい。 また、 本発明の多機能 塩基配列として、 前記マイクロ遺伝子のランダム重合体作成方法 (特開 平 9 一 1 5 4 5 8 5号公報) やマイクロ遺伝子重合法 (特開平 9 一 3 2 2 7 7 5号公報) 等により重合するための修飾が施されている多機能塩 基配列や、 天然由来の塩基配列が結合されている多機能塩基配列を用い ることもできる。
そして、 所定の機能と同一又は異なる生物機能を有する塩基配列は、 コンピュータ一を用いる計算科学的手法により選択することができ、 よ り具体的には、 生物機能予測プログラムを用いたときのスコア一によつ て選択する手法を例示することができる。 上記生物機能予測プログラム としては、 夕ンパク質やべプチドの生物機能とタンパク質やべプチドの —次構造との相関を統計的に処理して作成したプログラムを例示するこ とができ、 例えば、 ペプチドの二次構造形成能力は文献 (S t ruc tur e, Func t i on, and Gene t i c s 27 : 36-46 , 1997) 記載の方法を用いて評価する ことができる。この方法を用いることにより与えられたぺプチド配列の、 各残基位置での予想される αヘリックス、 βストランドの形成可能性が 数値化される (可能性が高いほど大きな値)。与えられたぺプチド配列の 全ての残基の、 αヘリックス、 ]3ストランドの形成可能性値をそれぞれ 合計した値を、 与えられたぺプチド配列のひヘリックスの形成のしゃす さ、 ]3ストランドの形成のしゃすさの値として計算し、 評価に用いるこ とができる。 その他、 機能予測プログラムとして、 例えば 「PROSITE」 (Nucleic Acids Res.,27:215-219,1999)に登録されている既知のモチ一 フとの類似性を検出する場合における 「Motiffindプログラム」 (Protein Sci.,5: 1991-1999, 1996)等のタンパク質ファミリーデ一夕べ一スゃ、天然 夕ンパク質との類似性から機能を予測する場合における類似性検索プロ グラム 「blast」 (J.Mol.Biol., 215:403-410, 1990)や、 信号伝達系のいろい ろなタンパク質因子との類似性を計算する場合における 「SMART」 プ ログラム(Proc.Natl.Acad.Sci.USA,95:5857-5864, 1998)や、 細胞外や細 胞内小器官へタンパク質を局在化させる能力を評価する場合における 「PSORT」 プログラム(Biochem. Sci.,24:34-35, 1999) や、 細胞膜に埋め 込まれる能力を評価する場合における 「 SOSUI」 プロ グラム (Bioinformatics, 4:378-379, 1998)¾どを挙げることができる。
また、 種類の異なる 2以上の多機能塩基配列をリガーゼ等を用いて結 合させることにより、 あるいは多機能塩基配列と天然由来の塩基配列と をリガーゼ等を用いて結合させて本発明の多機能塩基配列とすることも できる。 また、 本発明の多機能塩基配列の一部を個別に作製し、 その後 これらをリガーゼ等を用いて結合させることにより本発明の多機能塩基 配列とすることもできる。 そして、 以上の本発明の多機能塩基配列の製 造方法により製造される 2以上の機能を有する多機能塩基配列もまた、
6 本発明の多機能塩基配列に含まれる。
本発明の人工遺伝子は、上記の多機能塩基配列の 1種又は 2種以上を、 複数の読み枠が出現するようにコンビナトリアルに重合することにより 製造することができる。 複数の読み枠が出現するようにコンビナトリア ルに重合する方法としては、 前述の本発明者により開発された特開平 9 - 1 5 45 8 5号公報記載の方法、 すなわち 2本鎖多機能塩基配列の両 端に互いに異なる特定の D N A配列を付加し、 この特定の D N A配列に それぞれ相補的な配列を少なくとも一部含む DN A配列を調製し、 該そ れぞれ調製した DN A配列を連結した一本鎖 DN Aを用いて前記多機能 塩基配列のリガーゼ反応を行うことを特徴とする複数のマイクロ遺伝子 を用いるマイク口遺伝子のランダム重合方法や、 特開平 9一 3 2 2 7 7 5号公報記載の方法、 すなわち少なくとも一部の配列が互いに相補して いるオリゴヌクレオチド A及びオリゴヌクレオチド Bに、 D N Aポリメ ラ一ゼを作用させてポリメラ一ゼ連鎖反応を行うことを特徴とする単一 マイク口遺伝子を繰り返し重複するマイクロ遺伝子重合法を具体的に例 示することができる。
本発明の人工遺伝子発現ベクターとしては、 組み込まれた人工遺伝子 を目的細胞等で発現し得る発現ベクターであれば特に制限されるもので はなく、 発現べクタ一としては、 例えば p KC 3 0、 p T r c 9 9 A、 p B l u e s c r i p t IL p S V 2— n e o、 p CAGG S、 p c D L - S R « 2 9 6、 p G— 1、 pA c 3 7 3、 p Q E - 9 p ET— 3 a等の発現ベクターを具体的に挙げることができる。 前記ベクターは 必要に応じて複製起点、 選択マーカー、 プロモーターや、 必要に応じて RN Aスプライス部位、 ポリアデニル化シグナル等が付加されていても よい。 上記複製起点としては、 S V 4 0、 アデノウイルス、 ゥシパピ口 —マウィルス、 C o l E l、 R因子、 F因子、 AR S 1等の由来のもの
7 を例示することができ、 プロモ一夕一としては、 レトロウイルス、 ポリ ォ一マウィルス、 アデノウイルス、 S V 4 0等のウィルス由来のプロモ 一夕一や、 染色体由来の E F 1— αプロモーターや、 バクテリオファー ジ λ由来のプロモーターや、 t r p、 1 ρ ρ、 l a c , t a c等のプロ モーターを例示することができる。 また、選択マ一力一遺伝子としては、 本発明の人工遺伝子発現ベクター含有細胞をスクリーニングすることが できるものであればどのようなものでもよく、 例えば、 ネオマイシン耐 性遺伝子、 ピュー口マイシン耐性遺伝子、ハイグロマイシン耐性遺伝子、 ジフテリアトキシン耐性遺伝子、 0 _ g a 1 と n e o Rの融合遺伝子( β _ g e ο)、 カナマイシン耐性遺伝子、 アンピシリン耐性遺伝子、 テトラ サイクリン耐性遺伝子等を具体的に挙げることができる。
また、 上記人工遺伝子として、 生物活性を有するペプチドをコードす る遺伝子や GF Ρ等の標識物質をコードする遺伝子などの天然遺伝子が 適宜位置関係、 例えば上流域、 下流域、 中間域で、 適宜割合で結合され たものを用いることもできる。 この場合の天然遺伝子として、 用いる発 現ベクターに予め組み込まれている天然遺伝子を使用することもできる t 本発明の人工遺伝子発現ベクター含有細胞としては、 上記人工遺伝子 発現べクタ一が導入されている宿主細胞であれば特に制限されるもので はなく、 かかる宿主細胞としては、 動物細胞、 植物細胞、 微生物細胞を 挙げることができる。 上記動物細胞としては、 ドロソフイラ S 2、 スポ ドプテラ S f 9等の昆虫細胞や、 L細胞、 CHO細胞、 CO S細胞、 H e L a細胞、 C 1 2 7細胞、 BAL BZc 3 T 3細胞 (ジヒドロ葉酸レ ダク夕ーゼゃチミジンキナーゼなどを欠損した変異株を含む)、 B HK 2 1細胞、 HEK 2 9 3細胞、 B o w e sメラノーマ細胞等を例示するこ とができ、 植物細胞としては、 シロイヌナズナ、 タバコ、 トウモロコシ、 コムギ、 イネ、 ニンジン、 大豆などから株化した植物細胞等を例示する ことができる。 また、 微生物細胞としては、 大腸菌、 放線菌、 枯草菌、 ストレプトコッカス、 スタフイロコッカス等の細菌原核細胞や、 酵母、 ァスペルギルス等の真菌細胞を例示することができるが、 材料や知見が 豊富でかつストップコドンの 1つアンバーコドン (T A G ) をセリン、 グルタミ ンあるいはチロシンとして翻訳するサブレッサ一変異 (supD,supE,supF) をもっている大腸菌が好ましい。
また、 かかる人工遺伝子発現ベクターの宿主細胞への導入は、 Davis ら (BASIC METHODS IN MOLECULAR BIOLOGY, 1986 ) 及び Sambrook ら (MOLECULAR CLONING: A LABORATORY MANUAL, 2nd Ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989) などの多くの標準的な実験室マニュアルに記載される方法、 例えば、 リン酸カルシウムトランスフエクシヨン、 D E A E—デキスト ラン媒介トランスフエクシヨン、 トランスべクション(transvection)、 マ イク口インジェクション、 カチオン性脂質媒介トランスフエクシヨン、 エレクトロボレ一シヨン、 形質導入、 スクレープローデイング (scrape loading)^ 弾丸導入(ballistic introduction)、 感染等により行うことがで きる。
本発明の人工タンパク質又はその誘導体としては、 上記人工遺伝子の 翻訳産物として得られるタンパク質やその誘導体であれば特に制限され るものではなく、 かかる人工遺伝子の翻訳は、 無細胞発現系あるいは細 胞発現系で行うことができる。 上記無細胞発現系としては、 大腸菌 S 3 0抽出液を用いる無細胞夕ンパク質合成系、 コムギ胚芽無細胞夕ンパク 質合成系等を例示することができ、 また細胞発現系としては前記人工遺 伝子発現べクタ一含有細胞を培養することにより実施することができる t また、 上記人工タンパク質の誘導体としては、 糖タンパク質、 ホスホリ ピッ ドプロテイン、 ポリエチレングリコール修飾タンパク質、 ポルフィ リン結合夕ンパク質、 フラビン結合夕ンパク質などを挙げることができ る。
本発明の融合タンパク質又はその誘導体としては、 人工夕ンパク質又 はその誘導体とマ一力一タンパク質及び Z又はべプチドタグとが結合し ているものであればどのようなものでもよく、 マーカ一タンパク質とし ては、 従来知られているマーカータンパク質であれば特に制限されるも のではなく、 例えば、 アルカリフォスファターゼ、 抗体の F c領域、 H R P、 G F Pなどを具体的に挙げることができ、 またペプチドタグとし ては、 M y cタグ、 H i sタグ、 F L A Gタグ、 G S Tタグなどの従来 知られているペプチドタグを具体的に例示することができる。 かかる融 合タンパク質又はその誘導体は、 常法により作製することができ、 N i 一 N T Aと H i sタグの親和性を利用した人工タンパク質等の精製や、 人工夕ンパク質の検出や、 人エタンパク質等に対するリガンドの定量、 人工タンパク質に関わる疾患の診断用マ一カーなどとして、 また当該分 野の研究用試薬としても有用である。 さらに、 上記人工遺伝子、 人工夕 ンパク質をコードする D N A、 人工タンパク質、 人工タンパク質とマ一 力一タンパク質及び Z又はべプチドタグとを結合させた融合夕ンパク質. 人工遺伝子発現ベクター、 人工遺伝子発現ベクター含有細胞等は、 各種 疾患に対する治療薬に有用である。
本発明のトランスジエニック非ヒト動物としては、 人工タンパク質又 はその誘導体発現能を有する非ヒト動物であれば特に制限されるもので はなく、 また、 本発明のトランスジエニック植物としては、 人工タンパ ク質又はその誘導体発現能を有する植物であれば特に制限されるもので はない。 そして、 本発明における非ヒト動物としては、 マウス、 ラッ ト 等の齧歯目動物などの非ヒト動物を具体的に挙げることができ、 また、 本発明のトランスジエニック植物としては、 イネ、 小麦、 トウモロコシ、 大豆、 タバコ、 ニンジン等の農作物などの植物を具体的に挙げることが できるが、 これらに限定されるものではない。
以下、 人工夕ンパク質又はその誘導体をコ一ドする遺伝子が染色体上 で発現する非ヒト動物の作製方法を、 人工夕ンパク質又はその誘導体の トランスジエニックマウスを例にとって説明する。 例えば、 人工タンパ ク質又はその誘導体のトランスジエニックマウスは、 人工タンパク質又 はその誘導体をコードする D N Aにチキン jS —ァクチン、 マウスニュ一 口フィラメント、 S V 4 0等のプロモータ一、 及びラビット ] 3—グロビ ン、 S V 4 0等のポリ A又はイントロンを融合させて導入遺伝子を構築 し、該導入遺伝子をマウス受精卵の前核にマイクロインジェクションし、 得られた卵細胞を培養した後、 仮親のマウスの輸卵管に移植し、 その後 被移植動物を飼育し、 産まれた仔マウスから前記 D N Aを有する仔マウ スを選択することによりかかるトランスジエニックマウスを創製するこ とができる。 また、 D N Aを有する仔マウスの選択は、 マウスの尻尾等 より粗 D N Aを抽出し、 導入した人工タンパク質又はその誘導体をコ一 ドする D N Aをプローブとするドッ トハイプリダイゼ一ション法や、 特 異的プライマ一を用いた P C R法等により行うことができる。 また、 メ ンデルの法則に従い出生してくるホモ接合体非ヒト動物には、 人工タン パク質又はその誘導体発現型とその同腹の野生型とが含まれ、 これらホ モ接合体非ヒト動物における発現型とその同腹の野生型を同時に用いる ことによって、 各種診断等を個体レベルで正確な比較実験をすることが できる。
次に、 上記人工夕ンパク質又はその誘導体のトランスジエニック植物 の作製方法について説明する。 例えば、 本発明の人工遺伝子がインテグ レイ トされた植物体発現ベクターを、 シロイヌナズナ、 タバコ、 トウモ 口コシ、 小麦、 イネ、 ニンジン、 大豆などから樹立した植物株化細胞に 導入し、この遺伝子導入された細胞株を植物体へ再生させることにより、 トランスジエニック植物を得ることができる。 トランスジエニック植物 の形態としては、植物体の他、プロトプラスト、カルス、植物体の部分(リ ーフディスク、 ヒポコチル等)を挙げることができる。 また、 宿主植物細 胞へのべクタ一の導入法としては、 ァグロパクテリゥム法が好適である がその他にも、 例えば、 ポリエチレングリコール法、 エレクト口ポレー シヨン法、 パーティクルガン法などを用いることができる (モデル植物 の実験プロトコール、 秀潤社 ( 1996) )。 また、 本発明のトランスジェニ ック植物の種子、 塊根、 切穂、 メリクローン等を用いると、 目的とする 植物体を量産することが可能となる。
以下、 トランスジエニックイネ植物を例に挙げてより具体的に説明す る。 完熟種子からカルス誘導を行い、 これに人工タンパク質又はその誘 導体の c D N Aを導入したァグロパクテリゥムを感染させる。 これら力 ルスとァグロパクテリゥムとを共培養した後、選抜培地に移し培養する。 約 3週間後カルスを再分化培地に移し、 再分化するまで培養する。 4、 5 日馴化させた後ポッ.トに移すことで形質転換体を再生させることがで きる (モデル植物の実験プロトコール、 秀潤社 ( 1996) )。 その他、 ニン ジン、 タバコ等の再生の方法としては、 それぞれ加藤、 庄野博士等の方 法 (植物組織培養の技術 朝倉書店 ( 1983) ) を具体的に挙げることがで きる。 また、 人工タンパク質又はその誘導体をコードする D N Aが導入 されたトランスジエニック植物の選択は、 かかる植物体内から粗 D N A を抽出し、 ノーザンプロッ ト法により、 あるいは、 導入した人工タンパ ク質又はその誘導体をコードする D N Aをプローブとするドッ トハイブ リダイゼ一ション法や、 特異的プライマ一を用いた P C R法等により行 うことができる。
前記人エタンパク質又はその誘導体を有効成分として含有させること により、 各種疾病に対する治療薬や診断薬とすることができる。 人工夕 ンパク質又はその誘導体は、 細胞中や細胞膜に存在する形態でも使用す ることができ、 例えば、 細胞膜を得る方法としては、 F. P i e t r i -Rouxe l (Eur . J . B i ochem., 247 : 1 174-1 179, 1997)らの方法などを用いることがで きる。 また、 人工タンパク質又はその誘導体を細胞培養物から回収し精 製するには、 硫酸アンモニゥムまたはエタノール沈殿、 酸抽出、 ァニォ ンまたはカチオン交換クロマ卜グラフィー、 ホスホセルロースクロマト グラフィ一、 疎水性相互作用クロマトグラフィー、 ァフィ二ティーク口 マトグラフィ一、 ハイ ド口キシァパタイ トクロマトグラフィーおよぴレ クチンクロマトグラフィーを含めた公知の方法、 好ましくは、 高速液体 クロマトグラフィーが用いられる。 特に、 ァフイエティ一クロマトダラ フィ一に用いるカラムとしては、 例えば、 人工タンパク質に対するリガ ンドを結合させたカラムや、 後述するように本発明の人工タンパク質に 通常のぺプチドタグを付加した場合は、 このべプチドタグに親和性のあ る物質を結合したカラムを用いることにより、 人工タンパク質を得るこ とができる。
以下、 実施例により本発明をさらに具体的に説明するが、 本発明はこ れら実施例に限定されるものではない。 実施例 1
H I Vウィルスの一群の亜種がもつ g p 1 2 0タンパク質の部分配列 である、 配列番号 1に示されるアミノ酸配列からなるぺプチドをコード する塩基配列を読み枠の 1つとし、 かつ同方向の他の読み枠 2つのうち の少なくとも 1つの読み枠で 2次構造を形成しやすいアミノ酸配列から なるペプチドをコ一ドすることができるマイク口遺伝子をデザィンする ために、 図 1に示すフローチヤ一トにしたがってマイクロ遺伝子を構築 した。 計算機の処理能力を考慮して、 配列番号 1に示される 2 0ァミノ 酸残基を、 互いに一部重複する部分配列である 3つのアミノ酸配列、 す なわち配列番号 2、 配列番号 3、 配列番号 4にそれぞれ示される 3つの アミノ酸配列からなるぺプチドに分割し、 それぞれについて計算を実行 した。
配列番号 3に示されるアミノ酸配列からなるぺプチドをコードする塩 基配列の場合、 まず読み枠の 1つに配列番号 3に示されるアミノ酸配列 からなるペプチドをコードすることのできる全ての塩基配列 (塩基長は 1 3 X 3 = 3 9 ) である約 5億種の塩基配列を計算機内に作成し、 この 配列集団の中から、 同方向の他の 2つの読み枠に終止コ ドンをもたない 約 1 , 1 3 5万種の塩基配列を計算機内で選び出した。 次に、 これら選 び出された塩基配列の読み枠 1 と同方向の他の 2つの読み枠のコードす る全てのアミノ酸配列約 2, 2 7 0万種を計算機内に作成し、 このアミ ノ酸配列からなるペプチド集団の中から同じアミノ酸配列をもった重複 配列を除き、 それぞれ異なる配列をもつペプチド集団約 1 , 5 0 6万種 を選び出した。 このそれぞれのペプチド集団に対して、 その Q!ヘリック ス、 あるいは、 i3シートの二次構造形成能力を前記の二次構造予測プロ グラムを用いたスコア一によつて評価し、 二次構造形成能力が高いと予 想されるペプチドの中から、 配列番号 5に示されるアミノ酸配列からな るペプチドを選定した。 このペプチドは、 配列番号 6に示される塩基配 列の第 2読み枠にコ一ドされるアミノ酸配列であり、 αヘリックス構造 を形成しやすい配列と予想された。
配列番号 2に示されるアミノ酸配列からなるぺプチドをコードする塩 基配列についても、 上記同様の計算を実行し、 第 1読み枠で、 配列番号 2に示されるアミノ酸配列からなるペプチドを、 第 2読み枠で aへリツ クスを形成する可能性が高いペプチドをコードし、 かつ、 そのペプチド の 4番目から 6番目のアミノ酸配列が、 上記配列番号 5に示されるアミ ノ酸配列の 1番目から 3番目のアミノ酸配列に一致する、 配列番号 7に 示されるアミノ酸配列からなるペプチドを選び出した。このペプチドは、 配列番号 8に示される塩基配列の第 2読み枠にコ一ドされるアミノ酸配 列である。
配列番号 4についても上記同様の計算を実行し、 第 1読み枠で、 配列 番号 4に示されるアミノ酸配列からなるぺプチドを、 第 2読み枠でひ へ リックスを形成する可能性が高いペプチドをコードし、 かつ、 そのぺプ チドの 1番目から 3番目のアミノ酸配列が、 配列番号 5の 1 1番目から 1 3番目のアミノ酸配列に一致する、 配列番号 9に示されるアミノ酸配 列からなるペプチドを選び出した。 このペプチドは、 配列番号 1 0に示 される塩基配列の第 2読み枠にコ一ドされるアミノ酸配列である。
上記の操作で得られた配列番号 6、 配列番号 8、 配列番号 1 0にそれ ぞれ示される塩基配列を、 重複を考慮しながら連結し、 配列番号 1 1に 示される塩基配列を有するマイクロ遺伝子 「デザイン一 2 5」 を得た。 このデザインされたマイクロ遺伝子は、 図 2に示すように、 第 1読み枠 で H I Vウィルスの一群の亜種がもつ g p 1 2 0タンパク質の部分配列 をコードし、 第 2読み枠で、 ヘリックス構造を形成しやすいペプチド の配列をコードする。 なお、 マイクロ遺伝子デザイン— 2 5の場合、 マ イク口遺伝子のマイナス鎖 (配列番号 1 1に示される塩基配列に対して 相補的な配列) に関しては、 終止コドンの出現の回避などの制限を加え ていない
上記のデザィンされたマイク口遺伝子 「デザィンー 2 5」 を出発材料 とし、 前記特開平 9 - 3 2 2 7 7 5号公報記載の高分子マイクロ遺伝子 重合体の作成方法の技術を用いて、 マイクロ遺伝子重合体ライブラリー を作製した。 なお、 重合の基礎となるオリゴヌクレオチド Aとして、 配 列番号 1 2に示される塩基配列からなる KY— 1 1 9 7を、 オリゴヌク レオチド Βとして、 配列番号 1 3に示される塩基配列からなる ΚΥ— 1 1 9 8をそれぞれ合成して用いた。 これら 3 4ヌクレオチドからなるォ リゴヌクレオチド Αの 3 ' 側 1 0残基と、 3 6ヌクレオチドからなるォ リゴヌクレオチド Bの 3 ' 側 1 0残基とが、 ともに 3 ' 端を除いて互い に相補的な配列として構成されている。
上記オリゴヌクレオチド Aとオリゴヌクレオチド Bとを用いた重合反 応の条件は、 5 0 Lの反応容量では以下の通りである。
K Y - 1 1 9 7 2 0 p m o 1
K Y- 1 1 9 8 2 0 p m o 1
K C 1 1 0 mM
(NH4) 2 S 04 1 0 mM
T r i s -HC l (p H 8 8 ) 1 0 mM
M g S 04 2 mM
T r i t o n X - 1 0 0 0. %
2. 5 mM d N T P 7 II L
上記反応液を 94°Cで 1 0分間処理した後、 DN Aポリメラーゼ (二 ユーイングランドバイオラブス社製 「V e n t R」) を 5. 2ュニッ ト加 えた。
重合反応は、 パーキン · エルマ一社の 24 0 0ジーンアンプ P C Rシ ステムを用いて行った。 反応条件は、 94°Cで 1 0秒間熱変性させ、 6 6°Cで 6 0秒間ァ二一リングと伸張反応を行うというサイクルで 5 5サ ィクル繰り返し、 最後の伸張反応を 6 6°Cで 7分間行った。 重合反応産 物として得られた本発明の人工遺伝子をプラスミ ドベクタ一 p T Z 1 9 R (Protein Eng. , 1:67-74, 1986)にクローニングし、 その挿入 D Ν Α断片 の塩基配列をシ一クェンサ一 (パーキン ·エルマ一社) を用いて決定し た。 クローニングされた DN A断片のうちのいくつかを図 3に示す。 図 3に示される P TH 1 2 7の挿入塩基配列を配列番号 1 4に、 p TH 1 4 5の挿入塩基配列を配列番号 1 5に、 p TH 1 7 1の挿入塩基配列を 配列番号 1 6に、 p TH 1 7 6の揷入塩基配列を配列番号 1 7にそれぞ れ示す。
上記マイク口遺伝子重合体である人工遺伝子を大腸菌内で発現させる ために、 プラスミ ドベクター p T Z 1 9 Rにクロ一ニングした 24種の 挿入 DNA断片を切りだし、 方向、 読み枠などを考慮しながら、 方向、 読み枠を選んで発現させることができる発現プラスミ ドベクタ一シリー ズ p KS 6 0 0〜p KS 6 0 5のいずれか 1つに再クローニングした。 この 6種の発現プラスミ ドベクター p KS 6 0 0〜p K S 6 0 5は、 キ ァゲン社から発売されている読み枠を 1つずつずらした発現ベクターシ リ一ズである P QE— 9、 p QE_ 1 0、 p QE— 1 1のクローニング サイ トを改変したもので、 プラス鎖とマイナス鎖のそれぞれ 3読み枠、 合計 6種の読み枠のいずれかにより翻訳産物を大腸菌の中で大量発現さ せることができるように作製したものである。 この人工遺伝子が挿入さ れた発現プラスミ ドベクタ一 p TH l 7 7〜p TH 2 0 0が導入された 大腸菌を、発現誘導剤である I P TG存在条件下で培養することにより、 配列番号 1に示されるアミノ酸配列の全部、 あるいは一部をもつ人エタ ンパク質が得られた。翻訳産物のぺプチド配列のいくつかを図 4に示す。 図 4から、 マイクロ遺伝子 「デザイン— 2 5」 のもつ複数の読み枠の 翻訳産物が複雑に入り交じった種々の人工タンパク質が得られることが わかる。 図 4に示される前記 P TH 1 2 7に揷入された人工遺伝子を P KS 6 0 1に再クローニングして得られた p TH 1 7 7から産生される タンパク質のアミノ酸配列を配列番号 1 8に示す。 また、 前記 p TH l 4 5に揷入された人工遺伝子を! K S 6 0 1に再クローニングして得ら れた p TH l 8 1から産生されるタンパク質のアミノ酸配列を配列番号 1 9に、 p TH 1 7 1に揷入された人工遺伝子を p K S 6 0 1に再ク口 一二ングして得られた p TH 1 84から産生されるタンパク質のアミノ 酸配列を配列番号 2 0に、 p TH 1 7 6に挿入された人工遺伝子を p K S 6 0 1に再クローニングして得られた p TH 1 8 5から産生される夕 ンパク質のアミノ酸配列を配列番号 2 1にそれぞれ示す。
前記 24種の人工遺伝子が挿入された発現ベクター p TH 1 7 7〜p TH 2 0 0を大腸菌 X L 1 B 1 u e株内に導入し、 I P T Gで誘導後、 1 5 - 2 5 %グラジュェントゲルを用いた S D Sポリアクリルアミ ド電 気泳動法により、 その細胞抽出液を解析した。 結果を図 5に示す。 図 5 中の分子量マーカ一は、 大きいものより 9 7 , 4 0 0、 6 6, 2 6 7、 42, 40 0、 3 0 , 0 0 0、 2 0, 1 0 0、 1 4, 4 0 0であり、 人 ェ遺伝子の翻訳産物である人工タンパク質は 「秦」 印で示されている。 また、 発現べクタ一 p K S 6 0 0〜 p K S 6 0 5は、 N末端にポリヒス チジン残基を付加するタイプの発現べクタ一であり、 このポリヒスチジ ン領域に親和性をもつ樹脂を利用することにより精製が可能である。 図 5で観察された人エタンパク質のうち p TH l 8 4と p TH l 8 5をク 口ンテック社の TAL ON樹脂を用い精製した結果を図 6に示す。 実施例 2
H I Vの tat と呼ばれる遺伝子産物は、 細胞に接触させると細胞内部 に導入されるという プロテイ ン · ト ランスダクシヨ ン (protein transduction) 活性を有しており、 現在ではその N末端の配列がプロテ イン · トランスダクシヨン活性に関わり、 このアミノ酸配列を種々の夕 ンパク質の N末端に融合させて、 当該タンパク質を細胞内へ導入させる ことが報告されている (Science, 285:1569 - 1572, 1999)。 そこで、 配列番 号 2 2で示される上記 N末端のアミノ酸配列を出発情報として、 図 1の フローに従い、 マイクロ遺伝子を実施例 1と同様にデザインした。 この 配列番号 2 3で示される塩基配列を有するマイクロ遺伝子は、 第 2読み 枠がプロテイン · トランスダクション活性を有する配列番号 2 2で示さ れるアミノ酸配列を、 第 1読み枠が αヘリックス構造を形成しやすい配 列番号 2 4で示されるアミノ酸配列をそれぞれコ一ドしている。
他方、 アポトーシス信号伝達系のいくつかのタンパク質がもつモチ一 フとして知られている 「Β Η 3」 モチーフをもつ Noxaタンパク質を、 ァ デノウィルスべクタ一などで人為的に細胞に導入すると細胞死が誘導さ れることが知られている (Sc i ence, 288 : 1053-1058, 2000)。 この Noxaタ ンパク質は 1 0 0アミノ酸残基からなり、 上記 「B H 3」 モチーフ以外 の領域の種間での保存性は低く、 全体がひヘリックスに富むタンパク質 であることから、 アポトーシス信号伝達系に作用し、 細胞死誘導活性を 有するアミノ酸配列として上記 「B H 3」 モチーフを用いた。 配列番号 2 5で示されるアミノ酸配列からなる 「B H 3」 モチーフを出発情報と して、 図 1のフローに従い、 マイクロ遺伝子を実施例 1と同様にデザィ ンした。 この配列番号 2 6で示される塩基配列を有するマイクロ遺伝子 は、 第 1読み枠が細胞死誘導活性を有すると考えられる配列番号 2 5で 示されるアミノ酸配列を、 第 3読み枠がひヘリックス構造を形成しやす い配列番号 2 7で示されるアミノ酸配列をそれぞれコードしている。 次に、 前記配列番号 2 3で示される塩基配列を有するマイクロ遺伝子 と、 上記配列番号 2 6で示される塩基配列を有するマイクロ遺伝子を結 合させ、 配列番号 2 8で示される塩基配列を有するマイクロ遺伝子 「デ ザイン— 2 6」 をデザィンした。 マイク口遺伝子 「デザィン— 2 6」 の 第 1読み枠 (配列番号 2 9 ) は、 αヘリックス構造を形成しやすいアミ ノ酸配列と 「Β Η 3」 モチーフが融合しており、 上記 Noxaタンパク質と 類似の活性を有する可能性が大きい。 また、 第 2読み枠 (配列番号 3 0 ) にはプロテイン · トランスダクション活性を有するアミノ酸配列が含ま れており、 第 3読み枠 (配列番号 3 1 ) にはひヘリックス構造を形成し やすいアミノ酸配列が含まれている。 実施例 3
プロテイン · トランスダクション活性と細胞死誘導活性を異なる読み 枠に有するマイクロ遺伝子 「デザイン一 2 7」 を、 実施例 2と同様に構 築した。 この配列番号 3 2で示される塩基配列を有するマイクロ遺伝子 「デザイン— 2 7」 の第 1読み枠 (配列番号 3 3 ) は、 ひヘリックス構 造を形成しやすいアミノ酸配列と 「B H 3」 モチーフが融合しており、 上記 Noxa夕ンパク質と類似の活性を有する可能性が大きい。 また、第 3 読み枠 (配列番号 3 4 ) は、 プロテイン · トランスダクシヨン活性を有 するアミノ酸配列とひヘリックス構造を形成しやすいアミノ酸配列が融 合した配列から構成されている。 産業上の利用可能性
本発明の、 塩基配列の読み枠を異にした場合に 2以上の機能を有する 多機能塩基配列ゃ該多機能塩基配列が複数の読み枠が出現するように結 合している人工遺伝子を用いると、 自然には存在しない産業上有用な人 ェタンパク質を探し出す (創り出す) ことができる。 また、 本発明は、 夕ンパク質性の刺激応答ゲルや自己集合能力のあるナノスケールのタン パク質構造体の作製等材料工学の分野や、 接着夕ンパク質のモチーフな どを埋め込んで、 細胞増殖の土台となるような人工マトリックスタンパ ク質の創出等再生医学の分野で応用することができる。

Claims

求 の 範 囲
1 . 塩基配列の読み枠を異にした場合、 該塩基配列が 2以上の機能を有 することを特徴とする多機能塩基配列。
2 . 塩基配列が、 2本鎖の塩基配列であることを特徴とする請求項 1記 載の多機能塩基配列。
3 . 塩基配列が、 D N Aであることを特徴とする請求項 1又は 2記載の 多機能塩基配列。
4 . 塩基配列が、 R N Aであることを特徴とする請求項 1又は 2記載の 多機能塩基配列。
5 . 塩基配列が、 線状の塩基配列であることを特徴とする請求項 1〜 4 のいずれか記載の多機能塩基配列。
6 . 塩基配列の読み枠が、 1つずつずれた 3つの読み枠のすべてにスト ップコドンが存在しないことを特徴とする請求項 1〜 5のいずれか記載 の多機能塩基配列。
7 . 塩基配列の 6つの読み枠のすべてにストップコドンが存在しないこ とを特徴とする請求項 2〜 6のいずれか記載の多機能塩基配列。
8 . 多機能塩基配列を重合したときの連結部にストップコドンが生起す ることがないことを特徴とする請求項 6又は 7記載の多機能塩基配列。
9 . 2以上の機能が、 2以上の生物機能であることを特徴とする請求項 1〜 8のいずれか記載の多機能塩基配列。
1 0 . 生物機能が、 二次構造を形成しやすい機能、 中和抗体を誘導する 抗原機能、 免疫を賦活化する機能、 細胞増殖を促進又は抑制する機能、 癌細胞を特異的に認識する機能、 プロテイン · トランスダクション機能、 細胞死誘導機能、 抗原決定残基呈示機能、 金属結合機能、 補酵素結合機 能、 触媒活性機能、 蛍光発色活性機能、 特定の受容体に結合してその受 容体を活性化する機能、 信号伝達に関わる特定の因子に結合してその働 きをモジュレートする機能、 生体高分子を特異的に認識する機能、 細胞 接着機能、 細胞外へタンパク質を局在化させる機能、 特定の細胞内小器 官にターゲッ トする機能、 細胞膜に埋め込まれる機能、 アミロイ ド繊維 形成機能、 繊維性タンパク質の形成機能、 タンパク質性ゲル形成機能、 タンパク質性フィルム形成機能、 単分子膜形成機能、 自己集合機能、 粒 子形成機能、 又は、 他のタンパク質の高次構造形成を補助する機能であ ることを特徴とする請求項 9記載多機能塩基配列。
1 1 . 塩基配列が、 1 5〜 5 0 0の塩基又は塩基対からなることを特徴 とする請求項 1〜 1 0のいずれか記載の多機能塩基配列。
1 2 . 多機能塩基配列を重合するための修飾が施されていることを特徴 とする請求項 1〜 1 1のいずれか記載の多機能塩基配列。
1 3 . 天然由来の塩基配列が結合されていることを特徴とする請求項 1 〜 1 2のいずれか記載の多機能塩基配列。
1 4 . 所定の機能を有するアミノ酸配列をコードする塩基配列のすべて の組合せの中から、 前記所定の機能を有するアミノ酸配列の読み枠とは 異なる読み枠において、 前記所定の機能と同一又は異なる機能を有する 塩基配列を選択することを特徴とする 2以上の機能を有する多機能塩基 配列の製造方法。
1 5 . 所定の機能と同一又は異なる機能を有する塩基配列を、 計算科学 的手法により選択することを特徴とする請求項 1 4記載の 2以上の機能 を有する多機能塩基配列の製造方法。
1 6 . 計算科学的手法が、 生物機能予測プログラムを用いたときのスコ ァ一によつて評価 ·選択する手法であることを特徴とする請求項 1 5記 載の 2以上の機能を有する多機能塩基配列の製造方法。
1 7 . 塩基配列が、 2本鎖の塩基配列であることを特徴とする請求項 1 4〜 1 6のいずれか記載の 2以上の機能を有する多機能塩基配列の製造 方法。
1 8 . 塩基配列が、 D N Aであることを特徴とする請求項 1 4〜 1 7の いずれか記載の 2以上の機能を有する多機能塩基配列の製造方法。
1 9 . 塩基配列が、 R N Aであることを特徴とする請求項 1 4〜 1 7の いずれか記載の 2以上の機能を有する多機能塩基配列の製造方法。
2 0 . 塩基配列が、 線状の塩基配列であることを特徴とする請求項 1 4 〜 1 9のいずれか記載の 2以上の機能を有する多機能塩基配列の製造方 法。
2 1 . 塩基配列の読み枠が、 1つずつずれた 3つの読み枠のすべてにス トップコドンが存在しないことを特徴とする請求項 1 4:〜 2 0のいずれ か記載の 2以上の機能を有する多機能塩基配列の製造方法。
2 2 . 塩基配列の 6つの読み枠のすべてにストップコドンが存在しない ことことを特徴とする請求項 1 7〜 2 1のいずれか記載の 2以上の機能 を有する多機能塩基配列の製造方法。
2 3 . 多機能塩基配列を重合したときの連結部にストップコドンが生起 することがないことを特徴とする請求項 2 1又は 2 2記載の 2以上の機 能を有する多機能塩基配列の製造方法。
2 4 . 2以上の機能が、 2以上の生物機能を有することを特徴とする請 求項 1 4〜 2 3のいずれか記載の 2以上の機能を有する多機能塩基配列 の製造方法。
2 5 . 生物機能が、 二次構造を形成しやすい機能、 中和抗体を誘導する 抗原機能、 免疫を賦活化する機能、 細胞増殖を促進又は抑制する機能、 癌細胞を特異的に認識する機能、 プロテイン ' トランスダクション機能、 細胞死誘導機能、 抗原決定残基呈示機能、 金属結合機能、 補酵素結合機 能、 触媒活性機能、 蛍光発色活性機能、 特定の受容体に結合してその受 容体を活性化する機能、 信号伝達に関わる特定の因子に結合してその働 きをモジュレートする機能、 生体高分子を特異的に認識する機能、 細胞 接着機能、 細胞外へタンパク質を局在化させる機能、 特定の細胞内小器 官にターゲッ トする機能、 細胞膜に埋め込まれる機能、 アミロイ ド繊維 形成機能、 繊維性タンパク質の形成機能、 タンパク質性ゲル形成機能、 タンパク質性フィルム形成機能、 単分子膜形成機能、 自己集合機能、 粒 子形成機能、 又は、 他のタンパク質の高次構造形成を補助する機能であ ることを特徴とする請求項 2 4記載の 2以上の機能を有する多機能塩基 配列の製造方法。
2 6 . 塩基配列が、 1 5〜 5 0 0の塩基又は塩基対からなることを特徴 とする請求項 1 4〜 2 5のいずれか記載の 2以上の機能を有する多機能 塩基配列の製造方法。
2 7 . さらに多機能塩基配列を重合するための修飾を施すことを特徴と する請求項 1 4〜 2 6のいずれか記載の 2以上の機能を有する多機能塩 基配列の製造方法。
2 8 . さらに天然由来の塩基配列を結合することを特徴とする請求項 1 4〜 2 7のいずれか記載の 2以上の機能を有する多機能塩基配列の製造 方法。
2 9 . 請求項 1 4〜 2 8のいずれか記載の 2以上の機能を有する多機能 塩基配列の製造方法により製造することができる 2以上の機能を有する 多機能塩基配列。
3 0 . 請求項 1〜 1 3のいずれか記載又は請求項 2 9記載の多機能塩基 配列の 1種又は 2種以上が、 複数の読み枠が出現するように結合してい ることを特徴とする人工遺伝子。
3 1 . 3 0〜 1 0 0 0 0 0の塩基又は塩基対からなることを特徴とする 請求項 3 0記載の人工遺伝子。
3 2. 請求項 1〜 1 3のいずれか記載又は請求項 2 9記載の多機能塩基 配列の 1種又は 2種以上を、 複数の読み枠が出現するようにコンビナト リアルに重合することを特徴とする人工遺伝子の製造方法。
3 3. 2本鎖多機能塩基配列の一端に特定の DNA配列 「A」、 他端に特 定の DNA配列 「B」 を付加し、 DNA配列 「A」 及び 「B」 にそれぞ れ相補的な配列を少なくとも一部含む DNA配列 「a」 及び 「b」 を調 製し、 該 DNA配列 「 a」 と 「b」 とが連結した一本鎖 DNAを用いて 前記 2本鎖多機能塩基配列のリガーゼ反応を行うことを特徴とする請求 項 3 2記載の人工遺伝子の製造方法。
34. 多機能塩基配列の全部又は一部からなり、 少なくとも一部の配列 が互いに相補している 2つの塩基配列にポリメラーゼを作用させてポリ メラーゼ連鎖反応を行うことを特徴とする請求項 3 2記載の人工遺伝子 の製造方法。
3 5. 請求項 3 0又は 3 1記載の人工遺伝子が発現べクタ一に組み込ま れていることを特徴とする人工遺伝子発現ベクター。
3 6. 人工遺伝子が、 天然遺伝子と結合された人工遺伝子であることを 特徴とする請求項 3 5記載の人工遺伝子発現ベクター。
3 7. 請求項 3 5又は 3 6記載の人工遺伝子発現ベクターが宿主細胞に 導入されていることを特徴とする人工遺伝子発現べクタ一含有細胞。
3 8. 宿主細胞が大腸菌であることを特徴とする請求項 3 7記載の人工 遺伝子発現ベクター含有細胞。
3 9. 請求項 3 0又は 3 1記載の人工遺伝子の翻訳産物として得られる ことを特徴とする人工タンパク質又はその誘導体。
4 0. 翻訳が、 無細胞発現系で行われることを特徴とする請求項 3 9記 載の人工タンパク質又はその誘導体。
4 1. 翻訳が、 細胞発現系で行われることを特徴とする請求項 3 9記載 の人工タンパク質又はその誘導体。
4 2 . 細胞が、 請求項 3 7又は 3 8記載の人工遺伝子発現べクタ一含有 細胞であることを特徴とする請求項 4 1記載の人工夕ンパク質又はその 誘導体。
4 3 . 人工タンパク質の誘導体が、 人工糖タンパク質、 人工ホスホリピ ッ ドプロテイン、 人工ポリエチレングリコール修飾タンパク質、 人工ポ ルフイ リン結合タンパク質又は人エフラビン結合タンパク質であること を特徴とする請求項 3 9〜4 2のいずれか記載の人工タンパク質又はそ の誘導体。
4 4 . 請求項 3 0又は 3 1記載の人工遺伝子の翻訳産物の中から機能性 分子をスクリーニングすることを特徴とする人工夕ンパク質又はその誘 導体の製造方法。
4 5 . 請求項 3 9〜4 3のいずれか記載の人工タンパク質又はその誘導 体と、 マーカ一タンパク質及びノ又はべプチドタグとを結合させた融合 夕ンパク質又はその誘導体。
4 6 . 請求項 3 9〜 4 3のいずれか記載の人工タンパク質又はその誘導 体発現能を有するトランスジエニック非ヒト動物。
4 7 . 請求項 3 9〜 4 3のいずれか記載の人エタンパク質又はその誘導 体発現能を有するトランスジエニック植物。
4 8 . 請求項 3 9〜 4 3のいずれか記載の人工タンパク質又はその誘導 体を有効成分として含有することを特徴とする各種疾病に対する治療薬 (
4 9 . 請求項 3 9〜 4 3のいずれか記載の人工タンパク質又はその誘導 体を有効成分として含有することを特徴とする各種疾病に対する診断薬 (
5 0 . 請求項 3 9〜 4 3のいずれか記載の人エタンパク質又はその誘導 体を有効成分として含有することを特徴とする人工生体組織。
5 1 . 請求項 3 9〜 4 3のいずれか記載の人エタンパク質又はその誘導 体を有効成分として含有することを特徴とする人工タンパク質性高分子 材料。
PCT/JP2001/005116 2000-06-16 2001-06-15 Sequence de base polyfonctionnelle et gene artificiel contenant ladite sequence WO2001096558A1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
EP01938687A EP1291423A4 (en) 2000-06-16 2001-06-15 POLYFUNCTIONAL BASE SEQUENCE AND ARTIFICIAL GENE CONTAINING SAID SEQUENCE

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2000180997A JP2001352990A (ja) 2000-06-16 2000-06-16 多機能塩基配列及びそれを含む人工遺伝子
JP2000-180997 2000-06-16

Publications (1)

Publication Number Publication Date
WO2001096558A1 true WO2001096558A1 (fr) 2001-12-20

Family

ID=18681989

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2001/005116 WO2001096558A1 (fr) 2000-06-16 2001-06-15 Sequence de base polyfonctionnelle et gene artificiel contenant ladite sequence

Country Status (4)

Country Link
US (1) US20030121065A1 (ja)
EP (1) EP1291423A4 (ja)
JP (1) JP2001352990A (ja)
WO (1) WO2001096558A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7243031B2 (en) * 2001-12-27 2007-07-10 Fujitsu Limited Method of designing multifunctional base sequence

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4007477B2 (ja) * 2000-10-13 2007-11-14 独立行政法人科学技術振興機構 エピトープの免疫原性が増強された人工タンパク質
US20030224480A1 (en) * 2001-12-27 2003-12-04 Fujitsu Limited Method of designing multifunctional base sequence
US20030206172A1 (en) * 2002-03-05 2003-11-06 Vigilos, Inc. System and method for the asynchronous collection and management of video data
WO2006011589A1 (ja) * 2004-07-30 2006-02-02 Japan Science And Technology Agency 多数種モチーフ配列のランダム重合による人工遺伝子及び人工タンパク質集団の作製法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09154585A (ja) * 1995-12-06 1997-06-17 Kagaku Gijutsu Shinko Jigyodan マイクロ遺伝子のランダム重合体作成方法
EP0812911A2 (en) * 1996-06-10 1997-12-17 Japan Science and Technology Corporation A method of forming a macromolecular microgene polymer

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5830713A (en) * 1986-11-04 1998-11-03 Protein Polymer Technologies, Inc. Methods for preparing synthetic repetitive DNA
US5770697A (en) * 1986-11-04 1998-06-23 Protein Polymer Technologies, Inc. Peptides comprising repetitive units of amino acids and DNA sequences encoding the same
US5641648A (en) * 1986-11-04 1997-06-24 Protein Polymer Technologies, Inc. Methods for preparing synthetic repetitive DNA
US5089406A (en) * 1987-01-07 1992-02-18 Allied-Signal Inc. Method of producing a gene cassette coding for polypeptides with repeating amino acid sequences

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09154585A (ja) * 1995-12-06 1997-06-17 Kagaku Gijutsu Shinko Jigyodan マイクロ遺伝子のランダム重合体作成方法
EP0812911A2 (en) * 1996-06-10 1997-12-17 Japan Science and Technology Corporation A method of forming a macromolecular microgene polymer

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SHIBA K. ET AL.: "Creation of libraries with long ORFs by polymerization of a microgene", PROC. NATL. ACAD. SCI. USA, vol. 94, no. 8, 1997, pages 3805 - 3810, XP002945832 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7243031B2 (en) * 2001-12-27 2007-07-10 Fujitsu Limited Method of designing multifunctional base sequence

Also Published As

Publication number Publication date
EP1291423A4 (en) 2005-01-05
EP1291423A1 (en) 2003-03-12
JP2001352990A (ja) 2001-12-25
US20030121065A1 (en) 2003-06-26

Similar Documents

Publication Publication Date Title
CN104583239B (zh) 多特异单克隆抗体
Kinzler et al. Whole genome PCR: application to the identification of sequences bound by gene regulatory protein
JPH06504444A (ja) トランス−スプライシング リボザイム
CN112004932B (zh) 一种CRISPR/Cas效应蛋白及系统
CA2297109A1 (en) 5' ests for secreted proteins expressed in muscle and other mesodermal tissues
CN112105728A (zh) CRISPR/Cas效应蛋白及系统
WO2022166895A1 (zh) Crispr酶和系统以及应用
CN114438055B (zh) 新型的crispr酶和系统以及应用
JP2021531727A (ja) アフリカ豚熱の診断のための抗原生産用組み換えベクター及びその使用
Todd et al. The immunogenicity and antigenicity of proteins
JP5220620B2 (ja) 普遍的な分子認識のための、植物のキメラ結合ポリペプチド
US7618635B2 (en) Super-antigen fusion proteins and the use thereof
WO2001096558A1 (fr) Sequence de base polyfonctionnelle et gene artificiel contenant ladite sequence
JP5804520B2 (ja) 核酸構築物、それを用いた複合体の製造方法およびスクリーニング方法
CN101405393A (zh) 蛋白s融合用于蛋白增溶的用途
JP2003523742A (ja) コンビナトリアルタンパク質ドメイン
KR20220023984A (ko) 응집이 적은 피피알 단백질 및 그의 이용
CN104419756B (zh) 检测哺乳动物基因组三核苷酸重复序列的方法及其应用
CA2337692A1 (en) Kdel receptor inhibitors
CN115261359B (zh) 一种新型crispr酶和系统以及应用
TW200411069A (en) Detection of evolutionary bottlenecking by dna sequencing as a method to discover genes of value
WO1999011818A1 (fr) Procede de detection d'acides nucleiques ou de polypeptides hautement fonctionnels
Szuchet et al. Oligodendrocytes express an α/β‐interferon‐susceptible Mx gene: Molecular characterization of the encoded protein
AU2015203464B2 (en) Plant chimeric binding polypeptides for universal molecular recognition
JPWO2005012902A1 (ja) 有用タンパク質のスクリーニング方法

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): CH DE FR GB

121 Ep: the epo has been informed by wipo that ep was designated in this application
DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
WWE Wipo information: entry into national phase

Ref document number: 2001938687

Country of ref document: EP

Ref document number: 10311111

Country of ref document: US

WWP Wipo information: published in national office

Ref document number: 2001938687

Country of ref document: EP

WWW Wipo information: withdrawn in national office

Ref document number: 2001938687

Country of ref document: EP