WO2004024913A1 - 新規タンパク質及びそれをコードするdna - Google Patents

新規タンパク質及びそれをコードするdna Download PDF

Info

Publication number
WO2004024913A1
WO2004024913A1 PCT/JP2003/011552 JP0311552W WO2004024913A1 WO 2004024913 A1 WO2004024913 A1 WO 2004024913A1 JP 0311552 W JP0311552 W JP 0311552W WO 2004024913 A1 WO2004024913 A1 WO 2004024913A1
Authority
WO
WIPO (PCT)
Prior art keywords
protein
dna
amino acid
sequence
seq
Prior art date
Application number
PCT/JP2003/011552
Other languages
English (en)
French (fr)
Inventor
Jun Kondo
Kunji Kawai
Naoko Miyama
Midori Nakajima
Takao Isogai
Tomoyasu Sugiyama
Ai Wakamatsu
Ryotaro Irie
Shizuko Ishii
Original Assignee
Research Association For Biotechnology
Zoegene Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Research Association For Biotechnology, Zoegene Corporation filed Critical Research Association For Biotechnology
Priority to AU2003262046A priority Critical patent/AU2003262046A1/en
Priority to JP2004535926A priority patent/JPWO2004024913A1/ja
Publication of WO2004024913A1 publication Critical patent/WO2004024913A1/ja

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)

Definitions

  • the present invention relates to a novel protein, a DNA encoding the protein, a full-length cDNA encoding the protein, a recombinant vector having the DNA, an oligonucleotide comprising a partial sequence of the DNA, the DNA
  • the present invention relates to a gene-introduced cell into which is introduced, and an antibody specifically binding to the protein. Background art
  • genomic sequences of various organisms are being elucidated and analyzed on a global level.
  • the purpose of clarifying the genome sequence is to understand the complex life phenomena as a network of interactions and functions among all genes, between proteins, between cells, and even between individuals. Elucidating life phenomena from the genomic information of various species is not only important as a research topic in the academic field, but also how to develop the research results obtained therefrom into industrial applications. In that respect, its social significance is great.
  • Such information is used from various angles such as elucidation of human gene structure, prediction of exon region in genome sequence, and estimation of its expression profile.
  • human EST information are concentrated near the 3 'end of cDNA, the information especially near the 5' end of mRNA is extremely insufficient.
  • a full-length cDNA can be obtained, the starting point of mRNA transcription on the genomic sequence can be estimated from its 5 'terminal sequence, and the factors involved in the stability of mRNA contained in the sequence and the regulation of expression at the translation stage can be estimated. Analysis is possible. Also, since atg, which is the translation start point, is included on the 5 'side, translation into protein can be performed in the correct frame. Therefore, by applying an appropriate gene expression system, it becomes possible to produce a large amount of the protein encoded by the cDNA or to express the protein and analyze its biological activity. Thus, analysis of full-length cDNA provides important information that complements genomic sequence analysis. The expressible full-length cDNA clone is Its importance is extremely high in empirical analysis of the function of the gene and its application to industrial applications.
  • Splicing variant mRA an exon in which some exons in the genome are inserted and deleted and binds "Splicing variant mRA”
  • splicing variants a plurality of similar proteins (hereinafter sometimes referred to as “splicing variants”) produced by translating these mRNAs have been identified in vivo. Splicing variants are expressed in a tissue-specific, developmental stage-specific or disease-specific manner, and are thought to have different functions.
  • the tyrosine kinase JAK3 gene has three splice variants, S-type, B-type, and M-type.
  • S-type is expressed in hematopoietic cells
  • B-type and M-type are expressed in hematopoietic cells.
  • epithelial cells is expressed in epithelial cells.
  • S-type and M-type work together to further increase the complexity of intracellular cytokine signaling. (See, for example, Lai, KS et al., J. Biol. Chem. 270 (42), 25028-25036 (1995)).
  • the mRNA or cDNA of such a splicing variant is also difficult to obtain from a conventional cDNA library or EST, and is a clone that is likely to be obtained from a full-length cDNA library including the transcription start site (for example, W09). 8 Z22507 (see SEQ ID NO. 1 and NO. 2).
  • protein kinase is an enzyme that phosphorylates serine, threonine, or tyrosine residues of a protein serving as a substrate, and an extremely large number of families are known.
  • protein kinases are known to be involved in the control of various life phenomena by regulating the intracellular signal transduction system via the protein phosphoric acid, and the relationship with disease has been elucidated. Many genes (see, for example, Hunter, T., Cell, 50: 823-829 (1987)). However, about 3 of the human genes 44% are said to be protein kinase genes, and it is estimated that about 1,000 different protein kinases exist in the human body, and many protein kinase genes remain to be cloned.
  • the present invention analyzes the nucleotide sequence of a cDNA clone contained in a full-length cDNA library, and analyzes and identifies the physiological activity of a protein encoded by a cDNA having a novel full-length sequence including a splicing variant.
  • An object of the present invention is to propose a protein based on the physiological activity and a method of using DNA encoding the protein.
  • the present inventors have proposed the oligocap method (Maruyama, K., et al., Gene, 138: 171-174 (1994); Suzuki, ⁇ . Et al., Gene, 200: 149-156 (1997)).
  • a database containing the splicing variant obtained using the novel cDNA was searched in a database based on the homology of the nucleotide sequence of the cDNA clone, a sequence specific to a protein having kinase activity in the sequence was found.
  • the proteins encoded by these cDNAs were identified as protein kinases.
  • the present invention has been accomplished based on these findings.
  • a recombinant vector comprising the DNA according to any one of (2) to (4).
  • a sense oligonucleotide having the same sequence as 5 to 100 consecutive nucleotides in the nucleotide sequence of the DNA according to any one of (2) to (4), and an antisense having a sequence complementary to the sense oligonucleotide.
  • An oligonucleotide selected from the group consisting of an oligonucleotide and an oligonucleotide derivative of the sense or antisense oligonucleotide.
  • Computer-readable recording medium that stores at least one or more base sequence information.
  • FIG. 1 shows the results obtained by adding Syntide2 (SEQ ID NO: 21) as a substrate to a protein having the amino acid sequence of SEQ ID NO: 6 and measuring the peak on a reversed-phase HPLC.
  • FIG. 2 shows the results obtained by adding Syntide 2 (SEQ ID NO: 21) and CaMKI I (SEQ ID NO: 22) as substrates to a protein having the amino acid sequence of SEQ ID NO: 9, and measuring peaks on reversed-phase HPLC.
  • FIG. 3 shows the results of peaks measured on reversed-phase HP LC by adding Syntide 2 (SEQ ID NO: 21) and CaMK II (SEQ ID NO: 22) as substrates to a protein having the amino acid sequence of SEQ ID NO: 10 .
  • the DNA of the present invention may be a protein having the amino acid sequence of SEQ ID NOs: 6 to 10, or one or several in the amino acid sequence of SEQ ID NOs: 6 to 10 (here, several means, for example, 5 Or less, preferably 3 or less, more preferably 2 or less) amino acid sequence comprising substitution, deletion and / or addition of amino acid residues, and can encode a protein having kinase activity. Any object can be used. Specifically, it may be only the translation region encoding the amino acid sequence, or may include the full length of its cDNA.
  • examples of the DNA containing the full-length cDNA include, for example, DNAs having the nucleotide sequences of SEQ ID NOS: 1 to 5, and the like.
  • examples of the translation regions include, as the translation regions, nucleotide numbers 87 to 1124 of SEQ ID NO: 1, nucleotide numbers 115 to 2094 of SEQ ID NO: 2, nucleotide numbers 1232 to 2764 of SEQ ID NO: 3, nucleotide numbers 316 to 1947 of SEQ ID NO: 4 And those having a sequence represented by base numbers 151 to 1881 of SEQ ID NO: 5.
  • the one containing the above-mentioned translation region and a portion adjacent to the 3 ′ and Z or 5 ′ end thereof, which is the minimum necessary for expression of the translation region, etc. include.
  • the DNA of the present invention may be obtained by any method as long as it can be obtained, and specifically, for example, can be obtained by the method described below.
  • mRNA is prepared from human tissues or cultured cells by a method known per se and commonly used.
  • niRNA as type II, oligo cap method
  • the cap is removed from the obtained mRNA with acid pyrophosphatase, and then the oligocap linker is ligated using RNA ligase targeting the exposed 5'-terminal phosphate group.
  • the phosphate group existing at the 5' end is not removed beforehand so that the oligocap linker is not bound. It is effective to remove by using a phosphatase having the activity of removing only the phosphate group at the 5 'end.
  • this RNA molecule as type III as a primer on the 3 side After reverse transcription is performed with reverse transcriptase using oligo dT primer, the RNA strand is degraded and removed.
  • the obtained single-stranded DNA is designated as type III
  • the oligonucleotide having a partial sequence of the oligocap linker is used as a 5 ′ primer, and a polymerase chain reaction is performed using a specific primer (oligo dT primer, etc.) at the 3 ′ end.
  • a full-length cDNA library can be prepared by performing PCR (PCR).
  • the chain length of the primer is usually 15 to 100 nucleotides, preferably 15 to 30 nucleotides.If the length of the cDNA to be amplified is long, it is preferably 25 to 35 nucleotides. and Accurate PCR (LA PCR: Takeshi Hayashi, Separate Volume on Experimental Medicine ⁇ Latest PCR technology, Yodosha; Cheng, S. et al., 369: 684-685 (1994)).
  • the thus obtained cDNA is cloned by inserting it into an appropriate cloning vector.
  • a protein expression vector that can introduce the obtained cDNA clone into a cell and express the protein encoded by the cDNA is preferably used.
  • the host is a mammalian cell or the like
  • pME18SFL3 Genebank AB009864
  • the host is Escherichia coli, pET3, pETll (manufactured by Stratagene), pGEX (Amershamf) Almacia Biotech), and in the case of yeast, p ESP-I expression vector (Stratagene).
  • Bac PAK6 (Clontech) is used.
  • examples include ZAP Express (Stratagene), pSVK3 (Amersham Pharmacia Biotech) and the like; TL.
  • the nucleotide sequence of the thus obtained cDNA library is analyzed by a commonly used method known per se.
  • the DNA of the present invention is obtained by analyzing the nucleotide sequence of the obtained cDNA at the 5 'or 3' end, and analyzing the nucleotide sequence at the 5 'or 3' end of the obtained cDNA. 1 on; http / / www. Ncbi. N 1 m. Nih. Gov /) G emban, EMBL, DDB J, PDB, EST, etc.
  • Database B LAST Basiclocalalig nme ntsearchtool; Al tsc hu l , SF, eta 1., J. Mo 1. Biol., 215, 403-410 (1990)
  • Examples of the DNA having the nucleotide sequence of such a full-length cDNA include those having the nucleotide sequences of SEQ ID NOS: 1 to 5.
  • the translated regions include nucleotides 87 to 1124 of SEQ ID NO: 1 and nucleotides 115 to 1 of SEQ ID NO: 2.
  • nucleotides 1232 to 2764 of SEQ ID NO: 3 nucleotides 316 to 1947 of SEQ ID NO: 4
  • nucleotides 151 to 1881 of SEQ ID NO: 5 nucleotides 1232 to 2764 of SEQ ID NO: 5
  • a novel nucleotide sequence as the full length of the cDNA thus obtained is used for homology search (homology search) by BLAST, HMMER (sequence analysis method using hidden Markov model; Eddy, SR, Bioinfo rmatics 14, 755-763 (1 998)), the base sequence is encoded by performing a protein feature search (profilesearchrhttp: // vf am. Wu st 1. edu) using HMM PFAM, which is one of the functions of The function of the protein can be estimated.
  • a sufficiently significant hit sequence means that the identity between the catalytic domain portion of the registered sequence and the corresponding portion of the DNA of the present invention is 30% or more, and e-va 1 ue shows the following: 10- 4 as (query Rere alignment sequence expected to present by chance in a database). For example, if many of the top hit catalytic domain sequences have been confirmed to function as kinases, clones to be analyzed that are similar in sequence will also have the same function, ie, kinase activity. The prediction holds.
  • HMM PFAM is a method that analyzes the characteristics of the amino acid sequence of an entry in a database that integrates protein profiles called P fam by identifying whether the amino acid sequence encoded by the nucleotide sequence to be analyzed has the amino acid sequence. . Profiles are extracted from a series of proteins with the same characteristics. Even if a function cannot be clearly identified by comparing the full length of one sequence to one sequence, if the characteristic region is present in the sequence, the function can be identified and predicted. . As described above, the kinase activity of a cDNA whose protein is predicted to have kinase activity can be confirmed by a biochemical experiment described later.
  • clones determined to be novel as the full-length cDNA above include those having the nucleotide sequences shown in SEQ ID NOS: 1 to 5.
  • the amino acid sequences encoded by these base sequences include those shown in SEQ ID NOs: 6 to 10.
  • the DNA of the present invention thus obtained, whose base sequence is determined, and whose functions are estimated, are only those having the base sequences of SEQ ID NOS: 1 to 5 or the base sequences shown above as the translation regions thereof. Instead, in these base sequences, one or several bases (here, several means, for example, 15 or less, preferably 9 or less, more preferably 6 or less) DNA having a deletion, substitution, Z or addition of a base sequence, and encoding a protein having kinase activity, and a protein which hybridizes with these under stringent conditions and has kinase activity. Also includes DNA coding.
  • these DNAs comprise an amino acid sequence in which one or several amino acid sequences have been deleted, substituted and / or added in the amino acid sequence of the protein described in SEQ ID NOs: 6 to 10, And those encoding proteins having kinase activity.
  • DNA that hybridizes under stringent conditions refers to a nucleotide sequence described in SEQ ID NOS: 1 to 5 and a BLAST analysis of 80% or more, preferably 90% or more, More preferably, a DNA containing a base sequence having a homology of 95% or more can be mentioned.
  • Hybridization under stringent conditions refers to a reaction in a normal hybridization buffer at a temperature of 40 to 70 ° C, preferably 60 to 65 ° C, and the like.
  • the washing can be performed according to a method of washing in a washing solution having a salt concentration of 15 mM to 300 mM, preferably 15 mM to 60 mM.
  • the DNA of the present invention may be obtained by the above-described method or may be synthesized.
  • the DNA base sequence can be easily replaced with a commercially available kit such as a site-directed mutagenesis kit (Takara Shuzo) or a quick change site-directed mutagenesis kit (Stratagene). .
  • the translation region of the protein encoded by the DNA of the present invention converts the nucleotide sequence of the DNA into amino acids using three reading frames to determine the range in which the longest polypeptide is encoded.
  • the amino acid sequence can be deduced as the translation region of the present invention. Examples of such an amino acid sequence include those described in SEQ ID NOs: 6 to 10.
  • the protein of the present invention is not limited to the above amino acid sequence, but comprises an amino acid sequence in which one or several amino acids have been substituted, deleted, and / or added in the amino acid sequence, and Those having kinase activity are also included.
  • the method of transcription and translation of the DNA of the present invention described in (1) by an appropriate method is preferably used.
  • a recombinant vector inserted into a suitable expression vector or a suitable vector together with a suitable promoter is prepared, and this recombinant vector is used to transform a suitable host microorganism or introduced into a suitable cultured cell.
  • this recombinant vector is used to transform a suitable host microorganism or introduced into a suitable cultured cell.
  • the protein of the present invention also includes a protein that is inserted into a vector or the like designed to fuse an appropriate tag to the N-terminus or C-terminus and has a tag added thereto.
  • a tag include daltathione-1S-transferase, polyhistidine, F1ag, and the like.
  • the protein produced by the transformant can be modified by incorporating an amino acid substituted / modified with a heavy atom or the like during protein synthesis.
  • the protein can be converted into a modified protein by arbitrarily modifying it or by partially removing the polypeptide by applying an appropriate protein modifying enzyme before or after purification.
  • terminal modification such as N-terminal acetylation, C-terminal amidation, glycosylation, lipid addition, acylation, methylation, sulfonation, carboxylation, hydroxylation, phosphorylation, ADP-ribosylation, etc.
  • terminal modification such as N-terminal acetylation, C-terminal amidation, glycosylation, lipid addition, acylation, methylation, sulfonation, carboxylation, hydroxylation, phosphorylation, ADP-ribosylation, etc.
  • these modified proteins also have the kinase activity described above, they are included in the scope of the present invention.
  • the protein produced by the above transformant is treated with an appropriate protein-modifying enzyme before or after purification, thereby arbitrarily modifying the protein or partially removing the polypeptide. can do.
  • modified proteins are also included in the scope of the present invention as long as they have the kinase activity described above.
  • the vector used for producing the recombinant vector containing the DNA of the present invention is not particularly limited as long as the DNA is expressed in the transformant.
  • Vectors and phage vectors may be used.
  • a commercially available protein expression vector in which an expression control region DNA such as a promoter suitable for a host into which the DNA is introduced has already been inserted is used.
  • Specific examples of such protein expression vectors include, for example, pET3, pET11 (manufactured by Stratagene) and pGEX (manufactured by Amersham Pharmacia Biotech) when the host is Escherichia coli.
  • pESP-I expression vector manufactured by Stratagene
  • BacP AK6 manufactured by Clontech
  • the host is an animal cell
  • ZAPE xpress Stratagene
  • pS VK3 manufactured by Amersham Pharmacia Biotech
  • pME18SFL3 is preferred.
  • the promoter may be a promoter capable of using a promoter possessed by a host microorganism or a cultured cell.
  • the promoter is not limited thereto.
  • the host is E. coli, T3, T7, tac, 1 An ac promoter or the like can be used.
  • an nmt1 promoter, a Ga11 promoter, or the like can be used.
  • a polyhedrin promoter or the like can be used.
  • SV40 promoter, CMV promoter and the like are preferably used.
  • a promoter specific to the gene of the present invention can also be used. Insertion of the DNA of the present invention into these vectors may be performed by connecting the DNA or a DNA fragment containing the DNA to the amino acid sequence of the protein encoded by the gene DNA downstream of the open motor in the vector.
  • the recombinant vector thus prepared can be used to transform a host described below by a method known per se to prepare a DNA-introduced body.
  • a method for introducing the vector into a host specifically, a heat shock method (J. Mo 1. Bio 1., 53, 154, (1970)), a calcium phosphate method (Science, 221, 551, (1983)), DEAE dextran method (Science, 215, 166, (1982)), in vitro packaging method (Proc. Nat 1. Acad. Sci. USA, 72, 581, (1975)). ), The virus vector method (Cell, 37, 1053, (1984)), and the electric pulse method (Chu. Et al., Nc. Acids Res., 15, 1331 (1987)).
  • the host for preparing the DNA transfectant is not particularly limited as long as the DNA of the present invention is expressed in the body.
  • Arthropod Polyhedrovirus One insect cell or animal cell. Specifically, B L21 and XL-2B 1 ue (Stratagene) for Escherichia coli, SP-Q01 (Stratagene) for yeast, and Ac NPV (J. Biol. Ch for baculovirus). em., 263, 7406, (1988)) and its host, Sf-9 (J. Biol. Chem., 263, 7406, (1988)). As animal cells, mouse fibroblasts C127 (J. Viol., 26, 291, (1978)) and Chinese hamster ovary cells CHO cells (Proc. Natl. Acd. Sci. USA, 77, 4216,
  • COS-7 derived from African green monkey kidney (ATCC CRL 1651: american type culture collection preserved cells), and human fetal kidney derived HE from the viewpoint of expression level and simplicity of screening.
  • K293 cells AT CCCRL 15763 or human cervical cancer HeLa cells
  • a homologous recombination technique (AA Vertesetal., Biosci.) In which the promoter-ligated DNA fragment of the present invention is directly inserted into the chromosome of a host microorganism. Biotechno 1. Biochem., 57, 2036, (1993)), or a transposon or insertion system 1) (AA Vertesetal., Mo 1 ecular Microbiol., 11, 739, (1994)), etc. Can be used to prepare a DNA transductant.
  • the culture obtained above is obtained by collecting cells or cells by a method such as centrifugation, suspending the cells or cells in an appropriate buffer, and sonicating, lysozyme, and / or freeze-thaw. After the disruption by an appropriate method, a crude protein purified solution is obtained by centrifugation, filtration, or the like, and further purified by combining an appropriate purification method. By force, the protein of the present invention is obtained.
  • the DNA of the present invention obtained in the above (1) can be used in a cell-free transcription / translation system (also referred to as a cell-free protein synthesis system). By inducing protein expression, the protein of the present invention can be obtained.
  • the cell-free transcription / translation system used in the present invention is a system containing all the elements necessary for transcription from DNA to mRNA and translation of mRNA to protein. It refers to any system by which the protein encoded by the DNA is synthesized.
  • Specific examples of the cell-free transcription / translation system include a transcription / translation system prepared on the basis of an extract from eukaryotic cells, pecteria cells, or a part thereof.
  • Specific examples of the cell-free protein synthesis system include known ones such as Escherichia coli, plant seed germ, and cell extracts such as egret reticulocytes.
  • Escherichia coli extraction desire may be commercially available ones, or a method known per se, specifically, Escherichia coli extraction desire, is described in Pratt, JM, Transcription and Tranlation (Ed. By Hames, BD and Higgins, SJ), 179- 209, IRL Press, Oxford (1984).
  • a commercially available cell-free protein synthesis system or cell extract those derived from Escherichia coli include E. coli S30 extract system (Promega) and RTS 500 Rapid Tranlation System (Roche).
  • Erythrocyte-derived ones include Rabbit Reticulocyte Lysate System (Promega), and wheat germ-derived ones include PR0TEI0S TM (T0Y0B0).
  • Separation and purification of the protein of the present invention from the obtained transcription-translation product of the cell-free transcription / translation system can be performed by a method known per se and generally used. Specifically, a DNA region encoding an epitope peptide (eg, polyhistidine peptide, glutathione-S-transferase (GST), maltose binding protein, etc.) is introduced into the DNA to be transcribed and translated. Then, the protein can be expressed as described above, and purified using affinity of the protein with a substance having affinity.
  • an epitope peptide eg, polyhistidine peptide, glutathione-S-transferase (GST), maltose binding protein, etc.
  • the expression of the target protein is separated by SDS-polyacrylamide gel electrophoresis and stained with Coomassie brilliant blue (manufactured by Sigma) or by using an antibody that specifically binds to the protein of the present invention described later. It can be confirmed by the detection method. It is generally known that the expressed protein is cleaved (processed) by a proteolytic enzyme present in the living body.
  • the protein of the present invention is, of course, included in the protein of the present invention as long as it has a kinase activity, even if it is a partial fragment of the amino acid sequence that has been cleaved. (3) Confirmation of the activity of the protein of the present invention
  • the protein of the present invention is prepared as a recombinant protein as described in (2) above, and by analyzing this, it can be confirmed that it has the activity estimated in (1). Furthermore, analysis can also be performed by combination with the antibody or the like described in (4) below.
  • the fact that the protein of the present invention has kinase activity can be determined by a conventional method known per se.
  • Specific examples of the method include a method in which a substrate is brought into contact with the recombinant protein, and the amount of ATP consumed when the substrate is phosphorylated by the kinase activity of the recombinant protein and the amount of the product are measured. Will be described below.
  • the reaction solution is a magnesium ion, for example, magnesium chloride or magnesium acetate of 5 to 100 l ⁇ , and a reducing agent.
  • a magnesium ion for example, magnesium chloride or magnesium acetate of 5 to 100 l ⁇
  • a reducing agent for example, 1 to 10 OmM 2-mercaptoethanol or 1-1 OmM dithiothreitol, phosphate-free, neutral to weakly basic buffer, for example, 5 OmM Tris-HCl or HEPES buffer ( ..
  • HEPES buffer solution H 7.0 to 8.0
  • the purified protein of the present invention is added, and the mixture is reacted at room temperature to 37 ° C. for about 24 hours. Measure the amount of ATP consumed or the product of the kinase reaction performed by the protein.
  • a cyclic nucleotide-dependent protein kinase that is a Ser / Thr protein kinase
  • cyclic AMP cyclic AMP
  • cGMP cyclic GMP
  • phospholipid-dependent protein kinase a phospholipid is added to the reaction solution.
  • C-kinase phosphatidylserine is added and histone is used as a substrate.
  • calmodulin is added to the reaction solution, and myosin light chain is used as a substrate. This includes myosin light chain kinase and calmodulin kinase.
  • Tyr protein kinase tubulin, histone, casein, myosin L chain, gastrin, angiotensin, tyrosine monoglutamic acid (1: 4) polymer, etc. are used as substrates.
  • kinase activity measurement a hydrolysis reaction of ATP to ADP by a kinase occurs prior to transfer of a phosphate group to a substrate.
  • the kinase activity can be defined by measuring the amount of ATP hydrolyzed here. In this case, the amount of ATP in the reaction solution in the absence of the substrate is measured, and the consumed ATP is defined as the kinase activity (Whitehoouse, S. et al., J. Biol. Chem., 258: 3693-3701 ( 1983)).
  • the 3 2 P migrating insoluble I inhibit fraction to the substrate protein is phosphorylated measured in a liquid scintillation counter.
  • the reaction solution after the completion of the kinase reaction can be separated by chromatography, and the activity can be measured by the change in the elution position and the amount of change of the phosphorylated substrate. It is possible. In this case, ion chromatography and reverse phase chromatography can be used as the chromatography. It is also possible to measure the activity by measuring the change in mass of the substrate due to phosphoric acid with a mass spectrometer. In this case, the measurement accuracy is further increased by using the above-mentioned chromatography separation in combination.
  • Such a kinase activity analysis system can also be used for evaluation of agonists and antagonists of the protein having the kinase activity of the present invention.
  • the confirmation of the activity of the protein of the present invention is not limited to the method described above.
  • novel proteins including those identified as splicing variants thus obtained, and having kinase activity,
  • the protein may be referred to as “protein to be analyzed”).
  • the protein of the present invention includes a splicing variant of a known protein, it is important to identify how this variant has a function different from that of a known pariant.
  • Specific methods for analyzing functions include, for example, (i) a method for comparative analysis of the expression state in each tissue, disease, or developmental stage, and (ii) a method for analyzing the interaction with other proteins and DNA. (Iii) a method of analyzing phenotypic changes by introducing into appropriate cells or individuals, and (iv) a method of analyzing phenotypic changes by inhibiting the expression of the protein in appropriate cells or individuals.
  • a method for comparative analysis of the expression state in each tissue, disease, or developmental stage and ii) a method for analyzing the interaction with other proteins and DNA.
  • a method of analyzing phenotypic changes by introducing into appropriate cells or individuals
  • iv a method of analyzing phenotypic changes by inhibiting the expression of the protein in appropriate cells or individuals.
  • the expression of the protein of the present invention can be analyzed at the mRNA level or the protein level.
  • analyzing the expression level at the mRNA level for example, in situ hybridization (Application to Developmental Biology & Medicine (Ed. by Harris, N. and Wilkinson, DG)), Cambridge University Press (1990)), a hybridization method using a DNA chip and a quantitative PCR method, and the like.
  • the protein to be analyzed is a splicing variant in which a known variant is present
  • the method is performed by selecting primers that can generate amplified fragments of different lengths between the target variant and the known variant (Wong, Y.W.,
  • a conventional method known per se can be used. Specifically, for example, yeast two-hybrid method, fluorescence depolarization method, surface plasmon method, phage display Method, liposomal display method, etc. It is. Also in this method, when the protein to be analyzed is a splicing variant in which a known variant exists, the known variant is similarly analyzed for interacting substances, and a substance that specifically interacts with the target protein is identified. It is preferable to do it.
  • the cells into which the cDNA of the present invention is introduced are not particularly limited, but human cultured cells are particularly preferably used.
  • the method for introducing DNA into cells is described above.
  • the phenotype of the transfected cells includes microscopic observations such as cell viability, cell growth rate, cell differentiation, neurite outgrowth when cells are neurons, and localization and migration of intracellular proteins. This includes those that can be analyzed and those that can be analyzed by biochemical experiments, such as changes in the expression of specific proteins in cells. In the case of a splicing variant in which a known variant exists, these phenotypes can be similarly introduced into cells, and the phenotype associated with the variant to be analyzed can be identified by comparative analysis. Further, since it is known that the protein of the present invention has a kinase activity, it is also preferable to analyze by paying attention to the phenotype and the like found in a kinase-related disease.
  • the method can be efficiently performed by a method using an oligonucleotide described later or an RNA interference method.
  • the target protein to be analyzed is a splicing variant in which a known variant is present, the same analysis is performed for the known variant and other variants, and the target protein-specific protein is analyzed by comparative analysis. Function can be identified.
  • an antisense oligo having a partial sequence of the DNA of the present invention is obtained by a conventional method using a DNA synthesizer or the like.
  • Oligonucleotides such as nucleotides and sense oligonucleotides can be prepared.
  • the oligonucleotide include DNA having the same sequence as 5 to 100 consecutive nucleotides in the base sequence of the DNA or DNA having a sequence complementary to the DNA.
  • Specific examples include DNA having the same sequence as 5 to 100 consecutive nucleotides in the nucleotide sequence represented by SEQ ID NOS: 1 to 5, or DNA having a sequence complementary to the DNA.
  • the target protein is a splicing variant in which a known variant DNA exists
  • the above oligonucleotides in which the melting temperature (Tm) and the number of bases of both do not extremely change are preferred.
  • the length of the sequence is generally 5 to 100 bases, preferably 10 to 60 bases, and more preferably 15 to 50 bases.
  • oligonucleotide derivatives of these oligonucleotides can also be used as the oligonucleotide of the present invention.
  • the oligonucleotide derivative include an oligonucleotide derivative in which a phosphodiester bond in an oligonucleotide is converted to a phosphorothioate bond, and a phosphodiester bond in an oligonucleotide in which an N3,1-P5'phosphamidate bond is used.
  • Oligonucleotide derivatives in which the report and phosphodiester bond in the oligonucleotide have been converted to peptide nucleic acid bonds oligonucleotides in which the peracyl in the oligonucleotide has been replaced with C-5 propynyl peracyl Derivatives, oligonucleotide derivatives in which peracyl in oligonucleotides is substituted with C-5 thiazoleperacyl, oligonucleotide derivatives in which cytosines in oligonucleotides are substituted with c-15 propynylcytosine, oligonucleotides An oligonucleotide derivative in which cytosine has been substituted with a Fuenokisajin modified cytosine ⁇ enoxazine- mo difledcytosine Roh in, the oligonucleotide derivatives ribose is 2, it is substituted with-O-propyl
  • RNA does not need to be all RNA.
  • DNA the one described in WOO 2/10374 can be used.
  • target gene in the RNA interference method
  • target gene may be any gene as long as it is the DNA of the present invention.
  • a gene predicted to be an ortholog of the gene DNA can also be a target gene.
  • a double-stranded polynucleotide comprising RNA having a sequence substantially identical to at least a part of the base sequence of these DNAs (hereinafter, may be referred to as “double-stranded polynucleotide”) is It comprises a sequence substantially the same as a sequence of 15 bp or more, which may be any portion of the base sequence of the target gene.
  • substantially the same means that it has '80% or more homology with the sequence of the target gene.
  • the double-stranded polynucleotide sequence can be set at the insertion or substitution site.
  • a sequence that spans the deletion is defined as a double-stranded polynucleotide sequence, so that a sequence that is specifically effective for the protein can be selected. it can.
  • the nucleotide chain length can be any length from 15 bp to the full length of the open reading frame (ORF) of the target gene, but can be as small as 15 to 500 bp. Is preferably used. However, it is known that mammalian-derived cells have a signal transduction system that activates in response to a long double-stranded RNA of 30 bp or more.
  • PKR ds RNA-responsiveroteinkinas e: Non-specific inhibition of translation initiation of many genes via Bass, B.L., Nature, 411, 428-429 (2001)
  • 2 '-5'-oligoade ny lates yn thetase Bass, BL, Nature, 411, 428-429 (2001)
  • RNAse L resulting in non-specific degradation of intracellular RNA Is triggered.
  • a double-stranded polynucleotide of 15 to 30 bp, preferably 19 to 24 bp, more preferably 21 bp.
  • the double-stranded polynucleotide does not need to be entirely double-stranded, and includes those having a 5 'or 3' terminal partially protruding, but it is preferable to use a 3 'terminal having two bases protruding.
  • the double-stranded polynucleotide means a complementary double-stranded polynucleotide, but may be a self-annealed single-stranded polynucleotide having self-complementarity.
  • Examples of the single-stranded polynucleotide having autophagy include those having an inverted repeat sequence.
  • the method for preparing the double-stranded polynucleotide is not particularly limited, but a known chemical synthesis method is preferably used.
  • chemical synthesis a single-stranded polynucleotide having complementarity can be separately synthesized, and can be converted into a double-stranded strand by associating them by an appropriate method.
  • the association method include a method in which the above-mentioned polynucleotides are mixed, heated to a temperature at which the double strand is dissociated, and then gradually cooled.
  • the associated double-stranded polynucleotide is confirmed using an agarose gel or the like, and the remaining single-stranded polynucleotide is removed by, for example, decomposing with a suitable enzyme.
  • the transfectant into which the double-stranded polynucleotide prepared in this way is introduced may be any as long as the target gene can be transcribed into RNA or translated into protein in the cell.
  • specific examples include those belonging to plants and animals.
  • the plant may be a monocotyledonous, dicotyledonous or gymnosperm, and the animal may be a vertebrate or invertebrate.
  • vertebrates examples include fish, pests, goats, pigs, sheep, hamsters, mice, rats, and mammals, including humans, and invertebrates include nematodes, worms, Includes fly (D rosophi 1a), and other insects.
  • the cells are vertebrate cells.
  • the transfectant means a cell, a fibrous tissue or an individual.
  • the cell may be germ line or somatic, totipotent or pluripotent, divided or undivided, parenchymal or epithelial, immortalized or transformed, and the like.
  • the cell may be a gamete or an embryo, in the case of an embryo, a single cell embryo or a constitutive cell, or a cell from a multi-cell embryo, including fetal tissue. Furthermore, they may be undifferentiated cells, such as stem cells, or fraction cells, such as cells of an organ or tissue, including fetal tissue, or any other cells present in an organism.
  • Differentiating cell types include adipocytes, fibroblasts, muscle cells, cardiomyocytes, endothelial cells, nerve cells, glia, blood cells, megakaryocytes, lymphocytes, macrophages, neutrophils, eosinophils, Includes basophils, mast cells, leukocytes, granulocytes, keratinocytes, osteoblasts, osteoclasts, hepatocytes and cells of the endocrine or exocrine glands.
  • Methods for introducing the double-stranded polynucleotide into the recipient include calcium phosphate, electroporation, lipofection, virus infection, and double-stranded when the recipient is a cell or tissue. Immersion in a polynucleotide solution or a transformation method is used. Examples of the method for introducing the gene into the embryo include microinjection, electoral poration, and virus infection. When the recipient is a plant, injection, perfusion, or spraying into the body cavity or stromal cells of the plant is used.
  • the double-stranded polynucleotide can be mixed directly with the food of the organism.
  • it can be administered, for example, by administration as an implanted long-term release preparation or the like, or by ingesting an introduced body into which a double-stranded polynucleotide has been introduced.
  • the amount of the double-stranded polynucleotide to be introduced can be appropriately selected depending on the introduced substance and the target gene, but it is preferable to introduce an amount sufficient to introduce at least one copy per cell. Specifically, for example, when the transfectant is a cultured human cell and a double-stranded polynucleotide is introduced by the calcium phosphate method, 0.1 to L: 0.000 nM is preferred.
  • the function of the protein encoded by the gene of the present invention can be confirmed, or a new function can be analyzed.
  • an antibody that specifically binds to the protein of the present invention As a method for preparing an antibody that specifically binds to the protein of the present invention, a commonly used known method can be used.
  • the polypeptide used as an antigen also has a high antigenicity according to a known method and is used for epitope ( An appropriate sequence can be selected and used as the antigenic determinant.
  • An appropriate sequence can be selected and used as the antigenic determinant.
  • commercially available software such as Epitope Adviser (manufactured by Fujitsu Kyushu System Engineering Co., Ltd.) can be used.
  • the target protein is a splicing variant in which a known variant is present, the use of an antibody that reacts only with the target protein and does not react with a known or other variant allows the target protein to be used as a splicing variant.
  • an epitope of such an antibody for example, when there is an amino acid sequence in which the target protein is deleted as compared with a known variant, an amino acid sequence before and after the deleted portion (junction portion) is preferable. In addition, when the target protein has an amino acid sequence to which an N-terminal or C-terminal of a known variant is added, It is also preferable that the present amino acid sequence be an epitope.
  • an antibody that reacts only with the target protein can be obtained by removing an antibody that reacts with a known or other variant from the polyclonal antibody obtained with respect to the target protein. As a removing method, affinity mouth chromatography in which a known or other variant is immobilized as a ligand, or an immunoprecipitation method using a known or other variant is used.
  • polypeptide used as the above-mentioned antigen a synthetic peptide synthesized according to a known method, or the protein itself of the present invention can be used.
  • a polypeptide serving as an antigen may be prepared in an appropriate solution or the like according to a known method, and immunized to a mammal, for example, a heron, a mouse, a rat, or the like. Stable immunization or antibody titer may be performed.
  • the route of administration of the antigen upon immunization is not particularly limited, and any route such as subcutaneous, intraperitoneal, intravenous, or intramuscular route may be used. Specifically, for example, a method of inoculating a BALB / c mouse several times every several days to several weeks with an antigen polypeptide is used.
  • the amount of the antigen to be taken is preferably about 0.3 to 0.5 mg Zl when the antigen is a polypeptide, but is appropriately adjusted depending on the type of the polypeptide and the animal species to be immunized.
  • test blood is collected as appropriate, and an increase in antibody titer is confirmed by methods such as the Octaloni method, enzyme-linked immunosorbent assay (hereinafter sometimes referred to as "ELISA"), and Western blotting.
  • ELISA enzyme-linked immunosorbent assay
  • Blood should be collected from animals with sufficiently raised antibody titers.
  • a polyclonal antibody can be obtained by subjecting this to an appropriate treatment used for the preparation of the antibody. Specifically, for example, there is a method of obtaining a purified antibody obtained by purifying an antibody component from serum according to a known method. For purification of the antibody component, methods such as salting out, ion exchange chromatography, and ab- ity chromatography can be used.
  • a monoclonal antibody was prepared by using a hybridoma fused with spleen cells of the animal and myeloma cells according to a known method (Milstein, eta 1., Nature, 256, 495 (1975)). You can do it.
  • a monoclonal antibody can be obtained, for example, by the following method.
  • antibody-producing cells are obtained from an animal whose antibody titer has been raised by immunization with the above-mentioned antigen.
  • the antibody-producing cells are plasma cells and lymphocytes which are precursor cells thereof, which may be obtained from any of the individuals, but is preferably obtained from spleen, lymph nodes, peripheral blood and the like.
  • the myeloma to be fused with these cells is generally a cell line obtained from a mouse, for example, an 8-azaguanine-resistant mouse (such as one derived from BALBZc), a myeloma cell line P3X63-Ag8.653.
  • P 3 -NS 1/1 Ag 4.1 (RIKEN cell bank: RCB 0095) and the like are preferably used.
  • antibody-producing cells and myeloma cells are mixed at an appropriate ratio, and mixed in an appropriate cell fusion medium, such as RPMI 1640, Iscove's modified Dulbecco's medium (IMDM), or Dulbecco's modified Eagle's medium (DMEM).
  • IMDM Iscove's modified Dulbecco's medium
  • DMEM Dulbecco's modified Eagle's medium
  • PEG polyethylene glycol
  • It can also be performed by the electrofusion method (U. Zimmermann. Eta1., Naturwisssens schafaten, 68, 577 (1 981)).
  • Hybridoma is normal medium (HAT medium) in 5% C0 2 containing an appropriate amount of hypoxanthine 'aminopterin-thymidine (HAT) solution by utilizing the myeloma cell line is a 8-Azaguanin resistant strain used, It can be selected by culturing at 37 ° C for an appropriate time. This selection method can be appropriately selected and used depending on the myeloma cell line to be used.
  • the antibody titer of the antibody produced by the selected hybridoma is analyzed by the method described above, the hybridoma producing the antibody with a high antibody titer is separated by limiting dilution, etc., and the separated fused cells are cultured in an appropriate medium.
  • a monoclonal antibody For purification, a commercially available monoclonal antibody purification kit can also be used. Furthermore, by growing the antibody-producing hybridoma obtained above in the abdominal cavity of an animal of the same strain as the immunized animal or a nude mouse, ascites containing a large amount of the monoclonal antibody of the present invention can be obtained. You can also.
  • human peripheral blood lymphocytes are transplanted using the polypeptide or a partial peptide thereof as an antigen.
  • a human antibody can also be prepared by immunizing a mouse in the same manner as described above, and preparing a hybridoma of the antibody-producing cells of the immunized animal and the human myeoma cells. (Mosier, DE, eta 1. Nature, 335, 256-259 (1988); Duchosal, MA, eta 1., Nature, 355, 258-262 (1992)).
  • RNA is extracted from the obtained hybridoma producing the human antibody, the gene encoding the desired human antibody is cloned, this gene is inserted into an appropriate vector, and this is inserted into an appropriate host.
  • a human antibody By introducing the antibody into a human, it is possible to produce a human antibody in a larger amount.
  • an antibody with low binding to an antigen can be obtained as an antibody with even higher binding by using an evolutionary engineering technique known per se.
  • a partial fragment such as a transient antibody can be prepared by, for example, cleaving the Fab and Fc portions using papain or the like, and collecting the Fab portion using an affinity column or the like.
  • the antibody that specifically binds to the protein of the present invention obtained by forcing can also be used as a neutralizing antibody that specifically binds to the protein of the present invention and thereby inhibits the kinase activity or the like of the protein. .
  • a neutralizing antibody can be used alone when the clinical application is used, or can be used as a pharmaceutical composition by mixing with a pharmaceutically acceptable carrier. At this time, the ratio of the active ingredient to the carrier can be varied between 1 and 90% by weight.
  • powerful drugs can be administered in various forms, such as tablets, capsules, granules, powders, or syrups for oral administration, or injections, infusions, ribosomes And parenteral administration using suppositories and the like.
  • the dose can be appropriately selected depending on symptoms, age, weight, and the like.
  • This method of screening for a regulatory substance may be any method as long as it can obtain a substance that specifically binds to the protein of the present invention and has an activity of inhibiting, antagonizing, or enhancing the activity of the protein.
  • the protein of the present invention is brought into contact with a substance to be subjected to screening (hereinafter, this may be referred to as a “test substance”), and after selection using the binding property to the protein as an index, A method for selecting a test substance using the change in the activity of the protein of the present invention as an index can be used.
  • the test substance may be any substance that can interact with the protein of the present invention and affect the activity possessed by the protein. Examples thereof include peptides, proteins, non-peptidic compounds, low-molecular compounds, synthetic compounds, fermentation products, cell extracts, and animal tissue extracts. These substances may be novel substances or known substances.
  • a conventional method known per se can be used.
  • the yeast two-hybrid method examples include the fluorescence depolarization method, the surface plasmon method, the phage display method, the liposomal display method, and the competition analysis method with the antibody described in (6) above.
  • the substance found to bind to the protein of the present invention by such a method is then analyzed by analyzing how the activity of the protein of the present invention is affected in the presence of the substance.
  • the power used as a modulator is identified.
  • the target protein is a splicing variant in which a known variant is present
  • the effect of a substance that binds only to the target protein and does not bind to a known or other variant is analyzed. It is also possible to analyze the effect of the substance on the target protein by identifying whether or not it binds to the same or another variant, and analyzing the difference in the effect of the binding. it can. In addition, by examining the distribution of the substance in an individual, it is possible to analyze the effect on the target protein and known or other variants.
  • a protein serving as a substrate is introduced into the DNA-introduced gene described in (2) in the same manner.
  • phosphoric acid of the base protein of the transductant is analyzed by a commonly used method known per se. Specifically, it can be performed using the method described in the above (3). If the phosphorylation of the substrate protein is increased as compared to the absence of the substance, the substance may function as a kinase active substance, and if reduced or inhibited, the substance may Can be identified as potentially functioning as kinase inhibitors.
  • the DNA of the present invention when using the DNA of the present invention or a recombinant protein used for screening a regulatory substance for the purpose of obtaining a pharmaceutically active ingredient, it is preferable to use human DNA or a protein. Further, the substance screened by the above method is further screened in vivo to obtain a drug substance. A supplementary selection may be made.
  • the evaluation of the function regulating substance of the protein of the present invention is not limited to the method described above.
  • the kinase activity of the protein of the present invention includes, for example, signaling functions on pathways related to cancer, signaling functions on pathways related to myocardial development, signaling on pathways controlling sperm motility. Functions, signaling on pathways that regulate germ cell differentiation, signaling on pathways that regulate cell differentiation, signaling on pathways that regulate sperm segregation, pathways that regulate the onset of Alzheimer's disease Signaling function, glycerol triphosphate-generating function, cerebral cortex development, pathway that controls migration of nerve cells, etc., signaling function, function related to fatty acid sterol synthesis, pathway related to cell death The above signaling function, insulin signaling, etc.
  • compounds that can be identified by the present screening method can be used as anticancer agents, therapeutic agents for heart diseases, therapeutic agents for infertility, agents for inducing regenerated tissue, therapeutic agents for Alzheimer's disease, therapeutic agents for neurodegenerative diseases, and therapeutic agents for diabetes.
  • the protein of the present invention is cloned from a cDNA library constructed from testis, trachea, cultured cells derived from brain Darioma cells, and the like. And the like may have a specific function, and thus can be used as a therapeutic agent for diseases specific to the tissues and organs.
  • the above-mentioned active ingredient can be used alone for clinical application, but it can also be used as a pharmaceutical composition by mixing with a pharmaceutically acceptable carrier. At this time, the ratio of the active ingredient to the carrier can be varied between 1 and 90% by weight.
  • powerful drugs can be administered in various forms, such as tablets, capsules, granules, powders, or syrups for oral administration, or injections, infusions, ribosomes And parenteral administration using suppositories and the like.
  • the dose can be appropriately selected depending on symptoms, age, weight, and the like.
  • Screening of the DNA expression regulator of the present invention examples include a method of analyzing the expression level of the protein of the present invention or the mRNA encoding the same in the presence of a test substance.
  • a method of analyzing the expression level of the protein of the present invention or the mRNA encoding the same in the presence of a test substance Specifically, for example, cells expressing the protein of the present invention described in (2) are cultured in an appropriate medium containing a test substance, and the amount of the protein of the present invention expressed in the cells is determined by ELISA. Or by analyzing the amount of mRNA encoding the protein of the present invention in the cells by quantitative reverse transcription PCR, Northern blot, or the like. .
  • test substance those described in (7) can be used. According to this analysis, if the amount of the protein or mRNA expressed in the cells cultured in the absence of the test substance increases as compared with the amount of the mRNA, the test substance of the present invention It may function as a DNA expression promoting substance, and when it decreases, it can be determined that this test substance can be used as a DNA expression inhibiting substance of the present invention.
  • the above-mentioned active ingredient can be used alone for clinical application, but can also be used as a pharmaceutical composition by blending it with a pharmaceutically acceptable carrier. At this time, the ratio of the active ingredient to the carrier can be varied between 1 and 90% by weight.
  • the drug can be administered in various forms.
  • Examples of the dosage form include oral administration of tablets, capsules, granules, powders, syrups, and the like, or injections, drops, ribosomes, and the like. And parenteral administration using suppositories and suppositories.
  • the dose can be appropriately selected depending on the condition, age, weight, and the like.
  • the introduced DNA containing the DNA of the present invention described in the above (1) is constructed, introduced into a fertilized egg of a mammal other than a human, and transplanted into a female individual uterus to generate the DNA.
  • a non-human mammal into which the DNA of the present invention has been introduced can be produced. More specifically, for example, a female individual is superovulated by hormone administration, then mated with a male, a fertilized egg is removed from the oviduct on the first day after mating, and DNA is introduced into the fertilized egg by microinjection. And so on. After this, after culturing by an appropriate method, Surviving fertilized eggs are transplanted into the uterus of a pseudopregnant female individual (foster parent) to give birth.
  • Non-human mammals include, for example, mice, rats, guinea pigs, hamsters, rabbits, goats, pigs, dogs, cats, and the like.
  • the thus-obtained DNA-introduced animal of the present invention obtains its offspring by crossing this individual and subculturing it in a normal breeding environment while confirming that the introduced DNA is stably maintained. be able to. It is also possible to obtain offspring by repeating in vitro fertilization and maintain the strain.
  • the non-human mammal into which the DNA of the present invention has been introduced can be used as an analysis of the function of the DNA of the present invention in a living body, or as a screening system for a substance regulating the same.
  • the protein of the present invention can be used as a carrier on which it is bound.
  • a nucleotide sequence encoding the protein of the present invention for example, DNA having a nucleotide sequence shown in SEQ ID NOS: 1 to 5 or a partial fragment thereof can be used as a carrier obtained by binding them to a substrate. These are referred to below as “protein chips",
  • DNA chip or “DNA array” (DNA microarray and DNA macroarray).
  • DNA array DNA microarray and DNA macroarray.
  • proteins and DNA may contain other proteins and DNA in addition to the protein and DNA of the present invention.
  • the target protein is a splicing variant in which a known variant is present
  • an amino acid sequence partial fragment specific to the target protein can be used for the protein chip, but the protein chip has a different three-dimensional structure from other variants. It is possible that the entire length can be used.
  • the DNA array has It is preferable to select a sequence that is different from other variant DNAs from the DNA sequence encoding the target protein.
  • a resin substrate such as a nylon film or a polypropylene film, a nitrocellulose film, a glass plate, or a silicon plate is used.However, detection of hybridization is non-RI. For example, when using a fluorescent substance or the like, a glass plate or a silicon plate containing no fluorescent substance is preferably used.
  • binding of the protein or DNA to the substrate can be easily performed by a commonly used method known per se.
  • the amino acid sequence of the protein of the present invention and the nucleotide sequence of DNA can also be used as sequence information.
  • the nucleotide sequence of the DNA includes the nucleotide sequence of the corresponding RNA. That is, a database of amino acid sequences and base sequences can be constructed by storing the obtained amino acid sequences and base sequences in an appropriate recording medium in a predetermined format readable by a computer. This database may include the nucleotide sequences of other types of proteins and the DNA encoding them. Further, in the present invention, the database also means a computer system that writes the above-mentioned sequence on an appropriate recording medium and performs a search according to a predetermined program.
  • Suitable recording media include, for example, magnetic media such as flexible disks, hard disks, and magnetic tapes, optical disks such as CD-ROM, MO, CD-R, CD-RW, DVD-R, DVD-RAM, and semiconductors. Examples include a memory.
  • magnetic media such as flexible disks, hard disks, and magnetic tapes
  • optical disks such as CD-ROM, MO, CD-R, CD-RW, DVD-R, DVD-RAM, and semiconductors. Examples include a memory.
  • Example 1 Preparation of cDNA library by oligocap method From human cultured cells (H4 cells, which are cultured cells derived from human brain glioma cells, ATCC: HTB-148), the literature (J. Sambrook, eta 1., Molecular Cloning S econdedition, Coll. NiRNA was extracted by the method described in Springharbor La boratory Press (1989). Furthermore, po 1 y (A) + RNA was purified using oligo dT cellulose.
  • H4 cells which are cultured cells derived from human brain glioma cells, ATCC: HTB-148
  • the literature J. Sambrook, eta 1., Molecular Cloning S econdedition, Coll. NiRNA was extracted by the method described in Springharbor La boratory Press (1989). Furthermore, po 1 y (A) + RNA was purified using oligo dT cellulose.
  • the oligocap method was carried out using po 1 y (A) + RNA obtained above and commercially available human tissue mRNA (Clontech: testis (# 64027-1), trachea (# 64091-1)).
  • RNA was treated with BAP (Bac ter e r Al A k a l ine Po s p a tha s a se) and TAP (To bac Ac i d P yr rop pho s p tha tas a se), and then ligated with an oligocap linker (SEQ ID NO: 11) using an RNA ligase.
  • BAP Boc ter e r Al A k a l ine Po s p a tha s a se
  • TAP To bac Ac i d P yr rop pho s p tha tas a se
  • the first strand cDNA was synthesized by reverse transcription using an oligo dT primer (SEQ ID NO: 12) using this RNA strand as type III, and then the RNA strand was degraded and removed (Suzuki et al., Protein Nucleic Acid Enzyme, 41, 603- 607 (1996); Su zuki, Y. eta 1., Gene, 200, 149-156 (1997)). Then, double-stranded cDNA was amplified by PCR (polymerase chain reaction) using PCR primer (5) (SEQ ID NO: 13) and 3 ′ PCR primer (SEQ ID NO: 14), and the amplified DNA strand was Cut with S fi I.
  • pME18SFL3 (GenBank ABO09864), which is an expression vector, to prepare a cDNA library.
  • the pME18SFL3 vector used above incorporates the SR ⁇ promoter and SV40 sma11t intron upstream of the cloning site, and has inserted the SV40 poly A attached carosignal sequence downstream thereof. I have.
  • Cloning site of pME 18 SFL 3 is asymmetric Dra III site, which has a complementary SfiI site at the end of the cDNA fragment, so that the cloned cDNA fragment is SRQ; downstream of the promoter. Introduced in one direction.
  • the gene in a clone containing full-length cDNA, the gene can be transiently expressed by introducing the obtained plasmid into COS cells as it is. In other words, it is very easy to experimentally analyze proteins as gene products or their biological activities.
  • the nucleotide sequence at the 5 'end of the human cDNA library prepared in Example 1 was compared with the sequence of a known human mRNA in the public database. If the 5 'end is longer than the known mRNA sequence, or if the 5' end is shorter but has a translation initiation codon, it is judged as "full length”. Full length ".
  • the clones were evaluated by EST imate FL.
  • EST iMate FL was developed by Nishikawa and Ota, et al. Of the Helix Laboratory to select clones with high potential for full-length cDNA by comparing them with the EST 5, 5 and 3 'end sequences in public databases. This is a developed method.
  • Example 3 Analysis of nucleotide sequence and amino acid sequence of cDNA clone
  • BLAST Bas1 clocalalig nmentsearchtool; A1tschu1, SF, eta 1., J. Mo 1. Biol., 2 15, 403-410 ( 1990)
  • homology search homology search
  • HMMER sequence analysis method using hidden Markov model
  • the vector (pEU-SS4) was inserted into the cloning site.
  • the plasmid DNA prepared above was used as type I, transcribed using SP6 RA Polymerase (Promega), and the obtained RNA was extracted with phenol / cloth form, ethanol precipitated, and then Nick Column. (Amersham Pharmacia Biotech).
  • the reaction solution contains 24% of the wheat germ extract by volume, and has the following composition according to the method of Erickson et al. 20 mM HEPES-K0H, pH 7.6, 80 mM potassium acetate, 1.6 mM magnesium acetate, 0.4 mM spermidine, 2 raM dithiothreitol, 20 kinds of L-amino acids (0.24 mM each), 1.2 mM ATP, 0.26 ⁇ GTP, 16 raM
  • the above mRNA (1 rag / ml reaction volume) was added to inhibitor (RNasin TM) and used.
  • the above reaction solution was placed in a floater riser (Spectra / Float-A-Lyzer (Biotech RC), molecular weight cut off: 10 kDa, volume: 1 ml), and the dialysis solution (30 mM HEPES) was used 40 times the volume of the reaction solution.
  • the dialysate was centrifuged at 16,000 rpm for 5 minutes, and the supernatant was separated.
  • This supernatant was diluted 5-fold with 50 mM Tris' hydrochloric acid buffer (pH 8.5) containing 150 mM sodium chloride and 10 mM dithiothreitol, and was equilibrated with the same buffer.
  • Glutathione Sepharose '4B manufactured by Amersham Biosciences was added to an affinity column packed at room temperature to adsorb the target protein.
  • an affinity resin of 1Z2 amount of the obtained centrifugal supernatant was used for the column.
  • the target protein isolated in the above (1) was quantified using human serum albumin as a standard. 0.1 ⁇ g of the target protein was dissolved in 50 mM Tris' hydrochloric acid buffer (pH 7.4) containing 0.2 mg / m 1 serum albumin and 8 mM magnesium chloride at a final concentration of 1 to 1 OmM. After adding dithiothreitol, 1 J uM ATP After incubation at room temperature for 24 hours, 100 ⁇ l of luciferase / luciferin kit (manufactured by Wako Pure Chemical Industries, Ltd.) was added, and after reacting at room temperature for 24 hours, the fluorescence intensity at 560 ⁇ m was measured.
  • the fluorescence intensity at 560 nm was measured in the same manner.
  • the difference between the value of this control and the value of the system to which the target protein was added is defined as the amount of ATP consumed by the target protein. Identified as live.
  • the target protein isolated in (1) above was quantified using serum albumin as a standard. 0.1 ⁇ g of target protein is converted to a standard polypeptide as a substrate (Cdc2, Arg2-OH, PKA, PKC, DNA_PK, PTK1, PTK2: Promega, MLCKS, Ca MK II : Sigma, Syntide 2: BACHEM FE I NCHEMI KAL I EN AG) 0.2 ⁇ g, 0.2 mg / m 1 ⁇ cysteine albumin, 1 to 10 mM dithiothreitol, 8 The cells were incubated with 5 OmM Tris.HCl buffer (H7.4) containing 1 mM ATP containing 1 mM ATP for 2 hours at room temperature.
  • present DNA cb ng h4200501 7
  • present protein protein encoded by the DNA
  • SEQ ID NO: 1 consisting of 1828 bases, of which base number 87 From 1 to 124 are open reading frames (including the stop codon).
  • the amino acid sequence predicted from the open reading frame consists of 345 amino acid residues (SEQ ID NO: 6).
  • a homology search was performed for the amino acid sequence of SEQ ID NO: 6 using BLAST, and the results were obtained in the NRDB protein database (a database of non-redundant amino acid sequences created from SWI SS—PROT, PIR, TREMBLE, GENPEPT, and PDB).
  • ALS 2CR7 am yotropiclateralsclero sis 2 CR 7 ⁇ h ma n
  • ALS 2 CR 7 consists of 384 amino acid residues.
  • the amino acid sequence completely matches amino acid Nos. 52 to 181 of the amino acid sequence of No. 152 to 285, and completely matches amino acid Nos. 182 to 315 of the amino acid sequence of SEQ ID NO. That is, the present protein lacks amino acids 131 to 151 of the amino acid sequence of ALS2CR7, and has a novel sequence at the N-terminus 1 to 51 and the C-terminus 316 to 345.
  • AB 053308 is composed of 14 ethasons, the DNA of which lacks 1, 6, 11, 11, 12, 13 and 14 exons, and 2nd, 3, 4, 5, 7, 8, 9, 10 exons Was sharing.
  • the 21 amino acid deletion of ALS2CR7 in the protein described above is due to skipping of the sixth exon.
  • the N-terminal 51 amino acid residue of the present protein was due to the presence of another etason not present in AB 053308 at the 5 'end of the present DNA.
  • this protein is derived from mRNA expressed from a promoter different from amy otrophiclateral sclero sis 2 CR7 (human) .It has different N-terminal and C-terminal sequences and is deleted at the center. Was found to be a variant with.
  • Syntide 2 (SEQ ID NO: 21) was added as a substrate.
  • a decrease in the peak of the substrate on reversed-phase HPLC and elution of a new peak (arrow in Fig. 1) were confirmed.
  • this protein has a different sequence at both the N- and C-termini of ALS2CR7 and lacks a part of the Protein kinase domain, but protein kinase activity was found. It was presumed that this protein had a function different from that of ALS 2 CR7.
  • cDNA encoding the present protein was cloned from cultured cells derived from brain Dariomas cells, and was predicted to be related to the development and function of organs unique to the tissue and diseases.
  • c-testi 2025879 (hereinafter referred to as “present DNA” and the protein encoded by the DNA is referred to as “present protein”) comprises 2195 bases as shown in SEQ ID NO: 2, of which base number 1 From 15 to 2094 were open reading frames (including the stop codon).
  • the amino acid sequence predicted from the open reading frame consists of 659 amino acid residues (SEQ ID NO: 7).
  • a protein characteristic search was performed on the amino acid sequence of SEQ ID NO: 7 using HMMPFAM.
  • the amino acid sequence represented by amino acid numbers 413 to 659 of SEQ ID NO: 7 showed a sequence (Pf an ⁇ an amino acid sequence that is entered as a pkinase).
  • a homology search was performed using BLAST for the amino acid sequence of SEQ ID NO: 7, and the NRDB protein database (a database of non-redundant amino acid sequences created from SWI SS—PROT, PIR, TR EMBLE, GENPEPT, and PDB) or in the patent database GENESEQ, (i) a database registration symbols AX166558, and WOO amino acid sequence set forth in 1/38503 Patent Publication No., e- V a 1 ue: over 5 X 10- 148, 257 amino acids 9 Hits with 9% match.
  • AX166558 was composed of 278 amino acids, and amino acid numbers 1 to 257 in the amino acid sequence corresponded to amino acid numbers 403 to 659 of the amino acid sequence described in SEQ ID NO: 7 by 99% as described above. That is, The protein is a protein that is 402 amino acids longer at the N-terminus and 21 amino acids shorter at the C-terminus than AX166658.
  • AX166558 protein is novel mitogen-activated kinase (MAPK).
  • AF093669 (Dictyostelium discoideum MEK kinase a) has 43% identity over 270 amino acid residues
  • AB0 0 0 7 9 7 (Arabidopsis thaliana NPK-related protein kinase) was hit with a 48% match over 260 amino acid residues.
  • both cDNAs were compared on the genomic sequence of human chromosome 2 (database registration code: emb
  • This DNA consists of three exons, but in AX1666.58, there is no first exon of this DNA, starting in the middle of the second exon, sharing the third exon halfway, and then another exon Had.
  • the amino acid sequence of AX1665558 does not start with methionine and is presumed to be an incomplete protein.However, this protein starts with methionine, and the N-terminal is 40% lower than that of AX1665958. It was confirmed that the length was 2 amino acid residues longer.
  • this protein is a variant in which the N-terminal of the protein described in AX 166558 and WOO 1/38503 is extended, and has a kinase activity.
  • the present DNA was cloned from the testis, and was presumed to be related to the development, function, and disease of organs unique to tissues.
  • c-trach 2020048 (hereinafter referred to as “present DNA” and the protein encoded by the DNA is referred to as “present protein”) comprises 3255 bases as shown in SEQ ID NO: 3, of which base number 1232 To 2764 had an open reading frame (including a stop codon).
  • the amino acid sequence predicted from the open reading frame consists of 510 amino acid residues (SEQ ID NO: 8).
  • a homology search using BLAST was performed on the amino acid sequence of SEQ ID NO: 8, and it was found in the NRDB protein database (a database of non-overlapping amino acid sequences created from SWI SS—PROT, PIR, TREMBLE, GENPEPT, and PDB).
  • AX4056 33-1 unnamed ORF hit with e-value: 0, 96% concordance over 527 amino acid residues.
  • AX405633-1 was a protein similar to Nek3 (a novel human protein kinase) described as SEQ ID NO. 492 in WO 02Z22660.
  • AX405633-1 is composed of 527 amino acids, wherein amino acid numbers 1 to 313 of the sequence correspond to amino acids 1 to 313 of the amino acid sequence of the present protein (SEQ ID NO: 8), and amino acids 331 to 527 correspond to amino acids 314 to 314 of the present protein. It was exactly the same as the number 510.
  • AX4 Amino acid number 162 of 05633-1 is glycine, whereas valine was the amino acid corresponding to that of this protein.
  • the present protein is a variant in which the amino acid sequence of amino acid Nos. 314 to 330 of AX405633-1 has been deleted and a single amino acid substitution mutation has occurred. Since the substitution of amino acid No. 162 at AX405633-1 for palline / glycine has been recognized in other known variant proteins (eg, the protein described in WO 00/0006728), it is considered to be a mutation due to SNP. Can be Therefore, essentially, the deletion of 17 amino acids (amino acid Nos. 314 to 330 of the amino acid sequence of AX405633-1) in the central part (between amino acids 313 and 314 of SEQ ID NO: 8) is the structure of this protein. Is singular.
  • This deleted region has one site that is phosphorylated by PKA, one site that is phosphorylated by casein kinase II, and one site that is myristylated, and serves as various post-translational modification sites.
  • Comparison of this DNA with the cDNA of AX405633-1 using the genomic sequence of human chromosome 13 encoding AX405633-1 (database registration code: emne
  • the present protein is known as AX405633-1, ie, Nek3 described as SEQU ID NO. 492 in WO 02/22660.
  • c-testi 2016663 (hereinafter referred to as “present DNA” and the protein encoded by the DNA is referred to as “present protein”) is composed of 2259 bases as shown in SEQ ID NO: 4, of which base number 316 From 1947 to 1947 had open reading frames (including the stop codon).
  • the amino acid sequence predicted from the open reading frame consists of 543 amino acid residues (SEQ ID NO: 9).
  • a homology search was performed for the amino acid sequence of SEQ ID NO: 9 using BLAST, and it was found in the NRDB protein database (a database of non-overlapping amino acid sequences created from SWI SS—PROT, PIR, TREMBLE, GENPEPT, and PDB).
  • AX 36220 7-1 unnamed ORF, hit e-value: 0, 504 amino acid residues with 99% agreement.
  • AX362207-11 consists of 974 amino acids, and its amino acid number 470-973 is the same as amino acid number 1-502 of the amino acid sequence described in SEQ ID NO: 9 except for the four amino acid residues described below. Match.
  • AX 362207-1 was described in WO 02/08253 publication, and it was described as HumanEphAfulllengthkiinase.
  • amino acid sequence described in SEQ ID NO: 9 of the present protein was described in AX 362207-1 and WO 02/08253 described above.
  • the amino acid numbers 1-469 and 682 and 683 of the amino acid sequence of No. 1 were deleted, and mutations were found in amino acid numbers 681, 740 and 893.
  • nucleotide sequence of SEQ ID NO: 4 has the nucleotide numbers 1-1248 and 2042-2047 of the nucleotide sequence described in AX362207-1 and WO 02/08253 deleted, and the nucleotide sequence of SEQ ID NO: 2040 Mutated to 2219 and 2677 was observed. From these results, it was found that this protein is a variant in which the N-terminal 469 amino acids of Eprinreceptor family have been deleted using single-transmembrane receptor kinase.
  • the present DNA was compared with the cDNA sequence of AX362207-1 on the genome sequence of human chromosome 1 encoding AX362207-1 (database registration code: embl
  • the cDNA of AX362207-1 consists of 16 exons.
  • the present DNA has a structure in which a new sequence of C-terminal 41 amino acid is added by sharing the 5th to 15th ethasons and the middle of the 16th ethasons, and then having three exons. .
  • AX 362207-1 has a stop codon in the 16th exon and ends with one amino acid that is not shared with this protein.
  • this DNA has another untranslated exon before the fifth exon of AX362207-1, this DNA is generated by alternative promoter with AX362207-1, and the N-terminal of AX362207-1 Encodes a protein lacking. Thus, this DNA indicates that its transcriptional regulation and translation product are different from AX362207-1 due to its structure.
  • this protein is a protein with a large deletion of the N-terminal extracellular domain of the transmembrane receptor, a sequence involved in protein interaction near the C-terminal, and a novel sequence at the C-terminal part.
  • the present protein is a protein that interacts with intracellular proteins and causes signal transduction regardless of extracellular stimulation.
  • the ATP consuming activity of this protein was 43.1 as measured by the system of Example 4 (2), and it was confirmed that the protein had kinase activity.
  • Syntide 2 SEQ ID NO: 21
  • CaMK II SEQ ID NO: 22
  • the present DNA was cloned from the testis, and it was speculated that the present protein is related to the development, function, and disease of organs unique to the tissue.
  • the present DNA and the protein encoded by the DNA is referred to as “the present protein”
  • the present DNA is composed of 2028 bases as shown in SEQ ID NO: 5, of which base number 151 To 1881 had an open reading frame (including a stop codon).
  • the amino acid sequence predicted from the open reading frame consists of 576 amino acid residues (SEQ ID NO: 10).
  • a homology search was performed for the amino acid sequence of SEQ ID NO: 10 using BLAST.
  • Q9BXU1 I ST31 is composed of 1019 amino acids. And match.
  • the present protein is a variant lacking the 443 amino acids at the N-terminal of Serine eZnehroneteinekinease 31 (STPK31).
  • This protein has a proteinkinased oma in force at amino acid number 296 to 529 of SEQ ID NO: 10 by P fam search.
  • Q 9 BXU 1 IST 31 lacks the 443 amino acid equivalent of the N-terminal of HUMAN Therefore, it is considered that the protein has a function different from that of STPK31.
  • this protein is a variant lacking the N-terminus as compared with Serine / threonineeprotineinek31.
  • this protein was found to be involved in spermatogenesis based on literature information in the database (Nature Genetics, 27 (4), 422-426 (2001)). Furthermore, the present DNA was cloned from the testis, and it was speculated that the present protein is involved in the development, function, and disease of organs unique to the tissue. Industrial potential
  • the protein of the present invention and the DNA encoding the protein have kinase activity and the like, a substance that regulates the activity can be screened using the protein or the DNA encoding the protein, and the protein is relevant. It is useful for developing drugs that can be used for diseases and the like.

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Medicinal Chemistry (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

 本発明の目的は、完全長cDNAライブラリーに含まれるcDNAクローンの塩基配列を解析し、このうちスプライシングバリアントを含む全長として配列が新規なcDNAについては、これがコードするタンパク質の生理活性を解析及び同定し、該生理活性に基づくタンパク質およびそれをコードするDNAの利用方法を提案することである。本発明によれば、以下の(a)または(b)のタンパク質が提供される。(a)配列番号6~10のいずれかに記載のアミノ酸配列からなるタンパク質。(b)配列番号6~10のいずれかに記載のアミノ酸配列において1若しくは数個のアミノ酸が欠失、置換及び/または付加されたアミノ酸配列からなり、かつキナーゼ活性を有するタンパク質。

Description

新規タンパク質及びそれをコードする D NA 技術分野
本発明は、 新規なタンパク質、 該タンパク質をコードする D NA、 該タンパク 質をコードする完全長 c D NA、 該 D NAを有する組換えベクター、 該 D NAの 部分配列から成るオリゴヌクレオチド、 該 D N Aを導入した遺伝子導入細胞、 及 ぴ該タンパク質に特異的に結合する抗体等に関する。 背景技術
現在、 世界的なレベルで様々な生物のゲノム配列の解明とその解析が進められ ている。 既に約百数十の原核微生物、 下等真核生物の出芽酵母、 多細胞性真核生 物である線虫で、 その全ゲノム配列が決定された。 3 0億塩基対といわれるヒト のゲノムについては 2 0 0 1年 2月にその塩基配列のドラフトが発表されていた が、 2 0 0 3年 4月に完全配列が解読され公表された。 ゲノム配列を明らかにす る目的は、 全ての遺伝子の機能や制御、 あるいは遺伝子間、 タンパク質間、 細胞 間さらには個体間における相互作用のネットワークとして複雑な生命現象を理解 するところにある。 種々の生物種のゲノム情報から生命現象を解明していくこと は、 単に学術分野における研究課題として重要であるのみならず、 そこで得られ る研究成果をいかに産業上の応用へと発展させていくかという点で、 その社会的 な意義も大きレ、。
ところが単にゲノム配列を決定しただけでは、 全ての遺伝子の機能を明らカに できるわけではない。 例えば酵母では、 ゲノム配列から推定された約 6, 000の遺 伝子の約半数しか、 その機能を推定できなかった。 一方、 ヒトには約 1 0万種類 のタンパク質が存在するといわれる。 そこで、 ゲノム配列から明らかにされてく る膨大な量の新しい遺伝子の機能を、 迅速かつ効率的に解明していくための 「ハ イスループット遺伝子機能解析システム」 の確立が、 強く望まれている。 真核生物のゲノム配列では、 多くの場合、 一つの遺伝子がイントロンによって 複数のェクソンに分断されている。 そのため、 ゲノム配列情報だけからそこにコ ードされるタンパク質の構造を正確に予測するには、 多くの問題がある。 一方、 イントロンが除かれた mRNAから作製される cDNAでは、 タンパク質のァミノ酸配 列の情報が一つの連続した配列情報として得られるため、 容易にその一次構造を 明らかにすることが可能である。 ヒトの cDNAの研究では、 これまでに 5 0 0万 以上の EST (Expressed Sequence Tags) データが公共データベースに公開され ている。
これらの情報は、 ヒト遺伝子構造の解明ゃゲノム配列におけるェクソン領域の 予測、 あるいはその発現プロファイルの推定など、 様々な角度から利用されてい る。 ところが、 これらのヒ ト EST情報の多くは cDNAの 3' 末端側近傍に集中し ているため、 特に mRNAの 5' 末端近傍の情報が極端に不足している状況にある。 また、 世界の研究機関 (ヘリックス研究所、 かずさ D NA研究所、 東大医科学研 究所、 ドイツ癌研究センター、 MG Cプロジェクトなど) で行われている解析の 結果明らかにされている c D NAは 4万数千に上り、 数的には 3万数千と言われ る遺伝子座の大半を力パーしていると思われるが、 全長クローンとして取得され ている c D NAの割合は 8 0 %程度であることや、 重複ゃスプライスバリアント が含まれていることを考慮すると、 まだ取得されていない c D NAは多数存在し ていると考えられる。
完全長 cDNAを取得できれば、 その 5' 末端配列からゲノム配列上での mRNA転 写開始点が推定できる上、 その配列の中に含まれる mRNAの安定性や翻訳段階で の発現制御に関わる因子の解析が可能である。 また、 翻訳開始点である atgを 5' 側に含むことから、 正しいフレームでタンパク質への翻訳を行うことができ る。 したがって、 適当な遺伝子発現系を適用することで、 その cDNAがコードす るタンパク質を大量に生産したり、 タンパク質を発現させてその生物学的活性を 解析することも可能になる。 このように、 完全長 cDNAの解析からはゲノム配列 解析を相補する重要な情報が得られる。 また、 発現可能な全長 cDNA クローンは、 その遺伝子の機能の実証的な解析や産業分野での応用への展開において、 その重 要性はきわめて高い。
一方、 同一のゲノムにコードされたタンパク質であっても、 それをコードする mR NAが転写される際、 ゲノム中一部のェクソンが挿入 ·欠失して結合する異 性体 (以下、 これを 「スプライシングバリアント mR A」 と称することがある) がある。 実際、 これらの mRNAが翻訳されて生成される、 複数種の類似のタンパ ク質 (以下、 これらを 「スプライシングバリアント」 と称することがある) が生 体内において確認されている。 スプライシングバリアントは、 組織特異的、 発生 段階特異的、 あるいは疾患特異的に発現し、 それぞれ異なる機能を有していると 考えられている。
例えば、 tyrosine kinase である JAK3遺伝子は、 S型、 B型、 M型の 3種類の スプライスバリアントが存在し、 S型は造血細胞で発現しているのに対し、 B型 と M型は造血細胞と上皮細胞で発現している。 S型と M型が抗体によって共沈し、 同じ細胞で発現していること力 ら、 複数のスプライスバリアントが共に機能し、 細胞内におけるサイトカインのシグナル伝達反応の複雑性をより高めていると推 測されている (例えば、 Lai, K. S. 他、 J. Biol. Chem. 270 (42) , 25028-25036 (1995)を参照)。
このようなスプライシングバリアントの mRNAあるいは cDNAも、 従来の cDNA ライブラリーや ESTからは取得されにくく、 転写開始点を含む完全長 cDNAライ ブラリーにより取得される可能性の高いクローンである (例えば、 W0 9 8 Z 2 2 5 0 7号公報 (S E Q I D N O . 1および N O . 2 ) を参照) 。
特に、 プロテインキナーゼは、 基質であるタンパク質のセリン、 スレオニンあ るいはチロシン残基をリン酸ィヒする酵素であり、 極めて多くのフアミリーが知ら れている。 また、 一般にプロテインキナーゼはタンパク質リン酸ィヒを介する細胞 内シグナル伝達系を調節することにより、 種々の生命現象の制御に関わっている ことが知られており、 疾患との関係が解明されている遺伝子が多い (例えば、 Hunter, T. , Cell, 50: 823-829 (1987)を参照) 。 しかし、 ヒトの遺伝子の約 3 〜4%はプロテインキナーゼの遺伝子であると言われ、 ヒトの体内には約千種も の異なるプロテインキナーゼが存在すると推定されており、 まだ多くのプロティ ンキナーゼ遺伝子がクローニングされないままに残されている。 したがって、 ヒ トにおいて分離が進んでいないスプライシングバリアントを含む新規なプロティ ンキナーゼの全長 cDNAを提供する意義は大きい。 また、 プロテインキナーゼ は、 治療のための標的分子として、 またタンパク質自身に医薬品としての有用性 を期待できる。 したがって、 これらのタンパク質をコードする c DNAの全長を 明らかにすることには大きな意義がある。 発明の開示
本発明は、 完全長 cDNAライブラリーに含まれる cDNAクローンの塩基配 列を解析し、 このうちスプライシングバリアントを含む全長として配列が新規な cDNAについては、 これがコードするタンパク質の生理活性を解析及び同定し、 該生理活性に基づくタンパク質およびそれをコードする DN Aの利用方法を提案 することを目的とする。
本発明者らは、 オリゴキャップ法 (Maruyama, K. , et al. , Gene, 138: 171-174 (1994); Suzuki , Υ. et al. , Gene, 200: 149-156 (1997)) を用い て取得されたスプライシングバリアントを含む配列が新規な c DNAについて、 該 cDNAクローンの塩基配列の相同性に基づきデータベースを検索したところ、 該配列にキナーゼ活性を有するタンパク質に特異的な配列を見出し、 これらの c DNAがコードするタンパク質がプロテインキナーゼであると同定した。 本発明 は、 これらの知見に基づいて成し遂げられたものである。
すなわち本発明によれば、 以下の (1) 〜 (1 5) に記載の発明が提供される。
(1) 以下の (a) または (b) のタンパク質。
(a) 配列番号 6〜10のいずれかに記載のアミノ酸配列からなるタンパク質。
(b) 配列番号 6〜1 0のいずれかに記載のアミノ酸配列において 1若しくは数 個のアミノ酸が欠失、 置換及ぴ Zまたは付加されたァミノ酸配列からなり、 かつ キナーゼ活性を有するタンパク質。
(2) 上記 (1) に記載のタンパク質をコードする DNA、
(3) (1) に記載のタンパク質をコードする完全長 cDNA。
(4) 以下の (a) 、 (b) または (c) の何れかの DNA。
( a ) 配列番号 1〜 5のいずれかに記載の塩基配列を有する D N A。
(b) 配列番号 1〜 5のいずれかに記載の塩基配列において、 1若しくは数個の 塩基が欠失、 置換及ぴ Zまたは付加された塩基配列を有し、 かつキナーゼ活性を 有するタンパク質をコードする DNA。
( c ) 配列番号 1〜 5のいずれかに記載の塩基配列あるいはその相補配列を有す る D N Aをストリンジェントな条件下でハイブリダイズすることができる塩基配 列を有し、 かつキナーゼ活性を有するタンパク質をコードする DNA。
(5) (2) 〜 (4) のいずれかに記載の DNAを含む組換えベクター。
(6) (2) 〜 (4) のいずれかに記載の DNAまたは (5) に記載の組み 換えべクターを導入した遺伝子導入細胞または該細胞からなる個体。
(7) (6) に記載の細胞により産生される、 (1) に記載のタンパク質。
(8) (2) 〜 (4) のいずれかに記載の DNAの塩基配列中の連続した 5 〜100塩基と同じ配列を有するセンスオリゴヌクレオチド、 当該センスオリゴ ヌクレオチドと相補的な配列を有するアンチセンスオリゴヌクレオチド、 及び、 当該センス又はアンチセンスオリゴヌクレオチドのオリゴヌクレオチド誘導体か ら成る群から選ばれるオリゴヌクレオチド。
(9) (1)または (7) に記載のタンパク質に特異的に結合する抗体ある いはその部分フラグメント。
(10) 抗体がモノクローナル抗体である ( 9 ) に記載の抗体。
(11) モノクローナル抗体が (1) または (7) に記載のタンパク質のキ ナーゼ活性を中和する作用を有することを特徴とする (10) に記載の抗体。 (12) (1) または (7) に記載のタンパク質と被検物質を接触させ、 該 被検物質による該タンパク質が有する活性の変化を測定することを特徴とする、 該タンパク質の活性調節物質のスクリ一ユング方法。
(13) (6) に記載の遺伝子導入細胞と被検物質を接触させ、 該細胞に導 入されている DNAの発現レベルの変化を検出することを特徴とする、 該 DNA の発現調節物質のスクリーニング方法。
(14) (1) に記載のタンパク質のアミノ酸配列から選択される少なくと も 1以上のァミノ配列情報および Zまたは (2) 〜 (4) のいずれかに記載の D NAの塩基配列から選択される少なくとも 1以上の塩基配列情報を保存したコン ピュータ読み取り可能記録媒体。
(15) (1) に記載のタンパク質および/または (2) 〜 (4) のいずれ かに記載の D N Aを結合させた担体。 図面の簡単な説明
図 1は、 配列番号 6のァミノ酸配列を有するタンパク質に基質として S y n t i d e 2 (配列番号 21) を添加し、 逆相 H PLC上でピークを測定した結果を 示す。
図 2は、 配列番号 9のアミノ酸配列を有するタンパク質に基質として Syn t i d e 2 (配列番号 21) および CaMKI I (配列番号 22) を添加し、 逆相 HP L C上でピークを測定した結果を示す。
図 3は、 配列番号 10のアミノ酸配列を有するタンパク質に基質として Syn t i d e 2 (配列番号 21) および C aMK I I (配列番号 22) を添加し、 逆 相 HP L C上でピークを測定した結果を示す。 発明を実施するための最良の形態
以下、 本発明をさらに詳細に説明する。
( 1 ) 完全長 cDN Aの取得及び塩基配列の解析 本発明の DNAは、 配列番号 6〜10に記載のアミノ酸配列からなるタンパク 質、 または配列番号 6〜10に記載のアミノ酸配列において 1若しくは数個 (こ こで、 数個とは、 例えば 5個以下、 好ましくは 3個以下、 より好ましくは 2個以 下を意味する) のアミノ酸残基の置換、 欠失及び/または付加を含むアミノ酸配 列からなり、 かつキナーゼ活性を有するタンパク質をコードし得るものであれば 如何なるものであってもよい。 具体的には、 該アミノ酸配列をコードする翻訳領 域のみでも、 あるいはその c DNAの全長を含むものでもよい。
具体的には、 c DNAの全長を含む DNAとしては、 例えば配列番号 1〜5に 記載の塩基配列からなる DNA等が挙げられる。 また、 その翻訳領域としては、 配列番号 1の塩基番号 87〜1 124、 配列番号 2の塩基番号 1 15〜2094、 配列番号 3の塩基番号 1232〜 2764、 配列番号 4の塩基番号 316〜 19 47、 配列番号 5の塩基番号 151〜1881に示される配列を有するものが挙 げられる。 さらに上記の cDN Aの全長でなくても、 上記翻訳領域とその 3'及 び Zまたは 5'端に隣接する、 翻訳領域の発現に最低限必要な部分を含むもの等 も本発明の DN Aに含まれる。
本発明の DNAは、 これを取得できる方法であれば如何なる方法により取得し たものでもよいが、 具体的には例えば下述の方法により取得することができる。 まず、 ヒトの組織あるいは培養細胞等からそれ自体既知の通常用いられる方法に より mRNAを調製する。 次に、 この niRNAを铸型としてオリゴキャップ法
(Maruyama, K. et al. , Gene, 138, 171-174 (1994)) により c DNAを取得す る。 具体的には、 取得した mRNAについて酸性ピロフォスファターゼにより 5, キャップをはずし、 その後露出した 5' 末端のリン酸基を標的に、 オリゴキ ヤップリンカ一を RN Aライゲースを用いて連結する。 ここで、 キャップ構造を 5, 末端に有していない RN A分子について、 上記オリゴキャップリンカ一が結 合しないように、 予め 5' 末端に存在するリン酸基を、 5, キャップは外さない が 5' 端のリン酸基のみ外す活性を有するフォスファタ一ゼ等を用いて外してお くことは有効である。 この RNA分子を鍀型として、 3, 側のプライマーとして オリゴ dTプライマーを用いて逆転写酵素により逆転写を行った後、 RNA鎖を 分解除去する。
さらに取得された 1本鎖 DNAを鎳型として、 上記オリゴキャップリンカーの 部分配列を有するオリゴヌクレオチドを 5' プライマーとし、 3' 末端に特異的 なプライマー (オリゴ dTプライマー等) を用いてポリメラーゼチェインリアク シ.ヨン (PCR) を行うことにより完全長 cDNAライブラリーを作製すること ができる。 プライマーの鎖長としては、 通常 15〜100塩基、 好ましくは 15〜30 塩基が挙げられるが、 増幅する cDNAの鎖長が長い場合には 25〜35塩基の長 さとすることが好ましく、 また、 Long and Accurate PCR (LA PCR:林健志、 実 験医学別冊 · PCRの最新技術、 羊土社; Cheng, S. et al. , ature 369: 684- 685 (1994)) を用いることが好ましい。
このようにして取得された cDNAは、 これを適当なクローニングベクターに 挿入してクローニングを行う。 ここで用いられるベクターとしては、 取得された c D N Aクローンを細胞に導入して該 c D N Aがコードするタンパク質を発現で きるようなタンパク質発現用ベクターが好ましく用いられる。 具体的には例えば、 宿主が哺乳動物細胞等の場合には p ME 18 SFL 3 (Genbank AB009864) 等が 好ましく、 また大腸菌の場合では、 pET3、 pETl l (ストラタジーン社 製) 、 pGEX (アマシャムフアルマシアバイオテク社製) 等が挙げられ、 酵母 の場合では p E S P— Iエクスプレッションベクター (ストラタジーン社製) 等 が挙げられ、 さらに昆虫細胞の場合では B a c PAK6 (クロンテック社製) 等 が用いられる。 また宿主が動物細胞の場合では、 ZAP Ex p r e s s (スト ラタジーン社製) 、 p SVK3 (アマシャムフアルマシアバイォテク社製) 等が 挙げら; TLる。
かくして取得される cDNAライブラリーは、 それ自体既知の通常用いられる 方法により塩基配列の解析を行う。 本発明の DNAは、 取得された cDNAの 5, 末端あるいは 3, 末端の塩基配列を解析し、 これを NCB I (Na t i o n a 1 C e t e r f o r B i o t e c hn o l o g y I n f o rma t 1 o n ; h t t p / / www. n c b i . n 1 m. n i h . g o v /) の G e nb a nk、 EMBL、 DDB J、 PDB、 E S T等のデータベースについて B LAST (B a s i c l o c a l a l i g nme n t s e a r c h t o o l ; Al t s c hu l , S. F. , e t a 1. , J . Mo 1. B i o l . , 215, 403-410 (1990) ) を用いて検索し、 その全長 について完全に一致する配列が見出されない場合は新規として以下の解析に供す ることとした。
このような完全長 cDNAの塩基配列を有する DNAとしては、 例えば、 配列 番号 1〜 5に記載の塩基配列を有するものが挙げられる。 また、 その翻訳領域と しては、 配列番号 1の塩基番号 87〜1 124、 配列番号 2の塩基番号 1 15〜
2094、 配列番号 3の塩基番号 1232〜 2764、 配列番号 4の塩基番号 3 16〜 1947、 配列番号 5の塩基番号 151〜 1881に示される配列を有す るものが挙げられる。
かくして取得された cDNAの全長として新規な塩基配列を、 BLASTによる 相同性検索 (h omo l o gy s e a r c h) や、 HMMER (隠れ Ma r k o vモデルによる配列解析手法; E d d y , S. R. , B i o i n f o rma t i c s 14, 755-763 (1 998) ) の機能群のひとつである HMM PF AMによるタンパク質特徴検索 (p r o f i l e s e a r c h r h t t p: //v f am. wu s t 1. e d u) 等を行うことにより、 該塩基配列がコ 一ドするタンパク質の機能を推定することができる。
B L AS Tによる相同性検索においては、 検索の結果得られた相同性が十分有 意なヒット配列に付随する種々のァノテーシヨン情報から、 解析対象としている クローンの機能を推定することができる。 ここで、 十分有意なヒット配列とは、 登録されている配列の触媒ドメイン部分と本発明の D N Aのこれに対応する部分 との一致度 (i d e n t i t y) が 30%以上のものか、 e— v a 1 u e (問レヽ 合わせ配列がデータベース中に偶然存在する期待値) として 10— 4以下のものを 示す。 例えば、 上位にヒットした触媒ドメイン配列の多くがキナーゼとしての機能を 確認されたものであるならば、 それと配列上類似である解析対象クローンもまた 同じ機能、 即ち、 キナーゼ活性を持つであろうという予測が成り立つ。
HMM P F AMは、 P f a mというタンパク質プロファイルを集積したデータ ベース中にあるエントリーが有するアミノ酸配列の特徴を、 解析対象である塩基 配列のコードするアミノ酸配列が有するかどうかを洗い出す方法による解析であ る。 プロファイルは一連の同一特徴を持つタンパク質群から抽出されており、 一 配列対一配列の全長に亘る比較では明確ィヒできない機能でも、 配列中にその特徴 領域があればこれを見出し機能予測ができる。 このように、 それがコードするタ ンパク質がキナーゼ活性を有すると予測される cDNAは、 後述する生化学的実験 によりそのキナーゼ活 1·生を確認することができる。
上記で cDNAの全長として新規であるとされたクローンとして具体的には、 配 列番号 1 〜 5に示す塩基配列を有するものが挙げられる。 また、 これらの塩基配 列がコードするアミノ酸配列は配列番号 6〜 1 0に示すものが挙げられる。
かくして取得され、 塩基配列が決定され、 また機能が推定される本発明の D N Aは上記の配列番号 1〜 5に記載の塩基配列、 あるいはその翻訳領域として上記 に示した塩基配列を有するものだけでなく、 これらの塩基配列において、 1若し くは数個 (ここで言う数個とは、 例えば 1 5個以下、 好ましく 9個以下、 より好 ましくは 6個以下を意味する) の塩基が欠失、 置換及び Zまたは付加された塩基 配列を有し、 かつキナーゼ活性を有するタンパク質をコードする D NA、 並びに、 これらとストリンジェントな条件下でハイブリダイズし、 かつキナーゼ活性を有 するタンパク質をコードする D NA等も含まれる。 これら D NAには前記したと おり、 配列番号 6〜 1 0に記載のタンパク質のァミノ酸配列において 1若しくは 数個のァミノ酸配列が欠失、 置換及び/または付加されたァミノ酸配列からなり、 かつキナーゼ活性を有するタンパク質をコードするものが含まれる。
ここで、 ストリンジェントな条件でハイブリダイズする D N Aとは、 配列番号 1〜 5に記載の塩基配列と B L A S T解析で 8 0 %以上、'好ましくは 9 0 %以上、 さらに好ましくは 9 5 %以上の相同性を有する塩基配列を含む D N A等が挙げら れる。 また、 ストリンジェントな条件下のハイブリダィゼーシヨンとは、 通常の ハイブリダイゼーション緩衝液中で、 温度が 4 0〜 7 0 °C、 好ましくは 6 0〜 6 5 °C等で反応を行い、 塩濃度が 1 5 mM〜 3 0 0 mM、 好ましくは 1 5 mM〜 6 0 mM等の洗浄液中で洗浄を行う方法に従って行うことができる。
さらに、 本発明の D NAは、 上述の方法により取得されたものでも、 また合成 されたものでもよレ、。 D NAの塩基配列の置換は、 例えばサイトダイレクテッド ミュータジエネシスキット (宝酒造社製) や、 クイックチェンジサイトダイレク テッドミユータジエネシスキット (ストラタジーン社製) 等の市販キットで容易 に行うことができる。
( 2 ) 新規 c D NAがコードするタンパク質
本発明の D NAがコードするタンパク質の翻訳領域は、 例えば、 該 D NAが有 する塩基配列について 3種類の読み枠によりアミノ酸に変換していき、 最も長い ポリべプチドをコ一ドする範囲を本発明の翻訳領域としてそのァミノ酸配列を推 定することができる。 このようなァミノ酸配列として例えば、 配列番号 6〜 1 0 に記載のもの等が挙げられる。 また、 本発明のタンパク質は、 上記のアミノ酸配 列に限られるものではなく、 該ァミノ酸配列において 1若しくは数個のァミノ酸 が置換、 欠失、 及び/または付加されたアミノ酸配列からなり、 かつキナーゼ活 性を有するものも含まれる。
本発明のタンパク質の取得方法としては、 (1 ) に記載の本発明の D NAを適 当な方法により転写 Z翻訳する方法が好ましく用いられる。 具体的には、 適当な 発現用ベクター若しくは適当なベクターに適当なプロモーターとともに挿入した 組換えべクターを作製し、 この組換えベクターで適当な宿主微生物を形質転換し たり、 適当な培養細胞に導入することにより発現させ、 これを精製することによ り取得することができる。
また、 その N末端または C末端に適当なタグが融合するように設計されたべク ターなどに挿入してタグを付加したタンパク質も本発明のタンパク質に含まれる。 タグとして具体的には、 ダルタチオン一 S—トランスフェラ一ゼ、 ポリヒスチジ ン、 F 1 a gなどが挙げられる。
上記形質転換体が産生するタンパク質には、 タンパク質合成時に重原子などで 置換 ·修飾したァミノ酸を取り込ませることにより修飾することができる。 また、 タンパク質を、 精製の前又は後に適当なタンパク質修飾酵素を作用させることに より、 任意に修飾を加えたり、 ポリペプチドを部分的に除去することにより修飾 タンパク質とすることができる。 例えば、 N末端ァセチル化、 C末端アミド化な どの末端修飾、 糖鎖付加、 脂質付加、 ァシル化、 メチル化、 スルホン化、 カルボ キシル化、 水酸化、 リン酸化、 AD P—リボシル化などであるが、 必ずしもこれ らに限定されない。 これらの修飾タンパク質も上記したキナーゼ活性を有するも のであれば本発明の範囲に含まれる。
また、 上記形質転換体が産生するタンパク質を、 精製の前又は後に適当なタン パク質修飾酵素を作用させることにより、 任意に修飾を加えたり、 ポリペプチド を部分的に除去することにより修飾タンパク質とすることができる。 これらの修 飾タンパク質も上記したキナーゼ活性を有するものであれば本発明の範囲に含ま れる。
本発明のタンパク質の産生を行う際、 本発明の D NAを含む組換えベクターの 作製に用いるベクターとしては、 形質転換体内で該 D NAが発現されるものであ れば特に制限はなく、 プラスミドベクター、 ファージベクターのいずれでもよい。 これらのうち通常は、 該 D NAが導入される宿主に適したプロモーター等の発現 制御領域 D NAが既に挿入されている市販のタンパク質発現用べクターを用いる。 このようなタンパク質発現用ベクターとして、 具体的には例えば、 宿主が大腸菌 の場合では、 p E T 3、 p E T 1 1 (ストラタジーン社製) 、 p G E X (アマシ ャムフアルマシアバイオテク社製) 等が挙げられ、 酵母の場合では p E S P— I エクスプレッションベクター (ストラタジーン社製) 等が挙げられ、 さらに昆虫 細胞の場合では B a c P AK 6 (クロンテック社製) 等が用いられる。 また宿主 が動物細胞の場合では、 Z A P E x p r e s s (ストラタジーン社製) 、 p S VK3 (アマシャムフアルマシアバイオテク社製) が挙げられ、 宿主が哺乳動物 細胞等の場合には p ME 18 S F L 3 (Genbank AB009864) 等が好ましい。
発現制御領域が挿入されていないベクターを用いる場合には、 発現制御領域と して少なくともプロモーターを挿入する必要がある。 ここでプロモーターとして は、 宿主微生物または培養細胞が保有するプロモーターを用いることができる力 これに限られるものではなく、 具体的には例えば、 宿主が大腸菌の場合には T 3、 T7、 t a c、 1 a cプロモーター等を用いることができ、 酵母の場合には nm t 1プロモーター、 Ga 1 1プロモーター等を用いることができる。 昆虫細胞の 場合には、 ポリヘドリンプロモーター等を用いることができる。 また宿主が動物 細胞の場合には SV 40プロモーター、 CMVプロモーター等が好ましく用いら れる。
また哺乳動物由来のプロモーターが機能可能な宿主を用いる場合には、 本発明 の遺伝子に固有のプロモーターを用いることもできる。 これらのベクターへの本 発明の DNAの挿入は、 該 DNAまたはこれを含む DNA断片をベクター中のプ 口モーターの下流に該遺伝子 DNAがコードするタンパク質のアミノ酸配列を連 結して行えばよい。
このようにして作製した組換えべクターは、 それ自体既知の方法により後述す る宿主を形質転換して、 DN A導入体を作製することができる。 宿主への該べク ターの導入方法として、 具体的には、 ヒートショック法 (J. Mo 1. B i o 1. , 53, 154, (1970) ) 、 リン酸カルシウム法 (S c i e n c e, 221, 551, (1983) ) 、 DEAEデキストラン法 (S c i e n c e, 21 5, 166, (1982) ) 、 インビトロパッケージング法 (P r o c . N a t 1. Ac a d. S c i . USA, 72, 581, (1975) ) 、 ウィル スベクター法 (Ce l l , 37, 1053, ( 1984 ) ) 、 および電気パルス 法 (Chu. e t a l . , N c. Ac i d s Re s. , 15, 1331 (1987) ) 等が挙げられる。 DNA導入体を作製するための宿主としては、 本発明の DN Aが体内で発現す るものであれば特に限定されないが、 例えば大腸菌、 酵母、 バキュロウィルス
(節足動物多角体ウィルス) 一昆虫細胞、 あるいは動物細胞等が挙げられる。 具 体的には、 大腸菌では B L21、 XL-2B 1 u e (ストラタジーン社製) 等、 酵母では SP— Q01 (ストラタジーン社製) 等、 バキュロウィルスでは Ac N P V (J. B i o l. Ch em. , 263, 7406, (1988) ) とその宿 主である S f — 9 (J. B i o l . Ch e m. , 263, 7406, (198 8) ) 等が挙げられる。 また動物細胞としてはマウス繊維芽細胞 C 127 (J. V i o l . , 26, 291, ( 1978 ) ) やチャイニーズハムスター卵巣細胞 CHO細胞 (P r o c. Na t l . Ac a d. S c i . USA, 77, 4216,
(1980) ) 等が挙げられるが、 発現量やスクリーニングの簡便さから好まし くはアフリカミドリザル腎臓由来 COS— 7 (ATCC CRL 1651 :ァメ リカン タイプ カルチャー コレクション保存細胞) 、 ヒ ト胎児腎臓由来 HE K293細胞 (AT C C C R L 1573 ) またはヒト子宮頸部癌 H e L a細胞
(ATCC CCL- 2) が用いられる。
上記したようなタンパク質発現用ベクターを用いる発現方法の他に、 プロモー ターを連結した本発明の DN A断片を宿主微生物の染色体中に直接挿入する相同 組換え技術 (A. A. Ve r t e s e t a l . , B i o s c i . B i o t e c h n o 1. B i o c h em. , 57, 2036, (1993) ) 、 あるいは トランスポゾンや挿入酉己歹 1) (A. A. Ve r t e s e t a l . , Mo 1 e c u l a r Mi c r o b i o l . , 1 1, 739, (1994) ) 等を用いて D N A導入体を作製することもできる。
上記で得られた培養物は細胞または菌体を遠心分離等の方法により収集し、 こ れを適当な緩衝液に懸濁し、 超音波、 リゾチーム、 および/または凍結融解等の それ自体既知の適当な方法により破壊した後、 遠心分離や濾過等によりタンパク 質粗精製液を得、 さらに適当な精製方法を組み合わせることにより精製すること ができる。 力べして、 本発明のタンパク質が取得される。 上記したタンパク質発現組換え ベクターを用いる発現方法の他に、 上記 (1 ) で取得された本発明の D NAを無 細胞転写翻訳系 (または無細胞タンパク質合成系とも称する) に供することによ りタンパク質発現を誘導し、 本発明のタンパク質を取得することができる。 本発 明で用いられる無細胞転写翻訳系とは、 D NAから mR NAへの転写、 および m R N Aからタンパク質への翻訳に必要な全ての要素を含む系であり、 そこに D N Aを加えることによってその D NAがコードしているタンパク質が合成されるよ うなあらゆる系を指す。 無細胞転写翻訳系の具体例としては、 真核細胞、 および パクテリァ細胞、 又はそれらの一部からの抽出液に基づいて調製された転写翻訳 系が挙げられる。 無細胞タンパク質合成系として具体的には、 大腸菌、 植物種子 の胚芽、 ゥサギ網状赤血球等の細胞抽出液等の既知のものが用いられる。 これら は市販のものを用いることもできるし、 それ自体既知の方法、 具体的には大腸菌 抽出欲'は、 Pratt, J. M. , Transcription and Tranlation (Ed. by Hames, B. D. and Higgins, S. J. ) , 179-209, IRL Press, Oxford (1984)に記載の方法等に準 じて調製することもできる。 市販の無細胞タンパク質合成系、 または細胞抽出液 としては、 大腸菌由来のものは、 E. coli S30 extract system (Promega社製) と RTS 500 Rapid Tranlation System (Roche社製) 等が挙げられ、 ゥサギ網状 赤血球由来のものは Rabbit Reticulocyte Lysate Sytem (Promega社製) 等、 さ らにコムギ胚芽由来のものは PR0TEI0S™ (T0Y0B0社製) 等が挙げられる。
得られた無細胞転写翻訳系の転写翻訳産物からの、 本発明のタンパク質の分離、 および精製は、 それ自体既知の通常用いられる方法で行うことができる。 具体的 には、 ェピトープペプチド (例えば、 ポリヒスチジンペプチド、 グルタチオン一 S—トランスフェラーゼ (G S T) 、 マルトース結合タンパク質等) をコードす る D NA領域を、 前記した転写翻訳されるべき D NAに導入し、 前記の通り発現 させ、 該タンパク質と親和性を有する物質とのァフィ二ティーを利用して精製す ることができる。 目的とするタンパク質の発現は、 SDS—ポリアクリルアミドゲル電気泳動等 で分離し、 クマシ一ブリリアントブルー (シグマ社製) 等で染色するか、 または 後述する本発明のタンパク質に特異的に結合する抗体により検出する方法等によ つて確認できる。 また一般的に、 発現されたタンパク質は生体内に存在するタン パク質分解酵素により切断されること (プロセッシング) が知られている。 本発 明のタンパク質も当然のことながら切断されたアミノ酸配列の部分断片であって も、 キナーゼ活性を有するものであれば、 本発明のタンパク質に含まれる。 (3) 本発明のタンパク質が有する活性の確認
本発明のタンパク質は、 これを上記 (2) に記載のとおり組み換えタンパク質 として作製し、 これを解析することにより (1) で推測した活性を有しているこ とを確認することができる。 さらに下記 (4) に記載の抗体等との組み合わせに より解析することもできる。
本発明のタンパク質が、 キナーゼ活性を有することは、 それ自体既知の常法を 用いることができる。 具体的な方法の例として、 基質を該組み換えタンパク質に 接触させ、 該組み換えタンパク質のキナーゼ活性により基質がリン酸ィ匕される際 に消費される AT P量、 生成物の量を測定する方法等を以下に説明する。
反応液としては、 基質のリン酸化部位がセリン/スレオニンである、 Se rZ Th rプロテインキナーゼの活 を測定する場合は、 マグネシウムイオン、 例え ば 5〜 100 ιηΜの塩化マグネシゥムあるいは酢酸マグネシゥム、 および還元剤 として 1〜10 OmMの 2—メルカプトエタノール或いは 1〜1 OmMのジチォ スレイトールを含む、 リン酸イオンの存在しない、 中性から弱塩基性緩衝液、 例 えば 5 OmMのトリス—塩酸あるいは HEPES緩衝液 (pH7. 0〜8. 0) を用い、 また、 基質のリン酸化部位がチロシンである Ty rプロテインキナーゼ の活性を測定する場合は、 塩化マンガン、 塩化亜鉛、 NaVO3、 ジチオスレィ トールを含むトリス—塩酸あるいは HEP E S緩衝液 ( H 7. 0〜8. 0) を 用いることができる。 この反応液に、 AT Pおよびそれぞれに適した基質を加えた後、 精製した本発 明のタンパク質を添加し、 室温〜 3 7 °Cで 2 4時間程度反応後、 該タンパク質が 有するキナーゼ反応により消費した A T P量、 或いは該タンパク質により行われ るキナーゼ反応による生成物を測定する。
ここで、 受容体型キナーゼと予想されるタンパク質のキナーゼ活性を測定する 場合には、 該タンパク質の細胞内部分、 あるいはキナーゼ活性中心部分のみを組 み換えタンパク質として発現させて上記の反応に用いることが好ましい。
キナーゼ反応に関して、 S e r /T h rプロテインキナーゼである環状ヌクレ ォチド依存性プロティンキナーゼの場合、 各キナーゼに対応する環状ヌクレオチ ドを反応液中に添加することが必要である。 例えば、 A—キナーゼの場合は環状 AM P ( c AM P ) を、 G—キナーゼの場合は環状 GM P ( c GM P ) を添加し、 基質としてヒストンを用いる。
リン脂質依存性プロティンキナーゼの場合は、 リン脂質を反応液中に添加する。 例えば、 C一キナーゼの場合、 ホスファチジルセリンを添加し、 基質としてヒス トンを用いる。 カルシウム依存性プロテインキナーゼの場合には、 カルモジユリ ンを反応液に添加し、 基質としてミオシン L鎖を用いる。 ここには、 ミオシン L 鎖キナーゼ、 カルモジュリンキナーゼが含まれる。 T y rプロティンキナーゼの 場合は、 基質としてチューブリン、 ヒストン、 カゼイン、 ミオシン L鎖、 ガスト リン、 アンギオテンシン、 チロシン一グルタミン酸 (1 : 4 ) 重合物等を用いる。 キナーゼ活性測定において、 基質へのリン酸基の転移に先立ち、 キナーゼによ る A T Pの AD Pへの加水分解反応が起こる。 ここで加水分解された A T P量を 測定することで、 キナーゼ活性を定義づけることも可能である。 この場合、 基質 非存在下で行つた反応液中の A T P量を測定し、 消費 A T P量をキナーゼ活性と する (Whitehoouse, S. et al. , J. Biol. Chem. , 258: 3693-3701 (1983) ) 。
キナーゼ反応により消費した A T P量を測定する場合、 上記キナーゼ反応液に ルシフェリン、 ルシフェラーゼを加え、 一定時間反応後、 添加したルシフェリン 特有の蛍光波長で蛍光強度を測定し、 残存 AT Pによる蛍光量とする。 プロティ ンキナーゼおよぴ基質非存在下で測定した、 反応液中に存在する全 A T P蛍光強 度から上記蛍光強度を差し引いた値を、 キナーゼ活性により消費した AT P量と し、 酵素のキナーゼ活性とする。
キナーゼ反応による生成物を測定する場合は、 反応液に添加する A T Pとして 放射性同位元素である3 2 Pを AT Pの γ位に含んだ [ V— 3 2 P ] A T Pを用い る。 キナーゼ反応終了後、 反応液を S D S—ポリアクリルアミドゲル電気泳動に より分離し、 泳動後のゲルを X線フィルムによりオートラジオグラフィーを行い 3 2 Pの取り込まれたタンパク質バンドを検出する。 また、 反応液に 1 0 %トリ クロ口酢酸、 或いは終濃度 9 0 %となるようにエタノールまたはアセトンを加え、 タンパク質を ¾fc殿させる。 その後遠心或いはフィルター濾過により上清を除き、 さらに同溶液で数回洗浄した後乾燥し、 基質タンパク質がリン酸化されたために 不溶ィヒ画分に移行した3 2 Pを液体シンチレーションカウンターで測定する。 放 射性同位元素を用いない方法としては、 キナーゼ反応終了後の反応液を、 クロマ トグラフィ一により分離し、 リン酸ィ匕された基質の溶出位置の変化および変化量 で活性を測定することも可能である。 この場合、 クロマトグラフィーとしては、 イオン交換クロマトグラフィー、 逆相クロマトグラフィーを用いることができる。 また、 基質のリン酸ィヒによる質量変化を質量分析装置で測定することにより、 活 性測定することも可能である。 この場合、 前述のクロマトグラフィー分離と併用 することで、 測定精度がさらに上昇する。
このようなキナーゼ活性の解析系は、 本発明のキナーゼ活性を有するタンパク 質のァゴニストやアンタゴニストの評価にも用いることができる。 なお、 本発明 のタンパク質が有する活性の確認は、 上記した方法に限定されるものではない。
( 4 ) 本発明のタンパク質の機能解析
かくして得られたスプライシングバリアントとして同定されたものを含む新規 タンパク質であって、 かつキナーゼ活性を有する本発明のタンパク質は、 上記
( 3 ) で確認されたキナーゼ活性以外の機能を解析することによりその新規の利 用法が提供される (このキナーゼ活性以外の機能をさらに解析する対象となるタ ンパク質を、 以下 「解析対象タンパク質」 と称することがある) 。 特に、 本発明 のタンパク質には、 公知のタンパク質のスプライシングバリアントが含まれるた め、 このバリアントが公知のパリアントとどのような異なる機能があるかを同定 することは重要である。
具体的な機能の解析方法としては、 例えば、 (i) 各組織、 疾患、 あるいは発 生段階における発現状態を比較解析する方法、 (ii) 他のタンパク質、 D NAと の相互作用を解析する方法、 (iii) 適当な細胞あるいは個体へ導入し、 表現型 の変化を解析する方法、 (iv) 適当な細胞あるいは個体において該タンパク質の 発現を阻害して表現型の変化を解析する方法などが挙げられる。
(i) の方法においては、 本発明のタンパク質の発現を、 mRNAレベルあるいは タンパク質レベルで解析することができる。 mR Aレベルで発現量を解析する場 合は、 例えば、、 in situハイブリグイゼーション法 (In situ hybridization: Application to Developmental Biology & Medicine (Ed. by Harris, N. and Wilkinson, D. G. ) , Cambridge University Press (1990) ) 、 DNAチップを禾 lj 用したハイブリダィゼーシヨン法、 定量 P C R法等が用いられる。 ここで、 解析 の対象タンパク質が公知のバリアントが存在するスプライシングバリアントであ る場合には、 解析対象タンパク質をコードする cDNAにのみ存在し、 公知のバリ アントをコ一ドする cDNAとはハイブリダィズしないプローブを用いることが好 ましい。 定量 P C R法の場合には、 対象バリアントと公知バリアント間で異なる 長さの増幅断片ができるプライマーを選択して行う方法 (Wong, Y. W. ,
Neuroscience Let. , 320, 141-145 (2002) ) 等が挙げられる。 また、 タンパク質 レベルで解析する場合には、 後述する本発明のタンパク質に特異的に結合する抗 体を用いた糸且織染色法などが挙げられる。 この場合、 対象タンパク質にのみ反応 し、 公知のバリアントには反応しない抗体を用いることが好ましい。
(ii) の相互作用の解析法としては、 それ自体既知の常法を用いることができ るが、 具体的には、 例えば、 酵母ツーハイブリッド法、 蛍光偏光解消法、 表面プ ラズモン法、 ファージディスプレイ法、 リポソ一マルディスプレイ法等が挙げら れる。 該方法においても、 解析対象タンパク質が公知のバリアントが存在するス プライシングバリアントの場合には、 公知のバリアントも同様にして相互作用す る物質を解析し、 対象タンパク質特異的に相互作用する物質を同定することが好 ましい。
(iii) の方法では、 本発明の cDNAを導入する細胞は特に制限はないが、 ヒ ト 培養細胞等が特に好ましく用いられる。 DNAの細胞への導入法としては、 上記
( 2 ) に記載のものが挙げられる。 さらに導入細胞の表現型としては、 細胞の生 死、 細胞の増殖速度、 細胞の分化、 細胞が神経細胞の場合には神経突起の伸長度、 細胞内タンパク質の局在や移行など顕微鏡等で観察可能なものや、 細胞内の特定 タンパク質の発現変化など生化学的実験により解析可能なものも含む。 これらの 表現型は、 公知のバリアントが存在するスプライシングバリアントの場合には、 公知のものも同様に細胞へ導入し、 比較解析することにより解析対象バリアント に関連する表現型を同定することができる。 また、 本発明のタンパク質はキナー ゼ活性を有するものであることがわかっているので、 キナーゼが関連する疾患に 見られる表現型等に注目して解析することも好ましい。
(iv) の方法では、 後述するオリゴヌクレオチドを用いた方法や、 RNAインタ 一フェアレンス法により効率的に行うことができる。 この方法においても、 解析 する対象タンパク質が、 公知のバリアントが存在するスプライシングバリアント である場合には、 公知のバリアントやその他のバリアントについても同様の解析 を行い、 比較解析することにより対象タンパク質特異的な機能を同定することが できる。
( 5 ) オリゴヌクレオチドの調製
上記 (1 ) に記載の方法で取得した本発明の D NAまたはその断片を用いて、 D NA合成機などを用いる常法により、 本発明の D NAの一部の配列を有するァ ンチセンス ·オリゴヌクレオチド、 センス ·オリゴヌクレオチド等のォリゴヌク レオチドを調製することができる。 該オリゴヌクレオチドとしては、 上記 DNAの有する塩基配列中の連続した 5 〜100塩基と同じ配列を有する DN Aまたは該 DN Aと相補的な配列を有する DN Aを挙げることができる。 具体例としては、 配列番号 1〜 5で表される塩基 配列中の連続した 5〜100塩基と同じ配列を有する DNAまたは該 DNAと相 補的な配列を有する DN Aを挙げることができる。 ここで、 対象タンパク質が、 公知のバリアント DNAが存在するスプライシングバリ'アントの場合には、 公知 のバリアントと異なる部分の塩基配列を選択することが好ましい。 センスプライ マーおよびアンチセンスプライマーとして用いる場合には、 両者の融解温度 (T m) および塩基数が極端に変わることのない上記のオリゴヌクレオチドが好まし レ、。 また、 配列の長さは、 一般的には 5〜100塩基であり、 好ましくは 10〜 60塩基であり、 より好ましくは 15〜 50塩基である。
また、 これらオリゴヌクレオチドの誘導体も本発明のオリゴヌクレオチドとし て利用することができる。 該オリゴヌクレオチド誘導体としては、 オリゴヌタレ ォチド中のリン酸ジエステル結合がホスホロチォエート結合に変換されたオリゴ ヌクレオチド誘導体、 オリゴヌクレオチド中のリン酸ジエステル結合が N 3,一 P 5'ホスフォアミデート結合に変換されたオリゴヌクレオチド誘導体、 オリゴ ヌクレオチド中のリポースとリン酸ジエステル結合がぺプチド核酸結合に変換さ れたォリゴヌクレオチド誘導体、 オリゴヌクレオチド中のゥラシルが C— 5プロ ピニルゥラシルで置換されたオリゴヌクレオチド誘導体、 オリゴヌクレオチド中 のゥラシルが C— 5チアゾールゥラシルで置換されたォリゴヌクレオチド誘導体、 オリゴヌクレオチド中のシトシンが c一 5プロピニルシトシンで置換されたォリ ゴヌクレオチド誘導体、 オリゴヌクレオチド中のシトシンがフエノキサジン修飾 シトシン ^ e n o x a z i n e— mo d i f l e d c y t o s i n eノ で 置換されたオリゴヌクレオチド誘導体、 オリゴヌクレオチド中のリボースが2, —0—プロピルリポースで置換されたオリゴヌクレオチド誘導体、 あるいはオリ ゴヌクレオチド中のリポースが 2,ーメ トキシェトキシリボースで置換されたォ リゴヌクレオチド誘導体等をあげることができる。 また、 本発明のオリゴヌクレオチドは、 これを 2本鎖 RNAとして調製するこ とにより、 RNAインターフェアレンス法に適用することができる。 2本鎖 RN Aの作製方法、 及ぴ RNAインターフェアレンス法については、 例えば、
Elbashir, S. , et al. , Nature, 411, 494- 498(2001)に記載の方法等を用いるこ とができる。 上記 2本鎖 RNAは、 そのすべてが RN Aである必要はない。 具体 的には、 その一部が DN Aであるものとして、 WOO 2/10374号公報に記 載のものを用いることができる。
この RNAインターフェアランス法において標的となる遺伝子 (以下これを 「標的遺伝子」 と称することがある) は、 本発明の DNAであれば、 如何なるも のであってもよい。 また、 該遺伝子 DN Aのオルソログと予想される遺伝子も標 的遺伝子とすることができる。 これらの DNAの少なくとも一部の塩基配列と実 質的に同一な配列を有する RN Aからなる 2本鎖ポリヌクレオチド (以下、 これ を 「2本鎖ポリヌクレオチド」 と称することがある) とは、 標的遺伝子の塩基配 列のうち、 いずれの部分でもよい 15 b p以上の配列と実質的に同一な配列から なるものである。 ここで、 実質的に同一とは、 標的遺伝子の配列と' 80%以上の 相同性を有することを意味する。
また、 解析対象タンパク質が公知タンパク質と比較して、 挿入型あるいは置換 型バリアントである場合は、 2本鎖ポリヌクレオチド配列は挿入あるいは置換部 位に設定することができる。 また、 解析対象タンパク質が公知タンパク質の欠失 型バリアントである場合は、 欠失部を跨ぐ配列を 2本鎖ポリヌクレオチド配列と することにより、 該タンパク質特異的に効果のある配列を選定することができる。 さらに、 解析対象タンパク質と公知タンパク質のそれぞれをコードする DNAの 塩基配列と比較して、 解析対象タンパク質をコードする D N Aに特異的な塩基配 列を選定することによれば、 解析対象タンパク質特異的にその発現を阻害するこ とができる。
ヌクレオチドの鎖長は 15 b pから標的遺伝子のオープンリーディングフレー ム (ORF) の全長までの如何なる長さでもよいが、 15〜500 b p程度のも のが好ましく用いられる。 ただし、 哺乳類動物由来の細胞においては、 30 b p 以上の長い 2本鎖 RN Aに反応して活性化するシグナル伝達系の存在が知られて いる。 これはインターフェロン反応と呼ばれており (Ma r e u s, P. I . , e t a 1. , I n t e r f e r o n, 5, 115— 180 (1983) ) 、 該 2本鎖 RN Aが細胞内に侵入すると、 PKR (d s RNA- r e s p o n s i v e r o t e i n k i n a s e : B a s s, B . L . , Na t u r e, 41 1, 428-429 (2001) ) を介して多くの遺伝子の翻訳開始が非特異的 に阻害され、 それと同日寺に 2 ' -5' -o l i g o a d e ny l a t e s yn t h e t a s e (B a s s, B. L. , Na t u r e, 41 1, 428— 429 (2001) ) を介して RNa s e Lの活性化が起こり、 細胞内の RNAの非特 異的な分解が惹起される。 これらの非特異的な反応のために、 標的遺伝子の特異 的反応が隠蔽されてしまう。 従って哺乳類動物または該動物由来の細胞あるいは 組織を被導入体として用いる場合には 15〜30 b p、 好ましくは 19〜 24b p、 さらに好ましくは 21 b pの 2本鎖ポリヌクレオチドを用いることが好まし い。 2本鎖ポリヌクレオチドはその全体が 2本鎖である必要はなく、 5' または 3, 末端が一部突出したものも含むが、 3, 末端が 2塩基突出したものを用いる ことが好ましい。 2本鎖ポリヌクレオチドは相補性を有する 2本鎖のポリヌタレ ォチドを意味するが、 自己相補性を有する 1本鎖ポリヌクレオチドが自己ァニー リングしたものでもよい。 自己相ネ 性を有する 1本鎖ポリヌクレオチドとしては、 例えば、 逆方向反復配列を有するもの等が挙げられる。
2本鎖ポリヌクレオチドの調製方法としては特に制限はないが、 それ自体既知 の化学合成方法を用いることが好ましい。 化学合成は相補性を有する 1本鎖ポリ ヌクレオチドを別個に合成し、 これを適当な方法で会合させることにより 2本鎖 とすることができる。 会合の方法としては上記ポリヌクレオチドを混合し、 2本 鎖が解離する温度にまで加熱し、 その後徐々に冷却する方法等が挙げられる。 会 合した 2本鎖ポリヌクレオチドは、 ァガロースゲル等を用いて確認し、 残存する 1本鎖ポリヌクレオチドを適当な酵素により分解する等して除去する。 このようにして調製した 2本鎖ポリヌクレオチドを導入する被導入体としては、 標的遺伝子がその細胞内で R NAに転写、 またはタンパク質に翻訳を受け得るも のであれば如何なるものであってもよいが、 具体的には、 植物、 動物に属するも のが挙げられる。 植物は単子葉植物、 双子葉植物または裸子植物であってよく、 動物は、 脊椎動物または無脊椎動物であってよい。 脊椎動物の例には、 魚類、 ゥ シ、 ャギ、 ブタ、 ヒッジ、 ハムスター、 マウス、 ラット、 及ぴヒトを含む哺乳動 物が含まれ、 無脊椎動物には、 線虫、 キイ口ショウジョゥバエ (D r o s o p h i 1 a ) 、 及ぴ他の昆虫が含まれる。 好ましくは、 細胞は脊椎動物細胞である。 被導入体は、 細胞、 糸且織あるいは個体を意味する。 ここで細胞とは、 生殖系列 または体性、 分化全能または多分化能、 分割または非分割、 実質組織または上皮、 不滅化したものまたは形質転換したもの等であってよレ、。 細胞は、 配偶子または 胚であってよく、 胚の場合、 単一細胞胚または構成性細胞、 または多重細胞胚か らの細胞であり、 胎児組織を含む。 さらには、 幹細胞のような未分化細胞、 また は胎児組織を含む器官または組織の細胞のような分ィヒ細胞、 または生物内に存在 する任意の他の細胞であってよい。 分化している細胞型には、 脂肪細胞、 繊維芽 細胞、 筋細胞、 心筋細胞、 内皮細胞、 神経細胞、 グリア、 血液細胞、 巨核球、 リ ンパ球、 マクロファージ、 好中球、 好酸球、 好塩基球、 マスト細胞、 白血球、 顆 粒球、 ケラチン生成細胞、 軟骨細胞、 骨芽細胞、 破骨細胞、 肝細胞及び内分泌腺 または外分泌腺の細胞が含まれる。
被導入体への 2本鎖ポリヌクレオチドの導入法としては、 被導入体が細胞、 あ るいは組織の場合は、 カルシウムフォスフェート法、 エレクトロポレーシヨン法、 リポフエクシヨン法、 ウィルス感染、 2本鎖ポリヌクレオチド溶液への浸漬、 あ るいは形質転換法等が用いられる。 また、 胚に導入する方法としては、 マイクロ インジェクション、 エレクト口ポレーシヨン法、 あるいはウィルス感染等が挙げ られる。 被導入体が植物の場合には、 植物体の体腔または間質細胞等への注入ま たは灌流、 あるいは噴霧による方法が用いられる。 また、 動物個体の場合には、 経口、 局所、 非経口 (皮下、 筋肉内及び静脈内投与を含む) 、 経膣、 経直腸、 経 鼻、 経眼、 腹膜内投与等によって全身的に導入する方法、 あるいはエレクトロボ レーシヨン法やウィルス感染等が用いられる。 経口導入のための方法には、 2本 鎖ポリヌクレオチドを生物の食物と直接混合することができる。 さらに、 個体に 導入する場合には、 例えば埋め込み長期放出製剤等として投与することや、 2本 鎖ポリヌクレオチドを導入した導入体を摂取させることにより行うこともできる。 導入する 2本鎖ポリヌクレオチドの量は、 導入体や、 標的遺伝子によって適宜 選択することができるが、 細胞あたり少なくとも 1コピー導入されるに充分量を 導入することが好ましい。 具体的には、 例えば、 被導入体がヒト培養細胞で、 力 ルシゥムフォスフェート法により 2本鎖ポリヌクレオチドを導入する場合、 0 . 1〜: L 0 0 0 nMが好ましレヽ。
R N Aインターフェアレンスによる本発明の遺伝子の導入体内での発現抑制に より、 本発明の遺伝子がコードするタンパク質の機能の確認、 あるいは新たな機 能の解析等を行うことができる。
( 6 ) 本発明のタンパク質に特異的に結合する抗体
本発明のタンパク質と特異的に結合する抗体の調製方法としては、 通常用いら れる公知の方法を用いることができ、 抗原として用いられるポリペプチドについ ても、 公知の方法に従って抗原性が高くェピトープ (抗原決定基) として適した 配列を選択して用いることができる。 ェピトープの選択方法としては、 例えば E p i t o p e A d v i s e r (富士通九州システムエンジニアリング社製) 等 の市販のソフトウェアを用いることができる。 また、 対象タンパク質が、 公知の バリアントが存在するスプライシングバリアントである場合には、 対象タンパク 質にのみ反応し、 公知の、 またはそれ以外のバリアントには反応しない抗体を用 いることにより、 対象タンパク質に特異的な機能を同定することができる。 この ような抗体のェピトープとしては、 例えば、 対象タンパク質が公知のバリアント と比較して欠失しているアミノ酸配列がある場合、 欠失部分の前後のアミノ酸配 列 (ジャンクション部分) 等が好ましい。 また、 対象タンパク質が公知のバリア ントの N末または C末が添加されているアミノ酸配列を有する場合、 添カ卩されて いるアミノ酸配列をェピトープとすることも好ましい。 上記以外の方法として、 対象タンパク質に対して取得したポリクローナル抗体から、 公知の、 またはそれ 以外のバリアントに反応する抗体を除去することにより、 対象タンパク質にのみ 反応する抗体を取得することができる。 除去する方法としては、 公知の、 または それ以外のバリアントをリガンドとして固定したァフィ二ティーク口マトグラフ ィー、 或いは、 公知の、 またはそれ以外のバリアントによる免疫沈降法等が用い られる。
上記の抗原として用いるポリべプチドは、 公知の方法に従って合成した合成ぺ プチドでも、 また本発明のタンパク質そのものを用いることもできる。 抗原とな るポリペプチドは、 公知の方法に従って適当な溶液等に調製して、 哺乳動物、 例 えばゥサギ、 マウス、 ラット等に免疫を行えばよいが、 安定的な免疫を行ったり 抗体価を高めるために抗原ぺプチドを適当なキャリアタンパク質とのコンジュゲ ートにして用いたり、 アジュバント等を加えて免疫を行うのが好ましい。
免疫に際しての抗原の投与経路は特に限定されず、 例えば皮下、 腹腔内、 静脈 内、 あるいは筋肉内等のいずれの経路を用いてもよい。 具体的には、 例えば B A L B / cマウスに抗原ポリぺプチドを数日〜数週間おきに数回接種する方法等が 用いられる。 また、 抗原の摂取量としては、 抗原がポリペプチドの場合 0 . 3〜 0 . 5 m g Z l回程度が好ましいが、 ポリペプチドの種類、 また免疫する動物種 によっては適宜調節される。
免疫後、 適宜試験的に採血を行ってオクタローニ一法、 固相酵素免疫検定法 (以下、 これを 「E L I S A法」 と称することがある) やウェスタンプロッティ ング等の方法で抗体価の上昇を確認し、 十分に抗体価の上昇した動物から採血を 行う。 これに抗体の調製に用いられる適当な処理を行えばポリクローナル抗体を 得ることができる。 具体的には、 例えば、 公知の方法に従い血清から抗体成分を 精製した精製抗体を取得する方法等が挙げられる。 抗体成分の精製は、 塩析、 ィ オン交換クロマトグラフィー、 アブイ-ティークロマトグラフィ一等の方法を用 いることができる。 2 また、 該動物の脾臓細胞とミエローマ細胞とを用いて公知の方法に従って融合 させたハイプリ ドーマを用いる (Mi l s t e i n, e t a 1. , N a t u r e, 256, 495 (1975) ) ことによりモノクローナル抗体を作製するこ ともできる。 モノクローナル抗体は、 例えば以下の方法により取得することがで きる。
まず、 上記した抗原の免疫により抗体価の高まった動物から抗体産生細胞を取 得する。 抗体産生細胞は、 形質細胞、 及ぴその前駆細胞であるリンパ球であり、 これは個体の何れから取得してもよいが、 好ましくは脾臓、 リンパ節、 末梢血等 から取得する。 これらの細胞と融合させるミエローマとしては、 一般的にはマウ スから得られた株化細胞、 例えば 8—ァザグァ二ン耐性マウス (BALBZc由 来等) ミエローマ細胞株である P 3X63— Ag 8. 653 (ATCC : CRL -1580) 、 P 3 -NS 1/1 Ag 4. 1 (理研セルバンク : RCB 009 5) 等が好ましく用いられる。 細胞の融合は、 抗体産生細胞とミエローマ細胞を 適当な割合で混合し、 適当な細胞融合培地、 例えば RPMI 1640やイスコフ 改変ダルベッコ培地 (IMDM) 、 あるいはダルベッコ改変イーグル培地 (DM EM) 等に、 50%ポリエチレングリコール (PEG) を溶解したもの等を用い ることにより行うことができる。 また電気融合法 (U. Z imme rma nn. e t a 1. , Na t u rw i s s e n s c h a f t e n, 68, 577 (1 981) ) によっても行うことができる。
ハイブリ ドーマは、 用いたミエローマ細胞株が 8—ァザグァニン耐性株である ことを利用して適量のヒポキサンチン'アミノプテリン ·チミジン (HAT) 液 を含む正常培地 (HAT培地) 中で 5%C02、 37 °Cで適当時間培養すること により選択することができる。 この選択方法は用いるミエローマ細胞株によって 適宜選択して用いることができる。 選択されたハイプリ ドーマが産生する抗体の 抗体価を上記した方法により解析し、 抗体価の高い抗体を産生するハイプリ ドー マを限界希釈法等により分離し、 分離した融合細胞を適当な培地で培養して得ら れる培養上清から硫安分画、 ァフィ二テイクロマトググラフィ一等の適当な方法 により精製してモノクローナル抗体を得ることができる。 また精製には市販のモ ノクローナル抗体精製キットを用いることもできる。 さらには、 免疫した動物と 同系統の動物、 またはヌードマウス等の腹腔内で上記で得られた抗体産生ハイブ リ ドーマを増殖させることにより、 本発明のモノクローナル抗体を大量に含む腹 水を得ることもできる。
また、 本発明のタンパク質としてヒト由来のものを取得した場合には、 かかる ポリペプチド、 あるいはその部分ペプチドを抗原として、 ヒ ト末梢血リンパ球を 移植し 7こ S e v e r e c om i n e d i mm u n e d e f i c i e n c y (SC I D) マウスに上記した方法と同様にして免疫し、 該免疫動物の抗体産 生細胞とヒ トのミエ口一マ細胞とのハイブリ ドーマを作製することによってもヒ ト型抗体を作製することができる (Mo s i e r, D. E. , e t a 1. Na t u r e , 335, 256-259 (1988) ; Du c h o s a l , M. A. , e t a 1. , Na t u r e, 355, 258— 262 (1992) ) 。
また、 取得したヒト型抗体を産生するハイプリ ドーマから RNAを抽出し、 目 的のヒト型抗体をコードする遺伝子をクローニングして、 この遺伝子を適当なベ クタ一に挿入し、 これを適当な宿主に導入して発現させることにより、 さらに大 量にヒト型抗体を作製することができる。 ここで、 抗原との結合性の低い抗体は、 それ自体既知の進化工学的手法を用'いることによりさらに結合性の高い抗体とし て取得することもできる。 一過性抗体等の部分フラグメントは、 例えばパパイン 等を用いて F a b部分と F c部分を切断し、 ァフィ二ティカラム等を用いて F a b部分を回収することによつて作製することができる。
力くして得られる本発明のタンパク質と特異的に結合する抗体は、 本発明のタ ンパク質に特異的に結合することによって該タンパク質が有するキナーゼ活性等 を阻害する中和抗体として用いることもできる。 タンパク質が有する活性を阻害 するものの選択方法としては特に制限はないが、 例えば、 上記 (2) で作製した DNA導入体に抗体を接触または導入し、 導入体中の目的タンパク質の機能が阻 害されるか否かを解析する方法等が挙げられる。 かかる中和抗体は、 臨床へ応用するに際し、 上記有効成分を単独で用いること も可能であるが、 薬学的に許容され得る担体と配合して医薬品組成物として用い ることもできる。 この時の有効成分の担体に対する割合は、 1〜9 0重量%の間 で変動され得る。 また、 力かる薬剤は種々の形態で投与することができ、 それら の投与形態としては、 錠剤、 カプセル剤、 顆粒剤、 散剤、 あるいはシロップ剤等 による経口投与、 または注射剤、 点滴剤、 リボソーム剤、 坐薬剤等による非経口 投与を挙げることができる。 また、 その投与量は、 症状、 年齢、 体重等によって 適宜選択することができる。
( 7 ) 本発明のタンパク質が有する活性を調節する分子のスクリーニング 本発明のタンパク質に特異的に結合し、 かつ本発明のタンパク質の機能 (活 性) を阻害、 拮抗または増強する作用を有する物質をスクリーニングすることに より本発明のタンパク質の機能調節物質 (以下、 これを 「調節物質」 と称するこ とがある) を得ることができる。
この調節物質のスクリーニング方法は、 本発明のタンパク質に特異的に結合し、 且つ該タンパク質の活性を阻害、 拮抗または増強する作用を有する物質が得られ る方法であれば如何なるものであってもよい。 例えば、 先ずはじめに本発明のタ ンパク質とスクリーニングに供する物質 (以下、 これを 「被検物質」 と称するこ とがある) とを接触させ、 該タンパク質との結合性を指標として選抜した後に、 本発明のタンパク質が有する活性の変化を指標として被検物質を選抜する方法を 用いることができる。
被検物質としては、 本発明のタンパク質と相互作用して、 該タンパク質が有す る活性に影響を及ぼす可能性のある物質であれば如何なるものであってもよレ、が、 具体的には、 例えば、 ペプチド、 タンパク質、 非ペプチド性化合物、 低分子化合 物、 合成化合物、 発酵生産物、 細胞抽出液、 動物組織抽出液等が挙げられる。 こ れらの物質は新規な物質であってもよいし、 公知の物質であってもよい。
被検物質と本発明のタンパク質の相互作用の解析法としては、 それ自体既知の 常法を用いることができるが、 具体的には、 例えば、 酵母ツーハイブリッド法、 蛍光偏光解消法、 表面プラズモン法、 ファージディスプレイ法、 リポソ一マルデ イスプレイ法、 あるいは上記 (6 ) に記載した抗体との競合解析法等が挙げられ る。 このような方法により、 本発明のタンパク質に結合する活性を見いだされた 物質は、 次に該物質の存在下で本発明のタンパク質が有する活性がどのような影 響を受けるかを解析することによって、 調節物質として用いられる力否かが同定 される。
ここで、 対象タンパク質が、 公知のバリアントが存在するスプライシングバリ アントである場合には、 対象タンパク質にのみ結合し、 公知のまたは他のバリア ントには結合しない物質についてその影響を解析するカ または公知のあるいは 他のバリアントにおレ、ても同様に結合する力否かを同定し、 結合した場合にはそ の影響の相違を解析することによって、 対象タンパク質に対する該物質の影響を 解析することができる。 また、 該物質の個体内での分布を検討することにより、 対象タンパク質や公知のまたは他のバリアントに対する影響を解析することがで きる。
具体的な解析方法としては、 例えば、 キナーゼ活性を調節する物質を解析する 場合には、 (2 ) に記載した D NA導入体に基質となるタンパク質も同様の方法 で導入する。 この導入体について選択された物質の存在下/または非存在下で基 質となるタンパク質のリン酸ィヒをそれ自体既知の通常用いられる方法により解析 する。 具体的には、 上記 (3 ) に記載の方法等を用いて行うことができる。 基質 となるタンパク質のリン酸化が、 物質の非存在下の場合と比べて増加した場合に は、 該物質はキナーゼ活性物質として機能する可能性があり、 また低下、 または 阻害された場合には物質はキナーゼ阻害物質として機能する可能性があると同定 できる。
ここで、 医薬活 '性成分の取得を目的として調節物質をスクリーエングするため に用いる本発明の D NA、 あるいは組み換えタンパク質を用いる場合は、 ヒ トの D NAあるいはタンパク質を用いることが好ましい。 さらに上記方法によってで スクリーニングされた物質は、 さらに生体内でのスクリーニングによって医薬侯 補としての選択を行ってもよい。 なお、 本発明のタンパク質の機能調節物質の評 価は、 上記した方法に限定されるものではない。
本発明のタンパク質が有するキナーゼ活性としては、 例えば、 癌に関連するパ スウェイ上のシグナル伝達機能、 心筋発達に関連するパスウェイ上のシグナル伝 達機能、 精子の運動性を制御するパスウェイ上のシグナル伝達機能、 生殖細胞分 化を制御するパスウェイ上のシグナル伝達機能、 細胞分化を制御するパスウェイ 上のシグナル伝達機能、 精子の分ィヒを制御するパスウェイ上のシグナル伝達機能、 アルツハイマー病発症を制御するパスウェイ上のシグナル伝達機能、 グリセロー ル 3リン酸を生成する機能、 脳皮質発達、 神経細胞等遊走を制御するパスウェイ 上のシグナル伝達機能、 脂肪酸ゃステロールの合成に関連する機能、 細胞死に関 連するパスウェイ上のシグナル伝達機能、 ィンシュリンシグナル伝達等である。 そこで、 本スクリーニング方法により同定できる化合物は、 制癌剤、 心疾患治療 剤、 不妊治療剤、 再生組織誘導剤、 アルツハイマー病治療剤、 神経変性疾患治療 剤、 糖尿病治療剤として用いられ得るものである。
また、 本発明のタンパク質は、 精巣、 気管、 脳ダリオ一マ細胞由来の培養細胞 等から構築された cDNAライブラリーよりクローユングされており、 取得された 本発明のタンパク質は、 上記組織おょぴ器官等において特有の機能を有している 可能性があるので、 該組織および器官に特有の疾患の治療剤として用いられ得る。 かかる調節物質は、 臨床へ応用するに際し、 上記有効成分を単独で用いること も可能であるが、 薬学的に許容され得る担体と配合して医薬品糸且成物として用い ることもできる。 この時の有効成分の担体に対する割合は、 1〜9 0重量%の間 で変動され得る。 また、 力かる薬剤は種々の形態で投与することができ、 それら の投与形態としては、 錠剤、 カプセル剤、 顆粒剤、 散剤、 あるいはシロップ剤等 による経口投与、 または注射剤、 点滴剤、 リボソーム剤、 坐薬剤等による非経口 投与を挙げることができる。 また、 その投与量は、 症状、 年齢、 体重等によって 適宜選択することができる。
( 8 ) 本発明の D N Aの発現調節物質のスクリーニング スクリーニングの方法としては、 被検物質の存在下で本発明のタンパク質、 あ るいはそれをコードする mR N Aの発現量を解析する方法等が挙げられる。 具体 的には、 例えば、 (2 ) に記載した本発明のタンパク質を発現する細胞を被検物 質を含む適当な培地で培養し、 該細胞内に発現している本発明のタンパク質量を E L I S A等の常法を用いて解析するか、 あるいは該細胞内の本発明のタンパク 質をコードする mR NA量を、 定量的逆転写 P C R法や、 ノーザンブロット法等 により解析することにより行うことができる。
被検物質としては、 (7 ) に記載のものを用いることができる。 この解析によ り、 被検物質の非存在下で培養された当該細胞内で発現されたタンパク質、 ある いは mR NA量と比べてその量が増加すれば、 この被検物質は本発明の D N Aの 発現促進物質として機能する可能性があり、 逆に減少した場合には、 この被検物 質は本発明の D N Aの発現阻害物質として用いられ得ると判断することができる。 かかる発現調節物質は、 臨床へ応用するに際し、 上記有効成分を単独で用いる ことも可能であるが、 薬学的に許容され得る担体と配合して医薬品組成物として 用いることもできる。 この時の有効成分の担体に対する割合は、 1〜9 0重量% の間で変動され得る。 また、 かかる薬剤は種々の形態で投与することができ、 そ れらの投与形態としては、 錠剤、 カプセル剤、 顆粒剤、 散剤、 あるいはシロップ 剤等による経口投与、 または注射剤、 点滴剤、 リボソーム剤、 坐薬剤等による非 経口投与を挙げることができる。 また、 その投与量は、 症状、 年齢、 体重等によ つて適宜選択することができる。
( 9 ) 本発明の D N A導入動物
上記 (1 ) に記載の、 本発明の D NAを含む導入 D NAを構築し、 ヒト以外の 哺乳動物の受精卵に導入して、 これを雌個体子宮に移植して発生させることによ り、 本発明の D NAが導入された非ヒト哺乳動物を作製することができる。 より 具体的には、 例えば、 雌個体をホルモン投与により過剰排卵させた後、 雄と交配 し、 交配後 1日目の卵管から受精卵を摘出し、 該受精卵に導入 D NAをマイクロ インジェクション等の方法により導入する。 この後、 適当な方法で培養した後、 生存している受精卵を、 偽妊娠させた雌個体 (仮親) の子宮に移植して出産させ る。 新生仔に目的の D N Aが導入されているか否かは、 該個体の細胞から抽出し た D N Aのサザンプロット解析を行うことにより同定することができる。 ヒト以 外の哺乳動物としては、 例えばマウス、 ラット、 モルモット、 ハムスター、 ゥサ ギ、 ャギ、 ブタ、 ィヌ、 ネコ等が挙げられる。
かくして得られた本発明の D N A導入動物は、 この個体を交配し、 導入された D N Aが安定的に保持されていることを確認しながら通常の飼育環境で継代飼育 することによりその子孫を得ることができる。 また、 体外受精を繰り返すことに よりその子孫を得て、 系統を維持することもできる。
本発明の D N Aが導入ざれた非ヒト哺 ¾動物は、 本発明の D N Aの生体内にお ける機能の解析や、 またこれを調節する物質のスクリーニング系等として用いる ことができる。
( 1 0 ) 本発明のタンパク質及ぴそれをコードする塩基配列を含む D NAの他の 利用
本発明のタンパク質は、 それを基盤上に結合させた担体として利用することが できる。 また、 本発明のタンパク質をコードする塩基配列、 例えば、 配列番号 1 〜 5に記載の塩基配列を有する D N A及ぴその部分断片は、 それらを基板上に結 合させた担体として用いられ得る。 これらを、 以下、 「プロテインチップ」 、
「D NAチップ」 または 「D NAアレイ」 (D NAマイクロアレイ及び D NAマ クロアレイ) と称することがある。 これらのプロテインチップ、 又は D NAチッ プもしくはアレイには、 本発明のタンパク質や D NA以外に、 他のタンパク質や D N Aが含まれていてもよい。
ここで、 対象タンパク質が公知のバリアントが存在するスプライシングバリァ ントである場合、 上記プロテインチップには対象タンパク質特異的なアミノ酸配 列部分断片を用いることもできるが、 他バリアントと異なる立体構造を有してい る可能性もあるためその全長を用いることもできる。 また、 D NAアレイには、 対象タンパク質をコードする DNA配列のうち、 他のバリアント DN Aと異なる 配列を選択することが好ましい。
また、 タンパク質や DNAを結合させる基盤としては、 ナイロン膜、 ポリプロ ピレン膜等の樹脂基板、 ニトロセルロース膜、 ガラスプレート、 シリコンプレー ト等が用いられるが、 ハイプリダイゼーシヨンの検出を非 R I的に、 例えば、 蛍 光物質等を用いて行う場合には、 蛍光物質を含まないガラスプレート、 シリコン プレート等が好適に用いられる。 また該基盤へのタンパク質、 あるいは DN Aの 結合は、 それ自体公知の通常用いられる方法により容易に行うことができる。 こ れらのプロテインチップ、 DNAチップ、 あるいは DNAアレイも、 本発明の範 囲に含まれる。
■ また、 本発明のタンパク質のアミノ酸配列及ぴ DN Aの塩基配列は、 配列情報 としても用いることができる。 この DN Aの塩基配列には、 対応する RN Aの塩 基配列も含まれる。 すなわち、 得られたアミノ酸配列や塩基配列をコンピュータ 一が読みとり可能な所定の形式で適当な記録媒体に格納することにより、 ァミノ 酸配列や塩基配列のデータベースが構築できる。 このデータべ一スには、 他の種 類のタンパク質やそれをコードする DN Aの塩基配列が含まれていてもよい。 ま た、 本発明においてデータベースとは、 上記配列を適当な記録媒体に書き込み、 所定のプログラムに従って検索を行うコンピューターシステムをも意味する。 こ こで適当な記録媒体としては、 例えば、 フレキシブルディスク、 ハードディスク、 磁気テープ等の磁気媒体、 CD— ROM、 MO、 CD-R, CD-RW, DVD 一 R、 DVD— RAM等の光ディスク、 半導体メモリ等を挙げることができる。 実施例
以下、 実施例を挙げて本発明を詳細に説明するが、 本発明の範囲はこれらの実 施例により限定されるものではない。 なお、 取得された各 cDNAクローンにつ いて以下の実験を行った結果は、 実施例 5に纏めて記載した。
実施例 1 オリゴキヤップ法による cDNAライブラリ一の作製 ヒト培養細胞 (ヒト脳グリオ一マ細胞由来の培養細胞である H 4細胞、 ATCC : HTB-148) より、 文献 ( J . S a mb r o o k, e t a 1. , Mo l e c u l a r C l o n i n g S e c o n d e d i t i o n, Co l d S p r i n g h a r b o r La b o r a t o r y P r e s s (1989) ) 載の方 法により niRNAを抽出した。 さらに、 オリゴ dTセルロースで p o 1 y (A) +RNAを精製した。
上記で取得した p o 1 y (A) +RNAと、 巿販のヒト各組織 mRNA (クロ ンテック社製:精巣 (#64027-1) 、 気管 (#64091-1) ) よりオリゴキャップ法
(Ma r uy ama, K. , e t a 1. , Ge n e, 138, 171-174
(1994) ) により cDNAライブラリーを作製した。
まず、 上記 RNAを B AP (B a c t e r i l A l k a l i n e P o s p h a t a s e) およぴ TAP (To b a c c o Ac i d P y r o p h o s p h a t a s e) で処理した後に、 オリゴキャップリンカー (配列番号 1 1) を RNAライゲースを用いて連結した。 この RNA鎖を鍚型としてオリゴ dTプ ライマー (配列番号 12) 用いた逆転写反応により第 1鎖 cDNAを合成し、 続 いて RNA鎖を分解除去した (鈴木ら、 タンパク質 核酸 酵素、 41、 603 -607 (1996) ; Su z uk i, Y. e t a 1. , Ge n e, 200, 149- 156 (1997) ) 。 次いで、 5, の PCRプライマー (配列番号 1 3) と 3' の PC Rプライマー (配列番号 14) を用い PC R (p o l yme r a s e c h a i n r e a c t i o n) により 2本鎖 c DNAを増幅し、 増幅 された DNA鎖を S f i Iにより切断した。
次いで、 発現用ベクターである pME 18 S F L 3 (G e n B a n k AB O 09864) の D r a I I Iサイトに上記で取得した S f i I切断断片をクロー ユングし、 c DNAライブラリーを作成した。 上記で用いた pME 18 S F L 3 ベクターは、 クローニング部位の上流に S R αプロモーターと SV40 s ma 1 1 tイントロンが組み込まれており、 またその下流には S V 40ポリ A付カロ シグナル配列が挿入されている。 pME 18 S F L 3のクローン化部位は非対称 性の D r a I I Iサイトとなっており、 c DN A断片の末端にはこれと相捕的な S f i I部位を付加しているので、 クローン化した c DNA断片はSRQ;プロモ 一ターの下流に一方向性に揷入される。 したがって、 全長 cDNAを含むクロー ンでは、 得られたプラスミドをそのまま COS細胞に導入することにより、 一過 的に遺伝子を発現させることが可能である。 すなわち、 非常に容易に、 遺伝子産 物であるタンパク質として、 あるいはそれらの生物学的活性として実験的に解析 することが可能となっている。
これらより得たクローンのプラスミド DNAについて、 cDNAの 5, 端また は 3 ' 端の塩基配列を DN Aシーケンシング試薬 (Dy e Te rmi n a t o r し y c l e S e q u e n c i n g P S Re a d y Re a c t i o n Ki t, dRh o d ami n e Te rm i n a t o r Cy c l e S e q u e n c i n g F S Re a dy Re a c t i o K i tまたは B i gD y e Te rm i n a t o r Cy c l e S e qu e n c i n g F S Re a d y Re a c t i o n K i t : P E B i o s y s t erns社製) を用レヽ、 マニュアルに従ってシーケンシング反応後、 DNAシーケンサー (AB I PR I SM 3700 : PE B i o s y s t ems社製) で DNA塩基配列を解析 した。 実施例 2 オリゴキヤップ法で作製した c D N Aライブラリ一からのクローンの 5' 末端の全長性の評価
実施例 1で作製したヒト c DNAライブラリーの 5 ' 末端の塩基配列は、 これ を公共データベース中のヒト既知 mRNAの配列と比較し、 5, 末端配列が一致 する全クローンについて、 公共データベース中の既知 mRNA配列より長く 5, 末端が伸びている場合、 または 5' 末端は短いが翻訳開始コドンは有している場 合を 「全長」 と判断し、 翻訳開始コドンを含んでいない場合を 「非全長」 と判断 した。 次に、 E ST iMa t e F Lによるクローンの評価を行った。 E ST iMa t e F Lは、 公共データベース中の E S Tの 5, 末端配列や 3 ' 末端配列との比較 によって全長 cDNAの可能性の高いクローンを選択するために、 ヘリックス研 究所の西川 ·太田らにより開発された方法である。 実施例 1で解析した c DNA クローンの 5, 末端や 3, 末端配列を ESTデータベースに登録されている塩基 配列と比較し、 取得された c D N Aクローンの配列よりも、 5, 側または 3 ' 側 へ伸長している E STが存在する場合には、 そのクローンは 「全長ではない可能 性が高い」 と判断した。 公共データベース中の EST配列より 5, 末端が伸長し ている場合、 あるいは 5, 末端が短いクローンでも、 その差が 50塩基以内の場 合を便宜的に全長とし、 それ以上短い場合を非全長とした。 実施例 3 c D N Aクローンの塩基配列、 ァミノ酸配列の解析
実施例 2で解析した cDNAクローンの全塩基配列について、 BLAST (B a s 1 c l o c a l a l i g nme n t s e a r c h t o o l ; A 1 t s c h u 1 , S. F. , e t a 1. , J . Mo 1. B i o l . , 2 15, 403-410 (1990) ) による相同性検索 (h omo l o g y s e a r c h) や、 HMMER (隠れ Ma r k o vモデルによる配列解析手法; Ed dy, S. R. , B i o i n f o rma t i c s 14, 755— 763
(1998) ) の機能群のひとつである HMMPF AMによるタンパク質特徴検 (p r o f i l e s e a r c h : h t t p : // p f am. wu s t l . e d u) を行い、 各 c DNAクローンがコードするタンパク質の機能を推定した。 また、 その塩基配列の一部が完全に一致する公知のクローンが存在するスプライ シングバリアントと推定されるクローンについては、 そのゲノム配列が解析可能 であればどのェクソンが欠失してスプライシングしたものであるかを解析した。 実施例 4 キナーゼ活性の測定
(1) タンパク質の調製 実施例 3でキナーゼ活性を有すると推定された c D NAクローンについて、 こ れがコードするタンパク質を無細胞タンパク質合成系を用いて合成し、 該タンパ ク質がキナーゼ活性を有するか否かを以下の生化学的実験により解析した。 実施例 3でキナーゼ活性を有すると推定された cDNAクローンのオープンリー デイングフレーム (0RF) 断片を、 5, 側のプライマーとして各クローンに特異 的な下記プライマー、 3, 側のプライマーとして下記の共通プライマーを使用し た PCR法によつて取得した。
5 ' 側のプライマー
( a ) c-bngh42005017 : ATGGGTCAAGAGCTGTGTG (配列番号 1 5 )
( b ) c-testi2025879: ATGTTCAAAGAAATCAATTCAACTGCT (配列番号 1 6 )
( c ) c-trach2020048 : ATGCAGTTTGGGAGAGCC (配列番号 1 7 )
( d ) c-testi2016663: ATGGTGAAGACAGGGGC (配列番号 1 8 )
( e ) c-testi2015335: ATGCAGCAGAAGCTGTACAT (配列番号 1 9 )
3 ' 側の共通プライマー
GGCCCTTATGGCCGGAGAAAGGCGGACAGGTAT (配列番号 2 0 )
これを、 SP6プロモーターを含む翻訳制御領域一グルタチオン一S _トランス フェラーセ遺伝子一 PreScission Protease (アマシャムファノレマシァ/ ィォテク 社製) 切断サイト一 DNAクローニングサイト (Smal, Sfil) 一ポリ Aシグナル配 列を有するベクター (p E U—S S 4 ) のクローニングサイトに挿入した。 上記で調製されたプラスミ ド D NAを铸型として、 SP6 R A Polymerase (Promega社製) を用いて転写を行 、、 得られた RNAをフエノール/クロ口ホル ム抽出、 エタノール沈殿の後、 Nick Column (Amersham Pharmacia Biotech社 製) によって精製した。
透析法によるコムギ胚芽抽出液を用いた無細胞タンパク質合成の方法は既報 (Endo, Y. et al. , (1992) J. Biotech. , 25, 221-230) の方法に従った。 反応 溶液は、 容量の 2 4 %のコムギ胚芽抽出液を含み、 上記 Ericksonらの方法に準 じた以下の成分組成である。 20 mM HEPES-K0H、 pH 7. 6、 80 mM酢酸カリゥム、 1.6 mM酢酸マグネシウム、 0.4 mMスペルミジン、 2 raMジチオスレィトール、 20 種類の L -ァミノ酸(各 0.24 mM)、 1.2 mM ATP、 0.26 πιΜ GTP、 16 raM
リン酸、 0.4 mg/mlクレアチンキナーゼ、 1000 units/ml ribonuclease
inhibitor (RNasin™)に、 上述した mRNA (1 rag/ml反応容量) を添加して用いた。 上記反応溶液をフロータ ·ライザ一 (Spectra / Float- A- Lyzer (Biotech RC)、 分画分子量: 10 kDa, 容量: 1 ml) に入れ、 反応液の 40倍容量の透析外液 (30 mM HEPES- K0H、 pH 7.6、 100 mM酢酸カリゥム、 2.7 raM酢酸マグネシウム、 0.4 スペルミジン、 2.5 raMジチオスレィトール、 20種類の L -アミノ酸(各 0.3 )、 1.2 mM ATP, 0.25 uM GTPN 16 raM クレアチンリン酸) に対しての透析系で、 反応は 26°Cで、 48時間行った。
反応終了後、 透析内液を 1 6, 000 r p mで 5分間遠心分離し、 上清を分離 した。 この上淸を、 1 5 0 mM塩化ナトリゥム、 1 0 mMジチォスレイトールを 含む 50 mMトリス '塩酸緩衝液 (p H8. 5) で 5倍希釈し、 同緩衝液で平衡 化したァフイエティ樹脂であるグルタチオンセファロース ' 4 B (アマシャムバ ィォサイエンス社製) を充填したァフィ二ティカラムに室温で添加し、 目的タン パク質を吸着した。 ここで、 上記カラムには、 取得した遠心上清の 1Z 2量のァ フィニティ樹脂を用いた。
さらに、 上記で用いたァフィ二ティ樹脂の 10倍容量の同緩衝液にてカラムを 洗浄した後、 2 u 11 i t s / μ 1濃度の P r e S c i s s i o n p r o t e a s e (アマシャムバイオサイエンス社製) の同緩衝液による 2 5倍希釈液を、 ァ フィニティ樹脂と等容量添加し、 4 で 40時間切断反応を行った後、 上記緩衝 液にて目的タンパク質を溶出した。
(2) 目的タンパク質の AT P消費量を指標とするキナーゼ活性の測定
上記 (1) で単離した目的タンパク質は、 ゥシ血清アルブミンを標準として定 量した。 0. 1 μ gの目的タンパク質を、 0. 2mg/m 1ゥシ血清アルブミン、 8 mM塩化マグネシゥムを含む 5 0 mMトリス '塩酸緩衝液 (pH 7. 4) 中で、 終濃度 1〜1 OmMとなるようにジチオスレィトールを添加後、 1 JuMのATP と室温で 24時間インキュベートした後、 ルシフェラーゼ ·ルシフェリンキット (和光純薬工業社製) 1 00 μ 1を加え、 室温で 24時間反応した後、 560 η mの蛍光強度を測定した。 目的タンパク質を添加していない反応系をコントロー ルとして、 同様に 560 nmの蛍光強度を測定した。 このコントロールの値と目 的タンパク質を添加した系の値の差を目的タンパク質が消費した AT P量として、 目的タンパク質 1 mo 1あたりが 24時間に消費する ATP量 (m o 1 ) を目的 タンパク質のキナーゼ活·生として同定した。
(3) 目的タンパク質によるポリぺプチドのリン酸化を指標としたキナーゼ活性 の測定
上記 (1) で単離した目的タンパク質は、 ゥシ血清アルブミンを標準として定 量した。 0. 1 μ gの目的タンパク質を、 基質としての標準ポリペプチド (C d c 2、 Ar g 2— OH、 PKA、 PKC、 DNA_PK、 PTK1、 PTK 2 : P r ome g a社、 MLCKS、 C a MK I I : S i gma社、 S y n t i d e 2 : BACHEM FE I NCHEMI KAL I EN AG) 0. 2 μ gととも に、 0. 2mg /m 1ゥシ血清アルブミン、 1〜 1 0 mMジチォスレイトール、 8 mM塩化マグネシウムを含む 5 OmMトリス .塩酸緩衝液 ( H 7. 4) 、 1 μΜ ATPと室温で 2時間インキュベートした。 反応終了後、 反応液を、 2 0%ァセトニトリルを含む 0. 1%トリフルォロ酢酸で平衡化した B a k e r b o n d C 18 (J. T. B a k e r社製: 0. 46 X 25 c m) カラムに添カロ し、 0. 1 %トリフルォロ酢酸の存在下で、 20〜 80%のァセトニトリルの 6 0分間の直線濃度勾配により流速 1 m 1 Z分でぺプチドを分離した。 ぺプチドの 溶出は、 2 1 5 nmの吸光度により測定した。 コントロールとして目的タンパク 質を添加しない反応液についても同様に分離し 21 5 nmの吸光度を測定した。 ここで、 目的タンパク質を添加することによってピークの減少および溶出位置の 変動が検出されるポリぺプチドについては、 目的タンパク質の有するキナーゼ活 性の基質となると判断することができる。 実施例 5 各 cDNAクローンの解析結果
(1) c-b n gh4200501 7 (配列番号 1、 6 )
c-b n g h4200501 7 (以下、 これを 「本 DNA」 と称し、 該 DNA によりコードされるタンパク質を 「本タンパク質」 と称する) は、 配列番号 1に 示すように、 1828塩基から成り、 そのうち塩基番号 87から 1 124までが オープンリーディングフレーム (終止コドンを含む) である。 オープンリーディ ングフレームから予測されるアミノ酸配列は、 345アミノ酸残基から成る (配. 列番号 6) 。 配列番号 6のアミノ酸配列について BLASTを用いて相同性検索 を行ったところ、 NRDBタンパク質データベース (SWI S S— PROT、 P I R、 TREMBLE, GENPEPT、 P D Bから作成された重複のないアミ ノ酸配列のデータベース) 中に、 データベース登録記号 AB 053308、 am y o t r o p i c l a t e r a l s c l e r o s i s 2 C R 7 ^ h ma n) (以下、 これを 「ALS 2CR7」 と称する) 力 e - v a 1 u e : 5 X I 0- i 48、 285アミノ酸残基に亘り 92%の一致度でヒットした。 ALS 2CR7は amy o t r o p h i c l a t e r a l s c l e r o s i sの原 因遺伝子 a 1 s 2 c r 6の近傍に存在する遺伝子がコードするタンパク質
(Nature Genetics, 29, 166-173, (2001)) で、 p r o t e i n k i n a s e d oma i nが見出される。
本タンパク質と A L S 2 CR 7のアミノ酸配列 (データベース登録記号: AB 053308) を C.LUSTALWでアラインメント比較すると ALS 2 CR 7 は 384アミノ酸残基から成り、 その 1〜130番が、 配列番号 6に記載のアミ ノ酸配列のアミノ酸番号 52〜181番と完全に一致し、 また 152〜285番 、 配列番号 6に記載のァミノ酸配列のァミノ酸番号 182〜 315番と完全に 一致する。 即ち、 本タンパク質は ALS 2 CR 7のアミノ酸配列のアミノ酸番号 131〜151番を欠失し、 N末端の 1〜51番、 および C末端の 316〜34 5番に新規配列を有する。 このことを遺伝子上で確認するために ALS 2 CR 7がコードされているヒト 染色体 2番のゲノム配列上で本タンパク質をコードする c DNAと上記 AB 05 3308の c DNAの比較を行った。 AB 053308は 14個のエタソンから 成り、 本 DNAではその第 1、 6、 1 1、 12、 13、 14ェクソンを欠失し、 第 2、 3、 4、 5、 7、 8、 9、 10ェクソンを共有していた。 上記の本タンパ ク質の AL S 2 CR 7に対する 21アミノ酸の欠失は、 第 6ェクソンのスキップ によるものである。 また上記の本タンパク質の N末の 51アミノ酸残基の付カ卩は、 本 DNAの 5, 末端に上記 AB 053308にない別のエタソンが 1つ存在する ことによるものであった。 更に上記の本タンパク質の C末の 30アミノ酸残基の 付カ卩は、 本 DNAの 3 ' 末端に上記 A B 053308にない別のエタソンが存在 することによるものであった。 これらのことより本タンパク質は、 amy o t r o p h i c l a t e r a l s c l e r o s i s 2 CR7 (huma n) とは異なる p r omo t e rから発現する mRN Aに由来するタンパク質であ り、 N末端および C末端の配列が異なり、 中央に欠失を持つバリアントであるこ とがわかった。
一方、 本タンパク質と AB 053308の HMMPFAM検索を行ったところ、 本タンパク質 (配列番号 6) のアミノ酸番号 103— 325番に、 また AB 05 3308のァミノ酸配列のァミノ酸番号 52〜 336番に、 P r o t e i n k i n a s e d oma i nの特徴を示す配列 (P f a mに p k i n a s eとして エントリーされるアミノ酸配列) を見出した。 このことから本タンパク質の AL S 2 CR 7に対するアミノ酸配列の欠失は protein kinase domainに存在するこ とがわかった。 しかし本タンパク質の AT P消費活性を指標としたキナーゼ活性 を、 実施例 4 (2) の系で測定したところ、 29. 1であり、 また、 基質として Sy n t i d e 2 (配列番号 21) を添カ卩したところ (実施例 4 (3) ) 、 基質 の、 逆相 HP LC上でのピークの減少、 新規ピークの溶出 (図 1矢印部分) が確 認されたことから、 少なくとも S y n t i d e 2を基質とするプロテインキナー ゼであることが確認、された。 以上のように、 本タンパク質は AL S 2 CR 7の、 N末端、 C末端ともに異な る配列をもち Protein kinase domainの一部を欠失するが、 プロテインキナー ゼ活性が見出されたことから、 ALS 2 CR 7とは異なる機能をもつタンパク質 であることが推定された。
さらに、 本タンパク質をコードする cDNAは、 脳ダリオ一マ細胞由来の培養 細胞からクローユングされたものであり、 該組織に特有の器官の発生、 機能およ ぴ疾患に関連することが予測された。
(2) c- t e s t i 2025879 (配列番号 2、 7)
c- t e s t i 2025879 (以下、 これを 「本 DNA」 と称し、 該 DNA によりコードされるタンパク質を 「本タンパク質」 と称する) は、 配列番号 2に 示すように、 2195塩基から成り、 そのうち塩基番号 1 15から 2094まで がオープンリーディングフレーム (終止コドンを含む) になっていた。 オープン リーディングフレームから予測されるアミノ酸配列は、 659アミノ酸残基から 成る (配列番号 7) 。 また、 配列番号 7のアミノ酸配列について、 HMMPFA Mによるタンパク質特徴検索を行つたところ配列番号 7のァミノ酸番号 413— 659番に示されるアミノ酸配列に P r o t e i n k i n a s e d oma i nの特徴を示す配列 (P f an^ p k i n a s eとしてェントリーされるァミノ 酸配列) を見出した。
配列番号 7のァミノ酸配列について B LASTを用いて相同性検索を行ったと ころ、 NRDBタンパク質データベース (SWI S S— PROT、 P I R、 TR EMBLE、 GENPEPT、 P D Bから作成された重複のないアミノ酸配列の データベース) あるいは特許データベース GENESEQ中に、 (i) データベース登 録記号 AX166558、 および WOO 1/38503号公報に記載されている アミノ酸配列が、 e— V a 1 u e : 5 X 10— 148、 257アミノ酸に亘り 9 9 %の一致度でヒットした。 AX166558は 278ァミノ酸から成り、 その ァミノ酸配列中のァミノ酸番号 1 ~ 257番が配列番号 7に記載のァミノ酸配列 のアミノ酸番号 403〜659番と上記のように 99%—致していた。 即ち本タ ンパク質は AX 1 6 6 5 5 8より N末端が 40 2アミノ酸残基長く、 また、 C末 端が 2 1アミノ酸短いタンパク質である。 また、 上記特許公報には、 AX166558 タンパク質について novel mitogen- activated kinase (MAPK) との記載が あ 。
さらに、 ( i i ) データべース記号: AF 0 9 3 6 8 9 (Dictyostelium discoideum MEK kinase a) が 2 70アミノ酸残基にわたり 43 %の一致度で、 また、 ( i i i ) データベース登録記号: AB 0 0 0 7 9 7 (Arabidopsis thaliana NPK - related protein kinase)が 2 6 0ァミノ酸残基にわたって 4 8 % の一致度でヒットした。 これらはいずれも MAP kinase カスケ一ド (MAPKKK:、 MAPKK, MAPKが順次活性化することでシグナルを伝えていく系)における MAPKKK に位置付けられるプロテインキナーゼである。 従って、 本タンパク質は MAPKシ ダナルカスケードに属するタンパク質と推測される。
また AX 1 6 6 5 5 8と本タンパク質のアミノ酸配列の違いを明らかにするた め、 両 c DNAをヒ ト 2番染色体ゲノム配列上(データベース登録記号: emb|AC016725|AC016725)で比較した。 本 D N Aはェクソン 3個からなるが、 AX 1 6 6 5 5 8では本 DN Aの第 1ェクソンが無く、 第 2ェクソンの途中から開始 し、 第 3ェクソンを途中まで共有したあと、 別のェクソンを有していた。 AX 1 6 6 5 5 8のアミノ酸配列はメチォニンから始まっておらず、 不完全タンパク質 と推定されるが、 本タンパク質はメチォニンから始まっており、 AX 1 6 6 5 5 8よりも N末が 4 0 2アミノ酸残基長くなつていることが確認された。 このよう に N末に長レ、新規配列を有するタンパク質をコードする c DNAが単 ί隹されたの は、 実施例 1に記載のオリゴキャップ法を用いた優れた一例と考えられる。 上記 の新規 40 2アミノ酸配列を prosite検索すると、 6箇所の N—グリコシル化部 位、 1 3箇所の P K Cによるリン酸化部位、 1 2箇所の casein kinasellによる リン酸化部位、 1箇所のミリスチル化部位がみいだされ、 種々の翻訳後修飾およ び活性の調節を受ける可能性があることが分かった。 従って、 本タンパク質は A X 1 6 6 5 5 8にない活性調節部位を持つ protein kinaseと推定される。 本タンパク質の P f am検索を行うと、 配列番号 7のアミノ酸番号 413〜6 59番に protein kinase domainがみいだされた。 そこで本タンパク質の AT P 消費活性を、 実施例 4 (2) の系で測定したところ、 66. 6であり、 キナーゼ 活性があることが確認された。
これらのことより本タンパク質は、 上記 AX 166558および WOO 1/3 8503号公報に記載のタンパク質の N末端が伸長したバリアントであり、 キナ ーゼ活性を有することがわかった。 また、 本 DNAは、 精巣からクローニングさ れたものであり、 該,袓織に特有の器官の発生、 機能および疾患に関連するもので あることが推測された。
(3) c- t r a c h 2020048 (配列番号 3、 8)
c- t r a c h 2020048 (以下、 これを 「本 DNA」 と称し、 該 DNA によりコードされるタンパク質を 「本タンパク質」 と称する) は、 配列番号 3に 示すように、 3255塩基から成り、 そのうち塩基番号 1232から 2764ま でがオープンリーディングフレーム (終止コドンを含む) になっていた。 オーブ ンリーディングフレームから予測されるアミノ酸配列は、 510アミノ酸残基か ら成る (配列番号 8) 。 配列番号 8のアミノ酸配列について BLASTを用いて 相同性検索を行ったところ、 NRDBタンパク質データベース (SWI S S— P ROT, P I R、 TREMBLE, GENPEPT, PDBから作成された重複 のないアミノ酸配列のデータベース) 中に、 データベース登録記号 AX4056 33ー1、 unn ame d ORFが、 e— v a l u e : 0、 527アミノ酸残 基に亘り 96%の一致度でヒットした。 また、 AX405633—1は、 WO 0 2Z22660号公報に SEQ I D NO. 492として記載されている Nek3 (a novel human protein kinase) に類似のタンパク質であった。 AX 40 5633—1は 527アミノ酸から成り、 該配列のアミノ酸番号 1〜 313番が 本タンパク質のアミノ酸配列 (配列番号 8) の 1〜313番と、 また 331〜5 27番が本タンパク質の 314〜510番と完全に一致していた。 また、 AX4 05633—1のアミノ酸番号 162番がグリシンであるのに対し、 本タンパク 質のそれに相当する部分のアミノ酸はバリンであった。
すなわち本タンパク質は AX405633—1のアミノ酸番号 314〜330 番のアミノ酸配列部分を欠失し、 1アミノ酸置換変異をもつバリアントである。 AX405633—1のアミノ酸番号 162番のパリン/グリシン置換は他の公 知のバリアントタンパク質 (例えば、 WO 00/0006728号公報に記載の タンパク質) にも認められていることから SNPによる変異であると考えられる。 従って、 本質的には中央部 (配列番号 8のアミノ酸番号 313番と 314番の 間) の 17アミノ酸の欠失 (AX405633— 1のアミノ酸配列のアミノ酸番 号 314〜330番) が本タンパク質の構造を特異にしている。 この欠失領域に は PKAでリン酸化される部位 1箇所、 casein kinase IIでリン酸化される部 位 1箇所、 ミリスチル化部位 1箇所があり、 種々の翻訳後修飾部位となっている。 本 DNAと AX405633— 1の c DNAを、 AX405633— 1がコー ドされているヒ ト染色体 13番のゲノム配列 (データベース登録記号: emne | AL6722271 AL672227) において比較したところ、 本 D N Aは AX405 633— 1の第 10ェクソンをスキップすることで 17アミノ酸残基の欠失を生 じていることがわかった。
また、 配列番号 8のアミノ酸配列について、 HMMP F AMによるタンパク質 特徴検索を行つたところ配列番号 8のァミノ酸番号 25〜 278のァミノ酸配列 に P r o t e i n k i n a s e d oma i nの特徴を示す酉己列 (P f a mに p k i n a s eとしてェントリーされるアミノ酸配列) を見出した。 本タンパク 質の ATP消費量は、 実施例 4 (2) の系で測定したところ、 59. 0であり、 キナーゼ活性があることが確認された。
これらのことから本タンパク質は、 AX405633— 1、 すなわち WO 02 /22660号公報に S EQ I D NO. 492として記載されている Nek3
(a novel human protein kinase )に類似のタンノヽク (
ントであり、 キナーゼ活性を有するタンパク質であることが推定された また、 本 DNAは、 気管からクローユングされたものであり、 本タンパク質は 該組織に特有の器官の発生、 機能および疾患に関連することが推測された。
(4) c- t e s t i 201 6663 (配列番号 4、 9 )
c- t e s t i 2016663 (以下、 これを 「本 DNA」 と称し、 該 DNA によりコードされるタンパク質を 「本タンパク質」 と称する) は、 配列番号 4に 示すように、 2259塩基から成り、 そのうち塩基番号 316から 1947まで がオープンリーディングフレーム (終止コドンを含む) になっていた。 オープン リーディングフレームから予測されるアミノ酸配列は、 543アミノ酸残基から 成る (配列番号 9) 。 配列番号 9のアミノ酸配列について BLASTを用いて相 同性検索を行ったところ、 NRDBタンパク質データベース (SWI SS— PR OT、 P I R、 TREMBLE, GENPEPT、 P D Bから作成された重複の ないアミノ酸配列のデータベース) 中に、 データベース登録記号 AX 36220 7— 1、 unn ame d ORFが、 e— v a l u e : 0、 504ァミノ酸残基 に亘り 99%の一致度でヒッ トした。 AX362207一 1は 974アミノ酸か らなり、 そのアミノ酸配列のァミノ酸番号 470〜 973番が、 配列番号 9に記 載のアミノ酸配列のアミノ酸番号 1〜502番と下述の 4アミノ酸残基を除いて 一致している。 また、 上記 AX 362207—1は、 WO 02/08253号公 報に記載されており、 Hum a n E p hA f u l l l e n g t h k i n a s eであると記載されていた。
このアミノ酸配列と配列番号 9に記載のァミノ酸配列を詳細に比較したところ、 本タンパク質の配列番号 9に記載のァミノ酸配列は、 上記 AX 362207— 1 およぴ WO 02/08253号公報に記載のァミノ酸配列のァミノ酸番号 1〜 4 69および 682番、 683番が欠失しており、 アミノ酸番号 681番、 740 番、 893番に変異が認められた。
また、 配列番号 4に記載の塩基配列は、 上記 AX362207—1および WO 02/08253号公報に記載の塩基配列の塩基番号 1〜 1248番および 20 42〜2047番が欠失しており、 2040番、 2219番、 2677番に変異 が認められた。 これらのことより本タンパク質は、 膜 1回貫通受容体型 P r o t e i n k i n a s eでめる E p r i n r e c e p t o r f am i l yの N末端 469アミノ酸を欠失したバリアントであることがわかった。
また、 本 DNAと AX 362207—1の c DNA配列を AX 362207— 1がコードされているヒト染色体 1番のゲノム配列 (データベース登録記号: embl|AC104336|AC104336) 上で比較した。 AX362207— 1の cDNAはェ クソン 16個からなる。 一方、 本 DNAはその第 5〜15エタソンと第 16エタ ソンの途中までを共有し、 その後ェクソン 3個をもつことで C末端の 41ァミノ 酸の新規配列が付加された構造を有している。 AX 362207—1は第 16ェ クソンの中で終止コドンが現れ、 本タンパク質との非共有配列 1アミノ酸をもつ て終了する。 さらに本 DNAは AX362207— 1の第 5ェクソン相当の前に、 翻訳されない別のェクソン 1個をもつことから、 本 DNAは AX362207— 1とは a l t e r n a t i v e p r omo t e rにより生じ、 AX 36220 7—1の N末端を欠失したタンパク質をコードする。 このように本 DNAはその 構造から AX362207—1とは転写調節、 翻訳産物ともに異なることを示し ている。
また、 配列番号 9のアミノ酸配列について、 HMMPFAMによるタンパク質 特徵検索を行ったところ配列番号 9のァミノ酸番号 140〜395番に? ]: 0 e i n k i n a s e d oma i nの特 ί敷を示す酉 3歹 U (P f amに p k i n a s eとしてエントリーされるアミノ酸配列) を見出した。 更に本タンパク質は配 列番号 9のアミノ酸番号 60〜 83番に膜貫通領域を、 また、 468〜 497番 に L e u c i n e Z i p p e rモチーフを有することがわかった。
したがって本タンパク質は膜貫通受容体の N末端細胞外ドメィンを大きく欠失 し、 C末端寄りにタンパク質相互作用に関与する配列を持ち、 さらに C末端部分 に新規配列をもつタンパク質である。 すなわち本タンパク質は細胞外からの刺激 にかかわらず細胞内タンパク質と相互作用しシグナル伝達をおこすタンパク質で あると推定することができる。 本タンパク質の ATP消費活性は、 実施例 4 (2) の系で測定したところ、 4 3. 1であり、 キナーゼ活性があることが確認された。 また、 基質として S y n t i d e 2 (配列番号 21) 、 CaMK I I (配列番号 22) を添加したところ
(実施例 4 (3) ) 、 両基質の、 逆相 H PLC上での各々の溶出位置が変化した こと (図 2矢印部分) から、 これらのペプチドを基質とするプロテインキナーゼ であることが確認された。
また、 本 DNAは、 精巣からクローニングされたものであり、 本タンパク質は 該組織に特有の器官の発生、 機能および疾患に関連することが推測された。
(5) c- t e s t i 2015335 (配列番号 5、 10)
c- t e s t i 2015335 (以下、 これを 「本 DNA」 と称し、 該 DNA によりコードされるタンパク質を 「本タンパク質」 と称する) は、 配列番号 5に 示すように、 2028塩基から成り、 そのうち塩基番号 151から 1881まで がオープンリーディングフレーム (終止コドンを含む) になっていた。 オープン リーディングフレームから予測されるアミノ酸配列は、 576アミノ酸残基から 成る (配列番号 10) 。 配列番号 10のアミノ酸配列について BLASTを用い て相同性検索を行ったところ、 NRDBタンパク質データベース (SWI S S— PROT、 P I R、 TREMBLE、 GENPEPT、 PDBから作成された重 複のないアミノ酸配列のデータベース) 中に、 データベース登録記号 Q 9 BXU 1 I S T 31— HUMAN、 S e r i n e/t h r e o n i n e p r o t e i n k i n a s e 31力 e— v a l u e : 0、 576ァミノ酸残基に亘り 9 9%の一致度でヒットした。 Q9BXU1 I ST31— HUMANは 1019ァ ミノ酸力 ら成り、 そのアミノ酸配列のアミノ酸番号 444〜1019番が、 配列 番号 10に記載のアミノ酸配列のアミノ酸番号 1〜 576番と下述の 3残基を除 いて一致している。
Q9BXU1 I ST 31— HUMANのアミノ酸配列と配列番号 10に記載の ァミノ酸配列を詳細に比較したところ、 本タンパク質の配列番号 10に記載のァ ミノ酸配列は、 上記 Q9BXU1 I ST 31— HUMANのアミノ酸配列のアミ ノ番号 1〜443番が欠失しており、 また 621番、 623番、 および 1010 番に変異が認められた。 また本 DNAと Q 9 BXU 1 I ST31— HUMANの アミノ酸配列をコードする塩基配列 (データベース登録番号: AF 28559 9) を比較したところ、 本 DNAは AF 285599の塩基番号 1〜1202が 欠失しており、 1244番、 1878番、 1883番、 3043番に変異が認め られた。
これらのことより本タンパク質は、 S e r i n eZ t h r e o n i n e p r o t e i n k i n a s e 31 (STPK31)の N末端 443アミノ酸を欠失したバ リアントであることがわかった。
Interproscan(EBI)によると、 Q9BXU1 | ST31— HUMAN (S TP K31) のアミノ酸番号 105〜242番に t h e rmo s t a b l e n u c l e a s e d oma i n力、 ¾7こ 78〜 137番に T u d o r d oma i n
(R i b o nu c l e o p r o t e i nとともに存在するタンパク質に見出され る領域) 、 さらに 710〜 1019番に p r o t e i n k i n a s e d o m a i n力 S存在する。
—方、 本タンパク質は P f am検索により配列番号 10のアミノ酸番号 296 〜 529番に p r o t e i n k i n a s e d oma i n力 1字在する力、 Q 9 BXU 1 I ST 31— HUMANの N末 443アミノ酸相当部分を欠くため、 S TPK31とは異なる機能をもつタンパク質と考えられる。
更に本 DNAと AF 285599の c D N A配列についてゲノム情報を A F 2
85599がコードされる染色体 7番のゲノム配列で比較すると、 AF 2855
99はェクソン 24個力、らなり、 本 DNAではその第 10ェクソンの後半を共有 した後、 第 1 1ェクソンから第 24ェクソンを共有する。 このことから、 本 DN Aは AF 285599とは異なるプロモータから転写された産物と推定される。 本タンパク質の AT P消費活性は、 実施例 4 (2) の系で測定したところ、 3 8. 0であり、 キナーゼ活性があることが確認された。 また、 基質として Syn t i d e 2 (配列番号 21) 、 C aMK I I (配列番号 22) を添加したところ (実施例 4 (3) ) 、 両基質の、 逆相 HP LC上での各々の溶出位置が変化した こと (図 3矢印部分) から、 これらのペプチドを基質とするプロテインキナーゼ であることが確認された。
これらのこと力、ら、 本タン ク質は S e r i n e/t h r e o n i n e p r o t e i n k i n a s e 3 1と比較すると N末端を欠失したバリアントであ る。
また、 本タンパク質は、 データベース中の文献情報 (Nature Genetics, 27 (4), 422-426 (2001)) 力 ら精子形成に関わることが明らかとなった。 さらに、 本 DNAは、 精巣からクローニングされたものであり、 本タンパク質は該組織に 特有の器官の発生、 機能および疾患に関連することが推測された。 産業上の利用の可能性
本発明のタンパク質およびそれをコードする D N Aはキナーゼ活性等を有する こと力 ら、 該タンパク質あるいはそれをコードする DN Aを用いて該活性を調節 する物質をスクリーニングすることができ、 該タンパク質が関連する疾患等に作 用し得る医薬の開発に有用である。
本出願は、 2002年 9月 10日付けの日本特許出願 (特願 2002— 264 345) に基づくものであり、 その内容はここに参照として取り込まれる。 また、 本明細書にて引用した文献の内容もここに参照として取り込まれる。

Claims

請求の範囲
1. 以下の (a) または (b) のタンパク質。
(a) 配列番号 6〜10のいずれかに記載のアミノ酸配列からなるタンパク質。
(b) 配列番号 6〜10のいずれかに記載のアミノ酸配列において 1若しくは数 個のアミノ酸が欠失、 置換及び/または付加されたァミノ酸配列からなり、 かつ キナーゼ活性を有するタンパク質。
2. 請求項 1に記載のタンパク質をコードする DNA。
3. 請求項 1に記載のタンパク質をコードする完全長 c D N A。
4. 以下の (a;) 、 (b) または (c) の何れかの DNA。
( a ) 配列番号 1〜 5のいずれかに記載の塩基配列を有する DNA。
(b) 配列番号 1〜 5のいずれかに記載の塩基配列において、 1若しくは数個の 塩基が欠失、 置換及ぴ Zまたは付加された塩基配列を有し、 かつキナーゼ活性を 有するタンパク質をコードする DNA。
( c ) 配列番号 1〜 5のいずれかに記載の塩基配列あるいはその相補配列を有す る DNAをストリンジェントな条件下でハイブリダイズすることができる塩基酉己 列を有し、 かつキナーゼ活性を有するタンパク質をコードする DNA。
5. 請求項 2〜 4のいずれかに記載の D N Aを含む組換えベクター。
6. 請求項 2〜4のいずれかに記載の DN Aまたは請求項 5に記載の組み換 えベクターを導入した遺伝子導入細胞または該細胞からなる個体。
7. 請求項 6に記載の細胞により産生される、 請求項 1に記載のタンパク質。
8. 請求項 2〜4のいずれかに記載の DNAの塩基配列中の連続した 5〜 1 00塩基と同じ配列を有するセンスオリゴヌクレオチド、 当該センスオリゴヌク レオチドと相補的な配列を有するアンチセンスオリゴヌクレオチド、 及び、 当該 センス又はアンチセンスオリゴヌクレオチドのオリゴヌクレオチド誘導体から成 る群から選ばれるオリゴヌクレオチド。
9 . 請求項 1または 7に記載のタンパク質に特異的に結合する抗体あるいは その部分フラグメント。
1 0 . 抗体がモノクローナル抗体である請求項 9に記載の抗体。
1 1 . モノクローナル抗体が請求項 1または 7に記載のタンパク質のキ "一 ゼ活性を中和する作用を有することを特徴とする請求項 1 0に記載の抗体。
1 2 . 請求項 1または 7に記載のタンパク質と被検物質を接触させ、 該被検 物質による該タンパク質が有する活性の変化を測定することを特徴とする、 該タ ンパク質の活†生調節物質のスクリ一二ング方法。
1 3 . 請求項 6に記載の遺伝子導入細胞と被検物質を接触させ、 該細胞に導 入されている D NAの発現レベルの変化を検出することを特徴とする、 該 D NA の発現調節物質のスクリ一二ング方法。
1 4 . 請求項 1に記載のタンパク質のアミノ酸配列から選択される少なくと も 1以上のァミノ酸配列情報および Zまたは請求項 2〜 4のレ、ずれかに記載の D N Aの塩基配列から選択される少なくとも 1以上の塩基配列情報を保存したコン ピュータ読み取り可能記録媒体。
1 5 . 請求項 1に記載のタンパク質およびノまたは請求項 2〜4のいずれか に記載の D N Aを結合させた担体。
PCT/JP2003/011552 2002-09-10 2003-09-10 新規タンパク質及びそれをコードするdna WO2004024913A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
AU2003262046A AU2003262046A1 (en) 2002-09-10 2003-09-10 Novel proteins and dnas encoding the same
JP2004535926A JPWO2004024913A1 (ja) 2002-09-10 2003-09-10 新規タンパク質及びそれをコードするdna

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2002264345 2002-09-10
JP2002-264345 2002-09-10

Publications (1)

Publication Number Publication Date
WO2004024913A1 true WO2004024913A1 (ja) 2004-03-25

Family

ID=31986514

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2003/011552 WO2004024913A1 (ja) 2002-09-10 2003-09-10 新規タンパク質及びそれをコードするdna

Country Status (3)

Country Link
JP (1) JPWO2004024913A1 (ja)
AU (1) AU2003262046A1 (ja)
WO (1) WO2004024913A1 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002061060A2 (en) * 2001-01-31 2002-08-08 Pe Corporation (Ny) Two splice variants of the human pftaire serine/threonine kinase

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002061060A2 (en) * 2001-01-31 2002-08-08 Pe Corporation (Ny) Two splice variants of the human pftaire serine/threonine kinase

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
HADANO S. ET AL.: "A gene encoding a putative GTPase regulator is mutated in familial amyotrophic lateral sclerosis 2", NATURE GENETICS, vol. 29, 2001, pages 166 - 173, XP002220497 *
MARUYAMA K. ET AL.: "Oligo-capping: a simple method to replace the cap structure of eukaryotic mRNAs with oligoribonucleotides", GENE, vol. 138, 1994, pages 171 - 174, XP002915960 *
SUMIO KAN'NO: "Genome soyaku no saizensen kanzencho cDNA gijutsu", BIO INDUSTRY, vol. 16, no. 11, 1999, pages 19 - 26, XP002904655 *
SUZUKI Y. ET AL.: "Construction and characterization of a full length-enriched and a 5'-end-enriched cDNA library", GENE, vol. 200, 1997, pages 149 - 156, XP002917609 *
TETSUO NISHIKAWA ET AL.: "Genome igaku no genzai to mirai kiso idenshi kaiseki program: joho shori gijutsu to kanzencho cDNA library gijutsu tono togo ni yoru high throughput kino kaiseki", GENDAI IRYO, vol. 32, no. 1, 2000, pages 117 - 124, XP002983857 *
YUTAKA SUZUKI ET AL.: "Jikken shien no tame no informatics cDNA kaiseki data to annotation", EXPERIMENTAL MEDICINE, vol. 19, no. 11, 2001, pages 93 - 98, XP002983856 *

Also Published As

Publication number Publication date
JPWO2004024913A1 (ja) 2006-01-12
AU2003262046A8 (en) 2004-04-30
AU2003262046A1 (en) 2004-04-30

Similar Documents

Publication Publication Date Title
CA2665489C (en) Prrg4-associated compositions and methods of use thereof in methods of tumor diagnosis
US20040167066A1 (en) Cleavage and polyadenylation complex of precursor mrna
WO1997046678A1 (en) Nucleic acids and polypeptides related to presenilin
JP2012502654A (ja) チャイニーズハムスター卵巣細胞系
US20020098511A1 (en) Protein-protein interactions
WO2004024913A1 (ja) 新規タンパク質及びそれをコードするdna
WO2004074485A1 (ja) 新規タンパク質およびそれをコードするdna
WO1999007854A2 (en) Serine/threonine kinase, and uses related thereto
JP2005245274A (ja) 細胞増殖促進剤
JP7237064B2 (ja) 単一免疫グロブリンインターロイキン-1受容体関連(sigirr)変異型及びその使用
EP1227106A1 (en) Pro-apoptotic proteins and DNA molecules encoding them
WO2004099408A1 (ja) 新規蛋白質およびそれをコードするdna
US20050171336A1 (en) Murine ortholog of the human disrupted-in-schizophrenia 1 gene
WO2003091428A1 (fr) Nouvelles proteines et adn codant ces proteines
US20030032592A1 (en) Protein-protein interactions
JP2004229643A (ja) 新規タンパク質及びそれをコードするdna
JP2004229639A (ja) 新規タンパク質及びそれをコードするdna
White et al. RNA Polymerase III
US20020164615A1 (en) Protein-protein interactions
WO2003084992A1 (fr) Nouvelles proteines et adn les codant
Der Ende et al. Identification of genes that interact with liquid facets
Hagerty The role of ZIP kinase in smooth muscle contraction
JP2004041180A (ja) 新規タンパク質及びそれをコードするdna
JP2004229640A (ja) 新規タンパク質及びそれをコードするdna
JP2005052101A (ja) 新規タンパク質およびそれをコードするdna

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): GH GM KE LS MW MZ SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LU MC NL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2004535926

Country of ref document: JP

122 Ep: pct application non-entry in european phase