WO2003089466A1 - Nouvelles proteines et adn codant de celles-ci - Google Patents

Nouvelles proteines et adn codant de celles-ci Download PDF

Info

Publication number
WO2003089466A1
WO2003089466A1 PCT/JP2003/004981 JP0304981W WO03089466A1 WO 2003089466 A1 WO2003089466 A1 WO 2003089466A1 JP 0304981 W JP0304981 W JP 0304981W WO 03089466 A1 WO03089466 A1 WO 03089466A1
Authority
WO
WIPO (PCT)
Prior art keywords
protein
dna
seq
sequence
amino acid
Prior art date
Application number
PCT/JP2003/004981
Other languages
English (en)
French (fr)
Inventor
Yoshihide Hayashizaki
Mamoru Kamiya
Hideo Kubodera
Original Assignee
Riken
K. K. Dnaform
Mitsubishi Chemical Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Riken, K. K. Dnaform, Mitsubishi Chemical Corporation filed Critical Riken
Priority to AU2003227426A priority Critical patent/AU2003227426A1/en
Publication of WO2003089466A1 publication Critical patent/WO2003089466A1/ja

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals

Definitions

  • the present invention introduces a novel protein, a DNA encoding the protein, a full-length cDNA encoding the protein, a recombinant vector having the DNA, an oligonucleotide consisting of a partial sequence of the DNA, and ⁇ DNA.
  • the present invention relates to a transgenic cell, an antibody specifically binding to the protein, and the like. Background art
  • cDNA and analyzing its base sequence are essential for analyzing the physiological activity of a protein expressed in a living body and developing a method of using the protein based on the activity.
  • creating a library that catalogs full-length cDNAs for all genotypes is an important issue of the Human Genome Project.
  • a cataloged library means that there is no duplication in the cDNAs contained in the library, and is a library containing one type of each cDNA.
  • the full-length cDNA cloning method is described in JP-A-9-1248187 and JP-A-10-127291.
  • This method comprises the steps of binding a tag molecule to the diol structure present at the 5, cap site of mRNA, converting the mRNA bound to the tag molecule into type II, and using oligo dT as a primer to reverse-transcribe RNA-DNA complex.
  • a method comprising preparing a body, and separating a complex having a DNA corresponding to the full-length mRNA from the complex using the function of a tag molecule.
  • the full-length cDNA library produced by such a technique does not necessarily include all the elements that are different evenly as individual elements of the library. Some clones do not exist. Since clones that exist in only a trace amount are likely to be novel, a subtraction method and a normalization method have been developed to enrich such clones.
  • nucleotide sequence of each clone of the cataloged full-length cDNA library obtained in this manner can be identified by analyzing the nucleotide sequence by a known method, but the physiological activity of the protein encoded by the cDNA still remains. Remains unknown. Disclosure of the invention
  • the present invention analyzes the nucleotide sequence of a cDNA clone contained in a cataloged full-length cDNA library, and among those having a novel sequence, identifies the physiological activity of the protein encoded by the sequence.
  • An object of the present invention is to propose a method of using a protein based on a physiological activity and a DNA encoding the protein.
  • the present inventors analyzed the nucleotide sequence of the cDNA clone in the mouse full-length cDNA library and searched a database based on the homology of the sequence. Sequence was found. Further, the expression levels of these cDNAs in each tissue and the proteins encoded by the cDNAs were actually obtained and analyzed for their interaction. In addition, the proteins encoded by these cDNAs were analyzed for DNA binding activity or transcription control activity. Furthermore, human homolog DNA was obtained based on the nucleotide sequence of the cDNA, and the expression level of the obtained human homolog DNA in each tissue was analyzed. The present invention has been achieved based on these findings.
  • (c) having a nucleotide sequence capable of hybridizing under stringent conditions to DNA having the nucleotide sequence of any of SEQ ID NOs: 1 to 13 or 35 or a complementary sequence thereof, and DNA encoding an active protein.
  • (c) encodes a protein having a base sequence capable of hybridizing under stringent conditions with a DNA having the base sequence of SEQ ID NO: 37 or its complementary sequence and having an IAP-like activity DNA.
  • the protein according to (1), (5), (7) or (11) is brought into contact with a test substance, and a change in the activity of the protein caused by the test substance is measured.
  • a method for screening for an activity modulator of the protein is provided.
  • a method for screening a substance regulating the expression of a DNA which comprises detecting a change in the expression level of the DNA introduced in 1.
  • a computer-readable recording medium storing at least one nucleotide sequence information selected from the nucleotide sequence of DNA according to any one of (8) to (8).
  • the DNA of the present invention is a protein consisting of the amino acid sequence of SEQ ID NOS: 14 to 26 or 36, or one or several amino acids in the amino acid sequence (the number is not particularly limited; (Hereinafter, preferably 15 or less, more preferably 10 or less, and still more preferably 5 or less)) comprising an amino acid sequence containing substitution, deletion, insertion, addition, or inversion of an amino acid residue. And that can encode a protein having DNA binding activity, or a protein consisting of the amino acid sequence of SEQ ID NO: 38, or the amino acid sequence,
  • Any substance can be used as long as it is composed of an amino acid sequence containing substitution, deletion, insertion, addition, or inversion of one or several amino acid residues and can encode a protein having IAP-like activity. You may. Specifically, it may be only the translation region encoding the amino acid sequence, or may include the full length of its cDNA. Specifically, as the DNA containing the full-length cDNA, for example, SEQ ID NOS: 1 to 13,
  • nucleotide numbers 134 to 1690 of SEQ ID NO: 1 nucleotide numbers 1 751 to 2197 of SEQ ID NO: 2, nucleotide numbers 662 to 3259 of SEQ ID NO: 3, SEQ ID NO: 4 Nucleotide number 6 61 to 1476, Nucleotide number 2 13 to 1703 of SEQ ID No. 5, Nucleotide number 122 to 16 1 of SEQ ID No. 6, Nucleotide number 156 to 560 of SEQ ID No.
  • the DNA of the present invention may include a region adjacent to the above-mentioned translation region and the 3 ′ and / or 5 ′ end thereof and containing a minimum necessary part for the expression of the translation region. include.
  • the DNA of the present invention may be obtained by any method as long as it can be obtained. Specifically, for example, it can be obtained by the method described below. First, mRNA is prepared from a suitable animal, preferably a mammalian tissue or the like, by a commonly used method known per se. Next, cDNA is synthesized using this mRNA as type II.
  • a molecule that tags a diol structure specific to the 5 'cap ( 7MeG ppp N) site is used.
  • a method of separating only full-length cDNA using the function of tag molecule Japanese Patent Application Laid-Open No. 10-127291 is preferably used.
  • heat-resistant reverse transcriptase is used in the presence of trehalose or the like. It is preferable to use a method for performing reverse transfer (JP-A-10-84961).
  • high temperature means 40 to 80 ° C.
  • the cDNA thus obtained is inserted into an appropriate cloning vector for cloning.
  • the vector used here has a recombinase recognition sequence at both ends of the cloning site, which can uniformly clone DNAs of various chain lengths, and can be inserted into the host by a method other than infection.
  • Vector Japanese Unexamined Patent Publication (Kokai) No. 11-19273
  • Cataloged not all clones are present uniformly (hereinafter, this may be referred to as "cataloged"), but only a very small amount exists in this library. A clone that does not have a high probability of being new.
  • the nucleotide sequence of the cataloged cDNA library is analyzed by a commonly used method known per se.
  • the DNA of the present invention uses the base sequence obtained for the sequence based on the terminal 100 as a base sequence for databases such as GenBank, EMBL, DDBJ, and PDB of NCBI.
  • Examples of such a DNA having the base sequence of the full-length cDNA include those having the base sequence of SEQ ID NOs: 1 to 13, 35, or 37.
  • the translated regions include nucleotides 134 to 1690 of SEQ ID NO: 1, nucleotides 1 751 to 2197 of SEQ ID NO: 2, nucleotides 662 to 3259 of SEQ ID NO: 3, nucleotides 66 1 to 1476 of SEQ ID NO: 4.
  • the novel base sequence thus obtained is subjected to homology search (homology search) using BLAST (Basic local alignment search tool; Altschul, SF, et al., J. Mol. Biol., 215, 403-410 (1990)). ) And HMME R (sequence analysis method using hidden Markov model; Eddy, SR, Bioinfo advance 14, 755-763 (1998)). / pfam. wustl. edu) and the like, the function of the protein encoded by the nucleotide sequence can be estimated.
  • the function of the clone to be analyzed can be estimated from various annotation information accompanying the hit sequence whose homology is sufficiently significant as a result of the search.
  • the sufficient significant hit sequence, or identity of the corresponding portion to the DNA of the catalytic domain portion of the sequence registered invention e- value as 10- 4 following ones, or 3 0 % Or more.
  • HMMPFAM the analysis is performed by a method to identify whether or not the base sequence to be analyzed has the characteristics of the base sequence of the entry in the database in which the protein profile of Piam is accumulated. Profiles are extracted from a series of proteins with the same characteristics, and even if a function cannot be clarified by comparing the full length of a single sequence to a single sequence, if there is a characteristic region in the sequence, it is found. Function prediction is possible. Concrete examples of protein function prediction This will be described below.
  • Zinc finger protein 192 (LD5 - 1 ) is a SCAN box domain 3 ⁇ 4r 3 ⁇ 4 OKrup el gene family, e- va 1 ue: 2X10- 94, 42% homology, further Homo sapiens zinc having 4X10- 93, 41% homology: the finger protein (ZFP), e- va 1 ue. From these results, it can be inferred that the protein encoded by the nucleotide sequence of SEQ ID NO: 1 is Zinc finger protein.
  • amino acid sequence encoded by the nucleotide sequence shown in SEQ ID NO: 1 is searched for protein characteristics using HMM PFAM, a sequence exhibiting the characteristics of ZF-C2H2 (the nucleotide sequence that is entered as LIM in P fam) is obtained. Found seven times.
  • the protein encoded by the nucleotide sequence shown in SEQ ID NO: 1 is a zinc finger type transcription factor.
  • clone 2810411K16: SCAN domain and containing protein, e - va 1 ue : 6X10 one 76, 139 99% homology over amino acids, Homo sapiens cDNA FLJ14478 fis, a clone MAMMA1001633, e- va 1 ue: 1X10- 61, 86 ° / over 140 amino acids.
  • the amino acid sequence encoded by the nucleotide sequence of SEQ ID NO: 3 was identified by BLAST search as Homo sapiens, clone MGC: 13310 IMAGE: 4110431, and e-va 1 ue: 5
  • the X10 one 145, 919 homology of 40% over amino acids, also a Zinc finger protein 180 (HHZ168), e- va 1 ue: 2 ⁇ 1 the (gamma 63, 231 homology 51% over amino acids, further, Rattus norvegicus and Cys2 / His2 zinc finger protein (rKrl ), e- va 1 ue: 6X10- 63, 192 has a 56% homology over amino acids.
  • a SCAN sequence (a nucleotide sequence that is entered as an SCA in Pfam) is found.
  • the protein encoded by the nucleotide sequence shown in SEQ ID NO: 4 is a transcription factor.
  • HMMPFAM was used to search for protein characteristics, zf-C2H2 was found eight times, and from these characteristics, it can be inferred that the protein encoded by the nucleotide sequence of SEQ ID NO: 5 is a DNA-binding protein.
  • HMMP FAM was used to search for protein characteristics, and zf-C2H2 was found eight times at base numbers 929 to 1585, indicating that the protein encoded by the base sequence of SEQ ID NO: 6 is a DNA-binding protein. I can guess.
  • the amino acid sequence encoded by the nucleotide sequence set forth in SEQ ID NO: 7 is a BLAST search [according to STATc transcriptional repressor, e-value: 4 X 10 _28 , with 53% homology over 127 amino acids, and forkhead-related a transcription factor 2, e- value: 4 in X 10- 23, 58% homology over 109 amino acids, further, a Transcription regulatory protein SNF5, e- va 1 ue: with 2 X 10 _24, 1 18 Has 61% homology over amino acids.
  • the above-mentioned STATc transcriptional repressor is related to the control of the initial development rate and the timing of terminal differentiation, based on the literature information g (Mol. Cell, 7 (4), 779-88 (2001)) in the database, and , Rukoto force 3 ⁇ 4 to function as Riburessa to control the expression of ecmA gene, also forkhead- related transcription factor 2, the document information in the stator base (J. Biol Chem 1998, 273 ( 36):.. 23335- 43) Is a transcription factor expressed in the lung placenta and binds to the cis factor of several lung-specific genes.
  • Transcription regulatory protein SNF5 is a Bibliographical information (Mol. Cell. Biol. , 1990, 10 (11): Controlled by glucose and phosphate from 5616-25) It can be understood that they are involved in the transcriptional control of the genes that are performed.
  • the protein encoded by the nucleotide sequence of SEQ ID NO: 7 is a transcription factor.
  • HMMPF AM a protein characteristic search by HMMPF AM revealed that the amino acid sequence encoded by the nucleotide sequence set forth in SEQ ID NO: 8 showed a sequence (an amino acid sequence entered as BTB in P f am) showing characteristics related to protein dimerization. Found. In addition, one Zinc finger domain (amino acid sequence that is entered as Pfam as zf-C2H2) is also found.
  • the protein encoded by the nucleotide sequence shown in SEQ ID NO: 8 is a zinc finger-type DNA binding protein.
  • a protein feature search using HMMPFAM finds nine zinc finger domains (sequences that are entered as Pfam as zf-C2H2) in the amino acid sequence encoded by the nucleotide sequence of SEQ ID NO: 9.
  • the protein encoded by the nucleotide sequence shown in SEQ ID NO: 9 is a zinc finger-type DNA binding protein.
  • the amino acid sequence encoded by the nucleotide sequence set forth in SEQ ID NO: 10 shows PR-domain zinc finger protein 5, e-value: 3 X 10-13 , and 50% over 62 amino acids as a result of BLAST search. homologous' of, also, the zinc finger protein with interaction domain, e- value: with 2X 10 -12, has a homology of 43% over 81 amino acids. From these results, it can be inferred that the protein consisting of the amino acid sequence encoded by the nucleotide sequence of SEQ ID NO: 10 is a zinc finger type DNA binding protein.
  • zinc finger protein with interaction domain is considered to be zinc finger protein with interaction domain. Power.
  • a protein feature search using HMMPFAM finds Zinc finger domain (sequence that is entered as Pf am as zf_C2H2) in two places in the amino acid sequence encoded by the base sequence of SEQ ID NO: 10.
  • the protein encoded by the nucleotide sequence shown in SEQ ID NO: 10 is a zinc finger-type DNA binding protein.
  • the nucleotide sequence of SEQ ID NO: 11 It can be inferred that the protein consisting of the amino acid sequence encoded by Zinc is a zinc finger-type DNA binding protein.
  • the protein encoded by the nucleotide sequence shown in SEQ ID NO: 11 is a zinc finger-type DNA binding protein.
  • amino acid sequence encoded by the nucleotide sequence of SEQ ID NO: 12 was added to the amino acid sequence of BTB (for BR-C, ttk and bab) or POZ (for Pox virus and Zinc finger) by protein characteristic search using HMMPF AM.
  • BTB for BR-C, ttk and bab
  • POZ for Pox virus and Zinc finger
  • HMMPF AM protein characteristic search using HMMPF AM.
  • the protein encoded by the nucleotide sequence of SEQ ID NO: 12 is a Kaiso-like transcription factor having a zinc finger.
  • HMMPF AM Am amino acid sequence that is entered as BTB in P fam
  • a sequence that exhibits the characteristics of Msx-interacting- zinc finger an amino acid sequence that is entered as Pf am as zf-MIZ
  • Zinc finger and C2H2 type The sequence (amino acid sequence entered at P fam as zf_C2H2) is found.
  • nucleotide sequence shown in SEQ ID NO: 13 is a part of a Kaiso-like transcription factor gene sequence having a zinc finger.
  • Interferon-activatable protein 203 protein (a protein having IAP-like activity) is one of IFN-inducible proteins (200-family "), and mice (IFI202a, IFI202b, IFI203, IFI204 and D3) and mice. Not only are they structurally similar in humans (MNM, IFI-16 and AIM2), but they are also present in the nucleus, and the gene product P202 of IFI202 is a transcription factor of NF- / cB, c-Fos, and c-Jun Inhibiting transcription by binding to (Mol. Cell. Biol. 16, (1996) 359-368) Differentiation antigen protein
  • the protein encoded by the nucleotide sequence of SEQ ID NO: 37 is a protein having an IAP-like activity, and its transcription is induced by interferon, and has a function of modifying the function of a transcription factor through protein interaction. It can be inferred that this is a control factor.
  • protein having IAP-like activity refers to a transcription control factor which is induced to be expressed by interferon and has a function of modifying the function of a transcription factor through protein interaction.
  • the DNA of the present invention thus obtained, whose base sequence is determined, and whose function is presumed is the base sequence described in SEQ ID NOs: 1 to 13, 35, or 37, or a translation region thereof.
  • the DNA that hybridizes under stringent conditions refers to the nucleotide sequence shown in SEQ ID NO: 1-13, 35, or 37 or a complementary sequence thereof to 80% or more, preferably 9% or more by BLAST analysis.
  • Examples include DNA containing a base sequence having 0% or more, more preferably 95% or more homology.
  • Hybridization under stringent conditions means that the reaction is carried out in a normal hybridization buffer at a temperature of 40 to 70, preferably 60 to 65 ° C, etc. Can be carried out according to a method of washing in a washing solution of 15 mM to 300 mM, preferably 15 mM to 60 mM.
  • DNA of the present invention may be obtained by the above-described method or may be synthesized.
  • the DNA base sequence can be easily replaced with a sales kit such as a site-directed mutagenesis kit (Takara Shuzo) or a quick change site-directed mutagenesis kit (Stratagene). .
  • the nucleotide sequence of SEQ ID NOs: 1 to 13 or 37 is derived from a mouse.
  • a human cDNA library was prepared according to the above-described method for preparing a cDNA library.
  • the nucleotide sequence of SEQ ID NO: 1 to 13 or 37 encodes It is also possible to obtain DNA encoding a human homologue protein.
  • the DNA that hybridizes under stringent conditions with the DNA having the nucleotide sequence of SEQ ID NOS: 1 to 13 or 37 or a sequence complementary thereto also includes DNA encoding such a human homolog. It is.
  • methods for predicting a base sequence encoding a homolog protein of a target protein using informatics include, for example, (i) using a base sequence of a target cDNA as a query, A method for performing homology search using cDNA etc.
  • cDNA databases including cDNA databases predicted by informatics
  • base sequence of the target cDNA as a query
  • a homology search is performed using BLAST or the like on an EST database of humans or the like, and the sequence of the hit EST is linked to the base sequence of the target cDNA
  • a homology search is performed using a BLAST or the like on a human or other genomic database to find that the cDNA gene of interest exists. Genomic site (http: // genes.
  • a human homolog protein of the protein whose nucleotide sequence described in SEQ ID NO: 1 to 13 or 37 is encoded from the above human cDNA library. You can also get the DNA to code.
  • a primer having a nucleotide sequence complementary to the nucleotide sequence at the 5, 5, and 3 'end of the predicted human homolog DNA is used.
  • a similar gene having a nucleotide sequence with a high homology to the nucleotide sequence of the target gene is called a “homolog”, and the above-mentioned method also aims to obtain a human homolog.
  • the above-mentioned method aims to obtain a human homolog.
  • Genes acquired as “homologs” between two species are identical genes that evolved from a common ancestral gene
  • the function of the protein encoded by the human-derived DNA must be In order to verify the function of the protein of the present invention as a mouse, it is preferable to confirm that the human homolog is an ortholog of a closely related species of the mouse gene of the present invention.
  • the following method is used as a method for confirming the ortholog.
  • (2) homology is analyzed between the nucleotide sequence of the obtained human homolog DNA and the corresponding nucleotide sequence of the cDNA of the present invention.
  • the base sequence of the obtained human homolog DNA was used as a query, and used as a query in international base sequence databases such as DDB J, EMBL, GenBank, and mouse base sequences contained in patent databases.
  • a homology search is performed to confirm that the degree of matching between the cDNA of the present invention and the base sequence of the query is higher than the degree of matching between the base sequence obtained from the database and the base sequence of the query.
  • the homology analysis described in (1) and (2) above can be performed by comparing amino acid sequences, or can be examined by drawing a molecular evolutionary phylogenetic tree.
  • the human ortholog of the cDNA of the present invention includes, for example, DNA having the nucleotide sequence of SEQ ID NO: 35, and the human ortholog of the protein of the present invention has the amino acid sequence of SEQ ID NO: 36 And protein.
  • DNAs that hybridize under stringent conditions with DNA having the nucleotide sequence of SEQ ID NOS: 1 to 13 or 37 or a sequence complementary thereto include DNAs encoding such human homologues or orthologous proteins. .
  • the nucleotide sequence of the DNA is converted into amino acids by three types of reading frames, and the range in which the longest polypeptide is encoded is determined by the present invention.
  • its amino acid sequence can be determined as the translation region of the gene. Examples of such an amino acid sequence include those described in SEQ ID NOs: 14 to 26, 36, or 38.
  • the protein of the present invention The quality is not limited to the above amino acid sequence, and amino acids in which one or several amino acids have been substituted, deleted, and / or added in the amino acid sequence of SEQ ID NOs: 14 to 26 or 36
  • a protein consisting of an acid sequence and having a DNA binding activity; and an amino acid sequence represented by SEQ ID NO: 38 in which one or several amino acids have been substituted, deleted, Z, or added.
  • proteins having IAP-like activity are not limited to the above amino acid sequence, and amino acids in which one or several amino acids have been substituted, deleted, and / or added in the amino acid sequence of SEQ ID NOs: 14 to 26 or 36
  • the method for obtaining the protein of the present invention the method of transcription and translation of the DNA of the present invention described in the above (1) by an appropriate method is preferably used. Specifically, a recombinant vector inserted into a suitable expression vector or a suitable vector together with a suitable promoter is prepared, and this recombinant vector is used to transform a suitable host microorganism or to a suitable cultured cell. It can be expressed by introduction and purified to obtain it.
  • the protein thus obtained When the protein thus obtained is obtained in a free form, it can be converted into a salt by a known method or a method analogous thereto, and conversely, when the protein is obtained in a salt form, the free form or other Can be converted to a salt.
  • Such salts of the protein of the present invention are also included in the protein of the present invention.
  • the protein produced by the above transformant may be modified before or after purification with an appropriate protein modifying enzyme to optionally modify the protein or partially remove the polypeptide to modify the protein. Quality.
  • modified proteins are also included in the scope of the present invention as long as they have the above-mentioned DNA binding activity or IAP-like activity.
  • the vector used for producing a recombinant vector containing the DNA of the present invention is not particularly limited as long as the DNA is expressed in the transformant.
  • the plasmid vector or the phage vector may be misaligned.
  • a commercially available protein expression vector into which an expression control region DNA such as a promoter suitable for a host into which the DNA is introduced has already been inserted is used.
  • Examples of such a protein expression vector include, for example, pET3, pET11 (manufactured by Stratagene), GEX (Amersham 'Biotech), and in the case of yeast, pESP-I expression vector (Stratagene).
  • Bac PAK6 (Clontech) and the like are used.
  • examples include ZAP Express (manufactured by Stratagene) and SVK3 (manufactured by Amersham Pharmacia Biotech).
  • the promoter used herein may be a promoter contained in a host microorganism or a cultured cell, but is not limited thereto.
  • a promoter contained in a host microorganism or a cultured cell, but is not limited thereto.
  • the host is Escherichia coli, T3, T7, tac , 1 ac promoter and the like.
  • the nmt1 promoter, Ga11 promoter and the like can be used.
  • the host is an animal cell, SV40 promoter, CMV promoter and the like are preferably used.
  • a promoter specific to the gene of the present invention can also be used. Insertion of the DNA of the present invention into these vectors can be carried out by linking the DNA or a DNA fragment containing the DNA to the amino acid sequence of the protein encoded by the gene DNA downstream of the promoter in the vector. ,.
  • the recombinant vector thus prepared can be transformed into a host described below by a method known per se to prepare a DNA-introduced body.
  • a method for introducing the vector into a host specifically, a heat shock method (J. Mol. Biol., 53, 154, (1970)) and a calcium phosphate method (Science, 221, 551, (1983)) , DEAE dextran method (Science, 215, 166, (1982)), in vitro packaging method (Proc. Natl. Acad. Sci. USA, 72, 581, (1975)), virus vector method (Cell, 37, 1053, ( 1984)) and the electric pulse method (Chu. Et al., Nuc. Acids Res., 15, 1331 (1987)).
  • the host for preparing the DNA transfectant is not particularly limited as long as the DNA of the present invention is expressed in the body.
  • Pod Polyhedrovirus Insect cells or animal cells. Specifically, BL21 and L-2B 1 ue (manufactured by Stratagene) for E. coli, SP-Q01 (manufactured by Stratagene) for yeast, and Ac NPV (J. Biol. Chem. , 263, 7406, (1988)) and its host S f — 9
  • Examples of animal cells include mouse fibroblast C 127 (J. Viol., 26, 291, (1978)) and Chinese hamster ovary cell CHO cells (Proc. Natl. Acad. Sci. USA, 77, 4216, (1980). )), Etc., and it is preferable to use COS-7 (ATCC CRL1651: American type culture collection preserved cells) derived from African green monkey kidney because of its expression level and simple screening.
  • COS-7 ATCC CRL1651: American type culture collection preserved cells
  • a homologous strand exchanging technique for directly inserting a promoter-ligated DNA fragment of the present invention into the chromosome of a host microorganism (AA Vertes et al., Biosci. Biotechnol. Biochem., 57, 2036 (1993)), or a transposon or insertion sequence (AA Vertes et al., Molecular Microbiol., 11, 739, (1994)) can be used to prepare DNA transfectants. it can.
  • the resulting culture cells or cells are collected by a method such as centrifugation, suspended in an appropriate buffer, and then sonicated, lysozyme, and Z or freeze-thaw, etc. After crushing by the method, a crude protein solution is obtained by centrifugation, filtration, or the like, and can be further purified by combining an appropriate purification method. Thus, the protein of the present invention is obtained.
  • the protein of the present invention is induced by subjecting the DNA of the present invention obtained in (1) above to a cell-free transcription / translation system. Can be obtained.
  • the cell-free transcription / translation system used in the present invention is a system containing all the elements necessary for transcription from DNA to mRNA and translation of mRNA to protein, and by adding DNA thereto. It refers to any system in which the protein encoded by the DNA is synthesized.
  • Specific examples of the cell-free transcription / translation system include eukaryotic cells, and bacterial cells, or a part thereof.
  • a transcription / translation system prepared based on the extract of Escherichia coli is particularly preferable.
  • a particularly preferred example is a extract prepared from Escherichia coli reticulocytes, wheat germ, and Escherichia coli (Escherichia coli S30 extract) Transcription and translation systems.
  • Separation and purification of the protein of the present invention from the obtained transcription-translation product of the cell-free transcription / translation system can be carried out by a commonly used method known per se. Specifically, for example, a DNA region encoding an epitope peptide, a polyhistidine peptide, daltathione-S-transferase (GST), maltose binding protein, etc. is introduced into the DNA to be transcribed and translated, as described above. It can be expressed and purified using the affinity of the protein with a substance having affinity.
  • GST daltathione-S-transferase
  • the expression of the target protein is separated by SDS-polyacrylamide gel electrophoresis, etc., and stained with Coomassie brilliant blue (manufactured by Cygmane earth), or detected by an antibody that specifically binds to the protein of the present invention described later. It can be confirmed by the method of doing so. It is generally known that the expressed protein is cleaved (processed) by a proteolytic enzyme present in the living body. Naturally, the protein of the present invention is also included in the protein of the present invention as long as it has a DNA binding activity or an IAP-like activity, even if it is a partial fragment of the amino acid sequence that has been cleaved.
  • a method for analyzing the interaction a known method per se can be used. Specifically, for example, yeast two-hybrid method, fluorescence depolarization method, surface plasmon method, phage display method, liposome A multiple display method and the like can be mentioned.
  • the method of the present invention can be performed by a conventional method using a DNA synthesizer or the like. Having a partial sequence of the DNA Oligonucleotides such as antisense oligonucleotides and sense'oligonucleotides can be prepared.
  • oligonucleotide examples include DNA having the same sequence as 5 to 100 consecutive bases in the nucleotide sequence of DNA, or DNA having a sequence complementary to the DNA.
  • a DNA having the same sequence as 5 to 100 consecutive bases in the nucleotide sequence represented by SEQ ID NOs: 1 to 13, 35, or 37, A DNA having a complementary sequence can be mentioned.
  • the above-mentioned oligonucleotides are preferred, in which the melting temperature (T m) and the number of bases of both do not extremely change.
  • the base has 5 to 100 bases, preferably 10 to 60 bases, and more preferably 15 to 50 bases.
  • oligonucleotide derivatives of these oligonucleotides can also be used as the oligonucleotide of the present invention.
  • the oligonucleotide derivative include an oligonucleotide derivative in which a phosphodiester bond in an oligonucleotide is converted to a phosphorothioate bond, and a phosphodiester bond in an oligonucleotide in which an N 3, 1 P 5 ′ phosphoramidate bond is used.
  • Oligonucleotide derivatives Oligonucleotide derivatives in which peracyl in oligonucleotide is substituted with C-15 thiazoleperacyl, Oligonucleotide derivatives in which cytosine in oligonucleotide is substituted with C-15 propynylcytosine, Oligonucleotides Oligonucleotide derivative in which cytosine in the oligonucleotide has been replaced with phenoxazine-modified cytosine, oligonucleotide derivative in which the report in the oligonucleotide has been replaced by 2,1-O-propylribose, or oligonucleotide derivative in the oligonucleotide Oligonucleotide derivatives in which the report is substituted with 2, -methoxetoxyribose can be mentioned.
  • the oligonucleotide of the present invention is prepared as a double-stranded oligonucleotide, introduced into a recipient, and inhibited by the RNA interference method (hereinafter referred to as “RNAi method”) in which the expression of a target gene is inhibited. May be referred to).
  • RNAi method RNA interference method
  • the RA interference method for example, the method described in (Elbashir, S., et al., Nature, 411, 494-498 (2001)) can be used.
  • the double-stranded RNA does not necessarily have to be all RNA, and for example, those described in WO 02/10374 publication can be used.
  • any target gene may be used as long as it is the DNA of the present invention.
  • a double-stranded RNA consisting of a sequence substantially identical to at least a part of the base sequence of these DNAs (hereinafter sometimes referred to as “double-stranded polynucleotide”) is defined as a part of the base sequence of the target gene. It is composed of a sequence substantially identical to a sequence of 15 bp or more, which may be any part.
  • “substantially the same” means that it has 80% or more homology with the sequence of the target gene.
  • the nucleotide length may be any length from 15 bp to the entire length of the open reading frame (0RF) of the target gene, but a length of about 15 to 50 Obp is preferably used.
  • mammalian-derived cells have a signal transduction system that activates in response to a long double-stranded RNA of 3 Obp or more. This is called the interferon reaction (Mareus, PI, et al., Interferon, 5, 115-180 (1983)), and the double-stranded brittleness penetrates into cells.
  • IPKR dsRNA-responsive protein kinase
  • Bass, B ⁇ Nature, 411, 428-429 (2001)
  • 2 ', 5' oligoadenylate synthetase Bass, BL, Nature, 411, 428-429 (2001)
  • RaseL RaseL occurs, causing nonspecific degradation of intracellular RNA.
  • Double-stranded polynucleotide of 15 to 3 Obp, preferably 19 to 22 bp, and most preferably 21 bp should be used. Is preferred. Double-stranded polynucleotides need not be entirely double-stranded; Although ones whose ends are partially protruded are included, it is preferable to use ones whose three ends are protruded by two bases.
  • the double-stranded polynucleotide means a double-stranded polynucleotide having a trapping property, but may be a self-complementary single-stranded polynucleotide having self-complementarity.
  • Single-stranded polynucleotides having self-complementarity include, for example, those having an inverted repeat sequence.
  • the method for preparing the double-stranded polynucleotide is not particularly limited, but it is preferable to use a chemical synthesis method known per se.
  • chemical synthesis a single-stranded polynucleotide having complementarity can be separately synthesized, and can be converted into a double-stranded strand by associating them by an appropriate method.
  • Specific examples of the method of association include a method in which the synthesized single-stranded polynucleotide is mixed, heated to a temperature at which the double-strand is dissociated, and then gradually cooled.
  • the associated double-stranded polynucleotide is confirmed using an agarose gel or the like, and the remaining single-stranded polynucleotide is removed by, for example, decomposing with a suitable enzyme.
  • the transfectant into which the double-stranded polynucleotide prepared as described above is introduced may be any as long as the target gene can be transcribed into RA or translated into protein in the cell.
  • Specific examples include those belonging to plant, animal, protozoan, viral, bacterial, or fungal species.
  • the plant may be a monocotyledonous, dicotyledonous or gymnosperm, and the animal may be a vertebrate or invertebrate.
  • Preferred microorganisms are those used in agriculture or industry, and are pathogenic to plants or animals. Fungi include organisms in both power and yeast forms.
  • vertebrates examples include mammals, including fish, sea lions, goats, pigs, sheep, hamsters, mice, rats and humans, and invertebrates include nematodes and other Includes reptiles, Drosophila, and other insects.
  • the cells are vertebrate cells.
  • the transductant means a cell, tissue, or individual.
  • the cell may be from a germ line or somatic, totipotent or pluripotent, divided or undivided, parenchymal or epithelial, immortalized or transformed, and the like.
  • Cells are distributed It can be a gamete or an embryo, in the case of an embryo, a single-cell or constitutive cell, or a cell from a multi-cell embryo, including fetal tissue.
  • undifferentiated cells such as stem cells, or differentiated cells, such as from cells of an organ or tissue, including fetal tissue, or any other cells present in an organism.
  • Differentiating cell types include fat cells, fibroblasts, muscle cells, cardiomyocytes, endothelial cells, neurons, glial, blood cells, megakaryocytes, lymphocytes, macrophages, neutrophils, and eosinophils , Basophils, mast cells, leukocytes, granulocytes, keratinocytes, chondrocytes, osteoblasts, osteoclasts, liver cells and endocrine or exocrine gland cells.
  • Methods for introducing a double-stranded polynucleotide into a recipient include, when the recipient is a cell or a tissue, a calcium phosphate method, an electroporation method, a ribofusion method, a viral infection, Immersion in a single-stranded polynucleotide solution or a transformation method is used.
  • Examples of the method for introduction into an embryo include microinjection, electoral poration, and viral infection.
  • a method of injecting or perfusing the plant into the body cavity or stromal cells, or spraying is used.
  • an individual animal In the case of an individual animal, it is introduced systemically by oral, topical, parenteral (including subcutaneous, intramuscular and intravenous administration), vaginal, rectal, nasal, ophthalmic, intraperitoneal administration, etc.
  • the electrophoresis method or virus infection may be used.
  • the double-stranded polynucleotide can be mixed directly with the food of the organism.
  • it when introduced into an individual, it can be administered, for example, by administration as an implanted long-term release preparation or the like, or by ingesting an introduced body into which a double-stranded polynucleotide has been introduced.
  • the amount of the double-stranded polynucleotide to be introduced can be appropriately selected depending on the transductant and the target gene, but it is preferable to introduce an amount sufficient to introduce at least one copy per cell. Specifically, for example, when the transfectant is a human cultured cell and the double-stranded polynucleotide is introduced by a calcium phosphate method, 0.1 to L 0 OnM is preferred.
  • an antibody that specifically binds to the protein of the present invention As a method for preparing an antibody that specifically binds to the protein of the present invention, a commonly used known method can be used.
  • the polypeptide used as an antigen also has high antigenicity according to a known method, and can be used for epitope ( An appropriate sequence can be selected and used as the antigenic determinant.
  • An appropriate sequence can be selected and used as the antigenic determinant.
  • commercially available software such as Epitope Adviser (manufactured by Fujitsu Kyushu System Engineering Co., Ltd.) can be used.
  • polypeptide used as the above antigen a synthetic peptide synthesized according to a known method or the protein itself of the present invention can be used.
  • a polypeptide serving as an antigen may be prepared in an appropriate solution or the like according to a known method and immunized to a mammal, for example, a heron, a mouse, a rat, or the like.
  • an antigen peptide in a conjugate with an appropriate carrier protein, or to carry out immunization with an adjuvant or the like.
  • the route of administration of the antigen upon immunization is not particularly limited, and any route such as subcutaneous, intraperitoneal, intravenous, or intramuscular route may be used. Specifically, for example, a method of inoculating a BALB / c mouse several times every several days to several weeks with an antigen polypeptide is used.
  • the antigen intake is preferably about 0.3 to 0.5 mg Zl times when the antigen is a polypeptide, but is appropriately adjusted depending on the type of the polypeptide and the animal species to be immunized.
  • test blood is collected as appropriate, and an increase in antibody titer is confirmed by enzyme-linked immunosorbent assay (hereinafter sometimes referred to as “ELISA”) or Western blotting.
  • ELISA enzyme-linked immunosorbent assay
  • Blood is collected from animals with elevated antibody titers.
  • a polyclonal antibody can be obtained by subjecting this to an appropriate treatment used for antibody preparation. Specifically, for example, a purified antibody obtained by purifying an antibody component from serum according to a known method is obtained. And the like. For the purification of the antibody component, methods such as centrifugation, ion exchange chromatography and the like can be used.
  • Monoclonal antibodies can also be prepared by using a hybridoma fused with spleen cells and myeloma cells of the animal according to a known method (Milstein, et al., Nature, 256, 495 (1975)). it can.
  • a monoclonal antibody can be obtained, for example, by the following method.
  • antibody-producing cells are obtained from an animal whose antibody titer has been raised by immunization with the above-mentioned antigen.
  • the antibody-producing cells are plasma cells and lymphocytes which are precursor cells thereof, which may be obtained from any individual, but preferably obtained from spleen, lymph nodes, peripheral blood and the like.
  • the myeloma to be fused with these cells is generally a cell line obtained from a mouse, for example, an 8-azaguanine-resistant mouse (derived from BALB or the like) myeloma cell line P3X63-Ag8.653 (ATCC: CRL -1580), P3-NSl / lAg4.1 (RIKEN cell bank: RCB0095) and the like are preferably used.
  • an appropriate cell fusion medium such as RPMI1640, Iskov's modified Dulbecco's medium (IMDM), or Dulbecco's modified Eagle's medium is used.
  • DMEM polyethylene glycol
  • PEG polyethylene glycol
  • High Priestess dormer is myeloma cell line 8 Azaguanin by utilizing the resistance is a strain suitable amount of hypoxanthine 'aminopterin-thymidine (HAT) solution in including normal medium (HAT medium) 5% C0 2 using At 37 ° C. for an appropriate time.
  • HAT hypoxanthine 'aminopterin-thymidine
  • HAT medium normal medium
  • This selection method can be appropriately selected and used depending on the myeloma cell line to be used.
  • the antibody titer of the antibody produced by the selected hybridoma is analyzed by the above-described method, the hybridoma producing the antibody with a high antibody titer is separated by limiting dilution, etc., and the separated fused cells are cultured in an appropriate medium.
  • Monoclonal antibodies can be obtained by purifying the culture supernatant obtained by culturing by an appropriate method such as ammonium sulfate fractionation and affinity chromatography. For purification, a commercially available monocrona Antibody purification kit can also be used. Furthermore, ascites containing a large amount of the monoclonal antibody of the present invention can be obtained by growing the antibody-producing hybridoma obtained above in an animal of the same strain as the immunized animal or in the abdominal cavity of a nude mouse or the like. it can.
  • a Severe combined immune deficiency (SCID) mouse transplanted with human peripheral blood lymphocytes using the polypeptide or a partial peptide thereof as an antigen.
  • SCID Severe combined immune deficiency
  • Human antibodies can also be prepared by immunizing in the same manner as described above and preparing hybridomas between the antibody-producing cells of the immunized animal and human myeloma cells (Mosier, DE, et al.). al. Nature, 335, 256-259 (1988); Duchosal, MA, et al., Nature, 355, 258-262 (1992)).
  • RNA is extracted from the obtained hybridoma producing the human antibody, the gene encoding the desired human antibody is cloned, this gene is inserted into an appropriate vector, and this is introduced into an appropriate host.
  • human antibodies can be produced in larger quantities.
  • an antibody having a low binding property to the antigen can be obtained as an antibody having a higher binding property by using an evolutionary engineering technique known per se.
  • a partial fragment such as a monovalent antibody can be prepared by, for example, cleaving the Fab portion and the Fc portion using papain or the like, and recovering the Fab portion using an affinity column or the like.
  • the thus-obtained antibody that specifically binds to the protein of the present invention may be used as a neutralizing antibody that specifically binds to the protein of the present invention and thereby inhibits the DNA binding activity or IAP-like activity of the protein.
  • There is no particular limitation on the method of selecting a protein that inhibits the activity of the protein but, for example, contacting the antibody with the DNA transfectant prepared in (2) above will inhibit the function of the target protein in the transfectant. And a method of analyzing whether or not the data is correct.
  • Such a neutralizing antibody can be used alone for the clinical application, but it can be used as a pharmaceutical composition by mixing with a pharmaceutically acceptable carrier. You can also. At this time, the ratio of the active ingredient to the carrier can be varied between 1 and 90% by weight.
  • the drug can be administered in various forms. Examples of the dosage form include oral administration of tablets, capsules, granules, powders, syrups, and the like, or injections, drops, ribosomes, and the like. Parenteral administration with suppositories and the like can be mentioned. In addition, the dose can be appropriately selected depending on symptoms, age, weight, and the like.
  • the protein of the present invention is prepared as a recombinant protein as described in the above (2), and by analyzing this, it can be confirmed that it has the activity estimated in the above (1). Furthermore, analysis can also be performed in combination with the antibody or the like prepared as described in (4) above.
  • a method for measuring the DNA binding activity and the transcription control activity of the protein of the present invention will be described as an example.
  • the fact that the protein of the present invention has DNA binding activity can be confirmed, for example, by contacting an appropriate double-stranded DNA with the recombinant protein and measuring the binding property of the recombinant protein to the DNA chain. Can be. Specific methods include, for example, the methods described below.
  • reaction solution a neutral to weakly basic buffer solution containing 60 mM potassium salt, ImM dithiothreitol, 10% glycerol, 1 ⁇ ⁇ po 1 y (dI-dC), for example, 2 OmM Tris-HCl or
  • dI-dC a neutral to weakly basic buffer solution containing 60 mM potassium salt, ImM dithiothreitol, 10% glycerol, 1 ⁇ ⁇ po 1 y
  • dI-dC 2 OmM Tris-HCl
  • DNA binding between recombinant protein and DNA It can be detected using a method that detects the difference between the loads, a method that measures the affinity between the two, and the like.
  • Examples of the method for detecting the difference in electric charge include ion exchange chromatography, gel electrophoresis, and electrophoresis including capillary electrophoresis.
  • gel electrophoresis a difference in charge and a difference in molecular size appear as a difference in mobility.
  • the above reaction solution is electrophoresed in a polyacrylamide gel, and the gel after electrophoresis is stained with silver, Coomassie brilliant blue, or fluorescent, and the conjugate has a different mobility compared to the case of recombinant protein alone. Confirmed as Pando.
  • by labeling one end of the DNA with a fluorescent label it is possible to detect with higher sensitivity the difference between the DNA elution position and the mobility.
  • Methods for measuring the affinity of both include affinity chromatography, surface plasmon resonance, and the like.
  • DNA is immobilized on a carrier, and a recombinant protein is brought into contact therewith, and the amount of binding is measured to determine the activity.
  • affinity chromatography the bound recombinant protein is eluted with a high-concentration salt solution, denaturing agent, free DNA, etc., and the amount of eluted protein is measured.
  • the amount of protein bound to immobilized DNA is measured by surface plasmon resonance, and the strength of affinity can be measured by the concentration of bound protein.
  • the protein of the present invention is IFN-inducible proteins r200-family "). Includes those that are structurally similar to mouse IFI202, IFI203, IFI204 and human MNDA, IFI-16 AIM2, which are interferon-induced protein family molecules and may be involved in transcriptional regulation. Examples of the method for measuring the transcription control activity of the protein of the present invention include the methods described below.
  • the transcription control activity of the protein of the present invention can be examined by those skilled in the art, for example, by performing a reporter gene assay or the like as follows (Mol. Cell. Biol. 16, (1996) 359-368).
  • a reporter gene-assay vector is constructed in which a luciferase gene or a clonal ramphenicol acetyl transferase gene is linked downstream of a promoter controlled by NF-icB, AP-1, AP-2, and 0CT1, respectively.
  • a vector for expressing the gene encoding the protein of the present invention and a vector for reporter gene attachment are transiently introduced into L929 cells or EL4 cells, and interferon, poly (rl) -poly (rC), or PMA
  • the activity of the reporter gene can be measured according to a standard method in the presence or absence of DNA.
  • the fact that the protein of the present invention binds to, for example, the transcription factor F-zcB means that the fusion protein in which GST is linked to the N-terminus or C-terminus of the protein of the present invention is bound to daltathione agarose beads, and the cell extract is added thereto. After incubating at 4 ° C, wash the beads with buffer to remove non-specifically adsorbed substances, collect the bead conjugate, perform SDS gel electrophoresis, and use anti-NF-zcB antibody. By performing immunoplotting using NF- ⁇ B, the presence or absence of specific binding ability between the protein of the present invention and NF- ⁇ B can be examined.
  • target transcription regulatory regions For proteins that bind to DNA and RNA and are involved in transcription, generally, gene transcription regulatory regions such as the promoter janhansa, etc. that are recognized and targeted by known transcription factors (hereinafter referred to as “target transcription regulatory regions”)
  • JP-A-2001-314190 A method for comprehensively analyzing the transcription control activity by measuring the binding ability to DNA and its partial fragments using DNA and its partial fragments is known (JP-A-2001-314190). Used for analysis Not only those having a base sequence of a known target transcription regulatory region (hereinafter, this may be referred to as a “target sequence”) but also known targets as the DNA of the target transcription regulatory region and its partial fragments.
  • transcription target sequence It has a target sequence (hereinafter, sometimes referred to as “consensus target sequence”) that is recognized by multiple transcription-related factors in common and designed by analyzing and classifying the base sequence of the transcription regulatory region in the database. You may use something.
  • Known transcription-related factors include, for example, V-jun, c-jun, junB, junD, dJRA, c-fos, fosBl, fosB2, Fra-1, LRF-1, v-maf, mafG, NF-E2 p45 , aNF ⁇ E2, fNF-E2, Nrf short form, GCN4, yAP-1, CREB-2, ATF-3, CRE-BP1, CRE-BP3, ATF-a, CREB-341, CREB-327, CREM, dCREB2 , dCREB2-b, dCREB2-c, dCREB2-d, dCREB2-q, dCREB2-r, dCREB2-
  • the binding between the protein having the DNA binding activity or the transcription control activity of the present invention and the DNA of the target transcriptional regulatory region and its partial fragments can be detected using a measurement system known per se. For example, a test sample containing the protein of the present invention is added to a plate on which DNA of the target transcription regulatory region and a partial fragment thereof are immobilized, and direct binding between the two is determined by SPR (Surface Plasmon Resonance) method.
  • SPR Surface Plasmon Resonance
  • the DNA of the target transcription regulatory region or a partial fragment thereof recognized by the transcription-related protein as described above is immobilized on the sensor chip.
  • the annealed DNA and its partial fragments are immobilized.
  • the binding of the protein of the present invention or the target transcriptional regulatory region can be detected using fluorescently labeled DNA or a partial fragment thereof.
  • the test sample for analysis containing the protein of the present invention can be prepared by the method of transcribing / translating the DNA of the present invention by an appropriate method as described above.
  • the protein of the present invention can be obtained by inducing protein expression by subjecting the DNA of the present invention to a cell-free transcription / translation system.
  • proteins related to transcription are identified by analyzing their effects on transcription factors that regulate transcription of various genes involved in diseases (hereinafter referred to as “disease-related transcription factors”). It is also useful to analyze whether the disease is directly or indirectly involved in the disease.
  • Disease-related transcription factors include, for example, PPAR, p53, NFcB, AP-1, HIF-1, CREB, and the like. The effects on these known factors are determined by the same method as described above. It should be analyzed.
  • DNA of the target transcription regulatory region of the disease-related transcription factor or a partial fragment thereof is particularly preferably used.
  • a test sample containing the protein of the present invention is appropriately added to such a sensor chip on which DNA or a partial fragment is immobilized, so that the DNA on the sensor chip surface and the protein contained in the test sample are compared with each other. Analyze the interaction between. If the DNA has affinity with the immobilized DNA, the SPR response value increases compared to the control, and transcription-related factors are immobilized. It can be presumed that it has affinity with the modified DNA. By such an analysis, it is possible to analyze what function the protein of the present invention has in a specific disease.
  • test sample for analysis containing the protein of the present invention can be prepared by the method of transcribing and translating the DNA of the present invention by an appropriate method as described above.
  • the protein of the present invention can be obtained by inducing the expression of the protein by subjecting the DNA of the present invention to a cell-free transcription / translation system.
  • the disease-related transcription factor can be obtained from a cell extract or a cell nucleus extract containing the disease-related transcription factor.
  • a DNA encoding a disease-related transcription factor can be prepared by a method of transcription Z translation by an appropriate method. Specifically, for example, a cDNA encoding a disease-related transcription factor is used, and its full length or a part thereof is inserted into an appropriate expression vector, and this is inserted into a microorganism such as Escherichia coli, an insect cell, a yeast, an animal cell, or the like.
  • the disease-related transcription factor which is a recombinant protein
  • the confirmation of the activity of the protein of the present invention is not limited to the method described above. Further, these functional assay systems can also be used for screening of a function activator or a function inhibitor of the protein of the present invention, which will be described later, and a screening of a protein expression regulating substance of the present invention.
  • the method for analyzing the function of the protein of the present invention includes, for example, (i) a method for comparing and analyzing the expression state of each tissue, disease, or developmental stage, and (ii) the interaction with other proteins and DNA. (Iii) a method for analyzing phenotypic changes by introducing into appropriate cells or individuals, and (iv) analyzing phenotypic changes by inhibiting the expression of the protein in appropriate cells or individuals. And the like. According to such a method, the activity specific to the target protein can be analyzed from many aspects. In the method (i), the expression of the protein of the present invention can be analyzed at the mRNA level or the protein level.
  • the expression level is analyzed at the mRNA level, for example, the in situ hybridization method (In situ hybridization: Application to Developmental Biology & Medicine., Ed. by Harris, N. and Wilkinson, DG, Cambridge University Press (1990)), a hybridization method using a DNA chip, a quantitative PCR method, and the like.
  • a tissue staining method using an antibody, which specifically binds to the protein of the present invention described later an ELISA method, a Western plot method, and the like can be mentioned.
  • the target protein to be analyzed is a splicing variant in which a known variant is present, it is present only in the cDNA encoding the target protein and hybridizes with the cDNA that encodes a known parant. It is preferable to use a probe that does not soy.
  • the quantitative PCR method a method in which primers that can generate amplified fragments of different lengths between the target variant and the known variant are selected and performed
  • the function of the protein of the present invention can be analyzed by examining the presence or absence of interaction between the protein of the present invention and a known protein.
  • a method for analyzing interaction a conventional method known per se can be used. Specifically, for example, yeast two-hybrid method, fluorescence depolarization method, surface plasmon method, phage display method, liposome A multiple display method and the like can be mentioned.
  • yeast two-hybrid method fluorescence depolarization method, surface plasmon method, phage display method, liposome A multiple display method and the like can be mentioned.
  • the protein to be analyzed is a splicing variant in which a known variant is present
  • the known variant is similarly analyzed for interacting substances, and a substance that specifically interacts with the target protein is analyzed. Identification is preferred.
  • the cells into which the cDNA of the present invention is introduced are not particularly limited, but human cultured cells and the like are particularly preferably used.
  • Methods for introducing DNA into cells include those described in (2) above.
  • the phenotype of the introduced cells Viability, cell growth rate, cell differentiation, if the cell is a neuron, neurite outgrowth, localization and translocation of intracellular proteins, etc., which can be observed with a microscope, etc., and expression of specific proteins in cells Includes those that can be analyzed by biochemical experiments such as changes.
  • phenotypes in the case of a splicing variant in which a known variant exists, it is also possible to identify a phenotype associated with the variant to be analyzed by introducing a known variant into the cell and performing comparative analysis. it can.
  • the protein of the present invention since the protein of the present invention is known to have a DNA binding activity or an IAP-like activity, attention should be paid to phenotypes and the like found in diseases associated with DNA-binding proteins or proteins having an IAP-like activity. It is also preferable to perform analysis.
  • the method (iv) can be efficiently performed by a method using an oligonucleotide described below or an RNA interference method.
  • a method using an oligonucleotide described below or an RNA interference method if a known variant exists in the target protein to be analyzed, the same analysis is performed for the known variant and other variants, and the function specific to the target protein is identified by comparative analysis. can do.
  • the method of staring the modulator may be any method as long as it is a method capable of obtaining a substance that specifically binds to the protein of the present invention and has an activity of inhibiting, antagonizing or enhancing the activity of the protein. Good.
  • the protein of the present invention is brought into contact with a test substance, and the test substance is selected based on the activity of the protein of the present invention as an index. Any of the following methods can be used.
  • the test substance interacts with the protein of the present invention and has the protein Any substance may be used as long as it has the potential to affect the activity of the protein. Specifically, for example, peptides, proteins, non-peptidic compounds, low-molecular compounds, synthetic compounds, and fermentation products Cell extract, animal tissue extract and the like. These substances may be novel substances or known substances. As a method for analyzing the interaction between the test substance and the protein of the present invention, a conventional method known per se can be used.
  • a yeast two-hybrid method a fluorescence depolarization method, and a surface
  • the substance found to bind to the protein of the present invention is then analyzed by analyzing how the activity of the protein of the present invention is affected in the presence of the substance. Whether it is used as a modulator or not is identified.
  • the substances screened by the above method may be selected as drug candidates by screening in vivo.
  • the method described in the above (5-1) or (5-3) can be used. If the binding ability to double-stranded DNA is increased as compared to the absence of the substance, the substance may function as a DNA binding activator, and if the substance is reduced or inhibited, Can be identified as a substance that may function as a DNA binding inhibitor.
  • the DNA binding activity of the protein of the present invention includes, for example, a function of regulating the gene expression by changing the DNA structure, and includes a gene expression regulating protein, a transcription factor and the like.
  • Transcription factors are located on pathways associated with cancer. Signal transmission function on pathways related to myocardial development, signaling function on pathways that control sperm differentiation and motility, signaling function on pathways that control germ cell differentiation, control cell differentiation Signal transmission function on pathway, function to generate glycerol triphosphate, signal transmission function on pathway that controls the development, differentiation, proliferation, and survival of nerve cells, signal on pathway that controls the onset of Alzheimer's disease Expression of genes that ultimately bind to DNA in various types of signal transmission, such as signaling functions of pathways that control cell functions, including development, differentiation, growth, proliferation, survival, regeneration, and cell functions, etc.
  • Compounds that can be identified by this screening method include anticancer drugs, antidiabetic drugs, antiinflammatory drugs, neurodegenerative disease drugs, heart disease drugs, infertility drugs, regenerating tissue inducers, Alzheimer's disease drugs, obesity drugs, It can be used as a therapeutic agent for diabetes, cardiovascular disease, metabolic disorder, anorexia, bulimia, etc.
  • the method described in the above (5-2) or (5-3) can be used. If the transcription control activity or the binding to a transcription factor is increased as compared to the absence of the substance, the substance may function as a transcription control activator or a transcription factor binding promoter. Yes, and when reduced or inhibited, the substance can be identified as potentially functioning as a transcriptional control inhibitor.
  • the protein having the IAP-like activity of the present invention is an interferon-induced protein family molecule, and is considered to be involved in transcription control.
  • Such an expression control substance, a function activator, or a function inhibitor of the protein of the present invention can be used as a therapeutic agent for various diseases, cancer, diabetes, etc.
  • Such a modulator can be used alone as the active ingredient when it is applied to clinical applications, but can also be used as a pharmaceutical composition by mixing with a pharmaceutically acceptable carrier. At this time, the ratio of the active ingredient to the carrier can be varied between 1 and 90% by weight.
  • a powerful drug can be administered in various forms, such as tablets, capsules, granules, powders, or syrups, orally, or injections, drops, ribosomes. And parenteral administration using suppositories and the like. In addition, the dose can be appropriately selected depending on symptoms, age, weight, and the like. (7) Screening of the DNA expression regulator of the present invention
  • Examples of the screening method include a method of analyzing the expression level of the protein of the present invention or the mRNA encoding the protein in the presence of a test substance.
  • a method of analyzing the expression level of the protein of the present invention or the mRNA encoding the protein in the presence of a test substance Specifically, for example, cells expressing the protein of the present invention described in (2) above are cultured in a suitable medium containing a test substance, and the amount of the protein of the present invention expressed in the cells is determined.
  • the ability to analyze using a conventional method such as ELISA or the amount of mRNA encoding the protein of the present invention in the cells can be analyzed by quantitative reverse transcription PCR, Northern blotting, or the like. it can.
  • test substance those described in the above (6) can be used.
  • the substance functions as the DNA expression promoting substance of the present invention. If it is possible and conversely decreases, it can be determined that the substance can be used as a DNA expression inhibitor of the present invention.
  • the above-mentioned active ingredient can be used alone for clinical application, but can also be used as a pharmaceutical composition by blending it with a pharmaceutically acceptable carrier. At this time, the ratio of the active ingredient to the carrier can be varied between 1 and 90% by weight.
  • Such drugs can be administered in various forms. Examples of these administration forms include oral administration by tablets, capsules, granules, powders, syrups, and the like, and parenteral administration by injections, drops, ribosomes, suppositories, and the like. The dose can be appropriately selected depending on the condition, age, weight, and the like.
  • the introduced DNA containing the DNA of the present invention described in the above (1) is constructed, introduced into a fertilized egg of a mammal other than human, and transplanted into a female individual uterus to generate the present DNA.
  • a non-human mammal into which the DNA of the present invention has been introduced can be produced. More specifically, for example, a female individual is superovulated by hormone administration, then mated with a male, a fertilized egg is extracted from the oviduct on the first day after mating, and the introduced DNA is microinjected into the fertilized egg. It is introduced by a method such as a shot.
  • the surviving fertilized eggs are transplanted into the uterus of a pseudopregnant female individual (foster parent) to give birth.
  • a pseudopregnant female individual foster parent
  • the target DNA has been introduced into the neonate or not can be identified by Southern blot analysis of DNA extracted from cells of the individual. Examples of mammals other than humans include mice, rats, monoremots, hamsters, rabbits, goats, pigs, dogs, cats, and the like.
  • the thus-obtained DNA-introduced animal of the present invention is used to breed this individual and subculture them in a normal breeding environment while confirming that the introduced DNA is stably maintained, thereby obtaining the offspring.
  • the offspring can be obtained by repeating in vitro fertilization, and the strain can be maintained.
  • the non-human mammal into which the DNA of the present invention has been introduced can be used as an analysis of the function of the DNA of the present invention in a living body, or as a screening system for a substance regulating the function.
  • nucleotide sequence encoding the protein of the present invention for example, a DNA having the nucleotide sequence of any one of SEQ ID NOs: 1 to 13, 35, or 37 and a partial fragment thereof include SEQ ID NOs: 14 to
  • the protein having the amino acid sequence described in any one of 26, 36, and 38 and a partial fragment thereof can be used as a carrier on which they are bound on a substrate.
  • proteins proteins
  • DNA chips DNA arrays
  • DNA microarrays and DNA macroarrays DNA microarrays and DNA macroarrays
  • a resin substrate such as a nylon film or a polypropylene film, a nitrocellulose film, a glass plate, a silicon plate, or the like is used as a substrate for binding proteins and DNA.
  • a fluorescent substance or the like a glass plate or a silicon plate containing no fluorescent substance is preferably used.
  • the binding of the protein or DNA to the substrate can be easily performed by a commonly used method known per se.
  • tin chips, DNA chips, or DNA arrays are also included in the scope of the present invention.
  • the amino acid sequence of the protein of the present invention and the nucleotide sequence of DNA can be used as sequence information.
  • the nucleotide sequence of DNA includes the nucleotide sequence of the corresponding RNA.
  • a database of amino acid sequences and base sequences can be constructed by storing the obtained amino acid sequences and base sequences in an appropriate recording medium in a predetermined format readable by a computer.
  • This database may contain the nucleotide sequences of other types of proteins and the DNA that encodes them.
  • the database also means a computer system that writes the above-mentioned sequence on an appropriate recording medium and performs a search according to a predetermined program.
  • Suitable recording media here include, for example, magnetic media such as flexible disks, hard disks, and magnetic tapes, and optical disks such as CD-ROM, MO, CD-R, CD-RW, DVD-R, and DVD-RAM. And semiconductor memories.
  • niRNA-prepared mouse C57BLZ6
  • Each organ or tissue 0.5-: Lg was homogenized with a 10 ml suspension, and 1 ml of 2 M sodium acetate at pH 4.0 and the same amount of phenol / clonal form ( Volume ratio 5: 1) The mixture was added and extracted.
  • RNA separated and precipitated from the aqueous phase.
  • the sample was incubated on ice for 1 hour and then centrifuged at 4,000 rpm for 15 minutes to collect the precipitate.
  • RNA was then centrifuged at 4,000 rpm for 15 minutes at room temperature to dissolve the RNA in 4 ml of 7M guanidine-C1. After adding twice the volume of ethanol, the mixture was incubated on ice for 1 hour, centrifuged at 4,000 rpm for 15 minutes, and the resulting precipitate was washed with 70% ethanol to collect RNA, which was again added to water. Lysed and RNA purity was determined by reading the OD ratio 260/280 (> 1.8) and 230Z260 ( ⁇ 0.45).
  • RNase-free water RNase-free water
  • reaction 1 This acid reaction was performed on ice for 45 minutes under light-shielded conditions. Then add 5 ⁇ 1 sodium chloride 11 ⁇ l, 10% SDS 0.5 ⁇ l and the same amount of isopropanol, leave on ice for 60 min, then
  • the precipitate was obtained by centrifugation at 5,000 rpm. The precipitate was washed with 70% ethanol and redissolved in 50 ⁇ l of RNase-free water. Sodium acetate 1 ( ⁇ 6.1) 51, 10% SDS 5 u 10 mM biotin hydrazide (S igma) (150), and reacted overnight at room temperature (22-26 ° C). Finally, add 5 ⁇ l of 5 M NaCl, 1 M sodium acetate (pH 6.1), 75 ⁇ l, and 2.5 times the volume of ethanol. Was centrifuged for 15 minutes and biotinylated. After the reaction, the reaction solution was centrifuged for 15 minutes to precipitate the RNA-DNA complex again. The precipitate was washed once with 70% ethanol and once with 80% ethanol, and dissolved in 70 ⁇ l of RNase free water.
  • yeast tRNA DNase I-treated
  • CPG magneticporous glass
  • the beads were suspended in 500 ⁇ l of a solution of 5 OmM EDTA and 2 M NaCl, and the RNase I-treated cDNA obtained in (4) above was added. By stirring for 30 minutes at room temperature, the magnetic beads and the full-length cDNA were bound.
  • the single-stranded full-length cDNA recovered in this manner was extracted with phenol / chloroform, and the volume of the solution was reduced to 100 ⁇ l or less with a speed bag, and then subjected to G25 / GlOOSE Sephadex chromatography. Fractions having RI activity were collected in siliconized microtubes, 2 g of glycogen was added, and the precipitate obtained by ethanol precipitation was dissolved in 30 ⁇ l of ultrapure water.
  • second-strand cDNA obtained by converting the first-strand cDNA into a type II was carried out as follows.
  • second strand low buffer (20 OmM Tr is one HC 1 (pH8. 75), 10 OmM KC 1, 10 OmM (NH 4) 2 S0 4, 20 mM Mg S0 4 , L% Triton X-100, 1 mg ⁇ 1 BSA) 3 ⁇ 1, 2nd strand high buffer (20 OmM Tris-HCl (pH9.2), 6 O OmM KC 1, 20 mM M g C 1 2) 3 ⁇ 1, dCTP, d ATP, d TT P, (10 Ding? Each 0. 25mM, ⁇ -NADH 6 ⁇ 1 , was oligo d G Tsukeka ⁇ First strand: ⁇ 31 ⁇ 1, second strand primer-one adapter (SEQ ID NO: 28) 60
  • the reaction was stopped by adding 1 ⁇ l of 0.5 M EDTA, and further dissolved at 45 ° C in the presence of 10% SDS 1 ⁇ 1 and 10 ⁇ g of proteinase K to dissolve the protein components.
  • the mixture was heated for 5 minutes, and finally, a double-stranded full-length cDNA was purified by phenol / chloroform extraction and ethanol precipitation.
  • IPS RI KEN
  • PS RI KEN
  • FLC-1 FLC-1 (FLC stands for FULL—LENGTH cDNA)
  • BamHI and Sa1I which are convenient for cDNA insertion, are respectively introduced into cloning sites on both sides of lOkbpstuifer, and cDNA from 0.5 kb to about 13 kb can be cloned.
  • a 6 kb DNA fragment was inserted into the XbaI site as described above (JP-A-2000-325080).
  • L FLC—1, for example,
  • the average chain length of the insert was 2.57 kb, and it was possible to actually close the insert from 0.5 kb to 12 kb.
  • the average length of the insert was 0.97 kb; therefore, by using L-FLC-1, large cDNAs were more efficient than ⁇ ZAP. You can see that crawling can be done well.
  • RNA driper The mRNA prepared in Example 1 (1) (hereinafter, this may be referred to as "(a) RNA driper”) and the RNA prepared by invitro transcription reaction were used as drivers.
  • the latter RNA is further divided into two types (hereinafter referred to as “(b) RNA driver” and “(c) RNA driver”).
  • cDNA was recovered from RNA-cDNA removed by normalization and cloned into a phage vector. After infection with Escherichia coli, 1000 to 2000 plaques per starting material are mixed into one library (mini-library) and converted to plasmid DNA by a conventional method. Then, use phagemid and infect again to obtain plasmid DNA).
  • RNA driver was obtained by extraction of black mouth form. At this time, mini-libraries are prepared from nine types of tissues (pancreas, liver, lung, kidney, brain, spleen, testis, small intestine, stomach), and nine types of mini-libraries are mixed. To obtain RNA. Another RNA was obtained by culturing a library (about 20,000 clones) already stored as a non-overlapping clone. The resulting DNA was subjected to (b) an in vitro transcription reaction in the same manner as the RNA dryer, and (c) an RNA driver.
  • RNAs were labeled with a biotin label using the Label-ITB iotin labeling kit (manufactured by Mirus Corporation), added to the tester cDNA at a ratio of 1: 1: 1, and The reaction (42.C) at t10 was performed, and the second strand was synthesized from the supernatant collected after treatment with streptavidin beads (CPG).
  • CPG streptavidin beads
  • One representative clone was selected from each cluster. Representative clones were selected by Q-bot (manufactured by GENETIXLIMITED) and subjected to array dying on a 384-well plate. At that time, E. coli was cultured in 50 // 1 LB medium at 30 ° C for 18 to 24 hours. At this time, if the cDNA library has been introduced into the PS vector and E. coli DH10B has been transformed, add 10 Omg / m1 ampicillin and 50 mg / m1 kanamycin and introduce it into the Zap vector. However, when the system was introduced into the SOLR system, 10 Omg / m1 of ampicillin and 25 mg / m1 of streptavidin were added.
  • Each clone cultured in the above (1) is further cultured in 1.3 ml HT solution containing 10 Omg / ml of ampicillin, and after collecting cells by centrifugation, QI Ap rep 96 Turbo ( The plasmid DNA was recovered and purified using QI AG EN.
  • QI AG EN QI AG EN.
  • 1Z30 of the plasmid DNA obtained above was digested with the restriction enzyme PvuII, and subjected to 1% agarose gel electrophoresis.
  • the full-length nucleotide sequence of full-length cDNA inserted into the plasmid thus obtained Three types of sequencers were used for W 03 column analysis. Plasmids were divided into two categories: those with insertion sequences shorter than 2.5 kb and those with longer insertion sequences. Among these, the clones having an insertion sequence shorter than 2.5 kb were analyzed for the nucleotide sequence from both ends.
  • the plasmid was prepared using the primers described in SEQ ID NO: 31 (sense strand) when the vector was PS, and the primers described in SEQ ID NO: 32 (antisense strand) when the vector was Zap. The sense strand) and the antibody described in pp. 34 (antisense strand) can be used as the primers. Thermose quenasePrimerCyc1 eSequencing Kit And analyzed using Licor DNA4200 (longreadsequencer).
  • the gap that could not be analyzed by the nucleotide sequence analysis was determined by the primer walking method.
  • sequencing of clones in which the inserted cDNA was longer than 2.5 kb was performed by the shotgun method.
  • ShimadzuRISA384 and 0EnamicETTermineatOrccyclesequenecinigkit manufactured by Amersham Pharmacia Baiotech
  • 48 DNA fragments grown by PCR from 48 independent representative clones were used to generate a shotgun library. The ends of the amplified DNA fragments were blunt-ended with T4 DNA polymerase.
  • This DNA fragment was inserted into a pUC18 vector, and Escherichia coli DH10B was transformed with the recombinant vector.
  • a plasmid was prepared from this E. coli in the same manner as in (2) above.
  • nucleotide sequence was analyzed by nucleotide sequence analysis from both ends. After determining the sequence and linking the nucleotide sequences on a computer, shearing was performed with Double Stroke S hearing Device (Fiore Inc.). The gap for which the sequence could not be determined by the nucleotide sequence determination was determined by primer walking in the same manner as described above.
  • dnaio rm34837 consists of 3717 bases, of which base numbers 134 to 1690 constitute an open reading frame (including a stop codon).
  • the amino acid sequence predicted from the open reading frame consists of 518 amino acid residues (SEQ ID NO: 14).
  • a homology search was performed on the amino acid sequence encoded by SEQ ID NO: 1 using BLAST.
  • the SPTR protein database (integrating the SWISS-PROT protein sequence database and the TrEMBL nucleic acid translation database) contained (i ) Database registration symbol trembl
  • dnafo rm63166 was composed of 3607 bases, of which base numbers 612 to 2126 were an open reading frame (including a termination codon).
  • the amino acid sequence predicted from the open reading frame consists of 504 amino acid residues (SEQ ID NO: 15).
  • a homology search was performed using the BLAST for the amino acid sequence encoded by SEQ ID NO: 2.
  • dnafo rm33383 was composed of 3704 bases, of which base numbers 662 to 3259 were open reading frames (including a termination codon).
  • the amino acid sequence predicted from the open reading frame consists of 865 amino acid residues (SEQ ID NO: 16).
  • dnafo rm39530 was composed of 2397 bases, of which base numbers 661 to 1476 were open reading frames (including a stop codon).
  • the amino acid sequence predicted from the open reading frame consists of 271 amino acid residues (SEQ ID NO: 17).
  • a homology search was performed using BLAST on the amino acid sequence encoded by SEQ ID NO: 4. The results were obtained by integrating the SPTR protein database (swi SS—; ) in, (i) a database registration mark gp
  • a database registration mark rembl I AF0174331 AF0174331, Homo sapiens putative transcription factor CR53 is, e - va 1 ue:. 1 X 10- 32, a 56% degree of matching further
  • amino acid sequence encoded by the nucleotide sequence shown in SEQ ID NO: 4 was searched for protein characteristics using HMM PFAM, and the SCA sequence was found to be present in nucleotide numbers 775 to 1062. (Base sequence entered as PCAN in SCAN)
  • dnaform m38861 was composed of 2621 bases, of which base numbers 213 to 1703 were open reading frames (including a stop codon).
  • the amino acid sequence predicted from the open reading frame consists of 496 amino acid residues (SEQ ID NO: 18).
  • a homology search was performed using BLAST on the amino acid sequence encoded by SEQ ID NO: 5, and it was found in the SPTR protein database (integrated SWI SS-PROT protein sequence database and TrEMBL nucleic acid translation database).
  • dnafor m60441 was composed of 1830 bases, of which base numbers 122 to 1612 were open reading frames (including a stop codon).
  • the amino acid sequence predicted from the open reading frame consists of 496 amino acid residues (SEQ ID NO: 19).
  • a homology search was performed using the BLAST for the amino acid sequence encoded by SEQ ID NO: 6, and the SPTR protein database (SWISS—PROT protein sequence database and TrEMBL nucleic acid (I) a database registration symbol
  • dnaio rm425 15 was composed of 2311 bases, of which base numbers 156 to 560 were open reading frames (including a stop codon).
  • the amino acid sequence predicted from the open reading frame consists of 134 amino acid residues (SEQ ID NO: 20).
  • a homology search was performed for the amino acid sequence encoded by SEQ ID NO: 7 using BLAST, which was found in the SPTR protein database (integrating the SWISS-PROT protein sequence database and the TrEMBL nucleic acid translation database).
  • a database registration mark AJ301670, sTATc transcriptional repressor is, e- value: in 4 X 1 (gamma 28, and in 53% of the degree of coincidence over 127 amino acids, also (ii) day eat 1 "scan ⁇ g himself issue P58463, fo: rkhead- related transcription factor 2 forces ,, e- va 1 ue: at 4 X 10- 23, with 58% degree of coincidence over 109 amino acids, more
  • the protein of the above (i) is obtained from literature information (Mol. Cell, 7 (4), 779-88 (2001)) is involved in the control of the initial development rate and terminal differentiation timing, and functions as a repressor that controls the expression of the ecmA gene. From the literature information in the database (J. Biol. Chem. 1998, 273 (36): 23335-43), binds to the cis factor of several lung-specific genes with transcription factors expressed in lung and placenta. Force S, and the protein of (iii) above, from the literature information ( ⁇ 1 ⁇ cell. Biol., 1990, 10 (11): 5616-25) in the database, regulate the transcription of genes regulated by glucose and phosphate. It became clear that they were involved.
  • the protein encoded by the nucleotide sequence of SEQ ID NO: 7 was a transcription factor.
  • dnaform m41143 was composed of 2646 bases, of which base numbers 149 to 1591 constitute an open reading frame (including a stop codon).
  • the amino acid sequence predicted from the open reading frame consists of 480 amino acid residues (SEQ ID NO: 21).
  • the protein of (ii) above force 3 ⁇ 4 et al, it revealed a My c- interacting zinc finger protein.
  • a search for the amino acid sequence encoding the nucleotide sequence shown in SEQ ID NO: 8 by HMM PFAM revealed that amino acid Nos. 9 to 121 showed a sequence (P f am Amino acid sequence that is entered as BTB in Japan).
  • a Zinc finger domain an amino acid sequence that is entered as Pfam as zf-C2H2 was also found in one place.
  • the protein encoded by the nucleotide sequence shown in SEQ ID NO: 8 was a Zinc finger-type DM binding protein.
  • dnaform m34196 was composed of 2796 bases, of which base numbers 597 to 1982 had an open reading frame (including a stop codon).
  • the amino acid sequence predicted from the open reading frame consists of 461 amino acid residues (SEQ ID NO: 22).
  • a homology search was performed using BLAST for the amino acid sequence encoded by SEQ ID NO: 9, and the SPTR protein database (s WIS S-PROT protein sequence database and the Tr EMB L nucleic acid translation database were integrated. ) in, (i) database registration symbol Q9P255, Hypothetical zinc finger protein KIM1473 force ,, e- va 1 ue: 1 X 10- 5.
  • Zinc finger protein 135 is, e- value: with 2 X 10- 58, hit in the 39% degree of coincidence over 277 amino acids . From these results, it was inferred that the protein consisting of the amino acid sequence shown in SEQ ID NO: 22 was a zinc finger-type DNA binding protein.
  • amino acid sequence encoded by the nucleotide sequence shown in SEQ ID NO: 9 was subjected to protein characteristic search using HMM PFAM, and the result was a Zinc finger domain at amino acids 43 to 299 (a sequence entry as zf-C2H2 in P fam). Found in 9 places did.
  • the protein encoded by the nucleotide sequence shown in SEQ ID NO: 9 was a Zinc finger type DNA binding protein.
  • dnaform m37479 was composed of 2717 bases, of which base numbers 230 to 907 were open reading frames (including a stop codon).
  • the amino acid sequence predicted from the open reading frame consists of 225 amino acid residues (SEQ ID NO: 23). Homologous and raw searches were performed using BLAST for the amino acid sequence encoded by SEQ ID NO: 10, and the S PTR protein database (swi SS-PROT protein sequence database and the TrEMBL nucleic acid translation database were integrated).
  • the protein of (ii) above was found to be a zinc finger protein with interaction domain based on the literature information in the database (Genes Dev 1994 Jul 15; 8 (14): 1664-77).
  • amino acid sequence encoded by the nucleotide sequence shown in SEQ ID NO: 10 was searched for protein characteristics using HMMP FAM.As a result, amino acid numbers 12--34 and 40--63 showed Zinc finger domain (Pfam as zf-C2H2). Entry sequences) were found in two places.
  • the protein encoded by the nucleotide sequence shown in SEQ ID NO: 10 was a Zinc finger-type DNA binding protein.
  • dnafor m59635 (SEQ ID NOS: 11, 24) As shown in SEQ ID NO: 11, dnafor m59635 was composed of 2709 bases, of which bases 566 to 1228 had an open reading frame (including a stop codon). The amino acid sequence predicted from the open reading frame consists of 220 amino acid residues (SEQ ID NO: 24). A homology search was performed on the amino acid sequence encoded by SEQ ID NO: 11 using BLAST, and a S PTR protein database (SWI SS—PROT protein sequence database and Tr EMB L nucleic acid translation database were integrated).
  • the protein of (ii) above was found to be a zinc finger protein with interaction domain from literature information in the database (Genes Dev 1994 Jullo, 8 (14): 16D4-7J et al.).
  • dnafo rm33773 was composed of 3249 bases, and among them, bases from 487 to 2127 had an open reading frame (including a stop codon).
  • the amino acid sequence predicted from the open reading frame consists of 546 amino acid residues (SEQ ID NO: 25).
  • Code encoded by SEQ ID NO: 12 A homologous homology search was performed on the amino acid sequence using BLAST.
  • amino acid sequence encoded by the nucleotide sequence shown in SEQ ID NO: 12 was subjected to a protein feature search using HMMP FAM, and BTB (for BR-C, ttk) was found in the region of amino acid numbers 17 to 131 in SEQ ID NO: 25. and bab) or POZ (for Pox virus and Zinc finger) domain (amino acid sequence which is entered as BTB in P fam) was found, and Msx-interacting- zinc was found in the amino acid number 337-380 region.
  • a sequence that shows the characteristics of the finger (an amino acid sequence that is entered as zf-MIZ in P f am) was found, and a sequence that showed the characteristics of the Zinc finger, C2H2 type (in P fam Amino acid sequence (entry as zf-C2H2).
  • dnafo rm51218 consists of 2950 bases, of which, in the frame following base number 167, 2950 (the last base of the sequence) is followed by codons of amino acids other than the stop codon.
  • the amino acid sequence encoded by the region from 167 to 2950 consists of 927 amino acid residues (SEQ ID NO: 26).
  • the SPTR protein database (integrating the SWI SS-PROT protein sequence database and the TrEMBL nucleic acid translation database) contained ( i) Database registration code AY044336, Xenopus laevis DNA-methylation dependent transcriptional repressor Kaiso - like protein (Kaiso) is, e- value: at 4X 10- 32, and in 48% of the degree of matching for one 37 ⁇ amino acid, also (ii) a database registration mark AF420316, Xenopus laevis BTB / POZ zinc linger transcription factor XKaiso force S, e -value: at 4X 1 CT 32, were hit with 48% degree of coincidence over 137 amino acids.
  • Database registration code AY044336 Xenopus laevis DNA-methylation dependent transcriptional repressor Kaiso - like protein (Kaiso) is, e- value: at 4X 10- 32, and in 48% of the degree of matching for one 37 ⁇ amino acid, also (ii)
  • the amino acid sequence encoded by the nucleotide sequence shown in SEQ ID NO: 13 was subjected to a protein feature search using HMMP FAM.
  • BTB BR-C, ttk and bab
  • POZ Pox virus and Zinc finger domain
  • amino acid sequence that is entered as BTB in Pfam was found, and the characteristic of Msx-interacting zinc finger was found at amino acid number 337-380.
  • nucleotide sequence shown in SEQ ID NO: 13 was a part of the Kaiso-like transcription factor gene sequence having zinc finger.
  • dnafor m35763 was composed of 1138 bases, of which base numbers 89 to 1138 were an open reading frame (a stop codon did not appear, and 1138 was the last codon in the base sequence).
  • the amino acid sequence predicted from the open reading frame consists of 350 amino acid residues (SEQ ID NO: 38).
  • a homology search using BLAST was performed on the amino acid sequence encoded by SEQ ID NO: 37, and the result was found in the SPTR protein database (integrated SWI SS-PROT protein sequence database and TrEMBL nucleic acid translation database).
  • a database registration symbol 035368, Interferon- activatable protein 203 is, e- value: at 7 X l 0- 67, with 43% degree of coincidence over 348 amino acids, or
  • a database registration mark P41218, Myeloid cell nuclear differentiation antigen are, e- value: at 1 X 1 0- 38, and in 33% of the degree of coincidence over 355 amino acids, further (iii) a database registration mark Q16666,
  • the above-mentioned protein (i) is one of IFN-inducible proteins ("200-family"), and is a mouse (IFI202a, IFI202b, IFI203, IFI204 and D3) and a human.
  • IFI202a, IFI202b, IFI203, IFI204 and D3 mouse
  • MNDA, IFI-16 and AIM2 are not only structurally similar but also present in the nucleus
  • the gene product p202 of IFI202 is a transcription factor F- ⁇ B, c-Fos, and c-Jun And has been reported to suppress transcription (Mol. Cell. Biol. 16, (1996) 359-368).
  • the protein (ii) may be involved in the regulation of transcription in the myeloid lineage based on literature information (Immunogenetics 41: 40-43 (1995)) in the database, and the protein (iii) may be involved in the literature in the database. Information (Biochemistry 37: 11924-11931 (1998)) has revealed that each is involved in the suppression of transcription.
  • amino acid sequence encoded by the nucleotide sequence shown in SEQ ID NO: 37 was subjected to a protein feature search using HMMP FAM.
  • a sequence (a base sequence that is entered as a PMD-suppressed APIN in P fam) was found that shows the characteristics of the molecule that performs the above.
  • the protein encoded by the nucleotide sequence of SEQ ID NO: 37 is a protein having an IAP-like activity, and its transcription is induced by interferon and has a function of modifying the function of a transcription factor through protein interaction. It was speculated that this was a control factor.
  • Example 5 Tissue expression analysis using DNA microarray Tissue expression analysis was performed as described in Miki, R., et al., Pro Natl. Acad. Sci. USA, 98, 2199-2204 (2001).
  • Nucleotide sequences of two types of mouse full-length cDNAs (dnafo rm33383, dnaform m341 96) and one type of mouse belonging to the same cluster as the mouse full-length cDNA to be analyzed (having a nucleotide sequence homologous to the cDNA) cDNA library FANTOM (http://fantom.gsc.riken.go.jp/)
  • FANTOM NO: 9530049C15 After amplification of cDNA base sequence (FANTOM NO: 9530049C15) using M13 forward and reverse primers
  • the PCR product was precipitated with isopropanol and dissolved in 151 3XSSC solution.
  • the detection sensitivity of this DNA microarray was between mRNA1 and 3 copies per cell.
  • the signal intensity of clones with approximately 80% match with the target sequence was one-tenth that of clones with perfect sequence match.
  • the signal intensity of the clones with less than 80% match to the target sequence was at the background level.
  • the mRNA level (Cy3 label) in each tissue is expressed as the ratio (Cy3 / Cy5) to the reference 17.5-day-old fetal whole-body mRNA level (Cy5 label) as a logarithm (1 og 2 ). That is, if the expression level of mRNA corresponding to the full-length cDNA of each mouse to be analyzed is larger in each tissue than in the reference tissue, a positive value is used; Is indicated by 0. Experiments were performed twice independently to increase the accuracy of the data, and reproducible results were used. The results are shown in Table 1 below. You.
  • an increase or decrease of about 2 times is regarded as an experimental error. From this, when the numerical value in the results shown in Table 1 is 1 or more, the mRNA level in a certain tissue is more than twice as high as the mRNA level of whole body of fetal body at 17.5 days of age. , Interpreted as significantly increased. Conversely, if the resulting value is less than 11, the mRNA level in a given tissue is less than half the mRNA level in the whole body of the control 17.5-day-old fetus, Interpreted as significantly reduced.
  • the difference between the values in each tissue is 1, the mRNA amount is 2 times, if it is 2, the mRNA amount is 4 times, and conversely If the difference between the tissues is 11, the mRNA amount is 12 times, and if it is 12, the mRNA amount is 1/4 times.
  • Mouse cDNA clones belonging to the same cluster as the DNA spotted on the microarray and having a region having a nucleotide sequence identity of at least 80% with at least 200 bases are also shown in Table 1 And the numerical value of the measurement result of the DNA spotted on the microarray was used instead.
  • PCR was performed according to a standard method (Higuchi R, et al., Biotechnology, 11: 1026-30 (1993)). The tissue expression analysis used was performed.
  • the following seven mRNAs encoding the protein of the present invention were expressed using a light cycler constant-quantity PCR device (Roche Diagnostics).
  • primer CCTTGTACACMCCMGGGTAGA (SEQ ID NO: 46)
  • side primer GMCCTTGCTGGTGACCATT (SEQ ID NO: 52)
  • the sample was collected using Glyceraldehyde 3-phosphate dehydrogenase (GAPDH) as the standard. That is, the expression level of the target gene (copy number / 1) in each tissue is divided by the expression level of GAPDH (copy number /; i 1), and the constant (1 ⁇ 10 6 ) (Note: 10 6) Multiplied and displayed.
  • GAPDH Glyceraldehyde 3-phosphate dehydrogenase
  • dnafo rm33773 was strongly expressed in the whole body, but especially in lung, knee, fat and brain.
  • dnafo rm38861 is strong in the whole body although it was expressed, it was particularly strongly expressed in the viscera and lungs.
  • dn a fo rm41 143 is expressed in the whole body, but Katsu ⁇ , lung, expressed relatively strongly in the fat.
  • dnafo rm42515 was specifically expressed in the brain, especially in the frontal cortex.
  • dnafor m5 1218 was strongly expressed in the whole body, it was particularly strongly expressed in lung, kidney, fat and brain.
  • dnafo rm60441 was expressed systemically, but was particularly strongly expressed in the knee and lung.
  • dnafo rm35763 was strongly expressed in bone marrow and lung, and was upregulated in diabetic adipocytes and colon cancer.
  • the cDNA of the above clone and the protein encoded by the cDNA can be applied to the treatment and diagnosis of diabetes, cancer and the like. Further, the protein encoded by the cDNA may be involved in a disease relating to a tissue in which the mRNA expression is varied as described above or a tissue having a high mRNA expression level.
  • Two-hybrid experiments with mammalian cells were performed using CheckMatemamm a1ian two-hybridsystem (produced by Promega).
  • the sample for protein-protein interaction analysis was CMV promoter.
  • Vector pBIND with the DNA binding region of the Ga14 gene inserted downstream of the plasmid
  • plasmid vector pACT with the transcriptional activation region of the VP16 gene inserted downstream of the CMV promoter
  • Plasmid vector pG51uc in which the reporter luciferase gene was inserted downstream of the binding region and the TATA box, was prepared as type I.
  • the nucleotide sequence of the Ga14 gene and two mouse full-length cDNAs (dnafo rm33773 , Dnafo rm34837) and the clones of the VP16 gene and mouse cDNA library FANTOM (http://fantom.gsc.riken.go.jp/) Long cDNA protein Basically, a fusion gene with the nucleotide sequence was prepared by combining ligation using a common sequence and two-step PCR according to the protocol of Promega (Suzuki, H., et al., Genome Research, 11, 1758-1765 (2001)) The protein coding sequence of mouse cDNA is combined with a M13 universal primer, which has a common sequence on the 5 side and a gene-specific sequence on the 3 side.
  • the above amplification product is mixed with the PCR amplification product of pBIND or pACT (with a common sequence attached to the 3 'side), and the mixture is mixed with a nested primer to obtain a second primer.
  • the PCR amplification in the second step was performed to construct a vector for expressing a fusion protein of Ga14 and mouse protein (BIND sample) or a vector for expressing a fusion protein of VP16 and mouse protein (ACT sample).
  • the BIND and ACT samples prepared by PCR were used directly without further purification. 0.25 il, 30 ng of each of the BIND sample and the ACT sample: 1 uc of pG51, and 9.51 of Opti-MEM medium (manufactured by Lifetech) were dispensed into a 384-well plate. Add 10 ⁇ l of LF2000 transfection reagent (manufactured by Lifetech) diluted 32 times in Opti-MEM medium, mix well, incubate for 20 minutes, and incubate for 1,300 cells in F12 medium. 20 ⁇ l of CHO- ⁇ 1 Chinese hamster 1 cell suspension suspended in the suspension was added and well suspended. Atsu Si 20 hours of culture samples in C0 2 incubator in coater, Rushifueraze activity was measure using S teady- G lo Lu ciferase As say Sy st em (P romega Inc.) to confirm the interaction.
  • the proteins encoded by the protein coding sequences of the two mouse full-length cDNA base sequences are as shown below for specific proteins (specific clones of the mouse cDNA library FANTOM). It has been found that each of the cDNAs has an interaction with a specific protein encoded by the protein coding sequence of the cDNA.
  • SRP40 is one of the SR proteins that are a group of proteins involved in the splicing reaction of the pre-mRNA, and is a protein required for the splicing pathway of protein kinase C beta II mRNA involving phosphatidylinositol 3-kinase. It is known that SRP40 regulates the expression of protein kinase C beta II, and this action regulates insulin-dependent glucose metabolism (J. Biol. Chem., 276 (25): 22648-54) , 2001). Thus, abnormalities in SRP40 can cause diabetes.
  • the protein of the present invention encoded by Dnaform33773 is expected to have Zincfinger and to have transcription control activity.When these results are comprehensively analyzed, it is found that Dnaf binding to SRP40, which can cause diabetes
  • the protein encoded by orm33773 can be presumed to be a protein that can cause diabetes.
  • PXR2 is one of the nuclear steroid receptors and one of the nuclear receptors involved in the steroid compound-mediated signal transduction system. In the liver, it is present in the cytoplasm and, when exposed to ligand, forms a heterodimer with RXR (Retinoid X receptor) and translocates to the nucleus, causing specific gene expression. He is known for being involved.
  • RXR Retinoid X receptor
  • Dnaform34837 is a zinc-finger protein, which is predicted to be a protein having transcriptional regulatory activity, and which is located in the nucleus and binds to a specific DNA sequence for information. It is expected to be involved in the transmission system. Comprehensive analysis of the above results suggests that Dnaform34837 is a protein that may form a heterodimer under conditions that coexist with PXR2 and that may be involved in transcriptional regulation.
  • NCB IBuild 30 Using the nucleotide sequence of dnaform33383 (SEQ ID NO: 3) as a query, the human genome draft sequence (NCB IBuild 30;
  • SEQ ID NO: 53 was obtained.
  • This nucleotide sequence contained an open reading frame (SEQ ID NO: 35) of 2904 nucleotides at nucleotide numbers 319 to 3219.
  • the mouse nucleotide sequence of SEQ ID NO: 3 was found to have 81% homology over the length of about 2580 base pairs with the human nucleotide sequence of SEQ ID NO: 35.
  • nucleotide sequence of SEQ ID NO: 35 was translated into the amino acid sequence of SEQ ID NO: 36. was predicted to be. Between the amino acid sequence of SEQ ID NO: 36 and the amino acid sequence predicted from the open reading frame of dna 33383 (SEQ ID NO: 16) is 81 across the 864 amino acid sequence. /. There was homology.
  • SEQ ID NO: 35 was considered to be a novel human ortholog DNA for SEQ ID NO: 3.
  • HMMPFAM was used to perform a protein feature search on the human amino acid sequence of SEQ ID NO: 36.
  • SCAN domain amino acid sequence entered as SCAN in Pfam
  • amino acids 39-134 amino acids 229-269.
  • KRAB box region amino acid sequence that is entered as KRAB in Pfam
  • C2H2 type domain was found.
  • the SCAN domain is a conserved motif found at the N-terminus of some C2H2-type Zn finger proteins and is known to play a role in regulating oligomer formation and controlling transcription.
  • the Kruppel-associated box (KRAB) is found in about one-third of the C2H2-type Zn finger protein, is located at the N-terminal part, and acts to suppress transcription during binding to DNA, It is known to be involved in cell differentiation and development together with the finger domain.
  • the protein having the amino acid sequence of SEQ ID NO: 36 is a C2H2-type Zn finger protein having a Kruppel-associated box (KRAB) and is a transcription factor involved in the suppression of transcription. .
  • human tissue-derived cDNA (manufactured by CI ontech) was prepared using the forma primer 1 (SEQ ID NO: 54) and the reverse primer 1 (SEQ ID NO: 55). ) was performed, and amplification of the target DNA of about 150 bp was confirmed in the uterus, prostate, pituitary gland, brain, fetal brain, hippocampus, and thalamus.
  • Forward primer 1 corresponds to base numbers 1294 to 1313 of SEQ ID NO: 35
  • reverse primer 1 corresponds to base numbers 1443 to 1424 of SEQ ID NO: 35.
  • PCR using a forward primer 2 (SEQ ID NO: 56) and a reverse primer 2 (SEQ ID NO: 57) was performed using cDNAs derived from these tissues as type III. These primers are located outside the open reading frame in the human nucleotide sequence of SEQ ID NO: 53.
  • the human homologue DNA thus obtained was named ZG1001.
  • the amino acid numbers 64—91 3 in the human amino acid sequence were compared.
  • the amino acid sequence at the amino acid number 7-856 on the mouse amino acid sequence had a high degree of agreement.
  • the N-terminus was 59 amino acids longer in the human amino acid sequence and the C-terminus was 36 amino acids longer.
  • a PCR reaction was performed to prepare a DNA fragment for transcription.
  • a transcription reaction was performed using SP6 RNAPolymerase (produced by Promega), mRNA was synthesized, and raRNA obtained by ethanol precipitation was purified. Protein synthesis using this mRNA is performed by the overlay method according to Japanese Patent Application Laid-Open No. 2002-204689 and Proc. Natl. Acad. Sci. USA, 99: 14652-14657 (2002). This was performed using a cell-free protein synthesis system.
  • the translation solution (25 ⁇ l) used in the overlay cell-free protein synthesis system contains 6 ⁇ l of wheat germ prepared according to Proc. Natl. Acad. Sci. USA, 97: 559-564 (2000).
  • the extract was added to the above mRNA (0.02 nmo 1), and the composition was 24 mM Hepes / K0H (pH 7.8), 1.2 mM ATP, 0.25 mM GTP, lo mM creatine phospnate, 10 ⁇ g creatine kinase, rioonuclease
  • the translation buffer was 31.3raM HEPES / K0H (pH7.8), 2.67inM Mg (0Ac) 2, 93mM KOAc, 1.2raM AtP, 0.257mM GTP, 16mM creatine phosphate, 2.ImM DTT, 0.41mM spermidine, 0.3mM It consists of mML-amino acid (20 kinds), 1 ⁇ -64, 0.005% NaN3, 0.05% ⁇ -40.
  • a translation buffer solution 125 ⁇ l
  • the reaction was carried out by incubating the plate in a 26 ° C. incubator for 16 hours.
  • the following 53 types of biotinylated double-stranded DNAs were separately immobilized.
  • the sensor chip used was an SA type (manufactured by Biacore), and the SPR measurement and analysis used a BI AC ORE 3000 (manufactured by Biacore).
  • target sequence A known transcription factor and the base sequence of the designed target transcription regulatory region DNA or DNA fragment (hereinafter sometimes referred to as “target sequence”), or a target recognized by multiple transcription factors in common Nucleotide sequence of DNA or DNA fragment of transcription regulatory region
  • AhR Arnt consensus target sequence: GGGGATTGCGTG (SEQ ID NO: 63)
  • Target sequence of USF GTCACGTGGT (SEQ ID NO: 64)
  • RF-XI target sequence GGTAACATAGCMC (SEQ ID NO: 66)
  • Target sequence of 26 Evi-1 AGATMGATM (SEQ ID NO: 83)
  • Target sequence of 29 H0X9 TGACAGTTTMCGA (SEQ ID NO: 86)
  • Consensus target sequence of Oct-IA, Oct-IB and Oct-lC ATGCMAT (SEQ ID NO: 90)
  • Pax-3, Pax-6 consensus target sequence CGTCACGCTTGA (SEQ ID NO: 92)
  • Pax-1 target sequence CCGTTCCGCTCTAGATAT (SEQ ID NO: 93)
  • Consensus target sequence of HSF1 (short), HSF2, dHSF, fungalHSF: AGAAAAGAAAAGAAA (SEQ ID NO: 94)
  • Target sequence of IRF-1, IRF-2 GAAAAGCGAAACC (SEQ ID NO: 97)
  • Target sequence of p50 GGGGACTTTCC (SEQ ID NO: 98)
  • Consensus target sequence of NF-ATc and NF-Atp AGGMM (SEQ ID NO: 99)
  • Consensus target sequence of p91 and p84 GMTTCCGGGAAATGG (SEQ ID NO: 100)
  • STAT2, STAT3, STAT4, STAT5A, STAT5B Target sequence of STAT6, STAT6: TTTCCCGGGAAATG (SEQ ID NO: 101)
  • Target sequence of p53 GGACATGCCCGGGCATGTC (SEQ ID NO: 102)
  • Target sequence of MEF-2A CTCTAMAATA (SEQ ID NO: 103)
  • SRF target sequence CCATATATGGACAT (SEQ ID NO: 104)
  • Target sequence of E2 AACCAAAMCGGTM (SEQ ID NO: 105)
  • TBP target sequence TATMAA (SEQ ID NO: 106)
  • Target sequence of SRY, Sox-5, Sox-9 MAAAACMTAGGG (SEQ ID NO: 107)
  • Target sequence of mat-Mc TCATTGTT (SEQ ID NO: 108)
  • CP1A, CP1B, CBF-C consensus target sequence CTGATTGGCTACC (SEQ ID NO: 109)
  • Target sequence of AMLla TGTGGT (SEQ ID NO: 110)
  • DNA with biotin added to the 5 ′ side of each DNA and DNA having a complementary base sequence were determined by a standard method. Annealing was performed individually to prepare a total of 53 types of double-stranded DNA. On the other hand, the sensor chip used for analysis is divided into four flow cells per piece. Flow cell 1 was used as a control without any immobilization, and flow cells 2, 3 and 4 each immobilized three types of the double-stranded DNA prepared above.
  • the binding activity to the protein of the present invention encoded by the cDNA of the clone was analyzed.
  • the measurement was performed with reference to the measurement conditions of Molecular Microbiology, 36 (3), 557-569 (2000).
  • the protein solution is allowed to flow at the same flow rate to form a specific bond between the protein molecule and the DNA chain. After the injection for a certain period of time, the SPR response value (SPR—bound) of each flow cell was measured.
  • the protein of the present invention encoded by the cDNA of 13 clones of 37, 37479, 38861, 39530, 41 143, 42515, 512 18, 59635, 60441, 63166 is the total of 53 of the above [1] to [53]. It was found to have binding activity to at least one of the DNAs having different types of target sequences (SEQ ID NO: 58 to SEQ ID NO: 110).
  • SEQ ID NO: 58 to SEQ ID NO: 110 Human tissue expression analysis
  • Example 8 a human ortholog corresponding to dnaform33383
  • mRNAs of the following nine human tissues were purchased from Clontech and subjected to reverse transcription using oligo dT as a primer to synthesize cDNA.
  • Normal brain normal hippocampus, normal thalamus, normal kidney, normal liver, normal knee, normal skeletal muscle, normal fat, normal spleen
  • the cDNAs of the following eight human tissues were purchased from Clontech.
  • RNA of one human tissue was purchased from Unitech, and mRNA was extracted, followed by cDNA synthesis.
  • mRNA of the human ortholog ZG1001 of dnafo rm33338 The expression of the mRNA encoding the human protein of the present invention (mRNA of the human ortholog ZG1001 of dnafo rm33338) is constant in the light cycler. Amount Using a PCR device (Roche's Diagnostics-Tatas) and LightCycler-FastStart DNA Master SYBR Green I reagent, quantification was performed according to the protocol attached to the product. The synthetic DNA sequences used for quantitative PCR are shown below.
  • primer GCGGATAAATTCGATGCCTA (SEQ ID NO: 1 12)
  • ZG1001 mRNA was expressed in the knee, spleen, and brain, and increased in breast cancer.
  • the above-mentioned cDNA and the protein encoded by the cDNA can be applied to the treatment and diagnosis of cancer and Alzheimer's disease.
  • the cDNA Therefore, the encoded protein may be involved in a tissue associated with fluctuations in mRNA expression as described above, a high level of mRNA expression, or a disease associated with ito-tissue.
  • Example 1 1 Comprehensive analysis of proteins encoded by each full-length cDNA
  • the protein encoded by the cDNA of dnafo rm34837 was analyzed by a SPR measurement device (manufactured by BI ACORE) described in Example 9 as a result of a binding experiment with DNA having 53 types of target sequences. It was shown to be a DNA-binding protein that binds to at least one and has selectivity for the target sequence to which the protein binds. Expression analysis also revealed that it is strongly expressed in adipocytes derived from victory and epididymis. Furthermore, protein-protein interaction analysis confirmed that the protein encoded by the cDNA interacted with PXR2, one of the nuclear steroid receptors.
  • this protein is a DNA-binding protein that exists in the nucleus and may interact with multimers or other proteins.
  • the cDNA and the protein encoded by the cDNA may be involved in a disease relating to a tissue in which mRNA expression is fluctuated or a tissue having a high mRNA expression level, such as diabetes and cancer. It can be applied to treatment and diagnosis.
  • the protein encoded by the dnafo rm63166 cDNA was determined to be at least one of the target sequences.
  • the protein was shown to be a DNA-binding protein having selectivity for the bound target sequence. Expression analysis revealed that the gene was strongly expressed in the medulla oblongata. According to the results of the experiments described in Example 4 above, this protein is not present in the nucleus. It is considered to be a DNA binding protein that may interact with multimers or other proteins.
  • the cDNA and the protein encoded by the cDNA may be involved in a disease relating to a tissue in which mRNA expression is fluctuated or a tissue having a high mRNA expression level, such as diabetes or cancer. Can be applied to treatment and diagnosis
  • the protein encoded by the dnafo rm33383 cDNA was determined to be at least one of the target sequences as a result of a binding experiment with DNA having 53 types of target sequences using the SPR measurement apparatus (manufactured by BI ACORE) described in Example 9 above. It was shown that the protein was a DNA-binding protein having selectivity for the target sequence to which it bound. According to the results of the PFAM search described in Example 4, the present protein has six C 2H2 ty Z inc Finger structures at the C-terminus and S CAN dom in at the N-terminal side involved in protein interaction. , A protein with KRAB doma in. Prediction of protein intracellular localization by PleLoc strongly suggests nuclear localization.
  • this protein is a DNA binding protein that may interact with multimers or other proteins expected to be present in the nucleus. It is conceivable that. Therefore, the cDNA and the protein encoded by the cDNA may be involved in a disease relating to a tissue in which mRNA expression is fluctuated or a tissue having a high mRNA expression level, such as diabetes or cancer. Can be applied to treatment and diagnosis
  • the protein encoded by the cDNA of dnafo rm39530 was analyzed by the SPR measurement device (manufactured by BI ACORE) described in Example 9 as a result of a binding experiment to DNA having 53 kinds of target sequences, It was shown to be a DNA-binding protein that binds to at least one of the sequences and has selectivity for the target sequence to which the protein binds. From the analysis described in Example 4 and the results of these experiments, this protein is expected to be present in the nucleus, and is considered to be a DNA-binding protein that may interact with multimers or other proteins.
  • the cDNA and the protein encoded by the cDNA may be involved in a disease involving a tissue in which mRNA expression is fluctuated or a tissue with a high mRNA expression level, such as diabetes and cancer. It can be applied to medical treatment and diagnosis.
  • the protein encoded by the cDNA of dnafo rm38861 was analyzed by the SPR measurement apparatus (manufactured by BI ACORE) described in Example 9 as a result of a binding experiment with DNA having 53 types of target sequences. It was shown to be a DNA-binding protein that binds to at least one and has a selected 1 "life at the target sequence to which the protein is bound. Expression analysis also shows that it is strongly expressed throughout the body, especially It was found to be strongly expressed in the lung.
  • this protein is expected to be present in the nucleus, and is considered to be a DNA-binding protein that may interact with multimers or other proteins.
  • the cDNA and the protein encoded by the cDNA are involved in a disease relating to a tissue in which mRNA expression is varied or a tissue having a high mRNA expression level as described above. It can be applied to treatment and diagnosis of diseases and cancer.
  • the protein encoded by the cDNA of dnafor m60441 was analyzed using a SPR measurement device (manufactured by BI ACORE) described in Example 9 above, as a result of a binding experiment with DNA having 53 types of target sequences. It was shown to be a DNA binding protein that binds to at least one of the sequences and has selectivity for the target sequence to which the protein binds. Expression analysis also showed that it was strongly expressed in the whole body, especially in the viscera and lungs.
  • this protein was found to be nuclear. It is a DNA-binding protein that is expected to be present and may interact with multimers or other proteins. Therefore, the cDNA and the protein encoded by the cDNA may be involved in a disease relating to a tissue in which the mRNA expression is varied or a tissue having a high mRNA expression level, such as diabetes and It can be applied to treatment and diagnosis of cancer.
  • the protein encoded by the dnafo rm42515 cDNA was determined to be at least one of the target sequences as a result of a binding experiment on DNA having 53 types of target sequences using the SPR measurement apparatus (manufactured by BI ACORE) described in Example 9 above. It was shown to be a DNA-binding protein that binds to one and has selectivity for the target sequence to which the protein binds. Expression analysis also showed that it was specifically expressed in the brain, and particularly strongly in the frontal cortex.
  • this protein is expected to be present in the nucleus, and is a DNA-binding protein that may interact with multimers or other proteins. It is conceivable that. Therefore, the cDNA and the protein encoded by the cDNA may be involved in a disease relating to a tissue in which mRNA expression is fluctuated or a tissue expressing a large amount of mRNA as described above. It can be applied to treatment and diagnosis of diseases, cancers and neurological diseases.
  • the protein encoded by the cDNA of dnafor m41143 was analyzed using a SPR measurement apparatus (manufactured by BI ACORE) described in Example 9 as a result of a binding experiment on 53 types of target sequence-containing DNA. It was shown to be a DNA-binding protein that binds to at least one of the sequences and has selectivity for the target sequence to which the protein binds. From expression analysis, it was expressed in the whole body, but was relatively strong in the knee, lung and fat.
  • this protein is present in the nucleus, and there is a possibility that this protein may interact with multimers or other proteins. It is considered to be an NA binding protein. Therefore, there is a possibility that the cDNA and the protein encoded by the cDNA are involved in a tissue in which the mRNA expression is fluctuated as described above, a large amount of mRNA expression, and a tissue-related disease, For example, it can be applied to treatment and diagnosis of diabetes and cancer.
  • the protein encoded by the dnafo rm34196 cDNA was analyzed by a SPR measurement apparatus (manufactured by BI ACORE) described in Example 9 as a result of a binding experiment with DNA having 53 kinds of target sequences. It was shown that the protein was a DNA-binding protein having selectivity for the target sequence to which the protein was bound.
  • this protein is expected to be present in the nucleus, and is considered to be a DNA-binding protein that may interact with multimers or other proteins.
  • the cDNA and the protein encoded by the cDNA may be involved in a disease involving a tissue in which mRNA expression is fluctuated or a tissue with a high mRNA expression level, such as diabetes and cancer. It can be applied to medical treatment and diagnosis.
  • the protein encoded by the dnafo rm37479 cDNA was analyzed by a SPR measurement device (manufactured by BI ACORE) described in Example 9 in a binding experiment with DNA having 53 types of target sequences. It was shown to be a DNA binding protein that binds to at least one of the sequences and has selectivity for the target sequence to which the protein binds.
  • this protein is expected to be present in the nucleus, and is a DNA-binding protein that may interact with multimers or other proteins. It is conceivable that. Therefore, the cDNA and the protein encoded by the cDNA may be involved in a disease relating to a tissue in which mRNA expression is fluctuated or a tissue having a high mRNA expression level, such as diabetes and cancer. Cure Applicable to medical diagnosis
  • the protein encoded by the cDNA of dnafo rm59635 was analyzed by a SPR measurement apparatus (manufactured by BI ACORE) described in Example 9 as a result of a binding experiment with DNA having 53 kinds of target sequences. It was shown to be a DNA binding protein that binds to at least one and has selectivity for the target sequence to which the protein binds.
  • this protein is expected to be present in the nucleus, and is a DNA-binding protein that may interact with multimers or other proteins. It is conceivable that. Therefore, the cDNA and the protein encoded by the cDNA may be involved in a disease involving a tissue in which mRNA expression is fluctuated or a tissue with a high mRNA expression level, such as diabetes and cancer. It can be applied to medical treatment and diagnosis.
  • the protein encoded by the cDNA of dnafor m33773 was tested for binding to DNA having 53 types of target sequences using the SPR measurement device (manufactured by BI ACORE) described in Example 9 above. It was shown that the protein was a DNA-binding protein having selectivity for the target sequence to which the protein was bound. Expression analysis revealed that the protein was strongly expressed in the whole body, but was particularly strongly expressed in lung, spleen, fat, and brain. Furthermore, the protein-protein interaction analysis confirmed that the protein encoded by the cDNA interacted with SRP40, which can cause diabetes.
  • this protein is expected to be present in the nucleus, and is a DNA-binding protein that may interact with multimers or other proteins. It is conceivable that. Therefore, the cDNA and the protein encoded by the cDNA may be involved in a disease relating to a tissue in which mRNA expression is fluctuated or a tissue expressing a large amount of mRNA as described above. It can be applied to treatment and diagnosis of diseases, cancers and neurological diseases.
  • the protein encoded by the cDNA of dnafor m51218 was analyzed by a SPR measurement device (manufactured by BI ACORE) described in Example 9 above, as a result of a binding experiment with DNA having 53 types of target sequences. It was shown to be a DNA-binding protein that binds to at least one of the sequences and has selectivity for the target sequence to which the protein binds. Expression analysis revealed that the gene was strongly expressed in the whole body, but was particularly strongly expressed in lung, kidney, fat, and brain.
  • this protein is expected to be present in the nucleus, and is a DNA-binding protein that may interact with multimers or other proteins. It is conceivable that. Therefore, the cDNA and the protein encoded by the cDNA may be involved in a disease relating to a tissue in which mRNA expression is fluctuated as described above or a tissue with a large amount of mRNA effort. It can be applied to treatment and diagnosis of diabetes, cancer and neurological diseases.
  • the protein encoded by this cDNA is expected to be present in the nucleus, and may interact with multimers or other proteins. It is considered to be a DNA binding protein. Therefore, the cDNA and the protein encoded by the cDNA may be involved in a tissue in which the mRNA expression is fluctuated as described above, or a large amount of mRNA expression, or a tissue-related disease. Yes, it can be applied to the treatment and diagnosis of diabetes and cancer. Industrial applicability
  • the protein of the present invention and the DNA encoding the same have DNA binding activity, IAP-like activity, and the like
  • the protein or the DNA encoding the It can be used to screen for a substance that regulates the activity, and is useful for the development of a medicament that can act on diseases and the like in which the protein is associated.
  • This application is filed with Japanese Patent Application dated April 19, 2002 (Japanese Patent Application No. 2002-117840), Japanese Patent Application dated April 30, 2002 (Japanese Patent Application No. 2002- 1284 18), January 2002 It is based on a Japanese patent application filed on April 4, 2002 (Japanese Patent Application No. 2002-352469) and a Japanese patent application filed on April 30, 2002 (Japanese Patent Application No. 2002-28779), the contents of which are hereby incorporated by reference. It is captured. The contents of the documents cited in the present specification are also incorporated herein by reference.

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Biochemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Zoology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Toxicology (AREA)
  • Peptides Or Proteins (AREA)

Description

明細書
新規タンパク質及びそれをコードする DNA 技術分野
本発明は、 新規なタンパク質、 該タンパク質をコードする DNA、 該タンパク 質をコードする完全長 c DNA、 該 DNAを有する組換えベクター、 該 DNAの 部分配列から成るオリゴヌクレオチド、 ^DN Aを導入した遺伝子導入細胞、 及 ぴ該タンパク質に特異的に結合する抗体等に関する。 背景技術
c DNAの取得及ぴその塩基配列解析は、 生体内に発現するタンパク質の生理 活性を解析し、 その活性に基づくタンパク質の利用方法を開発するうえで不可欠 である。 さらに、 全遺伝子種に対応する完全長 cDNAをカタログ化したライブ ラリーの作製は、 ヒトゲノムプロジェクトの重要な課題の一つである。 カタログ 化したライブラリーとは、 ライブラリーに含まれる c DNAに重複がないという 意味であり、 各 c DNAが 1種類ずつ含まれているライブラリーのことである。 完全長 c DNAクローニング法については、 特開平 9一 248187号公報及 ぴ特開平 10— 127291号公報に記載されている。 この方法は、 mRNAの 5,キャップサイトに存在するジオール構造にタグになる分子を結合させる工程、 前記タグ分子を結合させた mRNAを铸型とし、 o l i g o dTをプライマー として逆転写により RNA— DNA複合体を作製し、 この複合体の内、 mRNA の完全長に対応する DNAを有するものをタグ分子の機能を利用して分離するェ 程を含むことを特徴とする方法である。
また効率のよい逆転写法として、 铸型が高次構造を形成しないような高温で行 うための方法も開発されている (特開平 10— 84961号公報) 。 さらに、 合 成された完全長 cDNAライブラリーに含まれる DNA断片についてその鎖長に 関わらず一律にクローユングすることができるクローニングベクターも開発され ている (特開平 11—9273号公報) 。
このような技術により作製された完全長 c DNAライブラリ一は、 ライブラリ 一の個々の要素として全て均等に異なるものが含まれている訳ではなく、 存在割 合の高いクローンや逆に極微量にしか存在しないクローンもある。 この極微量に しか存在しないクローンは新規である可能性が高いため、 このようなクローンを 濃縮するためのサブトラクション法ゃノーマライゼーション法も開発されている
(特開 2000— 325080号公報; Carninci, P. et al., Genomics, 37, 327-336(1996)) 。
かくして得られるカタログ化された完全長 c DNAライブラリーの各クローン について、 公知の方法により塩基配列の解析を行えばその塩基配列は同定される が、 該 c DNAがコードするタンパク質の生理活性は依然不明のままである。 発明の開示
本発明は、 カタログ化された完全長 cDNAライブラリーに含まれる c DNA クローンの塩基配列を解析し、 このうち配列が新規なものについては、 これがコ 一ドするタンパク質の生理活性を特定し、 該生理活性に基づくタンパク質および それをコードする DNAの利用方法を提案することを目的とする。
本発明者らは、 マウス完全長 cDNAライブラリ一中の cDNAクローンが有 する塩基配列を解析し、該配列の相同性に基づきデータベースを検索したところ、 該配列中に特定の機能を有するタンパク質に特異的な配列を見出した。 さらに、 これらの c DNAの各組織における発現量や、 該 c DNAがコードするタンパク 質を実際に取得してその相互作用を解析した。 また、 これらの cDNAがコード するタンパク質の DNA結合活性または転写制御活性を解析した。 さらには、 該 c DNAの塩基配列をもとにヒトホモログ DNAを取得し、 得られたヒトホモロ グ DNAの各組織における発現量を解析した。 本発明は、 これらの知見に基づい て成し遂げられたものである。
すなわち本発明によれば、以下の(1)〜(19) に記載の発明が提供される。 1
(1) 以下の (a) または (b) のタンパク質。
(a) 配列番号 14〜26または 36のいずれかに記載のアミノ酸配列からなる
(b) 配列番号 14〜26または 36のいずれかに記載のアミノ酸配列において 1若しくは数個のァミノ酸が欠失、 置換及び または付加されたァミノ酸配列か らなり、 かつ DN A結合活性を有するタンパク質。
(2) 上記 (1) に記載のタンパク質をコードする DNA。
(3) 上記 (1) に記載のタンパク質をコードする完全長 cDNA。
(4) 以下の (a) 、 (b)又は (c) の何れかの DNA。
(&)配列番号1〜13または 35のいずれかに記載の塩基配列を有する DNA。
(b) 配列番号 1〜13または 35のいずれかに記載の塩基配列において、 1若 しくは数個の塩基が欠失、 置換及び/または付加された塩基配列を有し、 かつ D NA結合活性を有するタンパク質をコードする DNA。
(c) 配列番号 1〜1 3または 35のいずれかに記載の塩基配列あるいはその相 補配列を有する DNAとス トリンジェントな条件下でハイブリダイズすることが できる塩基配列を有し、 かつ DNA結合活性を有するタンパク質をコードする D NA。
(5) 以下の (a) または (b) のタンパク質。
( a ) 配列番号 38に記載のァミノ酸配列からなるタンパク質。
(b) 配列番号 38に記載のアミノ酸配列において 1若しくは数個のァミノ酸が 欠失、 置換及び Zまたは付加されたアミノ酸配列からなり、 かつ I AP様活性を 有するタンパク質。 ·
(6) 上記 (5) に記載のタンパク質をコードする DNA。
(7) 上記 (5) に記載のタンパク質をコードする完全長 cDNA。
(8) 以下の (a) 、 (b)又は (c) の何れかの DNA。
(a) 配列番号 37に記載の塩基配列を有する DNA。
(b) 配列番号 37に記載の塩基配列において、 1若しくは数個の塩基が欠失、 置換及び/または付加された塩基配列を有し、 かつ I AP様活性を有するタンパ ク質をコードする DNA。
(c) 配列番号 37に記載の塩基配列あるいはその相補配列を有する DNAとス トリンジェントな条件下でハイブリダイズすることができる塩基配列を有し、 か つ I AP様活性を有するタンパク質をコードする DNA。
(9) 上記 (2) 〜 (4) 、 (6) 〜 (8) のいずれかに記載の DNAを含む 組換えベクター。
(10) 上記 (2) - (4) 、 (6) 〜 (8) のいずれかに記載の DN Aまた は (9) に記載の組み換えベクターを導入した遺伝子導入細胞または該細胞から なる個体。
(11) 上記 (10) に記載の細胞により産生される、 上記 (1) または (5) に記載のタンパク質。
(12) 上記 (2) 〜 (4) 、 (6) 〜 (8) の何れかに記載の DNAの塩基 配列中の連続した 5〜100塩基と同じ配列を有するセンスオリゴヌクレオチド、 当該センスオリゴヌクレオチドと相補的な配列を有するアンチセンスオリゴヌク レオチド、 及び、 当該センス又はアンチセンスオリゴヌクレオチドのオリゴヌク レオチド誘導体から成る群から選ばれるオリゴヌクレオチド。
(13) 上記 (1) 、 (5) 、 (7) 、 または (11) に記載のタンパク質に 特異的に結合する抗体あるいはその部分フラグメント。
(14) 抗体がモノク口ーナル抗体である上記 (13) に記載の抗体。
(15) モノクローナル抗体が上記 (1) 、 (5) 、 (7) 、 または (1 1) に記載のタンパク質の活性を中和する作用を有することを特徴とする上記(14) に記載の抗体。
(16) 上記 (1) 、 (5) 、 (7) 、 または (11) に記載のタンパク質と 被検物質を接触させ、 該被検物質による該タンパク質が有する活性の変化を測定 することを特徴とする、 該タンパク質の活性調節物質のスクリーニング方法。
(17) 上記 (10) に記載の遺伝子導入細胞と被検物質を接触させ、 該細胞 1 に導入されている DNAの発現レベルの変化を検出することを特徴とする、 該 D N Aの発現調節物質のスクリ一ユング方法。
(18) 上記 (1) または (5) に記載のタンパク質のアミノ酸配列から選択 される少なくとも 1以上のァミノ酸配列情報、およぴ Zまたは上記( 2 )〜( 4 )、
(6) 〜 (8) のいずれかに記載の DN Aの塩基配列から選択される少なくとも 1以上の塩基配列情報を保存したコンピュータ読み取り可能記録媒体。
(19) 上記(1)または(5)に記載のタンパク質、およびノまたは上記(2) 〜 (4) 、 (6) 〜 (8) のいずれかに記載の DN Aを結合させた担体。 発明を実施するための最良の形態
以下、 本発明をさらに詳細に説明する。
( 1 ) 完全長 cDNAの取得及び塩基配列の解析
本発明の DNAは、 配列番号 14〜26または 36に記載のアミノ酸配列から なるタンパク質、 または該アミノ酸配列において、 1若しくは数個 (ここで言う 数個の数は特には限定されないが、 例えば 20個以下、 好ましく 1 5個以下、 よ り好ましくは 10個以下、 さらに好ましくは 5個以下を意味する) のアミノ酸残 基の置換、 欠失、 揷入、 付加、 若しくは逆位を含むアミノ酸配列からなり、 かつ DNA結合活性を有するタンパク質をコードし得るもの、 または、 配列番号 38 に記載のアミノ酸配列からなるタンパク質、 または当該アミノ酸配列において、
1若しくは数個のアミノ酸残基の置換、 欠失、 揷入、 付加、 若しくは逆位を含む ァミノ酸配列からなり、 かつ I A P様活性を有するタンパク質をコードし得るも のであれば、 如何なるものであってもよい。 具体的には、 該アミノ酸配列をコー ドする翻訳領域のみでも、 あるいはその c DNAの全長を含むものでもよい。 具体的には、 c DNAの全長を含む DNAとしては、例えば配列番号 1〜13、
35、 または 37に記載の塩基配列からなる DNA等が挙げられる。 また、 その 翻訳領域としては、 配列番号 1の塩基番号 134〜 1690、 配列番号 2の塩基 番号 1 751〜 21 97、 配列番号 3の塩基番号 662〜 3259、 配列番号 4 の塩基番号 6 6 1〜 1476、 配列番号 5の塩基番号 2 1 3〜 1 703、 配列番 号 6の塩基番号 1 2 2〜 1 6 1 2、 配列番号 7の塩基番号 1 56〜 560、 配列 番号 8の塩基番号 1 4 9〜 1 5 9 1、 配列番号 9の塩基番号 5 9 7〜 1 98 2、 配列番号 1 0の塩基番号 230〜 90 7、 配列番号 1 1の塩基番号 56 6〜 1 2 28、 配列番号 1 2の塩基番号 48 7〜 2 1 27、 配列番号 1 3の塩基番号 1 6 7〜 2 9 50、 配列番号 3 5の塩基番号 1〜 2 904、 配列番号 3 7の塩基番号 89〜: L1 3 8に示される配列を有するものが挙げられる。 さらに上記の c DN Aの全長でなくても、 上記翻訳領域とその 3 ' 及び/または 5' 端に隣接する、 翻訳領域の発現に最低限必要な部分を含むもの等も本発明の DN Aに含まれる。 本発明の DN Aは、 これを取得できる方法であれば如何なる方法により取得し たものでもよいが、 具体的には、 例えば、 下述の方法により取得することができ る。 まず、 適当な動物、 好ましくは哺乳動物の組織等からそれ自体既知の通常用 いられる方法により mRNAを調製する。 次に、 この mRNAを铸型として c D NAを合成するが、このとき完全長の cDNAを合成するために 5 'キャップ(7Me GpppN) サイトに特異的なジオール構造にタグになる分子を化学結合させ、 この mRNAを铸型として o l i g o d Tをプライマーとして逆転写した後に、 タ グ分子の機能を利用して完全長の c DNAのみを分離する方法 (特開平 9一 24 8 1 8 7号公報;特開平 1 0— 1 2729 1号公報) を用いることが好ましい。 また、 逆転写の際には、 铸型が高次構造を形成して逆転写の効率が低下すること を阻止するために、 トレハロース等の存在下で、 耐熱性逆転写酵素を用いて高温 下で逆転写を行う方法(特開平 1 0— 849 6 1号公報)を用いるのが好ましい。 ここで、 高温下とは 40〜80°Cを意味する。
このようにして取得された c DNAは、 これを適当なクローニングベクターに 挿入してクローニングを行う。 ここで用いられるベクターとしては、 様々な鎖長 の DNAを一律にクローニングすることが可能な、 クローユングサイトの両末端 にリコンビナーゼ認識配列を有し、 感染以外の方法で宿主に挿入される直鎖状の ベクター (特開平 1 1一 9 2 73号公報) が好ましく用いられる。 かくして得ら れる c DNAライブラリ一は、 全てのクローンが均一に存在している (以下、 こ れを 「カタログ化されている」 と称することがある) 訳ではなく、 このライブラ リー中に極微量にしか存在しないクローンこそ新規である確率が高い。 そこで、 このようなクローンを濃縮するためのサブトラクション法ゃノーマライゼーショ ン法 (特開 2000— 325080号公報; Carninci, P. et al. , Genomics, 37, 327-336(1996)) を用いることが好ましい。
カタログ化された c DNAライブラリ一は、 それ自体既知の通常用いられる方 法により塩基配列の解析を行う。 本発明の DNAは、 cDNA全長の場合にはそ の末端 100ベースの配列について得られた塩基配列を NCB Iの Ge nB a n k、 EMBL、 DDB J、 P D B等のデータベースについて B L A S T
(http://www.ncbi.nlm.nih.gov/BLAST/; National Center of Biotechnology Information)を用いて検索し、最も高い相同性を示す配列でも相同性が 30%以 下であり、 かつ該 DN Aの翻訳領域の全長について最も高い相同性を示す配列で もその相同性が 40%以下であるものを新規として以下の解析に供することとし た。
このような完全長 c D N Aの塩基配列を有する D N Aとしては、 例えば、 配列 番号 1〜1 3、 35、 または 37に記載の塩基配列を有するものが挙げられる。 また、 その翻訳領域としては、 配列番号 1の塩基番号 134〜 1690、 配列番 号 2の塩基番号 1 751〜 2197、 配列番号 3の塩基番号 662〜 3259、 配列番号 4の塩基番号 66 1〜 1476、 配列番号 5の塩基番号 213〜 1 70 3、 配列番号 6の塩基番号 1 22〜 161 2、 配列番号 7の塩基番号 156〜 5 60、 配列番号 8の塩基番号 149〜 1591、 配列番号 9の塩基番号 597〜 1982、 配列番号 10の塩基番号 230〜 907、 配列番号 1 1の塩基番号 5 66〜 1228、 配列番号 1 2の塩基番号 487〜2127、 配列番号 1 3の塩 基番号 16 7〜 2950、 配列番号 35の塩基番号 1〜 2904、 配列番号 37 の塩基番号 89〜1 1 38に示される配列に示される配列を有するものが挙げら れる。 かくして取得された新規な塩基配列を、 BLAST (Basic local alignment search tool; Altschul, S. F. , et al. , J. Mol. Biol. , 215, 403 - 410 (1990)) に よる相同性検索 (homology search)や、 HMME R (隠れ Markovモデルによる配列 解析手法; Eddy, S. R., Bioinfo進 tics 14, 755-763 (1998)) の機能群のひと つである HMMPFAMによるタンパク質特徴検索 (profile search: http: //pfam. wustl. edu)等を行うことにより、 該塩基配列がコードするタンパク 質の機能を推定することができる。
B LAS Tによる相同性検索においては、 検索の結果得られた相同性が十分有 意なヒット配列に付随する種々のァノテーシヨン情報から、 解析対象としている クローンの機能を推定することができる。 ここで、 十分有意なヒット配列とは、 登録されている配列の触媒ドメイン部分と本発明の D N Aのこれに対応する部分 との i d e n t i t yが e— v a l u eとして 10— 4以下のものか、 あるいは 3 0%以上のものを示す。
例えば、 上位にヒットした触媒ドメイン配列の多くが D N A結合タンパク質と しての機能を確認されたものであるならば、 それと配列上類似である解析対象ク ローンもまた同じ機能、 即ち、 DNA結合活性を持つであろうという予測が成り 立つ。
また、 例えば、 上位にヒットした触媒ドメィン配列の多くが I AP様活性を有 するタンパク質としての機能を確認されたものであるならば、 それと配列上類似 である解析対象クローンもまた同じ機能、 即ち、 I AP様活性を持つであろうと いう予測が成り立つ。
HMMPFAMでは、 P i a mというタンパク質プロファイルを集積したデー タベース中にあるェントリ一が有する塩基配列の特徴を、 解析対象である塩基配 列が有するかどうかを洗い出す方法による解析が行われる。 プロフアイルは一連 の同一特徴を持つタンパク質群から抽出されており、 一配列対一配列の全長に亘 る比較では明確化できない機能でも、 配列中にその特徴領域があればこれを見出 し、 機能予測ができる。 力 くして行われるタンパク質の機能予測の具体的な例と して以下に説明する。
(1-1) DNA結合活性を有するタンパク質
配列番号 1に記載の塩基配列がコードするァミノ酸配列は、 B L A S Tサーチ により、 RIKEN full-length enriched library, clone :9530049C15, SCAN domain containing protein と、 e— v a 1 u e : 5X10— 171、 100%の相同性を、 また Zinc finger protein 192 (LD5 - 1)は、 SCAN box domain ¾r ¾ OKrup el gene familyで あるが、 e— v a 1 u e : 2X10— 94、 42%の相同性を、 さらに Homo sapiens zinc finger protein (ZFP)と、 e— v a 1 u e : 4X10— 93、 41%の相同性を有する。 こ れらの結果より、 配列番号 1に記載の塩基配列がコードするタンパク質は Zinc finger proteinであることが推測できる。
また、 配列番号 1に示す塩基配列がコードするァミノ酸配列には、 HMM P F AMによる蛋白質特徴検索を行うと、 ZF-C2H2の特徴を示す配列 (P f a mに LIM としてエントリーされる塩基配列) が 7回見出される。
これらのことから、 配列番号 1に示す塩基配列がコードするタンパク質は zinc finger型の転写因子であることが推測できる。
配列番号 2に記載の塩基配列がコードするァミノ酸配列は、 B L A S Tサーチ により、 RIKEN cDNA 2810411K16と、 e— v a 1 u e : 2X10— 76、 139アミノ酸にわ たって 100%の相同性を、 RIKEN full-length enriched library,
clone :2810411K16: SCAN domain containing proteinと、 e - v a 1 u e :6X10一76、 139アミノ酸にわたって 99%の相同性を、 Homo sapiens cDNA FLJ14478 fis, clone MAMMA1001633と、 e— v a 1 u e : 1X10— 61、 140アミノ酸にわたって 86°/。の相同性 を有する。
また、 HMMPF AMによる蛋白質特徴検索により塩基番号 1880〜2167に SCAN 配列が見出され、 これらのことから、 配列番号 2に示す塩基配列がコードするタ ンパク質は DNA結合蛋白質であることが推測できる。
配列番号 3に記載の塩基配列がコードするァミノ酸配列は、 BLASTサーチ により、 Homo sapiens, clone MGC: 13310 IMAGE :4110431と、 e— v a 1 u e : 5 X10一145、 919アミノ酸にわたって 40%の相同性を、 また、 Zinc finger protein 180 (HHZ168)と、 e— v a 1 u e : 2Χ1(Γ63、 231アミノ酸にわたって 51%の相同性を、 さらに、 Rattus norvegicus Cys2/His2 zinc finger protein (rKrl)と、 e— v a 1 u e : 6X10— 63、 192アミノ酸にわたって 56%の相同性を有する。
また、 HMMPFAMによる蛋白質特徴検索により塩基番号 786〜3275に zf - C2H2が 6箇所見出され、この特徴から、配列番号 3に記載の塩基配列がコード するタンパク質は DNA結合蛋白質であることが推測できる。
配列番号 4に記載の塩基配列がコードするアミノ酸配列は、 B LAS Tサーチ により、 Macaca fascicularis brain cDNA, clone :QccE— 18103.と、 e— v a 丄 u e :2X10—95、 220アミノ酸にわたって 79%の相同性を、 また Homo sapiens putative transcription factor CR53と、 e— v a 1 u e : 1Χ10-32、 56%の相同生を、 さら こ、 Homo sapiens, t milar to zinc finger protein 202, clone MGし ·156Ο0 IMAGE: 3347511と、 e— v a 1 u e : 1X10— 32、 134アミノ酸にわたって 56%の相同 性を有する。
また、 配列番号 4に示す塩基配列がコードするアミノ酸配列について HMMP FAMによる蛋白質特徴検索を行うと、 SCAN配列 (P f a mに SCA としてェント リーされる塩基配列) が見出される。
これらのこと力ゝら、 配列番号 4に示す塩基配列がコードするタンパク質は転写 因子であることが推測できる。
配列番号 5に記載の塩基配列がコードするアミノ酸配列は、 B LAS Tサーチ により、 Mus musculus, zinc finger proliferation 1と、 e— v a 1 u e : 6 X 10- 97、 491アミノ酸にわたって 41%の相同性を、 mouse Zinc finger protein 38 (Zfp-38) (CtFIN51) (Transcription factor RU49)と、 e— v a 1 u e :2X10— 96、 491アミノ酸にわたって 41°/。の相同性を、 さらに、 Hypothetical zinc finger protein KIM0426と、 e— v a 1 u e : 2X10— 95、 532アミノ酸にわたって 44%の相 同性を有する。
また、 HMMPFAMによる蛋白質特徴検索により、 塩基番号 929〜; 1585に zf - C2H2が 8回見出され、 これらの特徴から、 配列番号 5に記載の塩基配列がコー ドするタンパク質が DNA結合蛋白質であることが推測できる。
配列番号 6に記載の塩基配列がコードするァミノ酸配列は、 B L A S Tサーチ により、 Mus musculus, zinc linger proliferation 1, clone MGC-' 18498 IMAGE: 3981599と、 e— v a 1 u e : 6X10-97、 491アミノ酸にわたって 41%の相同 性を、 また、 mouse Zinc finger protein 38 (Zfp-38) (CtFIN5l) (Transcription factor RU49)と、 e— v a 1 u e : 2X10— 96、 491ァミノ酸にわたって 41%の相同性 を、 さらに、 Hypothetical zinc finger protein KIAA0426 b Λ e— v a 1 u e : 2X10— 、 532アミノ酸にわたって 44%の相同性を有する。
また、 HMMP FAMによる蛋白質特徴検索により塩基番号 929〜1585に zf - C2H2が 8回見出され、 この特徴から、 配列番号 6に記載の塩基配列がコードす るタンパク質が DNA結合蛋白質であることが推測できる。
配列番号 7に記載の塩基配列がコードするアミノ酸配列は、 B L A S Tサーチ 【こより、 STATc transcriptional repressorと、 e— v a l u e : 4 X 10_28で、 127アミノ酸にわたって 53%の相同性を、 また、 forkhead- related transcription factor 2と、 e— v a l u e : 4 X 10— 23で、 109アミノ酸に わたって 58%の相同性を、 さらに、 Transcription regulatory protein SNF5 と、 e— v a 1 u e : 2 X 10_24で、 1 18アミノ酸にわたって 61 %の相同性 を有する。
上記 STATc transcriptional repressorは、 データベース中の文献情幸 g (Mol. Cell, 7(4), 779-88(2001)) から、 初期の発生速度と末端分化のタイミングの制 御に関ること、 および、 ecmA遺伝子の発現を制御するリブレッサーとして機能す ること力 ¾、 また forkhead— related transcription factor 2は、 テータベース中の 文献情報 (J. Biol. Chem. 1998, 273 (36) :23335- 43) から肺おょぴ胎盤に発現 されている転写因子でいくつかの肺特異的遺伝子の cis因子に結合すること力 さ らに Transcription regulatory protein SNF5は、データベース中の文献情報(Mol. Cell. Biol. , 1990, 10 (11): 5616-25) からグルコースおよびリン酸により制御 される遺伝子の転写制御に関わることがそれぞれわかる。
これらの特徴より、 配列番号 7に記載の塩基配列がコードするタンパク質は転 写因子であると推測できる。
配列番号 8に記載の塩基配列がコードするアミノ酸配列は、 B LAS Tサーチ により、 zinc finger protein 151 (pHZ-67)と、 e— v a l u e : 1 X 10— 25で、 また 121アミノ酸にわたって 48%の相同性を、また、 Myc- interacting zinc finger proteinと、 e— v a l u e : 2 X l O—25で、 121アミノ酸にわたって 48%の相同 性を有する。 これらの結果より、 配列番号 8に記載の塩基配列がコードするアミ ノ酸配列からなるタンパク質は Zinc finger型 DNA結合蛋白質であることが推測で きる。
ま 7こ、 上 dMyc— interacting zinc finger proteinタン/ ク質は、 データべース 中の文献情報 (Curr Top Microbiol Immunol 1997; 224: 137-46) から、
Myc-interacting zinc finger proteinであること力 S知られてレヽる。
また、 HMMPF AMによる蛋白質特徴検索により、 配列番号 8に記載の塩基 配列がコードするアミノ酸配列中に蛋白質ニ量ィ匕に関わる特徴を示す配列(P f amに BTBとしてエントリーされるアミノ酸配列) が見出される。 また、 Zinc finger domain (P f a mに zf- C2H2としてェントリーされるアミノ酸配列)も 1ケ 所見出される。
これらの特徴から、 配列番号 8に示す塩基配列がコードするタンパク質は Zinc finger型 DNA結合蛋白質であることが推測できる。
配列番号 9に記載の塩基配列がコードするァミノ酸配列は、 BLASTサーチ により、 Hypothetical zinc finger protein KI 1473と、 e— v a 1 u e : I X 1 (Γ59で、 295アミノ酸にわたって 37%の相同性を、また、 Zinc finger protein 135 と、 e— v a 1 u e : 2 X 10— 58で、 277アミノ酸にわたって 39%の相同性を有し ている。 これらの結果より、 配列番号 9に記載の塩基配列がコードするアミノ酸 配列からなるタンパク質は Zinc finger型 DNA結合蛋白質であることが推測できる。 また、 上記 Zinc finger protein 135タンパク質は、 データベース中の文献情報 (Genomics 1995 May 20 ;27 (2) :259 - 64) 力 ら、 zinc finger Kruppel familyであ ることが明らかとなっており、 発達障害などに関わることが分かる。
また、 HMMPF AMによる蛋白質特徴検索により、 配列番号 9に記載の塩基 配列がコードするアミノ酸配列中に Zinc finger domain (P f a mに zf - C2H2とし てエントリーされる配列)が 9ケ所で見出される。
これらの特徴から、 配列番号 9に示す塩基配列がコードするタンパク質は Zinc finger型 DNA結合蛋白質であることが推測できる。
配列番号 10に記載の塩基配列がコ一ドするァミノ酸配列は、 B L A S Tサー チの結果、 PR- domain zinc finger protein 5と、 e— v a l u e : 3 X 10— 13 で、 また 62アミノ酸にわたって 50%の相同'性を、 また、 zinc finger protein with interaction domainと、 e— v a l u e : 2X 10-12で、 81アミノ酸にわたって 43%の相同性を有している。 これらの結果より、 配列番号 10に記載の塩基配列 がコードするアミノ酸配列からなるタンパク質は Zinc finger型 DNA結合蛋白質で あることが推測できる。
ま,こ、 上目己 zinc finger protein with interaction domainタンハク貧は、 テー タベース中の文献情報 (Genes Dev 1994 Jul 15; 8 (14) :1664-77)から、 zinc finger protein with interaction domainであることが分力る。
また、 HMMPF AMによる蛋白質特徴検索により、 配列番号 10に記載の塩 基配列がコードするアミノ酸配列中に Zinc finger domain (P f amに zf_C2H2 としてエントリーされる配列)が 2ケ所で見出される。
これらの特徴から、 配列番号 10に示す塩基配列がコードするタンパク質は Zinc finger型 DNA結合蛋白質であることが推測できる。
配列番号 1 1に記載の塩基配列がコードするァミノ酸配列は、 B L A S Tサー チにより、 PR— domain zinc finger protein 5と、 e— v a l u e : 4X 10一13 で、 また 62アミノ酸にわたって 50%の相同性を、 また、 zinc finger protein with interaction domainと、 e— v a 1 u e : 3 X 10— 11で、 81アミノ酸にわたって 41%の相同性を有している。 これらの結果より、 配列番号 1 1に記載の塩基配列 がコードするァミノ酸配列からなるタンパク質は Zinc finger型 DNA結合蛋白質で あることが推測できる。
また、 HMMPF AMによる蛋白質特徴検索を行うと、 配列番号 1 1に記載の 塩基配列がコードするアミノ酸配列中に Zinc finger domain (P f a mに zf- C2H2 としてエントリーされる配列)が 2ケ所で見出される。
これらの特徴から、 配列番号 1 1に示す塩基配列がコードするタンパク質は Zinc finger型 DNA結合蛋白質であることが推測できる。
配列番号 1 2に記載の塩基配列がコードするァミノ酸配列は、 B L A S Tサー テにより、 Mus mus cuius zinc finger transcription factor Kaisoと、 e— v a 1 u e : 2 X 10— 27で、 また 94アミノ酸にわたって 58%の相同性を、 また、 Xenopus laevis BTB/POZ zinc finger transcription factor XKaiso力、 e― v a l u e : 2 X 10— 29で、 1 36アミノ酸にわたって 48%の相同性を有して いる。
また、 HMMPF AMによる蛋白質特徴検索により、 配列番号 12に記載の塩 基配列がコードするアミノ酸配列に、 BTB (for BR-C, ttk and bab) or POZ (for Pox virus and Zinc finger)ドメインの特徴を示す配列 (P f a mに BTBとしてェ ントリーされるアミノ酸配列) 、 Msx- interacting - zinc fingerの特徴を示す配列 (P f amに zf - MIZとしてエントリーされるアミノ酸配列) 、 Zinc finger, C2H2 typeの特徴を示す配列 (P f a mに zf- C2H2としてェントリーされるアミノ酸配 列) が見い出される。
これらの特徴より、 配列番号 12に示す塩基配列がコードするタンパク質は zinc fingerを持った Kaiso様の転写因子であることが推測できる。
配列番号 1 3に記載の塩基配列がコードするアミノ酸配列は、 BLASTサー テ【こより、 Xenopus 丄 aevis DNA-methylation dependent transcriptional repressor Kaiso— like protein (Kaiso)と、 e— v a l u e : 4X 10_32で、 1 37ァミノ酸にわたって 48 %の相同性を、また、 Xenopus laevis BTB/POZ zinc finger transcription factor XKaisoと、 e— v a l u e : 4 X 1 O-32で、 13 7アミノ酸にわたって 48%の相同性を有する。
また、 HMMPF AMによる蛋白質特徴検索により、 配列番号 13に記載の塩 基配列がコードするアミノ酸配列に BTB (BR-C, ttk and bab) or POZ (Pox virus and Zinc finger)ドメインの特徴を示す配列 (P f a mに BTBとしてェントリーさ れるアミノ酸配列) 、 Msx- interacting- zinc fingerの特徴を示す配列 (P f am に zf - MIZとしてエントリーされるアミノ酸配列) 、 Zinc finger, C2H2 typeの特 徴を示す配列(P f amに zf_C2H2としてエントリーされるアミノ酸配列)が見出 される。
これらの特徴より、 配列番号 13に示す塩基配列は zinc fingerを持った Kaiso 様の転写因子遺伝子配列の一部分であることが推測できる。
(1— 2) I AP様活性を有するタンパク質
配列番号 37に記載の塩基配列がコードするァミノ酸配列は BLASTサーチ により Interferon- activatable protein 203と、 e— v a l u e : 7X 10— 67で、 348アミノ酸にわたって 43%の相同性を、 また Myeloid cell nuclear
differentiation antigenと、 e - v 1 u e : 1 X 10—38で、 また 355アミノ酸 【こわたつて 330/oのネ目同†生を、さら ίこ、 Gamma— interferon— inducible protein Ifi— 16 と、 e— v a l u e : 6 X l 0一39で、 351アミノ酸にわたって 33%の相同性を有す る。 これらの結果より配列番号 37に記載の塩基配列がコードするアミノ酸配列 からなるタンパク質はィンターフェロンによつて発現誘導され核内に存在するこ とが推測できる。
また、 上記 Interferon- activatable protein 203タンパク質 (I AP様活性を 有するタンパク質) は IFN- inducible proteins Γ200- family")の一つであり、 マ ウス (IFI202a, IFI202b, IFI203, IFI204 and D3)およぴヒト(MNM, IFI- 16及び AIM2) で構造上類似しているのみならず、 核内に存在すること、 並びに IFI202の 遺伝子産物 P202は転写因子 NF- /cB、 c-Fos、 及び c-Junに結合し転写を抑制するこ とが (Mol. Cell. Biol. 16, (1996) 359 - 368) 、 上記 Myeloid cell nuclear differentiation antigenタンパク質は、 データベース中の文献情報
(Immunogenetics 41: 40-43 (1995) ) から骨髄系での転写の調節に関わること力 た上言己 Gamma— interferon— inducible protein If i— 16タンノヽク質は、 ァータベー ス中の文献情報(Biochemistry 37: 11924-11931 (1998) ) から転写の抑制に関わる ことがそれぞれわかる。
また、 配列番号 3 7に示す塩基配列がコードするァミノ酸配列について、 HM MP F AMによる蛋白質特徴検索を行うと、 タンパク質相互作用を行う分子の特 徴を示す配列 (P f a mに PMD#DAPINとしてエントリーされる塩基配列) が見出 される。
これらのことから、 配列番号 3 7に示す塩基配列がコードするタンパク質は I A P様活性を有するタンパク質であり、インターフェロンによって発現誘導され、 タンパク質相互作用を介して転写因子の働きを修飾する機能を有する転写制御因 子であることが推測できる。
本明細書で言う I A P様活性を有するタンパク質とは、 より具体的には、 イン ターフェロンによつて発現誘導され、 タンパク質相互作用を介して転写因子の働 きを修飾する機能を有する転写制御因子を言う。 かくして取得され、 塩基配列が決定され、 また機能が推定される本発明の D N Aは上記の配列番号 1〜1 3、 3 5、 または 3 7に記載の塩基配列、 あるいはそ の翻訳領域として上記に示した塩基配列を有するものだけでなく、 これらの塩基 配列において、 1若しくは数個 (ここで言う数個の数は特には限定されないが、 例えば 6 0個以下、 好ましく 3 0個以下、 より好ましくは 2 0個以下、 さらに好 ましくは 1 0個以下、 特に好ましくは 5個以下を意味する。 ) の塩基が欠失、 置 換及ぴ Zまたは付加された塩基配列を有し、 かつ D N A結合活性を有するタンパ ク質または I A P様活性を有するタンパク質をコードする D NA、 並びに、 これ らとストリンジェントな条件下でハイプリダイズし、 かつ D N A結合 ¾性を有す るタンパク質または I A P様活性を有するタンパク質をコードする D N A等も含 まれる。 これら D NAには前記したとおり、 配列番号 1 4〜2 6、 3 6、 または 3 8に記載のタンパク質のアミノ酸配列において 1若しくは数個のアミノ酸配列 が欠失、 置換及び/または付カ卩されたアミノ酸配列からなり、 かつ D NA結合活 性を有するタンパク質または I A P様活性を有するタンパク質をコードするもの が含まれる。
ここで、 ス トリンジェントな条件でハイブリダイズする D N Aとは、 配列番号 1 - 1 3 , 3 5、 または 3 7に示される塩基配列またはその相補配列と B L A S T解析で 8 0 %以上、 好ましくは 9 0 %以上、 さらに好ましくは 9 5 %以上の相 同性を有する塩基配列を含む D N A等が挙げられる。 また、 ストリンジェントな 条件下のハイブリダイゼーシヨンとは、 通常のハイブリダイゼーション緩衝液中 で、 温度が 4 0〜 7 0で、 好ましくは 6 0〜6 5 °C等で反応を行い、 塩濃度が 1 5 mM〜 3 0 0 mM、 好ましくは 1 5 mM〜 6 0 mM等の洗浄液中で洗浄を行う 方法に従って行うことができる。
さらに、 本発明の D NAは、 上述の方法により取得されたものでも、 また合成 されたものでもよい。 D N Aの塩基配列の置換は、 例えばサイトダイレクテッド ミュータジエネシスキット (宝酒造社製) や、 クイックチェンジサイトダイレク テッドミュータジエネシスキット (ストラタジーン社製) 等の巿販キットで容易 に行うことができる。
また、 配列番号 1〜1 3または 3 7に記載の塩基配列は、 マウスを由来とする ものであるが、 上記した cDNAライブラリーの作製法に従ってヒトの cDNAライブラ リ一を作製し、 該ライブラリ一に対して配列番号 1〜 1 3または 3 7の塩基配列 を有する DNA断片をプローブとしたハイブリダィゼーションを行うことにより、配 列番号 1〜1 3または 3 7に記載の塩基配列がコードするタンパク質のヒ トのホ モログタンパク質をコ一ドする DNAを取得することもできる。本発明の配列番号 1 〜 1 3または 3 7に記載の塩基配列またはその相補配列を有する DNAとストリン ジェントな条件でハイブリダイズする DNAには、このようなヒトのホモログをコー ドする DNAも含まれる。 また、 インフォマティックスを利用して、 ヒトホモログ DNAが有する塩基配 列を予測し、 該塩基配列を基に上記のヒト c DNAライブラリーなどからヒトホ モログ DN Aを取得することもできる。
一般的に、 インフォマティックスを利用して目的とするタンパク質のホモログ タンパク質をコードする塩基配列を予測する方法としては、 例えば、 (i ) 目的 とする c DNAの塩基配列をクエリーとして、ヒト等の c DNAデータベース(ィ ンフォマティックスにより予測される c DNAデータベースを含む) に対し B L ASTなどを用いて相同性検索を行う方法や、 ( i i ) 目的とする c DNAの塩 基配列をクエリーとして、 ヒト等の E STデータベースに対し B LASTなどを 用いて相同性検索を行い、 ヒッ トした ESTが有する配列を目的とする c DNA の塩基配列を参照して連結する方法、 さらに (i i i ) 目的とする c DNAの塩 基配列をクエリーとして、 ヒトなどのゲノムデータベースに対し B LASTなど を用いて相同性検索を行い、 目的とする c DNAの遺伝子が存在するゲノム上の 位置を特定し、 そのゲノム領域に対して Ge n s c a n (http:// genes.
mit.edu/GENSCAN.html) や S i m4 (Genome Res., 8: 976-74 (1998)) 等を 用いて、 該ゲノム中の遺伝子部分の塩基配列を予測する方法等が挙げられる。 マウス由来の c DNAのヒトホモログ DNAの塩基配列を予測する場合、 上記 の方法のいずれも用いることができるが、 本発明の配列番号 1〜1 3または 3 7 に記載の塩基配列を有する c DN Aはいずれも新規であり、上記 (i)の方法では、 ヒトホモログ DN Aの塩基配列を取得できないと考えられるため、 (ii) あるい は (iii) に記載の方法などが好ましく用いられる。
かくして予測されたヒトホモログ DN Aの塩基配列を基に、 上記のヒト cDN Aライブラリーから、 配列番号 1〜 1 3または 3 7に記載の塩基配列がコ一ドす るタンパク質のヒトのホモログタンパク質をコードする DN Aを取得することも できる。 具体的な取得方法としては、 例えば、 予測されたヒ トホモログ DNAの 5, 端、 および 3' 端の塩基配列に相補的な塩基配列を有するプライマーを用い て、 上記ヒ ト c DNAライブラリーを鏡型として PCRを行う方法や、 予測され たヒトホモログ DNAの一部の配列をプローブとして、 上記ヒト cDNAライプ ラリーに対してハイブリダイゼーションを行う方法等が挙げられる。
一般的に、 目的遺伝子が有する塩基配列とホモロジ一の高い塩基配列を有する 類似遺伝子を 「ホモログ」 と呼ぴ、 上記の方法においてもヒトホモログの取得を 目的としているが、 遺伝子の機能解析においては、 塩基配列が類似していること だけではなく、 ホモログとして取得された遺伝子が、 目的遺伝子のフアミリーメ ンバーであることを確認することが重要である。 2種類の生物間で 「ホモログ」 として取得された遺伝子は、 共通の祖先遺伝子から進化した同一の遺伝子である
「オルソログ」 である可能性と、 また、 共通の祖先遺伝子からの重複によって生 じた異なる遺伝子である 「パラログ」 である可能性がある。
つまり、 上記でホモログとして取得されたヒト由来の DNAは、 これを、 本発 明のタンパク質と同一の機能を有すると解するには、 また、 該ヒト由来の DNA がコードするタンパク質の機能を、 本発明のタンパク質のマウスにおける機能と して推定検証するには、 上記ヒトホモログが本発明のマウス遺伝子の近縁種のォ ルソ口グであることを確認することが好ましい。
オルソログであることの確認方法は、 例えば、 以下の方法などが用いられる。
(1) まず、 本発明の c DN Aの塩基配列と、 取得されたヒトホモログ DNAの 塩基配列について相同性を解析する。 次に、 本発明の c DNAの塩基配列をタエ リーとして、 DDB J、 EMBL、 G e n B a n kなどの国際塩基配列データべ ースや、 特許データベースに含まれるヒト塩基配列について相同性検索を行い、 取得されたヒ トホモログ DNAとクエリーの塩基配列の一致度が、 データベース から得られた塩基配列とクエリ一の塩基配列の一致度より高いことを確認する。 さらに、 (2) 取得されたヒトホモログ DNAの塩基配列と、 対応する本発明の cDNAの塩基配列について相同性を解析する。 次に、 取得されたヒ トホモログ DN Aの塩基配列をクエリーとして、 DDB J、 EMBL、 Ge nB a nkなど の国際塩基配列データベースや、 特許データベースに含まれるマウス塩基配列に ついて相同性検索を行い、 本発明の cDNAとクエリ一の塩基配列の一致度が、 データベースから得られた塩基配列とクエリ一の塩基配列との一致度より高いこ とを確認する。 上記 (1) および (2) を確認することにより、 取得されたヒト ホモログが、 本発明の c DNAに対応するヒトオルソログであると同定すること ができる。 上記 (1) および (2) に記載した相同性の解析はアミノ酸配列の 比較を用いても良く、 また、 分子進化系統樹を描いて検討することも できる。 また、 上記 ( 1 ) および ( 2 ) に記載した相同性解析による 一致度は、 クエリ一の全長にわたる一致度と して解析することが好ま しい。
かくして取得されたヒトホモログ DNA、 あるいはオルソログ DNAの塩基配 列を、 B LAS Tによる相同性検索や HMMPF AMによる蛋白質特徴検索等を 行うことにより、 該塩基配列がコードするタンパク質の機能を推定および確認す ることができる。 本発明の c DNAのヒトオルソログとして、 例えば配列番号 3 5に記載の塩基配列を有する DN Aが挙げられ、 また本発明のタンパク質のヒト オルソログタンパク質として、 配列番号 36に記載のァミノ酸配列を有するタン パク質等が挙げられる。
本発明の配列番号 1〜 13または 37に記載の塩基配列またはその相補配列を 有する DNAとストリンジェントな条件でハイブリダィズする DN Aには、 この ようなヒトホモログ、 あるいはオルソログタンパク質をコードする DNAも含ま れる。
(2) 新規 c DNAがコードするタンパク質
本発明の DNAがコードするタンパク質の翻訳領域は、 例えば、 該 DNAが有 する塩基配列について 3種類の読み枠によりアミノ酸に変換していき、 最も長い ポリべプチドをコ一ドする範囲を本発明の翻訳領域としてそのアミノ酸配列を決 定すること等ができる。 このようなアミノ酸配列として例えば、 配列番号 14〜 26、 36、 または 38に記載のもの等が挙げられる。 また、 本発明のタンパク 質は、 上記のアミノ酸配列に限られるものではなく、 配列番号 1 4〜2 6または 3 6に記載のアミノ酸配列において 1若しくは数個のアミノ酸が置換、 欠失、 及 び/または付加されたァミノ酸配列からなり、 かつ D N A結合活性を有するタン パク質、 及ぴ、 配列番号 3 8に記載のアミノ酸配列において 1若しくは数個 ァ ミノ酸が置換、 欠失、 及び Zまたは付加されたアミノ酸配列からなり、 かつ I A P様活性を有するタンパク質も含まれる。
本発明のタンパク質の取得方法としては、 上記 (1 ) に記載の本発明の D NA を適当な方法により転写 Z翻訳する方法が好ましく用いられる。 具体的には、 適 当な発現用ベクター若しくは適当なベクターに適当なプロモーターとともに挿入 した組換えベクターを作製し、 この組換えベクターで適当な宿主微生物を形質転 換したり、 適当な培養細胞に導入することにより発現させ、 これを精製すること により取得することができる。
かくして得られるタンパク質が遊離体で得られた場合には、 公知の方法あるい はそれに準じる方法によつて塩に変換することができ、 逆に塩で得られた場合に は遊離体、 又は他の塩に変換することができる。 この様な本発明のタンパク質の 塩も本発明のタンパク質に含まれる。 また、 上記形質転換体が産生するタンパク 質を、 精製前、 又は後に適当なタンパク質修飾酵素を作用させることにより、 任 意に修飾を加えたり、 ポリぺプチドを部分的に除去することにより修飾タンパク 質とすることができる。 これらの修飾タンパク質も上記した D N A結合活性また は I A P様活性を有するものであれば本発明の範囲に含まれる。
本発明のタンパク質の産生を行う際、 本発明の D N Aを含む組換えべクタ一の 作製に用いるベクターとしては、 形質転換体内で該 D NAが発現されるものであ れば特に制限はなく、プラスミドベクター、ファージベクターのレ、ずれでもよい。 これらのうち通常は、 該 D N Aが導入される宿主に適したプロモーター等の発現 制御領域 D N Aが既に挿入されている巿販のタンパク質発現用ベクターを用いる。 このようなタンパク質発現用ベクターとして、 具体的には例えば、 宿主が大腸菌 の場合では、 p E T 3、 p E T 1 1 (ストラタジーン社製) 、 G E X (アマシ 'バイオテク社製) 等が挙げられ、 酵母の場合では pES P— I エクスプレッションベクター (ストラタジーン社製) 等が挙げられ、 さらに昆虫 細胞の場合では B a c PAK6 (クロンテック社製) 等が用いられる。 また宿主 が動物細胞の場合では、 ZAP Ex p r e s s (ストラタジーン社製) 、 S VK3 (アマシャムフアルマシアバイオテク社製) 等が挙げられる。
発現制御領域が挿入されていないベクターを用いる場合には、 発現制御領域と して少なくともプロモーターを挿入する必要がある。 ここでプロモーターとして は、 宿主微生物、 または培養細胞が保有するプロモーターを用いることができる が、 これに限られるものではなく、 具体的には例えば、 宿主が大腸菌の場合には T3、 T 7、 t a c、 1 a cプロモーター等を用いることができ、 酵母の場合に は nmt 1プロモーター、 Ga 1 1プロモーター等を用いることができる。 また 宿主が動物細胞の場合には SV 40プロモーター、 CMVプロモーター等が好ま しく用いられる。
また哺乳動物由来のプロモーターが機能可能な宿主を用いる場合には、 本発明 の遺伝子に固有のプロモーターを用いることもできる。 これらのベクターへの本 発明の DNAの挿入は、 該 DNAまたはこれを含む DNA断片をベクター中のプ 口モーターの下流に該遺伝子 DNAがコードするタンパク質のアミノ酸配列を連 結して行えばよレ、。
このようにして作製した組換えベクターは、 それ自体既知の方法により後述す る宿主を形質転換して、 DN A導入体を作製することができる。 宿主への該べク ターの導入方法として、 具体的には、 ヒートショック法 (J. Mol. Biol.,53, 154, (1970)) 、 リン酸カルシウム法 (Science, 221, 551, (1983)) 、 DEAEデキスト ラン法(Science, 215, 166, (1982))、インビトロパッケージング法(Proc. Natl. Acad. Sci. USA, 72,581,(1975)) 、 ウィルスベクター法 (Cell, 37, 1053, (1984)) 、 およ ぴ電気パルス法 (Chu. et al. , Nuc. Acids Res., 15, 1331 (1987) ) 等が挙げられる。
DNA導入体を作製するための宿主としては、 本発明の DN Aが体内で発現す るものであれば特に限定されないが、例えば大腸菌、酵母、パキュロウィルス(節 足動物多角体ウィルス) 一昆虫細胞、 あるいは動物細胞等が挙げられる。 具体的 には、 大腸菌では BL 21、 L-2B 1 u e (ストラタジーン社製) 等、 酵母 では S P— Q01 (ストラタジーン社製) 等、 パキュロウィルスでは A c NPV (J. Biol. Chem. , 263, 7406, (1988) ) とその宿主である S f — 9
(J. Biol. Chem. , 263, 7406, (1988) ) 等が挙げられる。 また動物細胞としてはマウ ス繊維芽細胞 C 127 (J. Viol. , 26, 291, (1978))やチャイニーズハムスター卵巣 細胞 CHO細胞 (Proc. Natl. Acad. Sci. USA, 77, 4216, (1980)) 等が挙げられる I 発現量やスクリーニングの簡便さから好ましくはアフリカミ ドリザル腎臓由 来 CO S— 7 (ATCC CRL1651:アメリカン タイプ カルチャー コレクション 保存細胞) が用いられる。
上記したようなタンパク質発現用ベクターを用いる発現方法の他に、 プロモー ターを連結した本発明の D N A断片を宿主微生物の染色体中に直接挿入する相同 糸且換え技術 (A. A. Vertes et al. , Biosci. Biotechnol. Bioc em. , 57, 2036 (1993)) 、 あるいはトランスポゾンや挿入配列 (A. A. Vertes et al. , Molecular Microbiol. , 11, 739, (1994))等を用いて DNA導入体を作製することもできる。 得られた培養物は、 細胞あるいは菌体を遠心分離等の方法により収集し、 これ を適当な緩衝液に懸濁し、 超音波、 リゾチーム、 および Zまたは凍結融解等のそ れ自体既知の適当な方法により破壌した後、 遠心分離や濾過等によりタンパク質 粗精製液を得、 さらに適当な精製方法を組み合わせることにより精製することが できる。 かくして、 本発明のタンパク質が取得される。 上記したタンパク質発現 組換えベクターを用いる発現方法の他に、 上記 (1) で取得された本発明の DN Aを無細胞転写翻訳系に供することによりタンパク質発現を誘導し、 本発明のタ ンパク質を取得することができる。 本発明で用いられる無細胞転写翻訳系とは、 DNAから mRN Aへの転写、 およぴ m R N Aからタンパク質への翻訳に必要な 全ての要素を含む系であり、 そこに DNAを加えることによってその DN Aがコ ードしているタンパク質が合成されるようなあらゆる系を指す。 無細胞転写翻訳 系の具体例としては、 真核細胞、 およびバクテリア細胞、 又はそれらの一部から の抽出液に基づいて調製された転写翻訳系が挙げられ、 特に好ましい具体例とし ては、 ゥサギ網状赤血球、小麦胚芽、大腸菌からの抽出液(大腸菌 S 3 0抽出液) に基づいて調製された転写翻訳系が挙げられる。
得られた無細胞転写翻訳系の転写翻訳産物からの、本発明のタンパク質の分離、 および精製は、 それ自体既知の通常用いられる方法で行うことができる。 具体的 には、 例えばェピトープペプチド、 ポリヒスチジンペプチド、 ダルタチオン一 S 一トランスフェラーゼ (G S T) 、 マルトース結合タンパク質等をコードする D N A領域を、前記した転写翻訳されるべき D N Aに導入し、前記の通り発現させ、 該タンパク質と親和性を有する物質とのァフィ二ティーを利用して精製すること ができる。
目的とするタンパク質の発現は、 S D S—ポリアクリルアミドゲル電気泳動等 で分離し、 クマシ一ブリリアントブルー (シグマネ土製) 等で染色するか、 または 後述する本発明のタンパク質に特異的に結合する抗体により検出する方法等によ つて確認できる。 また一般的に、 発現されたタンパク質は生体内に存在するタン パク質分解酵素により切断されること (プロセッシング) が知られている。 本発 明のタンパク質も当然のことながら切断されたアミノ酸配列の部分断片であって も、 D N A結合活性または I A P様活性を有するものであれば、 本発明のタンパ ク質に含まれる。
かくして得られたタンパク質は、 他のタンパク質、 D NAとの相互作用等を解 析することにより、 生体内における多面的な機能を知ることができる。 上記相互 作用の解析法としては、 それ自体既知の常法を用いることができるが、 具体的に は、 例えば、 酵母ツーハイブリッド法、 蛍光偏光解消法、 表面プラズモン法、 フ ァージディスプレイ法、 リポソ一マルディスプレイ法等が挙げられる。
( 3 ) オリゴヌクレオチドの調製及ぴ該オリゴヌクレオチドを用いる機能解析 上記 (1 ) に記載の方法で取得した本発明の D N Aまたはその断片を用いて、 D N A合成機などを用いる常法により、 本発明の D N Aの一部の配列を有するァ ンチセンス ·オリゴヌクレオチド、 センス 'オリゴヌクレオチド等のォリゴヌク レオチドを調製することができる。
該オリゴヌクレオチドとしては、 上記 D N Aの有する塩基配列中の連続した 5 〜 1 0 0塩基と同じ配列を有する D N Aまたは該 D N Aと相捕的な配列を有する D NAを挙げることができる。 具体例としては、 配列番号 1〜1 3、 3 5、 また は 3 7のレ、ずれかで表される塩基配列中の連続した 5〜 1 0 0塩基と同じ配列を 有する D N Aまたは該 D N Aと相補的な配列を有する D N Aを挙げることができ る。 センスプライマーおよびアンチセンスプライマ^"として用いる場合には、 両 者の融解温度 (T m) および塩基数が極端に変わることのない上記のオリゴヌク レオチドが好ましい。 また、 配列の長さは、 一般的には 5〜1 0 0塩基であり、 好ましくは 1 0〜6 0塩基であり、 より好ましくは 1 5〜5 0塩基である。
また、 これらオリゴヌクレオチドの誘導体も本発明のオリゴヌクレオチドとし て利用することができる。 該オリゴヌクレオチド誘導体としては、 オリゴヌタレ ォチド中のリン酸ジエステル結合がホスホロチォエート結合に変換されたオリゴ ヌクレオチド誘導体、 オリゴヌクレオチド中のリン酸ジエステル結合が N 3, 一 P 5 ' ホスフォアミデート結合に変換されたオリゴヌクレオチド誘導体、 オリゴ ヌクレオチド中のリボースとリン酸ジエステル結合がぺプチド核酸結合に変換さ れたォリゴヌクレオチド誘導体、 才リゴヌクレオチド中のゥラシルが C— 5プロ ビュルゥラシルで置換されたォリゴヌクレオチド誘導体、 オリゴヌクレオチド中 のゥラシルが C一 5チアゾールゥラシルで置換されたオリゴヌクレオチド誘導体、 オリゴヌクレオチド中のシトシンが C一 5プロピニルシトシンで置換されたォリ ゴヌクレオチド誘導体、 オリゴヌクレオチド中のシトシンがフエノキサジン修飾 シトシン (phenoxazine- modified cytosine) で置換されたオリゴヌクレオチド誘 導体、 オリゴヌクレオチド中のリポースが 2, 一O—プロピルリボースで置換さ れたオリゴヌクレオチド誘導体、あるいはオリゴヌクレオチド中のリポースが 2, ーメ トキシェトキシリボースで置換されたオリゴヌクレオチド誘導体等を挙げる ことができる。 また、本発明のオリゴヌクレオチドは、 これを 2本鎖匪として調製し、被導入 体へ導入し、標的遺伝子の発現を阻害する RNAインターフェアレンス法(以下、 こ れを 「RNA i法」 と称することがある) に用いることができる。 R Aインターフ エアレンス法については、 例えば、 (Elbashir, S. , et al. , Nature, 411, 494-498(2001)) に記載の方法等を用いることができる。 また、上記 2本鎖 RNA は必ずしも全てが RN Aである必要はなく、 例えば、 WO 02/10374号公 報に記載のもの等も用いることができる。
ここで、標的遺伝子としては、本発明の DNAであれば、如何なるものであっても よい。これら DNAの少なくとも一部の塩基配列と実質的に同一な配列からなる 2本 鎖 RNA (以下、 これを「2本鎖ポリヌクレオチド」 と称することがある) とは、 標的遺伝子の塩基配列のうち、 いずれの部分でもよい 15bp以上の配列と実質的 に同一な配列からなるものである。 ここで、 実質的に同一とは、 標的遺伝子の配 列と 80%以上の相同性を有することを意味する。 ヌクレオチドの鎖長は 1 5 bp から標的遺伝子のオープンリーディングフレーム(0RF)の全長までの如何なる長 さでもよいが、 1 5〜50 Obp程度のものが好ましく用いられる。 ただし、 哺乳 類動物由来の細胞おいては、 3 Obp以上の長い 2本鎖 RNAに反応して活性化するシ グナル伝達系の存在が知られている。 これはインターフェロン反応と呼ばれてお り (Mareus, P. I., et al., Interferon, 5, 115-180(1983)) 、 該 2本鎖脆が 細胞内に侵入する i PKR(dsRNA-responsive protein kinase :Bass, B丄, Nature, 411, 428-429 (2001)) を介して多くの遺伝子の翻訳開始が非特異的に阻害され、 それと同時に 2' 、 5 ' oligoadenylate synthetase (Bass, B. L. , Nature, 411, 428-429(2001)) を介して R aseLの活性化が起こり、 細胞内の RNAの非特異的な分 解が惹起される。 これらの非特異的な反応のために、 標的遺伝子の特異的反応が 隠蔽されてしまう。 従って哺乳類動物、 または該動物由来の細胞、 あるいは組織 を被導入体として用いる場合には 1 5〜3 Obp, 好ましくは 19〜22 b p、 最 も好ましくは 21 b pの 2本鎖ポリヌクレオチドを用いることが好ましい。 2本 鎖ポリヌクレオチドはその全体が 2本鎖である必要はなく、 5, 、 または 3, 末 端が一部突出したものも含むが、 3, 末端が 2塩基突出したものを用いることが 好ましい。 2本鎖ポリヌクレオチドは相捕性を有する 2本鎖のポリヌクレオチド を意味するが、 自己相補性を有する 1本鎖ポリヌクレオチドが自己ァユーリング したものでもよい。 自己相補性を有する 1本鎖ポリヌクレオチドとしては、 例え ば、 逆方向反復配列を有するもの等が挙げられる。
2本鎖ポリヌクレオチドの調製方法としては、 特に制限はないが、 それ自体既 知の化学合成方法を用いることが好ましい。 化学合成は、 相補性を有する 1本鎖 ポリヌクレオチドを別個に合成し、 これを適当な方法で会合させることにより 2 本鎖とすることができる。 会合の方法として具体的には、 例えば、 合成した 1本 鎖ポリヌクレオチドを混合し、 2本鎖が解離する温度にまで加熱し、 その後徐々 に冷却する方法等が挙げられる。 会合した 2本鎖ポリヌクレオチドは、 ァガロー スゲル等を用いて確認し、 残存する 1本鎖ポリヌクレオチドを適当な酵素により 分解する等して除去する。
このようにして調製した 2本鎖ポリヌクレオチドを導入する被導入体としては、 標的遺伝子がその細胞内で R Aに転写、またはタンパク質に翻訳を受け得るもので あれば如何なるものであってもよいが、 具体的には、 植物、 動物、 原生動物、 ゥ ィルス、 バクテリア、 または真菌種に属するものが挙げられる。 植物は単子葉植 物、 双子葉植物または裸子植物であってよく、 動物は、 脊椎動物または無脊椎動 物であってよい。 好ましい微生物は、 農業または工業で使用されるものであり、 そして植物または動物に対して病原性のものである。 真菌には、 力ビ及ぴ酵母形 態両方での生物体が含まれる。 脊椎動物の例には、 魚類、 ゥシ、 ャギ、 ブタ、 ヒ ッジ、 ハムスター、 マウス、 ラット及びヒトを含む哺乳動物が含まれ、 無脊椎動 物には、 線虫類及ぴ他の虫類、 キイ口ショウジヨウバエ (Drosophila) 、 及ぴ他 の昆虫が含まれる。 好ましくは、 細胞は脊椎動物細胞である。
被導入体は、 細胞、 組織、 あるいは個体を意味する。 ここで細胞とは、 生殖系 列または体性、 分化全能、 または多分化能、 分割または非分割、 実質組織または 上皮、 不滅化したものまたは形質転換したもの等からであってよい。 細胞は、 配 偶子または胚であってよく、 胚の場合、 単一細胞胚または構成性細胞、 または多 重細胞胚からの細胞であり、 胎児組織を含む。 さらには、 幹細胞のような未分化 細胞、 または胎児組織を含む器官または組織の細胞からのような分化細胞、 また は生物内に存在する任意の他の細胞であってよレ、。 分化している細胞型には、 脂 肪細胞、 繊維芽細胞、 筋細胞、 心筋細胞、 内皮細胞、 神経細胞、 グリア、 血液細 胞、 巨核球、 リンパ球、 マクロファージ、 好中球、 好酸球、 好塩基球、 マスト細 胞、 白血球、 顆粒球、 ケラチン生成細胞、 軟骨細胞、 骨芽細胞、 破骨細胞、 肝細 胞及ぴ内分泌腺または外分泌腺の細胞が含まれる。
被導入体への 2本鎖ポリヌクレオチドの導入法としては、 被導入体が細胞、 あ るいは組織の場合は、カルシウムフォスフエ一ト法、エレクトロポレーシヨン法、 リボフヱクシヨン法、 ウィルス感染、 2本鎖ポリヌクレオチド溶液への浸漬、 あ るいは形質転換法等が用いられる。 また、 胚に導入する方法としては、 マイクロ インジェクション、 エレクト口ポレーシヨン法、 あるいはウィルス感染等が挙げ られる。 被導入体が植物の場合には、 植物体の体腔または間質細胞等への注入ま たは灌流、 あるいは噴霧による方法が用いられる。 また、 動物個体の場合には、 経口、 局所、 非経口 (皮下、 筋肉内及び静脈内投与を含む) 、 経膣、 経直腸、 経 鼻、 経眼、 腹膜内投与等によって全身的に導入する方法、 あるいはエレク トロボ レーシヨン法やウィルス感染等が用いられる。 経口導入のための方法には、 2本 鎖ポリヌクレオチドを生物の食物と直接混合することができる。 さらに、 個体に 導入する場合には、 例えば埋め込み長期放出製剤等として投与することや、 2本 鎖ポリヌクレオチドを導入した導入体を摂取させることにより行うこともできる。 導入する 2本鎖ポリヌクレオチドの量は、 導入体や、 標的遺伝子によつて適宜 選択することができるが、 細胞あたり少なくとも 1コピー導入されるに充分量を 導入することが好ましい。 具体的には、 例えば、 被導入体がヒ ト培養細胞で、 力 ルシゥムフォスフエ一ト法により 2本鎖ポリヌクレオチドを導入する場合、 0 . 1〜: L 0 0 O nMが好ましい。
R Aィンターフェアレンスによる本発明の遺伝子の導入体内での発現抑制によ り、 本発明の遺伝子がコードするタンパク質の機能の確認、 あるいは新たな機能 の解析等を行うことができる。
( 4 ) 本発明のタンパク質に特異的に結合する抗体
本発明のタンパク質と特異的に結合する抗体の調製方法としては、 通常用いら れる公知の方法を用いることができ、 抗原として用いられるポリペプチドについ ても、 公知の方法に従って抗原性が高くェピトープ (抗原決定基) として適した 配列を選択して用いることができる。 ェピトープの選択方法としては、 例えば Epitope Adviser (富士通九州システムエンジニアリング社製) 等の市販のソフト ウェアを用いることができる。
上記の抗原として用いるポリべプチドは、 公知の方法に従って合成した合成べ プチドでも、 また本発明のタンパク質そのものを用いることもできる。 抗原とな るポリペプチドは、 公知の方法に従って適当な溶液等に調製して、 哺乳動物、 例 えばゥサギ、 マウス、 ラット等に免疫を行えばよいが、 安定的な免疫を行ったり 抗体価を高めるために抗原ペプチドを適当なキヤリァタンパク質とのコンジュゲ ートにして用いたり、 アジュバント等を加えて免疫を行うのが好ましい。
免疫に際しての抗原の投与経路は特に限定されず、 例えば皮下、 腹腔内、 静脈 内、あるいは筋肉内等のいずれの経路を用いてもよい。具体的には、例えば BALB/c マウスに抗原ポリぺプチドを数日〜数週間おきに数回接種する方法等が用いられ る。 また、 抗原の摂取量としては、 抗原がポリペプチドの場合 0 . 3〜0 . 5 m g Z l回程度が好ましいが、 ポリペプチドの種類、 また免疫する動物種によっては 適宜調節される。
免疫後、適宜試験的に採血を行って固相酵素免疫検定法 (以下、 これを 「ELISA 法」 と称することがある) やウェスタンブロッテイング等の方法で抗体価の上昇 を確認し、 十分に抗体価の上昇した動物から採血を行う。 これに抗体の調製に用 いられる適当な処理を行えばポリクローナル抗体を得ることができる。 具体的に は、 例えば、 公知の方法に従い血清から抗体成分を精製した精製抗体を取得する 方法等が挙げられる。抗体成分の精製は、遠析、イオン交換クロマ ァフィ二ティークロマトグラフィー等の方法を用いることができる。
また、 該動物の脾臓細胞とミエローマ細胞とを用いて公知の方法に従って融合 させたハイプリ ドーマを用いる (Milstein, et al., Nature, 256, 495 (1975) ) こと によりモノクローナル抗体を作製することもできる。 モノクローナル抗体は、 例 えば以下の方法により取得することができる。
まず、 上記した抗原の免疫により抗体価の高まった動物から抗体産生細胞を取 得する。 抗体産生細胞は、 形質細胞、 及ぴその前駆細胞であるリンパ球であり、 これは個体の何れから取得してもよいが、 好ましくは脾臓、 リンパ節、 末梢血等 から取得する。 これらの細胞と融合させるミエローマとしては、 一般的にはマウ スから得られた株化細胞、 例えば 8—ァザグァニン耐性マウス (BALBん由来等) ミエローマ細胞株である P3X63 - Ag8. 653 (ATCC : CRL - 1580) 、 P3-NSl/lAg4. 1 (理研 セルバンク : RCB0095) 等が好ましく用いられる。細胞の融合は、抗体産生細胞と ミエローマ細胞を適当な割合で混合し、 適当な細胞融合培地、 例えば RPMI1640や イスコフ改変ダルベッコ培地 (IMDM) 、 あるいはダルベッコ改変イーグル培地
(DMEM) 等に、 5 0 %ポリエチレングリコール (PEG) を溶解したもの等を用いる ことにより行うことができる。 また電気融合法 (U. Zi讓 er- mann. et al. , Naturwissenschaften, 68, 577 (1981) ) によっても行うことができる。
ハイプリ ドーマは、 用いたミエローマ細胞株が 8—ァザグァニン耐性株である ことを利用して適量のヒポキサンチン'アミノプテリン ·チミジン (HAT) 液を含 む正常培地 (HAT培地) 中で 5 %C02、 3 7 °Cで適当時間培養することにより選択 することができる。 この選択方法は用いるミエローマ細胞株によつて適宜選択し て用いることができる。 選択されたハイブリ ドーマが産生する抗体の抗体価を上 記した方法により解析し、 抗体価の高い抗体を産生するハイプリ ドーマを限界希 釈法等により分離し、 分離した融合細胞を適当な培地で培養して得られる培養上 清から硫安分画、 ァフィ二テイクロマトググラフィ一等の適当な方法により精製 してモノク口ーナル抗体を得ることができる。 また精製には市販のモノクローナ ル抗体精製キットを用いることもできる。 さらには、 免疫した動物と同系統の動 物、 またはヌードマウス等の腹腔内で上記で得られた抗体産生ハイプリ ドーマを 増殖させることにより、 本発明のモノクローナル抗体を大量に含む腹水を得るこ ともできる。
また、 本発明のタンパク質としてヒ ト由来のものを取得した場合には、 かかる ポリぺプチド、 あるいはその部分ぺプチドを抗原として、 ヒ ト末梢血リンパ球を 移植した Severe combined immune deficiency (SCID) マウスに上記した方法と同 様にして免疫し、 該免疫動物の抗体産生細胞とヒトのミエローマ細胞とのハイブ リ ドーマを作製することによってもヒト型抗体を作製することができる(Mosier, D. E., et al. Nature, 335, 256 - 259 (1988); Duchosal, M. A., et al., Nature, 355, 258-262 (1992) ) 。
また、取得したヒト型抗体を産生するハイプリ ドーマから RNAを抽出し、 目的の ヒト型抗体をコードする遺伝子をクローユングして、 この遺伝子を適当なベクタ 一に挿入し、 これを適当な宿主に導入して発現させることにより、 さらに大量に ヒト型抗体を作製することができる。 ここで、 抗原との結合性の低い抗体は、 そ れ自体既知の進化工学的手法を用いることによりさらに結合性の高い抗体として 取得することもできる。 一価性抗体等の部分フラグメントは、 例えばパパイン等 を用いて Fab部分と Fc部分を切断し、 ァフィ二ティカラム等を用いて Fab部分を回 収することによって作製することができる。
かくして得られる本発明のタンパク質と特異的に結合する抗体は、 本発明のタ ンパク質に特異的に結合することによって該タンパク質が有する D N A結合活性 または I A P様活性を阻害する中和抗体として用いることもできる。.タンパク質 が有する活性を阻害するものの選択方法としては特に制限はないが、 例えば、 上 記 (2 ) で作製した D NA導入体に抗体を接触させ、 導入体中の目的タンパク質 の機能が阻害されるか否かを解析する方法等が挙げられる。
かかる中和抗体は、 臨床へ応用するに際し、 上記有効成分を単独で用いること も可能であるが、 薬学的に許容され得る担体と配合して医薬品組成物として用い ることもできる。 この時の有効成分の担体に対する割合は、 1〜 90重量%の間 で変動され得る。 また、 かかる薬剤は種々の形態で投与することができ、 それら の投与形態としては、 錠剤、 カプセル剤、 顆粒剤、 散剤、 あるいはシロップ剤等 による経口投与、 または注射剤、 点滴剤、 リボソーム剤、 坐薬剤等による非経口 投与を挙げることができる。 また、 その投与量は、 症状、 年齢、 体重等によって 適宜選択することができる。
(5) 本発明のタンパク質が有する活性の確認およぴ解析
本発明のタンパク質は、 これを上記 (2) に記載のとおり組み換えタンパク質 として作製し、 これを解析することにより上記 (1) で推測した活性を有してい ることを確認することができる。 さらに上記 (4) のとおりに作製した抗体等と の組み合わせにより解析することもできる。 以下に、 本発明のタンパク質が有す る DN A結合活性および転写制御活性を測定する場合を例に挙げて、 その方法を 説明する。
(5-1) DN A結合活性の測定方法
本発明のタンパク質が、 DN A結合活性を有することは、 例えば、 適当な二本 鎖 D N Aを該組み換えタンパク質に接触させ、 該組み換えタンパク質の該 D N A 鎖への結合性を測定することにより確認することができる。 具体的な方法として は、 例えば、 以下に説明する方法等が挙げられる。
反応液としては、 60mM塩ィ匕カリウム、 ImMジチオトレイトール、 10% グリセロール、 1 μ § p o 1 y (d I - d C)を含む中性から弱塩基性緩衝液、 例えば 2 OmMトリスー塩酸或いは HEP E S緩衝: (pH7〜8) を用い、 適 当な長さの二本鎖 D N Aと本発明の laみ換えタンパク質を加えることにより反応 を開始する。 一定条件下で反応後、 該組み換えタンパク質と DNAの結合物を検 出することによりタンパク質の二本鎖 DN A結合活性を判断する。
組み換えタンパク質と DNAの結合は、 分子の大きさとして検出する方法、 電 荷の差異として検出する方法、 両者の親和性を測定する方法等を用いて検出する ことが可能である。
分子の大きさを検出する方法としては、 分子ふるいクロマトグラフィーによる 測定が挙げられる。 上記反応液を、 生理食塩水或いは 0. 1Mリン酸緩衝液 (p H7. 4) 、 0. 1M HEPES (pH7. 5) で平衡ィ匕した分子ふるいクロマ トグラフィー用カラムに添加し、 同溶液にて展開する。 組み換えタンパク質、 D NAそれぞれの溶出位置と比較して、 より高分子量側に両者の結合物が溶出され る。
電荷の差として検出する方法としては、 イオン交換クロマトグラフィー、 ゲル 電気泳動法、 キヤピラリー電気泳動法を含む電気泳動法が挙げられる。 ゲル電気 泳動法は、 電荷の差と分子の大きさの差が移動度の差として現れる。 上記反応液 を、 ポリアクリルアミドゲル中で電気泳動し、 泳動後のゲルを銀染色、 クマーシ 一ブリリアントブルー染色、 或いは蛍光染色し、 組み換えタンパク質単独の場合 と比較して、結合物は移動度の異なるパンドとして確認される。この 2法の場合、 DNAの一方の末端を蛍光ラベルしておくことによって、 DNAの溶出位置、 移 動度の差として、 より高感度で検出することも可能である。
両者の親和性を測定する方法としては、 ァフィユティークロマトグラフィー、 表面プラズモン共鳴法等が挙げられる。 これらの方法では、 DNAを担体に固定 しておき、 そこに組み換えタンパク質を接触させ、 その結合量を測定し活性の強 さとする。 ァフィ二ティークロマトグラフィーでは、 結合した組み換えタンパク 質を高濃度の塩溶液、 変性剤、 遊離の DNA等で溶出し、 溶出したタンパク質量 を測定する。 表面プラズモン共鳴法では、 固定化 DNAに結合したタンパク質量 を、 表面プラズモン共鳴で測定し、 結合したタンパク質濃度で親和性の強さを測 定することができる。
(5-2) 転写制御活性の測定方法
また、 本発明のタンパク質は、 IFN- inducible proteins r200-family")である マウス IFI202, IFI203, IFI204および ヒト MNDA, IFI - 16 AIM2と構造上類似して いるものを含み、 これらはインターフェロン誘導タンパク質フアミリー分子であ り、 転写制御に関与すると思われる。 このような本発明のタンパク質の転写制御 活性を測定する方法としては、 例えば、 以下に説明する方法等が挙げられる。 本発明タンパク質の転写制御活性は、 当業者であれば例えば以下の様にレポ一 タージーンアツセィ等を行うことで検討できる (Mol. Cell. Biol. 16, (1996) 359-368)。 NF-icB、 AP- 1、 AP-2、 および 0CT1などによって制御されるプロモータ 一の下流にそれぞれルシフェラーゼ遺伝子またはク口ラムフエニコールァセチル トランスフェラーゼ遺伝子を連結させたレポータージーンアツセィ用ベクターを 構築する。 本発明タンパク質をコードする遺伝子を発現させるためのベクターと レポータージーンアツセィ用ベクターを、 L929細胞または EL4細胞に一過性に遺伝 子導入し、 インターフェロン、 poly(rl) -poly(rC), または PMAの存在'非存在下 で定法に従ってレポータージーンの活性を測定することができる。
また、 本発明タンパク質が例えば転写因子 F-zcBと結合することは、 本発明タ 'ンパク質の N末端または C末端に GSTを連結させた融合タンパク質をダルタチオン ァガロースビーズに結合させ、これに細胞抽出液を添加し 4°Cにてー晚ィンキュベ ーシヨンを行い、 バッファーでビーズを洗浄し非特異的吸着物質を除いた後、 ビ ーズ結合物を回収し SDSゲル電気泳動後、抗 NF-zcB抗体を用いて免疫プロッティン グを行うことにより、 本発明タンパク質と NF- κ Bとの特異的結合能の有無を検討 することができる。
(5- 3) DN A結合活性及び転写制御活性の解析方法
DNA · RNAに結合し転写に関連するタンパク質では、 一般的に、 既知の転 写関連因子が認識し標的とするプロモーターゃェンハンサ一等の遺伝子転写調節 領域 (以下、 「標的転写調節領域」 と称する) の DN Aおよびその部分断片を用 いて、 これらに対する結合能を測定することにより網羅的に転写制御活性を解析 する方法が知られている (特開 2001— 314190号公報) 。 解析に使用す る標的転写調節領域の D NAおよびその部分断片として、 既知の標的転写調節領 域の塩基配列 (以下、 これを 「標的配列」 と称することがある) を有するものだ けでなく、 既知の標的転写調節領域の塩基配列をデーターベース解析し分類して それぞれ設計した、 複数の転写関連因子が共通して認識する標的配列 (以下、 こ れを 「コンセンサス標的配列」 と称することがある) を有するものを使用しても よい。 既知の転写関連因子としては、 例えば、 V- jun, c-jun, junB, junD, dJRA, c-fos, fosBl, fosB2, Fra-1, LRF-1, v-maf, mafG, NF-E2 p45, aNF~E2, fNF - E2, Nrf short form, GCN4, yAP-1, CREB - 2, ATF - 3, CRE - BP1, CRE-BP3, ATF-a, CREB-341, CREB- 327, CREM, dCREB2, dCREB2- b, dCREB2- c, dCREB2 - d, dCREB2-q, dCREB2- r, dCREB2-s, C/EBPalpha, C/EBPbeta, p34C/EBPbeta, CHOP - 10, VBP, Hlf, CPRF- 2, EmBP-lb, EmBP-lb, GBF1, GBF2, GBF3, CPRF - 1, TAF—l, HBP-la, GBF9, GBF1, GBF12, CPRF— 3, TGAla, TGAlb, 02, STE4, 0PI1, E2A, E47, ITF— 2/SEF2— IB, SEF— 1A, MyoD, p42Tal-l, HEN- 1, AhR, Arnt, USF, NF - 1A1, F-1A1. 1, NF-1A6, F-lBl, NF-1B1, NF-1B2, NF-1C2/CTF-2, CTF - 4, CTF - 6, RF— XI, AP2alphaA/AP-2alp al, AP2alpha2, AP2alpha3, AP2alpha4, AP2alphaB, AP2beta, AP2gamma, GR, AR, ER, RXR- alpha, PPARalpha, PPARgarama, C0UP-TF1, HNF-4alphal, H F-4alpha2, CF1, GATA- 1, GATA-2, GATA- 3, GATA— 4, AREA/NIT-2, Spl, YY1, Egr— 1, Egr- 2, Egr - 3, Snail, CF2-II, Evi-1, Ikaros, MZF—l, Tramtrack69K, H0X9, CDP, 膠 _1A, Nkx-2. 2, Nkx-2. 5, TTF-1, Oct - 1A, Oct - IB, Oct - 1C, Oct - 2, Oct-2. 1/Oct - 2B, Pax - 3, Pax- 6, Pax- 1, HSF1 (short) , HSF2, dHSF, fungalHSF, c- Myb, A-Myb, v-Myb, P (long) , P (short) , CI (long) , CI (short) , c_Ets— 1一 p54, Ets-l_deltaiV/VII, Ets-2, Elk— 1, SAP- 1, SAP-lb, Erg - 1, p55erg, Fli- lb, E4TF卜 60/GABP- alpha, E74A, IRF- 1, IRF-2, p50, NF-ATc, NF - Atp, p91, p84, STAT2, STAT3, STAT4, STAT5A, STAT5B, STAT6, p53, MEF-2A, SRF, E2, TBP, SRY, Sox- 5, Sox - 9, mat- Mc, CPIA, CP IB, CBF- C, AMLla, 等が知られており、これらの転写関連因子の標的転写調節領域の塩基配列 もそれぞれ報告されている (田ネ、ナ隆明、 外 2名編、 bio science 実験医学別冊 新用語ライブラリー 転写因子」 、 第 2版、 株式会社羊土社、 1999年 12月) 。 本発明の D N A結合活性または転写制御活性を有するタンパク質と標的転写調 節領域の D N Aおよぴその部分断片との結合は、 それ自体公知の測定系を使用し て検出することができる。 例えば、 標的転写調節領域の D N Aおよびその部分断 片を固定化したプレートに本発明のタンパク質を含む被検試料を添加し、 両者の 直接的な結合を S P R (Surface Plasmon Resonance, 表面プラズモン共鳴) 法を 用いて検出することができる。 その場合には、 前記したような転写に関連するタ ンパク質が認識する標的転写調節領域の D N Aまたはその部分断片をセンサーチ ップに固定化する。 D NA及びその部分断片は、 アニーリングさせたものを固定 化する。 また、 前記のように、 本発明のタンパク質または標的転写調節領域の D NAおよびその部分断片を蛍光標識したものを用いて、 両者の結合を検出するこ ともできる。
本発明のタンパク質を含む解析用の被検試料は、 前述のように本発明の D NA を適当な方法により転写/翻訳する方法により調製することができる。 具体的に は、 例えば、 本発明の D N Aを無細胞転写翻訳系に供することにより蛋白質発現 を誘導し、 本発明のタンパク質を取得することができる。
また、 転写に関連するタンパク質は、 疾患に関与する種々の遺伝子の転写を調 節する転写因子 (以下、 「疾患関連転写因子」 と称する) への作用を解析するこ とにより、 該タンパク質が特定の疾患に直接的または間接的に関与しているか否 かを解析することも有用である。疾患関連転写因子としては、例えば、 PPAR, p53, NF c B, AP-1, HIF - 1, CREB等が知られており、 これら既知の因子への作用を上記 と同様の方法等を用いて解析すればよい。
例えば、 S P R法を用いて解析を行う場合には、 前記疾患関連転写因子が有す る標的転写調節領域の D NAまたはその部分断片が特に好ましく用いられる。 こ のような D NAまたは部分断片が固定化されたセンサーチップに本発明のタンパ ク質を含む被検試料を適宜添加し、 センサーチップ表面の D N Aと被検試料中に 含まれる該タンパク質との間の相互作用を解析する。 固定化 D N Aと親和性を有 する場合、 コントロールに比較して S P R応答値が上がり、 転写関連因子が固定 化 D N Aと親和性を有していることが推定できる。 このような解析により、 本発 明のタンパク質が特定の疾患においてどのような機能を有しているかを解析する ことができる。
ここで、 本発明のタンパク質を含む解析用の被検試料は、 前述のように本発明 の D N Aを適当な方法により転写 Z翻訳する方法により調製することができる。 具体的には、 例えば、 本発明の D N Aを無細胞転写翻訳系に供することにより蛋 白質発現を誘導し、 本発明のタンパク質を取得することができる。
疾患関連転写因子は、 該疾患関連転写因子が含まれている細胞抽出液または細 胞核抽出液から取得することができる。 また、 前述のように、 疾患関連転写因子 をコードする D NAを適当な方法により転写 Z翻訳する方法により調製すること ができる。 具体的には、 例えば、 疾患関連転写因子をコードする c D N Aを使用 し、 その全長または一部を適当な発現ベクターに挿入し、 これを大腸菌などの微 生物、 昆虫細胞、 酵母、 動物細胞または動物に導入し、 疾患関連転写因子が発現 したこれらの遺伝子導入細胞の培養上清または細胞内、 糸且織、 体液より、 組換え 蛋白質である疾患関連転写因子を取得することができる。 なお、 本発明のタンパク質が有する活性の確認は、 上記した方法に限定される ものではない。 また、 これらの機能アツセィ系は、 後述する本発明のタンパク質 の機能賦活物質や機能阻害物質のスクリ一ニングゃ本発明のタンパク質の発現調 節物質のスクリーニングにも用いることができる。
本発明のタンパク質の機能解析の方法として一般的には、例えば、 (i)各組織、 疾患、 あるいは発生段階における発現状態を比較解析する方法、 (ii) 他のタン パク質、 D N Aとの相互作用を解析する方法、 (iii)適当な細胞あるいは個体へ 導入し、 表現型の変化を解析する方法、 (iv) 適当な細胞あるいは個体において 該タンパク質の発現を阻害して表現型の変化を解析する方法などが挙げられる。 このような方法によれば、 対象タンパク質に特異的な活性を多面的に解析するこ とができる。 (i) の方法においては、本発明のタンパク質の発現を、 mR NAレベルあるい はタンパク質レベルで解析することができる。 m R NAレベルで発現量を解析す る場合は、 例えば、 in situハイブリダィゼーシヨン法 (In situ hybridization: Application to Developmental Biology & Medicine. , Ed. by Harris, N. and Wilkinson, D. G. , Cambridge University Press (1990) ) 、 D NAチップを利用 したハイブリダィゼーシヨン法、 定量 P C R法等が用いられる。 また、 タンパク 質レベルで解析する場合には、 後述する本発明のタンパク質に特異的に結合する, 抗体を用いた組織染色法、 E L I S A法、 ウェスタンプロット法などが挙げられ る。 ここで、 解析の対象タンパク質が公知のバリアントが存在するスプライシン グバリアントである場合には、 解析対象タンパク質をコードする c D N Aにのみ 存在し、 公知のパリアントをコ一ドする c D NAとはハイブリダイズしないプロ ーブを用いることが好ましい。 定量 P C R法の場合には、 対象バリアントと公知 バリアント間で異なる長さの増幅断片ができるプライマーを選択して行う方法
(Wong, Υ·, Neuroscience Let. , . 320: 141-145 (2002) )等が挙げられる。 また、 タンパク質レベルで解析する場合にも、 対象タンパク質にのみ反応し、 公知のバ リアントには反応しない抗体を用いることが好ましい。
(ii) の方法においては、 本発明のタンパク質と既知のタンパク質との相互作 用の有無を調べて、 本発明のタンパク質の機能を解析することができる。 相互作 用の解析法としては、それ自体既知の常法を用いることができるが、具体的には、 例えば、 酵母ツーハイブリッド法、 蛍光偏光解消法、 表面プラズモン法、 ファー ジディスプレイ法、 リポソ一マルディスプレイ法等が挙げられる。 該方法におい ても、 解析対象タンパク質が公知のバリアントが存在するスプライシングバリア ントの場合には、 公知のバリアントも同様にして相互作用する物質を解析し、 対 象タンパク質特異的に相互作用する物質を同定することが好ましい。
(iii) の方法では、本発明の c D N Aを導入する細胞は特に制限はないが、 ヒ ト培養細胞等が特に好ましく用いられる。 D NAの細胞への導入法としては、 上 記 (2 ) に記載のものが挙げられる。 さらに導入細胞の表現型としては、 細胞の 生死、 細胞の増殖速度、 細胞の分化、 細胞が神経細胞の場合には神経突起の伸長 度、 細胞内タンパク質の局在や移行など顕微鏡等で観察可能なものや、 細胞内の 特定タンパク質の発現変化など生化学的実験により解析可能なものも含む。 これ らの表現型は、 公知のバリアントが存在するスプライシングバリアントの場合に は、 公知のものも同様に細胞へ導入し、 比較解析することにより解析対象バリア ントに関連する表現型を同定することができる。 また、 本発明のタンパク質は D NA結合活性または I A P様活性を有するものであることがわかっているので、 D N A結合タンパク質または I A P様活性を有するタンパク質が関連する疾患に 見られる表現型等に注目して解析することも好ましい。
( iv) の方法では、 後述するオリゴヌクレオチドを用いた方法や、 R N Aイン ターフェアレンス法により効率的に行うことができる。 この方法においても、 解 析する対象タンパク質に公知のバリアントが存在する場合には、 公知のバリアン トやその他のバリアントについても同様の解析を行い、 比較解析することにより 対象タンパク質特異的な機能を同定することができる。
( 6 ) 本発明のタンパク質が有する活性を調節する分子のスクリーニング 本発明のタンパク質に特異的に結合し、かつ本発明のタンパク質の機能(活性) を阻害、 拮抗または増強する作用を有する物質をスクリーニングすることにより 本発明のタンパク質の機能調節物質 (以下、 これを 「調節物質」 と称することが ある) を得ることができる。
この調節物質のスタリーニング方法は、本発明のタンパク質に特異的に結合し、 且つ該タンパク質の活性を阻害、 拮抗または増強する作用を有する物質が得られ る方法であれば如何なるものであってもよい。 例えば、 まずはじめに本発明のタ ンパク質と被検物質とを接触させ、 該タンパク質との結合性を指標として選抜し た後に、 本発明のタンパク質が有する活性の変化を指標として被検物質を選抜す る方法を用いることができる。
被検物質としては、 本発明のタンパク質と相互作用して、 該タンパク質が有す る活性に影響を及ぼす可能性のある物質であれば如何なるものであってもよいが、 具体的には、 例えば、 ペプチド、 タンパク質、 非ペプチド性化合物、 低分子化合 物、 合成化合物、 発酵生産物、 細胞抽出液、 動物組織抽出液等が挙げられる。 こ れらの物質は新規な物質であってもよいし、 公知の物質であってもよい。 被検物 質と本発明のタンパク質の相互作用の解析法としては、 それ自体既知の常法を用 いることができるが、 具体的には、 例えば、 酵母ツーハイブリッド法、 蛍光偏光 解消法、 表面プラズモン法、 ファージディスプレイ法、 リボソ一マルディスプレ ィ法、 あるいは上記 (4 ) に記載した^;体との競合解析法等が挙げられる。 この ような方法により、 本発明のタンパク質に結合する活性を見いだされた物質は、 次に該物質の存在下で本発明のタンパク質が有する活性がどのような影響を受け るかを解析することによって、 調節物質として用いられるか否かが同定される。 ここで、 医薬活性成分のスクリーニングを目的とするため、 用いる本発明の D NA、 あるいは組み換えタンパク質については、 上記したヒ トのホモログタンパ ク質またはオルソログタンパク質を用いることが好ましい。 さらに上記方法によ つてスクリーニングされた物質は、 これらの生体内でのスクリーユングによって 医薬候補としての選択を行ってもよい。
( 6 - 1 ) D N A結合活性を調節する分子のスクリーニング
具体的な解析方法としては、 例えば、 D N A結合活性を調節する物質を解析す る場合には、 上記 (5— 1 ) または (5— 3 ) に記載の方法等を用いて行うこと ができる。二本鎖 DNAとの結合性力 物質の非存在下の場合と比べて増加した場合 には、 該物質は D N A結合活性化物質として機能する可能性があり、 また低下、 または阻害された場合には物質は D N A結合阻害物質として機能する可能性があ ると同定できる。
本発明のタンパク質が有する D NA結合活性としては、 例えば、 D N A構造に 変化を与えて遺伝子発現を調節する機能が挙げられ、遺伝子発現調節タンパク質、 あるいは、 転写因子などが属する。 転写因子は、 癌に関連するパスウェイ上のシ グナル伝達機能、 心筋発達に関連するパスウェイ上のシグナル伝達機能、 精子の 分化 ·運動性を制御するパスウェイ上のシグナル伝達機能、 生殖細胞分化を制御 するパスウェイ上のシグナル伝達機能、 細胞分化を制御するパスウェイ上のシグ ナル伝達機能、 グリセロール 3燐酸を生成する機能、 神経細胞の発生 ·分化 ·増 殖 ·生存維持を制御するパスウェイ上のシグナル伝達機能、 ァルツハイマー病発 症を制御するパスウェイ上のシグナル伝達機能他、各種細胞の発生、分化、成長、 増殖、 生存、 再生、 および、 細胞機能等を制御するパスウェイのシグナル伝達機 能等、 各種シグナル伝達において最終的に D N Aに結合して遺伝子の発現制御に 関わる因子である。 従って、 これらシグナル伝達に関わる各種疾患治療剤のスク リーユングの標的とすることができる。 本スクリーニング方法により同定できる 化合物は、 抗ガン剤、 糖尿病治療剤、 抗炎症剤、 神経変性疾患治療剤、 心疾患治 療剤、 不妊治療剤、 再生組織誘導剤、 アルツハイマー病治療剤、 肥満治療剤、 糖 尿病治療剤、 心臓血管疾患治療剤、 代謝異常治療剤、 食欲不振、 過食症などの治 療剤等として用いられ得るものである。
( 6 - 2 ) I A P様活性を調節する分子のスクリーニング
また、 本発明のタンパク質の I A P様活性を調節する分子をスクリーニングす る場合には、 例えば、 上記 (5— 2 ) または (5— 3 ) に記載の方法等を用いて 行うことができる。 転写制御活性、 あるいは、 転写因子との結合性が、 物質の非 存在下の場合と比べて増加した場合には、 該物質は転写制御活性化物質あるいは 転写因子結合促進物質として機能する可能性があり、 また低下または阻害された 場合には物質は転写制御阻害物質として機能する可能性があると同定できる。 本発明の I A P様活性を有するタンパク質は、 すなわちインターフェロン誘導 タンパク質ファミリー分子であり、 転写制御に関与すると考えられる。 このよう な本発明タンパク質の発現制御物質、 機能賦活物質、 または機能阻害物質は、 免 疫応答に関連する種々の疾患、 癌、 糖尿病等の治療剤として用いられ得るもので ある。 かかる調節物質は、 臨床へ応用するに際し、 上記有効成分を単独で用いること も可能であるが、 薬学的に許容され得る担体と配合して医薬品組成物として用い ることもできる。 この時の有効成分の担体に対する割合は、 1〜 9 0重量%の間 で変動され得る。 また、 力かる薬剤は種々の形態で投与することができ、 それら の投与形態としては、 錠剤、 カプセル剤、 顆粒剤、 散剤、 あるいはシロップ剤等 による経口投与、 または注射剤、 点滴剤、 リボソーム剤、 坐薬剤等による非経口 投与を挙げることができる。 また、 その投与量は、 症状、 年齢、 体重等によって 適宜選択することができる。 ( 7 ) 本発明の D NAの発現調節物質のスクリーニング
スクリ一ユングの方法としては、 被検物質の存在下で本発明のタンパク質、 あ るいはそれをコードする mRNAの発現量を解析する方法等が挙げられる。 具体的に は、 例えば、 上記 (2 ) に記載した本発明のタンパク質を発現する細胞を被検物 質を含む適当な培地で培養し、 該細胞内に発現している本発明のタンパク質量を ELISA等の常法を用いて解析する力 \あるいは該細胞内の本発明のタンパク質をコ 一ドする mRNA量を、定量的逆転写 PCR法や、ノーザンブロット法等により解析する ことにより行うことができる。
被検物質としては、 上記 (6 ) に記載のものを用いることができる。 この解析 により、 被検物質の非存在下で培養された当該細胞内で発現されたタンパク質、 あるいは mRNA量と比べてその量が増加すれば、 物質は本発明の D N Aの発現促進 物質として機能する可能性があり、 逆に減少した場合には、 物質は本発明の D N Aの発現阻害物質として用いられ得ると判断することができる。
かかる発現調節物質は、 臨床へ応用するに際し、 上記有効成分を単独で用いる ことも可能であるが、 薬学的に許容され得る担体と配合して医薬品組成物として 用いることもできる。 この時の有効成分の担体に対する割合は、 1〜9 0重量% の間で変動され得る。 また、 かかる薬剤は種々の形態で投与することができ、 そ れらの投与形態としては、 錠剤、 カプセル剤、 顆粒剤、 散剤、 あるいはシロップ 剤等による経口投与、 または注射剤、 点滴剤、 リボソーム剤、 坐薬剤等による非 経口投与を挙げることができる。 また、 その投与量は、 症状、 年齢、 体重等によ つて適宜選択することができる。
( 8 ) 本発明の D N A導入動物
上記 (1 ) に記載の、 本発明の DNAを含む導入 DNAを構築し、 ヒ ト以外の哺乳動 物の受精卵に導入して、 これを雌個体子宮に移植して発生させることにより、 本 発明の DNAが導入された非ヒト哺乳動物を作製することができる。 より、具体的に は、 例えば、 雌個体をホルモン投与により過剰排卵させた後、 雄と交配し、 交配 後 1日目の卵管から受精卵を摘出し、該受精卵に導入 DNAをマイクロインジェクシ ヨン等の方法により導入する。 この後、 適当な方法で培養した後、 生存している 受精卵を、 偽妊娠させた雌個体 (仮親) の子宮に移植して出産させる。 新生仔に 目的の DNAが導入されている力否かは、 該個体の細胞から抽出した DNAのサザンブ ロット解析を行うことにより同定することができる。 ヒト以外の哺乳動物として は、 例えばマウス、 ラッ ト、 モノレモット、 ハムスター、 ゥサギ、 ャギ、 ブタ、 ィ ヌ、 ネコ等が挙げられる。
かくして得られた本発明の DNA導入動物は、 この個体を交配し、 導入された DNA が安定的に保持されていることを確認しながら通常の飼育環境で継代飼育するこ とによりその子孫を得ることができる。 また、 体外受精を繰り返すことによりそ の子孫を得て、 系統を維持することもできる。
本発明の DNAが導入された非ヒト哺乳動物は、 本発明の DNAの生体内における機 能の解析や、 またこれを調節する物質のスクリーニング系等として用いることが できる。
( 9 ) 本発明のタンパク質及びそれをコードする塩基配列を含む D N Aの他の利 用 本発明のタンパク質は、 それを基盤上に結合させた担体として利用することが できる。 また、 本発明のタンパク質をコードする塩基配列、 例えば、 配列番号 1 〜1 3、 3 5、または 3 7のいずれかに記載の塩基配列を有する DNA及ぴその部分 断片は、 配列番号 1 4〜2 6、 3 6、 または 3 8のいずれかに記载のァミノ酸配 列を有するタンパク質及びその部分断片は、 それらを基盤上に結合させた担体と してもちいられ得る。 これらを、 以下、 「プロテインチップ」 、 「DNAチップ」 ま たは「DNAァレイ」 (DNAマイクロアレイ及び DNAマクロアレイ) と称することがあ る。 これらのプロテインチップ、 又は D N Aチップもしくはアレイには、 本発明 のタンパク質や DNA以外に、 他のタンパク質や DNAが含まれていてもよい。
ここで、 タンパク質や DNAを結合させる基盤としては、ナイロン膜、 ポリプロピ レン膜等の樹脂基板、 ニトロセルロース膜、 ガラスプレート、 シリコンプレート 等が用いられるが、 ハイプリダイゼーシヨンの検出を非 R I的に、 例えば、 蛍光 物質等を用いて行う場合には、 蛍光物質を含まないガラスプレート、 シリコンプ レート等が好適に用いられる。また該基盤へのタンパク質、あるいは DNAの結合は、 それ自体公知の通常用いられる方法により容易に行うことができる。 これらのプ 口ティンチップ、 DNAチップ、 あるいは DNAアレイも、 本発明の範囲に含まれる。 また、本発明のタンパク質のァミノ酸配列及ぴ DNAの塩基配列は、配列情報とし ても用いることができる。 ここで、 D NAの塩基配列には、 対応する R NAの塩 基配列も含まれる。 すなわち、 得られたアミノ酸配列や塩基配列をコンピュータ 一が読みとり可能な所定の形式で適当な記録媒体に格納することにより、 ァミノ 酸配列や塩基配列のデータベースが構築できる。 このデータベースには、 他の種 類のタンパク質やそれをコードする DNAの塩基配列が含まれていてもよい。 また、 本発明においてデータベースとは、 上記配列を適当な記録媒体に書き込み、 所定 のプログラムに従って検索を行うコンピューターシステムをも意味する。 ここで 適当な記録媒体としては、 例えば、 フレキシブルディスク、 ハードディスク、 磁 気テープ等の磁気媒体、 C D— R OM、 MO、 C D - R , C D - RW, D V D— R、 D V D— R AM等の光ディスク、 半導体メモリ等を挙げることができる。 実施例
以下、 実施例を挙げて本発明を詳細に説明するが、 本発明の範囲はこれらの実 施例により限定されるものではない。
実施例 1 cDNAライブラリーの調製
(1) mRNAの調製 .
niRNA調製マウス (C57BLZ6) 各器官または組織 0. 5〜: L gを 10 m 1の懸濁液でホモジェナイズし、 pH4.0 の 2M酢酸ナトリウム 1 m 1 と、 同量のフエノール/ クロ口ホルム(体積比 5 : 1)混液を加え抽出した。 抽出後水 層に同量のイソプロパノールを加えると、 RNAが水相から分離沈澱した。 この 試料を氷の上で 1時間インキュベーションした後、 15分間 4, 000 r pmで 冷却遠心機にかけ、 沈澱物を回収した。 この検体を 70%エタノールで洗い、 8 m 1の水に溶解後、 2m lの 5M Na C l、 1 % CTAB (cetyltrimethy- 1 ammonium bromide), 4M尿素、 50 mM T r i sを含む pH7. 0 の水溶液 16m lを加えることで RNAを沈澱させ、ポリサッカライドを除いた(CTAB 沈澱) 。
続いて室温で 4, 000 r pm、 1 5分間遠心機にかけ、 RN Aを 4 mlの 7 Mグァニジン一 C 1に溶解した。 そして 2倍量のエタノールを加えた後、 氷上で 1時間インキュベーションし、 4, 000 r pm、 15分間遠心機にかけ、 生じ た沈澱物を 70%エタノールで洗い RNAを回収した、 これを再度水に溶解し、 RNAの純度を OD比 260/280 (> 1. 8) と 230Z260 (< 0. 4 5) を読むことによって計測した。
(2) 第 1鎖 cDNAの調製
上記 (1) で調製した mRNA 1 5 μ gを使って逆転写酵素 3, 000 u n i t により、最終容量 165 μ 1の反応液中で、 5—メチルー dCTP、 d AT P、 dTTP、 dGTPを各々 0. 54 mM、 0. 6Mトレハロース、 50 mM T r i s— HC 1 (pH8. 3) 、 75 mM KC 1、 3 mM MgC l 2、 1 OmM DTT、 52 n g/μ 1 B SA、 RNa s eインヒビター 5 un i tの条件下で逆転写反応を行った。 制限酵素 Xh o Iの認識配列を含むオリゴヌ クレオチド (配列番号 27) (配列中、 Vは A,G,又は Cを示し、 Nは A, G, C,又は T を示す) 12. 6 1をプライマーとして用いた。
この反応を始める際、 反応液の 1/4を採取し、 それに 1. 5 μ 1の [α— 32 Ρ] — dGTP (3000 C i /mm o l、 10 C i/ x l ; Am e r s h a m社製) を加えるこことにより、 第 1鎖 cDNAの合成効率を測定した。 R I標 識した反応液の 0. 5 μ 1を DE— 8 1ペーパー上にスポットし、 0. 5Μリン 酸ナトリウム緩衝液 (ρΗ7. 0) で 3回洗った前後の R I活性を測定し、 計算 した。 その後、 R I標識した反応液と非標識の反応液を混合し、 0. 5Μ ED ΤΑ 8 μ Κ 10 % S D S 2 μ 1、プロティナーゼ(P r o t e i n a s e) K 20 μ gを加え、 45 °Cで 1 5分間加熱した。 フエノール Zク口口ホルムに よる抽出、 エタノール沈澱後、 沈澱を RNa s eフリーに処理してある水 (以下 RN a s eフリー水とする) 47 μ 1に溶解した。
(3) 5, キャップ構造及ぴ 3, 末端へのビォチン付加
RN Αジオールのピオチン化 R N Aのジオール部位 (C a p構造のある 5, 末 端と、 ポリ A鎖のある 3, 末端のリボースの双方に存在) にビォチンを結合させ るために、 2段階の反応を行った。 それらは、 ジオール基の酸化とそれに続くビ ォチンヒドラジドと酸化 RNA体のカップリング反応である。 まず、 逆転写反応 で得られた RNA—第 1鎖 c DNA複合体 1 5 ^ gを、 6. 6 mM酢酸ナトリウ ム緩衝液 (pH4: 5) と、 酸化剤として過ヨウ素酸ナトリウムを用いて 5
1の反応液中で処理した。この酸ィヒ反応は遮光条件の下、氷上で 45分間行った。 続いて、 5Μ塩化ナトリウム 1 1 μ 1、 10% SDS 0. 5 μ そして 同量のイソプロパノールを加え、 60分間氷上に放置した後、 4°Cで 1 5分間 1
5, 000 r pm遠心し沈澱を取得した。 沈澱物は 70%エタノールで洗い、 R Na s eフリー水 50 μ 1に再溶解させた。 その試料に 1 Μ酢酸ナトリウム (ρ Η6. 1) 5 1、 10% SDS 5 u 10 mMピオチンヒドラジド ( S i gma社製) 1 5 0 ^ 1を加え、 室温 ( 2 2〜 2 6 °C) で終夜反応させた。 最 後に、 5 μ 1の 5M N a C l、 1 M酢酸ナトリウム (p H6. 1) 7 5 μ 1、 及ぴ 2. 5倍量のエタノールを加え、 1時間の氷上冷却後、 4°Cにおいて 1 5分 間遠心し、 ピオチン化した。 反応後、 反応液を 1 5分間遠心し、 再度 RNA— D N A複合体を沈澱させた。 沈澱物は 7 0 %エタノールで 1回、 更に 8 0 %エタノ ールで 1回洗い、 RN a s eフリ一水 70 μ 1に溶解した。
(4) RN a s e Iによる完全長 c DN Aの選択
上記 (3) で取得したピオチン化 RNA— DNA複合体について、 1本鎖 RN Aを消化する RN a s e Iで処理することにより、 逆転写反応時に完全な c D NAの伸長が得られなかった mRNA、 および! nRNAの 3 ' 末端に標識された ビォチン残基を取り除いた。 具体的には、 上記 (3) で得られた試料 7 0 μ 1に l O XRN a s e Iバッファ一( 1 0 0 mM T r i s _H C 1 ( p H 7. 5 )、 5 OmM EDTA、 2M N a OA c) 1 0 / 1、 RN a s e I (RN a s e On e™ ; P r ome g a社製) 2 0 0 u n i tを加えて、 3 7°Cで 1 5分 間 1本鎖 R N Aを消化した。
(5) 完全長 c DNAの採取
ストレプトアビジンコートしたマグネティックビーズに c DN Aが非特異的吸 着するのを防止するため、 1 0 0 μ gの酵母 t RNA (DNa s e I処理した もの) を 5m g (5 00 μ 1 ) のマグネテイツクビーズ (ma g n e t i c p o r o u s g l a s s (MP G) p a r t i c l e s c o a t e d w i t h s t r e p t a v i d i n (C PG, N J) ) に加え、 1時間氷上に放置し た後、 5 OmM EDTA、 2M N a C 1の溶液にて洗った。
このビーズを 5 OmM EDTA、 2M N a C 1の溶液 5 0 0 μ 1中に懸濁 し、 上記 (4) で取得した RN a s e I処理を施された c DNAを加えた。 室 温にて 3 0分間撹拌することで、 マグネティックビーズと完全長 c DNAを結合 させた。 完全長 c DNAを捕獲したビーズを 5 OmM EDTA、 2M N a C 1の溶液で 4回、 0. 4%SD S、 5 0 μ gZ/i 1酵母 t RNAで 1回、 1 0m M Na C l、 0. 2mM EDTA, 1 OmMT r i s -HC l (pH7. 5) , 20% グリセロールで 1回、 50 μ 1酵母 t RNA水溶液で 1回、 RN a s e H用バッファー (2 OmMT r i s— HC 1 (p H 7. 5) 、 10 mM MgC l2、 2 OmM KC I、 0. 1 mM EDTA、 0. 1 mM ジチォス レイトール (DTT) ) で 1回洗浄した後、 RNa s e H用バッファー 100 μ ΐに懸濁し、 RNa s e H 3 u n i tを加え、 37 °C下 30分間加温した。 その後、 10%SDS 1 μ 1、 0. 5Μ EDTA 2 μ 1を加えて、 10分 間、 65°Cに曝し、 その上清を回収した。
このようにして回収された 1本鎖完全長 c DNAはフエノール/クロロホルム で抽出され、 スピードバッグにて液量を 100 μ 1以下に減じてから G 25 /G l O O S e p h a d e xクロマトグラフィ一に付した。 R I活性を持った分画は シリコン処理したマイクロチューブに収集するとともに、 グリコーゲン 2 gを 加え、 エタノール沈澱にて得られた沈澱物を 30 μ 1の超純水に溶解した。
(6) 1本鎖 c DNAへのオリゴ d G付加
上記 (5) で回収された 1本鎖 c DNA30 μ 1は、 最終容量 50 μ 1の反応 液中で、 20 OmM力コジル酸ナトリウム (ρΗ6· 9) 、 1 mM M g C 12、 1 mM C o C l2、 ImM 2—メルカプトエタノール、 Ι Ο Ο μΜ d GTP の条件のもと、 ターミナルデォキシヌクレオチジルトランスフェラーゼ (T a K aRa社製) 32 u n i tを用いて 37 °Cで 30分間のオリゴ d G付加反応に付 した。 反応終了時に EDT Aを 5 OmMとなるように加え、 一連のフエノール/ クロ口ホルムによる抽出、エタノール沈澱を経て、 31 μ 1の超純水に溶解した。
(7) 第 2鎖 cDNA合成
第 1鎖 c D N Aを铸型にした第 2鎖 c D N Aの合成は以下のように行った。 最 終容量 60 n 1の反応系で、 第 2鎖低バッファー (20 OmM Tr i s一 HC 1 (pH8. 75) 、 10 OmM KC 1、 10 OmM (NH4) 2S04、 20 mM Mg S04、 l% Tr i t o n X- 100, 1 m g μ 1 B S A) 3 μ 1、 第 2鎖高バッファー (20 OmM T r i s—HC l (pH9. 2) 、 6 O OmM KC 1、 20 mM M g C 12) 3 μ 1、 dCTP、 d ATP, d TT P、 (10丁?各々 0. 25mM、 β -NADH 6 μ 1、 オリゴ d G付カ卩された 第 1鎖。ϋΝΑ31 μ 1、 第 2鎖プライマ一一アダプター (配列番号 28) 60
0 n g を加え、 Ex T a q. DNAポリメラーゼ (TaKaRa Ex T a q ; TaKaRa社製) 15 u n i t、 耐熱性 D N Aリガーゼ (Am 1 i g a s e ; Ep i c e n t r e社製) 1 50 u n i t、 ffォ熱性 R N a s e H (H y b r i d a s e ; Ep i c e n t r e社製) 3 u n i tによつて第 2鎖 c D N Aを合成した。
0. 5M EDTAを 1 μ 1加えることで反応を停止させ、 更にタンパク成分 を溶解するために、 10%SDS 1 ^ 1、 プロティナーゼ (P r o t e i n a s e) K 10 μ gの存在下に 45 °Cで 1 5分間加熱し、 最終的にフエノール /クロ口ホルムによる抽出、 エタノール沈澱にて精製した 2本鎖完全長 c DN A を得た。
(8) ライブラリーの調製
以上の方法により得られた二本鎖完全長 c DN Aは、 λΖΑΡ Ι I Iベクター に挿入し、 ライブラリーとして回収した。 λ ZAP I I Iベクターは ZAP I
1 (S TRATAGENE社製) ベクターのマルチクローユングサイトの一部の 配列である配列番号 29を配列番号 30に改変し、 二つの S f i Iサイトを新た に導入したものである。
さらに; IP S (R I KEN) ベクターを作製し、 cDNAを挿入した。 PS (R I KEN) (又一FLC— 1と命名(FLCとは FULL— LENGTH c DNAを意味する) ) とは、 Mo B i T e c社 (ドイツ) の I P Sベクターを c DNA用に改変したものである。 即ち l O k b p s t u i f e rの両側に存在 するクローニングサイトに c DNA挿入に便利な B a mH Iならびに S a 1 Iを 各々導入するとともに、 0. 5 k bから 13 k b程度までの c DNAがクロー二 ングできるように Xb a Iサイトに 6 k bの DNA断片を挿入したものである (特開 2000— 325080号公報) 。 この; L— F L C— 1を用いると、 例え ば肺臓 cDNAライプラリーの場合には、 インサートの平均鎖長は 2. 57 k b となり、 実際に 0. 5 k bから 12 k bまでのインサートをクローユングするこ とが出来た。 従来法の; I ZAPの場合には、 インサートの平均鎖長は 0. 97 k bであったことから、 ; L— FLC— 1を用いることによって、 サイズの大きな c DNAも λ ZAPに比べて効率よくクローユングできることがわかる。 実施例 2 完全長 cDNAライブラリーのノーマライゼーシヨン/サブトラクシ ョン
(1) ドライバーの調製
実施例 1 (1) で作製した mRNA (以下、 これを 「 (a) RNAドライパー」 と称することがある) 、 及ぴ i n v i t r o転写反応で作成した RNAをドラ ィバーとして用いた。 後者の RNAはさらに 2種類 (以下、 これを 「 (b) RN Aドライパー」 、 及ぴ 「 (c) RNAドライバー」 と称する) に分けられる。 1 つはノーマライゼーシヨンにより除かれた RNA— c DNAから c DNAを回収 し、 ファージベクターにクローニングしたものである。 大腸菌に感染後 1つの出 発材料あたり 1000から 2000プラークを混ぜ合わせて 1つのライブラリー (ミニライブラリー) とし、 常法によりプラスミ ド DN Aに変換する (ファージ をヘルパーファージとともに再度大腸菌に感染させ、 ファージミドとし、 さらに もう一度感染させてプラスミ ド DNAを得る) 。
得られた DNAについて i n v i t r o転写反応 (T 3 RNAポリメラーゼ または T 7 RNAポリメラーゼを用いる) を行い、 DNa s e I (RQ 1— R Na s e f r e e ; P r ome g a社製)、 P r o t e i n a s e K処理後、 フエノール Ζクロ口ホルム抽出をして RNA (b) RNAドライバーを得た。 こ の際、通常出発材料としては 9種類 (すい臓、肝臓、肺、 腎臓、脳、脾臓、 睾丸、 小腸、 胃) の組織からそれぞれミニライブラリーを作成して、 9種類のミニライ ブラリ一を混合して RNAを得る。 もう一つの RNAはすでに重複のないクロー ンとして保存されているライブラリー (クローン数約 2万個) を培養し、 得られ た DNAについて (b) RNAドライパーと同様に i n v i t r o転写反応を 行い (c) RNAドライバ一とした。
これら 3種の RNAは、 L a b e l— I T B i o t i n L a b e l i n g K i t (M i r u s Co r p o r a t i o n製) を用いてピオチン化標識を 行ったあと、 1 : 1 : 1の割合でテスター c DNAに添加し、 Ro t 10での反 応 (42。C) を行い、 ストレプトアビジンビーズ (CPG) 処理を行って回収し た上清について、 第 2鎖の合成を行った。 実施例 3 完全長 c D N Aクローンの塩基配列決定
(1) クローンの r e a r r a y
各クラスタからひとつの代表クローンを選んだ。代表クローンは Q—b o t (G ENET I X L I M I TED製) で選択し、 384穴プレートに a r r a yィ匕 した。 その際、 大腸菌は 30 °Cで 18〜 24時間、 50// 1の L B培地で培養し た。 このとき、 c DNAライブラリーが P Sベクターに導入され大腸菌 DH 10 Bを形質転換している場合には 10 Omg/m 1のアンピシリン及び 50 m g / m 1のカナマイシンを添加し、 Z a pベクターに導入し、 SOLRシステムに導 入している場合には 10 Omg/m 1のアンピシリン及ぴ 25 m g /m 1のスト レプトアビジンを添加して行った。
(2) プラスミドの抽出と I n s S i z i n g
上記 (1) で培養した各クローンは、 さらに 10 Omg/m 1のアンピシリン を含む 1. 3m 1の HT液中で培養され、 遠心分離により菌体を回収した後、 Q I Ap r e p 96 Tu r b o (Q I AG E N社製) を用いてプラスミド D N Aを回収、 精製した。 取得されたプラスミド中に挿入されている c DNAの鎖長 を調べるために、 上記で取得したプラスミド DNAの 1Z30を制限酵素 P V u I Iで消化し、 1%の a g a r o s eゲル電気泳動を行った。
(3) 配列決定
かくして取得されたプラスミ ド中に挿入された完全長 cDN Aの全長の塩基配 W 03 列解析には、 3種類のシークェンサを用いた。 また、 プラスミドは挿入配列の長 さが 2.5 k bより短いものと長いものの 2つのカテゴリに分けた。このうち 2. 5 k bより短い揷入配列を有するクローンについては両端から塩基配列を解析し た。その際、プラスミドはベクターが PSの場合には配列番号 3 1 (センス鎖)、 及ぴ 32 (アンチセンス鎖) に記載のプライマーを用いて、 またベクターが Z a pの場合には配列番号 33 (センス鎖) 、 及ぴ 34 (アンチセンス鎖) に記載の フフ マ一を用レヽ一 Th e rmo s e qu e n a s e P r i me r C y c 1 e S e q u e n c i n g K i t vAm e r s h am Ph a rma c i a B i o t e c h社製) で反応し、 L i c o r DNA4200 (l o n g r e a d s e q u e n c e r) を用いて解析した。
上記塩基配列解析により解析ができなかったギヤップは、 プライマウォーキン グ法により決定した。その際、 AB I P r i s m377及び/または AB I P r i sm3700 、Ap p l i e d B i o s y s t erns I n c. と B i g D y e t e rm i n a t o r k i tと Cy c l e S e qu e n c i n g F S r e a d y Re a c t i o n K i t (Ap p l i e d B i o s y s t erns I n c. 製) を用レヽた。
また、 挿入されている c DNAが 2. 5 k bより長いクローンの配列決定は、 ショットガン法によった。 その際、 S h i ma d z u R I S A 384と0 E n a m i c E T t e rm i n a t o r c y c l e s e qu e n c i n g k i t (Am e r s h am Ph a rma c i a B i o t e c h社製) を 用いた。 ショッ トガンライブラリを作製するために、 48の独立な代表クローン から PCRで増殖した 48の DNAフラグメントを用いた。 増幅された DNA断 片の末端を T 4 DNAポリメラーゼによって平滑化した。
この DNA断片を、 pUC 1 8ベクターへ挿入し、 更に該組み換えベクターに より大腸菌 DH10Bを形質転換した。 この大腸菌から上記 (2) と同様にして プラスミドを調製した。
それらの代表クローンについては、 両末端からの塩基配列解析によって塩基配 列を決定し、 該塩基配列をコンピューター上で連結した後、 Do u b l e S t r o k e S h e a r i n g De v i c e (F i o r e I n c. による s h e a r i n gを行った。 ショットガン法による塩基配列決定は、 12〜 15 クローンの重複をもって行った。 この塩基配列決定により配列が決定できなかつ たギヤップは、 上記と同様にプライマウォーキングによつて決定した。 実施例 4 塩基配列の解析
(1) d n a f o rm34837 (配列番号 1、 14)
d n a i o rm34837は、 配列番号 1に示すように、 371 7塩基から成 り、 そのうち塩基番号 134から 1690までがオープンリーディングフレーム (終止コドンを含む)になっていた。オープンリーディングフレームから予測され るアミノ酸配列は、 5 18アミノ酸残基から成る (配列番号 14)。配列番号 1が コードするアミノ酸配列について BLASTを用いて相同性検索を行ったところ、 SPTR蛋白質データベース (SWI S S— PROT蛋白質配列データベースと T r EMB L核酸翻訳データベースを統合したもの) 中に、 (i) データベース 登録記号 trembl|AK020600|AK020600—l、 RIKEN full-length enriched library, clone: 9530049C15, SCAN domain containing protein力、 e— v a 1 u e : 5X l(Tm、 100%の一致度で、また( i i )データベース登録記号 trembl|U88080|U88080 一 1、 Zinc finger protein 192 (LD5- 1)は、 SCAN box domainをもつ Kruppel gene familyであり、 e— v a 1 u e : 2X10— 94、 42%の一致度である。 さらに、 ( i i i ) データベース登録記号 gplAF15484618099348、 Homo sapiens zinc finger protein (ZFP)が、 e— v a 1 u e : 4X10— 93、 41%の一致度でヒットした。 これら の結果より、 配列番号 14に示したァミノ酸配列からなるタンパク質は Zinc finger proteinであることが推測された。
また、 配列番号 1に示す塩基配列がコードするアミノ酸配列について、 HMM PFAMによる蛋白質特徴検索を行ったところ、 ZF - C2H2の特徴を示す配列(P f amに LIMとしてェントリーされる塩基配列) が 7回見出された。 これらのことから、 配列番号 1に示す塩基配列がコードするタンパク質は zinc finger型の転写因子であることが推測された。
(2) d n a f o rm63166 (配列番号 2、 15)
d n a f o rm63166は、 配列番号 2に示すように、 3607塩基から成り、 そのうち塩基番号 612から 2126までがオープンリーディングフレーム (終止コド ンを含む) になっていた。 オープンリーディングフレームから予測されるァミノ 酸配列は、 504アミノ酸残基から成る (配列番号 15)。 配列番号 2がコードする アミノ酸配列について B LAS Tを用いて相同性検索を行ったところ、 S PTR 蛋白質データベース (SWI S S— P ROT蛋白質配列データベースと T r EM BL核酸翻訳データベースを統合したもの) 中に、 (i) データベース登録記号 gpnew|BC021456118204788, RIKEN cDNA 2810411K16、 e - v a 1 u e : 2X10— 76、 139アミノ酸にわたって 100%の一致度で、 また (i i) データベース登録記号 trembl | AK0130861 AK013086_1, RIKEN full-length enriched library, clone :2810411K16: SCAN domain containing protein力 e— v a 1 u e :6X10-76、 139アミノ酸にわたって 99%の一致度で、 さらに (i i i) データベース登録記号 gp|AK027384 |14042023, Homo sapiens cDNA FLJ14478 fis, clone MA腿 1001633 力 e— v a 1 u e :1X10— 61、 140アミノ酸にわたって 86%の一致度でヒットした。 また、 HMMPF AMによる蛋白質特徴検索を行ったところ、塩基番号 1880〜 2167に SCAN配列があり、 この特徴から DNA結合蛋白質であることが推測された。
(3) d n a f o rm33383 (配列番号 3、 16)
d n a f o rm33383は、 配列番号 3に示すように、 3704塩基から成り、 そのうち塩基番号 662から 3259までがオープンリーディングフレーム (終止コド ンを含む) になっていた。 オープンリーディングフレームから予測されるァミノ 酸配列は 865アミノ酸残基から成る (配列番号 16)。 配列番号 3がコードするァ ミノ酸配列について B LASTを用いて相同性検索を行ったところ、 S PTR蛋 白質データベース (SWI S S— PROT蛋白質配列データベースと T r EMB L核酸翻訳データベースを統合したもの) 中に、 (i) データベース登録記号 gp|BC008827114250716, Homo sapiens, clone MGC: 13310 IMAGE :4110431、 e—v a 1 u e : 5X10— 145、 919アミノ酸にわたって 40%の一致度で、 また (i i) デー タベース登録記号 trembl F192913|AF192913—l、 Zinc finger protein 180 (HHZ168)が、 e— v a 1 u e : 2X10—63、 231アミノ酸にわたって 51%の一致度で、 さらに (i i i) データベース登録記号 gp|U41164 127843、 Rattus norvegicus Cys2/His2 zinc finger protein (rKrl)が、 e— v a 1 u e : 6X10— 63、 192アミ ノ酸にわたって 56%の一致度でヒットした。
また、 11^^1^ 1^にょる蛋白質特徴検索を行ったところ塩基番号2786〜 3275に zf - C2H2が 6箇所あり、 この特徴から DNA結合蛋白質であることが推測され た。
(4) d n a f o rm39530 (配列番号 4、 17)
d n a f o rm39530は、配列番号 4に示すように、 2397塩基から成り、そのう ち塩基番号 661から 1476までがオープンリーディングフレーム (終止コドンを含 む) になっていた。 オープンリーディングフレームから予測されるアミノ酸配列 は、 271アミノ酸残基から成る (配列番号 17)。 配列番号 4がコードするァミノ 酸配列について B LASTを用いて相同性検索を行ったところ、 S PTR蛋白質 データベース (swi S S— ; PRO T蛋白質配列データベースと T r EMB L核 酸翻訳データベースを統合したもの) 中に、 (i) データベース登録記号 gp|AB05217l| 11611589, Macaca fascicularis brain cDNA, clone :QccE - 18103. が、 e— v a 1 u e : 2Χ1(Γ95、 220アミノ酸にわたって 79%の一致度で、 また (i i ) データベース登録記号 rembl I AF0174331 AF017433— 1, Homo sapiens putative transcription factor CR53は、 e - v a 1 u e : 1 X 10— 32、 56%の一致度である。 さらに ( i i i ) データベース登録記号 gp|BC007287 3938317、 Homo sapiens, Similar to zinc finger protein 202, clone MGC: 15660 IMAGE: 3347511が、 e一 v a l u e : 1X10— 32、 134アミノ酸にわたって 56%の一致度でヒットした。
また、 配列番号 4に示す塩基配列がコードするアミノ酸配列について、 HMM PF AMによる蛋白質特徴検索を行ったところ、 塩基番号 775〜1062に SCA配列 (P f amに SCANとしてエントリーされる塩基配列) 見出した。
これらのこと力 ら、 配列番号 4に示す塩基配列がコードするタンパク質は転写 因子であることが推測された。
(5) d n a f o r m38861 (配列番号 5、 18)
d n a f o r m38861は、配列番号 5に示すように、 2621塩基から成り、そのう ち塩基番号 213から 1703までがオープンリーディングフレーム (終止コドンを含 む) になっていた。 オープンリーディングフレームから予測されるアミノ酸配列 は 496ァミノ酸残基から成る (配列番号 18)。 配列番号 5がコードするアミノ酸 配列について B LASTを用いて相同性検索を行ったところ、 S PTR蛋白質デ ータベース (SWI S S— P ROT蛋白質配列データベースと T r EMB L核酸 翻訳データベースを統合したもの) 中に、 (i) データベース登録記号
Figure imgf000057_0001
Mus musculus, zinc finger proliferation 1、 e— v a 1 u e : 6X10—97、 491アミノ酸にわたって 41%の一致度で、 また (i i) データべ ース登録記号 trembl|D10630|MMZFP51—l、 mouse Zinc finger protein 38 (Zfp - 38) (CtFIN51) (Transcription factor RU49)が、 e— v a 1 u e : 2X10一96、 491アミ ノ酸にわたって 41%の一致度で、 さらに (i i i) データベース登録記号 trembl | AB007886 | AB007886 1、 Hypothetical zinc linger protein KIAA042oz>、 e - v a 1 u e : 2X10— 95、 532ァミノ酸にわたって 44%の一致度でヒットした。 また、 HMMPFAMによる蛋白質特徴検索を行ったところ、 塩基番号 929〜 1585に zf - C2H2力 S8回あり、この特徴から DNA結合蛋白質であることが推測された。
(6) d n a f o r m60441 (配列番号 6、 19)
d n a f o r m60441は、配列番号 6に示すように、 1830塩基から成り、そのう ち塩基番号 122から 1612までがオープンリーディングフレーム (終止コドンを含 む) になっていた。 オープンリーディングフレームから予測されるアミノ酸配列 は 496ァミノ酸残基から成る (配列番号 19)。 配列番号 6がコードするアミノ酸 配列について B LAS Tを用いて相同性検索を行ったところ、 S PTR蛋白質デ ータベース (SWI S S— PROT蛋白質配列データベースと T r EMB L核酸 翻訳データベースを統合したもの) 中に、 (i) データベース登録記号
gp 1BC010591 I 14714873、 Mus musculus, zinc finger proliferation 1, clone MGC: 18498 IMAGE: 3981599、 e— v a 1 u e :6Χ1(Γ97、 491アミノ酸にわたって 41% の一致度で、また( i i )データべース登録記号treπlbl|D10630|醒ZFP51—l、mouse Zinc finger protein 38 (Zfp-38) (CtFIN51) (Transcription factor RU49)力 S、 e - v a 1 u e : 2X ΚΓ96、 491アミノ酸にわたって 41%の一致度で、 さらに (i i i ) データベース登録記号 trembl|AB007886|AB007886—l、 Hypothetical zinc finger protein KIM0426が、 e— v a 1 u e : 2X10_95、 532アミノ酸にわたって 44%の一致度でヒットした。
また、 HMMPF AMによる蛋白質特徴検索を行ったところ、 塩基番号 929〜 1585に zf - C2H2が 8回あり、この特徴から DNA結合蛋白質であることが推測された。
(7) dn a f o rm4251 5 (配列番号 7、 20)
d n a i o rm425 15は、 配列番号 7に示すように、 231 1塩基から成 り、 そのうち塩基番号 1 56から 560までがオープンリーディングフレーム (終止コドンを含む)になっていた。オープンリーディングフレームから予測され るァミノ酸配列は、 134ァミノ酸残基から成る (配列番号 20)。配列番号 7が コードするアミノ酸配列について B LAS Tを用いて相同性検索を行ったところ、 S P TR蛋白質データベース (SWI S S— PROT蛋白質配列データベースと T r EMB L核酸翻訳データベースを統合したもの) 中に、 ( i ) データベース 登録記号 AJ301670, STATc transcriptional repressorが、 e— v a l u e : 4 X 1 (Γ28で、 また 127アミノ酸にわたって 53%の一致度で、 また (i i) デー タべ1 "ス 驟 g己号 P58463、fo:rkhead— related transcription factor 2力、、 e— v a 1 u e : 4 X 10— 23で、 109アミノ酸にわたって 58 %の一致度で、 さらに
( i i i )データベース登録記号 P18480、 Transcription regulatory protein S F5 I e-v a l u e : 2 X l 0一24で、 1 18ァミノ酸にわたって 61 %の一致度 でヒットした。
また、上記( i )のタンパク質は、データベース中の文献情報(Mol. Cell, 7(4), 779 - 88(2001)) 力 ら初期の発生速度と末端分化のタイミングの制御に関ること、 および、 ecmA遺伝子の発現を制御するリプレッサーとして機能することが、 また 上記 (i i) のタンパク質は、 データベース中の文献情報 (J. Biol. Chem. 1998, 273 (36) :23335-43)から肺および胎盤に発現されている転写因子でいくつかの肺 特異的遺伝子の cis因子に結合すること力 S、さらに上記(i i i)のタンパク質は、 データベース中の文献情報 (Μο1· cell. Biol. , 1990, 10 (11): 5616- 25) から グルコースおよびリン酸により制御される遺伝子の転写制御に関わることがそれ ぞれ明らかとなった。
これらの結果より、 配列番号 7に記載の塩基配列がコードするタンパク質は転 写因子であることが推測された。
(8) d n a f o r n41143 (配列番号 8、 21)
d n a f o r m41143は、配列番号 8に示すように、 2646塩基から成り、そのう ち塩基番号 149から 1591までがオープンリーディングフレーム (終止コドンを含 む) になっていた。 オープンリーディングフレームから予測されるアミノ酸配列 は、 480アミノ酸残基から成る (配列番号 21)。 配列番号 8がコードするァミノ 酸配列について B LASTを用いて相同性検索を行ったところ、 S PTR蛋白質 データベース (swi S S—PRO T蛋白質配列データベースと T r EMB L核 酸翻訳データベースを統合したもの) 中に、 ( i )データベース登録記号 AL034555、 zinc finger protein 151 (pHZ- 67)が、 e—v a l u e : l X l 0— 25で、 また 121 アミノ酸にわたって 48%の一致度で、また( i i )データベース登録記号 Q13105、 Myc— interacting zinc finger protein力 λ、 e—— v a l u e : 2 X l O "5で、 121 アミノ酸にわたって 48%の一致度でヒットした。 これらの結果より配列番号 21 に示したアミノ酸配列からなるタンパク質は Zinc finger型 DNA結合蛋白質である ことが推測された。
また、 上記 (i i) のタンパク質は、 データベース中の文献情報 (Curr Top Microbiol Immunol 1997; 224: 137-46)力 ¾ら、 My c- interacting zinc finger protein であることが明らかとなった。 また、 配列番号 8に示す塩基配列がコ一ドするァミノ酸配列について、 HMM P F AMによる蛋白質特徴検索を行つたところアミノ酸番号 9 - 121に蛋白質二量 化に関わる特徴を示す配列(P f amに BTBとしてエントリーされるアミノ酸配 列) を見出した。 また、 Zinc finger domain (P f a mに zf- C2H2としてェントリ 一されるアミノ酸配列)も 1ケ所で見出した。
これらのことから、 配列番号 8に示す塩基配列がコードするタンパク質は Zinc finger型 DM結合蛋白質であることが推測された。
(9) d n a f o r m34196 (配列番号 9、 22)
d n a f o r m34196は、配列番号 9に示すように、 2796塩基から成り、そのう ち塩基番号 597から 1982までがオープンリーディングフレーム (終止コドンを含 む) になっていた。 オープンリーディングフレームから予測されるアミノ酸配列 は、 461アミノ酸残基から成る (配列番号 22)。 配列番号 9がコードするァミノ 酸配列について B LASTを用いて相同性検索を行ったところ、 SPTR蛋白質 データベース (s W I S S- P RO T蛋白質配列データベースと T r EMB L核 酸翻訳データベースを統合したもの) 中に、 ( i )データベース登録記号 Q9P255、 Hypothetical zinc finger protein KIM1473力、、 e— v a 1 u e : 1 X 10— 5。 で、 また 295アミノ酸にわたって 37%の一致度で、 また (i i) データベース登録 記号 P52742、 Zinc finger protein 135が、 e— v a l u e : 2 X 10— 58で、 277 アミノ酸にわたって 39%の一致度でヒットした。 これらの結果より配列番号 22 に示したァミノ酸配列からなるタンパク質は Zinc finger型 DNA結合蛋白質である ことが推測された。
また、上記( i i )のタンパク質は、データベース中の文献情報(Genomics 1995 May 20;27 (2) :259-64) から、 zinc finger Kruppel familyであることが明らかと なっており、 発達障害などに関わることが分かった。
また、 配列番号 9に示す塩基配列がコードするアミノ酸配列について、 HMM P F AMによる蛋白質特徴検索を行ったところ、 アミノ酸番号 43— 299に Zinc finger domain (P f a mに zf- C2H2としてェントリーされる配列)を 9ケ所で見出 した。
これらのことから、 配列番号 9に示す塩基配列がコードするタンパク質は Zinc finger型 DNA結合蛋白質であることが推測された。
(10) d n a f o r m37479 (配列番号 10、 23)
d n a f o r m37479は、配列番号 10に示すように、 2717塩基から成り、その うち塩基番号 230から 907までがオープンリーディングフレーム (終止コドンを含 む) になっていた。 オープンリーディングフレームから予測されるアミノ酸配列 は、 225アミノ酸残基から成る (配列番号 23)。 配列番号 10がコードするアミ ノ酸配列について B LASTを用いて相同·生検索を行ったところ、 S PTR蛋白 質データベース (swi S S— P ROT蛋白質配列データベースと T r EMB L 核酸翻訳データベースを統合したもの) 中に、 ( i )データベース登録記号 Q9NQX1、 PR-domain zinc finger protein 5か、 e— v a 1 u e : 3 X 10— 13で、 まに 62 アミノ酸にわたって 50%の一致度で、また( i i )データベース登録記号 X82018、 zinc finger protein with interaction domain力 e— v a 1 u e : 2 X 10— 12 で、 81アミノ酸にわたって 43%の一致度でヒットした。 これらの結果より、 配列 番号 23に示したアミノ酸配列からなるタンパク質は Zinc finger型 DNA結合蛋白 質であることが推測された。
また、上記( i i )のタンパク質は、データベース中の文献情報(Genes Dev 1994 Jul 15 ;8 (14) :1664— 77) 力 ら、 zinc finger protein with interaction domain であることが分かった。
また、 配列番号 10に示す塩基配列がコードするァミノ酸配列について、 HM MP F AMによる蛋白質特徴検索を行ったところアミノ酸番号 12— 34と 40— 63に Zinc finger domain (P f a mに zf - C2H2としてェントリーされる配列)を 2ケ所 で見出した。
これらのこと力 ら、 配列番号 10に示す塩基配列がコードするタンパク質は Zinc finger型 DNA結合蛋白質であることが推測された。
(1 1) d n a f o r m59635 (配列番号 1 1、 24) d n a f o r m59635は、配列番号 11に示すように、 2709塩基から成り、その うち塩基番号 566から 1228までがオープンリーディングフレーム (終止コドンを 含む) になっていた。 オープンリーディングフレームから予測されるアミノ酸配 列は、 220ァミノ酸残基から成る (配列番号 24)。 配列番号 1 1がコードするァ ミノ酸配列について B LASTを用いて相同性検索を行ったところ、 S PTR蛋 白質データベース (SWI S S— P ROT蛋白質配列データベースと Tr EMB L核酸翻訳データベースを統合したもの) 中に、 (i) データベース登録記号 Q9職 1、 PR-domain zinc finger protein 5力 e— v a l u e : 4 X 10一13で、 また 62アミノ酸にわたって 50%の一致度で、 また (i i) データベース登録記号 X82018、 zinc finger protein with interaction domain力 e— v a 1 u e : 3 X 10— 11で、 81アミノ酸にわたって 41%の一致度でヒットした。 これらの結果よ り配列番号 24に示したァミノ酸配列からなるタンパク質は Zinc f inger型 DNA結 合蛋白質であることが推測された。
また、上記( i i )のタンパク質は、データベース中の文献情報(Genes Dev 1994 Jul lo,8 (14): 16D4- 7J ら、 zinc finger protein with interaction domain であることが分かった。
また、 配列番号 1 1に示す塩基配列がコードするアミノ酸配列について、 HM MP F AMによる蛋白質特徴検索を行ったところ、 アミノ酸番号 12— 34と 40— 63 に Zinc finger domain (P f amに zf - C2H2としてェントリーされる配歹 lj)を見出 した。
これらのことから、 配列番号 1 1に示す塩基配列がコードするタンパク質は Zinc finger型 DNA結合蛋白質であることが推測された。
(1 2) d n a f o r m33773 (配列番号 1 2、 25)
d n a f o rm33773は、配列番号 1 2に示すように、 3249塩基から成り、その うち塩基番号 487から 2127までがオープンリーディングフレーム (終止コドンを 含む) になっていた。 オープンリーディングフレームから予測されるアミノ酸配 列は、 546ァミノ酸残基から成る (配列番号 25)。 配列番号 12がコードするァ ミノ酸配列について BLASTを用いて相同十生検索を行ったところ、 S PTR蛋 白質データベース (SWI S S— P ROT蛋白質配列データベースと T r EMB L核酸翻訳データベースを統合したもの) 中に、 (i) データベース登録記号 AF097416、 Mus musculus zinc finger transcription factor Kaiso力21、 e— v a 1 u e : 2 X 1 0— 27で、 また 94アミノ酸にわたって 58 °/0の一致度で、 また ( i i ) データベース登録記号 AF420316、 Xenopus laevis BTB/POZ zinc finger transcription factor XKaiso力 S、 e— v a 1 u e : 2 X 10— 29で、 1 36ァミノ酸にわたって 48 %の一致度でヒットした。 一
また、 配列番号 1 2に示す塩基配列がコードするアミノ酸配列について、 HM MP F AMによる蛋白質特徴検索を行ったところ、 配列番号 25のアミノ酸番号 17— 131の領域に BTB (for BR-C, ttk and bab) or POZ (for Pox virus and Zinc finger)ドメインの特徴を示す配列 (P f a mに BTBとしてエントリーされるアミ ノ酸配列)を見出し、ァミノ酸番号 337 - 380の領域に Msx-interacting- zinc finger の特徴を示す配列 (P f amに zf-MIZとしてエントリーされるアミノ酸配列) を 見い出し、 アミノ酸番号 340- 508の領域に 4力所にわたって Zinc finger, C2H2 typeの特徴を示す配列 (P f a mに zf - C2H2としてェントリーされるアミノ酸配 列) を見いだした。
これらの結果より、 配列番号 12に示す塩基配列がコードするタンパク質は zinc fingerを持った Kaiso様の転写因子であることが推測された。
(13) d n a f o r m51218 (配列番号 13、 26)
d n a f o rm51218は、配列番号 13に示すように、 2950塩基から成り、その うち塩基番号 167から続くフレームで 2950 (配列の最後の塩基)まで終止コドン以 外のアミノ酸のコドンが続く。 167から 2950の領域がコードするアミノ酸配列は、 927アミノ酸残基から成る (配列番号 26)。 配列番号 13がコードするアミノ酸 配列について B LASTを用いて相同性検索を行ったところ、 S PTR蛋白質デ ータベース (SWI S S—PROT蛋白質配列データベースと T rEMBL核酸 翻訳データベースを統合したもの) 中に、 ( i )データベース登録記号 AY044336、 Xenopus laevis DNA-methylation dependent transcriptional repressor Kaiso - like protein (Kaiso)が、 e— v a l u e : 4X 10— 32で、 また 1 37ァ ミノ酸にわたって 48%の一致度で、また( i i )データベース登録記号 AF420316、 Xenopus laevis BTB/POZ zinc linger transcription factor XKaiso 力 S、 e -v a l u e : 4X 1 CT32で、 137アミノ酸にわたって 48%の一致度でヒッ トした。
また、 配列番号 13に示す塩基配列がコードするアミノ酸配列について、 HM MP F AMによる蛋白質特徴検索を行ったところ、 配列番号 26のアミノ酸番号 17— 131の領域に BTB (BR-C, ttk and bab) or POZ (Pox virus and Zinc finger) ドメインの特徴を示す配列 (P f amに BTBとしてエントリーされるアミノ酸配 列) を見出し、 アミノ酸番号 337- 380の領域に Msx- interacting- zinc fingerの特 徴を示す配列 (P f amに zf - MIZとしてエントリーされるアミノ酸配列) を見い 出し、 ァミノ酸番号 340- 537の領域に 5力所にわたって Zinc finger, C2H2 type の特徴を示す配列(P f amに zf- C2H2としてェントリーされるアミノ酸配列)を 見いだした。
これらの結果より、 配列番号 13に示す塩基配列は zinc fingerを持った Kaiso 様の転写因子遺伝子配列の一部分であることが推測された。
(14) dn a f o rm35763 (配列番号 37、 38)
d n a f o r m35763は、配列番号 37に示すように、 1138塩基から成り、その うち塩基番号 89から 1138までがオープンリーディングフレーム (終止コドンは現 れず、 1138が塩基配列中の最終コドン) になっていた。 オープンリーディングフ レームから予測されるアミノ酸配列は、 350アミノ酸残基から成る (配列番号 38)。配列番号 37がコードするアミノ酸配列について B LASTを用いて相同 性検索を行ったところ、 S PTR蛋白質データベース (SWI S S— PROT蛋 白質配列データベースと T r EMB L核酸翻訳データベースを統合したもの) 中 に、 ( i ) データベース登録記号 035368、 Interferon- activatable protein 203 が、 e— v a l u e : 7 X l 0— 67で、 348アミノ酸にわたって 43%の一致度で、 ま た (i i ) データベース登録記号 P41218、 Myeloid cell nuclear differentiation antigenが、 e— v a l u e : 1 X 1 0— 38で、 また 355アミノ酸にわたって 33%の 一致度で、 さらに (i i i ) データベース登録記号 Q16666、
Gamma- interferon- inducible protein Ifi- 16力 ¾、 e— v a 1 u e : 6 X 1 0 "9 で、 351アミノ酸にわたって 33%の一致度でヒットした。 これらの結果より配列番 号 3 8に示したアミノ酸配列からなるタンパク質はインターフェロンによって発 現誘導され核内に存在することが推測された。
また、 上記 ( i ) のタンパク質 (I AP様活性を有するタンパク質) は IFN- inducible proteins ("200- family")の一つであり、 マウス (IFI202a, IFI202b, IFI203, IFI204 and D3)および ヒ ト(MNDA, IFI- 16及び AIM2) で構造 上類似しているのみならず、核内に存在すること、並びに IFI202の遺伝子産物 p202 は転写因子 F - κ B、 c - Fos、 及ぴ c-Junに結合し転写を抑制することが報告されて いる (Mol. Cell. Biol. 16, (1996) 359—368) 。 ( i i ) のタンパク質は、 デー タベース中の文献情報(Immunogenetics41:40-43(1995)) から骨髄系での転写の 調節に関わることが、 また上記 (i i i ) のタンパク質は、 データベース中の文 献情報 (Biochemistry 37: 11924-11931 (1998)) から転写の抑制に関わることがそ れぞれ明らかとなった。
また、 配列番号 3 7に示す塩基配列がコードするァミノ酸配列について、 HM MP F AMによる蛋白質特徴検索を行ったところ、配列番号 3 8のアミノ酸番号 3 一 87がコードするアミノ酸配列にタンパク質相互作用を行う分子の特徴を示す配 列 (P f a mに PMD抑 APINとしてェントリーされる塩基配列) を見出した。
これらのことから、 配列番号 3 7に示す塩基配列がコードするタンパク質は I A P様活性を有するタンパク質であり、インターフェロンによって発現誘導され、 タンパク質相互作用を介して転写因子の働きを修飾する機能を有する転写制御因 子であることが推測された。 実施例 5 DNAマイクロアレーを用いた組織発現解析 組織発現解析は、 Miki, R., et al. , Pro Natl. Acad. Sci. USA, 98, 2199-2204 (2001)の記載に従って行った。
(1) DN Aマイクロアレーの作成
2種類のマウス全長 c DNAの塩基配列 (d n a f o rm33383、 d n a f o r m341 96) およぴ解析対象のマウス全長 c D N Aと同じクラスタに属 する (該 c DNAと相同な塩基配列を有する) 1種類のマウス c DNAライブラ リー FANTOM (http://fantom. gsc. riken. go. jp/) 由来の c DNAの塩基配 歹 lj (FANTOM NO:9530049C15) を、 M 1 3フォワードおよびリバースプライマーを 用いて増幅後、 この P CR産物をイソプロパノールにて沈澱させ 15 1の 3 X S S C液に溶解した。これらの 3種類の DNA溶液をポリ Lリジンコートしたガラ ススライドに、 16チップ(SMP 3、 Te 1 e Ch em I n t e r n a t i o n a l、 S unny v a l e, CA) の D N Aアレイヤーを用いてスポットし、 DN Aマイクロアレーを作成した (方法の詳細は
http://cmgm. Stanford, edu/pbrown/mguide/index. htmlに 己 され飞いる)。マウ ス ]3ァクチンとグリセルァノレデヒ ド- 3 - フォスフエ一トデヒドロゲナーゼの c DNAをポジティブコントロー/レとし、 シロイヌナズナの c DN Aをネガティブ コントロールとして用いた。
この DNAマイクロアレーの検出感度は、 1細胞当たり mRNAlないし 3コ ピーであった。 ターゲット配列との一致度がおよそ 80%のクローンのシグナル 強度は、 完全に配列が一致するクローンの 10分の 1であった。 ターゲット配列 との一致度が 80 %未満のク口ーンのシグナル強度は、 パックグランドレベルで めった。
(2) プローブの調製
C 57BL/6 Jマウスの胎児、 新生仔、 アダルトの 22組織 (腎臓、 脳、 脾 臓、 肺、 肝臓、 精巣、 脖臓、 胃、 小腸、 結腸、 胎盤、 心臓、 胸腺、 小脳、 子宮、 骨、 筋肉、 背側腎臓由来脂肪細胞、 副精巣由来脂肪細胞、 内臓脂肪、 10日齢新 生児小脳、 10日齢新生児皮膚) から抽出した mRNAl μ gを定法に従いラン ダムプライム逆転写 S応を行い蛍光色素 C y 3 (Ame r s h am P h a r m a c i a社) を取りこませた。 他方、 1 7. 5日齢の胎児全身から抽出した mR NA1 μ gをランダムプライム逆転写反応を行い、 蛍光色素 Cy 5を取りこませ 発現解析のリファレンスとした。 C y Dy e標識 c DNAプローブは、 Cy S c r i b e G F X P u r i f i c a t i o n K i t (Am e r s h a m P h a rma c i a社) を用いて精製し、 滅菌水 1 7 μ 1にてカラムから溶出した。 こ れに 3 t lの l O ^u gノ μ ΐ o l i g o (dA) , 3 μ Iの酵母 t RNA 20 μ g/ μ 1 , 1 1の 20 μ g//z 1マウス C ο t 1 DNA, 5. 1 /z 1の 2 OXS S C, および 0. 9 μ 1の 1 0%SD Sからなるブロッキング溶液を混和 して C y Dy e標識 c DNAプローブを調製した。
(3) DNAマイクロアレーのハイブリダィゼイシヨン
発現解析対象組織由来 cDN Aプローブ(Cy 3標識)とリファレンスの 1 7. 5日齢胎児由来 c DNAプローブ(C y 5標識)を混和した溶液 3 0 μ 1を 9 5 °C にて 1分間熱処理を行い室温にて冷却した。 D N Aマイクロアレーに上記プロ一 ブ溶液を添加し力バースリップを被せ、 Hy b r i c a s e t t e (A r r a y I t社) 中にて 6 5 °C—晚ハイブリダィズさせた。 次に、 DN Aマイクロアレー を 2 X S SC, 0. 1 %SD Sを用いて洗浄し、 続いて 1 X S S Cにて 2分間、 0. 1 X S S Cにて 2分間リレスした。 マイクロアレーは S c a nAr r a y 5
000共焦点レーザースキャナーを用いてスキャンし、画像を I MAGENE(B
1 o D i s c o V e r y社) で解析した。
(4) データ解析
各組織中の mRNA量 (C y 3標識) は、 リファレンスの 1 7. 5日齢の胎児 全身 mRNA量 (Cy 5標識) との比 (C y 3/C y 5) を対数 ( 1 o g 2) で 表示した。 すなわち、 解析対象とする各マウス全長 c DNAに対応する mRNA 発現量が、 リファレンス組織中よりも各組識中の方が多い場合は正の数値で、 少 ない場合は負の数値で、 等しい場合は 0で示される。 データの正確性を増すため に実験は独立に 2回行い、 再現性の有る結果を採用した。 結果を以下の表 1に示 す。
一般的に、 DN Aアレーを使用した発現解析では、 2倍程度の増減は実験誤差 とみなされる。 このことから、 表 1に示す結果の数値が 1以上の場合にはある組 織中の mRNA量が対照である 17. 5日齢の胎児全身の mR N A量と比較して 2倍以上であり、 有意に増加していると解釈した。 逆に、 結果の数値が一 1以下 の場合は、 ある組織中の mRNA量が対照である 1 7. 5日齢の胎児全身の mR N A量と比較して 2分の.1以下であり、 有意に減少していると解釈した。 また、 任意の組織間の: mRN A発現量を比較検討する際は、 各組織における数値の差が 1であれば mRNA量は 2倍、 2であれば mRNA量は 4倍であり、 逆に、 組織 間の数値の差が一 1であれば mRN A量は 1 2倍、 一 2であれば mRN A量は 1/4倍であることを意味する。
なお、 マイクロアレイにスポットした DNAと同じクラスタに属し、 該 DNA と少なくとも 200塩基に亘り 80%以上の塩基配列の一致度を有する領域を有 するマウス c DNAクローンについても、表 1に解析対象 c DNAとして記載し、 マイクロアレイにスポットした該 DN Aの測定結果の数値を代用して記載した。
表 1
解析対象 cDNマイクロアレーにスポット 腎臓 m 脾臓 肺 肝臓
A した DNA
dnaform34837 FANTOM NO:9530049C15 0.215624 0.09994 -0.549275 0.263561 -0.644025 dnaform33383 dnaform33383 一 0.967154 -1.94084 -0.530935 -0.849859 -1.50833 dnaform39530 dnaform33383 -0.967154 -1.94084 -0.530935 -0.849859 -1.50833 dnaform34196 dnaform34196 0.575673 0.492556 -0.251263 -0.214111 0.174794 解析対象 cDNマイクロアレーにスポット 精巣 膝臓 小腸
A した DNA
dnaform34837 FANTOM NO:9530049C15 -0.534563 1.8217 0.140585 0.391403 -0.675639 dnaform33383 dnaform33383 -0.828989 -1.24605 —1.0925 -0.422953 -1.12887 dnaform39530 dnaform33383 -0.828989 -1.24605 -1.0925 -0.422953 -1.12887 dnaform34196 dnaform34196 -1.25627 一 0.639753 -0.267965 0.152673 -0.20377 解析対象 cDNマイクロアレーにスポット 胎盤 心臓 胸腺 小脳 子宮
A した DNA
dnaform34837 FANTOM NO:9530049C15 0.054901 0.001484 -0.718892 -0.612813 0.49295 dnaform33383 dnaform33383 -1.30591 -1.34701 -0.143147 一 1.23766 -0.352747 dnaform39530 dnaform33383 -1.30591 -1.34701 -0.143147 -1.23766 -0.352747 dnaform34196 dnaform34196 -0.913309 -0.103305 0.284258 0.316549 -0.230652 解析対象 cDNマイクロアレーにスポット 骨 筋肉 背側腎臓 副精巣由来 内臓脂肪 A した DNA 由来脂肪 脂肪細胞
細胞
dnaform34837 FANTOM NO:9530049C15 0.059756 -0.189622 0.453962 1.20201 - 0.021024 dnaform33383 dnaform33383 -0.932356 -1.1704 -0.504222 -0.239201 -0.413961 dnaform39530 dnaform33383 -0.932356 -1.1704 -0.504222 -0.239201 -0.413961 dnaform34196 dnaform34196 -1.1193 0.235903 -0.699993 -0.350302 -0.301257 解析対象 cDNマイクロアレーにスポット 10曰齢新 10日齢新生
A した DNA 生児小脳 _児皮膚
dnaform34837 FANTOM NO:9530049C15 -0.240865 0.46505
dnaform33383 dnaform33383 -0.744533 - 0.369415
dnaform39530 dnaform33383 —0.744533 -0.369415
dnaform34196 dnaform34196 0.738951 -0.070083
d n a f o rm34837は、 FANTOM No:9530049C15をプローブとした発現解 析により、 脖臓でのみ発現が増加していることがわかった。 d n a f o rm33 383は、 それ自身をプローブとした発現解析により、 広い組織範囲で発現が低 下していることがわかった。 d n a i o rm39530は、 d n a f o rm33 383をプローブとした発現解析により、 広い組織範囲で発現が低下しているこ とがわかった。 d n a f o rm34916は、 それ自身をプローブとした発現解 析により.、 精巣でのみ発現が低下していることがわかった。 実施例 6 P C R法を用いた組織発現解析
本発明のタンパク質をコードする mRNAの正常マウスおよび疾患マウスでの 組織発現変動を検討するために、 定法 (Higuchi R, et al. , Biotechnology, 11: 1026-30 (1993)) に従い、 P C R法を用いた組織発現解析を行った。
(1) cDNA合成
以下のマウス (森脇和郎、 外 1名編、 Molecular Medicine別冊、 Vol. 36 「自然 発症疾患モデル動物」 、 中山書店、 1999年) の 1 9組織からトータル RNAを抽出 し、 オリゴ dTをプライマーとして逆転写酵素を用いて c DNA合成を行った。 ( a ) 正常マゥスの組織およぴ糖尿病モデルマゥスの組織
①対照マウス CWBL/KsJ - +m/+m Jcl (メス、 8週齢) の全脳、 視床、 肺、 腎臓、 骨髄、 脖臓、 脂肪細胞、 肝臓、 眼
②糖尿病モデルマウス C57BL/KsJ- db/db Jcl (メス、 8週齢) の脾臓、脂肪細胞、 肝臓、 眼
(b) 老化促進マウスの組織
①正常老化マウス SAM Rl/TA Sic (ォス、 13週齢) の海馬、 前頭葉皮質
②老化促進マウス SAM P8/Ta Sic (ォス、 15週齢) の海馬、 前頭葉皮質
(c) 癌転移モデルマウスの組織
①対照マウス Balb/p (メス、 5週齢) の正常結腸
②癌転移モデルマウス Balb/c (メス、 6週齢) の結腸癌 (マウス腹腔に結腸癌細 胞 Colon26を移植し、 2週間後に結腸癌を摘出)
(2) PCR法による定量
下記の 7個の、 本発明のタンパク質をコードしている mRNAの発現は、 ライ トサイクラ一定量 PCR装置 (ロシュ ·ダイァグノステイクス社) と
LightCycler-FastStart DNAマスター SYBR Green I試薬を用いて、 製品に添付 されているプロトコールに従い定量した。定量 PCRに用いた合成 DNA配列を以下 に示す。 (a) d n a f o rm33773
5, 側プライマー: AGGATTGGCGMCTATCCAG (配列番号 39
3, 側プライマー: CCACGAGTGMCATTTGCAT (配列番号 40
(b) dn a f o rm3886 1
5, 側プライマー: ACTCAGAGAGCCAGCCAGM (配列番号 41
3, 側プライマー: TGTTGGMCCGTTTCCTGAG (配列番号 42
c) d n a f o rm41 143
5, 側プライマー: GCTGCACAAACGGTCTCATA (配列番号 43
3, 側プライマー: ACCMGAGGTGCMCAGAGG (配列番号 44
d) dn a f o rm4251 5
5, 側プライマー: TGTGCTGTCATCTGAGACTTGA (配列番号 45)
3, 側プライマー: CCTTGTACACMCCMGGGTAGA (配列番号 46)
(e) d n a f o rm51218
5, 側プライマー: AGGATTGGCGMCTATCCAG (配列番号 47)
3 ' 側プライマー: CTCCACGAGTGMCATTTGC (配列番号 48)
( f ) d n a f o rm60441
5, 側プライマー: TCAGGAAACGGTTCCMCAT (配列番号 49)
3 ' 側プライマー: TCCTTGGAGGATTTCTTCTCTG (配列番号 50)
(g) dn a f o rm35763
5, 側プライマー: CCCCCAAMCTCCAAAAAGA (配列番号 51)
3, 側プライマー: GMCCTTGCTGGTGACCATT (配列番号 52 )
定直結果は Glyceraldehyde 3- phosphate dehydrogenase (GAPDH) を内咅 |5 標準として、 捕正した。 即ち、 各組織での対象遺伝子の発現量 (コピー数 / 1 ) を GAPDHの発現量 (コピー数/; i 1 ) で除し、 定数 ( 1 X 106) (注: 10の 6 乗) を乗じて表示した。
結果をまとめると、 d n a f o rm33773は全身で強く発現するが、 特に 肺、 膝臓、 脂肪、 脳で強力に発現した。 d n a f o rm38861は全身で強く 発現するが、 特に勝臓、 肺で強力に発現した。 d n a f o rm41 143は全身 で発現するが、 勝臓、 肺、 脂肪で比較的強く発現した。 d n a f o rm4251 5は脳に特異的に発現し、 特に前頭様皮質で強力に発現した。 d n a f o r m5 1218は全身で強く発現するが、 特に肺、 脖臓、 脂肪、 脳で強力に発現した。 d n a f o rm60441は全身で発現するが、 特に膝臓、 肺で強く発現した。 d n a f o rm35763は骨髄、 肺で強力に発現し、 糖尿病の脂肪細胞おょぴ 結腸癌で発現が増強した。 上記クローンの c DNAおよぴ該 c DNAによってコ ードされるタンパク質は、 糖尿病や癌などの治療や診断に応用できる。 また該 c DNAによってコードされるタンパク質は、 上記のような mRNA発現の変動が 見られる組織あるいは mRN A発現量の多い組織に関わる疾患に関与している可 能性がある。
表 2
Figure imgf000072_0001
実施例 7 質一 質相互作用解析
哺乳動物細胞における two— hy b r i d法 (Suzuki, H., et al. , Genome Research, 11, 1758-1765 (2001)) を用いて、 2種類のマウス全長 c D NAの塩 基配列 (d n a f o rm33773、 dn a f o rm34837) のタンパク質 コ一ド配列がコードするタンパク質のタンパク質一タンパク質相互作用を網羅的 に解析した。
(1) PCR法を用いた迅速なサンプル調製
哺乳動物細胞での two— h y b r i d実験は、 C h e c kMa t e ma mm a 1 i a n two— hy b r i d s y s t em (P r ome g a社製) ¾"利用 した。 タンパク質一タンパク質相互解析用のサンプルは、 CMVプロモーターの 下流に Ga 1 4遺伝子の DN A結合領域を挿入したプラスミ ドベクター pB I N D、 CMVプロモーターの下流に VP 16遺伝子の転写活性化領域を挿入したプ ラスミ ドベクター pACT, および 5個の Ga 1 4結合領域と TAT Aボックス の下流にレポーターであるルシフェラーゼ遺伝子を挿入したプラスミ ドベクター p G 5 1 u cを铸型として調製した。 Ga 1 4遺伝子と 2種類のマウス全長 cD N Aの塩基配列 (d n a f o rm33773、 d n a f o rm34837) のタ ンパク質コ一ド配列との融合遺伝子、 並びに V P 16遺伝子とマウス cDNAラ イブラリー FANTOM (http://fantom. gsc.riken. go. jp/) の各クローンが有 する完全長 cDNAのタンパク質コード配列との融合遺伝子は、 基本的に P r o me g a社のプロトコールに従い共通配列部分を用いた連結と 2段階 PCR法を 組み合わせて作成した (Suzuki, H. , et al. , Genome Research, 11, 1758 - 1765 (2001)) 。 マウス c DNAのタンパク質コード配列を、 5, 側に共通配列をもち 3,側に遺伝子特異的な配列をもつフォヮ一ドプライマ一おょぴ M13ユニバーサル プライマーとを用いて PCR増幅した後、 上記増幅産物と p B I NDまたは p A CTの PCR増幅産物 (3' 側に共通配列を付カ卩した) とを混和し、 それぞれネ スティ ドプライマ一を用いて第 2段の PCR増幅を行い、 Ga 1 4とマウスタン パク質の融合タンパク質を発現させるベクター (B I NDサンプル) または VP 16とマウスタンパク質の融合タンパク質を発現させるベクター (ACTサンプ ル) を構築した。 ( 2 ) ハイスループッ トな哺乳動物細胞での two— hy b r i d実験
PCR法で調製した B I NDおよび ACTサンプルは、 それ以上の精製を行わ ずに直接使用した。 B I NDサンプルおよび ACTサンプルのそれぞれ 0. 25 i l、 30n gの: pG5 1 u c、 および 9. 5 1の Op t i—MEM培地 (L i f e t e c h社製) を 384ゥエルプレートに分注した。 Op t i— MEM培 地にて 32倍希釈した LF 2000トランスフエクシヨン試薬 (L i f e t e c h社製) 10 μ 1をゥエルに加えて混和し 20分間インキュベーション後、 F 1 2培地にて 1, 300細胞 1に懸濁した CHO— Κ 1チャイニーズハムスタ 一細胞液 20 μ 1を加えて良く懸濁した。アツセィサンプルを C02インキュベー ター内で 20時間培養後、 ルシフエラーゼ活性は S t e a d y— G l o Lu c i f e r a s e As s a y Sy s t em (P r o m e g a社 ) 用いて測 定し、 相互作用を確認した。
この結果、 2種類のマウス全長 c DNAの塩基配列 (d n a f o rm3377 3、 d n a f o rm34837) のタンパク質コード配列がコードするタンパク 質は、 以下に示す特定のタンパク質 (マウス c DNAライブラリー FANTOM の特定のクローンが有する c DNAのタンパク質コード配列がコードする特定の タンパク質) との相互作用をそれぞれ有していることが明らかとなった。
表 3
Figure imgf000075_0001
( 3 ) 考察
Dnaf orm33773にコードされる本発明のタンパク質は、 SRP40と分子間相互作用す ることがわかった。 SRP40は、 mRNA前駆体のスプライシング反応に関与する蛋白質 の一群である SR蛋白質のひとつであって、 phosphatidylinositol 3- kinaseが関与 する protein kinase C beta II mRNAのスプライシング経路に必要な蛋白質であ る。この SRP40が protein kinase C beta IIの発現を調節し、この働きにより insulin 依存的な糖代謝が制御されていることが知られている (J. Biol. Chem. , 276 (25): 22648-54, 2001) 。 したがって、 SRP40の異常は糖尿病の原因となりうる。
Dnaform33773にコードされる本発明のタンパク質は、 Zincfingerをもち、 転写制 御活性を有することが予想されており、 これらの結果を総合的に解析すると、 糖 尿病の原因となりうる SRP40と結合する Dnaf orm33773にコードされるタンパク質 は、 糖尿病の原因となりうる蛋白質であると推測できる。
Dnaform34837にコードされる本発明のタンパク質は、 Pregnane X receptor 2 (PXR2)と相互作用することがわかった。 PXR2は核内ステロイド受容体の 1つで、 ステロイド化合物を介する情報伝達系に複合的に関与する核内受容体の 1つであ る。 肝臓においては細胞質に存在し、 リガンドに曝露されることにより RXR (Retinoid X receptor)とへテロ二量体を形成して核に移行し、特異的遺伝子発 現に関与していることで知られている。具体的には、例えば、 PXRは医薬品に応答 してチトクローム P450(CYP)酵素等の薬物代謝系を誘導することが知られており、 生体内での異物(医薬品)センサーとして機能していると推測されている。また、 この PXRの異常は、糖尿病、高脂血症、 高血圧、虚血性心疾患といったいわゆる生 活習慣病の原因となり、 様々な内分泌疾患を引き起こすことが知られている。 Dnaform34837にコードされる本発明のタンパク質は Zinc- finger proteinであり、 転写制御活性を有する蛋白質であることが予測されており、 核内に存在して特定 の DNA配列に結合することによつて情報伝達系に関与していることが予想される。 以上の結果を総合的に解析すると、 Dnaform34837は、 PXR2と共存する条件でへテ 口二量体を形成し、 転写制御に関与する可能性があるタンパク質であると推測で きる。 実施例 8 ヒ トオルソログ DN Aの取得
(1) d n a f o rm33383のヒ トオルソログ DNAの予測
d n a f o rm33383の塩基配列 (配列番号 3) を問い合わせとして、 ヒ トゲノムドラフト配列 (NCB I B u i l d 30 ;
http://w . ncbi. nlm. nih. gov/About/Doc/hsfFgenomeintro. html)にスすし B L A ST検索を行ったところ、 相同性の高い領域として 16番染色体の 6 p 1 2. 1 の 24. 62Mbから 24. 66 M bの領域を見出した。
該ゲノム配列領域に対して、 遺伝子予測プログラム Ge n s c a n
(http: //genes, mit. edu/GENSCAN. html) を用いて遺伝子領域予測を行レ、、 得られ た予測転写産物配列に対して相同性検索を行ったところ、 3520塩基よりなる 配列 (配列番号 53) を得た。 この塩基配列は、 塩基番号 319— 321 9に 2 904塩基のオープンリーディングフレーム (配列番号 35) を含んでいた。 配 列番号 3のマウス塩基配列は、 この配列番号 35のヒト塩基配列と約 2580塩 基対の長さに渡って 81 %の相同性をもつことがわかった。
また、 配列番号 35の塩基配列から配列番号 36のヒ トァミノ酸配列に翻訳さ れると予測された。 配列番号 36のァミノ酸配列と dn a 33383のオープン リーディングフレームから予測されるァミノ酸配列(配列番号 16 )との間には、 864ァミノ酸配列に渡つて 81。/。の相同性があった。
さらに、 配列番号 36のアミノ酸配列を問い合わせとして、 マウス cDNAラ イブラリー FANTO Mデータベース (http: //fantom. gsc. riken. go. jp/) に 対して BLASTによる相同性検索を行ったところ、 配列番号 16のアミノ酸配 列が最も相同性が高かった。
なお、 公開塩基配列データベースである e mb 1 eデータベースと特許データ ベースである G e n s e qデータベースに対しての B LAST相同性検索におい ては、 配列番号 35の塩基配列よりも相同性の高いヒト塩基配列は検索できなか つた 0
従つて、 配列番号 35が、 配列番号 3に対する新規なヒトオルソログ D N Aで あると考えられた。
(2) 取得されたヒトオルソログ DN Aの塩基配列の解析
上記 (1) で予測されたヒ トオルソログ DNAの塩基配列おょぴ該塩基配列に よりコードされるアミノ酸配列について、 さらなる解析を行った。
まず、 配列番号 36に示されるアミノ酸配列について B LASTを用いて相同 性検索を行ったところ、 NRDBタンパク質データベース (SWI S S— PRO T、 P I R、 TREMBLE、 GENPEPT、 P D Bから作成された重複のな ぃァミノ酸配列のデータベース)および特許配列のデータベース中には、配列番号 1 6に記載のマウスのアミノ酸配列以上に相同性を示す配列はなかった。 このこ とからも、 配列番号 36に記載のアミノ酸配列を有するタンパク質は、 配列番号 16に記載のァミノ酸配列配列を有するマウスタンパク質のヒトオルソログタン パク質であることが推測された。
配列番号 36に記載のヒトアミノ酸配列について、 HMMPFAMによるタン パク質特徴検索を行つたところ、 ァミノ酸番号 39— 134に SCAN domain (Pfam に SCANとしてエントリーされるアミノ酸配列) を、アミノ酸番号 229— 269に KRAB box region (Pfamに KRABとしてェントリーされるアミノ酸配列) を、 ァミノ 酸番号 775— 797、 803— 825、 831— 853、 859— 881、 88 7— 909、 915-937に Zinc Finger, C2H2 type domainの特徴を示す配列 (Pf amに zf-C2H2としてェントリーされるァミノ酸配列) を見出した。
SCAN domainは一部の C2H2タイプの Znフィンガータンパク質の N末端に見られる 保存されたモチーフで、オリゴマー形成の調節と転写制御の役割をもつことが知ら れている。 また Kruppel- associated box (KRAB)は C2H2タイプの Znフィンガータンパ ク質の約 1/3に見られ、 N末端部分に存在し、 DN Aとの結合の際には転写の抑 制にはたらき、 Znフィンガードメインとともに細胞分化 ·発生に関与することが知 られている。
以上のことから、 配列番号 36に記載のアミノ酸配列を有するタンパク質は、 Kruppel- associated box (KRAB)を持つ C2H2タイプの Znフィンガータンパク質で、転 写の抑制にかかわる転写因子であることが推測された。
(3) d n a f o rm33383のヒ トオルソログ DNAの取得
上記 (1) および (2) において新規なヒトオルソログ DNAが予測されたこ と力 ら、 以下のとおり、 この c DNAのクローニングをおこなった。
まず、 この cDNAを取得する遺伝資源となる組織を選択するために、 フォヮ 一ドプライマ一 1 (配列番号 54) とリバースプライマー 1 (配列番号 55) を 用いてヒ ト組織由来 cDNA (C I o n t e c h社製) を铸型とした PCRを行 つたところ、 子宮、 前立腺、 脳下垂体、 脳、 胎児脳、 海馬、 視床で目的とする約 1 50 b pの DNAの増幅が確認された。 フォワードプライマー 1は配列番号 3 5の塩基番号 1294— 131 3に相当し、 リバースプライマー 1は配列番号 3 5の塩基番号 1443— 1424に相当する。
次に、 オープンリーディングフレーム全長を取得するために、 これら組織由来 の c DNAを铸型としてフォワードプライマー 2 (配列番号 56) とリバースプ ライマー 2 (配列番号 57) を用いた PCRを行った。 これらのプライマーは、 配列番号 53のヒト塩基配列においてオープンリ一ディングフレームの外側に位 置する配列を用いて設計されたプライマーであって、 フォヮ一ドプライマ一 2は 配列番号 53の塩基番号 253— 272に相当し、 リバースプライマー 2は配列 番号 53の塩基番号 3256-3237に相当する。
PCRの結果、 子宮、 前立腺、 脳下垂体、 胎児脳、 海馬、 視床で予測値と一致 する 2. 9 k bの DNAが増幅した。 これらのうち子宮、 前立腺、 胎児脳に由来 する PC R増幅 DN A断片を铸型に直接シークェンスを行ったところ、 3種とも 同じ配列を有しており、 PCRによるミスはないことがわかった。 そこで、 子宫 由来の P CR増幅 DNA断片を p CR4B 1 un t i n g— TOP Oベクター ( I n v i t r o g e n社製) にライゲーシヨンして、 得られた独立のコロニー 3個から由来するプラスミドのシークェンスをおこなったところ、 3つとも配列 番号 53の塩基番号 253— 3256 (配列番号 35に記載された、 ヒ トのォー プンリーディングフレーム全長に相当する塩基配列を含む) と全く同じ配列が揷 入されていた。
以上のことから、 予想されたヒト転写物 (タンパク質) が実際に発現している ことが示され、 その cDNAを取得することができたことがわかった。 かくして 取得されたヒトホモログ DN Aを、 Z G 1001と名付けた。
このヒ ト塩基配列に由来するァミノ酸配列 (配列番号 36) とマウス塩基配列 に由来するァミノ酸配列 (配列番号 1 6 ) とを比較すると、 ヒ トァミノ酸配列上 のアミノ酸番号 64— 9 1 3と、 マウスアミノ酸配列上のアミノ酸番号 7— 85 6の部分で一致度が高く、 N末端はヒトァミノ酸配列の方が 59アミノ酸長く、 C末端は 36アミノ酸長かった。
さらに、 ヒ ト塩基配列 (配列番号 35) とマウス塩基配列 (配列番号 3) をそ れぞれヒトゲノム、 マウスゲノムにマッピングすると、 両者とも 7つのエタソン にコードされていた。 それぞれの N末端、 C末端をコードする部分は、 一致度が 高い部分から一致度が低い部分にかけてひとつのエタソンであった。 すなわち、 これらの配列の N末端及び C末端の違いは、 ェクソンの使い分けではなく種によ る違いであることがわかった。 実施例 9 標的転写調節領域に対する結合能の解析
(1) 無細胞蛋白質合成系を用いた本発明の蛋白質の調製
本発明のタンパク質をコードする DN Aを含むプラスミドに対して、
Proc. Natl. Acad. Sci. USA, 99, 14652-14657 (2002)に記載されている方法に準じて P CR反応を行い、 転写用の DNA断片を調製した。 この DNAを铸型として S P 6 RNA P o 1 y me r a s e (P r ome g a社製) を用いて転写反応 を行ない、 mRNAを合成し、 エタノール沈殿操作により得られた raRNAを精 製した。 この mRNAを用いたタンパク合成は、 特開 2 0 0 2— 20 4 6 8 9号 公報、および Proc. Natl. Acad. Sci. USA, 99: 14652-14657 (2002)に準じた重層法によ る無細胞蛋白質合成系を用いて行った。 重層法無細胞蛋白質合成系にて使用する 翻訳溶液 (2 5 μ 1 ) には、 Proc. Natl. Acad. Sci. USA, 97 :559-564 (2000)に従って 調製された 6 μ 1の小麦胚芽抽出液おょぴ上述した mRNA (0. 0 2 nmo 1 ) を添加して用い、 その組成は 24 mMHepes/K0H(pH 7.8), 1.2 mM ATP, 0.25 mM GTP, lo mM creatine phospnate, 10 μ g creatine kinase, rioonuclease
inhibitor (20units), 2 mM DTT, 0.4 mM spermidine, 0.3 mM L型アミノ酸 (20 種) , 2.7 mM magnesium acetate, 100 mM potassium acetate, 5 g小麦胚芽— 由来 tRNA, 0.05% Nonidet P-40および 0.005% NaN3から成る。 また翻訳用緩衝液は 31.3raM HEPES/K0H(pH7.8) , 2.67inM Mg(0Ac)2 , 93mM KOAc , 1.2raM AtP, 0.257mM GTP , 16mM creatine phosphate, 2. ImM DTT, 0.41mM spermidine, 0.3mML型ァ ミノ酸 (20種) , 1 μ Μ Ε-64 , 0.005% NaN3 , 0.05% ΝΡ- 40から成る。 重層法によ る無細胞蛋白質合成は、 まず 9 6穴プレートに翻訳用緩衝液を 1 2 5 μ 1ずつ加 えて、 この翻訳用緩衝液が入ったそれぞれの穴に底からゆつくりと翻訳溶液を重 層し、 このプレートを 2 6°Cインキュベーターで保温して 1 6時間反応させるこ とにより行った。
( 2 ) 標的配列を固定ィ匕したセンサーチップを用いた SPR測定方法
BIAapplications handbook, chapter4.4の記載に従い、 センサーチップ表面に ビォチン化した以下の 53種類の二重鎖 DN Aを別々に固定化した。 センサーチ ップは S Aタイプ (ビアコア社製) を用い、 S PR測定および 析は、 B I AC ORE 3000 (ビアコア社製) を用いた。
公知の転写因子と、 設計した標的転写調節領域の DNAまたは DNA断片の塩 基配列 (以下、 これを 「標的配列」 と称することがある) 、 または、 複数の転写 因子が共通して認識する標的転写調節領域の DN Aまたは DN A断片の塩基配列
(以下、 これを 「コンセンサス標的配列」 と称することがある) の関係は、 次の 通りである。
L 1」v - jun, c-jun, junB, junD, dJRA, c-fos, fosBl, fosB2, Fra - 1, LRF-1, v~maf, mafG, NF-E2 p45, aNF- E2, fNF- E2, Nrf short form, GCN4, yAP- 1, CREB-2, ATF - 3, CRE-BP1, CRE-BP3, ATF— a, CREB - 341, CREB— 327, CREM, dCREB2, dCREB2 - b, dCREB2-c, dCREB2-d, dCREB2- q, dCREB2 - r, dCREB2- sのコンセンサス標的配列: TGATGACGT (配列番号 58 )
[2] C/EBPalpha, C/EBPbeta, p34C/EBPbeta, CHOP- 10のコンセンサス標的配列: AAGTGGCGAAAGAGACA (配列番号 59 )
[3] VBP, Hlf, CPRF- 2, EmBP-lb, EmBP-lb, GBFl, GBF2, GBF3, CPRF-l, TAF- 1, HBP-la, GBF9, GBFl, GBF12, CPRF - 3, TGAla, TGAlb, 02, STE4のコンセンサス標 的配歹 IJ: AGAAGCACGTGG (配列番号 60 )
[4] 0PI1, E2A, E47, ITF - 2/SEF2-1B, SEF-1A, MyoD, p42Tal - 1のコンセンサス 標的配列: MCAGATGGT (配列番号 6 1 )
[5] HEN- 1の標的配列: GGGGCGCAGCTGCGGCCC (配列番号 62)
[6] AhR, Arnt のコンセンサス標的配列: GGGGATTGCGTG (配列番号 63)
[7] USFの標的配列: GTCACGTGGT (配列番号 64)
[ 8 ] NF-1A1, NF-1A1.1, NF-1A6, NF-1B1, NF-1B1, NF-1B2, NF - 1C2/CTF— 2, CTF— 4, CTF- 6のコンセンサス標的配列: CTGTGGGGTTTGGCACGGGGCCA (配列番号 65)
[9] RF- XIの標的配列: GGTAACATAGCMC (配列番号 66)
[10] AP2alphaA/AP-2alphal, AP2alpha2, AP2alpha3, AP2alpha4, AP2alphaB, AP2beta, AP2gammaのコンセンサス標的配列: CGCCCCCCGGCG (配列番号 6 7 )
1 1 GRの標的酉 S列: GGTACMAATGTTCT (配列番号 6 8 )
1 2 ARの標的配列: MCATTATGTTCT (配列番号 6 9 )
1 3 ERの標的配列: MGGGAAAATGACCCCC (配列番号 7 0 )
1 4 RXR- alphaの標的配列: GGTCATAGGGGT (配列番号 7 1 )
1 5 PPARalphaの標的配列: CTAGGGCAAAGGTCA (配列番号 7 2 )
1 6 PPARgaramaの標的配列: GGTCAMGGTCA (配列番号 7 3 )
1 7 COUP-TFl, HNF-4alphal, H F- 4alpha2の標的配列: TGAACTTTGA (配列番号
7 4 )
1 8 CF1の標的配列: GGGGTCACC (配列番号 7 5 )
1 9 GATA-1, GATA-2, GATA- 3, GATA-4のコンセンサス標的配列: CCAGATMGG 配列番号 7 6 )
2 0 AREA/NIT- 2の標的配列: TATCTC (配列番号 7 7 )
2 1 Splの標的配列: GGGGGGGGGG (配列番号 7 8 )
2 2 YY1の標的配列: CGGCCATCTTGGCT (配列番号 7 9 )
2 3 Egr-1, Egr-2, Egr- 3のコンセンサス標的配列: TGCGTGGGCG (配列番号 8 0 )
2 4 Snailの標的配列: CACCTGTTTTCA (配列番号 8 1 )
2 5 CF2- IIの標的配列: GTATATATA (配列番号 8 2 )
2 6 Evi- 1の標的配列: AGATMGATM (配列番号 8 3 )
2 7 Ikaros, MZF- 1のコンセンサス標的配列: TTGGGAGG (配列番号 8 4 ) 2 8 Tranrtrack69Kの標的配列: GGACCTGC (配列番号 8 5 )
2 9 H0X9の標的配列: TGACAGTTTMCGA (配列番号 8 6 )
3 0 CDPの標的配列: CCMTMTCGAT (配列番号 8 7 )
3 1 HNF- 1Aの標的配列: GGTTMTGATTMCCAC (配列番号 8 8 )
3 2 Nkx-2. 2, Nkx-2. 5, TTF- 1のコンセンサス標的配列: TTMGTGGTT (配列番 号 8 9 [33] Oct-IA, Oct- IB, Oct-lCのコンセンサス標的配列: ATGCMAT (配列番号 90)
[34] Oct- 2, Oct- 2, l/0ct-2Bのコンセンサス標的配列: TATTTGCAT (配列番号 91)
[35] Pax-3, Pax- 6のコンセンサス標的配列: CGTCACGCTTGA (配列番号 92 )
[36] Pax- 1の標的配列: CCGTTCCGCTCTAGATAT (配列番号 93)
[37] HSF1 (short) , HSF2, dHSF, fungalHSFのコンセンサス標的配列: AGAAAAGAAAAGAAA (配列番号 94 )
[38] c-Myb, A - Myb, v-Myb, P (long) , P (short), CI (long) , CI (short)のコン センサス標的配列: MCGGGCCC (配列番号 95)
[39] c - Ets - l_p54, Ets - 1— deltaiV/VII, Ets- 2, Elk - 1, SAP- 1, SAP - lb, Erg - 1, p55erg, Fli - lb, E4TF1-60/GABP- alpha, E74Aのコンセンサス標的配列:
GACAGGAAGTG (配列番号 96)
[40] IRF-1, IRF- 2の標的配列: GAAAAGCGAAACC (配列番号 97 )
[41] p50の標的配列: GGGGACTTTCC (配列番号 98)
[42] NF-ATc, NF- Atpのコンセンサス標的配列: AGGMM (配列番号 99) [43] p91, p84のコンセンサス標的配列: GMTTCCGGGAAATGG (配列番号 100) [44] STAT2, STAT3, STAT4, STAT5A, STAT5B, STAT6のコンセンサス標的配列: TTTCCCGGGAAATG (配列番号 101)
[45] p53の標的配列: GGACATGCCCGGGCATGTC (配列番号 102)
[46] MEF- 2Aの標的配列: CTCTAMAATA (配列番号 103)
[47] SRFの標的配列: CCATATATGGACAT (配列番号 104)
[48] E2の標的配列: AACCAAAMCGGTM (配列番号 105)
[49] TBPの標的配列: TATMAA (配列番号 1 06)
[50] SRY, Sox- 5, Sox- 9の標的配列: MAAAACMTAGGG (配列番号 107) [51] mat- Mcの標的配列: TCATTGTT (配列番号 108)
[52] CP1A, CP1B, CBF- Cのコンセンサス標的配列: CTGATTGGCTACC (配列番号 109)
[53] AMLlaの標的配列: TGTGGT (配列番号 1 10)
まず、 上記 53種類の標的配列 (配列番号 58〜配列番号 1 10) を有する D NAに関し、 それぞれの 5 ' 側にビォチンが付加した DN Aとその相捕な塩基配 列を有する DNAを定法により個別にアニーリングさせ、 合計 53種類の二本鎖 化した DNAを調製した。 一方、 解析に用いるセンサーチップは、 1枚に付きフ ローセルが 4分割されている。 フローセル 1は何も固定化せずコントロール区と して用い、 フローセル 2、 3および 4はそれぞれ上記で調製した二本鎖 DN Aを 3種類づっ固定化した。センサーチップの DN Aの固定ィヒ密度を一定にするため、 DNA固定化による S PR応答値の上昇 (ARU— DNA) を DNA分子量 (M W) で割った値 (D) が各フローセルで一定になるように ARU— DNAを調節 した。 同様の要領で、 残りの DNAについても固定化を行った。
以上のようにセンサーチップの作製ができた後、 クローンの c DNAがコード する本発明のタンパク質との結合活性解析を行った。 S PR法による DNAとタ ンパク質間の結合活性解析は既に多数報告がある。 本実施例では、 Molecular Microbiology, 36(3), 557- 569 (2000)の測定条件を参考にして行った。 まず、 フ ローセル 1—2— 3— 4が直列につながった流路に設定しておく。 そこにラン二 ングバッファーを一定流量 (S LZmi n) で流しておき、 SPR測定値を安 定させた後、 各フローセルのベースライン値 (S PR-b a s e 1 i n e) を測 定する。 次に、 蛋白質溶液を同流量で流し、 蛋白質分子と DNA鎖との間で特異 的結合を形成させる。 一定時間注入後、 各フローセルの S PR応答値 (SPR— b o un d) を測定した。
(4) S P R法により得られた測定結果の解析方法
S PR応答値からベースライン値を差し引き ( [SPR— b o un d] — [S PR-b a s e 1 i n e ] )することにより、真の結合量(B) を求め、 さらに、 標準化した値 (nB) を求めた。
測定結果より、 d n a f o rm33383, 33733, 34196, 348 37, 37479, 38861, 39530, 41 143, 42515, 512 18, 59635, 60441, 63 166の 1 3クローンの c DNAによって コードされる本発明のタンパク質は、 前記 [1] 〜 [53] の計 53種類の標的 配列 (配列番号 58〜配列番号 1 10) を有する DN Aの少なくとも一つに対し て結合活性を有していることがわかった。 実施例 10 ヒ ト組織発現解析
上記実施例 8において、 d n a f o rm33383に対応するヒトオルソ口グ
(ZG 1001) が取得された。 そこで、 本発明のヒ トタンパク質をコードする mRNAの正常ヒトおよび疾患患者での組織発現変動を検討するために、 定法
(Higuchi R, et al. , Biotechnology, 11: 1026-30 (1993)) に従い、 PCR法 を用いた組織発現解析を行つた。
(1) cDNA合成
以下のヒトの 9組織の mRNAは Clontech社から購入し、オリゴ dTをプライマーと した逆転写反応を行い cDNAを合成した。
正常脳、正常海馬、正常視床、正常腎臓、正常肝臓、正常膝臓、正常骨格筋、 正常脂肪、 正常脾臓
以下のヒトの 8組織の cDNAは Clontech社から購入した。
正常乳房、 乳癌、 正常結腸、 結腸癌、 正常肺、 肺癌、 正常胃、 胃癌 以下のヒトの 2組織の cDNAは Biochain社から購入した。
正常前頭葉、 アルツハイマー病前頭葉
以下のヒトの 1組織の全 RNAはュニーテック社から購入し、 mRNAを抽出後、 c DN A合成を行った。
正常末梢血白血球
(2) PCR法による定量
本発明のヒ トタンパク質をコードしている mRNA (d n a f o rm3338 3のヒ トオルソログ ZG1001の mRNA) の発現は、 ライトサイクラ一定 量 PCR装置 (ロシュ 'ダイァグノステイ-タス社製) と LightCycler- FastStart DN Aマスター SYBR Green I試薬を用いて、 製品に添付されているプロトコールに従 い定量した。 定量 PCRに用いた合成 D N A配列を以下に示す。
5 ' 側プライマー : GCTCCGTCCACTGATAAACC (配列番号 1 1 1)
3, 側プライマー: GCGGATAAATTCGATGCCTA (配列番号 1 12)
定量結果は、 Glyceraldehyde 3-phosphate dehydrogenase (GAPDH) を内 部標準として、補正した。即ち、各組織での対象遺伝子の発現量(コピー数/ μ 1 ) を GAPDHの発現量 (コピー数 / 1 ) で除し、 定数 (1 X 105) (注: 10の 5 乗) を乗して表示した。 その結果を表 4に示す。 表 4
Figure imgf000086_0001
表 4から明らかな通り、 ZG 1001の mRNAは膝臓、 脾臓、 および脳で発 現し、 乳癌で発現が増加した。
この結果より、 上記 c DN Aおよぴ該 c DNAによってコードされるタンパク 質は、 癌やアルツハイマー病などの治療や診断に応用できる。 また該 cDNAに よってコードされるタンパク質は、 上記のような mRNA発現の変動が見られる 組織あるいは m R N A発現量の多レ、糸且織に関わる疾患に関与している可能性があ る。 実施例 1 1 各完全長 c D N Aがコードするタンパク質の総合解析
(1) d n a f o rm34837 (配列番号 1、 14)
d n a f o rm34837の c DNAにコードされるタンパク質は、 前記実施 例 9に記載の S PR測定装置 (B I ACORE社製) を用いた 53種の標的配列 を有する DNAに対する結合実験の結果、該標的配列の少なくとも 1つに結合し、 該蛋白質が結合した標的配列に選択性を持つた D N A結合蛋白質であることが示 された。 また、 発現解析からは、 勝臓および副精巣由来脂肪細胞で強く発現する ことが分かった。 さらに、 タンパク質一タンパク質相互作用解析では、 該 cDN Aにコードされるタンパク質が核内ステロイド受容体の一つである PXR 2と相 互作用することが確認された。
前記実施例 4に記載の解析おょぴこれらの実験結果から、 この蛋白質は核に存 在し、 多量体あるいは他の蛋白質との相互作用をする可能性のある D N A結合蛋 白質であると考えられる。 したがって、 該 cDNAおよび該 cDNAによってコードされ る蛋白質は、 上記のような mRNA発現の変動が見られる組織あるいは mRNA発現量の 多い組織に関わる疾患に関与している可能性があり、 たとえば糖尿病や癌などの 治療や診断に応用できる。
(2) d n a f o rm63166 (配列番号 2、 15)
d n a f o rm63166の cDNAにコードされるタンパク質は、 前記実施 例 9に記載の SPR測定装置 (B I ACORE社製) を用いた 53種の標的配列 を有する DNAに対する結合実験の結果、該標的配列の少なくとも 1つに結合し、 該蛋白質が結合した標的配列に選択性を持つた D N A結合蛋白質であることが示 された。また、発現解析からは、延髄おょぴ乳腺で強く発現することが分かった。 前記実施例 4に記載の解析おょぴこれらの実験結果から、 この蛋白質は核に存 在し、 多量体あるいは他の蛋白質との相互作用をする可能性のある DN A結合蛋 白質であると考えられる。 したがって、 該 cDNAおよび該 cDNAによってコードされ る蛋白質は、 上記のような mRNA発現の変動が見られる組織あるいは mRNA発現量の 多い組織に関わる疾患に関与している可能性があり、 たとえば糖尿病や癌などの 治療や診断に応用できる
(3) dn a f o rm33383 (配列番号 3、 1 6)
d n a f o rm33383の c DNAにコードされるタンパク質は、 前記実施 例 9に記載の SPR測定装置 (B I ACORE社製) を用いた 53種の標的配列 を有する DNAに対する結合実験の結果、該標的配列の少なくとも 1つに結合し、 該蛋白質が結合した標的配列に選択性を持った DN A結合蛋白質であることが示 された。 前記実施例 4に記載した PF AM検索の結果によると、 本タンパク質は C末端に 6個の C 2H2 t y e Z i n c F i n g e r構造をもち、 N末 端側に蛋白相互作用にかかわる S CAN d oma i n, KRAB d oma i nをもつ蛋白質である。 また、 P r e L o cによる蛋白質細胞内局在予測によ ると、 核局在が強く示唆される。
前記実施例 4に記載の解析おょぴこれらの実験結果から、 この蛋白質は核での 存在が予想される多量体あるいは他の蛋白質との相互作用をする可能性のある D NA結合蛋白質であると考えられる。 従って、 該 cDNAおよぴ該 cDNAによってコー ドされる蛋白質は、 mRNA発現の変動が見られる組織あるいは mRNA発現量の多い組 織に関わる疾患に関与している可能性があり、 たとえば糖尿病や癌などの治療や 診断に応用できる
(4) dn a f o rm39530 (配列番号 4、 1 7)
d n a f o rm39530の c DNAにコードされるタンパク質は、前記実施例 9に 記載の SPR測定装置 (B I ACORE社製) を用いた 53種の標的配列を有す る DN Aに対する結合実験の結果、 該標的配列の少なくとも 1つに結合し、 該蛋 白質が結合した標的配列に選択性を持つた D N A結合蛋白質であることが示され た。 前記実施例 4に記載の解析およびこれらの実験結果から、 この蛋白質は核での 存在が予想され、 多量体あるいは他の蛋白質との相互作用をする可能性のある D NA結合蛋白質であると考えられる。 したがって、 該 cDNAおよぴ該 cDNAによって コードされる蛋白質は、 mRNA発現の変動が見られる組織あるいは mRNA発現量の多 い組織に関わる疾患に関与している可能性があり、 たとえば糖尿病や癌などの治 療ゃ診断に応用できる。
(5) d n a f o r m38861 (配列番号 5、 18 ) ,
d n a f o rm38861の cDNAにコードされるタンパク質は、前記実施例 9に 記載の SPR測定装置 (B I ACORE社製) を用いた 53種の標的配列を有す る DNAに対する結合実験の結果、 該標的配列の少なくとも 1つに結合し、 該蛋 白質が結合した標的配列に選択 1"生を持つた D N A結合蛋白質であることが示され た。 また、 発現解析からは、 全身で強く発現し、 特に膝臓、 肺で強力に発現する ことが分かった。
前記実施例 4に記載の解析およびこれらの実験結果から、 この蛋白質は核での 存在が予想され、 多量体あるいは他の蛋白質との相互作用をする可能性のある D NA結合蛋白質であると考えられる。 したがって、 該 cDNAおよぴ該 cDNAによって コードされる蛋白質は、 上記のような mRNA発現の変動が見られる組織あるいは mRNA発現量の多い組織に関わる疾患に関与している可能性があり、 たとえば糖尿 病や癌などの治療や診断に応用できる。
(6) d n a f o r m60441 (酉己列番号 6、 19)
d n a f o r m60441の c DNAにコードされるタンパク質は、前記実施例 9に 記載の SPR測定装置 (B I ACORE社製) を用いた 53種の標的配列を有す る DN Aに対する結合実験の結果、 該標的配列の少なくとも 1つに結合し、 該蛋 白質が結合した標的配列に選択性を持った DN A結合蛋白質であることが示され た。 また、 発現解析からは、 全身で強く発現し、 特に勝臓、 肺で強力に発現する ことが分かった。
前記実施例 4に記載の解析およびこれらの実験結果から、 この蛋白質は核での 存在が予想され、 多量体あるいは他の蛋白質との相互作用をする可能性のある D NA結合蛋白質であると考えられる。 したがって、 該 cDNAおよび該 cDNAによって コードされる蛋白質は、 上記のような mRNA発現の変動が見られる組織あるいは mRNA発現量の多い組織に関わる疾患に関与している可能性があり、 たとえば糖尿 病や癌などの治療や診断に応用できる。
(7) d n a f o rm425 15 (配列番号 7、 20)
d n a f o rm42515の c DNAにコードされるタンパク質は、 前記実施 例 9に記載の SPR測定装置 (B I ACORE社製) を用いた 53種の標的配列 を有する DNAに対する結合実験の結果、該標的配列の少なくとも 1つに結合し、 該蛋白質が結合した標的配列に選択性を持った D N A結合蛋白質であることが示 された。 また、 発現解析からは、 脳に特異的に発現し、 特に前頭様皮質で強力に 発現することが分かった。
前記実施例 4に記載の解析おょぴこれらの実験結果から、 この蛋白質は核での 存在が予想され、 多量体あるいは他の蛋白質との相互作用をする可能性のある D NA結合蛋白質であると考えられる。 したがって、 該 cDNAおよぴ該 cDNAによって コードされる蛋白質は、 上記のような mRNA発現の変動が見られる組織あるいは mRNA発現量の多い組織に関わる疾患に関与している可能性があり、 たとえば糖尿 病や癌や神経疾患などの治療や診断に応用できる。
(8) d n a f o r m41143 (配列番号 8、 21)
d n a f o r m41143の c DNAにコードされるタンパク質は、前記実施例 9に 記載の S PR測定装置 (B I ACORE社製) を用いた 53種の標的配列を有す る DNAに対する結合実験の結果、 該標的配列の少なくとも 1つに結合し、 該蛋 白質が結合した標的配列に選択性を持った D N A結合蛋白質であることが示され た。 また、 発現解析からは、 全身で発現するが、 膝臓、 肺、 脂肪で比較的強く発 現した。
前記実施例 4に記載の解析およびこれらの実験結果から、 この蛋白質は核での 存在が予想され、 多量体あるいは他の蛋白質との相互作用をする可能性のある D NA結合蛋白質であると考えられる。 したがって、 該 cDNAおよぴ該 cDNAによって コードされる蛋白質は、 上記のような mRNA発現の変動が見られる組織あるいは mRNA発現量の多レ、組織に関わる疾患に関与している可能性があり、 たとえば糖尿 病や癌などの治療や診断に応用できる。
(9) d n a f o r m34196 (配列番号 9、 22)
d n a f o rm34196の cDNAにコードされるタンパク質は、前記実施例 9に 記載の SPR測定装置 (B I ACORE社製) を用いた 53種の標的配列を有す る DN Aに対する結合実験の結果、 該標的配列の少なくとも 1つに結合し、 該蛋 白質が結合した標的配列に選択性を持った DN A結合蛋白質であることが示され た。
前記実施例 4に記載の解析およびこれらの実験結果から、 この蛋白質は核での 存在が予想され、 多量体あるいは他の蛋白質との相互作用をする可能性のある D NA結合蛋白質であると考えられる。 したがって、 該 cDNAおよぴ該 cDNAによって コードされる蛋白質は、 mRNA発現の変動が見られる組織あるいは mRNA発現量の多 い組織に関わる疾患に関与している可能性があり、 たとえば糖尿病や癌などの治 療ゃ診断に応用できる。
(10) d n a f o r m37479 (配列番号 10、 23)
d n a f o rm37479の cDNAにコードされるタンパク質は、前記実施例 9に 記載の S PR測定装置 (B I ACORE社製) を用いた 53種の標的配列を有す る DN Aに対する結合実験の結果、 該標的配列の少なくとも 1つに結合し、 該蛋 白質が結合した標的配列に選択性を持った DN A結合蛋白質であることが示され た。
前記実施例 4に記載の解析おょぴこれらの実験結果から、 この蛋白質は核での 存在が予想され、 多量体あるいは他の蛋白質との相互作用をする可能性のある D NA結合蛋白質であると考えられる。 したがって、 該 cDNAおよぴ該 cDNAによって コードされる蛋白質は、 mRNA発現の変動が見られる組織あるいは mRNA発現量の多 い組織に関わる疾患に関与している可能性があり、 たとえば糖尿病や癌などの治 療ゃ診断に応用できる
(1 1) dn a f o r m59635 (配列番号 1 1、 24)
d n a f o rm59635の cDNAにコードされるタンパク質は、前記実施例 9に 記載の SPR測定装置 (B I ACORE社製) を用いた 53種の標的配列を有す る DNAに対する結合実験の結果、 該標的配列の少なくとも 1つに結合し、 該蛋 白質が結合した標的配列に選択性を持った DNA結合蛋白質であることが示され た。
前記実施例 4に記載の解析おょぴこれらの実験結果から、 この蛋白質は核での 存在が予想され、 多量体あるいは他の蛋白質との相互作用をする可能性のある D NA結合蛋白質であると考えられる。 したがって、 該 cDNAおよぴ該 cDNAによって コードされる蛋白質は、 mRNA発現の変動が見られる組織あるいは mRNA発現量の多 い組織に関わる疾患に関与している可能性があり、 たとえば糖尿病や癌などの治 療ゃ診断に応用できる。
(12) dn a f o r m33773 (配列番号 1 2、 25)
d n a f o r m33773の c DNAにコードされるタンパク質は、前記実施例 9に 記載の SPR測定装置 (B I ACORE社製) を用いた 53種の標的配列を有す る DNAに対する結合実験の結果、 該標的配列の少なくとも 1つに結合し、 該蛋 白質が結合した標的配列に選択性を持った DNA結合蛋白質であることが示され た。 また、 発現解析からは、 全身で強く発現するが、 特に肺、 脾臓、 脂肪、 脳で 強力に発現することが分かった。 さらに、 タンパク質一タンパク質相互作用解析 では、 該 c DNAにコードされるタンパク質が糖尿病の原因となりうる SRP 4 0と相互作用することも確認された。
前記実施例 4に記載の解析おょぴこれらの実験結果から、 この蛋白質は核での 存在が予想され、 多量体あるいは他の蛋白質との相互作用をする可能性のある D NA結合蛋白質であると考えられる。 したがって、 該 cDNAおよぴ該 cDNAによって コードされる蛋白質は、 上記のような mRNA発現の変動が見られる組織あるいは mRNA発現量の多い組織に関わる疾患に関与している可能性があり、 たとえば糖尿 病や癌および神経疾患などの治療や診断に応用できる。
(13) d n a f o r m51218 (配列番号 13、 26)
d n a f o r m51218の c DNAにコードされるタンパク質は、前記実施例 9に 記載の SPR測定装置 (B I ACORE社製) を用いた 53種の標的配列を有す る DN Aに対する結合実験の結果、 該標的配列の少なくとも 1つに結合し、 該蛋 白質が結合した標的配列に選択性を持った DNA結合蛋白質であることが示され た。 また、 発現解析からは、 全身で強く発現するが、 特に肺、 脖臓、 脂肪、 脳で 強力に発現することが分かった。
前記実施例 4に記載の解析おょぴこれらの実験結果から、 この蛋白質は核での 存在が予想され、 多量体あるいは他の蛋白質との相互作用をする可能性のある D NA結合蛋白質であると考えられる。 したがって、 該 cDNAおよぴ該 cDNAによって コードされる蛋白質は、 上記のような mRNA発現の変動が見られる組織あるいは mRNA努現量の多い組織に関わる疾患に関与している可能性があり、 たとえば糖尿 病や癌および神経疾患などの治療や診断に応用できる。
(14) dn a f o rm35763 (配列番号 37、 38)
d n a f o r m35763は、発現解析から、骨髄、肺で強力に発現し、糖尿病の脂 肪細胞および結腸癌で発現が増強することが分かった。 前記実施例 4に記載の解 析およびこれらの実験結果から、 この c DNAにコードされる蛋白質は核での存 在が予想され、 多量体あるいは他の蛋白質との相互作用をする可能性のある D N A結合蛋白質であると考えられる。 したがって、 該 cDNAおよぴ該 cDNAによってコ 一ドされる蛋白質は、 上記のような mRNA発現の変動が見られる組織あるいは mRNA 発現量の多レ、組織に関わる疾患に関与している可能性があり、 たとえば糖尿病や 癌などの治療や診断に応用できる。 産業上の利用の可能性
本発明のタンパク質およびそれをコードする DNAは、 DNA結合活性、 I A P様活性等を有することから、 該タンパク質あるいはそれをコードする DNAを 用いて該活性を調節する物質をスクリーニングすることができ、 該タンパク質が 関連する疾患等に作用し得る医薬の開発に有用である。 本出願は、 2002年 4月 19日付けの日本特許出願 (特願 2002-1 17 840) 、 2002年 4月 30日付けの日本特許出願 (特願 2002— 1284 18) 、 2002年 1 2月 4日付けの日本特許出願 (特願 2002— 35246 9) 、 および 2002年 4月 30日付けの日本特許出願 (特願 2002-1 28 779)に基づくものであり、その内容はここに参照として取り込まれる。また、 本明細書にて引用した文献の内容もここに参照として取り込まれる。

Claims

請求の範囲
1. 以下の (a) または (b) のタンパク質。
(a) 配列番号 14〜26または 36のいずれかに記載のアミノ酸配列からなる
(b) 配列番号 14〜26または 36のいずれかに記載のアミノ酸配列において
1若しくは数個のアミノ酸が欠失、 置換及び Zまたは付加されたアミノ酸配列か らなり、 かつ DNA結合活性を有するタンパク質。
2. 請求項 1に記載のタンパク質をコードする DNA。
3. 請求項 1に記載のタンパク質をコードする完全長 c DNA。
4. 以下の (a) 、 (b)又は (c) の何れかの DNA。
(&)配列番号1〜13または 35のいずれかに記載の塩基配列を有する DNA。
(b) 配列番号 1〜1 3または 35のいずれかに記載の塩基配列において、 1若 しくは数個の塩基が欠失、 置換及び/または付加された塩基配列を有し、 かつ D N A結合活性を有するタンパク質をコードする DNA。
(c) 配列番号 1〜1 3または 35のいずれかに記載の塩基配列あるいはその相 補配列を有する D N Aとストリンジェントな条件下でハイブリダイズすることが できる塩基配列を有し、 かつ DN A結合活性を有するタンパク質をコードする D NA。
5. 以下の (a) または (b) のタンパク質。
( a ) 配列番号 38に記載のァミノ酸配列からなるタンパク質。
( b ) 配列番号 38に記載のァミノ酸配列において 1若しくは数個のァミノ酸が 欠失、 置換及び Zまたは付加されたアミノ酸配列からなり、 かつ I AP様活性を 有するタンパク質。
6. 請求項 5に記載のタンパク質をコードする DNA。
7. 請求項 5に記載のタンパク質をコードする完全長 c D N A。
8. 以下の (a) 、 (b)又は (c) の何れかの DNA。 ( a ) 配列番号 37に記載の塩基配列を有する D N A。
(b) 配列番号 37に記載の塩基配列において、 1若しくは数個の塩基が欠失、 置換及び/または付加された塩基配列を有し、 かつ I A P様活性を有するタンパ ク質をコードする DNA。
( c ) 配列番号 37に記載の塩基配列あるいはその相補配列を有する D N Aとス トリンジヱントな条件下でハイブリダイズすることができる塩基配列を有し、 か つ I AP様活性を有するタンパク質をコードする DNA。
9. 請求項 2〜4、 6〜8のいずれかに記載の DN Aを含む組換えベクター。
10. 請求項 2〜4、 6〜8のいずれかに記載の DNAまたは請求項 9に記載 の組み換えベクターを導入した遺伝子導入細胞または該細胞からなる個体。
11. 請求項 10に記載の細胞により産生される、 請求項 1または 5に記載の
12. 請求項 2〜4、 6〜8の何れかに記載の DNAの塩基配列中の連続した 5〜100塩基と同じ配列を有するセンスオリゴヌクレオチド、 当該センスオリ ゴヌクレオチドと相補的な配列を有するアンチセンスオリゴヌクレオチド、及ぴ、 当該センス又はアンチセンスオリゴヌクレオチドのオリゴヌクレオチド誘導体か ら成る群から選ばれるオリゴヌクレオチド。
13. 請求項 1、 5、 7、 または 11に記載のタンパク質に特異的 結合する 抗体あるいはその部分フラグメント。
14. 抗体がモノク口ーナル抗体である請求項 13に記載の抗体。
15. モノクローナル抗体が請求項 1、 5、 7、 または 11に記載のタンパク 質の活性を中和する作用を有することを特徴とする請求項 14に記載の抗体。
16. 請求項 1、 5、 7、 または 11に記載のタンパク質と被検物質を接触さ せ、 該被検物質による該タンパク質が有する活性の変化を測定することを特徴と する、 該タンパク質の活性調節物質のスクリーニング方法。
17. 請求項 10に記載の遺伝子導入細胞と被検物質を接触させ、 該細胞に導 入されている DNAの発現レベルの変化を検出することを特徴とする、 該 DNA の発現調節物質のスクリーニング方法。
1 8 . 請求項 1または 5に記載のタンパク質のアミノ酸配列から選択される少 なくとも 1以上のァミノ酸配列情報、 および/または請求項 2〜 4、 6〜 8のい ずれかに記載の D NAの塩基配列から選択される少なくとも 1以上の塩基配列情 報を保存したコンピュータ読み取り可能記録媒体。
1 9. 請求項 1または 5に記載のタンパク質、 および Zまたは請求項 2〜 4、 6〜 8のいずれかに記載の D N Aを結合させた担体。
PCT/JP2003/004981 2002-04-19 2003-04-18 Nouvelles proteines et adn codant de celles-ci WO2003089466A1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
AU2003227426A AU2003227426A1 (en) 2002-04-19 2003-04-18 Novel proteins and dnas encoding the same

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
JP2002117840 2002-04-19
JP2002-117840 2002-04-19
JP2002128418 2002-04-30
JP2002-128418 2002-04-30
JP2002-128779 2002-04-30
JP2002128779 2002-04-30
JP2002-352469 2002-12-04
JP2002352469 2002-12-04

Publications (1)

Publication Number Publication Date
WO2003089466A1 true WO2003089466A1 (fr) 2003-10-30

Family

ID=29255487

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2003/004981 WO2003089466A1 (fr) 2002-04-19 2003-04-18 Nouvelles proteines et adn codant de celles-ci

Country Status (2)

Country Link
AU (1) AU2003227426A1 (ja)
WO (1) WO2003089466A1 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001094530A2 (fr) * 2000-05-16 2001-12-13 Shanghai Biowindow Gene Development Inc. Nouveau polypeptide, proteine 57 de la sous-famille des proteines a doigt de zinc scan, et polynucleotide codant ce polypeptide

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001094530A2 (fr) * 2000-05-16 2001-12-13 Shanghai Biowindow Gene Development Inc. Nouveau polypeptide, proteine 57 de la sous-famille des proteines a doigt de zinc scan, et polynucleotide codant ce polypeptide

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
"The RIKEN genome exploration research group phase II team and the FANTOM consortium, functional annotation of a full-length mouse cDNA collection", NATURE, vol. 409, no. 6821, 2001, pages 685 - 690, XP001009930 *
CARNINCI P. ET AL.: "High-efficiency full-length cDNA cloning", METH. ENZYMOL., vol. 303, 1999, pages 19 - 44, XP001022979 *
CARNINCI P. ET AL.: "Normalization and subtraction of cap-trapper-selected cDNAs to prepare full-length cDNA libraries for rapid discovery of new genes", GENOME RES., vol. 10, no. 10, 2000, pages 1617 - 1630, XP002944079 *
DATABASE GENBANK [online] 5 December 2002 (2002-12-05), "The FANTOM consortium and the RIKEN genome exploration research group phase I & II team, analysis of the mouse transcriptome based on functional annotation of 60,770 full-length cDNAs", Database accession no. (AK036596) *
NATURE, vol. 420, no. 6915, 2002, pages 563 - 573, XP001165660 *
SHIBATA K. ET AL.: "RIKEN integrated sequence analysis (RISA) system--384-format sequencing pipeline with 384 multicapillary sequencer", GENOME RES., vol. 10, no. 11, 2000, pages 1757 - 1771, XP002951503 *

Also Published As

Publication number Publication date
AU2003227426A8 (en) 2003-11-03
AU2003227426A1 (en) 2003-11-03

Similar Documents

Publication Publication Date Title
Niceta et al. Mutations impairing GSK3-mediated MAF phosphorylation cause cataract, deafness, intellectual disability, seizures, and a down syndrome-like facies
Ware et al. Aberrant splicing of a mouse disabled homolog, mdab1, in the scrambler mouse
US20050130151A1 (en) Method and identification of downstream mrna ligands to fmrp and their role in fragile x syndrome and associated disorders
CA2852631A1 (en) A gene and mutations thereof associated with seizure and movement disorders
WO2003089466A1 (fr) Nouvelles proteines et adn codant de celles-ci
US20050123966A1 (en) Diagnostic and prognostic methods and compositions for seizure- and plasticity-related disorders
JP7410480B2 (ja) がんにおける融合遺伝子
JP2004229642A (ja) 新規タンパク質及びそれをコードするdna
JP2005052101A (ja) 新規タンパク質およびそれをコードするdna
JP2005021093A (ja) 新規タンパク質およびそれをコードするdna
JP2004041179A (ja) 新規タンパク質及びそれをコードするdna
JP2004229650A (ja) 新規タンパク質及びそれをコードするdna
JP2004229646A (ja) 新規タンパク質及びそれをコードするdna
WO2004099408A1 (ja) 新規蛋白質およびそれをコードするdna
JP2004261179A (ja) 新規タンパク質およびそれをコードするdna
WO2004074485A1 (ja) 新規タンパク質およびそれをコードするdna
JP2004229649A (ja) 新規タンパク質及びそれをコードするdna
EP1688487A1 (en) Method of controlling transcription of insulin gene
JP2004229651A (ja) 新規タンパク質及びそれをコードするdna
JP2004229643A (ja) 新規タンパク質及びそれをコードするdna
WO2003089643A1 (fr) Nouvelles proteines et adn codant lesdites proteines
WO2003089646A1 (fr) Proteines et adn codant ces proteines
JP2004041181A (ja) 新規タンパク質及びそれをコードするdna
JP2004041180A (ja) 新規タンパク質及びそれをコードするdna
CN115873935A (zh) Hilnc或包含其的信号通路作为调控脂质代谢的靶标的应用

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE ES FI GB GD GE GH GM HR HU ID IL IN IS KE KG KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NI NO NZ OM PH PL PT RO RU SC SD SE SG SK SL TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): GH GM KE LS MW MZ SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LU MC NL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
121 Ep: the epo has been informed by wipo that ep was designated in this application
122 Ep: pct application non-entry in european phase