WO2005050518A1 - 遺伝子および/又は蛋白質のデータベースを用いた相互作用マップの作成方法、ならびに、それを実現するためのソフトウエアおよび装置 - Google Patents

遺伝子および/又は蛋白質のデータベースを用いた相互作用マップの作成方法、ならびに、それを実現するためのソフトウエアおよび装置 Download PDF

Info

Publication number
WO2005050518A1
WO2005050518A1 PCT/JP2004/017362 JP2004017362W WO2005050518A1 WO 2005050518 A1 WO2005050518 A1 WO 2005050518A1 JP 2004017362 W JP2004017362 W JP 2004017362W WO 2005050518 A1 WO2005050518 A1 WO 2005050518A1
Authority
WO
WIPO (PCT)
Prior art keywords
protein
gene
sequence
library
bait
Prior art date
Application number
PCT/JP2004/017362
Other languages
English (en)
French (fr)
Inventor
Etsuko Miyamoto
Hiroshi Yanagawa
Original Assignee
Keio University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Keio University filed Critical Keio University
Priority to JP2005515680A priority Critical patent/JPWO2005050518A1/ja
Publication of WO2005050518A1 publication Critical patent/WO2005050518A1/ja

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis

Definitions

  • the present invention relates to a diagram (network map) showing the relationship of complex formation or interaction using a protein and gene database, a method of creating the diagram, and software and software for realizing the diagram. Related to the device.
  • Non-patent Document 1 Non-patent Document 1
  • Non-patent Document 3 Non-patent literature 3
  • protein-protein, nucleic acid-protein interaction, etc. are expected (non-patent literature 4, non-patent literature 5).
  • Non-Patent Document 6 immunoprecipitation (Non-Patent Document 6), pull-down by GST fusion protein 'Atsusei (Non-Patent Document 7), TAP method (Non-Patent Document 8), yeast The hybrid method (Non-Patent Document 9) and the like are known.
  • Non-patent document 10 Non-patent document 11, Non-patent document 12, Patent document 1, Patent document 2
  • STABLE method Non-patent document 13
  • phage display method Non-patent document 14
  • ribosome
  • the display method Non-Patent Document 15, Patent Document 3
  • mRNA-peptide fusion (mRNA display) method Non-Patent Document 16
  • Non-patent document 1 Saegusa A. Nature 401, 6751 (1999),
  • Non-patent document 2 Dalton R, Abbott A. Nature 402, 6763 (1999)
  • Non Patent Literature 3 Etsuko Takamoto, Hiroshi Yanagawa (2000) Series' Genome Science of Post-sequence 3: Proteomitas, pp.136-145
  • Non-patent document 4 Etsuko Takamoto, Hiroshi Yanagawa (2001) Protein 'nucleic acid' enzyme, 46 (2), pp.138-147)
  • Non-patent document 5 Etsuko Miyamoto, Hiroshi Yanagawa (2001) Proteins ⁇ nucleic acids, enzymes, 48 (11),
  • Non-Patent Document 6 Xiong et al. 1993 Nature 366, 701-704
  • Non-Patent Document 7 Kaelin, et al. 1991 Cell 64, 521-532
  • Non-patent document 8 Nicolas Rigaut, et al., Nature biotechnology 17, 1030 (1999)
  • Non-patent document 9 Fields S, Song O. Nature 340, 245 (1989)
  • Non-Patent Document 10 Miyamoto-Sato E, et al. Viva Origino 25, 35 (1997)
  • Non-patent literature ll Nemoto N, et al. FEBS Lett. 414, 405 (1997)
  • Non-patent document 1'2 Miyamoto—Sato, E. et al. Nucleic Acids Res. 31, e78 (2003)
  • Patent document 1 International Publication No. W098 / 16636 pamphlet
  • Patent Document 2 International Publication No. WO02 / 46395 pamphlet
  • Patent Document 13 Doi N, Yanagawa H. FEBS Lett. 457, 227 (1999)
  • Non-Patent Document 14 Smith G.P.Science 228, 1315 (1985)
  • Non-Patent Document 15 Mattheakis, L.C. et al. (1994) Proc.Natl.Acad.Sci. USA 91, 9022-9026 '
  • Patent Document 3 International Publication No.W095 / 11922 pamphlet
  • Non-Patent Document 16 Roberts R.W, Szostak J: W. (1997) Proc. Natl. Acad. Sci. USA 94, 12297
  • Patent Document 4 U.S. Patent No. 6,228,994
  • Patent Document 5 International Publication WO02 / 48347 pamphlet
  • Non-Patent Document 17 Schwikowski B., Uetz P. & Fields S. Nat. Bio'technol. 18, 1257-1261 (2000)
  • Non-patent document 18 Bader, G.D. & Hogue Christopher, Nat.Biotechnol. 20, 991-997 (2002)
  • Non-Patent Document 19 Legrain, P., Wojcik, J. & Gauthier, J—M. Trends in Genetics 17, .346-352 (2001)
  • the conventional gene or protein network 'map draws a network (Fig. 1A) by simply connecting interacting genes and proteins. Therefore, it is difficult for this method to predict the complex from the map and apply it to drug discovery by linking the structure and function.
  • An object of the present invention is to analyze important functions such as new functions of proteins known from interaction network analysis between proteins and between proteins and nucleic acids, and novel proteins that have not been known so far in post-genome functional analysis. The goal is to provide a gene network map that can be applied to the creation of pharmaceuticals by discovering macromolecules.
  • the present inventors have focused on functional elements represented by an amino acid sequence or a nucleic acid sequence in a protein-protein or protein-nucleic acid interacting region. Instead, it was found that drawing a network (FIG. 1B) based on the connection between functional elements of interacting genes and proteins could provide a more biologically meaningful map, and completed the present invention.
  • the present invention provides the following.
  • [0011] A method for creating a map showing the interrelationship between a gene Z and a protein based on data on the interrelationship between a gene and a protein, wherein the interrelationship is a function of the gene Z or a protein. Element-based interrelationships.
  • Storage means for storing data on the interrelationship between genes and proteins, and storage means based on the read data on the interrelationships, the gene and / or protein A program for causing a computer to function as a means for drawing a map showing the interrelationship between genes and / or proteins, characterized in that the interrelationship is based on genes and / or functional elements of proteins. Program to be used. '
  • a library of interacting genes or proteins is obtained by interaction analysis using an in vitro virus, and the nucleic acid sequence U or amino acid sequence of the genes or proteins in the library is extracted.
  • a method for determining a functional element comprising determining a functional element based on a sequence obtained.
  • the present invention provides a method for extracting a functional element of a gene protein, not a map of a total gene or protein network, and for extracting a functional element between the gene and the functional element using a database of the bark protein.
  • a network map by combining (Fig. 1). This will enable detailed analysis of networks between genes and proteins and prediction of complexes, and by providing analysis along with structural analysis, it will be possible to provide maps that can be applied to drug discovery support systems. Become. .
  • the network 'pattern when each functional element of the protein (gene) from which the functional element is extracted is selected differs. Even a single protein (globulin gene) may be involved in various networks, and it is difficult to predict the pathway of a living body using the method that displays only the total bonds as in the past. Was. ,
  • the gene network 'map based on functional elements can predict the complex from the network' pattern based on each functional element ⁇ , and it is possible to pay attention while comparing it with structural analysis data.
  • a model of a biological gene network as shown in FIG. 6 can be proposed by fusing it with the complex prediction and structural analysis data.
  • the functional element by the IW method (Fig. 7). Since the number of false positives is low in the mapping by extraction, there is no need to resolve false positives at the level of bioinformatics as in the yeast two-hybrid method. This is advantageous ( Figure 8).
  • the method for determining functional elements by the IW method can usually be implemented as follows. As shown in Fig. 9, input the sequence sequence, remove one vector sequence, extract the cDNA sequence, search the database, and confirm the protein frame and IW frame. As described above, only templates expressing proteins as IWs are selected, the templates are subjected to alignment and clustering, and common sequences of proteins and genes are extracted and compared from each cluster to determine functional elements. Genes and proteins from which these functional elements have been extracted can be collected into a database, and a network map using the database can be provided. Brief Description of Drawings
  • FIG. 1 shows an example of a gene network ′ map based on the functional elements of the present invention.
  • a conventional gene network map is compared with a gene network map based on the functional elements of the present invention.
  • the A gene protein is composed of three functional elements.
  • FIG. 2 shows an example of complex prediction in a gene network map based on functional elements of the present invention. If protein e and protein d bind at the same functional element of protein A, it is expected that the complex in case I would not be possible. I: complex consisting of three proteins, II: complex consisting of two proteins.
  • FIG. 3 shows an example of a protein (gene) from which a functional element has been extracted used in the present invention.
  • the protein from which the functional element was extracted in the functional analysis was combined with the results of the structural analysis to obtain a functional analysis and a structural analysis. And contribute to drug discovery.
  • the protein from which three functional elements (Element) are extracted is shown.
  • FIG. 4 shows an example of a protein (gene) from which a functional element is extracted and a network 'pattern based on the functional element of the present invention when each functional element is selected.
  • FIG. 5 shows an example of a gene network (halftone image). “?” Is a disease-related gene whose function you want to know.
  • the gene network '' map based on functional elements of the present invention '' can predict the network ⁇ pattern force complex '' based on each functional element, and determine the in vivo pathway of the gene of interest while comparing it with structural analysis. It will be possible to assist in assembling experiments to anticipate and verify them.
  • FIG. 6 shows an example of a biological gene network model. This is a hypothetical example that is considered to be ultimately provided by fusion with complex prediction and structural analysis based on a gene network map based on the functional elements of the present invention.
  • FIG. 7 shows an example of an analysis system by an IW selection method for realizing a protein (gene) from which a gene network map and functional elements have been extracted.
  • the analysis system based on the IW selection method consists of primary screening by IW selection and secondary screening as post-selection, which is an interaction analysis using C-terminal labeling. Primary screening detects interactions with substances and proteins,
  • the protein or nucleic acid sequence of the present invention can be used alone as an IW or C-terminal labeled protein for analyzing the interaction with a substance or protein by FCCS or microarray.
  • the present invention can be applied to the evolutionary molecular engineering using IW of the protein or nucleic acid sequence of the present invention, and it can be used for the creation of a functional protein by the primary screening.In that case, the primary screening and the secondary screening are combined. Thus, it is also possible to analyze the details of the interaction between the created functional proteins.
  • '[Fig. 8] Gene network' An example of construction of a highly reliable database by the IW selection method for realizing a protein (gene) from which a map and functional elements have been extracted. Conventional methods have attempted to resolve data with high false positives by post-processing using pyroinformatics, but the IW selection method provides experimental data with low false positives from the beginning.
  • FIG. 9 Gene network ⁇ Shows the detection sequence data analysis flow of the IW selection method for realizing a protein (gene) from which functional elements have been extracted. After inputting the sequence of the sequence detected by the analysis system using the IW selection method, preprocessing the sequence, searching the database, performing alignment analysis, extracting the * -sequence of each functional element by clustering, and listing the analysis results as a gene Display as a catalog. Further, the analysis results are stored as a database, and based on the data, a protein (gene) from which the gene network ⁇ '.
  • FIG. 10 shows a gene network based on functional elements, a map, and an outline of an IW's random priming library that can be used to realize a protein (gene) from which functional elements have been extracted, and a method for producing the same.
  • RNA library as a type I
  • a single-stranded cDNA library complementary to mRNA by reverse transcription by random priming using a random primer consisting of 9 bases and a random primer containing a specific sequence (tag2 sequence) ( ssDNA library) (1).
  • the synthesized double-stranded cDNA has a phosphate group at the 5 'end only on the side synthesized by DNA polymerase I.
  • PCR was performed using the specific sequences of the adapter and the random primer, and the cDNA library of the associating molecule with the promoter and gene sequence on the 5th side and the A tail on the 3 'side. ) (IV;).
  • the IW cDNA library is transcribed into an IW RNA library (V), a spacer for IW is ligated (VI), and further translated by a cell-free translation system, etc. Become the best library (VII). ⁇ . '
  • FIG. 11 shows the structure of a translation template (A) and its components, a coding molecule (B) and a spacer molecule (C).
  • a translation template is composed of a coding part derived from a coding molecule and a part of a spacer derived from a spacer molecule.
  • F1 and 2 represent fluorescent dyes.
  • FIG. 12 shows the structures of a C-terminal modified protein (C-terminal labeled protein) (A), the translation template (B) of the present invention, and a modifying agent (C).
  • FIG. 13 shows an outline of complex formation by cell-free cotranslation.
  • A 'Bait and prey are translated and interact together in a cell-free translation system to form a complex in the cell-free translation system.
  • the play may be singular (I) or plural (II), and it may be a polypeptide obtained by translation in a cell-free translation system. (Combined).
  • the prey may be singular (I) or plural (II), or the polypeptide itself obtained by translation in a cell-free translation system may be a mapping molecule (conjugate). It doesn't matter if it is.
  • FIG. 14 shows an outline of complex formation by cell-free cotranslation when a composite bait is used.
  • a part of the bait and prey constituting the composite bait are translated together in the cell-free translation system and interact with each other to form a complex in the cell-free translation system.
  • Prey may be singular (I) or plural (II), and even if the polypeptide itself is obtained by translation in a cell-free translation system, the assigning molecule (conjugate) It does not matter.
  • the composite bait is not limited to the combination of the polypeptide and the DNA bait translated by the cell-free translation system shown in the figure. Or a combination of a plurality of single baits (eg, DNA bait).
  • FIG. 15 shows an outline of a method for screening a complex by cell-free cotranslation.
  • Cell-free cotranslation and screening can be realized in vitro. If the play is an assigning molecule and a plurality of play, by reconstituting the mRNA or DNA encoding the play by RT-PCR or PCR, the process force screening in step (ii) can be repeated. Also, after analyzing the obtained play, it is possible to repeat the screening from step (1) as a bait.
  • Gene network A map showing a functional element determination method that is a means for realizing a protein (gene) from which functional elements have been extracted (halftone image).
  • a sequence obtained by obtaining a plurality of gene (protein) sequences or a plurality of nucleic acid (DNA) sequences detected by a random library or the like by the IW selection method or the like is aligned, and functional elements are extracted by clustering.
  • multiple gene (protein) sequences of c-Jnu shown in schematic form) are obtained and can be divided into E2 only groups, E2 + E3 groups, and E1 + E2 + E3 groups. .
  • the common sequences of each group were extracted and used as functional elements.
  • E1 to E3 are functional elements of the Jun gene.
  • E1 contains a DNA binding region.
  • E 2 Leu Si'ha. Contains one motif.
  • E3 Including the C-terminal region.
  • FIG. 17 shows the amino acid sequences and nucleic acid sequences of functional elements El, E2, and E3 of the c-Jun gene extracted in FIG.
  • FIG. 16 shows a comparison between the c-Jun gene from which functional elements El, E2, and E3 were extracted and the results of its structural analysis (halftone image).
  • FIG. 19 shows the difference between the network map using the functional elements El, E2, and E3 of the C-Jun gene extracted in FIG. 16 and the pattern of the network map obtained by selecting the functional elements.
  • FIG. 20 shows an example of the configuration of a map creation device of the present invention.
  • the method of the present invention is based on the normal gene and / or protein correlation data, except that the correlation is based on the functional elements of the gene and / or protein.
  • 'Map can be created in the same way. Such a map is sometimes called a graph. Also, depending on the type of interrelationship to be displayed, it may be called a gene network 'map, gene expression' control network.
  • a method of creating a map there is a method of creating a map by using a graph display algorithm by regarding a network as a graph in which genes and / or proteins are nodes and mutual relationships are edges.
  • a typical method is to create a model using a model called a “spring model”.
  • the interrelationships include direct and indirect relations such as a relation in which a gene controls another gene, a relation in which proteins interact with each other, and a relation in which a certain protein affects the expression of a gene encoding another protein. Is included. ''. '
  • the network 'map created by the creation method of the present invention maps the binding relationship of specific sequences that contribute to gene or protein interaction.
  • a ⁇ -specific sequence that contributes to the interaction of a gene or protein is called a functional element, and this sequence may be present in 0 to a plurality of times in one gene or protein.
  • Zero functional elements are isolated genes and proteins, and many functional elements indicate that they interact with various other genes and proteins. For example, if the A gene has three functional elements, as shown in Fig. 1 (11), the interaction between the three subregions of the A gene (functional elements) and each of the various protein subregions (functional elements)
  • the map connecting the relationships is the gene network map according to the present invention.
  • a functional element is a specific sequence that contributes to the interaction between a gene or a protein
  • a gene is a nucleic acid sequence
  • a protein is an amino acid sequence and a nucleic acid encoding the same.
  • the sequence may be a so-called functional motif or functional domain. That is, it is a specific sequence that contributes to the interaction between genes or proteins obtained by any interaction analysis.For example, an interaction caused by mutation or partial modification or deletion of a sequence such as gel shift Determination of the minimum required sequence, or determination of the interaction region by structure determination, or use of sequences obtained by IW, yeast two-hybrid, phage display method, etc.
  • a map showing the correlation based on the functional elements of the gene or protein is shown in the map.
  • Fig. 1 it is divided into a display showing the interrelationship of functional elements (solid line in Fig. 1) and a display showing the presence of the same gene and / or protein (dotted line in Fig. 1). There is a method of distinguishing and displaying.
  • the map according to the present invention allows prediction of the complex as shown in FIG. For example, if the interaction of three proteins is described using a conventional map, it is impossible to predict whether the complex of the three proteins is (I) or (II). . In the map according to the present invention, if proteins d and e interact with protein A in the same functional domain, it can be predicted that the complex is not (I) but ( ⁇ ).
  • the protein or gene used in the present invention can be obtained by detecting a plurality of templates from a library when a random 'library is used as a bait or play in the interaction analysis. It is preferably a protein or gene analyzed by a method capable of extracting a common sequence required for interaction.
  • the random "library” is one in which the gene protein constituting the library is composed of several sequences, not a single sequence.
  • a plurality of templates can be detected in one gene, and a common sequence required for the interaction can be extracted as a functional element in the template.
  • Random libraries are considered to be nucleic acid libraries, peptide libraries, protein libraries, etc.In nucleic acid libraries, promoter regions to which proteins bind are extracted as functional elements, and peptide libraries, protein libraries, etc. in it is extracted as the force s functional element such as a region which binds to the binding domain or nucleic acid of the promoter region between proteins. '
  • a gene network 'map based on functional elements can predict a complex from a network' pattern based on each functional element, and can be focused on while comparing it with structural analysis data. It will be possible to predict the in vivo pathway of a gene and to assist in constructing an experiment to verify it. For example, if you have a protein that you want to analyze in detail to clarify the pathway, if you only want to use a certain protein as a guide, pay attention to the gene promoter of that protein. If parallel analysis is performed by using proteins such as fos / Jun that interact with the protein as a bait, it is possible to estimate the pathway from upstream (up-regulation) to downstream (down-regulation) of a certain protein. Become.
  • a method for determining a functional element by the IW method which is an assigning molecule using random 'libraries, will be described in detail below.
  • IW selection interaction with bait (small molecules, nucleic acids, proteins, etc.) was performed by the IW method using random libraries such as cDNA, random 'peptide, random' protein, etc. It is a system that detects a certain prey population as a library and verifies it by secondary screening (post selection) using C-terminal labeling. '
  • the present effort provides a method for determining a functional element preferable for use in the production method of the present invention, that is, a library of interacting genes or proteins by an interaction analysis using an in vitro virus. And a method for determining a functional element, comprising determining a functional element based on the nucleic acid sequence or amino acid sequence of the gene or protein in the library and the extracted sequence.
  • the method using the IW and the library thereof uses the library to extract the functional elements.
  • the average length is long enough to provide data with fewer false positives compared to yeast two-hybrid methods, etc. ( Figure 5), which allows for more accurate network mapping.
  • the bait can select nucleic acids or proteins, it is possible to construct a database not only for protein-protein interaction but also for protein-nucleic acid interaction.
  • the use of functional elements obtained by the method of extracting functional elements from IW can be used to: 1) Prediction of complex (Fig. 2); 2) Link between structural analysis and functional analysis That wound Application to drugs (FIG. 3) is advantageous in such.
  • the vector sequence was removed from the sequence sequence detected by the IW selection, and the cDNA sequence was removed. Extract 15 and search the database if necessary to confirm the protein frame and the IW frame. Furthermore, these sequence sequences are aligned, and a common sequence of each protein (gene) is extracted as a functional element.
  • sequence sequence detected by IW selection is a commercially available sequencer.
  • the removal of the beta sequence means that the vector sequence used for cloning for the sequence is removed, and an extra sequence is removed to obtain only the cDNA library sequence.
  • Extraction of a cDNA sequence refers to removing a sequence common to a library in order to conduct a database search, and in this case, selecting only a cDNA sequence.
  • the database search refers to a nucleic acid database such as nt, a protein database such as nr, a database such as refseq, fantom2, and a genome database. '
  • Confirmation of the protein frame refers to confirming whether or not the frame translated by the cell-free translation system matches the ORF of the protein registered in the database. 'If the frames do not match, the frame' shift 'power 3' UTR, 5 'UTR array power etc. are revealed. .. '
  • Confirmation of the IW frame is to confirm whether the sequence can be translated by a cell-free translation system. That is, judgment is made based on the force at which multiple stop 'codons appear and whether the place is at the N-terminal side. '
  • Extraction of a common sequence by alignment and clustering analysis can be performed by a usual method.
  • Softer eg, ClustalX
  • Similar sequences are extracted from the sequence pool that has been processed as described above, here, the same gene is extracted, clustered between the sequences, each common sequence in clustering is extracted and compared, and extracted as functional elements I do. ⁇
  • the RNA or mRNA library used for the IW method includes prokaryote, eukaryote, virus, etc. 16 Any kind of RNA or mRNA library from which the tissue strength has been extracted may be used. Also, an RA library that transcribes the decoded genome or cDNA library, an artificial RNA library that reproduces the same, or an RNA library that transcribes an artificial cDNA library containing sequences that do not exist in nature may be used. ,.
  • the single-stranded (ss) DNA library is a library obtained by reverse transcription (FIG. 10, I) of the above RNA or mRNA library with a random primer having a specific sequence.
  • the reverse transcriptase in this case is not particularly defined, such as Superscript II RT (Superscript Double Strand cDNA Synthesis Kit; Invitrogen) and Sensiscript Reverse Transcnptase (Qiagen).
  • 3'tail is a poly Ax 8 sequence as an A sequence, an Xhol sequence as an XA sequence, or a sequence of (C or G) NN (C or G) with 4 or more bases.
  • Tag 2 is a tag-based sequence that uses an antigen-antibody reaction such as Flag-tag sequence, HA-tag, IgG protein A (z domain), His-tag, etc. The sequence may be used to use any means capable of detecting or purifying the protein.
  • the combination of the XA sequence is preferable during the synthesis of the C-terminal labeled protein, and the A sequence is preferable during the formation of IW.
  • the XA sequence or the A sequence is also a sequence required for ligation with the PEG (Boc) spacer to further promote IW PEG spacer translation.
  • assigning molecule The configuration of the assigning molecule is described, for example, in WO 02/46395, and the sequence necessary for forming the assigning molecule, that is, the specific sequence is known by those skilled in the art to such a known configuration. Can be set appropriately based on
  • the dsDNA library 1 is obtained by synthesizing the above ssDNA library into double-stranded DNA (FIG. 10, II). At this time, synthesis of complementary strand DNA by DNA polymerase I and RNA degradation by RNase H are performed simultaneously, and nicks between DNA synthesized by DNA polymerase I are connected by DNA ligase.
  • An important feature of the synthesized double-stranded DNA library is that only the complementary strand synthesized by DNA polymerase I is phosphorylated at the 5 'end and has a specific sequence at the 3' end. .
  • the dsDNA library must be formed by this method. 17 is preferred, but other enzymes may be used or other principles may be used as long as a dsDNA library can be formed in which only the 5 'end of single-stranded DNA is phosphorylated. Good.
  • the ligated dsDNA library is obtained by ligating an adapter having a specific sequence to the above dsDNA library by DNA ligase (FIG. 10, ⁇ ). In this case, self-ligation is avoided by avoiding phosphorylation at the end of the adapter main chain.
  • the secondary strand shorter than the main strand is not ligated at the 3 'end of the adapter to make it double stranded so that ligation can be performed with highly efficient ligation DNA ligase.
  • the adapter When ligation is performed using RNA ligase, the adapter must be single-stranded and the adapter must not be phosphorylated.
  • the 3 'end of the template has a sequence (A sequence) to be a good acceptor for RNA ligase, and the ligation between the templates occurs with the DNA ligase.
  • a sequence A sequence
  • the disadvantage is that the cost is much higher than the conventional method.
  • ligation efficiency of RNA ligase is lower than that of DNA ligase, it is preferable to perform ligation with DNA ligase when viewed comprehensively.
  • mapping molecules There is no restriction as long as a library of mapping molecules can be finally created. Normally, as shown in FIG. 10, it is a sequence containing 5′UTR or 5′UTR and Tag1.
  • the 5 'UTR is composed of a transcription promoter and a translation promoter.
  • Transcription promoters such as T7 / T3 or SP6 can be used, and there is no particular limitation.However, in a wheat cell-free translation system, the transcription promoter is As the enhancer sequence for SP6 and translation, it is preferable to use an omega sequence or a sequence containing a part of the omega sequence.
  • a part of the omega sequence of the translation enhancer ( ⁇ 29) contains a part of the omega sequence of TMV (Gallie DR, Walbot V. (1992) Nucleic Acids Res., Vol. 20, 4631-4638) And FIG. 3 of WO 02/48347).
  • Tag 1 the same force as that of Tag 2 is used. When both Tag 1 and Tag 2 are arranged, different Tag arrangements are arranged.
  • the adapter to be ligated ⁇ 7 may include these 5, UTR or 5'UTR and some or all of Tag1's ⁇ sequence. 18
  • the IW cDNA library of the present invention is synthesized by performing PCR (Fig. 10, IV) with 5 'and 3' primers having a specific sequence using the above-mentioned ligated dsDNA library as a template.
  • the 5 'and 3' primers anneal with specific sequences of the 5, UTR, Tag 1, Tag 2, 3 'tail, and a portion of the 5' UTR, Tag 1, Tag 2, 3 'tail. May be included as an adapter sequence.
  • a cDNA library with specific sequences such as 5 'UTR, Tag 1, Tag 2, Tag 3, and tail is completed.
  • the IW RNA library of the present invention can be obtained by copying the above-mentioned IW cDNA library (Fig. 10, V). At this time, it is possible to synthesize a C-terminal labeled protein library by translating the IW RNA library as it is or by translating it into the presence of a C-terminal labeling agent.
  • the enzyme for transcription is an enzyme such as T3, T7 or SP6 selected for the specific sequence.
  • the IW-ligated RNA library of the present invention can be obtained by ligating the above-mentioned IW RNA library with a spacer (Fig. 10, VI).
  • spacers include PEG spacers for IW in the case of IW formation, and PEG (Boc) ⁇ spacers for synthesizing C-terminal labeled proteins.
  • the ligation enzyme is typically a method using RNA ligase, but it is not limited to any particular method, such as using DNA ligase, ligation or light reaction. No '''
  • the IW random priming library of the present invention is obtained by translating the above-mentioned IW-ligated RNA library in a cell-free translation system or in a cell (Fig. 10, VII).
  • the PEG (Boc) spacer for the synthesis of a C-terminal labeled protein comprises a CCA region, a PEG region, and a donor region.
  • the minimum required configuration is the donor area.
  • puromycin which has not only a donor region but also a PEG moiety, and further has no amino acid binding ability.
  • the molecular weight range of the polyethylene glycol in the PEG region is from 400 to 30,000, preferably from 1,000 to 10,000, more preferably from 2,000 to 6,000.
  • the CCA region can be configured with or without puromycin.
  • puromycin Puromycin
  • 3,1-N-aminoacinolepuromycin aminonucleoside are examples of puromycin aminonucleoside.
  • 3'-N-Aminoacylpuromycin aminonucleoside PANS-amino acid
  • amino acid part is PANS-Gly for glycine
  • PANS-Val for phosphorus
  • PANS-Ala for alanine
  • all other amino acids 19 The corresponding PANS-all amino acids are available.
  • 3'-N-aminoacyl adenosine aminonucleosides ('3,-') were formed as a chemical bond by an amide bond formed as a result of the dehydration condensation of the amino group of 3'-aminoadenosine and the amino group of amino acid.
  • Aminoacyladenosine aminonucleoside for example, AANS-Gly of glycine, AANS-Val of phosphorus', AANS-Ala of alanine, and other AANS-amino acids corresponding to all amino acids can be used.
  • nucleosides or nucleosides and ester bonds of amino acids can also be used.
  • any nucleoside or a substance having a chemical structure skeleton similar to a nucleoside and an amino acid or a substance having a chemical structure skeleton similar to an amino acid can be used as long as they can be chemically bonded.
  • the CCA region preferably has a base sequence consisting of DNA and / or RNA of one or more residues on the 5 'side.
  • the type of base is preferably C> (U or T)>G> A.
  • the sequence is preferably dC-puromycin, rC-puromycin, etc., more preferably dCdC-puromycin, rCrC-puromycin, rCdC- ⁇ euromycin, dCrC-puromycin, etc., and aminoacyl-tRNA.
  • a CCA sequence that mimics the 3 'end (Philipps GR (1969) Nature 223, 374-377) is suitable.
  • any substance in which the amino group of the above puromycin derivative lacks the ability to bind to an amino acid, and a CCA region lacking puromycin may be considered.
  • the PEG portion can be configured to have a modifying substance.
  • the translation template can be used as a tag for recovery, reuse by purification, or fixing.
  • a modifying substance at least one base of DNA and / or RNA may be introduced with a fluorescent substance, biotin, or various separation tags such as His-tag.
  • the C-terminal labeling agent is a peptide translocation reaction in a protein translation system, that is, an acceptor moiety having a group (including a residue) capable of binding to a protein by a transpeptidation reaction on a liposome. It has a configuration in which it is linked to a modification via a nucleotide linker.
  • the protein interaction can be detected by synthesizing the protein in the presence of the modifying agent, purifying the resulting C-terminal modified protein, and using a detection system for the intermolecular interaction.
  • the modifying part contains a modifying substance similarly to the PEG part. Specific examples of the non-radioactive modifying substance as the modifying substance include fluorescent and non-fluorescent modifying substances.
  • fluorescent substance 20 There are fluorescent dyes such as the fluorescein system U, rhodamine series, Cy3, Cy5, eosin series, and NBD series, and fluorescent proteins such as green fluorescent protein (GFP).
  • any compound can be used as a marker, such as a coenzyme such as biotin, a protein, a peptide, a lipid, a pigment, polyethylene glycol, or the like.
  • the receptor part is a protein translation system and has a group capable of binding to a protein by a transpeptidation reaction, and preferably has a residue of puromycin or a derivative thereof. Puromycin has a structure similar to aminoacyl-tRNA, and is known to bind to the C-terminus of proteins at low concentrations, known as antibiotics that inhibit protein synthesis (
  • the puromycin derivative that can be used in the present invention may be any substance as long as it has a structure similar to puromycin and can bind to the C-terminus of the protein. Specific examples include 3, _N-aminoacino repuromycin aminonucleoside, and 3-N-aminoacyl adenosine aminonucleoside.
  • Nucleotide linker that connects between the modifying part and the receptor part is, specifically, a nucleic acid or nucleic acid derivative in which one or more ribonucleotides or deoxyribonucleotides are connected, and as a particularly preferred example, A ribonucleotide (-rC-) or deoxyribonucleotide (-dC-) containing a pentocin base may be an SI or a plurality of linked compounds.
  • any substance can be used as long as it can increase the amount of the modified protein by inserting it between the modification part and the receptor part.
  • the nucleotide linker is 2'-dexoxytidylic acid, 2, -dexoxytidyl- (3,5 ')-2'-deoxytidylic acid, lipocitidylic acid, or ribocytidyl- (3', 5 ') -Ribocytidylic acid is preferred.
  • the modifying agent can be produced by binding the above-mentioned modified moiety and receptor to each other via a desired nucleotide linker by a known chemical bonding method.
  • the above-mentioned receptor portion protected with an appropriate protecting group is bound on a solid support, and a nucleotide phosphoramidite and a deoxynucleotide phosphoramidite are used as a nucleotide linker using a nucleic acid synthesizer. It can be prepared by sequentially binding a phosphoramidite to which a fluorescent substance ⁇ biotin or the like is bound as a functional modifier, and then performing deprotection. Depending on the type of each part or the type of bonding, the components may be combined by liquid phase synthesis or 21 persons can be used together.
  • a metal ion such as nickel When a metal ion such as nickel is used as the functional modifier, a chelating agent such as tri-triacetic acid or iminodiacetic acid to which the metal ion can coordinate is bound, and then the metal ion is converted. It can be coordinated.
  • the cell-free protein synthesis system include a wheat germ extract, a heron reticulocyte extract, and an Escherichia coli S30 extract.
  • a library that is a translation template is prepared.
  • the C-terminal modified protein is synthesized by adding ⁇ 100 ⁇ M of the modifying agent and incubating at 25 to 37 ° C for 1 to several hours.
  • mapping the mapping molecule is synthesized simply by adding a translation template library and keeping the mixture at 25 to 37 ° C for 1 to several hours. Both synthesized modified proteins can be directly used for the next purification or detection process, or directly introduced into cells.
  • cell expression systems include bacteria such as Escherichia coli, Bacillus subtilis, thermophiles, yeast, etc., cultured cells such as insect cells, mammals, etc., as well as nematodes, Drosophila, 'zebrafish, mice, etc. Any cell may be used.
  • bacteria such as Escherichia coli, Bacillus subtilis, thermophiles, yeast, etc.
  • cultured cells such as insect cells, mammals, etc., as well as nematodes, Drosophila, 'zebrafish, mice, etc. Any cell may be used.
  • the above-mentioned C′-terminal-labeled or both modified proteins can be directly introduced.
  • a modified protein is synthesized by introducing 1-100 ⁇ M of the modifying agent into cells by electroporation, microinjection, etc., and keeping the cells at the optimal growth temperature for several hours. .
  • a library as an associating template is introduced, and an associating molecule is synthesized by heating at an optimal growth temperature of cells for several hours.
  • the synthesized quotient modified protein can be recovered by crushing the cells and subjected to the subsequent purification or detection process. It can also be subjected to the detection process in cells as it is. ..
  • the library of mapping molecules uses the Darwinian evolutionary mechanism to perform three unit operations of "Mutation”, “Selection” and “Amplification” as evolutionary molecular engineering. It can be applied scientifically by creating a substance that has acquired the desired function by evolving it progressively, and as an application to genomic function analysis, from the cDNA library to the desired substance or protein. ( Figure 7) A comprehensive set of gene sequences that interact with the cDNA can be analyzed ( Figure 7). 22 It is possible to detect an interaction with a substance or protein in one Jung, and to analyze the details of the interaction by secondary screening such as FCCS or microarray.
  • the library of the present invention can be used alone as a library of IW or C-terminal labeled proteins for analysis of interactions with substances or proteins by FCCS or microarray.
  • the library of the present invention it is of course possible to apply the library of the present invention to evolutionary molecular engineering using IW and use it to create functional proteins by primary screening, in which case the primary screening and the secondary screening are combined. Thus, it is also possible to analyze the details of the interaction between the created functional proteins.
  • mapping molecule when using the mapping molecule in the primary screening, the coding sequence of the A sequence is used.
  • secondary screening when using the mapping molecule, the coding sequence of the A sequence and labeling the C-terminal are used.
  • proteins when used, the effects of each can be used by changing the coding portion of the XA sequence by priming.
  • the library of IW libraries or C-terminally labeled proteins obtained above and a "target molecule” are brought into contact with each other by appropriately combining them according to the type of a modifying substance, the type of a reaction system, and the like. Based on the signal emitted by the molecule, the interaction can be analyzed by measuring the change in the signal generated based on the interaction between the two molecules. The interaction is analyzed by, for example, fluorescence correlation spectroscopy, fluorescence imaging analysis, fluorescence resonance energy transfer, evanescent field molecular imaging, fluorescence depolarization, surface plasmon resonance, or enzyme-linked immunosorbent assay. Be done.
  • the “target molecule” means a molecule that interacts with the IW or c-terminal label protein, and specifically includes proteins, nucleic acids, sugar chains, low molecular weight compounds, and the like.
  • the protein includes the modified protein of the present invention. 23 As long as it has the ability to interact with white matter, it may be a full-length protein or a partial peptide containing a binding active site, which is not particularly limited.
  • the protein may have a known amino acid sequence and its function, or may have an unknown protein. These can be translated from a synthesized peptide protein, a protein purified from a living body, or a cDNA library using an appropriate translation system, and the purified protein can be used as a target molecule.
  • the synthesized peptide chain may be a glycoprotein having a sugar chain bonded thereto.
  • a protein that has been translated and purified using an appropriate method can be used, preferably a purified protein having a known amino acid sequence or a cDNA library.
  • the "interaction" between the target molecule and the IW or C-terminal labeled protein is usually defined as a covalent bond, a hydrophobic bond, a hydrogen bond, a van der Waals bond, a covalent bond between the protein and the target molecule.
  • At least one of the forces of electrostatic coupling A force that indicates the action of a force acting between molecules This term should be interpreted in the broadest sense and not in any sense in a limited sense.
  • the covalent bond includes a coordinate bond and a dipole bond.
  • the coupling by electrostatic force includes not only electrostatic coupling but also electric repulsion.
  • the interaction also includes a binding reaction, a synthesis reaction, and a decomposition reaction that occur as a result of the above action.
  • interaction examples include binding and dissociation between an antigen and an antibody, binding and dissociation between a protein receptor and a ligand, binding and dissociation between an adhesion molecule and a partner molecule, and binding between an enzyme and a substrate. And dissociation, binding and dissociation between nucleic acids and proteins that bind to it, binding and dissociation between proteins in a signal transduction system, binding between glycoproteins and proteins, and so on. Dissociation, or binding and dissociation between a sugar chain and a protein.
  • Analytical methods include methods for detecting interactions and methods for screening interacting proteins.
  • the detection method of the present invention uses the library of the present invention as a play in detecting an interaction between a bait and a play.
  • the bait and prey are subjected to separation modification and detection labeling in a specific manner, and the bait is prepared by translation in the presence of the bait in a cell-free translation system.
  • the main feature is to make contact with play.
  • contacting a bait with a prey by generating a prey by translation in the presence of a bait is also referred to as “cell-free cotranslation”.
  • bait and prey have meanings commonly used in the technical field of analysis of interaction between substances. That is, known substances such as proteins and nucleic acids are called baits, and proteins and nucleic acids that interact with them are called play (prey).
  • the prey is preferably a protein.
  • the bait includes a complex composed of any ligands such as proteins (including peptides), nucleic acids, antibodies, hormones, and any metal such as bait. Any of them is fine. There is no particular restriction on the molecular weight of the bait.
  • a protein includes a functional domain or a full-length protein containing a functional domain. In the case of using a preamplifier, more complete detection is possible by using a full-length protein.
  • the play is preferably a protein library. There is no particular restriction on the molecular weight as a play. '.'
  • the bait and the prey are subjected to a detection label and a modification for separation in a specific manner;
  • the main feature is that cell-free co-translation is performed.
  • a preferred configuration of the detection method of the present invention is to connect the bait to the prey except that the bait is pre-labeled in a specific manner for detection and modification for separation, and cell-free cotranslation is performed. It may be similar to the usual method of detecting the interaction between bait and play, including touching and detecting the complex formed by the contact.
  • the modification for detection of bait and prey and the label for detection are appropriately selected as appropriate for the detection of complex and body.
  • both bait and prey are used for detection. It must be labeled or not modified for separation.
  • the prey is a fusion protein with a protein that can be used as a detection label, or a corresponding molecule, and accordingly, the bait has a modification for separation.
  • the bait should have a modification for separation. If the bait is a protein, the bait is fused to a protein that can be used as a modification for separation. 25 It is preferable that the fusion protein is present in the cell-free translation system by performing translation of mRNA encoding the bait-containing fusion protein in the cell-free translation system.
  • modification for separation when the bait is a protein examples include CBP (separable by affinity with calmodulin beads) and protein A (IgG) used for GST protein and TAP method.
  • -Affinity tags include fusion proteins with various antibody tags. If the bait itself has properties that can be used as a modification for separation, it can be used as a bait having the modification for separation without removing the bait.
  • the modification for detection of prey includes a fusion protein with a fluorescent protein such as GFP (green fluorescent protein).
  • Preparation of mRNA encoding the above fusion protein and translation of this mRNA in a cell-free translation system can be performed according to a conventional method.
  • the mRNA may be produced by transcription of DNA in a cell-free transcription / translation system.
  • the bait can be subjected to an arbitrary modification for separation.
  • the bait is a protein
  • examples of the modification for separation described above are given.
  • examples of the modification for separation when the bait is a nucleic acid or a drug include streptavidin and biotin which interacts with avidin. Use. If the bait itself has a property that can be used as a modification for separation, the bait can be used as it is as a bait having the modification for separation.
  • the associating molecule means a molecule that associates a phenotype with a genotype.
  • An associating molecule is usually a molecule in which a genotype molecule containing a nucleic acid having a salt S sequence reflecting a genotype is combined with a phenotype molecule containing a protein involved in phenotypic expression. .
  • prey By using prey as this protein, prey can be used as an association molecule
  • Such an assigning molecule may be used to translate the mRNA encoding play in a cell-free translation system so that the translated play associates with the mRNA, or to encode the play in a cell-free transcription translation system.
  • the transcription and translation of the DNA can be performed by performing the translated prey in association with the DNA. Therefore, cell-free cotranslation can be performed by the presence of a bait during this production. That is, cell-free cotranslation can be performed according to (1) or (2) below.
  • transcription and translation of DNA encoding the prey is performed in the presence of the bait such that the translated prey associates with the DNA. Then, a prey is generated by the cell-free transcription / translation system, and the bait is brought into contact with the prey.
  • the mRNA has a spacer region bound to its 3, terminal, and a peptide acceptor region containing a group capable of binding to a peptide by a transpeptidation reaction, which is bound to the spacer region. It is preferred that the translated prey associates with the mRNA. Examples of a method for detecting an interaction using such an assigning molecule include an in vitro virus method.
  • the mRNA is preferably a 5 'untranslated region including a transcription promoter and a translation enhancer, an ORF region encoding a prey bound to the 3' side of the 5 'untranslated region, and a 3' A nucleic acid comprising a 3'-terminal region comprising a poly A sequence attached to the side.
  • an expression amplification sequence containing an SNNS (S is G or C) sequence is further included on the 5 ′ side of the poly A sequence.
  • the 5 'end may or may not have a Cap structure.
  • the poly A sequence is a mixture of dA and / or rA of at least 2 residues or a single poly A continuous chain, preferably 3 residues or more, more preferably 6 or more, and still more preferably It is a poly A continuous chain of 8 residues or more.
  • Factors affecting the translation efficiency include a combination of a transcription promoter, a 5'UTR that can be used as a translation promoter, and a 3'terminal region containing a polyA sequence.
  • the effect of the poly A sequence in the 3 'terminal region is usually exerted with 10 residues or less.
  • the 5′UTR transcription promoter can be T7 / T3 or SP6, and is not particularly limited. SP6 is preferred, and SP6 is particularly preferred when an omega sequence or a sequence containing a part of an omega sequence is used as the translation sequence.
  • the translation enhancer is preferably a part of an omega sequence, and the omega sequence includes a part of a TMV omega sequence (029; Gallie DR, Walbot V. (1992) Nucleic Acids Res., Vol. 20, vol. 4631-4638 and WO 02/48347 27 (see FIG. 3).
  • a combination of an Xhol sequence and a polyA sequence is preferable. Further, a combination of an affinity tag and a polyA sequence is preferred downstream of the ORF region, ie, upstream of the Xhol sequence.
  • the affinity tag sequence is not limited as long as it is a sequence for using any means capable of detecting a protein such as an antigen antibody reaction. Preferably, it is a Flag-tag sequence or His-tag sequence which is a tag for affinity separation and analysis by an antigen-antibody reaction.
  • the translation efficiency of an affinity tag such as Flag-tag with an Xhol sequence and a poly A sequence further attached thereto increases.
  • the His-tag even without the Xhol sequence, the translation efficiency is sufficient and it is effective.
  • the configuration effective for the translation efficiency is also effective for the association efficiency.
  • the length is about 49 bp for the UTR and about 38 bp or about 26 bp for the 3'-terminal region, and is a length that can be incorporated into the PCR primer as an adapter region. This makes it easy to create a coding region with a 5 'UTR and a 3, terminal region from any vector, plasmid or cDNA library by PCR. In the coding region, translation can be done beyond the ORF region. That is, there may be no stop codon at the end of the ORF region.
  • the peptide acceptor region is not particularly limited as long as it can bind to the C-terminus of the peptide.
  • pyrromycin, 3-N-aminoacylpuromycin aminonucleoside (3-N -Aminoacylpuromycin aminonucleoside (PANS-amino acid) for example, PANS-Gly of glycine, PANS-Val of norin, PANS-Ala of alanine, and other PANS-amino acids corresponding to all amino acids are available. .
  • AANS-amino acid 3'-Aminoacyladenosine aminonucleoside
  • AANS-amino acid for example, AANS-Gly of glycine, AANS-Val of palin, AANS-Ala of alanine, and 0AANS-all amino acids corresponding to all amino acids.
  • nucleosides or those in which a nucleoside and an amino acid are ester-linked can also be used.
  • Other nucleosides or nucleosides Any substance having a chemical structure skeleton similar to 28 and a substance having a chemical structure skeleton similar to an amino acid or amino acid can be used as long as they can be chemically bonded.
  • the peptide acceptor region is preferably composed of puromycin or a derivative thereof, or puromycin or a derivative thereof and one or two residues of deoxyliponucleide or liponucleotide.
  • the derivative means a derivative capable of binding to the C-terminus of the peptide in the protein translation system.
  • the puromycin derivative is not limited to one having a complete puromycin structure, and a part of the puromycin structure is missing! / Includes things. Specific examples of puromycin derivatives include PANS-amino acids, AANS-amino acids, and the like.
  • the peptide ceptor region may be composed of only puromycin, but preferably has a base sequence consisting of DNA and / or RNA on the 5 'side by one residue.
  • the sequence may be dC-puromycin, rC-puromycin, etc., more preferably dCdC-puromycin, rCrC-puromycin, rCdC-puromycin, dCrC-puremycin, etc., and the aminoacyl-tRNA 3
  • CCA sequence that mimics the terminus (Philipps, GR '(1969) Nature 223, 374-377) is appropriate.
  • C> (U or T)> G> A is preferred because it is II. '''
  • the spacer region is preferably a PEG region containing polyethylene glycol as a main component.
  • the spacer region usually contains, in addition to the PEG region, a donor region capable of binding to the 3 ′ end of the nucleic acid.
  • the donor region capable of binding to the 3 'end of a nucleic acid usually consists of one or more nucleotides.
  • the number of nucleotides is usually 1 to 15, preferably 1 to 2.
  • Nucleotides may be liponutatides or deoxyliponucleotides.
  • the donor region may have a modifying substance.
  • the sequence at the 5 'end of the donor region affects the efficiency of ligation with the coding region encoding play.
  • Ligation of the coding region and the spacer region requires the inclusion of at least one or more residues.
  • at least one residue of dC (doxycytidylic acid) is required.
  • dCdC (dideoxycytidylic acid) with 2 residues 29 is preferred.
  • the type of base is preferably in the order of C> (U or T)>G> A.
  • the PEG region contains polyethylene glycol as a main component.
  • “main component” means that the total number of nucleotides contained in the PEG region is 20 bp or less, or the average molecular weight of polyethylene glycol is 400 or more. Preferably, it means that the total number of nucleotides is 10 bp or less, or the average molecular weight of polyethylene glycol is 1000 or more.
  • the average molecular weight of polyethylene glycol in the PEG region is usually from 400 to 30,000, preferably from 1,000 to 10,000, and more preferably from 2,000 to 8,000.
  • the molecular weight of polyethylene glycol is lower than about 400, when the genotype molecule containing the spacer region is associated and translated, post-processing of the associated translation may be necessary. (Liu, R., Barrick, E., Szostak, JW, Roberts, RW (2000) Methods in Enzymology, vol. 318, 268-293), using PEG with a molecular weight of 1000 or more, more preferably 000 or more Since high-efficiency matching can be performed only by tagging translation, post-translation processing is not required.
  • the stability of the genotype tends to increase, especially when the molecular weight is 1000 or more, and when the molecular weight is 400 or less, the DNA spacer and the properties are different. It may become unstable as soon as possible. .
  • the associating molecule can be formed not only in the egret reticulocytes but also in the cell-free translation system of wheat germ.
  • the stability of the template molecule is dramatically improved, eliminating the need for post-translational processing.
  • the DNA encodes a fusion protein of the protein and streptavidin or avidin, the DNA is labeled with biotin, and the DNA is transcribed in a state where the DNA-molecule is contained in one section of the emulsion.
  • the translated play is associated with the DNA by performing the translation.
  • the emulsion is usually a W / 0 type emulsion formed by mixing two kinds of surfactants and mineral oil with a reaction solution of a cell-free transcription / translation system.
  • the surfactant HLB hydrophile-lipophile
  • 30 balance) value must be between 3.5 and 6.
  • the ratio of surfactant to mineral oil is: ® The ratio is usually 1:18 (volume ratio) .
  • the ratio of the reaction solution to the whole emulsion is:! ⁇ 50% (volume ratio), usually 5% .Surfactant and mineral oil
  • the emulsion can be formed by adding the reaction solution to several portions of the mixture at low temperature with stirring, and mixing the mixture to increase the temperature of the emulsion. Can be started with ''''
  • a complex formed by cell-free cotranslation can be specifically detected by performing detection labeling and separation modification in a specific manner on the bait and prey.
  • E. coli E. cdi Egret reticulocytes
  • Any kind of wheat germ system is acceptable.
  • the formation of the assigning molecule is highly unstable in the E. coli bacillus.
  • the heron reticulocyte system (Nemoto N,
  • the template of bait and prey added to the cell-free translation system may be either RNA or DNA as long as the cell-free translation system also generates transcription.
  • a translation part plate characterized by a coding part having information to be translated into a protein and a PEG spacer is used.
  • the coding part is information to be translated into a protein, and may be any sequence. However, it is preferable that the coding part has an apter (A sequence) in the third terminal region or the coding part. It has an acceptor (A sequence) in the 3 'terminal region and a translation amplification sequence (X sequence) 5' upstream of the A sequence.
  • a short poly A sequence is included as the A sequence in the coding section.
  • a short poly A sequence is a sequence that normally has an A force of 210 bases.
  • a part of the PEG spacer has a PEG region containing polyethylene glycol as a main component, a donor region for linking to a coding part, and a CCA region at the 3 ′ end.
  • the PEG spacer portion can be controlled only by the donor region or the CCA region alone, but preferably has a configuration including a PEG region mainly composed of polyethylene glycol.
  • the CCA region is characterized in that it has no function of binding to a protein translated by the translation template by a transpeptidation reaction.
  • the polyethylene glycol in the PEG region has a molecular weight of 500 or more.
  • the function imparting unit (F1 and / or F2) is characterized in that the translation template and / or the protein translated from the translation template is fixed or fluorescently labeled.
  • Biotin or the like can be considered as the immobilizing substance, and fluorescein, Cy5, or rhodamine green (RhG) can be considered as the fluorescent substance. It relates to these coding parts, translation templates and their libraries, as well as proteins translated on ribosomes and their libraries.
  • the bait translation template (A in Fig. 11) consists of a coding part derived from the coding molecule (B in Fig. 11) and a part of the PEG spacer derived from one molecule of the PEG spacer (C in Fig. 11). Consists of In this embodiment, the stability is improved and the translation efficiency can be improved by connecting (ligating) a part of the PEG spacer to the code part basically irrespective of the arrangement of the code part. However, the translation efficiency can be further improved depending on the structure of the code section and the type of the PEG spacer. The details are described below.
  • the code part (B in Fig. 11) of the present embodiment consists of a 5 'terminal region, an ORF region, and a 3' terminal region. 32 Cap ends may or may not be present.
  • the 3'-terminal region of the code part is composed of poly Ax8 system IJ as A sequence, Xhol sequence as X sequence, SNNS (S is G or C) sequence with 4 or more bases, and A sequence.
  • XA array is a combination of X arrays.
  • the affinity tag sequence for the jt flow of the A sequence a configuration comprising a Flag-tag sequence and a tag sequence can be considered.
  • the affinity tag sequence any means that can detect or purify the protein, such as those utilizing an antigen-antibody reaction such as HA-tag or IgG protein A (z domain) or His-tag, can be used. It doesn't work even with the arrangement for.
  • the combination of XA sequences is important. Among the X sequences, the first four bases are important, and those having an SNNS sequence are preferable.
  • the 5'-terminal region acts as a transcription promoter and translation promoter, and transcription promoters such as T7 / T3 or SP6 can be used, and there are no particular restrictions. It is preferable to use an omega sequence or a sequence containing a part of the omega sequence as the promoter sequence, and it is preferable to use SP6 as the promoter.
  • a part of the omega sequence of translation enhancer (029) contains a part of the omega sequence of TMV (Gallie DR, Walbot V. (1992) Nucleic Acids Res., Vol. 20, 4631-4638). , And FIG. 3 of WO 02/48347).
  • the ORF region in the coding part may be any sequence consisting of DNA and / or RNA. Gene sequences, exo sequences, intron sequences, random sequences, or any other natural or artificial sequences are possible, and there are no sequence restrictions.
  • the PEG spacer molecule of this embodiment (C in FIG. 11) is composed of a CCA region, a PEG region, and a donor region.
  • the minimum required configuration is the donor region.
  • the molecular weight of the polyethylene glycol in the PEG region ranges from 400 to 30,000, preferably from 1,000 to 10,000, more preferably from 2,000 to 6,000.
  • the CCA region can be composed of puromycin-containing and non-puromycin-containing.
  • puromycin, 3 -N-aminoaminopuromycin-a-nonnucleoside (3-N-Aminoacylpuromycin aminonucleoside) can be used.
  • PANS-amino acid for example, the amino acid portion is glycine PANS-Gly, palin PANS-Val, ara 33 PANS-Ala for nin and other PANS-total amino acid power corresponding to all amino acids are available.
  • AANS-Gly for glycine, AANS-Val for palin, AANS-Ala for alanine, and other AANS-amino acids corresponding to all amino acids can be used.
  • nucleosides or those in which a nucleoside and an amino acid are ester-bonded can also be used.
  • any nucleoside or a substance having a chemical structure skeleton similar to a nucleoside and an amino acid or a substance having a chemical structure skeleton similar to an amino acid can be used as long as they can be chemically bonded.
  • any substance that lacks the ability of the amino group of the above puromycin to bind to an amino acid, and a CCA region that lacks piuromycin can be considered, but include puromycin that cannot bind to proteins on ribosomes. By doing so, the translation efficiency can be further improved. The reason is not clear, but turnover may be promoted by stimulating puromycin-powered S ribosomes that cannot bind to proteins.
  • CCA region CCA region
  • CCA CCA region
  • the sequence may be dC-puromycin, rC-puromycin, or the like, more preferably dCdC-puromycin, rCrC-puromycin, rCdC-puromycin, dCrC-puromycin, etc., and the 3 'end of aminoacyl-tRNA.
  • these puromycins are unable to bind to amino acids in any way.
  • a part of the PEG spacer of the present embodiment can be configured to have a modifying substance (F1 and / or F2).
  • a modifying substance F1 and / or F2.
  • the translation template can be used as a tag for recovery, reuse by purification, or immobilization.
  • a modifying substance a fluorescent substance, biotin, or various separation tags such as His-tag may be introduced into at least one base of DNA and / or RNA.
  • a fluorescent substance, biotin, or various separation tags such as His-tag may be introduced into at least one base of DNA and / or RNA.
  • each length is approximately equal to that of the 5 'terminal region.
  • the method of ligation of a PEG spacer molecule and a coding molecule of the present embodiment is not particularly limited, and any method may be used, such as a method using general DNA ligase or a ligation reaction.
  • the A sequence of the 3'-terminal region is important as the range that affects ligation efficiency in the coding region, and at least two dA and / or rA residues or a mixture of two or more dA and / or rA residues are important. It is a poly A continuous chain, preferably a poly A continuous chain of 3 residues or more, more preferably 6 to 8 residues or more.
  • the DNA and / or RNA sequence at the 5 'end of the donor region of a part of the PEG spacer influences the ligation efficiency.
  • the residue dC (doxycytidylic acid) or the two-residue dCdC (dideoxycitylic acid) is preferred.
  • the type of base is preferably in the order of C> (U or T)> G> A. Further, it is preferable to add polyethylene glycol having the same molecular weight as the PEG region during the ligation reaction.
  • a translation template consists of a coding part having information to be translated into a protein and a part of a PEG spacer. It has an A sequence at the 3 'end of the code portion, and the A sequence includes a short poly A sequence.
  • the PEG spacer portion is characterized in that the polyethylene glycol has a molecular weight of at least 00 in the PEG region containing polyethylene glycol as a main component, and at least one PEG spacer in the donor region and / or the CCA region.
  • the CCA region is characterized in that it has a function of combining with a protein translated by the translation template by a peptide transfer reaction. Has 35 romycin.
  • the present invention is characterized in that a modifying substance (F1 and / or F2) is immobilized or fluorescently labeled on the translation template and / or the protein translated from the translation template. Biotin or the like can be considered as the immobilizing substance, and fluorescein, Cy5, or rhodamine green (RhG) can be considered as the fluorescent substance.
  • a play is a protein (A in FIG. 12; an assigning molecule) synthesized by translation using a translation template and C-terminal modified with a translation template.
  • the translation template (B in FIG. 12)
  • the structure of the protein (C in Fig. 12) modified with C-terminal by PEG. The details are described below.
  • the PEG spacer part of the translation template (Fig. 12B) is similar to the translation template preferred for use as the bait described above, except that puromycin can be linked to amino acids.
  • the coding part is also the same as the translation template preferable for use as the above-mentioned bait.
  • the 3 'terminal region be an A sequence, and the total protein The efficiency of association is significantly improved, and free protein and quantity of quality S are drastically reduced.
  • the protein of the present embodiment modified with C-terminal by PEG (C in Fig. 12) can be applied to, for example, FCCS measurement, a fluorescence reader, and a protein chip when the coding part is not used for detecting protein interaction.
  • it may be intentionally cut with RNase A or the like. Cleavage can eliminate the difficulties in detecting protein-protein interactions due to interference with the coding region. I "production can also be eliminated.
  • a single assigned molecule can be immobilized on plates, beads, or glass slides It is also possible to do
  • the cell-free cotranslation will be described with reference to FIG.
  • the play is translated in vitro in the presence of the bait, as shown in FIG.
  • FIGS. 13A and 13B the case where the bait is a protein and is translated at the same time as play in a cell-free translation system, and the case where the bait is a nucleic acid or formone, etc.
  • the prey is a fusion protein or an assigning molecule. '.
  • the complex may also be formed by combining another play with a play linked to a bait (II). is there. ,.
  • the bait is a protein
  • examples of the bait include a protein having only a functional domain for interacting with a target protein, a protein containing a functional domain, and a full-length protein.
  • a full-length protein it is preferable to use a full-length protein, since it is generally expected that the protein has a plurality of functional domains, so that play can be comprehensively detected.
  • the full-length protein may be a full-length protein alone or a collection of a plurality of baits reconstituting the full-length protein.
  • the bait may be a complex, which is referred to as a "composite bait”.
  • complexes that can be considered in cell-free cotranslation include a complex of a single bait and a single play, a complex of a composite bait and a play, a complex of a bait and a plurality of plays, And, a composite of multiple play with multiple baits is possible. Therefore, the interaction that can be detected by the detection method of the present invention includes an indirect interaction between a bait and a prey to form a complex that is not limited to a direct interaction.
  • the most important thing in the cell-free cotranslation of the present invention is that the protein is folded in a native state and is in a non-denatured state just after translation, and the protein to be interacted with the bait. It is considered that play or bait and bait or play and play coexist in the cell-free translation system and can interact with each other quickly. This can be translated separately and translated 37 It is supported by the fact that the translation results were superior to the co-translation, rather than the co-existence. In other words, it is considered that the protein translated in vitro can meet the protein or nucleic acid in a native folded state, and thus the complex can be rapidly formed by the interaction.
  • bait had to be expressed and purified in large amounts in Escherichia coli. For example, in order to express bait-prey interaction in cells by the TAP method, etc., preparation for at least one month was required.
  • bait is expressed in E. coli or other cells and purified, so it takes at least 2 to 3 weeks. In addition, it was necessary to add 50 to 100 times the amount of bait to play in order to interact with play.
  • the detection method of the present invention By the detection method of the present invention, translation and in vitro, including bait, can be completely performed. By performing the screening, it is possible to construct a system capable of avoiding nonspecific detection of interaction between proteins or between protein and nucleic acid and comprehensively detecting the interaction. Therefore, the present invention also provides a screening method using the detection method of the present invention.
  • the screening method of the present invention is characterized in that a bait and a prey interact through cell-free cotranslation to form a complex, and the prey interacting with the bait is analyzed by screening the complex.
  • the screening method of the present invention includes a detection step of detecting an interaction between a bait and a prey, and a detection step of detecting an interaction between a bait and a prey, according to the detection method of the present invention, and It may be the same as a normal screening method for plays interacting with a bait, including a selection step of selecting a play in which an interaction is detected. 38
  • the screening method of the present invention further comprises a preparation step of preparing the prey selected in the selection step, wherein the prepared prey is used in place of the bait used in the detection step or together with the bait thereof, It is preferable to repeat the selection step and the preparation step.
  • a cell-free cotranslation step in a cell-free translation system in which a play bait forms an interaction, 2) a play interacting with a bait is detected.
  • the play is analyzed and analyzed in 4)
  • the play analyzed and analyzed in 3) is set as a new next bait, and the process is repeated from 1).
  • Steps 1) and 2) correspond to the detection step and the selection step, and step 3) corresponds to the preparation step. That is, the step of bringing the bait into contact with the prey in the detection step corresponds to the cell-free cotranslation step, and the step of detecting and selecting the complex in the detection step corresponds to the 'step of screening.
  • the play selected in the selection step may be subjected to the detection step again.
  • cell-free co-translation between bait and a prey's library which is a group of a plurality of preys, may be performed, and two or more preys may be detected in the 'screening' step. . '' ''
  • the composite bait and the play may coexist and form a complex of the composite bait and the play by interaction.
  • multiple plays of the play 'library coexist with the bait, forming a complex of bait and multiple plays through interaction. Multiple plays can be detected.
  • the bait is a full-length protein
  • the full-length protein generally contains a plurality of interacting functional domains, so that more plays can be comprehensively detected.
  • a plurality of plays interacting with the composite bait can be detected.
  • the bait serves as a reinforcing agent for the interaction between bait and prey, and more specific interaction can be realized, thereby avoiding non-specific detection in exhaustive detection.
  • play is performed using the mapping molecule (fiision). 39.
  • the play may or may not directly interact with the bait. '
  • the prey that forms the complex is detected by RT-PCR or PCR, and then, ⁇
  • the PCR product is re-screened as a prey (reconstruction of the prey), or the prey analyzed by PCR product You may screen as the next bait.
  • re-screening from the PCR product, or screening the play analyzed by the PCR product power as a new next cell can only be performed using evolutionary molecular techniques such as the in vitro virus method and STABLE method. It is possible, and cannot be done by methods that directly analyze proteins, such as the pull-down method and the TAP method. '
  • the gene sequence of the protein prey can be known by RT-PCR or PCR after screening.
  • the protein play here is a play that interacts with the bait or a play that interacts with the play, and a play that interacts with the bait. All multiple plays can be analyzed comprehensively. If further prescreening is required, transcribe the DNA template that is the product of RT-PCR or PCR and repeat the same cycle. Also, if play is determined by RT-PCR or PCR followed by a sequence, the protein play can be used as a bait. If more than one play interacts with the first bait, a composite bait can be formed and more plays can be detected.
  • the analyzed play can be used as a bait in the next analysis. If the number of baits increases, the bait composite proceeds, which leads to detection of a further play. In this way, using play as a bait in the next cycle can be easily realized only by using an in vitro virus method or STABLE method using an assigning molecule.
  • methods such as mRNA display require large-scale synthesis and purification of the newly prepared GST fusion protein in Escherichia coli, and preparation of the bait is time-consuming and difficult. According to cell-free co-translation, the cycle can be easily performed without the necessity.
  • the bait may be provided with a mechanism of immobilization using an affinity tag or the like, and play interacting with the bait may be detected.
  • the fixation mechanism can be a good one or a good one.
  • Pre-libraries include cDNA libraries (random priming 'libraries, dT priming libraries), random libraries, peptide libraries, formone' libraries, antibody 'libraries, and ligands' live libraries. Rallies, drug compound libraries, etc. For example, if a random-primed cDNA library is used as a play 'library', full-length play cannot be expected from this library, but play including functional domains can be expected. Such a library is particularly effective for comprehensive prey detection when used for screening in combination with a composite bait or a full-length protein.
  • Examples of random priming libraries include the promoter of SP6 RNA polymerase (SP6) as the transcription promoter on the 5 'side of the manoretic cloning site (MCS), and the tobacco mosaic virus as the translation enzyme. 5 'containing a part of the TMV omega sequence ( ⁇ 29); has an untranslated (UTR) region and is used as an affinity tag sequence on the 3' side of MCS for antigen-antibody reaction.
  • SP6 RNA polymerase as the transcription promoter on the 5 'side of the manoretic cloning site (MCS)
  • MCS manoretic cloning site
  • tobacco mosaic virus as the translation enzyme.
  • 5 'containing a part of the TMV omega sequence ( ⁇ 29) has an untranslated (UTR) region and is used as an affinity tag sequence on the 3' side of MCS for antigen-antibody reaction.
  • cDNA obtained by random priming is incorporated is mentioned.
  • the above-described detection method of the present invention includes a step of bringing a bait into contact with a prey to form a complex. Accordingly, a method for forming a complex of a bait and a prey interacting with the bait according to this step is provided.
  • the method of the present invention uses the library of the present invention as a prey in forming a complex of bait and a prey that is a protein that interacts with the bait. It is characterized by performing detection labeling and separation i3 ⁇ 4 modification in a specific manner, and performing cell-free cotranslation. Therefore, a preferred configuration of the method of the present invention is to provide bait and prey with a detection label and separation modification in a specific manner, and with the exception of performing cell-free cotranslation. This may be similar to the usual method of forming a bait-prey complex, including contacting the interacting prey. Labeling for detection and modification for separation in a particular mode of bait and prey, as well as cell-free cotranslation, may be as described for the detection method of the invention.
  • examples of post 'selection include the following.
  • a method for analyzing an interaction between a protein and a target molecule comprising using a C-terminal modified protein containing the protein and having a C-terminal modified modifier. Interactions are analyzed by fluorescence correlation spectroscopy, fluorescence imaging analysis, fluorescence resonance energy transfer, evanescent field molecular imaging, fluorescence depolarization, surface plasmon resonance, or enzyme-linked immunosorbent assay. be able to.
  • the C-terminal modified protein may be immobilized.
  • a C-terminal modified protein may be added to the array on which the target molecule is immobilized, and the C-terminal modified protein specifically bound to the target molecule may be detected.
  • the modified protein of the present invention obtained above and a target molecule are brought into contact with each other in an appropriate combination depending on the type of the modifying substance, the type of the reaction system, and the like.
  • the interaction is analyzed by measuring a change in the signal generated by the modified protein of the present invention or the target molecule based on the interaction between the two molecules. 42
  • Interaction analysis can be performed, for example, by fluorescence correlation spectroscopy, fluorescence imaging analysis, fluorescence energy transfer, evanescent field molecular imaging, fluorescence depolarization, surface plasmon resonance, or solid-phase enzyme immunoassay. It is done by law. The details of these methods are described below. -
  • target molecule refers to a molecule that interacts with the modified protein of the present invention, and specifically includes a protein, a nucleic acid, a heavy chain, a low-molecular compound, and the like. It is.
  • the protein is not particularly limited as long as it has the ability to interact with the modified protein of the present invention, and may be a full-length protein or a partial peptide containing a binding active site.
  • the protein may be a protein whose amino acid sequence and its function are known or unknown. These can be translated from a synthesized peptide chain, a protein purified from a living body, or a cDNA library using an appropriate translation system, and the purified protein can be used as a target molecule.
  • the synthesized peptide chain may be a glycoprotein having a sugar chain bound thereto. Of these, preferably, a protein translated and purified from a purified protein library having a known amino acid sequence or a first-class cDNA library using an appropriate method can be used.
  • the nucleic acid is not particularly limited as long as it has the ability to interact with the modified protein of the present invention.
  • RNA can be used for DNA and RNA.
  • the nucleic acid may have a known base sequence or function, or may have an unknown nucleic acid.
  • those having a known function as a nucleic acid capable of binding to a protein and having a known base sequence, or those obtained by cleavage and isolation of a genomic library using a restriction enzyme or the like can be used.
  • the sugar is not particularly limited as long as it has an ability to interact with the modified protein of the present invention, and may be a sugar chain having a known or unknown sugar sequence or function.
  • a sugar chain which has already been separated and analyzed and whose sugar sequence or function is known is used.
  • the low molecular weight compound is not particularly limited as long as it has an ability to interact with the modified protein of the present invention. Even those whose functions are unknown or whose ability to bind to a protein is already known can be used. .
  • the term "interaction” performed by these target molecules with the modified protein of the present invention usually means a covalent bond, a hydrophobic bond, a hydrogen bond, a van der Waals bond, or an electrostatic bond between the protein and the target molecule.
  • 43 Denotes the effect of forces acting between molecules arising from at least one of the force bonds, but this term should be interpreted in the broadest sense and not in any way limited.
  • the covalent bond includes a coordination bond and a dipole bond.
  • the coupling by electrostatic force includes not only electrostatic coupling but also electric repulsion.
  • the interaction also includes a binding reaction, a synthesis reaction, and a decomposition reaction resulting from the above action.
  • Specific examples of the interaction include the binding and dissociation between an antigen and an antibody, the binding and dissociation between a protein receptor and a ligand, the binding and dissociation between an adhesion molecule and a partner molecule, and the interaction between an enzyme and a substrate. Binding and dissociation, binding and dissociation between nucleic acids and proteins that bind to it, dissociation and dissociation between proteins in the signal transduction system, binding and dissociation between glycoproteins and proteins, or dissociation between sugar chains and proteins And the solution between i. .
  • the target molecule to be used can be used after being modified with a modifying substance according to the embodiment.
  • the modifying substance is usually selected from non-radioactive modifying substances such as fluorescent substances.
  • the fluorescent substance include various fluorescent dyes having free functional groups (for example, carboxyl group, hydroxyl group, amino group, etc.) and capable of being linked to the above-mentioned target substances such as proteins and nucleic acids, such as fluorescein-based rhodamine-based and rhodamine-based fluorescent dyes. Any of U, Cy3, Cy5, eosin series, NBD series, etc. may be used.
  • the compound is a modifiable compound such as a dye, the type and size of the compound are not limited. , ' ⁇
  • modifying substances those suitable for a method of measuring or analyzing a change in a signal generated based on an interaction between a target molecule and the modified protein of the present invention are appropriately used.
  • the above-mentioned modifying substance can be bound to the target molecule using an appropriate method known per se. Specifically, for example, when the target molecule is a protein, a method for modifying the C-terminal described in WO 02/48347 can be used. When the target molecule is a nucleic acid, it can be easily modified by a method of performing PCR using an oligo DNA primer to which a modifying substance is previously bound by a covalent bond or the like.
  • modified protein of the present invention or the target molecule used in the present invention may be bound to a solid phase (that is, immobilized) depending on the embodiment. Some of them are bonded via a modifying substance, while others are bonded by other parts. , 44
  • the modifying substance used in the case of binding via a modifying substance is usually a molecule that specifically binds to a specific polypeptide (hereinafter, may be referred to as "ligand”).
  • a specific polypeptide hereinafter, sometimes referred to as an “adaptor protein” that binds to the ligand is bound to the phase surface.
  • the adapter protein also includes a binding protein, a receptor protein constituting a receptor, an antibody, and the like.
  • Examples of the combination of the adapter protein Z ligand include biotin-biotin'biotin-binding protein Z-biotin or iminobiotin such as avidin and streptavidin, maltose-binding protein nomaltose, G protein Z-guanine nucleotide, and polyhist ' Thidine peptide Metal ion such as nickel or cobalt, gnoretathionone S-transferase / daltathione, DNA binding protein / DNA, antibody Z antigen molecule (epitope), rumodulin calmodulin binding peptide, ATP binding protein ZATP, or estradiol receptor protein And various receptor proteins such as estradiol Z and its ligands.
  • biotin-biotin'biotin-binding protein Z-biotin or iminobiotin such as avidin and streptavidin, maltose-binding protein nomaltose, G protein Z-guanine nucleot
  • combinations of adapter protein / ligand include biotin such as avidin 'streptavidin and iminobiotis binding protein / pyotin or iminobiotin, maltose binding protein / maltose, polyhistidine peptide Z nickel or cobalt.
  • biotin such as avidin 'streptavidin and iminobiotis binding protein / pyotin or iminobiotin
  • maltose binding protein / maltose polyhistidine peptide Z nickel or cobalt.
  • streptavidin / biotin or iminobiotin which is preferred by a metal ion such as glutathione-S-transferase / daltathione, an antibody / antigen molecule (epitope), etc.
  • binding proteins are known per se, and the DNA encoding the protein has been cloned. .
  • the binding of the adapter protein to the solid phase surface can be carried out by a method known per se. Specifically, for example, tannic acid, formalin, gnoletalanolaldehyde, Use a method that utilizes pyruvaldehyde, benzodiazobis bis-diazotide, toluene-2,4-diisocyanate, an amino group, a carboxyl group that can be converted to an active ester, or a hydroxyl or amino group that can be converted to a phosphoramidide. Let's do it.
  • a known method usually used to bind proteins, nucleic acids, sugar chains, and low molecular weight compounds to the solid phase specifically, for example, tannin Acid, formalin, glutaraldehyde, pyrvicaldehyde, bis-diazo
  • tannin Acid formalin
  • glutaraldehyde pyrvicaldehyde
  • bis-diazo a method utilizing a carboxyl group convertible to an active ester, a hydroxyl group or an amino group convertible to a phosphoramidide, or the like can be used.
  • the solid phase is usually used for immobilizing proteins, nucleic acids and the like, and the material and shape of the solid phase are not particularly limited.
  • a glass plate, a nitrocellulose membrane, a nylon membrane, a polyvinylidene fluoride film, a plastic microplate, or the like can be used.
  • Measurement is a means for collecting changes in signals used for analysis, and should not be interpreted in a limited manner in a limited sense.
  • Examples of the measuring method used include fluorescence correlation spectroscopy, fluorescence resonance energy transfer, evanescent field molecular imaging, fluorescence depolarization, fluorescence imaging analysis, surface plasmon resonance, and enzyme-linked immunosorbent assay. Any system that can detect intermolecular interactions is available.
  • This measurement method also includes a method comprising adding the modified protein of the present invention onto an array having target molecules immobilized thereon, and detecting the modified protein of the present invention specifically bound to the target molecule.
  • An array on which target molecules are immobilized means a solid phase on which target molecules are immobilized in an arrangement that allows their identification.
  • the method for detecting the modified protein of the present invention specifically bound to the target molecule is not particularly limited as long as the modified protein of the present invention specifically bound to the target molecule is detected.
  • a method in which the modified protein of the present invention is not bound to the target molecule from the array to which the modified protein of the present invention has been added! / ⁇
  • FCS Fluorescence Correlation Spectroscopy
  • the flow rate of the particles, the diffusivity, the volume shrinkage, and the like are measured.
  • the interaction between the modified protein of the present invention (C-terminal modified protein) and the target molecule causes Interact by measuring changes in the translational Brownian motion of one molecule 46 molecules can be measured.
  • the sample particles are excited by the excitation light, emit fluorescence in a part of the sample solution volume, and the emitted light is measured to obtain the photon ratio. This value varies with the number of particles present in the volume of space observed at a particular time.
  • the various parameters described above can be calculated using the autocorrelation function. Equipment for performing this FCS is also commercially available from Carl Zeiss and other companies. In this method, analysis can be performed using these equipment.
  • FCCS fluorescence cross-correlation spectroscopy
  • FRET fluorescence resonance energy transfer
  • the FCCS method when compared to other detection systems such as the fluorescence depolarization method, the FCCS method has the advantages of requiring less sample volume, shorter detection time, and easier automation for HTS.
  • the FCCS method can provide very basic information such as the size and number of fluorescently labeled molecules. May be used for mediocre uses. The difference between the two is that the surface plasmon resonance method detects the interaction in the state where the protein is immobilized, whereas the FCCS method allows the interaction in a solution to be more closely resembled to the natural state. It is in.
  • the FCCS method it is necessary to label the protein with a fluorescent dye instead of immobilizing the protein, but the present invention has made it possible to overcome this problem.
  • the protein'protein interaction protein is in a solution state close to the intracellular environment. 47 White matter 'nucleic acid interaction can be examined, and the dissociation constant (binding constant) can be easily calculated by one measurement.
  • any method may be used as long as the two molecules are brought into contact with each other to an extent sufficient for interaction.
  • a solution prepared by dissolving the C-terminal modified protein at an appropriate concentration is added to a buffer solution or the like which is usually used biochemically for measurement in a commercially available FCS device, and then an appropriate buffer solution is added. This is performed by a method in which a solution in which a target molecule is dissolved at a concentration is introduced.
  • a modified molecule is brought into contact with the immobilized molecule, and the interaction between the two molecules causes the modified molecule to remain on the immobilized molecule. It is a method of measuring or analyzing using. ..
  • the C-terminal modified protein may be one which is fixed and immobilized via a modified portion, or one which is immobilized on a portion other than the modified portion.
  • a substrate (solid phase) for immobilizing a C-terminal modified protein or a target molecule is usually a glass plate used for immobilizing proteins, nucleic acids, or the like. Nylon membranes or plastic microplates can also be used.
  • the surface has various functional groups (amino group, carboxyl group, thiol group, hydroxyl group, etc.) and various ligands (metal ions such as biotin, iminobiotin, nickel or cobalt,
  • the above-mentioned substrate to which daltathione, saccharides, nucleotides, DNA, RNA, antibody, calmodulin, receptor protein, etc. are bound can also be used.
  • any method for bringing the modified target molecule or the C-terminal modified protein into contact with the immobilized molecule may be used as long as the two molecules are brought into contact with each other to an extent sufficient for interaction.
  • a method is preferably used in which a solution is prepared by dissolving a modified target molecule or a C-terminal modified protein in an appropriate concentration in a buffer commonly used in biochemistry, and the solution is brought into contact with the surface of a solid phase.
  • a step of washing the excessively present modified target molecule or C-terminal modified protein and the decorated protein with the same buffer or the like is carried out, and the target molecule or the C molecule remaining on the solid phase is removed.
  • the fluorescent signal generated by the modifying substance of the terminally modified protein, or the modified molecular force immobilized on the solid phase and the modified molecular force remaining on the solid phase are mixed to produce a signal that is commercially available.
  • the method of performing a large number of analyzes simultaneously includes, for example, a method of immobilizing a plurality of C-terminal modified proteins or modified or unmodified target molecules on the solid phase surface, or A method of immobilizing on a kind of c-terminal modified protein or a modified or unmodified target molecule, contacting a plurality of kinds of C-terminal modified proteins or modified target molecules, and the like are used.
  • a method of immobilizing a plurality of C-terminal modified proteins or modified or unmodified target molecules on the solid phase surface or A method of immobilizing on a kind of c-terminal modified protein or a modified or unmodified target molecule, contacting a plurality of kinds of C-terminal modified proteins or modified target molecules, and the like are used.
  • the molecules remaining on the solid phase are obtained by dissociation due to differences in buffer concentration, etc., and analyzed by a known method. Can be identified.
  • FRET fluorescence resonance energy-transfer
  • the disadvantage of this method is that the two fluorescent dyes must be close to each other within 40 to 50 A in order to generate FR3 ⁇ 4T, so depending on the size of the protein and the location of the fluorescent dye, they may interact. However, there is a risk that FRET will not be observed.
  • the evanescent field molecular imaging method is a method described in Funatsu, T., et al., Nature, 374, 555-559 (1995), etc., in which a solution is immobilized on a molecule immobilized on a transparent body such as glass.
  • a second molecule is brought into contact, a light source such as a laser beam is irradiated to the second molecule at an angle at which an evanescent field is generated, and the generated evanescent light is measured or analyzed by a detector.
  • a substrate for immobilizing the C-terminal modified protein or the target molecule a substrate made of a material such as glass is used, and quartz glass is preferably used. Further, it is preferable that the surface is subjected to ultrasonic cleaning in order to prevent scattering of laser light.
  • the method of contacting the immobilized R-terminal modified protein or modified target molecule with the immobilized molecule in the present method is a method in which both molecules are in contact with each other to an extent sufficient for interaction.
  • Any C-terminal modified protein or modified target molecule that is not immobilized is preferably used at a concentration appropriate for a buffer commonly used in biochemistry.
  • a preferred method is to prepare a dissolved solution and drop it on the surface of the solid phase. ⁇
  • the fluorescence polarization method (Perran, J., et al., J. Phys. Rad., 1, 390-401 (1926)) states that a fluorescent molecule excited by fluorescence polarization changes its steady state during the excited state. If it is kept, it emits fluorescence in the same plane of polarization, but if the excited molecule undergoes rotational Braun motion during the excited state, the emitted fluorescence will be in a different plane from the excitation light It is a method that utilizes' The motion of the molecule is affected by its size. If the fluorescent molecule is a macromolecule, there is almost no motion of the molecule during the excited state, and the emitted light remains polarized.
  • the polarization of emitted light is eliminated because of the high movement speed. Therefore, the intensity of the fluorescence emitted from the fluorescent molecule excited by the plane-polarized light is measured on the original plane and a plane perpendicular to the original plane. The information about is obtained. According to this method, it is possible to track the behavior of a target molecule interacting with a fluorescent molecule without being affected by contaminants. This is because the change in the degree of polarization is measured only when the fluorescence-modified molecule and the target molecule interact.
  • BECON manufactured by Panyera
  • this method can also be performed by using these devices.
  • any method of bringing the C-terminal modified protein into contact with the target molecule may be used as long as the two molecules can be brought into contact with each other to an extent sufficient for interaction.
  • a measurement tube of a commercially available fluorescence depolarizer add a solution in which a C-terminal modified protein is dissolved at an appropriate concentration in a buffer or the like normally used in biochemistry, and then add the target molecule in the buffer at an appropriate concentration. Is carried out by a method of charging a solution in which is dissolved.
  • the interaction between the C-terminal modified protein and the target molecule measured in the present method is not necessarily considered to be as specific as in the antigen-antibody reaction, and therefore, in order to detect the optimal combination, It is effective to quantify the degree of interaction.
  • an index indicating the degree of interaction for example, the value of the minimum target substance concentration that gives the maximum fluorescence polarization degree for a constant concentration of the C-terminal modified protein can be used.
  • a method of performing a large number of analyzes at the same time for example, a plurality of different C-terminal modified proteins are respectively injected into each measurement well of the above-mentioned fluorescence depolarization measurement apparatus, and a specific target molecule is added thereto.
  • a method is used in which a solution is injected or a specific C-terminal modified protein is injected, and different types of target molecule solutions are injected into each well.
  • -Surface plasmon resonance is a method in which surface plasmons are excited by molecules interacting at the metal-liquid interface and are measured by changes in the intensity of reflected light (Cullen, DC, et al., Biosensors, 3 ( 4), 211-225 (1987-88)).
  • the C-terminal modified protein needs to be immobilized by the method described above, but the target molecule is not required to be modified.
  • a substrate for immobilizing the C-terminal modified protein a substrate in which a metal thin film of -gold, silver, platinum or the like is formed on a transparent substrate of glass or the like is used.
  • the transparent substrate it is generally possible to use a substrate that is used for a surface plasmon resonance device, and it may be a substrate that is generally made of a material that is transparent to one laser beam.
  • the thickness is about 0.1 to 5 mm.
  • the thickness of the metal thin film is suitably about 100 to 2000A.
  • a commercially available solid substrate for such a surface plasmon resonance device can also be used. Immobilization of C-terminal modified protein on the above substrate 52 It can be performed by the method described above. .
  • any method may be used as long as both molecules are brought into contact with each other to an extent sufficient for interaction.
  • a method in which the C-terminal protein immobilized is brought into contact with a solution obtained by dissolving the target molecule at a suitable concentration in a commonly used biochemical buffer can be used.
  • These steps may be performed by a commercially available surface plasmon resonance device, for example, BIAcore2000 (Pharmacia Biosensor). After the two molecules are brought into contact with each other, the relative intensity of the reflected light is measured over time using a surface plasmon resonance device known per se, whereby the immobilized C-terminal modified protein and the target molecule are measured. Interactions can be analyzed.
  • BIAcore2000 Pulacia Biosensor
  • Enzyme linked immunosorbent assay Crowther, JR, Methods in Molecular Biology, 42 (1995) is a method in which a solution containing an antibody is contacted with an antigen immobilized on a solid phase. Due to the interaction of both molecules (antigen-antibody reaction), the fluorescence emitted from a modified molecule (such as G) that specifically binds the antibody remaining on the immobilized antigen to the antigen, or the modified molecule as a substrate. This is a method of measuring or analyzing a signal emitted from a dye that emits light using a commercially available detector (ELISA reader).
  • ELISA reader commercially available detector
  • a plastic microplate usually used for ELISA can also be used.
  • the method of contacting the modified target molecule to be an antibody with the solid phase molecule in the present method is not particularly limited as long as the two molecules are brought into contact with each other to an extent sufficient for interaction. However, it is preferable to prepare a solution in which the modified target molecule is dissolved in a buffer commonly used in biochemistry at an appropriate concentration, and inject the solution into a microplate.
  • a step of washing the modified molecules with the same buffer or the like, preferably not binding to the excess immobilized lignin molecules, is carried out, so that the modified molecules stay on the solid phase.
  • a molecule that interacts with the immobilized antigen molecule can be identified.
  • the target molecule When the primary structure of the target molecule, which has been determined to have an interaction with the C-terminal modified protein as measured by the above methods, is unknown, the target molecule can be obtained by an appropriate method known per se.
  • the primary structure can be analyzed. Specifically, when the target molecule for which interaction has been recognized is a protein, the primary structure can be identified by analyzing the amino acid sequence using an amino acid analyzer or the like.
  • the base sequence can be determined by a base sequence determination method using an auto DNA sequencer or the like.
  • the map of the present invention can be expected to be applied to drug discovery by linking structural analysis and functional analysis. As shown in Fig. 3, if a structural analysis is performed on a protein from which functional elements have been extracted, it is possible to link structural analysis with functional analysis. In the conventional interaction map, it is not possible to know the sequence of the interacting site.In the map by extracting functional elements, the specific interacting sequence and the structure of that part are compared. And mutation experiments for drug discovery of inhibitors and the like become possible.
  • the production method of the present invention comprises a storage means for storing correlation data based on a functional element of a gene and a Z or a protein, and a method for determining a correlation between a gene and / or a protein based on the correlation data read from the storage means.
  • the present invention can be implemented by an apparatus having a means for drawing a map showing a mutual relationship.
  • FIG. 20 shows an example of the configuration of the device of the present invention.
  • the storage means 1 stores data 2 of the interrelationship based on the functional elements.
  • the drawing means 3 stores the interrelation data from the storage means 1. 54 Read and draw a network 'map. ''
  • the device of the present invention can be constituted by a computer in which a program for causing a computer to function as the above means is mounted.
  • the device of the present invention may further include an input unit for inputting or correcting interrelated data, and an output unit for outputting a drawn map from the device.
  • the drawing means preferably has a function of selecting a drawing style.
  • the user has a function of indicating only a correlation related to a functional element of a selected gene and / or a protein or only a type of the selected correlation by a single selection.
  • a map of a large number of genes Z or proteins from being indistinguishable if all their correlations are displayed.
  • the device of the present invention may further include means for determining a functional element, if necessary.
  • means for determining a functional element for example, software and an apparatus that realize the flow of FIG. 9 can be considered.
  • a computer-readable recording medium on which the program of the present invention is recorded is also provided.
  • the recording medium include a flexible disk, a CD-ROM, and a DVD-ROM.
  • the method for preparing the bait c-Fos protein was as follows. PCR (primers) from pCMV-FosCBPzz vector (SEQ ID NO: 37) using TaKaRa Ex Taq (Takara Shuzo)
  • a DNA template was prepared using 5′SP6 (029) T7-FosCBPzz (SEQ ID NO: 38), 3′FosCBPzz (SEQ ID NO: 39), and the PCR program CYCB1 (see Table 1).
  • DNA template was prepared using 5′SP6 (029) T7-FosCBPzz (SEQ ID NO: 38), 3′FosCBPzz (SEQ ID NO: 39), and the PCR program CYCB1 (see Table 1).
  • Transcription (37 ° C, 2h) was performed using RiboMAX TM Large Scale RNA Production Systems (Promega) to prepare an mRNA template for bait c-Fos protein.
  • the bait DNA to be co-existed was prepared using PCR (primer 5 'DNA (SEQ ID NO: 41) and 3' DNA (SEQ ID NO: 42) using DNA-Fos / Jun (SEQ ID NO: 40) containing the binding sequence of Fo's / Jun as a template.
  • PCR program V-2 (see Table 1).
  • RNA library a commercially available mouse brain (polyA +) RNA library (purified tissue library RNA library by oligo dT column; clontech) was purchased.
  • the adapter was designed to add a 5 ′ UTR sequence (promoter SP6 + enantrancer 029 or 0 ′) suitable for the formation of an associater to the library as a sequence required for IW formation.
  • An adapter with Enhancer 029 was used for the mouse brain (polyA +) RNA library.
  • the main chain (SEQ ID NO: 43 or 44) and the side chain (gaattcgc or ggaattcg) of the adapter for Enhancer 029 are each dissolved in TE-bath; fur (10 m Tris-Cl, pH 8.0, 1 mM EDTA). ⁇ M, and mix the main chain and subchain in equimolar amounts of 10 ⁇ l each. Heated at 90 ° C for 2 minutes, heated at 70 ° C for 5 minutes, set in a 60 ° C water bath, turned off the bath heater, and slowly lowered from 60 ° C to room temperature. Aliquots of 5/1 were stored at -20 ° C.
  • mice brain (polyA +) RNA library was reverse-transcribed into single-stranded DNA (FIGS. 10 and 1).
  • Mouse brain (P QlyA +) and RNA library (1.4 pmole / 0.5 ⁇ g) of 0.5 ⁇ g, 3 'random primer mosquito and (SEQ ID NO: 45) and 2 pmol and DEPC water ⁇ Ete 12.0 ⁇ 1, 70 ° C And cooled on ice for 1 minute.
  • reverse transcription was performed at 45 ° C with SuperScript II RT (Superscript Double Strand cDNA Synthesis Kit; Invitrogen).
  • E. coli DNA ligase, E. coli polymerase I, and E. coli RNase H Superscript Double Strand cDNA Synthesis Kit; Inviogen
  • PCR conditions total volume 100 zl, 22 cycles (30 cycles at 94 ° C, 30 seconds at 60 ° C, 90 seconds at 72 ° C, and a final extension reaction of 180 seconds at 72 ° C) And .
  • bait c-Fos protein mRNA template prey mouse brain cDNA library, and coexisting bait DNA were converted to a wheat cell-free translation system (Wheat Germ.
  • IgG binding buffer (10 mM Tris-Cl, pH 8.0, 150 mM NaCl, 0.1 mM) was used. % NP40) was added to obtain a total of 100 (cotranslation sample), and then IgG agarose (Sigma) was washed twice with an IgG-binding buffer, and the cotranslation sample (100 ⁇ l) was added thereto.
  • TEV cleavage buffer (10 mM Tris-Cl, pH 8.0, 150 mM NaCl, 0.1% NP40, 0.5 mM EDTA, 1 mM DTT).
  • TEV protease GEBCO-BRL
  • supernatant 901 was added to 300 ⁇ l calmodulin binding buffer and 0.3 ⁇ l
  • Add 50 ⁇ l calmodulin beads washed twice with 11 M CaCI2 and 500 1 calmodulin binding buffer, and rotate and stir at 4 ° C for 1 hour.
  • RT-PCR ⁇ ne step RT-PCR kit (QIAGEN), primers; SEQ ID NOs: 46 and 47, program; RT-QH30 '(see Table 1)
  • SEQ ID NOS: 1 to 15 The nucleic acid sequence (SEQ ID NOS: 1 to 15) and the amino acid sequence (SEQ ID NOs: 16 to 31) of the gene encoding the 57c-JUIJ protein were obtained.
  • FIG. 17 shows the nucleic acid sequence and the amino acid sequence of the functional elements (E1-E3).
  • E1 is part of the DNA binding domain
  • E2 is part of the leucine zipper 'motif and the DNA binding domain
  • E3 Corresponds to the C-terminal region.
  • the present effort extracts a functional element of a gene or protein, and provides a network map based on a connection between functional elements using a database of the gene or protein from which the functional element has been extracted. This enables detailed analysis of networks between genes and proteins and prediction of complexes, and by providing analysis along with structural analysis, it is possible to provide maps that can be applied to drug discovery support systems. become.

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Molecular Biology (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Physiology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

 ポストゲノム機能解析において、蛋白質間および蛋白質-核酸間などの相互作用ネットワーク解析から公知の蛋白質の新たな機能やこれまで知られていなかった新規の蛋白質などの重要な生体高分子の発見による医薬品の創製などに応用可能な遺伝子ネットワーク・マップを提供する。遺伝子および/又は蛋白質の相互関係のデータに基づき遺伝子および/又は蛋白質の相互関係を示すマップの作成方法において、相互関係として遺伝子および/又は蛋白質の機能エレメントに基づく相互関係を用いる。

Description

遺伝子および z又は蛋白質のデータベースを用いた相互作用マップの 作成方法、ならびに、それを実現するためのソフトウェアおよび装置
技術分野
[0001] 本発明は、蛋白質および遺伝子のデータベースを用いた複合体形成又は相互作 用の関係性を表す図 (ネットワーク 'マップ)およびその図の作成方法、ならびにそれを .実現するためのソフトウェアおよび装置に関する。
背景技術
[0002] 現在、多様な生物のゲノムの塩基配列が解読されようとしている。ゲノムシーケンス の研究では、第 2幕のポストシーケンスの研究として、解読したゲノム情報力 その意 .味を解析する研究、すなわち、遺伝子や蛋白質の構造や機能解析 (非特許文献 1、 非特許文献 2、非特許文献 3)、および蛋白質間、核酸-蛋白質間相互作用解析など 力 S期待されている (非特許文献 4、非特許文献 5)。
[0003] 以上のような技術を駆使したポストゲノム機能解析によって、蛋白質間および蛋白
Λ-核酸間などの相互作用ネットワーク解析力 公知の蛋白質の新たな機能やこれ まで知られていなかった新規の蛋白質などの重要な生体酵素の発見による医薬品の 創製などが期待されている。 >
[0004] 蛋白質間相互作用の検出方法として、これまで免疫沈降 (非特許文献 6)、 GST融合 蛋白質によるプルダウン 'アツセィ (非特許文献 7)、 TAP法(非特許文献 8)、酵母ツー ノ、イブリツド法(非特許文献 9)などが知られている。一方、進化分子工学 ツールとし て誕生した「遺伝子 (遺伝子型)と蛋白質 (表現型)の对応付け」を応用して、ポストゲノ ム機能解析における蛋白質間相互作用を網羅的に解析する方法として、 in vitroウイ ルス法(非特許文献 10、非特許文献 11、非特許文献 12、特許文献 1、特許文献 2) 、 STABLE法(非特許文献 13)、ファージディスプレー法(非特許文献 14)、リボソーム. •ディスプレイ法(非特許文献 15、特許文献 3)、 mRNA-ペプチドヒユージョン (mRNA ディスプレイ)法 (非特許文献 16)などが知られてレ、る。
[0005]' さらに、表面プラズモン共鳴法、蛍光共鳴エネルギー移動 fe、蛍光偏光解消法、ェ パネッセント場イメージング法、蛍光相関分光法、蛍光イメージング法、固相酵素免 疫検定法などが知られている。また、ピューロマイシン等の核酸誘導体を用いて翻訳 系中で蛋白質の C末端を修飾する方法 (特許文献 4、特許文献 5)が知られている。
[0006] 以上のようなさまざまな方法によって、蛋白質や遺伝子の複合体や相互作用解析 が進み、その.結果として、網羅的な遺伝子ネットワーク '·マッピングが行われ、そのネ ットワーク ·マップから、生物学的に意味のある事柄を抽出してこようとする研究が盛 んとなっている。
[0007] 現在、主に、 TAP法、酵母ツーハイブリッド法などの網羅的解析結果をバイオインフ .ォマテイツタスでデータ処理し、遺伝子間又は蛋白質間ネットワーク 'マップを描き出 し、いろいろな角度力 解析検討が行われている (非特許文献 17、非特許文献 18、 . ' 非特許文献 19)。従来の遺伝子間又は蛋白質間ネットワーク 'マップ技術では、単純 に相互作用のある遺伝子間又は蛋白質間を結合させるものである。
非特許文献 1: Saegusa A. Nature 401, 6751 (1999) , 非特許文献 2: Dalton R, Abbott A. Nature 402, 6763 (1999)
. . 非特許文献 3:宫本悦子、柳川弘志(2000)シリーズ 'ポストシークェンスのゲノム科学 3:プロテオミタス, pp.136-145
非特許文献 4:宫本悦子、柳川弘志(2001)蛋白質 '核酸'酵素、 46(2), pp.138-147) 非特許文献 5 :宮本悦子、柳川弘志(2001)蛋白質 ·核酸,酵素、 48(11),
pp.1474-1480)
非特許文献 6 :Xiong et al. 1993 Nature 366, 701-704
非特許文献 7 : Kaelin, et al. 1991 Cell 64, 521-532
非特許文献 8 : Guillaume Rigaut, et al., Nature biotechnology 17, 1030 (1999) 非特許文献 9 : Fields S, Song O. Nature 340, 245 (1989)
非特許文献 10 : Miyamoto- Sato E, et al. Viva Origino 25, 35 (1997)
非特許文献 ll : Nemoto N, et al. FEBS Lett. 414, 405 (1997)
非特許文献 1'2 : Miyamoto— Sato, E. et al. Nucleic Acids Res. 31, e78 (2003) 特許文献 1:国際公開第 W098/16636号パンフレット
特許文献 2:国際公開第 WO02/46395号パンフレット 非特許文献 13 : Doi N, Yanagawa H. FEBS Lett. 457, 227 (1999)
非特許文献 14: Smith G.P. Science 228, 1315 (1985)
非特許文献 15 :Mattheakis, L.C. et al. (1994) Proc. Natl. Acad. Sci. USA 91, 9022-9026 '
特許文献 3 :国際公開第 W095/11922号パンフレット
非特許文献 16 : Roberts R.W, Szostak J:W. (1997) Proc. Natl. Acad. Sci. USA 94, 12297
特許文献 4:米国特許第 6, 228, 994号明細書
特許文献 5:国際公開第 WO02/48347号パンフレット
非特許文献 17 : Schwikowski B., Uetz P. & Fields S. Nat. Bio'technol. 18, 1257 - 1261 (2000)
非特許文献 18 : Bader, G.D. & Hogue Christopher, Nat. Biotechnol. 20, 991-997 (2002)
非特許文献 19 :Legrain, P., Wojcik, J. & Gauthier, J— M. Trends in Genetics 17, . 346-352 (2001)
発明の開示
[0008] 従来の遺伝子又は蛋白質のネットワーク 'マップは、単純に相互作用のある遺伝子 や蛋白質を結合することでネットワーク (図 1A)を作図している。そのため、この方法で は、マップからの複合体の予測、構造と機能とのリンクによる創薬への応用などが困 '難である。本発明の課題は、ポストゲノム機能解析において、蛋白質間および蛋白質 -核酸間などの相互作用ネットワーク解析から公知の蛋白質の新たな機能やこれまで 知られていな力つた新規の蛋白質などの重要な生体高分子の発見による医薬品の 創製などに応用可能な遺伝子ネットワーク 'マップを提供することである。
[0009] 本発明者らは、蛋白質一蛋白質又は蛋白質一核酸の相互作用する領域で、ァミノ 酸配列又は核酸配列で表示される機能エレメントに着目し、延べの遺伝子間ゃ蛋白 質間の結合ではなくて、相互作用のある遺伝子や蛋白質の機能エレメント間の結合 によるネットワーク (図 1B)を作図すると、一層生物学的に意味のあるマップを提供でき ることを見出し、本発明を完成した。 [0010] 本発明は、以下のものを提供する。
[0011] 1. 遺伝子および/又は蛋白質の相互関係のデータに基づき遺伝子おょぴ Z又 は蛋白質の相互関係を示すマップの作成方法であって、相互関係が遺伝子おょぴ Z又は蛋白質の機能エレメントに基づく相互関係であること'を特徴とする方法。
[0012] 2. 機能エレメントが、遺伝子および/又は蛋白質の相互作用解析によりランダム ライブラリ一力 抽出された配列に基づき決定されたものである 1に記載の方法。
[0013] 3. ランダムライブラリーが核酸配列のランダ Λライブラリーである 2記載の方法。
[0014] 4. ランダムライブラリーが対応付け分子のランダムライブラリーである 2記載の方
. 法。 ;
[0015] 5. 相互作用解析力 in vitroウィルスを用いる相互作用解析である 2〜4のいずれ. 力 1項に記載の方法。 '
[0016] 6. 遺伝子おょぴ 又は蛋白質の間の相互関係のデータを記憶する記憶手段、 ならびに、記憶手段力 読み出された相互関係のデータに基づき遺 ί云子および/又 'は蛋白質の間の相互関係を示すマップを描画する手段としてコンピューターを機能 させるためのプ グラムであって、遺伝子および 又は蛋白質の相互関係力 遺伝 子および/又は蛋白質の機能エレメントに基づく相互関係であることを特徴とするプ ログラム。 '
[0017] 7. 機能エレメントが、遺伝子および Ζ又は蛋白質の相互作用解析によりランダム ライブラリ一力 抽出された配列に基づき決定されたものである 6に記載のプログラム
[0018] 8. ランダムライブラリーが核酸配列のランダムライブラリーである 7記載のプロダラ ム。
[0019] 9. 'ランダムライプラリーが対応付け分子のランダムライブラリーである 7記載のプロ グラム。
[0020] 10. 相互作用解析力 in .vitroウィルスを用レ、る相互作用解析である 7〜9のいず れか 1項に記載のプログラム。 '
[0021] 11. 6〜 10のいずれか 1項に記載されたプログラムを記録したコンピュータ一読 み取り可能な記録媒体。, [0022] 12. 遺伝子おょぴ 又は蛋白質の間の相互関係のデータを記憶する記憶手段、 ならびに、記億手段力 読み出された相互関係のデータに基づき遺伝子および z又 は蛋白質の間の相互関係を示すマップを描 する手段を備える、遺伝子および Z 又は蛋白質の相互関係を示すマップの作成装置であって、遺伝子および /"又は蛋 白質の相互関係が、遺伝子および z又は蛋白質の機能エレメントに基づく相互'関係 であることを特徴とする装置。
[0023] 13. 機能エレメントが、遺伝子および/又は蛋白質の相互作用解析によりランダ ムライブラリ一から抽出された配列に基づき決定されたものである 12に記載の装置。
[0024] 14. ランダムライブラリーが核酸配列のランダムライブラリーである 12記載の装置
[0025] 15. ランダ,ムライブラリーが対応付け分子のランダムライブラリーである 12記載の 装置
[0026] 16. 相互作用解析力 in vitroウィルスを用いる相互作用解析である 13〜15のい ずれか 1項に記載の装置。
[0027] 17. in vitroウィルスを用いる相互作用解析により、相互作用する遺ィ云子又は蛋 白質のライブラリーを得、そのライブラリーの遺伝子又は蛋白質の核酸配歹 U又はアミ ノ酸配列力 抽出された配列に基づき機能エレメントを決定することを含む、機能ェ レメントの決定方法。 '
[0028] 本発明は、延べの遺伝子や蛋白質のネットワーク 'マップではなくて、遺伝子ゃ蛋 ' 白質の機能エレメントを抽出し、それら機能エレメントを抽出した遺伝子や蛮白質の データベースを用いた機能エレメント間の結合によるネットワーク ·マップを提供する( 図 1)。そのことによって、遺伝子間や蛋白質間のネットワークの詳細な解析や複合体 の予想が可能となり、構造解析と合わせて解析することにより、創薬支援システムへ 応用可能なマップを提供することが可能になる。 .
[0029] 複合体の予測に関しては、図 2に示すように、たとえば、三つの蛋白質の相互作用 を従来のマップで書くと、三つの蛋白質の複合体について (I)の場合なのか (II)の場合 なのかを予測することは不可能であった力 機能エレメントに基づくマップでは、蛋白 質 d, eが同じ機能ドメインで蛋白質 Aと相互作用しているならば、複合体は (I)ではなく て (II)の場合であることが予測できる。
[0030] 構造解析と機能解析のリンクによる創薬への応用に関しては、図 3に示すように、機 能エレメントが決定された蛋白質について構造解析を行えば、構造解析と機能解析 のリンクが可能となる。これまでの相互作用マップでは、相互作用してレ、る部位の配 列までは知りようがな力、つた力 機能エレメントに基づくマップでは、相互作用してレヽ る特定の配列とその部分の構造を比較することが可熊となり、阻害剤などの創薬のた めのミューテーション実験などに大変有利となる。
[0031] 図 4のように、機能エレメントが抽出された蛋白質 (遺伝子)の各機能エレメントを選 択したときのネットワーク 'パターンは、それぞれ異なってくる。一つの蛋白質 (球伝子) でもさまざまなネットワークに関係してレ、る可能性があり、これまでのような延べの結合 のみを表示する方法では、生体のパスウェイを予想することは困難であった。 ,
[0032] また、図 5のように、機能エレメントに基づく遺伝子ネットワーク 'マップは、各機能ェ レメントに基づくネットワーク 'パターンから複合体を予測可^であり、構造解析データ と照らし合わせながら、注目してレ、る遺伝子の in vivoでのパスウェイを予想し、それを ' 検証するための実験を組み立てる支援が可能となる。 '
[0033] 最終的には、機能エレメントに基づくネットワーク 'マップを土台として、複合体の予 想や構造解析データとの融合により、図 6のような生体の遺伝子ネットワークのモデ ルを提案できる。
[0034] また、 IW法 (図 7)による機能エレメント.抽出によるマッピングでは、擬陽性が少なレヽ ため'、酵母ツーハイブリッド法のように擬陽性をパイォインフォマティックのレベルで解 決する必要が無く、大変有利となる (図 8)。 IW法による機能エレメント決定法は、通 常には、以下のように実施できる。図 9に示すように、シーケンス配列を入力し、ベクタ 一配列を除去し、 cDNA配列を抽出し、.データベース検索し、蛋白質フレームや IW フレームを確認する。以上によって、 IWとして蛋白質を発現しているテンプレートの み選択し、それらのテンプレートをァライメントとクラスタリングにかけ、各クラスターか ら蛋白質や遺伝子の共通配列を抽出比較し、機能エレメントを決定する。それら機能 エレメントを抽出した遺伝子や蛋白質を集めてデータベースとし、そのデータベース を用いたネットワーク ·マップを提供することができる。 図面の簡単な説明
[図 1]本発明の機能エレメントに基づく遺伝子ネットワーク 'マップの一例を示す。従 来の遺伝子ネットワーク 'マップと本発明の機能エレメントに基づいた遺伝子ネットヮー ク-マップを比較して示す。ここでは、 A遺伝子 (蛋白質)が 3つの機能エレメントから構 成されている。
[図 2]本発明の機能エレメントに基づく遺伝子ネットワーク 'マップにおける複合体予 測の一例を示す。蛋白質 eと蛋白質 dが蛋白質 Aの同じ機能エレメントで結合する場合 は、 Iのケースの複合体はあり得ないことが予想される。 I: 3つの蛋白質からなる複合 体、 II: 2つの蛋白質からなる複合体。
[図 3]本発明で用いられる機能エレメントが抽出された蛋白質 (遺伝子)の一例を示す, 機能解析において機能エレメントが抽出された蛋白質は、構造解析結果と合わせるこ とで、機能解析と構造解析の橋渡しが可能となり、創薬などに貢献可能となる。ここで は 3つの機能エレメント (Element)が抽出された蛋白質を示している。
[図 4]機能エレメントが抽出された蛋白質 (遺伝子)と各機能エレメントを選択したときの 本発明の機能エレメントに基づくネットワーク 'パターンの例を示す。
[図 5]遺伝子ネットワークの一例を示す(中間調画像)。「?」は、機能を知りたい疾患関 連遺伝子などである。本発明の機能エレメントに基づく遺伝子ネットワーク 'マップは、 各機能エレメントに基づくネットワーク 'パターン力 複合体を予測可能であり、構造解 析と照らし合わせながら、注目している遺伝子の in vivoでのパスウェイを予想し、それ を検証するための実験を組み立てる支援が可能となる。
[図 6]生体の遺伝子ネットワーク 'モデルの一例を示す。本発明の機能エレメントに基 づく遺伝子ネットワーク 'マップを土台として、複合体の予想や構造解析との融合によ り、最終的に提供されると考えられる仮想的な例である。
[図 7]遺伝子ネットワーク ·マップおよび機能エレメントが抽出された蛋白質 (遺伝子)を 実現するための IWセレクション法による解析システムの一例を示す。 IWセレクショ ン法による解析システムは、 IWセレクションによる一次スクリーニングと C末端ラベル 化法などを利用した相互作用解析であるポストセレクションとしての二次スクリーニン グからなる。一次スクリーニングで物質や蛋白質と相互作用を検出し、さらに、相互作
差替え用.紙 '一.
7/1
用の詳細を FCCSやマイクロアレイなどの二次スクリーニングで解析することが可能で
秦替え用.紙 8 ある。また、本発明の蛋白質や核酸配列は、 IW又は C末端ラベル化蛋白質として、 単独で FCCSやマイクロアレイなどにより物質や蛋白質との相互作用解析に利用する ことも可能である。また、本発明の蛋白質や核酸配列の IWを用いた進化分子工学 に応用レ、一次スクリーニング より機能性蛋白質の創出に利用することも可能であり 、その際に、一次スクリーニングと二次スクリーニングを組み合わせて、創出した機能 性蛋白質の相互作 の詳細を解析することも可能である。 ' [図 8]遺伝子ネットワーク 'マップおよび機能エレメントが抽出された蛋白質 (遺伝子)を 実現するための IWセレクション法による信頼性の高いデータべ スの構築の一例を 示す。従来法では、擬陽性の高いデータをパイォインフォマティックスによる後処理 , で解決を試みてきたが、 IWセレクション法では、擬陽性の低い実験データが最初か ら提供される。
[図 9]遺伝子ネットワーク ·マップおよび機能エレメントが抽出された蛋白質 (遺伝子)を 実現するための IWセレクション法の検出酉列データ解析フローを示す。 IWセレク シヨン法による解析システムで検出した配列のシーケンスを入力し、配列の前処理の 後、データベース検索、ァライメント解析してクラスタリングにより各機能エレメントの * 通配列を抽出し、 析結果の一覧を遺伝子カタログとして表示する。さらに、それら の解析結果をデータベースとして蓄え、それらのデータをもとにして、遺伝子ネットヮ '.ーク ·マ,ップ又は機能エレメントが抽出された蛋白質 (遺伝子)を作図する。
[図 10]機能エレメントに基づく遺伝子ネットワーク 'マップおよび機能エレメントが抽出 された蛋白質 (遺伝子)を実現するために用レヽることのできる IWの'ランダムプライミン グライブラリーとその製法の概略を示す。 RNAライブラリーを鐯型として、 9塩基からな るランダム配列と特定配列 (tag2配列)を含むランダムプライマーを用レヽてランダムプ ライミング法により逆転写で mRNAに相補的な一本鎖 cDNAライブラリー (ssDNAライブ ラリー)を合成する (1)。 RNaseHにより cDNAと RNAの二本鎖力 RNAのみを分解すると 同時に、 DNAポリメラーゼ Iによる cDNAに相補的な DNAを合成し、さらに、 DNAリガ一 ゼにより DNAポリメラーゼ Iにより合成された DNA間にあるニックを修正して二本鎖 DNAライプラリー (dsDNAライブラリー)を合成する (11)。合成された二本鎖 cDNAは DNAポリメラーゼ Iにより合成された側のみ 5'末端にリン酸基を持つのでこれを利用し 9
、特定配列 (5,UTR=プロモーター +ェンハンサー)を持つアダプターを DNAリガーゼを 用いて結合し、ライゲーテッド dsDNAライブラリーを合成する (111)。アダプターとランダ ムプライマーの特定配列を利用して PCRを行レ、、 5,側にプロモーターとェンノヽンサ一 の配列、 3'側に A tailをもつ対応付け分子の cDNAライブラリー GW cDNAライブラリ 一)を作成する (IV;)。次に IW cDNAライブラリーを転写して IW RNAライブラリ一とし (V), IWとするためのスぺーサーをライゲーシヨンし (VI)、さらに、無細胞翻訳系など で翻訳すれば、対応付け分子のライブラリ一となる (VII)。 · . '
[図 11]翻訳テンプレート (A)ならびにその構成要素であるコード分子 (B)およぴスぺ ーサ一分子 (C)の構成を示す。翻訳テンプレートは、コード分子由来のコード部とス ぺーサ一分子由来のスぺーサ一部からなる。 F1および 2は蛍光色素を示す。
[図 12]C末端修飾された蛋白質 (C末端ラベル化蛋白質) (A)、本発明め翻訳テンプ レート (B)、および;修飾剤 (C)の構成を示す。
[図 13]無細胞共翻訳による複合体の形成の概略を示す。 A: 'ベイトとプレイが無細胞 翻訳系で共に翻訳され相互作用し、無細胞翻訳系において複合体を形成する。.プレ ィは単数 (I)であっても複数 (II)であっても構わなレヽし、また、'無細胞翻訳系での翻訳 で得られるポリ プチ、そのものであっても、対応付け分子 (結合体)であっても構わな い。 B: ベイトの共存下、プレイが無細胞翻訳系で翻訳され相互作用し、無細胞翻訳 系において複合体を形成する。プレイは単数 (I)であっても複数 (II)であっても構わな . いし、また、無細胞翻訳系での翻訳で得られるポリペプチドそのものであっても、対応 付け分子 (結合体)であっても構わなレヽ。
[図 14]複合べイトを用いた場合の無細胞共翻訳.による複合体の形成の概略を示す。 複合べイトを構成する一部のベイトとプレイが無細胞翻訳系で共に翻訳され相互作 用し、無細胞翻訳系において複合体を形成する。プレイは、単数 (I)であっても複数 (II)であっても構わないし、また、無細胞翻訳系での翻訳で得られるポリペプチドその ものであっても、対応付け分子 (結合体)であっても構わない。また、複合べイトは、図 に示した無細胞翻訳系で翻訳されたポリペプチドと DNAベイトの組合せに限られず、 無細胞翻訳系で翻訳された複数又は単独のポリペプチドと、無細胞翻訳系で共存す る複数又は単独のベイト (たとえば、 DNAベイトなど)の組み合わせが挙げられる。 10
[図 15]無細胞共翻訳による複合体のスクリ一ユング方法の概略を示す。 図 13およ ぴ 14で示したような無細胞共翻訳による複合体形成の工程 (1)、その複合体のプレイ をスクリーニングする工程 (2)、および、プレイの解析の工程 (3)により、無細胞共翻訳と スクリーニングをトータルに in vitroで実現することができる。プレイが対応付け分子で かつ複数であれば、 RT- PCR又は PCRによってプレイをコードする mRNA又は DNAを 再構成することにより再度ひ)の工程力 スクリーニングを繰り返すことができる。また、 得られたプレイを解析後、ベイトとして (1)の工程からスクリーニングを新たに繰り返すこ と力 Sできる。
[図 16]遺伝子ネットワーク 'マップおょぴ機能エレメントが抽出された蛋白質 (遺伝子) を実現するための手段である機能エレメント決定方法を示す(中間調画像)。ランダ ム 'ライブラリーなどから IWセレクション法などにより検出された複数の遺伝子 (蛋白 質)配列、又は複数の核酸 (DNA)配列が得られたものをァライメントし、クラスタリングに よって機能エレメントを抽出する。ここでは、 c- Jnuの複数の遺伝子 (蛋白質)配列(模 様で示す)が得られており、 E2のみを持つグループと E2+E3のグループと E1+E2+E3の グループに分けることが出来る。各グループの共通配列を抽出して機能エレメントとし た。 3つの機能エレメント毎又はその組み合わせによる機能が存在する可能性が考え られる。 E1〜E3は、 Jun遺伝子の機能エレメントである。 E1 :DNA結合領域を含む。 E 2 : Leu シ'ッハ。一モチーフを含む。 E3 : C末端領域を含む。
[図 17]図 16で抽出した c- Jun遺伝子の機能エレメント El、 E2、 E3のアミノ酸配列およ び核酸配列を示す。
[図 18]図 16で機能エレメント El、 E2、 E3を抽出した c- Jun遺伝子とその構造解析結果 との照合を示す(中間調画像)。
[図 19]図 16で抽出した C- Jun遺伝子の機能エレメント El、 E2、 E3を用いたネットヮー ク.マップと機能エレメントの選択によるネットワーク.マップのパターンの違いを示す。
X:現在まだ報告されていない遺伝子。 '
[図 20]本発明のマップ作成装置の構成の一例を示す。
発明を実施するための最良の形態
< 1 >本発明のネットワーク 'マップの作成方法
差替え,用.紙 ^ 10/1 本発明の作成方法は、相互関係が遺伝子および/又は蛋白質の機能エレメントに 基づく相互関係であることの他は、通常の、遺伝子および/又は蛋白質の相互関係 のデータに ¾づき遺伝子おょぴノ又は蛋白質の相互関係を示すマップ (ネットワーク
差替え用.紙 11
'マップ)の作成方法と同様でよい。このようなマクプはグラフとも呼ばれることがある。 また、表示する相互関係の種類によっては、遺伝子ネットワーク 'マップ、遺伝子発現 ' 制御ネットワークと呼ばれることもある。
[0037] マップを作成する方法としては、ネットワークを、遺伝子および/又は蛋白質をノー . ド、相互関係をエッジとするグラフとみなして、グラフ表示のアルゴリズムによりマップ を作成する方法が挙げられる。代表的なものとしては、「スプリングモデル」と呼ばれる モデルにより作成する方法が挙げられる。
[0038] 相互関係には、ある遺伝子が他の遺伝子を制御する関係、蛋白質間で相互作用 する関係、ある蛋白質が、他の蛋白質をコードする遺伝子の発現に影響する関係な どの直接および間接'に作用する関係が含まれる。' ' . '
[0039] 本発明の作成方法で作成されるネットワーク 'マップとは、遺伝子又は蛋白質の相 互作用に寄与する特定の配列の結合関係をマッピングしたものである。遺伝子又は 蛋白質の相互作用に寄与す δ特定の配列を機能エレメントと呼び、この配列は、一 つの遺伝子又は蛋白質に 0—複数存在することがある。機能エレメントがゼロのもの は、孤立した遺伝子や蛋白質であり、機能エレメントが沢山あるものは、他のいろいろ な遺伝子や蛋白質と相互作用があることを表している。図 1(11)のように、たとえば、 A 遺伝子が 3つの機能エレメントを持つ場合、 A遺伝子の 3つのサブ領域 (機能 レメン ト)とそれぞれさまざまな蛋白質のサブ領域 (機能エレメント)との相互作用関係を結合 したマップが、本発明による遺伝子ネットワーク ·マップである。
[0040] ここで、機能エレメントとは、遺伝子又は蛋自質の相互作用に寄与する特定の配列 であり、遺伝子の場合は核酸配列であり、蛋白質の場合はアミノ酸配列とそれをコー ドする核酸配列である。いわゆる機能モチーフ、機能ドメインなどと呼ばれてレ、る配列 でもかまわない。すなわち、あらゆる相互作用解析によって得られた遺伝子間又は蛋 白質間の相互作用に寄与する特定の配列であり、たとえば、ミューテーシヨン実験や ゲルシフト ·アツセィなど配列の一部の改変や削除による相互作用に最低限必要な 配列の決定、又は構造決定による相互作用領域の決定、又は、 IWや酵母ツーハイ ブリツド、ファージ 'ディスプレイ法などによって得られた配列でも力まわなレ、。
[0041] 遺伝子おょぴノ又は蛋白質の機能エレメントに基づく相互関係を示すマップにお 12 いては、一の遺伝子おょぴ 又は蛋白質が有する機能エレメントが、その一の遺伝 ' 子および/又は蛋白質に存在することが分力るように表示することが好ましレ、。例え ば、図 1のように、機能エレメントの相互関係を示す表示(図 1では実線)と、同一の遺 伝子および/又は蛋白質に存在することを示す 示(図 1では点線)に分けることに より区別して表佘する方法が挙げられる。
[0042] 本発明によるマップによって、図 2に示したように、複合体の予想が可能となる。たと えば、三つの蛋白質の相互作用を従来のマップで書くと、三つの蛋白質の複合体に ついて (I)の場合なのか (II)の場合なのかを予測すること'は不可能であった。本発明に よるマップでは、蛋白質 d, eが同じ機能ドメインで蛋白質 Aと相互作用してレ、るならば 、複合体は (I)ではなくて (Π)の場合であることが予測できる。
[0043] 本発明で用いられる蛋白質や遺伝子は、相互作用解析において、ベイト又はプレ ィとして、ランダム 'ライブラリーを利用している場合に、ライブラリーから複数のテンプ レートが検出されることにより、相互作用に必要な共通配列を抽出できる方法で解析 された蛋白質や遺伝子であることが好ましい。
[0044] ここで、ランダム 'ライブラリーとは、ライブラリーを構成する遺伝子ゃ蛋.白質が、ある ' 一通りの配列ではな 幾通りもの配列で構成されているも である。そのことによつ て、相互作用解析では、一つの遺伝子で複数のテンプレートを検出できるので、その ― 中で相互作用に必要な共通配列を機能エレメントとして抽出できる。ランダム ·ライブ ラリーは、核酸ライブラリー、ペプチド 'ライプラリー、蛋白質ライプラリーなどが考えら , れ、核酸ライプラリーでは、蛋白質の結合するプロモーター領域などが機能エレメント として抽出され、ペプチド 'ライブラリー、蛋白質ライブラリーなどでは、蛋白質同士の 結合領域や核酸のプロモーター領域と結合する領域など力 s機能エレメントとして抽出 される。 '
[0045] 共通配列の抽出によって機能エレメントが決定された蛋白質や遺伝子を用いること によって、図 3に示したように、構造解析された蛋白質のどのような構造に機能エレメ ントが当たるのかを解析可能となり、相互作用磯能)と構造のリンクが可能となる。この ことによって、構造解析と機能解析のリンクによる創薬への応用などが現実的となる。 たとえば、これまでの蛋白質による相互作用解析や酵母ツーハイブリッド法などでは 13
、相互作用している部位の配列までは知りようがな力つた力 本発明では、相互作用 してレ、る特定の配列とその部分の構造を比較することが可能となり、阻害剤などの創 薬のためのミューテーシヨン実験などに大変有利となる。
[0046] 図 4のように、機能エレメントが決定された蛋白質や遺伝子の各機能エレメントを選 択したときのネットワーク 'パターンは、それぞれ異なってくる。一つの蛋白質や遺伝 子でもさまざまなネットワークに関係してレ、る可能性があり、これまでのような延べの結 合のみを表示する方法では、生体のパスウェイを予想することは困難である。
[0047] また、図 5のように、機能エレメントに基づく遺伝子ネットワーク 'マップは、各機能ェ レメントに基づくネットワーク 'パターンから複合体を予測可能であり、構造解析データ と照らし合わせながら、注目してレ、る遺伝子の in vivoでのパスウェイを予想し、それを 検証するための実験を組み立てる支援が可能となる。たとえば、詳細に解析してパス ウェイを明確にしたいある蛋白質がある場合、ある蛋白質をべイドとするのみなら \ その蛋白質の遺伝子めプロモーター部分にも注目し、たとえば APIサイトがあれば、 APIサイトと相互作用する蛋白質 fos/Junなどの蛋白質もべイトとすることで並列的な 解析を行えば、ある蛋白質の上流 (up- regulation)から下流 (down- regulation)へのパ スウェイを推測可能となる。
[0048] 最終的には、本発明の機能エレメントに基づくネットワーク 'マップを土台として、複 合体の予想や構造解析データとの融合により、図 6のような生体の遺伝子ネットヮー クのモデルを提案できる。
[0049] ランダム 'ライプラリーを用いた対応付け分子である IW法による機能エレメント決定 方法を以下に詳しく説明する。図 7に示すように、一次スクリーニング (IWセレクション )として、 cDNA、ランダム 'ペプチド、ランダム 'プロテインなどのランダム 'ライプラリー を用いた IW法でベイト (低分子化合物、核酸、蛋白質など)と相互作用のあるプレイ 集団をライブラリ一力 検出し、 C末端ラベル化法などを利用した二次スクリーニング( ポスト ·セレクション)で検証するシステムである。 '
[0050] IW法 (図 7)により決定された機能エレメントによるマッピングでは、 IWセレクション での擬陽性が少なぐかつポスト'セレクションで擬陽性の排除を行うために、酵母ッ 一ハイブリッド法のように擬陽性をバイオインフォマティックスのレベルで解決する必 14
. 要が無ぐ大変有利となる (図 8)。したがって、本努明は、本発明の作成方法におい て使用するのに好ましい機能エレメントの決定方法、すなわち、 in vitroウィルスを用 レ、る相互作用解析により、相互作用する遺伝子又は蛋白質のライブラリーを得、その ライブラリーの遺伝子又は蛋白質の核酸配列又はアミノ酸配列力 抽出された配列 に基づき機能エレメントを決定することを含む、機能エレメントの決定方法も提供する
[0051] 従来の TAP法、酵母ツーハイブリッド法 (1:1のマトリックス型解析)などでは、蛋白質 の相互作用する領域である機能エレメントを抽出することは困難である。しかしながら 、 in vitro virus(IW)法、ファージディスプレイ法などでは、ランダムプライマーなどを 用いたライブラリー (一つ ( 遺伝子について幾通りもの部分配列を包含したライブラリ 一)を利用することにより、遺伝子や蛋白質の相互作用する領域である機能エレメント を抽出することが可能となる。酵母ツーハイブリッド法でもランダムプライマーなどを用 いたライブラリー (一つの遺伝子について幾通りもの部分配列を包含したライブラリー) を利用することで機能エレメントの抽出は可能である力 一般的にはマトリックス型が 採用されており、かつ擬陽性が多いなどの問題がある。また、ファージディスプレイ法 では、ペプチド 'ライブラリーのため、機能エレメントの抽出にはライブラリーの平均長 が短すぎるという問題点がある。一方、図 4に示したように、我々が先に発明してきた IWとそのライブラリー (特許文献:特願 2002- 360039)を用いる方法では、機能エレメ ントを抽出するのに、ライブラリーの平均長は十分に長く、酵母ツーハイブリッド法な どと比較して擬陽性め少ないデータが得られる (図 5)。このことによつで、より正確なネ ットワーク ·マッピングが可能となる。'また、 IW法ではべイトは核酸でも蛋白質でもセ レクシヨンが可能なため、蛋白質一蛋白質相互作用のみならず、蛋白質一核酸相互 作用についてもデータベースを構築することが可能となり、より網羅ネットワーク 'マツ ビングが可能となる。そして、 IWの機能エレメント抽出法により得られる機能エレメン トを用レ、ることは、 1)複合体の予測 (図 2); 2)構造解析と機能解析とのリンクによる創 薬への応用 (図 3)などにおいて有利である。
[0052] IW法による機能エレメント決定法の例について以下に説明する。図 9に示すように 、 IWセレクションで検出したシーケンス配列から、ベクター配列を除去し、 cDNA配列 15 を抽出し、必要によりデータ ース検索し、蛋白質フレームを確認すると同時に、 IW フレームを確認する。さらに、それらのシーケンス配列をァライメントにかけ、各蛋白質 (遺伝子)の共通配列を機能エレメントとして抽出する。
[0053] IWセレクションで検出したシーケンス配列とは、市販のシーケンサー
(ABI,BECKMANなど)の波形データとその解析に基づく配列データである。
[0054] ベタター配列の除去とは、シーケンスのためのクローニングに用いたベクター配列 を除去し、余分な配列を除去して cDNAライブラリー配列のみとすることである。
[0055] cDNA配列の抽出とは、データベース検索にかけるために、ライブラリーに共通の配 列を除去し、ここでは、' cDNA配列のみとすることである。
[0056] データベース検索とは、核酸データベースとして、 ntなどがあり、蛋白質データべ一 スとして、 nrなどがあり、その他、 refseq, fantom2などのデータベース、ゲノム'データ ベ スなどがある。 '
[0057] 蛋白質フレームの確認とは、無細胞翻訳系で翻訳されたフレームがデータベース に登録されている蛋白質の ORFとフレームが一致するかどうかを確認することである。 ' フレームが一致していない場合は、フレーム 'シフトなのカ 3'UTR, 5'UTRの配列な の力 などを らかにする。 . . '
- [0058] IWフレームの確認とは、無細胞翻訳系で翻訳されうる配列なのかどうかを確認す , ることである。すなわち、ストップ'コドンが複数出てくる力、場所は N末端側か、などに よって判断す 。 '
[0059] ァライメントとクラスタリング解析による共通配列の抽出は、通常の方法によって行う ことができる。ごのような抽出を行うためのソフトゥ mァ(例えば ClustalX)が入手可能で ある。以上のような処理を施した配列プールの中で類似の配列、ここでは、同じ遣伝 子を抽出し、その配列間でクラスタリングし、クラスタリングにおける各共通配列を抽 出比較し、機能エレメントとして抽出する。 ·
[0060] 以下、本発明の具体的なマップや蛋白質を実現するための機能エレメント決定方 法の例として、ベイトとプレイとの間の相互作用の検出において IW法を用レ、るものに ついて詳細に説明する。
[0061] IW法に使用される RNA又は mRNAライブラリ一は、原核、真核生物、ウィルスなど 16 あらゆる種のレ、かなる組織力も抽出した RNA又は mRNAライブラリーでも構わなレ、。ま た、解読したゲノムや cDNAライプラリーを転写した R Aライブラリーやそれを再現した 人工の RNAライブラリー、又は自然には存在しない配列を含む人工の cDNAライブラ リーを転写した RNAライブラリーでも構わなレ、。
[0062] —本鎖 (ss)DNAライブラリ一は、上記の RNA又は mRNAライブラリーを特定配列を持 'つランダムプライマーで逆転写 (図 10、 I)したライブラリーである。この際の逆転写酵 素としては特に定めはなぐ Superscript II RT (Superscript Double Strand cDNA Synthesis Kit; Invitrogen), Sensiscript Reverse Transcnptase(Qiagen)なと(?民い。.ま た、ランダムプライマーのアダプター 分の特定配列にっレ、ては、最終的に対 ife付 け分子のライブラリーを作成できるものあれば制限はないが、通常には、図 10にある ように、 3'tail又は Tag 2と 3'tailを含む配列となる。ここで、 3'tailは、 A配列としてポリ Ax ' 8配列、又は XA配列として Xhol配列や 4塩基以上で (C又は G)NN(C又は G)の配列と A 配列の組み合わせが挙げられる。 Tag 2は、峩和性タグ配列として Flag-tag配列、 HA-tag, IgGのプロテイン A(zドメイン)などの抗原抗体反応を利用したもの、 His- tagな ど、蛋白質を検出又は精製できるいかなる手段を用いるための配列でも力、まわない。 ' ここで、翻訳効率に影響する範囲としては、 C末端ラベルイ匕蛋白質合成の際は、 XA 配列の組み合わせが好ましぐ IW形成の際は、 A配列が好ましレ、。また、 3'tailの XA 配列又は A配列は、 IWの PEGスぺーサーゃ翻訳をさらに促進する PEG(Boc)スぺー ' サ一とのライゲーシヨンの嚓に必要な配列でもある。
[0063] 対応付け分子の構成は、例えば、 WO 02/46395に記載されており、対応付け分子 の形成に必要な配列、すなわち、特定配列は当業者であれば、このような公知の構 成に基づき、適宜設定できる。
[0064] dsDNAライブラリ一は、上記の ssDNAライブラリーを二本鎖 DNAに合成 (図 10、 II)し たものである。この際、 DNAポリメラーゼ Iによる相補鎖 DNAの合成と RNase Hによる RNA分解を同時に行レ、、さらに、 DNAリガーゼで、 DNAポリメラーゼ Iにより合成された DNA間のニックをつなぐ。合成された二本鎖 DNAライブラリ一は、 DNAポリメラーゼ Iに より合成された相補鎖のみ 5'末端力 Sリン酸化されており、 3'末端に特定の配列を持つ . ことが重要な特徴である。なお、 dsDNAライブラリ一は、この方法により形成されること 17 が好ましいが、一本鎖 DNAの相捕鎖 DNAの 5'末端のみがリン酸化されている dsDNA ライプラリーが形成きれる限り、他の酵素を用いてもよいし、他の原理によって形成し てもよい。
ライゲーテッド dsDNAライブラリ一は、上記の dsDNAライブラリーに、特定配列を持 つアダプターを DNAリガーゼによりライゲーシヨン (図 10、 ΙΠ)したものである。この際に 、アダプター主鎖の 5,末 ^はリン酸化されていないことでセルフライゲーシヨンを回避
.することが特徴であり、ライゲーシヨン効率の良い DNAリガーゼでライゲーシヨンできる '· ようにアダプターの 3'末端に主鎖より短い副鎖をノヽィプリダイゼーシヨンし二本鎖にし ておくことが好ましい。ここで、アダプタ の副鎖の 5'末端もリン酸化されていないこと が必要であり、理論的には主鎖より短ければよいが、ハイブリダィゼーシヨンの有効性. を考えると 6bp以上であることが好ましい。ライゲーシヨンを RNAリガーゼで行う場合は 、アダプタ一は一本鎖とし、ここでもアダプターをリン酸化しなレ、。ただし、 IWランダ ムライブラリー作成時では、テンプレートの 3'末端が RNAリガーゼの良いァクセプター となるための配列 (A配列)を有しており、テンプレート同士のライゲーシヨンが起こる ¾ 率は、 DNAリガーゼを用いた作成方法より断然高くなる点が不利である。また、 RNAリ ガーゼは DNAリガーゼに比較してライゲーシヨン効率が落ちるので、総合的に見て、 ライゲーシヨンを DNAリガーゼで行うことが好ましい。また、アダプターの特定配列に
'ついては、最終的に対応付け分子のライブラリーを作成できるものあれば制限はない 力 通常には、図 10にあるように、 5'UTR又は 5'UTRと Tag 1を含む配列となる。
5'UTRは、転写プロモーターと翻訳ェンノヽンサ一力らなり、転写プロモーターは ' T7/T3又は SP6などが利用でき、特に制限はないが、小麦の無細胞翻訳系では、転 写プロモーターとしては SP6、翻訳のェンハンサー配列としてはオメガ配列やオメガ 配列の一部を含む配列を利用することが好ましい。翻訳ェンハンサ一のオメガ配列 の一部 (〇29)は、 TMVのオメガ配列の一部を含んだものである (Gallie D.R., Walbot V. (1992) Nucleic Acids Res., vol. 20, 4631 - 4638、および、 WO 02/48347の図 3参 照)。 Tag 1については、先程の Tag2と同様である力 Tag 1と Tag2の両方を配する場 合は、異なる Tag配列を配するようにする。ライゲーシヨンされるアダプ^7—には、これ ら 5,UTR又は 5'UTRと Tag 1の一部又は全部 ©配列が含まれる場合がある。 18
[0066] 本発明の IW cDNAライブラリ一は、上記のラ ゲーテッド dsDNAライブラリーをテン プレートとして、特定の配列を有する 5 'および 3'プライマーで PCR (図 10、 IV)を行い合 成する。 5 'および 3'プライマーは、 5,UTR、 Tag 1、 Tag 2、 3'tailの特定の配列でァニ 一リングし、かつ 5'UTR、 Tag 1、 Tag 2、 3'tailの一部をアダプター配列として含む場 合がある。この PCRで 5'UTR、 Tag 1、 Tag 2、 3,tailなどの特定配列を持つ cDNAライブ .ラリーが完成する。
[0067] 本発明の IW RNAライブラリ一は、上記の IW cDNAライブラリーを 写 (図 10、 V) して得られる。この際、この IW RNAライブラリーをこのまま翻訳することや C末端ラベ ル化剤存在化に翻訳することで C末端ラベル化蛋白質ライブラリーを合成することが 可库である。転写の酵素は、特定配列に選択した T3, T7又は SP6などの酵素となる。
[0068] 本発明の IWライゲーテッド RNAライブラリ一は、上記の IW RNAライブラリーをスぺ ーサ一とライゲーシヨン (図 10、 VI)して得られる。スぺーサ一としては、 IW形成の場 合は IWの PEGスぺ サ一、および C末端ラベル化蛋白質合成のための PEG(Boc)^ ぺーサ一などが考えられる。.ライゲーシヨン酵素としては、 RNAリガーゼを用レ、る方法 が代表的だ力 その f也、 DNAリガーゼを用レ、るものや光反応による連結など何でもよ く、特に限定されるものではない。 ノ ' '
[0069] 本発明の IWランダムプライミンダライブラリーは、上記の IWライゲーテッド RNAライ ブラリーを無細胞翻訳系又は細胞内で翻訳 (図 10、 VII)して得られる。
[0070] IWの PEGスぺーサ一おょぴ C末端ラ.ベル化蛋白質合成の PEG(Boc)スぺーサ一は' 、 CCA領域、 PEG領域、ドナー領域からなる。最低限必要な構成は、ドナー領域であ る。翻 IR効率に影響する範囲としては、ドナー領域のみならず PEG部を持つものが好 ましぐさらにアミノ酸との結合能力のないピューロマイシンを持つことが好ましい。 PEG領域のポリエチレングリコールの分子量の範囲は、 400〜30,000で、好ましくは 1,000〜10,000、より好ましくは 2,000〜6,000である。また、 CCA領域にはピュー口マイ ^ンを含む構成と含まない構成が可能であり、ピューロマイシンについては、ピュー口 マイシン (Puromycin)、 3,一 N—アミノアシノレピューロマイシンアミノヌクレオシド(
3'-N-Aminoacylpuromycin aminonucleoside, PANS—アミノ酸)、例えばアミノ酸部がグ リシンの PANS- Gly、ノ《リンの PANS- Val、ァラニンの PANS- Ala、その他、全アミノ酸に 19 対応する PANS-全アミノ酸が利用できる。また、化学結合として 3'-アミノアデノシンの ァミノ基とアミノ酸の力ルポキシル基が脱水縮合じた結果形成されたアミド結合でつな がった 3'し N -アミノアシルアデノシンアミノヌクレオシド ('3,- Aminoacyladenosine aminonucleoside, AANS -アミノ酸)、例えばアミノ酸部がグリシンの AANS - Gly、ノ《リン 'の AANS- Val、ァラニンの AANS - Ala、その他、全アミノ酸に対応する AANS -全ァミノ 酸が利用できる。また、ヌクレオシド又はヌクレオシドとアミノ酸のエステル結合したも のなども利用できる。その他、ヌクレオシド又はヌクレオシドに類似した化学構造骨格 を有する物質と、アミノ酸又はアミノ酸に類似した化学構造骨格を有する物質を化学 的に結合可能な結合様式のものなら全て利用することができる。 CCA領域は、 5'側に ' 1残基以上の DNAおよび/又は RNAからなる塩基配列を持つことが好ましレ、。塩基の 種類としては、 C>(U又は T)>G>Aの順で好ましレ、。配列としては、 dC-ピューロマイシ ン, rC-ピューロマイシンなど、より好ましくは dCdC-ピューロマイシン, rCrC-ピュー口 マイシン, rCdC - ^ユーロマイシン, dCrC-ピューロマイシンなどの配列で、アミノアシ ル- tRNAの 3'末端を模倣した CCA配列 (Philipps G.R. (1969) Nature 223, 374-377) が適当である。 C末端ラベルイ匕蛋白質合成のための PEG(Boc)スぺーサ一では、以上 のピューロマイシン誘導体のァミノ基がアミノ酸と結合する能力を欠いたあらゆる物質 、およびピューロマイシンを欠いた CCA領域も考えられる。 PEG部は修飾物質を有す る構成が可能である。このことによって、翻訳テンプレートを回収、精製による再利用 、又は固定ィ匕などのためのタグとして利用することが出来る。少なくとも 1残基の DNA および/又は RNAの塩基に修飾物質として、蛍光物質、ビォチン、又は His - tagなど各 種分離タグなどを導入したものが可能である。
C末端ラベル化剤は、蛋白質の翻訳系でのペプチド転移反応、すなわち、 'リポソ一 ム上でのペプチド転移反応によって蛋白質と結合し得る基 (残基を含む)をもつァク セプター部が、ヌクレオチドリンカ一を介して修飾部と結合した構成をもつ。この修飾 剤の存在下で蛋白質合成を行い、得られる C末端修飾蛋白質を精製し、分子間相互 作用の検出系を用いることによって、蛋白質相互作用の検出が可能となる。修飾部 には、 PEG部と同様に修飾物質が含まれる。修飾物質として、非放射性修飾物質の 具体例としては、蛍光性、非蛍光性修飾物質等が挙げられる。蛍光性物質としては、 20 フルォレセイン系歹 U、ローダミン系列、 Cy3、 Cy5、ェォシン系列、 NBD系列等の蛍光 色素や、緑色蛍光蛋白質 (GFP)等の蛍光性蛋 質がある。また、非蛍光性物質とし ては、ピオチンのような補酵素、蛋白質、ペプチド、 ,脂質 、色素、ポリエチレ ングリコール等、何らかの目印となり得る化合物であればいかなるものでもよい。ァク セプター部は、蛋白質の翻訳系で、ペプチド転移反応によって蛋白質と結合し得る, 基をもち、好ましくはピューロマイシン又はその誘導体の残基をもつ。ピューロマイシ ンはアミノアシル tRNAと類似した構造をもち、蛋白質合成を阻害する抗生物質として 知られている力 低濃度では蛋白質の C末端に結合することが知られている(
Miyamoto-Sato, E. et al. (2000) Nucleic Acids Res. 28: 1176—1182)。本発明で用い ることができるピューロマイシン誘導体は、ピューロマイシンと類似した構造を有し、蛋 白質の C末端に結合するこ^:ができる物質であればいかなるものでもよい。具体例と しては、 3,_N—アミノアシノレピューロマイシンアミノヌクレオシド、 3し N-アミノアシルアデ ノシンアミノヌクレオシド等が挙げられる。修飾部とァクセプター部との間をつなぐヌク レオチドリンカーとは、具体的には、,リボヌクレオチド又はデォキシリボヌクレオチドが 1個ないし複数個つながった核酸又は核酸誘導体であり、特に好ましい例として、ヽン トシン塩基を含むリボヌクレオチド (- rC -)又はデォキシリボヌクレオチド (- dC-)力 SI個 ないし複数個つながった化合物が挙げられる。その他、修飾部とァクセプター部との 間に挿入することによって修飾蛋白質の ί|¾量を上げることができる物質であればいか なるものでもよレヽ。本発明修飾剤においては、ヌクレオチドリンカ一が 2' -デォキシシ チジル酸、 2,-デォキシシチジル- (3,,5')- 2'-デォキシチジル酸、リポシチジル酸、又 は、リボシチジル - (3',5')-リボシチジル酸であることが好ましい。修飾剤は、上記修飾 ' 部とァクセプター部とを所望のヌクレオチドリンカ一を介して、それ自体既知の化学結 合方法によって結合させることにより製造することができる。具体的には、例えば、適 当な保護基で保護された上記ァクセプター部を固相担体上に結合させ、核酸合成 機を用いてヌクレオチドリンカ ^としてヌクレオチドホスホアミダイト、およぴデォキシヌ クレオチドホスホアミダイト、機能性修飾物質として蛍光物質ゃビォチンなどを結合し たホスホアミダイトを順次結合させた後、脱保護を行うことによって作製することができ る。上記各部の種類、又は結合の種類によっては液相合成法で結合させるか又ほ両 21 者を併用することもできる。また、機能性修飾物質としてニッケル等の金属イオンを用 レ、る場合には、金属イオンが配位しうる二トリ口トリ酢酸やイミノジ酢酸等のキレート性 の試薬を結合させ、次いで金属イオンを配位させることができる。
[0072] '無細胞蛋白質合成系の具体例としては、小麦胚芽抽出液、ゥサギ網状赤血球抽出 液、大腸菌 S30抽出液等が挙げられる。これらの無細胞蛋白質合成系の中に、翻訳 テンプレートであるライブラリーをカ卩え、 C末端ラ ル化の場合は、同時に:!〜 100 μ M の修飾剤を加え、 25〜37°Cで 1〜数時間保温することによって C末端修飾蛋白質が 合成される。対応付けの場合は、翻 テンプレートであるライブラリーを加えて、 25〜 ' 37°Cで 1〜数時間保温するだけで対応付け分子が合成される。合成された両修飾蛋 白質は、そのまま次の精製プロセス又は検出プロセス、又は直接細胞への導入に供 することができる。細胞発現系の具体例としては、大腸菌、,枯草菌、好熱菌、酵母等 の細菌から、昆虫細胞、哺乳類等の培養細胞、さらに線虫、ショウジヨウバエ、'ゼブラ フィッシュ、マウス等こ至るまでいかなる細胞でもよい。これらの細胞の中に、上記 C' 末端ラベル化又は対応付けされた両修飾蛋白質を直接導入することもできるし、ある いは、翻訳テンプレートであるライプラリーを導入し、 C末端ラベル化の場合は、同時 に 1〜100 μ Μの修飾剤を電気穿孔法、マイクロインジヱクシヨン法等により細胞の中 に導入し、細胞の至適生育温度で数時間保温することによって修飾蛋白質が合成さ れる。対応付けの場合は、対応付けテンプレートであるライブラリーを導入し、'細胞の 至適生育温度で数時間^:温することによって対応付け分子が合成される。合成され た商修飾蛋白質は、細胞を破碎することによって回収し次の精製プロセス又は検出 プロセス 供することができる。また、そのまま細胞の中で検出プロセスに供すること も可能である。 ..
[0073] 対応付け分子のライブラリ一は、進化分子工学として、ダーウィン進化機構を利用 して、「変異 (Mutation)」、「選択 (Selection) 、「増幅 (Amplification) の 3つの単位操作 を繰り返すことで漸進的に進化させ、所望の機能を獲得した物質を創製することでェ 学的に応用することが可能であり、また、ゲノム機能解析への応用として、 cDNAライ ブラリーから所望の物質や蛋白質と相互作用を持つ一群の遺伝子配列を網羅的に 解析可能である (図 7)。本発明のライブラリ一として IWの cDNAをもちいて、一次スクリ 22 一ユングで物質や蛋白質と相互作用を検出し、さらに、相互作用の詳細を FCCSやマ イクロアレイなどの二次スクリーニングで解析することが可能である。また、本発明のラ イブラリーは、 IW又は C末端ラベルイ匕蛋白質のライブラリ一として、単独で FCCSや マイクロアレイなどにより物質や蛋白質との相互作用解析に利用することも可能であ る。また、もちろん本発明のライブラリーを IWを用いた進化分子工学に応用し、一次 スクリーニングにより機能性蛋白質の創出に利用することも可能であり、その際に、一 次スクリーニングと二次スクリーニングを組み合わせて、創出した機能性蛋白質の相 互作用の詳細を解析することも可能である。
[0074] この場合に、対応付け分子の共翻訳スクリーニング/セレクションを用いた解析は非 常に有効である。なぜなら、共翻訳スクリーニング/セレクション法によって、ベイト蛋 白質と直接又は間接的に相互作用のある蛋白質を網羅的に検出することが可能とな ' つたからである。さらに、共翻訳スク] /一ユング/セレクション法などによる一次スクリー ユング後に、二次スクリーニングとして、物質や蛋白質と相互作用の詳細を FCCSや • マイクロアレイなどにより解析することが可能であ?)。以上の解析は、 in'vitroにおける 共翻訳や共翻訳スクリーニング法と組み合わせて利用することもできる。また、一次ス クリーニングで対応付け分子を利用するときは A配列のコード部を利用し、二次スクリ 一二ングでは、対応'付け分子を利用するときは A配列のコード部、 C末端ラベル化蛋 白質を利用するときは XA配列のコード部をプライミングによって変更して使用するこ とで、それぞれの効果を使い けることが出来る。
[0075] ,上記で得られた IWライプラリー又は C末端ラベルイ匕蛋白質のライブラリーと「標的 分子」を、修飾物質の種類や反応系の種類などにより適宜組み合わせて接触せしめ 、該修飾蛋白質又は該標的分子が発する信号にぉレ、て両分子間の相互作用に基 づいて発生される上記信号の変化を測定することにより相互作用を解析することが出 来る。相互作用の解析は、例えば、蛍光相関分光法、蛍光イメージングアナライズ法 、蛍光共鳴エネルギー移動法、エバネッセント場分子イメージング法、蛍光偏光解消 法、表面プラズモン共鳴法、又は、固相酵素免疫検定法により行われる。「標的分子 」とは、 IW又は c末端ラベルィヒ蛋白質と相互作用する分子を意味し、具体的には蛋 白質、核酸、糖鎖、低分子化合物などが挙げられる。蛋白質としては、本発明修飾蛋 23 白質と相互作用する能力を有する限'り特に制限はなぐ蛋白質の全長であっても結 合活性部位を含む部分ペプチドでもよい。またアミノ酸配列、およびその機能が既知 の蛋白質でも、未知の蛋白質でもよい。これらは、合成されたペプチド鎮、生体より精 製された蛋白質、又は、 cDNAライブラリ一等力も適当な翻訳系を用いて翻訳し、精 製した蛋白質等でも標的分子として用レヽることができる。合成されたペプチド鎖はこ れに糖鎖が結合した糖蛋白質であってもよい。これらのうち好ましくはアミノ酸配列が 既知の精製された蛋白質力 又は、 cDNAライブラリ一等力 適当な方法を用いて 翻訳および精製された蛋白質を用いることができる。
[0076] これら標的分子と IW又は C末端ラベル化蛋白質との「相互作用」とは、通常は、蛋 白質と標的分子間の共有結合、疎水結合、水素結合、ファンデルワールス結合、お ょぴ静電力による結合のうち少なくとも 1つ力 生じる分子間に働く力による作用を示 す力 この用語は最も広義に解釈すべきであり、いかなる意味においても限定的に 解釈してはならない。共有結合としては、配位結合、 ¾極子結合を含有する。また静 電力による結合とは、静電結合の他、電気的反発も含有する。また、上記作用の結 ' 果生じる結合反応、合成反応、分解反応も相互作用に含有される。相互作用の具体 例としては、抗原と抗体間の結合おょぴ解離、蛋白質レセプターとリガンドの間の結 合および解離、接着分子と相手方分子の間の結合および解離、酵素と基質の間の 結合および解離、核酸とそれに結合する蛋白質の間の結合および解離、情報伝達 系における蛋白質同士の間の結合と解離、糖蛋白質と蛋白質との間の結合および 。解離、又は糖鎖と蛋白質との間の結合および解離が挙げられる。
[0077] 以下、共翻訳スクリーニング/セレクションを用いた解析方法の例について説明する 。解析方法には、相互作用の検出方法および相互作用する蛋白質のスクリーニング 方法が含まれる。
[0078] 本発明検出方法は、ベイトとプレイとの間の相互作用の検出において、プレイとして 本発明のライブラリーを用レ、るものである。
[0079] 好ましくは、ベイトおよびプレイに特定の様式で分離用修飾および検出用標識を行 レ、、そして、無細胞翻訳系においてべイトの存在下で、プレイを翻訳により生成させる ことによりベイトとプレイとを接触させることを主な特徴とするものである。本明細書に 24 おいては、無細胞翻訳系においてべイトの存在下で、プレイを翻訳により生成させる ことによりベイトとプレイとを接触させることを「無細胞共翻訳」ともいう。
[0080] 本明細書において、ベイトおよびプレイの用語は、物質間の相互作用の解析の技 術分野で通常に用いられる意味を有する。すなわち、既知の物質である蛋白質や核 酸などをべイト (おとり)と呼ぴ、それと相互作用する物質である蛋白質や核酸などをプ レイ (獲物)と呼ぶ。本発明では、プレイは蛋白質であることが好ましレ、。
[0081] ここで、ベイトとしては、あらゆる蛋白質 (ペプチドを含む)、核酸、抗体、ホルモンな , どのリガンド、金属などの任意のものから構成される複合体が挙げられ、天然のもの でも人工のもののいずれでも構わない。ベイトとしての分子量の制限などは特にない 。たとえば蛋白質であれば、機能ドメイン又は機能ドメインを含む完全長蛋白質など が挙げられる。プレイライプラリーを用いる場合は、完全長蛋白質とすることでより網 羅的検出が可能となる。
[0082] また、プレイとしては、好ましくは、蛋白質のライプラリーが用いられる。プレイとして の分子量の'制限などは特にない。' . '
[0083] 本発明検出方法は、好ましくは、上述のように、ベイトとプレイとの間 相互作用の 検出において、ベイトおょぴプレイに特定の様式で検出用標識および分離用修飾を 行い、そして、'無細胞共翻訳を行うことを主な特徴とするものである。従って、本発明 検出方法の好ましい構成は、ベイトおょぴプレイに特定の様式で検出用標識および 分離用修飾を行い、そして、無細胞共翻訳を行うことを除いて、ベイトとプレイとを接 触させ、接触により形成された複合体を検出することを含む、ベイトとプレイとの間の 相互作用の通常の検出方法と同様でよい。
[0084] ベイトおよびプレイの分離用修飾および検出用標識は、複合,体の検出に適合した ものが適宜選択されるが、無細胞共翻訳において、ベイトとプレイとが共に検出用標 . 識で標識されたり、分離用修飾を受けたりしなレ、ように行われる必要がある。そのため 、プレイは、検出用標識として使用できる蛋白質との融合蛋白質とされるか、又は、対 応付け分子とされ、それに応じて、ベイトは分離用修飾を有するものとされる。
[0085] プレイが融合蛋白質とされる場合には、ベイトは分離用修飾を有するようにする。ベ イトが蛋白質である場合には、ベイトは、分離用修飾として使用できる蛋白質との融 25 合蛋白質として、無細胞翻訳系において、ベイトを含む融合蛋白質をコードする mR NAの翻訳が行われることにより無細胞翻訳系に存在させることが好ましい。
[0086] ベイトが蛋白質の場合の分離用修飾の例としては、蛋白質として、 GST蛋白質や TAP法などに用いられてレ、る CBP (カルモジュリンビーズとの親和性により分離可能) やプロテイン A(IgG -プロテイン A親和性により分離可能)、親和性タグとして、各種の 抗体タグなどとの融合蛋白質とすることが挙げられる。ベイト自体が分離用修飾として 使用できる性質を有する場合には、ベイトをそめまま、分離用修飾を有するベイトとし て使用できる。プレイの検出用修飾としては、 GFP(green fluorescent protein)などの 蛍光蛋白質との融合蛋白質とすることが挙げられる。
[0087] 上記の融合蛋白質をコードする mRNAの調製およびこの mRNAの無細胞翻訳系 での翻訳は通常の方法に従って行うことができる。 mRNAは、無細胞転写翻訳系に おいて、 DNAの転写により生成するものであってもよい。
[0088] ■プレイが対応付け分子とされる場^には、ベイトには任意の分離用修飾を施すこと ができる。ベイトが蛋白質である場合には、上述の分離用修飾の例が挙げられる他、 ベイトが核酸やドラッグなどの場合の分離用修飾の例としては、ストレプトアビジンや アビジンと相互作用のあるピオチンなどを利用することが挙げられる。ベイト自体が分 離用修飾として使用できる性質を有する場合には、ベイトをそのまま、分離用修飾を 有するベイトとして使用できる。
[0089] 対応付け分子とは、表現型と遺伝子型と対応付ける分子を意味する。対応付け分 子は、通常には、遺伝子型を反映する塩 S配列を有する核酸を含む遺伝子型分子 と、表現形の発現に関与する蛋白質を含む表現型分子とが結合してなる分子である 。この蛋白質としてプレイを用いることによりプレイを対応付け分子とすることができる
。このような対応付け分子は、無細胞翻訳系において、プレイをコードする mRNAの 翻訳を、翻訳されたプレイが該 mRNAと会合するように行うこと、又は、無細胞転写 翻訳系において、プレイをコードする DNAの転写おょぴ翻訳を、翻訳されたプレイ が該 DNAと会合するように行うことにより形成することができる。従って、この製造の 際に、ベイトを存在させることにより、無細胞共翻訳を行うことができる。すなわち、下 記(1)又は(2)により無細胞共翻訳を行うことができる。 26
[0090] (1)無細胞翻訳系において 前記べイトの存在下で、前記プレイをコードする mRN Aの翻訳を、翻訳されたプレイが該 mRNAと会合するように行うことにより、無細胞翻 訳系にプレイを生成させて、ベイトとプレイとを接触させる。
[0091] (2)無細胞転写翻訳系において、前記べイトの存在下で、前記プレイをコードする DNAの転写および翻訳を、翻訳されたプレイが該 DNAと会合するように行うことによ り、無細胞転写翻訳系にプレイを生成させて、ベイトとプレイとを接触させる。
[0092] 以下、上記(1)および(2)の態様について説明する。
(1)の態様では、 mRNAが、その 3,末端に結合したスぺーサー領域と、スぺーサー 領域に結合した、ペプチド転移反応によってペプチドと結合し得る基を含むペプチド ァクセプター領域とを有することにより、翻訳されたプレイが該 mRNAと会合すること が好ましい。このような対応付け分子を用いる相互作用の検出方法としては、 in vitro ウィルス方法が挙げられる。
[0093] mRNAは、好ましくは、転写.プロモーターおよび翻訳ェンハンサーを含 5'非翻訳 領域と、 5'非翻訳領域の 3'側に結合した、プレイをコードする ORF領域と、 ORF領域 の 3'側に結合した、ポリ A配列を含む 3'末端領域を含む核酸である。好ましくは、ポリ A配列の 5'側に、 SNNS (Sは G又は C)配列を含む発現増幅配列 (例えば制限酵素 , Xholが認識する配列)が更に含まれる。 5'末端に Cap構造があってもなくても良い。
[0094] ポリ A配列は、少なくとも 2残基以上の dAおよび/又は rAの混合又は単一のポリ A連 続鎖であり、好ましくほ、 3残基以上、より好ましくは 6以上、さらに好ましくは 8残基以 上のポリ A連続鎖である。 ,
[0095] 翻訳効率に影響する要素としては、転写プロモーターと翻訳ェンノヽンサ一力 なる 5'UTR、および、ポリ A配列を含む 3'末端領域の組み合わせがある。 3'末端領域のポ 'リ A配列の効果は通常には 10残基以下で発揮される。 5'UTRの転写プロモーターは T7/T3又は SP6などが利用でき、特に制限はない。好ましくは SP6であり、特に、翻訳 のェンノ、ンサ一配列としてオメガ配列やオメガ配列の一部を含む配列を利用する場 合は SP6を用いることが特に好ましい。翻訳ェンハンサ一は好ましくはオメガ配列の 一部であり、オメガ配列の一部としては、 TMVのオメガ配列の一部 (029; Gallie D.R., Walbot V. (1992) Nucleic Acids Res., vol. 20, 4631 - 4638、および、 WO 02/48347 27 の図 3参照)を含んだものが好ましい。
[0096] .また、翻訳効率に関し、 3'末端領域においては、 Xhol配列とポリ A配列の組み合わ せが好ましい。さらに、 ORF領域の下流部分、すなわち Xhol配列の上流に親和性タ グがつレ、たものとポリ A配列の組み合わせが好ましレ、。親和性タグ配列としては、抗 原抗体反応など、蛋白質を検出できるいかなる手段を用レ、るための配列であればよ ぐ制限はない。好ましくは、抗原抗体反応によるァフィユティー分離分析用タグであ る Flag-tag配列又は His-tag配列である。ポリ A配列効果としては、 Flag - tag等の親和 性タグに Xhol配列がついたものとそこへさらにポリ A配列がついたものの翻訳効率が 上昇する。こごで、 His- tagについては、 Xhol配列のない構成でも十分な翻訳効率を 示し、有効である。
[0097] 上記の翻訳効率に関し効果のある構成は、対応付け効率にも有効である。
[0098] 5,UTRを' SP6+029とじ、 3,末端領域を、たとえば、 Flag+XhoI+An(n=8)又は His+ An (n=8)とすることで、各長さは、 5'UTRで約 49bp、 3'末端領域で約 38bp又は約 26bpであ . り、 PCRのプライマ にアダプター領域として組み込める長さである。このため、あら ゆるベクターやプラスミドや cDNAライブラリーから PCRによって、 5'UTRと 3,末端領域 をもったコード領域を簡単に作成できる。コード領域において、翻訳は ORF領域を超 えてされてもよレ、。すなわち、 ORF镇域め末端に終止コドンがなくてもよい。
[0099] ペプチドァクセプター領域は、ペプチドの C末端に結合できるもので'あれば特に限 定されなレ、が、例えば、ピ ーロマイシン、 3し N-アミノアシルピューロマイシンアミノヌ クレオシド (3し N - Aminoacylpuromycin aminonucleoside, PANS—アミノ酸)、 列えば、アミ ノ酸部がグリシンの PANS- Gly、ノ リンの PANS-Val、ァラニンの PANS - Ala、その他、 全アミノ酸に対応する PANS-全アミノ酸が利用できる。また、化学結合として 3'-ァミノ アデノシンのァミノ基とアミノ酸のカルボキシル基が脱水縮合した結果形成されたアミ ド結合でつながった 3' - N-アミノアシルアデノシンアミノヌクレオシド(
3'- Aminoacyladenosine aminonucleoside, AANS -アミノ酸)、例えばアミノ酸部がグリ シンの AANS- Gly、パリンの AANS- Val、ァラニンの AANS- Ala、その他、全アミノ酸に 対応す 0AANS-全アミノ酸が利用できる。また、ヌクレオシド又はヌクレオシドとァミノ 酸のエステル結合したものなども利用できる。その他、ヌクレオシド又はヌクレオシド 28 に類似した化学構造骨格を有する物質と、アミノ酸又はアミノ酸に類似した化学構造 骨格を有する物質を化学的に結合可能な結合様式のものなら全て利用することがで さる。
[0100] ペプチドァクセプター領域は、好ましくは、ピューロマイシンもしくはその誘導体、又 は、ピューロマイシンもしくはその誘導体と 1残基もしくは 2残基のデォキシリポヌクレ .ォチドもしくはリポヌクレオチドからなることが好ましい。ここで、誘導体とは蛋白質翻 訳系においてペプチドの C末端に結合できる誘導体を意味する。ピューロマイシン誘 導体は、ピューロマイシン構造を完全に有しているものに限られず、ピューロマイシン 構造の一部が欠落して!/、るものも包含する。ピューロマイシン誘導体の具体例として は、 PANS-アミノ酸、 AANS -アミノ酸などが挙げられる。
[0101] ペプチドァクセプター領域は、ピューロマイシンのみの構成でもかまわなレ、が、 5'側 に 1残基 ¾上の DNAおよび/又は RNAからなる塩基配列を持つことが好ましレ、。配列 としては、 dC-ピューロマイシン, rC-ピューロマイシンなど、より好ましくは dCdC—ピュ 一口マイシン, rCrC—ピューロマイシン, rCdC-ピューロマイシン, dCrC—ピュー口マイ シンなどの配列で、アミノアシル- tRNAの 3'末端を模倣した CCA配列 (Philipps, G.R. ' (1969) Nature 223, 374- 377)が適当である。塩基の種類としては、 C〉(U又は T)>G>A の II匿で好ましい。 ' '
[0102] スぺーサー領域は、好ましくは、ポリエチレングリコールを主成分とした PEG領域で ある。スぺーサー領域は、通常には、 PEG領域の他に、核酸の 3'末端に結合できるド ナー領域を含む。
[0103] 核酸の 3 '末端に結合できるドナー領域は、通常、 1以上のヌクレオチドからなる。ヌ クレオチドの数は、通常には 1〜15、好ましくは 1〜2である。ヌクレオチドはリポヌタレ ォチドでもデォキシリポヌクレオチドでもよレ、。ドナー領域は修飾物質を有してレ、ても よい。
[0104] ドナー領域の 5'末端の配列は、プレイをコードするコード領域とのライゲーシヨン効 率を左右する。コード領域とスぺーサー領域をライゲーシヨンさせるためには、少なく とも 1残基以上を含むことが必要であり、ポリ A配列をもつァクセプターに対しては、少 なくとも 1残基の dC (デォキシシチジル酸)又は 2残基の dCdC (ジデォキシシチジル酸) 29 が好ましい。塩基の種類としては、 C>(U又は T)>G>Aの順で好ましい。
[0105] PEG領域はポリエチレングリコールを主成分とするものである。ここで、主成分とする とは、 PEG領域に含まれるヌクレオチドの数の合計が 20 bp以下、又は、ポリエチレン グリコールの平均分子量が 400以上であることを意味する。好ましくは、ヌクレオチドの 合計の数が 10 bp以下、又は、ポリエチレングリコールの平均分子量が 1000以上であ ることを意味する。 , '
[0106] PEG領域のポリエチレングリコールの平均分子量は、通常には、 400〜30,000、好ま しくは 1,000〜10,000、より好ましくは 2,000〜8,000である。ここで、ポリエチレングリコ ールの分子量が約 400より低レ、と、このスぺーサー領域を含む遺伝子型分子を対応 付け翻訳したときに、対応付け翻訳の後処理が必要となることがあるが (Liu, R., Barrick, E., Szostak, J.W., Roberts, R.W. (2000) Methods in Enzymology, vol. 318, 268-293)、分子量 1000以上、より好ましくは 000以上の PEGを用いると、対応付け翻 訳のみで高効率の対応付けができるため、翻訳の後処理が必要なくなる。また、ポリ エチレングリコールの分子量が増えると、遺伝子型;^子の安定性が増す傾向があり、 特に分午量 1000以上で良好であり、分子量 400以下では DNAスぺーサ一と性質がそ れほどかわらず不安定となることがある。 .
[0107] .ポリエチレングリコールを主成分とするスぺーサー領域を有することによって、.対応 付け分子がゥサギ網状赤血球のみならず小麦胚芽の無細胞翻訳系でも形成可能と なり、両翻訳系での遺伝子型分子の安定性が飛躍的に向上し、翻訳後の処理を施 すことが不要となる。 '
[0108] (2)の態様では、 DNAが、蛋白質とストレプトアビジン又はアビジンとの融合蛋白 質をコードし、 DNAがピオチンにより標識され、 DNA—分子がェマルジヨンの一区 画に含まれる状態で転写おょぴ翻訳が行われることにより、翻訳されたプレイが該 D . NAと会合することが好ましい。このような対応付け分子を用いる相互作用の検出方 法としては、 STABLE法が挙げられる。
[0109] ェマルジヨンは、通常には、 2種の界面活性剤およびミネラルオイルと、無細胞転写 翻訳系の反応液を混合して形成される W/0型のェマルジヨンである。 W/0型のエマ ルジョンを形成するには、通常には、界面活性剤の HLB(hydrophile-lipophile 30 balance)値が 3.5〜6である必要がある。 2種の界面活性剤を混合した場合の HLB値 は、個々の界面活性剤の HLB値力 簡単な計算式で求められる。例えば、 Span 85(HLB=1.8および Tween 80(HLB=15.0)を、それぞれ 40.2 μ 1および 9.8 μ 1の割合で 混合することにより HLB=4.4となる。界面活性剤とミネラルオイルの割合は: ®常 1 : 1 8 (容量比)である。.また、反応液の割合はェマルジヨン全体に対して:!〜 50% (容量 比)であり、通常は 5%である。界面活性剤とミネラルオイルの混合物に、撹拌しなが ら、低温で、反応液をいくつかに分けて添加し、混合することによりェマルジヨ を^ 成することができる。転写および翻訳の反応は、エマルジョンの温度を上げることによ り、開始させることができる。 ' ' '
[0110] プレイをコードする DNAの調製およびこの DNAの無細胞転写翻訳系での転写お よび翻訳は通常の方法に従って行うことができる。
[0111] 上述のように、ベイトおよびプレイに特定の様式で検出用標識および分離用修飾を 行うことにより、無細胞共翻訳により形成された複合体を特異的に検出することができ る。
[0112] ベイトとプレイの無細胞共翻訳にお!/、て、 ^細胞共翻訳を行う無細胞翻訳系(無細 胞転写翻訳系を含む)については、大腸菌 E. cdi、ゥサギ網状赤血球、小麦胚芽の 系などいずれでも構わなレ、。 in vitroウィルス法では、対応付け分子の形成は、大腸 菌 E coliではかなり不安定である力 ゥサギ網状赤血球の系 (Nemoto N,
Miyamoto-Sato E, Yanagawa H. (1997) FEBS Lett. 414, 405; Roberts R.W, Szostak. J.W. (1997) Proc. Natl. Acad. Sci. USA 9 12297)では安定であることが確認されて おり、さらに小麦胚芽の系 (特開 2002- 176987)ではより安定であることが確認されてい る。 STABLE法では、大腸菌 E. coli、ゥサギ網状赤血球、小麦胚芽の系などいずれで も構わない。
[0113] 無細胞共翻訳における翻訳又は転写および翻訳の条件は、用いる無細胞翻訳系 に応じて適宜選択される。 ;
[0114] 無細胞翻訳系に添加'するベイトとプレイのテンプレートは、無細胞翻訳系が転写も 生じる無細胞転写翻訳系であれば、 RNA又は DNAのどちらでも構わない。
[0115] 以下、ベイトとして用いるのに好ましい翻訳テンプレートの例について説明する。 31
[0116] 本態様の共翻訳スクリーニングにおけるベイトとして、図 11に示すように、蛋白質に 翻訳される情報を持つコード部と PEGスぺーサ一部力 なることを特徴とする翻訳テ 'ンプレートを利用する。コード部は、蛋白質に翻訳される情報であり、どのような配列 でも良いが、好ましくは、コード部の 3,末端領域にァク: プター(A配列)を持つ、ある いは、コード部の 3'末端領域にァクセプター (A配列)を持ち、かつ A配列の 5'上流に 翻訳増幅配列 (X配列)を持つことを特徴とする。コード部の A配列として、短いポリ A 配列を含む。短いポリ A配列とは、通常には 2 10塩基の A力もなる配列である。 X配 列として、(C又は G)NN(C又は G)配列を有する配列、たとえば、 Xhol配列を有すること を特徴とする。 PEGスぺーサ一部は、ポリエチレングリコールを主成分とした PEG領域 、コード部と連結するためのドナー領域、および 3'末端に CCA領域を持つ。 PEGスぺ ーサ 部は、ドナー領域のみ、 CCA領域のみでも力まわなレ、が、好ましくは、ポリエ . チレングリコールを主成分とした PEG領域を含む構成をとる。 CCA領域は、該翻訳テ ンプレートによって翻訳された蛋白質と、ペプチド転移反応によって結合する機能を 有しないことを特徴とする。 PEG領域のポリエチレングリコールの分子量は、 500以上 であることを特徴とする。また、ドナー領域および/又は CCA領域において、少なくとも 1つの機能付与ユニット (F)を含むことを特徴とする。機能付与ユニット (F1および/又 は F2)が、該翻訳テンプレートおよび/又は該翻訳テンプレートから翻訳された蛋白 質を固定ィ匕又は蛍光ラベル化することを特徴とする。固定化物質としてビォチンなど が考えられ、蛍光性物質として、フルォレセイン, Cy5,又はローダミングリーン (RhG) などが考えられる。これらのコード部や翻訳テンプレート、およびそのライブラリー、さ らに、リボソーム上で翻訳された蛋白質やその イブラリーに関するものである。
[0117] ベイトの翻訳テンプレート (図 11の A)は、コード分子 (図 11の B)に由来するコード部 と PEGスぺーサ一分子 (図 11の C)に由来する PEGスぺーサ一部からなる。本態様で は、基本的には ード部の配列によらず、コード部に PEGスぺーサ一部を連結 (ライゲ ーシヨン)することでその安定性が向上して翻訳効率を向上出来る。しかしながら、さ らにコード部の構成や PEGスぺーサ一部の種類によって、その翻訳効率をより向上さ せることが可能である。以下にその詳細を記載する。
[0118] 本態 のコード部 (図 11の B)は、 5'末端領域、 ORF領域、 3'末端領域力 なり、 5'末 32 端に Cap構造があってもなくても良い。また、コード部の配歹には特に制限はな あ らゆるベクターやプラスミドに組み込まれたものとしての利用が考えられる。また、コー ド部の 3'末端領域は、 A配列としてポリ Ax8配歹 IJ、又は X配列として Xhol配列や 4塩基 以上で SNNS(Sは G又は C)の配列を持つもの、および A配列と X配列の組み合わせと しての XA配列がある。 A配列、 X配列、又は XA配列の jt流に親和性タグ配列として Flag - tag配列、カゝらなる構成が考えられる。ここで、親和性タグ配列としては HA- tagや IgGのプロテイン A(zドメイン)などの抗原抗体反応を利用したものや His- tagなど、蛋 質を検出又は精製できるいかなる手段を用レ、るための配列でも力まわない。ここで、 翻訳効率に影響する範囲としては、 XA配列の組み合わせが重要であり、 X配列のな かで、最初の 4塩基が重要であり、 SNNSの配列を持つものが好ましい。また、 5'末端 領域は、転写プロモーターと翻訳ェンノヽンサ一力 なり、転写プロモーターは T7/T3 又は SP6などが利用でき、特に制限はなレ、が、小麦の無細胞翻訳系では、翻訳のェ ンノヽンサー配列としてオメガ配列やオメガ配列の一部を含む配列を利用することが 好ましぐプロモーターとしては、 SP6を用いることが好ましレ、。翻訳ェンハンサ一のォ メガ配列の一部 (029)は、 TMVのオメガ配列の一部を含んだものである (Gallie D.R., Walbot V. (1992) Nucleic Acids Res., vol. 20, 4631-4638,および、 WO 02/48347の 図 3参照)。コード部の ORF領域については、 DNAおよび/又は RNAからなるいかなる 配列でもよい。遺伝子配列、ェキソ 配列、イントロン配列、ランダム配列、又は、い ' かなる自然界の配列、人為的配列が可能であり、配列の制限はない。
本態様の PEGスぺーサ一分子 (図 11の C)は、 CCA領域、 PEG領域、ドナー領域か らなる。最低限必要な構成は、ドナー領域である。翻訳効率に影響する範囲としては 、ドナー領域めみならず PEG領域を持つものが好ましぐさらにアミノ酸との結合能力 のないピューロマイシンを持つことが好ましレ、。 PEG領域のポリエチレングリコールの 分子量の範囲は、 400〜30,000で、,好ましくは 1,000〜10,000、より好ましくは 2,000〜 6,000である。また、 CCA領域にはピューロマイシンを含む構成と含まない構成が可 能であり、ピューロマイシンについては、ピューロマイシン(Puromycin)、 3し N-アミノア シノレピューロマづンンア^ノヌクレオシド (3 -N-Aminoacylpuromycin aminonucleoside,
PANS -アミノ酸)、例えばアミノ酸部がグリシンの PANS - Gly、パリンの PANS - Val、ァラ 33 ニンの PANS - Ala、その他、全アミノ酸に対応する PANS-全アミノ酸力 S利用できる。ま た、化学 合として 3'-アミノアデノシンのァミノ基とアミノ酸のカルボキシル基が脱水 縮合した結果形成されたアミド結合でつな力 sつた 3, - N -アミノアシルアデノシンアミノヌ クレオシド (3,— Aminoacyladenosine aminonucleoside, AANS -アミノ酸)、 ί列えば、アミノ 酸部がグリシンの AANS-Gly、パリンの AANS-Val、ァラニンの AANS-Ala、その他、全 アミノ酸に対応する AANS-全アミノ酸が利用できる。また、ヌクレオシド又はヌクレオシ ドとアミノ酸のエステル結合したものなども利用できる。その他、ヌクレオシド又はヌク レオシドに類似した化学構造骨格を有する物質と、アミノ酸又はアミノ酸に類似した 化学構造骨格を有する物質を化学的に結合可能な結合様式のものなら全て利用す ることができる。本翻訳テンプレートでは、以上のピューロマイシン誘導体のアミノ基 がアミノ酸と結合する能力を欠いたあらゆる物質、およぴピユーロマイシシを欠いた CCA領域も考えられるが、リボソーム上 蛋白質と結合不能なピューロマイシンを含 むことで、より翻訳効率を高められる。その理由は定かではないが、蛋白質と結合不 能なピューロマイシン力 Sリボソームを刺激することでターンオーバーが促進される可 能性がある。 CCA領域 (CCA)の 5'側に 1残基以上の DNAおよび/又は RNA力もなる 塩基配列を持つことが好ましい。塩基の種類としては、 C>(U又は T)〉G>Aの順で好ま しレ、。配列としては、 dC-ピューロマイシン, rC-ピューロマイシンなど、より好ましくは dCdC-ピューロマイシン, rCrC—ピューロマイシン, rCdC-ピューロマイシン, dCrC -ピュ 一口マイシンなどの配列で、アミノアシル- tRNAの 3'末端を模倣した CCA配列
(Philipps G.R. (1969) Nature 223, 374 - 377)が適当である。本発明の一態様では、こ れらのピューロマイシンが何らかの方法でアミノ酸と結合不可能となっている。
本態様の PEGスぺーサ一部は修飾物質 (F1および/又は F2)を有する構成が可能 である。このことによって、翻訳テンプレートを回収、精製による再利用、あるいは固 定化などのためのタグとして利用することが出来る。少なくとも 1残基の DNAお,よび/ 又は RNAの塩基に修飾物質として、蛍光物質、ビォチン、あるいは His- tagなど各種 分離タグなどを導入したものが可能である。また、コード部の 5'末端領域を SP6+029と し、 3'末端領域を、たとえば、 Flag+Xhol+A (n=8)とすることで、各長さは、 5'末端領域 で約 60bp; 3'末端領域で約 40bpであり、 PCRのプライマーにアダプター領域として設 34 計可能な長さである。これによつて新たな効果が生み出された。すなわち、あらゆる ベクターやプラスミドや cDNAライプラリーから PCRによって、本態様の 5'末端領域と 3' 末端領域をもったコード部を簡単に作成可能となり、このコード部に、 3'UTRの代わり として PEGスぺーサ一部をライゲーシヨンすることで、翻訳効率の高い翻訳テンプレ ートを得られる。
[0121] ' 本態様の PEGスぺーサ一分子とコード分子のライゲーシヨンは、その方法について は、一般的な DNAリガーゼを用いるものや^反応による連結など何でもよく、特に限 定されるものではない。 RNAリガーゼを用いるライゲーシヨンでは、コード部でライゲ ーシヨン効率に影響を与える範囲としては 3'末端領域の A配列 重要であり、少なくと も 2残基以上の dAおよび/又は rAの混合又は単一のポリ A連続鎖であり、好ましくは、 3残基以上、より好ましくは 6から 8残 ¾以上のポリ A連続鎖である。 PEGスぺーサ一部 のドナー領域の 5'末端の DNAおよび/又は RNA配列は、ライゲーシヨン効率を左右す る。コード部と PEGスぺーサ一部を、 RNAリガーゼでライゲーシヨンするためには、少 なくとも 1残基以上を含むことが必要であり、ポリ A配列をもつァクセプターに対しては' 、·少なくとも 1残基の dC (デォキシシチジル酸)又は 2残基の dCdC (ジデォキシシチジ · ル酸)が好ましい。塩基の種類としては、 C>(U又は T)>G>Aの順で好ましい。さらに、ラ ィゲーシヨン反応時に、 PEG領域と同じ分子量のポリエチレ グリコールを添カ卩するこ とが好ましい。
[0122] 次に、プレイとして用いるのに好ましい翻訳テンプレ トの例について説明する
[0123] 本態様の共翻訳スクリーニングにおけるプレイとして、図 12に示すように、,訳テン プレートによって C末端修飾された蛋白質 (=対応付け分子)を利用する。翻訳テンプ レートは、蛋白質に翻訳される情報を持つコード部と PEGスぺーサ一部からなる。コ ード部の 3'末端に A配列を有し、 A配列は、短いポリ A配列を含む。 PEGスぺーサー 部は、ポリエチレングリコールを主成分とした PEG領域において、ポリエチレングリコ ールの分子量力 00以上であることを特徴とする、また、ドナー領域および/又は CCA 領域において、少なくと 1つの修飾物質 (F1および/又は F2)を含むことを特徴とする 。また、 CCA領域は、該翻訳テンプレートによって翻訳された蛋白質と、ペプチド転 ■移反応によって 合する機能を有することを特徴とし、代表的には CCA領域にピュー 35 ロマイシンを有する。また、修飾物質 (F1および/又は F2)力 該翻訳テンプレートおよ ひ 7又は該翻訳テンプレートから翻訳された蛋白質を固定ィヒ又は蛍光ラベルイ匕する ことを特徴とする。固定化物質としてビォチンなどが考えられ、蛍光性物質として、フ ルォレセイン, Cy5,又はローダミングリーン (RhG)などが考えられる。これら、コード部 および翻訳テンプレート、およびそのライブラリ一力 リボソーム上で翻訳されることに より合成される蛋白質 (=対応付け分子)および蛋白質 (=対応付け分子)のライプラリー に関するものである。 ;■ '
[0124] プレイは、翻訳テンプレ ^トを用いた翻訳によって合成された、翻訳テンプレートで C末端修飾された蛋白質 (図 12の A;対応付け分子)であり、翻訳テンプレート (図 12 の B.)と、 PEGによって C末端修飾された蛋白質 (図 12の C)の構成に特徴を持つ。以 下詳細に記述する。
[0125] 翻訳テンプレート (図 12の B)の PEGスぺーサ一部は、ピュー マイシンがアミノ酸と 連結できることを特徴とする以外は上記のベイトとして用いるのに好ましい翻訳テンプ レートと同様である。また、コード部も上記のベイトとして用いるのに好ましい翻訳テン プレートと同様である力 特に、対応付けに適した構成としては、 3'末端領域を A配列 にすることが重要であり、トータル蛋白の対応付けの効率が著しく向上してフリー蛋白 ,質の量力 S激減する。ここでも、コード部の 5'末端領域を SP6+〇29とし、 3'末端領域を、' たとえば、 Flag+XhoI+An(n=8)とすることで、各長きは、 5'末端領域で約 60bp、 3'末端 領域で約 40bpであり、 PCRのプライマーにアダプター領域として設計できる長さであ る。これによつて、あらゆるベクターやプラスミドや cDNAライブラリーから PCRによって 、本態様の 5'末端領域 末端領域をもったコード部を簡単に作成可能となり、 PEG スぺーサ一部をライゲーシヨンすることで、対応付け効率の高レ、翻訳テンプレートが 得られる。
[0126] 本態様の PEGによって C末端修飾された蛋白質 (図 12の C)は、蛋白質の相互作用 検出などにおいて、コード部を利用しない場合、たとえば、 FCCS測定、蛍光リーダー 、プロテインチップなどに応用する場合は、 RNase Aなどで意図的に切断してもよい。 切断することによって、コード部の妨害による蛋白質間相互作用の検出の困難 I"生が 解消出来る。また、単独の対応付け分子をプレートやビーズやスライドガラスに固定 36 することも可能である。
[0127] 無細胞共翻訳を、図 13を参照して説明する。図 13に示すように、ベイトの存在下で プレイが in vitroで翻訳される。図 13の Aおよび Bに示されるように、ベイトが蛋白質で あって、無細胞翻訳系でプレイと同時に翻訳される場合と、ベイトが、核酸やホルモ ' ンなどであって、無細胞翻訳系に添加される場合がある。図 13に示すように、プレイ は融合蛋白貲又は対応付け分子とされる。 ' .
[0128] 複合体は、ベイトと一つのプレイが結合して形成されること (I)の他に、ベイトに結合 したプレイにさらに別のプレイが結合することにより形成されること (II)もある。, .
[0129] 本発明検出方法によれば、 in vitroで複合体の形成を行うことができるので、一貫し て in vitroで蛋白質間又は核酸-蛋白質間などの相互作用を検出できる。 '
[0130] .ベイトが蛋白質である場合は、ベイトとしては、目的蛋白質との相互作用のための 機能ドメインのみの蛋白質、機能ドメインを含む蛋白質、又は完全長蛋白質などが举 げられる。ここで、完全長蛋白質を用いることは、複数の機能ドメインを有することが . '一般に予測されるため、きらに網羅的にプレイを検出可能となることから、好ましい。 完全長蛋白質は、単独で完全長の蛋白質でもよいし、完全長の蛋白質を再構成す る複数のベイトの集まりでもよい。
[0131] , ベイトは、図 14に示したように、複合体であってもよく、これを「複合べイト」と呼ぶ。
複合体にすることによって、より非特異的な吸着を減らすことができ、かつ完全長蛋 白質と同様の効果として、より網羅的にプレイを検出することが可能となる。
[0132] 以上のように、無細胞共翻訳で考えられる複合体としては、単独のベイトと単独のプ レイの複合体、複合べイトとプレイの複合体、ベイトと複数のプレイの複合体、および 、複合べイトと複数のプレイの複合体が可能である。従って、本発明検出法により検 出可能な相互作用は、ベイトとプレイとの間の直接の相互作用だけでなぐ複合体を 形成するための間接的な相互作用をも包含するものである。
[0133] 本発明における無細胞共翻訳で最も重要なことは、蛋白質がネイティブな状態でフ オールデイングしており、翻訳されたての変性していない状態であり、相互作用する べきべイトとプレイ又はべイトとベイトやプレイとプレイが無細胞翻訳系に共存しており 、速やかに相互作用できると言うことと考えられる。このことは、別々に翻訳して翻訳 37 直後に混合して共存させるよりも、共に翻訳したものの方が優れた結果が得られたこ とにより支持される。すなわち、 in vitroで翻訳された蛋白質がネイティブなフォールデ イング状態で、蛋白質又は核酸などと出会うことができるため、速やかに相互作用に よる複合体の形成が可能となったためと思われる。
[0134] 従籴の相互作用の検出法では、ベイトを大腸菌で大量に発現精製する必要があつ た。例えば、 TAP法などでベイトとプレイの相互作用を細胞で発現させる場合は、最 低一ヶ月の準備が必要であった。また、 GST融合蛋白によるプルダウン法を採用して いる mRNAディスプレイ法では、ベイトを大腸菌などで木量に発現させて精製するた め、最低 2〜3週間かかり、大腸菌で発現しないものはべイトに,出来ないなどの問題が あり、さらに、プレイと相互作用させるにはプレイの 50〜100倍の量のベイトを添カ卩する 必要があった。無細胞共翻訳では、無細胞翻訳系において、ほぼ同量の mRNA又は DNA ンプレートを添加すればよいだけとなり、ベイトを細胞で発現させる必要は全く なくなり作業時間の大幅な短縮が行える。さらに、複合べイトや完全長蛋白質によつ て、ベイトとプレイの相互作用をより強化し特異的なものとし、非特異的な結合の検出 を回避することができる。また、複合べイトによって、その第二のベイトと相互作用する より多くのプレイを網羅的に解析できる。
[0135] これまで、一貫して in vitroで相互作用による複合体形成とスクリーニングを実現す るシステムは存在しなかった力 以上の本発明検出法によって、ベイトも含めて完全 に in vitroで翻訳とスクリーニングを行って、蛋白質間又は蛋白質 -核酸間の相互作 用を非特異的な検出を回避しかつ網羅的に検出可能なシステムを構築できる。従つ て、本発明は、本発明検出方法を利用したスクリーニング方法も提供する。
[0136] 本発明スクリーニング法は、ベイトとプレイが無細胞共翻訳を通して相互作用して複 合体を形成し、複合体のスクリーニングによってべイトと相互作用するプレイを解析す • ることを特長とする。従って、本発明スクリーニング方法は、本発明検出方法により、 ベイトとプレイとの間の相互作用を検出する検出工程を含む他は、ベイトとプレイとの 間の相互作用を検出する検出工程、および、相互作用が検出されたプレイを選択す る選択工程を含む、ベイトと相互作用するプレイの通常のスクリーニング方法と同様 でよい。 38
[0137] 本発明スクリーニング方法は、選択工程で選択されたプレイを調製する調製工程を さらに含み、調製されたプレイを、検出工程で使用されたべイトの代わりに又はその ベイトと共に用いて、検出工程、選択工程および調製工程を繰り返すことが好ましい 。この態様は、例えば、図 15に示すように、 1)プレイおょぴベイトが相互作用を形成 する無細胞翻訳系における無細胞共翻訳の工程、 2)ベイトと相互作用しているプレイ を検出するスクリーニングの工程、 3)プレイを分析および解析する土程、および 4) 3) . で分析および解析されたプレイを新たな次のベイトとし、 1)から繰り返す工程から構成 される。 1)および 2)の工程が検出工程および選択工程に相当し、 3)の工程が調製ェ 程に相当する。すなわち、検出工程のうちの、ベイトとプレイを接触させる工程が無細 胞共翻訳の工程に相当し、検出工程のうちの複合体の検出および選択工程がスクリ 一ユングの'工程に相当する。 、
[0138] 本発明スクリーニング法では、選択工程で選.択されたプレイを再度検出工程に付し てもよい。 '
[0139]. 本発明スクリーニング法では、ベイトと複数のプレイの集団であるプレイ'ライブラリ 一との無細胞共翻訳を行い、スクリーニングの'工程において、 2つ以上のプレイが検 出されてもよい。 ' ' ' '
[0140] 図 14に示すように、複合べイトとプレイが共存し、相互作用によって複合べイトとプ . レイの複合体を形成する場合がある。この無細胞共翻訳で、プレイ'ライブラリーの複 数のプレイがベイトと共存し、相互作用によってべイトと複数のプレイの複合体を形成 することによって、スクリーニングにおいて、一挙に網羅的な相互作用する複数のプ レイを検出できる。,また、ベイトが完全長蛋白質であることによって、完全長蛋白質は 一般に相互作用の機能ドメインを複数含むので、より多くのプレイを網羅的に検出可 能となる。
[0141] さらに、図 14に示すように、複合べイトと相互作用する複数のプレイの複合体を形 成することによって、複合べイトと相互作用する複数のプレイを検出でき、また、第二 のべイトがベイトとプレイの相互作用の補強剤となり、より特異的な相互作用が実現さ れることによって、網羅的検出における非特異的検出の回避が可能となる。 in vitroゥ ィルス法や STABLE法など進化分子工学的手法では、プレイは対応付け分子 (fiision) 39 となる。プレイ'ライブラリーや複数のプレイを用いた場合の複合体の形成では、プレ ィは直接べイトと相互作用する場合としない場合がある。 '
[0142] 複合体のスクリーニシグにより得られた複合体が対応付け分子である場合には、図
15に示すように、複合体を形成するプレイを RT - PCR又は PCRにより検出し、さらに、 ■ PCR産物をプレイとして再スクリーニングする(プレイの再構築)、あるいは、 PCR産物 力 解析したプレイを新たな次のベイトとしてスクリーニングしてもよレ、。ここで、 PCR産 物から再スクリーニングする.、あるいは、 PCR産物力 解析したプレイを新たな次のベ ,イトとしてスクリーニングする方法は、 in vitroウィルス法や STABLE法など進化分子ェ 学的手法においてのみ可能であり、プルダウン法、 TAP法など蛋白質を直接解析す る方法ではできない。 '
[0143] 対応付け分子を用いた場合には、スクリーニングの後、 RT- PCR又は PCRによって 蛋白質プレイの遺伝子配列を知ることが出来る。図 13および 14に示すように、ここで の蛋白質プレイとは、ベイトと枏互作用してレヽるプレイ又はそのプレイと相互作用して レ、るプレイなどで'あり、ベイトと相互作用しているすべての複数のプレイが網羅的に解 析できる。さらにプレイの再'スクリーニングが必要な場合は、 RT - PCR又は PCRの産物 である DNAテンプレートを転写し、同じサイクルを繰り返す。また、 RT- PCR又は PCR とそれに続くシークェンスによってプレイが定まった場合は、その蛋白質プレイはべィ トとして使えるようになる。はじめのベイトに対して相互作用するプレイが複数個見つ かれば、複合べイトを形成することが出来るようになり、さらにより多くのプレイを検出 することが出来るようになる。
[0144] 無細胞共翻訳を用いると、プルダウン法や TAP法においても一貫して in vitroで蛋 白質間相互作用を検出できることになるが、 TAP法では対応付け分子を形成してい ないので、プレイの解析において直接的に蛋白質を解析しなければならなレ、。そこで 、プノレダウン法や TAP法をスクリーニングの方法として in vitroウィルス法や STABLE 法に応用すれば、対応付け分子を形成しているので、 RT-PCR又は PCRによって、相 互作用するプレイの解析においてその遺伝子配列を簡単に検出することが出来る。 さらに、無細胞共翻訳を用いると、 in vitroウィルス法や STABLE法において、一貫し て in vitroで蛋白質間相互作用を検出できることになる。また、プレイの数が莫大な場 40 合は、サイクルを回すことで再スクリーニングによりプレイを絞り込むことが可能である 。また、解析されたプレイは、次の解析では、ベイトとして使うことができ、ベイトの数が 増えれば、ベイトの複合ィ匕が進み、さらなるプレイが検出されることにつながる。このよ うに、プレイをべイトとして次のサイクルで使用することは、対応付け分子を用レ、る in vitroウィルス法や STABLE法などでのみ簡単に実現できる。しかしながら、 mRNAディ スプレイなどの方法では、新しレヽベイトの GST融合蛋白を大腸菌で大量合成と精製 が必要であり、ベイトの用意に時間が力、かり困難である。無細胞共翻訳によれば、そ の必要もなく簡単にサイクルを回すことが出来る。
[0145] 無細胞共翻訳後の複合体のスクリーニングにおいて、無細胞共翻訳によって出来 た複合体を壌すことなくプレイを網羅的にスクリーニングできることが好ましい。このた めに、親和性タグなどによってべイトに固定化の仕組みを持たせ、ベイトと相互作用 するプレイを検出してもよい。その固定化の仕組みは、レ、かなるものでも構わなレ、。た とえば、既存の TAP法などのように、 IgG-プロテイン A親和性やカルモジュリンビーズ を用いた 2段階のスクリーニングを行う方法、又はプルダウン法のように、ストレプトァ ビジン又はアビジン了ピオチン親和性、 GST-tag、 Flag-tag, T7- tag, His- ¾gなどを利 用した一段階又は二段階のスクリーニングを行う方法力 S挙げられる。
[0146] プレ ライブラリ一としては、 cDNAライブラリー (ランダムプライミング'ライブラリー、 dTプライミング ·ライブラリー)、ランダム ·ライブラリー、ペプチド ·ライブラリー、ホルモ ン'ライブラリー、抗体'ライブラリー、リガンド 'ライブラリー、医薬化合物ライブラリーな どが挙げられ、レ、かなるライブラリーでも構わなレ、。たとえば、プレイ'ライブラリ一とし ' てランダムプライミング 'cDNAライブラリーを用いた場合、このライブラリーには完全長 プレイは望めないが、機能ドメインを含むプレイは期待できる。このようなライブラリー は、特に、複合べイトや完全長蛋白質との組み合わせによるスクリーニングに用いる と、プレイの網羅的検出に有効となる。
[0147] ランダムプライミングライプラリーの例としては、マノレチクロ一-ングサイト (MCS)の 5' 側に、転写プロモーターとして SP6の RNAポリメラーゼのプロモーター (SP6)と、翻訳ェ ンノヽンサ一としてタバコモザイクウィルスの TMVオメガ配列の一部 (〇29)とを含んだ 5' ;非翻訳 (UTR)領域を持ち、力 MCSの 3'側に親和タグ配列として、抗原抗体反応に 41 よるァフィ二ティー分離分析用タグである Flag - tag配列を、 MCSに組み込まれた挿入 配列から発現した蛋白質の C末端に Flag- tagが付加されるように含む 3'末端を持つ ベクターの MCSに、ランダムプライミングで得られた cDNAが組み込まれたものが挙 げられる。
[0148] 上記の本発明検出方法は、ベイトとプレイとを接触させ複合体を形成させる工程を 含んでいる。従って、この工程に準じて、ベイトとそのべイトと相互作用するプレイとの 複合体を形成させる方法が提供される。
[0149] 本発明形成方法は、ベイトとベイトと相互作用する蛋白質であるプレイとの複合体 の形成において、プレイとして本発明のライブラリーを用いるものであり、好ましくは、 さらに、ベイトおよびプレイに特定の様式で検出用標識および分離 i¾修飾を行い、そ して、,無細胞共翻訳を行うことを主な特徴とするものである。従って、本発明形成方法 の好ましい構成は、ベイトおよびプレイに特定の様式で検出用標識および分離用修 飾を行い、'そして、無細胞共翻訳を行うことを除いて、ベイトとそのべイトと相互作用 するプレイとを接触させることを含む、ベイトとプレイとの複合体の通常の形成方法と 同様でよい。ベイトおよびプレイの特定の様式での検出用標識および分離用修飾な らぴに無細胞共翻訳については、本発明検出方法に関し説明した通りでよい。
[0150] また、ポスト'セレクションの例として、以下のものも挙げられる。
蛋白質と標的分子との間の相互作用を解析する方法でぁゥて、該蛋白質を含む、 修飾剤が C末端に結合した C末端修飾蛋白質を用いることを特徴とする方法。相互 作用の解析は、蛍光相関分光法、蛍光イメージングアナライズ法、蛍光共鳴エネル ギー移動法、エバネッセント場分子イメージング法、蛍光偏光解消法、表面ブラズモ ン共鳴法、又は、固相酵素免疫検定法により行うことができる。 C末端修飾蛋白質を 固定化してもよい。標的分子が固定されたアレイ上に C末端修飾蛋白質を添加し、該 標的分子と特異的に結合した該 C末端修飾蛋白質を検出してもよい。
[0151] 本態様の解析方法においては、通常には、上記で得られた本発明修飾蛋白質と標 的分子を、修飾物質の種類や反応系の種類などにより適宜組み合わせて接触せし め、該本発明修飾蛋白質又は該標的分子が発する信号において両分子間の相互 作甩に基づいて発生される上記信号の変化を測定することにより相互作用を解析す 42 る。相互作用の解析は、例えば、蛍光相関分光法、蛍光イメージングアナライズ法、 蛍^:共鳴エネルギー移動法、ェパネッセント場分子イメージング法、蛍光偏光解消 法、表面プラズモン共鳴法、又は、固相酵素免疫'検定法により行われる。これらの方 法の詳細については下記で説明する。 -
[0152] 「標的分子」とは、本.発明修飾蛋白質と相互作用する分子を意味し、具体的には蛋 白質、核酸、獰鎖、低分子化合物などが挙げられ、好ましくは、蛋白質又は DNAで ある。
[0153] 蛋白質としては、本発明修飾蛋白質と相互作用する能力を有する限り特に制限は なぐ蛋白質の全長であっても結合活性部位を含む部分ペプチドでもよい。またアミ ノ酸配列、およびその機能が既知の蛋白質でも、未知の蛋白質でもよい。これらは、 合成されたペプチド鎖、生体より精製された蛋白質、又は cDNAライブラリ一等から 適当な翻訳系を用いて翻訳し、精製した蛋白質等でも標的分子として用いることがで 'きる。合成されたペプチド鎖はこれに糖鏔が結合した糖蛋白質であってもよい。これ らのうち好ましくはアミノ酸配列が既知の精製された蛋白質力 \又は cDNAライブラリ 一等'から適当な方法を用いて翻訳および精製された蛋白質を用いることができる。
[0154] 核酸としては、本発明修飾蛋白質と相互作用する能力を有する限り、特に制限はな ぐ DNA文は RNAも用レヽることができる。また、塩基配列又は機能が既知の核酸で も、未知の核酸でもよい。好ましくは、蛋白質に結合能力を有する核酸としての機能、 および塩基配列が ¾知のものか、あるいはゲノムライブラリ一等力も制限酵素等を用 いて切断単離してきたものを用いることができる。
[0155] 糖 としては、本発明修飾蛋白質と相互作用する能力を有する限り、特に制限はな く、その糖配列又は機能が、既知の糖鎖でも未知の糖鎖でもよい。好ましくは、既に 分離解析され、糖配列又は機能が既知の糖鎖が用いられる。
[0156] 低分子化合物としては、本発明修飾蛋白質と相互作用する能力を有する限り、特 に制限はない。機能が未知のものでも、又は蛋白質に結合する能力が既に知られて レ、るものでも用いることができる。 .
[0157] これら標的分子が本発明修飾蛋白質と行う「相互作用」とは、通常は、蛋白質と標 的分子間の共有結合、疎水結合、水素結合、ファンデルワールス結合、および静電 43 力による結合のうち少なくとも 1つから生じる分子間に働く力による作用を示すが、こ の用語は最も広義に解釈すべきであり、いかなる意味においても限定的に解釈して はならない。共有結合として 、配位結合、双極子結合を含有する。また静電力によ る結合とは、静電結合の他、電気的反発も含有'する。また、上記作用の結果生じる結 合反応、合成反応、分解反応も相互作用に含有される。
[0158] 相互作用の具体例としては、抗原と抗体間の結合および解離、蛋白質レセプターと リガンドの間の結合および解離、接着分子と相手方分子の間の結合および解離、酵 素と基質の間の結合および解離、核酸とそれに結合する蛋白質の間の結合および .解離、情報伝達系における蛋白質同士の間の結合と解離、糖蛋白質と蛋白質との間 の結合および解離、又は糖鎖と蛋白質との間の結合および解 iが挙げられる。 .
[0159] 用いられる標的分子は、態様に応じて修飾物質により修飾して用いることができる。
修飾物質は、通常、蛍光性物質などの非放射性修飾物質カゝら選択される。蛍光物質 としては、フリーの官能基 (例えばカルボキシル基、水酸基、アミノ基など)を持ち、蛋 白質、核酸等の上記標的物質と連結可能な種々の蛍光色素、例えばフルォレセイン 系歹 lj、ローダミン系歹 U、 Cy3、 Cy5、ェォシン系列、 NBD系列などのいかなるものであ つてもよい。その他、色素など修飾可能な化合物であれば、その化合物の種類、大き さは問わない。 , ' ·
[0160] これらの修飾物質は、標的分子と本発明修飾蛋白質との間の相互作用に基づレ、て 発生される信号の変化の測定又は解析方法に適したものが適宜用いられる。
' [0161] 上記修飾物質の標的分子への結合は、それ自体既知の適当な方法を用いて行う ことができる。具体的には、例えば、標的分子が蛋白質の場合、 WO 02/48347に記 ' 載された C末端を修飾する方法等を用いることができる。また標的分子が核酸の場合 は、予め修飾物質を共有結合などで結合させたオリゴ DNAプライマーを用いた PCR を行う方法などによって簡便に修飾することができる。
[0162] また、本発明修飾蛋白質又は本発明に用レヽられる標的分子は態様に応じて、固相 に結合させる(即ち、固定化する)場合があるが、固相に結合させる方法としては、修 飾物質を介して結合させるものと、それ以外の部分により結合させるものが挙げられ る。 , 44
[0163] 修飾物質を介して結合させる場合に用いられる修飾物質は、通常には、特定のポリ ペプチドに特異的に結合する分子 (以下、「リガンド」と称することがある。)であり、固 相表面には該リガンドと結合する特定のポリペプチド (以下、「アダプター蛋白質」と 称することがある)を結合させる。アダプター蛋白質には、結合蛋白質、受容体を構 成する受容体蛋白質、抗体なども含まれる。
[0164] アダプター蛋白質 Zリガンドの組み合わせとしては、例えば、アビジンおよびストレ プトアビジン等のビォチンおょぴィミノ'ビォチン結合蛋白質 Zピオチン又はイミノビォ チン、マルトース結合蛋白質ノマルトース、 G蛋白質 Zグァニンヌクレオチド、ポリヒス' チジンペプチド ニッケル又はコバルト等の金属イオン、グノレタチオン一 S—トランス フェラーゼ /ダルタチオン、 DNA結合蛋白質/ DNA、抗体 Z抗原分子(ェピトープ )、 ルモジュリン カルモジュリン結合ペプチド、 ATP結合蛋白質 ZATP、又はェ ストラジオール受容体蛋 質/エストラジオールなどの各種受容体蛋白質 Zそのリ ガンドなどが挙げられる。 ' '
[0165] これらの中で、アダプター蛋白質/リガンドの組み合わせとしては、アビジンおょぴ ' ストレプトアビジンなどのビォチンおよびイミノビォチシ結合蛋白質/ピオチン又はィ ミノピオチン、マルトース結合蛋白質/マルトース、ポリヒスチジンペプチド Zニッケル 又はコバルト等の金属イオン、グルタチオン一 S—トランスフェラーゼ /ダルタチオン 、抗体/抗原分子. (ェピトープ)、などが好ましぐ特にストレプトアビジン/ビォチン 又はイミノビォチンの組み合わせが最も好ましい。これらの結合蛋白質は、それ自体 既知のものであり、該蛋白質をコードする DNAは既にクローニングされている。 .
[0166] アダプター蛋白質の固相表面への結合は、それ自体既知の方法を用レ、ることがで きるが、具体的には、例えば、タン-ン酸、ホルマリン、グノレタルァノレデヒド、ピルビッ クアルデヒド、ビス一ジァゾ化べンジゾン、トルエン - 2,4-ジイソシァネート、アミノ基、 活性エステルに変換可能なカルボキシル基、又はホスホアミダイドに変換可能な水 酸基又はアミノ基などを利用する方法を用レ、ることができる。
[0167] 修飾物質以外の部分により固相に結合させる場合は、通常蛋白質、核酸、糖鎖、 低分子化合物を固相に結合させるのに用いられる既知の方法、具体的には例えば、 ■ タンニン酸、ホルマリン、グルタルアルデヒド、ピルビックアルデヒド、ビス一ジァゾ化べ 45 ンジゾン、トルエン - 2,4-ジイソシァネート、アミノ基、活性エステルに変換可能なカル ボキシル基、又はホスホアミダイドに変換可能な水酸基又はアミノ基などを利用する 方法を用いることができる。 ,
[0,168] 固相は、通常、蛋白質や核酸等を固定化するのに用レ、られるものでよぐその材質 および形状は特に限定されない。例えば、ガラス板やニトロセルロースメンブレンや ナイロンメンブレンやポリビニリデンフロライド膜、又はプラスチック製のマイクロプレー ト等を用レ、ることができる。
[0169] 「測定」とは解析のために用いられる信号の変化を収集するための手段であり、レヽ かなる意味においても限定的に解釈してはならなレ、。用いられる測定法としては、例 えば、蛍光相関分光法、蛍光共鳴エネルギー移動法、エバネッセント場分子イメージ ング法、蛍光偏光解消法、蛍光イメージングアナライズ法、表面プラズモン共鳴法、 固相酵素免疫検定法など、分子間相互作用を検出できるあらゆる系が利用可能であ る。
[0170]- この測定法は、標的分子が固定されたアレイ上に本発明修飾蛋白質を添加し、該 . 標的分子と特異的に結合した本発明修飾蛋白質を検出することを含む方法も含む。 標的分子が固定されたアレイとは、標的分子がそれらの同定が可能な配置で固定化 されている固相を意味する。該標的分子と特異的に結合した本発明修飾蛋白質の 検出の方法は、該標的分子と特異的に結合した本発明修餘蛋白質が検出される限 り、特に限定されず、通常には、本発明修飾蛋白質を添加したアレイから、標的分子 に結合しな!/ヽ本発明修飾蛋白質を洗浄により除去し、残った本発明修飾蛋白質を検 出する方法が挙げられる。
[0171] 以下、測定法の例につい T説明する。
[0172] (1)蛍光相関分光法
紫光ネ目関分光法 (Fluorescence Correlation Spectroscopy (FCS): Eigen, ., et al., Proc. Natl. Acad. Sci. USA, 91, 5740 - 5747(1994))は、共焦点レーザー顕微鏡等の 下で、粒子の流動速度、又は拡散率、容積収縮等を測定する方法であり、本発明に おいては、本発明修飾蛋白質 (C末端修飾蛋白質)と標的分子間の相互作用により 元の修飾分子 1分子の並進ブラウン運動の変化を測定することにより、相互作用する 46 分子を測定することができる。
[0173] 具体的には試料粒子が励起光により励起されて、試料液容積の一部において蛍光 を放射し、この放射光を測定し光子割合を得る。この値は、特定の時間に観測されて レ、る空間容積中に存在する粒子の数と共に変化する。上述した種々のパラメタ一は 自己相関関数を使用してこの信号の変動力 算出され得る。この FCSを行う為の装 置もカールツァイス (Zeiss)社等力ら巿販されており、.本方法においてもこれらの装置 を用いて解析を行うことができる。
[0174] この方法を用いて蛋白質一標的分子間相互作用の測定又は解析を行う場合、. C末 端修飾蛋白質又は標的分子のレヽずれも溶液として供することが必要である (液相法) . 。標的分子は修飾の必要はない。また相互作用を調べようとする C末端修飾蛋白質 より非常に分子量の小さい分子は、 c末端修飾蛋白質のブラウン運動に影響を及ぼ - さないため本方法においてはふさわしくない。 '
[0175] しかし、' 2種類の蛍光色素を用レ、る蛍光相互相関分光法 (FCCS)は、 1種類の蛍光 色素を用いる FCSでは困難であった周じくらいの分子量をもつ蛋白質間の相互作用 も検出できる。 2種類の蛍光色素を用レ、る他の方法としては蛍光共鳴エネルギー移 動(FRET)法が知られている力 FRETが生じるためには 2つの蛍光色素が 40〜50 A 以内に近接する必要があり、蛋白質の大きさや蛍光色素の付いている位置によって は、相互作用してレ、ても FRETが観測されなレ、危険性がある。 FCCS法では相互相関 の検出は蛍光色素間の距離に依存しないので、そのような問題がない。 方、他の 検出系である蛍光偏光解消法と比較すると、 FCCS法は必要なサンプル量が少なく、 検出時間が短ぐ HTSのための自動化が容易等の長所がある。さらに FCCS法では蛍 光標識された分子の大きさや数というきわめて基本的な情報が得られるので、表面プ ラズモン共 ή鳥法のように?凡用的な用途に利用できる可能性がある。両者の違いは、 表面プラズモン共鳴法では蛋白質が固定化された状態で相互作用を検出するのに 対して、 FCCS法ではより天然の状態に近レ、溶液中の相互作用を見ることができる点 にある。 FCCS法では、蛋白質の固定化が必要ないかわりに、蛋白質を蛍光色素で 標識する必要があるが、本発明により、この課題を克服することが可能となった。
[0176] また、 FCCS法では細胞内の環境に近い溶液状態で蛋白質'蛋白質相互作用ゃ蛋 47 白質'核酸相互作用を調べることができ、かつ解離定数 (結合定数)を 1回の測定で 簡便に算出することができる。
[0177] 本方法にぉレ、て C末端修飾蛋白質に標的分子を接触せしめる方法としては、両分 ' 子が相互作用するに十分な程度に接触する方法であれば如何なるものであってもよ いが、好ましくは市販の FCS用装置の測定用ゥエルに通常生化学的に用レ、られる緩 衝液等に適当な濃度で C末端修飾蛋白質溶解した溶液を投入し、さらに同緩衝液に 適当な濃度で標的分子を溶解した溶液を投入する方法によって行われる。
[0178] この方法において、同時に多数の解析を行う方法としては、例えば上記 FCS用測 定装置の各測定用ゥ ルにそれぞれ異なる複数の C末端修飾蛋白質を投入し、これ に特定の標的分子溶液を投入するか、又は特定の C末端修飾蛋白質を投入し、各ゥ エルに互いに異なる複数種の標的分子溶液を投入する: *r法が用いられる。
[0179] (2)蛍光イメージングアナライズ法
蛍光イメージングアナライズ法は、固定化された分子に、修飾分子を接触せしめ、 両分子の相互作用により、固定化された分子上にとどまった修飾分子力 発せられ る蛍光を、市販の蛍光イメージングアナライザーを用いて測定又は解析する方法で ある。 · . ' ·
[0180] この方法を用いて蛋白質一標的分子間相互作用の測定又は解析を行う場合、 C末 . 端修飾蛋白質又は標的分子のいずれか一方は上記した方法により固定化されてい ることが必要である。標的分子は固定化して用レ、る場合には修飾されてレ、るものと、 されていないもののどちらも利用可能である。また、固定ィ匕しないで用レ、る場合には 上記した修飾物質により修飾されてレ、ることが必要である。 C末端修飾蛋白質は、修 飾部を介して固定ィ匕されてレ、るものも、修飾部以外の部分で固定ィ匕されているものも 用いることができる。
[0181] C末端修飾蛋白質、又は標的分子を固定ィ匕するための基板(固相)としては、通常 、蛋白質や核酸等を固定ィ匕するのに用いられるガラス板ゃュトロセルロースメンブレ ンゃナイロンメンプレン、又はプラスチック製のマイクロプレート等も用レ、ることができ . る。また、表面が種々の官能基 (ァミノ基、カルボキシル基、チオール基、水酸基等) や種々のリガンド(ビォチン、イミノビォチン、ニッケル又はコバルト等の金属イオン、 48 ダルタチオン、糖類、ヌクレオチド類、 DNA、 RNA、抗体、カルモジュリン、受容体蛋 白質等)が結合した上記基板等も用いることができる。
[0182] 本方法において修飾標的分子又は C末端修飾蛋白質を固定化分子へ接触せしめ る方法としては、両分子が相互作用するに十分な程度に接触する方法であればいか ' なるものであってもよいが、好ましくは修飾標的分子又は C末端修飾蛋白質を生化学 的に通常使用される緩衝液に適当な濃度で溶解した溶液を作成し、これを固相表面 に接触させる方法が好ましい。 ·
[0183] 両分子を接触せしめた後、好ましくは過剰に存在する修飾標的分子又は C末端修 , 飾蛋白質を同緩衝液等により洗浄する工程を行い、固相上にとどまった標的分子又 ほ C末端修飾蛋白質の修飾物質力 発せられる蛍光信号、又は固定化されてレ、る修 飾分子力 発せられる蛍光と固相上にとどまった修飾分子力 発せられる蛍光が混 ざり合った信号を、市販のイメージングアナライザーを用いて測定又は解析すること により、固定化された分子と相互作用する分子を同定することができる。 '
[0184] この方法において、同時に多数の解析を行う方法とじては、例えば上記固相表面 に、複数の C末端修飾蛋白質又は修飾もしくは非修飾標的分子を番地付けして固定 化する方法、又は 1種類の c末端修飾蛋白質又は修飾もしくは非修飾標的分子に固 定化されてレ、なレ、複数種の C末端修飾蛋白質又は修飾標的分子を接触させる方法 , 等が用いられる。複数種の C末端修飾蛋白質文は修飾標的分子を接触させる場合 には、固相にとどまった 分子を緩衝液の濃度の差等により解離させて取得し、これ を既知の方法により分析することにより同定できる。
[0185] (3)蛍光共鳴エネルギー移動法
2種類の蛍光色素を用いる他の分子間相互作用検出法として、蛍光共鳴エネルギ ' 一移動 (FRET)法がよく知られて!/、る。 FRETとは、 2種類の蛍光色素の一方 (ェネル ギー供与体)の蛍光スペクトルと、もう一方(エネルギー受容体)の吸収スペクトルに 重なりがあるとき、 2つの蛍光色素間の距離が十分小さいと、供与体からの発光が起 こらないうちに、その励起エネルギーが受容体を励起してしまう確率が高くなる現象 をいう。したがって、相互作用を検出したい 2つの蛋白質を、それぞれ供与体おょぴ ¾容体となる蛍光色素で標識しておき、供与体を励起すれば、 2つの蛋白質が相互 49 作用しない場合は、蛍光色素間の距離が大きいため FRETは起こらず、供与体の蛍 光スペクトルが観察されるが、 2つの蛋白質が相互作用して蛍光色素間の距離が小 さくなると、 FRETにより受容体の蛍光スペクトルが観察されるので、蛍光スペクトルの 波長の違いから蛋白質間相互作用の有無を判別することができる。蛍光色素 して は、供与体がフルォレセイン、受容体がローダミンという組み合わせがよく用いられて いる。また最近では、蛍光緑色蛋白質 (GFP)の波長の異なる変異体の組み合わせ により、細胞の中で FRETを観察し相互作用を検出する試みがなされている。この方 法の欠点としては、 FR¾Tが生じるために 2つの蛍光色素が 40〜50A以内に近接す る必要があるため、蛋白質の大きさや蛍光色素の付いてレ、る位置によっては、相互 作用していても FRETが観測されない危険性があるという点が拳げられる。
[0186] (4)エバネッセント場分子イメージング法
ェパネッセント場分子イメージング法とは、 Funatsu, T., et al., Nature, 374, 555-559 (1995)等に記載されてレ、る方法で、ガラス等の透明体に固定化した分子に 溶液として第 2の分子を接触せしめ、これにエバネッセント場が発生する角度でレー ザ一光等の光源を照射し、発生したエバネッセント光を検出器によって測定又は解 析する方法である。これらの操作は、それ自体既知のェパネッセント場蛍光顕微鏡 装置を用いて行うことができる。 .
[0187] この方法を用いて蛋白質一標的分子間相互作用の測定又は解析を行う場合、 C末 端修飾蛋白質又は標的分子のいずれか一方は上記した方法により固定化されてい ることが必要である。標的分子は固定ィ匕する場合は修飾の必要はないが、固定化し ないで用いる場合には上記した修飾物質により修飾されてレ、ることが必要である。
[0188] C末端修飾蛋白質、又は標的分子を固定化するための基板としては、ガラス等の 材質の基板が用いら 、好ましくは石英ガラスが用いられる。また、レーザー光の散 ■ 乱等を防ぐために表面を超音波洗浄したものが好ましい。 '
[0189] 本方法において固定ィ匕していなレヽ C末端修飾蛋白質又は修飾標的分子を固定ィ匕 分子へ接触せしめる方法としては、両分子が相互作用するに十分な程度に接触する 方法であればいかなるものであってもよいが、好ましくは固定ィ匕していない C末端修 飾蛋白質又は修飾標的分子を生化学的に通常使用される緩衝液に適当な濃度で 50 溶解した溶液を作成し、これを固相表面に滴下する方法が好ましい。 ^
[0190] 両分子を接触せしめた後、エバネッセント場照明により励起された蛍光を CCDカメ ラ等の検出器を用いて測定することにより、固定化された分子と相互作用する分子を 同定することができる。
[0191] この方法において、同時に.多数の解析を行う方法としては、例えば上記基 に、複 数の C末端修飾蛋白質又は修飾標的分子を番地付けして固定ィヒする方法等が用い られる。
[0192] (5)蛍光偏光解消法
蛍光偏光法 (Perran, J., et al., J. Phys. Rad., 1, 390- 401(1926))は、蛍光偏光で励 起ざれた蛍光分子が、励起状態の間、定常状態を保っている場合には同一の偏光 平面で蛍光を放射するが、励起された分子が励起状態中に回転ブラクン運動等を 行った場合に、放射された蛍光は励起光とは異なった平面になることを利用する方 ' 法である。分子の運動はその大きさに影響^受け、蛍光分子が高分子である場合に は、励起状態の間の分子の運動はほとんどなく、放射光は偏光を保ったままになって レ、るのに対して、'低分子の蛍光分子の場合は、運動速度が速いために放 光の偏 光が解消される。そこで、平面偏光で励起された蛍光分子から放射される蛍光の強 度を、元の平面とそれに垂直な平面とで測定し、両平面の蛍光強度の割合からこの 分子の運動性およびその存在状態に関する情報が得られるものである。この方法に よれば、夾雑物があってもこれに影響されることなぐ蛍光修飾され: ^分子と相互作 用する標的分子の挙動を追跡できる。これは蛍光修飾された分子と標的分子が相互 作用するときにのみ、偏光度の変化として測定されるからである。
[0193], この方法を行うための装置としては例えば BECON (Panyera社製)等が市販されて おり、本方法もこれらの装置を用レ、ることにより行うことができる。
[0194] . この方法を用いて蛋白質一標的分子間相互作用の測定又は解析を行う場合、 C末 端修飾蛋白質又は標的分子のいずれも溶液として供する必要がある。標的分子は 修飾の必要はない。また相互作用を調べようとする C末端修飾蛋白質より非常に分 子量の小さい分子は、 C末端修飾蛋白質のブラウン運動に影響を及ぼ ないため本 方法においてはふさわしくない。 51
[0195] 本方法において C末端修飾蛋白質に標的分子を接触せしめる方法としては、両分 子が相互作用するに十分な程度に接触する方法であれば如何なるものであって よ レ、が、好ましく,は市販の蛍光偏光解消装置の測定用ゥエルに通常生化学的に用いら れる緩衝液等に適当な濃度で C末端修飾蛋白質溶解した溶液を投入し、さらに同緩 衝液に適当な濃度で標的分子を溶解した溶液を投入する方法によって行われる。
[0196] 本方法において測定する C末端修飾蛋白質および標的分子との間の相互作用は 、必ずしも抗原抗体反応ほど特異性は高くないことが考えられるため、最適の組み合 わせを検出するためには、相互作用の程度を数値化することが有効である。相互作 用の程度を示す指標としては、例えば一定濃度の C末端修飾蛋白質に対して、極大 蛍光偏光度を与える最小標的物濃度の値等を用いることができる。 ,
[0197] この方法において、同時に多数の解析を行う方法としては、例えば上記蛍光偏光 解消法測定装置の各測定用ゥエルにそれぞれ異なる複数の C末端修飾蛋白質を投 入し、これに特定の標的分子溶液を投入するか、又は特定の C末端修飾蛋白質を投 入し、各ゥエルに互いに異なる複数種の標的分子溶液を投入する方法が用いられる
[0198] (6)表面プラズモン共鳴法 '
- 表面プラズモ 共鳴法とは、金属 液体界面で相互作用する分子によって表面プ ラズモンが励起され、これを反射光の強度変化で測定する方法である(Cullen, D.C., et al., Biosensors, 3(4), 211-225(1987-88))。この方法を用いて蛋白質一標的分子 間相互作用の測定又は解析を行う場合、 C末端修飾蛋白質は上記した方法により固 定化されていることが必要であるが、標的分子の修飾は必要ない。
[0199] C末端修飾蛋白質を固定ィ匕するための基板としては、ガラスの等の透明基板上に ' -金、銀、白金等の金属薄膜が構成されたものが用いられる。透明基板としては、通常 '表面プラズモン共鳴装置用に用いられるものであればレ、かなるものであってもよ レ 一ザ一光に対して透明な材料からなるものとして一般的にはガラス等力 なるもので あり、'その厚さは 0. l〜5mm程度のものが用いられる。また金属薄膜の膜厚は 100 〜2000A程度が適当である。このような表面プラズモン共鳴装置用固基板として巿 販されているものも用レ、ることができる。 C末端修飾蛋白質の上記基板への固定化は 52 前述した方法により行うことができる。 . .
[0200] 本方法において標的分子を C末端修飾蛋白質へ接触甘しめる方法としては、両分 子が相互作用するに十分な程度に接触する方法であればレ、かなるものであってもよ いが、好ましくは標的分子を生化学的に通常使用される緩衝液に適当な濃度で溶解 した溶液に固定ィ匕きれた C末端蛋白質を接触させる方法を用いることができる。
[0201] これらの行程は市販の表面プラズモン共鳴装置、例えば BIAcore2000 (Pharmacia Biosensor社製)によってもよい。両分子を接触せしめた後、それ自体既知の表面ブラ ズモン共鳴装置を用いて、それぞれの反射光の相対強度の時間的変化を測定する ことにより、固定化 れた C末端修飾蛋白質と標的分子の相互作用が解析できる。
[0202] この方法において、同時に多数の解析を行う方法としては、例えば上記表面プラズ モン共鳴装置に用いられる基板に、複数の C末端修飾蛋白質を番地付けして固定 化するか、又は 1種類の固定化された c末端修飾蛋白質に複数種の標的分子を接 触させる方法等が用レ、られる。
[0203] (7)固相酵素免疫検定法
固相酵素免疫検定法(Enzyme Linked Immunosorbent Assay (ELISA): Crowther, J.R., Methods in Molecular Biology, 42 (1995))は、固相上に固定化した抗原に対し 、抗体を含む溶液を接触せしめ、両分子の相互作用(抗原抗体反応)により、固定化, された抗原上にとどまった抗体をこれと特異的に結合する修飾分子 (¾G等)から発 .せられる蛍光、又は修飾分子を基質とする色素から発せられる信号を、市販の検出 器 (ELISAリーダー)を用レヽて測定又は解析する方法である。
[0204] この方法を用いて蛋白質一標的分子間相互作用の測定又は解析を'行う場合、抗 原となる C末端修飾蛋白質は上記した方法により固定ィ匕されてレ、ることが必要である 。また抗体となる標的分子は上記した修飾物質により修飾されてレ、ることが必要であ る。
[0205]· 抗原となる C末端修飾蛋白質を固定ィ匕するための基板としては、通常 ELISAに用 レ、られるプラスチック製のマイクロプレート等も用いることができる。
[0206] 本方法において抗体となる修飾標的分子を固相分子へ接触せしめる方法としては 、両分子が相互作用するに十分な程度に接触する方法であればいかなるものであつ 53 てもよレ、が、好ましくは修飾標的分子を生化学的に通常使用される緩衝液に適当な 濃度で溶解した溶液を作成し、これをマイクロプレートに注入する方法が好ましレ、。
[0207] 両分子を接触せしめた後、好ましくは過剰に存在する固定ィヒ分子に結合していな レ、修飾分子を同緩衝液等により洗浄する工程を行い、固相上にとどまった修飾分子 力 発せられる蛍光を、市販の ELISAリーダー等を用いて測定又は解析することに より、固定化された抗原分子と相互作用する分子を同定することができる。
[0208] この方法において、同時に多数の解析を行う方法としては、例えば上記マイクロプ レートの各穴にそれぞれ異なる複数の修飾標的分子を固定化する方法が用いられる
[0209] 上記のそれぞれの方法により測定され C末端修飾蛋白質との間に相互作用が認め られた標的分子は、該分子の一次構造が未知の場合、それ自体既知の適当な方法 . により、その一次構造を解析することができる。具体的には、相互作甩を認め^れた' 標的分子が蛋白質の場合、アミノ酸分析装置等によりアミノ酸配列を解析し、一次構 造を特定す,ることができる。また、標的分子が核酸の場合には、塩基配列決定方法 により、オート DNAシーケンサーなどを用いれば塩基配列を決定することができる。
[0210] さらに、本発明のマップは、構造解析と機能解析のリンクによる創薬への応用が期 ■待できる。図 3に示したように、機能エレメントが抽出された蛋白質について構造解析 を行えば、構造解析と機能解析のリンクが可能となる。これまでの相互作用マップで は、相互作用している部位 配列までは知りようがな力つた力 機能エレメント抽出に よるマップでは、相互作用している特定の配列とその部分の構造を比較することが可 能となり、阻害剤などの創薬のためのミューテーシヨン実験などが可能となる。
[0211] < 2>本発明の作成方法を実現するためのソフトウェアと装置
本発明の作成方法は、遺伝子および Z又は蛋白質の機能エレメントに基づく相互 関係のデータを記憶する記憶手段、ならびに、記憶手段から読み出された相互関係 のデータに基づき遺伝子および/又は蛋白質の間の相互関係を示すマップを描画 する手段を備える装置により実施することができる。
[0212] 本発明の装置の構成の例を図 20に示す。記憶手段 1は、機能エレメントに基づく 相互関係のデータ 2を記憶する。描画手段 3は記憶手段 1から相互関係のデータを 54 読み出して、ネットワーク 'マップを描画する。 ' '
[0213] 本発明の装置は、上記のような手段としてコンピューターを機能させるためのプログ ラムを実装したコンピュータ一により構^することができる。
[0214] 本発明の装置は、さらに、相互関係のデータを入力又は修正するための入力手段 や、描画されたマップを装置から出力する出力手段を備えていてもよ)/、。
描画手段は、描画の様式を選択できる機能を有することが好ましい。例えば、ユー ザ一の選択により、選択した遺伝子および/又は蛋白質の機能エレメントに関連す る相互関係あるいは選択した相互関係の種類のみを示す機能を有することが好まし レ、。これにより、また、多数の遺伝子おょぴ Z又は蛋白質のマップでは、それらの相 互関係を全て表示すると判別不能になってしまうことを防ぐことができる。 .
[0215] 本発明の装置は、必要により、機能エレメントの決定手段をさらに有していてもよい 。このよう 装置およびそのためのソフトウェアの例としては、たとえば、図 9のフロー を実現するようなソフトウェアと装置などが考えられる。
[0216] 本発明のプログラムを記録したコンピューター読み取り可能な記録媒体も提供され る。記録媒体としては、フレキシブルディスク、 CD-ROM, DVD— ROMなどが挙 . げられる。
[0217] 以下、本発明の相互作用のある遺伝子や蛋白質の機能エレメント抽出による機能 エレメント間の結合によるネットワーク 'マップとその作図方法、およぴ機^エレメント が抽出され 蛋白質とその抽出方法について具体的に記するが、下記の実施例は 本発明についての具体的認識を得る一助とみなすべきものであり、本発明の範囲は 下記の実施例により何ら限定されるものでない。
実施例 1
[0218] ベイトを c - Fos蛋白質として、プレイをマウス脳の cDNAライブラリ一として、 IWの共 翻訳セレクション/スクリーニングを行い (図 7)、その結果、 C- Fos蛋白質と複合体を形 成しうる c-Jun蛋白質をコードする遺伝子の核酸配列 (配列番号:!〜 15)およびァミノ 酸配列 (配列番号 16〜31)を得た。また、それらの配列をァライメントすることで、 c - Junの機能エレメントとして、核酸配列 (配列番号 31〜33)およびアミノ酸配列 (配列 番号 34〜36)を得た。 55
[0219] ベイト c-Fos蛋白質の作成方法は以下の通りであった。 pCMV- FosCBPzzベクタ一( 配列番号 37)から、 TaKaRa Ex Taq (宝酒造)を用いて、 PCR (プライマー
5'SP6(029)T7- FosCBPzz (配列番号 38)と 3'FosCBPzz (配列番号 39)、 PCRプログラム CYCB 1 (表 1参照))によつて DNAテンプレートを準備した。 DNAテンプレートを
RiboMAX™ Large Scale RNA Production Systems(Promega)を用いて転写 (37°C, 2h) し、ベイト c-Fos蛋白質の mRNAテンプレートを準備した。共存させるベイト DNAは、 , Fo's/Junの結合配列を含む DNA- Fos/Jun (配列番号 40)をテンプレートとし、 PCR (プ ライマ 5'DNA (配列番号 41)と 3'DNA (配列番号 42)、 PCRプログラム V-2(表 1参照》 によって準備した。
[0220] プレイのマウス脳 cDNAライブラリーの作成方法ほ以下の通りであった。図 10に従つ て IWランダムライブラリーを作成した。 RNAライブラリ一として、市販のマウス脳 (polyA+) RNAライブラリー (組織抽出 RNAライブラリーを oligo dTカラムで精製したもの ; clontech)を購入した。アダプター設計は、対応付け 子の形成に適した 5'UTR配列 (プロモーター SP6+ェンノヽンサ一 029又は 0')をライブラリーに、 IW形成に必要な配 列として付加するための設計を行った。マウス脳 (polyA+) RNAライブラリーには、ェン ハンサー 029をもつアダプターを使用した。ェンハンサー 029用のアダプターの主鎖 (配列番号 43又は 44)と副鎖 (gaattcgc又は ggaattcg)は、各々 TEバ、;ファー (10 m Tris-Cl, pH 8.0, 1 mM EDTA)に溶解して ΙΟΟ μ Mとし、主鎖と副鎖をそれぞれ 10 μ 1 ずつ等モルで混合する。 90°Cで 2分間加熱し、 70°Cで 5分加熱し、 60°Cのウォーター バスにセ トしてバスのヒーターを切ってゆっくりと 60°Cから室温まで下げた。 5 / 1ず つに分注して- 20°Cに保存した。次に、マウス脳 (polyA+) RNAライブラリーを一本鎖 DNAに逆転写した (図 10, 1)。マウス脳 (PQlyA+) RNAライブラリー (1.4 pmole/0.5 μ g)を 0.5 μ g、 3'ランダムプライマー (配列番号 45)を 2 pmolと DEPC水とをカ卩えて 12.0 μ 1とし 、 70°Cで 10 min加熱し、氷上で 1分間冷却した。これを用いて、 SuperScriptll RT (Superscript Double Strand cDNA Synthesis Kit; Invitrogen)で 45°Cで. lh逆転写反応 を行った。次に、逆転写反応で合成した一本鎖 DNAを全量用いて、 E.coli DNAリガ ーゼ、 E.coliポリメラーゼ I、および E.coli RNase H (Superscript Double Strand cDNA Synthesis Kit; Invi ogen)で 16°Cで 2h反応じ、さらに T4 DNAポリメラーゼで 16°Cで 56
5minで末端を平滑ィ匕し、二本鎖 DNAを合成した (図 10, 11)。 ·次に、この二本鎖 DNAの 5'末端カリン酸化されていることを利用して、先に準備したアダプターを用いてライゲ ーシヨンした (図 10, 111)。合成した二本鎖 DNAライブラリーをエタノール沈殿し、 4 / 1 の DEPC水に溶解した。これに、 100 Mの準備したアダプターを 1.0 μ ΐ添カ卩し、 50 μ 1 ligation Wgh(TOY。BO)をカロえて、 16。Cでオーバーナイトで反応させ、精製 (DNA purification kit; QIAGEN)した後 50 μ 1とした。次に、 PCR(EX Taq Hot Start Version) TaKaRa)を行った (図 10, IV)。 50 1のライゲーシヨンした二本鎖 DNAライブラリーから 2 1をテンプレートとして、 IWに必要な特定配列 (029)を持つ 5'PCRプライマー (配列 番号 41)と 3'PCRプライマー (配列番号 42)を用いて、 IW cDNAライブラリーを作成し た。 PCRの条件は、全量 100 z l、 22サイクル (94°Cで 30秒、 60°Cで 30秒、 72°Cで 90秒 を 1サイクルとし、最後の伸長反応は、 72°Cで 180秒)とした。.
これらべイト c-Fos蛋白質の mRNAテンプレート、プレイのマウス脳 cDNAライブラリー 、そして共存させるベイト DNAを小麦の無細胞翻訳系 (Wheat Germ.
Extract(Promega》を用いて 50 μ 1で共翻 I (26°C, 60 min)させた。. 50 のサンプルに 対し、 IgG結合バッファー (10 mM Tris-Cl, pH 8.0, 150 mM NaCl, 0.1% NP40) 50 μ 1 を添加し計 100 (共翻訳サンプル)とした。その後、 IgGァガロース (Sigma)を IgG結合 ノッファーで 2回洗浄し、これに共翻訳サンプル (100 μ 1)を加え、 4°Cで 2時間回転攪 拌した。結合バッファーで 3回、 TEV切断バッファー(10 mM Tris-Cl, pH 8.0, 150 mM NaCl, 0.1% NP40, 0.5 mM EDTA, 1 mM DTT)で 1回洗浄し、 - IgGァガロースに結 合したベイト/プレイ複合体を TEVプロテアーゼ (GIBCO- BRL)で切断した (16°C、 2時 間)。さらに、上清 90 1を 300 μ 1カルモジュリン結合バッファーと 0.3 μ 1 1 M CaCI2、 さらに、 500 1カルモジュリン結合バッファーで 2回洗浄した 50 μ 1カルモジュリンビー ズを加えて 4°Cで 1時間回転攪拌した。遠心後、 1000 μ ΐカルモジュリン結合バッファ 一で 3回洗浄した。 50 μ ΐカルモジュリン溶出バッファーを加えて、氷上で 1〜2分放置 し、遠心後、 50 μ ΐを回収した。回収した溶液をテンプレートとして、 RT- PCR(〇ne step RT-PCR kit (QIAGEN),プライマー;配列番号 46と 47、プログラム; RT - QH30' (表 1 参照))を行った。このスクリーニング/セレクション操作を 3ラウンド繰り返した後のライ ブラリーをクローニングしてシーケンスすることで、 c - Fos蛋白質と複合体を形成しうる 57 c - JUIJ蛋白質をコードする遺伝子の核酸配列 (配列番号 1〜 15)およびアミノ酸配列( 配列番号 16〜31)を得た。この結果は、ェンハンサー 029用のアダプターの主鎖とし て配列番号 43を用いて作成したライプラリーおよび配列番号 44を用いて作成したラ ,イブラリーのいずれでも同様であった。また、それらの配列を、 ClustalXを用いてァラ ィメントしクラスタリングすることで、 C- Junの機能エレメントとして、核酸配列 (配列番号 31〜33)およびアミノ酸配列 (配列番号 34〜36)を得た (図 16)。
[0222] 図 16のように、ライブラリーから得られた c - Jun遺伝子の核酸配列をァライメントしク ラスタリングすると、 Jun(El+E2+E3) Jun(E2)、 Jun(E2+E3)に分けることが出来る。この こと力 、 C- Junから 3つの機能エレメント 卜 E3)を抽出し、核酸配列番号 31〜33お . よびアミノ酸配列番号 34〜36を得た。図 17に機能エレメント (E1-E3)の核酸配列とァ ミノ酸配列を記した。 ' '
[0223] 3つの機能エレメントを抽出された C- Jun (図 18)は、 c- Junの構造解析 (Yurii
Chinenovl and Tom K Kerppola, Oncogene (2001) 20, 2438 - 2452)と付き合わせるこ とで、 E1は DNA結合領域の一部に当たり、 E2はロイシンジッパー 'モチーフと DNA結 合領域の一部に当たり、 E3はその先の C末端領域に当たることが.わかる。このような 情報が得られたことで、蛋白質結合領域や DNA結合領域を制御するためのミューテ ーシヨン実験などを行うことが出来る。 :
さらに、,これら抽出した 3つの機能エレメントを用いて c - Jun遺伝子を中心にマツピン グすることによって、これまで区別できな力 たネ トワークが 3つに区別可能となり、 3通りのネットワーク 'パターン、すなわち C- Jun機能のパターンは少なくとも 3つあるこ とが読みとれる(図 19)。
[0224] [表 1] " 58 表 1 PGRプログラム プログラム名 : CYCB1
反応条件:
95°C 1m i n
15サイクル
Figure imgf000062_0001
4°C ポーズ プログラム名: V-2
反応条件:
35サイクル
Figure imgf000062_0002
プログラム名: RT-QH30'
反応条件:
60°C 30m i n
95°C 〗5mi n
(1 -2回目: 32サイクル, 3回目: 30サイクル)
Figure imgf000062_0003
72°C 〗0mi n 産業上の利用の可能性
本努明は、遺伝子や蛋白質の機能エレメントを抽出し、それら機能エレメントを抽出 した遺伝子や蛋白質のデータベースを用いた機能エレメント間の結合によるネットヮ ' ーク.マップを提供する。そのことによって、遺伝子間や蛋白質間のネットワークの詳 細な解析や複合体の予想が可能となり、構造解析と合わせて解析することにより、創 薬支援システムへ応用可能なマップを提供することが可能になる。

Claims

請求の範囲
[I] 遺伝子および Z又は蛋白質の相互関係のデータに基づき遺伝子および Z又は蛋白 質の相互関係を示すマップの作成方法であって、相互関係が遺伝子および Z又は 蛋白質の機能エレメントに基づく相互関係であることを特徴とする方法。
[2] 機能エレメントが、遺伝子および Z又は蛋白質の相互作用解析によりランダムライブ ラリー力 抽出された配列に基づき決定されたものである請求項 1に記載の方法。
[3] ランダムライブラリーが核酸配列のランダムライブラリーである請求項 2記載の方法。
[4] ランダムライブラリーが対応付け分子のランダムライブラリーである請求項 2記載の方 法。
[5] 相互作用解析が、 in vitroウィルスを用いる相互作用解析である請求項 2— 4の 、ず れか 1項に記載の方法。
[6] 遺伝子および Z又は蛋白質の間の相互関係のデータを記憶する記憶手段、ならび に、記憶手段から読み出された相互関係のデータに基づき遺伝子および Z又は蛋 白質の間の相互関係を示すマップを描画する手段としてコンピューターを機能させる ためのプログラムであって、遺伝子および Z又は蛋白質の相互関係が、遺伝子およ び Z又は蛋白質の機能エレメントに基づく相互関係であることを特徴とするプロダラ ム。
[7] 機能エレメントが、遺伝子および Z又は蛋白質の相互作用解析によりランダムライブ ラリー力 抽出された配列に基づき決定されたものである請求項 6に記載のプロダラ ム。
[8] ランダムライブラリーが核酸配列のランダムライブラリーである請求項 7記載のプログ ラム。
[9] ランダムライブラリーが対応付け分子のランダムライブラリーである請求項 7記載のプ ログラム。
[10] 相互作用解析が、 in vitroウィルスを用いる相互作用解析である請求項 7— 9の 、ず れか 1項に記載のプログラム。
[II] 請求項 6— 10のいずれか 1項に記載されたプログラムを記録したコンピュータ一読み 取り可能な記録媒体。
[12] 遺伝子および Z又は蛋白質の間の相互関係のデータを記憶する記憶手段、ならび に、記憶手段から読み出された相互関係のデータに基づき遺伝子および Z又は蛋 白質の間の相互関係を示すマップを描画する手段を備える、遺伝子および Z又は 蛋白質の相互関係を示すマップの作成装置であって、遺伝子および Z又は蛋白質 の相互関係が、遺伝子および Z又は蛋白質の機能エレメントに基づく相互関係であ ることを特徴とする装置。
[13] 機能エレメントが、遺伝子および Z又は蛋白質の相互作用解析によりランダムライブ ラリー力も抽出された配列に基づき決定されたものである請求項 12に記載の装置。
[14] ランダムライブラリーが核酸配列のランダムライブラリーである請求項 12記載の装置。
[15] ランダムライブラリーが対応付け分子のランダムライブラリーである請求項 12記載の 装置。
[16] 相互作用解析が、 in vitroウィルスを用いる相互作用解析である請求項 13— 15のい ずれか 1項に記載の装置。
[17] in vitroウィルスを用いる相互作用解析により、相互作用する遺伝子又は蛋白質のラ イブラリーを得、そのライブラリーの遺伝子又は蛋白質の核酸配列又はアミノ酸配列 力 抽出された配列に基づき機能エレメントを決定することを含む、機能エレメントの 決定方法。
PCT/JP2004/017362 2003-11-20 2004-11-22 遺伝子および/又は蛋白質のデータベースを用いた相互作用マップの作成方法、ならびに、それを実現するためのソフトウエアおよび装置 WO2005050518A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005515680A JPWO2005050518A1 (ja) 2003-11-20 2004-11-22 遺伝子および/又は蛋白質のデータベースを用いた相互作用マップの作成方法、ならびに、それを実現するためのソフトウエアおよび装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003391368 2003-11-20
JP2003-391368 2003-11-20

Publications (1)

Publication Number Publication Date
WO2005050518A1 true WO2005050518A1 (ja) 2005-06-02

Family

ID=34616376

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2004/017362 WO2005050518A1 (ja) 2003-11-20 2004-11-22 遺伝子および/又は蛋白質のデータベースを用いた相互作用マップの作成方法、ならびに、それを実現するためのソフトウエアおよび装置

Country Status (2)

Country Link
JP (1) JPWO2005050518A1 (ja)
WO (1) WO2005050518A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009044459A1 (ja) * 2007-10-02 2009-04-09 Fujitsu Limited 分析支援プログラム、分析支援装置、および分析支援方法
CN106548005A (zh) * 2016-09-16 2017-03-29 天津大学 网络交互的调节效应定量方法
JPWO2017209280A1 (ja) * 2016-06-03 2019-04-11 国立大学法人 鹿児島大学 酵母と断片化cDNAライブラリーを用いたタンパク質の新しい同定法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105678108A (zh) * 2016-01-11 2016-06-15 天津师范大学 一种全局比对的蛋白互作网络融合方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
ITO T. ET AL.: "Systematic analysis of saccharomyces cerevisiae genome: Gene network and protein-protein interaction network.", PROTEIN, NUCLEIC ACID AND ENZYME, vol. 46, no. 16, 10 December 2001 (2001-12-10), pages 2407 - 2413, XP002996995 *
MIYAMOTO E. ET AL.: "Application of in vitro virus and C-terminal protein labeling to the post-genome research.", PROTEIN, NUCLEIC ACID AND ENZYME, vol. 48, no. 11, 10 August 2003 (2003-08-10), pages 1474 - 1480, XP002996994 *
MIYAMOTO-SATO E. WT AL.: "Highly stable and efficient mRNA templates for mRNA-protein", NUCLEIC ACID RESEARCH, vol. 31, no. 15, 1 August 2003 (2003-08-01), pages E78-1 - E78-9, XP002985730 *
TAKASHIMA H. ET AL.: "Comprehensive protein-protein interaction analysis (proteome analysis) using "in vitro virus" and its applications for drug target exploration.", DRUG DELIVERY SYSTEM, vol. 18, no. 6, 10 November 2003 (2003-11-10), pages 519 - 527, XP002997104 *
VERNIKOS G.S. ET AL.: "GenoViTo: visualizing gene-product functional and structural features in genomic datasets", BMC BIO INFORMATICS, vol. 4, no. 1, 31 October 2003 (2003-10-31), pages 1 - 15, XP002983680 *
VON MERING C. ET AL.: "STRING: a database of predicted functional associations between proteins", NUCLEIC ACID RESEARCH, vol. 31, no. 1, 1 January 2003 (2003-01-01), pages 258 - 261, XP002983681 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009044459A1 (ja) * 2007-10-02 2009-04-09 Fujitsu Limited 分析支援プログラム、分析支援装置、および分析支援方法
US8244480B2 (en) 2007-10-02 2012-08-14 Fujitsu Limited Computer product, analysis support apparatus, and analysis support method
JP5099142B2 (ja) * 2007-10-02 2012-12-12 富士通株式会社 分析支援プログラム、分析支援装置、および分析支援方法
JPWO2017209280A1 (ja) * 2016-06-03 2019-04-11 国立大学法人 鹿児島大学 酵母と断片化cDNAライブラリーを用いたタンパク質の新しい同定法
JP6998056B2 (ja) 2016-06-03 2022-01-18 国立大学法人 鹿児島大学 酵母と断片化cDNAライブラリーを用いたタンパク質の新しい同定法
CN106548005A (zh) * 2016-09-16 2017-03-29 天津大学 网络交互的调节效应定量方法
CN106548005B (zh) * 2016-09-16 2019-04-05 天津大学 网络交互的调节效应定量方法

Also Published As

Publication number Publication date
JPWO2005050518A1 (ja) 2007-12-06

Similar Documents

Publication Publication Date Title
US11970693B2 (en) Methods of selecting binding reagents
Twyman Principles of proteomics
US11993865B2 (en) Selection of affinity reagents
US9110054B2 (en) Detectable nucleic acid tag
Kawahashi et al. In vitro protein microarrays for detecting protein‐protein interactions: Application of a new method for fluorescence labeling of proteins
JP2005507650A (ja) 新規融合タンパク質及び分子結合に関するアッセイ
Gold et al. Engineering A-kinase anchoring protein (AKAP)-selective regulatory subunits of protein kinase A (PKA) through structure-based phage selection
KR20220002978A (ko) 합성 단백질 안정성을 증가시키기 위한 시스템 및 방법
Bradbury et al. Antibodies in proteomics II: screening, high-throughput characterization and downstream applications
US20160097050A1 (en) Devices and methods for display of encoded peptides, polypeptides, and proteins on dna
Zhang et al. Ribosome-bound Get4/5 facilitates the capture of tail-anchored proteins by Sgt2 in yeast
WO2002046395A1 (fr) Proteine a c-terminaison modifiee et procede permettant d&#39;obtenir cette proteine, agent de modification et matrice de traduction necessaire a la production d&#39;une proteine a c-terminaison modifiee, et procede de detection de l&#39;interaction proteique avec l&#39;utilisation de ladite proteine
WO2005050518A1 (ja) 遺伝子および/又は蛋白質のデータベースを用いた相互作用マップの作成方法、ならびに、それを実現するためのソフトウエアおよび装置
Kunys et al. Specificity Profiling of Protein‐Binding Domains Using One‐Bead‐One‐Compound Peptide Libraries
JP5587528B2 (ja) c−Jun蛋白質と複合体を形成する蛋白質、及び、それをコードする核酸、ならびに、それらの利用方法
JP3706942B2 (ja) 物質と蛋白質との間の相互作用の検出方法、物質と相互作用する蛋白質のスクリーニング方法、及び、物質とその物質と相互作用する蛋白質との複合体の形成方法
JP2002253240A (ja) 分子間の相互作用の分析方法
JPWO2003048363A1 (ja) 対応付け分子とc末端ラベル化蛋白質の複合体および対応付け分子の複合体、ならびにそれらの複合体を利用した蛋白質間相互作用解析方法
US7670787B2 (en) Protein forming complex with c-Fos protein, nucleic acid encoding the same and method of using the same
Feilner et al. Proteomic studies using microarrays
JP4441623B2 (ja) 対応付け分子およびその構成要素のライブラリーの製造方法および利用方法
JP4747292B2 (ja) 翻訳テンプレートおよびそのライブラリー、それらから合成される蛋白質および蛋白質のライブラリー、ならびにそれらを構成する要素、ならびにそれらの製造法および利用方法
JP4761202B2 (ja) 切断可能な対応付け分子およびそれを用いるスクリーニング方法
JPWO2005001086A1 (ja) 固定化mRNA−ピューロマイシン連結体及びその用途
JP2002257832A (ja) タンパク質のラベル化試薬

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LU MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2005515680

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE

WWW Wipo information: withdrawn in national office

Country of ref document: DE

122 Ep: pct application non-entry in european phase