JP2006141348A - Method for selecting and acquiring domain polypeptide interacting with target substance, method for identifying structural motif sequence, and method for designing molecule - Google Patents

Method for selecting and acquiring domain polypeptide interacting with target substance, method for identifying structural motif sequence, and method for designing molecule Download PDF

Info

Publication number
JP2006141348A
JP2006141348A JP2004339301A JP2004339301A JP2006141348A JP 2006141348 A JP2006141348 A JP 2006141348A JP 2004339301 A JP2004339301 A JP 2004339301A JP 2004339301 A JP2004339301 A JP 2004339301A JP 2006141348 A JP2006141348 A JP 2006141348A
Authority
JP
Japan
Prior art keywords
nucleic acid
protein
target substance
sequence
amino acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004339301A
Other languages
Japanese (ja)
Inventor
Yoshikazu Shiratori
美和 白鳥
Teruaki Kobayashi
輝章 小林
Toru Sasaki
亨 佐々木
Daichi Naka
大地 仲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Molecuence Corp
Original Assignee
Molecuence Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Molecuence Corp filed Critical Molecuence Corp
Priority to JP2004339301A priority Critical patent/JP2006141348A/en
Publication of JP2006141348A publication Critical patent/JP2006141348A/en
Pending legal-status Critical Current

Links

Landscapes

  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a method for selecting and acquiring a domain polypeptide interacting with a target substance, to provide a method for identifying and acquiring a structural motif, and to provide a method for designing a molecule interacting with the target substance. <P>SOLUTION: A pharmaceutical compound interacting with the target substance is designed as follows: the domain polypeptide which is necessary for interacting with the target substance is cut out of a protein and acquired, by utilizing a cell-free protein displaying procedure, in a method for analyzing a protein or a polypeptide interacting with the target protein; the structural motif comprising an amino acid sequence which is necessary and sufficient for interacting with the target substance is identified, by analyzing an amino acid sequence of the acquired domain polypeptide; and the pharmaceutical compound is designed, by estimating a combining space based on a three-dimensional structure of a complex of the structural motif with the target substance. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は、標的物質と相互作用するドメインポリペプチドの選抜取得方法、および該ドメインポリペプチドのアミノ酸配列を用いた構造モチーフの同定方法、ならびに該構造モチーフを用いた標的物質と相互作用する化合物の分子設計方法等に関する。   The present invention relates to a method for selecting and obtaining a domain polypeptide that interacts with a target substance, a method for identifying a structural motif using the amino acid sequence of the domain polypeptide, and a compound that interacts with a target substance using the structural motif. The present invention relates to a molecular design method.

生体の構造と機能の最も基本的かつ不可欠な担い手であるタンパク質は、一般的に数十から数百のアミノ酸から成るいくつかのドメインから構成されている。ドメインとはタンパク質の構造と機能をつかさどる最小単位であり、特にヒトや齧歯類などの進化の時間の中で比較的新しいタンパク質は、様々なドメインを有していることが知られている。タンパク質はこれらのドメインを介して他の生体分子と相互作用しており、これにより細胞レベルでは遺伝子の発現制御、細胞骨格の形成、さらには細胞内のシグナル伝達などに深く関与している。またこの相互作用は個体レベルにおいては生命活動の維持に必須であるとともに、一方では疾患を引き起こす原因となっている場合もある。   Proteins, which are the most fundamental and indispensable players in the structure and function of living organisms, are generally composed of several domains consisting of tens to hundreds of amino acids. A domain is the smallest unit that controls the structure and function of a protein. In particular, relatively new proteins such as humans and rodents are known to have various domains. Proteins interact with other biomolecules through these domains, and are thus deeply involved in the regulation of gene expression, cytoskeleton formation, and intracellular signal transduction at the cellular level. In addition, this interaction is essential for the maintenance of life activity at the individual level, and on the other hand, it may cause disease.

しかしながらこのドメインを見出す理論的および実験的手法については、蓄積された既存の情報との比較に基づく要素が極めて大きい。例えばタンパク質が有するドメインを推定する方法の一つとして、個別の実験情報を統合したタンパク質のデータベースを対象に、コンピューターを利用したアミノ酸配列の相同性に基づく解析法が知られているにすぎない。この方法ではコンピューターによる相同性解析後、推定したドメインが実際に機能を有しているか否かを実験的に立証する必要があった。このためタンパク質のドメインに相当するアミノ酸配列領域を同定する有効な手法の開発が大きな課題となっていた。   However, the theoretical and experimental methods of finding this domain are extremely large based on comparison with the existing information accumulated. For example, as a method for estimating a domain possessed by a protein, only an analysis method based on amino acid sequence homology using a computer is known for a protein database obtained by integrating individual experimental information. In this method, after homology analysis by a computer, it was necessary to experimentally verify whether or not the estimated domain actually has a function. For this reason, the development of an effective method for identifying an amino acid sequence region corresponding to a protein domain has been a major issue.

一方、タンパク質の相互作用を解析する技術として、ファージ・ディスプレー法、リボソームディスプレー法、mRNAディスプレー法などが近年に入って実用化されている。これらの技術は解析対象となる物質に対してタンパク質とその遺伝子の複合体を添加し、相互作用する複合体を回収した後、その遺伝子部分の配列を解析することにより、相互作用するタンパク質を同定する方法である。また酵母Two-Hybridシステムは、酵母の細胞内転写システムを利用したタンパク質相互作用の解析方法であり、ハイスループットな解析手段としてよく知られている。さらに解析対象となる物質をアフィニティークロマトグラフィーなどで濃縮した後、マススペクロメトリーにより相互作用するタンパク質を同定する方法も開発されている。しかしながらこれらの方法で得られる情報は、解析対象となる物質に対して相互作用するタンパク質の断片にすぎず、その断片中に相互作用に必要な最小単位であるドメインが存在するか否かは、既存のアミノ酸配列データベースを用いた相同性解析に依存していた。また、例えドメインを含んでいたとしても、上記方法により得られるポリペプチドには余分なアミノ酸配列が多数結合している(図20(A))ため、これらを除去してドメインのみを取得することは非常に煩雑な操作が必要であった。   On the other hand, phage display methods, ribosome display methods, mRNA display methods, and the like have been put into practical use in recent years as techniques for analyzing protein interactions. These technologies add a protein and its gene complex to the substance to be analyzed, collect the interacting complex, and then analyze the sequence of the gene part to identify the interacting protein It is a method to do. The yeast Two-Hybrid system is a method for analyzing protein interactions using the yeast intracellular transcription system, and is well known as a high-throughput analysis means. Furthermore, a method for identifying a protein that interacts by mass spectrometry after concentrating a substance to be analyzed by affinity chromatography or the like has been developed. However, the information obtained by these methods is only a fragment of a protein that interacts with the substance to be analyzed, and whether or not a domain that is the minimum unit necessary for interaction exists in the fragment. Relied on homology analysis using existing amino acid sequence databases. In addition, even if a domain is included, the polypeptide obtained by the above method has many extra amino acid sequences bound to it (FIG. 20 (A)). Requires a very complicated operation.

また、物質とタンパク質の相互作用を解析する技術であるIVV法(特許文献1および非特許文献1等を参照)により標的物質に相互作用するタンパク質の同定も試みられていた。この方法によれば、標的物質とタンパク質を接触させて相互作用する分子を取得する操作を繰り返すことにより、標的物質と相互作用することがわかっているタンパク質の一部のポリペプチドが取得される(非特許文献2等を参照)。このポリペプチドは、上記ドメインを含んではいたが、やはり余分なアミノ酸が結合しており(図20(A))、標的物質との相互作用に必要最小単位を取得するには同様に煩雑な操作が必要であった。   Moreover, identification of the protein which interacts with a target substance by the IVV method (refer patent document 1 and nonpatent literature 1 etc.) which is the technique which analyzes the interaction of a substance and protein was also tried. According to this method, by repeating the operation of obtaining a molecule that interacts by bringing the target substance into contact with the protein, a partial polypeptide of the protein that is known to interact with the target substance is obtained ( (See Non-Patent Document 2, etc.). This polypeptide contains the above-mentioned domain, but still has an extra amino acid linked (FIG. 20 (A)), and it is similarly complicated to obtain the minimum unit necessary for interaction with the target substance. Was necessary.

一方、特定の疾患に関連することが知られている創薬の標的となるタンパク質に関し、該タンパク質の相互作用をいかにして抑制し、その活性を制御する物質が該疾患の治療薬として開発されることが多い。タンパク質はその相互作用に関与するドメインの界面にホットスポットと呼ばれる部位を有していることが知られており(非特許文献3、図20(A))、創薬開発の観点からはこのホットスポットに作用し、タンパク質の相互作用を抑制する医薬化合物の開発が望まれている。一般的にタンパク質の相互作用に関与するホットスポット部位に存在するアミノ酸およびその側鎖は立体構造的に自由度が高いため、単一のタンパク質の結晶構造解析からは、その空間位置を正確に同定することは困難であることが知られている(非特許文献3)。このような意味でも、タンパク質の相互作用に必要最小単位であるドメイン(図20(B))の簡便な同定あるいは取得方法の提供が望まれていた。
WO98/16636号公報 特願2003-315385号明細書 蛋白質核酸化学Vol.46,No2(2001)138-146 J. of Biological Chemistry, vol.276, 24, 20898-20906(2001) Nature Reviews 301-317Vol.3(2004)
On the other hand, regarding proteins that are targets of drug discovery that are known to be related to specific diseases, substances that suppress the interaction of the proteins and control their activities have been developed as therapeutic agents for the diseases. Often. It is known that a protein has a site called a hot spot at the interface of domains involved in the interaction (Non-patent Document 3, FIG. 20 (A)). Development of pharmaceutical compounds that act on spots and suppress protein interactions is desired. In general, amino acids and their side chains that exist in hot spot sites involved in protein interactions have a high degree of freedom in three-dimensional structure. It is known that it is difficult to do (Non-patent Document 3). In this sense, it has been desired to provide a simple identification or acquisition method for a domain (FIG. 20B) that is a minimum unit necessary for protein interaction.
WO98 / 16636 Publication Japanese Patent Application No. 2003-315385 Specification Protein Nucleic Acid Chemistry Vol.46, No2 (2001) 138-146 J. of Biological Chemistry, vol.276, 24, 20898-20906 (2001) Nature Reviews 301-317Vol.3 (2004)

本発明は、標的物質と相互作用するタンパク質またはポリペプチドの解析方法において、無細胞タンパク質ディスプレー法を利用することにより、標的物質との相互作用に必要なドメインポリペプチドをタンパク質から切り出して取得する方法、および該方法により得られたドメインポリペプチドのアミノ酸配列を解析することにより、標的物質との相互作用に必要十分なアミノ酸配列からなる構造モチーフを同定する方法、ならびに該方法により同定された構造モチーフを利用して標的物質に相互作用する医薬化合物を設計する方法等を提供するためになされたものである。   The present invention relates to a method for analyzing a protein or polypeptide that interacts with a target substance, and using a cell-free protein display method to obtain a domain polypeptide necessary for interaction with the target substance by cutting it out from the protein. And a method for identifying a structural motif comprising an amino acid sequence necessary and sufficient for interaction with a target substance by analyzing the amino acid sequence of the domain polypeptide obtained by the method, and the structural motif identified by the method The present invention has been made in order to provide a method for designing a pharmaceutical compound that interacts with a target substance using the above.

本発明者らは、上記課題を達成するために鋭意検討を進めた結果、(1)mRNAライブラリーの3’末端にピューロマイシンを含む核酸構築物を結合させて、これを鋳型として無細胞タンパク質合成系にて翻訳して、上記核酸構築物のピューロマイシンを介し、タンパク質とそれをコードするmRNAが共有結合したタンパク質−核酸連結体を作製し、(2)このタンパク質−核酸連結体を標的物質と接触させ、標的物質と特異的に結合するタンパク質部を有する上記連結体を選択し、(3)選択されたタンパク質−核酸連結体についているmRNAをポリメラーゼチェインリアクション(PCR)で増幅し、(4)増幅されたDNAを鋳型の一部として上記タンパク質−核酸連結体を作製し、(2)〜(4)の工程を行なうというサイクル(以下、これを「濃縮操作」と称することがある)を数回繰り返したところ、次第に取得されるmRNAライブラリーに含まれるmRNAの平均鎖長が短くなるとともに、同定されるタンパク質のアミノ酸鎖長も短くなり、かつ数個のクラスターを形成する現象を見出した。   As a result of intensive studies to achieve the above-mentioned problems, the present inventors have (1) bound a nucleic acid construct containing puromycin to the 3 ′ end of an mRNA library, and used this as a template for cell-free protein synthesis. The protein-nucleic acid conjugate in which the protein and the mRNA encoding it are covalently bound is produced through puromycin of the nucleic acid construct, and (2) the protein-nucleic acid conjugate is brought into contact with the target substance. And selecting the above-mentioned conjugate having a protein part that specifically binds to the target substance, (3) amplifying the mRNA attached to the selected protein-nucleic acid conjugate by polymerase chain reaction (PCR), and (4) amplification The above-mentioned protein-nucleic acid conjugate is prepared using the prepared DNA as a part of the template, and the steps (2) to (4) are performed (hereinafter referred to as “concentration operation”). Is repeated several times, the average chain length of mRNA contained in the mRNA library obtained gradually decreases, the amino acid chain length of the identified protein also shortens, and several We found the phenomenon of cluster formation.

そこで、糖尿病と関連するPPARγ2(Peroxisome Proliferation-activated receptor gamma 2)を標的物質として上記濃縮操作を繰り返し、相互作用するタンパク質のうち、クラスターを形成したポリペプチドのアミノ酸配列を解析した結果、これらのポリペプチドは共通配列を有する数十アミノ酸からなる部分ポリペプチドとして取得されており、これらがPPARγ2結合ドメインとほぼ一致することを見出した。さらに、該ポリペプチドのアミノ酸配列を類似のアミノ酸配列順に並べて解析(マルチプルアライメント解析)を行ない、共通するアミノ酸が出現する位置や頻度を求めることにより、標的物質と相互作用するに必要十分なアミノ酸配列である構造モチーフ配列を決定できることを見出した。本発明はこれらの知見に基づいて成し遂げられたものである。   Thus, the above enrichment operation was repeated using PPARγ2 (Peroxisome Proliferation-activated receptor gamma 2) associated with diabetes as a target substance, and as a result of analyzing the amino acid sequences of the polypeptides that formed clusters among the interacting proteins, The peptide was obtained as a partial polypeptide consisting of several tens of amino acids having a common sequence, and it was found that these substantially coincide with the PPARγ2 binding domain. Furthermore, the amino acid sequence of the polypeptide is arranged in the order of similar amino acid sequences and analyzed (multiple alignment analysis), and the amino acid sequence necessary and sufficient to interact with the target substance is obtained by determining the position and frequency at which common amino acids appear. It was found that a structural motif sequence can be determined. The present invention has been accomplished based on these findings.

すなわち本発明によれば、
(1)(i)タンパク質部とそれをコードする核酸部が、核酸部の3’末端に結合した核酸構築物を介して直接結合したタンパク質−核酸連結体群と標的物質とを接触させる工程、(ii)標的物質に特異的に結合した該タンパク質−核酸連結体を取得し、該連結体の核酸部を増幅し、これを鋳型の一部として用いて、タンパク質部とそれをコードする核酸部が、核酸部の3’末端に結合した核酸構築物を介して直接結合したタンパク質−核酸連結体群を調製する工程、(iii)上記(i)および(ii)の工程を、標的物質に特異的に結合したタンパク質−核酸連結体の核酸部が、ドメインポリペプチドをコードするクラスターを形成するまで繰り返す工程を含むことを特徴とする標的物質と相互作用するドメインポリペプチドの選抜取得方法、
(2)(i)タンパク質部とそれをコードする核酸部が、核酸部の3’末端に結合した核酸構築物を介して直接結合したタンパク質−核酸連結体群と標的物質とを接触させる工程、(ii)標的物質に特異的に結合した該タンパク質−核酸連結体を取得し、該連結体の核酸部を増幅し、これを鋳型の一部として用いて、タンパク質部とそれをコードする核酸部が、核酸部の3’末端に結合した核酸構築物を介して直接結合したタンパク質−核酸連結体群を調製する工程、(iii)上記(i)および(ii)の工程を、標的物質に特異的に結合したタンパク質−核酸連結体の核酸部がドメインポリペプチドをコードするクラスターを形成するまで繰り返す工程、(iv)工程(iii)でクラスターを形成した核酸を取得する工程を含むことを特徴とする標的物質と相互作用するドメインポリペプチドをコードする核酸の選抜取得方法、
(3)ドメインポリペプチドが、全長タンパク質の90%以下の長さのポリペプチドからなり、かつ標的物質との相互作用ドメインの130%以下の長さのポリペプチドであることを特徴とする上記(1)または(2)に記載の方法、
(4)(i)タンパク質部とそれをコードする核酸部が、核酸部の3’末端に結合した核酸構築物を介して直接結合したタンパク質−核酸連結体群と標的物質とを接触させる工程、(ii)標的物質に特異的に結合した該タンパク質−核酸連結体を取得し、該連結体の核酸部を増幅し、これを鋳型の一部として用いて、タンパク質部とそれをコードする核酸部が、核酸部の3’末端に結合した核酸構築物を介して直接結合したタンパク質−核酸連結体群を調製する工程、(iii)上記(i)および(ii)の工程を、標的物質に特異的に結合したタンパク質−核酸連結体の核酸部がドメインポリペプチドをコードするクラスターを形成するまで繰り返す工程、(iv)工程(iii)でクラスターを形成した核酸の塩基配列を解析する工程、(v)該塩基配列あるいはそれを翻訳したアミノ酸配列から存在頻度および/または出現頻度を指標として共通配列を選択する工程を含むことを特徴とする構造モチーフ配列の同定方法、
(5)上記(4)に記載の構造モチーフ配列の一部に変異を導入し、該変異構造モチーフを標的物質と接触させて相互作用を解析することを特徴とする変容した機能を有する構造モチーフの取得方法、
(6)(i)上記(1)または(3)で選抜されたドメインポリペプチド、あるいは上記(4)または(5)に記載の構造モチーフと標的物質との複合体を作製する工程、(ii)該複合体の立体構造解析を行い標的物質と該ポリペプチドまたは構造モチーフとの結合部位を特定する工程、(iii)同定された結合部位から標的物質の結合空間を予測して、該結合空間に合う化合物を設計する工程を含むことを特徴とする標的物質と相互作用する化合物の分子設計方法、
(7)標的物質が、疾病に関連するものであることを特徴とする上記(1)〜(6)のいずれか1項に記載の方法、
(8)(i)標的物質が疾病に関連するもので、上記(1)または(3)で選抜されたドメインポリペプチドまたは上記(4)または(5)に記載の構造モチーフと標的物質との複合体を作製する工程、(ii)該複合体の立体構造解析を行い標的物質と該ポリペプチドまたは構造モチーフとの結合部位を特定する工程、(iii)同定された結合部位から標的物質の結合空間を予測して、該結合空間に合う化合物を設計し、(iv)設計された化合物を合成する工程を含むことを特徴とする標的物質が関連する疾患の治療および/又は予防薬の製造方法、
が提供される。
That is, according to the present invention,
(1) (i) a step in which a protein-nucleic acid conjugate group in which a protein part and a nucleic acid part encoding the protein part are directly bound via a nucleic acid construct bound to the 3 ′ end of the nucleic acid part is brought into contact with the target substance; ii) Obtaining the protein-nucleic acid conjugate specifically bound to the target substance, amplifying the nucleic acid part of the conjugate, and using this as part of the template, the protein part and the nucleic acid part encoding the protein part A step of preparing a group of protein-nucleic acid conjugates directly bound via a nucleic acid construct bound to the 3 ′ end of the nucleic acid part, (iii) the steps (i) and (ii) above are carried out specifically for the target substance A method for selecting and obtaining a domain polypeptide that interacts with a target substance, comprising the step of repeating until the nucleic acid part of the bound protein-nucleic acid conjugate forms a cluster encoding the domain polypeptide,
(2) (i) a step of contacting a target substance with a protein-nucleic acid conjugate group in which a protein part and a nucleic acid part encoding the protein part are directly bound via a nucleic acid construct bound to the 3 ′ end of the nucleic acid part; ii) Obtaining the protein-nucleic acid conjugate specifically bound to the target substance, amplifying the nucleic acid part of the conjugate, and using this as part of the template, the protein part and the nucleic acid part encoding the protein part A step of preparing a group of protein-nucleic acid conjugates directly bound via a nucleic acid construct bound to the 3 ′ end of the nucleic acid part, (iii) the steps (i) and (ii) above are carried out specifically for the target substance A step of repeating until the nucleic acid part of the bound protein-nucleic acid conjugate forms a cluster that encodes the domain polypeptide, and (iv) a step of obtaining the clustered nucleic acid in step (iii) Substance and A method for selecting and obtaining a nucleic acid encoding an interacting domain polypeptide;
(3) The domain polypeptide is a polypeptide having a length of 90% or less of the full-length protein, and a polypeptide having a length of 130% or less of the interaction domain with the target substance ( 1) or the method according to (2),
(4) (i) a step of contacting a protein-nucleic acid conjugate group in which a protein part and a nucleic acid part encoding the protein part are directly bound via a nucleic acid construct bound to the 3 ′ end of the nucleic acid part with a target substance ( ii) Obtaining the protein-nucleic acid conjugate specifically bound to the target substance, amplifying the nucleic acid part of the conjugate, and using this as part of the template, the protein part and the nucleic acid part encoding the protein part A step of preparing a group of protein-nucleic acid conjugates directly bound via a nucleic acid construct bound to the 3 ′ end of the nucleic acid part, (iii) the steps (i) and (ii) above are carried out specifically for the target substance A step of repeating until the nucleic acid part of the bound protein-nucleic acid conjugate forms a cluster encoding the domain polypeptide, (iv) a step of analyzing the base sequence of the nucleic acid that formed the cluster in step (iii), (v) There is a base sequence Methods for identifying the structure motif sequence, which comprises the step of selecting a common sequence present frequency and / or frequency as an indicator of the amino acid sequence translated it,
(5) A structural motif having a transformed function, characterized in that a mutation is introduced into a part of the structural motif sequence described in (4), and the interaction is analyzed by bringing the mutant structural motif into contact with a target substance. How to get the
(6) (i) a step of preparing a domain polypeptide selected in (1) or (3) above, or a complex of the structural motif described in (4) or (5) and a target substance, (ii) And (iii) predicting the binding space of the target substance from the identified binding site, and analyzing the binding structure. A molecular design method for a compound that interacts with a target substance, comprising a step of designing a compound in time,
(7) The method according to any one of (1) to (6) above, wherein the target substance is related to a disease,
(8) (i) the target substance is associated with a disease, and the domain polypeptide selected in (1) or (3) above or the structural motif described in (4) or (5) above and the target substance A step of producing a complex, (ii) a step of analyzing the three-dimensional structure of the complex and specifying a binding site between the target substance and the polypeptide or structural motif, and (iii) binding of the target substance from the identified binding site Predicting space, designing a compound that fits the binding space, and (iv) synthesizing the designed compound, and a method for producing a therapeutic and / or prophylactic agent for a disease associated with a target substance,
Is provided.

本発明によれば、標的物質との相互作用に必要なドメインポリペプチドをタンパク質から切り出して取得する方法、および得られたドメインポリペプチドのアミノ酸配列を解析し、標的物質との相互作用に必要十分なアミノ酸配列からなる構造モチーフ配列を同定する方法、ならびに該方法により同定された構造モチーフを利用して標的物質に相互作用する化合物を設計する方法等が提供される。該方法は、標的物質が疾患に関連する物質であった場合、該疾患の治療および/又は予防薬となる短鎖ポリペプチドの取得、あるいは化合物の分子設計・取得方法等に有用である。   According to the present invention, a domain polypeptide necessary for interaction with a target substance is obtained by excising from a protein, and the amino acid sequence of the obtained domain polypeptide is analyzed to be necessary and sufficient for interaction with the target substance. There are provided a method for identifying a structural motif sequence comprising a simple amino acid sequence, a method for designing a compound that interacts with a target substance using the structural motif identified by the method, and the like. When the target substance is a substance related to a disease, this method is useful for obtaining a short-chain polypeptide serving as a therapeutic and / or prophylactic agent for the disease, or for molecular design / acquisition of a compound.

以下、本発明を更に詳細に説明するが、以下の構成要件の説明は、本発明の実施態様の代表例であり、本発明はこれらの内容のみに特定されるものではない。
(1)ドメインポリペプチドおよびそれをコードする核酸の選抜取得方法
本発明の1つは、以下に説明する方法により標的物質と相互作用するドメインポリペプチドを選抜取得する方法である。「ドメインポリペプチド」とは、標的物質と相互作用する必要最小単位である「ドメイン」を含み、該ドメインのアミノ酸鎖長の30%以下以下の長さのアミノ酸残基からなるポリペプチドが該ドメインに付加された構造を有する。付加されるポリペプチドは、該ドメインのC末側、N末側のいずれでも、又両方でもよい。標的物質と相互作用する必要最小単位である「ドメイン」とは、それ自体安定な立体構造を形成するタンパク質の部分構造であり、標的物質と結合して相互作用する機能を有する単位を意味する。本発明におけるドメインとは、既知のものも未知のものも含む。
Hereinafter, the present invention will be described in more detail. However, the following description of the constituent elements is a representative example of the embodiment of the present invention, and the present invention is not limited only to these contents.
(1) Selection and acquisition method of domain polypeptide and nucleic acid encoding the same One of the present invention is a method of selecting and acquiring a domain polypeptide that interacts with a target substance by the method described below. The “domain polypeptide” includes a “domain” that is a necessary minimum unit that interacts with a target substance, and a polypeptide comprising an amino acid residue having a length of 30% or less of the amino acid chain length of the domain is the domain. It has the structure added to. The added polypeptide may be either the C-terminal side or the N-terminal side of the domain, or both. The “domain”, which is a necessary minimum unit that interacts with a target substance, is a partial structure of a protein that itself forms a stable three-dimensional structure, and means a unit having a function of binding to and interacting with a target substance. The domain in the present invention includes known and unknown domains.

「相互作用する」とは、標的物質に結合して該物質の機能を制御するか、または該物質によって機能を制御されることを意味する。また、本発明の方法で用いる「標的物質」とは、タンパク質あるいはポリペプチドと相互作用するものであれば何れのものでもよいが、特定の疾患と関連し、該物質の機能の制御が該疾病の治療および/又は予防に有用であることがわかっている物質が特に好ましく用いられる。具体的には、例えば、タンパク質、ポリペプチド、核酸、糖質、脂質、化合物、既知の医薬化合物等が挙げられる。   “Interact” means binding to a target substance to control the function of the substance or being controlled by the substance. The “target substance” used in the method of the present invention may be any substance that interacts with a protein or polypeptide, but is associated with a specific disease, and control of the function of the substance is related to the disease. Substances known to be useful for the treatment and / or prevention of are particularly preferably used. Specific examples include proteins, polypeptides, nucleic acids, carbohydrates, lipids, compounds, known pharmaceutical compounds, and the like.

本発明のドメインポリペプチドの選抜取得方法は、 (1)タンパク質部とそれをコードする核酸部が、核酸部の3’末端に結合した核酸構築物を介して直接結合したタンパク質−核酸連結体群と標的物質とを接触させる工程、(2)標的物質に特異的に結合した該タンパク質−核酸連結体を取得し、該連結体の核酸部を増幅し、これを鋳型の一部として用いて、タンパク質部とそれをコードする核酸部が、核酸部の3’末端に結合した核酸構築物を介して直接結合したタンパク質−核酸連結体群を調製する工程、(3)上記(1)および(2)の工程を、標的物質に特異的に結合したタンパク質−核酸連結体の核酸部が、1つ以上のクラスターを形成するまで繰り返す工程を含むことを特徴とするものである。以下に本方法を詳細に説明する。   The method for selecting and obtaining a domain polypeptide of the present invention comprises: (1) a protein-nucleic acid conjugate group in which a protein part and a nucleic acid part encoding the protein part are directly bound via a nucleic acid construct bound to the 3 ′ end of the nucleic acid part; A step of contacting with a target substance, (2) obtaining the protein-nucleic acid conjugate specifically bound to the target substance, amplifying the nucleic acid part of the conjugate, and using this as a part of a template, A step of preparing a protein-nucleic acid conjugate group in which a part and a nucleic acid part encoding the same are directly bound via a nucleic acid construct bound to the 3 ′ end of the nucleic acid part, (3) in (1) and (2) above It is characterized by including the process of repeating a process until the nucleic acid part of the protein-nucleic acid coupling body couple | bonded specifically with the target substance forms one or more clusters. The method is described in detail below.

(i)タンパク質−核酸連結体および該連結体と標的物質を接触させる工程
本発明の方法で用いられる「タンパク質−核酸連結体」は、例えば、WO98/16636号公報に記載のもの等のように、タンパク質部とそれをコードする核酸部が、核酸部の3’末端に結合した核酸構築物を介して直接結合したものであり、タンパク質の相互作用解析等の強力なツールとなり得る分子である。
(I) Step of contacting a protein-nucleic acid conjugate and the conjugate with a target substance The “protein-nucleic acid conjugate” used in the method of the present invention is, for example, as described in WO98 / 16636 The protein part and the nucleic acid part that encodes it are directly bound via a nucleic acid construct bound to the 3 ′ end of the nucleic acid part, and can be a powerful tool for protein interaction analysis and the like.

ここで、「タンパク質部」とは、核酸部に含まれるコーディング配列によりコードされるタンパク質を含み、タンパク質は既知のものも未知のものも含み、具体的には、生物体内で発現しているタンパク質は全て含まれ、さらには合成のポリペプチドからなるもの、ランダムアミノ酸配列からなるもの等も挙げられる。また、タンパク質−核酸連結体を精製するためのタグと上記タンパク質との融合タンパク質も含まれる。「核酸部」とは、タンパク質部のタンパク質をコードするコーディング配列を含み、さらに、用いるタンパク質合成系においてタンパク質が生成されるための配列を含む核酸であり、RNAでもDNAでもよい。   Here, the “protein part” includes a protein encoded by a coding sequence contained in the nucleic acid part, and the protein includes both known and unknown proteins. Specifically, the protein is expressed in an organism. Are all included, and those composed of a synthetic polypeptide and those composed of a random amino acid sequence are also included. Moreover, the fusion protein of the tag for purifying a protein-nucleic acid coupling body and the said protein is also contained. The “nucleic acid part” is a nucleic acid containing a coding sequence encoding the protein of the protein part and further containing a sequence for generating the protein in the protein synthesis system to be used, and may be RNA or DNA.

核酸部は、具体的には、コーディング領域と発現制御領域を含むものである。発現制御配列とは、(1)プロモーター配列、(2)翻訳の際にリボソームによって認識される配列等が挙げられる。プロモーター配列の種類は、適用する発現系に適したものを適宜選択すればよく、特に限定されない。例えば、大腸菌ウイルスT7のRNAポリメラーゼによって認識されるT7プロモーター配列、SP6 RNAポリメラーゼにより認識されるSP6プロモーター配列などが挙げられる。また、翻訳の際にリボソームによって認識される配列としては、翻訳の際に真核細胞のリボソームによって認識されるRNA配列(Kozak配列)に対応するDNA配列や、原核細胞のリボソームによって認識されるシャイン・ダルガノ配列(Shine-Dalgarno)、5’キャップ構造(Shatkin,Cell,9,645−(1976))、オメガ配列等のtabacco mosaic virusのリボソームによって認識される配列、WO03/56009号公報に記載の配列、rabbitβ−globlin、Xenopusβ−globlin あるいはbromo mosaic virusのリボゾーム認識領域などが挙げられる。また、タンパク質−核酸連結体の核酸部を増幅するのに、PCRを用いる場合、PCRプライマー用配列を含むものも挙げられる。また、核酸部を増幅するためにPCRを用いる場合には、PCRプライマー結合用の共通配列を含むものも挙げられる。   Specifically, the nucleic acid part includes a coding region and an expression control region. Examples of expression control sequences include (1) promoter sequences, (2) sequences recognized by ribosomes during translation, and the like. The type of promoter sequence is not particularly limited as long as it is appropriately selected from those suitable for the expression system to be applied. Examples thereof include a T7 promoter sequence recognized by E. coli virus T7 RNA polymerase, an SP6 promoter sequence recognized by SP6 RNA polymerase, and the like. In addition, sequences recognized by ribosomes during translation include DNA sequences corresponding to RNA sequences (Kozak sequences) recognized by eukaryotic ribosomes during translation, and shine recognized by prokaryotic ribosomes. A sequence recognized by the ribosome of Tabacco mosaic virus, such as a Dalgarno sequence (Shine-Dalgarno), a 5 ′ cap structure (Shatkin, Cell, 9,645- (1976)), an omega sequence, and the like described in WO 03/56009 Examples thereof include a sequence, a ribosome recognition region of rabbit β-globulin, Xenopus β-globulin or bromo mosaic virus. In addition, when PCR is used to amplify the nucleic acid part of the protein-nucleic acid conjugate, those containing a PCR primer sequence are also included. In addition, when PCR is used to amplify the nucleic acid part, one containing a common sequence for PCR primer binding is also included.

コーディング配列とは、タンパク質−核酸連結体のタンパク質部に含まれるタンパク質をコードする配列であり、この種類は特に限定されず、目的に応じて適宜選択できる。また、タンパク質−核酸連結体群を作製する場合には、cDNAライブラリーの各要素が有する塩基配列等も好ましい。
また、該核酸部の3’末端に結合した「核酸構築物」とは、その末端に「核酸誘導体」を結合しており、該核酸部を鋳型として無細胞タンパク質翻訳系又は生細胞中でタンパク質の翻訳を行った場合、mRNAの末端付近まで翻訳が進んだ後、該核酸誘導体(例えば、ピューロマイシンなど)がリボソームのAサイトに入ることによりタンパク質と結合させる機能を有するものを意味する。具体的には、スペーサー、該タンパク質−核酸連結体を標識する標識部、また該連結体を固相に結合するための構造、核酸部を逆転写するためのプライマー部等を含むものが好ましい。
The coding sequence is a sequence encoding a protein contained in the protein part of the protein-nucleic acid conjugate, and the type is not particularly limited and can be appropriately selected depending on the purpose. Further, when preparing a protein-nucleic acid conjugate group, a base sequence or the like possessed by each element of a cDNA library is also preferred.
In addition, the “nucleic acid construct” bound to the 3 ′ end of the nucleic acid part has a “nucleic acid derivative” bound to the end, and the protein in a cell-free protein translation system or living cell using the nucleic acid part as a template. When translation is performed, it means that the nucleic acid derivative (for example, puromycin) has a function of binding to a protein by entering the A site of the ribosome after translation proceeds to the vicinity of the end of mRNA. Specifically, those including a spacer, a labeling part for labeling the protein-nucleic acid conjugate, a structure for binding the conjugate to a solid phase, a primer part for reverse transcription of the nucleic acid part, and the like are preferable.

「核酸誘導体」としては、無細胞タンパク質翻訳系又は生細胞中でタンパク質の翻訳が行われた時に、合成されたタンパク質のC末端に結合する能力を有する化合物である限り限定されないが、その3’末端がアミノアシルtRNAに化学構造骨格が類似しているものを選択することができる。代表的な化合物として、ピューロマイシン(Puromycin)と3’-N-アミノアシルピューロマイシンアミノヌクレオシド(3'-N-Aminoacylpuromycinaminonucleoside 、 PANS-アミノ酸)、すなわち、アミノ酸部がグリシンのPANS−Gly、アミノ酸部がバリンのPANS−Val、アミノ酸部がアラニンのPANS−Ala、その他、アミノ酸部が全ての各アミノ酸に対応するPANS−アミノ酸化合物が挙げられる。   The “nucleic acid derivative” is not limited as long as it is a compound having the ability to bind to the C-terminus of the synthesized protein when the protein is translated in a cell-free protein translation system or living cells, but the 3 ′ Those having a chemical structure skeleton similar to aminoacyl-tRNA at the end can be selected. Representative compounds include puromycin and 3'-N-aminoacylpuromycin aminonucleoside (PANS-amino acid), that is, PANS-Gly having an amino acid part of glycine and an amino acid part of valine. PANS-Val, PANS-Ala whose amino acid part is alanine, and other PANS-amino acid compounds whose amino acid part corresponds to all amino acids.

また、3’−アミノアデノシンのアミノ基とアミノ酸のカルボキシル基が脱水縮合して連結した3’-N-アミノアシルアデノシンアミノヌクレオシド(3'-Aminoacyladenosine aminonucleoside, AANS-アミノ酸)、すなわち、アミノ酸部がグリシンのAANS−Gly、アミノ酸部がバリンのAANS−Val、アミノ酸部がアラニンのAANS−Ala、その他、アミノ酸部が全アミノ酸の各アミノ酸に対応するAANS−アミノ酸化合物を使用できる。また、核酸あるいは核酸とアミノ酸のエステル結合したものなども使用できる。さらにまた、核酸あるいは核酸に類似した化学構造骨格及び塩基を有する物質と、アミノ酸に類似した化学構造骨格を有する物質とを化学的に結合した化合物は、すべて本発明で用いられる核酸誘導体に含まれる。核酸誘導体としては、ピューロマイシン、PANS−アミノ酸もしくはAANS−アミノ酸がリン酸基を介してヌクレオシドと結合している化合物がより好ましい。これらの化合物の中でピューロマイシン、リボシチジルピューロマイシン、デオキシシチジルピューロマイシン、デオキシシチジルデオキシシチジルピューロマイシン、デオキシウリジルピューロマイシンなどのピューロマイシン誘導体が特に好ましい。
このような核酸誘導体は、それ自体既知の化学結合方法によって製造することができる。具体的には、リン酸ジエステル結合で合成ユニットを結合させる場合は、DNA合成機に一般的に用いられているホスホアミダイド法などにより固相合成で合成することが可能である。ペプチド結合を導入する場合は、活性エステル法などにより合成ユニットを結合させるが、DNAとの複合体を合成する場合は、両方の合成法に対応が可能な保護基が必要になる。
In addition, 3′-N-aminoacyl adenosine aminonucleoside (AANS-amino acid) in which the amino group of 3′-aminoadenosine and the carboxyl group of amino acid are linked by dehydration condensation, that is, the amino acid part is glycine. AANS-Gly, AANS-Val whose amino acid part is alanine, AANS-Ala whose amino acid part is alanine, and other AANS-amino acid compounds corresponding to each amino acid whose amino acid part is all amino acids can be used. In addition, nucleic acid or nucleic acid and amino acid ester-bonded ones can be used. Furthermore, the nucleic acid derivatives used in the present invention are all compounds in which a nucleic acid or a substance having a chemical structure skeleton similar to a nucleic acid and a base is chemically bonded to a substance having a chemical structure skeleton similar to an amino acid. . The nucleic acid derivative is more preferably a compound in which puromycin, PANS-amino acid or AANS-amino acid is bound to a nucleoside via a phosphate group. Of these compounds, puromycin derivatives such as puromycin, ribocytidylpuromycin, deoxycytidylpuromycin, deoxycytidyldeoxycytidylpuromycin, and deoxyuridylpuromycin are particularly preferred.
Such a nucleic acid derivative can be produced by a chemical bonding method known per se. Specifically, when the synthesis unit is bound by a phosphodiester bond, the synthesis unit can be synthesized by solid phase synthesis by a phosphoramidide method or the like generally used in DNA synthesizers. When a peptide bond is introduced, a synthesis unit is bound by an active ester method or the like, but when a complex with DNA is synthesized, a protecting group capable of supporting both synthesis methods is required.

「スペーサー」は、ポリエチレン又はポリエチレングリコールあるいはその誘導体などの高分子物質や、オリゴヌクレオチドやペプチドあるいはその誘導体などの生体高分子物質等が用いられ、好ましくはポリエチレングリコールが用いられる。スペーサーの長さは特に限定されないが、好ましくは、分子量150〜6000であるか、または主鎖の原子数は10原子から400原子であり、さらに好ましくは、分子量600〜3000であるか、または主鎖の原子数が40原子から200原子である。   As the “spacer”, a polymer substance such as polyethylene or polyethylene glycol or a derivative thereof, a biopolymer substance such as an oligonucleotide, a peptide or a derivative thereof, or the like is used, and preferably polyethylene glycol is used. The length of the spacer is not particularly limited, but preferably the molecular weight is 150 to 6000, or the number of atoms in the main chain is 10 to 400 atoms, more preferably the molecular weight is 600 to 3000, The number of atoms in the chain is 40 to 200 atoms.

「標識部」は、親和性物質、共有結合性物質、蛍光物質、分解性物質等が挙げられる。これらは、「該連結物を固相に結合するための構造」としても用いられるし、また「該連結物を精製するための構造」としても用いられる。親和性物質としては、ポリA配列、ポリT配列、ビオチン、FLAG等の各種抗原又は抗体、Hisタグ、NTA等の配位子、受容体リガンド等が挙げられる。また、共有結合性物質としては、デオキシリボヌクレオチド、リボヌクレオチド等の核酸末端部分、ヒドラジド、ケトン、チオエステル等の官能基、ソラレン等の架橋性物質が挙げられる。蛍光物質としては、フルオレセイン、オレゴングリーン、ローダミン、テトラメチルローダミン、テキサスレッド、Cy3、Cy5、Alexa488等が挙げられる。分解性物質としては、光反応で分解する1-(2-ニトロフェニル)-エチル基を有する誘導体や、プロテアーゼやペプチダーゼに認識されるアミノ酸配列等が挙げられる。これらの標識物質は、それ自体既知の通常用いられるものであり、容易に入手可能であり、また常法により核酸等に結合して標識することができる。   Examples of the “labeling part” include affinity substances, covalent substances, fluorescent substances, and degradable substances. These are used as “a structure for binding the linked substance to a solid phase” and also used as a “structure for purifying the linked substance”. Examples of the affinity substance include poly A sequences, poly T sequences, various antigens or antibodies such as biotin and FLAG, His tags, ligands such as NTA, receptor ligands, and the like. Examples of the covalently binding substance include nucleic acid terminal portions such as deoxyribonucleotide and ribonucleotide, functional groups such as hydrazide, ketone, and thioester, and crosslinkable substances such as psoralen. Examples of the fluorescent substance include fluorescein, Oregon green, rhodamine, tetramethylrhodamine, Texas red, Cy3, Cy5, Alexa488 and the like. Examples of the degradable substance include derivatives having a 1- (2-nitrophenyl) -ethyl group that decomposes by a photoreaction, amino acid sequences recognized by proteases and peptidases, and the like. These labeling substances are known and used in general and can be easily obtained, and can be labeled by binding to a nucleic acid or the like by a conventional method.

好ましい核酸部とその3’末端側に結合した核酸構築物、核酸誘導体(以下、これを「タンパク質−核酸連結体鋳型」と称することがある)の好ましい構造としては、核酸部であるRNAと、核酸誘導体を末端に有するスペーサーが枝分かれした状態で結合している1本鎖核酸(以下、これを「スペーサー鎖」と称することがある)がアニーリングした構造を有し、さらに該スペーサー鎖と標識部を含む1本鎖核酸と核酸部がそれぞれ結合しているものが挙げられる。具体的には、PCT/JP2004/013399号明細書に記載のもので、製造法も該明細書に記載された方法が好ましく用いられる。このような構造を有することにより、核酸部と核酸構築物のRNAリガーセ等による結合効率が高く、またタンパク質−核酸連結体を標識部により精製でき、核酸部のRNAを逆転写することができ、さらに核酸部を2本鎖DNAとすることもできる。   Preferred structures of a preferred nucleic acid part and a nucleic acid construct or nucleic acid derivative (hereinafter sometimes referred to as a “protein-nucleic acid conjugate template”) bound to the 3 ′ end thereof include RNA as a nucleic acid part and nucleic acid It has a structure in which a single-stranded nucleic acid (hereinafter sometimes referred to as a “spacer chain”) to which a spacer having a derivative at its end is bound in a branched state is annealed. Examples include those in which a single-stranded nucleic acid and a nucleic acid part are contained. Specifically, the method described in the specification of PCT / JP2004 / 013399 and the method described in the specification is preferably used as the production method. By having such a structure, the binding efficiency of the nucleic acid part and the nucleic acid construct by RNA ligase or the like is high, the protein-nucleic acid conjugate can be purified by the labeling part, the RNA of the nucleic acid part can be reverse-transcribed, The nucleic acid part can be double-stranded DNA.

かくして構築されたタンパク質−核酸連結体鋳型をタンパク質翻訳系に導入することによりタンパク質−核酸連結体を製造することができる。核酸からそれがコードするタンパク質を人工的に生成させるための翻訳系は当業者に公知である。具体的には、適当な細胞よりタンパク質合成能を有する成分を抽出し、その抽出液を用いて目的のタンパク質を合成させる無細胞タンパク質合成系が挙げられる。このような無細胞タンパク質合成系には、リボゾーム、開始因子、伸長因子及びtRNA等の翻訳に必要な要素が含まれている。このような無細胞タンパク質合成系としては、例えば、真核生物の無細胞タンパク質合成系が用いられ、より具体的には、ウサギ網状赤血球抽出液やコムギ胚芽抽出液などが挙げられるが、これらに限られるものではない。無細胞タンパク質合成系は、キットとして市販されているものを使用することができる。例えば、ウサギ網状赤血球抽出液のキットとしては、Rabbit Reticulocyte Lysate Systems, Nuclease Treated(Promega社製)等が用いられ、またコムギ胚芽抽出液としては、PROTEIOSTM Wheat germ cell−free protein synthesis core kit(TOYOBO社製)等が挙げられる。タンパク質翻訳系としては、生細胞を使用してもよく、具体的には、原核又は真核生物、例えば大腸菌の細胞等を用いることができる。無細胞タンパク質翻訳系又は生細胞などは、その中にタンパク質をコードする核酸を添加するか又は導入することによってタンパク質合成が行われるものである限り特に制限はない。本発明の核酸構築物を無細胞タンパク質合成系に導入する直前に、60〜90℃で加熱した後急冷する工程を行うと、タンパク質−核酸連結体の合成効率が高くなるため好ましい。 A protein-nucleic acid conjugate can be produced by introducing the thus constructed protein-nucleic acid conjugate template into a protein translation system. Translation systems for artificially generating the protein that it encodes from nucleic acids are known to those skilled in the art. Specifically, a cell-free protein synthesis system in which a component having protein synthesis ability is extracted from an appropriate cell, and the target protein is synthesized using the extract. Such a cell-free protein synthesis system includes elements necessary for translation such as ribosomes, initiation factors, elongation factors, and tRNAs. Examples of such cell-free protein synthesis systems include eukaryotic cell-free protein synthesis systems, and more specifically, rabbit reticulocyte extract and wheat germ extract. It is not limited. As the cell-free protein synthesis system, a commercially available kit can be used. For example, the kit rabbit reticulocyte lysate, Rabbit Reticulocyte Lysate Systems, Nuclease Treated (Promega Corporation) and the like are used, and as the wheat germ extract, PROTEIOS TM Wheat germ cell-free protein synthesis core kit (TOYOBO Etc.). As the protein translation system, live cells may be used. Specifically, prokaryotic or eukaryotic organisms such as cells of E. coli can be used. The cell-free protein translation system or living cell is not particularly limited as long as protein synthesis is performed by adding or introducing a nucleic acid encoding a protein therein. Immediately before introducing the nucleic acid construct of the present invention into a cell-free protein synthesis system, a step of heating at 60 to 90 ° C. and then rapidly cooling is preferable because the synthesis efficiency of the protein-nucleic acid conjugate is increased.

上記翻訳反応液から、タンパク質−核酸連結体を精製する場合、標識鎖に親和性物質あるいは共有結合物質が結合している場合には、該親和性物質あるいは共有結合物質を介して精製を行うことができる。精製の方法は、用いる親和性物質および共有結合物質に応じて適宜選択してそれ自体既知の定法を用いることができる。
上記で製造されたタンパク質−核酸連結体は、上記標的物質と接触させ、該物質と相互作用する連結体を選択取得する工程に供する。この選択方法は、タンパク質−核酸連結体中のタンパク質が有する機能(生物活性)を用いて標的物質と相互作用するタンパク質を該連結体として選択することを意味する。このような相互作用の解析方法としては、例えばWO98/16636号公報に記載の方法を用いることができる。また、標的物質と接触させるタンパク質−核酸連結体は、通常、cDNAライブラリー等から製造された複数の連結体群である。
When purifying a protein-nucleic acid conjugate from the above translation reaction solution, if an affinity substance or a covalent binding substance is bound to the labeled chain, the purification is performed via the affinity substance or the covalent binding substance. Can do. The purification method can be appropriately selected according to the affinity substance and covalent bond substance to be used, and a known method per se can be used.
The protein-nucleic acid conjugate produced above is brought into contact with the target substance and subjected to a step of selectively obtaining a conjugate that interacts with the substance. This selection method means that a protein that interacts with a target substance is selected as the conjugate using the function (biological activity) of the protein in the protein-nucleic acid conjugate. As a method for analyzing such interaction, for example, the method described in WO98 / 16636 can be used. The protein-nucleic acid conjugate to be contacted with the target substance is usually a plurality of conjugate groups produced from a cDNA library or the like.

また、本発明のタンパク質−核酸連結体および標的物質は、固相(支持体)に結合させて用いることもできる。タンパク質−核酸連結体の固相への結合は、上記標識部に親和性物質や共有結合性物質が結合している場合には、これらを用いて行うことができる。具体的には、親和性物質又は共有結合性物質が親和性を有するまたは結合する物質を予め固定化した固相に、上記タンパク質−核酸連結体を接触させることにより、当該タンパク質−核酸連結体を固相に容易に固定化することができる。固相への標的物質の結合は、例えば、Scott,J.K.&Smith,G.P.(1990)Science,249,386−390;Devlin,P.E.et al.(1990)Science,249,404−406;Mattheakis,L.C.et al.(1994)Proc.Natl.Acad.Sci.USA,91,9022−9026等に記載されている方法等により行うことができる。   Moreover, the protein-nucleic acid conjugate of the present invention and the target substance can be used by being bound to a solid phase (support). The protein-nucleic acid conjugate can be bound to the solid phase when an affinity substance or a covalent substance is bound to the labeling portion. Specifically, the protein-nucleic acid conjugate is brought into contact with a solid phase on which an affinity substance or a covalently bound substance has an affinity or binds a substance in advance, thereby bringing the protein-nucleic acid conjugate into contact. It can be easily immobilized on a solid phase. Binding of the target substance to the solid phase is described, for example, in Scott, J. et al. K. & Smith, G.M. P. (1990) Science, 249, 386-390; Devlin, P. et al. E. et al. (1990) Science, 249, 404-406; Mattheakis, L .; C. et al. (1994) Proc. Natl. Acad. Sci. USA, 91, 9022-9026, etc.

固相(支持体)としては、通常の核酸、タンパク質、糖質、脂質、化合物等の固定化に用いることができる支持体であれば特に限定されない。支持体としては、親和性物質や共有結合性物質どうしの結合形成、あるいは標的物質の結合に悪影響を及ぼさないものであればその形状は特に限定されず、例えば、平板、マイクロウェル、ビーズ等の任意の形態をとることができる。支持体の材質としては、例えば、ガラス、セメント、陶磁器等のセラミックス、ポリエチレンテレフタレート、酢酸セルロース、ビスフェノールAのポリカーボネート、ポリスチレン、ポリメチルメタクリレート等のポリマー類、シリコン、活性炭、多孔質ガラス、多孔質セラミックス、多孔質シリコン、多孔質活性炭、織編物、不織布、濾紙、短繊維、メンブランフィルター等の多孔質物質を挙げることができる。   The solid phase (support) is not particularly limited as long as it is a support that can be used for immobilizing normal nucleic acids, proteins, carbohydrates, lipids, compounds, and the like. The shape of the support is not particularly limited as long as it does not adversely affect the formation of a bond between affinity substances or covalent substances, or the binding of a target substance. For example, a plate, a microwell, a bead, etc. It can take any form. Examples of the support material include glass, cement, ceramics such as ceramics, polyethylene terephthalate, cellulose acetate, bisphenol A polycarbonate, polystyrene, polymethyl methacrylate, and other polymers, silicon, activated carbon, porous glass, and porous ceramics. And porous materials such as porous silicon, porous activated carbon, woven and knitted fabric, non-woven fabric, filter paper, short fiber, and membrane filter.

上記選択方法に付するタンパク質−核酸連結体は、核酸部がRNAのものでもよいし、mRNA鎖をDNAに逆転写したタンパク質−逆転写核酸連結体でもよい。逆転写反応に必要な試薬及び反応条件は当業者に周知であり、必要に応じて適宜選択することができる。さらに得られたタンパク質−逆転写核酸連結体のRNAをRNA分解酵素などを用いて分解し、DNAを鋳型にポリメラーゼ反応をすることにより2本鎖DNA−タンパク質連結体を作製して用いることもできる。このような、タンパク質−逆転写核酸連結体、あるいは2本鎖DNA−タンパク質連結体を用いれば、核酸部分の安定性がよいこと、また1本鎖RNAの非特異的吸着がないため好ましい。   The protein-nucleic acid conjugate to be subjected to the above selection method may be one in which the nucleic acid part is RNA, or may be a protein-reverse transcription nucleic acid conjugate in which the mRNA chain is reverse-transcribed into DNA. Reagents and reaction conditions necessary for the reverse transcription reaction are well known to those skilled in the art, and can be appropriately selected as necessary. Furthermore, the double-stranded DNA-protein conjugate can be prepared and used by degrading the RNA of the obtained protein-reverse transcription nucleic acid conjugate using an RNase or the like and subjecting the DNA to a polymerase reaction. . Use of such a protein-reverse transcription nucleic acid conjugate or a double-stranded DNA-protein conjugate is preferred because the stability of the nucleic acid moiety is good and there is no non-specific adsorption of single-stranded RNA.

(ii)標的物質に特異的に結合したタンパク質−核酸連結体の取得、核酸部の増幅、該核酸部を鋳型の一部としたタンパク質−核酸連結体の調製工程
上記選択方法で選択されたタンパク質−核酸連結体は、これを再度標的物質との相互作用に基づいて選択する工程に供する。一度選択されたタンパク−核酸連結体の核酸部を増幅して、さらにタンパク質−核酸連結体とするためには、(a)選択取得されたタンパク質−核酸連結体の1本鎖RNA部分を必要に応じて分解する等した後に、これをPCRなどで増幅し(増幅工程)、(b)増幅されたDNA鎖をもとにmRNA鎖を製造し、さらに上記のタンパク質−核酸連結体鋳型を製造し、これを翻訳してタンパク質−核酸連結体を調製することにより行なうことができる。
(Ii) Acquisition of a protein-nucleic acid conjugate specifically bound to a target substance, amplification of the nucleic acid portion, and a protein-nucleic acid conjugate preparation step using the nucleic acid portion as a part of a template Protein selected by the above selection method -The nucleic acid conjugate is subjected to a step of selecting it again based on the interaction with the target substance. In order to further amplify the nucleic acid part of the protein-nucleic acid conjugate selected once to make a protein-nucleic acid conjugate further, (a) a single-stranded RNA portion of the protein-nucleic acid conjugate obtained by selection is necessary. After being decomposed accordingly, this is amplified by PCR or the like (amplification step), (b) an mRNA chain is produced based on the amplified DNA chain, and the above-mentioned protein-nucleic acid conjugate template is further produced. This can be done by translating this to prepare a protein-nucleic acid conjugate.

(a)増幅工程は、PCRを用いて例えば以下のように行うことも好ましい。タンパク質−核酸連結体の核酸中、増幅するのは少なくともコーディング配列を含む領域である。このように増幅されたDNAについて、それ自体既知の定法により塩基配列を解析することにより、上記選択方法で選択されたタンパク質をコードするDNA配列を同定できるので、該配列をもとにDNAまたはRNAも取得することができる。該領域を増幅するのに用いられるPCRプライマーとしては、特に制限はないが、全てのタンパク質−核酸連結体に共通に用いられる配列として、5’側のプライマーは、コーディング配列の5’上流側に連結されている配列が好ましく用いられる。具体的には、上記したタンパク質−核酸連結体の場合、5’側のプライマーは、翻訳の際にリボソームによって認識されるDNA配列などが好ましく用いられ、3’側のプライマーは、タグ配列や共通配列が好ましく用いられる。   (A) It is also preferable to perform an amplification process as follows, for example using PCR. In the nucleic acid of the protein-nucleic acid conjugate, the region to be amplified contains at least the coding sequence. The DNA sequence encoding the protein selected by the above selection method can be identified by analyzing the base sequence of the DNA thus amplified by a known method per se, so that DNA or RNA can be identified based on the sequence. Can also get. The PCR primer used for amplifying the region is not particularly limited, but as a sequence commonly used for all protein-nucleic acid conjugates, the 5 ′ primer is located 5 ′ upstream of the coding sequence. A linked sequence is preferably used. Specifically, in the case of the above-described protein-nucleic acid conjugate, the 5 ′ primer is preferably a DNA sequence recognized by a ribosome during translation, and the 3 ′ primer is a tag sequence or common A sequence is preferably used.

かくして増幅されて得られたDNAは、コーディング配列のみを含むものであるので、上記に記載の(1)プロモーター配列、(2)翻訳の際にリボソームによって認識されるDNA配列(以下、これらを「5’付加配列」と称することがある)。タグ配列、共通配列等(以下、これらを「3’付加配列」と称することがある)を結合する。これらの配列の結合は、DNAリガーゼ、下述するオーバーラップエクステンション法、PCR法を用いて行うことができる。PCRのプライマーとしては、増幅されたDNAの5’末端と共通の配列を3’末端に有する5’末端付加配列からなるものと、増幅されたDNAの3’末端と共通の配列を5’末端に有する3’付加配列からなるものが用いられる。   Since the DNA thus obtained contains only the coding sequence, (1) the promoter sequence described above and (2) the DNA sequence recognized by the ribosome during translation (hereinafter referred to as “5 ′”). Sometimes referred to as "additional sequence"). A tag sequence, a common sequence, etc. (hereinafter, these may be referred to as “3 ′ additional sequences”) are combined. The binding of these sequences can be performed using DNA ligase, the overlap extension method described below, or the PCR method. PCR primers include a 5'-end additional sequence having a sequence common to the 5 'end of the amplified DNA at the 3' end, and a sequence common to the 3 'end of the amplified DNA as the 5' end. What consists of 3 'addition arrangement | sequence which it has in is used.

オーバーラップエクステンション法による結合方法は、まず増幅されたDNAの5’末端と共通の配列を3’末端に有する5’付加配列を等モル数程度用意し、これをアニーリングさせた後に、DNAポリメラーゼなどを用いて2本鎖DNAに合成し、さらに増幅されたDNAの3’末端と共通の配列を5’末端に有する3’付加配列を等モル数程度用意し、これをアニーリングさせた後に、DNAポリメラーゼなどを用いて2本鎖DNAを合成する方法である。上記5’側付加配列および3’付加配列の結合は、片方ずつ行っても、両方同時に行ってもよい。かくして合成された2本鎖DNAは、これを両末端の塩基配列を有するプライマーなどを用いてさらにPCRで増幅してもよい。   In the binding method by the overlap extension method, first, approximately 5 moles of 5 ′ additional sequence having a sequence common to the 5 ′ end of the amplified DNA at the 3 ′ end is prepared, annealed, and then DNA polymerase, etc. After preparing an equimolar number of 3 ′ additional sequence having a sequence common to the 3 ′ end of the amplified DNA at the 5 ′ end and annealing the DNA, In this method, double-stranded DNA is synthesized using a polymerase or the like. The 5'-side additional sequence and 3'-added sequence may be combined one by one or both at the same time. The double-stranded DNA thus synthesized may be further amplified by PCR using a primer having a nucleotide sequence at both ends.

かくして調製されたタンパク質−核酸連結体鋳型は、上記(i)に記載の方法により翻訳され、タンパク質-核酸連結体が調製される。   The protein-nucleic acid conjugate template thus prepared is translated by the method described in (i) above to prepare a protein-nucleic acid conjugate.

(iii)濃縮操作
本発明の方法では、上記(i)および(ii)に記載の工程を、標的物質に特異的に結合したタンパク質−核酸連結体の核酸部が、ドメインポリペプチドをコードするクラスターを形成するまで繰り返す(本明細書では、これを「濃縮操作」と称することがある)。「ドメインポリペプチドをコードするクラスター」(以下、「クラスター」と称することがある)とは、上記ドメインポリペプチドをコードする核酸を共通配列として含むほぼ同じ長さの核酸のかたまりを意味する。共通配列を含むほぼ同じ長さのかたまりとは、上記で取得されるタンパク質−核酸連結体群の50%以上が該共通配列を含み、その鎖長が最も短い核酸と長い核酸が1倍〜10倍の範囲に入ってくることを意味する。このようなクラスターが形成されたことは、形成を確認し得る方法であれば特に制限はないが、例えば、標的物質と相互作用することで選択取得されたタンパク質−核酸連結体の核酸部を、RNAのまま、又はDNAとしてアガロースゲルまたはSDS−ポリアクリルアミドゲル中を電気泳動等で分離した場合にバンドが観察されることにより確認することができる。
また、クラスターが形成された場合、その反応溶液に含まれる全てのポリペプチドをコードする核酸を取得して、上記の方法等を用いて翻訳し、標的物質に再度接触させ、標的物質と結合するポリペプチドの割合が高いことにより濃縮操作が十分であることを確認することもできる。
(Iii) Concentration operation In the method of the present invention, the steps described in (i) and (ii) above are carried out using a cluster in which the nucleic acid part of the protein-nucleic acid conjugate specifically bound to the target substance encodes a domain polypeptide. (This may be referred to herein as a “concentration operation”). A “cluster encoding a domain polypeptide” (hereinafter, sometimes referred to as “cluster”) means a cluster of nucleic acids having substantially the same length, including the nucleic acid encoding the domain polypeptide as a common sequence. A cluster of almost the same length including a common sequence means that 50% or more of the protein-nucleic acid conjugate group obtained above contains the common sequence, and the nucleic acid having the shortest chain length and the longest nucleic acid are 1 to 10 times. It means to enter the double range. The formation of such a cluster is not particularly limited as long as the formation can be confirmed, but for example, the nucleic acid part of a protein-nucleic acid conjugate obtained by interacting with a target substance is selected, It can be confirmed by observing a band when the RNA is separated as a DNA or agarose gel or SDS-polyacrylamide gel is separated by electrophoresis or the like.
When a cluster is formed, nucleic acids encoding all polypeptides contained in the reaction solution are obtained, translated using the above method, etc., contacted with the target substance again, and bound to the target substance. It can also be confirmed that the concentration operation is sufficient due to the high ratio of the polypeptide.

通常、この濃縮操作は、2〜15回行なうことによって、本発明のドメインポリペプチドと、これをコードする核酸の連結体が取得される。取得された連結体の核酸部を上記方法により増幅して常法により塩基配列を解析することにより、該ドメインポリペプチドをコードする塩基配列を同定することができる。また、該塩基配列を有する核酸を常法により合成すればドメインポリペプチドをコードする核酸を取得することができ、またこの核酸を公知の、例えば、上記したタンパク質合成方法等により翻訳合成することにより、ドメインポリペプチドを取得することができる。   Usually, this enrichment operation is performed 2 to 15 times to obtain a conjugate of the domain polypeptide of the present invention and the nucleic acid encoding it. By amplifying the nucleic acid part of the obtained linked body by the above method and analyzing the base sequence by a conventional method, the base sequence encoding the domain polypeptide can be identified. Further, if a nucleic acid having the base sequence is synthesized by a conventional method, a nucleic acid encoding a domain polypeptide can be obtained, and this nucleic acid can be obtained by translational synthesis using a known method such as the protein synthesis method described above. A domain polypeptide can be obtained.

かくして取得されるドメインポリペプチドの例としては、PPARγ2に相互作用するドメインペプチドとして、配列表の配列番号1〜14に記載のアミノ酸配列を有するものが挙げられる。さらに、図1および図2に記載の遺伝子としてUNIGENEデータベースに登録されているものを含むものが取得された。また、Smad3に相互作用するドメインペプチドとしては、配列番号15〜19に記載のアミノ酸配列を有するものが取得され、さらに図3および図4に記載の遺伝子としてUNIGENEデータベースに登録されているものを含むものが取得された。また、FK506に相互作用するドメインポリペプチドとしては、配列番号20〜23に記載のアミノ酸配列を有するものが取得され、さたに図5および図6に遺伝子としてUNIGENEデータベースに登録されているものを含むものが取得された。   Examples of the domain polypeptide thus obtained include those having the amino acid sequences described in SEQ ID NOs: 1 to 14 in the Sequence Listing as domain peptides that interact with PPARγ2. Furthermore, those including those registered in the UNIGENE database as the genes described in FIGS. 1 and 2 were obtained. Domain peptides that interact with Smad3 include those having the amino acid sequences described in SEQ ID NOs: 15 to 19, and those registered in the UNIGENE database as the genes described in FIGS. 3 and 4 Things were acquired. In addition, as domain polypeptides that interact with FK506, those having the amino acid sequences described in SEQ ID NOs: 20 to 23 are obtained, and those registered in the UNIGENE database as genes in FIGS. What was included was acquired.

(2)構造モチーフ配列の同定方法
上記(1)で選抜取得されたドメインポリペプチド群をコードする塩基配列、あるいはそれを翻訳したアミノ酸配列から、存在頻度および/または出現頻度を指標として共通配列を選択する工程等により構造モチーフ配列を同定することができる。この構造モチーフ配列の同定方法の概要を図7に示す。
(2) Identification method of structural motif sequence From the base sequence encoding the domain polypeptide group selected and obtained in (1) above, or from the translated amino acid sequence, a common sequence is determined using the presence frequency and / or appearance frequency as an index. The structural motif sequence can be identified by the selection process or the like. An outline of this structural motif sequence identification method is shown in FIG.

「構造モチーフ」とは、標的物質と相互作用するドメインよりさらに短鎖のアミノ酸からなる標的物質との相互作用に必要十分なポリペプチドを意味する。また、「構造モチーフ配列」とは、該構造モチーフを構成するアミノ酸配列、または該アミノ酸配列をコードする塩基配列を意味する。
構造モチーフ配列は、上記で選抜取得されたドメインポリペプチド群をコードする塩基配列、あるいはそれを翻訳したアミノ酸配列から解析同定する。以下、アミノ酸配列から同定する方法について説明するが、塩基配列からも同様にして同定することができる。同定の方法は、取得されたドメインポリペプチド群がほぼ共通に有しているアミノ酸配列を抜き出すことによる方法が用いられる。「ほぼ共通に有しているアミノ酸配列」は、(i)存在頻度と(ii)出現頻度を指標として同定される。(i)存在頻度による選択方法は、まず、取得されたドメインポリペプチド群のアミノ酸配列を、市販のソフトウェア(ClustalW:Thompson JD,et al., Nucleic Acids Res., 22(22), 4673-80 (1994))を用いてマルチプルアラインメント解析を行なう(図7)。ここで、多くのドメインペプチドが共通に有しているアミノ酸配列(図7)を中心として、その前後に隣接するアミノ酸1つずつについて、各ドメインポリペプチドに存在しているかいないかを解析し、全ドメインポリペプチドの50%、好ましくは80%、さらに好ましくは90%、最も好ましくは100%で存在している範囲を選択する(以下、これを「存在頻度により選択されたポリペプチド」と称することがある)。図7では、アミノ酸配列B1のN末(左端)からアミノ酸配列A−1およびA−2のC末(右端)までが存在頻度100%の範囲となる。
The “structural motif” means a polypeptide that is necessary and sufficient for interaction with a target substance consisting of a shorter chain amino acid than a domain that interacts with the target substance. The “structural motif sequence” means an amino acid sequence constituting the structural motif or a base sequence encoding the amino acid sequence.
The structural motif sequence is analyzed and identified from the base sequence encoding the domain polypeptide group selected and obtained above, or the amino acid sequence obtained by translating it. Hereinafter, although the method of identifying from an amino acid sequence is demonstrated, it can identify similarly from a base sequence. As an identification method, a method by extracting an amino acid sequence that is substantially common to the obtained domain polypeptide group is used. The “almost common amino acid sequence” is identified using (i) presence frequency and (ii) appearance frequency as indices. (I) In the selection method based on the presence frequency, the amino acid sequence of the obtained domain polypeptide group is first converted into commercially available software (Clustal W: Thompson JD, et al., Nucleic Acids Res., 22 (22), 4673-80 (1994)) to perform multiple alignment analysis (FIG. 7). Here, centering on the amino acid sequence that many domain peptides have in common (FIG. 7), for each of the adjacent amino acids one after the other, analyze whether each domain polypeptide exists, A range that is present in 50%, preferably 80%, more preferably 90%, and most preferably 100% of the total domain polypeptide is selected (hereinafter referred to as “polypeptide selected by frequency”). Sometimes). In FIG. 7, the range from the N end (left end) of the amino acid sequence B1 to the C ends (right end) of the amino acid sequences A-1 and A-2 is in the range of 100% existence frequency.

(ii)さらに、上記マルチプルアラインメント解析したドメインペプチドが共通に有しているアミノ酸配列およびその前後に隣接しているアミノ酸1つずつについて、アミノ酸の種類を解析し、全ドメインペプチドの50%、好ましくは80%、さらに好ましくは90%、最も好ましくは100%が同じアミノ酸を有している範囲を選択する(以下、これを「出現頻度により選択されたポリペプチド」)と称する。図7では、黒楕円で示したアミノ酸が出現頻度の高いアミノ酸であるといえる。   (Ii) Furthermore, the amino acid type is analyzed for each of the amino acid sequences shared by the domain peptides subjected to the multiple alignment analysis and the adjacent amino acids adjacent to each other, and 50% of all domain peptides, preferably Is referred to as selecting a range in which 80%, more preferably 90%, and most preferably 100% have the same amino acids (hereinafter referred to as “polypeptides selected by frequency of appearance”). In FIG. 7, it can be said that amino acids indicated by black ellipses are amino acids having a high appearance frequency.

本発明の構造モチーフ配列は、存在頻度により選択されたポリペプチドと出現頻度により選択されたポリペプチドの共通部分を選択することにより同定することができる。図7では、最下段に示した部分が構造モチーフとして選択することができる。また、マルチプルアラインメントを行なう際、取得されたドメインポリペプチドの部分アミノ酸配列が完全に一致するドメインポリペプチド群をファミリーとしてグループ化しておくと、これらのファミリー内で上記構造モチーフの解析を行なうこともできる。例えば、図7では、黒塗り部分のアミノ酸配列が完全に一致したファミリーA、斜線部分のアミノ酸配列が完全一致したファミリーB、縦線部分のアミノ酸配列が完全一致したファミリーC等のようにファミリー化することができる。   The structural motif sequence of the present invention can be identified by selecting the common part of the polypeptide selected by the occurrence frequency and the polypeptide selected by the appearance frequency. In FIG. 7, the part shown at the bottom can be selected as the structural motif. In addition, when performing multiple alignment, grouping domain polypeptides that completely match the partial amino acid sequences of the acquired domain polypeptides as a family can also analyze the above structural motifs within these families. it can. For example, in FIG. 7, family A is a family such that the amino acid sequence of the black portion is completely matched, Family B is the amino acid sequence of the shaded portion is completely matched, Family C is the amino acid sequence of the vertical portion is completely matched. can do.

かくして同定した構造モチーフ配列としては、例えば、PPARγ2に相互作用する構造モチーフとして配列表の配列番号24または25に記載のアミノ酸配列が、またTGFβの細胞内情報伝達因子smad3に相互作用する構造モチーフとして配列表の配列番号26または27に記載のアミノ酸配列が、さらに免疫抑制剤であるFK506(タクロリムス、J. Antibiot.(Tokyo), 40(9), 1249-55(1987))に相互作用する構造モチーフとして配列表の配列番号28に記載のアミノ酸配列等が挙げられる。このような構造モチーフ配列は、これをコードするDNAを周知の方法で調製し、これを上記のような周知の方法で翻訳することにより調製取得することができるし、化学合成によって合成ポリペプチドとして取得することもできる。   As the structural motif sequence thus identified, for example, the amino acid sequence described in SEQ ID NO: 24 or 25 in the sequence listing as a structural motif that interacts with PPARγ2, and the structural motif that interacts with the intracellular signal transduction factor smad3 of TGFβ A structure in which the amino acid sequence described in SEQ ID NO: 26 or 27 in the sequence listing further interacts with FK506 (tacrolimus, J. Antibiot. (Tokyo), 40 (9), 1249-55 (1987)), which is an immunosuppressant Examples of the motif include the amino acid sequence set forth in SEQ ID NO: 28 in the Sequence Listing. Such a structural motif sequence can be prepared and obtained by preparing a DNA encoding it by a well-known method and translating it by a well-known method as described above, or as a synthetic polypeptide by chemical synthesis. It can also be acquired.

また、構造モチーフ配列は、これに変異をいれることにより変容した機能を有する構造モチーフを取得することもできる。このような構造モチーフも本発明の範囲に入るものである。「変容した機能」とは、例えば、標的物質への結合力が強いものや相互作用が強いもの等が挙げられる。変異を導入するアミノ酸としては、上記の出現頻度の解析で最も高いアミノ酸の出現頻度が60%以下のものを選択することができる。変異を導入した構造モチーフは、標的物質と接触させ、その相互作用を上記の方法で解析することができ、野生型と比較することによれば、該構造モチーフの変容した機能を同定することができる。構造モチーフへの変異の導入方法は、それ自体既知の通常用いられる方法で行うことができる。例えば、構造モチーフをコードするDNAに市販の点変異導入キット等を用いて変異を入れ、これを周知の方法で翻訳することにより調製することができるし、また化学合成によってもポリペプチドとして合成することができる。   In addition, a structural motif having a modified function can be obtained by adding a mutation to the structural motif sequence. Such structural motifs are also within the scope of the present invention. Examples of the “transformed function” include those having a strong binding force to the target substance and those having a strong interaction. As the amino acid to be introduced with a mutation, the amino acid having the highest appearance frequency of 60% or less in the analysis of the appearance frequency can be selected. The structural motif into which the mutation has been introduced can be brought into contact with the target substance, and its interaction can be analyzed by the above method. By comparing with the wild type, the transformed function of the structural motif can be identified. it can. The method for introducing a mutation into a structural motif can be carried out by a commonly used method known per se. For example, it can be prepared by introducing a mutation into a DNA encoding a structural motif using a commercially available point mutation introduction kit, etc., and translating this using a well-known method, or by chemical synthesis as a polypeptide. be able to.

(3)ドメインポリペプチドあるいは構造モチーフと標的物質複合体の立体構造解析
本発明の1つは、(i)上記で取得されたドメインポリペプチドあるいは構造モチーフと標的物質との複合体を作製する工程、(ii)該複合体の立体構造解析を行い標的物質と該ポリペプチドまたは構造モチーフとの結合部位を特定する工程、(iii)同定された結合部位から標的物質の結合空間を予測して、該結合空間に合う化合物を設計する工程を含むことを特徴とする標的物質と相互作用する化合物の分子設計方法である。
(3) Three-dimensional structure analysis of domain polypeptide or structural motif and target substance complex One of the present inventions is (i) a step of producing a complex of the domain polypeptide or structural motif obtained above and the target substance. (Ii) performing a three-dimensional structure analysis of the complex and identifying a binding site between the target substance and the polypeptide or structural motif; (iii) predicting a binding space of the target substance from the identified binding site; A molecular design method for a compound that interacts with a target substance, comprising a step of designing a compound that fits the binding space.

「ドメインポリペプチドあるいは構造モチーフと標的物質との複合体」とは、両分子が相互作用をするような立体構造および配置で複合体を形成したものを意味し、異なる複数のドメインポリペプチドあるいは構造モチーフが標的物質に結合したものでもよい。本発明は最終的に、ドメインポリペプチドあるいは構造モチーフが、標的物質と結合した場合の立体構造をもとに、標的物質と相互作用する化合物の構造を設計する方法であるので、ドメインポリペプチドあるいは構造モチーフは標的物質と結合して相互作用する機能を有する限りでより短鎖(立体構造が低体積)であることが好ましい。   “Complex of domain polypeptide or structural motif and target substance” means a complex formed with a three-dimensional structure and arrangement in which both molecules interact with each other, and a plurality of different domain polypeptides or structures The motif may be bound to the target substance. Since the present invention is finally a method for designing the structure of a compound that interacts with a target substance based on the three-dimensional structure when the domain polypeptide or structural motif binds to the target substance, As long as the structural motif has a function of binding to and interacting with the target substance, it is preferably a shorter chain (stereostructure has a low volume).

本発明で取得される構造モチーフ、特に短鎖のモチーフはそれ自体が医薬としての活性を有する可能性がある。このポリペプチドの構造をさらに最適化することで、より優れた医薬とすることができる。これらを本明細書において「短鎖ポリペプチド」と称することがある。
結合した「標的物質と標的物質と該ポリペプチドまたは構造モチーフとの結合部位」とは、両分子が相互作用をするような立体構造及び配置を保つための結合位置(以下)、これを「ホットスポット」と称することがある)を意味する。
「標的物質の結合空間」とは、標的物質がタンパク質の場合は、これと相互作用するタンパク質もしくは化合物、ポリペプチドの結合する空間を意味し、また、標的物質が化合物もしくはポリペプチドの場合には、これと相互作用するタンパク質の結合空間を意味する。具体的には、標的物質がタンパク質であり、これと相互作用するものがポリペプチドの場合、標的物質に結合するタンパク質のホットスポット部位に存在するアミノ酸側鎖はタンパク質と結合したポリペプチドのアミノ酸側鎖と立体構造的に安定な複合体を形成する。このため、標的タンパク質のホットスポット部位に存在するアミノ酸およびその側鎖の正確な空間位置が解析可能となり、上記部位に作用する化合物の分子設計に極めて重要な情報となる。
The structural motifs obtained by the present invention, particularly short-chain motifs, may themselves have pharmaceutical activity. By further optimizing the structure of this polypeptide, it can be made a more excellent medicine. These are sometimes referred to herein as “short polypeptides”.
The bound `` target substance and the binding site between the target substance and the polypeptide or structural motif '' means a binding position (hereinafter referred to as `` hot position '') for maintaining a three-dimensional structure and arrangement in which both molecules interact. It may be referred to as “spot”).
“Target substance binding space” means a protein, compound, or polypeptide binding space that interacts with the target substance when the target substance is a protein, and when the target substance is a compound or polypeptide. , And means the binding space of proteins that interact with this. Specifically, when the target substance is a protein and the substance that interacts with it is a polypeptide, the amino acid side chain present at the hot spot site of the protein that binds to the target substance is the amino acid side of the polypeptide bound to the protein. Forms a conformationally stable complex with the chain. This makes it possible to analyze the exact spatial positions of amino acids and their side chains present at the hot spot site of the target protein, which is extremely important information for the molecular design of compounds that act on the site.

上記工程は、それ自体既知の方法を適宜組み合わせて行うことができる。例えば、(i)上記で取得されたドメインポリペプチドあるいは構造モチーフと標的物質との複合体を作製する工程、(ii)該複合体の立体構造解析を行い標的物質と該ポリペプチドまたは構造モチーフとの結合部位を特定する工程については、立体構造の解析は、X線解析やNMR法などを用いることができ、例えばDuncan E. McRee etal.,Practical Protein Crystallography(second edition(1999),Academic Prに記載の方法等を用いることができる。(iii)同定された結合部位から標的物質の結合空間を予測して、該結合空間に合う化合物を設計する工程は創薬化学(第1版)、長野哲雄、夏苅英昭、原博、東京化学同人(2004)、あるいは最新創薬化学(上)(下)、C.G. Wermth、
テクノミック(1998)に記載の方法等を用いて行なうことができる。
The above steps can be performed by appropriately combining methods known per se. For example, (i) a step of producing a complex of the domain polypeptide or structural motif obtained above and a target substance, (ii) a three-dimensional structure analysis of the complex, and the target substance and the polypeptide or structural motif As for the step of identifying the binding site, X-ray analysis, NMR method, etc. can be used to analyze the three-dimensional structure. For example, Duncan E. McRee et al., Practical Protein Crystallography (second edition (1999), Academic Pr) (Iii) The process of predicting the binding space of a target substance from the identified binding site and designing a compound that fits the binding space is a drug discovery chemistry (first edition), Tetsuo Nagano. , Hideaki Natsume, Hiroshi Hara, Tokyo Chemical Doujin (2004), or the latest drug discovery chemistry (top) (bottom), CG Wermth,
The method described in Technomic (1998) can be used.

かくして設計された短鎖ポリペプチドや化合物は、これを周知の方法で合成し、標的物質と接触させて、設計のもととなったドメインポリペプチドあるいは構造モチーフと同様の相互作用を示すかを確認する。ここで、標的物質が疾病に関連するものである場合、上記方法で設計された医薬候補化合物は、それ自体既知の方法により試験管内、あるいは生体内における薬理学的または生理学的試験により、その医薬としての活性や安全性のスクリーニングを行なうことにより該疾病治療薬とすることができる。この場合、上記工程により得た化合物を有効成分とする医薬組成物を製造する方法も本発明に含まれる。   Whether the short polypeptide or compound thus designed is synthesized by a well-known method and brought into contact with the target substance, whether or not it shows the same interaction as the domain polypeptide or structural motif from which it was designed. Check. Here, when the target substance is related to a disease, the drug candidate compound designed by the above-described method is used for the drug candidate compound in a test tube or a pharmacological or physiological test in vivo by a method known per se. It is possible to obtain a therapeutic agent for the disease by screening for activity and safety. In this case, a method for producing a pharmaceutical composition containing the compound obtained in the above step as an active ingredient is also included in the present invention.

かくして得られる医薬化合物はそれ自体を単独で用いることも可能であるが、薬学的に許容され得る担体と配合して医薬組成物として用いることもできる。この時の有効成分の担体に対する割合は、1〜90重量%の間で変動され得る。 本発明で得られた医薬化合物は、必要に応じて糖衣を施した錠剤、カプセル剤、軟カプセル剤、散剤、顆粒剤、細粒剤、シロップ剤、乳剤、懸濁剤、液剤等の剤形として経口的に投与してもよいし、あるいは薬学的に許容し得る液との無菌性溶液または懸濁剤形等の注射剤として非経口的投与、例えば静脈内投与、筋肉内投与、局所内投与、皮下投与してもよい。また坐薬としての投与も可能である。   The pharmaceutical compound thus obtained can itself be used alone, but can also be used as a pharmaceutical composition by blending with a pharmaceutically acceptable carrier. The ratio of the active ingredient to the carrier at this time can vary between 1 and 90% by weight. The pharmaceutical compound obtained in the present invention is in the form of tablets, capsules, soft capsules, powders, granules, fine granules, syrups, emulsions, suspensions, liquids, etc. May be administered orally or parenterally as an injectable solution such as a sterile solution or suspension form with a pharmaceutically acceptable liquid, eg intravenous, intramuscular, topical Administration or subcutaneous administration may be used. Administration as a suppository is also possible.

経口、経腸、非経口の組成物を調製する場合には、有機または無機の固体または液体の担体、希釈剤とともに通常用いられる単位容量形態で混和することによって行うことができる。これら製剤における有効成分量は、指示された範囲の適当な容量が得られるようにするものである。 固形製剤を製造する際に用いられる賦形剤としては、例えば乳糖、ショ糖、デンプン、タルク、セルロース、デキストリン、カオリン、炭酸カルシウム等が用いられる。経口投与のための液体製剤、すなわちシロップ剤、懸濁剤、液剤等は、一般的に用いられる不活性な希釈剤、例えば水、植物油等を含む。この製剤は、不活性な希釈剤以外に補助剤、例えば湿潤剤、懸濁補助剤、甘味剤、香味剤、着色剤、保存剤、安定剤等を含むこともできる。   When an oral, enteral or parenteral composition is prepared, it can be prepared by mixing in an organic or inorganic solid or liquid carrier or diluent in a unit volume form usually used. The amount of active ingredient in these preparations is such that an appropriate volume within the indicated range can be obtained. Examples of excipients used in producing the solid preparation include lactose, sucrose, starch, talc, cellulose, dextrin, kaolin, calcium carbonate and the like. Liquid preparations for oral administration, i.e. syrups, suspensions, solutions, etc., contain generally used inert diluents such as water, vegetable oils and the like. In addition to the inert diluent, the preparation can also contain adjuvants such as wetting agents, suspending aids, sweetening agents, flavoring agents, coloring agents, preservatives, stabilizers and the like.

非経口投与の製剤、すなわち注射剤、坐剤等の製造に用いられる溶剤または懸濁化剤としては、例えば水、プロピレングリコール、ポリエチレングリコール、ベンジルアルコール、オレイン酸エチル、レシチン等が挙げられる。坐剤に用いられる基剤としては、例えばカカオ脂、乳化カカオ脂、ラウリン脂、ウィテップゾール等が挙げられる。
なお、本明細書における、上記した核酸の単離、調製、核酸の連結、核酸の合成、PCR、プラスミドの構築、無細胞系の遺伝子操作技術は、市販のキットなどを用いた場合にはその取扱説明書に準じ、それ以外で特に明記しない限り、Sambrook et al.(1998)Molecular Clonimg, 2nd Edition, Cold Spring Harbor Laboratory Pressに記載の方法またはそれに準じた方法により行うことができる。
Examples of the solvent or suspending agent used for the preparation of parenteral preparations, that is, injections, suppositories, and the like include water, propylene glycol, polyethylene glycol, benzyl alcohol, ethyl oleate, lecithin and the like. Examples of bases used for suppositories include cocoa butter, emulsified cocoa butter, laurin butter, witepsol and the like.
In this specification, the nucleic acid isolation, preparation, nucleic acid ligation, nucleic acid synthesis, PCR, plasmid construction, and cell-free genetic manipulation techniques described above are the same when a commercially available kit is used. According to the instruction manual, unless otherwise specified, Sambrook et al. (1998) Molecular Clonimg, 2nd Edition, Cold Spring Harbor Laboratory Press, or a method analogous thereto.

以下、実施例を挙げて本発明を詳細に説明するが、本発明の範囲はこれらの実施例により限定されるものではない。
実施例1 標的タンパク質と相互作用するタンパク質を含む対応付けライブラリーおよび該タンパク質をコードするDNAの取得
(1)対応付け分子ライブラリーの調製
(1−i)ランダムプライマーを利用した対応付け分子作成用cDNAライブラリーの作製 oligo dTカラムで精製したヒト脳由来のmRNA(CLONTECH社製)0.5μgを鋳型としてランダムプライミング法により逆転写反応を行った。ランダムプライミング法に用いるランダムプライマーとして9塩基からなるランダム配列と後述のPCRで3’側共通配列となる配列を含むプライマー(配列番号29)を0.2あるいは0.4pmol、または、2あるいは4pmol用い、SuperScriptDouble Strand cDNA Synthesis Kit(Invitrogen社製)に付属の逆転酵素を利用し、mRNAから相補的な一本鎖cDNAライブラリーを合成した。これを上記キットに添付されたマニュアルに従って、RNaseHを用いてcDNAと二本鎖化しているRNAを部分分解し、E.coliDNAポリメラーゼIにより第2鎖のDNAを合成した。次にE.coli DNAリガーゼにて合成された第2鎖を連結後、T4 DNAポリメラーゼより得られたcDNA末端の平滑化を行い、この二本鎖化されたcDNAをエタノール沈殿にて精製した。
EXAMPLES Hereinafter, although an Example is given and this invention is demonstrated in detail, the scope of the present invention is not limited by these Examples.
Example 1 Acquisition of a correspondence library containing proteins that interact with a target protein and DNA encoding the protein (1) Preparation of a correspondence molecule library (1-i) For creation of a correspondence molecule using random primers Preparation of cDNA library Reverse transcription reaction was performed by random priming method using 0.5 μg of human brain-derived mRNA (CLONTECH) purified by oligo dT column as a template. As a random primer used in the random priming method, a primer (SEQ ID NO: 29) containing a random sequence consisting of 9 bases and a sequence that becomes the 3 ′ common sequence in PCR described below (0.2 or 0.4 pmol, or 2 or 4 pmol), SuperScript Double Strand A complementary single-stranded cDNA library was synthesized from mRNA using the reverse enzyme attached to cDNA Synthesis Kit (manufactured by Invitrogen). In accordance with the manual attached to the kit, the RNA double-stranded with cDNA was partially decomposed using RNaseH, and the second strand DNA was synthesized with E. coli DNA polymerase I. Next, after ligating the second strand synthesized with E. coli DNA ligase, the cDNA ends obtained from T4 DNA polymerase were smoothed, and the double-stranded cDNA was purified by ethanol precipitation.

一方、無細胞蛋白合成用の翻訳エンハンサー配列と、FLAGをコードする遺伝子を含む一本鎖DNA(配列番号30)とその3’末端に相補的な配列からなるDNA(配列番号31)をアニーリングしたアダプターを調製した。このアダプター(100μM)とcDNA(4μl)を混合し、DNAリガーゼ(ligationhigh;TOYOBO社製)を5μl加えて、16℃で一晩反応させ両者を結合し、QIAGEN社DNA purifucation Kitを用いて精製後、50μlのnucleasefree水に溶解した。   On the other hand, a translation enhancer sequence for cell-free protein synthesis, a single-stranded DNA (SEQ ID NO: 30) containing a gene encoding FLAG and a DNA (SEQ ID NO: 31) consisting of a sequence complementary to its 3 ′ end were annealed. An adapter was prepared. Mix this adapter (100 μM) with cDNA (4 μl), add 5 μl of DNA ligase (ligationhigh; manufactured by TOYOBO), react at 16 ° C overnight, bind both, and purify using QIAGEN DNA purifucation Kit And dissolved in 50 μl of nucleasefree water.

次にSP6プロモーター、翻訳エンハンサー配列と開始コドンからなるフォワードプライマー(配列番号32)および後述するピューロマイシンリンカーとの結合のための配列を有するリバースプライマー(配列番号33)を用い、TOYOBO社KODplusを用いたPCR法にて94℃2分間の反応後、98℃10秒、60℃30秒、68℃5分の反応を16回から18回実施後、さらに68℃3分反応させた。このPCRにより増幅されたDNAを、対応付け分子作成用cDNAライブラリーとした。   Next, the SP6 promoter, a forward primer consisting of a translation enhancer sequence and a start codon (SEQ ID NO: 32), and a reverse primer (SEQ ID NO: 33) having a sequence for binding to the puromycin linker described later were used with TOYOBO KODplus. After the reaction at 94 ° C. for 2 minutes by the conventional PCR method, the reaction at 98 ° C. for 10 seconds, 60 ° C. for 30 seconds and 68 ° C. for 5 minutes was performed 16 to 18 times, and further reacted at 68 ° C. for 3 minutes. The DNA amplified by this PCR was used as a cDNA library for creating a corresponding molecule.

(1−ii)対応付け分子作成用cDNAライブラリーから対応付け分子ライブラリーの作製 Promega社製Ribomax Large ScaleRNA Production Systemを利用し、本システムの方法に従い、上記で作製した対応付け分子作成用cDNAライブラリーからmRNAを合成した。そして、このmRNAに対してキャップアナログ(7.2mM、RNA Capping Analog ; Gibco BRL社製)を加え、定法によりmRNAの5'側を修飾した。次に特願2003-315385号明細書に記載のピューロマイシンリンカー(T-splint5.9FA)とmRNAとの混合モル比が1.2:1から3.0:1になる様にT4RNA リガーセ buffer (50mM Tris-HCl、pH7.5、10mM MgCl2、10mM DTT、1mM ATP)に溶解し、ジメチルスルホキシドを最終濃度5%になるように加えた。この溶液を94℃になるまで加熱後、10分かけて25℃まで冷却することによりアニーリングした。この後、T4RNAリガーゼ(Takara社製)を至適量加えて25℃で約1時間反応させた後、RNeasy Mini Kit (QIAGEN社製)を用いて精製し、対応付け分子作製用mRNAライブラリーとした。 (1-ii) Creation of a mapping molecule library from a cDNA library for creating mapping molecules Using the Ribomax Large Scale RNA Production System manufactured by Promega, according to the method of this system, the cDNA library for creating mapping molecules prepared above is used. MRNA was synthesized from the rally. Then, a cap analog (7.2 mM, RNA Capping Analog; manufactured by Gibco BRL) was added to the mRNA, and the 5 ′ side of the mRNA was modified by a conventional method. Next, T4RNA ligase buffer (50 mM Tris-HCl) was prepared so that the mixing molar ratio of puromycin linker (T-splint5.9FA) described in Japanese Patent Application No. 2003-315385 and mRNA was 1.2: 1 to 3.0: 1. , PH 7.5, 10 mM MgCl 2 , 10 mM DTT, 1 mM ATP), and dimethyl sulfoxide was added to a final concentration of 5%. This solution was heated to 94 ° C. and then annealed by cooling to 25 ° C. over 10 minutes. After that, an optimal amount of T4RNA ligase (Takara) was added and allowed to react at 25 ° C. for about 1 hour, and then purified using RNeasy Mini Kit (QIAGEN) to obtain an mRNA library for creating a corresponding molecule. .

次にTOYOBO社製PROTEIOS(小麦胚芽無細胞タンパク質合成系)を用い、同キット添付の方法に従い、上記のピューロマイシンリンカーが結合した対応付け分子作製用mRNAライブラリー(64μg)からタンパク質合成を行った。この反応により、ピューロマイシンリンカーが結合したmRNAとタンパク質が共有結合した対応付け分子(本明細書中では、これを「タンパク質−核酸連結体」又は「対応付け分子」と称することがある)が作製された。また、対応付け分子のライブラリーを、「対応付け分子ライブラリー」と称することがある。   Next, using PROYOIOS (wheat germ cell-free protein synthesis system) manufactured by TOYOBO, protein synthesis was carried out from the mRNA library (64 μg) for creating a corresponding molecule bound with the puromycin linker according to the method attached to the kit. . As a result of this reaction, an association molecule in which mRNA with a puromycin linker is bound to a protein and a protein are covalently bound (in this specification, this may be referred to as a “protein-nucleic acid conjugate” or “association molecule”) is produced. It was done. In addition, a library of mapping molecules may be referred to as a “matching molecule library”.

(1−iii)対応付け分子ライブラリーの逆転写反応および精製
上記(2)で得られた対応付け分子ライブラリーを含む溶液が1MNaCl、100mM Tris-HCl(pH8.0)、10mM EDTA、0.25% Triton-X100になるように調整し、9.6nmolのBiotinylatedOligo(dT)Probe(Promega社製)が結合したMAGNOTEX-SA(Takara社製)360μlと4℃、約1時間結合させた。この後、上清を除き、洗浄bufferA(1M NaCl、100mM Tris-HCl(pH8.0)、0.25% Triton-X100)で3回洗浄後、buffer B(500mM NaCl、100mMTris-HCl(pH8.0)、0.25% Triton-X100)で1回洗い、さらにbuffer C(250mM NaCl、100mM Tris-HCl(pH8.0)、0.25%Triton-X100)で1回洗い、次いで、MilliQ水90μlで3回溶出し、poly-Aを用いて対応付け分子の精製を行なった。
(1-iii) Reverse transcription reaction and purification of mapping molecule library The solution containing the mapping molecule library obtained in (2) above is 1 M NaCl, 100 mM Tris-HCl (pH 8.0), 10 mM EDTA, 0.25% Triton-X100 was prepared, and MAGNOTEX-SA (Takara) 360 μl bound with 9.6 nmol Biotinylated Oligo (dT) Probe (Promega) was bound at 4 ° C. for about 1 hour. After this, the supernatant was removed, washed 3 times with washing buffer A (1M NaCl, 100 mM Tris-HCl (pH 8.0), 0.25% Triton-X100), and then buffer B (500 mM NaCl, 100 mM Tris-HCl (pH 8.0)). Wash once with 0.25% Triton-X100), then once with buffer C (250 mM NaCl, 100 mM Tris-HCl (pH 8.0), 0.25% Triton-X100), then elute three times with 90 μl MilliQ water. The corresponding molecule was purified using poly-A.

次に精製された対応付け分子のリンカーに含まれる逆転写用配列を利用し、SuperScript III Reverse Transcriptase (Invitrogen社製)を用いて逆転写反応を行った。すなわち上記精製工程の溶出画分270μlに対し、108μlの5×RT Buffer、54μl の10mM dNTP、27μl の0.1M DTT、21.6μl の40U/μl RNase Inhibitor(WAKO社製)、27μlの200U/μl RTase、32.4μl のnuclease free水を添加し、50℃2分反応後、26℃に至るまで1秒間に0.4℃温度を降下させ逆転写反応を行った。   Next, reverse transcription reaction was performed using SuperScript III Reverse Transcriptase (manufactured by Invitrogen) using the reverse transcription sequence contained in the linker of the purified mapping molecule. That is, for 270 μl of the elution fraction in the above purification step, 108 μl of 5 × RT Buffer, 54 μl of 10 mM dNTP, 27 μl of 0.1 M DTT, 21.6 μl of 40 U / μl RNase Inhibitor (WAKO), 27 μl of 200 U / μl RTase Then, 32.4 μl of nuclease free water was added, reacted at 50 ° C. for 2 minutes, and then the reverse transcription reaction was performed by decreasing the temperature by 0.4 ° C. per second until reaching 26 ° C.

次に上記で逆転写反応した反応液540μlを20mM HEPES-KOH(pH7.8)、100mM KCl、0.1mM EDTA、1mM DTT、0.1% Np40、10%グリセロール、50μg/ml BSA、0.5μg/ml tRNAになるように調整した。これを、40μlの抗FLAG M2抗体アガロースビーズ(Sigma社製)と4℃で一晩結合させ、100μlのBindingBuffer(20mM HEPES-KOH(pH7.8)、100mM KCl、0.1mM EDTA、1mM DTT、0.1% Np40、10% グリセロール、50μg/mlBSA、0.5μg/ml tRNA)で3回洗浄後、40μlの3×FLAG peptide(Sigma社製) Buffer(最濃度100μM 3×FLAGpeptideを含むBinding Buffer)で3回溶出し、精製された核酸部分がDNAとRNAのハイブリッドである対応付け分子ライブラリー(本明細書中では、これを「タンパク質−逆転写連結体群」又は「RNA-DNA対応付けライブラリー」と称することがある)を得た。   Next, 540 μl of the reaction solution subjected to the reverse transcription reaction described above was added 20 mM HEPES-KOH (pH 7.8), 100 mM KCl, 0.1 mM EDTA, 1 mM DTT, 0.1% Np40, 10% glycerol, 50 μg / ml BSA, 0.5 μg / ml tRNA. It was adjusted to become. This was combined with 40 μl of anti-FLAG M2 antibody agarose beads (Sigma) at 4 ° C. overnight, and 100 μl of Binding Buffer (20 mM HEPES-KOH (pH 7.8), 100 mM KCl, 0.1 mM EDTA, 1 mM DTT, 0.1 After washing 3 times with% Np40, 10% glycerol, 50 μg / ml BSA, 0.5 μg / ml tRNA), 3 times with 40 μl of 3 × FLAG peptide (manufactured by Sigma) Buffer (binding buffer containing a maximum concentration of 100 μM 3 × FLAG peptide) An association molecule library in which the eluted and purified nucleic acid portion is a hybrid of DNA and RNA (in the present specification, this is referred to as “protein-reverse transcription linkage group” or “RNA-DNA association library”. Sometimes obtained).

(2)標的タンパク質(PPARγ2)に相互作用するタンパク質を有する対応付け分子および該タンパク質コードする遺伝子の取得
(2−i)標的タンパク質と対応付け分子ライブラリーの接触および融合体の取得
スクリーニングの標的タンパク質として核内受容体(PPARγ2)を用い、これに相互作用するタンパク質(ポリペプチド)のスクリーニングを、実施例1にて調製した対応付け分子ライブラリーから行った。PPARγ2は506アミノ酸からなる核内受容体であり、糖尿病や高脂血症に関与することが知られている。
まず常法に従って、ヒトPPARγ2(GenBank accession No.D83233.1, AF012874.1, L40904.2, :配列番号34)のN末に融合タンパク質としてグルタチオンS−トランスフェラーゼ(gulutathione S-transferase:GST)をコードするDNAを付加させて、大腸菌用発現ベクターに挿入したDNAを調製し、これを大腸菌(BL21(DE3)pLysS)で発現させた。この際、GSTとPPARγ2の間にTEVプロテアーゼで切断できるサイトを導入した。得られた融合タンパク質はGlutathione Sepharose4Bビーズ(アマシャムファルマシア社製)を用いて精製し、脱塩カラムにて溶出に使用したグルタチオンを除去した。精製の詳細な方法は、上記の合成反応で得られたタンパク質(25μg)をBinding Buffer(100mM KCl、20mM HEPES-KOH(pH7.8)、0.1% NP40、0.1mM EDTA、1mM DTT、0.5μg/ml tRNA、50μg/ml BSA、10%グリセロール)に溶解し、Glutathione Sepharose4Bビーズ(アマシャムファルマシア社製)に結合させた後、100μlのBinding Bufferで3回洗浄操作を行った。またネガティブコントロール用としてGSTタンパク質のみを合成し、同様の方法で精製した。
(2) Acquisition of a mapping molecule having a protein that interacts with the target protein (PPARγ2) and a gene encoding the protein (2-i) Contact between the target protein and the mapping molecule library and acquisition of a fusion target protein for screening A nuclear receptor (PPARγ2) was used as a screen, and a protein (polypeptide) interacting with this was screened from the correspondence molecule library prepared in Example 1. PPARγ2 is a nuclear receptor consisting of 506 amino acids and is known to be involved in diabetes and hyperlipidemia.
First, according to a conventional method, glutathione S-transferase (GST) is encoded as a fusion protein at the N-terminus of human PPARγ2 (GenBank accession No. D83233.1, AF012874.1, L40904.2 ,: SEQ ID NO: 34). The DNA to be inserted was added to prepare a DNA inserted into an expression vector for E. coli, which was expressed in E. coli (BL21 (DE3) pLysS). At this time, a site capable of being cleaved by TEV protease was introduced between GST and PPARγ2. The obtained fusion protein was purified using Glutathione Sepharose 4B beads (manufactured by Amersham Pharmacia) to remove glutathione used for elution on a desalting column. For the detailed purification method, the protein (25 μg) obtained in the above synthesis reaction was bound with Binding Buffer (100 mM KCl, 20 mM HEPES-KOH (pH 7.8), 0.1% NP40, 0.1 mM EDTA, 1 mM DTT, 0.5 μg / It was dissolved in ml tRNA, 50 μg / ml BSA, 10% glycerol and bound to Glutathione Sepharose 4B beads (Amersham Pharmacia), followed by washing with 100 μl of Binding Buffer three times. For the negative control, only GST protein was synthesized and purified by the same method.

上記で得られたGST-PPARγタンパク質およびGSTタンパク質を実施例1にて調製した対応付け分子ライブラリーと接触させた。まず、実施例1で得られた対応付け分子ライブラリーをGlutathione Sepharose4Bビーズ(タンパク質を結合させていないビース)と室温で30分間混合し、ビーズを除去後、上記のPPARγ2を結合させたGlutathione Sepharose4Bビーズに室温で1から2時間反応させた後、BindingBufferを用いて3回から10回の範囲で洗浄した。   The GST-PPARγ protein and GST protein obtained above were brought into contact with the corresponding molecule library prepared in Example 1. First, the correspondence molecule library obtained in Example 1 was mixed with Glutathione Sepharose 4B beads (beads not bound with protein) at room temperature for 30 minutes, and after removing the beads, the Glutathione Sepharose 4B beads bound with the above PPARγ2 were used. And allowed to react at room temperature for 1 to 2 hours, and then washed 3 to 10 times with Binding Buffer.

次に、上記接触によって得られたGST-PPARγタンパク質あるいはGSTタンパク質と対応付け分子の融合体を取得するために、TEVプロテアーゼ(インビトロジェン社製)2μlを添加したBindingBuffer 100μlを添加し、室温で1時間反応させ、この上清を回収する操作を2回繰り返した。   Next, in order to obtain the GST-PPARγ protein obtained by the above contact or the fusion of the GST protein and the corresponding molecule, 100 μl of BindingBuffer added with 2 μl of TEV protease (manufactured by Invitrogen) was added for 1 hour at room temperature. The operation of reacting and collecting the supernatant was repeated twice.

(2−ii)標的タンパク質と相互作用するタンパク質を有する対応付け分子および該タンパク質をコードするDNAの回収
上記(1)で得られたGST-PPARγ2あるいはGSTと対応付け分子の融合体から、対応付け分子の核酸部分のみをDNAとして取得した。具体的には、上記で得られた溶出液200μlに対して100μg/mlのRNase A(キアゲン社製)を40μlあるいは10U/μlのRNase H(TOYOBO社製)を10μl添加し、室温で5分あるいは37℃で30分反応させることにより、対応付け分子の二本鎖形成(RNA/DNA)しているRNA鎖部分を除去し、エタノール沈殿により精製後、20μlのNucleaseFree水に懸濁した。ここで、得られた分子に含まれるDNAは、標的タンパク質と相互作用するタンパク質をコードするものである。ここまでの一連の操作を、以下「DNA取得操作」と称することがある。
(2-ii) Retrieval of a mapping molecule having a protein that interacts with a target protein and DNA encoding the protein From the fusion of GST-PPARγ2 or GST and the mapping molecule obtained in (1) above, mapping Only the nucleic acid part of the molecule was obtained as DNA. Specifically, 40 μl of 100 μg / ml RNase A (Qiagen) or 10 μl of 10 U / μl RNase H (TOYOBO) was added to 200 μl of the eluate obtained above, and the mixture was stirred for 5 minutes at room temperature. Alternatively, the reaction was allowed to proceed at 37 ° C. for 30 minutes to remove the RNA strand portion where the corresponding molecule was double-stranded (RNA / DNA), purified by ethanol precipitation, and suspended in 20 μl of NucleaseFree water. Here, the DNA contained in the obtained molecule encodes a protein that interacts with the target protein. The series of operations so far may be hereinafter referred to as “DNA acquisition operation”.

このDNAを用いて、再度上記実施例1に記載の方法を実施し、標的タンパク質に相互作用するタンパク質を有する対応付け分子の濃縮を行なった。   Using this DNA, the method described in Example 1 was performed again, and the corresponding molecules having proteins that interacted with the target protein were concentrated.

実施例2 標的タンパク質と相互作用するタンパク質を有する対応付け分子および該タンパク質をコードする遺伝子の濃縮
上記実施例1(2)で得られたPPARγあるいはGSTと相互作用するタンパク質をコードするDNA溶液1μlを鋳型として、配列番号35および36に記載の配列からなるプライマーを用い、TOYOBO社製KODplusを用いたPCR法にて94℃で2分反応後、さらに98℃で10秒、60℃で30秒、68℃で5分の反応を18回実施後、さらに68℃で3分反応させた。次にこのPCR産物を鋳型とし、SP6プロモーターやスペーサーとのアニーリング配列を含むプライマー(配列番号32および配列番号33)を使用して実施例1に記載の方法でPCRを実施し、対応付け分子作製用cDNAライブラリーを調製した。
Example 2 Concentration of a mapping molecule having a protein that interacts with a target protein and a gene encoding the protein 1 μl of a DNA solution encoding a protein that interacts with PPARγ or GST obtained in Example 1 (2) above As a template, using a primer consisting of the sequences of SEQ ID NOs: 35 and 36, after reaction at 94 ° C. for 2 minutes by PCR using TOYOBO KODplus, further 98 ° C. for 10 seconds, 60 ° C. for 30 seconds, The reaction was carried out 18 times at 68 ° C. for 5 minutes, and further reacted at 68 ° C. for 3 minutes. Next, using this PCR product as a template, PCR was performed by the method described in Example 1 using primers (SEQ ID NO: 32 and SEQ ID NO: 33) containing an annealing sequence with the SP6 promoter and spacer, and a corresponding molecule was prepared. A cDNA library was prepared.

得られた対応付け分子作製用cDNAライブラリーについて、上記実施例1(1−ii)、(1-iii)および(2)に記載の一連の操作を行なった。上記の操作を「標的タンパク質と相互作用するタンパク質を有する対応付け分子および該タンパク質をコードする遺伝子の濃縮操作」あるいは「濃縮操作」と称することもある。
この濃縮操作を、さらに3回繰り返した。この操作により、標的タンパク質であるPPARγ2あるいはGSTに相互作用するタンパク質を有する対応付け分子および相互作用するタンパク質をコードする遺伝子の濃縮を合計4回(1回目の上記対応付け分子あるいは遺伝子の取得(実施例1に記載)は濃縮操作には含まない)繰り返したことになる。
With respect to the obtained cDNA library for creating an associating molecule, a series of operations described in Example 1 (1-ii), (1-iii) and (2) were performed. The above operation may be referred to as “concentration operation of the mapping molecule having a protein that interacts with the target protein and a gene encoding the protein” or “concentration operation”.
This concentration operation was repeated three more times. By this operation, the correspondence molecule having a protein that interacts with the target protein PPARγ2 or GST and the concentration of the gene encoding the interacting protein are totaled four times in total (the acquisition of the first correspondence molecule or gene (execution) (Described in Example 1) is not included in the concentration operation).

これらの操作(DNA取得操作1回目、濃縮操作1〜4回目)により得られたDNAを、実施例2に記載の方法により、対応付け分子作製用mRNAライブラリーとし、各100ngを、4%ウレア変性ポリアクリルアミドゲルを用いて電気泳動した。この後、対応付け分子作製用mRNAライブラリーに結合しているピューロマイシンリンカーに導入してある蛍光(Fluoroscein)をMolecularImager(Bio Rad社製)を用いて検出し、各DNA取得、および濃縮工程後のmRNAライブラリーの泳動パターンを解析した。   The DNA obtained by these operations (first DNA acquisition operation, 1st to 4th concentration operations) was made into an mRNA library for producing a corresponding molecule by the method described in Example 2, and each 100 ng was treated with 4% urea. Electrophoresis was performed using a denaturing polyacrylamide gel. After this, the fluorescence (Fluoroscein) introduced into the puromycin linker bound to the mRNA library for creating the mapping molecule is detected using MolecularImager (Bio Rad), and after each DNA acquisition and concentration step The migration pattern of the mRNA library was analyzed.

この結果を図8に示す。レーン0はDNA取得操作で得られたDNAから、またレーン1〜4は濃縮操作1〜4回後の結果を示す。図から明らかなように、3および4回の濃縮操作の後のDNA(RNA)では、不均一なmRNAライブラリー(レーン0に記載のスメアな泳動図)と比較して、いくつかの単一なバンドが形成されていることがわかった(レーン3および4)。つまり、上記濃縮操作3〜4回で得られるDNA(RNA)はいくつかの断片に集約されていることが判った。   The result is shown in FIG. Lane 0 shows the results obtained from the DNA obtained by the DNA acquisition operation, and lanes 1 to 4 show the results after the concentration operation 1 to 4 times. As is apparent from the figure, the DNA (RNA) after 3 and 4 enrichment operations is more likely to have several singles compared to the heterogeneous mRNA library (smear electropherogram described in lane 0). It was found that a good band was formed (lanes 3 and 4). That is, it was found that DNA (RNA) obtained by the above concentration operation 3 to 4 times was concentrated into several fragments.

実施例3 塩基配列解析によるPPARγ2と相互作用するタンパク質の解析
(1)塩基配列解析
実施例2までの操作で得られた2〜4回の濃縮操作を行った対応付け分子作製用cDNAライブラリーを、常法に従って精製後、pGEM−Teasyベクター(プロメガ社製)へ挿入するクローニング操作を行った。そして挿入配列を含んでいるクローンを選択し、各回毎に約100クローンの塩基配列解析を行なった。濃縮操作3〜4回で得られた塩基配列として、図1及び図2に記載のUNIGENEデータベースに登録されていた遺伝子をコードするものがあった。
Example 3 Analysis of protein interacting with PPARγ2 by base sequence analysis (1) Base sequence analysis A cDNA library for creating a correspondence molecule obtained by performing the enrichment operation 2 to 4 times obtained by the operations up to Example 2 was prepared. Then, after purification according to a conventional method, a cloning operation for insertion into a pGEM-Teasy vector (Promega) was performed. Then, clones containing the inserted sequence were selected, and base sequence analysis of about 100 clones was performed each time. As a base sequence obtained by the concentration operation 3 to 4 times, there was one encoding a gene registered in the UNIGENE database shown in FIG. 1 and FIG.

(2)特定のアミノ酸配列の濃縮度解析
上記で得られた塩基配列をアミノ酸配列に変換し、得られたアミノ酸配列情報をもとに、マルチプルアライメント解析をソフトウェアー(Clustal W)を用いて実施した。これらのうち代表的なものを図9および配列番号1〜14に示す。この解析の結果、上記標的タンパク質としてGST-PPARγ2を用いた濃縮操作により取得されたタンパク質は、同じアミノ酸配列を含むアミノ酸数として14から55個前後の比較的短いペプチドに集約されていることが判った。さらに、核内受容体と相互作用することが知られている特徴的なアミノ酸配列(LXXL*L*-様配列、Xは任意のアミノ酸を示す。L*L*は両方がL、もしくはいずれか一方がLであることを示す)を含む新規なタンパク質が選択的に取得されていることが判った。
(2) Concentration analysis of a specific amino acid sequence The base sequence obtained above is converted into an amino acid sequence, and multiple alignment analysis is performed using software (Clustal W) based on the obtained amino acid sequence information. did. Representative of these are shown in FIG. 9 and SEQ ID NOs: 1-14. As a result of this analysis, it was found that the proteins obtained by the enrichment operation using GST-PPARγ2 as the target protein were aggregated into relatively short peptides of about 14 to 55 amino acids containing the same amino acid sequence. It was. In addition, a characteristic amino acid sequence known to interact with nuclear receptors (LXXL * L * -like sequence, X represents any amino acid. L * L * is both L or either It was found that a novel protein containing one of L was selectively obtained.

上記で塩基配列を解析した約100クローンのうち、上記LXXL*L*-様配列が出現した頻度を示した結果を図10に示す。図から明らかなように、濃縮操作を繰り返すごとにLXXL*L*-様配列を有するタンパク質の割合が増加していることがわかった(図10、白バー:PPARγ2)。一方、実施例1および2で標的タンパク質(GST-PPARγ2)ではなくGSTを用いて同様にスクリーニングを実施した結果では、LXXL*L*-様配列を有するタンパク質は全く濃縮、取得されていなかった(図10、黒バー:GST)。このことから、上記濃縮操作により得られたタンパク質は、標的タンパク質GST-PPARγ2に特異的に選択されて取得されたものであることがわかった。 FIG. 10 shows the results showing the frequency of appearance of the LXXL * L * -like sequence out of about 100 clones whose base sequences were analyzed above. As is clear from the figure, it was found that the ratio of the protein having the LXXL * L * -like sequence increased each time the concentration operation was repeated (FIG. 10, white bar: PPARγ2). On the other hand, in the results of screening in the same manner using GST instead of the target protein (GST-PPARγ2) in Examples 1 and 2, the protein having the LXXL * L * -like sequence was not concentrated or obtained at all ( FIG. 10, black bar: GST). From this, it was found that the protein obtained by the concentration operation was obtained by being specifically selected by the target protein GST-PPARγ2.

次に、上記DNA取得および濃縮操作で得られたDNA全体に対して特定のアミノ酸配列をコードするDNAの割合を解析した。特定のアミノ酸配列は、図9に記載のPPAR1ファミリーおよびPPAR2ファミリーに分類されるものを例に解析した。ここで、PPAR1ファミリーおよびPPAR2ファミリーとは、上記でマルチプルアライメント解析をソフトウェアー(ClustalW)を用いてアラインメントをした後、LXXL*L*-様配列が同じアミノ酸配列であるものをファミリーとして分類したものである。 Next, the ratio of DNA encoding a specific amino acid sequence was analyzed with respect to the entire DNA obtained by the above DNA acquisition and concentration operation. The specific amino acid sequences were analyzed by using examples classified into the PPAR1 family and PPAR2 family shown in FIG. Here, the PPAR1 family and the PPAR2 family are those in which multiple alignment analysis is aligned using software (ClustalW) and then the LXXL * L * -like sequences are the same amino acid sequence as a family. It is.

まず、常法に従って、サイバーグリーンを用いた定量PCR法(SYBER GREEN Master Mix:ABI社製)により、各濃縮回におけるPPAR1ファミリーおよびPPAR2ファミリーをコードするDNAの存在量を定量した。ネガティブコントロールとして、βActinを指標とした。また遺伝子の定量は、PPAR1ファミリーに関しては配列番号37および38の配列を有するプライマー、PPAR2ファミリーに関しては配列番号39および40の配列を有するプライマー、βActinは配列番号41および42の配列を有するプライマーを用いて実施した。   First, according to a conventional method, the abundance of DNA encoding the PPAR1 family and PPAR2 family in each enrichment round was quantified by a quantitative PCR method using Cyber Green (SYBER GREEN Master Mix: manufactured by ABI). As a negative control, βActin was used as an index. For gene quantification, primers having the sequences of SEQ ID NOs: 37 and 38 are used for the PPAR1 family, primers having the sequences of SEQ ID NOs: 39 and 40 are used for the PPAR2 family, and primers having the sequences of SEQ ID NOs: 41 and 42 are used for βActin. Carried out.

この結果を図11に示す。図11(1)は各濃縮操作により取得されたDNA10ng中のPPAR1ファミリーをコードするDNAの分子数を示し、図11(2)は各濃縮操作により取得されたDNA10ng中のPPAR2ファミリーをコードするDNAの分子数を示す。また、図11(3)は各濃縮操作により取得されたDNA10ng中のβActinをコードするDNAの分子数を示す。図から明らかなように、濃縮回が進むとともにPPAR1ファミリーおよびPPAR2ファミリーをコードするDNAの分子数が増加しており、これらのDNAが濃縮されていることが判った。一方、βActinをコードするDNAの分子数は濃縮回が進むとともに減少していくことが判った。   The result is shown in FIG. FIG. 11 (1) shows the number of molecules of DNA encoding the PPAR1 family in 10 ng of DNA obtained by each enrichment operation, and FIG. 11 (2) is the DNA encoding the PPAR2 family in 10 ng of DNA obtained by each enrichment operation. Indicates the number of molecules. FIG. 11 (3) shows the number of molecules of DNA encoding βActin in 10 ng of DNA obtained by each concentration operation. As is clear from the figure, the number of molecules of DNAs encoding the PPAR1 family and PPAR2 family increased with the progress of enrichment, indicating that these DNAs were concentrated. On the other hand, the number of molecules of βActin-encoding DNA was found to decrease with the progress of concentration.

(3)PPARγ2との結合解析
(3−i)タンパク質合成
上記(1)で得られたペプチド(図9に記載のPPAR1-6(配列番号1)、1-7(配列番号2)、1-13(配列番号3)、2-1(配列番号4)、2-5(配列番号5)、2-7(配列番号6)、2-8(配列番号7)、3-3(配列番号8)、4-1(配列番号9)、4-2(配列番号10)、5-3(配列番号11)、5-5(配列番号12)、7-5(配列番号13)、10-1(配列番号14))を以下の方法で合成した。まず、上記アミノ酸配列をコードする塩基配列の5’側に、GST及びFLAGエピトープのアミノ酸配列をコードする塩基配列を定法により結合し、このDNAに対してProc.Natl.Acad.Sci.USA、99:14652-14657(2002)に記載されている方法に準じてPCR反応を行い、転写用のDNA断片を調製した。このDNAを鋳型としてSP6RNA Polymerase(Promega社製)を用いて転写反応を行ない、mRNAを合成し、エタノール沈殿操作により得られたmRNAを精製した。このmRNAを用いたタンパク合成は特開2002-204689号公報およびProc.Natl.Acad.Sci.USA、99:14652-14657(2002)に準じたバッチ法による無細胞タンパク質合成系を用いた。
(3) Binding analysis with PPARγ2 (3-i) Protein synthesis The peptides obtained in (1) above (PPAR1-6 (SEQ ID NO: 1), 1-7 (SEQ ID NO: 2) described in FIG. 9), 1- 13 (SEQ ID NO: 3), 2-1 (SEQ ID NO: 4), 2-5 (SEQ ID NO: 5), 2-7 (SEQ ID NO: 6), 2-8 (SEQ ID NO: 7), 3-3 (SEQ ID NO: 8) ), 4-1 (SEQ ID NO: 9), 4-2 (SEQ ID NO: 10), 5-3 (SEQ ID NO: 11), 5-5 (SEQ ID NO: 12), 7-5 (SEQ ID NO: 13), 10-1 (SEQ ID NO: 14) was synthesized by the following method. First, a base sequence encoding the amino acid sequence of GST and FLAG epitope is bound by a standard method to the 5 ′ side of the base sequence encoding the amino acid sequence, and Proc. Natl. Acad. Sci. USA, 99 : A PCR reaction was performed according to the method described in 14652-14657 (2002) to prepare a DNA fragment for transcription. Using this DNA as a template, a transcription reaction was performed using SP6RNA Polymerase (Promega) to synthesize mRNA, and the mRNA obtained by ethanol precipitation was purified. Protein synthesis using this mRNA was performed using a cell-free protein synthesis system by a batch method according to Japanese Patent Application Laid-Open No. 2002-204689 and Proc. Natl. Acad. Sci. USA, 99: 14652-14657 (2002).

陽性コントロールとしてPPARγとヘテロダイマーを形成することが知られているRxRα、陰性コントロールとしてGSTとFLAGエピトープのみを有するものを上記と同様に調製した。無細胞タンパク質合成系で得られた合成溶液に含まれるGST融合蛋白質をGST96-well Detection Module(Amersham社製)を用いて定量した結果、いずれもほぼ一定量のタンパク質が合成されていることが判った。   As a positive control, RxRα known to form a heterodimer with PPARγ and a negative control having only GST and FLAG epitope were prepared in the same manner as described above. As a result of quantifying the GST fusion protein contained in the synthesis solution obtained by the cell-free protein synthesis system using the GST96-well Detection Module (Amersham), it was found that almost constant amount of protein was synthesized. It was.

(3−ii)標的タンパク質との結合解析
実施例1で大腸菌で発現させたPPARγ2タンパク質を精製後、PBS(-)により5〜10μg/mlの濃度に希釈し、96ウェルプレート(CORNING社製、透明、高結合型)に1ウェル当たり100μl(0.5〜1μg)の量で添加した。このプレートを4℃にて12時間以上静置し、PPARγ2タンパク質をプレートに固定化した。次にこのプレートをPBSで2回洗浄後、BlockingBuffer(1%BSA/PBS)を1ウェル当たり200μl添加し、インキュベーター内で37℃、200rpm、2〜3時間ブロッキング反応を行った。この後、プレートをPBSで2回洗浄し、リガンドとして10μMのチアゾリジン系化合物(ロシグリタゾン、エタノールに溶解)を含むBindingBuffer(L+) (20mM Hepes-KOH(pH 7.9)、100mM KCl、0.1mM EDTA、0.1% NP40、10%(v/v)グリセロール、50μg/mlBSA、10μM ロシグリタゾン)を1ウェル当たり95μl、あるいはリガンドを含まないBinding Buffer(L-) (20mMHepes-KOH(pH 7.9)、100mM KCl、0.1mM EDTA、0.1% NP40、10%(v/v)グリセロール、50μg/ml BSA、0.4%(v/v)エタノール)を1ウェル当たり95μl添加した。
(3-ii) Binding analysis with target protein After purifying the PPARγ2 protein expressed in E. coli in Example 1, it was diluted with PBS (−) to a concentration of 5 to 10 μg / ml, and a 96-well plate (manufactured by CORNING, (Clear, high binding type) was added in an amount of 100 μl (0.5 to 1 μg) per well. This plate was allowed to stand for 12 hours or more at 4 ° C., and PPARγ2 protein was immobilized on the plate. Next, the plate was washed twice with PBS, 200 μl of Blocking Buffer (1% BSA / PBS) was added per well, and a blocking reaction was performed in an incubator at 37 ° C., 200 rpm for 2 to 3 hours. After this, the plate was washed twice with PBS, BindingBuffer (L +) containing 10 μM thiazolidine compound (rosiglitazone, dissolved in ethanol) as a ligand (20 mM Hepes-KOH (pH 7.9), 100 mM KCl, 0.1 mM EDTA, 95% per well of 0.1% NP40, 10% (v / v) glycerol, 50 μg / ml BSA, 10 μM rosiglitazone), or Binding Buffer (L-) without ligand (20 mM Hepes-KOH (pH 7.9), 100 mM KCl, 95 mM of 0.1 mM EDTA, 0.1% NP40, 10% (v / v) glycerol, 50 μg / ml BSA, 0.4% (v / v) ethanol) was added per well.

続いて上記(3−i)で調製したGST融合タンパク質を含む合成反応液を、1ウェル当たり5μl添加し、室温にて1時間反応させた。次にこのプレートをWashBuffer(0.05%Tween20 in PBS)で3回洗浄後、Blocking Bufferにて10000倍希釈したAnti-FLAG M2Antibody-Peroxidase Conjugate(SIGMA)を1ウェル当たり100μl添加し、室温にて1時間反応させた。次にプレートをWashBufferで3回洗浄後、発色液(24mMクエン酸、51mM Na2HPO4、0.4mg/mlオルトフェニレンジアミン(OPD、SIGMA)、0.014%H2O2)を1ウェル当たり100μl添加して約5分間発色させた後、1N 硫酸溶液を1ウェル当たり100μl添加して反応を停止した。反応液の波長490nmにおける吸光度に対し、リファレンス波長を650nmとして測定した。この結果を図12に示す。   Subsequently, 5 μl of the synthesis reaction solution containing the GST fusion protein prepared in the above (3-i) was added per well and reacted at room temperature for 1 hour. Next, after washing this plate 3 times with WashBuffer (0.05% Tween20 in PBS), add 100 μl of Anti-FLAG M2 Antibody-Peroxidase Conjugate (SIGMA) diluted 10,000 times with Blocking Buffer for 1 hour at room temperature. Reacted. Next, after washing the plate 3 times with WashBuffer, add 100 μl per well of color developing solution (24 mM citric acid, 51 mM Na2HPO4, 0.4 mg / ml orthophenylenediamine (OPD, SIGMA), 0.014% H2O2) for about 5 minutes. After that, the reaction was stopped by adding 100 μl of 1N sulfuric acid solution per well. For the absorbance at a wavelength of 490 nm of the reaction solution, the reference wavelength was measured at 650 nm. The result is shown in FIG.

図から明らかなようにPPAR1-6、1-7、1-13、2-1、2-5、2-7、2-8、3-3、4-1、4-2、5-3、5-5、7-5、10-1はいずれも陰性コントロールであるGST-FLAG(図12:Negative Control)よりPPARγ2に対し高い結合活性を示した(図12:白色バー)。またこれらの結合活性はロシグリタゾンを添加することにより、PPARγ2との結合活性が上昇することが判った(図12:黒色バー)。   As is clear from the figure, PPAR1-6, 1-7, 1-13, 2-1, 2-5, 2-7, 2-8, 3-3, 4-1, 4-2, 5-3, 5-5, 7-5, and 10-1 all showed higher binding activity to PPARγ2 than GST-FLAG (FIG. 12: Negative Control) which is a negative control (FIG. 12: white bar). It was also found that the binding activity of these binding activities increased with addition of rosiglitazone (FIG. 12: black bar).

さらに、これらのうち、ポリペプチドPPAR1-7、 PPAR 1-13、PPAR 2-7に関し、そのアミノ酸配列のC末端側にKを介してビオチン結合させた合成ペプチドを化学合成により準備し、BIACORE3000(ビアコア社製)を用いたSPR測定および解析を行った。BIAapplicationshandbook、chapter4.4に従い、センサーチップ表面に上記ビオチン化したペプチドを個別に固定化した。センサーチップはSAタイプ(ビアコア社製)を用いた。センサーチップ1枚に付きフローセルが4分割されているが、フローセル1には何も固定化せずコントロール区として用い、フローセル2、3および4に各ビオチン化ペプチドを1種類ずつ固定化した。   Furthermore, among these, regarding the polypeptides PPAR1-7, PPAR 1-13, and PPAR 2-7, a synthetic peptide in which biotin is bonded to the C-terminal side of the amino acid sequence via K is prepared by chemical synthesis, and BIACORE3000 ( SPR measurement and analysis using Biacore) were performed. According to BIAapplications handbook, chapter 4.4, the biotinylated peptides were individually immobilized on the sensor chip surface. The sensor chip was an SA type (manufactured by Biacore). The flow cell attached to one sensor chip is divided into four. However, nothing was immobilized on the flow cell 1 and used as a control section, and one type of biotinylated peptide was immobilized on each of the flow cells 2, 3 and 4.

次にランニングバッファーを一定流量(5μL/min)で流しておき、SPR測定値を安定させ、各フローセルのベースライン値(SPR-baseline)後、種々の濃度のPPARγ2を含有液を同流量で流し、センサーチップ上の各ポリペプチドとの間で特異的結合を形成させ、各フローセルのSPR応答値(SPR-bound)を測定し、解離定数(Kd)を解析した。この結果、PPAR1-7のPPARγ2に対するKd値は132nM、PPAR 1-13のPPARγ2に対するKd値は241nM、PPAR 2-7のPPARγ2に対するKd値は92.6nMであることが判った。   Next, let the running buffer flow at a constant flow rate (5 μL / min), stabilize the SPR measurement value, and after the baseline value of each flow cell (SPR-baseline), flow various concentrations of PPARγ2 at the same flow rate. Specific binding was formed between each polypeptide on the sensor chip, the SPR response value (SPR-bound) of each flow cell was measured, and the dissociation constant (Kd) was analyzed. As a result, it was found that the Kd value for PPARγ2 of PPAR1-7 was 132 nM, the Kd value for PPARγ2 of PPAR 1-13 was 241 nM, and the Kd value for PPARγ2 of PPAR 2-7 was 92.6 nM.

(3−iii)PPARγ2リガンドの結合阻害活性測定
各ポリペプチドのPPARγ2のコアクティベーターであるSRC-1結合阻害活性を測定した。SRC-1はその分子内にLXXL*L*-様配列を有し、ロシグリタゾン存在下でPPARγ2への結合力が増強することが知られている。そこでプルダウンアッセイ法により、PPARγとSRC-1の相互作用への、上記ポリペプチド(PPAR1-7、PPAR 1-13、PPAR 2-7)が及ぼす影響について解析を行った。
(3-iii) PPARγ2 Ligand Binding Inhibitory Activity Measurement SRC-1 binding inhibitory activity, which is a PPARγ2 coactivator of each polypeptide, was measured. SRC-1 has an LXXL * L * -like sequence in its molecule, and is known to have enhanced binding power to PPARγ2 in the presence of rosiglitazone. Therefore, the effect of the above-mentioned polypeptides (PPAR1-7, PPAR 1-13, PPAR 2-7) on the interaction between PPARγ and SRC-1 was analyzed by a pull-down assay.

10μl(bed体積7.5μl)のGlutathioneSepharose 4Bビーズに、実施例1で大腸菌を用いて合成および精製したGST-PPARγ2(PPARγのN末端側にGSTタグを結合させた融合蛋白質)を50μl(10〜20μg)添加して結合させた。また、陰性コントロールとしてGSTを50μl(10〜20μg)添加して結合させた。ヒトSRC-1(GenBank accession No. 1101269074203_0.1
、1101269074203_1.1.)のアミノ酸番号として565〜770残基部分をコードする遺伝子配列番号43をpET15bベクターに挿入したDNAを調製し、特願2003-173634号明細書に記載の方法に従ってmRNAへの転写反応の鋳型となるDNAテンプレートを調製した。この後、RiboMAXLarge Scale RNA ProductionSystem-SP6 (Promega社製)を用いた転写反応によりmRNAを調製し、得られたmRNAをRneasyKit(QIAGEN社製)を用いて精製し、さらに特願2003-173634号明細書に記載の方法に従い、Cy3-Puroにて C末端がラベル化されたSRC-1(以下、これを「C末端ラベル化SRC-1」と称することがある)含む反応溶液を得た。
10 μl (bed volume 7.5 μl) of Glutathione Sepharose 4B beads were mixed with 50 μl (10-20 μg of GST-PPARγ2 (a fusion protein in which a GST tag was bound to the N-terminal side of PPARγ) synthesized and purified using E. coli in Example 1. ) Added to bind. As a negative control, 50 μl (10 to 20 μg) of GST was added and bound. Human SRC-1 (GenBank accession No. 1101269074203_0.1
, 1101269074203_1.1.), A DNA in which the gene SEQ ID NO: 43 encoding the 565 to 770 residue part is inserted into the pET15b vector, and the mRNA is prepared according to the method described in Japanese Patent Application No. 2003-173634. A DNA template serving as a template for the transcription reaction was prepared. Thereafter, mRNA is prepared by a transcription reaction using RiboMAXLarge Scale RNA ProductionSystem-SP6 (Promega), the obtained mRNA is purified using RneasyKit (QIAGEN), and further, Japanese Patent Application No. 2003-173634 A reaction solution containing SRC-1 labeled at the C-terminus with Cy3-Puro (hereinafter sometimes referred to as “C-terminal labeled SRC-1”) was obtained.

GST-PPARγ2あるいはGSTを固定化したビーズに25μMロシグリタゾンを含むバインディングバッファー(20mM Hepes-KOH(pH 7.9)、100mM KCl、0.1mM EDTA、0.1% NP40、10%(v/v)グリセロール、50μg/mlBSA、10μM ロシグリタゾン)、あるいはロシグリタゾンを含まないバインディングバッファー (20mM Hepes-KOH (pH 7.9)、100mMKCl、0.1mM EDTA、0.1% NP40、10%(v/v)グリセロール、50μg/ml BSA、 0.25〜0.4%(v/v)エタノール)を100μl添加後、添加したバインディングバッファーと同じバッファーでビーズを洗浄した。   Binding buffer containing 25 μM rosiglitazone on beads with GST-PPARγ2 or GST immobilized (20 mM Hepes-KOH (pH 7.9), 100 mM KCl, 0.1 mM EDTA, 0.1% NP40, 10% (v / v) glycerol, 50 μg / Binding buffer without rosiglitazone (20 mM Hepes-KOH (pH 7.9), 100 mM KCl, 0.1 mM EDTA, 0.1% NP40, 10% (v / v) glycerol, 50 μg / ml BSA, 0.25 mlBSA, 10 μM rosiglitazone) After adding 100 μl of ˜0.4% (v / v) ethanol), the beads were washed with the same buffer as the added binding buffer.

陽性コントロールとしてGST-PPARγ2を結合させたビーズに、ロシグリタゾンを含むバインディングバッファー50μlおよびC末端ラベル化SRC-1を含む反応溶液50μlを添加したもの、及びロシグリタゾンを含むバインディングバッファー 50μlおよびC末端ラベル化SRC-1を含む反応溶液50μlを添加したものを準備した。
一方、GST-PPARγ2を結合させたビーズに、ロシグリタゾンを含むバインディングバッファー 50μlとC末端ラベル化SRC-1を含む反応溶液50μl、及び最終濃度として4μMの上記ポリペプチド(PPAR1-7、PPAR 1-13、PPAR 2-7)を個別に添加したものを準備した。
As a positive control, beads bound with GST-PPARγ2 plus 50 μl of binding buffer containing rosiglitazone and 50 μl of reaction solution containing C-terminal labeled SRC-1, and 50 μl of binding buffer containing rosiglitazone and C-terminal label A reaction solution containing 50 μl of a reaction solution containing SRC-1 was prepared.
Meanwhile, 50 μl of binding buffer containing rosiglitazone and 50 μl of reaction solution containing C-terminal labeled SRC-1 and 4 μM of the above polypeptide (PPAR1-7, PPAR 1- 13, prepared by adding PPAR 2-7) individually.

試料を遮光し、ロータリーシェーカーに乗せて室温、200rpmで2時間反応後、添加したものと同じバインディングバッファーでビーズを洗浄し、15μlの2×SDSloading Bufferを添加し、95℃、5分間熱処理を行った後、ビーズに結合したC末端ラベル化SRC-1を回収した。回収した溶液はSDSポリアクリルアミド電気泳動により分離し、C末端ラベル化SRC-1の蛍光バンドをMolecularImager(Bio Rad社製)にて解析した。この結果を図13に示す。   Protect the sample from light, place it on a rotary shaker, react at room temperature and 200 rpm for 2 hours, wash the beads with the same binding buffer, add 15 μl of 2 × SDSloading Buffer, and heat-treat at 95 ° C for 5 minutes. After that, C-terminal labeled SRC-1 bound to the beads was recovered. The collected solution was separated by SDS polyacrylamide electrophoresis, and the fluorescent band of C-terminal labeled SRC-1 was analyzed with MolecularImager (Bio Rad). The result is shown in FIG.

PPARγとSRC-1の結合はロシグリタゾンを添加しない場合(図13Ligand(-))と比べ、ロシグリタゾンを添加(10μM)することにより増強した(図13:Ligand(+))。このロシグリタゾン存在下で合成ペプチド(PPAR1-7、PPAR 1-13、PPAR 2-7)の影響を解析した結果、これらのペプチドはPPARγとSRC-1の結合を阻害する活性を有していることが判った。   The binding of PPARγ and SRC-1 was enhanced by the addition of rosiglitazone (10 μM) compared to the case where rosiglitazone was not added (FIG. 13 Ligand (−)) (FIG. 13: Ligand (+)). As a result of analyzing the influence of synthetic peptides (PPAR1-7, PPAR 1-13, PPAR 2-7) in the presence of rosiglitazone, these peptides have the activity of inhibiting the binding of PPARγ and SRC-1 I found out.

つまり、本発明の濃縮操作により取得されたこれらのポリペプチドは、標的タンパク質であるPPARγ2に結合して相互作用するのに必要十分な部分が切り出されたものであることが判った。   That is, it was found that these polypeptides obtained by the enrichment operation of the present invention were obtained by cutting out a portion necessary and sufficient to bind to and interact with the target protein PPARγ2.

実施例4 マルチプルアラインメント解析によるPPARγ2と相互作用するタンパク質の構造モチーフ配列の同定
上記のように、本発明の濃縮操作によれば、標的タンパク質に結合して相互作用するのに必要十分な部分ポリペプチドが切り出されて取得されることがわかったので、次に、取得されたポリペプチドに変異を入れることにより、より強い結合力や相互作用活性を有するより短鎖のポリペプチドの取得ができないか検討した。
Example 4 Identification of Structural Motif Sequence of Protein Interacting with PPARγ2 by Multiple Alignment Analysis As described above, according to the enrichment operation of the present invention, a partial polypeptide necessary and sufficient to bind to and interact with a target protein As a result, it was found that it is possible to obtain a shorter polypeptide with stronger binding force and interaction activity by introducing mutation into the obtained polypeptide. did.

(1)構造モチーフ配列候補の選択
実施例3でPPARγ2を標的タンパク質とした濃縮操作の3回もしくは4回後に得られたLXXL*L*-様配列を有するクローン由来のアミノ酸配列を対象に、ソフトウェアー(ClustalW)を用いてマルチプルアライメント解析を実施した。これらのアミノ酸配列において、共通するアミノ酸の出現する位置や頻度を求めることにより、PPARγ2と結合して相互作用するために好ましいアミノ酸配列や、必要十分なポリペプチド鎖長の決定を試みた。
(1) Selection of structural motif sequence candidates For the amino acid sequence derived from a clone having an LXXL * L * -like sequence obtained 3 or 4 times after the enrichment operation using PPARγ2 as a target protein in Example 3, software Multiple alignment analysis was performed using Wear (ClustalW). In these amino acid sequences, by determining the position and frequency of occurrence of common amino acids, an attempt was made to determine a preferred amino acid sequence and a necessary and sufficient polypeptide chain length for binding and interacting with PPARγ2.

(1−i)PPARγ2を標的タンパク質とした濃縮操作で得られたポリペプチドのアミノ酸配列の解析
図14(A)、(B)において、濃縮操作3回および4回で得られた種々のアミノ酸配列に関し、LXXL*L*-様配列を含むものをすべてマルチプルアラインメント解析して、これらのアミノ酸配列についてLXXL*L*-様配列のはじめのロイシン(L)の位置をアミノ酸番号0とし、C末側をプラス(+)、N末側をマイナス(−)として並べた。
(1-i) Analysis of the amino acid sequence of the polypeptide obtained by the enrichment operation using PPARγ2 as the target protein In FIGS. 14 (A) and (B), various amino acid sequences obtained by the enrichment operation 3 and 4 times. For all of the amino acid sequences containing LXXL * L * -like sequences, multiple alignment analysis was performed, and for these amino acid sequences, the first leucine (L) position of the LXXL * L * -like sequences was amino acid number 0, and the C-terminal side Are arranged as plus (+) and the N-terminal side is minus (−).

まず、上記でアラインメントしたアミノ酸配列において、特定の位置(番号)のアミノ酸の種類を解析し、各クローンがその位置に有するアミノ酸のうち、最も多かったアミノ酸が全体に対して占める割合(以下、これを「最も多かったアミノ酸の出現頻度」と称することがある)を黒色のバーで示した。この結果を図14(A)および(B)に示した。(A)は濃縮回数3回目で得られたポリペプチドの結果を示し、(B)は濃縮回数4回目で得られたポリペプチドの結果を示す。   First, in the aligned amino acid sequences described above, the type of amino acid at a specific position (number) is analyzed, and the proportion of amino acids with the largest number of amino acids at each position in each clone (hereinafter referred to as this) (Sometimes referred to as “appearance frequency of most amino acids”) is indicated by a black bar. The results are shown in FIGS. 14 (A) and (B). (A) shows the result of the polypeptide obtained at the third enrichment, and (B) shows the result of the polypeptide obtained at the fourth enrichment.

この図において、アミノ酸番号はグラフの横軸、最も多かったアミノ酸の出現頻度は縦軸となっている。また、3回目(上段)、4回目(上段)で最も多かったアミノ酸を図14(D)に示した。例えば、3回目の濃縮により得られたLXXL*L*-様配列を含むクローンにおいて、アミノ酸番号―8では、最も多かったアミノ酸はセリン(S)であり、その出現頻度は約75%であったことがわかる。また、図14(C)には、濃縮操作4回後の上記アミノ酸の出現頻度と濃縮操作3回の結果の差を示し、濃縮3回後と4回後のポリペプチドの間で特定の位置のアミノ酸の出現頻度の変化の有無を示した。 In this figure, the amino acid numbers are on the horizontal axis of the graph, and the appearance frequency of the most frequently occurring amino acid is on the vertical axis. In addition, FIG. 14 (D) shows the most amino acids in the third round (upper) and the fourth round (upper). For example, in the clone containing the LXXL * L * -like sequence obtained by the third enrichment, the most common amino acid at amino acid number-8 was serine (S), and its appearance frequency was about 75%. I understand that. FIG. 14 (C) shows the difference between the appearance frequency of the above-mentioned amino acid after 4 times of the concentration operation and the result of 3 times of the concentration operation, and shows a specific position between the polypeptide after 3 and 4 times of concentration. The presence or absence of changes in the appearance frequency of amino acids was shown.

図14(A)および図14(B)から、アミノ酸番号―2のプリン(P)およびアミノ酸番号0のロイシン(L)はともに出現頻度100%を示すことがわかった。また、アミノ酸番号−2〜0、及び3、4、また10〜13でも最も多かったアミノ酸の出現頻度が90%以上であり、さらに−13から−7、及び9〜13では最も多かったアミノ酸の出現頻度が65%以上と特定のアミノ酸の出現頻度が高いことがわかった。つまり、PPARγ2を標的タンパク質とした濃縮操作により取得されたポリペプチドは、そのアミノ酸配列中に各クローンで共通性の高いアミノ酸配列が存在し、またそれとは逆にいくつかの異なるアミノ酸が用いられている場所もあることがわかった。   From FIG. 14 (A) and FIG. 14 (B), it was found that both the purine (P) of amino acid number-2 and the leucine (L) of amino acid number 0 showed an appearance frequency of 100%. In addition, the appearance frequency of amino acids with the highest amino acid numbers of amino acid numbers -2 to 0, 3, 4, and 10 to 13 is 90% or more, and the amino acid numbers of -13 to -7 and 9 to 13 with the highest number of amino acids. It was found that the frequency of appearance of specific amino acids was high, with an appearance frequency of 65% or more. In other words, the polypeptide obtained by the enrichment operation using PPARγ2 as the target protein has a highly common amino acid sequence in each clone, and conversely, several different amino acids are used. I found out that there are some places.

一方、取得されたLXXL*L*-様配列を含むクローンは、様々な長さのアミノ酸配列を含んでいた。このため、上記のアラインメントを行なったアミノ酸配列において、あるアミノ酸番号については、アミノ酸が存在するクローンとしないクローンがあった。そこで、各アミノ酸番号において実際にアミノ酸があったクローン数の総クローン数に対する割合(以下、これを「存在頻度」と称することがある)を図14(A)(B)に白丸でプロットしたグラフで示した。この存在頻度は、解析したクローン間のアミノ酸配列で共通に存在する領域長の範囲を知るための指標となる。図から明らかなように、アミノ酸番号−4〜4までは存在頻度が100%であることがわかった。また、−7〜9の範囲も存在頻度が80%以上、−11〜13の範囲でも50%以上と存在頻度が比較的高いことがわかった。これらの範囲は図14(D)でそれぞれ枠線で囲って示した。 On the other hand, the obtained clones containing LXXL * L * -like sequences contained amino acid sequences of various lengths. For this reason, in the amino acid sequences subjected to the above alignment, there were clones in which an amino acid was present and a clone in which an amino acid was not present. Therefore, a graph in which the ratio of the number of clones that actually had amino acids in each amino acid number to the total number of clones (hereinafter, this may be referred to as “presence frequency”) is plotted with white circles in FIGS. It showed in. This existence frequency serves as an index for knowing the range of the region length that is commonly present in the amino acid sequences between the analyzed clones. As is apparent from the figure, it was found that the amino acid numbers -4 to 4 have a presence frequency of 100%. Further, it was found that the existence frequency was 80% or more in the range of -7 to 9 and 50% or more in the range of -11 to 13 and the existence frequency was relatively high. These ranges are shown surrounded by a frame line in FIG.

さらに、出現頻度及び存在頻度が共に高いアミノ酸として、いずれも65%以上であるものを四角で囲み、50〜65%であるものを丸で囲み、さらに40〜50%であるものを破線で示した。これらのアミノ酸配列は、PPARγ2を標的タンパク質とした濃縮操作により得られたポリペプチドで共通配列として存在しており、このアミノ酸配列が構造モチーフ配列候補として選択されると考えられた。   In addition, as amino acids having high appearance frequency and existence frequency, those with 65% or more are surrounded by a square, those with 50 to 65% are circled, and those with 40 to 50% are indicated by a broken line. It was. These amino acid sequences exist as a common sequence in the polypeptide obtained by the enrichment operation using PPARγ2 as a target protein, and this amino acid sequence was considered to be selected as a structural motif sequence candidate.

(1−ii)構造モチーフ配列候補の選択
さらにPPARγ2を標的タンパク質とした濃縮操作を2〜5回行なった後に取得されたポリペプチドについて、上記の解析を行なった結果を図15(A)に示した。最上部の番号は、LXXL*L*-様配列のはじめのロイシン(L)の位置をアミノ酸番号0とし、C末側をプラス(+)、N末側をマイナス(−)として並べたアミノ酸番号を示し、アミノ酸配列は、上段が全ての濃縮操作後で取得されたポリペプチドで最も出現頻度が高かったアミノ酸を番号順に並べたものである。また、その下には、それ以外のクローンで出現したアミノ酸を出現頻度が高い順に並べたものである。また、存在頻度が100%であるアミノ酸配列(−4〜4)を枠線で囲って示し、存在頻度が80%以上(−7〜9)、及び50%以上(−11〜13)を破線で囲った。また、存在頻度が50%以上で出現頻度が最も高かったアミノ酸を四角で囲み、さらに出現頻度、存在頻度が共に100%であったアミノ酸を星印で示した。さらに存在頻度が50%以上で、いずれかの濃縮操作で出現頻度が50%以上であったアミノ酸を丸で囲んで示した。
(1-ii) Selection of Structural Motif Sequence Candidate Further, FIG. 15 (A) shows the result of the above analysis performed on the polypeptide obtained after performing the concentration operation with PPARγ2 as the target protein 2 to 5 times. It was. The uppermost number is the amino acid number in which the position of the first leucine (L) of the LXXL * L * -like sequence is amino acid number 0, the C-terminal side is plus (+), and the N-terminal side is minus (-) In the amino acid sequence, amino acids having the highest frequency of appearance are arranged in numerical order in the polypeptide obtained after all the concentration operations. Below that, amino acids appearing in other clones are arranged in descending order of appearance frequency. In addition, amino acid sequences (−4 to 4) with an occurrence frequency of 100% are shown surrounded by a frame, and the occurrence frequencies are 80% or more (−7 to 9) and 50% or more (−11 to 13) with broken lines Enclosed in In addition, the amino acids having the highest occurrence frequency with an occurrence frequency of 50% or more are enclosed by a square, and the amino acids having both the appearance frequency and the occurrence frequency are indicated by asterisks. In addition, amino acids having an occurrence frequency of 50% or more and the appearance frequency of 50% or more in any of the concentration operations are circled.

この結果から構造モチーフ配列候補を以下のとおり選択した。存在頻度および出現頻度が共に50%以上であるアミノ酸番号−2〜4のポリペプチドで、出現頻度が100%であるアミノ酸番号−2のプロリン(P)、アミノ酸番号0のリジン(L)は固定して、アミノ酸番号4を疎水性アミノ酸(X)、それ以外を任意のアミノ酸(X1)である図15(B)に示したものを基本型として選択した。さらに、この配列においてアミノ酸番号1をトリプトファン(T)、又アミノ酸番号2をフェニルアラニン(F)又はセリン(S)としたポリペプチドもより好ましい構造モチーフ候補(図15B(2))として選択した。また、アミノ酸番号−2がプリン(P)、−1がリジン(L)、0がリジン(L)、3がリジン(L)、4がリジン(L)、それ以外を任意のアミノ酸(X1)とした配列を有するポリペプチドも選択した(図15(B)(3))。さらに、この配列においてアミノ酸番号1がスレオニン(T)、2がフェニルアラニン(F)もしくはセリン(S)であるポリペプチド(図13(B)(4))も選択した。 From this result, structural motif sequence candidates were selected as follows. A polypeptide of amino acid Nos. -2 to 4 having both occurrence frequency and appearance frequency of 50% or more, and Proline (P) of amino acid No.-2 having appearance frequency of 100% and lysine (L) of amino acid No. 0 are fixed Then, the amino acid number 4 shown in FIG. 15B, which is a hydrophobic amino acid (X 2 ) and the other amino acids (X 1 ), was selected as a basic type. Furthermore, a polypeptide having amino acid number 1 as tryptophan (T) and amino acid number 2 as phenylalanine (F) or serine (S) in this sequence was also selected as a more preferred structural motif candidate (FIG. 15B (2)). In addition, amino acid number-2 is purine (P), -1 is lysine (L), 0 is lysine (L), 3 is lysine (L), 4 is lysine (L), and any other amino acid (X 1 A polypeptide having the sequence of) was also selected (FIGS. 15B and 3). Furthermore, in this sequence, a polypeptide having amino acid number 1 of threonine (T) and 2 of phenylalanine (F) or serine (S) (FIGS. 13B and 4) was also selected.

さらに、上記の図13(B)に記載したアミノ酸配列を有する構造モチーフ候補に、さらに配列を追加した構造モチーフ候補として、アミノ酸番号−7がプリン(P)、アミノ酸番号−6〜−3を任意のアミノ酸(X1)とした構造モチーフの基本型(図13C(1))を選択した。この追加される構造モチーフの基本型配列において、さらにアミノ酸番号−4がアルギニン(R)もしくはリジン(L)、アミノ酸番号−3がチロシン(Y)もしくはヒスチジン(H)である構造モチーフ候補(図13(C)(2))も選択した。さらに、図13(C)(3)に記載の配列も選択した。 Furthermore, as a structural motif candidate in which the sequence is further added to the structural motif candidate having the amino acid sequence described in FIG. 13B, amino acid number -7 is purine (P), and amino acid numbers -6 to -3 are arbitrarily selected. The basic type of structural motif (FIG. 13C (1)) was selected as amino acid (X 1 ). In the basic sequence of this added structural motif, further candidate structural motifs in which amino acid number-4 is arginine (R) or lysine (L) and amino acid number-3 is tyrosine (Y) or histidine (H) (FIG. 13). (C) (2)) was also selected. Furthermore, the sequences described in FIG. 13 (C) (3) were also selected.

実施例5 転写因子(Smad3)に相互作用するタンパク質のアミノ酸配列解析およびその構造モチーフ候補の選択および確認スクリーニングの標的タンパク質として転写因子であるSmad3を用い、これに相互作用するタンパク質のスクリーニングを実施例1で調製した対応付け分子ライブラリーから行った。Smad3は、TGFβシグナル経路で重要な役割を果たし、疾患との関連も高い425アミノ酸からなるタンパク質である。ヒトSmad3(GenBank Accession No. 1101269074203_2.1、1101269074203_3.1、1101269074203_4.1、1101269074203_5.1、1101269074203_6.1、1101269074203_7.1、1101269074203_8.1、1101269074203_9.1、1101269074203_10.1、1101269074203_11.1、1101269074203_12.1、1101269074203_13.1、1101269074203_14.1)は、そのC末端の網の酸配列(SSVS)をDDVDに置き換えた常活性体のDNA(配列番号44)を作成し、そのN末にGST (gulutathioneS-transferase)を付加させた融合タンパク質として実施例1と同様の方法で大腸菌で発現させた。この際、GSTとSmad3との間にトロンビンで切断できるサイトを導入した。そして実施例2に準じてSmad3を標的タンパク質としたDNA取得操作および濃縮操作を実施した。 Example 5 Analysis of the amino acid sequence of a protein that interacts with a transcription factor (Smad3) and selection and confirmation screening of candidate structural motifs of the transcription factor Smad3 is used as a target protein to screen for proteins that interact with this. This was carried out from the mapping molecule library prepared in 1. Smad3 is a protein consisting of 425 amino acids that plays an important role in the TGFβ signaling pathway and is highly associated with diseases. Human Smad3 (GenBank Accession No. 1101269074203_2.1, 1101269074203_3.1, 1101269074203_4.1, 1101269074203_5.1, 1101269074203_6.1, 1101269074203_7.1, 1101269074203_8.1, 1101269074203_9.1, 1101269074203_10.1, 1101269074203_12.1, 1101269074203_12.1 , 1101269074203_13.1, 1101269074203_14.1) create a normal active DNA (SEQ ID NO: 44) in which the acid sequence (SSVS) of the C-terminal network is replaced with DDVD, and GST (gulutathione S-transferase at the N-terminus thereof. ) Was added to Escherichia coli in the same manner as in Example 1 as a fusion protein to which) was added. At this time, a site that can be cleaved by thrombin was introduced between GST and Smad3. And according to Example 2, DNA acquisition operation and concentration operation which used Smad3 as target protein were implemented.

DNA取得操作(図16:0)および各濃縮操作(図16:1〜5)の過程で得られた、対応付け分子作成用mRNAライブラリー各100ngを、4%ウレア変性PAGEにて泳動した。この後、mRNAライブラリーのスペーサーに導入してある蛍光(Fluoroscein)をMolecularImager(Bio Rad社製)を用いて検出し、DNA取得操作および各濃縮操作におけるmRNAライブラリーの泳動パターンを解析した。   100 ng each of the mRNA library for creating a corresponding molecule obtained in the process of DNA acquisition operation (FIG. 16: 0) and each concentration operation (FIG. 16: 1 to 5) was electrophoresed on 4% urea-denatured PAGE. Thereafter, fluorescence (Fluoroscein) introduced into the spacer of the mRNA library was detected using MolecularImager (manufactured by Bio Rad), and the migration pattern of the mRNA library in the DNA acquisition operation and each concentration operation was analyzed.

結果を図16に示す。図から明らかとおり、4および5回の濃縮操作により、不均一なmRNAライブラリー(レーン0に記載のスメアな泳動図)と比較し、いくつかの単一なバンドが形成された(レーン4および5)。この解析の結果、対応付け分子作成用mRNAライブラリーが4回から5回の濃縮操作により濃縮されていることが判った。
実施例3の方法に準じて4回および5回の濃縮操作を行って取得した対応付け分子作成用cDNAライブラリーをクローニングした後、塩基配列を解析した。さらに該塩基配列をアミノ酸配列に変換し、実施例4(1)に記載の方法に準じてマルチプルアラインメント解析を行なった結果、出現頻度の高かったアミノ酸配列を図17(1)から(5)及び配列番号15〜19に示す。図17に記載のアミノ酸配列を解析した結果、これらのタンパク質は1425アミノ酸からなるSARA(SmadAnchor for Receptor Activation)の一部であることが判った。このタンパク質はSmad3のMH2ト゛メインと相互作用し、Smad3の核内移行を抑制することが知られている。
The results are shown in FIG. As can be seen from the figure, 4 and 5 enrichment operations formed several single bands (lanes 4 and 5) compared to the heterogeneous mRNA library (smear electropherogram described in lane 0). 5). As a result of this analysis, it was found that the mRNA library for creating a corresponding molecule was concentrated by 4 to 5 concentration operations.
After cloning the cDNA library for creating a corresponding molecule obtained by performing the concentration operation 4 times and 5 times according to the method of Example 3, the nucleotide sequence was analyzed. Further, the base sequence was converted into an amino acid sequence, and multiple alignment analysis was performed according to the method described in Example 4 (1). As a result, amino acid sequences having a high appearance frequency are shown in FIGS. 17 (1) to (5) and Shown in SEQ ID NOs: 15-19. As a result of analyzing the amino acid sequence shown in FIG. 17, it was found that these proteins are part of SARA (SmadAnchor for Receptor Activation) consisting of 1425 amino acids. This protein is known to interact with the Smad3 MH2 domain and suppress Smad3 nuclear translocation.

つまり、本発明の濃縮操作は、標的タンパク質に結合して相互作用するに必要十分なポリペプチドが切り出されて取得されることが異なる2種類の標的タンパク質を用いた解析により確認された。
さらに、上記で解析したアミノ酸配列のうち、実施例4の方法に準じて存在頻度および出現頻度が高いことを指標として、図17(1)から(5)のアミノ酸配列で四角で囲った配列を構造モチーフ配列候補として選択した。
That is, the enrichment operation of the present invention was confirmed by analysis using two different types of target proteins that are obtained by cutting out and obtaining a polypeptide necessary and sufficient to bind to and interact with the target protein.
Further, among the amino acid sequences analyzed above, the sequence surrounded by a square with the amino acid sequences of FIGS. 17 (1) to (5) is used as an indicator that the presence frequency and appearance frequency are high according to the method of Example 4. Selected as a structural motif sequence candidate.

上記で選択した構造モチーフ配列候補は、文献(Genes Dev. 16 pp. 1950 (2002))に示されているSmad3とSARAの複合体をX線結晶構造解析で示された、SARAの相互作用部分とほぼ完全に一致していた。つまり、上記で選択した構造モチーフ配列候補が、実際の構造モチーフ配列であることが確認できた。
さらに、図17(5)配列の二重線部分で示した部位と結合が報告されている(Nat Genet. 2002 Aug;31(4):419-23.)PPP1CCがこの濃縮操作と解析により得られていることが判った。このことは、スクリーニングの標的タンパク質に対し、間接的に相互作用するタンパク質も同様に取得可能であることを示している。
The structural motif candidate selected above is the SARA interaction part shown by X-ray crystal structure analysis of the complex of Smad3 and SARA shown in the literature (Genes Dev. 16 pp. 1950 (2002)). And almost completely matched. That is, it was confirmed that the structural motif sequence candidate selected above was an actual structural motif sequence.
Furthermore, the site and binding indicated by the double line part of FIG. 17 (5) sequence have been reported (Nat Genet. 2002 Aug; 31 (4): 419-23.) PPP1CC was obtained by this enrichment operation and analysis. I found out that This indicates that proteins that interact indirectly with the target protein for screening can be obtained in the same manner.

また、濃縮操作4〜5回後に取得された上記Smad3と相互作用するドメインポリペプチドで、UNIGENEデータベースに登録されていたものを図3及び4に記載した。   Moreover, what was registered in the UNIGENE database by the domain polypeptide which interacts with the said Smad3 acquired 4 to 5 times after concentration operation was described in FIG.

実施例6 医薬化合物FK506に相互作用するタンパク質のアミノ酸配列解析およびその構造モチーフ候補の選択および確認
スクリーニングの標的化合物として免疫抑制剤であるFK506を用い、これに相互作用するタンパク質のスクリーニングを実施例1で調製した対応付け分子ライブラリーから行った。FK506はペプチジルプロリルイソメラーゼである蛋白質FKBPと複合体を形成してカルシニューリンに結合し、NFAT(nuclearfactor of activated T cells)の脱リン酸化とその核内移行によるT細胞の活性化を阻害する天然から単離された免疫抑制剤である。FKBPの中でも12kDaのFKBP12がFK506の主な標的である。
Example 6 Analysis of the amino acid sequence of a protein that interacts with the pharmaceutical compound FK506 and selection and confirmation of its structural motif candidate FK506, an immunosuppressive agent, was used as a target compound for screening a protein that interacts with this. This was carried out from the correspondence molecule library prepared in (1). FK506 forms a complex with the protein FKBP, a peptidylprolyl isomerase, binds to calcineurin, and inhibits T cell activation by dephosphorylation of NFAT (nuclear factor of activated T cells) and its nuclear translocation. Isolated immunosuppressant. Among FKBPs, 12 kDa FKBP12 is the main target of FK506.

標的化合物であるFK506はまず1等量のジメチルアミノピリジン存在下で5等量の無水コハク酸とジメチルホルムアミド(DMF)中、室温で2日間室温で反応させ、カルボン酸誘導体として逆相HPLCで精製した。これをDMFに溶解し、それぞれ1等量のBenzotriazole-1-yl-oxy-tris-pyrrolidino-phosphoniumhexafluorophosphate(PyBOP)、1-Hydroxybenzotriazole hydrate(HOBt)、トリエチルアミンを加えて室温で5分間反応させた後、Biotin-POE3-amine(モレキュラーバイオサイエンス社製)を3等量加えて1時間反応させた。生成したビオチン化FK506を逆相HPLCで精製し、MALDI-TOF-MSで確認した。   The target compound FK506 was first reacted in 5 equivalents of succinic anhydride and dimethylformamide (DMF) at room temperature for 2 days in the presence of 1 equivalent of dimethylaminopyridine, and purified by reverse phase HPLC as a carboxylic acid derivative. did. After dissolving this in DMF and adding 1 equivalent each of Benzotriazole-1-yl-oxy-tris-pyrrolidino-phosphoniumhexafluorophosphate (PyBOP), 1-Hydroxybenzotriazole hydrate (HOBt), triethylamine and reacting at room temperature for 5 minutes, 3 equivalents of Biotin-POE3-amine (Molecular Bioscience) was added and reacted for 1 hour. The resulting biotinylated FK506 was purified by reverse phase HPLC and confirmed by MALDI-TOF-MS.

上記で調製したビオチン化FK506を50%エタノール水溶液に1mMとなるように溶解した水溶液16μlをTBKT(150mM KCl、50mMTris-HCl(pH7.5)、0.2% Tween20)384μlに加えて撹拌し、MAGNOTEX-SAビーズ(Takara社製)100μl相当に加えて室温で30分混合した。このビーズを回収し、TBKT150μlで5回、FH506バインディングバッファー(150mM KCl、50mM Tris-HCl(pH7.5)、0.1% Tween20、 1mMEDTA、 1mM DTT)300μlで3回洗って、これをFK506ビーズとした。上記の方法において、ビオチン化FK506の代わりにBiotin-POE3-amine(モレキュラーバイオサイエンス社製)を使って、これをビオチンビーズとして陰性コントロールとした。   Add 16 μl of the biotinylated FK506 prepared above to 1 mM in 50% ethanol aqueous solution to TBKT (150 mM KCl, 50 mM Tris-HCl (pH 7.5), 0.2% Tween20) 384 μl, stir, and MAGNOTEX- SA beads (Takara Co., Ltd.) equivalent to 100 μl were added and mixed at room temperature for 30 minutes. The beads were collected, washed 5 times with 150 μl of TBKT, and washed 3 times with 300 μl of FH506 binding buffer (150 mM KCl, 50 mM Tris-HCl (pH 7.5), 0.1% Tween20, 1 mM EDTA, 1 mM DTT) to obtain FK506 beads. . In the above method, Biotin-POE3-amine (manufactured by Molecular Bioscience) was used instead of biotinylated FK506, and this was used as a biotin bead as a negative control.

このFK506ビーズおよびビオチンビーズに対して、実施例1で調製した対応付け分子ライブラリーを添加し、実施例2に記載の方法に準じてFK506に対して相互作用するタンパク質及びこれをコードするDNAの取得および濃縮操作を実施した。この結果、濃縮操作7回および8回で、SDS-PAGEで確認できるバンドが形成されたので、ここで得られた応付け分子作成用cDNAライブラリーを取得してクローニングした後、塩基配列を解析した。一方、陰性コントロールであるビオチンビーズでは、特定のDNAに集約することはなかった。   To this FK506 bead and biotin bead, the mapping molecule library prepared in Example 1 was added, and the protein interacting with FK506 and the DNA encoding the same according to the method described in Example 2 were added. Acquisition and concentration operations were performed. As a result, bands that could be confirmed by SDS-PAGE were formed after 7 and 8 enrichment operations. The obtained cDNA library for creating attachment molecules was obtained and cloned, and then the nucleotide sequence was analyzed. did. On the other hand, biotin beads as a negative control did not aggregate into specific DNA.

上記で得られた塩基配列をアミノ酸配列に変換し、実施例4(1)に記載の方法に準じてマルチプルアラインメント解析を行なった結果、出現頻度の高かったアミノ酸配列を図18及び配列番号20〜23に示した。ここで、取得された配列を解析したところ、FKBP12の全長に相当する配列(図18および図19:FKBP12)が得られた。またFKBP5の部分アミノ酸配列、(図18および19:FKBP5)が得られた。この部分アミノ酸配列は、FK506結合活性が比較的高いとされているN末端側のFK506結合ドメイン(FK1)を完全に含んでいた((図19:FKBP5)。このことから、本発明の標的物質を用いた濃縮操作は、標的物質が化合物でも行なうことができ、取得されるペプチドは、該化合物に結合して相互作用するに必要十分なポリペプチドが切り取られていることが確認された。   As a result of converting the base sequence obtained above into an amino acid sequence and conducting multiple alignment analysis according to the method described in Example 4 (1), the amino acid sequence having a high appearance frequency is shown in FIG. 23. Here, when the obtained sequence was analyzed, a sequence corresponding to the full length of FKBP12 (FIGS. 18 and 19: FKBP12) was obtained. In addition, a partial amino acid sequence of FKBP5 (FIGS. 18 and 19: FKBP5) was obtained. This partial amino acid sequence completely contained the N-terminal FK506 binding domain (FK1), which is considered to have relatively high FK506 binding activity (FIG. 19: FKBP5). It was confirmed that the concentration operation using can be carried out even if the target substance is a compound, and that the obtained peptide has a sufficient polypeptide cut out to bind to and interact with the compound.

上記の濃縮操作では、さらに、FKBP12のホモログと推測されるタンパク質(図18:Homolog1(配列番号22)、Homolog2(配列番号23))が得られた。これらのアミノ酸配列よりFK506と結合するタンパク質の構造モチーフ候補配列を図18の再下段及び配列番号28に示した。Xは任意のアミノ酸を示す。
また、濃縮操作7〜8回後で得られたFK506と相互作用するポリペプチドをコードする核酸のうち、UNIGENEデータベースに登録されていた遺伝子の番号及び遺伝子名を図5及び6に示した。
In the above enrichment operation, proteins (Fig. 18: Homolog1 (SEQ ID NO: 22), Homolog2 (SEQ ID NO: 23)) presumed to be homologues of FKBP12 were obtained. From these amino acid sequences, the structural motif candidate sequences of proteins that bind to FK506 are shown in the lower part of FIG. 18 and SEQ ID NO: 28. X represents any amino acid.
5 and 6 show the gene numbers and gene names registered in the UNIGENE database among nucleic acids encoding polypeptides interacting with FK506 obtained 7 to 8 times after the concentration operation.

本発明の方法は、標的物質との相互作用に必要なドメインポリペプチドをタンパク質から切り出して取得する方法(図20(B))、および得られたドメインポリペプチドのアミノ酸配列を解析し、標的物質との相互作用に必要十分なアミノ酸配列からなる構造モチーフ配列を同定する方法(図21(A))、ならびに該方法により同定された構造モチーフを利用して標的物質に相互作用する化合物を設計する方法(図21(B))等が提供される。該方法は、標的物質が疾患に関連する物質であった場合、該疾患の治療薬となる短鎖ポリペプチドあるいは化合物の取得・設計等に有用である。   In the method of the present invention, a domain polypeptide necessary for interaction with a target substance is obtained by cutting out from the protein (FIG. 20B), and the amino acid sequence of the obtained domain polypeptide is analyzed, and the target substance is analyzed. For identifying a structural motif sequence consisting of amino acid sequences necessary and sufficient for interaction with a target substance (FIG. 21A), and designing a compound that interacts with a target substance using the structural motif identified by the method A method (FIG. 21B) and the like are provided. When the target substance is a substance related to a disease, this method is useful for obtaining / designing a short polypeptide or compound that is a therapeutic agent for the disease.

PPARγ2と相互作用するドメインポリペプチドをコードする遺伝子を示した図である。It is the figure which showed the gene which codes the domain polypeptide which interacts with PPARγ2. PPARγ2と相互作用するドメインポリペプチドをコードする遺伝子を示した図であり、図1の続きである。FIG. 2 shows a gene encoding a domain polypeptide that interacts with PPARγ2, and is a continuation of FIG. Smad3と相互作用するドメインポリペプチドをコードする遺伝子を示した図である。It is the figure which showed the gene which codes the domain polypeptide which interacts with Smad3. Smad3と相互作用するドメインポリペプチドをコードする遺伝子を示した図であり、図3の続きである。FIG. 4 shows a gene encoding a domain polypeptide that interacts with Smad3, which is a continuation of FIG. FK506と相互作用するドメインポリペプチドをコードする遺伝子を示した図である。It is the figure which showed the gene which codes the domain polypeptide which interacts with FK506. FK506と相互作用するドメインポリペプチドをコードする遺伝子を示した図であり、図5の続きである。FIG. 6 shows a gene encoding a domain polypeptide that interacts with FK506, and is a continuation of FIG. 本発明の構造モチーフの同定方法を示した模式図である。It is the schematic diagram which showed the identification method of the structural motif of this invention. PPARγ2を標的物質とした濃縮操作の結果を示す電気泳動写真である。It is an electrophoresis photograph which shows the result of the concentration operation which used PPARγ2 as a target substance. PPARγ2を標的物質として得られたドメインポリペプチドのアミノ酸配列の例を示した図である。It is the figure which showed the example of the amino acid sequence of the domain polypeptide obtained by using PPARγ2 as a target substance. 濃縮操作と、共通配列を有する核酸の割合の関係を示すグラフである。It is a graph which shows the relationship between concentration operation and the ratio of the nucleic acid which has a common sequence. 濃縮操作と、共通配列を有する核酸量の関係を示すグラフである。It is a graph which shows the relationship between concentration operation and the amount of nucleic acids which have a common sequence. PPARγ2を標的物質とした濃縮操作で得られたドメインポリペプチドのPPARγ2との結合度を示したグラフである。It is the graph which showed the binding degree with PPARγ2 of the domain polypeptide obtained by the concentration operation using PPARγ2 as a target substance. PPARγ2を標的物質とした濃縮操作で得られたドメインポリペプチドがPPARγ2の天然のリガンドの結合を阻害する程度を示したグラフである。It is the graph which showed the grade which the domain polypeptide obtained by the concentration operation which used PPARγ2 as the target substance inhibits the binding of the natural ligand of PPARγ2. PPARγ2を標的物質とした濃縮操作で得られたドメインポリペプチドの各アミノ酸の存在頻度および出現頻度を示すグラフである。It is a graph which shows the presence frequency and appearance frequency of each amino acid of the domain polypeptide obtained by the concentration operation which used PPARγ2 as a target substance. PPARγ2を標的物質とした濃縮操作で得られたドメインポリペプチドから得られた構造モチーフ配列を示す図である。It is a figure which shows the structure motif sequence obtained from the domain polypeptide obtained by the concentration operation which used PPARγ2 as the target substance. Smad3を標的物質とした濃縮操作の結果を示す電気泳動写真である。It is an electrophoretic photograph showing the result of concentration operation using Smad3 as a target substance. Smad3を標的物質として得られたドメインポリペプチドのアミノ酸配列の例を示した図である。It is the figure which showed the example of the amino acid sequence of the domain polypeptide obtained by using Smad3 as a target substance. FK506を標的物質として得られたドメインポリペプチドのアミノ酸配列の例を示した図である。It is the figure which showed the example of the amino acid sequence of the domain polypeptide obtained by using FK506 as a target substance. FK506の天然のリガンド配列における本発明の濃縮操作で得られたドメインポリペプチドの位置を示す図である。It is a figure which shows the position of the domain polypeptide obtained by the concentration operation of this invention in the natural ligand sequence of FK506. 本発明のドメインポリペプチドを示す模式図である。It is a schematic diagram which shows the domain polypeptide of this invention. 本発明の構造モチーフを示す模式図である。It is a schematic diagram which shows the structural motif of this invention.

Claims (8)

(1)タンパク質部とそれをコードする核酸部が、核酸部の3’末端に結合した核酸構築物を介して直接結合したタンパク質−核酸連結体群と標的物質とを接触させる工程、(2)標的物質に特異的に結合した該タンパク質−核酸連結体を取得し、該連結体の核酸部を増幅し、これを鋳型の一部として用いて、タンパク質部とそれをコードする核酸部が、核酸部の3’末端に結合した核酸構築物を介して直接結合したタンパク質−核酸連結体群を調製する工程、(3)上記(1)および(2)の工程を、標的物質に特異的に結合したタンパク質−核酸連結体の核酸部が、ドメインポリペプチドをコードするクラスターを形成するまで繰り返す工程を含むことを特徴とする標的物質と相互作用するドメインポリペプチドの選抜取得方法。 (1) A step of bringing a protein-nucleic acid conjugate group in which a protein part and a nucleic acid part encoding the protein part are directly bound via a nucleic acid construct bound to the 3 ′ end of the nucleic acid part into contact with a target substance, (2) target Obtaining the protein-nucleic acid conjugate specifically bound to the substance, amplifying the nucleic acid part of the conjugate, and using this as part of the template, the protein part and the nucleic acid part encoding it are A step of preparing a group of protein-nucleic acid conjugates directly bound via a nucleic acid construct bound to the 3 ′ end of (3), a protein specifically bound to a target substance in the steps (1) and (2) above A method for selecting and obtaining a domain polypeptide that interacts with a target substance, comprising a step of repeating until the nucleic acid part of the nucleic acid conjugate forms a cluster encoding the domain polypeptide. (1)タンパク質部とそれをコードする核酸部が、核酸部の3’末端に結合した核酸構築物を介して直接結合したタンパク質−核酸連結体群と標的物質とを接触させる工程、(2)標的物質に特異的に結合した該タンパク質−核酸連結体を取得し、該連結体の核酸部を増幅し、これを鋳型の一部として用いて、タンパク質部とそれをコードする核酸部が、核酸部の3’末端に結合した核酸構築物を介して直接結合したタンパク質−核酸連結体群を調製する工程、(3)上記(1)および(2)の工程を、標的物質に特異的に結合したタンパク質−核酸連結体の核酸部がドメインポリペプチドをコードするクラスターを形成するまで繰り返す工程、(4)工程(3)でクラスターを形成した核酸を取得する工程を含むことを特徴とする標的物質と相互作用するドメインポリペプチドをコードする核酸の選抜取得方法。 (1) A step of bringing a protein-nucleic acid conjugate group in which a protein part and a nucleic acid part encoding the protein part are directly bound via a nucleic acid construct bound to the 3 ′ end of the nucleic acid part into contact with a target substance, (2) target Obtaining the protein-nucleic acid conjugate specifically bound to the substance, amplifying the nucleic acid part of the conjugate, and using this as part of the template, the protein part and the nucleic acid part encoding it are A step of preparing a group of protein-nucleic acid conjugates directly bound via a nucleic acid construct bound to the 3 ′ end of (3), a protein specifically bound to a target substance in the steps (1) and (2) above A target substance comprising a step of repeating until the nucleic acid part of the nucleic acid conjugate forms a cluster encoding a domain polypeptide, and (4) a step of obtaining the nucleic acid having a cluster formed in step (3) Selection method of obtaining nucleic acid encoding the domain interacting polypeptides. ドメインポリペプチドが、全長タンパク質の90%以下の長さのポリペプチドからなり、かつ標的物質との相互作用ドメインの130%以下の長さのポリペプチドであることを特徴とする請求項1または2に記載の方法。 The domain polypeptide is composed of a polypeptide having a length of 90% or less of the full-length protein, and a polypeptide having a length of 130% or less of the interaction domain with the target substance. The method described in 1. (1)タンパク質部とそれをコードする核酸部が、核酸部の3’末端に結合した核酸構築物を介して直接結合したタンパク質−核酸連結体群と標的物質とを接触させる工程、(2)標的物質に特異的に結合した該タンパク質−核酸連結体を取得し、該連結体の核酸部を増幅し、これを鋳型の一部として用いて、タンパク質部とそれをコードする核酸部が、核酸部の3’末端に結合した核酸構築物を介して直接結合したタンパク質−核酸連結体群を調製する工程、(3)上記(1)および(2)の工程を、標的物質に特異的に結合したタンパク質−核酸連結体の核酸部がドメインポリペプチドをコードするクラスターを形成するまで繰り返す工程、(4)工程(3)でクラスターを形成した核酸の塩基配列を解析する工程、(5)該塩基配列あるいはそれを翻訳したアミノ酸配列から存在頻度および/または出現頻度を指標として共通配列を選択する工程を含むことを特徴とする構造モチーフ配列の同定方法。 (1) A step of bringing a protein-nucleic acid conjugate group in which a protein part and a nucleic acid part encoding the protein part are directly bound via a nucleic acid construct bound to the 3 ′ end of the nucleic acid part into contact with a target substance, (2) target Obtaining the protein-nucleic acid conjugate specifically bound to the substance, amplifying the nucleic acid part of the conjugate, and using this as part of the template, the protein part and the nucleic acid part encoding it are A step of preparing a group of protein-nucleic acid conjugates directly bound via a nucleic acid construct bound to the 3 ′ end of (3), a protein specifically bound to a target substance in the steps (1) and (2) above -A step of repeating until the nucleic acid part of the nucleic acid conjugate forms a cluster encoding the domain polypeptide, (4) a step of analyzing the base sequence of the nucleic acid that formed the cluster in step (3), (5) the base sequence Method for identifying structural motifs sequences have the which comprises the step of selecting a common sequence present frequency and / or frequency as an indicator of the amino acid sequence translated it. 請求項4に記載の構造モチーフ配列の一部に変異を導入し、該変異構造モチーフを標的物質と接触させて相互作用を解析することを特徴とする変容した機能を有する構造モチーフの取得方法。 A method for obtaining a structural motif having a transformed function, wherein a mutation is introduced into a part of the structural motif sequence according to claim 4 and the interaction is analyzed by contacting the mutant structural motif with a target substance. (1)請求項1または3で選抜されたドメインポリペプチド、あるいは請求項4または5に記載の構造モチーフと標的物質との複合体を作製する工程、(2)該複合体の立体構造解析を行い標的物質と該ポリペプチドまたは構造モチーフとの結合部位を特定する工程、(3)同定された結合部位から標的物質の結合空間を予測して、該結合空間に合う低分子化合物を設計する工程を含むことを特徴とする標的物質と相互作用する化合物の分子設計方法。 (1) a step of producing a domain polypeptide selected in claim 1 or 3 or a complex of the structural motif according to claim 4 or 5 and a target substance; (2) three-dimensional structure analysis of the complex; Performing a step of specifying a binding site between the target substance and the polypeptide or structural motif, and (3) predicting a binding space of the target substance from the identified binding site and designing a low molecular compound that fits the binding space. A molecular design method for a compound that interacts with a target substance, comprising: 標的物質が、疾病に関連するものであることを特徴とする請求項1〜6のいずれか1項に記載の方法。 The method according to claim 1, wherein the target substance is associated with a disease. (1)標的物質が疾病に関連するもので、請求項1または3で選抜されたドメインポリペプチドまたは請求項4または5に記載の構造モチーフと標的物質との複合体を作製する工程、(2)該複合体の立体構造解析を行い標的物質と該ポリペプチドまたは構造モチーフとの結合部位を特定する工程、(3)同定された結合部位から標的物質の結合空間を予測して、該結合空間に合う化合物を設計し、(4)設計された化合物を合成する工程を含むことを特徴とする標的物質が関連する疾患の治療および/又は予防薬の製造方法。 (1) The target substance is associated with a disease, and a domain polypeptide selected in claim 1 or 3 or a complex of the structural motif of claim 4 or 5 and the target substance, (2 (3) a step of analyzing the three-dimensional structure of the complex to identify the binding site between the target substance and the polypeptide or structural motif; (3) predicting the binding space of the target substance from the identified binding site, and A method for producing a therapeutic and / or prophylactic agent for a disease associated with a target substance, comprising a step of designing a compound in time and (4) synthesizing the designed compound.
JP2004339301A 2004-11-24 2004-11-24 Method for selecting and acquiring domain polypeptide interacting with target substance, method for identifying structural motif sequence, and method for designing molecule Pending JP2006141348A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004339301A JP2006141348A (en) 2004-11-24 2004-11-24 Method for selecting and acquiring domain polypeptide interacting with target substance, method for identifying structural motif sequence, and method for designing molecule

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004339301A JP2006141348A (en) 2004-11-24 2004-11-24 Method for selecting and acquiring domain polypeptide interacting with target substance, method for identifying structural motif sequence, and method for designing molecule

Publications (1)

Publication Number Publication Date
JP2006141348A true JP2006141348A (en) 2006-06-08

Family

ID=36621710

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004339301A Pending JP2006141348A (en) 2004-11-24 2004-11-24 Method for selecting and acquiring domain polypeptide interacting with target substance, method for identifying structural motif sequence, and method for designing molecule

Country Status (1)

Country Link
JP (1) JP2006141348A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012504415A (en) * 2008-09-30 2012-02-23 アボット・ラボラトリーズ Improved RNA display method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012504415A (en) * 2008-09-30 2012-02-23 アボット・ラボラトリーズ Improved RNA display method

Similar Documents

Publication Publication Date Title
US6716973B2 (en) Use of a ribozyme to join nucleic acids and peptides
CN110637086B (en) Method for producing complex of RNA molecule and peptide, and use thereof
EP2022856B1 (en) Improvements in or relating to binding proteins for recognition of DNA
AU779653B2 (en) Methods for encoding and sorting in vitro translated proteins
US7176287B2 (en) Methods of detecting interactions between proteins, peptides or libraries thereof using fusion proteins
Raabe et al. Poly (A) polymerase contains multiple functional domains
JP2003523195A (en) Zinc finger domain and identification method thereof
CA2217641A1 (en) Polypeptides having a functional domain of interest and methods of identifying and using same
US20120283136A1 (en) Compositions and methods for the rapid biosynthesis and in vivo screening of biologically relevant peptides
Schimmele et al. Identification of a functional epitope of the Nogo receptor by a combinatorial approach using ribosome display
Minakhin et al. Mapping the molecular interface between the σ70 subunit of E. coli RNA polymerase and T4 AsiA
KR20020064140A (en) Methods
Draganescu et al. Homeodomain proteins: what governs their ability to recognize specific DNA sequences?
US20130295595A1 (en) Modified prokaryotic ubiquitin-like protein and methods of use thereof
JP2004097213A (en) Method for selecting nucleic acid and/or protein
CA2220785A1 (en) Selective technique for rapid identification of proteins and genes and uses thereof
JP2006141348A (en) Method for selecting and acquiring domain polypeptide interacting with target substance, method for identifying structural motif sequence, and method for designing molecule
JP3706942B2 (en) Method for detecting interaction between substance and protein, method for screening protein interacting with substance, and method for forming complex of substance and protein interacting with the substance
US20050079546A1 (en) Serum albumin scaffold-based proteins and uses thereof
WO2003062417A1 (en) Rna-dna ligation product and utilization thereof
JP6478392B2 (en) Nucleic acid linker
JPWO2003048363A1 (en) Complex of mapping molecule and C-terminal labeled protein, complex of mapping molecule, and protein-protein interaction analysis method using the complex
JPWO2005024018A1 (en) Nucleic acid construct and method for producing the same
JP5587528B2 (en) Protein that forms a complex with c-Jun protein, nucleic acid encoding the same, and method of using the same
WO2008124111A2 (en) System for pulling out regulatory elements in vitro