JP2007181453A - Method for obtaining array data, method for extracting target gene by using the same, and method for designing protein - Google Patents

Method for obtaining array data, method for extracting target gene by using the same, and method for designing protein Download PDF

Info

Publication number
JP2007181453A
JP2007181453A JP2006329313A JP2006329313A JP2007181453A JP 2007181453 A JP2007181453 A JP 2007181453A JP 2006329313 A JP2006329313 A JP 2006329313A JP 2006329313 A JP2006329313 A JP 2006329313A JP 2007181453 A JP2007181453 A JP 2007181453A
Authority
JP
Japan
Prior art keywords
protein
sequence
pcr
library
ivv
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006329313A
Other languages
Japanese (ja)
Inventor
Etsuko Miyamoto
悦子 宮本
Takanori Washio
尊規 鷲尾
Masamichi Ishizaka
正道 石坂
Hiroshi Yanagawa
弘志 柳川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Keio University
Original Assignee
Keio University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Keio University filed Critical Keio University
Priority to JP2006329313A priority Critical patent/JP2007181453A/en
Publication of JP2007181453A publication Critical patent/JP2007181453A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To further improve efficiency of obtaining data by IVV (in vitro virus) method, which data include several partial sequences of a gene. <P>SOLUTION: The method repeats rounds including (1) a step for producing, from a nucleic acid library, a molecular library of an associating molecule bonded with a protein and a nucleic acid encoding the protein, (2) a step for mixing a target substance with the library of the associating molecule, (3) a step for selecting an associating molecule bonding to the target substance and (4) a step for preparing, by RT-PCR or PCR, a nucleic acid library from the nucleic acid of the associating molecule selected in (3), wherein, in the RT-PCR or PCR, the cycle number is determined when the increase of the amplified products reaches, for the first time, the predetermined amount less than the saturation amount, and after the cycle number reaches to be a constant, one more round is performed and sequence analysis of the nucleic acid library is performed. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、選択的スプライシング、RNAエディティング、一塩基多型(SNP)、配列変異、配列融合などによってDNA配列やmRNA配列が変化し、その結果、蛋白質間相互作用が変化する疾患関連遺伝子等の抽出や、蛋白質相互作用解析におけるベイト蛋白質設計に有用な配列データの取得方法、及び、その配列データを用いて前記抽出及び前記ベイト蛋白質設計を行う方法に関する。   The present invention relates to a disease-related gene or the like in which DNA sequence or mRNA sequence is changed by alternative splicing, RNA editing, single nucleotide polymorphism (SNP), sequence mutation, sequence fusion, etc., and as a result, protein-protein interaction is changed. And a method for obtaining sequence data useful for bait protein design in protein interaction analysis, and a method for performing the extraction and bait protein design using the sequence data.

創薬ターゲット遺伝子、すなわち、選択的スプライシング、RNAエディティング、SNP、配列変異、配列融合などによってDNA配列やmRNA配列が変化し、その結果、蛋白質間相互作用が変化する疾患関連遺伝子の抽出においては、選択的スプライシング、RNAエディティング、SNPs(single nucleotide polymorphisms)などに由来するDNA配列やmRNA配列の変化を追うのには、蛋白質間相互作用の解析を用いて、多くの配列情報を得ることが重要である。   In the extraction of drug-related target genes, that is, disease-related genes in which the DNA sequence or mRNA sequence changes due to alternative splicing, RNA editing, SNP, sequence mutation, sequence fusion, etc., resulting in changes in protein-protein interactions In order to follow changes in DNA sequences and mRNA sequences derived from alternative splicing, RNA editing, SNPs (single nucleotide polymorphisms), etc., it is possible to obtain a lot of sequence information by analyzing the interaction between proteins. is important.

蛋白質間相互作用の検出方法として、これまで免疫沈降、GST融合蛋白質によるプルダウン・アッセイ、TAP(Tandem Affinity Purification)法、酵母ツーハイブリッド法などが知られている。一方、進化分子工学のツールとして誕生した「遺伝子(遺伝子型)と蛋白質(表現型)の対応付け」を応用して、ポストゲノム機能解析における蛋白質間相互作用を網羅的に解析する方法として、in vitro virus法 (非特許文献1、非特許文献2、非特許文献3、特許文献1、特許文献2)、STABLE法、ファージディスプレイ法、リボソーム・ディスプレイ法、mRNA-ペプチドヒュージョン(mRNAディスプレイ)法などが知られている。   Known methods for detecting protein-protein interactions include immunoprecipitation, pull-down assay using GST fusion protein, TAP (Tandem Affinity Purification) method, and yeast two-hybrid method. On the other hand, as a method for comprehensive analysis of protein-protein interactions in post-genome functional analysis by applying `` association of genes (genotypes) and proteins (phenotypes) '' that was born as an evolutionary molecular engineering tool, In vitro virus method (Non-patent document 1, Non-patent document 2, Non-patent document 3, Patent document 1, Patent document 2), STABLE method, phage display method, ribosome display method, mRNA-peptide fusion (mRNA display) method, etc. It has been known.

また、従来のツーハイブリッド法やTAP法などの蛋白質間相互作用解析では、ベイト蛋白質設計は蛋白質毎に試行錯誤的に行う必要があった。大規模解析においては、ベイト蛋白質設計が効率よく実現可能で、出来るだけ自動的で連続的に繰り返すことが可能な蛋白質間相互作用解析システムが所望されている。また、蛋白質設計において、三次元構造解析のための結晶化が難しい蛋白質は、アミノ酸の全長の様々な領域を様々な長さでクローニングし、それらの結合能をGST融合蛋白質によるプルダウン・アッセイなどにより、すべて実験的に確認していく必要があった。   Moreover, in the protein-protein interaction analysis such as the conventional two-hybrid method and TAP method, it is necessary to design the bait protein by trial and error for each protein. In large-scale analysis, there is a demand for a protein-protein interaction analysis system that enables efficient bait protein design and that can be repeated automatically and continuously as much as possible. In protein design, proteins that are difficult to crystallize for three-dimensional structural analysis are cloned in various lengths of amino acids in various lengths, and their binding ability is determined by pull-down assays using GST fusion proteins. All had to be confirmed experimentally.

in vitro virus法によれば、擬陽性の少ないデータが得られることが知られている(特許文献3)。
Miyamoto-Sato E, et al. Viva Origino 25, 35 (1997) Nemoto N, et al. FEBS Lett. 414, 405 (1997) Miyamoto-Sato, E. et al. Nucleic Acids Res. 31, e78 (2003) 国際公開第WO98/16636号パンフレット 国際公開第WO02/46395号パンフレット 国際公開第WO 2005/050518号パンフレット
According to the in vitro virus method, it is known that data with few false positives can be obtained (Patent Document 3).
Miyamoto-Sato E, et al. Viva Origino 25, 35 (1997) Nemoto N, et al. FEBS Lett. 414, 405 (1997) Miyamoto-Sato, E. et al. Nucleic Acids Res. 31, e78 (2003) International Publication No. WO98 / 16636 Pamphlet International Publication No. WO02 / 46395 Pamphlet International Publication No. WO 2005/050518 Pamphlet

創薬ターゲット遺伝子の探索において、選択的スプライシング、RNAエディティング、SNPsなどに由来するDNA配列やmRNA配列の詳細な変化を追うためには、どの蛋白質とどの蛋白質が相互作用するかを解析出来るだけでは十分ではない。in vitro virus(IVV)法のように、どのような部位で相互作用しているかを詳細に検出することが重要であり、さらに、バリアントやSNPsなどのデータベースと重ね合わせて新規の機能を見出す場合、一つの遺伝子について幾通りもの部分配列を包含したデータを用いることが重要である。   When searching for drug discovery target genes, it is only possible to analyze which proteins interact with each other in order to follow detailed changes in DNA and mRNA sequences derived from alternative splicing, RNA editing, SNPs, etc. Is not enough. It is important to detect in detail the site of interaction, such as the in vitro virus (IVV) method, and when discovering new functions by overlaying with databases such as variants and SNPs It is important to use data including several partial sequences for one gene.

また、蛋白質間相互作用解析のためのベイト蛋白質設計においては、相互作用の認められる、位置や長さの点で様々な領域の配列データを入手することが重要である。   In designing a bait protein for protein-protein interaction analysis, it is important to obtain sequence data of various regions in terms of position and length where the interaction is recognized.

従来のツーハイブリッド法やTAP法などの蛋白質間相互作用解析法では、上述のような配列データを効率よく得ることが難しい。   In conventional protein-protein interaction analysis methods such as the two-hybrid method and the TAP method, it is difficult to efficiently obtain the sequence data as described above.

IVV法によれば、国際公開第WO 2005/050518号パンフレットに記載されているように、擬陽性の少ないデータが得られ、データの質の点で、上述のような配列データを効率よく得ることができると言えるが、まだ改善が期待される。   According to the IVV method, as described in the pamphlet of International Publication No. WO 2005/050518, data with few false positives can be obtained, and the above sequence data can be efficiently obtained in terms of data quality. Although it can be said, improvement is still expected.

本発明は、IVV法による、一つの遺伝子について幾通りもの部分配列を包含したデータの取得の効率をさらに改善することを目的とする。   An object of the present invention is to further improve the efficiency of acquiring data including several partial sequences for one gene by the IVV method.

IVV法では、プレイライブラリーの作成、ベイトとプレイの複合体の形成、及び、複合体のスクリーニングからなるラウンドを繰り返すことにより、ライブラリーにおける一つの遺伝子についての部分配列の割合が増加する。   In the IVV method, the ratio of partial sequences for one gene in the library is increased by repeating a round consisting of creation of a play library, formation of a bait and play complex, and screening of the complex.

一つの遺伝子について多数の部分配列を包含したライブラリーが得られたか否かは、シーケンスをすることにより判定できるが、各ラウンド終了後に、毎回シーケンスしてこれを判定することは効率を向上させる上で問題である。そこで、得られるライブラリーにおける、一つの遺伝子についての部分配列の割合を予め予想して、何処のタイミングで塩基配列解析を行うべきかを知ることのできる方法を検討した。その結果、ラウンド毎のRT-PCRのサイクル数をモニターすると、RT-PCRのサイクル数が一定になったところから所定の濃縮率が得られるまでラウンドを回すことによって、一つの遺伝子について多数の部分配列を包含したライブラリーが得られることを見出した。   Whether or not a library containing a large number of partial sequences for one gene has been obtained can be determined by sequencing, but after each round, sequencing and determining this can improve efficiency. It is a problem. In view of this, a method was examined in which it was possible to know in advance at what timing the base sequence analysis should be performed by predicting the proportion of partial sequences for one gene in the obtained library. As a result, when the number of RT-PCR cycles per round is monitored, a large number of portions of one gene can be obtained by rotating the round from the point where the number of RT-PCR cycles is constant until a predetermined enrichment rate is obtained. It was found that a library containing the sequence was obtained.

これらの知見に基づき、本発明は完成した。本発明は、下記のものを提供する。
[1] (1)核酸ライブラリーから、蛋白質と該蛋白質をコードする核酸とが結合した対応付け分子のライブラリーを製造する工程、(2)前記対応付け分子のライブラリーと標的物質とを混合する工程、(3)標的物質に結合した対応付け分子を選択する工程、(4)(3)で選択された対応付け分子の核酸からRT-PCR又はPCRにより核酸ライブラリーを調製する工程を含むラウンドを繰り返すことを含み、
前記RT-PCR又はPCRにおいて、増幅産物の増幅量が飽和量以下の一定量に最初に達するサイクル数を求めること、及び、前記サイクル数が一定に達した後、さらに1回以上のラウンドを経た時に、核酸ライブラリーの配列解析を行うことを特徴とする、配列データの取得方法。
[2] 蛋白質と該蛋白質をコードする核酸とが結合した対応付け分子のライブラリーを用いる配列データの取得方法であって、(a)ベイト蛋白質を設計し、(b)設計されたベイト蛋白質との相互作用に関してライブラリーからのセレクションを行い、(c)セレクション
で選択された対応付け分子の配列解析を行い、配列データを取得し、(d)取得された配列データに基づき相互作用部位を決定し、(e)決定された相互作用部位に基づき配列データを抽出することを含み、工程(b)及び(c)が[1]記載の方法により行われることを特徴とする前記方法。
[3] 配列データに基づき、相互作用部位を抽出し、抽出結果に基づきベイト蛋白質を設計することを含み、[1]又は[2]記載の方法により配列データを取得することを特徴とする蛋白質の設計方法。
[4] [1]又は[2]に記載の方法により配列データを取得し、得られた配列データを用いて、塩基配列の変化によって蛋白質間相互作用が変化する遺伝子を抽出することを特徴とする遺伝子の抽出方法。
Based on these findings, the present invention has been completed. The present invention provides the following.
[1] (1) A step of producing a library of mapping molecules in which a protein and a nucleic acid encoding the protein are bound from a nucleic acid library, and (2) mixing the library of mapping molecules and a target substance. (3) selecting the mapping molecule bound to the target substance, (4) preparing a nucleic acid library by RT-PCR or PCR from the nucleic acid of the mapping molecule selected in (3) Including repeating rounds,
In the RT-PCR or PCR, the number of cycles in which the amplification amount of the amplification product first reaches a certain amount less than or equal to the saturation amount is obtained, and after the number of cycles reaches a certain value, one or more rounds are passed. A method for obtaining sequence data, characterized in that the sequence analysis of a nucleic acid library is sometimes performed.
[2] A method for obtaining sequence data using a library of mapping molecules in which a protein and a nucleic acid encoding the protein are bound, wherein (a) a bait protein is designed, and (b) the designed bait protein (C) Sequence analysis of the corresponding molecules selected in the selection, acquisition of sequence data, (d) determination of the interaction site based on the acquired sequence data And (e) extracting sequence data based on the determined interaction site, wherein the steps (b) and (c) are performed by the method described in [1].
[3] A protein comprising extracting interaction sites based on sequence data, designing a bait protein based on the extraction result, and obtaining sequence data by the method according to [1] or [2] Design method.
[4] Characteristically, sequence data is obtained by the method according to [1] or [2], and using the obtained sequence data, a gene whose protein-protein interaction changes due to a change in base sequence is extracted. Gene extraction method.

一つの遺伝子について幾通りもの部分配列を包含した配列データを効率的に取得できる。この効率向上は、大規模蛋白質間相互作用解析においては特に重要である。また、このような配列データは、創薬ターゲット遺伝子の探索において、相互作用部位の塩基配列が変化することで蛋白質間相互作用が変化する蛋白質の抽出に用いるのに適した配列データである。このことによって、遺伝子の機能解析や疾患メカニズムの解明が加速される。さらに、相互作用部位の塩基配列の変化と疾患との関わりを解析することで、疾患関連遺伝子の抽出が可能となる。   Sequence data including various partial sequences for one gene can be efficiently obtained. This improvement in efficiency is particularly important in large-scale protein-protein interaction analyses. Further, such sequence data is sequence data suitable for use in extraction of a protein whose interaction between proteins changes due to a change in the base sequence of the interaction site in searching for a drug discovery target gene. This accelerates the functional analysis of genes and the elucidation of disease mechanisms. Furthermore, it is possible to extract a disease-related gene by analyzing the relationship between the change in the base sequence of the interaction site and the disease.

<1>本発明配列データ取得方法
本発明配列データ取得方法は、(1)核酸ライブラリーから、蛋白質と該蛋白質をコードする核酸とが結合した対応付け分子のライブラリーを製造する工程、(2)前記対応付け分子のライブラリーと標的物質とを混合する工程、(3)標的物質に結合した対応付け分子を選択する工程、(4)(3)で選択された対応付け分子の核酸からRT-PCR又はPCRにより核酸ライブラリーを調製する工程を含むラウンドを繰り返すことを含み、前記RT-PCR又はPCRにおいて、増幅量が飽和量以下の一定量に最初に達するサイクル数を求めること、及び、前記サイクル数が一定に達した後、さらに1回以上のラウンドを経た時に、核酸ライブラリーの配列解析を行うことを特徴とする。
<1> Sequence Data Acquisition Method of the Present Invention The sequence data acquisition method of the present invention comprises (1) a step of producing a library of mapping molecules in which a protein and a nucleic acid encoding the protein are bound, from a nucleic acid library; ) A step of mixing the library of matching molecules and the target substance, (3) a step of selecting the mapping molecule bound to the target substance, (4) RT from the nucleic acid of the mapping molecule selected in (3) -Repeating a round including a step of preparing a nucleic acid library by PCR or PCR, in RT-PCR or PCR, determining the number of cycles that the amplification amount first reaches a certain amount below the saturation amount; and After the number of cycles reaches a certain value, the sequence analysis of the nucleic acid library is performed when one or more rounds are passed.

上記のラウンドは、通常の対応付け分子を用いるスクリーニング方法と同様でよい(特許文献1〜3参照)。蛋白質と該蛋白質をコードする核酸とが結合した対応付け分子を用いるスクリーニング法は、例えば、遺伝子型(核酸)の増幅、表現型(蛋白質)と遺伝子型の連結、及び、アフィニティー選択を含み、これらの工程を必要により繰り返すものである。このような方法の代表的なものは、in vitro virus法に基づくスクリーニング法(例えば、WO 02/48347、特開2002-176987参照)である。   Said round may be the same as the screening method using a normal matching molecule (refer patent documents 1-3). Screening methods that use an association molecule in which a protein and a nucleic acid encoding the protein are combined include, for example, amplification of genotype (nucleic acid), linkage of phenotype (protein) and genotype, and affinity selection. These steps are repeated as necessary. A typical example of such a method is a screening method based on the in vitro virus method (see, for example, WO 02/48347, JP-A-2002-176987).

in vitro virus法による対応付け分子(以下、IVVとも呼ぶ)は、蛋白質を含む表現型分子と、該蛋白質をコードする核酸を含む遺伝子型分子とが結合してなる。遺伝子型分子は、蛋白質をコードする領域を、その領域の塩基配列が翻訳され得るような形態で有するコード分子と、スペーサー部とが結合してなる。説明の便宜のため、対応付け分子における、表現型分子に由来する部分、スペーサー分子に由来する部分、および、コード分子に由来する部分をそれぞれ、デコード部、スペーサー部およびコード部と呼ぶ。また、遺伝子型分子における、スペーサー分子に由来する部分、および、コード分子に由来する部分をそれぞれ、スペーサー部およびコード部と呼ぶ。   A mapping molecule (hereinafter also referred to as IVV) by the in vitro virus method is formed by binding a phenotype molecule containing a protein and a genotype molecule containing a nucleic acid encoding the protein. The genotype molecule is formed by binding a coding molecule having a region encoding a protein in such a form that the base sequence of the region can be translated, and a spacer part. For convenience of explanation, a part derived from a phenotype molecule, a part derived from a spacer molecule, and a part derived from a coding molecule in the mapping molecule are referred to as a decoding part, a spacer part, and a coding part, respectively. Moreover, the part derived from the spacer molecule and the part derived from the coding molecule in the genotype molecule are referred to as a spacer part and a coding part, respectively.

スペーサー分子は、例えば、核酸の3'末端に結合できるドナー領域と、ドナー領域に結合した、ポリエチレングリコールを主成分としたPEG領域と、PEG領域に結合した、ペプチド転移反応によってペプチドと結合し得る基を含むペプチドアクセプター領域とを含む。
PEG領域はなくてもよい。
The spacer molecule can bind to the peptide by, for example, a donor region capable of binding to the 3 ′ end of the nucleic acid, a PEG region mainly composed of polyethylene glycol bound to the donor region, and a peptide transfer reaction bound to the PEG region. And a peptide acceptor region containing a group.
There may be no PEG area.

核酸の3'末端に結合できるドナー領域は、通常、1以上のヌクレオチドからなる。ヌクレオチドの数は、通常には1〜15、好ましくは1〜2である。ヌクレオチドはリボヌクレオチドでもデオキシリボヌクレオチドでもよい。   The donor region that can bind to the 3 ′ end of a nucleic acid usually consists of one or more nucleotides. The number of nucleotides is usually 1-15, preferably 1-2. The nucleotide may be ribonucleotide or deoxyribonucleotide.

ドナー領域の5'末端の配列は、ライゲーション効率を左右する。コード部とスペーサー部をライゲーションさせるためには、少なくとも1残基以上を含むことが必要であり、ポリA配列をもつアクセプターに対しては、少なくとも1残基のdC(デオキシシチジル酸)または2残基のdCdC(ジデオキシシチジル酸)が好ましい。塩基の種類としては、C>U又はT>G>Aの順で好ましい。   The sequence at the 5 ′ end of the donor region affects the ligation efficiency. In order to ligate the coding part and the spacer part, it is necessary to contain at least one residue. For an acceptor having a poly A sequence, at least one residue of dC (deoxycytidylic acid) or 2 The residue dCdC (dideoxycytidylic acid) is preferred. The base type is preferably C> U or T> G> A.

PEG領域はポリエチレングリコールを主成分とするものである。ここで、主成分とするとは、PEG領域に含まれるヌクレオチドの数の合計が20塩基以下、又は、ポリエチレングリコールの平均分子量が400以上であることを意味する。好ましくは、ヌクレオチドの合計の数が10塩基以下、又は、ポリエチレングリコールの平均分子量が2000以上であることを意味する。   The PEG region is mainly composed of polyethylene glycol. Here, the main component means that the total number of nucleotides contained in the PEG region is 20 bases or less, or the average molecular weight of polyethylene glycol is 400 or more. Preferably, it means that the total number of nucleotides is 10 bases or less, or the average molecular weight of polyethylene glycol is 2000 or more.

PEG領域のポリエチレングリコールの平均分子量は、通常には、400〜30,000、好ましくは1,000〜10,000、より好ましくは2,000〜8,000である。ここで、ポリエチレングリコールの分子量が約400より低いと、このスペーサー分子に由来するスペーサー部を含む遺伝子型分子を対応付け翻訳したときに、対応付け翻訳の後処理が必要となることがあるが(Liu, R., Barrick, E., Szostak, J.W., Roberts, R.W. (2000) Methods in Enzymology,
vol. 318, 268-293)、分子量1000以上、より好ましくは2000以上のPEGを用いると、対応付け翻訳のみで高効率の対応付けができるため、翻訳の後処理が必要なくなる。また、ポリエチレングリコールの分子量が増えると、遺伝子型分子の安定性が増す傾向があり、特に分子量1000以上で良好であり、分子量400以下ではDNAスペーサーと性質がそれほどかわらず不安定となることがある。
The average molecular weight of polyethylene glycol in the PEG region is usually 400 to 30,000, preferably 1,000 to 10,000, and more preferably 2,000 to 8,000. Here, when the molecular weight of polyethylene glycol is lower than about 400, when a genotype molecule containing a spacer part derived from this spacer molecule is associated and translated, a post-process of associated translation may be required ( Liu, R., Barrick, E., Szostak, JW, Roberts, RW (2000) Methods in Enzymology,
vol. 318, 268-293), and using a PEG having a molecular weight of 1000 or more, more preferably 2000 or more, high-efficiency association can be achieved only by association translation, so that post-translation processing is not necessary. In addition, when the molecular weight of polyethylene glycol increases, the stability of genotype molecules tends to increase, especially when the molecular weight is 1000 or higher, and when the molecular weight is 400 or lower, the DNA spacer may not be so characteristic and unstable. .

ペプチドアクセプター領域は、ペプチドのC末端に結合できるものであれば特に限定されないが、例えば、ピューロマイシン、3'-N-アミノアシルピューロマイシンアミノヌクレオシド(3'-N-Aminoacylpuromycin aminonucleoside, PANS-アミノ酸)、例えばアミノ酸部がグリシンのPANS-Gly、バリンのPANS-Val、アラニンのPANS-Ala、その他、全アミノ酸に対応するPANS-全アミノ酸が利用できる。また、化学結合として3'-アミノアデノシンのアミノ基とアミノ酸のカルボキシル基が脱水縮合した結果形成されたアミド結合でつながった3'-N-アミノアシルアデノシンアミノヌクレオシド(3'-Aminoacyladenosine aminonucleoside, AANS-アミノ酸)、例えばアミノ酸部がグリシンのAANS-Gly、バリンのAANS-Val、アラニンのAANS-Ala、その他、全アミノ酸に対応するAANS-全アミノ酸が利用できる。また、ヌクレオシドまたはヌクレオシドとアミノ酸のエステル結合したものなども利用できる。その他、ヌクレオシドまたはヌクレオシドに類似した化学構造骨格を有する物質と、アミノ酸またはアミノ酸に類似した化学構造骨格を有する物質を化学的に結合可能な結合様式のものなら全て利用することができる。   The peptide acceptor region is not particularly limited as long as it can bind to the C-terminus of the peptide. For example, puromycin, 3'-N-aminoacylpuromycin aminonucleoside (3'-N-aminoacylpuromycin aminonucleoside, PANS-amino acid) For example, PANS-Gly whose amino acid part is glycine, PANS-Val of valine, PANS-Ala of alanine, and other PANS-all amino acids corresponding to all amino acids can be used. In addition, 3'-Aminoacyladenosine aminonucleoside (AANS-amino acid, 3'-Aminoacyladenosine aminonucleoside, formed by dehydration condensation of the amino group of 3'-aminoadenosine and the carboxyl group of amino acid as a chemical bond For example, AANS-Gly having an amino acid part of glycine, AANS-Val of valine, AANS-Ala of alanine, and other AANS-all amino acids corresponding to all amino acids can be used. Further, a nucleoside or a nucleoside and an amino acid ester-bonded one can be used. In addition, nucleoside or a substance having a chemical structure skeleton similar to nucleoside and an amino acid or a substance having a chemical structure skeleton similar to amino acid can be used as long as they can be chemically bonded.

ペプチドアクセプター領域は、好ましくは、ピューロマイシンもしくはその誘導体、又は、ピューロマイシンもしくはその誘導体と1残基もしくは2残基のデオキシリボヌクレオチドもしくはリボヌクレオチドからなることが好ましい。ここで、誘導体とは蛋白質翻訳系においてペプチドのC末端に結合できる誘導体を意味する。ピューロマイシン誘導体は、ピューロマイシン構造を完全に有しているものに限られず、ピューロマイシン構造の一部が欠落しているものも包含する。ピューロマイシン誘導体の具体例としては、PANS-アミノ酸、AANS-アミノ酸などが挙げられる。   The peptide acceptor region is preferably composed of puromycin or a derivative thereof, or puromycin or a derivative thereof and one or two residues of deoxyribonucleotide or ribonucleotide. Here, the derivative means a derivative capable of binding to the C-terminus of the peptide in the protein translation system. The puromycin derivatives are not limited to those having a complete puromycin structure, but also include those lacking a part of the puromycin structure. Specific examples of the puromycin derivative include PANS-amino acid and AANS-amino acid.

ペプチドアクセプター領域は、ピューロマイシンのみの構成でもかまわないが、5'末端側に1残基以上のDNAおよび/またはRNAからなる塩基配列を持つことが好ましい。配列としては、dC-ピューロマイシン, rC-ピューロマイシンなど、より好ましくはdCdC-ピューロマイシン, rCrC-ピューロマイシン, rCdC-ピューロマイシン, dCrC-ピューロマイシンなどの配列で、アミノアシル-tRNAの3'末端を模倣したCCA配列(Philipps, G.R. (1969) Nature 223, 374-377)が適当である。塩基の種類としては、C>U又はT>G>Aの順で好ましい。   The peptide acceptor region may be composed of puromycin alone, but preferably has a base sequence consisting of DNA and / or RNA of 1 residue or more on the 5 ′ end side. The sequence is dC-puromycin, rC-puromycin, etc., more preferably dCdC-puromycin, rCrC-puromycin, rCdC-puromycin, dCrC-puromycin, etc., and the 3 ′ end of aminoacyl-tRNA is A mimicked CCA sequence (Philipps, GR (1969) Nature 223, 374-377) is suitable. The base type is preferably C> U or T> G> A.

スペーサー分子は、ドナー領域とPEG領域との間に、少なくとも1つの機能付与ユニットを含むことが好ましい。機能付与ユニットは、好ましくは、少なくとも1残基のデオキシリボヌクレオチド又はリボヌクレオチドの塩基に機能修飾を施したものである。例えば、機能修飾物質として、蛍光物質、ビオチン、またはHis-tagなど各種分離タグなどを導入したものが可能である。   The spacer molecule preferably includes at least one function-imparting unit between the donor region and the PEG region. The function-imparting unit is preferably a functional modification of at least one residue of deoxyribonucleotide or ribonucleotide base. For example, a substance into which various separation tags such as a fluorescent substance, biotin, or His-tag are introduced as a function modifying substance can be used.

コード分子は、例えば、転写プロモーターおよび翻訳エンハンサーを含む5'非翻訳領域と、5'非翻訳領域の3'末端側に結合した、蛋白質をコードするORF領域と、ORF領域の3'末端側に結合したポリA配列を持ち、かつポリA配列の5'上流に親和性タグ配列を含む核酸である。   The coding molecule includes, for example, a 5 ′ untranslated region containing a transcription promoter and a translation enhancer, an ORF region encoding a protein bound to the 3 ′ end of the 5 ′ untranslated region, and a 3 ′ end of the ORF region. A nucleic acid having a bound poly A sequence and containing an affinity tag sequence 5 ′ upstream of the poly A sequence.

コード分子は、DNAでもRNAでもよく、RNAの場合、5'末端にCap構造があってもなくても良い。また、コード分子は任意のベクターやプラスミドに組み込まれたものとしてもよい。   The coding molecule may be DNA or RNA. In the case of RNA, the 5 'end may or may not have a Cap structure. The coding molecule may be incorporated into any vector or plasmid.

3'末端領域は、親和性タグ配列とその下流にポリA配列を含んでもよい。スペーサー分子とコード分子とのライゲーション効率に影響を与える要素としては3'末端領域のポリA配列が重要であり、ポリA配列は、少なくとも2残基以上のdAおよび/またはrAの混合または単一のポリA連続鎖であり、好ましくは、3残基以上、より好ましくは6以上、さらに好ましくは8残基以上のポリA連続鎖である。   The 3 ′ end region may comprise an affinity tag sequence and a poly A sequence downstream thereof. As a factor affecting the ligation efficiency between the spacer molecule and the coding molecule, the polyA sequence in the 3 ′ end region is important, and the polyA sequence may be a mixture of dA and / or rA having at least 2 residues or more. The poly A continuous chain is preferably 3 or more residues, more preferably 6 or more, and even more preferably 8 residues or more.

コード分子の翻訳効率に影響する要素としては、転写プロモーターと翻訳エンハンサーからなる5'UTR、および、ポリA配列を含む3'末端領域の組み合わせがある。3'末端領域のポリA配列の効果は通常には10残基以下で発揮される。5'UTRの転写プロモーターはT7/T3またはSP6などが利用でき、特に制限はない。好ましくはSP6であり、特に、翻訳のエンハンサー配列としてオメガ配列やオメガ配列の一部を含む配列を利用する場合はSP6を用いることが特に好ましい。翻訳エンハンサーは好ましくはオメガ配列の一部であり、オメガ配列の一部としては、TMVのオメガ配列の一部(O29; Gallie D.R., Walbot V. (1992) Nucleic Acids Res., vol. 20, 4631-4638、及び、WO 02/48347の図3参照)やO'(配列番号37)を含んだものが好ましい。   Elements affecting the translation efficiency of the coding molecule include a 5 ′ UTR consisting of a transcription promoter and a translation enhancer, and a combination of a 3 ′ terminal region containing a poly A sequence. The effect of the poly A sequence in the 3 ′ end region is usually exerted with 10 residues or less. T7 / T3 or SP6 can be used as the 5 ′ UTR transcription promoter, and there is no particular limitation. SP6 is preferable, and SP6 is particularly preferable when an omega sequence or a sequence containing a part of the omega sequence is used as an enhancer sequence for translation. The translation enhancer is preferably part of the omega sequence, and part of the omega sequence may be part of the TMV omega sequence (O29; Gallie DR, Walbot V. (1992) Nucleic Acids Res., Vol. 20, 4631 -4638, and WO 02/48347 (see FIG. 3) and O ′ (SEQ ID NO: 37) are preferred.

親和性タグ配列としては、抗原抗体反応など、蛋白質を検出できるいかなる手段を用いるための配列であればよく、制限はない。好ましくは、抗原抗体反応によるアフィニティー分離分析用タグであるFlag-tag配列やHis-tag配列である。   The affinity tag sequence is not particularly limited as long as it is a sequence for using any means capable of detecting a protein such as an antigen-antibody reaction. Preferably, a Flag-tag sequence or a His-tag sequence, which is a tag for affinity separation analysis by antigen-antibody reaction.

ORF領域については、DNAおよび/またはRNAからなるいかなる配列でもよい。遺伝子配列、エキソン配列、イントロン配列、ランダム配列、または、いかなる自然界の配列、人為的配列が可能であり、配列の制限はない。このような配列からなる核酸ライブラリーが使用できる。また、コード分子の5'UTRをSP6+O29とし、3'末端領域を、たとえば、Flag+XhoI+An(n=8)とすることで、各長さは、5'UTRで約60bp、3'末端領域で約32bpであり、PCRのプライマーにアダプター領域として組み込める長さである。このため、あらゆるベクター
やプラスミドやcDNAライブラリーからPCRによって、5'UTRと3'末端領域をもったコード分子を簡単に作成できる。コード分子において、翻訳はORF領域を超えてされてもよい。すなわち、ORF領域の末端に終止コドンがなくてもよい。
The ORF region may be any sequence consisting of DNA and / or RNA. A gene sequence, exon sequence, intron sequence, random sequence, or any natural or artificial sequence is possible, and there is no sequence limitation. A nucleic acid library having such a sequence can be used. Further, by setting the 5′UTR of the coding molecule as SP6 + O29 and the 3 ′ terminal region as, for example, Flag + XhoI + A n (n = 8), each length is about 60 bp in 5′UTR, The length of the 3 ′ end region is about 32 bp, and it can be incorporated as an adapter region into a PCR primer. For this reason, a coding molecule having a 5 ′ UTR and a 3 ′ terminal region can be easily prepared by PCR from any vector, plasmid, or cDNA library. In the coding molecule, translation may be done beyond the ORF region. That is, there may not be a stop codon at the end of the ORF region.

コード分子は、転写プロモーターおよび翻訳エンハンサーを含む5'非翻訳領域と、5'非翻訳領域の3'末端側に結合した、蛋白質をコードするORF領域と、ORF領域の3'末端側に結合した、ポリA配列を含む3'末端領域を含む核酸であってもよい。   The coding molecule was bound to the 5 'untranslated region containing the transcription promoter and translation enhancer, the ORF region encoding the protein bound to the 3' end of the 5 'untranslated region, and the 3' end of the ORF region. Or a nucleic acid containing a 3 ′ terminal region containing a poly A sequence.

遺伝子型分子は、上記コード分子を、必要により、蛋白質をコードする領域の塩基配列が翻訳され得るような形態に変換した後(例えば転写した後)、コード分子の3'末端と、スペーサー分子のドナー領域を、通常のリガーゼ反応により結合させることにより製造できる。反応条件としては、通常、4〜25℃で4〜48時間の条件が挙げられ、PEG領域を含むスペーサー分子のPEG領域内のポリエチレングリコールと同じ分子量のポリエチレングリコールを反応系に添加する場合には、15℃で0.5〜4時間に短縮することも可能である。   The genotype molecule is obtained by converting the above coding molecule into a form in which the base sequence of the protein coding region can be translated (for example, after transcription), if necessary, and the 3 ′ end of the coding molecule and the spacer molecule. The donor region can be produced by binding by a normal ligase reaction. The reaction conditions usually include conditions at 4 to 25 ° C. for 4 to 48 hours. When adding polyethylene glycol having the same molecular weight as the polyethylene glycol in the PEG region of the spacer molecule containing the PEG region, to the reaction system It is also possible to shorten to 0.5 to 4 hours at 15 ° C.

スペーサー分子とコード分子の組み合わせはライゲーション効率に重要な効果をもたらす。アクセプターにあたるコード部の3'末端領域において、少なくとも2残基以上、好ましくは3残基以上、さらに好ましくは6〜8残基以上のDNAおよび/またはRNAのポリA配列があること、さらに、5'UTRの翻訳エンハンサーとしては、オメガ配列の部分配列(O29やO' )が好ましく、スペーサー部のドナー領域としては、少なくとも1残基のdC(デオキシシチジル酸)または2残基のdCdC(ジデオキシシチジル酸)が好ましい。このことによって、RNAリガーゼを用いることでDNAリガーゼのもつ問題点を回避し、かつ効率を60〜80%に保つことができる。   The combination of spacer molecule and coding molecule has an important effect on ligation efficiency. In the 3 ′ terminal region of the coding part corresponding to the acceptor, there should be a DNA and / or RNA polyA sequence of at least 2 residues, preferably 3 residues, more preferably 6-8 residues, The UTR translation enhancer is preferably a partial sequence of an omega sequence (O29 or O '), and the spacer region donor region is at least one dC (deoxycytidylic acid) or two residues dCdC (dideoxy). Cytidylic acid) is preferred. By using RNA ligase, the problem of DNA ligase can be avoided and the efficiency can be maintained at 60 to 80%.

(a)転写プロモーターおよび翻訳エンハンサーを含む5'非翻訳領域と、5'非翻訳領域の3'末端側に結合した、蛋白質をコードするORF領域と、ORF領域の3'末端側に結合した、ポリA配列を含む3'末端領域を含むRNAであるコード分子の3'末端と、(b)上記スペーサー分子のドナー領域であってRNAからなるものとを、スペーサー分子内のPEG領域を構成するポリエチレングリコールと同じ分子量をもつ遊離のポリエチレングリコールの存在下で、RNAリガーゼにより結合させることが好ましい。   (a) a 5 ′ untranslated region containing a transcription promoter and a translation enhancer, an ORF region encoding a protein bound to the 3 ′ end of the 5 ′ untranslated region, and a 3 ′ end of the ORF region The 3 'end of the coding molecule, which is RNA containing the 3' end region containing the poly A sequence, and (b) the donor region of the spacer molecule consisting of RNA constitutes the PEG region in the spacer molecule It is preferable to bind with RNA ligase in the presence of free polyethylene glycol having the same molecular weight as polyethylene glycol.

ライゲーション反応時に、PEG領域を含むスペーサー部のPEG領域と同じ分子量のポリエチレングリコールを添加することによって、スペーサー部のポリエチレングリコールの分子量によらずライゲーション効率が80〜90%以上に向上し、反応後の分離工程も省略することができる。
この態様の対応付け分子は、上記の遺伝子型分子を無細胞翻訳系で翻訳することにより、ペプチド転移反応で、遺伝子型分子内のORF領域によりコードされた蛋白質である表現型分子と連結することにより得ることができる。無細胞翻訳系は、好ましくは、小麦胚芽又はウサギ網状赤血球のものである。翻訳の条件は通常に採用される条件でよい。例えば、25〜37℃で15〜240分の条件が挙げられる。また、この態様の対応付け分子の核酸部分は、翻訳後に逆転写によりRNAとDNAとのハイブリッドとすることができる。
By adding polyethylene glycol having the same molecular weight as the PEG region of the spacer part including the PEG region during the ligation reaction, the ligation efficiency is improved to 80 to 90% or more regardless of the molecular weight of the polyethylene glycol of the spacer part. The separation step can also be omitted.
The mapping molecule in this embodiment is linked to a phenotype molecule that is a protein encoded by the ORF region in the genotype molecule by translating the genotype molecule in a cell-free translation system. Can be obtained. The cell-free translation system is preferably that of wheat germ or rabbit reticulocytes. The conditions for translation may be those normally employed. For example, the conditions are 15 to 240 minutes at 25 to 37 ° C. In addition, the nucleic acid portion of the mapping molecule of this embodiment can be a hybrid of RNA and DNA by reverse transcription after translation.

標的物質はペプチド(化学合成された、又は天然から単離された、又は蛋白質の部分消化物であってもよい)、蛋白質、核酸(DNA、又はRNA)、糖類、種々の低分子化合物、金属、金属化合物など、あらゆる化合物や物質が該当する。   Target substances include peptides (which may be chemically synthesized, isolated from nature, or partially digested proteins), proteins, nucleic acids (DNA or RNA), saccharides, various low molecular compounds, metals All compounds and substances such as metal compounds are applicable.

本発明に用いられる標的物質は態様に応じて、樹脂、ビーズ等の固相に結合させるが、結合の時期は、対応付け分子と混合する前でも後でもよく、結合方法に応じて選択される。固相に結合させる方法としては、修飾物質を介して結合させるものと、それ以外の部分
により結合させるものが挙げられる。
The target substance used in the present invention is bound to a solid phase such as a resin or a bead depending on the embodiment, and the timing of binding may be before or after mixing with the corresponding molecule, and is selected according to the binding method. . Examples of the method for binding to a solid phase include a method of binding via a modifying substance and a method of binding using a moiety other than that.

修飾物質を介して結合させる場合に用いられる修飾物質は、通常には、特定のポリペプチドに特異的に結合する分子(以下、「リガンド」と称することがある。)であり、固相表面には該リガンドと結合する特定のポリペプチド(以下、「アダプター蛋白質」と称することがある)を結合させる。アダプター蛋白質には、結合蛋白質、受容体を構成する受容体蛋白質、抗体なども含まれる。アダプター蛋白質/リガンドの組み合わせとしては、例えば、アビジンおよびストレプトアビジン等のビオチン結合蛋白質/ビオチン、マルトース結合蛋白質/マルトース、G蛋白質/グアニンヌクレオチド、ポリヒスチジンペプチド/ニッケルあるいはコバルト等の金属イオン、グルタチオン−S−トランスフェラーゼ/グルタチオン、DNA結合蛋白質/DNA、抗体/抗原分子(エピトープ)、カルモジュリン/カルモジュリン結合ペプチド、ATP結合蛋白質/ATP、あるいはエストラジオール受容体蛋白質/エストラジオールなどの各種受容体蛋白質/そのリガンドなどが挙げられる。   The modifier used for binding via a modifier is usually a molecule that specifically binds to a specific polypeptide (hereinafter sometimes referred to as a “ligand”) and is attached to the solid surface. Binds a specific polypeptide that binds to the ligand (hereinafter sometimes referred to as "adapter protein"). Adapter proteins also include binding proteins, receptor proteins that constitute receptors, antibodies, and the like. Examples of adapter protein / ligand combinations include biotin-binding proteins such as avidin and streptavidin / biotin, maltose-binding protein / maltose, G protein / guanine nucleotide, polyhistidine peptide / nickel or cobalt or other metal ions, glutathione-S -Transferase / glutathione, DNA binding protein / DNA, antibody / antigen molecule (epitope), calmodulin / calmodulin binding peptide, ATP binding protein / ATP, or various receptor proteins such as estradiol receptor protein / estradiol / ligands thereof It is done.

これらの中で、アダプター蛋白質/リガンドの組み合わせとしては、アビジンおよびストレプトアビジンなどのビオチン結合蛋白質、マルトース結合蛋白質/マルトース、ポリヒスチジンペプチド/ニッケルあるいはコバルト等の金属イオン、グルタチオン−S−トランスフェラーゼ/グルタチオン、などが好ましく、特にストレプトアビジン/ビオチンの組み合わせが最も好ましい。これらの結合蛋白質は、それ自体既知のものであり、該蛋白質をコードするDNAは既にクローニングされている。   Among these, adapter protein / ligand combinations include biotin-binding proteins such as avidin and streptavidin, maltose-binding proteins / maltose, polyhistidine peptides / metal ions such as nickel or cobalt, glutathione-S-transferase / glutathione, The combination of streptavidin / biotin is most preferable. These binding proteins are known per se, and the DNA encoding the protein has already been cloned.

アダプター蛋白質の固相表面への結合は、それ自体既知の方法を用いることができるが、具体的には、例えば、タンニン酸、ホルマリン、グルタルアルデヒド、ピルビックアルデヒド、ビス−ジアゾ化ベンジゾン、トルエン-2,4-ジイソシアネート、アミノ基、活性エステルに変換可能なカルボキシル基、又はホスホアミダイドに変換可能な水酸基もしくはアミノ基などを利用する方法を用いることができる。   The adapter protein can be bound to the solid phase surface by a method known per se. Specifically, for example, tannic acid, formalin, glutaraldehyde, pyruvaldehyde, bis-diazotized benzidone, toluene- A method utilizing a 2,4-diisocyanate, an amino group, a carboxyl group that can be converted into an active ester, or a hydroxyl group or amino group that can be converted into a phosphoramidide can be used.

修飾物質以外の部分により固相に結合させる場合は、通常蛋白質、核酸、糖鎖、低分子化合物を固相に結合させるのに用いられる既知の方法、具体的には例えば、タンニン酸、ホルマリン、グルタルアルデヒド、ピルビックアルデヒド、ビス−ジアゾ化ベンジゾン、トルエン-2,4-ジイソシアネート、アミノ基、活性エステルに変換可能なカルボキシル基、又はホスホアミダイドに変換可能な水酸基もしくはアミノ基などを利用する方法を用いることができる。   When binding to the solid phase by a moiety other than the modifying substance, known methods commonly used for binding proteins, nucleic acids, sugar chains, low molecular weight compounds to the solid phase, specifically, for example, tannic acid, formalin, Use a method that uses glutaraldehyde, pyruvic aldehyde, bis-diazotized benzidone, toluene-2,4-diisocyanate, amino group, carboxyl group that can be converted to active ester, hydroxyl group or amino group that can be converted to phosphoramidide, etc. be able to.

固相担体は、好ましくはアガロースビーズ、磁性体が包埋されたアガロースビーズが好ましい。   The solid support is preferably agarose beads or agarose beads in which a magnetic material is embedded.

対応付け分子のライブラリーと標的物質との混合は、対応付け分子の被標的蛋白質が標的物質と相互作用する条件で混合すればよい。この条件は、検出しようとする相互作用および標的物質の種類に応じて適宜選択される。標的物質が蛋白質の場合には、その蛋白質をコードするRNAを準備し、対応付け分子の合成時に一緒に合成してもよい(共翻訳)。このような方法は、WO03/048363に記載されている。   The library of the mapping molecule and the target substance may be mixed under the condition that the target protein of the mapping molecule interacts with the target substance. This condition is appropriately selected according to the interaction to be detected and the type of target substance. When the target substance is a protein, RNA encoding the protein may be prepared and synthesized together during the synthesis of the corresponding molecule (cotranslation). Such a method is described in WO03 / 048363.

標的物質に結合した対応付け分子を選択する工程は、標的物質に結合した対応付け分子と、標的物質に結合しない対応付け分子を分離する工程であり、通常には、標的物質を固相に固定化しておく又は固定化することによって、対応付け分子と混合後の標的分子を固定化した固相を洗浄することにより分離を行うことができる。洗浄の条件は、検出しようとする相互作用および標的物質の種類に応じて適宜選択される。ここで固相に固定化するとは、対応付け分子と標的物質との結合体が非結合の分子から分離可能になっていること
を意味し、例えば、標的物質が膜蛋白質の場合、細胞の細胞膜等に発現した膜蛋白質や人工膜中に埋め込まれた蛋白質も、固相に固定化された標的物質に包含される。
The process of selecting the mapping molecule bound to the target substance is a process of separating the mapping molecule bound to the target substance and the mapping molecule that does not bind to the target substance. Usually, the target substance is fixed to the solid phase. By separating or immobilizing, separation can be performed by washing the solid phase on which the target molecule after mixing with the corresponding molecule is immobilized. Washing conditions are appropriately selected according to the interaction to be detected and the type of target substance. Here, immobilization on the solid phase means that the conjugate of the mapping molecule and the target substance can be separated from the non-bonded molecule. For example, when the target substance is a membrane protein, the cell membrane of the cell Membrane proteins expressed in the above or proteins embedded in artificial membranes are also included in the target substance immobilized on the solid phase.

選択された対応付け分子の核酸に基づいて核酸ライブラリーを調製する工程は、RT-PCR又はPCRによりDNAを調製することを含む。PCRの場合には、逆転写を行い、DNAとしてから行う。RT-PCRの方が、操作の簡便性の点で有利である。調製されたDNAは、配列解析に用いられ、又は、核酸ライブラリーとして、対応付け分子の合成に用いられる。   The step of preparing a nucleic acid library based on the nucleic acid of the selected mapping molecule includes preparing DNA by RT-PCR or PCR. In the case of PCR, reverse transcription is performed and then DNA is used. RT-PCR is advantageous in terms of ease of operation. The prepared DNA is used for sequence analysis, or used as a nucleic acid library for the synthesis of mapping molecules.

スクリーニング方法の具体例を、図15を参照して説明する。このスクリーニング方法は(I)転写、(II)無細胞共翻訳、(III)IVVセレクション及び(IV)RT-PCRからなるラウンドを繰り返すものである。共翻訳では、対応付け分子の製造と、それらとベイトとの混合が同時に行われるため、工程(I)及び(II)が、製造工程(1)及び混合工程(2)に対応している。工程(III)及び(IV)はそれぞれ、選択工程(3)及び調製工程(4)に対応する。   A specific example of the screening method will be described with reference to FIG. This screening method repeats a round consisting of (I) transcription, (II) cell-free cotranslation, (III) IVV selection, and (IV) RT-PCR. In the co-translation, the production of the mapping molecules and the mixing of them with the bait are performed at the same time. Therefore, the steps (I) and (II) correspond to the production step (1) and the mixing step (2). Steps (III) and (IV) correspond to the selection step (3) and the preparation step (4), respectively.

工程(I)では、ベイトDNA及びプレイcDNAライブラリーが転写によりベイト蛋白質mRNA及びプレイIVV mRNA(mRNAの3'側にスペーサーを介してピューロマイシンが結合されたもの)とされる。工程(II)では、ベイト蛋白質mRNA及びプレイIVV mRNAが無細胞翻訳系で翻訳され、IVVとベイトとの複合体が形成される。工程(III)では、二段セレクションが行われる。工程(IV)では、IVVの核酸部分に基づきRT-PCRによりDNAが増幅される。増幅されたDNAは、次のラウンドのライブラリーとして使用されるか、又は、配列解析に付される。   In step (I), the bait DNA and prey cDNA library are transcribed into bait protein mRNA and prey IVV mRNA (puromycin bound to the 3 ′ side of mRNA via a spacer). In step (II), bait protein mRNA and prey IVV mRNA are translated in a cell-free translation system, and a complex of IVV and bait is formed. In step (III), a two-stage selection is performed. In step (IV), DNA is amplified by RT-PCR based on the nucleic acid portion of IVV. The amplified DNA is used as the next round library or subjected to sequence analysis.

RT-PCR又はPCRにおいては、サイクル数を増やしていくと、反応が飽和状態になる。ライブラリーをテンプレートとして用いた場合には、反応が飽和状態になると、産物量は元のテンプレート量を反映したものにならなくなる。これは、テンプレートの配列や量が異なるため、一部のDNAの増幅が飽和に達しても、その他の増幅は止まらないという現象が生じるためである。このような現象により生じるバイアスは、スクリーニングにおいては好ましくない。   In RT-PCR or PCR, the reaction becomes saturated as the number of cycles is increased. When a library is used as a template, the product amount will not reflect the original template amount when the reaction is saturated. This is because the template sequence and amount are different, so that even if the amplification of some DNA reaches saturation, the other amplification does not stop. Bias caused by such a phenomenon is not preferable in screening.

そこで、スクリーニングにおいては、一般に、飽和に達する前の増幅産物を次のラウンドに用いる。通常には、増幅量が飽和量の90%以下のものを用いる。増幅量の下限は、RT-PCR又はPCRが可能であればよく、一般的には、増幅量が飽和量の40%以上である。増幅量はリアルタイムPCRによれば、簡便に測定でき、飽和量は、同一条件で、反応が飽和するまで反応させることにより特定することができる。増幅量の指標としては、リアルタイムPCRで測定される蛍光等の強度値をそのまま用いることができる。   Therefore, in the screening, the amplification product before reaching saturation is generally used for the next round. Usually, the amplification amount is 90% or less of the saturation amount. The lower limit of the amplification amount is not limited as long as RT-PCR or PCR is possible, and generally the amplification amount is 40% or more of the saturation amount. The amount of amplification can be easily measured by real-time PCR, and the amount of saturation can be specified by reacting under the same conditions until the reaction is saturated. As an amplification amount index, an intensity value such as fluorescence measured by real-time PCR can be used as it is.

本発明においては、このサイクル数を、増幅量が飽和量以下の一定量に最初に達したサイクル数を求める。一定量は、飽和量の、通常には59〜100%の範囲、好ましくは70〜85%の範囲から選ばれる。一定量が小さすぎると、次回のラウンドもしくはクローニングを行うために十分なDNA量を得ることが出来ないことがある。一定量が大きすぎるとセレクションで得られた配列の分布が変化することがある。この特定サイクル数は、後記実施例に示されるように、各ラウンドで得られるライブラリーの質(一つの遺伝子についての部分配列の割合)と関連があることが見出された。   In the present invention, this cycle number is determined as the number of cycles that first reaches a certain amount of amplification amount below the saturation amount. A certain amount is selected from a saturation amount, usually in the range of 59 to 100%, preferably in the range of 70 to 85%. If the amount is too small, it may not be possible to obtain a sufficient amount of DNA for the next round or cloning. If a certain amount is too large, the distribution of sequences obtained by selection may change. This specific cycle number was found to be related to the quality of the library obtained in each round (percentage of partial sequences for one gene), as shown in the Examples below.

本発明においては、特定サイクル数が一定に達した後、さらに1回以上のラウンドを行い、核酸ライブラリーの配列解析を行う。ここで「一定」とは、実験誤差等を考慮して実質的に一定でることを意味し、通常には、上下2回以内、好ましくは上下1回以内の変動が許される。特定サイクル数が一定に達すると、配列データ中の、一つの遺伝子についての部分配列の数が顕著に増加し始める。特定サイクル数が一定に達した後に、実施するラウンドの数の上限は、経済的観点から選択すればよいが、多すぎると、部分配列のバリエーションが低下して、配列データの質が低下する傾向がある。   In the present invention, after the number of specific cycles reaches a certain value, one or more rounds are further performed to perform sequence analysis of the nucleic acid library. Here, “constant” means that it is substantially constant in consideration of experimental errors and the like, and usually, fluctuations within 2 times are preferably allowed within 1 time. When the number of specific cycles reaches a constant, the number of partial sequences for one gene in the sequence data starts to increase significantly. After the number of specific cycles reaches a certain level, the upper limit of the number of rounds to be carried out may be selected from an economic point of view, but if too many, the variation of the partial sequence tends to decrease and the quality of the sequence data tends to decrease There is.

特定サイクル数が一定に達した後に実施するべきラウンド数は、1000倍以上の濃縮率が得られるように行うことが好ましい。   The number of rounds to be performed after the number of specific cycles reaches a certain value is preferably performed so that a concentration rate of 1000 times or more is obtained.

ここで濃縮率とは、初期cDNAライブラリーにおける指標遺伝子の存在量と1stラウンド後の指標遺伝子の存在量の比で求まる値である。指標遺伝子とは、FOS/JUNであり、ベイトFosを用いて、相互作用相手のJunが、プレイのcDNAライブラリーで濃縮されるときの比率である。FOS/JUNの相互作用の強さは物理化学的な値であり(Kd=10-7〜10-8)、相互作用の強さは普遍的であるが、濃縮率は、用いるビーズの種類や精製用のタグや精製の段数などの影響を受ける。 Here, the enrichment rate is a value obtained by a ratio between the abundance of the indicator gene in the initial cDNA library and the abundance of the indicator gene after the first round. The indicator gene is FOS / JUN, and is the ratio when Jun of the interaction partner is concentrated in the prey cDNA library using bait Fos. The FOS / JUN interaction strength is a physicochemical value (Kd = 10 -7 to 10 -8 ), and the interaction strength is universal, but the concentration rate depends on the type of beads used and It is affected by the purification tag and the number of purification stages.

後記実施例の条件では、初期cDNAライブラリーにおける指標遺伝子の存在量と1stラウンドの1段目における指標遺伝子の存在量の比は100であり(濃縮率100倍)、1stラウンドの2段目における指標遺伝子の存在量の比は10であり(濃縮率10倍)、各ラウンドの一段目の濃縮率100倍、二段目までの濃縮率は1000倍となる。従って、特定サイクル数が一定に達した後、この一段セレクションを用いるラウンドでは2回、二段セレクションでは1回行えばよい。   In the conditions of Examples described later, the ratio of the abundance of the indicator gene in the initial cDNA library and the abundance of the indicator gene in the first stage of the 1st round is 100 (concentration rate 100 times), and in the second stage of the 1st round The ratio of the abundance of the indicator gene is 10 (concentration rate 10 times), the concentration rate of the first stage of each round is 100 times, and the concentration ratio up to the second stage is 1000 times. Therefore, after the number of specific cycles reaches a certain value, the round using this one-stage selection may be performed twice, and the two-stage selection may be performed once.

濃縮率は、Genome Research vol.15 pp710-717(2005)の方法で評価できる(同文献のFig. 1B参照)。具体的には、100 nM junテンプレートを、後記実施例に記載の条件で、400 nMのfosテンプレート(ベイト)の存在下及び非存在下で翻訳し、翻訳産物の系列希釈物を、電気泳動等で定量することにより求めることができる。   The concentration rate can be evaluated by the method of Genome Research vol.15 pp710-717 (2005) (see Fig. 1B of the same document). Specifically, a 100 nM jun template is translated in the presence and absence of a 400 nM fos template (bait) under the conditions described in Examples below, and serial dilutions of translation products are subjected to electrophoresis, etc. It can be obtained by quantifying with.

なお、この濃縮率は、初期cDNAライブラリーにおける指標遺伝子の存在量と1stラウンド後の指標遺伝子の存在量の比によって濃縮力の程度を評価したものであり、特定サイクル数が一定に達した後のラウンドにおいて現実にこの濃縮率で濃縮が行われなければならないものではない。   This enrichment rate is based on the ratio of the concentration of the indicator gene in the initial cDNA library to the amount of the indicator gene after the first round, and the degree of enrichment is evaluated. In the second round, the concentration does not actually have to be performed at this concentration rate.

このように、特定サイクル数を指標とし、また、あらかじめ濃縮率の知られたセレクションを用いれば、ラウンド毎に配列解析により、一つの遺伝子について幾通りもの部分配列を包含した配列データが得られたか否かを確認する必要がないので、効率よく目的の配列データを得ることができる。   In this way, if the number of specific cycles was used as an index and selection with a known enrichment ratio was used in advance, sequence data including several partial sequences for one gene was obtained by sequence analysis for each round. Since it is not necessary to confirm whether or not, the target sequence data can be obtained efficiently.

核酸ライブラリーの配列解析は以下のように行うことができる。
配列決定により得られる塩基配列から、ベクター配列を除去し、cDNA配列を抽出し、必要によりデータベース検索し、蛋白質フレームを確認すると同時に、IVVのフレームを確認する。
The sequence analysis of the nucleic acid library can be performed as follows.
The vector sequence is removed from the base sequence obtained by sequencing, the cDNA sequence is extracted, the database is searched if necessary, the protein frame is confirmed, and at the same time, the IVV frame is confirmed.

IVVセレクションで検出したシーケンス配列とは、市販のシーケンサー(ABI,BECKMANなど)の波形データとその解析に基づく配列データである。   Sequence sequences detected by IVV selection are waveform data of commercially available sequencers (ABI, BECKMAN, etc.) and sequence data based on the analysis thereof.

ベクター配列の除去とは、シーケンスのためのクローニングに用いたベクター配列を除去し、余分な配列を除去してcDNAライブラリー配列のみとすることである。   The removal of the vector sequence is to remove the vector sequence used for cloning for the sequence and to remove the extra sequence so that only the cDNA library sequence is obtained.

cDNA配列の抽出とは、データベース検索にかけるために、ライブラリーに共通の配列を除去し、ここでは、cDNA配列のみとすることである。   Extraction of a cDNA sequence is to remove a sequence common to the library and to use only the cDNA sequence in this case for database search.

データベース検索とは、核酸データベースとして、ntなどがあり、蛋白質データベースとして、nrなどがあり、その他、refseq, fantom2などのデータベース、ゲノム・データベースなどがある。   Database search includes nt as a nucleic acid database, nr as a protein database, and other databases such as refseq and fantom2, and a genome database.

蛋白質フレームの確認とは、無細胞翻訳系で翻訳されたフレームがデータベースに登録されている蛋白質のORFとフレームが一致するかどうかを確認することである。フレームが一致していない場合は、フレーム・シフトなのか、3'UTR, 5'UTRの配列なのか、などを明らかにする。   The confirmation of the protein frame is to check whether the frame translated by the cell-free translation system matches the frame with the ORF of the protein registered in the database. If the frames do not match, clarify whether it is a frame shift or a 3'UTR, 5'UTR array.

IVVフレームの確認とは、無細胞翻訳系で翻訳されうる配列なのかどうかを確認することである。すなわち、ストップ・コドンが複数出てくるか、場所はN末端側か、などによって判断する。   Confirmation of the IVV frame is to confirm whether the sequence can be translated by a cell-free translation system. That is, whether or not a plurality of stop codons appear or whether the location is on the N-terminal side is determined.

アライメントは、通常の方法によって行うことができる。このようなアライメントを行うためのソフトウェア(例えばClustalX)が入手可能である。   Alignment can be performed by a normal method. Software for performing such an alignment (for example, ClustalX) is available.

<2>本発明配列データ取得方法の応用
本発明配列データ取得方法によれば、一つの遺伝子について多数の部分配列を包含したライブラリーの配列データを効率的に取得できる。このような配列データの性質が重要な用途のために、配列データを取得するために本発明配列データ取得方法を使用できる。以下、例を挙げて説明する。
<2> Application of Sequence Data Acquisition Method of the Present Invention According to the sequence data acquisition method of the present invention, sequence data of a library including a large number of partial sequences for one gene can be efficiently acquired. For applications where the nature of such sequence data is important, the sequence data acquisition method of the present invention can be used to acquire sequence data. Hereinafter, an example will be described.

<2−1>ターゲット遺伝子の抽出
選択的スプライシング、RNAエディティング、SNPsなど由来するDNA配列やmRNA配列の変化を追うためには、蛋白質間相互作用解析法において、どの蛋白質とどの蛋白質が相互作用するかを解析出来るだけでは十分ではない。IVV法のように、どのような塩基配列部位で相互作用しているかを詳細に検出することが重要であり、さらに、塩基配列部位が分かるだけではなく、バリアントやSNPsなどのデータベースと重ね合わせて新規の機能を見出す場合、重ね合わせるIVVの配列データ(以下、IVV配列とも呼ぶ)が多い方がよい。一つの遺伝子について多数の部分配列が得られれば、図2のように、バリアント解析の場合、ある遺伝子のどのエクソンが機能に寄与しているかを解析できる。また、融合遺伝子については、図3のように、図2と同様に解析できる。さらに、図4のように、SNPs解析の場合も、ある遺伝子のどのSNPsが機能に寄与しているかを解析できる。また、RNAエディティングや癌由来の変異については、図5のように、SNPsと同様に解析できる。
<2-1> Extraction of target genes To track changes in DNA sequences and mRNA sequences derived from alternative splicing, RNA editing, SNPs, etc., which proteins interact with which proteins in the protein-protein interaction analysis method It is not enough to be able to analyze what to do. As in the IVV method, it is important to detect in detail what kind of base sequence site interacts, and in addition to knowing the base sequence site, it can also be overlaid with databases such as variants and SNPs. When finding a new function, it is better to have more IVV sequence data to be superimposed (hereinafter also referred to as IVV sequence). If many partial sequences are obtained for one gene, as shown in FIG. 2, in the case of variant analysis, it is possible to analyze which exon of a certain gene contributes to the function. Further, the fusion gene can be analyzed in the same manner as in FIG. 2 as shown in FIG. Furthermore, as shown in FIG. 4, in the case of SNPs analysis, it is possible to analyze which SNPs of a certain gene contribute to the function. In addition, RNA editing and cancer-derived mutations can be analyzed in the same manner as SNPs, as shown in FIG.

本発明配列データ取得方法によれば、このような配列データを効率的に得ることができるので、本発明配列データ取得方法により、配列データを取得し、塩基配列の変化によって蛋白質間相互作用が変化する遺伝子を抽出することが有利である。従って、本発明により、本発明配列データ取得方法により配列データを取得し、その配列データを用いて、塩基配列の変化によって蛋白質間相互作用が変化する遺伝子を抽出する遺伝子の抽出方法が提供される。   According to the sequence data acquisition method of the present invention, such sequence data can be obtained efficiently. Therefore, the sequence data is acquired by the sequence data acquisition method of the present invention, and the interaction between proteins changes due to the change of the base sequence. It is advantageous to extract the genes that do. Therefore, according to the present invention, there is provided a gene extraction method for acquiring sequence data by the sequence data acquisition method of the present invention and using the sequence data to extract a gene whose protein-protein interaction changes due to a change in base sequence. .

図1は、本発明配列データ取得方法を利用する、本発明の「塩基配列の変化によって蛋白質間相互作用が変化する遺伝子の抽出」の構成図である。 (1)IVV法の実験、(2)公共データベース、あるいは公共データベースの組み合わせセット、(3)IVVのデータの公共データベースによる解析により、塩基配列の変化によって相互作用が変化する遺伝子の抽出とDB化、(4)さらに、疾患によって塩基配列が変化する遺伝子の抽出とそれらのDB化を行うことにより、疾患に関わる塩基配列の変化によって相互作用が変化する遺伝子を抽出し、蓄積できる。この操作を大規模に進めることにより、新しいDBが構築され、遺伝子機能や疾患メカニズムの解明が加速される。   FIG. 1 is a configuration diagram of “extraction of a gene whose protein-protein interaction is changed by a change in base sequence” of the present invention using the sequence data acquisition method of the present invention. (1) Experiment of IVV method, (2) Public database or combination set of public database, (3) Analysis of IVV data by public database, extraction of genes whose interaction changes due to base sequence change and creation of DB (4) Furthermore, by extracting genes whose base sequence changes depending on the disease and making them into a DB, genes whose interaction changes due to the change of the base sequence related to the disease can be extracted and accumulated. By proceeding with this operation on a large scale, a new database is constructed, and the elucidation of gene functions and disease mechanisms is accelerated.

公共データベース、あるいは公共データベースの組み合わせセットは、バリアントのデータベースとしては、ASD (Alternative Splicing Database)などの公共のデータベース
、自ら実験で得た選択的スプライシングのデータベースなどローカルなデータセットやそれらの組み合わせなどでもかまわない。SNPsのデータベースとしては、dbSNPなどの公共のデータベース、自ら実験得たSNPsのデータベースなどローカルなデータセットやそれらの組み合わせなどでもかまわない。RNAエディティング、変異遺伝子や融合遺伝子なども、公共のデータベース、公共データベースのアノテーションから抽出してきたセット、自ら実験得たSNPsのデータベースなどローカルなデータセットやそれらの組み合わせなどでもかまわない。トランススプライシング、スタートコドンバリエーション、ストップコドンリードスルーなどの情報やデータベースとの組み合わせによる解析も可能である。また、構造解析データベースとの解析では、構造解析による相互作用部位の解析結果とIVV法による結果を照合し、相互作用部位が正確に抽出できていることを確認できる。
A public database, or a combination set of public databases, may be a variant database, such as a public database such as ASD (Alternative Splicing Database), a local data set such as an alternative splicing database obtained through experiments, or a combination thereof. It doesn't matter. The database of SNPs may be a public database such as dbSNP, a local dataset such as a database of SNPs obtained through experiments, or a combination thereof. RNA editing, mutant genes, fusion genes, etc. can also be local data sets such as public databases, sets extracted from public database annotations, databases of SNPs obtained through experiments, or combinations thereof. Analysis based on information such as trans-splicing, start codon variation, stop codon read-through, etc. and a database is also possible. Moreover, in the analysis with the structural analysis database, the analysis result of the interaction site by the structural analysis is collated with the result by the IVV method, and it can be confirmed that the interaction site has been accurately extracted.

疾患によって塩基配列が変化する遺伝子の抽出とそれらのDB化を行うことにより、疾患に関わる塩基配列の変化によって相互作用が変化する遺伝子を抽出し、蓄積できる。この操作を大規模に進めることにより、疾患ターゲット遺伝子の新しいDBが構築され、遺伝子機能や疾患メカニズム解明が加速される。   By extracting genes whose base sequence changes depending on the disease and making them into a database, it is possible to extract and accumulate genes whose interaction changes due to changes in the base sequence related to the disease. By proceeding with this operation on a large scale, a new database of disease target genes will be constructed, and gene function and disease mechanism elucidation will be accelerated.

<2−2>蛋白質の設計
一つの遺伝子について多数の部分配列を含む配列データは、高精度な相互作用部位の決定に有用である。相互作用部位の決定を含む、蛋白質間相互作用の効率的な大規模解析のベイト設計やタンパク質の立体構造解析等を行う場合には、このような配列データの取得を効率的に取得することが重要である。
<2-2> Protein Design Sequence data including a large number of partial sequences for one gene is useful for determining an interaction site with high accuracy. When performing bait design for efficient large-scale analysis of protein-protein interactions, including the determination of interaction sites, and protein tertiary structure analysis, such sequence data can be acquired efficiently. is important.

従って、本発明配列データ取得法を利用すれば、作製したベイト蛋白質により蛋白質相互作用解析により得たプレイ蛋白質のデータベース(一次DB)から相互作用部位の正確な決定を行うことにより、ベイト蛋白質設計に必要な領域情報のデータベース(二次DB)を作成し、そのDB情報を利用することにより、ベイト蛋白質設計が速やかに行われ、連続して繰り返し解析可能なシステムを提供できる。また、システムにおける蛋白質設計に必要な領域情報を効率よく取得できる。さらに、三次元構造解析のための結晶化が難しい蛋白質の機能部位とその機能部位の抽出を効率よく行うことができる。   Therefore, if the sequence data acquisition method of the present invention is used, it is possible to design a bait protein by accurately determining the interaction site from the prey protein database (primary DB) obtained by protein interaction analysis using the prepared bait protein. By creating a database (secondary DB) of necessary region information and using the DB information, it is possible to provide a system in which bait protein design is performed quickly and can be continuously and repeatedly analyzed. In addition, it is possible to efficiently acquire region information necessary for protein design in the system. Furthermore, it is possible to efficiently extract a functional part of a protein that is difficult to crystallize for three-dimensional structural analysis and the functional part.

本発明は、蛋白質と該蛋白質をコードする核酸とが結合した対応付け分子のライブラリーを用いる配列データの取得方法であって、(a)ベイト蛋白質を設計し、(b)設計されたベイト蛋白質との相互作用に関してライブラリーからのセレクションを行い、(c)セレクションで選択された対応付け分子の配列解析を行い、配列データを取得し、(d)取得された配列データに基づき相互作用部位を決定し、(e)決定された相互作用部位に基づき配列データを抽出することを含み、工程(b)及び(c)が本発明配列データ取得法により行われることを特徴とする前記方法を提供する。
工程(a)、(d)及び(e)は、通常の方法によって行うことができる。
The present invention relates to a sequence data acquisition method using a library of mapping molecules in which a protein and a nucleic acid encoding the protein are bound to each other, comprising: (a) designing a bait protein; and (b) a designed bait protein. (C) Perform sequence analysis of the corresponding molecule selected in the selection, obtain sequence data, and (d) select the interaction site based on the obtained sequence data. And (e) extracting the sequence data based on the determined interaction site, wherein the steps (b) and (c) are performed by the sequence data acquisition method of the present invention. To do.
Steps (a), (d) and (e) can be performed by a usual method.

また、本発明は、配列データに基づき、相互作用部位を抽出し、抽出結果に基づきベイト蛋白質を設計することを含み、本発明配列データ取得方法により配列データを取得することを特徴とする蛋白質の設計方法を提供する。設計される蛋白質は、スクリーニングに使用されるベイト蛋白質、相互作用領域(機能領域)を含む蛋白質の立体構造のX線解析、NMR解析に必要な蛋白質、蛋白質の結晶化技術に必要な蛋白質などである。   The present invention also includes extracting an interaction site based on sequence data, designing a bait protein based on the extraction result, and obtaining sequence data by the sequence data acquisition method of the present invention. Provide a design method. The designed proteins include bait proteins used for screening, X-ray analysis of protein structures including interaction regions (functional regions), proteins required for NMR analysis, and proteins required for protein crystallization technology. is there.

以下、蛋白質間相互作用の効率的な大規模解析を例にとって説明する。
蛋白質間相互作用の大規模解析システムは、図11に示すように、ベイト蛋白質を設計し、IVVセレクションを行い、配列解析を行い、ベイトと相互作用するプレイ・蛋白質のデータ・ベース(DB)を一次DBとして得、一次DBに基づいて、結合部位などの相互作用部位の決定を行い、「共通インタラクト領域」、「全長インタラクト領域」などの機能情報
データベースを二次DBとして得るものである。この例では、二次DBを利用して、ベイト蛋白質の設計を行う。
Hereinafter, an efficient large-scale analysis of protein-protein interactions will be described as an example.
As shown in Fig. 11, the large-scale analysis system for protein-protein interaction designs bait proteins, performs IVV selection, performs sequence analysis, and creates a pre-protein database (DB) that interacts with baits. It is obtained as a primary DB, and based on the primary DB, an interaction site such as a binding site is determined, and a function information database such as “common interact region” and “full length interact region” is obtained as a secondary DB. In this example, a bait protein is designed using a secondary DB.

図11は、「蛋白質間相互作用の大規模解析システム」の構成図とフローである。システムは、(1)(ベイト)蛋白質設計、(2)ベイト作製とセレクション、(3)配列解析、(4)一次DB、(5)相互作用部位の決定、(6)二次DBから構成され、このフローを繰り返すことにより、大規模解析が効率的に行われ、各DBにもデータの蓄積が促進される。   FIG. 11 is a configuration diagram and a flow of a “large-scale analysis system for protein-protein interaction”. The system consists of (1) (bait) protein design, (2) bait preparation and selection, (3) sequence analysis, (4) primary DB, (5) determination of interaction site, (6) secondary DB By repeating this flow, large-scale analysis is performed efficiently, and the accumulation of data is also promoted in each DB.

(1)(ベイト)蛋白質設計は、(6)二次DBの情報を利用することで効率化できる構成になっている。具体的な利用の例としては、蛋白質間相互作用解析のためのベイト蛋白質設計、X線やNMRによる蛋白質の立体構造解析のための蛋白質の設計、さらに、創薬(ドラッグデザイン)を目的とした、蛋白質やリガンドなどと相互作用している複合体の立体構造解析のための蛋白質の結晶化技術に必要な蛋白質の設計などへの応用が提供できる。   (1) (Bait) protein design is structured to be efficient by using information of (6) secondary DB. Specific examples of utilization include bait protein design for protein-protein interaction analysis, protein design for protein structure analysis by X-ray and NMR, and drug discovery (drug design) In addition, it is possible to provide applications such as protein design necessary for protein crystallization techniques for the three-dimensional structure analysis of complexes interacting with proteins and ligands.

(2)ベイト作製とセレクションは、図11のシステムが成立するための重要な構成である。ここでは、完全にin vitroの系でのベイト作製とセレクションが必要である。ベイト作製の具体的方法は、図14に示した。また、セレクション方法は、in vitro virus法に使用できるものであれば利用可能である。ライブラリーやベイトに使用する生物種については、マウス、ヒト、その他のいずれの生物種でも使用可能である。   (2) Bait production and selection are important components for establishing the system of FIG. Here, bait creation and selection in a completely in vitro system is required. A specific method for producing the bait is shown in FIG. The selection method can be used as long as it can be used for the in vitro virus method. The species used for the library and bait can be mouse, human, or any other species.

(3)配列解析は、配列が解析できる方法であれば利用可能である。具体的には、ジデオキシ法、エピ蛍光イメージング法、光ファイバー法、ナノポア法、リアルタイムDNAシーケンシングによるシーケンス解析、あるいは、マイクロアレイ法やタイリングアレイ法によるシーケンス解析などである。   (3) Sequence analysis can be used as long as the sequence can be analyzed. Specific examples include dideoxy method, epifluorescence imaging method, optical fiber method, nanopore method, sequence analysis by real-time DNA sequencing, or sequence analysis by microarray method or tiling array method.

(4)一次DBは、(3)配列解析で配列が明らかになったデータについて、遺伝子あるいは蛋白質を決定して割り当てた配列情報によって構成されデータベースである。各配列について、遺伝子あるいは蛋白質を決定する方法としては、公共のデータベース(Nt, Locus link, refseqなど)を利用する方法などがある。また、IVV解析システム(IWAS;Genome Research vol.15 pp710-717(2005))を利用する方法もある。   (4) The primary DB is a database composed of (3) sequence information determined by assigning genes or proteins for data whose sequences have been clarified by sequence analysis. As a method for determining a gene or protein for each sequence, there is a method using a public database (Nt, Locus link, refseq, etc.). There is also a method using an IVV analysis system (IWAS; Genome Research vol.15 pp710-717 (2005)).

(5)相互作用部位の決定は、図11のシステムが成立するための重要な手段である。図12に示したように、(4)一次DBを利用して、各遺伝子(蛋白質)の各配列情報のアミノ酸配列を各遺伝子の「インタラクト領域」として、それらをアライメント(図12では、ベイトFOSを用いたIVV法により得られたプレイJUNのアライメントを実施)して得た共通アミノ酸領域である「共通インタラクト領域」を高精度な結合部位として得る。同時に、「全長インタラクト領域」などの情報も得ることが出来る。さらに、配列の遺伝子(蛋白質)情報を用いて、公共データベースのPDBにそれら遺伝子(蛋白質)が登録されているかどうかを検索し、されている場合は、第14図に示したように、PDBデータから算出した相互作用領域と「共通インタラクト領域」の比較による整合性を確認し、高精度な結合部位であることを確認する。   (5) The determination of the interaction site is an important means for establishing the system of FIG. As shown in FIG. 12, (4) using the primary DB, the amino acid sequence of each sequence information of each gene (protein) is used as an “interaction region” of each gene, and they are aligned (in FIG. 12, bait FOS A common amino acid region obtained by performing an alignment of prey JUN obtained by the IVV method using a common amino acid region is obtained as a highly accurate binding site. At the same time, information such as “full length interact region” can be obtained. Furthermore, using the gene (protein) information of the sequence, it is searched whether or not those genes (proteins) are registered in the PDB of the public database. If so, as shown in FIG. 14, the PDB data Confirm the consistency by comparing the interaction region calculated from the above and the “common interact region”, and confirm that it is a highly accurate binding site.

ここで、「IVV共通インタラクト領域」とは、複数のIVV配列をアライメントして共通する核酸(アミノ酸)配列を決定したものである。また、「IVV全長インタラクト領域」とは、複数のIVV配列をアライメントして共通する核酸(アミノ酸)配列を含む5’配列の共通しない配列の先頭から3’配列の共通しない配列の末端までの最も長い領域を決定したものである。   Here, the “IVV common interact region” is a sequence in which a plurality of IVV sequences are aligned to determine a common nucleic acid (amino acid) sequence. In addition, the “IVV full length interact region” is the most from the beginning of a non-common sequence of 5 ′ sequences including a common nucleic acid (amino acid) sequence by aligning a plurality of IVV sequences to the end of a non-common sequence of 3 ′ sequences. The long area is determined.

(6)二次DBは、(5)相互作用部位の決定によって作成された「共通インタラクト領域」、「全長インタラクト領域」などによって構成されている。これらの情報を利用することで
、(1)(ベイト)蛋白質設計が実現できる。また、「共通インタラクト領域」、「全長インタラクト領域」などを利用して、三次元構造解析やNMR解析のための蛋白質の設計が可能となる。
(6) The secondary DB is composed of (5) “common interact region”, “full length interact region” and the like created by determining the interaction site. Using this information, (1) (bait) protein design can be realized. In addition, it is possible to design proteins for three-dimensional structural analysis and NMR analysis using “common interact region”, “full length interact region” and the like.

次に、プレイの一次DBを用いた相互作用領域等の決定ならびにそれによる二次DBの作成方法およびその利用の例を説明する。   Next, a description will be given of an example of determination of an interaction area using a primary DB of play, a method of creating a secondary DB, and use thereof.

一次DBに基づく結合部位を決定する方法の例としては、プレイとして得られた遺伝子(蛋白質)のIVV配列をアライメントして求める方法がある(図12:同一遺伝子に複数のIVV配列が得られれば高精度の決定が可能である)。   As an example of a method for determining the binding site based on the primary DB, there is a method of obtaining by aligning IVV sequences of genes (proteins) obtained as a prey (FIG. 12: If a plurality of IVV sequences are obtained in the same gene) High accuracy can be determined).

ベイト蛋白質設計の場合は、IVV配列をアライメントして「IVV共通インタラクト領域」を決定し、それを含む最長のIVV配列を選択してベイト設計に用いることが挙げられる。   In the case of bait protein design, the IVV sequences are aligned to determine an “IVV common interact region”, and the longest IVV sequence including the IVV sequences is selected and used for bait design.

また、立体構造のNMR解析やX線解析のための結晶化の蛋白質設計などの場合は、「IVV共通インタラクト領域」を含む「IVV全長インタラクト領域」(IVV配列の全相互作用領域を網羅)までを領域として結晶化のための設計を行うことが挙げられる。   In the case of crystallization protein design for 3D NMR analysis and X-ray analysis, etc., up to “IVV full-length interact region” including “IVV common interact region” (covering all interaction regions of IVV sequence) Designing for crystallization using as a region.

アライメントの手法としては、ClustalWなどのプログラムを用いて、漸進的マルチプルシークエンスアライメントを行うことが挙げられる。このプログラムで同一遺伝子のフラグメントとして検出されたIVV配列をアライメントして共通する核酸(アミノ酸)配列を決定する。   As an alignment method, a gradual multiple sequence alignment may be performed using a program such as ClustalW. This program aligns IVV sequences detected as fragments of the same gene to determine a common nucleic acid (amino acid) sequence.

以下、一次DBとしてプレイDBを用いた「IVV共通インタラクト領域」、「IVV全長インタラクト領域」の決定方法、およびこの「IVV共通インタラクト領域」がPDBにより予測される相互作用領域「PDBインタラクト領域」と一致することを確認する方法についての例を示す。   The following is a method for determining the “IVV common interact region” and “IVV full length interact region” using the play DB as the primary DB, and the interaction region “PDB interact region” in which this “IVV common interact region” is predicted by the PDB. An example of how to confirm that they match is shown.

[利用する基礎データの選択]
1. IVV 配列をBLASTでNTにあてて、Ntの中の相同な配列のAccession IDとその配列中の位置情報から、IVV配列が由来する遺伝子を特定し、そのRefseqIDを取得する。
2. 1のRefseqIDからPDB IDを取得する。Ensemblにある情報からPDBとRefseqIDの対応をとる.1つのRefseqIDに複数のPDB IDが存在する場合はすべてのPDB IDを取得する.
3. RefseqIDから全長配列(塩基)を取得し、続いて遺伝子の全長のアミノ酸配列を取得し、読み枠の特定を行う。
[Select basic data to use]
1. Apply the IVV sequence to NT with BLAST, identify the gene from which the IVV sequence is derived from the Accession ID of the homologous sequence in Nt and the positional information in that sequence, and obtain the RefseqID.
2. Get the PDB ID from RefseqID in 1. The correspondence between PDB and RefseqID is taken from the information in Ensembl. If multiple PDB IDs exist in one RefseqID, all PDB IDs are acquired.
3. Obtain the full-length sequence (base) from RefseqID, then obtain the full-length amino acid sequence of the gene, and specify the reading frame.

[PDB領域の特定]
4. 2のPDB IDからPDBファイルを取得する。
5. 4で得られたPDB IDをPQSで検索し、PQS内に存在するPDB IDには、そのPDB IDにフラグを立てる。
6. 4のPDBファイルから構造決定された領域のPDBアミノ酸配列を抽出する。1つのPDBIDに複数のアミノ酸配列が登録されている場合は、すべてのアミノ酸配列を別々に抽出する。7. 6のPDBアミノ酸配列と3の全長アミノ酸配列をアライメントし、6のPDBアミノ酸配列の領域を特定する。1つのPDB IDに複数のアミノ酸配列が存在する場合は、領域がより長く、かつ相同性がより高いアミノ酸配列をPDBアミノ酸配列として利用する。1つの全長アミノ酸配列に複数のPDB IDが対応する場合は、すべてのPDBアミノ酸配列に対して領域を特定する。
[Identify PDB area]
4. Get the PDB file from the PDB ID of 2.
5. The PDB ID obtained in 4 is searched by PQS, and the PDB ID existing in the PQS is flagged.
6. Extract the PDB amino acid sequence of the region determined from the PDB file of 4. When multiple amino acid sequences are registered in one PDBID, all amino acid sequences are extracted separately. 7. Align 6 PDB amino acid sequences with 3 full-length amino acid sequences to identify the region of 6 PDB amino acid sequences. When a plurality of amino acid sequences exist in one PDB ID, an amino acid sequence having a longer region and higher homology is used as the PDB amino acid sequence. When a plurality of PDB IDs correspond to one full-length amino acid sequence, a region is specified for all PDB amino acid sequences.

[IVVインタラクト領域の特定]
8. 1のBLAST結果からIVV配列が由来する遺伝子の塩基配列の領域を特定する。
9. 3の全長のアミノ酸配列から、8で特定された領域に対応するアミノ酸配列の領域を特定し「IVVインタラクト領域」とする。複数のIVV配列が存在する場合は、それらを合わせて最上流から最下流までのアミノ酸配列の領域を「全長IVVインタラクト領域」とする。また、複数のIVV配列すべてが共有するアミノ酸配列の領域を「共通IVVインタラクト領域」とする。
10. 7のPDBアミノ酸配列の領域と9の「IVVインタラクト領域」を比較し、二つの領域が重なるPDB IDを特定する。複数のPDB IDが対応する場合は、重なる領域がより長いPDBアミノ酸配列を含むPDB IDを選択する。重なる領域の長さが同じ場合は、より長いPDBアミノ酸配列をもち、かつ5のフラグの付いているPDB IDを選択する。
[Identify IVV interact area]
8. Specify the region of the base sequence of the gene from which the IVV sequence is derived from the BLAST result of 1.
9. From the amino acid sequence of the full length of 3, the region of the amino acid sequence corresponding to the region specified in 8 is identified as the “IVV interact region”. When there are a plurality of IVV sequences, the region of the amino acid sequence from the most upstream to the most downstream is collectively referred to as a “full length IVV interact region”. A region of an amino acid sequence shared by all the plurality of IVV sequences is referred to as a “common IVV interact region”.
10. Compare 7 PDB amino acid region with 9 “IVV interact region” and identify the PDB ID where the two regions overlap. When a plurality of PDB IDs correspond, a PDB ID including a longer PDB amino acid sequence is selected. If the overlapping regions have the same length, select a PDB ID that has a longer PDB amino acid sequence and is flagged with 5.

[PDBインタラクト領域の特定]
11. 10で得られたPDB IDの中で、複数のアミノ酸配列が登録されているPDB IDを選択する。
12. 11で得られたPDB IDに登録されているすべての炭素原子、窒素原子、酸素原子(水素原子は除く)の相互の原子間距離を計算する。
13. それらのうち、異なるアミノ酸配列上に存在し、かつ4オングストローム以下の距離に存在する原子を特定する。
14. 13で特定された原子が存在するアミノ酸を「PDBインタラクト領域」とする。
[Identification of PDB interact area]
11. From the PDB IDs obtained in 10 above, select the PDB ID in which multiple amino acid sequences are registered.
12. Calculate the interatomic distance between all carbon, nitrogen, and oxygen atoms (excluding hydrogen atoms) registered in the PDB ID obtained in 11.
13. Among them, identify atoms that are on different amino acid sequences and at a distance of 4 angstroms or less.
14. The amino acid containing the atom specified in 13 is defined as “PDB interact region”.

[インタラクト領域の視覚化]
15. 10で得られたPDB ID のPDB ファイルを、RasMolなどのmolecular graphics
programに読み込ませ三次元構造を可視化する。
その際に、9で得られた「IVVインタラクト領域」「IVV全長インタラクト領域」「IVV共通インタラクト領域」、14で得られた「PDBインタラクト領域」を識別できるように表示する。
[Visualization of interact area]
15. The PDB file with the PDB ID obtained in step 10 is saved to molecular graphics such as RasMol.
Load the program to visualize the 3D structure.
At that time, the “IVV interact region”, “IVV full length interact region”, “IVV common interact region” obtained in 9 and “PDB interact region” obtained in 14 are displayed so that they can be identified.

また、IVV法によれば、選択されたプレイを効率よくベイトに転用できる。これにより、ベイトとプレイを入れ換えることによる相互作用の態様(直接又は間接など)の検証や、相互作用ネットワークの拡大を効率よく行うことができる。   Moreover, according to the IVV method, the selected play can be efficiently diverted to a bait. Thereby, verification of the mode of interaction (direct or indirect, etc.) by exchanging bait and play and expansion of the interaction network can be performed efficiently.

プレイからのベイトへの転用の手順の例を、図14を参照して説明する。
IVV法により選択されたプレイの遺伝子を持つプラスミドをテンプレート (Genome Research vol.15 pp710-717(2005)を参照) としてPCR (1st PCR)により、遺伝子の配列に応じて調製したプライマーセット(1st 5'primer及び1st 3'primer)を用いて、それぞれの遺伝子の5'側にenhancer+T7tag、3'側にカルモジュリン結合蛋白質(CBP)を一部付加したDNA断片を作成する。また、そのDNA断片の3'側tagを介してCBP+zz domain (CBPzz断片)を持つDNAをPCR(2nd PCR)により作成する。両断片をオーバーラップPCR (3rd PCR)により結合する。2nd PCR産物の5'末端にSP6 promotorを付加するPCR (4th PCR)を行い、転写のテンプレートDNAを用意する。準備したtemplate DNAを用いて転写反応を行い、mRNAを作成する。
An example of the procedure for diversion from play to bait will be described with reference to FIG.
A primer set (1st 5) prepared by PCR (1st PCR) using a plasmid containing the prey gene selected by the IVV method as a template (see Genome Research vol.15 pp710-717 (2005)). Using “primer and 1st 3 ′ primer”, DNA fragments are prepared by adding enhancer + T7tag on the 5 ′ side of each gene and a part of calmodulin-binding protein (CBP) on the 3 ′ side. Further, a DNA having a CBP + zz domain (CBPzz fragment) is prepared by PCR (2nd PCR) via the 3′-side tag of the DNA fragment. Both fragments are ligated by overlap PCR (3rd PCR). Perform PCR (4th PCR) to add SP6 promoter to the 5 'end of the 2nd PCR product, and prepare a template DNA for transcription. Perform transcription reaction using the prepared template DNA to prepare mRNA.

以上のように、本発明によれば、ベイト蛋白質からプレイ蛋白質の一方向のみの解析ではなく、得られたプレイからベイトを作製できるため、蛋白質間相互作用の効率的な大規模解析とそれによるDBへのデータの蓄積、およびデータの信頼性の向上を提供できる。また、大規模解析システムは、DBへのデータの蓄積が効率的に出来ることから、ベイト蛋白質設計に必要な領域情報の大規模DBとその作成方法を提供することが出来る。大規模DBの利用方法としては、蛋白質間相互作用解析のベイト蛋白質設計のみならず、相互作用領域(機能領域)を含む蛋白質の立体構造のX線解析、NMR解析に必要な蛋白質の設計、さらに、創薬(ドラッグデザイン)のための立体構造解析では、蛋白質やリガンドなどと相互作用している複合体の立体構造解析が重要になり、そのための蛋白質の結晶化技術に必要な
蛋白質の設計などへの応用が提供できる。すなわち、アミノ酸の全長が長い、または全長では構造が不安定で、結晶化が困難である蛋白質は、機能領域だけをクローニングし部分的に翻訳させて結晶化させることが多い。これまでの手法では、アミノ酸の全長の様々な領域を様々な長さでクローニングし、それらの結合能をすべて実験的に確認していく必要があった。また、ダイマーを形成する蛋白質は、ペアとなる蛋白質と相互作用することで安定化し、結晶化に成功するケースもあるため、場合によってはペアとなる蛋白質の同定も必要であった。IVV法で得られた配列は、蛋白質の相互作用機能部位を示しており、IVV配列が複数存在すれば、その相互作用機能部位の予測がより正確となる。さらにその部位に相互作用するペアの蛋白質は既にベイトとして特定されており、そのまま結晶化に利用できる。IVV配列を用いて特定された蛋白質コード領域を結晶化に使う領域として利用し、これによって効率の良い三次元構造解析が可能となる。
As described above, according to the present invention, since bait can be produced from the obtained prey rather than analysis of the prey protein from the bait protein, efficient large-scale analysis of protein-protein interaction and thereby Accumulate data in DB and improve data reliability. In addition, since the large-scale analysis system can efficiently accumulate data in the DB, it can provide a large-scale DB of region information necessary for bait protein design and a method for creating the same. Large-scale database usage includes not only bait protein design for protein-protein interaction analysis, but also X-ray analysis of the three-dimensional structure of proteins including interaction regions (functional regions), protein design necessary for NMR analysis, and In the three-dimensional structure analysis for drug discovery (drug design), the three-dimensional structure analysis of the complex that interacts with proteins and ligands is important, and the protein design necessary for protein crystallization technology for that purpose, etc. Application to can be provided. That is, a protein having a long amino acid length or a structure that is unstable at the full length and difficult to crystallize is often crystallized by cloning only a functional region and partially translating it. In the conventional methods, it has been necessary to clone various regions of the full length of amino acids with various lengths and experimentally confirm their binding ability. In addition, the protein that forms the dimer is stabilized by interacting with the paired protein and may be successfully crystallized, and in some cases, identification of the paired protein is also necessary. The sequence obtained by the IVV method indicates an interaction functional site of the protein. If there are a plurality of IVV sequences, the prediction of the interaction functional site becomes more accurate. Furthermore, a pair of proteins that interact with the site have already been identified as baits and can be used for crystallization as they are. The protein coding region specified using the IVV sequence is used as a region used for crystallization, which enables efficient three-dimensional structural analysis.

以下、具体的に本発明の実施例を記述するが、下記の実施例は本発明についての具体的認識を得る一助とみなすべきものであり、本発明の範囲は下記の実施例により何ら限定されるものでない。   Hereinafter, examples of the present invention will be specifically described. However, the following examples should be regarded as an aid for obtaining specific recognition of the present invention, and the scope of the present invention is limited by the following examples. It is not something.

<参考例1>
一つの遺伝子について幾通りもの部分配列を包含したライブラリーを用いて選択的エクソンについて検討した例を示す。
<Reference Example 1>
The example which examined the selective exon using the library which included several partial arrangement | sequences about one gene is shown.

ライブラリーにおける一つの遺伝子についての部分配列の割合の指標として、ライブラリー中の部分配列についてシーケンサーで配列解析を行い、Entrez gene DBに登録されているマウスの遺伝子に対し、以下のように算出されたシングルジーン率を用いた。
シングルジーン率:単一遺伝子にヒットした配列の総数/遺伝子にヒットした配列の総数
As an index of the partial sequence ratio for one gene in the library, the sequence analysis is performed for the partial sequences in the library using a sequencer, and the calculation is performed as follows for the mouse genes registered in the Entrez gene DB. Single gene rate was used.
Single gene rate: total number of sequences that hit a single gene / total number of sequences that hit a gene

マウスFosをベイト蛋白質とし、ライブラリーはマウス組織から抽出したmRNAを用いて、IVVセレクションを行い、シーケンサーにより塩基配列解析した。具体的には、下記の実施例1に記載されたように行った。   Mouse Fos was used as a bait protein, and the library was subjected to IVV selection using mRNA extracted from mouse tissue, and the base sequence was analyzed by a sequencer. Specifically, it was performed as described in Example 1 below.

続いてIVV解析システム(In Vitro Virus Analysis System: IWAS)で遺伝子解析を行った(Genome Research vol.15 pp710-717 (2005))。   Subsequently, gene analysis was performed using an IVV analysis system (In Vitro Virus Analysis System: IWAS) (Genome Research vol.15 pp710-717 (2005)).

セレクション条件として、実験条件(1)4サイクル、1段セレクション、実験条件(2)4サイクル、2段セレクションの実験条件で行い、各条件で配列解析を行い、IVVの配列データにおいて、シングルジーン率を求めた。結果は、図6に示す。実験条件(1)では、241配列解析し、シングルジーン率は42%であった。条件(2)では、131配列解析し、シングルジーン率は24%であった。   As selection conditions, experiment conditions (1) 4 cycles, 1 stage selection, experiment conditions (2) 4 cycles, 2 stages selection experiment conditions, sequence analysis under each condition, IVV sequence data single gene rate Asked. The results are shown in FIG. Under experimental condition (1), 241 sequences were analyzed and the single gene rate was 42%. In condition (2), 131 sequences were analyzed and the single gene rate was 24%.

得られたIVVの配列データについて、公共のデータベースを利用して、選択的スプライシングのバリアント解析を以下のように行った。   With respect to the obtained IVV sequence data, variant analysis of alternative splicing was performed as follows using a public database.

(a) ASD (Alternative Splicing Database) の中から、選択的に変化するエクソンの領域のみを抽出しFASTA 形式のファイルとして保存した。  (a) From the ASD (Alternative Splicing Database), only selectively changing exon regions were extracted and saved as FASTA format files.

(b) IVV 配列を (a) の 選択的エクソンに対してBLASTで相同性検索を行った。
その際の閾値は、期待値が0.001以下、相同性が90%以上、領域の長さが 60bp以上、とした。その結果、IVV 配列と選択的エクソンの対応が得られた。
(b) The homology search of the IVV sequence was performed by BLAST against the selective exon of (a).
In this case, the threshold was set to an expected value of 0.001 or less, a homology of 90% or more, and a region length of 60 bp or more. As a result, correspondence between IVV sequences and selective exons was obtained.

(c) CDS 領域内に存在するもので重複するものを統合し、その中にIVV 配列と、それに
対応する選択的エクソンが存在する遺伝子を抽出した。
(c) The duplicated ones existing in the CDS region were integrated, and the gene in which the IVV sequence and the corresponding selective exon existed was extracted.

Eefldに関する結果を、図7に示す。実験条件(1)では、Eef1dの配列は、1本であり、正確に相互作用部位を決定できないが、実験条件(2)では、Eef1dは複数本得られているので、大変正確に相互作用部位が決定でき、それにより、選択的エクソンを特定することが出来る。   The results for Eefld are shown in FIG. Under the experimental condition (1), the sequence of Eef1d is one and the interaction site cannot be determined accurately. However, under the experimental condition (2), multiple Eef1d are obtained, so the interaction site is very accurate. Can be determined so that selective exons can be identified.

<参考例2>
一つの遺伝子について幾通りもの部分配列を包含したライブラリーを用いてSNPについて検討した例を示す。
<Reference Example 2>
An example in which SNP was examined using a library containing several partial sequences for one gene is shown.

ベイトとしてマウスFosの代わりにヒトFosを、ライブラリーとしてマウス脳組織から抽出したmRNAの代わりにヒト脳組織から抽出したmRNAを用いて、参考例1と同様に、シングルジーン率を指標にして条件を検討した。但し、シングルジーン率は、Entrez gene DBに登録されているヒトの遺伝子に対して算出した。   As in the case of Reference Example 1, the conditions were set using the single gene rate as an index, using human Fos instead of mouse Fos as the bait and mRNA extracted from human brain tissue as the library instead of mRNA extracted from mouse brain tissue. It was investigated. However, the single gene rate was calculated for human genes registered in Entrez gene DB.

セレクション条件として、実験条件(3)2サイクル、1段セレクション、実験条件(4)4サイクル、1段セレクション、実験条件(5)5サイクル、2段セレクションの実験条件で行い、各条件で配列解析を行い、IVVの配列データにおいて、シングルジーン率を求めた。結果は、図8に示す。実験条件(3)では、72配列解析し、シングルジーン率は79%であった。実験条件条件(4)では、74配列解析し、シングルジーン率は44%であった。実験条件条件(5)では、57配列解析し、シングルジーン率は33%であった。   As selection conditions, experiment conditions (3) 2 cycles, 1 stage selection, experiment conditions (4) 4 cycles, 1 stage selection, experiment conditions (5) 5 cycles, 2 stages selection experiment conditions, sequence analysis under each condition The single gene rate was determined in the IVV sequence data. The results are shown in FIG. Under experimental condition (3), 72 sequences were analyzed and the single gene rate was 79%. Under experimental condition (4), 74 sequences were analyzed, and the single gene rate was 44%. Under experimental condition (5), 57 sequences were analyzed, and the single gene rate was 33%.

得られたIVVの配列データについて、公共のデータベースを利用して、SNPs解析を以下のように行った。   About the obtained IVV sequence data, SNPs analysis was performed as follows using a public database.

(a) IVV 配列をRefSeq 配列に対してBLASTで相同性検索を行った。その際の閾値は、期待値が10以下、相同性が90%以上とした。ここからIVV 配列と RefSeq ID との対応表を作成した。  (a) Homology search of IVV sequence was performed by BLAST against RefSeq sequence. In this case, the threshold was set to 10 or less for the expected value and 90% or more for the homology. From this, a correspondence table between IVV sequences and RefSeq IDs was created.

(b) dbSNPのSNP 配列は対応する RefSeq の ID が割り振られているため、そのデータを抽出してSNP と RefSeq ID との対応表を作成した。  (b) Since the corresponding RefSeq ID is assigned to the SNP sequence of dbSNP, the data was extracted and a correspondence table of SNP and RefSeq ID was created.

(c) 双方の対応表に一致する RefSeq ID を抽出し、複数の IVV 配列や、複数の SNP が、ひとつの RefSeq ID に対応している場合があったため、それらを統合した。  (c) RefSeq IDs that matched both correspondence tables were extracted, and multiple IVV sequences and multiple SNPs might correspond to one RefSeq ID, so they were integrated.

(d) 次に dbSNP から対応する SNP の周辺配列(FASTA形式)を抽出した。IVV 配列と SNP
周辺配列をSIM4によってアライメントし、実際の位置関係を確認した。
その結果、IVV 配列上に SNP が位置していることが確認できた。
(d) Next, the peripheral sequence (FASTA format) of the corresponding SNP was extracted from dbSNP. IVV sequence and SNP
Peripheral sequences were aligned by SIM4, and the actual positional relationship was confirmed.
As a result, it was confirmed that SNP was located on the IVV sequence.

(e) それらの中から、コード領域に存在するもの(cSNP)を選別し、さらにアミノ酸に変化を与えるもの(Non-synonymous cSNP)を選別した。  (e) Among them, those existing in the coding region (cSNP) were selected, and those that change the amino acid (Non-synonymous cSNP) were selected.

JUNに関する結果を図8に示す。実験条件(3)では、JUNの配列は、1本も検出されなかった。実験条件(4)では、1本検出できたので、相互作用解析は出来るが、正確な相互作用部位は抽出できず、SNPsも絞り込めない。実験条件(5)では、複数本検出できたので、JUN のFOSとの相互作用部位に対応する1つの Non-synonymous cSNP が存在することを確認できた(図9)。   The results for JUN are shown in FIG. Under experimental condition (3), no JUN sequence was detected. In experimental condition (4), one was detected, so interaction analysis was possible, but the exact interaction site could not be extracted and SNPs could not be narrowed down. In the experimental condition (5), since multiple lines were detected, it was confirmed that there was one non-synonymous cSNP corresponding to the interaction site with JUN's FOS (Fig. 9).

以上から、一つの遺伝子について幾通りもの部分配列を包含したライブラリーを効率よ
く得ることが、選択的スプライシングによってDNA配列やmRNA配列の変化、SNPsなどに由来するDNA配列やmRNA配列の変化等を追うために重要であることがわかる。
From the above, it is possible to efficiently obtain a library containing various partial sequences for one gene, such as changes in DNA sequence and mRNA sequence by selective splicing, changes in DNA sequence and mRNA sequence derived from SNPs, etc. It turns out to be important to follow.

<実施例1>
マウスc-Fosをベイト蛋白質とし、ライブラリーはマウス脳組織から抽出したmRNAを用いて、IVVセレクションを行った(Genome Research vol.15 pp710-717 (2005))。具体的には、以下の通りであった。
<Example 1>
Mouse c-Fos was used as a bait protein, and the library was subjected to IVV selection using mRNA extracted from mouse brain tissue (Genome Research vol.15 pp710-717 (2005)). Specifically, it was as follows.

<1-1>cDNAライブラリーの調製
Chechik et al. 1996 BioTechniques 21: 526-534の方法に従って、マウス脳由来のpoly(A)+ mRNAライブラリー(Clontech)又はヒト脳由来poly(A)+ mRNAライブラリー(Cosmo Bio)から、プライマー(TCATCGTCCTTGTAGTCAAGCTTNNNNNNNNN(配列番号1))を用いるランダムプライミングによる逆転写(RT)及び増幅を行い、cDNAライブラリーを調製した。5'リン酸化dsDNAは、SuperScriptII Double Strand cDNA Synthesis Kit (Invitrogen)を用いて得た。5'リン酸化dsDNAにおいては、合成二本鎖アダプター(GGAATTCG及びGAACAACAACAACAACAAACAACAACAAAATGGCTAGCATGACTGGTGGACAGCAAATGGCGAATTCC(配列番号2))がセンスcDNA鎖の5'端に結合することを利用して、アダプター結合cDNAライブラリーを、プライマー5'IVVlib (GGAAGATCTATTTAGGTGACACTATAGAACAACAACAACAACAAACAACAACAAAATG(配列番号3))及び3'IVVlib (ttttttttcttgtcgtcatcgtccttgtagTCAAGC(配列番号4))を用いてPCRにより増幅した。
<1-1> Preparation of cDNA library
According to the method of Chechik et al. 1996 BioTechniques 21: 526-534, from the poly (A) + mRNA library derived from mouse brain (Clontech) or the poly (A) + mRNA library derived from human brain (Cosmo Bio), primers ( Reverse transcription (RT) and amplification by random priming using TCATCGTCCTTGTAGTCAAGCTTNNNNNNNNN (SEQ ID NO: 1)) was performed to prepare a cDNA library. 5 'phosphorylated dsDNA was obtained using SuperScript II Double Strand cDNA Synthesis Kit (Invitrogen). In 5′-phosphorylated dsDNA, the adapter-bound cDNA library is used as a primer 5 ′ by utilizing the fact that a synthetic double-stranded adapter (GGAATTCG and GAACAACAACAACAACAAACAACAACAAAATGGCTAGCATGACTGGTGGACAGCAAATGGCGAATTCC (SEQ ID NO: 2)) binds to the 5 ′ end of the sense cDNA strand. Amplification was carried out by PCR using IVVlib (GGAAGATCTATTTAGGTGACACTATAGAACAACAACAACAACAAACAACAACAAAATG (SEQ ID NO: 3)) and 3′IVVlib (ttttttttcttgtcgtcatcgtccttgtagTCAAGC (SEQ ID NO: 4)).

ついで、cDNAライブラリーの転写、及び、PEG Puroスペーサーとの連結を行った(Miyamoto-Sato et al. 2003 Nucleic Acids Res. 31: e78)。   Subsequently, transcription of the cDNA library and ligation with a PEG Puro spacer were performed (Miyamoto-Sato et al. 2003 Nucleic Acids Res. 31: e78).

<1-2>ベイトRNAテンプレートの調製
ベイトのFos(アミノ酸118-211の部分)のDNAテンプレートは、pCMV-FosCBPzz (Miyamoto-Sato et al. 2003 Nucleic Acids Res. 31: e78)から、delta-TMV配列(Sleat et al. 1988 Nucleic Acids Res. 16: 3127-3140)を含むプライマー5'FosCBPzz(gaatttaggtgacactatagaaACAATTACTATTTACAATTACAatggctagcatgactggtggacag(配列番号5))及びプライマー3'FosCBPzz (GGATCTCCATTCGCCATTCA(配列番号6))を用いて、95℃, 1 minの後、 (98℃, 20 sec; 55℃, 1 min; 72℃, 4 min) 15サイクルの条件でPCRにより調製した。このテンプレートは、Fosの一部、ならびに、TAP法のための、カルモジュリン結合蛋白質(CBP)及びプロテインA (zドメイン)を含む。
<1-2> Preparation of Bait RNA Template The DNA template for bait Fos (parts of amino acids 118-211) was obtained from pCMV-FosCBPzz (Miyamoto-Sato et al. 2003 Nucleic Acids Res. 31: e78). Primer 5'FosCBPzz (gaatttaggtgacactatagaaACAATTACTATTTACAATTACAatggctagcatgactggtggacag (SEQ ID NO: 5)) and primer 3'FosCBPzz (GGATCTCCATTCGCCATTCA (SEQ ID NO: 6) using the sequence (Sleat et al. 1988 Nucleic Acids Res. 16: 3127-3140) , 1 min, and (98 ° C., 20 sec; 55 ° C., 1 min; 72 ° C., 4 min) were prepared by PCR under conditions of 15 cycles. This template contains part of Fos and calmodulin binding protein (CBP) and protein A (z domain) for the TAP method.

ベイトのMdm2(アミノ酸1-188の部分)のDNAテンプレートはヒト脳poly(A)+ mRNAライブラリー(Cosmo Bio)からクローニングにより調製した。すなわち、逆転写後、PCR (94℃
2 min; (94℃ 30 sec, 62℃ 30 sec, 73℃ 2 min) 15サイクル; 73℃ 15 min)を、プライマーhuman_5'T7+mdm2 (atggctagcatgactggtggacagcaaatgggtcgcggatccATgTgCAATACCAACATgTCTgTAC(配列番号7))及びhuman_3'mdm2-564 (actatcagatttgtggcgttttctttgtcgttcacc(配列番号8))により行った。また、pCMVFosCBPzzから、PCR(上記PCRと同条件)を、プライマーhuman_5'mdm2+CBP (ggtgaacgacaaagaaaacgccacaaatctgatagtctcgagctcaagagaagatggaaaaagaatttcatag(配列番号9))及び3'FosCBPzzにより行った。両方の増幅断片を用いて、プライマーhuman_5'T7+mdm2及び3'FosCBPzzを用いてオーバーラップPCR(上記PCRと同条件)を行い、その増幅産物から、プライマー5'SP6(O')T7 (GAATTTAGGTGACACTATAGAAacaattactatttacaattacaATGGCTAGCATGACTGGTGGACag(配列番号10))及び3'FosCBPzzを用いてさらにPCR(上記PCRと同条件)を行った。
The DNA template for bait Mdm2 (amino acids 1-188) was prepared from human brain poly (A) + mRNA library (Cosmo Bio) by cloning. That is, after reverse transcription, PCR (94 ° C
2 min; (94 ° C 30 sec, 62 ° C 30 sec, 73 ° C 2 min) 15 cycles; 73 ° C 15 min) with primers human_5'T7 + mdm2 (atggctagcatgactggtggacagcaaatgggtcgcggatccATgTgCAATACCAACATgTCTgTAC (SEQ ID NO: 7)) and human_3'mdm2-564 ( actatcagatttgtggcgttttctttgtcgttcacc (SEQ ID NO: 8)). Further, from pCMVFosCBPzz, PCR (same conditions as in the above PCR) was performed with primers human_5'mdm2 + CBP (ggtgaacgacaaagaaaacgccacaaatctgatagtctcgagctcaagagaagatggaaaaagaatttcatag (SEQ ID NO: 9)) and 3'FosCBPzz. Using both amplified fragments, overlap PCR (same conditions as the above PCR) using primers human_5'T7 + mdm2 and 3'FosCBPzz, primer 5'SP6 (O ') T7 (GAATTTAGGTGACACTATAGAAacaattactatttacaattacaATGGCTAGCATGACTGGTGGACag (SEQ ID NO: 10)) and 3′FosCBPzz were used for further PCR (same conditions as in the above PCR).

これらのDNAテンプレートから、Miyamoto-Sato et al. 2003 Nucleic Acids Res. 31: e78に記載の方法で、mRNAテンプレートを調製した。   From these DNA templates, mRNA templates were prepared by the method described in Miyamoto-Sato et al. 2003 Nucleic Acids Res. 31: e78.

<1-3>無細胞共翻訳及びIVVセレクション
無細胞共翻訳を、200 nMの上記で調製したマウス又はヒト脳IVV mRNAライブラリー(プレイ)、400 nM fos又はmdm2 mRNA(ベイト)を用いて、400 nM DNA (Jun/FosのAP1複合体に結合する5リピートTGACTCA配列(Chinenov and Kerppola 2001))の存在下又は非存在下で、Wheat Germ Extract (Promega)により、26℃で1 h行った。二段又は一段の精製(セレクション)は、TAP法(Rigaut et al. 1999 Nat. Biotechnol. 17: 1030-1032)に従って行った。
<1-3> Cell-free cotranslation and IVV selection Cell-free cotranslation is performed using 200 nM mouse or human brain IVV mRNA library (prey), 400 nM fos or mdm2 mRNA (bait) prepared above, 1 h at 26 ° C. with Wheat Germ Extract (Promega) in the presence or absence of 400 nM DNA (5 repeat TGACTCA sequence (Chinenov and Kerppola 2001) that binds to Jun / Fos AP1 complex). Two-stage or one-stage purification (selection) was performed according to the TAP method (Rigaut et al. 1999 Nat. Biotechnol. 17: 1030-1032).

セレクションにより得られたIVVライブラリーに対し、one-step RT-PCR kit (QIAGEN)を用いて、プライマー5'IVVlib及び3'IVVlibによりRT-PCRを行い、ライブラリーを増幅した。RT-PCR産物をCHROMA SPIN-1000 Columns (Clontech)で精製し、PCR Cloning Kit (QIAGEN)を用いてクローニングした。   The IVV library obtained by the selection was subjected to RT-PCR with primers 5′IVVlib and 3′IVVlib using a one-step RT-PCR kit (QIAGEN) to amplify the library. RT-PCR products were purified with CHROMA SPIN-1000 Columns (Clontech) and cloned using PCR Cloning Kit (QIAGEN).

配列決定には、Qpix (GENETIX)及びGenePCR System 2700 (Applied Biosystems)を用いて、ベクター特異的プライマー(M13R: gAAACAgCTATgACCATgATTACg(配列番号11)及びM13F: gTTTTCCCAgTCACgACgTTg(配列番号12))によりコロニーPCRを行った。コロニーPCR産物の精製は、BioRobot 8000 (QIAGEN)を用いて行い、産物の配列は、ABI PRISM 3100 Genetic Analyzer (Applied Biosystems)を用いて決定した。   For sequencing, colony PCR was performed using vector-specific primers (M13R: gAAACAgCTATgACCATgATTACg (SEQ ID NO: 11) and M13F: gTTTTCCCAgTCACgACgTTg (SEQ ID NO: 12)) using Qpix (GENETIX) and GenePCR System 2700 (Applied Biosystems). . The purification of the colony PCR product was performed using BioRobot 8000 (QIAGEN), and the sequence of the product was determined using ABI PRISM 3100 Genetic Analyzer (Applied Biosystems).

ラウンド毎に、ライブラリーのテンプレートを増幅するRT-PCRの条件(サイクル数)を検討した。RT-PCRにより増幅したDNAテンプレート量が、飽和量100%とした場合59%以上となる最初のサイクル数を採用すると(表1)、図10に示すように、一段セレクション(プロテインAのみ)では、第3ラウンド(図10の星印)でサイクル数は一定になった。サイクル数が一定になった後のセレクションで、シングルジーン率が顕著に低下し始め、特に二回セレクションを行うと、相互作用部位を正確に抽出するために適した、一つの遺伝子について十分な部分配列を包含したライブラリーが得られることが判明した。また、二段セレクション(プロテインA及びカルモジュリン)では、サイクル数が一定になった第3ラウンド(図10の星印)からもう一回、二段セレクションを行うと、相互作用部位を正確に抽出するために適した、一つの遺伝子について十分な部分配列を包含したライブラリーが得られることが判明した。   For each round, the RT-PCR conditions (number of cycles) for amplifying the library template were examined. When the initial number of cycles is 59% or more when the amount of DNA template amplified by RT-PCR is 100% saturation (Table 1), as shown in FIG. In the third round (stars in FIG. 10), the number of cycles became constant. In the selection after the number of cycles has become constant, the single gene rate starts to decrease significantly, especially when the selection is performed twice, a sufficient part of one gene that is suitable for accurately extracting the interaction site. It was found that a library containing the sequence was obtained. In addition, in the two-stage selection (protein A and calmodulin), when the second-stage selection is performed once again from the third round (the asterisk in FIG. 10) where the number of cycles is constant, the interaction site is accurately extracted. It was found that a library containing sufficient partial sequences for one gene was obtained.

Figure 2007181453
Figure 2007181453

ヒトMDM2を用いた場合の結果を表2に示す。ヒトMDM2をベイト蛋白質とし、ライブラリーはヒト脳組織から抽出したmRNAを用いて、IVVの一段セレクションを行い、図10と同様に、サイクル数が一定になった後、二回のセレクションを行うと、一つの遺伝子について十分な部分配列を包含したライブラリーが得られることが判明した。   The results when human MDM2 is used are shown in Table 2. Human MDM2 is used as a bait protein, and the library uses mRNA extracted from human brain tissue to perform one-stage selection of IVV, and after two cycles of selection after the number of cycles is constant, as in FIG. It was found that a library including a sufficient partial sequence for one gene was obtained.

Figure 2007181453
Figure 2007181453

<参考例3>
FOS/JUNを例として、「IVV共通インタラクト領域」、「IVV全長インタラクト領域」を決定した。
<Reference Example 3>
Taking “FOS / JUN” as an example, “IVV common interact region” and “IVV full length interact region” were determined.

FOSをベイトとして、ライブラリーはヒト脳組織から抽出したmRNAを用いて、IVVセレクションを行った(Genome Research vol.15 pp710-717(2005))。その結果得られたプレイ遺伝子のJUN(Refseq ID: NM_002228.2)について、IVV配列として、下記のIVV(1)〜IVV(9)を
得た(図12)。IVV(1)〜IVV(9)をアライメントすることで、「IVV共通インタラクト領域」、「IVV全長インタラクト領域」を得た。この「IVV共通インタラクト領域」は、PDBにより予測される相互作用領域(アミノ酸番号286〜318(286, 287, 290, 291, 293, 294, 297, 298, 300, 301, 304, 305, 307, 308, 311, 312, 314, 315, 318))と良く一致していた。
Using FOS as a bait, IVV selection was performed using mRNA extracted from human brain tissue as a library (Genome Research vol.15 pp710-717 (2005)). As a result, the following IVV (1) to IVV (9) were obtained as the IVV sequence for the prey gene JUN (Refseq ID: NM — 002228.2) obtained as a result (FIG. 12). By aligning IVV (1) to IVV (9), “IVV common interact region” and “IVV full length interact region” were obtained. This “IVV common interact region” is an interaction region predicted by PDB (amino acid numbers 286 to 318 (286, 287, 290, 291, 293, 294, 297, 298, 300, 301, 304, 305, 307, 308, 311, 312, 314, 315, 318)).

プレイJUN(Refseq ID: NM_002228.2)の「IVVインタラクト領域」:
IVV(1): 050517_5_D1_C05_5_D1C5_034.seq; 284-327
IVV(2): 050517_5_D1_H05_5_D1H5_044.seq; 257-326
IVV(3): 050519_m5_2_G09_m5_2_G9_068.seq; 282-326
IVV(4): D1_A12.seq; 257-326
IVV(5): D1_D12.seq; 284-327
IVV(6): D1_E02.seq; 277-331
IVV(7): H1_M17.seq; 284-327
IVV(8): d1_5th_c04.seq; 277-331
IVV(9): d1_5th_f12.seq; 257-326
Play JUN (Refseq ID: NM_002228.2) "IVV interact area":
IVV (1): 050517_5_D1_C05_5_D1C5_034.seq; 284-327
IVV (2): 050517_5_D1_H05_5_D1H5_044.seq; 257-326
IVV (3): 050519_m5_2_G09_m5_2_G9_068.seq; 282-326
IVV (4): D1_A12.seq; 257-326
IVV (5): D1_D12.seq; 284-327
IVV (6): D1_E02.seq; 277-331
IVV (7): H1_M17.seq; 284-327
IVV (8): d1_5th_c04.seq; 277-331
IVV (9): d1_5th_f12.seq; 257-326

プレイJUNの「IVV共通インタラクト領域」:282-326
プレイJUNの「IVV全長インタラクト領域」:257-331
Play JUN's “IVV Common Interact Area”: 282-226
Play JUN's “IVV Full Length Interaction Region”: 257-331

<参考例4>
c-Fosをベイト蛋白質とし、ライブラリーとしてはマウス脳組織から抽出したmRNAを用いて、IVVセレクションを行い、シーケンサーにより配列解析した。続いてIVV解析システム(IWAS)で遺伝子解析を行い、プレイの一次DBを得た(Genome Research vol.15 pp710-717(2005))。
<Reference Example 4>
Using c-Fos as a bait protein and mRNA extracted from mouse brain tissue as a library, IVV selection was performed and sequence analysis was performed using a sequencer. Subsequently, gene analysis was performed with an IVV analysis system (IWAS) to obtain the primary DB of play (Genome Research vol.15 pp710-717 (2005)).

ベイトc-Fosとの相互作用を確認したプレイ(Jun/ Tro1/ Tro2/ Eef1d/ Ship1/ Opt/ JunD/ C130020M04Rik/ Psmc5/ FLJ32000/ Snapc5/Rit2)について(図13A:プルダウンによるプレイとベイトc-Fosとの相互作用確認)、一次DBに基づき、「IVV共通インタラクト領域」を決定し、それを含む最長のIVV配列を選択した。
選択された配列を以下に示す。
Play (Jun / Tro1 / Tro2 / Eef1d / Ship1 / Opt / JunD / C130020M04Rik / Psmc5 / FLJ32000 / Snapc5 / Rit2) that confirmed the interaction with bait c-Fos (Figure 13A: Pull-down play and bait c-Fos Based on the primary DB, the “IVV common interact region” was determined, and the longest IVV sequence containing it was selected.
Selected sequences are shown below.

1. Jun
DNA配列(配列番号13)
GCGGATCAAGGCAGAGAGGAAGCGCATGAGGAACCGCATTGCCGCCTCCAAGTGCCGGAAAAGGAAGCTGGAGCGGATCGCTCGGCTAGAGGAAAAAGTGAAAACCTTGAAAGCGCAAAACTCCGAGCTGGCATCCACGGCCAACATGCTCAGGGAACAGGTGGCACAGCTTAAGCAGAAAGTCATGAACCACGTTAACAGTGGGTGCCAACTCATGCTAACACAGCAG
アミノ酸配列(配列番号14)
RIKAERKRMRNRIAASKCRKRKLERIARLEEKVKTLKAQNSELASTANMLREQVAQLKQKVMNHVNSGCQLMLTQQ
1. Jun
DNA sequence (SEQ ID NO: 13)
GCGGATCAAGGCAGAGAGGAAGCGCATGAGGAACCGCATTGCCGCCTCCAAGTGCCGGAAAAGGAAGCTGGAGCGGATCGCTCGGCTAGAGGAAAAAGTGAAAACCTTGAAAGCGCAAAACTCCGAGCTGGCATCCACGGCCAACATGCTCAGGGAACAGGTGGCACAGCTTAAGCAGACAAGGTCATGAACCGCTGACAG
Amino acid sequence (SEQ ID NO: 14)
RIKAERKRMRNRIAASKCRKRKLERIARLEEKVKTLKAQNSELASTANMLREQVAQLKQKVMNHVNSGCQLMLTQQ

2. Tro1
DNA配列(配列番号15)
GATTGAGGCATCTAACAGACAGATTGGGGCATCTAACAGACAAACTGAGGCATCTAACAGACAGATTGGGCATCTAACAGACAGACTGAGGCATCTAACAGACAGATTGGGGCATcTAACAGACAGACTGATGCATCTAACAGACAGACTGATGCATCTAACAGACAGACTGAGGCATCTAGCAGACAGACAGAGGCATCTAGCAGACAGACTG
アミノ酸配列(配列番号16)
IEASNRQIGASNRQTEASNRQIGHLTDRLRHLTDRLGHLTDRLMHLTDRLMHLTDRLRHLADRQRHLADRL
2. Tro1
DNA sequence (SEQ ID NO: 15)
GATTGAGGCATCTAACAGACAGATTGGGGCATCTAACAGACAAACTGAGGCATCTAACAGACAGATTGGGCATCTAACAGACAGACTGAGGCATCTAACAGACAGATTGGGGCATcTAACAGACAGACTGATGCATCTAACAGACAGACTGATGCATCTAACAGACAGACTGAGGCATCTAGCAGACAGACAGAGGCATG
Amino acid sequence (SEQ ID NO: 16)
IEASNRQIGASNRQTEASNRQIGHLTDRLRHLTDRLGHLTDRLMHLTDRLMHLTDRLRHLADRQRHLADRL

3. Tro2
DNA配列(配列番号17)
GAGGCATCTAACAGACAGATTGGGGCATCTAACAGACAGACTGAGGCATCTAACAGACAGATTGGGGCATCTAACAGACAGACTGATGCATCTAACAGACAGACTGAGGCATCTAGCAGACAGACAGAGGCATCTAGCAGACAGGCAGAGGCAC
アミノ酸配列(配列番号18)
RHLTDRLGHLTDRLRHLTDRLGHLTDRLMHLTDRLRHLADRQRHLADRQRH
3. Tro2
DNA sequence (SEQ ID NO: 17)
GAGGCATCTAACAGACAGATTGGGGCATCTAACAGACAGACTGAGGCATCTAACAGACAGATTGGGGCATCTAACAGACAGACTGATGCATCTAACAGACAGACTGAGGCATCTAGCAGACAGACAGAGGCATCTAGCAGACAGGCAGAGGCAC
Amino acid sequence (SEQ ID NO: 18)
RHLTDRLGHLTDRLRHLTDRLGHLTDRLMHLTDRLRHLADRQRHLADRQRH

4. Eef1d
DNA配列(配列番号19)
CCACAGTGAGCTCATTGTGAGGATTACCAGTCTGGAAGTGGAGAATCAGAACCTTCGAGGCGTGGTGCAAGATTTGCAGCAGGCCATTTCCAAGTTGGAGGCCCGGCTGAGCTCTCTAGAGAAGAGTTCACCTACTCCCCGAGCCACGGCCCCACAGACCCG
アミノ酸配列(配列番号20)
HSELIVRITSLEVENQNLRGVVQDLQQAISKLEARLSSLEKSSPTPRATAPQTR
4. Eef1d
DNA sequence (SEQ ID NO: 19)
CCACAGTGAGCTCATTGTGAGGATTACCAGTCTGGAAGTGGAGAATCAGAACCTTCGAGGCGTGGTGCAAGATTTGCAGCAGGCCATTTCCAAGTTGGAGGCCCGGCTGAGCTCTCTAGAGAAGAGTTCACCTACTCCCCGAGCCACGGCCCCACAGACCCG
Amino acid sequence (SEQ ID NO: 20)
HSELIVRITSLEVENQNLRGVVQDLQQAISKLEARLSSLEKSSPTPRATAPQTR

5. Schip1
DNA配列(配列番号21)
CCCACACATGCCTCACATAAGCGAATGTTTGATGAAAAGAAGCTTAAAGCCCACCGACCTGAGAGACATGACTATCGGGCAGCTACAAGTGATCGTCAATGACCTCCACTCCCAGATTGAGCGTTTGAATGAAGAGTTGGTCCAGCTGCTCCTTATTCGAGATGAGCTGCACACAGAACAAGATGCCATGCTGGTGGACATTGAAGACTTGACTAGACACGCTGAGAAGGAGCAG
アミノ酸配列(配列番号22)
PHMPHISECLMKRSLKPTDLRDMTIGQLQVIVNDLHSQIERLNEELVQLLLIRDELHTEQDAMLVDIEDLTRHAEKEQ
5. Schip1
DNA sequence (SEQ ID NO: 21)
CCCACACATGCCTCACATAAGCGAATGTTTGATGAAAAGAAGCTTAAAGCCCACCGACCTGAGAGACATGACTATCGGGCAGCTACAAGTGATCGTCAATGACCTCCACTCCCAGATTGAGCGTTTGAATGAAGAGTTGGTCCAGCTGCTCCTTATTCGAGATGAGCTGAGCACATGAGCGATGAGATTCCATGCTGGA
Amino acid sequence (SEQ ID NO: 22)
PHMPHISECLMKRSLKPTDLRDMTIGQLQVIVNDLHSQIERLNEELVQLLLIRDELHTEQDAMLVDIEDLTRHAEKEQ

6. Optinurin
DNA配列(配列番号23)
GCTGAAGACCCAGGTGGAGCAGGAAGTGGAGCATCTGAAGATCCAGGTGATGCGCCTTCGGGCTGAAAAGGCAGACCTGCTGGGCATCGTCTCAGAACTGCAGCTCAAACTCAACTCCGGCGGCTCCTcGGAAGACTCCTTcGTTGAGATCAGGATGACCGAAGGAGAGACTGAAGGGGCAATGAAGGAGATGAAGAGCTGCCCTACACCCaCAAGAACAGACCCCATCAGCTTGAGCAACTGTACAGAGGATGCCAGGAGTTGTGCGGAGTTTGAAGAACTGACTGTGAGCCAGCTTcTGCTTTGCCTAAGGGAAGGAAACCAA
アミノ酸配列(配列番号24)
LKTQVEQEVEHLKIQVMRLRAEKADLLGIVSELQLKLNSGGSSEDSFVEIRMTEGETEGAMKEMKSCPTPTRTDPISLSNCTEDARSCAEFEELTVSQLLLCLREGNQ
6. Optinurin
DNA sequence (SEQ ID NO: 23)
GCTGAAGACCCAGGTGGAGCAGGAAGTGGAGCATCTGAAGATCCAGGTGATGCGCCTTCGGGCTGAAAAGGCAGACCTGCTGGGCATCGTCTCAGAACTGCAGCTCAAACTCAACTCCGGCGGCTCCTcGGAAGACTCCTTcGTTGAGATCAGGATGACCGAAGGAGAGACTGAAGGGGCAATGAAGGAGATGAAGAGCTGCCCTACACCCaCAAGAACAGACCCCATCAGCTTGAGCAACTGTACAGAGGATGCCAGGAGTTGTGCGGAGTTTGAAGAACTGACTGTGAGCCAGCTTcTGCTTTGCCTAAGGGAAGGAAACCAA
Amino acid sequence (SEQ ID NO: 24)
LKTQVEQEVEHLKIQVMRLRAEKADLLGIVSELQLKLNSGGSSEDSFVEIRMTEGETEGAMKEMKSCPTPTRTDPISLSNCTEDARSCAEFEELTVSQLLLCLREGNQ

7. JunD
DNA配列(配列番号25)
CAAGAGGCTGCGCAACCGCATCGCCGCCTCCAAATGCCGCAAGCGCAAGCTGGAGCGTATCTCGCGCCTGAAGGAGAAAGTCAAGACCCTCAAAAGCCAGAACACCGAGCTGGCGTCCACCGCCAGCCTGCTGCGCGAGCAGGTGGCGCAGCTCAAACAGAAAGTCCTCAGCCACGTCAACAGCGGCTGCCAGCTGCTGCCCCAGCACCAGGCC
アミノ酸配列(配列番号26)
KRLRNRIAASKCRKRKLERISRLKEKVKTLKSQNTELASTASLLREQVAQLKQKVLSHVNSGCQLLPQHQA
7. JunD
DNA sequence (SEQ ID NO: 25)
CAAGAGGCTGCGCAACCGCATCGCCGCCTCCAAATGCCGCAAGCGCAAGCTGGAGCGTATCTCGCGCCTGAAGGAGAAAGTCAAGACCCTCAAAAGCCAGAACACCGAGCTGGCGTCCACCGCCAGCCTGCTGCGCGAGCAGGTGGCGCAGCTCAAACAGAAAGTCCTCAGCCACGTCAACAGCGCCTGCCAGC
Amino acid sequence (SEQ ID NO: 26)
KRLRNRIAASKCRKRKLERISRLKEKVKTLKSQNTELASTASLLREQVAQLKQKVLSHVNSGCQLLPQHQA

8. C130020M04Rik
DNA配列(配列番号27)
CGATGCCGGCAAAAGCGGAAACTGTGGGTGTCCTCCCTGGAAAAGAAGGCAGAAGAACTTACTTCTCAGAACATTCAGCTGAGTAATGAAGTCACATTACTACGCAATGAGGTGGCTCAGCTGAAGCAGCTACTGTTAGCTCATAAAGATTGTCCAGTCACCGCACAA
アミノ酸配列(配列番号28)
RCRQKRKLWVSSLEKKAEELTSQNIQLSNEVTLLRNEVAQLKQLLLAHKDCPVTAQ
8. C130020M04Rik
DNA sequence (SEQ ID NO: 27)
CGATGCCGGCAAAAGCGGAAACTGTGGGTGTCCTCCCTGGAAAAGAAGGCAGAAGAACTTACTTCTCAGAACATTCAGCTGAGTAATGAAGTCACATTACTACGCAATGAGGTGGCTCAGCTGAAGCAGCTACTGTTAGCTCATAAAGATTGTCCAGTCACCGCACAA
Amino acid sequence (SEQ ID NO: 28)
RCRQKRKLWVSSLEKKAEELTSQNIQLSNEVTLLRNEVAQLKQLLLAHKDCPVTAQ

9. Psmc5
DNA配列(配列番号29)
GCCAGAATCTCCGTAGACTGCAGGCACAGAGGAATGAGCTGAATGCAAAAGTTCGCCTGTTGCGGGAGGAGCTGCAGCTGTTGCAGGAACAGGGCTCCTACGTTGGAGAAGTCGTGAGGGCAGA
アミノ酸配列(配列番号30)
RQNLRRLQAQRNELNAKVRLLREELQLLQEQGSYVGEVVRAE
9. Psmc5
DNA sequence (SEQ ID NO: 29)
GCCAGAATCTCCGTAGACTGCAGGCACAGAGGAATGAGCTGAATGCAAAAGTTCGCCTGTTGCGGGAGGAGCTGCAGCTGTTGCAGGAACAGGGCTCCTACGTTGGAGAAGTCGTGAGGGCAGA
Amino acid sequence (SEQ ID NO: 30)
RQNLRRLQAQRNELNAKVRLLREELQLLQEQGSYVGEVVRAE

10. FLJ32000
DNA配列(配列番号31)
GGAAGAAGTTCAGCAGCCTGCAGAAGGAGATCGAAGAGCGCACCAACGACATCGAGCTCCTCAAGTCGGAGCGGATGAAGCTGCAGGGCATCATCAGATCCCTGGAGAAAGACATCCAAGGGCTCAAGAGAGAGATCCAGGAGAGGGACGAGACCATTCAAGACATGGAGAAGCTTGACTACAAGGACGATTATAATTCAAACCTAGAGATC
アミノ酸配列(配列番号32)
RKKFSSLQKEIEERTNDIELLKSERMKLQGIIRSLEKDIQGLKREIQERDETIQDMEKLDYKDDYNSNLEIKL
10. FLJ32000
DNA sequence (SEQ ID NO: 31)
GGAAGAAGTTCAGCAGCCTGCAGAAGGAGATCGAAGAGCGCACCAACGACATCGAGCTCCTCAAGTCGGAGCGGATGAAGCTGCAGGGCATCATCAGATCCCTGGAGAAAGACATCCAAGGGCTCAAGAGAGAGATCCAGGAGAGGGACGAGACCATTCAAGACATGGAGAAGCTGAACTG
Amino acid sequence (SEQ ID NO: 32)
RKKFSSLQKEIEERTNDIELLKSERMKLQGIIRSLEKDIQGLKREIQERDETIQDMEKLDYKDDYNSNLEIKL

11. Snapc5
DNA配列(配列番号33)
CGCCCTAAGGAAGTGGAAGGGGACGTTGAGTCGACTGCAGGAGCTCCGCAAGGAGGTGGAAACCCCGCTGCGTcTAAAGGCGGCTCTACACGACCAACTGAACCGCCTCAAGGTTGAAGAATTAGCCCTTCAATCCATGATAAATTCTCGAGGAAGGACCGAGACACTGTCTTCTCAGCCTGCaCCTGAACAGTTATGTGATATGTCCCTACATGTAGACAACGAAGTGACAATAAATCAGACTAGGCTG
アミノ酸配列(配列番号34)
ALRKWKGTLSRLQELRKEVETPLRLKAALHDQLNRLKVEELALQSMINSRGRTETLSSQPAPEQLCDMSLHVDNEVTINQTRL
11. Snapc5
DNA sequence (SEQ ID NO: 33)
CGCCCTAAGGAAGTGGAAGGGGACGTTGAGTCGACTGCAGGAGCTCCGCAAGGAGGTGGAAACCCCGCTGCGTcTAAAGGCGGCTCTACACGACCAACTGAACCGCCTCAAGGTTGAAGAATTAGCCCTTCAATCCATGATAAATTCTCGAGGAAGGACCGAGCAATGGTCG
Amino acid sequence (SEQ ID NO: 34)
ALRKWKGTLSRLQELRKEVETPLRLKAALHDQLNRLKVEELALQSMINSRGRTETLSSQPAPEQLCDMSLHVDNEVTINQTRL

12. Rit2
DNA配列(配列番号35)
TGCAGCCCTGCGATTCGGTATCGATGATGCTCTTCAAGGCTTAGTGAGAGAAATTCGCAGGAAGGAATCCATGCTGCCCTTGGTGGAAAGGAAATTGAAGAGGAAGGACAGCCTGTGGAAGAAGATAAAAGCCTCCCTGAAGAAGAAGAGG
アミノ酸配列(配列番号36)
AALRFGIDDALQGLVREIRRKESMLPLVERKLKRKDSLWKKIKASLKKKR
12. Rit2
DNA sequence (SEQ ID NO: 35)
TGCAGCCCTGCGATTCGGTATCGATGATGCTCTTCAAGGCTTAGTGAGAGAAATTCGCAGGAAGGAATCCATGCTGCCCTTGGTGGAAAGGAAATTGAAGAGGAAGGACAGCCTGTGGAAGAAGATAAAAGCCTCCCTGAAGAAGAAGAGG
Amino acid sequence (SEQ ID NO: 36)
AALRFGIDDALQGLVREIRRKESMLPLVERKLKRKDSLWKKIKASLKKKR

このように選択されたIVV配列を有するプレイの遺伝子からベイト用テンプレートを作成し(図14)、プルダウンにより、ベイトとしての機能について検証した。その結果、発現しなかった一つのクローン(C130020M04Rik)を除いて、12個中11個がベイトとして機能可能なことが確認できた(図13B:プルダウンによる各ベイトとプレイc-Fosとの相互作用確認)。このことは、この方法によるベイト設計が非常に効率的であることを示している。   A bait template was created from the prey gene having the IVV sequence thus selected (FIG. 14), and the function as a bait was verified by pull-down. As a result, it was confirmed that 11 out of 12 cells could function as baits except for one clone (C130020M04Rik) that did not express (FIG. 13B: interaction between each bait and pre-c-Fos by pull-down) Confirmation). This shows that the bait design by this method is very efficient.

各手順の詳細は以下の通りであった。
1.ベイト蛋白質mRNAの準備
選択されたクローンを持つプラスミドをテンプレート (Genome Research vol.15 pp710-717を参照) としてExTaq (Takara)を用いたPCR (1st PCR)により、それぞれの遺伝子の5'側にenhancer+T7tag、3'側にカルモジュリン結合蛋白質 (CBP)を一部付加したDNA断片を作成し、QIAquick PCR Purification Kit (QIAGEN)で精製した。そのDNA断片の3'側タグを介してCBP+zz domain (CBPzz断片)を持つDNAをオーバーラップPCR (2nd PCR)により結合、1st PCRと同様に処理した。2nd PCR産物の5'末端にSP6 promotorを付加するPCR (3rd
PCR)を行い、1st PCRと同様に処理することで転写のテンプレートDNAを用意した。
Details of each procedure were as follows.
1. Preparation of bait protein mRNA By PCR (1st PCR) using ExTaq (Takara) using a plasmid with the selected clone as a template (see Genome Research vol.15 pp710-717), enhancer is placed on the 5 'side of each gene. A DNA fragment in which calmodulin-binding protein (CBP) was partially added to the 3 ′ side was prepared and purified by QIAquick PCR Purification Kit (QIAGEN). DNA having a CBP + zz domain (CBPzz fragment) was bound by overlap PCR (2nd PCR) via the 3′-side tag of the DNA fragment, and treated in the same manner as 1st PCR. PCR to add SP6 promotor to the 5 'end of the 2nd PCR product (3rd
PCR) and a template DNA for transcription was prepared by processing in the same manner as 1st PCR.

準備したテンプレートDNAとCap analoge (Invitrogen)を用いてRiboMAX Large Scale RNA Production System-SP (Promega)により転写反応を行い、mRNAを作成した。mRNAはRNeasy Mini Kit (QIAGEN)で精製した。   Using the prepared template DNA and Cap analoge (Invitrogen), transcription reaction was performed by RiboMAX Large Scale RNA Production System-SP (Promega) to prepare mRNA. mRNA was purified with RNeasy Mini Kit (QIAGEN).

2.プレイc-FOS mRNAの準備
ベイトc-FOSをコードするプラスミドをテンプレートとしてExTaq (Takara)を用いたPCR
(4th PCR、プライマーセット:Table4)によりc-FOSをコードするDNA断片を増幅、QIAquick PCR Purification Kit (QIAGEN)で精製した。4th PCRの産物をテンプレートとしてPCR
(5th PCR)を行い、QIAquick PCR Purification Kit (QIAGEN)で精製した。この5th PCR産物、RiboMAX Large Scale RNA Production System-SP (Promega)とCap analoge (Invitrogen)を用いて転写を行い、mRNAを作成した。mRNAはRNeasy Mini Kit (QIAGEN)で精製した。
2. Preparation of pre-c-FOS mRNA PCR using ExTaq (Takara) with plasmid encoding bait c-FOS
A DNA fragment encoding c-FOS was amplified by (4th PCR, primer set: Table 4) and purified by QIAquick PCR Purification Kit (QIAGEN). PCR using 4th PCR product as template
(5th PCR) was performed and purified with the QIAquick PCR Purification Kit (QIAGEN). Transcription was carried out using this 5th PCR product, RiboMAX Large Scale RNA Production System-SP (Promega) and Cap analoge (Invitrogen) to prepare mRNA. mRNA was purified with RNeasy Mini Kit (QIAGEN).

3.プルダウン実験
作成したmRNAからベイト蛋白質とプレイ蛋白質を小麦胚芽抽出液 (Promega)を用いたin
vitro翻訳により作成した。この際にプレイ蛋白質はC末端を蛍光標識しておいた。ベイト蛋白質とプレイ蛋白質を混合し、ベイト蛋白質をIgG ビーズ (SIGMA)に固定した。固定したビーズを洗浄後、ビーズとベイト蛋白質-プレイ蛋白質複合体の結合を切断し、電気泳動によりベイト蛋白質と結合しているプレイ蛋白質を検出した。
3. Pull-down experiment Bait protein and prey protein from the prepared mRNA in wheat germ extract (Promega)
Prepared by in vitro translation. At this time, the prey protein was fluorescently labeled at the C-terminus. Bait protein and prey protein were mixed, and the bait protein was fixed to IgG beads (SIGMA). After washing the immobilized beads, the bond between the beads and the bait protein-prey protein complex was cleaved, and the prey protein bound to the bait protein was detected by electrophoresis.

塩基配列の変化によって蛋白質間相互作用が変化する遺伝子の抽出の構成図である。It is a block diagram of extraction of the gene from which the interaction between proteins changes by the change of a base sequence. バリアント解析の説明図である。It is explanatory drawing of a variant analysis. 融合遺伝子解析の説明図である。It is explanatory drawing of a fusion gene analysis. SNPs解析の説明図である。It is explanatory drawing of SNPs analysis. 変異遺伝子、RNAエディティング解析の説明図である。It is explanatory drawing of a mutated gene and RNA editing analysis. 参考例1の条件検討結果を示す。The condition examination result of the reference example 1 is shown. Eef1dの相互作用部位における選択的エクソンの解析結果を示す。The analysis result of the selective exon in the interaction site of Eef1d is shown. 参考例2の条件検討結果を示す。The condition examination result of the reference example 2 is shown. JUNとFOSとの相互作用部位におけるSNPの解析結果を示す。The analysis result of SNP in the interaction site of JUN and FOS is shown. シングルジーン率の変化とRT-PCRのラウンド数の関係を示す。The relationship between the change in the single gene rate and the number of RT-PCR rounds is shown. 蛋白質相互作用大規模解析システムの説明図である。It is explanatory drawing of a protein interaction large-scale analysis system. 一次DBを利用した結合領域の一例である。It is an example of the coupling | bonding area | region using primary DB. プルダウン実験の結果を示す。The result of a pull-down experiment is shown. プレイの遺伝子からのベイト用テンプレート作製の手順の説明図である。It is explanatory drawing of the procedure of template production for bait from a play gene. スクリーニング方法の一例の説明図である。It is explanatory drawing of an example of a screening method.

Claims (4)

(1)核酸ライブラリーから、蛋白質と該蛋白質をコードする核酸とが結合した対応付け分子のライブラリーを製造する工程、(2)前記対応付け分子のライブラリーと標的物質とを混合する工程、(3)標的物質に結合した対応付け分子を選択する工程、(4)(3)で選択された対応付け分子の核酸からRT-PCR又はPCRにより核酸ライブラリーを調製する工程を含むラウンドを繰り返すことを含み、
前記RT-PCR又はPCRにおいて、増幅産物の増幅量が飽和量以下の一定量に最初に達するサイクル数を求めること、及び、前記サイクル数が一定に達した後、さらに1回以上のラウンドを経た時に、核酸ライブラリーの配列解析を行うことを特徴とする、配列データの取得方法。
(1) a step of producing a correspondence molecule library in which a protein and a nucleic acid encoding the protein are bound from a nucleic acid library, (2) a step of mixing the correspondence molecule library and a target substance, (3) Repeat the round including the step of selecting the mapping molecule bound to the target substance, (4) the step of preparing the nucleic acid library by RT-PCR or PCR from the nucleic acid of the mapping molecule selected in (3) Including
In the RT-PCR or PCR, the number of cycles in which the amplification amount of the amplification product first reaches a certain amount less than or equal to the saturation amount is obtained, and after the number of cycles reaches a certain value, one or more rounds are passed. A method for obtaining sequence data, characterized in that the sequence analysis of a nucleic acid library is sometimes performed.
蛋白質と該蛋白質をコードする核酸とが結合した対応付け分子のライブラリーを用いる配列データの取得方法であって、(a)ベイト蛋白質を設計し、(b)設計されたベイト蛋白質との相互作用に関してライブラリーからのセレクションを行い、(c)セレクションで選択された対応付け分子の配列解析を行い、配列データを取得し、(d)取得された配列データに基づき相互作用部位を決定し、(e)決定された相互作用部位に基づき配列データを抽出することを含み、工程(b)及び(c)が請求項1記載の方法により行われることを特徴とする前記方法。 A method of acquiring sequence data using a library of mapping molecules in which a protein and a nucleic acid encoding the protein are bound, comprising: (a) designing a bait protein; and (b) interacting with the designed bait protein (C) Sequence analysis of the corresponding molecules selected in the selection, obtain sequence data, (d) determine the interaction site based on the obtained sequence data, ( e) extracting sequence data based on the determined interaction sites, wherein steps (b) and (c) are performed by the method of claim 1. 配列データに基づき、相互作用部位を抽出し、抽出結果に基づきベイト蛋白質を設計することを含み、請求項1又は2記載の方法により配列データを取得することを特徴とする蛋白質の設計方法。 A method for designing a protein, comprising extracting an interaction site based on sequence data and designing a bait protein based on the extraction result, wherein the sequence data is obtained by the method according to claim 1 or 2. 請求項1又は2に記載の方法により配列データを取得し、得られた配列データを用いて、塩基配列の変化によって蛋白質間相互作用が変化する遺伝子を抽出することを特徴とする遺伝子の抽出方法。 A method for extracting a gene, comprising obtaining sequence data by the method according to claim 1 or 2, and using the obtained sequence data to extract a gene whose protein-protein interaction changes due to a change in base sequence .
JP2006329313A 2005-12-08 2006-12-06 Method for obtaining array data, method for extracting target gene by using the same, and method for designing protein Pending JP2007181453A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006329313A JP2007181453A (en) 2005-12-08 2006-12-06 Method for obtaining array data, method for extracting target gene by using the same, and method for designing protein

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2005354344 2005-12-08
JP2006329313A JP2007181453A (en) 2005-12-08 2006-12-06 Method for obtaining array data, method for extracting target gene by using the same, and method for designing protein

Publications (1)

Publication Number Publication Date
JP2007181453A true JP2007181453A (en) 2007-07-19

Family

ID=38338046

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006329313A Pending JP2007181453A (en) 2005-12-08 2006-12-06 Method for obtaining array data, method for extracting target gene by using the same, and method for designing protein

Country Status (1)

Country Link
JP (1) JP2007181453A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018016556A1 (en) * 2016-07-21 2018-01-25 石原産業株式会社 Peptide effective in geminivirus disease prevention, and method for using same

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002238575A (en) * 2001-02-19 2002-08-27 Japan Science & Technology Corp METHOD FOR AMPLIFYING VERY SMALL AMOUNT OF mRNA AND cDNA
JP2002345466A (en) * 2001-05-08 2002-12-03 Takara Bio Inc Method for amplifying dna

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002238575A (en) * 2001-02-19 2002-08-27 Japan Science & Technology Corp METHOD FOR AMPLIFYING VERY SMALL AMOUNT OF mRNA AND cDNA
JP2002345466A (en) * 2001-05-08 2002-12-03 Takara Bio Inc Method for amplifying dna

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JPN6012011735; Nucl. Acids Res., vol. 32, e169 (total 10 pages) (2004) *
JPN6012011736; Genome Res., vol. 15, pages 710-717 (May 2005) *
JPN6012011737; Nucl. Acids Res., vol. 34, e27 (total 8 pages) (2006) *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018016556A1 (en) * 2016-07-21 2018-01-25 石原産業株式会社 Peptide effective in geminivirus disease prevention, and method for using same
CN109477093A (en) * 2016-07-21 2019-03-15 石原产业株式会社 To the effective peptide of prevention and treatment and its utilization method of geminivirus infection disease
JPWO2018016556A1 (en) * 2016-07-21 2019-05-09 石原産業株式会社 Effective peptides for controlling gemini virus disease and methods of using the same
CN109477093B (en) * 2016-07-21 2022-08-26 石原产业株式会社 Peptide effective in controlling geminivirus disease and method of using the same
US11427833B2 (en) 2016-07-21 2022-08-30 Ishihara Sangyo Kaisha, Ltd. Peptide effective in control of geminivirus disease and use thereof
JP7369522B2 (en) 2016-07-21 2023-10-26 石原産業株式会社 Peptides effective in controlling geminivirus disease and their usage

Similar Documents

Publication Publication Date Title
US20220260581A1 (en) Peptide constructs and assay systems
Thompson et al. The ribosomal protein Asc1/RACK1 is required for efficient translation of short mRNAs
Donczew et al. Two roles for the yeast transcription coactivator SAGA and a set of genes redundantly regulated by TFIID and SAGA
Di Niro et al. Rapid interactome profiling by massive sequencing
JP4803933B2 (en) Encoding method and selection method of in vitro translated protein
Cheng et al. Consistent global structures of complex RNA states through multidimensional chemical mapping
Mears et al. A structural model for the large subunit of the mammalian mitochondrial ribosome
EP2080812A1 (en) Compositions and methods of detecting post-stop peptides
US11993865B2 (en) Selection of affinity reagents
JPH0923885A (en) Gene expression library and its production
Trahan et al. Targeted cross-linking-mass spectrometry determines vicinal interactomes within heterogeneous RNP complexes
Wei et al. Progress in aptamer screening methods
JP2007181453A (en) Method for obtaining array data, method for extracting target gene by using the same, and method for designing protein
Chakrabarti et al. A computationally-enhanced hiCLIP atlas reveals Staufen1-RNA binding features and links 3′ UTR structure to RNA metabolism
Wu et al. Efficient detection of the alternative spliced Human proteome using translatome sequencing
JP6945902B1 (en) Translation promoter, translation template mRNA, transcription template DNA, translation template mRNA production method, and protein production method
JP3706942B2 (en) Method for detecting interaction between substance and protein, method for screening protein interacting with substance, and method for forming complex of substance and protein interacting with the substance
JP6478392B2 (en) Nucleic acid linker
JP4441623B2 (en) Method for producing and using library of mapping molecule and component thereof
JP4761202B2 (en) Cleavage mapping molecule and screening method using the same
EP2762563B1 (en) Method for detecting protein that interacts with target substance
EP2554681B1 (en) Constitution of tool for analyzing biomolecular interaction and analysis method using same
JPWO2005050518A1 (en) Method of creating interaction map using gene and / or protein database, and software and apparatus for realizing the method
CN104774923A (en) Method for determining transcriptional control complex
JP6057297B2 (en) Nucleic acid construct, nucleic acid-protein complex, and use thereof

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120306

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120424

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121113

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130402