KR20150123741A - Vectors for measuring multiple protein-protein interactions simultaneously - Google Patents

Vectors for measuring multiple protein-protein interactions simultaneously Download PDF

Info

Publication number
KR20150123741A
KR20150123741A KR1020150058333A KR20150058333A KR20150123741A KR 20150123741 A KR20150123741 A KR 20150123741A KR 1020150058333 A KR1020150058333 A KR 1020150058333A KR 20150058333 A KR20150058333 A KR 20150058333A KR 20150123741 A KR20150123741 A KR 20150123741A
Authority
KR
South Korea
Prior art keywords
vector
site
sequence
gene
protein
Prior art date
Application number
KR1020150058333A
Other languages
Korean (ko)
Inventor
황병준
김성훈
박성균
김병규
유해용
기윤
권남훈
Original Assignee
재단법인 의약바이오컨버젼스연구단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 재단법인 의약바이오컨버젼스연구단 filed Critical 재단법인 의약바이오컨버젼스연구단
Publication of KR20150123741A publication Critical patent/KR20150123741A/en

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/64General methods for preparing the vector, for introducing it into the cell or for selecting the vector-containing host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • C12N15/815Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6845Methods of identifying protein-protein interactions in protein mixtures

Abstract

The present invention relates to a vector for analyzing multiple protein-protein interactions simultaneously. More specifically, the present invention relates to a donor vector and an accepting vector having a specific construct for efficiently searching protein coupling pairs at a library level, a kit including the vectors, and a protein interaction detection method using the same. According to the present invention, when the vector set is used to detect the protein interactions, the protein interactions simultaneously occurring between protein libraries (or a bait protein library and a prey protein library) can be detected. The present invention can also provide an advantage in processing a large amount of information in order to identify the interacting proteins in each protein reaction between the libraries by using the bar code sequence contained in each vector.

Description

다수의 단백질-단백질 상호작용 동시 분석을 위한 벡터{Vectors for measuring multiple protein-protein interactions simultaneously}[0002] Vectors for measuring multiple protein-protein interactions simultaneously for multiple protein-

본 발명은 다수의 단백질-단백질 상호작용 동시 분석을 위한 벡터에 관한 것으로, 보다 상세하게는 라이브러리 수준의 단백질들의 결합 쌍들을 동시에 효율적으로 검색하기 위한 특수한 컨스트럭트(construct)를 가지는 공여 벡터 및 수용 벡터, 상기 벡터들을 포함하는 키트 및 이를 이용한 단백질 상호작용 검출 방법에 관한 것이다. The present invention relates to a vector for simultaneous analysis of a plurality of protein-protein interactions, and more particularly, to a vector for a simultaneous analysis of protein-protein interactions using a donor vector having a specific construct for simultaneously and efficiently searching binding pairs of library- Vectors, kits comprising the vectors, and methods for detecting protein interactions using the kits.

세포 내에서 하나 또는 두 개 이상의 단백질은 서로 상호작용(비공유결합, 물리적인 결합)을 통하여 생물학적인 기능을 나타낸다. 따라서 단백질 간의 상호작용에 대한 이해는 생물학적인 기능을 이해하는데 있어서 매우 중요한 의미를 갖는다. 생화학(biochemistry), 단백질체학(Proteomics), 분자 동력학(molecular dynamics), 신호 전달(signal transduction) 등의 다양한 학문에서 단백질 간의 상호작용을 밝히기 위한 노력이 현재까지 지속되고 있다. 최근 사용되고 있는 단백질 간의 상호작용을 알아보기 위한 방법들은 Co-immunoprecipitation(Co-IP), Fluorescence resonance energy transfer (FRET), Yeast two-hybrid 그리고 최근에 고안된 Bimolecular Fluorescence Complementation (BiFC) 등이 잘 알려져 있다.One or more proteins in a cell exhibit biological functions through interaction (non-covalent, physical). Understanding the interactions between proteins is therefore of great importance in understanding biological functions. Efforts to identify protein interactions in diverse disciplines such as biochemistry, proteomics, molecular dynamics, and signal transduction have continued to date. Co-immunoprecipitation (Co-IP), fluorescence resonance energy transfer (FRET), yeast two-hybrid and recently designed Bimolecular Fluorescence Complementation (BiFC) are well known.

그 중에서도 Yeast two-hybrid(Fields S, Song O, 1989)는 1989년에 송옥규 박사와 Stanley Fields에 의하여 고안된 방법으로서 일반적인 전사인자(Transcription factor)가 갖는 modular한 특징을 이용한 방법이다. 여기서 modular라는 것은 전사인자의 구조는 DNA 결합 도메인(DNA binding domanin, DBD)과 활성 도메인(Activation domain, AD)으로 구성이 되며 서로 독립적으로 분리되어 발현되어도 어떠한 상호작용에 의하여 두 도메인이 가까운 거리를 유지할 때 전사인자로서의 정상적인 기능이 가능하다는 원리를 이용한 방법이다. Among them, Yeast two-hybrid (Fields S, Song O, 1989) was designed by Dr. Song Ok-kyu and Stanley Fields in 1989 and uses a modular characteristic of a common transcription factor. Here, the modular structure consists of the DNA binding domain (DNA binding domain) (DBD) and the activation domain (AD), and the two domains are close to each other It is a method using the principle that normal function as a transcription factor is possible.

일반적으로 Yeast two-hybrid mothod에서는 Saccharomyces cerevisiae (S. cerevisiae)의 GAL4 전사인자를 주로 사용하며 특정 단백질 간의 상호작용 또는 하나의 단백질에 대한 상호작용 파트너를 선별(screening)하는데 널리 사용되고 있다. 따라서 GAL4 전사인자의 각 각의 도메인에 연구하고자하는 단백질의 유전자를 재조합하여 동일한 효모 내에서 발현을 유도하여 상호작용 유무를 알 수 있는 방법이다. 일반적으로 DNA 결합 도메인에는 Bait(미끼)를 활성 도메인에는 Prey(먹이)를 결합하게 되는데 Bait에는 주로 연구하고자하는 한 종류의 단백질에 대한 유전자를 Prey에는 주로 cDNA library를 재조합하여 Bait 단백질에 대한 상호작용 파트너를 선별하는 방식으로 진행된다. DNA 결합 도메인(DBD)과 Bait, 활성 부위(AD)와 Prey는 각 각 독립적인 벡터(Vector)의 형태로 효모에 형질전환(transformation)되고 도입 후 각 각의 벡터에 존재하는 ADH1 프로모터(ADH1 promoter)에 의하여 항시발현(Constitutive expression)된다. 발현된 DBD-Bait, AD-Prey 결합 단백질은 DNA 결합 도메인과 활성 도메인의 N-말단(N-terminus)에 존재하는 NLS(Nuclear Localization Signal)에 의하여 효모의 핵으로 이동하게 된다. 그 후 핵 내에서 Bait와 Prey가 서로 상호작용하지 않을 경우에는 DBD-Bait, AD-Prey가 복합체를 이루지 못하므로 정상적인 GAL4 전사인자의 기능을 할 수 없다. 그러나 Bait와 Prey가 서로 상호작용하는 경우에는 DBD-Bait-Prey-AD 복합체(DBD-Bait-Prey-AD complex)가 형성되어 GAL4 전사인자의 정상적인 기능을 수행할 수 있게 되어 효모의 유전체 내에 존재하는 리포터(Reporter)의 발현을 유도하게 된다. Generally, in yeast two-hybrid mothod, GAL4 transcription factor of Saccharomyces cerevisiae (S. cerevisiae) is mainly used and is widely used for screening interactions among specific proteins or interaction partners for one protein. Therefore, it is a method of recombination of gene of protein to be studied in each angular domain of GAL4 transcription factor and induction of expression in the same yeast to determine whether or not there is an interaction. In general, Bait binds to the DNA binding domain and Prey (prey) to the active domain. In Bait, a gene for one kind of protein to be studied is prey, and a cDNA library is mainly recombined for Bait to interact with Bait protein It is conducted in a way that selects partners. The DNA binding domain (DBD), Bait, the active site (AD) and Prey are transformed into yeast in the form of independent vectors, and the ADH1 promoter (ADH1 promoter (Constitutive expression). The expressed DBD-Bait and AD-Prey binding proteins are transferred to the yeast nucleus by NLS (Nuclear Localization Signal) located at the N-terminus of the DNA binding domain and the active domain. If Bait and Prey do not interact with each other in the nucleus, DBD-Bait and AD-Prey do not form a complex, so they can not function as normal GAL4 transcription factors. However, when Bait and Prey interact with each other, DBD-Bait-Prey-AD complex (DBD-Bait-Prey-AD complex) is formed to perform the normal function of GAL4 transcription factor. Which leads to the expression of the reporter.

이러한 원리로 리포터 유전자의 발현을 통하여 Bait와 Prey의 상호작용을 확인하는 방법이다. 효모 유전체 내의 리포터는 GAL4 전사인자의 DNA 결합 도메인이 결합할 수 있는 GAL4 UAS (Upstream Activation Sequence)와 레포터 유전자로 구성되는데 대표적으로 LacZ, MEL1(Colormetric repoter), HIS3, ADE2, URA3(Authotrophic reporter) 등의 유전자가 사용된다. 따라서 결과 적으로 Bait와 Prey가 서로 상호작용하는 경우 DBD-Bait-Prey-AD 복합체가 리포터의 GAL4 UAS에 결합하여 리포터 유전자의 발현을 유도하게 된다.This principle is a method to confirm the interaction of Bait and Prey through the expression of the reporter gene. Reporters in the yeast genome are composed of GAL4 UAS (Upstream Activation Sequence) and reporter genes to which the DNA binding domain of the GAL4 transcription factor can bind. Typically, LacZ, MEL1 (Colormetric reporter), HIS3, ADE2, URA3 (Authotrophic reporter) Are used. As a result, when Bait and Prey interact with each other, the DBD-Bait-Prey-AD complex binds to the reporter GAL4 UAS and induces the expression of the reporter gene.

이러한 Yeast two-hybrid가 가지는 장점 중에는 in vivo 에서 수행이 가능하다는 점, 고등진핵생물(Higher eukaryote)인 효모를 이용하므로 박테리아(Bacteria)를 이용할 때 보다 유리하다는 점, 실험을 수행하는데 필요한 요소가 많지 않다는 점, 수천가지 단백질 간의 상호작용을 동시에 선별할 수 있다는 점 등이 있다. 반면 기존의 Yeast two-hybrid system(이하 Y2H)은 몇 가지 한계를 가지고 있었다. One of the advantages of this yeast two-hybrid is that it can be performed in vivo, it is more advantageous to use bacteria than yeast because it is a high eukaryote, And the ability to simultaneously screen thousands of protein interactions. On the other hand, the existing yeast two-hybrid system (Y2H) has some limitations.

첫 번째 한계는 대량 선별이 어렵다는 것이다. Y2H를 통하여 특정 단백질에 대한 상호작용 단백질을 찾기 위한 선별(screening)을 수행할 경우 높은 다양성(diversity)을 갖는 단백질 라이브러리가 사용된다. 예를 들어 특정 단백질 A에 대한 상호작용 단백질을 찾기 위한 선별에서 1.0 x 107의 다양성을 갖는 단백질 라이브러리를 사용할 경우 1개의 한천배지에서 천(1.0 x 103)개의 효모 colony를 선별할 수 있다고 하면 실험자는 선별을 위해서 만개의 한천배지를 사용하여야 한다. 이는 실험자에게 상당히 높은 노동력이 소모됨과 동시에 시간 그리고 비용적인 측면에서 상당히 비효율적이다. 따라서 이러한 문제로 인하여 대량 선별이 어렵다는 한계를 가지고 있다.The first limitation is that mass screening is difficult. A protein library with high diversity is used when performing screening to find an interacting protein for a specific protein through Y2H. For example, if a protein library with a diversity of 1.0 x 10 7 is used for screening for interacting proteins for a specific protein A, one (1 x 10 3 ) yeast colony can be selected from one agar medium The experimenter should use full agar medium for screening. This consumes a considerably high labor force for the experimenter, as well as considerable inefficiency in terms of time and cost. Therefore, it is difficult to select the mass because of these problems.

두 번째 한계는 선별을 통하여 얻은 데이터의 분석이다. 기존의 방법에서는 한천배지를 이용하여 positive candidate(단백질 간의 상호작용이 존재하는 효모)를 선별한 후에 plasmid를 얻어 sanger sequencing을 통하여 prey 유전자의 데이터를 분석하는 방식으로 진행되었다. 이러한 방식을 사용 할 경우 대량 선별을 통하여 얻은 positive candidate를 모두 분석하는 것은 많은 노동력을 필요로 하며 시간과 비용 또한 상당히 비효율 적이다. The second limitation is the analysis of data obtained through screening. In the conventional method, a positive candidate (a yeast with interactions between proteins) was selected using an agar medium, and a plasmid was obtained and analyzed by precher gene sequencing. Using this method, analyzing all the positive candidates obtained through mass screening requires a lot of labor and time and cost are also quite inefficient.

세 번째 한계는 기존의 reporter system의 민감도(sensitivity) 문제이다. 기존의 Y2H에 사용되는 reporter system(예를 들어 β-galactosidase, HIS3, ADE2 등)을 사용하였을 경우 약한 단백질 간의 상호작용을 선별할 수 없다는 단점을 가지고 있다. 그 외 자동화가 어렵다는 점, 단백질 자체가 스스로 활성화 되어 전사(transcription)를 활성화 할 경우 사용 할 수 없다는 점, 단백질 간의 상호작용에 보인자(Co-factor)가 필요한 경우 선별하기 어렵다는 점 등이 있다.The third limitation is the sensitivity of existing reporter systems. The use of reporter systems (eg, β-galactosidase, HIS3, ADE2, etc.) used in conventional Y2H has the disadvantage that it can not discriminate weak protein interactions. And other difficulties in automation, the fact that the protein itself can not be activated when it is activated by transcription, and it is difficult to select when a co-factor is required for protein interactions.

본 발명자들은 기존 투-하이브리드 (two-hybrid) 시스템의 단점을 보완하여, 라이브러리 수준의 단백질들의 결합 쌍들을 동시에 효율적으로 검색하기 위한 특수한 컨스트럭트(construct)를 가지는 벡터 세트(set)를 제조하여 본 발명을 완성하였다. The present inventors have made up a disadvantage of the existing two-hybrid system to produce a vector set having a special construct for simultaneously and efficiently searching the binding pairs of library-level proteins Thus completing the present invention.

따라서 본 발명의 목적은, 제 1프로모터; 숙주세포 리포터 유전자의 프로모터에 결합하는 DBD 코딩 서열; 베이트 단백질 코딩 서열의 삽입을 위한 제1 클로닝 부위(cloning site); 제1 부위 특이적 재조합효소 인식 서열(site-specific recombination site); 상기 베이트 단백질을 표시하는 바코드 서열의 삽입을 위한 제2클로닝 부위; 및 제2 부위 특이적 재조합효소 인식 서열을 포함하는 것을 특징으로 하는 공여벡터를 제공하는 것이다.Accordingly, an object of the present invention is to provide a recombinant vector comprising a first promoter; A DBD coding sequence that binds to the promoter of a host cell reporter gene; A first cloning site for insertion of a bait protein coding sequence; A first site-specific recombination site; A second cloning site for insertion of a barcode sequence representing the bait protein; And a second site-specific recombinase recognition sequence.

본 발명의 다른 목적은, 제1 프로모터; 숙주세포 리포터 유전자의 전사를 돕는 AD 코딩 서열; 프레이 단백질 코딩 서열의 삽입을 위한 제1클로닝 부위; 상기 프레이 단백질을 표시하는 바코드 서열의 삽입을 위한 제2클로닝 부위; 제1 부위 특이적 재조합효소 인식 서열(site-specific recombination site); 및 제2 부위 특이적 재조합효소 인식 서열을 포함하는 것을 특징으로 하는 수용벡터를 제공하는 것이다.Another object of the present invention is a recombinant DNA comprising: a first promoter; An AD coding sequence to aid transcription of the host cell reporter gene; A first cloning site for insertion of a pre-protein coding sequence; A second cloning site for insertion of a barcode sequence representing said pre-protein; A first site-specific recombination site; And a second site-specific recombinase recognition sequence.

본 발명의 또 다른 목적은, 상기 공여벡터 및 수용벡터를 포함하는 단백질 상호작용 검출을 위한 키트(kit)를 제공하는 것이다. It is still another object of the present invention to provide a kit for protein interaction detection including the donor vector and acceptor vector.

본 발명의 또 다른 목적은, (a) 상기 공여벡터에 베이트(bait) 단백질 및 상기 베이트 단백질을 표시하는 바코드 서열을 도입하여 베이트 라이브러리를 제작 하는 단계; (b) 상기 수용벡터에 프레이(prey) 단백질 및 상기 프레이 단백질을 표시하는 바코드 서열을 도입하여 프레이 라이브러리를 제작하는 단계; (c) 상기 베이트 라이브러리 및 프레이 라이브러리를 리포터로서 재조합효소를 발현하는 숙주세포에 도입하는 단계; 및 (c) 상기 숙주세포로부터 리포터 발현 여부를 조사하여 베이트-프레이 단백질 결합 쌍들을 검출하는 단계를 포함하는, 단백질 상호작용 검출 방법을 제공하는 것이다.It is still another object of the present invention to provide a method for preparing a bait library, comprising: (a) preparing a bait library by introducing a bait protein and a barcode sequence representing the bait protein into the donor vector; (b) introducing a prey protein and a barcode sequence representing the pre-protein into the acceptor vector to prepare a prey library; (c) introducing the bait library and the prey library into a host cell expressing the recombinant enzyme as a reporter; And (c) detecting the expression of the reporter from the host cell to detect the bait-prey protein binding pairs.

상기의 목적을 달성하기 위해 본 발명은 제 1프로모터; 숙주세포 리포터 유전자의 프로모터에 결합하는 DBD 코딩 서열; 베이트 단백질 코딩 서열의 삽입을 위한 제1 클로닝 부위(cloning site); 제1 부위 특이적 재조합효소 인식 서열(site-specific recombination site); 상기 베이트 단백질을 표시하는 바코드 서열의 삽입을 위한 제2클로닝 부위; 및 제2 부위 특이적 재조합효소 인식 서열을 포함하는 것을 특징으로 하는 공여벡터를 제공한다.In order to accomplish the above object, the present invention provides a recombinant vector comprising: a first promoter; A DBD coding sequence that binds to the promoter of a host cell reporter gene; A first cloning site for insertion of a bait protein coding sequence; A first site-specific recombination site; A second cloning site for insertion of a barcode sequence representing the bait protein; And a second site-specific recombinase recognition sequence.

본 발명의 다른 목적을 달성하기 위해 본 발명은 제1 프로모터; 숙주세포 리포터 유전자의 전사를 돕는 AD 코딩 서열; 프레이 단백질 코딩 서열의 삽입을 위한 제1클로닝 부위; 상기 프레이 단백질을 표시하는 바코드 서열의 삽입을 위한 제2클로닝 부위; 제1 부위 특이적 재조합효소 인식 서열(site-specific recombination site); 및 제2 부위 특이적 재조합효소 인식 서열을 포함하는 것을 특징으로 하는 수용벡터를 제공한다.According to another aspect of the present invention, An AD coding sequence to aid transcription of the host cell reporter gene; A first cloning site for insertion of a pre-protein coding sequence; A second cloning site for insertion of a barcode sequence representing said pre-protein; A first site-specific recombination site; And a second site-specific recombinase recognition sequence.

본 발명의 다른 목적을 달성하기 위해 본 발명은 상기 공여벡터 및 수용벡터를 포함하는 단백질 상호작용 검출을 위한 키트(kit)를 제공한다. In order to accomplish another object of the present invention, the present invention provides a kit for detecting protein interactions including the donor vector and the acceptor vector.

본 발명의 다른 목적을 달성하기 위해 본 발명은 (a) 상기 공여벡터에 베이트(bait) 단백질 및 상기 베이트 단백질을 표시하는 바코드 서열을 도입하여 베이트 라이브러리를 제작 하는 단계; (b) 상기 수용벡터에 프레이(prey) 단백질 및 상기 프레이 단백질을 표시하는 바코드 서열을 도입하여 프레이 라이브러리를 제작하는 단계; (c) 상기 베이트 라이브러리 및 프레이 라이브러리를 리포터로서 재조합효소를 발현하는 숙주세포에 도입하는 단계; 및 (c) 상기 숙주세포로부터 리포터 발현 여부를 조사하여 베이트-프레이 단백질 결합 쌍들을 검출하는 단계를 포함하는, 단백질 상호작용 검출 방법을 제공한다.According to another aspect of the present invention, there is provided a method for preparing a bait library, comprising the steps of: (a) preparing a bait library by introducing a bait protein and a barcode sequence representing the bait protein into the donor vector; (b) introducing a prey protein and a barcode sequence representing the pre-protein into the acceptor vector to prepare a prey library; (c) introducing the bait library and the prey library into a host cell expressing the recombinant enzyme as a reporter; And (c) detecting the expression of a reporter from the host cell and detecting bait-prey protein binding pairs.

이하 본 발명을 상세히 설명한다.Hereinafter, the present invention will be described in detail.

본 발명에서 용어‘벡터’란 적당한 숙주세포에서 목적 단백질을 발현할 수 있는 발현 벡터로서, 유전자 삽입물이 발현되도록 작동가능하게 연결된 필수적인 조절 요소를 포함하는 유전자 작제물을 말한다. 상기 벡터는 플라스미드 벡터, 코즈미드 벡터, 박테리오파아지 벡터, 효모 벡터, 바이러스 벡터 등을 포함한다. 적당한 숙주로 형질전환되면, 벡터는 숙주 게놈과 무관하게 복제하고 기능할 수 있거나, 또는 일부 경우에 게놈 그 자체에 통합될 수 있다. 플라스미드가 현재 벡터의 가장 통상적으로 사용되는 형태이므로, 본 발명의 명세서에서 "플라스미드(plasmid)" 및 "벡터(vector)"는 때로 상호 교환적으로 사용된다. 본 발명의 목적상, 플라스미드 벡터를 이용하는 게 바람직하다.The term " vector " as used herein refers to an expression vector capable of expressing a desired protein in a suitable host cell, and a gene construct containing an essential regulatory element operably linked to the expression of the gene insert. Such vectors include plasmid vectors, cosmid vectors, bacteriophage vectors, yeast vectors, viral vectors, and the like. Once transformed into the appropriate host, the vector may replicate and function independently of the host genome, or, in some cases, integrate into the genome itself. Because the plasmid is the most commonly used form of the current vector, the terms "plasmid" and "vector" are sometimes used interchangeably in the context of the present invention. For the purpose of the present invention, it is preferable to use a plasmid vector.

본 명세서에서 각 벡터의 구성은 특별한 언급이 없는 한, 플라스미드를 이루는 이중 가닥 중 하나의 가닥(strand)을 기준으로하여 5’에서 3’방향으로 기술된다. 따라서 벡터를 구성하는 유전적 구성 단위의 기술 순서는 실질적으로 유전체가 전사되는 방향과 일치하지 않을 수 있으며, 벡터에 포함된 유전체의 전사 방향은 프로모터로부터 상기 프로모터에 작동가능하게 연결된 구조유전자로 향하는 방향이다. 그러므로 본 발명에서 용어‘상류’,‘하류’는, 특별한 언급이 없는 한, 상기 기준가닥 상에서 각 핵산 단위들의 상대적 위치를 나타낸다. 당업자라면 전사배향에 의하여 당해 유전자가 본 발명에서 기술하는 기준 가닥(sense strand)에서 발현되는지, 이의 상대 가닥(antisense strand)에서 발현되는지 자명하게 이해 가능하다. In the present specification, the constitution of each vector is described in 5 'to 3' direction based on one strand of the double strands constituting the plasmid, unless otherwise specified. Therefore, the description order of the genetic constituent units constituting the vector may not substantially match the direction in which the genome is transcribed, and the direction of transcription of the genome contained in the vector may be a direction from the promoter to a structural gene operably linked to the promoter to be. Thus, in the present invention, the terms "upstream" and "downstream" refer to the relative positions of each nucleic acid unit on the reference strand, unless otherwise specified. Those skilled in the art will readily understand whether the gene is expressed in the sense strand described in the present invention or in its antisense strand by transcriptional orientation.

본 발명에서 용어 "작동 가능하게 연결된"은 유전자 발현의 매개나 조절과 같은 의도된 기능을 수행하기 위해 특정 서열들이 직접적으로 또는 간접적으로 상호작용하는 것을 의미한다. 작동 가능하게 연결된 서열들의 상호작용은, 예를 들어 작동 가능하게 연결된 서열들과 상호작용하는 단백질에 의해 매개될 수 있다. 전사 조절영역과 관심 서열이 작동 가능하게 연결된 경우, 이 서열들이 기능적으로 연결됨으로써 전사 조절영역에 의해 관심 서열의 전사가 매개되거나 조정될 수 있다. The term "operably linked" in the present invention means that certain sequences interact directly or indirectly to perform an intended function, such as mediation or regulation of gene expression. The interaction of operably linked sequences may be mediated, for example, by proteins interacting with operably linked sequences. When the transcriptional regulatory region and the sequence of interest are operatively linked, the transcription of the sequence of interest can be mediated or regulated by the transcriptional regulatory region by functionally linking these sequences.

본 발명에서 용어‘프로모터’는 광의의 개념으로서 구조 유전자로부터의 전사개시 영역을 의미할 수 있으며, 좀 더 구체적으로는 특정 뉴클레오티드 서열과 연결된 경우 상기 특정 뉴클레오티드 서열이 mRNA로 전사되는 것을 조절할 수 있는 DNA 서열을 의미한다. 통상적으로, 프로모터는 모든 경우에 적용되는 것은 아니나 mRNA로 전사될 목적하는 뉴클레오티드 서열의 5' 에 존재하고 RNA 폴리머라제 및 기타 전사 개시를 위한 전사 인자가 특이적으로 결합하는 부위를 제공한다. 숙주세포의 종류에 따라 때때로 상기 프로모터는 UAS(upstream activating sequence)등의 조절서열을 포함하는 것으로 이해될 수 있다. As used herein, the term " promoter " means a transcription initiation region from a structural gene as a broad concept, and more specifically, a DNA capable of regulating the transcription of the specific nucleotide sequence into mRNA when linked to a specific nucleotide sequence. ≪ / RTI > Typically, the promoter is located in the 5 'of the desired nucleotide sequence to be transcribed into mRNA, although not in all cases, and provides a site for RNA polymerase and other transcription factors specifically for transcription initiation. Depending on the type of host cell, it is sometimes understood that the promoter comprises a regulatory sequence such as a UAS (upstream activating sequence).

본 발명의 프로모터는 구성적이거나 조절 가능한 프로모터를 이용할 수 있으며, 바람직하게는 구성적 프로모터이다. 프로모터와 관련하여 사용되는 용어 "구성적"은 프로모터가 자극 (예, 열 쇼크, 화학물질 등) 없이도 작동가능하게 연결된 핵산 서열의 전사를 지시할 수 있다는 것을 의미한다. 반면, "조절 가능한" 프로모터는 자극 (예, 열 쇼크, 화학물질 등)이 존재하는 경우 작동가능하게 연결된 핵산 서열의 전사 수준을 자극 없는 경우와 구별되게 지시할 수 있는 프로모터를 의미한다.The promoter of the present invention may be a constitutive or regulatable promoter, preferably a constitutive promoter. The term "constitutive" as used in connection with a promoter means that the promoter can direct transcription of operably linked nucleic acid sequences without stimulation (e.g., heat shock, chemicals, etc.). By contrast, an "adjustable" promoter refers to a promoter capable of directing the transcription level of an operably linked nucleic acid sequence to be distinct from that without stimulation when stimulation (eg, heat shock, chemicals, etc.) is present.

당업자라면 벡터가 도입되는 숙주세포에 따라 적당한 프로모터를 선택하여 사용가능하며, 예를 들어 숙주세포가 효모인 경우 GAL10 프로모터, ADH1 프로모터, GAL1 프로모터, CYC1 프로모터, PGK 프로모터 등을 사용할 수 있으며, 이에 제한되지 않는다. 또한 포유 동물의 세포에 적합한 프로모터는, 예를 들어, CMV 프로모터, HSV-TK 프로모터, RSV 프로모터, SV40 프로모터 및 LTR 프로모터 등이 있을 수 있으며, 이에 제한되지 않는다.Those skilled in the art can use a suitable promoter depending on the host cell into which the vector is introduced. For example, when the host cell is yeast, the GAL10 promoter, ADH1 promoter, GAL1 promoter, CYC1 promoter and PGK promoter can be used. It does not. In addition, suitable promoters for mammalian cells include, but are not limited to, CMV promoter, HSV-TK promoter, RSV promoter, SV40 promoter and LTR promoter.

본 발명에서 용어 "이중-하이브리드 시스템(two hybrid system)"은 리포터 유전자의 활성화를 이용하여 단백질 결합을 확인함으로써 단백질 상호작용을 분석하는 방법 및 이를 위해 사용되는 일련의 구성물을 의미한다. 일반적으로, 이중-하이브리드 시스템은 리포터 유전자를 활성화할 수 있는 전사인자를 두 개의 물리적으로 분리되는 모듈 도메인, 즉 DNA-결합 도메인과 전사활성 도메인으로 나누어 사용한다. 이들을 이용하여 단백질 상호작용을 분석하기 위해서는, 상기 DNA-결합 도메인과 전사활성 도메인을 상호작용을 알아보고자 하는 베이트 및 프레이 단백질에 각각 융합하여 재조합 단백질을 발현시키고, 발현된 재조합 단백질은 베이트 및 프레이 단백질의 상호작용에 의해 DNA-결합 도메인과 전사활성 도메인이 결합하여 활성을 나타내면서 리포터 유전자를 발현시킴으로써 두 단백질의 상호작용을 확인할 수 있다. 상기 이중-하이브리드 시스템의 기본 원리는 진핵세포 및 원핵세포를 아우르는 다양한 세포에 대하여 적용된 바 있으며, 예를 들어 식물세포-이중 하이브리드 시스템(대한민국 등록특허 10-1460231), 군소-이중 하이브리드 시스템(대한민국 등록특허 10-0471605), 포유동물세포-이중 하이브리드 시스템(US 6251676 B1), 박테리아 이중-하이브리드 시스템(EP 1224324 B1) 등이 공지된 바 있다. The term "two hybrid system " in the present invention means a method for analyzing protein interactions by confirming protein binding using the activation of a reporter gene, and a series of constructs used for this purpose. Generally, a double-hybrid system uses a transcription factor capable of activating a reporter gene divided into two physically discrete module domains, a DNA-binding domain and a transcriptionally active domain. In order to analyze protein interactions using these proteins, recombinant proteins are expressed by fusion to bait and pre-protein, respectively, in which interaction between the DNA-binding domain and the transcriptional activation domain is to be detected, and the expressed recombinant protein is expressed as bait and pre- Binding domain binds to the transcriptional activation domain by the interaction between the DNA-binding domain and the transcriptional activation domain, thereby expressing the reporter gene, thereby confirming the interaction of the two proteins. The basic principle of the dual-hybrid system has been applied to various cells including eukaryotic cells and prokaryotic cells. For example, a plant cell-dual hybrid system (Korean Patent No. 10-1460231), a small-double hybrid system Patent No. 10-0471605), mammalian cell-dual hybrid system (US 6251676 B1), bacterial double-hybrid system (EP 1224324 B1), and the like.

본 발명에서 용어 "전사인자(Transcription factor)"는 DNA의 프로모터 영역에 결합하여 전사를 조절하는 인자로서, 본 발명에서 분할 가능한 DNA-결합 도메인(DBD) 및 전사활성 도메인(AD)으로 구성된 모듈(module) 특성을 가지는 것이라면 그 종류가 특별히 제한되지 않는다. 예를 들어, GAL4, GCN4, ARD1, the human estrogen receptor, E. coli LexA 및 B42 단백질, herpes simplex virus VP16, NF-kB p65 등을 포함하며, 이에 제한되지 않는다. The term "transcription factor" in the present invention refers to a module that binds to the promoter region of DNA to regulate transcription. In the present invention, the term " transcription factor " module type, the type thereof is not particularly limited. But are not limited to, GAL4, GCN4, ARD1, the human estrogen receptor, E. coli LexA and B42 proteins, herpes simplex virus VP16, NF-kB p65, and the like.

또한 상기 DNA-결합 도메인(DBD) 및 전사활성 도메인(AD) 조합의 모듈에 있어서, 상기 두 도메인은 하나의 전사인자로부터 유래되는 것 또는 서로 다른 전사인자들로부터 유래되는 것 일 수 있다. 후자에 있어서, 당업계에 서로 다른 전사인자로부터 유래되지만 서로 상호작용(결합)하여 목적 유전자의 전사를 촉발시키는 활성을 가지는 모듈의 구체적 종류가 공지되어있으며, 예를들어, 이에 제한되지 않으나, GAL4 DBD의 경우 이와 상호작용하는 전사활성 도메인은 GAL4 AD, VP16 AD, MSG1 유래 CR2 AD 로 이루어진 군에서 선택되는 것 일 수 있다. Also in the module of the DNA-binding domain (DBD) and the transcriptional activation domain (AD) combination, the two domains may be derived from one transcription factor or from different transcription factors. In the latter, specific types of modules derived from different transcription factors in the art, but having an activity of interacting with each other (triggering transcription of a target gene) are known, and examples thereof include, but are not limited to, GAL4 In the case of DBD, the transcriptional activation domain with which it interacts may be selected from the group consisting of GAL4 AD, VP16 AD, and CR2 AD from MSG1.

본 발명에서 용어 "베이트(bait)"는 단백질 상호작용에 대한 연구에 있어 단백질 결합을 확인할 때, 상호작용을 알아보고자 하는 목적 단백질 또는 이를 암호화하는 뉴클레오티드 서열을 의미한다. 상기 베이트 단백질은 단백질 상호작용을 확인하기 위하여 리포터 유전자를 활성화시키는 전사인자의 DNA-결합 도메인 또는 전사활성 도메인과 융합될 수 있다. 본 발명의 바람직한 실시양태에서, 베이트 단백질은 전사인자의 DNA-결합 도메인과 융합된다.In the present invention, the term "bait " refers to a target protein or a nucleotide sequence encoding the target protein to be examined for interaction when confirming protein binding in the study of protein interaction. The bait protein may be fused with a DNA-binding domain or transcriptional activation domain of a transcription factor that activates a reporter gene to confirm protein interactions. In a preferred embodiment of the invention, the bait protein is fused with the DNA-binding domain of the transcription factor.

본 발명에서 용어 "프레이(prey)"는 단백질 상호작용에 대한 연구에 있어 단백질 결합을 확인할 때, 목적 단백질과 결합할 것으로 예상되는 단백질 또는 이를 암호화하는 뉴클레오티드 서열을 의미한다. 상기 프레이 단백질은 단백질 상호작용을 확인하기 위하여 리포터 유전자를 활성화시키는 전사인자의 DNA-결합 도메인 또는 전사활성 도메인과 융합될 수 있다. 본 발명의 바람직한 실시양태에서, 프레이 단백질은 전사인자의 전사활성 도메인과 융합된다.The term "prey " in the present invention refers to a protein or a nucleotide sequence encoding the protein, which is expected to bind with a target protein when confirming protein binding in a study on protein interaction. The pre-protein may be fused with the DNA-binding domain or transcriptional activation domain of the transcription factor that activates the reporter gene to confirm protein interaction. In a preferred embodiment of the invention, the freeprotein is fused with the transcriptional activation domain of the transcription factor.

본 발명에서 용어 "링커(linker)"는 두 핵산 사이를 연결하는 임의의 핵산서열을 의미하는 것으로서, 예를들어 본 발명에서 베이트 단백질과 전사인자의 DBD 또는 프레이 단백질과 전사인자의 AD 사이에 삽입되어 두 단위체를 연결한다. The term "linker " in the present invention means any nucleic acid sequence linking two nucleic acids. For example, in the present invention, insertions between a Bait protein and a DBD of a transcription factor or a pre- The two units are connected.

본 발명에서 용어 "클로닝 부위(또는 외래 DNA 삽입좌)"는 제한효소 부위(restriction enzyme site, 제한효소가 인식 또는/및 절단할 수 있는 부위를 의미)를 한 세트 가지고 있는 부분을 의미한다. 즉, 클로닝 시에 유전자 조작을 용이하게 하기 위하여 벡터 내에 목적하는 유전자를 삽입할 수 있도록 한 세트의 제한효소 부위를 포함하도록 구성된 염기서열 부위로서, 적어도 두 개의 제한효소 부위가 하나의 세트를 구성한다. 상기 클로닝 부위는 한 세트로서 두 개 이상의 제한 효소 부위를 포함 할 수 있으나, 바람직하게 본 발명의 클로닝 부위는 한 종류의 제한효소에 대한 제한효소 부위 두 개가 하나의 세트를 이루는 것이거나 또는 두 개의 제한효소에 대한 각각의 제한효소 부위 두 개가 하나의 세트를 이루는 것 일 수 있다. 본 발명에서는 공지의 다양한 제한효소 부위 중 어느 것을 사용하여도 무방하나, 바람직하게 II 형 제한효소 부위를 사용하는 것이 바람직하다. 상기 II 형 제한효소는 Sfi I, BsiW I, Sac II, XbaI, Sac II, Afl II 또는 Age I 등을 포함하나, 이에 제한되지 않는다.In the present invention, the term "cloning site (or foreign DNA insertion site)" means a site having a set of restriction enzyme sites (meaning sites where restriction enzymes can recognize and / or cleave). That is, a base sequence region configured to include a set of restriction enzyme sites so that a desired gene can be inserted into a vector to facilitate gene manipulation during cloning, wherein at least two restriction enzyme sites constitute one set . The cloning site may comprise more than one restriction enzyme site as a set, but preferably the cloning site of the invention is one in which two restriction enzyme sites for one type of restriction enzyme constitute one set, or two restriction sites The two restriction enzyme sites for the enzyme may be one set. Any of various known restriction enzyme sites may be used in the present invention, but it is preferable to use the restriction enzyme region of type II. Such Type II restriction enzymes include, but are not limited to, Sfi I, BsiW I, Sac II, Xba I, Sac II, Afl II or Age I.

본 발명에서 용어‘바코드 서열(barcode sequences)’은 서로 다른 벡터 내에 부가되어, 상기 벡터에 부가된 각각의 외래 유전자(또는 관심 유전자)를 표시 또는 구분할 수 있도록 하는 임의의 짧은 핵산서열을 의미한다. 본 발명에서 상기 외래 유전자(또는 관심 유전자)는 베이트 또는 프레이 단백질에 해당하는 것으로서, 당업자는 상호관계를 알고자하는 각각의 베이트 및 프레이 단백질(또는 이들을 코딩하는 핵산 서열)에 대하여 사전에 임의로 바코드 서열을 부가하고 이들의 관계를 정립한다. 상기 바코드 서열은 벡터에 삽입된 베이트 또는 프레이 단백질에 따라 당업자가 이를 표시할 수 있도록 임의로 설정할 수 있다. 상기 바코드 서열에 있어서 이를 구성하는 뉴클레오티드 수는 특별히 제한되지 아니하나, 1개 내지 20개의 뉴클레오티드로 구성될 수 있으며, 바람직하게는 5개 내지 15개의 뉴클레오티드로 구성될 수 있다.The term " barcode sequences " in the present invention refers to any short nucleic acid sequence which is added in different vectors and which enables to display or distinguish each foreign gene (or gene of interest) added to the vector. In the present invention, the foreign gene (or gene of interest) corresponds to a bait or a prey protein, and a person skilled in the art can arbitrarily select a barcode sequence And establishes the relationship between them. The bar code sequence can be arbitrarily set so that a person skilled in the art can express it according to the bait or the pre-protein inserted into the vector. In the bar code sequence, the number of nucleotides constituting the bar code sequence is not particularly limited, but it may be composed of 1 to 20 nucleotides, preferably 5 to 15 nucleotides.

본 발명에서 용어‘인접한다’는, 컨스트럭트(construct) 내의 유전적 요소(엘리먼트, element)의 위치 관계에 관해서, 약 1 내지 100bp 내로 떨어져 있는 것을 의미할 수 있으며, 바람직하게는 1 내지 50bp 내로 떨어져 있는 것을 의미할 수 있다.The term " adjacent " in the context of the present invention may mean that it is within about 1 to 100 bp with respect to the positional relationship of the genetic elements in the construct, preferably between 1 and 50 bp It can mean being away from inside.

본 발명에서 용어‘부위(위치) 특이적 재조합효소 인식 서열(site-specific recombination site 또는 site-specific recombinase site)’은 재조합효소에 의하여 인식되는 짧은 핵산 서열로서, 부위 특이적 재조합 현상이 일어나는 동안 교차 영역(crossover region)을 구성한다. 상기 부위(위치) 특이적 재조합효소 인식 서열은 당업계에 공지되어있으며, 예를 들어 lox 부위, rox 부위, att 부위, dif 부위, 및 frt 부위 등을 포함하며, 이에 제한되지 않는다. The term " site-specific recombination site " or " site-specific recombination site " in the present invention is a short nucleic acid sequence recognized by a recombinase, And constitutes a crossover region. Such site-specific recombinase recognition sequences are known in the art and include, but are not limited to, for example, lox, rox, att, dif, and frt sites.

본 발명에서 용어‘라이브러리’는 이종 폴리펩티드 또는 핵산의 혼합물, 수집물 또는 세트를 의미한다. 라이브러리는 각각이 단일 폴리펩티드 또는 핵산 서열을 지니는 일원으로 구성된다. 라이브러리 일원 사이의 서열 차이는 라이브러리에 존재하는 다양성을 책임진다. 라이브러리는 폴리펩티드 또는 핵산의 단순한 혼합물의 형태를 취하거나, 핵산의 라이브러리로 형질전환된 유기체 또는 세포, 예를 들어 박테리아, 바이러스, 효모, 동물 또는 식물 세포 등의 형태일 수 있다. The term " library " in the present invention means a mixture, collection or set of heterologous polypeptides or nucleic acids. The library consists of members each having a single polypeptide or nucleic acid sequence. Sequence differences between library members are responsible for the diversity that exists in the library. The library may take the form of a simple mixture of polypeptides or nucleic acids, or may be in the form of an organism or cell, such as a bacterium, virus, yeast, animal or plant cell, transformed with a library of nucleic acids.

본 발명에서 용어‘NGS(Next generation sequencing)’은, 당업계에 알려진 바와 같이 용어‘병렬적 시퀀싱(parallel sequencing)’ 과 호환적으로 사용된다. In the present invention, the term 'Next Generation Sequencing' (NGS) is used interchangeably with the term 'parallel sequencing' as is known in the art.

본 발명은 The present invention

제 1프로모터;A first promoter;

숙주세포 리포터 유전자의 프로모터에 결합하는 DBD 코딩 서열;A DBD coding sequence that binds to the promoter of a host cell reporter gene;

베이트 단백질 코딩 서열의 삽입을 위한 제1 클로닝 부위(cloning site);A first cloning site for insertion of a bait protein coding sequence;

제1 부위 특이적 재조합효소 인식 서열(site-specific recombination site);A first site-specific recombination site;

상기 베이트 단백질을 표시하는 바코드 서열의 삽입을 위한 제2클로닝 부위; 및A second cloning site for insertion of a barcode sequence representing the bait protein; And

제2 부위 특이적 재조합효소 인식 서열을 포함하는 것을 특징으로 하는 공여벡터를 제공한다. And a second site-specific recombinase recognition sequence.

상기 제 1프로모터는 이의 하류에 위치하는 DBD 및 상기 DBD에 연결된 베이트 단백질 코딩 서열과 작동 가능하게 연결되어 상기 서열의 전사를 조절하기 위한 핵산 서열을 의미한다. 숙주세포 또는 전사인자의 종류 등에 따라 상기 제1 프로모터의 종류를 당업자가 용이하게 설정 변경하여 사용할 수 있으며, 이는 당업계에 잘 알려져 있다. The first promoter refers to a nucleic acid sequence operatively linked to a DBD located downstream thereof and a bait protein coding sequence linked to the DBD to control transcription of the sequence. The kind of the first promoter can be easily changed by a person skilled in the art according to the type of the host cell or the transcription factor and is well known in the art.

상기 DBD 코딩 서열로부터 발현되는 DBD는 숙주세포 리포터 유전자의 프로모터에 결합하여, 리포터 유전자의 전사활성에 영향을 준다. 이때 상기 숙주세포의 리포터 유전자는 종래 이중-하이브리드 시스템에서 리포터로 사용하는 것이라면 그 종류가 특별히 제한되지 않으나, 상기 숙주세포 리포터 유전자는 재조합효소 발현 유전자인 것이 바람직하다. 상기 재조합효소는 부위-특이적 재조합(site specific recombination) 기능을 가진 것으로 당업계에 공지된 것이라면 그 종류가 특별히 제한되지 않으나, 예를 들어 bacteriophage P1 Cre recombinase, yeast FLP recombinase, φC31 recombinase, Inti integrase, bacteriophage λ recombinase, phi 80 recombinase, P22 recombinase, P2 recombinase, 186 recombinase, P4 recombinase, Tn3 resolvase, Hin recombinase, Cin recombinase, E. coli xerC recombinases, E. coli xerD recombinases, Bacillus thuringiensis recombinase, TpnI 및 β-lactamase transposons, immunoglobulin recombinases, KD recombinase, R recombinase, B2 recombinase, B3 recombinase, Dre recombinase 등을 포함한다. The DBD expressed from the DBD coding sequence binds to the promoter of the host cell reporter gene and affects the transcription activity of the reporter gene. In this case, the reporter gene of the host cell is not particularly limited as long as it is used as a reporter in the conventional dual-hybrid system, but the host cell reporter gene is preferably a recombinant enzyme expression gene. The recombinant enzyme may have a site-specific recombination function, and examples thereof include bacteriophage P1 Cre recombinase, yeast FLP recombinase,? C31 recombinase, Inti integrase, bacteriophage λ recombinase, phi 80 recombinase, P22 recombinase, P2 recombinase, 186 recombinase, P4 recombinase, Tn3 resolvase, Hin recombinase, Cin recombinase, E. coli xerC recombinases, Bacillus thuringiensis recombinase, TpnI and β-lactamase transposons, immunoglobulin recombinases, KD recombinase, R recombinase, B2 recombinase, B3 recombinase, and Dre recombinase.

본 발명의 공여벡터에서 후술하는 제1 및 제2 부위-특이적 제조합효소 인식서열은 상기 숙주세포가 리포터로서 발현하는 재조합효소에 따라 그 서열 종류를 당업자가 설정 변경하여 사용가능한 것으로서, 당업계에는 예를들어 Cre/lox system, Flp/FRT system, Dre/rox system, Xer/dif system, phiC31/att system 등의‘재조합효소/해당 부위특이적 인식서열’의 재조합 시스템이 공지되어있다. 당업자라면 상기 시스템을 이용하여 본 발명의 벡터에서 제1 및 제2 부위-특이적 제조합효소 인식서열을 구성할 수 있음이 자명하다. The first and second site-specific recombinant enzyme recognition sequences to be described later in the donor vector of the present invention can be used by a person skilled in the art to change the sequence types according to the recombinase expressed by the host cell as a reporter, There is known a recombination system of 'recombinase / site-specific recognition sequence' such as Cre / lox system, Flp / FRT system, Dre / rox system, Xer / dif system and phiC31 / att system. It will be apparent to those skilled in the art that these systems can be used to construct first and second site-specific recombinant enzyme recognition sequences in the vector of the present invention.

상기‘제1 클로닝 부위’는 본 발명의 명세서에서‘유전자 삽입 부위’등으로 호환적으로 지칭될 수 있으며, 베이트 단백질 코딩 서열의 삽입을 위한 영역으로서 한 세트의 제한효소 부위로 이루어진다. 목적 핵산의 클로닝을 위한 제한효소 부위는 당업계에 잘 알려져 있으며, 전술한 바를 참조할 수 있다. The 'first cloning site' may be referred to as 'gene insertion site' or the like in the specification of the present invention and consists of a set of restriction enzyme sites as a site for insertion of a bait protein coding sequence. Restriction sites for the cloning of the desired nucleic acid are well known in the art and can be found in the foregoing description.

상기 DBD 코딩 서열과 상기 제1 클로닝 부위에 삽입되는 베이트 단백질 코딩 서열은 직접적으로 연결되거나, 또는 링커 서열에 의해 연결될 수 있다. 따라서 상기 DBD 코딩 서열과 제1 클로닝 부위 사이에는 링커 서열이 추가적으로 포함될 수 있다. The DBD coding sequence and the bait protein coding sequence inserted in the first cloning site may be directly linked or linked by a linker sequence. Thus, a linker sequence may be additionally included between the DBD coding sequence and the first cloning site.

상기 공여벡터에서‘제1 부위 특이적 재조합효소 인식 서열’및‘제2 부위 특이적 재조합효소 인식 서열은’상호 간에 일정 간격으로 떨어져 벡터 내에 위치되며, 바람직하게 상호 간에 500 내지 4000bp(base pair) 범위의 간격으로 위치되는 것일 수 있다. 더욱 바람직하게 상기‘제1 부위 특이적 재조합효소 인식 서열’및‘제2 부위 특이적 재조합효소 인식 서열은’상호 간에 750 내지 3500bp 범위의 간격으로, 가장 바람직하게는 1500 내지 2500bp 범위 간격으로 위치되는 것일 수 있다.The 'first site-specific recombinase recognition sequence' and the 'second site-specific recombinase recognition sequence' in the donor vector are located within the vector at regular intervals, preferably between 500 and 4000 bp (base pair) And may be located at intervals of a range. More preferably, the 'first site-specific recombinase recognition sequence' and the 'second site-specific recombinase recognition sequence' are located at an interval in the range of 750 to 3500 bp, and most preferably in the range of 1500 to 2500 bp, .

본 발명에서, 상기 제1 및 제2 부위 특이적 재조합효소 인식 서열은 동일 배향(same orientation)으로 위치된다. In the present invention, the first and second site-specific recombinase recognition sequences are located in the same orientation.

상기 제1 또는 제2 부위 특이적 재조합효소 인식 서열은 당업계의 공지된 것이라면 그 서열이 특별히 제한되지 않으나, 예를 들어 lox 부위(site), rox 부위, att 부위, dif 부위 및 frt 부위 등을 포함한다. 좀 더 구체적으로 상기 제1 또는 제2 부위 특이적 재조합효소 인식 서열은 lox P와 그 이형, rox와 그 이형, att P와 그 이형, dif와 그 이형 및 frt와 그 이형으로 이루어진 군에서 선택되는 것 일 수 있다. 상기 이형(variant)는 야생형(wild type) 서열로 알려진 서열에 대하여 변이체(mutant)를 포함하는 의미이다.  The first or second site-specific recombinase recognition sequence is not particularly limited as long as it is known in the art. For example, a lox site, a rox site, an att site, a diff site and a frt site, . More specifically, the first or second site-specific recombinase recognition sequence is selected from the group consisting of lox P and its variant, rox and its variant, att P and its variant, dif and its variant, and frt and its variants It can be one. The variant is meant to include a mutant for a sequence known as a wild-type sequence.

바람직하게 본 발명의 상기 제1 또는 제2 부위 특이적 재조합효소 인식 서열은 lox 부위(site)일 수 있으며, 예를 들어 loxB, loxL, loxR, loxP, loxP3, loxP23(당업계에 lox23으로도 표기), loxΔ86, loxΔ117, loxP511(당업계에 lox511로도 표기), loxC2, loxP2272(당업계에 lox2272로도 표기), loxP5171(당업계에 lox5171로도 표기), loxP71(당업계에 lox71로도 표기), loxP66(당업계에 lox66으로도 표기), M2, M3, M7 및 M11 등을 포함하나, 이에 제한되지 않는다. 상기 제1 또는 제2 부위 특이적 재조합 효소는 동일한 것 일 수 있고, 서로 다른 것일 수 있다. 가장 바람직하게 본 발명의 상기 제1 또는 제2 부위 특이적 재조합효소 인식 서열은 loxP 및 loxP 변이체(mutant loxP)의 관계에 있는 것이 바람직하며, 상기 loxP 변이체(mutant loxP) 종류에 대해서는 당업계에 잘 알려져 있으며, 본 발명의 명세서에서 전술한 바를 참조할 수 있다. Preferably, the first or second site-specific recombinase recognition sequence of the present invention may be a lox site, for example, loxB, loxL, loxR, loxP, loxP3, loxP23 (also referred to in the art as lox23 loxP71 (also referred to in the art as lox5171), loxP71 (also referred to in the art as lox71), loxP66 (also referred to in the art as lox511), loxP86 Also referred to in the art as lox66), M2, M3, M7, M11, and the like. The first or second site-specific recombinase may be the same or different. Most preferably, the first or second site-specific recombinase recognition sequence of the present invention is preferably in the relationship of loxP and loxP mutant (mutant loxP), and the loxP variant (mutant loxP) Which are known and can be referred to in the description of the present invention.

본 발명의 공여벡터에서 상기‘제1 부위 특이적 재조합효소 인식 서열(site-specific recombination site)’ 내지‘제2 부위 특이적 재조합효소 인식 서열’로 구성되는 영역은 재조합효소에 의하여 스위칭(swiching)되며, 본 발명에서 용어‘공여영역(donor region)’ 으로 지칭될 수 있다. 상기 공여영역 이외의 벡터의 부분을 비-공여영역으로 지칭한다. In the donor vector of the present invention, the region consisting of the 'first site-specific recombination site' to the 'second site-specific recombinase recognition sequence' is swiching by the recombinase, And may be referred to herein as the term " donor region ". The portion of the vector other than the donor region is referred to as the non-donor region.

상기 공여영역에는 바코드 서열이 포함되는 것이 그 특징으로서, 즉, 상기 공여영역에는 베이트 단백질을 표시하는 바코드 서열의 삽입을 위한 제2클로닝 부위를 포함한다. 상기 제2클로닝 부위는 본 발명의 명세서에서‘바코드 삽입 부위’등의 용어와 호환적으로 지칭될 수 있다. The donor region includes a barcode sequence. That is, the donor region includes a second cloning site for insertion of a barcode sequence representing a bait protein. The second cloning site may be referred to as being compatible with the term " barcode insertion site " in the description of the present invention.

‘제2 클로닝 부위’는 한 세트의 제한효소 부위로 이루어진다. 목적 핵산의 클로닝을 위한 제한효소 부위는 당업계에 잘 알려져 있으며, 전술한 바를 참조할 수 있다. 상기 제2 클로닝 부위는 제1 부위 특이적 재조합효소 인식 서열의 하류에 바로 연결되어있거나, 1 내지 30bp 이내, 바람직하게는 1내지 20bp 이내로 근접해 있는 것이 바람직하다. The 'second cloning site' consists of a set of restriction enzyme sites. Restriction sites for the cloning of the desired nucleic acid are well known in the art and can be found in the foregoing description. It is preferable that the second cloning site is directly connected to the downstream of the first site-specific recombinase recognition sequence or is within 1 to 30 bp, preferably within 1 to 20 bp.

또한, 상기 공여영역에는 터미네이터 서열이 포함 될 수 있다. 상기 용어 ‘터미네이터’는 구조 유전자의 번역 정지 코돈에 대해 하류방향에 위치하고, 구조 유전자에 대해 작동적으로 연결되어 있으며 전사 종결을 조절하는 비번역 서열을 지칭한다. 상기 터미네이터 서열은 바람직하게 공여역역에서 바코드 서열의 하류에 위치하는 것 일 수 있다.Also, the donor region may include a terminator sequence. The term " terminator " refers to an untranslated sequence located downstream in the translation stop codon of a structural gene, operatively linked to a structural gene and regulating transcription termination. The terminator sequence may preferably be located downstream of the bar code sequence in the donor region.

또한, 상기 공여 영역에는 하나 이상의 마커 유전자를 추가로 포함 할 수 있다. 바람직하게 본 발명의 공여 벡터는 상기 공여영역 중 상기 제2 클로닝 부위와 제2 부위 특이적 재조합효소 인식 서열 사이에, 하나 이상의 마커 유전자를 추가로 포함할 수 있다. 상기 공여영역에 포함되는 마커는, 첫째로 본 발명의 공여벡터로 숙주세포의 형질전환이 적절히 이루어졌는지를 확인하는 기능; 및 둘째로 공여벡터로부터 발현된 베이트 단백질이 후술하는 수용벡터로부터 발현된 프레이 단백질과 상호작용하는지를 확인하는 기능의 두 가지 기능을 가진다. In addition, the donor region may further include one or more marker genes. Preferably, the donor vector of the present invention may further comprise one or more marker genes between the second cloning site and the second site-specific recombinase recognition sequence in the donor region. The marker included in the donor region can be firstly identified as a donor vector of the present invention to confirm whether the host cell has been transformed properly; And secondly the function of confirming whether the bait protein expressed from the donor vector interacts with the expressed protein from the acceptance vector described below.

상기 마커 유전자는 당업계에 통상의 클로닝 벡터 마커 유전자로서 공지된 것이라면 그 종류가 특별히 제한되지 않으나, 예를 들어 (ⅰ) 약물 저항성 유전자; (ⅱ) 형광 단백질 코딩 유전자; (ⅲ) 영양 요구성 표지 유전자; (ⅳ) 전사 인자 유전자; 및 (ⅴ) 세포 표면 마커 유전자 등을 포함한다. The marker gene is not particularly limited as long as it is known as a conventional cloning vector marker gene in the art. For example, (i) a drug resistance gene; (Ii) a fluorescent protein coding gene; (Iii) an auxotrophic marker gene; (Iv) a transcription factor gene; And (v) cell surface marker genes.

상기 약물 저항성 유전자는 특정 약물처리에 의하여 적절히 형질전환된 형질전환체의 선택가능 표현형을 부여하는 유전자를 의미하는 것으로서, 상기 약물로는 항생제, 세포 독성제 등이 사용될 수 있다. 바람직하게 상기 약물 저항성 유전자는 항생제 저항성 유전자를 의미하는 것으로, 예를 들어 앰피실린 저항성 유전자, 카나마이신 저항성 유전자, 클로람페니콜 저항성 유전자, 스트렙토마이신 저항성 유전자, 테트라사이클린 저항성 유전자, 겐타마이신 저항성 유전자, 카베니실린 저항성 유전자 등을 포함하나, 이에 제한되지 않는다. The drug resistance gene means a gene that imparts a selectable phenotype of a transformant properly transformed by a specific drug treatment, and the drug may be an antibiotic, a cytotoxic agent, or the like. Preferably, the drug resistance gene refers to an antibiotic resistance gene, for example, an ampicillin resistance gene, a kanamycin resistance gene, a chloramphenicol resistance gene, a streptomycin resistance gene, a tetracycline resistance gene, a gentamycin resistance gene, Genes, and the like.

상기 형광 단백질 코딩 유전자에 있어서, 상기 형광 단백질은 형광을 내는 것으로 당업계에 공지된 단백질이면 그 종류가 특별히 제한되지 않으나, 녹색 형광 단백질(GFP), 변형된 녹색 형광 단백질(modified green fluorescent protein), 증강된 녹색 형광 단백질(enhanced green fluorescent protein; EGFP), 적색 형광 단백질(RFP), 증강된 적색 형광 단백질(ERFP), 청색 형광 단백질(BFP), 증강된 청색 형광 단백질(EBFP), 황색 형광 단백질(YFP), 증강된 황색 형광 단백질(EYFP), 남색 형광 단백질(CFP), 및 증강된 남색 형광 단백질(ECFP)을 이용할 수 있으며, 바람직하게는 녹색 형광 단백질(GFP)을 사용하는 것 일 수 있다.In the above-mentioned fluorescent protein coding gene, the fluorescent protein may be any one known in the art as a fluorescent substance. Examples of the fluorescent protein coding gene include green fluorescent protein (GFP), modified green fluorescent protein, (EFP), red fluorescent protein (RFP), enhanced red fluorescent protein (ERFP), blue fluorescent protein (BFP), enhanced blue fluorescent protein (EBFP), yellow fluorescent protein YFP), enhanced yellow fluorescent protein (EYFP), indigo blue fluorescent protein (CFP), and enhanced blue fluorescent protein (ECFP), preferably using green fluorescent protein (GFP).

상기 영양 요구성 표지 유전자는 본 명에서에서 용어‘영양성 표지자’와 호환성 있게 사용되며, 세포의 영양 요구성을 보상할 수 있고 그래서 그 영양요구성 세포에 원영양성을 부여하는 유전자 생산물을 암호화하고 있는 표지자 서열이다. 본 발명에 따라 “영양요구성”은 세포가 반드시 영양요구성 세포 스스로에 의해서는 생산될 수 없는 필수 영양소를 가지고 있는 배지에서 길러져야 한다는 것을 의미한다. 영양성 표지자 유전자의 유전자 생산물은 영양요구성 세포에서 상실한 필수 영상소의 합성을 촉진한다. 성공적으로 발현한 영양성 표지자 유전자에 의해 세포가 길러지는 배양 배지에 필수 영양소를 첨부할 필요는 없을 것이다. 바람직한 표지자는 URA3, LEU2, CAN1, CYH2, TRP1, ADE1, ADE2 및 MET5 등을 포함한다. The nutritional requirement marker gene is used interchangeably with the term " nutritional marker " in the present description, and is capable of compensating the nutritional requirement of the cell and thus encoding a gene product that imparts nutritional value to the nutritional requirement cell It is a marker sequence. According to the present invention, " nutritional requirement " means that the cell must be grown in a medium having essential nutrients that can not necessarily be produced by the auxotrophic cells themselves. The gene product of the nutritional marker gene promotes the synthesis of the essential imaging element lost in the auxotrophic cells. It will not be necessary to attach essential nutrients to the culture medium in which the cells are grown by the successfully expressed nutritional marker gene. Preferred markers include URA3, LEU2, CAN1, CYH2, TRP1, ADE1, ADE2 and MET5, and the like.

전사 인자 유전자는 특정 유전자의 전사 조절 부위, 일반적으로 프로모터 부위에 결합하여 그 유전자의 전사(Transcription)를 유도 또는 억제에 관여하는 단백질로서 당업계에 공지된 단백질이면 그 종류가 특별히 제한되지 않으나, Adr1, Cat8, Gal4, Glc7, Hap2, Hxt, Hxk, Lac4, Lac9, Mal63, Mig1, Mig2, Mig3, Mxr1, Oaf1, Sip4, Snf1, Snf3, Rgt2 및 URS 등을 이용할 수 있다. The transcription factor gene is a transcriptional regulatory region of a specific gene, generally a protein involved in induction or inhibition of transcription of the gene by binding to the promoter region, and is not particularly limited as long as it is a protein known in the art. , Cat8, Gal4, Glc7, Hap2, Hxt, Hxk, Lac4, Lac9, Mal63, Mig1, Mig2, Mig3, Mxr1, Oaf1, Sip4, Snf1, Snf3, Rgt2 and URS.

상기‘세포 표면 마커(cell surface marker) 유전자’는 세포 표면(즉, 세포막 또는 세포벽)에 특정 단백질 또는 항원의 발현시켜 형질전환체의 선택가능 표현형을 부여하는 유전자를 의미하는 것으로, 상기 세포 표면 마커로는 예를 들어 α-galactosidase, Aga1p/Aga2p, Flo1p, Cwp1p, Cwp2p, Tip1p, Pir1, Pir2, Pir3 및 Pir4 등을 포함하나, 이에 제한되지 않는다. The 'cell surface marker gene' refers to a gene that expresses a specific protein or antigen on a cell surface (that is, cell membrane or cell wall) to give a selectable phenotype of the transformant, But are not limited to, for example,? -Galactosidase, Aga1p / Aga2p, Flo1p, Cwp1p, Cwp2p, Tip1p, Pir1, Pir2, Pir3 and Pir4.

상기 공여영역에 포함되는 마커 유전자는, 전술한 DBD 및 상기 DBD에 연결된 베이트 단백질 코딩 서열과 서로 다른 번역 프레임(frame)에 위치하는 것이 바람직하다. 따라서 상기 공여영역에 포함되는 마커 유전자는, 상기 마커 유전자의 하류에 위치하며 제1 프로모터와 반대 전사 배향인 제2 프로모터와 작동가능하게 연결되는 것이 바람직 할 수 있다.The marker gene contained in the donor region is preferably located in a different translation frame from the DBD and the bait protein coding sequence linked to the DBD. Therefore, it is preferable that the marker gene contained in the donor region is operatively linked to the second promoter located downstream of the marker gene and opposite to the first promoter.

상기‘제2 프로모터’는 전술한 바와 같이 공여영역에 포함되는 상기 마커 유전자를 발현시키기 위한 것으로서, 상기 마커 유전자와 작동 가능하게 연결되며 제1프로모터와는 완전하게 독립적으로 작동한다. 본 발명의 제1프로모터-DBD 및 베이트 단백질 코딩 서열로 연결되는 구조 및 제2프로모터-마커 유전자로 연결 되는 구조는 제1프로모터와 제2프로모터가 듀얼-프로모터로 따로 작동하기 용이하도록, 각각의 구조가 반대의 전사방향으로 벡터 내에 삽입되어 존재하는 것이 바람직하다.The 'second promoter' is for expressing the marker gene contained in the donor region as described above, and is operatively linked to the marker gene and operates completely independently of the first promoter. The structure linked to the first promoter-DBD and bait protein coding sequences of the present invention and the structure linked to the second promoter-marker gene may be constructed so that the first promoter and the second promoter are separately activated Is preferably inserted into the vector in the direction of the opposite transfer direction.

공여영역 내에 위치하는 마커 유전자와 관련하여 본 발명의 일 실시양태에서, 본 발명 공여 벡터는 제2 클로닝 부위와 제2 부위 특이적 재조합효소 인식 서열 사이에 순차적으로 마커 유전자; 및 제1 프로모터와 반대 전사 배향이며 상기 마커 유전자와 작동 가능하게 연결된 제2 프로모터를 포함하는 형태로 이루어진 것 일 수 있다. 즉, 본 발명 공여벡터의 공여영역이 순차적으로‘제1 부위특이적 재조합효소 인식서열- 바코드 서열을 위한 제2 클로닝 부위-마커 유전자-제2 프로모터- 제2 부위특이적 재조합효소 인식서열’로 이루어지는 것 일 수 있다. In one embodiment of the present invention with respect to a marker gene located within the donor region, the donor vector of the invention comprises a marker gene sequentially between a second cloning site and a second site-specific recombinase recognition sequence; And a second promoter having an opposite transcriptional orientation to the first promoter and operatively linked to the marker gene. That is, the donor region of the donor vector of the present invention is sequentially referred to as 'first site-specific recombinase recognition sequence-second cloning site-marker gene-second promoter-second site-specific recombinase recognition sequence for barcode sequence' It can be done.

상기 실시양태에서 적용될 수 있는 마커 유전자의 종류는 특별히 제한되지 않으나, 바람직하게 항생제 저항성 유전자일 수 있고 이는 전술한 바를 참조로 한다. The kind of the marker gene that can be applied in the above embodiment is not particularly limited, but may preferably be an antibiotic resistance gene, which is described above.

또 한가지 바람직한 실시양태에서, 본 발명의 공여벡터는 제2 클로닝 부위와 제2 부위 특이적 재조합효소 인식 서열 사이에 순차적으로 제1 마커 유전자; 제1 프로모터와 반대 전사 배향이며 상기 제1마커 유전자와 작동 가능하게 연결된 제2 프로모터; 및 제1 마커 유전자와 다른 제2 마커 유전자를 포함하는 형태로 이루어진 것 일 수 있다. 즉, 본 발명 공여벡터의 공여부위가 순차적으로‘제1 부위특이적 재조합효소 인식서열- 바코드 서열을 위한 제2 클로닝 부위-제1 마커 유전자-제2 프로모터- 제2 마커 유전자- 제2 부위특이적 재조합효소 인식서열’로 이루어지는 것 일 수 있다. In another preferred embodiment, the donor vector of the present invention comprises a first marker gene sequentially between a second cloning site and a second site-specific recombinase recognition sequence; A second promoter that is opposite in transcriptional orientation to the first promoter and is operably linked to the first marker gene; And a form comprising a first marker gene and a second marker gene different from the first marker gene. That is, the donor site of the donor vector of the present invention is sequentially referred to as a first site-specific recombinase recognition sequence, a second cloning site for a barcode sequence, a first marker gene, a second promoter, a second marker gene, Recombinase recognition sequence ".

상기 실시양태에서, 공여영역에 존재하는 제1 마커 유전자는 본 발명의 공여벡터로 적절하게 형질전환이 수행된 형질전환체를 선별하기 위한 선별마커인 것이 적절하다. 상기 제 1마커는 제2 프로모터와 작동 가능하게 연결되어 본 발명의 공여벡터가 도입된 형질전환체에서 항시 발현한다. In this embodiment, the first marker gene present in the donor region is suitably a selectable marker for screening transformants that have been suitably transformed into the donor vector of the invention. The first marker is operatively linked to a second promoter and is constantly expressed in the transformant into which the donor vector of the present invention is introduced.

또한 상기 실시양태에서, 공여영역에 존재하는 상기 제2 마커 유전자는 베이트 및 프레이 단백질의 상호작용 여부를 검출 및 선별하기 위한 마커로 사용되는 것으로서, 본 발명의 공여벡터가 도입된 형질전환체는 상기 제2 마커를 항시 발현하지 않는다. 즉, 공여 벡터 내에는 상기 제2 마커 유전자를 전사 또는 발현시키기 위한 조절서열(프로모터)이 포함되어 있지 않고, 또한 제2 마커는‘제2 프로모터-제1 마커 유전자’로 연결 되는 구조의 번역 프레임 밖(out of frame)에 존재한다. 따라서 단순히 본 발명의 공여벡터가 형질전환체 내에 도입된 사실 만으로는 제2 마커의 발현이 보장되지 못하며, 상기 제2 마커는 베이트 및 프레이 단백질의 상호작용에 의하여 숙주세포에서 재조합효소 리포터가 발현됨으로 인하여 후술하는 수용벡터에 공여영역이 재조합되었을 때 비로소 발현된다. 따라서 공여 벡터 내에는 상기 제2 마커 유전자를 전사 또는 발현시키기 위한 조절서열(프로모터)이 포함되어 있지 않은 것이 특징이며, 이는 형질전환체 선별을 목적으로 하는 제1 마커와 구별된다. 상기 제2 마커의 전사 또는 발현을 위한 조절서열은 후술하는 수용 벡터 내에 포함되는 것이 바람직하며 특히, 수용벡터의 제2 부위특이적 재조합효소 인식서열에 바로 인접하여 존재하는 것이 바람직하다. In addition, in the above embodiment, the second marker gene present in the donor region is used as a marker for detecting and selecting whether or not the bait and the freeprotein interact with each other. The transformant into which the donor vector of the present invention is introduced, The second marker is not always expressed. That is, within the donor vector, the translation frame (promoter) for transcription or expression of the second marker gene is not contained and the second marker is linked to the 'second promoter-first marker gene' It is in the out of frame. Therefore, the expression of the second marker is not ensured merely by the fact that the donor vector of the present invention is introduced into the transformant, and the recombinant enzyme reporter is expressed in the host cell by the interaction of the second marker with the bait and pre-protein But only when the donor region is recombined in the acceptance vector described later. Therefore, the donor vector is characterized in that it does not contain a regulatory sequence (promoter) for transcription or expression of the second marker gene, which is distinguished from the first marker for screening a transformant. Preferably, the regulatory sequence for transcription or expression of the second marker is contained within the acceptance vector described below, particularly preferably immediately adjacent to the second site-specific recombinase recognition sequence of the acceptor vector.

상기 실시양태에서 적용될 수 있는 제1 마커 유전자와 제2 마커 유전자는 서로 다른 종류의 것이라면 상기 마커의 조합 및 종류가 특별히 제한되지 않으며, 전술한 바를 참조하여 당업자가 설정 변경하여 사용할 수 있다. 바람직하게 상기 제1 마커 유전자는 항생제 저항성 유전자일 수 있으며, 상기 제2 마커 유전자는 형광 단백질 코딩 유전자일 수 있다. If the first marker gene and the second marker gene that can be applied in the above embodiment are of different kinds, the combination and the kind of the marker are not particularly limited, and those skilled in the art can change and use the marker by referring to the above description. Preferably, the first marker gene may be an antibiotic resistance gene, and the second marker gene may be a fluorescent protein coding gene.

또한 본 발명의 공여벡터는 상기 공여영역 이외의 부분인 비-공여영역에 대하여, 마커 유전자가 추가로 포함될 수 있다. 상기 비-공여영역의 마커 유전자는 본 발명의 공여벡터로 형질전환된 세포를 선별하기 위한 목적으로 삽입되는 것일 수 있으며, 공여영역에 삽입된 마커 유전자와 다른 종류의 것인 것이 바람직하다. 벡터에 삽입 될 수 있는 통상의 마커 유전자에 대해서는 전술한 바와 같다. Further, the donor vector of the present invention may further include a marker gene for a non-donor region which is a portion other than the donor region. The marker gene in the non-donor region may be inserted for the purpose of screening cells transformed with the donor vector of the present invention, and preferably a marker gene inserted in the donor region. Conventional marker genes that can be inserted into vectors are as described above.

본 발명의 상기 공여 벡터는 프로모터, 복제 기원, 오퍼레이터, 폴리아데닐화 신호, 인핸서 및 분비 신호 및 친화성 태그(affinity tag)로 이루어진 군에서 선택된 하나 이상을 추가로 포함할 수 있다. The donor vector of the present invention may further include at least one selected from the group consisting of a promoter, a copy origin, an operator, a polyadenylation signal, an enhancer and a secretion signal, and an affinity tag.

상기 본 발명 공여벡터의 구현 일례로서, 본 발명은 플라스미드 pGBKT7에 멀티 클로닝 사이트(MCS)를 제거하고, 멀티플 클로닝 사이트(MCS)를 두 개의 Sfi I 제한효소 자리로 대체하고, 그 뒤로 lox2272 서열과 바코드 삽입 부위, 카나마이신 항생제 저항성 유전자와 프로모터, GFP 유전자 및 loxP 서열이 순차적으로 도입된 것을 특징으로 하는 pDBD-donor 벡터를 제공한다. As an embodiment of the donor vector according to the present invention, the present invention is a method of removing a multicloning site (MCS) from plasmid pGBKT7, replacing multiple cloning sites (MCS) with two Sfi I restriction sites, followed by a lox2272 sequence and a barcode A pDBD-donor vector characterized in that an insertion site, a kanamycin antibiotic resistance gene and a promoter, a GFP gene, and a loxP sequence are sequentially introduced.

본 발명의 상기 pDBD-donor 벡터는 pGBKT7 벡터를 기본으로 유전자 변형을 통하여 제조된 것으로 멀티플 클로닝 사이트(MCS)를 제거하고, 멀티플 클로닝 사이트(MCS)를 두 개의 Sfi I 제한효소 자리로 대체하고, 그 뒤로 lox2272 서열과 바코드 삽입 부위, 카나마이신 항생제 저항성 유전자와 프로모터, GFP 유전자 및 loxP 서열이 순차적으로 도입된 것을 특징으로 한다.The pDBD-donor vector of the present invention was prepared through gene modification based on the pGBKT7 vector. The multiple cloning site (MCS) was removed, the multiple cloning site (MCS) was replaced with two Sfi I restriction sites, A lox2272 sequence and a barcode insertion site, a kanamycin antibiotic resistance gene and a promoter, a GFP gene and a loxP sequence are sequentially introduced.

상기 pGBKT7 벡터는 목적 단백질이 GAL4 DNA binding 도메인(DBD)에 결합(융합)하여 발현될 수 있도록 디자인 된 yeast two hybrid 벡터로 [도 4]의 개열지도와 같은 구조를 가진다.The pGBKT7 vector is a yeast two hybrid vector designed to bind to (fusion with) the GAL4 DNA binding domain (DBD) of a target protein, and has a structure similar to that of FIG.

loxP 서열 및 lox2272 서열은 Cre recombinase에 인식되고 switching 되는 서열이다. 본 발명의 pDBD-donor 벡터는 Cre recombinase에 의해 인식되고 재조합되는 loxP 서열 및 lox2272 서열을 포함하며, 상기 loxP 서열 및 lox2272 서열은 바람직하게 상호 간에 500 내지 4000bp(base pair) 범위의 간격으로 위치되는 것일 수 있다. 더욱 바람직하게 상기 loxP 서열 및 lox2272 서열은 상호 간에 750 내지 3500bp 범위의 간격으로, 가장 바람직하게는 1500 내지 2500bp 범위의 간격으로 위치되는 것일 수 있다. 상기 pDBD-donor 벡터의 loxP 서열 및 lox2272 서열은 동일 배향(same orientation)으로 위치된다. 상기 loxP 서열 및 lox2272 서열 사이에 GFP 유전자 및 바코드 서열 삽입부위가 도입되어 있다.The loxP sequence and the lox2272 sequence are sequences recognized and switched to Cre recombinase. The pDBD-donor vector of the present invention comprises a loxP sequence and a lox2272 sequence recognized and recombined by Cre recombinase, wherein the loxP sequence and the lox2272 sequence are preferably located at intervals of 500 to 4000 bp (base pair) . More preferably, the loxP sequence and the lox2272 sequence may be located at an interval in the range of 750 to 3500 bp, and most preferably in the range of 1500 to 2500 bp, relative to each other. The loxP sequence and the lox2272 sequence of the pDBD-donor vector are located in the same orientation. The GFP gene and the barcode sequence insertion site are introduced between the loxP sequence and the lox2272 sequence.

Cre recombinase에 의해 loxP 서열 및 lox2272 서열 사이의 부분이 후술하는 pAD-acc 벡터로 도입되면, 상기 GFP(green fluorescent protein) 유전자는 LEU2 프로모터에 의해 발현이 되어 형광을 나타내며, 상기 pDBD-donor 벡터의 바코드 서열은 후술하는 pAD-acc 벡터의 바코드 서열과 연결(또는 인접)되어 식별될 수 있도록 구성되어 있다(도 18 참조).When a portion between the loxP sequence and the lox2272 sequence is introduced into a pAD-acc vector described later by Cre recombinase, the GFP (green fluorescent protein) gene is expressed by the LEU2 promoter to exhibit fluorescence, and the barcode of the pDBD- The sequence is constructed so that it can be identified (connected to or adjacent to) the bar code sequence of the pAD-acc vector described later (see FIG. 18).

상기‘멀티플 클로닝 사이트(MCS)를 두 개의 Sfi I 제한효소 자리로 대체’는, 상기 기존 벡터의 MCS를 목적 단백질에 대한 유전자 삽입부위로 만드는 것을 의미한다. 상기 유전자 삽입부위는 라이브러리를 구성하는 목적 단백질의 유전자가 삽입될 수 있는 부위로 임의의 제한효소 인식부위를 포함하여 원하는 유전자를 도입할 수 있게 하는 것이 바람직하며, 상기 제한효소는 공지의 제한효소로 그 종류가 특별히 제한되지 아니하나, 바람직하게는 두 개의 Sfi I 일 수 있다. 상기 유전자 삽입부위에 삽입되는 유전자는 후술하는 pAD-acc 벡터에 도입되는 유전자와 상호 interaction을 알고자 하는 목적 유전자로 그 종류는 특별히 제한되지 아니한다.Replacing the 'multiple cloning site (MCS) with two Sfi I restriction enzyme sites' means making the MCS of the existing vector a gene insertion site for the target protein. It is preferable that the gene insertion site allows a desired gene to be introduced by including an arbitrary restriction enzyme recognition site as a site into which a gene of a target protein constituting the library can be inserted, and the restriction enzyme is a known restriction enzyme The kind thereof is not particularly limited, but preferably it can be two Sfi I. The gene to be inserted into the gene insertion site is a target gene to be mutually interacted with a gene to be introduced into a pAD-acc vector to be described later, and its type is not particularly limited.

상기 바코드 서열 삽입부위는 상기 pDBD-donor 벡터의 유전자 삽입부위(두 개의 Sfi I 제한효소 자리 사이)에 도입되는 베이트 단백질 유전자를 표시하는 서열로 뉴클레오티드 수는 특별히 제한되지 아니하나, 1개 내지 20개의 뉴클레오티드로 구성될 수 있으며, 바람직하게는 5개 내지 15개의 뉴클레오티드로 구성될 수 있다. 상기 바코드 서열 삽입부위는 임의의 제한효소 인식부위를 포함하여 원하는 바코드를 도입할 수 있게 하는 것이 바람직하며, 상기 제한효소는 공지의 제한효소로 그 종류가 특별히 제한되지 아니하나, 바람직하게는 Afl II 및 Age I 일 수 있다.The barcode sequence insertion site is a sequence representing a bait protein gene introduced into a gene insertion site (between two SfiI restriction enzyme sites) of the pDBD-donor vector. The number of nucleotides is not particularly limited, but 1 to 20 Nucleotides, preferably 5 to 15 nucleotides. It is preferable that the barcode sequence insertion site includes an arbitrary restriction enzyme recognition site so that a desired barcode can be introduced. The restriction enzyme is a known restriction enzyme and its kind is not particularly limited. Preferably, the restriction enzyme is Afl II And Age I.

본 발명의 pDBD-donor 벡터는 바람직하게는 [도 2]의 개열지도로 나타내어질 수 있다. 도 2의 개열지도로 표시되는 pDBD-donor 벡터는 베이트 단백질 삽입을 위한 제1 클로닝 부위로서 한 세트의 Sfi I 제한효소 자리가 포함되며, 바코드 삽입부을 위한 제2 클로닝 부위로서 Afl II 및 Age I 세트의 제한효소 인식서열이 포함되어있다. 도 2의 개열지도로 표시되는 pDBD-donor 벡터는 바람직하게 서열번호 15의 염기서열로 이루어지는 것 일 수 있으며, 본 발명자에 의하여 기탁번호 KCTC12790BP로 기탁되었다. The pDBD-donor vector of the present invention can be preferably represented by a cleavage map of [Fig. 2]. The pDBD-donor vector represented by the cleaved map in FIG. 2 includes a set of Sfi I restriction sites as a first cloning site for bait protein insertion, Afl II and Age I sets as a second cloning site for a barcode insertion site Of the restriction enzyme recognition sequence. The pDBD-donor vector represented by the cleaved map in Fig. 2 may preferably consist of the nucleotide sequence of SEQ ID NO: 15 and was deposited by the present inventor with the accession number KCTC12790BP.

한편, 본 발명은 On the other hand,

제1 프로모터;A first promoter;

숙주세포 리포터 유전자의 전사를 돕는 AD 코딩 서열;An AD coding sequence to aid transcription of the host cell reporter gene;

프레이 단백질 코딩 서열의 삽입을 위한 제1클로닝 부위;A first cloning site for insertion of a pre-protein coding sequence;

상기 프레이 단백질을 표시하는 바코드 서열의 삽입을 위한 제2클로닝 부위;A second cloning site for insertion of a barcode sequence representing said pre-protein;

제1 부위 특이적 재조합효소 인식 서열; 및 A first site-specific recombinase recognition sequence; And

제2 부위 특이적 재조합효소 인식 서열을 포함하는 것을 특징으로 하는 수용벡터를 제공한다. And a second site-specific recombinase recognition sequence.

상기 제 1프로모터는 이의 하류에 위치하는 AD 및 상기 AD에 연결된 프레이단백질 코딩 서열과 작동 가능하게 연결되어 상기 서열의 전사를 조절하기 위한 핵산 서열을 의미한다. 숙주세포 또는 전사인자의 종류 등에 따라 상기 제1 프로모터의 종류를 당업자가 용이하게 설정 변경하여 사용할 수 있으며, 이는 당업계에 잘 알려져 있다. The first promoter means a nucleic acid sequence operatively linked to AD and a downstream protein coding sequence linked to the AD located downstream thereof to regulate transcription of the sequence. The kind of the first promoter can be easily changed by a person skilled in the art according to the type of the host cell or the transcription factor and is well known in the art.

상기 AD는 전술한 공여벡터의 DBD와 상호작용 또는 결합하는 것이라면 그 종류가 특별히 제한되지 않으며, 전사인자의 DBD 및 AD 조합에 대해서는 전술한 바와 같다. The type of AD is not particularly limited as long as it interacts with or binds to the DBD of the donor vector described above, and DBD and AD combinations of transcription factors are as described above.

상기‘제1 클로닝 부위’는 본 발명의 명세서에서‘유전자 삽입 부위’등으로 호환적으로 지칭될 수 있으며, 프레이 단백질 코딩 서열의 삽입을 위한 영역으로서 한 세트의 제한효소 부위로 이루어진다. 목적 핵산의 클로닝을 위한 제한효소 부위는 당업계에 잘 알려져 있으며, 전술한 바를 참조할 수 있다. The 'first cloning site' may be referred to as 'gene insertion site' or the like in the context of the present invention and consists of a set of restriction enzyme sites as a site for insertion of the pre-protein coding sequence. Restriction sites for the cloning of the desired nucleic acid are well known in the art and can be found in the foregoing description.

상기 AD 코딩 서열과 상기 제1 클로닝 부위에 삽입되는 프레이 단백질 코딩 서열은 직접적으로 연결되거나, 또는 링커 서열에 의해 연결될 수 있다. 따라서 상기 AD 코딩 서열과 제1 클로닝 부위 사이에는 링커 서열이 추가적으로 포함될 수 있다. The AD coding sequence and the pre-protein coding sequence inserted in the first cloning site may be directly linked or linked by a linker sequence. Thus, a linker sequence may be additionally included between the AD coding sequence and the first cloning site.

수용벡터에서 상기 프레이 단백질을 표시하는 바코드 서열의 삽입을 위한 제2클로닝 부위는 제1 부위 특이적 재조합효소 인식 서열의 상류에 위치하는 것이 특징이다. 제2클로닝 부위는 제1 부위 특이적 재조합효소 인식 서열의 상류에 바로 연결되어있거나, 1 내지 30bp 이내, 바람직하게는 1내지 20bp 이내로 근접해 있는 것이 바람직하다. The second cloning site for insertion of the bar code sequence representing the pre-protein in the acceptance vector is located upstream of the first site-specific recombinase recognition sequence. It is preferable that the second cloning site is directly upstream of the first site-specific recombinase recognition sequence, or is within 1 to 30 bp, preferably within 1 to 20 bp.

상기 수용벡터에서‘제1 부위 특이적 재조합효소 인식 서열’및‘제2 부위 특이적 재조합효소 인식 서열은’상호 간에 일정 간격으로 떨어져 벡터 내에 위치되며, 바람직하게 상호 간에 500 내지 4000bp(base pair) 범위의 간격으로 위치되는 것일 수 있다. 더욱 바람직하게 상기‘제1 부위 특이적 재조합효소 인식 서열’및‘제2 부위 특이적 재조합효소 인식 서열은’상호 간에 500 내지 3000bp 범위의 간격으로, 가장 바람직하게는 700 내지 1200bp의 범위로 위치되는 것일 수 있다.The 'first site-specific recombinase recognition sequence' and the 'second site-specific recombinase recognition sequence' in the acceptance vector are located within the vector at regular intervals mutually, preferably between 500 and 4000 bp (base pair) And may be located at intervals of a range. More preferably, the 'first site-specific recombinase recognition sequence' and the 'second site-specific recombinase recognition sequence' are located at an interval of between 500 and 3000 bp, most preferably between 700 and 1200 bp, Lt; / RTI >

수용 벡터의 제1 및 제2 부위 특이적 재조합효소 인식 서열은 각각 전술한 공여 벡터의 제1 및 제2 부위 특이적 재조합 효소 인식 서열과 동일하다. 따라서 공여벡터에서 1 및 제2 부위 특이적 재조합 효소 인식 서열 조합에 따라, 당업자라면 수용 벡터의 제1 및 제2 부위 특이적 재조합효소 인식 서열을 용이하게 설정할 수 있다. 상기 공여벡터의 제1 및 제2 부위 특이적 재조합효소 인식 서열에 대해서는 전술한 바와 같다. The first and second site-specific recombinase recognition sequences of the acceptance vector are the same as the first and second site-specific recombinase recognition sequences of the donor vector, respectively. Thus, according to the combination of 1 and the second site-specific recombinase recognition sequence in the donor vector, one skilled in the art can easily set the first and second site-specific recombinase recognition sequences of the acceptor vector. The first and second site-specific recombinase recognition sequences of the donor vector are as described above.

본 발명에서, 수용벡터의 상기 제1 및 제2 부위 특이적 재조합효소 인식 서열은 동일 배향(same orientation)으로 위치된다. 또한, 상기 수용벡터의 제1 및 제2 부위 특이적 재조합효소 인식서열은 전술한 공여벡터의 제1 및 제2 부위 특이적 재조합효소 인식 서열과 동일한 상대배향으로 배열(또는 위치)되는 것이 바람직하다. In the present invention, the first and second site-specific recombinase recognition sequences of the acceptor vector are located in the same orientation. In addition, it is preferable that the first and second site-specific recombinase recognition sequences of the acceptance vector are arranged (or positioned) in the same relative orientation as the first and second site-specific recombinase recognition sequences of the donor vector described above .

본 발명의 수용벡터에서 상기‘제1 부위 특이적 재조합효소 인식 서열(site-specific recombination site)’ 내지‘제2 부위 특이적 재조합효소 인식 서열’로 구성되는 영역은 재조합효소에 의하여 스위칭(swiching)되며, 본 발명에서 용어 ‘수용영역(acceptor region)’ 으로 지칭될 수 있다. 상기 수용영역 이외의 벡터의 부분을 비-수용영역으로 지칭한다.In the acceptance vector of the present invention, the region consisting of the 'first site-specific recombination site' to the 'second site-specific recombinase recognition sequence' is swiching by the recombinase, And may be referred to in the present invention as the term " acceptor region ". The portion of the vector other than the receiving region is referred to as the non-receiving region.

상기 수용영역에는 터미네이터 서열이 포함 될 수 있다. 상기 용어 ‘터미네이터’는 구조 유전자의 번역 정지 코돈에 대해 하류방향에 위치하고, 구조 유전자에 대해 작동적으로 연결되어 있으며 전사 종결을 조절하는 비번역 서열을 지칭한다. 상기 터미네이터 서열은 바람직하게 수용영역에서 제1 부위특이적 재조합효소 인식 서열의 하류에 위치하는 것 일 수 있다.The accepting region may include a terminator sequence. The term " terminator " refers to an untranslated sequence located downstream in the translation stop codon of a structural gene, operatively linked to a structural gene and regulating transcription termination. The terminator sequence may preferably be located downstream of the first site-specific recombinase recognition sequence in the accepting region.

상기 수용벡터에서 수용영역은, 베이트 및 프레이 단백질 간에 상호작용이 있는 경우 숙주세포로부터 리포터로서 발현된 재조합효소에 의하여 전술한 공여벡터의 공여영역으로 교체(또는 치환, 스위칭, 재조합)된다. 이로서, 베이트 표시 바코드 서열과 프레이 표시 바코드 서열이 제1 부위 특이적 재조합효소 인식 서열을 사이에 두고 서로 인접해있게 된다. In the acceptance vector, the acceptor region is replaced (or substituted, switched, recombined) with the donor region of the donor vector described above by a recombinase expressed as a reporter from the host cell if there is an interaction between bait and pre-protein. As a result, the bait display barcode sequence and the prey display barcode sequence become adjacent to each other with the first site-specific recombinase recognition sequence therebetween.

상기 수용벡터는 비-수용영역에 하나 이상의 마커 유전자를 추가로 포함할 수 있다. 바람직하게 상기 수용벡터는 제2 부위 특이적 재조합효소 인식 서열의 하류에 하나 이상의 마커 유전자를 추가로 포함할 수 있다. The acceptor vector may further comprise one or more marker genes in the non-accepting region. Preferably, the acceptor vector further comprises one or more marker genes downstream of the second site-specific recombinase recognition sequence.

수용벡터에 포함되는 상기 마커 유전자는 당업계에 통상의 클로닝 벡터 마커 유전자로서 공지된 것이라면 그 종류가 특별히 제한되지 않으나, 예를 들어 (ⅰ) 약물 저항성 유전자; (ⅱ) 형광 단백질 코딩 유전자; (ⅲ) 영양 요구성 표지 유전자; (ⅳ) 전사 인자 유전자; 및 (ⅴ) 세포 표면 마커 유전자 등을 포함한다. 상기 수용벡터에 포함되는 마커 유전자는 상기 공여벡터에 사용된 마커 유전자와 동일한 것을 사용하지 않는 것이 바람직하며, 마커 유전자의 구체적 종류에 대해서는 공여벡터 설명 시 전술한 바와 같다. The type of the marker gene contained in the acceptance vector is not particularly limited as long as it is known as a conventional cloning vector marker gene in the art, (I) a drug resistance gene; (Ii) a fluorescent protein coding gene; (Iii) an auxotrophic marker gene; (Iv) a transcription factor gene; And (v) cell surface marker genes. It is preferable that the marker gene contained in the acceptance vector is not the same as the marker gene used in the donor vector, and the specific kind of the marker gene is as described above in the description of the donor vector.

상기 비-수용영역에 포함되는 마커 유전자는 전술한 AD 및 상기 AD에 연결된 프레이 단백질 코딩 서열과 서로 다른 번역 프레임(frame)에 위치하는 것이 바람직하다. 따라서 상기 비-수용영역에 포함되는 마커 유전자는, 상기 마커 유전자의 하류에 위치하며 제1 프로모터와 반대 전사 배향인 제2 프로모터와 작동가능하게 연결되는 것이 바람직 할 수 있다.The marker gene contained in the non-accepting region is preferably located in a different translation frame from the pre-protein coding sequence linked to AD and AD described above. Therefore, it is preferable that the marker gene contained in the non-accepting region is operatively connected to a second promoter located downstream of the marker gene and opposite to the first promoter.

상기‘제2 프로모터’는 전술한 바와 같이 비-수용영역에 포함되는 상기 마커 유전자를 발현시키기 위한 것으로서, 상기 마커 유전자와 작동 가능하게 연결되며 제1프로모터와는 완전하게 독립적으로 작동한다. 본 발명의 제1프로모터-AD 및 프레이 단백질 코딩 서열로 연결되는 구조 및 제2프로모터-마커 유전자로 연결 되는 구조는 제1프로모터와 제2프로모터가 듀얼-프로모터로 따로 작동하기 용이하도록, 각각의 구조가 반대의 전사방향으로 벡터 내에 삽입되어 존재하는 것이 바람직하다.The 'second promoter' is for expressing the marker gene contained in the non-accepting region as described above, and is operatively linked to the marker gene and operates completely independently of the first promoter. The structure connected to the first promoter-AD and the pre-protein coding sequence of the present invention and the structure linked to the second promoter-marker gene is such that the first promoter and the second promoter are operably linked to each other Is preferably inserted into the vector in the direction of the opposite transfer direction.

비-수용영역에 위치하는 마커 유전자와 관련하여 본 발명의 일 실시양태에서, 본 발명의 수용 벡터는 제2 부위 특이적 재조합효소 인식 서열이 이의 하류에 순차적으로, 번역 종결 코돈이 제거된 제1 마커 유전자; 및 제1 프로모터와 반대 전사 배향이며 상기 제1 마커 유전자와 작동 가능하게 연결된 제2 프로모터를 포함하는 형태로 이루어진 것 일 수 있다. 즉, 본 발명 수용벡터에서 제2 부위 특이적 재조합효소 인식 서열의 하류에 위치하는 비-수용영역이‘제2 부위 특이적 재조합효소 인식 서열-번역 종결 코돈이 제거된 제1 마커 유전자-제2 프로모터’로 이루어지는 것 일 수 있다. In one embodiment of the present invention with respect to a marker gene located in the non-accepting region, the acceptor vector of the present invention comprises a second site-specific recombinase recognition sequence sequentially downstream thereof, a first Marker genes; And a second promoter having an opposite transcriptional orientation to the first promoter and operatively linked to the first marker gene. That is, in the acceptor vector of the present invention, the non-accepting region located downstream of the second site-specific recombinase recognition sequence is referred to as a 'second site-specific recombinase recognition sequence-translation termination codon First marker gene-second promoter ".

상기 실시양태에서, 베이트 및 프레이 단백질의 상호작용에 의하여 숙주세포에서 재조합효소 리포터가 발현됨으로 인해 상기 수용벡터에 공여영역이 재조합되면, 상기 공여영역의 제2 마커(공여벡터로부터 유래된 것)가 상기 수용벡터의 제2 프로모터에 의한 번역 프레임에 통합되고(in frame) 발현된다. In this embodiment, when the donor region is recombined in the acceptor vector due to the expression of the recombinase reporter in the host cell by interaction of bait and prey protein, the second marker (derived from the donor vector) of the donor region (In frame) expressed in a translation frame by the second promoter of the accepting vector.

추가적으로, 본 발명의 수용 벡터는 상기 제2 프로모터의 하류에 순차적으로, 제2 마커 유전자; 및 제1 프로모터와 반대 전사 배향이며 상기 제2 마커 유전자와 작동 가능하게 연결된 제3 프로모터를 포함하는 형태로 이루어진 것 일 수 있다. 즉, 본 발명 수용벡터에서 제2 부위 특이적 재조합효소 인식 서열의 하류에 위치하는 비-수용영역이‘제2 부위 특이적 재조합효소 인식 서열-번역 종결 코돈이 제거된 제1 마커 유전자-제1 프로모터와 반대 전사 배향이며 상기 제1 마커 유전자와 작동 가능하게 연결된 제2 프로모터-제2마커 유전자-제1 프로모터와 반대 전사 배향이며 상기 제2 마커 유전자와 작동 가능하게 연결된 제3 프로모터’로 이루어지는 것 일 수 있다. In addition, the acceptor vector of the present invention may further comprise a second marker gene downstream of the second promoter; And a third promoter having an opposite transcriptional orientation to the first promoter and operatively linked to the second marker gene. That is, in the acceptor vector of the present invention, the non-accepting region located downstream of the second site-specific recombinase recognition sequence is referred to as a 'second site-specific recombinase recognition sequence-translation termination codon A second marker gene having an opposite transcriptional orientation to the first promoter and operatively linked to the first marker gene, a second marker gene having an opposite transcriptional orientation to the first marker gene and operably linked to the second marker gene Third promoter ".

상기 수용벡터의 제2 마커 유전자는 본 발명의 수용벡터로 형질전환된 세포를 선별하기 위한 목적으로 삽입되는 것일 수 있으며, 공여벡터에 삽입된 마커 유전자와 다른 것을 사용하는 것이 바람직하다. 벡터에 삽입 될 수 있는 통상의 마커 유전자에 대해서는 전술한 바와 같으며, 바람직하게 상기 수용벡터의 제2 마커 유전자는 항생제 저항성 유전자일 수 있다.The second marker gene of the acceptor vector may be inserted for the purpose of screening cells transformed with the acceptor vector of the present invention, and it is preferable to use a marker gene other than the marker gene inserted into the donor vector. Conventional marker genes that can be inserted into the vector are as described above, and preferably the second marker gene of the acceptor vector may be an antibiotic resistance gene.

본 발명의 상기 수용 벡터는 프로모터, 복제 기원, 오퍼레이터, 폴리아데닐화 신호, 인핸서 및 분비 신호 및 친화성 태그(affinity tag)로 이루어진 군에서 선택된 선택된 하나 이상을 추가로 포함할 수 있다. The acceptor vector of the present invention may further comprise at least one selected from the group consisting of a promoter, an origin of replication, an operator, a polyadenylation signal, an enhancer and an secretion signal, and an affinity tag.

상기 본 발명의 수용 벡터의 구현 일례로서, 본 발명은 플라스미드 pGADT7의 LEU2 유전자 말단에 loxP 서열을 삽입하고, 멀티플 클로닝 사이트(MCS)를 두 개의 Sfi I 제한효소 자리로 대체하고, 그 뒤로 바코드 삽입 부위, lox2272 서열이 순차적으로 도입된 것을 특징으로 하는 pAD-acc 벡터를 제공한다. As an embodiment of the acceptance vector of the present invention, the present invention is characterized in that a loxP sequence is inserted at the LEU2 gene end of the plasmid pGADT7, the multiple cloning site (MCS) is replaced with two Sfi I restriction sites, , and lox2272 sequences are sequentially introduced.

본 발명의 상기 pAD-acc 벡터는 pGADT7벡터를 기본으로 유전자 변형을 통하여 제조된 것으로 LEU2 유전자 말단(전사방향 기준)에 loxP 서열을 삽입하고, 멀티플 클로닝 사이트(MCS)를 두 개의 Sfi I 제한효소 자리로 대체하고, 그 뒤로 바코드 삽입 부위, lox2272 서열이 순차적으로 도입된 것을 특징으로 한다.The pAD-acc vector of the present invention was prepared through gene modification based on the pGADT7 vector. The pAD-acc vector was constructed by inserting the loxP sequence at the end of the LEU2 gene (based on the transcription direction) and introducing multiple cloning sites (MCS) into two Sfi I restriction sites , Followed by a barcode insertion site and a lox2272 sequence, which are sequentially introduced.

상기 pGADT7 벡터는 목적 단백질이 GAL4 activation 도메인(AD)에 결합(융합)하여 발현될 수 있도록 디자인 된 yeast two hybrid 벡터로 [도 3]의 개열지도와 같은 구조를 가진다.The pGADT7 vector is a yeast two hybrid vector designed to be expressed by binding (fusion) of a target protein to the GAL4 activation domain (AD), and has the same structure as that of the cleavage map of [Fig. 3].

상기 LEU2 유전자는 류신의 upstream 조절 인자로 일반적으로 효모의 스크리닝에 사용되며, pGADT7벡터에 기본적으로 포함된다. 상기 LEU2 유전자는 이와 작동가능하게 연결되어있는 LEU2 프로모터에 의해 발현이 조절된다. The LEU2 gene is an upstream regulator of leucine and is generally used for yeast screening and is basically contained in the pGADT7 vector. The LEU2 gene is regulated in its expression by an operably linked LEU2 promoter.

loxP 서열 및 lox2272 서열은 Cre recombinase에 인식되고 switching 되는 서열이다. 상기 pAD-acc 벡터에서 loxP 서열 및 lox2272 서열은 상호 간에 일정 간격으로 떨어져 벡터 내에 위치되며, 바람직하게 상호 간에 500 내지 4000bp(base pair) 범위의 간격으로 위치되는 것일 수 있다. 더욱 바람직하게 상기 loxP 서열 및 lox2272 서열은 상호 간에 500 내지 3000bp 범위의 간격으로, 가장 바람직하게는 700 내지 1200bp의 범위로 위치되는 것일 수 있다. 상기 pAD-acc 벡터의 loxP 서열 및 lox2272 서열은 동일 배향(same orientation)으로 위치된다. 또한 상기 pAD-acc 벡터의 loxP 서열 및 lox2272 서열은, 상기 pDBD-donor 벡터의 loxP 서열 및 lox2272 서열과 서로 동일한 상대배향으로 배열(또는 위치)되는 것이 바람직하다. 본 발명의 벡터는 LEU2 유전자 하단(전사방향 기준)에 loxP 서열이 위치하여, Cre recombinase에 의해 다른 서열(유전자)이 LEU2 하단에 결합하면 발현이 이루어지게 구성되어 있다. 이를 위하여 loxP 서열이 도입되는 LEU2 유전자 말단은 종결코돈을 제거하여 발현시 LEU2 말단에서 발현이 중단되지 않도록 구성되어 있다. 또한 lox2272 서열 앞에 바코드 서열 삽입부위를 도입하여, 상기 바코드 서열 삽입부위에 삽입된 바코드 서열이 Cre recombinase에 의해 이동된 다른 바코드 서열(즉, pDBD-donor 벡터로부터의 바코드 서열)과 함께 결합 또는 인접 되도록 구성되어 있다. 도 5에서 Cre recombinase에 의하여 pDBD-donor 벡터로부터 일부 서열(양 말단이 각각 loxP 및 lox2272에 의하여 flanking 되어있는 서열)이 pAD-acc 벡터로 switch 된 후의 벡터의 개열지도를 도시하며, 이러한 벡터의 switch 과정 및 결과물을 도 14에서 도시한다. The loxP sequence and the lox2272 sequence are sequences recognized and switched to Cre recombinase. The loxP sequence and the lox2272 sequence in the pAD-acc vector are spaced apart from each other by a predetermined distance and are preferably located within the vector, preferably at intervals of 500 to 4000 bp (base pair) . More preferably, the loxP sequence and the lox2272 sequence may be located at an interval in the range of 500 to 3000 bp, and most preferably in the range of 700 to 1200 bp, relative to each other. The loxP sequence and the lox2272 sequence of the pAD-acc vector are located in the same orientation. The loxP sequence and the lox2272 sequence of the pAD-acc vector are preferably arranged (or positioned) in the same relative orientation as the loxP sequence and the lox2272 sequence of the pDBD-donor vector. The vector of the present invention is constructed so that the loxP sequence is located at the lower end of the LEU2 gene (based on the transcription direction), and expressed by Cre recombinase when another sequence (gene) binds to the lower end of LEU2. For this purpose, the end of the LEU2 gene in which the loxP sequence is introduced is constructed so as not to stop the expression at the end of LEU2 upon elimination of the stop codon. In addition, a barcode sequence insertion site is introduced in front of the lox2272 sequence so that the barcode sequence inserted at the barcode sequence insertion site is bonded or adjacent to another barcode sequence (i.e., a barcode sequence from the pDBD-donor vector) moved by Cre recombinase Consists of. FIG. 5 shows a cleavage map of a vector after a partial sequence (both sequences flanked by loxP and lox2272) from the pDBD-donor vector was switched to pAD-acc vector by Cre recombinase. The process and the result are shown in Fig.

상기‘멀티플 클로닝 사이트(MCS)를 두 개의 Sfi I 제한효소 자리로 대체’는, 상기 기존 벡터의 MCS를 목적 단백질에 대한 유전자 삽입부위로 만드는 것을 의미한다. 상기 유전자 삽입부위는 라이브러리를 구성하는 목적 단백질의 유전자가 삽입될 수 있는 부위로 임의의 제한효소 인식부위를 포함하여 원하는 유전자를 도입할 수 있게 하는 것이 바람직하며, 상기 제한효소는 공지의 제한효소로 그 종류가 특별히 제한되지 아니하나, 바람직하게는 두 개의 Sfi I 일 수 있다. 상기 유전자 삽입부위에 삽입되는 유전자는 pDBD-donor 벡터에 도입되는 유전자와 상호 interaction을 알고자 하는 목적 유전자로서 그 종류는 특별히 제한되지 아니한다.Replacing the 'multiple cloning site (MCS) with two Sfi I restriction enzyme sites' means making the MCS of the existing vector a gene insertion site for the target protein. It is preferable that the gene insertion site allows a desired gene to be introduced by including an arbitrary restriction enzyme recognition site as a site into which a gene of a target protein constituting the library can be inserted, and the restriction enzyme is a known restriction enzyme The kind thereof is not particularly limited, but preferably it can be two Sfi I. The gene to be inserted into the gene insertion site is a target gene to be mutually interacted with a gene introduced into the pDBD-donor vector, and its kind is not particularly limited.

상기 바코드 서열 삽입부위는 상기 pAD-acc 벡터의 유전자 삽입부위(두 개의 Sfi I 제한효소 자리 사이)에 도입되는 프레이 단백질 유전자를 표시하는 서열로 뉴클레오티드 수는 특별히 제한되지 아니하나, 1개 내지 20개의 뉴클레오티드로 구성될 수 있으며, 바람직하게는 5개 내지 15개의 뉴클레오티드로 구성될 수 있다. 상기 바코드 서열 삽입부위는 임의의 제한효소 인식부위를 포함하여 원하는 바코드를 도입할 수 있게 하는 것이 바람직하며, 상기 제한효소는 공지의 제한효소로 그 종류가 특별히 제한되지 아니하나, 바람직하게는 BsiW I, XbaI 및 Sac II의 제한효소 일 수 있으며, 예를 들어 BsiW I 및 Sac II의 세트 또는 XbaI 및 Sac II 세트를 사용할 수 있다.The barcode sequence insertion site is a sequence representing a freeprotein gene introduced into a gene insertion site (between two SfiI restriction enzyme sites) of the pAD-acc vector. The number of nucleotides is not particularly limited, but 1 to 20 Nucleotides, preferably 5 to 15 nucleotides. It is preferable that the barcode sequence insertion site includes an arbitrary restriction enzyme recognition site so that a desired barcode can be introduced. The restriction enzyme is a known restriction enzyme and its kind is not particularly limited. Preferably, the restriction enzyme is a BsiW I , XbaI and SacII, for example a set of BsiW I and Sac II or a set of XbaI and Sac II.

본 발명의 pAD-acc 벡터는 바람직하게는 [도 1] 또는 [도 10]의 개열지도로 나타내어질 수 있다. 도 1과 도 10의 개열지도는 바코드 삽입부위에 포함되는 제한효소 인식 서열에서 차이가 있을 뿐 이외의 다른 구성은 모두 동일하다. 도 1의 개열지도로 표시되는 pAD-acc 벡터의 바코드 삽입부위에는 BsiW I 및 Sac II의 제한효소 인식 서열이 포함되어있으며 도 10의 개열지도로 표시되는 pAD-acc 벡터의 바코드 삽입부위에는 XbaI 및 Sac II의 제한효소 인식서열이 포함되어 있다. The pAD-acc vector of the present invention can be preferably represented by a cleavage map of [Figure 1] or [Figure 10]. The cleavage maps of FIGS. 1 and 10 are identical except for the restriction enzyme recognition sequence included in the barcode insertion site. The barcode insertion site of the pAD-acc vector represented by the cleaved map in Fig. 1 contains the restriction enzyme recognition sequence of BsiW I and Sac II, and the bar code insertion site of the pAD-acc vector represented by the cleaved map of Fig. Contains the restriction enzyme recognition sequence of Sac II.

상기 도 1의 개열지도로 표시되는 pAD-acc 벡터는 바람직하게 서열번호 16의 염기서열로 이루어지는 것 일 수 있다.The pAD-acc vector represented by the cleaved map in Fig. 1 may preferably consist of the nucleotide sequence of SEQ ID NO: 16.

상기 도 10의 개열지도로 표시되는 pAD-acc 벡터는 바람직하게 서열번호 17의 염기서열로 이루어지는 것 일 수 있으며, 본 발명자에 의하여 기탁번호 KCTC12791BP로 기탁되었다. The pAD-acc vector represented by the cleaved map in FIG. 10 may preferably consist of the nucleotide sequence shown in SEQ ID NO: 17, and deposited by the present inventor with the accession number KCTC12791BP.

본 발명은 상기 공여벡터 및 상기 수용벡터를 포함하는, 단백질 상호작용 검출을 위한 키트(kit)를 제공한다. The present invention provides a kit for protein interaction detection comprising the donor vector and the acceptor vector.

본 발명에 따른 단백질 상호작용 검출 키트는 상기 공여벡터 및 수용벡터 외에도, 상기 벡터들에 목적 핵산을 삽입시키기 위한 제한효소, 프라이머, 완충용액 등의 재료(material)와 제조된 벡터를 세포에 도입시키기 위한 트랜스펙션 제제, 모세포주 등을 비롯하여 형질전환 된 세포주의 선별에 필요한 모든 생물학적 또는 화학적 시약을 포함할 수 있다. 또한 본 발명의 키트는 필요에 따라 각 성분들을 혼합하는데 사용될 튜브, 웰 플레이트 등의 실험도구들과 사용방법을 기재한 지시자료(사용설명서) 등을 추가로 포함할 수 있다. 이 외에도, 본 발명의 키트의 구성은 당업자에 의하여 적절히 선택될 수 있다.In addition to the donor and acceptor vectors, the kit for protein interaction detection according to the present invention may further comprise a material such as a restriction enzyme, a primer, or a buffer for inserting a target nucleic acid into the vectors, And all biological or chemical reagents necessary for screening of transformed cell lines, including, for example, transfection agents, < RTI ID = 0.0 > In addition, the kit of the present invention may further include experimental tools such as a tube and a well plate to be used for mixing the components as needed, and instructional materials (instruction manuals) describing the methods of use. In addition, the construction of the kit of the present invention can be suitably selected by those skilled in the art.

또한 본 발명은, 상기 공여벡터 및 수용벡터를 이용하여 단백질간의 상호작용을 검출하는 방법을 제공한다. 구체적으로,The present invention also provides a method for detecting protein interactions using the donor and acceptor vectors. Specifically,

(a) 상기 공여벡터에 베이트(bait) 단백질 코딩 서열 및 상기 베이트 단백질을 표시하는 바코드 서열을 도입하여 베이트 라이브러리를 제작 하는 단계;(a) preparing a bait library by introducing a bait protein coding sequence and a barcode sequence representing the bait protein into the donor vector;

(b) 상기 수용벡터에 프레이(prey) 단백질 코딩 서열 및 상기 프레이 단백질을 표시하는 바코드 서열을 도입하여 프레이 라이브러리를 제작하는 단계;(b) introducing a prey protein coding sequence and a barcode sequence representing the pre-protein into the acceptor vector to prepare a pre-library;

(c) 상기 베이트 라이브러리 및 프레이 라이브러리를 리포터로서 재조합효소를 발현하는 숙주세포에 도입하는 단계; 및(c) introducing the bait library and the prey library into a host cell expressing the recombinant enzyme as a reporter; And

(c) 상기 숙주세포로부터 리포터 발현 여부를 조사하여 베이트-프레이 단백질 결합 쌍들을 검출하는 단계를 포함하는, 단백질 상호작용 검출 방법.(c) detecting the expression of the reporter from the host cell and detecting bait-prey protein binding pairs.

본 발명에서 제공하는 단백질 상호작용 검출방법은 기존 이중-하이브리드 시스템을 근간으로 하고 있으나, 전술한 본 발명의 공여벡터 및 수용벡터를 이용함으로서 단백질 라이브러리간(베이트 단백질 라이브러리 및 프레이 단백질 라이브러리)에서 동시 다발적으로 일어나는 단백질 상호작용 검출을 가능하게 한다. 뿐만아니라 각 벡터에 포함된 바코드 서열을 이용하여, 라이브러리 간 단백질 반응에 있어서 서로 상호작용하는 단백질들을 규명하기 위한 대량의 정보처리에 있어 이점을 제공한다.  The protein interaction detection method provided in the present invention is based on the existing dual-hybrid system. However, by using the above-described donor vector and acceptor vector of the present invention, it is possible to detect the protein interactions between the protein libraries (Bait protein library and pre- This allows for the detection of protein interactions that occur as a result. In addition, using the bar code sequences contained in each vector, it provides an advantage in the processing of large amounts of information to identify proteins that interact with each other in library protein reactions.

상기‘베이트 라이브러리’는 서로 상이한 베이트 단백질을 코딩하는 핵산의 총 집합체를 의미한다. 본 발명에서 상기 베이트 라이브러리는 본 발명의 상기 공여벡터 각각에 대하여 서로 다른 베이트 단백질 코딩 서열과 상기 베이트 단백질을 표시하는 바코드 서열을 삽입함으로서 제조된다. The 'bait library' refers to a total collection of nucleic acids encoding mutated bait proteins. In the present invention, the bait library is prepared by inserting different bait protein coding sequences and a barcode sequence representing the bait protein for each of the donor vectors of the present invention.

상기‘프레이 라이브러리’는 서로 상이한 프레이 단백질을 코딩하는 핵산의 총 집합체를 의미한다. 본 발명에서 상기 프레이 라이브러리는 본 발명의 상기 수용벡터 각각에 대하여 서로 다른 프레이 단백질 코딩 서열과 상기 프레이 단백질을 표시하는 바코드 서열을 삽입함으로서 제조된다. The term 'prey library' refers to a total collection of nucleic acids encoding different prey proteins. In the present invention, the prey library is prepared by inserting a different pre-protein coding sequence and a bar code sequence representing the pre-protein for each of the acceptance vectors of the present invention.

한편 상기 라이브러리의 제조에 있어서, 본 발명에서 사용되는 표준 재조합 DNA 및 분자 클로닝 기술은 당해 분야에 널리 공지되어 있고, 다음 문헌에 기재되어 있는 것을 참고로 할 수 있다(Sambrook, J., Fritsch, E. F. and Maniatis, T., Molecular Cloning: A Laboratory Manual, 2nd ed., Cold Spring Harbor Laboratory: Cold Spring Harbor, NY (1989); by Silhavy, T. J., Bennan, M. L. and Enquist, L. W., Experiments with Gene Fusions, Cold Spring Harbor Laboratory: Cold Spring Harbor, NY (1984); and by Ausubel, F. M. et al., Current Protocols in Molecular Biology, published by Greene Publishing Assoc. and Wiley-lnterscience (1987)).In the meantime, standard recombinant DNA and molecular cloning techniques used in the present invention are well known in the art and can be found in the following references (Sambrook, J., Fritsch, EF and Maniatis, T., Molecular Cloning: A Laboratory Manual, 2nd ed., Cold Spring Harbor Laboratory, Cold Spring Harbor, NY (1989); by Silhavy, TJ, Bennan, ML and Enquist, LW, Experiments with Gene Fusions, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY (1984); and by Ausubel, FM et al., Current Protocols in Molecular Biology, published by Greene Publishing Assoc. And Wiley-lnterscience (1987)).

상기 숙주세포는 원핵세포 또는 진핵세포 일 수 있다. 예를 들어 진핵세포는 균류(ex. 효모), 곤충 및 포유동물 세포 등을 포함하는 종류 일 수 있으며, 원핵세포로는 박테리아(ex. 대장균(Escherichia coli)) 등을 포함할 수 있으나, 이에 제한되지 않는다. The host cell may be a prokaryotic or eukaryotic cell. For example, eukaryotic cells may be of the species including fungi (yeast), insects and mammalian cells, and prokaryotic cells may include bacteria (e.g., Escherichia coli ) It does not.

본 발명에서 상기 숙주세포는 리포터로서 재조합효소를 발현하는 것이 그 특징으로, 상기 재조합 효소는 상기 (a) 단계에서 사용된 공여벡터 및 (b) 단계에서 사용된 수용벡터에 삽입되어있는 부위-특이적 재조합효소 인식 서열을 인식할 수 있는 재조합효소인 것이 바람직하다. 상기 공여벡터 및 수용벡터 내에 포함되는 부위-특이적 재조합효소 인식 서열과 숙주세포가 리포터로서 발현하는 재조합 효소간의 특이적 관계 및 이를 이용한 재조합 시스템은 전술한 바와 같이 당업계에 공지되어있으며, 당업자는 이를 이용하여 본 발명의 단백질 상호작용 검출방법의 구성을 조합할 수 있다. In the present invention, the host cell expresses a recombinant enzyme as a reporter, and the recombinant enzyme is inserted into the donor vector used in the step (a) and the site-specific It is preferably a recombinant enzyme capable of recognizing the recombinase recognition sequence. The specific relationship between the site-specific recombinase recognition sequence contained in the donor vector and the acceptor vector and the recombinase expressed by the host cell as a reporter and the recombination system using the same are known in the art as described above, And the constitution of the protein interaction detection method of the present invention can be combined using this.

한편, 상기 숙주세포로서 본 발명은 하기 (i) 및 (ii)의 발현 카세트를 동시에 포함하는 이중(dual) 리포터 효모 균주를 제공한다;On the other hand, as the host cells, the present invention provides dual reporter yeast strains simultaneously containing the expression cassettes of (i) and (ii) below;

(i) 순차적으로 작동 가능하게 연결되며 GAL4 UAS(upstream activation sequence), GAL1 프로모터, MFα1 유전자, c-myc 에피토프 코딩 폴리뉴클레오티드 및 AgαI 유전자를 포함하는 c-myc 리포터 발현 카세트; 및 (i) a c-myc reporter expression cassette comprising a GAL4 upstream activation sequence, GAL1 promoter, MFα1 gene, c-myc epitope-encoding polynucleotide and AgαI gene operably linked in sequence; And

(ii) 순차적으로 작동 가능하게 연결되며 GAL4 UAS(upstream activation sequence), GAL1 프로모터 및 Cre 재조합효소(Cre recombinase) 발현 유전자를 포함하는 Cre 리포터 발현 카세트.(ii) a Cre reporter expression cassette comprising a GAL4 upstream activation sequence, GAL1 promoter and Cre recombinase expression gene operably linked in sequence.

본 발명에서 용어‘발현 카세트’는 ‘발현 구조체’와 호환성 있게 사용되며, 목적하는 구조 유전자를 발현할 수 있는 핵산 구조체를 의미하는 것으로, 세포에 따라 적절한 프로모터 및 이와 작동가능 하게 연결된 구조 유전자 등을 포함한다. In the present invention, the term 'expression cassette' refers to a nucleic acid construct which is used interchangeably with an 'expression construct' and is capable of expressing a desired structural gene. The expression cassette may include a suitable promoter and a structural gene operably linked thereto, .

상기 이중 리포터 효모 균주는, 상기 (i)의 발현 카세트에 의한 c-myc 리포터 시스템(도 11의 A에 도시) 및 (ii)의 발현 카세트에 의한 Cre 리포터 시스템(도 11의 B에 도시)의 이중 리포터 시스템을 가지는 것이 그 특징이다. The double-reporter yeast strain contains the Cre reporter system (shown in Fig. 11B) by the c-myc reporter system (shown in Fig. 11A) by the expression cassette of (i) and the expression cassette of (ii) It is characterized by having a dual reporter system.

상기 효모 균주는 효모 이중 보합계(yeast two hybrid)에 사용될 수 있는 균주는 어떤 것이든 가능하며, 예를 들어 사카로마이세스 속(Saccharomyces spp.), 클루이베로미세스 속(Kluyveromyces spp.), 시조사카로마이세스 속(Schizosaccharomyces spp.), 피키아 속(Pichia spp.), 파피아 속(Paffia spp.), 칸디다 속(Candida spp.), 탈라로미세스 속(Talaromyces spp.), 브레타노미세스 속(Brettanomyces spp.), 파키솔렌 속(Pachysolen spp.) 또는 데바리오미세스 속(Debaryomyces spp.) 등을 포함하며, 이에 제한하지 않는다. The yeast strain may be any yeast two hybrid strain. Examples of such strains include Saccharomyces spp., Kluyveromyces spp. Such as Schizosaccharomyces spp., Pichia spp., Paffia spp., Candida spp., Talaromyces spp., Bretanomis spp. and the like in (Brettanomyces spp.), Parkinson solren in (Pachysolen spp.) or Deva Rio in MRS (Debaryomyces spp.), is not limited to this.

바람직하게는 사카로마이세스 속 균주일 수 있으며, 더욱 바람직하게는 사카로마이세스 세레비지애(Saccharomyces cerevisiae) 균주 일 수 있다.The strain may be preferably a strain of the genus Saccharomyces, more preferably a strain of the genus Saccharomyces cerevisiae .

상기 (i)의 c-myc 리포터 발현 카세트는 본 명세서에서‘1st 리포터’ 또는 ‘1st 리포터 시스템’등으로 지칭 될 수 있으며, 순차적으로 작동 가능하게 연결되어있는 GAL4 UAS(upstream activation sequence), GAL1 프로모터, MFα1 유전자, c-myc 에피토프 코딩 폴리뉴클레오티드 및 AgαI 유전자가 포함된 것이 그 특징이다. The c-myc reporter expression cassette of (i) may be referred to herein as a '1st reporter' or a '1st reporter system', and may include a GAL4 upstream activation sequence, a GAL1 promoter, , MF alpha 1 gene, c-myc epitope-encoding polynucleotide and Ag alpha I gene.

상기 GAL4 UAS는 GAL4 전사인자의 DNA 결합 도메인(DBD)이 결합 할 수 있는 서열을 말한다. GAL4 전사인자를 이용하는 이중-하이브리드 시스템에 있어서, GAL4 전사인자의 DNA 결합 도메인(DBD)과 전사활성 도메인(AD)은 각각 베이트 및 프레이 단백질과 융합(이들은 통상 각각 DBD-Bait 및 AD-Prey로 불림)되어 효모 균주 내에서 발현되며, DBD-Bait 및 AD-Prey가 상호작용하면 GAL4 전사인자가 작동하여 하위에 작동 가능하게 연결된 리포트(report) 서열의 전사가 일어나게 된다. The GAL4 UAS refers to a sequence to which the DNA binding domain (DBD) of the GAL4 transcription factor can bind. In a dual-hybrid system using a GAL4 transcription factor, the DNA binding domain (DBD) and the transcriptional activation domain (AD) of the GAL4 transcription factor are respectively fused with bait and pre-protein (these are usually referred to as DBD-Bait and AD-Prey, ) And expressed in yeast strains. When DBD-Bait and AD-Prey interact, the GAL4 transcription factor is activated and a report sequence that is operatively linked to the lower level is transcribed.

GAL1 프로모터는 GAL4 UAS의 하류에 작동가능하게 연결되며, 본 발명에서 상기 GAL1 프로모터의 핵산서열은 이에 제한되지 않으나, 예를 들어 서열번호 24의 염기서열로 이루어지는 것일 수 있다. The GAL1 promoter is operably linked downstream of the GAL4 UAS. In the present invention, the nucleic acid sequence of the GAL1 promoter is not limited thereto, but may be, for example, the nucleotide sequence of SEQ ID NO: 24.

MFα1 유전자는, 효모에서 외래 유전자에 의한 단백질(본 발명에서 c-myc 에피토프)의 분비를 위한 분비 신호 인자이다. 본 발명에서 상기 MFα1 유전자의 핵산 서열은 이에 제한되지 않으나, 예를 들어 서열번호 25의 염기서열로 이루어지는 것 일 수 있다. The MF? 1 gene is a secretory signaling factor for the secretion of a protein (c-myc epitope in the present invention) by a foreign gene in yeast. In the present invention, the nucleic acid sequence of the MFα1 gene is not limited thereto, but may be, for example, a nucleotide sequence of SEQ ID NO: 25.

c-myc 에피토프(epitope, 항원결정기) 코딩 폴리뉴클레오티드는 Myc 단백질 중 특정 에피토프만을 발현하도록 구성되었다. 본 발명의 상기 c-myc 에피토프 코딩 폴리뉴클레오티드의 서열구성은 이에 제한되지 않으나, 예를 들어 서열번호 26의 염기서열로 이루어지는 것 일 수 있다. 상기 c-myc 에피토프는, 상기 c-myc 에피토프의 반복체(즉, 첫번째 c-myc 에피토프에 연결되어 수회 반복하여 발현된 것)를 의미하는 것 수 있다. 상기 반복 횟수는 특별히 제한되지 아니하나, 1회 내지 20회 일 수 있으며, 바람직하게는 1회 내지 10회 일 수 있다.The c-myc epitope (antigenic determinant) coding polynucleotide was constructed to express only a specific epitope of the Myc protein. The sequence structure of the c-myc epitope-encoding polynucleotide of the present invention is not limited thereto, but may be, for example, the nucleotide sequence of SEQ ID NO: 26. The c-myc epitope may be a repetitive form of the c-myc epitope (i.e., a c-myc epitope linked to the first c-myc epitope and repeatedly expressed). The number of repeating times is not particularly limited, but may be 1 to 20 times, preferably 1 to 10 times.

Agα1 유전자는 효모 균주의 세포 표면 당단백질인 알파-아글루티닌(α-agglutinin)을 발현하는 유전자이다. 상기 Agα1 유전자는 c-myc 에피토프 코딩 폴리뉴클레오티드와 연결되어 있다. 따라서 yeast two hybrid 실험 시 bait와 prey가 상호작용하는 경우, 알파-아글루티닌이 c-myc 에피토프와 함께 세포 표면에 발현되므로 세포 표면에 c-myc 에피토프가 노출된다. 본 발명에서 상기 Agα1 유전자의 핵산 서열은 이에 제한되지 않으나, 예를 들어 서열번호 28의 염기서열로 이루어지는 것 일 수 있다. Agα1 gene is a gene that expresses alpha-agglutinin, a cell surface glycoprotein of yeast strain. The Ag [alpha] l gene is linked to a c-myc epitope-encoding polynucleotide. Therefore, when bait and prey interact with each other in yeast two hybrid experiments, alpha-agglutinin is expressed on the cell surface together with the c-myc epitope, so that the c-myc epitope is exposed on the cell surface. In the present invention, the nucleic acid sequence of the Agα1 gene is not limited thereto, but may be, for example, a nucleotide sequence of SEQ ID NO: 28.

상기 (i) c-myc 리포터 발현 카세트에서, c-myc 에피토프 코딩 폴리뉴클레오티드 및 AgαI 유전자는 상기 핵산이 직접 연결되는 것 일 수 있고 도는 링커에 의해 연결되는 것 일 수 있다. In the above (i) c-myc reporter expression cassette, the c-myc epitope-encoding polynucleotide and the Ag? I gene may be those in which the nucleic acid is directly linked or linked by a linker.

본 발명에서 상기 용어‘링커(linker)’는 두 핵산 사이를 연결하는 임의의 핵산서열을 의미한다. 본 발명에서 상기 c-myc 에피토프 코딩 폴리뉴클레오티드 및 AgαI 유전자를 연결하는 링커는 그 서열구성이 특별히 제한되지 않으나, 바람직하게 글리신(Glycine) 또는/ 및 세린(Serine)으로 이루어지는 펩타이드 단편을 코딩하는 핵산서열 일 수 있다. 상기‘글리신 또는/ 및 세린으로 이루어지는 펩타이드 단편’은 펩타이드 단편을 이루는 글리신과 세린의 개수 및 조합이 특별히 제한되지 않으며, 당업자라면 목적하는 바에 따라 상기 링커의 구성을 용이하게 설정할 수 있음이 자명하다. 일례로 본 발명에서 상기 c-myc 에피토프 코딩 폴리뉴클레오티드 및 AgαI 유전자를 연결하는 링커는 서열번호 27의 염기서열로 이루어지는 것 일 수 있다. The term " linker " in the present invention means any nucleic acid sequence linking two nucleic acids. In the present invention, the linker connecting the c-myc epitope-encoding polynucleotide and the Ag? I gene is not particularly limited in its sequence structure but preferably has a nucleic acid sequence encoding a peptide fragment comprising glycine or / and serine Lt; / RTI > The number and combination of glycine and serine constituting the peptide fragment are not particularly limited, and it is obvious to those skilled in the art that the structure of the linker can be easily set according to the purpose. For example, in the present invention, the linker connecting the c-myc epitope-encoding polynucleotide and the Ag? I gene may comprise the nucleotide sequence of SEQ ID NO: 27.

가장 바람직하게 상기 (i)의 c-myc 리포터 발현 카세트는 GAL4 UAS의 하류에 서열번호 13으로 표시되는 DNA 서열이 작동가능하게 연결된 것 일 수 있다. 상기 서열번호 13의 DNA 서열은 c-myc 에피토프의 10회 반복체가 삽입되어있는 것이 특징이다. Most preferably, the c-myc reporter expression cassette of (i) may be operably linked to the DNA sequence represented by SEQ ID NO: 13 downstream of the GAL4 UAS. The DNA sequence of SEQ ID NO: 13 is characterized in that 10 repeats of the c-myc epitope are inserted.

상기 이중 리포터 효모 균주에 도입된 bait와 prey가 상호작용하여 GAL4 전사인자를 작동시키면 하위 Myc단백질(특히, c-myc 에피토프)이 세포 표면에 발현이 되고, 이를 검출(detection)하는 방법으로 bait와 prey의 상호작용 여부를 확인할 수 있다.When the bait and prey introduced into the double-reporter yeast strain interact with each other to activate the GAL4 transcription factor, the sub Myc protein (particularly the c-myc epitope) is expressed on the cell surface and detected by bait You can see if prey is interacting.

상기 Myc 단백질의 세포 표면 발현을 검출하는 방법은 공지의 단백질 detection 방법에 의할 수 있으며, 바람직하게는 Myc 단백질(특히, c-myc 에피토프)에 특이적으로 결합하는 항체 및 식별가능한 표지를 포함하며 상기 항체에 특이적으로 결합하는 항체에 의한 검출 방법일 수 있다.  The method for detecting the cell surface expression of the Myc protein can be performed by a known protein detection method, and preferably includes an antibody specifically binding to the Myc protein (particularly the c-myc epitope) and an identifiable label And may be a detection method by an antibody that specifically binds to the antibody.

상기 항체를 사용하는 경우, 항체의 결합 특이성을 이용하는 공지의 세포 검출 또는 세포 선별 방법을 사용하는 것일 수 있으며, 이에 제한되지 않으나 Magnetic-activated cell sorting (MACS) 방법에 의한 것 일 수 있다. When the antibody is used, known cell detection or cell sorting methods using the binding specificity of the antibody may be used, but may be by a magnetic-activated cell sorting (MACS) method.

상기 식별 가능한 표지는 바람직하게는 형광물질 일 수 있으며, 더욱 바람직하게는 시아닌 계열의 형광물질 일 수 있다. 상기 형광물질의 발현을 detection하는 방법은 공지의 형광 분석 방법이면 특별히 제한되지 아니하며, 바람직하게는 형광 분석 및 형광 발현 세포의 분류가 가능한 FACS(Fluorescence-activated cell sorting) 방법, 형광현미경 등에 의할 수 있다.The identifiable label may preferably be a fluorescent substance, and more preferably a fluorescent substance of the cyanine series. The method for detecting the expression of the fluorescent substance is not particularly limited as long as it is a known fluorescence analysis method. Preferably, the method can be applied to a fluorescence-activated cell sorting (FACS) method, a fluorescence microscope have.

상기 (ii)의 Cre 리포터 발현 카세트는 본 명세서에서‘2nd 리포터’또는 ‘2nd 리포터 시스템’등으로 지칭 될 수 있으며, 순차적으로 작동 가능하게 연결되며 GAL4 UAS(upstream activation sequence), GAL1 프로모터 및 Cre 재조합효소(Cre recombinase) 발현 유전자를 포함하는 것이 특징이다. The Cre reporter expression cassette of (ii) above may be referred to herein as a " 2nd Reporter " or a " 2nd Reporter System ", and is operably linked in sequence and comprises GAL4 upstream activation sequence, GAL1 promoter and Cre recombination Enzyme (Cre recombinase) expression gene.

상기 GAL4 UAS(upstream activation sequence) 및 GAL1 프로모터는 전술한 바와 같다. 상기‘Cre 재조합효소(Cre recombinase) 발현 유전자’는 본 명세서에서‘CRE 유전자’등의 용어와 호환성 있게 사용된다. 상기 Cre 재조합효소는 P1 박테리아파지에서 유래되는 티로신 재조합 효소로서, Cre-Lox site 재조합을 유발하는데 활용되는 효소로서 알려져 있다. 공지의 Cre 재조합효소 활성을 가지는 단백질을 코딩 하는 한, 본 발명에서 상기 Cre 재조합효소 발현 유전자의 구체적인 염기서열은 특별히 제한되지 않으나, 예를 들어 서열번호 29의 염기서열로 이루어지는 것 일 수 있다. The GAL4 upstream activation sequence (UAS) and the GAL1 promoter are as described above. The 'Cre recombinase expression gene' is used interchangeably with the term 'CRE gene' in the present specification. The Cre recombinase is a tyrosine recombinase derived from P1 bacterial phage, and is known as an enzyme used for inducing Cre-Lox site recombination. As long as a protein having a known Cre recombinase activity is encoded, the specific nucleotide sequence of the Cre recombinase expression gene in the present invention is not particularly limited, but may be, for example, a nucleotide sequence of SEQ ID NO: 29.

가장 바람직하게 (ii)의 Cre 리포터 발현 카세트는 GAL4 UAS 의 하류에 서열번호 14로 표시되는 DNA 서열이 작동가능하게 연결된 것 일 수 있다. Most preferably, the Cre reporter expression cassette of (ii) may be operably linked to the DNA sequence represented by SEQ ID NO: 14 downstream of the GAL4 UAS.

상기 이중 리포터 효모 균주에 도입된 bait와 prey가 상호작용하여 GAL4 전사인자를 작동시키면 Cre 재조합효소가 발현된다. 따라서 상기 Cre 재조합효소를 직접 검출(detection)하거나, 상기 Cre 재조합효소가 발현됨으로 인해 세포 내에 발생된 유전적인 변화를 탐지하는 방법으로 bait와 prey의 상호작용 여부를 확인할 수 있다.When the bait and prey introduced into the double reporter yeast strain interact with each other to activate the GAL4 transcription factor, the Cre recombinase is expressed. Therefore, it is possible to directly detect the Cre recombinase or to detect the genetic change generated in the cell due to the expression of the Cre recombinase, thereby confirming whether or not the bait and prey interact with each other.

상기 Cre 재조합효소를 직접 검출하는 방법은 공지의 단백질 검출 방법에 의할 수 있으며, 바람직하게는 Cre 재조합효소에 특이적으로 결합하는 항체 및 식별가능한 표지를 포함하며 상기 항체에 특이적으로 결합하는 항체에 의한 검출 방법일 수 있다. 상기 식별 가능한 표지는 당업계에 단백질 또는 항체표지 물질로 사용되는 것이라면 그 종류가 특별히 제한되지 않으나, 바람직하게는 형광물질 일 수 있다. 상기 형광물질의 발현을 검출하는 방법은 공지의 형광 분석 방법이면 특별히 제한되지 아니하며, 바람직하게는 형광 분석 및 형광 발현 세포의 분류가 가능한 FACS(Fluorescence-activated cell sorting) 방법, 형광현미경 등에 의할 수 있다.The method for directly detecting the Cre recombinase may be a known protein detection method, preferably an antibody that specifically binds to the Cre recombinase and an antibody that specifically binds to the antibody, As shown in FIG. The kind of the label is not particularly limited as long as it is used in the art as a protein or an antibody labeling substance, but it may preferably be a fluorescent substance. The method of detecting the expression of the fluorescent substance is not particularly limited as long as it is a known fluorescence analysis method. Preferably, the method can be applied to a fluorescence-activated cell sorting (FACS) method capable of fluorescence analysis and classification of a fluorescently expressed cell, have.

상기 Cre 재조합효소가 발현됨으로 인해 세포 내에 발생된 유전적인 변화를 탐지하는 방법으로는, 구체적으로 Cre-lox 재조합 시스템(Cre-lox recomination system)을 본 발명의 효모에 도입하여 세포 내 핵산들의 변화를 탐지하는 방법일 수 있다. 이를 위해서는 bait 및 prey 단백질을 효모 세포 내에 발현시키기 전에, 효모 균주의 유전체 또는/및 상기 효모 균주에 도입될 외래 핵산(예를들어, 벡터 등)에 하나 이상의 lox site를 도입하는 사전 작업이 필요할 수 있다. 상기 lox site에 대해서는 전술한 바와 같다. As a method for detecting a genetic change generated in a cell due to expression of the Cre recombinase, specifically, a Cre-lox recombination system is introduced into the yeast of the present invention, It can be a way to detect. This may require prior work to introduce one or more lox sites into the genome of the yeast strain and / or into the foreign nucleic acid (e. G., Vector, etc.) to be introduced into the yeast strain before the bait and prey proteins are expressed in yeast cells have. The lox site is as described above.

Cre 재조합효소가 발현되면 lox site를 함유하는 핵산 영역 간에 재조합이 일어나 핵산 서열에 변화가 생기게 되며, 상기 변화된 핵산 서열은 실질적인 변화 표현형(phenotype)을 나타낼 수 있다. When the Cre recombinase is expressed, recombination occurs in the nucleic acid region containing the lox site, resulting in a change in the nucleic acid sequence, and the altered nucleic acid sequence can exhibit a substantial phenotype.

상기 변화된 핵산서열은 공지의 시퀀싱(sequencing) 방법에 의하여 탐지(규명) 될 수 있다. 상기 시퀀싱 방법으로는 이에 제한되지 않으나, Sanger sequencing 또는 NGS(Next generation sequencing)등의 방법에 의해 수행될 수 있다. The altered nucleic acid sequence may be detected by a known sequencing method. The sequencing method is not limited thereto, but may be performed by a method such as Sanger sequencing or NGS (Next Generation Sequencing).

또한, 상기 변화된 핵산서열로 인하여 세포에 변화된 표현형이 나타나는 경우에는 상기 변화 표현형을 검출하여 bait 및 prey 단백질 간에 상호작용을 판정할 수 있다. In addition, if the altered phenotype appears in the cell due to the changed nucleic acid sequence, the interaction phenotype may be detected to determine the interaction between the bait and prey proteins.

상기 변화 표현형이란, 기존에 나타내지 않던 표현형을 새롭게 나타내는 것 또는 표현형의 조합을 모두 포함하는 의미이다. The change expression type is meant to include both a new expression of a phenotype not previously shown or a combination of a phenotype.

기존에 나타내지 않던 표현형을 새롭게 나타내는 경우는, 예를 들어, 사전에 어떠한 번역 프레임(frame)에도 속하지 않는 마커 유전자 근처에 하나 이상의 lox site를 위치시키는 경우, bait 및 prey 단백질 상호작용으로 인해 발현된 Cre 재조합효소에 의하여 lox site 재조합이 일어났을 때, 상기 마커 유전자가 번역 프레임에 들어오도록(in frame) 핵산 서열들의 위치가 스위칭(switching)될 수 있으며, 이에 따라 기존에 발현되지 않던 마커 유전자가 발현되므로 표현형의 변화를 가져오게 된다. For example, when one or more lox sites are positioned near a marker gene that does not belong to any translation frame (frame), the expression When lox site recombination occurs by recombinase, the positions of the nucleic acid sequences in the frame can be switched so that the marker gene enters the translation frame, and thus a marker gene that has not been expressed before is expressed Resulting in a change in phenotype.

표현형의 조합은, 예를 들어, 어떤 마커 유전자에 대한 하나의 번역 프레임 근처에 하나 이상의 lox site를 위치시키는 경우, bait 및 prey 단백질 상호작용으로 인해 발현된 Cre 재조합효소에 의하여 lox site 재조합이 일어났을 때, 상기 마커 유전자의 번역 프레임 전체가 유전체 상의 다른 위치로 스위칭(switching)되어 복수의 표현형을 나타낼 수 있다. The combination of phenotypes resulted in lox site recombination by Cre recombinase expressed by bait and prey protein interactions, for example, when one or more lox sites were placed near one translation frame for a marker gene The entire translation frame of the marker gene may be switched to another location on the dielectric to represent a plurality of phenotypes.

상기 마커 유전자는 그 종류가 특별히 제한되지 않으나, 예를 들어 약물 저항성 유전자, 형광 단백질 코딩 유전자, 영양 요구성 표지 유전자 등을 포함한다. 본 발명에서 상기 마커 유전자로는 형광 단백질 코딩 유전자가 사용되는 것이 바람직할 수 있으며, 이 경우 형광 분석 및 형광 발현 세포의 분류가 가능한 FACS(Fluorescence-activated cell sorting) 등의 방법을 통하여 손쉽게 해당 세포들을 선별할 수 있다. The type of the marker gene is not particularly limited, and includes, for example, a drug resistance gene, a fluorescent protein coding gene, a nutritional requirement marker gene, and the like. In the present invention, it may be preferable to use a fluorescent protein coding gene as the marker gene. In this case, the cells can be easily detected by fluorescence-activated cell sorting (FACS) Can be selected.

상기 이중 리포터 효모 균주에서, 상기 1st 리포터 시스템과 2nd 리포터 시스템은 효모 유전체 내에서 서로 상이한 영역에 위치하는 것 일 수 있다. 즉, 1st 리포터 시스템과 2nd 리포터 시스템은 서로 다른 염색체(chromosome) 상에 위치하는 것 일 수 있다.  In the double reporter yeast strain, the 1st reporter system and the 2nd reporter system may be located in different regions in the yeast dielectric. That is, the 1st reporter system and the 2nd reporter system may be located on different chromosomes.

상기 이중 리포터 효모 균주는 본 발명자에 의해 KCTC12792BP로 기탁되었다. 상기 기탁균주는 1st 리포터 시스템으로서 GAL4 UAS 의 하류에 서열번호 13으로 표시되는 DNA 서열이 작동가능하게 연결된 c-myc 리포터 발현 카세트가 효모 유전체 중 15번 염색체에 포함되어있으며, 2nd 리포터 시스템으로서 GAL4 UAS 의 하류에 서열번호 14로 표시되는 DNA 서열이 작동가능하게 연결된 Cre 리포터 발현 카세트가 5번 염색체에 포함되어있다.The double reporter yeast strain was deposited with the present inventor as KCTC12792BP. As the first reporter system, the c-myc reporter expression cassette in which the DNA sequence represented by SEQ ID NO: 13 is operatively linked is contained in the chromosome 15 of the yeast genome, downstream of GAL4 UAS, and GAL4 UAS The Cre reporter expression cassette in which the DNA sequence represented by SEQ ID NO: 14 is operatively linked is contained in the chromosome 5.

상기‘도입’은 숙주세포 내에 해당 핵산이 발현되도록 형질전환 하는 것을 의미하며, 숙주세포의 벡터로 형질전환은 당업계에 공지된 형질전환방법, 예를 들면, 인산칼슘법, 염화칼슘법, 염화루비듐법, 미세사출법(microprojectile bombardment), 일렉트로포레이션(electroporation), 입자 총 충격(particle gun bombardment), 실리콘 탄화물 위스커(Silicon carbide whiskers), 초음파 처리(sonication), PEG-매개 융합법(PEG-mediated fusion), 미세주입법(microinjection), 리포좀 매개법(liposome-mediated method), 자성나노입자 매개법(magnetic nanoparticle-mediated method) 등에 의해 수행될 수 있으나, 이에 제한되지 않는다. As used herein, the term 'introduction' refers to transformation to express a nucleic acid in a host cell, and transformation with a vector of a host cell can be carried out by a transformation method known in the art, for example, calcium phosphate method, calcium chloride method, Microprojectile bombardment, electroporation, particle gun bombardment, silicon carbide whiskers, sonication, PEG-mediated (PEG-mediated) fusion, microinjection, liposome-mediated method, magnetic nanoparticle-mediated method, and the like, but the present invention is not limited thereto.

상기 숙주세포로부터 리포터 발현 여부를 조사하면 베이트-프레이 단백질 결합 쌍들을 검출할 수 있으며, 특히 리포터로서 재조합효소가 발현되는 경우에 공여벡터 및 수용벡터에 포함되어있던 각각의 바코드 서열이 서로 인접하도록 조합된다(도 14 참조). 이렇게 인접하게 조합된 바코드 서열을 이용하면, PCR을 통하여 해당 단백질의 상호작용의 유무를 검출 할 수 있을 뿐만아니라, NGS를 통한 바코드 리딩(bacord reading)을 통하여 라이브러리-라이브러리간 대량의 단백질 동시 분석 시에 단백질간 상호작용의 세기 차이 또한 검출 가능하다. When the expression of the reporter from the host cell is examined, it is possible to detect bait-prey protein binding pairs. In particular, when the recombinase is expressed as a reporter, the combination of the donor vector and each barcode sequence contained in the acceptance vector are combined (See Fig. 14). By using the bar code sequence thus adjacently combined, not only the presence or absence of the interaction of the protein can be detected by PCR, but also the simultaneous analysis of a large amount of proteins between the library and the library through the bar code reading through NGS The intensity difference of protein interactions can also be detected.

본 발명의 단백질 상호작용 검출 방법에 있어서, 가장 바람직한 실시 방법은 하기와 같을 수 있다; In the method for detecting protein interactions of the present invention, the most preferred method may be as follows;

(a) 상기 pAD-acc 벡터 및 상기 pDBD-donor 벡터에 각각 상이한 바코드 서열을 도입하고, 서로 다른 목적 단백질을 발현하는 유전자를 재조합하여 제 1, 제 2 라이브러리를 구성하는 단계;(a) constructing first and second libraries by introducing different barcode sequences into the pAD-acc vector and the pDBD-donor vector, respectively, and recombining the genes expressing different target proteins;

(b) 상기 제1 및 제2라이브러리를 상기 이중 리포터 효모 균주에 도입하는 단계;(b) introducing said first and second libraries into said double reporter yeast strain;

(c) 상기 제1라이브러리 및 제2라이브러리가 도입된 효모 균주로부터, 상기 pAD-acc 벡터에 도입된 유전자로부터 발현된 단백질과 상기 pDBD-donor 벡터에 도입된 유전자로부터 발현된 단백질이 서로 상호작용하는 효모균주를 선별하는 단계; 및(c) a protein expressed from the gene introduced into the pAD-acc vector and a protein expressed from the gene introduced into the pDB-donor vector interact with each other from the yeast strain into which the first library and the second library are introduced Selecting yeast strains; And

(d) 상기 선별된 효모균주의 바코드 서열을 식별하여 상기 상호작용하는 단백질을 선택하는 단계를 포함하는 단백질간의 상호작용을 검출하는 방법을 제공한다.(d) identifying the barcode sequence of the selected yeast strain to select the interacting protein.

이하 상기 방법에 관하여 단계별로 설명한다.Hereinafter, the method will be described step by step.

(a) 단계에서는 전술한 pAD-acc 벡터 및 pDBD-donor벡터에 각각 상이한 바코드 서열을 도입하고, 서로 다른 목적 단백질을 발현하는 유전자를 재조합하여 제1 및 제2라이브러리를 구성한다.In step (a), the first and second libraries are constructed by introducing different bar code sequences into the pAD-acc vector and the pDBD-donor vector, respectively, and recombining the genes expressing different target proteins.

상기 pAD-acc 벡터, pDBD-donor벡터 및 바코드 서열에 관해서는 전술한 바와 같다. 도 14의 A 및 B에서 상기 벡터들에 대한 모식도가 제공된다. The above pAD-acc vector, pDBD-donor vector and barcode sequence are as described above. A schematic diagram of the vectors is provided in Figures 14A and 14B.

바코드는 재조합되는 유전자를 식별하기 위하여 도입되는 서열로서, 각 벡터에 재조합 되는 목적 단백질 유전자(즉, 베이트 단백질 유전자 또는 프레이 단백질 유전자)에 따라 상이한 바코드 서열이 도입되는 것이 바람직하다. 바코드 서열은 상기 pAD-acc 벡터 및 상기 pDBD-donor 벡터의 바코드 서열 삽입부위에 삽입된다.The barcode is a sequence introduced to identify a gene to be recombined, and it is preferable that a different barcode sequence is introduced depending on a target protein gene (that is, a bait protein gene or a freeprotein gene) recombined in each vector. The bar code sequence is inserted into the pAD-acc vector and the bar code sequence insertion site of the pDBD-donor vector.

상기 목적 단백질 유전자는 상호작용 여부를 확인하고자 하는 단백질을 코딩하는 DNA(유전자)를 말하며, pAD-acc 벡터 및 pDBD-donor벡터의 유전자 삽입부위(두개의 Sfi I site 사이에)에 삽입된다. The target protein gene refers to a DNA (gene) encoding a protein to be examined for interaction, and is inserted into a gene insertion site (between two Sfi I sites) of a pAD-acc vector and a pDBD-donor vector.

본 발명의 벡터에 바코드 서열 및 유전자를 재조합하는 방법은 공지의 유전자 조작 방법에 의할 수 있다.The method of recombining the bar code sequence and the gene into the vector of the present invention can be carried out by a known gene manipulation method.

본 발명의 제1라이브러리는 목적 단백질 유전자(특히, 프레이 단백질 유전자) 및 바코드 서열이 도입된 pAD-acc 벡터군을 말하며, 제2라이브러리는 목적 단백질 유전자(특히, 베이트 단백질 유전자) 및 바코드 서열이 도입된 pDBD-donor 벡터군을 말한다.The first library of the present invention refers to a group of pAD-acc vectors into which a target protein gene (in particular, a freeprotein gene) and a barcode sequence are introduced, and a second library contains a target protein gene (in particular, a bait protein gene) PDBD-donor vector group.

상기 (b) 단계에서는 상기 제1 및 제2라이브러리를 본 발명의 이중 리포터 효모 균주에 도입한다. 본 발명의 라이브러리를 효모 균주에 도입하는 방법은 공지의 효모 형질전환 방법에 의할 수 있다.In the step (b), the first and second libraries are introduced into the double reporter yeast strain of the present invention. The method of introducing the library of the present invention into yeast strains can be performed by a known yeast transformation method.

상기 (c) 단계에서는 pAD-acc 벡터에 도입된 유전자로부터 발현된 단백질(AD-Prey)과 pDBD-donor 벡터에 도입된 유전자로부터 발현된 단백질(DBD-Bait)이 상호작용 하는 효모균주를 선별한다.In step (c), a yeast strain in which a protein (AD-Prey) expressed from a gene introduced into a pAD-acc vector interacts with a protein expressed from a gene introduced into a pDBD-donor vector (DBD-Bait) is selected .

상기 본 발명의 효모균주는 전술한 (i) 및 (ii)의 이중(dual) 리포터 시스템을 가지므로, 상기 AD-Prey와 DBD-Bait이 상호작용하는 경우, (i)의 리포터 시스템에 의하여 c-myc에피토프가 효모 세포벽 표면에 발현하고, (ii)의 리포터 시스템에 의해 GFP의 발현, 바코드 서열 조합, 두 개 이상의 항생제에 대한 내성을 가지는 등 다양한 표현형이 발현된다. Since the yeast strain of the present invention has a dual reporter system of (i) and (ii) described above, when the AD-Prey interacts with the DBD-Bait, the reporter system of (i) myc epitope is expressed on the surface of the yeast cell wall, and various phenotypes are expressed by the reporter system of (ii), such as expression of GFP, barcode sequence combination, resistance to two or more antibiotics.

상기 (ii)의 리포터 시스템에의한 표현형과 관련하여 좀 더 구체적으로 설명하면, 상기 (ii)리포터 시스템의 CRE 유전자의 발현에 의해 생성된 Cre recombinase는 yeast two hybird 과정에서 본 발명의 효모 균주에 도입된 pAD-acc 벡터 및 pDBD-donor 벡터의 loxP 및 lox2272서열을 인식하고 이들을 재조합한다. 상기 두 벡터의 Cre recombinase에 의한 재조합에 의해 GFP 단백질의 발현(재조합에 의해 LEU2 하단에 GFP가 발현 가능하도록 연결됨. 즉, LEU2 번역 프레임에 GFP가 인프레임(in frame) 됨) 및 바코드 서열의 조합(pDBD-donor 벡터의 바코드 서열이 pAD-acc 벡터로 이동(transfer)됨)이 일어나게 되며, 상기 GFP 단백질의 발현을 detection하여 bait와 prey간 상호작용이 일어난 균주를 selection 할 수 있으며, 상기 조합된 pAD-acc 벡터 및 pDBD-donor 벡터에 포함된 바코드 서열을 식별하여 상호작용이 일어난 단백질이 어떤 것인지 확인이 가능하다. 상기 식별은 바코드의 폴리뉴클레오티드 서열을 식별하는 것을 말하며, 공지의 시퀀싱 방법에 의하여 식별할 수 있다. 상기 GFP 단백질의 발현을 detection하는 방법은 공지의 형광 분석 방법이면 특별히 제한되지 아니하며, 바람직하게는 형광 분석 및 형광 발현 세포의 분류가 가능한 FACS(Fluorescence-activated cell sorting) 방법에 의할 수 있다. 또한 상기 바코드 서열의 조합은 PCR을 통하여 해당 단백질의 상호작용의 유무를 검출 할 수 있을 뿐만아니라, NGS를 통한 바코드 리딩(bacord reading)을 통하여 라이브러리-라이브러리간 대량의 단백질 동시 분석 시에 단백질간 상호작용의 세기 차이 또한 검출 가능하다. More specifically, the Cre recombinase produced by the expression of the CRE gene of the reporter system (ii) in the yeast two hybrid process of yeast strain of the present invention in the yeast two hybird process is described in relation to the phenotype of the reporter system of (ii) Recognize the loxP and lox2272 sequences of the introduced pAD-acc vector and pDBD-donor vector and recombine them. Expression of GFP protein by recombination with Cre recombinase of the above two vectors (GFP is linked in such a manner that GFP is expressed at the bottom of LEU2 by recombination, that is, GFP is in frame in LEU2 translation frame) and combination of barcode sequence (the bar code sequence of the pDBD-donor vector is transferred to the pAD-acc vector), and the expression of the GFP protein is detected to select a strain in which the interaction between bait and prey occurs, The pAD-acc vector and the pDBD-donor vector can be used to identify the interacting protein by identifying the barcode sequence. The identification refers to identifying the polynucleotide sequence of the barcode and can be identified by a known sequencing method. The method of detecting the expression of the GFP protein is not particularly limited as long as it is a known fluorescence analysis method. Preferably, the fluorescence-activated cell sorting (FACS) method capable of fluorescence analysis and classification of fluorescently expressed cells can be used. In addition, the combination of the above-mentioned barcode sequences can detect the presence or absence of the interaction of the protein through PCR, and can also be used for the simultaneous analysis of proteins in a large amount of library-library through bar code reading (bacord reading) The intensity difference of action is also detectable.

상기 표현형들을 이용하여 AD-Prey와 DBD-Bait가 상호작용하는 효모균주를 선별할 수 있다. 도 14의 C에서 상기 AD-Prey와 DBD-Bait이 상호작용하는 경우, (ii)의 리포터 시스템에의해 재조합된 벡터의 모식도를 도시하며, 구체적으로 도 5에서 그 개열지도를 도시한다.  Using these phenotypes, yeast strains that interact with AD-Prey and DBD-Bait can be selected. FIG. 14C shows a schematic diagram of a vector reconstructed by the reporter system of (ii) when the AD-Prey interacts with DBD-Bait, and specifically shows a cleavage map thereof in FIG.

상기 효모균주 선별은 상기 표현형을 이용하는 한 그 방법이 특별히 제한되지 않으나, 예를 들어, Myc 단백질(특히, c-myc 에피토프)에 특이적으로 결합하는 1차 항체를 Myc 단백질에 결합시킨 후 상기 1차 항체에 특이적으로 결합하며 형광물질(특히 시아닌 계열)로 표지된 2차 항체를 결합시키고 형광현미경 또는 FACS 등을 이용하여 선별하는 방법, Myc 단백질에 특이적으로 결합하는 1차 항체를 단백질에 결합시킨 후 상기 1차 항체에 특이적으로 결합하는 항체로 코팅된 자성 비드를 사용하여 MACS를 수행하여 선별하는 방법, 2종 이상의 항생제를 처리하여 선별하는 방법, GFP에 대하여 형광현미경 관찰 또는 FACS 등을 수행하여 선별하는 방법 등을 사용할 수 있다. 특히, 본 발명에서 MACS 또는 FACS를 사용하는 방법은 기존의 한천배지를 이용한 yeast two hybrid 스크리닝에 비하여, 한천 배지를 사용하지 않고도 월등히 적은 시간과 노동력으로도 많은 양의 균주를 처리할 수 있어 매우 유용하다.For example, the primary antibody that specifically binds to the Myc protein (particularly, the c-myc epitope) is bound to the Myc protein and the 1 < st > A secondary antibody that specifically binds to a secondary antibody and binds to a secondary antibody labeled with a fluorescent substance (in particular, a cyanine family) and is screened using a fluorescence microscope or FACS; a method in which a primary antibody that specifically binds to Myc protein is added to a protein A method of screening by performing MACS using magnetic beads coated with an antibody that specifically binds to the primary antibody, a method of selecting and treating two or more kinds of antibiotics, a fluorescence microscope observation of GFP or a FACS And then performing a screening process. In particular, the method using MACS or FACS in the present invention can treat a large amount of strains with much less time and labor even without using agar medium, compared with yeast two hybrid screening using conventional agar medium, Do.

상기 (d) 단계에서는 상기 선별된 효모균주의 바코드 서열을 식별하여 어떤 유전자의 단백질들이 서로 상호작용을 하였는지 확인하여 선택한다.In step (d), the bar code sequence of the selected yeast strain is identified, and the proteins of the genes are identified and selected.

상기 (d) 단계의 바코드 서열은, 상기 (a) 단계에서 pAD-acc 벡터 및 pDBD-donor 벡터에 Prey 및 Bait를 코딩하는 유전자와 함께 도입한 각 바코드 서열의 조합이다. 본 발명의 효모균주는 Prey 및 Bait가 상호작용하는 경우 Cre recombinase가 생성되어 pAD-acc 벡터 및 pDBD-donor 벡터에 포함된 바코드 서열을 결합(또는 인접)시킨다. 즉, pDBD-donor 벡터에 포함된 바코드 서열이 pAD-acc 벡터 내로 이동(transfer)되므로 각 바코드 서열들이 인접되어 특수한 핵산 조합을 나타낸다. 이처럼 본 발명의 단백질 상호작용 검출 방법은 바코드 이동 분석(barcode transfer assay)에 기반을 두는 것으로 이해될 수 있다.The bar code sequence in step (d) is a combination of the respective bar code sequences introduced together with a gene encoding Prey and Bait in the pAD-acc vector and the pDBD-donor vector in step (a). The yeast strain of the present invention produces Cre recombinase when Prey and Bait interact, and binds (or adjoins) the bar code sequence contained in the pAD-acc vector and the pDBD-donor vector. That is, since the bar code sequence contained in the pDBD-donor vector is transferred into the pAD-acc vector, each bar code sequence is adjacent to a specific nucleic acid combination. As described above, it can be understood that the protein interaction detection method of the present invention is based on a barcode transfer assay.

라이브러리 구성시 각 벡터에 도입되는 유전자가 어떤 바코드 서열과 매칭(matching)되었는지 조사되므로, 상기 선별된 효모 균주의 바코드 서열의 식별을 통하여 어떤 단백질이 서로 상호작용하여 해당 효모균주에서 형광물질이 발생한 것인지 손쉽게 확인 할 수 있다. 상기 바코드 서열을 식별하는 방법은 공지의 폴리뉴클레오티드 서열의 식별 방법인 시퀀싱(예를들어 Sanger sequencing, NSG)등에 의할 수 있다. In the library construction, it is examined how the genes introduced into each vector match with the bar code sequence. Therefore, it is possible to identify which proteins interact with each other through identification of the bar code sequence of the selected yeast strains, You can easily check. The method of identifying the bar code sequence may be performed by sequencing (for example, Sanger sequencing, NSG), which is a known polynucleotide sequence discrimination method.

특수한 컨스트럭트(construct)를 가지는 본 발명의 공여벡터 및 수용벡터 세트를 이용하여 단백질간의 상호작용을 검출하면, 단백질 라이브러리간(베이트 단백질 라이브러리 및 프레이 단백질 라이브러리)에서 동시 다발적으로 일어나는 단백질 상호작용 검출을 가능하게 할뿐만 아니라, 각 벡터에 포함된 바코드 서열을 이용하여 라이브러리 간 단백질 반응에 있어서 서로 상호작용하는 단백질들을 규명하기 위한 대량의 정보처리에 있어 이점을 제공한다. Detection of protein interactions using the donor and acceptor vectors of the invention with specific constructs results in simultaneous protein interactions in the protein libraries (the bait protein library and the pre-protein library) Not only does this allow for detection, but it also provides an advantage in the processing of large amounts of information to identify proteins that interact with each other in library protein reactions using the bar code sequences contained in each vector.

도 1은 본 발명의 pAD-acc 벡터의 개열지도이다.
도 2는 본 발명의 pDBD-donor 벡터의 개열지도(기탁번호 KCTC12790BP)이다.
도 3은 본 발명의 pAD-acc 벡터 제작을 위한 기본 벡터인 pGAADT7 AD 벡터의 개열지도이다.
도 4는 본 발명의 pDBD-donor 벡터 제작을 위한 기본 벡터인 pGBKT7 벡터의 개열지도이다.
도 5는 본 발명의 Cre recombinase에 의하여 pDBD-donor 벡터로부터 일부 서열이 pAD-acc 벡터로 switch 된 후 벡터의 개열지도이다. 구체적으로 도 1의 개열지도를 가지는 pAD-acc 벡터와 도 2의 개열지도를 가지는 pDBD-donor 벡터 사이에서 lox site에 의해 재조합이 일어난 후의 벡터 개열지도를 나타낸다.
도 6 및 도 7은 본 발명 효모 균주에 p53과 SV40 large T 항원을 도입한 본 발명 벡터를 형질전환 후 효모의 리포터 유전자가 정상작동 하는지를 확인한 형광현미경 사진이다(p53 (WT): 야생형 Murine p53; p53 (D278G, 34 %) : p53 단백질의 278번째 아미노산 D(aspartic acid)를 G(Glycin)으로 바꾼 돌연변이, SV40 L.T와 결합력이 34%로 감소; p53 (V144G, 4.9%) : p53 단백질의 144번째 아미노산 V(Valine)를 G(Glycin)으로 바꾼 돌연변이, SV40 L.T와 결합력이 4.9%로 감소; p53 (E255K, 1.5%) : p53 단백질의 255번째 아미노산 E(Glutamic acid)를 K(Lysine)으로 바꾼 돌연변이, SV40 L.T와 결합력이 1.5%로 감소; Lamin A : p53 단백질과 전혀 상호작용하지 않는 단백질 (Negative control)).
도 8은 본 발명 효모 균주에 p53(wild type 및 이의 muatant)과 SV40 large T 항원을 도입한 본 발명 벡터를 형질전환 후, 단백질 상호작용이 일어난 효모세포를 FACS로 검출 분리한 결과그래프로서, 붉은색은 Cy5(AgαI-myc10 발현확인)를 초록색은 GFP(Cre recombinase 발현확인) 분석 결과를 나타낸다(도 8a: p53 (WT)와 Sv40 T, 도 8b: D278G(34 %)와 Sv40 T, 도 8c: V144G (4.9%)와 Sv40 T, 도 8d: E255K (1.5 %)와 Sv40 T, 도 8e: Lamin A와 Sv40 T).
도 9는 본 발명 효모 균주에 p53과 SV40 large T 항원을 도입한 본 발명 벡터를 형질전환 후 단백질 상호작용이 일어난 효모세포를 FACS로 검출 분리한 결과그래프이다(X 축 : GFP 발현강도, Y 축 : Cy5 발현강도, 도 9a: p53 (WT)와 Sv40 T, 도 9b: D278G(34 %)와 Sv40 T, 도 9c: V144G (4.9%)와 Sv40 T, 도 9d: E255K (1.5 %)와 Sv40 T, 도 9e: Lamin A와 Sv40 T).
도 10은 본 발명에서 또다른 형태의 pAD-acc 벡터(기탁번호 KCTC12791BP)의 개열지도이다.
도 11은 본 발명의 효모 세포에 포함된 두 개의 리포터 시스템을 나타낸다(A: c-myc 리포터 시스템, B: Cre 리포터 시스템)
도 12는 c-myc 리포터 시스템에 의해, 목적하는 두 단백질이 상호작용하는 경우 효모 세포벽에 c-myc 에피토프가 발현되는 것을 나타내는 모식도이다.
도 13은 c-myc 리포터 시스템을 위한 c-myc 리포터 발현 시스템의 여러 가지 구현형태를 도시한다(A: c-myc 10개 반복, B: c-myc 5개 반복, C: c-myc 1개 )
도 14는 cre 리포터 시스템에 의하여, pDBD-donor 벡터(A) 및 pAD-acc 벡터(B)가 재조합(C)되는 것을 보여주는 모식도이다.
도 15는 c-myc 리포터 시스템에서, c-myc 에피토프 반복 갯수에 따른 신호강도를 나타낸다.
도 16은 본 발명의 dual repoter Y2H 시스템을 적용한 효모에서, 단백질 상호작용에 따른 MACS 선별 및 이의 결과를 GFP로 확인한 것이다.
도 17은 본 발명의 dual repoter Y2H 시스템을 적용한 효모에서, MACS를 1회 및 2회 반복 수행하여 단백질 상호작용에 따른 MACS 선별 결과를 형광신호로 확인한 결과이다.
도 18은 본 발명에서 Cre recombinase 발현에 의해 바코드 이동(barcode transfer) 결과로서 생성된 본 발명에서 바코드 조합을 검출하기 위해 사용된 primer A,B,C의 결합위치를 나타낸다.
도 19는 PCR 방법으로 본 발명의 dual repoter Y2H 시스템을 적용한 효모에서, 단백질 상호작용 여부에 따른 바코드 조합여부를 검출한 결과이다.
도 20은 본 발명의 dual repoter Y2H 시스템을 적용한 효모에 2종의 항생제 처리 후 생성된 콜로니에 대하여, PCR 방법으로 단백질 상호작용에 따른 바코드 조합여부를 검출한 결과이다.
도 21는 NGS 분석 방법을 이용하여, 단백질 상호작용 강도에 따른 바코드 리드(bacord read) 수치를 나타낸다.

도 22는 NGS 분석 방법을 이용하여, 라이브러리-라이브러리 간 단백질 상호작용 강도에 따른 바코드 리드(bacord read) 수치를 나타낸다.
도 23은 상기 도 22와 관련하여 NGS결과 bacord read 수가 높은 순서로 상위 36개를 정렬한 결과이다.
도 24는 단백질 상호작용 세기에 따라 MACS 수행시 세포 선별능이 달라지는 것을 나타내는 것을 보여주는 데이터로서, 단백질 상호작용 세기가 강할수록 MACS에 의해 세포 선별이 잘되며, 이를 형광강도로 확인한 결과이다(도 24a: p53 (WT)와 Sv40 T, 도 24b: D278G(34 %)와 Sv40 T, 도 24c: V144G (4.9%)와 Sv40 T, 도 24d: E255K (1.5 %)와 Sv40 T, 도 24e: Lamin A와 Sv40 T).
Figure 1 is a cleavage map of the pAD-acc vector of the present invention.
Figure 2 is a cleavage map of the pDBD-donor vector of the present invention (Accession No. KCTC12790BP).
Fig. 3 is a cleavage map of the pGAADT7 AD vector, which is a basic vector for producing the pAD-acc vector of the present invention.
FIG. 4 is a cleavage map of the pGBKT7 vector, which is a basic vector for producing the pDBD-donor vector of the present invention.
FIG. 5 shows a cleavage map of a vector after some sequences are switched from a pDBD-donor vector to a pAD-acc vector by the Cre recombinase of the present invention. Specifically, it shows the vector cleavage map after recombination by lox site between the pAD-acc vector having the cleaved map of FIG. 1 and the pDBD-donor vector having the cleavage map of FIG. 2.
FIGS. 6 and 7 are fluorescence micrographs showing that the reporter gene of the yeast is functioning after transfection of the vector of the present invention in which p53 and SV40 large T antigen are introduced into the yeast strain of the present invention (p53 (WT): wild type Murine p53; p53 (D278G, 34%): a mutation that changed the 278th amino acid D (aspartic acid) of p53 protein to G (Glycine), decreased binding capacity to SV40 LT by 34%; p53 (V144G, 4.9% (E255K, 1.5%): The 255th amino acid E (Glutamic acid) of the p53 protein is converted to K (Lysine) by the mutation of the amino acid V (Valine) A mutated mutation, reduced binding to SV40 LT by 1.5%; Lamin A: a protein that does not interact with the p53 protein at all (Negative control).
FIG. 8 is a graph showing a result of detecting and isolating yeast cells having protein interaction by FACS after transforming the vector of the present invention into which p53 (wild type and its muatant) and SV40 large T antigen were introduced into the yeast strain of the present invention, (WT) and Sv40 T, Fig. 8b: D278G (34%) and Sv40 T, and Fig. 8c (a) shows the result of analysis of GFP (Cre recombinase expression confirmation) : V144G (4.9%) and Sv40T, Figure 8d: E255K (1.5%) and Sv40T, Figure 8e: Lamin A and Sv40 T).
FIG. 9 is a graph showing the result of detection and isolation of yeast cells in which protein interactions have occurred after transfection according to the present invention vector in which p53 and SV40 large T antigen are introduced into yeast strain of the present invention (X axis: GFP expression intensity, Y axis : Cy5 expression intensity, Figure 9a: p53 (WT) and Sv40 T, Figure 9b: D278G (34%) and Sv40 T, Figure 9c: V144G (4.9%) and Sv40 T, Figure 9d: E255K T, Figure 9e: Lamin A and Sv40 T).
10 is a cleavage map of another form of pAD-acc vector (Accession No. KCTC12791BP) in the present invention.
Figure 11 shows two reporter systems included in the yeast cells of the present invention (A: c-myc reporter system, B: Cre reporter system)
12 is a schematic diagram showing that a c-myc epitope is expressed on the yeast cell wall when two desired proteins interact with each other by a c-myc reporter system.
Figure 13 shows several implementations of a c-myc reporter expression system for a c-myc reporter system (A: 10 repeats of c-myc, 5 repeats of c-myc, )
14 is a schematic diagram showing that the pDBD-donor vector (A) and the pAD-acc vector (B) are recombined (C) by the cre reporter system.
Figure 15 shows the signal intensity according to the number of c-myc epitope repeats in the c-myc reporter system.
FIG. 16 shows the results of screening of MACS according to protein interaction and the result of GFP using yeast using the dual reporter Y2H system of the present invention.
FIG. 17 is a graph showing the result of MACS screening by fluorescence signal according to protein interaction by performing MACS once and twice in yeast using the dual reporter Y2H system of the present invention.
FIG. 18 shows binding positions of the primers A, B and C used in the present invention, which are generated as a result of barcode transfer by expression of Cre recombinase in the present invention, to detect the barcode combination.
FIG. 19 is a result of detecting whether or not bar codes are combined according to the protein interaction in yeast to which the dual reporter Y2H system of the present invention is applied by the PCR method.
FIG. 20 is a graph showing the results of detection of the combination of bar codes according to protein interaction by the PCR method on the colonies produced after the treatment with the two antibiotics in the yeast to which the dual reporter Y2H system of the present invention was applied.
FIG. 21 shows the bar code read value according to the protein interaction intensity, using the NGS analysis method.

22 shows the bar code read value according to the protein-protein interaction strength between the library and the library, using the NGS analysis method.
FIG. 23 shows the result of aligning the top 36 in order of NGS result bacord read count with respect to FIG. 22. FIG.
FIG. 24 shows data showing that the cell sorting ability is changed by MACS according to the protein interaction intensity. As the protein interaction intensity is strong, cell sorting by MACS is performed well and the result is confirmed by fluorescence intensity (FIG. 24a: Figure 24b: D278G (34%) and Sv40T, Figure 24c: V144G (4.9%) and Sv40 T, Figure 24d: E255K (1.5%) and Sv40 T, Figure 24e: Lamin A and p53 (WT) Sv40 T).

이하, 본 발명을 실시예에 의해 상세히 설명한다.Hereinafter, the present invention will be described in detail by way of examples.

단, 하기 실시예는 본 발명을 예시하는 것일 뿐, 본 발명의 내용이 하기 실시예에 한정되는 것은 아니다.However, the following examples are illustrative of the present invention, and the present invention is not limited to the following examples.

<< 실시예Example 1> 1>

이중 리포터 시스템을 가지는 Mega-throughput Mega-throughput with dual reporter system Y2HY2H 효모 균주 개발 Yeast strain development

<1-1> c-<1-1> c- mycmyc 에피토프를Epitope 발현하는 1st  1st to express repoterreporter 발현 카세트 Expression cassette

GAL4 UAS(upstream activation sequence)의 downstream에 서열번호 13의 ‘Gal1 promoter MFα1- myc10 repeats- Glycine/Serine linker- AgαI(C-term)’의 발현 구조체(발현 카세트)가 연결된 형태의, c-myc 리포터 시스템을 제작하였다. (Expression cassette) of the 'Gal1 promoter MFα1-myc10 repeats-Glycine / Serine linker-AgαI (C-term)' of SEQ ID NO: 13 downstream of GAL4 UAS (upstream activation sequence) c-myc reporter system.

이때, 상기 발현 구조체 중 myc repeat의 개수를 0개, 1개, 5개, 10개(myc10 repeats)로 하는 발현 구조체(도 13 참조)를 제작 및 효모에 도입하여 발현시키고, 상기 효모에 1차 항체인 mouse α-myc 항체(c-Myc Antibody (9E10) (Santa cruz사의 sc-40))와 2차 항체인 goat α-mouse IgG-Cy5(Molecular probe사의 A10524) 항체를 처리하여, 형광현미경으로 관찰하였다. At this time, an expression construct (see FIG. 13) in which the number of myc repeats in the expression construct was 0, 1, 5, 10 (myc10 repeats) was produced and introduced into yeast, The mouse α-myc antibody (c-Myc Antibody (9E10) (Santa Cruz sc-40)) and goat α-mouse IgG-Cy5 antibody (A10524 of Molecular probe) were treated with a fluorescent microscope Respectively.

그 결과, 도 15에서 보는 바와 같이 c-myc 10 repeat에서 형광 발현이 강한 것을 확인하였고, 이를 이후의 실험에서도 확인하였다. As a result, as shown in Fig. 15, it was confirmed that the fluorescence expression was strong in c-myc 10 repeat, which was confirmed in the subsequent experiments.

<1-2> <1-2> CreCre recombinaserecombinase 를 발현하는 2nd 2nd repoterreporter 발현 카세트 Expression cassette

GAL4 UAS(upstream activation sequence)의 downstream에 서열번호 14의 ‘GAL1 promoter- CRE recombinase’가 연결된 형태의, Cre 리포터 시스템을 제작하였다. A Cre reporter system with the 'GAL1 promoter-CRE recombinase' of SEQ ID NO: 14 linked downstream of the GAL4 UAS (upstream activation sequence) was constructed.

<1-3> c-<1-3> c- mycmyc 리포터 발현 카세트 및  The reporter expression cassette and CreCre 리포터 발현 카세트를 동시에 포함하는 효모 균주 제작 Production of yeast strains simultaneously containing reporter expression cassettes

상기 실시에 1-1 및 1-2의 발현 구조체가 영구적으로 발현되는 효모균주를 제작하였다. 서열번호 13의 ‘Gal1 promoter MFα1- myc10 repeats- Glycine/Serine linker- AgαI(C-term)’의 발현 구조체는 15번 크로모좀(chromosome)에서 GAL4 UAS(upstream activation sequence)의 downstream에 위치하며, 서열번호 14의 ‘GAL1 promoter- CRE recombinase’ 발현 구조체는 5번 크로모좀(chromosome)에서 GAL4 UAS(upstream activation sequence)의 downstream에 위치한다. Yeast strains in which the expression constructs 1-1 and 1-2 were permanently expressed were prepared. The expression construct of the 'Gal1 promoter MFα1- myc10 repeats-Glycine / Serine linker-AgαI (C-term)' of SEQ ID NO: 13 is located downstream of the GAL4 UAS (upstream activation sequence) in chromosome 15, The 'GAL1 promoter-CRE recombinase' expression construct of SEQ ID NO: 14 is located downstream of the GAL4 UAS (upstream activation sequence) in chromosome 5.

구체적으로, c-myc 리포터 및 Cre 리포터 동시발현 효모 균주인 SK10-CRE(기탁번호 KCTC12792BP)’를 제작하였으며, 상기 효모 균주는 하기 표 1의 유전자형을 가진다.Specifically, c-myc reporter and Cre reporter was produced co-expression of yeast strain 'SK10-CRE (Accession No. KCTC12792BP)', wherein the yeast strain has a genotype in Table 1 below.

균주명Strain name 유전자형 (Genotype)Genotype SK10-CRESK10-CRE MATa, gal4Δ, gal80Δ, trp1-901, ura3-52, leu2-3, leu2-112,
[HIS3::GAL1-Agα1-myc10, URA3::GAL1-CRE]
MATa, GAL4A, Gal80A, TRP1-901, URa3-52, Leu2-3, Leu2-112,
[HIS3 :: GAL1-Agα1-myc10, URA3 :: GAL1-CRE]

상기 효모의 제작방법은 하기와 같다. 먼저 하기 표 2의 유전자형을 가지는JC-993 (ATCC 204097) 효모 균주에 pRS_pGAL1-MFαI-myc10-GS-Agα1(350a.a)를 도입하여 GAL1-Agα1-myc10 repoter 시스템을 가지는 효모인 SK10을 제작하였다. 상기 pRS_pGAL1-MFαI-myc10-GS-Agα1(350a.a)는 효모 게놈상의 his3 유전자에 상동성이 있는 부분이 있어 이를 이용하여 재조합을 유도하여 리포터를 도입하였다. 구체적으로, 5ug pRS_pGAL1-MFαI-myc10-GS-Agα1(350a.a)를 제한효소 Msc I(His3 유전자의 중간을 자름)를 처리하여 완전히 반응한 후 에탄올 침전을 사용하여 DNA를 모두 가라 앉힌 후 형질전환에 사용 하였다. 형질전환체의 선별은 SD / -Ura, -His + 25mM 3-AT media 선택배지에서 진행하였으며 선별된 후보군 중 게놈상에 리포터가 삽입된 효모를 PCR과 GAL4를 지속적으로 발현하는 벡터를 형질전환하여 리포터의 정상적인 작동을 확인하였다. The production method of the yeast is as follows. First, pRS_pGAL1-MFαI-myc10-GS-Agα1 (350a.a) was introduced into a JC-993 (ATCC 204097) yeast strain having the genotype shown in Table 2 below to prepare SK10 as a yeast having a GAL1-Agα1-myc10 reporter system . The above pRS_pGAL1-MFαI-myc10-GS-Agα1 (350a.a) had a portion homologous to the his3 gene on the yeast genome, and the reporter was introduced by inducing recombination thereof. Specifically, 5 ug pRS_pGAL1-MFαI-myc10-GS-Agα1 (350a.a) was treated with restriction enzyme Msc I (truncated His3 gene in the middle), completely reacted, ethanol precipitation was used to completely quench the DNA, Was used for conversion. Transformants were screened in SD / -Ura, -His + 25mM 3 -AT media selective medium, and yeast transformed with the reporter gene in the genome of the selected candidate group was transformed with PCR and a vector expressing GAL4 continuously I confirmed the normal operation of the reporter.

이렇게 제작된 SK10 효모의 유전자형은 하기 표 2와 같으며, 상기 SK10 효모에서 효모 게놈상의 URA3::GAL1-LacZ 부분의 LacZ 를 CRE 유전자로 바꾸어주어, 본 발명의 이중리포터를 가지는 SK10-Cre 효모 균주를 제작하였다. Cas9-gRNA를 이용하여 게놈상의 LacZ 부위에 dsDNA 절단부위를 만들고 여기에 CRE 유전자의 5‘말단에 Gal1 프로모터의 끝부분의 300 bp와 3’ 말단에 LacZ 유전자의 끝부분 500 bp를 갖는 Donor DNA를 PCR을 통하여 제작하여 형질전환시에 함께 넣어 상동성 재조합을 유도하였다. 구체적으로, 먼저 200 ng p414-TEF1p-Cas9-CYC1t(Cas9 발현벡터)을 SK10 효모 균주에 형질전환하고 SD/-Ura,-His,-Trp 한천배지에서 선별하여, SK10 + Cas9 형질전환체를 얻었다. PCR을 통하여 Cre Donor DNA를 증폭하여 준비하고, 6 ug의 DNA를 에탄올 침전을 통하여 침전후 충분히 말린 후 사용하였다. 그리고 상기 효모 균주 SK10 + Cas9 형질전환체(on the SD/ -Ura, -His, -Trp)에 상기 Donor DNA와 200 ng과 Guide RNA expression vector를 함께 형질 전환 하였다. 형질전환체는 SD/ -Ura, -His, -Trp, -Leu 한천배지를 통하여 선별 하였고 리포터 유전자의 도입은 형질전환체의 게놈에 존재하는 CRE 유전자를 PCR을 통하여 확인하였다.The genotype of SK10 yeast thus constructed is shown in Table 2 below. In the SK10 yeast, LacZ of the URA3 :: GAL1-LacZ moiety on the yeast genome was replaced with CRE gene, and SK10-Cre yeast strain having the double reporter of the present invention Respectively. Using Cas9-gRNA, a dsDNA cleavage site was created in the LacZ site on the genome. Donor DNA, which had 300 bp of the end of the Gal1 promoter and 500 bp of the end of the LacZ gene at the 3 'end at the 5' PCR, and inserted into the transformant to induce homologous recombination. Specifically, 200 ng of p414-TEF1p-Cas9-CYC1t (Cas9 expression vector) was transformed into SK10 yeast strain and selected in SD / -Ura, -His, -Trp agar medium to obtain SK10 + Cas9 transformant . The Cre donor DNA was amplified and prepared by PCR, and 6 ug of DNA was precipitated through ethanol precipitation and dried sufficiently before use. Then, 200 ng of Donor DNA and a guide RNA expression vector were transformed into the yeast strain SK10 + Cas9 transformant (on the SD / -Ura, -His, -Trp). Transformants were screened through SD / -Ura, -His, -Trp, -Leu agar medium and the introduction of reporter gene was confirmed by PCR using the CRE gene present in the genome of the transformant.

균주명Strain name 유전자형 (Genotype)Genotype JC-993
(ATCC 204097)
JC-993
(ATCC 204097)
MATa gal4 gal80 trp1-901 ura3-52 leu2-3 leu2-112 his3
[URA3::pGAL1-LacZ]
MATa gal4 gal80 trp1-901 ura3-52 leu2-3 leu2-112 his3
[URA3 :: pGAL1-LacZ]
SK10SK10 MATa, gal4Δ, gal80Δ, trp1-901, ura3-52, leu2-3, leu2-112,
[HIS3::GAL1-Agα1-myc10, URA3::GAL1-LacZ]
MATa, GAL4A, Gal80A, TRP1-901, URa3-52, Leu2-3, Leu2-112,
[HIS3 :: GAL1-Agα1-myc10, URA3 :: GAL1-LacZ]

<< 실시예Example 2> 2>

Mega-throughput Mega-throughput Y2HY2H vector 구축 building a vector

본 발명의 Mega-through put Y2H system에 사용되는 vector를 제작하였다. 본 발명의 vector는 pAD-acc 및 pDBD-donor의 두 종류가 한 쌍으로 이루어져 있으며, 상기 두 벡터 모두 barcode sequence와 CRE recombinase에 의해 switching 되는 서열을 포함하고 있다. pDBD-donor 벡터에는 형광을 방출하는 단백질의 유전자(GFP)가 포함되어 있는 것이 특징으로서, Cre recombinase에 의해 switching되면 pDBD-donor 벡터에 포함되어있던 식별용 barcode 및 GFP 유전자가 pAD-acc 벡터로 이동되어, 각각 검출 및 발현이 가능한 상태로 만들어진다.A vector used in the Mega-through put Y2H system of the present invention was prepared. The vector of the present invention consists of two pairs of pAD-acc and pDBD-donor, both of which contain sequences that are switched by the barcode sequence and CRE recombinase. The pDBD-donor vector contains a fluorescent protein gene (GFP). When it is switched by Cre recombinase, the identification barcode and GFP gene contained in the pDBD-donor vector are shifted to the pAD-acc vector So that they can be detected and expressed, respectively.

<2-1> <2-1> pADpAD -- accacc vector의 구축 Construction of vector

기존의 Y2H vector인 pGADT7 vector(Clontech, 도 3 참조)를 바탕으로 하여 본 발명의 목적에 맞게 변형하였다. 먼저 MCS 부분을 모두 제거하고, 두 개의 Sfi I 제한효소 인식자리를 포함하는 유전자 삽입 부위를 도입하였다. 그 다음 NGS 분석을 통하여 삽입된 유전자가 무엇인지 파악하기 위하여 바코드 삽입부위 (제한효소 BsiW I 및 Sac II[도 1의 개열지도 참조], 또는 제한효소 XbaI 및 Sac II[도 10의 개열지도 참조])와 CRE recombinase에 의하여 재조합을 유도할 수 있는 lox2272 염기서열(서열번호 20)을 두 번째 Sfi I 인식부위 바로 뒤에 삽입하였다. loxP 염기서열(서열번호 21)은 Leu2 유전자의 종결코돈을 제거하고 삽입하였다. 그 결과 loxP와 lox2272 사이는 약 1000bp 떨어져 있도록 배열되었으며, 상기 loxP와 lox2272는 동일한 배향(orientation)으로 위치되었다. 전술한 과정을 통하여, 각각 도 1(full sequence: 서열번호 16) 또는 도 10(full sequence: 서열번호 17)의 개열지도를 가지는 pAD-acc vector를 제조하였다. Based on the existing Y2H vector pGADT7 vector (Clontech, see FIG. 3), it was modified for the purpose of the present invention. First, the MCS portion was removed and a gene insertion site containing two Sfi I restriction enzyme recognition sites was introduced. Then, NGS analysis was carried out to identify the inserted gene. The barcode insertion site (restriction enzymes BsiW I and Sac II [refer to the cleavage map in FIG. 1], or restriction enzymes XbaI and Sac II [see the open map in FIG. 10] ) And the lox2272 nucleotide sequence (SEQ ID NO: 20), which can induce recombination by CRE recombinase, was inserted just after the second Sfi I recognition site. The loxP nucleotide sequence (SEQ ID NO: 21) removed and inserted the stop codon of the Leu2 gene. As a result, loxP and lox2272 were arranged to be about 1000 bp apart, and loxP and lox2272 were positioned in the same orientation. A pAD-acc vector having a cleaved map of the full sequence (SEQ ID NO: 16) or the full sequence (SEQ ID NO: 17) was prepared through the above-described procedure.

<2-2> <2-2> pDBDpDBD -donor vector의 구축- Construction of donor vector

기존의 Y2H vector인 pGBKT7 vector(Clontech, 도 4참조)를 바탕으로 하여 본 발명의 목적에 맞게 변형하였다. 먼저 MCS 부분을 모두 제거하고, 두 개의 Sfi I 제한효소 인식자리를 포함하는 유전자 삽입부위를 도입하였다. 그 다음 CRE recombinase에 의하여 재조합을 유도할 수 있는 lox2272 염기서열과 함께 NGS 분석을 통하여 삽입된 유전자가 무엇인지 파악하기 위한 바코드 삽입 부위(제한효소 Afl II/ Age I)를 두 번째 Sfi I 인식부위 뒤에 삽입하였다. 그 뒤로 항생제 카나마이신(Kanamycin) 저항성 유전자와 프로모터 그리고 GFP 유전자와 loxP 염기서열을 차례로 삽입 하였다. 그 결과 loxP와 lox2272 사이는 약 2000bp 떨어져 있도록 배열되었으며, 상기 loxP와 lox2272는 동일한 배향(orientation)으로 위치되었다. 전술한 과정을 통하여, 도 2(full sequence: 서열번호 15)의 개열지도를 가지는 pDBD-donor vector를 제조하였다. Based on the existing Y2H vector pGBKT7 vector (Clontech, see FIG. 4), it was modified for the purpose of the present invention. First, the MCS portion was removed and a gene insertion site containing two Sfi I restriction enzyme recognition sites was introduced. Then, a barcode insertion site (restriction enzyme Afl II / Age I) for identifying the inserted gene by NGS analysis together with the lox2272 base sequence capable of inducing recombination by CRE recombinase was inserted into the second Sfi I recognition site Respectively. Followed by the insertion of the antibiotic kanamycin resistance gene and promoter, and the GFP gene and loxP nucleotide sequence. As a result, loxP and lox2272 were arranged to be about 2000 bp apart, and loxP and lox2272 were positioned in the same orientation. Through the above-described procedure, a pDBD-donor vector having a cleavage map of the full sequence (SEQ ID NO: 15) was prepared.

<2-3> Barcode 및 벡터 준비<2-3> Barcode and vector preparation

상기 구축한 vector에 삽입하기 위한 barcode를 준비하였다. barcode 주형 oligo와 이를 PCR을 통하여 증폭하기 위한 프라이머를 제작한다. High-fidelity Phusion DNA polymerase(NEB, Cat.No M0530)를 사용하여 PCR을 통해 Barcode를 합성하였다. PCR machine으로 Bio-rad T100TM thermal cycler (Cat.No 186-1096)를 사용하였고, 하기 표 3과 같은 조성으로 PCR 반응액을 만들었으며, 구제적인 PCR Condition 은 다음과 같다; 95℃/30초-[95℃/20초-65℃/30초]x15 cycles-72℃/60초-4℃/∞.A barcode for inserting into the constructed vector was prepared. barcode template oligo and a primer to amplify it by PCR. Barcode was synthesized by PCR using High-fidelity Phusion DNA polymerase (NEB, Cat. No. M0530). A PCR machine Bio-rad T100 TM thermal cycler was used (Cat.No 186-1096), were made to the PCR reaction solution in the proportion shown in Table 3, the relief of PCR Condition is as follows; 95 ° C / 30 sec - [95 ° C / 20 sec -65 ° C / 30 sec] x15 cycles -72 ° C / 60 sec -4 ° C / ∞.

PCR 반응액의 조성Composition of PCR reaction solution 물질matter 용량Volume 농도density 5X Phusion DNA Pol. buffer5X Phusion DNA Pol. buffer 10 ul10 μl 1X1X dNTP (10mM)dNTP (10 mM) 4 ul4 μl 0.8 mM0.8 mM Primer F, R (50 pmole/ul)Primer F, R (50 pmoles / ul) 2/2 ul2/2 ul 100 pmole each100 pmole each Barcode template (0.01 pmole/ul)Barcode template (0.01 pmole / ul) 2 ul2 μl 0.02 pmoles0.02 pmoles Phusion DNA polymerasePhusion DNA polymerase 2 ul2 μl D.WD.W 28 ul28 μl Total volumeTotal volume 50 ul50 μl

Barcode 제작에 사용된 주형 올리고 및 프라이머 서열The template oligo and primer sequences used in the barcode construction 서열번호SEQ ID NO: 이름name 서열order 1One Barcode 주형 oligo ADBarcode Template oligo AD 5'-CGT ACG CTT GGG NNN NNN NNN NTT TCC ACC GCG G-3'5'-CGT ACG CTT GGG NNN NNN NNN NTT TCC ACC GCG G-3 ' 22 AD-5 (BsiW I)AD-5 (BsiW I) 5'-TGC ACA GCG TAC GCT TGG G-3'5'-TGC ACA GCG TAC GCT TGG G-3 ' 33 AD-3 (Sac II) AD-3 (Sac II) 5'-GGC CAT GCC GCG GTG GAA A-3'5'-GGC CAT GCC GCG GTG GAAA-3 ' 44 Barcode 주형 oligo DBD Barcode Template oligo DBD 5'-ACC GGT CTT GGG NNN NNN NNN NTT TCC ACT TAA G-3'5'-ACC GGT CTT GGG NNN NNN NNN NTT TCC ACT TAA G-3 ' 55 DBD-5 (Afl II)DBD-5 (Afl II) 5'-TGC ACA GAC CGG TCT TGG G-3'5'-TGC ACA GAC CGG TCT TGG G-3 ' 66 DBD-3 (Age I)DBD-3 (Age I) 5'-GGC CAT GCT TAA GTG GAA A-3'5'-GGC CAT GCT TAA GTG GAAA-3 '

PCR을 통하여 얻은 산물에 각 각 제한효소를 처리하였다. AD 용 바코드는 pAD-acc에 맞도록 제한효소 BsiW I (NEB사) 및 Sac II (NEB사)를 처리하며, DBD용 바코드는 pDBD-donor에 맞도록 제한효소 Afl II (NEB사) 및 Age I (NEB사)를 처리하였다.The products obtained by PCR were treated with restriction enzymes. The bar codes for AD are treated with restriction enzymes BsiW I (NEB) and Sac II (NEB) to match pAD-acc, and the bar codes for DBD are treated with restriction enzymes Afl II (NEB) and Age I (NEB Corp.).

제한효소 처리 후 Shrimp alkaline phosphatase(USB사의 78390)를 처리하여 양 말단의 인산기를 모두 제거하였다. 완전히 제한된 절편(약 30 bp)을 10% polyacrylamide gel(1X TBE)을 통하여 순수하게 정제하였다.After the restriction enzyme treatment, Shrimp alkaline phosphatase (78390, manufactured by USB Corporation) was treated to remove all phosphate groups at both ends. A fully defined section (approximately 30 bp) was purified pure through 10% polyacrylamide gel (1X TBE).

실시예 2-1 및 2-2를 통하여 구축한 vector에 각각 제한효소를 처리하였다. pAD-acc vector는 제한효소 BsiW I (NEB사) 및 Sac II (NEB사)를 처리하며, pDBD-donor vector는 제한효소 Afl II (NEB사) 및 Age I (NEB사)를 처리하였다.The vectors constructed in Examples 2-1 and 2-2 were treated with restriction enzymes, respectively. pAD-acc vector was treated with restriction enzymes BsiW I (NEB) and Sac II (NEB), and pDBD-donor vector was treated with restriction enzymes Afl II (NEB) and Age I (NEB).

효소 처리 후 완전히 제한된 절편을 Expin Gel SV(Geneall사의 102-150)를 사용하여 정제하였다.After the enzyme treatment, a completely restricted section was purified using Expin Gel SV (Geneall's 102-150).

<2-4> Barcode 삽입 라이브러리 구축<2-4> Building Barcode Insertion Library

상기 과정을 통하여 얻은 vector와 barcode를 분자 수의 비율을 1:10이 되도록 섞은 후 T4 DNA ligase(NEB사의 M0202)를 처리하여 재조합을 유도한다. (4℃에서 12시간) 반응을 마친 후 박테리아(Top10F')에 형질전환을 하여 총 1.0 x 107개의 박테리아 클론을 얻을 수 있는 양을 준비한다.The vector and barcode obtained by the above procedure are mixed so that the ratio of the number of molecules is 1:10, and then T4 DNA ligase (NE20 M0202) is treated to induce recombination. (12 hours at 4 ° C) and then transformed into bacteria (Top10F ') to prepare an amount to obtain a total of 1.0 × 10 7 bacterial clones.

준비된 클론을 미리 준비한 0.3% seaPrep agarose(Lonza사의 50302) LB 배지에 접종하여 37℃에서 36시간 동안 배양 후 Plasmid Maxi kit(Qiagen사의 12165)를 사용하여 barcode가 삽입 된 라이브러리를 얻는다.The prepared clone was inoculated on a 0.3% seaPrep agarose (Lonza 50302) LB medium and incubated at 37 ° C for 36 hours. A plasmid maxi kit (Qiagen 12165) was used to obtain a library having a barcode inserted therein.

<2-5> <2-5> PCRPCR 을 통한 재조합 유전자 준비Preparation of recombinant gene

재조합에 사용된 유전자는 총 27종으로서 Amino-acyl tRNA 합성에 관여하는 유전자를 대상으로 하였다. 구체적으로 AIMP1(genebank NM_004757.3), AIMP2(NM_006303.3), AIMP3(NM_004280), DRS(NM_001349.2), FRSα(NM_004461.2), FRSβ(NM_005687.3), HRS(NM_002109.3), NRS(NM_004539.3), SRS(NM_006513.3), WRS(NM_004184.3), YRS(NM_003680.3), CRS(NM_139273.3), GRS(NM_002047.2), LRS(NM_020117.9)는 유전자의 크기가 너무 커 클로닝에 어려움이 있어 LRS-A(1-520 aa) 및 LRS-B(521-1176 aa)의 두 부분으로 나누어 실험함, MRS(NM_004990.3), QRS(NM_005051.1), RRS(NM_002887.3), TRS(NM_152295.4), PRS(NM_004446.2에서 753-1512 aa), IRS(NM_013417.2), ARS(NM_001605.2), ERS(NM_004446.2에서 1-953 aa), KRS(NM_001130089.1), VRS(NM_006295.2)는 유전자의 크기가 너무 커 클로닝에 어려움이 있어 VRS-A(1-938 aa) 및 VRS-B(939-1265 aa)의 두 부분으로 나누어 실험함, DX2(AIMP2-DX2, 서열번호 22)의 유전자가 사용되었으며, 유전자의 목록은 [표 6]에 표시하였다. A total of 27 genes were used for recombination, including genes involved in the synthesis of Amino-acyl tRNA. Specifically, AIMP1 (genebank NM_004757.3), AIMP2 (NM_006303.3), AIMP3 (NM_004280), DRS (NM_001349.2), FRSα (NM_004461.2), FRSβ (NM_005687.3), HRS NRS (NM_004539.3), SRS (NM_006513.3), WRS (NM_004184.3), YRS (NM_003680.3), CRS (NM_139273.3), GRS (NM_002047.2) (NM_004990.3), QRS (NM_005051.1), and LRS-B (521-1176 aa), which are difficult to clone due to the large size of LRS-A (1-520 aa) , RRS (NM_002887.3), TRS (NM_152295.4), PRS (NM_004446.2 to 753-1512 aa), IRS (NM_013417.2), ARS (NM_001605.2), ERS (NM_004446.2 to 1-953 (1-938 aa) and VRS-B (939-1265 aa) due to the difficulty of cloning due to the size of the gene being too large for KRS (NM_001130089.1) and VRS (NM_006295.2) And the gene of DX2 (AIMP2-DX2, SEQ ID NO: 22) was used, and the list of genes was shown in [Table 6].

상기 각각의 유전자의 cDNA를 주형으로 하여, 사용된 프라이머를 제외하고는 상기 실시예 <2-3>과 동일한 방법으로 PCR을 수행하여 핵산을 증폭하였다. 본 실험에서 사용된 프라이머는 하기 표 5와 같다. pAD-acc vector에 삽입될 유전자는 서열번호 7 및 9번의 프라이머를 이용하여 증폭하고, pDBD-donor vector에 삽입될 유전자는 서열번호 7 및 8번의 프라이머를 이용하여 증폭하였다.Using the cDNA of each of the above genes as a template, PCR was performed in the same manner as in the above Example 2-3 except for the primers used to amplify the nucleic acid. The primers used in this experiment are shown in Table 5 below. The gene to be inserted into the pAD-acc vector was amplified using the primers of SEQ ID NOS: 7 and 9, and the gene to be inserted into the pDBD-donor vector was amplified using the primers of SEQ ID NOS: 7 and 8.

라이브러리 제작에 사용된 프라이머 서열The primer sequences used in library construction 서열번호SEQ ID NO: 이름name 서열order 77 aaRS(F)sfi IaaRS (F) sfi I 5'-GCG ATC AGG CCC AGC AGG CCG GCG CCG AGA CCG CGG TC-3'5'-GCG ATC AGG CCC AGC AGG CCG GCG CCG AGA CCG CGG TC-3 ' 88 DBD-aaRS(R)sfi IDBD-aaRS (R) sfi I 5'-ACA GCT TGG CCA GCA GGG CCC TGC AGG TCG ACC TCG AG-3'5'-ACA GCT TGG CCA GCA GGG CCC TGC AGG TCG ACC TCG AG-3 ' 99 AD-aaRS(R)sfi IAD-aaRS (R) sfi I 5'-ACA GCT TGG CCC AGC AGG CCC TGC AGG TCG ACC TCG AG-3'5'-ACA GCT TGG CCC AGC AGG CCC TGC AGG TCG ACC TCG AG-3 '

<2-6> 유전자 재조합<2-6> Genetic recombination

상기 얻은 PCR 산물 총 54종 (AD-aaRS 27종, DBD-aaRS 27종)과 pAD-acc와 pDBD-donor를 제한효소 Sfi I(NEB사의 R0123)을 사용하여 절단한다. 절단을 마친 후 Expin Gel SV(Geneall사의 102-150)를 사용하여 원하는 산물만을 정제하였다. 이후 제한효소를 처리한 aaRS 유전자와 vector의 분자 수의 비율을 3:1로 하여 섞어 주었고 T4 DNA ligase(NEB사의 M0202)를 처리하여 재조합을 유도하였다. 재조합 반응은 4℃에서 1시간 동안 진행하였고 반응을 마친 후 박테리아(Top10F')에 형질전환 하였고, LB 한천배지 내에서 각각 Ampicillin과 kanamycin 항생제에 대한 저항성을 통하여 재조합 클론을 선별하였다. (주) 코스모진텍에 의뢰하여 Sanger sequencing 방법으로 각각의 벡터에 도입된 aars 유전자와 barcode의 서열의 연관관계를 정립 하였다([표 6] 참고). 간략하게 상기 sequencing에는 BigDye®Terminator v3.1 Cycle Sequencing Kit (Cat.No. 4337455, life technologies) 및 ABI 3730XL Sequencing machine(capillary 96ea X 50cm)이 사용되었다. A total of 54 PCR products (27 kinds of AD-aaRS, 27 kinds of DBD-aaRS), pAD-acc and pDBD-donor were digested with restriction enzyme Sfi I (R0123 of NEB). After cleavage, only the desired product was purified using Expin Gel SV (Geneall's 102-150). Then, the ratio of the number of molecules of the aaRS gene treated with the restriction enzyme to that of the vector was adjusted to 3: 1, and the recombination was induced by treatment with T4 DNA ligase (NEB M0202). The recombinant reaction was carried out at 4 ° C for 1 hour and after transformation, transformed into bacteria (Top10F '). Recombinant clones were screened for resistance to ampicillin and kanamycin antibiotics in LB agar medium, respectively. (Refer to [Table 6]). The sequence of the barcodes was determined by Sanger sequencing method. Briefly, the BigDye®Terminator v3.1 Cycle Sequencing Kit (Cat. No. 4337455, life technologies) and ABI 3730XL Sequencing machine (capillary 96ea x 50 cm) were used for the above sequencing.

Figure pat00001
Figure pat00001

<< 실시예Example 3> 3>

dual dual repoterreporter Mega-throughput  Mega-throughput Y2HY2H system 구축 및 시스템 작동 확인 Establish system and check system operation

스크리닝 시스템 작동 시험을 하기 위하여 이미 단백질간 상호작용하는 것으로 알려진 p53 단백질(서열번호 19) 및 SV40 large T 항원(서열번호 18)을 각각 본 발명의 벡터에 도입하고 상기 각 단백질이 도입된 벡터를 본 발명의 이중 리포터 효모 균주(실시예1의 효모 균주, 즉 리포터 유전자인 CRE유전자 및 c-myc 유전자를 모두 리포터 유전자로 가지는 효모 균주)에 도입하여 형광 발색을 관찰하였다.In order to perform a screening system operation test, p53 protein (SEQ ID NO: 19) and SV40 large T antigen (SEQ ID NO: 18) which are already known to interact with each other are introduced into the vector of the present invention, Fluorescence development was observed by introducing the inventive double-reporter yeast strain (yeast strain of Example 1, that is, a yeast strain having reporter genes CRE and c-myc as reporter genes).

<3-1> 라이브러리 구성<3-1> Library Configuration

우선 표 7에 기재된 바와 같이, Sv40과의 결합력이 제한된 p53 돌연변이를 제조하고, 이를 벡터에 도입하여 시험용 라이브러리를 구축하였다. 라이브러리 구축을 위하여 유전자를 벡터에 도입하는 방법은 실시예 2와 동일하게 실시하였다.First, as shown in Table 7, a p53 mutation with limited binding capacity to Sv40 was prepared and introduced into a vector to construct a test library. The method for introducing the gene into the vector for constructing the library was carried out in the same manner as in Example 2. [

시험용 라이브러리 구성Configuring the test library 실험군Experimental group 대조군Control group 1One pDBD-donor-p53 (WT) + pAD-acc-Sv40 TpDBD-donor-p53 (WT) + pAD-acc-Sv40 T 66 pDBD-donor-p53 (WT)pDBD-donor-p53 (WT) 22 pDBD-donor-p53 (D278G, 34 %) + pAD-acc-Sv40 TpDBD-donor-p53 (D278G, 34%) + pAD-acc-Sv40 T 77 pDBD-donor-p53 (D278G, 34 %)pDBD-donor-p53 (D278G, 34%) 33 pDBD-donor-p53 (V144G, 4.9%) + pAD-acc-Sv40 TpDBD-donor-p53 (V144G, 4.9%) + pAD-acc-Sv40 T 88 pDBD-donor-p53 (V144G, 4.9 %)pDBD-donor-p53 (V144G, 4.9%) 44 pDBD-donor-p53 (E255K, 1.5%) + pAD-acc-Sv40 TpDBD-donor-p53 (E255K, 1.5%) + pAD-acc-Sv40 T 99 pDBD-donor-p53 (E255K, 1.5 %)pDBD-donor-p53 (E255K, 1.5%) 55 pDBD-donor-Lamin A + pAD-acc-Sv40 TpDBD-donor-Lamin A + pAD-acc-Sv40 T 1010 pDBD-donor-Lamin ApDBD-donor-Lamin A 1111 pAD-acc-Sv 40 TpAD-acc-Sv 40 T

Figure pat00002
Figure pat00002

상기 표의 기재에 관한 설명은 다음과 같다.The description of the above table is as follows.

p53 (W.T): 야생형 Murine p53(서열번호 19)p53 (W.T): wild type Murine p53 (SEQ ID NO: 19)

p53 (D278G, 34 %) : p53 단백질의 278번째 아미노산 D(aspartic acid)를 G(Glycin)으로 바꾼 돌연변이, SV40 L.T와 결합력이 34%로 감소p53 (D278G, 34%): a mutation that changed the 278th amino acid D (aspartic acid) of p53 protein to G (Glycin)

p53 (V144G, 4.9%) : p53 단백질의 144번째 아미노산 V(Valine)를 G(Glycin)으로 바꾼 돌연변이, SV40 L.T와 결합력이 4.9%로 감소p53 (V144G, 4.9%): a mutation that changed the 144th amino acid V (Valine) of p53 protein to G (Glycine), decreased binding strength to SV40 L.T by 4.9%

p53 (E255K, 1.5%) : p53 단백질의 255번째 아미노산 E(Glutamic acid)를 K(Lysine)으로 바꾼 돌연변이, SV40 L.T와 결합력이 1.5%로 감소p53 (E255K, 1.5%): a mutation that changed the 255th amino acid E (Glutamic acid) of p53 protein to K (Lysine) and decreased the binding force to 1.5% with SV40 L.T

Lamin A : SV40 LT 단백질과 전혀 상호작용하지 않는 단백질 (Negative control, 서열번호 23) Lamin A: a protein that does not interact with the SV40 LT protein at all (Negative control, SEQ ID NO: 23)

SV40 LT : 야생형 Murine p53와 상호작용하는 것으로 알려진 단백질(서열번호 18)SV40 LT: a protein known to interact with wild type Murine p53 (SEQ ID NO: 18)

<3-2> 효모 균주의 형질전환 및 &Lt; 3-2 > Transformation of yeast strains and GFPGFP 를 통한 Through CRECRE 리포터의 작동 여부 확인 Check if the reporter is working

실시예 1에서 제작한 효모의 형질전환은 Yeastmaker™ Yeast Transformation System 2(Clontech 사의 Cat no.630439)을 사용하여 진행하였다. 형질전환에 사용된 재조합 DNA는 표 7에 따라 plasmid 하나 당 100 ng 씩 섞은 후 사용하였다.(총 11종의 실험군) 상기 실시예1에서 제조한 효모에 형질전환시킨 후 형질전환체 선별을 위하여 SD/ -U,H,L,T 한천 배지에서 배양하였다. 3일간 배양 후 배양이 진행된 한천배지를 형광현미경으로 관찰하였다.Yeast transformants prepared in Example 1 were transformed using Yeastmaker Yeast Transformation System 2 (Cat no. 630439, Clontech). The recombinant DNA used in the transformation was used after mixing 100 ng per plasmid according to Table 7. (Total 11 kinds of experimental groups) After transforming the yeast prepared in Example 1, SD / -U, H, L, T agar medium. After culturing for 3 days, the cultured agar medium was observed under a fluorescence microscope.

실험 결과, [도 6]에서 보는 바와 같이, 상호작용이 일어난 세포에서 성공적으로 형광이 나타나는 것을 확인하였다. 또한 단백질 간의 결합력이 강할수록 리포터 유전자의 발현 수준이 증가하여 결론적으로 형광의 강도가 강해지는 것을 확인하였다.As a result of the experiment, as shown in FIG. 6, it was confirmed that fluorescence appeared successfully in the cells in which the interaction occurred. In addition, the stronger the binding force between the proteins, the higher the expression level of the reporter gene, and consequently, the stronger the fluorescence intensity was confirmed.

<3-3> 항생제 처리에 의한 <3-3> Antibiotic treatment CRECRE 리포터의 작동 여부 확인 Check if the reporter is working

전술한 바와 같이 형질전환된 세포에서, 단백질 간의 상호작용이 일어나는 경우 CRE recombinase에 의하여 Ampicillin과 kanamycin 모두에 저항성을 갖는 plasmid가 재조합된다. 이를 확인하기 위하여, 구체적으로 상기 실시예3-2와 같은 방법을 통하여 얻은 형질전환 효모에서, Easy Yeast Plasmid Isolation Kit (Clontech, Cat.No : 630467)를 이용하여 plasmid를 정제한 후에, 박테리아(Top10F')에 형질전환하고 이를 LB-엠피실린 배지 또는 LB-엠피실린 및 카나마이신 배지 접종한 후 생성된 콜로니를 측정하였다. 상기 배지는 1L기준 10g Tryptone, 5g Yeast extract, 10g NaCl의 조성으로 이루어지는 Luria-Bertani(LB) Broth, Miller(Company : Difco, Cat.No : 244620)를 기초로 하여, 각각 엠피실린 50 ug/ml 또는/및 카나마이신 15 ug/ml의 농도가 되도록 제조한 것이다. In the transfected cells as described above, when protein interactions occur, plasmids resistant to both Ampicillin and kanamycin are recombined by CRE recombinase. In order to confirm this, the plasmid was purified using the Easy Yeast Plasmid Isolation Kit (Clontech, Cat. No: 630467) in the transformant yeast obtained in the same manner as in Example 3-2, '), And the resulting colonies were measured after inoculation with LB-ampicillin medium or LB-ampicillin and kanamycin medium. The medium was prepared by adding 50 μg / ml of ampicillin to each of Luria-Bertani (LB) Broth and Miller (Company: Difco, Cat. No. 244620), each consisting of 10 g Tryptone, 5 g Yeast extract and 10 g NaCl Or / and kanamycin at a concentration of 15 ug / ml.

항생제 처리 결과Antibiotic treatment results p53
WT
p53
WT
P53
D278G
P53
D278G
P53
V144G
P53
V144G
P53
E255K
P53
E255K
Laminin ALaminin A
Ampr Amp r 389389 401401 296296 266266 312312 Ampr Kanr Amp r Kan r 138 138 80 80 1919 44 00 Ampr Kanr
/ Ampr
Amp r Kan r
/ Amp r
35.7± 3.3%35.7 ± 3.3% 19.8 ± 3.4%19.8 ± 3.4% 6.2± 3.4%6.2 ± 3.4% 1.8± 0.5%1.8 ± 0.5% 0%0%
Relative frequencyRelative frequency 100.0%100.0% 55.5%55.5% 17.4%17.4% 5.0%5.0% 0%0%

* 3 반복 실험에 대한 평균 결과임* 3 Average result for repeated experiments

그 결과 상기 표 9에서 보는 바와 같이, 단백질 간의 상호작용이 강할수록 CRE에 의한 recombination 비율이 높아지기 때문에 두 종의 항생제에 저항성을 갖는 plasmid가 증가하게 되고, 더 많은 콜로니가 형성되는 것을 확인하였다. As a result, as shown in Table 9, stronger interactions between proteins resulted in an increase in recombination rate by CRE, so that plasmids resistant to both antibiotics were increased and more colonies were formed.

<3-4> 효모 균주의 &Lt; 3-4 > MycMyc 리포터 작동 여부 확인 Check if the reporter is working

상기 배양한 형질전환체 효모에서 c-myc 리포터 유전자가 정상 작동하는지 여부를 확인하기 위하여 상기 배양한 형질전환체 효모에 1차로 발현된 Myc과 결합하는 mouse α- c-myc 항체와 상기 c-myc 항체에 결합하는 2차 항체로 Alexa Fluor 568 Goat Anti-Mouse IgG 항체(Molecular probe)를 처리한 후 형광현미경으로 관찰하였다.In order to confirm whether the c-myc reporter gene functions normally in the cultured transformant yeast, mouse α-c-myc antibody that binds to Myc firstly expressed in the transformant yeast cultured and the c-myc Antibody-conjugated secondary antibody was treated with Alexa Fluor 568 Goat anti-Mouse IgG antibody (Molecular probe) and observed with fluorescence microscope.

실험결과 [도 7]에서 보는 바와 같이, 효모 균주의 Myc가 단백질간 상호작용에 의해 정상 작동하여 붉은색 형광이 나타나는 것을 확인하였다. 또한 Cre recombinase 정상 발현에 의하여 GFP 형광 발현도 함께 관찰되었다. As a result of the experiment, as shown in Fig. 7, it was confirmed that Myc of the yeast strain works normally by protein interactions and red fluorescence appears. GFP fluorescence was also observed by normal expression of Cre recombinase.

<3-5> 형광표지 효모세포의 선별 process 작동 여부 확인<3-5> Confirmation of selection process of fluorescently labeled yeast cells

효모 균주에 도입된 pAD-acc 벡터 및 pDBD-donor 벡터에 도입된 알려진 p53 단백질과 SV40 large T 항원의 상호작용에 의해 형광이 발현된 효모균주를 한천배지 작업 없이 검출하고 분리할 수 있는지 확인하기 위하여 실시예 3-2에서 형질전환 한 효모균주 실험군을 액상배지에서 배양 후, 세포를 분리하여 버퍼에 현탁하고 FACS 분석을 하였다.To confirm that the yeast strain expressing fluorescence by the interaction of the SV40 large T antigen with the known p53 protein introduced into the pAD-acc vector and the pDBD-donor vector introduced into the yeast strain can be detected and isolated without agar medium operation The yeast strains transformed in Example 3-2 were cultured in a liquid medium, the cells were separated, suspended in a buffer, and subjected to FACS analysis.

구체적으로, 실시예 3-2에서 형질전환시킨 효모균주 실험군들에서 배양을 마친 배양액을 원심분리하여 배지를 완전히 제거하고 효모만을 얻었다. 여기에 5 ml WB 버퍼(1X PBS, 5% BSA, 5mM EDTA)를 이용하여 2 번 효모를 세척하고 1 ml WB buffer에 1차 항체인 mouse α-myc 항체(c-Myc Antibody (9E10) (Santa cruz사의 sc-40))를 1:500으로 희석하여 세척한 효모에 넣고 잘 섞어 주었다. 얼음에 시료가 담긴 튜브를 보관하여 차가운 상태를 유지하면서 30분간 1차 항체가 결합하도록 반응시켰다. 30분 후 5 ml WB 버퍼를 이용하여 효모를 세척한 후 1 ml buffer에 형광염료가 표지된 2차 항체인 goat α-mouse IgG-Cy5(Molecular probe사의 A10524) 항체를 1:500으로 희석하여 1차 항체를 부착한 효모에 넣고 잘 섞어 주었다. 이 또한 얼음에 보관하여 차가운 상태를 유지하면서 30분간 반응시켰다. 염색을 마친 후 5 ml WB buffer로 한번 5 ml 1X PBS로 두 번 세척한 후 3 ml 1X PBS로 효모 세포를 완전히 풀어 준 후 14 ml FACS tube(BD falcon사의 352017)에 옮겼다. Specifically, in the main experimental groups transformed in Example 3-2, the cultured medium was centrifuged to completely remove the culture medium and only yeast cells were obtained. The yeast cells were washed with 5 ml of WB buffer (1X PBS, 5% BSA, 5 mM EDTA), and 1 ml of mouse α-myc antibody (c-Myc Antibody (9E10) (Santa sc-40, manufactured by cruz) was diluted 1: 500 and added to the washed yeast. The tubes containing the samples were kept in ice and allowed to react for 30 minutes while the cold was maintained. After 30 minutes, the yeast was washed with 5 ml of WB buffer. Then, 1 ml of goat α-mouse IgG-Cy5 (Molecular probe A10524) antibody, a fluorescent dye-labeled secondary antibody, was diluted 1: 500 It was added to the yeast with the secondary antibody and mixed well. This was also stored in ice and allowed to react for 30 minutes while keeping it in a cold state. After completion of the staining, the cells were washed twice with 5 ml of 1X PBS in 5 ml of WB buffer, and the yeast cells were completely disrupted with 3 ml of 1X PBS, and then transferred to a 14 ml FACS tube (352017 from BD falcon).

준비된 시료를 FACS Moflo XDP(Backman Coulter)를 이용하여 분석하고 단백질 간의 상호작용에 의하여 유도된 레포터 유전자의 발현을 통하여 나타나는 형광(GFP, Cy5)을 가지는 효모 군을 따로 분리하였다. 선별되는 세포는 최소 1.0 x 107 이상이 되도록 하였다.The prepared samples were analyzed by FACS Moflo XDP (Backman Coulter) and the yeast group having fluorescence (GFP, Cy5) appeared through the expression of the reporter gene induced by protein interactions was separately isolated. Selected cells were at least 1.0 x 10 7 cells.

그 결과 [도 8] 및 [도 9]에서 보는 바와 같이, 상호작용이 일어나는 1번, 2번 실험군의 경우 리포트 유전자의 정상 발현에 의해 세포들이 분리되는 반면(도 8a 및 도8b, 도9a 및 도9b 참조), 형질전환된 단백질이 상호작용하지 않는 3번 내지 5번 실험군(각각 도8c, 도8d 및 도8e 참조, 및 각각 도9c,도9d 및 도9e 참조)의 경우 대조군(6번 내지 11번, 데이터 미도시)과 동일한 분포를 나타내는 것을 확인하였다.As a result, as shown in FIG. 8 and FIG. 9, in the case of the first and second test groups in which the interaction occurs, cells are separated by normal expression of the report gene (FIGS. 8A and 8B, (See Fig. 9B). In the case of the experiment group 3 to 5 (see Figs. 8C, 8D and 8E and 9C, 9D and 9E, respectively) in which the transfected proteins do not interact, To 11, data not shown).

<3-6> 선별된 효모의 &Lt; 3-6 > barcordbarcord reading 가능 여부 확인 Check reading availability

단백질 상호작용이 일어난 효모에서 바코드가 재조합을 통하여 PCR이 가능한 상태로 조합되었는지 확인하기 위하여, 상기 실시예3-5에서 GFP를 발현하는 콜로니의 효모 세포로부터, Easy Yeast Plasmid Isolation Kit (Clontech, Cat.No : 630467)를 이용하여 Plasmid를 정제하고, 하기 표 10의 프라이머들을 사용하여 PCR을 수행하였다. PCR machine으로 Bio-rad T100TM thermal cycler (Cat.No 186-1096)를 사용하였고, DNA 중합효소로는 High-fidelity DNA polymerase(NEB, Cat.No M0530)를 사용하였으며, 상기 표 3과 같은 조성으로 PCR 반응액을 제조하였다. 구체적인 PCR Condition은 다음과 같다; 95℃/30초-[95℃/20초-65℃/30초]x25 cycles-72℃/60초-4℃/∞.From the yeast cells expressing GFP in the above Example 3-5, the yeast cells of Easy Yeast Plasmid Isolation Kit (Clontech, Cat. &Lt; RTI ID = 0.0 &gt; No: 630467), and PCR was performed using the primers shown in Table 10 below. By PCR machine was used for Bio-rad T100 TM thermal cycler ( Cat.No 186-1096), a DNA polymerase was used as the High-fidelity DNA polymerase (NEB, Cat.No M0530), the composition, such as Table 3 To prepare a PCR reaction solution. The specific PCR conditions are as follows; 95 ° C / 30 seconds - [95 ° C / 20 seconds -65 ° C / 30 seconds] x25 cycles -72 ° C / 60 seconds -4 ° C / ∞.

GFP를 발현하지 않았던 콜로니의 효모는 대조군으로 사용되었다. 도 18에서 보는 바와 같이, 하기 표 10의 프라이머 A 및 C의 쌍은 DBD-donor vector로부터 도입된 바코드 서열(즉, 베이트 단백질을 표시하는 서열)과 AD-acc vector의 바코드 서열의 조합여부를 검출하기 위해 사용되었으며, 하기 표 10의 프라이머 A 및 B의 쌍은 플라스미드의 존재 여부를 확인하기 위한 대조군 실험에 사용되었다. 구체적인 실험군 및 대조군은 하기 표 11에 나타내었다.Colony yeasts that did not express GFP were used as controls. As shown in FIG. 18, the pair of primers A and C in Table 10 detects whether or not the bar code sequence introduced from the DBD-donor vector (that is, the sequence representing the bait protein) and the bar code sequence of the AD-acc vector are combined And pairs of primers A and B in Table 10 below were used in a control experiment to confirm the presence of the plasmid. Specific experimental groups and control groups are shown in Table 11 below.

프라이머 서열Primer sequence 서열번호SEQ ID NO: 명칭designation sequencesequence 1010 primer Aprimer GGCCgTCGAcTaaTtGAGTGACGTACGCTTGGGGGCCgTCGAcTaaTtGAGTGACGTACGCTTGGG 1111 primer Bprimer B ggccATGCCGCGGTGGAAAggccATGCCGCGGTGGAAA 1212 primer Cprimer C GCCCCAAGGGGTTATGCTAGTTATCTTAAGGCCCCAAGGGGTTATGCTAGTTATCTTAAG

LaneLane TemplateTemplate PrimersPrimers 1One GFP positive colonyGFP positive colony A/CA / C 22 GFP negative colonyGFP negative colony A/CA / C 33 GFP positive colonyGFP positive colony A/BA / B 44 GFP negative colonyGFP negative colony A/BA / B

도 19는 loxP 인근에서 재조합 된 Barcode를 PCR을 통하여 증폭한 결과를 나타낸다. 단백질 상호작용이 일어나 GFP가 발현되는 효모(lane 1)에서는 Cre recombinase에 의해 재조합이 일어나 115bp의 Barcode PCR 산물이 형성된 것을 확인하였으나, GFP 를 발현하지 않았던 콜로니의 효모(lane 2)에서는 Barcode PCR 산물이 검출되지 않았다. lane 3 및 lane 4는 plasmid가 있다는 것을 확인하기 위한 control로서 사용되었다(48 bp).19 shows the result of amplifying the recombined barcode near loxP by PCR. In the lane 1 gene expressing GFP, recombination was induced by Cre recombinase and a 115-bp Barcode PCR product was formed. In the lane 2 of the colonies that did not express GFP, Barcode PCR product Was not detected. lane 3 and lane 4 were used as controls to confirm that plasmids were present (48 bp).

이를 좀 더 알아보기 위하여 상기 실시예3-3의 방법으로 선별된 세포로부터 핵산을 추출하고 전술한 방법과 동일한 방법으로 PCR을 수행하였다. 그 결과 도 20에서 보는 바와 같이, 단백질 상호작용이 일어나 ampicillin과 kanamycin 모두에 저항성을 갖는 효모들에서는 정상적으로 Barcode PCR 산물이 검출되는 것을 확인하였다. To further elucidate this, nucleic acids were extracted from selected cells by the method of Example 3-3, and PCR was performed in the same manner as described above. As a result, as shown in Fig. 20, it was confirmed that Barcode PCR products were detected normally in yeast resistant to both ampicillin and kanamycin due to protein interaction.

이로서 본 발명의 효모균주 및 벡터를 이용한 단백질간의 상호작용을 검출하는 system이 정상 작동하는 것을 확인하였다.Thus, it was confirmed that the system for detecting the interactions between proteins using the yeast strains and the vectors of the present invention works normally.

<< 실시예Example 4> 4>

dual dual repoterreporter Mega-throughput  Mega-throughput Y2HY2H system 을 이용한, 단백질 상호작용 조사 System Interaction Study

<4-1> MACS(Magnetic-activated cell sorting)를 이용한, 단백질 상호작용 효모의 선별<4-1> Screening of protein-interacting yeast by MACS (Magnetic-activated cell sorting)

전술한 표 6에서와 같이 총 27 종의 ARS 유전자 및 상기 각각의 단백질을 표시하는 바코드 서열을 pAD-acc vector와 pDBD-donor vector에 재조합 후에 실험을 진행하였다. 또한 negative control 로서 Lamin A와 SV40 T를 사용하였다. 전술한바와 같이 각 각의 벡터를 제조하고 본 발명의 효모에 형질전환하여, 하기 표 12와 같은 실험군으로 실험을 진행하였다. 1.0x108개의 효모 세포에 80ng c-Myc 항체(9e10, SantaCruz, sc-40)를 처리하여 효모 세포 표면에 발현된 AgαI-myc10에 결합하도록 하였고, 그 후에 BioMag Goat Anti-Mouse IgG (Anti-mouse IgG 항체가 코팅된 자성비드, qiagen, Cat.No. 310007) 1 ml과 함께 섞어 최종적으로 효모와 자성비드가 항원-항체 결합을 통하여 결합된 상태가 되도록 하였다. 자석을 이용하여 자성비드를 바닥으로 모두 가라앉힌 후 비드에 부착하지 않은 효모를 제거 한 후, SD/-U,H,L,T 한천 배지를 넣고 비드에 결합한 효모를 30℃에서 24시간 동안 배양 하였다. 선별된 세포들은 형광현미경을 통하여 분석하였다. As shown in Table 6, a total of 27 kinds of ARS genes and barcode sequences representing the respective proteins were recombined into a pAD-acc vector and a pDBD-donor vector. Lamin A and SV40 T were used as negative controls. Each vector was prepared as described above and transformed into the yeast of the present invention, and the experiment was conducted with the experimental group as shown in Table 12 below. 1.0x10 8 Yeast cells were treated with 80ng c-Myc antibody (9e10, SantaCruz, sc-40) to bind AgαI-myc10 expressed on the surface of yeast cells, followed by BioMag Goat Anti-Mouse IgG , And 1 ml of a magnetic bead (qiagen, Cat. No. 310007) were mixed together to finally bind the yeast and the magnetic beads through antigen-antibody binding. After immersing all the magnetic beads on the bottom using a magnet, yeast not attached to the beads was removed, and SD / -U, H, L, and T agar medium were added and the yeast bound to the beads was incubated at 30 ° C for 24 hours Respectively. Selected cells were analyzed by fluorescence microscopy.

O.D 600O.D 600 Total cell numberTotal cell number ARS library vs ARS libraryARS library vs ARS library 2.0152.015 2.0 X 108 2.0 X 10 8 Lamin vs Sv40 Large TLamin vs Sv40 Large T 0.0460.046 4.6 X 106 4.6 X 10 6

도 16에서 보는 바와 같이, MACS를 통하여 c-myc 리포터가 발현된 세포들을 선별하였으며, 이들 세포에서 GFP 형광발현이 일어나는 것을 형광현미경 관찰을 통해 확인하였다. 따라서 한천배지 작업 없이도, MACS 등의 작업을 통해 단백질 상호작용이 일어나고 있는 효모들을 선별할 수 있었다.As shown in FIG. 16, cells expressing c-myc reporter through MACS were selected, and fluorescence microscopy observation of GFP fluorescence expression in these cells was confirmed. Therefore, it was possible to select yeasts that are undergoing protein interaction through MACS and other processes without agar medium.

또한, 단백질 상호작용 세기와 관련하여 MACS 방법이 얼마나 효율적으로 효모 세포들을 선별할 수 있는지 확인하기 위하여, 하기 표 13과 같이 벡터를 제조하고 본 발명의 효모(실시예 1의 이중 리포터 효모)에 형질전환하여, 전술한 방법과 동일하게 MACS 수행하였다. In order to determine how efficiently the MACS method can select yeast cells in relation to the protein interaction intensity, a vector was prepared as shown in Table 13 below, and the yeast of the present invention (double reporter yeast of Example 1) And MACS was carried out in the same manner as described above.

pHAB210 : pDBD-donor-p53pHAB210: pDBD-donor-p53 VSVS pHAB215 : pAD-acc-SV40 TpHAB215: pAD-acc-SV40 T pHAB211 : pDBD-donor-p53-E255K (1.5 %)pHAB211: pDBD-donor-p53-E255K (1.5%) pHAB212 : pDBD-donor-p53-V144G (4.9%)pHAB212: pDBD-donor-p53-V144G (4.9%) pHAB213 : pDBD-donor-p53-D278G (34 %)pHAB213: pDBD-donor-p53-D278G (34%) pHAB214 : pDBD-donor-Lamin ApHAB214: pDBD-donor-Lamin A

p53p53 (WT)  (WT)
vsvs
Sv40Sv40 T T
D278GD278G
(34 %)(34%)
vsvs
Sv40Sv40 T T
V144GV144G (4.9%) (4.9%)
vsvs
Sv40Sv40 T T
E255KE255K
(1.5 %)(1.5%)
vsvs
Sv40Sv40 T T
LaminLamin A A
vsvs
Sv40Sv40 T T
c-c- MycMyc + + 28.76 %28.76% 27.84 %27.84% 11.54 %11.54% 1.47 %1.47% 0.47 %0.47% 1.0x 105 --> 287601.0x 10 5 -> 28760 1.0x 105 --> 278401.0x 10 5 -> 27840 1.0x 105 --> 115401.0x 10 5 -> 11540 1.0x 105 --> 14701.0x 10 5 -> 1470 1.0x 105 --> 47001.0x 10 5 -> 4700 5.0 x 105.0 x 10 66 1.7 x 107 cells 1.7 x 10 7 cells 1.8 x 107 cells1.8 x 10 7 cells 4.3 x 107 cells4.3 x 10 7 cells 3.6 x 108 cells 3.6 x 10 8 cells -- Cell concentrationCell concentration 1.17 x 109 cells / ml1.17 x 10 9 cells / ml 1.0 x 109 cells / ml1.0 x 10 9 cells / ml 8.8 x 108 cells / ml8.8 x 10 8 cells / ml 1.0 x 109 cells / ml1.0 x 10 9 cells / ml 1.15 x 109 cells / ml1.15 x 10 9 cells / ml Volume to Volume to
5.0 x 105.0 x 10 6 6 cellcell
15 ul15 μl 18 ul18 μl 49 ul49 μl 340 ul340 μl 300 ul300 μl
Cells toCells to
3.6 x 103.6 x 10 88
3.2 x 108 cell3.2 x 10 8 cells 3.2 x 108 cell3.2 x 10 8 cells 2.9 x 108 cell2.9 x 10 8 cells -- --

그 결과 상기 표 14 및 도 24에서 보는 바와 같이, 단백질 사이의 상호작용 세기가 강할수록 MACS에 의해서 선별되는 세포의 양이 다른 것을 알 수 있다. 따라서 MACS를 수행함으로써 단백질 상호작용이 강한 것들이 더 잘 선별되며, 이는 본 발명의 Y2H system 정확도 향상에 기여하는 것으로 생각되었다. As a result, as shown in Table 14 and FIG. 24, it can be seen that as the intensity of interaction between proteins is stronger, the amount of cells selected by MACS is different. Therefore, by performing MACS, those with strong protein interactions are better selected, which is thought to contribute to the improvement of the Y2H system accuracy of the present invention.

<4-2> 단백질 상호작용 효모의 선별에 있어서, 형광 이용 방법과 MACS 이용 방법의 효율 비교<4-2> Comparison of efficiency of fluorescence use and MACS utilization in screening protein-interacting yeast

실제로 단백질 상호작용이 일어난 효모 세포(즉, positive cell)를 선별하는 방법으로서, 형광을 이용하는 방법과 상기 MACS를 이용하는 방법 중 어느 방법이 더욱 정확한 선별을 가능하게 하는지 알아보았다. 먼저, 상기 실시예 4-1과 같이 본 발명의 효모를 형질전환하고 36시간 후에 Cy5 및 GFP의 형광을 FACS( MoflowTM XDP, Beckman coulter)를 통하여 조사하였다. 그리고 상기 실시예 4-1과 같이 본 발명의 효모를 형질전환하고 MACS를 1회 및 2회 시행하여 선별한 세포들에서 24시간 후에 Cy5 및 GFP의 형광을 FACS( MoflowTM XDP, Beckman coulter)를 통해 조사하였다. As a method for screening yeast cells (i.e., positive cells) in which protein interaction actually took place, it was examined whether the method using fluorescence or the method using MACS enabled more accurate selection. First, the yeast of the present invention was transformed as in Example 4-1, and after 36 hours, the fluorescence of Cy5 and GFP was examined through FACS (Moflow TM XDP, Beckman coulter). As in Example 4-1, Yeast of the present invention was transformed and MACS was performed once and twice. After 24 hours, the fluorescence of Cy5 and GFP was measured by FACS (Moflow TM XDP, Beckman coulter) Respectively.

도 17에서 보는 바와 같이, MACS를 수행하지 않은 형질전환 효모에서는 각 벡터들을 효모에 도입한지 36시간째에 형광발현을 통하여 단백질 상호작용 여부를 알기 어려웠으나(도 17의 A), MACS는 실제로 단백질 상호작용이 일어난 positive cell들을 분리 가능하였으며 특히 MACS 시행 횟수가 증가할수록 positive cell 선별력이 증가되는 것이 확인되었다(도 17의 B). MACS를 이용하면, 높은 정확도로 positive cell들을 선별 가능함을 확인하였다.  As shown in FIG. 17, in the transformant yeast that did not perform MACS, it was difficult to know the protein interaction through fluorescence expression at 36 hours after each vector was introduced into the yeast (FIG. 17A) Positive cells with interactions were able to be separated. Especially, as the number of times of MACS administration increased, positive cell sorting power was increased (FIG. 17B). Using MACS, we confirmed that positive cells can be selected with high accuracy.

<4-3> 상호작용하는 단백질들의 규명을 위한 바코드 <4-3> Barcode for identification of interacting proteins 리딩Reading (reading)(reading)

본 발명의 dual repoter Mega-throughput Y2H system에서 어떤 단백질들이 상호작용을 하고 있는지 규명하기 위하여, 이들의 바코드 서열을 분석하였다. 구체적으로 먼저, 전술한 방법으로 표 7의 라이브러리를 구축하고 이들을 본 발명의 효모에 도입하였다. 실시예 3-6과 동일한 방법으로 재조합된 barcode DNA 시료를 얻은 후, 이를 (주)셀레믹스에 NGS 분석 의뢰하였다. 간략하게, 상기 NGS 분석은, Sample 준비에 MiSeq Reagent Kit v2(300 cycle) (Illumina, Cat.No MS-102-2001)가 사용되었고, Illumine MiSeq Desktop Sequencer를 이용하여 각 barcode read 수가 분석되었다. To identify which proteins interact with the dual reporter Mega-throughput Y2H system of the present invention, their bar code sequences were analyzed. Specifically, first, the library of Table 7 was constructed by the above-mentioned method, and these were introduced into the yeast of the present invention. The recombinant barcode DNA samples were obtained in the same manner as in Example 3-6, and then NGS analysis was commissioned on the Celamics Co., Ltd. For the NGS analysis, MiSeq Reagent Kit v2 (300 cycles) (Illumina, Cat. No. MS-102-2001) was used for sample preparation and each barcode read number was analyzed using Illumine MiSeq Desktop Sequencer.

그 결과 도 21에서 보는 바와 같이, LaminA, SV40 T의 p53과의 친화도에 따라서 바코드 리드(barcode reads) 수가 현격히 차이가 나는 것을 확인하였다. 즉, 단백질의 친화도(상호작용 세기)가 감소될수록 바코드 리드수가 감소되었다. As a result, as shown in FIG. 21, it was confirmed that the number of barcode reads was significantly different according to the affinity of LaminA and SV40 T for p53. That is, as the affinity (interaction intensity) of the protein decreases, the number of barcode leads decreases.

<4-4> 라이브러리-라이브러리 단백질 상호작용 분석<4-4> Analysis of library-library protein interaction

본 발명의 dual repoter Mega-throughput Y2H system이 라이브러리-라이브러리 간의 각 단백질 상호작용에 대한 정보를 제공할 수 있는지 확인하기 위하여, ARS 라이브러리(표 6 참조)를 대상으로 본 발명의 Y2H system을 작동시키고, (주)셀레믹스에 의뢰하여 NGS로 바코드를 리딩(reading)한 결과를 확인하였다. 실험은 AD-acc 벡터는 AIMP2가 발현되도록 고정하고 DBD-doner 벡터에 ARS 라이브러리를 적용하는 방법(도 22의 A), DBD-doner 벡터는 AIMP2가 발현되도록 고정하고 D-acc 벡터에 ARS 라이브러리를 적용하는 방법(도 22의 B)의 두 가지로 확인하였다. In order to confirm whether the dual reporter Mega-throughput Y2H system of the present invention can provide information about each protein interaction between the library-library, the Y2H system of the present invention was operated on the ARS library (see Table 6) The result of reading the bar code with NGS was confirmed by Ceremix Co., Ltd. In the experiment, the AD-acc vector was fixed to express AIMP2 and the ARS library was applied to DBD-donor vector (FIG. 22A). DBD-doner vector was fixed to express AIMP2 and ARS library was added to D-acc vector (FIG. 22B).

그 결과 도 22 및 도 23에서 보는 바와 같이, 라이브러리를 이용한 대량의 단백질 동시 분석 실험에서 바코드 read 정도를 비교함에 따라 단백질간 상호작용 세기의 분석이 가능하였다. As a result, as shown in FIG. 22 and FIG. 23, it was possible to analyze the intensities of protein interactions by comparing the readings of bar codes in a large amount of protein simultaneous analysis using a library.

이상 살펴본 바와 같이, 본 발명은 다수의 단백질-단백질 상호작용 동시 분석을 위한 벡터에 관한 것으로, 보다 상세하게는 라이브러리 수준의 단백질들의 결합 쌍들을 동시에 효율적으로 검색하기 위한 특수한 컨스트럭트(construct)를 가지는 공여 벡터 및 수용 벡터, 상기 벡터들을 포함하는 키트 및 이를 이용한 단백질 상호작용 검출 방법에 관한 것이다. As described above, the present invention relates to a vector for simultaneous analysis of a plurality of protein-protein interactions, and more particularly, to a specific construct for simultaneously and efficiently detecting binding pairs of proteins at a library level A donor vector and acceptor vector, a kit containing the vectors, and a method for detecting protein interactions using the kit.

본 발명의 벡터 세트를 이용하여 단백질간의 상호작용을 검출하면, 단백질 라이브러리간(베이트 단백질 라이브러리 및 프레이 단백질 라이브러리)에서 동시 다발적으로 일어나는 단백질 상호작용 검출을 가능하게 할뿐만 아니라, 각 벡터에 포함된 바코드 서열을 이용하여 라이브러리 간 단백질 반응에 있어서 서로 상호작용하는 단백질들을 규명하기 위한 대량의 정보처리에 있어 이점을 제공한다. Detecting interactions between proteins using the vector set of the present invention not only enables the detection of protein interactions that occur simultaneously in protein libraries (bait protein library and pre-protein library) Barcode sequences are used to provide an advantage in the processing of large amounts of information to identify proteins that interact with each other in library protein reactions.

한국생명공학연구원Korea Biotechnology Research Institute KCTC12790BPKCTC12790BP 2015040820150408 한국생명공학연구원Korea Biotechnology Research Institute KCTC12791BPKCTC12791BP 2015040820150408 한국생명공학연구원Korea Biotechnology Research Institute KCTC12792BPKCTC12792BP 2015040820150408

<110> Medicinal Bioconvergence Research Center <120> Vectors for measuring multiple protein-protein interactions simultaneously <130> NP15-0046 <150> KR 10-2015-0037979 <151> 2015-03-19 <150> KR 1020140049726 <151> 2014-04-25 <160> 29 <170> KopatentIn 2.0 <210> 1 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Barcode template oligo AD <400> 1 cgtacgcttg ggnnnnnnnn nntttccacc gcgg 34 <210> 2 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> AD-5 (BsiW I) <400> 2 tgcacagcgt acgcttggg 19 <210> 3 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> AD-3 (Sac II) <400> 3 ggccatgccg cggtggaaa 19 <210> 4 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Barcode template oligo DBD <400> 4 accggtcttg ggnnnnnnnn nntttccact taag 34 <210> 5 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> DBD-5 (Afl II) <400> 5 tgcacagacc ggtcttggg 19 <210> 6 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> DBD-3 (Age I) <400> 6 ggccatgctt aagtggaaa 19 <210> 7 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> aaRS(F)sfi I <400> 7 gcgatcaggc ccagcaggcc ggcgccgaga ccgcggtc 38 <210> 8 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> DBD-aaRS(R)sfi I <400> 8 acagcttggc cagcagggcc ctgcaggtcg acctcgag 38 <210> 9 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> AD-aaRS(R)sfi I <400> 9 acagcttggc ccagcaggcc ctgcaggtcg acctcgag 38 <210> 10 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> primer A <400> 10 ggccgtcgac taattgagtg acgtacgctt ggg 33 <210> 11 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> primer B <400> 11 ggccatgccg cggtggaaa 19 <210> 12 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer C <400> 12 gccccaaggg gttatgctag ttatcttaag 30 <210> 13 <211> 2474 <212> DNA <213> Artificial Sequence <220> <223> Gal1 promoter- MFalpha1- myc10 repeats- Glycine/Serine linker- AgalphaI(C-term) <400> 13 acggattaga agccgccgag cgggtgacag ccctccgaag gaagactctc ctccgtgcgt 60 cctcgtcttc accggtcgcg ttcctgaaac gcagatgtgc ctcgcgccgc actgctccga 120 acaataaaga ttctacaata ctagctttta tggttatgaa gaggaaaaat tggcagtaac 180 ctggccccac aaaccttcaa atgaacgaat caaattaaca accataggat gataatgcga 240 ttagtttttt agccttattt ctggggtaat taatcagcga agcgatgatt tttgatctat 300 taacagatat ataaatgcaa aaactgcata accactttaa ctaatacttt caacattttc 360 ggtttgtatt acttcttatt caaatgtaat aaaagtatca acaaaaaatt gttaatatac 420 ctctatactt taacgtcaag gagaaaaaac cccggatcgg actactagca gctgtaatac 480 gactcactat agggaatatt aagctaattc tacttcatac attttcaatt aagagatcta 540 tgagatttcc ttcaattttt actgctgttt tattcgcagc atcctccgca ttagctgctc 600 cagtcaacac tacaacagaa gatgaaacgg cacaaattcc ggctgaagct gtcatcggtt 660 actcagattt agaaggggat ttcgatgttg ctgttttgcc attttccaac agcacaaata 720 acgggttatt gtttataaat actactattg ccagcattgc tgctaaagaa gaaggggtat 780 ctctcgagaa aagagaggct gaagctacgc gtaacacaca gtatgttttt gatatcaaaa 840 tgtcccatcg atttaaagct atggagcaaa agctcatttc tgaagaggac ttgaatgaaa 900 tggagcaaaa gctcatttct gaagaggact tgaatgaaat ggagcaaaag ctcatttctg 960 aagaggactt gaatgaaatg gagcaaaagc tcatttctga agaggacttg aatgaaatgg 1020 agcaaaagct catttctgaa gaggacttga atgaaatgga gagcttgggc gacctcacct 1080 cgatcaaaat gtcccatcga tttaaagcta tggagcaaaa gctcatttct gaagaggact 1140 tgaatgaaat ggagcaaaag ctcatttctg aagaggactt gaatgaaatg gagcaaaagc 1200 tcatttctga agaggacttg aatgaaatgg agcaaaagct catttctgaa gaggacttga 1260 atgaaatgga gcaaaagctc atttctgaag aggacttgaa tgaaatggag agcttgggcg 1320 acctcaccgc cgctaatggc aagcttctgc aggctagtgg tggtggtggt tctggtggtg 1380 gtggttctgg tggtggtggt tctgctagca tgactctcga gcttgatacc atagcaaata 1440 ctacgtacgc tacgcaattc tcgactacta gggaatttat tgtttatcag ggtcggaacc 1500 tcggtacagc tagcgccaaa agctctttta tctcaaccac tactactgat ttaacaagta 1560 taaacactag tgcgtattcc actggatcca tttccacagt agaaacaggc aatcgaacta 1620 catcagaagt gatcagccat gtggtgacta ccagcacaaa actgtctcca actgctacta 1680 ccagcctgac aattgcacaa accagtatct attctactga ctcaaatatc acagtaggaa 1740 cagatattca caccacatca gaagtgatta gtgatgtgga aaccattagc agagaaacag 1800 cttcgaccgt tgtagccgct ccaacctcaa caactggatg gacaggcgct atgaatactt 1860 acatctcgca atttacatcc tcttctttcg caacaatcaa cagcacacca ataatctctt 1920 catcagcagt atttgaaacc tcagatgctt caattgtcaa tgtgcacact gaaaatatca 1980 cgaatactgc tgctgttcca tctgaagagc ccacttttgt aaatgccacg agaaactcct 2040 taaattcctt ctgcagcagc aaacagccat ccagtccctc atcttatacg tcttccccac 2100 tcgtatcgtc cctctccgta agcaaaacat tactaagcac cagttttacg ccttctgtgc 2160 caacatctaa tacatatatc aaaacgaaaa atacgggtta ctttgagcac acggctttga 2220 caacatcttc agttggcctt aattctttta gtgaaacagc agtctcatct cagggaacga 2280 aaattgacac ctttttagtg tcatccttga tcgcatatcc ttcttctgca tcaggaagcc 2340 aattgtccgg tatccaacag aatttcacat caacttctct catgatttca acctatgaag 2400 gtaaagcgtc tatatttttc tcagctgagc tcggttcgat catttttctg cttttgtcgt 2460 acctgctatt ctaa 2474 <210> 14 <211> 1588 <212> DNA <213> Artificial Sequence <220> <223> GAL1 promoter- CRE recombinase <400> 14 acggattaga agccgccgag cgggtgacag ccctccgaag gaagactctc ctccgtgcgt 60 cctcgtcttc accggtcgcg ttcctgaaac gcagatgtgc ctcgcgccgc actgctccga 120 acaataaaga ttctacaata ctagctttta tggttatgaa gaggaaaaat tggcagtaac 180 ctggccccac aaaccttcaa atgaacgaat caaattaaca accataggat gataatgcga 240 ttagtttttt agccttattt ctggggtaat taatcagcga agcgatgatt tttgatctat 300 taacagatat ataaatgcaa aaactgcata accactttaa ctaatacttt caacattttc 360 ggtttgtatt acttcttatt caaatgtaat aaaagtatca acaaaaaatt gttaatatac 420 ctctatactt taacgtcaag gagaaaaaac tataatgact aaatctcatt cagaagaagt 480 gattgtacct gagttcaatt ctagcgcaaa ggaattacca agaccattgg ccgaaaagtg 540 cggaattcaa atgtctaatt tgttgactgt tcatcaaaat ttgccagctt tgccagttga 600 tgcaacgtct gatgaggtaa gaaagaattt gatggatatg tttagagata gacaagcatt 660 ctctgaacat acttggaaaa tgttgttgtc tgtttgtaga tcttgggctg cttggtgtaa 720 attaaataat agaaaatggt ttccagctga accagaagat gttagagatt atttgttgta 780 tttgcaagct agaggtttgg ctgttaaaac tatacaacaa catttgggtc aattaaatat 840 gttgcatagg agatctggtt tgcctagacc atctgattct aatgctgtat ctttggttat 900 gagaaggatt agaaaagaaa atgttgatgc aggtgaaaga gctaaacaag cattggcgtt 960 tgaaagaact gattttgatc aagttagatc tttgatggaa aattctgata gatgtcaaga 1020 tataagaaac ttggctttct tgggaattgc ttataataca ttgttgagaa ttgctgaaat 1080 tgctagaatt agagttaaag acatttctag aactgatggt ggtagaatgt tgattcatat 1140 tggtagaact aaaacattgg tttcaactgc tggcgttgag aaagcattgt ctttgggtgt 1200 tactaaattg gttgaaagat ggatttctgt atctggtgtg gctgatgacc caaataatta 1260 tttattttgt agagttagaa agaatggtgt tgcggctcca tctgctacat ctcagctctc 1320 tacccgtgcc ttggaaggaa tttttgaagc aactcataga ttgatttatg gtgctaaaga 1380 tgattctggt caaagatatt tagcatggtc tggtcattct gctagagttg gtgccgctag 1440 agatatggct agagctgggg tatctattcc tgaaattatg caagctggtg gttggactaa 1500 tgttaacatc gtcatgaact atattagaaa tttggattct gaaactggtg caatggttag 1560 actcttggaa gatggtgatc ccgggtag 1588 <210> 15 <211> 8410 <212> DNA <213> Artificial Sequence <220> <223> pDBD-donor <400> 15 cggtgcgggc ctcttcgcta ttacgccaga tccttttgtt gtttccgggt gtacaatatg 60 gacttcctct tttctggcaa ccaaacccat acatcgggat tcctataata ccttcgttgg 120 tctccctaac atgtaggtgg cggaggggag atatacaata gaacagatac cagacaagac 180 ataatgggct aaacaagact acaccaatta cactgcctca ttgatggtgg tacataacga 240 actaatactg tagccctaga cttgatagcc atcatcatat cgaagtttca ctaccctttt 300 tccatttgcc atctattgaa gtaataatag gcgcatgcaa cttcttttct ttttttttct 360 tttctctctc ccccgttgtt gtctcaccat atccgcaatg acaaaaaaaa tgatggaaga 420 cactaaagga aaaaattaac gacaaagaca gcaccaacag atgtcgttgt tccagagctg 480 atgaggggta tctcgaagca cacgaaactt tttccttcct tcattcacgc acactactct 540 ctaatgagca acggtatacg gccttccttc cagttacttg aatttgaaat aaaaaaagtt 600 tgctgtcttg ctatcaagta taaatagacc tgcaattatt aatcttttgt ttcctcgtca 660 ttgttctcgt tccctttctt ccttgtttct ttttctgcac aatatttcaa gctataccaa 720 gcatacaatc aactccaagc ttgaagcaag cctcctgaaa gatgaagcta ctgtcttcta 780 tcgaacaagc atgcgatatt tgccgactta aaaagctcaa gtgctccaaa gaaaaaccga 840 agtgcgccaa gtgtctgaag aacaactggg agtgtcgcta ctctcccaaa accaaaaggt 900 ctccgctgac tagggcacat ctgacagaag tggaatcaag gctagaaaga ctggaacagc 960 tatttctact gatttttcct cgagaagacc ttgacatgat tttgaaaatg gattctttac 1020 aggatataaa agcattgtta acaggattat ttgtacaaga taatgtgaat aaagatgccg 1080 tcacagatag attggcttca gtggagactg atatgcctct aacattgaga cagcatagaa 1140 taagtgcgac atcatcatcg gaagagagta gtaacaaagg tcaaagacag ttgactgtat 1200 cgccggaatt tgtaatacga ctcactatag ggcgagccgc catcatggag gagcagaagc 1260 tgatctcaga ggaggacctg catatacgcg tggcctggag ggccgccgaa ttcccgggga 1320 tccgtcgacc tgcagcggcc gcagggcctc cagggccact agttaattga gtgagacgtc 1380 ccccattcga gaataaataa cttcgtataa agtatcctat acgaagttat accggtctaa 1440 agtagcccct tgaattccga ggcagtaggc acgtgaagtt gcttcttggc ctcacctagg 1500 ctgcccgcgc cggacttgta cagctcgtcc atgccgagag tgatcccggc ggcggtcacg 1560 aactccagca ggaccatgtg atcgcgcttc tcgttggggt ctttgctcag ggcggactgg 1620 gtgctcaggt agtggttgtc gggcagcagc acggggccgt cgccgatggg ggtgttctgc 1680 tggtagtggt cggcgagctg cacgctgccg tcctcgatgt tgtggcggat cttgaagttc 1740 accttgatgc cgttcttctg cttgtcggcc atgatataga cgttgtggct gttgtagttg 1800 tactccagct tgtgccccag gatgttgccg tcctccttga agtcgatgcc cttcagctcg 1860 atgcggttca ccagggtgtc gccctcgaac ttcacctcgg cgcgggtctt gtagttgccg 1920 tcgtccttga agaagatggt gcgctcctgg acgtagcctt cgggcatggc ggacttgaag 1980 aagtcgtgct gcttcatgtg gtcggggtag cggctgaagc actgcacgcc gtaggtcagg 2040 gtggtcacga gggtgggcca gggcacgggc agcttgccgg tggtgcagat gaacttcagg 2100 gtcagcttgc cgtaggtggc atcgccctcg ccctcgccgg acacgctgaa cttgtggccg 2160 tttacgtcgc cgtccagctc gaccaggatg ggcaccaccc cggtgaacag ctcctcgccc 2220 ttgctcacca tcttaagata actagcataa ccccttgggg cctctaaacg ggtcttgagg 2280 ggttttttgc gcgcttgcag ccaagctaat tccgggcgaa tttcttatga tttatgattt 2340 ttattattaa ataagttata aaaaaaataa gtgtatacaa attttaaagt gactcttagg 2400 ttttaaaacg aaaattctta ttcttgagta actctttcct gtaggtcagg ttgctttctc 2460 aggtatagca tgaggtcgct cttattgacc acacctctac cggcatgcaa gcttggcgta 2520 atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 2580 acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgaggt aactcacatt 2640 aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta 2700 atgaatcggc caacgcgcgg ggagaggcgg ttgacgtccc ccattcgaga ataaatcgat 2760 agtcccgctc agaagaactc gtcaagaagg cgatagaagg cgatgcgctg cgaatcggga 2820 gcggcgatac cgtaaagcac gaggaagcgg tcagcccatt cgccgccaag ctcttcagca 2880 atatcacggg tagccaacgc tatgtcctga tagcggtccg ccacacccag ccggccacag 2940 tcgatgaatc cagaaaagcg gccattttcc accatgatat tcggcaagca ggcatcgtca 3000 tgggtcacga cgagatcctc gccgtcgggc atgctcgcct tgagcctggc gaacagttcg 3060 gctggcgcga gcccctgatg ctcttcgtcc agatcatcct gatcgacaag accggcttcc 3120 atccgagtac gtgctcgctc gatgcgatgt ttcgcttggt ggtcgaatgg gcaggtagcc 3180 ggatcaagcg tatgcagccg ccgcattgca tcagccatga tggatacttt ctcggcagga 3240 gcaaggtgag atgacaggag atcctgcccc ggcacttcgc ccaatagcag ccagtccctt 3300 cccgcttcag tgacaacgtc gagcacagct gcgcaaggaa cgcccgtcgt ggccagccac 3360 gatagccgcg ctgcctcgtc ttgcagttca ttcagggcac cggacaggtc ggtcttgaca 3420 aaaagaaccg ggcgcccctg cgctgacagc cggaacacgg cggcatcaga gcagccgatt 3480 gtctgttgtg cccagtcata gccgaatagc ctctccaccc aagcggccgg agaacctgcg 3540 tgcaatccat cttgttcaat catactcttc ctttttcaat attattgaag catttatcag 3600 ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg 3660 gttccgcgca catttccccg aaaggcgcgc cttattcttc accggcatct gcatccgggg 3720 tcttgaaggc gtgctggtac tccacgatgc ccagctcggt gttgctgtga tcctcctcca 3780 cgcggcggaa ggcgaacatg gggcccccgt tctgcaggat gctggggtgg atggcgctct 3840 tgaagtgcat gtggctgtcc accacggagc tgtagtagcc gccgtcgcgc aggctgaagg 3900 tgcgggtgaa gctgccatcc agatcgttat cgcccatggg gtgcaggtgc tccacggtgg 3960 cgttgctgcg gatgatcttg tcggtgaaga tcacgctgtc ctcggggaag ccggtgccca 4020 tcaccttgaa gtcgccgatc acgcggccgg cctcgtagcg gtagctgaag ctcacgtgca 4080 gcacgccgcc gtcctcgtac ttctcgatgc gggtgttggt gtagccgccg ttgttgatgg 4140 cgtgcaggaa ggggttctcg tagccgctgg ggtaggtgcc gaagtggtag aagccgtagc 4200 ccatcacgtg gctcagcagg taggggctga aggtcagggc gcctttggtg ctcttcatct 4260 tgttggtcat gcggccctgc tcgggggtgc cctctccgcc gcccaccagc tcgaactcca 4320 cgccgttcag ggtgccggtg atgcggcact cgatctccat ggcgggcagg ccgctctcgt 4380 cgctctccat agatcttgag cgtcgagtta gcatatggat cgatccatat aacttcgtat 4440 aatgtatgct atacgaagtt attacgatac cgtcaacttg tttattgcag cttataatgg 4500 taccgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg 4560 gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa 4620 cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc 4680 gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc 4740 aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag 4800 ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct 4860 cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta 4920 ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc 4980 cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc 5040 agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt 5100 gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct gcgctctgct 5160 gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc 5220 tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca 5280 agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta 5340 agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa 5400 atgaagtttt aaatcaatct aaagtatata tgagtaacct gaggctatgg cagggcctgc 5460 cgccccgacg ttggctgcga gccctgggcc ttcacccgaa cttggggggt ggggtgggga 5520 aaaggaagaa acgcgggcgt attggcccca atggggtctc ggtggggtat cgacagagtg 5580 ccagccctgg gaccgaaccc cgcgtttatg aacaaacgac ccaacaccgt gcgttttatt 5640 ctgtcttttt attgccgtca tagcgcgggt tccttccggt attgtctcct tccgtgtttc 5700 agttagcctc cccctagcta gtacaatttc ctgatgcggt attttctcct tacgcatctg 5760 tgcggtattt cacaccgcat agatcggcaa gtgcacaaac aatacttaaa taaatactac 5820 tcagtaataa cctatttctt agcatttttg acgaaatttg ctattttgtt agagtctttt 5880 acaccatttg tctccacacc tccgcttaca tcaacaccaa taacgccatt taatctaagc 5940 gcatcaccaa cattttctgg cgtcagtcca ccagctaaca taaaatgtaa gctttcgggg 6000 ctctcttgcc ttccaaccca gtcagaaatc gagttccaat ccaaaagttc acctgtccca 6060 cctgcttctg aatcaaacaa gggaataaac gaatgaggtt tctgtgaagc tgcactgagt 6120 agtatgttgc agtcttttgg aaatacgagt cttttaataa ctggcaaacc gaggaactct 6180 tggtattctt gccacgactc atctccatgc agttggacga tatcaatgcc gtaatcattg 6240 accagagcca aaacatcctc cttaggttga ttacgaaaca cgccaaccaa gtatttcgga 6300 gtgcctgaac tatttttata tgcttttaca agacttgaaa ttttccttgc aataaccggg 6360 tcaattgttc tctttctatt gggcacacat ataataccca gcaagtcagc atcggaatct 6420 agagcacatt ctgcggcctc tgtgctctgc aagccgcaaa ctttcaccaa tggaccagaa 6480 ctacctgtga aattaataac agacatactc caagctgcct ttgtgtgctt aatcacgtat 6540 actcacgtgc tcaatagtca ccaatgccct ccctcttggc cctctccttt tcttttttcg 6600 accgaattaa ttcttaatcg gcaaaaaaag aaaagctccg gatcaagatt gtacgtaagg 6660 tgacaagcta tttttcaata aagaatatct tccactactg ccatctggcg tcataactgc 6720 aaagtacaca tatattacga tgctgttcta ttaaatgctt cctatattat atatatagta 6780 atgtcgttga tctatggtgc actctcagta caatctgctc tgatgccgca tagttaagcc 6840 agccccgaca cccgccaaca cccgctgacg cgccctgacg ggcttgtctg ctcccggcat 6900 ccgcttacag acaagctgtg accgtctccg ggagctgcat gtgtcagagg ttttcaccgt 6960 catcaccgaa acgcgcgaga cgaaagggcc tcgtgatacg cctattttta taggttaatg 7020 tcatgataat aatggtttct taatatgatc caatatcaaa ggaaatgata gcattgaagg 7080 atgagactaa tccaattgag gagtggcagc atatagaaca gctaaagggt agtgctgaag 7140 gaagcatacg ataccccgca tggaatggga taatatcaca ggaggtacta gactaccttt 7200 catcctacat aaatagacgc atataagtac gcatttaagc ataaacacgc actatgccgt 7260 tcttctcatg tatatatata tacaggcaac acgcagatat aggtgcgacg tgaacagtga 7320 gctgtatgtg cgcagctcgc gttgcatttt cggaagcgct cgttttcgga aacgctttga 7380 agttcctatt ccgaagttcc tattctctag aaagtatagg aacttcagag cgcttttgaa 7440 aaccaaaagc gctctgaaga cgcactttca aaaaaccaaa aacgcaccgg actgtaacga 7500 gctactaaaa tattgcgaat accgcttcca caaacattgc tcaaaagtat ctctttgcta 7560 tatatctctg tgctatatcc ctatataacc tacccatcca cctttcgctc cttgaacttg 7620 catctaaact cgacctctac attttttatg tttatctcta gtattactct ttagacaaaa 7680 aaattgtagt aagaactatt catagagtga atcgaaaaca atacgaaaat gtaaacattt 7740 cctatacgta gtatatagag acaaaataga agaaaccgtt cataattttc tgaccaatga 7800 agaatcatca acgctatcac tttctgttca caaagtatgc gcaatccaca tcggtataga 7860 atataatcgg ggatgccttt atcttgaaaa aatgcacccg cagcttcgct agtaatcagt 7920 aaacgcggga agtggagtca ggcttttttt atggaagaga aaatagacac caaagtagcc 7980 ttcttctaac cttaacggac ctacagtgca aaaagttatc aagagactgc attatagagc 8040 gcacaaagga gaaaaaaagt aatctaagat gctttgttag aaaaatagcg ctctcgggat 8100 gcatttttgt agaacaaaaa agaagtatag attctttgtt ggtaaaatag cgctctcgcg 8160 ttgcatttct gttctgtaaa aatgcagctc agattctttg tttgaaaaat tagcgctctc 8220 gcgttgcatt tttgttttac aaaaatgaag cacagattct tcgttggtaa aatagcgctt 8280 tcgcgttgca tttctgttct gtaaaaatgc agctcagatt ctttgtttga aaaattagcg 8340 ctctcgcgtt gcatttttgt tctacaaaat gaagcacaga tgcttcgttc aggtggcact 8400 tttcggcgat 8410 <210> 16 <211> 8955 <212> DNA <213> Artificial Sequence <220> <223> pAD-acceptor <400> 16 tgcatgcctg caggtcgaga tccgggatcg aagaaatgat ggtaaatgaa ataggaaatc 60 aaggagcatg aaggcaaaag acaaatataa gggtcgaacg aaaaataaag tgaaaagtgt 120 tgatatgatg tatttggctt tgcggcgccg aaaaaacgag tttacgcaat tgcacaatca 180 tgctgactct gtggcggacc cgcgctcttg ccggcccggc gataacgctg ggcgtgaggc 240 tgtgcccggc ggagtttttt gcgcctgcat tttccaaggt ttaccctgcg ctaaggggcg 300 agattggaga agcaataaga atgccggttg gggttgcgat gatgacgacc acgacaactg 360 gtgtcattat ttaagttgcc gaaagaacct gagtgcattt gcaacatgag tatactagaa 420 gaatgagcca agacttgcga gacgcgagtt tgccggtggt gcgaacaata gagcgaccat 480 gaccttgaag gtgagacgcg cataaccgct agagtacttt gaagaggaaa cagcaatagg 540 gttgctacca gtataaatag acaggtacat acaacactgg aaatggttgt ctgtttgagt 600 acgctttcaa ttcatttggg tgtgcacttt attatgttac aatatggaag ggaactttac 660 acttctccta tgcacatata ttaattaaag tccaatgcta gtagagaagg ggggtaacac 720 ccctccgcgc tcttttccga tttttttcta aaccgtggaa tatttcggat atccttttgt 780 tgtttccggg tgtacaatat ggacttcctc ttttctggca accaaaccca tacatcggga 840 ttcctataat accttcgttg gtctccctaa catgtaggtg gcggagggga gatatacaat 900 agaacagata ccagacaaga cataatgggc taaacaagac tacaccaatt acactgcctc 960 attgatggtg gtacataacg aactaatact gtagccctag acttgatagc catcatcata 1020 tcgaagtttc actacccttt ttccatttgc catctattga agtaataata ggcgcatgca 1080 acttcttttc tttttttttc ttttctctct cccccgttgt tgtctcacca tatccgcaat 1140 gacaaaaaaa atgatggaag acactaaagg aaaaaattaa cgacaaagac agcaccaaca 1200 gatgtcgttg ttccagagct gatgaggggt atctcgaagc acacgaaact ttttccttcc 1260 ttcattcacg cacactactc tctaatgagc aacggtatac ggccttcctt ccagttactt 1320 gaatttgaaa taaaaaaaag tttgctgtct tgctatcaag tataaataga cctgcaatta 1380 ttaatctttt gtttcctcgt cattgttctc gttccctttc ttccttgttt ctttttctgc 1440 acaatatttc aagctatacc aagcatacaa tcaactccaa gctttgcaaa gatggataaa 1500 gcggaattaa ttcccgagcc tccaaaaaag aagagaaagg tcgaattggg taccgccgcc 1560 aattttaatc aaagtgggaa tattgctgat agctcattgt ccttcacttt cactaacagt 1620 agcaacggtc cgaacctcat aacaactcaa acaaattctc aagcgctttc acaaccaatt 1680 gcctcctcta acgttcatga taacttcatg aataatgaaa tcacggctag taaaattgat 1740 gatggtaata attcaaaacc actgtcacct ggttggacgg accaaactgc gtataacgcg 1800 tttggaatca ctacagggat gtttaatacc actacaatgg atgatgtata taactatcta 1860 ttcgatgatg aagatacccc accaaaccca aaaaaagaga tctttcaata cgactcacta 1920 aagggcgagc gccgccatgg ggcctggagg gccagtgaat tccacccggg tgggcatcga 1980 tacgggatcc atcgagctcg agctgcaggg cctccagggc cgtcgactaa ttgagtgaac 2040 gtacgctaaa gtagcccctt gaattccgag gcagtaggca cgtgaagttg cttcttggcc 2100 tcacctaggc tgcccgcgcc ggacttgtac agctcgtcca tgccgagagt gatcccggcg 2160 gcggtcacga actccagcag gaccatgtga tcgcgcttct cgttggggtc tttgctcagg 2220 gcggactggg tgctcaggta gtggttgtcg ggcagcagca cggggccgtc gccgatgggg 2280 gtgttctgct ggtagtggtc ggcgagctgc acgctgccgt cctcgatgtt gtggcggatc 2340 ttgaagttca ccttgatgcc gttcttctgc ttgtcggcca tgatatagac gttgtggctg 2400 ttgtagttgt actccagctt gtgccccagg atgttgccgt cctccttgaa gtcgatgccc 2460 ttcagctcga tgcggttcac cagggtgtcg ccctcgaact tcacctcggc gcgggtcttg 2520 tagttgccgt cgtccttgaa gaagatggtg cgctcctgga cgtagccttc gggcatggcg 2580 gacttgaaga agtcgtgctg cttcatgtgg tcggggtagc ggctgaagca ctgcacgccg 2640 taggtcaggg tggtcacgag ggtgggccag ggcacgggca gcttgccggt ggtgcagatg 2700 aacttcaggg tcagcttgcc gtaggtggca tcgccctcgc cctcgccgga cacgctgaac 2760 ttgtggccgt ttacgtcgcc gtccagctcg accaggatgg gcaccacccc ggtgaacagc 2820 tcctcgccct tgctcaccat ccgcggataa cttcgtataa agtatcctat acgaagttat 2880 gcatccgcta gccatgtaac ctctgatcta tagaattttt taaatgacta gaattaatgc 2940 ccatcttttt tttggaccta aattcttcat gaaaatatat tacgagggct tattcagaag 3000 ctttggactt cttcgccaga ggtttggtca agtctccaat caaggttgtc ggcttgtcta 3060 ccttgccaga aatttacgaa aagatggaaa agggtcaaat cgttggtaga tacgttgttg 3120 acacttctaa ataagcgaat ttcttatgat ttatgatttt tattattaaa taagttataa 3180 aaaaaataag tgtatacaaa ttttaaagtg actcttaggt tttaaaacga aaattcttat 3240 tcttgagtaa ctctttcctg taggtcaggt tgctttctca ggtatagcat gaggtcgctc 3300 ttattgacca cacctctacc ggccggtcga aattccccta ccctatgaac atattccatt 3360 ttgtaatttc gtgtcgtttc tattatgaat ttcatttata aagtttatgt acaaatatca 3420 taaaaaaacc tagggcatcc accatgaaaa agcctgaact caccgcgacg tctgtcgaga 3480 agtttctgat cgaaaagttc gacagcgtct ccgacctgat gcagctctcg gagggcgaag 3540 aatctcgtgc tttcagcttc gatgtaggag ggcgtggata tgtcctgcgg gtaaatagct 3600 gcgccgatgg tttctacaaa gatcgttatg tttatcggca ctttgcatcg gccgcgctcc 3660 cgattccgga agtgcttgac attggggagt tcagcgagag cctgacctat tgcatctccc 3720 gccgtgcaca gggtgtcacg ttgcaagacc tgcctgaaac cgaactgccc gctgttctgc 3780 agcttacata tggatcgatc catataactt cgtataatgt atgctatacg aagttatact 3840 agtaaggatt ttcttaactt cttcggcgac agcatcaccg acttcggtgg tactgttgga 3900 accacctaaa tcaccagttc tgatacctgc atccaaaacc tttttaactg catcttcaat 3960 ggccttacct tcttcaggca agttcaatga caatttcaac atcattgcag cagacaagat 4020 agtggcgata gggttgacct tattctttgg caaatctgca gcagaaccgt ggcatggttc 4080 gtacaaacca aatgcggtgt tcttgtctgg caaagaggcc aaggacgcag atggcaacaa 4140 acccaaggaa cctgggataa cggaggcttc atcggagatg atatcaccaa acatgttgct 4200 ggtgattata ataccattta ggtgggttgg gttcttaact aggatcatgg cggcagaatc 4260 aatcaattga tgttgaacct tcaatgtagg aaattcgttc ttgatggttt cctccacagt 4320 ttttctccat aatcttgaag aggccaaaac attagcttta tccaaggacc aaataggcaa 4380 tggtggctca tgttgtaggg ccatgaaagc ggccattctt gtgattcttt gcacttctgg 4440 aacggtgtat tgttcactat cccaagcgac accatcacca tcgtcttcct ttctcttacc 4500 aaagtaaata cctcccacta attctctgac aacaacgaag tcagtacctt tagcaaattg 4560 tggcttgatt ggagataagt ctaaaagaga gtcggatgca aagttacatg gtcttaagtt 4620 ggcgtacaat tgaagttctt tacggatttt tagtaaacct tgttcaggtc taacactacc 4680 tgtaccccat ttaggaccac ccacagcacc taacaaaacg gcatcaacct tcttggaggc 4740 ttccagcgcc tcatctggaa gtgggacacc tgtagcgtcg atagcagcac caccaattaa 4800 atgattttcg aaatcgaact tgacattgga acgaacatca gaaatagctt taagaacctt 4860 aatggcttcg gctgtgattt cttgaccaac gtggtcacct ggcaaaacga cgatcttctt 4920 aggggcagac attagaatgg tatatccttg aaatatatat atatattgct gaaatgtaaa 4980 aggtaagaaa agttagaaag taagacgatt gctaaccacc tattggaaaa aacaataggt 5040 ccttaaataa tattgtcaac ttcaagtatt gtgatgcaag catttagtca tgaacgcttc 5100 tctattctat atgaaaagcc ggttccggcg ctctcacctt tcctttttct cccaattttt 5160 cagttgaaaa aggtatatgc gtcaggcgac ctctgaaatt aacaaaaaat ttccagtcat 5220 cgaatttgat tctgtgcgat agcgcccctg tgtgttctcg ttatgttgag gaaaaaaata 5280 atggttgcta agagattcga actcttgcat cttacgatac ctgagtattc ccacagttgg 5340 ggatctcgac tctagctaga ggatcaattc gtaatcatgg tcatagctgt ttcctgtgtg 5400 aaattgttat ccgctcacaa ttccacacaa catacgagcc ggaagcataa agtgtaaagc 5460 ctggggtgcc taatgagtga gctaactcac attaattgcg ttgcgctcac tgcccgcttt 5520 ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg 5580 cggtttgcgt attgggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt 5640 tcggctgcgg cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc 5700 aggggataac gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa 5760 aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 5820 tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 5880 ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 5940 cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag 6000 ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 6060 ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 6120 gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 6180 agagttcttg aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg 6240 cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 6300 aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 6360 aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 6420 ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt 6480 aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag 6540 ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 6600 agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 6660 cagtgctgca atgataccgc gagacccacg ctcaccggct gcagatttat cagcaataaa 6720 ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 6780 gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 6840 cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 6900 cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 6960 ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 7020 catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 7080 tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 7140 ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 7200 catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 7260 cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 7320 cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 7380 acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg 7440 ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 7500 tccgcgcaca tttccccgaa aagtgccacc tgacgtctaa gaaaccatta ttatcatgac 7560 attaacctat aaaaataggc gtatcacgag gccctttcgt ctcgcgcgtt tcggtgatga 7620 cggtgaaaac ctctgacaca tgcagctccc ggagacggtc acagcttgtc tgtaagcgga 7680 tgccgggagc agacaagccc gtcagggcgc gtcagcgggt gttggcgggt gtcggggctg 7740 gcttaactat gcggcatcag agcagattgt actgagagtg caccataacg catttaagca 7800 taaacacgca ctatgccgtt cttctcatgt atatatatat acaggcaaca cgcagatata 7860 ggtgcgacgt gaacagtgag ctgtatgtgc gcagctcgcg ttgcattttc ggaagcgctc 7920 gttttcggaa acgctttgaa gttcctattc cgaagttcct attctctagc tagaaagtat 7980 aggaacttca gagcgctttt gaaaaccaaa agcgctctga agacgcactt tcaaaaaacc 8040 aaaaacgcac cggactgtaa cgagctacta aaatattgcg aataccgctt ccacaaacat 8100 tgctcaaaag tatctctttg ctatatatct ctgtgctata tccctatata acctacccat 8160 ccacctttcg ctccttgaac ttgcatctaa actcgacctc tacatttttt atgtttatct 8220 ctagtattac tctttagaca aaaaaattgt agtaagaact attcatagag tgaatcgaaa 8280 acaatacgaa aatgtaaaca tttcctatac gtagtatata gagacaaaat agaagaaacc 8340 gttcataatt ttctgaccaa tgaagaatca tcaacgctat cactttctgt tcacaaagta 8400 tgcgcaatcc acatcggtat agaatataat cggggatgcc tttatcttga aaaaatgcac 8460 ccgcagcttc gctagtaatc agtaaacgcg ggaagtggag tcaggctttt tttatggaag 8520 agaaaataga caccaaagta gccttcttct aaccttaacg gacctacagt gcaaaaagtt 8580 atcaagagac tgcattatag agcgcacaaa ggagaaaaaa agtaatctaa gatgctttgt 8640 tagaaaaata gcgctctcgg gatgcatttt tgtagaacaa aaaagaagta tagattcttt 8700 gttggtaaaa tagcgctctc gcgttgcatt tctgttctgt aaaaatgcag ctcagattct 8760 ttgtttgaaa aattagcgct ctcgcgttgc atttttgttt tacaaaaatg aagcacagat 8820 tcttcgttgg taaaatagcg ctttcgcgtt gcatttctgt tctgtaaaaa tgcagctcag 8880 attctttgtt tgaaaaatta gcgctctcgc gttgcatttt tgttctacaa aatgaagcac 8940 agatgcttcg ttgct 8955 <210> 17 <211> 8955 <212> DNA <213> Artificial Sequence <220> <223> pAD-acceptor <400> 17 tgcatgcctg caggtcgaga tccgggatcg aagaaatgat ggtaaatgaa ataggaaatc 60 aaggagcatg aaggcaaaag acaaatataa gggtcgaacg aaaaataaag tgaaaagtgt 120 tgatatgatg tatttggctt tgcggcgccg aaaaaacgag tttacgcaat tgcacaatca 180 tgctgactct gtggcggacc cgcgctcttg ccggcccggc gataacgctg ggcgtgaggc 240 tgtgcccggc ggagtttttt gcgcctgcat tttccaaggt ttaccctgcg ctaaggggcg 300 agattggaga agcaataaga atgccggttg gggttgcgat gatgacgacc acgacaactg 360 gtgtcattat ttaagttgcc gaaagaacct gagtgcattt gcaacatgag tatactagaa 420 gaatgagcca agacttgcga gacgcgagtt tgccggtggt gcgaacaata gagcgaccat 480 gaccttgaag gtgagacgcg cataaccgct agagtacttt gaagaggaaa cagcaatagg 540 gttgctacca gtataaatag acaggtacat acaacactgg aaatggttgt ctgtttgagt 600 acgctttcaa ttcatttggg tgtgcacttt attatgttac aatatggaag ggaactttac 660 acttctccta tgcacatata ttaattaaag tccaatgcta gtagagaagg ggggtaacac 720 ccctccgcgc tcttttccga tttttttcta aaccgtggaa tatttcggat atccttttgt 780 tgtttccggg tgtacaatat ggacttcctc ttttctggca accaaaccca tacatcggga 840 ttcctataat accttcgttg gtctccctaa catgtaggtg gcggagggga gatatacaat 900 agaacagata ccagacaaga cataatgggc taaacaagac tacaccaatt acactgcctc 960 attgatggtg gtacataacg aactaatact gtagccctag acttgatagc catcatcata 1020 tcgaagtttc actacccttt ttccatttgc catctattga agtaataata ggcgcatgca 1080 acttcttttc tttttttttc ttttctctct cccccgttgt tgtctcacca tatccgcaat 1140 gacaaaaaaa atgatggaag acactaaagg aaaaaattaa cgacaaagac agcaccaaca 1200 gatgtcgttg ttccagagct gatgaggggt atctcgaagc acacgaaact ttttccttcc 1260 ttcattcacg cacactactc tctaatgagc aacggtatac ggccttcctt ccagttactt 1320 gaatttgaaa taaaaaaaag tttgctgtct tgctatcaag tataaataga cctgcaatta 1380 ttaatctttt gtttcctcgt cattgttctc gttccctttc ttccttgttt ctttttctgc 1440 acaatatttc aagctatacc aagcatacaa tcaactccaa gctttgcaaa gatggataaa 1500 gcggaattaa ttcccgagcc tccaaaaaag aagagaaagg tcgaattggg taccgccgcc 1560 aattttaatc aaagtgggaa tattgctgat agctcattgt ccttcacttt cactaacagt 1620 agcaacggtc cgaacctcat aacaactcaa acaaattctc aagcgctttc acaaccaatt 1680 gcctcctcta acgttcatga taacttcatg aataatgaaa tcacggctag taaaattgat 1740 gatggtaata attcaaaacc actgtcacct ggttggacgg accaaactgc gtataacgcg 1800 tttggaatca ctacagggat gtttaatacc actacaatgg atgatgtata taactatcta 1860 ttcgatgatg aagatacccc accaaaccca aaaaaagaga tctttcaata cgactcacta 1920 aagggcgagc gccgccatgg ggcctggagg gccagtgaat tccacccggg tgggcatcga 1980 tacgggatcc atcgagctcg agctgcaggg cctccagggc cgtcgactaa ttgagtgaat 2040 ctagactaaa gtagcccctt gaattccgag gcagtaggca cgtgaagttg cttcttggcc 2100 tcacctaggc tgcccgcgcc ggacttgtac agctcgtcca tgccgagagt gatcccggcg 2160 gcggtcacga actccagcag gaccatgtga tcgcgcttct cgttggggtc tttgctcagg 2220 gcggactggg tgctcaggta gtggttgtcg ggcagcagca cggggccgtc gccgatgggg 2280 gtgttctgct ggtagtggtc ggcgagctgc acgctgccgt cctcgatgtt gtggcggatc 2340 ttgaagttca ccttgatgcc gttcttctgc ttgtcggcca tgatatagac gttgtggctg 2400 ttgtagttgt actccagctt gtgccccagg atgttgccgt cctccttgaa gtcgatgccc 2460 ttcagctcga tgcggttcac cagggtgtcg ccctcgaact tcacctcggc gcgggtcttg 2520 tagttgccgt cgtccttgaa gaagatggtg cgctcctgga cgtagccttc gggcatggcg 2580 gacttgaaga agtcgtgctg cttcatgtgg tcggggtagc ggctgaagca ctgcacgccg 2640 taggtcaggg tggtcacgag ggtgggccag ggcacgggca gcttgccggt ggtgcagatg 2700 aacttcaggg tcagcttgcc gtaggtggca tcgccctcgc cctcgccgga cacgctgaac 2760 ttgtggccgt ttacgtcgcc gtccagctcg accaggatgg gcaccacccc ggtgaacagc 2820 tcctcgccct tgctcaccat ccgcggataa cttcgtataa agtatcctat acgaagttat 2880 gcatccgcta gccatgtaac ctctgatcta tagaattttt taaatgacta gaattaatgc 2940 ccatcttttt tttggaccta aattcttcat gaaaatatat tacgagggct tattcagaag 3000 ctttggactt cttcgccaga ggtttggtca agtctccaat caaggttgtc ggcttgtcta 3060 ccttgccaga aatttacgaa aagatggaaa agggtcaaat cgttggtaga tacgttgttg 3120 acacttctaa ataagcgaat ttcttatgat ttatgatttt tattattaaa taagttataa 3180 aaaaaataag tgtatacaaa ttttaaagtg actcttaggt tttaaaacga aaattcttat 3240 tcttgagtaa ctctttcctg taggtcaggt tgctttctca ggtatagcat gaggtcgctc 3300 ttattgacca cacctctacc ggccggtcga aattccccta ccctatgaac atattccatt 3360 ttgtaatttc gtgtcgtttc tattatgaat ttcatttata aagtttatgt acaaatatca 3420 taaaaaaacc tagggcatcc accatgaaaa agcctgaact caccgcgacg tctgtcgaga 3480 agtttctgat cgaaaagttc gacagcgtct ccgacctgat gcagctctcg gagggcgaag 3540 aatctcgtgc tttcagcttc gatgtaggag ggcgtggata tgtcctgcgg gtaaatagct 3600 gcgccgatgg tttctacaaa gatcgttatg tttatcggca ctttgcatcg gccgcgctcc 3660 cgattccgga agtgcttgac attggggagt tcagcgagag cctgacctat tgcatctccc 3720 gccgtgcaca gggtgtcacg ttgcaagacc tgcctgaaac cgaactgccc gctgttctgc 3780 agcttacata tggatcgatc catataactt cgtataatgt atgctatacg aagttatact 3840 agtaaggatt ttcttaactt cttcggcgac agcatcaccg acttcggtgg tactgttgga 3900 accacctaaa tcaccagttc tgatacctgc atccaaaacc tttttaactg catcttcaat 3960 ggccttacct tcttcaggca agttcaatga caatttcaac atcattgcag cagacaagat 4020 agtggcgata gggttgacct tattctttgg caaatctgca gcagaaccgt ggcatggttc 4080 gtacaaacca aatgcggtgt tcttgtctgg caaagaggcc aaggacgcag atggcaacaa 4140 acccaaggaa cctgggataa cggaggcttc atcggagatg atatcaccaa acatgttgct 4200 ggtgattata ataccattta ggtgggttgg gttcttaact aggatcatgg cggcagaatc 4260 aatcaattga tgttgaacct tcaatgtagg aaattcgttc ttgatggttt cctccacagt 4320 ttttctccat aatcttgaag aggccaaaac attagcttta tccaaggacc aaataggcaa 4380 tggtggctca tgttgtaggg ccatgaaagc ggccattctt gtgattcttt gcacttctgg 4440 aacggtgtat tgttcactat cccaagcgac accatcacca tcgtcttcct ttctcttacc 4500 aaagtaaata cctcccacta attctctgac aacaacgaag tcagtacctt tagcaaattg 4560 tggcttgatt ggagataagt ctaaaagaga gtcggatgca aagttacatg gtcttaagtt 4620 ggcgtacaat tgaagttctt tacggatttt tagtaaacct tgttcaggtc taacactacc 4680 tgtaccccat ttaggaccac ccacagcacc taacaaaacg gcatcaacct tcttggaggc 4740 ttccagcgcc tcatctggaa gtgggacacc tgtagcgtcg atagcagcac caccaattaa 4800 atgattttcg aaatcgaact tgacattgga acgaacatca gaaatagctt taagaacctt 4860 aatggcttcg gctgtgattt cttgaccaac gtggtcacct ggcaaaacga cgatcttctt 4920 aggggcagac attagaatgg tatatccttg aaatatatat atatattgct gaaatgtaaa 4980 aggtaagaaa agttagaaag taagacgatt gctaaccacc tattggaaaa aacaataggt 5040 ccttaaataa tattgtcaac ttcaagtatt gtgatgcaag catttagtca tgaacgcttc 5100 tctattctat atgaaaagcc ggttccggcg ctctcacctt tcctttttct cccaattttt 5160 cagttgaaaa aggtatatgc gtcaggcgac ctctgaaatt aacaaaaaat ttccagtcat 5220 cgaatttgat tctgtgcgat agcgcccctg tgtgttctcg ttatgttgag gaaaaaaata 5280 atggttgcta agagattcga actcttgcat cttacgatac ctgagtattc ccacagttgg 5340 ggatctcgac tctagctaga ggatcaattc gtaatcatgg tcatagctgt ttcctgtgtg 5400 aaattgttat ccgctcacaa ttccacacaa catacgagcc ggaagcataa agtgtaaagc 5460 ctggggtgcc taatgagtga gctaactcac attaattgcg ttgcgctcac tgcccgcttt 5520 ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg 5580 cggtttgcgt attgggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt 5640 tcggctgcgg cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc 5700 aggggataac gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa 5760 aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 5820 tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 5880 ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 5940 cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag 6000 ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 6060 ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 6120 gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 6180 agagttcttg aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg 6240 cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 6300 aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 6360 aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 6420 ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt 6480 aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag 6540 ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 6600 agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 6660 cagtgctgca atgataccgc gagacccacg ctcaccggct gcagatttat cagcaataaa 6720 ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 6780 gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 6840 cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 6900 cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 6960 ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 7020 catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 7080 tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 7140 ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 7200 catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 7260 cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 7320 cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 7380 acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg 7440 ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 7500 tccgcgcaca tttccccgaa aagtgccacc tgacgtctaa gaaaccatta ttatcatgac 7560 attaacctat aaaaataggc gtatcacgag gccctttcgt ctcgcgcgtt tcggtgatga 7620 cggtgaaaac ctctgacaca tgcagctccc ggagacggtc acagcttgtc tgtaagcgga 7680 tgccgggagc agacaagccc gtcagggcgc gtcagcgggt gttggcgggt gtcggggctg 7740 gcttaactat gcggcatcag agcagattgt actgagagtg caccataacg catttaagca 7800 taaacacgca ctatgccgtt cttctcatgt atatatatat acaggcaaca cgcagatata 7860 ggtgcgacgt gaacagtgag ctgtatgtgc gcagctcgcg ttgcattttc ggaagcgctc 7920 gttttcggaa acgctttgaa gttcctattc cgaagttcct attctctagc tagaaagtat 7980 aggaacttca gagcgctttt gaaaaccaaa agcgctctga agacgcactt tcaaaaaacc 8040 aaaaacgcac cggactgtaa cgagctacta aaatattgcg aataccgctt ccacaaacat 8100 tgctcaaaag tatctctttg ctatatatct ctgtgctata tccctatata acctacccat 8160 ccacctttcg ctccttgaac ttgcatctaa actcgacctc tacatttttt atgtttatct 8220 ctagtattac tctttagaca aaaaaattgt agtaagaact attcatagag tgaatcgaaa 8280 acaatacgaa aatgtaaaca tttcctatac gtagtatata gagacaaaat agaagaaacc 8340 gttcataatt ttctgaccaa tgaagaatca tcaacgctat cactttctgt tcacaaagta 8400 tgcgcaatcc acatcggtat agaatataat cggggatgcc tttatcttga aaaaatgcac 8460 ccgcagcttc gctagtaatc agtaaacgcg ggaagtggag tcaggctttt tttatggaag 8520 agaaaataga caccaaagta gccttcttct aaccttaacg gacctacagt gcaaaaagtt 8580 atcaagagac tgcattatag agcgcacaaa ggagaaaaaa agtaatctaa gatgctttgt 8640 tagaaaaata gcgctctcgg gatgcatttt tgtagaacaa aaaagaagta tagattcttt 8700 gttggtaaaa tagcgctctc gcgttgcatt tctgttctgt aaaaatgcag ctcagattct 8760 ttgtttgaaa aattagcgct ctcgcgttgc atttttgttt tacaaaaatg aagcacagat 8820 tcttcgttgg taaaatagcg ctttcgcgtt gcatttctgt tctgtaaaaa tgcagctcag 8880 attctttgtt tgaaaaatta gcgctctcgc gttgcatttt tgttctacaa aatgaagcac 8940 agatgcttcg ttgct 8955 <210> 18 <211> 622 <212> PRT <213> Artificial Sequence <220> <223> SV40 LTag a.a sequence <400> 18 Gly Thr Asp Glu Trp Glu Gln Trp Trp Asn Ala Phe Asn Glu Glu Asn 1 5 10 15 Leu Phe Cys Ser Glu Glu Met Pro Ser Ser Asp Asp Glu Ala Thr Ala 20 25 30 Asp Ser Gln His Ser Thr Pro Pro Lys Lys Lys Arg Lys Val Glu Asp 35 40 45 Pro Lys Asp Phe Pro Ser Glu Leu Leu Ser Phe Leu Ser His Ala Val 50 55 60 Phe Ser Asn Arg Thr Leu Ala Cys Phe Ala Ile Tyr Thr Thr Lys Glu 65 70 75 80 Lys Ala Ala Leu Leu Tyr Lys Lys Ile Met Glu Lys Tyr Ser Val Thr 85 90 95 Phe Ile Ser Arg His Asn Ser Tyr Asn His Asn Ile Leu Phe Phe Leu 100 105 110 Thr Pro His Arg His Arg Val Ser Ala Ile Asn Asn Tyr Ala Gln Lys 115 120 125 Leu Cys Thr Phe Ser Phe Leu Ile Cys Lys Gly Val Asn Lys Glu Tyr 130 135 140 Leu Met Tyr Ser Ala Leu Thr Arg Asp Pro Phe Ser Val Ile Glu Glu 145 150 155 160 Ser Leu Pro Gly Gly Leu Lys Glu His Asp Phe Asn Pro Glu Glu Ala 165 170 175 Glu Glu Thr Lys Gln Val Ser Trp Lys Leu Val Thr Glu Tyr Ala Met 180 185 190 Glu Thr Lys Cys Asp Asp Val Leu Leu Leu Leu Gly Met Tyr Leu Glu 195 200 205 Phe Gln Tyr Ser Phe Glu Met Cys Leu Lys Cys Ile Lys Lys Glu Gln 210 215 220 Pro Ser His Tyr Lys Tyr His Glu Lys His Tyr Ala Asn Ala Ala Ile 225 230 235 240 Phe Ala Asp Ser Lys Asn Gln Lys Thr Ile Cys Gln Gln Ala Val Asp 245 250 255 Thr Val Leu Ala Lys Lys Arg Val Asp Ser Leu Gln Leu Thr Arg Glu 260 265 270 Gln Met Leu Thr Asn Arg Phe Asn Asp Leu Leu Asp Arg Met Asp Ile 275 280 285 Met Phe Gly Ser Thr Gly Ser Ala Asp Ile Glu Glu Trp Met Ala Gly 290 295 300 Val Ala Trp Leu His Cys Leu Leu Pro Lys Met Asp Ser Val Val Tyr 305 310 315 320 Asp Phe Leu Lys Cys Met Val Tyr Asn Ile Pro Lys Lys Arg Tyr Trp 325 330 335 Leu Phe Lys Gly Pro Ile Asp Ser Gly Lys Thr Thr Leu Ala Ala Ala 340 345 350 Leu Leu Glu Leu Cys Gly Gly Lys Ala Leu Asn Val Asn Leu Pro Leu 355 360 365 Asp Arg Leu Asn Phe Glu Leu Gly Val Ala Ile Asp Gln Phe Leu Val 370 375 380 Val Phe Glu Asp Val Lys Gly Thr Gly Gly Glu Ser Arg Asp Leu Pro 385 390 395 400 Ser Gly Gln Gly Ile Asn Asn Leu Asp Asn Leu Arg Asp Tyr Leu Asp 405 410 415 Gly Ser Val Lys Val Asn Leu Glu Lys Lys His Leu Asn Lys Arg Thr 420 425 430 Gln Ile Phe Pro Pro Gly Ile Val Thr Met Asn Glu Tyr Ser Val Pro 435 440 445 Lys Thr Leu Gln Ala Arg Phe Val Lys Gln Ile Asp Phe Arg Pro Lys 450 455 460 Asp Tyr Leu Lys His Cys Leu Glu Arg Ser Glu Phe Leu Leu Glu Lys 465 470 475 480 Arg Ile Ile Gln Ser Gly Ile Ala Leu Leu Leu Met Leu Ile Trp Tyr 485 490 495 Arg Pro Val Ala Glu Phe Ala Gln Ser Ile Gln Ser Arg Ile Val Glu 500 505 510 Trp Lys Glu Arg Leu Asp Lys Glu Phe Ser Leu Ser Val Tyr Gln Lys 515 520 525 Met Lys Phe Asn Val Ala Met Gly Ile Gly Val Leu Asp Trp Leu Arg 530 535 540 Asn Ser Asp Asp Asp Asp Glu Asp Ser Gln Glu Asn Ala Asp Lys Asn 545 550 555 560 Glu Asp Gly Gly Glu Lys Asn Met Glu Asp Ser Gly His Glu Thr Gly 565 570 575 Ile Asp Ser Gln Ser Gln Gly Ser Phe Gln Ala Pro Gln Ser Ser Gln 580 585 590 Ser Val His Asp His Asn Gln Pro Tyr His Ile Cys Arg Gly Phe Thr 595 600 605 Cys Phe Lys Lys Pro Pro Thr Pro Pro Pro Glu Pro Glu Thr 610 615 620 <210> 19 <211> 319 <212> PRT <213> Artificial Sequence <220> <223> Murine p53 a.a sequence <400> 19 Pro Val Thr Glu Thr Pro Gly Pro Val Ala Pro Ala Pro Ala Thr Pro 1 5 10 15 Trp Pro Leu Ser Ser Phe Val Pro Ser Gln Lys Thr Tyr Gln Gly Asn 20 25 30 Tyr Gly Phe His Leu Gly Phe Leu Gln Ser Gly Thr Ala Lys Ser Val 35 40 45 Met Cys Thr Tyr Ser Pro Pro Leu Asn Lys Leu Phe Cys Gln Leu Val 50 55 60 Lys Thr Cys Pro Val Gln Leu Trp Val Ser Ala Thr Pro Pro Ala Gly 65 70 75 80 Ser Arg Val Arg Ala Met Ala Ile Tyr Lys Lys Ser Gln His Met Thr 85 90 95 Glu Val Val Arg Arg Cys Pro His His Glu Arg Cys Ser Asp Gly Asp 100 105 110 Gly Leu Ala Pro Pro Gln His Leu Ile Arg Val Glu Gly Asn Leu Tyr 115 120 125 Pro Glu Tyr Leu Glu Asp Arg Gln Thr Phe Arg His Ser Val Val Val 130 135 140 Pro Tyr Glu Pro Pro Glu Ala Gly Ser Glu Tyr Thr Thr Ile His Tyr 145 150 155 160 Lys Tyr Met Cys Asn Ser Ser Cys Met Gly Gly Met Asn Arg Arg Pro 165 170 175 Ile Leu Thr Ile Ile Thr Leu Glu Asp Ser Ser Gly Asn Leu Leu Gly 180 185 190 Arg Asp Ser Phe Glu Val Arg Val Cys Ala Cys Pro Gly Arg Asp Arg 195 200 205 Arg Thr Glu Glu Glu Asn Phe Arg Lys Lys Glu Val Leu Cys Pro Glu 210 215 220 Leu Pro Pro Gly Ser Ala Lys Arg Ala Leu Pro Thr Cys Thr Ser Ala 225 230 235 240 Ser Pro Pro Gln Lys Lys Lys Pro Leu Asp Gly Glu Tyr Phe Thr Leu 245 250 255 Lys Ile Arg Gly Arg Lys Arg Phe Glu Met Phe Arg Glu Leu Asn Glu 260 265 270 Ala Leu Glu Leu Lys Asp Ala His Ala Thr Glu Glu Ser Gly Asp Ser 275 280 285 Arg Ala His Ser Ser Tyr Leu Lys Thr Lys Lys Gly Gln Ser Thr Ser 290 295 300 Arg His Lys Lys Thr Met Val Lys Lys Val Gly Pro Asp Ser Asp 305 310 315 <210> 20 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> lox 2272 <400> 20 ataacttcgt ataaagtatc ctatacgaag ttat 34 <210> 21 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> lox P <400> 21 ataacttcgt ataatgtatg ctatacgaag ttat 34 <210> 22 <211> 251 <212> PRT <213> Artificial Sequence <220> <223> DX2(AIMP2-DX2) <400> 22 Met Pro Met Tyr Gln Val Lys Pro Tyr His Gly Gly Gly Ala Pro Leu 1 5 10 15 Arg Val Glu Leu Pro Thr Cys Met Tyr Arg Leu Pro Asn Val His Gly 20 25 30 Arg Ser Tyr Gly Pro Ala Pro Gly Ala Gly His Val Gln Asp Tyr Gly 35 40 45 Ala Leu Lys Asp Ile Val Ile Asn Ala Asn Pro Ala Ser Pro Pro Leu 50 55 60 Ser Leu Leu Val Leu His Arg Leu Leu Cys Glu His Phe Arg Val Leu 65 70 75 80 Ser Thr Val His Thr His Ser Ser Val Lys Ser Val Pro Glu Asn Leu 85 90 95 Leu Lys Cys Phe Gly Glu Gln Asn Lys Lys Gln Pro Arg Gln Asp Tyr 100 105 110 Gln Leu Gly Phe Thr Leu Ile Trp Lys Asn Val Pro Lys Thr Gln Met 115 120 125 Lys Phe Ser Ile Gln Thr Met Cys Pro Ile Glu Gly Glu Gly Asn Ile 130 135 140 Ala Arg Phe Leu Phe Ser Leu Phe Gly Gln Lys His Asn Ala Val Asn 145 150 155 160 Ala Thr Leu Ile Asp Ser Trp Val Asp Ile Ala Ile Phe Gln Leu Lys 165 170 175 Glu Gly Ser Ser Lys Glu Lys Ala Ala Val Phe Arg Ser Met Asn Ser 180 185 190 Ala Leu Gly Lys Ser Pro Trp Leu Ala Gly Asn Glu Leu Thr Val Ala 195 200 205 Asp Val Val Leu Trp Ser Val Leu Gln Gln Ile Gly Gly Cys Ser Val 210 215 220 Thr Val Pro Ala Asn Val Gln Arg Trp Met Arg Ser Cys Glu Asn Leu 225 230 235 240 Ala Pro Phe Asn Thr Ala Leu Lys Leu Leu Lys 245 250 <210> 23 <211> 181 <212> PRT <213> Artificial Sequence <220> <223> Lamin A (Homo sapiens) <400> 23 Met Glu Ala Glu Phe Pro Gly Ile Ser Glu Glu Val Val Ser Arg Glu 1 5 10 15 Val Ser Gly Ile Lys Ala Ala Tyr Glu Ala Glu Leu Gly Asp Ala Arg 20 25 30 Lys Thr Leu Asp Ser Val Ala Lys Glu Arg Ala Arg Leu Gln Leu Glu 35 40 45 Leu Ser Lys Val Arg Glu Glu Phe Lys Glu Leu Lys Ala Arg Asn Thr 50 55 60 Lys Lys Glu Gly Asp Leu Ile Ala Ala Gln Ala Arg Leu Lys Asp Leu 65 70 75 80 Glu Ala Leu Leu Asn Ser Lys Glu Ala Ala Leu Ser Thr Ala Leu Ser 85 90 95 Glu Lys Arg Thr Leu Glu Gly Glu Leu His Asp Leu Arg Gly Gln Val 100 105 110 Ala Lys Leu Glu Ala Ala Leu Gly Glu Ala Lys Lys Gln Leu Gln Asp 115 120 125 Glu Met Leu Arg Arg Val Asp Ala Glu Asn Arg Leu Gln Thr Met Lys 130 135 140 Glu Glu Leu Asp Phe Gln Lys Asn Ile Tyr Ser Glu Glu Leu Arg Glu 145 150 155 160 Thr Lys Arg Arg His Glu Thr Arg Leu Val Glu Ile Asp Arg Ile Arg 165 170 175 Arg Pro Ala Ala Ala 180 <210> 24 <211> 450 <212> DNA <213> Artificial Sequence <220> <223> Gal1 promoter <400> 24 acggattaga agccgccgag cgggtgacag ccctccgaag gaagactctc ctccgtgcgt 60 cctcgtcttc accggtcgcg ttcctgaaac gcagatgtgc ctcgcgccgc actgctccga 120 acaataaaga ttctacaata ctagctttta tggttatgaa gaggaaaaat tggcagtaac 180 ctggccccac aaaccttcaa atgaacgaat caaattaaca accataggat gataatgcga 240 ttagtttttt agccttattt ctggggtaat taatcagcga agcgatgatt tttgatctat 300 taacagatat ataaatgcaa aaactgcata accactttaa ctaatacttt caacattttc 360 ggtttgtatt acttcttatt caaatgtaat aaaagtatca acaaaaaatt gttaatatac 420 ctctatactt taacgtcaag gagaaaaaac 450 <210> 25 <211> 267 <212> DNA <213> Artificial Sequence <220> <223> MFalpha 1 <400> 25 atgagatttc cttcaatttt tactgctgtt ttattcgcag catcctccgc attagctgct 60 ccagtcaaca ctacaacaga agatgaaacg gcacaaattc cggctgaagc tgtcatcggt 120 tactcagatt tagaagggga tttcgatgtt gctgttttgc cattttccaa cagcacaaat 180 aacgggttat tgtttataaa tactactatt gccagcattg ctgctaaaga agaaggggta 240 tctctcgaga aaagagaggc tgaagct 267 <210> 26 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> c-myc <400> 26 gagcaaaagc tcatttctga agaggacttg 30 <210> 27 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Glycine/Serine linker <400> 27 gctagtggtg gtggtggttc tggtggtggt ggttctggtg gtggtggt 48 <210> 28 <211> 1053 <212> DNA <213> Artificial Sequence <220> <223> Ag alpha I <400> 28 cttgatacca tagcaaatac tacgtacgct acgcaattct cgactactag ggaatttatt 60 gtttatcagg gtcggaacct cggtacagct agcgccaaaa gctcttttat ctcaaccact 120 actactgatt taacaagtat aaacactagt gcgtattcca ctggatccat ttccacagta 180 gaaacaggca atcgaactac atcagaagtg atcagccatg tggtgactac cagcacaaaa 240 ctgtctccaa ctgctactac cagcctgaca attgcacaaa ccagtatcta ttctactgac 300 tcaaatatca cagtaggaac agatattcac accacatcag aagtgattag tgatgtggaa 360 accattagca gagaaacagc ttcgaccgtt gtagccgctc caacctcaac aactggatgg 420 acaggcgcta tgaatactta catctcgcaa tttacatcct cttctttcgc aacaatcaac 480 agcacaccaa taatctcttc atcagcagta tttgaaacct cagatgcttc aattgtcaat 540 gtgcacactg aaaatatcac gaatactgct gctgttccat ctgaagagcc cacttttgta 600 aatgccacga gaaactcctt aaattccttc tgcagcagca aacagccatc cagtccctca 660 tcttatacgt cttccccact cgtatcgtcc ctctccgtaa gcaaaacatt actaagcacc 720 agttttacgc cttctgtgcc aacatctaat acatatatca aaacgaaaaa tacgggttac 780 tttgagcaca cggctttgac aacatcttca gttggcctta attcttttag tgaaacagca 840 gtctcatctc agggaacgaa aattgacacc tttttagtgt catccttgat cgcatatcct 900 tcttctgcat caggaagcca attgtccggt atccaacaga atttcacatc aacttctctc 960 atgatttcaa cctatgaagg taaagcgtct atatttttct cagctgagct cggttcgatc 1020 atttttctgc ttttgtcgta cctgctattc taa 1053 <210> 29 <211> 1134 <212> DNA <213> Artificial Sequence <220> <223> CRE recombinase <400> 29 atgactaaat ctcattcaga agaagtgatt gtacctgagt tcaattctag cgcaaaggaa 60 ttaccaagac cattggccga aaagtgcgga attcaaatgt ctaatttgtt gactgttcat 120 caaaatttgc cagctttgcc agttgatgca acgtctgatg aggtaagaaa gaatttgatg 180 gatatgttta gagatagaca agcattctct gaacatactt ggaaaatgtt gttgtctgtt 240 tgtagatctt gggctgcttg gtgtaaatta aataatagaa aatggtttcc agctgaacca 300 gaagatgtta gagattattt gttgtatttg caagctagag gtttggctgt taaaactata 360 caacaacatt tgggtcaatt aaatatgttg cataggagat ctggtttgcc tagaccatct 420 gattctaatg ctgtatcttt ggttatgaga aggattagaa aagaaaatgt tgatgcaggt 480 gaaagagcta aacaagcatt ggcgtttgaa agaactgatt ttgatcaagt tagatctttg 540 atggaaaatt ctgatagatg tcaagatata agaaacttgg ctttcttggg aattgcttat 600 aatacattgt tgagaattgc tgaaattgct agaattagag ttaaagacat ttctagaact 660 gatggtggta gaatgttgat tcatattggt agaactaaaa cattggtttc aactgctggc 720 gttgagaaag cattgtcttt gggtgttact aaattggttg aaagatggat ttctgtatct 780 ggtgtggctg atgacccaaa taattattta ttttgtagag ttagaaagaa tggtgttgcg 840 gctccatctg ctacatctca gctctctacc cgtgccttgg aaggaatttt tgaagcaact 900 catagattga tttatggtgc taaagatgat tctggtcaaa gatatttagc atggtctggt 960 cattctgcta gagttggtgc cgctagagat atggctagag ctggggtatc tattcctgaa 1020 attatgcaag ctggtggttg gactaatgtt aacatcgtca tgaactatat tagaaatttg 1080 gattctgaaa ctggtgcaat ggttagactc ttggaagatg gtgatcccgg gtag 1134 <110> Medicinal Bioconvergence Research Center <120> Vectors for measuring multiple protein-protein interactions          simultaneously <130> NP15-0046 <150> KR 10-2015-0037979 <151> 2015-03-19 <150> KR 1020140049726 <151> 2014-04-25 <160> 29 <170> Kopatentin 2.0 <210> 1 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Barcode template oligo AD <400> 1 cgtacgcttg ggnnnnnnnn nntttccacc gcgg 34 <210> 2 <211> 19 <212> DNA <213> Artificial Sequence <220> &Lt; 223 > AD-5 (BsiW I) <400> 2 tgcacagcgt acgcttggg 19 <210> 3 <211> 19 <212> DNA <213> Artificial Sequence <220> &Lt; 223 > AD-3 (Sac II) <400> 3 ggccatgccg cggtggaaa 19 <210> 4 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Barcode template oligo DBD <400> 4 accggtcttg ggnnnnnnnn nntttccact taag 34 <210> 5 <211> 19 <212> DNA <213> Artificial Sequence <220> &Lt; 223 > DBD-5 (Afl II) <400> 5 tgcacagacc ggtcttggg 19 <210> 6 <211> 19 <212> DNA <213> Artificial Sequence <220> &Lt; 223 > DBD-3 (Age I) <400> 6 ggccatgctt aagtggaaa 19 <210> 7 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> aaRS (F) sfi I <400> 7 gcgatcaggc ccagcaggcc ggcgccgaga ccgcggtc 38 <210> 8 <211> 38 <212> DNA <213> Artificial Sequence <220> &Lt; 223 > DBD-aaRS (R) sfi I <400> 8 acagcttggc cagcagggcc ctgcaggtcg acctcgag 38 <210> 9 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> AD-aaRS (R) sfi I <400> 9 acagcttggc ccagcaggcc ctgcaggtcg acctcgag 38 <210> 10 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 10 ggccgtcgac taattgagtg acgtacgctt ggg 33 <210> 11 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> primer B <400> 11 ggccatgccg cggtggaaa 19 <210> 12 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer C <400> 12 gccccaaggg gttatgctag ttatcttaag 30 <210> 13 <211> 2474 <212> DNA <213> Artificial Sequence <220> <223> Gal1 promoter- MFalpha1- myc10 repeats- Glycine / Serine linker-          Agalpha I (C-term) <400> 13 acggattaga agccgccgag cgggtgacag ccctccgaag gaagactctc ctccgtgcgt 60 cctcgtcttc accggtcgcg ttcctgaaac gcagatgtgc ctcgcgccgc actgctccga 120 acaataaaga ttctacaata ctagctttta tggttatgaa gaggaaaaat tggcagtaac 180 ctggccccac aaaccttcaa atgaacgaat caaattaaca accataggat gataatgcga 240 ttagtttttt agccttattt ctggggtaat taatcagcga agcgatgatt tttgatctat 300 taacagatat ataaatgcaa aaactgcata accactttaa ctaatacttt caacattttc 360 ggtttgtatt acttcttatt caaatgtaat aaaagtatca acaaaaaatt gttaatatac 420 ctctatactt taacgtcaag gagaaaaaac cccggatcgg actactagca gctgtaatac 480 gactcactat agggaatatt aagctaattc tacttcatac attttcaatt aagagatcta 540 tgagatttcc ttcaattttt actgctgttt tattcgcagc atcctccgca ttagctgctc 600 cagtcaacac tacaacagaa gatgaaacgg cacaaattcc ggctgaagct gtcatcggtt 660 actcagattt agaaggggat ttcgatgttg ctgttttgcc attttccaac agcacaaata 720 acgggttatt gtttataaat actactattg ccagcattgc tgctaaagaa gaaggggtat 780 ctctcgagaa aagagaggct gaagctacgc gtaacacaca gtatgttttt gatatcaaaa 840 tgtcccatcg atttaaagct atggagcaaa agctcatttc tgaagaggac ttgaatgaaa 900 tggagcaaaa gctcatttct gaagaggact tgaatgaaat ggagcaaaag ctcatttctg 960 aagaggactt gaatgaaatg gagcaaaagc tcatttctga agaggacttg aatgaaatgg 1020 agcaaaagct catttctgaa gaggacttga atgaaatgga gagcttgggc gacctcacct 1080 cgatcaaaat gtcccatcga tttaaagcta tggagcaaaa gctcatttct gaagaggact 1140 tgaatgaaat ggagcaaaag ctcatttctg aagaggactt gaatgaaatg gagcaaaagc 1200 tcatttctga agaggacttg aatgaaatgg agcaaaagct catttctgaa gaggacttga 1260 atgaaatgga gcaaaagctc atttctgaag aggacttgaa tgaaatggag agcttgggcg 1320 acctcaccgc cgctaatggc aagcttctgc aggctagtgg tggtggtggt tctggtggtg 1380 gtggttctgg tggtggtggt tctgctagca tgactctcga gcttgatacc atagcaaata 1440 ctacgtacgc tacgcaattc tcgactacta gggaatttat tgtttatcag ggtcggaacc 1500 tcggtacagc tagcgccaaa agctctttta tctcaaccac tactactgat ttaacaagta 1560 taaacactag tgcgtattcc actggatcca tttccacagt agaaacaggc aatcgaacta 1620 catcagaagt gatcagccat gtggtgacta ccagcacaaa actgtctcca actgctacta 1680 ccagcctgac aattgcacaa accagtatct attctactga ctcaaatatc acagtaggaa 1740 cagatattca caccacatca gaagtgatta gtgatgtgga aaccattagc agagaaacag 1800 cttcgaccgt tgtagccgct ccaacctcaa caactggatg gacaggcgct atgaatactt 1860 acatctcgca atttacatcc tcttctttcg caacaatcaa cagcacacca ataatctctt 1920 catcagcagt atttgaaacc tcagatgctt caattgtcaa tgtgcacact gaaaatatca 1980 cgaatactgc tgctgttcca tctgaagagc ccacttttgt aaatgccacg agaaactcct 2040 taaattcctt ctgcagcagc aaacagccat ccagtccctc atcttatacg tcttccccac 2100 tcgtatcgtc cctctccgta agcaaaacat tactaagcac cagttttacg ccttctgtgc 2160 caacatctaa tacatatatc aaaacgaaaa atacgggtta ctttgagcac acggctttga 2220 caacatcttc agttggcctt aattctttta gtgaaacagc agtctcatct cagggaacga 2280 tcgcataccc aattgtccgg tatccaacag aatttcacat caacttctct catgatttca acctatgaag 2400 gtaaagcgtc tatatttttc tcagctgagc tcggttcgat catttttctg cttttgtcgt 2460 acctgctatt ctaa 2474 <210> 14 <211> 1588 <212> DNA <213> Artificial Sequence <220> <223> GAL1 promoter-CRE recombinase <400> 14 acggattaga agccgccgag cgggtgacag ccctccgaag gaagactctc ctccgtgcgt 60 cctcgtcttc accggtcgcg ttcctgaaac gcagatgtgc ctcgcgccgc actgctccga 120 acaataaaga ttctacaata ctagctttta tggttatgaa gaggaaaaat tggcagtaac 180 ctggccccac aaaccttcaa atgaacgaat caaattaaca accataggat gataatgcga 240 ttagtttttt agccttattt ctggggtaat taatcagcga agcgatgatt tttgatctat 300 taacagatat ataaatgcaa aaactgcata accactttaa ctaatacttt caacattttc 360 ggtttgtatt acttcttatt caaatgtaat aaaagtatca acaaaaaatt gttaatatac 420 ctctatactt taacgtcaag gagaaaaaac tataatgact aaatctcatt cagaagaagt 480 gattgtacct gagttcaatt ctagcgcaaa ggaattacca agaccattgg ccgaaaagtg 540 cggaattcaa atgtctaatt tgttgactgt tcatcaaaat ttgccagctt tgccagttga 600 tgcaacgtct gatgaggtaa gaaagaattt gatggatatg tttagagata gacaagcatt 660 ctctgaacat acttggaaaa tgttgttgtc tgtttgtaga tcttgggctg cttggtgtaa 720 attaaataat agaaaatggt ttccagctga accagaagat gttagagatt atttgttgta 780 tttgcaagct agaggtttgg ctgttaaaac tatacaacaa catttgggtc aattaaatat 840 gttgcatagg agatctggtt tgcctagacc atctgattct aatgctgtat ctttggttat 900 gagaaggatt agaaaagaaa atgttgatgc aggtgaaaga gctaaacaag cattggcgtt 960 tgaaagaact gattttgatc aagttagatc tttgatggaa aattctgata gatgtcaaga 1020 tatagaaac ttggctttct tgggaattgc ttataataca ttgttgagaa ttgctgaaat 1080 tgctagaatt agagttaaag acatttctag aactgatggt ggtagaatgt tgattcatat 1140 tggtagaact aaaacattgg tttcaactgc tggcgttgag aaagcattgt ctttgggtgt 1200 tactaaattg gttgaaagat ggatttctgt atctggtgtg gctgatgacc caaataatta 1260 tttattttgt agagttagaa agaatggtgt tgcggctcca tctgctacat ctcagctctc 1320 tacccgtgcc ttggaaggaa tttttgaagc aactcataga ttgatttatg gtgctaaaga 1380 tgattctggt caaagatatt tagcatggtc tggtcattct gctagagttg gtgccgctag 1440 agatatggct agagctgggg tatctattcc tgaaattatg caagctggtg gttggactaa 1500 tgttaacatc gtcatgaact atattagaaa tttggattct gaaactggtg caatggttag 1560 actcttggaa gatggtgatc ccgggtag 1588 <210> 15 <211> 8410 <212> DNA <213> Artificial Sequence <220> <223> pDBD-donor <400> 15 cggtgcgggc ctcttcgcta ttacgccaga tccttttgtt gtttccgggt gtacaatatg 60 gacttcctct tttctggcaa ccaaacccat acatcgggat tcctataata ccttcgttgg 120 tctccctaac atgtaggtgg cggaggggag atatacaata gaacagatac cagacaagac 180 ataatgggct aaacaagact acaccaatta cactgcctca ttgatggtgg tacataacga 240 actaatactg tagccctaga cttgatagcc atcatcatat cgaagtttca ctaccctttt 300 tccatttgcc atctattgaa gtaataatag gcgcatgcaa cttcttttct ttttttttct 360 tttctctctc ccccgttgtt gtctcaccat atccgcaatg acaaaaaaaa tgatggaaga 420 cactaaagga aaaaattaac gacaaagaca gcaccaacag atgtcgttgt tccagagctg 480 atgaggggta tctcgaagca cacgaaactt tttccttcct tcattcacgc acactactct 540 ctaatgagca acggtatacg gccttccttc cagttacttg aatttgaaat aaaaaaagtt 600 tgctgtcttg ctatcaagta taaatagacc tgcaattatt aatcttttgt ttcctcgtca 660 ttgttctcgt tccctttctt ccttgtttct ttttctgcac aatatttcaa gctataccaa 720 gcatacaatc aactccaagc ttgaagcaag cctcctgaaa gatgaagcta ctgtcttcta 780 tcgaacaagc atgcgatatt tgccgactta aaaagctcaa gtgctccaaa gaaaaaccga 840 agtgcgccaa gtgtctgaag aacaactggg agtgtcgcta ctctcccaaa accaaaaggt 900 ctccgctgac tagggcacat ctgacagaag tggaatcaag gctagaaaga ctggaacagc 960 tatttctact gatttttcct cgagaagacc ttgacatgat tttgaaaatg gattctttac 1020 aggatataaa agcattgtta acaggattat ttgtacaaga taatgtgaat aaagatgccg 1080 tcacagatag attggcttca gtggagactg atatgcctct aacattgaga cagcatagaa 1140 taagtgcgac atcatcatcg gaagagagta gtaacaaagg tcaaagacag ttgactgtat 1200 cgccggaatt tgtaatacga ctcactatag ggcgagccgc catcatggag gagcagaagc 1260 tgatctcaga ggaggacctg catatacgcg tggcctggag ggccgccgaa ttcccgggga 1320 tccgtcgacc tgcagcggcc gcagggcctc cagggccact agttaattga gtgagacgtc 1380 ccccattcga gaataaataa cttcgtataa agtatcctat acgaagttat accggtctaa 1440 agtagcccct tgaattccga ggcagtaggc acgtgaagtt gcttcttggc ctcacctagg 1500 ctgcccgcgc cggacttgta cagctcgtcc atgccgagag tgatcccggc ggcggtcacg 1560 aactccagca ggaccatgtg atcgcgcttc tcgttggggt ctttgctcag ggcggactgg 1620 gtgctcaggt agtggttgtc gggcagcagc acggggccgt cgccgatggg ggtgttctgc 1680 tggtagtggt cggcgagctg cacgctgccg tcctcgatgt tgtggcggat cttgaagttc 1740 accttgatgc cgttcttctg cttgtcggcc atgatataga cgttgtggct gttgtagttg 1800 tactccagct tgtgccccag gatgttgccg tcctccttga agtcgatgcc cttcagctcg 1860 atgcggttca ccagggtgtc gccctcgaac ttcacctcgg cgcgggtctt gtagttgccg 1920 tcgtccttga agaagatggt gcgctcctgg acgtagcctt cgggcatggc ggacttgaag 1980 aagtcgtgct gcttcatgtg gtcggggtag cggctgaagc actgcacgcc gtaggtcagg 2040 gtggtcacga gggtgggcca gggcacgggc agcttgccgg tggtgcagat gaacttcagg 2100 gtcagcttgc cgtaggtggc atcgccctcg ccctcgccgg acacgctgaa cttgtggccg 2160 tttacgtcgc cgtccagctc gaccaggatg ggcaccaccc cggtgaacag ctcctcgccc 2220 ttgctcacca tcttaagata actagcataa ccccttgggg cctctaaacg ggtcttgagg 2280 ggttttttgc gcgcttgcag ccaagctaat tccgggcgaa tttcttatga tttatgattt 2340 ttattattaa ataagttata aaaaaaataa gtgtatacaa attttaaagt gactcttagg 2400 ttttaaaacg aaaattctta ttcttgagta actctttcct gtaggtcagg ttgctttctc 2460 aggtatagca tgaggtcgct cttattgacc acacctctac cggcatgcaa gcttggcgta 2520 atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 2580 acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgaggt aactcacatt 2640 aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta 2700 atgaatcggc caacgcgcgg ggagaggcgg ttgacgtccc ccattcgaga ataaatcgat 2760 agtcccgctc agaagaactc gtcaagaagg cgatagaagg cgatgcgctg cgaatcggga 2820 gcggcgatac cgtaaagcac gaggaagcgg tcagcccatt cgccgccaag ctcttcagca 2880 atatcacggg tagccaacgc tatgtcctga tagcggtccg ccacacccag ccggccacag 2940 tcgatgaatc cagaaaagcg gccattttcc accatgatat tcggcaagca ggcatcgtca 3000 tgggtcacga cgagatcctc gccgtcgggc atgctcgcct tgagcctggc gaacagttcg 3060 gctggcgcga gcccctgatg ctcttcgtcc agatcatcct gatcgacaag accggcttcc 3120 atccgagtac gtgctcgctc gatgcgatgt ttcgcttggt ggtcgaatgg gcaggtagcc 3180 ggatcaagcg tatgcagccg ccgcattgca tcagccatga tggatacttt ctcggcagga 3240 gcaaggtgag atgacaggag atcctgcccc ggcacttcgc ccaatagcag ccagtccctt 3300 cccgcttcag tgacaacgtc gagcacagct gcgcaaggaa cgcccgtcgt ggccagccac 3360 gatagccgcg ctgcctcgtc ttgcagttca ttcagggcac cggacaggtc ggtcttgaca 3420 aaaagaaccg ggcgcccctg cgctgacagc cggaacacgg cggcatcaga gcagccgatt 3480 gtctgttgtg cccagtcata gccgaatagc ctctccaccc aagcggccgg agaacctgcg 3540 tgcaatccat cttgttcaat catactcttc ctttttcaat attattgaag catttatcag 3600 ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg 3660 gttccgcgca catttccccg aaaggcgcgc cttattcttc accggcatct gcatccgggg 3720 tcttgaaggc gtgctggtac tccacgatgc ccagctcggt gttgctgtga tcctcctcca 3780 cgcggcggaa ggcgaacatg gggcccccgt tctgcaggat gctggggtgg atggcgctct 3840 tgaagtgcat gtggctgtcc accacggagc tgtagtagcc gccgtcgcgc aggctgaagg 3900 tgcgggtgaa gctgccatcc agatcgttat cgcccatggg gtgcaggtgc tccacggtgg 3960 cgttgctgcg gatgatcttg tcggtgaaga tcacgctgtc ctcggggaag ccggtgccca 4020 tcaccttgaa gtcgccgatc acgcggccgg cctcgtagcg gtagctgaag ctcacgtgca 4080 gcacgccgcc gtcctcgtac ttctcgatgc gggtgttggt gtagccgccg ttgttgatgg 4140 cgtgcaggaa ggggttctcg tagccgctgg ggtaggtgcc gaagtggtag aagccgtagc 4200 ccatcacgtg gctcagcagg taggggctga aggtcagggc gcctttggtg ctcttcatct 4260 tgttggtcat gcggccctgc tcgggggtgc cctctccgcc gcccaccagc tcgaactcca 4320 cgccgttcag ggtgccggtg atgcggcact cgatctccat ggcgggcagg ccgctctcgt 4380 cgctctccat agatcttgag cgtcgagtta gcatatggat cgatccatat aacttcgtat 4440 aatgtatgct atacgaagtt attacgatac cgtcaacttg tttattgcag cttataatgg 4500 taccgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg 4560 gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa 4620 cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc 4680 gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc 4740 aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag 4800 ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct 4860 cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta 4920 ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc 4980 cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc 5040 agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt 5100 gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct gcgctctgct 5160 gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc 5220 tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca 5280 agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta 5340 agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa 5400 atgaagtttt aaatcaatct aaagtatata tgagtaacct gaggctatgg cagggcctgc 5460 cgccccgacg ttggctgcga gccctgggcc ttcacccgaa cttggggggt ggggtgggga 5520 aaaggaagaa acgcgggcgt attggcccca atggggtctc ggtggggtat cgacagagtg 5580 ccagccctgg gaccgaaccc cgcgtttatg aacaaacgac ccaacaccgt gcgttttatt 5640 ctgtcttttt attgccgtca tagcgcgggt tccttccggt attgtctcct tccgtgtttc 5700 agttagcctc cccctagcta gtacaatttc ctgatgcggt attttctcct tacgcatctg 5760 tgcggtattt cacaccgcat agatcggcaa gtgcacaaac aatacttaaa taaatactac 5820 tcagtaataa cctatttctt agcatttttg acgaaatttg ctattttgtt agagtctttt 5880 acaccatttg tctccacacc tccgcttaca tcaacaccaa taacgccatt taatctaagc 5940 gcatcaccaa cattttctgg cgtcagtcca ccagctaaca taaaatgtaa gctttcgggg 6000 ctctcttgcc ttccaaccca gtcagaaatc gagttccaat ccaaaagttc acctgtccca 6060 cctgcttctg aatcaaacaa gggaataaac gaatgaggtt tctgtgaagc tgcactgagt 6120 agtatgttgc agtcttttgg aaatacgagt cttttaataa ctggcaaacc gaggaactct 6180 tggtattctt gccacgactc atctccatgc agttggacga tatcaatgcc gtaatcattg 6240 accagagcca aaacatcctc cttaggttga ttacgaaaca cgccaaccaa gtatttcgga 6300 gtgcctgaac tatttttata tgcttttaca agacttgaaa ttttccttgc aataaccggg 6360 tcaattgttc tctttctatt gggcacacat ataataccca gcaagtcagc atcggaatct 6420 agagcacatt ctgcggcctc tgtgctctgc aagccgcaaa ctttcaccaa tggaccagaa 6480 ctacctgtga aattaataac agacatactc caagctgcct ttgtgtgctt aatcacgtat 6540 actcacgtgc tcaatagtca ccaatgccct ccctcttggc cctctccttt tcttttttcg 6600 accgaattaa ttcttaatcg gcaaaaaaag aaaagctccg gatcaagatt gtacgtaagg 6660 tgacaagcta tttttcaata aagaatatct tccactactg ccatctggcg tcataactgc 6720 aaagtacaca tatattacga tgctgttcta ttaaatgctt cctatattat atatatagta 6780 atgtcgttga tctatggtgc actctcagta caatctgctc tgatgccgca tagttaagcc 6840 agccccgaca cccgccaaca cccgctgacg cgccctgacg ggcttgtctg ctcccggcat 6900 ccgcttacag acaagctgtg accgtctccg ggagctgcat gtgtcagagg ttttcaccgt 6960 catcaccgaa acgcgcgaga cgaaagggcc tcgtgatacg cctattttta taggttaatg 7020 tcatgataat aatggtttct taatatgatc caatatcaaa ggaaatgata gcattgaagg 7080 atgagactaa tccaattgag gagtggcagc atatagaaca gctaaagggt agtgctgaag 7140 gaagcatacg ataccccgca tggaatggga taatatcaca ggaggtacta gactaccttt 7200 catcctacat aaatagacgc atataagtac gcatttaagc ataaacacgc actatgccgt 7260 tcttctcatg tatatatata tacaggcaac acgcagatat aggtgcgacg tgaacagtga 7320 gctgtatgtg cgcagctcgc gttgcatttt cggaagcgct cgttttcgga aacgctttga 7380 agttcctatt ccgaagttcc tattctctag aaagtatagg aacttcagag cgcttttgaa 7440 aaccaaaagc gctctgaaga cgcactttca aaaaaccaaa aacgcaccgg actgtaacga 7500 gctactaaaa tattgcgaat accgcttcca caaacattgc tcaaaagtat ctctttgcta 7560 tatatctctg tgctatatcc ctatataacc tacccatcca cctttcgctc cttgaacttg 7620 catctaaact cgacctctac attttttatg tttatctcta gtattactct ttagacaaaa 7680 aaattgtagt aagaactatt catagagtga atcgaaaaca atacgaaaat gtaaacattt 7740 cctatacgta gtatatagag acaaaataga agaaaccgtt cataattttc tgaccaatga 7800 agaatcatca acgctatcac tttctgttca caaagtatgc gcaatccaca tcggtataga 7860 atataatcgg ggatgccttt atcttgaaaa aatgcacccg cagcttcgct agtaatcagt 7920 aaacgcggga agtggagtca ggcttttttt atggaagaga aaatagacac caaagtagcc 7980 ttcttctaac cttaacggac ctacagtgca aaaagttatc aagagactgc attatagagc 8040 gcacaaagga gaaaaaaagt aatctaagat gctttgttag aaaaatagcg ctctcgggat 8100 gcatttttgt agaacaaaaa agaagtatag attctttgtt ggtaaaatag cgctctcgcg 8160 ttgcatttct gttctgtaaa aatgcagctc agattctttg tttgaaaaat tagcgctctc 8220 gcgttgcatt tttgttttac aaaaatgaag cacagattct tcgttggtaa aatagcgctt 8280 tcgcgttgca tttctgttct gtaaaaatgc agctcagatt ctttgtttga aaaattagcg 8340 ctctcgcgtt gcatttttgt tctacaaaat gaagcacaga tgcttcgttc aggtggcact 8400 tttcggcgat 8410 <210> 16 <211> 8955 <212> DNA <213> Artificial Sequence <220> <223> pAD-acceptor <400> 16 tgcatgcctg caggtcgaga tccgggatcg aagaaatgat ggtaaatgaa ataggaaatc 60 aaggagcatg aaggcaaaag acaaatataa gggtcgaacg aaaaataaag tgaaaagtgt 120 tgatatgatg tatttggctt tgcggcgccg aaaaaacgag tttacgcaat tgcacaatca 180 tgctgactct gtggcggacc cgcgctcttg ccggcccggc gataacgctg ggcgtgaggc 240 tgtgcccggc ggagtttttt gcgcctgcat tttccaaggt ttaccctgcg ctaaggggcg 300 agattggaga agcaataaga atgccggttg gggttgcgat gatgacgacc acgacaactg 360 gtgtcattat ttaagttgcc gaaagaacct gagtgcattt gcaacatgag tatactagaa 420 gaatgagcca agacttgcga gacgcgagtt tgccggtggt gcgaacaata gagcgaccat 480 gaccttgaag gtgagacgcg cataaccgct agagtacttt gaagaggaaa cagcaatagg 540 gttgctacca gtataaatag acaggtacat acaacactgg aaatggttgt ctgtttgagt 600 acgctttcaa ttcatttggg tgtgcacttt attatgttac aatatggaag ggaactttac 660 acttctccta tgcacatata ttaattaaag tccaatgcta gtagagaagg ggggtaacac 720 ccctccgcgc tcttttccga tttttttcta aaccgtggaa tatttcggat atccttttgt 780 tgtttccggg tgtacaatat ggacttcctc ttttctggca accaaaccca tacatcggga 840 ttcctataat accttcgttg gtctccctaa catgtaggtg gcggagggga gatatacaat 900 agaacagata ccagacaaga cataatgggc taaacaagac tacaccaatt acactgcctc 960 attgatggtg gtacataacg aactaatact gtagccctag acttgatagc catcatcata 1020 tcgaagtttc actacccttt ttccatttgc catctattga agtaataata ggcgcatgca 1080 acttcttttc tttttttttc ttttctctct cccccgttgt tgtctcacca tatccgcaat 1140 gacaaaaaaa atgatggaag acactaaagg aaaaaattaa cgacaaagac agcaccaaca 1200 gatgtcgttg ttccagagct gatgaggggt atctcgaagc acacgaaact ttttccttcc 1260 ttcattcacg cacactactc tctaatgagc aacggtatac ggccttcctt ccagttactt 1320 gaatttgaaa taaaaaaaag tttgctgtct tgctatcaag tataaataga cctgcaatta 1380 ttaatctttt gtttcctcgt cattgttctc gttccctttc ttccttgttt ctttttctgc 1440 acaatatttc aagctatacc aagcatacaa tcaactccaa gctttgcaaa gatggataaa 1500 gcggaattaa ttcccgagcc tccaaaaaag aagagaaagg tcgaattggg taccgccgcc 1560 aattttaatc aaagtgggaa tattgctgat agctcattgt ccttcacttt cactaacagt 1620 agcaacggtc cgaacctcat aacaactcaa acaaattctc aagcgctttc acaaccaatt 1680 gcctcctcta acgttcatga taacttcatg aataatgaaa tcacggctag taaaattgat 1740 gatggtaata attcaaaacc actgtcacct ggttggacgg accaaactgc gtataacgcg 1800 tttggaatca ctacagggat gtttaatacc actacaatgg atgatgtata taactatcta 1860 ttcgatgatg aagatacccc accaaaccca aaaaaagaga tctttcaata cgactcacta 1920 aagggcgagc gccgccatgg ggcctggagg gccagtgaat tccacccggg tgggcatcga 1980 tacgggatcc atcgagctcg agctgcaggg cctccagggc cgtcgactaa ttgagtgaac 2040 gtacgctaaa gtagcccctt gaattccgag gcagtaggca cgtgaagttg cttcttggcc 2100 tcacctaggc tgcccgcgcc ggacttgtac agctcgtcca tgccgagagt gatcccggcg 2160 gcggtcacga actccagcag gaccatgtga tcgcgcttct cgttggggtc tttgctcagg 2220 gcggactggg tgctcaggta gtggttgtcg ggcagcagca cggggccgtc gccgatgggg 2280 gtgttctgct ggtagtggtc ggcgagctgc acgctgccgt cctcgatgtt gtggcggatc 2340 ttgaagttca ccttgatgcc gttcttctgc ttgtcggcca tgatatagac gttgtggctg 2400 ttgtagttgt actccagctt gtgccccagg atgttgccgt cctccttgaa gtcgatgccc 2460 ttcagctcga tgcggttcac cagggtgtcg ccctcgaact tcacctcggc gcgggtcttg 2520 tagttgccgt cgtccttgaa gaagatggtg cgctcctgga cgtagccttc gggcatggcg 2580 gacttgaaga agtcgtgctg cttcatgtgg tcggggtagc ggctgaagca ctgcacgccg 2640 taggtcaggg tggtcacgag ggtgggccag ggcacgggca gcttgccggt ggtgcagatg 2700 aacttcaggg tcagcttgcc gtaggtggca tcgccctcgc cctcgccgga cacgctgaac 2760 ttgtggccgt ttacgtcgcc gtccagctcg accaggatgg gcaccacccc ggtgaacagc 2820 tcctcgccct tgctcaccat ccgcggataa cttcgtataa agtatcctat acgaagttat 2880 gcatccgcta gccatgtaac ctctgatcta tagaattttt taaatgacta gaattaatgc 2940 ccatcttttt tttggaccta aattcttcat gaaaatatat tacgagggct tattcagaag 3000 ctttggactt cttcgccaga ggtttggtca agtctccaat caaggttgtc ggcttgtcta 3060 ccttgccaga aatttacgaa aagatggaaa agggtcaaat cgttggtaga tacgttgttg 3120 acacttctaa ataagcgaat ttcttatgat ttatgatttt tattattaaa taagttataa 3180 aaaaaataag tgtatacaaa ttttaaagtg actcttaggt tttaaaacga aaattcttat 3240 tcttgagtaa ctctttcctg taggtcaggt tgctttctca ggtatagcat gaggtcgctc 3300 ttattgacca cacctctacc ggccggtcga aattccccta ccctatgaac atattccatt 3360 ttgtaatttc gtgtcgtttc tattatgaat ttcatttata aagtttatgt acaaatatca 3420 taaaaaaacc tagggcatcc accatgaaaa agcctgaact caccgcgacg tctgtcgaga 3480 agtttctgat cgaaaagttc gacagcgtct ccgacctgat gcagctctcg gagggcgaag 3540 aatctcgtgc tttcagcttc gatgtaggag ggcgtggata tgtcctgcgg gtaaatagct 3600 gcgccgatgg tttctacaaa gatcgttatg tttatcggca ctttgcatcg gccgcgctcc 3660 cgattccgga agtgcttgac attggggagt tcagcgagag cctgacctat tgcatctccc 3720 gccgtgcaca gggtgtcacg ttgcaagacc tgcctgaaac cgaactgccc gctgttctgc 3780 agcttacata tggatcgatc catataactt cgtataatgt atgctatacg aagttatact 3840 agtaaggatt ttcttaactt cttcggcgac agcatcaccg acttcggtgg tactgttgga 3900 accacctaaa tcaccagttc tgatacctgc atccaaaacc tttttaactg catcttcaat 3960 ggccttacct tcttcaggca agttcaatga caatttcaac atcattgcag cagacaagat 4020 agtggcgata gggttgacct tattctttgg caaatctgca gcagaaccgt ggcatggttc 4080 gtacaaacca aatgcggtgt tcttgtctgg caaagaggcc aaggacgcag atggcaacaa 4140 acccaaggaa cctgggataa cggaggcttc atcggagatg atatcaccaa acatgttgct 4200 ggtgattata ataccattta ggtgggttgg gttcttaact aggatcatgg cggcagaatc 4260 aatcaattga tgttgaacct tcaatgtagg aaattcgttc ttgatggttt cctccacagt 4320 ttttctccat aatcttgaag aggccaaaac attagcttta tccaaggacc aaataggcaa 4380 tggtggctca tgttgtaggg ccatgaaagc ggccattctt gtgattcttt gcacttctgg 4440 aacggtgtat tgttcactat cccaagcgac accatcacca tcgtcttcct ttctcttacc 4500 aaagtaaata cctcccacta attctctgac aacaacgaag tcagtacctt tagcaaattg 4560 tggcttgatt ggagataagt ctaaaagaga gtcggatgca aagttacatg gtcttaagtt 4620 ggcgtacaat tgaagttctt tacggatttt tagtaaacct tgttcaggtc taacactacc 4680 tgtaccccat ttaggaccac ccacagcacc taacaaaacg gcatcaacct tcttggaggc 4740 ttccagcgcc tcatctggaa gtgggacacc tgtagcgtcg atagcagcac caccaattaa 4800 atgattttcg aaatcgaact tgacattgga acgaacatca gaaatagctt taagaacctt 4860 aatggcttcg gctgtgattt cttgaccaac gtggtcacct ggcaaaacga cgatcttctt 4920 aggggcagac attagaatgg tatatccttg aaatatatat atatattgct gaaatgtaaa 4980 aggtaagaaa agttagaaag taagacgatt gctaaccacc tattggaaaa aacaataggt 5040 ccttaaataa tattgtcaac ttcaagtatt gtgatgcaag catttagtca tgaacgcttc 5100 tctattctat atgaaaagcc ggttccggcg ctctcacctt tcctttttct cccaattttt 5160 cagttgaaaa aggtatatgc gtcaggcgac ctctgaaatt aacaaaaaat ttccagtcat 5220 cgaatttgat tctgtgcgat agcgcccctg tgtgttctcg ttatgttgag gaaaaaaata 5280 atggttgcta agagattcga actcttgcat cttacgatac ctgagtattc ccacagttgg 5340 ggatctcgac tctagctaga ggatcaattc gtaatcatgg tcatagctgt ttcctgtgtg 5400 aaattgttat ccgctcacaa ttccacacaa catacgagcc ggaagcataa agtgtaaagc 5460 ctggggtgcc taatgagtga gctaactcac attaattgcg ttgcgctcac tgcccgcttt 5520 ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg 5580 cggtttgcgt attgggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt 5640 tcggctgcgg cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc 5700 aggggataac gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa 5760 aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 5820 tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 5880 ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 5940 cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag 6000 ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 6060 ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 6120 gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 6180 agagttcttg aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg 6240 cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 6300 aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 6360 aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 6420 ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt 6480 aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag 6540 ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 6600 agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 6660 cagtgctgca atgataccgc gagacccacg ctcaccggct gcagatttat cagcaataaa 6720 ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 6780 gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 6840 cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 6900 cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 6960 ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 7020 catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 7080 tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 7140 ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 7200 catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 7260 cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 7320 cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 7380 acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg 7440 ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 7500 tccgcgcaca tttccccgaa aagtgccacc tgacgtctaa gaaaccatta ttatcatgac 7560 attaacctat aaaaataggc gtatcacgag gccctttcgt ctcgcgcgtt tcggtgatga 7620 cggtgaaaac ctctgacaca tgcagctccc ggagacggtc acagcttgtc tgtaagcgga 7680 tgccgggagc agacaagccc gtcagggcgc gtcagcgggt gttggcgggt gtcggggctg 7740 gcttaactat gcggcatcag agcagattgt actgagagtg caccataacg catttaagca 7800 taaacacgca ctatgccgtt cttctcatgt atatatatat acaggcaaca cgcagatata 7860 ggtgcgacgt gaacagtgag ctgtatgtgc gcagctcgcg ttgcattttc ggaagcgctc 7920 gttttcggaa acgctttgaa gttcctattc cgaagttcct attctctagc tagaaagtat 7980 aggaacttca gagcgctttt gaaaaccaaa agcgctctga agacgcactt tcaaaaaacc 8040 aaaaacgcac cggactgtaa cgagctacta aaatattgcg aataccgctt ccacaaacat 8100 tgctcaaaag tatctctttg ctatatatct ctgtgctata tccctatata acctacccat 8160 ccacctttcg ctccttgaac ttgcatctaa actcgacctc tacatttttt atgtttatct 8220 ctagtattac tctttagaca aaaaaattgt agtaagaact attcatagag tgaatcgaaa 8280 acaatacgaa aatgtaaaca tttcctatac gtagtatata gagacaaaat agaagaaacc 8340 gttcataatt ttctgaccaa tgaagaatca tcaacgctat cactttctgt tcacaaagta 8400 tgcgcaatcc acatcggtat agaatataat cggggatgcc tttatcttga aaaaatgcac 8460 ccgcagcttc gctagtaatc agtaaacgcg ggaagtggag tcaggctttt tttatggaag 8520 agaaaataga caccaaagta gccttcttct aaccttaacg gacctacagt gcaaaaagtt 8580 atcaagagac tgcattatag agcgcacaaa ggagaaaaaa agtaatctaa gatgctttgt 8640 tagaaaaata gcgctctcgg gatgcatttt tgtagaacaa aaaagaagta tagattcttt 8700 gttggtaaaa tagcgctctc gcgttgcatt tctgttctgt aaaaatgcag ctcagattct 8760 ttgtttgaaa aattagcgct ctcgcgttgc atttttgttt tacaaaaatg aagcacagat 8820 tcttcgttgg taaaatagcg ctttcgcgtt gcatttctgt tctgtaaaaa tgcagctcag 8880 attctttgtt tgaaaaatta gcgctctcgc gttgcatttt tgttctacaa aatgaagcac 8940 agatgcttcg ttgct 8955 <210> 17 <211> 8955 <212> DNA <213> Artificial Sequence <220> <223> pAD-acceptor <400> 17 tgcatgcctg caggtcgaga tccgggatcg aagaaatgat ggtaaatgaa ataggaaatc 60 aaggagcatg aaggcaaaag acaaatataa gggtcgaacg aaaaataaag tgaaaagtgt 120 tgatatgatg tatttggctt tgcggcgccg aaaaaacgag tttacgcaat tgcacaatca 180 tgctgactct gtggcggacc cgcgctcttg ccggcccggc gataacgctg ggcgtgaggc 240 tgtgcccggc ggagtttttt gcgcctgcat tttccaaggt ttaccctgcg ctaaggggcg 300 agattggaga agcaataaga atgccggttg gggttgcgat gatgacgacc acgacaactg 360 gtgtcattat ttaagttgcc gaaagaacct gagtgcattt gcaacatgag tatactagaa 420 gaatgagcca agacttgcga gacgcgagtt tgccggtggt gcgaacaata gagcgaccat 480 gaccttgaag gtgagacgcg cataaccgct agagtacttt gaagaggaaa cagcaatagg 540 gttgctacca gtataaatag acaggtacat acaacactgg aaatggttgt ctgtttgagt 600 acgctttcaa ttcatttggg tgtgcacttt attatgttac aatatggaag ggaactttac 660 acttctccta tgcacatata ttaattaaag tccaatgcta gtagagaagg ggggtaacac 720 ccctccgcgc tcttttccga tttttttcta aaccgtggaa tatttcggat atccttttgt 780 tgtttccggg tgtacaatat ggacttcctc ttttctggca accaaaccca tacatcggga 840 ttcctataat accttcgttg gtctccctaa catgtaggtg gcggagggga gatatacaat 900 agaacagata ccagacaaga cataatgggc taaacaagac tacaccaatt acactgcctc 960 attgatggtg gtacataacg aactaatact gtagccctag acttgatagc catcatcata 1020 tcgaagtttc actacccttt ttccatttgc catctattga agtaataata ggcgcatgca 1080 acttcttttc tttttttttc ttttctctct cccccgttgt tgtctcacca tatccgcaat 1140 gacaaaaaaa atgatggaag acactaaagg aaaaaattaa cgacaaagac agcaccaaca 1200 gatgtcgttg ttccagagct gatgaggggt atctcgaagc acacgaaact ttttccttcc 1260 ttcattcacg cacactactc tctaatgagc aacggtatac ggccttcctt ccagttactt 1320 gaatttgaaa taaaaaaaag tttgctgtct tgctatcaag tataaataga cctgcaatta 1380 ttaatctttt gtttcctcgt cattgttctc gttccctttc ttccttgttt ctttttctgc 1440 acaatatttc aagctatacc aagcatacaa tcaactccaa gctttgcaaa gatggataaa 1500 gcggaattaa ttcccgagcc tccaaaaaag aagagaaagg tcgaattggg taccgccgcc 1560 aattttaatc aaagtgggaa tattgctgat agctcattgt ccttcacttt cactaacagt 1620 agcaacggtc cgaacctcat aacaactcaa acaaattctc aagcgctttc acaaccaatt 1680 gcctcctcta acgttcatga taacttcatg aataatgaaa tcacggctag taaaattgat 1740 gatggtaata attcaaaacc actgtcacct ggttggacgg accaaactgc gtataacgcg 1800 tttggaatca ctacagggat gtttaatacc actacaatgg atgatgtata taactatcta 1860 ttcgatgatg aagatacccc accaaaccca aaaaaagaga tctttcaata cgactcacta 1920 aagggcgagc gccgccatgg ggcctggagg gccagtgaat tccacccggg tgggcatcga 1980 tacgggatcc atcgagctcg agctgcaggg cctccagggc cgtcgactaa ttgagtgaat 2040 ctagactaaa gtagcccctt gaattccgag gcagtaggca cgtgaagttg cttcttggcc 2100 tcacctaggc tgcccgcgcc ggacttgtac agctcgtcca tgccgagagt gatcccggcg 2160 gcggtcacga actccagcag gaccatgtga tcgcgcttct cgttggggtc tttgctcagg 2220 gcggactggg tgctcaggta gtggttgtcg ggcagcagca cggggccgtc gccgatgggg 2280 gtgttctgct ggtagtggtc ggcgagctgc acgctgccgt cctcgatgtt gtggcggatc 2340 ttgaagttca ccttgatgcc gttcttctgc ttgtcggcca tgatatagac gttgtggctg 2400 ttgtagttgt actccagctt gtgccccagg atgttgccgt cctccttgaa gtcgatgccc 2460 ttcagctcga tgcggttcac cagggtgtcg ccctcgaact tcacctcggc gcgggtcttg 2520 tagttgccgt cgtccttgaa gaagatggtg cgctcctgga cgtagccttc gggcatggcg 2580 gacttgaaga agtcgtgctg cttcatgtgg tcggggtagc ggctgaagca ctgcacgccg 2640 taggtcaggg tggtcacgag ggtgggccag ggcacgggca gcttgccggt ggtgcagatg 2700 aacttcaggg tcagcttgcc gtaggtggca tcgccctcgc cctcgccgga cacgctgaac 2760 ttgtggccgt ttacgtcgcc gtccagctcg accaggatgg gcaccacccc ggtgaacagc 2820 tcctcgccct tgctcaccat ccgcggataa cttcgtataa agtatcctat acgaagttat 2880 gcatccgcta gccatgtaac ctctgatcta tagaattttt taaatgacta gaattaatgc 2940 ccatcttttt tttggaccta aattcttcat gaaaatatat tacgagggct tattcagaag 3000 ctttggactt cttcgccaga ggtttggtca agtctccaat caaggttgtc ggcttgtcta 3060 ccttgccaga aatttacgaa aagatggaaa agggtcaaat cgttggtaga tacgttgttg 3120 acacttctaa ataagcgaat ttcttatgat ttatgatttt tattattaaa taagttataa 3180 aaaaaataag tgtatacaaa ttttaaagtg actcttaggt tttaaaacga aaattcttat 3240 tcttgagtaa ctctttcctg taggtcaggt tgctttctca ggtatagcat gaggtcgctc 3300 ttattgacca cacctctacc ggccggtcga aattccccta ccctatgaac atattccatt 3360 ttgtaatttc gtgtcgtttc tattatgaat ttcatttata aagtttatgt acaaatatca 3420 taaaaaaacc tagggcatcc accatgaaaa agcctgaact caccgcgacg tctgtcgaga 3480 agtttctgat cgaaaagttc gacagcgtct ccgacctgat gcagctctcg gagggcgaag 3540 aatctcgtgc tttcagcttc gatgtaggag ggcgtggata tgtcctgcgg gtaaatagct 3600 gcgccgatgg tttctacaaa gatcgttatg tttatcggca ctttgcatcg gccgcgctcc 3660 cgattccgga agtgcttgac attggggagt tcagcgagag cctgacctat tgcatctccc 3720 gccgtgcaca gggtgtcacg ttgcaagacc tgcctgaaac cgaactgccc gctgttctgc 3780 agcttacata tggatcgatc catataactt cgtataatgt atgctatacg aagttatact 3840 agtaaggatt ttcttaactt cttcggcgac agcatcaccg acttcggtgg tactgttgga 3900 accacctaaa tcaccagttc tgatacctgc atccaaaacc tttttaactg catcttcaat 3960 ggccttacct tcttcaggca agttcaatga caatttcaac atcattgcag cagacaagat 4020 agtggcgata gggttgacct tattctttgg caaatctgca gcagaaccgt ggcatggttc 4080 gtacaaacca aatgcggtgt tcttgtctgg caaagaggcc aaggacgcag atggcaacaa 4140 acccaaggaa cctgggataa cggaggcttc atcggagatg atatcaccaa acatgttgct 4200 ggtgattata ataccattta ggtgggttgg gttcttaact aggatcatgg cggcagaatc 4260 aatcaattga tgttgaacct tcaatgtagg aaattcgttc ttgatggttt cctccacagt 4320 ttttctccat aatcttgaag aggccaaaac attagcttta tccaaggacc aaataggcaa 4380 tggtggctca tgttgtaggg ccatgaaagc ggccattctt gtgattcttt gcacttctgg 4440 aacggtgtat tgttcactat cccaagcgac accatcacca tcgtcttcct ttctcttacc 4500 aaagtaaata cctcccacta attctctgac aacaacgaag tcagtacctt tagcaaattg 4560 tggcttgatt ggagataagt ctaaaagaga gtcggatgca aagttacatg gtcttaagtt 4620 ggcgtacaat tgaagttctt tacggatttt tagtaaacct tgttcaggtc taacactacc 4680 tgtaccccat ttaggaccac ccacagcacc taacaaaacg gcatcaacct tcttggaggc 4740 ttccagcgcc tcatctggaa gtgggacacc tgtagcgtcg atagcagcac caccaattaa 4800 atgattttcg aaatcgaact tgacattgga acgaacatca gaaatagctt taagaacctt 4860 aatggcttcg gctgtgattt cttgaccaac gtggtcacct ggcaaaacga cgatcttctt 4920 aggggcagac attagaatgg tatatccttg aaatatatat atatattgct gaaatgtaaa 4980 aggtaagaaa agttagaaag taagacgatt gctaaccacc tattggaaaa aacaataggt 5040 ccttaaataa tattgtcaac ttcaagtatt gtgatgcaag catttagtca tgaacgcttc 5100 tctattctat atgaaaagcc ggttccggcg ctctcacctt tcctttttct cccaattttt 5160 cagttgaaaa aggtatatgc gtcaggcgac ctctgaaatt aacaaaaaat ttccagtcat 5220 cgaatttgat tctgtgcgat agcgcccctg tgtgttctcg ttatgttgag gaaaaaaata 5280 atggttgcta agagattcga actcttgcat cttacgatac ctgagtattc ccacagttgg 5340 ggatctcgac tctagctaga ggatcaattc gtaatcatgg tcatagctgt ttcctgtgtg 5400 aaattgttat ccgctcacaa ttccacacaa catacgagcc ggaagcataa agtgtaaagc 5460 ctggggtgcc taatgagtga gctaactcac attaattgcg ttgcgctcac tgcccgcttt 5520 ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg 5580 cggtttgcgt attgggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt 5640 tcggctgcgg cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc 5700 aggggataac gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa 5760 aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 5820 tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 5880 ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 5940 cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag 6000 ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 6060 ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 6120 gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 6180 agagttcttg aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg 6240 cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 6300 aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 6360 aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 6420 ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt 6480 aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag 6540 ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 6600 agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 6660 cagtgctgca atgataccgc gagacccacg ctcaccggct gcagatttat cagcaataaa 6720 ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 6780 gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 6840 cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 6900 cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 6960 ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 7020 catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 7080 tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 7140 ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 7200 catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 7260 cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 7320 cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 7380 acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg 7440 ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 7500 tccgcgcaca tttccccgaa aagtgccacc tgacgtctaa gaaaccatta ttatcatgac 7560 attaacctat aaaaataggc gtatcacgag gccctttcgt ctcgcgcgtt tcggtgatga 7620 cggtgaaaac ctctgacaca tgcagctccc ggagacggtc acagcttgtc tgtaagcgga 7680 tgccgggagc agacaagccc gtcagggcgc gtcagcgggt gttggcgggt gtcggggctg 7740 gcttaactat gcggcatcag agcagattgt actgagagtg caccataacg catttaagca 7800 taaacacgca ctatgccgtt cttctcatgt atatatatat acaggcaaca cgcagatata 7860 ggtgcgacgt gaacagtgag ctgtatgtgc gcagctcgcg ttgcattttc ggaagcgctc 7920 gttttcggaa acgctttgaa gttcctattc cgaagttcct attctctagc tagaaagtat 7980 aggaacttca gagcgctttt gaaaaccaaa agcgctctga agacgcactt tcaaaaaacc 8040 aaaaacgcac cggactgtaa cgagctacta aaatattgcg aataccgctt ccacaaacat 8100 tgctcaaaag tatctctttg ctatatatct ctgtgctata tccctatata acctacccat 8160 ccacctttcg ctccttgaac ttgcatctaa actcgacctc tacatttttt atgtttatct 8220 ctagtattac tctttagaca aaaaaattgt agtaagaact attcatagag tgaatcgaaa 8280 acaatacgaa aatgtaaaca tttcctatac gtagtatata gagacaaaat agaagaaacc 8340 gttcataatt ttctgaccaa tgaagaatca tcaacgctat cactttctgt tcacaaagta 8400 tgcgcaatcc acatcggtat agaatataat cggggatgcc tttatcttga aaaaatgcac 8460 ccgcagcttc gctagtaatc agtaaacgcg ggaagtggag tcaggctttt tttatggaag 8520 agaaaataga caccaaagta gccttcttct aaccttaacg gacctacagt gcaaaaagtt 8580 atcaagagac tgcattatag agcgcacaaa ggagaaaaaa agtaatctaa gatgctttgt 8640 tagaaaaata gcgctctcgg gatgcatttt tgtagaacaa aaaagaagta tagattcttt 8700 gttggtaaaa tagcgctctc gcgttgcatt tctgttctgt aaaaatgcag ctcagattct 8760 ttgtttgaaa aattagcgct ctcgcgttgc atttttgttt tacaaaaatg aagcacagat 8820 tcttcgttgg taaaatagcg ctttcgcgtt gcatttctgt tctgtaaaaa tgcagctcag 8880 attctttgtt tgaaaaatta gcgctctcgc gttgcatttt tgttctacaa aatgaagcac 8940 agatgcttcg ttgct 8955 <210> 18 <211> 622 <212> PRT <213> Artificial Sequence <220> <223> SV40 LTag a.a sequence <400> 18 Gly Thr Asp Glu Trp Glu Gln Trp Trp Asn Ala Phe Asn Glu Glu Asn   1 5 10 15 Leu Phe Cys Ser Glu Glu Met Pro Ser Ser Asp Asp Glu Ala Thr Ala              20 25 30 Asp Ser Gln His Ser Thr Pro Pro Lys Lys Lys Arg Lys Val Glu Asp          35 40 45 Pro Lys Asp Phe Pro Ser Glu Leu Leu Ser Phe Leu Ser His Ala Val      50 55 60 Phe Ser Asn Arg Thr Leu Ala Cys Phe Ala Ile Tyr Thr Thr Lys Glu  65 70 75 80 Lys Ala Leu Leu Tyr Lys Lys Ile Met Glu Lys Tyr Ser Val Thr                  85 90 95 Phe Ile Ser Arg His His Ser Tyr Asn His Asn Ile Leu Phe Phe Leu             100 105 110 Thr Pro His Arg His Arg Val Ser Ala Ile Asn Asn Tyr Ala Gln Lys         115 120 125 Leu Cys Thr Phe Ser Phe Leu Ile Cys Lys Gly Val Asn Lys Glu Tyr     130 135 140 Leu Met Tyr Ser Ala Leu Thr Arg Asp Pro Phe Ser Val Ile Glu Glu 145 150 155 160 Ser Leu Pro Gly Gly Leu Lys Glu His Asp Phe Asn Pro Glu Glu Ala                 165 170 175 Glu Glu Thr Lys Gln Val Ser Trp Lys Leu Val Thr Glu Tyr Ala Met             180 185 190 Glu Thr Lys Cys Asp Asp Val Leu Leu Leu Leu Gly Met Tyr Leu Glu         195 200 205 Phe Gln Tyr Ser Phe Glu Met Cys Leu Lys Cys Ile Lys Lys Glu Gln     210 215 220 Pro Ser His Tyr Lys Tyr His Glu Lys His Tyr Ala Asn Ala Ala Ile 225 230 235 240 Phe Ala Asp Ser Lys Asn Gln Lys Thr Ile Cys Gln Gln Ala Val Asp                 245 250 255 Thr Val Leu Ala Lys Lys Arg Val Asp Ser Leu Gln Leu Thr Arg Glu             260 265 270 Gln Met Leu Thr Asn Arg Phe Asn Asp Leu Leu Asp Arg Met Met Asp Ile         275 280 285 Met Phe Gly Ser Thr Gly Ser Ala Asp Ile Glu Glu Trp Met Ala Gly     290 295 300 Val Ala Trp Leu His Cys Leu Leu Pro Lys Met Asp Ser Val Val Tyr 305 310 315 320 Asp Phe Leu Lys Cys Met Val Tyr Asn Ile Pro Lys Lys Arg Tyr Trp                 325 330 335 Leu Phe Lys Gly Pro Ile Asp Ser Gly Lys Thr Thr Leu Ala Ala Ala             340 345 350 Leu Leu Glu Leu Cys Gly Gly Lys Ala Leu Asn Val Asn Leu Pro Leu         355 360 365 Asp Arg Leu Asn Phe Glu Leu Gly Val Ala Ile Asp Gln Phe Leu Val     370 375 380 Val Phe Glu Asp Val Lys Gly Thr Gly Gly Glu Ser Arg Asp Leu Pro 385 390 395 400 Ser Gly Gln Gly Ile Asn Asn Leu Asp Asn Leu Arg Asp Tyr Leu Asp                 405 410 415 Gly Ser Val Lys Val Asn Leu Glu Lys Lys His Leu Asn Lys Arg Thr             420 425 430 Gln Ile Phe Pro Pro Gly Ile Val Thr Met Asn Glu Tyr Ser Val Pro         435 440 445 Lys Thr Leu Gln Ala Arg Phe Val Lys Gln Ile Asp Phe Arg Pro Lys     450 455 460 Asp Tyr Leu Lys His Cys Leu Glu Arg Ser Glu Phe Leu Leu Glu Lys 465 470 475 480 Arg Ile Ile Gln Ser Gly Ile Ala Leu Leu Leu Met Leu Ile Trp Tyr                 485 490 495 Arg Pro Val Ala Glu Phe Ala Gln Ser Ile Gln Ser Arg Ile Val Glu             500 505 510 Trp Lys Glu Arg Leu Asp Lys Glu Phe Ser Leu Ser Val Tyr Gln Lys         515 520 525 Met Lys Phe Asn Val Ala Met Gly Ile Gly Val Leu Asp Trp Leu Arg     530 535 540 Asn Ser Asp Asp Asp Asp Glu Asp Ser Glu Glu Asn Ala Asp Lys Asn 545 550 555 560 Glu Asp Gly Gly Glu Lys Asn Met Glu Asp Ser Gly His Glu Thr Gly                 565 570 575 Ile Asp Ser Gln Ser Gln Gly Ser Phe Gln Ala Pro Gln Ser Ser Gln             580 585 590 Ser Val His Asp His Asn Gln Pro Tyr His Ile Cys Arg Gly Phe Thr         595 600 605 Cys Phe Lys Lys Pro Pro Thr Pro Pro Pro Glu Pro Glu Thr     610 615 620 <210> 19 <211> 319 <212> PRT <213> Artificial Sequence <220> <223> Murine p53 a.a sequence <400> 19 Pro Val Thr Glu Thr Pro Gly Pro Val Ala Pro Ala Pro Ala Thr Pro   1 5 10 15 Trp Pro Leu Ser Ser Phe Val Ser Ser Gln Lys Thr Tyr Gln Gly Asn              20 25 30 Tyr Gly Phe His Leu Gly Phe Leu Gln Ser Gly Thr Ala Lys Ser Val          35 40 45 Met Cys Thr Tyr Ser Pro Pro Leu Asn Lys Leu Phe Cys Gln Leu Val      50 55 60 Lys Thr Cys Pro Val Gln Leu Trp Val Ser Ala Thr Pro Pro Ala Gly  65 70 75 80 Ser Arg Val Ala Met Ala Ile Tyr Lys Lys Ser Gln His Met Thr                  85 90 95 Glu Val Val Arg Arg Cys Pro His His Glu Arg Cys Ser Asp Gly Asp             100 105 110 Gly Leu Ala Pro Pro Gln His Leu Ile Arg Val Glu Gly Asn Leu Tyr         115 120 125 Pro Glu Tyr Leu Glu Asp Arg Gln Thr Phe Arg His Ser Val Val Val     130 135 140 Pro Tyr Glu Pro Pro Glu Ala Gly Ser Glu Tyr Thr Thr Ile His Tyr 145 150 155 160 Lys Tyr Met Cys Asn Ser Ser Cys Met Gly Gly Met Asn Arg Arg Pro                 165 170 175 Ile Leu Thr Ile Ile Thr Leu Glu Asp Ser Ser Gly Asn Leu Leu Gly             180 185 190 Arg Asp Ser Phe Glu Val Arg Cys Ala Cys Pro Gly Arg Asp Arg         195 200 205 Arg Thr Glu Glu Glu Asn Phe Arg Lys Lys Glu Val Leu Cys Pro Glu     210 215 220 Leu Pro Pro Gly Ser Ala Lys Arg Ala Leu Pro Thr Cys Thr Ser Ala 225 230 235 240 Ser Pro Pro Gln Lys Lys Lys Pro Leu Asp Gly Glu Tyr Phe Thr Leu                 245 250 255 Lys Ile Arg Gly Arg Lys Arg Phe Glu Met Phe Arg Glu Leu Asn Glu             260 265 270 Ala Leu Glu Leu Lys Asp Ala His Ala Thr Glu Glu Ser Gly Asp Ser         275 280 285 Arg Ala His Ser Ser Tyr Leu Lys Thr Lys Lys Gly Gln Ser Thr Ser     290 295 300 Arg His Lys Lys Thr Met Val Lys Lys Val Gly Pro Asp Ser Asp 305 310 315 <210> 20 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> lox 2272 <400> 20 ataacttcgt ataaagtatc ctatacgaag ttat 34 <210> 21 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> lox P <400> 21 ataacttcgt ataatgtatg ctatacgaag ttat 34 <210> 22 <211> 251 <212> PRT <213> Artificial Sequence <220> <223> DX2 (AIMP2-DX2) <400> 22 Met Pro Met Tyr Gln Val Lys Pro Tyr His Gly Gly Gly Ala Pro Leu   1 5 10 15 Arg Val Glu Leu Pro Thr Cys Met Tyr Arg Leu Pro Asn Val His Gly              20 25 30 Arg Ser Tyr Gly Pro Ala Pro Gly Ala Gly His Val Gln Asp Tyr Gly          35 40 45 Ala Leu Lys Asp Ile Val Ile Asn Ala Asn Pro      50 55 60 Ser Leu Leu Val Leu His Arg Leu Leu Cys Glu His Phe Arg Val Leu  65 70 75 80 Ser Thr Val His Thr His Ser Ser Val Lys Ser Val Pro Glu Asn Leu                  85 90 95 Leu Lys Cys Phe Gly Glu Gln Asn Lys Lys Gln Pro Arg Gln Asp Tyr             100 105 110 Gln Leu Gly Phe Thr Leu Ile Trp Lys Asn Val Pro Lys Thr Gln Met         115 120 125 Lys Phe Ser Ile Gln Thr Met Cys Pro Ile Glu Gly Glu Gly Asn Ile     130 135 140 Ala Arg Phe Leu Phe Ser Leu Phe Gly Gln Lys His Asn Ala Val Asn 145 150 155 160 Ala Thr Leu Ile Asp Ser Trp Val Asp Ile Ala Ile Phe Gln Leu Lys                 165 170 175 Glu Gly Ser Ser Lys Glu Lys Ala Ala Val Phe Arg Ser Ser Met Asn Ser             180 185 190 Ala Leu Gly Lys Ser Pro Trp Leu Ala Gly Asn Glu Leu Thr Val Ala         195 200 205 Asp Val Val Leu Trp Ser Val Leu Gln Gln Ile Gly Gly Cys Ser Val     210 215 220 Thr Val Pro Ala Asn Val Gln Arg Trp Met Arg Ser Ser Cys Glu Asn Leu 225 230 235 240 Ala Pro Phe Asn Thr Ala Leu Lys Leu Leu Lys                 245 250 <210> 23 <211> 181 <212> PRT <213> Artificial Sequence <220> <223> Lamin A (Homo sapiens) <400> 23 Met Glu Ala Glu Phe Pro Gly Ile Ser Glu Glu Val Val Ser Arg Glu   1 5 10 15 Val Ser Gly Ile Lys Ala Ala Tyr Glu Ala Glu Leu Gly Asp Ala Arg              20 25 30 Lys Thr Leu Asp Ser Val Ala Lys Glu Arg Ala Arg Leu Gln Leu Glu          35 40 45 Leu Ser Lys Val Arg Glu Glu Phe Lys Glu Leu Lys Ala Arg Asn Thr      50 55 60 Lys Lys Glu Gly Asp Leu Ile Ala Ala Gln Ala Arg Leu Lys Asp Leu  65 70 75 80 Glu Ala Leu Leu Asn Ser Lys Glu Ala Ala Leu Ser Thr Ala Leu Ser                  85 90 95 Glu Lys Arg Thr Leu Glu Gly Glu Leu His Asp Leu Arg Gly Gln Val             100 105 110 Ala Lys Leu Glu Ala Ala Leu Gly Glu Ala Lys Lys Gln Leu Gln Asp         115 120 125 Glu Met Leu Arg Arg Val Asp Ala Glu Asn Arg Leu Gln Thr Met Lys     130 135 140 Glu Glu Leu Asp Phe Gln Lys Asn Ile Tyr Ser Glu Glu Leu Arg Glu 145 150 155 160 Thr Lys Arg Arg His Glu Thr Arg Leu Val Glu Ile Asp Arg Ile Arg                 165 170 175 Arg Pro Ala Ala Ala             180 <210> 24 <211> 450 <212> DNA <213> Artificial Sequence <220> <223> Gal1 promoter <400> 24 acggattaga agccgccgag cgggtgacag ccctccgaag gaagactctc ctccgtgcgt 60 cctcgtcttc accggtcgcg ttcctgaaac gcagatgtgc ctcgcgccgc actgctccga 120 acaataaaga ttctacaata ctagctttta tggttatgaa gaggaaaaat tggcagtaac 180 ctggccccac aaaccttcaa atgaacgaat caaattaaca accataggat gataatgcga 240 ttagtttttt agccttattt ctggggtaat taatcagcga agcgatgatt tttgatctat 300 taacagatat ataaatgcaa aaactgcata accactttaa ctaatacttt caacattttc 360 ggtttgtatt acttcttatt caaatgtaat aaaagtatca acaaaaaatt gttaatatac 420 ctctatactt taacgtcaag gagaaaaaac 450 <210> 25 <211> 267 <212> DNA <213> Artificial Sequence <220> <223> MFalpha 1 <400> 25 atgagatttc cttcaatttt tactgctgtt ttattcgcag catcctccgc attagctgct 60 ccagtcaaca ctacaacaga agatgaaacg gcacaaattc cggctgaagc tgtcatcggt 120 tactcagatt tagaagggga tttcgatgtt gctgttttgc cattttccaa cagcacaaat 180 aacgggttat tgtttataaa tactactatt gccagcattg ctgctaaaga agaaggggta 240 tctctcgaga aaagagaggc tgaagct 267 <210> 26 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> c-myc <400> 26 gagcaaaagc tcatttctga agaggacttg 30 <210> 27 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Glycine / Serine linker <400> 27 gctagtggtg gtggtggttc tggtggtggt ggttctggtg gtggtggt 48 <210> 28 <211> 1053 <212> DNA <213> Artificial Sequence <220> <223> Ag alpha I <400> 28 cttgatacca tagcaaatac tacgtacgct acgcaattct cgactactag ggaatttatt 60 gtttatcagg gtcggaacct cggtacagct agcgccaaaa gctcttttat ctcaaccact 120 actactgatt taacaagtat aaacactagt gcgtattcca ctggatccat ttccacagta 180 gaaacaggca atcgaactac atcagaagtg atcagccatg tggtgactac cagcacaaaa 240 ctgtctccaa ctgctactac cagcctgaca attgcacaaa ccagtatcta ttctactgac 300 tcaaatatca cagtaggaac agatattcac accacatcag aagtgattag tgatgtggaa 360 accattagca gagaaacagc ttcgaccgtt gtagccgctc caacctcaac aactggatgg 420 acaggcgcta tgaatactta catctcgcaa tttacatcct cttctttcgc aacaatcaac 480 agcacaccaa taatctcttc atcagcagta tttgaaacct cagatgcttc aattgtcaat 540 gtgcacactg aaaatatcac gaatactgct gctgttccat ctgaagagcc cacttttgta 600 aatgccacga gaaactcctt aaattccttc tgcagcagca aacagccatc cagtccctca 660 tcttatacgt cttccccact cgtatcgtcc ctctccgtaa gcaaaacatt actaagcacc 720 agttttacgc cttctgtgcc aacatctaat acatatatca aaacgaaaaa tacgggttac 780 tttgagcaca cggctttgac aacatcttca gttggcctta attcttttag tgaaacagca 840 gtctcatctc agggaacgaa aattgacacc tttttagtgt catccttgat cgcatatcct 900 tcttctgcat caggaagcca attgtccggt atccaacaga atttcacatc aacttctctc 960 atgatttcaa cctatgaagg taaagcgtct atatttttct cagctgagct cggttcgatc 1020 atttttctgc ttttgtcgta cctgctattc taa 1053 <210> 29 <211> 1134 <212> DNA <213> Artificial Sequence <220> <223> CRE recombinase <400> 29 atgactaaat ctcattcaga agaagtgatt gtacctgagt tcaattctag cgcaaaggaa 60 ttaccaagac cattggccga aaagtgcgga attcaaatgt ctaatttgtt gactgttcat 120 caaaatttgc cagctttgcc agttgatgca acgtctgatg aggtaagaaa gaatttgatg 180 gatatgttta gagatagaca agcattctct gaacatactt ggaaaatgtt gttgtctgtt 240 tgtagatctt gggctgcttg gtgtaaatta aataatagaa aatggtttcc agctgaacca 300 gaagatgtta gagattattt gttgtatttg caagctagag gtttggctgt taaaactata 360 caacaacatt tgggtcaatt aaatatgttg cataggagat ctggtttgcc tagaccatct 420 gattctaatg ctgtatcttt ggttatgaga aggattagaa aagaaaatgt tgatgcaggt 480 gaaagagcta aacaagcatt ggcgtttgaa agaactgatt ttgatcaagt tagatctttg 540 atggaaaatt ctgatagatg tcaagatata agaaacttgg ctttcttggg aattgcttat 600 aatacattgt tgagaattgc tgaaattgct agaattagag ttaaagacat ttctagaact 660 gatggtggta gaatgttgat tcatattggt agaactaaaa cattggtttc aactgctggc 720 gttgagaaag cattgtcttt gggtgttact aaattggttg aaagatggat ttctgtatct 780 ggtgtggctg atgacccaaa taattattta ttttgtagag ttagaaagaa tggtgttgcg 840 gctccatctg ctacatctca gctctctacc cgtgccttgg aaggaatttt tgaagcaact 900 catagattga tttatggtgc taaagatgat tctggtcaaa gatatttagc atggtctggt 960 cattctgcta gagttggtgc cgctagagat atggctagag ctggggtatc tattcctgaa 1020 attatgcaag ctggtggttg gactaatgtt aacatcgtca tgaactatat tagaaatttg 1080 gattctgaaa ctggtgcaat ggttagactc ttggaagatg gtgatcccgg gtag 1134

Claims (46)

제 1프로모터;
숙주세포 리포터 유전자의 프로모터에 결합하는 DBD 코딩 서열;
베이트 단백질 코딩 서열의 삽입을 위한 제1 클로닝 부위(cloning site);
제1 부위 특이적 재조합효소 인식 서열(site-specific recombination site);
상기 베이트 단백질을 표시하는 바코드 서열의 삽입을 위한 제2클로닝 부위; 및
제2 부위 특이적 재조합효소 인식 서열을 포함하는 것을 특징으로 하는 공여벡터.
A first promoter;
A DBD coding sequence that binds to the promoter of a host cell reporter gene;
A first cloning site for insertion of a bait protein coding sequence;
A first site-specific recombination site;
A second cloning site for insertion of a barcode sequence representing the bait protein; And
And a second site-specific recombinase recognition sequence.
제1항에 있어서, 상기 DBD 코딩 서열과 제1 클로닝 부위 사이에 링커 서열을 추가적으로 포함하는 것을 특징으로 하는 공여벡터.
2. The donor vector of claim 1, further comprising a linker sequence between the DBD coding sequence and the first cloning site.
제1항에 있어서, 상기 제1 및 제2 부위 특이적 재조합효소 인식 서열은 동일 배향(same orientation)인 것을 특징으로 하는 공여벡터.
2. The donor vector according to claim 1, wherein the first and second site-specific recombinase recognition sequences are in the same orientation.
제1항에 있어서, 상기 제1 또는 제2 부위 특이적 재조합효소 인식 서열은 lox 부위(site), rox 부위, att 부위, dif 부위 및 frt 부위로 이루어지는 군에서 선택되는 것을 특징으로 하는 공여벡터.
2. The donor vector according to claim 1, wherein the first or second site-specific recombinase recognition sequence is selected from the group consisting of lox site, rox site, att site, dif site and frt site.
제1항에 있어서, 상기 제1 또는 제2 부위 특이적 재조합효소 인식 서열은 lox P와 그 이형, rox와 그 이형, att P와 그 이형, dif와 그 이형 및 frt와 그 이형으로 이루어지는 군에서 선택되는 것을 특징으로 하는 공여벡터.
[Claim 2] The method according to claim 1, wherein the first or second site-specific recombinase recognition sequence is selected from the group consisting of lox P and a variant thereof, rox and a variant thereof, att P and a variant thereof, dif and a variant thereof, A donor vector.
제4항에 있어서, 상기 lox 부위(site)는 loxB, loxL, loxR, loxP, loxP3, loxP23, loxΔ86, loxΔ117, loxP511, loxC2, loxP2272, loxP5171, loxP71, loxP66, M2, M3, M7, M11로 이루어진 군에서 선택되는 것을 특징으로 하는 공여벡터.
5. The method of claim 4, wherein the lox site comprises loxB, loxL, loxR, loxP, loxP3, loxP23, loxA86, loxA117, loxP511, loxC2, loxP2272, loxP5171, loxP71, loxP66, M2, M3, M7, Lt; RTI ID = 0.0 &gt; a &lt; / RTI &gt; donor vector.
제1항에 있어서, 상기 제1 및 제2 부위 특이적 재조합 효소 인식 서열은 loxP 및 loxP 변이체(mutant loxP)인 것을 특징으로 하는 공여벡터.
2. The donor vector according to claim 1, wherein the first and second site-specific recombinase recognition sequences are loxP and loxP mutants (mutant loxP).
제1항에 있어서, 상기 제2 클로닝 부위와 제2 부위 특이적 재조합효소 인식 서열 사이에, 하나 이상의 마커 유전자를 추가로 포함하는 것을 특징으로 하는 공여벡터.
The donor vector according to claim 1, further comprising at least one marker gene between the second cloning site and the second site-specific recombinase recognition sequence.
제8항에 있어서, 상기 마커 유전자는
(i) 약물 저항성 유전자;
(ii) 형광 단백질 코딩 유전자;
(iii) 영양 요구성 표지 유전자;
(ⅳ) 전사 인자 유전자; 및
(ⅴ) 세포 표면 마커 유전자
로 이루어진 군에서 선택되는 것을 특징으로 하는 공여벡터.
9. The method according to claim 8, wherein the marker gene
(i) a drug resistance gene;
(ii) a fluorescent protein coding gene;
(iii) an auxotrophic marker gene;
(Iv) a transcription factor gene; And
(V) a cell surface marker gene
&Lt; / RTI &gt; wherein the donor vector is selected from the group consisting of:
제8항에 있어서, 상기 마커 유전자는,
상기 마커 유전자의 하류에 위치하며 제1 프로모터와 반대 전사 배향인 제2 프로모터와 작동가능하게 연결되는 것을 특징으로 하는 공여벡터.
9. The method according to claim 8,
Wherein the promoter is operatively linked to a second promoter located downstream of the marker gene and in an opposite transcriptional orientation to the first promoter.
제1항에 있어서, 상기 공여벡터는 제2 클로닝 부위와 제2 부위 특이적 재조합효소 인식 서열 사이에 순차적으로
마커 유전자; 및
제1 프로모터와 반대 전사 배향이며 상기 마커 유전자와 작동 가능하게 연결된 제2 프로모터
를 추가적으로 포함하는 것을 특징으로 하는 공여벡터.
4. The method of claim 1, wherein the donor vector is sequentially sequenced between a second cloning site and a second site-specific recombinase recognition sequence
Marker genes; And
A second promoter that is opposite in transcriptional orientation to the first promoter and is operably linked to the marker gene
Further comprising a donor vector.
제11항에 있어서, 상기 마커 유전자는 항생제 저항성 유전자인 것을 특징으로 하는 공여벡터.
12. The donor vector according to claim 11, wherein the marker gene is an antibiotic resistance gene.
제1항에 있어서, 상기 공여벡터는 제2 클로닝 부위와 제2 부위 특이적 재조합효소 인식 서열 사이에 순차적으로
제1 마커 유전자;
제1 프로모터와 반대 전사 배향이며 상기 제1마커 유전자와 작동 가능하게 연결된 제2 프로모터; 및
제1 마커 유전자와 다른 제2 마커 유전자
를 추가적으로 포함하는 것을 특징으로 하는 공여벡터.
4. The method of claim 1, wherein the donor vector is sequentially sequenced between a second cloning site and a second site-specific recombinase recognition sequence
A first marker gene;
A second promoter that is opposite in transcriptional orientation to the first promoter and is operably linked to the first marker gene; And
The first marker gene and the other second marker gene
Further comprising a donor vector.
제13항에 있어서, 상기 제1 마커 유전자는 항생제 저항성 유전자인 것을 특징으로 하는 공여벡터.
14. The donor vector according to claim 13, wherein the first marker gene is an antibiotic resistance gene.
제13항에 있어서, 상기 제2 마커 유전자는 형광 단백질 코딩 유전자인 것을 특징으로 하는 공여벡터.
14. The donor vector according to claim 13, wherein the second marker gene is a fluorescent protein coding gene.
제1항에 있어서, 상기 공여 벡터는 프로모터, 복제 기원, 오퍼레이터, 폴리아데닐화 신호, 인핸서 및 분비 신호 및 친화성 태그(affinity tag)로 이루어진 군에서 선택된 하나 이상을 추가로 포함하는 것을 특징으로 하는 공여벡터.
The method according to claim 1, wherein the donor vector further comprises at least one selected from the group consisting of a promoter, an origin of replication, an operator, a polyadenylation signal, an enhancer and an secretion signal, and an affinity tag Vector donation.
제1항에 있어서, 상기 공여벡터는
플라스미드 pGBKT7에 멀티 클로닝 사이트(MCS)를 제거하고, 멀티플 클로닝 사이트(MCS)를 두 개의 Sfi I 제한효소 자리로 대체하고, 그 뒤로 lox2272 서열과 바코드 삽입 부위, 카나마이신 항생제 저항성 유전자와 프로모터, GFP 유전자 및 loxP 서열이 순차적으로 도입된 것을 특징으로 하는 pDBD-donor 벡터
인 공여벡터.
2. The method of claim 1, wherein the donor vector
The multiple cloning site (MCS) was removed from the plasmid pGBKT7, the multiple cloning site (MCS) was replaced with two Sfi I restriction sites, followed by the lox2272 sequence and the barcode insertion site, the kanamycin antibiotic resistance gene and promoter, the GFP gene pDBD-donor vector &lt; RTI ID = 0.0 &gt;
Vector illustration.
제17항에 있어서, 상기 pDBD-donor 벡터는 도 2의 개열지도로 나타내어지는 것을 특징으로 하는 공여벡터.
18. The donor vector according to claim 17, wherein the pDBD-donor vector is represented by a cleavage map of Fig.
제18항에 있어서, 상기 pDBD-donor 벡터는 서열번호 15 로 이루어진 것을 특징으로 하는 공여벡터.
19. The donor vector of claim 18, wherein the pDBD-donor vector comprises SEQ ID NO: 15.
제19항에 있어서, 상기 pDBD-donor 벡터는 기탁번호 KCTC12790BP로 기탁된 벡터인 것을 특징으로 하는 공여벡터.
20. The donor vector according to claim 19, wherein the pDBD-donor vector is a vector deposited with Accession No. KCTC12790BP.
제1 프로모터;
숙주세포 리포터 유전자의 전사를 돕는 AD 코딩 서열;
프레이 단백질 코딩 서열의 삽입을 위한 제1클로닝 부위;
상기 프레이 단백질을 표시하는 바코드 서열의 삽입을 위한 제2클로닝 부위;
제1 부위 특이적 재조합효소 인식 서열(site-specific recombination site);및
제2 부위 특이적 재조합효소 인식 서열을 포함하는 것을 특징으로 하는 수용벡터.
A first promoter;
An AD coding sequence to aid transcription of the host cell reporter gene;
A first cloning site for insertion of a pre-protein coding sequence;
A second cloning site for insertion of a barcode sequence representing said pre-protein;
A first site-specific recombination site; and
And a second site-specific recombinase recognition sequence.
제21항에 있어서, 상기 AD 코딩 서열과 제1 클로닝 부위 사이에 링커 서열을 추가적으로 포함하는 것을 특징으로 하는 수용벡터.
22. The acceptor vector of claim 21, further comprising a linker sequence between the AD coding sequence and the first cloning site.
제21항에 있어서, 상기 수용 벡터의 제1 및 제2 부위 특이적 재조합효소 인식 서열은 동일 배향(same orientation)인 것을 특징으로 하는 수용벡터.
22. The acceptor vector of claim 21, wherein the first and second site-specific recombinase recognition sequences of the acceptor vector are in the same orientation.
제21항에 있어서, 상기 제1 또는 제2 부위 특이적 재조합효소 인식 서열은 lox 부위(site), rox 부위, att 부위, dif 부위 및 frt 부위로 이루어지는 군에서 선택되는 것을 특징으로 하는 수용벡터.
22. The acceptor vector according to claim 21, wherein the first or second site-specific recombinase recognition sequence is selected from the group consisting of lox site, rox site, att site, dif site and frt site.
제21항에 있어서, 상기 제1 또는 제2 부위 특이적 재조합효소 인식 서열은 lox P와 그 이형, rox와 그 이형, att P와 그 이형, dif와 그 이형 및 frt와 그 이형으로 이루어지는 군에서 선택되는 것을 특징으로 하는 수용벡터.
22. The method according to claim 21, wherein said first or second site-specific recombinase recognition sequence is selected from the group consisting of lox P and its variant, rox and its variant, att P and its variant, dif and its variant and frt and its variants &Lt; / RTI &gt;
제24항에 있어서, 상기 lox 부위(site)는 loxB, loxL, loxR, loxP, loxP3, loxP23, loxΔ86, loxΔ117, loxP511, loxC2, loxP2272, loxP5171, loxP71, loxP66, M2, M3, M7, M11로 이루어진 군에서 선택되는 것을 특징으로 하는 수용벡터.
26. The method of claim 24, wherein the lox site is selected from the group consisting of loxB, loxL, loxR, loxP, loxP3, loxP23, loxΔ86, loxΔ117, loxP511, loxC2, loxP2272, loxP5171, loxP71, loxP66, M2, M3, M7, Lt; RTI ID = 0.0 &gt; 1, &lt; / RTI &gt;
제21항에 있어서, 상기 제1 및 제2 부위 특이적 재조합 효소 인식 서열은 loxP 및 loxP 변이체(mutant loxP)인 것을 특징으로 하는 수용벡터.
The acceptor vector according to claim 21, wherein the first and second site-specific recombinase recognition sequences are loxP and loxP mutants (mutant loxP).
제21항에 있어서, 상기 수용 벡터의 제1 및 제2 부위 특이적 재조합효소 인식 서열은 각각 제1항의 공여 벡터의 제1 및 제2 부위 특이적 재조합 효소 인식 서열과 동일한 것을 특징으로 하는 수용벡터.
22. The method of claim 21, wherein the first and second site-specific recombinase recognition sequences of the acceptor vector are identical to the first and second site-specific recombinase recognition sequences of the donor vector of claim 1, respectively, .
제21항에 있어서, 상기 수용벡터는 제2 부위 특이적 재조합효소 인식 서열의 하류에 하나 이상의 마커 유전자를 추가로 포함하는 것을 특징으로 하는 것을 수용벡터.
22. The acceptor vector according to claim 21, wherein the acceptor vector further comprises at least one marker gene downstream of the second site-specific recombinase recognition sequence.
제29항에 있어서, 상기 마커 유전자는
(ⅰ) 약물 저항성 유전자;
(ⅱ) 형광 단백질 코딩 유전자;
(ⅲ) 영양 요구성 표지 유전자;
(ⅳ) 전사 인자 유전자; 및
(ⅴ) 세포 표면 마커 유전자
로 이루어진 군에서 선택되는 것을 특징으로 하는 수용벡터.
30. The method of claim 29, wherein the marker gene is
(I) a drug resistance gene;
(Ii) a fluorescent protein coding gene;
(Iii) an auxotrophic marker gene;
(Iv) a transcription factor gene; And
(V) a cell surface marker gene
&Lt; / RTI &gt; wherein the acceptor vector is selected from the group consisting of:
제30항에 있어서, 상기 마커 유전자는,
상기 마커 유전자의 하류에 위치하며 제1 프로모터와 반대 전사 배향인 제2 프로모터와 작동가능하게 연결되는 것을 특징으로 하는 수용벡터.
31. The method according to claim 30,
Is operatively linked to a second promoter located downstream of the marker gene and in an opposite transcriptional orientation to the first promoter.
제21항에 있어서, 상기 수용 벡터는 제2 부위 특이적 재조합효소 인식 서열이, 이의 하류에 순차적으로
번역 종결 코돈이 제거된 제1 마커 유전자; 및
제1 프로모터와 반대 전사 배향이며 상기 제1 마커 유전자와 작동 가능하게 연결된 제2 프로모터
와 추가적으로 연결되어 있는 것을 특징으로 하는 수용벡터.
22. The method of claim 21, wherein the acceptor vector comprises a second site-specific recombinase recognition sequence,
A first marker gene from which a translation termination codon has been removed; And
A second promoter that is opposite in transcriptional orientation to the first promoter and is operably linked to the first marker gene
And an additional vector is further coupled to the acceptance vector.
제32항에 있어서, 상기 수용 벡터는 제2 프로모터의 하류에 순차적으로
제2 마커 유전자; 및
제1 프로모터와 반대 전사 배향이며 상기 제2 마커 유전자와 작동 가능하게 연결된 제3 프로모터를 추가적으로 포함하는 것을 특징으로 하는 수용벡터.
33. The method of claim 32, wherein the acceptor vector is sequenced downstream of the second promoter
A second marker gene; And
Wherein the vector further comprises a third promoter that is opposite in transcriptional orientation to the first promoter and is operably linked to the second marker gene.
제33항에 있어서, 상기 제2 마커 유전자는 항생제 저항성 유전자인 것을 특징으로 하는 수용벡터.
34. The acceptor vector of claim 33, wherein the second marker gene is an antibiotic resistance gene.
제21항에 있어서, 상기 수용 벡터는 프로모터, 복제 기원, 오퍼레이터, 폴리아데닐화 신호, 인핸서 및 분비 신호 및 친화성 태그(affinity tag)로 이루어진 군에서 선택된 하나 이상을 추가로 포함하는 것을 특징으로 하는 수용벡터.
22. The method of claim 21, wherein the acceptor vector further comprises at least one selected from the group consisting of a promoter, an origin of replication, an operator, a polyadenylation signal, an enhancer and an secretion signal, and an affinity tag Acceptance vector.
제21항에 있어서, 상기 수용 벡터는
플라스미드 pGADT7의 LEU2 유전자 말단에 loxP 서열을 삽입하고, 멀티플 클로닝 사이트(MCS)를 두 개의 Sfi I 제한효소 자리로 대체하고, 그 뒤로 바코드 삽입 부위, lox2272 서열이 순차적으로 도입된 것을 특징으로 하는 pAD-acc 벡터
인 수용벡터.
22. The method of claim 21,
Characterized in that the loxP sequence is inserted at the LEU2 gene end of the plasmid pGADT7, the multiple cloning site (MCS) is replaced with two Sfi I restriction enzyme sites, followed by the barcode insertion site and the lox2272 sequence, acc vector
Phosphorylation.
제36항에 있어서, 상기 pAD-acc 벡터는 도 1의 개열지도로 나타내어지는 것을 특징으로 하는 수용벡터.
37. The acceptor vector of claim 36, wherein said pAD-acc vector is represented by a cleavage map of Fig.
제36항에 있어서, 상기 pAD-acc 벡터는 도 10의 개열지도로 나타내어지는 것을 특징으로 하는 수용벡터.
37. The acceptor vector of claim 36, wherein the pAD-acc vector is represented by a cleavage map of FIG.
제37항에 있어서, 상기 pAD-acc 벡터는 서열번호 16으로 이루어진 것을 특징으로 하는 수용벡터.
38. The acceptor vector of claim 37, wherein said pAD-acc vector is of SEQ ID NO: 16.
제38항에 있어서, 상기 pAD-acc 벡터는 서열번호 17로 이루어진 것을 특징으로 하는 수용벡터.
39. The acceptor vector of claim 38, wherein the pAD-acc vector is of SEQ ID NO:
제40항에 있어서, 상기 pAD-acc 벡터는 기탁번호 KCTC12791BP로 기탁된 벡터인 것을 특징으로 하는 수용벡터.
41. The acceptor vector of claim 40, wherein the pAD-acc vector is a vector deposited with Accession No. KCTC12791BP.
제1항의 공여벡터 및 제21항의 수용벡터를 포함하는, 단백질 상호작용 검출을 위한 키트(kit).
A kit for detecting protein interactions, comprising the donor vector of claim 1 and the acceptor vector of claim 21.
(a) 제1항의 공여벡터에 베이트(bait) 단백질 코딩 서열 및 상기 베이트 단백질을 표시하는 바코드 서열을 도입하여 베이트 라이브러리를 제작 하는 단계;
(b) 제21항의 수용벡터에 프레이(prey) 단백질 코딩 서열 및 상기 프레이 단백질을 표시하는 바코드 서열을 도입하여 프레이 라이브러리를 제작하는 단계;
(c) 상기 베이트 라이브러리 및 프레이 라이브러리를 리포터로서 재조합효소를 발현하는 숙주세포에 도입하는 단계; 및
(d) 상기 숙주세포로부터 리포터 발현 여부를 조사하여 베이트-프레이 단백질 결합 쌍들을 검출하는 단계를 포함하는
단백질 상호작용 검출 방법.
(a) preparing a bait library by introducing a bait protein coding sequence and a barcode sequence representing the bait protein into the donor vector of claim 1;
(b) introducing a prey protein coding sequence and a barcode sequence representing the pre-protein into the acceptor vector of claim 21 to prepare a pre-library;
(c) introducing the bait library and the prey library into a host cell expressing the recombinant enzyme as a reporter; And
(d) detecting the reporter expression from said host cell and detecting bait-prey protein binding pairs
Protein interaction detection method.
제43항에 있어서, 상기 숙주세포는 원핵세포 또는 진핵세포인 방법.
44. The method of claim 43, wherein the host cell is a prokaryotic or eukaryotic cell.
제44항에 있어서, 진핵세포는 균류, 곤충 및 포유동물로 이루어진 진핵세포 군으로부터 선택되는 방법.
45. The method of claim 44, wherein the eukaryotic cell is selected from the group of eukaryotic cells consisting of fungi, insects and mammals.
제44항에 있어서, 상기 원핵세포는 박테리아(bacteria)인 것을 특징으로 하는 방법.45. The method of claim 44, wherein the prokaryotic cell is a bacteria.
KR1020150058333A 2014-04-25 2015-04-24 Vectors for measuring multiple protein-protein interactions simultaneously KR20150123741A (en)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR20140049726 2014-04-25
KR1020140049726 2014-04-25
KR1020150037979 2015-03-19
KR1020150037979A KR20150124383A (en) 2014-04-25 2015-03-19 Method for measuring multiple protein-protein interactions simultaneously between two yeast library

Publications (1)

Publication Number Publication Date
KR20150123741A true KR20150123741A (en) 2015-11-04

Family

ID=54600602

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020150037979A KR20150124383A (en) 2014-04-25 2015-03-19 Method for measuring multiple protein-protein interactions simultaneously between two yeast library
KR1020150058333A KR20150123741A (en) 2014-04-25 2015-04-24 Vectors for measuring multiple protein-protein interactions simultaneously
KR1020150058335A KR20150124402A (en) 2014-04-25 2015-04-24 Yeast strain with dual reporter system for barcode transfer assay

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020150037979A KR20150124383A (en) 2014-04-25 2015-03-19 Method for measuring multiple protein-protein interactions simultaneously between two yeast library

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020150058335A KR20150124402A (en) 2014-04-25 2015-04-24 Yeast strain with dual reporter system for barcode transfer assay

Country Status (1)

Country Link
KR (3) KR20150124383A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200114292A (en) * 2019-03-28 2020-10-07 김태욱 Composition for detecting protein-protein interactions comprising fragments of SEAP and method for detecting protein-protein interactions using the same

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200114292A (en) * 2019-03-28 2020-10-07 김태욱 Composition for detecting protein-protein interactions comprising fragments of SEAP and method for detecting protein-protein interactions using the same

Also Published As

Publication number Publication date
KR20150124402A (en) 2015-11-05
KR20150124383A (en) 2015-11-05

Similar Documents

Publication Publication Date Title
KR102370675B1 (en) Improved methods for modification of target nucleic acids
CN107893075A (en) CRISPR Cas9 targeting knock out people colon-cancer cell RITA genes and its specific sgRNA
CN108026523A (en) Guide RNA assembles carrier
CN107090441A (en) The method based on MGMT for obtaining high yield expression of recombinant proteins
US11001859B2 (en) Recombinantly-modified adeno-associated virus helper vectors and their use to improve the packaging efficiency of recombinantly-modified adeno-associated virus
US6544779B1 (en) Pseudo-type retroviral vectors with modifiable surface capsid proteins
CN105176936B (en) Replicate the subclone and preparation method and application of the Semliki forest virus of tolerance type
CN113061626B (en) Method for knocking out zebra fish genes in tissue-specific manner and application
CN110734480A (en) Application of Escherichia coli molecular chaperone GroEL/ES in assisting synthesis of plant Rubisco
CN111534542A (en) PiggyBac transposon system mediated eukaryotic transgenic cell line and construction method thereof
KR20150123741A (en) Vectors for measuring multiple protein-protein interactions simultaneously
CN114874332B (en) Use of modified RNF112 as a medicament for the treatment of ALS
CN113637672B (en) Base editing tool and construction method thereof
CN113355288B (en) Preparation method and application of universal chimeric antigen receptor T cell for treating COVID-19
CN116135974A (en) Recombinant glycosylase base editing system and application thereof
KR20080030378A (en) System of biomolecular fluorescence complementation containing a cell inserted a part of fluorescence protein gene in chromosome and methods of biomolecular fluorescence complementation by using it
CN111826397A (en) Method for producing recombinant target protein, overexpression vector and virus suspension
JP2022541238A (en) Use of Ion Concentration to Increase Packaging Efficiency of Recombinant Adeno-associated Virus
CN110747216A (en) Multigene co-expression complete vector and application thereof
CN104673832B (en) A method of assembling TALE/TALEN module
CN114317605B (en) Construction method of microglial cell potassium ion probe transgenic mouse model
CN115109791B (en) Functional gene delivery vector based on IncQ plasmid flood host, construction method and application
US20220257678A1 (en) Recombinantly-modified adeno-associated virus (raav) having improved packaging efficiency
CN113604503A (en) Construction method and application of novel primary cilia-marked transgenic zebra fish
CN112111512A (en) Method for researching blood vessel growth by conditional induction kdrl gene knockout in zebra fish

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application