KR102245733B1 - Method for protein structure determination using an antibody that binds to alpha helix - Google Patents

Method for protein structure determination using an antibody that binds to alpha helix Download PDF

Info

Publication number
KR102245733B1
KR102245733B1 KR1020190125045A KR20190125045A KR102245733B1 KR 102245733 B1 KR102245733 B1 KR 102245733B1 KR 1020190125045 A KR1020190125045 A KR 1020190125045A KR 20190125045 A KR20190125045 A KR 20190125045A KR 102245733 B1 KR102245733 B1 KR 102245733B1
Authority
KR
South Korea
Prior art keywords
leu
ser
gly
ala
thr
Prior art date
Application number
KR1020190125045A
Other languages
Korean (ko)
Other versions
KR20210042466A (en
Inventor
이지오
김지원
조근영
Original Assignee
포항공과대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 포항공과대학교 산학협력단 filed Critical 포항공과대학교 산학협력단
Priority to KR1020190125045A priority Critical patent/KR102245733B1/en
Publication of KR20210042466A publication Critical patent/KR20210042466A/en
Application granted granted Critical
Publication of KR102245733B1 publication Critical patent/KR102245733B1/en

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6854Immunoglobulins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/12Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from bacteria
    • C07K16/1267Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from bacteria from Gram-positive bacteria
    • C07K16/1271Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from bacteria from Gram-positive bacteria from Micrococcaceae (F), e.g. Staphylococcus
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/40Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against enzymes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/20Protein or domain folding
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/60Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments
    • C07K2317/62Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments comprising only variable region components
    • C07K2317/622Single chain antibody (scFv)

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Immunology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Physics & Mathematics (AREA)
  • Hematology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biotechnology (AREA)
  • Urology & Nephrology (AREA)
  • Biomedical Technology (AREA)
  • Analytical Chemistry (AREA)
  • Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • Food Science & Technology (AREA)
  • Microbiology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Cell Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Peptides Or Proteins (AREA)

Abstract

본 발명은 대상 단백질의 구조를 규명하기 위한 신규한 방법에 관한 것으로서, 보다 구체적으로는 대상 단백질의 알파나선 구조에 항나선 항체(antihelix antibody)에 대한 에피토프(epitope)를 도입함으로써 대상 단백질의 구조를 규명하는 방법에 관한 것이다. 본 발명에 따른 단백질 규명 방법의 제공으로, 기존의 방법으로는 크기가 너무 작거나 결정화가 어려워 그 구조를 결정할 수 없었던 다양한 종류의 단백질 구조를 빠르고 효율적으로 규명할 수 있게 되므로, 단백질의 구조를 결정하는데 소요되는 시간, 비용, 및 노력을 절감하는데 매우 유용할 것으로 기대된다.The present invention relates to a novel method for identifying the structure of a target protein, and more specifically, the structure of a target protein by introducing an epitope for an antihelix antibody into the alpha-helix structure of the target protein. It's about how to figure it out. With the provision of the protein identification method according to the present invention, it is possible to quickly and efficiently identify various types of protein structures that were too small in size or difficult to crystallize by conventional methods, so that the structure of the protein can be determined. It is expected to be very useful in reducing the time, cost, and effort required to do so.

Description

알파나선에 결합하는 항체를 이용한 단백질 구조 규명 방법 {Method for protein structure determination using an antibody that binds to alpha helix}Method for protein structure determination using an antibody that binds to alpha helix}

본 발명은 단백질의 구조 규명 방법에 관한 것으로서, 보다 구체적으로는 알파나선에 결합하는 항체를 이용하여 기존의 방법으로는 그 구조를 파악하기 어려웠던 단백질의 구조를 규명하는 방법에 관한 것이다.The present invention relates to a method for identifying the structure of a protein, and more particularly, to a method for identifying the structure of a protein, which was difficult to determine the structure by the conventional method using an antibody that binds to an alpha helix.

항체는 단백질 공학 및 구조 생물학 분야에서 필수적인 연구 도구로서, X-선 결정학(crystallography) 및 전자현미경에 의한 단백질의 구조 연구에 도움이 되는 것으로 밝혀졌으며, 유용한 단백질 나노 구조체를 구성하는 데에도 사용되고 있다. 특히 단백질의 고해상도 입체구조는 신약 물질과 표적 단백질의 결합방식을 보여주기 때문에 신약 개발에서 중요한 플랫폼이 된다. 지금까지 약 15만 개의 단백질 구조가 규명되었지만, 그 중에서 신약의 표적이 될 수 있는 인간 단백질은 전체 유전자의 10%에 그치고 있다. 그 중에서도 특히 세포막에 결합되어있는 GPCR(G protein-coupled receptor), 이온채널, 수용체 단백질들은 신약 개발에서 가장 중요한 위치를 차지하고 있음에도 불구하고, 그 구조가 거의 규명되어 있지 않은 상태이다. 단백질의 구조 규명이 어려운 가장 큰 이유는 결정화 조건을 찾기 어렵기 때문이다. X-선 결정학은 단백질 구조 규명에서 가장 많이 사용되고 있는 기술이다. X-선 회절을 이용하여 구조를 규명하기 위해서는 크리스탈 상태의 샘플이 필요하지만, 결정화 조건을 찾는 것이 많은 시간이 소요되는 경우가 많고 아예 불가능한 경우도 많다. 단백질 구조를 규명하는 또 다른 방법은 극저온 전자현미경을 이용하는 방법이 있다. 이 방법은 크리스탈 상태의 샘플이 필요 없다는 장점이 있지만, 분자량 50kDa 이하의 작은 단백질에는 적용하기 어려운 단점이 있다. 항체의 이용은 이러한 단점을 해결해 줄 수 있기 때문에 단백질 구조 규명에 있어 매우 중요한 도구이다. 결정화가 어려운 표적 단백질에 항체가 결합하면 소수성 또는 유연한 표면을 숨김으로써 결정화를 도와줄 수 있으며, 전자현미경으로 구조 규명이 어려운 작은 크기의 표적 단백질에 결합하여 전체 단백질의 유효 크기를 증가시킴으로써 구조 규명을 가능케 한다.Antibodies, as essential research tools in the fields of protein engineering and structural biology, have been found to be helpful in the study of the structure of proteins by X-ray crystallography and electron microscopy, and are also used to construct useful protein nanostructures. In particular, the high-resolution three-dimensional structure of a protein is an important platform in the development of a new drug because it shows the binding method of a new drug substance and a target protein. So far, about 150,000 protein structures have been identified, but among them, only 10% of all genes are human proteins that can be targeted for new drugs. Among them, in particular, the G protein-coupled receptor (GPCR), ion channel, and receptor proteins bound to the cell membrane occupy the most important positions in the development of new drugs, but their structures are hardly elucidated. The biggest reason why it is difficult to determine the structure of a protein is that it is difficult to find crystallization conditions. X-ray crystallography is the most widely used technique for protein structure identification. In order to investigate the structure using X-ray diffraction, a sample in a crystal state is required, but finding crystallization conditions is often time-consuming and impossible. Another way to determine the structure of a protein is to use a cryogenic electron microscope. This method has the advantage that it does not require a sample in a crystal state, but has a disadvantage that it is difficult to apply to small proteins with a molecular weight of 50 kDa or less. The use of antibodies is a very important tool in the identification of protein structure because it can solve these shortcomings. When an antibody binds to a target protein that is difficult to crystallize, it can help crystallization by hiding a hydrophobic or flexible surface, and it binds to a target protein of a small size, which is difficult to identify with an electron microscope, and increases the effective size of the entire protein. Make it possible.

한편, 단백질 구조 연구에 유용한 항체는 단백질의 3차원 입체구조를 인식함과 동시에 단백질에 경직된 구조로 결합하여야 한다. 단백질의 유연한 선형 영역에 결합하는 항체는 단단한 복합체를 형성할 수 없기 때문에, 단백질에 강하게 결합하여도 구조 규명에는 전혀 도움이 되지 않는다. 따라서, 각각의 표적 단백질에 대하여 상기와 같은 특별한 특성을 지니는 항체를 따로 만들어야 한다. 그러나 이러한 항체를 제작하는 데에는 6~8개월 정도의 긴 시간이 소요되고, 통상적으로 1~10mg 정도의 정제된 다량의 표적 단백질이 필요하다. 즉, 단백질의 구조 규명을 위한 항체의 생성 및 항원과의 복합체를 특성화 하는 데에는 상당한 시간과 노력이 소요되며, 특히 신약 개발에 중요한 세포막 단백질의 경우에는 상기와 같이 많은 양의 단백질을 생산·정제하는 것이 매우 어렵기 때문에 구조 규명에 있어 큰 장애가 되고 있다.On the other hand, antibodies useful for protein structure studies must recognize the three-dimensional conformational structure of the protein and at the same time bind to the protein in a rigid structure. Antibodies that bind to the flexible linear region of a protein cannot form a rigid complex, so even if it binds strongly to a protein, it does not help at all in the elucidation. Therefore, for each target protein, an antibody having the above-described special properties must be separately prepared. However, it takes a long time of about 6 to 8 months to produce such an antibody, and typically requires a large amount of purified target protein of about 1 to 10 mg. In other words, it takes considerable time and effort to generate antibodies and characterize complexes with antigens for the identification of the structure of proteins, especially in the case of cell membrane proteins, which are important for the development of new drugs, to produce and purify a large amount of proteins as described above. Because it is very difficult, it poses a major obstacle to the investigation of the structure.

KRKR 10-142682310-1426823 B1B1

본 발명은 상술한 문제점을 해결하기 위하여 안출된 것으로서, 본 발명의 목적은 대상 단백질의 구조를 규명하기 위한 항나선 항체 방법(antihelix antibody method)을 제공하는 것이다.The present invention has been devised to solve the above problems, and an object of the present invention is to provide an antihelix antibody method for clarifying the structure of a target protein.

본 발명의 다른 목적은 항나선 항체에 대한 에피토프(epitope)를 포함하는 조작된 대상 단백질을 제공하는 것이다.Another object of the present invention is to provide an engineered protein of interest containing an epitope for an anti-helix antibody.

본 발명의 또 다른 목적은 항나선 항체에 대한 에피토프(epitope)를 포함하는 조작된 대상 단백질에 항나선 항체가 결합된 복합체를 제공하는 것이다.Another object of the present invention is to provide a complex in which an anti-helix antibody is bound to an engineered target protein containing an epitope for an anti-helix antibody.

본 발명의 또 다른 목적은 상기 조작된 대상 단백질 또는 조작된 대상 단백질에 항나선 항체가 결합된 복합체의 대상 단백질 구조 규명 용도를 제공하는 것이다.Another object of the present invention is to provide a use of the engineered target protein or a complex in which an anti-helix antibody is bound to the engineered target protein to determine the structure of a target protein.

그러나 본 발명이 이루고자 하는 기술적 과제는 이상에서 언급한 과제에 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.However, the technical task to be achieved by the present invention is not limited to the above-mentioned tasks, and other tasks that are not mentioned can be clearly understood by those of ordinary skill in the technical field to which the present invention belongs from the following description. will be.

상기와 같은 본 발명의 목적을 달성하기 위해서, 본 발명은 항나선(antihelix) 항체에 대한 에피토프(epitope)를 대상 단백질의 알파나선(alpha helix)에 생성하는 단계를 포함하고, 상기 에피토프의 아미노산 서열은 하기 (a) 내지 (c)의 조건 중 어느 하나 이상을 만족하는 것을 특징으로 하는, 대상 단백질의 구조 규명 방법을 제공한다:In order to achieve the object of the present invention as described above, the present invention includes the step of generating an epitope for an antihelix antibody in the alpha helix of the target protein, and the amino acid sequence of the epitope Provides a method for identifying the structure of a protein of interest, characterized in that it satisfies any one or more of the following conditions (a) to (c):

(a) 상기 항나선 항체와 상호작용하는 핵심 아미노산 서열을 포함함;(a) contains a key amino acid sequence that interacts with the anti-helix antibody;

(b) 상기 대상 단백질의 소수성 코어(core) 아미노산을 포함함; 또는(b) containing a hydrophobic core amino acid of the protein of interest; or

(c) 상기 항나선 항체와 상기 대상 단백질의 상호작용 시 입체 충돌(steric collision)이 유발되지 아니함.(c) When the anti-helix antibody interacts with the target protein, stereoscopic collision is not caused.

또한, 본 발명에 따른 대상 단백질의 구조 규명 방법에 있어서, 하기의 단계 중 하나 이상의 단계를 더 포함하는 것을 특징으로 하는, 대상 단백질의 구조 규명 방법을 제공한다:In addition, in the method for identifying the structure of a target protein according to the present invention, it provides a method for identifying the structure of a target protein, characterized in that it further comprises at least one of the following steps:

(S1) 에피토프가 생성된 상기 대상 단백질에 항나선 항체를 결합시켜 복합체를 형성시키는 단계;(S1) forming a complex by binding an anti-helix antibody to the target protein in which an epitope has been generated;

(S2) 상기 복합체를 결정화하는 단계; 및(S2) crystallizing the complex; And

(S3) 결정화된 상기 복합체의 구조를 분석하는 단계.(S3) analyzing the structure of the crystallized complex.

본 발명의 일 구체예로, 상기 (a)의 핵심 아미노산은, 아미노산을 구성하는 전체 원자 표면적의 30% 이상이 상기 항나선 항체와 접촉하는 것을 특징으로 하는, 대상 단백질의 구조 규명 방법을 제공한다.In one embodiment of the present invention, the core amino acid of (a) provides a method for identifying the structure of a target protein, characterized in that at least 30% of the total atomic surface area constituting the amino acid is in contact with the anti-helical antibody. .

본 발명의 다른 구체예로, 상기 (b)의 소수성 코어 아미노산은, 아미노산을 구성하는 전체 원자 표면적의 70% 이상이 상기 대상 단백질 내의 다른 원자와 접촉하고 있는 것을 특징으로 하는, 대상 단백질의 구조 규명 방법을 제공한다.In another embodiment of the present invention, the hydrophobic core amino acid of (b) is characterized in that at least 70% of the total atomic surface area constituting the amino acid is in contact with other atoms in the target protein. Provides a way.

본 발명의 또 다른 구체예로, 상기 (c)의 입체충돌은 상기 항나선 항체와 상기 대상 단백질의 백본(backbone) 원자 사이의 거리가 3.5 옹스트롬(Å) 이내인 것을 특징으로 하는, 대상 단백질의 구조 규명 방법을 제공한다.In another embodiment of the present invention, the stereoscopic collision of (c) is characterized in that the distance between the anti-helix antibody and the backbone atom of the target protein is within 3.5 angstroms (Å). Provides a method for identifying structures.

본 발명의 또 다른 구체예로, 상기 백본 원자는 아미노산의 알파(alpha) 탄소, 카복실기(carboxyl group) 또는 아미노기(amino group) 원자인 것을 특징으로 하는, 대상 단백질의 구조 규명 방법을 제공한다.In another embodiment of the present invention, the backbone atom is an alpha carbon, carboxyl group, or amino group atom of an amino acid, providing a method for identifying the structure of a target protein.

본 발명의 일 구체예로, 상기 에피토프는 대상 단백질의 C-말단 알파나선, N-말단 알파나선, 또는 내부 알파나선에 생성되는 것을 특징으로 하는, 대상 단백질의 구조 규명 방법을 제공한다.In one embodiment of the present invention, the epitope is characterized in that it is generated in the C-terminal alpha helix, the N-terminal alpha helix, or the internal alpha helix of the target protein, provides a method for identifying the structure of the target protein.

본 발명의 다른 구체예로, 상기 에피토프 서열의 생성은 합성 올리고뉴클레오타이드(oligonucleotides)를 이용한 PCR(polymerase chain reaction), 또는 OE(overlap extension)-PCR, 또는 상기 에피토프 서열을 포함하는 대상 단백질의 유전자 일부 또는 전부를 합성하는 것으로 달성되는 것을 특징으로 하는, 대상 단백질의 구조 규명 방법을 제공한다.In another embodiment of the present invention, the generation of the epitope sequence is a polymerase chain reaction (PCR) using synthetic oligonucleotides, or overlap extension (OE)-PCR, or a part of a gene of a target protein comprising the epitope sequence. Or it provides a method for identifying the structure of the protein of interest, characterized in that achieved by synthesizing all.

본 발명의 또 다른 구체예로, 상기 항나선 항체는 서열번호 12, 서열번호 13, 서열번호 14, 서열번호 15, 서열번호 16, 및 서열번호 17로 이루어진 군으로부터 선택된 어느 하나 이상의 서열번호로 표시되는 아미노산 서열을 포함하는 것을 특징으로 하는, 대상 단백질의 구조 규명 방법을 제공한다.In another embodiment of the present invention, the anti-helical antibody is represented by any one or more SEQ ID NOs selected from the group consisting of SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, and SEQ ID NO: 17 It provides a method for identifying the structure of a protein of interest, characterized in that it comprises an amino acid sequence.

또한, 본 발명은 항나선(antihelix) 항체에 대한 에피토프(epitope)를 대상 단백질의 알파나선(alpha helix)에 생성하는 단계; 및 에피토프가 생성된 상기 대상 단백질에 항나선 항체를 결합시켜 복합체를 형성시키는 단계를 포함하고, 상기 에피토프의 아미노산 서열은 하기 (a) 내지 (c)의 조건 중 어느 하나 이상을 만족하는 것을 특징으로 하는, 대상 단백질의 형태(conformation) 안정화 방법을 제공한다:In addition, the present invention comprises the steps of generating an epitope for an antihelix antibody in an alpha helix of a target protein; And forming a complex by binding an anti-helical antibody to the protein of interest in which the epitope is generated, wherein the amino acid sequence of the epitope satisfies any one or more of the following conditions (a) to (c). It provides a method for stabilizing the conformation of the target protein:

(a) 상기 항나선 항체와 상호작용하는 핵심 아미노산을 포함함;(a) contains key amino acids that interact with the anti-helix antibody;

(b) 상기 대상 단백질의 소수성 코어(core) 아미노산을 포함함; 또는(b) containing a hydrophobic core amino acid of the protein of interest; or

(c) 상기 항나선 항체와 상기 대상 단백질의 상호작용 시 입체충돌(steric collision)이 유발되지 아니함.(c) When the anti-helix antibody interacts with the target protein, stereoscopic collision is not caused.

또한, 본 발명은 서열번호 1, 서열번호 2, 서열번호 3, 서열번호 4, 서열번호 5, 및 서열번호 8로 이루어진 군으로부터 선택된 어느 하나의 서열번호로 표시되는 아미노산 서열을 포함하는 조작된 단백질 A(protein A), 또는 상기 조작된 단백질 A에 항나선 항체가 결합된 복합체를 제공한다.In addition, the present invention is an engineered protein comprising an amino acid sequence represented by any one sequence number selected from the group consisting of SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, and SEQ ID NO: 8. A (protein A), or a complex in which an anti-helix antibody is bound to the engineered protein A is provided.

또한, 본 발명은 서열번호 6으로 표시되는 아미노산 서열을 포함하는 조작된 칼모듈린(calmodulin), 또는 상기 조작된 칼모듈린에 항나선 항체가 결합된 복합체를 제공한다.In addition, the present invention provides an engineered calmodulin comprising the amino acid sequence represented by SEQ ID NO: 6, or a complex in which an anti-helix antibody is bound to the engineered calmodulin.

또한, 본 발명은 서열번호 7로 표시되는 아미노산 서열을 포함하는 조작된 T4 라이소자임(lysozyme), 또는 상기 조작된 T4 라이소자임에 항나선 항체가 결합된 복합체를 제공한다.In addition, the present invention provides an engineered T4 lysozyme comprising the amino acid sequence represented by SEQ ID NO: 7 or a complex in which an anti-helical antibody is bound to the engineered T4 lysozyme.

또한, 본 발명은 서열번호 9 또는 서열번호 10으로 표시되는 아미노산 서열을 포함하는 조작된 P-gp(glycoprotein), 또는 상기 조작된 P-gp에 항나선 항체가 결합된 복합체를 제공한다.In addition, the present invention provides an engineered P-gp (glycoprotein) comprising an amino acid sequence represented by SEQ ID NO: 9 or SEQ ID NO: 10, or a complex in which an anti-helical antibody is bound to the engineered P-gp.

또한, 본 발명은 서열번호 11로 표시되는 아미노산 서열을 포함하는 조작된 ABCB6(ATP-binding cassette sub-family B member 6, mitochondrial) 수송체(transporter), 또는 상기 조작된 ABCB6 수송체에 항나선 항체가 결합된 복합체를 제공한다.In addition, the present invention is an anti-helix antibody to the engineered ABCB6 (ATP-binding cassette sub-family B member 6, mitochondrial) transporter, or the engineered ABCB6 transporter comprising the amino acid sequence represented by SEQ ID NO: 11 Provides a combined complex.

또한, 본 발명은 상기 조작된 단백질 A(protein A), 상기 조작된 칼모듈린, 상기 조작된 T4 라이소자임, 상기 조작된 P-gp, 상기 조작된 ABCB6 수송체, 및 이들 각각에 항나선 항체가 결합된 복합체들로 이루어진 군으로부터 선택된 어느 하나 이상의 단백질 구조 규명 용도를 제공한다.In addition, the present invention relates to the engineered protein A, the engineered calmodulin, the engineered T4 lysozyme, the engineered P-gp, the engineered ABCB6 transporter, and anti-helical antibodies to each of them. It provides the use of any one or more protein structures selected from the group consisting of bound complexes.

본 발명에 따른 대상 단백질의 구조 규명 방법을 이용하면, 기존에 존재하는 여러 종류의 항나선 항체를 이용할 수 있으므로, X-선 결정학과 초저온전자현미경에 의한 단백질 구조 연구에 있어서 빠르고 효율적으로 단백질의 구조를 결정할 수 있으며, 나아가 유용한 단백질의 나노 구조체를 구성하는 데에도 응용될 수 있을 것으로 기대된다.When the method for identifying the structure of a target protein according to the present invention is used, various types of anti-helix antibodies can be used, so that the structure of the protein is quickly and efficiently in the study of protein structure by X-ray crystallography and cryogenic electron microscopy. Can be determined, and furthermore, it is expected to be applied to construct a nanostructure of a useful protein.

도 1a 내지 도 1e는 3MNZ-단백질 A #8420 복합체의 결정 구조를 나타낸 도면이다: (도 1a) 단백질 A #8420에서 조작된 에피토프의 아미노산 서열; (도 1b) 단백질 A 및 gp41-3MNZ의 도킹 구조; (도 1c) 3MNZ 에피토프를 갖는 조작된 단백질 A의 예측 구조; (도 1d) 네이티브 단백질 A와 조작된 단백질 A #8420의 구조 비교; (도 2e) 3MNZ scFv 및 단백질 A #8420 복합체의 결정 구조(좌) 및 조작된 에피토프의 확대도(우).
도 2a 내지 도 2h는 3LRH-단백질 A 복합체의 결정 구조를 나타낸 도면이다: (도 2a) 단백질 A #8188에서 조작된 에피토프의 아미노산 서열; (도 2b) 단백질 A 및 헌팅틴-3LRH의 도킹 구조; (도 2c) 헌팅틴 에피토프를 갖는 조작된 단백질 A #8188의 예측 구조; (도 2d) 3LRH 인트라바디와 단백질 A #8188 복합체의 결정 구조(좌측) 및 조작된 에피토프의 확대도(우측); (도 2e) 네이티브 단백질 A와 조작된 단백질 A #8188의 구조 비교; (도 2f) 단백질 A #8189(상단) 및 #8496(하단)에서 조작된 에피토프의 아미노산 서열; (도 2g) 3LRH 인트라바디와 단백질 A #8189 복합체의 결정 구조(좌측) 및 3LRH 인트라바디와 단백질 A #8496 복합체의 결정 구조(우측); (도 2h) 네이티브 단백질 A와 조작된 단백질 A #8189 및 #8496의 구조 비교.
도 3a 내지 도 3d는 3LRH-칼모듈린 복합체의 결정 구조를 나타낸 도면이다: (도 3a) 칼모듈린 #9011에서 조작된 에피토프의 아미노산 서열; (도 3b) 칼모듈린과 헌팅틴 나선의 구조 정렬; (도 3c) 네이티브 칼모듈린과 조작된 칼모듈린 #9011의 구조 비교; (도 3d) 3LRH 인트라바디 및 칼모듈린 #9011 복합체의 결정 구조(좌측) 및 조작된 에피토프의 확대도(우측).
도 4a 내지 도 4d는 3LRH-T4 라이소자임 복합체의 결정 구조를 나타낸 도면이다: (도 4a) T4 라이소자임에서 조작된 에피토프의 아미노산 서열; (도 4b) T4 라이소자임과 헌팅틴 나선의 구조 정렬; (도 4c) 3LRH 인트라바디와 T4 라이소자임 #9213 복합체의 결정 구조(좌측) 및 조작된 에피토프의 확대도(우측); (도 4d) 네이티브 T4 라이소자임과 조작된 T4 라이소자임 #9213의 구조 비교.
도 5a 내지 도 5d는 1P4B-단백질 A #9014 복합체의 결정 구조를 나타낸 도면이다: (도 5a) 단백질 A #9014에서 조작된 에피토프의 아미노산 서열; (도 5b) GCN4 에피토프를 갖는 조작된 단백질 A의 예측 구조; (도 5c) 1P4B scFv 및 단백질 A #9014 복합체의 결정 구조(좌측) 및 조작된 에피토프의 확대도(우측); (도 5d) 네이티브 단백질 A와 조작된 단백질 A #9014의 구조 비교.
도 6a 내지 도 6f는 인간 ABCB6와 1P4B Fab 간의 상호작용을 나타낸 도면이다: (도 6a) ABCB6 상동성 모델 및 인간 ABCB6 결정 구조의 NBD 도메인의 중첩도; (도 6b) ABCB6 #4038에서 조작된 에피토프의 아미노산 서열(상단), 1P4B 에피토프를 갖는 조작된 ABCB6의 예측 구조(좌하단), 및 1P4B scFv와 ABCB6 #4038 복합체의 예측 구조(우하단); (도 6c) 1P4B scFv와 네이티브 ABCB6의 입체 충돌; (도 6d) ABCB6-1P4B Fab 복합체의 크기 배제 크로마토그래피 프로파일(좌측) 및 SDS-PAGE 분석 결과(우측); (도 6e) 1P4B Fab가 있거나(좌측) 없는(우측) ABCB6의 전자현미경 사진; (도 6f) 박테리아성 복합 약물 ABC 수송체 Sav1866의 도킹 결정 구조를 나타내는 전자현미경 맵.
도 7a 내지 도 7g는 예쁜꼬마선충의 P-gp 내의 1P4B 또는 3LRH 에피토프를 조작한 결과를 나타낸 도면이다: (도 7a) 1P4B scFv 및 P-gp #3273 복합체의 예측 구조; (도 7b) P-gp #3273에서 조작된 에피토프의 아미노산 서열(좌측) 및 1P4B 에피토프를 갖는 조작된 P-gp의 예측 구조(우측); (도 7c) 3LRH 인트라바디 및 P-gp #3274 복합체의 예측 구조; (도 7d) P-gp #3274에서 조작된 에피토프의 아미노산 서열(좌측) 및 3LRH 에피토프를 갖는 조작된 P-gp의 예측 구조(우측); (도 7e) P-gp #3273-1P4B scFv 복합체(상단) 및 P-gp #3274-3LRH 인트라바디 복합체(하단)의 Ni-NTA를 이용한 풀-다운 분석; (도 7f) P-gp #3273-1P4B scFv 복합체(좌측열) 및 P-gp #3274-3LRH 인트라바디 복합체(우측열)의 크기 배제 크로마토그래피 프로파일 및 SDS-PAGE 분석; (도 7g) 파클리탁셀(좌측) 또는 엑티노마이신 D(우측)에 의해 자극된, 항체의 존재 여부에 따른 ATPase 활성.
1A to 1E are diagrams showing the crystal structure of the 3MNZ-Protein A #8420 complex: (FIG. 1A) the amino acid sequence of the epitope engineered in Protein A #8420; (Fig. 1b) the docking structure of protein A and gp41-3MNZ; (Fig. 1c) Predicted structure of engineered protein A with 3MNZ epitope; (Fig. 1D) Structure comparison of native protein A and engineered protein A #8420; (Fig. 2e) The crystal structure of the 3MNZ scFv and Protein A #8420 complex (left) and an enlarged view of the engineered epitope (right).
2A to 2H are diagrams showing the crystal structure of the 3LRH-Protein A complex: (FIG. 2A) the amino acid sequence of the epitope engineered in Protein A #8188; (Fig. 2b) the docking structure of protein A and huntingtin-3LRH; (Fig. 2c) Predicted structure of engineered protein A #8188 with huntingtin epitope; (Fig. 2d) The crystal structure of the 3LRH intrabody and protein A #8188 complex (left) and an enlarged view of the engineered epitope (right); (FIG. 2E) Structure comparison of native protein A and engineered protein A #8188; (FIG. 2F) Amino acid sequences of epitopes engineered in Protein A #8189 (top) and #8496 (bottom); (Fig. 2g) The crystal structure of the 3LRH intrabody and the protein A #8189 complex (left) and the crystal structure of the 3LRH intrabody and the protein A #8496 complex (right); (Fig. 2h) Structure comparison of native protein A and engineered proteins A #8189 and #8496.
3A to 3D are diagrams showing the crystal structure of the 3LRH-calmodulin complex: (Fig. 3A) the amino acid sequence of the epitope engineered in Calmodulin #9011; (Fig. 3b) structure alignment of calmodulin and huntingtin helix; (Fig. 3c) Structure comparison of native calmodulin and engineered calmodulin #9011; (Fig. 3d) The crystal structure of the 3LRH intrabody and calmodulin #9011 complex (left) and an enlarged view of the engineered epitope (right).
4A to 4D are diagrams showing the crystal structure of the 3LRH-T4 lysozyme complex: (FIG. 4A) the amino acid sequence of the epitope engineered in T4 lysozyme; (Fig. 4b) Alignment of the structure of T4 lysozyme and huntingtin helix; (Fig. 4c) The crystal structure of the 3LRH intrabody and T4 lysozyme #9213 complex (left) and an enlarged view of the engineered epitope (right); (Figure 4d) Structure comparison of native T4 lysozyme and engineered T4 lysozyme #9213.
5A to 5D are diagrams showing the crystal structure of the 1P4B-Protein A #9014 complex: (FIG. 5A) the amino acid sequence of the epitope engineered in Protein A #9014; (Fig. 5b) the predicted structure of engineered protein A with a GCN4 epitope; (Fig. 5c) The crystal structure of the 1P4B scFv and Protein A #9014 complex (left) and an enlarged view of the engineered epitope (right); (Figure 5d) Structure comparison of native protein A and engineered protein A #9014.
6A to 6F are diagrams showing the interaction between human ABCB6 and 1P4B Fab: (FIG. 6A) an overlap of the ABCB6 homology model and the NBD domain of the human ABCB6 crystal structure; (Figure 6b) the amino acid sequence of the engineered epitope in ABCB6 #4038 (top), the predicted structure of engineered ABCB6 with the 1P4B epitope (bottom left), and the predicted structure of the complex 1P4B scFv and ABCB6 #4038 (bottom right); (Fig. 6c) steric collision of 1P4B scFv and native ABCB6; (Figure 6d) size exclusion chromatography profile (left) and SDS-PAGE analysis results (right) of the ABCB6-1P4B Fab complex; (Figure 6e) Electron micrograph of ABCB6 with (left) or without (right) 1P4B Fab; (Fig. 6f) An electron microscope map showing the docking crystal structure of the bacterial complex drug ABC transporter Sav1866.
7A to 7G are diagrams showing the results of manipulating the 1P4B or 3LRH epitope in P-gp of the nematode nematode: (FIG. 7A) the predicted structure of the 1P4B scFv and P-gp #3273 complex; (Fig. 7B) The amino acid sequence of the engineered epitope at P-gp #3273 (left) and the predicted structure of the engineered P-gp with 1P4B epitope (right); (Fig. 7c) the predicted structure of the 3LRH intrabody and P-gp #3274 complex; (Fig. 7D) The amino acid sequence of the engineered epitope in P-gp #3274 (left) and the predicted structure of the engineered P-gp with 3LRH epitope (right); (Fig. 7e) Pull-down analysis of P-gp #3273-1P4B scFv complex (top) and P-gp #3274-3LRH intrabody complex (bottom) using Ni-NTA; (Fig. 7f) Size exclusion chromatography profile and SDS-PAGE analysis of P-gp #3273-1P4B scFv complex (left row) and P-gp #3274-3LRH intrabody complex (right row); (Fig. 7g) ATPase activity according to the presence or absence of an antibody stimulated by paclitaxel (left) or actinomycin D (right).

대부분의 단백질은 알파나선(alpha helix) 구조를 가지고 있고, 이러한 구조는 일정하고 경직된 구조를 가지기 때문에 여기에 결합하는 항체는 단백질의 구조 규명에 사용할 수 있다. 본 발명자들은 표적 단백질이 가지고 있는 알파나선 부분의 아미노산 서열을 일부 바꾸면 기존에 잘 연구된 항체가 강하게 결합한다는 사실을 발견하고, 이를 단백질 A, 칼모듈린(calmodulin) 등의 모델 단백질 및 알파나선에 결합하는 3MNZ, 1P4B, 3LRH 등의 모델 항체를 이용하여 단백질의 구조를 규명함으로써 본 발명을 완성하였다.Most proteins have an alpha helix structure, and since this structure has a constant and rigid structure, antibodies that bind to it can be used to investigate the structure of the protein. The present inventors found that if the amino acid sequence of the alpha helix portion of the target protein is partially changed, the previously well-studied antibody binds strongly, and this is applied to model proteins such as protein A and calmodulin, and alpha helix. The present invention was completed by identifying the structure of the protein using model antibodies such as 3MNZ, 1P4B, and 3LRH that bind.

본 발명의 일 실시예에서는, 단백질 A에 3MNZ 항체에 대한 에피토프를 생성한 후, 단백질 A-3MNZ scFv 복합체를 형성시킴으로써 이의 결정 구조를 규명하였다(실시예 2 참조).In one embodiment of the present invention, after generating an epitope for the 3MNZ antibody in Protein A, the crystal structure thereof was elucidated by forming a protein A-3MNZ scFv complex (see Example 2).

본 발명의 다른 실시예에서는, 단백질 A에 3LRH 항체에 대한 에피토프를 알파나선의 각기 다른 세 위치에서 생성한 후, 이들 모두는 3LRH와 성공적으로 상호작용하여 안정적인 복합체를 형성함을 보였다(실시예 3 참조).In another example of the present invention, after generating an epitope for 3LRH antibody on Protein A at three different positions of the alpha helix, all of them successfully interacted with 3LRH to form a stable complex (Example 3 Reference).

본 발명의 또 다른 실시예에서는, 칼모듈린에 3LRH 항체에 대한 에피토프를 생성하였고, 칼모듈린-3LRH 복합체는 기능적, 구조적 완전성이 저해되지 않음을 확인하였다(실시예 4 참조).In another embodiment of the present invention, an epitope for the 3LRH antibody was generated on calmodulin, and it was confirmed that the calmodulin-3LRH complex did not inhibit functional and structural integrity (see Example 4).

본 발명의 또 다른 실시예에서는, T4 라이소자임의 내부 알파나선에 3LRH 에피토프를 생성하고, 여기에 3LRH 항체가 성공적으로 결합할 수 있음을 보였다(실시예 5 참조).In another example of the present invention, it was shown that a 3LRH epitope was generated on the internal alpha helix of T4 lysozyme, and a 3LRH antibody could be successfully bound thereto (see Example 5).

본 발명의 또 다른 실시예에서는, 단백질 A에 1P4B 항체에 대한 에피토프를 생성하여, 단백질 A 및 1P4B의 scFv 단편이 안정적인 복합체를 형성함을 확인하였다(실시예 6 참조).In another embodiment of the present invention, an epitope for the 1P4B antibody was generated in Protein A, and it was confirmed that the scFv fragments of Protein A and 1P4B form a stable complex (see Example 6).

본 발명의 또 다른 실시예에서는, 구조가 밝혀지지 않은 인간 ABCB6 수송체 단백질에 1P4B 항체에 대한 에피토프를 생성하고, ABCB6-1P4B Fab 복합체의 결정 구조를 전자현미경으로 확인하였다(실시예 7 참조).In another embodiment of the present invention, an epitope for 1P4B antibody was generated on a human ABCB6 transporter protein whose structure is unknown, and the crystal structure of the ABCB6-1P4B Fab complex was confirmed with an electron microscope (see Example 7).

본 발명의 또 다른 실시예에서는, 예쁜꼬마선충의 P-gp에 1P4B 및 3LRH 항체에 대한 에피토프를 생성하고, 이들 항체가 P-gp와 강력하게 상호작용함을 확인하였으며, 항체의 결합에 의해 ABC 수송체의 ATP 가수분해 활성이 억제됨을 확인함으로써, 항나선 항체를 이용하면 단백질의 특정 형태(conformation)를 안정화시킬 수 있음을 확인하였다(실시예 8 참조).In another embodiment of the present invention, epitopes for 1P4B and 3LRH antibodies were generated in P-gp of P. nematode, and it was confirmed that these antibodies strongly interact with P-gp, and by binding of antibodies, ABC By confirming that the ATP hydrolytic activity of the transporter was inhibited, it was confirmed that the use of an anti-helix antibody can stabilize a specific conformation of the protein (see Example 8).

상기 실시예들을 통해 다양한 대상 단백질의 알파나선에 이미 알려져 있는 항나선 항체의 에피토프를 도입함으로써 대상 단백질과 항체 사이의 상호작용을 유도할 수 있고, 이는 대상 단백질의 구조를 규명하는 데 이용될 수 있다.Through the above embodiments, the interaction between the target protein and the antibody can be induced by introducing an epitope of an anti-helix antibody, which is already known, into the alpha helix of various target proteins, which can be used to elucidate the structure of the target protein. .

따라서, 본 발명에 따른 단백질 구조 규명 방법을 이용하면, 그 크기가 너무 작거나 결정화가 어려워 종래의 방법으로는 그 구조를 파악할 수 없었던 단백질을 빠르고 효율적으로 구조 규명이 가능하다.Therefore, if the protein structure identification method according to the present invention is used, it is possible to quickly and efficiently determine the structure of a protein whose size is too small or crystallization is difficult, so that the structure cannot be determined by the conventional method.

본 발명에 따른 대상 단백질의 구조 규명 방법은, 기존에 잘 알려져 있는 항나선 항체에 대한 에피토프 아미노산 서열을 대상 단백질의 알파나선에 생성하는 단계를 포함하며, 이때 상기 에피토프의 아미노산 서열은 항나선 항체와 상호작용하는 핵심 아미노산을 포함하면서도, 대상 단백질의 소수성 코어 아미노산은 보존하여 대상 단백질의 구조가 변형되지 않도록 하며, 항나선 항체와 대상 단백질의 상호작용 시 입체충돌이 유발되지 않는 특징을 가지므로, 이를 통해 대상 단백질의 구조를 효율적이고 정확하게 규명할 수 있다.The method for determining the structure of a target protein according to the present invention includes the step of generating an amino acid sequence of an epitope for an anti-helix antibody, which is well known in the past, in the alpha helix of the target protein, wherein the amino acid sequence of the epitope is an anti-helical antibody and While including the interacting core amino acids, the hydrophobic core amino acids of the target protein are preserved so that the structure of the target protein is not modified, and when the anti-helix antibody and the target protein interact, steric collision does not occur. Through this, the structure of the target protein can be efficiently and accurately identified.

특히, 본 발명에 따른 대상 단백질의 구조 규명 방법을 이용하면, 분자량 50kDa 이하의 작은 단백질도 전자현미경을 통한 구조의 규명이 가능해 진다.In particular, by using the method for determining the structure of a target protein according to the present invention, even a small protein having a molecular weight of 50 kDa or less can be identified through an electron microscope.

본 명세서에서 사용되는 용어 "에피토프(epitope)"는 특정 항체에 의해 인식될 수 있는 항원의 한 부분으로서, 본 발명의 에피토프 보다 크거나, 본 발명의 에피토프를 포함하는 단리 또는 정제된 단백질 또는 펩타이드 분자 또한 본 발명의 범위에 포함된다.As used herein, the term "epitope" is a portion of an antigen that can be recognized by a specific antibody, and an isolated or purified protein or peptide molecule that is larger than the epitope of the present invention or contains the epitope of the present invention. It is also included in the scope of the present invention.

본 명세서에서 사용되는 용어 "조작", "변경", 또는 "돌연변이"는 본 명세서에서 언급하고 있는 단백질, 펩타이드 또는 그들의 일부분에 해당하는 아미노산 서열을 인위적으로 치환, 삽입, 삭제, 또는 둘 이상의 아미노산 서열을 연결하는 등의 행위 내지 그 결과물을 의미하는 것으로서, 상호 교환적으로 사용되었다. 또한, 에피토프와 관련하여 사용된 용어, "이식", "생성"은 대상 단백질의 특정 부분에 항나선 항체가 결합할 수 있는 에피토프 서열의 일부 또는 전부가 포함될 수 있도록 하기 위해 하나 이상의 아미노산 서열을 치환, 삭제 내지 부가하는 모든 행위를 의미한다.As used herein, the terms "manipulation", "modification", or "mutation" are artificially substituted, inserted, deleted, or two or more amino acid sequences corresponding to a protein, a peptide or a portion thereof referred to herein. It is used interchangeably as meaning an action or a result of linking. In addition, the terms used in connection with an epitope, "transplantation" and "production", are substituted for one or more amino acid sequences so that part or all of the epitope sequence to which the anti-helical antibody can bind to a specific portion of the target protein may be included. , Means all actions that are deleted or added.

본 명세서에서 사용되는 용어 "대상 단백질"은, 본 발명에 따른 방법으로 그 구조를 규명하고자 하는 단백질을 의미하는 것으로서, 상기 단백질의 구조가 이미 알려져 있는지 여부는 불문하며, 3차 구조에 알파나선 구조를 포함하고 있는 것이라면 단백질의 종류에는 제한이 없다.The term "target protein" as used herein refers to a protein whose structure is to be elucidated by the method according to the present invention, regardless of whether the structure of the protein is already known, and an alpha helical structure in the tertiary structure There is no limit to the type of protein as long as it contains.

본 발명의 일 구현예에 따르면, 상기 "핵심 아미노산"이란, 아미노산을 구성하는 전체 원자 표면적의 30% 이상이 상기 항나선 항체와 접촉하고 있는 아미노산을 의미한다.According to one embodiment of the present invention, the "core amino acid" refers to an amino acid in which 30% or more of the total atomic surface area constituting the amino acid is in contact with the anti-helical antibody.

본 발명의 다른 구현예에 따르면, 상기 "소수성 코어 아미노산"이란, 아미노산을 구성하는 전체 원자 표면적의 70% 이상이 상기 대상 단백질 내의 다른 원자와 접촉하고 있는 아미노산을 의미한다.According to another embodiment of the present invention, the "hydrophobic core amino acid" refers to an amino acid in which 70% or more of the total atomic surface area constituting the amino acid is in contact with other atoms in the target protein.

본 발명의 또 다른 구현예에 따르면, 상기 "입체충돌"은 항나선 항체와 대상 단백질의 백본(backbone) 원자 사이의 거리가 3.5 옹스트롬(Å) 이내로 되어 반발력이 생기는 것을 의미하며, 이러한 반발력은 항나선 항체와 대상 단백질의 상호작용을 방해하는 요소로서 작용한다. 여기서, 상기 백본 원자는 대상 단백질을 이루고 있는 아미노산의 알파(alpha) 탄소, 카복실기(carboxyl group) 또는 아미노기(amino group) 원자 등이 해당될 수 있다.According to another embodiment of the present invention, the "stereoscopic collision" means that the distance between the anti-helix antibody and the backbone atom of the target protein is within 3.5 angstroms (Å), thereby generating a repulsive force, and such a repulsive force is anti It acts as an element that interferes with the interaction between the helix antibody and the protein of interest. Here, the backbone atom may correspond to an alpha carbon, a carboxyl group, or an amino group atom of an amino acid constituting the target protein.

본 발명은 또한, 항나선 항체에 대한 에피토프를 대상 단백질의 알파나선에 생성하는 단계 이후에, 추가적으로 하기의 단계 중 하나 이상의 단계를 더 포함할 수 있다: 에피토프가 생성된 상기 대상 단백질에 항나선 항체를 결합시켜 복합체를 형성시키는 단계; 또는 상기 복합체를 결정화하는 단계; 또는 결정화된 상기 복합체의 구조를 분석하는 단계.The present invention may further include, after the step of generating an epitope for an anti-helix antibody in the alpha helix of the target protein, additionally, one or more of the following steps: Anti-helical antibody to the protein of interest in which the epitope has been generated. Combining to form a complex; Or crystallizing the complex; Or analyzing the structure of the crystallized complex.

본 발명의 일 구현예에 따르면, 상기 에피토프는 상기 대상 단백질의 C-말단 알파나선, N-말단 알파나선, 또는 내부 알파나선 중 어느 한 곳 이상에 생성될 수 있으며, 에피토프의 위치는 알파나선의 구조 또는 아미노산 서열에 따라 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 적절하게 선택할 수 있다.According to one embodiment of the present invention, the epitope may be generated at any one or more of the C-terminal alpha helix, the N-terminal alpha helix, or the internal alpha helix of the target protein, and the location of the epitope is of the alpha helix. According to the structure or amino acid sequence, a person of ordinary skill in the art may appropriately select it.

본 발명의 다른 구현예에 따르면, 상기 에피토프 서열의 생성은 합성 올리고뉴클레오타이드(oligonucleotides)를 이용한 PCR(polymerase chain reaction), OE(overlap extension)-PCR, 또는 상기 에피토프 서열을 포함하는 대상 단백질의 유전자 일부 또는 전부를 합성하는 것으로 달성될 수 있으나, 이에 제한되는 것은 아니다.According to another embodiment of the present invention, the generation of the epitope sequence is a polymerase chain reaction (PCR), overlap extension (OE)-PCR using synthetic oligonucleotides, or a part of a gene of a target protein including the epitope sequence. Or may be achieved by synthesizing all, but is not limited thereto.

본 발명의 또 다른 구현예에 따르면, 상기 항나선 항체는 서열번호 12, 서열번호 13, 서열번호 14, 서열번호 15, 서열번호 16, 및 서열번호 17로 이루어진 군으로부터 선택된 어느 하나 이상의 서열번호로 표시되는 아미노산 서열을 포함할 수 있으나, 알파나선에 특이적으로 결합할 수 있는 항체라면 상기 열거한 아미노산 서열에 제한되는 것은 아니며, 바람직하게는 상기 항나선 항체는 서열번호 12; 서열번호 13; 서열번호 14; 서열번호 15; 또는 서열번호 16 및 서열번호 17로 표시되는 아미노산 서열 중 어느 하나를 포함할 수 있다.According to another embodiment of the present invention, the anti-helical antibody is selected from the group consisting of SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, and SEQ ID NO: 17 It may include the amino acid sequence shown, but if an antibody capable of specifically binding to an alpha helix is not limited to the amino acid sequence listed above, preferably, the anti-helix antibody is SEQ ID NO: 12; SEQ ID NO: 13; SEQ ID NO: 14; SEQ ID NO: 15; Or it may include any one of the amino acid sequence represented by SEQ ID NO: 16 and SEQ ID NO: 17.

본 발명에서 사용한 3MNZ 항체는 HIV(human immunodeficiency virus)의 gp41 펩타이드에 의해 생성되는 수많은 항체 중 하나이다. 본 명세서에서는 혼란을 피하기 위해 단백질 데이터 뱅크(PBD) ID 코드를 사용하여 상기 3MNZ 항체를 지정하였다(표 4 참조). Gp41은 HIV 외피 단백질의 서브유닛으로서, 6개의 알파나선을 포함하는 동종 삼합체(homotrimeric complex)를 형성한다. 상기 3MNZ 항체는, 바람직하게는 서열번호 12의 아미노산 서열을 포함하고, 가장 바람직하게는 서열번호 12로 표시되는 아미노산 서열로 이루어지나, 서열번호 12의 아미노산 서열과 80% 이상, 더욱 바람직하게는 90% 이상, 더더욱 바람직하게는 95% 이상의 서열 상동성을 가지는 아미노산 서열을 포함할 수 있다. 예를 들면, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%의 서열 상동성을 갖는 항체를 포함한다. 아미노산 서열에 대한 "서열 상동성의 %"는 두 개의 최적으로 배열된 서열과 비교 영역을 비교함으로써 확인되며, 비교 영역에서의 아미노산 서열의 일부는 두 서열의 최적 배열에 대한 참고 서열(추가 또는 삭제를 포함하지 않음)에 비해 추가 또는 삭제(즉, 갭)를 포함할 수 있다.The 3MNZ antibody used in the present invention is one of numerous antibodies produced by the gp41 peptide of HIV (human immunodeficiency virus). In this specification, to avoid confusion, the 3MNZ antibody was designated using the Protein Data Bank (PBD) ID code (see Table 4). Gp41 is a subunit of the HIV envelope protein, forming a homotrimeric complex containing six alpha helices. The 3MNZ antibody preferably comprises the amino acid sequence of SEQ ID NO: 12, and most preferably consists of the amino acid sequence represented by SEQ ID NO: 12, but is 80% or more of the amino acid sequence of SEQ ID NO: 12, more preferably 90 It may comprise an amino acid sequence having a sequence homology of% or more, even more preferably 95% or more. For example, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85 %, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100% sequence homology Includes antibodies having. The "% of sequence homology" for an amino acid sequence is identified by comparing two optimally aligned sequences with a comparison region, and a portion of the amino acid sequence in the comparison region is a reference sequence (addition or deletion) for the optimal alignment of the two sequences. It may include additions or deletions (i.e., gaps) compared to not including).

3LRH 인트라바디(intrabody)는 항나선(antihelix) 항체의 다른 예로서, 세포 내에서 작용하여 세포 내 단백질에 결합하는 항체 또는 항체의 단편이다. 3LRH 인트라바디는 인간 헌팅틴 단백질로부터 유래된 14개 아미노산의 알파나선 구간에 결합하는 면역 글로불린 경쇄의 조작된 가변 도메인 단편이다. 항원성 펩타이드의 결합 부위는 통상적으로 중쇄 가변 도메인과 상호작용하는 베타병풍(beta sheet)에 의해 형성된 오목한 표면에 위치한다. 펩타이드 항원이 3LRH 인트라바디에 결합할 때, 거의 이상적인 알파나선 구조를 사용한다. 상기 3LRH 항체는, 바람직하게는 서열번호 13 또는 서열번호 14의 아미노산 서열을 포함하고, 가장 바람직하게는 서열번호 13 또는 서열번호 14로 표시되는 아미노산 서열로 이루어지나, 서열번호 13 또는 서열번호 14의 아미노산 서열과 80% 이상, 더욱 바람직하게는 90% 이상, 더더욱 바람직하게는 95% 이상의 서열 상동성을 가지는 아미노산 서열을 포함할 수 있다.The 3LRH intrabody is another example of an antihelix antibody, which is an antibody or fragment of an antibody that acts within a cell and binds to an intracellular protein. The 3LRH intrabody is an engineered variable domain fragment of an immunoglobulin light chain that binds to the 14 amino acid alpha helix section derived from human huntingtin protein. The binding site of the antigenic peptide is usually located on the concave surface formed by the beta sheet interacting with the heavy chain variable domain. When the peptide antigen binds to the 3LRH intrabody, it uses an almost ideal alpha helix structure. The 3LRH antibody preferably comprises the amino acid sequence of SEQ ID NO: 13 or SEQ ID NO: 14, and most preferably consists of an amino acid sequence represented by SEQ ID NO: 13 or SEQ ID NO: 14, but SEQ ID NO: 13 or SEQ ID NO: 14 It may include an amino acid sequence having at least 80%, more preferably at least 90%, even more preferably at least 95% of sequence homology with the amino acid sequence.

1P4B 항체는 다른 아미노산 서열을 갖는 나선형 에피토프(epitope)를 인식한다. 이는 초기 GCN4 펩타이드에 대한 리보솜 디스플레이 스크리닝에 의해 생성되고 선택되었다. 상기 항체는 거의 이상적인 알파나선 구조를 갖는 12-잔기 GCN4에 결합한다. 상기 1P4B 항체는, 바람직하게는 서열번호 15, 또는 서열번호 16, 또는 서열번호 17 중 어느 하나 이상의 아미노산 서열을 포함하고, 가장 바람직하게는 서열번호 15, 또는 서열번호 16, 또는 서열번호 17로 표시되는 아미노산 서열로 이루어지나, 서열번호 15, 또는 서열번호 16, 또는 서열번호 17의 아미노산 서열과 80% 이상, 더욱 바람직하게는 90% 이상, 더더욱 바람직하게는 95% 이상의 서열 상동성을 가지는 아미노산 서열을 포함할 수 있다.The 1P4B antibody recognizes helical epitopes with different amino acid sequences. It was generated and selected by ribosome display screening for the initial GCN4 peptide. The antibody binds to the 12-residue GCN4, which has an almost ideal alpha helix structure. The 1P4B antibody preferably comprises any one or more amino acid sequences of SEQ ID NO: 15, or SEQ ID NO: 16, or SEQ ID NO: 17, and most preferably is represented by SEQ ID NO: 15, or SEQ ID NO: 16, or SEQ ID NO: 17. An amino acid sequence consisting of an amino acid sequence, but having sequence homology of at least 80%, more preferably at least 90%, and even more preferably at least 95% with the amino acid sequence of SEQ ID NO: 15, or SEQ ID NO: 16, or SEQ ID NO: 17 It may include.

또한, 본 발명은 항나선(antihelix) 항체에 대한 에피토프(epitope)를 대상 단백질의 알파나선(alpha helix)에 생성하는 단계; 및 에피토프가 생성된 상기 대상 단백질에 항나선 항체를 결합시켜 복합체를 형성시키는 단계를 포함하고, 상기 에피토프의 아미노산 서열은 하기 (a) 내지 (c)의 조건 중 어느 하나 이상을 만족하는 것을 특징으로 하는, 대상 단백질의 형태(conformation) 안정화 방법을 제공할 수 있다:In addition, the present invention comprises the steps of generating an epitope for an antihelix antibody in an alpha helix of a target protein; And forming a complex by binding an anti-helical antibody to the protein of interest in which the epitope is generated, wherein the amino acid sequence of the epitope satisfies any one or more of the following conditions (a) to (c). It is possible to provide a method for stabilizing the conformation of the target protein:

(a) 상기 항나선 항체와 상호작용하는 핵심 아미노산을 포함함;(a) contains key amino acids that interact with the anti-helix antibody;

(b) 상기 대상 단백질의 소수성 코어(core) 아미노산을 포함함; 또는(b) containing a hydrophobic core amino acid of the protein of interest; or

(c) 상기 항나선 항체와 상기 대상 단백질의 상호작용 시 입체충돌(steric collision)이 유발되지 아니함.(c) When the anti-helix antibody interacts with the target protein, stereoscopic collision is not caused.

또한, 본 발명은 서열번호 1, 서열번호 2, 서열번호 3, 서열번호 4, 서열번호 5, 및 서열번호 8로 이루어진 군으로부터 선택된 어느 하나의 서열번호로 표시되는 아미노산 서열을 포함하는 조작된 단백질 A(protein A)을 제공하거나, 상기 조작된 단백질 A에 항나선 항체가 결합된 복합체를 제공할 수 있다. 여기서 "포함하는"의 의미는, 네이티브(native) 단백질 A의 전체 아미노산 서열의 일부로서, 네이티브 단백질 A의 알파나선 구조 상에 에피토프가 생성되도록 조작된 단백질 A의 아미노산 서열이 존재할 수 있다는 의미이다.In addition, the present invention is an engineered protein comprising an amino acid sequence represented by any one sequence number selected from the group consisting of SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, and SEQ ID NO: 8. A (protein A) may be provided, or a complex in which an anti-helix antibody is bound to the engineered protein A may be provided. Here, the meaning of “comprising” means that as part of the entire amino acid sequence of native protein A, the amino acid sequence of protein A engineered to generate an epitope on the alpha helical structure of native protein A may exist.

또한, 본 발명은 서열번호 6으로 표시되는 아미노산 서열을 포함하는 조작된 칼모듈린(calmodulin)을 제공하거나, 상기 조작된 칼모듈린에 항나선 항체가 결합된 복합체를 제공할 수 있다. 여기서 "포함하는"의 의미는, 네이티브 칼모듈린의 전체 아미노산 서열의 일부로서, 네이티브 칼모듈린의 알파나선 구조 상에 에피토프가 생성되도록 조작된 칼모듈린의 아미노산 서열이 존재할 수 있다는 의미이다.In addition, the present invention may provide an engineered calmodulin comprising the amino acid sequence represented by SEQ ID NO: 6, or a complex in which an anti-helix antibody is bound to the engineered calmodulin. Here, the meaning of "comprising" means that as part of the total amino acid sequence of native calmodulin, an amino acid sequence of calmodulin engineered to generate an epitope on the alpha helix structure of native calmodulin may exist.

또한, 본 발명은 서열번호 7로 표시되는 아미노산 서열을 포함하는 조작된 T4 라이소자임(lysozyme)을 제공하거나, 상기 조작된 T4 라이소자임에 항나선 항체가 결합된 복합체를 제공할 수 있다. 여기서 "포함하는"의 의미는, 네이티브 T4 라이소자임의 전체 아미노산 서열의 일부로서, 네이티브 T4 라이소자임의 알파나선 구조 상에 에피토프가 생성되도록 조작된 T4 라이소자임의 아미노산 서열이 존재할 수 있다는 의미이다.In addition, the present invention may provide an engineered T4 lysozyme comprising the amino acid sequence represented by SEQ ID NO: 7 or a complex in which an anti-helix antibody is bound to the engineered T4 lysozyme. Here, the meaning of “comprising” means that as part of the entire amino acid sequence of the native T4 lysozyme, the amino acid sequence of the T4 lysozyme engineered to generate an epitope on the alpha helical structure of the native T4 lysozyme may exist.

또한, 본 발명은 서열번호 9 또는 서열번호 10으로 표시되는 아미노산 서열을 포함하는 조작된 P-gp(glycoprotein)를 제공하거나, 상기 조작된 P-gp에 항나선 항체가 결합된 복합체를 제공할 수 있다. 여기서 "포함하는"의 의미는, 네이티브 P-gp의 전체 아미노산 서열의 일부로서, 네이티브 P-gp의 알파나선 구조 상에 에피토프가 생성되도록 조작된 P-gp의 아미노산 서열이 존재할 수 있다는 의미이다.In addition, the present invention can provide an engineered P-gp (glycoprotein) comprising an amino acid sequence represented by SEQ ID NO: 9 or SEQ ID NO: 10, or provide a complex in which an anti-helical antibody is bound to the engineered P-gp. have. Here, the meaning of "comprising" means that as part of the entire amino acid sequence of native P-gp, the amino acid sequence of P-gp engineered to generate an epitope on the alpha helical structure of native P-gp may exist.

또한, 본 발명은 서열번호 11로 표시되는 아미노산 서열을 포함하는 조작된 ABCB6(ATP-binding cassette sub-family B member 6, mitochondrial) 수송체(transporter)를 제공하거나, 상기 조작된 ABCB6 수송체에 항나선 항체가 결합된 복합체를 제공할 수 있다. 여기서 "포함하는"의 의미는, 네이티브 ABCB6 수송체의 전체 아미노산 서열의 일부로서, 네이티브 ABCB6 수송체의 알파나선 구조 상에 에피토프가 생성되도록 조작된 ABCB6 수송체의 아미노산 서열이 존재할 수 있다는 의미이다.In addition, the present invention provides an engineered ABCB6 (ATP-binding cassette sub-family B member 6, mitochondrial) transporter comprising the amino acid sequence represented by SEQ ID NO: 11, or against the engineered ABCB6 transporter. A complex to which a helical antibody is bound can be provided. Here, the meaning of “comprising” means that as part of the entire amino acid sequence of the native ABCB6 transporter, the amino acid sequence of the ABCB6 transporter engineered to generate an epitope on the alpha helical structure of the native ABCB6 transporter may exist.

또한, 본 발명은 상기 조작된 단백질 A, 또는 이에 항나선 항체가 결합된 복합체의 단백질 A 구조 규명 용도를 제공할 수 있다.In addition, the present invention can provide the use of the engineered protein A or the protein A structure of the complex to which the anti-helix antibody is bound thereto.

또한, 본 발명은 상기 조작된 칼모듈린, 또는 이에 항나선 항체가 결합된 복합체의 칼모듈린 구조 규명 용도를 제공할 수 있다.In addition, the present invention may provide a use of the engineered calmodulin or a complex to which an anti-helical antibody is bound thereto to determine the structure of calmodulin.

또한, 본 발명은 상기 조작된 T4 라이소자임, 또는 이에 항나선 항체가 결합된 복합체의 T4 라이소자임 구조 규명 용도를 제공할 수 있다.In addition, the present invention can provide a use of the engineered T4 lysozyme, or a complex to which an anti-helical antibody is bound thereto, to determine the structure of T4 lysozyme.

또한, 본 발명은 상기 조작된 P-gp, 또는 이에 항나선 항체가 결합된 복합체의 P-gp 구조 규명 용도를 제공할 수 있다.In addition, the present invention can provide the use of the engineered P-gp, or a complex to which an anti-helical antibody is bound thereto, to determine the P-gp structure.

또한, 본 발명은 상기 조작된 ABCB6 수송체, 또는 이에 항나선 항체가 결합된 복합체의 ABCB6 수송체 구조 규명 용도를 제공할 수 있다.In addition, the present invention can provide the use of the above-engineered ABCB6 transporter or a complex to which an anti-helical antibody is bound thereto to determine the structure of the ABCB6 transporter.

본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니 되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다.The terms or words used in the present specification and claims should not be construed as being limited to their usual or dictionary meanings, and the inventor may appropriately define the concept of terms in order to describe his own invention in the best way. It should be interpreted as a meaning and concept consistent with the technical idea of the present invention based on the principle that there is.

이하, 본 발명의 이해를 돕기 위하여 바람직한 실시예를 제시한다. 그러나 하기의 실시예는 본 발명을 보다 쉽게 이해하기 위하여 제공되는 것일 뿐, 하기 실시예에 의해 본 발명의 내용이 한정되는 것은 아니다.Hereinafter, a preferred embodiment is presented to aid the understanding of the present invention. However, the following examples are provided for easier understanding of the present invention, and the contents of the present invention are not limited by the following examples.

[실시예][Example]

실시예 1: 실험 재료 및 방법Example 1: Experimental Materials and Methods

1.1. 항체의 제조1.1. Production of antibodies

하기 실시예에서 사용된 항체 도메인 유전자는 PDB 단백질 데이터 뱅크에 기탁된 서열에 기초하여 합성되었다(하기 표 1).The antibody domain genes used in the following examples were synthesized based on the sequences deposited in the PDB protein data bank (Table 1 below).

Figure 112019103004585-pat00001
Figure 112019103004585-pat00001

돌연변이는 OE-PCR(overlap extension polymerase chain reaction)을 이용하여 도입하였다. 3LRH 인트라바디(intrabody) 유전자는 pET28a 벡터에 클로닝하였다. 단백질 생산을 위해, 단백질 발현 플라스미드를 대장균(E. coli) 균주 BL21(DE3)에 형질전환(transformation)시키고, 형질전환된 세포를 카나마이신 50 μg/ml가 첨가된 LB(Lysogeny broth) 배지로 37℃에서 배양하였다. OD 600이 0.7에 도달하였을 때, 0.5 mM IPTG(Isopropyl β-d-1-thiogalactopyranoside)를 첨가하여 단백질 생성을 유도하고 21℃에서 밤새 배양하였다. 수확된 세포 펠릿을 20 mM Tris(pH 8.0), 200 mM NaCl 및 0.5 mM PMSF(phenylmethylsulfonyl fluoride)가 포함된 용해 버퍼(lysis buffer)에 재현탁하고, 미세유동화기(microfluidizer)로 균질화하였다(microfluidics; 미세유체). 세포의 잔해물은 원심분리하여 제거하고, 상층액을 Ni-NTA(nickel-nitrilotriacetic acid) 금속 친화성 컬럼에 로딩하였다. 6×히스티딘-태그가 부착된 단백질을 20 mM Tris(pH 8.0), 200 mM NaCl 및 500 mM 이미다졸(pH 8.0)을 포함하는 버퍼로 용리하였다.Mutations were introduced using OE-PCR (overlap extension polymerase chain reaction). The 3LRH intrabody gene was cloned into the pET28a vector. For protein production, the protein expression plasmid was transformed into E. coli strain BL21 (DE3), and the transformed cells were transformed into LB (Lysogeny broth) medium supplemented with 50 μg/ml kanamycin at 37° C. Cultured in. When the OD 600 reached 0.7, 0.5 mM IPTG (Isopropyl β-d-1-thiogalactopyranoside) was added to induce protein production, followed by incubation at 21° C. overnight. The harvested cell pellet was resuspended in a lysis buffer containing 20 mM Tris (pH 8.0), 200 mM NaCl, and 0.5 mM phenylmethylsulfonyl fluoride (PMSF), and homogenized with a microfluidizer (microfluidics; Microfluidic). Cell debris was removed by centrifugation, and the supernatant was loaded on a Ni-NTA (nickel-nitrilotriacetic acid) metal affinity column. The 6×histidine-tagged protein was eluted with a buffer containing 20 mM Tris (pH 8.0), 200 mM NaCl, and 500 mM imidazole (pH 8.0).

3MNZ scFv(single-chain variable fragment; 단일-사슬 가변 단편) 유전자는 pAcGP67A 배큘로바이러스(baculovirus) 전달 벡터에 클로닝하였다(BD Biosciences, 미국). 재조합 바이러스는 제조사가 제공한 프로토콜에 따라 생성하였다. 3MNZ scFv 단백질은 SF900 배지(Invitrogen, 미국)에서 생장한 High Five(BTI-Tn-5B1-4) 곤충 세포(Invitrogen, 미국)에서 발현되었다. 재조합 배큘로바이러스에 의해 감염된 세포는 28℃에서 3 일 동안 배양하였다. 배지에 분비된 6×히스티딘이 부착된 3MNZ scFv를 Ni-NTA 친화 크로마토그래피(GE Healthcare, 미국)를 이용하여 정제하였다. 1P4B scFv 유전자는 파지미드(phagemid) 벡터에 클로닝한 후, 이에 의해 형질전환된 세포를 50 μg/ml의 암피실린이 첨가된 CRAP 배지에서 37℃로 배양하였다. OD 600이 0.7에 도달하였을 때, 0.5 mM IPTG를 첨가하여 단백질 생성을 유도하고 21℃에서 밤새 배양하였다. 수확된 세포를 용해시키고, 항체 단편 단백질을 Ni-NTA 친화 크로마토그래피로 정제하였다. 6×히스티딘-태그(tag)를 제거하기 위해, 용리된 항체 단편을 트롬빈(thrombin)과 함께 밤새 배양하였다. 절단된 항체 단편의 추가 정제를 위해, 샘플을 20 mM Tris(pH 8.0), 200 mM NaCl로 평형화된 Superdex 200 크기-배제(size-exclusion) 컬럼(GE Healthcare, 미국)에 주입하여 정제하였다.The 3MNZ scFv (single-chain variable fragment; single-chain variable fragment) gene was cloned into a pAcGP67A baculovirus transfer vector (BD Biosciences, USA). Recombinant virus was generated according to the protocol provided by the manufacturer. The 3MNZ scFv protein was expressed in High Five (BTI-Tn-5B1-4) insect cells (Invitrogen, USA) grown in SF900 medium (Invitrogen, USA). Cells infected with the recombinant baculovirus were cultured at 28° C. for 3 days. 3MNZ scFv with 6×histidine secreted in the medium was purified using Ni-NTA affinity chromatography (GE Healthcare, USA). The 1P4B scFv gene was cloned into a phagemid vector, and the transformed cells were cultured at 37° C. in CRAP medium to which 50 μg/ml of ampicillin was added. When the OD 600 reached 0.7, 0.5 mM IPTG was added to induce protein production and incubated overnight at 21°C. The harvested cells were lysed, and the antibody fragment protein was purified by Ni-NTA affinity chromatography. To remove the 6×histidine-tag, the eluted antibody fragment was incubated with thrombin overnight. For further purification of the cleaved antibody fragment, the sample was purified by injection into a Superdex 200 size-exclusion column (GE Healthcare, USA) equilibrated with 20 mM Tris (pH 8.0), 200 mM NaCl.

1.2. 조작된(engineered) 단백질의 제조 및 풀-다운(pull-down) 분석1.2. Preparation and pull-down analysis of engineered proteins

조작된 에피토프를 코딩하는 돌연변이 유전자는 합성 올리고뉴클레오타이드를 사용하는 PCR 또는 OE-PCR에 의한 돌연변이 유발에 의해 생성되었다(표 2, # 뒤의 4자리 숫자는 실험 편의상 임의로 붙인 번호이다).The mutant gene encoding the engineered epitope was generated by mutagenesis by PCR or OE-PCR using synthetic oligonucleotides (Table 2, the 4 digits after # are randomly assigned numbers for convenience of experimentation).

Figure 112019103004585-pat00002
Figure 112019103004585-pat00002

Figure 112019103004585-pat00003
Figure 112019103004585-pat00003

발현 벡터 pET28a에 유전자를 클로닝하고, 클로닝된 플라스미드를 대장균 균주 BL21(DE3)에 형질전환시킨 후, 형질전환된 세포를 카나마이신(kanamycin) 50 μg/ml가 첨가된 LB 배지에 37℃로 배양하였다. OD 600이 0.6에 도달하였을 때, 0.5 mM IPTG를 첨가하여 단백질 생성을 유도하고, 유도된 세포를 37℃에서 추가로 4시간 동안 배양하였다. 수확된 세포 펠릿을 20 mM Tris(pH 8.0), 200 mM NaCl, 0.5 mM PMSF를 포함하는 용해 버퍼에 재현탁시키고, 미세유동화기로 균질화하였다. 세포 잔해물은 원심분리로 제거하고, 상층액을 Ni-NTA 크로마토그래피 컬럼에 로딩하였다. 6×히스티딘이 부착된 단백질을 20 mM Tris(pH 8.0), 200 mM NaCl 및 500 mM 이미다졸(pH 8.0)을 포함한 버퍼로 용출시키고, PD-10 탈염 컬럼(GE Healthcare, 미국)을 사용하여 이미다졸을 제거하였다. 칼모듈린(calmodulin) 단편을 정제하기 위해, 정제에 사용된 모든 버퍼에 5 mM CaCl2를 첨가하였다.The gene was cloned into the expression vector pET28a, and the cloned plasmid was transformed into E. coli strain BL21 (DE3), and the transformed cells were cultured at 37°C in LB medium to which 50 μg/ml of kanamycin was added. When the OD 600 reached 0.6, 0.5 mM IPTG was added to induce protein production, and the induced cells were cultured at 37°C for an additional 4 hours. The harvested cell pellet was resuspended in lysis buffer containing 20 mM Tris (pH 8.0), 200 mM NaCl, 0.5 mM PMSF, and homogenized with a microfluidizer. Cell debris was removed by centrifugation, and the supernatant was loaded onto a Ni-NTA chromatography column. 6×Histidine-attached protein was eluted with a buffer containing 20 mM Tris (pH 8.0), 200 mM NaCl, and 500 mM imidazole (pH 8.0), and already using a PD-10 desalting column (GE Healthcare, USA). The dazole was removed. To purify the calmodulin fragment, 5 mM CaCl 2 was added to all buffers used for purification.

조작된 에피토프를 코딩하는 예쁜꼬마선충(C. elegans)의 P-gp(glycoprotein) 및 인간 ABCB6 작제물(construct)은 합성 올리고뉴클레오타이드를 사용한 OE-PCR에 의해 생성되었고, C-말단 eGFP 및 10×히스티딘 태그를 갖는 효모 발현 벡터 pPICZ-C로 복제하였다. 트롬빈 절단 부위는 단백질 서열과 태그 사이에 삽입하였다. 단백질은 기존에 알려진 방법을 약간 변형하여 제조하였다. 간단하게, 작제물은 피히아 파스토리스(Pichia pastoris) 균주 SMD1163 (Invitrogen, 미국)에 형질전환되었다. 세포를 28℃에서 100 μg/mL 제오신(zeocin)이 첨가된 MMY 최소 배지에서 성장시킨 후, 24시간 동안 1% 메탄올과 함께 인큐베이션함으로써 단백질 생성을 유도하였다. 수확한 세포 펠릿을 액화 질소에서 극저온분쇄(cryomilling; MM400, Retsch, 독일)로 동결 및 파쇄하고, 50 mM Tris(pH 8.0), 300 mM NaCl, 5 mM MgCl2, 10% 글리세롤, 4μg/mL DNAse 및 1mM PMSF를 포함하는 용해 버퍼에 재현탁시켰다. 막 단백질을 4℃에서 2시간 동안 2%(w/v) n-도데실-β-D-말토피라노시드(n-dodecyl-β-D-maltopyranoside; DDM; Anatrace, 미국)로 가용화시켰다. 불용성 세포 파편을 90,000g에서 50분 동안 원심분리하여 제거하고, 상층액을 Ni-NTA 크로마토그래피 또는 항-GFP DARPin이 콘쥬게이트된 컬럼에 로딩하였다. C-말단 eGFP 및 10×히스티딘 태그는 트롬빈 프로테아제를 이용한 컬럼 상 절단(on-column cleavage)에 의해 제거되었다. P-gp를 20 mM MES(pH 6.5), 200 mM NaCl, 5% 글리세롤 및 0.12%(w/v) n-운데실-β-D-말토피라노시드(n-undecyl-β-D-maltopyranoside; UDM; Anatrace, 미국)를 포함하는 버퍼로 용리시키고, ABCB6을 20 mM HEPES(pH 7.5), 200 mM NaCl, 0.06% 6-사이클로헥실-1-헥실-β-D-말토사이드(6-cyclohexyl-1-hexyl-β-D-maltoside; Cymal-6; Anatrace, 미국) 및 0.0018%(w/v) 콜레스테릴 헤미숙시네이트(cholesteryl hemmisuccinate)를 포함하는 완충액으로 용리시켰다. 용리된 단백질을 Amicon 초고속 원심분리필터(Millipore, 미국)로 농축하고 1 : 3의 몰비로 항나선 항체와 함께 얼음에서 최소 1시간 이상 이상 인큐베이션 하였다. 항나선 항체가 있거나 없는 단백질은 Superdex 200 겔 여과 크로마토그래피(GE Healthcare, 미국)에 의해 추가로 정제되었다. P-gp (glycoprotein) and human ABCB6 constructs of C. elegans encoding the engineered epitope were generated by OE-PCR using synthetic oligonucleotides, and C-terminal eGFP and 10× It was cloned into the yeast expression vector pPICZ-C with the histidine tag. The thrombin cleavage site was inserted between the protein sequence and the tag. Proteins were prepared by slightly modifying previously known methods. Briefly, the construct was transformed into Pichia pastoris strain SMD1163 (Invitrogen, USA). Cells were grown at 28° C. in MMY minimal medium to which 100 μg/mL zeocin was added, and then incubated with 1% methanol for 24 hours to induce protein production. The harvested cell pellet was frozen and crushed in liquid nitrogen by cryomilling (MM400, Retsch, Germany), 50 mM Tris (pH 8.0), 300 mM NaCl, 5 mM MgCl 2 , 10% glycerol, 4 μg/mL DNAse. And resuspended in a lysis buffer containing 1 mM PMSF. Membrane proteins were solubilized with 2% (w/v) n-dodecyl-β-D-maltopyranoside (DDM; Anatrace, USA) for 2 hours at 4°C. Insoluble cell debris was removed by centrifugation at 90,000 g for 50 minutes, and the supernatant was loaded onto a column conjugated with Ni-NTA chromatography or anti-GFP DARPin. The C-terminal eGFP and 10×histidine tags were removed by on-column cleavage using thrombin protease. P-gp in 20 mM MES (pH 6.5), 200 mM NaCl, 5% glycerol and 0.12% (w/v) n-undecyl-β-D-maltopyranoside (n-undecyl-β-D-maltopyranoside) ; UDM; Anatrace, U.S.) eluting with a buffer containing, and ABCB6 20 mM HEPES (pH 7.5), 200 mM NaCl, 0.06% 6-cyclohexyl-1-hexyl-β-D-maltoside (6-cyclohexyl It was eluted with a buffer containing -1-hexyl-β-D-maltoside; Cymal-6; Anatrace, USA) and 0.0018% (w/v) cholesteryl hemmisuccinate. The eluted protein was concentrated with an Amicon ultra-high-speed centrifugal filter (Millipore, USA) and incubated for at least 1 hour on ice with an anti-helix antibody at a molar ratio of 1:3. Proteins with or without anti-helical antibodies were further purified by Superdex 200 gel filtration chromatography (GE Healthcare, USA).

풀-다운 분석은, 조작된 에피토프를 갖는 eGFP 및 10×히스티딘이 부착된 P-gp를 Ni-NTA 수지 상에 고정시키고, 이를 정제된 항체와 함께 20 mM MES(pH 6.5), 200 mM NaCl, 5% 글리세롤 및 0.12%(w/v) UDM이 포함된 버퍼에서 4℃, 1시간 동안 부드럽게 교반한 후 광범위한 세척을 진행하였다. 결합 단백질을 4X Laemmli 샘플 버퍼에서 수지로부터 용리시키고, 15% SDS-PAGE를 이용하여 분석하였다.In the pull-down analysis, eGFP with the engineered epitope and P-gp to which 10×histidine was attached were immobilized on Ni-NTA resin, and this together with purified antibody 20 mM MES (pH 6.5), 200 mM NaCl, After gently stirring for 1 hour at 4° C. in a buffer containing 5% glycerol and 0.12% (w/v) UDM, extensive washing was performed. Binding proteins were eluted from the resin in 4X Laemmli sample buffer and analyzed using 15% SDS-PAGE.

1.3. 항체-조작 단백질 복합체(antibody-engineered protein complex)의 제조1.3. Preparation of antibody-engineered protein complex

3MNZ scFv-단백질 A #8420 복합체를 제조하기 위해, 정제된 항체 단편 및 조작된 단백질을 4℃에서 1시간 동안 1 : 1 몰비로 혼합하였다. 복합체 형성은 native-PAGE(Polyacrylamide gel electrophoresis)에 의해 관찰하였다. 다른 항체-단백질 복합체는 결합되지 않은 단백질 제거를 위해 Superdex 200 겔 여과 크로마토그래피(GE Healthcare, 미국)를 이용하여 혼합한 후 정제하였다. 항체-단백질 복합체는 결정화 전에 5 mg/mL로 농축하였다.To prepare the 3MNZ scFv-Protein A #8420 complex, the purified antibody fragment and the engineered protein were mixed at a molar ratio of 1:1 at 4° C. for 1 hour. Complex formation was observed by native-PAGE (Polyacrylamide gel electrophoresis). Other antibody-protein complexes were mixed and purified using Superdex 200 gel filtration chromatography (GE Healthcare, USA) to remove unbound protein. The antibody-protein complex was concentrated to 5 mg/mL before crystallization.

1.4. 결정화(crystallization) 및 데이터 수집1.4. Crystallization and data collection

항체-조작 단백질 복합체의 결정화 조건 및 결정의 동결 조건은 하기 표 3에 요약하였다. 모든 결정은 -170℃의 액체 질소에서 급속 냉동시켰다. 회절 데이터는 포항가속기연구소(대한민국)의 7A 및 5C 빔 라인에서 수집하였다. 수집된 회절 데이터는 HKL-2000 패키지(HKL Research, 미국)을 사용하여 색인화, 통합 및 스케일링 하였다.Crystallization conditions of the antibody-engineered protein complex and freezing conditions of the crystals are summarized in Table 3 below. All crystals were quick-frozen in liquid nitrogen at -170°C. Diffraction data was collected at the 7A and 5C beam lines of the Pohang Accelerator Research Institute (Korea). The collected diffraction data was indexed, integrated and scaled using the HKL-2000 package (HKL Research, USA).

항체 복합체Antibody complex 결정화 용액Crystallization solution 동결보호제Cryoprotectant 3MNZ-protein A #84203MNZ-protein A #8420 20% PEG MME 2000, 0.1 M MOPS pH 6.5, 21℃20% PEG MME 2000, 0.1 M MOPS pH 6.5, 21°C 20% ethylene glycol20% ethylene glycol 3LRH-protein A #81883LRH-protein A #8188 35% PEG 4000, 0.1 M MOPS pH 6.5, 4℃35% PEG 4000, 0.1 M MOPS pH 6.5, 4°C 30% glycerol30% glycerol 3LRH-protein A #81893LRH-protein A #8189 30% PEG 4000, 0.2 M MgCl2,
0.1 M MOPS pH 6.5, 21℃
30% PEG 4000, 0.2 M MgCl 2 ,
0.1 M MOPS pH 6.5, 21℃
30% ethylene glycol30% ethylene glycol
3LRH-protein A #84963LRH-protein A #8496 35% PEG 4000, 0.1 M MES pH 5.5, 21℃35% PEG 4000, 0.1 M MES pH 5.5, 21°C 10% ethylene glycol10% ethylene glycol 3LRHcys-protein A #8188cys 3LRH cys -protein A #8188 cys 45% PEG 4000, 0.1 M HEPES pH 7.5, 21℃45% PEG 4000, 0.1 M HEPES pH 7.5, 21°C 30% glycerol30% glycerol 3LRH-calmodulin #90113LRH-calmodulin #9011 50% PEG 400, 0.2 M CaCl2,
0.1 M HEPES pH 7.5, 21℃
50% PEG 400, 0.2 M CaCl 2 ,
0.1 M HEPES pH 7.5, 21℃
nonenone
3LRH-T4 lysozyme #92133LRH-T4 lysozyme #9213 4.8 M sodium formate,
0.1 M sodium acetate pH 4.5, 21℃
4.8 M sodium formate,
0.1 M sodium acetate pH 4.5, 21℃
30% glycerol30% glycerol
1P4B-protein A #90141P4B-protein A #9014 1.8 M NaK phosphate,
0.1 M HEPES pH 7.5, 21℃
1.8 M NaK phosphate,
0.1 M HEPES pH 7.5, 21℃
30% ethylene glycol30% ethylene glycol

1.5. 구조 결정, 정제 및 상동성 모델링(homology modeling)1.5. Structure determination, purification and homology modeling

초기 상(phase)은 PHASER 결정학 소프트웨어를 이용하여 분자치환법(molecular replacement)에 의해 계산하였다. 원자 모델은 COOT 및 PHENIX 프로그램을 사용하여 반복적인 모델링 및 개선을 통해 구축하였다. 결정학적 데이터는 하기 표 4에 나타내었다. 리소좀(lysosome) 표적화 세그먼트(잔기 1 내지 205)가 없는 인간 ABCB6의 상동성 모델은 노보스핑고비움 아로마티시보란스(Novosphingobium aromaticivorans) DSM 12444, NaAtm1의 Atm1-type ABC 수송체 구조에 기초하여 MODELER 프로그램(https://salilab.org/modeller)에 의해 생성되었다. 원자 좌표 및 회절 데이터는 PDB에 기탁하였다.The initial phase was calculated by molecular replacement using PHASER crystallography software. The atomic model was built through iterative modeling and refinement using the COOT and PHENIX programs. Crystallographic data are shown in Table 4 below. The homology model of human ABCB6 without lysosome targeting segment (residues 1 to 205) is based on the structure of the Atm1-type ABC transporter of Novosphingobium aromaticivorans DSM 12444, NaAtm1 ( https://salilab.org/modeller). Atomic coordinates and diffraction data were deposited with the PDB.

Figure 112019103004585-pat00004
Figure 112019103004585-pat00004

Figure 112019103004585-pat00005
Figure 112019103004585-pat00005

1.6. ATP 가수분해 활성 측정1.6. ATP hydrolytic activity measurement

항체의 존재 및 부재하에 조작된 P-gp의 ATP 가수 분해 활성을 조사하기 위해 ATP/NADH 결합 분석을 수행하였다. 계면활성제 내의 정제된 단백질 및 약물을 50 mM 칼륨, HEPES(pH 8.0), 10 mM MgCl2, 60 μg/ml 피루브산 인산화효소(pyruvate kinase), 32 μg/ml 젖산 탈수소효소(lactate dehydrogenase), 4 mM 포스포엔올피루브산(phosphoenolpyruvate), 0.3 mM NADH, 5 mM ATP 및 0.05% DDM이 포함된 버퍼에서 결합시키고, NADH의 감소율 모니터링하기 위해 25℃에서 3분 동안 5초 간격으로 340nm에서의 흡광도 변화를 측정하였다. 모든 측정은 동일한 단백질의 제조에 따라 3회 반복하였다.An ATP/NADH binding assay was performed to investigate the ATP hydrolytic activity of engineered P-gp in the presence and absence of antibodies. Purified proteins and drugs in surfactants were 50 mM potassium, HEPES (pH 8.0), 10 mM MgCl 2 , 60 μg/ml pyruvate kinase, 32 μg/ml lactate dehydrogenase, 4 mM Combined in a buffer containing phosphoenolpyruvate, 0.3 mM NADH, 5 mM ATP, and 0.05% DDM, and absorbance changes at 340 nm at 25° C. for 3 minutes at 5 seconds intervals to monitor the reduction rate of NADH. It was measured. All measurements were repeated three times according to the preparation of the same protein.

1.7. 전자현미경 데이터1.7. Electron microscope data

음성 전자현미경(electron microscopy, 이하 'EM'이라 함) 및 이미지 획득을 위한 샘플을 준비하기 위해서, 1P4B Fab이 있거나 없는 정제된 ABCB6를 얼음 상에서 1mM ATP (또는 AMPPNP) 및 1 mM MgCl2와 함께 1시간 동안 인큐베이션하였다. 이를 0.07 mg/mL로 희석하고, 새롭게 글로우-방전된(glow-discharged), 탄소로 코팅된 EM 그리드(grid)에 로딩한 후, 0.75%(w/v) 포름산우라닐(uranyl formate)로 염색하였다. 데이터는 120kV에서 작동하고 Ceta 16M (4k×4k) CMOS 카메라가 장착된 FEI Talos L120C(FEI, 네덜란드)로 수집하였다. 배율은 ×57,000, 픽셀 크기는 1.8Å 이었다.In order to prepare samples for negative electron microscopy (electron microscopy, hereinafter referred to as'EM') and image acquisition, purified ABCB6 with or without 1P4B Fab was mixed with 1 mM ATP (or AMPPNP) and 1 mM MgCl 2 on ice. Incubated for hours. This was diluted to 0.07 mg/mL, loaded on a newly glow-discharged, carbon-coated EM grid, and stained with 0.75% (w/v) uranyl formate. I did. Data was collected on a FEI Talos L120C (FEI, Netherlands) operating at 120kV and equipped with a Ceta 16M (4k×4k) CMOS camera. The magnification was ×57,000 and the pixel size was 1.8Å.

EM 데이터 처리 및 이미지 분석을 위해, Gctf 프로그램(v1.18)을 이용하여 CTF(Contrast transfer function) 파라미터를 추정하였다. 총 390개의 현미경 사진을 검사하여 약 150,000개의 입자를 식별하였고, 156 픽셀의 박스 사이즈(box size)로 추출하였다. 이들은 RELION-3.0을 사용하여 참조가 없는(reference-free) 2D 클래스 평균(class average)을 얻기 위해 사용되었다. ABC 수송체의 구조적 특징이 정의된 주요 2D 클래스는 cryoSPARC v2 GUI 인터페이스를 사용하여 초기 3D 모델을 생성하는데 이용되었다. 3D 구조의 개선 후, 기존에 결정되 황색포도상구균(Staphylococcus aureus) Sav1866의 구조를 UCSF 키메라를 사용하여 밀도 맵(density map)에 상에 위치시켰다.For EM data processing and image analysis, the CTF (Contrast transfer function) parameter was estimated using the Gctf program (v1.18). A total of 390 micrographs were examined to identify approximately 150,000 particles, and extracted with a box size of 156 pixels. These were used to obtain a reference-free 2D class average using RELION-3.0. The main 2D class, in which the structural features of the ABC transporter were defined, was used to create an initial 3D model using the cryoSPARC v2 GUI interface. After the improvement of the 3D structure, the previously determined structure of Staphylococcus aureus Sav1866 was placed on a density map using a UCSF chimera.

실시예 2: 단백질 A의 3MNZ 에피토프 생성 및 조작된 단백질 A-3MNZ scFv(single-chain variable fragment) 복합체 결정 구조의 규명Example 2: Generation of 3MNZ epitope of protein A and identification of crystal structure of engineered protein A-3MNZ single-chain variable fragment (scFv) complex

2.1. 단백질 A의 C-말단 알파나선에서 3MNZ 에피토프 생성2.1. Generation of 3MNZ epitope in the C-terminal alpha helix of protein A

3MNZ 항체는 14개의 아미노산 잔기 및 2개의 gp41 C-말단 아미노산을 갖는 알파나선형 펩타이드를 인식한다(도 1a에서 overlap 표시 부분). 펩타이드-항체 복합체의 코어 상호 작용은 소수성 아미노산 L61, W66 및 L69 및 친수성 아미노산 E62, D64, K65 및 S68로 구성된 나선의 한쪽 면에 의해 매개되며, 나선의 다른 쪽 면은 용매에 완전히 노출된다. C-말단 N71은 나선의 일부가 아니며, 항체의 중쇄와 수소 결합을 통해 강한 상호 작용을 한다.The 3MNZ antibody recognizes an alpha helical peptide having 14 amino acid residues and two gp41 C-terminal amino acids (indicated overlap in FIG. 1a). The core interaction of the peptide-antibody complex is mediated by one side of the helix consisting of the hydrophobic amino acids L61, W66 and L69 and the hydrophilic amino acids E62, D64, K65 and S68, and the other side of the helix is completely exposed to the solvent. The C-terminal N71 is not part of the helix and has a strong interaction with the heavy chain of the antibody through hydrogen bonding.

단백질 A의 B1 도메인은 3MNZ 에피토프를 생성하기 위한 실험 사례로 선택되었는데, 이는 3개의 알파나선으로 구성되고, 대장균(E. coli)에서 쉽게 생산되며, 다양한 조건에서 결정화될 수 있기 때문이다. 단백질 A 도메인을 조작하기 위해, 항체 및 단백질 A의 입체 충돌(steric collision)을 피하면서 3MNZ 항체의 Fab 단편에 결합된 gp41 펩타이드의 구조를 단백질 A의 C-말단 나선에 중첩(superimposed)시켰다(도 1b). gp41의 N56 부터 Q58 까지의 N-말단 아미노산 3개가 상기 항체와 상호 작용하지 않기 때문에, 해당 위치는 단백질 A의 아미노산 서열을 사용하였다(도 1a). 도킹된(docked) 구조에서는, 단백질 A의 G44, E45, K47-L49, E51, S52 및 A54 위치의 아미노산이 항체 결합에서 중요한 역할을 하며, 따라서 상기 아미노산은 gp41 아미노산 서열로 변경하였다(도 1c 에서 붉은색으로 표시). 단백질 A의 아미노산 V42, L43, A46 및 Q53은 단백질 A의 소수성 코어를 나타내기 때문에 변경되지 않았다. 단백질 A의 N50 위치는 결합에 중요하지 않다; 따라서 상기 위치에 호환되는 아스파라진(asparagine; Asn) 또는 알라닌(alanine; Ala) 중 알라닌이 선택되었다. 상기에 따라 생성된 #8420 단백질 A를 대장균에서 생산하고 균질하게 정제하였다. 단백질이 대장균에서 과발현될 수 있고, 서브틸리신(subtilisin) 분해에 큰 저항성을 갖고 있으며, 겔 여과 크로마토그래피(gel filtration chromatography)에서 단량체로 용리될 수 있기 때문에, 단백질 A는 구조적으로 무결성하다고 판단하였다. 조작된 단백질 A를 3MNZ 항체의 정제된 scFv와 혼합하고, 이에 따른 복합체의 구조를 X-선 결정학으로 규명하였다.The B1 domain of protein A was selected as an experimental case for generating the 3MNZ epitope, because it consists of three alpha helices, is easily produced in E. coli , and can be crystallized under various conditions. To manipulate the protein A domain, the structure of the gp41 peptide bound to the Fab fragment of the 3MNZ antibody was superimposed on the C-terminal helix of the protein A while avoiding the steric collision of the antibody and protein A (Fig. 1b). Since three N-terminal amino acids from N56 to Q58 of gp41 do not interact with the antibody, the amino acid sequence of protein A was used for the corresponding position (Fig. 1A). In the docked structure, amino acids at positions G44, E45, K47-L49, E51, S52 and A54 of protein A play an important role in antibody binding, and thus the amino acid was changed to the gp41 amino acid sequence (Fig. Marked in red). Amino acids V42, L43, A46 and Q53 of protein A were not altered because they represent the hydrophobic core of protein A. The N50 position of protein A is not critical for binding; Therefore, alanine was selected among asparagine (Asn) or alanine (Ala) compatible with the position. #8420 Protein A produced according to the above was produced in E. coli and homogeneously purified. Protein A was judged to be structurally integrity because the protein can be overexpressed in E. coli, has great resistance to subtilisin degradation, and can be eluted as a monomer in gel filtration chromatography. . The engineered protein A was mixed with the purified scFv of the 3MNZ antibody, and the structure of the resulting complex was elucidated by X-ray crystallography.

2.2. 조작된 단백질 A-3MNZ scFv 복합체 결정 구조2.2. Engineered protein A-3MNZ scFv complex crystal structure

조작된 단백질 A-3MNZ scFv 복합체의 결정 구조는 C-말단 나선의 변형이 실질적으로 단백질 A의 전체 구조에 변화를 일으키지 않았으며(도 1e 좌측 그림 참조), 야생형 및 조작된 단백질 A는 0.77Å의 Cα 근평균제곱편차(root mean square deviation) 값으로 겹쳐질 수 있었다(도 1d). 인공적으로 생성된 에피토프는 의도된 바와 같이 알파나선 구조를 취하였고, 항체와 상호작용하도록 조작된 아미노산은 3MNZ scFv에 결합된 gp41의 아미노산과 중첩될 수 있었다(도 1e 우측 그림 참조). 이러한 결정학적 관찰을 통해 본 발명자들은 3MNZ scFv의 에피토프가 단백질 A의 C-말단 나선에서 조작될 수 있음을 증명하였다.The crystal structure of the engineered protein A-3MNZ scFv complex showed that the modification of the C-terminal helix did not substantially change the overall structure of protein A (see Figure 1e left figure), and the wild-type and engineered protein A were of 0.77Å. Cα root mean square deviation (root mean square deviation) value could be overlapped (Fig. 1d). The artificially generated epitope took an alpha helical structure as intended, and the amino acid engineered to interact with the antibody could overlap with the amino acid of gp41 bound to 3MNZ scFv (see Figure 1e right figure). Through these crystallographic observations, the present inventors demonstrated that the epitope of 3MNZ scFv can be manipulated in the C-terminal helix of Protein A.

실시예 3: 단백질 A 도메인에서 3LRH 에피토프 조작Example 3: 3LRH epitope engineering in protein A domain

다른 항체가 항알파나선(anti-alpha helix) 항체로 사용될 수 있는지 확인하기 위해 3LRH 인트라바디(intrabody)를 선택했다. 상기 항체는 펩타이드-항체 상호 작용이 나선의 한쪽에 의해 매개되고 다른 쪽이 용매에 완전히 노출되기 때문에 선택되었다. 또한, 이는 대장균에서 생산하기 쉽고 알파나선 항원에 대한 친화력이 높다. 본 발명자들은 단백질 A의 3가지 다른 위치에서 3LRH의 에피토프를 만들고 3LRH와 그들의 복합체의 구조를 밝혔다(도 2a 내지 도 2h).A 3LRH intrabody was selected to see if other antibodies could be used as anti-alpha helix antibodies. The antibody was chosen because the peptide-antibody interaction was mediated by one side of the helix and the other side was completely exposed to the solvent. In addition, it is easy to produce in E. coli and has a high affinity for the alpha helix antigen. The present inventors have found that three kinds of making an epitope of 3LRH at another location of said structure 3LRH and their complexes (Fig. 2a to FIG. 2 h) of protein A.

3LRH 인트라바디는 인간 헌팅틴 단백질로부터 유래된 펩타이드에 결합한다. 에피토프를 만들기 위해, 헌팅틴 펩타이드의 첫 10개 아미노산 및 단백질 A의 C-말단 나선의 마지막 10개 아미노산을 분자 모델링 프로그램으로 중첩시켰다(도 2a 및 2b). 단백질 A의 아미노산 K48, E51 및 S52는 항체를 겨냥하여 결합에 결정적으로 보였다(도 2c). 따라서 단백질 A의 아미노산은 헌팅틴 펩타이드의 아미노산으로 바꾸었다. 라이신은 헌팅틴 펩타이드 및 단백질 A 서열 모두의 상응하는 위치에서 발견되었기 때문에 K48은 변경할 필요가 없었다. 생성된 #8188 단백질 A는 높은 친화도로 3LRH에 결합하였고, 항체-항원 복합체는 결정화를 위한 겔 여과 크로마토그래피에 의해 결합되지 않은 과잉 단백질로부터 정제되었다. 결정 구조에서, 단백질 A의 변형된 C-말단 알파나선은 의도된 바와 같이 항체와 상호작용하였다(도 2d). 항체와 상호작용하는 아미노산의 구조는 네이티브(native) 헌팅틴 펩타이드 3LRH 복합체와 실질적으로 동일하였으며, 돌연변이체 및 네이티브 단백질 A의 전체 구조는 계획한 바와 같이 0.41Å의 Cα 근평균제곱편차 값으로 겹쳐질 수 있었다(도 2d 우측 그림 및 도 2e 참조). 또한, 이황화물다리(disulfide bridge)의 도입으로 3LRH 복합체의 안정성이 향상될 수 있는데, 이는 동물 실험에서 발생하는 것과 같은 까다로운 나노기술 응용 분야에 유용할 수 있다.The 3LRH intrabody binds to a peptide derived from the human huntingtin protein. To create an epitope, the first 10 amino acids of the huntingtin peptide and the last 10 amino acids of the C-terminal helix of protein A were superimposed with a molecular modeling program (FIGS. 2A and 2B ). Amino acids K48, E51 and S52 of protein A were shown to be crucial for binding by targeting the antibody (Fig. 2c). Therefore, the amino acid of protein A was changed to the amino acid of huntingtin peptide. Since lysine was found at the corresponding positions in both the huntingtin peptide and protein A sequences, K48 did not need to be altered. The resulting #8188 protein A bound to 3LRH with high affinity, and the antibody-antigen complex was purified from unbound excess protein by gel filtration chromatography for crystallization. In the crystal structure, the modified C-terminal alpha helix of Protein A interacted with the antibody as intended (FIG. 2D ). The structure of the amino acid interacting with the antibody was substantially the same as that of the native huntingtin peptide 3LRH complex, and the overall structure of the mutant and native protein A overlapped with a Cα root mean square deviation value of 0.41Å as planned. (See Figure 2d right figure and Figure 2e). In addition, the introduction of a disulfide bridge can improve the stability of the 3LRH complex, which can be useful for demanding nanotechnology applications such as those occurring in animal experiments.

에피토프가 단백질 A의 상이한 위치에서 생성될 수 있음을 입증하기 위해, 단백질 A에 2개의 추가 에피토프 부위를 생성하였다(도 2f; 상단, protein A #8189; 하단, protein A #8496). 먼저, #8189는 도킹 영역(docking area)을 #8188 단백질 A의 도킹 영역에서 하나의 나선 회전(helical turn)만큼 이동시켜 만들어졌다. 이를 위해, 헌팅틴 펩타이드의 7개 아미노산 및 단백질 A의 C-말단 나선을 중첩시켜 인공적인 C-말단 에피토프를 생성하였다(도 2f 상단). 3LRH 인트라바디를 겨냥하는 단백질 A 구조의 아미노산은 헌팅틴 펩타이드의 아미노산으로 변경되었으며, 단백질 A의 코어를 겨냥하는 아미노산은 변경되지 않았다. 두번째 에피토프는 위와 유사한 전략을 사용하여 단백질 A의 N-말단 나선을 돌연변이시킴으로써 생성되었다(도 2f 하단). 의도한 바와 같이, 2개의 돌연변이 단백질은 3LRH 인트라바디와 안정적인 복합체를 형성하였고, 복합체는 겔 여과 크로마토그래피에 의해 해리되지 않았으며, 이들의 구조를 확인할 수 있었다. 결정 구조는 에피토프를 생성하기 위해 돌연변이시킨 아미노산이 계획된 바와 같이 항체와 상호작용하는 것으로 나타났으며(도 2g), 이들의 구조는 설계된 구조와 겹쳐질 수 있는 것으로 나타났다(도 2h).To demonstrate that epitopes can be generated at different locations of protein A, two additional epitope sites were created in protein A (Figure 2f; top, protein A #8189; bottom, protein A #8496). First, #8189 was created by moving the docking area by one helical turn in the docking area of #8188 Protein A. To this end, 7 amino acids of the huntingtin peptide and the C-terminal helix of protein A were overlapped to generate an artificial C-terminal epitope (top of FIG. 2f). The amino acid of the protein A structure targeting the 3LRH intrabody was changed to the amino acid of the huntingtin peptide, and the amino acid targeting the core of Protein A was not changed. The second epitope was generated by mutating the N-terminal helix of Protein A using a strategy similar to the above (Fig. 2F bottom). As intended, the two mutant proteins formed a stable complex with the 3LRH intrabody, and the complex was not dissociated by gel filtration chromatography, and their structures were confirmed. The crystal structure showed that amino acids mutated to generate the epitope interacted with the antibody as planned (FIG. 2g ), and their structures could overlap with the designed structure (FIG. 2h ).

실시예 4: 칼모듈린(Calmodulin)에서 3LRH 에피토프 조작Example 4: 3LRH epitope manipulation in Calmodulin

인공 나선형 에피토프가 단백질 A 이외의 단백질에서 생성될 수 있는지 조사하기 위해서, 3LRH 에피토프는 칼모듈린의 N-말단 나선에서 조작되었다(도 3a 및 3b). 칼모듈린은 칼슘 센서로서 EF-핸드 모티프(EF-hand motifs)를 통해 칼슘이온에 결합한다고 알려져 있다. 이는 구조상뿐만 아니라 서열상으로도 상동성인 N- 및 C-말단 도메인으로 구성된다. 각각의 도메인은 2개의 칼슘 결합 EF-핸드 모티프를 포함한다. 3LRH 에피토프를 생성하기 위해, 칼모듈린 나선의 첫 8개의 아미노산과 헌팅틴 나선의 마지막 8개의 아미노산을 중첩시킴으로써 칼모듈린의 N-말단 도메인의 N-말단 나선과 헌팅틴 펩타이드를 도킹하였다(도 3a). 단백질 A에서와 같이, 중첩된 영역에서 용매를 가리키는 아미노산은 헌팅틴 펩타이드의 아미노산으로 변경하였다(도 3b). 칼모듈린의 생성된 돌연변이체 N-말단 단편은 3LRH 인트라바디에 강력하게 결합하고, 복합체는 결정화될 수 있었다. 설계된 바와 같이, 칼모듈린-3LRH 복합체의 칼모듈린 부분의 구조는 마지막 3개의 아미노산을 제외하고는 변하지 않았으며, 그 구조는 C-말단 칼모듈린 단편이 없는 경우 불안정한 것으로 나타났다(도 3c). 조작된 칼모듈린 단편의 2개의 칼슘 결합 부위는 칼슘 이온에 의해 점유되어 있는 것으로 미루어 볼 때, 단백질의 기능적 및 구조적 완전성이 저해되지 않았음을 확인하였다(도 3d 좌측 그림 참조). 조작된 3LRH 에피토프의 전체적인 구조는 3LRH 복합체에서 헌팅틴 펩타이드의 구조와 중첩될 수 있어, 설계의 성공을 입증하였다(도 3d).To investigate whether artificial helical epitopes can be produced in proteins other than protein A, the 3LRH epitope was engineered in the N-terminal helix of calmodulin (FIGS. 3A and 3B ). Calmodulin is a calcium sensor that is known to bind to calcium ions through EF-hand motifs. It is composed of N- and C-terminal domains that are structurally as well as sequence homologous. Each domain contains two calcium binding EF-hand motifs. In order to generate the 3LRH epitope, the first 8 amino acids of the calmodulin helix and the last 8 amino acids of the huntingtin helix were overlapped to dock the N-terminal helix and the huntingtin peptide of the N-terminal domain of calmodulin (Fig. 3a). As in protein A, the amino acid indicating the solvent in the overlapped region was changed to the amino acid of the huntingtin peptide (FIG. 3B). The resulting mutant N-terminal fragment of calmodulin strongly binds to the 3LRH intrabody, and the complex is able to crystallize. As designed, the structure of the calmodulin part of the calmodulin-3LRH complex did not change except for the last three amino acids, and the structure was found to be unstable in the absence of the C-terminal calmodulin fragment (Fig. 3c). . Considering that the two calcium binding sites of the engineered calmodulin fragment are occupied by calcium ions, it was confirmed that the functional and structural integrity of the protein was not impaired (refer to the left figure of Fig. 3d). The overall structure of the engineered 3LRH epitope can overlap with the structure of the huntingtin peptide in the 3LRH complex, demonstrating the success of the design (FIG. 3D ).

실시예 5: 내부 알파나선에서 3LRH 에피토프의 조작Example 5: manipulation of the 3LRH epitope in the inner alpha helix

나선형 에피토프가 말단 나선뿐만 아니라 내부 나선에서도 생성될 수 있음을 보여주기 위해, T4 라이소자임(lysozyme)의 내부 나선에 3LRH 에피토프를 제작하였다. 라이소자임은 11개의 알파나선과 3개의 짧은 베타 가닥(beta strands)으로 구성되어있으며, 본 발명자들은 두 번째 알파나선에서 3LRH 에피토프를 생성하였다(도 4a 및 4b). 3개의 추가된 나선 회전으로 연장된 3번째 베타 가닥과 조작된 2개의 알파나선을 연결하기 위해, 12개의 유연한 아미노산으로 구성된 링커를 삽입하였다(도 4c 좌측 그림의 회색 점선). 돌연변이된 라이소자임 단백질을 대장균에서 생산하고 3LRH 인트라바디와의 복합체 상태로 결정화하였다. 결정 구조는 3LRH 에피토프가 생성되었고, 돌연변이된 라이소자임이 항체에 결합한다는 것을 확인하였다(도 4c). 3LRH 복합체에서 항체와 상호작용하는 측쇄는 헌팅틴 펩타이드의 것과 실질적으로 동일한 형태를 갖는다(도 4c 우측 그림 참조).In order to show that the helical epitope can be generated not only in the distal helix but also in the inner helix, a 3LRH epitope was constructed on the inner helix of T4 lysozyme. Lysozyme consists of 11 alpha helices and 3 short beta strands, and the inventors generated 3LRH epitopes in the second alpha helix (FIGS. 4A and 4B ). In order to connect the 3rd beta strand extended by 3 additional helix rotations and the 2 engineered alpha helices, a linker consisting of 12 flexible amino acids was inserted (gray dotted line in the left figure of Fig. 4c). The mutated lysozyme protein was produced in E. coli and crystallized in a complex state with a 3LRH intrabody. The crystal structure confirmed that a 3LRH epitope was generated, and that the mutated lysozyme binds to the antibody (Fig. 4c). The side chain that interacts with the antibody in the 3LRH complex has substantially the same form as that of the huntingtin peptide (see Figure 4c right figure).

실시예 6: 단백질 A 도메인에서의 1P4B 에피토프 조작 및 단백질 A-1P4B scFv 복합체의 결정 구조Example 6: 1P4B epitope engineering in protein A domain and crystal structure of protein A-1P4B scFv complex

단백질 A에 대한 마지막 시험 사례로서, GCN4의 알파나선 항원에 대한 높은 친화성을 가지며 대장균에서 효율적으로 발현이 가능한 1P4B 항체를 선택하였다. 1P4B 항체의 펩타이드-항체 상호작용은 다시 나선의 한쪽에 의해 매개되었고 다른 쪽은 용매에 완전히 노출되었다. 상기 실시예들의 경우와 마찬가지로, 단백질 A와 항체의 입체 충돌을 피하면서 단백질 A 도메인의 C-말단 나선에 1P4B-GCN4 구조를 도킹하였다. 이어서, 항체와 상호작용하는 아미노산 잔기를 GCN4 펩타이드의 아미노산 잔기로 돌연변이 시켰다(도 5a 및 5b). 단백질 A 및 1P4B의 scFv 단편은 안정적인 복합체를 형성하였고, 정제된 복합체는 구조 분석을 위해 결정화되었다. 돌연변이된 단백질 A, #9014는 의도된 구조를 형성하는 항체 단편에 결합하고, 항체 단편에 결합하도록 돌연변이된 아미노산은 1P4B 복합체에서 GCN4 펩타이드의 그것과 실질적으로 동일한 구조를 취한다(도 5c 및 5d).As the last test case for protein A, 1P4B antibody which has high affinity for the alpha helix antigen of GCN4 and can be efficiently expressed in E. coli was selected. The peptide-antibody interaction of the 1P4B antibody was again mediated by one side of the helix and the other side was completely exposed to the solvent. As in the above examples, the 1P4B-GCN4 structure was docked to the C-terminal helix of the protein A domain while avoiding steric collision between the protein A and the antibody. Subsequently, the amino acid residue interacting with the antibody was mutated to the amino acid residue of the GCN4 peptide (FIGS. 5A and 5B ). The scFv fragments of protein A and 1P4B formed a stable complex, and the purified complex was crystallized for structural analysis. The mutated protein A, #9014 binds to the antibody fragment forming the intended structure, and the amino acid mutated to bind to the antibody fragment takes substantially the same structure as that of the GCN4 peptide in the 1P4B complex (Figs. 5C and 5D). .

실시예 7: ABCB6 수송체에서 1P4B 에피토프 조작Example 7: Engineering the 1P4B epitope in the ABCB6 transporter

항나선 항체가 밝혀지지 않은 막 단백질 구조 연구에 유용한지 확인하기 위하여 하기와 같이 실험을 수행하였다. 먼저, 인간 ABCB6을 표적 단백질로 선택하였다. ABCB6은 세포질에서 미토콘드리아로 코프로포르피리노겐(coproporphyrinogen) III를 전위(translocation)시킴으로써 헴(heme) 및 포르피린(porphyrin)의 합성을 조절하는 미토콘드리아 ATP 결합 카세트(ATP binding cassette; ABC) 수송체이다. 단량체 ABCB6은 반 수송체(half transporter)이며, 1개의 막관통 도메인(transmembrane domain; 이하 'TMD'라 함) 및 1개의 뉴클레오타이드 결합 도메인(nucleotide binding domain; 이하 'NBD'라 함)을 포함하여 동종이량체를 형성함으로써 활성화된다. 분리된 NBD의 결정 구조는 밝혀져 있다. 그러나, TMD를 포함한 ABCB6의 구조는 아직 보고된 바 없다. 따라서 상동성 모델링 기법을 사용하여 구조를 예측하였다. 인간 ABCB6과 46%의 서열 상동성을 갖는 Atm1-타입 ABC 익스포터 (NaAtm1; PDB ID code 4MRS)의 구조를 템플릿으로서 사용하였고, 계산은 프로그램 MODELER를 사용하였다. NBD의 상동성 모델은 결정 구조와 밀접하게 일치하여 모델링의 정확성을 보여주었으며(도 6a), ABCB6의 NBD는 C-말단에 짧은 나선이 포함되어 있었다(도 6a 우측 그림 참조). 1P4B 에피토프를 이식하기 위해, ABCB6의 NBD 도메인의 C-말단 나선은 ABCB6의 마지막 3개 아미노산과 GCN4 나선의 첫번째 3개의 아미노산을 겹쳐서 GCN4 펩타이드와 도킹시켰다(도 6b). 중첩 영역에서 용매에 노출된 아미노산은 다시 GCN4 펩타이드의 아미노산으로 변경되었지만, ABCB6을 겨냥하는 아미노산은 변경되지 않았다. 또한, ABCB6의 Q823은 중첩 영역에 있지 않지만 도킹 모델에서 1P4B scFv의 W109 및 S111 잔기와 충돌하는 것으로 나타났다(도 6c). 따라서, 이러한 충돌을 피하기 위해, 글루타민을 알라닌(Q823A)으로 변경하였다.In order to confirm whether the anti-helix antibody is useful for studying the structure of an unknown membrane protein, an experiment was performed as follows. First, human ABCB6 was selected as a target protein. ABCB6 is a mitochondrial ATP binding cassette (ABC) transporter that regulates the synthesis of heme and porphyrin by translocation of coproporphyrinogen III from the cytoplasm to mitochondria. Monomer ABCB6 is a half transporter and is homogeneous, including one transmembrane domain (hereinafter referred to as'TMD') and one nucleotide binding domain (hereinafter referred to as'NBD'). It is activated by forming a dimer. The crystal structure of the isolated NBD has been revealed. However, the structure of ABCB6 including TMD has not been reported yet. Therefore, the structure was predicted using a homology modeling technique. The structure of the Atm1-type ABC exporter (NaAtm1; PDB ID code 4MRS) having 46% sequence homology with human ABCB6 was used as a template, and the program MODELER was used for calculation. The homology model of NBD was in close agreement with the crystal structure to show the accuracy of modeling (FIG. 6A), and the NBD of ABCB6 contained a short helix at the C-terminus (refer to the right picture of FIG. 6A). To transplant the 1P4B epitope, the C-terminal helix of the NBD domain of ABCB6 overlapped the last 3 amino acids of ABCB6 and the first 3 amino acids of the GCN4 helix and docked with the GCN4 peptide (FIG. 6B ). In the overlapping region, the amino acid exposed to the solvent was changed back to the amino acid of the GCN4 peptide, but the amino acid targeting ABCB6 was not changed. In addition, Q823 of ABCB6 was not in the overlapping region, but appeared to collide with the W109 and S111 residues of 1P4B scFv in the docking model (Fig. 6c). Therefore, to avoid this conflict, glutamine was changed to alanine (Q823A).

현미경 사진에서 ABCB6의 시각화를 촉진하기 위해, 2개의 돌연변이를 도입하였다. 먼저, 본 발명자들은 앞서 나타낸 바와 같이 단백질의 균질성을 개선시키기 위해 인간 ABCB6의 리소좀 표적 세그먼트(lysosomal targeting segment), 잔기 1 내지 205를 절단하였다. 그리고, ATP 가수분해 활성을 방해하고 외향(outward-facing) 구조를 안정화시키기 위해, ABCB6의 NBD 도메인에 E659Q 돌연변이를 도입하였다. 조작된 ABCB6을 피키아 파스토리스(Pichia pastoris)에서 생산하고, 정제된 ABCB6을 1 : 3 의 몰비로 1P4B Fab와 함께 인큐베이션하여 안정한 복합체가 형성되도록 하였다. 이를 통해 수득한 복합체 및 과량의 항체는 크기 배제 크로마토그래피를 용하여 분리하였다(도 6d). 이어서 ABCB6-Fab 복합체를 포함하는 풀링(pooling)된 분획을 ATP/Mg2+와 혼합하여 ATP- 결합된, 바깥쪽을 향한 촉매 상태의 ABCB6을 포획하였다. 생성된 단백질 복합체는 음성 염색(negative staining) EM 및 단일-입자 분석이 진행되었다. 전체적으로, 153,945개 및 138,419개의 입자를 수집하고, 각각 1P4B Fab가 결합되어 있거나 결합되지 않은 ABCB6의 2차원(2D) 클래스 평균(class average)을 얻기 위해 사용하였다. 결합된 항체가 없는 ABCB6의 주요 2D 클래스 평균은 ABC 수송체의 구조적 특징을 나타냈다: 계면활성제의 마이셀(micelle)에 포함된 TMD와 폐쇄된 이량체를 형성하는 NBD. 이와는 대조적으로, ABCB6-1P4B Fab 복합체의 EM 이미지는 추정된 NBD 결합 부위에 결합된 아령 모양의 Fab에 해당하는 여분의 밀도가 또렷하게 포함되어 있었다(도 6e). 3D 재구성에 의해서는 Fab 밀도의 위치가 설계된 구조와 일치함을 확인하였고, 따라서 인공적으로 설계된 에피토프를 갖는 단백질이 의도된 구조를 가짐을 확인하였다(도 6f). Fab의 가변 영역과 불변 영역 사이의 유연성으로 인해, 최종 밀도 맵에서는 Fv 영역만 나타난다.To facilitate visualization of ABCB6 in micrographs, two mutations were introduced. First, the present inventors cut the lysosomal targeting segment of human ABCB6, residues 1 to 205, in order to improve the homogeneity of the protein as shown above. And, in order to interfere with the ATP hydrolytic activity and stabilize the outward-facing structure, the E659Q mutation was introduced into the NBD domain of ABCB6. Engineered ABCB6 was produced in Pichia pastoris , and purified ABCB6 was incubated with 1P4B Fab at a molar ratio of 1:3 to form a stable complex. The complex and excess antibody obtained through this were separated using size exclusion chromatography (FIG. 6D). Subsequently, the pooled fraction containing the ABCB6-Fab complex was mixed with ATP/Mg 2+ to capture ATP-bonded, outwardly catalytic ABCB6. The resulting protein complex was subjected to negative staining EM and single-particle analysis. In total, 153,945 and 138,419 particles were collected and used to obtain a two-dimensional (2D) class average of ABCB6 with or without 1P4B Fab bound, respectively. The main 2D class average of ABCB6 without bound antibody revealed the structural features of the ABC transporter: the TMD contained in the micelles of the surfactant and the NBD forming a closed dimer. In contrast, the EM image of the ABCB6-1P4B Fab complex clearly contained the extra density corresponding to the dumbbell-shaped Fab bound to the estimated NBD binding site (FIG. 6E). By 3D reconstruction, it was confirmed that the location of the Fab density coincided with the designed structure, and thus it was confirmed that the protein having the artificially designed epitope has the intended structure (FIG. 6F). Due to the flexibility between the variable and constant regions of the Fab, only the Fv region appears in the final density map.

본 발명의 구조에서, 예측된 바와 같이 입체 장애가 다른 도메인에 대한 결합을 방지하기 때문에 Fab의 1 분자 만이 1 NBD 도메인에 결합된다. 정제 과정에서 콜레스테릴 헤미숙시네이트(cholesteryl hemisuccinate)를 계면활성제에 첨가하여 ABCB6의 구조를 안정화시키고 그 활성을 유지하였으며, 이는 계면활성제 마이셀의 약간 더 큰 면적의 원인이 될 수 있다(도 6f). EM 맵의 해상도는 ABCB6에 대한 모델을 직접 구축하기에는 충분하지 않았기 때문에, P-glycoprotein(이하, 'P-gp'라고 함)의 박테리아 상동체, 스타필로코커스 아우레우스(Staphylococcus aureus)의 Sav1866의 공지된 구조를 최종 밀도 맵에 적합하게 구성하였다. 그 결과 EM 맵은 Sav1866 구조와 밀접하게 일치하였으며, ABCB6은 바깥쪽을 향한 TMD(즉, 미토콘드리아의 막사이 공간으로 개방됨)와 닫힌 NBD 구조를 나타냄을 확인하였다.In the structure of the present invention, only one molecule of the Fab is bound to one NBD domain because, as predicted, steric hindrance prevents binding to other domains. In the purification process, cholesteryl hemisuccinate was added to the surfactant to stabilize the structure of ABCB6 and maintain its activity, which may cause a slightly larger area of the surfactant micelle (Fig. 6f). ). Since the resolution of the EM map was not sufficient to directly build a model for ABCB6, the bacterial homologue of P-glycoprotein (hereinafter referred to as'P-gp'), and of Sav1866 of Staphylococcus aureus. The known structure was adapted to fit the final density map. As a result, it was confirmed that the EM map closely matched the Sav1866 structure, and ABCB6 showed the TMD facing outward (ie, open to the intermembrane space of the mitochondria) and the closed NBD structure.

실시예 8: P-gp에서 1P4B 및 3LRH 에피토프 조작 및 ATP 가수 분해 활성의 억제Example 8: Inhibition of 1P4B and 3LRH epitope manipulation and ATP hydrolytic activity in P-gp

항나선 항체를 이용하여 단백질의 특정 형태(conformation)를 안정화시킬 수 있는지 시험하기 위해 예쁜꼬마선충(Caenorhabditis elegans)의 P-gp를 모델 단백질로 선택하였다. ABC 수송체의 상과(superfamily) 구성원인 P-gp는 암세포로부터 항암제를 퍼냄으로써 약물 내성을 부여할 수 있는 주요 다중 약물 수송체(multidrug transporter)이다. P-gp의 기능적 단위는 단일 폴리펩타이드 내에 각각 TMD(TMD1 및 TMD2) 및 세포질 NBD(NBD1 및 NBD2)를 포함하는 상동성 N-말단 및 C-말단 절반으로 구성되어 있다(도 7a 및 7c). TMD는 다양한 기질을 인식하고, 막을 가로지르는 기질의 전위(translocation)를 용이하게 하는 반면, NBD는 ATP에 결합하고 가수분해하여 기질의 전위를 위한 에너지를 제공한다. P-gp of Caenorhabditis elegans was selected as a model protein in order to test whether a specific conformation of the protein can be stabilized using an anti-helix antibody. P-gp, a member of the superfamily of ABC transporters, is a major multidrug transporter capable of imparting drug resistance by pumping anticancer drugs from cancer cells. The functional units of P-gp consist of homologous N-terminal and C-terminal halves containing TMD (TMD1 and TMD2) and cytoplasmic NBD (NBD1 and NBD2), respectively, in a single polypeptide (FIGS. 7A and 7C ). TMD recognizes a variety of substrates and facilitates translocation of the substrate across the membrane, while NBD binds to and hydrolyzes ATP, providing energy for the translocation of the substrate.

P-gp에 1P4B 에피토프를 도입하기 위해, NBD1의 C-말단에 위치한 짧은 나선은 NBD1 나선의 마지막 12개 아미노산과 GCN4 펩타이드의 첫 번째 12개의 아미노산을 겹침으로써 GCN4 펩타이드와 도킹하였다(도 7a 및 7b). 용매에 노출된 NBD1 나선의 아미노산은 GCN4 펩타이드의 아미노산으로 대체하였지만, NBD1의 중심을 가리키는 아미노산은 대체하지 않았다. 유사한 전략을 사용하여 3LRH 에피토프도 P-gp NBD1에 생성하였고, 다만 도킹 영역은 1P4B의 도킹 영역에서 1 나선 회전만큼 이동하여 대상 단백질과의 입체 충돌을 피했다(도 7c 및 7d).In order to introduce the 1P4B epitope into P-gp, the short helix located at the C-terminus of NBD1 was docked with the GCN4 peptide by overlapping the last 12 amino acids of the NBD1 helix with the first 12 amino acids of the GCN4 peptide (FIGS. 7A and 7B. ). The amino acid of the NBD1 helix exposed to the solvent was replaced with the amino acid of the GCN4 peptide, but the amino acid indicating the center of the NBD1 was not replaced. Using a similar strategy, a 3LRH epitope was also generated in P-gp NBD1, except that the docking region moved by one helix rotation in the docking region of 1P4B to avoid steric collision with the target protein (Figs. 7c and 7d).

시험관 내에서 조작된 P-gp와 항체의 상호작용을 확인하기 위해 풀다운 분석(pull-down assay)을 수행하였다. 이를 위해, C-말단에서 eGFP 및 데카히스티딘 태그(decahistidine tags)를 갖는 조작된 P-gp를 Ni-NTA 수지에 결합시키고, 1:10 의 몰비로 1P4B scFv 또는 3LRH 인트라바디와 함께 배양하였다. 철저히 세척한 후, 단백질 혼합물을 SDS-PAGE(sodium dodecyl sulfate-polyacrylamide gel electrophoresis)로 분리하였다. 야생형 P-gp를 제 1 음성 대조군으로 사용하였고, 결합된 P-gp가 없는 빈 수지를 제 2 음성 대조군으로 사용하여 백그라운드 결합 가능성을 배제하였다. 그 결과 조작된 P-gp가 두 항체 모두와 강력하게 상호작용 한다는 것을 확인하였다(도 7e). 안정한 복합체의 형성은 크기 배제 크로마토그래피에 의해서도 확인되었다. 두 항체 모두 강한 상호작용에 의해 안정화된 복합체의 전형적인 고분자량 분획에서 용리되었다(도 7f).A pull-down assay was performed to confirm the interaction between the engineered P-gp and the antibody in vitro. To this end, the engineered P-gp having eGFP and decahistidine tags at the C-terminus was bound to the Ni-NTA resin, and incubated with 1P4B scFv or 3LRH intrabody at a molar ratio of 1:10. After thoroughly washing, the protein mixture was separated by SDS-PAGE (sodium dodecyl sulfate-polyacrylamide gel electrophoresis). Wild-type P-gp was used as the first negative control, and empty resin without bound P-gp was used as the second negative control to exclude the possibility of background binding. As a result, it was confirmed that the engineered P-gp strongly interacts with both antibodies (Fig. 7e). The formation of stable complexes was also confirmed by size exclusion chromatography. Both antibodies eluted in a typical high molecular weight fraction of the complex stabilized by strong interactions (Fig. 7f).

폐쇄된 NBD 이량체의 형성은 ABC 수송체의 ATPase 활성의 전제 조건인 것으로 알려져 있다. 본 발명의 구조 기반 도킹 모델은 조작된 P-gp에 대한 항나선 항체의 결합이 NBD 도메인의 폐쇄 모션을 입체적으로 방지함으로써 ATP 가수 분해 활성을 억제하는 것을 시사하였다. 이를 확인하기 위해, 강력한 항암제인 파클리탁셀(Paclitaxel) 및 액티노마이신(Actinomycin) D를 약물 기질로 사용하여 항체의 존재 및 부재하에 정제된 P-gp의 ATPase 활성을 측정하였다. ABC 수송체에 대해 예상되었던 바와 같이, 항체가 없는 모든 P-gp 구조는 약물에 의해 자극된 ATPase 활성을 나타내었고, P-gp의 조작은 약물 농도 의존성, 약물에 의한 최대 자극 수준 및 기질에 대한 2상(biphasic) 반응과 같은 저농도 촉진성 및 고농도 억제성의 효소적 특성에 거의 영향을 미치지 않았다(도 7g). 이러한 결과는 나선 에피토프를 대상 단백질에 이식하는 것이 그들의 고유한 기능에 영향을 미치지 않으며, 전체적인 구조의 손상을 야기하지 않는다는 것을 강력하게 시사하는 것이다. 그러나, 1P4B scFv 및 3LRH 인트라바디는 조작된 P-gp의 기초 ATPase 활성 및 약물에 의해 자극된 ATPase 활성을 억제하였다(도 7g). 이는 조작된 P-gp에 대한 항나선 항체의 결합이 ATPase 활성에 필수적인 닫힌 상태(closed state)로 단백질의 구조적 전환을 억제했음을 입증하는 것이다. 이는 마우스 P-gp NBD1에 나노바디(nanobody)를 결합하는 효과가 ATPase 활성에 미치는 영향을 크게 연상시켰다.The formation of a closed NBD dimer is known to be a prerequisite for the ATPase activity of the ABC transporter. The structure-based docking model of the present invention suggested that the binding of the anti-helix antibody to the engineered P-gp sterically prevents the closing motion of the NBD domain, thereby inhibiting the ATP hydrolytic activity. To confirm this, the ATPase activity of purified P-gp in the presence and absence of antibodies was measured using paclitaxel and actinomycin D, which are potent anticancer agents, as drug substrates. As expected for the ABC transporter, all P-gp structures in the absence of antibodies showed drug-stimulated ATPase activity, and manipulation of P-gp was dependent on the drug concentration, the level of maximal stimulation by the drug, and the substrate. There was little effect on the enzymatic properties of low concentration promoting and high concentration inhibitory properties such as biphasic reaction (Fig. 7g). These results strongly suggest that implantation of the helix epitope into the target protein does not affect their intrinsic function and does not cause damage to the overall structure. However, the 1P4B scFv and 3LRH intrabody inhibited the basal ATPase activity of the engineered P-gp and the ATPase activity stimulated by the drug (FIG. 7G ). This demonstrates that the binding of the anti-helix antibody to the engineered P-gp inhibited the structural conversion of the protein to a closed state essential for ATPase activity. This was reminiscent of the effect of binding a nanobody to mouse P-gp NBD1 on ATPase activity.

본 발명자들은 상기 실시예들을 통하여 알파나선의 용매에 노출된(solvent-exposed) 아미노산을 항체와 상호 작용할 수 있도록 새로운 형태로 변형시킴으로써, 특정 알파나선에 결합하는 몇몇 항체가 관련이 없는 다양한 단백질에 결합하도록 만들어질 수 있음을 보여주었다. 알파나선의 구조적 안정성에 중요한 역할을 하는 아미노산 잔기는 대상 단백질의 고유 구조를 교란하지 않기 위해 변화되지 않았다. X-선 결정학에 의해 8 가지의 조작된 단백질-항체 복합체의 구조를 규명함으로써 본 발명에 따른 방법이 유효하다는 것을 증명하였다. 모든 경우에 있어서, 각각의 돌연변이된 단백질의 전체적인 구조는 심각하게 방해 받지 않았으며, 돌연변이된 나선은 의도한 대로 항나선 항체와 상호작용을 하였다. 더욱이 항체와 직접 상호작용하는 아미노산은 네이티브 펩타이드-항체 복합체에서 발견되는 것과 동일한 형태(conformation)를 나타내었다.Through the above embodiments, the present inventors modified amino acids exposed to the solvent of the alpha helix into a new form to interact with the antibody, so that some antibodies that bind to a specific alpha helix bind to various unrelated proteins. Showed that it can be made to do. The amino acid residues that play an important role in the structural stability of the alpha helix were not changed in order not to disturb the intrinsic structure of the protein of interest. By elucidating the structures of eight engineered protein-antibody complexes by X-ray crystallography, it was proved that the method according to the present invention is effective. In all cases, the overall structure of each mutated protein was not severely disturbed, and the mutated helix interacted with the anti-helix antibody as intended. Moreover, amino acids that directly interact with the antibody exhibited the same conformation as found in the native peptide-antibody complex.

본 발명에 따른 항나선 항체를 이용한 단백질 구조 규명 방법은 하기와 같은 상황에서도 사용될 수 있다. 먼저, 대상 단백질의 파라로그(paralog) 또는 오쏘로그(ortholog) 단백질에 대한 구조적 정보가 있는 경우, 상기 방법을 사용하여 상동성 모델링에 의해 표적 단백질에서 에피토프를 설계할 수 있다. 둘째, 단백질 복합체의 일부 구조가 알려진 경우에 사용될 수 있다. 예를 들어, 리간드 단백질의 구조가 알려진 경우, 이는 구조를 알지 못하는 리간드-수용체 복합체의 리간드 단백질 부분에서 에피토프를 설계하는데 사용될 수 있다. 셋째, 본 발명에 따른 방법은 막관통 단백질의 구조 연구에 특히 유용할 수 있다. 대부분의 막관통 단백질은 전적으로 긴 알파나선으로 구성되어 있기 때문이다. 항체 Fab 단편은 막관통 단백질의 구조 분석에 성공적으로 사용되어 왔다. 그러나, 작은 친수성 영역을 갖는 막관통 단백질에 대한 고친화도 항체의 생산은 상당한 시간과 노력이 필요하다. 넷째로, 약물 설계 실험에서 고처리율(high-throughput)로 수백 개에 달하는 단백질-약물 복합체의 구조를 결정할 필요성이 있고, 여기에는 결합된 항체가 고처리율 사용에 보다 편리한 결정화 또는 초저온전자현미경(cryo-EM) 조건을 식별하는데 도움이 될 수 있다. 구조 생물학에서 사용되고 있는 수많은 다른 단백질 공학 방법들과 마찬가지로, 본 발명에 따른 항나선 항체 접근법의 적용은 나선에 유입된 돌연변이에 의해 대상 단백질의 기능적, 구조적 무결점이 훼손되지 않았다는 것을 보여주는 세심한 통제 실험이 필요하다.The protein structure identification method using the anti-helix antibody according to the present invention can be used in the following situations. First, if there is structural information on a paralog or ortholog protein of a target protein, an epitope in the target protein can be designed by homology modeling using the above method. Second, it can be used when some structure of the protein complex is known. For example, if the structure of a ligand protein is known, it can be used to design an epitope in the ligand protein portion of a ligand-receptor complex whose structure is unknown. Third, the method according to the present invention may be particularly useful for structural studies of transmembrane proteins. This is because most transmembrane proteins consist entirely of long alpha helices. Antibody Fab fragments have been successfully used for structural analysis of transmembrane proteins. However, the production of high-affinity antibodies to transmembrane proteins having small hydrophilic regions requires considerable time and effort. Fourth, in drug design experiments, there is a need to determine the structure of hundreds of protein-drug complexes at high-throughput, in which the bound antibodies are crystallized or cryoelectron microscopy (cryo electron microscope) more convenient for use with high throughput. -EM) can help to identify the condition. Like many other protein engineering methods used in structural biology, the application of the anti-helix antibody approach according to the present invention requires careful control experiments to show that the functional and structural integrity of the target protein is not damaged by mutations introduced into the helix. Do.

본 발명에 따른 단백질의 구조 규명 방법의 유효성을 확인하기 위해, 알파나선 펩타이드에 결합하는 것으로 알려져 있는 3개의 항체 단편(3MNZ, 3LRH 및 1P4B)을 사용하였다. 모든 항체는 조작된 단백질에 결합하여 예상되는 단단한 구조를 형성하였다. 이러한 성공은 많은 다른 나선 결합 항체가 항나선 항체 방법에 적용될 수 있음을 시사한다. 수 천 개의 항체-항원 구조가 이미 PDB에 기탁되었다. 이러한 구조에 대해 재빠르게 조사한 결과, 10개 이상의 항체가 항 나선 항체로 사용될 수 있다는 것이 밝혀졌다. 더욱이 이러한 항체들이 다른 목적으로 생성되었기 때문에 본 연구의 항나선 항체 방법에 사용하기 위하여 항체를 생성, 선별하는 보다 체계적인 방법이 시도된다면 항나선 항체의 풀(pool)은 급격히 증가할 것이다.In order to confirm the effectiveness of the method for identifying the structure of a protein according to the present invention, three antibody fragments (3MNZ, 3LRH and 1P4B) known to bind to an alpha helical peptide were used. All antibodies bound to the engineered protein to form the expected rigid structure. This success suggests that many other helix-binding antibodies can be applied to anti-helix antibody methods. Thousands of antibody-antigen structures have already been deposited with the PDB. A quick investigation into this structure revealed that more than 10 antibodies could be used as anti-helix antibodies. Moreover, since these antibodies were produced for different purposes, if a more systematic method of generating and selecting antibodies for use in the anti-helical antibody method of this study is attempted, the pool of anti-helical antibodies will rapidly increase.

또한 본 발명에 따른 항나선 방법을 적용하는데 있어서, 항체와 대상 단백질의 입체 충돌이 상호 결합을 방해하기 때문에 대상 단백질의 알파나선이 용매에 잘 노출되어야 한다. 서로 상이한 서열 및 구조를 갖는 항체 패널(panel)을 갖는 것은 매우 유용할 것으로 사료되는데, 이는 각각의 항체들은 서로 상이한 구조를 인식하고, 그 중 입체 충돌을 일으키지 않는 항체가 후보 항나선 항체의 패널 중 적어도 하나는 존재할 수 있기 때문이다.In addition, in applying the anti-helix method according to the present invention, since steric collision between the antibody and the target protein interferes with mutual binding, the alpha-helix of the target protein must be well exposed to the solvent. It is believed that it would be very useful to have a panel of antibodies having different sequences and structures, which means that each antibody recognizes a different structure, and among them, antibodies that do not cause steric collisions are among the panel of candidate anti-helical antibodies. Because at least one can exist.

결론적으로, 본 발명자들은 알파나선에 결합하는 기 보고된 여러 종류의 항체가 반범용적인(semiuniversal) 항나선 항체로서 사용될 수 있다는 것을 실시예들을 통하여 보여주었다. 이 항체들은 X-선 결정학과 초저온전자현미경에 의한 단백질 구조 연구에 있어서 편리한 도구가 될 것이다. 또한, 본 발명은 단백질 나노기술 분야에서 예측 가능한 구조로 단백질 서브유닛을 조립하는 데 사용될 수 있을 것으로 기대된다.In conclusion, the present inventors have shown through examples that several types of previously reported antibodies that bind to the alpha helix can be used as semiuniversal anti-helix antibodies. These antibodies will be a convenient tool in the study of protein structure by X-ray crystallography and cryogenic electron microscopy. In addition, the present invention is expected to be used to assemble protein subunits into predictable structures in the field of protein nanotechnology.

전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다.The above description of the present invention is for illustrative purposes only, and those of ordinary skill in the art to which the present invention pertains will be able to understand that other specific forms can be easily modified without changing the technical spirit or essential features of the present invention. will be. Therefore, it should be understood that the embodiments described above are illustrative and non-limiting in all respects.

<110> POSTECH ACADEMY-INDUSTRY FOUNDATION <120> Method for protein structure determination using an antibody that binds to alpha helix <130> MP19-230 <160> 17 <170> KoPatentIn 3.0 <210> 1 <211> 56 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of Protein A #8420 <400> 1 Gly Ser His Met Phe Asn Lys Asp Gln Gln Ser Ala Phe Tyr Glu Ile 1 5 10 15 Leu Asn Met Pro Asn Leu Asn Glu Ala Gln Arg Asn Gly Phe Ile Gln 20 25 30 Ser Leu Lys Asp Asp Pro Ser Gln Ser Thr Asn Val Leu Leu Glu Ala 35 40 45 Asp Lys Trp Ala Ser Leu Gln Asn 50 55 <210> 2 <211> 62 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of Protein A #8188 <400> 2 Gly Ser His Met Phe Asn Lys Asp Gln Gln Ser Ala Phe Tyr Glu Ile 1 5 10 15 Leu Asn Met Pro Asn Leu Asn Glu Ala Gln Arg Asn Gly Phe Ile Gln 20 25 30 Ser Leu Lys Asp Asp Pro Ser Gln Ser Thr Asn Val Leu Gly Glu Ala 35 40 45 Lys Lys Leu Asn Lys Ala Gln Ala Ser Leu Lys Ser Phe Gln 50 55 60 <210> 3 <211> 65 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of Protein A #8189 <400> 3 Gly Ser His Met Phe Asn Lys Asp Gln Gln Ser Ala Phe Tyr Glu Ile 1 5 10 15 Leu Asn Met Pro Asn Leu Asn Glu Ala Gln Arg Asn Gly Phe Ile Gln 20 25 30 Ser Leu Lys Asp Asp Pro Ser Gln Ser Thr Asn Val Leu Gly Glu Ala 35 40 45 Lys Lys Leu Asn Lys Leu Gln Lys Ala Phe Glu Ser Leu Lys Ser Phe 50 55 60 Gln 65 <210> 4 <211> 56 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of Protein A #8496 <400> 4 Met Glu Lys Leu Met Lys Ala Phe Gln Ser Leu Ala Phe Phe Glu Ile 1 5 10 15 Leu Asn Met Pro Asn Leu Asn Glu Ala Gln Arg Asn Gly Phe Ile Gln 20 25 30 Ser Leu Lys Asp Asp Pro Ser Gln Ser Thr Asn Val Leu Gly Glu Ala 35 40 45 Lys Lys Leu Asn Glu Ser Gln Ala 50 55 <210> 5 <211> 62 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of Protein A #8188cys <400> 5 Gly Ser His Met Phe Asn Lys Asp Gln Gln Ser Ala Phe Tyr Glu Ile 1 5 10 15 Leu Asn Met Pro Asn Leu Asn Glu Ala Gln Arg Asn Gly Phe Ile Gln 20 25 30 Ser Leu Lys Asp Asp Pro Ser Gln Ser Thr Asn Val Leu Gly Glu Ala 35 40 45 Lys Lys Leu Asn Lys Cys Gln Ala Ser Leu Lys Ser Phe Gln 50 55 60 <210> 6 <211> 87 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of Calmodulin #9011 <400> 6 Gly Ser His Met Glu Lys Leu Met Lys Ala Phe Glu Ser Leu Gln Ile 1 5 10 15 Phe Gln Phe Lys Glu Ala Phe Ser Leu Phe Asp Lys Asp Gly Asp Gly 20 25 30 Thr Ile Thr Thr Lys Glu Leu Gly Thr Val Met Arg Ser Leu Gly Gln 35 40 45 Asn Pro Thr Glu Ala Glu Leu Gln Asp Met Ile Asn Glu Val Asp Ala 50 55 60 Asp Gly Asn Gly Thr Ile Asp Phe Pro Glu Phe Leu Thr Met Met Ala 65 70 75 80 Arg Lys Met Lys Asp Thr Asp 85 <210> 7 <211> 189 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of T4 lysozyme #9213 <400> 7 Gly Ser His Met Asn Ile Phe Glu Met Leu Arg Ile Asp Glu Gly Leu 1 5 10 15 Arg Leu Lys Ile Tyr Lys Asp Thr Glu Gly Tyr Tyr Thr Ile Gly Ile 20 25 30 Gly His Leu Leu Thr Lys Ser Pro Val Glu Gly Gly Gly Gly Ser Gly 35 40 45 Gly Gly Gly Ser Glu Lys Leu Met Lys Ala Phe Glu Ser Leu Ser Leu 50 55 60 Phe Gln Ala Lys Ser Glu Leu Asp Lys Ala Ile Gly Arg Asn Thr Asn 65 70 75 80 Gly Val Ile Thr Lys Asp Glu Ala Glu Lys Leu Phe Asn Gln Asp Val 85 90 95 Asp Ala Ala Val Arg Gly Ile Leu Arg Asn Ala Lys Leu Lys Pro Val 100 105 110 Tyr Asp Ser Leu Asp Ala Val Arg Arg Ala Ala Leu Ile Asn Met Val 115 120 125 Phe Gln Met Gly Glu Thr Gly Val Ala Gly Phe Thr Asn Ser Leu Arg 130 135 140 Met Leu Gln Gln Lys Arg Trp Asp Glu Ala Ala Val Asn Leu Ala Lys 145 150 155 160 Ser Arg Trp Tyr Asn Gln Thr Pro Asn Arg Ala Lys Arg Val Ile Thr 165 170 175 Thr Phe Arg Thr Gly Thr Trp Asp Ala Tyr Ala Asn Leu 180 185 <210> 8 <211> 61 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of Protein A #9014 <400> 8 Gly Ser His Met Lys Glu Gln Gln Asn Ala Phe Tyr Glu Ile Leu His 1 5 10 15 Leu Pro Asn Leu Asn Glu Glu Gln Arg Asn Ala Phe Ile Gln Ser Leu 20 25 30 Lys Asp Asp Pro Ser Gln Ser Ala Asn Leu Leu Ala Glu Ala Lys Ala 35 40 45 Leu Asn His Leu Gln Asn Glu Val Ala Arg Leu Lys Lys 50 55 60 <210> 9 <211> 1325 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of P-gp #3273 <400> 9 Met Leu Arg Asn Gly Ser Leu Arg Gln Ser Leu Arg Thr Leu Asp Ser 1 5 10 15 Phe Ser Leu Ala Pro Glu Asp Val Leu Lys Thr Ala Ile Lys Thr Val 20 25 30 Glu Asp Tyr Glu Gly Asp Asn Ile Asp Ser Asn Gly Glu Ile Lys Ile 35 40 45 Thr Arg Asp Ala Lys Glu Glu Val Val Asn Lys Val Ser Ile Pro Gln 50 55 60 Leu Tyr Arg Tyr Thr Thr Thr Leu Glu Lys Leu Leu Leu Phe Ile Gly 65 70 75 80 Thr Leu Val Ala Val Ile Thr Gly Ala Gly Leu Pro Leu Met Ser Ile 85 90 95 Leu Gln Gly Lys Val Ser Gln Ala Phe Ile Asn Glu Gln Ile Val Ile 100 105 110 Asn Asn Asn Gly Ser Thr Phe Leu Pro Thr Gly Gln Asn Tyr Thr Lys 115 120 125 Thr Asp Phe Glu His Asp Val Met Asn Val Val Trp Ser Tyr Ala Ala 130 135 140 Met Thr Val Gly Met Trp Ala Ala Gly Gln Ile Thr Val Thr Cys Tyr 145 150 155 160 Leu Tyr Val Ala Glu Gln Met Asn Asn Arg Leu Arg Arg Glu Phe Val 165 170 175 Lys Ser Ile Leu Arg Gln Glu Ile Ser Trp Phe Asp Thr Asn His Ser 180 185 190 Gly Thr Leu Ala Thr Lys Leu Phe Asp Asn Leu Glu Arg Val Lys Glu 195 200 205 Gly Thr Gly Asp Lys Ile Gly Met Ala Phe Gln Tyr Leu Ser Gln Phe 210 215 220 Ile Thr Gly Phe Ile Val Ala Phe Thr His Ser Trp Gln Leu Thr Leu 225 230 235 240 Val Met Leu Ala Val Thr Pro Ile Gln Ala Leu Cys Gly Phe Ala Ile 245 250 255 Ala Lys Ser Met Ser Thr Phe Ala Ile Arg Glu Thr Leu Arg Tyr Ala 260 265 270 Lys Ala Gly Lys Val Val Glu Glu Thr Ile Ser Ser Ile Arg Thr Val 275 280 285 Val Ser Leu Asn Gly Leu Arg Tyr Glu Leu Glu Arg Tyr Ser Thr Ala 290 295 300 Val Glu Glu Ala Lys Lys Ala Gly Val Leu Lys Gly Leu Phe Leu Gly 305 310 315 320 Ile Ser Phe Gly Ala Met Gln Ala Ser Asn Phe Ile Ser Phe Ala Leu 325 330 335 Ala Phe Tyr Ile Gly Val Gly Trp Val His Asp Gly Ser Leu Asn Phe 340 345 350 Gly Asp Met Leu Thr Thr Phe Ser Ser Val Met Met Gly Ser Met Ala 355 360 365 Leu Gly Leu Ala Gly Pro Gln Leu Ala Val Leu Gly Thr Ala Gln Gly 370 375 380 Ala Ala Ser Gly Ile Tyr Glu Val Leu Asp Arg Lys Pro Val Ile Asp 385 390 395 400 Ser Ser Ser Lys Ala Gly Arg Lys Asp Met Lys Ile Lys Gly Asp Ile 405 410 415 Thr Val Glu Asn Val His Phe Thr Tyr Pro Ser Arg Pro Asp Val Pro 420 425 430 Ile Leu Arg Gly Met Asn Leu Arg Val Asn Ala Gly Gln Thr Val Ala 435 440 445 Leu Val Gly Ser Ser Gly Cys Gly Lys Ser Thr Ile Ile Ser Leu Leu 450 455 460 Leu Arg Tyr Tyr Asp Val Leu Lys Gly Lys Ile Thr Ile Asp Gly Val 465 470 475 480 Asp Val Arg Asp Ile Asn Leu Glu Phe Leu Arg Lys Asn Val Ala Val 485 490 495 Val Ser Gln Glu Pro Ala Leu Phe Asn Cys Thr Ile Glu Glu Asn Ile 500 505 510 Ser Leu Gly Lys Glu Gly Ile Thr Arg Glu Glu Met Val Ala Ala Cys 515 520 525 Lys Met Ala Asn Ala Glu Lys Phe Ile Lys Thr Leu Pro Asn Gly Tyr 530 535 540 Asn Thr Leu Val Gly Asp Arg Gly Thr Gln Leu Ser Gly Gly Gln Lys 545 550 555 560 Gln Arg Ile Ala Ile Ala Arg Ala Leu Val Arg Asn Pro Lys Ile Leu 565 570 575 Leu Leu Asp Glu Ala Thr Ser Ala Leu Asp Ala Glu Ser Glu Gly Ile 580 585 590 Val Gln Gln Ala Leu Asp Lys Ala Ala Lys Gly Arg Thr Thr Ile Ile 595 600 605 Ile Ala His Arg Leu Ser Thr Ile Arg Asn Ala Asp Leu Ile Ile Ser 610 615 620 Cys Lys Asn Gly Gln Val Val Glu Val Gly Asp His Arg Ala Leu Met 625 630 635 640 Ala Gln Gln Gly Leu Tyr Tyr Asp Leu Val Thr Ala Gln Thr Ala Thr 645 650 655 Asp His Val Asp Ser Glu Val Glu Arg Leu Lys Lys Gly Lys Phe Ser 660 665 670 Arg Glu Asn Ser Val Ala Arg Gln Thr Ser Glu His Glu Gly Leu Ser 675 680 685 Arg Gln Ala Ser Glu Met Asp Asp Ile Met Asn Arg Val Arg Ser Ser 690 695 700 Thr Ile Gly Ser Ile Thr Asn Gly Pro Val Ile Asp Glu Lys Glu Glu 705 710 715 720 Arg Ile Gly Lys Asp Ala Leu Ser Arg Leu Lys Gln Glu Leu Glu Glu 725 730 735 Asn Asn Ala Gln Lys Thr Asn Leu Phe Glu Ile Leu Tyr His Ala Arg 740 745 750 Pro His Ala Leu Ser Leu Phe Ile Gly Met Ser Thr Ala Thr Ile Gly 755 760 765 Gly Phe Ile Tyr Pro Thr Tyr Ser Val Phe Phe Thr Ser Phe Met Asn 770 775 780 Val Phe Ala Gly Asn Pro Ala Asp Phe Leu Ser Gln Gly His Phe Trp 785 790 795 800 Ala Leu Met Phe Leu Val Leu Ala Ala Ala Gln Gly Ile Cys Ser Phe 805 810 815 Leu Met Thr Phe Phe Met Gly Ile Ala Ser Glu Ser Leu Thr Arg Asp 820 825 830 Leu Arg Asn Lys Leu Phe Arg Asn Val Leu Ser Gln His Ile Gly Phe 835 840 845 Phe Asp Ser Pro Gln Asn Ala Ser Gly Lys Ile Ser Thr Arg Leu Ala 850 855 860 Thr Asp Val Pro Asn Leu Arg Thr Ala Ile Asp Phe Arg Phe Ser Thr 865 870 875 880 Val Ile Thr Thr Leu Val Ser Met Val Ala Gly Ile Gly Leu Ala Phe 885 890 895 Phe Tyr Gly Trp Gln Met Ala Leu Leu Ile Ile Ala Ile Leu Pro Ile 900 905 910 Val Ala Phe Gly Gln Tyr Leu Arg Gly Arg Arg Phe Thr Gly Lys Asn 915 920 925 Val Lys Ser Ala Ser Glu Phe Ala Asp Ser Gly Lys Ile Ala Ile Glu 930 935 940 Ala Ile Glu Asn Val Arg Thr Val Gln Ala Leu Ala Arg Glu Asp Thr 945 950 955 960 Phe Tyr Glu Asn Phe Cys Glu Lys Leu Asp Ile Pro His Lys Glu Ala 965 970 975 Ile Lys Glu Ala Phe Ile Gln Gly Leu Ser Tyr Gly Cys Ala Ser Ser 980 985 990 Val Leu Tyr Leu Leu Asn Thr Cys Ala Tyr Arg Met Gly Leu Ala Leu 995 1000 1005 Ile Ile Thr Asp Pro Pro Thr Met Gln Pro Met Arg Val Leu Arg Val 1010 1015 1020 Met Tyr Ala Ile Thr Ile Ser Thr Ser Thr Leu Gly Phe Ala Thr Ser 1025 1030 1035 1040 Tyr Phe Pro Glu Tyr Ala Lys Ala Thr Phe Ala Gly Gly Ile Ile Phe 1045 1050 1055 Gly Met Leu Arg Lys Ile Ser Lys Ile Asp Ser Leu Ser Leu Ala Gly 1060 1065 1070 Glu Lys Lys Lys Leu Tyr Gly Lys Val Ile Phe Lys Asn Val Arg Phe 1075 1080 1085 Ala Tyr Pro Glu Arg Pro Glu Ile Glu Ile Leu Lys Gly Leu Ser Phe 1090 1095 1100 Ser Val Glu Pro Gly Gln Thr Leu Ala Leu Val Gly Pro Ser Gly Cys 1105 1110 1115 1120 Gly Lys Ser Thr Val Val Ala Leu Leu Glu Arg Phe Tyr Asp Thr Leu 1125 1130 1135 Gly Gly Glu Ile Phe Ile Asp Gly Ser Glu Ile Lys Thr Leu Asn Pro 1140 1145 1150 Glu His Thr Arg Ser Gln Ile Ala Ile Val Ser Gln Glu Pro Thr Leu 1155 1160 1165 Phe Asp Cys Ser Ile Ala Glu Asn Ile Ile Tyr Gly Leu Asp Pro Ser 1170 1175 1180 Ser Val Thr Met Ala Gln Val Glu Glu Ala Ala Arg Leu Ala Asn Ile 1185 1190 1195 1200 His Asn Phe Ile Ala Glu Leu Pro Glu Gly Phe Glu Thr Arg Val Gly 1205 1210 1215 Asp Arg Gly Thr Gln Leu Ser Gly Gly Gln Lys Gln Arg Ile Ala Ile 1220 1225 1230 Ala Arg Ala Leu Val Arg Asn Pro Lys Ile Leu Leu Leu Asp Glu Ala 1235 1240 1245 Thr Ser Ala Leu Asp Thr Glu Ser Glu Lys Val Val Gln Glu Ala Leu 1250 1255 1260 Asp Arg Ala Arg Glu Gly Arg Thr Cys Ile Val Ile Ala His Arg Leu 1265 1270 1275 1280 Asn Thr Val Met Asn Ala Asp Cys Ile Ala Val Val Ser Asn Gly Thr 1285 1290 1295 Ile Ile Glu Lys Gly Thr His Thr Gln Leu Met Ser Glu Lys Gly Ala 1300 1305 1310 Tyr Tyr Lys Leu Thr Gln Lys Gln Met Thr Glu Lys Lys 1315 1320 1325 <210> 10 <211> 1325 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of P-gp #3274 <400> 10 Met Leu Arg Asn Gly Ser Leu Arg Gln Ser Leu Arg Thr Leu Asp Ser 1 5 10 15 Phe Ser Leu Ala Pro Glu Asp Val Leu Lys Thr Ala Ile Lys Thr Val 20 25 30 Glu Asp Tyr Glu Gly Asp Asn Ile Asp Ser Asn Gly Glu Ile Lys Ile 35 40 45 Thr Arg Asp Ala Lys Glu Glu Val Val Asn Lys Val Ser Ile Pro Gln 50 55 60 Leu Tyr Arg Tyr Thr Thr Thr Leu Glu Lys Leu Leu Leu Phe Ile Gly 65 70 75 80 Thr Leu Val Ala Val Ile Thr Gly Ala Gly Leu Pro Leu Met Ser Ile 85 90 95 Leu Gln Gly Lys Val Ser Gln Ala Phe Ile Asn Glu Gln Ile Val Ile 100 105 110 Asn Asn Asn Gly Ser Thr Phe Leu Pro Thr Gly Gln Asn Tyr Thr Lys 115 120 125 Thr Asp Phe Glu His Asp Val Met Asn Val Val Trp Ser Tyr Ala Ala 130 135 140 Met Thr Val Gly Met Trp Ala Ala Gly Gln Ile Thr Val Thr Cys Tyr 145 150 155 160 Leu Tyr Val Ala Glu Gln Met Asn Asn Arg Leu Arg Arg Glu Phe Val 165 170 175 Lys Ser Ile Leu Arg Gln Glu Ile Ser Trp Phe Asp Thr Asn His Ser 180 185 190 Gly Thr Leu Ala Thr Lys Leu Phe Asp Asn Leu Glu Arg Val Lys Glu 195 200 205 Gly Thr Gly Asp Lys Ile Gly Met Ala Phe Gln Tyr Leu Ser Gln Phe 210 215 220 Ile Thr Gly Phe Ile Val Ala Phe Thr His Ser Trp Gln Leu Thr Leu 225 230 235 240 Val Met Leu Ala Val Thr Pro Ile Gln Ala Leu Cys Gly Phe Ala Ile 245 250 255 Ala Lys Ser Met Ser Thr Phe Ala Ile Arg Glu Thr Leu Arg Tyr Ala 260 265 270 Lys Ala Gly Lys Val Val Glu Glu Thr Ile Ser Ser Ile Arg Thr Val 275 280 285 Val Ser Leu Asn Gly Leu Arg Tyr Glu Leu Glu Arg Tyr Ser Thr Ala 290 295 300 Val Glu Glu Ala Lys Lys Ala Gly Val Leu Lys Gly Leu Phe Leu Gly 305 310 315 320 Ile Ser Phe Gly Ala Met Gln Ala Ser Asn Phe Ile Ser Phe Ala Leu 325 330 335 Ala Phe Tyr Ile Gly Val Gly Trp Val His Asp Gly Ser Leu Asn Phe 340 345 350 Gly Asp Met Leu Thr Thr Phe Ser Ser Val Met Met Gly Ser Met Ala 355 360 365 Leu Gly Leu Ala Gly Pro Gln Leu Ala Val Leu Gly Thr Ala Gln Gly 370 375 380 Ala Ala Ser Gly Ile Tyr Glu Val Leu Asp Arg Lys Pro Val Ile Asp 385 390 395 400 Ser Ser Ser Lys Ala Gly Arg Lys Asp Met Lys Ile Lys Gly Asp Ile 405 410 415 Thr Val Glu Asn Val His Phe Thr Tyr Pro Ser Arg Pro Asp Val Pro 420 425 430 Ile Leu Arg Gly Met Asn Leu Arg Val Asn Ala Gly Gln Thr Val Ala 435 440 445 Leu Val Gly Ser Ser Gly Cys Gly Lys Ser Thr Ile Ile Ser Leu Leu 450 455 460 Leu Arg Tyr Tyr Asp Val Leu Lys Gly Lys Ile Thr Ile Asp Gly Val 465 470 475 480 Asp Val Arg Asp Ile Asn Leu Glu Phe Leu Arg Lys Asn Val Ala Val 485 490 495 Val Ser Gln Glu Pro Ala Leu Phe Asn Cys Thr Ile Glu Glu Asn Ile 500 505 510 Ser Leu Gly Lys Glu Gly Ile Thr Arg Glu Glu Met Val Ala Ala Cys 515 520 525 Lys Met Ala Asn Ala Glu Lys Phe Ile Lys Thr Leu Pro Asn Gly Tyr 530 535 540 Asn Thr Leu Val Gly Asp Arg Gly Thr Gln Leu Ser Gly Gly Gln Lys 545 550 555 560 Gln Arg Ile Ala Ile Ala Arg Ala Leu Val Arg Asn Pro Lys Ile Leu 565 570 575 Leu Leu Asp Glu Ala Thr Ser Ala Leu Asp Ala Glu Ser Glu Gly Ile 580 585 590 Val Gln Gln Ala Leu Asp Lys Ala Ala Lys Gly Arg Thr Thr Ile Ile 595 600 605 Ile Ala His Arg Leu Ser Thr Ile Arg Asn Ala Asp Leu Ile Ile Ser 610 615 620 Cys Lys Asn Gly Gln Val Val Glu Val Gly Asp His Arg Ala Leu Met 625 630 635 640 Ala Gln Gln Gly Leu Tyr Tyr Asp Leu Val Thr Ala Gln Thr Thr Lys 645 650 655 Leu Asp Lys Ala Phe Ser Ser Leu Lys Ser Phe Gln Gly Lys Phe Ser 660 665 670 Arg Glu Asn Ser Val Ala Arg Gln Thr Ser Glu His Glu Gly Leu Ser 675 680 685 Arg Gln Ala Ser Glu Met Asp Asp Ile Met Asn Arg Val Arg Ser Ser 690 695 700 Thr Ile Gly Ser Ile Thr Asn Gly Pro Val Ile Asp Glu Lys Glu Glu 705 710 715 720 Arg Ile Gly Lys Asp Ala Leu Ser Arg Leu Lys Gln Glu Leu Glu Glu 725 730 735 Asn Asn Ala Gln Lys Thr Asn Leu Phe Glu Ile Leu Tyr His Ala Arg 740 745 750 Pro His Ala Leu Ser Leu Phe Ile Gly Met Ser Thr Ala Thr Ile Gly 755 760 765 Gly Phe Ile Tyr Pro Thr Tyr Ser Val Phe Phe Thr Ser Phe Met Asn 770 775 780 Val Phe Ala Gly Asn Pro Ala Asp Phe Leu Ser Gln Gly His Phe Trp 785 790 795 800 Ala Leu Met Phe Leu Val Leu Ala Ala Ala Gln Gly Ile Cys Ser Phe 805 810 815 Leu Met Thr Phe Phe Met Gly Ile Ala Ser Glu Ser Leu Thr Arg Asp 820 825 830 Leu Arg Asn Lys Leu Phe Arg Asn Val Leu Ser Gln His Ile Gly Phe 835 840 845 Phe Asp Ser Pro Gln Asn Ala Ser Gly Lys Ile Ser Thr Arg Leu Ala 850 855 860 Thr Asp Val Pro Asn Leu Arg Thr Ala Ile Asp Phe Arg Phe Ser Thr 865 870 875 880 Val Ile Thr Thr Leu Val Ser Met Val Ala Gly Ile Gly Leu Ala Phe 885 890 895 Phe Tyr Gly Trp Gln Met Ala Leu Leu Ile Ile Ala Ile Leu Pro Ile 900 905 910 Val Ala Phe Gly Gln Tyr Leu Arg Gly Arg Arg Phe Thr Gly Lys Asn 915 920 925 Val Lys Ser Ala Ser Glu Phe Ala Asp Ser Gly Lys Ile Ala Ile Glu 930 935 940 Ala Ile Glu Asn Val Arg Thr Val Gln Ala Leu Ala Arg Glu Asp Thr 945 950 955 960 Phe Tyr Glu Asn Phe Cys Glu Lys Leu Asp Ile Pro His Lys Glu Ala 965 970 975 Ile Lys Glu Ala Phe Ile Gln Gly Leu Ser Tyr Gly Cys Ala Ser Ser 980 985 990 Val Leu Tyr Leu Leu Asn Thr Cys Ala Tyr Arg Met Gly Leu Ala Leu 995 1000 1005 Ile Ile Thr Asp Pro Pro Thr Met Gln Pro Met Arg Val Leu Arg Val 1010 1015 1020 Met Tyr Ala Ile Thr Ile Ser Thr Ser Thr Leu Gly Phe Ala Thr Ser 1025 1030 1035 1040 Tyr Phe Pro Glu Tyr Ala Lys Ala Thr Phe Ala Gly Gly Ile Ile Phe 1045 1050 1055 Gly Met Leu Arg Lys Ile Ser Lys Ile Asp Ser Leu Ser Leu Ala Gly 1060 1065 1070 Glu Lys Lys Lys Leu Tyr Gly Lys Val Ile Phe Lys Asn Val Arg Phe 1075 1080 1085 Ala Tyr Pro Glu Arg Pro Glu Ile Glu Ile Leu Lys Gly Leu Ser Phe 1090 1095 1100 Ser Val Glu Pro Gly Gln Thr Leu Ala Leu Val Gly Pro Ser Gly Cys 1105 1110 1115 1120 Gly Lys Ser Thr Val Val Ala Leu Leu Glu Arg Phe Tyr Asp Thr Leu 1125 1130 1135 Gly Gly Glu Ile Phe Ile Asp Gly Ser Glu Ile Lys Thr Leu Asn Pro 1140 1145 1150 Glu His Thr Arg Ser Gln Ile Ala Ile Val Ser Gln Glu Pro Thr Leu 1155 1160 1165 Phe Asp Cys Ser Ile Ala Glu Asn Ile Ile Tyr Gly Leu Asp Pro Ser 1170 1175 1180 Ser Val Thr Met Ala Gln Val Glu Glu Ala Ala Arg Leu Ala Asn Ile 1185 1190 1195 1200 His Asn Phe Ile Ala Glu Leu Pro Glu Gly Phe Glu Thr Arg Val Gly 1205 1210 1215 Asp Arg Gly Thr Gln Leu Ser Gly Gly Gln Lys Gln Arg Ile Ala Ile 1220 1225 1230 Ala Arg Ala Leu Val Arg Asn Pro Lys Ile Leu Leu Leu Asp Glu Ala 1235 1240 1245 Thr Ser Ala Leu Asp Thr Glu Ser Glu Lys Val Val Gln Glu Ala Leu 1250 1255 1260 Asp Arg Ala Arg Glu Gly Arg Thr Cys Ile Val Ile Ala His Arg Leu 1265 1270 1275 1280 Asn Thr Val Met Asn Ala Asp Cys Ile Ala Val Val Ser Asn Gly Thr 1285 1290 1295 Ile Ile Glu Lys Gly Thr His Thr Gln Leu Met Ser Glu Lys Gly Ala 1300 1305 1310 Tyr Tyr Lys Leu Thr Gln Lys Gln Met Thr Glu Lys Lys 1315 1320 1325 <210> 11 <211> 632 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of ABCB6 #4038 <400> 11 Met Ala Pro Gly Leu Arg Pro Gln Ser Tyr Thr Leu Gln Val His Glu 1 5 10 15 Glu Asp Gln Asp Val Glu Arg Ser Gln Val Arg Ser Ala Ala Gln Gln 20 25 30 Ser Thr Trp Arg Asp Phe Gly Arg Lys Leu Arg Leu Leu Ser Gly Tyr 35 40 45 Leu Trp Pro Arg Gly Ser Pro Ala Leu Lys Leu Val Val Leu Ile Cys 50 55 60 Leu Gly Leu Met Gly Leu Glu Arg Ala Leu Asn Val Leu Val Pro Ile 65 70 75 80 Phe Tyr Arg Asn Ile Val Asn Leu Leu Thr Glu Lys Ala Pro Trp Asn 85 90 95 Ser Leu Ala Trp Thr Val Thr Ser Tyr Val Phe Leu Lys Phe Leu Gln 100 105 110 Gly Gly Gly Thr Gly Ser Thr Gly Phe Val Ser Asn Leu Arg Thr Phe 115 120 125 Leu Trp Ile Arg Val Gln Gln Phe Thr Ser Arg Arg Val Glu Leu Leu 130 135 140 Ile Phe Ser His Leu His Glu Leu Ser Leu Arg Trp His Leu Gly Arg 145 150 155 160 Arg Thr Gly Glu Val Leu Arg Ile Ala Asp Arg Gly Thr Ser Ser Val 165 170 175 Thr Gly Leu Leu Ser Tyr Leu Val Phe Asn Val Ile Pro Thr Leu Ala 180 185 190 Asp Ile Ile Ile Gly Ile Ile Tyr Phe Ser Met Phe Phe Asn Ala Trp 195 200 205 Phe Gly Leu Ile Val Phe Leu Cys Met Ser Leu Tyr Leu Thr Leu Thr 210 215 220 Ile Val Val Thr Glu Trp Arg Thr Lys Phe Arg Arg Ala Met Asn Thr 225 230 235 240 Gln Glu Asn Ala Thr Arg Ala Arg Ala Val Asp Ser Leu Leu Asn Phe 245 250 255 Glu Thr Val Lys Tyr Tyr Asn Ala Glu Ser Tyr Glu Val Glu Arg Tyr 260 265 270 Arg Glu Ala Ile Ile Lys Tyr Gln Gly Leu Glu Trp Lys Ser Ser Ala 275 280 285 Ser Leu Val Leu Leu Asn Gln Thr Gln Asn Leu Val Ile Gly Leu Gly 290 295 300 Leu Leu Ala Gly Ser Leu Leu Cys Ala Tyr Phe Val Thr Glu Gln Lys 305 310 315 320 Leu Gln Val Gly Asp Tyr Val Leu Phe Gly Thr Tyr Ile Ile Gln Leu 325 330 335 Tyr Met Pro Leu Asn Trp Phe Gly Thr Tyr Tyr Arg Met Ile Gln Thr 340 345 350 Asn Phe Ile Asp Met Glu Asn Met Phe Asp Leu Leu Lys Glu Glu Thr 355 360 365 Glu Val Lys Asp Leu Pro Gly Ala Gly Pro Leu Arg Phe Gln Lys Gly 370 375 380 Arg Ile Glu Phe Glu Asn Val His Phe Ser Tyr Ala Asp Gly Arg Glu 385 390 395 400 Thr Leu Gln Asp Val Ser Phe Thr Val Met Pro Gly Gln Thr Leu Ala 405 410 415 Leu Val Gly Pro Ser Gly Ala Gly Lys Ser Thr Ile Leu Arg Leu Leu 420 425 430 Phe Arg Phe Tyr Asp Ile Ser Ser Gly Cys Ile Arg Ile Asp Gly Gln 435 440 445 Asp Ile Ser Gln Val Thr Gln Ala Ser Leu Arg Ser His Ile Gly Val 450 455 460 Val Pro Gln Asp Thr Val Leu Phe Asn Asp Thr Ile Ala Asp Asn Ile 465 470 475 480 Arg Tyr Gly Arg Val Thr Ala Gly Asn Asp Glu Val Glu Ala Ala Ala 485 490 495 Gln Ala Ala Gly Ile His Asp Ala Ile Met Ala Phe Pro Glu Gly Tyr 500 505 510 Arg Thr Gln Val Gly Glu Arg Gly Leu Lys Leu Ser Gly Gly Glu Lys 515 520 525 Gln Arg Val Ala Ile Ala Arg Thr Ile Leu Lys Ala Pro Gly Ile Ile 530 535 540 Leu Leu Asp Gln Ala Thr Ser Ala Leu Asp Thr Ser Asn Glu Arg Ala 545 550 555 560 Ile Gln Ala Ser Leu Ala Lys Val Cys Ala Asn Arg Thr Thr Ile Val 565 570 575 Val Ala His Arg Leu Ser Thr Val Val Asn Ala Asp Gln Ile Leu Val 580 585 590 Ile Lys Asp Gly Cys Ile Val Glu Arg Gly Arg His Glu Ala Leu Leu 595 600 605 Ser Arg Gly Gly Val Tyr Ala Asp Met Trp Ala Leu Gln His Leu Glu 610 615 620 Asn Glu Val Ala Arg Leu Lys Lys 625 630 <210> 12 <211> 246 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of 3MNZ scFv <400> 12 Asp Pro Gln Ile Gln Leu Val Gln Ser Gly Pro Glu Leu Lys Lys Pro 1 5 10 15 Gly Glu Thr Val Lys Ile Ser Cys Lys Ala Ser Gly Tyr Thr Phe Thr 20 25 30 Asp Tyr Ser Val His Trp Val Lys Gln Val Pro Gly Lys Gly Leu Lys 35 40 45 Trp Met Gly Trp Ile Asn Thr Glu Thr Gly Glu Pro Thr Tyr Ala Asp 50 55 60 Asp Phe Lys Gly Arg Phe Ala Phe Ser Leu Glu Ser Ser Ala Ser Thr 65 70 75 80 Ala Tyr Leu Glu Ile His Asn Leu Thr Asn Glu Asp Thr Ala Thr Tyr 85 90 95 Phe Cys Ala Leu Gly Trp Leu His Trp Gly Leu Gly Thr Thr Leu Thr 100 105 110 Val Ser Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 115 120 125 Gly Ser Asp Ile Gln Leu Thr Gln Ser Pro Ser Ser Leu Ala Met Ser 130 135 140 Gly Gly Gln Lys Val Thr Met Arg Cys Lys Ser Ser Gln Ser Leu Leu 145 150 155 160 Asn Ser Arg Asn Glu Arg Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro 165 170 175 Gly Gln Ser Pro Lys Leu Leu Val Tyr Phe Ala Ser Ile Arg Glu Ser 180 185 190 Gly Val Pro Asp Arg Phe Ile Gly Ser Gly Ser Gly Thr Asp Phe Thr 195 200 205 Leu Thr Ile Ser Ser Val Gln Ala Glu Asp Leu Ala Asp Tyr Phe Cys 210 215 220 Leu Gln His Tyr Asn Thr Pro Trp Thr Phe Gly Gly Gly Thr Lys Leu 225 230 235 240 Glu Ile Lys Ser Gly Arg 245 <210> 13 <211> 118 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of 3LRH intrabody <400> 13 Gly Ser His Met Gly Ser Gln Pro Val Leu Thr Gln Ser Pro Ser Val 1 5 10 15 Ser Ala Ala Pro Arg Gln Arg Val Thr Ile Ser Val Ser Gly Ser Asn 20 25 30 Ser Asn Ile Gly Ser Asn Thr Val Asn Trp Ile Gln Gln Leu Pro Gly 35 40 45 Arg Ala Pro Glu Leu Leu Met Tyr Asp Asp Asp Leu Leu Ala Pro Gly 50 55 60 Val Ser Asp Arg Phe Ser Gly Ser Arg Ser Gly Thr Ser Ala Ser Leu 65 70 75 80 Thr Ile Ser Gly Leu Gln Ser Glu Asp Glu Ala Asp Tyr Tyr Ala Ala 85 90 95 Thr Trp Asp Asp Ser Leu Asn Gly Trp Val Phe Gly Gly Gly Thr Lys 100 105 110 Val Thr Val Leu Ser Ala 115 <210> 14 <211> 118 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of 3LRHcys intrabody <400> 14 Gly Ser His Met Gly Ser Gln Pro Val Leu Thr Gln Ser Pro Ser Val 1 5 10 15 Ser Ala Ala Pro Arg Gln Arg Val Thr Ile Ser Val Ser Gly Ser Asn 20 25 30 Ser Asn Ile Gly Ser Asn Thr Val Asn Trp Ile Gln Gln Leu Pro Gly 35 40 45 Arg Ala Pro Glu Leu Leu Met Cys Asp Asp Asp Leu Leu Ala Pro Gly 50 55 60 Val Ser Asp Arg Phe Ser Gly Ser Arg Ser Gly Thr Ser Ala Ser Leu 65 70 75 80 Thr Ile Ser Gly Leu Gln Ser Glu Asp Glu Ala Asp Tyr Tyr Ala Ala 85 90 95 Thr Trp Asp Asp Ser Leu Asn Gly Trp Val Phe Gly Gly Gly Thr Lys 100 105 110 Val Thr Val Leu Ser Ala 115 <210> 15 <211> 253 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of 1P4B scFv <400> 15 Met Ala Asp Tyr Ala Asp Ala Val Val Thr Gln Glu Ser Ala Leu Thr 1 5 10 15 Thr Ser Pro Gly Glu Thr Val Thr Leu Thr Cys Arg Ser Ser Thr Gly 20 25 30 Ala Val Thr Thr Ser Asn Tyr Ala Ser Trp Val Gln Glu Lys Pro Asp 35 40 45 His Leu Phe Thr Gly Leu Ile Gly Gly Thr Asn Asn Arg Ala Pro Gly 50 55 60 Val Pro Ala Arg Phe Ser Gly Ser Leu Ile Gly Asp Lys Ala Ala Leu 65 70 75 80 Thr Ile Thr Gly Ala Gln Thr Glu Asp Glu Ala Ile Tyr Phe Cys Ala 85 90 95 Leu Trp Tyr Ser Asn His Trp Val Phe Gly Gly Gly Thr Lys Leu Thr 100 105 110 Val Leu Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 115 120 125 Gly Ser Gly Gly Gly Gly Ser Asp Val Gln Leu Gln Gln Ser Gly Pro 130 135 140 Gly Leu Val Ala Pro Ser Gln Ser Leu Ser Ile Thr Cys Thr Val Ser 145 150 155 160 Gly Phe Ser Leu Thr Asp Tyr Gly Val Asn Trp Val Arg Gln Ser Pro 165 170 175 Gly Lys Gly Leu Glu Trp Leu Gly Val Ile Trp Gly Asp Gly Ile Thr 180 185 190 Asp Tyr Asn Ser Ala Leu Lys Ser Arg Leu Ser Val Thr Lys Asp Asn 195 200 205 Ser Lys Ser Gln Val Phe Leu Lys Met Asn Ser Leu Gln Ser Gly Asp 210 215 220 Ser Ala Arg Tyr Tyr Cys Val Thr Gly Leu Phe Asp Tyr Trp Gly Gln 225 230 235 240 Gly Thr Thr Leu Thr Val Ser Ser Ala Ser Gly Ala Asp 245 250 <210> 16 <211> 211 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of 1P4B Fab Heavy chain <400> 16 Asp Val Gln Leu Gln Gln Ser Gly Pro Gly Leu Val Ala Pro Ser Gln 1 5 10 15 Ser Leu Ser Ile Thr Cys Thr Val Ser Gly Phe Ser Leu Thr Asp Tyr 20 25 30 Gly Val Asn Trp Val Arg Gln Ser Pro Gly Lys Gly Leu Glu Trp Leu 35 40 45 Gly Val Ile Trp Gly Asp Gly Ile Thr Asp Tyr Asn Ser Ala Leu Lys 50 55 60 Ser Arg Leu Ser Val Thr Lys Asp Asn Ser Lys Ser Gln Val Phe Leu 65 70 75 80 Lys Met Asn Ser Leu Gln Ser Gly Asp Ser Ala Arg Tyr Tyr Cys Val 85 90 95 Thr Gly Leu Phe Asp Tyr Trp Gly Gln Gly Thr Thr Leu Thr Val Ser 100 105 110 Ser Arg Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Cys Ser 115 120 125 Ser Glu Ser Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro 130 135 140 Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val 145 150 155 160 His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser 165 170 175 Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Lys Thr Tyr Thr 180 185 190 Cys Asn Val Asp His Lys Pro Ser Asn Thr Lys Val Asp Lys Arg Val 195 200 205 His His His 210 <210> 17 <211> 222 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of 1P4B Fab Light chain <400> 17 Met Ala Asp Tyr Ala Asp Ala Val Val Thr Gln Glu Ser Ala Leu Thr 1 5 10 15 Thr Ser Pro Gly Glu Thr Val Thr Leu Thr Cys Arg Ser Ser Thr Gly 20 25 30 Ala Val Thr Thr Ser Asn Tyr Ala Ser Trp Val Gln Glu Lys Pro Asp 35 40 45 His Leu Phe Thr Gly Leu Ile Gly Gly Thr Asn Asn Arg Ala Pro Gly 50 55 60 Val Pro Ala Arg Phe Ser Gly Ser Leu Ile Gly Asp Lys Ala Ala Leu 65 70 75 80 Thr Ile Thr Gly Ala Gln Thr Glu Asp Glu Ala Ile Tyr Phe Cys Ala 85 90 95 Leu Trp Tyr Ser Asn His Trp Val Phe Gly Gly Gly Thr Lys Leu Thr 100 105 110 Val Leu Arg Ser Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro 115 120 125 Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu 130 135 140 Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn 145 150 155 160 Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser 165 170 175 Lys Asp Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala 180 185 190 Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly 195 200 205 Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys 210 215 220 <110> POSTECH ACADEMY-INDUSTRY FOUNDATION <120> Method for protein structure determination using an antibody that binds to alpha helix <130> MP19-230 <160> 17 <170> KoPatentIn 3.0 <210> 1 <211> 56 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of Protein A #8420 <400> 1 Gly Ser His Met Phe Asn Lys Asp Gln Gln Ser Ala Phe Tyr Glu Ile 1 5 10 15 Leu Asn Met Pro Asn Leu Asn Glu Ala Gln Arg Asn Gly Phe Ile Gln 20 25 30 Ser Leu Lys Asp Asp Pro Ser Gln Ser Thr Asn Val Leu Leu Glu Ala 35 40 45 Asp Lys Trp Ala Ser Leu Gln Asn 50 55 <210> 2 <211> 62 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of Protein A #8188 <400> 2 Gly Ser His Met Phe Asn Lys Asp Gln Gln Ser Ala Phe Tyr Glu Ile 1 5 10 15 Leu Asn Met Pro Asn Leu Asn Glu Ala Gln Arg Asn Gly Phe Ile Gln 20 25 30 Ser Leu Lys Asp Asp Pro Ser Gln Ser Thr Asn Val Leu Gly Glu Ala 35 40 45 Lys Lys Leu Asn Lys Ala Gln Ala Ser Leu Lys Ser Phe Gln 50 55 60 <210> 3 <211> 65 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of Protein A #8189 <400> 3 Gly Ser His Met Phe Asn Lys Asp Gln Gln Ser Ala Phe Tyr Glu Ile 1 5 10 15 Leu Asn Met Pro Asn Leu Asn Glu Ala Gln Arg Asn Gly Phe Ile Gln 20 25 30 Ser Leu Lys Asp Asp Pro Ser Gln Ser Thr Asn Val Leu Gly Glu Ala 35 40 45 Lys Lys Leu Asn Lys Leu Gln Lys Ala Phe Glu Ser Leu Lys Ser Phe 50 55 60 Gln 65 <210> 4 <211> 56 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of Protein A #8496 <400> 4 Met Glu Lys Leu Met Lys Ala Phe Gln Ser Leu Ala Phe Phe Glu Ile 1 5 10 15 Leu Asn Met Pro Asn Leu Asn Glu Ala Gln Arg Asn Gly Phe Ile Gln 20 25 30 Ser Leu Lys Asp Asp Pro Ser Gln Ser Thr Asn Val Leu Gly Glu Ala 35 40 45 Lys Lys Leu Asn Glu Ser Gln Ala 50 55 <210> 5 <211> 62 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of Protein A #8188cys <400> 5 Gly Ser His Met Phe Asn Lys Asp Gln Gln Ser Ala Phe Tyr Glu Ile 1 5 10 15 Leu Asn Met Pro Asn Leu Asn Glu Ala Gln Arg Asn Gly Phe Ile Gln 20 25 30 Ser Leu Lys Asp Asp Pro Ser Gln Ser Thr Asn Val Leu Gly Glu Ala 35 40 45 Lys Lys Leu Asn Lys Cys Gln Ala Ser Leu Lys Ser Phe Gln 50 55 60 <210> 6 <211> 87 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of Calmodulin #9011 <400> 6 Gly Ser His Met Glu Lys Leu Met Lys Ala Phe Glu Ser Leu Gln Ile 1 5 10 15 Phe Gln Phe Lys Glu Ala Phe Ser Leu Phe Asp Lys Asp Gly Asp Gly 20 25 30 Thr Ile Thr Thr Lys Glu Leu Gly Thr Val Met Arg Ser Leu Gly Gln 35 40 45 Asn Pro Thr Glu Ala Glu Leu Gln Asp Met Ile Asn Glu Val Asp Ala 50 55 60 Asp Gly Asn Gly Thr Ile Asp Phe Pro Glu Phe Leu Thr Met Met Ala 65 70 75 80 Arg Lys Met Lys Asp Thr Asp 85 <210> 7 <211> 189 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of T4 lysozyme #9213 <400> 7 Gly Ser His Met Asn Ile Phe Glu Met Leu Arg Ile Asp Glu Gly Leu 1 5 10 15 Arg Leu Lys Ile Tyr Lys Asp Thr Glu Gly Tyr Tyr Thr Ile Gly Ile 20 25 30 Gly His Leu Leu Thr Lys Ser Pro Val Glu Gly Gly Gly Gly Ser Gly 35 40 45 Gly Gly Gly Ser Glu Lys Leu Met Lys Ala Phe Glu Ser Leu Ser Leu 50 55 60 Phe Gln Ala Lys Ser Glu Leu Asp Lys Ala Ile Gly Arg Asn Thr Asn 65 70 75 80 Gly Val Ile Thr Lys Asp Glu Ala Glu Lys Leu Phe Asn Gln Asp Val 85 90 95 Asp Ala Ala Val Arg Gly Ile Leu Arg Asn Ala Lys Leu Lys Pro Val 100 105 110 Tyr Asp Ser Leu Asp Ala Val Arg Arg Ala Ala Leu Ile Asn Met Val 115 120 125 Phe Gln Met Gly Glu Thr Gly Val Ala Gly Phe Thr Asn Ser Leu Arg 130 135 140 Met Leu Gln Gln Lys Arg Trp Asp Glu Ala Ala Val Asn Leu Ala Lys 145 150 155 160 Ser Arg Trp Tyr Asn Gln Thr Pro Asn Arg Ala Lys Arg Val Ile Thr 165 170 175 Thr Phe Arg Thr Gly Thr Trp Asp Ala Tyr Ala Asn Leu 180 185 <210> 8 <211> 61 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of Protein A #9014 <400> 8 Gly Ser His Met Lys Glu Gln Gln Asn Ala Phe Tyr Glu Ile Leu His 1 5 10 15 Leu Pro Asn Leu Asn Glu Glu Gln Arg Asn Ala Phe Ile Gln Ser Leu 20 25 30 Lys Asp Asp Pro Ser Gln Ser Ala Asn Leu Leu Ala Glu Ala Lys Ala 35 40 45 Leu Asn His Leu Gln Asn Glu Val Ala Arg Leu Lys Lys 50 55 60 <210> 9 <211> 1325 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of P-gp #3273 <400> 9 Met Leu Arg Asn Gly Ser Leu Arg Gln Ser Leu Arg Thr Leu Asp Ser 1 5 10 15 Phe Ser Leu Ala Pro Glu Asp Val Leu Lys Thr Ala Ile Lys Thr Val 20 25 30 Glu Asp Tyr Glu Gly Asp Asn Ile Asp Ser Asn Gly Glu Ile Lys Ile 35 40 45 Thr Arg Asp Ala Lys Glu Glu Val Val Asn Lys Val Ser Ile Pro Gln 50 55 60 Leu Tyr Arg Tyr Thr Thr Thr Leu Glu Lys Leu Leu Leu Phe Ile Gly 65 70 75 80 Thr Leu Val Ala Val Ile Thr Gly Ala Gly Leu Pro Leu Met Ser Ile 85 90 95 Leu Gln Gly Lys Val Ser Gln Ala Phe Ile Asn Glu Gln Ile Val Ile 100 105 110 Asn Asn Asn Gly Ser Thr Phe Leu Pro Thr Gly Gln Asn Tyr Thr Lys 115 120 125 Thr Asp Phe Glu His Asp Val Met Asn Val Val Trp Ser Tyr Ala Ala 130 135 140 Met Thr Val Gly Met Trp Ala Ala Gly Gln Ile Thr Val Thr Cys Tyr 145 150 155 160 Leu Tyr Val Ala Glu Gln Met Asn Asn Arg Leu Arg Arg Glu Phe Val 165 170 175 Lys Ser Ile Leu Arg Gln Glu Ile Ser Trp Phe Asp Thr Asn His Ser 180 185 190 Gly Thr Leu Ala Thr Lys Leu Phe Asp Asn Leu Glu Arg Val Lys Glu 195 200 205 Gly Thr Gly Asp Lys Ile Gly Met Ala Phe Gln Tyr Leu Ser Gln Phe 210 215 220 Ile Thr Gly Phe Ile Val Ala Phe Thr His Ser Trp Gln Leu Thr Leu 225 230 235 240 Val Met Leu Ala Val Thr Pro Ile Gln Ala Leu Cys Gly Phe Ala Ile 245 250 255 Ala Lys Ser Met Ser Thr Phe Ala Ile Arg Glu Thr Leu Arg Tyr Ala 260 265 270 Lys Ala Gly Lys Val Val Glu Glu Thr Ile Ser Ser Ile Arg Thr Val 275 280 285 Val Ser Leu Asn Gly Leu Arg Tyr Glu Leu Glu Arg Tyr Ser Thr Ala 290 295 300 Val Glu Glu Ala Lys Lys Ala Gly Val Leu Lys Gly Leu Phe Leu Gly 305 310 315 320 Ile Ser Phe Gly Ala Met Gln Ala Ser Asn Phe Ile Ser Phe Ala Leu 325 330 335 Ala Phe Tyr Ile Gly Val Gly Trp Val His Asp Gly Ser Leu Asn Phe 340 345 350 Gly Asp Met Leu Thr Thr Phe Ser Ser Val Met Met Gly Ser Met Ala 355 360 365 Leu Gly Leu Ala Gly Pro Gln Leu Ala Val Leu Gly Thr Ala Gln Gly 370 375 380 Ala Ala Ser Gly Ile Tyr Glu Val Leu Asp Arg Lys Pro Val Ile Asp 385 390 395 400 Ser Ser Ser Lys Ala Gly Arg Lys Asp Met Lys Ile Lys Gly Asp Ile 405 410 415 Thr Val Glu Asn Val His Phe Thr Tyr Pro Ser Arg Pro Asp Val Pro 420 425 430 Ile Leu Arg Gly Met Asn Leu Arg Val Asn Ala Gly Gln Thr Val Ala 435 440 445 Leu Val Gly Ser Ser Gly Cys Gly Lys Ser Thr Ile Ile Ser Leu Leu 450 455 460 Leu Arg Tyr Tyr Asp Val Leu Lys Gly Lys Ile Thr Ile Asp Gly Val 465 470 475 480 Asp Val Arg Asp Ile Asn Leu Glu Phe Leu Arg Lys Asn Val Ala Val 485 490 495 Val Ser Gln Glu Pro Ala Leu Phe Asn Cys Thr Ile Glu Glu Asn Ile 500 505 510 Ser Leu Gly Lys Glu Gly Ile Thr Arg Glu Glu Met Val Ala Ala Cys 515 520 525 Lys Met Ala Asn Ala Glu Lys Phe Ile Lys Thr Leu Pro Asn Gly Tyr 530 535 540 Asn Thr Leu Val Gly Asp Arg Gly Thr Gln Leu Ser Gly Gly Gln Lys 545 550 555 560 Gln Arg Ile Ala Ile Ala Arg Ala Leu Val Arg Asn Pro Lys Ile Leu 565 570 575 Leu Leu Asp Glu Ala Thr Ser Ala Leu Asp Ala Glu Ser Glu Gly Ile 580 585 590 Val Gln Gln Ala Leu Asp Lys Ala Ala Lys Gly Arg Thr Thr Ile Ile 595 600 605 Ile Ala His Arg Leu Ser Thr Ile Arg Asn Ala Asp Leu Ile Ile Ser 610 615 620 Cys Lys Asn Gly Gln Val Val Glu Val Gly Asp His Arg Ala Leu Met 625 630 635 640 Ala Gln Gln Gly Leu Tyr Tyr Asp Leu Val Thr Ala Gln Thr Ala Thr 645 650 655 Asp His Val Asp Ser Glu Val Glu Arg Leu Lys Lys Gly Lys Phe Ser 660 665 670 Arg Glu Asn Ser Val Ala Arg Gln Thr Ser Glu His Glu Gly Leu Ser 675 680 685 Arg Gln Ala Ser Glu Met Asp Asp Ile Met Asn Arg Val Arg Ser Ser 690 695 700 Thr Ile Gly Ser Ile Thr Asn Gly Pro Val Ile Asp Glu Lys Glu Glu 705 710 715 720 Arg Ile Gly Lys Asp Ala Leu Ser Arg Leu Lys Gln Glu Leu Glu Glu 725 730 735 Asn Asn Ala Gln Lys Thr Asn Leu Phe Glu Ile Leu Tyr His Ala Arg 740 745 750 Pro His Ala Leu Ser Leu Phe Ile Gly Met Ser Thr Ala Thr Ile Gly 755 760 765 Gly Phe Ile Tyr Pro Thr Tyr Ser Val Phe Phe Thr Ser Phe Met Asn 770 775 780 Val Phe Ala Gly Asn Pro Ala Asp Phe Leu Ser Gln Gly His Phe Trp 785 790 795 800 Ala Leu Met Phe Leu Val Leu Ala Ala Ala Gln Gly Ile Cys Ser Phe 805 810 815 Leu Met Thr Phe Phe Met Gly Ile Ala Ser Glu Ser Leu Thr Arg Asp 820 825 830 Leu Arg Asn Lys Leu Phe Arg Asn Val Leu Ser Gln His Ile Gly Phe 835 840 845 Phe Asp Ser Pro Gln Asn Ala Ser Gly Lys Ile Ser Thr Arg Leu Ala 850 855 860 Thr Asp Val Pro Asn Leu Arg Thr Ala Ile Asp Phe Arg Phe Ser Thr 865 870 875 880 Val Ile Thr Thr Leu Val Ser Met Val Ala Gly Ile Gly Leu Ala Phe 885 890 895 Phe Tyr Gly Trp Gln Met Ala Leu Leu Ile Ile Ala Ile Leu Pro Ile 900 905 910 Val Ala Phe Gly Gln Tyr Leu Arg Gly Arg Arg Phe Thr Gly Lys Asn 915 920 925 Val Lys Ser Ala Ser Glu Phe Ala Asp Ser Gly Lys Ile Ala Ile Glu 930 935 940 Ala Ile Glu Asn Val Arg Thr Val Gln Ala Leu Ala Arg Glu Asp Thr 945 950 955 960 Phe Tyr Glu Asn Phe Cys Glu Lys Leu Asp Ile Pro His Lys Glu Ala 965 970 975 Ile Lys Glu Ala Phe Ile Gln Gly Leu Ser Tyr Gly Cys Ala Ser Ser 980 985 990 Val Leu Tyr Leu Leu Asn Thr Cys Ala Tyr Arg Met Gly Leu Ala Leu 995 1000 1005 Ile Ile Thr Asp Pro Pro Thr Met Gln Pro Met Arg Val Leu Arg Val 1010 1015 1020 Met Tyr Ala Ile Thr Ile Ser Thr Ser Thr Leu Gly Phe Ala Thr Ser 1025 1030 1035 1040 Tyr Phe Pro Glu Tyr Ala Lys Ala Thr Phe Ala Gly Gly Ile Ile Phe 1045 1050 1055 Gly Met Leu Arg Lys Ile Ser Lys Ile Asp Ser Leu Ser Leu Ala Gly 1060 1065 1070 Glu Lys Lys Lys Leu Tyr Gly Lys Val Ile Phe Lys Asn Val Arg Phe 1075 1080 1085 Ala Tyr Pro Glu Arg Pro Glu Ile Glu Ile Leu Lys Gly Leu Ser Phe 1090 1095 1100 Ser Val Glu Pro Gly Gln Thr Leu Ala Leu Val Gly Pro Ser Gly Cys 1105 1110 1115 1120 Gly Lys Ser Thr Val Val Ala Leu Leu Glu Arg Phe Tyr Asp Thr Leu 1125 1130 1135 Gly Gly Glu Ile Phe Ile Asp Gly Ser Glu Ile Lys Thr Leu Asn Pro 1140 1145 1150 Glu His Thr Arg Ser Gln Ile Ala Ile Val Ser Gln Glu Pro Thr Leu 1155 1160 1165 Phe Asp Cys Ser Ile Ala Glu Asn Ile Ile Tyr Gly Leu Asp Pro Ser 1170 1175 1180 Ser Val Thr Met Ala Gln Val Glu Glu Ala Ala Arg Leu Ala Asn Ile 1185 1190 1195 1200 His Asn Phe Ile Ala Glu Leu Pro Glu Gly Phe Glu Thr Arg Val Gly 1205 1210 1215 Asp Arg Gly Thr Gln Leu Ser Gly Gly Gln Lys Gln Arg Ile Ala Ile 1220 1225 1230 Ala Arg Ala Leu Val Arg Asn Pro Lys Ile Leu Leu Leu Asp Glu Ala 1235 1240 1245 Thr Ser Ala Leu Asp Thr Glu Ser Glu Lys Val Val Gln Glu Ala Leu 1250 1255 1260 Asp Arg Ala Arg Glu Gly Arg Thr Cys Ile Val Ile Ala His Arg Leu 1265 1270 1275 1280 Asn Thr Val Met Asn Ala Asp Cys Ile Ala Val Val Ser Asn Gly Thr 1285 1290 1295 Ile Ile Glu Lys Gly Thr His Thr Gln Leu Met Ser Glu Lys Gly Ala 1300 1305 1310 Tyr Tyr Lys Leu Thr Gln Lys Gln Met Thr Glu Lys Lys 1315 1320 1325 <210> 10 <211> 1325 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of P-gp #3274 <400> 10 Met Leu Arg Asn Gly Ser Leu Arg Gln Ser Leu Arg Thr Leu Asp Ser 1 5 10 15 Phe Ser Leu Ala Pro Glu Asp Val Leu Lys Thr Ala Ile Lys Thr Val 20 25 30 Glu Asp Tyr Glu Gly Asp Asn Ile Asp Ser Asn Gly Glu Ile Lys Ile 35 40 45 Thr Arg Asp Ala Lys Glu Glu Val Val Asn Lys Val Ser Ile Pro Gln 50 55 60 Leu Tyr Arg Tyr Thr Thr Thr Leu Glu Lys Leu Leu Leu Phe Ile Gly 65 70 75 80 Thr Leu Val Ala Val Ile Thr Gly Ala Gly Leu Pro Leu Met Ser Ile 85 90 95 Leu Gln Gly Lys Val Ser Gln Ala Phe Ile Asn Glu Gln Ile Val Ile 100 105 110 Asn Asn Asn Gly Ser Thr Phe Leu Pro Thr Gly Gln Asn Tyr Thr Lys 115 120 125 Thr Asp Phe Glu His Asp Val Met Asn Val Val Trp Ser Tyr Ala Ala 130 135 140 Met Thr Val Gly Met Trp Ala Ala Gly Gln Ile Thr Val Thr Cys Tyr 145 150 155 160 Leu Tyr Val Ala Glu Gln Met Asn Asn Arg Leu Arg Arg Glu Phe Val 165 170 175 Lys Ser Ile Leu Arg Gln Glu Ile Ser Trp Phe Asp Thr Asn His Ser 180 185 190 Gly Thr Leu Ala Thr Lys Leu Phe Asp Asn Leu Glu Arg Val Lys Glu 195 200 205 Gly Thr Gly Asp Lys Ile Gly Met Ala Phe Gln Tyr Leu Ser Gln Phe 210 215 220 Ile Thr Gly Phe Ile Val Ala Phe Thr His Ser Trp Gln Leu Thr Leu 225 230 235 240 Val Met Leu Ala Val Thr Pro Ile Gln Ala Leu Cys Gly Phe Ala Ile 245 250 255 Ala Lys Ser Met Ser Thr Phe Ala Ile Arg Glu Thr Leu Arg Tyr Ala 260 265 270 Lys Ala Gly Lys Val Val Glu Glu Thr Ile Ser Ser Ile Arg Thr Val 275 280 285 Val Ser Leu Asn Gly Leu Arg Tyr Glu Leu Glu Arg Tyr Ser Thr Ala 290 295 300 Val Glu Glu Ala Lys Lys Ala Gly Val Leu Lys Gly Leu Phe Leu Gly 305 310 315 320 Ile Ser Phe Gly Ala Met Gln Ala Ser Asn Phe Ile Ser Phe Ala Leu 325 330 335 Ala Phe Tyr Ile Gly Val Gly Trp Val His Asp Gly Ser Leu Asn Phe 340 345 350 Gly Asp Met Leu Thr Thr Phe Ser Ser Val Met Met Gly Ser Met Ala 355 360 365 Leu Gly Leu Ala Gly Pro Gln Leu Ala Val Leu Gly Thr Ala Gln Gly 370 375 380 Ala Ala Ser Gly Ile Tyr Glu Val Leu Asp Arg Lys Pro Val Ile Asp 385 390 395 400 Ser Ser Ser Lys Ala Gly Arg Lys Asp Met Lys Ile Lys Gly Asp Ile 405 410 415 Thr Val Glu Asn Val His Phe Thr Tyr Pro Ser Arg Pro Asp Val Pro 420 425 430 Ile Leu Arg Gly Met Asn Leu Arg Val Asn Ala Gly Gln Thr Val Ala 435 440 445 Leu Val Gly Ser Ser Gly Cys Gly Lys Ser Thr Ile Ile Ser Leu Leu 450 455 460 Leu Arg Tyr Tyr Asp Val Leu Lys Gly Lys Ile Thr Ile Asp Gly Val 465 470 475 480 Asp Val Arg Asp Ile Asn Leu Glu Phe Leu Arg Lys Asn Val Ala Val 485 490 495 Val Ser Gln Glu Pro Ala Leu Phe Asn Cys Thr Ile Glu Glu Asn Ile 500 505 510 Ser Leu Gly Lys Glu Gly Ile Thr Arg Glu Glu Met Val Ala Ala Cys 515 520 525 Lys Met Ala Asn Ala Glu Lys Phe Ile Lys Thr Leu Pro Asn Gly Tyr 530 535 540 Asn Thr Leu Val Gly Asp Arg Gly Thr Gln Leu Ser Gly Gly Gln Lys 545 550 555 560 Gln Arg Ile Ala Ile Ala Arg Ala Leu Val Arg Asn Pro Lys Ile Leu 565 570 575 Leu Leu Asp Glu Ala Thr Ser Ala Leu Asp Ala Glu Ser Glu Gly Ile 580 585 590 Val Gln Gln Ala Leu Asp Lys Ala Ala Lys Gly Arg Thr Thr Ile Ile 595 600 605 Ile Ala His Arg Leu Ser Thr Ile Arg Asn Ala Asp Leu Ile Ile Ser 610 615 620 Cys Lys Asn Gly Gln Val Val Glu Val Gly Asp His Arg Ala Leu Met 625 630 635 640 Ala Gln Gln Gly Leu Tyr Tyr Asp Leu Val Thr Ala Gln Thr Thr Lys 645 650 655 Leu Asp Lys Ala Phe Ser Ser Leu Lys Ser Phe Gln Gly Lys Phe Ser 660 665 670 Arg Glu Asn Ser Val Ala Arg Gln Thr Ser Glu His Glu Gly Leu Ser 675 680 685 Arg Gln Ala Ser Glu Met Asp Asp Ile Met Asn Arg Val Arg Ser Ser 690 695 700 Thr Ile Gly Ser Ile Thr Asn Gly Pro Val Ile Asp Glu Lys Glu Glu 705 710 715 720 Arg Ile Gly Lys Asp Ala Leu Ser Arg Leu Lys Gln Glu Leu Glu Glu 725 730 735 Asn Asn Ala Gln Lys Thr Asn Leu Phe Glu Ile Leu Tyr His Ala Arg 740 745 750 Pro His Ala Leu Ser Leu Phe Ile Gly Met Ser Thr Ala Thr Ile Gly 755 760 765 Gly Phe Ile Tyr Pro Thr Tyr Ser Val Phe Phe Thr Ser Phe Met Asn 770 775 780 Val Phe Ala Gly Asn Pro Ala Asp Phe Leu Ser Gln Gly His Phe Trp 785 790 795 800 Ala Leu Met Phe Leu Val Leu Ala Ala Ala Gln Gly Ile Cys Ser Phe 805 810 815 Leu Met Thr Phe Phe Met Gly Ile Ala Ser Glu Ser Leu Thr Arg Asp 820 825 830 Leu Arg Asn Lys Leu Phe Arg Asn Val Leu Ser Gln His Ile Gly Phe 835 840 845 Phe Asp Ser Pro Gln Asn Ala Ser Gly Lys Ile Ser Thr Arg Leu Ala 850 855 860 Thr Asp Val Pro Asn Leu Arg Thr Ala Ile Asp Phe Arg Phe Ser Thr 865 870 875 880 Val Ile Thr Thr Leu Val Ser Met Val Ala Gly Ile Gly Leu Ala Phe 885 890 895 Phe Tyr Gly Trp Gln Met Ala Leu Leu Ile Ile Ala Ile Leu Pro Ile 900 905 910 Val Ala Phe Gly Gln Tyr Leu Arg Gly Arg Arg Phe Thr Gly Lys Asn 915 920 925 Val Lys Ser Ala Ser Glu Phe Ala Asp Ser Gly Lys Ile Ala Ile Glu 930 935 940 Ala Ile Glu Asn Val Arg Thr Val Gln Ala Leu Ala Arg Glu Asp Thr 945 950 955 960 Phe Tyr Glu Asn Phe Cys Glu Lys Leu Asp Ile Pro His Lys Glu Ala 965 970 975 Ile Lys Glu Ala Phe Ile Gln Gly Leu Ser Tyr Gly Cys Ala Ser Ser 980 985 990 Val Leu Tyr Leu Leu Asn Thr Cys Ala Tyr Arg Met Gly Leu Ala Leu 995 1000 1005 Ile Ile Thr Asp Pro Pro Thr Met Gln Pro Met Arg Val Leu Arg Val 1010 1015 1020 Met Tyr Ala Ile Thr Ile Ser Thr Ser Thr Leu Gly Phe Ala Thr Ser 1025 1030 1035 1040 Tyr Phe Pro Glu Tyr Ala Lys Ala Thr Phe Ala Gly Gly Ile Ile Phe 1045 1050 1055 Gly Met Leu Arg Lys Ile Ser Lys Ile Asp Ser Leu Ser Leu Ala Gly 1060 1065 1070 Glu Lys Lys Lys Leu Tyr Gly Lys Val Ile Phe Lys Asn Val Arg Phe 1075 1080 1085 Ala Tyr Pro Glu Arg Pro Glu Ile Glu Ile Leu Lys Gly Leu Ser Phe 1090 1095 1100 Ser Val Glu Pro Gly Gln Thr Leu Ala Leu Val Gly Pro Ser Gly Cys 1105 1110 1115 1120 Gly Lys Ser Thr Val Val Ala Leu Leu Glu Arg Phe Tyr Asp Thr Leu 1125 1130 1135 Gly Gly Glu Ile Phe Ile Asp Gly Ser Glu Ile Lys Thr Leu Asn Pro 1140 1145 1150 Glu His Thr Arg Ser Gln Ile Ala Ile Val Ser Gln Glu Pro Thr Leu 1155 1160 1165 Phe Asp Cys Ser Ile Ala Glu Asn Ile Ile Tyr Gly Leu Asp Pro Ser 1170 1175 1180 Ser Val Thr Met Ala Gln Val Glu Glu Ala Ala Arg Leu Ala Asn Ile 1185 1190 1195 1200 His Asn Phe Ile Ala Glu Leu Pro Glu Gly Phe Glu Thr Arg Val Gly 1205 1210 1215 Asp Arg Gly Thr Gln Leu Ser Gly Gly Gln Lys Gln Arg Ile Ala Ile 1220 1225 1230 Ala Arg Ala Leu Val Arg Asn Pro Lys Ile Leu Leu Leu Asp Glu Ala 1235 1240 1245 Thr Ser Ala Leu Asp Thr Glu Ser Glu Lys Val Val Gln Glu Ala Leu 1250 1255 1260 Asp Arg Ala Arg Glu Gly Arg Thr Cys Ile Val Ile Ala His Arg Leu 1265 1270 1275 1280 Asn Thr Val Met Asn Ala Asp Cys Ile Ala Val Val Ser Asn Gly Thr 1285 1290 1295 Ile Ile Glu Lys Gly Thr His Thr Gln Leu Met Ser Glu Lys Gly Ala 1300 1305 1310 Tyr Tyr Lys Leu Thr Gln Lys Gln Met Thr Glu Lys Lys 1315 1320 1325 <210> 11 <211> 632 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of ABCB6 #4038 <400> 11 Met Ala Pro Gly Leu Arg Pro Gln Ser Tyr Thr Leu Gln Val His Glu 1 5 10 15 Glu Asp Gln Asp Val Glu Arg Ser Gln Val Arg Ser Ala Ala Gln Gln 20 25 30 Ser Thr Trp Arg Asp Phe Gly Arg Lys Leu Arg Leu Leu Ser Gly Tyr 35 40 45 Leu Trp Pro Arg Gly Ser Pro Ala Leu Lys Leu Val Val Leu Ile Cys 50 55 60 Leu Gly Leu Met Gly Leu Glu Arg Ala Leu Asn Val Leu Val Pro Ile 65 70 75 80 Phe Tyr Arg Asn Ile Val Asn Leu Leu Thr Glu Lys Ala Pro Trp Asn 85 90 95 Ser Leu Ala Trp Thr Val Thr Ser Tyr Val Phe Leu Lys Phe Leu Gln 100 105 110 Gly Gly Gly Thr Gly Ser Thr Gly Phe Val Ser Asn Leu Arg Thr Phe 115 120 125 Leu Trp Ile Arg Val Gln Gln Phe Thr Ser Arg Arg Val Glu Leu Leu 130 135 140 Ile Phe Ser His Leu His Glu Leu Ser Leu Arg Trp His Leu Gly Arg 145 150 155 160 Arg Thr Gly Glu Val Leu Arg Ile Ala Asp Arg Gly Thr Ser Ser Val 165 170 175 Thr Gly Leu Leu Ser Tyr Leu Val Phe Asn Val Ile Pro Thr Leu Ala 180 185 190 Asp Ile Ile Ile Gly Ile Ile Tyr Phe Ser Met Phe Phe Asn Ala Trp 195 200 205 Phe Gly Leu Ile Val Phe Leu Cys Met Ser Leu Tyr Leu Thr Leu Thr 210 215 220 Ile Val Val Thr Glu Trp Arg Thr Lys Phe Arg Arg Ala Met Asn Thr 225 230 235 240 Gln Glu Asn Ala Thr Arg Ala Arg Ala Val Asp Ser Leu Leu Asn Phe 245 250 255 Glu Thr Val Lys Tyr Tyr Asn Ala Glu Ser Tyr Glu Val Glu Arg Tyr 260 265 270 Arg Glu Ala Ile Ile Lys Tyr Gln Gly Leu Glu Trp Lys Ser Ser Ala 275 280 285 Ser Leu Val Leu Leu Asn Gln Thr Gln Asn Leu Val Ile Gly Leu Gly 290 295 300 Leu Leu Ala Gly Ser Leu Leu Cys Ala Tyr Phe Val Thr Glu Gln Lys 305 310 315 320 Leu Gln Val Gly Asp Tyr Val Leu Phe Gly Thr Tyr Ile Ile Gln Leu 325 330 335 Tyr Met Pro Leu Asn Trp Phe Gly Thr Tyr Tyr Arg Met Ile Gln Thr 340 345 350 Asn Phe Ile Asp Met Glu Asn Met Phe Asp Leu Leu Lys Glu Glu Thr 355 360 365 Glu Val Lys Asp Leu Pro Gly Ala Gly Pro Leu Arg Phe Gln Lys Gly 370 375 380 Arg Ile Glu Phe Glu Asn Val His Phe Ser Tyr Ala Asp Gly Arg Glu 385 390 395 400 Thr Leu Gln Asp Val Ser Phe Thr Val Met Pro Gly Gln Thr Leu Ala 405 410 415 Leu Val Gly Pro Ser Gly Ala Gly Lys Ser Thr Ile Leu Arg Leu Leu 420 425 430 Phe Arg Phe Tyr Asp Ile Ser Ser Gly Cys Ile Arg Ile Asp Gly Gln 435 440 445 Asp Ile Ser Gln Val Thr Gln Ala Ser Leu Arg Ser His Ile Gly Val 450 455 460 Val Pro Gln Asp Thr Val Leu Phe Asn Asp Thr Ile Ala Asp Asn Ile 465 470 475 480 Arg Tyr Gly Arg Val Thr Ala Gly Asn Asp Glu Val Glu Ala Ala Ala 485 490 495 Gln Ala Ala Gly Ile His Asp Ala Ile Met Ala Phe Pro Glu Gly Tyr 500 505 510 Arg Thr Gln Val Gly Glu Arg Gly Leu Lys Leu Ser Gly Gly Glu Lys 515 520 525 Gln Arg Val Ala Ile Ala Arg Thr Ile Leu Lys Ala Pro Gly Ile Ile 530 535 540 Leu Leu Asp Gln Ala Thr Ser Ala Leu Asp Thr Ser Asn Glu Arg Ala 545 550 555 560 Ile Gln Ala Ser Leu Ala Lys Val Cys Ala Asn Arg Thr Thr Ile Val 565 570 575 Val Ala His Arg Leu Ser Thr Val Val Asn Ala Asp Gln Ile Leu Val 580 585 590 Ile Lys Asp Gly Cys Ile Val Glu Arg Gly Arg His Glu Ala Leu Leu 595 600 605 Ser Arg Gly Gly Val Tyr Ala Asp Met Trp Ala Leu Gln His Leu Glu 610 615 620 Asn Glu Val Ala Arg Leu Lys Lys 625 630 <210> 12 <211> 246 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of 3MNZ scFv <400> 12 Asp Pro Gln Ile Gln Leu Val Gln Ser Gly Pro Glu Leu Lys Lys Pro 1 5 10 15 Gly Glu Thr Val Lys Ile Ser Cys Lys Ala Ser Gly Tyr Thr Phe Thr 20 25 30 Asp Tyr Ser Val His Trp Val Lys Gln Val Pro Gly Lys Gly Leu Lys 35 40 45 Trp Met Gly Trp Ile Asn Thr Glu Thr Gly Glu Pro Thr Tyr Ala Asp 50 55 60 Asp Phe Lys Gly Arg Phe Ala Phe Ser Leu Glu Ser Ser Ala Ser Thr 65 70 75 80 Ala Tyr Leu Glu Ile His Asn Leu Thr Asn Glu Asp Thr Ala Thr Tyr 85 90 95 Phe Cys Ala Leu Gly Trp Leu His Trp Gly Leu Gly Thr Thr Leu Thr 100 105 110 Val Ser Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 115 120 125 Gly Ser Asp Ile Gln Leu Thr Gln Ser Pro Ser Ser Leu Ala Met Ser 130 135 140 Gly Gly Gln Lys Val Thr Met Arg Cys Lys Ser Ser Gln Ser Leu Leu 145 150 155 160 Asn Ser Arg Asn Glu Arg Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro 165 170 175 Gly Gln Ser Pro Lys Leu Leu Val Tyr Phe Ala Ser Ile Arg Glu Ser 180 185 190 Gly Val Pro Asp Arg Phe Ile Gly Ser Gly Ser Gly Thr Asp Phe Thr 195 200 205 Leu Thr Ile Ser Ser Val Gln Ala Glu Asp Leu Ala Asp Tyr Phe Cys 210 215 220 Leu Gln His Tyr Asn Thr Pro Trp Thr Phe Gly Gly Gly Thr Lys Leu 225 230 235 240 Glu Ile Lys Ser Gly Arg 245 <210> 13 <211> 118 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of 3LRH intrabody <400> 13 Gly Ser His Met Gly Ser Gln Pro Val Leu Thr Gln Ser Pro Ser Val 1 5 10 15 Ser Ala Ala Pro Arg Gln Arg Val Thr Ile Ser Val Ser Gly Ser Asn 20 25 30 Ser Asn Ile Gly Ser Asn Thr Val Asn Trp Ile Gln Gln Leu Pro Gly 35 40 45 Arg Ala Pro Glu Leu Leu Met Tyr Asp Asp Asp Leu Leu Ala Pro Gly 50 55 60 Val Ser Asp Arg Phe Ser Gly Ser Arg Ser Gly Thr Ser Ala Ser Leu 65 70 75 80 Thr Ile Ser Gly Leu Gln Ser Glu Asp Glu Ala Asp Tyr Tyr Ala Ala 85 90 95 Thr Trp Asp Asp Ser Leu Asn Gly Trp Val Phe Gly Gly Gly Thr Lys 100 105 110 Val Thr Val Leu Ser Ala 115 <210> 14 <211> 118 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of 3LRHcys intrabody <400> 14 Gly Ser His Met Gly Ser Gln Pro Val Leu Thr Gln Ser Pro Ser Val 1 5 10 15 Ser Ala Ala Pro Arg Gln Arg Val Thr Ile Ser Val Ser Gly Ser Asn 20 25 30 Ser Asn Ile Gly Ser Asn Thr Val Asn Trp Ile Gln Gln Leu Pro Gly 35 40 45 Arg Ala Pro Glu Leu Leu Met Cys Asp Asp Asp Leu Leu Ala Pro Gly 50 55 60 Val Ser Asp Arg Phe Ser Gly Ser Arg Ser Gly Thr Ser Ala Ser Leu 65 70 75 80 Thr Ile Ser Gly Leu Gln Ser Glu Asp Glu Ala Asp Tyr Tyr Ala Ala 85 90 95 Thr Trp Asp Asp Ser Leu Asn Gly Trp Val Phe Gly Gly Gly Thr Lys 100 105 110 Val Thr Val Leu Ser Ala 115 <210> 15 <211> 253 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of 1P4B scFv <400> 15 Met Ala Asp Tyr Ala Asp Ala Val Val Thr Gln Glu Ser Ala Leu Thr 1 5 10 15 Thr Ser Pro Gly Glu Thr Val Thr Leu Thr Cys Arg Ser Ser Thr Gly 20 25 30 Ala Val Thr Thr Ser Asn Tyr Ala Ser Trp Val Gln Glu Lys Pro Asp 35 40 45 His Leu Phe Thr Gly Leu Ile Gly Gly Thr Asn Asn Arg Ala Pro Gly 50 55 60 Val Pro Ala Arg Phe Ser Gly Ser Leu Ile Gly Asp Lys Ala Ala Leu 65 70 75 80 Thr Ile Thr Gly Ala Gln Thr Glu Asp Glu Ala Ile Tyr Phe Cys Ala 85 90 95 Leu Trp Tyr Ser Asn His Trp Val Phe Gly Gly Gly Thr Lys Leu Thr 100 105 110 Val Leu Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 115 120 125 Gly Ser Gly Gly Gly Gly Ser Asp Val Gln Leu Gln Gln Ser Gly Pro 130 135 140 Gly Leu Val Ala Pro Ser Gln Ser Leu Ser Ile Thr Cys Thr Val Ser 145 150 155 160 Gly Phe Ser Leu Thr Asp Tyr Gly Val Asn Trp Val Arg Gln Ser Pro 165 170 175 Gly Lys Gly Leu Glu Trp Leu Gly Val Ile Trp Gly Asp Gly Ile Thr 180 185 190 Asp Tyr Asn Ser Ala Leu Lys Ser Arg Leu Ser Val Thr Lys Asp Asn 195 200 205 Ser Lys Ser Gln Val Phe Leu Lys Met Asn Ser Leu Gln Ser Gly Asp 210 215 220 Ser Ala Arg Tyr Tyr Cys Val Thr Gly Leu Phe Asp Tyr Trp Gly Gln 225 230 235 240 Gly Thr Thr Leu Thr Val Ser Ser Ala Ser Gly Ala Asp 245 250 <210> 16 <211> 211 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of 1P4B Fab Heavy chain <400> 16 Asp Val Gln Leu Gln Gln Ser Gly Pro Gly Leu Val Ala Pro Ser Gln 1 5 10 15 Ser Leu Ser Ile Thr Cys Thr Val Ser Gly Phe Ser Leu Thr Asp Tyr 20 25 30 Gly Val Asn Trp Val Arg Gln Ser Pro Gly Lys Gly Leu Glu Trp Leu 35 40 45 Gly Val Ile Trp Gly Asp Gly Ile Thr Asp Tyr Asn Ser Ala Leu Lys 50 55 60 Ser Arg Leu Ser Val Thr Lys Asp Asn Ser Lys Ser Gln Val Phe Leu 65 70 75 80 Lys Met Asn Ser Leu Gln Ser Gly Asp Ser Ala Arg Tyr Tyr Cys Val 85 90 95 Thr Gly Leu Phe Asp Tyr Trp Gly Gln Gly Thr Thr Leu Thr Val Ser 100 105 110 Ser Arg Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Cys Ser 115 120 125 Ser Glu Ser Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro 130 135 140 Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val 145 150 155 160 His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser 165 170 175 Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Lys Thr Tyr Thr 180 185 190 Cys Asn Val Asp His Lys Pro Ser Asn Thr Lys Val Asp Lys Arg Val 195 200 205 His His His 210 <210> 17 <211> 222 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of 1P4B Fab Light chain <400> 17 Met Ala Asp Tyr Ala Asp Ala Val Val Thr Gln Glu Ser Ala Leu Thr 1 5 10 15 Thr Ser Pro Gly Glu Thr Val Thr Leu Thr Cys Arg Ser Ser Thr Gly 20 25 30 Ala Val Thr Thr Ser Asn Tyr Ala Ser Trp Val Gln Glu Lys Pro Asp 35 40 45 His Leu Phe Thr Gly Leu Ile Gly Gly Thr Asn Asn Arg Ala Pro Gly 50 55 60 Val Pro Ala Arg Phe Ser Gly Ser Leu Ile Gly Asp Lys Ala Ala Leu 65 70 75 80 Thr Ile Thr Gly Ala Gln Thr Glu Asp Glu Ala Ile Tyr Phe Cys Ala 85 90 95 Leu Trp Tyr Ser Asn His Trp Val Phe Gly Gly Gly Thr Lys Leu Thr 100 105 110 Val Leu Arg Ser Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro 115 120 125 Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu 130 135 140 Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn 145 150 155 160 Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser 165 170 175 Lys Asp Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala 180 185 190 Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly 195 200 205 Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys 210 215 220

Claims (10)

항나선(antihelix) 항체에 대한 에피토프(epitope)를 대상 단백질의 알파나선(alpha helix)에 생성하는 단계를 포함하고, 상기 에피토프의 아미노산 서열은 하기 (a) 내지 (c)의 조건 중 어느 하나 이상을 만족하는 것을 특징으로 하며:
(a) 상기 항나선 항체와 상호작용하는 핵심 아미노산을 포함함;
(b) 상기 대상 단백질의 소수성 코어(core) 아미노산을 포함함; 또는
(c) 상기 항나선 항체와 상기 대상 단백질의 상호작용 시 입체충돌(steric collision)이 유발되지 아니함,
이 때, 상기 항나선 항체는 서열번호 12, 서열번호 13, 서열번호 14, 서열번호 15, 서열번호 16, 및 서열번호 17로 이루어진 군으로부터 선택된 어느 하나 이상의 서열번호로 표시되는 아미노산 서열을 포함하는 것을 특징으로 하는, 대상 단백질의 구조 규명 방법.
It includes the step of generating an epitope for an antihelix antibody in the alpha helix of the target protein, and the amino acid sequence of the epitope is at least one of the conditions of the following (a) to (c). It is characterized by satisfying:
(a) contains key amino acids that interact with the anti-helix antibody;
(b) containing a hydrophobic core amino acid of the protein of interest; or
(c) no steric collision is caused when the anti-helix antibody interacts with the target protein,
In this case, the anti-helical antibody comprises an amino acid sequence represented by any one or more SEQ ID NOs selected from the group consisting of SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, and SEQ ID NO: 17 Characterized in that, the method for identifying the structure of the target protein.
제1항에 있어서,
하기의 단계 중 하나 이상의 단계를 더 포함하는 것을 특징으로 하는, 대상 단백질의 구조 규명 방법:
(S1) 에피토프가 생성된 상기 대상 단백질에 항나선 항체를 결합시켜 복합체를 형성시키는 단계;
(S2) 상기 복합체를 결정화하는 단계; 및
(S3) 결정화된 상기 복합체의 구조를 분석하는 단계.
The method of claim 1,
A method for determining the structure of a protein of interest, characterized in that it further comprises one or more of the following steps:
(S1) forming a complex by binding an anti-helix antibody to the target protein in which an epitope has been generated;
(S2) crystallizing the complex; And
(S3) analyzing the structure of the crystallized complex.
제1항에 있어서,
상기 (a)의 핵심 아미노산은, 아미노산을 구성하는 전체 원자 표면적의 30% 이상이 상기 항나선 항체와 접촉하는 것을 특징으로 하는, 대상 단백질의 구조 규명 방법.
The method of claim 1,
The core amino acid of (a) is characterized in that at least 30% of the total atomic surface area constituting the amino acid is in contact with the anti-helical antibody, a method for identifying the structure of a target protein.
제1항에 있어서,
상기 (b)의 소수성 코어 아미노산은, 아미노산을 구성하는 전체 원자 표면적의 70% 이상이 상기 대상 단백질 내의 다른 원자와 접촉하고 있는 것을 특징으로 하는, 대상 단백질의 구조 규명 방법.
The method of claim 1,
In the hydrophobic core amino acid of (b), at least 70% of the total atomic surface area constituting the amino acid is in contact with other atoms in the target protein.
제1항에 있어서,
상기 (c)의 입체충돌은 상기 항나선 항체와 상기 대상 단백질의 백본(backbone) 원자 사이의 거리가 3.5 옹스트롬(Å) 이내인 것을 특징으로 하는, 대상 단백질의 구조 규명 방법.
The method of claim 1,
The three-dimensional collision of (c) is characterized in that the distance between the anti-helical antibody and the backbone atoms of the target protein is within 3.5 angstroms (Å), the method for identifying the structure of the target protein.
제5항에 있어서,
상기 백본 원자는 아미노산의 알파(alpha) 탄소, 카복실기(carboxyl group) 또는 아미노기(amino group) 원자인 것을 특징으로 하는, 대상 단백질의 구조 규명 방법.
The method of claim 5,
The backbone atom is an alpha carbon, carboxyl group, or amino group atom of an amino acid.
제1항에 있어서,
상기 에피토프는 상기 대상 단백질의 C-말단 알파나선, N-말단 알파나선, 또는 내부 알파나선에 생성되는 것을 특징으로 하는, 대상 단백질의 구조 규명 방법.
The method of claim 1,
The epitope is characterized in that it is generated in the C-terminal alpha helix, the N-terminal alpha helix, or the internal alpha helix of the target protein.
제1항에 있어서,
상기 에피토프 서열의 생성은 합성 올리고뉴클레오타이드(oligonucleotides)를 이용한 PCR(polymerase chain reaction), OE(overlap extension)-PCR, 또는 상기 에피토프 서열을 포함하는 대상 단백질의 유전자 일부 또는 전부를 합성하는 것으로 달성되는 것을 특징으로 하는, 대상 단백질의 구조 규명 방법.
The method of claim 1,
The generation of the epitope sequence is achieved by synthesizing some or all of the genes of the target protein including the epitope sequence, PCR (polymerase chain reaction), OE (overlap extension)-PCR using synthetic oligonucleotides. Characterized in, a method for identifying the structure of a target protein.
삭제delete 삭제delete
KR1020190125045A 2019-10-10 2019-10-10 Method for protein structure determination using an antibody that binds to alpha helix KR102245733B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190125045A KR102245733B1 (en) 2019-10-10 2019-10-10 Method for protein structure determination using an antibody that binds to alpha helix

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190125045A KR102245733B1 (en) 2019-10-10 2019-10-10 Method for protein structure determination using an antibody that binds to alpha helix

Publications (2)

Publication Number Publication Date
KR20210042466A KR20210042466A (en) 2021-04-20
KR102245733B1 true KR102245733B1 (en) 2021-04-28

Family

ID=75721138

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190125045A KR102245733B1 (en) 2019-10-10 2019-10-10 Method for protein structure determination using an antibody that binds to alpha helix

Country Status (1)

Country Link
KR (1) KR102245733B1 (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008505048A (en) 2003-09-19 2008-02-21 ザ スクリップス リサーチ インスティテュート Peptides that bind to the broadly neutralizing anti-HIV antibody structure of the 4E10 Fab fragment complex, their use, compositions derived therefrom

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0949836A (en) * 1995-08-08 1997-02-18 Hitachi Ltd Method for evaluating structure of protein by using antibody
KR101426823B1 (en) 2013-01-24 2014-08-05 한국해양과학기술원 Methods of determination of protein structure by using zinc
KR102140557B1 (en) * 2018-03-30 2020-08-03 한국과학기술원 Peptides for forming protein-protein conjugate and the method for forming protein-protein conjugate using the same

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008505048A (en) 2003-09-19 2008-02-21 ザ スクリップス リサーチ インスティテュート Peptides that bind to the broadly neutralizing anti-HIV antibody structure of the 4E10 Fab fragment complex, their use, compositions derived therefrom

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Nat Methods, (2019.09.), Vol. 16, pp 958.
PNAS, 1999, Vol. 96, pp 13679-13684.

Also Published As

Publication number Publication date
KR20210042466A (en) 2021-04-20

Similar Documents

Publication Publication Date Title
Hudalla et al. Gradated assembly of multiple proteins into supramolecular nanomaterials
Hakanpää et al. Two crystal structures of Trichoderma reesei hydrophobin HFBI—the structure of a protein amphiphile with and without detergent interaction
Schmitz et al. Golgi localization of glycosyltransferases requires a Vps74p oligomer
JP2017127306A (en) Binding domains directed against gpcr:g protein complexes and uses derived thereof
KR20180002734A (en) SPECIFIC MODIFICATION OF ANTIBODY BY IgG-BINDING PEPTIDE
Shvarev et al. Structure of the HOPS tethering complex, a lysosomal membrane fusion machinery
CN109627294B (en) Correctly folded recombinant rabies virus G protein extracellular domain and potential application thereof
US8275595B2 (en) Computer-based methods of designing molecules
CN110177811A (en) Method and application thereof for protein connection
US6492492B1 (en) Circularly permuted biotin binding proteins
KR102245733B1 (en) Method for protein structure determination using an antibody that binds to alpha helix
US20060128944A1 (en) Molecular linkers suitable for crystallization and structural analysis of molecules of interest, method of using same, and methods of purifying g protein-coupled receptors
Kundu et al. N-terminal region of Vibrio parahemolyticus thermostable direct hemolysin regulates the membrane-damaging action of the toxin
JP2010524485A (en) Novel antibody molecules and nucleic acids that bind to fungal stress protein HSP90
JP7229169B2 (en) A supramolecular high-affinity protein binding system for the purification of biomacromolecules
US20180141994A1 (en) Toll-like receptor 2 binding epitope and binding member thereto
Vohl et al. Crystallization and preliminary analysis of the NqrA and NqrC subunits of the Na+-translocating NADH: ubiquinone oxidoreductase from Vibrio cholerae
CN105980562A (en) Immunogenic compositions and vaccines derived from bacterial surface receptor proteins
Masuyer et al. Structures of engineered Clostridium botulinum neurotoxin derivatives
Schroder et al. Expression, purification and refolding of a human NaV1. 7 voltage sensing domain with native-like toxin binding properties
KR102140557B1 (en) Peptides for forming protein-protein conjugate and the method for forming protein-protein conjugate using the same
US20220073574A1 (en) Fusion protein with a toxin and scaffold protein
KR101789056B1 (en) Protein complexes comprising GST domains and uses thereof
Julien et al. Structural elucidation of full-length Pfs48/45 in complex with potent mAbs isolated from a naturally exposed individual
Duan et al. New Insights into the Complement Receptor of the Ig Superfamily Obtained from Structural and Functional Studies on Two Mutants

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant