KR20210090010A - An L-DNA-binding natural protein and uses thereof - Google Patents

An L-DNA-binding natural protein and uses thereof Download PDF

Info

Publication number
KR20210090010A
KR20210090010A KR1020200003290A KR20200003290A KR20210090010A KR 20210090010 A KR20210090010 A KR 20210090010A KR 1020200003290 A KR1020200003290 A KR 1020200003290A KR 20200003290 A KR20200003290 A KR 20200003290A KR 20210090010 A KR20210090010 A KR 20210090010A
Authority
KR
South Korea
Prior art keywords
dna
lys
ile
dpo4
val
Prior art date
Application number
KR1020200003290A
Other languages
Korean (ko)
Other versions
KR102285583B1 (en
Inventor
안대로
정학숙
안진수
최재우
Original Assignee
한국과학기술연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술연구원 filed Critical 한국과학기술연구원
Priority to KR1020200003290A priority Critical patent/KR102285583B1/en
Publication of KR20210090010A publication Critical patent/KR20210090010A/en
Application granted granted Critical
Publication of KR102285583B1 publication Critical patent/KR102285583B1/en

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1252DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/51Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
    • A61K47/62Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being a protein, peptide or polyamino acid
    • A61K47/64Drug-peptide, drug-protein or drug-polyamino acid conjugates, i.e. the modifying agent being a peptide, protein or polyamino acid which is covalently bonded or complexed to a therapeutically active agent
    • A61K47/645Polycationic or polyanionic oligopeptides, polypeptides or polyamino acids, e.g. polylysine, polyarginine, polyglutamic acid or peptide TAT
    • A61K47/6455Polycationic oligopeptides, polypeptides or polyamino acids, e.g. for complexing nucleic acids
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07007DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Epidemiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Peptides Or Proteins (AREA)

Abstract

The present invention relates to a protein including a domain exhibiting a property of binding with L-DNA and uses thereof, and more particularly, to an isolated L-DNA binding domain including an amino acid sequence represented by SEQ ID NO: 1, a protein including the isolated L-DNA binding domain, a drug carrier including the protein, and a pharmaceutical composition for the treatment of cancer including the drug carrier and an anticancer agent. The protein including the isolated L-DNA binding domain according to the present invention can be applied to the preparation of antibody-drug conjugates to deliver drugs in a target-selective manner. In addition, when the protein containing the isolated L-DNA binding domain is applied to the conjugation of the antibody and the drug, it is possible to label a drug as much as a desired amount in a site-selective manner without interfering with a target recognition site of the antibody for delivering the drug to a specific target.

Description

L-DNA와 결합하는 자연계 단백질 및 이의 용도{An L-DNA-binding natural protein and uses thereof}Natural protein binding to L-DNA and uses thereof {An L-DNA-binding natural protein and uses thereof}

본 발명은 L-DNA와 결합 성질을 보이는 도메인을 포함하는 단백질 및 이의 용도에 관한 것이다. 보다 상세하게는 서열번호 1로 표시되는 아미노산 서열로 구성된, 단리된 L-DNA 결합 도메인, 상기 단리된 L-DNA 결합 도메인을 포함하는 단백질, 상기 단백질을 포함하는 약물 전달체, 및 상기 약물 전달체 및 항암제를 포함하는 암 치료용 약학 조성물에 관한 것이다.The present invention relates to a protein comprising a domain exhibiting binding properties with L-DNA and uses thereof. More specifically, an isolated L-DNA binding domain comprising the amino acid sequence represented by SEQ ID NO: 1, a protein comprising the isolated L-DNA binding domain, a drug carrier comprising the protein, and the drug carrier and an anticancer agent It relates to a pharmaceutical composition for the treatment of cancer comprising a.

L-DNA는 천연(natural) D-DNA의 거울상 이성질체이다. 거울상 이미지 구조로 인해 L-DNA는 D-DNA와 혼성화되지 않는다 (B. E. Young. et.al., Chemistry - A European Journal, 25:7981-7990, 2019). L-DNA는 천연 유전자 시스템에 사용되지 않지만, 이 생물직교성 염기-쌍 시스템은 주로 유전자 검출 시스템의 표적 특이성을 개선하고자 생명공학에 적용되어왔다 (G. Ke. et.al., Journal of the American Chemical Society, 134:18908-18911, 2012; N. C. Hauser et.al., Nucleic acids research, 34:5101-5111, 2006). L-DNA의 키랄성은 폴리머라아제, 리가아제 및 뉴클레아제를 포함하는 자연적으로 발생하는 DNA 변형 효소와 양립할 수 없다. 특히, L-DNA의 뉴클레아제 내성은 생물학적 환경에서 앱타머의 안정성을 확보하고자 사용되어왔다 (K. P. Williams et.al., Proceedings of the National Academy of Sciences, 94:11285-11290, 1997). 또한, L-DNA 이중체(duplex)가 천연 DNA 이중체와 동일한 열역학적 특성을 유지함에 따라 (W. G. Purschke et.al., Nucleic acids research, 31:3027-3032, 2003), D-DNA 나노구조체를 구축하기 위해 이전에 사용된 서열을 차용함에 의해 다양한 자가-조립된 L-DNA 나노구조체를 쉽게 제조할 수 있었다 (K.-R. Kim et.al., Journal of Controlled Release, 243:121-131, 2016; C. Lin et.al., Nano Letters, 9:433-436, 2009). L-DNA 나노구조체는 향상된 혈청 안정성뿐만 아니라 상대적으로 높은 세포 흡수 효율 및 그들의 천연 대응물(counterpart)에 비해 유사한 생체적합성을 보여주었다 (K.-R. Kim et.al., Chemical Science, 5:1533-1537, 2014). L-DNA 나노구조체의 이러한 특성은 생체내 적용을 위한 약물 전달 플랫폼을 개발하는데 성공적으로 활용되었다 (K.-R. Kim et.al., Biomaterials, 195:1-12, 2019; A. Y. Lee et.al., Journal of Industrial and Engineering Chemistry, 74:187-192, 2019).L-DNA is the enantiomer of natural D-DNA. Due to the mirror image structure, L-DNA does not hybridize with D-DNA (BE Young. et.al. , Chemistry - A European Journal , 25:7981-7990, 2019). Although L-DNA is not used in natural genetic systems, this bioorthogonal base-pairing system has been mainly applied in biotechnology to improve the target specificity of gene detection systems (G. Ke. et.al. , Journal of the American Chemical Society , 134:18908-18911, 2012; NC Hauser et.al. , Nucleic acids research , 34:5101-5111, 2006). The chirality of L-DNA is incompatible with naturally occurring DNA modifying enzymes including polymerases, ligases and nucleases. In particular, the nuclease resistance of L-DNA has been used to secure the stability of aptamers in a biological environment (KP Williams et.al. , Proceedings of the National Academy of Sciences , 94:11285-11290, 1997). In addition, as the L-DNA duplex maintains the same thermodynamic properties as the natural DNA duplex (WG Purschke et.al. , Nucleic acids research , 31:3027-3032, 2003), the D-DNA nanostructures were Various self-assembled L-DNA nanostructures could be easily prepared by borrowing the sequences previously used for construction (K.-R. Kim et.al. , Journal of Controlled Release , 243:121-131). , 2016; C. Lin et. al. , Nano Letters , 9:433-436, 2009). L-DNA nanostructures showed not only improved serum stability but also relatively high cellular uptake efficiency and similar biocompatibility compared to their natural counterpart (K.-R. Kim et.al. , Chemical Science , 5: 1533-1537, 2014). These properties of L-DNA nanostructures have been successfully utilized to develop drug delivery platforms for in vivo applications (K.-R. Kim et.al. , Biomaterials , 195:1-12, 2019; AY Lee et. al. , Journal of Industrial and Engineering Chemistry , 74:187-192, 2019).

L-DNA 나노구조체를 이용하여 단백질 약물을 전달하고자 할 시에는 L-DNA와 단백질간 결합(conjugation)이 필요한데, 이를 위해서 쉽게 이용할 수 있는 방법은 L-DNA 말단을 화학적 결합이 용이한 카르복실산(carboxylic acid), 아민(amine), 또는 티올(thiol) 작용기로 변형하고, 이를 단백질이 지니는 리신(Lys)의 아민 작용기와 교차결합(cross-linking) 반응을 보내는 것이다. 하지만, 이러한 방법은 단백질 내 여러 Lys 중 특정 Lys에만 선택적으로 L-DNA가 결합이 되도록 하기가 어렵다는 단점이 있다. 만일, 단백질이 지니는 도메인들 중에서 L-DNA와 결합할 수 있는 도메인이 있으면 탑재하고자 하는 단백질 약물에 이러한 L-DNA 결합 도메인을 도입하여 L-DNA를 섞어 주었을 때, 자연스럽게 L-DNA에 단백질 약물이 결합하여 탑재 되도록 할 수 있다. 이외에 최근 siRNA또는 안티센스 올리고뉴클레오티드(antisense oligonucleotide)와 같은 질환 유전자를 표적으로 하는 유전자 약물을 질환 부위에 효과적으로 전달하기 위하여 올리고뉴클레오타이드 유전자 약물에 항체를 결합하여 사용하는 항체-올리고뉴클레오타이드 결합(Antibody-Oligonucleotide Conjugates, AOCs)를 활용하고자 하는 시도가 활발하다. 이때, L-DNA 결합 도메인을 항체에 도입하고 유전자 약물 말단을 L-DNA로 연장하여 서로 결합하게 함으로써 유전자 약물을 항체의 특정 부분에 결합하는 것이 가능할 수 있다. 그러나, 자연계에 알려진 단백질 중 현재까지 L-DNA와 결합할 수 있는 도메인을 내재하고 있는 단백질은 보고된 바 없다. L-DNA와의 결합력을 지닐 수 있는지 여부를 알아보기 위해서는 L-DNA와 자연계 단백질간의 상호작용을 알아볼 수 있는 구조적 정보가 필수적으로 필요한데, 이러한 정보도 자연계 DNA인 D-DNA와 단백질의 상호작용에 대한 정보에 비해 매우 부족한 상황이다.In order to deliver protein drugs using L-DNA nanostructures, conjugation between L-DNA and proteins is required. For this purpose, an easily available method is to connect the L-DNA end to a carboxylic acid with easy chemical bonding. (carboxylic acid), amine (amine), or thiol (thiol) functional group is transformed, and it sends a cross-linking reaction with the amine functional group of lysine (Lys) of the protein. However, this method has a disadvantage in that it is difficult to selectively bind L-DNA to only a specific Lys among several Lys in a protein. If there is a domain that can bind to L-DNA among the domains of the protein, when the L-DNA is mixed with the L-DNA binding domain into the protein drug to be loaded, the protein drug is naturally added to the L-DNA. It can be combined and mounted. In addition, recently, in order to effectively deliver gene drugs targeting disease genes such as siRNA or antisense oligonucleotides to disease sites, antibody-oligonucleotide conjugates are used by binding an antibody to an oligonucleotide gene drug. , attempts to utilize AOCs) are active. In this case, it may be possible to bind the gene drug to a specific part of the antibody by introducing the L-DNA binding domain into the antibody and extending the end of the gene drug to L-DNA to bind to each other. However, among the proteins known in nature, there has been no report of a protein having a domain capable of binding to L-DNA so far. Structural information to determine the interaction between L-DNA and a natural protein is essential to determine whether it can have binding to L-DNA. This information also provides information on the interaction between natural DNA, D-DNA and protein. Information is very scarce.

다양한 천연 DNA 형태의 구조 및 그들의 단백질과의 복합체에 대한 연구의 수와 달리 (T. A. Steitz, Journal of Biological Chemistry, 274:17395-17398, 1999; P. J. Paukstelis et.al., Crystals, 6:97, 2016; N. M. Luscombe et.al., Genome Biology, 1, reviews001.1., 2000), L-DNA의 구조에 대한 연구는 매우 제한적이었다. 천연 DNA의 구조적 식견은 많은 DNA-관련 생물학적 기능을 이해하기 위해 더 유용한 정보를 제공하기 때문에 놀라운 것은 아니다. 그럼에도 불구하고, 많은 기능적 L-DNA 구조가 등장하기 시작하면서, L-DNA 구조와 분자 수준의 단백질과의 그들 복합체의 구조적 설명은 거울상 DNA가 생물학적 시스템에 어떻게 통합될 수 있는지 이해하고, L-DNA에서 작동하는 새로운 효소를 설계하는 방법을 마련하는 데 중요하다. 이전에, L-DNA 이중체의 결정 구조는 라세미 혼합물에서 보고되었다 (P. K. Mandal et.al., Angewandte Chemie International Edition, 53:14424-14427, 2014). 자가-조립된 L-DNA 삼방정계의 홀리데이 접합부(Holliday junction)의 결정도 매우 최근에 얻어졌다 (C. R. Simmons et.al., Journal of the American Chemical Society, 139:11254-11260, 2017). L-DNA/단백질 복합체의 구조 측면에서, L-DNA-단백질 상호작용이 자연적으로 자유롭게 이용 가능하지 않기 때문에 매우 적은 경우가 보고되었다. 거울상 DNA/천연 단백질 복합체의 유일한 공지된 결정 구조는 천연 단백질과 이의 실험적으로 발달된 거울상 DNA 앱타머 (또는 DNA 스피에겔머(spiegelmer)) 간의 상호작용을 기술하였다 (L. Yatime et.al., Nature Communications, 6:6481, 2015). 그러나, 천연 단백질의 고유 L-DNA 결합 특성은 지금까지 탐구되지 않았다.Contrary to the number of studies on the structure of various natural DNA forms and their complexes with proteins (TA Steitz, Journal of Biological Chemistry , 274:17395-17398, 1999; PJ Paukstelis et.al. , Crystals , 6:97, 2016) ; NM Luscombe et.al. , Genome Biology , 1, reviews001.1., 2000), studies on the structure of L-DNA were very limited. Structural insight into native DNA is not surprising as it provides more useful information for understanding many DNA-related biological functions. Nevertheless, as many functional L-DNA structures begin to emerge, the structural description of L-DNA structures and their complexes with proteins at the molecular level is important in understanding how mirror DNA can be integrated into biological systems, and L-DNA It is important to come up with a way to design new enzymes that work in Previously, the crystal structure of an L-DNA duplex was reported in a racemic mixture (PK Mandal et.al. , Angewandte Chemie International Edition , 53:14424-14427, 2014). The determination of the Holliday junction of the self-assembled L-DNA trigonal system was also obtained very recently (CR Simmons et.al. , Journal of the American Chemical Society , 139:11254-11260, 2017). In terms of the structure of L-DNA/protein complexes, very few cases have been reported since L-DNA-protein interactions are not freely available in nature. The only known crystal structure of a mirror DNA/native protein complex describes the interaction between a native protein and its experimentally developed mirror DNA aptamer (or DNA spiegelmer) (L. Yatime et.al. , Nature Communications , 6:6481, 2015). However, the intrinsic L-DNA binding properties of native proteins have not been explored so far.

B. E. Young. et.al., Chemistry - A European Journal, 25:7981-7990, 2019B. E. Young. et.al., Chemistry - A European Journal, 25:7981-7990, 2019 G. Ke. et.al., Journal of the American Chemical Society, 134:18908-18911, 2012G. Ke. et.al., Journal of the American Chemical Society, 134:18908-18911, 2012 N. C. Hauser et.al., Nucleic acids research, 34:5101-5111, 2006N. C. Hauser et. al., Nucleic acids research, 34:5101-5111, 2006 K. P. Williams et.al., Proceedings of the National Academy of Sciences, 94:11285-11290, 1997K. P. Williams et. al., Proceedings of the National Academy of Sciences, 94:11285-11290, 1997 W. G. Purschke et.al., Nucleic acids research, 31:3027-3032, 2003W. G. Purschke et.al., Nucleic acids research, 31:3027-3032, 2003 K.-R. Kim et.al., Journal of Controlled Release, 243:121-131, 2016K.-R. Kim et.al., Journal of Controlled Release, 243:121-131, 2016 C. Lin et.al., Nano Letters, 9:433-436, 2009C. Lin et. al., Nano Letters, 9:433-436, 2009 K.-R. Kim et.al., Chemical Science, 5:1533-1537, 2014K.-R. Kim et.al., Chemical Science, 5:1533-1537, 2014 K.-R. Kim et.al., Biomaterials, 195:1-12, 2019K.-R. Kim et.al., Biomaterials, 195:1-12, 2019 A. Y. Lee et.al., Journal of Industrial and Engineering Chemistry, 74:187-192, 2019A. Y. Lee et.al., Journal of Industrial and Engineering Chemistry, 74:187-192, 2019 T. A. Steitz, Journal of Biological Chemistry, 274:17395-17398, 1999T. A. Steitz, Journal of Biological Chemistry, 274:17395-17398, 1999 P. J. Paukstelis et.al., Crystals, 6:97, 2016P. J. Paukstelis et. al., Crystals, 6:97, 2016 N. M. Luscombe et.al., Genome Biology, 1, reviews001.1., 2000N. M. Luscombe et.al., Genome Biology, 1, reviews001.1., 2000 P. K. Mandal et.al., Angewandte Chemie International Edition, 53:14424-14427, 2014P. K. Mandal et. al., Angewandte Chemie International Edition, 53:14424-14427, 2014 C. R. Simmons et.al., Journal of the American Chemical Society, 139:11254-11260, 2017C. R. Simmons et.al., Journal of the American Chemical Society, 139:11254-11260, 2017 L. Yatime et.al., Nature Communications, 6:6481, 2015L. Yatime et. al., Nature Communications, 6:6481, 2015

상기와 같은 배경하에서, 본 발명자들은 신규한 생체적합성(biocompatible) 약물 전달체를 개발하고자 예의 노력한 결과, 천연 DNA의 거울상 형태인 L-DNA와 DNA 중합효소 Dpo4 유래의 LF 도메인(little figner domain)이 결합 특성을 보임을 밝힘으로써, 본 발명을 완성하게 되었다.Under the above background, the present inventors made diligent efforts to develop a novel biocompatible drug delivery system. As a result, L-DNA, which is a mirror image of natural DNA, and the LF domain derived from DNA polymerase Dpo4 (little figner domain) are combined By revealing the characteristics, the present invention was completed.

본 발명의 목적은 L-DNA와 결합력을 지니는, 단백질 도메인을 제공하기 위한 것이다.It is an object of the present invention to provide a protein domain having binding affinity to L-DNA.

본 발명의 다른 목적은 서열번호 1로 표시되는 아미노산 서열로 구성된, 단리된 L-DNA 결합 도메인 및 상기 단리된 L-DNA 결합 도메인을 포함하는 단백질을 제공하기 위한 것이다.Another object of the present invention is to provide an isolated L-DNA binding domain comprising the amino acid sequence represented by SEQ ID NO: 1 and a protein comprising the isolated L-DNA binding domain.

본 발명의 또 다른 목적은 상기 단리된 L-DNA 결합 도메인을 포함하는 단백질을 포함하는 약물 전달체를 제공하기 위한 것이다.Another object of the present invention is to provide a drug delivery system comprising a protein comprising the isolated L-DNA binding domain.

본 발명의 또 다른 목적은 상기 약물 전달체 및 항암제를 포함하는 암 치료용 약학 조성물을 제공하기 위한 것이다.Another object of the present invention is to provide a pharmaceutical composition for treating cancer comprising the drug carrier and an anticancer agent.

본 발명의 목적은 이상에서 언급한 목적으로 제한되지 않는다. 본 발명의 목적은 이하의 설명으로 보다 분명해 질 것이며, 특허청구범위에 기재된 수단 및 그 조합으로 실현될 것이다.The object of the present invention is not limited to the object mentioned above. The objects of the present invention will become more apparent from the following description, and will be realized by means and combinations thereof described in the claims.

상기 목적을 달성하기 위하여, 하기의 해결 수단을 제공한다.In order to achieve the above object, the following solutions are provided.

본 발명의 일측면은 L-DNA와 결합력을 지니는, 단백질 도메인을 제공한다.One aspect of the present invention provides a protein domain having binding affinity to L-DNA.

본 발명의 일측면에 있어서, 상기 도메인은 서열번호 2와 서열 상동성이 30% 이상인, 단백질 도메인을 제공한다.In one aspect of the present invention, the domain provides a protein domain having 30% or more sequence homology with SEQ ID NO: 2.

본 발명의 일측면에 있어서, 상기 도메인은 서열번호 2와 서열 상동성이 80% 이상인, 단백질 도메인을 제공한다.In one aspect of the present invention, the domain provides a protein domain having at least 80% sequence homology with SEQ ID NO: 2.

본 발명의 다른 측면은 서열번호 1로 표시되는 아미노산 서열로 구성된, 단리된 L-DNA 결합 도메인을 제공한다.Another aspect of the present invention provides an isolated L-DNA binding domain comprising the amino acid sequence represented by SEQ ID NO: 1.

본 발명의 다른 측면에 있어서, 상기 단리된 L-DNA 결합 도메인은 DNA 중합효소 유래인, 단리된 L-DNA 결합 도메인을 제공한다.In another aspect of the present invention, there is provided an isolated L-DNA binding domain, wherein the isolated L-DNA binding domain is derived from a DNA polymerase.

본 발명의 다른 측면에 있어서, 상기 DNA 중합효소는 Dpo4(DNA polymerase 4)인, 단리된 L-DNA 결합 도메인을 제공한다.In another aspect of the present invention, the DNA polymerase provides an isolated L-DNA binding domain, which is DNA polymerase 4 (Dpo4).

본 발명의 다른 측면에 있어서, 상기 단리된 L-DNA 결합 도메인은 DNA 중합효소의 LF 도메인(little figner domain)인, 단리된 L-DNA 결합 도메인을 제공한다.In another aspect of the present invention, there is provided an isolated L-DNA binding domain, wherein the isolated L-DNA binding domain is a LF domain (little figner domain) of a DNA polymerase.

본 발명의 다른 측면에 있어서, 상기 단리된 L-DNA 결합 도메인은 서열번호 2로 표시되는 아미노산 서열의 300번째 Arg(Arginine), 321번째 Lys(Lysine) 및 339번째 Lys(Lysine)으로 구성된 군으로부터 선택된 하나 이상의 아미노산 잔기가 치환 또는 변이되지 않는 것인, 단리된 L-DNA 결합 도메인을 제공한다.In another aspect of the present invention, the isolated L-DNA binding domain is from the group consisting of Arg (Arginine) at position 300, Lys (Lysine) at position 321, and Lys (Lysine) at position 339 of the amino acid sequence shown in SEQ ID NO: 2 and wherein at least one selected amino acid residue is unsubstituted or mutated.

본 발명의 또 다른 측면은 상기 도메인을 포함하는, 단백질을 제공한다.Another aspect of the present invention provides a protein comprising the domain.

본 발명의 또 다른 측면에 있어서, 상기 단백질은 항체-약물 복합체(antibody-drug conjugates) 제조에 적용되는 것인, 단백질을 제공한다.In another aspect of the present invention, the protein is applied to the preparation of antibody-drug conjugates (antibody-drug conjugates), it provides a protein.

본 발명의 또 다른 측면에 있어서, 상기 약물은 항암제, 앱타머, 안티센스 올리고뉴클레오타이드, 작은 간섭 리보핵산(siRNA, small interfering RNA) 및 마이크로 RNA(miRNA)로 이루어진 군으로부터 선택되는 것인, 단백질을 제공한다.In another aspect of the present invention, the drug is selected from the group consisting of anticancer drugs, aptamers, antisense oligonucleotides, small interfering ribonucleic acids (siRNA, small interfering RNA) and micro RNA (miRNA), providing a protein do.

본 발명의 또 다른 측면은 상기 단백질을 포함하는, 약물 전달체를 제공한다.Another aspect of the present invention provides a drug delivery system comprising the protein.

본 발명의 또 다른 측면은 상기 약물 전달체; 및 항암제를 포함하는, 암 치료용 약학 조성물을 제공한다.Another aspect of the present invention is the drug delivery system; And it provides a pharmaceutical composition for the treatment of cancer, including an anticancer agent.

본 발명의 또 다른 측면에 있어서, 상기 항암제는 DNA 앱타머 또는 RNA 앱타머인, 약학 조성물을 제공한다.In another aspect of the present invention, the anticancer agent is a DNA aptamer or an RNA aptamer, it provides a pharmaceutical composition.

본 발명의 일측면에 따른 서열번호 1로 표시되는 아미노산 서열로 구성된, 단리된 L-DNA 결합 도메인을 포함하는 단백질을 항체-약물 복합체(antibody-drug conjugates) 제조에 적용하여 표적 선택적으로 약물을 전달할 수 있는 효과가 있다.A protein comprising an isolated L-DNA binding domain, consisting of the amino acid sequence represented by SEQ ID NO: 1 according to an aspect of the present invention, is applied to the preparation of antibody-drug complexes (antibody-drug conjugates) to selectively deliver drugs can have an effect.

또한, 본 발명의 일측면에 따른 단리된 L-DNA 결합 도메인을 포함하는 단백질을 항체와 약물의 컨쥬게이션(conjugation)에 적용하게 되면, 특정 표적으로 약물을 전달하기 위한 항체의 표적 인식 부위를 방해하지 않으면서, 위치 선별적으로 원하는 정량만큼 약물 표지가 가능하므로, 항체-약물 복합체 제조에 유용하게 사용될 수 있다.In addition, when the protein comprising the isolated L-DNA binding domain according to one aspect of the present invention is applied to the conjugation of an antibody and a drug, it interferes with the target recognition site of the antibody for delivering the drug to a specific target Since it is possible to label a drug as much as a desired quantity in a site-selective manner, it can be usefully used for preparing an antibody-drug complex.

본 발명의 효과는 이상에서 언급한 효과로 한정되지 않는다. 본 발명의 효과는 이하의 설명에서 추론 가능한 모든 효과를 포함하는 것으로 이해되어야 할 것이다.The effects of the present invention are not limited to the above-mentioned effects. It should be understood that the effects of the present invention include all effects that can be inferred from the following description.

도 1은 천연 DNA 중합효소가 핵심 도메인, 예컨대 썸(thumb), 팜(palm) 및 핑거(finger)에 의해 형성된 포켓을 사용하여 D-DNA에 결합하고 (상단), DNA 중합효소가 L-DNA에 결합할 수 있는지의 여부에 대해서는 알려져 있지 않음 (하단)에 관하여 개략적으로 나타낸 도이다.
도 2는 D-DNA(상단) 및 L-DNA(하단)에 결합하는 중합효소를 스크리닝한 6% Native PAGE 결과를 나타낸 도이다. P 및 T는 각각 프라이머 및 주형을 나타낸다.
도 3은 Dpo4(DNA polymerase 4)의 L-DNA 결합 특성을 나타낸 도이다. 구체적으로, (a) FP 분석에 의해 추정된 Dpo4의 DNA 결합 친화력을 나타낸 도이다. 형광 표지된 DNA의 농도는 100 nM이었다. (b) Dpo4 결합에 대한 D-DNA 및 L-DNA간의 경쟁을 나타낸 도이다. D-DNA를 100 nM의 형광 표지된 L-DNA와 미리 인큐베이션한 Dpo4 (1 μM) 용액으로 적정하였다. (c) 형광 표지된 D-프라이머 및 L-프라이머 (100 nM)에 대해 프라이머 연장 반응을 분석한 20% 변성 PAGE 수행 결과를 나타낸 도이다. P 및 P+1은 각각 프라이머 및 단일 뉴클레오티드-연장된 프라이머를 나타낸다. (d) FP 분석을 사용하여, 상이한 GC-함량 (100 nM)을 갖는 다양한 DNA 이중체에 대한 Dpo4 결합의 Kd 값을 측정하여 나타낸 도이다. GC-0, GC-33, GC-67 및 GC-100은 각각 DNA 이중체에서 0%, 33%, 67% 및 100% GC 함량을 나타낸다.
도 4는 D-DNA 및 L-DNA와 복합체를 이루는 Dpo4의 결정 구조를 나타낸 도이다. 구체적으로, (a) Dpo4/D-DNA 바이너리 복합체(binary complex)의 전체 구조를 나타낸 도이다. (b) Dpo4/L-DNA 바이너리 복합체의 전체 구조를 나타낸 도이다. (c) apo-Dpo4 (분홍색), D-DNA (청록색) 및 L-DNA (연한 청색)와 복합화된 Dpo4를 중첩하여 나타낸 도이다. Dpo4/D-DNA 복합체, Dpo4/L-DNA 복합체, 및 apo-Dpo4의 아미노산 부분의 구조적 정렬을 나타내었다. 리틀 핑거 및 다른 핵심 도메인, 촉매 핵심 도메인 (왼쪽 하단), 및 리틀 핑거 도메인 (오른쪽 하단) 간의 가요성 링커 주변의 아미노산 잔기를 확대하여 볼 수 있는 전체 Dpo4 구조 (상단)를 나타내었다. Dpo4/D-DNA 이중체 및 Dpo4/L-DNA 이중체의 C-알파 원자는 PyMol (PDB: 2RDI)프로그램으로 apo-Dpo4 구조의 C-알파 원자와 정렬되었다. (d) Dpo4/L-DNA 복합체에서 이량체화된 리틀 핑거 도메인의 구조 및 이의 90°회전뷰를 나타낸 도이다. (e) 등온적정열량계를 사용하여 추정된 결합 화학량론 곡선을 나타낸 도이다.
도 5는 L-DNA와의 상호작용을 위한 Dpo4에 있어서 리틀 핑거(little finger, LF)의 중요한 역할에 대해 시사하는 도이다. (a) Dpo4, 리틀 핑거가 절단된 Dpo4 (Dpo4-ΔLF), 리틀 핑거가 돌연변이된 Dpo4 (Dpo4-mutLF) 및 리틀 핑거 도메인 (LF)과 L-DNA와의 결합 친화력을 형광 편광 분석을 사용하여 측정한 결과를 나타낸 도이다. (b) L-DNA 이중체의 부홈과의 상호작용을 담당하는 사슬 A 및 주홈과의 상호작용을 담당하는 사슬 B의 리틀 핑거로부터의 아미노산 잔기를 나타낸 도이다. (c) Dpo4-L-DNA 상호작용의 개략도를 나타낸 도이다.
도 6은 (a) 다양한 고세균(archaea) 종으로부터의 Dpo4의 다양한 농도 조건에 대한 L-DNA의 결합 정도를 추정하고자 실시한 6% Native PAGE 결과 및 (b) 시그마플롯 소프트웨어 (SigmaPlot software; Systat, USA)를 사용하여 4개의 파라미터 로지스틱 곡선 방정식에 대한 밴드(band) 강도 및 비선형 회귀의 정량화에 의해 결정된 Kd 값을 나타낸 도이다.
도 7은 본 발명에 따른 서열번호 1로 표시되는 아미노산 서열로 구성된, 단리된 L-DNA 결합 도메인을 포함하는 단백질을 적용하여 제조한 항체-약물 복합체(antibody-drug conjugates)의 약물 전달 원리를 개략적으로 나타낸 도이다.
도 8은 본 발명에 따른 서열번호 2로 표시되는 술포로버스 솔파타리쿠스(S. solfataricus: Ss) Dpo4를 기준으로 서열번호 11로 표시되는 술폴로부스 아시도칼다리우스(Sulfolobus acidocaldarius: Sa) Dpo4를 정렬하여 상동성(55.6%)을 확인한 도이다.
도 9는 본 발명에 따른 서열번호 2로 표시되는 술포로버스 솔파타리쿠스(S. solfataricus: Ss) Dpo4를 기준으로 서열번호 12로 표시되는 피크로필러스 토리두스(Picrophilus torridus: Pt) Dpo4를 정렬하여 상동성(48.2%)을 확인한 도이다.
도 10은 본 발명에 따른 서열번호 2로 표시되는 술포로버스 솔파타리쿠스(S. solfataricus: Ss) Dpo4를 기준으로 서열번호 13으로 표시되는 메탈로스페에라 세둘라(Metallosphaera sedula: Ms) Dpo4를 정렬하여 상동성(56.8%)을 확인한 도이다.
도 11은 본 발명에 따른 서열번호 2로 표시되는 술포로버스 솔파타리쿠스(S. solfataricus: Ss) Dpo4를 기준으로 서열번호 14로 표시되는 니트로소스파이라 비에넨시스(Nitrososphaera viennensis: Nv) Dpo4를 정렬하여 상동성(35.7%)을 확인한 도이다.
도 12는 본 발명에 따른 서열번호 2로 표시되는 술포로버스 솔파타리쿠스(S. solfataricus: Ss) Dpo4를 기준으로 서열번호 15로 표시되는 아시디플라즈마 에오리쿰(Acidiplasma aeolicum: Aa) Dpo4를 정렬하여 상동성(44.5%)을 확인한 도이다.
도 13은 본 발명에 따른 서열번호 2로 표시되는 술포로버스 솔파타리쿠스(S. solfataricus: Ss) Dpo4를 기준으로 고세균 도메인에 있는 5개의 다른 종들 (술폴로부스 아시도칼다리우스[Sulfolobus acidocaldarius: Sa(서열번호 11)], 피크로필러스 토리두스[Picrophilus torridus: Pt(서열번호 12)], 메탈로스페에라 세둘라[Metallosphaera sedula: Ms(서열번호 13)], 니트로소스파이라 비에넨시스[Nitrososphaera viennensis: Nv(서열번호 14)], 아시디플라즈마 에오리쿰[Acidiplasma aeolicum: Aa(서열번호 15)])로부터의 Dpo4를 EMBOSS Needle 프로그램을 이용하여, 정렬하여 나타낸 도이다.
Figure 1 shows that native DNA polymerase binds to D-DNA using pockets formed by key domains such as thumb, palm and finger (top), and DNA polymerase is L-DNA It is a diagram schematically showing whether it is not known whether it can bind to (bottom).
2 is a diagram showing the results of 6% Native PAGE screening for polymerase binding to D-DNA (top) and L-DNA (bottom). P and T represent primer and template, respectively.
3 is a diagram showing the L-DNA binding properties of Dpo4 (DNA polymerase 4). Specifically, (a) is a diagram showing the DNA binding affinity of Dpo4 estimated by FP analysis. The concentration of fluorescently labeled DNA was 100 nM. (b) A diagram showing competition between D-DNA and L-DNA for Dpo4 binding. D-DNA was titrated with a solution of Dpo4 (1 μM) previously incubated with 100 nM of fluorescently labeled L-DNA. (c) A diagram showing the results of 20% denaturation PAGE analysis of primer extension reactions for fluorescently labeled D-primer and L-primer (100 nM). P and P+1 denote primers and single nucleotide-extended primers, respectively. (d) A diagram showing the measurement of K d values of Dpo4 binding to various DNA duplexes with different GC-contents (100 nM) using FP analysis. GC-0, GC-33, GC-67 and GC-100 show 0%, 33%, 67% and 100% GC content in the DNA duplex, respectively.
4 is a diagram showing the crystal structure of Dpo4 forming a complex with D-DNA and L-DNA. Specifically, (a) is a diagram showing the overall structure of the Dpo4/D-DNA binary complex. (b) A diagram showing the overall structure of the Dpo4/L-DNA binary complex. (c) A diagram showing overlapping Dpo4 complexed with apo-Dpo4 (pink), D-DNA (turquoise) and L-DNA (light blue). Structural alignments of the amino acid portion of the Dpo4/D-DNA complex, the Dpo4/L-DNA complex, and apo-Dpo4 are shown. The overall Dpo4 structure (top) is shown, with a magnified view of the amino acid residues around the flexible linker between the little finger and other core domains, the catalytic core domain (bottom left), and the little finger domain (bottom right). The C-alpha atoms of the Dpo4/D-DNA duplex and the Dpo4/L-DNA duplex were aligned with the C-alpha atom of the apo-Dpo4 structure with the PyMol (PDB: 2RDI) program. (d) A diagram showing the structure of the dimerized little finger domain in the Dpo4/L-DNA complex and a 90° rotation view thereof. (e) A diagram showing the estimated binding stoichiometry curve using an isothermal titration calorimeter.
5 is a diagram suggesting an important role of a little finger (LF) in Dpo4 for interaction with L-DNA. (a) The binding affinity of Dpo4, little finger cleaved Dpo4 (Dpo4-ΔLF), little finger mutated Dpo4 (Dpo4-mutLF) and little finger domain (LF) with L-DNA was measured using fluorescence polarization analysis. A diagram showing a result. (b) A diagram showing amino acid residues from the little finger of the chain A responsible for interaction with the minor groove and the chain B responsible for the interaction with the main groove of the L-DNA duplex. (c) A diagram showing a schematic diagram of the Dpo4-L-DNA interaction.
Figure 6 is (a) 6% Native PAGE results and (b) SigmaPlot software (SigmaPlot software; Systat, USA) performed to estimate the degree of binding of L-DNA to various concentration conditions of Dpo4 from various archaea species. ) is a diagram showing the K d value determined by quantification of band intensity and nonlinear regression for a four-parameter logistic curve equation.
7 is a drug delivery principle of antibody-drug complexes (antibody-drug conjugates) prepared by applying a protein comprising an isolated L-DNA binding domain, consisting of the amino acid sequence represented by SEQ ID NO: 1 according to the present invention; is a diagram shown as
8 is a S. solfataricus (S. solfataricus: Ss) Dpo4 represented by SEQ ID NO: 2 according to the present invention, as shown in SEQ ID NO: 11 Sulfolobus acidocaldarius (Sulfolobus acidocaldarius: Sa) Dpo4 It is a diagram confirming the homology (55.6%) by sorting.
9 is a S. solfataricus (S. solfataricus: Ss) Dpo4 represented by SEQ ID NO: 2 according to the present invention, the Picrophilus torridus represented by SEQ ID NO: 12 ( Picrophilus torridus: Pt) Dpo4 It is a diagram confirming homology (48.2%) by sorting.
10 is a metallosphaera sedula (Metallosphaera sedula : Ms) Dpo4 represented by SEQ ID NO: 13 based on S. solfataricus (Ss) Dpo4 represented by SEQ ID NO: 2 according to the present invention; It is a diagram confirming homology (56.8%) by sorting.
11 is a nitrosospira represented by SEQ ID NO: 14 based on S. solfataricus (Ss) Dpo4 represented by SEQ ID NO: 2 according to the present invention; Vienensis ( Nitrososphaera viennensis : Nv) is a diagram confirming homology (35.7%) by aligning Dpo4.
12 is an acidiplasma aeolicum (Acidiplasma aeolicum: Aa) Dpo4 represented by SEQ ID NO: 15 based on S. solfataricus (Ss) Dpo4 represented by SEQ ID NO: 2 according to the present invention; It is a diagram confirming homology (44.5%) by sorting.
13 is a view showing five different species in the archaeal domain based on S. solfataricus : Ss Dpo4 represented by SEQ ID NO: 2 according to the present invention ( Sulfolobus acidocaldarius [Sulfolobus acidocaldarius: Sa (SEQ ID NO: 11)], Picrophilus torridus [Picrophilus torridus: Pt (SEQ ID NO: 12)], Metallosphaera sedula [Metallosphaera sedula: Ms (SEQ ID NO: 13)], nitrosospira Dpo4 from Vienensis [Nitrososphaera viennensis: Nv (SEQ ID NO: 14)], Acidiplasma aeolicum [Acidiplasma aeolicum: Aa (SEQ ID NO: 15)]) using the EMBOSS Needle program, is a diagram showing alignment .

달리 명시되지 않는 한, 본 명세서에서 사용된 성분, 반응 조건, 성분의 함량을 표현하는 모든 숫자, 값 및/또는 표현은, 이러한 숫자들이 본질적으로 다른 것들 중에서 이러한 값을 얻는 데 발생하는 측정의 다양한 불확실성이 반영된 근사치들이므로, 모든 경우 "약"이라는 용어에 의해 수식되는 것으로 이해되어야 한다. 또한, 본 기재에서 수치범위가 개시되는 경우, 이러한 범위는 연속적이며, 달리 지적되지 않는 한 이러한 범위의 최소값으로부터 최대값이 포함된 상기 최대값까지의 모든 값을 포함한다. 더 나아가, 이러한 범위가 정수를 지칭하는 경우, 달리 지적되지 않는 한 최소값으로부터 최대값이 포함된 상기 최대값까지를 포함하는 모든 정수가 포함된다.Unless otherwise specified, all numbers, values, and/or expressions expressing ingredients, reaction conditions, and amounts of ingredients used herein refer to a variety of measures that may occur in obtaining such values, among others, in which such numbers are inherently different. Since they are approximations reflecting uncertainty, it should be understood as being modified by the term "about" in all cases. Also, where the disclosure discloses numerical ranges, such ranges are continuous and inclusive of all values from the minimum to the maximum inclusive of the range, unless otherwise indicated. Furthermore, when such ranges refer to integers, all integers inclusive from the minimum to the maximum inclusive are included, unless otherwise indicated.

본 명세서에 있어서, 범위가 변수에 대해 기재되는 경우, 상기 변수는 상기 범위의 기재된 종료점들을 포함하는 기재된 범위 내의 모든 값들을 포함하는 것으로 이해될 것이다. 예를 들면, "5 내지 10"의 범위는 5, 6, 7, 8, 9, 및 10의 값들뿐만 아니라 6 내지 10, 7 내지 10, 6 내지 9, 7 내지 9 등의 임의의 하위 범위를 포함하고, 5.5, 6.5, 7.5, 5.5 내지 8.5 및 6.5 내지 9 등과 같은 기재된 범위의 범주에 타당한 정수들 사이의 임의의 값도 포함하는 것으로 이해될 것이다. 또한 예를 들면, "10% 내지 30%"의 범위는 10%, 11%, 12%, 13% 등의 값들과 30%까지를 포함하는 모든 정수들뿐만 아니라 10% 내지 15%, 12% 내지 18%, 20% 내지 30% 등의 임의의 하위 범위를 포함하고, 10.5%, 15.5%, 25.5% 등과 같이 기재된 범위의 범주 내의 타당한 정수들 사이의 임의의 값도 포함하는 것으로 이해될 것이다.In this specification, when a range is described for a variable, the variable will be understood to include all values within the stated range including the stated endpoints of the range. For example, a range of “5 to 10” includes the values of 5, 6, 7, 8, 9, and 10, as well as any subranges such as 6 to 10, 7 to 10, 6 to 9, 7 to 9, etc. It will be understood to include any value between integers that are appropriate for the scope of the recited range, such as 5.5, 6.5, 7.5, 5.5 to 8.5 and 6.5 to 9, and the like. Also for example, a range of "10% to 30%" includes values such as 10%, 11%, 12%, 13%, and all integers up to and including 30%, as well as 10% to 15%, 12% to It will be understood to include any subrange, such as 18%, 20% to 30%, etc., as well as any value between reasonable integers within the scope of the recited range, such as 10.5%, 15.5%, 25.5%, and the like.

이하, 본 발명을 구체적으로 설명한다.Hereinafter, the present invention will be specifically described.

본 발명은 항체-약물 복합체(antibody-drug conjugates) 제조에 적용하여 표적 선택적으로 약물을 전달할 수 있는, L-DNA와 결합 성질을 보이는 도메인을 포함하는 단백질 및 이의 용도에 관한 것이다. 보다 상세하게는 서열번호 1로 표시되는 아미노산 서열로 구성된, 단리된 L-DNA 결합 도메인, 상기 단리된 L-DNA 결합 도메인을 포함하는 단백질, 상기 단백질을 포함하는 약물 전달체, 및 상기 약물 전달체 및 항암제를 포함하는 암 치료용 약학 조성물에 관한 것이다.The present invention relates to a protein comprising a domain exhibiting binding properties with L-DNA, which can be applied to the preparation of antibody-drug conjugates to selectively deliver a drug to a target, and uses thereof. More specifically, an isolated L-DNA binding domain comprising the amino acid sequence represented by SEQ ID NO: 1, a protein comprising the isolated L-DNA binding domain, a drug carrier comprising the protein, and the drug carrier and an anticancer agent It relates to a pharmaceutical composition for the treatment of cancer comprising a.

본 발명의 일측면은 L-DNA와 결합력을 지니는, 단백질 도메인을 제공한다.One aspect of the present invention provides a protein domain having binding affinity to L-DNA.

본 발명에서 용어 "L-DNA"는 천연(natural) D-DNA의 거울상 이성질체로, 거울상 이미지 구조로 인해 L-DNA는 D-DNA와 혼성화되지 않는 특징이 있다. L-DNA의 키랄성은 중합효소(polymerase), 리가아제(ligase) 및 뉴클레아제(nuclease)를 포함하는 자연적으로 발생하는 DNA 변형 효소와 양립할 수 없음이 알려져 있다. 특히, L-DNA의 뉴클레아제 내성은 생물학적 환경에서 앱타머의 안정성을 확보하고자 사용되어왔다. 또한, L-DNA 이중체(duplex)가 천연 DNA 이중체와 동일한 열역학적 특성을 유지함에 따라, D-DNA 나노구조체를 구축하기 위해 이전에 사용된 서열을 차용함에 의해 다양한 자가-조립된 L-DNA 나노구조체를 쉽게 제조할 수 있음이 보고된 바 있다. L-DNA 나노구조체는 향상된 혈청 안정성뿐만 아니라 상대적으로 높은 세포 흡수 효율 및 그들의 천연 대응물(counterpart)에 비해 유사한 생체적합성을 보여주고, L-DNA 나노구조체의 이러한 특성은 생체내 적용을 위한 약물 전달 플랫폼을 개발하는데 활용될 수 있음이 보고되었다.In the present invention, the term “L-DNA” is an enantiomer of natural D-DNA, and due to the mirror image structure, L-DNA does not hybridize with D-DNA. It is known that the chirality of L-DNA is incompatible with naturally occurring DNA modifying enzymes including polymerases, ligases and nucleases. In particular, the nuclease resistance of L-DNA has been used to secure the stability of aptamers in a biological environment. In addition, various self-assembled L-DNA by borrowing sequences previously used to construct D-DNA nanostructures, as L-DNA duplexes retain the same thermodynamic properties as native DNA duplexes. It has been reported that nanostructures can be easily prepared. L-DNA nanostructures show not only improved serum stability, but also relatively high cellular uptake efficiency and similar biocompatibility compared to their natural counterparts, and these properties of L-DNA nanostructures are useful for drug delivery for in vivo applications. It has been reported that it can be used to develop a platform.

본 발명에서 용어 "단백질 도메인"은 생체내(in vivo) 또는 시험관내(in vitro)에서 L-DNA에 결합하는 폴리펩타이드를 의미한다. 상기 '폴리펩타이드(polypeptide)'는 10개 이상의 아미노산이 펩타이드(peptide) 결합으로 형성된 아미노산 중합체로서, L-DNA와 결합할 수 있는 한 임의의 특정 폴리펩타이드로 제한되지 않는다.As used herein, the term "protein domain" refers to a polypeptide that binds to L-DNA in vivo or in vitro. The 'polypeptide' is an amino acid polymer formed by peptide bonds of 10 or more amino acids, and is not limited to any specific polypeptide as long as it can bind to L-DNA.

용어 "폴리펩타이드", "펩타이드" 및 "단백질"은 아미노산 잔기들의 중합체를 지칭하기 위해 상호교환적으로 사용된다. 상기 용어는 또한 하나 이상의 아미노산이 대응하는 자연적으로 발생하는 아미노산의 화학적 유사체 또는 변형된 유도체인 아미노산 중합체에 적용된다.The terms “polypeptide”, “peptide” and “protein” are used interchangeably to refer to a polymer of amino acid residues. The term also applies to amino acid polymers in which one or more amino acids are chemical analogs or modified derivatives of the corresponding naturally occurring amino acids.

본 발명에 있어서, 상기 단백질 도메인은 이에 제한되지는 않으나 서열번호 2와 서열 상동성이 30%, 40%, 50%, 55%, 60%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 이상 동일한 아미노산 서열을 포함하는, L-DNA와 결합력을 지니는 단백질 도메인일 수 있다. In the present invention, the protein domain is not limited thereto, but the sequence homology with SEQ ID NO: 2 is 30%, 40%, 50%, 55%, 60%, 70%, 75%, 80%, 85%, 86 contains an amino acid sequence that is at least %, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% identical It may be a protein domain having binding affinity to L-DNA.

본 발명의 일실시예에 있어서, 술포로부스 솔파타리커스 (Sulfolobus solfataricus, Ss) 유래의 Dpo4의 L-DNA 결합 능력을 조사하고자, 형광 편광 (fluorescence polarization, FP) 분석을 사용하여 해리 상수 (Kd) 값을 측정한 결과, Kd 값이 L-DNA 결합에 대해 756 nM임을 나타내었다 (도 3의 a).In one embodiment of the present invention, in order to investigate the L-DNA binding ability of Dpo4 derived from Sulfolobus solfataricus , Ss, using fluorescence polarization (FP) analysis, the dissociation constant (K d ) As a result of measuring the value, it was shown that the K d value was 756 nM for L-DNA binding (FIG. 3a).

또한, 겔-시프트 결합 분석법(gel-shift binding assay)을 사용하여 상기 고세균 술포로부스 솔파타리커스 이외의 고세균 도메인에 있는 5개의 다른 종들 (술폴로부스 아시도칼다리우스[Sulfolobus acidocaldarius: Sa], 피크로필러스 토리두스[Picrophilus torridus: Pt], 메탈로스페에라 세둘라[Metallosphaera sedula: Ms], 니트로소스파이라 비에넨시스[Nitrososphaera viennensis: Nv], 아시디플라즈마 에오리쿰[Acidiplasma aeolicum: Aa])로부터 Dpo4를 조사하였을 시, 이들은 모두 L-DNA에 결합할 수 있음을 확인하였다 (도 6). L-DNA 결합에 대한 이들의 Kd 값은 200 내지 5088 nM으로 결정되었다. 이는 고세균 도메인의 Dpo4 중합효소가 일반적으로 L-DNA 결합 특성을 가질 수 있지만, 친화력은 유기체에 따라 달라질 수 있음을 알 수 있었다.In addition, using a gel-shift binding assay, five other species in the archaeal domain other than the archaea Sulfolobus solfataricus (Sulfolobus acidocaldarius [Sulfolobus acidocaldarius: Sa], Picrophilus torridus [ Picrophilus torridus: Pt], Metallosphaera sedula [Metallosphaera sedula: Ms], nitrosospira When Dpo4 was investigated from Vienensis [Nitrososphaera viennensis : Nv], Acidiplasma aeolicum : Aa), it was confirmed that all of them could bind to L-DNA (FIG. 6). Their K d values for L-DNA binding were determined to be between 200 and 5088 nM. This suggests that the Dpo4 polymerase of the archaeal domain may generally have L-DNA binding properties, but the affinity may vary depending on the organism.

한편, 상기 술포로버스 솔파타리쿠스(S. solfataricus: Ss) Dpo4(서열번호 2)를 기준으로 상기 고세균(archaea) 도메인에 있는 5개의 다른 종들 (Sa(서열번호 11)], Pt(서열번호 12), Ms(서열번호 13), Nv(서열번호 14), Aa(서열번호 15))로부터의 Dpo4를 EMBOSS Needle 프로그램을 이용하여, 상동성을 확인해 본 결과, Ss Dpo4와 Sa Dpo4의 경우 55.6% (도 8), Ss Dpo4와 Pt Dpo4의 경우 48.2% (도 9), Ss Dpo4와 Ms Dpo4의 경우 56.8% (도 10), Ss Dpo4와 Nv Dpo4의 경우 35.7% (도 11), Ss Dpo4와 Aa Dpo4의 경우 44.5% (도 12)의 상동성을 보임을 확인하였다.On the other hand, 5 other species in the archaea domain based on the S. solfataricus (Ss) Dpo4 (SEQ ID NO: 2) (Sa (SEQ ID NO: 11)], Pt (SEQ ID NO: 2) 12), Ms (SEQ ID NO: 13), As a result of confirming the homology of Dpo4 from Nv (SEQ ID NO: 14), Aa (SEQ ID NO: 15)) using the EMBOSS Needle program, 55.6% of Ss Dpo4 and Sa Dpo4 ( FIG. 8 ), Ss Dpo4 and Pt 48.2% for Dpo4 (Fig. 9), 56.8% for Ss Dpo4 and Ms Dpo4 (Fig. 10), 35.7% for Ss Dpo4 and Nv Dpo4 (Fig. 11), 44.5% for Ss Dpo4 and Aa Dpo4 (Fig. 12) ) was confirmed to show homology.

상기 일련의 결과를 통해, 유래 유기체에 따라 L-DNA 친화력에 차이를 보이기는 하나, 술포로부스 솔파타리커스 유래의 Dpo4와 30% 수준의 상동성만을 나타내어도 L-DNA와 결합 특성을 가짐을 알 수 있었다.Through the above series of results, although there is a difference in L-DNA affinity depending on the derived organism, it has binding properties to L-DNA even if it shows only 30% homology with Dpo4 derived from Sulphorobus solfataricus. Could know.

본 발명의 다른 측면은 서열번호 1로 표시되는 아미노산 서열로 구성된, 단리된 L-DNA 결합 도메인을 제공한다.Another aspect of the present invention provides an isolated L-DNA binding domain comprising the amino acid sequence represented by SEQ ID NO: 1.

본 발명에 있어서, 상기 "L-DNA"는 전술한 바와 같다.In the present invention, the "L-DNA" is as described above.

본 발명에서 용어 "L-DNA 결합 도메인" 또는 "단리된 L-DNA 결합 도메인"은 생체내(in vivo) 또는 시험관내(in vitro)에서 L-DNA에 결합하는 폴리펩타이드를 의미한다. 상기 '폴리펩타이드(polypeptide)'는 10개 이상의 아미노산이 펩타이드(peptide) 결합으로 형성된 아미노산 중합체로서, 다시 말해 'L-DNA 결합 도메인'은 서열번호 1로 표시되는 121개의 아미노산(121 a.a) 서열로 구성된, 폴리펩타이드임을 의미한다.As used herein, the term "L-DNA binding domain" or "isolated L-DNA binding domain" refers to a polypeptide that binds to L-DNA in vivo or in vitro. The 'polypeptide' is an amino acid polymer formed by peptide bonds of 10 or more amino acids, that is, the 'L-DNA binding domain' is a sequence of 121 amino acids (121 aa) represented by SEQ ID NO: 1. It means that it is composed of a polypeptide.

용어 "폴리펩타이드", "펩타이드" 및 "단백질"은 아미노산 잔기들의 중합체를 지칭하기 위해 상호교환적으로 사용된다. 상기 용어는 또한 하나 이상의 아미노산이 대응하는 자연적으로 발생하는 아미노산의 화학적 유사체 또는 변형된 유도체인 아미노산 중합체에 적용된다.The terms “polypeptide”, “peptide” and “protein” are used interchangeably to refer to a polymer of amino acid residues. The term also applies to amino acid polymers in which one or more amino acids are chemical analogs or modified derivatives of the corresponding naturally occurring amino acids.

상기 서열번호 1로 표시되는 아미노산 서열로 구성된, 단리된 L-DNA 결합 도메인은 이에 제한되지는 않으나, 서열번호 1과 적어도 10%, 20%, 30%, 40%, 50%, 55%, 60%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 이상 동일한 아미노산 서열을 포함하는, L-DNA 결합 도메인일 수 있다. The isolated L-DNA binding domain consisting of the amino acid sequence represented by SEQ ID NO: 1, but is not limited thereto, is at least 10%, 20%, 30%, 40%, 50%, 55%, 60% with SEQ ID NO: 1 %, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, an L-DNA binding domain comprising an amino acid sequence that is at least 98%, 99%, or 100% identical.

본 발명에 있어서, 상기 단리된 L-DNA 결합 도메인은 DNA 중합효소로부터 유래된 것으로, 상기 DNA 중합효소는 이에 제한되지는 않으나, Dpo4(DNA polymerase 4) 유래일 수 있다.In the present invention, the isolated L-DNA binding domain is derived from a DNA polymerase, the DNA polymerase is not limited thereto, but may be derived from DNA polymerase 4 (Dpo4).

상기 'Dpo4(DNA polymerase 4; DNA polyerase Ⅳ)'는 호열성(thermophilic)의 고세균(archaea)에 속하는 술포로버스 솔파타리쿠스(Sulfolobus solfataricus)로부터 유래한 Y-패밀리(Y-family) DNA 중합효소(polymerase)로서, 손상통과합성 (Translesion synthesis, TLS) DNA 중합효소 중의 하나이다. Dpo4는 손상된 DNA와 직면할 때 손상된 부위에서 DNA 합성을 진행할 수 있다.The 'Dpo4 (DNA polymerase 4; DNA polyerase IV)' is a Y-family DNA polymerase derived from Sulfolobus solfataricus belonging to the thermophilic archaea. As a polymerase, it is one of the translesion synthesis (TLS) DNA polymerases. When Dpo4 encounters damaged DNA, it can proceed with DNA synthesis at the damaged site.

상기 Dpo4는 이에 제한되지는 않으나, 서열번호 2로 표시되는 352개의 아미노산(352 a.a) 서열로 구성된 폴리펩타이드일 수 있다.The Dpo4 is not limited thereto, but may be a polypeptide consisting of a sequence of 352 amino acids (352 a.a) represented by SEQ ID NO: 2.

또한, 상기 Dpo4는 이에 제한되지는 않으나, 술포로버스 솔파타리쿠스(Sulfolobus solfataricus), 술폴로부스 아시도칼다리우스(Sulfolobus acidocaldarius), 피크로필러스 토리두스(Picrophilus torridus), 메탈로스페에라 세둘라(Metallosphaera sedula), 니트로소스파이라 비에넨시스(Nitrososphaera viennensis), 아시디플라즈마 에오리쿰(Acidiplasma aeolicum) 등의 고세균으로부터 유래될 수 있다.In addition, the Dpo4 is, but not limited to, Sulfolobus solfataricus ( Sulfolobus solfataricus ), Sulfolobus acidocaldarius ( Sulfolobus acidocaldarius ), Picrophilus torridus ( Picrophilus torridus ), Metallos ferae three Doula ( Metallosphaera sedula ), nitrosospira Bienensis ( Nitrososphaera viennensis ), Acidiplasma aeolicum ( Acidiplasma aeolicum ) It may be derived from archaea.

본 발명에 있어서, 상기 단리된 L-DNA 결합 도메인은 DNA 중합효소의 LF 도메인(little figner domain)일 수 있다. 바람직하게는, Y-패밀리 DNA 중합효소인 Dpo4의 LF 도메인으로, 서열번호 1로 표시되는 121개의 아미노산(121 a.a) 서열로 구성된 폴리펩타이드일 수 있다.In the present invention, the isolated L-DNA binding domain may be a LF domain (little finger domain) of DNA polymerase. Preferably, the LF domain of Dpo4, a Y-family DNA polymerase, may be a polypeptide consisting of the 121 amino acid (121 a.a) sequence shown in SEQ ID NO: 1.

한편, Y-패밀리 중합효소는 UmuC, DinB, Rev1/Rad30A 속으로 구성되어 있고, Dpo4는 DinB 상동체(homolog)를 가진다. DinB 상동성 단백질은 인간 (DINB1), 쥐 (DinB1)로부터, 그리고 박테리아, 고세균까지 널리 존재하는 단백질이다. DinB 상동체들은 LF 도메인을 포함하고 있다. LF 도메인은 4개의 β-시트(β-sheet)와 2개의 α-헬릭스(α-helix)가 βαββαβ로 구성되어 있다.On the other hand, Y-family polymerase consists of UmuC, DinB, Rev1/Rad30A genera, and Dpo4 has a DinB homolog. The DinB homology protein is a protein that exists widely in humans (DINB1), mice (DinB1), and in bacteria and archaea. DinB homologues contain the LF domain. The LF domain is composed of four β-sheets and two α-helixes βαββαβ.

본 발명에 있어서, 상기 단리된 L-DNA 결합 도메인은 서열번호 2로 표시되는 아미노산 서열의 300번째 Arg(Arginine; R), 321번째 Lys(Lysine; K) 및 339번째 Lys(Lysine; K)으로 구성된 군으로부터 선택된 하나 이상의 아미노산 잔기가 치환 또는 변이되지 않은 것일 수 있다 (도 13 참조).In the present invention, the isolated L-DNA binding domain is the amino acid sequence shown in SEQ ID NO: 2 Arg (Arginine; R) at position 300, Lys at position 321 (Lysine; K) and Lys at position 339 (Lysine; K) One or more amino acid residues selected from the group consisting of may be unsubstituted or substituted (see FIG. 13 ).

본 발명에 있어서, 상기 단리된 L-DNA 결합 도메인은 서열번호 11로 표시되는 아미노산 서열의 300번째 Lys(Lysine; K), 321번째 Glu(Glutamic acid; E) 및 339번째 Asn(Asparagine; N)으로 구성된 군으로부터 선택된 하나 이상의 아미노산 잔기가 치환 또는 변이되지 않은 것일 수 있다 (도 13 참조).In the present invention, the isolated L-DNA binding domain is Lys at position 300 (Lysine; K), Glu (Glutamic acid; E) at position 321 and Asn at position 339 (Asparagine; N) of the amino acid sequence shown in SEQ ID NO: 11 One or more amino acid residues selected from the group consisting of may not be substituted or mutated (see FIG. 13).

본 발명에 있어서, 상기 단리된 L-DNA 결합 도메인은 서열번호 12로 표시되는 아미노산 서열의 300번째 Try(Tyrosine; Y), 321번째 Lys(Lysine; K) 및 339번째 Lys(Lysine; K)으로 구성된 군으로부터 선택된 하나 이상의 아미노산 잔기가 치환 또는 변이되지 않은 것일 수 있다 (도 13 참조).In the present invention, the isolated L-DNA binding domain is the amino acid sequence shown in SEQ ID NO: 12 Try (Tyrosine; Y), Lys at 321, Lys at position 321 (Lysine; K), and Lys at position 339 (Lysine; K) One or more amino acid residues selected from the group consisting of may be unsubstituted or substituted (see FIG. 13 ).

본 발명에 있어서, 상기 단리된 L-DNA 결합 도메인은 서열번호 13으로 표시되는 아미노산 서열의 300번째 Lys(Lysine; K), 321번째 Lys(Lysine; K) 및 339번째 Lys(Lysine; K)으로 구성된 군으로부터 선택된 하나 이상의 아미노산 잔기가 치환 또는 변이되지 않은 것일 수 있다 (도 13 참조).In the present invention, the isolated L-DNA binding domain is the amino acid sequence shown in SEQ ID NO: 13 Lys at 300 (Lysine; K), Lys at 321 (Lysine; K) and Lys at position 339 (Lysine; K) One or more amino acid residues selected from the group consisting of may be unsubstituted or substituted (see FIG. 13 ).

본 발명에 있어서, 상기 단리된 L-DNA 결합 도메인은 서열번호 14로 표시되는 아미노산 서열의 300번째 Arg(Arginine; R), 321번째 Glu(Glutamic acid; E) 및 339번째 Asp(Aspartic acid; D)으로 구성된 군으로부터 선택된 하나 이상의 아미노산 잔기가 치환 또는 변이되지 않은 것일 수 있다 (도 13 참조).In the present invention, the isolated L-DNA binding domain is the amino acid sequence shown in SEQ ID NO: 14 Arg (Arginine; R) at position 300, Glu (Glutamic acid; E) at position 321, and Asp (Aspartic acid; D at position 339) ), one or more amino acid residues selected from the group consisting of may not be substituted or mutated (see FIG. 13 ).

본 발명에 있어서, 상기 단리된 L-DNA 결합 도메인은 서열번호 15로 표시되는 아미노산 서열의 300번째 Try(Tyrosine; Y), 321번째 Arg(Arginine; R) 및 339번째 Lys(Lysine; K)으로 구성된 군으로부터 선택된 하나 이상의 아미노산 잔기가 치환 또는 변이되지 않은 것일 수 있다 (도 13 참조).In the present invention, the isolated L-DNA binding domain is the amino acid sequence shown in SEQ ID NO: 15 Try (Tyrosine; Y), 321 Arg (Arginine; R), and 339 Lys (Lysine; K) One or more amino acid residues selected from the group consisting of may be unsubstituted or substituted (see FIG. 13 ).

본 발명에서 상기 용어 "치환" 또는 "변이"는 폴리펩타이드 또는 폴리뉴클레오티드 서열 내에 그 서열의 변이체를 생성시키기 위해 하나 이상의 아미노산 또는 뉴클레오티드의 변경, 결실, 또는 삽입하는 것을 의미한다.As used herein, the term “substitution” or “mutation” refers to alteration, deletion, or insertion of one or more amino acids or nucleotides in a polypeptide or polynucleotide sequence to generate a variant of the sequence.

상기 용어 "변이체"는 하나 이상의 변형(modification), 예를 들어, 치환, 삽입, 또는 결실에 의해 기준 폴리펩타이드 또는 기준 폴리뉴클레오티드와 상이한 폴리펩타이드 또는 폴리뉴클레오티드를 의미한다.The term “variant” refers to a polypeptide or polynucleotide that differs from a reference polypeptide or reference polynucleotide by one or more modifications, eg, substitutions, insertions, or deletions.

용어 "폴리뉴클레오티드"는 당-인산 골격 또는 다른 균등한 공유결합적 화학적 특성에 의해 공유 결합된 뉴클레오티드의 사슬을 포함하는 분자를 의미한다. 이중 가닥 및 단일 가닥 DNA 및 RNA가 폴리뉴클레오티드의 전형적인 예이다.The term “polynucleotide” refers to a molecule comprising a chain of nucleotides covalently linked by a sugar-phosphate backbone or other equivalent covalent chemical property. Double-stranded and single-stranded DNA and RNA are typical examples of polynucleotides.

용어 "폴리펩타이드" 또는 "단백질"은 폴리펩타이드를 형성하도록 펩타이드 결합에 의해 연결된 적어도 2개의 아미노산 잔기를 포함하는 분자를 의미한다. 약 50개 미만의 아미노산의 작은 폴리펩타이드는 "펩타이드"로 지칭될 수 있다.The term “polypeptide” or “protein” refers to a molecule comprising at least two amino acid residues joined by peptide bonds to form a polypeptide. Small polypeptides of less than about 50 amino acids may be referred to as “peptides”.

본 발명의 일실시예에서, L-DNA 결합 도메인, 즉 LF 도메인이 결여된 절단된 Dpo4 (Dpo4-ΔLF)가 L-DNA 결합에 대해 시험된 경우, FP 분석에서 상당한 결합 친화력을 나타내지 않음을 확인하였다 (도 5의 a). 특히, LF 도메인에서 3개의 아미노산 잔기가 L-DNA와의 결합에 관여함을 확인하였다 (도 5의 b 및 도 5의 c). 상세하게는, 사슬 A에서 LF의 Arg300 및 Lys339는 L-DNA 이중체의 주홈 근처의 인산염과 상호작용하고 (도 5의 b 및 도 5의 c), 사슬 B에서 LF의 Arg300 및 Lys321는 부홈의 인산염과 상호작용함을 확인하였다 (도 5의 b 및 도 5의 c). 이 아미노산을 알라닌 (Dpo4-mutLF)으로 돌연변이된 경우, L-DNA에 대한 Kd는 야생형에 비해 약 7배 감소한 5520 nM이었으며, 이들 아미노산이 Dpo4에 L-DNA 결합 특성을 부여하는 주요 잔기임을 입증하였다 (도 5의 a). In one embodiment of the present invention, it is confirmed that truncated Dpo4 (Dpo4-ΔLF) lacking the L-DNA binding domain, i.e., the LF domain, does not show significant binding affinity in the FP assay when tested for L-DNA binding. (Fig. 5a). In particular, it was confirmed that three amino acid residues in the LF domain are involved in binding to L-DNA ( FIGS. 5 b and 5 c ). Specifically, Arg300 and Lys339 of LF in chain A interact with phosphate near the major groove of the L-DNA duplex (Fig. 5b and 5c), and Arg300 and Lys321 of LF in chain B interact with the minor groove of the L-DNA duplex. It was confirmed that it interacts with phosphate (FIG. 5 b and 5 c). When this amino acid was mutated to alanine (Dpo4-mutLF), the K d for L-DNA was 5520 nM, about a 7-fold decrease compared to the wild-type, demonstrating that these amino acids are key residues conferring L-DNA binding properties to Dpo4. (Fig. 5a).

즉, 서열번호 2로 표시되는 아미노산 서열로 구성된, Dpo4의 아미노산 서열의 300Arg, 321Lys, 339Lys 부위의 (돌연)변이 유발 시, L-DNA 및 Dpo4의 LF 도메인 간의 특이적 결합이 상실됨을 알 수 있었다 (도 5 및 도 13).That is, when (mutation) mutation of the 300Arg, 321Lys, 339Lys regions of the amino acid sequence of Dpo4, consisting of the amino acid sequence shown in SEQ ID NO: 2, specific binding between L-DNA and the LF domain of Dpo4 was lost. (FIGS. 5 and 13).

본 발명의 또 다른 측면은 상기 도메인을 포함하는, 단백질을 제공한다.Another aspect of the present invention provides a protein comprising the domain.

본 발명에 있어서, 상기 도메인, 구체적으로 L-DNA와 결합력을 지니는 단백질 도메인 또는 단리된 L-DNA 결합 도메인은 전술한 바와 같다.In the present invention, the domain, specifically, the protein domain having binding affinity to L-DNA or the isolated L-DNA binding domain is as described above.

본 발명에 있어서, 상기 도메인을 포함하는 단백질은 항체-약물 복합체(antibody-drug conjugates) 제조에 적용될 수 있다 (도 7 참조).In the present invention, the protein including the domain may be applied to the preparation of antibody-drug conjugates (see FIG. 7 ).

상기 단백질은 자연계에 존재하는 단백질로, 특정 단백질로 제한되지 않는다. 단백질은 유전정보에 따라 합성되며, 유전자는 단백질의 아미노산 배열정보를 갖고 있다. 단백질은 20종류의 아미노산으로 구성된 고분자로서, 생체에 있어서 기능분자이며, 온갖 생명현상에 필요한 과정과 화학반응을 담당하고 있다.The protein is a protein that exists in nature, and is not limited to a specific protein. Proteins are synthesized according to genetic information, and genes have information on the amino acid sequence of proteins. Protein is a polymer composed of 20 kinds of amino acids, and is a functional molecule in the living body, and is responsible for the processes and chemical reactions necessary for all kinds of life phenomena.

단백질, 예컨대 중합효소 단백질, 촉매효소 단백질, 호르몬 단백질과 같은 자연계에 존재하는 단백질은 당업자에 의해 용이하게 합성 또는 자연계에 존재하는 생물로부터 분리, 수득될 수 있다.Proteins, for example, proteins that exist in nature, such as polymerase proteins, catalytic enzyme proteins, and hormone proteins, can be easily synthesized by those skilled in the art or isolated and obtained from living organisms in nature.

본 발명에 있어서, 상기 단백질은 단백질에 L-DNA 결합 도메인이 포함되어 있는 한, 특별히 제한되지 않는다.In the present invention, the protein is not particularly limited as long as the protein contains an L-DNA binding domain.

상기 'L-DNA 결합 도메인이 단백질에 포함되어 있는'이란, 자연계 단백질의 아미노산 배열정보 내에 L-DNA 결합 도메인, 즉 서열번호 1로 표시되는 아미노산 서열 정보가 내포되어 있는 것을 의미한다.The 'L-DNA binding domain is included in the protein' means that the amino acid sequence information of the L-DNA binding domain, ie, SEQ ID NO: 1, is contained in the amino acid sequence information of a natural protein.

이에 제한되지는 않으나, 자연계 단백질에 포함되는 상기 L-DNA 결합 도메인, 즉 Dpo4(DNA polymerase 4) 유래의 LF 도메인은 서열번호 1로 표시되는 아미노산 서열과 10%, 20%, 30%, 40%, 50%, 55%, 60%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 이상의 상동성을 가지는 것일 수 있다.Although not limited thereto, the L-DNA binding domain included in the natural protein, that is, the LF domain derived from Dpo4 (DNA polymerase 4) is 10%, 20%, 30%, 40% with the amino acid sequence shown in SEQ ID NO: 1 , 50%, 55%, 60%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95 %, 96%, 97%, 98%, 99%, or may be one having 100% or more homology.

본 발명에서, 상기 용어 "항체-약물 복합체(antibody-drug conjugates)"는 인체에서 질환을 유발하는 항원을 선택적으로 공격하는 항체와 치료 효과를 지닌 약물이 L-DNA 결합 도메인을 포함하는 단백질에 의해 컨쥬게이션(conjugation)된 복합체를 의미한다.In the present invention, the term "antibody-drug conjugates" refers to an antibody that selectively attacks an antigen causing a disease in the human body and a drug having a therapeutic effect by a protein containing an L-DNA binding domain. It refers to a conjugated complex.

상기 'L-DNA 결합 도메인을 포함하는 단백질'은 전술한 바와 같으며, 상기 단백질은 항체의 표적 인식 부위를 제외한 부위에 결합될 수 있다. 이에 따라, 항체가 표적 인식 부위, 즉 항원 인식 부위를 방해하지 않으면서, 위치 선별적으로 정량적인 개수만큼(예컨대, 항체 1개당 핵산약물 1개) 약물 표지가 가능함에 따라, 특정 표적 선택적으로 원하는 정량만큼 약물을 전달할 수 있다 (도 7 참조).The 'protein including the L-DNA binding domain' is the same as described above, and the protein may be bound to a site other than the target recognition site of the antibody. Accordingly, as the antibody does not interfere with the target recognition site, that is, the antigen recognition site, a quantitative number of drugs (eg, one nucleic acid drug per antibody) can be labeled in a site-selective manner, so that a specific target selectively desired It is possible to deliver the drug by a quantity (see FIG. 7 ).

용어 "항체"는 적어도 하나의 면역글로불린 가변 도메인(가변 영역) 또는 면역글로불린 가변 도메인(가변 영역) 서열을 포함하는 단백질을 지칭한다. 예를 들어, 항체는 중쇄 가변 영역 및 경쇄 가변 영역을 포함할 수 있다. 또한, 항체는 항체의 항원-결합 단편(예를 들어, 단일쇄 항체, Fab 및 sFab 단편, F(ab')2, Fd 단편, Fv 단편, scFv, 및 도메인 항체) 단편(de Wildt et al, Eur J Immunol., 26(3):629-39, 1996)뿐만 아니라 완전한 항체를 포함한다. 항체는 IgA, IgG, IgE, IgD, IgM(뿐만 아니라 이것의 서브타입)의 구조적 특징을 가질 수 있다. 항체는 임의의 공급원으로부터 유래될 수 있지만, 영장류(인간 및 비-인간 영장류) 및 영장류화가 바람직하다.The term “antibody” refers to a protein comprising at least one immunoglobulin variable domain (variable region) or immunoglobulin variable domain (variable region) sequence. For example, an antibody may comprise a heavy chain variable region and a light chain variable region. Antibodies also include antigen-binding fragments of antibodies (eg, single chain antibodies, Fab and sFab fragments, F(ab')2, Fd fragments, Fv fragments, scFv, and domain antibodies) fragments (de Wildt et al , Eur J Immunol ., 26(3):629-39, 1996) as well as complete antibodies. Antibodies may have structural features of IgA, IgG, IgE, IgD, IgM (as well as subtypes thereof). Antibodies can be derived from any source, but primates (human and non-human primates) and primatization are preferred.

본 발명에서 있어서, 상기 약물은 항암제, 앱타머, 안티센스 올리고뉴클레오타이드, 작은 간섭 리보핵산(siRNA, small interfering RNA) 및 마이크로 RNA(miRNA)로 이루어진 군으로부터 선택될 수 있다.In the present invention, the drug may be selected from the group consisting of an anticancer agent, an aptamer, an antisense oligonucleotide, a small interfering ribonucleic acid (siRNA, small interfering RNA), and a micro RNA (miRNA).

상기 약물은 본 발명의 항체-약물 복합체 형성을 매개하는 상기 단백질에 포함된 L-DNA 결합 도메인, 즉 LF 도메인(서열번호 1)과 결합하는 L-DNA와 혼성화(hybridization) 될 수 있는 단백질 또는 유전자 약물일 수 있다.The drug is a protein or gene capable of hybridization with L-DNA binding to the L-DNA binding domain, that is, the LF domain (SEQ ID NO: 1) contained in the protein mediating the formation of the antibody-drug complex of the present invention. It may be a drug.

본 발명의 또 다른 측면은 상기 L-DNA 결합 도메인을 포함하는 단백질을 포함하는, 약물 전달체를 제공한다.Another aspect of the present invention provides a drug delivery system comprising a protein comprising the L-DNA binding domain.

상기 'L-DNA 결합 도메인을 포함하는 단백질'은 전술한 바와 같다.The 'protein comprising the L-DNA binding domain' is the same as described above.

전술한 바와 같이, 약물은 본 발명의 항체-약물 복합체 형성을 매개하는 상기 단백질에 포함된 L-DNA 결합 도메인, 즉 LF 도메인(서열번호 1)과 결합하는 L-DNA 백본에 상보적으로 결합, 또는 혼성화되어 세포 내로 전달되는 것일 수 있다 (도 7 참조). As described above, the drug complementarily binds to the L-DNA backbone that binds to the L-DNA binding domain contained in the protein, that is, the LF domain (SEQ ID NO: 1), which mediates the formation of the antibody-drug complex of the present invention; Alternatively, it may be hybridized and delivered into cells (see FIG. 7 ).

본 발명의 약물 전달체를 사용하여 세포 내로 전달할 수 있는 약물, 즉 약학적 활성 성분의 종류는 특정의 것으로 제한되지 아니하며, 예컨대 항암제, 조영제, 호르몬제, 항호르몬제, 비타민제, 칼슘제, 무기질 제제, 당류제, 유기산 제제, 단백질 아미노산 제제, 해독제, 효소 제제, 대사성 제제, 당뇨 병용제, 조직 부활 용약, 글로로필 제제, 색소제제, 종양 용약, 종양 치료제, 방사성 의약품, 조직 세포 진단제, 조직 세포 치료제, 항생 물질 제제, 항바이러스제, 복합항생물질제제, 화학요법제, 백신, 독소, 톡소이드, 항독소, 렙토스피라혈청, 혈액 제제, 생물학적 제제, 진통제, 면역원성 분자, 항히스타민제, 알레르기 용약, 비특이성 면역원 제제, 마취제, 각성제, 정신 신경 용제, 핵산, 앱타머, 안티센스 핵산, 올리고뉴클레오타이드, 펩타이드, siRNA 및 마이크로 RNA 등을 포함한다.Drugs that can be delivered into cells using the drug delivery system of the present invention, that is, the types of pharmaceutically active ingredients are not limited to specific ones, for example, anti-cancer agents, contrast agents, hormone agents, anti-hormones, vitamins, calcium agents, mineral agents, sugars agent, organic acid preparation, protein amino acid preparation, antidote, enzyme preparation, metabolic agent, diabetes combination agent, tissue revitalization agent, glophyll agent, pigment agent, tumor agent, tumor agent, radiopharmaceutical, tissue cell diagnostic agent, tissue cell therapy , antibiotic agent, antiviral agent, combination antibiotic agent, chemotherapeutic agent, vaccine, toxin, toxoid, antitoxin, leptospirin serum, blood product, biological agent, analgesic, immunogenic molecule, antihistamine, allergy drug, non-specific immunogen agent , anesthetics, stimulants, psychoactive agents, nucleic acids, aptamers, antisense nucleic acids, oligonucleotides, peptides, siRNAs and microRNAs, and the like.

본 발명의 약물 전달체는 약학적 활성 성분으로서 핵산을 세포 내로 전달하기 위하여 사용될 수 있으며, 이 경우 전달물질인 핵산의 서열이 담체 서열과 혼성화될 염려가 없으므로, 그 어떠한 천연의 핵산 기반 전달물질이라도 자유롭게 사용할 수 있다는 장점을 갖는다.The drug delivery system of the present invention can be used to deliver a nucleic acid into a cell as a pharmaceutically active ingredient, and in this case, there is no concern that the sequence of the nucleic acid as the delivery material will be hybridized with the carrier sequence, so any natural nucleic acid-based delivery material can be freely used. It has the advantage of being able to use it.

본 발명의 또 다른 측면은 상기 L-DNA 결합 도메인을 포함하는 단백질을 포함하는 약물 전달체; 및 항암제를 포함하는, 암 치료용 약학 조성물을 제공한다.Another aspect of the present invention is a drug delivery system comprising a protein comprising the L-DNA binding domain; And it provides a pharmaceutical composition for the treatment of cancer, including an anticancer agent.

상기 항암제는 이에 제한되지는 않으나, DNA 앱타머 또는 RNA 앱타머일 수 있다.The anticancer agent is not limited thereto, but may be a DNA aptamer or an RNA aptamer.

본 발명의 암 치료용 약학 조성물은 전술한 L-DNA 결합 도메인을 포함하는 단백질과 함께 약제학적으로 허용되는 담체를 포함하는데, 상기 약제학적으로 허용되는 담체는 제제시에 통상적으로 이용되는 것으로서, 락토스, 덱스트로스, 수크로스, 솔비톨, 만니톨, 전분, 아카시아 고무, 인산 칼슘, 알기네이트, 젤라틴, 규산 칼슘, 미세결정성 셀룰로스, 폴리비닐피롤리돈, 셀룰로스, 물, 시럽, 메틸 셀룰로스, 메틸히드록시벤조에이트, 프로필히드록시벤조에이트, 활석, 스테아르산 마그네슘 및 미네랄 오일 등을 포함하나, 이에 한정되는 것은 아니다. 적합한 약제학적으로 허용되는 담체 및 제제는 Remington's Pharmaceutical Sciences (19th ed, 1995)에 상세히 기재되어 있다.The pharmaceutical composition for the treatment of cancer of the present invention includes a pharmaceutically acceptable carrier together with the protein comprising the L-DNA binding domain described above. The pharmaceutically acceptable carrier is commonly used in formulation, and includes lactose. , dextrose, sucrose, sorbitol, mannitol, starch, gum acacia, calcium phosphate, alginate, gelatin, calcium silicate, microcrystalline cellulose, polyvinylpyrrolidone, cellulose, water, syrup, methyl cellulose, methylhydroxy benzoate, propylhydroxybenzoate, talc, magnesium stearate and mineral oil, and the like. Suitable pharmaceutically acceptable carriers and agents are described in detail in Remington's Pharmaceutical Sciences (19th ed, 1995).

한편, 본 발명에 따른 암 치료용 약학 조성물은, 정맥 투여, 근육 내 투여, 피하 투여, 구강 투여, 골수 내 투여, 경피 투여 또는 국소 투여 등으로 투여될 수 있고, 용액, 현탁 주사제, 정제 또는 캡슐제 등의 다양한 형태로 제형화 할 수 있다.Meanwhile, the pharmaceutical composition for treating cancer according to the present invention may be administered by intravenous administration, intramuscular administration, subcutaneous administration, oral administration, intramedullary administration, transdermal administration, or topical administration, and may be administered as a solution, suspension injection, tablet or capsule. It can be formulated in various forms such as

이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로, 본 발명의 요지에 따라 본 발명의 범위가 이들 실시예에 의해 제한되지 않는다는 것은 당업계에서 통상의 지식을 가진 자에 있어서 자명할 것이다.Hereinafter, the present invention will be described in more detail through examples. These examples are only for illustrating the present invention in more detail, and it will be apparent to those of ordinary skill in the art that the scope of the present invention is not limited by these examples according to the gist of the present invention. .

실시예 1: 실험 재료 준비 및 실험 방법Example 1: Preparation of Experimental Materials and Experimental Methods

실시예 1-1: 실험 재료 준비Example 1-1: Preparation of experimental materials

Dpo4를 제외한 모든 DNA 중합효소는 New England Biolabs (USA)에서 구입하였다. D-DNA 올리고뉴클레오티드는 Bioneer (Korea)에서 구입하였다. L-DNA 올리고뉴클레오티드는 표준 포스포아마다이트(phosphoramidite) 화학법을 사용하여 Mermaid-4 DNA/RNA 합성기 (Bioautomation, USA)로 1 μmol 스케일로 합성되었다. L-DNA 포스포아마다이트는 ChemGenes (USA)에서 구입하였다. 플루오레세인 포스포아마다이트는 Glen Research (USA)에서 구입하였다. L-dTTP는 TriLink BioTechnologies (USA)에서 구입하였다. D-dNTP는 Promega (USA)에서 구입하였다.All DNA polymerases except Dpo4 were purchased from New England Biolabs (USA). D-DNA oligonucleotides were purchased from Bioneer (Korea). L-DNA oligonucleotides were synthesized on a 1 μmol scale with a Mermaid-4 DNA/RNA synthesizer (Bioautomation, USA) using standard phosphoramidite chemistry. L-DNA phosphoamidite was purchased from ChemGenes (USA). Fluorescein phosphoamidite was purchased from Glen Research (USA). L-dTTP was purchased from TriLink BioTechnologies (USA). D-dNTPs were purchased from Promega (USA).

실시예 1-2: Dpo4의 발현 및 정제Example 1-2: Expression and purification of Dpo4

코돈(codon)에 최적화된 술포로버스 솔파타리쿠스(S. solfataricus: Ss) Dpo4를 운반하는 pET21b 플라스미드는 연세대학교 합성 생물학 연구실로부터 제공받았다. 재조합 플라스미드를 C41(DE3) 발현 숙주로 형질전환시켰다. 단백질 발현을 1 mM 이소프로필-β-D-티오갈락토시드(isopropyl-β-D-thiogalactoside)로 18℃에서 21시간 동안 유도하였다. HisTrap 및 HiTrap monoS 컬럼을 사용하여 Biochemistry, 43, 2106-2115 (2004)에 보고된 절차에 따라 Dpo4 (서열번호 2)를 정제하였다. 정제된 단백질을 버퍼 20mM Tris-HCl (pH 7.5), 100mM NaCl, 0.1mM EDTA, 1mM DTT에서 10K 아웃-오프 원심분리 필터를 이용하여 11 ㎎/㎖로 농축시켰다.The pET21b plasmid carrying the codon-optimized S. solfataricus (Ss) Dpo4 was provided by the Yonsei University Synthetic Biology Laboratory. The recombinant plasmid was transformed into a C41 (DE3) expression host. Protein expression was induced with 1 mM isopropyl-β-D-thiogalactoside at 18° C. for 21 hours. Dpo4 (SEQ ID NO: 2) was purified using HisTrap and HiTrap monoS columns according to the procedure reported in Biochemistry, 43, 2106-2115 (2004). Purified protein was concentrated to 11 mg/ml in buffer 20 mM Tris-HCl (pH 7.5), 100 mM NaCl, 0.1 mM EDTA, 1 mM DTT using a 10K out-off centrifugal filter.

실시예 1-3: GMSA (Gel mobility shift assay)Example 1-3: Gel mobility shift assay (GMSA)

ThermoPol® 버퍼 (20 mM Tris-HCl, 10 mM(NH4)2SO4, 10 mM KCl, 2 mM MgSO4, 0.1% 트리톤 X-100 pH 8.8@RT, New England Biolabs, USA) 중의 플루오레세인-표지된 프라이머 (GCT ACG ACT CAC TAT GGA CG, 100 nM) 및 주형 (AAA AAA AAA ACG TCC ATA GTG AGT CGT AGC, 100 nM)을 5분 동안 95℃로 가열하고, 어닐링하여 10분 동안 실온 (25℃)으로 냉각시켜 플루오레세인-표지된 DNA 이중체를 형성하였다. DNA 이중체 용액에 중합효소 (말단 데옥시리보뉴클레오티드 트랜스퍼라아제 (TdT) (100 단위(unit)), Deep Vent (exo-) DNA 중합효소 (28 단위), Dpo4 (10 μM), M-MuLV 역전사 효소 (2800 단위), 클레노우 절편 (3'→5' exo-) (70 단위), Taq DNA 중합효소 (70 단위), 및 Vent (exo-) DNA 중합효소 (28 단위))를 첨가하고, 상기 혼합물을 30분 동안 실온에서 인큐베이션하였다. 이후, 혼합물을 100V에서 0.5×TBE (44.5 mM Tris-HCl, 44.5 mM 붕산, 1 mM EDTA pH 8.0) 내 6% 비-변성 PAGE 실행(run)으로 분석하였다. 밴드는 Chemidoc (Biorad, USA)을 사용하여 시각화되었다.Fluorescein in ThermoPol® buffer (20 mM Tris-HCl, 10 mM(NH 4 ) 2 SO 4 , 10 mM KCl, 2 mM MgSO 4 , 0.1% Triton X-100 pH 8.8@RT, New England Biolabs, USA) -labeled primer (GCT ACG ACT CAC TAT GGA CG, 100 nM) and template (AAA AAA AAA ACG TCC ATA GTG AGT CGT AGC, 100 nM) were heated to 95° C. for 5 minutes, annealed at room temperature for 10 minutes ( 25°C) to form a fluorescein-labeled DNA duplex. Polymerase (terminal deoxyribonucleotide transferase (TdT) (100 units)), Deep Vent (exo-) DNA polymerase (28 units), Dpo4 (10 μM), M-MuLV in DNA duplex solution Reverse transcriptase (2800 units), Klenow fragment (3'→5' exo-) (70 units), Taq DNA polymerase (70 units), and Vent (exo-) DNA polymerase (28 units)) were added and , the mixture was incubated for 30 min at room temperature. The mixture was then analyzed in a 6% non-denaturing PAGE run in 0.5×TBE (44.5 mM Tris-HCl, 44.5 mM boric acid, 1 mM EDTA pH 8.0) at 100V. Bands were visualized using Chemidoc (Biorad, USA).

실시예 1-4: 형광 편광 분석Example 1-4: Fluorescence Polarization Analysis

플루오레세인-표지된 프라이머 (fluorescein-GGG GGA AGG ATT CC) 및 주형 (TCA CGG AAT CCT TCC CCC)으로 구성된 플루오레세인-표지된 DNA 이중체 (100 nM)를 Dpo4 반응 버퍼 (50 mM HEPES, pH 7.5, 50 mM NaCl, 5 mM MgCl2, 5mM DTT, 10% 글리세롤, 0.1mM EDTA)에서 다양한 농도 (0-10 μM)의 Dpo4와 혼합하고 4℃에서 30분 동안 인큐베이션하였다. DNA 이중체에 대한 Dpo4의 결합 친화력은 형광 편광 값에 의해 분석되었고, Appliskan (Thermo Fisher Scientific, USA)을 사용하여 측정되었다. Kd 값은 시그마플롯 소프트웨어 (Systat, USA)를 사용하여 한-부위(one-site) 포화 리간드 결합 방정식에 대한 비-선형 회귀에 기초하여 추정되었다. 경쟁 실험을 위해, Dpo4 반응 버퍼 중 플루오레세인-표지된 L-DNA 이중체 (100nM)와 미리-혼합된 Dpo4 (1 μM)의 용액에 D-DNA 이중체를 다양한 농도 (0-4 μM)로 첨가하고 실온에서 30분 동안 인큐베이션하였다. 형광 편광 값은 Appliskan (Thermo Fisher Scientific, USA)을 사용하여 측정되었다. IC50 값은 시그마플롯 소프트웨어 (Systat, USA)를 사용하여 4개의 파라미터 로지스틱 곡선 방정식에 대한 비선형 회귀에 기초하여 추정되었다. 모든 데이터는 삼반복 독립된 실험으로부터 수득하였다.Fluorescein-labeled DNA duplex (100 nM) consisting of fluorescein-labeled primer (fluorescein-GGG GGA AGG ATT CC) and template (TCA CGG AAT CCT TCC CCC) was mixed with Dpo4 reaction buffer (50 mM HEPES, pH 7.5, 50 mM NaCl, 5 mM MgCl 2 , 5 mM DTT, 10% glycerol, 0.1 mM EDTA) at various concentrations (0-10 μM) of Dpo4 and incubated at 4° C. for 30 minutes. The binding affinity of Dpo4 to DNA duplexes was analyzed by fluorescence polarization values and measured using Appliskan (Thermo Fisher Scientific, USA). K d values were estimated based on non-linear regression to the one-site saturated ligand binding equation using Sigmaplot software (Systat, USA). For competition experiments, various concentrations (0-4 µM) of D-DNA duplexes were added to solutions of Dpo4 (1 µM) pre-mixed with fluorescein-labeled L-DNA duplexes (100 nM) in Dpo4 reaction buffer. was added and incubated at room temperature for 30 minutes. Fluorescence polarization values were measured using Appliskan (Thermo Fisher Scientific, USA). IC 50 values were estimated based on nonlinear regression to a four parameter logistic curve equation using Sigmaplot software (Systat, USA). All data were obtained from triplicate independent experiments.

실시예 1-5: 프라이머 연장Example 1-5: Primer Extension

연장 분석 전에, 5'-플루오레세인-표지된 DNA 프라이머 (플루오레세인-GCT ACG AGC ACT ATG GA CG) 및 DNA 주형 (AAA AAA AAA ACG TCC ATA GTG AGT CGT AG C)을 2분 동안 95℃로 가열하여 천천히 4℃로 냉각시킴으로써 어닐링하였다. 프라이머 연장 반응은 20 mM Tris-HCl (pH 8.8), 10 mM (NH4)2SO-4, 10 mM KCl, 2 mM MgSO4, 0.1 % 트리톤 X-100, 1 mM dTTP 및 Dpo4 (1 μM)를 함유하는 버퍼에서 1μM의 프라이머/주형을 이용하여 수행되었다. 반응을 55℃에서 30분 동안 수행하고, 동일한 부피의 95% 포름아마이드 및 10mM EDTA를 첨가한 후 95℃에서 5분 동안 인큐베이션함으로써 종결시켰다. 반응 생성물을 7M 우레아에서 20% 변성 PAGE에서 분해하고 iBright FL1000 (Invitrogen)으로 시각화하였다.Prior to extension analysis, 5'-fluorescein-labeled DNA primer (fluorescein-GCT ACG AGC ACT ATG GA CG) and DNA template (AAA AAA AAA ACG TCC ATA GTG AGT CGT AG C) were incubated at 95° C. for 2 min. It was annealed by heating with a furnace and slowly cooling to 4°C. Primer extension reaction was 20 mM Tris-HCl (pH 8.8 ), 10 mM (NH 4) 2 SO- 4, 10 mM KCl, 2 mM MgSO 4, 0.1% Triton X-100, 1 mM dTTP and Dpo4 (1 μM) was performed using 1 μM of primer/template in a buffer containing The reaction was carried out at 55° C. for 30 minutes and terminated by addition of equal volumes of 95% formamide and 10 mM EDTA followed by incubation at 95° C. for 5 minutes. Reaction products were digested on PAGE 20% denaturing in 7M urea and visualized with an iBright FL1000 (Invitrogen).

실시예 1-6: 등온 적정 열량 측정(Isothermal titration calorimetry)Example 1-6: Isothermal titration calorimetry

Dpo4 및 DNA의 등온 적정 열량 측정은 Nano ITC (TA Instruments, USA) 상에서 측정되었다. Dpo4 및 DNA를 20mM HEPES, 100mM NaCl, 0.5mM EDTA, 0.5mM TCEP, 및 10mM MgSO4를 함유하는 pH 7.5의 ITC 버퍼에 대해 투석하였다. 최적화된 Dpo4 농도는 25 μM이고 DNA의 농도는 125 μM이었다. 샘플 세포에서 5 μL DNA를 Dpo4 용액으로 자동으로 적정하고, 완전한 평형에 도달하기 위해 각 샷(shot) 사이에 300초 간격으로 총 20 적정을 수행하였다. 개별 실험에서 총 측정 시간은 6,000초 이상이었다. L-DNA 대한 Dpo4의 ITC는 45℃에서 수행되었고, D-DNA에 대한 Dpo4의 ITC는 15℃에서 수행되었다. 데이터는 결합 비율이 독립적인 결합 모델에 적절한 프로그램 Nanoanalyze (TA Instruments, USA)로 분석되었다.Isothermal titration calorimetry of Dpo4 and DNA was measured on a Nano ITC (TA Instruments, USA). Dpo4 and DNA were dialyzed against ITC buffer at pH 7.5 containing 20 mM HEPES, 100 mM NaCl, 0.5 mM EDTA, 0.5 mM TCEP, and 10 mM MgSO 4 . The optimized Dpo4 concentration was 25 μM and the DNA concentration was 125 μM. 5 μL DNA from the sample cells was automatically titrated with Dpo4 solution, and a total of 20 titrations were performed with 300 sec intervals between each shot to reach complete equilibrium. The total measurement time in individual experiments was over 6,000 seconds. ITC of Dpo4 to L-DNA was performed at 45°C, and ITC of Dpo4 to D-DNA was performed at 15°C. Data were analyzed with the appropriate program Nanoanalyze (TA Instruments, USA) for binding models where the binding rate is independent.

실시예 1-7: 결정화 및 구조 결정Examples 1-7: Crystallization and Structure Determination

프라이머 (GGG GGA AGG ATT CC) 및 주형 (TCA CGG AAT CCT TCC CCC)으로 형성된 DPO4 및 DNA 이중체를 4℃에서 약 1:1.3 몰비로 인큐베이션하였다. Dpo4/D-DNA 또는 Dpo4/L-DNA 복합체의 결정은 각각 5:5 비례 부피의 단백질/DNA 용액 및 리저버 용액(reservoir solution; 0.1 M BIS-TRIS (pH 7.0), 0.1 M 칼슘 아세테이트, 2% 글리세롤, 및 9% w/v PEG3350) 또는 리저버 용액(reservoir solution; 0.1 M 포름산 나트륨, 0.05 M BICINE (pH 8.5), 10% w/v 폴리에틸렌 글리콜 모노메틸 에테르 5,000, 및 1.1% 벤즈아미딘-HCl)을 19℃에서 함유하는 드롭(drop)에서 시팅-드롭 증기 확산법(sitting-drop vapour diffusion method)을 사용하여 성장시켰다. Dpo4/D-DNA 결정의 경우 0.1 M BIS-TRIS (pH 7.0), 20% PEG3350, 100mM CaOAC2, 및 25% 글리세롤에, 그리고 Dpo4/L-DNA 결정의 경우 0.1 M 포름산 나트륨, 0.05 M BICINE (pH 8.5), 10% w/v 폴리에틸렌 글리콜 모노메틸 에테르 5,000, 1.1% 벤즈아미딘-HCl 및 25% 글리세롤에 결정을 빠르게 침지시켰으며, 이를 즉시 액체 질소로 급속 냉동시켰다. 데이터는 포항 가속기 광원 빔라인 5C (Pohang, Korea)에서 파장 1.0Å에서 수집되었다. 데이터 세트는 HKL-2000을 사용하여 축소 및 확대되었다 (Method Enzymol, 276:307-326, 1997). Dpo4/D-DNA 및 Dpo4/L-DNA 결정을 P22121 및 P1211에서 결정화하고, 2.60 및 2.36Å의 해상도로 회절하여 각각 2.60 및 2.36으로 알아내었다. 두 복합체에 대한 상(phase)은 공개된 DPO4 구조 (PDB 2BQ3) (J Biol Chem, 280:29750-29764, 2005)를 사용하여 분자 치환을 통해 결정되었으며, 초기 모델 구축은 PHENIX (Acta Crystallogr D, 66:213-221, 2010) 내에서 Autobuild를 사용하여 수행되었다. COOT (Acta Crystallogr D, 60:2126-2132, 2004) 및 PHENIX를 사용하여 모델 구축 및 개량을 수행하였다. 최종 모델은 MOLPROBITY (Acta Crystallogr D, 66:12-21, 2010)를 통해 검증되었다. 통계는 표 2에 요약하여 나타내었다.DPO4 and DNA duplex formed from primer (GGG GGA AGG ATT CC) and template (TCA CGG AAT CCT TCC CCC) were incubated at about 1:1.3 molar ratio at 4°C. Determination of Dpo4/D-DNA or Dpo4/L-DNA complexes was prepared using a 5:5 proportional volume of protein/DNA solution and a reservoir solution (0.1 M BIS-TRIS (pH 7.0), 0.1 M calcium acetate, 2%, respectively). glycerol, and 9% w/v PEG3350) or reservoir solution (0.1 M sodium formate, 0.05 M BICINE (pH 8.5), 10% w/v polyethylene glycol monomethyl ether 5,000, and 1.1% benzamidine-HCl ) was grown using a sitting-drop vapor diffusion method in a drop containing at 19 °C. 0.1 M BIS-TRIS (pH 7.0), 20% PEG3350, 100 mM CaOAC2, and 25% glycerol for Dpo4/D-DNA crystals, and 0.1 M sodium formate, 0.05 M BICINE (pH) for Dpo4/L-DNA crystals 8.5), 10% w/v polyethylene glycol monomethyl ether 5,000, 1.1% benzamidine-HCl and 25% glycerol were rapidly immersed in the crystals, which were immediately flash frozen with liquid nitrogen. Data were collected at a wavelength of 1.0 Å at the Pohang accelerator light source beamline 5C (Pohang, Korea). The data set was reduced and enlarged using HKL-2000 ( Method Enzymol , 276:307-326, 1997). Dpo4/D-DNA and Dpo4/L-DNA crystals were crystallized at P22 1 2 1 and P12 1 1 , and diffracted at resolutions of 2.60 and 2.36 Å, which were found to be 2.60 and 2.36, respectively. Phases for both complexes were determined through molecular substitution using the published DPO4 structure (PDB 2BQ3) ( J Biol Chem , 280:29750-29764, 2005), and initial model construction was based on PHENIX ( Acta Crystallogr D , 66:213-221, 2010) using Autobuild. Model building and refinement were performed using COOT ( Acta Crystallogr D , 60:2126-2132, 2004) and PHENIX. The final model was validated through MOLPROBITY ( Acta Crystallogr D , 66:12-21, 2010). Statistics are summarized in Table 2.

실시예 1-8: 결정 구조의 수탁 번호 획득Example 1-8: Acquisition of accession number of crystal structure

결정 구조는 RCSB 단백질 데이터 뱅크에서 DPO4/D-DNA 이중체의 수탁 코드 6L84 및 DPO4/L-DNA 이중체의 수탁코드 6L97로 기탁되었다.Crystal structures were deposited in the RCSB Protein Data Bank with accession code 6L84 for DPO4/D-DNA duplex and accession code 6L97 for DPO4/L-DNA duplex.

실시예 1-9: 다양한 유기체 유래의 Dpo4의 정렬Examples 1-9: Alignment of Dpo4 from various organisms

상기 실시예 1-2에서 수득한 술포로버스 솔파타리쿠스(S. solfataricus: Ss) Dpo4(서열번호 2)를 기준으로 고세균(archaea) 도메인에 있는 5개의 다른 종들 (술폴로부스 아시도칼다리우스[Sulfolobus acidocaldarius: Sa(서열번호 11)], 피크로필러스 토리두스[Picrophilus torridus: Pt(서열번호 12)], 메탈로스페에라 세둘라[Metallosphaera sedula: Ms(서열번호 13)], 니트로소스파이라 비에넨시스[Nitrososphaera viennensis: Nv(서열번호 14)], 아시디플라즈마 에오리쿰[Acidiplasma aeolicum: Aa(서열번호 15)])로부터의 Dpo4 (표 3 참조)를 EMBOSS Needle(https://www.ebi.ac.uk/Tools/psa/emboss_needle/)을 이용하여, pairwise sequence alignment를 수행하여 상동성을 확인하였다.5 different species (Sulpholobus acidocaldarius) in the archaea domain based on S. solfataricus : Ss) Dpo4 (SEQ ID NO: 2) obtained in Example 1-2 [ Sulfolobus acidocaldarius : Sa (SEQ ID NO: 11)], Picrophilus torridus [Picrophilus torridus: Pt (SEQ ID NO: 12)], Metallosphaera sedula [Metallosphaera sedula: Ms (SEQ ID NO: 13)], nitrosospira Dpo4 (see Table 3) from Vienensis [Nitrososphaera viennensis : Nv (SEQ ID NO: 14)], Acidiplasma aeolicum : Aa (SEQ ID NO: 15)) was transferred to the EMBOSS Needle (https:// Using www.ebi.ac.uk/Tools/psa/emboss_needle/), pairwise sequence alignment was performed to confirm homology.

그 결과, Ss Dpo4와 Sa Dpo4의 경우 55.6% (도 8), Ss Dpo4와 Pt Dpo4의 경우 48.2% (도 9), Ss Dpo4와 Ms Dpo4의 경우 56.8% (도 10), Ss Dpo4와 Nv Dpo4의 경우 35.7% (도 11), Ss Dpo4와 Aa Dpo4의 경우 44.5% (도 12)의 상동성을 보였다.As a result, in the case of Ss Dpo4 and Sa Dpo4 55.6% (FIG. 8), in the case of Ss Dpo4 and Pt Dpo4 48.2% (FIG. 9), in the case of Ss Dpo4 and Ms Dpo4 56.8% (FIG. 10), Ss Dpo4 and Nv Dpo4 of 35.7% (Fig. 11), and 44.5% (Fig. 12) of Ss Dpo4 and Aa Dpo4 (Fig. 12).

실시예 2: DNA 중합효소의 D-DNA 및 L-DNA에 대한 결합 분석Example 2: Analysis of Binding of DNA Polymerase to D-DNA and L-DNA

DNA 중합효소는 프라이머의 3'-말단에 데옥시뉴클레오시드 트리포스페이트 (dNTP)를 결합시킴으로써 프라이머 DNA를 연장시키는 단백질 효소이다. 중합효소는 효소 활성을 위한 핵심 도메인, 예컨대 썸(thumb), 팜(palm) 및 핑거(finger)를 사용하여 키랄-선택적 방식으로 D-DNA 이중체에 결합한다 (도 1). DNA 결합에 대한 중합효소의 키랄 선택성은 매우 충실한 것으로 여겨지지만, 사실상 L-DNA 결합 성질을 갖는 임의의 중합효소가 있는지의 여부는 알려져 있지 않다. 이와 관련하여, 본 발명자들은 중합효소가 L-DNA 이중체와 결합할 수 있는지의 여부를 조사하고자, 일련의 쉽게 이용 가능한 DNA 중합효소를 스크리닝하였다. 놀랍게도, 본 발명자들은 Dpo4, M-MuLV 역전사 효소 (RT) 및 클레노우 절편 (Klenow fragment, KF) (도 2)이 L-DNA 이중체에 결합할 수 있음을 밝혀내었다. 본 발명에서, 가장 작은 중합효소인 Dpo4의 L-DNA 결합 특성이 특히 조사되었다. DNA 결합에 대한 해리 상수를 결정한 후, 본 발명자들은 또한 D-DNA 및 L-DNA와 복합화된 중합효소의 결정 구조를 수득하고, 각각의 키랄성으로 DNA 결합을 담당하는 아미노산 잔기 및 도메인을 특징지었다. 구조는 주요 결합 도메인에서 D-DNA와 비교하여 L-DNA에 대한 Dpo4의 두드러지게 상이한 결합 양상, 복합체의 형태, 및 결합 화학량론을 나타내었다. 이는 천연 DNA 중합효소의 고유 L-DNA 이중체-결합 특성을 보고한 최초 연구이다.DNA polymerase is a protein enzyme that extends primer DNA by binding deoxynucleoside triphosphate (dNTP) to the 3'-end of the primer. The polymerase binds to the D-DNA duplex in a chiral-selective manner using key domains for enzymatic activity, such as thumb, palm and finger ( FIG. 1 ). Although the chiral selectivity of polymerases for DNA binding is believed to be very faithful, it is not known whether there are in fact any polymerases with L-DNA binding properties. In this regard, the present inventors screened a series of readily available DNA polymerases to investigate whether the polymerase could bind to the L-DNA duplex. Surprisingly, we found that Dpo4, M-MuLV reverse transcriptase (RT) and Klenow fragment (KF) ( FIG. 2 ) can bind to the L-DNA duplex. In the present invention, the L-DNA binding properties of the smallest polymerase, Dpo4, were specifically investigated. After determining the dissociation constant for DNA binding, we also obtained crystal structures of polymerase complexed with D-DNA and L-DNA, and characterized the amino acid residues and domains responsible for DNA binding with their respective chirality. The structure exhibited markedly different binding behavior, complex morphology, and binding stoichiometry of Dpo4 to L-DNA compared to D-DNA in the major binding domain. This is the first study to report the intrinsic L-DNA duplex-binding properties of native DNA polymerases.

실시예 3: D-DNA 및 L-DNA에 대한 DNA 중합효소 4(Dpo 4)의 결합능 분석Example 3: Analysis of binding capacity of DNA polymerase 4 (Dpo 4) to D-DNA and L-DNA

술포로부스 솔파타리커스 (Sulfolobus solfataricus, Ss) 유래의 Dpo4는 이전 연구 (K. A. Fiala & Z. Suo, Biochemistry, 43:2106-2115, 2004)에 따라 박테리아로 발현되고 정제되었다. Dpo4의 DNA 결합 능력을 조사하고자, 형광 편광 (fluorescence polarization, FP) 분석을 사용하여 해리 상수 (Kd) 값을 측정하였으며, 이는 Kd 값이 D-DNA 결합에 대해 187 nM이고 L-DNA 결합에 대해 756 nM임을 나타내었다 (도 3의 a). FP 분석에 의해 추정된 Dpo4/D-DNA 복합체에 대한 Kd 값은 이전에 보고된 값 (36 nM)보다 높았으며, 이는 상이한 분석 조건 및 방법으로 인한 것일 수 있다 (K. A. Fiala et.al., Journal of Biological Chemistry, 282:8188-8198, 2007). L-DNA 결합이 Dpo4에 결합된 D-DNA를 교란시키고 대체할 수 있는지를 확인하고자, 본 발명자들은 또한 FP 방법을 사용하여 DNA-Dpo4 상호작용에 대한 경쟁 분석을 수행하였다 (도 3의 b). 중합효소와 복합화된 형광 표지된 L-DNA의 높은 FP 수준은 비표지된 D-DNA의 첨가시 감소되었으며, 이는 D-DNA가 중합효소에 결합하기 위해 L-DNA (IC50: 670 nM)와 경쟁함을 나타낸다. 이는 Dpo4에 D-DNA 및 L-DNA에 대한 공유 결합 부위가 있음을 시사한다. 중합 활성과 관련하여, Dpo4는 L-DNA 프라이머의 3'-말단에 임의의 뉴클레오티드를 결합시킬 수 없었지만, D-DNA 프라이머의 3'-말단에 D-dTTP 및 L-dTTP를 둘 다 추가할 수 있었다 (도 3의 c). 이는 Dpo4에 있어서 L-DNA의 결합 방식이 D-DNA의 결합 방식과 동일하지 않으며 공유 결합 부위가 있지만 중합효소 활성에 적합하지 않음을 시사한다. 상이한 서열 (표 1)을 갖는 추가의 L-DNA 이중체를 사용하여 Dpo4/L-DNA 복합화를 시험하였을 시, Kd 값은 서열에 따라 다양하지만 Dpo4는 모든 시험된 L-DNA 이중체에 결합할 수 있었다. 이것은 Dpo4의 L-DNA 결합 특성이 DNA 서열에 크게 의존하지 않음을 입증한다 (도 3의 d). Dpo4 from Sulfolobus solfataricus (Ss) was bacterially expressed and purified according to a previous study (KA Fiala & Z. Suo, Biochemistry , 43:2106-2115, 2004). To investigate the DNA binding ability of Dpo4, the dissociation constant (K d ) value was measured using fluorescence polarization (FP) analysis, which indicated that the K d value was 187 nM for D-DNA binding and L-DNA binding. to 756 nM (FIG. 3a). The K d values for Dpo4/D-DNA complexes estimated by FP analysis were higher than previously reported values (36 nM), which may be due to different assay conditions and methods (KA Fiala et.al. , Journal of Biological Chemistry , 282:8188-8198, 2007). To confirm that L-DNA binding can perturb and replace D-DNA bound to Dpo4, we also performed a competition analysis for DNA-Dpo4 interaction using the FP method (Fig. 3b). . The high FP level of fluorescently labeled L-DNA complexed with polymerase was reduced upon addition of unlabeled D-DNA, indicating that D-DNA was combined with L-DNA (IC 50 : 670 nM) for binding to polymerase. indicates competition. This suggests that Dpo4 has covalent binding sites for D-DNA and L-DNA. Regarding the polymerization activity, Dpo4 was unable to bind any nucleotides to the 3'-end of the L-DNA primer, but could add both D-dTTP and L-dTTP to the 3'-end of the D-DNA primer. There was (Fig. 3c). This suggests that the binding mode of L-DNA in Dpo4 is not the same as that of D-DNA, and there is a covalent binding site, but it is not suitable for polymerase activity. When Dpo4/L-DNA complexes were tested using additional L-DNA duplexes with different sequences (Table 1), the K d values varied with the sequence, but Dpo4 bound to all tested L-DNA duplexes. Could. This demonstrates that the L-DNA binding properties of Dpo4 are not highly dependent on the DNA sequence (Fig. 3d).

Dpo4 결합에 대해 시험한 D-DNA 및 L-DNA 서열D-DNA and L-DNA sequences tested for Dpo4 binding 명칭designation 서열order 서열번호SEQ ID NO: GC-0-LGC-0-L 5'-AAAAAAAAAAAAAAAAAA-FAM-3'5'-AAAAAAAAAAAAAAAAAA-FAM-3' 33 GC-0-DGC-0-D 3'-TTTTTTTTTTTTTTTTTT-5'3'-TTTTTTTTTTTTTTTTTT-5' 44 GC-33-LGC-33-L 5'-CAATGTCTAAACTGAAAG-FAM-3'5'-CAATGTCTAAACTGAAAG-FAM-3' 55 GC-33-DGC-33-D 3'-GTTACAGATTTGACTTTC-5'3'-GTTACAGATTTGACTTTC-5' 66 GC-67-LGC-67-L 5'-GGACCGTGACTCCCTGAC-FAM-3'5'-GGACCGTGACTCCCTGAC-FAM-3' 77 GC-67-DGC-67-D 3'-CCTGGCACTGAGGGACTG-5'3'-CCTGGCACTGAGGGACTG-5' 88 GC-100-LGC-100-L 5'-GGGGGGGGGGGGGGGGGG-FAM-3'5'-GGGGGGGGGGGGGGGGGG-FAM-3' 99 GC-100-DGC-100-D 3'-CCCCCCCCCCCCCCCCCC-5'3'-CCCCCCCCCCCCCCCCCC-5' 1010

* FAM 플루오레세인을 나타낸다.* Indicates FAM fluorescein.

실시예 4: D-DNA 및 L-DNA와 복합체를 이루는 Dpo4의 결정 구조 분석Example 4: Analysis of the crystal structure of Dpo4 complexed with D-DNA and L-DNA

Dpo4는 D-DNA 뿐만 아니라 L-DNA에도 친화력이 있음을 밝혀낸 후, 본 발명자들은 단백질-DNA 상호작용의 분자적 측면을 밝히고자 각 DNA 입체 이성질체와 복합된 중합효소의 결정 구조를 조사하였다. 본 발명자들은 공간군(space group) P22121 및 P1211에 속하고 각각 2.6 및 2.36Å로 회절된 Dpo4/D-DNA 및 Dpo4/L-DNA 복합체의 결정을 수득하였다 (표 2). 두 구조 모두 이전에 보고(H. Zang et.al., Journal of Biological Chemistry, 280:29750-29764, 2005)된 Dpo4 구조 (PDB 2BQ3)를 사용한 분자 치환(molecular replacement)을 통해 알아내었다.After revealing that Dpo4 has an affinity for L-DNA as well as D-DNA, the present inventors investigated the crystal structure of the polymerase complex with each DNA stereoisomer in order to elucidate the molecular aspect of the protein-DNA interaction. The present inventors obtained crystals of Dpo4/D-DNA and Dpo4/L-DNA complexes belonging to the space groups P22 1 2 1 and P12 1 1 and diffracted to 2.6 and 2.36 Å, respectively (Table 2). Both structures were found through molecular replacement using the previously reported Dpo4 structure (PDB 2BQ3) (H. Zang et.al., Journal of Biological Chemistry , 280:29750-29764, 2005).

데이터 수집 및 개량 통계Data collection and improvement statistics Dpo4Dpo4   D-DNAD-DNA L-DNAL-DNA 데이터 수집data collection 공간군space group P 2 21 21 P 2 2 1 2 1 P 1 21 1P 1 2 1 1 단위 셀 (a, b, 및 c;Å)
(α, β, 및 γ; °)
unit cells (a, b, and c; Å)
(α, β, and γ; °)
52.8, 98.7, 100.8
90.0, 90.0, 90.0
52.8, 98.7, 100.8
90.0, 90.0, 90.0
85.9, 55.0, 96.6
90.0, 113.4, 90.0
85.9, 55.0, 96.6
90.0, 113.4, 90.0
파장 (Å)Wavelength (Å) 1.01.0 0.97940.9794 해상도a (Å)Resolution a (Å) 50-2.60 (2.64-2.60)50-2.60 (2.64-2.60) 50-2.36 (2.44-2.36)50-2.36 (2.44-2.36) Rmerge a,b(%)R merge a,b (%) 12.2 (35.9)12.2 (35.9) 12.5 (55.5)12.5 (55.5) 평균 I/σ(I) a mean I/σ ( I ) a 20.6 (5.4)20.6 (5.4) 28.5 (3.1)28.5 (3.1) 완전성a(%)Completeness a (%) 99.8 (99.8)99.8 (99.8) 97.9 (95.3)97.9 (95.3) 가외성(redundancy)a redundancy a 11.3 (7.7)11.3 (7.7) 4.6 (3.0)4.6 (3.0) 관찰된 상(reflections) (고유)Observed reflections (unique) 188,903 (16,695)188,903 (16,695) 153,932 (33,537)153,932 (33,537) 윌슨 B-인자Wilson B-factor 35.135.1 50.550.5 개량(refinement)refinement Rwork/Rfree c(%)R work /R free c (%) 18.2/22.618.2/22.6 23.0/26.623.0/26.6 asu(air separation unit) 당단백질 당 단백질 잔기asu (air separation unit) glycoprotein glycoprotein residues 341341 672672 asu 당 물 분자water molecules per asu 108108 115115 asu 당 기타 리간드Other ligands per asu 2929 2828 CACA 33 라마찬드란 도표(Ramachandran plot)Ramachandran plot 선호/허용치/이상치 (%)Preferred/acceptable/outlier (%) 95.6/4.1/0.395.6/4.1/0.3 95.3/4.7/0.095.3/4.7/0.0 Rms(root mean square) 편차root mean square (Rms) deviation 결합 길이 (Å) bond length (Å) 0.00340.0034 0.700.70 결합 각 (°) bonding angle (°) 0.4750.475 2.092.09 평균 B 인자 (Å2)mean B factor (Å 2 ) 42.742.7 66.866.8 거대분자(macromolecule) macromolecules 42.842.8 66.266.2 리간드 ligand 52.852.8 74.474.4 용매 menstruum 40.6840.68 55.955.9 PDB 코드PDB code 6L846L84 6L976L97

a 괄호 안의 수는 외부-해상도 쉘(outer-resolution shell)을 나타낸다. a Numbers in parentheses indicate outer-resolution shells.

b R merge=[Σ hkl Σ i |I-〈I〉|/Σ hkl Σ I |I|×100]. b R merge =[Σ hkl Σ i | I -< I >|/Σ hkl Σ I | I |×100].

c R factor/R free hkl F o|-|F c∥/Σ hkl |F o|, 여기서 F oF c는 각각 관찰 및 계산된 구조 인자(structure factor)이다. c R factor / R free hkl F o |-| F c │/Σ hkl | F o |, where F o and F c are the observed and calculated structure factors, respectively.

Dpo4/D-DNA 복합체의 구조는 공지된 Dpo4/D-DNA 바이너리 복합체(binary complex)의 구조와 유사하였다 (H. Ling et.al., Cell, 2001, 107:91-102). D-DNA 이중체는 마치 오른손이 '로프'를 잡는 것처럼 Dpo4의 4개 도메인 (썸, 팜, 핑거, 및 리틀 핑거)에 내장되어 있는데, 이는 이중-가닥 DNA와 복합된 Y-패밀리 DNA 중합효소의 다른 결정 구조와 일치한다 (도 4의 a) [V. Jha & H. Ling, Sci Rep, 8:15125-15125, 2018; W. Yang, Biochemistry, 53:2793-2803, 2014; Y. Zhao et.al., Proceedings of the National Academy of Sciences, 109:7269-7274, 2012]. 썸 도메인(thumb domain)은 D-DNA 이중체의 부홈(minor groove)과 상호작용하였다. 중합 활성에 결정적으로 요구되는 2가 이온 (Ca2+, 노락색 구체)을 갖는 활성 부위 잔기가 팜 도메인(palm domain)에 위치하였다. 들어오는(incoming) 뉴클레오타이드와 상호작용하는 역할을 갖는 핑거 도메인(finger domain)을 프라이머의 3'-말단에 위치시켜 신장(elongation)을 준비하였다. 리틀 핑거 도메인(little finger domain)은 D-DNA의 중합에 있어서 Dpo4의 진행도(processivity)를 개선시키는 것으로 공지되어 있다 (H. Ling et.al., Cell, 107:91-102, 2001). 중합효소와 D-DNA 이중체의 주홈 (major groove) 사이에 결합 인터페이스를 제공하고, 주형 가닥의 5'-말단을 돌출시키기 위해 핑거 도메인과 좁은 간격을 만들었다 (도 4의 a).The structure of the Dpo4/D-DNA complex was similar to that of the known Dpo4/D-DNA binary complex (H. Ling et.al. , Cell , 2001, 107:91-102). The D-DNA duplex is embedded in the four domains of Dpo4 (thumb, palm, finger, and little finger) as if the right hand is holding the 'rope', which is a Y-family DNA polymerase complexed with double-stranded DNA. (Fig. 4a) [V. Jha & H. Ling, Sci Rep , 8:15125-15125, 2018; W. Yang, Biochemistry , 53:2793-2803, 2014; Y. Zhao et.al. , Proceedings of the National Academy of Sciences , 109:7269-7274, 2012]. The thumb domain interacted with the minor groove of the D-DNA duplex. An active site residue having a divalent ion (Ca 2+ , yellow sphere) critical for polymerization activity was located in the palm domain. A finger domain having a role of interacting with incoming nucleotides was positioned at the 3'-end of the primer to prepare elongation. Little finger domains are known to improve the processivity of Dpo4 in the polymerization of D-DNA (H. Ling et.al. , Cell , 107:91-102, 2001). To provide a binding interface between the polymerase and the major groove of the D-DNA duplex, and to extrude the 5'-end of the template strand, a narrow gap was made with the finger domain (Fig. 4a).

통상적 DNA-중합효소 상호작용을 보여주는 Dpo4/D-DNA 복합체의 구조와는 극명하게 대조적으로, Dpo4/L-DNA 복합체의 구조는 비정규 DNA-중합효소 결합 인터페이스를 나타내었다. L-DNA 이중체는 중합효소의 3가지 주요 도메인 (썸 도메인, 팜 도메인, 및 핑거 도메인)과 유의한 상호작용을 갖지 않았지만, 이량체 (사슬 A 및 사슬 B)를 형성하는 2개의 Dpo4 분자로부터 2개의 리틀 핑거 도메인에 의해 만들어진 '핑키 스웨어(pinky swear)' 구조를 취하고 있었다 (도 4의 b). 도 4의 c에 도시된 바와 같이, 이 극적으로 변형된 중합효소의 전체 구조는 주로 다른 도메인으로부터 멀리 떨어진 리틀 핑거의 위치로 인한 것이었다 (도 4의 c, 상단). apo-Dpo4 (PDB : 2RDI) [J. H. Wong et.al., Journal of Molecular Biology, 379:317-330, 2008] 및 Dpo4/D-DNA 복합체에서 리틀 핑거 도메인을 핑거 도메인에 더 가깝게 만들고자 잔기 237-240 주위에 힌지(hinge)를 만드는, 가요성(flexible) 링커 (잔기 231-243)는 활성 포켓 외부에 위치한 L-DNA와 상호작용하기 위해 이완되었다. 그러나, DNA의 존재 및 키랄성에 관계없이, 각 도메인의 폴딩(folding)은 Dpo4/D-DNA 및 Dpo4/L-DNA 복합체로부터 각 도메인을 정렬함으로써 밝혀진 바와 같이 보존되었다 (근평균제곱 편차 (RMSD): 썸의 경우 0.590, 팜의 경우 0.302, 핑거의 경우 0.480, 및 리틀 핑거의 경우 0.298) (도 4의 c, 하단). L-DNA와의 복합체에서 이량체화된 Dpo4의 리틀 핑거 도메인은 β-배럴형-유사 구조를 형성하여, L-DNA에 대한 결합 인터페이스를 제공한다 (도 4의 d). 따라서, 리틀 핑거 도메인의 위치는 또한 DNA에 대한 중합효소의 결합 화학량론, 예컨대 D-DNA와 1:1 및 L-DNA와 2:1을 결정한다. 본 발명자들이 등온적정열량계(isothermal titration calorimetry, ITC)를 사용하여 Dpo4와 DNA 간의 결합 비율을 측정하였을 시, Dpo4는 1:0.9의 비율로 D-DNA에 결합되는 반면 1:0.5 (또는 2:1)의 비율로 L-DNA에 결합됨을 확인하였다 (도 4의 e). 즉, 결정 구조 상에서 단백질 2 분자와 L-DNA 이중체 1 분자가 결합하는 것으로 확인되었으며, 이는 실제 용액에 내에서도 2:1의 비율로 결합됨을 의미한다.In stark contrast to the structure of the Dpo4/D-DNA complex, which showed a typical DNA-polymerase interaction, the structure of the Dpo4/L-DNA complex exhibited a non-canonical DNA-polymerase binding interface. The L-DNA duplex did not have significant interactions with the three major domains of the polymerase (thumb domain, palm domain, and finger domain), but from two Dpo4 molecules forming a dimer (chain A and chain B). It took a 'pinky swear' structure made by two little finger domains (FIG. 4 b). As shown in Fig. 4c, the overall structure of this dramatically modified polymerase was mainly due to the location of the little finger away from other domains (Fig. 4c, top). apo-Dpo4 (PDB: 2RDI) [JH Wong et.al. , Journal of Molecular Biology , 379:317-330, 2008] and making a hinge around residues 237-240 to bring the little finger domain closer to the finger domain in the Dpo4/D-DNA complex. The linker (residues 231-243) was relaxed to interact with L-DNA located outside the active pocket. However, regardless of the presence and chirality of DNA, the folding of each domain was conserved as revealed by aligning each domain from the Dpo4/D-DNA and Dpo4/L-DNA complexes (root mean square deviation (RMSD)). : 0.590 for thumb, 0.302 for palm, 0.480 for finger, and 0.298 for little finger (Fig. 4c, bottom). The little finger domain of Dpo4 dimerized in complex with L-DNA forms a β-barrel-like structure, providing a binding interface to L-DNA (Fig. 4d). Thus, the position of the little finger domain also determines the binding stoichiometry of the polymerase to DNA, such as 1:1 with D-DNA and 2:1 with L-DNA. When the present inventors measured the binding ratio between Dpo4 and DNA using isothermal titration calorimetry (ITC), Dpo4 was bound to D-DNA in a ratio of 1:0.9 whereas 1:0.5 (or 2:1) ) was confirmed to bind to L-DNA at a ratio of ( FIG. 4 e ). That is, it was confirmed that 2 molecules of the protein and 1 molecule of the L-DNA duplex were bound on the crystal structure, meaning that they were bound in a ratio of 2:1 even in the actual solution.

실시예 5: L-DNA와 Dpo4의 LF(little finger) 도메인 간의 특이적 상호작용 분석Example 5: Analysis of specific interactions between L-DNA and the LF (little finger) domain of Dpo4

Dpo4/L-DNA 복합체의 구조에 따르면, L-DNA는 이량체화된 Dpo4의 리틀 핑거 도메인과 오로지 상호작용하였으며, 이는 리틀 핑거가 Dpo4에 대해 L-DNA 결합 특성을 갖는 데 중요하다는 것을 나타낸다. 실제로, 리틀 핑거 도메인이 결여된 절단된 Dpo4 (Dpo4-ΔLF)가 L-DNA 결합에 대해 시험된 경우, FP 분석에서 상당한 결합 친화력을 나타내지 않음을 확인하였다 (도 5의 a). 그러나, 리틀 핑거 도메인만으로도 L-DNA 결합 특성을 유지하여, 전장(full length) Dpo4와 유사한 Kd 값 (860 nM의 Kd 값)을 나타냈으며 (도 5의 a), 이에 결정 구조에 의해 밝혀진 리틀 핑거-편향된 결합 모드를 일관되게 뒷받침할 수 있다. 특히, Dpo4 이량체의 2개의 핑거 도메인에서 3개의 아미노산 잔기가 L-DNA와의 결합에 관여하였다 (도 5의 b 및 도 5의 c). 결합 인터페이스는 이들 잔기의 양으로 하전된 측쇄와 L-DNA의 음으로 하전된 인산 골격(phosphate backbone) 간의 정전기적 상호작용에 기초할 수 있다. 사슬 A에서 리틀 핑거의 Arg300 및 Lys339는 L-DNA 이중체의 주홈 근처의 인산염과 상호작용하였으며 (도 5의 b 및 도 5의 c), 사슬 B에서 리틀 핑거의 Arg300 및 Lys321는 부홈의 인산염과 상호작용하였다 (도 5의 b 및 도 5의 c). 이 아미노산을 알라닌 (Dpo4-mutLF)으로 돌연변이된 경우, L-DNA에 대한 Kd는 야생형에 비해 약 7배 감소한 5520 nM이었으며, 이들 아미노산이 Dpo4에 L-DNA 결합 특성을 부여하는 주요 잔기임을 입증하였다 (도 5의 a). 종합하면, 이러한 결과를 통해 Dpo4의 리틀 핑거 도메인(LF domain; 서열번호 1)이 L-DNA 인식에서 중요한 역할을 함을 알 수 있었다.According to the structure of the Dpo4/L-DNA complex, L-DNA only interacted with the dimerized little finger domain of Dpo4, indicating that little finger is important for possessing L-DNA binding properties to Dpo4. Indeed, it was confirmed that the truncated Dpo4 lacking the little finger domain (Dpo4-ΔLF) did not show significant binding affinity in the FP assay when tested for L-DNA binding (Fig. 5a). However, the little finger to keep the L-DNA binding properties with only domain, full-length (full length) similar K d values and Dpo4 showed the (K d values of 860 nM) (in Fig. 5 a), this revealed by the crystal structure Little finger-biased binding modes can be supported consistently. In particular, three amino acid residues in the two finger domains of the Dpo4 dimer were involved in binding to L-DNA ( FIGS. 5 b and 5 c ). The binding interface may be based on electrostatic interactions between the positively charged side chains of these residues and the negatively charged phosphate backbone of L-DNA. In chain A, Arg300 and Lys339 of the little finger interacted with phosphate near the major groove of the L-DNA duplex (Fig. 5b and Fig. 5c), and Arg300 and Lys321 of the little finger in chain B interacted with the phosphate of the minor groove of the L-DNA duplex. interacted (FIG. 5B and 5C). When this amino acid was mutated to alanine (Dpo4-mutLF), the K d for L-DNA was 5520 nM, about a 7-fold decrease compared to the wild-type, demonstrating that these amino acids are key residues conferring L-DNA binding properties to Dpo4. (Fig. 5a). Taken together, these results show that the little finger domain (LF domain; SEQ ID NO: 1) of Dpo4 plays an important role in L-DNA recognition.

실시예 6: 다양한 유기체 유래의 Dpo4의 L-DNA 결합능 분석Example 6: Analysis of L-DNA binding capacity of Dpo4 from various organisms

거울상 키랄성을 갖는 DNA 및 단백질은 천연 DNA 및 단백질과 동일하지만 미러링된 방식으로 서로 상호작용할 것으로 예상된다. 이전에, 합성 거울상 HIV-1 프로테아제는 거울상 펩타이드 기질에서만 프로테아제 활성을 갖는 것으로 보고된 바 있다 (R. Milton, S. Milton & S. Kent, Science, 256:1445-1448, 1992). 보다 최근에, 합성 거울상 DNA 중합효소는 화학적으로 합성되고, 거울상 DNA에 중합 활성을 보여 거울상 DNA 레플리콘(replicon)을 생성하였다 (A. Pech et.al., Nucleic Acids Research, 45:3997-4005, 2017; Z. Wang et.al., Nature Chemistry, 8:698, 2016). L-단백질에 대한 D-DNA와 같은 자연적으로 발달된 키랄성 선호도는 DNA-단백질 상호작용에서 엄격하게 유지되지만, 거울상-천연 상호작용 (L-단백질에 대한 L-DNA/RNA) 또는 교차-키랄성 상호작용을 나타내는 DNA 및 RNA는 여전히 SELEX를 사용하여 인위적으로 발달될 수 있다 (A. Vater & S. Klussmann, Drug Discovery Today, 20:147-155, 2015). 교차-키랄성 중합 활성을 갖는 리보자임도 발달되었다(J. T. Sczepanski & G. F. Joyce, Nature, 515:440, 2014). 이러한 연구와 구별되는, 본 발명은 Dpo4의 본질적으로 존재하는 교차-키랄성 L-DNA 결합 가능성을 기술한다. 본 발명자들이 아는 한, 이것은 서열-독립적인 방식으로 거울상 DNA와 천연 단백질의 교차-키랄성 상호작용의 최초 발견이다.DNA and proteins with mirror image chirality are expected to interact with each other in a mirrored manner, but identical to native DNA and proteins. Previously, it was reported that synthetic mirror HIV-1 protease has protease activity only on the mirror peptide substrate (R. Milton, S. Milton & S. Kent, Science , 256:1445-1448, 1992). More recently, synthetic mirror DNA polymerases were synthesized chemically and exhibited polymerization activity on mirror DNA to generate mirror DNA replicons (A. Pech et. al. , Nucleic Acids Research , 45:3997- 4005, 2017; Z. Wang et. al. , Nature Chemistry , 8:698, 2016). Naturally developed chirality preferences, such as D-DNA for L-proteins, remain stringent in DNA-protein interactions, but mirror-natural interactions (L-DNA/RNAs for L-proteins) or cross-chirality interactions DNA and RNA showing action can still be artificially developed using SELEX (A. Vater & S. Klussmann, Drug Discovery Today , 20:147-155, 2015). Ribozymes with cross-chiral polymerization activity have also been developed (JT Sczepanski & GF Joyce, Nature , 515:440, 2014). In contrast to these studies, the present invention describes the inherently present cross-chiral L-DNA binding potential of Dpo4. To the best of our knowledge, this is the first discovery of a cross-chiral interaction of a native protein with mirror DNA in a sequence-independent manner.

중합효소가 L-DNA를 인식하기 위한 리틀 핑거 도메인의 중요성은 다른 유기체로부터의 리틀 핑거를 갖는 Dpo4 중합효소가 또한 L-DNA 결합 특성을 가질 수 있음을 시사한다. 실제로, 본 발명자들은 겔-시프트 결합 분석법(gel-shift binding assay)을 사용하여 고세균(archaea) 도메인에 있는 5개의 다른 종들 (술폴로부스 아시도칼다리우스[Sulfolobus acidocaldarius: Sa], 피크로필러스 토리두스[Picrophilus torridus: Pt], 메탈로스페에라 세둘라[Metallosphaera sedula: Ms], 니트로소스파이라 비에넨시스[Nitrososphaera viennensis: Nv], 아시디플라즈마 에오리쿰[Acidiplasma aeolicum: Aa])로부터 Dpo4 (표 3 참조)를 조사하였을 시, 이들은 모두 L-DNA에 결합할 수 있음을 확인하였다 (도 6). L-DNA 결합에 대한 이들의 Kd 값은 200 내지 5088 nM으로 결정되었다. 이는 고세균 도메인의 Dpo4 중합효소가 일반적으로 L-DNA 결합 특성을 가질 수 있지만, 친화력은 유기체에 따라 달라질 수 있음을 나타낸다.The importance of the little finger domain for polymerases to recognize L-DNA suggests that Dpo4 polymerases with little fingers from other organisms may also have L-DNA binding properties. Indeed, the present inventors used a gel-shift binding assay to study five different species in the archaea domain ( Sulfolobus acidocaldarius [Sa], Pycrophilus). Torridus [ Picrophilus torridus: Pt], Metallosphaera sedula [ Metallosphaera sedula: Ms], nitrosospira When Dpo4 (see Table 3) was investigated from Vienensis [Nitrososphaera viennensis : Nv], Acidiplasma aeolicum : Aa), it was confirmed that they were all capable of binding to L-DNA ( Fig. 6). Their K d values for L-DNA binding were determined to be between 200 and 5088 nM. This indicates that the Dpo4 polymerase of the archaeal domain may generally have L-DNA binding properties, but the affinity may vary depending on the organism.

5종의 고세균 종의 Dpo4 중합효소 아미노산 서열Dpo4 polymerase amino acid sequence of 5 archaeal species 고세균 종archaea species 서열order 서열번호SEQ ID NO: 술폴로부스 아시도칼다리우스
(Sulfolobus acidocaldarius: Sa)
Sulfolovus Acidocaldarius
( Sulfolobus acidocaldarius : Sa)
MIVIFVDFDYFFAQVEEVLNPQYKGKPLVVCVYSGRTKTSGAVATANYEARKLGVKAGMPIIKAMEIAPNAVYLPMRKPVYEAFSNRIMNLLNKYADKIEIASIDEAYLDVTNKVQGNFELGVELARKIKQEILEKEKITVTVGVTPNKILAKIIADKSKPNGLGVIRPTEVQDFLNELDIDEIPGIGSVLARRLNELGIHKLRDILSKNYNELEKITGKAKALYLLKLAENKYSEPVENKSKIPHGRYLTLPYNTRDVKVILPYLKKAINEAYNKVNGIPMRITVVAIMEDLDILSKGKKFKHGISIDNAYKVAEDLLRELLIRDKRRNIRRIGVKLDNIIINKTNLSDFFDIMIVIFVDFDYFFAQVEEVLNPQYKGKPLVVCVYSGRTKTSGAVATANYEARKLGVKAGMPIIKAMEIAPNAVYLPMRKPVYEAFSNRIMNLLNKYADKIEIASIDEAYLDVTNKVQGNFELGVELARKIKQEILEKEKITVTVGVTPNKILAKIIADKSKPNGLGVIRPTEVQDFLNELDIDEIPGIGSVLARRLNELGIHKLRDILSKNYNELEKITGKAKALYLLKLAENKYSEPVENKSKIPHGRYLTLPYNTRDVKVILPYLKKAINEAYNKVNGIPMRITVVAIMEDLDILSKGKKFKHGISIDNAYKVAEDLLRELLIRDKRRNIRRIGVKLDNIIINKTNLSDFFDI 1111
피크로필러스 토리두스
(Picrophilus torridus: Pt)
picrophilus toridus
( Picrophilus torridus: Pt)
MIMLIDFDYFFAQVEEINDPSLKGKPVVVSVYSGRNERSGAVATSNYEARALGIKSGMPLYRALEIGKNRAVFLPIRKDFYQKYSDKIMDIISEYSEKMEIASIDEAYIDIDGNDCKIGIANEIKNRILNETGIKVSIGIGINKVIAKMAAEMAKPNGIKCISADETGEFLNNIKINDIPGIGKVLSKNLNEIGIEYLRDIKNFDVNKIKSILGESKTNYLYELYENKYFSPVEPRVKKNFGRYLTLPENTRDIDKIVPYLKKSIDAAYEKAPGIPQEISVVAIMEDLDIVSRSYTGNAIKRDDSINIALNLLNKIISEDNRNIRRIGVRLSKISKNNTLDDFFMIMLIDFDYFFAQVEEINDPSLKGKPVVVSVYSGRNERSGAVATSNYEARALGIKSGMPLYRALEIGKNRAVFLPIRKDFYQKYSDKIMDIISEYSEKMEIASIDEAYIDIDGNDCKIGIANEIKNRILNETGIKVSIGIGINKVIAKMAAEMAKPNGIKCISADETGEFLNNIKINDIPGIGKVLSKNLNEIGIEYLRDIKNFDVNKIKSILGESKTNYLYELYENKYFSPVEPRVKKNFGRYLTLPENTRDIDKIVPYLKKSIDAAYEKAPGIPQEISVVAIMEDLDIVSRSYTGNAIKRDDSINIALNLLNKIISEDNRNIRRIGVRLSKISKNNTLDDFF 1212
메탈로스페에라 세둘라
(Metallosphaera sedula: Ms)
Metalos Spera Sedula
( Metallosphaera sedula : Ms.)
MIVLFVDFDYFFAQVEEILNPSLKGKPVVVCVYSGRTKDSGAVATSNYEARKLGIKAGMPIIKAKEIGKDAVFLPMRKEVYQQVSRRVMNIISGYGDKLEIASIDEAYLDITRRVKDFDEAKELARKLKAEVLEKERLRVTVGIGPNKVVAKIIADMNKPDGLGIIYPEEVKDFLYNLDISKVPGVGKITEEILRKVGINRLGDVINKSGELVNLVGKSKANYLLSLANNTYHDPVESREITHRGRYVTLPENTRDLNRILPSLKRSIEEAYSKVDGIPMEIYVVAIMEDLDIVSKGKSFKFGVSQDRALSVAQELLNKILESDKRKLRRVGVRLGKITKSSTLEDFLHMIVLFVDFDYFFAQVEEILNPSLKGKPVVVCVYSGRTKDSGAVATSNYEARKLGIKAGMPIIKAKEIGKDAVFLPMRKEVYQQVSRRVMNIISGYGDKLEIASIDEAYLDITRRVKDFDEAKELARKLKAEVLEKERLRVTVGIGPNKVVAKIIADMNKPDGLGIIYPEEVKDFLYNLDISKVPGVGKITEEILRKVGINRLGDVINKSGELVNLVGKSKANYLLSLANNTYHDPVESREITHRGRYVTLPENTRDLNRILPSLKRSIEEAYSKVDGIPMEIYVVAIMEDLDIVSKGKSFKFGVSQDRALSVAQELLNKILESDKRKLRRVGVRLGKITKSSTLEDFLH 1313
니트로소스파이라 비에넨시스
(Nitrososphaera viennensis: Nv)
nitrosospira vienensis
( Nitrososphaera viennensis : Nv)
MLAPPHRVVMHIDFDYFFAQCEEVRRPEIRQRPVLVCVFSGRTEDSGVVSTANYVARKYGVKSGIPIRVAKAKLAGVDDALFLPLDASYYRQVSENAMSAIKEHADVFEHVGIDECFIDVSGRANGRFDAAEALARTVKQRVQERTKLTCSVGVAPNKMLAKIASDYNKPDGLTVVRPENALQFVSALDVDKIPGIGPKTRDRLAELGVKTAGDLASFDLFRLIKEFGKKTATYIHNAAKGIDDEPVMESAEGERRQQIMRIVTLKKDAQSAEEMYADLEEICRDVYESATEKKVAFGSVGIILVLDDLENVTRSRGLKAHASSFELLHSTARSLLDEAMGEKKRSVRRLGVRISDFQDSSGQNTLFDYFTARQGEMLAPPHRVVMHIDFDYFFAQCEEVRRPEIRQRPVLVCVFSGRTEDSGVVSTANYVARKYGVKSGIPIRVAKAKLAGVDDALFLPLDASYYRQVSENAMSAIKEHADVFEHVGIDECFIDVSGRANGRFDAAEALARTVKQRVQERTKLTCSVGVAPNKMLAKIASDYNKPDGLTVVRPENALQFVSALDVDKIPGIGPKTRDRLAELGVKTAGDLASFDLFRLIKEFGKKTATYIHNAAKGIDDEPVMESAEGERRQQIMRIVTLKKDAQSAEEMYADLEEICRDVYESATEKKVAFGSVGIILVLDDLENVTRSRGLKAHASSFELLHSTARSLLDEAMGEKKRSVRRLGVRISDFQDSSGQNTLFDYFTARQGE 1414
아시디플라즈마 에오리쿰
(Acidiplasma aeolicum: Aa)
acidiplasma aericum
( Acidiplasma aeolicum : Aa)
MPQFIIFIDFDYFFAQVEEILNPEIREKPVVVCVYSGRTETSGAVATSNYLARKIGIKSGMPLPQAMKIGKDRAVFLPIRKDIYKEWSDHIMDIISEYSDKIEIASIDEAYIDVTDSCKDFNDAVNTAQKIKDEIYNKTGVRVSVGVSVNKAIAKVLGDMAKPNGIKSVGPSEIQDFLKGLEISKIPGVGKVIGQRLNDAGIKYITDVINADRDQLINIIGTAKYNYLYDIANNTYNKPVTPREKKNFGRYMTLPENTRDVNIIIPYVKKAIDSAYEKAPGLPSELSLVAIMEDISILSRSYTGARIDKNRALEIAIGLLNRIINEDQRNIRRVGVRLGKITKNETLDDFFMPQFIIFIDFDYFFAQVEEILNPEIREKPVVVCVYSGRTETSGAVATSNYLARKIGIKSGMPLPQAMKIGKDRAVFLPIRKDIYKEWSDHIMDIISEYSDKIEIASIDEAYIDVTDSCKDFNDAVNTAQKIKDEIYNKTGVRVSVGVSVNKAIAKVLGDMAKPNGIKSVGPSEIQDFLKGLEISKIPGVGKVIGQRLNDAGIKYITDVINADRDQLINIIGTAKYNYLYDIANNTYNKPVTPREKKNFGRYMTLPENTRDVNIIIPYVKKAIDSAYEKAPGLPSELSLVAIMEDISILSRSYTGARIDKNRALEIAIGLLNRIINEDQRNIRRVGVRLGKITKNETLDDFF 1515

결론적으로, 본 발명자들은 Dpo4의 L-DNA 이중체 결합 특성을 밝혀내었다. 결정학에 의해 밝혀진 구조에 따르면, Dpo4는 2:1 결합 비율로 L-DNA와 상호작용하기 위한 리틀 핑거-기반 결합 인터페이스를 구축하고자 이량체화되었지만, 1:1 결합 비율을 갖는 모든 도메인에 의해 형성된 활성 포켓 내에 D-DNA 이중체를 내장(embedding) 시켰다. 리틀 핑거 도메인은 리틀 핑거 도메인이 각각 돌연변이되거나 절단된 경우 L-DNA에 대한 친화력이 감소되거나 상실되므로, Dpo4가 L-DNA 결합 특성을 갖는 데 중요하였다. 천연 중합효소의 L-DNA 결합 특성의 분자적 측면을 특징화하는 본 발명자들의 연구는 L-DNA 이중체와 결코 연구된 적이 없는 천연 단백질 간의 교차-키랄성 상호작용의 원리를 이해하는데 기여할 것이다.In conclusion, the present inventors revealed the L-DNA duplex binding properties of Dpo4. According to the structure revealed by crystallography, Dpo4 dimerized to establish a little finger-based binding interface for interacting with L-DNA with a 2:1 binding ratio, but the activity formed by all domains with a 1:1 binding ratio. A D-DNA duplex was embedded in the pocket. The little finger domain was important for Dpo4 to have L-DNA binding properties, as the affinity for L-DNA was reduced or lost when the little finger domain was mutated or truncated, respectively. Our study characterizing the molecular aspects of the L-DNA binding properties of natural polymerases will contribute to understanding the principles of cross-chirality interactions between L-DNA duplexes and never-explored native proteins.

<110> KOREA INSTITUTE OF SCIENCE AND TECHNOLOGY <120> An L-DNA-binding natural protein and uses thereof <130> DP-2019-0467 <160> 15 <170> KoPatentIn 3.0 <210> 1 <211> 120 <212> PRT <213> Artificial Sequence <220> <223> LF domain <400> 1 Tyr Asn Glu Pro Ile Arg Thr Arg Val Arg Lys Ser Ile Gly Arg Ile 1 5 10 15 Val Thr Met Lys Arg Asn Ser Arg Asn Leu Glu Glu Ile Lys Pro Tyr 20 25 30 Leu Phe Arg Ala Ile Glu Glu Ser Tyr Tyr Lys Leu Asp Lys Arg Ile 35 40 45 Pro Lys Ala Ile His Val Val Ala Val Thr Glu Asp Leu Asp Ile Val 50 55 60 Ser Arg Gly Arg Thr Phe Pro His Gly Ile Ser Lys Glu Thr Ala Tyr 65 70 75 80 Ser Glu Ser Val Lys Leu Leu Gln Lys Ile Leu Glu Glu Asp Glu Arg 85 90 95 Lys Ile Arg Arg Ile Gly Val Arg Phe Ser Lys Phe Ile Glu Ala Ile 100 105 110 Gly Leu Asp Lys Phe Phe Asp Thr 115 120 <210> 2 <211> 352 <212> PRT <213> Artificial Sequence <220> <223> Ss Dpo4 <400> 2 Met Ile Val Leu Phe Val Asp Phe Asp Tyr Phe Tyr Ala Gln Val Glu 1 5 10 15 Glu Val Leu Asn Pro Ser Leu Lys Gly Lys Pro Val Val Val Cys Val 20 25 30 Phe Ser Gly Arg Phe Glu Asp Ser Gly Ala Val Ala Thr Ala Asn Tyr 35 40 45 Glu Ala Arg Lys Phe Gly Val Lys Ala Gly Ile Pro Ile Val Glu Ala 50 55 60 Lys Lys Ile Leu Pro Asn Ala Val Tyr Leu Pro Met Arg Lys Glu Val 65 70 75 80 Tyr Gln Gln Val Ser Ser Arg Ile Met Asn Leu Leu Arg Glu Tyr Ser 85 90 95 Glu Lys Ile Glu Ile Ala Ser Ile Asp Glu Ala Tyr Leu Asp Ile Ser 100 105 110 Asp Lys Val Arg Asp Tyr Arg Glu Ala Tyr Asn Leu Gly Leu Glu Ile 115 120 125 Lys Asn Lys Ile Leu Glu Lys Glu Lys Ile Thr Val Thr Val Gly Ile 130 135 140 Ser Lys Asn Lys Val Phe Ala Lys Ile Ala Ala Asp Met Ala Lys Pro 145 150 155 160 Asn Gly Ile Lys Val Ile Asp Asp Glu Glu Val Lys Arg Leu Ile Arg 165 170 175 Glu Leu Asp Ile Ala Asp Val Pro Gly Ile Gly Asn Ile Thr Ala Glu 180 185 190 Lys Leu Lys Lys Leu Gly Ile Asn Lys Leu Val Asp Thr Leu Ser Ile 195 200 205 Glu Phe Asp Lys Leu Lys Gly Met Ile Gly Glu Ala Lys Ala Lys Tyr 210 215 220 Leu Ile Ser Leu Ala Arg Asp Glu Tyr Asn Glu Pro Ile Arg Thr Arg 225 230 235 240 Val Arg Lys Ser Ile Gly Arg Ile Val Thr Met Lys Arg Asn Ser Arg 245 250 255 Asn Leu Glu Glu Ile Lys Pro Tyr Leu Phe Arg Ala Ile Glu Glu Ser 260 265 270 Tyr Tyr Lys Leu Asp Lys Arg Ile Pro Lys Ala Ile His Val Val Ala 275 280 285 Val Thr Glu Asp Leu Asp Ile Val Ser Arg Gly Arg Thr Phe Pro His 290 295 300 Gly Ile Ser Lys Glu Thr Ala Tyr Ser Glu Ser Val Lys Leu Leu Gln 305 310 315 320 Lys Ile Leu Glu Glu Asp Glu Arg Lys Ile Arg Arg Ile Gly Val Arg 325 330 335 Phe Ser Lys Phe Ile Glu Ala Ile Gly Leu Asp Lys Phe Phe Asp Thr 340 345 350 <210> 3 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> GC-0-L <400> 3 aaaaaaaaaa aaaaaaaa 18 <210> 4 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> GC-0-D <400> 4 tttttttttt tttttttt 18 <210> 5 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> GC-33-L <400> 5 caatgtctaa actgaaag 18 <210> 6 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> GC-33-D <400> 6 gttacagatt tgactttc 18 <210> 7 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> GC-67-L <400> 7 ggaccgtgac tccctgac 18 <210> 8 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> GC-67-D <400> 8 cctggcactg agggactg 18 <210> 9 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> GC-100-L <400> 9 gggggggggg gggggggg 18 <210> 10 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> GC-100-D <400> 10 cccccccccc cccccccc 18 <210> 11 <211> 354 <212> PRT <213> Artificial Sequence <220> <223> Sa Dpo4 <400> 11 Met Ile Val Ile Phe Val Asp Phe Asp Tyr Phe Phe Ala Gln Val Glu 1 5 10 15 Glu Val Leu Asn Pro Gln Tyr Lys Gly Lys Pro Leu Val Val Cys Val 20 25 30 Tyr Ser Gly Arg Thr Lys Thr Ser Gly Ala Val Ala Thr Ala Asn Tyr 35 40 45 Glu Ala Arg Lys Leu Gly Val Lys Ala Gly Met Pro Ile Ile Lys Ala 50 55 60 Met Glu Ile Ala Pro Asn Ala Val Tyr Leu Pro Met Arg Lys Pro Val 65 70 75 80 Tyr Glu Ala Phe Ser Asn Arg Ile Met Asn Leu Leu Asn Lys Tyr Ala 85 90 95 Asp Lys Ile Glu Ile Ala Ser Ile Asp Glu Ala Tyr Leu Asp Val Thr 100 105 110 Asn Lys Val Gln Gly Asn Phe Glu Leu Gly Val Glu Leu Ala Arg Lys 115 120 125 Ile Lys Gln Glu Ile Leu Glu Lys Glu Lys Ile Thr Val Thr Val Gly 130 135 140 Val Thr Pro Asn Lys Ile Leu Ala Lys Ile Ile Ala Asp Lys Ser Lys 145 150 155 160 Pro Asn Gly Leu Gly Val Ile Arg Pro Thr Glu Val Gln Asp Phe Leu 165 170 175 Asn Glu Leu Asp Ile Asp Glu Ile Pro Gly Ile Gly Ser Val Leu Ala 180 185 190 Arg Arg Leu Asn Glu Leu Gly Ile His Lys Leu Arg Asp Ile Leu Ser 195 200 205 Lys Asn Tyr Asn Glu Leu Glu Lys Ile Thr Gly Lys Ala Lys Ala Leu 210 215 220 Tyr Leu Leu Lys Leu Ala Glu Asn Lys Tyr Ser Glu Pro Val Glu Asn 225 230 235 240 Lys Ser Lys Ile Pro His Gly Arg Tyr Leu Thr Leu Pro Tyr Asn Thr 245 250 255 Arg Asp Val Lys Val Ile Leu Pro Tyr Leu Lys Lys Ala Ile Asn Glu 260 265 270 Ala Tyr Asn Lys Val Asn Gly Ile Pro Met Arg Ile Thr Val Val Ala 275 280 285 Ile Met Glu Asp Leu Asp Ile Leu Ser Lys Gly Lys Lys Phe Lys His 290 295 300 Gly Ile Ser Ile Asp Asn Ala Tyr Lys Val Ala Glu Asp Leu Leu Arg 305 310 315 320 Glu Leu Leu Ile Arg Asp Lys Arg Arg Asn Ile Arg Arg Ile Gly Val 325 330 335 Lys Leu Asp Asn Ile Ile Ile Asn Lys Thr Asn Leu Ser Asp Phe Phe 340 345 350 Asp Ile <210> 12 <211> 344 <212> PRT <213> Artificial Sequence <220> <223> Pt Dpo4 <400> 12 Met Ile Met Leu Ile Asp Phe Asp Tyr Phe Phe Ala Gln Val Glu Glu 1 5 10 15 Ile Asn Asp Pro Ser Leu Lys Gly Lys Pro Val Val Val Ser Val Tyr 20 25 30 Ser Gly Arg Asn Glu Arg Ser Gly Ala Val Ala Thr Ser Asn Tyr Glu 35 40 45 Ala Arg Ala Leu Gly Ile Lys Ser Gly Met Pro Leu Tyr Arg Ala Leu 50 55 60 Glu Ile Gly Lys Asn Arg Ala Val Phe Leu Pro Ile Arg Lys Asp Phe 65 70 75 80 Tyr Gln Lys Tyr Ser Asp Lys Ile Met Asp Ile Ile Ser Glu Tyr Ser 85 90 95 Glu Lys Met Glu Ile Ala Ser Ile Asp Glu Ala Tyr Ile Asp Ile Asp 100 105 110 Gly Asn Asp Cys Lys Ile Gly Ile Ala Asn Glu Ile Lys Asn Arg Ile 115 120 125 Leu Asn Glu Thr Gly Ile Lys Val Ser Ile Gly Ile Gly Ile Asn Lys 130 135 140 Val Ile Ala Lys Met Ala Ala Glu Met Ala Lys Pro Asn Gly Ile Lys 145 150 155 160 Cys Ile Ser Ala Asp Glu Thr Gly Glu Phe Leu Asn Asn Ile Lys Ile 165 170 175 Asn Asp Ile Pro Gly Ile Gly Lys Val Leu Ser Lys Asn Leu Asn Glu 180 185 190 Ile Gly Ile Glu Tyr Leu Arg Asp Ile Lys Asn Phe Asp Val Asn Lys 195 200 205 Ile Lys Ser Ile Leu Gly Glu Ser Lys Thr Asn Tyr Leu Tyr Glu Leu 210 215 220 Tyr Glu Asn Lys Tyr Phe Ser Pro Val Glu Pro Arg Val Lys Lys Asn 225 230 235 240 Phe Gly Arg Tyr Leu Thr Leu Pro Glu Asn Thr Arg Asp Ile Asp Lys 245 250 255 Ile Val Pro Tyr Leu Lys Lys Ser Ile Asp Ala Ala Tyr Glu Lys Ala 260 265 270 Pro Gly Ile Pro Gln Glu Ile Ser Val Val Ala Ile Met Glu Asp Leu 275 280 285 Asp Ile Val Ser Arg Ser Tyr Thr Gly Asn Ala Ile Lys Arg Asp Asp 290 295 300 Ser Ile Asn Ile Ala Leu Asn Leu Leu Asn Lys Ile Ile Ser Glu Asp 305 310 315 320 Asn Arg Asn Ile Arg Arg Ile Gly Val Arg Leu Ser Lys Ile Ser Lys 325 330 335 Asn Asn Thr Leu Asp Asp Phe Phe 340 <210> 13 <211> 349 <212> PRT <213> Artificial Sequence <220> <223> Ms Dpo4 <400> 13 Met Ile Val Leu Phe Val Asp Phe Asp Tyr Phe Phe Ala Gln Val Glu 1 5 10 15 Glu Ile Leu Asn Pro Ser Leu Lys Gly Lys Pro Val Val Val Cys Val 20 25 30 Tyr Ser Gly Arg Thr Lys Asp Ser Gly Ala Val Ala Thr Ser Asn Tyr 35 40 45 Glu Ala Arg Lys Leu Gly Ile Lys Ala Gly Met Pro Ile Ile Lys Ala 50 55 60 Lys Glu Ile Gly Lys Asp Ala Val Phe Leu Pro Met Arg Lys Glu Val 65 70 75 80 Tyr Gln Gln Val Ser Arg Arg Val Met Asn Ile Ile Ser Gly Tyr Gly 85 90 95 Asp Lys Leu Glu Ile Ala Ser Ile Asp Glu Ala Tyr Leu Asp Ile Thr 100 105 110 Arg Arg Val Lys Asp Phe Asp Glu Ala Lys Glu Leu Ala Arg Lys Leu 115 120 125 Lys Ala Glu Val Leu Glu Lys Glu Arg Leu Arg Val Thr Val Gly Ile 130 135 140 Gly Pro Asn Lys Val Val Ala Lys Ile Ile Ala Asp Met Asn Lys Pro 145 150 155 160 Asp Gly Leu Gly Ile Ile Tyr Pro Glu Glu Val Lys Asp Phe Leu Tyr 165 170 175 Asn Leu Asp Ile Ser Lys Val Pro Gly Val Gly Lys Ile Thr Glu Glu 180 185 190 Ile Leu Arg Lys Val Gly Ile Asn Arg Leu Gly Asp Val Ile Asn Lys 195 200 205 Ser Gly Glu Leu Val Asn Leu Val Gly Lys Ser Lys Ala Asn Tyr Leu 210 215 220 Leu Ser Leu Ala Asn Asn Thr Tyr His Asp Pro Val Glu Ser Arg Glu 225 230 235 240 Ile Thr His Arg Gly Arg Tyr Val Thr Leu Pro Glu Asn Thr Arg Asp 245 250 255 Leu Asn Arg Ile Leu Pro Ser Leu Lys Arg Ser Ile Glu Glu Ala Tyr 260 265 270 Ser Lys Val Asp Gly Ile Pro Met Glu Ile Tyr Val Val Ala Ile Met 275 280 285 Glu Asp Leu Asp Ile Val Ser Lys Gly Lys Ser Phe Lys Phe Gly Val 290 295 300 Ser Gln Asp Arg Ala Leu Ser Val Ala Gln Glu Leu Leu Asn Lys Ile 305 310 315 320 Leu Glu Ser Asp Lys Arg Lys Leu Arg Arg Val Gly Val Arg Leu Gly 325 330 335 Lys Ile Thr Lys Ser Ser Thr Leu Glu Asp Phe Leu His 340 345 <210> 14 <211> 376 <212> PRT <213> Artificial Sequence <220> <223> Nv Dpo4 <400> 14 Met Leu Ala Pro Pro His Arg Val Val Met His Ile Asp Phe Asp Tyr 1 5 10 15 Phe Phe Ala Gln Cys Glu Glu Val Arg Arg Pro Glu Ile Arg Gln Arg 20 25 30 Pro Val Leu Val Cys Val Phe Ser Gly Arg Thr Glu Asp Ser Gly Val 35 40 45 Val Ser Thr Ala Asn Tyr Val Ala Arg Lys Tyr Gly Val Lys Ser Gly 50 55 60 Ile Pro Ile Arg Val Ala Lys Ala Lys Leu Ala Gly Val Asp Asp Ala 65 70 75 80 Leu Phe Leu Pro Leu Asp Ala Ser Tyr Tyr Arg Gln Val Ser Glu Asn 85 90 95 Ala Met Ser Ala Ile Lys Glu His Ala Asp Val Phe Glu His Val Gly 100 105 110 Ile Asp Glu Cys Phe Ile Asp Val Ser Gly Arg Ala Asn Gly Arg Phe 115 120 125 Asp Ala Ala Glu Ala Leu Ala Arg Thr Val Lys Gln Arg Val Gln Glu 130 135 140 Arg Thr Lys Leu Thr Cys Ser Val Gly Val Ala Pro Asn Lys Met Leu 145 150 155 160 Ala Lys Ile Ala Ser Asp Tyr Asn Lys Pro Asp Gly Leu Thr Val Val 165 170 175 Arg Pro Glu Asn Ala Leu Gln Phe Val Ser Ala Leu Asp Val Asp Lys 180 185 190 Ile Pro Gly Ile Gly Pro Lys Thr Arg Asp Arg Leu Ala Glu Leu Gly 195 200 205 Val Lys Thr Ala Gly Asp Leu Ala Ser Phe Asp Leu Phe Arg Leu Ile 210 215 220 Lys Glu Phe Gly Lys Lys Thr Ala Thr Tyr Ile His Asn Ala Ala Lys 225 230 235 240 Gly Ile Asp Asp Glu Pro Val Met Glu Ser Ala Glu Gly Glu Arg Arg 245 250 255 Gln Gln Ile Met Arg Ile Val Thr Leu Lys Lys Asp Ala Gln Ser Ala 260 265 270 Glu Glu Met Tyr Ala Asp Leu Glu Glu Ile Cys Arg Asp Val Tyr Glu 275 280 285 Ser Ala Thr Glu Lys Lys Val Ala Phe Gly Ser Val Gly Ile Ile Leu 290 295 300 Val Leu Asp Asp Leu Glu Asn Val Thr Arg Ser Arg Gly Leu Lys Ala 305 310 315 320 His Ala Ser Ser Phe Glu Leu Leu His Ser Thr Ala Arg Ser Leu Leu 325 330 335 Asp Glu Ala Met Gly Glu Lys Lys Arg Ser Val Arg Arg Leu Gly Val 340 345 350 Arg Ile Ser Asp Phe Gln Asp Ser Ser Gly Gln Asn Thr Leu Phe Asp 355 360 365 Tyr Phe Thr Ala Arg Gln Gly Glu 370 375 <210> 15 <211> 351 <212> PRT <213> Artificial Sequence <220> <223> Aa Dpo4 <400> 15 Met Pro Gln Phe Ile Ile Phe Ile Asp Phe Asp Tyr Phe Phe Ala Gln 1 5 10 15 Val Glu Glu Ile Leu Asn Pro Glu Ile Arg Glu Lys Pro Val Val Val 20 25 30 Cys Val Tyr Ser Gly Arg Thr Glu Thr Ser Gly Ala Val Ala Thr Ser 35 40 45 Asn Tyr Leu Ala Arg Lys Ile Gly Ile Lys Ser Gly Met Pro Leu Pro 50 55 60 Gln Ala Met Lys Ile Gly Lys Asp Arg Ala Val Phe Leu Pro Ile Arg 65 70 75 80 Lys Asp Ile Tyr Lys Glu Trp Ser Asp His Ile Met Asp Ile Ile Ser 85 90 95 Glu Tyr Ser Asp Lys Ile Glu Ile Ala Ser Ile Asp Glu Ala Tyr Ile 100 105 110 Asp Val Thr Asp Ser Cys Lys Asp Phe Asn Asp Ala Val Asn Thr Ala 115 120 125 Gln Lys Ile Lys Asp Glu Ile Tyr Asn Lys Thr Gly Val Arg Val Ser 130 135 140 Val Gly Val Ser Val Asn Lys Ala Ile Ala Lys Val Leu Gly Asp Met 145 150 155 160 Ala Lys Pro Asn Gly Ile Lys Ser Val Gly Pro Ser Glu Ile Gln Asp 165 170 175 Phe Leu Lys Gly Leu Glu Ile Ser Lys Ile Pro Gly Val Gly Lys Val 180 185 190 Ile Gly Gln Arg Leu Asn Asp Ala Gly Ile Lys Tyr Ile Thr Asp Val 195 200 205 Ile Asn Ala Asp Arg Asp Gln Leu Ile Asn Ile Ile Gly Thr Ala Lys 210 215 220 Tyr Asn Tyr Leu Tyr Asp Ile Ala Asn Asn Thr Tyr Asn Lys Pro Val 225 230 235 240 Thr Pro Arg Glu Lys Lys Asn Phe Gly Arg Tyr Met Thr Leu Pro Glu 245 250 255 Asn Thr Arg Asp Val Asn Ile Ile Ile Pro Tyr Val Lys Lys Ala Ile 260 265 270 Asp Ser Ala Tyr Glu Lys Ala Pro Gly Leu Pro Ser Glu Leu Ser Leu 275 280 285 Val Ala Ile Met Glu Asp Ile Ser Ile Leu Ser Arg Ser Tyr Thr Gly 290 295 300 Ala Arg Ile Asp Lys Asn Arg Ala Leu Glu Ile Ala Ile Gly Leu Leu 305 310 315 320 Asn Arg Ile Ile Asn Glu Asp Gln Arg Asn Ile Arg Arg Val Gly Val 325 330 335 Arg Leu Gly Lys Ile Thr Lys Asn Glu Thr Leu Asp Asp Phe Phe 340 345 350 <110> KOREA INSTITUTE OF SCIENCE AND TECHNOLOGY <120> An L-DNA-binding natural protein and uses thereof <130> DP-2019-0467 <160> 15 <170> KoPatentIn 3.0 <210> 1 <211> 120 <212> PRT <213> Artificial Sequence <220> <223> LF domain <400> 1 Tyr Asn Glu Pro Ile Arg Thr Arg Val Arg Lys Ser Ile Gly Arg Ile 1 5 10 15 Val Thr Met Lys Arg Asn Ser Arg Asn Leu Glu Glu Ile Lys Pro Tyr 20 25 30 Leu Phe Arg Ala Ile Glu Glu Ser Tyr Tyr Lys Leu Asp Lys Arg Ile 35 40 45 Pro Lys Ala Ile His Val Val Ala Val Thr Glu Asp Leu Asp Ile Val 50 55 60 Ser Arg Gly Arg Thr Phe Pro His Gly Ile Ser Lys Glu Thr Ala Tyr 65 70 75 80 Ser Glu Ser Val Lys Leu Leu Gln Lys Ile Leu Glu Glu Asp Glu Arg 85 90 95 Lys Ile Arg Arg Ile Gly Val Arg Phe Ser Lys Phe Ile Glu Ala Ile 100 105 110 Gly Leu Asp Lys Phe Phe Asp Thr 115 120 <210> 2 <211> 352 <212> PRT <213> Artificial Sequence <220> <223> Ss Dpo4 <400> 2 Met Ile Val Leu Phe Val Asp Phe Asp Tyr Phe Tyr Ala Gln Val Glu 1 5 10 15 Glu Val Leu Asn Pro Ser Leu Lys Gly Lys Pro Val Val Val Val Cys Val 20 25 30 Phe Ser Gly Arg Phe Glu Asp Ser Gly Ala Val Ala Thr Ala Asn Tyr 35 40 45 Glu Ala Arg Lys Phe Gly Val Lys Ala Gly Ile Pro Ile Val Glu Ala 50 55 60 Lys Lys Ile Leu Pro Asn Ala Val Tyr Leu Pro Met Arg Lys Glu Val 65 70 75 80 Tyr Gln Gln Val Ser Ser Arg Ile Met Asn Leu Leu Arg Glu Tyr Ser 85 90 95 Glu Lys Ile Glu Ile Ala Ser Ile Asp Glu Ala Tyr Leu Asp Ile Ser 100 105 110 Asp Lys Val Arg Asp Tyr Arg Glu Ala Tyr Asn Leu Gly Leu Glu Ile 115 120 125 Lys Asn Lys Ile Leu Glu Lys Glu Lys Ile Thr Val Thr Val Gly Ile 130 135 140 Ser Lys Asn Lys Val Phe Ala Lys Ile Ala Ala Asp Met Ala Lys Pro 145 150 155 160 Asn Gly Ile Lys Val Ile Asp Asp Glu Glu Val Lys Arg Leu Ile Arg 165 170 175 Glu Leu Asp Ile Ala Asp Val Pro Gly Ile Gly Asn Ile Thr Ala Glu 180 185 190 Lys Leu Lys Lys Leu Gly Ile Asn Lys Leu Val Asp Thr Leu Ser Ile 195 200 205 Glu Phe Asp Lys Leu Lys Gly Met Ile Gly Glu Ala Lys Ala Lys Tyr 210 215 220 Leu Ile Ser Leu Ala Arg Asp Glu Tyr Asn Glu Pro Ile Arg Thr Arg 225 230 235 240 Val Arg Lys Ser Ile Gly Arg Ile Val Thr Met Lys Arg Asn Ser Arg 245 250 255 Asn Leu Glu Glu Ile Lys Pro Tyr Leu Phe Arg Ala Ile Glu Glu Ser 260 265 270 Tyr Tyr Lys Leu Asp Lys Arg Ile Pro Lys Ala Ile His Val Val Ala 275 280 285 Val Thr Glu Asp Leu Asp Ile Val Ser Arg Gly Arg Thr Phe Pro His 290 295 300 Gly Ile Ser Lys Glu Thr Ala Tyr Ser Glu Ser Val Lys Leu Leu Gln 305 310 315 320 Lys Ile Leu Glu Glu Asp Glu Arg Lys Ile Arg Arg Ile Gly Val Arg 325 330 335 Phe Ser Lys Phe Ile Glu Ala Ile Gly Leu Asp Lys Phe Phe Asp Thr 340 345 350 <210> 3 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> GC-0-L <400> 3 aaaaaaaaaa aaaaaaaa 18 <210> 4 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> GC-0-D <400> 4 tttttttttt tttttttt 18 <210> 5 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> GC-33-L <400> 5 caatgtctaa actgaaag 18 <210> 6 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> GC-33-D <400> 6 gttacagatt tgactttc 18 <210> 7 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> GC-67-L <400> 7 ggaccgtgac tccctgac 18 <210> 8 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> GC-67-D <400> 8 cctggcactg agggactg 18 <210> 9 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> GC-100-L <400> 9 gggggggggg gggggggg 18 <210> 10 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> GC-100-D <400> 10 cccccccccc cccccccc 18 <210> 11 <211> 354 <212> PRT <213> Artificial Sequence <220> <223> Sa Dpo4 <400> 11 Met Ile Val Ile Phe Val Asp Phe Asp Tyr Phe Phe Ala Gln Val Glu 1 5 10 15 Glu Val Leu Asn Pro Gln Tyr Lys Gly Lys Pro Leu Val Val Cys Val 20 25 30 Tyr Ser Gly Arg Thr Lys Thr Ser Gly Ala Val Ala Thr Ala Asn Tyr 35 40 45 Glu Ala Arg Lys Leu Gly Val Lys Ala Gly Met Pro Ile Ile Lys Ala 50 55 60 Met Glu Ile Ala Pro Asn Ala Val Tyr Leu Pro Met Arg Lys Pro Val 65 70 75 80 Tyr Glu Ala Phe Ser Asn Arg Ile Met Asn Leu Leu Asn Lys Tyr Ala 85 90 95 Asp Lys Ile Glu Ile Ala Ser Ile Asp Glu Ala Tyr Leu Asp Val Thr 100 105 110 Asn Lys Val Gln Gly Asn Phe Glu Leu Gly Val Glu Leu Ala Arg Lys 115 120 125 Ile Lys Gln Glu Ile Leu Glu Lys Glu Lys Ile Thr Val Thr Val Gly 130 135 140 Val Thr Pro Asn Lys Ile Leu Ala Lys Ile Ile Ala Asp Lys Ser Lys 145 150 155 160 Pro Asn Gly Leu Gly Val Ile Arg Pro Thr Glu Val Gln Asp Phe Leu 165 170 175 Asn Glu Leu Asp Ile Asp Glu Ile Pro Gly Ile Gly Ser Val Leu Ala 180 185 190 Arg Arg Leu Asn Glu Leu Gly Ile His Lys Leu Arg Asp Ile Leu Ser 195 200 205 Lys Asn Tyr Asn Glu Leu Glu Lys Ile Thr Gly Lys Ala Lys Ala Leu 210 215 220 Tyr Leu Leu Lys Leu Ala Glu Asn Lys Tyr Ser Glu Pro Val Glu Asn 225 230 235 240 Lys Ser Lys Ile Pro His Gly Arg Tyr Leu Thr Leu Pro Tyr Asn Thr 245 250 255 Arg Asp Val Lys Val Ile Leu Pro Tyr Leu Lys Lys Ala Ile Asn Glu 260 265 270 Ala Tyr Asn Lys Val Asn Gly Ile Pro Met Arg Ile Thr Val Val Ala 275 280 285 Ile Met Glu Asp Leu Asp Ile Leu Ser Lys Gly Lys Lys Phe Lys His 290 295 300 Gly Ile Ser Ile Asp Asn Ala Tyr Lys Val Ala Glu Asp Leu Leu Arg 305 310 315 320 Glu Leu Leu Ile Arg Asp Lys Arg Arg Asn Ile Arg Arg Ile Gly Val 325 330 335 Lys Leu Asp Asn Ile Ile Ile Asn Lys Thr Asn Leu Ser Asp Phe Phe 340 345 350 Asp Ile <210> 12 <211> 344 <212> PRT <213> Artificial Sequence <220> <223> Pt Dpo4 <400> 12 Met Ile Met Leu Ile Asp Phe Asp Tyr Phe Phe Ala Gln Val Glu Glu 1 5 10 15 Ile Asn Asp Pro Ser Leu Lys Gly Lys Pro Val Val Val Ser Val Tyr 20 25 30 Ser Gly Arg Asn Glu Arg Ser Gly Ala Val Ala Thr Ser Asn Tyr Glu 35 40 45 Ala Arg Ala Leu Gly Ile Lys Ser Gly Met Pro Leu Tyr Arg Ala Leu 50 55 60 Glu Ile Gly Lys Asn Arg Ala Val Phe Leu Pro Ile Arg Lys Asp Phe 65 70 75 80 Tyr Gln Lys Tyr Ser Asp Lys Ile Met Asp Ile Ile Ser Glu Tyr Ser 85 90 95 Glu Lys Met Glu Ile Ala Ser Ile Asp Glu Ala Tyr Ile Asp Ile Asp 100 105 110 Gly Asn Asp Cys Lys Ile Gly Ile Ala Asn Glu Ile Lys Asn Arg Ile 115 120 125 Leu Asn Glu Thr Gly Ile Lys Val Ser Ile Gly Ile Gly Ile Asn Lys 130 135 140 Val Ile Ala Lys Met Ala Ala Glu Met Ala Lys Pro Asn Gly Ile Lys 145 150 155 160 Cys Ile Ser Ala Asp Glu Thr Gly Glu Phe Leu Asn Asn Ile Lys Ile 165 170 175 Asn Asp Ile Pro Gly Ile Gly Lys Val Leu Ser Lys Asn Leu Asn Glu 180 185 190 Ile Gly Ile Glu Tyr Leu Arg Asp Ile Lys Asn Phe Asp Val Asn Lys 195 200 205 Ile Lys Ser Ile Leu Gly Glu Ser Lys Thr Asn Tyr Leu Tyr Glu Leu 210 215 220 Tyr Glu Asn Lys Tyr Phe Ser Pro Val Glu Pro Arg Val Lys Lys Asn 225 230 235 240 Phe Gly Arg Tyr Leu Thr Leu Pro Glu Asn Thr Arg Asp Ile Asp Lys 245 250 255 Ile Val Pro Tyr Leu Lys Lys Ser Ile Asp Ala Ala Tyr Glu Lys Ala 260 265 270 Pro Gly Ile Pro Gln Glu Ile Ser Val Val Ala Ile Met Glu Asp Leu 275 280 285 Asp Ile Val Ser Arg Ser Tyr Thr Gly Asn Ala Ile Lys Arg Asp Asp 290 295 300 Ser Ile Asn Ile Ala Leu Asn Leu Leu Asn Lys Ile Ile Ser Glu Asp 305 310 315 320 Asn Arg Asn Ile Arg Arg Ile Gly Val Arg Leu Ser Lys Ile Ser Lys 325 330 335 Asn Asn Thr Leu Asp Asp Phe Phe 340 <210> 13 <211> 349 <212> PRT <213> Artificial Sequence <220> <223> Ms Dpo4 <400> 13 Met Ile Val Leu Phe Val Asp Phe Asp Tyr Phe Phe Ala Gln Val Glu 1 5 10 15 Glu Ile Leu Asn Pro Ser Leu Lys Gly Lys Pro Val Val Val Cys Val 20 25 30 Tyr Ser Gly Arg Thr Lys Asp Ser Gly Ala Val Ala Thr Ser Asn Tyr 35 40 45 Glu Ala Arg Lys Leu Gly Ile Lys Ala Gly Met Pro Ile Ile Lys Ala 50 55 60 Lys Glu Ile Gly Lys Asp Ala Val Phe Leu Pro Met Arg Lys Glu Val 65 70 75 80 Tyr Gln Gln Val Ser Arg Arg Val Met Asn Ile Ile Ser Gly Tyr Gly 85 90 95 Asp Lys Leu Glu Ile Ala Ser Ile Asp Glu Ala Tyr Leu Asp Ile Thr 100 105 110 Arg Arg Val Lys Asp Phe Asp Glu Ala Lys Glu Leu Ala Arg Lys Leu 115 120 125 Lys Ala Glu Val Leu Glu Lys Glu Arg Leu Arg Val Thr Val Gly Ile 130 135 140 Gly Pro Asn Lys Val Val Ala Lys Ile Ile Ala Asp Met Asn Lys Pro 145 150 155 160 Asp Gly Leu Gly Ile Ile Tyr Pro Glu Glu Val Lys Asp Phe Leu Tyr 165 170 175 Asn Leu Asp Ile Ser Lys Val Pro Gly Val Gly Lys Ile Thr Glu Glu 180 185 190 Ile Leu Arg Lys Val Gly Ile Asn Arg Leu Gly Asp Val Ile Asn Lys 195 200 205 Ser Gly Glu Leu Val Asn Leu Val Gly Lys Ser Lys Ala Asn Tyr Leu 210 215 220 Leu Ser Leu Ala Asn Asn Thr Tyr His Asp Pro Val Glu Ser Arg Glu 225 230 235 240 Ile Thr His Arg Gly Arg Tyr Val Thr Leu Pro Glu Asn Thr Arg Asp 245 250 255 Leu Asn Arg Ile Leu Pro Ser Leu Lys Arg Ser Ile Glu Glu Ala Tyr 260 265 270 Ser Lys Val Asp Gly Ile Pro Met Glu Ile Tyr Val Val Ala Ile Met 275 280 285 Glu Asp Leu Asp Ile Val Ser Lys Gly Lys Ser Phe Lys Phe Gly Val 290 295 300 Ser Gln Asp Arg Ala Leu Ser Val Ala Gln Glu Leu Leu Asn Lys Ile 305 310 315 320 Leu Glu Ser Asp Lys Arg Lys Leu Arg Arg Val Gly Val Arg Leu Gly 325 330 335 Lys Ile Thr Lys Ser Ser Thr Leu Glu Asp Phe Leu His 340 345 <210> 14 <211> 376 <212> PRT <213> Artificial Sequence <220> <223> Nv Dpo4 <400> 14 Met Leu Ala Pro Pro His Arg Val Val Met His Ile Asp Phe Asp Tyr 1 5 10 15 Phe Phe Ala Gln Cys Glu Glu Val Arg Arg Pro Glu Ile Arg Gln Arg 20 25 30 Pro Val Leu Val Cys Val Phe Ser Gly Arg Thr Glu Asp Ser Gly Val 35 40 45 Val Ser Thr Ala Asn Tyr Val Ala Arg Lys Tyr Gly Val Lys Ser Gly 50 55 60 Ile Pro Ile Arg Val Ala Lys Ala Lys Leu Ala Gly Val Asp Asp Ala 65 70 75 80 Leu Phe Leu Pro Leu Asp Ala Ser Tyr Tyr Arg Gln Val Ser Glu Asn 85 90 95 Ala Met Ser Ala Ile Lys Glu His Ala Asp Val Phe Glu His Val Gly 100 105 110 Ile Asp Glu Cys Phe Ile Asp Val Ser Gly Arg Ala Asn Gly Arg Phe 115 120 125 Asp Ala Ala Glu Ala Leu Ala Arg Thr Val Lys Gln Arg Val Gln Glu 130 135 140 Arg Thr Lys Leu Thr Cys Ser Val Gly Val Ala Pro Asn Lys Met Leu 145 150 155 160 Ala Lys Ile Ala Ser Asp Tyr Asn Lys Pro Asp Gly Leu Thr Val Val 165 170 175 Arg Pro Glu Asn Ala Leu Gln Phe Val Ser Ala Leu Asp Val Asp Lys 180 185 190 Ile Pro Gly Ile Gly Pro Lys Thr Arg Asp Arg Leu Ala Glu Leu Gly 195 200 205 Val Lys Thr Ala Gly Asp Leu Ala Ser Phe Asp Leu Phe Arg Leu Ile 210 215 220 Lys Glu Phe Gly Lys Lys Thr Ala Thr Tyr Ile His Asn Ala Ala Lys 225 230 235 240 Gly Ile Asp Asp Glu Pro Val Met Glu Ser Ala Glu Gly Glu Arg Arg 245 250 255 Gln Gln Ile Met Arg Ile Val Thr Leu Lys Lys Asp Ala Gln Ser Ala 260 265 270 Glu Glu Met Tyr Ala Asp Leu Glu Glu Ile Cys Arg Asp Val Tyr Glu 275 280 285 Ser Ala Thr Glu Lys Lys Val Ala Phe Gly Ser Val Gly Ile Ile Leu 290 295 300 Val Leu Asp Asp Leu Glu Asn Val Thr Arg Ser Arg Gly Leu Lys Ala 305 310 315 320 His Ala Ser Ser Phe Glu Leu Leu His Ser Thr Ala Arg Ser Leu Leu 325 330 335 Asp Glu Ala Met Gly Glu Lys Lys Arg Ser Val Arg Arg Leu Gly Val 340 345 350 Arg Ile Ser Asp Phe Gln Asp Ser Ser Gly Gln Asn Thr Leu Phe Asp 355 360 365 Tyr Phe Thr Ala Arg Gln Gly Glu 370 375 <210> 15 <211> 351 <212> PRT <213> Artificial Sequence <220> <223> Aa Dpo4 <400> 15 Met Pro Gln Phe Ile Ile Phe Ile Asp Phe Asp Tyr Phe Phe Ala Gln 1 5 10 15 Val Glu Glu Ile Leu Asn Pro Glu Ile Arg Glu Lys Pro Val Val Val 20 25 30 Cys Val Tyr Ser Gly Arg Thr Glu Thr Ser Gly Ala Val Ala Thr Ser 35 40 45 Asn Tyr Leu Ala Arg Lys Ile Gly Ile Lys Ser Gly Met Pro Leu Pro 50 55 60 Gln Ala Met Lys Ile Gly Lys Asp Arg Ala Val Phe Leu Pro Ile Arg 65 70 75 80 Lys Asp Ile Tyr Lys Glu Trp Ser Asp His Ile Met Asp Ile Ile Ser 85 90 95 Glu Tyr Ser Asp Lys Ile Glu Ile Ala Ser Ile Asp Glu Ala Tyr Ile 100 105 110 Asp Val Thr Asp Ser Cys Lys Asp Phe Asn Asp Ala Val Asn Thr Ala 115 120 125 Gln Lys Ile Lys Asp Glu Ile Tyr Asn Lys Thr Gly Val Arg Val Ser 130 135 140 Val Gly Val Ser Val Asn Lys Ala Ile Ala Lys Val Leu Gly Asp Met 145 150 155 160 Ala Lys Pro Asn Gly Ile Lys Ser Val Gly Pro Ser Glu Ile Gln Asp 165 170 175 Phe Leu Lys Gly Leu Glu Ile Ser Lys Ile Pro Gly Val Gly Lys Val 180 185 190 Ile Gly Gln Arg Leu Asn Asp Ala Gly Ile Lys Tyr Ile Thr Asp Val 195 200 205 Ile Asn Ala Asp Arg Asp Gln Leu Ile Asn Ile Ile Gly Thr Ala Lys 210 215 220 Tyr Asn Tyr Leu Tyr Asp Ile Ala Asn Asn Thr Tyr Asn Lys Pro Val 225 230 235 240 Thr Pro Arg Glu Lys Lys Asn Phe Gly Arg Tyr Met Thr Leu Pro Glu 245 250 255 Asn Thr Arg Asp Val Asn Ile Ile Ile Pro Tyr Val Lys Lys Ala Ile 260 265 270 Asp Ser Ala Tyr Glu Lys Ala Pro Gly Leu Pro Ser Glu Leu Ser Leu 275 280 285 Val Ala Ile Met Glu Asp Ile Ser Ile Leu Ser Arg Ser Tyr Thr Gly 290 295 300 Ala Arg Ile Asp Lys Asn Arg Ala Leu Glu Ile Ala Ile Gly Leu Leu 305 310 315 320 Asn Arg Ile Ile Asn Glu Asp Gln Arg Asn Ile Arg Arg Val Gly Val 325 330 335 Arg Leu Gly Lys Ile Thr Lys Asn Glu Thr Leu Asp Asp Phe Phe 340 345 350

Claims (14)

L-DNA와 결합력을 지니는, 단백질 도메인.
A protein domain having binding affinity to L-DNA.
제1항에 있어서, 상기 도메인은 서열번호 2와 서열 상동성이 30% 이상인, 단백질 도메인.
The protein domain of claim 1, wherein the domain has at least 30% sequence homology with SEQ ID NO: 2.
제1항에 있어서, 상기 도메인은 서열번호 2와 서열 상동성이 80% 이상인, 단백질 도메인.
The protein domain of claim 1, wherein the domain has at least 80% sequence homology with SEQ ID NO: 2.
서열번호 1로 표시되는 아미노산 서열로 구성된, 단리된 L-DNA 결합 도메인.
An isolated L-DNA binding domain consisting of the amino acid sequence represented by SEQ ID NO: 1.
제4항에 있어서, 상기 단리된 L-DNA 결합 도메인은 DNA 중합효소 유래인, 단리된 L-DNA 결합 도메인.
5. The isolated L-DNA binding domain of claim 4, wherein the isolated L-DNA binding domain is derived from a DNA polymerase.
제5항에 있어서, 상기 DNA 중합효소는 Dpo4(DNA polymerase 4)인, 단리된 L-DNA 결합 도메인.
The isolated L-DNA binding domain of claim 5 , wherein the DNA polymerase is DNA polymerase 4 (Dpo4).
제4항에 있어서, 상기 단리된 L-DNA 결합 도메인은 DNA 중합효소의 LF 도메인(little figner domain)인, 단리된 L-DNA 결합 도메인.
5. The isolated L-DNA binding domain of claim 4, wherein the isolated L-DNA binding domain is a little finger domain of a DNA polymerase.
제4항에 있어서, 상기 단리된 L-DNA 결합 도메인은 서열번호 2로 표시되는 아미노산 서열의 300번째 Arg(Arginine), 321번째 Lys(Lysine) 및 339번째 Lys(Lysine)으로 구성된 군으로부터 선택된 하나 이상의 아미노산 잔기가 치환 또는 변이되지 않는 것인, 단리된 L-DNA 결합 도메인.
According to claim 4, wherein the isolated L-DNA binding domain is one selected from the group consisting of Arg (Arginine) at position 300, Lys at position 321 (Lysine), and Lys at position 339 (Lysine) of the amino acid sequence shown in SEQ ID NO: 2 An isolated L-DNA binding domain wherein at least one amino acid residue is not substituted or mutated.
제1항 내지 제8항 중 어느 한 항의 도메인을 포함하는, 단백질.
A protein comprising the domain of any one of claims 1 to 8 .
제9항에 있어서, 상기 단백질은 항체-약물 복합체(antibody-drug conjugates) 제조에 적용되는 것인, 단백질.
The protein of claim 9, wherein the protein is applied to the preparation of antibody-drug conjugates.
제10항에 있어서, 상기 약물은 항암제, 앱타머, 안티센스 올리고뉴클레오타이드, 작은 간섭 리보핵산(siRNA, small interfering RNA) 및 마이크로 RNA(miRNA)로 이루어진 군으로부터 선택되는 것인, 단백질.
The protein of claim 10, wherein the drug is selected from the group consisting of anticancer drugs, aptamers, antisense oligonucleotides, small interfering ribonucleic acids (siRNA, small interfering RNA) and micro RNA (miRNA).
제9항의 단백질을 포함하는, 약물 전달체.
A drug delivery system comprising the protein of claim 9 .
제12항의 약물 전달체; 및 항암제를 포함하는, 암 치료용 약학 조성물.
The drug carrier of claim 12; And comprising an anticancer agent, a pharmaceutical composition for the treatment of cancer.
제13항에 있어서, 상기 항암제는 DNA 앱타머 또는 RNA 앱타머인, 약학 조성물.The pharmaceutical composition of claim 13, wherein the anticancer agent is a DNA aptamer or an RNA aptamer.
KR1020200003290A 2020-01-09 2020-01-09 An L-DNA-binding natural protein and uses thereof KR102285583B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200003290A KR102285583B1 (en) 2020-01-09 2020-01-09 An L-DNA-binding natural protein and uses thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200003290A KR102285583B1 (en) 2020-01-09 2020-01-09 An L-DNA-binding natural protein and uses thereof

Publications (2)

Publication Number Publication Date
KR20210090010A true KR20210090010A (en) 2021-07-19
KR102285583B1 KR102285583B1 (en) 2021-08-05

Family

ID=77126052

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200003290A KR102285583B1 (en) 2020-01-09 2020-01-09 An L-DNA-binding natural protein and uses thereof

Country Status (1)

Country Link
KR (1) KR102285583B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4116964A1 (en) 2021-07-08 2023-01-11 LG Display Co., Ltd. Gate driver and display device using the same

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150013804A (en) * 2012-05-16 2015-02-05 녹손 파르마 아게 Enzymatic synthesis of L-nucleic acids
KR20160079126A (en) * 2013-11-20 2016-07-05 녹손 파르마 아게 Synthesis of L-nucleic acids by means of an enzyme

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150013804A (en) * 2012-05-16 2015-02-05 녹손 파르마 아게 Enzymatic synthesis of L-nucleic acids
KR20160079126A (en) * 2013-11-20 2016-07-05 녹손 파르마 아게 Synthesis of L-nucleic acids by means of an enzyme

Non-Patent Citations (17)

* Cited by examiner, † Cited by third party
Title
A. Y. Lee et.al., Journal of Industrial and Engineering Chemistry, 74:187-192, 2019
B. E. Young. et.al., Chemistry - A European Journal, 25:7981-7990, 2019
C. Lin et.al., Nano Letters, 9:433-436, 2009
C. R. Simmons et.al., Journal of the American Chemical Society, 139:11254-11260, 2017
G. Ke. et.al., Journal of the American Chemical Society, 134:18908-18911, 2012
K. P. Williams et.al., Proceedings of the National Academy of Sciences, 94:11285-11290, 1997
K.-R. Kim et.al., Biomaterials, 195:1-12, 2019
K.-R. Kim et.al., Chemical Science, 5:1533-1537, 2014
K.-R. Kim et.al., Journal of Controlled Release, 243:121-131, 2016
L. Yatime et.al., Nature Communications, 6:6481, 2015
N. C. Hauser et.al., Nucleic acids research, 34:5101-5111, 2006
N. M. Luscombe et.al., Genome Biology, 1, reviews001.1., 2000
P. J. Paukstelis et.al., Crystals, 6:97, 2016
P. K. Mandal et.al., Angewandte Chemie International Edition, 53:14424-14427, 2014
T. A. Steitz, Journal of Biological Chemistry, 274:17395-17398, 1999
W. G. Purschke et.al., Nucleic acids research, 31:3027-3032, 2003
비특허문헌 1 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4116964A1 (en) 2021-07-08 2023-01-11 LG Display Co., Ltd. Gate driver and display device using the same

Also Published As

Publication number Publication date
KR102285583B1 (en) 2021-08-05

Similar Documents

Publication Publication Date Title
US20230250439A1 (en) Polynucleotide secondary structure
US20220127667A1 (en) Method of dna synthesis
Zhou et al. Aptamers as targeted therapeutics: current potential and challenges
US11879145B2 (en) Reagents and methods for replication, transcription, and translation in semi-synthetic organisms
US6605713B1 (en) Mirror-symmetrical selection and evolution of nucleic acids
CN107208096A (en) Composition and application method based on CRISPR
Hirao et al. DNA aptamer generation by ExSELEX using genetic alphabet expansion with a mini-hairpin DNA stabilization method
Hoshino et al. DNA polymerase variants with high processivity and accuracy for encoding and decoding locked nucleic acid sequences
TW201726918A (en) Compositions and methods for inhibiting gene expression of LPA
TW200909577A (en) Single-chain circular RNA and method of producing the same
CN101495504A (en) Materials and methods for the generation of fully 2&#39;-modified nucleic acid transcripts
AU2003304281B2 (en) pRNA chimera
EA036064B1 (en) Albumin-binding arginine deiminase fusion protein for treating cancer and arginine-dependent diseases
Betat et al. Exchange of regions between bacterial poly (A) polymerase and the CCA-adding enzyme generates altered specificities
KR102285583B1 (en) An L-DNA-binding natural protein and uses thereof
Davydova et al. Escort aptamers: new tools for the targeteddelivery of therapeutics into cells
Clark Jr et al. [15] Crystallization of human immunodeficiency virus type 1 reverse transcriptase with and without nucleic acid substrates, inhibitors, and an antibody fab fragment
CN114574496B (en) Nucleoside derivative modified aptamer sgc8
WO2022221550A1 (en) Fn3 domain-sirna conjugates and uses thereof
EP3733852A1 (en) Aptamer template and method for preparing aptamer by using same
JP2009005592A (en) Method for detecting single nucleotide mutant
Pitolli et al. RNA aptamers developed against tRip: A preliminary approach targeting tRNA entry in Plasmodium
CN117070514B (en) Preparation method of non-natural RNA and product
WO2023222114A1 (en) Methods of making circular rna
AU2020256316B2 (en) Molecular design of recombinant protein drug

Legal Events

Date Code Title Description
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
X701 Decision to grant (after re-examination)