KR20130055507A - 갯벌 메타게놈 유래 신규 유전자 및 이로부터 얻어지는 포스포리파제 및 리파제 동시 활성을 보이는 신규 단백질 - Google Patents
갯벌 메타게놈 유래 신규 유전자 및 이로부터 얻어지는 포스포리파제 및 리파제 동시 활성을 보이는 신규 단백질 Download PDFInfo
- Publication number
- KR20130055507A KR20130055507A KR1020120077632A KR20120077632A KR20130055507A KR 20130055507 A KR20130055507 A KR 20130055507A KR 1020120077632 A KR1020120077632 A KR 1020120077632A KR 20120077632 A KR20120077632 A KR 20120077632A KR 20130055507 A KR20130055507 A KR 20130055507A
- Authority
- KR
- South Korea
- Prior art keywords
- phospholipase
- lipase
- activity
- mplag
- gly
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/18—Carboxylic ester hydrolases (3.1.1)
- C12N9/20—Triglyceride splitting, e.g. by means of lipase
-
- C—CHEMISTRY; METALLURGY
- C11—ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
- C11D—DETERGENT COMPOSITIONS; USE OF SINGLE SUBSTANCES AS DETERGENTS; SOAP OR SOAP-MAKING; RESIN SOAPS; RECOVERY OF GLYCEROL
- C11D3/00—Other compounding ingredients of detergent compositions covered in group C11D1/00
- C11D3/16—Organic compounds
- C11D3/38—Products with no well-defined composition, e.g. natural products
- C11D3/386—Preparations containing enzymes, e.g. protease or amylase
- C11D3/38627—Preparations containing enzymes, e.g. protease or amylase containing lipase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/20—Fusion polypeptide containing a tag with affinity for a non-protein ligand
- C07K2319/21—Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a His-tag
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/20—Fusion polypeptide containing a tag with affinity for a non-protein ligand
- C07K2319/23—Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a GST-tag
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/40—Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation
- C07K2319/41—Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation containing a Myc-tag
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/40—Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation
- C07K2319/43—Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation containing a FLAG-tag
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/50—Fusion polypeptide containing protease site
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/01—Carboxylic ester hydrolases (3.1.1)
- C12Y301/01003—Triacylglycerol lipase (3.1.1.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/01—Carboxylic ester hydrolases (3.1.1)
- C12Y301/01032—Phospholipase A1 (3.1.1.32)
Landscapes
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Medicinal Chemistry (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Oil, Petroleum & Natural Gas (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
본 발명은 갯벌 메타게놈 유래 신규 유전자 및 이로부터 얻어지는 포스포리파제 및 리파제 동시 활성을 보이는 단백질에 관한 것으로, 구체적으로, 갯벌 토양 미생물의 메타게놈 라이브러리로부터 분리한 신규 유전자 및 이로부터 코딩되는 포스포리파제 및 리파제 활성을 모두 갖는 단백질은 수용성 형태로 발현되므로 대량생산이 가능하고, Ni-NTA 컬럼을 이용한 한 단계의 정제만으로 현저히 높은 순도의 단백질 수득이 가능하며, pH 5 내지 10에서 우수한 활성을 나타내고, 3℃ 내지 40℃까지 우수한 저온 활성 및 안정성을 유지하며, 다양한 유기용매에 대한 높은 내성을 가지므로, 유지의 정제 및 전환 생물의학과 정밀화학분야 등의 다양한 산업에 유용하게 이용될 수 있다.
Description
본 발명은 포스포리파제 및 리파제 동시 활성을 보이는 신규한 단백질에 관한 것으로서, 구체적으로 갯벌 토양 미생물의 메타게놈에서 분리한 신규 포스포리파제 및 리파제 활성을 모두 갖는 유전자 및 이로부터 코딩되는 칼슘 의존성 포스포리파제 및 리파제 활성을 모두 갖는 단백질에 관한 것이다.
리파제(lipase; glycerol ester hydrolases, EC 3.1.1.3)는 긴 체인의 아실글리세롤(long-chain acylglycerol)을 가수분해하거나 합성하는 α/β가수분해효소군 중의 카르복시 에스터 가수분해효소(carboxy ester hydrolase)로서 현재까지 많은 종류의 동물, 식물, 미생물이 리파제를 생산하는 것으로 알려져 있으며, 리파제의 생화학적 특성에 대한 연구와 리파제 유전자에 대한 연구가 활발히 진행되고 있다. 또한, 리파제는 생체 내에 존재하여 지방의 대사에 관여할 뿐만 아니라, 유기용제에 대한 안정성이 상대적으로 높고, 조효소가 필요 없으며, 넓은 기질 특이성과 상대적으로 높은 광학 특이성을 지니고 있어 세제 산업, 식품 첨가제 제조, 제지 산업에서의 피치(pitch) 제거, 생물 전환 반응에서의 생체 촉매로서 널리 이용되고 있다. 상기와 같이 다양한 산업적 이용가치가 있는 리파제를 고효율로 대량생산하기 위한 연구가 활발하게 진행되고 있다. 특히, 리파제를 생산하는 미생물에 관한 연구가 활발하게 이루어지고 있는데, 리파제를 생산하는 균주로는 캔디다 속(Candida sp.), 바실러스 속(Bacillus sp.), 페니실리움 속(Penicilium sp.), 뮤우코 속(Mucor sp.), 라이조푸스 속(Rhizopus sp.), 슈우도모나스 속(Pseudomonas sp.) 및 스트렙토마이세스 속(Streptomyces sp.) 등이 있다.
포스포리피드가 포스포리파제에 의해 가수분해되어 생성되는 라이소포스포리피드(lysophospholipid)는 혈소판 응집에서 작용기의 역할을 할 뿐만 아니라 신호전달 등 여러 가지 생리적 활성을 매개하거나, 식물 호르몬으로서 식물이나 과일의 과숙성을 방지하는 역할을 한다고 알려졌다. 특히, 라이소포스포리피드는 물에 대한 용해도가 높고, 다양한 수소 이온농도 및 온도에서도 안정한 유제(emulsion)를 형성시킬 수 있으며, 마그네슘과 칼슘 이온 존재 하에서도 안정성을 가지므로, 유화제(emulsifier)로서 의약, 화장품 및 식품 산업에서 다양하게 활용되고 있다.
상술한 라이소포스포리피드는 생화학적인 경로에서 인지질 가수분해효소인 포스포리파제에 의해서 포스포리피드로부터 생성될 수 있으며, 전기 과정은 포스포리파제 A가 포스포리피드의 1-아실기 또는 2-아실기를 가수분해하여 라이소포스포리피드와 지방산을 생성됨으로써 일어난다. 이러한 포스포리파제 A는 DHA 또는 EPA 등의 다가불포화지방산(PUFA)과 같은 유용지방산을 함유하는 인지질의 합성공정에 필수적인 효소이다. 이와 같은 포스포리파제 A는 다양한 포유동물, 뱀이나 벌 종류의 독성분, 세라시아 속(Serratia sp.)과 아스퍼질러스 속(Aspergillus sp.), 스트렙토마이시스 속(Streptomyces sp), 푸사리움 속 (Fusarium sp.)등의 미생물로부터 분리되어, 식품산업에 응용되고 있으나, 더욱 많은 산업 분야에 응용하기 위해서는 기질 특이성이나 효소 안정성에 있어 많은 개선의 여지가 필요하다(De Maria et al., Appl. Microbiol. Biotechnol. 74:290-300, 2007).
리파제와 포스포리파제는 그 기작이 유사함에도 불구하고, 지질과 인지질 양쪽에 대하여 동시에 활성을 갖는 것으로 알려진 효소인 Staphylococcus hyicus로부터 얻어진 리파제가 유일하다(van Oort et al., Biochemistry, 28:9278-9285, 1989). 그러나, S. hyicus 유래의 효소의 경우 대량 생산이 어려우며, 안정성 역시 상대적으로 낮아 산업적으로 이용하기에는 부적합하다.
의약품을 비롯한 부가가치가 높은 선도물질을 합성하는 정밀화학분야에서, 기존의 화학적인 방법으로 에스테르화합물을 합성하는 경우, 고온과 고압에서 합성되기 때문에 에너지가 많이 소모되며 품질에 나쁜 영향을 주는 여러 가지 부반응이 일어날 뿐 아니라, 전환율 및 특정 광학이성체의 순도가 낮아서 고순도의 정밀화학제품 생산에 어려움이 있어왔다. 최근에는 이러한 문제점을 보완하기 위해서, 위치특이성과 광학활성 특이성을 나타내는 효소를 생촉매로 사용하는 반응이 활발히 연구되고 있으나, 저온에서 활성이 떨어지는 단점 때문에 응용가능성에 제한을 받고 있다.
또한, 리파제는 지방성분의 때를 물에 잘 녹는 지방산 또는 글리세롤로 가수분해시켜 계면활성제의 작용을 용이하게 해주는 기능이 있어 세제, 표백제의 첨가제로 연구돼 왔지만, 현재까지 사용실적이 미미한 상태이다. 이는 낮은 세정온도에서 리파제의 활성이 떨어지는 단점으로 인해, 지방이나 유지성분이 불량하게 혹은 불완전하게 제거되기 때문이다.
한편, 활성이나 안정성이 뛰어난 효소를 발굴하고자 하는 노력은 주로 배양이 가능한 미생물을 대상으로 이루어졌고, 이로부터 밝혀진 다양한 미생물 효소들이 산업적으로 이용되고 있다. 그러나 최근 많은 분자미생물 생태학의 연구들은 자연계에 존재하는 99% 이상의 미생물들이 실험실에서 행해지는 전통적인 배양기법을 통해서는 분리 동정 되지 않는다는 사실을 증명하였다(Amann et al., Microbiol. Rev. 59: 143-169, 1995; Hugenholtz and Pace, Trends Biotechnol. 14: 190-197, 1996; Ward et al., Nature 345: 63-65, 1990). 따라서 자연계로부터 배양 없이 직접적으로 추출한 모든 미생물의 유전체인 메타게놈(metagenome)을 이용하여 라이브러리를 만들어 그동안 배양되지 않아서 이용하지 못했던 많은 신규 유전자들을 발굴하고 그 유용 산물을 확보하고자 하는 새로운 연구가 진행되고 있다.
메타게놈(metagenome)은 자연계에 존재하는 모든 미생물의 유전체를 통칭하는 것으로 정의된다. 일반적으로, 메타게놈 연구는 자연계 시료로부터 미생물을 배양하지 않고 메타게놈을 분리한 후, 이들을 라이브러리로 작성하여 배양가능한 대장균에 도입하는 단계로 구성된다. 이는 배양이 불가능했던 미생물로부터 유용 산물을 확보하기 위한 방법으로, 유전자의 유래가 되는 미생물에 대한 정보는 얻기가 어려우나 미생물의 산물과 유전자를 동시에 확보할 수 있는 장점이 있다.
미국 위스콘신 대학 연구팀은 처음으로 대형 메타게놈을 성공적으로 분리하여 인위적 염색체(bacterial artificial chromosome, BAC) 벡터에 클로닝하여 메타게놈 라이브러리를 구축하였고, 이로부터 광범위한 항생물질 및 그의 생합성에 관련된 유전자들을 분리하였다 (Gillespie et al., Appl. Environ. Microbiol. 68: 4301-4306, 2002; Rondon et al., Appl. Environ. Microbiol. 66: 2541-2547, 2000). TIGR (The Institute for Genomic Research) 연구팀에서도 해양 미생물의 총 미생물 메타게놈 라이브러리를 BAC 벡터에 구축하여 해양 생태계로부터 배양되지 않는 미생물의 유전자원 탐색을 시도하고 있다.
이에, 본 발명자들은 다양한 미생물이 존재하는 갯벌 토양 미생물의 메타게놈 라이브러리로부터 신규 유전자를 분리하여, 상기 유전자를 포함하는 벡터를 제작하고, 상기 벡터를 대장균에 형질전환 한 후 상기 형질전환체로부터 생산된 단백질이 우수한 포스포리파제 및 리파제 동시 활성을 나타내고, 저온 및 염기성에서 우수한 활성과 안정성을 가지는 것을 확인함으로써 본 발명을 완성하였다.
본 발명의 목적은 갯벌 토양 미생물의 메타게놈에서 분리한 신규 유전자, 상기 유전자들을 포함하는 재조합 벡터, 상기 발현벡터가 형질 도입된 형질전환체 및 상기 유전자로부터 암호화되는 포스포리파제 및 리파제 활성을 모두 갖는 폴리펩티드를 제공하는 것이다.
본 발명의 다른 목적은 본 발명의 포스포리파제 및 리파제 활성을 모두 갖는 폴리펩티드를 유효성분으로 함유하는 세제첨가제를 제공하는 것이다.
상기와 같은 목적을 달성하기 위해, 본 발명은 서열번호 5로 기재되는 아미노산 서열로 구성되며, 포스포리파제 및 리파제 활성을 모두 갖는 폴리펩티드를 제공한다.
또한, 본 발명은 본 발명의 폴리펩티드를 암호화하는 폴리뉴클레오티드를 제공한다.
또한, 본 발명은 본 발명의 폴리뉴클레오티드를 포함하는 재조합 발현벡터를 제공한다.
또한, 본 발명은 본 발명의 재조합 발현벡터가 숙주세포에 형질 도입된 형질전환체를 제공한다.
또한, 본 발명은,
1) 본 발명의 폴리뉴클레오티드를 포함하는 재조합 발현벡터를 제조하는 단계;
2) 상기 재조합 발현벡터를 숙주세포에 도입하여 형질전환체를 제조하는 단계; 및,
3) 상기 형질전환체를 배양하여 재조합 단백질의 발현을 유도하고 이를 수득하는 단계를 포함하는 포스포리파제 및 리파제 활성을 모두 갖는 재조합 단백질 제조방법을 제공한다.
또한, 본 발명은 본 발명의 포스포리파제 및 리파제 활성을 모두 갖는 폴리펩티드를 유효성분으로 함유하는 세제첨가제를 제공한다.
본 발명의 갯벌 토양 미생물의 메타게놈 라이브러리로부터 분리한 신규 유전자 및 이로부터 코딩되는 포스포리파제 및 리파제 활성을 모두 갖는 단백질은 수용성 형태로 발현되므로 대량생산이 가능하고, Ni-NTA 컬럼을 이용한 한 단계의 정제만으로 현저히 높은 순도의 단백질 수득이 가능하며, pH 5 내지 10에서 우수한 활성을 나타내고, 3℃ 내지 40℃까지 우수한 저온 활성 및 안정성을 유지하며, 다양한 유기용매에 대한 높은 내성을 가지므로, 유지의 정제 및 전환 생물의학과 정밀화학분야 등의 다양한 산업에 유용하게 이용될 수 있다.
도 1은 본 발명의 포스포리파제/리파제 PlaG(포스포리파제 및 리파제 활성을 모두 가지는 단백질 PlaG)와 그의 아미노 말단(A)과 유사한 단백질 또는 카르복시 말단(B)과 유사한 단백질 사이의 상동성을 비교한 결과이다:
ZP_02001945는 Beggiatoa sp. PS유래의 분비성 단백질(secreted protein);
EBL22535는 해양 메타게놈 유래의 가상단백질(hypothetical protein);
AAD10476은 Serratia sp. MK1유래의 포스포리파제 A1(phospholipase A1);
AAM13978은 Serratia marcescens유래의 포스포리파제(phospholipase);
YP_001005338은 Yersinia enterocolitica 8081유래의 포스포리파제 A(phospholipase A);
YP_001479905은 Serratia proteamaculans 568유래의 포스포리파제 A1(phospholipase A1); 및
*로 표시돼 있는 아미노산들은 잘 보존되어있는 리파제 특이적 세작용기 촉매(catalytic triad)를, 밑줄은 포스포리파제 A의 세린(Ser) 잔기 주변의 공통적인 아미노산 서열들을 나타낸다.
도 2는 본 발명에 따른 갯벌 토양 미생물의 메타게놈 유래의 신규 PlaG 유전자의 기능 도메인인 MPlaG를 포함하는 재조합 벡터 pET22b(+)-MPlaG의 모식도이다.
도 3은 갯벌 메타게놈 유래 포스포리파제/리파제 MPlaG(포스포리파제 및 리파제 활성을 모두 가지는 단백질 MPlaG)와 기존에 알려진 리파제 패밀리(family)로부터 선별된 여러 리파제, 포스포리파제/리파제 MPlaG와 유사한 포스포리파제 및 다른 알려진 포스포리파제와의 계통발생나무 (phylogenetic tree)를 구축한 것이다; 계통발생나무는 프로그램 MEGALIGN을 이용하여 구축되었고, 막대기는 아미노산 치환 발생을 나타낸다.
도 4는 본 발명의 포스포리파제/리파제 MPlaG의 트리카프릴린(tricaplyrin)과 포스파티딜콜린(phosphatidylcholine) 에멀젼이 첨가된 고체배지 상에서의 활성을 나타낸 결과로서, 음성대조군으로서 형질전환체를 만들기 위해 사용한 숙주 세포인 대장균 BL21(DE3)의 세포 용해물을 사용하였고 리파제-양성 대조군으로서 Candida antarctica의 lipase B(CALB)를 사용하였다.
도 5는 pH에 따른 본 발명의 포스포리파제/리파제 MPlaG의 활성(●)과 안정성(■)을 나타낸 그래프이다.
도 6은 온도에 따른 본 발명의 포스포리파제/리파제 MPlaG 활성을 나타낸 그래프이다.
도 7은 0mM(-), 2mM(○), 5mM(●) 칼슘에 의한 본 발명의 포스포리파제/리파제 MPlaG의 녹는 온도(melting temperature)의 변화를 보여준다.
도 8은 다양한 포스포리피드에 대한 본 발명의 포스포리파제/리파제 MPlaG의 기질특이성을 보여준다.
도 9은 (a)트리글리세라이드, (b)파라-니트로페닐 에스테르 및 (C)포스파티딜콜린에 대한 MPlaG의 사슬 길이 특이성를 각각 pH-적정, 분광분석, LC-MS 법을 이용하여 측정한 것이다; (a), (b)에서 수직 및 수평선은 각각 기질 탄소 사슬 길이 및 최대 활성을 100%라 했을 때의 상대적 활성을 나타낸다; LC-MS 분석에 있어서, 포스파티딜콜린 기질에 대한 MPlaG의 반응 생성물은 HPLC를 이용하여 하기의 보유 시간(retention time)에서 분리되었다: diC6PC, 8.77 분(m/z 498의 1,2-디헥사노일-포스파티딜콜린(1,2-dihexanoyl-phosphatidylcholine), 89.6%) 및 10.36 분 (m/z 400의 2-헥사노일-라이소포스파티딜콜린(2-hexanoyl-lysophosphatidylcholine), 10.4%); diC7PC, 8.40 분 (m/z 526의 1,2-디헵타노일-포스파티딜콜린(1,2-diheptanoyl-phosphatidylcholine), 50.5%) 및 9.99 분 (m/z 414의 2-헵타노일-라이소포스파티딜콜린(2-heptanoyl-lysophosphatidylcholine), 49.5%); diC8PC, 8.14 분 (m/z 554의 1,2-디옥타노일-포스파티딜콜린(1,2-dioctanoyl-phosphatidylcholine), 49.6%) 및 9.73 분 (m/z 428의 2-옥타노일-라이소포스파티딜콜린(2-octanoyl-lysophosphatidylcholine), 50.4%); diC14PC, 7.68 분 (m/z 722의 1,2-디미리스토일-포스파티딜콜린(1,2-dimyristoyl-phosphatidylcholine), 96.5%) 및 8.91 분 (m/z 512의 2-미리스토일-라이소포스파티딜콜린(2-myristoyl-lysophosphatidylcholine), 3.5%).
도 10은 정제된 본 발명의 포스포리파제/리파제 MPlaG를 확인하기 위하여, SDS-PAGE(Sodium dodecylsulfate-polyacrylamide gel electrophoresis)로 확인한 결과를 나타낸 도이다:
M: size marker;
레인 1: 전장(full-length) 단백질인 포스포리파제/리파제 PlaG;
레인 2: 절단형 단백질(truncated protein) 1; 및
레인 3: 절단형 단백질 2(포스포리파제/리파제 MPlaG).
도 11은 MPlaG의 포스포리파제 A1 활성을 동정한 것을 나타낸 도이다; OPPC(1-올레오일-2-팔미토일-포스파티딜콜린, 1-oleoyl-2-palmitoyl-phosphatidylcholine)에 대한 MPlaG의 위치적 특이성을 LC-MS를 이용하여 결정하였다;(a) MPlaG에 의한 반응 생성물은 HPLC를 이용하여 16.93분(m/z 804, OPPC, (b)의 위쪽 그래프) 및 18.14 분(m/z 540, 2-팔미토일-라이소포스파티딜콜린(2-palmitoyl-lysophoaphatidylcholine), (b)의 아래쪽 그래프)에 분리되었다.
ZP_02001945는 Beggiatoa sp. PS유래의 분비성 단백질(secreted protein);
EBL22535는 해양 메타게놈 유래의 가상단백질(hypothetical protein);
AAD10476은 Serratia sp. MK1유래의 포스포리파제 A1(phospholipase A1);
AAM13978은 Serratia marcescens유래의 포스포리파제(phospholipase);
YP_001005338은 Yersinia enterocolitica 8081유래의 포스포리파제 A(phospholipase A);
YP_001479905은 Serratia proteamaculans 568유래의 포스포리파제 A1(phospholipase A1); 및
*로 표시돼 있는 아미노산들은 잘 보존되어있는 리파제 특이적 세작용기 촉매(catalytic triad)를, 밑줄은 포스포리파제 A의 세린(Ser) 잔기 주변의 공통적인 아미노산 서열들을 나타낸다.
도 2는 본 발명에 따른 갯벌 토양 미생물의 메타게놈 유래의 신규 PlaG 유전자의 기능 도메인인 MPlaG를 포함하는 재조합 벡터 pET22b(+)-MPlaG의 모식도이다.
도 3은 갯벌 메타게놈 유래 포스포리파제/리파제 MPlaG(포스포리파제 및 리파제 활성을 모두 가지는 단백질 MPlaG)와 기존에 알려진 리파제 패밀리(family)로부터 선별된 여러 리파제, 포스포리파제/리파제 MPlaG와 유사한 포스포리파제 및 다른 알려진 포스포리파제와의 계통발생나무 (phylogenetic tree)를 구축한 것이다; 계통발생나무는 프로그램 MEGALIGN을 이용하여 구축되었고, 막대기는 아미노산 치환 발생을 나타낸다.
도 4는 본 발명의 포스포리파제/리파제 MPlaG의 트리카프릴린(tricaplyrin)과 포스파티딜콜린(phosphatidylcholine) 에멀젼이 첨가된 고체배지 상에서의 활성을 나타낸 결과로서, 음성대조군으로서 형질전환체를 만들기 위해 사용한 숙주 세포인 대장균 BL21(DE3)의 세포 용해물을 사용하였고 리파제-양성 대조군으로서 Candida antarctica의 lipase B(CALB)를 사용하였다.
도 5는 pH에 따른 본 발명의 포스포리파제/리파제 MPlaG의 활성(●)과 안정성(■)을 나타낸 그래프이다.
도 6은 온도에 따른 본 발명의 포스포리파제/리파제 MPlaG 활성을 나타낸 그래프이다.
도 7은 0mM(-), 2mM(○), 5mM(●) 칼슘에 의한 본 발명의 포스포리파제/리파제 MPlaG의 녹는 온도(melting temperature)의 변화를 보여준다.
도 8은 다양한 포스포리피드에 대한 본 발명의 포스포리파제/리파제 MPlaG의 기질특이성을 보여준다.
도 9은 (a)트리글리세라이드, (b)파라-니트로페닐 에스테르 및 (C)포스파티딜콜린에 대한 MPlaG의 사슬 길이 특이성를 각각 pH-적정, 분광분석, LC-MS 법을 이용하여 측정한 것이다; (a), (b)에서 수직 및 수평선은 각각 기질 탄소 사슬 길이 및 최대 활성을 100%라 했을 때의 상대적 활성을 나타낸다; LC-MS 분석에 있어서, 포스파티딜콜린 기질에 대한 MPlaG의 반응 생성물은 HPLC를 이용하여 하기의 보유 시간(retention time)에서 분리되었다: diC6PC, 8.77 분(m/z 498의 1,2-디헥사노일-포스파티딜콜린(1,2-dihexanoyl-phosphatidylcholine), 89.6%) 및 10.36 분 (m/z 400의 2-헥사노일-라이소포스파티딜콜린(2-hexanoyl-lysophosphatidylcholine), 10.4%); diC7PC, 8.40 분 (m/z 526의 1,2-디헵타노일-포스파티딜콜린(1,2-diheptanoyl-phosphatidylcholine), 50.5%) 및 9.99 분 (m/z 414의 2-헵타노일-라이소포스파티딜콜린(2-heptanoyl-lysophosphatidylcholine), 49.5%); diC8PC, 8.14 분 (m/z 554의 1,2-디옥타노일-포스파티딜콜린(1,2-dioctanoyl-phosphatidylcholine), 49.6%) 및 9.73 분 (m/z 428의 2-옥타노일-라이소포스파티딜콜린(2-octanoyl-lysophosphatidylcholine), 50.4%); diC14PC, 7.68 분 (m/z 722의 1,2-디미리스토일-포스파티딜콜린(1,2-dimyristoyl-phosphatidylcholine), 96.5%) 및 8.91 분 (m/z 512의 2-미리스토일-라이소포스파티딜콜린(2-myristoyl-lysophosphatidylcholine), 3.5%).
도 10은 정제된 본 발명의 포스포리파제/리파제 MPlaG를 확인하기 위하여, SDS-PAGE(Sodium dodecylsulfate-polyacrylamide gel electrophoresis)로 확인한 결과를 나타낸 도이다:
M: size marker;
레인 1: 전장(full-length) 단백질인 포스포리파제/리파제 PlaG;
레인 2: 절단형 단백질(truncated protein) 1; 및
레인 3: 절단형 단백질 2(포스포리파제/리파제 MPlaG).
도 11은 MPlaG의 포스포리파제 A1 활성을 동정한 것을 나타낸 도이다; OPPC(1-올레오일-2-팔미토일-포스파티딜콜린, 1-oleoyl-2-palmitoyl-phosphatidylcholine)에 대한 MPlaG의 위치적 특이성을 LC-MS를 이용하여 결정하였다;(a) MPlaG에 의한 반응 생성물은 HPLC를 이용하여 16.93분(m/z 804, OPPC, (b)의 위쪽 그래프) 및 18.14 분(m/z 540, 2-팔미토일-라이소포스파티딜콜린(2-palmitoyl-lysophoaphatidylcholine), (b)의 아래쪽 그래프)에 분리되었다.
이하, 본 발명에서 사용된 용어를 정의한다.
본 발명에서 사용된 용어 "재조합 발현벡터"란 적당한 숙주세포에서 목적 단백질 또는 목적 RNA을 발현할 수 있는 벡터로서, 발현벡터의 전사에 제공되는 추가단편에 작동가능하게 연결된 관심의 폴리펩티드를 암호화하는 단편으로 구성되는 선형 또는 원형의 DNA 분자이다. 그와 같은 추가단편은 프로모터 및 종료암호 서열을 포함한다. 발현벡터는 하나 이상의 복제 개시점, 하나 이상의 선택마커, 폴리아데닐화 신호 등을 또한 포함한다. 발현벡터는 일반적으로 플라스미드 또는 바이러스 DNA로부터 유도되거나, 또는 둘 다의 요소를 함유한다.
본 발명에서 사용된 용어 "작동가능하게 연결된(operably linked)"이란 일반적인 기능을 수행하도록 핵산 발현조절 서열과 목적하는 단백질 또는 RNA를 코딩하는 핵산 서열이 기능적으로 연결(functional linkage)되어 있는 것을 말한다. 예를 들어 프로모터와 단백질 또는 RNA를 코딩하는 핵산 서열이 작동가능하게 연결되어 코딩하는 핵산 서열의 발현에 영향을 미칠 수 있다. 재조합 벡터와의 작동적 연결은 당해 기술분야에서 잘 알려진 유전자 재조합 기술을 이용하여 제조할 수 있으며, 부위-특이적 DNA 절단 및 연결은 당해 기술 분야에서 일반적으로 알려진 효소 등을 사용한다.
이하, 본 발명을 상세히 설명한다.
본 발명은 서열번호 5로 기재되는 아미노산 서열로 구성되며, 포스포리파제 및 리파제 활성을 모두 갖는 폴리펩티드를 제공한다.
또한, 본 발명은 서열번호 5로 기재되는 포스포리파제 및 리파제 활성을 모두 갖는 폴리펩티드를 암호화하는 폴리뉴클레오티드를 제공한다.
상기 포스포리파제 및 리파제는 pH가 5 내지 10에서 우수한 활성을 나타내는 것이 바람직하고, pH가 6 내지 9인 것이 보다 바람직하고, pH가 8인 것이 가장 바람직하나 이에 한정되지 않는다.
상기 포스포리파제 및 리파제는 활성온도가 3 내지 30℃인 것이 바람직하고, 5 내지 25℃인 것이 보다 바람직하나 이에 한정되지 않는다.
상기 폴리뉴클레오티드는 서열번호 3으로 기재되는 염기서열로 구성되는 것이 바람직하나 이에 한정되지 않는다.
본 발명의 구체적인 실시예에서 갯벌의 토양샘플로부터 DNA를 추출하고 이를 포스미드(fosmid) 벡터에 클로닝하여 메타게놈 라이브러리를 제작하고, 이 라이브러리를 트리카프릴린(tricaprylin) 에멀젼이 첨가된 영양고체배지에 도말하여 배양하였다. 그 후, 투명환을 생성하는 콜로니를 탐색하여 재조합 플라스미드(pFosPlaG)를 분리하고, 전체 염기서열 분석하였으며, 이들 유전자를 미국 GenBank에 등록번호 EU285670으로 등록하였다(서열번호: 1). 서열번호 1의 염기서열에서 상보적인 뉴클레오티드 번호 2881에서 4578 부위에 해당하는 전사해독프레임(open reading frame, ORF)은 본 발명의 포스포리파제 및 리파제 활성을 모두 갖는 단백질 코딩 영역으로, 서열번호 2의 1698 bp의 염기서열을 갖는 포스포리파제 및 리파제 활성을 모두 갖는 유전자 부위로 결정하고, 상기 포스포리파제 및 리파제 활성을 모두 갖는 유전자를 PlaG로 명명하였다.
본 발명의 구체적인 실시예에서 본 발명의 포스포리파제/리파제 PlaG(포스포리파제 및 리파제 활성을 모두 가지는 단백질 PlaG) 서열을 블라스트(BLAST) 데이터베이스를 이용하여 기존 단백질과 비교해 본 결과, 전체서열 중 아미노 말단 부위와 카르복시 말단 부위가 별개의 각각 다른 특징의 단백질들과 상동성을 나타내었다. 아미노 말단의 287개의 아미노산 잔기들은 Beggiatoa sp. PS유래의 분비 단백질(secreted protein; ZP_02001945)과 54%로 가장 높은 유사성을 나타내었다(도 1A 참조). 반면, 카르복시 말단의 167개의 아미노산 잔기들은 Grimontia hollisae CIP 101886의 포스포리파제와 가장 높은 유사성을 나타내었으며, 이전에 보고된 포스포리파제 유전자 집단과 30~35% 정도의 낮은 상동성을 보여 포스포리파제를 암호화하는 신규한 유전자로서 확인되었다. 또한, 본 발명의 포스포리파제/리파제 PlaG와 이와 유사한 포스포리파제의 아미노산 서열 사이의 상동성을 비교한 결과, α/β가수분해효소의 보존적인 글리신-X-세린-X-글리신(Gly-X-Ser-X-Gly)의 공통서열(consensus sequence) 내의 435번째 세린잔기(Ser), 496번째 아스파라긴산(Asp), 550번째 히스티딘(His)으로 이루어져 있는 세작용기 촉매(catalytic triad)를 갖고 있었으며 그 주변의 아미노산들이 포스포리파제 A의 특징적 서열들로 이루어져 있는 것을 확인하였다(도 1B 참조). 특히, 아미노 말단의 26개의 아미노산 잔기들은 분비 시그날 펩티드(signal peptide)로 동정 되어졌으며, 분비 시그날 펩티드가 끝나는 27번째 알라닌 잔기(Ala)부터 157번째 글리신 잔기(Gly)는 다음의 아미노산인 158번째 트레오닌 잔기(Thr)부터 287번째 글리신 잔기(Gly)까지 반복되는 서열로 구성돼 있었다. 즉, 서열번호 2의 유전자는 아미노 말단 287개의 아미노산으로 구성돼 있는 구조 도메인과 카르복시 말단의 278개의 아미노산으로 이루어져 있는 기능 도메인(MPlaG)으로 구성돼 있는 것을 확인하였다. 이러한 분석을 근거로 하여, 서열번호 2로부터 기능 도메인만으로 이루어져 있는 전사해독프레임을 MPlaG를 디자인하였고, 이를 서열번호 3에 나타내었다. 이러한 전사해독프레임의 디자인은 리파제와 같은 경우 일반적으로 세포 바깥으로 분비되는 경우가 많으며, 이러한 과정은 미생물에 따라 다르기 때문에, 이로 인한 외래 단백질 발현의 난점을 피하기 위함이기도 하다. 서열번호 3의 포스포리파제 및 리파제 활성을 모두 갖는 MPlaG 유전자 중 구아닌시토신 비율은 44.1%였으며, 이로부터 얻어지는 단백질의 분자량은 약 30.5 kDa이며, 등전점은 pI 4.0으로 추측되었다.
본 발명의 구체적인 실시예에서, 본 발명의 서열번호 3에 의해 코딩되는 폴피펩티드인 포스포리라제/리파제 MPlaG(포스포리파제 및 리파제 활성을 모두 갖는 단백질 MPlaG)의 아미노산 서열(서열번호: 5)은 기존에 알려진 다양한 리파제 및 포스포리파제의 아미노산 서열들과 함께 계통발생나무(phylogenetic tree)를 구축하였다. 그 결과, 본 발명의 포스포리파제/리파제 MPlaG는 어떠한 리파제 패밀리에도 속하지 않았으며, 리파제보다는 포스포리파제와 계통발생학적으로 더 유연한 관계가 있는 것을 확인하였다(도 3 참조). 즉, 본 발명의 갯벌 메타게놈 유래의 포스포리파제/리파제 MPlaG는 리파제 또는 포스포리파제 A의 공통서열은 가지고 있지만, 리파제 뿐만 아니라 포스포리파제와도 낮은 상동성을 보여 신규 효소임을 재확인하였다.
본 발명의 구체적인 실시예에서, 상기 서열번호 3으로 기재되는 MPlaG 유전자를 벡터에 클로닝하고(도 2 참조), 상기 벡터를 대장균에 형질전환시킨 후, 상기 형질전환체로부터 생산된 포스포리파제/리파제 MPlaG를 SDS-PAGE 방법으로 확인함으로써 분자량이 약 31kDa으로 효과적으로 생산되었음을 알 수 있었으며, 본 발명의 포스포리파제/리파제 MPlaG는 수용성 형태로 발현이 이루어지고 있음을 확인할 수 있었다(도 10 참조).
본 발명의 구체적인 실시예에서, 서열번호 3으로 기재되는 MPlaG 유전자의 인지질 분해능을 확인하기 위하여, 포스파티딜콜린 에멀젼이 첨가된 고체배지에 본 발명의 포스포리파제/리파제 MPlaG를 떨어뜨려 그 활성능을 투명환으로 확인한 결과, 본 발명의 포스포리파제/리파제 MPlaG를 떨어뜨린 고체배지에서 투명환 형성을 확인하여 인지질 분해능도 가지고 있음을 확인하였다(도 4 참조).
또한, 본 발명의 포스포리파제/리파제 MPlaG는 다음과 같은 특성을 나타낸다: pH 5 내지 10 범위에서 안정하며, pH 8에서 최대 활성을 나타내고(도 5 참조), 40℃까지 활성을 나타내고 25℃에서 최적활성을 보였으며(도 6 참조), 시차주사열량계(DSC, differential scanning calorimetry)를 이용하여 녹는 온도(melting temperature)를 분석한 결과, 38.5℃임을 확인하였다(도 7 참조). 또한, 다양한 인지질에 대한 본 발명의 포스포리파제/리파제 MPlaG의 특이성을 조사한 결과, 포스파티딜콜린, 포스파티딜에탄올아민, 포스파티딜글리세롤에 대해서 뛰어난 활성을 보였으나, 분비성 포스포리파제 A가 분해하는 것으로 알려져 있는 포스파티딜세린과 포스파티딜산은 분해하지 못하는 것을 확인하였으며(도 8 참조),MPlaG는 긴 아실 직쇄를 가지는 파라-니트로페닐 에스테르, 짧은 아실 직쇄를 가지는 트리글리세라이드 및 중간 아실 직쇄를 가지는 포스포리피드에 대하여 높은 선호도를 나타냄으로써 기질에 따라 다양한 사슬길이 특이성을 보였다. 정제된 효소는 에스터라제(esterases)에 의해 가수분해되지 않는 트리올레인(triolein)(C18:1)에 대해서 활성을 나타내었으며, 트리부티린(tributyrin)의 농도 증가와 함께 가수 분해 활성을 측정하였을 때 정제된 효소는 계면 활성을 나타내었고, 이것은 MPlaG가 에스터라제(esterase)가 아니라는 것을 나타낸다(도 9A 참조). 부가적으로 MPlaG의 가수분해 위치를 1-올레오일-2-팔미토일-포스파티딜콜린(1-oleoly-2-palmitoyl-phosphatidylcholine, OPPC)을 이용하여 액체 크로마토그래피 질량 분석법(Liquid chromatography mass spectrometry, LC-MS)을 통해 결정하였다(도 11 참조). MPlaG를 OPPC(759의 분자량)기질과 함께 25℃에서 12시간 동안 반응한 후에, LC-MS 분석결과는 MPlaG가 OPPC(m/z 804, [M-H+HCOOH]-)를 분해하여 m/z 540의 반응산물을 생성하였다는 것을 나타내었다. 만약 MPlaG가 OPPC의 sn-2 위치에서 팔미산(palmitic acid)을 잘랐다면, 반응 생성물은 m/z 567에서 관찰되었을 것이다. 그러나, MS 스펙트럼은 2-팔미토일-라이소포스파티딜콜린(2-palmitoyl-lysophosphatidylcholine)에 대응하는 m/z 540 ([M-h+COOH-C18:1]-)에서 탐지되었기 때문에, MPlaG는 포스포리피드의 sn-1 위치에 있는 아실기의 가수분해를 촉진할 수 있는 포스포리파제 A1임이 동정되었다. 아울러, 다양한 첨가물에 대한 영향을 확인한 결과, 칼슘이온(Ca2+)에 의해 활성이 약 10배 정도 증가하는 것을 확인하였고(표 1 참조), 다양한 유기용제에 의한 활성 저해는 없는 것을 확인하였다(표 2 참조).
본 발명의 서열번호 5로 기재되는 아미노산 서열을 갖는 폴리펩티드는 단백질의 기능에 영향을 미치지 않는 범위 내에서 아미노산 잔기의 결실, 삽입, 치환 또는 이들의 조합에 의해서 상이한 서열을 가지는 아미노산의 변이체 또는 단편을 본 발명의 범위에 포함한다. 분자의 활성을 전체적으로 변경시키지 않는 단백질 및 펩티드에서의 아미노산 교환은 당해 분야에 공지되어 있다. 경우에 따라서는 인산화(phosphorylation), 황화(sulfation), 아크릴화(acrylation), 당화(glycosylation), 메틸화(methylation), 파네실화(farnesylation) 등으로 수식(modification)될 수도 있다. 따라서, 본 발명은 상기 서열번호 5로 기재되는 아미노산 서열을 갖는 폴리펩티드와 실질적으로 동일한 아미노산 서열을 갖는 폴리펩티드 및 이의 변이체 또는 이의 활성 단편을 포함하며, 실질적으로 동일한 폴리펩티드란 80% 이상, 바람직하게는 90% 이상, 가장 바람직하게는 95% 이상의 아미노산 서열의 상동성을 갖는 것들을 의미한다. 그러나 이에 한정되는 것은 아니며, 70% 이상의 아미노산 서열의 상동성을 가지며 동일한 생화학적 활성을 가진다면 본원 발명에 포함된다.
또한, 본 발명의 폴리뉴클레오티드는 바람직하게는 서열번호 3으로 기재되는 폴리뉴클레오티드인 것을 특징으로 한다. 그러나 코돈의 축퇴성(degeneracy)으로 인하여 또는 상기 포스포리파제 및 리파제 활성을 모두 갖는 유전자를 발현시키고자 하는 생물에서 선호되는 코돈을 고려하여, 본 발명의 포스포리파제 및 리파제 활성을 모두 갖는 유전자는 코딩영역으로부터 발현되는 포스포리파제 및 리파제 활성을 모두 갖는 단백질의 아미노산 서열을 변화시키지 않는 범위 내에서 코딩영역에 다양한 변형이 이루어질 수 있고, 코딩영역을 제외한 부분에서도 유전자의 발현에 영향을 미치지 않는 범위 내에서 다양한 변형 또는 수식이 이루어질 수 있으며, 그러한 변형 유전자 역시 본 발명의 범위에 포함됨을 당업자는 잘 이해할 수 있을 것이다. 따라서 본 발명은 상기 서열번호 3으로 기재되는 포스포리파제 및 리파제 활성을 모두 갖는 유전자와 실질적으로 동일한 염기 서열을 갖는 폴리뉴클레오티드 및 상기 유전자의 단편을 포함한다. 실질적으로 동일한 염기서열을 갖는 폴리뉴클레오티드란 80% 이상, 바람직하게는 90% 이상, 가장 바람직하게는 95% 이상의 서열 상동성을 갖는 것들을 의미한다. 그러나 이에 한정되는 것은 아니며, 70% 이상의 서열 상동성을 가지며 암호화된 단백질의 동일한 생화학적 활성을 가진다면 본원 발명에 포함된다. 상술한 바와 같이, 본 발명의 폴리뉴클레오티드는 이와 동등한 활성을 갖는 단백질을 코딩하는 한, 하나 이상의 핵산 염기가 치환, 결실, 삽입 또는 이들의 조합에 의해 변이될 수 있으며, 이들 또한 본 발명의 범위에 포함된다. 서열번호 5로 기재되는 아미노산 서열을 갖는 폴리펩티드는 바람직하게는 서열번호 3으로 기재되는 폴리뉴클레오티드 서열을 갖는 핵산 분자에 의해 코딩되나, 본 발명은 이에 제한되지 않고, 동일 아미노산 서열을 갖는 본 발명의 단백질을 코딩할 수 있는 한, 서열번호 3의 염기서열과 실질적으로 동일한 다른 염기서열을 갖는 뉴클레오티드 서열을 갖는 핵산 분자에 의해 코딩될 수도 있다. 이러한 핵산 분자의 서열은 단쇄 또는 이중쇄일 수 있으며, DNA 분자 또는 RNA(mRNA)분자일 수 있다.
또한, 본 발명은 서열번호 3으로 기재되는 본 발명의 폴리뉴클레오티드를 포함하는 재조합 발현벡터를 제공한다.
상기 재조합 발현벡터의 제작 시에는, 상기 포스포리파제 및 리파제 활성을 모두 갖는 유전자 또는 단백질을 생산하고자 하는 숙주세포의 종류에 따라 프로모터(promoter), 종결자(terminator), 인핸서(inhancer) 등과 같은 발현조절 서열, 막 표적화 또는 분비를 위한 서열 등을 적절히 선택하고 목적에 따라 다양하게 조합할 수 있다.
본 발명의 발현벡터는 플라스미드 벡터, 코즈미드 벡터, 박테리오파이지 벡터 및 바이러스 벡터 등을 포함하나 이에 제한되지 않는다. 적합한 발현벡터는 프로모터, 오퍼레이터, 개시코돈, 종결코돈, 폴리아데닐화 시그널 및 인핸서 같은 발현 조절 엘리먼트 외에도 막 표적화 또는 분비를 위한 시그널 서열 또는 리더 서열을 포함하며 목적에 따라 다양하게 제조될 수 있다. 발현벡터의 프로모터는 구성적 또는 유도성일 수 있다. 상기 시그널 서열에는 숙주가 에쉐리키아속(Escherichia sp.) 균인 경우에는 PhoA 시그널 서열, OmpA 시그널 서열 등이, 숙주가 바실러스속(Bacillus sp.) 균인 경우에는 α-아밀라아제 시그널 서열, 서브틸리신 시그널 서열 등이, 숙주가 효모(yeast)인 경우에는 MFα 시그널 서열, SUC2 시그널 서열 등이, 숙주가 동물세포인 경우에는 인슐린 시그널 서열, α-인터페론 시그널 서열, 항체 분자 시그널 서열 등을 이용할 수 있으나, 이에 제한되지 않는다. 또한, 발현벡터는 벡터를 함유하는 숙주 세포를 선택하기 위한 선택 마커를 포함할 수 있고, 복제 가능한 발현벡터인 경우 복제 기원을 포함한다. 그러나 본 발명에 따른 포스포리파제/리파제 MPlaG를 코딩하는 유전자를 포함하는 재조합 발현벡터의 경우, 상기 포스포리파제/리파제 MPlaG 단백질이 숙주세포에서 발현하면 그 활성을 나타내게 되므로, 상기한 바와 같이, 숙주세포의 배양 배지에 트리카프릴린등의 기질을 첨가함으로써, 선택마커 없이도 형질전환된 숙주세포의 선별이 가능하도록 할 수 있다.
또한, 상기 재조합 발현벡터는 발현물의 정제를 용이하게 하기 위한 서열을 포함할 수 있으며, 구체적으로 본 발명의 포스포리파제 및 리파제 활성을 모두 갖는 유전자에 작동 가능하도록 분리정제용 태그를 코딩하는 폴리뉴클레오티드가 연결될 수 있다. 이때, 상기 분리정제용 태그는 GST, poly-Arg, FLAG, 히스티딘-택(His-tag) 및 c-myc 등이 단독으로 사용되거나 어느 두 개 이상을 순차적으로 연결하여 사용할 수 있다.
본 발명의 구체적 실시예에서, 히스티딘-택을 C-말단에 위치시켜 니켈-엔티에이(Ni-NTA, Ni-nitriloteiacetic acid, Qiagen, 독일) 컬럼을 이용하여 발현된 포스포리파제/리파제 MPlaG를 정제하였다.
본 발명의 구체적인 실시예에서, 상기 서열번호 3으로 기재되는 MPlaG 유전자 유전자를 벡터에 클로닝하고(도 2 참조), 상기 벡터를 대장균에 형질전환시킨 후, 상기 형질전환체로부터 생산된 포스포리파제/리파제 MPlaG 단백질을 SDS-PAGE 방법으로 확인함으로써 분자량이 약 31kDa으로 효과적으로 생산되는 것을 확인하였으며, 또한, 본 발명의 포스포리파제/리파제 MPlaG는 수용성 형태로 발현이 이루어지고 있음을 확인할 수 있었다(도 10 참조).
또한, 본 발명은 서열번호 3으로 기재되는 본 발명의 폴리뉴클레오티드를 포함하는 재조합 발현벡터가 숙주세포에 형질 도입된 형질전환체를 제공한다.
본 발명에 따른 상기 재조합 발현 벡터를 적절한 숙주 세포, 예를 들어, 대장균 또는 효모 세포, 바람직하게는 대장균에 형질전환시킨 후, 형질전환된 숙주세포를 배양함으로써 본 발명에 따른 신규 포스포리파제 및 리파제 활성을 모두 갖는 유전자의 DNA를 대량으로 복제하거나 단백질을 대량 생산할 수 있다. 숙주세포의 종류에 따른 적절한 배양 방법 및 배지 조건 등은 당해 분야의 통상의 기술자에게 알려진 공지 기술로부터 당업자가 용이하게 선택할 수 있다.
본 발명의 구체적인 실시예에서, 신규 MPlaG 유전자를 포함하는 재조합 벡터 pET22b(+)-MPlaG를 작제하고(도 2 참조), 이를 대장균 BL21(DE3)에 형질전환시켰으며, 상기 형질전환 균주로부터 발현된 포스포리파제/리파제 MPlaG 활성을 조사한 결과, 상기 유전자를 포함하지 않는 pET-22b(+)벡터로만 형질전환된 대장균은 트리카프릴린(tricaprylin)과 인지질인 포스파티딜콜린(phosphatidylcholine)을 전혀 분해하지 못한 반면, 본 발명의 포스포리파제/리파제 MPlaG로 형질전환된 대장균은 트리카프릴린과 포스파티딜콜린을 효과적으로 분해하여 포스포리파제 및 리파제 동시 활성을 나타내었다(도 4 참조). 이로부터 갯벌 메타게놈에서 분리한 포스포리파제 및 리파제 활성을 모두 갖는 유전자가 대장균 형질전환체에서 발현되어 우수한 활성을 나타냄을 확인하였다. 또한, 포스포리파제 활성과 리파제 활성을 확인하기 위해 동일한 단백질 양을 트리카프릴린과 포스파티딜콜린이 들어있는 고체배지에 떨어뜨린 결과, 리파제 기질인 트리카프릴린과 인지질인 포스파티딜콜린을 함유한 배지에서 모두 투명환을 형성함으로써 포스포리파제 활성뿐만 아니라 리파제 활성도 가지고 있음을 확인하였다(도 4). 아울러, 상기 형질전환된 대장균 BL21(DE3)/pET22b(+)-MPlaG를 2011년 05월 30일자로 한국생명공학연구원 유전자은행에 기탁번호 KCTC 11942BP로 기탁하였다.
아울러, 본 발명은,
1) 서열번호 3으로 기재되는 폴리뉴클레오티드를 포함하는 재조합 발현벡터를 제조하는 단계;
2) 상기 재조합 발현벡터를 숙주세포에 도입하여 형질전환체를 제조하는 단계; 및,
3) 상기 형질전환체를 배양하여 재조합 단백질의 발현을 유도하고 이를 수득하는 단계를 포함하는 포스포리파제 및 리파제 활성을 모두 갖는 재조합 단백질 제조방법을 제공한다.
상기 단계 1)의 폴리뉴클레오티드의 N-말단에 분리정제용 태그를 암호화하는 폴리뉴클레오티드와 단백질 절단효소 인식부위가 추가로 연결될 수 있고, 이로 인해 포스포리파제/리파제 MPlaG의 정제 또는 원래 형태의 포스포리파제/리파제 MPlaG의 수득이 가능할 수 있다. 즉, 포스포리파제/리파제 MPlaG를 분리정제용 태그를 이용하여 정제한 후, 상기 단백질 절단효소 인식부위를 절단할 수 있는 단백질 절단효소를 처리하는 단계를 추가로 포함함으로써 원래 형태의 포스포리파제/리파제 MPlaG를 수득할 수 있다.
상기 분리정제용 태그는 GST, poly-Arg, FLAG, 히스티딘-택(His-tag) 및 c-myc으로 이루어진 군으로부터 선택되는 어느 하나 이상인 것인 바람직하고, 히스티딘-택인 것이 보다 바람직하나 이에 한정되지 않는다.
또한, 본 발명은 서열번호 5로 기재되는 아미노산 서열로 구성되며, 포스포리파제 및 리파제 활성을 모두 갖는 폴리펩티드를 유효성분으로 함유하는 세제첨가제를 제공한다.
본 발명의 갯벌 토양 미생물의 메타게놈 라이브러리로부터 분리한 신규 유전자 및 이로부터 코딩되는 포스포리파제 및 리파제 활성을 모두 갖는 단백질은 수용성 형태로 발현되므로 대량생산이 가능하고, Ni-NTA 컬럼을 이용한 한 단계의 정제만으로 현저히 높은 순도의 단백질 수득이 가능하며, pH 5 내지 10에서 우수한 활성을 나타내고, 3℃ 내지 40℃까지 우수한 저온 활성 및 안정성을 유지하며, 다양한 유기용매에 대한 높은 내성을 가지므로, 유지의 정제 및 전환 생물의학과 정밀화학분야 등의 다양한 산업에 유용하게 이용될 수 있다.
이하, 본 발명을 실시예 및 실험예에 의해 상세히 설명한다.
단, 하기 실시예 및 실험예는 본 발명을 예시하는 것일 뿐, 본 발명의 내용이 하기 실시예 및 실험예에 한정되는 것은 아니다.
<실시예 1> 메타게놈(Metagenome) 라이브러리의 구축
전라북도 부안군 새만금 간척지 갯벌에서 채취한 토양 시료 10 g을 50 ㎍/㎖의 프로테이나제(proteinase) K를 포함하는 동일부피의 DNA 추출용 완충액[100 mM 트리즈마 완충액(Tris-HCl, pH 8), 100 mM EDTA(ethylenediaminetetraacetic acid, Sigam, 미국), 100 mM 인산 나트륨 완충액(sodium phosphate, pH 8, Sigam, 미국), 1.5 M 염화나트륨(NaCl, Junsei, 일본), 1%(w/v) CTAB(hexadecyl trimethyl ammonium bromide, Sigma, 미국)]에 현탁시킨 후, 음이온 계면활성제(sodium dodecyl sulfate, SDS, Sigma, 미국)를 최종 2%(v/v)가 되게 첨가하여 65℃에서 2시간 동안 반응시켰다. 그 후, 원심분리를 통해 획득한 상등액에 1.6 M 염화나트륨(NaCl)을 포함한 30%(v/v) 폴리에틸렌 글리콜(polyethylene glycol)을 동일 부피만큼 첨가시켜 잘 섞어 주었다. 침전된 DNA는 원심분리를 통해 분리하여 TE 버퍼에 현탁하고, 동일 부피의 페놀/클로로포름/이소아밀 알코올(phenol/chloroform/isoamyl alcohol)(25:24:1)과 클로로포름/이소아밀 알코올(chloroform/isoamyl alcohol)(24:1) 혼합액을 첨가하여 두 번 추출하였다. 원심분리하여 획득한 상등액에 이소프로파놀(isopropanol)을 첨가하여 DNA를 침전회수하였다. DNA 침전물을 완전히 건조시켜 멸균수에 녹인 후 불순물을 완전히 제거하고, 약 23~48 kb정도의 DNA 단편으로 부분 절단하기 위해 PFGE(pulse-field gel electrophoresis)를 이용하여 전기영동하고 Gelase(Epicentre, 미국)를 사용하여 겔 용출을 수행하였다. 정제된 DNA단편들은 CopyControl fosmid 라이브러리 제작 키트(Epicentre, 미국)를 사용하여 메타게놈 라이브러리를 구축하였다.
라이브러리의 질을 검사하기 위해, 형질전환체들을 무작위적으로 선택하여 재조합 플라스미드를 추출하여 제한효소 처리해 본 결과, 모두 재조합 플라스미드를 가지고 있었으며 삽입된 메타게놈의 평균 크기는 35 kb였다.
<실시예 2> 지질분해 활성능을 가진 재조합 플라스미드의 탐색 및 분리
상기 <실시예 1>에서 수득한 메타게놈 라이브러리로부터 지질분해성 유전자를 탐색하기 위해 트리카프릴린(tricaprylin)을 포함하는 고체배지에서 상기 메타게놈 라이브러리를 배양하였다.
구체적으로, 상기 메타게놈 라이브러리를 트리카프릴린 에멀젼[1%(v/v) 트리카프릴린(tricaprylin), 1 mM 염화칼슘(CaCl2), 0.5%(w/v) 아라비아 고무(Gum arabic)]가 첨가된 영양고체배지[1%(w/v) 트립톤(trypton), 0.5%(w/v) 이스트 추출물(yeast extract), 0.5%(w/v) 염화나트륨(NaCl), 1.5%(w/v) 한천(agar)]에 도말하여 37℃에서 배양하였다. 그런 다음, 지질 분해 효소는 트리카프릴린(tricaprylin)을 분해하므로, 트리카프릴린이 분해되어 투명환을 형성하는 콜로니를 선별한 후, 트리카프릴린 분해능이 가장 우수한 콜로니로부터 재조합 플라스미드를 분리하여 pFosPlaG로 명명하였다.
<실시예 3> 지질분해 활성능이 우수한 재조합 플라스미드의 염기서열 분석 및 염기서열 결정
<3-1> 재조합 플라스미드의 염기서열 분석
메타게놈 라이브러리로부터 분리된 재조합 플라스미드 pFosPlaG는 샷건 시퀸싱(shot-gun sequencing) 방법을 이용하여 염기서열을 분석하였다.
구체적으로, pFosPlaG로부터 피펫팅을 이용한 물리적인 방법으로 만들어진 DNA단편을 pUC118(TaKaRa)벡터에 서브클로닝하고 자동염기서열분석기(ABI 3730 DNA analyzer)를 사용하여 수행하였다.
그 결과, pFosPlaG는 28,845 bp 크기였으며, 이들 유전자의 염기서열은 서열번호: 1과 같으며, 이들은 미국 진뱅크(GenBank)에 등록번호(accession number) EU285670으로서 등록하였다.
또한, National Center for Biotechnology Information(NCBI)의 ORF finder를 이용하여 e-2 이하의 e-value값을 가지는 전사해독프레임(open reading frame, ORF)만을 동정하였고, 블라스트엑스(BlastX)를 이용하여 각 전사해독프레임의 기능을 예측하였다.
그 결과, 표 1에 나타낸 바와 같이 총 15개의 전사해독프레임이 동정 되었으며, 서열번호 1의 상보적인 염기서열에서 뉴클레오티드 번호 2881에서 4578 부위에 해당하는 전사해독프레임이 포스포리파제 단백질 코딩영역이었으며 상기 유전자를 plaG로 명명하였다. 본 발명의 포스포리파제 및 리파제 활성을 모두 갖는 유전자(plaG)는 1698 개의 염기서열로 구성되며 구아닌시토신 조성이 44.94%이고, 이 유전자로부터 발현되는 포스포리파제/리파제 PlaG(포스포리파제 및 리파제 활성을 모두 가지는 단백질 PlaG; 서열번호: 4)는 566 개의 아미노산으로 이루어지며 분자량이 약 61,187 Da으로 예측되는 포스포리파제 및 리파제 활성을 모두 갖는 단백질이었다.
ORF no. | 길이 (a.a.) |
G+C (%) |
가장 상동적인 단백질 | Putative source organism | 상동성 (%) | E- value |
1 | 291 | 36.87 | RNA polymerase sigma factor | Planctomyces maris DSM 8797 | 39 | 2e-53 |
2 | 565 | 44.94 | Phospholipase A | Grimontia hollisae CIP 101886 | 31 | 5e-06 |
3 | 334 | 47.56 | NADP-dependent oxidoreductases | Moritella sp. PE36 | 88 | 4e-173 |
4 | 208 | 44.34 | hypoxanthine phosphoribosyltransferase | Desulfotalea psychrophila LSv54 | 71 | 2e-66 |
5 | 90 | 37.36 | Putative regulatory protein | Dictyoglomus thermophilum H-6-12 | 57 | 8e-08 |
6 | 160 | 33.54 | hypothetical protein | Pelobacter carbinolicus DSM 2380 | 49 | 2e-26 |
7 | 328 | 36.58 | Amino acid ABC transporter periplasmic protein | Hahella chejuensis KCTC 2396 | 41 | 2e-47 |
8 | 274 | 40.48 | Putative transposase | Solibacter usitatus Ellin6076 | 39 | 3e-44 |
9 | 158 | 46.12 | hypothetical protein | Methanosarcina barkeri str. Fusaro | 44 | 2e-37 |
10 | 107 | 38.58 | hypothetical protein | Chlorobium chlorochromatii CaD3 | 61 | 4e-36 |
11 | 1095 | 35.92 | transcriptional regulator | Bacillus sp. SG-1 | 22 | 5e-57 |
12 | 253 | 39.76 | NAD(P)H dehydrogenase | Desulfatibacillum alkenivorans AK-01 | 37 | 4e-43 |
13 | 114 | 31.59 | Transposase | Pseudomonas aeruginosa | 28 | 1e-2 |
14 | 435 | 34.79 | Hypothetical exported 24-amino acid repeat protein | Fusobacterium nucleatum subsp. vinventii ATCC 49256 | 32 | 2e-44 |
15 | 308 | 35.38 | Transposase | Marinobacter sp. ELB17 | 25 | 2e-11 |
<3-2> 상동성 분석
블라스트(BLAST) 데이타베이스를 이용하여 기존 단백질과 아미노산 서열을 비교 분석하였다.
그 결과, 포스포리파제/리파제 PlaG(서열번호: 4), 더 바람직하게는 PlaG의 기능 도메인 MPlaG로부터 발현되는 포스포리파제/리파제 MPalG(포스포리파제 및 리파제 활성을 모두 갖는 단백질; 서열번호: 5)는 Grimontia hollisae CIP 101886과 가장 높은 유사성을 나타내었으며, 이전에 보고된 포스포리파제 유전자 집단과 30~35% 정도의 낮은 유사성을 보여 포스포리파제를 암호화하는 신규한 유전자로서 확인되었다. 또한, 본 발명의 포스포리파제/리파제 PlaG 아미노산 서열과 이와 유사한 포스포리파제의 아미노산 서열 사이의 상동성을 비교한 결과, α/β가수분해효소의 보존적인 글리신-X-세린-X-글리신(Gly-X-Ser-X-Gly)의 공통서열(consensus sequence) 내의 435번째 세린잔기(Ser), 496번째 아스파라긴산(Asp), 550번째 히스티딘(His)으로 이루어져 있는 세작용기 촉매(catalytic triad) 갖고 있었으며 그 주변의 아미노산들이 포스포리파제 A의 특징적 서열([LIV]-{KG}-[LIVFY]-[LIVMST]-G-[HYWV]-S-{YAG}-G-[GSTAC])들로 이루어져 있음을 확인하였다(도 1B). 한편, 포스포리파제/리파제 PlaG의 아미노 말단의 287개 아미노산 잔기들은 Beggiatoa sp. PS유래의 분비 단백질(secreted protein; ZP_02001945)과 54%로 가장 높은 유사성을 나타내었다(도 1A). 또한, 아미노 말단의 26개의 아미노산 잔기들은 분비 시그날 펩티드(signal peptide)로 동정 되어졌으며, 분비 시그날 펩티드가 끝나는 27번째 알라닌 잔기(Ala)부터 157번째 글리신 잔기(Gly)는 다음의 아미노산인 158번째 트레오닌(Thr)부터 287번째 글리신(Gly)까지 반복되는 서열로 구성돼 있었다(도 3). 즉, 분비 시그날 펩티드와 반복서열의 존재, 블라스트 데이트베이스 분석 결과를 근거로 하여 포스포리파제/리파제 PlaG는 구조도메인과 기능도메인으로 구성돼 있을 것으로 예측 가능하였으며, 포스포리파제/리파제 PlaG의 기능 도메인을 포스포리파제/리파제 MPlaG로 명명하였다.
<3-3> 계통발생나무(phylogenetic tree)를 통한 계통분석
포스포리파제/리파제 MPlaG의 아미노산 서열(서열번호: 5)은 아미노산 서열과 특성에 따라 분류된 다양한 리파제 및 기존에 알려진 포스포리파제의 아미노산 서열들과 함께 계통발생나무(phylogenetic tree)를 구축하였다.
그 결과, 도 3에 나타낸 바와 같아, 본 발명의 포스포리파제/리파제 MPlaG는 어떠한 리파제 패밀리에도 속하지 않았으며, 리파제보다는 포스포리파제와 계통발생학적으로 더 유연관계가 있는 것을 확인할 수 있었다(도 3). 특히, 특이적으로 리파제 활성뿐만 아니라 우수한 포스포리파제 활성을 나타내는 것으로 알려져 있는 Staphylococcus hyicus유래의 리파제와도 계통발생학적으로 거리가 멀었다. 또한, 기존의 알려진 Serratia sp. MK1, Serratia marcescens, Yersinia enterocolitica 8081, Serratia proteamaculans 568유래의 포스포리파제의 아미노산 서열들은 서로 높은 상동성(59.7-88.1%)을 보이는 반면, 본 발명의 포스포리파제/리파제 MPlaG와는 17.2-20.4%의 낮은 상동성을 보였다. 즉, 갯벌 메타게놈 유래의 포스포리파제 및 리파제는 리파제 또는 포스포리파제 A의 공통서열은 가지고 있지만, 리파제 뿐만 아니라 포스포리파제와도 낮은 상동성을 보여 신규 효소임을 재확인하였다.
<실시예 4>: 형질전환체의 제조
본 발명의 신규 포스포리파제/리파제 MPlaG를 대량으로 생산할 수 있는 재조합 플라스미드를 제조하기 위해, PlaG의 기능 도메인(MPlaG)만으로 이루어져 있는 전사해독프레임을 디자인하고 그 작제물을 제조하였다. 상기 작제물은 pET-22b(+)(Novagen)의 제한효소 NdeI과 XhoI부위에 서열번호 2의 서열 위치 862 bp에서 시작하는 837 bp를(서열번호: 3) 클로닝하였다. 이 작제물은 대장균 BL21(DE3)에 형질전환시켜 대장균 BL21(DE3)/pET22b(+)-MPlaG를 제조하였다.
구체적으로, 메타게놈 라이브러리로부터 탐색 된 재조합 플라스미드 pFosPlaG을 주형 DNA로 하고, 합성된 하기 서열번호 6의 N-말단 프라이머와 합성된 서열번호 7의 C-말단 프라이머(primer)를 사용하여 중합효소 연쇄반응(polymerase chain reaction, PCR)을 수행하였다.
서열번호 6: 5'-CCCCATATGTTAAATCAGTCTGATTATGA-3'
서열번호 7: 5'-CCCCTCGAGAAATTTATCGTTCTCAAGCAT-3'
본 발명의 MPlaG 유전자 N-말단 프라이머와 C-말단 프라이머는 각각 NdeI과 XhoI의 제한효소 절단부위를 가지며 서열번호 6, 7로 기재되는 올리고 뉴클레오티드이다. 재조합벡터 pET22b(+)-MPlaG에는 강력한 T7프로모터와 판독신호가 내재되어 있어서, 이를 T7 RNA 중합효소를 갖고 있는 대장균 BL21(DE3)를 숙주로 사용하는 경우 포스포리파제/리파제 MPlaG의 대량 생산이 가능하다. 또한, C-말단에는 포스포리파제 및 리파제의 정제를 수월하게 수행할 수 있게 하는 6 개의 히스티딘을 암호화하는 택이 형성되어 있다.
중합효소 연쇄반응을 통해 대량 증폭된 DNA 단편을 제한효소 NdeI과 XhoI으로 완전히 자른 후, 동일한 제한효소와 포스파타제(calf intestinal phosphatase)를 처리한 발현용 벡터 pET-22b(+)와 연결(ligation)하여 포스포리파제 및 리파제 발현용 재조합 플라스미드 pET22b(+)-MPlaG를 제조하였다(도 2). 상기 재조합 플라스미드 pET22b(+)-MPlaG를 대장균 BL21(DE3)로 전기충격유전자전달(electroporation)을 수행하여 형질전환된 균주를 제조하였다. 상기 형질전환체를 각각 대장균 BL21(DE3)/pET22b(+)-MPlaG라 명명하고, 한국생명공학연구원 유전자은행에 2011년 05월 30일자로 기탁하였다(수탁번호: KCTC 11942BP).
<실시예 5> 포스포리파제/리파제 MPlaG 생산 확인
<5-1> 포스포리파제/리파제 MPlaG의 발현 및 정제
상기 <실시예 4>에서 제조한 대장균 BL21(DE3)/pET22b(+)-MPlaG를 암피실린(ampicillin, 100㎍/㎖)이 포함된 액체영양배지[1%(w/v) 트립톤(trypton), 0.5%(w/v) 효모 추출액(yeast extract), 0.5%(w/v) 염화나트륨(NaCl)]에서 600 nm에서의 흡광도가 0.6이 될 때까지 배양한 후, 최종 농도 0.5mM의 IPTG(isopropyl-β-D-thiogalactopyranoside)를 배양액에 넣어 12시간 동안 배양하였다. 원심분리를 통해 얻어진 대장균 BL21(DE3)/pET22b(+)-MPlaG는 결합완충액(50mM 트리즈마 완충액(Tris-HCl, pH 8), 500mM 염화나트륨(NaCl), 10mM 이미다졸(imidazole))에 현탁시킨 후, 초음파 분쇄법으로 파쇄하였다. 이를 다시 원심분리하여 회수한 상층액만을 니켈-엔티에이(Ni-NTA(nitriloteiacetic acid))컬럼에 가하여 이미다졸(imidazole) 농도 구배를 이용해 포스포리파제 및 리파제를 용출시킨 후 투석농축하였다. 상기와 같이 정제된 포스포리파제/리파제 MPlaG를 확인하기 위해, SDS-PAGE(Sodium dodecyl sulfate-polyacrylamide gel electrophoresis)를 수행하였고 쿠마시 블루(comassie brilliant blue)로 염색하였다.
그 결과, 도 10에 나타낸 바와 같이, 본 발명의 포스포리파제/리파제 MPlaG 는 발현 12 시간 후 시료 속 단백질의 분자량이 약 31 kDa으로 효과적으로 생산되는 것을 확인하였으며, 이는 포스포리파제 및 리파제의 활성을 모두 갖는 아미노산 배열로부터 추론된 분자량과 상당히 근접하여 이 단백질 밴드가 본 발명의 신규 포스포리파제/리파제 MPlaG들임을 확인할 수 있었다. 또한, 본 발명의 포스포리파제/리파제 MPlaG는 수용성 형태로 발현이 이루어지며 본 발명의 전장(full-length) 단백질인 포스포리파제/리파제 PlaG와 단백질 발현량을 비교한 결과, 본 발명의 포스포리파제/리파제 MPlaG의 발현양이 현저히 증가한 것을 확인하였다(도 10). 아울러, 전장(full-length) 단백질 포스포리파제/리파제 PlaG 단백질의 경우 여러 단계의 정제 과정 또는 새로운 벡터시스템을 이용하더라도 항상 비특이적 단백질(non-specific protein)이 함께 존재하지만, 본 발명의 포스포리파제/리파제 MPlaG는 Ni-NTA 컬럼을 이용한 한 단계의 정제만으로도 월등히 높은 순도의 단백질을 수득할 수 있음을 확인하였다.
<5-2> 인지질 분해능 확인
메타게놈 라이브러리로부터 분리된 재조합 플라스미드 pFosPlaG는 리파제 유전자의 분리 확인을 위해 널리 사용되어지고 있는 트리카프릴린 에멀젼이 첨가된 영양고체배지에서 분리되었으므로, 이 유전자의 포스포리파제로서의 인지질 분해능을 확인하기 위해 포스파티딜콜린 에멀젼[0.5%(w/v) 포스파티딜콜린(phosphatidyl choline), 0.5%(w/v) 타로콜릭산(taurocholic acid), 20mM 염화칼슘(CaCl2))이 첨가된 고체배지에 포스포리파제/리파제 MPlaG를 떨어뜨려 그 활성능을 투명환으로 확인하였다. 실험의 수행에 있어서 비교군으로서는 우수한 리파제 활성능을 지닌 리파제 CALB(lipase B from Candida antarctica)와 형질전환체를 만들기 위해 사용한 숙주 세포인 대장균 BL21(DE3)의 세포 용해물을 사용하였다.
그 결과, 도 4에 나타낸 바와 같이, 대장균 BL21(DE3)의 세포 용해물은 두 고체배지 상에서 모두 활성을 나타내지 않았고, CALB는 트리카프릴린 에멀젼이 첨가된 영양고체배지에서만 투명환을 형성하였으며, 본 유전자는 두 고체배지 상에서 모두 투명환을 형성하여 지질의 분해능뿐만 아니라 인지질 분해능도 가지고 있음을 확인할 수 있었다(도 4).
<실시예 6> 갯벌 메타게놈으로부터 분리한 포스포리파제/리파제 MPlaG의 특성 조사
상기 <실시예 5>에서 정제한 포스포리파제/리파제 MPlaG의 온도 및 pH 변화에 따른 효소활성, 다양한 탄소길이를 갖고 있는 기질에 대한 특이성, 다양한 금속이온, 저해제, 그리고 유기용제에 대한 영향을 리파제 활성을 기준으로 하여 다음과 같이 측정하였다.
구체적으로, 효소활성 측정을 위해 두 가지 방법을 사용하였다. 첫 번째 방법은 pH-stat법으로, 트리글리세롤 5 ㎖과 495 ㎖의 아라비아 고무 현탁액[20 mM 염화나트륨(NaCl), 1mM 염화칼슘(CaCl2), 0.5%(w/v) 아라비아 고무(gum arabic)]을 혼합한 다음, Waring blendor를 이용하여 에멀젼을 만들었다. 상기 트리글리세롤 에멀젼 25 ㎖을 온도 조절장치가 장착된 반응조에 넣은 후 10 mM NaOH을 떨어드려 pH 8로 적정하였다. 상기 적정액에 정제를 통해 수득한 포스포리파제/리파제 MPlaG 효소액을 첨가하였고, 25℃에서 가수분해 반응을 진행하면서 첨가되는 NaOH양을 pH 적정(842T Titrando, Metrohm)을 통하여 측정하였다. 효소의 1 unit(U)는 분당 1 μ㏖의 지방산을 생산하는 효소의 양으로 정의하였다. 또 다른 방법은 본 발명의 표준 활성 측정법으로서, 10 mM 파라-니트로페닐 에스테르(p-nitrophenyl ester)기질 20 ㎕, 에탄올 40 ㎕, 50 mM 트리즈마 완충액(Tris-HCl, pH 8) 940 ㎕로 구성된 반응액에 포스포리파제/리파제 MPlaG 효소액을 첨가하여 5분간 반응시키면서, 기질에서 분해되어 나오는 파라-니트로페놀(p-nitrophenol)을 405nm에서의 흡광도 증가율로 측정하였다. 1 unit(U)은 분당 1 μmol의 파라-니트로페놀을 가수분해하여 생산할 수 있는 효소의 양으로 정의하였다.
<6-1> 온도 및 pH에 대한 포스포리파제/리파제 MPlaG의 특성
효소 활성에 대한 pH의 영향을 조사하기 위해, 다양한 pH 완충액에서 활성을 측정한 결과 pH 8에서 최대의 활성을 나타내었고, 다양한 pH에서 180분간 방치한 후 잔존 활성을 측정한 결과 pH 5 내지 10의 범위에서 안정한 것으로 나타났다(도 5). 또한, 포스포리파제 및 리파제 활성에 미치는 온도의 영향을 조사한 결과, 25℃에서 최적 활성을 보였으며, 5℃에서도 최고 활성의 39%의 활성능을 가지고 있었으며, 최적 활성 온도이상에서는 활성이 급격히 감소하였다(도 6). 아울러, 시차주사열량계(DSC, differential scanning calorimetry)를 이용하여 녹는 온도(melting temperature)를 분석한 결과, 38.5℃였다(도 7). 이는 본 발명의 포스포리파제/리파제 MPlaG 는 저온성과 알칼리성의 리파제임을 보여주었다.
<6-2> 다양한 인지질에 대한 포스포리파제/리파제 MPlaG의 특이성 조사
다양한 인지질에 대한 기질특이성을 조사하기 위해, 다양한 인지질 에멀젼이 첨가된 고체배지에 정제된 포스포리파제/리파제 MPlaG를 떨어뜨려서 그 활성능을 투명환의 크기로 비교하였다. 인지질 에멀젼은 0.5%(w/v) 인지질 기질, 0.5%(w/v) 타로콜릭산(taurocholic acid), 20mM 염화칼슘(CaCl2)으로 구성된 조성액으로 만들어졌으며, 사용되어진 기질은 포스파티딜콜린(PC, phosphatidylcholine, 99% 순도), 포스파티딜에탄올아민(PE, phosphatidylethanolamine, 97% 순도), 포스파티딜세린(PS, phosphatidylserine, 97% 순도), 포스파티딜오노시톨(PI, phosphatidylinositol, 98% 순도), 포스파티딜글리세롤(PG, phosphatidylglycerol, 99% 순도), 포스파티딜산(PA, phosphatidic acid, 98% 순도)이다.
그 결과, 도 8에 나타낸 바와 같이, 포스파티딜콜린, 포스파티딜에탄올아민, 포스파티딜글리세롤에 대해서 뛰어난 활성을 보였으나, 분비성 포스포리파제 A가 분해하는 것으로 알려져 있는 포스파티딜세린과 포스파티딜산은 분해하지 못하였다(도 8).
<6-3> 다양한 탄소길이에 대한 포스포리파제/리파제 MPlaG의 특성
트리아실글리세라이드(triacylglycerides), 올리브 오일(olive oil), 및 포스파티딜콜린(phosphatidylcholine)에 대한 MPlaG의 가수분해 활성을 pH 적정기(842 Tirando, Metrohm)을 이용하여 유리 지방산을 적정함으로써 측정하였다. 10mM 의 수산화나트륨 용액을 첨가하여 기질 에멀젼의 pH를 8.0으로 조정한 후에, 적정량의 효소 용액을 첨가하였다. 지방산의 배출 속도를 5분 동안 pH 적정기를 이용하여 측정하였다. 1 단위(unit)의 리파제 활성은 분당 1μmole 의 지방산을 방출시키는 효소의 양으로 정의되었다. 기질의 비효소적 가수분해 값을 제외하기 위해 서로 다른 조건에서 효소 첨가 없이 측정하여 대조군 반응으로 이용하였다.
그 결과, 올리브 오일 및 포스파티딜콜린에 대한 MPlaG의 특이적 활성은 각각 2957±144 및 1735±147 U·mg- 1 이었다. MPlaG는 포스포리파제의 동족 단백질이나, 올리브 오일에 대해서 현저한 리파제 활성을 나타내었다.
다양한 탄소 길이를 갖고 있는 기질에 대한 특이성을 알아보기 위하여, 트리부티린(tributyrin, C4), 트리카프릴린(tricaprylin, C8), 트리카프린(tricaprin, C10), 트리라우린(trilaurin, C12), 트리팔미틴(tripalmitin, C16), 트리올레인(triolein, C18:1)을 기질로 사용하여 활성을 비교하였다. 트리아실글리세라이드에 대한 pH-적정 평가의 결과는 트리부티린(tributyrin)(C4)에서 가장 높은 활성을 보였고, 사슬 길이가 증가함에 따라 효소 활성은 현저하게 감소하였다(도 9A).
또한, MPlaG의 합성기질인 파라-니트로페닐 에스테르에 대한 활성을 알아보기 위해 분광 분석법을 실온에서 수행하였다. 파라-니트로페닐 부틸레이트(p-nitrophenyl butyrate, C4), 파라-니트로페닐 카프릴에이트(p-nitrophenyl caprylate, C8), 파라-니트로페닐 카프레이트(p-nitrophenyl caprate, C10), 파라-니트로페닐 로레이트(p-nitrophenyl laurate, C12), 파라-니트로페닐 팔미테이트(p-nitrophenyl palmitate, C16), 및 파라-니트로페닐 스티어레이트(p-nitrophenyl stearate, C18)를 기질로 사용하여 활성을 비교하였다. 구체적으로 파라-니트로페닐 에스테르(p-nitrophenyl ester)에 대한 MPlaG 활성을 분광탐지기(spectrophotometric detection)을 이용하여 표준 평가 방법으로 측정하였다. 별도의 표시가 없으면 파라-니트로페닐 카프레이트(p-nitrophenyl caprate)(C 10)을 기질로 이용하였고, 5 mM Ca2 +를 반응 용액에 첨가하였다. 효소 활성은 생산물인 p-나이트로페놀을 DU800 분광광도계(spectrophotometer)(Beckman)을 사용하여 450nm에서 5분간 계속적으로 측정하였다. 1 단위(unit)의 파라-니트로페닐 에스테르에 대한 활성은 분당 1μmole 의 파라-니트로페닐을 방출하는 효소의 양으로 정의되었다. 기질의 비효소적 가수분해 값을 제외하기 위해 서로 다른 조건에서의 모든 측정을 효소 없이 대조군 반응으로 이용하였다.
그 결과, MPlaG는 파라-니트로페닐 팔미테이트(p-nitrophenyl palmitate)(C 16)에 대하여 약 112배의 가장 높은 활성을 보였고, 다음으로는 파라-니트로페닐 부틸레이트(p-nitrophenyl butyrate)(C 4)였다(도 9B).
또한, MPlaG의 포스포리피드의 위치 및 사슬길이 특이성을 알아보기 위해, 다양한 탄소 길이(C6, C7, C8 C14)의 포스파티딜콜린과 1-올레오일-2-팔미토일-포스파티딜콜린(1-oleoly-2-palmitoyl-phosphatidylcholine, OPPC)을 이용하여 수행하였다. 정제된 MPlaG를 5mM 염화칼슘 및 150mM 염화나트륨을 포함하는 50mM 트리스 버퍼(pH 8.0)에 1mM 기질과 함께 12시간 동안 25℃에서 효소반응 하였다. 액체 크로마토그래피 질량 분석법(Liquid chromatography mass spectrometry, LC-MS)을 Finnigan LCQ를 이용하여 반응 생성물의 분석을 수행하였다. 어드밴테이지 이온 트랩 질량분석기(Advantage MAX ion trap mass spectrometer, Thermo Fisher Sceintific)는 전자분무 이온화 소스(electrospray ionization source)가 장착되었다. HPLC 분리는 HILIC 가드 컬럼(4 x 2.0mm, Phenomenex)와 함께 Kinetex HILIC 컬럼(2.6㎛, 2.1 x 100mm, Phenomenex)을 이용하여 수행하였다. 이동상 A는 포름산을 이용하여 pH 를 3.0으로 조정한 10mM 포름산 암모니움(ammonium formate)였고, 이동상 B는 아세토나이트릴(acetonitrile)이었다. 기울기 용리(gradient elution)는 다음과 같이 0.2ml/min의 유동 속도에서 수행되었다: 0 - 10분, 10%에서 40%의 A(선형 구배); 10 - 20분 70%의 A(등용매). 컬럼 온도는 실온이었고, 주입량은 10μL 이었다. 질량 스펙트라는 3 마이크로스캔 및 200ms의 최대 이온 주입시간에서 네거티브 이온 모드(negative ion mode) 100 - 1200 범위의 m/z 값에서 얻었다.
그 결과, 특징적인 질량 스펙트럼은 네거티브 이온 모드에서 탈양자 분자 이온 [M-H]-및 [M-H+HCOOH]- 와 같은 용매 부가이온을 나타내었다. 라이소포스파티딜콜린(lysophosphatidylcholine)에 대한 포스파티딜콜린의 가수분해 효소적 활성은 1,2-디옥타노일-포스파티딜콜린(1,2-Dioctanoyl-phosphatidylcholine)(diC8PC)에서 가장 높았다(도 9C). 그러므로 MPlaG는 기질에 따라서 다양한 사슬 길이 특이성을 가지고 긴 아실 직쇄를 가지는 파라-니트로페닐 에스테르, 짧은 아실 직쇄를 가지는 트리글리세라이드 및 중간 아실 직쇄를 가지는 포스포리피드에 대하여 높은 선호도를 나타내어, 기질에 따라서 다양한 사슬길이 특이성을 보였다. 정제된 효소는 에스터라제(esterases)에 의해 가수분해되지 않는 트리올레인(triolein)(C18:1)에 대해서 활성을 나타내었으며 트리부티린(tributyrin)의 농도증가와 함께 가수 분해 활성을 측정하였을 때, 정제된 효소는 계면 활성을 나타내었고, 이것은 MPlaG가 에스터라제(esterase)가 아니라는 것을 나타낸다(도 9A). 부가적으로 MPlaG의 가수분해 위치를 1-올레오일-2-팔미토일-포스파티딜콜린(1-oleoly-2-palmitoyl-phosphatidylcholine)을 이용하여 LC-MS 분석을 통해 결정하였다(도 11). MPlaG를 OPPC(759의 분자량)로 25℃에서 12시간 동안 반응한 후에, LC-MS 스펙트럼은 MPlaG가 OPPC(m/z 804, [M-H+HCOOH]-)를 분해하여 m/z 540의 반응산물을 생성하였다는 것을 나타내었다. 만약 MPlaG가 OPPC의 sn-2 위치에서 팔미산(palmitic acid)을 잘랐다면, 반응 생성물은 m/z 567에서 관찰되었을 것이다. 그러나, MS 스펙트럼은 2-팔미토일-라이소포스파티딜콜린(2-Palmitoyl-lysophosphatidylcholine)에 대응하는 m/z 540 ([M-h+COOH-C18:1]-)에서 탐지되었기 때문에, MPlaG는 포스포리피드의 sn-1 위치에 있는 아실기의 가수분해를 촉진할 수 있는 포스포리파제 A1임이 동정되었다.
따라서, 에스터라제가 분해할 수 없는 트리올레인을 분해하고 트리부티린의 농도증가에 따라서 계면활성을 보임으로써 본 발명의 MPlaG는 포스포에스터라제/에스터라제가 아니라 포스포리파제/리파제임을 알 수가 있다.
<6-4> 금속이온 및 저해제에 대한 포스포리파제/리파제 MPlaG의 영향
하기의 [표 2]에서와 같은 다양한 농도의 다양한 금속이온과 저해제에 대한 포스포리파제 및 리파제의 활성을 측정하였다.
그 결과, 도 7에 나타낸 바와 같이 칼슘이온(Ca2+)에 의해 활성이 약 10배 증가하는 것을 확인하였으며 EDTA에 의해서 활성이 강하게 저해되었다. 또한, 2 mM과 5 mM의 칼슘 이온을 첨가하였을 경우, 본 발명의 포스포리파제/리파제 MPlaG의 녹는 온도가 38.5℃에서 각각 47.2℃와 49.2℃로 증가되어 칼슘에 의해 구조적인 안정화가 증가되었을 것으로 기대할 수 있다(도 7).
금속이온 및 저해제 | 효소활성 상대치(%) | ||
1mM | 5mM | 10mM | |
염화칼슘(CaCl2) | 466 | 1015 | 994 |
염화구리(CuCl2) | 135 | 32 | 11 |
염화마그네슘(MgCl2) | 105 | 198 | 142 |
황산철(FeSO4) | 137 | 142 | 151 |
염화아연(ZnCl2) | 107 | 9 | 5 |
염화니켈(NiCl2) | 62 | 23 | 7 |
염화코발트(CoCl2) | 120 | 177 | 116 |
EDTA(ehylenediami- netetraacetic acid) |
78 | 0 | 0 |
PMSF(phenyl methyl sulfonyl fluoride) | 94 | 107 | 105 |
DTT(dithiothreitol) | 93 | 107 | 105 |
2-mercaptoethanol | 105 | 108 | 80 |
<6-5> 유기용제에 대한
포스포리파제
/
리파제
MPlaG
의 효소활성
본 발명의 포스포리파제/리파제 MPlaG의 하기 [표 3]의 디메틸설폭사이드(DMSO, dimethyl sulfoxide), 디메틸폼아마이드(DMF, dimethylformamide), 2-프로판놀(2-propanol), 에탄올(Ethanol), 메탄올(Methanol), 아세토니트릴(Acetronitrile) 및 아세톤(Acetone)에 대한 안정성을 알아보기 위해 다양한 농도에서 포스포리파제/리파제 MPlaG 활성을 측정하였다.
그 결과, 60%(v/v)농도까지 사용한 유기용제들에 의한 포스포리파제/리파제 MPlaG의 활성 저해는 관찰되지 않았으며, 이는 유기용제 환경에서의 산업적인 응용에서도 충분히 활용 가능함을 보여주는 것이다.
유기용제 | 효소활성 상대치(%) | |||
20% | 30% | 50% | 60% | |
디메틸설폭사이드(DMSO, dimethyl sulfoxide) | 98 | 97 | 98 | 81 |
디메틸폼아마이드(DMF, dimethylformamide) | 99 | 100 | 93 | 98 |
2-프로판놀(2-propanol) | 101 | 97 | 96 | 99 |
에탄올(Ethanol) | 100 | 95 | 94 | 98 |
메탄올(Methanol) | 100 | 101 | 93 | 98 |
아세토니트릴(Acetronitrile) | 100 | 99 | 98 | 99 |
아세톤(Acetone) | 96 | 100 | 96 | 99 |
<6-6>
포스포리파제
/
리파제
MPlaG
의 효소활성 비교
본 발명의 포스포리파제/리파제 MPlaG와 산업적으로 많이 이용되는 CALB(lipase from Candida antartica) 및 CRL(lipase from Candida rugosa) 을 효소 활성 분석법(pH-stat법)에 따라서 비활성도(specific activity)를 측정하였다.
그 결과, 표 4에 나타낸 바와 같이, 비록 합성된 트리부티린(tributyrin, C4) 기질에 대해서는 CALB가 가장 높은 활성을 나타내었지만, 천연기질인 올리브유(Olive oil)에 대해서는 본 발명의 포스포리파제/리파제 MPlaG가 가장 높은 활성을 나타내었다. 또한, 포스포리파제 기질인 포스파티딜콜린(phosphatidylcholine)에 대해서는 본 발명의 포스포리파제/리파제 MPlaG만이 활성을 나타내었다. 즉, 리파제인 CALB 및 CRL과 달리 본 발명의 포스포리파제/리파제 MPlaG는 포스포리파제 활성을 나타내고 있다는 것을 정량적으로 확인하였다. 또한, P.pseudoalcaligenes 유래의 리파제의 경우 5.7 U/mg의 포스포리파제 활성을, LecitaseTM (Novozyme)의 경우 6 U/mg의 포스포리파제 활성을 나타내는 것으로 보고한 문헌(Biochimica et Biophysica Acta 1259(1995) 9-17)과 비교해 보았을 때, 본 발명의 포스포리파제/리파제 MPlaG는 지질(lipid)뿐만 아니라 인지질(phospholipid)에 대해서도 우수한 분해활성을 가지는 것을 확인하였다(표 4).
아울러, 합성기질을 이용한 활성분석에서, 본 발명의 포스포리파제/리파제 MPlaG 및 전장(full-length) 단백질의 비활성도를 측정한 결과, 본 발명의 포스포리파제/리파제 MPlaG는 본 발명의 전장(full-length) 단백질에 비해 2배 이상 비활성도가 증가하는 것을 확인하였다.
Substrates | |||
트리부티린 (tributyrin, C4) |
올리브 오일 (Olive oil) |
포스파티딜콜린 (phosphatidylcholine) | |
본 발명의 포스포리파제/리파제 MPlaG | 140 ± 6.4 | 114.8 ± 11.3 | 13.4 ± 1.5 |
CALB (lipase from Candida antartica) |
294.2 ± 14.5 | 15.3 ± 0.1 | a |
CRL(lipase from Candida rugosa) | 20.3 ± 0.5 | 53.7 ± 1.5 | a |
a: not determined
<110> Korea Research Institute of Bioscience & Biotechnology
<120> Novel gene from tidal flat metagenome and a novel protein
displaying both phospholipase and lipase activities
<130> 11p-05-20
<160> 7
<170> KopatentIn 1.71
<210> 1
<211> 28845
<212> DNA
<213> Unknown
<220>
<223> pFosPlaG sequence
<400> 1
ctaagatttg ctcagttgaa gaatcaattg gtgatattct ttatatcaag cgtaaggatt 60
tagatcattg ccgactcgca cgcgtaccgt atgtttttgg gaaaaccagt tttgctctgc 120
ttgagtgagc gaaacagtat tgttttgagc taataataat cttggcaaga aaatcaggca 180
aaagagtaca gatactataa taaaagtatg tttcttcaag cggcatcctg ttaggtgaaa 240
atacgatttg aaataaagat tcacacagat aaatttccca atgcaaatat tatattataa 300
tgtttaagat tacacaatca tattgtctgc tattgtgatc cggtttaaag cctaatacag 360
ttttggagag ggagaccaat tatttataat aaacggtgtg agcatcctct ccagtaatga 420
aaaaatgaat tttttaaaaa aaaatgtcac aaacaacaat gtcatgcgta taagtattag 480
gtaaactgag gaggaaggaa taatgcataa cccgtttagt gaacaatcag tatcgaaaga 540
ttccgataga gaattggtgg ctgctgcaat tcagggagac ggtcaagctc tggagaagat 600
tatattaagg catcaggcat ggatttacaa catcgcattt aaaatgatta tggaccatga 660
tgatgcttgt gacattacgc aggaaatttt gattaaaacc ataaccaatc tatcgtcata 720
cgattcaaaa aaagcagctt ttcgaacctg gttgtatcgt gttgtggtca atcatgtgct 780
gagtatgaaa cggaaaaaat ttgaaagaag aatcaatgat tttgatcaat atattaattt 840
aatcgaaaaa ttgccggatc accaacagac aaatcatccg gaagctcatt ttttagcatc 900
cgaatttaaa attggttgta tgatgggaat gctcatgtgt ctcaaccgaa gtgatcgttt 960
gacattttta ctgggtgcag tttttagtat aaaagatact gttggggctg aacttatgga 1020
aatttctcga gaaaattttc gaaaaaagct gtctcgggca aaacaaaaat tatttaccca 1080
catgaatagt gtgtgcggtc atgtgaatcc cgaaagaaag tgtttatgca aaaataaata 1140
taaaaatttt gtagaaatgg gcatgttgga tggtgataat acccgatatc taaagcctga 1200
cacaatggtg gtgaaagagg ttgtggaaga aagagttaag cagttttcga ctcagtatta 1260
tgacccattt ctcactcatt ttcaggaaca accgttttat gaaccgcctg atatggtgaa 1320
atggctgcgt gatatgatcg ggcatgatga tttcaagcgt atgtttaata tacagtaagg 1380
taatatcata ttttttatat ataaaaaagg agattaacat gagaaataaa tttaaaaaag 1440
aactcaaaga atcctatcgt atggaaatgc ttggtgcggg gatttataag gggttgtcaa 1500
atcaatacag caaacgagat gctgagctaa gtcgtaaatt tttaaaattt tcaagacagg 1560
aagcgatgca tggcaggcta tttaaagagt atttttcaga acaatctttt gggcagctta 1620
gatctggttt tttctggcga ttcataggac gcatggcagc aacgctgatg aggcccttac 1680
cgttaagtaa aaaactcaaa aaaatacaag tggccgaaca gcacgccgta tatagcattg 1740
aaaaaaaatt aattgaaaat cttgatcagg ggtatcgcaa aatcattgag ctgattttac 1800
cgcatgaaga agcccatgcc gctctgtatg gtgacctgtt ctccgactaa atgccaagtt 1860
tgtactgggt gtacaggaca ggaaatgata aataacgggg tatgaggtcc aatgggagga 1920
ttatgtaaag ctttacataa tcgttcggtt ggacctcata ccccaatacc ataataaaaa 1980
aggaggggca gaaatgtcac aattaattga agagctcaaa tcctttcacg ttgaaatatc 2040
agatattttc cgccaggtag tggagttcgg aattacctcc gaagaaggtc agaaaaaact 2100
tcttctcgta aaatcaaaac tacttgaaca tttgaagaaa gagaatgagg aactatatcc 2160
gattctctgg aaagaagctg gaaataacat agacttaaaa cttaaattag agttgtttgc 2220
aagagatatg gatgctattg ctatgcaaac aattacattc ttcgaaaaat atactggagt 2280
aacgtctgaa aatgatttta agtctgattt taaaaagatg tatgtagcta tgacaaaaag 2340
acttaacaat gaagaaagta agctgttttc tgaatatgaa aaattgaata tccaataaat 2400
tcaatatgta aaacataacc tcaacattca gagggacagc aaaagcaggc ggtttttatt 2460
tcaagctaaa gtatgtgttc aattgccatc gacaacggtc tgtttgcttt tgctgcccct 2520
gatgccagtg ttataagaaa aaaattaatg aaaaccggaa tgcacattaa aacaaaaaca 2580
ataataatta taggcgtgtt attaactata ggcggcttta tgtttgattt gttttttgct 2640
ggtattccca atcaagatcc tacatcagaa atgacccaaa gatttaattt caataaatct 2700
gtagccaata cgatagagct aattggatta gtaagtataa taatcggaat aatagcaact 2760
attcttaaaa aaatattaaa aatgacaatc aaaatataat attccatcaa acgacaaaac 2820
ctcgaagaaa agtctccgag gttttagtcg tttatactgt tttcttgtta tatcatgttc 2880
ttagagaaat ttatcgttct caagcatata gacatataca tgccatgcat ggtttagaat 2940
agattttgcg aaatccaccg ccatattatt atcaggtacc aaccatccgc caaaatcagc 3000
gatatcgtta atcccttcca gccaatacgt gttgccatat tgcttggttt caggaactat 3060
accggccaat tcggatccga gagtggtgtc atccatctgc ttattgtggt ctgacaacca 3120
atcgccttta acgttaaaat tggttatctt gcttgcatga cgtatatcta atccgaggtt 3180
attaatggtt ccctgagata aaccggcagc atcaaacgcc attgcttcac gaccggttgc 3240
cagtgccgaa gcagttgcaa gcccgccgcc cagactgtgt ccggtaaacg acaattgcat 3300
tgccgcatca cccgtcaatc cattttgtac attgtactgt tcaacctggg cgctcaagtc 3360
ccttgcaaaa tcaactgcct tttgatattg ctctgagttc ccgaatatct gttccgcatc 3420
tgctacccag tcaacaggag acaggggttc tgttccttta taggcaacaa caaggtcatc 3480
tgtttcagtg ttttgaaaaa ctttgaaatc taaaccatca gtgccccacc agtcaatata 3540
accgccaacg gattgtactt ctacatagtt tggtgttgca aagtctgttg ctttgatatc 3600
atcgatattg gcaaagaatc ccattccaac atgcgctgct gcataatcat cccagtcgta 3660
ggcttgagcg gacagcttac cgtaatcaat cgctttttca taatcagact gatttaaccc 3720
ccatgaatag tttatggtgg catatccgga tgcataccca aaggctttca ttatcagtgg 3780
tcgatccaat ttccccatga ttctgatgta ctcatgacct gaaccggtac catcgccatt 3840
atatccggag tactctatgg tcacacttcc ataagtcgtc gtcactttac ctgcaccatt 3900
taaaatacca ttcggccact gcacaatctt cgtaccattg tttttatcaa aaagctgaat 3960
atcaacatcc ctgtcagaaa tgagatcaat attgacattg gtcagccccg ccggaagttc 4020
acccacctca acaaccgcat tttgggtgat gtcttgctgg aatgttccgg agccggatct 4080
ggccggtcct tctgtgcagt tctctgtccc ttcccaggag tactcgacgg tagctgtccc 4140
tgcggcatat ccaaacgctt tcattgtcag aggttcgtct acggtaccgt aaattttgat 4200
atattcatga cctgaaccag taccatcacc gttataacct gaatactcaa tgacaaaccc 4260
accgtgaagc gtcgtgcctt tgcttggacc gtttaaaatt ccatccggcc attggacaat 4320
ttttaaaccg gtgtttttat caaaaagctg aatatcaaca tcctgatcac tcctcagttc 4380
aatcagaacc tcctgttttc caaccggaat gtcgccaaca accacaacat catttcgggc 4440
gatcgcctgc tgaaacgttc cacttccgga gcaactggcc cccccccagt cgaatccggc 4500
aaatgctgaa cttgcgatga agagacttat taaaacaatc aaattaattt tcatcggttt 4560
ttctagtgtt gtgttcattt cccccccctt aattaatttt tttagttaat caaatgcctt 4620
agtagtacca tcacgaatat cttttatcgt ttacatgtga tccatttcga cttcggtcca 4680
ctgattgcat cagtgtcttt agtttagtct tgtaaacatc gtttagtatc tgcgcatatt 4740
atcggaaagt tcgaaaaagc acaatcaggg aaaccctaat tttgggcttc gattttccta 4800
atttttgccg taaatgctgt attcggttac gttaaggtct gttttttttc accataagac 4860
gcaacgaaga aggtcgcttt ggtaataaat tcatagttat agaatgtaat gcagaaagag 4920
gataatttga caatctctta acattaattg cccaaagatt ttaatatatc tatattgaca 4980
ataaacctaa atttatgaag attgtcaaaa gtgtagaaat acgctaaact aaatacaaat 5040
attgggatta taatttttcc tccaaacgct gcaattagca taataatagt tatgctaatt 5100
gtaatcaaat cttttcgaaa agaagcagta atatcttaga ttaaaataca ggaataatcg 5160
ctttactaaa aaagaacaca agtaaaatat caataacagg agaaatgctc atgacaacaa 5220
atacagcgat caatcttatt aaacgcccga gcggcggccc aatcactgcg gatctctttg 5280
ccgttgttga aaaagagatg ccagctgtgg gggcgggtga gtttttagtt aagcagaatc 5340
atatgtcact tgaccctgcc atgttcggtt ggatgagtcc ggacaccaat agctacattc 5400
ctcctgttgc actcggtgat gtgatgcgca gctcaggtat tggtgaagtg gtcgaaagta 5460
accacccgga ctttaaagta ggcgaccggg taatgggcat gatgggttgg cagcactatt 5520
ttctaagtaa cggccaaggg gtcaacaagg tggatgcgcc actgccggat gaagccatat 5580
tatcgatttt tgcactacct ggtttaacag ccacacaagg tttgtttaat gtcggtaaac 5640
ctaaaaaagg cgaaacgctc attgtcacag gggccgcggg ctcagtaggc tctattgttg 5700
gtcagttagc aaaagccgat ggcctgcacg tgattggtgt tgtcggcaaa gatgaaaaag 5760
ccgattggat tgtgaatgaa ttggggtttg atgctgctat taactacaag agtgacgatt 5820
tagacggtca acttgccaga cacgccgcaa acggcatcga tttgtatttt gaaaacaccg 5880
gcggcccgat tcaaaattta atcgtcgagc gtatgaatgc ccatggtcgt gtagttgttt 5940
gtggtctgat cgcagactac gacaaggaat tagcgtcacc gggcccaagc tggatcaatg 6000
tcattaaacg ccgcctgacc attcaaggat tcaccatgcc ggatcacttt catgaagtgc 6060
ctgctctgct ggcaaaacta acaccgtatg tgatggcagg taagattaaa catcgctcac 6120
atgtattaga gggattggaa tctgctatcg agggcttgaa tttattcttt accggagaga 6180
ataaaggtaa gttgatcgtc aagctttaat agaccggatc aggctgtggt ggggcaagtt 6240
aatccgatat ctgatcgtct cttttaatta ggccattgag ggattttact aacttttaat 6300
ttggtctgta gaaaatattt attacagtgg tggcaattct gctttggttt ccacctgagt 6360
tgatgtagtt gtaactggat gaagacccgg taccgattac attattatcg cattgtgctg 6420
tggtgagttt aataaaaata tctctggtta tgcgggttat ggatgcgctg tcgctgatca 6480
atttgattat ttcgatggtg cttaatgttg aaagttttga gtgggaggga gtgatgcctg 6540
atacgggaat agctgaagtg ttgattgatg aagaaaagat caaaacaatt gttgcacgtt 6600
tgggaaaaga gattaccgaa tattataaag gctctgaaaa ggagttgata gtggttgggc 6660
tgctgcgcgg ctcgtttgtg tttatggctg atctggtgcg cgagatcaaa caccctatga 6720
ttactgactt tatgacggtg tccagttatg gtgacggaac ggtgagctcc ggtgaattca 6780
aagtggtgat ggatcttgat gaatcaattg agggacgtga catacttctg gttgaggata 6840
ttgtcgatac cggaaacact ttcagcaagg tgatccaaat gctcgaaagc agaaacccgg 6900
cttcgcttaa agtctgcact tttttgaata aaccggctcg cagagtcatc gaagtaccga 6960
tagatttctg cggtattgat attcccgatg agtttgtggt cggctacggt cttgatttgg 7020
ctcagaaata ccgcaacatt ccctatgtag gaatctataa tccggagcat aagtaggtgt 7080
cataccccgg taaggctgtc tctctgaaaa attagatctc gcgaaattcc taacaaattt 7140
cgagcagagc cagcaataaa aaaggaaata ttgataatag atgaaaaggt gcatattatc 7200
atgtagttat aaaagcgtca aaaacacatt gcgcttttca gtgtagaggt tggggttacc 7260
cttacttgga agaccgatac ctgctgcttt atagaggttc ttgattggag cgattaaacc 7320
atgccgattt ttgaatatga gtgtaaagag tgtcttaata gatttgaaaa gttagtaagg 7380
ggccaagaaa aaatctgctg ccctcagtgc aattcttaca atttaaaaaa actgatttca 7440
acctgtggta ggatctccga tgataccaaa tatgactggg gtaatcccag cctgcctaat 7500
aagcaagagt ttcaacggga aaaatttaac cacagaaatt tgggtaaaat taaacaaata 7560
gggggactcc ccaaaagcaa acgcacgaaa taaagatgca gttgtcagtg aaacgaacgg 7620
agtcatcctc cagagaccaa aaatatacct tgctacttag ggttccgtta aacatttagg 7680
cctaaaagta gcgtagctgc cgtttgccgc aatctgtgtt tttgataaaa acggataaat 7740
gactttttct aaataaatca gtggattaaa aaatataatg ctttaaaaat agttggttaa 7800
gtgtgccttg tggcaaacgg caactacgct atttatgggc atagtagcat aagtctgaaa 7860
tttagttgtt tttctaaaaa tttcttcaat ataaaatcaa caattaagaa aaaataacgt 7920
ttacaggtaa gcggtgagct tcacaggaat tctatttcaa gttttaaata tgaggaagct 7980
ttgaataagc aattcagagt gaagcgtccc ttataattat agcgatttta ttaaacactt 8040
acaaaataag ttaatgccag atcgagtaaa accgcaaccg cagacatggc aaatataaac 8100
agatagttat agttttctct ggaatttctg attgaggata aacagtagat tacaacagct 8160
cgatcctcat cactaagttc atcacctttc ctgatctttg gaataagact ataatcttca 8220
atcgctcttt tacgtttctc tgaaataata tacctgtaga ggaaaaaaaa agtataccca 8280
attattccga agtaccatac gggtctgaaa tattcctgtt tcacatgctg aaatacaatc 8340
aaaattctga aagcgacggc tgataaaaca ccaagaataa aaaaaatatt aattacgtaa 8400
ccaggtaaag tttttggaac ctctttcatt tgacgatatc cttgcttgtc atgttgaatt 8460
ttatttttgg tgacaacaac ttcaacccta taaaaactaa gagtttgtcc cattcagtca 8520
cattatgtat atatctatat accacataat tacccgtccc tcaaaaccct attcatggta 8580
agccacaatt ttaaaagtga accatttttc aatcgttttt taatttattc tacaaaaagt 8640
taaattaaag ataagaactc ctgtaaaata aagttcttta aatgtgatat ttctatttcg 8700
taaaaacgaa cgttttattg aactgtcctg gcacaatgca tcaaaaatta tagtttcatt 8760
tattgtgagt cagtggcaga taatgtgggt ccgggcttca ggatagaatc aaataatgtg 8820
gtctcagatt tgcgatgatt ccgggtccgg gtgcattata attccggtcc gctacaccta 8880
aatggaccta attaccccat tttctaaaaa ccatgctttg ctatgatttt tttcatcgtt 8940
ccatcttttg agatttgttt caaaccttcg ttgaaatcct tgatctttct ctgataattc 9000
ttcgcttttt ttgagatggc aagatagaga ggatcctcct ttaatgaagg ttccatcggc 9060
tctaaaatct cattatattt tgggaatttc gtattaataa tatgctgagc aaccaattta 9120
tctacaatca ttaaatcaat tctacctaat actaacattt gtagagtctg tgcttctaca 9180
gtaaccggat acttttttaa ataatctgcc gcatcaaacg ctggtggatt gacataccct 9240
ttgataatcc caatcgtgta aggttttagt gcttcataac tcccattaaa tggtatattt 9300
ctatccttgc gtttataaaa gacaatgaga ctgaatggca aaggatcaga gaataatagc 9360
cactgtgccc tttcctctcg ataccaaagc gcataggttc catcggcatc tctgtctttg 9420
accatcaata gacttcttgc gaatggcacg aaatcgacct tcaccgtgta tcccattcgt 9480
tgataggcga tcttcacaat ctcagaaatg aatccataat ttggaagggt tttactctca 9540
tacggaggaa attcagtgga cgtaagtgat atttcttctt ttgcgacgac tcctccaacg 9600
gcataaatca taaatcccag tatgattaga aaatatttca gcttcatttt agctaccttt 9660
tgaattcctt tgaatgattc ctgagatgaa ctgcgaatgc caacgacata ataaccagtt 9720
ataaaagccg acgagactgg ggtaacccca acctttacac taaaaagcgc aatgtgtttt 9780
tgacccattt tataactaca tgataatatg tactttttca tattccatat gcatgcaata 9840
aaccacatta taggcaaaat gtcatctggt tttatttgaa aagatgacat tgtaattatc 9900
taaatatatc ttatggttac cataatacca cagtggtagg ggaccagtgg aagccccccc 9960
caaaagtgat cagttagaat taatttttcc ccaaaagctc tgttttaagg gctgtttaag 10020
aatctgtttg gtgaggccaa ggcaaacctg atcaggcgtg agtggctttg ccttggctcc 10080
atgtttttta aagttgtatc actatacacg tagcggattt taacccggtg gaagatgatg 10140
aatccacccc atattttaag taaaacccag tatgtaattg tctttttcgt cacatttggg 10200
ggttcttcca ctggccccca tatacacctt cattgtgtga ttccggctgg ggtactctct 10260
tttgacaatc aatccttcaa gaaggggcgt aaggattttc tttttccagt tatggctctt 10320
tcaaaagttt ttcgggggaa atttatggag atgctacaaa cagcctatga tgaaaaaaaa 10380
cttatatttc ctgggagaac aaaatcttat ggaaccgttt ccggcttcag agctctaacc 10440
aaaattctct ggtcaaaagg ttgggtggtt tattctaaaa agcccttttc cggacctgag 10500
acagttcttg agtatctctc ccggtatact catcgggtgg cgatttcaaa taaccgtatc 10560
aaaacatgta aagatggaaa agtgactgtt acataccgaa accggaaaaa agaaaccacc 10620
gaaacactgt cgattgatgc tgttgagttt atacgtcgat ttcttttgca tgtggtgcca 10680
cccaacttta tgagaattcg tcattttgga atatttgcca atcgctgcaa gaagaaaaat 10740
atcagtcaat gtcgcagatt tctggggctt tctgaagtaa gacaaaaacc ggcggtaaaa 10800
tccgtagaaa ccctgatgct tgaactgaca ggaattgata taaatcgttg ccctttttgc 10860
aaaaagggtg tgatgaaaca agtttgcaat attccaaaat taaccggtaa gggggctcat 10920
gattttattc aacgccctga caggaggaat tcatcatgaa tgaagcgtag cattaattaa 10980
ctgttgttta gcctaaaatg ttcgttgaag aacaacagga taggtgcgct cattttttga 11040
taaagaggtt attcaaagga attaatttaa aaaaataagc cgcgtattta aaaaagggta 11100
tagtttgcgt aaggtgaaaa taaaaaaacg gggcaaaaag ttcaaaaacc atccatttaa 11160
ctcttgccag agaaatcatt cgactattta caatccccat atatattgtt aagcatttaa 11220
tacgtctaag ttcaacaaag ttttatccat catcccttgt tgtgggaaca cgggtttcac 11280
tcaatttggc attaatattt tccaggccgt tttctatgta aggaccacgg gacaatggat 11340
aaaacccttt acgttcggca actaaactaa atgaaaaaat atcatctttt catgaatggg 11400
caaaatttct taatcgactt aaatggtaaa acatctaagt atggatttta ccagaatgtt 11460
ttcgtcatat cggaagatat agaaaatgca gaacttcttg gcatagaaaa gatcagaagt 11520
gataaagaag atcctccaat gatttttctt gattcatacg atgaaattga tgaaatatct 11580
aatgataata tggcgttaga aaaaggaagc acatattacc ttgaaaaaaa atggtggcaa 11640
ttttggaaat aattgccgaa ccaagcattc aacatagacg ggcgttacgt tgccgctaaa 11700
ttttcagctg caattttatt aatcaatcac attaactggc ttttttcgct ttgaacgccc 11760
gccagttaat ttgtcgttgg gtttcaaaat atataggaag taaaatgata tcttttacag 11820
gtggagcaag aattggttgg gttaatgcaa cttggccttt tgctaaattg aatgttcaaa 11880
aaaatacaat cgaaatcaat gccacagtta ttggaaaata ttcatttaat caagatcaag 11940
taatatctat aaaaaaacat acaataattc ccgtaatagg ttggggaatt cagattgttc 12000
ataacattcc agagtatcct aagaaaataa tattttggac actgaaaaat ccgaattcag 12060
caatcacgaa gattcaaaaa actggttttt taccaaaagc agatccatcg acaataccgc 12120
ctaacattgg aatcccagtt aaatggcagg caatagtatt cattatagca ttatggaatg 12180
ctctactttt tattgatatg ggtggttttc caccagaaaa ttttaaacca ggtttatata 12240
cattattggc tatttttctg ctttttactg gttcaatttc aatatggaaa ttatcgtggt 12300
tgaaacgttt aattattaaa caaggccgta gccctaatga aataaaggca tttttgaatt 12360
tgatttcctt agttagtgga cttcttttag taatgatgtc catgcaaata ttattcatgg 12420
gttaaaaccc aacaatttaa taaagcggac tcaaaaaacc gcgccgcttg ttaaatcgtt 12480
gaactaagcc gctgcgcgtc agtattctcg taattccaac cacttacacc gcaccagcct 12540
tgctaataac attgcaaaaa aaatcatttt ctgattattc actctatatt aagaactcct 12600
tatattgttt tttatttatt tactaacaaa atgaggaggt aactatgggt cccattaaac 12660
atttggtaca aatccgtcat ggcctgtgcc atcattcata ttttacagga cttcacctca 12720
tacctgtaac cggcgatttt tcaagaaagt attaataatc aattgaaaaa tagttcaatt 12780
attttagaac ggtgggttaa actataatac agtttttgat ggtaggagca gtgcctttaa 12840
atcgggccag gttatttatg cttcctggcc gttacaatta ctctttctag cccaaagaat 12900
aattcttaga aaaatataca acacaaatag acacacaagc agagttacaa atagtcccca 12960
taactctggc aaagctatcc agccgtcgtc tgcttcaatt ttaacaacaa acttttgccc 13020
tatattttta ctgctttttg gaacaacctt gattgtatag aggattcctt tcctgcagtc 13080
atagttaaac cagtttgcat gatcaggcat ttcagtgccc tgttgcgaaa aggcaccagc 13140
ctgtcgtccc cgagcataag gaacattaag gttggaagaa actgagttct ttagatcatc 13200
accctcatag agataaagtt caatgagtga gcccgaatga ttgtcataat atgtcgaaat 13260
attaaatttt atatctgcag caggaataaa tttcagcctc atattttcgc tcattacgcc 13320
tcttaaccca tggaattttt cagtgaaata gaggtcagat tttacgtccg gtttctcgaa 13380
aagcgggccg gtataacacc ctctaaattg atttaccttt tctgcaacag caggtaattt 13440
tacctcaact aaaggaaaaa cagcgacaaa aaggcccgcc aaagctgcta aaatgataaa 13500
taaaataaga acacctccaa cacctttctc ttttttttcc atctgaaatc ctttttttgt 13560
tttatatggc ttaatctcca cgaatggaat tatgtttttt gaagcctacc aagtcttggc 13620
tactttttca acatcctctc ttcctacttg gcaactaatg gatgtaagtc gttatgagat 13680
taactctcag atctgtactc gtacaaattc aataaattat atttccctat aattgtggat 13740
tggttcaggc tttttttaat agtcagctcc tggaaggtaa ataaatcaaa attcgcaatg 13800
catcgaaaca ataatcaatt ttccagcggt tatgtagctc acctcttatc tgtaaatggc 13860
gatttttcat aagataattc aaaaacagtt gaaaactggt taatttttta aaatgaatct 13920
caaatatgaa ctattacaat tcatcatatg ttgtatcctt ggttttatta tattcttata 13980
gaatgttttt ccttattttt cctgtatttc ttaatccaga gtttgtctgg aattactatt 14040
agtcaggtga attatttata tcaaaaactt aaaaattttt tttctgttta cgaaagatgt 14100
ttaacatgtc tacttttact tgccccccta ccttacgtcg gatttacttt tagaaaaatt 14160
atccttaatt ttttataggg atactattat ctattgactt tggaggcctt ataagtgttc 14220
ggtttttttt ggtgggatag actcttttac tttccagacg tcacccttca cttcaaacca 14280
aagacgataa tagaggccta taaccgtaaa cgcattatat gtgatttcaa cgtcagtcat 14340
ataatcccct cctgattttt gaattgcatc ttcgactgct ccgtctatct gaggcaagga 14400
tcgtgataga tctatcaaaa caaaccaatg aacattttct ccaactacat ctgtggctac 14460
tttctctctt tttacagaaa gatcaatgct cgtaggtgcc atgacggaaa aagtaccaac 14520
ggatcttgac atacatcctg taattcctac aacgcataac aatgtgaaaa ccatgcggaa 14580
caaatttttt ttcattcttg acctttctcc aactataatg ttctatgaaa ccgaacgctt 14640
aaaaaacccg acaaaaaaag ccgacgggat tggtttatat ttttgacaac ttagcaaaaa 14700
ccaaacctca gggcaacgaa gaacataagc gaacataaag gacatgcaaa caatacactt 14760
ttttaatttg agaaatgtgg atttagtata atttgcctgt ctctgattgt gtcttattct 14820
cggagtggtt gattttacgt tgaggcagtt tacagataat tataaatcaa gcattttaaa 14880
ggacatcacc tcttatctgt aaacgttatt ttttgttgat ctgttgattt aatcttaaaa 14940
aatggtgagt aaactctacc tgataattat ttaccggaat tatcaggcct gcatgataag 15000
tatgataatt gtcacgaaaa gcggcatagt aaaattaaag aggcctgtat ttacaggata 15060
tttaaatctt gaaaaaagta acatttaggc atatatatta cgaaaaatgg taattcggtt 15120
gcaaatgcgg ccgacgtgtt aataactaat gttgtgtgaa aaagtcattg aaaaatcaaa 15180
ccaggaggaa tgatgagaga aaagctattg tcactgcata ttaaaggaca aattaaaaaa 15240
caagaaattg ttgggtttgt ggttgaaaat gcaaagacta ttgaatcata tctggaattg 15300
ttactgacag aatatataaa accccaagga gataggtacc aattagttcg agaggtgctt 15360
ttatctaatg tttttttaga atttggaaag aaagtcaatt tatttggcta tatcaataca 15420
agtgagcagt ggcttaaagg aaaggataaa gacgattttt ttaaaaaaat acgttcaatt 15480
ttgagaacca gaaacacatt tgcgcatgac ttaggttctt ctgctatagg agagactata 15540
gatggtgaaa tcacttttga ttacaaggtt aaaagctttc aatccgaaaa atttaaaatg 15600
cttgaatacc aagagactat aaatgatttt gaaaataact gtaatagcgt tttagaaaca 15660
attcagaaaa ttattgatag ctttgaatag gaataataaa aatcacacaa caaacaggtg 15720
caagggacaa ttaccgcggg ctttgttatt ttaaacactg tggtaatttt aacaatgatt 15780
ttttaataat caacaaggtt aatcggcggc aattgcccct gaccttcagc gttggccaaa 15840
taatgaagga ggataatcga tgactgcgag caataccgat gaatgctgtc caagattcga 15900
tcccgctccc tgggacgaga aggaactaac atgggagcac aggcgtttcg taaaagaccg 15960
ggtgatcagc ttttttcata ttccgttgaa tttcggctcg gttatgaaac gtaacgtagg 16020
cgcaatcgaa gcggcggatg caaagcctga aacaatggta gttctttctg acgagaactc 16080
gttctggggc gccgacgtgt atatagaggt tacaaaggac ataccgggag ccaatatggc 16140
aaccatttca ggaacgtttc tttccaaagt gttcgaggga ccatatcgga acatgcgaaa 16200
atggatcgaa gagatgaaga cgtttgtgca gagcaaagat aagcaccttg agaagttata 16260
ttttttctat accacatgtc caaggtgcgc aaagaagttc ggcaagaatt acgttgctat 16320
tttggcaaag ctatagaagt ggccaacaac tggctgtaat ggattcgggc caaaaagcgg 16380
ccctcacctg tgagccagag cgttacattt cattcacaat aaacaggaga taccatgatt 16440
gcatattgcg gtttagattg ttccaaatgc gatgcacata tcgctacaat tgaaaatagt 16500
ccagcaaaaa ggattgagac tgctaaacag tggtctaaga tgtatcagca tgaaatgagt 16560
cctgaccaaa tcaattgtga tggctgcaaa tcaagtggta caaaattttt tcactgtaac 16620
aactgtgaaa ttcgccagtg ctgtgtttct aaaaatgtcg aaaattgtgc agcctgcgaa 16680
gattacatct gtgacacttt agcagggttt attaagttag ctcctcaagc aggtttagcc 16740
cttgaatctc ttcgataaaa gctcgaggtt ttatagtaac ccgtcgttgc agcggaccga 16800
aagggcaagc cacttgtccc ttcggcttcg ctcggcggcc ccctaaactc catcgttaaa 16860
ggatatcacc tcttatctgt atgcgaaatt ttttaagaaa atatttaaaa acaattgaaa 16920
actgatttaa cattaaaaat gtaacttaac ctcggataca atttgagggg aggatcatat 16980
tttttctaac ggcttcgctc ggcggccccc taaactccat cgttaaagga tatcacctct 17040
tatctgtatg cgaaattttt taagaaaata tttaaaaaca attgaaaact gatttaacat 17100
taaaaatgta acttaacctc ggatacaatt tgaggggagg atcatatttt ttctaatagt 17160
aattcctcat ataaagattc tgttttttga ctcaatgggc tgcataaatc atctacaata 17220
ttttgtttac atttctcata cagaaccttt aacattgctg tatttccagt atataaataa 17280
tacttcatta gcttttgata gatattctct gcgtaaacat caactgtgag atattttttt 17340
gaatagtcta tgcattttaa aaaatctttt cgattttcat aatgttcaat tatacggcta 17400
attgcatgga ggtaagaatc ccggtaatac tctttttttt cagcaatcca atcaacataa 17460
aggtcttctg ccaaaaatgc ccctttgtat gtcgattcta ctttgagata atgatggatt 17520
gatttattca aatcagtttc gttatcctcg gcgagtatta tctcttctcg gaactcatta 17580
atatcgctcc atccatcttt ccccagatgc agtttataac cgttagcatc gtttagaata 17640
tacgatgaca tcatcccttt gatcagttcc ggttcgagta tttttcttaa tgcagataga 17700
gttacccgta acctgtttga tgttttatta ctgtcctgtt caggccacaa catctctatc 17760
aggacttctt tggggatgaa tcctcgactg cgttctgtta atagaaattt aaacaatagt 17820
ttggcattct ggctggtcca tttttcagca ggtatttctg tattcccacg atagagttta 17880
aactctccca ggcaggaaac ccgaagtgac ggagcgggca tctgtgtaag tatttcagag 17940
gcagcctttg agatatcagt cgacttgctt ttttgcaaat ctattaaaga ggatcttgca 18000
cacatcccca tttggttaaa aatcttcttt atatacaact gctctttacc gcttgcaaaa 18060
agctcaacca gtataggcac cacaccctct tcaccaactg agagtagaaa ataatattgg 18120
ttttcctggc atatctttat accttttaga agtttttgaa atgccatttc tttatcattt 18180
tgtgcccagt aatatcgagc ccacacaaaa tttattctat tatttagata tctaaataac 18240
tttaattctt tattagaagt ttccagtatc tgacgtgctt tttggaaatc cgatttttca 18300
atgtataaac cagctttaaa cacgtttaac tcaaactcgg cccatggtat tttatactgg 18360
cctatgactg cctcgcattg tgaaaggttt tttaaagctt tagcatcatc accggaatgt 18420
ttatgaatct gataaaatgt aagatagcac attgccctcc cccaatcact cccgatgttt 18480
tcaaaatttc gaagactctc tttaatatgc tccgttgctt ctattgtttt atttaattca 18540
aggcaattcc gagcggcaga aaaattcagc caggcagatg gaaagaaatc ctcaaatcct 18600
ttatctctca ttaaatttag tcccttttgc gcattctcaa gtccttcaga aaaatcgccc 18660
atataataat ttgtcaatgc agtgatgtaa taattctttg tgaatagtgc ataaaaatct 18720
gaattttcga aaagttgttt ggactttttt aaaaaatcat ttgatctctg gaaattgccg 18780
gataagagat gtcgattccc tatttgagta tatatgccac cttccagaag taaccgccat 18840
tgactatctt gagggtttac tgagatcgtc atcgccttat tgtaacagag atctgcttgt 18900
tcaaacttgc cttgttgagc caaggtatca ataataaaca gatataatat cgttgttaat 18960
tctatattat ccacaaagat atcgaccgct tgtttataag tccgttcagc cttaggaaaa 19020
tcaccatcca tatgattctg atatcccagg cgcattaaac acaaagcagc tccatagggc 19080
accttatcat ttaaaaaagc ttgtgcagac tgctccagac actgaacagc ctcttgcgtt 19140
ttacctgtta gatcaagcca ttgcgccttt aaaaagttaa tccatggttc cttttggaaa 19200
tatctcgacg ggatgtgttt caggtaggat ttaattctct gtcgccgtcc tttagaccat 19260
aaaaatgttg agatttttcc gatgattcga aaagaatctt ccatctgttc actttccaga 19320
taatactcca gggcttcttc ttcgtttcca tcctgttcca ataattgtgc cgtttttttc 19380
tgtagatcct gaatctcttc tttgcaatag ttgttatcga gttttgttct taagaaatcc 19440
tgaaaaatat ggtgatatgt aaagcaatct ttttcatcat ccaattgaaa tgtaaacaga 19500
tgtctttttt ccaaatcaga taaaatctct tttgaattgt taatcctgag aagttgattg 19560
caaaaagcta cttttacttt tgataaaaga gaagtcttga ctaagaaatc ttttgtttca 19620
ggcggaagca tctcatacgc attttcttct aaataggttg caataatccg gttggatcct 19680
tttattttca ataaatcatt atctgctgtt tcctgacttt ttccttttaa cgaatgaaag 19740
aaaaggatta aggcggcaac ccagccgcct gttttttttt ggagatcggc aaaggttctg 19800
ctctgcaatg atagctgaaa cacatctgaa taaagctttt ttatttccga aatagtaaag 19860
gcaaggtcag actctgtaag atccagaaca tctctcctga ctcgtaagct tgaaatctta 19920
attggcggtt cagcacgact gataagtaca agatgaatct tatgatgcat gttttctatt 19980
aaaaatttaa cagcacgatt gacttcatca ttatcatgaa caaggtaata atcgtccagc 20040
acaataacga actcatgttg aattcgattc tcaatctcct ttaaaaagaa atgtaaaatt 20100
ttttcaacct tattaacatc ctgcaaattt tcctcaatcg aaatttctat gtcacccaga 20160
tgctcttcca tacctgcttt caagtaacta aaaaacgttt caaaatcaga atcgtattta 20220
tccaatcgat accagaccgc gggtagttta aaagaaagaa cagcctgttt tacaagggtg 20280
gtttttccat atccggcacc tgcaataacc atggttaatc gtttcgtctg aatatttgac 20340
agtattggca tcaaacgatc ccgaatgatt gtttccgagg ctcctgaaaa acgaagtttt 20400
gactttaaga cttttttatt ctcgtacatt aaacacccta ttgtagttga aacaagcaaa 20460
tgtaatttcg ttttttaaca ttaagagagc aacacttatt ctaataaaac actgggttta 20520
aataaaggtt aacaaacaat taatccaaac gtaacaggtt gttttacaga aagaaagctc 20580
caaattttat caaagtaagt tggcagttga tgttattttt cgcaatctca ttttttatga 20640
attggcatac cattggaatt ctatgttgtt gctggttttg gctttgtaat agatggacac 20700
tcgtatgttt gaggaaattt tggatttggc aaagaaaggt gaagcagtgg cgcacttaag 20760
tacgtcacac aaaagaactg cataaaaaag gaattgatag aaaaatcatt tatgagttaa 20820
caacaatcta tccaacccaa tcattcatca tcattgaaat gttatttcac cgcttcgtat 20880
cgatccgcca tagccacctc ccagaaggca ccacgctcct gtaaggtata gaccgtcaat 20940
cggcgtacga ttatataatc gttgactcag cgagcttttc atagacttat caaaaccaca 21000
gattgcacct tttgcacttc ctgtaattaa tatcatatta atgcatgatt aacatatcgt 21060
ttgttaagaa gaattattta accataaaag gaggatgtta tgaaggtact cgcactaaac 21120
gccagtcccc gcaaacaggg gcaaagtaaa accgaactca tgttgaacaa tcttgtcaag 21180
ggcatgcgtg aagctggtgc tgatgtagaa gttatcaatc ttagggacaa acaaattgag 21240
aattgtaaag ggtgcttttt ttgttggacc aagaccccgg gcatatgtgt tcaaaaagat 21300
gacatgacaa acgagctcta tccaaaatta ctggcctcgg atcttgctat ttacggaaca 21360
ccactctatt taagtacagt cagtgcttct atgaaaacat tcatagacag aacattaccc 21420
gttcttgagc catttttcga aaaagataac gaaagaatat ttcatcctta tcggcatgat 21480
cggctcaaaa tagtttttct ttccgtagca gcagtccctg gtgattcagt gttcgatcgt 21540
ttgtcttctt gggcaaatta cctgtatgct catagcggca aacttgtagc cgaaatatat 21600
agatcctgtt ccccagcatt aaacttgccg ttatatcaag aaaaatcgca agatattcta 21660
gctgctgtta cacaagccgg tcacgaactc gtgaaatcgg aaacaatttt acctgataca 21720
atggctcgca ttaagcagcc tattatggat gatgattctt ttatcgaatt gtcgaatcat 21780
atatgggagg cttgtattaa aaataaaatg actataaatg aatatattga aaaaaagttg 21840
atggcagatt ctggggtctg atacccaatg gaactatttc gtacaataag tcgtatgtgc 21900
ctgatatatc cgtgtttatc aggcacataa tgaggttgtt ttaaggaatt taacagataa 21960
tatctgtaaa tcaatcaatt tataggcaaa aacgtgtttt attgttcctt atcgtacgtt 22020
tggctccact gggcttcaaa ccccttaatc ctgatattgt tactttccca atgacgacct 22080
ttacagataa ttataaatca aacatttgaa aggacatcac ctcttatctg taaacggttt 22140
tttttacaaa tttgttgaaa atttattgat actgctatgg ttttgatcaa tgtaaaaaat 22200
gattgaattt aaaagaatta tacgatagtc gataaagaaa atatcgatta gtaaaaacaa 22260
tgaatttttc ccatatatag agccaaccac aagttttaag ggctataagt aaaagaatga 22320
agaaaagaat aatgatcaat ggagttgtat ttgttgcgtt gacagcaatc ccattaattg 22380
gtgagttaat tacaataaca ccaaactatg tacctggtac tggttttagt atcttgctgt 22440
atgaaccttt tgattttgcc tattcgctat tggccttaac aatattcata atagtaaata 22500
taaagattgc tattgcaagc aacacctcat tgtgggtcga tgccgtaaca tcaataggtg 22560
tatttattat atggttcatt atatcgttct tatgtgtatg tcaattgcat gttagccttg 22620
gtggtcaact atgagcatac ttataacaag gcaataaaat cattgcggac tacaaaggcc 22680
gtgtttgggt ttcactcatt tgagtttgtc gtttaagaaa ctttgtaata attactatca 22740
gcccgccgct tttcgtggct gcttattttt tatggggctt tatgaaactt ctaattatag 22800
caataattat attcttttta tgtacagtcg cctcagcaga aaaaaggcca ctttatatgt 22860
ctaaggcgag attttatagt ggtgtttata aatcagaaaa tataaaagaa atttgggcaa 22920
aaattgtaaa gaatctttct cctgaagagt tccaaatcct taaaatgaag ccggaatatg 22980
atatttcaac tgcagaatat attgatggtg tttatatacc tgaagatcta caagaggttt 23040
ggtttgaatt agataaaaaa ttgtcaaaag aagatcgcga gaaactaaca aaaatacaag 23100
aacatgaaat gtctaatttt cacttctcaa caggtatggg tatgagaaat agttggaaac 23160
tttggagtgg gtcacgtcta tcaaagtatt tcaatgaaat aggaatacac cacccggatg 23220
atatgtctgg cattatctta aagacttttt ggtgttacat aaataataaa ccactaaaat 23280
tggagcagca aattgcattt tataaacaat actgggacgt tcgtttacct cctcctttgc 23340
atacacaccc ggaacaaaac ctcattgagg ttggtgcaca agactataac acaacgaaag 23400
gaagatactt aggttatata caagtttata aaaatccaga ttctggtaaa atatggcttt 23460
atgaaaatgg caagggatgg aaaatagcta aaaagtcttt ttataaaaaa tttccgcatt 23520
ggaaagaata aaaaaaggcc cataatatgg ctaaataagg attttttgaa attacggcac 23580
cctgagtaag gatcattaga aattcatcag gtgttgccgc aattgcagtc tatacagcga 23640
taaaggatat cacctcttat ctttaaacgt tattttttgc gtaactattg aaaagtcgtt 23700
tatatctgtg gtgggtttgt taatataaaa aacaattgaa attgcagaat aaaggggtcc 23760
acttttgact cttggtttaa atataaaggt caaacgtaga cttaaccccc atttttgatt 23820
agaagtgatt gcataattaa gtatgcgaag accaaatctt ttttttgctt cagaaagcca 23880
gtacaaccat cttttcttat cttttgaaaa ttttaacaaa aaatcttttt tatgacatct 23940
ttgggtaata tgccacatgt agtttggtat atagtggcta tttgctcggg ccatttttct 24000
taaatagacc ttttttacct gaaaaacaag gtcctaagac caaaaaaaaa taaaaaaata 24060
gcttttttca tattaattca agatgttgac ttggtccgac aagaatattg atacttctgc 24120
acgcccctat tcgatccgtt caccatcttt gtaagttctc tcggattctt tttttccatt 24180
ttcagaccac tcaatccgtt tcccaatctc tataccattc ttgtaagttc cctctgcttt 24240
tagttgacca ttttcatgcc aactaatcca tttcccgttc cttataccat ccttgtaagt 24300
tccctcttct tttatttgtc cattttcgta ccacagaata tatttccctt tccttatacc 24360
atccttgtaa gtttcctcct cacttatttg gccattttcg taccacagaa tatatttccc 24420
gttccttata ccatccttgt aagtttcctc cctacttatt tggccatttt cataccactc 24480
agtatttttc ccgttctttt tattattctt gtaagttgtc tctatgtatt tttgactatt 24540
tccatgccac cacctaatcc atttaccgtt ccgtttacca ttcttgtatg ttgtctcgat 24600
ttttttctga ccattttcat accatgaaat atatttcccg ttcagtttac cattattgta 24660
agttgtctca ctttttttct gaccatctat aaagaacctg ataactaccc aagtgtttgg 24720
tttttcatgg tttgtttcat aagaaatccc ttttagattt tgtaattgtg atgcatcaat 24780
gtaagtttcc tctttttctt tttgaccatt ttcataccac gaaaaatatt tcccgtttat 24840
ttcaccattc ttaaaagtta tctccctata tttttggcca ttttcatgcc acccaatcat 24900
tgtcccgttc tctttaccat tcttggaagt tccttcctct tttttttgac cattttcata 24960
ccactgaatc catttcccgt ttattttacc aaacttgtat gttgtctctc tatatttttg 25020
gccattttta taccagtaaa tagcgttccc attcagttgc ccctcttcat accaggtttc 25080
tccatcctca tatgtttcct cgcttttttt ttgaccattt tcataccaac aaatagcctt 25140
cccggtcact acaccatccc tgaaagtaaa ctcgcttttt ttttgaccat tttcatacca 25200
acaaatacct ttcccgtttt ttttaccatc cttgaaaata aactcgcttt ttttttggcc 25260
attttcatgc aacctaatta ctttcccggt atacggtttt ccctggttta tttcataaaa 25320
aagttcatct atcattttta attttgatgc ttcaattgtt ttactatctc catgatcaga 25380
gttacacgac acaattaaaa acaataaccc aagaactaca ataaattttt tcatctctcc 25440
acctatctta aggtcaagct cgattcgcta aatattatat gctttcactt ttatcgtttt 25500
acatttatcc aatctttttt tgtaccacta tcataataaa ttgctaattt attttttatc 25560
aagatatcgg ctaaatttct atgattataa cggacaagtt tcaaaagata tgaatcatcc 25620
tagaaaatcg gggagaaaat cggggagaaa atcggggaca gaaaatcggg aaaatcgggg 25680
acatgtataa aatcgggtat aaaatcgggg acatgtaaat aatacataat ccttgacagg 25740
gaacattgag atggggtaga ttgactaaaa ctttcatgtt ttaaggaaca taaagcatag 25800
gagacttata atgcccagaa catcacgaat gttaatccct gacgagaaaa cagcttacca 25860
tgtaatgtcg agaactgccc tggatggttt tccctttgga gatgttgaga aggataaatt 25920
tgttaatatc attaaaaggt atagtaaact ttattttgca gaaataattg gttttacaat 25980
tatggataat cactggcatt tgttagcaat aatgcacccg gagcgaaatt attccgatga 26040
agatataaaa aacagattca ttgaatttca tggtaaagat gcattctttc cacctgaacg 26100
aattccgtac tttcgagaga agtggtcgag cctttcagag tttatcagag atatcaagca 26160
gtccttttca cgcttttaca ataagcttca taacagacgt ggaactttgt ggggtgaaag 26220
atttaaaagt gtgattgttc aaaaaggtga aacccttata aattgtatag cgtatattga 26280
tcttaattca atgagagccg gaatcgttaa aaaaccggat aattacagat ggagttccat 26340
cggataccat gctcagacag agaataaaga tgattttctt tctcttaatt tcggcggtgt 26400
tgaatttggt agaatggatg aaaaagaaag actcagaaga tatagaaaat atctttatga 26460
agccggggca attaataaat atgatggtaa aagcaaaaaa gttattgatc agaagatcgt 26520
tgaaaaagaa agagctaata actttgaaat tacaggctcc ggaagattta tcaataaaac 26580
ccgttacttt acagactcgg gcataatagg cagtaaagag tttgttgctg aaaattatca 26640
gcggtttaaa cacatgtttc aatcgaagca tgagaagaaa cccaactcgg taaaagggat 26700
tgcaggaatg tattctctta aacggctttc aatttaaaaa aatcagaaaa tcaagataat 26760
aagttctcaa taattgagga cgttgtataa atgtttaatt tttaatagtt ttctccatta 26820
tttccgtttt aacaatctta attactaata aaaaatcaca taaaataatt aatcattttt 26880
gttatgcgtt cttataattg aattgtgttg gcgctactgt ggaatttatg catagtttac 26940
atgtccctat tttccctacc tatatgttcc ctgtcaagat ttatgtatta tttgcctgtc 27000
cccagttttt ccagtttttt gttatttgcc tgtccccagt tttcccagtt tttcttagta 27060
ataggactaa acacattaac ccaaaataaa ttttccaata aaataataag ctactttttt 27120
tccacattat cctcaaccct tttctatttt tcaagtggtt caaacattcc gccacaatat 27180
cattgactaa tactgctatg attttttaca ctatggtaca gccagaattc aagaacgcaa 27240
ccactaaaat ttgactatta ttatctttat tctattctat tttcgttttt cgtcccacat 27300
atatttattt tgtgcatatc agtactatgg gttctattaa acatttggta caaattcgtc 27360
acagccagaa acatctttta tatcgtacag gagctcacct cttatctgta aaggttattt 27420
tttgttgaac ggttgattta ctattgatca agtggactta ttattcccaa aacatgaaat 27480
tattatatat gaagagagat acataataga tcaaacgaaa ggttagacaa cctgaaaata 27540
actaaaattt cagaattatg ctgctagcag caaaacagtt ataattcgac aaaatcttaa 27600
catggacttt tcacatattt taatatatct tattgataat aaaacaaaat caatgattat 27660
tgccaaaatt agcaaaatgc gctaaaacaa ctataaatgt gaggatttat aatttttcct 27720
caaaaagctg ctagcagcat aataaaattg ttgtgtttca aatactatga atgaaaataa 27780
agaaataatt aaaaaaggaa cattcctcta cgatggttct gtaatcacgg atattaaaat 27840
tgttaaaact aatattcggt atggatcttg tgattacgag gatgaacctg aatatagaga 27900
tgatttcgaa ggggaattct ataatatcga atttggctct actactgaac gaggtaaatt 27960
tgtatctggt tctctctccc acacatcatt acaagaggca atatcggaag ccgaaaaggc 28020
aactaatttc acggtaactt gggataaata aaagtcccaa aacacaacaa taaggtgcaa 28080
gggacaatta ccgcggcttt gttctattga atgctgccgt gactttaaac tgtaattttt 28140
tattaatctt caaggtcaat cggcggtaat tgcccctgac cttaagcgtt caatccccta 28200
aagagacaaa tattgaggaa tatgtgaata gatcaaattt tgattttgaa agatttcaat 28260
ctgcaaaaag attaaaaata actaagagtt tcaaaccatg ccctactgaa attggcgatg 28320
agatttacca gaacggaatt tttgaattca atatttcaaa acttatcgaa tatattaaga 28380
ataatactga taaatttgaa cttatagaag ttgagattga cgattttcct aaagaatttt 28440
catcattaaa tgagatgcat gtggaatcaa cagaccattc tcaacctgta ataatcgctg 28500
agatttctcc aggactttat aatttgattg atggcaatca taggatggaa aaagcacgta 28560
taaagggatt gacttgtatt aatgcattca aagttaatgt ggaccagcac ataaaattct 28620
taactgataa agatgcgtat ttaaagtaca tcgagtactg gaatggtaaa ataaggcatt 28680
gatattatag acaagaccga aattcactca gactggtgtt acgctgccgc tacacaccgg 28740
ctggtgatgc tgacgttccg ggcctgggtt aaggatcatt cgaaattcat caggtggtgc 28800
cgcaattgca gtcgatacga cgataaagga tttcacctct tatct 28845
<210> 2
<211> 1698
<212> DNA
<213> Unknown
<220>
<223> PlaG
<400> 2
atgaacacaa cactagaaaa accgatgaaa attaatttga ttgttttaat aagtctcttc 60
atcgcaagtt cagcatttgc cggattcgac tggggggggg ccagttgctc cggaagtgga 120
acgtttcagc aggcgatcgc ccgaaatgat gttgtggttg ttggcgacat tccggttgga 180
aaacaggagg ttctgattga actgaggagt gatcaggatg ttgatattca gctttttgat 240
aaaaacaccg gtttaaaaat tgtccaatgg ccggatggaa ttttaaacgg tccaagcaaa 300
ggcacgacgc ttcacggtgg gtttgtcatt gagtattcag gttataacgg tgatggtact 360
ggttcaggtc atgaatatat caaaatttac ggtaccgtag acgaacctct gacaatgaaa 420
gcgtttggat atgccgcagg gacagctacc gtcgagtact cctgggaagg gacagagaac 480
tgcacagaag gaccggccag atccggctcc ggaacattcc agcaagacat cacccaaaat 540
gcggttgttg aggtgggtga acttccggcg gggctgacca atgtcaatat tgatctcatt 600
tctgacaggg atgttgatat tcagcttttt gataaaaaca atggtacgaa gattgtgcag 660
tggccgaatg gtattttaaa tggtgcaggt aaagtgacga cgacttatgg aagtgtgacc 720
atagagtact ccggatataa tggcgatggt accggttcag gtcatgagta catcagaatc 780
atggggaaat tggatcgacc actgataatg aaagcctttg ggtatgcatc cggatatgcc 840
accataaact attcatgggg gttaaatcag tctgattatg aaaaagcgat tgattacggt 900
aagctgtccg ctcaagccta cgactgggat gattatgcag cagcgcatgt tggaatggga 960
ttctttgcca atatcgatga tatcaaagca acagactttg caacaccaaa ctatgtagaa 1020
gtacaatccg ttggcggtta tattgactgg tggggcactg atggtttaga tttcaaagtt 1080
tttcaaaaca ctgaaacaga tgaccttgtt gttgcctata aaggaacaga acccctgtct 1140
cctgttgact gggtagcaga tgcggaacag atattcggga actcagagca atatcaaaag 1200
gcagttgatt ttgcaaggga cttgagcgcc caggttgaac agtacaatgt acaaaatgga 1260
ttgacgggtg atgcggcaat gcaattgtcg tttaccggac acagtctggg cggcgggctt 1320
gcaactgctt cggcactggc aaccggtcgt gaagcaatgg cgtttgatgc tgccggttta 1380
tctcagggaa ccattaataa cctcggatta gatatacgtc atgcaagcaa gataaccaat 1440
tttaacgtta aaggcgattg gttgtcagac cacaataagc agatggatga caccactctc 1500
ggatccgaat tggccggtat agttcctgaa accaagcaat atggcaacac gtattggctg 1560
gaagggatta acgatatcgc tgattttggc ggatggttgg tacctgataa taatatggcg 1620
gtggatttcg caaaatctat tctaaaccat gcatggcatg tatatgtcta tatgcttgag 1680
aacgataaat ttctctaa 1698
<210> 3
<211> 837
<212> DNA
<213> Unknown
<220>
<223> MPlaG
<400> 3
ttaaatcagt ctgattatga aaaagcgatt gattacggta agctgtccgc tcaagcctac 60
gactgggatg attatgcagc agcgcatgtt ggaatgggat tctttgccaa tatcgatgat 120
atcaaagcaa cagactttgc aacaccaaac tatgtagaag tacaatccgt tggcggttat 180
attgactggt ggggcactga tggtttagat ttcaaagttt ttcaaaacac tgaaacagat 240
gaccttgttg ttgcctataa aggaacagaa cccctgtctc ctgttgactg ggtagcagat 300
gcggaacaga tattcgggaa ctcagagcaa tatcaaaagg cagttgattt tgcaagggac 360
ttgagcgccc aggttgaaca gtacaatgta caaaatggat tgacgggtga tgcggcaatg 420
caattgtcgt ttaccggaca cagtctgggc ggcgggcttg caactgcttc ggcactggca 480
accggtcgtg aagcaatggc gtttgatgct gccggtttat ctcagggaac cattaataac 540
ctcggattag atatacgtca tgcaagcaag ataaccaatt ttaacgttaa aggcgattgg 600
ttgtcagacc acaataagca gatggatgac accactctcg gatccgaatt ggccggtata 660
gttcctgaaa ccaagcaata tggcaacacg tattggctgg aagggattaa cgatatcgct 720
gattttggcg gatggttggt acctgataat aatatggcgg tggatttcgc aaaatctatt 780
ctaaaccatg catggcatgt atatgtctat atgcttgaga acgataaatt tctctaa 837
<210> 4
<211> 565
<212> PRT
<213> Unknown
<220>
<223> phospholipase/lipase PlaG
<400> 4
Met Asn Thr Thr Leu Glu Lys Pro Met Lys Ile Asn Leu Ile Val Leu
1 5 10 15
Ile Ser Leu Phe Ile Ala Ser Ser Ala Phe Ala Gly Phe Asp Trp Gly
20 25 30
Gly Ala Ser Cys Ser Gly Ser Gly Thr Phe Gln Gln Ala Ile Ala Arg
35 40 45
Asn Asp Val Val Val Val Gly Asp Ile Pro Val Gly Lys Gln Glu Val
50 55 60
Leu Ile Glu Leu Arg Ser Asp Gln Asp Val Asp Ile Gln Leu Phe Asp
65 70 75 80
Lys Asn Thr Gly Leu Lys Ile Val Gln Trp Pro Asp Gly Ile Leu Asn
85 90 95
Gly Pro Ser Lys Gly Thr Thr Leu His Gly Gly Phe Val Ile Glu Tyr
100 105 110
Ser Gly Tyr Asn Gly Asp Gly Thr Gly Ser Gly His Glu Tyr Ile Lys
115 120 125
Ile Tyr Gly Thr Val Asp Glu Pro Leu Thr Met Lys Ala Phe Gly Tyr
130 135 140
Ala Ala Gly Thr Ala Thr Val Glu Tyr Ser Trp Glu Gly Thr Glu Asn
145 150 155 160
Cys Thr Glu Gly Pro Ala Arg Ser Gly Ser Gly Thr Phe Gln Gln Asp
165 170 175
Ile Thr Gln Asn Ala Val Val Glu Val Gly Glu Leu Pro Ala Gly Leu
180 185 190
Thr Asn Val Asn Ile Asp Leu Ile Ser Asp Arg Asp Val Asp Ile Gln
195 200 205
Leu Phe Asp Lys Asn Asn Gly Thr Lys Ile Val Gln Trp Pro Asn Gly
210 215 220
Ile Leu Asn Gly Ala Gly Lys Val Thr Thr Thr Tyr Gly Ser Val Thr
225 230 235 240
Ile Glu Tyr Ser Gly Tyr Asn Gly Asp Gly Thr Gly Ser Gly His Glu
245 250 255
Tyr Ile Arg Ile Met Gly Lys Leu Asp Arg Pro Leu Ile Met Lys Ala
260 265 270
Phe Gly Tyr Ala Ser Gly Tyr Ala Thr Ile Asn Tyr Ser Trp Gly Leu
275 280 285
Asn Gln Ser Asp Tyr Glu Lys Ala Ile Asp Tyr Gly Lys Leu Ser Ala
290 295 300
Gln Ala Tyr Asp Trp Asp Asp Tyr Ala Ala Ala His Val Gly Met Gly
305 310 315 320
Phe Phe Ala Asn Ile Asp Asp Ile Lys Ala Thr Asp Phe Ala Thr Pro
325 330 335
Asn Tyr Val Glu Val Gln Ser Val Gly Gly Tyr Ile Asp Trp Trp Gly
340 345 350
Thr Asp Gly Leu Asp Phe Lys Val Phe Gln Asn Thr Glu Thr Asp Asp
355 360 365
Leu Val Val Ala Tyr Lys Gly Thr Glu Pro Leu Ser Pro Val Asp Trp
370 375 380
Val Ala Asp Ala Glu Gln Ile Phe Gly Asn Ser Glu Gln Tyr Gln Lys
385 390 395 400
Ala Val Asp Phe Ala Arg Asp Leu Ser Ala Gln Val Glu Gln Tyr Asn
405 410 415
Val Gln Asn Gly Leu Thr Gly Asp Ala Ala Met Gln Leu Ser Phe Thr
420 425 430
Gly His Ser Leu Gly Gly Gly Leu Ala Thr Ala Ser Ala Leu Ala Thr
435 440 445
Gly Arg Glu Ala Met Ala Phe Asp Ala Ala Gly Leu Ser Gln Gly Thr
450 455 460
Ile Asn Asn Leu Gly Leu Asp Ile Arg His Ala Ser Lys Ile Thr Asn
465 470 475 480
Phe Asn Val Lys Gly Asp Trp Leu Ser Asp His Asn Lys Gln Met Asp
485 490 495
Asp Thr Thr Leu Gly Ser Glu Leu Ala Gly Ile Val Pro Glu Thr Lys
500 505 510
Gln Tyr Gly Asn Thr Tyr Trp Leu Glu Gly Ile Asn Asp Ile Ala Asp
515 520 525
Phe Gly Gly Trp Leu Val Pro Asp Asn Asn Met Ala Val Asp Phe Ala
530 535 540
Lys Ser Ile Leu Asn His Ala Trp His Val Tyr Val Tyr Met Leu Glu
545 550 555 560
Asn Asp Lys Phe Leu
565
<210> 5
<211> 278
<212> PRT
<213> Unknown
<220>
<223> phospholipase/lipase MPlaG
<400> 5
Leu Asn Gln Ser Asp Tyr Glu Lys Ala Ile Asp Tyr Gly Lys Leu Ser
1 5 10 15
Ala Gln Ala Tyr Asp Trp Asp Asp Tyr Ala Ala Ala His Val Gly Met
20 25 30
Gly Phe Phe Ala Asn Ile Asp Asp Ile Lys Ala Thr Asp Phe Ala Thr
35 40 45
Pro Asn Tyr Val Glu Val Gln Ser Val Gly Gly Tyr Ile Asp Trp Trp
50 55 60
Gly Thr Asp Gly Leu Asp Phe Lys Val Phe Gln Asn Thr Glu Thr Asp
65 70 75 80
Asp Leu Val Val Ala Tyr Lys Gly Thr Glu Pro Leu Ser Pro Val Asp
85 90 95
Trp Val Ala Asp Ala Glu Gln Ile Phe Gly Asn Ser Glu Gln Tyr Gln
100 105 110
Lys Ala Val Asp Phe Ala Arg Asp Leu Ser Ala Gln Val Glu Gln Tyr
115 120 125
Asn Val Gln Asn Gly Leu Thr Gly Asp Ala Ala Met Gln Leu Ser Phe
130 135 140
Thr Gly His Ser Leu Gly Gly Gly Leu Ala Thr Ala Ser Ala Leu Ala
145 150 155 160
Thr Gly Arg Glu Ala Met Ala Phe Asp Ala Ala Gly Leu Ser Gln Gly
165 170 175
Thr Ile Asn Asn Leu Gly Leu Asp Ile Arg His Ala Ser Lys Ile Thr
180 185 190
Asn Phe Asn Val Lys Gly Asp Trp Leu Ser Asp His Asn Lys Gln Met
195 200 205
Asp Asp Thr Thr Leu Gly Ser Glu Leu Ala Gly Ile Val Pro Glu Thr
210 215 220
Lys Gln Tyr Gly Asn Thr Tyr Trp Leu Glu Gly Ile Asn Asp Ile Ala
225 230 235 240
Asp Phe Gly Gly Trp Leu Val Pro Asp Asn Asn Met Ala Val Asp Phe
245 250 255
Ala Lys Ser Ile Leu Asn His Ala Trp His Val Tyr Val Tyr Met Leu
260 265 270
Glu Asn Asp Lys Phe Leu
275
<210> 6
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> forward primer for PCR
<400> 6
ccccatatgt taaatcagtc tgattatga 29
<210> 7
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> reverse primer for PCR
<400> 7
cccctcgaga aatttatcgt tctcaagcat 30
Claims (13)
- 서열번호 5로 기재되는 아미노산 서열로 구성되며, 포스포리파제 및 리파제 활성을 모두 갖는 폴리펩티드.
- 제 1항에 있어서, 상기 포스포리파제 및 리파제의 활성pH는 pH가 5 내지 10인 것을 특징으로 하는 폴리펩티드.
- 제 1항에 있어서, 상기 포스포리파제 및 리파제는 활성온도가 3 내지 30℃인 것을 특징으로 하는 폴리펩티드.
- 제 1항의 폴리펩티드를 암호화하는 폴리뉴클레오티드.
- 제 4항에 있어서, 상기 폴리뉴클레오티드는 서열번호 3으로 기재되는 염기서열을 갖는 것을 특징으로 하는 폴리뉴클레오티드.
- 제 4항의 폴리뉴클레오티드를 포함하는 재조합 발현벡터.
- 제 6항의 재조합 발현벡터가 숙주세포에 형질 도입된 형질전환체.
- 제 7항에 있어서, 상기 형질전환체는 기탁번호 KCTC 11942BP로 기탁된 것을 특징으로 하는 형질전환체.
- 1) 제 4항의 폴리뉴클레오티드를 포함하는 재조합 발현벡터를 제조하는 단계;
2) 상기 재조합 발현벡터를 숙주세포에 도입하여 형질전환체를 제조하는 단계; 및,
3) 상기 형질전환체를 배양하여 재조합 단백질의 발현을 유도하고 이를 수득하는 단계를 포함하는 포스포리파제 및 리파제 활성을 모두 갖는 재조합 단백질 제조방법.
- 제 9항에 있어서, 상기 단계 1)의 폴리뉴클레오티드의 N-말단에 분리정제용 태그를 암호화하는 폴리뉴클레오티드와 단백질 절단효소 인식부위가 추가로 연결되는 것을 특징으로 하는 제조방법.
- 제 10항에 있어서, 상기 분리정제용 태그는 GST, poly-Arg, FLAG, 히스티딘-택(His-tag) 및 c-myc으로 이루어진 군으로부터 선택되는 어느 하나 이상인 것을 특징으로 하는 제조방법.
- 제 10항에 있어서, 상기 단백질 절단효소 인식부위를 절단할 수 있는 단백질 분해효소를 처리하여 원래 형태의 포스포리파제 및 리파제 활성을 모두 갖는 재조합 단백질을 수득하는 단계를 추가로 포함하는 것을 특징으로 하는 제조방법.
- 서열번호 5로 기재되는 아미노산 서열로 구성되며, 포스포리파제 및 리파제 활성을 모두 갖는 폴리펩티드를 유효성분으로 함유하는 세제첨가제.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201280067563.1A CN104471065B (zh) | 2011-11-18 | 2012-07-17 | 来自于淤泥滩宏基因组的基因和从其获得的显示出磷脂酶和脂肪酶共活性的蛋白质 |
PCT/KR2012/005705 WO2013073760A1 (ko) | 2011-11-18 | 2012-07-17 | 갯벌 메타게놈 유래 신규 유전자 및 이로부터 얻어지는 포스포리파제 및 리파제 동시 활성을 보이는 신규 단백질 |
US14/280,062 US9441018B2 (en) | 2011-11-18 | 2014-05-16 | Gene from tidal flat metagenome and a novel protein displaying both phospholipase and lipase activities |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20110120844 | 2011-11-18 | ||
KR1020110120844 | 2011-11-18 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20130055507A true KR20130055507A (ko) | 2013-05-28 |
KR101336785B1 KR101336785B1 (ko) | 2013-12-04 |
Family
ID=48663979
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020120077632A KR101336785B1 (ko) | 2011-11-18 | 2012-07-17 | 갯벌 메타게놈 유래 신규 유전자 및 이로부터 얻어지는 포스포리파제 및 리파제 동시 활성을 보이는 신규 단백질 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9441018B2 (ko) |
EP (1) | EP2784160B1 (ko) |
KR (1) | KR101336785B1 (ko) |
CN (1) | CN104471065B (ko) |
DK (1) | DK2784160T3 (ko) |
WO (1) | WO2013073760A1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023156913A (ja) * | 2022-04-13 | 2023-10-25 | 花王株式会社 | 新規リパーゼ |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1077598C (zh) * | 1994-02-22 | 2002-01-09 | 诺沃奇梅兹有限公司 | 制备脂解酶变异体的方法 |
CN101084307B (zh) * | 2004-09-30 | 2011-06-01 | 诺维信股份有限公司 | 具有脂肪酶活性的多肽和编码其的多核苷酸 |
US8137477B2 (en) * | 2005-03-22 | 2012-03-20 | Gumlink A/S | Method of cleaning a surface attached with at least one chewing gum lump |
EP1891213A2 (en) * | 2005-06-10 | 2008-02-27 | The University Of York | Lipase polypeptide |
MX2009003034A (es) * | 2006-09-21 | 2009-11-18 | Verenium Corp | Fosfolipasas, acidos nucleicos que las codifican, y metodos de hacerlas y usarlas. |
-
2012
- 2012-07-17 DK DK12850464.4T patent/DK2784160T3/en active
- 2012-07-17 CN CN201280067563.1A patent/CN104471065B/zh not_active Expired - Fee Related
- 2012-07-17 KR KR1020120077632A patent/KR101336785B1/ko active IP Right Grant
- 2012-07-17 EP EP12850464.4A patent/EP2784160B1/en not_active Not-in-force
- 2012-07-17 WO PCT/KR2012/005705 patent/WO2013073760A1/ko active Application Filing
-
2014
- 2014-05-16 US US14/280,062 patent/US9441018B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20150329840A1 (en) | 2015-11-19 |
EP2784160A1 (en) | 2014-10-01 |
EP2784160B1 (en) | 2016-01-13 |
EP2784160A4 (en) | 2014-12-31 |
KR101336785B1 (ko) | 2013-12-04 |
WO2013073760A1 (ko) | 2013-05-23 |
CN104471065B (zh) | 2016-10-05 |
US9441018B2 (en) | 2016-09-13 |
CN104471065A (zh) | 2015-03-25 |
DK2784160T3 (en) | 2016-04-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kim et al. | Screening and characterization of a novel esterase from a metagenomic library | |
CN111139229A (zh) | 一种新型gdsl家族脂类水解酶eii-2及其编码基因与应用 | |
KR100986161B1 (ko) | 갯벌 메타게놈 유래 신규 에스터라제 및 이의 제조방법 | |
JP2005517435A (ja) | 新規の真菌リパーゼ | |
KR101336785B1 (ko) | 갯벌 메타게놈 유래 신규 유전자 및 이로부터 얻어지는 포스포리파제 및 리파제 동시 활성을 보이는 신규 단백질 | |
KR100380804B1 (ko) | 내열성을 갖는 포스포리파제 a1의 돌연변이체 및 그의제조방법 | |
KR101209700B1 (ko) | 메타게놈 유래 신규 저온성 에스터라제 | |
JP2005185290A (ja) | 組換カンジダルゴサリパーゼ | |
KR101734935B1 (ko) | 메타게놈 라이브러리로부터 유래한 신규 지질분해효소 및 그의 생산 방법 | |
KR102026836B1 (ko) | 토양 메타게놈 유래 신규 리파아제 유전자 Lip-1420 및 이의 용도 | |
KR101383546B1 (ko) | 심해 해저에서 분리된 에스터라제 ktl 4 | |
Chao et al. | Molecular cloning of the carboxylesterase gene and biochemical characterization of the encoded protein from Pseudomonas citronellolis ATCC 13674 | |
KR101383548B1 (ko) | 심해 해저에서 분리된 에스터라제 ktl 9 | |
KR100572722B1 (ko) | 신규 에스터라제 | |
KR20060022339A (ko) | 토양 메타게놈 유래 신규 리파제 및 이를 이용하여 라세믹에틸 2-브로모프로피오네이트를 선택적으로 분할하는 방법 | |
KR101715817B1 (ko) | 메타게놈 라이브러리로부터 유래한 신규 지질분해효소 및 그의 생산 방법 | |
KR102088811B1 (ko) | 토양 메타게놈 유래 신규 알칼리성 리파아제/에스터라제 유전자 Lip-1447 및 이의 용도 | |
JP2017060424A (ja) | リパーゼ、ポリヌクレオチド、組換えベクター、形質転換体、リパーゼの製造法、グリセロ脂質を加水分解する方法及びグリセロ脂質の加水分解物を製造する方法 | |
KR100714374B1 (ko) | 오플록사신 에스테르에 대한 광학선택적 에스터라아제,이를 암호화하는 뉴클레오타이드 및 이를 이용하여레보플록사신을 제조하는 방법 | |
KR101596435B1 (ko) | 남극 유래 바실러스 푸밀러스 리파아제 | |
KR100997735B1 (ko) | 갯벌 메타게놈 유래 신규 저온성 리파제 및 이의 제조방법 | |
KR101202259B1 (ko) | 심해 해저에서 분리된 리파제 em2l4 | |
KR101383547B1 (ko) | 심해 해저에서 분리된 에스터라제 ktl 7 | |
KR101202261B1 (ko) | 심해 해저에서 분리된 리파제 em2l7 | |
JP2003144162A (ja) | 組換カンジダルゴサリパーゼ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20161124 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20170921 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20181008 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20181226 Year of fee payment: 19 |