KR20230048891A - Phytase Variant - Google Patents

Phytase Variant Download PDF

Info

Publication number
KR20230048891A
KR20230048891A KR1020210131840A KR20210131840A KR20230048891A KR 20230048891 A KR20230048891 A KR 20230048891A KR 1020210131840 A KR1020210131840 A KR 1020210131840A KR 20210131840 A KR20210131840 A KR 20210131840A KR 20230048891 A KR20230048891 A KR 20230048891A
Authority
KR
South Korea
Prior art keywords
leu
ala
gln
thr
pro
Prior art date
Application number
KR1020210131840A
Other languages
Korean (ko)
Inventor
김남윤
김승환
심지현
박을수
이승희
최은정
박재용
홍소연
Original Assignee
씨제이제일제당 (주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 씨제이제일제당 (주) filed Critical 씨제이제일제당 (주)
Priority to KR1020210131840A priority Critical patent/KR20230048891A/en
Priority to CN202280051695.9A priority patent/CN117716028A/en
Priority to PCT/KR2022/014941 priority patent/WO2023059044A1/en
Publication of KR20230048891A publication Critical patent/KR20230048891A/en

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/03Phosphoric monoester hydrolases (3.1.3)
    • C12Y301/030083-Phytase (3.1.3.8)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/03Phosphoric monoester hydrolases (3.1.3)
    • C12Y301/030264-Phytase (3.1.3.26), i.e. 6-phytase

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

The present invention application relates to phytase variants and uses thereof. One object of the present application is to provide a variant polypeptide having phytase activity. The variant polypeptide has sequence identity of 70 to 100% with SEQ ID NO: 1 or an amino acid sequence with 90% or more sequence identity thereto.

Description

피타아제 변이체{Phytase Variant}Phytase Variant {Phytase Variant}

본 출원은 피타아제 활성을 갖는 변이형 폴리펩티드 및 이의 용도에 관한 것이다.The present application relates to variant polypeptides having phytase activity and uses thereof.

피틴산(Phytic acid, myo-inositol hexakisphosphate)은 곡물과 기름 종자에서 발견되는 유기 형태의 인(phosphorus)으로써, 단위동물의 소화관에서 분해되지 않아서 인체와 가축의 무기질 결핍을 유발하고, 또한 분뇨로서 배출되어 가축 사육 밀집지역의 하천이나 호수를 부영양화시켜 수질오염을 야기시켜왔다. Phytic acid (myo-inositol hexakisphosphate) is an organic form of phosphorus found in grains and oilseeds. It is not broken down in the digestive tract of monogamous animals, causing mineral deficiency in humans and livestock, and is also excreted as manure. It has caused water pollution by eutrophication of rivers and lakes in areas where livestock breeding is concentrated.

이에, 피틴산을 분해시키기 위한 방법으로 화학적인 처리가 시도되었으나, 공존하는 영양소를 파괴시키기 때문에 실용화되지 못하였으며, 이후 식품이나 사료에 대한 영양적인 악영향이 없이 피틴산을 분해시키기 위한 수단으로, 피틴산의 가수 분해를 촉매하고 사용 가능한 형태의 무기 형태의 인을 방출하는 포스파타아제(phosphatase) 효소인 피타아제(Phytase, myo-inositol hexakisphosphate phosphohydrolase) (Mullaney EJ, et al., Advances in Applied Microbiology, Volume 47, 2000, Pages 157-199., 2000)가 가장 효과적이라고 입증된 후, 피타아제를 생산하는 미생물을 발굴하기 위한 연구가 1960년대부터 진행되었다. 특히, 1990년대에 곰팡이로부터 피아타제 유전자가 분리된 것을 계기로, 신규한 피타아제 발굴을 비롯하여 기존 피타아제의 활성과 내열성을 향상시키기 위한 연구가 진행되고 있다. Accordingly, chemical treatment has been attempted as a method for decomposing phytic acid, but it has not been put to practical use because it destroys coexisting nutrients, and then, as a means for decomposing phytic acid without adverse nutritional effects on food or feed, phytic acid hydrolysis Phytase (myo-inositol hexakisphosphate phosphohydrolase), a phosphatase enzyme that catalyzes the breakdown and releases phosphorus in usable inorganic form (Mullaney EJ, et al., Advances in Applied Microbiology, Volume 47, 2000, Pages 157-199., 2000) was proven to be most effective, and research to discover microorganisms that produce phytase has been conducted since the 1960s. In particular, since the phytase gene was isolated from fungi in the 1990s, research has been conducted to improve the activity and heat resistance of existing phytases, including the discovery of new phytases.

본 출원의 하나의 목적은 피타아제 활성을 갖는 변이형 폴리펩티드를 제공하는 것이다.One object of the present application is to provide a variant polypeptide having phytase activity.

본 출원의 다른 하나의 목적은 상기 변이형 폴리펩티드를 포함하는 조성물을 제공하는 것이다.Another object of the present application is to provide a composition comprising the variant polypeptide.

본 출원의 다른 하나의 목적은 피틴과 반응을 위한, 상기 변이형 폴리펩티드 또는 상기 변이형 폴리펩티드를 포함하는 반응용 조성물 및/또는 상기 반응용 조성물의 용도를 제공하는 것이다.Another object of the present application is to provide a composition for reaction comprising the variant polypeptide or the variant polypeptide and/or a use of the composition for reaction with phytin.

본 출원의 다른 하나의 목적은 상기 변이형 폴리펩티드, 상기 변이형 폴리펩티드를 발현하는 숙주 세포, 및/또는 상기 변이형 폴리펩티드를 포함하는 조성물을 기질과 접촉시키는 것을 포함하는, 피틴의 가수분해물을 제조하는 방법 및/또는 피틴의 가수분해 방법을 제공하는 것이다.Another object of the present application is to prepare a hydrolyzate of phytin, including contacting the variant polypeptide, a host cell expressing the variant polypeptide, and/or a composition comprising the variant polypeptide with a substrate. It is to provide a method and/or a method for hydrolyzing phytin.

본 출원의 다른 하나의 목적은 상기 변이형 폴리펩티드를 코딩하는 폴리뉴클레오티드; 상기 폴리뉴클레오티드를 포함하는 핵산 구조체; 상기 폴리뉴클레오티드 또는 핵산 구조체를 포함하는 벡터; 및/또는 상기 폴리뉴클레오티드, 핵산 구조체 또는 벡터를 포함하는 숙주세포를 제공하는 것이다.Another object of the present application is a polynucleotide encoding the variant polypeptide; a nucleic acid construct comprising the polynucleotide; a vector containing the polynucleotide or nucleic acid construct; and/or a host cell containing the polynucleotide, nucleic acid construct or vector.

본 출원의 다른 하나의 목적은 상기 변이형 폴리펩티드의 제조방법을 제공하는 것이다.Another object of the present application is to provide a method for producing the variant polypeptide.

본 출원의 하나의 양태는 피타아제 활성을 갖는 변이형 폴리펩티드이다.One aspect of the present application is a variant polypeptide having phytase activity.

하나의 구체예로서, 상기 변이형 폴리펩티드는 i) 상기 변이형 폴리펩티드는 서열번호 1 또는 이와 90% 이상의 서열 동일성을 갖는 아미노산 서열과 70% 이상 100% 미만의 서열 동일성을 가지고; 및/또는In one embodiment, the variant polypeptide has i) the variant polypeptide has a sequence identity of 70% or more and less than 100% with SEQ ID NO: 1 or an amino acid sequence having a sequence identity of 90% or more therewith; and/or

ii) 상기 변이형 폴리펩티드는 서열번호 1 또는 이와 90% 이상의 서열 동일성을 갖는 아미노산 서열의 성숙 폴리펩티드를 코딩하는 서열과 70% 이상 100% 미만의 서열 동일성을 갖는 폴리뉴클레오티드에 의해 코딩되는 폴리펩티드이고; 및/또는ii) the variant polypeptide is a polypeptide encoded by a polynucleotide having at least 70% and less than 100% sequence identity with a sequence encoding a mature polypeptide of SEQ ID NO: 1 or an amino acid sequence having at least 90% sequence identity therewith; and/or

iii) 상기 변이형 폴리펩티드는 (a) 서열번호 1 또는 이와 90% 이상의 서열 동일성을 갖는 아미노산 서열의 성숙 폴리펩티드 코딩 서열, (b) 이의 cDNA, 또는 (c) 상기 (a) 또는 (b)의 전장 상보 서열(full-length complement)과 낮은 엄격도 조건, 중간 엄격도 조건, 중상 엄격도 조건, 높은 엄격도 조건, 또는 매우 높은 엄격도 조건에서 혼성화하는 폴리뉴클레오티드에 의해 코딩되는 폴리펩티드이고; 및/또는iii) the variant polypeptide is (a) a mature polypeptide coding sequence of SEQ ID NO: 1 or an amino acid sequence having at least 90% sequence identity therewith, (b) a cDNA thereof, or (c) the full length of (a) or (b) above A polypeptide encoded by a polynucleotide that hybridizes to a full-length complement under low, medium, high, medium, high, or very high stringency conditions; and/or

iv) 상기 변이형 폴리펩티드는 피타아제 활성을 갖는 i), ii) 또는 iii) 폴리펩티드의 기능적 단편이고; 및iv) the variant polypeptide is a functional fragment of i), ii) or iii) polypeptide having phytase activity; and

하기에서 선택된 어느 하나의 변형을 포함한다.It includes a variant of any one selected from the following.

109번, 134번, 137번, 164번 및 이들의 조합 중 하나 이상의 위치의 아미노산에서의 결실(deletion), 아미노산의 삽입(insertion), 다른 아미노산으로의 치환(substitution), 및 이의 조합;Deletion of amino acids at positions 109, 134, 137, 164 and combinations thereof, insertion of amino acids, substitution with other amino acids, and combinations thereof;

여기서, 상기 위치 번호는 서열번호 1의 폴리펩티드의 위치에 상응하는 위치이다.Here, the position number is a position corresponding to the position of the polypeptide of SEQ ID NO: 1.

상기 구체예 중 어느 하나의 구체예로서, 상기 변형 전 109번 아미노산은 알라닌(A); 134번 아미노산은 글루타민(Q) 또는 리신(K); 137번 아미노산은 아스파라긴(N) 또는 아르기닌(R); 및/또는 164번 아미노산은 아르기닌(R)인 것일 수 있다.As an embodiment of any one of the above embodiments, amino acid number 109 before the modification is alanine (A); Amino acid 134 is glutamine (Q) or lysine (K); amino acid 137 is asparagine (N) or arginine (R); And/or amino acid number 164 may be arginine (R).

상기 구체예 중 어느 하나의 구체예로서, 상기 변이형 폴리펩티드는 하기 i) 내지 xv)에서 선택된 위치의 아미노산의 변형을 포함하는 것일 수 있다:As an embodiment of any one of the above embodiments, the variant polypeptide may include modifications of amino acids at positions selected from the following i) to xv):

i) 109번;i) No. 109;

ii) 134번;ii) No. 134;

iii) 137번;iii) No. 137;

iv) 164번;iv) No. 164;

v) 109+134번;v) No. 109+134;

vi) 109+137번;vi) No. 109+137;

vii) 109+164번;vii) No. 109+164;

viii) 134+137번;viii) times 134+137;

ix) 134+164번;ix) No. 134+164;

x) 137+164번;x) No. 137+164;

xi) 109+134+137번;xi) No. 109+134+137;

xii) 109+134+164번;xii) No. 109+134+164;

xiii) 109+137+164번;xiii) No. 109+137+164;

xiv) 134+137+164번; 및xiv) No. 134+137+164; and

xv) 109+134+137+164번;xv) No. 109+134+137+164;

여기서, 상기 위치 번호는 서열번호 1의 폴리펩티드의 위치에 상응하는 위치이다.Here, the position number is a position corresponding to the position of the polypeptide of SEQ ID NO: 1.

상기 구체예 중 어느 하나의 구체예로서, 상기 변이형 폴리펩티드는 하기 i) 내지 iv) 중 어느 하나 이상의 치환을 포함하는 것일 수 있다:As an embodiment of any one of the above embodiments, the variant polypeptide may include any one or more substitutions of the following i) to iv):

i) 109번 아미노산의 글루탐산으로의 치환;i) substitution of amino acid 109 with glutamic acid;

ii) 134번 아미노산의 글루탐산으로의 치환;ii) substitution of amino acid 134 with glutamic acid;

iii) 137번 아미노산의 히스티딘으로의 치환; 및iii) substitution of amino acid 137 with histidine; and

iv) 164번 아미노산의 세린으로의 치환;iv) substitution of amino acid 164 with serine;

여기서, 상기 위치 번호는 서열번호 1의 폴리펩티드의 위치에 상응하는 위치이다.Here, the position number is a position corresponding to the position of the polypeptide of SEQ ID NO: 1.

상기 구체예 중 어느 하나의 구체예로서, 상기 변이형 폴리펩티드는 하기에서 선택된 어느 하나 이상의 치환을 포함하는 것일 수 있다:As an embodiment of any one of the above embodiments, the variant polypeptide may include any one or more substitutions selected from the following:

A109E;A109E;

Q134E 또는 K134E;Q134E or K134E;

N137H 또는 R137H;N137H or R137H;

R164S;R164S;

A109E+Q134E 또는 A109E+K134E;A109E+Q134E or A109E+K134E;

A109E+N137H 또는 A109E+R137H;A109E+N137H or A109E+R137H;

A109E+R164S;A109E+R164S;

Q134E+N137H 또는 K134E+R137H;Q134E+N137H or K134E+R137H;

Q134E+R164S 또는 K134E+R164S;Q134E+R164S or K134E+R164S;

N137H+R164S 또는 R137H+R164S;N137H+R164S or R137H+R164S;

A109E+Q134E+N137H 또는 A109E+K134E+R137H;A109E+Q134E+N137H or A109E+K134E+R137H;

A109E+Q134E+R164S 또는 A109E+K134E+R164S;A109E+Q134E+R164S or A109E+K134E+R164S;

A109E+N137H+R164S 또는 A109E+R137H+R164S;A109E+N137H+R164S or A109E+R137H+R164S;

Q134E+N137H+R164S 또는 K134E+R137H+R164S; 및Q134E+N137H+R164S or K134E+R137H+R164S; and

A109E+Q134E+N137H+R164S 또는 A109E+K134E+R137H+R164S.A109E+Q134E+N137H+R164S or A109E+K134E+R137H+R164S.

상기 구체예 중 어느 하나의 구체예로서, 상기 변이형 폴리펩티드는 서열번호 1의 아미노산 서열로 구성된 폴리펩티드에 비하여 하기 i) 내지 vii) 중 어느 하나 이상의 변경된 특성을 갖는 것일 수 있다:As an embodiment of any one of the above embodiments, the variant polypeptide may have one or more altered characteristics of the following i) to vii) compared to the polypeptide composed of the amino acid sequence of SEQ ID NO: 1:

i) 효소 활성(enzyme activity) 증가;i) increased enzyme activity;

ii) 특이적 활성 증가; 및ii) increased specific activity; and

iii) 내열성 증가.iii) increased heat resistance.

본 출원의 다른 하나의 양태는 상기 변이형 폴리펩티드를 포함하는 조성물이다.Another aspect of the present application is a composition comprising the variant polypeptide.

본 출원의 다른 하나의 양태는 피틴과의 반응을 위한, 상기 변이형 폴리펩티드 및/또는 상기 변이형 폴리펩티드를 포함하는 조성물의 용도이다.Another aspect of the present application is the use of the variant polypeptide and/or a composition comprising the variant polypeptide for reaction with phytin.

본 출원의 다른 하나의 양태는 상기 변이형 폴리펩티드, 상기 변이형 폴리펩티드를 발현하는 숙주 세포, 및/또는 상기 변이형 폴리펩티드를 포함하는 조성물과 피틴을 접촉시키는 것을 포함하는, 피틴의 가수분해물을 제조하는 방법이다.Another aspect of the present application is to prepare a hydrolyzate of phytin, comprising contacting phytin with the variant polypeptide, a host cell expressing the variant polypeptide, and/or a composition comprising the variant polypeptide way.

본 출원의 다른 하나의 양태는 상기 변이형 폴리펩티드, 상기 변이형 폴리펩티드를 발현하는 숙주 세포, 및/또는 상기 변이형 폴리펩티드를 포함하는 조성물을 피틴에 처리시키는 것을 포함하는, 피틴의 가수분해 방법이다.Another aspect of the present application is a method for hydrolyzing phytin, comprising treating phytin with the variant polypeptide, a host cell expressing the variant polypeptide, and/or a composition comprising the variant polypeptide.

본 출원의 다른 하나의 양태는 상기 변이형 폴리펩티드를 코딩하는 폴리뉴클레오티드이다.Another aspect of the present application is a polynucleotide encoding the variant polypeptide.

본 출원의 다른 하나의 양태는 상기 폴리뉴클레오티드를 포함하는 핵산 구조체이다.Another aspect of the present application is a nucleic acid construct comprising the polynucleotide.

본 출원의 다른 하나의 양태는 상기 폴리뉴클레오티드 또는 상기 핵산 구조체를 포함하는 벡터이다.Another aspect of the present application is a vector comprising the polynucleotide or the nucleic acid construct.

본 출원의 다른 하나의 양태는 상기 변이형 폴리펩티드, 상기 폴리뉴클레오티드, 상기 핵산 구조체, 및/또는 상기 벡터를 포함하는 숙주세포이다.Another aspect of the present application is a host cell comprising the variant polypeptide, the polynucleotide, the nucleic acid construct, and/or the vector.

본 출원의 다른 하나의 양태는 상기 숙주세포를 배양하는 단계를 포함하는, 변이형 폴리펩티드를 제조하는 방법이다.Another aspect of the present application is a method for producing a variant polypeptide comprising culturing the host cell.

본 출원의 피타아제 활성을 갖는 변이형 폴리펩티드는 다양한 산업 분야에 유용하게 사용될 수 있다.The variant polypeptide having phytase activity of the present application can be usefully used in various industrial fields.

도 1은 대장균(Escherichia coli, E.coli) MG1655 균주 유래 피타아제(EcPhy) 변이체의 효소 역가를 형광도(RFU)로 나타낸 도이다.
도 2는 EcPhy 변이체의 상대적 효소 활성을 나타낸 도이다.
도 3은 EPM08 피타아제 변이체의 상대적 효소 활성을 나타낸 도이다.
Figure 1 is Escherichia coli ( E.coli ) MG1655 strain-derived phytase (EcPhy) is a diagram showing the enzyme titer of the mutant fluorescence (RFU).
Figure 2 is a diagram showing the relative enzyme activity of EcPhy mutants.
Figure 3 is a diagram showing the relative enzyme activity of EPM08 phytase variants.

본 출원의 명세서 및 첨부된 청구범위에서 사용되는 바와 같이, 단수형 관사("a", "an", 및 "the")에는 문맥상 명백하게 다르게 언급되지 않는 한 복수의 참조대상이 포함된다. 문맥상 달리 언급되지 않는 한, 단수형 용어는 복수형을 포함하고 복수형 용어는 단수형을 포함한다. 본 출원의 명세서 및 첨부된 청구범위에서, 달리 언급되지 않는 한, "또는"의 사용은 "및/또는"을 포함하는 의미로 사용될 수 있다.As used in the specification of this application and the appended claims, the singular articles "a", "an", and "the" include plural referents unless the context clearly dictates otherwise. Singular terms include the plural and plural terms include the singular, unless the context indicates otherwise. In the specification of this application and in the appended claims, unless stated otherwise, the use of "or" may be used to include "and/or".

본 출원에서, 용어 "약(about)"은 특정 숫자 값 앞에 제시될 수 있다. 본 출원에서 사용되는 용어 "약"은 용어 뒤에 기재되는 정확한 숫자뿐만 아니라, 거의 그 숫자이거나 그 숫자에 가까운 범위까지 포함한다. 그 숫자가 제시된 문맥을 고려하여, 언급된 구체적인 숫자와 가깝거나 거의 그 숫자인지 여부를 결정할 수 있다. 일 예로, 용어 "약"은 숫자 값의 -10% 내지 +10% 범위를 지칭할 수 있다. 다른 예로, 용어 "약"은 주어진 숫자 값의 -5% 내지 +5% 범위를 지칭할 수 있다. 그러나 이에 제한되지 않는다.In this application, the term "about" may be presented before a specific numeric value. As used in this application, the term "about" includes not only the exact number that follows the term, but also a range that is or is close to that number. It can be determined whether the number is close to or nearly the specific number mentioned, given the context in which it is presented. As an example, the term “about” can refer to a range of -10% to +10% of a numerical value. As another example, the term "about" can refer to a range of -5% to +5% of a given numerical value. However, it is not limited thereto.

본 출원에서, 용어 "제1, 제2, 제3,," "i), ii), iii)…" 또는 "(a), (b), (c), (d)…"와 같은 기재는 유사한 구성을 구별하기 위해 사용되었으며, 이들 용어는 연속적이거나 순서대로 수행되는 것을 의미하는 것이 아니다. 예를 들어, 상기 용어가 방법, 용도 또는 분석의 단계(step)와 관련하여 사용되었을 경우, 이들 단계 사이에는 시간적인 간격이 없거나, 동시에 수행되거나, 수 초, 수 분, 수 시간, 수 일, 또는 수 개월 간격을 두고 수행될 수 있다.In this application, descriptions such as the terms “first, second, third,,” “i), ii), iii)…” or “(a), (b), (c), (d)…” are used to distinguish similar configurations, and these terms are not meant to be performed sequentially or sequentially. For example, when the term is used in reference to steps in a method, use, or assay, there is no time interval between these steps, performed simultaneously, seconds, minutes, hours, days, Or it may be performed several months apart.

본 출원에서, 용어 "본질적으로 이루어지는(consisting essentially of)"은 본 출원에서 청구하는 대상의 특징이 불특정 성분의 존재에 실질적으로 영향을 받지 않는 경우, 상기 불특정 성분이 존재할 수 있음을 의미한다.In this application, the term "consisting essentially of" means that a non-specified component may be present if the characteristics of the subject matter claimed in this application are not substantially affected by the presence of the non-specified component.

본 출원에서, 용어 "이루어지는(consisting of)"은 특정 성분(들)의 비율이 총 100%인 것을 의미한다. 용어 "이루어지는" 이하에 오는 성분 또는 특징은 필수적이거나 의무적인 것일 수 있다. 일부 구체예에서, "이루어지는" 이하에 오는 성분 또는 특징 외에, 다른 임의의 성분 또는 필수적이지 않은 성분은 배제될 수 있다.In this application, the term “consisting of” means that the proportions of the specified component(s) total 100%. Ingredients or features that come after the term “consisting of” may be essential or mandatory. In some embodiments, in addition to the ingredients or features that come under "consisting of", any other ingredients or non-essential ingredients may be excluded.

본 출원에서, 용어 "포함하는(comprising)"은 상기 용어 이하에 기재되는 특징, 단계 또는 구성 요소의 존재를 의미하며, 하나 이상의 특징, 단계 또는 구성 요소의 존재 또는 추가를 배제하지 않는다. 본 출원에서 "포함하는" 이하에 기재되는 성분 또는 특징은 필수적이거나 의무적인 것일 수 있으나, 일부 구체예에서는 다른 임의의 혹은 필수적이지 않은 성분 또는 특징을 더 포함할 수 있다.In this application, the term “comprising” means the presence of features, steps or components described below the term, and does not exclude the presence or addition of one or more features, steps or components. Components or features described under "comprising" in this application may be essential or mandatory, but in some embodiments may further include other optional or non-essential components or features.

본 출원에서, 용어 "포함하는" 은, 일부 구체예에서, "본질적으로 이루어지는" 또는 "이루어지는"을 지칭하는 것으로 수정될 수 있다.In this application, the term “comprising” may, in some embodiments, be modified to refer to “consisting essentially of” or “consisting of”.

본 출원에서 아미노산 서열과 관련하여, 특정 서열번호로 기재된 아미노산 서열을 "포함하는" 폴리펩티드, 특정 서열번호로 기재된 아미노산 서열로 "이루어진" 폴리펩티드, 또는 특정 서열번호로 기재된 아미노산 서열을 "갖는" 폴리펩티드 또는 단백질이라고 기재되어 있더라도, 해당 서열번호의 아미노산 서열로 이루어진 폴리펩티드와 동일 혹은 상응하는 활성을 가지는 경우라면, 일부 서열이 결실, 변형, 치환, 보존적 치환 또는 부가된 아미노산 서열을 갖는 단백질도 본 출원에서 사용될 수 있음은 자명하다. 예를 들어, 상기 아미노산 서열 N-말단 그리고/또는 C-말단에 단백질의 기능을 변경하지 않는 서열 추가, 자연적으로 발생할 수 있는 돌연변이, 이의 잠재성 돌연변이(silent mutation) 또는 보존적 치환을 가지는 경우일 수 있으나, 이에 제한되지는 않는다.Regarding the amino acid sequence in this application, a polypeptide "comprising" the amino acid sequence set forth in a specific SEQ ID NO, a polypeptide "consisting of" the amino acid sequence set forth in a specific SEQ ID NO, or a polypeptide "having" an amino acid sequence set forth in a specific SEQ ID NO, or Even if it is described as a protein, if it has the same or equivalent activity as the polypeptide consisting of the amino acid sequence of the corresponding sequence number, a protein having an amino acid sequence in which a part of the sequence is deleted, modified, substituted, conservatively substituted, or added is also used in this application. It is self-evident that it can be used. For example, if the amino acid sequence has an addition of a sequence that does not change the function of the protein, a naturally occurring mutation, a silent mutation thereof, or a conservative substitution to the N-terminus and/or C-terminus of the amino acid sequence. It may, but is not limited thereto.

본 출원에서, 용어 "단백질" 또는 "폴리펩티드"는 연속적인 아미노산 잔기의 폴리머 또는 올리고머를 의미한다. 본 출원에서, "폴리펩티드", "단백질", 및 "펩티드"는 "아미노산 서열"과 상호 교환적으로 사용될 수 있다.In this application, the term "protein" or "polypeptide" refers to a polymer or oligomer of contiguous amino acid residues. In this application, "polypeptide", "protein", and "peptide" may be used interchangeably with "amino acid sequence".

경우에 따라, 활성을 나타내는 아미노산 서열은 "효소"로 지칭할 수 있다. 본 출원에서, 아미노산 서열은 달리 표시되지 않는 한, N-말단 → C-말단 배향으로 기재된다.In some cases, an amino acid sequence that exhibits an activity may be referred to as an "enzyme." In this application, unless otherwise indicated, amino acid sequences are written in N-terminal to C-terminal orientation.

세포, 핵산, 폴리펩티드, 또는 벡터와 관련하여, 본 출원에서 용어 "재조합"은 세포, 핵산, 폴리펩티드 또는 벡터가 이종(heterologous) 핵산 또는 폴리펩티드의 도입 또는 천연 핵산 또는 폴리펩티드의 변경에 의해 변형된 것, 또는 세포가 그렇게 변형된 세포로부터 유도되는 것을 의미한다. 따라서, 예를 들어, 재조합 세포는 세포의 천연(비-재조합) 형태 내에서 발견되지 않는 유전자를 발현하거나, 또는 발현되거나 전혀 발현되지 않는, 다르게는 비정상적으로 발현되는 천연 유전자를 발현할 수 있다.With respect to a cell, nucleic acid, polypeptide, or vector, the term "recombinant" in this application means that a cell, nucleic acid, polypeptide or vector has been modified by introduction of a heterologous nucleic acid or polypeptide or alteration of a natural nucleic acid or polypeptide; or that the cell is derived from a cell so modified. Thus, for example, a recombinant cell may express a gene that is not found in the native (non-recombinant) form of the cell, or may express a native gene that is expressed or not expressed at all, or otherwise abnormally expressed.

본 출원에서, 용어 "분리된(isolated)"은 자연적으로 발생하지 않는 환경에 존재하거나 혹은 자연적으로 존재하지 않는 형태의 물질을 지칭한다. 이는 자연에서 자연적으로 회합되어 있고 자연에서 발견되는 것과 같은 물질, 예를 들어 서열, 효소 또는 핵산을 갖는 적어도 하나의 다른 성분으로부터 상기 물질(서열, 효소 또는 핵산)이 적어도 실질적으로 유리되는 것을 포함한다.In this application, the term "isolated" refers to a substance in a form that does not exist or exists in a non-naturally occurring environment. This includes at least substantially the separation of a substance (sequence, enzyme or nucleic acid) from at least one other component with which it is naturally associated in nature and which has the same substance, eg, a sequence, enzyme or nucleic acid, as found in nature. .

예를 들어, 본 출원에서 제공하는 분리된 서열, 효소 또는 핵산은 하나 이상의 오염물질이 실질적으로 없는 형태로 제공될 수 있다.For example, an isolated sequence, enzyme or nucleic acid provided herein may be provided in a form that is substantially free of one or more contaminants.

분리된 물질의 예시는 i) 자연적으로 발생하지 않는(non-naturally occurring) 임의의 물질, ii) 자연 상태에서 결합되어(associated) 있는 하나, 그 이상, 또는 모든 자연적으로 발생하는 구성이 제거된 임의의 물질(예를 들어, 효소, 변이체, 핵산, 단백질, 펩타이드 또는 보조인자(cofactor)), iii) 자연에서 발견되는 물질이 인위적으로 변형된 임의의 물질, 또는 iv) 자연적으로 결합된 다른 구성성분에 비해 그 물질의 양을 변경하도록 변형된 물질(예를 들어, 특정 물질을 코딩하는 유전자 카피수 증가; 특정 물질을 코딩하는 유전자와 자연적으로 연결된 프로모터를 활성이 강한 프로모터로 변형 등)을 포함할 수 있으나, 이에 제한되지는 않는다. Examples of an isolated material are i) any material that is not naturally occurring, ii) any material from which one, more, or all naturally occurring constituents associated with it in nature have been removed. (e.g., enzymes, variants, nucleic acids, proteins, peptides or cofactors), iii) any substance that has been artificially modified from a substance found in nature, or iv) other constituents with which it is naturally associated. (e.g., increased copy number of a gene encoding a specific substance; modification of a promoter naturally linked to a gene encoding a specific substance into a highly active promoter, etc.) It may, but is not limited thereto.

본 출원에서, 용어 "야생형"은 인위적인 변형을 가지지 않는 천연형(naturally-occurring)인 것을 의미한다. 상기 용어 "야생형"이 폴리펩티드와 관련하여 사용되는 경우, 천연형(naturally occurring) 폴리펩티드로, 하나 이상의 아미노산 위치에서 인위적인 변이(치환, 삽입, 결실 등)를 갖지 않는 것을 의미한다. 이와 유사하게, 용어 "야생형"이 폴리뉴클레오티드와 관련하여 사용되는 경우, 하나 이상의 뉴클레오티드의 인위적인 변형(치환, 삽입, 결실)을 갖지 않는 것을 의미한다. 그러나 야생형 폴리펩티드를 코딩하는 폴리뉴클레오티드는 천연형 폴리뉴클레오티드에 제한되지 않으며, 임의의 야생형 폴리펩티드를 코딩하는 서열도 포함한다.In this application, the term "wild type" means a naturally-occurring one without artificial modification. When the term "wild type" is used in reference to a polypeptide, it is meant to be a naturally occurring polypeptide, which does not have artificial variance (substitutions, insertions, deletions, etc.) at one or more amino acid positions. Similarly, when the term "wild type" is used in reference to a polynucleotide, it means not having artificial modifications (substitutions, insertions, deletions) of one or more nucleotides. However, polynucleotides encoding wild-type polypeptides are not limited to wild-type polynucleotides, and include sequences encoding any wild-type polypeptides.

본 출원에서, 모서열(parent sequence) 또는 골격(backbone)이란 변형(modification)를 도입하여 변이형 폴리펩티드가 되는 기준 서열을 의미한다. 즉, 모서열은 시작 서열(starting sequence)로서 치환, 삽입 및/또는 결실 등의 변이를 도입하는 대상일 수 있다. 상기 모서열은 천연형(naturally occurring) 혹은 야생형(wild type)일 수 있고, 또는 상기 천연형 또는 야생형에 하나 이상의 치환, 삽입 또는 결실이 발생한 변이체(variant)이거나, 또는 인위적으로 합성된 서열일 수 있다. 상기 모서열이 활성을 나타내는 아미노산 서열, 즉 효소의 아미노산 서열인 경우 모효소(parent enzyme)로 칭할 수 있다.In the present application, a parent sequence or backbone refers to a reference sequence that becomes a mutant polypeptide by introducing modification. That is, the parental sequence may be a target for introducing mutations such as substitution, insertion, and/or deletion as a starting sequence. The parental sequence may be a naturally occurring or wild type, or a variant in which one or more substitutions, insertions or deletions have occurred in the natural or wild type, or may be an artificially synthesized sequence. there is. When the parent sequence is an amino acid sequence showing activity, that is, an amino acid sequence of an enzyme, it may be referred to as a parent enzyme.

본 출원에서, 용어 "참조 서열(reference sequence)"은 임의의 아미노산 서열 내 아미노산의 위치(position)를 결정하는 데 사용되는 서열을 의미한다. 임의의 아미노산 서열과 참조 서열을 정렬(align)하여, 임의의 아미노산 서열 내에서 참조 서열의 특정 위치에 대응하는 아미노산의 위치를 결정할 수 있다.In this application, the term “reference sequence” refers to a sequence used to determine the position of amino acids within any amino acid sequence. Any amino acid sequence can be aligned with a reference sequence to determine the position of an amino acid within any amino acid sequence that corresponds to a particular position in the reference sequence.

본 출원에서 아미노산 또는 핵산 서열과 관련하여, 용어 "단편"은 모서열(parent sequence)의 일부를 의미한다. 예를 들어, 모서열에서 하나 이상의 아미노산이 C 또는 N 말단에서 제거된 형태의 폴리펩티드일 수 있다. The term "fragment" in relation to an amino acid or nucleic acid sequence in this application means a portion of a parent sequence. For example, it may be a polypeptide in which one or more amino acids in the parental sequence are removed from the C or N terminus.

본 출원에서, 효소의 "단편"은 "기능적 단편(functional fragment)"을 지칭하는 것일 수 있다. "기능적 단편"은 활성 단편(active fragment)으로도 지칭될 수 있으며, 모효소의 일부이면서 모효소의 효소 활성을 가지는 폴리펩티드를 의미한다. 예를 들어, 효소의 기능적 단편은 효소의 활성 부위(catalytic site)를 포함하는 것일 수 있다.In the present application, a "fragment" of an enzyme may refer to a "functional fragment". "Functional fragment" may also be referred to as an active fragment, and refers to a polypeptide that is part of a parent enzyme and has the enzymatic activity of the parent enzyme. For example, a functional fragment of an enzyme may include a catalytic site of an enzyme.

효소의 단편은 모효소의 전장(full length)의 일부를 포함할 수 있다. 예를 들어, 모효소의 전장의 적어도 약 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 98%, 99% 이상, 100% 미만의 아미노산을 포함할 수 있으나, 이에 제한되지는 않는다.A fragment of an enzyme may include a portion of the full length of the parent enzyme. For example, at least about 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 98%, 99% or more, but less than 100% amino acids of the full length of the parent enzyme. It may include, but is not limited thereto.

본 출원에서, "변이/변형시키는(modifying)"은 변화(changing) 또는 변경(altering)시키는 것을 의미한다. 이는 자연적으로 발생하는 것으로부터의 변경일 수 있다. 일 예로, 효소가 모서열 또는 참조 서열로부터 변경되게 하는 방식으로 효소를 변화시킬 수 있다.In this application, "modifying" means changing or altering. This may be a change from naturally occurring. In one example, an enzyme can be altered in such a way that the enzyme is altered from a parental or reference sequence.

본 출원에서, 변형된 효소는 그 자체로 자연에 존재하지 않는, 즉 자연적으로 발생하지 않는(non-naturally occurring) 효소일 수 있다.In this application, a modified enzyme may be an enzyme that does not itself exist in nature, i.e., is non-naturally occurring.

본 출원에서 용어, "변형된(modified)"은, 예를 들어 그의 자연적으로 발생하는 형태로부터 변경된 것을 의미한다. 본 출원의 변형된 효소는 자연적으로 발생하지 않는 효소 또는 자연적으로 발생하는 변이체를 포함한다. 일 예로, 본 출원의 변형된 효소는 자연에서 발견되지 않은 변형된 효소이다. 일 예로, 본 출원의 변형된 효소는 자발적으로(spontaneously) 발생되지 않은 것일 수 있으나, 이에 제한되지 않는다.In this application, the term "modified" means altered from, for example, its naturally occurring form. Modified enzymes of this application include non-naturally occurring enzymes or naturally occurring variants. In one example, the modified enzyme of the present application is a modified enzyme not found in nature. For example, the modified enzyme of the present application may not occur spontaneously (spontaneously), but is not limited thereto.

본 출원에서 용어 "변형(modification)"이 아미노산/핵산 서열과 관련하여 사용되는 경우, 아미노산 서열에서 하나 이상의 부위에서 상이한 아미노산/핵산 잔기에 대한 모서열의 아미노산/핵산 잔기의 치환(substitution), 하나 이상의 부위에서 모서열의 아미노산/핵산 잔기(또는 일련의 아미노산/핵산 잔기)의 결실(deletion), 하나 이상의 부위에서 모서열의 아미노산/핵산 잔기(또는 일련의 아미노산/핵산 잔기)의 삽입(insertion), N-말단 및/또는 C-말단의 아미노산 서열 또는 5' 및/또는 3' 핵산 서열의 절단(truncation), 및 이들의 임의의 조합을 포함할 수 있다.In this application, when the term "modification" is used in reference to an amino acid/nucleic acid sequence, it is a substitution of an amino acid/nucleic acid residue of a parent sequence for a different amino acid/nucleic acid residue at one or more sites in an amino acid sequence, one Deletion of a parental amino acid/nucleic acid residue (or set of amino acid/nucleic acid residues) at an abnormal site, insertion of a parental amino acid/nucleic acid residue (or set of amino acid/nucleic acid residues) at one or more sites , truncation of N-terminal and/or C-terminal amino acid sequences or 5' and/or 3' nucleic acid sequences, and any combination thereof.

본 출원에서, 효소의 "변이체(variant)" 또는 "변이형 폴리펩티드(modified polypeptide)"는 하나 이상의 아미노산이 보존적 치환(conservative substitution) 및/또는 변형(modification)에 있어서 모효소와 상이한 단백질을 지칭한다. "변이체" 또는 "변이형 폴리펩티드"는 상호 교환적으로 사용될 수 있다. 상기 변이체 또는 변이형 폴리펩티드는 자연적으로 발생하지 않는(non-naturally occurring)것일 수 있으나, 이에 제한되지 않는다.In this application, a “variant” or “modified polypeptide” of an enzyme refers to a protein that differs from the parent enzyme in one or more amino acids by conservative substitution and/or modification. do. “Variant” or “variant polypeptide” may be used interchangeably. The variant or variant polypeptide may be non-naturally occurring, but is not limited thereto.

상기 변이체는 하나 이상의 변형, 예를 들어 아미노산 치환, 결실 및/또는 삽입에 의해 모효소의 서열과 상이하다. Such variants differ from the sequence of the parent enzyme by one or more modifications, eg, amino acid substitutions, deletions and/or insertions.

이러한 변이체는 일반적으로 상기 모효소에서 하나 이상의 아미노산을 변형하고, 상기 변형된 단백질의 특성을 평가하여 식별될 수 있다. 즉, 변이체의 능력은 모효소에 비하여 증가되거나, 변하지 않거나, 또는 감소될 수 있다. Such variants can generally be identified by modifying one or more amino acids in the parent enzyme and evaluating the properties of the modified protein. That is, the ability of the variant may be increased, unchanged, or reduced compared to the parent enzyme.

또한, 일부 변이체는 N-말단 리더 서열 또는 막전이 도메인(transmembrane domain)과 같은 하나 이상의 부분이 제거된 변이형 폴리펩티드를 포함할 수 있다. In addition, some variants may include variant polypeptides in which one or more portions such as an N-terminal leader sequence or a transmembrane domain are removed.

다른 변이체는 성숙 단백질(mature protein)의 N- 및/또는 C-말단으로부터 일부분이 제거된 변이체를 포함할 수 있다. Other variants may include variants in which a portion is removed from the N- and/or C-terminus of the mature protein.

용어 "변이체" 또는 "변이형 폴리펩티드"는 변이형, 변형, 변이된 단백질, 변이 등의 용어(영문 표현으로는 modification, modified protein, mutant, mutein, divergent, variant 등)가 혼용되어 사용될 수 있으며, 변이된 의미로 사용되는 용어라면 이에 제한되지 않는다.The term "mutant" or "mutant polypeptide" may be used interchangeably with terms such as variant, modification, mutated protein, mutation (in English, modification, modified protein, mutant, mutein, divergent, variant, etc.), If the term is used in a modified sense, it is not limited thereto.

변이체는 폴리펩티드의 특성과 2차 구조에 최소한의 영향을 갖는 아미노산들의 결실 또는 부가를 포함할 수 있다. 예를 들면 폴리펩티드는 번역-동시에(co-translationally) 또는 번역-후에(post-translationally) 단백질의 이전(transfer)에 관여하는 단백질 N-말단의 시그널(또는 리더) 서열과 컨쥬게이트 할 수 있다. 또한 상기 폴리펩티드는 폴리펩티드를 확인, 정제, 또는 합성할 수 있도록 다른 서열 또는 링커와 컨쥬게이트 될 수 있다.Variants may include deletions or additions of amino acids that have minimal effect on the secondary structure and properties of the polypeptide. For example, a polypeptide may be conjugated with a signal (or leader) sequence at the N-terminus of a protein that is involved in protein transfer either co-translationally or post-translationally. The polypeptide may also be conjugated with other sequences or linkers to allow identification, purification, or synthesis of the polypeptide.

본 출원에서, 용어 "보존적 치환(conservative substitution)"은 한 아미노산을 유사한 구조적 및/또는 화학적 성질을 갖는 또 다른 아미노산으로 치환시키는 것을 의미한다. 이러한 아미노산 치환은 일반적으로 잔기의 극성, 전하, 용해도, 소수성, 친수성 및/또는 양친매성(amphipathic nature)에서의 유사성에 근거하여 발생할 수 있다.In this application, the term "conservative substitution" means the substitution of one amino acid with another amino acid having similar structural and/or chemical properties. Such amino acid substitutions can generally occur based on similarities in polarity, charge, solubility, hydrophobicity, hydrophilicity and/or amphipathic nature of the residues.

본 출원 명세서 전반에서, 천연적으로 존재하는 아미노산에 대한 통상의 1문자 및 3문자 코드가 사용된다. 또한 본 출원에서 약어로 언급된 아미노산은 IUPAC-IUB 명명법에 따라 기재되었다.Throughout the specification of this application, common one-letter and three-letter codes for naturally occurring amino acids are used. Amino acids also referred to by abbreviations in this application are described according to the IUPAC-IUB nomenclature.

알라닌 Ala, A 아르기닌 Arg, Ralanine Ala, A Arginine Arg, R

아스파라긴 Asn, N 아스파르트산 Asp, DAsparagine Asn, N Aspartate Asp, D

시스테인 Cys, C 글루탐산 Glu, ECysteine Cys, C Glutamate Glu, E

글루타민 Gln, Q 글리신 Gly, GGlutamine Gln, Q Glycine Gly, G

히스티딘 His, H 이소류신 Ile, IHistidine His, H Isoleucine Ile, I

류신 Leu, L 라이신 Lys, KLeucine Leu, L Lysine Lys, K

메티오닌 Met, M 페닐알라닌 Phe, FMethionine Met, M Phenylalanine Phe, F

프롤린 Pro, P 세린 Ser, SProline Pro, P Serine Ser, S

트레오닌 Thr, T 트립토판 Trp, WThreonine Thr, T Tryptophan Trp, W

티로신 Tyr, Y 발린 Val, VTyrosine Tyr, Y Valine Val, V

한편, 임의의 아미노산은 Xaa, X로 기재할 수 있다. On the other hand, any amino acid can be described as Xaa, X.

또한, 천연적으로 존재하는 아미노산뿐만 아니라 Aib(2-Aminoisobutyric acid), Sar(N-methylglycine), 알파-메틸-글루탐산(α-methyl-glutamic acid) 등과 같은 다른 아미노산에 대해 일반적으로 허용되는 3문자 코드가 사용될 수 있다.In addition, the generally accepted three-letter designation for naturally occurring amino acids as well as other amino acids such as Aib (2-Aminoisobutyric acid), Sar (N-methylglycine), α-methyl-glutamic acid, etc. code can be used.

아미노산은 일반적으로 잔기의 극성, 전하, 용해도, 소수성, 친수성 및/또는 양친매성(amphipathic nature)에서의 유사성에 근거하여 분류할 수 있다. 이에, 아미노산 치환은 일반적으로 잔기의 극성, 전하, 용해도, 소수성, 친수성 및/또는 양친매성(amphipathic nature)에서의 유사성에 근거하여 발생할 수 있다.Amino acids can generally be classified based on similarities in the polarity, charge, solubility, hydrophobicity, hydrophilicity and/or amphipathic nature of the residues. Thus, amino acid substitutions can generally occur based on similarities in polarity, charge, solubility, hydrophobicity, hydrophilicity and/or amphipathic nature of the residues.

예를 들면, 전하를 띠는 곁사슬(electrically charged amino acid)을 갖는 아미노산 중 양으로 하전된(염기성) 아미노산은 아르기닌, 라이신, 및 히스티딘을, 음으로 하전된(산성) 아미노산은 글루탐산 및 아스파르트산을 포함하고; 전하를 띠지 않는 곁사슬(uncharged amino acid)을 갖는 아미노산 중 비극성 아미노산(nonpolar amino acid)은 글리신, 알라닌, 발린, 류신, 이소류신, 메티오닌, 페닐알라닌, 트립토판 및 프롤린을 포함하고, 극성(polar) 또는 친수성(hydrophilic) 아미노산은 세린, 트레오닌, 시스테인, 티로신, 아스파라긴 및 글루타민을 포함하고, 상기 비극성 아미노산 중 방향족 아미노산은 페닐알라닌, 트립토판 및 티로신을 포함한다. For example, among amino acids with electrically charged side chains, positively charged (basic) amino acids are arginine, lysine, and histidine, and negatively charged (acidic) amino acids are glutamic acid and aspartic acid. contain; Nonpolar amino acids among amino acids with uncharged side chains include glycine, alanine, valine, leucine, isoleucine, methionine, phenylalanine, tryptophan, and proline, and are polar or hydrophilic ( hydrophilic) amino acids include serine, threonine, cysteine, tyrosine, asparagine, and glutamine, and aromatic amino acids among the non-polar amino acids include phenylalanine, tryptophan, and tyrosine.

본 출원에서 용어, "유전자(gene)"는 폴리펩티드를 코딩하는 폴리뉴클레오티드와 상기 코딩 영역의 앞뒤의 영역을 포함하는 폴리뉴클레오티드를 의미한다. 일부 구체예에서, 유전자는 각각의 코딩 영역(엑손; exon) 사이에 삽입되는 서열(인트론; intron)을 가질 수 있다.As used herein, the term "gene" refers to a polynucleotide that encodes a polypeptide and a polynucleotide that includes regions preceding and following the coding region. In some embodiments, a gene may have sequences (introns) inserted between each coding region (exon).

본 출원에서 용어, "상동성(homology)" 또는 "동일성(identity)"은 두 개의 주어진 아미노산 서열 또는 염기 서열과 관련된 정도를 의미하며 백분율로 표시될 수 있다. 용어 상동성 및 동일성은 종종 상호교환적으로 이용될 수 있다.In this application, the term "homology" or "identity" refers to the degree of relatedness between two given amino acid sequences or nucleotide sequences and can be expressed as a percentage. The terms homology and identity are often used interchangeably.

보존된(conserved) 폴리뉴클레오티드 또는 폴리펩티드의 서열 상동성 또는 동일성은 표준 배열 알고리즘에 의해 결정되며, 사용되는 프로그램에 의해 확립된 디폴트 갭 페널티가 함께 이용될 수 있다. 실질적으로, 상동성을 갖거나(homologous) 또는 동일한(identical) 서열은 일반적으로 서열 전체 또는 전체-길이의 적어도 약 50%, 60%, 70%, 80% 또는 90%를 따라 중간 또는 높은 엄격한 조건(stringent conditions)에서 하이브리드할 수 있다. 하이브리드화는 폴리뉴클레오티드에서 일반 코돈 또는 코돈 축퇴성을 고려한 코돈을 함유하는 폴리뉴클레오티드 역시 포함됨이 자명하다.Sequence homology or identity of conserved polynucleotides or polypeptides can be determined by standard alignment algorithms, together with default gap penalties established by the program used. Substantially homologous or identical sequences are generally under moderate or high stringency conditions along at least about 50%, 60%, 70%, 80% or 90% of the entire or full-length sequence. It can hybridize under stringent conditions. It is obvious that hybridization also includes polynucleotides containing common codons or codons considering codon degeneracy in polynucleotides.

임의의 두 폴리뉴클레오티드 또는 폴리펩티드 서열이 상동성, 유사성 또는 동일성을 갖는지 여부는, 예를 들어, Pearson et al (1988) [Proc. Natl. Acad. Sci. USA 85]: 2444에서와 같은 디폴트 파라미터를 이용하여 "FASTA" 프로그램과 같은 공지의 컴퓨터 알고리즘을 이용하여 결정될 수 있다. 또는, EMBOSS 패키지의 니들만 프로그램(EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16: 276-277)(버전 5.0.0 또는 이후 버전)에서 수행되는 바와 같은, 니들만-운치(Needleman-Wunsch) 알고리즘(Needleman and Wunsch, 1970, J. Mol. Biol. 48: 443-453)이 사용되어 결정될 수 있다(GCG 프로그램 패키지 (Devereux, J., et al, Nucleic Acids Research 12: 387 (1984)), BLASTP, BLASTN, FASTA (Atschul, [S.] [F.,] [ET AL, J MOLEC BIOL 215]: 403 (1990); Guide to Huge Computers, Martin J. Bishop, [ED.,] Academic Press, San Diego,1994, 및 [CARILLO ETA/.](1988) SIAM J Applied Math 48: 1073을 포함한다). 예를 들어, 국립 생물공학 정보 데이터베이스 센터의 BLAST, 또는 ClustalW를 이용하여 상동성, 유사성 또는 동일성을 결정할 수 있으나, 이에 제한되지는 않는다.Whether any two polynucleotide or polypeptide sequences have homology, similarity or identity can be determined, for example, by Pearson et al (1988) [Proc. Natl. Acad. Sci. USA 85]: can be determined using known computer algorithms such as the “FASTA” program using default parameters as in 2444. or, as performed in the Needleman program of the EMBOSS package (EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16: 276-277) (version 5.0.0 or later), It can be determined using the Needleman-Wunsch algorithm (Needleman and Wunsch, 1970, J. Mol. Biol. 48: 443-453) (GCG program package (Devereux, J., et al, Nucleic Acids Research 12: 387 (1984)), BLASTP, BLASTN, FASTA (Atschul, [S.] [F.,] [ET AL, J MOLEC BIOL 215]: 403 (1990); Guide to Huge Computers, Martin J. Bishop , [ED.,] Academic Press, San Diego, 1994, and [CARILLO ETA/.] (1988) SIAM J Applied Math 48: 1073. For example, BLAST of the National Center for Biotechnology Information Database, or ClustalW can be used to determine homology, similarity or identity, but is not limited thereto.

폴리뉴클레오티드 또는 폴리펩티드의 상동성, 유사성 또는 동일성은, 예를 들어, Smith and Waterman, Adv. Appl. Math (1981) 2:482 에 공지된 대로, 예를 들면, Needleman et al. (1970), J Mol Biol. 48:443과 같은 GAP 컴퓨터 프로그램을 이용하여 서열 정보를 비교함으로써 결정될 수 있다. 요약하면, GAP 프로그램은 두 서열 중 더 짧은 것에서의 기호의 전체 수로, 유사한 배열된 기호(즉, 뉴클레오티드 또는 아미노산)의 수를 나눈 값으로 정의할 수 있다. GAP 프로그램을 위한 디폴트 파라미터는 (1) 이진법 비교 매트릭스(동일성을 위해 1 그리고 비-동일성을 위해 0의 값을 함유함) 및 Schwartz and Dayhoff, eds., Atlas Of Protein Sequence And Structure, National Biomedical Research Foundation, pp. 353-358 (1979)에 의해 개시된 대로, Gribskov et al(1986) Nucl. Acids Res. 14: 6745의 가중된 비교 매트릭스 (또는 EDNAFULL (NCBI NUC4.4의 EMBOSS 버전) 치환 매트릭스); (2) 각 갭을 위한 3.0의 페널티 및 각 갭에서 각 기호를 위한 추가의 0.10 페널티 (또는 갭 개방 패널티 10, 갭 연장 패널티 0.5); 및 (3) 말단 갭을 위한 무 페널티를 포함할 수 있다.Homology, similarity or identity of polynucleotides or polypeptides can be found in, for example, Smith and Waterman, Adv. Appl. Math (1981) 2:482, eg, Needleman et al. (1970), J Mol Biol. It can be determined by comparing sequence information using a GAP computer program such as 48:443. In summary, the GAP program can define the total number of symbols in the shorter of the two sequences divided by the number of similarly arranged symbols (i.e., nucleotides or amino acids). The default parameters for the GAP program are (1) a binary comparison matrix (containing values of 1 for identity and 0 for non-identity) and Schwartz and Dayhoff, eds., Atlas Of Protein Sequence And Structure, National Biomedical Research Foundation , pp. 353-358 (1979), Gribskov et al (1986) Nucl. Acids Res. 14: weighted comparison matrix of 6745 (or EDNAFULL (EMBOSS version of NCBI NUC4.4) substitution matrix); (2) a penalty of 3.0 for each gap and an additional penalty of 0.10 for each symbol in each gap (or 10 gap opening penalty, 0.5 gap extension penalty); and (3) no penalty for end gaps.

또한, 임의의 두 폴리뉴클레오티드 또는 폴리펩티드 서열이 상동성, 유사성 또는 동일성을 갖는지 여부는 정의된 엄격한 조건하에서 써던 혼성화 실험에 의해 서열을 비교함으로써 확인할 수 있으며, 정의되는 적절한 혼성화 조건은 해당 기술 범위 내이고, 당업자에게 잘 알려진 방법(예컨대, J. Sambrook et al., Molecular Cloning, A Laboratory Manual, 2nd Edition, Cold Spring Harbor Laboratory press, Cold Spring Harbor, New York, 1989; F.M. Ausubel et al., Current Protocols in Molecular Biology, John Wiley & Sons, Inc., New York)으로 결정될 수 있으나, 이에 제한되지는 않는다.In addition, whether any two polynucleotide or polypeptide sequences have homology, similarity or identity can be confirmed by comparing the sequences by Southern hybridization experiments under defined stringent conditions, and appropriate hybridization conditions defined are within the scope of the art , methods well known to those skilled in the art (e.g., J. Sambrook et al., Molecular Cloning, A Laboratory Manual, 2nd Edition, Cold Spring Harbor Laboratory press, Cold Spring Harbor, New York, 1989; F.M. Ausubel et al., Current Protocols in Molecular Biology, John Wiley & Sons, Inc., New York), but is not limited thereto.

본 출원에서, 용어 "성숙 폴리펩티드(mature polypeptide)"는 신호 서열(signal sequence) 또는 프로펩타이드 서열(propeptide sequence)이 없는 형태의 폴리펩티드를 의미한다. 성숙 단백질/폴리펩티드/펩티드는, 단백질/폴리펩티드/펩티드의 기능적 형태일 수 있다. 성숙 폴리펩티드는 번역 이후, 또는 번역 후 변형을 거친 최종(final form) 형태일 수 있다. 번역 후 변형의 예시로는 N-또는 C-말단 변형, 글리코실화, 인산화, 리더 서열(leader sequence) 제거 등이 있으나, 이에 제한되지는 않는다. In this application, the term “mature polypeptide” refers to a polypeptide in its form without a signal sequence or propeptide sequence. A mature protein/polypeptide/peptide may be a functional form of the protein/polypeptide/peptide. A mature polypeptide may be in its final form post-translational or subjected to post-translational modifications. Examples of post-translational modifications include, but are not limited to, N- or C-terminal modifications, glycosylation, phosphorylation, leader sequence removal, and the like.

본 출원에서 용어, "핵산 구조체(nucleic acid construct)"는, 하나 이상의 조절 서열(regulatory sequence)을 포함하고, 인위적으로 합성되거나, 자연계에 존재하지 않는 방법으로 특정 서열을 포함하도록 조작되거나, 자연으로부터 분리된 단일 혹은 이중가닥 핵산 분자를 의미한다.In this application, the term "nucleic acid construct" includes one or more regulatory sequences, is artificially synthesized, engineered to include a specific sequence by a method that does not exist in nature, or derived from nature. Refers to an isolated single or double-stranded nucleic acid molecule.

본 출원에서 용어, "발현"은 폴리펩티드의 생성에 관여하는 임의의 단계, 예를 들어 전사, 전사 후 변형, 번역, 번역후 변형, 및 분비 등을 포함하나, 이에 제한되지 않는다.As used herein, the term "expression" includes, but is not limited to, any step involved in the production of a polypeptide, such as transcription, post-transcriptional modification, translation, post-translational modification, secretion, and the like.

본 출원에서 용어, "발현 벡터"는 코딩 서열 및 이의 발현을 위해 작동가능하게 연결된 조절 서열을 포함하는 선형 혹은 환형 핵산 분자를 의미한다.As used herein, the term "expression vector" refers to a linear or circular nucleic acid molecule comprising a coding sequence and operably linked regulatory sequences for its expression.

본 출원에서 용어, "작동가능하게 연결된"은 조절 서열이 코딩 서열의 발현을 지시하도록 조절 서열이 적절한 위치에 배치되는 구성을 의미한다. 따라서 "작동가능하게 연결된"은, 프로모터, 종결자, 신호 서열 또는 인핸서 영역과 같이 알려진 혹은 원하는 활성을 가진 기능적 도메인의 조절 영역이 타겟(유전자 또는 폴리펩티드)의 발현, 분비 또는 기능을 상기의 알려진 혹은 원하는 활성에 따라 조절할 수 있도록 그 타겟에 부착되거나 연결된 것을 포함한다.As used herein, the term "operably linked" refers to a configuration in which regulatory sequences are positioned in appropriate positions such that the regulatory sequences direct expression of the coding sequence. Thus, "operably linked" means that a regulatory region of a functional domain having a known or desired activity, such as a promoter, terminator, signal sequence, or enhancer region, functions to express, secrete, or function a target (gene or polypeptide). It includes those attached to or linked to their targets so that they can be modulated according to the desired activity.

본 출원에서 용어, "cDNA"는 진핵 또는 원핵 세포로부터 얻을 수 있는 성숙된, 스플라이싱된 mRNA 분자로부터 역전사를 통해 제조될 수 있는 DNA 서열을 의미한다. cDNA 서열은 상응하는 게놈 DNA에 존재할 수 있는 인트론 서열을 포함하지 않는다. 초기 1차 RNA 전사체는 스플라이싱을 포함한 일련의 단계를 통해 처리되어 성숙된 스플라이싱된 mRNA로 나타나기 전 mRNA의 전구체이다.As used herein, the term "cDNA" refers to a DNA sequence that can be prepared by reverse transcription from mature, spliced mRNA molecules obtainable from eukaryotic or prokaryotic cells. A cDNA sequence does not include intronic sequences that may be present in the corresponding genomic DNA. Early primary RNA transcripts are precursors of mRNA before they are processed through a series of steps including splicing to appear as mature spliced mRNA.

본 출원에서 용어, "조절 서열(regulatory sequence)"은 코딩 서열의 발현에 필요한 폴리뉴클레오티드 서열을 의미한다. 각각의 조절 서열은 코딩 서열에 대해 천연형이거나(기원이 동일함) 또는 외래(foreign; 다른 유전자에서 유래함) 서열일 수 있다. 상기 조절 서열의 예시는 리더 서열(leader sequence), 폴리아데닐레이션 서열(polyadenylation sequence), 프로펩타이드 서열, 프로모터, 신호 펩타이드 서열, 오퍼레이터 서열, 리보좀 결합 부위를 코딩하는 서열, 전사 및 번역 종결을 조절하는 서열을 포함한다. 상기 조절 서열의 최소 단위는 프로모터, 전사 및 번역 종결 서열을 포함할 수 있다.As used herein, the term "regulatory sequence" refers to a polynucleotide sequence necessary for the expression of a coding sequence. Each regulatory sequence may be native (of the same origin) or foreign (from another gene) to the coding sequence. Examples of the regulatory sequence include a leader sequence, a polyadenylation sequence, a propeptide sequence, a promoter, a signal peptide sequence, an operator sequence, a sequence encoding a ribosome binding site, and a sequence that regulates transcription and translation termination. contains sequence. The minimum unit of the regulatory sequence may include a promoter, transcriptional and translational termination sequences.

2. 변이 기재 방법2. How to describe mutations

본 출원에서 제공하는 변이체를 기재하기 위해, 하기의 명명법이 사용된다. To describe the variants provided in this application, the following nomenclature is used.

본 출원에서 아미노산 서열의 특정 위치를 지칭하는 것은, 그 위치에 존재하거나 치환되는 아미노산을 지칭하는 것을 포함할 수 있다. 특정 위치의 아미노산을 지칭하는 것은 다양하게 기재할 수 있다. 예를 들어, "109번 위치"는 "109번 위치", "109번 아미노산", "109번째 아미노산"과 같이 기재할 수 있다. 또한, 예를 들어, 109번째 위치에 있는 아미노산이 알라닌(A)인 경우 이를 "A109" 또는 "Ala109"와 같이 기재할 수 있다.In the present application, reference to a specific position in an amino acid sequence may include reference to an amino acid present or substituted at that position. Referencing an amino acid at a specific position can be described in various ways. For example, "position 109" can be described as "position 109", "amino acid at position 109", "amino acid at position 109". Also, for example, when the amino acid at the 109th position is alanine (A), it can be described as "A109" or "Ala109".

아미노산의 치환은 치환 전의 아미노산, 위치, 치환되는 아미노산 순으로 기재함으로써 표현할 수 있다. 상기 아미노산은 통상의 1문자 및 3문자 코드를 사용하여 표현할 수 있다. 일 예로, 특정 서열의 109번 위치의 아미노산인 알라닌이 글루탐산으로 치환되는 경우 "A109E" 또는 "Ala109Glu"와 같이 기재할 수 있다. Amino acid substitution can be expressed by describing the amino acid before substitution, the position, and the amino acid to be substituted in the order. The amino acids can be expressed using conventional one-letter and three-letter codes. For example, when alanine, an amino acid at position 109 of a specific sequence, is substituted with glutamic acid, it may be described as "A109E" or "Ala109Glu".

특정 위치에서 임의의 아미노산은 "X"로 지칭할 수 있다. 예를 들어 X134는 134번 위치의 임의의 아미노산을 칭한다. 또한 치환되는 아미노산을 X로 표기하는 경우, 치환 전에 존재하는 아미노산과 다른 아미노산으로 치환되는 것을 의미한다. 예를 들어 "R137X"는 137번 위치에서 R이 R이 아닌 임의의 아미노산으로 치환되는 것을 나타낸다.Any amino acid at a particular position may be referred to as "X". For example, X134 refers to any amino acid at position 134. In addition, when the amino acid to be substituted is expressed as X, it means that it is substituted with an amino acid different from the amino acid present before substitution. For example, "R137X" indicates that R at position 137 is substituted with any amino acid other than R.

"/" 또는 "," 기호를 이용해 여러 종류의 아미노산을 동시에 기재함으로써 서로 다른 변형(different alternation)을 표현할 수 있다. 예를 들어 164번 위치의 아미노산(R)이 S 또는 K로 치환된 것은 R164S/K 또는 R164S,K 로 혼용되어 기재될 수 있다. 다른 예로, R/S164K는 치환 전의 164번 위치의 아미노산 R 또는 S가 K로 치환되는 것을 의미한다. Different alternations can be expressed by simultaneously describing several types of amino acids using "/" or "," symbols. For example, when the amino acid (R) at position 164 is substituted with S or K, it may be used interchangeably as R164S/K or R164S,K. As another example, R/S164K means that amino acid R or S at position 164 before substitution is substituted with K.

다중 변이는 "+"를 이용하여 기재할 수 있다. 예를 들어, "A109E+R137H"와 같은 기재는 각각 109번 위치의 아미노산인 알라닌이 글루탐산으로, 137번 위치의 아미노산인 아르기닌이 히스티딘으로 치환되는 것을 의미한다.Multiple mutations can be written using "+". For example, descriptions such as "A109E+R137H" mean that alanine, an amino acid at position 109, is substituted with glutamic acid, and arginine, an amino acid at position 137, is substituted with histidine.

아미노산의 결실은 결실 전 아미노산, 위치, * 순으로 기재함으로써 표현할 수 있다. 예를 들어, 특정 서열의 109번 위치에 상응하는 아미노산인 알라닌이 결실되는 경우 A109* 또는 (Ala109*) 로 표현할 수 있다.Deletion of an amino acid can be expressed by listing the amino acid before deletion, position, * in order. For example, when alanine, an amino acid corresponding to position 109 of a specific sequence, is deleted, it can be expressed as A109* or (Ala109*).

아미노산의 삽입은 예를 들어, 특정 서열 내의 109번 위치의 알라닌과 110번 위치의 아미노산 사이에 라이신이 삽입된 경우, Ala109GlyLys 또는 A109GK와 같이 기재될 수 있다. 하나 이상의 아미노산이 삽입되는 경우, 예를 들어, 특정 서열 내의 109번 위치의 알라닌과 110번 위치의 아미노산 사이에 라이신 및 발린이 삽입되는 것은 Ala109GlyLysVal 또는 A109GKV와 같이 기재할 수 있다. 이 경우 삽입된 아미노산의 위치는, 삽입된 아미노산 앞의 아미노산 번호와 알파벳을 사용하여 나타낼 수 있으며, 전술한 경우를 예로 들면 삽입된 라이신과 발린은 109aK, 109bV와 같이 넘버링 할 수 있다.Insertion of amino acids may be described as Ala109GlyLys or A109GK, for example, when lysine is inserted between alanine at position 109 and amino acid at position 110 in a specific sequence. When one or more amino acids are inserted, for example, insertion of lysine and valine between alanine at position 109 and amino acid at position 110 in a specific sequence can be described as Ala109GlyLysVal or A109GKV. In this case, the position of the inserted amino acid can be indicated using the amino acid number and alphabet in front of the inserted amino acid. For example, in the case described above, the inserted lysine and valine can be numbered as 109aK and 109bV.

본 출원에서, 용어 "상응하는(corresponding to)"은, 단백질 또는 폴리펩티드에서 열거되는 위치의 아미노산 잔기이거나, 또는 단백질 또는 폴리펩티드에서 열거되는 잔기와 유사하거나 동일하거나 상동한 아미노산 잔기를 지칭한다. 상응하는 위치의 아미노산을 확인하는 것은 특정 서열을 참조하는 서열의 특정 아미노산을 결정하는 것일 수 있다. 본 출원에 사용된 "상응 영역"은 일반적으로 관련 단백질 또는 참조 (reference) 단백질에서의 유사하거나 대응되는 위치를 지칭한다. In this application, the term “corresponding to” refers to an amino acid residue at a recited position in a protein or polypeptide, or an amino acid residue that is similar, identical, or homologous to a recited residue in a protein or polypeptide. Identification of the amino acid at the corresponding position may be determining the specific amino acid in the sequence that references the specific sequence. As used herein, “corresponding region” generally refers to a similar or corresponding position in a related or reference protein.

본 출원에서 임의의 아미노산 서열 내 아미노산의 위치(position)를 결정하는 데 서열번호 1이 참조 서열(reference sequence)로 사용될 수 있다. SEQ ID NO: 1 may be used as a reference sequence to determine the position of amino acids in any amino acid sequence in this application.

즉, 본 출원에서 개시하는 서열번호 1는 임의의 피타아제 활성을 가지는 폴리펩티드에서 상응하는 아미노산 잔기를 결정하기 위해 사용될 수 있으며, 본 출원에서 달리 지칭하지 않는 한, 특정 아미노산 서열의 잔기는 서열번호 1을 기준으로 넘버링된다.That is, SEQ ID NO: 1 disclosed in this application can be used to determine the corresponding amino acid residue in any polypeptide having phytase activity, and unless otherwise indicated in this application, the residue of a specific amino acid sequence is SEQ ID NO: 1 are numbered based on

예를 들어, 임의의 아미노산 서열을 서열번호 1과 정렬(align)하고, 이를 토대로 상기 아미노산 서열의 각 아미노산 잔기는 서열번호 1의 아미노산 잔기와 상응하는 아미노산 잔기의 숫자 위치를 참조하여 넘버링 할 수 있다. 예를 들어, 본 출원에 기재된 것과 같은 서열 정렬 알고리즘은, 쿼리 시퀀스("참조 서열"이라고도 함)와 비교하여 아미노산의 위치, 또는 치환, 삽입 또는 결실 등의 변형이 발생하는 위치를 확인할 수 있다.For example, any amino acid sequence can be aligned with SEQ ID NO: 1, and based on this, each amino acid residue of the amino acid sequence can be numbered with reference to the numerical position of the amino acid residue corresponding to the amino acid residue of SEQ ID NO: 1. . For example, sequence alignment algorithms, such as those described herein, can identify the location of amino acids, or locations where modifications such as substitutions, insertions, or deletions occur, compared to a query sequence (also referred to as a “reference sequence”).

이러한 정렬에는 Needleman-Wunsch 알고리즘 (Needleman 및 Wunsch, 1970, J. Mol. Biol. 48: 443-453), EMBOSS 패키지의 Needle 프로그램 (EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000), Trends Genet. 16: 276-277) 등을 이용할 수 있으나, 이에 제한되지는 않는다.These alignments include the Needleman-Wunsch algorithm (Needleman and Wunsch, 1970, J. Mol. Biol. 48: 443-453), the Needle program in the EMBOSS package (EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000). , Trends Genet. 16: 276-277) may be used, but is not limited thereto.

또한 다중 서열 정렬(Multiple sequence alignment)을 통해 다른 피타아제 에서 상응하는 아미노산 잔기를 식별할 수 있다. 당업계에 알려진 다중 서열 정렬 프로그램의 예시로 MUSCLE (multiple sequence comparison by log-expectation; 3.5 버전 이상; Edgar, 2004, Nucleic Acids Research 32: 1792-1797), MAFFT (6.857 버전 이상; Katoh and Kuma, 2002, Nucleic Acids Research 30: 3059-3066; Katoh et al., 2005, Nucleic Acids Research 33: 511-518; Katoh and Toh, 2007, Bioinformatics 23: 372-374; Katoh et al., 2009, Methods in Molecular Biology 537: 39-64; Katoh and Toh, 2010, Bioinformatics 26: 1899-1900) 등의 프로그램 및 ClustalW를 사용하는 EMBOSS EMMA (1.83 이상; Thompson et al., 1994, Nucleic Acids Research 22 : 4673-4680) 등이 있으며, 상기 프로그램 각각의 기본 매개 변수를 사용할 수 있으며, 이에 제한되지는 않는다. In addition, the corresponding amino acid residues in other phytases can be identified through multiple sequence alignment. Examples of multiple sequence alignment programs known in the art include MUSCLE (multiple sequence comparison by log-expectation; version 3.5 or higher; Edgar, 2004, Nucleic Acids Research 32: 1792-1797), MAFFT (version 6.857 or higher; Katoh and Kuma, 2002). , Nucleic Acids Research 30: 3059-3066; Katoh et al., 2005, Nucleic Acids Research 33: 511-518; Katoh and Toh, 2007, Bioinformatics 23: 372-374; Katoh et al., 2009, Methods in Molecular Biology 537: 39-64; Katoh and Toh, 2010, Bioinformatics 26: 1899-1900) and EMBOSS EMMA using ClustalW (at least 1.83; Thompson et al., 1994, Nucleic Acids Research 22: 4673-4680), etc. There is, and the basic parameters of each of the above programs can be used, but are not limited thereto.

그 외에, 서열번호 1의 성숙 폴리펩티드로부터 갈라져 나온 효소가 종래의 서열 기반 비교로 그들의 관계를 검출하지 못하게 되는 경우, 그 밖의 쌍 서열(pairwise sequence) 비교 알고리즘이 사용될 수 있다(Lindahl and Elofsson, 2000, J. Mol. Biol. 295: 613-615). 데이터베이스를 검색하기 위한 폴리펩티드 패밀리(프로파일)의 확률론적 표시를 이용하는 검색 프로그램을 사용하여, 서열 기반 검색에서 보다 높은 민감도(sensitivity)를 얻을 수 있다. 예를 들어, PSI-BLAST 프로그램은 반복적인 데이터베이스 검색 과정을 통하여 프로파일을 산출하고, 관계도가 낮은 상동체(remote homolog)를 검출할 수 있다(Atschul et al., 1997, Nucleic Acids Res. 25: 3389-3402). 폴리펩티드에 대한 패밀리 또는 슈퍼패밀리가 단백질 구조 데이터베이스에서 1개 이상의 표시를 가지는 경우, 훨씬 더 큰 민감성이 달성될 수 있다. GenTHREADER (Jones, 1999, J. Mol. Biol. 287: 797-815; McGuffin and Jones, 2003, Bioinformatics 19: 874-881)와 같은 프로그램은 쿼리 시퀀스(query sequence)에 대한 구조적 폴딩을 예측하는 신경망에 대한 입력으로 PSI-BLAST, 2차 구조 예측, 구조 정렬 프로파일 및 용매화 포텐셜과 같은 다양한 소스로부터의 정보를 이용한다. 유사하게는, 구조를 알 수 없는 서열과 SCOP 데이터베이스에 존재하는 슈퍼패밀리 모델을 정렬하기 위해 Gough et al., 2000, J. Mol. Biol. 313: 903-919의 방법이 사용될 수 있다. 이들 정렬은 폴리펩티드에 대한 상동성 모델을 만들기 위해 차례로 사용될 수 있고, 이러한 모델은 그 목적을 위해 개발된 다양한 툴을 사용하여 정확성에 대해 평가될 수 있다.In addition, if the enzymes diverged from the mature polypeptide of SEQ ID NO: 1 do not detect their relationship by conventional sequence-based comparison, other pairwise sequence comparison algorithms can be used (Lindahl and Elofsson, 2000, J. Mol. Biol. 295: 613-615). Higher sensitivity can be achieved in sequence-based searches by using search programs that use stochastic representations of polypeptide families (profiles) to search databases. For example, the PSI-BLAST program calculates a profile through an iterative database search process and can detect remote homologs with low relationships (Atschul et al., 1997, Nucleic Acids Res. 25: 3389-3402). Even greater sensitivity can be achieved if the family or superfamily for the polypeptide has more than one representation in the protein structure database. Programs such as GenTHEADER (Jones, 1999, J. Mol. Biol. 287: 797-815; McGuffin and Jones, 2003, Bioinformatics 19: 874-881) have been used for neural networks that predict structural folding for query sequences. It uses information from various sources such as PSI-BLAST, secondary structure predictions, structural alignment profiles, and solvation potentials as input to the . Similarly, to align sequences of unknown structure with superfamily models present in the SCOP database, Gough et al., 2000, J. Mol. Biol. 313: The method of 903-919 can be used. These alignments can in turn be used to build homology models for polypeptides, and these models can be evaluated for accuracy using a variety of tools developed for that purpose.

공지된 구조의 단백질에 대해, 구조적 정렬을 검색하고 만들어내는 데 몇몇의 툴 및 리소스가 이용될 수 있다. 예를 들어, 단백질의 SCOP 슈퍼패밀리는 구조적으로 정렬되었고, 이 정렬은 접근 및 다운로드 가능하다. 둘 이상의 단백질 구조는 거리행렬 정렬(distance alignment matrix) (Holm and Sander, 1998, Proteins 33: 88-96) 또는 CE(Combinatiorial extension) Shindyalov and Bourne, 1998, Protein Engineering 11: 739-747)와 같은 다양한 알고리즘을 사용하여 정렬될 수 있다. 이들 알고리즘의 구현은 가능한 구조적 상동체를 발견하기 위해, 대상 구조를 가지는 구조 데이터베이스를 질의하기 위해 추가적으로 이용될 수 있다(Holm and Park, 2000, Bioinformatics 16: 566-567).For proteins of known structure, several tools and resources are available to search for and create structural alignments. For example, the SCOP superfamily of proteins has been structurally aligned, and these alignments are accessible and downloadable. The structure of two or more proteins can be structured in a variety of ways, such as a distance alignment matrix (Holm and Sander, 1998, Proteins 33: 88-96) or a combinational extension (CE) Shindyalov and Bourne, 1998, Protein Engineering 11: 739-747). It can be sorted using an algorithm. Implementations of these algorithms can additionally be used to query structural databases with the structure of interest, to discover possible structural homologs (Holm and Park, 2000, Bioinformatics 16: 566-567).

상기의 방법들은 하나의 예시로, 이에 제한되지는 않는다.The above methods are examples, but are not limited thereto.

3. 구체적인 설명3. Specific explanation

이하, 본 출원의 구체예를 보다 상세하게 설명하면 다음과 같다.Hereinafter, specific examples of the present application will be described in more detail.

본 출원에서, "피타아제(Phytase)"는 myo-inositol hexakisphosphate + H2O ⇔ 1D-myo-inositol 1,2,3,5,6-pentakisphosphate + phosphate 반응을 촉매하는 효소를 의미한다. EC 3.1.3.26로 분류될 수 있다.In this application, “phytase” means an enzyme that catalyzes the reaction of myo-inositol hexakisphosphate + H 2 O ⇔ 1D-myo-inositol 1,2,3,5,6-pentakisphosphate + phosphate. may be classified as EC 3.1.3.26.

본 출원에서 피타아제 활성은 본 출원에 기재된 실시 양태를 포함하여, 당업계에 공지된 방법을 사용함으로써 측정 및 평가할 수 있다.Phytase activity in this application can be measured and evaluated using methods known in the art, including the embodiments described in this application.

본 출원에서 "모 피타아제(Parent Phytase)"는 본 출원의 변이체 또는 변이형 폴리펩티드를 생산하기 위하여 변형이 가해지는 피타아제를 의미한다. 구체적으로는, 모 피타아제, 모 효소 또는 모서열은 자연적으로 발생하는 폴리펩티드 또는 야생형 폴리펩티드일 수 있고, 이의 성숙 폴리펩티드일 수 있으며, 이의 변이체 또는 기능적 단편을 포함할 수 있으나, 피타아제 활성을 갖고 변이체의 모체가 될 수 있는 폴리펩티드라면 이에 제한되지는 않는다.In the present application, "parent phytase" refers to a phytase to which a modification is applied to produce a variant or variant polypeptide of the present application. Specifically, the parent phytase, parent enzyme or parent sequence may be a naturally occurring polypeptide or wild-type polypeptide, may be a mature polypeptide thereof, may include a variant or functional fragment thereof, but may have a phytase activity and have a variant It is not limited thereto as long as it is a polypeptide that can be the parent of.

본 출원에서 제공하는 모 피타아제(Parent Phytase)는, 이에 제한되지는 않으나 서열번호 1의 폴리펩티드인 것일 수 있다. 상기 서열번호 1의 폴리펩티드는 야생형 대장균 유래 피타아제에서 22개의 아미노산으로 구성되는 신호 서열(Signal sequence)을 제외한 아미노산 서열일 수 있다. 또한, 피타아제 활성을 갖는 한, 서열번호 1의 폴리펩티드와 약 60%, 70%, 75%. 80%. 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 폴리펩티드일 수 있으며, 서열번호 1의 아미노산 서열로 이루어진 폴리펩티드와 동일 혹은 상응하는 활성을 가지는 경우라면 모 피타아제(Parent Phytase)의 범위에 제한 없이 포함될 수 있다.The parent phytase provided in the present application may be a polypeptide of SEQ ID NO: 1, but is not limited thereto. The polypeptide of SEQ ID NO: 1 may be an amino acid sequence excluding a signal sequence consisting of 22 amino acids in wild-type E. coli-derived phytase. In addition, about 60%, 70%, 75% with the polypeptide of SEQ ID NO: 1, as long as it has phytase activity. 80%. It may be a polypeptide having a sequence identity of 85%, 90%, 95%, 96%, 97%, 98% or 99% or more, and if it has the same or corresponding activity as the polypeptide consisting of the amino acid sequence of SEQ ID NO: 1, all It may be included without limitation in the range of phytase (Parent Phytase).

본 발명에 있어서, 상기 모 피타아제(Parent Phytase)는 서열번호 1 및 90% 이상의 서열 동일성을 갖는 아미노산 서열을 포함할 수 있고, 상기 서열번호 1과 90% 이상의 서열 동일성을 갖는 아미노산 서열은 서열번호 11의 아미노산 서열을 포함할 수 있으나, 이에 제한되지 않고 서열번호 1과 90% 이상의 서열 동일성을 갖는 아미노산 서열을 제한없이 포함할 수 있다.In the present invention, the parent phytase may include an amino acid sequence having 90% or more sequence identity with SEQ ID NO: 1, and the amino acid sequence having 90% or more sequence identity with SEQ ID NO: 1 It may include an amino acid sequence of 11, but is not limited thereto and may include an amino acid sequence having 90% or more sequence identity with SEQ ID NO: 1 without limitation.

본 출원에서 제공하는 변이체의 모 피타아제(Parent Phytase)는, 대장균(Escherichia coli, E.coli) 유래일 수 있다.The parent phytase of the variant provided in the present application (Parent Phytase) may be derived from Escherichia coli ( E.coli ).

한편 전술한 미생물은 본 출원에서 제공하는 모 피타아제(Parent Phytase)가 유래될 수 있는 미생물의 일 예시로, 미생물의 명칭과 관계없이 그와 분류학적으로 상동인 미생물로부터 유래하는 것도 포함한다.On the other hand, the above-described microorganism is an example of a microorganism from which the parent phytase provided in the present application can be derived, and includes those derived from microorganisms taxonomically homologous to the microorganism regardless of the name of the microorganism.

전술한 미생물은 ATCC, DSMZ, CBS, NRRL, KCTC, KCCM과 같은 공지된 미생물 기탁기관에서 분양받을 수 있다.The aforementioned microorganisms may be distributed from known microorganism depository institutions such as ATCC, DSMZ, CBS, NRRL, KCTC, and KCCM.

본 출원에서, 특정 미생물에서 "유래하는(derived from)" 서열은 그 미생물에서 자연적으로 제조되거나 제조 가능한 것에 제한되지 않고, 그 유전자를 포함하는 미생물에서 제조되고 분리되는 유전자에 의해 코딩되는 서열도 포함한다. In this application, a sequence "derived from" a specific microorganism is not limited to those naturally produced or producible in that microorganism, but also includes sequences encoded by genes produced and isolated from the microorganism containing the gene. do.

예를 들어, Escherichia 속 유래 피타아제는 Escherichia에서 자연적으로 생산되는 피타아제 활성을 갖는 효소뿐만 아니라 Escherichia source에서 생산되는 것, 그리고 당업계에 공지된 유전적 변형(예를 들면, 상기 효소를 코딩하는 서열로 형질전환)을 통해 다른 숙주세포에서 생산되는 것 또한 포함한다.For example, a phytase derived from the genus Escherichia includes an enzyme having a phytase activity naturally produced in Escherichia , as well as one produced from an Escherichia source, and a genetic modification known in the art (eg, encoding the enzyme). Sequence transformation) also includes those produced in other host cells.

본 출원에서 "피타아제 활성을 갖는 변이형 폴리펩티드"는 모 피타아제의 변이체일 수 있다.In the present application, "variant polypeptide having phytase activity" may be a variant of the parent phytase.

본 출원에서 용어, "모 피타아제의 변이체" 또는 "피타아제 변이체"는 하나 이상의 아미노산이 모 피타아제(Parent Phytase)의 아미노산 서열과 상이하고, 피타아제의 활성을 갖는 단백질을 지칭한다. As used herein, the term "parent phytase variant" or "phytase variant" refers to a protein having at least one amino acid sequence different from that of parent phytase and having phytase activity.

상기 "피타아제 활성을 갖는 변이형 폴리펩티드", "모 피타아제의 변이체"와 "피타아제 변이체"는 혼용 가능하다.The "mutant polypeptide having phytase activity", the "parent phytase variant" and the "phytase variant" can be used interchangeably.

본 출원에서 제공하는 변이체는 피타아제 활성을 가지면서, 모 피타아제(Parent Phytase) 서열에서 하나 이상의 아미노산의 변형(modification)을 포함하는 것일 수 있다. 또한, 상기 변이체는 i) 서열번호 1 또는 이와 90% 이상의 서열 동일성을 갖는 아미노산 서열과 70% 이상, 100% 미만의 서열 동일성을 갖는 폴리펩티드이고; 및/또는 ii) 상기 변이체는 서열번호 1 또는 이와 90% 이상의 서열 동일성을 갖는 아미노산 서열의 성숙 폴리펩티드를 코딩하는 서열과 70% 이상 100% 미만의 서열 동일성을 갖는 폴리뉴클레오티드에 의해 코딩되는 폴리펩티드이고; 및/또는 iii) 상기 변이형 폴리펩티드는 (a) 서열번호 1 또는 이와 90% 이상의 서열 동일성을 갖는 아미노산 서열의 성숙 폴리펩티드 코딩 서열, (b) 이의 cDNA, 또는 (c) 상기 (a) 또는 (b)의 전장 상보 서열(full-length complement)과 낮은 엄격도 조건, 중간 엄격도 조건, 중상 엄격도 조건, 높은 엄격도 조건, 또는 매우 높은 엄격도 조건에서 혼성화하는 폴리뉴클레오티드에 의해 코딩되는 폴리펩티드이고; 및/또는 iv) 상기 변이형 폴리펩티드는 피타아제 활성을 갖는 i), ii) 또는 iii) 폴리펩티드의 기능적 단편일 수 있다.The variant provided in the present application may have phytase activity and include one or more amino acid modifications in the parent phytase sequence. In addition, the variant is i) a polypeptide having at least 70% and less than 100% sequence identity with SEQ ID NO: 1 or an amino acid sequence having at least 90% sequence identity therewith; and/or ii) the variant is a polypeptide encoded by a polynucleotide having at least 70% and less than 100% sequence identity with a sequence encoding a mature polypeptide of SEQ ID NO: 1 or an amino acid sequence having at least 90% sequence identity therewith; and/or iii) the variant polypeptide is (a) a mature polypeptide coding sequence of SEQ ID NO: 1 or an amino acid sequence having at least 90% sequence identity thereto, (b) a cDNA thereof, or (c) the above (a) or (b) A polypeptide encoded by a polynucleotide that hybridizes under low stringency conditions, medium stringency conditions, medium to high stringency conditions, high stringency conditions, or very high stringency conditions to the full-length complement of ); and/or iv) the variant polypeptide may be a functional fragment of i), ii) or iii) polypeptide having phytase activity.

구체적으로, 본 출원에서 제공하는 변이체는 피타아제 활성을 가지면서, 모 피타아제 서열에서 하나 이상의 아미노산의 변형(modification)을 포함하여 모 피타아제 대비 하나 이상의 변경된 기능 또는 특성을 가지는 것일 수 있다.Specifically, the variant provided in the present application may have phytase activity and one or more altered functions or properties compared to the parent phytase, including modification of one or more amino acids in the parent phytase sequence.

일 구체예로, 본 출원에서 제공하는 변이체는 피타아제 활성을 가지면서, 모 피타아제 서열에서 하나 이상의 아미노산의 변형(modification)을 포함하여 모 피타아제 대비 하나 이상의 변경된 기능 또는 특성을 가지고, 하나 이상의 보존적 치환을 가질 수 있다.In one embodiment, the variant provided in the present application has phytase activity, has one or more altered functions or properties compared to the parent phytase, including modification of one or more amino acids in the parent phytase sequence, and one or more Can have conservative substitutions.

본 출원에서 제공하는 변이체는 모 피타아제의 변이체로서, 피타아제 활성을 갖는 폴리펩티드일 수 있다.The variant provided in the present application is a variant of the parent phytase, and may be a polypeptide having phytase activity.

하나의 구체예로, 본 출원에서 제공하는 변이체는 서열번호 1의 109번, 134번, 137번 및 164번 위치에 상응하는 1개 이상의 위치에서의 변형(modification)을 포함할 수 있다. In one embodiment, the variant provided in the present application may include modifications at one or more positions corresponding to positions 109, 134, 137, and 164 of SEQ ID NO: 1.

본 출원에서 위치 번호는 서열번호 1 의 폴리펩티드의 위치에 상응하는 위치로, "상응하는" 은 상기에서 설명한 바와 같다.In this application, the position number is a position corresponding to the position of the polypeptide of SEQ ID NO: 1, and "corresponding" is as described above.

하나의 구체예로, 본 출원에서 제공하는 변이체는 서열번호 1의 A109, Q134, N137 및 R164 중 1개 이상에 상응하는 아미노산의 변형을 포함할 수 있고, 서열번호 11의 A109, K134, R137 및 R164 중 1개 이상에 상응하는 아미노산의 변형을 포함할 수 있다.In one embodiment, the variant provided in the present application may include modifications of amino acids corresponding to one or more of A109, Q134, N137 and R164 of SEQ ID NO: 1, A109, K134, R137 and SEQ ID NO: 11 modifications of amino acids corresponding to one or more of R164.

하나의 구체예로, 본 출원에서 제공하는 변형 전 서열번호 1의 109번 위치에 상응하는 아미노산은 알라닌(A); 134번 위치에 상응하는 아미노산은 글루타민(Q) 또는 리신(K); 137번 위치에 상응하는 아미노산은 아스파라긴(N) 또는 아르기닌(R); 및/또는 164번 위치에 상응하는 아미노산은 아르기닌(R)일 수 있다.In one embodiment, the amino acid corresponding to position 109 of SEQ ID NO: 1 before modification provided in the present application is alanine (A); The amino acid corresponding to position 134 is glutamine (Q) or lysine (K); The amino acid corresponding to position 137 is asparagine (N) or arginine (R); And/or the amino acid corresponding to position 164 may be arginine (R).

하나의 구체예로, 본 출원에서 제공하는 변이체는 서열번호 1의 109번 위치에 상응하는 아미노산의 G, V, L, I, M, F, W, P, S, T, C, Y, N, Q, D, E, K, R 또는 H로의 치환을 포함할 수 있다.In one embodiment, the variant provided in this application is G, V, L, I, M, F, W, P, S, T, C, Y, N of the amino acid corresponding to position 109 of SEQ ID NO: 1 , Q, D, E, K, R or H.

하나의 구체예로, 본 출원에서 제공하는 변이체는 서열번호 1의 134번 위치에 상응하는 아미노산의 G, A, V, L, I, M, F, W, P, S, T, C, Y, N, D, E, R 또는 H로의 치환을 포함할 수 있다.In one embodiment, the variant provided in this application is G, A, V, L, I, M, F, W, P, S, T, C, Y of the amino acid corresponding to position 134 of SEQ ID NO: 1 , N, D, E, R or H.

하나의 구체예로, 본 출원에서 제공하는 변이체는 서열번호 1의 137번 위치에 상응하는 아미노산의 G, A, V, L, I, M, F, W, P, S, T, C, Y, Q, D, E, K 또는 H로의 치환을 포함할 수 있다.In one embodiment, the variant provided in the present application is G, A, V, L, I, M, F, W, P, S, T, C, Y of the amino acid corresponding to position 137 of SEQ ID NO: 1 , Q, D, E, K or H.

하나의 구체예로, 본 출원에서 제공하는 변이체는 서열번호 1의 164번 위치에 상응하는 아미노산의 G, A, V, L, I, M, F, W, P, S, T, C, Y, N, Q, D, E, K 또는 H로의 치환을 포함할 수 있다.In one embodiment, the variant provided in the present application is G, A, V, L, I, M, F, W, P, S, T, C, Y of the amino acid corresponding to position 164 of SEQ ID NO: 1 , N, Q, D, E, K or H.

하나의 구체예로, 본 출원에서 제공하는 변이체는 서열번호 1의 109번 위치에 상응하는 아미노산의 산성 아미노산으로의 치환을 포함할 수 있다.In one embodiment, the variant provided in the present application may include substitution of an acidic amino acid with an amino acid corresponding to position 109 of SEQ ID NO: 1.

하나의 구체예로, 본 출원에서 제공하는 변이체는 서열번호 1의 134번 위치에 상응하는 아미노산의 산성 아미노산으로의 치환을 포함할 수 있다.In one embodiment, the variant provided in the present application may include substitution of an acidic amino acid with an amino acid corresponding to position 134 of SEQ ID NO: 1.

하나의 구체예로, 본 출원에서 제공하는 변이체는 서열번호 1의 137번 위치에 상응하는 아미노산의 염기성 아미노산으로의 치환을 포함할 수 있다.In one embodiment, the variant provided in the present application may include substitution of a basic amino acid with an amino acid corresponding to position 137 of SEQ ID NO: 1.

하나의 구체예로, 본 출원에서 제공하는 변이체는 서열번호 1의 164번 위치에 상응하는 아미노산의 극성 아미노산으로의 치환을 포함할 수 있다.In one embodiment, the variant provided in the present application may include substitution of an amino acid corresponding to position 164 of SEQ ID NO: 1 with a polar amino acid.

하나의 구체예로, 본 출원에서 제공하는 변이체는 서열번호 1의 A109E, Q134E, N137H 및 R164S 중 1 이상의 치환을 포함할 수 있고, 서열번호 11의 A109E, K134E, R137H 및 R164S 중 1 이상의 치환을 포함할 수 있다. 구체적으로, 서열번호 1의 A3V 치환을 포함하는 변이체는 서열번호 2로 표시될 수 있으며, 서열번호 1의 V6F 치환을 포함하는 변이체는 서열번호 3으로 표시될 수 있으며, 서열번호 1의 L9K 치환을 포함하는 변이체는 서열번호 4로 표시될 수 있으며, 서열번호 1의 M12E 치환을 포함하는 변이체는 서열번호 5로 표시될 수 있다.In one embodiment, the variant provided in the present application may include substitution of one or more of A109E, Q134E, N137H and R164S of SEQ ID NO: 1, and substitution of one or more of A109E, K134E, R137H and R164S of SEQ ID NO: 11 can include Specifically, a variant comprising an A3V substitution of SEQ ID NO: 1 may be represented by SEQ ID NO: 2, a variant comprising a V6F substitution of SEQ ID NO: 1 may be represented by SEQ ID NO: 3, and a L9K substitution of SEQ ID NO: 1 A variant comprising the sequence may be represented by SEQ ID NO: 4, and a variant comprising the M12E substitution of SEQ ID NO: 1 may be represented by SEQ ID NO: 5.

서열번호 1의 A109E 치환을 포함하는 변이체는 서열번호 3으로 표시될 수 있으며, 서열번호 1의 Q134E 치환을 포함하는 변이체는 서열번호 5로 표시될 수 있으며, 서열번호 1의 N137H 치환을 포함하는 변이체는 서열번호 7로 표시될 수 있으며, 서열번호 1의 R164S 치환을 포함하는 변이체는 서열번호 9로 표시될 수 있으며, 서열번호 11의 A109E 치환을 포함하는 변이체는 서열번호 13으로 표시될 수 있으며, 서열번호 11의 R137H 치환을 포함하는 변이체는 서열번호 15로 표시될 수 있으며, 서열번호 11의 K134E+R164S 치환을 포함하는 변이체는 서열번호 17로 표시될 수 있으며, 서열번호 11의 A109E+K134E+R137H+R164S 치환을 포함하는 변이체는 서열번호 19로 표시될 수 있다.A variant comprising the A109E substitution of SEQ ID NO: 1 may be represented by SEQ ID NO: 3, a variant comprising the Q134E substitution of SEQ ID NO: 1 may be represented by SEQ ID NO: 5, and a variant comprising the N137H substitution of SEQ ID NO: 1 may be represented by SEQ ID NO: 7, a variant comprising the R164S substitution of SEQ ID NO: 1 may be represented by SEQ ID NO: 9, and a variant comprising the A109E substitution of SEQ ID NO: 11 may be represented by SEQ ID NO: 13, A variant comprising the R137H substitution of SEQ ID NO: 11 may be represented by SEQ ID NO: 15, a variant comprising the K134E+R164S substitution of SEQ ID NO: 11 may be represented by SEQ ID NO: 17, and A109E+K134E+ of SEQ ID NO: 11 A variant comprising the R137H+R164S substitution can be represented by SEQ ID NO: 19.

하나의 구체예로, 본 출원에서 제공하는 변이체는 전술한 변형의 모든 가능한 조합을 포함한다.In one embodiment, the variants provided herein include all possible combinations of the foregoing variants.

예를 들어, 상기 변이체는 전술한 변형의 조합으로 하기 i) 내지 xv)에서 선택된 위치의 아미노산의 변형을 포함하는 것일 수 있다: i) 109번; ii) 134번; iii) 137번; iv) 164번; v) 109+134번; vi) 109+137번; vii) 109+164번; viii) 134+137번; ix) 134+164번; x) 137+164번; xi) 109+134+137번; xii) 109+134+164번; xiii) 109+137+164번; xiv) 134+137+164번; 및 xv) 109+134+137+164번.For example, the variant may include a modification of an amino acid at a position selected from i) to xv) as a combination of the above modifications: i) position 109; ii) No. 134; iii) No. 137; iv) No. 164; v) No. 109+134; vi) No. 109+137; vii) No. 109+164; viii) times 134+137; ix) No. 134+164; x) No. 137+164; xi) No. 109+134+137; xii) No. 109+134+164; xiii) No. 109+137+164; xiv) No. 134+137+164; and xv) 109+134+137+164.

또 하나의 예로, 상기 변이체는 하기 i) 내지 iv) 중 어느 하나 이상의 치환을 포함하는 것일 수 있으나, 이에 제한되지 않는다: i) 109번 아미노산의 글루탐산으로의 치환; ii) 134번 아미노산의 글루탐산으로의 치환; iii) 137번 아미노산의 히스티딘으로의 치환; 및 iv) 164번 아미노산의 세린으로의 치환.As another example, the variant may include, but is not limited to, substitution of any one or more of the following i) to iv): i) substitution of amino acid number 109 with glutamic acid; ii) substitution of amino acid 134 with glutamic acid; iii) substitution of amino acid 137 with histidine; and iv) substitution of amino acid 164 with serine.

또 하나의 예로, 상기 변이체는 하기에서 선택된 어느 하나 이상의 변형을 포함할 수 있으나, 이에 제한되지 않는다:As another example, the variant may include one or more modifications selected from the following, but is not limited thereto:

A109E;A109E;

Q134E 또는 K134E;Q134E or K134E;

N137H 또는 R137H;N137H or R137H;

R164S;R164S;

A109E+Q134E 또는 A109E+K134E;A109E+Q134E or A109E+K134E;

A109E+N137H 또는 A109E+R137H;A109E+N137H or A109E+R137H;

A109E+R164S;A109E+R164S;

Q134E+N137H 또는 K134E+R137H;Q134E+N137H or K134E+R137H;

Q134E+R164S 또는 K134E+R164S;Q134E+R164S or K134E+R164S;

N137H+R164S 또는 R137H+R164S;N137H+R164S or R137H+R164S;

A109E+Q134E+N137H 또는 A109E+K134E+R137H;A109E+Q134E+N137H or A109E+K134E+R137H;

A109E+Q134E+R164S 또는 A109E+K134E+R164S;A109E+Q134E+R164S or A109E+K134E+R164S;

A109E+N137H+R164S 또는 A109E+R137H+R164S;A109E+N137H+R164S or A109E+R137H+R164S;

Q134E+N137H+R164S 또는 K134E+R137H+R164S; 및Q134E+N137H+R164S or K134E+R137H+R164S; and

A109E+Q134E+N137H+R164S 또는 A109E+K134E+R137H+R164S.A109E+Q134E+N137H+R164S or A109E+K134E+R137H+R164S.

하나의 구체예로, 본 출원에서 제공하는 변이체는, 모 피타아제; 이의 성숙 폴리펩티드 또는 이의 기능적 단편과 약 60% 이상, 예를 들어, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상 또는 99% 이상 및 100% 미만의 서열 동일성을 갖는 것일 수 있다.In one embodiment, the variant provided in the present application is a parent phytase; At least about 60%, e.g., at least 65%, at least 70%, at least 75%, at least 80%, at least 85%, at least 90%, at least 91%, at least 92%, 93 with a mature polypeptide or functional fragment thereof. % or greater, 94% or greater, 95% or greater, 96% or greater, 97% or greater, 98% or greater or 99% or greater and less than 100% sequence identity.

하나의 구체예로, 본 출원에서 제공하는 변이체는, 서열번호 1 또는 이와 90% 이상의 서열 동일성을 갖는 아미노산 서열과 약 60% 이상, 예를 들어, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는, 99% 이상 및 100% 미만의 서열 동일성을 갖는 것일 수 있다.In one embodiment, the variant provided in the present application is about 60% or more, for example, 65% or more, 70% or more, 75% or more, 80% or more, 85% or more, 90% or more, 91% or more, 92% or more, 93% or more, 94% or more, 95% or more, 96% or more, 97% or more, 98% or more, or 99% or more and It may have less than 100% sequence identity.

하나의 구체예로, 본 출원에서 제공하는 변이체는, 서열번호 1 또는 이와 90% 이상의 서열 동일성을 갖는 아미노산 서열의 성숙 폴리펩티드를 코딩하는 서열과 약 60% 이상, 예를 들어, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는, 99% 이상 및 100% 미만인 서열 동일성을 갖는 폴리뉴클레오티드에 의해 코딩되는 폴리펩티드일 수 있다.In one embodiment, the variant provided in the present application is about 60% or more, for example, 65% or more, 70% or more, with a sequence encoding a mature polypeptide of SEQ ID NO: 1 or an amino acid sequence having a sequence identity of 90% or more therewith. % or more, 75% or more, 80% or more, 85% or more, 90% or more, 91% or more, 92% or more, 93% or more, 94% or more, 95% or more, 96% or more, 97% or more, 98% or more , or a polypeptide encoded by a polynucleotide having at least 99% and less than 100% sequence identity.

하나의 구체예로, 본 출원에서 제공하는 변이체는, 서열번호 1 또는 이와 90% 이상의 서열 동일성을 갖는 아미노산 서열의 기능적 단편과 약 60% 이상, 예를 들어, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는, 99% 이상 및 100% 미만인 서열 동일성을 갖는 것일 수 있다.In one embodiment, the variant provided in the present application is about 60% or more, for example, 65% or more, 70% or more, 75% or more, with SEQ ID NO: 1 or a functional fragment of an amino acid sequence having 90% or more sequence identity therewith. % or more, 80% or more, 85% or more, 90% or more, 91% or more, 92% or more, 93% or more, 94% or more, 95% or more, 96% or more, 97% or more, 98% or more, or 99 % or greater and less than 100% sequence identity.

본 출원에서 제공하는 변이체는 다른 피타아제, 예를 들어 야생형 피타아제, 모 피타아제, 다른 피타아제 변이체 등과 비교하여, 선택되거나 검출될 수 있는 폴리펩티드의 임의의 특성 또는 속성이 1 이상 변경된 것일 수 있다.Variants provided in this application may be one or more changes in any characteristic or attribute of a selected or detectable polypeptide compared to other phytases, such as wild-type phytase, parent phytase, other phytase variants, etc. .

상기의 특성 또는 속성에는, 산화 안정성, 기질 특이성, 촉매 활성, 열 안정성, 알칼리 안정성, pH 활성 프로파일, 단백질분해에 대한 내성, Km, kcat, kcat/Km 비율, 단백질 접힘, 면역 반응 유도, 리간드에 결합하는 능력, 수용체에 결합하는 능력, 분비되는 능력, 세포의 표면에 전시되는 능력, 올리고머를 형성하는 능력, 신호를 보내는 능력, 세포 증식을 촉진하는 능력, 세포 증식을 억제하는 능력, 세포자멸사를 유도하는 능력, 인산화 또는 글리코실화에 의해 개질되는 능력, 및/또는 질환을 치료하는 능력이 포함되나, 이에 제한되는 것은 아니다.The above properties or attributes include oxidative stability, substrate specificity, catalytic activity, thermal stability, alkali stability, pH activity profile, resistance to proteolysis, Km, k cat , k cat /Km ratio, protein folding, induction of an immune response, Ability to bind to ligands, to bind to receptors, to be secreted, to be displayed on the surface of cells, to form oligomers, to signal, to promote cell proliferation, to inhibit cell proliferation, to inhibit cell proliferation ability to induce apoptosis, ability to be modified by phosphorylation or glycosylation, and/or ability to treat disease.

구체적으로, 본 출원에서 제공하는 변이체는 모서열에 비해 다음 중 어느 하나 이상의 변경된 활성을 가질 수 있다:Specifically, the variants provided in this application may have altered activity compared to the parental sequence in any one or more of the following:

i) 효소 활성(enzyme activity) 증가 또는 감소;i) increase or decrease enzyme activity;

ii) 특이적 활성(specific activity) 증가 또는 감소; 및ii) increase or decrease specific activity; and

iii) 내열성 증가 또는 감소;iii) increase or decrease heat resistance;

그러나, 이에 제한되지 않는다.However, it is not limited thereto.

본 출원에서, "효소활성(enzymatic activity)"은 적어도 하나의 촉매 활성(catalytic activity)을 나타낸다. 구체적으로는 kcat/Km으로 주로 표현되는 효소의 전환 효율일 수 있으나, 이에 제한되지 않는다. In this application, "enzymatic activity" refers to at least one catalytic activity. Specifically, it may be the conversion efficiency of an enzyme mainly expressed as k cat /Km, but is not limited thereto.

kcat는 효소가 기질로 완전히 포화되었을 때, 한 개의 효소에 의한 단위시간에 생성물로 전환하는 속도상수(catalytic constant)를 의미하며, 전환수(turnover number)라고도 칭해진다. Km은 반응속도가 최고값(Vmax)의 절반일 때의 기질 농도(substrate concenstration)이다. k cat means a rate constant (catalytic constant) of conversion to a product in unit time by one enzyme when the enzyme is completely saturated with a substrate, and is also referred to as a turnover number. Km is the substrate concentration when the reaction rate is half of the maximum value (Vmax).

효소 활성을 표현하는 방법의 예시로, 특이적 활성(specific activity; umol of converted substrate x mg -1 x min -1) 또는 volumetric activity (umol of converted substrate x mL -1 x min -1)등이 있다.Examples of methods of expressing enzyme activity include specific activity (umol of converted substrate x mg -1 x min -1 ) or volumetric activity (umol of converted substrate x mL -1 x min -1 ). .

다만 효소활성을 정의하는 것은 전술한 내용에 제한되지 않고, Irwin H. Segel, Enzyme kinetics, John Wiley & Sons, 1979; A. G. Marangoni, Enzyme kinetics, Wiley-Interscience, 2003; A. Fersht, Enzyme structure and mechanisms, John Wiley & Sons, 1981; Structure and Mechanism in Protein Science: A guide to enzyme catalysis and protein folding, Alan Fersht, W.H. Freeman, 1999; Fundamentals of Enzyme Kinetics, Athel Cornish-Bowden, Wiley-Blackwell 2012 and Voet ef a/., "Biochemie" [Biochemistry], 1992, VCH-Verlag, Chapter 13, pages 331-332 with respect to enzymatic activity 등에 알려진 내용을 토대로 정의하고 평가할 수 있다.However, the definition of enzyme activity is not limited to the above, and Irwin H. Segel, Enzyme kinetics, John Wiley & Sons, 1979; A. G. Marangoni, Enzyme kinetics, Wiley-Interscience, 2003; A. Fersht, Enzyme structure and mechanisms, John Wiley & Sons, 1981; Structure and Mechanism in Protein Science: A guide to enzyme catalysis and protein folding, Alan Fersht, W.H. Freeman, 1999; Fundamentals of Enzyme Kinetics, Athel Cornish-Bowden, Wiley-Blackwell 2012 and Voet ef a/., "Biochemie" [Biochemistry], 1992, VCH-Verlag, Chapter 13, pages 331-332 with respect to enzymatic activity can be defined and evaluated on the basis of

하나의 구체예로, 본 출원에서 제공하는 변이체는 모효소 대비 약 101%, 약 110%, 약 115%, 약 115.6%, 약 115.9%, 약 118%, 약 120%, 약 120.9%, 약 125%, 약 130%, 약 135%, 약 139%, 약 139.9%, 약 140%, 약 145%, 약 150%, 약 155%, 약 160%, 약 165%, 또는 약 168% 이상의 증가된 효소 활성을 가질 수 있다. In one embodiment, the variant provided in the present application is about 101%, about 110%, about 115%, about 115.6%, about 115.9%, about 118%, about 120%, about 120.9%, about 125% compared to the parent enzyme %, about 130%, about 135%, about 139%, about 139.9%, about 140%, about 145%, about 150%, about 155%, about 160%, about 165%, or about 168% or more increased enzyme can have activity.

다른 하나의 구체예로, 본 출원에서 제공하는 변이체는 모효소 대비 약 99%, 약 95%, 약 90%, 약 80%, 약 70%, 약 60%, 약 50%, 약 40%, 또는 약 20% 이하의 감소된 효소 활성을 가질 수 있다.In another embodiment, the variant provided in the present application is about 99%, about 95%, about 90%, about 80%, about 70%, about 60%, about 50%, about 40%, or It may have a reduced enzymatic activity of about 20% or less.

본 출원에서 용어 "특이적 활성(specific activity)"은 단백질 단위 중량 당 나타나는 효소의 활성으로, unit/mg으로 표현할 수 있다. 단백질의 정량은, 예를 들면 SDS-PAGE 혹은 Bradford assay 등을 이용하여 할 수 있다.In this application, the term “specific activity” is the activity of an enzyme per unit weight of protein, and can be expressed as unit/mg. Quantification of the protein can be performed using, for example, SDS-PAGE or Bradford assay.

효소 안정성(enzyme stability)이란, 효소 활성이 저장 또는 반응 시간 동안 보존되는 것을 의미한다. 이러한 안정성의 변화를 측정하기 위해, 최초 효소 활성을 정해진 조건 하에 0시간(time zero) (100%) 및 일정 시간 경과 후 (x%) 측정하여 비교함으로써, 효소활성이 상실되는 수준 내지는 효소 안정성을 표현할 수 있다.Enzyme stability means that enzyme activity is preserved during storage or reaction time. In order to measure this change in stability, the initial enzyme activity was measured and compared at time zero (100%) and after a certain amount of time (x%) under predetermined conditions to determine the level at which enzyme activity is lost or enzyme stability. can express

효소 활성에 영향을 미치는 요소는, 예를 들어 pH, 열, 다른 물질(예를 들어, 산화제, 킬레이트제)의 존재 등이 있다.Factors that affect enzyme activity include, for example, pH, heat, the presence of other substances (eg, oxidizing agents, chelating agents), and the like.

본 출원에서 용어, "pH 안정성"이란 특정 pH 범위에서 단백질이 기능할 수 있는 능력(ability)을 의미한다. 하나의 구체예로, 본 출원에서 제공하는 변이체는 약 pH 3.0 내지 약 pH 12.0 에서 활성을 가질 수 있으나, 이에 제한되지 않는다. As used herein, the term "pH stability" means the ability of a protein to function in a specific pH range. In one embodiment, the variant provided in the present application may have activity at about pH 3.0 to about pH 12.0, but is not limited thereto.

특정 pH 범위에서 단백질이 기능을 유지하는 경우 "pH 안정성"을 가지는 것으로 정의할 수 있으며, pH 범위에 따라 "내산성", "알칼리 내성" 등을 가지는 것으로 정의할 수 있다.When a protein maintains its function in a specific pH range, it can be defined as having "pH stability", and according to the pH range, it can be defined as having "acid resistance", "alkali resistance", and the like.

본 출원에서 용어, "열안정성(thermal stability)"이란 특정 온도 범위에서 단백질이 기능할 수 있는 능력을 의미한다. 하나의 구체예로, 본 출원에서 제공하는 변이체는 약 20℃ 내지 약 70℃ 범위에서 활성을 가질 수 있으나, 이에 제한되지 않는다.As used herein, the term "thermal stability" means the ability of a protein to function in a specific temperature range. In one embodiment, the variant provided in the present application may have activity in the range of about 20 ° C to about 70 ° C, but is not limited thereto.

본 출원에서 용어, "내열성(thermal tolerance)"이란 단백질이 특정 온도, 예를 들어 고열 또는 극저온에 노출된 후 기능할 수 있는 능력을 의미한다. 예를 들어, 내열성을 갖는 단백질은 노출된 온도에서는 기능하지 않을 수 있으나, 최적 온도 환경으로 돌아오면 다시 기능을 가질 수 있다.As used herein, the term "thermal tolerance" refers to the ability of a protein to function after exposure to a specific temperature, eg, high heat or cryogenic temperature. For example, proteins that are thermotolerant may not function at the temperature they are exposed to, but may become functional again when returned to an optimal temperature environment.

안정성의 증가는 다른 효소, 예를 들어 야생형 효소, 모 효소 및/또는 다른 변이체와 비교하여, 높은 효소 활성 유지; 단백질이 기능을 유지하는 pH, 온도 및/또는 시간 등의 범위 증가를 포함한다.The increase in stability may be compared to other enzymes, eg, wild-type enzyme, parent enzyme and/or other variants, maintaining high enzyme activity; This includes increasing the range of pH, temperature and/or time, etc., over which the protein remains functional.

안정성의 감소는 다른 효소, 예를 들어 야생형 효소, 모 효소 및/또는 다른 변이체와 비교하여, 낮은 효소 활성 유지; 단백질이 기능을 유지하는 pH, 온도 및/또는 시간 등의 범위 감소를 포함한다.Reduction in stability is associated with maintenance of lower enzyme activity compared to other enzymes, e.g., wild-type enzyme, parent enzyme, and/or other variants; This includes reducing the range of pH, temperature and/or time, etc., over which the protein remains functional.

본 출원에서 용어, "기질특이성(substrate speicifity)"이란 기질 및 기질과 경쟁하는 분자들을 식별할 수 있는 효소의 능력을 의미한다. 기질특이성은 상이한 기질에 대한 효소의 활성을 측정하여 결정할 수 있다. 하나의 구체예로, 상기 기질특이성의 변화는 목적하는 산물을 생성할 수 있는 기질에 대한 특이성이 증가하는 방향으로 변화하는 것일 수 있다. 다른 하나의 구체예로, 상기 기질특이성의 변화는 목적하는 산물을 생성할 수 있는 기질에 대한 특이성이 감소하는 방향으로 변화하는 것일 수 있다.As used herein, the term “substrate specificity” refers to the ability of an enzyme to discriminate between a substrate and molecules that compete with the substrate. Substrate specificity can be determined by measuring the activity of an enzyme on different substrates. In one embodiment, the change in substrate specificity may be a change in the direction of increasing specificity for a substrate capable of producing a desired product. In another embodiment, the change in substrate specificity may be a change in a direction in which specificity for a substrate capable of producing a desired product is reduced.

본 출원에서 제공하는 변이체의 변경된 특성은 식품, 사료, 약제 및 세정을 비롯한 다양한 조성물에 적용하기 적합한 활성, 개선된 활성일 수 있다.The altered properties of the variants provided in this application may be suitable activity, improved activity for application in various compositions including food, feed, pharmaceutical and cleaning.

본 출원의 변이체를 코딩하는 폴리뉴클레오티드는 전술한 변이체의 코딩 서열을 포함할 수 있다. 상기 폴리뉴클레오티드는 코돈의 축퇴성(degeneracy)으로 인하여 또는 상기 폴리펩티드를 발현시키고자 하는 생물에서 선호되는 코돈을 고려하여, 폴리펩티드의 아미노산 서열을 변화시키지 않는 범위 내에서 코딩 영역에 다양한 변형이 이루어질 수 있다. A polynucleotide encoding a variant of the present application may include the coding sequence of the above-described variant. In the polynucleotide, various modifications may be made to the coding region within a range that does not change the amino acid sequence of the polypeptide due to codon degeneracy or in consideration of codons preferred in organisms in which the polypeptide is to be expressed. .

또한, 본 출원의 폴리뉴클레오티드는 공지의 유전자 서열로부터 제조될 수 있는 프로브, 예를 들면, 상기 염기 서열의 전체 또는 일부에 대한 상보 서열과 엄격한 조건 하에 하이브리드화하여, 본 출원의 변이체를 코딩하는 서열이라면 제한없이 포함될 수 있다. In addition, the polynucleotide of the present application is a probe that can be prepared from a known gene sequence, for example, a sequence that hybridizes with a complementary sequence to all or part of the nucleotide sequence under stringent conditions to encode the variant of the present application. can be included without limitation.

상기 "엄격한 조건(stringent condition)"이란 폴리뉴클레오티드 간의 특이적 혼성화를 가능하게 하는 조건을 의미한다. 이러한 조건은 문헌(예컨대, J. Sambrook et al., Molecular Cloning, A Laboratory Manual, 2nd Edition, Cold Spring Harbor Laboratory press, Cold Spring Harbor, New York, 1989; F.M. Ausubel et al., Current Protocols in Molecular Biology, John Wiley & Sons, Inc., New York)에 구체적으로 기재되어 있다. The "stringent condition" means a condition that allows specific hybridization between polynucleotides. These conditions are described in the literature (e.g., J. Sambrook et al., Molecular Cloning, A Laboratory Manual, 2nd Edition, Cold Spring Harbor Laboratory press, Cold Spring Harbor, New York, 1989; F.M. Ausubel et al., Current Protocols in Molecular Biology , John Wiley & Sons, Inc., New York).

예를 들어, 상동성 또는 동일성이 높은 폴리뉴클레오티드끼리, 40% 이상, 구체적으로 90% 이상, 보다 구체적으로 95% 이상, 96% 이상, 97% 이상, 98% 이상, 더욱 구체적으로 99% 이상의 상동성 또는 동일성을 갖는 폴리뉴클레오티드끼리 하이브리드화하고, 그보다 상동성 또는 동일성이 낮은 폴리뉴클레오티드끼리 하이브리드화하지 않는 조건, 또는 통상의 써던 하이브리드화(southern hybridization)의 세척 조건인 60℃, 1ХSSC, 0.1% SDS, 구체적으로 60℃, 0.1ХSSC, 0.1% SDS, 보다 구체적으로 68℃, 0.1ХSSC, 0.1% SDS에 상당하는 염 농도 및 온도에서, 1회, 구체적으로 2회 내지 3회 세정하는 조건을 열거할 수 있다.For example, polynucleotides with high homology or identity, 40% or more, specifically 90% or more, more specifically 95% or more, 96% or more, 97% or more, 98% or more, more specifically 99% or more 60°C, 1ХSSC, 0.1% SDS, which is a condition in which polynucleotides of the same identity or identity do not hybridize and polynucleotides having less homology or identity do not hybridize, or washing conditions of conventional southern hybridization. , Specifically, at 60 ° C., 0.1ХSSC, 0.1% SDS, more specifically at a salt concentration and temperature corresponding to 68 ° C., 0.1ХSSC, 0.1% SDS, conditions for washing once, specifically 2 to 3 times are listed. can

혼성화는 비록 혼성화의 엄격도에 따라 염기 간의 미스매치(mismatch)가 가능할지라도, 두 개의 핵산이 상보적 서열을 가질 것을 요구한다. 용어, "상보적"은 서로 혼성화가 가능한 뉴클레오티드 염기 간의 관계를 기술하는데 사용된다. 예를 들면, DNA에 관하여, 아데노신은 티민에 상보적이며 시토신은 구아닌에 상보적이다. 따라서, 본 출원의 폴리뉴클레오티드는 또한 실질적으로 유사한 핵산 서열뿐만 아니라 전체 서열에 상보적인 단리된 핵산 단편을 포함할 수 있다.Hybridization requires that two nucleic acids have complementary sequences, although mismatches between bases are possible depending on the stringency of hybridization. The term "complementary" is used to describe the relationship between nucleotide bases that are capable of hybridizing to each other. For example, with respect to DNA, adenosine is complementary to thymine and cytosine is complementary to guanine. Thus, the polynucleotides of the present application may also include substantially similar nucleic acid sequences as well as isolated nucleic acid fragments complementary to the entire sequence.

구체적으로, 상동성 또는 동일성을 가지는 폴리뉴클레오티드는 55℃의 Tm 값에서 혼성화 단계를 포함하는 혼성화 조건을 사용하고 상술한 조건을 사용하여 탐지할 수 있다. 또한, 상기 Tm 값은 60℃, 63℃ 또는 65℃일 수 있으나, 이에 제한되는 것은 아니고 그 목적에 따라 당업자에 의해 적절히 조절될 수 있다.Specifically, polynucleotides having homology or identity can be detected using hybridization conditions including a hybridization step at a Tm value of 55° C. and using the above-described conditions. In addition, the Tm value may be 60 ° C, 63 ° C or 65 ° C, but is not limited thereto and may be appropriately adjusted by those skilled in the art according to the purpose.

폴리뉴클레오티드를 혼성화하는 적절한 엄격도는 폴리뉴클레오티드의 길이 및 상보성 정도에 의존하고 변수는 해당기술분야에 잘 알려져 있다(Sambrook et al., supra, 9.50-9.51, 11.7-11.8 참조).Appropriate stringency for hybridizing polynucleotides depends on the length of the polynucleotide and the degree of complementarity, parameters well known in the art (see Sambrook et al., supra, 9.50-9.51, 11.7-11.8).

예를 들어 "높은 엄격도"는 프로브의 Tm의 약 5 내지 10 ℃아래에서 발생하고; "중간 엄격도"는 프로브의 Tm의 약 10 내지 20 ℃아래에서 발생하며; "낮은 엄격도"는 Tm의 약 20 내지 25℃ 아래에서 발생할 수 있으나 이에 제한되지 않는다.For example, “high stringency” occurs about 5 to 10° C. below the Tm of the probe; “Medium stringency” occurs between about 10 and 20° C. below the Tm of the probe; “Low stringency” may occur, but is not limited to, about 20 to 25° C. below the Tm.

일 예로, "낮은 엄격도 조건(low stringency condition)" 은 써던 블롯팅 표준 절차에 따라 12-24시간 동안, 적어도 100개의 뉴클레오티드 길이의 프로브에 대해, 5X SSPE, 0.3% SDS, 전단 및 변성된 연어 정자 DNA 200 micrograms/ml 및 25% 포름아미드에서, 42℃에서의 사전 혼성화(prehybridization) 및 혼성화 일 수 있다. 상기 운반체 물질은 최종적으로 50℃에서 2 X SSC, 0.1 내지 0.2% SDS를 사용하여 15분 동안 각각 2회 내지 3회 세척될 수 있다.In one example, "low stringency condition" is 5X SSPE, 0.3% SDS, sheared and denatured salmon, for probes of at least 100 nucleotides in length, for 12-24 hours according to Southern blotting standard procedures. Prehybridization and hybridization at 42° C. at 200 micrograms/ml of sperm DNA and 25% formamide. The carrier material can be finally washed 2 to 3 times each for 15 minutes using 2 X SSC, 0.1 to 0.2% SDS at 50 °C.

일 예로, "중간 엄격도 조건(medium stringency condition)"은 써던 블롯팅 표준 절차에 따라 12-24시간 동안, 적어도 100개의 뉴클레오티드 길이의 프로브에 대해, 5X SSPE, 0.3% SDS, 전단 및 변성된 연어 정자 DNA 200 micrograms/ml 및 35% 포름아미드에서, 42℃에서의 사전 혼성화(prehybridization) 및 혼성화 일 수 있다. 상기 운반체 물질은 최종적으로 55℃에서 2 X SSC, 0.1 내지 0.2% SDS를 사용하여 15분 동안 각각 2회 내지 3회 세척될 수 있다.일 예로, "중상 엄격도 조건(medium-high stringency condition)"은 써던 블롯팅 표준 절차에 따라 12-24시간 동안, 적어도 100개의 뉴클레오티드 길이의 프로브에 대해, 5X SSPE, 0.3% SDS, 전단 및 변성된 연어 정자 DNA 200 micrograms/ml 및 35% 포름아미드에서, 42℃에서의 사전 혼성화(prehybridization) 및 혼성화 일 수 있다. 상기 운반체 물질은 최종적으로 60℃에서 1 내지 2 X SSC, 0.1 내지 0.2% SDS를 사용하여 15분 동안 각각 2회 내지 3회 세척될 수 있다.As an example, "medium stringency condition" is 5X SSPE, 0.3% SDS, sheared and denatured salmon, for probes of at least 100 nucleotides in length, for 12-24 hours according to standard Southern blotting procedures. Prehybridization and hybridization at 42°C at 200 micrograms/ml of sperm DNA and 35% formamide. The carrier material can be finally washed 2-3 times with 2 X SSC, 0.1-0.2% SDS at 55°C for 15 minutes each. For example, "medium-high stringency condition" "In 5X SSPE, 0.3% SDS, 200 micrograms/ml of sheared and denatured salmon sperm DNA and 35% formamide, for probes of at least 100 nucleotides in length, for 12-24 hours according to standard Southern blotting procedures, It may be prehybridization and hybridization at 42°C. The carrier material can be finally washed 2 to 3 times at 60° C. with 1 to 2 X SSC, 0.1 to 0.2% SDS for 15 minutes each.

일 예로, "높은 엄격도 조건(high stringency condition)"은 써던 블롯팅 표준 절차에 따라 12-24시간 동안, 적어도 100개의 뉴클레오티드 길이의 프로브에 대해, 5 X SSPE, 0.3% SDS, 전단 및 변성된 연어 정자 DNA 200 micrograms/ml 및 35% 포름아미드에서, 42℃에서의 사전 혼성화(prehybridization) 및 혼성화 일 수 있다. 상기 운반체 물질은 최종적으로 65℃에서 2 X SSC, 0.1 내지 0.2% SDS를 사용하여 15분 동안 각각 2회 내지 3회 세척될 수 있다.In one example, "high stringency conditions" are 5 X SSPE, 0.3% SDS, sheared and denatured, for probes of at least 100 nucleotides in length, for 12-24 hours according to Southern blotting standard procedures. Prehybridization and hybridization at 42° C. in 200 micrograms/ml of salmon sperm DNA and 35% formamide. The carrier material can be finally washed 2 to 3 times each for 15 minutes using 2 X SSC, 0.1 to 0.2% SDS at 65 °C.

본 출원에서 제공하는 핵산 구조체는, 조절 서열에 적합한 조건 하에서 적절한 숙주 세포에서 코딩서열의 발현을 지시하는 1개 이상의 조절 서열에 작동가능하게 연결된, 본 출원에서 제공하는 변이체를 코딩하는 폴리뉴클레오티드를 포함한다.A nucleic acid construct provided herein comprises a polynucleotide encoding a variant provided herein, operably linked to one or more regulatory sequences that direct expression of the coding sequence in an appropriate host cell under conditions suitable for the regulatory sequence. do.

폴리뉴클레오티드는 변이체의 발현을 가능하게 하는 다양한 방식으로 조작될 수 있다. 발현 벡터에 따라, 벡터로 폴리뉴클레오티드를 삽입하기 전 폴리뉴클레오티드를 조작하는 것이 바람직하거나 필요할 수 있다. 그와 같은 조작은 당업계에 공지된 방법을 사용할 수 있다.Polynucleotides can be engineered in a variety of ways to allow expression of variants. Depending on the expression vector, it may be desirable or necessary to manipulate the polynucleotide prior to insertion into the vector. Such manipulations may use methods known in the art.

본 출원에서 제공하는 "벡터"는 적합한 숙주 내에서 본 출원의 변이체를 발현시킬 수 있도록 적합한 발현조절영역(또는 발현조절서열)에 작동 가능하게 연결된 상기 변이체를 코딩하는 폴리뉴클레오티드의 염기서열을 함유하는 DNA 제조물을 의미한다. 상기 발현조절영역은 전사를 개시할 수 있는 프로모터, 그러한 전사를 조절하기 위한 임의의 오퍼레이터 서열, 적합한 mRNA 리보좀 결합부위를 코딩하는 서열, 및 전사 및 해독의 종결을 조절하는 서열을 포함할 수 있다. 벡터는 적당한 숙주세포 내로 형질전환된 후, 숙주 게놈과 무관하게 복제되거나 기능할 수 있으며, 게놈 그 자체에 통합될 수 있다.The "vector" provided in the present application contains a nucleotide sequence of a polynucleotide encoding the variant operably linked to a suitable expression control region (or expression control sequence) so as to express the variant of the present application in a suitable host. means a DNA preparation. The expression control region may include a promoter capable of initiating transcription, an arbitrary operator sequence for regulating such transcription, a sequence encoding a suitable mRNA ribosome binding site, and a sequence regulating termination of transcription and translation. After transformation into a suitable host cell, the vector can replicate or function independently of the host genome and can integrate into the genome itself.

본 출원에서 사용될 수 있는 벡터는 특별히 한정되지 않으며, 당업계에 알려진 임의의 벡터를 이용할 수 있다. 통상 사용되는 벡터의 예로는 천연 상태이거나 재조합된 상태의 플라스미드, 코스미드, 바이러스 및 박테리오파지를 들 수 있다. 예를 들어, 파지 벡터 또는 코스미드 벡터로서 pWE15, M13, MBL3, MBL4, IXII, ASHII, APII, t10, t11, Charon4A, 및 Charon21A 등을 사용할 수 있으며, 플라스미드 벡터로서 pBR계, pUC계, pBluescriptII계, pGEM계, pTZ계, pCL계 및 pET계 등을 사용할 수 있다. 구체적으로는 pDZ, pACYC177, pACYC184, pCL, pECCG117, pUC19, pBR322, pMW118, pCC1BAC 벡터 등을 사용할 수 있다.Vectors that can be used in the present application are not particularly limited, and any vectors known in the art may be used. Examples of commonly used vectors include natural or recombinant plasmids, cosmids, viruses and bacteriophages. For example, pWE15, M13, MBL3, MBL4, IXII, ASHII, APII, t10, t11, Charon4A, and Charon21A can be used as phage vectors or cosmid vectors, and pBR-based, pUC-based, and pBluescriptII-based plasmid vectors , pGEM-based, pTZ-based, pCL-based, pET-based, etc. can be used. Specifically, pDZ, pACYC177, pACYC184, pCL, pECCG117, pUC19, pBR322, pMW118, pCC1BAC vectors and the like can be used.

일례로 세포 내 염색체 삽입용 벡터를 통해 염색체 내에 본 출원에서 제공하는 변이체를 코딩하는 폴리뉴클레오티드를 염색체 내로 삽입할 수 있다. 상기 폴리뉴클레오티드의 염색체 내로의 삽입은 당업계에 알려진 임의의 방법, 예를 들면, 상동재조합(homologous recombination)에 의하여 이루어질 수 있으나, 이에 한정되지는 않는다. 상기 염색체 삽입 여부를 확인하기 위한 선별 마커(selection marker)를 추가로 포함할 수 있다. 선별 마커는 벡터로 형질전환된 세포를 선별, 즉 목적 핵산 분자의 삽입 여부를 확인하기 위한 것으로, 약물 내성, 영양 요구성, 세포 독성제에 대한 내성 또는 표면 폴리펩티드의 발현과 같은 선택가능 표현형을 부여하는 마커들이 사용될 수 있다. 선택제(selective agent)가 처리된 환경에서는 선별 마커를 발현하는 세포만 생존하거나 다른 표현 형질을 나타내므로, 형질전환된 세포를 선별할 수 있다.For example, a polynucleotide encoding a variant provided in the present application may be inserted into a chromosome through a vector for chromosomal insertion into a cell. Insertion of the polynucleotide into the chromosome may be performed by any method known in the art, for example, homologous recombination, but is not limited thereto. A selection marker for determining whether the chromosome is inserted may be further included. Selectable markers are used to select cells transformed with a vector, that is, to determine whether a target nucleic acid molecule has been inserted, and to give selectable phenotypes such as drug resistance, auxotrophy, resistance to cytotoxic agents, or surface polypeptide expression. markers may be used. In an environment treated with a selective agent, only cells expressing the selectable marker survive or exhibit other expression traits, and thus transformed cells can be selected.

본 출원의 숙주 세포는, 본 출원의 변이체를 발현할 수 있는 것이면 제한 없이 포함될 수 있다.Host cells of the present application may be included without limitation as long as they can express the variants of the present application.

본 출원의 숙주 세포는 전술한 변이체, 상기 변이체를 코딩하는 폴리뉴클레오티드, 이를 포함하는 핵산 구조체 및/또는 벡터를 포함할 수 있다. The host cell of the present application may include the above-described variant, a polynucleotide encoding the variant, a nucleic acid construct containing the same, and/or a vector.

상기 핵산 구조체 또는 벡터는 앞서 설명된 바와 같이 염색체에 통합되거나, 또는 자가 복제되는 염색체외 벡터로 유지될 수 있다.The nucleic acid construct or vector may be maintained as a chromosomally integrated or self-replicating extrachromosomal vector as described above.

본 출원의 숙주 세포는 복제 동안 일어나는 돌연변이에 기인하여 모 세포와 동일하지 않은 모 세포의 임의의 자손을 포함한다. A host cell of the present application includes any progeny of the parent cell that are not identical to the parent cell due to mutations occurring during replication.

숙주 세포는 변이체의 재조합 생성에 유용한 임의의 세포, 예를 들어, 원핵세포 또는 진핵세포일 수 있다.A host cell may be any cell useful for recombinant production of variants, such as a prokaryotic or eukaryotic cell.

원핵 숙주 세포는 임의의 그람-양성 또는 그람-음성 박테리아일 수 있다. A prokaryotic host cell can be any gram-positive or gram-negative bacterium.

그람-양성 박테리아에는 바실러스, 클로스트리듐, 엔테로코커스, 게오바실러스, 락토바실러스, 락토코커스, 오세아노바실러스, 스타필로코커스, 스트렙토코커스 및 스트렙토마이세스가 포함되나 이들에 제한되지 않는다. Gram-positive bacteria include, but are not limited to, Bacillus, Clostridium, Enterococcus, Geobacillus, Lactobacillus, Lactococcus, Oceanobacillus, Staphylococcus, Streptococcus, and Streptomyces.

그람-음성 박테리아에는 캄필로박터, 에스케리키아 콜라이, 플라보박테리움, 푸소박테리움, 헬리코박터, 일리오박터, 네이세리아, 슈도모나스, 살모넬라, 비브리오(예컨대, 비브리오 나트리에겐스(Vibrio natriegens)) 및 유레아플라스마가 포함되나 이들에 제한되지 않는다.Gram-negative bacteria include Campylobacter, Escherichia coli, Flavobacterium, Fusobacterium, Helicobacter, Iliobacter, Neisseria, Pseudomonas, Salmonella, Vibrio (e.g. Vibrio natriegens) ) and Ureaplasma.

하나의 구체예로, 상기 박테리아 숙주 세포는 바실러스 속 숙주 세포일 수 있고, 구체적으로 바실러스 알칼로필러스, 바실러스 아밀로리쿼파시엔스, 바실러스 브레비스, 바실러스 서큘란스, 바실러스 클라우시이, 바실러스 코아굴란스, 바실러스 퍼무스, 바실러스 라우투스, 바실러스 렌투스, 바실러스 리케니포르미스, 바실러스 메가테리움, 바실러스 푸밀러스, 바실러스 스테아로써모필루스, 바실러스 서브틸리스 및 바실러스 투린지엔시스 세포를 포함하나 이들에 제한되지 않는다.In one embodiment, the bacterial host cell may be a host cell of the genus Bacillus, specifically, Bacillus alkalophilus, Bacillus amyloliquefaciens, Bacillus brevis, Bacillus circulans, Bacillus clausii, Bacillus coagulans, Bacillus firmus, Bacillus lautus, Bacillus lentus, Bacillus licheniformis, Bacillus megaterium, Bacillus pumillus, Bacillus stearothermophilus, Bacillus subtilis and Bacillus thuringiensis cells. don't

하나의 구체예로, 상기 박테리아 숙주 세포는 스트렙토코커스 속 숙주 세포일 수 있고 구체적으로 스트렙토코커스 에퀴시밀리스(Streptococcus equisimilis), 스트렙토코커스 피오게네스(Streptococcus pyogenes), 스트렙토코커스 유베리스(Streptococcus uberis) 및 스트렙토코커스 에퀴(Streptococcus equi) 하위종 주에피데미쿠스(Zooepidemicus) 세포를 포함하나 이들에 제한되지 않는다.In one embodiment, the bacterial host cell may be a host cell of the genus Streptococcus, specifically Streptococcus equisimilis, Streptococcus pyogenes, Streptococcus uberis and Streptococcus equi subspecies Zooepidemicus cells.

하나의 구체예로, 상기 박테리아 숙주 세포는 스트렙토마이세스 속 숙주 세포일 수 있고, 구체적으로 스트렙토마이세스 아크로모게네스(Streptomyces achromogenes), 스트렙토마이세스 아베르미틸리스(Streptomyces avermitilis), 스트렙토마이세스 코엘리콜라, 스트렙토마이세스 그리세우스(Streptomyces griseus) 및 스트렙토마이세스 리비단스(Streptomyces lividans) 세포를 포함하나 이들에 제한되지 않는다.In one embodiment, the bacterial host cell may be a host cell of the genus Streptomyces, specifically Streptomyces achromogenes, Streptomyces avermitilis, Streptomyces Coelicola, Streptomyces griseus and Streptomyces lividans cells.

하나의 구체예로, 상기 박테리아 숙주 세포는 코리네박테리움 속 숙주 세포일 수 있고, 코리네박테리움 글루타미쿰(Corynebacterium glutamicum), 코리네박테리움 크루디락티스(Corynebacterium crudilactis), 코리네박테리움 데세르티(Corynebacterium deserti), 코리네박테리움 이피시엔스(Corynebacterium efficiens), 코리네박테리움 칼루내(Corynebacterium callunae), 코리네박테리움 스테셔니스(Corynebacterium stationis), 코리네박테리움 싱굴라레(Corynebacterium singulare), 코리네박테리움 할로톨레란스(Corynebacterium halotolerans), 코리네박테리움 스트리아툼(Corynebacterium striatum), 코리네박테리움 암모니아게네스(Corynebacterium ammoniagenes), 코리네박테리움 폴루티솔리(Corynebacterium pollutisoli), 코리네박테리움 이미탄스(Corynebacterium imitans), 코리네박테리움 테스투디노리스(Corynebacterium testudinoris) 또는 코리네박테리움 플라베스센스(Corynebacterium flavescens)일 수 있으나 이에 제한되지 않는다.In one embodiment, the bacterial host cell may be a host cell of the genus Corynebacterium, Corynebacterium glutamicum, Corynebacterium crudilactis, Corynebacterium Corynebacterium deserti, Corynebacterium efficiens, Corynebacterium callunae, Corynebacterium stationis, Corynebacterium singulare ( Corynebacterium singulare), Corynebacterium halotolerans, Corynebacterium striatum, Corynebacterium ammoniagenes, Corynebacterium pollutisoli , Corynebacterium imitans, Corynebacterium testudinoris, or Corynebacterium flavescens, but is not limited thereto.

숙주 세포는 포유동물, 곤충, 식물 또는 진균 세포와 같은 진핵생물일 수 있다.The host cell may be a eukaryote such as a mammalian, insect, plant or fungal cell.

숙주 세포는 진균 세포일 수 있다. 본 출원에서 "진균"은 자낭균문, 담자균문, 통곰팡이문 및 접합균문뿐 아니라 난균문 및 모든 불완전 진균류를 포함한다.The host cell may be a fungal cell. In this application, "fungi" includes ascomycetes, basidiomycota, phylum phylum and zygomycota, as well as phylum oomycetes and all imperfect fungi.

진균 숙주 세포는 효모 세포일 수 있다. 본 출원의 "효모"는 자낭포자형성(ascosporogenous) 효모(엔도마이세탈레스(Endomycetales)), 담자포자(basidiosporogenous) 효모 및 불완전 진균류(Fungi imperfecti)(블라스토마이세테스(Blastomycetes))에 속하는 효모를 포함한다. 다만, 이러한 분류는 변화할 수 있으며, Biology and Activities of Yeast (Skinner, Passmore, and Davenport, editors, Soc. App. Bacteriol. Symposium Series No. 9, 1980)에 설명된 바에 따라 분류를 정의할 수 있다.Fungal host cells may be yeast cells. "Yeast" in this application refers to ascosporogenous yeast (Endomycetales), basidiosporogenous yeast and yeast belonging to Fungi imperfecti (Blastomycetes). includes However, these classifications are subject to change, and classifications may be defined as described in Biology and Activities of Yeast (Skinner, Passmore, and Davenport, editors, Soc. App. Bacteriol. Symposium Series No. 9, 1980). .

효모 숙주 세포는 칸디다(Candida), 한세눌라(Hansenula), 클루이베로마이세스(Kluyveromyces), 피키아(Pichia), 코마가텔라(Komagataella), 사카로마이세스(Saccharomyces), 스키조사카로마이세스(Schizosaccharomyces) 또는 야로위아(Yarrowia) 세포, 예를 들어, 피키아 파스토리스(Pichia pastoris), 클루이베로마이세스 락티스(Kluyveromyces lactis), 사카로마이세스 칼스베르겐시스(Saccharomyces carlsbergensis), 사카로마이세스 세레비지애(Saccharomyces cerevisiae), 사카로마이세스 디아스타티쿠스(Saccharomyces diastaticus), 사카로마이세스 도우글라시이(Saccharomyces douglasii), 사카로마이세스 클루이베리(Saccharomyces kluyveri), 사카로마이세스 노르벤시스(Saccharomyces norbensis), 사카로마이세스 오비포르미스(Saccharomyces oviformis), 코마가텔라 파피(Komagataella phaffii) 또는 야로위아 리폴리티카(Yarrowia lipolytica) 세포일 수 있다.Yeast host cells are Candida, Hansenula, Kluyveromyces, Pichia, Komagataella, Saccharomyces, Schizosaccharomyces ( Schizosaccharomyces or Yarrowia cells, for example Pichia pastoris, Kluyveromyces lactis, Saccharomyces carlsbergensis, Saccharomyces Saccharomyces cerevisiae, Saccharomyces diastaticus, Saccharomyces douglasii, Saccharomyces kluyveri, Saccharomyces norvensis (Saccharomyces norbensis), Saccharomyces oviformis, Komagataella phaffii or Yarrowia lipolytica cells.

진균 숙주 세포는 사상 진균 세포일 수 있다. "사상 진균"은 진균문 및 난균문 아문의 모든 사상 형태를 포함한다(상기 문헌(Hawksworth et al., 1995)에 정의된 바와 같음). 사상 진균은 일반적으로, 키틴, 셀룰로스, 글루칸, 키토산, 만난 및 그 밖의 복합 다당류로 이루어진 균사 벽을 특징으로 한다. 영양 성장은 균사 신장에 의한 것이며, 탄소이화는 절대적으로 호기성이다. 대조적으로, 효모, 예를 들어, 사카로마이세스 세레비지애에 의한 영양 성장은 단세포 엽상체(thallus)의 발아에 의한 것이며, 탄소이화는 발효성일 수 있다.Fungal host cells may be filamentous fungal cells. "Filamentous fungi" includes all filamentous forms of the subphylum Mycobacterium and Oomycota (as defined above by Hawksworth et al., 1995). Filamentous fungi are generally characterized by hyphal walls composed of chitin, cellulose, glucan, chitosan, mannan and other complex polysaccharides. Vegetative growth is by mycelial elongation, and carbon catabolism is strictly aerobic. In contrast, vegetative growth by yeasts, such as Saccharomyces cerevisiae, is by germination of unicellular thalluses, and carbon catabolism can be fermentative.

사상 진균 숙주 세포는 아크레모늄(Acremonium), 아스페르길루스, 아우레오바시듐(Aureobasidium), 비어칸데라(Bjerkandera), 세리포리옵시스(Ceriporiopsis), 크리소스포리움(Chrysosporium), 코프리누스(Coprinus), 코리올루스(Coriolus), 크립코코커스(Cryptococcus), 필리바시듐(Filibasidium), 푸사리움, 휴미콜라, 마그나포르테(Magnaporthe), 무코르(Mucor), 마이셀리옵토라, 네오칼리마스틱스(Neocallimastix), 뉴로스포라(Neurospora), 파에실로마이세스(Paecilomyces), 페니실리움, 파네로차에테(Phanerochaete), 플레비아(Phlebia), 피로마이세스(Piromyces), 플레우로투스(Pleurotus), 스키조필룸(Schizophyllum), 탈라로마이세스(Talaromyces), 써모아스쿠스(Thermoascus), 티엘라비아(Thielavia), 톨리포클라디움(Tolypocladium), 트라메테스(Trametes) 또는 트리코데르마 세포일 수 있다.Filamentous fungal host cells include Acremonium, Aspergillus, Aureobasidium, Bjerkandera, Ceriporiopsis, Chrysosporium, Coprinus ( Coprinus), Coriolus, Cryptococcus, Filibasidium, Fusarium, Humicola, Magnaporthe, Mucor, Mycellioptora, Neocalimastics (Neocallimastix), Neurospora, Paecilomyces, Penicillium, Phanerochaete, Phlebia, Piromyces, Pleurotus ), Schizophyllum, Talaromyces, Thermoascus, Thielavia, Tolypocladium, Trametes or Trichoderma cells can be

예를 들어, 사상 진균 숙주 세포는 아스페르길루스 아와모리, 아스페르길루스 포에티두스(Aspergillus foetidus), 아스페르길루스 푸미가투스(Aspergillus fumigatus), 아스페르길루스 야포니쿠스(Aspergillus japonicus), 아스페르길루스 니둘란스, 아스페르길루스 니게르, 아스페르길루스 오리자에, 비어칸데라 아두스타(Bjerkandera adusta), 세리포리옵시스 아네이리나(Ceriporiopsis aneirina), 세리포리옵시스 카레기에나(Ceriporiopsis caregiea), 세리포리옵시스 길베센스(Ceriporiopsis gilvescens), 세리포리옵시스 판노신타(Ceriporiopsis pannocinta), 세리포리옵시스 리불로사(Ceriporiopsis rivulosa), 세리포리옵시스 서브루파(Ceriporiopsis subrufa), 세리포리옵시스 서브베르미스포라(Ceriporiopsis subvermispora), 크리소스포리움 이놉스(Chrysosporium inops), 크리소스포리움 케라티노필룸(Chrysosporium keratinophilum), 크리소스포리움 루크노웬스(Chrysosporium lucknowense), 크리소스포리움 메르다리움(Chrysosporium merdarium), 크리소스포리움 판니콜라(Chrysosporium pannicola), 크리소스포리움 퀸스란디쿰(Chrysosporium queenslandicum), 크리소스포리움 트로피쿰(Chrysosporium tropicum), 크리소스포리움 조나툼(Chrysosporium zonatum), 코프리누스 시네레우스(Coprinus cinereus), 코리올루스 히르수투스(Coriolus hirsutus), 푸사리움 박트리디오이데스(Fusarium bactridioides), 푸사리움 세레알리스(Fusarium cerealis), 푸사리움 크루크웰렌스(Fusarium crookwellense), 푸사리움 쿨모룸(Fusarium culmorum), 푸사리움 그라미네아룸(Fusarium graminearum), 푸사리움 그라미눔(Fusarium graminum), 푸사리움 헤테로스포룸(Fusarium heterosporum), 푸사리움 네군디(Fusarium negundi), 푸사리움 옥시스포룸(Fusarium oxysporum), 푸사리움 레티쿨라툼(Fusarium reticulatum), 푸사리움 로세움(Fusarium roseum), 푸사리움 삼부시눔(Fusarium sambucinum), 푸사리움 사로크로움(Fusarium sarcochroum), 푸사리움 스포로트리키오이데스(Fusarium sporotrichioides), 푸사리움 설푸레움(Fusarium sulphureum), 푸사리움 토룰로숨(Fusarium torulosum), 푸사리움 트리코테시오이데스(Fusarium trichothecioides), 푸사리움 베네나툼(Fusarium venenatum), 휴미콜라 인솔렌스(Humicola insolens), 휴미콜라 라누기노사(Humicola lanuginosa), 무코르 미에헤이, 마이셀리옵토라 써모필라, 뉴로스포라 크라사(Neurospora crassa), 페니실리움 푸르푸로게눔(Penicillium purpurogenum), 파네로차에테 크리소스포리움(Phanerochaete chrysosporium), 플레비아 라디아타(Phlebia radiata), 플레우로투스 에린지이(Pleurotus eryngii), 티엘라비아 테레스트리스(Thielavia terrestris), 트라메테스 빌로사(Trametes villosa), 트라메테스 베르시콜라(Trametes versicolor), 트리코데르마 하지아눔(Trichoderma harzianum), 트리코데르마 코닌지이(Trichoderma koningii), 트리코데르마 론지브라키아툼(Trichoderma longibrachiatum), 트리코데르마 리세이 또는 트리코데르마 비리데(Trichoderma viride) 세포일 수 있다. 그러나, 이에 제한되지 않는다.For example, filamentous fungal host cells are Aspergillus awamori, Aspergillus foetidus, Aspergillus fumigatus, Aspergillus japonicus ), Aspergillus nidulans, Aspergillus niger, Aspergillus oryzae, Bjerkandera adusta, Ceriporiopsis aneirina, Ceriporiopsis curry Ceriporiopsis caregiea, Ceriporiopsis gilvescens, Ceriporiopsis pannocinta, Ceriporiopsis rivulosa, Ceriporiopsis subrupa subrufa), Ceriporiopsis subvermispora, Chrysosporium inops, Chrysosporium keratinophilum, Chrysosporium lucknowense , Chrysosporium merdarium, Chrysosporium pannicola, Chrysosporium queenslandicum, Chrysosporium tropicum, Chrysosporium tropicum Chrysosporium zonatum, Coprinus cinereus, Coriolus hirsutus, Fusarium bactridioides, Fusarium cerealis, Fusa Fusarium crookwellense, Fusarium culmorum, Fusarium graminearum, Fusarium gramineum, Fusarium heterosporum, Fusarium Fusarium negundi, Fusarium oxysporum, Fusarium reticulatum, Fusarium roseum, Fusarium sambucinum, Fusarium sarloc Fusarium sarcochroum, Fusarium sporotrichioides, Fusarium sulphureum, Fusarium torulosum, Fusarium trichothecioides, Fusa Fusarium venenatum, Humicola insolens, Humicola lanuginosa, Mucor Miehei, Mysellioptora thermophila, Neurospora crassa, Penny Penicillium purpurogenum, Phanerochaete chrysosporium, Phlebia radiata, Pleurotus eryngii, Thiellabia terrestris ( Thielavia terrestris), Trametes villosa, Trametes versicolor, Trichoderma harzianum, Trichoderma koningii, Trichoderma longibraki It may be a Trichoderma longibrachiatum, Trichoderma reesei or Trichoderma viride cell. However, it is not limited thereto.

본 출원의 조성물은 피틴을 피틴의 가수분해물로 전환하는 데에 사용될 수 있다.The composition of the present application can be used to convert phytin to hydrolysates of phytin.

본 출원의 조성물은 본 출원에서 제공하는 변이체 외에 다른 구성요소를 추가로 더 포함할 수 있다. 당업자는 본 출원의 조성물에 추가되는 구성요소를 적절히 선택할 수 있다. The composition of the present application may further include other components in addition to the variants provided in the present application. A person skilled in the art can appropriately select components added to the composition of the present application.

일 구체예로, 본 출원의 조성물은 피틴을 피틴의 가수분해물로 전환하는 데 적용하기 적합한 임의의 구성요소를 더 포함할 수 있다.In one embodiment, the composition of the present application may further include any component suitable for conversion of phytin to a hydrolyzate of phytin.

일 구체예로, 본 출원의 조성물은 식품, 사료, 약제 및 세정을 비롯한 다양한 조성물에 적용하기 적합한 임의의 구성요소를 더 포함할 수 있다.In one embodiment, the composition of the present application may further include any component suitable for application to various compositions including food, feed, pharmaceutical and cleaning.

추가될 수 있는 물질의 예시는, 안정화제, 계면활성제, 빌더, 킬레이트제, 분산제, 효소, 효소 안정제, 촉매제, 활성화제, 담체, 합제, 활택제, 붕해제, 부형제, 가용화제, 현탁화제, 색소, 향료, 완충제, 보존제, 무통화제, 가용화제, 등장화제, 안정화제, 희석제, 윤활제, 보존제 등을 포함하나, 이에 제한되지 않는다.Examples of materials that may be added are stabilizers, surfactants, builders, chelating agents, dispersants, enzymes, enzyme stabilizers, catalysts, activators, carriers, formulations, lubricants, disintegrants, excipients, solubilizers, suspending agents, colorant, flavoring agent, buffering agent, preservative, soothing agent, solubilizer, tonicity agent, stabilizer, diluent, lubricant, preservative and the like, but are not limited thereto.

일 구체예로, 본 출원에서 제공하는 조성물은 본 출원에서 제공하는 변이체 외에, 자연적으로 발생한 물질 또는 자연적으로 비발생한(Non-naturally occurring) 물질을 더 포함할 수 있다. In one embodiment, the composition provided in the present application may further include a naturally occurring material or a non-naturally occurring material, in addition to the variant provided in the present application.

일 구체예로, 본 출원에서 제공하는 조성물은 본 출원에서 제공하는 변이체 외에 식품, 사료, 약제 및 세정을 비롯한 다양한 조성물에 사용되는 추가적인 효소를 더 포함할 수 있다.In one embodiment, the composition provided in the present application may further include additional enzymes used in various compositions including food, feed, pharmaceuticals, and cleaning, in addition to the variants provided in the present application.

예를 들어 상기 추가적인 효소는, 베타-아밀라아제, 셀룰라아제(베타글루코시다아제, 셀로비오히드롤라아제 및 엔도글루카나아제), 글루코아밀라아제, 헤미셀룰라아제(예를 들어, 자일라아나제), 아이소아밀라아제, 아이소머라아제, 리파아제, 피타아제, 프로테아제, 풀룰라나아제 및/또는 알파-아밀라아제와 함께 상업적 과정에서 유용한 그 밖의 효소로 구성된 군으로부터 선택되는 어느 하나 이상의 효소를 더 포함할 수 있다.For example, the additional enzymes include beta-amylases, cellulases (beta-glucosidases, cellobiohydrolases and endoglucanases), glucoamylases, hemicellulases (e.g., xylanases), isoamylases. , Isomerase, lipase, phytase, protease, pullulanase and / or alpha-amylase, together with any one or more enzymes selected from the group consisting of other enzymes useful in commercial processes.

본 출원의 변이체를 제조하는 방법은 숙주세포를 배양하는 단계를 회수하는 단계를 포함하는 것일 수 있다.The method for producing a variant of the present application may include a step of recovering the step of culturing the host cell.

본 출원에서, 용어 "배양"은 상기 숙주 세포를 적당히 조절된 환경 조건에서 생육시키는 것을 의미한다. 본 출원의 배양과정은 당업계에 알려진 적당한 배지와 배양조건에 따라 이루어질 수 있다. 이러한 배양 과정은 선택되는 균주에 따라 당업자가 용이하게 조정하여 사용할 수 있다. 구체적으로 상기 배양은 회분식, 연속식 및 유가식일 수 있으나, 이에 제한되는 것은 아니다.In this application, the term "culture" means growing the host cells under appropriately controlled environmental conditions. The culture process of the present application may be performed according to suitable media and culture conditions known in the art. This culturing process can be easily adjusted and used by those skilled in the art according to the selected strain. Specifically, the culture may be batch, continuous and fed-batch, but is not limited thereto.

본 출원에서 용어, "배지"는 상기 숙주 세포를 배양하기 위해 필요로 하는 영양물질을 주성분으로 혼합한 물질을 의미하며, 생존 및 발육에 불가결한 물을 비롯하여 영양물질 및 발육인자 등을 공급한다. 구체적으로, 본 출원의 숙주 세포의 배양에 사용되는 배지 및 기타 배양 조건은 통상의 숙주 세포의 배양에 사용되는 배지라면 특별한 제한 없이 어느 것이나 사용할 수 있으나, 본 출원의 숙주 세포를 적당한 탄소원, 질소원, 인원, 무기화합물, 아미노산 및/또는 비타민 등을 함유한 통상의 배지 내에서 호기성 조건 하에서 온도, pH 등을 조절하면서 배양할 수 있다.As used herein, the term "medium" refers to a material in which nutrients necessary for culturing the host cells are mixed as main components, and supplies nutrients and growth factors, including water essential for survival and growth. Specifically, the medium and other culture conditions used for culturing the host cells of the present application can be any medium without particular limitation as long as it is a medium used for culturing conventional host cells. It can be cultured while controlling temperature, pH, etc. under aerobic conditions in a conventional medium containing phosphorus, inorganic compounds, amino acids, and/or vitamins.

본 출원에서 상기 탄소원으로는 글루코오스, 사카로오스, 락토오스, 프룩토오스, 수크로오스, 말토오스 등과 같은 탄수화물; 만니톨, 소르비톨 등과 같은 당 알코올, 피루브산, 락트산, 시트르산 등과 같은 유기산; 글루탐산, 메티오닌, 라이신 등과 같은 아미노산 등이 포함될 수 있다. 또한, 전분 가수분해물, 당밀, 블랙스트랩 당밀, 쌀겨울, 카사버, 사탕수수 찌꺼기 및 옥수수 침지액 같은 천연의 유기 영양원을 사용할 수 있으며, 구체적으로는 글루코오스 및 살균된 전처리 당밀(즉, 환원당으로 전환된 당밀) 등과 같은 탄수화물이 사용될 수 있으며, 그 외의 적정량의 탄소원을 제한 없이 다양하게 이용할 수 있다. 이들 탄소원은 단독으로 사용되거나 2 종 이상이 조합되어 사용될 수 있으며, 이에 한정되는 것은 아니다.Examples of the carbon source in the present application include carbohydrates such as glucose, saccharose, lactose, fructose, sucrose, and maltose; sugar alcohols such as mannitol and sorbitol; organic acids such as pyruvic acid, lactic acid, citric acid and the like; Amino acids such as glutamic acid, methionine, lysine, and the like may be included. In addition, natural organic nutrients such as starch hydrolysate, molasses, blackstrap molasses, rice winter, cassava, sorghum pomace and corn steep liquor can be used, specifically glucose and sterilized pretreated molasses (i.e. converted to reducing sugar). Carbohydrates such as molasses) may be used, and other carbon sources in an appropriate amount may be used in various ways without limitation. These carbon sources may be used alone or in combination of two or more, but are not limited thereto.

상기 질소원으로는 암모니아, 황산암모늄, 염화암모늄, 초산암모늄, 인산암모늄, 탄산안모늄, 질산암모늄 등과 같은 무기질소원; 글루탐산, 메티오닌, 글루타민 등과 같은 아미노산, 펩톤, NZ-아민, 육류 추출물, 효모 추출물, 맥아 추출물, 옥수수 침지액, 카세인 가수분해물, 어류 또는 그의 분해생성물, 탈지 대두 케이크 또는 그의 분해 생성물 등과 같은 유기 질소원이 사용될 수 있다. 이들 질소원은 단독으로 사용되거나 2 종 이상이 조합되어 사용될 수 있으며, 이에 한정되는 것은 아니다.Examples of the nitrogen source include inorganic nitrogen sources such as ammonia, ammonium sulfate, ammonium chloride, ammonium acetate, ammonium phosphate, ammonium carbonate, and ammonium nitrate; Amino acids such as glutamic acid, methionine, glutamine, etc., organic nitrogen sources such as peptone, NZ-amine, meat extract, yeast extract, malt extract, corn steep liquor, casein hydrolysate, fish or degradation products thereof, defatted soybean cake or degradation products thereof, etc. can be used These nitrogen sources may be used alone or in combination of two or more, but are not limited thereto.

상기 인원으로는 인산 제1칼륨, 인산 제2칼륨, 또는 이에 대응되는 소디움-함유 염 등이 포함될 수 있다. 무기화합물로는 염화나트륨, 염화칼슘, 염화철, 황산마그네슘, 황산철, 황산망간, 탄산칼슘 등이 사용될 수 있으며, 그 외에 아미노산, 비타민 및/또는 적절한 전구체 등이 포함될 수 있다. 이들 구성성분 또는 전구체는 배지에 회분식 또는 연속식으로 첨가될 수 있다. 그러나, 이에 한정되는 것은 아니다.The number of persons may include monopotassium phosphate, dipotassium phosphate, or a sodium-containing salt corresponding thereto. As the inorganic compound, sodium chloride, calcium chloride, iron chloride, magnesium sulfate, iron sulfate, manganese sulfate, calcium carbonate, etc. may be used, and amino acids, vitamins, and/or appropriate precursors may be included. These components or precursors may be added to the medium either batchwise or continuously. However, it is not limited thereto.

또한, 상기 숙주 세포의 배양 중에 수산화암모늄, 수산화칼륨, 암모니아, 인산, 황산 등과 같은 화합물을 배지에 적절한 방식으로 첨가하여, 배지의 pH를 조정할 수 있다. 또한, 배양 중에는 지방산 폴리글리콜 에스테르와 같은 소포제를 사용하여 기포 생성을 억제할 수 있다. 또한, 배지의 호기 상태를 유지하기 위하여, 배지 내로 산소 또는 산소 함유 기체를 주입하거나 혐기 및 미호기 상태를 유지하기 위해 기체의 주입 없이 혹은 질소, 수소 또는 이산화탄소 가스를 주입할 수 있으며, 이에 한정되는 것은 아니다.In addition, the pH of the medium can be adjusted by adding compounds such as ammonium hydroxide, potassium hydroxide, ammonia, phosphoric acid, sulfuric acid, etc. to the medium in an appropriate manner during the culture of the host cells. In addition, during cultivation, the formation of bubbles can be suppressed by using an antifoaming agent such as a fatty acid polyglycol ester. In addition, in order to maintain the aerobic state of the medium, oxygen or oxygen-containing gas may be injected into the medium, or nitrogen, hydrogen or carbon dioxide gas may be injected without gas injection or nitrogen, hydrogen or carbon dioxide gas may be injected to maintain the anaerobic and non-aerobic state. It is not.

배지의 온도는 20℃ 내지 45℃, 구체적으로는 25℃ 내지 40℃일 수 있으나 이에 제한되지 않는다. 배양 기간은 유용 물질의 원하는 생성량이 수득될 때까지 계속될 수 있으며, 구체적으로는 10 시간 내지 160 시간일 수 있으나 이에 제한되지 않는다.The temperature of the medium may be 20 °C to 45 °C, specifically 25 °C to 40 °C, but is not limited thereto. The culturing period may be continued until a desired production amount of a useful substance is obtained, specifically, it may be 10 hours to 160 hours, but is not limited thereto.

하나의 구체예로, 본 출원의 피타아제 활성을 갖는 변이형 폴리펩티드를 제조하는 방법은 상기 배양단계에서 발현되는 본 출원의 피타아제 활성을 갖는 변이형 폴리펩티드를 회수하는 단계를 더 포함할 수 있다.In one embodiment, the method for producing the variant polypeptide having phytase activity of the present application may further include recovering the variant polypeptide having phytase activity of the present application expressed in the culturing step.

다른 하나의 구체예로, 상기 배양단계에서 발현된 변이체는 본 발명이 속하는 분야에 알려져 있는 방법을 사용하여 회수될 수 있다. 예를 들어, 변이체는 수집, 원심분리, 여과, 추출, 분무-건조, 증발 또는 침전을 포함하나 이들에 한정되지 않는 통상적인 절차에 의해 영양 배지로부터 회수될 수 있다.In another embodiment, the mutant expressed in the culturing step can be recovered using a method known in the art to which the present invention belongs. For example, variants can be recovered from nutrient media by conventional procedures including, but not limited to, collection, centrifugation, filtration, extraction, spray-drying, evaporation or precipitation.

상기 회수 방법은 본 출원의 숙주 세포의 배양 방법, 예를 들어 회분식, 연속식 또는 유가식 배양 방법 등에 따라 당해 기술 분야에 공지된 적합한 방법을 이용하여 변이체를 수집(collect)하는 것일 수 있다. 예를 들어, 원심분리, 여과, 결정화 단백질 침전제에 의한 처리(염석법), 추출, 초음파 파쇄, 한외여과, 투석법, 분자체 크로마토그래피(겔여과), 흡착크로마토그래피, 이온교환 크로마토그래피, 친화도 크로마토그래피 등의 각종 크로마토그래피, HPLC 및 이들의 방법을 조합하여 사용될 수 있으며, 당해 분야에 공지된 적합한 방법을 이용하여 배지 또는 숙주 세포로부터 변이체를 회수할 수 있다.The recovery method may be to collect variants using a suitable method known in the art according to the host cell culture method of the present application, for example, batch, continuous, or fed-batch culture. For example, centrifugation, filtration, treatment with a precipitating agent for crystallized proteins (salting out method), extraction, sonic disruption, ultrafiltration, dialysis, molecular sieve chromatography (gel filtration), adsorption chromatography, ion exchange chromatography, affinity Various chromatography, HPLC, and these methods may be used in combination, and the mutant may be recovered from the medium or host cell using a suitable method known in the art.

다른 하나의 구체예로, 배양단계에서 숙주 세포에 의해 발현되는 변이체는 회수되지 않을 수 있다. 상기 구체예에서, 변이체를 발현하는 숙주 세포 자체를 변이체의 공급원으로 사용할 수 있다.In another embodiment, variants expressed by the host cell in the culture step may not be recovered. In the above embodiment, the host cell itself expressing the variant may be used as a source of the variant.

본 출원의 변이체, 이를 발현하는 숙주 세포, 상기 변이체 및/또는 숙주 세포를 포함하는 조성물을 이용하여 기질(예컨대, 피틴(myo-inositol hexakisphosphate))을 최종 산물(예컨대, 1D-myo-inositol 1,2,3,5,6-pentakisphosphate)로 전환시킬 수 있다. 기질의 가수 분해 단계에서 본 출원의 변이체 외에 보조인자(cofactor), 조효소(coenzyme) 등이 함께 첨가될 수 있다. 기질의 가수 분해 단계는 최적 pH, 온도 조건 등에서 수행될 수 있으며 당업자가 적절한 조건을 선택할 수 있다. A substrate (e.g., phytin (myo-inositol hexakisphosphate)) is converted into a final product (e.g., 1D-myo-inositol 1, 2,3,5,6-pentakisphosphate). In addition to the variants of the present application, cofactors, coenzymes, etc. may be added together in the hydrolysis step of the substrate. The step of hydrolyzing the substrate can be performed under optimal pH, temperature conditions, etc., and appropriate conditions can be selected by those skilled in the art.

본 출원의 변이체는 피틴산을 포함하거나 이것으로 이루어진 곡물과 기름 종자를 포함하는 사료를 처리하는데 사용될 수 있다. 이와 같은 사료는, 투여를 위해서 추가로 구연산, 푸마르산, 아디프산, 젖산 등의 유기산; 인산칼륨, 인산나트륨, 중합 인산염 등의 인산염; 폴리페놀, 카테친, 토코페롤, 비타민 C, 녹차 추출물, 키토산, 탄니산 등의 천연 항산화제 중 1종 이상을 혼합하여 사용할 수 있으며, 필요에 따라 항인플루엔자제, 완충액, 정균제 등 다른 통상의 첨가제를 첨가할 수 있다. 또한 희석제, 분산제, 계면활성제, 결합제 또는 윤활제를 부가적으로 첨가하여 수용액, 현탁액, 유탁액 등과 같은 주사용 제형, 캡슐, 과립 또는 정제로 제제화할 수 있다. 또한, 상기 사료는 보조성분으로 아미노산, 무기염류, 비타민, 항산화제, 항진균제, 항균제 등과 같은 각종 보조제 및 분쇄 또는 파쇄된 밀, 보리, 옥수수 등의 식물성 단백질 사료, 혈분, 육분, 생선분 등의 동물성 단백질 사료, 동물성 지방 및 식물성 지방 같은 주성분 이외에도 영양 보충제, 성장 촉진제, 소화 흡수 촉진제, 질병 예방제와 함께 사용될 수 있다. 처리는 단위동물의 소화관에서의 분해에 따른 인체와 가축의 무기질 충족, 사육 밀집지역의 하천이나 호수를 부영양화 및 수질오염 예방을 제공할 수 있다.The variants of the present application can be used to treat feeds including grains and oil seeds containing or consisting of phytic acid. Such a feed may further include organic acids such as citric acid, fumaric acid, adipic acid, and lactic acid for administration; phosphates such as potassium phosphate, sodium phosphate, and polymerized phosphate; At least one of natural antioxidants such as polyphenol, catechin, tocopherol, vitamin C, green tea extract, chitosan, and tannic acid may be mixed and used, and other conventional additives such as anti-influenza, buffer, and bacteriostatic agent may be added as necessary. can do. In addition, diluents, dispersants, surfactants, binders, or lubricants may be additionally added to prepare formulations for injections such as aqueous solutions, suspensions, emulsions, and the like, capsules, granules, or tablets. In addition, the feed includes various auxiliary ingredients such as amino acids, inorganic salts, vitamins, antioxidants, antifungal agents, and antibacterial agents as auxiliary ingredients, vegetable protein feed such as pulverized or crushed wheat, barley, and corn, and animal sources such as blood meal, meat meal, and fish meal. In addition to main ingredients such as protein feed, animal fat and vegetable fat, it can be used with nutritional supplements, growth promoters, digestion and absorption promoters, and disease prevention agents. The treatment can provide minerals for the human body and livestock according to decomposition in the digestive tract of unit animals, eutrophication of rivers and lakes in breeding densely populated areas, and prevention of water pollution.

실시예Example

이하 본 출원을 실시예 및 실험예를 통하여 보다 상세하게 설명한다. 그러나 이들 실시예 및 실험예는 본 출원을 예시적으로 설명하기 위한 것으로 본 출원의 범위가 이들 실시예 및 실험예에 한정되는 것은 아니다.Hereinafter, the present application will be described in more detail through Examples and Experimental Examples. However, these examples and experimental examples are for illustrative purposes of the present application, and the scope of the present application is not limited to these examples and experimental examples.

실시예 1: 피타아제 변이체의 제조Example 1: Preparation of phytase variants

실시예 1-1. 주형(Template) 제작Example 1-1. Manufacture of template

대장균(Escherichia coli, E.coli) MG1655 균주의 지노믹 DNA(Genomic DNA)에서 피타아제(phytase, 이하, EcPhy로 기재) (서열번호 1)를 코딩하는 폴리뉴클레오티드(서열번호 2)를 증폭하여 pET 벡터(Novagen)에 클로닝한 것을 주형(Template)으로 사용하였다.Escherichia coli ( Escherichia coli , E.coli ) A polynucleotide (SEQ ID NO: 2) encoding a phytase (hereinafter referred to as EcPhy) (SEQ ID NO: 1) in the genomic DNA of the MG1655 strain is amplified to pET Cloning into a vector (Novagen) was used as a template.

실시예 1-2. EcPhy 변이체 발현 벡터 제작Example 1-2. Construction of EcPhy variant expression vectors

EcPhy의 상온 활성 증가를 위한 표면 잔기 부위를 선정하고, 프라이머를 디자인하여, 4종의 변이체 발현 벡터를 제작하였다. 각 변이체의 서열번호 1의 아미노산 서열을 기준으로 한 변이 위치 및 변이 전후 아미노산은 하기 표 1과 같다.Surface residue sites for increasing EcPhy activity at room temperature were selected, primers were designed, and four variant expression vectors were constructed. Table 1 shows the mutation position and amino acids before and after the mutation based on the amino acid sequence of SEQ ID NO: 1 of each variant.

변이체
명칭
variant
designation
변이 내용mutation content 서열번호sequence number 프라이머 서열(5'→3')Primer sequence (5'→3')
EPM1EPM1 A109EA109E ForwardForward 2121 GGCTGGCACCTGACTGT GAA ATAACCGTACATACCCAGGCAGATACGTCCGGCTGGCACCTGACTGT GAA ATAACCGTACATACCCAGGCAGATACGTCC ReverseReverse 2222 TTC ACAGTCAGGTGCCAGCCCGGCGGCGAAGGCTTCG TTC ACAGTCAGGTGCCAGCCCGGCGGCGAAGGCTTCG EPM2EPM2 Q134EQ134E ForwardForward 2323 AAAAACTGGCGTTTGC GAA CTGGATAACGCGAACGTGACTGACGAAAAACTGGCGTTTGC GAA CTGGATAACGCGAACGTGACTGACG ReverseReverse 2424 TTC GCAAACGCCAGTTTTTAGAGGATTAAATAACGGATCGGGACTGGACG TTC GCAAACGCCAGTTTTTAGAGGATTAAATAACGGATCGGGACTGGACG EPM3EPM3 N137HN137H ForwardForward 2525 CGTTTGCCAACTGGAT CAC GCGAACGTGACTGACGCGATCCCGTTTGCCAACTGGAT CAC GCGAACGTGACTGACGCGATCC ReverseReverse 2626 GTG ATCCAGTTGGCAAACGCCAGTTTTTAGAGGATTAAATAACGGATCGG GTG ATCCAGTTGGCAAACGCCAGTTTTTAGAGGATTAAATAACGGATCGG EPM4EPM4 R164SR164S ForwardForward 2727 GGCAAACGGCGTTT AGC GAACTGGAACGGGTGCTTAATTTTCCGGGCAAACGGCGTTT AGC GAACTGGAACGGGTGCTTAATTTTCCG ReverseReverse 2828 GCT AAACGCCGTTTGCCGATGCCCGGTAAAGTCAGCAATTGACC GCT AAACGCCGTTTGCCGATGCCCGGTAAAGTCAGCAATTGACC

구체적으로, 상기 피타아제 변이체 발현 벡터는 주형(서열번호 2), 프라이머(Primer) 및 PCR premix(iNtRON, cat no. 25185)를 사용하여 QuikChange Site-Directed Mutagenesis를 통해 제작하였다. PCR은 Eppendorf Mastercycler Nexus GX2를 이용하였고, 반응 조건은 최초 변성(Initial denaturation)은 94℃, 2min, 변성(Denaturation)은 94℃, 20sec, 어닐링(Annealing)은 55℃, 10sec, 신장(Extension)은 72℃, 8min(변성에서 신장까지 15cycle) 및 최종 신장(Final Extension)은 72℃, 5min 조건으로 수행하였다. Specifically, the phytase mutant expression vector was prepared through QuikChange Site-Directed Mutagenesis using a template (SEQ ID NO: 2), primers, and PCR premix (iNtRON, cat no. 25185). Eppendorf Mastercycler Nexus GX2 was used for PCR, and the reaction conditions were initial denaturation at 94 ° C, 2 min, denaturation at 94 ° C, 20 sec, annealing at 55 ° C, 10 sec, and extension 72 ℃, 8min (15 cycles from denaturation to elongation) and final extension (Final Extension) were carried out at 72 ℃, 5min conditions.

상기 각 변이체 제작시 사용된 프라이머는 상기 표 1과 같다.The primers used in preparing each variant are shown in Table 1 above.

위의 방법으로 만들어진 4종의 변이체 발현 벡터를 E.coli DH5α 균주에 형질전환한 후 콜로니 PCR 및 시퀀싱을 통해 서열 변이 여부를 확인하였다.After transforming the 4 mutant expression vectors prepared by the above method into E.coli DH5α strain, sequence mutation was confirmed through colony PCR and sequencing.

실시예 1-3. EPM08 피타아제 변이체 발현 벡터 제작Example 1-3. Construction of EPM08 phytase mutant expression vector

상기 실시예 1-2에서 ECphy에 도입된 변이와 동일한 변이를 ECphy와 서열 동일성 90%인 EPM08 피타아제(서열번호 11)의 상응하는 위치에 도입하기 위한 프라이머를 디자인하여, 하기 표 2의 변이(A109E 또는 R137H) 또는 변이 조합(K134E+R164S 또는 A109E+K134E+R137H+R164S)이 도입된 변이체 4종의 발현 벡터를 제작하였다. 각 변이체의 서열번호 11의 아미노산 서열을 기준으로 한 변이 위치 및 변이 전후 아미노산은 하기 표 2와 같다.A primer was designed to introduce the same mutation introduced into ECphy in Example 1-2 into the corresponding position of EPM08 phytase (SEQ ID NO: 11) having 90% sequence identity with ECphy, and the mutations in Table 2 below ( A109E or R137H) or mutation combinations (K134E+R164S or A109E+K134E+R137H+R164S) were introduced into four variant expression vectors. The position of mutation based on the amino acid sequence of SEQ ID NO: 11 of each variant and the amino acids before and after the mutation are shown in Table 2 below.

변이 내용mutation content 서열번호sequence number 프라이머 서열(5'→3')Primer sequence (5'→3') A109EA109E ForwardForward 2929 GGCTGC GAA ATTACGGTCCACACGCAGCCCGACGGGCTGC GAA ATTACGGTCCACACGCAGCCCGACG ReverseReverse 3030 GACCGTAAT TTC GCAGCCGGGAGCCAAGCCGGCAGGACCGTAAT TTC GCAGCCGGGAGCCAAGCCGGCAG K134EK134E ForwardForward 3131 AGACGGGCGTGTGT GAA TTAGATCGTGCCAACGTTACTGCTGCAGACGGGCGTGTGT GAA TTAGATCGTGCCAACGTTACTGCTGC ReverseReverse 3232 TTC ACACACGCCCGTCTTTAATGGATTAAAAAGGGGATCGGGC TTC ACACACGCCCGTCTTTAATGGATTAAAAAGGGGATCGGGC R164SR164S ForwardForward 3333 GGCAACCCGCCTTT AGC GAATTAGAAAGGGTGTTGAACTTTCCTCAGGGCAACCCGCCTTT AGC GAATTAGAAAGGGTGTTGAACTTTCCTCAG ReverseReverse 3434 GCT AAAGGCGGGTTGCCTATGTTGCGTCCATCTGGCAATAGAGC GCT AAAGGCGGGTTGCCTATGTTGCGTCCATCTGGCAATAGAGC R137HR137H ForwardForward 3535 TGTGTAAATTAGAT CAT GCCAACGTTACTGCTGCAATTTTAGCACGTGCTGTGTAAATTAGAT CAT GCCAACGTTACTGCTGCAATTTTAGCACGTGC ReverseReverse 3636 GGC ATG ATCTAATTTACACACGCCCGTCTTTAATGGATTAAAAAGGGGGGC ATG ATCTAATTTACACACGCCCGTCTTTAATGGATTAAAAAGGGG

구체적으로, EPM08 피타아제 변이체(A109E 또는 R137H) 발현 벡터는 주형, 프라이머(Primer), PCR premix(iNtRON, cat no. 25185)를 사용하여 QuikChange Site-Directed Mutagenesis를 통해 제작하였다. 주형으로는 EPM08 피타아제(서열번호 11)을 코딩하는 폴리뉴클레오티드(서열번호 12)를 pET 벡터에 클로닝한 것(pET-EPM08)을 사용하였다. PCR은 Eppendorf Mastercycler Nexus GX2를 이용하였고, 반응 조건은 최초 변성은 94℃, 2min, 변성은 94℃, 20sec, 어닐링은 55℃, 10sec, 신장은 72℃, 8min(변성에서 신장까지 15cycle) 및 최종 신장은 72℃, 5min 조건으로 수행하였다. Specifically, the EPM08 phytase variant (A109E or R137H) expression vector was constructed through QuikChange Site-Directed Mutagenesis using a template, primers, and PCR premix (iNtRON, cat no. 25185). As a template, a polynucleotide (SEQ ID NO: 12) encoding EPM08 phytase (SEQ ID NO: 11) was cloned into a pET vector (pET-EPM08). Eppendorf Mastercycler Nexus GX2 was used for PCR, and the reaction conditions were initial denaturation at 94°C, 2min, denaturation at 94°C, 20sec, annealing at 55°C, 10sec, elongation at 72°C, 8min (15cycles from denaturation to elongation) and final Elongation was performed under conditions of 72°C and 5 min.

EPM08 피타아제 변이체 EPM08M2(K134E+R164S) 발현 벡터(pET-EPM08M2)는 주형인 pET-EPM08 벡터의 EPM08 피타아제를 코딩하는 폴리뉴클레오티드 서열에 K134E 변이 코딩 서열 도입 후 R164S 변이 코딩 서열을 도입하여 제작하였다. The EPM08 phytase variant EPM08M2 (K134E+R164S) expression vector (pET-EPM08M2) was constructed by introducing the K134E mutant coding sequence and then the R164S mutant coding sequence into the polynucleotide sequence encoding EPM08 phytase of the pET-EPM08 vector as a template. .

EPM08 피타아제 변이체 EPM08M4(A109E+K134E+R137H+R164S) 발현 벡터(pET-EPM08M4)는 앞서 제작한 pET-EPM08M2 벡터의 EPM08M2 피타아제 코딩 서열에 A109E 변이 코딩 서열 도입 후 R137H 변이 코딩 서열을 도입하여 제작하였다. The EPM08 phytase variant EPM08M4 (A109E+K134E+R137H+R164S) expression vector (pET-EPM08M4) was prepared by introducing the A109E mutant coding sequence and then the R137H mutant coding sequence into the EPM08M2 phytase coding sequence of the previously constructed pET-EPM08M2 vector. did

상기 각 변이체 제작시 사용된 프라이머는 상기 표 2와 같다.The primers used in preparing each variant are shown in Table 2 above.

위의 방법으로 만들어진 4종의 변이체 발현 벡터를 E.coli DH5α 균주에 형질전환 후 콜로니 PCR 및 시퀀싱을 통해 서열 변이 여부를 확인하였다.After transforming the 4 mutant expression vectors prepared by the above method into E.coli DH5α strain, sequence mutation was confirmed through colony PCR and sequencing.

실시예 2: 피타아제 변이체 활성 개선 효과 확인Example 2: Confirmation of the effect of improving the activity of phytase variants

실시예 2-1. EcPhy 변이체 효소 역가Example 2-1. EcPhy variant enzyme titer

상기 실시예 1에서 제작된 EcPhy 변이체 및 EcPhy 발현 벡터로 각각 형질전환된 E. coli BL21(DE3) 균주를 멸균된 LB 배지에 접종하고, 37℃, 250rpm으로 20시간 동안 전배양하고, 1:100으로 희석하여 2시간 동안 본배양한 뒤, IPTG 유도를 통하여 4시간 동안 세포 내 단백질을 발현시켰다. 배양된 배지를 원심분리하여 균체를 회수하고, 회수된 균체에 용해 완충액(lysis buffer: 50 mM Tris-HCl, pH 7.4, 2 mg/mL lysozyme)을 가하여 재현탁한 다음, 37℃, 1000 rpm에서 30분 동안 용해 후 원심분리를 통해 효소액을 확보하여 역가 평가를 진행하였다. E. coli BL21(DE3) strains each transformed with the EcPhy variant and EcPhy expression vector prepared in Example 1 were inoculated into a sterile LB medium, pre-cultured at 37°C and 250 rpm for 20 hours, and 1:100 After incubation for 2 hours after dilution, intracellular protein was expressed for 4 hours through IPTG induction. The cultured medium was centrifuged to recover cells, and lysis buffer (50 mM Tris-HCl, pH 7.4, 2 mg/mL lysozyme) was added to the recovered cells, resuspended, and then 30°C at 1000 rpm at 37°C. After dissolving for 10 minutes, the enzyme solution was secured through centrifugation to evaluate the potency.

효소 역가는 10 μL의 효소액과 50 μL의 기질용액(50 mM sodium acetate pH 5.5,1 mM 4-methylumbelliferyl phosphate)을 혼합하여 생성되는 물질(4-methylumbelliferone)의 형광도(RFU; excitation 360nm, emission 465nm)를 측정하여 평가하였다. 변이체마다 10분간 반응을 진행하였고, 30초마다 RFU를 측정하여 초당 RFU 증가량(RFU/s)을 계산하여 변이체들의 상대역가를 구하였다. 각 변이체들의 초당 RFU 증가량(RFU/s)은 도 1에 나타내었고, 이를 토대로 각 변이체들의 상대역가를 EcPhy를 기준으로 산출한 결과는 하기 표 3과 같다.The enzyme titer was determined by the fluorescence (RFU; excitation 360 nm, emission 465 nm) of the substance (4-methylumbelliferone) produced by mixing 10 μL of enzyme solution and 50 μL of substrate solution (50 mM sodium acetate pH 5.5, 1 mM 4-methylumbelliferyl phosphate). ) was evaluated by measuring. The reaction was carried out for 10 minutes for each variant, and the RFU was measured every 30 seconds to calculate the RFU increase per second (RFU / s) to obtain the relative titer of the variants. The RFU increase per second (RFU / s) of each variant is shown in Figure 1, and based on this, the relative titer of each variant was calculated based on EcPhy, and the results are shown in Table 3 below.

변이체 명칭variant name RFU/sRFU/s 역가 비율potency ratio 역가 증가량 (%)Potency increase (%) EcPhyEcPhy 63.2563.25 1.001.00 0.000.00 EPM1EPM1 76.4076.40 1.211.21 20.7820.78 EPM2EPM2 88.4688.46 1.401.40 39.8639.86 EPM3EPM3 73.3173.31 1.161.16 15.8915.89 EPM4EPM4 73.1473.14 1.161.16 15.6315.63

그 결과, 효소 역가를 비율로 측정하였을 때, EcPhy 대비 EcPhy 변이체 4종(EPM1, EPM2, EPM3 및 EPM4)에서 효소 역가가 15% ~ 40% 이상 개선되었음을 확인하였다. As a result, when the enzyme titer was measured as a ratio, it was confirmed that the enzyme titer was improved by 15% to 40% or more in the four EcPhy variants (EPM1, EPM2, EPM3 and EPM4) compared to EcPhy.

실시예 2-2. EPM08 피타아제 변이체 효소 역가Example 2-2. EPM08 phytase variant enzyme titer

상기 실시예 1에서 제작된 EPM08 피타아제 변이체 및 EPM08 피타아제 발현 벡터로 각각 형질전환된 E. coli BL21(DE3) 균주를 이용하여 상기와 동일한 방법으로 EPM08 피타아제 변이체 4종(A109E, R137H, EPM08M2(K134E+R164S), EPM08M4(A109E+K134E+R137H+R164S))의 효소 역가를 분석한 결과, EPM08 피타아제 변이체 4종에서도 EPM08 피타아제 대비 역가가 18%~68% 개선되었음을 확인하였다(도 3).Four EPM08 phytase mutants (A109E, R137H , EPM08M2 As a result of analyzing the enzyme activity of (K134E + R164S) and EPM08M4 (A109E + K134E + R137H + R164S)), it was confirmed that the activity was improved by 18% to 68% compared to EPM08 phytase in four EPM08 phytase variants (FIG. 3 ).

실시예 3: 피타아제 변이체 발현 피키아 파스토리스(Example 3: Phytase variant expression Pichia pastoris ( Pichia pastorisPichia pastoris ) 균주 제작) strain production

Ecphy 피타아제, EPM08 피타아제 또는 상기 실시예 1에서 제작된 이의 각각의 변이체를 발현하는 피키아 파스토리스 균주를 제작하기 위하여 이들 단백질을 발현할 수 있는 각각의 폴리뉴클레오티드를 코돈 최적화한 후 합성하고, 하기 표 4의 프라이머 쌍을 사용하여 PCR을 통해 증폭하였다. 증폭된 각 폴리뉴클레오티드를 pPICZaA 벡터의 신호 펩타이드(signal peptide)와 AOX1 터미네이터(terminator) 사이 멀티 클로닝 위치(multi cloning site)에 퓨전 라이게이션하여 E.coli DH5a에 형질전환하고, 제오신(Zeocin) 플레이트(저염 LB)에서 37℃, 24시간 동안 배양하여 콜로니들을 선별하였다. 선별된 콜로니들을 하기 표 4의 프라이머 쌍을 사용하여 PCR을 수행하여, Ecphy 피타아제, EPM08 피타아제 또는 이의 변이체를 코딩하는 폴리뉴클레오티드가 삽입된 벡터를 포함하고 있는 콜로니를 최종 선별하였다. In order to prepare a Pichia pastoris strain expressing Ecphy phytase, EPM08 phytase or each variant thereof prepared in Example 1, each polynucleotide capable of expressing these proteins was codon-optimized and then synthesized, It was amplified by PCR using the primer pairs shown in Table 4 below. Each amplified polynucleotide was fusion-ligated to the multi cloning site between the signal peptide of the pPICZaA vector and the AOX1 terminator, transformed into E.coli DH5a, and plated on a Zeocin plate. Colonies were selected by culturing at 37° C. for 24 hours in (low salt LB). PCR was performed on the selected colonies using the primer pairs shown in Table 4 below, and colonies containing vectors containing polynucleotides encoding Ecphy phytase, EPM08 phytase or variants thereof were finally selected.

각 폴리뉴클레오티드에 대해 선별된 콜로니를 제오신을 첨가한 저염 LB에 접종하여 37℃, 24시간 동안 배양하고 원심분리를 통하여 균체를 얻은 후 DNA prep을 통하여 클로닝된 벡터를 수득하였다. 수득한 각 벡터에 Sac1 제한 효소를 처리하고 37℃에서 4시간 인큐베이션하여 선형화된 플라스미드를 얻었다. Colonies selected for each polynucleotide were inoculated in low-salt LB supplemented with Zeocin, cultured at 37° C. for 24 hours, centrifuged to obtain cells, and then cloned vectors were obtained through DNA prep. Each obtained vector was treated with Sac1 restriction enzyme and incubated at 37°C for 4 hours to obtain a linearized plasmid.

해당 각 플라스미드를 야생형 피키아 파스토리스 BG10 균주에 전기천공법(electroporation)으로 형질전환한 후 30℃에서 2일 이상 배양하여 콜로니들을 선별하였다. 선별된 콜로니들을 YPD 배지에 접종하여 균체를 얻은 후 PCR을 수행하여, Ecphy 피타아제, EPM08 피타아제 또는 이의 변이체를 코딩하는 폴리뉴클레오티드가 삽입된 벡터를 포함하고 있는 각각의 피키아 파스토리스 균주 선별하였다. Each corresponding plasmid was transformed into wild-type Pichia pastoris BG10 strain by electroporation, and then cultured at 30° C. for 2 days or more to select colonies. After inoculating the selected colonies into YPD medium to obtain cells, PCR was performed to select each Pichia pastoris strain containing a vector inserted with a polynucleotide encoding Ecphy phytase, EPM08 phytase or a variant thereof. .

서열번호sequence number 서열명sequence name 서열(5'→3')Sequence (5'→3') 3737 primer_Fprimer_F AGA GAG GCT GAA GCT CAA TCT GAA TTG CAAAGA GAG GCT GAA GCT CAA TCT GAA TTG CAA 3838 primer_Rprimer_R AAG GCT ACA AAC TCA CAA AGA ACA AGC TGG AAT TCT AGAAG GCT ACA AAC TCA CAA AGA ACA AGC TGG AAT TCT AG

실시예 4: 피타아제 변이체 발현 피키아 파스토리스 균주 활성 평가Example 4: Activity evaluation of Pichia pastoris strains expressing phytase variants

상기 실시예 3에서 제작된 각 균주의 플라스크 배양 및 효소 발현을 확인하기 위하여 플라스크 비교 평가를 진행하였다. 시드 배양은 상기 균주를 1ml BMGY(1% glycerol) (표 5)에 접종하여 30℃, 200 rpm에서 16시간 동안 배양하였고, 본 배양은 20ml 역가 배지(표 6)에 시드 배양액을 200ul 접종하여 30℃, 200 rpm에서 배양하였다. Aox1 프로모터 유도를 위해 메탄올을 24시간 간격으로 3%씩 첨가하였다. 역가 평가를 위해 본 배양액의 상등액을 이용하여 피타아제 활성 어세이를 수행한 후 상대적 피타아제 활성을 분석하였다.Flask comparison evaluation was performed to confirm the flask culture and enzyme expression of each strain prepared in Example 3. Seed culture was inoculated with the above strain in 1ml BMGY (1% glycerol) (Table 5) and cultured at 30 ° C and 200 rpm for 16 hours. C, incubated at 200 rpm. To induce the Aox1 promoter, 3% methanol was added every 24 hours. For titer evaluation, a phytase activity assay was performed using the supernatant of this culture, and then the relative phytase activity was analyzed.

BMGY 1% 배지 조성Composition of BMGY 1% medium Stock conc.Stock conc. Working conc.Working conc. 1L 당per 1L Yeast extractYeast extract 1%One% 10g10g PeptonePeptone 2% 2% 20g20g Autoclave 121℃, 15min
BMGY(1%): total volume 700ml
Autoclave 121℃, 15min
BMGY (1%): total volume 700ml
1M K-pi, pH6.01M K-pi, pH6.0 100mM100 mM 100ml100ml 13.4% YNB13.4% YNB 1.34%1.34% 100ml100ml 1X10-2% Biotin1X10-2% Biotin 4X10-5%4X10-5% 2ml2ml 10% Glycerol10% Glycerol 1%One% 100ml100ml

역가 배지 조성Potency medium composition 배지 성분medium component 농도density KH2PO4 KH 2 PO 4 11.7g/L11.7g/L K2HPO4 K 2 HPO 4 2.4g/L2.4g/L Calcium sulfateCalcium sulfate 0.93g/L0.93g/L Pottasium sulfatePottasium sulfate 9.1g/L9.1g/L MgSO7H2OMgSO 4 7H2O 14.9g/L14.9g/L GlycerolGlycerol 1.0g/L1.0g/L YE(yeast extract)YE (yeast extract) 20.0g/L20.0g/L CSL(Corn steep liquor) (50%)Corn steep liquor (CSL) (50%) 50.0g/L50.0g/L PTM4(Pichia trace minerals 4)PTM4 (Pichia trace minerals 4) 2.0ml/L2.0ml/L

PTM4 스톡 조성PTM4 stock composition 성분ingredient 농도density CuSO5H2OCuSO 4 5H 2 O 2g/L2g/L NaI(sodium iodide)sodium iodide (NaI) 0.08g/L0.08g/L MnSOH2OMnSO 4 H 2 O 3g/L3g/L Sodium molybdate·2H2OSodium molybdate 2H 2 O 200mg/L200mg/L Boric acidBoric acid 20mg/L20mg/L CaSO2H2OCaSO 4 2H 2 O 0.5g/L0.5g/L Cobalt chlorideCobalt chloride 0.5g/L0.5g/L Zinc chlorideZinc chloride 7g/L7g/L FeSO7H2OFeSO 4 7H 2 O 22g/L22g/L BiotinBiotin 200mg/L200mg/L Sulfuric acidSulfuric acid 1ml/L1ml/L

그 결과, EPM08 피타아제 발현 벡터가 도입된 균주는 약 84 U/ml의 피타아제 활성을 나타냈으며, 4개 변이가 동시 도입된 EPM08 피타아제 변이체 EPM08M4(A109E+K134E+R137H+R164S) 발현 벡터가 도입된 균주는 103 U/ml의 피타아제 활성을 나타내었다.As a result, the strain into which the EPM08 phytase expression vector was introduced showed a phytase activity of about 84 U/ml, and the EPM08 phytase mutant EPM08M4 (A109E+K134E+R137H+R164S) expression vector in which four mutations were simultaneously introduced The introduced strain showed a phytase activity of 10 3 U/ml.

다음으로, 상기에서 산출된 활성을 토대로 각 EcPhy 변이체 4종의 상대적 피타아제 활성을 EcPhy를 기준으로 확인한 결과, 도 2와 같이 EcPhy 변이체 4종 모두 EcPhy에 비해 활성이 증가함을 확인하였다.Next, as a result of confirming the relative phytase activity of each of the four EcPhy variants based on the activity calculated above, it was confirmed that the activity of all four EcPhy variants increased compared to EcPhy, as shown in FIG.

또한, 각 EPM08 피타아제 변이체 4종의 상대적 피타아제 활성을 EPM08 피타아제를 기준으로 확인한 결과, 도 3과 같이 EPM08 피타아제 변이체 4종 모두 EPM08 피타아제에 비해 활성이 증가함을 확인하였다.In addition, as a result of confirming the relative phytase activity of each of the four EPM08 phytase variants based on EPM08 phytase, it was confirmed that the activity of all four EPM08 phytase variants increased compared to EPM08 phytase as shown in FIG. 3 .

이상의 설명으로부터, 본 출원이 속하는 기술분야의 당업자는 본 출원이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 이와 관련하여, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다. 본 출원의 범위는 상기 상세한 설명보다는 후술하는 특허 청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 출원의 범위에 포함되는 것으로 해석되어야 한다.From the above description, those skilled in the art to which this application pertains will be able to understand that this application can be implemented in other specific forms without changing its technical spirit or essential features. In this regard, it should be understood that the embodiments described above are illustrative in all respects and not limiting. The scope of the present application should be construed as including all changes or modifications derived from the meaning and scope of the following patent claims and their equivalent concepts rather than the detailed description above.

<110> CJ CheilJedang Corporation <120> Phytase Variant <130> KPA210391-KR <160> 38 <170> KoPatentIn 3.0 <210> 1 <211> 410 <212> PRT <213> Unknown <220> <223> EcPhy AA <400> 1 Gln Ser Glu Pro Glu Leu Lys Leu Glu Ser Val Val Ile Val Ser Arg 1 5 10 15 His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln Leu Met Gln Asp Val 20 25 30 Thr Pro Asp Ala Trp Pro Thr Trp Pro Val Lys Leu Gly Trp Leu Thr 35 40 45 Pro Arg Gly Gly Glu Leu Ile Ala Tyr Leu Gly His Tyr Gln Arg Gln 50 55 60 Arg Leu Val Ala Asp Gly Leu Leu Ala Lys Lys Gly Cys Pro Gln Ser 65 70 75 80 Gly Gln Val Ala Ile Ile Ala Asp Val Asp Glu Arg Thr Arg Lys Thr 85 90 95 Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Asp Cys Ala Ile Thr Val 100 105 110 His Thr Gln Ala Asp Thr Ser Ser Pro Asp Pro Leu Phe Asn Pro Leu 115 120 125 Lys Thr Gly Val Cys Gln Leu Asp Asn Ala Asn Val Thr Asp Ala Ile 130 135 140 Leu Ser Arg Ala Gly Gly Ser Ile Ala Asp Phe Thr Gly His Arg Gln 145 150 155 160 Thr Ala Phe Arg Glu Leu Glu Arg Val Leu Asn Phe Pro Gln Ser Asn 165 170 175 Leu Cys Leu Lys Arg Glu Lys Gln Asp Glu Ser Cys Ser Leu Thr Gln 180 185 190 Ala Leu Pro Ser Glu Leu Lys Val Ser Ala Asp Asn Val Ser Leu Thr 195 200 205 Gly Ala Val Ser Leu Ala Ser Met Leu Thr Glu Ile Phe Leu Leu Gln 210 215 220 Gln Ala Gln Gly Met Pro Glu Pro Gly Trp Gly Arg Ile Thr Asp Ser 225 230 235 240 His Gln Trp Asn Thr Leu Leu Ser Leu His Asn Ala Gln Phe Tyr Leu 245 250 255 Leu Gln Arg Thr Pro Glu Val Ala Arg Ser Arg Ala Thr Pro Leu Leu 260 265 270 Asp Leu Ile Lys Thr Ala Leu Thr Pro His Pro Pro Gln Lys Gln Ala 275 280 285 Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe Ile Ala Gly His Asp 290 295 300 Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Glu Leu Asn Trp Thr Leu 305 310 315 320 Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu Leu Val Phe Glu 325 330 335 Arg Trp Arg Arg Leu Ser Asp Asn Ser Gln Trp Ile Gln Val Ser Leu 340 345 350 Val Phe Gln Thr Leu Gln Gln Met Arg Asp Lys Thr Pro Leu Ser Leu 355 360 365 Asn Thr Pro Pro Gly Glu Val Lys Leu Thr Leu Ala Gly Cys Glu Glu 370 375 380 Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly Phe Thr Gln Ile Val 385 390 395 400 Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu 405 410 <210> 2 <211> 1230 <212> DNA <213> Unknown <220> <223> EcPhy NT <400> 2 cagagtgagc cggagctgaa gctggaaagt gtggtgattg tcagtcgtca tggtgtgcgt 60 gctccaacca aggccacgca actgatgcag gatgtcaccc cagacgcatg gccaacctgg 120 ccggtaaaac tgggttggct gacaccgcgc ggtggtgagc taatcgccta tctcggacat 180 taccaacgcc agcgtctggt agccgacgga ttgctggcga aaaagggctg cccgcagtct 240 ggtcaggtcg cgattattgc tgatgtcgac gagcgtaccc gtaaaacagg cgaagccttc 300 gccgccgggc tggcacctga ctgtgcaata accgtacata cccaggcaga tacgtccagt 360 cccgatccgt tatttaatcc tctaaaaact ggcgtttgcc aactggataa cgcgaacgtg 420 actgacgcga tcctcagcag ggcaggaggg tcaattgctg actttaccgg gcatcggcaa 480 acggcgtttc gcgaactgga acgggtgctt aattttccgc aatcaaactt gtgccttaaa 540 cgtgagaaac aggacgaaag ctgttcatta acgcaggcat taccatcgga actcaaggtg 600 agcgccgaca atgtctcatt aaccggtgcg gtaagcctcg catcaatgct gacggagata 660 tttctcctgc aacaagcaca gggaatgccg gagccggggt ggggaaggat caccgattca 720 caccagtgga acaccttgct aagtttgcat aacgcgcaat tttatttgct acaacgcacg 780 ccagaggttg cccgcagccg cgccaccccg ttattagatt tgatcaagac agcgttgacg 840 ccccatccac cgcaaaaaca ggcgtatggt gtgacattac ccacttcagt gctgtttatc 900 gccggacacg atactaatct ggcaaatctc ggcggcgcac tggagctcaa ctggacgctt 960 cccggtcagc cggataacac gccgccaggt ggtgaactgg tgtttgaacg ctggcgtcgg 1020 ctaagcgata acagccagtg gattcaggtt tcgctggtct tccagacttt acagcagatg 1080 cgtgataaaa cgccgctgtc attaaatacg ccgcccggag aggtgaaact gaccctggca 1140 ggatgtgaag agcgaaatgc gcagggcatg tgttcgttgg caggttttac gcaaatcgtg 1200 aatgaagcac gcataccggc gtgcagtttg 1230 <210> 3 <211> 410 <212> PRT <213> Artificial Sequence <220> <223> EPM1(A109E) AA <400> 3 Gln Ser Glu Pro Glu Leu Lys Leu Glu Ser Val Val Ile Val Ser Arg 1 5 10 15 His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln Leu Met Gln Asp Val 20 25 30 Thr Pro Asp Ala Trp Pro Thr Trp Pro Val Lys Leu Gly Trp Leu Thr 35 40 45 Pro Arg Gly Gly Glu Leu Ile Ala Tyr Leu Gly His Tyr Gln Arg Gln 50 55 60 Arg Leu Val Ala Asp Gly Leu Leu Ala Lys Lys Gly Cys Pro Gln Ser 65 70 75 80 Gly Gln Val Ala Ile Ile Ala Asp Val Asp Glu Arg Thr Arg Lys Thr 85 90 95 Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Asp Cys Glu Ile Thr Val 100 105 110 His Thr Gln Ala Asp Thr Ser Ser Pro Asp Pro Leu Phe Asn Pro Leu 115 120 125 Lys Thr Gly Val Cys Gln Leu Asp Asn Ala Asn Val Thr Asp Ala Ile 130 135 140 Leu Ser Arg Ala Gly Gly Ser Ile Ala Asp Phe Thr Gly His Arg Gln 145 150 155 160 Thr Ala Phe Arg Glu Leu Glu Arg Val Leu Asn Phe Pro Gln Ser Asn 165 170 175 Leu Cys Leu Lys Arg Glu Lys Gln Asp Glu Ser Cys Ser Leu Thr Gln 180 185 190 Ala Leu Pro Ser Glu Leu Lys Val Ser Ala Asp Asn Val Ser Leu Thr 195 200 205 Gly Ala Val Ser Leu Ala Ser Met Leu Thr Glu Ile Phe Leu Leu Gln 210 215 220 Gln Ala Gln Gly Met Pro Glu Pro Gly Trp Gly Arg Ile Thr Asp Ser 225 230 235 240 His Gln Trp Asn Thr Leu Leu Ser Leu His Asn Ala Gln Phe Tyr Leu 245 250 255 Leu Gln Arg Thr Pro Glu Val Ala Arg Ser Arg Ala Thr Pro Leu Leu 260 265 270 Asp Leu Ile Lys Thr Ala Leu Thr Pro His Pro Pro Gln Lys Gln Ala 275 280 285 Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe Ile Ala Gly His Asp 290 295 300 Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Glu Leu Asn Trp Thr Leu 305 310 315 320 Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu Leu Val Phe Glu 325 330 335 Arg Trp Arg Arg Leu Ser Asp Asn Ser Gln Trp Ile Gln Val Ser Leu 340 345 350 Val Phe Gln Thr Leu Gln Gln Met Arg Asp Lys Thr Pro Leu Ser Leu 355 360 365 Asn Thr Pro Pro Gly Glu Val Lys Leu Thr Leu Ala Gly Cys Glu Glu 370 375 380 Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly Phe Thr Gln Ile Val 385 390 395 400 Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu 405 410 <210> 4 <211> 1230 <212> DNA <213> Artificial Sequence <220> <223> EPM1(A109E) NT <400> 4 cagagtgagc cggagctgaa gctggaaagt gtggtgattg tcagtcgtca tggtgtgcgt 60 gctccaacca aggccacgca actgatgcag gatgtcaccc cagacgcatg gccaacctgg 120 ccggtaaaac tgggttggct gacaccgcgc ggtggtgagc taatcgccta tctcggacat 180 taccaacgcc agcgtctggt agccgacgga ttgctggcga aaaagggctg cccgcagtct 240 ggtcaggtcg cgattattgc tgatgtcgac gagcgtaccc gtaaaacagg cgaagccttc 300 gccgccgggc tggcacctga ctgtgaaata accgtacata cccaggcaga tacgtccagt 360 cccgatccgt tatttaatcc tctaaaaact ggcgtttgcc aactggataa cgcgaacgtg 420 actgacgcga tcctcagcag ggcaggaggg tcaattgctg actttaccgg gcatcggcaa 480 acggcgtttc gcgaactgga acgggtgctt aattttccgc aatcaaactt gtgccttaaa 540 cgtgagaaac aggacgaaag ctgttcatta acgcaggcat taccatcgga actcaaggtg 600 agcgccgaca atgtctcatt aaccggtgcg gtaagcctcg catcaatgct gacggagata 660 tttctcctgc aacaagcaca gggaatgccg gagccggggt ggggaaggat caccgattca 720 caccagtgga acaccttgct aagtttgcat aacgcgcaat tttatttgct acaacgcacg 780 ccagaggttg cccgcagccg cgccaccccg ttattagatt tgatcaagac agcgttgacg 840 ccccatccac cgcaaaaaca ggcgtatggt gtgacattac ccacttcagt gctgtttatc 900 gccggacacg atactaatct ggcaaatctc ggcggcgcac tggagctcaa ctggacgctt 960 cccggtcagc cggataacac gccgccaggt ggtgaactgg tgtttgaacg ctggcgtcgg 1020 ctaagcgata acagccagtg gattcaggtt tcgctggtct tccagacttt acagcagatg 1080 cgtgataaaa cgccgctgtc attaaatacg ccgcccggag aggtgaaact gaccctggca 1140 ggatgtgaag agcgaaatgc gcagggcatg tgttcgttgg caggttttac gcaaatcgtg 1200 aatgaagcac gcataccggc gtgcagtttg 1230 <210> 5 <211> 410 <212> PRT <213> Artificial Sequence <220> <223> EPM2(Q134E) AA <400> 5 Gln Ser Glu Pro Glu Leu Lys Leu Glu Ser Val Val Ile Val Ser Arg 1 5 10 15 His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln Leu Met Gln Asp Val 20 25 30 Thr Pro Asp Ala Trp Pro Thr Trp Pro Val Lys Leu Gly Trp Leu Thr 35 40 45 Pro Arg Gly Gly Glu Leu Ile Ala Tyr Leu Gly His Tyr Gln Arg Gln 50 55 60 Arg Leu Val Ala Asp Gly Leu Leu Ala Lys Lys Gly Cys Pro Gln Ser 65 70 75 80 Gly Gln Val Ala Ile Ile Ala Asp Val Asp Glu Arg Thr Arg Lys Thr 85 90 95 Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Asp Cys Ala Ile Thr Val 100 105 110 His Thr Gln Ala Asp Thr Ser Ser Pro Asp Pro Leu Phe Asn Pro Leu 115 120 125 Lys Thr Gly Val Cys Glu Leu Asp Asn Ala Asn Val Thr Asp Ala Ile 130 135 140 Leu Ser Arg Ala Gly Gly Ser Ile Ala Asp Phe Thr Gly His Arg Gln 145 150 155 160 Thr Ala Phe Arg Glu Leu Glu Arg Val Leu Asn Phe Pro Gln Ser Asn 165 170 175 Leu Cys Leu Lys Arg Glu Lys Gln Asp Glu Ser Cys Ser Leu Thr Gln 180 185 190 Ala Leu Pro Ser Glu Leu Lys Val Ser Ala Asp Asn Val Ser Leu Thr 195 200 205 Gly Ala Val Ser Leu Ala Ser Met Leu Thr Glu Ile Phe Leu Leu Gln 210 215 220 Gln Ala Gln Gly Met Pro Glu Pro Gly Trp Gly Arg Ile Thr Asp Ser 225 230 235 240 His Gln Trp Asn Thr Leu Leu Ser Leu His Asn Ala Gln Phe Tyr Leu 245 250 255 Leu Gln Arg Thr Pro Glu Val Ala Arg Ser Arg Ala Thr Pro Leu Leu 260 265 270 Asp Leu Ile Lys Thr Ala Leu Thr Pro His Pro Pro Gln Lys Gln Ala 275 280 285 Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe Ile Ala Gly His Asp 290 295 300 Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Glu Leu Asn Trp Thr Leu 305 310 315 320 Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu Leu Val Phe Glu 325 330 335 Arg Trp Arg Arg Leu Ser Asp Asn Ser Gln Trp Ile Gln Val Ser Leu 340 345 350 Val Phe Gln Thr Leu Gln Gln Met Arg Asp Lys Thr Pro Leu Ser Leu 355 360 365 Asn Thr Pro Pro Gly Glu Val Lys Leu Thr Leu Ala Gly Cys Glu Glu 370 375 380 Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly Phe Thr Gln Ile Val 385 390 395 400 Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu 405 410 <210> 6 <211> 1230 <212> DNA <213> Artificial Sequence <220> <223> EPM2(Q134E) NT <400> 6 cagagtgagc cggagctgaa gctggaaagt gtggtgattg tcagtcgtca tggtgtgcgt 60 gctccaacca aggccacgca actgatgcag gatgtcaccc cagacgcatg gccaacctgg 120 ccggtaaaac tgggttggct gacaccgcgc ggtggtgagc taatcgccta tctcggacat 180 taccaacgcc agcgtctggt agccgacgga ttgctggcga aaaagggctg cccgcagtct 240 ggtcaggtcg cgattattgc tgatgtcgac gagcgtaccc gtaaaacagg cgaagccttc 300 gccgccgggc tggcacctga ctgtgcaata accgtacata cccaggcaga tacgtccagt 360 cccgatccgt tatttaatcc tctaaaaact ggcgtttgcg aactggataa cgcgaacgtg 420 actgacgcga tcctcagcag ggcaggaggg tcaattgctg actttaccgg gcatcggcaa 480 acggcgtttc gcgaactgga acgggtgctt aattttccgc aatcaaactt gtgccttaaa 540 cgtgagaaac aggacgaaag ctgttcatta acgcaggcat taccatcgga actcaaggtg 600 agcgccgaca atgtctcatt aaccggtgcg gtaagcctcg catcaatgct gacggagata 660 tttctcctgc aacaagcaca gggaatgccg gagccggggt ggggaaggat caccgattca 720 caccagtgga acaccttgct aagtttgcat aacgcgcaat tttatttgct acaacgcacg 780 ccagaggttg cccgcagccg cgccaccccg ttattagatt tgatcaagac agcgttgacg 840 ccccatccac cgcaaaaaca ggcgtatggt gtgacattac ccacttcagt gctgtttatc 900 gccggacacg atactaatct ggcaaatctc ggcggcgcac tggagctcaa ctggacgctt 960 cccggtcagc cggataacac gccgccaggt ggtgaactgg tgtttgaacg ctggcgtcgg 1020 ctaagcgata acagccagtg gattcaggtt tcgctggtct tccagacttt acagcagatg 1080 cgtgataaaa cgccgctgtc attaaatacg ccgcccggag aggtgaaact gaccctggca 1140 ggatgtgaag agcgaaatgc gcagggcatg tgttcgttgg caggttttac gcaaatcgtg 1200 aatgaagcac gcataccggc gtgcagtttg 1230 <210> 7 <211> 410 <212> PRT <213> Artificial Sequence <220> <223> EPM3(N137H) AA <400> 7 Gln Ser Glu Pro Glu Leu Lys Leu Glu Ser Val Val Ile Val Ser Arg 1 5 10 15 His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln Leu Met Gln Asp Val 20 25 30 Thr Pro Asp Ala Trp Pro Thr Trp Pro Val Lys Leu Gly Trp Leu Thr 35 40 45 Pro Arg Gly Gly Glu Leu Ile Ala Tyr Leu Gly His Tyr Gln Arg Gln 50 55 60 Arg Leu Val Ala Asp Gly Leu Leu Ala Lys Lys Gly Cys Pro Gln Ser 65 70 75 80 Gly Gln Val Ala Ile Ile Ala Asp Val Asp Glu Arg Thr Arg Lys Thr 85 90 95 Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Asp Cys Ala Ile Thr Val 100 105 110 His Thr Gln Ala Asp Thr Ser Ser Pro Asp Pro Leu Phe Asn Pro Leu 115 120 125 Lys Thr Gly Val Cys Gln Leu Asp His Ala Asn Val Thr Asp Ala Ile 130 135 140 Leu Ser Arg Ala Gly Gly Ser Ile Ala Asp Phe Thr Gly His Arg Gln 145 150 155 160 Thr Ala Phe Arg Glu Leu Glu Arg Val Leu Asn Phe Pro Gln Ser Asn 165 170 175 Leu Cys Leu Lys Arg Glu Lys Gln Asp Glu Ser Cys Ser Leu Thr Gln 180 185 190 Ala Leu Pro Ser Glu Leu Lys Val Ser Ala Asp Asn Val Ser Leu Thr 195 200 205 Gly Ala Val Ser Leu Ala Ser Met Leu Thr Glu Ile Phe Leu Leu Gln 210 215 220 Gln Ala Gln Gly Met Pro Glu Pro Gly Trp Gly Arg Ile Thr Asp Ser 225 230 235 240 His Gln Trp Asn Thr Leu Leu Ser Leu His Asn Ala Gln Phe Tyr Leu 245 250 255 Leu Gln Arg Thr Pro Glu Val Ala Arg Ser Arg Ala Thr Pro Leu Leu 260 265 270 Asp Leu Ile Lys Thr Ala Leu Thr Pro His Pro Pro Gln Lys Gln Ala 275 280 285 Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe Ile Ala Gly His Asp 290 295 300 Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Glu Leu Asn Trp Thr Leu 305 310 315 320 Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu Leu Val Phe Glu 325 330 335 Arg Trp Arg Arg Leu Ser Asp Asn Ser Gln Trp Ile Gln Val Ser Leu 340 345 350 Val Phe Gln Thr Leu Gln Gln Met Arg Asp Lys Thr Pro Leu Ser Leu 355 360 365 Asn Thr Pro Pro Gly Glu Val Lys Leu Thr Leu Ala Gly Cys Glu Glu 370 375 380 Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly Phe Thr Gln Ile Val 385 390 395 400 Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu 405 410 <210> 8 <211> 1230 <212> DNA <213> Artificial Sequence <220> <223> EPM3(N137H) NT <400> 8 cagagtgagc cggagctgaa gctggaaagt gtggtgattg tcagtcgtca tggtgtgcgt 60 gctccaacca aggccacgca actgatgcag gatgtcaccc cagacgcatg gccaacctgg 120 ccggtaaaac tgggttggct gacaccgcgc ggtggtgagc taatcgccta tctcggacat 180 taccaacgcc agcgtctggt agccgacgga ttgctggcga aaaagggctg cccgcagtct 240 ggtcaggtcg cgattattgc tgatgtcgac gagcgtaccc gtaaaacagg cgaagccttc 300 gccgccgggc tggcacctga ctgtgcaata accgtacata cccaggcaga tacgtccagt 360 cccgatccgt tatttaatcc tctaaaaact ggcgtttgcc aactggatca tgcgaacgtg 420 actgacgcga tcctcagcag ggcaggaggg tcaattgctg actttaccgg gcatcggcaa 480 acggcgtttc gcgaactgga acgggtgctt aattttccgc aatcaaactt gtgccttaaa 540 cgtgagaaac aggacgaaag ctgttcatta acgcaggcat taccatcgga actcaaggtg 600 agcgccgaca atgtctcatt aaccggtgcg gtaagcctcg catcaatgct gacggagata 660 tttctcctgc aacaagcaca gggaatgccg gagccggggt ggggaaggat caccgattca 720 caccagtgga acaccttgct aagtttgcat aacgcgcaat tttatttgct acaacgcacg 780 ccagaggttg cccgcagccg cgccaccccg ttattagatt tgatcaagac agcgttgacg 840 ccccatccac cgcaaaaaca ggcgtatggt gtgacattac ccacttcagt gctgtttatc 900 gccggacacg atactaatct ggcaaatctc ggcggcgcac tggagctcaa ctggacgctt 960 cccggtcagc cggataacac gccgccaggt ggtgaactgg tgtttgaacg ctggcgtcgg 1020 ctaagcgata acagccagtg gattcaggtt tcgctggtct tccagacttt acagcagatg 1080 cgtgataaaa cgccgctgtc attaaatacg ccgcccggag aggtgaaact gaccctggca 1140 ggatgtgaag agcgaaatgc gcagggcatg tgttcgttgg caggttttac gcaaatcgtg 1200 aatgaagcac gcataccggc gtgcagtttg 1230 <210> 9 <211> 410 <212> PRT <213> Artificial Sequence <220> <223> EPM4(R164S) AA <400> 9 Gln Ser Glu Pro Glu Leu Lys Leu Glu Ser Val Val Ile Val Ser Arg 1 5 10 15 His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln Leu Met Gln Asp Val 20 25 30 Thr Pro Asp Ala Trp Pro Thr Trp Pro Val Lys Leu Gly Trp Leu Thr 35 40 45 Pro Arg Gly Gly Glu Leu Ile Ala Tyr Leu Gly His Tyr Gln Arg Gln 50 55 60 Arg Leu Val Ala Asp Gly Leu Leu Ala Lys Lys Gly Cys Pro Gln Ser 65 70 75 80 Gly Gln Val Ala Ile Ile Ala Asp Val Asp Glu Arg Thr Arg Lys Thr 85 90 95 Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Asp Cys Ala Ile Thr Val 100 105 110 His Thr Gln Ala Asp Thr Ser Ser Pro Asp Pro Leu Phe Asn Pro Leu 115 120 125 Lys Thr Gly Val Cys Gln Leu Asp Asn Ala Asn Val Thr Asp Ala Ile 130 135 140 Leu Ser Arg Ala Gly Gly Ser Ile Ala Asp Phe Thr Gly His Arg Gln 145 150 155 160 Thr Ala Phe Ser Glu Leu Glu Arg Val Leu Asn Phe Pro Gln Ser Asn 165 170 175 Leu Cys Leu Lys Arg Glu Lys Gln Asp Glu Ser Cys Ser Leu Thr Gln 180 185 190 Ala Leu Pro Ser Glu Leu Lys Val Ser Ala Asp Asn Val Ser Leu Thr 195 200 205 Gly Ala Val Ser Leu Ala Ser Met Leu Thr Glu Ile Phe Leu Leu Gln 210 215 220 Gln Ala Gln Gly Met Pro Glu Pro Gly Trp Gly Arg Ile Thr Asp Ser 225 230 235 240 His Gln Trp Asn Thr Leu Leu Ser Leu His Asn Ala Gln Phe Tyr Leu 245 250 255 Leu Gln Arg Thr Pro Glu Val Ala Arg Ser Arg Ala Thr Pro Leu Leu 260 265 270 Asp Leu Ile Lys Thr Ala Leu Thr Pro His Pro Pro Gln Lys Gln Ala 275 280 285 Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe Ile Ala Gly His Asp 290 295 300 Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Glu Leu Asn Trp Thr Leu 305 310 315 320 Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu Leu Val Phe Glu 325 330 335 Arg Trp Arg Arg Leu Ser Asp Asn Ser Gln Trp Ile Gln Val Ser Leu 340 345 350 Val Phe Gln Thr Leu Gln Gln Met Arg Asp Lys Thr Pro Leu Ser Leu 355 360 365 Asn Thr Pro Pro Gly Glu Val Lys Leu Thr Leu Ala Gly Cys Glu Glu 370 375 380 Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly Phe Thr Gln Ile Val 385 390 395 400 Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu 405 410 <210> 10 <211> 1230 <212> DNA <213> Artificial Sequence <220> <223> EPM4(R164S) NT <400> 10 cagagtgagc cggagctgaa gctggaaagt gtggtgattg tcagtcgtca tggtgtgcgt 60 gctccaacca aggccacgca actgatgcag gatgtcaccc cagacgcatg gccaacctgg 120 ccggtaaaac tgggttggct gacaccgcgc ggtggtgagc taatcgccta tctcggacat 180 taccaacgcc agcgtctggt agccgacgga ttgctggcga aaaagggctg cccgcagtct 240 ggtcaggtcg cgattattgc tgatgtcgac gagcgtaccc gtaaaacagg cgaagccttc 300 gccgccgggc tggcacctga ctgtgcaata accgtacata cccaggcaga tacgtccagt 360 cccgatccgt tatttaatcc tctaaaaact ggcgtttgcc aactggataa cgcgaacgtg 420 actgacgcga tcctcagcag ggcaggaggg tcaattgctg actttaccgg gcatcggcaa 480 acggcgttta gcgaactgga acgggtgctt aattttccgc aatcaaactt gtgccttaaa 540 cgtgagaaac aggacgaaag ctgttcatta acgcaggcat taccatcgga actcaaggtg 600 agcgccgaca atgtctcatt aaccggtgcg gtaagcctcg catcaatgct gacggagata 660 tttctcctgc aacaagcaca gggaatgccg gagccggggt ggggaaggat caccgattca 720 caccagtgga acaccttgct aagtttgcat aacgcgcaat tttatttgct acaacgcacg 780 ccagaggttg cccgcagccg cgccaccccg ttattagatt tgatcaagac agcgttgacg 840 ccccatccac cgcaaaaaca ggcgtatggt gtgacattac ccacttcagt gctgtttatc 900 gccggacacg atactaatct ggcaaatctc ggcggcgcac tggagctcaa ctggacgctt 960 cccggtcagc cggataacac gccgccaggt ggtgaactgg tgtttgaacg ctggcgtcgg 1020 ctaagcgata acagccagtg gattcaggtt tcgctggtct tccagacttt acagcagatg 1080 cgtgataaaa cgccgctgtc attaaatacg ccgcccggag aggtgaaact gaccctggca 1140 ggatgtgaag agcgaaatgc gcagggcatg tgttcgttgg caggttttac gcaaatcgtg 1200 aatgaagcac gcataccggc gtgcagtttg 1230 <210> 11 <211> 410 <212> PRT <213> Artificial Sequence <220> <223> EPM08 Phy AA <400> 11 Gln Ser Glu Pro Glu Leu Gln Leu Glu Ser Val Val Ile Val Ser Arg 1 5 10 15 His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln Leu Met Gln Asp Val 20 25 30 Thr Pro Asp Pro Trp Pro Thr Trp Pro Val Lys Leu Gly Trp Leu Thr 35 40 45 Pro Arg Gly Ala Glu Leu Ile Lys Tyr Met Gly His Tyr Gln Arg Gln 50 55 60 Arg Leu Val Ala Gln Gly Leu Leu Ala Lys Lys Gly Cys Pro Ala Ser 65 70 75 80 Gly Gln Val Phe Ile Ile Ala Asp Val Asp Gln Arg Thr Arg Ala Thr 85 90 95 Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Gly Cys Ala Ile Thr Val 100 105 110 His Thr Gln Pro Asp Gly Ser Met Pro Asp Pro Leu Phe Asn Pro Leu 115 120 125 Lys Thr Gly Val Cys Lys Leu Asp Arg Ala Asn Val Thr Ala Ala Ile 130 135 140 Leu Ala Arg Ala Gly Gly Ser Ile Ala Arg Trp Thr Gln His Arg Gln 145 150 155 160 Pro Ala Phe Arg Glu Leu Glu Arg Val Leu Asn Phe Pro Gln Ser Asn 165 170 175 Leu Cys Gln Lys Arg Glu Lys Gln Asn Glu Ser Cys Ser Leu Thr Gln 180 185 190 Met Leu Pro Ser Glu Leu Lys Val Ser Ala Asp Asn Val Ser Leu Thr 195 200 205 Gly Ala Leu Ser Leu Ala Ser Met Leu Thr Glu Ile Phe Leu Leu Gln 210 215 220 Trp Ala Glu Gly Met Pro Gln Pro Gly Trp Gly Arg Ile Thr Asp Glu 225 230 235 240 His Gln Trp Arg Thr Leu Leu Ser Leu His Asn Ala Gln Phe Tyr Leu 245 250 255 Leu Gln Arg Thr Pro Glu Val Ala Arg Arg Arg Ala Thr Pro Leu Leu 260 265 270 Asp Leu Ile Leu Thr Ala Leu Thr Pro His Pro Pro Gln Lys Gln Ala 275 280 285 Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe Ile Ala Gly His Asp 290 295 300 Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Gly Leu Asn Trp Thr Leu 305 310 315 320 Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu Leu Val Phe Glu 325 330 335 Arg Trp Arg Asp Arg Lys Asp Asn Ser Gln Trp Ile Arg Val Ser Phe 340 345 350 Val Phe Gln Thr Leu Asp Gln Met Arg Asp Lys Thr Pro Leu Ser Leu 355 360 365 Asn His Pro Pro Gly Glu Val Thr Leu Thr Leu Ala Gly Cys Glu Glu 370 375 380 Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly Phe Gln Gln Ile Val 385 390 395 400 Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu 405 410 <210> 12 <211> 1233 <212> DNA <213> Artificial Sequence <220> <223> EPM08 Phy NT <400> 12 caaagtgagc cagagctaca gcttgagagt gtggtcatcg tttctcgtca tggtgtccgt 60 gcaccaacaa aggctaccca gttgatgcag gacgtgaccc cagatccttg gccaacatgg 120 cctgtaaagc tgggttggct gacacctaga ggcgccgagc tgataaaata catgggtcat 180 tatcagcgtc agagactagt agctcaggga ttgctagcga aaaaaggctg ccccgcttct 240 ggccaagtgt tcattatcgc tgacgttgat caaagaacga gagccacggg tgaagccttt 300 gctgccggct tggctcccgg ctgcgcaatt acggtccaca cgcagcccga cggcagtatg 360 cccgatcccc tttttaatcc attaaagacg ggcgtgtgta aattagatcg tgccaacgtt 420 actgctgcaa ttttagcacg tgctggaggc tctattgcca gatggacgca acataggcaa 480 cccgccttta gagaattaga aagggtgttg aactttcctc agagtaattt gtgccaaaag 540 cgtgagaaac agaacgagag ctgttcctta acgcaaatgt taccaagtga gctaaaagta 600 tcagccgaca acgtctcact gactggtgca ctatcattag ccagtatgct aacagaaata 660 tttctacttc aatgggctga gggtatgcca cagccaggtt ggggcagaat caccgatgaa 720 caccaatggc gtacccttct gtcccttcat aatgctcagt tctatctgtt gcaaagaact 780 ccagaggtag ctagacgtcg tgctacaccc cttctggatt tgattttaac ggcactgaca 840 cctcatcctc cccaaaagca ggcttacggt gtaactttgc caacgtctgt cttgtttata 900 gcaggacacg acacgaactt ggccaatctt ggcggtgccc ttggactaaa ttggacgctg 960 ccaggtcagc ctgacaacac acccccaggc ggcgagttag tattcgagag atggagagac 1020 cgtaaagata actcccagtg gatcagggtt tcctttgttt tccagacgct agaccaaatg 1080 cgtgataaga cgcctctaag tcttaatcac cctccaggcg aagtcactct aacactagca 1140 ggatgtgaag aacgtaatgc acaaggtatg tgtagtctag caggttttca gcaaatcgtc 1200 aatgaagcaa gaatcccagc ctgctcactt taa 1233 <210> 13 <211> 410 <212> PRT <213> Artificial Sequence <220> <223> EPM08 Phy A109E AA <400> 13 Gln Ser Glu Pro Glu Leu Gln Leu Glu Ser Val Val Ile Val Ser Arg 1 5 10 15 His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln Leu Met Gln Asp Val 20 25 30 Thr Pro Asp Pro Trp Pro Thr Trp Pro Val Lys Leu Gly Trp Leu Thr 35 40 45 Pro Arg Gly Ala Glu Leu Ile Lys Tyr Met Gly His Tyr Gln Arg Gln 50 55 60 Arg Leu Val Ala Gln Gly Leu Leu Ala Lys Lys Gly Cys Pro Ala Ser 65 70 75 80 Gly Gln Val Phe Ile Ile Ala Asp Val Asp Gln Arg Thr Arg Ala Thr 85 90 95 Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Gly Cys Glu Ile Thr Val 100 105 110 His Thr Gln Pro Asp Gly Ser Met Pro Asp Pro Leu Phe Asn Pro Leu 115 120 125 Lys Thr Gly Val Cys Lys Leu Asp Arg Ala Asn Val Thr Ala Ala Ile 130 135 140 Leu Ala Arg Ala Gly Gly Ser Ile Ala Arg Trp Thr Gln His Arg Gln 145 150 155 160 Pro Ala Phe Arg Glu Leu Glu Arg Val Leu Asn Phe Pro Gln Ser Asn 165 170 175 Leu Cys Gln Lys Arg Glu Lys Gln Asn Glu Ser Cys Ser Leu Thr Gln 180 185 190 Met Leu Pro Ser Glu Leu Lys Val Ser Ala Asp Asn Val Ser Leu Thr 195 200 205 Gly Ala Leu Ser Leu Ala Ser Met Leu Thr Glu Ile Phe Leu Leu Gln 210 215 220 Trp Ala Glu Gly Met Pro Gln Pro Gly Trp Gly Arg Ile Thr Asp Glu 225 230 235 240 His Gln Trp Arg Thr Leu Leu Ser Leu His Asn Ala Gln Phe Tyr Leu 245 250 255 Leu Gln Arg Thr Pro Glu Val Ala Arg Arg Arg Ala Thr Pro Leu Leu 260 265 270 Asp Leu Ile Leu Thr Ala Leu Thr Pro His Pro Pro Gln Lys Gln Ala 275 280 285 Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe Ile Ala Gly His Asp 290 295 300 Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Gly Leu Asn Trp Thr Leu 305 310 315 320 Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu Leu Val Phe Glu 325 330 335 Arg Trp Arg Asp Arg Lys Asp Asn Ser Gln Trp Ile Arg Val Ser Phe 340 345 350 Val Phe Gln Thr Leu Asp Gln Met Arg Asp Lys Thr Pro Leu Ser Leu 355 360 365 Asn His Pro Pro Gly Glu Val Thr Leu Thr Leu Ala Gly Cys Glu Glu 370 375 380 Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly Phe Gln Gln Ile Val 385 390 395 400 Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu 405 410 <210> 14 <211> 1233 <212> DNA <213> Artificial Sequence <220> <223> EPM08 Phy A109E NT <400> 14 caaagtgagc cagagctaca gcttgagagt gtggtcatcg tttctcgtca tggtgtccgt 60 gcaccaacaa aggctaccca gttgatgcag gacgtgaccc cagatccttg gccaacatgg 120 cctgtaaagc tgggttggct gacacctaga ggcgccgagc tgataaaata catgggtcat 180 tatcagcgtc agagactagt agctcaggga ttgctagcga aaaaaggctg ccccgcttct 240 ggccaagtgt tcattatcgc tgacgttgat caaagaacga gagccacggg tgaagccttt 300 gctgccggct tggctcccgg ctgcgaaatt acggtccaca cgcagcccga cggcagtatg 360 cccgatcccc tttttaatcc attaaagacg ggcgtgtgta aattagatcg tgccaacgtt 420 actgctgcaa ttttagcacg tgctggaggc tctattgcca gatggacgca acataggcaa 480 cccgccttta gagaattaga aagggtgttg aactttcctc agagtaattt gtgccaaaag 540 cgtgagaaac agaacgagag ctgttcctta acgcaaatgt taccaagtga gctaaaagta 600 tcagccgaca acgtctcact gactggtgca ctatcattag ccagtatgct aacagaaata 660 tttctacttc aatgggctga gggtatgcca cagccaggtt ggggcagaat caccgatgaa 720 caccaatggc gtacccttct gtcccttcat aatgctcagt tctatctgtt gcaaagaact 780 ccagaggtag ctagacgtcg tgctacaccc cttctggatt tgattttaac ggcactgaca 840 cctcatcctc cccaaaagca ggcttacggt gtaactttgc caacgtctgt cttgtttata 900 gcaggacacg acacgaactt ggccaatctt ggcggtgccc ttggactaaa ttggacgctg 960 ccaggtcagc ctgacaacac acccccaggc ggcgagttag tattcgagag atggagagac 1020 cgtaaagata actcccagtg gatcagggtt tcctttgttt tccagacgct agaccaaatg 1080 cgtgataaga cgcctctaag tcttaatcac cctccaggcg aagtcactct aacactagca 1140 ggatgtgaag aacgtaatgc acaaggtatg tgtagtctag caggttttca gcaaatcgtc 1200 aatgaagcaa gaatcccagc ctgctcactt taa 1233 <210> 15 <211> 410 <212> PRT <213> Artificial Sequence <220> <223> EPM08 Phy R137H AA <400> 15 Gln Ser Glu Pro Glu Leu Gln Leu Glu Ser Val Val Ile Val Ser Arg 1 5 10 15 His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln Leu Met Gln Asp Val 20 25 30 Thr Pro Asp Pro Trp Pro Thr Trp Pro Val Lys Leu Gly Trp Leu Thr 35 40 45 Pro Arg Gly Ala Glu Leu Ile Lys Tyr Met Gly His Tyr Gln Arg Gln 50 55 60 Arg Leu Val Ala Gln Gly Leu Leu Ala Lys Lys Gly Cys Pro Ala Ser 65 70 75 80 Gly Gln Val Phe Ile Ile Ala Asp Val Asp Gln Arg Thr Arg Ala Thr 85 90 95 Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Gly Cys Ala Ile Thr Val 100 105 110 His Thr Gln Pro Asp Gly Ser Met Pro Asp Pro Leu Phe Asn Pro Leu 115 120 125 Lys Thr Gly Val Cys Lys Leu Asp His Ala Asn Val Thr Ala Ala Ile 130 135 140 Leu Ala Arg Ala Gly Gly Ser Ile Ala Arg Trp Thr Gln His Arg Gln 145 150 155 160 Pro Ala Phe Arg Glu Leu Glu Arg Val Leu Asn Phe Pro Gln Ser Asn 165 170 175 Leu Cys Gln Lys Arg Glu Lys Gln Asn Glu Ser Cys Ser Leu Thr Gln 180 185 190 Met Leu Pro Ser Glu Leu Lys Val Ser Ala Asp Asn Val Ser Leu Thr 195 200 205 Gly Ala Leu Ser Leu Ala Ser Met Leu Thr Glu Ile Phe Leu Leu Gln 210 215 220 Trp Ala Glu Gly Met Pro Gln Pro Gly Trp Gly Arg Ile Thr Asp Glu 225 230 235 240 His Gln Trp Arg Thr Leu Leu Ser Leu His Asn Ala Gln Phe Tyr Leu 245 250 255 Leu Gln Arg Thr Pro Glu Val Ala Arg Arg Arg Ala Thr Pro Leu Leu 260 265 270 Asp Leu Ile Leu Thr Ala Leu Thr Pro His Pro Pro Gln Lys Gln Ala 275 280 285 Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe Ile Ala Gly His Asp 290 295 300 Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Gly Leu Asn Trp Thr Leu 305 310 315 320 Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu Leu Val Phe Glu 325 330 335 Arg Trp Arg Asp Arg Lys Asp Asn Ser Gln Trp Ile Arg Val Ser Phe 340 345 350 Val Phe Gln Thr Leu Asp Gln Met Arg Asp Lys Thr Pro Leu Ser Leu 355 360 365 Asn His Pro Pro Gly Glu Val Thr Leu Thr Leu Ala Gly Cys Glu Glu 370 375 380 Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly Phe Gln Gln Ile Val 385 390 395 400 Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu 405 410 <210> 16 <211> 1233 <212> DNA <213> Artificial Sequence <220> <223> EPM08 Phy R137H NT <400> 16 caaagtgagc cagagctaca gcttgagagt gtggtcatcg tttctcgtca tggtgtccgt 60 gcaccaacaa aggctaccca gttgatgcag gacgtgaccc cagatccttg gccaacatgg 120 cctgtaaagc tgggttggct gacacctaga ggcgccgagc tgataaaata catgggtcat 180 tatcagcgtc agagactagt agctcaggga ttgctagcga aaaaaggctg ccccgcttct 240 ggccaagtgt tcattatcgc tgacgttgat caaagaacga gagccacggg tgaagccttt 300 gctgccggct tggctcccgg ctgcgcaatt acggtccaca cgcagcccga cggcagtatg 360 cccgatcccc tttttaatcc attaaagacg ggcgtgtgta aattagatca tgccaacgtt 420 actgctgcaa ttttagcacg tgctggaggc tctattgcca gatggacgca acataggcaa 480 cccgccttta gagaattaga aagggtgttg aactttcctc agagtaattt gtgccaaaag 540 cgtgagaaac agaacgagag ctgttcctta acgcaaatgt taccaagtga gctaaaagta 600 tcagccgaca acgtctcact gactggtgca ctatcattag ccagtatgct aacagaaata 660 tttctacttc aatgggctga gggtatgcca cagccaggtt ggggcagaat caccgatgaa 720 caccaatggc gtacccttct gtcccttcat aatgctcagt tctatctgtt gcaaagaact 780 ccagaggtag ctagacgtcg tgctacaccc cttctggatt tgattttaac ggcactgaca 840 cctcatcctc cccaaaagca ggcttacggt gtaactttgc caacgtctgt cttgtttata 900 gcaggacacg acacgaactt ggccaatctt ggcggtgccc ttggactaaa ttggacgctg 960 ccaggtcagc ctgacaacac acccccaggc ggcgagttag tattcgagag atggagagac 1020 cgtaaagata actcccagtg gatcagggtt tcctttgttt tccagacgct agaccaaatg 1080 cgtgataaga cgcctctaag tcttaatcac cctccaggcg aagtcactct aacactagca 1140 ggatgtgaag aacgtaatgc acaaggtatg tgtagtctag caggttttca gcaaatcgtc 1200 aatgaagcaa gaatcccagc ctgctcactt taa 1233 <210> 17 <211> 410 <212> PRT <213> Artificial Sequence <220> <223> EPM08 Phy EPM08M2(K134E+R164S) AA <400> 17 Gln Ser Glu Pro Glu Leu Gln Leu Glu Ser Val Val Ile Val Ser Arg 1 5 10 15 His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln Leu Met Gln Asp Val 20 25 30 Thr Pro Asp Pro Trp Pro Thr Trp Pro Val Lys Leu Gly Trp Leu Thr 35 40 45 Pro Arg Gly Ala Glu Leu Ile Lys Tyr Met Gly His Tyr Gln Arg Gln 50 55 60 Arg Leu Val Ala Gln Gly Leu Leu Ala Lys Lys Gly Cys Pro Ala Ser 65 70 75 80 Gly Gln Val Phe Ile Ile Ala Asp Val Asp Gln Arg Thr Arg Ala Thr 85 90 95 Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Gly Cys Ala Ile Thr Val 100 105 110 His Thr Gln Pro Asp Gly Ser Met Pro Asp Pro Leu Phe Asn Pro Leu 115 120 125 Lys Thr Gly Val Cys Glu Leu Asp Arg Ala Asn Val Thr Ala Ala Ile 130 135 140 Leu Ala Arg Ala Gly Gly Ser Ile Ala Arg Trp Thr Gln His Arg Gln 145 150 155 160 Pro Ala Phe Ser Glu Leu Glu Arg Val Leu Asn Phe Pro Gln Ser Asn 165 170 175 Leu Cys Gln Lys Arg Glu Lys Gln Asn Glu Ser Cys Ser Leu Thr Gln 180 185 190 Met Leu Pro Ser Glu Leu Lys Val Ser Ala Asp Asn Val Ser Leu Thr 195 200 205 Gly Ala Leu Ser Leu Ala Ser Met Leu Thr Glu Ile Phe Leu Leu Gln 210 215 220 Trp Ala Glu Gly Met Pro Gln Pro Gly Trp Gly Arg Ile Thr Asp Glu 225 230 235 240 His Gln Trp Arg Thr Leu Leu Ser Leu His Asn Ala Gln Phe Tyr Leu 245 250 255 Leu Gln Arg Thr Pro Glu Val Ala Arg Arg Arg Ala Thr Pro Leu Leu 260 265 270 Asp Leu Ile Leu Thr Ala Leu Thr Pro His Pro Pro Gln Lys Gln Ala 275 280 285 Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe Ile Ala Gly His Asp 290 295 300 Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Gly Leu Asn Trp Thr Leu 305 310 315 320 Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu Leu Val Phe Glu 325 330 335 Arg Trp Arg Asp Arg Lys Asp Asn Ser Gln Trp Ile Arg Val Ser Phe 340 345 350 Val Phe Gln Thr Leu Asp Gln Met Arg Asp Lys Thr Pro Leu Ser Leu 355 360 365 Asn His Pro Pro Gly Glu Val Thr Leu Thr Leu Ala Gly Cys Glu Glu 370 375 380 Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly Phe Gln Gln Ile Val 385 390 395 400 Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu 405 410 <210> 18 <211> 1233 <212> DNA <213> Artificial Sequence <220> <223> EPM08 Phy EPM08M2(K134E+R164S) NT <400> 18 caaagtgagc cagagctaca gcttgagagt gtggtcatcg tttctcgtca tggtgtccgt 60 gcaccaacaa aggctaccca gttgatgcag gacgtgaccc cagatccttg gccaacatgg 120 cctgtaaagc tgggttggct gacacctaga ggcgccgagc tgataaaata catgggtcat 180 tatcagcgtc agagactagt agctcaggga ttgctagcga aaaaaggctg ccccgcttct 240 ggccaagtgt tcattatcgc tgacgttgat caaagaacga gagccacggg tgaagccttt 300 gctgccggct tggctcccgg ctgcgcaatt acggtccaca cgcagcccga cggcagtatg 360 cccgatcccc tttttaatcc attaaagacg ggcgtgtgtg aattagatcg tgccaacgtt 420 actgctgcaa ttttagcacg tgctggaggc tctattgcca gatggacgca acataggcaa 480 cccgccttta gcgaattaga aagggtgttg aactttcctc agagtaattt gtgccaaaag 540 cgtgagaaac agaacgagag ctgttcctta acgcaaatgt taccaagtga gctaaaagta 600 tcagccgaca acgtctcact gactggtgca ctatcattag ccagtatgct aacagaaata 660 tttctacttc aatgggctga gggtatgcca cagccaggtt ggggcagaat caccgatgaa 720 caccaatggc gtacccttct gtcccttcat aatgctcagt tctatctgtt gcaaagaact 780 ccagaggtag ctagacgtcg tgctacaccc cttctggatt tgattttaac ggcactgaca 840 cctcatcctc cccaaaagca ggcttacggt gtaactttgc caacgtctgt cttgtttata 900 gcaggacacg acacgaactt ggccaatctt ggcggtgccc ttggactaaa ttggacgctg 960 ccaggtcagc ctgacaacac acccccaggc ggcgagttag tattcgagag atggagagac 1020 cgtaaagata actcccagtg gatcagggtt tcctttgttt tccagacgct agaccaaatg 1080 cgtgataaga cgcctctaag tcttaatcac cctccaggcg aagtcactct aacactagca 1140 ggatgtgaag aacgtaatgc acaaggtatg tgtagtctag caggttttca gcaaatcgtc 1200 aatgaagcaa gaatcccagc ctgctcactt taa 1233 <210> 19 <211> 410 <212> PRT <213> Artificial Sequence <220> <223> EPM08 Phy EPM08M4(A109E+K134E+R137H+R164S) AA <400> 19 Gln Ser Glu Pro Glu Leu Gln Leu Glu Ser Val Val Ile Val Ser Arg 1 5 10 15 His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln Leu Met Gln Asp Val 20 25 30 Thr Pro Asp Pro Trp Pro Thr Trp Pro Val Lys Leu Gly Trp Leu Thr 35 40 45 Pro Arg Gly Ala Glu Leu Ile Lys Tyr Met Gly His Tyr Gln Arg Gln 50 55 60 Arg Leu Val Ala Gln Gly Leu Leu Ala Lys Lys Gly Cys Pro Ala Ser 65 70 75 80 Gly Gln Val Phe Ile Ile Ala Asp Val Asp Gln Arg Thr Arg Ala Thr 85 90 95 Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Gly Cys Glu Ile Thr Val 100 105 110 His Thr Gln Pro Asp Gly Ser Met Pro Asp Pro Leu Phe Asn Pro Leu 115 120 125 Lys Thr Gly Val Cys Glu Leu Asp His Ala Asn Val Thr Ala Ala Ile 130 135 140 Leu Ala Arg Ala Gly Gly Ser Ile Ala Arg Trp Thr Gln His Arg Gln 145 150 155 160 Pro Ala Phe Ser Glu Leu Glu Arg Val Leu Asn Phe Pro Gln Ser Asn 165 170 175 Leu Cys Gln Lys Arg Glu Lys Gln Asn Glu Ser Cys Ser Leu Thr Gln 180 185 190 Met Leu Pro Ser Glu Leu Lys Val Ser Ala Asp Asn Val Ser Leu Thr 195 200 205 Gly Ala Leu Ser Leu Ala Ser Met Leu Thr Glu Ile Phe Leu Leu Gln 210 215 220 Trp Ala Glu Gly Met Pro Gln Pro Gly Trp Gly Arg Ile Thr Asp Glu 225 230 235 240 His Gln Trp Arg Thr Leu Leu Ser Leu His Asn Ala Gln Phe Tyr Leu 245 250 255 Leu Gln Arg Thr Pro Glu Val Ala Arg Arg Arg Ala Thr Pro Leu Leu 260 265 270 Asp Leu Ile Leu Thr Ala Leu Thr Pro His Pro Pro Gln Lys Gln Ala 275 280 285 Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe Ile Ala Gly His Asp 290 295 300 Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Gly Leu Asn Trp Thr Leu 305 310 315 320 Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu Leu Val Phe Glu 325 330 335 Arg Trp Arg Asp Arg Lys Asp Asn Ser Gln Trp Ile Arg Val Ser Phe 340 345 350 Val Phe Gln Thr Leu Asp Gln Met Arg Asp Lys Thr Pro Leu Ser Leu 355 360 365 Asn His Pro Pro Gly Glu Val Thr Leu Thr Leu Ala Gly Cys Glu Glu 370 375 380 Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly Phe Gln Gln Ile Val 385 390 395 400 Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu 405 410 <210> 20 <211> 1233 <212> DNA <213> Artificial Sequence <220> <223> EPM08 Phy EPM08M4(A109E+K134E+R137H+R164S) NT <400> 20 caaagtgagc cagagctaca gcttgagagt gtggtcatcg tttctcgtca tggtgtccgt 60 gcaccaacaa aggctaccca gttgatgcag gacgtgaccc cagatccttg gccaacatgg 120 cctgtaaagc tgggttggct gacacctaga ggcgccgagc tgataaaata catgggtcat 180 tatcagcgtc agagactagt agctcaggga ttgctagcga aaaaaggctg ccccgcttct 240 ggccaagtgt tcattatcgc tgacgttgat caaagaacga gagccacggg tgaagccttt 300 gctgccggct tggctcccgg ctgcgaaatt acggtccaca cgcagcccga cggcagtatg 360 cccgatcccc tttttaatcc attaaagacg ggcgtgtgtg aattagatca tgccaacgtt 420 actgctgcaa ttttagcacg tgctggaggc tctattgcca gatggacgca acataggcaa 480 cccgccttta gcgaattaga aagggtgttg aactttcctc agagtaattt gtgccaaaag 540 cgtgagaaac agaacgagag ctgttcctta acgcaaatgt taccaagtga gctaaaagta 600 tcagccgaca acgtctcact gactggtgca ctatcattag ccagtatgct aacagaaata 660 tttctacttc aatgggctga gggtatgcca cagccaggtt ggggcagaat caccgatgaa 720 caccaatggc gtacccttct gtcccttcat aatgctcagt tctatctgtt gcaaagaact 780 ccagaggtag ctagacgtcg tgctacaccc cttctggatt tgattttaac ggcactgaca 840 cctcatcctc cccaaaagca ggcttacggt gtaactttgc caacgtctgt cttgtttata 900 gcaggacacg acacgaactt ggccaatctt ggcggtgccc ttggactaaa ttggacgctg 960 ccaggtcagc ctgacaacac acccccaggc ggcgagttag tattcgagag atggagagac 1020 cgtaaagata actcccagtg gatcagggtt tcctttgttt tccagacgct agaccaaatg 1080 cgtgataaga cgcctctaag tcttaatcac cctccaggcg aagtcactct aacactagca 1140 ggatgtgaag aacgtaatgc acaaggtatg tgtagtctag caggttttca gcaaatcgtc 1200 aatgaagcaa gaatcccagc ctgctcactt taa 1233 <210> 21 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> A109E Forward <400> 21 ggctggcacc tgactgtgaa ataaccgtac atacccaggc agatacgtcc 50 <210> 22 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> A109E Reverse <400> 22 ttcacagtca ggtgccagcc cggcggcgaa ggcttcg 37 <210> 23 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Q134E Forward <400> 23 aaaaactggc gtttgcgaac tggataacgc gaacgtgact gacg 44 <210> 24 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Q134E Reverse <400> 24 ttcgcaaacg ccagttttta gaggattaaa taacggatcg ggactggacg 50 <210> 25 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> N137H Forward <400> 25 cgtttgccaa ctggatcacg cgaacgtgac tgacgcgatc c 41 <210> 26 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> N137H Reverse <400> 26 gtgatccagt tggcaaacgc cagtttttag aggattaaat aacggatcgg 50 <210> 27 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> R164S Forward <400> 27 ggcaaacggc gtttagcgaa ctggaacggg tgcttaattt tccg 44 <210> 28 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> R164S Reverse <400> 28 gctaaacgcc gtttgccgat gcccggtaaa gtcagcaatt gacc 44 <210> 29 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> A109E Forward <400> 29 ggctgcgaaa ttacggtcca cacgcagccc gacg 34 <210> 30 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> A109E Reverse <400> 30 gaccgtaatt tcgcagccgg gagccaagcc ggcag 35 <210> 31 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> K134E Forward <400> 31 agacgggcgt gtgtgaatta gatcgtgcca acgttactgc tgc 43 <210> 32 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> K134E Reverse <400> 32 ttcacacacg cccgtcttta atggattaaa aaggggatcg ggc 43 <210> 33 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> R164S Forward <400> 33 ggcaacccgc ctttagcgaa ttagaaaggg tgttgaactt tcctcag 47 <210> 34 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> R164S Reverse <400> 34 gctaaaggcg ggttgcctat gttgcgtcca tctggcaata gagc 44 <210> 35 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> R137H Forward <400> 35 tgtgtaaatt agatcatgcc aacgttactg ctgcaatttt agcacgtgc 49 <210> 36 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> R137H Reverse <400> 36 ggcatgatct aatttacaca cgcccgtctt taatggatta aaaagggg 48 <210> 37 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer_F <400> 37 agagaggctg aagctcaatc tgaattgcaa 30 <210> 38 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> primer_R <400> 38 aaggctacaa actcacaaag aacaagctgg aattctag 38 <110> CJ CheilJedang Corporation <120> Phytase Variant <130> KPA210391-KR <160> 38 <170> KoPatentIn 3.0 <210> 1 <211> 410 <212> PRT <213> Unknown <220> <223> EcPhy AA <400> 1 Gln Ser Glu Pro Glu Leu Lys Leu Glu Ser Val Val Ile Val Ser Arg 1 5 10 15 His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln Leu Met Gln Asp Val 20 25 30 Thr Pro Asp Ala Trp Pro Thr Trp Pro Val Lys Leu Gly Trp Leu Thr 35 40 45 Pro Arg Gly Gly Glu Leu Ile Ala Tyr Leu Gly His Tyr Gln Arg Gln 50 55 60 Arg Leu Val Ala Asp Gly Leu Leu Leu Ala Lys Lys Gly Cys Pro Gln Ser 65 70 75 80 Gly Gln Val Ala Ile Ile Ala Asp Val Asp Glu Arg Thr Arg Lys Thr 85 90 95 Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Asp Cys Ala Ile Thr Val 100 105 110 His Thr Gln Ala Asp Thr Ser Ser Pro Asp Pro Leu Phe Asn Pro Leu 115 120 125 Lys Thr Gly Val Cys Gln Leu Asp Asn Ala Asn Val Thr Asp Ala Ile 130 135 140 Leu Ser Arg Ala Gly Gly Ser Ile Ala Asp Phe Thr Gly His Arg Gln 145 150 155 160 Thr Ala Phe Arg Glu Leu Glu Arg Val Leu Asn Phe Pro Gln Ser Asn 165 170 175 Leu Cys Leu Lys Arg Glu Lys Gln Asp Glu Ser Cys Ser Leu Thr Gln 180 185 190 Ala Leu Pro Ser Glu Leu Lys Val Ser Ala Asp Asn Val Ser Leu Thr 195 200 205 Gly Ala Val Ser Leu Ala Ser Met Leu Thr Glu Ile Phe Leu Leu Gln 210 215 220 Gln Ala Gln Gly Met Pro Glu Pro Gly Trp Gly Arg Ile Thr Asp Ser 225 230 235 240 His Gln Trp Asn Thr Leu Leu Ser Leu His Asn Ala Gln Phe Tyr Leu 245 250 255 Leu Gln Arg Thr Pro Glu Val Ala Arg Ser Arg Ala Thr Pro Leu Leu 260 265 270 Asp Leu Ile Lys Thr Ala Leu Thr Pro His Pro Pro Gln Lys Gln Ala 275 280 285 Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe Ile Ala Gly His Asp 290 295 300 Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Glu Leu Asn Trp Thr Leu 305 310 315 320 Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu Leu Val Phe Glu 325 330 335 Arg Trp Arg Arg Leu Ser Asp Asn Ser Gln Trp Ile Gln Val Ser Leu 340 345 350 Val Phe Gln Thr Leu Gln Gln Met Arg Asp Lys Thr Pro Leu Ser Leu 355 360 365 Asn Thr Pro Pro Gly Glu Val Lys Leu Thr Leu Ala Gly Cys Glu Glu 370 375 380 Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly Phe Thr Gln Ile Val 385 390 395 400 Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu 405 410 <210> 2 <211> 1230 <212> DNA <213> Unknown <220> <223> EcPhy NT <400> 2 cagagtgagc cggagctgaa gctggaaagt gtggtgattg tcagtcgtca tggtgtgcgt 60 gctccaacca aggccacgca actgatgcag gatgtcaccc cagacgcatg gccaacctgg 120 ccggtaaaac tgggttggct gacaccgcgc ggtggtgagc taatcgccta tctcggacat 180 taccaacgcc agcgtctggt agccgacgga ttgctggcga aaaagggctg cccgcagtct 240 ggtcaggtcg cgattattgc tgatgtcgac gagcgtaccc gtaaaacagg cgaagccttc 300 gccgccgggc tggcacctga ctgtgcaata accgtacata cccaggcaga tacgtccagt 360 cccgatccgt tatttaatcc tctaaaaact ggcgtttgcc aactggataa cgcgaacgtg 420 actgacgcga tcctcagcag ggcaggaggg tcaattgctg actttaccgg gcatcggcaa 480 acggcgtttc gcgaactgga acgggtgctt aattttccgc aatcaaactt gtgccttaaa 540 cgtgagaaac aggacgaaag ctgttcatta acgcaggcat taccatcgga actcaaggtg 600 agcgccgaca atgtctcatt aaccggtgcg gtaagcctcg catcaatgct gacggagata 660 tttctcctgc aacaagcaca gggaatgccg gagccggggt ggggaaggat caccgattca 720 caccagtgga acaccttgct aagtttgcat aacgcgcaat tttatttgct acaacgcacg 780 ccagaggttg cccgcagccg cgccaccccg ttattagatt tgatcaagac agcgttgacg 840 ccccatccac cgcaaaaaca ggcgtatggt gtgacattac ccacttcagt gctgtttatc 900 gccggacacg atactaatct ggcaaatctc ggcggcgcac tggagctcaa ctggacgctt 960 cccggtcagc cggataacac gccgccaggt ggtgaactgg tgtttgaacg ctggcgtcgg 1020 ctaagcgata acagccagtg gattcaggtt tcgctggtct tccagacttt acagcagatg 1080 cgtgataaaa cgccgctgtc attaaatacg ccgcccggag aggtgaaact gaccctggca 1140 ggatgtgaag agcgaaatgc gcagggcatg tgttcgttgg caggttttac gcaaatcgtg 1200 aatgaagcac gcataccggc gtgcagtttg 1230 <210> 3 <211> 410 <212> PRT <213> Artificial Sequence <220> <223> EPM1(A109E) AA <400> 3 Gln Ser Glu Pro Glu Leu Lys Leu Glu Ser Val Val Ile Val Ser Arg 1 5 10 15 His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln Leu Met Gln Asp Val 20 25 30 Thr Pro Asp Ala Trp Pro Thr Trp Pro Val Lys Leu Gly Trp Leu Thr 35 40 45 Pro Arg Gly Gly Glu Leu Ile Ala Tyr Leu Gly His Tyr Gln Arg Gln 50 55 60 Arg Leu Val Ala Asp Gly Leu Leu Ala Lys Lys Gly Cys Pro Gln Ser 65 70 75 80 Gly Gln Val Ala Ile Ile Ala Asp Val Asp Glu Arg Thr Arg Lys Thr 85 90 95 Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Asp Cys Glu Ile Thr Val 100 105 110 His Thr Gln Ala Asp Thr Ser Ser Pro Asp Pro Leu Phe Asn Pro Leu 115 120 125 Lys Thr Gly Val Cys Gln Leu Asp Asn Ala Asn Val Thr Asp Ala Ile 130 135 140 Leu Ser Arg Ala Gly Gly Ser Ile Ala Asp Phe Thr Gly His Arg Gln 145 150 155 160 Thr Ala Phe Arg Glu Leu Glu Arg Val Leu Asn Phe Pro Gln Ser Asn 165 170 175 Leu Cys Leu Lys Arg Glu Lys Gln Asp Glu Ser Cys Ser Leu Thr Gln 180 185 190 Ala Leu Pro Ser Glu Leu Lys Val Ser Ala Asp Asn Val Ser Leu Thr 195 200 205 Gly Ala Val Ser Leu Ala Ser Met Leu Thr Glu Ile Phe Leu Leu Gln 210 215 220 Gln Ala Gln Gly Met Pro Glu Pro Gly Trp Gly Arg Ile Thr Asp Ser 225 230 235 240 His Gln Trp Asn Thr Leu Leu Ser Leu His Asn Ala Gln Phe Tyr Leu 245 250 255 Leu Gln Arg Thr Pro Glu Val Ala Arg Ser Arg Ala Thr Pro Leu Leu 260 265 270 Asp Leu Ile Lys Thr Ala Leu Thr Pro His Pro Pro Gln Lys Gln Ala 275 280 285 Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe Ile Ala Gly His Asp 290 295 300 Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Glu Leu Asn Trp Thr Leu 305 310 315 320 Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu Leu Val Phe Glu 325 330 335 Arg Trp Arg Arg Leu Ser Asp Asn Ser Gln Trp Ile Gln Val Ser Leu 340 345 350 Val Phe Gln Thr Leu Gln Gln Met Arg Asp Lys Thr Pro Leu Ser Leu 355 360 365 Asn Thr Pro Pro Gly Glu Val Lys Leu Thr Leu Ala Gly Cys Glu Glu 370 375 380 Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly Phe Thr Gln Ile Val 385 390 395 400 Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu 405 410 <210> 4 <211 > 1230 <212> DNA <213> Artificial Sequence <220> <223> EPM1(A109E) NT <400> 4 cagagtgagc cggagctgaa gctggaaagt gtggtgattg tcagtcgtca tggtgtgcgt 60 gctccaacca aggccacgca actgatgcag gatgtcaccc cagacgcatg gccaacctgg 120 ccggtaaaac tgggttggct gacaccgcgc ggtggtgagc taatcgccta tctcggacat 180 taccaacgcc agcgtctggt agccgacgga ttgctggcga aaaagggctg cccgcagtct 240 ggtcaggtcg cgattattgc tgatgtcgac gagcgtaccc gtaaaacagg cgaagccttc 300 gccgccgggc tggcacctga ctgtgaaata accgtacata cccaggcaga tacgtccagt 360 cccgatccgt tatttaatcc tctaaaaact ggcgtttgcc aactggataa cgcgaacgtg 420 actgacgcga tcctcagcag ggcaggaggg tcaattgctg actttaccgg gcatcggcaa 480 acggcgtttc gcgaactgga acgggtgctt aattttccgc aatcaaactt gtgccttaaa 540 cgtgagaaac aggacgaaag ctgttcatta acgcaggcat taccatcgga actcaaggtg 600 agcgccgaca atgtctcatt aaccggtgcg gtaagcctcg catcaatgct gacggagata 660 tttctcctgc aacaagcaca gggaatgccg gagccggggt ggggaaggat caccgattca 720 caccagtgga acaccttgct aagtttgcat aacgcgcaat tttatttgct acaacgcacg 780 ccagaggttg cccgcagccg cgccaccccg ttattagatt tgatcaagac agcgttgacg 840 ccccatccac cgcaaaaaca ggcgtatggt gtgacattac ccacttcagt gctgtttatc 900 gccggacacg atactaatct ggcaaatctc ggcggcgcac tggagctcaa ctggacgctt 960 cccggtcagc cggataacac gccgccaggt ggtgaactgg tgtttgaacg ctggcgtcgg 1020 ctaagcgata acagccagtg gattcaggtt tcgctggtct tccagacttt acagcagatg 1080 cgtgataaaa cgccgctgtc attaaatacg ccgcccggag aggtgaaact gaccctggca 1140 ggatgtgaag agcgaaatgc gcagggcatg tgttcgttgg caggttttac gcaaatcgtg 1200 aatgaagcac gcataccggc gtgcagtttg 1230 <210> 5 <211> 410 <212> PRT <213> Artificial Sequence <220> <223> EPM2(Q134E) AA <400 > 5 Gln Ser Glu Pro Glu Leu Lys Leu Glu Ser Val Val Ile Val Ser Arg 1 5 10 15 His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln Leu Met Gln Asp Val 20 25 30 Thr Pro Asp Ala Trp Pro Thr Trp Pro Val Lys Leu Gly Trp Leu Thr 35 40 45 Pro Arg Gly Gly Glu Leu Ile Ala Tyr Leu Gly His Tyr Gln Arg Gln 50 55 60 Arg Leu Val Ala Asp Gly Leu Leu Ala Lys Lys Gly Cys Pro Gln Ser 65 70 75 80 Gly Gln Val Ala Ile Ile Ala Asp Val Asp Glu Arg Thr Arg Lys Thr 85 90 95 Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Asp Cys Ala Ile Thr Val 100 105 110 His Thr Gln Ala Asp Thr Ser Ser Pro Asp Pro Leu Phe Asn Pro Leu 115 120 125 Lys Thr Gly Val Cys Glu Leu Asp Asn Ala Asn Val Thr Asp Ala Ile 130 135 140 Leu Ser Arg Ala Gly Gly Ser Ile Ala Asp Phe Thr Gly His Arg Gln 145 150 155 160 Thr Ala Phe Arg Glu Leu Glu Arg Val Leu Asn Phe Pro Gln Ser Asn 165 170 175 Leu Cys Leu Lys Arg Glu Lys Gln Asp Glu Ser Cys Ser Leu Thr Gln 180 185 190 Ala Leu Pro Ser Glu Leu Lys Val Ser Ala Asp Asn Val Ser Leu Thr 195 200 205 Gly Ala Val Ser Leu Ala Ser Met Leu Thr Glu Ile Phe Leu Leu Gln 210 215 220 Gln Ala Gln Gly Met Pro Glu Pro Gly Trp Gly Arg Ile Thr Asp Ser 225 230 235 240 His Gln Trp Asn Thr Leu Leu Ser Leu His Asn Ala Gln Phe Tyr Leu 245 250 255 Leu Gln Arg Thr Pro Glu Val Ala Arg Ser Arg Ala Thr Pro Leu Leu 260 265 270 Asp Leu Ile Lys Thr Ala Leu Thr Pro His Pro Pro Gln Lys Gln Ala 275 280 285 Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe Ile Ala Gly His Asp 290 295 300 Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Glu Leu Asn Trp Thr Leu 305 310 315 320 Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu Leu Val Phe Glu 325 330 335 Arg Trp Arg Arg Leu Ser Asp Asn Ser Gln Trp Ile Gln Val Ser Leu 340 345 350 Val Phe Gln Thr Leu Gln Gln Met Arg Asp Lys Thr Pro Leu Ser Leu 355 360 365 Asn Thr Pro Pro Gly Glu Val Lys Leu Thr Leu Ala Gly Cys Glu Glu 370 375 380 Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly Phe Thr Gln Ile Val 385 390 395 400 Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu 405 410 <210> 6 < 211> 1230 <212> DNA <213> Artificial Sequence <220> <223> EPM2(Q134E) NT <400> 6 cagagtgagc cggagctgaa gctggaaagt gtggtgattg tcagtcgtca tggtgtgcgt 60 gctccaacca aggccacgca actgatgcag gatgtcaccc cagacgcatg gccaacctgg 120 ccggtaaaac tgggttggct gacaccgcgc ggtggtgagc taatcgccta tctcggacat 180 taccaacgcc agcgtctggt agccgacgga ttgctggcga aaaagggctg cccgcagtct 240 ggtcaggtcg cgattattgc tgatgtcgac gagcgtaccc gtaaaacagg cgaagccttc 300 gccgccgggc tggcacctga ctgtgcaata accgtacata cccaggcaga tacgtccagt 360 cccgatccgt tatttaatcc tctaaaaact ggcgtttgcg aactggataa cgcgaacgtg 420 actgacgcga tcctcagcag ggcaggaggg tcaattgctg actttaccgg gcatcggcaa 480 acggcgtttc gcgaactgga acgggtgctt aattttccgc aatcaaactt gtgccttaaa 540 cgtgagaaac aggacgaaag ctgttcatta acgcaggcat taccatcgga actcaaggtg 600 agcgccgaca atgtctcatt aaccggtgcg gtaagcctcg catcaatgct gacggagata 660 tttctcctgc aacaagcaca gggaatgccg gagccggggt ggggaaggat caccgattca 720 caccagtgga acaccttgct aagtttgcat aacgcgcaat tttatttgct acaacgcacg 780 ccagaggttg cccgcagccg cgccaccccg ttattagatt tgatcaagac agcgttgacg 840 ccccatccac cgcaaaaaca ggcgtatggt gtgacattac ccacttcagt gctgtttatc 900 gccggacacg atactaatct ggcaaatctc ggcggcgcac tggagctcaa ctggacgctt 960 cccggtcagc cggataacac gccgccaggt ggtgaactgg tgtttgaacg ctggcgtcgg 1020 ctaagcgata acagccagtg gattcaggtt tcgctggtct tccagacttt acagcagatg 1080 cgtgataaaa cgccgctgtc attaaatacg ccgcccggag aggtgaaact gaccctggca 1140 ggatgtgaag agcgaaatgc gcagggcatg tgttcgttgg caggttttac gcaaatcgtg 1200 aatgaagcac gcataccggc gtgcagtttg 1230 <210> 7 <211> 410 <212> PRT <213> Artificial Sequence <220> <223> EPM3(N137H) AA < 400>7 Gln Ser Glu Pro Glu Leu Lys Leu Glu Ser Val Val Ile Val Ser Arg 1 5 10 15 His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln Leu Met Gln Asp Val 20 25 30 Thr Pro Asp Ala Trp Pro Thr Trp Pro Val Lys Leu Gly Trp Leu Thr 35 40 45 Pro Arg Gly Gly Glu Leu Ile Ala Tyr Leu Gly His Tyr Gln Arg Gln 50 55 60 Arg Leu Val Ala Asp Gly Leu Leu Leu Ala Lys Lys Gly Cys Pro Gln Ser 65 70 75 80 Gly Gln Val Ala Ile Ile Ala Asp Val Asp Glu Arg Thr Arg Lys Thr 85 90 95 Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Asp Cys Ala Ile Thr Val 100 105 110 His Thr Gln Ala Asp Thr Ser Ser Pro Asp Pro Leu Phe Asn Pro Leu 115 120 125 Lys Thr Gly Val Cys Gln Leu Asp His Ala Asn Val Thr Asp Ala Ile 130 135 140 Leu Ser Arg Ala Gly Gly Ser Ile Ala Asp Phe Thr Gly His Arg Gln 145 150 155 160 Thr Ala Phe Arg Glu Leu Glu Arg Val Leu Asn Phe Pro Gln Ser Asn 165 170 175 Leu Cys Leu Lys Arg Glu Lys Gln Asp Glu Ser Cys Ser Leu Thr Gln 180 185 190 Ala Leu Pro Ser Glu Leu Lys Val Ser Ala Asp Asn Val Ser Leu Thr 195 200 205 Gly Ala Val Ser Leu Ala Ser Met Leu Thr Glu Ile Phe Leu Leu Gln 210 215 220 Gln Ala Gln Gly Met Pro Glu Pro Gly Trp Gly Arg Ile Thr Asp Ser 225 230 235 240 His Gln Trp Asn Thr Leu Leu Ser Leu His Asn Ala Gln Phe Tyr Leu 245 250 255 Leu Gln Arg Thr Pro Glu Val Ala Arg Ser Arg Ala Thr Pro Leu Leu 260 265 270 Asp Leu Ile Lys Thr Ala Leu Thr Pro His Pro Pro Gln Lys Gln Ala 275 280 285 Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe Ile Ala Gly His Asp 290 295 300 Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Glu Leu Asn Trp Thr Leu 305 310 315 320 Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu Leu Val Phe Glu 325 330 335 Arg Trp Arg Arg Leu Ser Asp Asn Ser Gln Trp Ile Gln Val Ser Leu 340 345 350 Val Phe Gln Thr Leu Gln Gln Met Arg Asp Lys Thr Pro Leu Ser Leu 355 360 365 Asn Thr Pro Pro Gly Glu Val Lys Leu Thr Leu Ala Gly Cys Glu Glu 370 375 380 Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly Phe Thr Gln Ile Val 385 390 395 400 Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu 405 410 <210> 8 <211> 1230 <212> DNA <213> Artificial Sequence <220> <223> EPM3(N137H) NT <400> 8 cagagtgagc cggagctgaa gctggaaagt gtggtgattg tcagtcgtca tggtgtgcgt 60 gctccaacca aggccacgca actgatgcag gatgtcaccc cagacgcatg gccaacctgg 120 ccggtaaaac tgggttggct gacaccgcgc ggtggtgagc taatcgccta tctcggacat 180 taccaacgcc agcgtctggt agccgacgga ttgctggcga aaaagggctg cccgcagtct 240 ggtcaggtcg cgattattgc tgatgtcgac gagcgtaccc gtaaaacagg cgaagccttc 300 gccgccgggc tggcacctga ctgtgcaata accgtacata cccaggcaga tacgtccagt 360 cccgatccgt tatttaatcc tctaaaaact ggcgtttgcc aactggatca tgcgaacgtg 420 actgacgcga tcctcagcag ggcaggaggg tcaattgctg actttaccgg gcatcggcaa 480 acggcgtttc gcgaactgga acgggtgctt aattttccgc aatcaaactt gtgccttaaa 540 cgtgagaaac aggacgaaag ctgttcatta acgcaggcat taccatcgga actcaaggtg 600 agcgccgaca atgtctcatt aaccggtgcg gtaagcctcg catcaatgct gacggagata 660 tttctcctgc aacaagcaca gggaatgccg gagccggggt ggggaaggat caccgattca 720 caccagtgga acaccttgct aagtttgcat aacgcgcaat tttatttgct acaacgcacg 780 ccagaggttg cccgcagccg cgccaccccg ttattagatt tgatcaagac agcgttgacg 840 ccccatccac cgcaaaaaca ggcgtatggt gtgacattac ccacttcagt gctgtttatc 900 gccggacacg atactaatct ggcaaatctc ggcggcgcac tggagctcaa ctggacgctt 960 cccggtcagc cggataacac gccgccaggt ggtgaactgg tgtttgaacg ctggcgtcgg 1020 ctaagcgata acagccagtg gattcaggtt tcgctggtct tccagacttt acagcagatg 1080 cgtgataaaa cgccgctgtc attaaatacg ccgcccggag aggtgaaact gaccctggca 1140 ggatgtgaag agcgaaatgc gcagggcatg tgttcgttgg caggttttac gcaaatcgtg 1200 aatgaagcac gcataccggc gtgcagtttg 1230 <210> 9 <211> 410 <212> PRT <213> Artificial Sequence <220> <223> EPM4(R164S) AA <400> 9 Gln Ser Glu Pro Glu Leu Lys Leu Glu Ser Val Val Ile Val Ser Arg 1 5 10 15 His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln Leu Met Gln Asp Val 20 25 30 Thr Pro Asp Ala Trp Pro Thr Trp Pro Val Lys Leu Gly Trp Leu Thr 35 40 45 Pro Arg Gly Gly Glu Leu Ile Ala Tyr Leu Gly His Tyr Gln Arg Gln 50 55 60 Arg Leu Val Ala Asp Gly Leu Leu Ala Lys Lys Gly Cys Pro Gln Ser 65 70 75 80 Gly Gln Val Ala Ile Ile Ala Asp Val Asp Glu Arg Thr Arg Lys Thr 85 90 95 Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Asp Cys Ala Ile Thr Val 100 105 110 His Thr Gln Ala Asp Thr Ser Ser Pro Asp Pro Leu Phe Asn Pro Leu 115 120 125 Lys Thr Gly Val Cys Gln Leu Asp Asn Ala Asn Val Thr Asp Ala Ile 130 135 140 Leu Ser Arg Ala Gly Gly Ser Ile Ala Asp Phe Thr Gly His Arg Gln 145 150 155 160 Thr Ala Phe Ser Glu Leu Glu Arg Val Leu Asn Phe Pro Gln Ser Asn 165 170 175 Leu Cys Leu Lys Arg Glu Lys Gln Asp Glu Ser Cys Ser Leu Thr Gln 180 185 190 Ala Leu Pro Ser Glu Leu Lys Val Ser Ala Asp Asn Val Ser Leu Thr 195 200 205 Gly Ala Val Ser Leu Ala Ser Met Leu Thr Glu Ile Phe Leu Leu Gln 210 215 220 Gln Ala Gln Gly Met Pro Glu Pro Gly Trp Gly Arg Ile Thr Asp Ser 225 230 235 240 His Gln Trp Asn Thr Leu Leu Ser Leu His Asn Ala Gln Phe Tyr Leu 245 250 255 Leu Gln Arg Thr Pro Glu Val Ala Arg Ser Arg Ala Thr Pro Leu Leu 260 265 270 Asp Leu Ile Lys Thr Ala Leu Thr Pro His Pro Pro Gln Lys Gln Ala 275 280 285 Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe Ile Ala Gly His Asp 290 295 300 Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Glu Leu Asn Trp Thr Leu 305 310 315 320 Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu Leu Val Phe Glu 325 330 335 Arg Trp Arg Arg Leu Ser Asp Asn Ser Gln Trp Ile Gln Val Ser Leu 340 345 350 Val Phe Gln Thr Leu Gln Gln Met Arg Asp Lys Thr Pro Leu Ser Leu 355 360 365 Asn Thr Pro Pro Gly Glu Val Lys Leu Thr Leu Ala Gly Cys Glu Glu 370 375 380 Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly Phe Thr Gln Ile Val 385 390 395 400 Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu 405 410 <210> 10 <211> 1230 <212> DNA <213> Artificial Sequence <220> <223> EPM4(R164S) NT <400> 10 cagagtgagc cggagctgaa gctggaaagt gtggtgattg tcagtcgtca tggtgtgcgt 60 gctccaacca aggccacgca actgatgcag gatgtcaccc cagacgcatg gccaacctgg 120 ccggtaaaac tgggttggct gacaccgcgc ggtggtgagc taatcgccta tctcggacat 180 taccaacgcc agcgtctggt agccgacgga ttgctggcga aaaagggctg cccgcagtct 240 ggtcaggtcg cgattattgc tgatgtcgac gagcgtaccc gtaaaacagg cgaagccttc 300 gccgccgggc tggcacctga ctgtgcaata accgtacata cccaggcaga tacgtccagt 360 cccgatccgt tatttaatcc tctaaaaact ggcgtttgcc aactggataa cgcgaacgtg 420 actgacgcga tcctcagcag ggcaggaggg tcaattgctg actttaccgg gcatcggcaa 480 acggcgttta gcgaactgga acgggtgctt aattttccgc aatcaaactt gtgccttaaa 540 cgtgagaaac aggacgaaag ctgttcatta acgcaggcat taccatcgga actcaaggtg 600 agcgccgaca atgtctcatt aaccggtgcg gtaagcctcg catcaatgct gacggagata 660 tttctcctgc aacaagcaca gggaatgccg gagccggggt ggggaaggat caccgattca 720 caccagtgga acaccttgct aagtttgcat aacgcgcaat tttatttgct acaacgcacg 780 ccagaggttg cccgcagccg cgccaccccg ttattagatt tgatcaagac agcgttgacg 840 ccccatccac cgcaaaaaca ggcgtatggt gtgacattac ccacttcagt gctgtttatc 900 gccggacacg atactaatct ggcaaatctc ggcggcgcac tggagctcaa ctggacgctt 960 cccggtcagc cggataacac gccgccaggt ggtgaactgg tgtttgaacg ctggcgtcgg 1020 ctaagcgata acagccagtg gattcaggtt tcgctggtct tccagacttt acagcagatg 1080 cgtgataaaa cgccgctgtc attaaatacg ccgcccggag aggtgaaact gaccctggca 1140 ggatgtgaag agcgaaatgc gcagggcatg tgttcgttgg caggttttac gcaaatcgtg 1200 aatgaagcac gcataccggc gtgcagtttg 1230 <210> 11 <211> 410 <212> PRT <213> Artificial Sequence <220> <223> EPM08 Phy AA <400> 11 Gln Ser Glu Pro Glu Leu Gln Leu Glu Ser Val Val Ile Val Ser Arg 1 5 10 15 His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln Leu Met Gln Asp Val 20 25 30 Thr Pro Asp Pro Trp Pro Thr Trp Pro Val Lys Leu Gly Trp Leu Thr 35 40 45 Pro Arg Gly Ala Glu Leu Ile Lys Tyr Met Gly His Tyr Gln Arg Gln 50 55 60 Arg Leu Val Ala Gln Gly Leu Leu Ala Lys Lys Gly Cys Pro Ala Ser 65 70 75 80 Gly Gln Val Phe Ile Ile Ala Asp Val Asp Gln Arg Thr Arg Ala Thr 85 90 95 Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Gly Cys Ala Ile Thr Val 100 105 110 His Thr Gln Pro Asp Gly Ser Met Pro Asp Pro Leu Phe Asn Pro Leu 115 120 125 Lys Thr Gly Val Cys Lys Leu Asp Arg Ala Asn Val Thr Ala Ala Ile 130 135 140 Leu Ala Arg Ala Gly Gly Ser Ile Ala Arg Trp Thr Gln His Arg Gln 145 150 155 160 Pro Ala Phe Arg Glu Leu Glu Arg Val Leu Asn Phe Pro Gln Ser Asn 165 170 175 Leu Cys Gln Lys Arg Glu Lys Gln Asn Glu Ser Cys Ser Leu Thr Gln 180 185 190 Met Leu Pro Ser Glu Leu Lys Val Ser Ala Asp Asn Val Ser Leu Thr 195 200 205 Gly Ala Leu Ser Leu Ala Ser Met Leu Thr Glu Ile Phe Leu Leu Gln 210 215 220 Trp Ala Glu Gly Met Pro Gln Pro Gly Trp Gly Arg Ile Thr Asp Glu 225 230 235 240 His Gln Trp Arg Thr Leu Leu Ser Leu His Asn Ala Gln Phe Tyr Leu 245 250 255 Leu Gln Arg Thr Pro Glu Val Ala Arg Arg Arg Ala Thr Pro Leu Leu 260 265 270 Asp Leu Ile Leu Thr Ala Leu Thr Pro His Pro Pro Gln Lys Gln Ala 275 280 285 Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe Ile Ala Gly His Asp 290 295 300 Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Gly Leu Asn Trp Thr Leu 305 310 315 320 Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu Leu Val Phe Glu 325 330 335 Arg Trp Arg Asp Arg Lys Asp Asn Ser Gln Trp Ile Arg Val Ser Phe 340 345 350 Val Phe Gln Thr Leu Asp Gln Met Arg Asp Lys Thr Pro Leu Ser Leu 355 360 365 Asn His Pro Pro Gly Glu Val Thr Leu Thr Leu Ala Gly Cys Glu Glu 370 375 380 Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly Phe Gln Gln Ile Val 385 390 395 400 Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu 405 410 <210> 12 <211> 1233 <212> DNA <213> Artificial Sequence <220> <223> EPM08 Phy NT <400> 12 caaagtgagc cagagctaca gcttgagagt gtggtcatcg tttctcgtca tagca gggtccg 60 aggctaccca gttgatgcag gacgtgaccc cagatccttg gccaacatgg 120 cctgtaaagc tgggttggct gacacctaga ggcgccgagc tgataaaata catgggtcat 180 tatcagcgtc agagactagt agctcaggga ttgctagcga aaaaaggctg ccccgcttct 240 ggccaagtgt tcattatcgc tgacgttgat caaagaacga gagccacggg tgaagccttt 300 gctgccggct tggctcccgg ctgcgcaatt acggtccaca cgcagcccga cggcagtatg 360 cccgatcccc tttttaatcc attaaagacg ggcgtgtgta aattagatcg tgccaacgtt 420 actgctgcaa ttttagcacg tgctggaggc tctattgcca gatggacgca acataggcaa 480 cccgccttta gagaattaga aagggtgttg aactttcctc agagtaattt gtgccaaaag 540 cgtgagaaac agaacgagag ctgttcctta acgcaaatgt taccaagtga gctaaaagta 600 tcagccgaca acgtctcact gactggtgca ctatcattag ccagtatgct aacagaaata 660 tttctacttc aatgggctga gggtatgcca cagccaggtt ggggcagaat caccgatgaa 720 caccaatggc gtacccttct gtcccttcat aatgctcagt tctatctgtt gcaaagaact 780 ccagaggtag ctagacgtcg tgctacaccc cttctggatt tgattttaac ggcactgaca 840 cctcatcctc cccaaaagca ggcttacggt gtaactttgc caacgtctgt cttgtttata 900 gcaggacacg acacgaactt ggccaatctt ggcggtgccc ttggactaaa ttggacgctg 960 ccaggtcagc ctgacaacac acccccaggc ggcgagttag tattcgagag atggagagac 1020 cgtaaagata actcccagtg gatcagggtt tcctttgttt tccagacgct agaccaaatg 1080 cgtgataaga cgcctctaag tcttaatcac cctccaggcg aagtcactct aacactagca 1140 ggatgtgaag aacgtaatgc acaaggtatg tgtagtctag caggttttca gcaaatcgtc 1200 aatgaagcaa gaatcccagc ctgctcactt taa 1233 <210> 13 <211> 410 <212> PRT < 213> Artificial Sequence <220> <223> EPM08 Phy A109E AA <400> 13 Gln Ser Glu Pro Glu Leu Gln Leu Glu Ser Val Val Ile Val Ser Arg 1 5 10 15 His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln Leu Met Gln Asp Val 20 25 30 Thr Pro Asp Pro Trp Pro Thr Trp Pro Val Lys Leu Gly Trp Leu Thr 35 40 45 Pro Arg Gly Ala Glu Leu Ile Lys Tyr Met Gly His Tyr Gln Arg Gln 50 55 60 Arg Leu Val Ala Gln Gly Leu Leu Ala Lys Lys Gly Cys Pro Ala Ser 65 70 75 80 Gly Gln Val Phe Ile Ile Ala Asp Val Asp Gln Arg Thr Arg Ala Thr 85 90 95 Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Gly Cys Glu Ile Thr Val 100 105 110 His Thr Gln Pro Asp Gly Ser Met Pro Asp Pro Leu Phe Asn Pro Leu 115 120 125 Lys Thr Gly Val Cys Lys Leu Asp Arg Ala Asn Val Thr Ala Ala Ile 130 135 140 Leu Ala Arg Ala Gly Gly Ser Ile Ala Arg Trp Thr Gln His Arg Gln 145 150 155 160 Pro Ala Phe Arg Glu Leu Glu Arg Val Leu Asn Phe Pro Gln Ser Asn 165 170 175 Leu Cys Gln Lys Arg Glu Lys Gln Asn Glu Ser Cys Ser Leu Thr Gln 180 185 190 Met Leu Pro Ser Glu Leu Lys Val Ser Ala Asp Asn Val Ser Leu Thr 195 200 205 Gly Ala Leu Ser Leu Ala Ser Met Leu Thr Glu Ile Phe Leu Leu Gln 210 215 220 Trp Ala Glu Gly Met Pro Gln Pro Gly Trp Gly Arg Ile Thr Asp Glu 225 230 235 240 His Gln Trp Arg Thr Leu Leu Ser Leu His Asn Ala Gln Phe Tyr Leu 245 250 255 Leu Gln Arg Thr Pro Glu Val Ala Arg Arg Arg Ala Thr Pro Leu Leu 260 265 270 Asp Leu Ile Leu Thr Ala Leu Thr Pro His Pro Pro Gln Lys Gln Ala 275 280 285 Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe Ile Ala Gly His Asp 290 295 300 Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Gly Leu Asn Trp Thr Leu 305 310 315 320 Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu Leu Val Phe Glu 325 330 335 Arg Trp Arg Asp Arg Lys Asp Asn Ser Gln Trp Ile Arg Val Ser Phe 340 345 350 Val Phe Gln Thr Leu Asp Gln Met Arg Asp Lys Thr Pro Leu Ser Leu 355 360 365 Asn His Pro Pro Gly Glu Val Thr Leu Thr Leu Ala Gly Cys Glu Glu 370 375 380 Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly Phe Gln Gln Ile Val 385 390 395 400 Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu 405 410 <210> 14 <211> 1233 <212> DNA <213> Artificial Sequence <220> <223> EPM08 Phy A109E NT <400> 14 caaagtgagc cagagctaca gcttgagagt gtggtcatcg tttctcgtca tggtgtca60 gccgcca aggctaccca gttgatgcag gacgtgaccc cagatccttg gccaacatgg 120 cctgtaaagc tgggttggct gacacctaga ggcgccgagc tgataaaata catgggtcat 180 tatcagcgtc agagactagt agctcaggga ttgctagcga aaaaaggctg ccccgcttct 240 ggccaagtgt tcattatcgc tgacgttgat caaagaacga gagccacggg tgaagccttt 300 gctgccggct tggctcccgg ctgcgaaatt acggtccaca cgcagcccga cggcagtatg 360 cccgatcccc tttttaatcc attaaagacg ggcgtgtgta aattagatcg tgccaacgtt 420 actgctgcaa ttttagcacg tgctggaggc tctattgcca gatggacgca acataggcaa 480 cccgccttta gagaattaga aagggtgttg aactttcctc agagtaattt gtgccaaaag 540 cgtgagaaac agaacgagag ctgttcctta acgcaaatgt taccaagtga gctaaaagta 600 tcagccgaca acgtctcact gactggtgca ctatcattag ccagtatgct aacagaaata 660 tttctacttc aatgggctga gggtatgcca cagccaggtt ggggcagaat caccgatgaa 720 caccaatggc gtacccttct gtcccttcat aatgctcagt tctatctgtt gcaaagaact 780 ccagaggtag ctagacgtcg tgctacaccc cttctggatt tgattttaac ggcactgaca 840 cctcatcctc cccaaaagca ggcttacggt gtaactttgc caacgtctgt cttgtttata 900 gcaggacacg acacgaactt ggccaatctt ggcggtgccc ttggactaaa ttggacgctg 960 ccaggtcagc ctgacaacac acccccaggc ggcgagttag tattcgagag atggagagac 1020 cgtaaagata actcccagtg gatcagggtt tcctttgttt tccagacgct agaccaaatg 1080 cgtgataaga cgcctctaag tcttaatcac cctccaggcg aagtcactct aacactagca 1140 ggatgtgaag aacgtaatgc acaaggtatg tgtagtctag caggttttca gcaaatcgtc 1200 aatgaagcaa gaatcccagc ctgctcactt taa 1233 <210> 15 <211> 410 <212> PRT < 213> Artificial Sequence <220> <223> EPM08 Phy R137H AA <400> 15 Gln Ser Glu Pro Glu Leu Gln Leu Glu Ser Val Val Ile Val Ser Arg 1 5 10 15 His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln Leu Met Gln Asp Val 20 25 30 Thr Pro Asp Pro Trp Pro Thr Trp Pro Val Lys Leu Gly Trp Leu Thr 35 40 45 Pro Arg Gly Ala Glu Leu Ile Lys Tyr Met Gly His Tyr Gln Arg Gln 50 55 60 Arg Leu Val Ala Gln Gly Leu Leu Ala Lys Lys Gly Cys Pro Ala Ser 65 70 75 80 Gly Gln Val Phe Ile Ile Ala Asp Val Asp Gln Arg Thr Arg Ala Thr 85 90 95 Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Gly Cys Ala Ile Thr Val 100 105 110 His Thr Gln Pro Asp Gly Ser Met Pro Asp Pro Leu Phe Asn Pro Leu 115 120 125 Lys Thr Gly Val Cys Lys Leu Asp His Ala Asn Val Thr Ala Ala Ile 130 135 140 Leu Ala Arg Ala Gly Gly Ser Ile Ala Arg Trp Thr Gln His Arg Gln 145 150 155 160 Pro Ala Phe Arg Glu Leu Glu Arg Val Leu Asn Phe Pro Gln Ser Asn 165 170 175 Leu Cys Gln Lys Arg Glu Lys Gln Asn Glu Ser Cys Ser Leu Thr Gln 180 185 190 Met Leu Pro Ser Glu Leu Lys Val Ser Ala Asp Asn Val Ser Leu Thr 195 200 205 Gly Ala Leu Ser Leu Ala Ser Met Leu Thr Glu Ile Phe Leu Leu Gln 210 215 220 Trp Ala Glu Gly Met Pro Gln Pro Gly Trp Gly Arg Ile Thr Asp Glu 225 230 235 240 His Gln Trp Arg Thr Leu Leu Ser Leu His Asn Ala Gln Phe Tyr Leu 245 250 255 Leu Gln Arg Thr Pro Glu Val Ala Arg Arg Arg Ala Thr Pro Leu Leu 260 265 270 Asp Leu Ile Leu Thr Ala Leu Thr Pro His Pro Pro Gln Lys Gln Ala 275 280 285 Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe Ile Ala Gly His Asp 290 295 300 Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Gly Leu Asn Trp Thr Leu 305 310 315 320 Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu Leu Val Phe Glu 325 330 335 Arg Trp Arg Asp Arg Lys Asp Asn Ser Gln Trp Ile Arg Val Ser Phe 340 345 350 Val Phe Gln Thr Leu Asp Gln Met Arg Asp Lys Thr Pro Leu Ser Leu 355 360 365 Asn His Pro Pro Gly Glu Val Thr Leu Thr Leu Ala Gly Cys Glu Glu 370 375 380 Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly Phe Gln Gln Ile Val 385 390 395 400 Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu 405 410 <210> 16 <211> 1233 <212> DNA <213> Artificial Sequence < 220> <223> EPM08 Phy R137H NT <400> 16 caaagtgagc cagagctaca gcttgagagt gtggtcatcg tttctcgtca tggtgtccgt 60 gcaccaacaa aggctaccca gttgatgcag gacgtgaccc cagatccttg gccaacatgg 120 cctgtaaagc tgggttggct gacacctaga ggcgccgagc tgataaaata catgggtcat 180 tatcagcgtc agagactagt agctcaggga ttgctagcga aaaaaggctg ccccgcttct 240 ggccaagtgt tcattatcgc tgacgttgat caaagaacga gagccacggg tgaagccttt 300 gctgccggct tggctcccgg ctgcgcaatt acggtccaca cgcagcccga cggcagtatg 360 cccgatcccc tttttaatcc attaaagacg ggcgtgtgta aattagatca tgccaacgtt 420 actgctgcaa ttttagcacg tgctggaggc tctattgcca gatggacgca acataggcaa 480 cccgccttta gagaattaga aagggtgttg aactttcctc agagtaattt gtgccaaaag 540 cgtgagaaac agaacgagag ctgttcctta acgcaaatgt taccaagtga gctaaaagta 600 tcagccgaca acgtctcact gactggtgca ctatcattag ccagtatgct aacagaaata 660 tttctacttc aatgggctga gggtatgcca cagccaggtt ggggcagaat caccgatgaa 720 caccaatggc gtacccttct gtcccttcat aatgctcagt tctatctgtt gcaaagaact 780 ccagaggtag ctagacgtcg tgctacaccc cttctggatt tgattttaac ggcactgaca 840 cctcatcctc cccaaaagca ggcttacggt gtaactttgc caacgtctgt cttgtttata 900 gcaggacacg acacgaactt ggccaatctt ggcggtgccc ttggactaaa ttggacgctg 960 ccaggtcagc ctgacaacac acccccaggc ggcgagttag tattcgagag atggagagac 1020 cgtaaagata actcccagtg gatcagggtt tcctttgttt tccagacgct agaccaaatg 1080 cgtgataaga cgcctctaag tcttaatcac cctccaggcg aagtcactct aacactagca 1140 ggatgtgaag aacgtaatgc acaaggtatg tgtagtctag caggttttca gcaaatcgtc 1200 aatgaagcaa gaatcccagc ctgctcactt taa 1233 <210> 17 <211> 410 <212> PRT <213> Artificial Sequence <220> <223> EPM08 Phy EPM08M2(K134E+R164S) AA Glun Pro Glun Ser Glun Ser Glun <400> 17 Guln Gln Leu Glu Ser Val Val Ile Val Ser Arg 1 5 10 15 His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln Leu Met Gln Asp Val 20 25 30 Thr Pro Asp Pro Trp Pro Thr Trp Pro Val Lys Leu Gly Trp Leu Thr 35 40 45 Pro Arg Gly Ala Glu Leu Ile Lys Tyr Met Gly His Tyr Gln Arg Gln 50 55 60 Arg Leu Val Ala Gln Gly Leu Leu Ala Lys Lys Gly Cys Pro Ala Ser 65 70 75 80 Gly Gln Val Phe Ile Ile Ala Asp Val Asp Gln Arg Thr Arg Ala Thr 85 90 95 Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Gly Cys Ala Ile Thr Val 100 105 110 His Thr Gln Pro Asp Gly Ser Met Pro Asp Pro Leu Phe Asn Pro Leu 115 120 125 Lys Thr Gly Val Cys Glu Leu Asp Arg Ala Asn Val Thr Ala Ala Ile 130 135 140 Leu Ala Arg Ala Gly Gly Ser Ile Ala Arg Trp Thr Gln His Arg Gln 145 150 155 160 Pro Ala Phe Ser Glu Leu Glu Arg Val Leu Asn Phe Pro Gln Ser Asn 165 170 175 Leu Cys Gln Lys Arg Glu Lys Gln Asn Glu Ser Cys Ser Leu Thr Gln 180 185 190 Met Leu Pro Ser Glu Leu Lys Val Ser Ala Asp Asn Val Ser Leu Thr 195 200 205 Gly Ala Leu Ser Leu Ala Ser Met Leu Thr Glu Ile Phe Leu Leu Gln 210 215 220 Trp Ala Glu Gly Met Pro Gln Pro Gly Trp Gly Arg Ile Thr Asp Glu 225 230 235 240 His Gln Trp Arg Thr Leu Leu Ser Leu His Asn Ala Gln Phe Tyr Leu 245 250 255 Leu Gln Arg Thr Pro Glu Val Ala Arg Arg Arg Ala Thr Pro Leu Leu 260 265 270 Asp Leu Ile Leu Thr Ala Leu Thr Pro His Pro Pro Gln Lys Gln Ala 275 280 285 Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe Ile Ala Gly His Asp 290 295 300 Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Gly Leu Asn Trp Thr Leu 305 310 315 320 Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu Leu Val Phe Glu 325 330 335 Arg Trp Arg Asp Arg Lys Asp Asn Ser Gln Trp Ile Arg Val Ser Phe 340 345 350 Val Phe Gln Thr Leu Asp Gln Met Arg Asp Lys Thr Pro Leu Ser Leu 355 360 365 Asn His Pro Pro Gly Glu Val Thr Leu Thr Leu Ala Gly Cys Glu Glu 370 375 380 Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly Phe Gln Gln Ile Val 385 390 395 400 Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu 405 410 <210> 18 <211> 1233 <212> DNA < 213> Artificial Sequence <220> <223> EPM08 Phy EPM08M2(K134E+R164S) NT <400> 18 caaagtgagc cagagctaca gcttgagagt gtggtcatcg tttctcgtca tggtgtccgt 60 gcaccaacaa aggctaccca gttgatgcag gacgtgaccc cagatccttg gccaacatgg 120 cctgtaaagc tgggttggct gacacctaga ggcgccgagc tgataaaata catgggtcat 180 tatcagcgtc agagactagt agctcaggga ttgctagcga aaaaaggctg ccccgcttct 240 ggccaagtgt tcattatcgc tgacgttgat caaagaacga gagccacggg tgaagccttt 300 gctgccggct tggctcccgg ctgcgcaatt acggtccaca cgcagcccga cggcagtatg 360 cccgatcccc tttttaatcc attaaagacg ggcgtgtgtg aattagatcg tgccaacgtt 420 actgctgcaa ttttagcacg tgctggaggc tctattgcca gatggacgca acataggcaa 480 cccgccttta gcgaattaga aagggtgttg aactttcctc agagtaattt gtgccaaaag 540 cgtgagaaac agaacgagag ctgttcctta acgcaaatgt taccaagtga gctaaaagta 600 tcagccgaca acgtctcact gactggtgca ctatcattag ccagtatgct aacagaaata 660 tttctacttc aatgggctga gggtatgcca cagccaggtt ggggcagaat caccgatgaa 720 caccaatggc gtacccttct gtcccttcat aatgctcagt tctatctgtt gcaaagaact 780 ccagaggtag ctagacgtcg tgctacaccc cttctggatt tgattttaac ggcactgaca 840 cctcatcctc cccaaaagca ggcttacggt gtaactttgc caacgtctgt cttgtttata 900 gcaggacacg acacgaactt ggccaatctt ggcggtgccc ttggactaaa ttggacgctg 960 ccaggtcagc ctgacaacac acccccaggc ggcgagttag tattcgagag atggagagac 1020 cgtaaagata actcccagtg gatcagggtt tcctttgttt tccagacgct agaccaaatg 1080 cgtgataaga cgcctctaag tcttaatcac cctccaggcg aagtcactct aacactagca 1140 ggatgtgaag aacgtaatgc acaaggtatg tgtagtctag caggttttca gcaaatcgtc 1200 aatgaagcaa gaatcccagc ctgctcactt taa 1233 <210> 19 <211> 410 <212> PRT <213> Artificial Sequence <220> <223> EPM08 Phy EPM08M4(A109E+K134E+R137H +R164S) AA <400> 19 Gln Ser Glu Pro Glu Leu Gln Leu Glu Ser Val Val Ile Val Ser Arg 1 5 10 15 His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln Leu Met Gln Asp Val 20 25 30 Thr Pro Asp Pro Trp Pro Thr Trp Pro Val Lys Leu Gly Trp Leu Thr 35 40 45 Pro Arg Gly Ala Glu Leu Ile Lys Tyr Met Gly His Tyr Gln Arg Gln 50 55 60 Arg Leu Val Ala Gln Gly Leu Leu Leu Ala Lys Lys Gly Cys Pro Ala Ser 65 70 75 80 Gly Gln Val Phe Ile Ile Ala Asp Val Asp Gln Arg Thr Arg Ala Thr 85 90 95 Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Gly Cys Glu Ile Thr Val 100 105 110 His Thr Gln Pro Asp Gly Ser Met Pro Asp Pro Leu Phe Asn Pro Leu 115 120 125 Lys Thr Gly Val Cys Glu Leu Asp His Ala Asn Val Thr Ala Ala Ile 130 135 140 Leu Ala Arg Ala Gly Gly Ser Ile Ala Arg Trp Thr Gln His Arg Gln 145 150 155 160 Pro Ala Phe Ser Glu Leu Glu Arg Val Leu Asn Phe Pro Gln Ser Asn 165 170 175 Leu Cys Gln Lys Arg Glu Lys Gln Asn Glu Ser Cys Ser Leu Thr Gln 180 185 190 Met Leu Pro Ser Glu Leu Lys Val Ser Ala Asp Asn Val Ser Leu Thr 195 200 205 Gly Ala Leu Ser Leu Ala Ser Met Leu Thr Glu Ile Phe Leu Leu Gln 210 215 220 Trp Ala Glu Gly Met Pro Gln Pro Gly Trp Gly Arg Ile Thr Asp Glu 225 230 235 240 His Gln Trp Arg Thr Leu Leu Ser Leu His Asn Ala Gln Phe Tyr Leu 245 250 255 Leu Gln Arg Thr Pro Glu Val Ala Arg Arg Arg Ala Thr Pro Leu Leu 260 265 270 Asp Leu Ile Leu Thr Ala Leu Thr Pro His Pro Pro Gln Lys Gln Ala 275 280 285 Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe Ile Ala Gly His Asp 290 295 300 Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Gly Leu Asn Trp Thr Leu 305 310 315 320 Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu Leu Val Phe Glu 325 330 335 Arg Trp Arg Asp Arg Lys Asp Asn Ser Gln Trp Ile Arg Val Ser Phe 340 345 350 Val Phe Gln Thr Leu Asp Gln Met Arg Asp Lys Thr Pro Leu Ser Leu 355 360 365 Asn His Pro Pro Gly Glu Val Thr Leu Thr Leu Ala Gly Cys Glu Glu 370 375 380 Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly Phe Gln Gln Ile Val 385 390 395 400 Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu 405 410 <210> 20 <211> 1233 <212> DNA <213> Artificial Sequence <220> <223> EPM08 Phy EPM08M4(A109E+K134E+R137H+R164S) NT <400> 20 caaagtgagc cagagctaca gcttgagagt gtggtcatcg tttctcgtca tggtgtccgt 60 gcaccaacaa aggctaccca gttgatgcag gacgtgaccc cagatccttg gccaacatgg 120 cctgtaaagc tgggttggct gacacctaga ggcgccgagc tgataaaata catgggtcat 180 tatcagcgtc agagactagt agctcaggga ttgctagcga aaaaaggctg ccccgcttct 240 ggccaagtgt tcattatcgc tgacgttgat caaagaacga gagccacggg tgaagccttt 300 gctgccggct tggctcccgg ctgcgaaatt acggtccaca cgcagcccga cggcagtatg 360 cccgatcccc tttttaatcc attaaagacg ggcgtgtgtg aattagatca tgccaacgtt 420 actgctgcaa ttttagcacg tgctggaggc tctattgcca gatggacgca acataggcaa 480 cccgccttta gcgaattaga aagggtgttg aactttcctc agagtaattt gtgccaaaag 540 cgtgagaaac agaacgagag ctgttcctta acgcaaatgt taccaagtga gctaaaagta 600 tcagccgaca acgtctcact gactggtgca ctatcattag ccagtatgct aacagaaata 660 tttctacttc aatgggctga gggtatgcca cagccaggtt ggggcagaat caccgatgaa 720 caccaatggc gtacccttct gtcccttcat aatgctcagt tctatctgtt gcaaagaact 780 ccagaggtag ctagacgtcg tgctacaccc cttctggatt tgattttaac ggcactgaca 840 cctcatcctc cccaaaagca ggcttacggt gtaactttgc caacgtctgt cttgtttata 900 gcaggacacg acacgaactt ggccaatctt ggcggtgccc ttggactaaa ttggacgctg 960 ccaggtcagc ctgacaacac acccccaggc ggcgagttag tattcgagag atggagagac 1020 cgtaaagata actcccagtg gatcagggtt tcctttgttt tccagacgct agaccaaatg 1080 cgtgataaga cgcctctaag tcttaatcac cctccaggcg aagtcactct aacactagca 1140 ggatgtgaag aacgtaatgc acaaggtatg tgtagtctag caggttttca gcaaatcgtc 1200 aatgaagcaa gaatcccagc ctgctcactt taa 1233 <210> 21 <211> 50 <212> DNA <213 > Artificial Sequence <220> <223> A109E Forward <400> 21 ggctggcacc tgactgtgaa ataaccgtac atacccaggc agatacgtcc 50 <210> 22 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> A109E Reverse <400> 22 ttcacagtca ggtgccagcc cggcggcgaa ggcttcg 37 <210> 23 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Q134E Forward <400> 23 aaaaactggc gtttgcgaac tggataacgc gaacgtgact <2021> 112 44 <2021> > DNA <213> Artificial Sequence <220> <223> Q134E Reverse <400> 24 ttcgcaaacg ccagttttta gaggattaaa taacggatcg ggactggacg 50 <210> 25 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> N137H Forward <400> 25 cgtttgccaa ctggatcacg cgaacgtgac tgacgcgatc c 41 <210> 26 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> N137H Reverse <400> 26 gtgatccagt tggcaaacgc cagttttt 50 aggattagggaat a0 <aggattaggaat> 211> 44 <212> DNA <213> Artificial Sequence <220> <223> R164S Forward <400> 27 ggcaaacggc gtttagcgaa ctggaacggg tgcttaattt tccg 44 <210> 28 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> R164S Reverse <400> 28 gctaaacgcc gtttgccgat gcccggtaaa gtcagcaatt gacc 44 <210> 29 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> A109E Forward <400> 29 ggctgcgaaa ttacg ggt3cca c 210> 30 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> A109E Reverse <400> 30 gaccgtaatt tcgcagccgg gagccaagcc ggcag 35 <210> 31 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> K134E Forward <400> 31 agacgggcgt gtgtgaatta gatcgtgcca acgttactgc tgc 43 <210> 32 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> K134E Reverse <400> 32 ttcacac atg cattccgtacta DNA <213> Artificial Sequence <220> <223> R164S Reverse <400> 34 gctaaaggcg ggttgcctat gttgcgtcca tctggcaata gagc 44 <210> 35 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> R137H Forward <400> 35 tgtgtaaatt agatcatgcc aacgttactg ctgcaatttt agcac2g2019 <4gt18> <223> 212> DNA <213> Artificial Sequence <220> <223> R137H Reverse <400> 36 ggcatgatct aatttacaca cgcccgtctt taatggatta aaaagggg 48 <210> 37 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer_F <400> 37 agagaggctg aagctcaatc tgaattgcaa 30 <210> 38 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> primer_R<400> 38 aaggctacaa actcacaaag aacaagctgg aattctag 38

Claims (16)

피타아제 활성을 갖는 변이형 폴리펩티드로서,
i) 상기 변이형 폴리펩티드는 서열번호 1 또는 이와 90% 이상의 서열 동일성을 갖는 아미노산 서열과 70% 이상 100% 미만의 서열 동일성을 가지고; 및/또는
ii) 상기 변이형 폴리펩티드는 서열번호 1 또는 이와 90% 이상의 서열 동일성을 갖는 아미노산 서열의 성숙 폴리펩티드를 코딩하는 서열과 70% 이상 100% 미만의 서열 동일성을 갖는 폴리뉴클레오티드에 의해 코딩되는 폴리펩티드이고; 및/또는
iii) 상기 변이형 폴리펩티드는 (a) 서열번호 1 또는 이와 90% 이상의 서열 동일성을 갖는 아미노산 서열의 성숙 폴리펩티드 코딩 서열, (b) 이의 cDNA, 또는 (c) 상기 (a) 또는 (b)의 전장 상보 서열(full-length complement)과 낮은 엄격도 조건, 중간 엄격도 조건, 중상 엄격도 조건, 높은 엄격도 조건, 또는 매우 높은 엄격도 조건에서 혼성화하는 폴리뉴클레오티드에 의해 코딩되는 폴리펩티드이고; 및/또는
iv) 상기 변이형 폴리펩티드는 피타아제 활성을 갖는 i), ii) 또는 iii) 폴리펩티드의 기능적 단편이고; 및
하기에서 선택된 어느 하나의 변형을 포함하는, 변이형 폴리펩티드:
109번, 134번, 137번, 164번 및 이들의 조합 중 하나 이상의 위치의 아미노산에서의 결실(deletion), 아미노산의 삽입(insertion), 다른 아미노산으로의 치환(substitution), 및 이의 조합;
여기서, 상기 위치 번호는 서열번호 1의 폴리펩티드의 위치에 상응하는 위치인 것임.
As a variant polypeptide having phytase activity,
i) the variant polypeptide has 70% or more and less than 100% sequence identity with SEQ ID NO: 1 or an amino acid sequence having 90% or more sequence identity therewith; and/or
ii) the variant polypeptide is a polypeptide encoded by a polynucleotide having at least 70% and less than 100% sequence identity with a sequence encoding a mature polypeptide of SEQ ID NO: 1 or an amino acid sequence having at least 90% sequence identity therewith; and/or
iii) the variant polypeptide is (a) a mature polypeptide coding sequence of SEQ ID NO: 1 or an amino acid sequence having at least 90% sequence identity therewith, (b) a cDNA thereof, or (c) the full length of (a) or (b) above A polypeptide encoded by a polynucleotide that hybridizes to a full-length complement under low, medium, high, medium, high, or very high stringency conditions; and/or
iv) the variant polypeptide is a functional fragment of i), ii) or iii) polypeptide having phytase activity; and
A variant polypeptide comprising any one of the modifications selected from the following:
Deletion of amino acids at positions 109, 134, 137, 164 and combinations thereof, insertion of amino acids, substitution with other amino acids, and combinations thereof;
Here, the position number is a position corresponding to the position of the polypeptide of SEQ ID NO: 1.
제1항에 있어서, 상기 피타아제 활성을 갖는 변이형 폴리펩티드의 변형 전 109번 아미노산은 알라닌(A); 134번 아미노산은 글루타민(Q) 또는 리신(K); 137번 아미노산은 아스파라긴(N) 또는 아르기닌(R); 및/또는 164번 아미노산은 아르기닌(R)인 것인, 변이형 폴리펩티드.
According to claim 1, amino acid number 109 before modification of the variant polypeptide having phytase activity is alanine (A); Amino acid 134 is glutamine (Q) or lysine (K); amino acid 137 is asparagine (N) or arginine (R); And / or amino acid number 164 is arginine (R), the mutant polypeptide.
제1항에 있어서, 상기 변이형 폴리펩티드는 하기 i) 내지 xv)에서 선택된 위치의 아미노산의 변형을 포함하는 것인, 변이형 폴리펩티드;
i) 109번;
ii) 134번;
iii) 137번;
iv) 164번;
v) 109+134번;
vi) 109+137번;
vii) 109+164번;
viii) 134+137번;
ix) 134+164번;
x) 137+164번;
xi) 109+134+137번;
xii) 109+134+164번;
xiii) 109+137+164번;
xiv) 134+137+164번; 및
xv) 109+134+137+164번;
여기서, 상기 위치 번호는 서열번호 1의 폴리펩티드의 위치에 상응하는 위치임.
The variant polypeptide according to claim 1, wherein the variant polypeptide comprises a modification of an amino acid at a position selected from the following i) to xv);
i) No. 109;
ii) No. 134;
iii) No. 137;
iv) No. 164;
v) No. 109+134;
vi) No. 109+137;
vii) No. 109+164;
viii) times 134+137;
ix) No. 134+164;
x) No. 137+164;
xi) No. 109+134+137;
xii) No. 109+134+164;
xiii) No. 109+137+164;
xiv) No. 134+137+164; and
xv) No. 109+134+137+164;
Here, the position number is a position corresponding to the position of the polypeptide of SEQ ID NO: 1.
제1항에 있어서, 상기 변이형 폴리펩티드는 하기 i) 내지 iv) 중 어느 하나 이상의 치환을 포함하는 것인, 변이형 폴리펩티드;
i) 109번 아미노산의 글루탐산으로의 치환;
ii) 134번 아미노산의 글루탐산으로의 치환;
iii) 137번 아미노산의 히스티딘으로의 치환; 및
iv) 164번 아미노산의 세린으로의 치환으로,
여기서, 상기 위치 번호는 서열번호 1의 폴리펩티드의 위치에 상응하는 위치임.
The variant polypeptide according to claim 1, wherein the variant polypeptide comprises substitution of one or more of the following i) to iv);
i) substitution of amino acid 109 with glutamic acid;
ii) substitution of amino acid 134 with glutamic acid;
iii) substitution of amino acid 137 with histidine; and
iv) by substitution of amino acid position 164 with serine,
Here, the position number is a position corresponding to the position of the polypeptide of SEQ ID NO: 1.
제1항에 있어서, 상기 변이형 폴리펩티드는 하기에서 선택된 어느 하나 이상의 변형을 포함하는 것인, 변이형 폴리펩티드:
A109E;
Q134E 또는 K134E;
N137H 또는 R137H;
R164S;
A109E+Q134E 또는 A109E+K134E;
A109E+N137H 또는 A109E+R137H;
A109E+R164S;
Q134E+N137H 또는 K134E+R137H;
Q134E+R164S 또는 K134E+R164S;
N137H+R164S 또는 R137H+R164S;
A109E+Q134E+N137H 또는 A109E+K134E+R137H;
A109E+Q134E+R164S 또는 A109E+K134E+R164S;
A109E+N137H+R164S 또는 A109E+R137H+R164S;
Q134E+N137H+R164S 또는 K134E+R137H+R164S; 및
A109E+Q134E+N137H+R164S 또는 A109E+K134E+R137H+R164S.
The variant polypeptide according to claim 1, wherein the variant polypeptide comprises any one or more modifications selected from the following:
A109E;
Q134E or K134E;
N137H or R137H;
R164S;
A109E+Q134E or A109E+K134E;
A109E+N137H or A109E+R137H;
A109E+R164S;
Q134E+N137H or K134E+R137H;
Q134E+R164S or K134E+R164S;
N137H+R164S or R137H+R164S;
A109E+Q134E+N137H or A109E+K134E+R137H;
A109E+Q134E+R164S or A109E+K134E+R164S;
A109E+N137H+R164S or A109E+R137H+R164S;
Q134E+N137H+R164S or K134E+R137H+R164S; and
A109E+Q134E+N137H+R164S or A109E+K134E+R137H+R164S.
제1항에 있어서, 상기 변이형 폴리펩티드는 서열번호 1 또는 이와 90% 이상의 서열 동일성을 갖는 아미노산 서열의 아미노산 서열로 구성된 폴리펩티드에 비하여 하기 i) 내지 vii) 중 어느 하나 이상의 변경된 특성을 갖는 것인, 변이형 폴리펩티드:
i) 효소 활성(enzyme activity) 증가;
ii) 특이적 활성 증가; 및
iii) 내열성 증가.
The method of claim 1, wherein the variant polypeptide has at least one of the following i) to vii) altered characteristics compared to a polypeptide consisting of an amino acid sequence of SEQ ID NO: 1 or an amino acid sequence having 90% or more sequence identity therewith, Variant Polypeptide:
i) increased enzyme activity;
ii) increased specific activity; and
iii) increased heat resistance.
제1항 내지 제6항 중 어느 한 항의 변이형 폴리펩티드를 포함하는 조성물.
A composition comprising the variant polypeptide of any one of claims 1 to 6.
피틴과의 반응을 위한, 제1항 내지 제6항 중 어느 한 항의 변이형 폴리펩티드 또는 상기 변이형 폴리펩티드를 포함하는, 반응용 조성물.
A composition for reaction comprising the variant polypeptide or the variant polypeptide according to any one of claims 1 to 6 for reaction with phytin.
제1항 내지 제6항 중 어느 한 항의 변이형 폴리펩티드, 상기 변이형 폴리펩티드를 발현하는 숙주 세포, 및/또는 상기 변이형 폴리펩티드를 포함하는 조성물과 피틴을 접촉시키는 것을 포함하는, 피틴의 가수분해물을 제조하는 방법.
A hydrolyzate of phytin, comprising contacting phytin with the variant polypeptide of any one of claims 1 to 6, a host cell expressing the variant polypeptide, and/or a composition comprising the variant polypeptide How to manufacture.
제1항 내지 제6항 중 어느 한 항의 변이형 폴리펩티드, 상기 변이형 폴리펩티드를 발현하는 숙주 세포, 및/또는 상기 변이형 폴리펩티드를 포함하는 조성물을 기질에 처리시키는 것을 포함하는, 피틴의 가수분해 방법.
A method for hydrolyzing phytin, comprising treating a substrate with the variant polypeptide of any one of claims 1 to 6, a host cell expressing the variant polypeptide, and/or a composition comprising the variant polypeptide. .
제1항 내지 제6항 중 어느 한 항의 변이형 폴리펩티드를 코딩하는, 폴리뉴클레오티드.
A polynucleotide encoding the variant polypeptide of any one of claims 1 to 6.
제11항의 폴리뉴클레오티드를 포함하는 핵산 구조체.
A nucleic acid construct comprising the polynucleotide of claim 11.
제11항의 폴리뉴클레오티드 또는 제12항의 핵산 구조체를 포함하는 벡터.
A vector comprising the polynucleotide of claim 11 or the nucleic acid construct of claim 12.
제1항 내지 제6항 중 어느 한 항의 변이형 폴리펩티드, 제11항의 폴리뉴클레오티드, 제12항의 핵산 구조체, 및/또는 제13항의 벡터를 포함하는 숙주세포.
A host cell comprising the variant polypeptide according to any one of claims 1 to 6, the polynucleotide according to claim 11, the nucleic acid construct according to claim 12, and/or the vector according to claim 13.
제14항의 숙주세포를 배양하는 단계를 포함하는, 피타아제 활성을 갖는 변이형 폴리펩티드를 제조하는 방법.
A method for producing a variant polypeptide having phytase activity, comprising culturing the host cell of claim 14.
제15항에 있어서, 상기 배양단계에서 발현되는 제1항 내지 제6항 중 어느 한 항의 피타아제 활성을 갖는 변이형 폴리펩티드를 회수하는 단계를 더 포함하는, Tase 활성을 갖는 변이형 폴리펩티드를 제조하는 방법.The method of claim 15, further comprising the step of recovering the variant polypeptide having the phytase activity of any one of claims 1 to 6 expressed in the culturing step, producing a variant polypeptide having Tase activity method.
KR1020210131840A 2021-10-05 2021-10-05 Phytase Variant KR20230048891A (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020210131840A KR20230048891A (en) 2021-10-05 2021-10-05 Phytase Variant
CN202280051695.9A CN117716028A (en) 2021-10-05 2022-10-05 Phytase variants
PCT/KR2022/014941 WO2023059044A1 (en) 2021-10-05 2022-10-05 Phytase variant

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210131840A KR20230048891A (en) 2021-10-05 2021-10-05 Phytase Variant

Publications (1)

Publication Number Publication Date
KR20230048891A true KR20230048891A (en) 2023-04-12

Family

ID=85803605

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210131840A KR20230048891A (en) 2021-10-05 2021-10-05 Phytase Variant

Country Status (3)

Country Link
KR (1) KR20230048891A (en)
CN (1) CN117716028A (en)
WO (1) WO2023059044A1 (en)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004050410A1 (en) * 2004-10-15 2006-06-08 Ab Enzymes Gmbh Polypeptide with phytase activity and this coding nucleotide sequence
US10351832B2 (en) * 2016-06-30 2019-07-16 Fornia Biosolutions, Inc. Phytases and uses thereof
US9528096B1 (en) * 2016-06-30 2016-12-27 Fornia Biosolutions, Inc. Phytases and uses thereof
US20210207112A1 (en) * 2018-05-30 2021-07-08 Nanjing Bestzyme Bio-Engineering Co., Ltd. Phytase mutant
US10995325B2 (en) * 2019-03-21 2021-05-04 Fornia Biosolutions, Inc. Additional phytase variants and methods

Also Published As

Publication number Publication date
CN117716028A (en) 2024-03-15
WO2023059044A1 (en) 2023-04-13

Similar Documents

Publication Publication Date Title
EP2238243B1 (en) Polypeptides having arabinofuranosidase activity and polynucleotides encoding same
US9113649B2 (en) Food additive comprising an amidase for detoxifying ochratoxin
US9528096B1 (en) Phytases and uses thereof
US20220195410A1 (en) Xylanase Variants and Methods
US10351832B2 (en) Phytases and uses thereof
EP2748189B1 (en) Polypeptides having alpha-amylase activity and polynucleotides encoding same
EP4328237A1 (en) Modified polypeptide having lysozyme activity
EP3313193B1 (en) Method for producing a coffee extract
CN111718918B (en) Additional phytase variants and methods
KR20230048891A (en) Phytase Variant
US20240218413A1 (en) Modified polypeptide having lysozyme activity
KR102677156B1 (en) Modified polypeptide having xylanase activity
KR102502711B1 (en) Modified polypeptide having xylanase activity
EP4372082A1 (en) Variant polypeptide having xylanase activity
EP4242302A1 (en) Variant polypeptide having mannanase activity
EP4261282A1 (en) Variant polypeptide having xylanase activity
EP3263699B1 (en) Novel phytases and uses thereof
KR20230062151A (en) Modified polypeptide having xylanase activity
KR20230167903A (en) Modified polypeptide having xylanase activity
US20230250405A1 (en) Second Additional Phytase Variants and Methods
AU2015203891A1 (en) Food Additive Comprising An Amidase For Detoxifying Ochratoxin

Legal Events

Date Code Title Description
E902 Notification of reason for refusal