KR100770721B1

KR100770721B1 - α-아밀라제 돌연변이체

Info

Publication number: KR100770721B1
Application number: KR1020007004453A
Authority: KR
Inventors: 보르체르트토르벤베델; 스벤센알란; 안델센칼스텐; 니엘센자네뢴펠트; 니센토르벤라우에스가르트; 자에르울프쇠렌
Original assignee: 노보자임스 에이/에스
Priority date: 1997-10-30
Filing date: 1998-10-30
Publication date: 2007-10-29
Also published as: KR20010031424A

Abstract

본 발명은 부모 Termamyl-유사 α-아밀라제의 변이체에 관한 것으로, 이 변이체는 상기 부모 Termamyl-유사 α-아밀라제와 비교하여 최소한 하나의 다음의 성질: i) 8 내지 10.5 의 pH 에서 증가된 pH 안정성; 및/또는 ii) 8 내지 10.5 의 pH 에서 증가된 Ca²⁺ 안정성; 및/또는 iii) 10 내지 60 ℃ 의 온도에서 증가된 특이 활성이 변경된 것으로 나타난다.

Termamyl, α-아밀라제, 안정성, 변이체

Description

α-아밀라제 돌연변이체{α-AMYLASE MUTANTS}

본 발명은 중간 온도 및/또는 높은 pH 에서 보다 큰 활성을 가지고 있는 부부모 (parent) Termamyl과 유사한 α-아밀라제의 변이체 (돌연변이체)에 관한 것이다.

α-아밀라제 (α-1,4-글루칸-4-글루카노히드롤라제, EC 3.2.1.1)는 녹말과 다른 선형 및 분지된 1,4-글루코시딕 올리고- 및 다당류의 가수분해를 촉매하는 효소군을 구성한다.

상기와 같은 산업적으로 매우 중요한 부류의 효소들과 관련된 특허 및 과학 문헌이 매우 광범위하게 있다. Termamyl-유사 α-아밀라제 변이체와 같은 많은 α-아밀라제들이 WO 90/11352, WO 95/10603, WO 95/26397, WO 96/23873 및 WO 96/23874 로부터 공지되어 있다.

α-아밀라제와 관련된 가장 최근의 공개문헌 중에서, WO 96/23874 에는 Termamyl-유사 α-아밀라제에 대한 삼-차원 X-선 결정 구조 데이터가 공개되어 있는데, 그 데이터에 의하면 이 효소는 B. amyloliquefaciens α-아밀라제 (BAN^TM)의 300 개의 N-말단 아미노산 잔기와 아미노산 서열을 포함하는 B. licheniformis α- 아밀라제의 C- 말단부의 아미노산 301-483 으로 구성되고 (후자의 것은 상표명 Termamyl^TM 으로 시판중인 것을 구입할 수 있음), 그러므로 이 효소는 산업적으로 중요한 Bacillus α-아밀라제에 밀접하게 관련된 것이다 (이 효소는 본 명세서에서 용어 "Termamyl-유사 α-아밀라제"를 규정하는 의미안에 포함되며, 무엇보다도 B. licheniformis α-아밀라제, B. amyloliquefaciens α-아밀라제 (BAN^TM) 및 B. stearothermophilus α-아밀라제 (BSG^TM) 를 포함한다. WO 96/23874 호에는 또한 부모 Termamyl-유사 α-아밀라제의 구조에 대한 분석을 토대로 하여, 부모세대의 것과 관련된 변경된 성질을 나타내는 부모 Termamyl-유사 α-아밀라제의 변이체를 디자인하기 위한 방법론이 게재되어 있다.

발명의 간단한 설명

본 발명은 높은 pH 및 중간 온도에서 (부모 α-아밀라제와 관련하여) 개선된 세척 성능을 나타내는 Termamyl-유사 α-아밀라제의 새로운 α-녹말 분해성 변이체 (돌연변이체)에 관한 것이다.

용어 "중간 온도" 는 본 발명의 명세서에서 10 ℃ 내지 60 ℃ 사이의 온도, 바람직하게는 20 ℃ 에서 50 ℃ 사이의 온도, 특히 30 내지 40 ℃ 의 온도를 의미한다.

용어 "높은 pH" 는 오늘날 세척에 사용되는 알칼리성 pH, 보다 구체적으로는 약 pH 8 내지 10.5 를 의미한다.

본 발명의 명세서에서 "저온 α-아밀라제" 는 0 내지 30 ℃ 범위의 온도에서 상대적으로 최적의 활성을 가지고 있는 α-아밀라제를 의미한다.

본 명세서에서 "중간 온도 α-아밀라제" 는 30 내지 60 ℃ 범위의 온도에서 최적의 활성을 가지고 있는 α-아밀라제를 의미한다. 예를 들면, SP690 및 SP722 α-아밀라제가 각각 "중간 온도 α-아밀라제" 이다.

본 명세서에서 "고온 α-아밀라제" 는 60 내지 110 ℃ 의 온도 범위에서 최적의 활성을 나타내는 α-아밀라제이다. 예를 들어, Termamyl이 "고온 α-아밀라제" 이다.

본 발명의 변이체 (돌연변이체)에서 이루어질 수 있는 성질의 변경으로는 다음과 같은 것들이 있다: 8 내지 10.5 의 pH 에서의 Termamyl-유사 α-아밀라제의 안정성, 및/또는 pH 8 내지 10.5 에서의 Ca²⁺ 안정성, 및/또는 10 내지 60 ℃, 바람직하게는 20 내지 50 ℃, 특히 30 내지 40 ℃ 의 온도에서의 특이한 활성.

상대적인 최적 온도는 때로 사용되는 특정 pH 에 좌우된다는 것이 주지되어야 한다. 달리 표현하자면, 예컨대 pH 8 에서 측정된 상대적인 최적 온도는 실질적으로는 예컨대 pH 10 에서 측정된 상대적인 최적 온도와 상이할 수 있다.

효소 활성에 미치는 온도의 영향

활성 부위 및 그 주변에서의 역학은 온도 및 아미노산 조성에 따라 좌우되며, 효소의 상대적인 최적 온도에 매우 중요하다. 중간 온도 α-아밀라제와 고온 α-아밀라제의 역학을 비교함으로써, 중간 온도에서 고온 α-아밀라제가 작용하기 위한 중요한 영역이 결정될 수 있다. SP722 α-아밀라제 (SEQ ID NO: 2) 및 B. licheniformis α-아밀라제 (Novo Nordisk에서 등록상표명 Termamyl 로 시판함)의 온도 활성 프로필이 도 2 에 도시되어 있다.

절대 활성에서 SP722 의 상대적인 최적 온도는 중간 범위 온도 (30 내지 60 ℃)에서 동종성 B. licheniformis α-아밀라제보다 더 높은 것으로 나타나는데, SP722 는 60 내지 100 ℃ 주변에서 최적 활성을 나타낸다. 프로필은 주로 온도 안정성 및 활성 부위 잔기와 그 주변의 역학에 따라 좌우된다. 나아가, 활성 프로필은 사용되는 pH 및 활성 부위 잔기의 pKa 에 좌우된다.

첫 번째 측면으로, 본 발명은 α-아밀라제 활성을 가지고 있는, 부모 Termamyl-유사 α-아밀라제의 변이체에 관한 것으로, 상기 변이체는 SEQ ID NO: 2 에 도시된 아미노산 서열에 다음의 돌연변이에 상응하는 하나 또는 그 이상의 돌연변이를 포함하고 있다:

T141, K142, F143, D144, F145, P146, G147, R148, G149,

Q174, R181, G182, D183, G184, K185, A186, W189, S193, N195,

H107, K108, G109, D166, W167, D168, Q169, S170, R171, Q172, F173,

F267, W268, K269, N270, D271, L272, G273, A274, L275, K311,

E346, K385, G456, N457, K458, P459, G460, T461, V462, T463.

본 발명의 변이체들은 하나 또는 그 이상의 다음의 치환 또는 결실을 포함하고 있다:

하나 또는 그 이상의 다음의 치환 또는 결실을 포함하고 있는 변이체들이 바람직하다: K142R; S193P; N195F; K269R,Q; N270Y,R,D; K311R; E346Q; K385R; K458R; P459T; T461P; Q174^*; R181Q,N,S; G182T,S,N; D183^*; G184^*; K185A,R,D,C,E,Q,G,H,I,L,M,N,F,P,S,T,W,Y,V; A186T,S,N,I,V,R; W189T,S,N,Q.

특히 바람직한 것은 위치 D183 및 G184 가 결실되어 있고 또한 하나 또는 그 이상의 다음의 치환 또는 결실을 포함하고 있는 변이체들이다: K142R; S193P; N195F; K269R,Q; N270Y,R,D; K311R; E346Q; K385R; K458R; P459T; T461P; Q174^*; R181Q,N,S; G182T,S,N; K185A,R,D,C,E,Q,G,H,I,L,M,N,F,P,S,T,W,Y,V; A186T,S,N,I,V,R; W189T,S,N,Q.

상기 언급된 본 발명의 변이체들은 부모 α-아밀라제와 관련하여 최소한 하나의 다음의 성질이 변경된 것으로 나타난다:

i) 8 내지 10.5 의 pH 에서 증가된 pH 안정성; 및/또는

ii) 8 내지 10.5 의 pH 에서 증가된 Ca²⁺ 안정성; 및/또는

iii) 10 내지 60 ℃, 바람직하게는 20 내지 50 ℃, 특히 30 내지 40 ℃ 의 온도에서 증가된 특이 활성. 한층 더 상세한 것은 하기에서 설명하기로 한다.

본 발명은 또한 본 발명의 변이체를 암호화하는 DNA 구조체; 본 발명의 변이체를 제조하기 위한 방법; 및 본 발명의 변이체를 단독으로 또는 다른 효소들과 병용하여 다양한 산업적 제품 또는 공정에, 예컨대 세제에 또는 녹말 액화를 위하여 사용하는 용도에 관한 것이다.

본 발명의 최종 측면은 변경된 최적 pH, 및/또는 변경된 최적 온도, 및/또는 증가된 안정성을 나타내는 α-아밀라제를 제공하는 방법에 관한 것이다.

명명법

본 명세서 및 특허청구의 범위에서, 아미노산 잔기에 대한 종래의 한-문자 및 세-문자 코드가 사용된다. 참조를 용이하게 하기 위하여, 본 발명의 α-아밀라제 변이체는 다음의 명명법에 의하여 기재된다:

원래의 아미노산(들) : 위치(들) : 치환된 아미노산(들).

상기 명명법에 따라서, 예를 들면 위치 30 에서 알라닌이 아스파라긴으로 치환되는 것은 다음과 같이 표시된다: Ala30Asn 또는 A30N;

동일한 위치에서의 알라닌의 결실은 다음과 같이 표시된다: Ala30^*또는 A30^*;

추가의 아미노산 잔기, 예컨대 라이신의 삽입은 다음과 같이 표시된다: Ala30AlaLys 또는 A30AK.

아미노산 잔기의 연속적인 스트레치, 예컨대 아미노산 잔기 30 에서 33 까지의 결실은 (30-33)^* 또는 Δ(A30-N33) 으로 표시된다.

특이한 α-아밀라제가 다른 α-아밀라제와 비교하여 위치 36 에 "결실"을 포함하고 있고, 그 위치에 아스파르트산이 삽입되어 있다면, 이렇게 표시된다: ^*36Asp 또는 ^*36D.

다중 돌연변이는 플러스 부호로 분리된다. 즉 Ala30Asp + Glu34Ser 또는 A30N+E34S 는 위치 30 과 34 에서 알라닌과 글루탐산이 각각 아스파라긴과 세린으로 치환된 돌연변이를 나타낸다.

하나 또는 그 이상의 대체 아미노산 잔기들이 주어진 위치에서 삽입될 수 있다면, 그 때에는 다음과 같이 표시된다: A30N,E 또는 A30N 또는 A30E.

나아가, 변형에 적당한 위치가 제시되는 어떠한 특정 변형없이 본원에서 확인되는 때에는, 어떠한 아미노산 잔기든지 그 위치에 존재하는 아미노산으로 치환될 수 있는 것으로 이해되어야 한다. 그러므로, 예를 들어, 위치 30 에서의 알라닌의 변형이 언급된다면, 그러나 특정되지는 않았다면, 그 때에는 알라닌이 결실되었거나 또는 어떠한 다른 아미노산, 즉 다음의 아미노산들중 하나로 치환될 수 있는 것으로 이해되어야 한다: R,N,D,A,C,Q,E,G,H,I,L,K,M,F,P,S,T,W,Y,V.

발명의 상세한 설명

Termamyl-유사 α-아밀라제

Bacillus 종에 의해 생성되는 많은 α-아밀라제들이 아미노산 수준에 있어 매우 크게 상동한다는 것은 잘 알려져 있다. 예를 들어, SEQ ID NO: 4 에 도시되어 있는 아미노산 서열을 포함하고 있는 B. licheniformis α-아밀라제 (Termamyl^TM 로서 시판됨)는 SEQ ID NO: 5 에 도시되는 아미노산 서열을 포함하고 있는 B. amyloliquefaciens α-아밀라제와 약 89 % 상동하며, SEQ ID NO: 3 에 도시되어 있는 아미노산 서열을 포함하고 있는 B. stearothermophilus α-아밀라제와는 약 79 % 상동하는 것으로 밝혀져 있다. 나아가 상동성 α-아밀라제들로는 Bacillus 종 NCIB 12289, NCIB 12512, NCIB 12513 또는 DSM 9375 세균주로부터 유도된 α-아밀라제가 있다. 이들 세균주는 WO 95/26397 에 상세하게 설명되어 있으며, α-아밀라제는 문헌에 기재되어 있다 [Tsukamoto et al., Biochemical and Biophysical Research Communications, 151 (1988), pp. 25-31 (SEQ ID NO: 6 참조)].

추가의 상동성 α-아밀라제로는 EP 0252666 에 기재되어 있는 B. licheniformis 세균주 (ATCC 27811)에 의해 생성되는 α-아밀라제, 및 WO 91/00353 및 WO 94/18314 에서 확인되는 α-아밀라제가 있다. 다른 상용성 Termamyl-유사 B. licheniformis α-아밀라제들로는 제품 Optitherm^TM 및 Takatherm^TM (Solvay 사에서 시판함), Maxamyl^TM (Gist-brocades/Genencor 사에서 시판함), Spezym AA^TM 및 Spezyme Delta AA^TM (Genencor 사에서 시판함), 및 Keistase^TM (Daiwa 사에서 시판함) 가 있다.

이들 α-아밀라제들 사이에서 발견된 실질적인 상동성 때문에, 이것들은 동일한 부류의 α-아밀라제, 즉 "Termamyl-유사 α-아밀라제" 의 부류에 속하는 것으로 간주된다.

따라서, 본 명세서에서, 용어 "Termamyl-유사 α-아밀라제" 는 아미노산 수준에서, Termamyl^TM, 즉 본원의 SEQ ID NO: 4 에 도시된 아미노산 서열을 가지고 있는 B. licheniformis α-아밀라제에 대해 실질적인 상동성을 나타내는 α-아밀라제를 가리키는 것으로 의도된다. 달리 표현하면, 본원의 SEQ ID NO: 1, 2, 3, 4, 5, 6, 7 또는 8 에 도시된 아미노산 서열, 또는 WO 95/26397 의 SEQ ID NO: 1 에 도시되어 있는 아미노산 서열 (본원의 SEQ ID NO: 7 로서 도시된 아미노산 서열과 동일함), 또는 WO 95/26397 의 SEQ ID NO: 2 에 도시된 아미노산 서열 (본원의 SEQ ID NO: 8 로서 도시된 아미노산 서열과 동일함) 또는 쯔가모토 등에 의해 기재된 아미노산 서열 (이 아미노산 서열은 본원의 SEQ ID NO: 6 에 도시된다)을 가지고 있는 다음의 모든 α-아밀라제들은 "Termamyl-유사 α-아밀라제" 인 것으로 간주된다. 다른 Termamyl-유사 α-아밀라제들은 i) SEQ ID NO : 1 내지 8 에 도시된 상기의 아미노산 서열들 중 최소한 하나와 최소한 60 %, 예컨대 최소한 70 %, 예컨대 최소한 75 %, 또는 최소한 80 %, 예컨대 최소한 85 %, 최소한 90 % 또는 최소한 95 % 의 상동성을 나타내고, 및/또는 ii) 상기의 α-아밀라제중 최소한 하나에 대하여 발생하는 항체와 면역학적 교차-반응성을 나타내며, 및/또는 iii) 각각 본 명세서의 SEQ ID NO: 9, 10, 11, 12 또는 58(이 암호화 서열들은 각각 본원의 SEQ ID NO: 1, 2, 3, 4 및 5 에 도시된 아미노산 서열을 암호화한다)로부터, WO 95/26397 의 SEQ ID NO: 4 (이 DNA 서열은 정지코돈 TAA 와 함께, 본원의 SEQ ID NO: 13 에 도시되며, 본원의 SEQ ID NO: 8 에 도시된 아미노산 서열을 암호화한다)로부터 및 WO 95/26397 의 SEQ ID NO: 5 (본원의 SEQ ID NO: 14 에 도시됨)로부터 나타나는 상기에서 특정된 α-아밀라제들을 암호화하는 DNA 서열에 혼성화하는 DNA 서열에 의하여 암호화되는 α-아밀라제들이다.

상기의 성질 i) 과 관련하여서, "상동성" 은 어떠한 종래의 알고리즘을 사용 함으로써, 바람직하게는 GAP 크리에이션 페널티 (creation penalty) 3.0 과 GAP 익스텐젼 페널티 (extension penalty) 0.1 인 GAP 페널티에 대한 디폴트 값(default value)을 사용하는 GCG 팩키지 버전 7.3 (June 1993)으로부터의 GAP 프로그램을 사용함으로써 측정될 수 있다 (Genetic Computer Group (1991) Programme Manual for the GCG Package, version 7, 575 Science Drive, Madison, Wisconsin, USA 53711).

Termamyl (SEQ ID NO: 4)과 Termamyl-유사 α-아밀라제 사이의 구조적 배열은 다른 Termamyl-유사 α-아밀라제에서 동등한/상응하는 위치를 확인하기 위하여 사용될 수 있다. 상기의 구조적 배열을 얻는 한 가지 방법은 갭 페널티의 디폴트값, 즉 3.0 의 갭 크리에이션 페널티와 0.1 의 갭 익스텐젼 페널티를 사용하여 GCG 팩키지로부터 파일 업 (Pile Up) 프로그램을 사용하는 것이다. 다른 구조적 배열 방법으로는 소수성 클러스터 분석법 [Gaboriaud et al., (1987), FEBS LETTERS 224, pp. 149-155] 및 역 트레딩법 (reverse threading)[Huber, T., Torda, AE, PROTEIN SCIENCE Vol. 7, No. 1 pp. 142-149 (1998)] 이 있다.

α-아밀라제의 성질 ii), 즉 면역학적 교차 반응성은 관련된 Termamyl-유사 α-아밀라제의 최소한 하나의 에피톱에 대하여 발생된, 또는 에피톱와 반응하는 항체를 사용하여 검정될 수 있다. 단클론성 또는 다클론성일 수 있는 항체는 당해 기술분야에 공지되어 있는 방법들, 예컨대 허드슨에 의해 기재된 방법 에 의하여 제조될 수 있다 [Hudson et al., Practical Immunology, Third edition (1989), Blackwell Scientific Publications]. 면역학적 교차-반응성은 당해 기술분야에 공지되어 있는 검정법, 예를 들면 허드슨 등의 문헌에 기재되어 있는 것과 같은 (Hudson et al., 1989) 웨스턴 블롯팅 또는 방사성 면역 확산 검정법을 사용하여 측정될 수 있다. 이런 관점에서 각각 SEQ ID NO: 1, 2, 3, 4, 5, 6, 7 또는 8 에 도시된 아미노산 서열을 가지고 있는 α-아밀라제들 사이의 면역학적 교차-반응성이 발견되었다.

상기의 성질 iii) 과 관련하여 Termamyl-유사 α-아밀라제의 특성 확인에 사용되는 올리고뉴클레오티드 프로브는 관심의 대상이 되는 α-아밀라제의 완전한 또는 부분적인 뉴클레오티드 또는 아미노산 서열을 기초로 하여 적절하게 제조될 수 있다.

혼성화를 시험하기 위하여 적당한 조건은 5×SSC 에 예비침지하고, 1 시간동안 ~40 ℃ 에서 20 % 포름아미드, 5×덴하르드트 용액, 50 mM 인산 나트륨, pH 6.8, 및 50 mg 의 변성된 초음파처리된 소 흉선 DNA 의 용액중에서 예비 혼성화시킨 후, 이어서 100 mM 의 ATP 가 첨가된 상기와 동일한 용액중에서 18 시간동안 ~40 ℃ 에서 혼성화시킨 다음, 2×SSC, 0.2 % SDS 중에서 40 ℃ 에서 (엄격도 저), 바람직하게는 50 ℃ 에서 (엄격도 중간), 보다 바람직하게는 65 ℃ 에서 (엄격도 높음), 가장 바람직하게는 약 75 ℃ 에서 (엄격도 매우 높음) 30 분동안 필터를 3 회 세척하는 것을 포함한다. 혼성화 방법에 대한 보다 상세한 설명은 샘브룩 등의 참조문헌을 참고한다 [Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor, 1989].

본 명세서에서, "으로부터 유도된" 은 관심의 대상이 되는 유기체의 세균주 에 의하여 생성된 또는 생성될 수 있는 α-아밀라제뿐만 아니라, 그러한 세균주로부터 단리된 DNA 서열에 의하여 암호화되고 상기 DNA 서열로 형질전환된 숙주 유기체에서 생성된 α-아밀라제를 가리키는 것으로 의도된다. 결국, 이 용어는 합성 및/또는 cDNA 기원의 DNA 서열에 의해 암호화되고 관심의 대상이 되는 α-아밀라제의 확인된 특성을 가지고 있는 α-아밀라제를 가리키는 것으로 의도된다. 이 용어는 또한 부모 α-아밀라제가 자연 발생적인 α-아밀라제의 변이체일 수 있음, 즉 자연 발생적인 α-아밀라제의 하나 또는 그 이상의 아미노산 잔기의 변형 (삽입, 치환, 결실)의 결과인 변이체일 수 있음을 가리키는 것으로 의도된다.

부모 하이브리드 α-아밀라제

부모 α-아밀라제 (즉 골격 α-아밀라제)는 하이브리드 α-아밀라제, 즉 최소한 두 개의 α-아밀라제로부터 유도된 부분적인 아미노산 서열이 조합되어 있는 α-아밀라제일 수 있다.

부모 하이브리드 α-아밀라제는 아미노산 상동성 및/또는 면역학적 교차-반응성 및/또는 DNA 혼성화 (상기 규정된 바와 같음)를 토대로 하여 Termamyl-유사 α-아밀라제 패밀리에 속하는 것으로 측정될 수 있는 것일 수 있다. 이 경우, 하이브리드 α-아밀라제는 전형적으로 최소한 한 부분의 Termamyl-유사 α-아밀라제와 미생물 (박테리아 또는 균류) 및/또는 포유동물 기원의 Termamyl-유사 α-아밀라제 또는 비-Termamyl-유사 α-아밀라제로부터 선택된 하나 또는 그 이상의 다른 α-아밀라제 부분(들)로 구성된다.

그러므로, 부모 하이브리드 α-아밀라제는 최소한 두 개의 Termamyl-유사 α-아밀라제로부터, 또는 최소한 하나의 Termamyl-유사 α-아밀라제와 최소한 하나의 비-Termamyl-유사 박테리아성 α-아밀라제로부터, 또는 최소한 하나의 Termamyl-유사 α-아밀라제와 최소한 하나의 진균성 α-아밀라제로부터 유도되는 부분적인 아미노산 서열들의 조합물을 포함할 수 있다. 부분적인 아미노산 서열이 유도되는 Termamyl-유사 α-아밀라제는 예를 들면, 본원에서 언급되는 특정 Termamyl-유사 α-아밀라제들 중 하나일 수 있다.

예를 들면, 부모 α-아밀라제는 B. licheniformis의 세균주로부터 유도된 α-아밀라제의 C-말단 부분, 및 B. amyloliquefaciens의 세균주로부터 또는 B. stearothermophilus의 세균주로부터 유도된 α-아밀라제의 N-말단 부분을 포함할 수 있다. 예를 들어, 부모 α-아밀라제는 B. licheniformis α-아밀라제의 C-말단 부분의 최소한 430 개의 아미노산 잔기를 포함할 수 있고, 예컨대 a) SEQ ID NO: 5 에 도시된 아미노산 서열을 가지고 있는 B. amyloliquefaciens α-아밀라제의 37 개의 N-말단 아미노산 잔기에 상응하는 아미노산 절편과 SEQ ID NO: 4 에 도시된 아미노산 서열을 가지고 있는 B. licheniformis α-아밀라제의 445 개의 C-말단 아미노산 잔기에 상응하는 아미노산 절편, 또는 Termamyl 서열과 동일한 하이브리드 Termamyl-유사 α-아밀라제, 즉 (성숙한 단백질의) N-말단의 35 개의 아미노산 잔기가 BAN (성숙한 단백질)의 N-말단의 33 개의 잔기로 대체된 것을 제외한, SEQ ID NO: 4 에 도시된 B. licheniformis α-아밀라제, 즉 SEQ ID NO: 5 에 도시된 B. amyloliquefaciens α-아밀라제; 또는 b) SEQ ID NO: 3 에 도시된 아미노산 서열을 가지고 있는 B. stearothermophilus α-아밀라제의 68 개의 N-말단 아미노산 잔기 에 상응하는 아미노산 절편 및 SEQ ID NO: 4 에 도시된 아미노산 서열을 가지고 있는 B. licheniformis α-아밀라제의 415 개의 C-말단 아미노산 잔기에 상응하는 아미노산 절편을 포함할 수 있다.

다른 적당한 부모 하이브리드 α-아밀라제는 이미 WO 96/23874 (Novo Nordisk)에서 기재되었던 것으로, 그것은 BAN, B. amyloliquefaciens α-아밀라제의 N-말단 (성숙한 단백질의 아미노산 1 내지 300) 및 Termamyl의 C-말단 (성숙한 단백질의 아미노산 301 내지 483)으로 구성된다. 증가된 활성은 상기 하이브리드 α-아밀라제 (BAN:1-300/Termamyl:301-483)의 다음 위치중 하나 또는 그 이상을 치환함으로써 이루어졌다: Q360, F290, 및 N102. 특히 관심을 끄는 치환은 다음 치환중 하나 또는 그 이상이다: Q360E,D; F290A,C,D,E,G,H,I,K,L,M,N,P,Q,R,S,T; N102D,E.

SEQ ID NO: 2 에 도시된 SP722 α-아밀라제에서의 상응하는 위치는 S365, Y295, N106 중 하나 또는 그 이상이다. SEQ ID NO: 2 에 도시된 상기 α-아밀라제에서 특히 관심있는 상응하는 치환은 S365D,E; Y295A,C,D,E,G,H,I,K,L,M,N,P,Q,R,S,T; 및 N106D,E 중 하나 또는 그 이상이다.

SEQ ID NO: 1 에 도시된 SP690 α-아밀라제에서의 상응하는 위치는 S365, Y295, N106 중 하나 또는 그 이상이다. 특히 관심을 끄는 상응하는 치환은 S365D,E; Y295A,C,D,E,G,H,I,K,L,M,N,P,Q,R,S,T; N106D,E 중 하나 또는 그 이상이다.

상기 언급된 비-Termamyl-유사 α-아밀라제는 예컨대 균류의 α-아밀라제, 포유동물 또는 식물의 α-아밀라제 또는 박테리아의 α-아밀라제 (Termamyl-유사 α-아밀라제와는 상이함)일 수 있다. 그러한 α-아밀라제의 특이한 실예로는 Aspergillus oryzae TAKA α-아밀라제, Aspergillus niger 산 α-아밀라제, Bacillus subtilis α-아밀라제, 돼지 췌장의 α-아밀라제 및 보리의 α-아밀라제가 있다. 이들 α-아밀라제는 모두 본원에서 언급되는 바와 같이 전형적인 Termamyl-유사 α-아밀라제의 구조와는 현저하게 상이한 해명된 구조를 가지고 있다.

상기 언급된, 즉 Aspergillus niger 및 Aspergillus oryzae로부터 유도된 균류 α-아밀라제들은 아미노산 수준에서 볼 때 매우 상동성이고, 일반적으로 동일한 α-아밀라제 패밀리에 속하는 것으로 간주된다. Aspergillus oryzae로부터 유도된 균류 α-아밀라제는 상표명 Fungamyl^TM 으로 시판중이다.

나아가, Termamyl-유사 α-아밀라제의 특정 변이체 (본 발명의 변이체)가 -종래 방식대로- 특이한 Termamyl-유사 α-아밀라제의 아미노산 서열의 특정 아미노산 잔기의 변형 (예컨대 결실 또는 치환)과 관련하여 언급되는 때에는, 동등한 위치(들)에서 변형된 (각각의 아미노산 서열 사이의 가장 좋은 가능한 아미노산 서열 배열로부터 측정되는 바) 다른 Termamyl-유사 α-아밀라제의 변이체들도 따라서 포함되는 것으로 이해되어져야 한다.

본 발명의 바람직한 구체예에서, α-아밀라제 골격은 B. licheniformis (부모 Termamyl-유사 α-아밀라제로서), 예컨대 상기 언급된 것들 중 하나, 예를 들면 SEQ ID NO:4 에 도시된 아미노산 서열을 가지고 있는 B. licheniformis α-아밀라제로부터 유도된다.

본 발명의 변이체들의 변경된 성질

하기에서는 본 발명의 변이체들에 존재하는 돌연변이들 사이의 관계, 및 그것으로부터 유발될 수 있는 성질 (부모 Termamyl-유사 α-아밀라제와 관련하여)의 바람직한 변경에 대해 논의된다.

pH 8 내지 10.5 에서의 증가된 안정성

본 발명의 명세서에서, 높은 pH (즉 pH 8 내지 10.5)에서 증가된 안정성을 이루는 것과 관련하여 중요한 돌연변이 (아미노산 치환을 포함함)는 SP722 α-아밀라제 (SEQ ID NO: 2 에 도시된 아미노산 서열을 가지고 있음)의 다음의 위치중 하나 또는 그 이상에서의 돌연변이에 상응하는 돌연변이를 포함한다: T141, K142, F143, D144, F145, P146, G147, R148, G149, R181, A186, S193, N195, K269, N270, K311, K458, P459, T461.

본 발명의 변이체는 하나 또는 그 이상의 다음의 치환을 갖는다 (SEQ ID NO: 2 의 넘버링을 사용함):

바람직한 높은 pH 안정성 변이체들은 SP722 α-아밀라제 (SEQ ID NO: 2 에 도시된 아미노산 서열을 가지고 있음)에서 다음의 치환 중 하나 또는 그 이상을 포함한다: K142R, R181S, A186T, S193P, N195F, K269R, N270Y, K311R, K458R, P459T 및 T461P.

특정 구체예에서, SEQ ID NO: 1 에 도시된 서열을 가지고 있는 Bacillus 세균주 NCIB 12512 α-아밀라제, 또는 SEQ ID NO: 3 에 도시된 서열을 가지고 있는 B. stearothermophilus α-아밀라제, 또는 SEQ ID NO: 4 에 도시된 서열을 가지고 있는 B. licheniformis α-아밀라제, 또는 SEQ ID NO: 5 에 도시된 서열을 가지고 있는 B. amyloliquefaciens α-아밀라제가 이들 돌연변이를 위한 골격, 즉 부모 Termamyl-유사 α-아밀라제로서 사용된다.

도 1 에 도시된 배열로부터 알 수 있는 바와 같이, B. stearothermophilus α-아밀라제는 이미 SP722 의 N270 에 상응하는 위치에 티로신을 가지고 있다. 나아가, Bacillus 세균주 NCIB 12512 α-아밀라제, B. stearothermophilus α-아밀라제, B. licheniformis α-아밀라제 및 B. amyloliquefaciens α-아밀라제는 이미 SP722 의 K458 에 상응하는 위치에 아르기닌을 가지고 있다. 또한, B. licheniformis α-아밀라제는 이미 SP722 의 T461 에 상응하는 위치에 프롤린을 가지고 있다. 그러므로, 상기 α-아밀라제들에 대해서는 이들 치환이 관련되지 않는다.

높은 pH 에서 증가된 안정성을 나타내는 α-아밀라제 변이체들은 하기 실시예 2 에서 언급되는 분자 역학 시뮬레이션을 사용하여 발견된 영역에 치환을 일으킴으로써 제조될 수 있다. 시뮬레이션은 중간 pH 와 비교할 때 높은 pH (즉 pH 8 내지 10.5)에서 보다 큰 유연성 (flexibility) 또는 이동성을 가지는 영역(들)을 묘사한다.

그것의 삼차원 구조가 WO 96/23874 (Novo Nordisk)의 아펜딕스 1 에 게재되어 있는 Termamyl-유사 α-아밀라제에 대해 (하기에서 규정되는 바와 같은) 상동성을 가지고 있는 어떠한 박테리아 알파-아밀라제의 구조를 사용함으로써, 그러한 알파-아밀라제의 구조를 모델화하고 그것을 분자 역학 시뮬레이션에 적용시키는 것이 가능하다. 상기 박테리아 α-아밀라제의 상동성은 GAP 페널티에 대한 디폴트값을 사용하여 GCG 팩키지 버전 7.3 으로부터의 UWGCG GAP 프로그램을 사용하여 측정된 바, 상기 언급된 Termamyl-유사 α-아밀라제 (BA2)에 최소한 60 %, 바람직하게는 70 % 이상, 보다 바람직하게는 80 % 이상, 가장 바람직하게는 90 % 이상 상동할 수 있다 [Genetic Computer Group (1991) Programme Manual for the GCG Package, version 7, 575 Science Drive, Madison, Wisconsin, USA 53711]. 다른 것에 대한 바람직하지 않은 잔기의 치환도 적용될 수 있을 것이다.

pH 8 내지 10.5 에서의 증가된 Ca ²⁺ 안정성

증가된 Ca²⁺ 안정성은 Ca²⁺ 고갈이 개선되었을 때의 효소의 안정성을 의미한다. 본 발명의 명세서에서, 높은 pH 에서 증가된 Ca²⁺ 안정성을 이루는 것과 관련하여 중요한 돌연변이 (아미노산 치환을 포함함)는 SEQ ID NO: 2 에 도시된 아미노산 서열을 가지고 있는 SP722 α-아밀라제의 다음의 위치에 상응하는 하나 또는 그 이상의 위치에서의 돌연변이 또는 결실을 포함한다: R181, G182, D183, G184, K185, A186, W189, N195, N270, E346, K385, K458, P459.

본 발명의 변이체들은 하기의 치환 또는 결실중 하나 또는 그 이상의 치환 또는 결실을 포함하고 있다:

바람직한 변이체들은 하나 또는 그 이상의 다음의 치환 또는 결실을 가지고 있는 것들이다:

R181Q,N; G182T,S,N; D183^*; G184^*;

K185A,R,D,C,E,Q,G,H,I,L,M,N,F,P,S,T,W,Y,V; A186T,S,N,I,V;

W189T,S,N,Q; N195F, N270R,D; E346Q; K385R; K458R; P459T.

특정 구체예에서, SEQ ID NO: 1 에 도시된 서열을 가지고 있는 Bacillus 세균주 NCIB 12512 α-아밀라제, 또는 SEQ ID NO: 5 에 도시된 서열을 가지고 있는 B. amyloliquefaciens α-아밀라제, 또는 SEQ ID NO: 4 에 도시된 서열을 가지고 있는 B. licheniformis α-아밀라제가 이들 돌연변이를 위한 골격으로서 사용된다.

도 1 에 도시된 배열로부터 알 수 있는 바와 같이, B. licheniformis α-아밀라제는 SP722 의 D183 및 G184 에 상응하는 위치를 가지고 있지 않다. 그러므로 상기 α-아밀라제에 대해서는 이들 결실은 관계가 없다.

바람직한 구체예에서, 변이체는 D183 및 G184 가 결실되어 있고 또한 다음의 치환중 하나를 포함하고 있는 Bacillus 세균주 NCIB 12512 α-아밀라제이다: R181Q,N 및/또는 G182T,S,N 및/또는 D183^*; G184^* 및/또는 K185A,R,D,C,E,Q,G,H,I,L,M,N,F,P,S,T,W,Y,V 및/또는 A186T,S,N,I,V 및/또는 W189T,S,N,Q 및/또는 N195F 및/또는 N270R,D 및/또는 E346Q 및/또는 K385R 및/또는 K458R 및/또는 P459T.

중간 온도에서의 증가된 특이 활성

본 발명의 추가의 측면으로, 10 내지 60 ℃, 바람직하게는 20 내지 50 ℃, 특히 30 내지 40 ℃ 의 온도에서 증가된 특이 활성을 나타내는 변이체들을 얻는 것과 관련하여 중요한 돌연변이는, SEQ ID NO: 2 에 도시된 아미노산 서열을 가지고 있는 SP722 α-아밀라제의 하나 또는 그 이상의 다음의 위치에 상응하는 돌연변이를 포함한다: H107, K108, G109, D166, W167, D168, Q169, S170, R171, Q172, F173, Q174, D183, G184, N195, F267, W268, K269, N270, D271, L272, G273, A274, L275, G456, N457, K458, P459, G460, T461, V462, T463.

본 발명의 변이체는 하나 또는 그 이상의 다음의 치환을 포함한다:

바람직한 변이체들은 하나 또는 그 이상의 다음의 치환 또는 결실을 포함하고 있다: Q174^*, D183^*, G184^*, K269S.

특정 구체예에서, SEQ ID NO: 4 에 도시된 서열을 가지고 있는 B. licheniformis α-아밀라제가 이들 돌연변이를 위한 골격으로서 사용된다.

본 발명의 변이체들의 일반적인 돌연변이: 중간 온도에서의 증가된 특이 활성

특히 관심을 끄는 아미노산 치환은 효소의 활성 부위 주변의 이동성을 증가시키는 치환이다. 이것은 활성 부위와 근접한 부위, 즉 활성 부위를 구성하는 잔 기들중 어느 것으로부터든지 바람직하게는 10 Å 또는 8 Å 또는 6 Å 또는 4 Å 거리내에 있는 부위에서의 안정화 상호작용을 파괴하는 변화에 의하여 이루어진다.

그러한 것의 실예로는 측쇄의 크기를 감소시키는 돌연변이, 예를 들면 Ala 의 Gly 으로의 돌연변이, Val 의 Ala 또는 Gly 으로의 돌연변이, Ile 또는 Leu 의 Val, Ala, 또는 Gly 으로의 돌연변이, Thr 의 Ser 으로의 돌연변이가 있다.

그러한 돌연변이들은 공동 (cavities)의 도입에 의해서나 또는 돌연변이에 의한 좌측의 공간을 채우는 구조적 재배열에 의해서 활성 부위 영역에서의 유연성의 증가를 유발시키는 것으로 예상된다.

본 발명의 변이체는 상기에서 대략적으로 설명된 것 외에 하나 또는 그 이상의 변형을 포함하는 것이 바람직할 것이다. 그러므로, 변형된 α-아밀라제 변이체의 부분에 존재하는 하나 또는 그 이상의 프롤린 잔기가 가능한, 자연 발생적인 비-프롤린성 잔기중 어느 하나일 수 있고, 바람직하게는 알라닌, 글리신, 세린, 트레오닌, 발린 또는 류신인 비-프롤린성 잔기로 대체되는 것이 유익할 것이다.

유사하게, 변형된 부모 α-아밀라제의 아미노산 잔기들중에 존재하는 하나 또는 그 이상의 시스테인 잔기가 세린, 알라닌, 트레오닌, 글리신, 발린 또는 류신과 같은 비-시스테인성 잔기로 대체되는 것이 바람직할 것이다.

나아가, 본 발명의 변이체는 - 유일한 변형으로서 또는 상기에서 대략적으로 설명된 변형들중 어느 것과의 조합상태로 - 변형될 수 있어서, SEQ ID NO: 4 의 아미노산 단편 185-209 에 상응하는 아미노산 단편에 존재하는 하나 또는 그 이상의 Asp 및/또는 Glu 가, 각각 Asn 및/또는 Gln 으로 대체된다. 또한 관심의 대상이 되는 것은 Termamyl-유사 α-아밀라제에서, SEQ ID NO: 4 의 아미노산 단편 185-209 에 상응하는 아미노산 단편에 존재하는 하나 또는 그 이상의 Lys 잔기들이 Arg 으로 대체되는 것이다.

본 발명이 상기에서 대략적으로 설명된 변형들을 둘 또는 그 이상 포함하고 있는 변이체들을 포함한다는 것이 이해될 것이다.

나아가, 본원에서 설명되는 변이체들중 어떤 것에든지 점-돌연변이를 도입시키는 것이 유익할 수 있다.

활성 부위 주변에서 증가된 이동성을 가지고 있는 α-아밀라제 변이체

본 발명의 α-아밀라제 변이체의 이동성은 기질 부위에 근접한 하나 또는 그 이상의 위치에 있는 하나 또는 그 이상의 아미노산 잔기를 대체시킴으로써 증가될 수 있다. 이들 위치는 (SP722 α-아밀라제 (SEQ ID NO: 2) 넘버링을 사용하여) 다음과 같다: V56, K108, D168, Q169, Q172, L201, K269, L272, L275, K446, P459.

그러므로, 한 측면으로 본 발명은 상기 언급된 위치중 하나 또는 그 이상의 위치에서 돌연변이되는 변이체들에 관한 것이다.

바람직한 치환은 다음중 하나 또는 그 이상의 것들이다:

본 발명의 특정한 구체예에서, SEQ ID NO: 1 에 도시된 서열을 가지고 있는 Bacillus 세균주 NCIB 12512 α-아밀라제, 또는 SEQ ID NO: 3 에 도시된 서열을 가지고 있는 B. stearothermophilus α-아밀라제, 또는 SEQ ID NO: 4 에 도시된 서열을 가지고 있는 B. licheniformis α-아밀라제, 또는 SEQ ID NO: 5 에 도시된 서열을 가지고 있는 B. amyloliquefaciens α-아밀라제가 이들 돌연변이를 위한 골격으로서 사용된다.

도 1 에 도시된 배열로부터 알 수 있는 바와 같이, B. licheniformis α-아밀라제와 B. amyloliquefaciens α-아밀라제는 SP722 의 K269 에 상응하는 위치에 글루타민을 가지고 있다. 또한, B. stearothermophilus α-아밀라제는 SP722 의 K269 에 상응하는 위치에 세린을 가지고 있다. 그러므로, 상기 α-아밀라제에 대해서는 이들 치환은 관계가 없다.

나아가, 도 1 에 도시된 배열로부터 알 수 있는 바와 같이, B. amyloliquefaciens α-아밀라제는 SP722 의 L272 에 상응하는 위치에 알라닌을 가지고 있고, B. stearothermophilus α-아밀라제는 SP722 의 L272 에 상응하는 위치 에 이소류신을 가지고 있다. 그러므로, 상기 α-아밀라제들에 대해 이들 치환은 관계가 없다.

도 1 에 도시된 배열로부터 알 수 있는 바와 같이, Bacillus 세균주 12512 α-아밀라제는 SP722 의 L275 에 상응하는 위치에 이소류신을 가지고 있다. 그러므로, 상기 α-아밀라제에 대하여 이 치환은 관계가 없다.

도 1 에 도시된 배열로부터 알 수 있는 바와 같이, B. amyloliquefaciens α-아밀라제는 SP722 의 Y295 에 상응하는 위치에 페닐알라닌을 가지고 있다. 또한, B. stearothermophilus α-아밀라제는 SP722 의 Y295 에 상응하는 위치에 아스파라긴을 가지고 있다. 그러므로, 상기 α-아밀라제들에 대하여 이들 치환은 관계가 없다.

도 1 에 도시된 배열로부터 알 수 있는 바와 같이, B. licheniformis α-아밀라제 및 B. amyloliquefaciens α-아밀라제는 SP722 의 K446 에 상응하는 위치에 아스파라긴을 가지고 있다. 또한, B. stearothermophilus α-아밀라제는 SP722 의 K446 에 상응하는 위치에 히스티딘을 가지고 있다. 그러므로, 상기 α-아밀라제들에 대하여 이들 치환은 관계가 없다.

도 1 에 도시된 배열로부터 알 수 있는 바와 같이, B. licheniformis α-아밀라제, B. amyloliquefaciens α-아밀라제 및 B. stearothermophilus α-아밀라제는 SP722 의 P459 에 상응하는 위치에 세린을 가지고 있다. 또한, Bacillus 세균주 12512 α-아밀라제는 SP722 의 P459 에 상응하는 위치에 트레오닌을 가지고 있다. 그러므로, 상기 α-아밀라제들에 대하여 이들 치환은 관계가 없다.

중간 온도에서 높은 활성을 가지고 있는 효소들의 안정화

추가의 구체예에서, 본 발명은 저온 α-아밀라제 (예컨대 Alteromonas haloplanctis [Feller et al., (1994), Eur. J. Biochem. 222:441-447]), 및 중간 온도 활성을 가지고 있는 중간 온도 α-아밀라제 (예컨대 SP722 및 SP690), 즉 통상적으로 호저온성 효소 및 호중온성 효소로 알려져 있는 α-아밀라제들의 안정성을 개선시키는 것에 관한 것이다. 이 특정 효소 부류에 대한 안정성은 열안정성 또는 칼슘 고갈 상태에서의 안정성중 어느 하나인 것으로 이해될 수 있다.

전형적으로, 중간 온도에서 높은 활성을 나타내는 효소들은 또한 온도 또는 칼슘 고갈과 같은, 효소에 스트레스를 주는 조건하에서 심각한 문제점들을 나타낸다.

따라서, 본 발명의 목적은 경미하게 스트레스를 받는 조건하에서도 그것들의 활성을 잃어버리지 않으면서 중간 온도에서 원하는 높은 활성을 동시에 나타내는 효소들을 제공하는 것이다.

중간 온도에서 측정된 안정화된 변이체의 활성은 바람직하게는 효소의 안정화전에 그 특정 온도에서의 원래의 활성의 100 % 이상과 50 % 사이이어야 하고, 보다 바람직하게는 100 % 이상과 70 % 사이, 가장 바람직하게는 100 % 이상과 85 % 사이이어야 하며, 그 결과 효소는 스트레스를 받는 조건에서 야생형 효소보다 더 긴 인큐베이션을 견뎌내야 한다.

예상되는 효소들로는 예컨대 박테리아 또는 균류 기원의 α-아밀라제들이다.

그러한 저온 α-아밀라제의 실예는 Alteromonas haloplanctis로부터 단리된 것이다 [Feller et al., (1994), Eur. J. Biochem. 222:441-447]. 이 알파-아밀라제의 결정 구조는 해명되었다 [Aghajari et al., (1998), Protein Science 7:564-572].

Alteromonas haloplanctis 알파-아밀라제 (도 4 에 도시된 배열중 5)는 돼지 췌장의 알파-아밀라제 (PPA) (도 4 에 도시된 배열중 3)에 대하여 대략 66 % 의 상동성을 가지고 있다. PPA 3-차원 구조는 알려져 있으며, 상표명 1OSE 또는 1DHK 하에 브룩크하벤 데이터베이스사 (Brookhaven database)로부터 구할 수 있다. 다른 보다 안정한 알파 아밀라제에 대한 상동성을 토대로 하여, Alteromonas haloplanctis 알파-아밀라제로부터 "저온 고도 활성 효소" 가 얻어질 수 있고, 동시에 중간 온도에서 원하는 높은 활성을 보유하고 있다.

도 4 는 AHA 및 PPA α-아밀라제를 포함하여 5 개의 α-아밀라제의 다중 서열 배열을 도시한다. Alteromonas haloplanctis 알파-아밀라제의 안정성을 증가시키는 특정 돌연변이는 다음과 같다: T66P, Q69P, R155P, Q177R, A205P, A232P, L243R, V295P, S315R.

α-아밀라제 변이체의 제조방법

유전자안에 돌연변이를 도입시키기 위한 여러 가지 방법이 당해 기술분야에 공지되어 있다. α-아밀라제-암호화 DNA 서열의 클로닝에 대하여 간단히 논의된 후에 α-아밀라제-암호화 서열내에 있는 특정 부위에서의 돌연변이법 방법이 논의될 것이다.

α-아밀라제를 암호화하는 DNA 서열의 클로닝

부모 α-아밀라제를 암호화하는 DNA 서열은 관심의 α-아밀라제를 생성하는 모든 세포 또는 미생물로부터, 당해 기술분야에 잘 알려져 있는 다양한 방법들을 사용하여 단리될 수 있다. 먼저, 게놈 DNA 및/또는 cDNA 라이브러리는 연구될 α-아밀라제를 생성하는 유기체로부터 염색체 DNA 또는 메신저 RNA 를 사용하여 구성되어야 한다. 그런 다음, 만약 α-아밀라제의 아미노산 서열이 공지되어 있다면, 상동성의 표지된 올리고뉴클레오티드 프로브가 합성될 수 있고, 관심의 유기체로부터 제조되는 게놈 라이브러리로부터 α-아밀라제를 암호화하는 클론을 확인하기 위하여 사용될 수 있다. 또는 달리, 공지의 α-아밀라제 유전자에 상동하는 서열을 함유하고 있는 표지된 올리고뉴클레오티드 프로브가, 엄격도가 더 낮은 혼성화 및 세척 조건을 사용하여, α-아밀라제를 암호화하는 클론을 확인하기 위한 프로브로서 사용될 수 있을 것이다.

α-아밀라제를 암호화하는 클론을 확인하기 위한 또 다른 방법은 플라스미드와 같은 발현 벡터안에 게놈 DNA 의 단편을 삽입하고, 그 결과의 게놈 DNA 라이브러리로 α-아밀라제-음성 박테리아를 형질전환시킨 후, 형질전환된 박테리아를 α-아밀라제에 대한 기질을 함유하고 있는 아가위에 플레이팅함으로써, α-아밀라제를 발현하는 클론이 확인되는 것을 가능하게 하는 과정을 포함할 것이다.

또는 달리, 효소를 암호화하는 DNA 서열은 수립되어 있는 표준 방법, 예컨대 포스포로아미다이트 방법 [S.L. Beaucage and M.H. Caruthers (1981)] 또는 마테스 등의 방법 (Matthes et al., (1984))에 의하여 합성 제조될 수도 있다. 포스포로아미다이트 방법에서, 올리고뉴클레오티드는 예컨대 자동 DNA 합성기에서 합성되 고, 정제되며, 어닐링되고, 결찰된 후, 적절한 벡터안에 클로닝된다.

마지막으로, DNA 서열은 합성 기원, 게놈 기원 또는 cDNA 기원의 DNA 단편들 (필요에 따라 완전한 DNA 서열의 다양한 부분들에 상응하는 단편들)을 표준 기법에 따라 결찰시킴에 의해 제조된 게놈 및 합성 기원의 혼합형, 합성 및 cDNA 기원의 혼합형, 또는 게놈과 cDNA 기원의 혼합형일 수 있다. DNA 서열은 또한 특이한 프라이머, 예를 들면 미국 특허 제 4,683,202 호에 또는 사이키 등 (R.K. Saiki et al., (1988))에 의해 설명된 바와 같은 프라이머를 사용하여 중합효소 연쇄 반응 (PCR)에 의하여 제조될 수도 있다.

α-아밀라제 변이체의 발현

본 발명에 따라, 상술된 방법에 의해, 또는 당해 기술분야에 공지되어 있는 어떠한 대용 방법에 의하여 제조된 변이체를 암호화하는 DNA 서열은, 전형적으로 프로모터, 오퍼레이터, 리보솜 결합 부위, 번역 개시 신호, 및 임의로 리프레서 유전자 또는 다양한 활성화제 유전자를 암호화하는 조절 서열들을 포함하고 있는 발현 벡터를 사용하여 효소 형태로 발현될 수 있다.

본 발명의 α-아밀라제 변이체를 암호화하는 DNA 서열을 포함하고 있는 재조합 발현 벡터는 재조합 DNA 과정을 편리하게 수행할 수 있는 모든 유형의 벡터일 수 있으며, 벡터의 선택은 때로 그것이 도입되는 숙주 세포에 따라 좌우될 것이다. 그러므로, 벡터는 자동적으로 복제하는 벡터, 즉 그것의 복제가 염색체성 복제와는 무관한 염색체외적으로 존재하는 실체로서 존재하는 벡터, 예컨대 플라스미드, 박테리오파지 또는 염색체외재성 엘레먼트, 미니크로모좀 또는 인공제조된 염색체일 수 있다. 또는 달리, 벡터는 숙주 세포에 도입되었을 때, 숙주 세포 게놈안에 통합되어 그것이 통합된 염색체(들)과 함께 복제되는 그러한 것일 수도 있다.

벡터에서, DNA 서열은 적당한 프로모터 서열에 작동가능하게 연결되어야 한다. 프로모터는 선택된 숙주 세포에서 전사 활성을 나타내는 어떠한 DNA 서열일 수 있고 숙주 세포에 동종성이거나 이종성인 단백질을 암호화하는 유전자로부터 유도될 수 있다. 본 발명의 α-아밀라제 변이체를 암호화하는 DNA 서열의 전사를, 특히 박테리아 숙주에서 지시하기에 적당한 프로모터의 실예로는 대장균의 lac 오페론의 프로모터, Streptomyces coelicolor 아가라제 유전자 dagA 프로모터, Bacillus licheniformis α-아밀라제 유전자 (amyL)의 프로모터, Bacillus stearothermophilus 말토제닉 아밀라제 유전자 (amyM)의 프로모터, Bacillus amyloliquefaciens α-아밀라제 (amyQ)의 프로모터, B. subtilis xylA 및 xylB 유전자의 프로모터 등이 있다. 균류 숙주에서의 전사를 위해서 유용한 프로모터의 실예로는 A. oryzae TAKA 아밀라제, Rhizomucor miehei 아스파틱 단백질 가수분해효소, A. niger 중성 α-아밀라제, A. niger 산 안정성 α-아밀라제, A. niger 글루코아밀라제, Rhizomucor miehei 리파아제, A. oryzae 알칼리성 프로테아제, A. oryzae 트리오스 포스페이트 이소메라제 또는 A. nidulans 아세트아미다아제를 암호화하는 유전자로부터 유도되는 것들이 있다.

본 발명의 발현 벡터는 또한 적당한 전사 터미네이터, 및 진핵세포에서, 본 발명의 α-아밀라제 변이체를 암호화하는 DNA 서열에 작동가능하게 연결된 폴리-아데닐화 서열을 포함할 수 있다. 터미네이션 및 폴리아데닐화 서열은 프로모터와 동일한 공급원으로부터 적절하게 유도될 수 있다.

벡터는 또한 관심의 숙주 세포에서 벡터가 복제되는 것을 가능하게 하는 DNA 서열을 포함할 수 있다. 그러한 서열의 실예는 플라스미드 pUC19, pACYC177, pUB110, pE194, pAMB1 및 pIJ702 의 복제원점이다.

벡터는 또한 선택가능한 마커, 예컨대 그것의 생성물이 숙주 세포에서의 결핍을 보충하는 유전자, 예를 들면, B. subtilis 또는 B. licheniformis로부터 얻어지는 dal 유전자, 또는 암피실린, 카나마이신, 클로람페니콜 또는 테트라사이클린 내성과 같은 항생물질 내성을 부여하는 유전자를 포함할 수 있다. 나아가, 벡터는 amdS, argB, niaD 및 sC 와 같은 Aspergillus 선택 마커, 하이그로마이신 내성을 유발하는 마커를 포함할 수 있으며, 또는 선택은 예컨대 WO 91/17243 에 기재된 바와 같은 공-형질전환에 의하여 이루어질 수 있다.

세포내 발현이 예컨대 숙주 세포로서 특정 박테리아를 사용할 때 어떤 관점에서는 유익할 수 있는 한편으로, 일반적으로 발현은 세포외적으로 이루어지는 것이 바람직하다. 일반적으로, 본원에서 언급되는 Bacillus α-아밀라제들은 발현된 프로테아제의 배양 배지로의 분비를 허용하는 예비영역을 포함하고 있다. 필요하다면, 이 예비영역은 상이한 예비영역 또는 신호 서열로 대체될 수 있는데, 이것은 각각의 예비영역을 암호화하는 DNA 서열을 치환시킴으로써 편리하게 이루어진다.

α-아밀라제 변이체, 프로모터, 터미네이터 및 다른 엘레먼트들을 각각 암호화하는 본 발명의 DNA 구조체를 결찰하기 위한 과정들, 및 그것들을 복제에 필요한 정보를 함유하고 있는 적당한 벡터에 삽입하기 위한 과정들은 당업자에게 잘 알려 져 있다 [예를 들면 Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor, 1989 참조].

DNA 구조체를 포함하고 있거나 상기 규정된 바와 같은 본 발명의 발현 벡터를 포함하고 있는 본 발명의 세포는 유익하게도, 본 발명의 α-아밀라제 변이체의 재조합 제조에서 숙주 세포로서 사용된다. 세포는 편리하게는 숙주 염색체안에 DNA 구조체를 (하나 또는 그 이상의 복사물로서) 통합시킴에 의해, 변이체를 암호화하는 본 발명의 DNA 구조체로 형질전환될 수 있다. 이러한 통합은 일반적으로 DNA 서열이 보다 더 세포에서 안정하게 유지되는 것으로 여겨지기 때문에 유익한 것으로 간주된다. 숙주 염색체안으로의 DNA 구조체의 통합은 종래 방법에 따라, 예를 들면 동형 또는 이형 재조합에 의하여 수행될 수 있다. 또는 달리, 세포는 숙주 세포의 상이한 유형과 관련하여 상술된 바와 같이 발현 벡터로 형질전환될 수도 있다.

본 발명의 세포는 포유동물 또는 곤충과 같은 고등 유기체의 세포일 수도 있지만, 예컨대 박테리아 또는 균류 (효모를 포함함) 세포와 같은 미생물 세포가 바람직하다.

적당한 박테리아의 실예로는 그람 양성 박테리아, 예컨대 Bacillus subtilis, Bacillus licheniformis, Bacillus lentus, Bacillus brevis, Bacillus stearothermophilus, Bacillus alkalophilus, Bacillus amyloliquefaciens, Bacillus coagulans, Bacillus circulans, Bacillus lautus, Bacillus megaterium, Bacillus thuringiensis, 또는 Streptomyces lividans 또는 Streptomyces murinus, 또는 E. coli와 같은 그람 음성 박테리아가 있다. 박테리아의 형질전환은 예를 들면, 원형질체 형질전환에 의해 또는 공지된 방법 자체대로 경합 세포를 사용함으로써 이루어질 수 있다.

효모 유기체는 바람직하게는 Saccharomyces 또는 Schizosaccharomyces 종, 예컨대 Saccharomyces cerevisiae, 으로부터 선택될 수 있다. 필라멘트형 균류는 유익하게도 Aspergillus 종, 예컨대 Aspergillus oryzae 또는 Aspergillus niger에 속할 수 있다. 균류 세포는 원형질체 형성 및 원형질체의 형질전환과 이어서 공지된 자체의 방법을 사용한 세포 벽의 재생을 포함하는 방법에 의하여 형질전환될 수 있다. Aspergillus 숙주 세포의 형질전환에 적절한 과정은 EP 238 023 에 설명되어 있다.

여전히 추가의 측면으로, 본 발명은 본 발명의 α-아밀라제 변이체를 제조하는 방법에 관한 것으로, 이 방법은 상술된 바와 같은 숙주 세포를 변이체의 생성이 수행될 수 있는 조건하에서 배양시킨 후, 세포 및/또는 배양 배지로부터 변이체를 회수하는 것으로 이루어진다.

세포를 배양시키기 위하여 사용되는 배지는, 관심의 숙주 세포를 성장시키고, 본 발명의 α-아밀라제 변이체의 발현을 얻기에 적당한 것이면, 종래의 배지중 어떤 것이든지 좋을 것이다. 적당한 배지는 상업적인 공급자로부터 구입할 수 있거나 또는 공개된 방법에 따라 (예컨대 American Type Culture Collection의 카탈로그에 기재된 대로) 제조될 수 있다.

숙주 세포로부터 분비된 α-아밀라제 변이체는, 편리하게는 세포를 원심분리 또는 여과에 의하여 배지로부터 분리하고, 배지의 단백질성 성분을 황산 암모늄과 같은 염에 의하여 침전시킨 다음, 이온 교환 크로마토그래피, 친화성 크로마토그래피, 등과 같은 크로마토그래피 과정을 사용하는 것을 포함하는, 잘 알려져 있는 방법들에 의하여 배양 배지로부터 회수될 수 있다.

산업적 응용

본 발명의 α-아밀라제 변이체는 다양한 산업적 응용이 가능한 가치있는 성질을 가지고 있다. 특히, 본 발명의 효소 변이체들은 세척, 식기세척 및 경질-표면 세정 세제 조성물의 성분으로서 사용될 수 있다.

많은 변이체들이 감미료 및 녹말로부터 에탄올 제조에, 및/또는 직물 식기세척에 특히 유용하다. 녹말 액화 및/또는 당화 과정을 포함한 종래의 녹말-전환 과정 조건은 예컨대 미국 특허 제 3,912,590 호, 및 EP 특허 공보 제 252,730 호 및 63,909 호에 게재되어 있다.

세제 조성물

상기 언급된 바와 같이, 본 발명의 변이체들은 세제 조성물에 적절하게 혼입될 수 있다. 세제 조성물 (예컨대 세탁 또는 식기세척용 세제)의 성분들, 그러한 세제 조성물에 변이체들을 제형시키는 방법, 및 예를 들어 세제 조성물의 관련된 유형에 관련된 보다 상세한 설명은 WO 96/23874 및 WO 97/07202 를 참조한다.

본 발명의 변이체를 포함하고 있는 세제 조성물은 하나 또는 그 이상의 다른 효소, 예컨대 리파아제, 큐티나제, 프로테아제, 셀룰라제, 페록시다제 또는 락카아제, 및/또는 다른 α-아밀라제를 추가로 포함할 수 있다.

본 발명의 α-아밀라제 변이체들은 종래 사용되는 농도로 세제에 혼입될 수 있다. 본 발명의 변이체는 종래부터 사용되는 세제의 용량 수준을 사용하여 세척/식기세척액의 리터당 α-아밀라제의 0.00001 내지 1 mg (순수한 활성 효소 단백질로서 계산됨)에 상응하는 양으로 혼입될 수 있는 것으로 현재 예상된다.

본 발명은 또한 1) 변경된 최적 pH, 및/또는 2) 변경된 최적 온도, 및/또는 3) 증가된 안정성을 가지는 α-아밀라제를 제공하는 방법에 관한 것으로, 이 방법은 다음 단계들로 이루어진다:

i) 실질적으로 상이한 pH, 온도 및/또는 안정성 프로필을 가지고 있는 둘 또는 그 이상의 α-아밀라제의 3-차원 구조의 분자 역학을 비교함으로써 α-아밀라제의 돌연변이를 위한 표적 위치(들) 및/또는 영역(들)을 확인하는 단계,

ii) 확인된 위치(들) 및/또는 영역(들)에서 하나 또는 그 이상의 아미노산을 치환, 첨가 및/또는 결실시키는 단계.

본 발명의 구체예에서 중간 온도 α-아밀라제는 고온 α-아밀라제와 비교된다. 다른 구체예에서는 저온 α-아밀라제가 중간 온도 α-아밀라제 또는 고온 α-아밀라제중 하나와 비교된다.

비교되는 α-아밀라제들은 바람직하게는 상호간에 최소한 70 %, 바람직하게는 80 %, 90 % 까지, 예컨대 95 % 까지, 특별히 95 % 상동하여야 한다.

비교되는 α-아밀라제들은 상기 규정된 바와 같은 Termamyl-유사 α-아밀라제들일 수 있다. 특정한 구체예에서 비교되는 α-아밀라제들은 SEQ ID NO: 1 내지 SEQ ID NO: 8 에 도시된 α-아밀라제들이다.

다른 구체예에서, 비교되는 관심의 α-아밀라제들의 안정성 프로필은 Ca²⁺ 의존성 프로필이다.

재료 및 방법

효소:

SP722: (SEQ ID NO: 2, Novo Nordisk 사에서 구입할 수 있음)

Termamyl^TM (SEQ ID NO: 4, Novo Nordisk 사에서 구입할 수 있음)

SP690: (SEQ ID NO: 1, Novo Nordisk 사에서 구입할 수 있음)

Bacillus subtilis SHA273: WO 95/10603 참조.

플라스미드

pJE1 은 성숙한 단백질의 아미노산 D183-G184 에 상응하는 6 개의 뉴클레오티드가 결실되어 있는 SP722 α-아밀라제 (SEQ ID NO: 2): viz. 의 변이체를 암호화하는 유전자를 함유하고 있다. JE1 유전자의 전사는 amyL 프로모터로부터 지시를 받는다. 이 플라스미드는 또한 복제원점 및 플라스미드 pUB110 (Gryczan, TJ et al., (1978), J. Bact. 134:318-329)으로부터 얻어지는 카나마이신에 대한 내성을 부여하는 cat-유전자를 함유하고 있다.

방법:

라이브러리 벡터 pDorK101 의 제조

대장균/Bacillus 셔틀 벡터 pDorK101 (하기에서 설명됨)은 대장균에서 α-아밀라제가 발현되는 일 없이 돌연변이를 도입시키기 위하여 사용될 수 있고, 그런 다음 Bacillus에서 α-아밀라제가 활성이 되도록 변형될 수 있다. 이 벡터는 다음과 같이 제조하였다: JE1 암호화 유전자 (D183-G184 가 결실된 SP722)를 대장균 복제원점을 함유하고 있는 1.2 kb 단편을 사용하여 SEQ ID NO: 2: SP722 의 5' 코딩 영역에 있는 PstI 부위에 끼워넣어 유전자를 방해함으로써 pJE1 에서 비활성화시켰다. 이 단편을 순방향 프라이머: 5'-gacctgcagtcaggcaacta-3' 및 역 프라이머: 5'-tagagtcgacctgcaggcat-3' 을 사용하여 pUC19 (GenBank Accession #:X02514) 로부터 PCR 증폭시켰다. PCR 암플리콘 및 pJE1 벡터를 PstI 을 사용하여 37 ℃ 에서 2 시간동안 소화시켰다. pJE1 벡터 단편과 PCR 단편을 실온에서 1 시간동안 결찰시키고, 전기-형질전환에 의하여 대장균에 형질전환시켰다. 그 결과의 벡터를 pDorK101 로 표시한다.

필터 스크리닝 검정

부모 효소와 비교하여 높은 pH 에서 증가된 안정성을 가지고 있는 Termamyl-유사 α-아밀라제 변이체들과, 스크리닝 온도 세팅에 좌우되는 부모 효소와 비교하여 높은 pH 및 중간 온도에서 증가된 안정성을 가지고 있는 Termamyl-유사 α-아밀라제 변이체들을 스크리닝하기 위하여 검정이 사용될 수 있다.

높은 pH 필터 검정

Bacillus 라이브러리를, 10 ㎍/ml 의 카나마이신을 함유하고 있는 TY 아가 플레이트 위의 셀룰로오스 아세테이트 (OE 67, Schleicher & Schuell, Dassel, Germany) - 및 니트로셀룰로오스 필터 (Protran-Ba 85, Schleicher & Schuell, Dassel, Germany)의 샌드위치위에 37 ℃ 에서 최소한 21 시간동안 플레이팅한다. 셀룰로오스 아세테이트 층은 TY 아가 플레이트위에 위치한다.

각 필터 샌드위치를 플레이팅후에, 그러나 필터상에 양성 변이체들이 위치할 수 있도록 하기 위해 인큐베이션하기 전에 바늘로 특별하게 표시하고, 변이체들이 결합되어 있는 니트로셀룰로오스 필터를 글리신-NaOH 완충액, pH 8.6-10.6 을 함유하고 있는 콘테이너에 옮긴 후, 실온 (10 내지 60 ℃ 로 변경될 수 있음)에서 15 분동안 인큐베이션한다. 콜로니를 포함한 셀룰로오스 아세테이트 필터를 사용할 때까지 TY 플레이트상에서 실온에서 보관한다. 인큐베이션후에, 잔여 활성을 글리신-NaOH 완충액, pH 8.6-10.6 중에 1 % 아가로오스, 0.2 % 녹말을 함유하고 있는 플레이트상에서 검출한다. 니트로셀룰로오스 필터를 포함하고 있는 검정 플레이트를 필터 샌드위치와 동일한 방식으로 표시하고 2 시간동안 실온에서 인큐베이션한다. 필터를 제거한 후, 검정 플레이트를 10 % 의 루골 (Lugol) 용액으로 염색한다. 녹말의 등급을 저하시키는 변이체들은 진한 푸른색 바탕위에 하얀색 반점으로서 검출되며, 그런 다음 보관 플레이트상에서 확인된다. 양성 변이체들을 첫 번째 스크리닝때와 동일한 조건하에서 두 번 재스크리닝한다.

저칼슘 필터 검정

Bacillus 라이브러리를, 관련된 항생물질, 예컨대 카나마이신 또는 클로람페니콜을 함유하고 있는 TY 아가 플레이트 위의 셀룰로오스 아세테이트 (OE 67, Schleicher & Schuell, Dassel, Germany) - 및 니트로셀룰로오스 필터 (Protran-Ba 85, Schleicher & Schuell, Dassel, Germany)의 샌드위치위에서 37 ℃ 에서 최소한 21 시간동안 플레이팅한다. 셀룰로오스 아세테이트 층은 TY 아가 플레이트위에 위 치한다.

각 필터 샌드위치를 플레이팅후에, 그러나 필터상에 양성 변이체들이 위치할 수 있도록 하기 위해 인큐베이션하기 전에 바늘로 특별하게 표시하고, 변이체들이 결합되어 있는 니트로셀룰로오스 필터를 탄산염/중탄산염 완충액, pH 8.5-10 및 상이한 EDTA 농축액 (0.001 mM - 100 mM)을 함유하고 있는 콘테이너에 옮긴 후, 실온에서 1 시간동안 인큐베이션한다. 콜로니를 포함한 셀룰로오스 아세테이트 필터를 사용할 때까지 TY 플레이트상에 실온에서 보관한다. 인큐베이션후에, 잔여 활성을 탄산염/중탄산염 완충액, pH 8.5-10 중에 1 % 아가로오스, 0.2 % 녹말을 함유하고 있는 플레이트상에서 검출한다. 니트로셀룰로오스 필터를 포함하고 있는 검정 플레이트를 필터 샌드위치와 동일한 방식으로 표시하고 2 시간동안 실온에서 인큐베이션한다. 필터를 제거한 후, 검정 플레이트를 10 % 의 루골 용액으로 염색한다. 녹말의 등급을 저하시키는 변이체들은 진한 푸른색 바탕위에 하얀색 반점으로서 검출되며, 그런 다음 보관 플레이트상에서 확인된다. 양성 변이체들을 첫 번째 스크리닝때와 동일한 조건하에서 두 번 재스크리닝한다.

관심의 영역들을 얻기 위한 방법:

박테리아 α-아밀라제들의 3-차원 구조에 대해서는 3 가지가 알려져 있다. B. licheniformis α-아밀라제, 브루크하벤 데이터베이스 1 BPL [Machius et al., (1995), J. Mol. Biol. 246, p. 545-559] 및 1VJS [Song et al., (1996), Enzymes for Carbohydrate 163 Engineering (Prog. Biotechnol. V 12)]. 이들 두가지 구조는 두 개의 칼슘 이온과 하나의 나트륨 이온 결합 부위 주변 영역에, 소위 B-도메 인으로부터 구조의 중요한 부분이 결여되어 있다. 따라서 본 발명자들은 α-아밀라제 BA2 (WO 96/23874, BAN^TM (SEQ ID NO: 5) 과 B. licheniformis α-아밀라제 (SEQ ID NO: 4) 사이의 하이브리드)의 3-차원 구조를 사용하였다. 이 구조를 토대로 하여 B. licheniformis 알파 아밀라제와 SP722 α-아밀라제의 모델을 만들었다.

α-아밀라제 변이체들의 발효 및 정제

발효 및 정제는 당해 기술분야에 잘 공지되어 있는 방법들에 의해 수행될 수 있다.

안정성 측정

모든 안정성 시험은 동일한 셋업을 사용하여 이루어진다. 방법은 다음과 같다:

효소를 관련된 조건하에서 인큐베이션한다 (1-4). 샘플을 다양한 시간점, 예컨대 0, 5, 10, 15 및 30 분후에 취하여 검정 완충액 (0.1 M 의 50 mM 브리톤 완충액 pH 7.3)중에 25 배로 희석하고 (모든 샘플에 대하여 동일한 희석), 활성을 표준 조건 pH 7.3, 37 ℃ 하에서 파데바스 검정 (Phadebas assay, Pharmacia)을 사용하여 측정한다.

인큐베이션전 (0 분)에 측정된 활성을 대조표준 (100 %)으로서 사용한다. % 의 감소는 인큐베이션 시간의 함수로서 계산한다. 하기의 표는 예컨대 30 분동안의 인큐베이션후의 잔여 활성을 나타낸다.

특이 활성 측정

특이 활성을 활성/mg 효소로서 파데바스 검정 (Pharmacia)을 사용하여 측정한다. 제조자의 지시를 따른다 (하기의 "α-아밀라제 활성에 대한 검정" 참조).

α-아밀라제 활성에 대한 검정

1. 파데바스 검정

α-아밀라제 활성을 기질로서 파데바스 정 (tablet)을 사용하는 방법에 의하여 측정한다. 파데바스 정 (Phadebas Amylase Test, Pharmacia Diagnostic 사 제공)은 우혈청 알부민 및 완충 물질과 혼합되고 정제화된 교차-결합된 불용성의 푸른색의 녹말 중합체를 함유하고 있다.

매번 단일 측정에 대해 한 정제를 5 ml 의 50 mM 브리톤-로빈슨 완충액 (50 mM 의 아세트산, 50 mM 의 인산, 50 mM 의 붕산, 0.1 mM 의 CaCl₂, pH 는 NaOH 를 사용하여 관심의 값으로 조정됨)을 함유하고 있는 튜브안에 현탁시킨다. 시험은 관심의 온도에서 수조에서 수행한다. 시험될 α-아밀라제를 50 mM 의 브리톤-로빈슨 완충액중에 × ml 로 희석한다. 이 α-아밀라제 용액 1 ml 을 5 ml 의 50 mM 브리톤-로빈슨 완충액에 첨가한다. 녹말이 α-아밀라제에 의하여 가수분해되어 가용성 푸른색 단편을 생성시킨다. 그 결과의 푸른색 용액의 흡광도를 620 nm 에서 비색계로 측정하고, 그것은 α-아밀라제 활성의 함수이다.

10 분 또는 15 분의 인큐베이션 (시험 시간) 후에 620 nm 에서 측정된 흡광도가 620 nm 에서 0.2 내지 2.0 흡광도 유니트의 범위내에 있음은 중요하다. 이 흡광도 범위내에서 활성과 흡광도 사이에는 선형성이 존재한다 (람버트-비어 법칙). 그러므로 효소의 희석은 이 범주에 맞도록 조정되어야 한다. 특정한 조건 (온도, 반응시간, 완충 조건)의 세트하에서, 1 mg 의 주어진 α-아밀라제가 특정량의 기질을 가수분해할 것이고, 그 결과 푸른색이 생성될 것이다. 색의 강도는 620 nm 에서 측정한다. 측정된 흡광도는 주어진 세트의 조건하에서 의문의 대상이 되는 α-아밀라제의 특이 활성에 정비례한다 (활성/순수한 α-아밀라제 단백질의 mg).

2. 대체 방법

α-아밀라제 활성을 PNP-G7 기질을 사용하는 방법에 의하여 측정한다. p-니트로페닐-α,D-말토헵타오시드의 약자인 PNP-G7 은 엔도-아밀라제에 의해 절단될 수 있는 차단된 올리고당이다. 절단후에, 키트안에 포함되어 있는 α-글루코시다제가 기질을 소화시켜서 노란색을 띄는 유리 PNP 분자를 분리시키며, 따라서 λ=405 nm (400 - 420 nm)에서 육안 분광측광법에 의해 측정될 수 있다. PNP-G7 기질과 α-글루코시다제를 함유하고 있는 키트는 뵈링거-만하임사에서 제조된다 (cat.No. 1054635).

기질을 제조하기 위하여, 1 병의 기질 (BM 1442309)을 5 ml 의 완충액 (BM 1442309)에 첨가한다. α-글루코시다제를 제조하기 위해서는 1 병의 α-글루코시다제 (BM 1462309)를 45 ml 의 완충액 (BM1442309)에 첨가한다. 작업 용액은 5 ml 의 α-글루코시다제 용액과 0.5 ml 의 기질을 혼합함으로써 만들어진다.

검정은 96 웰 미소적정 플레이트에 20 ㎕ 의 효소 용액을 넣고 25 ℃ 에서 인큐베이션함으로써 수행된다. 25 ℃ 의 200 ㎕ 의 작업 용액을 첨가한다. 용액 을 혼합하고 1 분동안 예비-인큐베이션한 후, 흡광도를 매 15 초마다 3 분동안 OD 405 nm 에서 측정한다.

시간 의존성 흡광도 곡선의 기울기는 주어진 세트의 조건하에서 의문의 대상이 되는 α-아밀라제의 특이 활성에 정비례한다 (mg 효소당 활성).

DOPE 프로그램의 사용에 의한 무작위 돌연변이법을 위한 일반적인 방법

무작위 돌연변이는 다음 단계들에 의하여 수행될 수 있다:

1. 부모효소에서의 변형을 위해 관심의 영역을 선택한다.

2. 선택된 영역에서 돌연변이 부위와 비-돌연변이 부위를 결정한다.

3. 어떤 종류의 돌연변이가 수행되어야 하는지를, 예컨대 구성될 변이체의 원하는 안정성 및/또는 성능과 관련하여 결정한다.

4. 구조적으로 타당한 돌연변이를 선택한다.

5. 단계 4 와 관련하여 단계 3 에 의해 선택된 잔기들을 조정한다.

6. 적당한 도프 알고리즘을 사용함으로써 뉴클레오티드 분포를 분석한다.

7. 필요에 따라 유전자 코드 실제 (realism)에 원하는 잔기들을 조정한다 (예컨대 (예를 들어 정지코돈의 도입을 피하기 위하여) 유전자 코드로부터 유발되는 제한점들을 고려하여) (당업자는 어떤 코돈 조합들은 실제로 사용될 수 없으며 적응될 필요가 있음을 알게 될 것이다).

8. 프라이머를 만든다.

9. 프라이머의 사용에 의하여 무작위 돌연변이법을 수행한다.

10. 그 결과 생성된 α-아밀라제 변이체를, 원하는 증가된 성질에 대해 스크 리닝함으로써 선택한다.

단계 6 에서 사용하기에 적당한 도프 알고리즘은 당해 기술분야에 잘 알려져 있다. 한 가지 알고리즘은 토만들 등에 의해 설명되었다[Tomandl, D. et al., Journal of Compyter-Aided Molecular Design, 11 (1997), pp. 29-38). 다른 알고리즘인 DOPE 에 대해서는 하기에서 설명된다.

도프 프로그램

"DOPE" 프로그램은 원하는 아미노산 분포를 가장 닮은 아미노산 분포를 암호화하는 방식으로 코돈 트리플렛의 뉴클레오티드 조성을 최적화시키는데 유용한 컴퓨터 알고리즘이다. 그것의 가능한 분포가 원하는 아미노산 분포와 가장 유사한지를 평가하기 위하여, 스코어링 함수가 필요하다. "도프" 프로그램에서는 다음의 함수가 적절한 것으로 발견되었다:

상기 식에서, x_i' 는 프로그램에 의해 계산되는 바 아미노산의 얻어진 양 및 아미노산의 그룹이고, y_i' 는 프로그램의 사용자에 의하여 규정되는 아미노산의 원하는 양 및 아미노산 그룹이며 (예컨대 20 개의 아미노산 또는 정지코돈중 어느 것을, 예컨대 특정 백분율 (예를 들면 90 % 의 Ala, 3 % 의 Ile, 7 % 의 Val)로 도입하기를 원하는 지 특정하는 것), w_i' 는 프로그램의 사용자에 의해 규정되는 획득된 중량 인자이다 (예를 들어 의문의 대상이 되는 위치안에 삽입된 특이한 아미노산 잔기를 가지고 있는 중요성에 좌우됨). N 은 프로그램의 사용자에 의해 규정되는 바와 같은 아미노산 그룹의 수 더하기 21 이다. 이 함수의 목적에 대해 0⁰ 은 1 로서 규정된다.

상기 함수의 최대값을 찾기 위하여 몬테-카를로 알고리즘을 사용한다 (한 가지 실예는 밸류와 휘팅톤에 의해 설명된 것이다: Valleau, J.P. & Whittington, S.G. (1977) A guide to Monte Carlo for statistical mechanics: 1 Highways. In "Statistical Mechanics, Part A" Equlibrium Techniqeues ed. B.J. Berne, New York: Plenum). 각 반복에서 다음의 단계들이 수행된다:

1. 새로운 무작위 뉴클레오티드 조성이 각 염기에 대해 선택되는데, 이 때 현재의 조성과 새로운 조성 사이의 절대적인 차이가 코돈의 모든 세 개의 위치에서 4 개의 뉴클레오티드, G, A, T, C 의 각각에 대해 d 보다 작거나 동일하다 (d 의 조건에 대해서는 하기의 설명 참조).

2. 새로운 조성과 현재의 조성의 스코어를 상술된 바와 같은 함수 s 를 사용함으로써 비교한다. 만약 새로운 스코어가 현재의 조성의 스코어보다 더 높거나 또는 같다면, 새로운 조성이 유지되고 현재의 조성은 새로운 것으로 교체된다. 만약 새로운 스코어가 더 작다면, 새로운 조성을 유지할 가능성은 exp(1000(new_score - current_score)) 이다.

사이클은 정상적으로는 d 가 1 에서 0 으로 선형으로 감소하는 상술된 바와 같은 1000 회 반복으로 구성된다. 100 사이클 또는 그 이상의 사이클이 최적화된 방법에서 수행된다. 가장 높은 스코어를 유발하는 뉴클레오티드 조성이 마지막으로 제공된다.

도 1 은 6 개의 부모 Termamyl-유사 α-아밀라제의 아미노산 서열의 배열을 도시한다. 가장 왼쪽에 있는 숫자는 다음과 같은 각각의 아미노산 서열을 나타낸다:

1: SEQ ID NO: 2

2: Kaoamyl

3: SEQ ID NO: 1

4: SEQ ID NO: 5

5: SEQ ID NO: 4

6: SEQ ID NO: 3.

도 2 는 pH 9 에서의 SP722 (SEQ ID NO: 2)의 온도 활성 프로필 및 pH 7.3 에서의 B. licheniformis α-아밀라제 (SEQ ID NO: 4)의 온도 활성 프로필을 도시한다.

도 3 은 pH 10 에서의 SP690 (SEQ ID NO: 1)에 대한 온도 프로필, SP722 (SEQ ID NO: 2)에 대한 온도 프로필, 및 B. licheniformis α-아밀라제 (SEQ ID NO: 4)에 대한 온도 프로필을 도시한다.

도 4 는 5 개의 α-아밀라제의 아미노산 서열의 배열을 도시한다. 가장 왼쪽에 있는 숫자는 각각 다음과 같은 아미노산 잔기를 나타낸다:

1: amyp_마우스

2: amyp_래트

3: amyp_돼지 돼지 췌장의 알파-아밀라제 (PPA)

4: amyp_사람

5: amy_알타 A. haloplanctis 알파-아밀라제 (AHA)

실시예 1

Termamyl ^TM 의 상동성 제작에 대한 실시예

다른 Termamyl-유사 α-아밀라제에 대한 B. licheniformis α-아밀라제 (하기에서 Termamyl^TM 으로 언급함)의 전체적인 상동성은 높으며 % 유사성은 매우 높다. 위스콘신 대학 제네틱스 컴퓨터 그룹의 프로그램 GCG 를 사용하여 계산된 Termamyl^TM 의 BSG (SEQ ID NO: 3 을 갖는 B. stearothermophilus α-아밀라제), 및 BAN (SEQ ID NO: 5 를 갖는 B. amyloliquefaciens α-아밀라제)에 대한 유사성은 각각 89 % 및 78 % 였다. TERM 은 BAN^TM 및 BSG 와 비교하여 잔기 G180 과 K181 사이에 2 개의 잔기가 결실된 것이다. BSG 는 BAN^TM 및 Termamyl^TM 과 비교하여 G371 과 I372 사이에 3 개의 잔기가 결실된 것이다. 나아가 BSG 는 BAN^TM 및 Termamyl^TM 과 비교하여 C-말단에 20 개 이상의 잔기가 연장된 것이다. BAN^TM 은 BSG 와 비교 하여 N-말단이 2 개의 잔기가 적으며 Termamyl 은 한 개의 잔기가 더 적다.

B. licheniformis α-아밀라제 (Termamyl^TM) 및 B. amyloliquefaciens α-아밀라제 (BAN^TM)의 구조는 각각, WO 96/23974 의 부록 1 에 게재된 구조를 모델로 하여 만들었다. 다른 Termamyl-유사 α-아밀라제들 (예컨대 본원에 개시된 것들)의 구조도 유사하게 만들 수 있다.

본 구조를 설명하기 위하여 사용된 α-아밀라제와 비교하여, Termamyl^TM 은 그것이 178 내지 182 주변의 두 개의 잔기가 부족하다는 점에서 상이하다. 모델 구조에서 이것을 상쇄하기 위하여, BIOSYM 으로부터 받은 HOMOLOGY 프로그램을 사용하여 결실점을 제외하고 구조의 동등한 위치에 있는 잔기 (구조적으로 보존된 영역뿐만 아니라)를 치환하였다. 펩티드 결합을 Termamyl^TM (BAN^TM) 의 G179(G177) 와 K180(K180)사이에 만들었다. 해결된 구조와 모델 구조 사이의 밀접한 구조 관계 (및 그로 인한 후자의 타당성)를 모델에서 너무 가까이 함께 있는 것으로 밝혀진 단지 매우 적은 수의 원자들의 존재에 의해 나타낸다.

그런 다음 INSIGHT 프로그램을 사용하여 상기 해결된 구조에 대한 것과 동일한 좌표에서 해결된 구조 (WO 96/23874 의 부록 1 참조)로부터의 모든 물 (605)과 이온 (4 개의 칼슘 및 1 개의 나트륨)을 이 매우 개략적인 Termamyl^TM 구조에 첨가하였다. 이것은 단지 소수의 오버랩 - 달리 말하면 매우 정확하게 맞춤으로 행해질 수 있었다. 그런 다음 이 모델 구조를 200 단(step)의 스팁페스트 하강 (Steepest descent) 및 600 단의 콘쥬게이트된 구배 [Brooks et al., 1983, J. Computational Chemistry 4, p.187-217 참조]를 사용하여 최소화하였다. 그런 다음 최소화된 구조에 대해 5 ps 의 가열과 이어서 200 ps 까지의, 그러나 35 ps 이상의 평형화로 이루어진 분자 역학을 수행하였다. 베를렛 (Verlet) 알고리즘과 평형 온도 300 K 를 사용하여 작동된 역학을, 수조에 대한 베렌드센 커플링 (Behrendsen et al., 1984, J. Chemical Physics 81, p.3684-3690)을 사용하여 유지시켰다. 회전 및 번역을 매 피코초마다 제거하였다.

실시예 2

증가된 pH 안정성과 변경된 온도 활성을 가지고 있는 α-아밀라제 변이체를 확인하기 위하여 중요한 영역을 추출하는 방법

관심의 효소, 본원의 SP722 및 Termamyl^TM의 X-선 구조 및/또는 모델 빌드 구조에 대해 분자 역학 시뮬레이션을 수행하였다. 분자 역학 시뮬레이션은 CHARMM 프로그램 (Molecular simulations (MSI)로부터) 또는 예컨대 DISCOVER (MSI 로부터)와 같은 다른 적절한 프로그램을 사용하여 만들었다. 분자 역학 분석은 진공 상태에서, 또는 보다 바람직하게는 결정수를 포함하여, 또는 물속에, 예컨대 물공 또는 물상자안에 삽입된 효소를 사용하여 만든다. 시뮬레이션은 300 피코초 (ps), 또는 그 이상동안, 예컨대 300 내지 1200 ps 동안 작동시킨다. 등방성 변동을 구조들의 CA 탄소에 대하여 예상하고 비교한다. 서열에 결실 및/또는 삽입이 일어난 경우, 다른 구조로부터의 등방성 변동이 삽입되고, 그로써 등방성 변동의 차이는 0 이 된다. 등방성 변동에 대한 설명은 CHARMM 매뉴얼 (MSI 로부터 얻을 수 있음)을 참고한다.

분자 역학 시뮬레이션은 하전가능한 아미노산상에 있는 표준 전하를 사용하여 수행할 수 있다. 이것은 Asp 이고, Glu 는 음으로 하전되며, Lys 과 Arg 은 양으로 하전된다. 이 조건은 대략 7 의 중간 pH 를 닮아있다. 보다 높은 또는 낮은 pH 를 분석하기 위하여, 정상적으로 pH 2 내지 10 사이에 있는 표준 적정가능한 잔기들; Lys, Arg, Asp, Glu, Tyr 및 His 의 변경된 pKa' 를 얻기 위하여 분자의 적정을 수행할 수 있다. 또한 Ser, Thr 및 Cys 은 적정가능하지만, 본원에서는 고려하지 않았다. 본원에서 Asp 와 Glu 두 가지와 같이 설명된 pH 에 기인한 변경된 전하는 높은 pH 에서 음의 전하이고, Arg 과 Lys 두가지는 변화하지 않았다. 이것은 Lys 과 Arg 의 적정이 시작된 곳인 10 내지 11 주변의 pH 를 모방하는데, 이들 잔기의 정상적인 pKa 는 9 내지 11 주위이다.

1. 높은 pH 안정성을 가지고 있는 α-아밀라제 변이체를 확인하기 위한 중요한 영역 추출에 사용된 접근법:

증가된 pH 안정성을 가지고 있는 변이체를 제조하기 위해 중요한 영역들은 극한 pH 에서 가장 높은 이동성을 나타내는 영역, 즉 가장 높은 등방성 변동을 가지고 있는 영역이다.

그러한 영역들은 2 가지의 분자 역학 시뮬레이션을 수행함으로써 확인된다: i) 염기성 아미노산, Lys 및 Arg 이 중성으로 나타나고 (즉 양성자화되지 않음), 산성 아미노산, Asp 와 Glu 이 (-1)의 전하를 가지는 높은 pH 를 작동시킨다; 그리 고 ii) 염기성 아미노산, Lys 및 Arg 이 (+1)의 순 전하를 가지고, 산성 아미노산이 (-1)의 전하를 가지는 중성의 pH 를 작동시킨다.

두가지 작동을 비교하고 중성 pH 분석과 비교하여 높은 pH 에서 상대적으로 더 높은 이동성을 나타내는 영역들을 확인하였다.

일반적인 안정성, 예컨대 수소 결합을 개선시키는 잔기들의 도입은 영역을 더 견고하게 만들고 (프롤린 치환 또는 글리신 잔기의 교체와 같은 돌연변이에 의해), 또는 전하 또는 그것들의 상호작용을 개선시키는 잔기들의 도입은 효소의 높은 pH 안정성을 개선시킨다.

2. 중간 온도에서 증가된 활성을 가지고 있는 α-아밀라제 변이체들을 확인하기 위한 영역을 추출하기 위해 사용된 접근법:

중간 온도에서 증가된 활성을 가지고 있는 변이체들을 제조하기에 중요한 영역들을 SP722 와 Termamyl에서 등방성 변동의 차이, 즉 SP722 - Termamyl CA 등방성 변동으로서 발견하였다. 등방성 변동에서 가장 높은 이동성을 나타내는 영역을 선택하였다. 이들 영역 및 잔기들은 중간 온도에서 활성을 증가시키는 것으로 예상되었다. 알파-아밀라제의 활성은 단지 만약 특정 잔기의 정확한 이동성이 존재하는 경우에만 나타난다. 만약 잔기의 이동성이 너무 느리면 활성은 감소되거나 또는 포기된다.

실시예 3

부모효소와 비교하여 중간 온도에서 증가된 Ca ²⁺ 안정성을 가지고 있는 Termamyl-유사 α-아밀라제 변이체의, 국소화된 무작위, 도프된 돌연변이법에 의한 제조:

낮은 칼슘 농도에서 α-아밀라제의 안정성을 개선시키기 위하여, 예비-선택된 영역에서 무작위 돌연변이법을 수행하였다.

영역: 잔기:

SAI: R181-W189

DOPE 소프트웨어 (재료 및 방법 참조)를 사용하여, 정지코돈의 양을 최소화하는 SA1 영역에서의 각각의 제시된 변화에 대한 강화된 코돈을 결정하였다 (하기 표 1 참조). 뉴클레오티드의 정확한 분포를 코돈의 3 위치에서 계산하여 아미노산 변화의 제시된 군집을 제공하였다. 도프된 영역들을 원하는 잔기를 얻을 수 있는 높은 기회를 가지도록, 그러나 여전히 다른 가능성도 허용되도록 표시된 위치에 특이적으로 도프하였다.

각각의 위치에 대한 아미노산 잔기의 분포

R181	72% R, 2% N, 7% Q, 4% H, 4% K, 11% S
G182	73% G, 13% A, 12% S, 2% T
K185	95% K, 5% R
A186	50% A, 4% N, 6% D, 1% E, 1% G, 1% K, 5% S, 31% T
W187	100% W
D188	100% D
W189	92% W, 8% S

그 결과의 도프된 올리고뉴클레오티드 가닥은 하기 표 2 에 센스 가닥으로서 나타낸다: 야생형 뉴클레오티드 및 아미노산 서열 및 각각의 도프된 위치에 대한 뉴클레오티드의 분포도 함께 나타낸다.

위치	181 182 185 186 187 188 189
아미노산 서열	Arg Gly Lys Ala Thr Asp Thr
Wt 뉴클레오티드 서열	cga ggt aaa gct tgg gat tgg

순방향 프라이머 (SEQ ID NO: 15):

FSA: 5'-caa aat cgt atc tac aaa ttc 123 456 a7g 8910 tgg

gat t11g gaa gta gat tcg gaa aat-3'

각각의 도프된 위치에 대한 뉴클레오티드의 분포

1: 35 % A, 65 % C

2: 83 % G, 17 % A

3: 63 % G, 37 % T

4: 86 % G, 14 % A

5: 85 % G, 15 % C

6: 50 % T, 50 % C

7: 95 % A, 5 % G

8: 58 % G, 37 % A, 5 % T

9: 86 % C, 13 % A, 1 % G

10: 83 % T, 17 % G

11: 92 % G, 8 % C

역 프라이머 (SEQ ID NO: 16):

RSA: 5'-gaa ttt gta gat acg att ttg-3'

무작위 돌연변이법

상기 표 2 로부터 나타나는 강화된 올리고뉴클레오티드 (통상적으로 FSA 로 표시됨) 및 SA1 영역에 대한 역 프라이머 RSA 및 SacII 와 DraIII 부위를 덮고 있는 특이한 SEQ ID NO: 2: SP722 프라이머를 사용하여, 중첩 연장 방법 [Horton et al., Gene, 77 (1989), pp. 61-68]에 의하여 21 개의 염기쌍의 중복을 사용하여 PCR-라이브러리-단편을 생성하였다. 플라스미드 pJE1 은 중합효소 연쇄 반응에 대한 주형이다. PCR 단편들을 대장균/Bacillus 셔틀 벡터인 pDork101 (재료 및 방법 참조)에 클론하여, 대장균에서의 돌연변이법과, Bacillus subtilis에서의 즉각적인 발현을 가능하게 하여 대장균에서의 아밀라제의 치명적인 축적을 방지한다. 대장균에 클론된 PCR 단편을 수립한 후에, 변형된 pUC19 단편을 플라스미드로부터 소화시켜 분리해내고, 프로모터 및 돌연변이된 Termamyl 유전자를 물리적으로 연결시키면 Bacillus에서 발현이 일어날 수 있다.

스크리닝

라이브러리는 상기의 "재료 및 방법" 에서 설명된 저 칼슘 필터 검정으로 스크린할 수 있다.

실시예 4

아밀라제 SEQ ID NO: 1 (SP690)의 변이체의 제조

SEQ ID NO:1 로부터의 아밀라제를 암호화하는 유전자를 WO 96/23873 에서 설명된 플라스미드 pTVB106 에 위치시킨다. 아밀라제는 Bacillus subtilis의 구조체에서 amyL 프로모터로부터 발현된다.

단백질의 변이체는 델타(T183-G184)+Y243F+Q391E+K444Q 이다. 이 변이체의 제조는 WO 96/23873 에 설명되어 있다.

메가-프라이머 방법에 의한 델타(T183-G184) + N195F 의 제조는 사카르와 솜머에 의해 설명된 바와 같다 [Sarkar & Sommer, (1990), BioTechniques 8:404-407].

유전자 특이적 프라이머 B1 (SEQ ID NO: 17) 및 돌연변이 유발 프라이머 101458 (SEQ ID NO: 19)을 사용하여 pTVB106-유사 플라스미드 (SEQ ID NO: 1 로부터의 아밀라제를 암호화하는 유전자에 델타(T183-G184) 돌연변이가 있음)로부터 대략 645 bp DNA 단편을 PCR 에 의하여 증폭시켰다.

645 bp 단편을 아가로오스 겔로부터 정제하여, 동일한 주형에 대해 수행된 두 번째 PCR 에서 프라이머 Y2 (SEQ ID NO: 18)와 함께 메가-프라이머로서 사용하였다.

그 결과 생성된 대략 1080 bp 단편을 제한 효소 BstEII 및 AflIII 로 소화시키고, 그 결과의 대략 510 bp DNA 단편을 정제하여 동일한 효소로 소화되어 있는 pTVB106-유사 플라스미드 (SEQ ID NO: 1 로부터의 아밀라제를 암호화하는 유전자에 델타(T183-G184) 돌연변이가 있음)에 결찰시켰다. 경합하는 B. subtilis SHA273 (저수준의 아밀라제 및 프로테아제) 세포를 결찰 결과물로 형질전환시키고, 그 결과의 클로람페니콜 내성 형질전환체를, 플라스미드상에 정확한 돌연변이가 존재하는 지를 증명하기 위하여 DNA 서열결정에 의하여 체크하였다.

프라이머 B1: (SEQ ID NO: 17):

5' CGA TTG CTG ACG CTG TTA TTT GCG 3'

프라이머 Y2: (SEQ ID NO: 18):

5' CTT GTT CCC TTG TCA GAA CCA ATG 3'

프라이머 101458 (SEQ ID NO: 19):

5' GT CAT AGT TGC CGA AAT CTG TAT CGA CTT C 3'

변이체: 델타(T183-G184) + K185R + A186T 의 제조는 돌연변이유발 프라이머로서 101638 을 사용한 것을 제외하고 유사한 방식으로 수행하였다.

프라이머 101638 (SEQ ID NO: 20):

5' CC CAG TCC CAC GTA CGT CCC CTG AAT TTA TAT ATT TTG 3'

변이체: 델타(T183-G184) + A186T, 델타(T183-G184) + A186I, 델타(T183-G184) + A186S, 델타(T183-G184) + A186N 을 유사한 방법에 의하여 제조하였다. 단, 클로닝 목적에 대하여 주형으로서 및 벡터로서 pTVB106-유사 플라스미드 (변이체 델타(T183-G184) + K185R+A186T 를 포함하고 있음)를 사용하였다. 돌연변이유발 올리고뉴클레오티드 (올리고 1)는 다음과 같다:

5' CC CAG TCC CAG NTCTTT CCC CTG AAT TTA TAT ATT TTG 3' (SEQ ID NO: 21)

상기에서 N 은 뮤타제니콜리 (mutagenicoli)-고뉴클레오티드의 합성에 사용된 4 가지 염기: A, C, G, 및 T 의 혼합물이다. 형질전환체들의 서열결정으로 성숙한 아밀라제의 아미노산 위치 186 에 대한 정확한 코돈을 확인한다.

변이체: 델타(T183-G184) + K185R+A186T+N195F 는 다음과 같이 제조하였다:

프라이머 x2 (SEQ ID NO: 22) 와 프라이머 101458 (SEQ ID NO: 19)을 사용하 여 pTVB106-유사 플라스미드 (델타(T183-G184) + K185R+A186T 돌연변이를 가지고 있음)상에서 PCR 을 수행한다. 그 결과의 DNA 단편을 프라이머 Y2 (SEQ ID NO: 18)와 함께 메가-프라이머로서, pTVB106-유사 플라스미드 (델타(T183-G184) + N195 돌연변이를 가지고 있음)상에서 PCR 을 수행하는데 사용하였다. 두 번째 PCR 의 생성물을 제한 엔도뉴클레아제 Acc65I 과 AflIII 으로 소화시켜서 동일한 효소로 소화시켜놓은 pTVB106-유사 플라스미드 (델타(T183-G184) + N195F 돌연변이를 가지고 있음)에 클론하였다.

프라이머 x2: (SEQ ID NO: 22)

5' GCG TGG ACA AAG TTT GAT TTT CCT G 3'

변이체: 델타(T183-G184) + K185R+A186T+N195F+Y243F+Q391E+K444Q 는 다음과 같이 제조하였다:

프라이머 x2 및 프라이머 101458 을 사용하여 pTVB106-유사 플라스미드 (델타(T183-G184) + K185R+A186T 돌연변이를 가지고 있음)상에서 PCR 을 수행한다. 그 결과의 DNA 단편을 프라이머 Y2 와 함께 메가-프라이머로서, pTVB106-유사 플라스미드 (델타(T183-G184) + Y243F+Q391E+K444Q 돌연변이를 가지고 있음)상에서 PCR 을 수행하는데 사용하였다. 두 번째 PCR 의 생성물을 제한 엔도뉴클레아제 Acc65I 과 AflIII 으로 소화시켜서 동일한 효소로 소화시켜놓은 pTVB106-유사 플라스미드 (델타(T183-G184) + Y243F+Q391E+K444Q 돌연변이를 가지고 있음)에 클론하였다.

실시예 5

부모 SP722 α-아밀라제 (SEQ ID NO: 2)에서 부위-특정된 α-아밀라제 변이체의 제조

아밀라제 SEQ ID NO: 2 (SP722)의 변이체의 제조는 다음 설명과 같이 수행한다.

SEQ ID NO: 2 로부터의 아밀라제를 암호화하는 유전자를 WO 96/23873 에 설명되어 있는 플라스미드 pTVB112 에 위치시킨다. 아밀라제는 B. subtilis에서 이 구조체에 있는 amyL 프로모터로부터 발현된다.

메가-프라이머 방법에 의한 델타(D183-G184) + V56I 의 제조는 사카르와 솜머에 의해 설명된 바와 같다 [Sarkar & Sommer, 1990, BioTechniques 8:404-407].

유전자 특이적 프라이머 DA03 과 돌연변이 유발 프라이머 DA07 을 사용하여, pTVB112-유사 플라스미드 (SEQ ID NO: 2 에 도시된 α-아밀라제를 암호화하는 유전자에 델타(D183-G184) 돌연변이를 가지고 있음)로부터의 대략 820 bp 의 DNA 단편을 PCR 에 의하여 증폭시켰다.

820 bp 의 단편을 아가로오스 겔로부터 정제하여, 동일한 주형상에서 수행되는 두 번째 PCR 에서 프라이머 DA01 과 함께 메가-프라이머로서 사용한다.

그 결과의 대략 920 bp 의 단편을 제한 효소 NgoM I 및 Aat II 로 소화시키고, 그 결과 생성된 대략 170 bp 의 DNA 단편을 정제한 다음, 동일한 효소로 소화시켜 놓은 pTVB112-유사 플라스미드 (SEQ ID NO: 2 에 도시된 아밀라제를 암호화하는 유전자에 델타(D183-G184) 돌연변이가 있음)와 결찰시켰다. 경합하는 B. subtilis SHA273 (저수준의 아밀라제 및 프로테아제) 세포를 결찰물로 형질전환시 키고, 생성된 클로람페니콜 내성 형질전환체를, 플라스미드상에서의 정확한 돌연변이의 존재를 증명하기 위하여 DNA 서열결정에 의하여 조사하였다.

프라이머 DA01 (SEQ ID NO: 23):

5' CCTAATGATGGGAATCACTGG 3'

프라이머 DA03 (SEQ ID NO: 24):

5' GCATTGGATGCTTTTGAACAACCG 3'

프라이머 DA07 (SEQ ID NO: 25):

5' CGCAAAATGATATCGGGTATGGAGCC 3'

변이체: 델타(D183-G184) + K108L, 델타(D183-G184) + K108Q, 델타(D183-G184) + K108E, 델타(D183-G184) + K108V 를 사카르와 솜머에 의하여 설명된 바와 같이 메가-프라이머 방법에 의하여 제조하였다 [Sarkar and Sommer, 1990, BioTechniques 8:404-407]:

프라이머 DA03 및 돌연변이법 프라이머 DA20 을 사용하여 pTVB112-유사 플라스미드 (델타(D183-G184) 돌연변이를 가지고 있음)상에서 PCR 을 수행한다. 그 결과의 DNA 단편을, pTVB112-유사 플라스미드 (델타(D183-G184) 돌연변이를 가지고 있음)상에서의 PCR 에 프라이머 DA01 과 함께 메가-프라이머로서 사용한다. 두 번째 PCR 의 대략 920 bp 생성물을 제한 엔도뉴클레아제 Aat II 및 Mlu I 로 소화시키고, 동일한 효소로 소화시켜놓은 pTVB112-유사 플라스미드 (델타(D183-G184) 돌연변이를 가지고 있음)에 클론하였다.

프라이머 DA20 (SEQ ID NO: 26):

5' GTGATGAACCACSWAGGTGGAGCTGATGC 3'

상기에서 S 는 돌연변이 유발 올리고뉴클레오티드의 합성에 사용된 두 가지 염기: C 와 G 의 혼합물을 나타내고, W 는 돌연변이 유발 올리고뉴클레오티드의 합성에 사용된 두 가지 염기: A 와 T 의 혼합물을 나타낸다.

형질전환체의 서열결정으로 성숙한 아밀라제의 아미노산 위치 108 에 대한 정확한 코돈을 확인한다.

변이체: 델타(D183-G184) + D168A, 델타(D183-G184) + D168I, 델타(D183-G184) + D168V, 델타(D183-G184) + D168T 의 제조를 돌연변이유발 프라이머DA14 를 사용한 것을 제외하고는 유사한 방식으로 수행한다.

프라이머 DA14 (SEQ ID NO: 27):

5' GATGGTGTATGGRYCAATCACGACAATTCC 3'

상기에서 R 은 돌연변이 유발 올리고뉴클레오티드의 합성에 사용된 두 가지 염기: A 와 G 의 혼합물을 나타내고, Y 는 돌연변이 유발 올리고뉴클레오티드의 합성에 사용된 두 가지 염기: C 와 T 의 혼합물을 나타낸다.

변이체: 델타(D183-G184) + Q169N 의 제조는 돌연변이 유발 프라이머 DA15 를 사용한 것을 제외하고 유사한 방식으로 수행한다.

프라이머 DA15 (SEQ ID NO: 28):

5' GGTGTATGGGATAACTCACGACAATTCC 3'

변이체: 델타(D183-G184) + Q169L 의 제조는 돌연변이 유발 프라이머 DA16 을 사용한 것을 제외하고 유사한 방식으로 수행한다.

프라이머 DA16 (SEQ ID NO: 29):

5' GGTGTATGGGATCTCTCACGACAATTCC 3'

변이체: 델타(D183-G184) + Q172N 의 제조는 돌연변이 유발 프라이머 DA17 을 사용한 것을 제외하고 유사한 방식으로 수행한다.

프라이머 DA17 (SEQ ID NO: 30):

5' GGGATCAATCACGAAATTTCCAAAATCGTATC 3'

변이체: 델타(D183-G184) + Q172L 의 제조는 돌연변이 유발 프라이머 DA18 을 사용한 것을 제외하고 유사한 방식으로 수행한다.

프라이머 DA18 (SEQ ID NO: 31):

5' GGGATCAATCACGACTCTTCCAAAATCGTATC 3'

변이체: 델타(D183-G184) + L201I 의 제조는 돌연변이 유발 프라이머 DA06 을 사용한 것을 제외하고 유사한 방식으로 수행한다.

프라이머 DA06 (SEQ ID NO: 32):

5' GGAAATTATGATTATATCATGTATGCAGATGTAG 3'

변이체: 델타(D183-G184) + K269S 의 제조는 돌연변이 유발 프라이머 DA09 를 사용한 것을 제외하고 유사한 방식으로 수행한다.

프라이머 DA09 (SEQ ID NO: 33):

5' GCTGAATTTTGGTCGAATGATTTAGGTGCC 3'

변이체: 델타(D183-G184) + K269Q 의 제조는 돌연변이 유발 프라이머 DA11 을 사용한 것을 제외하고 유사한 방식으로 수행한다.

프라이머 DA11 (SEQ ID NO: 34):

5' GCTGAATTTTGGTCGAATGATTTAGGTGCC 3'

변이체: 델타(D183-G184) + N270Y 의 제조는 돌연변이 유발 프라이머 DA21 을 사용한 것을 제외하고 유사한 방식으로 수행한다.

프라이머 DA21 (SEQ ID NO: 35):

5' GAATTTTGGAAGTACGATTTAGGTCGG 3'

변이체: 델타(D183-G184) + L272A, 델타(D183-G184) + L272I, 델타(D183-G184) + L272V, 델타(D183-G184) + L272T 의 제조는 돌연변이 유발 프라이머 DA12 를 사용한 것을 제외하고 유사한 방식으로 수행한다.

프라이머 DA12 (SEQ ID NO: 36):

5' GGAAAAACGATRYCGGTGCCTTGGAGAAC 3'

형질전환체의 서열결정으로 성숙한 아밀라제의 아미노산 위치 272 에 대한 정확한 코돈을 확인한다.

변이체: 델타(D183-G184) + L275A, 델타(D183-G184) + L275I, 델타(D183-G184) + L275V, 델타(D183-G184) + L275T 의 제조는 돌연변이 유발 프라이머 DA13 을 사용한 것을 제외하고 유사한 방식으로 수행한다.

프라이머 DA13 (SEQ ID NO: 37):

5' GATTTAGGTGCCTRYCAGAACTATTTA 3'

형질전환체의 서열결정으로 성숙한 아밀라제의 아미노산 위치 275에 대한 정확한 코돈을 확인한다.

변이체: 델타(D183-G184) + Y295E 의 제조는 돌연변이 유발 프라이머 DA08 을 사용한 것을 제외하고 유사한 방식으로 수행한다.

프라이머 DA08 (SEQ ID NO: 38):

5' CCCCCTTCATGAGAATCTTTATAACG 3'

메가-프라이머 방법에 의한 델타(D183-G184) + K446Q 의 제조는 사카르와 솜머에 의해 설명된 바와 같다 [Sarkar and Sommer, 1990, BioTechniques 8:404-407]:

중지-코돈 및 돌연변이 유발 프라이머 DA10 에 대하여 214 내지 231 bp 아래쪽에 어닐링되어 있는 유전자 특이적 프라이머 DA04 를 사용하여 pTVB112-유사 플라스미드 (SEQ ID NO: 2 에 도시된 아밀라제를 암호화하는 유전자에 델타(D183-G184) 돌연변이를 가지고 있음)로부터 얻어지는 대략 350 bp 의 DNA 단편을 PCR 에 의하여 증폭시켰다.

그 결과의 DNA 단편을, pTVB112-유사 플라스미드 (델타(D183-G184) 돌연변이를 가지고 있음)상에서의 PCR 에 프라이머 DA05 와 함께 메가-프라이머로서 사용한다. 두 번째 PCR 의 대략 460 bp 생성물을 제한 엔도뉴클레아제 SnaB I 및 Not I 으로 소화시키고, 동일한 효소로 소화시켜놓은 pTVB112-유사 플라스미드 (델타(D183-G184) 돌연변이를 가지고 있음)에 클론하였다.

프라이머 DA04 (SEQ ID NO: 39):

5' GAATCCGAACCTCATTACACATTCG 3'

프라이머 DA05 (SEQ ID NO: 40):

5' CGGATGGACTCGAGAAGGAAATACCACG 3'

프라이머 DA10 (SEQ ID NO: 41):

5' CGTAGGGCAAAATCAGGCCGGTCAAGTTTGG 3'

변이체: 델타(D183-G184) + K458R 의 제조를 돌연변이 유발 프라이머 DA22 를 사용한 것을 제외하고 유사한 방식으로 수행한다.

프라이머 DA22 (SEQ ID NO: 42):

5' CATAACTGGAAATCGCCCGGGAACAGTTACG 3'

변이체: 델타(D183-G184) + P459S 및 델타(D183-G184) + P459T 의 제조를 돌연변이 유발 프라이머 DA19 를 사용한 것을 제외하고 유사한 방식으로 수행한다.

프라이머 DA19 (SEQ ID NO: 43):

5' CTGGAAATAAAWCCGGAACAGTTACG 3'

상기에서 W 는 돌연변이 유발 올리고뉴클레오티드의 합성에 사용된 두 개의 염기: A 와 T 의 혼합물이다.

형질전환체의 서열결정으로 성숙한 아밀라제의 아미노산 위치 459 에 대한 정확한 코돈을 확인한다.

변이체: 델타(D183-G184) + T461P 의 제조를 돌연변이 유발 프라이머 DA23 을 사용한 것을 제외하고 유사한 방식으로 수행한다.

프라이머 DA23 (SEQ ID NO: 44):

5' GGAAATAAACCAGGACCCGTTACGATCAATGC 3'

변이체: 델타(D183-G184) + K142R 의 제조를 돌연변이 유발 프라이머 DA32 를 사용한 것을 제외하고 유사한 방식으로 수행한다.

프라이머 DA32 (SEQ ID NO: 45):

5' GAGGCTTGGACTAGGTTTGATTTTCCAG 3'

변이체: 델타(D183-G184) + K269R 의 제조를 돌연변이 유발 프라이머 DA31 을 사용한 것을 제외하고 유사한 방식으로 수행한다.

프라이머 DA31 (SEQ ID NO: 46):

5' GCTGAATTTTGGCGCAATGATTTAGGTGCC 3'

실시예 6

부모 Termamyl α-아밀라제 (SEQ ID NO: 4)에서의 부위-특정된 α-아밀라아

제 변이체의 제조

Termamyl α-아밀라제를 암호화하는 amyL 유전자를 WO 95/10603 (Novo Nordisk)에서 설명된 플라스미드 pDN1528 에 위치시킨다. 각각 N265R 과 N265D 의 치환을 포함하고 있는 상기 부모 α-아밀라제의 변이체들을 WO 97/41213 에 기재되어 있는 방법에 의하여 또는 상술한 "메가-프라이머" 접근법에 의하여 제조한다.

돌연변이 유발 올리고뉴클레오티드는 다음과 같다:

N265R 치환에 대한 프라이머 bl1:

5' PCC AGC GCG CCT AGG TCA CGC TGC CAA TAT TCA G (SEQ ID NO: 56)

N265D 치환에 대한 프라이머 bl2:

5' PCC AGC GCG CCT AGG TCA TCC TGC CAA TAT TCA G (SEQ ID NO: 57)

상기에서 P 는 포스페이트 기를 나타낸다.

실시예 7

SEQ ID NO: 2 에 도시된 아미노산 서열을 가지고 있는 부모 α-아밀라제의 변이체들의 알칼리성 pH 에서의 pH 안정성의 측정

이 일련의 분석에서는 정제된 효소 샘플을 사용하였다. 측정은 pH 10.5 로 조정된 100 mM 의 CAPS 완충액중의 각각의 변이체들의 용액을 사용하여 수행하였다. 용액을 75 ℃ 에서 인큐베이션하였다.

20 분 및 30 분동안 인큐베이션한 후에 잔여 활성을 PNP-G7 검정 (상기의 "재료 및 방법" 단원에서 설명됨)을 사용하여 측정하였다. 샘플중의 잔여 활성을 브리톤 로빈슨 완충액 pH 7.3 을 사용하여 측정하였다. 잔여 활성의 감소는, 높은 pH 및 75 ℃ 에서 인큐베이션되지 않은, 0 분에서의 동일한 효소의 상응하는 대조 용액과 관련하여 측정하였다.

함수로서의 초기 활성의 백분율을 부모효소 (SEQ ID NO: 2)에 대하여 및 의 문의 대상인 변이체들에 대하여 각각 하기 표에 나타낸다.

변이체	20 분후의 잔여 활성	30 분후의 잔여 활성
△(D183-G184)+M323L	56 %	44 %
△(D183-G184)+M323L+R181S	67 %	55 %
△(D183-G184)+M323L+A186T	62 %	50 %

다른 일련의 분석에서는 배양 상층액을 사용하였다. 측정은 pH 10.5 로 조정된 100 mM CAPS 완충액중의 각각의 변이체의 용액을 사용하여 수행하였다. 용액을 80 ℃ 에서 인큐베이션하였다.

30 분동안 인큐베이션한 후에 잔여 활성을 파데바스 검정 (상기의 "재료 및 방법" 단원에서 설명됨)을 사용하여 측정하였다. 샘플중의 잔여 활성을 브리톤 로빈슨 완충액 pH 7.3 을 사용하여 측정하였다. 잔여 활성의 감소는, 높은 pH 및 80 ℃ 에서 인큐베이션되지 않은, 0 분에서의 동일한 효소의 상응하는 대조 용액과 관련하여 측정하였다.

함수로서의 초기 활성의 백분율을 부모효소 (SEQ ID NO: 2)에 대하여 및 의문의 대상인 변이체들에 대하여 각각 하기 표에 나타낸다.

변이체	30 분 후의 잔여 활성
△(D183-G184)	4 %
△(D183-G184) + P459T	25 %
△(D183-G184) + K458R	31 %
△(D183-G184) + K311R	10 %

실시예 8

SEQ ID NO: 1, SEQ ID NO: 2 및 SEQ ID NO: 4 에 도시된 아미노산 서열을 가지고 있는 부모 α-아밀라제의 변이체들의 알칼리성 pH 에서의 칼슘 안정성의 측정

A: SEQ ID NO: 1 의 서열의 변이체들의 칼슘 안정성

측정은 최종 농도 2400 ppm 으로 폴리포스페이트가 첨가되어 있고 (시간 t=0), pH 10.5 로 조정된 100 mM CAPS 완충액중의 각각의 변이체들의 용액을 사용하여 수행하였다. 용액을 50 ℃ 에서 인큐베이션하였다.

20 분 및 30 분동안 인큐베이션한 후에 잔여 활성을 PNP-G7 검정 (상술된 바와 같음)을 사용하여 측정하였다. 샘플중의 잔여 활성을 브리톤 로빈슨 완충액 pH 7.3 을 사용하여 측정하였다. 잔여 활성의 감소는, 높은 pH 및 50 ℃ 에서 인큐베이션되지 않은, 0 분에서의 동일한 효소의 상응하는 대조 용액과 관련하여 측정하였다.

함수로서의 초기 활성의 백분율을 부모효소 (SEQ ID NO: 1)에 대하여 및 의문의 대상인 변이체들에 대하여 각각 하기 표에 나타낸다.

변이체	20 분후의 잔여활성	30 분후의 잔여활성
△(T183-G184)	32 %	19 %
△(T183-G184)+A186T	36 %	23 %
△(T183-G184)+K185R+A186T	45 %	29 %
△(T183-G184)+A186T	35 %	20 %
△(T183-G184)+N195F	44 %	n.d.

n.d. = 측정하지 않음.

B: SEQ ID NO: 2 의 서열의 변이체들의 칼슘 안정성

이 일련의 분석에서는 효소의 정제된 샘플을 사용하였다. 측정은 최종 농도 2400 ppm 으로 폴리포스페이트가 첨가되어 있고 (시간 t=0), pH 10.5 로 조정된 100 mM CAPS 완충액중의 각각의 변이체들의 용액을 사용하여 수행하였다. 용액을 50 ℃ 에서 인큐베이션하였다.

변이체	20 분후의 잔여 활성	30 분후의 잔여 활성
△(D183-G184)+M323L	21 %	13 %
△(D183-G184)+M323L+R181S	32 %	19 %
△(D183-G184)+M323L+A186T	28 %	17 %
△(D183-G184)+M323L+A186R	30 %	18 %
변이체	20 분후의 잔여 활성	30 분후의 잔여 활성
△(D183-G184)	30 %	20 %
△(D183-G184)+N195F	55 %	44 %

이 일련의 분석에서는 배양 상층액을 사용하였다. 측정은 최종 농도 2400 ppm 으로 폴리포스페이트가 첨가되어 있고 (시간 t=0), pH 10.5 로 조정된 100 mM CAPS 완충액중의 각각의 변이체들의 용액을 사용하여 수행하였다. 용액을 50 ℃ 에서 인큐베이션하였다.

30 분동안 인큐베이션한 후에 잔여 활성을 상술된 바와 같은 파데바스 검정을 사용하여 측정하였다. 샘플중의 잔여 활성을 브리톤 로빈슨 완충액 pH 7.3 을 사용하여 측정하였다. 잔여 활성의 감소는, 높은 pH 및 50 ℃ 에서 인큐베이션되지 않은, 0 분에서의 동일한 효소의 상응하는 대조 용액과 관련하여 측정하였다.

변이체	30 분 후의 잔여 활성
△(D183-G184)	0 %
△(D183-G184)+P459T	19 %
△(D183-G184)+K458R	18 %
△(D183-G184)+T461P	13 %
△(D183-G184)+E346Q+K385R	4 %

C: SEQ ID NO: 4 의 서열의 변이체들의 칼슘 안정성

측정은 최종 농도 2400 ppm 으로 폴리포스페이트가 첨가되어 있고 (시간 t=0), pH 10.5 로 조정된 100 mM CAPS 완충액중의 각각의 변이체들의 용액을 사용하여 수행하였다. 용액을 60 ℃ 에서 20 분동안 인큐베이션하였다.

20 분동안 인큐베이션한 후에 잔여 활성을 PNP-G7 검정 (상술된 바와 같음)을 사용하여 측정하였다. 샘플중의 잔여 활성을 브리톤 로빈슨 완충액 pH 7.3 을 사용하여 측정하였다. 잔여 활성의 감소는, 높은 pH 및 60 ℃ 에서 인큐베이션되지 않은, 0 분에서의 동일한 효소의 상응하는 대조 용액과 관련하여 측정하였다.

함수로서의 초기 활성의 백분율을 부모효소 (SEQ ID NO: 4)에 대하여 및 의문의 대상인 변이체들에 대하여 각각 하기 표에 나타낸다.

변이체	20 분 후의 잔여 활성
Termamyl (SEQ ID NO: 4)	17 %
N265R	28 %
N265D	25 %

실시예 9

SEQ ID NO: 1 에 도시된 아미노산 서열을 가지고 있는 α-아밀라제의 중간

온도에서의 활성 측정

A: SEQ ID NO: 1 의 서열의 변이체들의 α-아밀라제 활성

측정은 pH 7.3 으로 조정된 50 mM 의 브리톤 로빈슨 완충액중의 각각의 변이체들의 용액과 상술된 바와 같은 파데바스 검정을 사용하여 수행하였다. 샘플중의 활성은 50 mM 의 브리톤 로빈슨 완충액 pH 7.3 을 사용하여 37 ℃ 에서, 그리고 50 mM 의 CAPS 완충액 pH 10.5 를 사용하여 25 ℃ 에서 측정하였다.

온도 의존성 활성 및 37 ℃ 에서의 활성에 대한 25 ℃ 에서의 활성의 백분율을 부모효소 (SEQ ID NO: 1)에 대하여 및 의문의 대상인 변이체들에 대하여 각각 하기 표에 나타낸다.

변이체	NU/mg, 25 ℃	NU/mg, 37 ℃	NU(25 ℃)/NU(37 ℃)
SP690	1440	35000	4.1 %
△(T183-G184)	2900	40000	7.3 %
△(T183-G184)+K269S	1860	12000	15.5 %
△(Q174)	3830	38000	7.9 %

다른 측정을 pH 7.3 으로 조정된 50 mM 의 브리톤 로빈슨 완충액중의 각각의 변이체들의 용액과 상술된 바와 같은 파데바스 검정을 사용하여 수행하였다. 샘플중의 활성은 50 mM 의 브리톤 로빈슨 완충액 pH 7.3 을 사용하여 37 ℃ 및 50 ℃ 에서 측정하였다.

온도 의존성 활성 및 50 ℃ 에서의 활성에 대한 37 ℃ 에서의 활성의 백분율을 부모효소 (SEQ ID NO: 1)에 대하여 및 의문의 대상인 변이체들에 대하여 각각 하기 표에 나타낸다.

변이체	NU/mg, 37 ℃	NU/mg, 50 ℃	NU(37 ℃)/NU(50 ℃)
SP690 (SEQ ID NO: 1)	13090	21669	60 %
K269Q	7804	10063	78 %

B: SEQ ID NO: 2 의 서열의 변이체들의 α-아밀라제 활성

측정을 pH 7.3 으로 조정된 50 mM 의 브리톤 로빈슨 완충액중의 각각의 변이체들의 용액과 상술된 바와 같은 파데바스 검정을 사용하여 수행하였다. 샘플중의 활성은 50 mM 의 브리톤 로빈슨 완충액 pH 7.3 을 사용하여 25 ℃ 및 37 ℃ 에서 모두 측정하였다.

온도 의존성 활성 및 37 ℃ 에서의 활성에 대한 25 ℃ 에서의 활성의 백분율을 부모효소 (SEQ ID NO: 2)에 대하여 및 의문의 대상인 변이체들에 대하여 각각 하기 표에 나타낸다.

변이체	NU/mg, 25 ℃	NU/mg, 37 ℃	NU(25 ℃)/NU(37 ℃)
△(D183-G184)+M323L	3049	10202	30 %
△(D183-G184)+M323L+R181S	18695	36436	51 %

C: SEQ ID NO: 4 의 서열의 변이체들의 α-아밀라제 활성

측정을 pH 7.3 으로 조정된 50 mM 의 브리톤 로빈슨 완충액중의 각각의 변이체들의 용액과 상술된 바와 같은 파데바스 검정을 사용하여 수행하였다. 샘플중의 활성은 50 mM 의 브리톤 로빈슨 완충액 pH 7.3 을 사용하여 37 ℃ 에서, 그리고 50 mM 의 CAPS pH 10.5 완충액을 사용하여 60 ℃ 에서 모두 측정하였다.

온도 의존성 활성 및 60 ℃ 에서의 활성에 대한 37 ℃ 에서의 활성의 백분율을 부모효소 (SEQ ID NO: 4)에 대하여 및 의문의 대상인 변이체들에 대하여 각각 하기 표에 나타낸다.

변이체	NU/mg, 37 ℃	NU/mg, 60 ℃	NU(37 ℃)/NU(60 ℃)
Termamyl	7400	4350	170 %
Q264S	10000	4650	215 %

실시예 10

부모 하이브리드 BAN:1-300/Termamyl:301-483 α-아밀라제의 변이체의 제조

플라스미드 pTVB191 은 B. subtilis에서 작용할 수 있는 복제원점 및 클로람페니콜 내성을 부여하는 cat 유전자 뿐만 아니라 하이브리드 α-아밀라제 BAN:1-300/Termamyl:301-483 을 암호화하는 유전자를 함유하고 있다.

변이체 BM4 (F290E)를 주형으로서 pTVB191 을 사용하여 메가프라이머 접근법 (Sarkar and Sommer, 1990)을 사용하여 제조하였다.

프라이머 p1 (SEQ ID NO: 52) 및 돌연변이 유발 올리고뉴클레오티드 bm4 (SEQ ID NO: 47)를 사용하여 표준 조건하에서 중합효소 연쇄 반응 (PCR)으로 444 bp 의 단편을 증폭시켰다.

이 단편을 아가로오스 겔로부터 정제하여 프라이머 p2 (SEQ ID NO: 53)와 함께 두 번재 PCR 에서 "메가프라이머" 로서 사용하여 531 bp 의 단편을 생성하였다. 이 단편을 제한 엔도뉴클레아제 HinDIII 및 TthlllI 로 소화시켰다. 이렇게 하여 생성된 389 bp 의 단편을 동일한 두 개의 효소로 절단하여 놓은 플라스미드 pTVB191 에 결찰시켰다. 그 결과의 플라스미드를 B. subtilis SHA273 에 형질전환하였다. 불용성 녹말 뿐만이 아니라 클로람페니콜을 함유하고 있는 플레이트상에서 형질전환체를 성장시킴으로써 클로람페니콜 내성 콜로니들을 선택하였다. 활성 α-아밀라제를 발현하는 클론들을, 플레이트를 요오드 증기로 염색한 후에 주변에 무리 (halo)를 형성한 클론들을 선택함으로써 분리하였다. 도입된 돌연변이의 주체(identity)는 DNA 서열결정에 의하여 확인하였다.

변이체 BM5 (F290K), BM6 (F290A), BM8 (Q360E) 및 BM11 (N102D)을 유사한 방식으로 제조하였다. 이것들의 제조를 위한 자세한 사항은 다음과 같다.

변이체: BM5 (F290K)

돌연변이 유발 올리고뉴클레오티드: bm5 (SEQ ID NO: 48)

프라이머 (첫 번째 PCR): p1 (SEQ ID NO: 52)

그 결과 생성된 단편의 크기: 444 bp

프라이머 (두 번째 PCR): p2 (SEQ ID NO: 53)

제한 엔도뉴클레아제: HinDIII, TthlllI

절단된 단편의 크기: 389 bp

변이체: BM6 (F290A)

돌연변이 유발 올리고뉴클레오티드: bm6 (SEQ ID NO: 49)

프라이머 (첫 번째 PCR): p1 (SEQ ID NO: 52)

그 결과 생성된 단편의 크기: 444 bp

프라이머 (두 번째 PCR): p2 (SEQ ID NO: 53)

제한 엔도뉴클레아제: HinDIII, TthlllI

절단된 단편의 크기: 389 bp

변이체: BM8 (Q360E)

돌연변이 유발 올리고뉴클레오티드: bm8 (SEQ ID NO: 50)

프라이머 (첫 번째 PCR): p1 (SEQ ID NO: 52)

그 결과 생성된 단편의 크기: 230 bp

프라이머 (두 번째 PCR): p2 (SEQ ID NO: 53)

제한 엔도뉴클레아제: HinDIII, TthlllI

절단된 단편의 크기: 389 bp

변이체: BM11(N102D)

돌연변이 유발 올리고뉴클레오티드: bm11 (SEQ ID NO: 51)

프라이머 (첫 번째 PCR): p3 (SEQ ID NO: 54)

그 결과 생성된 단편의 크기: 577 bp

프라이머 (두 번째 PCR): p4 (SEQ ID NO: 55)

제한 엔도뉴클레아제: HinDIII, PvuI

절단된 단편의 크기: 576 bp

돌연변이 유발 올리고뉴클레오티드:

bm4 (SEQ ID NO: 47): F290E

프라이머 5' GTG TTT GAC GTC CCG CTT CAT GAG AAT TTA CAG G

bm5 (SEQ ID NO: 48): F290K

프라이머 5' GTG TTT GAC GTC CCG CTT CAT AAG AAT TTA CAG G

bm6 (SEQ ID NO: 49): F290A

프라이머 5' GTG TTT GAC GTC CCG CTT CAT GCC AAT TTA CAG G

bm8 (SEQ ID NO: 50): Q360E

프라이머 5' AGG GAA TCC GGA TAC CCT GAG GTT TTC TAC GG

bm11 (SEQ ID NO: 51): N102D

프라이머 5' GAT GTG GTT TTG GAT CAT AAG GCC GGC GCT GAT G

다른 프라이머:

p1: 5' CTG TTA TTA ATG CCG CCA AAC C (SEQ ID NO: 52)

p2: 5' G GAA AAG AAA TGT TTA CGG TTG CG (SEQ ID NO: 53)

p3: 5' G AAA TGA AGC GGA ACA TCA AAC ACG (SEQ ID NO: 54)

p4: 5' GTA TGA TTT AGG AGA ATT CC (SEQ ID NO: 55)

실시예 11

부모 BAN:1-300/Termamyl:301-483 하이브리드 α-아밀라제의 변이체들의

알칼리성 pH 에서의 α-아밀라제 활성

측정을 각각의 효소에 대한 용액 및 파데바스 검정 (상술된 바와 같음)을 사용하여 수행하였다. 활성을 NaOH 에 의해 표시된 pH 로 조정된 50 mM 의 브리톤-로빈슨 완충액중에서 15 분동안 30 ℃ 에서 인큐베이션한 후에 측정하였다.

NU/mg 효소
pH	wt	Q360E	F290A	F290K	F290E	N102D
8.0	5300	7800	8300	4200	6600	6200
9.0	1600	2700	3400	2100	1900	1900

인용문헌

SEQUENCE LISTING (1) GENERAL INFORMATION: (i) APPLICANT: (A) NAME: NOVO NORDISK A/S (B) STREET: Novo Alle (C) CITY: DK-2880 Bagsvaerd (E) COUNTRY: Denmark (F) POSTAL CODE (ZIP): DK-2880 (G) TELEPHONE: +45 44 44 88 88 (H) TELEFAX: +45 44 49 60 80 (ii) TITLE OF INVENTION: (-amylase mutants (iii) NUMBER OF SEQUENCES: 58 (iv) COMPUTER READABLE FORM: (A) MEDIUM TYPE: Floppy disk (B) COMPUTER: IBM PC compatible (C) OPERATING SYSTEM: PC-DOS/MS-DOS (D) SOFTWARE: PatentIn Release #1.0, Version #1.25 (EPO) (2) INFORMATION FOR SEQ ID NO: 1: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 485 amino acids (B) TYPE: amino acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: peptide (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 1: His His Asn Gly Thr Asn Gly Thr Met Met Gln Tyr Phe Glu Trp Tyr 1 5 10 15 Leu Pro Asn Asp Gly Asn His Trp Asn Arg Leu Arg Asp Asp Ala Ala 20 25 30 Asn Leu Lys Ser Lys Gly Ile Thr Ala Val Trp Ile Pro Pro Ala Trp 35 40 45 Lys Gly Thr Ser Gln Asn Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr 50 55 60 Asp Leu Gly Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly 65 70 75 80 Thr Arg Asn Gln Leu Gln Ala Ala Val Thr Ser Leu Lys Asn Asn Gly 85 90 95 Ile Gln Val Tyr Gly Asp Val Val Met Asn His Lys Gly Gly Ala Asp 100 105 110 Gly Thr Glu Ile Val Asn Ala Val Glu Val Asn Arg Ser Asn Arg Asn 115 120 125 Gln Glu Thr Ser Gly Glu Tyr Ala Ile Glu Ala Trp Thr Lys Phe Asp 130 135 140 Phe Pro Gly Arg Gly Asn Asn His Ser Ser Phe Lys Trp Arg Trp Tyr 145 150 155 160 His Phe Asp Gly Thr Asp Trp Asp Gln Ser Arg Gln Leu Gln Asn Lys 165 170 175 Ile Tyr Lys Phe Arg Gly Thr Gly Lys Ala Trp Asp Trp Glu Val Asp 180 185 190 Thr Glu Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Val Asp Met 195 200 205 Asp His Pro Glu Val Ile His Glu Leu Arg Asn Trp Gly Val Trp Tyr 210 215 220 Thr Asn Thr Leu Asn Leu Asp Gly Phe Arg Ile Asp Ala Val Lys His 225 230 235 240 Ile Lys Tyr Ser Phe Thr Arg Asp Trp Leu Thr His Val Arg Asn Thr 245 250 255 Thr Gly Lys Pro Met Phe Ala Val Ala Glu Phe Trp Lys Asn Asp Leu 260 265 270 Gly Ala Ile Glu Asn Tyr Leu Asn Lys Thr Ser Trp Asn His Ser Val 275 280 285 Phe Asp Val Pro Leu His Tyr Asn Leu Tyr Asn Ala Ser Asn Ser Gly 290 295 300 Gly Tyr Tyr Asp Met Arg Asn Ile Leu Asn Gly Ser Val Val Gln Lys 305 310 315 320 His Pro Thr His Ala Val Thr Phe Val Asp Asn His Asp Ser Gln Pro 325 330 335 Gly Glu Ala Leu Glu Ser Phe Val Gln Gln Trp Phe Lys Pro Leu Ala 340 345 350 Tyr Ala Leu Val Leu Thr Arg Glu Gln Gly Tyr Pro Ser Val Phe Tyr 355 360 365 Gly Asp Tyr Tyr Gly Ile Pro Thr His Gly Val Pro Ala Met Lys Ser 370 375 380 Lys Ile Asp Pro Leu Leu Gln Ala Arg Gln Thr Phe Ala Tyr Gly Thr 385 390 395 400 Gln His Asp Tyr Phe Asp His His Asp Ile Ile Gly Trp Thr Arg Glu 405 410 415 Gly Asn Ser Ser His Pro Asn Ser Gly Leu Ala Thr Ile Met Ser Asp 420 425 430 Gly Pro Gly Gly Asn Lys Trp Met Tyr Val Gly Lys Asn Lys Ala Gly 435 440 445 Gln Val Trp Arg Asp Ile Thr Gly Asn Arg Thr Gly Thr Val Thr Ile 450 455 460 Asn Ala Asp Gly Trp Gly Asn Phe Ser Val Asn Gly Gly Ser Val Ser 465 470 475 480 Val Trp Val Lys Gln 485 (2) INFORMATION FOR SEQ ID NO: 2: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 485 amino acids (B) TYPE: amino acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: peptide (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 2: His His Asn Gly Thr Asn Gly Thr Met Met Gln Tyr Phe Glu Trp His 1 5 10 15 Leu Pro Asn Asp Gly Asn His Trp Asn Arg Leu Arg Asp Asp Ala Ser 20 25 30 Asn Leu Arg Asn Arg Gly Ile Thr Ala Ile Trp Ile Pro Pro Ala Trp 35 40 45 Lys Gly Thr Ser Gln Asn Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr 50 55 60 Asp Leu Gly Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly 65 70 75 80 Thr Arg Ser Gln Leu Glu Ser Ala Ile His Ala Leu Lys Asn Asn Gly 85 90 95 Val Gln Val Tyr Gly Asp Val Val Met Asn His Lys Gly Gly Ala Asp 100 105 110 Ala Thr Glu Asn Val Leu Ala Val Glu Val Asn Pro Asn Asn Arg Asn 115 120 125 Gln Glu Ile Ser Gly Asp Tyr Thr Ile Glu Ala Trp Thr Lys Phe Asp 130 135 140 Phe Pro Gly Arg Gly Asn Thr Tyr Ser Asp Phe Lys Trp Arg Trp Tyr 145 150 155 160 His Phe Asp Gly Val Asp Trp Asp Gln Ser Arg Gln Phe Gln Asn Arg 165 170 175 Ile Tyr Lys Phe Arg Gly Asp Gly Lys Ala Trp Asp Trp Glu Val Asp 180 185 190 Ser Glu Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Val Asp Met 195 200 205 Asp His Pro Glu Val Val Asn Glu Leu Arg Arg Trp Gly Glu Trp Tyr 210 215 220 Thr Asn Thr Leu Asn Leu Asp Gly Phe Arg Ile Asp Ala Val Lys His 225 230 235 240 Ile Lys Tyr Ser Phe Thr Arg Asp Trp Leu Thr His Val Arg Asn Ala 245 250 255 Thr Gly Lys Glu Met Phe Ala Val Ala Glu Phe Trp Lys Asn Asp Leu 260 265 270 Gly Ala Leu Glu Asn Tyr Leu Asn Lys Thr Asn Trp Asn His Ser Val 275 280 285 Phe Asp Val Pro Leu His Tyr Asn Leu Tyr Asn Ala Ser Asn Ser Gly 290 295 300 Gly Asn Tyr Asp Met Ala Lys Leu Leu Asn Gly Thr Val Val Gln Lys 305 310 315 320 His Pro Met His Ala Val Thr Phe Val Asp Asn His Asp Ser Gln Pro 325 330 335 Gly Glu Ser Leu Glu Ser Phe Val Gln Glu Trp Phe Lys Pro Leu Ala 340 345 350 Tyr Ala Leu Ile Leu Thr Arg Glu Gln Gly Tyr Pro Ser Val Phe Tyr 355 360 365 Gly Asp Tyr Tyr Gly Ile Pro Thr His Ser Val Pro Ala Met Lys Ala 370 375 380 Lys Ile Asp Pro Ile Leu Glu Ala Arg Gln Asn Phe Ala Tyr Gly Thr 385 390 395 400 Gln His Asp Tyr Phe Asp His His Asn Ile Ile Gly Trp Thr Arg Glu 405 410 415 Gly Asn Thr Thr His Pro Asn Ser Gly Leu Ala Thr Ile Met Ser Asp 420 425 430 Gly Pro Gly Gly Glu Lys Trp Met Tyr Val Gly Gln Asn Lys Ala Gly 435 440 445 Gln Val Trp His Asp Ile Thr Gly Asn Lys Pro Gly Thr Val Thr Ile 450 455 460 Asn Ala Asp Gly Trp Ala Asn Phe Ser Val Asn Gly Gly Ser Val Ser 465 470 475 480 Ile Trp Val Lys Arg 485 (2) INFORMATION FOR SEQ ID NO: 3: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 514 amino acids (B) TYPE: amino acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: peptide (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 3: Ala Ala Pro Phe Asn Gly Thr Met Met Gln Tyr Phe Glu Trp Tyr Leu 1 5 10 15 Pro Asp Asp Gly Thr Leu Trp Thr Lys Val Ala Asn Glu Ala Asn Asn 20 25 30 Leu Ser Ser Leu Gly Ile Thr Ala Leu Trp Leu Pro Pro Ala Tyr Lys 35 40 45 Gly Thr Ser Arg Ser Asp Val Gly Tyr Gly Val Tyr Asp Leu Tyr Asp 50 55 60 Leu Gly Glu Phe Asn Gln Lys Gly Ala Val Arg Thr Lys Tyr Gly Thr 65 70 75 80 Lys Ala Gln Tyr Leu Gln Ala Ile Gln Ala Ala His Ala Ala Gly Met 85 90 95 Gln Val Tyr Ala Asp Val Val Phe Asp His Lys Gly Gly Ala Asp Gly 100 105 110 Thr Glu Trp Val Asp Ala Val Glu Val Asn Pro Ser Asp Arg Asn Gln 115 120 125 Glu Ile Ser Gly Thr Tyr Gln Ile Gln Ala Trp Thr Lys Phe Asp Phe 130 135 140 Pro Gly Arg Gly Asn Thr Tyr Ser Ser Phe Lys Trp Arg Trp Tyr His 145 150 155 160 Phe Asp Gly Val Asp Trp Asp Glu Ser Arg Lys Leu Ser Arg Ile Tyr 165 170 175 Lys Phe Arg Gly Ile Gly Lys Ala Trp Asp Trp Glu Val Asp Thr Glu 180 185 190 Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Leu Asp Met Asp His 195 200 205 Pro Glu Val Val Thr Glu Leu Lys Ser Trp Gly Lys Trp Tyr Val Asn 210 215 220 Thr Thr Asn Ile Asp Gly Phe Arg Leu Asp Ala Val Lys His Ile Lys 225 230 235 240 Phe Ser Phe Phe Pro Asp Trp Leu Ser Asp Val Arg Ser Gln Thr Gly 245 250 255 Lys Pro Leu Phe Thr Val Gly Glu Tyr Trp Ser Tyr Asp Ile Asn Lys 260 265 270 Leu His Asn Tyr Ile Met Lys Thr Asn Gly Thr Met Ser Leu Phe Asp 275 280 285 Ala Pro Leu His Asn Lys Phe Tyr Thr Ala Ser Lys Ser Gly Gly Thr 290 295 300 Phe Asp Met Arg Thr Leu Met Thr Asn Thr Leu Met Lys Asp Gln Pro 305 310 315 320 Thr Leu Ala Val Thr Phe Val Asp Asn His Asp Thr Glu Pro Gly Gln 325 330 335 Ala Leu Gln Ser Trp Val Asp Pro Trp Phe Lys Pro Leu Ala Tyr Ala 340 345 350 Phe Ile Leu Thr Arg Gln Glu Gly Tyr Pro Cys Val Phe Tyr Gly Asp 355 360 365 Tyr Tyr Gly Ile Pro Gln Tyr Asn Ile Pro Ser Leu Lys Ser Lys Ile 370 375 380 Asp Pro Leu Leu Ile Ala Arg Arg Asp Tyr Ala Tyr Gly Thr Gln His 385 390 395 400 Asp Tyr Leu Asp His Ser Asp Ile Ile Gly Trp Thr Arg Glu Gly Val 405 410 415 Thr Glu Lys Pro Gly Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro 420 425 430 Gly Gly Ser Lys Trp Met Tyr Val Gly Lys Gln His Ala Gly Lys Val 435 440 445 Phe Tyr Asp Leu Thr Gly Asn Arg Ser Asp Thr Val Thr Ile Asn Ser 450 455 460 Asp Gly Trp Gly Glu Phe Lys Val Asn Gly Gly Ser Val Ser Val Trp 465 470 475 480 Val Pro Arg Lys Thr Thr Val Ser Thr Ile Ala Trp Ser Ile Thr Thr 485 490 495 Arg Pro Trp Thr Asp Glu Phe Val Arg Trp Thr Glu Pro Arg Leu Val 500 505 510 Ala Trp (2) INFORMATION FOR SEQ ID NO: 4: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 483 amino acids (B) TYPE: amino acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: protein (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 4: Ala Asn Leu Asn Gly Thr Leu Met Gln Tyr Phe Glu Trp Tyr Met Pro 1 5 10 15 Asn Asp Gly Gln His Trp Arg Arg Leu Gln Asn Asp Ser Ala Tyr Leu 20 25 30 Ala Glu His Gly Ile Thr Ala Val Trp Ile Pro Pro Ala Tyr Lys Gly 35 40 45 Thr Ser Gln Ala Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr Asp Leu 50 55 60 Gly Glu Phe His Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr Lys 65 70 75 80 Gly Glu Leu Gln Ser Ala Ile Lys Ser Leu His Ser Arg Asp Ile Asn 85 90 95 Val Tyr Gly Asp Val Val Ile Asn His Lys Gly Gly Ala Asp Ala Thr 100 105 110 Glu Asp Val Thr Ala Val Glu Val Asp Pro Ala Asp Arg Asn Arg Val 115 120 125 Ile Ser Gly Glu His Leu Ile Lys Ala Trp Thr His Phe His Phe Pro 130 135 140 Gly Arg Gly Ser Thr Tyr Ser Asp Phe Lys Trp His Trp Tyr His Phe 145 150 155 160 Asp Gly Thr Asp Trp Asp Glu Ser Arg Lys Leu Asn Arg Ile Tyr Lys 165 170 175 Phe Gln Gly Lys Ala Trp Asp Trp Glu Val Ser Asn Glu Asn Gly Asn 180 185 190 Tyr Asp Tyr Leu Met Tyr Ala Asp Ile Asp Tyr Asp His Pro Asp Val 195 200 205 Ala Ala Glu Ile Lys Arg Trp Gly Thr Trp Tyr Ala Asn Glu Leu Gln 210 215 220 Leu Asp Gly Phe Arg Leu Asp Ala Val Lys His Ile Lys Phe Ser Phe 225 230 235 240 Leu Arg Asp Trp Val Asn His Val Arg Glu Lys Thr Gly Lys Glu Met 245 250 255 Phe Thr Val Ala Glu Tyr Trp Gln Asn Asp Leu Gly Ala Leu Glu Asn 260 265 270 Tyr Leu Asn Lys Thr Asn Phe Asn His Ser Val Phe Asp Val Pro Leu 275 280 285 His Tyr Gln Phe His Ala Ala Ser Thr Gln Gly Gly Gly Tyr Asp Met 290 295 300 Arg Lys Leu Leu Asn Gly Thr Val Val Ser Lys His Pro Leu Lys Ser 305 310 315 320 Val Thr Phe Val Asp Asn His Asp Thr Gln Pro Gly Gln Ser Leu Glu 325 330 335 Ser Thr Val Gln Thr Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu 340 345 350 Thr Arg Glu Ser Gly Tyr Pro Gln Val Phe Tyr Gly Asp Met Tyr Gly 355 360 365 Thr Lys Gly Asp Ser Gln Arg Glu Ile Pro Ala Leu Lys His Lys Ile 370 375 380 Glu Pro Ile Leu Lys Ala Arg Lys Gln Tyr Ala Tyr Gly Ala Gln His 385 390 395 400 Asp Tyr Phe Asp His His Asp Ile Val Gly Trp Thr Arg Glu Gly Asp 405 410 415 Ser Ser Val Ala Asn Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro 420 425 430 Gly Gly Ala Lys Arg Met Tyr Val Gly Arg Gln Asn Ala Gly Glu Thr 435 440 445 Trp His Asp Ile Thr Gly Asn Arg Ser Glu Pro Val Val Ile Asn Ser 450 455 460 Glu Gly Trp Gly Glu Phe His Val Asn Gly Gly Ser Val Ser Ile Tyr 465 470 475 480 Val Gln Arg (2) INFORMATION FOR SEQ ID NO: 5: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 480 amino acids (B) TYPE: amino acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: protein (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 5: Val Asn Gly Thr Leu Met Gln Tyr Phe Glu Trp Tyr Thr Pro Asn Asp 1 5 10 15 Gly Gln His Trp Lys Arg Leu Gln Asn Asp Ala Glu His Leu Ser Asp 20 25 30 Ile Gly Ile Thr Ala Val Trp Ile Pro Pro Ala Tyr Lys Gly Leu Ser 35 40 45 Gln Ser Asp Asn Gly Tyr Gly Pro Tyr Asp Leu Tyr Asp Leu Gly Glu 50 55 60 Phe Gln Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr Lys Ser Glu 65 70 75 80 Leu Gln Asp Ala Ile Gly Ser Leu His Ser Arg Asn Val Gln Val Tyr 85 90 95 Gly Asp Val Val Leu Asn His Lys Ala Gly Ala Asp Ala Thr Glu Asp 100 105 110 Val Thr Ala Val Glu Val Asn Pro Ala Asn Arg Asn Gln Glu Thr Ser 115 120 125 Glu Glu Tyr Gln Ile Lys Ala Trp Thr Asp Phe Arg Phe Pro Gly Arg 130 135 140 Gly Asn Thr Tyr Ser Asp Phe Lys Trp His Trp Tyr His Phe Asp Gly 145 150 155 160 Ala Asp Trp Asp Glu Ser Arg Lys Ile Ser Arg Ile Phe Lys Phe Arg 165 170 175 Gly Glu Gly Lys Ala Trp Asp Trp Glu Val Ser Ser Glu Asn Gly Asn 180 185 190 Tyr Asp Tyr Leu Met Tyr Ala Asp Val Asp Tyr Asp His Pro Asp Val 195 200 205 Val Ala Glu Thr Lys Lys Trp Gly Ile Trp Tyr Ala Asn Glu Leu Ser 210 215 220 Leu Asp Gly Phe Arg Ile Asp Ala Ala Lys His Ile Lys Phe Ser Phe 225 230 235 240 Leu Arg Asp Trp Val Gln Ala Val Arg Gln Ala Thr Gly Lys Glu Met 245 250 255 Phe Thr Val Ala Glu Tyr Trp Gln Asn Asn Ala Gly Lys Leu Glu Asn 260 265 270 Tyr Leu Asn Lys Thr Ser Phe Asn Gln Ser Val Phe Asp Val Pro Leu 275 280 285 His Phe Asn Leu Gln Ala Ala Ser Ser Gln Gly Gly Gly Tyr Asp Met 290 295 300 Arg Arg Leu Leu Asp Gly Thr Val Val Ser Arg His Pro Glu Lys Ala 305 310 315 320 Val Thr Phe Val Glu Asn His Asp Thr Gln Pro Gly Gln Ser Leu Glu 325 330 335 Ser Thr Val Gln Thr Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu 340 345 350 Thr Arg Glu Ser Gly Tyr Pro Gln Val Phe Tyr Gly Asp Met Tyr Gly 355 360 365 Thr Lys Gly Thr Ser Pro Lys Glu Ile Pro Ser Leu Lys Asp Asn Ile 370 375 380 Glu Pro Ile Leu Lys Ala Arg Lys Glu Tyr Ala Tyr Gly Pro Gln His 385 390 395 400 Asp Tyr Ile Asp His Pro Asp Val Ile Gly Trp Thr Arg Glu Gly Asp 405 410 415 Ser Ser Ala Ala Lys Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro 420 425 430 Gly Gly Ser Lys Arg Met Tyr Ala Gly Leu Lys Asn Ala Gly Glu Thr 435 440 445 Trp Tyr Asp Ile Thr Gly Asn Arg Ser Asp Thr Val Lys Ile Gly Ser 450 455 460 Asp Gly Trp Gly Glu Phe His Val Asn Asp Gly Ser Val Ser Ile Tyr 465 470 475 480 (2) INFORMATION FOR SEQ ID NO: 6: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 485 amino acids (B) TYPE: amino acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: peptide (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 6: His His Asn Gly Thr Asn Gly Thr Met Met Gln Tyr Phe Glu Trp Tyr 1 5 10 15 Leu Pro Asn Asp Gly Asn His Trp Asn Arg Leu Asn Ser Asp Ala Ser 20 25 30 Asn Leu Lys Ser Lys Gly Ile Thr Ala Val Trp Ile Pro Pro Ala Trp 35 40 45 Lys Gly Ala Ser Gln Asn Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr 50 55 60 Asp Leu Gly Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly 65 70 75 80 Thr Arg Ser Gln Leu Gln Ala Ala Val Thr Ser Leu Lys Asn Asn Gly 85 90 95 Ile Gln Val Tyr Gly Asp Val Val Met Asn His Lys Gly Gly Ala Asp 100 105 110 Ala Thr Glu Met Val Arg Ala Val Glu Val Asn Pro Asn Asn Arg Asn 115 120 125 Gln Glu Val Thr Gly Glu Tyr Thr Ile Glu Ala Trp Thr Arg Phe Asp 130 135 140 Phe Pro Gly Arg Gly Asn Thr His Ser Ser Phe Lys Trp Arg Trp Tyr 145 150 155 160 His Phe Asp Gly Val Asp Trp Asp Gln Ser Arg Arg Leu Asn Asn Arg 165 170 175 Ile Tyr Lys Phe Arg Gly His Gly Lys Ala Trp Asp Trp Glu Val Asp 180 185 190 Thr Glu Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Ile Asp Met 195 200 205 Asp His Pro Glu Val Val Asn Glu Leu Arg Asn Trp Gly Val Trp Tyr 210 215 220 Thr Asn Thr Leu Gly Leu Asp Gly Phe Arg Ile Asp Ala Val Lys His 225 230 235 240 Ile Lys Tyr Ser Phe Thr Arg Asp Trp Ile Asn His Val Arg Ser Ala 245 250 255 Thr Gly Lys Asn Met Phe Ala Val Ala Glu Phe Trp Lys Asn Asp Leu 260 265 270 Gly Ala Ile Glu Asn Tyr Leu Gln Lys Thr Asn Trp Asn His Ser Val 275 280 285 Phe Asp Val Pro Leu His Tyr Asn Leu Tyr Asn Ala Ser Lys Ser Gly 290 295 300 Gly Asn Tyr Asp Met Arg Asn Ile Phe Asn Gly Thr Val Val Gln Arg 305 310 315 320 His Pro Ser His Ala Val Thr Phe Val Asp Asn His Asp Ser Gln Pro 325 330 335 Glu Glu Ala Leu Glu Ser Phe Val Glu Glu Trp Phe Lys Pro Leu Ala 340 345 350 Tyr Ala Leu Thr Leu Thr Arg Glu Gln Gly Tyr Pro Ser Val Phe Tyr 355 360 365 Gly Asp Tyr Tyr Gly Ile Pro Thr His Gly Val Pro Ala Met Arg Ser 370 375 380 Lys Ile Asp Pro Ile Leu Glu Ala Arg Gln Lys Tyr Ala Tyr Gly Lys 385 390 395 400 Gln Asn Asp Tyr Leu Asp His His Asn Ile Ile Gly Trp Thr Arg Glu 405 410 415 Gly Asn Thr Ala His Pro Asn Ser Gly Leu Ala Thr Ile Met Ser Asp 420 425 430 Gly Ala Gly Gly Ser Lys Trp Met Phe Val Gly Arg Asn Lys Ala Gly 435 440 445 Gln Val Trp Ser Asp Ile Thr Gly Asn Arg Thr Gly Thr Val Thr Ile 450 455 460 Asn Ala Asp Gly Trp Gly Asn Phe Ser Val Asn Gly Gly Ser Val Ser 465 470 475 480 Ile Trp Val Asn Lys 485 (2) INFORMATION FOR SEQ ID NO: 7: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 485 amino acids (B) TYPE: amino acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: peptide (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 7: His His Asn Gly Thr Asn Gly Thr Met Met Gln Tyr Phe Glu Trp Tyr 1 5 10 15 Leu Pro Asn Asp Gly Asn His Trp Asn Arg Leu Arg Asp Asp Ala Ala 20 25 30 Asn Leu Lys Ser Lys Gly Ile Thr Ala Val Trp Ile Pro Pro Ala Trp 35 40 45 Lys Gly Thr Ser Gln Asn Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr 50 55 60 Asp Leu Gly Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly 65 70 75 80 Thr Arg Asn Gln Leu Gln Ala Ala Val Thr Ser Leu Lys Asn Asn Gly 85 90 95 Ile Gln Val Tyr Gly Asp Val Val Met Asn His Lys Gly Gly Ala Asp 100 105 110 Gly Thr Glu Ile Val Asn Ala Val Glu Val Asn Arg Ser Asn Arg Asn 115 120 125 Gln Glu Thr Ser Gly Glu Tyr Ala Ile Glu Ala Trp Thr Lys Phe Asp 130 135 140 Phe Pro Gly Arg Gly Asn Asn His Ser Ser Phe Lys Trp Arg Trp Tyr 145 150 155 160 His Phe Asp Gly Thr Asp Trp Asp Gln Ser Arg Gln Leu Gln Asn Lys 165 170 175 Ile Tyr Lys Phe Arg Gly Thr Gly Lys Ala Trp Asp Trp Glu Val Asp 180 185 190 Thr Glu Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Val Asp Met 195 200 205 Asp His Pro Glu Val Ile His Glu Leu Arg Asn Trp Gly Val Trp Tyr 210 215 220 Thr Asn Thr Leu Asn Leu Asp Gly Phe Arg Ile Asp Ala Val Lys His 225 230 235 240 Ile Lys Tyr Ser Phe Thr Arg Asp Trp Leu Thr His Val Arg Asn Thr 245 250 255 Thr Gly Lys Pro Met Phe Ala Val Ala Glu Phe Trp Lys Asn Asp Leu 260 265 270 Gly Ala Ile Glu Asn Tyr Leu Asn Lys Thr Ser Trp Asn His Ser Val 275 280 285 Phe Asp Val Pro Leu His Tyr Asn Leu Tyr Asn Ala Ser Asn Ser Gly 290 295 300 Gly Tyr Tyr Asp Met Arg Asn Ile Leu Asn Gly Ser Val Val Gln Lys 305 310 315 320 His Pro Thr His Ala Val Thr Phe Val Asp Asn His Asp Ser Gln Pro 325 330 335 Gly Glu Ala Leu Glu Ser Phe Val Gln Gln Trp Phe Lys Pro Leu Ala 340 345 350 Tyr Ala Leu Val Leu Thr Arg Glu Gln Gly Tyr Pro Ser Val Phe Tyr 355 360 365 Gly Asp Tyr Tyr Gly Ile Pro Thr His Gly Val Pro Ala Met Lys Ser 370 375 380 Lys Ile Asp Pro Leu Leu Gln Ala Arg Gln Thr Phe Ala Tyr Gly Thr 385 390 395 400 Gln His Asp Tyr Phe Asp His His Asp Ile Ile Gly Trp Thr Arg Glu 405 410 415 Gly Asn Ser Ser His Pro Asn Ser Gly Leu Ala Thr Ile Met Ser Asp 420 425 430 Gly Pro Gly Gly Asn Lys Trp Met Tyr Val Gly Lys Asn Lys Ala Gly 435 440 445 Gln Val Trp Arg Asp Ile Thr Gly Asn Arg Thr Gly Thr Val Thr Ile 450 455 460 Asn Ala Asp Gly Trp Gly Asn Phe Ser Val Asn Gly Gly Ser Val Ser 465 470 475 480 Val Trp Val Lys Gln 485 (2) INFORMATION FOR SEQ ID NO: 8: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 485 amino acids (B) TYPE: amino acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: peptide (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 8: His His Asn Gly Thr Asn Gly Thr Met Met Gln Tyr Phe Glu Trp His 1 5 10 15 Leu Pro Asn Asp Gly Asn His Trp Asn Arg Leu Arg Asp Asp Ala Ser 20 25 30 Asn Leu Arg Asn Arg Gly Ile Thr Ala Ile Trp Ile Pro Pro Ala Trp 35 40 45 Lys Gly Thr Ser Gln Asn Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr 50 55 60 Asp Leu Gly Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly 65 70 75 80 Thr Arg Ser Gln Leu Glu Ser Ala Ile His Ala Leu Lys Asn Asn Gly 85 90 95 Val Gln Val Tyr Gly Asp Val Val Met Asn His Lys Gly Gly Ala Asp 100 105 110 Ala Thr Glu Asn Val Leu Ala Val Glu Val Asn Pro Asn Asn Arg Asn 115 120 125 Gln Glu Ile Ser Gly Asp Tyr Thr Ile Glu Ala Trp Thr Lys Phe Asp 130 135 140 Phe Pro Gly Arg Gly Asn Thr Tyr Ser Asp Phe Lys Trp Arg Trp Tyr 145 150 155 160 His Phe Asp Gly Val Asp Trp Asp Gln Ser Arg Gln Phe Gln Asn Arg 165 170 175 Ile Tyr Lys Phe Arg Gly Asp Gly Lys Ala Trp Asp Trp Glu Val Asp 180 185 190 Ser Glu Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Val Asp Met 195 200 205 Asp His Pro Glu Val Val Asn Glu Leu Arg Arg Trp Gly Glu Trp Tyr 210 215 220 Thr Asn Thr Leu Asn Leu Asp Gly Phe Arg Ile Asp Ala Val Lys His 225 230 235 240 Ile Lys Tyr Ser Phe Thr Arg Asp Trp Leu Thr His Val Arg Asn Ala 245 250 255 Thr Gly Lys Glu Met Phe Ala Val Ala Glu Phe Trp Lys Asn Asp Leu 260 265 270 Gly Ala Leu Glu Asn Tyr Leu Asn Lys Thr Asn Trp Asn His Ser Val 275 280 285 Phe Asp Val Pro Leu His Tyr Asn Leu Tyr Asn Ala Ser Asn Ser Gly 290 295 300 Gly Asn Tyr Asp Met Ala Lys Leu Leu Asn Gly Thr Val Val Gln Lys 305 310 315 320 His Pro Met His Ala Val Thr Phe Val Asp Asn His Asp Ser Gln Pro 325 330 335 Gly Glu Ser Leu Glu Ser Phe Val Gln Glu Trp Phe Lys Pro Leu Ala 340 345 350 Tyr Ala Leu Ile Leu Thr Arg Glu Gln Gly Tyr Pro Ser Val Phe Tyr 355 360 365 Gly Asp Tyr Tyr Gly Ile Pro Thr His Ser Val Pro Ala Met Lys Ala 370 375 380 Lys Ile Asp Pro Ile Leu Glu Ala Arg Gln Asn Phe Ala Tyr Gly Thr 385 390 395 400 Gln His Asp Tyr Phe Asp His His Asn Ile Ile Gly Trp Thr Arg Glu 405 410 415 Gly Asn Thr Thr His Pro Asn Ser Gly Leu Ala Thr Ile Met Ser Asp 420 425 430 Gly Pro Gly Gly Glu Lys Trp Met Tyr Val Gly Gln Asn Lys Ala Gly 435 440 445 Gln Val Trp His Asp Ile Thr Gly Asn Lys Pro Gly Thr Val Thr Ile 450 455 460 Asn Ala Asp Gly Trp Ala Asn Phe Ser Val Asn Gly Gly Ser Val Ser 465 470 475 480 Ile Trp Val Lys Arg 485 (2) INFORMATION FOR SEQ ID NO: 9: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 1455 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: DNA (genomic) (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 9: CATCATAATG GAACAAATGG TACTATGATG CAATATTTCG AATGGTATTT GCCAAATGAC 60 GGGAATCATT GGAACAGGTT GAGGGATGAC GCAGCTAACT TAAAGAGTAA AGGGATAACA 120 GCTGTATGGA TCCCACCTGC ATGGAAGGGG ACTTCCCAGA ATGATGTAGG TTATGGAGCC 180 TATGATTTAT ATGATCTTGG AGAGTTTAAC CAGAAGGGGA CGGTTCGTAC AAAATATGGA 240 ACACGCAACC AGCTACAGGC TGCGGTGACC TCTTTAAAAA ATAACGGCAT TCAGGTATAT 300 GGTGATGTCG TCATGAATCA TAAAGGTGGA GCAGATGGTA CGGAAATTGT AAATGCGGTA 360 GAAGTGAATC GGAGCAACCG AAACCAGGAA ACCTCAGGAG AGTATGCAAT AGAAGCGTGG 420 ACAAAGTTTG ATTTTCCTGG AAGAGGAAAT AACCATTCCA GCTTTAAGTG GCGCTGGTAT 480 CATTTTGATG GGACAGATTG GGATCAGTCA CGCCAGCTTC AAAACAAAAT ATATAAATTC 540 AGGGGAACAG GCAAGGCCTG GGACTGGGAA GTCGATACAG AGAATGGCAA CTATGACTAT 600 CTTATGTATG CAGACGTGGA TATGGATCAC CCAGAAGTAA TACATGAACT TAGAAACTGG 660 GGAGTGTGGT ATACGAATAC ACTGAACCTT GATGGATTTA GAATAGATGC AGTGAAACAT 720 ATAAAATATA GCTTTACGAG AGATTGGCTT ACACATGTGC GTAACACCAC AGGTAAACCA 780 ATGTTTGCAG TGGCTGAGTT TTGGAAAAAT GACCTTGGTG CAATTGAAAA CTATTTGAAT 840 AAAACAAGTT GGAATCACTC GGTGTTTGAT GTTCCTCTCC ACTATAATTT GTACAATGCA 900 TCTAATAGCG GTGGTTATTA TGATATGAGA AATATTTTAA ATGGTTCTGT GGTGCAAAAA 960 CATCCAACAC ATGCCGTTAC TTTTGTTGAT AACCATGATT CTCAGCCCGG GGAAGCATTG 1020 GAATCCTTTG TTCAACAATG GTTTAAACCA CTTGCATATG CATTGGTTCT GACAAGGGAA 1080 CAAGGTTATC CTTCCGTATT TTATGGGGAT TACTACGGTA TCCCAACCCA TGGTGTTCCG 1140 GCTATGAAAT CTAAAATAGA CCCTCTTCTG CAGGCACGTC AAACTTTTGC CTATGGTACG 1200 CAGCATGATT ACTTTGATCA TCATGATATT ATCGGTTGGA CAAGAGAGGG AAATAGCTCC 1260 CATCCAAATT CAGGCCTTGC CACCATTATG TCAGATGGTC CAGGTGGTAA CAAATGGATG 1320 TATGTGGGGA AAAATAAAGC GGGACAAGTT TGGAGAGATA TTACCGGAAA TAGGACAGGC 1380 ACCGTCACAA TTAATGCAGA CGGATGGGGT AATTTCTCTG TTAATGGAGG GTCCGTTTCG 1440 GTTTGGGTGA AGCAA 1455 (2) INFORMATION FOR SEQ ID NO: 10: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 1455 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: DNA (genomic) (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 10: CATCATAATG GGACAAATGG GACGATGATG CAATACTTTG AATGGCACTT GCCTAATGAT 60 GGGAATCACT GGAATAGATT AAGAGATGAT GCTAGTAATC TAAGAAATAG AGGTATAACC 120 GCTATTTGGA TTCCGCCTGC CTGGAAAGGG ACTTCGCAAA ATGATGTGGG GTATGGAGCC 180 TATGATCTTT ATGATTTAGG GGAATTTAAT CAAAAGGGGA CGGTTCGTAC TAAGTATGGG 240 ACACGTAGTC AATTGGAGTC TGCCATCCAT GCTTTAAAGA ATAATGGCGT TCAAGTTTAT 300 GGGGATGTAG TGATGAACCA TAAAGGAGGA GCTGATGCTA CAGAAAACGT TCTTGCTGTC 360 GAGGTGAATC CAAATAACCG GAATCAAGAA ATATCTGGGG ACTACACAAT TGAGGCTTGG 420 ACTAAGTTTG ATTTTCCAGG GAGGGGTAAT ACATACTCAG ACTTTAAATG GCGTTGGTAT 480 CATTTCGATG GTGTAGATTG GGATCAATCA CGACAATTCC AAAATCGTAT CTACAAATTC 540 CGAGGTGATG GTAAGGCATG GGATTGGGAA GTAGATTCGG AAAATGGAAA TTATGATTAT 600 TTAATGTATG CAGATGTAGA TATGGATCAT CCGGAGGTAG TAAATGAGCT TAGAAGATGG 660 GGAGAATGGT ATACAAATAC ATTAAATCTT GATGGATTTA GGATCGATGC GGTGAAGCAT 720 ATTAAATATA GCTTTACACG TGATTGGTTG ACCCATGTAA GAAACGCAAC GGGAAAAGAA 780 ATGTTTGCTG TTGCTGAATT TTGGAAAAAT GATTTAGGTG CCTTGGAGAA CTATTTAAAT 840 AAAACAAACT GGAATCATTC TGTCTTTGAT GTCCCCCTTC ATTATAATCT TTATAACGCG 900 TCAAATAGTG GAGGCAACTA TGACATGGCA AAACTTCTTA ATGGAACGGT TGTTCAAAAG 960 CATCCAATGC ATGCCGTAAC TTTTGTGGAT AATCACGATT CTCAACCTGG GGAATCATTA 1020 GAATCATTTG TACAAGAATG GTTTAAGCCA CTTGCTTATG CGCTTATTTT AACAAGAGAA 1080 CAAGGCTATC CCTCTGTCTT CTATGGTGAC TACTATGGAA TTCCAACACA TAGTGTCCCA 1140 GCAATGAAAG CCAAGATTGA TCCAATCTTA GAGGCGCGTC AAAATTTTGC ATATGGAACA 1200 CAACATGATT ATTTTGACCA TCATAATATA ATCGGATGGA CACGTGAAGG AAATACCACG 1260 CATCCCAATT CAGGACTTGC GACTATCATG TCGGATGGGC CAGGGGGAGA GAAATGGATG 1320 TACGTAGGGC AAAATAAAGC AGGTCAAGTT TGGCATGACA TAACTGGAAA TAAACCAGGA 1380 ACAGTTACGA TCAATGCAGA TGGATGGGCT AATTTTTCAG TAAATGGAGG ATCTGTTTCC 1440 ATTTGGGTGA AACGA 1455 (2) INFORMATION FOR SEQ ID NO: 11: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 1548 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: DNA (genomic) (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 11: GCCGCACCGT TTAACGGCAC CATGATGCAG TATTTTGAAT GGTACTTGCC GGATGATGGC 60 ACGTTATGGA CCAAAGTGGC CAATGAAGCC AACAACTTAT CCAGCCTTGG CATCACCGCT 120 CTTTGGCTGC CGCCCGCTTA CAAAGGAACA AGCCGCAGCG ACGTAGGGTA CGGAGTATAC 180 GACTTGTATG ACCTCGGCGA ATTCAATCAA AAAGGGACCG TCCGCACAAA ATACGGAACA 240 AAAGCTCAAT ATCTTCAAGC CATTCAAGCC GCCCACGCCG CTGGAATGCA AGTGTACGCC 300 GATGTCGTGT TCGACCATAA AGGCGGCGCT GACGGCACGG AATGGGTGGA CGCCGTCGAA 360 GTCAATCCGT CCGACCGCAA CCAAGAAATC TCGGGCACCT ATCAAATCCA AGCATGGACG 420 AAATTTGATT TTCCCGGGCG GGGCAACACC TACTCCAGCT TTAAGTGGCG CTGGTACCAT 480 TTTGACGGCG TTGATTGGGA CGAAAGCCGA AAATTGAGCC GCATTTACAA ATTCCGCGGC 540 ATCGGCAAAG CGTGGGATTG GGAAGTAGAC ACGGAAAACG GAAACTATGA CTACTTAATG 600 TATGCCGACC TTGATATGGA TCATCCCGAA GTCGTGACCG AGCTGAAAAA CTGGGGGAAA 660 TGGTATGTCA ACACAACGAA CATTGATGGG TTCCGGCTTG ATGCCGTCAA GCATATTAAG 720 TTCAGTTTTT TTCCTGATTG GTTGTCGTAT GTGCGTTCTC AGACTGGCAA GCCGCTATTT 780 ACCGTCGGGG AATATTGGAG CTATGACATC AACAAGTTGC ACAATTACAT TACGAAAACA 840 GACGGAACGA TGTCTTTGTT TGATGCCCCG TTACACAACA AATTTTATAC CGCTTCCAAA 900 TCAGGGGGCG CATTTGATAT GCGCACGTTA ATGACCAATA CTCTCATGAA AGATCAACCG 960 ACATTGGCCG TCACCTTCGT TGATAATCAT GACACCGAAC CCGGCCAAGC GCTGCAGTCA 1020 TGGGTCGACC CATGGTTCAA ACCGTTGGCT TACGCCTTTA TTCTAACTCG GCAGGAAGGA 1080 TACCCGTGCG TCTTTTATGG TGACTATTAT GGCATTCCAC AATATAACAT TCCTTCGCTG 1140 AAAAGCAAAA TCGATCCGCT CCTCATCGCG CGCAGGGATT ATGCTTACGG AACGCAACAT 1200 GATTATCTTG ATCACTCCGA CATCATCGGG TGGACAAGGG AAGGGGGCAC TGAAAAACCA 1260 GGATCCGGAC TGGCCGCACT GATCACCGAT GGGCCGGGAG GAAGCAAATG GATGTACGTT 1320 GGCAAACAAC ACGCTGGAAA AGTGTTCTAT GACCTTACCG GCAACCGGAG TGACACCGTC 1380 ACCATCAACA GTGATGGATG GGGGGAATTC AAAGTCAATG GCGGTTCGGT TTCGGTTTGG 1440 GTTCCTAGAA AAACGACCGT TTCTACCATC GCTCGGCCGA TCACAACCCG ACCGTGGACT 1500 GGTGAATTCG TCCGTTGGAC CGAACCACGG TTGGTGGCAT GGCCTTGA 1548 (2) INFORMATION FOR SEQ ID NO: 12: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 1920 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: DNA (genomic) (ix) FEATURE: (A) NAME/KEY: CDS (B) LOCATION:421..1872 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 12: CGGAAGATTG GAAGTACAAA AATAAGCAAA AGATTGTCAA TCATGTCATG AGCCATGCGG 60 GAGACGGAAA AATCGTCTTA ATGCACGATA TTTATGCAAC GTTCGCAGAT GCTGCTGAAG 120 AGATTATTAA AAAGCTGAAA GCAAAAGGCT ATCAATTGGT AACTGTATCT CAGCTTGAAG 180 AAGTGAAGAA GCAGAGAGGC TATTGAATAA ATGAGTAGAA GCGCCATATC GGCGCTTTTC 240 TTTTGGAAGA AAATATAGGG AAAATGGTAC TTGTTAAAAA TTCGGAATAT TTATACAACA 300 TCATATGTTT CACATTGAAA GGGGAGGAGA ATCATGAAAC AACAAAAACG GCTTTACGCC 360 CGATTGCTGA CGCTGTTATT TGCGCTCATC TTCTTGCTGC CTCATTCTGC AGCAGCGGCG 420 GCA AAT CTT AAT GGG ACG CTG ATG CAG TAT TTT GAA TGG TAC ATG CCC 468 AAT GAC GGC CAA CAT TGG AGG CGT TTG CAA AAC GAC TCG GCA TAT TTG 516 GCT GAA CAC GGT ATT ACT GCC GTC TGG ATT CCC CCG GCA TAT AAG GGA 564 ACG AGC CAA GCG GAT GTG GGC TAC GGT GCT TAC GAC CTT TAT GAT TTA 612 GGG GAG TTT CAT CAA AAA GGG ACG GTT CGG ACA AAG TAC GGC ACA AAA 660 GGA GAG CTG CAA TCT GCG ATC AAA AGT CTT CAT TCC CGC GAC ATT AAC 708 GTT TAC GGG GAT GTG GTC ATC AAC CAC AAA GGC GGC GCT GAT GCG ACC 756 GAA GAT GTA ACC GCG GTT GAA GTC GAT CCC GCT GAC CGC AAC CGC GTA 804 ATT TCA GGA GAA CAC CTA ATT AAA GCC TGG ACA CAT TTT CAT TTT CCG 852 GGG CGC GGC AGC ACA TAC AGC GAT TTT AAA TGG CAT TGG TAC CAT TTT 900 GAC GGA ACC GAT TGG GAC GAG TCC CGA AAG CTG AAC CGC ATC TAT AAG 948 TTT CAA GGA AAG GCT TGG GAT TGG GAA GTT TCC AAT GAA AAC GGC AAC 996 TAT GAT TAT TTG ATG TAT GCC GAC ATC GAT TAT GAC CAT CCT GAT GTC 1044 GCA GCA GAA ATT AAG AGA TGG GGC ACT TGG TAT GCC AAT GAA CTG CAA 1092 TTG GAC GGT TTC CGT CTT GAT GCT GTC AAA CAC ATT AAA TTT TCT TTT 1140 TTG CGG GAT TGG GTT AAT CAT GTC AGG GAA AAA ACG GGG AAG GAA ATG 1188 TTT ACG GTA GCT GAA TAT TGG CAG AAT GAC TTG GGC GCG CTG GAA AAC 1236 TAT TTG AAC AAA ACA AAT TTT AAT CAT TCA GTG TTT GAC GTG CCG CTT 1284 CAT TAT CAG TTC CAT GCT GCA TCG ACA CAG GGA GGC GGC TAT GAT ATG 1332 AGG AAA TTG CTG AAC GGT ACG GTC GTT TCC AAG CAT CCG TTG AAA TCG 1380 GTT ACA TTT GTC GAT AAC CAT GAT ACA CAG CCG GGG CAA TCG CTT GAG 1428 TCG ACT GTC CAA ACA TGG TTT AAG CCG CTT GCT TAC GCT TTT ATT CTC 1476 ACA AGG GAA TCT GGA TAC CCT CAG GTT TTC TAC GGG GAT ATG TAC GGG 1524 ACG AAA GGA GAC TCC CAG CGC GAA ATT CCT GCC TTG AAA CAC AAA ATT 1572 GAA CCG ATC TTA AAA GCG AGA AAA CAG TAT GCG TAC GGA GCA CAG CAT 1620 GAT TAT TTC GAC CAC CAT GAC ATT GTC GGC TGG ACA AGG GAA GGC GAC 1668 AGC TCG GTT GCA AAT TCA GGT TTG GCG GCA TTA ATA ACA GAC GGA CCC 1716 GGT GGG GCA AAG CGA ATG TAT GTC GGC CGG CAA AAC GCC GGT GAG ACA 1764 TGG CAT GAC ATT ACC GGA AAC CGT TCG GAG CCG GTT GTC ATC AAT TCG 1812 GAA GGC TGG GGA GAG TTT CAC GTA AAC GGC GGG TCG GTT TCA ATT TAT 1860 GTT CAA AGA TAG AAGAGCAGAG AGGACGGATT TCCTGAAGGA AATCCGTTTT 1912 TTTATTTT 1920 (2) INFORMATION FOR SEQ ID NO: 13: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 1455 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: DNA (genomic) (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 13: CATCATAATG GAACAAATGG TACTATGATG CAATATTTCG AATGGTATTT GCCAAATGAC 60 GGGAATCATT GGAACAGGTT GAGGGATGAC GCAGCTAACT TAAAGAGTAA AGGGATAACA 120 GCTGTATGGA TCCCACCTGC ATGGAAGGGG ACTTCCCAGA ATGATGTAGG TTATGGAGCC 180 TATGATTTAT ATGATCTTGG AGAGTTTAAC CAGAAGGGGA CGGTTCGTAC AAAATATGGA 240 ACACGCAACC AGCTACAGGC TGCGGTGACC TCTTTAAAAA ATAACGGCAT TCAGGTATAT 300 GGTGATGTCG TCATGAATCA TAAAGGTGGA GCAGATGGTA CGGAAATTGT AAATGCGGTA 360 GAAGTGAATC GGAGCAACCG AAACCAGGAA ACCTCAGGAG AGTATGCAAT AGAAGCGTGG 420 ACAAAGTTTG ATTTTCCTGG AAGAGGAAAT AACCATTCCA GCTTTAAGTG GCGCTGGTAT 480 CATTTTGATG GGACAGATTG GGATCAGTCA CGCCAGCTTC AAAACAAAAT ATATAAATTC 540 AGGGGAACAG GCAAGGCCTG GGACTGGGAA GTCGATACAG AGAATGGCAA CTATGACTAT 600 CTTATGTATG CAGACGTGGA TATGGATCAC CCAGAAGTAA TACATGAACT TAGAAACTGG 660 GGAGTGTGGT ATACGAATAC ACTGAACCTT GATGGATTTA GAATAGATGC AGTGAAACAT 720 ATAAAATATA GCTTTACGAG AGATTGGCTT ACACATGTGC GTAACACCAC AGGTAAACCA 780 ATGTTTGCAG TGGCTGAGTT TTGGAAAAAT GACCTTGGTG CAATTGAAAA CTATTTGAAT 840 AAAACAAGTT GGAATCACTC GGTGTTTGAT GTTCCTCTCC ACTATAATTT GTACAATGCA 900 TCTAATAGCG GTGGTTATTA TGATATGAGA AATATTTTAA ATGGTTCTGT GGTGCAAAAA 960 CATCCAACAC ATGCCGTTAC TTTTGTTGAT AACCATGATT CTCAGCCCGG GGAAGCATTG 1020 GAATCCTTTG TTCAACAATG GTTTAAACCA CTTGCATATG CATTGGTTCT GACAAGGGAA 1080 CAAGGTTATC CTTCCGTATT TTATGGGGAT TACTACGGTA TCCCAACCCA TGGTGTTCCG 1140 GCTATGAAAT CTAAAATAGA CCCTCTTCTG CAGGCACGTC AAACTTTTGC CTATGGTACG 1200 CAGCATGATT ACTTTGATCA TCATGATATT ATCGGTTGGA CAAGAGAGGG AAATAGCTCC 1260 CATCCAAATT CAGGCCTTGC CACCATTATG TCAGATGGTC CAGGTGGTAA CAAATGGATG 1320 TATGTGGGGA AAAATAAAGC GGGACAAGTT TGGAGAGATA TTACCGGAAA TAGGACAGGC 1380 ACCGTCACAA TTAATGCAGA CGGATGGGGT AATTTCTCTG TTAATGGAGG GTCCGTTTCG 1440 GTTTGGGTGA AGCAA 1455 (2) INFORMATION FOR SEQ ID NO: 14: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 1455 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: DNA (genomic) (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 14: CATCATAATG GGACAAATGG GACGATGATG CAATACTTTG AATGGCACTT GCCTAATGAT 60 GGGAATCACT GGAATAGATT AAGAGATGAT GCTAGTAATC TAAGAAATAG AGGTATAACC 120 GCTATTTGGA TTCCGCCTGC CTGGAAAGGG ACTTCGCAAA ATGATGTGGG GTATGGAGCC 180 TATGATCTTT ATGATTTAGG GGAATTTAAT CAAAAGGGGA CGGTTCGTAC TAAGTATGGG 240 ACACGTAGTC AATTGGAGTC TGCCATCCAT GCTTTAAAGA ATAATGGCGT TCAAGTTTAT 300 GGGGATGTAG TGATGAACCA TAAAGGAGGA GCTGATGCTA CAGAAAACGT TCTTGCTGTC 360 GAGGTGAATC CAAATAACCG GAATCAAGAA ATATCTGGGG ACTACACAAT TGAGGCTTGG 420 ACTAAGTTTG ATTTTCCAGG GAGGGGTAAT ACATACTCAG ACTTTAAATG GCGTTGGTAT 480 CATTTCGATG GTGTAGATTG GGATCAATCA CGACAATTCC AAAATCGTAT CTACAAATTC 540 CGAGGTGATG GTAAGGCATG GGATTGGGAA GTAGATTCGG AAAATGGAAA TTATGATTAT 600 TTAATGTATG CAGATGTAGA TATGGATCAT CCGGAGGTAG TAAATGAGCT TAGAAGATGG 660 GGAGAATGGT ATACAAATAC ATTAAATCTT GATGGATTTA GGATCGATGC GGTGAAGCAT 720 ATTAAATATA GCTTTACACG TGATTGGTTG ACCCATGTAA GAAACGCAAC GGGAAAAGAA 780 ATGTTTGCTG TTGCTGAATT TTGGAAAAAT GATTTAGGTG CCTTGGAGAA CTATTTAAAT 840 AAAACAAACT GGAATCATTC TGTCTTTGAT GTCCCCCTTC ATTATAATCT TTATAACGCG 900 TCAAATAGTG GAGGCAACTA TGACATGGCA AAACTTCTTA ATGGAACGGT TGTTCAAAAG 960 CATCCAATGC ATGCCGTAAC TTTTGTGGAT AATCACGATT CTCAACCTGG GGAATCATTA 1020 GAATCATTTG TACAAGAATG GTTTAAGCCA CTTGCTTATG CGCTTATTTT AACAAGAGAA 1080 CAAGGCTATC CCTCTGTCTT CTATGGTGAC TACTATGGAA TTCCAACACA TAGTGTCCCA 1140 GCAATGAAAG CCAAGATTGA TCCAATCTTA GAGGCGCGTC AAAATTTTGC ATATGGAACA 1200 CAACATGATT ATTTTGACCA TCATAATATA ATCGGATGGA CACGTGAAGG AAATACCACG 1260 CATCCCAATT CAGGACTTGC GACTATCATG TCGGATGGGC CAGGGGGAGA GAAATGGATG 1320 TACGTAGGGC AAAATAAAGC AGGTCAAGTT TGGCATGACA TAACTGGAAA TAAACCAGGA 1380 ACAGTTACGA TCAATGCAGA TGGATGGGCT AATTTTTCAG TAAATGGAGG ATCTGTTTCC 1440 ATTTGGGTGA AACGA 1455 (2) INFORMATION FOR SEQ ID NO: 15: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 60 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/ KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Forward Primer FSA" (ix) FEATURE: (A) NAME/KEY: misc-feature (B) LOCATION: 22-27,29,31-33,41 (D): OTHER INFORMATION: /Note= 1: 35% A, 65% C 2: 83% G, 17% A 3: 63% G, 37% T 4: 86% G, 14% A 5: 85% G, 15% C 6: 50% T, 50% C 7: 95% A, 5%G 8: 58% G, 37% A, 5% T 9: 86% C, 13% A, 1% G 10: 83% T, 17% G 11: 92% G, 8% C (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 15: caaaatcgta tctacaaatt c123456a7g 8910tgggatt 11ggaagtaga ttcggaaaat 60 (2) INFORMATION FOR SEQ ID NO: 16: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 21 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Reverse Primer RSA" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 16: gaatttgtag atacgatttt g 21 (2) INFORMATION FOR SEQ ID NO: 17: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 24 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer B1" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 17: CGATTGCTGA CGCTGTTATT TGCG 24 (2) INFORMATION FOR SEQ ID NO: 18: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 24 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer Y2" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 18: CTTGTTCCCT TGTCAGAACC AATG 24 (2) INFORMATION FOR SEQ ID NO: 19: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 30 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer 101458" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 19: GTCATAGTTG CCGAAATCTG TATCGACTTC 30 (2) INFORMATION FOR SEQ ID NO: 20: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 35 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer 101638" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 20: CCCAGTCCCA CGTACGTCCC CTGAATTTATATA TTTTG 35 (2) INFORMATION FOR SEQ ID NO: 21: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 38 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Oligo 1" (A) NAME/KEY: misc-feature (B) LOCATION: 12 (D): OTHER INFORMATION: /Note=N= 25% A, 25% C, 25% G, 25% T. (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 21: CCCAGTCCCA GNTCTTTCCC CTGAATTTAT ATATTTTG 38 (2) INFORMATION FOR SEQ ID NO: 22: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 25 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer X2" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 22: GCGTGGACAA AGTTTGATTT TCCTG 25 (2) INFORMATION FOR SEQ ID NO: 23: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 21 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer DA01" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 23: CCTAATGATG GGAATCACTG G 21 2) INFORMATION FOR SEQ ID NO: 24: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 24 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer DA03" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 24: GCATTGGATG CTTTTGAACA ACCG 24 2) INFORMATION FOR SEQ ID NO: 25: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 26 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer DA07" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 25: CGCAAAATGA TATCGGGTAT GGAGCC 26 (2) INFORMATION FOR SEQ ID NO: 26: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 29 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/ KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer DA20" (ix) FEATURE: (A) NAME/KEY: misc-feature (B) LOCATION: 13,14 (D): OTHER INFORMATION: /Note:S= mixture of C and G W= mixture of A and T (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 26: GTGATGAACC ACSWAGGTGG AGCTGATGC 29 (2) INFORMATION FOR SEQ ID NO: 27: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 30 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/ KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer DA14" (ix) FEATURE: (A) NAME/KEY: misc-feature (B) LOCATION: 13,14 (D): OTHER INFORMATION: /Note:R= mixture of A and G Y= mixture of C and T (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 27: GATGGTGTAT GGRYCAATCA CGACAATTCC 30 2) INFORMATION FOR SEQ ID NO: 28: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 28 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer DA15" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 28: GGTGTATGGG ATAACTCACG ACAATTCC 28 2) INFORMATION FOR SEQ ID NO: 29: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 28 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer DA16" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 29: GGTGTATGGG ATCTCTCACG ACAATTCC 28 2) INFORMATION FOR SEQ ID NO: 30: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 32 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer DA17" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 30: GGGATCAATC ACGAAATTTC CAAAATCGTA TC 32 2) INFORMATION FOR SEQ ID NO: 31: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 32 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer DA18" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 31: GGGATCAATC ACGACTCTTC CAAAATCGTA TC 32 2) INFORMATION FOR SEQ ID NO: 32: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 34 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer DA06" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 32: GGAAATTATG ATTATATCAT GTATGCAGAT GTAG 34 2) INFORMATION FOR SEQ ID NO: 33: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 30 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer DA09" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 33: GCTGAATTTT GGTCGAATGA TTTAGGTGCC 30 2) INFORMATION FOR SEQ ID NO: 34: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 30 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer DA11" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 34: GCTGAATTTT GGTCGAATGA TTTAGGTGCC 30 2) INFORMATION FOR SEQ ID NO: 35: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 27 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer DA21" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 35: GAATTTTGGA AGTACGATTT AGGTCGG 27 (2) INFORMATION FOR SEQ ID NO: 36: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 29 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/ KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer DA12" (ix) FEATURE: (A) NAME/KEY: misc-feature (B) LOCATION: 12,13 (D): OTHER INFORMATION: /Note:R= mixture of A and G Y= mixture of C and T (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 36: GGAAAAACGA TRYCGGTGCC TTGGAGAAC 29 (2) INFORMATION FOR SEQ ID NO: 37: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 27 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/ KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer DA13" (ix) FEATURE: (A) NAME/KEY: misc-feature (B) LOCATION: 14,15 (D): OTHER INFORMATION: /Note:R= mixture of A and G Y= mixture of C and T (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 37 GATTTAGGTG CCTRYCAGAA CTATTTA 27 2) INFORMATION FOR SEQ ID NO: 38: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 26 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer DA08" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 38: CCCCCTTCAT GAGAATCTTT ATAACG 26 2) INFORMATION FOR SEQ ID NO: 39: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 25 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer DA04" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 39: GAATCCGAAC CTCATTACAC ATTCG 25 2) INFORMATION FOR SEQ ID NO: 40: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 38 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer DA05" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 40: CGGATGGACT CGAGAAGGAA ATACCACG 38 2) INFORMATION FOR SEQ ID NO: 41: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 31 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer DA10" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 41: CGTAGGGCAA AATCAGGCCG GTCAAGTTTG G 31 2) INFORMATION FOR SEQ ID NO: 42: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 31 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer DA22" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 42: CATAACTGGA AATCGCCCGG GAACAGTTAC G 31 (2) INFORMATION FOR SEQ ID NO: 43: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 36 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/ KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer DA19" (ix) FEATURE: (A) NAME/KEY: misc-feature (B) LOCATION: 12 (D): OTHER INFORMATION: /Note:W= mixture of A and T (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 43 CTGGAAATAA AWCCGGAACA GTTACG 36 2) INFORMATION FOR SEQ ID NO: 44: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 32 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer DA23" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 44: GGAAATAAAC CAGGACCCGT TACGATCAAT GC 32 2) INFORMATION FOR SEQ ID NO: 45: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 28 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer DA32" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 45: GAGGCTTGGA CTAGGTTTGA TTTTCCAG 28 2) INFORMATION FOR SEQ ID NO: 46: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 30 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer DA31" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 46: GCTGAATTTT GGCGCAATGA TTTAGGTGCC 30 2) INFORMATION FOR SEQ ID NO: 47: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 34 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer bm4" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 47: GTGTTTGACG TCCCGCTTCA TGAGAATTTA CAGG 34 2) INFORMATION FOR SEQ ID NO: 48: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 34 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer bm5" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 48: GTGTTTGACG TCCCGCTTCA TAAGAATTTA CAGG 34 2) INFORMATION FOR SEQ ID NO: 49: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 34 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer bm6" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 49: GTGTTTGACG TCCCGCTTCA TGCCAATTTA CAGG 34 2) INFORMATION FOR SEQ ID NO: 50: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 32 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer bm8" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 50: AGGGAATCCG GATACCCTGA GGTTTTCTAC GG 32 2) INFORMATION FOR SEQ ID NO: 51: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 34 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer bm11" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 51: GATGTGGTTT TGGATCATAA GGCCGGCGCT GATG 34 2) INFORMATION FOR SEQ ID NO: 52 (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 22 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer p1" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 52: CTGTTATTAA TGCCGCCAAA CC 22 2) INFORMATION FOR SEQ ID NO: 53: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 24 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer p2" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 53: GGAAAAGAAA TGTTTACGGT TGCG 24 2) INFORMATION FOR SEQ ID NO: 54: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 25 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer p3" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 54: GAAATGAAGC GGAACATCAA ACACG 25 2) INFORMATION FOR SEQ ID NO: 55: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 20 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer p4" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 55: GTATGATTTA GGAGAATTCC 20 (2) INFORMATION FOR SEQ ID NO: 56: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 34 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/ KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer bl1" (ix) FEATURE: (A) NAME/KEY: misc-feature (B) LOCATION: 1 (D): OTHER INFORMATION: /Note:P=phosphate group (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 56: PCCAGCGCGC CTAGGTCACG CTGCCAATAT TCAG 34 (2) INFORMATION FOR SEQ ID NO: 57: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 34 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: other nucleic acid (ix) FEATURE: (A) NAME/ KEY: misc-feature: (B) OTHER INFORMATION: /desc = "Primer bl2" (ix) FEATURE: (A) NAME/KEY: misc-feature (B) LOCATION: 1 (D): OTHER INFORMATION: /Note:P=phosphate group (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 57: PCCAGCGCGC CTAGGTCATC CTGCCAATAT TCAG 34 (2) INFORMATION FOR SEQ ID NO: 58: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 2084 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: single (D) TOPOLOGY: linear (ii) MOLECULE TYPE: DNA (genomic) (ix) FEATURE: (A) NAME/KEY: CDS (B) LOCATION:343..1794 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 58: GCCCCGCACA TACGAAAAGA CTGGCTGAAA ACATTGAGCC TTTGATGACT GATGATTTGG 60 CTGAAGAAGT GGATCGATTG TTTGAGAAAA GAAGAAGACC ATAAAAATAC CTTGTCTGTC 120 ATCAGACAGG GTATTTTTTA TGCTGTCCAG ACTGTCCGCT GTGTAAAAAT AAGGAATAAA 180 GGGGGGTTGT TATTATTTTA CTGATATGTA AAATATAATT TGTATAAGAA AATGAGAGGG 240 AGAGGAAACA TGATTCAAAA ACGAAAGCGG ACAGTTTCGT TCAGACTTGT GCTTATGTGC 300 ACGCTGTTAT TTGTCAGTTT GCCGATTACA AAAACATCAG CC GTA AAT GGC ACG 354 CTG ATG CAG TAT TTT GAA TGG TAT ACG CCG AAC GAC GGC CAG CAT TGG 402 AAA CGA TTG CAG AAT GAT GCG GAA CAT TTA TCG GAT ATC GGA ATC ACT 450 GCC GTC TGG ATT CCT CCC GCA TAC AAA GGA TTG AGC CAA TCC GAT AAC 498 GGA TAC GGA CCT TAT GAT TTG TAT GAT TTA GGA GAA TTC CAG CAA AAA 546 GGG ACG GTC AGA ACG AAA TAC GGC ACA AAA TCA GAG CTT CAA GAT GCG 594 ATC GGC TCA CTG CAT TCC CGG AAC GTC CAA GTA TAC GGA GAT GTG GTT 642 TTG AAT CAT AAG GCT GGT GCT GAT GCA ACA GAA GAT GTA ACT GCC GTC 690 GAA GTC AAT CCG GCC AAT AGA AAT CAG GAA ACT TCG GAG GAA TAT CAA 738 ATC AAA GCG TGG ACG GAT TTT CGT TTT CCG GGC CGT GGA AAC ACG TAC 786 AGT GAT TTT AAA TGG CAT TGG TAT CAT TTC GAC GGA GCG GAC TGG GAT 834 GAA TCC CGG AAG ATC AGC CGC ATC TTT AAG TTT CGT GGG GAA GGA AAA 882 GCG TGG GAT TGG GAA GTA TCA AGT GAA AAC GGC AAC TAT GAC TAT TTA 930 ATG TAT GCT GAT GTT GAC TAC GAC CAC CCT GAT GTC GTG GCA GAG ACA 978 AAA AAA TGG GGT ATC TGG TAT GCG AAT GAA CTG TCA TTA GAC GGC TTC 1026 CGT ATT GAT GCC GCC AAA CAT ATT AAA TTT TCA TTT CTG CGT GAT TGG 1074 GTT CAG GCG GTC AGA CAG GCG ACG GGA AAA GAA ATG TTT ACG GTT GCG 1122 GAG TAT TGG CAG AAT AAT GCC GGG AAA CTC GAA AAC TAC TTG AAT AAA 1170 ACA AGC TTT AAT CAA TCC GTG TTT GAT GTT CCG CTT CAT TTC AAT TTA 1218 CAG GCG GCT TCC TCA CAA GGA GGC GGA TAT GAT ATG AGG CGT TTG CTG 1266 GAC GGT ACC GTT GTG TCC AGG CAT CCG GAA AAG GCG GTT ACA TTT GTT 1314 GAA AAT CAT GAC ACA CAG CCG GGA CAG TCA TTG GAA TCG ACA GTC CAA 1362 ACT TGG TTT AAA CCG CTT GCA TAC GCC TTT ATT TTG ACA AGA GAA TCC 1410 GGT TAT CCT CAG GTG TTC TAT GGG GAT ATG TAC GGG ACA AAA GGG ACA 1458 TCG CCA AAG GAA ATT CCC TCA CTG AAA GAT AAT ATA GAG CCG ATT TTA 1506 AAA GCG CGT AAG GAG TAC GCA TAC GGG CCC CAG CAC GAT TAT ATT GAC 1554 CAC CCG GAT GTG ATC GGA TGG ACG AGG GAA GGT GAC AGC TCC GCC GCC 1602 AAA TCA GGT TTG GCC GCT TTA ATC ACG GAC GGA CCC GGC GGA TCA AAG 1650 CGG ATG TAT GCC GGC CTG AAA AAT GCC GGC GAG ACA TGG TAT GAC ATA 1698 ACG GGC AAC CGT TCA GAT ACT GTA AAA ATC GGA TCT GAC GGC TGG GGA 1746 GAG TTT CAT GTA AAC GAT GGG TCC GTC TCC ATT TAT GTT CAG AAA TAA 1794 GGTAATAAAA AAACACCTCC AAGCTGAGTG CGGGTATCAG CTTGGAGGTG CGTTTATTTT 1854 TTCAGCCGTA TGACAAGGTC GGCATCAGGT GTGACAAATA CGGTATGCTG GCTGTCATAG 1914 GTGACAAATC CGGGTTTTGC GCCGTTTGGC TTTTTCACAT GTCTGATTTT TGTATAATCA 1974 ACAGGCACGG AGCCGGAATC TTTCGCCTTG GAAAAATAAG CGGCGATCGT AGCTGCTTCC 2034 AATATGGATT GTTCATCGGG ATCGCTGCTT TTAATCACAA CGTGGGATCC 2084 5368.204-WO 33

Claims

SEQ ID NO:4에 도시된 아미노산 서열을 가지는 B. 리케니포미스 (B. licheniformis) α-아밀라제의 변이체로서, 상기 변이체는 α- 아밀라제 활성을 가지고 있고, 다음 치환: K458R 및 P459T 중 하나 또는 둘을 포함하는 것을 특징으로 하는 변이체.
제 1 항에 있어서, 변이체가 위치 D183 + G184가 결실되고, 또한 다음의 치환: K458R; 및 P459T 중 하나 또는 둘을 갖는 것을 특징으로 하는 변이체.
삭제
삭제
제 1 항 또는 제 2 항에 따르는 α-아밀라제 변이체를 암호화하는 DNA 서열을 포함하는 DNA 구조체.
제 5 항에 따른 DNA 구조체를 운반하는 재조합 발현 벡터.
제 5 항에 따른 DNA 구조체로 형질전환된 세포.
제 7 항에 있어서, 미생물인 것을 특징으로 하는 세포.
제 8 항에 있어서, 박테리아 또는 균류인 것을 특징으로 하는 세포.
제 9 항에 있어서, 그람 양성 박테리아인 것을 특징으로 하는 세포.
비-먼지유발 과립, 안정화된 액체 또는 보호된 효소 중 어느 하나의 형태로, 제 1 항 또는 제 2 항에 따르는 α-아밀라제 변이체를 포함하는 세제 첨가제.
제 11 항에 있어서, 첨가제 g 당 0.02 내지 200 mg 의 효소 단백질을 함유하는 것을 특징으로 하는 세제 첨가제.
제 11 항에 있어서, 프로테아제, 리파아제, 페록시다제, 다른 녹말분해효소 및 셀룰라제로 구성되는 군으로부터 선택된 다른 효소를 더 포함하는 것을 특징으로 하는 세제 첨가제.
제 1 항 또는 제 2 항에 따르는 α-아밀라제 변이체를 포함하는 세제 조성물.
제 14 항에 있어서, 프로테아제, 리파아제, 페록시다아제, 다른 녹말분해 효소 및 셀룰라제로 구성되는 군으로부터 선택된 다른 효소를 더 포함하는 것을 특징으로 하는 세제 조성물.
제 1 항 또는 제 2 항에 따르는 α-아밀라제 변이체를 포함하는 수동 또는 자동 식기세척용 세제 조성물.
제 16 항에 있어서, 프로테아제, 리파아제, 페록시다아제, 다른 녹말 분해 효소 및 셀룰라제로 구성되는 군으로부터 선택된 다른 효소를 포함하는 것을 더 특징으로 하는 식기세척용 세제 조성물.
제 1 항 또는 제 2 항에 따르는 α-아밀라제 변이체를 포함하는 수동 또는 자동 세탁물 세척 조성물.
제 18 항에 있어서, 프로테아제, 리파아제, 페록시다제, 다른 녹말 분해 효소 및 셀룰라제로 구성되는 군으로부터 선택된 다른 효소를 더 포함하는 것을 특징으로 하는 세탁물 세척 조성물.
제 10 항에 있어서, 그람 양성 박테리아는 바실러스 서브틸리스 (Bacillus subtilis), 바실러스 리케니포미스 (Bacillus licheniformis), 바실러스 렌투스 (Bacillus lentus), 바실러스 브레비스 (Bacillus brevis), 바실러스 스테로테르모필루스 (Bacillus stearothermophilus), 바실러스 알칼로필루스 (Bacillus alkalophilus), 바실러스 리케파시엔스 (Bacillus amyloliquefaciens), 바실러스 코아굴란스 (Bacillus coagulans), 바실러스 설귤란스 (Bacillus circulans), 바실러스 로투스(Bacillus lautus) 및 바실러스 투린지엔시스(Bacillus thuringiensis)로 이루어지는 군으로부터 선택되는 것을 특징으로 하는 세포.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제