KR100770721B1 - α-아밀라제 돌연변이체 - Google Patents
α-아밀라제 돌연변이체 Download PDFInfo
- Publication number
- KR100770721B1 KR100770721B1 KR1020007004453A KR20007004453A KR100770721B1 KR 100770721 B1 KR100770721 B1 KR 100770721B1 KR 1020007004453 A KR1020007004453 A KR 1020007004453A KR 20007004453 A KR20007004453 A KR 20007004453A KR 100770721 B1 KR100770721 B1 KR 100770721B1
- Authority
- KR
- South Korea
- Prior art keywords
- gly
- amylase
- seq
- asn
- asp
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2408—Glucanases acting on alpha -1,4-glucosidic bonds
- C12N9/2411—Amylases
- C12N9/2414—Alpha-amylase (3.2.1.1.)
- C12N9/2417—Alpha-amylase (3.2.1.1.) from microbiological source
Abstract
본 발명은 부모 Termamyl-유사 α-아밀라제의 변이체에 관한 것으로, 이 변이체는 상기 부모 Termamyl-유사 α-아밀라제와 비교하여 최소한 하나의 다음의 성질: i) 8 내지 10.5 의 pH 에서 증가된 pH 안정성; 및/또는 ii) 8 내지 10.5 의 pH 에서 증가된 Ca2+ 안정성; 및/또는 iii) 10 내지 60 ℃ 의 온도에서 증가된 특이 활성이 변경된 것으로 나타난다.
Termamyl, α-아밀라제, 안정성, 변이체
Description
본 발명은 중간 온도 및/또는 높은 pH 에서 보다 큰 활성을 가지고 있는 부부모 (parent) Termamyl과 유사한 α-아밀라제의 변이체 (돌연변이체)에 관한 것이다.
α-아밀라제 (α-1,4-글루칸-4-글루카노히드롤라제, EC 3.2.1.1)는 녹말과 다른 선형 및 분지된 1,4-글루코시딕 올리고- 및 다당류의 가수분해를 촉매하는 효소군을 구성한다.
상기와 같은 산업적으로 매우 중요한 부류의 효소들과 관련된 특허 및 과학 문헌이 매우 광범위하게 있다. Termamyl-유사 α-아밀라제 변이체와 같은 많은 α-아밀라제들이 WO 90/11352, WO 95/10603, WO 95/26397, WO 96/23873 및 WO 96/23874 로부터 공지되어 있다.
α-아밀라제와 관련된 가장 최근의 공개문헌 중에서, WO 96/23874 에는 Termamyl-유사 α-아밀라제에 대한 삼-차원 X-선 결정 구조 데이터가 공개되어 있는데, 그 데이터에 의하면 이 효소는 B. amyloliquefaciens α-아밀라제 (BANTM)의 300 개의 N-말단 아미노산 잔기와 아미노산 서열을 포함하는 B. licheniformis α- 아밀라제의 C- 말단부의 아미노산 301-483 으로 구성되고 (후자의 것은 상표명 TermamylTM 으로 시판중인 것을 구입할 수 있음), 그러므로 이 효소는 산업적으로 중요한 Bacillus α-아밀라제에 밀접하게 관련된 것이다 (이 효소는 본 명세서에서 용어 "Termamyl-유사 α-아밀라제"를 규정하는 의미안에 포함되며, 무엇보다도 B. licheniformis α-아밀라제, B. amyloliquefaciens α-아밀라제 (BANTM) 및 B. stearothermophilus α-아밀라제 (BSGTM) 를 포함한다. WO 96/23874 호에는 또한 부모 Termamyl-유사 α-아밀라제의 구조에 대한 분석을 토대로 하여, 부모세대의 것과 관련된 변경된 성질을 나타내는 부모 Termamyl-유사 α-아밀라제의 변이체를 디자인하기 위한 방법론이 게재되어 있다.
발명의 간단한 설명
본 발명은 높은 pH 및 중간 온도에서 (부모 α-아밀라제와 관련하여) 개선된 세척 성능을 나타내는 Termamyl-유사 α-아밀라제의 새로운 α-녹말 분해성 변이체 (돌연변이체)에 관한 것이다.
용어 "중간 온도" 는 본 발명의 명세서에서 10 ℃ 내지 60 ℃ 사이의 온도, 바람직하게는 20 ℃ 에서 50 ℃ 사이의 온도, 특히 30 내지 40 ℃ 의 온도를 의미한다.
용어 "높은 pH" 는 오늘날 세척에 사용되는 알칼리성 pH, 보다 구체적으로는 약 pH 8 내지 10.5 를 의미한다.
본 발명의 명세서에서 "저온 α-아밀라제" 는 0 내지 30 ℃ 범위의 온도에서 상대적으로 최적의 활성을 가지고 있는 α-아밀라제를 의미한다.
본 명세서에서 "중간 온도 α-아밀라제" 는 30 내지 60 ℃ 범위의 온도에서 최적의 활성을 가지고 있는 α-아밀라제를 의미한다. 예를 들면, SP690 및 SP722 α-아밀라제가 각각 "중간 온도 α-아밀라제" 이다.
본 명세서에서 "고온 α-아밀라제" 는 60 내지 110 ℃ 의 온도 범위에서 최적의 활성을 나타내는 α-아밀라제이다. 예를 들어, Termamyl이 "고온 α-아밀라제" 이다.
본 발명의 변이체 (돌연변이체)에서 이루어질 수 있는 성질의 변경으로는 다음과 같은 것들이 있다: 8 내지 10.5 의 pH 에서의 Termamyl-유사 α-아밀라제의 안정성, 및/또는 pH 8 내지 10.5 에서의 Ca2+ 안정성, 및/또는 10 내지 60 ℃, 바람직하게는 20 내지 50 ℃, 특히 30 내지 40 ℃ 의 온도에서의 특이한 활성.
상대적인 최적 온도는 때로 사용되는 특정 pH 에 좌우된다는 것이 주지되어야 한다. 달리 표현하자면, 예컨대 pH 8 에서 측정된 상대적인 최적 온도는 실질적으로는 예컨대 pH 10 에서 측정된 상대적인 최적 온도와 상이할 수 있다.
효소 활성에 미치는 온도의 영향
활성 부위 및 그 주변에서의 역학은 온도 및 아미노산 조성에 따라 좌우되며, 효소의 상대적인 최적 온도에 매우 중요하다. 중간 온도 α-아밀라제와 고온 α-아밀라제의 역학을 비교함으로써, 중간 온도에서 고온 α-아밀라제가 작용하기 위한 중요한 영역이 결정될 수 있다. SP722 α-아밀라제 (SEQ ID NO: 2) 및 B. licheniformis α-아밀라제 (Novo Nordisk에서 등록상표명 Termamyl 로 시판함)의 온도 활성 프로필이 도 2 에 도시되어 있다.
절대 활성에서 SP722 의 상대적인 최적 온도는 중간 범위 온도 (30 내지 60 ℃)에서 동종성 B. licheniformis α-아밀라제보다 더 높은 것으로 나타나는데, SP722 는 60 내지 100 ℃ 주변에서 최적 활성을 나타낸다. 프로필은 주로 온도 안정성 및 활성 부위 잔기와 그 주변의 역학에 따라 좌우된다. 나아가, 활성 프로필은 사용되는 pH 및 활성 부위 잔기의 pKa 에 좌우된다.
첫 번째 측면으로, 본 발명은 α-아밀라제 활성을 가지고 있는, 부모 Termamyl-유사 α-아밀라제의 변이체에 관한 것으로, 상기 변이체는 SEQ ID NO: 2 에 도시된 아미노산 서열에 다음의 돌연변이에 상응하는 하나 또는 그 이상의 돌연변이를 포함하고 있다:
T141, K142, F143, D144, F145, P146, G147, R148, G149,
Q174, R181, G182, D183, G184, K185, A186, W189, S193, N195,
H107, K108, G109, D166, W167, D168, Q169, S170, R171, Q172, F173,
F267, W268, K269, N270, D271, L272, G273, A274, L275, K311,
E346, K385, G456, N457, K458, P459, G460, T461, V462, T463.
본 발명의 변이체들은 하나 또는 그 이상의 다음의 치환 또는 결실을 포함하고 있다:
하나 또는 그 이상의 다음의 치환 또는 결실을 포함하고 있는 변이체들이 바람직하다: K142R; S193P; N195F; K269R,Q; N270Y,R,D; K311R; E346Q; K385R; K458R; P459T; T461P; Q174*; R181Q,N,S; G182T,S,N; D183*; G184*; K185A,R,D,C,E,Q,G,H,I,L,M,N,F,P,S,T,W,Y,V; A186T,S,N,I,V,R; W189T,S,N,Q.
특히 바람직한 것은 위치 D183 및 G184 가 결실되어 있고 또한 하나 또는 그 이상의 다음의 치환 또는 결실을 포함하고 있는 변이체들이다: K142R; S193P; N195F; K269R,Q; N270Y,R,D; K311R; E346Q; K385R; K458R; P459T; T461P; Q174*; R181Q,N,S; G182T,S,N; K185A,R,D,C,E,Q,G,H,I,L,M,N,F,P,S,T,W,Y,V; A186T,S,N,I,V,R; W189T,S,N,Q.
상기 언급된 본 발명의 변이체들은 부모 α-아밀라제와 관련하여 최소한 하나의 다음의 성질이 변경된 것으로 나타난다:
i) 8 내지 10.5 의 pH 에서 증가된 pH 안정성; 및/또는
ii) 8 내지 10.5 의 pH 에서 증가된 Ca2+ 안정성; 및/또는
iii) 10 내지 60 ℃, 바람직하게는 20 내지 50 ℃, 특히 30 내지 40 ℃ 의 온도에서 증가된 특이 활성. 한층 더 상세한 것은 하기에서 설명하기로 한다.
본 발명은 또한 본 발명의 변이체를 암호화하는 DNA 구조체; 본 발명의 변이체를 제조하기 위한 방법; 및 본 발명의 변이체를 단독으로 또는 다른 효소들과 병용하여 다양한 산업적 제품 또는 공정에, 예컨대 세제에 또는 녹말 액화를 위하여 사용하는 용도에 관한 것이다.
본 발명의 최종 측면은 변경된 최적 pH, 및/또는 변경된 최적 온도, 및/또는 증가된 안정성을 나타내는 α-아밀라제를 제공하는 방법에 관한 것이다.
명명법
본 명세서 및 특허청구의 범위에서, 아미노산 잔기에 대한 종래의 한-문자 및 세-문자 코드가 사용된다. 참조를 용이하게 하기 위하여, 본 발명의 α-아밀라제 변이체는 다음의 명명법에 의하여 기재된다:
원래의 아미노산(들) : 위치(들) : 치환된 아미노산(들).
상기 명명법에 따라서, 예를 들면 위치 30 에서 알라닌이 아스파라긴으로 치환되는 것은 다음과 같이 표시된다: Ala30Asn 또는 A30N;
동일한 위치에서의 알라닌의 결실은 다음과 같이 표시된다: Ala30* 또는 A30*;
추가의 아미노산 잔기, 예컨대 라이신의 삽입은 다음과 같이 표시된다: Ala30AlaLys 또는 A30AK.
아미노산 잔기의 연속적인 스트레치, 예컨대 아미노산 잔기 30 에서 33 까지의 결실은 (30-33)* 또는 Δ(A30-N33) 으로 표시된다.
특이한 α-아밀라제가 다른 α-아밀라제와 비교하여 위치 36 에 "결실"을 포함하고 있고, 그 위치에 아스파르트산이 삽입되어 있다면, 이렇게 표시된다: *36Asp 또는 *36D.
다중 돌연변이는 플러스 부호로 분리된다. 즉 Ala30Asp + Glu34Ser 또는 A30N+E34S 는 위치 30 과 34 에서 알라닌과 글루탐산이 각각 아스파라긴과 세린으로 치환된 돌연변이를 나타낸다.
하나 또는 그 이상의 대체 아미노산 잔기들이 주어진 위치에서 삽입될 수 있다면, 그 때에는 다음과 같이 표시된다: A30N,E 또는 A30N 또는 A30E.
나아가, 변형에 적당한 위치가 제시되는 어떠한 특정 변형없이 본원에서 확인되는 때에는, 어떠한 아미노산 잔기든지 그 위치에 존재하는 아미노산으로 치환될 수 있는 것으로 이해되어야 한다. 그러므로, 예를 들어, 위치 30 에서의 알라닌의 변형이 언급된다면, 그러나 특정되지는 않았다면, 그 때에는 알라닌이 결실되었거나 또는 어떠한 다른 아미노산, 즉 다음의 아미노산들중 하나로 치환될 수 있는 것으로 이해되어야 한다: R,N,D,A,C,Q,E,G,H,I,L,K,M,F,P,S,T,W,Y,V.
발명의 상세한 설명
Termamyl-유사 α-아밀라제
Bacillus 종에 의해 생성되는 많은 α-아밀라제들이 아미노산 수준에 있어 매우 크게 상동한다는 것은 잘 알려져 있다. 예를 들어, SEQ ID NO: 4 에 도시되어 있는 아미노산 서열을 포함하고 있는 B. licheniformis α-아밀라제 (TermamylTM 로서 시판됨)는 SEQ ID NO: 5 에 도시되는 아미노산 서열을 포함하고 있는 B. amyloliquefaciens α-아밀라제와 약 89 % 상동하며, SEQ ID NO: 3 에 도시되어 있는 아미노산 서열을 포함하고 있는 B. stearothermophilus α-아밀라제와는 약 79 % 상동하는 것으로 밝혀져 있다. 나아가 상동성 α-아밀라제들로는 Bacillus 종 NCIB 12289, NCIB 12512, NCIB 12513 또는 DSM 9375 세균주로부터 유도된 α-아밀라제가 있다. 이들 세균주는 WO 95/26397 에 상세하게 설명되어 있으며, α-아밀라제는 문헌에 기재되어 있다 [Tsukamoto et al., Biochemical and Biophysical Research Communications, 151 (1988), pp. 25-31 (SEQ ID NO: 6 참조)].
추가의 상동성 α-아밀라제로는 EP 0252666 에 기재되어 있는 B. licheniformis 세균주 (ATCC 27811)에 의해 생성되는 α-아밀라제, 및 WO 91/00353 및 WO 94/18314 에서 확인되는 α-아밀라제가 있다. 다른 상용성 Termamyl-유사 B. licheniformis α-아밀라제들로는 제품 OptithermTM 및 TakathermTM (Solvay 사에서 시판함), MaxamylTM (Gist-brocades/Genencor 사에서 시판함), Spezym AATM 및 Spezyme Delta AATM (Genencor 사에서 시판함), 및 KeistaseTM (Daiwa 사에서 시판함) 가 있다.
이들 α-아밀라제들 사이에서 발견된 실질적인 상동성 때문에, 이것들은 동일한 부류의 α-아밀라제, 즉 "Termamyl-유사 α-아밀라제" 의 부류에 속하는 것으로 간주된다.
따라서, 본 명세서에서, 용어 "Termamyl-유사 α-아밀라제" 는 아미노산 수준에서, TermamylTM, 즉 본원의 SEQ ID NO: 4 에 도시된 아미노산 서열을 가지고 있는 B. licheniformis α-아밀라제에 대해 실질적인 상동성을 나타내는 α-아밀라제를 가리키는 것으로 의도된다. 달리 표현하면, 본원의 SEQ ID NO: 1, 2, 3, 4, 5, 6, 7 또는 8 에 도시된 아미노산 서열, 또는 WO 95/26397 의 SEQ ID NO: 1 에 도시되어 있는 아미노산 서열 (본원의 SEQ ID NO: 7 로서 도시된 아미노산 서열과 동일함), 또는 WO 95/26397 의 SEQ ID NO: 2 에 도시된 아미노산 서열 (본원의 SEQ ID NO: 8 로서 도시된 아미노산 서열과 동일함) 또는 쯔가모토 등에 의해 기재된 아미노산 서열 (이 아미노산 서열은 본원의 SEQ ID NO: 6 에 도시된다)을 가지고 있는 다음의 모든 α-아밀라제들은 "Termamyl-유사 α-아밀라제" 인 것으로 간주된다. 다른 Termamyl-유사 α-아밀라제들은 i) SEQ ID NO : 1 내지 8 에 도시된 상기의 아미노산 서열들 중 최소한 하나와 최소한 60 %, 예컨대 최소한 70 %, 예컨대 최소한 75 %, 또는 최소한 80 %, 예컨대 최소한 85 %, 최소한 90 % 또는 최소한 95 % 의 상동성을 나타내고, 및/또는 ii) 상기의 α-아밀라제중 최소한 하나에 대하여 발생하는 항체와 면역학적 교차-반응성을 나타내며, 및/또는 iii) 각각 본 명세서의 SEQ ID NO: 9, 10, 11, 12 또는 58(이 암호화 서열들은 각각 본원의 SEQ ID NO: 1, 2, 3, 4 및 5 에 도시된 아미노산 서열을 암호화한다)로부터, WO 95/26397 의 SEQ ID NO: 4 (이 DNA 서열은 정지코돈 TAA 와 함께, 본원의 SEQ ID NO: 13 에 도시되며, 본원의 SEQ ID NO: 8 에 도시된 아미노산 서열을 암호화한다)로부터 및 WO 95/26397 의 SEQ ID NO: 5 (본원의 SEQ ID NO: 14 에 도시됨)로부터 나타나는 상기에서 특정된 α-아밀라제들을 암호화하는 DNA 서열에 혼성화하는 DNA 서열에 의하여 암호화되는 α-아밀라제들이다.
상기의 성질 i) 과 관련하여서, "상동성" 은 어떠한 종래의 알고리즘을 사용 함으로써, 바람직하게는 GAP 크리에이션 페널티 (creation penalty) 3.0 과 GAP 익스텐젼 페널티 (extension penalty) 0.1 인 GAP 페널티에 대한 디폴트 값(default value)을 사용하는 GCG 팩키지 버전 7.3 (June 1993)으로부터의 GAP 프로그램을 사용함으로써 측정될 수 있다 (Genetic Computer Group (1991) Programme Manual for the GCG Package, version 7, 575 Science Drive, Madison, Wisconsin, USA 53711).
Termamyl (SEQ ID NO: 4)과 Termamyl-유사 α-아밀라제 사이의 구조적 배열은 다른 Termamyl-유사 α-아밀라제에서 동등한/상응하는 위치를 확인하기 위하여 사용될 수 있다. 상기의 구조적 배열을 얻는 한 가지 방법은 갭 페널티의 디폴트값, 즉 3.0 의 갭 크리에이션 페널티와 0.1 의 갭 익스텐젼 페널티를 사용하여 GCG 팩키지로부터 파일 업 (Pile Up) 프로그램을 사용하는 것이다. 다른 구조적 배열 방법으로는 소수성 클러스터 분석법 [Gaboriaud et al., (1987), FEBS LETTERS 224, pp. 149-155] 및 역 트레딩법 (reverse threading)[Huber, T., Torda, AE, PROTEIN SCIENCE Vol. 7, No. 1 pp. 142-149 (1998)] 이 있다.
α-아밀라제의 성질 ii), 즉 면역학적 교차 반응성은 관련된 Termamyl-유사 α-아밀라제의 최소한 하나의 에피톱에 대하여 발생된, 또는 에피톱와 반응하는 항체를 사용하여 검정될 수 있다. 단클론성 또는 다클론성일 수 있는 항체는 당해 기술분야에 공지되어 있는 방법들, 예컨대 허드슨에 의해 기재된 방법 에 의하여 제조될 수 있다 [Hudson et al., Practical Immunology, Third edition (1989), Blackwell Scientific Publications]. 면역학적 교차-반응성은 당해 기술분야에 공지되어 있는 검정법, 예를 들면 허드슨 등의 문헌에 기재되어 있는 것과 같은 (Hudson et al., 1989) 웨스턴 블롯팅 또는 방사성 면역 확산 검정법을 사용하여 측정될 수 있다. 이런 관점에서 각각 SEQ ID NO: 1, 2, 3, 4, 5, 6, 7 또는 8 에 도시된 아미노산 서열을 가지고 있는 α-아밀라제들 사이의 면역학적 교차-반응성이 발견되었다.
상기의 성질 iii) 과 관련하여 Termamyl-유사 α-아밀라제의 특성 확인에 사용되는 올리고뉴클레오티드 프로브는 관심의 대상이 되는 α-아밀라제의 완전한 또는 부분적인 뉴클레오티드 또는 아미노산 서열을 기초로 하여 적절하게 제조될 수 있다.
혼성화를 시험하기 위하여 적당한 조건은 5×SSC 에 예비침지하고, 1 시간동안 ~40 ℃ 에서 20 % 포름아미드, 5×덴하르드트 용액, 50 mM 인산 나트륨, pH 6.8, 및 50 mg 의 변성된 초음파처리된 소 흉선 DNA 의 용액중에서 예비 혼성화시킨 후, 이어서 100 mM 의 ATP 가 첨가된 상기와 동일한 용액중에서 18 시간동안 ~40 ℃ 에서 혼성화시킨 다음, 2×SSC, 0.2 % SDS 중에서 40 ℃ 에서 (엄격도 저), 바람직하게는 50 ℃ 에서 (엄격도 중간), 보다 바람직하게는 65 ℃ 에서 (엄격도 높음), 가장 바람직하게는 약 75 ℃ 에서 (엄격도 매우 높음) 30 분동안 필터를 3 회 세척하는 것을 포함한다. 혼성화 방법에 대한 보다 상세한 설명은 샘브룩 등의 참조문헌을 참고한다 [Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor, 1989].
본 명세서에서, "으로부터 유도된" 은 관심의 대상이 되는 유기체의 세균주 에 의하여 생성된 또는 생성될 수 있는 α-아밀라제뿐만 아니라, 그러한 세균주로부터 단리된 DNA 서열에 의하여 암호화되고 상기 DNA 서열로 형질전환된 숙주 유기체에서 생성된 α-아밀라제를 가리키는 것으로 의도된다. 결국, 이 용어는 합성 및/또는 cDNA 기원의 DNA 서열에 의해 암호화되고 관심의 대상이 되는 α-아밀라제의 확인된 특성을 가지고 있는 α-아밀라제를 가리키는 것으로 의도된다. 이 용어는 또한 부모 α-아밀라제가 자연 발생적인 α-아밀라제의 변이체일 수 있음, 즉 자연 발생적인 α-아밀라제의 하나 또는 그 이상의 아미노산 잔기의 변형 (삽입, 치환, 결실)의 결과인 변이체일 수 있음을 가리키는 것으로 의도된다.
부모 하이브리드 α-아밀라제
부모 α-아밀라제 (즉 골격 α-아밀라제)는 하이브리드 α-아밀라제, 즉 최소한 두 개의 α-아밀라제로부터 유도된 부분적인 아미노산 서열이 조합되어 있는 α-아밀라제일 수 있다.
부모 하이브리드 α-아밀라제는 아미노산 상동성 및/또는 면역학적 교차-반응성 및/또는 DNA 혼성화 (상기 규정된 바와 같음)를 토대로 하여 Termamyl-유사 α-아밀라제 패밀리에 속하는 것으로 측정될 수 있는 것일 수 있다. 이 경우, 하이브리드 α-아밀라제는 전형적으로 최소한 한 부분의 Termamyl-유사 α-아밀라제와 미생물 (박테리아 또는 균류) 및/또는 포유동물 기원의 Termamyl-유사 α-아밀라제 또는 비-Termamyl-유사 α-아밀라제로부터 선택된 하나 또는 그 이상의 다른 α-아밀라제 부분(들)로 구성된다.
그러므로, 부모 하이브리드 α-아밀라제는 최소한 두 개의 Termamyl-유사 α-아밀라제로부터, 또는 최소한 하나의 Termamyl-유사 α-아밀라제와 최소한 하나의 비-Termamyl-유사 박테리아성 α-아밀라제로부터, 또는 최소한 하나의 Termamyl-유사 α-아밀라제와 최소한 하나의 진균성 α-아밀라제로부터 유도되는 부분적인 아미노산 서열들의 조합물을 포함할 수 있다. 부분적인 아미노산 서열이 유도되는 Termamyl-유사 α-아밀라제는 예를 들면, 본원에서 언급되는 특정 Termamyl-유사 α-아밀라제들 중 하나일 수 있다.
예를 들면, 부모 α-아밀라제는 B. licheniformis의 세균주로부터 유도된 α-아밀라제의 C-말단 부분, 및 B. amyloliquefaciens의 세균주로부터 또는 B. stearothermophilus의 세균주로부터 유도된 α-아밀라제의 N-말단 부분을 포함할 수 있다. 예를 들어, 부모 α-아밀라제는 B. licheniformis α-아밀라제의 C-말단 부분의 최소한 430 개의 아미노산 잔기를 포함할 수 있고, 예컨대 a) SEQ ID NO: 5 에 도시된 아미노산 서열을 가지고 있는 B. amyloliquefaciens α-아밀라제의 37 개의 N-말단 아미노산 잔기에 상응하는 아미노산 절편과 SEQ ID NO: 4 에 도시된 아미노산 서열을 가지고 있는 B. licheniformis α-아밀라제의 445 개의 C-말단 아미노산 잔기에 상응하는 아미노산 절편, 또는 Termamyl 서열과 동일한 하이브리드 Termamyl-유사 α-아밀라제, 즉 (성숙한 단백질의) N-말단의 35 개의 아미노산 잔기가 BAN (성숙한 단백질)의 N-말단의 33 개의 잔기로 대체된 것을 제외한, SEQ ID NO: 4 에 도시된 B. licheniformis α-아밀라제, 즉 SEQ ID NO: 5 에 도시된 B. amyloliquefaciens α-아밀라제; 또는 b) SEQ ID NO: 3 에 도시된 아미노산 서열을 가지고 있는 B. stearothermophilus α-아밀라제의 68 개의 N-말단 아미노산 잔기 에 상응하는 아미노산 절편 및 SEQ ID NO: 4 에 도시된 아미노산 서열을 가지고 있는 B. licheniformis α-아밀라제의 415 개의 C-말단 아미노산 잔기에 상응하는 아미노산 절편을 포함할 수 있다.
다른 적당한 부모 하이브리드 α-아밀라제는 이미 WO 96/23874 (Novo Nordisk)에서 기재되었던 것으로, 그것은 BAN, B. amyloliquefaciens α-아밀라제의 N-말단 (성숙한 단백질의 아미노산 1 내지 300) 및 Termamyl의 C-말단 (성숙한 단백질의 아미노산 301 내지 483)으로 구성된다. 증가된 활성은 상기 하이브리드 α-아밀라제 (BAN:1-300/Termamyl:301-483)의 다음 위치중 하나 또는 그 이상을 치환함으로써 이루어졌다: Q360, F290, 및 N102. 특히 관심을 끄는 치환은 다음 치환중 하나 또는 그 이상이다: Q360E,D; F290A,C,D,E,G,H,I,K,L,M,N,P,Q,R,S,T; N102D,E.
SEQ ID NO: 2 에 도시된 SP722 α-아밀라제에서의 상응하는 위치는 S365, Y295, N106 중 하나 또는 그 이상이다. SEQ ID NO: 2 에 도시된 상기 α-아밀라제에서 특히 관심있는 상응하는 치환은 S365D,E; Y295A,C,D,E,G,H,I,K,L,M,N,P,Q,R,S,T; 및 N106D,E 중 하나 또는 그 이상이다.
SEQ ID NO: 1 에 도시된 SP690 α-아밀라제에서의 상응하는 위치는 S365, Y295, N106 중 하나 또는 그 이상이다. 특히 관심을 끄는 상응하는 치환은 S365D,E; Y295A,C,D,E,G,H,I,K,L,M,N,P,Q,R,S,T; N106D,E 중 하나 또는 그 이상이다.
상기 언급된 비-Termamyl-유사 α-아밀라제는 예컨대 균류의 α-아밀라제, 포유동물 또는 식물의 α-아밀라제 또는 박테리아의 α-아밀라제 (Termamyl-유사 α-아밀라제와는 상이함)일 수 있다. 그러한 α-아밀라제의 특이한 실예로는 Aspergillus oryzae TAKA α-아밀라제, Aspergillus niger 산 α-아밀라제, Bacillus subtilis α-아밀라제, 돼지 췌장의 α-아밀라제 및 보리의 α-아밀라제가 있다. 이들 α-아밀라제는 모두 본원에서 언급되는 바와 같이 전형적인 Termamyl-유사 α-아밀라제의 구조와는 현저하게 상이한 해명된 구조를 가지고 있다.
상기 언급된, 즉 Aspergillus niger 및 Aspergillus oryzae로부터 유도된 균류 α-아밀라제들은 아미노산 수준에서 볼 때 매우 상동성이고, 일반적으로 동일한 α-아밀라제 패밀리에 속하는 것으로 간주된다. Aspergillus oryzae로부터 유도된 균류 α-아밀라제는 상표명 FungamylTM 으로 시판중이다.
나아가, Termamyl-유사 α-아밀라제의 특정 변이체 (본 발명의 변이체)가 -종래 방식대로- 특이한 Termamyl-유사 α-아밀라제의 아미노산 서열의 특정 아미노산 잔기의 변형 (예컨대 결실 또는 치환)과 관련하여 언급되는 때에는, 동등한 위치(들)에서 변형된 (각각의 아미노산 서열 사이의 가장 좋은 가능한 아미노산 서열 배열로부터 측정되는 바) 다른 Termamyl-유사 α-아밀라제의 변이체들도 따라서 포함되는 것으로 이해되어져야 한다.
본 발명의 바람직한 구체예에서, α-아밀라제 골격은 B. licheniformis (부모 Termamyl-유사 α-아밀라제로서), 예컨대 상기 언급된 것들 중 하나, 예를 들면 SEQ ID NO:4 에 도시된 아미노산 서열을 가지고 있는 B. licheniformis α-아밀라제로부터 유도된다.
본 발명의 변이체들의 변경된 성질
하기에서는 본 발명의 변이체들에 존재하는 돌연변이들 사이의 관계, 및 그것으로부터 유발될 수 있는 성질 (부모 Termamyl-유사 α-아밀라제와 관련하여)의 바람직한 변경에 대해 논의된다.
pH 8 내지 10.5 에서의 증가된 안정성
본 발명의 명세서에서, 높은 pH (즉 pH 8 내지 10.5)에서 증가된 안정성을 이루는 것과 관련하여 중요한 돌연변이 (아미노산 치환을 포함함)는 SP722 α-아밀라제 (SEQ ID NO: 2 에 도시된 아미노산 서열을 가지고 있음)의 다음의 위치중 하나 또는 그 이상에서의 돌연변이에 상응하는 돌연변이를 포함한다: T141, K142, F143, D144, F145, P146, G147, R148, G149, R181, A186, S193, N195, K269, N270, K311, K458, P459, T461.
본 발명의 변이체는 하나 또는 그 이상의 다음의 치환을 갖는다 (SEQ ID NO: 2 의 넘버링을 사용함):
바람직한 높은 pH 안정성 변이체들은 SP722 α-아밀라제 (SEQ ID NO: 2 에 도시된 아미노산 서열을 가지고 있음)에서 다음의 치환 중 하나 또는 그 이상을 포함한다: K142R, R181S, A186T, S193P, N195F, K269R, N270Y, K311R, K458R, P459T 및 T461P.
특정 구체예에서, SEQ ID NO: 1 에 도시된 서열을 가지고 있는 Bacillus 세균주 NCIB 12512 α-아밀라제, 또는 SEQ ID NO: 3 에 도시된 서열을 가지고 있는 B. stearothermophilus α-아밀라제, 또는 SEQ ID NO: 4 에 도시된 서열을 가지고 있는 B. licheniformis α-아밀라제, 또는 SEQ ID NO: 5 에 도시된 서열을 가지고 있는 B. amyloliquefaciens α-아밀라제가 이들 돌연변이를 위한 골격, 즉 부모 Termamyl-유사 α-아밀라제로서 사용된다.
도 1 에 도시된 배열로부터 알 수 있는 바와 같이, B. stearothermophilus α-아밀라제는 이미 SP722 의 N270 에 상응하는 위치에 티로신을 가지고 있다. 나아가, Bacillus 세균주 NCIB 12512 α-아밀라제, B. stearothermophilus α-아밀라제, B. licheniformis α-아밀라제 및 B. amyloliquefaciens α-아밀라제는 이미 SP722 의 K458 에 상응하는 위치에 아르기닌을 가지고 있다. 또한, B. licheniformis α-아밀라제는 이미 SP722 의 T461 에 상응하는 위치에 프롤린을 가지고 있다. 그러므로, 상기 α-아밀라제들에 대해서는 이들 치환이 관련되지 않는다.
높은 pH 에서 증가된 안정성을 나타내는 α-아밀라제 변이체들은 하기 실시예 2 에서 언급되는 분자 역학 시뮬레이션을 사용하여 발견된 영역에 치환을 일으킴으로써 제조될 수 있다. 시뮬레이션은 중간 pH 와 비교할 때 높은 pH (즉 pH 8 내지 10.5)에서 보다 큰 유연성 (flexibility) 또는 이동성을 가지는 영역(들)을 묘사한다.
그것의 삼차원 구조가 WO 96/23874 (Novo Nordisk)의 아펜딕스 1 에 게재되어 있는 Termamyl-유사 α-아밀라제에 대해 (하기에서 규정되는 바와 같은) 상동성을 가지고 있는 어떠한 박테리아 알파-아밀라제의 구조를 사용함으로써, 그러한 알파-아밀라제의 구조를 모델화하고 그것을 분자 역학 시뮬레이션에 적용시키는 것이 가능하다. 상기 박테리아 α-아밀라제의 상동성은 GAP 페널티에 대한 디폴트값을 사용하여 GCG 팩키지 버전 7.3 으로부터의 UWGCG GAP 프로그램을 사용하여 측정된 바, 상기 언급된 Termamyl-유사 α-아밀라제 (BA2)에 최소한 60 %, 바람직하게는 70 % 이상, 보다 바람직하게는 80 % 이상, 가장 바람직하게는 90 % 이상 상동할 수 있다 [Genetic Computer Group (1991) Programme Manual for the GCG Package, version 7, 575 Science Drive, Madison, Wisconsin, USA 53711]. 다른 것에 대한 바람직하지 않은 잔기의 치환도 적용될 수 있을 것이다.
pH 8 내지 10.5 에서의 증가된 Ca
2+
안정성
증가된 Ca2+ 안정성은 Ca2+ 고갈이 개선되었을 때의 효소의 안정성을 의미한다. 본 발명의 명세서에서, 높은 pH 에서 증가된 Ca2+ 안정성을 이루는 것과 관련하여 중요한 돌연변이 (아미노산 치환을 포함함)는 SEQ ID NO: 2 에 도시된 아미노산 서열을 가지고 있는 SP722 α-아밀라제의 다음의 위치에 상응하는 하나 또는 그 이상의 위치에서의 돌연변이 또는 결실을 포함한다: R181, G182, D183, G184, K185, A186, W189, N195, N270, E346, K385, K458, P459.
본 발명의 변이체들은 하기의 치환 또는 결실중 하나 또는 그 이상의 치환 또는 결실을 포함하고 있다:
바람직한 변이체들은 하나 또는 그 이상의 다음의 치환 또는 결실을 가지고 있는 것들이다:
R181Q,N; G182T,S,N; D183*; G184*;
K185A,R,D,C,E,Q,G,H,I,L,M,N,F,P,S,T,W,Y,V; A186T,S,N,I,V;
W189T,S,N,Q; N195F, N270R,D; E346Q; K385R; K458R; P459T.
특정 구체예에서, SEQ ID NO: 1 에 도시된 서열을 가지고 있는 Bacillus 세균주 NCIB 12512 α-아밀라제, 또는 SEQ ID NO: 5 에 도시된 서열을 가지고 있는 B. amyloliquefaciens α-아밀라제, 또는 SEQ ID NO: 4 에 도시된 서열을 가지고 있는 B. licheniformis α-아밀라제가 이들 돌연변이를 위한 골격으로서 사용된다.
도 1 에 도시된 배열로부터 알 수 있는 바와 같이, B. licheniformis α-아밀라제는 SP722 의 D183 및 G184 에 상응하는 위치를 가지고 있지 않다. 그러므로 상기 α-아밀라제에 대해서는 이들 결실은 관계가 없다.
바람직한 구체예에서, 변이체는 D183 및 G184 가 결실되어 있고 또한 다음의 치환중 하나를 포함하고 있는 Bacillus 세균주 NCIB 12512 α-아밀라제이다: R181Q,N 및/또는 G182T,S,N 및/또는 D183*; G184* 및/또는 K185A,R,D,C,E,Q,G,H,I,L,M,N,F,P,S,T,W,Y,V 및/또는 A186T,S,N,I,V 및/또는 W189T,S,N,Q 및/또는 N195F 및/또는 N270R,D 및/또는 E346Q 및/또는 K385R 및/또는 K458R 및/또는 P459T.
중간 온도에서의 증가된 특이 활성
본 발명의 추가의 측면으로, 10 내지 60 ℃, 바람직하게는 20 내지 50 ℃, 특히 30 내지 40 ℃ 의 온도에서 증가된 특이 활성을 나타내는 변이체들을 얻는 것과 관련하여 중요한 돌연변이는, SEQ ID NO: 2 에 도시된 아미노산 서열을 가지고 있는 SP722 α-아밀라제의 하나 또는 그 이상의 다음의 위치에 상응하는 돌연변이를 포함한다: H107, K108, G109, D166, W167, D168, Q169, S170, R171, Q172, F173, Q174, D183, G184, N195, F267, W268, K269, N270, D271, L272, G273, A274, L275, G456, N457, K458, P459, G460, T461, V462, T463.
본 발명의 변이체는 하나 또는 그 이상의 다음의 치환을 포함한다:
바람직한 변이체들은 하나 또는 그 이상의 다음의 치환 또는 결실을 포함하고 있다: Q174*, D183*, G184*, K269S.
특정 구체예에서, SEQ ID NO: 4 에 도시된 서열을 가지고 있는 B. licheniformis α-아밀라제가 이들 돌연변이를 위한 골격으로서 사용된다.
본 발명의 변이체들의 일반적인 돌연변이: 중간 온도에서의 증가된 특이 활성
특히 관심을 끄는 아미노산 치환은 효소의 활성 부위 주변의 이동성을 증가시키는 치환이다. 이것은 활성 부위와 근접한 부위, 즉 활성 부위를 구성하는 잔 기들중 어느 것으로부터든지 바람직하게는 10 Å 또는 8 Å 또는 6 Å 또는 4 Å 거리내에 있는 부위에서의 안정화 상호작용을 파괴하는 변화에 의하여 이루어진다.
그러한 것의 실예로는 측쇄의 크기를 감소시키는 돌연변이, 예를 들면 Ala 의 Gly 으로의 돌연변이, Val 의 Ala 또는 Gly 으로의 돌연변이, Ile 또는 Leu 의 Val, Ala, 또는 Gly 으로의 돌연변이, Thr 의 Ser 으로의 돌연변이가 있다.
그러한 돌연변이들은 공동 (cavities)의 도입에 의해서나 또는 돌연변이에 의한 좌측의 공간을 채우는 구조적 재배열에 의해서 활성 부위 영역에서의 유연성의 증가를 유발시키는 것으로 예상된다.
본 발명의 변이체는 상기에서 대략적으로 설명된 것 외에 하나 또는 그 이상의 변형을 포함하는 것이 바람직할 것이다. 그러므로, 변형된 α-아밀라제 변이체의 부분에 존재하는 하나 또는 그 이상의 프롤린 잔기가 가능한, 자연 발생적인 비-프롤린성 잔기중 어느 하나일 수 있고, 바람직하게는 알라닌, 글리신, 세린, 트레오닌, 발린 또는 류신인 비-프롤린성 잔기로 대체되는 것이 유익할 것이다.
유사하게, 변형된 부모 α-아밀라제의 아미노산 잔기들중에 존재하는 하나 또는 그 이상의 시스테인 잔기가 세린, 알라닌, 트레오닌, 글리신, 발린 또는 류신과 같은 비-시스테인성 잔기로 대체되는 것이 바람직할 것이다.
나아가, 본 발명의 변이체는 - 유일한 변형으로서 또는 상기에서 대략적으로 설명된 변형들중 어느 것과의 조합상태로 - 변형될 수 있어서, SEQ ID NO: 4 의 아미노산 단편 185-209 에 상응하는 아미노산 단편에 존재하는 하나 또는 그 이상의 Asp 및/또는 Glu 가, 각각 Asn 및/또는 Gln 으로 대체된다. 또한 관심의 대상이 되는 것은 Termamyl-유사 α-아밀라제에서, SEQ ID NO: 4 의 아미노산 단편 185-209 에 상응하는 아미노산 단편에 존재하는 하나 또는 그 이상의 Lys 잔기들이 Arg 으로 대체되는 것이다.
본 발명이 상기에서 대략적으로 설명된 변형들을 둘 또는 그 이상 포함하고 있는 변이체들을 포함한다는 것이 이해될 것이다.
나아가, 본원에서 설명되는 변이체들중 어떤 것에든지 점-돌연변이를 도입시키는 것이 유익할 수 있다.
활성 부위 주변에서 증가된 이동성을 가지고 있는 α-아밀라제 변이체
본 발명의 α-아밀라제 변이체의 이동성은 기질 부위에 근접한 하나 또는 그 이상의 위치에 있는 하나 또는 그 이상의 아미노산 잔기를 대체시킴으로써 증가될 수 있다. 이들 위치는 (SP722 α-아밀라제 (SEQ ID NO: 2) 넘버링을 사용하여) 다음과 같다: V56, K108, D168, Q169, Q172, L201, K269, L272, L275, K446, P459.
그러므로, 한 측면으로 본 발명은 상기 언급된 위치중 하나 또는 그 이상의 위치에서 돌연변이되는 변이체들에 관한 것이다.
바람직한 치환은 다음중 하나 또는 그 이상의 것들이다:
본 발명의 특정한 구체예에서, SEQ ID NO: 1 에 도시된 서열을 가지고 있는 Bacillus 세균주 NCIB 12512 α-아밀라제, 또는 SEQ ID NO: 3 에 도시된 서열을 가지고 있는 B. stearothermophilus α-아밀라제, 또는 SEQ ID NO: 4 에 도시된 서열을 가지고 있는 B. licheniformis α-아밀라제, 또는 SEQ ID NO: 5 에 도시된 서열을 가지고 있는 B. amyloliquefaciens α-아밀라제가 이들 돌연변이를 위한 골격으로서 사용된다.
도 1 에 도시된 배열로부터 알 수 있는 바와 같이, B. licheniformis α-아밀라제와 B. amyloliquefaciens α-아밀라제는 SP722 의 K269 에 상응하는 위치에 글루타민을 가지고 있다. 또한, B. stearothermophilus α-아밀라제는 SP722 의 K269 에 상응하는 위치에 세린을 가지고 있다. 그러므로, 상기 α-아밀라제에 대해서는 이들 치환은 관계가 없다.
나아가, 도 1 에 도시된 배열로부터 알 수 있는 바와 같이, B. amyloliquefaciens α-아밀라제는 SP722 의 L272 에 상응하는 위치에 알라닌을 가지고 있고, B. stearothermophilus α-아밀라제는 SP722 의 L272 에 상응하는 위치 에 이소류신을 가지고 있다. 그러므로, 상기 α-아밀라제들에 대해 이들 치환은 관계가 없다.
도 1 에 도시된 배열로부터 알 수 있는 바와 같이, Bacillus 세균주 12512 α-아밀라제는 SP722 의 L275 에 상응하는 위치에 이소류신을 가지고 있다. 그러므로, 상기 α-아밀라제에 대하여 이 치환은 관계가 없다.
도 1 에 도시된 배열로부터 알 수 있는 바와 같이, B. amyloliquefaciens α-아밀라제는 SP722 의 Y295 에 상응하는 위치에 페닐알라닌을 가지고 있다. 또한, B. stearothermophilus α-아밀라제는 SP722 의 Y295 에 상응하는 위치에 아스파라긴을 가지고 있다. 그러므로, 상기 α-아밀라제들에 대하여 이들 치환은 관계가 없다.
도 1 에 도시된 배열로부터 알 수 있는 바와 같이, B. licheniformis α-아밀라제 및 B. amyloliquefaciens α-아밀라제는 SP722 의 K446 에 상응하는 위치에 아스파라긴을 가지고 있다. 또한, B. stearothermophilus α-아밀라제는 SP722 의 K446 에 상응하는 위치에 히스티딘을 가지고 있다. 그러므로, 상기 α-아밀라제들에 대하여 이들 치환은 관계가 없다.
도 1 에 도시된 배열로부터 알 수 있는 바와 같이, B. licheniformis α-아밀라제, B. amyloliquefaciens α-아밀라제 및 B. stearothermophilus α-아밀라제는 SP722 의 P459 에 상응하는 위치에 세린을 가지고 있다. 또한, Bacillus 세균주 12512 α-아밀라제는 SP722 의 P459 에 상응하는 위치에 트레오닌을 가지고 있다. 그러므로, 상기 α-아밀라제들에 대하여 이들 치환은 관계가 없다.
중간 온도에서 높은 활성을 가지고 있는 효소들의 안정화
추가의 구체예에서, 본 발명은 저온 α-아밀라제 (예컨대 Alteromonas haloplanctis [Feller et al., (1994), Eur. J. Biochem. 222:441-447]), 및 중간 온도 활성을 가지고 있는 중간 온도 α-아밀라제 (예컨대 SP722 및 SP690), 즉 통상적으로 호저온성 효소 및 호중온성 효소로 알려져 있는 α-아밀라제들의 안정성을 개선시키는 것에 관한 것이다. 이 특정 효소 부류에 대한 안정성은 열안정성 또는 칼슘 고갈 상태에서의 안정성중 어느 하나인 것으로 이해될 수 있다.
전형적으로, 중간 온도에서 높은 활성을 나타내는 효소들은 또한 온도 또는 칼슘 고갈과 같은, 효소에 스트레스를 주는 조건하에서 심각한 문제점들을 나타낸다.
따라서, 본 발명의 목적은 경미하게 스트레스를 받는 조건하에서도 그것들의 활성을 잃어버리지 않으면서 중간 온도에서 원하는 높은 활성을 동시에 나타내는 효소들을 제공하는 것이다.
중간 온도에서 측정된 안정화된 변이체의 활성은 바람직하게는 효소의 안정화전에 그 특정 온도에서의 원래의 활성의 100 % 이상과 50 % 사이이어야 하고, 보다 바람직하게는 100 % 이상과 70 % 사이, 가장 바람직하게는 100 % 이상과 85 % 사이이어야 하며, 그 결과 효소는 스트레스를 받는 조건에서 야생형 효소보다 더 긴 인큐베이션을 견뎌내야 한다.
예상되는 효소들로는 예컨대 박테리아 또는 균류 기원의 α-아밀라제들이다.
그러한 저온 α-아밀라제의 실예는 Alteromonas haloplanctis로부터 단리된 것이다 [Feller et al., (1994), Eur. J. Biochem. 222:441-447]. 이 알파-아밀라제의 결정 구조는 해명되었다 [Aghajari et al., (1998), Protein Science 7:564-572].
Alteromonas haloplanctis 알파-아밀라제 (도 4 에 도시된 배열중 5)는 돼지 췌장의 알파-아밀라제 (PPA) (도 4 에 도시된 배열중 3)에 대하여 대략 66 % 의 상동성을 가지고 있다. PPA 3-차원 구조는 알려져 있으며, 상표명 1OSE 또는 1DHK 하에 브룩크하벤 데이터베이스사 (Brookhaven database)로부터 구할 수 있다. 다른 보다 안정한 알파 아밀라제에 대한 상동성을 토대로 하여, Alteromonas haloplanctis 알파-아밀라제로부터 "저온 고도 활성 효소" 가 얻어질 수 있고, 동시에 중간 온도에서 원하는 높은 활성을 보유하고 있다.
도 4 는 AHA 및 PPA α-아밀라제를 포함하여 5 개의 α-아밀라제의 다중 서열 배열을 도시한다. Alteromonas haloplanctis 알파-아밀라제의 안정성을 증가시키는 특정 돌연변이는 다음과 같다: T66P, Q69P, R155P, Q177R, A205P, A232P, L243R, V295P, S315R.
α-아밀라제 변이체의 제조방법
유전자안에 돌연변이를 도입시키기 위한 여러 가지 방법이 당해 기술분야에 공지되어 있다. α-아밀라제-암호화 DNA 서열의 클로닝에 대하여 간단히 논의된 후에 α-아밀라제-암호화 서열내에 있는 특정 부위에서의 돌연변이법 방법이 논의될 것이다.
α-아밀라제를 암호화하는 DNA 서열의 클로닝
부모 α-아밀라제를 암호화하는 DNA 서열은 관심의 α-아밀라제를 생성하는 모든 세포 또는 미생물로부터, 당해 기술분야에 잘 알려져 있는 다양한 방법들을 사용하여 단리될 수 있다. 먼저, 게놈 DNA 및/또는 cDNA 라이브러리는 연구될 α-아밀라제를 생성하는 유기체로부터 염색체 DNA 또는 메신저 RNA 를 사용하여 구성되어야 한다. 그런 다음, 만약 α-아밀라제의 아미노산 서열이 공지되어 있다면, 상동성의 표지된 올리고뉴클레오티드 프로브가 합성될 수 있고, 관심의 유기체로부터 제조되는 게놈 라이브러리로부터 α-아밀라제를 암호화하는 클론을 확인하기 위하여 사용될 수 있다. 또는 달리, 공지의 α-아밀라제 유전자에 상동하는 서열을 함유하고 있는 표지된 올리고뉴클레오티드 프로브가, 엄격도가 더 낮은 혼성화 및 세척 조건을 사용하여, α-아밀라제를 암호화하는 클론을 확인하기 위한 프로브로서 사용될 수 있을 것이다.
α-아밀라제를 암호화하는 클론을 확인하기 위한 또 다른 방법은 플라스미드와 같은 발현 벡터안에 게놈 DNA 의 단편을 삽입하고, 그 결과의 게놈 DNA 라이브러리로 α-아밀라제-음성 박테리아를 형질전환시킨 후, 형질전환된 박테리아를 α-아밀라제에 대한 기질을 함유하고 있는 아가위에 플레이팅함으로써, α-아밀라제를 발현하는 클론이 확인되는 것을 가능하게 하는 과정을 포함할 것이다.
또는 달리, 효소를 암호화하는 DNA 서열은 수립되어 있는 표준 방법, 예컨대 포스포로아미다이트 방법 [S.L. Beaucage and M.H. Caruthers (1981)] 또는 마테스 등의 방법 (Matthes et al., (1984))에 의하여 합성 제조될 수도 있다. 포스포로아미다이트 방법에서, 올리고뉴클레오티드는 예컨대 자동 DNA 합성기에서 합성되 고, 정제되며, 어닐링되고, 결찰된 후, 적절한 벡터안에 클로닝된다.
마지막으로, DNA 서열은 합성 기원, 게놈 기원 또는 cDNA 기원의 DNA 단편들 (필요에 따라 완전한 DNA 서열의 다양한 부분들에 상응하는 단편들)을 표준 기법에 따라 결찰시킴에 의해 제조된 게놈 및 합성 기원의 혼합형, 합성 및 cDNA 기원의 혼합형, 또는 게놈과 cDNA 기원의 혼합형일 수 있다. DNA 서열은 또한 특이한 프라이머, 예를 들면 미국 특허 제 4,683,202 호에 또는 사이키 등 (R.K. Saiki et al., (1988))에 의해 설명된 바와 같은 프라이머를 사용하여 중합효소 연쇄 반응 (PCR)에 의하여 제조될 수도 있다.
α-아밀라제 변이체의 발현
본 발명에 따라, 상술된 방법에 의해, 또는 당해 기술분야에 공지되어 있는 어떠한 대용 방법에 의하여 제조된 변이체를 암호화하는 DNA 서열은, 전형적으로 프로모터, 오퍼레이터, 리보솜 결합 부위, 번역 개시 신호, 및 임의로 리프레서 유전자 또는 다양한 활성화제 유전자를 암호화하는 조절 서열들을 포함하고 있는 발현 벡터를 사용하여 효소 형태로 발현될 수 있다.
본 발명의 α-아밀라제 변이체를 암호화하는 DNA 서열을 포함하고 있는 재조합 발현 벡터는 재조합 DNA 과정을 편리하게 수행할 수 있는 모든 유형의 벡터일 수 있으며, 벡터의 선택은 때로 그것이 도입되는 숙주 세포에 따라 좌우될 것이다. 그러므로, 벡터는 자동적으로 복제하는 벡터, 즉 그것의 복제가 염색체성 복제와는 무관한 염색체외적으로 존재하는 실체로서 존재하는 벡터, 예컨대 플라스미드, 박테리오파지 또는 염색체외재성 엘레먼트, 미니크로모좀 또는 인공제조된 염색체일 수 있다. 또는 달리, 벡터는 숙주 세포에 도입되었을 때, 숙주 세포 게놈안에 통합되어 그것이 통합된 염색체(들)과 함께 복제되는 그러한 것일 수도 있다.
벡터에서, DNA 서열은 적당한 프로모터 서열에 작동가능하게 연결되어야 한다. 프로모터는 선택된 숙주 세포에서 전사 활성을 나타내는 어떠한 DNA 서열일 수 있고 숙주 세포에 동종성이거나 이종성인 단백질을 암호화하는 유전자로부터 유도될 수 있다. 본 발명의 α-아밀라제 변이체를 암호화하는 DNA 서열의 전사를, 특히 박테리아 숙주에서 지시하기에 적당한 프로모터의 실예로는 대장균의 lac 오페론의 프로모터, Streptomyces coelicolor 아가라제 유전자 dagA 프로모터, Bacillus licheniformis α-아밀라제 유전자 (amyL)의 프로모터, Bacillus stearothermophilus 말토제닉 아밀라제 유전자 (amyM)의 프로모터, Bacillus amyloliquefaciens α-아밀라제 (amyQ)의 프로모터, B. subtilis xylA 및 xylB 유전자의 프로모터 등이 있다. 균류 숙주에서의 전사를 위해서 유용한 프로모터의 실예로는 A. oryzae TAKA 아밀라제, Rhizomucor miehei 아스파틱 단백질 가수분해효소, A. niger 중성 α-아밀라제, A. niger 산 안정성 α-아밀라제, A. niger 글루코아밀라제, Rhizomucor miehei 리파아제, A. oryzae 알칼리성 프로테아제, A. oryzae 트리오스 포스페이트 이소메라제 또는 A. nidulans 아세트아미다아제를 암호화하는 유전자로부터 유도되는 것들이 있다.
본 발명의 발현 벡터는 또한 적당한 전사 터미네이터, 및 진핵세포에서, 본 발명의 α-아밀라제 변이체를 암호화하는 DNA 서열에 작동가능하게 연결된 폴리-아데닐화 서열을 포함할 수 있다. 터미네이션 및 폴리아데닐화 서열은 프로모터와 동일한 공급원으로부터 적절하게 유도될 수 있다.
벡터는 또한 관심의 숙주 세포에서 벡터가 복제되는 것을 가능하게 하는 DNA 서열을 포함할 수 있다. 그러한 서열의 실예는 플라스미드 pUC19, pACYC177, pUB110, pE194, pAMB1 및 pIJ702 의 복제원점이다.
벡터는 또한 선택가능한 마커, 예컨대 그것의 생성물이 숙주 세포에서의 결핍을 보충하는 유전자, 예를 들면, B. subtilis 또는 B. licheniformis로부터 얻어지는 dal 유전자, 또는 암피실린, 카나마이신, 클로람페니콜 또는 테트라사이클린 내성과 같은 항생물질 내성을 부여하는 유전자를 포함할 수 있다. 나아가, 벡터는 amdS, argB, niaD 및 sC 와 같은 Aspergillus 선택 마커, 하이그로마이신 내성을 유발하는 마커를 포함할 수 있으며, 또는 선택은 예컨대 WO 91/17243 에 기재된 바와 같은 공-형질전환에 의하여 이루어질 수 있다.
세포내 발현이 예컨대 숙주 세포로서 특정 박테리아를 사용할 때 어떤 관점에서는 유익할 수 있는 한편으로, 일반적으로 발현은 세포외적으로 이루어지는 것이 바람직하다. 일반적으로, 본원에서 언급되는 Bacillus α-아밀라제들은 발현된 프로테아제의 배양 배지로의 분비를 허용하는 예비영역을 포함하고 있다. 필요하다면, 이 예비영역은 상이한 예비영역 또는 신호 서열로 대체될 수 있는데, 이것은 각각의 예비영역을 암호화하는 DNA 서열을 치환시킴으로써 편리하게 이루어진다.
α-아밀라제 변이체, 프로모터, 터미네이터 및 다른 엘레먼트들을 각각 암호화하는 본 발명의 DNA 구조체를 결찰하기 위한 과정들, 및 그것들을 복제에 필요한 정보를 함유하고 있는 적당한 벡터에 삽입하기 위한 과정들은 당업자에게 잘 알려 져 있다 [예를 들면 Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor, 1989 참조].
DNA 구조체를 포함하고 있거나 상기 규정된 바와 같은 본 발명의 발현 벡터를 포함하고 있는 본 발명의 세포는 유익하게도, 본 발명의 α-아밀라제 변이체의 재조합 제조에서 숙주 세포로서 사용된다. 세포는 편리하게는 숙주 염색체안에 DNA 구조체를 (하나 또는 그 이상의 복사물로서) 통합시킴에 의해, 변이체를 암호화하는 본 발명의 DNA 구조체로 형질전환될 수 있다. 이러한 통합은 일반적으로 DNA 서열이 보다 더 세포에서 안정하게 유지되는 것으로 여겨지기 때문에 유익한 것으로 간주된다. 숙주 염색체안으로의 DNA 구조체의 통합은 종래 방법에 따라, 예를 들면 동형 또는 이형 재조합에 의하여 수행될 수 있다. 또는 달리, 세포는 숙주 세포의 상이한 유형과 관련하여 상술된 바와 같이 발현 벡터로 형질전환될 수도 있다.
본 발명의 세포는 포유동물 또는 곤충과 같은 고등 유기체의 세포일 수도 있지만, 예컨대 박테리아 또는 균류 (효모를 포함함) 세포와 같은 미생물 세포가 바람직하다.
적당한 박테리아의 실예로는 그람 양성 박테리아, 예컨대 Bacillus subtilis, Bacillus licheniformis, Bacillus lentus, Bacillus brevis, Bacillus stearothermophilus, Bacillus alkalophilus, Bacillus amyloliquefaciens, Bacillus coagulans, Bacillus circulans, Bacillus lautus, Bacillus megaterium, Bacillus thuringiensis, 또는 Streptomyces lividans 또는 Streptomyces murinus, 또는 E. coli와 같은 그람 음성 박테리아가 있다. 박테리아의 형질전환은 예를 들면, 원형질체 형질전환에 의해 또는 공지된 방법 자체대로 경합 세포를 사용함으로써 이루어질 수 있다.
효모 유기체는 바람직하게는 Saccharomyces 또는 Schizosaccharomyces 종, 예컨대 Saccharomyces cerevisiae, 으로부터 선택될 수 있다. 필라멘트형 균류는 유익하게도 Aspergillus 종, 예컨대 Aspergillus oryzae 또는 Aspergillus niger에 속할 수 있다. 균류 세포는 원형질체 형성 및 원형질체의 형질전환과 이어서 공지된 자체의 방법을 사용한 세포 벽의 재생을 포함하는 방법에 의하여 형질전환될 수 있다. Aspergillus 숙주 세포의 형질전환에 적절한 과정은 EP 238 023 에 설명되어 있다.
여전히 추가의 측면으로, 본 발명은 본 발명의 α-아밀라제 변이체를 제조하는 방법에 관한 것으로, 이 방법은 상술된 바와 같은 숙주 세포를 변이체의 생성이 수행될 수 있는 조건하에서 배양시킨 후, 세포 및/또는 배양 배지로부터 변이체를 회수하는 것으로 이루어진다.
세포를 배양시키기 위하여 사용되는 배지는, 관심의 숙주 세포를 성장시키고, 본 발명의 α-아밀라제 변이체의 발현을 얻기에 적당한 것이면, 종래의 배지중 어떤 것이든지 좋을 것이다. 적당한 배지는 상업적인 공급자로부터 구입할 수 있거나 또는 공개된 방법에 따라 (예컨대 American Type Culture Collection의 카탈로그에 기재된 대로) 제조될 수 있다.
숙주 세포로부터 분비된 α-아밀라제 변이체는, 편리하게는 세포를 원심분리 또는 여과에 의하여 배지로부터 분리하고, 배지의 단백질성 성분을 황산 암모늄과 같은 염에 의하여 침전시킨 다음, 이온 교환 크로마토그래피, 친화성 크로마토그래피, 등과 같은 크로마토그래피 과정을 사용하는 것을 포함하는, 잘 알려져 있는 방법들에 의하여 배양 배지로부터 회수될 수 있다.
산업적 응용
본 발명의 α-아밀라제 변이체는 다양한 산업적 응용이 가능한 가치있는 성질을 가지고 있다. 특히, 본 발명의 효소 변이체들은 세척, 식기세척 및 경질-표면 세정 세제 조성물의 성분으로서 사용될 수 있다.
많은 변이체들이 감미료 및 녹말로부터 에탄올 제조에, 및/또는 직물 식기세척에 특히 유용하다. 녹말 액화 및/또는 당화 과정을 포함한 종래의 녹말-전환 과정 조건은 예컨대 미국 특허 제 3,912,590 호, 및 EP 특허 공보 제 252,730 호 및 63,909 호에 게재되어 있다.
세제 조성물
상기 언급된 바와 같이, 본 발명의 변이체들은 세제 조성물에 적절하게 혼입될 수 있다. 세제 조성물 (예컨대 세탁 또는 식기세척용 세제)의 성분들, 그러한 세제 조성물에 변이체들을 제형시키는 방법, 및 예를 들어 세제 조성물의 관련된 유형에 관련된 보다 상세한 설명은 WO 96/23874 및 WO 97/07202 를 참조한다.
본 발명의 변이체를 포함하고 있는 세제 조성물은 하나 또는 그 이상의 다른 효소, 예컨대 리파아제, 큐티나제, 프로테아제, 셀룰라제, 페록시다제 또는 락카아제, 및/또는 다른 α-아밀라제를 추가로 포함할 수 있다.
본 발명의 α-아밀라제 변이체들은 종래 사용되는 농도로 세제에 혼입될 수 있다. 본 발명의 변이체는 종래부터 사용되는 세제의 용량 수준을 사용하여 세척/식기세척액의 리터당 α-아밀라제의 0.00001 내지 1 mg (순수한 활성 효소 단백질로서 계산됨)에 상응하는 양으로 혼입될 수 있는 것으로 현재 예상된다.
본 발명은 또한 1) 변경된 최적 pH, 및/또는 2) 변경된 최적 온도, 및/또는 3) 증가된 안정성을 가지는 α-아밀라제를 제공하는 방법에 관한 것으로, 이 방법은 다음 단계들로 이루어진다:
i) 실질적으로 상이한 pH, 온도 및/또는 안정성 프로필을 가지고 있는 둘 또는 그 이상의 α-아밀라제의 3-차원 구조의 분자 역학을 비교함으로써 α-아밀라제의 돌연변이를 위한 표적 위치(들) 및/또는 영역(들)을 확인하는 단계,
ii) 확인된 위치(들) 및/또는 영역(들)에서 하나 또는 그 이상의 아미노산을 치환, 첨가 및/또는 결실시키는 단계.
본 발명의 구체예에서 중간 온도 α-아밀라제는 고온 α-아밀라제와 비교된다. 다른 구체예에서는 저온 α-아밀라제가 중간 온도 α-아밀라제 또는 고온 α-아밀라제중 하나와 비교된다.
비교되는 α-아밀라제들은 바람직하게는 상호간에 최소한 70 %, 바람직하게는 80 %, 90 % 까지, 예컨대 95 % 까지, 특별히 95 % 상동하여야 한다.
비교되는 α-아밀라제들은 상기 규정된 바와 같은 Termamyl-유사 α-아밀라제들일 수 있다. 특정한 구체예에서 비교되는 α-아밀라제들은 SEQ ID NO: 1 내지 SEQ ID NO: 8 에 도시된 α-아밀라제들이다.
다른 구체예에서, 비교되는 관심의 α-아밀라제들의 안정성 프로필은 Ca2+ 의존성 프로필이다.
재료 및 방법
효소:
SP722: (SEQ ID NO: 2, Novo Nordisk 사에서 구입할 수 있음)
TermamylTM (SEQ ID NO: 4, Novo Nordisk 사에서 구입할 수 있음)
SP690: (SEQ ID NO: 1, Novo Nordisk 사에서 구입할 수 있음)
Bacillus subtilis SHA273: WO 95/10603 참조.
플라스미드
pJE1 은 성숙한 단백질의 아미노산 D183-G184 에 상응하는 6 개의 뉴클레오티드가 결실되어 있는 SP722 α-아밀라제 (SEQ ID NO: 2): viz. 의 변이체를 암호화하는 유전자를 함유하고 있다. JE1 유전자의 전사는 amyL 프로모터로부터 지시를 받는다. 이 플라스미드는 또한 복제원점 및 플라스미드 pUB110 (Gryczan, TJ et al., (1978), J. Bact. 134:318-329)으로부터 얻어지는 카나마이신에 대한 내성을 부여하는 cat-유전자를 함유하고 있다.
방법:
라이브러리 벡터 pDorK101 의 제조
대장균/Bacillus 셔틀 벡터 pDorK101 (하기에서 설명됨)은 대장균에서 α-아밀라제가 발현되는 일 없이 돌연변이를 도입시키기 위하여 사용될 수 있고, 그런 다음 Bacillus에서 α-아밀라제가 활성이 되도록 변형될 수 있다. 이 벡터는 다음과 같이 제조하였다: JE1 암호화 유전자 (D183-G184 가 결실된 SP722)를 대장균 복제원점을 함유하고 있는 1.2 kb 단편을 사용하여 SEQ ID NO: 2: SP722 의 5' 코딩 영역에 있는 PstI 부위에 끼워넣어 유전자를 방해함으로써 pJE1 에서 비활성화시켰다. 이 단편을 순방향 프라이머: 5'-gacctgcagtcaggcaacta-3' 및 역 프라이머: 5'-tagagtcgacctgcaggcat-3' 을 사용하여 pUC19 (GenBank Accession #:X02514) 로부터 PCR 증폭시켰다. PCR 암플리콘 및 pJE1 벡터를 PstI 을 사용하여 37 ℃ 에서 2 시간동안 소화시켰다. pJE1 벡터 단편과 PCR 단편을 실온에서 1 시간동안 결찰시키고, 전기-형질전환에 의하여 대장균에 형질전환시켰다. 그 결과의 벡터를 pDorK101 로 표시한다.
필터 스크리닝 검정
부모 효소와 비교하여 높은 pH 에서 증가된 안정성을 가지고 있는 Termamyl-유사 α-아밀라제 변이체들과, 스크리닝 온도 세팅에 좌우되는 부모 효소와 비교하여 높은 pH 및 중간 온도에서 증가된 안정성을 가지고 있는 Termamyl-유사 α-아밀라제 변이체들을 스크리닝하기 위하여 검정이 사용될 수 있다.
높은 pH 필터 검정
Bacillus 라이브러리를, 10 ㎍/ml 의 카나마이신을 함유하고 있는 TY 아가 플레이트 위의 셀룰로오스 아세테이트 (OE 67, Schleicher & Schuell, Dassel, Germany) - 및 니트로셀룰로오스 필터 (Protran-Ba 85, Schleicher & Schuell, Dassel, Germany)의 샌드위치위에 37 ℃ 에서 최소한 21 시간동안 플레이팅한다. 셀룰로오스 아세테이트 층은 TY 아가 플레이트위에 위치한다.
각 필터 샌드위치를 플레이팅후에, 그러나 필터상에 양성 변이체들이 위치할 수 있도록 하기 위해 인큐베이션하기 전에 바늘로 특별하게 표시하고, 변이체들이 결합되어 있는 니트로셀룰로오스 필터를 글리신-NaOH 완충액, pH 8.6-10.6 을 함유하고 있는 콘테이너에 옮긴 후, 실온 (10 내지 60 ℃ 로 변경될 수 있음)에서 15 분동안 인큐베이션한다. 콜로니를 포함한 셀룰로오스 아세테이트 필터를 사용할 때까지 TY 플레이트상에서 실온에서 보관한다. 인큐베이션후에, 잔여 활성을 글리신-NaOH 완충액, pH 8.6-10.6 중에 1 % 아가로오스, 0.2 % 녹말을 함유하고 있는 플레이트상에서 검출한다. 니트로셀룰로오스 필터를 포함하고 있는 검정 플레이트를 필터 샌드위치와 동일한 방식으로 표시하고 2 시간동안 실온에서 인큐베이션한다. 필터를 제거한 후, 검정 플레이트를 10 % 의 루골 (Lugol) 용액으로 염색한다. 녹말의 등급을 저하시키는 변이체들은 진한 푸른색 바탕위에 하얀색 반점으로서 검출되며, 그런 다음 보관 플레이트상에서 확인된다. 양성 변이체들을 첫 번째 스크리닝때와 동일한 조건하에서 두 번 재스크리닝한다.
저칼슘 필터 검정
Bacillus 라이브러리를, 관련된 항생물질, 예컨대 카나마이신 또는 클로람페니콜을 함유하고 있는 TY 아가 플레이트 위의 셀룰로오스 아세테이트 (OE 67, Schleicher & Schuell, Dassel, Germany) - 및 니트로셀룰로오스 필터 (Protran-Ba 85, Schleicher & Schuell, Dassel, Germany)의 샌드위치위에서 37 ℃ 에서 최소한 21 시간동안 플레이팅한다. 셀룰로오스 아세테이트 층은 TY 아가 플레이트위에 위 치한다.
각 필터 샌드위치를 플레이팅후에, 그러나 필터상에 양성 변이체들이 위치할 수 있도록 하기 위해 인큐베이션하기 전에 바늘로 특별하게 표시하고, 변이체들이 결합되어 있는 니트로셀룰로오스 필터를 탄산염/중탄산염 완충액, pH 8.5-10 및 상이한 EDTA 농축액 (0.001 mM - 100 mM)을 함유하고 있는 콘테이너에 옮긴 후, 실온에서 1 시간동안 인큐베이션한다. 콜로니를 포함한 셀룰로오스 아세테이트 필터를 사용할 때까지 TY 플레이트상에 실온에서 보관한다. 인큐베이션후에, 잔여 활성을 탄산염/중탄산염 완충액, pH 8.5-10 중에 1 % 아가로오스, 0.2 % 녹말을 함유하고 있는 플레이트상에서 검출한다. 니트로셀룰로오스 필터를 포함하고 있는 검정 플레이트를 필터 샌드위치와 동일한 방식으로 표시하고 2 시간동안 실온에서 인큐베이션한다. 필터를 제거한 후, 검정 플레이트를 10 % 의 루골 용액으로 염색한다. 녹말의 등급을 저하시키는 변이체들은 진한 푸른색 바탕위에 하얀색 반점으로서 검출되며, 그런 다음 보관 플레이트상에서 확인된다. 양성 변이체들을 첫 번째 스크리닝때와 동일한 조건하에서 두 번 재스크리닝한다.
관심의 영역들을 얻기 위한 방법:
박테리아 α-아밀라제들의 3-차원 구조에 대해서는 3 가지가 알려져 있다. B. licheniformis α-아밀라제, 브루크하벤 데이터베이스 1 BPL [Machius et al., (1995), J. Mol. Biol. 246, p. 545-559] 및 1VJS [Song et al., (1996), Enzymes for Carbohydrate 163 Engineering (Prog. Biotechnol. V 12)]. 이들 두가지 구조는 두 개의 칼슘 이온과 하나의 나트륨 이온 결합 부위 주변 영역에, 소위 B-도메 인으로부터 구조의 중요한 부분이 결여되어 있다. 따라서 본 발명자들은 α-아밀라제 BA2 (WO 96/23874, BANTM (SEQ ID NO: 5) 과 B. licheniformis α-아밀라제 (SEQ ID NO: 4) 사이의 하이브리드)의 3-차원 구조를 사용하였다. 이 구조를 토대로 하여 B. licheniformis 알파 아밀라제와 SP722 α-아밀라제의 모델을 만들었다.
α-아밀라제 변이체들의 발효 및 정제
발효 및 정제는 당해 기술분야에 잘 공지되어 있는 방법들에 의해 수행될 수 있다.
안정성 측정
모든 안정성 시험은 동일한 셋업을 사용하여 이루어진다. 방법은 다음과 같다:
효소를 관련된 조건하에서 인큐베이션한다 (1-4). 샘플을 다양한 시간점, 예컨대 0, 5, 10, 15 및 30 분후에 취하여 검정 완충액 (0.1 M 의 50 mM 브리톤 완충액 pH 7.3)중에 25 배로 희석하고 (모든 샘플에 대하여 동일한 희석), 활성을 표준 조건 pH 7.3, 37 ℃ 하에서 파데바스 검정 (Phadebas assay, Pharmacia)을 사용하여 측정한다.
인큐베이션전 (0 분)에 측정된 활성을 대조표준 (100 %)으로서 사용한다. % 의 감소는 인큐베이션 시간의 함수로서 계산한다. 하기의 표는 예컨대 30 분동안의 인큐베이션후의 잔여 활성을 나타낸다.
특이 활성 측정
특이 활성을 활성/mg 효소로서 파데바스 검정 (Pharmacia)을 사용하여 측정한다. 제조자의 지시를 따른다 (하기의 "α-아밀라제 활성에 대한 검정" 참조).
α-아밀라제 활성에 대한 검정
1. 파데바스 검정
α-아밀라제 활성을 기질로서 파데바스 정 (tablet)을 사용하는 방법에 의하여 측정한다. 파데바스 정 (Phadebas Amylase Test, Pharmacia Diagnostic 사 제공)은 우혈청 알부민 및 완충 물질과 혼합되고 정제화된 교차-결합된 불용성의 푸른색의 녹말 중합체를 함유하고 있다.
매번 단일 측정에 대해 한 정제를 5 ml 의 50 mM 브리톤-로빈슨 완충액 (50 mM 의 아세트산, 50 mM 의 인산, 50 mM 의 붕산, 0.1 mM 의 CaCl2, pH 는 NaOH 를 사용하여 관심의 값으로 조정됨)을 함유하고 있는 튜브안에 현탁시킨다. 시험은 관심의 온도에서 수조에서 수행한다. 시험될 α-아밀라제를 50 mM 의 브리톤-로빈슨 완충액중에 × ml 로 희석한다. 이 α-아밀라제 용액 1 ml 을 5 ml 의 50 mM 브리톤-로빈슨 완충액에 첨가한다. 녹말이 α-아밀라제에 의하여 가수분해되어 가용성 푸른색 단편을 생성시킨다. 그 결과의 푸른색 용액의 흡광도를 620 nm 에서 비색계로 측정하고, 그것은 α-아밀라제 활성의 함수이다.
10 분 또는 15 분의 인큐베이션 (시험 시간) 후에 620 nm 에서 측정된 흡광도가 620 nm 에서 0.2 내지 2.0 흡광도 유니트의 범위내에 있음은 중요하다. 이 흡광도 범위내에서 활성과 흡광도 사이에는 선형성이 존재한다 (람버트-비어 법칙). 그러므로 효소의 희석은 이 범주에 맞도록 조정되어야 한다. 특정한 조건 (온도, 반응시간, 완충 조건)의 세트하에서, 1 mg 의 주어진 α-아밀라제가 특정량의 기질을 가수분해할 것이고, 그 결과 푸른색이 생성될 것이다. 색의 강도는 620 nm 에서 측정한다. 측정된 흡광도는 주어진 세트의 조건하에서 의문의 대상이 되는 α-아밀라제의 특이 활성에 정비례한다 (활성/순수한 α-아밀라제 단백질의 mg).
2. 대체 방법
α-아밀라제 활성을 PNP-G7 기질을 사용하는 방법에 의하여 측정한다. p-니트로페닐-α,D-말토헵타오시드의 약자인 PNP-G7 은 엔도-아밀라제에 의해 절단될 수 있는 차단된 올리고당이다. 절단후에, 키트안에 포함되어 있는 α-글루코시다제가 기질을 소화시켜서 노란색을 띄는 유리 PNP 분자를 분리시키며, 따라서 λ=405 nm (400 - 420 nm)에서 육안 분광측광법에 의해 측정될 수 있다. PNP-G7 기질과 α-글루코시다제를 함유하고 있는 키트는 뵈링거-만하임사에서 제조된다 (cat.No. 1054635).
기질을 제조하기 위하여, 1 병의 기질 (BM 1442309)을 5 ml 의 완충액 (BM 1442309)에 첨가한다. α-글루코시다제를 제조하기 위해서는 1 병의 α-글루코시다제 (BM 1462309)를 45 ml 의 완충액 (BM1442309)에 첨가한다. 작업 용액은 5 ml 의 α-글루코시다제 용액과 0.5 ml 의 기질을 혼합함으로써 만들어진다.
검정은 96 웰 미소적정 플레이트에 20 ㎕ 의 효소 용액을 넣고 25 ℃ 에서 인큐베이션함으로써 수행된다. 25 ℃ 의 200 ㎕ 의 작업 용액을 첨가한다. 용액 을 혼합하고 1 분동안 예비-인큐베이션한 후, 흡광도를 매 15 초마다 3 분동안 OD 405 nm 에서 측정한다.
시간 의존성 흡광도 곡선의 기울기는 주어진 세트의 조건하에서 의문의 대상이 되는 α-아밀라제의 특이 활성에 정비례한다 (mg 효소당 활성).
DOPE 프로그램의 사용에 의한 무작위 돌연변이법을 위한 일반적인 방법
무작위 돌연변이는 다음 단계들에 의하여 수행될 수 있다:
1. 부모효소에서의 변형을 위해 관심의 영역을 선택한다.
2. 선택된 영역에서 돌연변이 부위와 비-돌연변이 부위를 결정한다.
3. 어떤 종류의 돌연변이가 수행되어야 하는지를, 예컨대 구성될 변이체의 원하는 안정성 및/또는 성능과 관련하여 결정한다.
4. 구조적으로 타당한 돌연변이를 선택한다.
5. 단계 4 와 관련하여 단계 3 에 의해 선택된 잔기들을 조정한다.
6. 적당한 도프 알고리즘을 사용함으로써 뉴클레오티드 분포를 분석한다.
7. 필요에 따라 유전자 코드 실제 (realism)에 원하는 잔기들을 조정한다 (예컨대 (예를 들어 정지코돈의 도입을 피하기 위하여) 유전자 코드로부터 유발되는 제한점들을 고려하여) (당업자는 어떤 코돈 조합들은 실제로 사용될 수 없으며 적응될 필요가 있음을 알게 될 것이다).
8. 프라이머를 만든다.
9. 프라이머의 사용에 의하여 무작위 돌연변이법을 수행한다.
10. 그 결과 생성된 α-아밀라제 변이체를, 원하는 증가된 성질에 대해 스크 리닝함으로써 선택한다.
단계 6 에서 사용하기에 적당한 도프 알고리즘은 당해 기술분야에 잘 알려져 있다. 한 가지 알고리즘은 토만들 등에 의해 설명되었다[Tomandl, D. et al., Journal of Compyter-Aided Molecular Design, 11 (1997), pp. 29-38). 다른 알고리즘인 DOPE 에 대해서는 하기에서 설명된다.
도프 프로그램
"DOPE" 프로그램은 원하는 아미노산 분포를 가장 닮은 아미노산 분포를 암호화하는 방식으로 코돈 트리플렛의 뉴클레오티드 조성을 최적화시키는데 유용한 컴퓨터 알고리즘이다. 그것의 가능한 분포가 원하는 아미노산 분포와 가장 유사한지를 평가하기 위하여, 스코어링 함수가 필요하다. "도프" 프로그램에서는 다음의 함수가 적절한 것으로 발견되었다:
상기 식에서, xi' 는 프로그램에 의해 계산되는 바 아미노산의 얻어진 양 및 아미노산의 그룹이고, yi' 는 프로그램의 사용자에 의하여 규정되는 아미노산의 원하는 양 및 아미노산 그룹이며 (예컨대 20 개의 아미노산 또는 정지코돈중 어느 것을, 예컨대 특정 백분율 (예를 들면 90 % 의 Ala, 3 % 의 Ile, 7 % 의 Val)로 도입하기를 원하는 지 특정하는 것), wi' 는 프로그램의 사용자에 의해 규정되는 획득된 중량 인자이다 (예를 들어 의문의 대상이 되는 위치안에 삽입된 특이한 아미노산 잔기를 가지고 있는 중요성에 좌우됨). N 은 프로그램의 사용자에 의해 규정되는 바와 같은 아미노산 그룹의 수 더하기 21 이다. 이 함수의 목적에 대해 00 은 1 로서 규정된다.
상기 함수의 최대값을 찾기 위하여 몬테-카를로 알고리즘을 사용한다 (한 가지 실예는 밸류와 휘팅톤에 의해 설명된 것이다: Valleau, J.P. & Whittington, S.G. (1977) A guide to Monte Carlo for statistical mechanics: 1 Highways. In "Statistical Mechanics, Part A" Equlibrium Techniqeues ed. B.J. Berne, New York: Plenum). 각 반복에서 다음의 단계들이 수행된다:
1. 새로운 무작위 뉴클레오티드 조성이 각 염기에 대해 선택되는데, 이 때 현재의 조성과 새로운 조성 사이의 절대적인 차이가 코돈의 모든 세 개의 위치에서 4 개의 뉴클레오티드, G, A, T, C 의 각각에 대해 d 보다 작거나 동일하다 (d 의 조건에 대해서는 하기의 설명 참조).
2. 새로운 조성과 현재의 조성의 스코어를 상술된 바와 같은 함수 s 를 사용함으로써 비교한다. 만약 새로운 스코어가 현재의 조성의 스코어보다 더 높거나 또는 같다면, 새로운 조성이 유지되고 현재의 조성은 새로운 것으로 교체된다. 만약 새로운 스코어가 더 작다면, 새로운 조성을 유지할 가능성은 exp(1000(new_score - current_score)) 이다.
사이클은 정상적으로는 d 가 1 에서 0 으로 선형으로 감소하는 상술된 바와 같은 1000 회 반복으로 구성된다. 100 사이클 또는 그 이상의 사이클이 최적화된 방법에서 수행된다. 가장 높은 스코어를 유발하는 뉴클레오티드 조성이 마지막으로 제공된다.
도 1 은 6 개의 부모 Termamyl-유사 α-아밀라제의 아미노산 서열의 배열을 도시한다. 가장 왼쪽에 있는 숫자는 다음과 같은 각각의 아미노산 서열을 나타낸다:
1: SEQ ID NO: 2
2: Kaoamyl
3: SEQ ID NO: 1
4: SEQ ID NO: 5
5: SEQ ID NO: 4
6: SEQ ID NO: 3.
도 2 는 pH 9 에서의 SP722 (SEQ ID NO: 2)의 온도 활성 프로필 및 pH 7.3 에서의 B. licheniformis α-아밀라제 (SEQ ID NO: 4)의 온도 활성 프로필을 도시한다.
도 3 은 pH 10 에서의 SP690 (SEQ ID NO: 1)에 대한 온도 프로필, SP722 (SEQ ID NO: 2)에 대한 온도 프로필, 및 B. licheniformis α-아밀라제 (SEQ ID NO: 4)에 대한 온도 프로필을 도시한다.
도 4 는 5 개의 α-아밀라제의 아미노산 서열의 배열을 도시한다. 가장 왼쪽에 있는 숫자는 각각 다음과 같은 아미노산 잔기를 나타낸다:
1: amyp_마우스
2: amyp_래트
3: amyp_돼지 돼지 췌장의 알파-아밀라제 (PPA)
4: amyp_사람
5: amy_알타 A. haloplanctis 알파-아밀라제 (AHA)
실시예 1
Termamyl
TM
의 상동성 제작에 대한 실시예
다른 Termamyl-유사 α-아밀라제에 대한 B. licheniformis α-아밀라제 (하기에서 TermamylTM 으로 언급함)의 전체적인 상동성은 높으며 % 유사성은 매우 높다. 위스콘신 대학 제네틱스 컴퓨터 그룹의 프로그램 GCG 를 사용하여 계산된 TermamylTM 의 BSG (SEQ ID NO: 3 을 갖는 B. stearothermophilus α-아밀라제), 및 BAN (SEQ ID NO: 5 를 갖는 B. amyloliquefaciens α-아밀라제)에 대한 유사성은 각각 89 % 및 78 % 였다. TERM 은 BANTM 및 BSG 와 비교하여 잔기 G180 과 K181 사이에 2 개의 잔기가 결실된 것이다. BSG 는 BANTM 및 TermamylTM 과 비교하여 G371 과 I372 사이에 3 개의 잔기가 결실된 것이다. 나아가 BSG 는 BANTM 및 TermamylTM 과 비교하여 C-말단에 20 개 이상의 잔기가 연장된 것이다. BANTM 은 BSG 와 비교 하여 N-말단이 2 개의 잔기가 적으며 Termamyl 은 한 개의 잔기가 더 적다.
B. licheniformis α-아밀라제 (TermamylTM) 및 B. amyloliquefaciens α-아밀라제 (BANTM)의 구조는 각각, WO 96/23974 의 부록 1 에 게재된 구조를 모델로 하여 만들었다. 다른 Termamyl-유사 α-아밀라제들 (예컨대 본원에 개시된 것들)의 구조도 유사하게 만들 수 있다.
본 구조를 설명하기 위하여 사용된 α-아밀라제와 비교하여, TermamylTM 은 그것이 178 내지 182 주변의 두 개의 잔기가 부족하다는 점에서 상이하다. 모델 구조에서 이것을 상쇄하기 위하여, BIOSYM 으로부터 받은 HOMOLOGY 프로그램을 사용하여 결실점을 제외하고 구조의 동등한 위치에 있는 잔기 (구조적으로 보존된 영역뿐만 아니라)를 치환하였다. 펩티드 결합을 TermamylTM (BANTM) 의 G179(G177) 와 K180(K180)사이에 만들었다. 해결된 구조와 모델 구조 사이의 밀접한 구조 관계 (및 그로 인한 후자의 타당성)를 모델에서 너무 가까이 함께 있는 것으로 밝혀진 단지 매우 적은 수의 원자들의 존재에 의해 나타낸다.
그런 다음 INSIGHT 프로그램을 사용하여 상기 해결된 구조에 대한 것과 동일한 좌표에서 해결된 구조 (WO 96/23874 의 부록 1 참조)로부터의 모든 물 (605)과 이온 (4 개의 칼슘 및 1 개의 나트륨)을 이 매우 개략적인 TermamylTM 구조에 첨가하였다. 이것은 단지 소수의 오버랩 - 달리 말하면 매우 정확하게 맞춤으로 행해질 수 있었다. 그런 다음 이 모델 구조를 200 단(step)의 스팁페스트 하강 (Steepest descent) 및 600 단의 콘쥬게이트된 구배 [Brooks et al., 1983, J. Computational Chemistry 4, p.187-217 참조]를 사용하여 최소화하였다. 그런 다음 최소화된 구조에 대해 5 ps 의 가열과 이어서 200 ps 까지의, 그러나 35 ps 이상의 평형화로 이루어진 분자 역학을 수행하였다. 베를렛 (Verlet) 알고리즘과 평형 온도 300 K 를 사용하여 작동된 역학을, 수조에 대한 베렌드센 커플링 (Behrendsen et al., 1984, J. Chemical Physics 81, p.3684-3690)을 사용하여 유지시켰다. 회전 및 번역을 매 피코초마다 제거하였다.
실시예 2
증가된 pH 안정성과 변경된 온도 활성을 가지고 있는 α-아밀라제 변이체를 확인하기 위하여 중요한 영역을 추출하는 방법
관심의 효소, 본원의 SP722 및 TermamylTM 의 X-선 구조 및/또는 모델 빌드 구조에 대해 분자 역학 시뮬레이션을 수행하였다. 분자 역학 시뮬레이션은 CHARMM 프로그램 (Molecular simulations (MSI)로부터) 또는 예컨대 DISCOVER (MSI 로부터)와 같은 다른 적절한 프로그램을 사용하여 만들었다. 분자 역학 분석은 진공 상태에서, 또는 보다 바람직하게는 결정수를 포함하여, 또는 물속에, 예컨대 물공 또는 물상자안에 삽입된 효소를 사용하여 만든다. 시뮬레이션은 300 피코초 (ps), 또는 그 이상동안, 예컨대 300 내지 1200 ps 동안 작동시킨다. 등방성 변동을 구조들의 CA 탄소에 대하여 예상하고 비교한다. 서열에 결실 및/또는 삽입이 일어난 경우, 다른 구조로부터의 등방성 변동이 삽입되고, 그로써 등방성 변동의 차이는 0 이 된다. 등방성 변동에 대한 설명은 CHARMM 매뉴얼 (MSI 로부터 얻을 수 있음)을 참고한다.
분자 역학 시뮬레이션은 하전가능한 아미노산상에 있는 표준 전하를 사용하여 수행할 수 있다. 이것은 Asp 이고, Glu 는 음으로 하전되며, Lys 과 Arg 은 양으로 하전된다. 이 조건은 대략 7 의 중간 pH 를 닮아있다. 보다 높은 또는 낮은 pH 를 분석하기 위하여, 정상적으로 pH 2 내지 10 사이에 있는 표준 적정가능한 잔기들; Lys, Arg, Asp, Glu, Tyr 및 His 의 변경된 pKa' 를 얻기 위하여 분자의 적정을 수행할 수 있다. 또한 Ser, Thr 및 Cys 은 적정가능하지만, 본원에서는 고려하지 않았다. 본원에서 Asp 와 Glu 두 가지와 같이 설명된 pH 에 기인한 변경된 전하는 높은 pH 에서 음의 전하이고, Arg 과 Lys 두가지는 변화하지 않았다. 이것은 Lys 과 Arg 의 적정이 시작된 곳인 10 내지 11 주변의 pH 를 모방하는데, 이들 잔기의 정상적인 pKa 는 9 내지 11 주위이다.
1. 높은 pH 안정성을 가지고 있는 α-아밀라제 변이체를 확인하기 위한 중요한 영역 추출에 사용된 접근법:
증가된 pH 안정성을 가지고 있는 변이체를 제조하기 위해 중요한 영역들은 극한 pH 에서 가장 높은 이동성을 나타내는 영역, 즉 가장 높은 등방성 변동을 가지고 있는 영역이다.
그러한 영역들은 2 가지의 분자 역학 시뮬레이션을 수행함으로써 확인된다: i) 염기성 아미노산, Lys 및 Arg 이 중성으로 나타나고 (즉 양성자화되지 않음), 산성 아미노산, Asp 와 Glu 이 (-1)의 전하를 가지는 높은 pH 를 작동시킨다; 그리 고 ii) 염기성 아미노산, Lys 및 Arg 이 (+1)의 순 전하를 가지고, 산성 아미노산이 (-1)의 전하를 가지는 중성의 pH 를 작동시킨다.
두가지 작동을 비교하고 중성 pH 분석과 비교하여 높은 pH 에서 상대적으로 더 높은 이동성을 나타내는 영역들을 확인하였다.
일반적인 안정성, 예컨대 수소 결합을 개선시키는 잔기들의 도입은 영역을 더 견고하게 만들고 (프롤린 치환 또는 글리신 잔기의 교체와 같은 돌연변이에 의해), 또는 전하 또는 그것들의 상호작용을 개선시키는 잔기들의 도입은 효소의 높은 pH 안정성을 개선시킨다.
2. 중간 온도에서 증가된 활성을 가지고 있는 α-아밀라제 변이체들을 확인하기 위한 영역을 추출하기 위해 사용된 접근법:
중간 온도에서 증가된 활성을 가지고 있는 변이체들을 제조하기에 중요한 영역들을 SP722 와 Termamyl에서 등방성 변동의 차이, 즉 SP722 - Termamyl CA 등방성 변동으로서 발견하였다. 등방성 변동에서 가장 높은 이동성을 나타내는 영역을 선택하였다. 이들 영역 및 잔기들은 중간 온도에서 활성을 증가시키는 것으로 예상되었다. 알파-아밀라제의 활성은 단지 만약 특정 잔기의 정확한 이동성이 존재하는 경우에만 나타난다. 만약 잔기의 이동성이 너무 느리면 활성은 감소되거나 또는 포기된다.
실시예 3
부모효소와 비교하여 중간 온도에서 증가된 Ca
2+
안정성을 가지고 있는 Termamyl-유사 α-아밀라제 변이체의, 국소화된 무작위, 도프된 돌연변이법에 의한 제조:
낮은 칼슘 농도에서 α-아밀라제의 안정성을 개선시키기 위하여, 예비-선택된 영역에서 무작위 돌연변이법을 수행하였다.
영역: 잔기:
SAI: R181-W189
DOPE 소프트웨어 (재료 및 방법 참조)를 사용하여, 정지코돈의 양을 최소화하는 SA1 영역에서의 각각의 제시된 변화에 대한 강화된 코돈을 결정하였다 (하기 표 1 참조). 뉴클레오티드의 정확한 분포를 코돈의 3 위치에서 계산하여 아미노산 변화의 제시된 군집을 제공하였다. 도프된 영역들을 원하는 잔기를 얻을 수 있는 높은 기회를 가지도록, 그러나 여전히 다른 가능성도 허용되도록 표시된 위치에 특이적으로 도프하였다.
R181 | 72% R, 2% N, 7% Q, 4% H, 4% K, 11% S |
G182 | 73% G, 13% A, 12% S, 2% T |
K185 | 95% K, 5% R |
A186 | 50% A, 4% N, 6% D, 1% E, 1% G, 1% K, 5% S, 31% T |
W187 | 100% W |
D188 | 100% D |
W189 | 92% W, 8% S |
그 결과의 도프된 올리고뉴클레오티드 가닥은 하기 표 2 에 센스 가닥으로서 나타낸다: 야생형 뉴클레오티드 및 아미노산 서열 및 각각의 도프된 위치에 대한 뉴클레오티드의 분포도 함께 나타낸다.
위치 | 181 182 185 186 187 188 189 |
아미노산 서열 | Arg Gly Lys Ala Thr Asp Thr |
Wt 뉴클레오티드 서열 | cga ggt aaa gct tgg gat tgg |
순방향 프라이머 (SEQ ID NO: 15):
FSA: 5'-caa aat cgt atc tac aaa ttc 123 456 a7g 8910 tgg
gat t11g gaa gta gat tcg gaa aat-3'
각각의 도프된 위치에 대한 뉴클레오티드의 분포
1: 35 % A, 65 % C
2: 83 % G, 17 % A
3: 63 % G, 37 % T
4: 86 % G, 14 % A
5: 85 % G, 15 % C
6: 50 % T, 50 % C
7: 95 % A, 5 % G
8: 58 % G, 37 % A, 5 % T
9: 86 % C, 13 % A, 1 % G
10: 83 % T, 17 % G
11: 92 % G, 8 % C
역 프라이머 (SEQ ID NO: 16):
RSA: 5'-gaa ttt gta gat acg att ttg-3'
무작위 돌연변이법
상기 표 2 로부터 나타나는 강화된 올리고뉴클레오티드 (통상적으로 FSA 로 표시됨) 및 SA1 영역에 대한 역 프라이머 RSA 및 SacII 와 DraIII 부위를 덮고 있는 특이한 SEQ ID NO: 2: SP722 프라이머를 사용하여, 중첩 연장 방법 [Horton et al., Gene, 77 (1989), pp. 61-68]에 의하여 21 개의 염기쌍의 중복을 사용하여 PCR-라이브러리-단편을 생성하였다. 플라스미드 pJE1 은 중합효소 연쇄 반응에 대한 주형이다. PCR 단편들을 대장균/Bacillus 셔틀 벡터인 pDork101 (재료 및 방법 참조)에 클론하여, 대장균에서의 돌연변이법과, Bacillus subtilis에서의 즉각적인 발현을 가능하게 하여 대장균에서의 아밀라제의 치명적인 축적을 방지한다. 대장균에 클론된 PCR 단편을 수립한 후에, 변형된 pUC19 단편을 플라스미드로부터 소화시켜 분리해내고, 프로모터 및 돌연변이된 Termamyl 유전자를 물리적으로 연결시키면 Bacillus에서 발현이 일어날 수 있다.
스크리닝
라이브러리는 상기의 "재료 및 방법" 에서 설명된 저 칼슘 필터 검정으로 스크린할 수 있다.
실시예 4
아밀라제 SEQ ID NO: 1 (SP690)의 변이체의 제조
SEQ ID NO:1 로부터의 아밀라제를 암호화하는 유전자를 WO 96/23873 에서 설명된 플라스미드 pTVB106 에 위치시킨다. 아밀라제는 Bacillus subtilis의 구조체에서 amyL 프로모터로부터 발현된다.
단백질의 변이체는 델타(T183-G184)+Y243F+Q391E+K444Q 이다. 이 변이체의 제조는 WO 96/23873 에 설명되어 있다.
메가-프라이머 방법에 의한 델타(T183-G184) + N195F 의 제조는 사카르와 솜머에 의해 설명된 바와 같다 [Sarkar & Sommer, (1990), BioTechniques 8:404-407].
유전자 특이적 프라이머 B1 (SEQ ID NO: 17) 및 돌연변이 유발 프라이머 101458 (SEQ ID NO: 19)을 사용하여 pTVB106-유사 플라스미드 (SEQ ID NO: 1 로부터의 아밀라제를 암호화하는 유전자에 델타(T183-G184) 돌연변이가 있음)로부터 대략 645 bp DNA 단편을 PCR 에 의하여 증폭시켰다.
645 bp 단편을 아가로오스 겔로부터 정제하여, 동일한 주형에 대해 수행된 두 번째 PCR 에서 프라이머 Y2 (SEQ ID NO: 18)와 함께 메가-프라이머로서 사용하였다.
그 결과 생성된 대략 1080 bp 단편을 제한 효소 BstEII 및 AflIII 로 소화시키고, 그 결과의 대략 510 bp DNA 단편을 정제하여 동일한 효소로 소화되어 있는 pTVB106-유사 플라스미드 (SEQ ID NO: 1 로부터의 아밀라제를 암호화하는 유전자에 델타(T183-G184) 돌연변이가 있음)에 결찰시켰다. 경합하는 B. subtilis SHA273 (저수준의 아밀라제 및 프로테아제) 세포를 결찰 결과물로 형질전환시키고, 그 결과의 클로람페니콜 내성 형질전환체를, 플라스미드상에 정확한 돌연변이가 존재하는 지를 증명하기 위하여 DNA 서열결정에 의하여 체크하였다.
프라이머 B1: (SEQ ID NO: 17):
5' CGA TTG CTG ACG CTG TTA TTT GCG 3'
프라이머 Y2: (SEQ ID NO: 18):
5' CTT GTT CCC TTG TCA GAA CCA ATG 3'
프라이머 101458 (SEQ ID NO: 19):
5' GT CAT AGT TGC CGA AAT CTG TAT CGA CTT C 3'
변이체: 델타(T183-G184) + K185R + A186T 의 제조는 돌연변이유발 프라이머로서 101638 을 사용한 것을 제외하고 유사한 방식으로 수행하였다.
프라이머 101638 (SEQ ID NO: 20):
5' CC CAG TCC CAC GTA CGT CCC CTG AAT TTA TAT ATT TTG 3'
변이체: 델타(T183-G184) + A186T, 델타(T183-G184) + A186I, 델타(T183-G184) + A186S, 델타(T183-G184) + A186N 을 유사한 방법에 의하여 제조하였다. 단, 클로닝 목적에 대하여 주형으로서 및 벡터로서 pTVB106-유사 플라스미드 (변이체 델타(T183-G184) + K185R+A186T 를 포함하고 있음)를 사용하였다. 돌연변이유발 올리고뉴클레오티드 (올리고 1)는 다음과 같다:
5' CC CAG TCC CAG NTCTTT CCC CTG AAT TTA TAT ATT TTG 3' (SEQ ID NO: 21)
상기에서 N 은 뮤타제니콜리 (mutagenicoli)-고뉴클레오티드의 합성에 사용된 4 가지 염기: A, C, G, 및 T 의 혼합물이다. 형질전환체들의 서열결정으로 성숙한 아밀라제의 아미노산 위치 186 에 대한 정확한 코돈을 확인한다.
변이체: 델타(T183-G184) + K185R+A186T+N195F 는 다음과 같이 제조하였다:
프라이머 x2 (SEQ ID NO: 22) 와 프라이머 101458 (SEQ ID NO: 19)을 사용하 여 pTVB106-유사 플라스미드 (델타(T183-G184) + K185R+A186T 돌연변이를 가지고 있음)상에서 PCR 을 수행한다. 그 결과의 DNA 단편을 프라이머 Y2 (SEQ ID NO: 18)와 함께 메가-프라이머로서, pTVB106-유사 플라스미드 (델타(T183-G184) + N195 돌연변이를 가지고 있음)상에서 PCR 을 수행하는데 사용하였다. 두 번째 PCR 의 생성물을 제한 엔도뉴클레아제 Acc65I 과 AflIII 으로 소화시켜서 동일한 효소로 소화시켜놓은 pTVB106-유사 플라스미드 (델타(T183-G184) + N195F 돌연변이를 가지고 있음)에 클론하였다.
프라이머 x2: (SEQ ID NO: 22)
5' GCG TGG ACA AAG TTT GAT TTT CCT G 3'
변이체: 델타(T183-G184) + K185R+A186T+N195F+Y243F+Q391E+K444Q 는 다음과 같이 제조하였다:
프라이머 x2 및 프라이머 101458 을 사용하여 pTVB106-유사 플라스미드 (델타(T183-G184) + K185R+A186T 돌연변이를 가지고 있음)상에서 PCR 을 수행한다. 그 결과의 DNA 단편을 프라이머 Y2 와 함께 메가-프라이머로서, pTVB106-유사 플라스미드 (델타(T183-G184) + Y243F+Q391E+K444Q 돌연변이를 가지고 있음)상에서 PCR 을 수행하는데 사용하였다. 두 번째 PCR 의 생성물을 제한 엔도뉴클레아제 Acc65I 과 AflIII 으로 소화시켜서 동일한 효소로 소화시켜놓은 pTVB106-유사 플라스미드 (델타(T183-G184) + Y243F+Q391E+K444Q 돌연변이를 가지고 있음)에 클론하였다.
실시예 5
부모 SP722 α-아밀라제 (SEQ ID NO: 2)에서 부위-특정된 α-아밀라제 변이체의 제조
아밀라제 SEQ ID NO: 2 (SP722)의 변이체의 제조는 다음 설명과 같이 수행한다.
SEQ ID NO: 2 로부터의 아밀라제를 암호화하는 유전자를 WO 96/23873 에 설명되어 있는 플라스미드 pTVB112 에 위치시킨다. 아밀라제는 B. subtilis에서 이 구조체에 있는 amyL 프로모터로부터 발현된다.
메가-프라이머 방법에 의한 델타(D183-G184) + V56I 의 제조는 사카르와 솜머에 의해 설명된 바와 같다 [Sarkar & Sommer, 1990, BioTechniques 8:404-407].
유전자 특이적 프라이머 DA03 과 돌연변이 유발 프라이머 DA07 을 사용하여, pTVB112-유사 플라스미드 (SEQ ID NO: 2 에 도시된 α-아밀라제를 암호화하는 유전자에 델타(D183-G184) 돌연변이를 가지고 있음)로부터의 대략 820 bp 의 DNA 단편을 PCR 에 의하여 증폭시켰다.
820 bp 의 단편을 아가로오스 겔로부터 정제하여, 동일한 주형상에서 수행되는 두 번째 PCR 에서 프라이머 DA01 과 함께 메가-프라이머로서 사용한다.
그 결과의 대략 920 bp 의 단편을 제한 효소 NgoM I 및 Aat II 로 소화시키고, 그 결과 생성된 대략 170 bp 의 DNA 단편을 정제한 다음, 동일한 효소로 소화시켜 놓은 pTVB112-유사 플라스미드 (SEQ ID NO: 2 에 도시된 아밀라제를 암호화하는 유전자에 델타(D183-G184) 돌연변이가 있음)와 결찰시켰다. 경합하는 B. subtilis SHA273 (저수준의 아밀라제 및 프로테아제) 세포를 결찰물로 형질전환시 키고, 생성된 클로람페니콜 내성 형질전환체를, 플라스미드상에서의 정확한 돌연변이의 존재를 증명하기 위하여 DNA 서열결정에 의하여 조사하였다.
프라이머 DA01 (SEQ ID NO: 23):
5' CCTAATGATGGGAATCACTGG 3'
프라이머 DA03 (SEQ ID NO: 24):
5' GCATTGGATGCTTTTGAACAACCG 3'
프라이머 DA07 (SEQ ID NO: 25):
5' CGCAAAATGATATCGGGTATGGAGCC 3'
변이체: 델타(D183-G184) + K108L, 델타(D183-G184) + K108Q, 델타(D183-G184) + K108E, 델타(D183-G184) + K108V 를 사카르와 솜머에 의하여 설명된 바와 같이 메가-프라이머 방법에 의하여 제조하였다 [Sarkar and Sommer, 1990, BioTechniques 8:404-407]:
프라이머 DA03 및 돌연변이법 프라이머 DA20 을 사용하여 pTVB112-유사 플라스미드 (델타(D183-G184) 돌연변이를 가지고 있음)상에서 PCR 을 수행한다. 그 결과의 DNA 단편을, pTVB112-유사 플라스미드 (델타(D183-G184) 돌연변이를 가지고 있음)상에서의 PCR 에 프라이머 DA01 과 함께 메가-프라이머로서 사용한다. 두 번째 PCR 의 대략 920 bp 생성물을 제한 엔도뉴클레아제 Aat II 및 Mlu I 로 소화시키고, 동일한 효소로 소화시켜놓은 pTVB112-유사 플라스미드 (델타(D183-G184) 돌연변이를 가지고 있음)에 클론하였다.
프라이머 DA20 (SEQ ID NO: 26):
5' GTGATGAACCACSWAGGTGGAGCTGATGC 3'
상기에서 S 는 돌연변이 유발 올리고뉴클레오티드의 합성에 사용된 두 가지 염기: C 와 G 의 혼합물을 나타내고, W 는 돌연변이 유발 올리고뉴클레오티드의 합성에 사용된 두 가지 염기: A 와 T 의 혼합물을 나타낸다.
형질전환체의 서열결정으로 성숙한 아밀라제의 아미노산 위치 108 에 대한 정확한 코돈을 확인한다.
변이체: 델타(D183-G184) + D168A, 델타(D183-G184) + D168I, 델타(D183-G184) + D168V, 델타(D183-G184) + D168T 의 제조를 돌연변이유발 프라이머DA14 를 사용한 것을 제외하고는 유사한 방식으로 수행한다.
프라이머 DA14 (SEQ ID NO: 27):
5' GATGGTGTATGGRYCAATCACGACAATTCC 3'
상기에서 R 은 돌연변이 유발 올리고뉴클레오티드의 합성에 사용된 두 가지 염기: A 와 G 의 혼합물을 나타내고, Y 는 돌연변이 유발 올리고뉴클레오티드의 합성에 사용된 두 가지 염기: C 와 T 의 혼합물을 나타낸다.
형질전환체의 서열결정으로 성숙한 아밀라제의 아미노산 위치 108 에 대한 정확한 코돈을 확인한다.
변이체: 델타(D183-G184) + Q169N 의 제조는 돌연변이 유발 프라이머 DA15 를 사용한 것을 제외하고 유사한 방식으로 수행한다.
프라이머 DA15 (SEQ ID NO: 28):
5' GGTGTATGGGATAACTCACGACAATTCC 3'
변이체: 델타(D183-G184) + Q169L 의 제조는 돌연변이 유발 프라이머 DA16 을 사용한 것을 제외하고 유사한 방식으로 수행한다.
프라이머 DA16 (SEQ ID NO: 29):
5' GGTGTATGGGATCTCTCACGACAATTCC 3'
변이체: 델타(D183-G184) + Q172N 의 제조는 돌연변이 유발 프라이머 DA17 을 사용한 것을 제외하고 유사한 방식으로 수행한다.
프라이머 DA17 (SEQ ID NO: 30):
5' GGGATCAATCACGAAATTTCCAAAATCGTATC 3'
변이체: 델타(D183-G184) + Q172L 의 제조는 돌연변이 유발 프라이머 DA18 을 사용한 것을 제외하고 유사한 방식으로 수행한다.
프라이머 DA18 (SEQ ID NO: 31):
5' GGGATCAATCACGACTCTTCCAAAATCGTATC 3'
변이체: 델타(D183-G184) + L201I 의 제조는 돌연변이 유발 프라이머 DA06 을 사용한 것을 제외하고 유사한 방식으로 수행한다.
프라이머 DA06 (SEQ ID NO: 32):
5' GGAAATTATGATTATATCATGTATGCAGATGTAG 3'
변이체: 델타(D183-G184) + K269S 의 제조는 돌연변이 유발 프라이머 DA09 를 사용한 것을 제외하고 유사한 방식으로 수행한다.
프라이머 DA09 (SEQ ID NO: 33):
5' GCTGAATTTTGGTCGAATGATTTAGGTGCC 3'
변이체: 델타(D183-G184) + K269Q 의 제조는 돌연변이 유발 프라이머 DA11 을 사용한 것을 제외하고 유사한 방식으로 수행한다.
프라이머 DA11 (SEQ ID NO: 34):
5' GCTGAATTTTGGTCGAATGATTTAGGTGCC 3'
변이체: 델타(D183-G184) + N270Y 의 제조는 돌연변이 유발 프라이머 DA21 을 사용한 것을 제외하고 유사한 방식으로 수행한다.
프라이머 DA21 (SEQ ID NO: 35):
5' GAATTTTGGAAGTACGATTTAGGTCGG 3'
변이체: 델타(D183-G184) + L272A, 델타(D183-G184) + L272I, 델타(D183-G184) + L272V, 델타(D183-G184) + L272T 의 제조는 돌연변이 유발 프라이머 DA12 를 사용한 것을 제외하고 유사한 방식으로 수행한다.
프라이머 DA12 (SEQ ID NO: 36):
5' GGAAAAACGATRYCGGTGCCTTGGAGAAC 3'
상기에서 R 은 돌연변이 유발 올리고뉴클레오티드의 합성에 사용된 두 가지 염기: A 와 G 의 혼합물을 나타내고, Y 는 돌연변이 유발 올리고뉴클레오티드의 합성에 사용된 두 가지 염기: C 와 T 의 혼합물을 나타낸다.
형질전환체의 서열결정으로 성숙한 아밀라제의 아미노산 위치 272 에 대한 정확한 코돈을 확인한다.
변이체: 델타(D183-G184) + L275A, 델타(D183-G184) + L275I, 델타(D183-G184) + L275V, 델타(D183-G184) + L275T 의 제조는 돌연변이 유발 프라이머 DA13 을 사용한 것을 제외하고 유사한 방식으로 수행한다.
프라이머 DA13 (SEQ ID NO: 37):
5' GATTTAGGTGCCTRYCAGAACTATTTA 3'
상기에서 R 은 돌연변이 유발 올리고뉴클레오티드의 합성에 사용된 두 가지 염기: A 와 G 의 혼합물을 나타내고, Y 는 돌연변이 유발 올리고뉴클레오티드의 합성에 사용된 두 가지 염기: C 와 T 의 혼합물을 나타낸다.
형질전환체의 서열결정으로 성숙한 아밀라제의 아미노산 위치 275에 대한 정확한 코돈을 확인한다.
변이체: 델타(D183-G184) + Y295E 의 제조는 돌연변이 유발 프라이머 DA08 을 사용한 것을 제외하고 유사한 방식으로 수행한다.
프라이머 DA08 (SEQ ID NO: 38):
5' CCCCCTTCATGAGAATCTTTATAACG 3'
메가-프라이머 방법에 의한 델타(D183-G184) + K446Q 의 제조는 사카르와 솜머에 의해 설명된 바와 같다 [Sarkar and Sommer, 1990, BioTechniques 8:404-407]:
중지-코돈 및 돌연변이 유발 프라이머 DA10 에 대하여 214 내지 231 bp 아래쪽에 어닐링되어 있는 유전자 특이적 프라이머 DA04 를 사용하여 pTVB112-유사 플라스미드 (SEQ ID NO: 2 에 도시된 아밀라제를 암호화하는 유전자에 델타(D183-G184) 돌연변이를 가지고 있음)로부터 얻어지는 대략 350 bp 의 DNA 단편을 PCR 에 의하여 증폭시켰다.
그 결과의 DNA 단편을, pTVB112-유사 플라스미드 (델타(D183-G184) 돌연변이를 가지고 있음)상에서의 PCR 에 프라이머 DA05 와 함께 메가-프라이머로서 사용한다. 두 번째 PCR 의 대략 460 bp 생성물을 제한 엔도뉴클레아제 SnaB I 및 Not I 으로 소화시키고, 동일한 효소로 소화시켜놓은 pTVB112-유사 플라스미드 (델타(D183-G184) 돌연변이를 가지고 있음)에 클론하였다.
프라이머 DA04 (SEQ ID NO: 39):
5' GAATCCGAACCTCATTACACATTCG 3'
프라이머 DA05 (SEQ ID NO: 40):
5' CGGATGGACTCGAGAAGGAAATACCACG 3'
프라이머 DA10 (SEQ ID NO: 41):
5' CGTAGGGCAAAATCAGGCCGGTCAAGTTTGG 3'
변이체: 델타(D183-G184) + K458R 의 제조를 돌연변이 유발 프라이머 DA22 를 사용한 것을 제외하고 유사한 방식으로 수행한다.
프라이머 DA22 (SEQ ID NO: 42):
5' CATAACTGGAAATCGCCCGGGAACAGTTACG 3'
변이체: 델타(D183-G184) + P459S 및 델타(D183-G184) + P459T 의 제조를 돌연변이 유발 프라이머 DA19 를 사용한 것을 제외하고 유사한 방식으로 수행한다.
프라이머 DA19 (SEQ ID NO: 43):
5' CTGGAAATAAAWCCGGAACAGTTACG 3'
상기에서 W 는 돌연변이 유발 올리고뉴클레오티드의 합성에 사용된 두 개의 염기: A 와 T 의 혼합물이다.
형질전환체의 서열결정으로 성숙한 아밀라제의 아미노산 위치 459 에 대한 정확한 코돈을 확인한다.
변이체: 델타(D183-G184) + T461P 의 제조를 돌연변이 유발 프라이머 DA23 을 사용한 것을 제외하고 유사한 방식으로 수행한다.
프라이머 DA23 (SEQ ID NO: 44):
5' GGAAATAAACCAGGACCCGTTACGATCAATGC 3'
변이체: 델타(D183-G184) + K142R 의 제조를 돌연변이 유발 프라이머 DA32 를 사용한 것을 제외하고 유사한 방식으로 수행한다.
프라이머 DA32 (SEQ ID NO: 45):
5' GAGGCTTGGACTAGGTTTGATTTTCCAG 3'
변이체: 델타(D183-G184) + K269R 의 제조를 돌연변이 유발 프라이머 DA31 을 사용한 것을 제외하고 유사한 방식으로 수행한다.
프라이머 DA31 (SEQ ID NO: 46):
5' GCTGAATTTTGGCGCAATGATTTAGGTGCC 3'
실시예 6
부모 Termamyl α-아밀라제 (SEQ ID NO: 4)에서의 부위-특정된 α-아밀라아
제 변이체의 제조
Termamyl α-아밀라제를 암호화하는 amyL 유전자를 WO 95/10603 (Novo Nordisk)에서 설명된 플라스미드 pDN1528 에 위치시킨다. 각각 N265R 과 N265D 의 치환을 포함하고 있는 상기 부모 α-아밀라제의 변이체들을 WO 97/41213 에 기재되어 있는 방법에 의하여 또는 상술한 "메가-프라이머" 접근법에 의하여 제조한다.
돌연변이 유발 올리고뉴클레오티드는 다음과 같다:
N265R 치환에 대한 프라이머 bl1:
5' PCC AGC GCG CCT AGG TCA CGC TGC CAA TAT TCA G (SEQ ID NO: 56)
N265D 치환에 대한 프라이머 bl2:
5' PCC AGC GCG CCT AGG TCA TCC TGC CAA TAT TCA G (SEQ ID NO: 57)
상기에서 P 는 포스페이트 기를 나타낸다.
실시예 7
SEQ ID NO: 2 에 도시된 아미노산 서열을 가지고 있는 부모 α-아밀라제의 변이체들의 알칼리성 pH 에서의 pH 안정성의 측정
이 일련의 분석에서는 정제된 효소 샘플을 사용하였다. 측정은 pH 10.5 로 조정된 100 mM 의 CAPS 완충액중의 각각의 변이체들의 용액을 사용하여 수행하였다. 용액을 75 ℃ 에서 인큐베이션하였다.
20 분 및 30 분동안 인큐베이션한 후에 잔여 활성을 PNP-G7 검정 (상기의 "재료 및 방법" 단원에서 설명됨)을 사용하여 측정하였다. 샘플중의 잔여 활성을 브리톤 로빈슨 완충액 pH 7.3 을 사용하여 측정하였다. 잔여 활성의 감소는, 높은 pH 및 75 ℃ 에서 인큐베이션되지 않은, 0 분에서의 동일한 효소의 상응하는 대조 용액과 관련하여 측정하였다.
함수로서의 초기 활성의 백분율을 부모효소 (SEQ ID NO: 2)에 대하여 및 의 문의 대상인 변이체들에 대하여 각각 하기 표에 나타낸다.
변이체 | 20 분후의 잔여 활성 | 30 분후의 잔여 활성 |
△(D183-G184)+M323L | 56 % | 44 % |
△(D183-G184)+M323L+R181S | 67 % | 55 % |
△(D183-G184)+M323L+A186T | 62 % | 50 % |
다른 일련의 분석에서는 배양 상층액을 사용하였다. 측정은 pH 10.5 로 조정된 100 mM CAPS 완충액중의 각각의 변이체의 용액을 사용하여 수행하였다. 용액을 80 ℃ 에서 인큐베이션하였다.
30 분동안 인큐베이션한 후에 잔여 활성을 파데바스 검정 (상기의 "재료 및 방법" 단원에서 설명됨)을 사용하여 측정하였다. 샘플중의 잔여 활성을 브리톤 로빈슨 완충액 pH 7.3 을 사용하여 측정하였다. 잔여 활성의 감소는, 높은 pH 및 80 ℃ 에서 인큐베이션되지 않은, 0 분에서의 동일한 효소의 상응하는 대조 용액과 관련하여 측정하였다.
함수로서의 초기 활성의 백분율을 부모효소 (SEQ ID NO: 2)에 대하여 및 의문의 대상인 변이체들에 대하여 각각 하기 표에 나타낸다.
변이체 | 30 분 후의 잔여 활성 |
△(D183-G184) | 4 % |
△(D183-G184) + P459T | 25 % |
△(D183-G184) + K458R | 31 % |
△(D183-G184) + K311R | 10 % |
실시예 8
SEQ ID NO: 1, SEQ ID NO: 2 및 SEQ ID NO: 4 에 도시된 아미노산 서열을 가지고 있는 부모 α-아밀라제의 변이체들의 알칼리성 pH 에서의 칼슘 안정성의 측정
A: SEQ ID NO: 1 의 서열의 변이체들의 칼슘 안정성
측정은 최종 농도 2400 ppm 으로 폴리포스페이트가 첨가되어 있고 (시간 t=0), pH 10.5 로 조정된 100 mM CAPS 완충액중의 각각의 변이체들의 용액을 사용하여 수행하였다. 용액을 50 ℃ 에서 인큐베이션하였다.
20 분 및 30 분동안 인큐베이션한 후에 잔여 활성을 PNP-G7 검정 (상술된 바와 같음)을 사용하여 측정하였다. 샘플중의 잔여 활성을 브리톤 로빈슨 완충액 pH 7.3 을 사용하여 측정하였다. 잔여 활성의 감소는, 높은 pH 및 50 ℃ 에서 인큐베이션되지 않은, 0 분에서의 동일한 효소의 상응하는 대조 용액과 관련하여 측정하였다.
함수로서의 초기 활성의 백분율을 부모효소 (SEQ ID NO: 1)에 대하여 및 의문의 대상인 변이체들에 대하여 각각 하기 표에 나타낸다.
변이체 | 20 분후의 잔여활성 | 30 분후의 잔여활성 |
△(T183-G184) | 32 % | 19 % |
△(T183-G184)+A186T | 36 % | 23 % |
△(T183-G184)+K185R+A186T | 45 % | 29 % |
△(T183-G184)+A186T | 35 % | 20 % |
△(T183-G184)+N195F | 44 % | n.d. |
n.d. = 측정하지 않음.
B: SEQ ID NO: 2 의 서열의 변이체들의 칼슘 안정성
이 일련의 분석에서는 효소의 정제된 샘플을 사용하였다. 측정은 최종 농도 2400 ppm 으로 폴리포스페이트가 첨가되어 있고 (시간 t=0), pH 10.5 로 조정된 100 mM CAPS 완충액중의 각각의 변이체들의 용액을 사용하여 수행하였다. 용액을 50 ℃ 에서 인큐베이션하였다.
20 분 및 30 분동안 인큐베이션한 후에 잔여 활성을 PNP-G7 검정 (상술된 바와 같음)을 사용하여 측정하였다. 샘플중의 잔여 활성을 브리톤 로빈슨 완충액 pH 7.3 을 사용하여 측정하였다. 잔여 활성의 감소는, 높은 pH 및 50 ℃ 에서 인큐베이션되지 않은, 0 분에서의 동일한 효소의 상응하는 대조 용액과 관련하여 측정하였다.
함수로서의 초기 활성의 백분율을 부모효소 (SEQ ID NO: 2)에 대하여 및 의문의 대상인 변이체들에 대하여 각각 하기 표에 나타낸다.
변이체 | 20 분후의 잔여 활성 | 30 분후의 잔여 활성 |
△(D183-G184)+M323L | 21 % | 13 % |
△(D183-G184)+M323L+R181S | 32 % | 19 % |
△(D183-G184)+M323L+A186T | 28 % | 17 % |
△(D183-G184)+M323L+A186R | 30 % | 18 % |
변이체 | 20 분후의 잔여 활성 | 30 분후의 잔여 활성 |
△(D183-G184) | 30 % | 20 % |
△(D183-G184)+N195F | 55 % | 44 % |
이 일련의 분석에서는 배양 상층액을 사용하였다. 측정은 최종 농도 2400 ppm 으로 폴리포스페이트가 첨가되어 있고 (시간 t=0), pH 10.5 로 조정된 100 mM CAPS 완충액중의 각각의 변이체들의 용액을 사용하여 수행하였다. 용액을 50 ℃ 에서 인큐베이션하였다.
30 분동안 인큐베이션한 후에 잔여 활성을 상술된 바와 같은 파데바스 검정을 사용하여 측정하였다. 샘플중의 잔여 활성을 브리톤 로빈슨 완충액 pH 7.3 을 사용하여 측정하였다. 잔여 활성의 감소는, 높은 pH 및 50 ℃ 에서 인큐베이션되지 않은, 0 분에서의 동일한 효소의 상응하는 대조 용액과 관련하여 측정하였다.
함수로서의 초기 활성의 백분율을 부모효소 (SEQ ID NO: 2)에 대하여 및 의문의 대상인 변이체들에 대하여 각각 하기 표에 나타낸다.
변이체 | 30 분 후의 잔여 활성 |
△(D183-G184) | 0 % |
△(D183-G184)+P459T | 19 % |
△(D183-G184)+K458R | 18 % |
△(D183-G184)+T461P | 13 % |
△(D183-G184)+E346Q+K385R | 4 % |
C: SEQ ID NO: 4 의 서열의 변이체들의 칼슘 안정성
측정은 최종 농도 2400 ppm 으로 폴리포스페이트가 첨가되어 있고 (시간 t=0), pH 10.5 로 조정된 100 mM CAPS 완충액중의 각각의 변이체들의 용액을 사용하여 수행하였다. 용액을 60 ℃ 에서 20 분동안 인큐베이션하였다.
20 분동안 인큐베이션한 후에 잔여 활성을 PNP-G7 검정 (상술된 바와 같음)을 사용하여 측정하였다. 샘플중의 잔여 활성을 브리톤 로빈슨 완충액 pH 7.3 을 사용하여 측정하였다. 잔여 활성의 감소는, 높은 pH 및 60 ℃ 에서 인큐베이션되지 않은, 0 분에서의 동일한 효소의 상응하는 대조 용액과 관련하여 측정하였다.
함수로서의 초기 활성의 백분율을 부모효소 (SEQ ID NO: 4)에 대하여 및 의문의 대상인 변이체들에 대하여 각각 하기 표에 나타낸다.
변이체 | 20 분 후의 잔여 활성 |
Termamyl (SEQ ID NO: 4) | 17 % |
N265R | 28 % |
N265D | 25 % |
실시예 9
SEQ ID NO: 1 에 도시된 아미노산 서열을 가지고 있는 α-아밀라제의 중간
온도에서의 활성 측정
A: SEQ ID NO: 1 의 서열의 변이체들의 α-아밀라제 활성
측정은 pH 7.3 으로 조정된 50 mM 의 브리톤 로빈슨 완충액중의 각각의 변이체들의 용액과 상술된 바와 같은 파데바스 검정을 사용하여 수행하였다. 샘플중의 활성은 50 mM 의 브리톤 로빈슨 완충액 pH 7.3 을 사용하여 37 ℃ 에서, 그리고 50 mM 의 CAPS 완충액 pH 10.5 를 사용하여 25 ℃ 에서 측정하였다.
온도 의존성 활성 및 37 ℃ 에서의 활성에 대한 25 ℃ 에서의 활성의 백분율을 부모효소 (SEQ ID NO: 1)에 대하여 및 의문의 대상인 변이체들에 대하여 각각 하기 표에 나타낸다.
변이체 | NU/mg, 25 ℃ | NU/mg, 37 ℃ | NU(25 ℃)/NU(37 ℃) |
SP690 | 1440 | 35000 | 4.1 % |
△(T183-G184) | 2900 | 40000 | 7.3 % |
△(T183-G184)+K269S | 1860 | 12000 | 15.5 % |
△(Q174) | 3830 | 38000 | 7.9 % |
다른 측정을 pH 7.3 으로 조정된 50 mM 의 브리톤 로빈슨 완충액중의 각각의 변이체들의 용액과 상술된 바와 같은 파데바스 검정을 사용하여 수행하였다. 샘플중의 활성은 50 mM 의 브리톤 로빈슨 완충액 pH 7.3 을 사용하여 37 ℃ 및 50 ℃ 에서 측정하였다.
온도 의존성 활성 및 50 ℃ 에서의 활성에 대한 37 ℃ 에서의 활성의 백분율을 부모효소 (SEQ ID NO: 1)에 대하여 및 의문의 대상인 변이체들에 대하여 각각 하기 표에 나타낸다.
변이체 | NU/mg, 37 ℃ | NU/mg, 50 ℃ | NU(37 ℃)/NU(50 ℃) |
SP690 (SEQ ID NO: 1) | 13090 | 21669 | 60 % |
K269Q | 7804 | 10063 | 78 % |
B: SEQ ID NO: 2 의 서열의 변이체들의 α-아밀라제 활성
측정을 pH 7.3 으로 조정된 50 mM 의 브리톤 로빈슨 완충액중의 각각의 변이체들의 용액과 상술된 바와 같은 파데바스 검정을 사용하여 수행하였다. 샘플중의 활성은 50 mM 의 브리톤 로빈슨 완충액 pH 7.3 을 사용하여 25 ℃ 및 37 ℃ 에서 모두 측정하였다.
온도 의존성 활성 및 37 ℃ 에서의 활성에 대한 25 ℃ 에서의 활성의 백분율을 부모효소 (SEQ ID NO: 2)에 대하여 및 의문의 대상인 변이체들에 대하여 각각 하기 표에 나타낸다.
변이체 | NU/mg, 25 ℃ | NU/mg, 37 ℃ | NU(25 ℃)/NU(37 ℃) |
△(D183-G184)+M323L | 3049 | 10202 | 30 % |
△(D183-G184)+M323L+R181S | 18695 | 36436 | 51 % |
C: SEQ ID NO: 4 의 서열의 변이체들의 α-아밀라제 활성
측정을 pH 7.3 으로 조정된 50 mM 의 브리톤 로빈슨 완충액중의 각각의 변이체들의 용액과 상술된 바와 같은 파데바스 검정을 사용하여 수행하였다. 샘플중의 활성은 50 mM 의 브리톤 로빈슨 완충액 pH 7.3 을 사용하여 37 ℃ 에서, 그리고 50 mM 의 CAPS pH 10.5 완충액을 사용하여 60 ℃ 에서 모두 측정하였다.
온도 의존성 활성 및 60 ℃ 에서의 활성에 대한 37 ℃ 에서의 활성의 백분율을 부모효소 (SEQ ID NO: 4)에 대하여 및 의문의 대상인 변이체들에 대하여 각각 하기 표에 나타낸다.
변이체 | NU/mg, 37 ℃ | NU/mg, 60 ℃ | NU(37 ℃)/NU(60 ℃) |
Termamyl | 7400 | 4350 | 170 % |
Q264S | 10000 | 4650 | 215 % |
실시예 10
부모 하이브리드 BAN:1-300/Termamyl:301-483 α-아밀라제의 변이체의 제조
플라스미드 pTVB191 은 B. subtilis에서 작용할 수 있는 복제원점 및 클로람페니콜 내성을 부여하는 cat 유전자 뿐만 아니라 하이브리드 α-아밀라제 BAN:1-300/Termamyl:301-483 을 암호화하는 유전자를 함유하고 있다.
변이체 BM4 (F290E)를 주형으로서 pTVB191 을 사용하여 메가프라이머 접근법 (Sarkar and Sommer, 1990)을 사용하여 제조하였다.
프라이머 p1 (SEQ ID NO: 52) 및 돌연변이 유발 올리고뉴클레오티드 bm4 (SEQ ID NO: 47)를 사용하여 표준 조건하에서 중합효소 연쇄 반응 (PCR)으로 444 bp 의 단편을 증폭시켰다.
이 단편을 아가로오스 겔로부터 정제하여 프라이머 p2 (SEQ ID NO: 53)와 함께 두 번재 PCR 에서 "메가프라이머" 로서 사용하여 531 bp 의 단편을 생성하였다. 이 단편을 제한 엔도뉴클레아제 HinDIII 및 TthlllI 로 소화시켰다. 이렇게 하여 생성된 389 bp 의 단편을 동일한 두 개의 효소로 절단하여 놓은 플라스미드 pTVB191 에 결찰시켰다. 그 결과의 플라스미드를 B. subtilis SHA273 에 형질전환하였다. 불용성 녹말 뿐만이 아니라 클로람페니콜을 함유하고 있는 플레이트상에서 형질전환체를 성장시킴으로써 클로람페니콜 내성 콜로니들을 선택하였다. 활성 α-아밀라제를 발현하는 클론들을, 플레이트를 요오드 증기로 염색한 후에 주변에 무리 (halo)를 형성한 클론들을 선택함으로써 분리하였다. 도입된 돌연변이의 주체(identity)는 DNA 서열결정에 의하여 확인하였다.
변이체 BM5 (F290K), BM6 (F290A), BM8 (Q360E) 및 BM11 (N102D)을 유사한 방식으로 제조하였다. 이것들의 제조를 위한 자세한 사항은 다음과 같다.
변이체: BM5 (F290K)
돌연변이 유발 올리고뉴클레오티드: bm5 (SEQ ID NO: 48)
프라이머 (첫 번째 PCR): p1 (SEQ ID NO: 52)
그 결과 생성된 단편의 크기: 444 bp
프라이머 (두 번째 PCR): p2 (SEQ ID NO: 53)
제한 엔도뉴클레아제: HinDIII, TthlllI
절단된 단편의 크기: 389 bp
변이체: BM6 (F290A)
돌연변이 유발 올리고뉴클레오티드: bm6 (SEQ ID NO: 49)
프라이머 (첫 번째 PCR): p1 (SEQ ID NO: 52)
그 결과 생성된 단편의 크기: 444 bp
프라이머 (두 번째 PCR): p2 (SEQ ID NO: 53)
제한 엔도뉴클레아제: HinDIII, TthlllI
절단된 단편의 크기: 389 bp
변이체: BM8 (Q360E)
돌연변이 유발 올리고뉴클레오티드: bm8 (SEQ ID NO: 50)
프라이머 (첫 번째 PCR): p1 (SEQ ID NO: 52)
그 결과 생성된 단편의 크기: 230 bp
프라이머 (두 번째 PCR): p2 (SEQ ID NO: 53)
제한 엔도뉴클레아제: HinDIII, TthlllI
절단된 단편의 크기: 389 bp
변이체: BM11(N102D)
돌연변이 유발 올리고뉴클레오티드: bm11 (SEQ ID NO: 51)
프라이머 (첫 번째 PCR): p3 (SEQ ID NO: 54)
그 결과 생성된 단편의 크기: 577 bp
프라이머 (두 번째 PCR): p4 (SEQ ID NO: 55)
제한 엔도뉴클레아제: HinDIII, PvuI
절단된 단편의 크기: 576 bp
돌연변이 유발 올리고뉴클레오티드:
bm4 (SEQ ID NO: 47): F290E
프라이머 5' GTG TTT GAC GTC CCG CTT CAT GAG AAT TTA CAG G
bm5 (SEQ ID NO: 48): F290K
프라이머 5' GTG TTT GAC GTC CCG CTT CAT AAG AAT TTA CAG G
bm6 (SEQ ID NO: 49): F290A
프라이머 5' GTG TTT GAC GTC CCG CTT CAT GCC AAT TTA CAG G
bm8 (SEQ ID NO: 50): Q360E
프라이머 5' AGG GAA TCC GGA TAC CCT GAG GTT TTC TAC GG
bm11 (SEQ ID NO: 51): N102D
프라이머 5' GAT GTG GTT TTG GAT CAT AAG GCC GGC GCT GAT G
다른 프라이머:
p1: 5' CTG TTA TTA ATG CCG CCA AAC C (SEQ ID NO: 52)
p2: 5' G GAA AAG AAA TGT TTA CGG TTG CG (SEQ ID NO: 53)
p3: 5' G AAA TGA AGC GGA ACA TCA AAC ACG (SEQ ID NO: 54)
p4: 5' GTA TGA TTT AGG AGA ATT CC (SEQ ID NO: 55)
실시예 11
부모 BAN:1-300/Termamyl:301-483 하이브리드 α-아밀라제의 변이체들의
알칼리성 pH 에서의 α-아밀라제 활성
측정을 각각의 효소에 대한 용액 및 파데바스 검정 (상술된 바와 같음)을 사용하여 수행하였다. 활성을 NaOH 에 의해 표시된 pH 로 조정된 50 mM 의 브리톤-로빈슨 완충액중에서 15 분동안 30 ℃ 에서 인큐베이션한 후에 측정하였다.
NU/mg 효소 | ||||||
pH | wt | Q360E | F290A | F290K | F290E | N102D |
8.0 | 5300 | 7800 | 8300 | 4200 | 6600 | 6200 |
9.0 | 1600 | 2700 | 3400 | 2100 | 1900 | 1900 |
인용문헌
SEQUENCE LISTING
(1) GENERAL INFORMATION:
(i) APPLICANT:
(A) NAME: NOVO NORDISK A/S
(B) STREET: Novo Alle
(C) CITY: DK-2880 Bagsvaerd
(E) COUNTRY: Denmark
(F) POSTAL CODE (ZIP): DK-2880
(G) TELEPHONE: +45 44 44 88 88
(H) TELEFAX: +45 44 49 60 80
(ii) TITLE OF INVENTION: (-amylase mutants
(iii) NUMBER OF SEQUENCES: 58
(iv) COMPUTER READABLE FORM:
(A) MEDIUM TYPE: Floppy disk
(B) COMPUTER: IBM PC compatible
(C) OPERATING SYSTEM: PC-DOS/MS-DOS
(D) SOFTWARE: PatentIn Release #1.0, Version #1.25 (EPO)
(2) INFORMATION FOR SEQ ID NO: 1:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 485 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 1:
His His Asn Gly Thr Asn Gly Thr Met Met Gln Tyr Phe Glu Trp Tyr
1 5 10 15
Leu Pro Asn Asp Gly Asn His Trp Asn Arg Leu Arg Asp Asp Ala Ala
20 25 30
Asn Leu Lys Ser Lys Gly Ile Thr Ala Val Trp Ile Pro Pro Ala Trp
35 40 45
Lys Gly Thr Ser Gln Asn Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr
50 55 60
Asp Leu Gly Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly
65 70 75 80
Thr Arg Asn Gln Leu Gln Ala Ala Val Thr Ser Leu Lys Asn Asn Gly
85 90 95
Ile Gln Val Tyr Gly Asp Val Val Met Asn His Lys Gly Gly Ala Asp
100 105 110
Gly Thr Glu Ile Val Asn Ala Val Glu Val Asn Arg Ser Asn Arg Asn
115 120 125
Gln Glu Thr Ser Gly Glu Tyr Ala Ile Glu Ala Trp Thr Lys Phe Asp
130 135 140
Phe Pro Gly Arg Gly Asn Asn His Ser Ser Phe Lys Trp Arg Trp Tyr
145 150 155 160
His Phe Asp Gly Thr Asp Trp Asp Gln Ser Arg Gln Leu Gln Asn Lys
165 170 175
Ile Tyr Lys Phe Arg Gly Thr Gly Lys Ala Trp Asp Trp Glu Val Asp
180 185 190
Thr Glu Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Val Asp Met
195 200 205
Asp His Pro Glu Val Ile His Glu Leu Arg Asn Trp Gly Val Trp Tyr
210 215 220
Thr Asn Thr Leu Asn Leu Asp Gly Phe Arg Ile Asp Ala Val Lys His
225 230 235 240
Ile Lys Tyr Ser Phe Thr Arg Asp Trp Leu Thr His Val Arg Asn Thr
245 250 255
Thr Gly Lys Pro Met Phe Ala Val Ala Glu Phe Trp Lys Asn Asp Leu
260 265 270
Gly Ala Ile Glu Asn Tyr Leu Asn Lys Thr Ser Trp Asn His Ser Val
275 280 285
Phe Asp Val Pro Leu His Tyr Asn Leu Tyr Asn Ala Ser Asn Ser Gly
290 295 300
Gly Tyr Tyr Asp Met Arg Asn Ile Leu Asn Gly Ser Val Val Gln Lys
305 310 315 320
His Pro Thr His Ala Val Thr Phe Val Asp Asn His Asp Ser Gln Pro
325 330 335
Gly Glu Ala Leu Glu Ser Phe Val Gln Gln Trp Phe Lys Pro Leu Ala
340 345 350
Tyr Ala Leu Val Leu Thr Arg Glu Gln Gly Tyr Pro Ser Val Phe Tyr
355 360 365
Gly Asp Tyr Tyr Gly Ile Pro Thr His Gly Val Pro Ala Met Lys Ser
370 375 380
Lys Ile Asp Pro Leu Leu Gln Ala Arg Gln Thr Phe Ala Tyr Gly Thr
385 390 395 400
Gln His Asp Tyr Phe Asp His His Asp Ile Ile Gly Trp Thr Arg Glu
405 410 415
Gly Asn Ser Ser His Pro Asn Ser Gly Leu Ala Thr Ile Met Ser Asp
420 425 430
Gly Pro Gly Gly Asn Lys Trp Met Tyr Val Gly Lys Asn Lys Ala Gly
435 440 445
Gln Val Trp Arg Asp Ile Thr Gly Asn Arg Thr Gly Thr Val Thr Ile
450 455 460
Asn Ala Asp Gly Trp Gly Asn Phe Ser Val Asn Gly Gly Ser Val Ser
465 470 475 480
Val Trp Val Lys Gln
485
(2) INFORMATION FOR SEQ ID NO: 2:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 485 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 2:
His His Asn Gly Thr Asn Gly Thr Met Met Gln Tyr Phe Glu Trp His
1 5 10 15
Leu Pro Asn Asp Gly Asn His Trp Asn Arg Leu Arg Asp Asp Ala Ser
20 25 30
Asn Leu Arg Asn Arg Gly Ile Thr Ala Ile Trp Ile Pro Pro Ala Trp
35 40 45
Lys Gly Thr Ser Gln Asn Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr
50 55 60
Asp Leu Gly Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly
65 70 75 80
Thr Arg Ser Gln Leu Glu Ser Ala Ile His Ala Leu Lys Asn Asn Gly
85 90 95
Val Gln Val Tyr Gly Asp Val Val Met Asn His Lys Gly Gly Ala Asp
100 105 110
Ala Thr Glu Asn Val Leu Ala Val Glu Val Asn Pro Asn Asn Arg Asn
115 120 125
Gln Glu Ile Ser Gly Asp Tyr Thr Ile Glu Ala Trp Thr Lys Phe Asp
130 135 140
Phe Pro Gly Arg Gly Asn Thr Tyr Ser Asp Phe Lys Trp Arg Trp Tyr
145 150 155 160
His Phe Asp Gly Val Asp Trp Asp Gln Ser Arg Gln Phe Gln Asn Arg
165 170 175
Ile Tyr Lys Phe Arg Gly Asp Gly Lys Ala Trp Asp Trp Glu Val Asp
180 185 190
Ser Glu Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Val Asp Met
195 200 205
Asp His Pro Glu Val Val Asn Glu Leu Arg Arg Trp Gly Glu Trp Tyr
210 215 220
Thr Asn Thr Leu Asn Leu Asp Gly Phe Arg Ile Asp Ala Val Lys His
225 230 235 240
Ile Lys Tyr Ser Phe Thr Arg Asp Trp Leu Thr His Val Arg Asn Ala
245 250 255
Thr Gly Lys Glu Met Phe Ala Val Ala Glu Phe Trp Lys Asn Asp Leu
260 265 270
Gly Ala Leu Glu Asn Tyr Leu Asn Lys Thr Asn Trp Asn His Ser Val
275 280 285
Phe Asp Val Pro Leu His Tyr Asn Leu Tyr Asn Ala Ser Asn Ser Gly
290 295 300
Gly Asn Tyr Asp Met Ala Lys Leu Leu Asn Gly Thr Val Val Gln Lys
305 310 315 320
His Pro Met His Ala Val Thr Phe Val Asp Asn His Asp Ser Gln Pro
325 330 335
Gly Glu Ser Leu Glu Ser Phe Val Gln Glu Trp Phe Lys Pro Leu Ala
340 345 350
Tyr Ala Leu Ile Leu Thr Arg Glu Gln Gly Tyr Pro Ser Val Phe Tyr
355 360 365
Gly Asp Tyr Tyr Gly Ile Pro Thr His Ser Val Pro Ala Met Lys Ala
370 375 380
Lys Ile Asp Pro Ile Leu Glu Ala Arg Gln Asn Phe Ala Tyr Gly Thr
385 390 395 400
Gln His Asp Tyr Phe Asp His His Asn Ile Ile Gly Trp Thr Arg Glu
405 410 415
Gly Asn Thr Thr His Pro Asn Ser Gly Leu Ala Thr Ile Met Ser Asp
420 425 430
Gly Pro Gly Gly Glu Lys Trp Met Tyr Val Gly Gln Asn Lys Ala Gly
435 440 445
Gln Val Trp His Asp Ile Thr Gly Asn Lys Pro Gly Thr Val Thr Ile
450 455 460
Asn Ala Asp Gly Trp Ala Asn Phe Ser Val Asn Gly Gly Ser Val Ser
465 470 475 480
Ile Trp Val Lys Arg
485
(2) INFORMATION FOR SEQ ID NO: 3:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 514 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 3:
Ala Ala Pro Phe Asn Gly Thr Met Met Gln Tyr Phe Glu Trp Tyr Leu
1 5 10 15
Pro Asp Asp Gly Thr Leu Trp Thr Lys Val Ala Asn Glu Ala Asn Asn
20 25 30
Leu Ser Ser Leu Gly Ile Thr Ala Leu Trp Leu Pro Pro Ala Tyr Lys
35 40 45
Gly Thr Ser Arg Ser Asp Val Gly Tyr Gly Val Tyr Asp Leu Tyr Asp
50 55 60
Leu Gly Glu Phe Asn Gln Lys Gly Ala Val Arg Thr Lys Tyr Gly Thr
65 70 75 80
Lys Ala Gln Tyr Leu Gln Ala Ile Gln Ala Ala His Ala Ala Gly Met
85 90 95
Gln Val Tyr Ala Asp Val Val Phe Asp His Lys Gly Gly Ala Asp Gly
100 105 110
Thr Glu Trp Val Asp Ala Val Glu Val Asn Pro Ser Asp Arg Asn Gln
115 120 125
Glu Ile Ser Gly Thr Tyr Gln Ile Gln Ala Trp Thr Lys Phe Asp Phe
130 135 140
Pro Gly Arg Gly Asn Thr Tyr Ser Ser Phe Lys Trp Arg Trp Tyr His
145 150 155 160
Phe Asp Gly Val Asp Trp Asp Glu Ser Arg Lys Leu Ser Arg Ile Tyr
165 170 175
Lys Phe Arg Gly Ile Gly Lys Ala Trp Asp Trp Glu Val Asp Thr Glu
180 185 190
Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Leu Asp Met Asp His
195 200 205
Pro Glu Val Val Thr Glu Leu Lys Ser Trp Gly Lys Trp Tyr Val Asn
210 215 220
Thr Thr Asn Ile Asp Gly Phe Arg Leu Asp Ala Val Lys His Ile Lys
225 230 235 240
Phe Ser Phe Phe Pro Asp Trp Leu Ser Asp Val Arg Ser Gln Thr Gly
245 250 255
Lys Pro Leu Phe Thr Val Gly Glu Tyr Trp Ser Tyr Asp Ile Asn Lys
260 265 270
Leu His Asn Tyr Ile Met Lys Thr Asn Gly Thr Met Ser Leu Phe Asp
275 280 285
Ala Pro Leu His Asn Lys Phe Tyr Thr Ala Ser Lys Ser Gly Gly Thr
290 295 300
Phe Asp Met Arg Thr Leu Met Thr Asn Thr Leu Met Lys Asp Gln Pro
305 310 315 320
Thr Leu Ala Val Thr Phe Val Asp Asn His Asp Thr Glu Pro Gly Gln
325 330 335
Ala Leu Gln Ser Trp Val Asp Pro Trp Phe Lys Pro Leu Ala Tyr Ala
340 345 350
Phe Ile Leu Thr Arg Gln Glu Gly Tyr Pro Cys Val Phe Tyr Gly Asp
355 360 365
Tyr Tyr Gly Ile Pro Gln Tyr Asn Ile Pro Ser Leu Lys Ser Lys Ile
370 375 380
Asp Pro Leu Leu Ile Ala Arg Arg Asp Tyr Ala Tyr Gly Thr Gln His
385 390 395 400
Asp Tyr Leu Asp His Ser Asp Ile Ile Gly Trp Thr Arg Glu Gly Val
405 410 415
Thr Glu Lys Pro Gly Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro
420 425 430
Gly Gly Ser Lys Trp Met Tyr Val Gly Lys Gln His Ala Gly Lys Val
435 440 445
Phe Tyr Asp Leu Thr Gly Asn Arg Ser Asp Thr Val Thr Ile Asn Ser
450 455 460
Asp Gly Trp Gly Glu Phe Lys Val Asn Gly Gly Ser Val Ser Val Trp
465 470 475 480
Val Pro Arg Lys Thr Thr Val Ser Thr Ile Ala Trp Ser Ile Thr Thr
485 490 495
Arg Pro Trp Thr Asp Glu Phe Val Arg Trp Thr Glu Pro Arg Leu Val
500 505 510
Ala Trp
(2) INFORMATION FOR SEQ ID NO: 4:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 483 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: protein
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 4:
Ala Asn Leu Asn Gly Thr Leu Met Gln Tyr Phe Glu Trp Tyr Met Pro
1 5 10 15
Asn Asp Gly Gln His Trp Arg Arg Leu Gln Asn Asp Ser Ala Tyr Leu
20 25 30
Ala Glu His Gly Ile Thr Ala Val Trp Ile Pro Pro Ala Tyr Lys Gly
35 40 45
Thr Ser Gln Ala Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr Asp Leu
50 55 60
Gly Glu Phe His Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr Lys
65 70 75 80
Gly Glu Leu Gln Ser Ala Ile Lys Ser Leu His Ser Arg Asp Ile Asn
85 90 95
Val Tyr Gly Asp Val Val Ile Asn His Lys Gly Gly Ala Asp Ala Thr
100 105 110
Glu Asp Val Thr Ala Val Glu Val Asp Pro Ala Asp Arg Asn Arg Val
115 120 125
Ile Ser Gly Glu His Leu Ile Lys Ala Trp Thr His Phe His Phe Pro
130 135 140
Gly Arg Gly Ser Thr Tyr Ser Asp Phe Lys Trp His Trp Tyr His Phe
145 150 155 160
Asp Gly Thr Asp Trp Asp Glu Ser Arg Lys Leu Asn Arg Ile Tyr Lys
165 170 175
Phe Gln Gly Lys Ala Trp Asp Trp Glu Val Ser Asn Glu Asn Gly Asn
180 185 190
Tyr Asp Tyr Leu Met Tyr Ala Asp Ile Asp Tyr Asp His Pro Asp Val
195 200 205
Ala Ala Glu Ile Lys Arg Trp Gly Thr Trp Tyr Ala Asn Glu Leu Gln
210 215 220
Leu Asp Gly Phe Arg Leu Asp Ala Val Lys His Ile Lys Phe Ser Phe
225 230 235 240
Leu Arg Asp Trp Val Asn His Val Arg Glu Lys Thr Gly Lys Glu Met
245 250 255
Phe Thr Val Ala Glu Tyr Trp Gln Asn Asp Leu Gly Ala Leu Glu Asn
260 265 270
Tyr Leu Asn Lys Thr Asn Phe Asn His Ser Val Phe Asp Val Pro Leu
275 280 285
His Tyr Gln Phe His Ala Ala Ser Thr Gln Gly Gly Gly Tyr Asp Met
290 295 300
Arg Lys Leu Leu Asn Gly Thr Val Val Ser Lys His Pro Leu Lys Ser
305 310 315 320
Val Thr Phe Val Asp Asn His Asp Thr Gln Pro Gly Gln Ser Leu Glu
325 330 335
Ser Thr Val Gln Thr Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu
340 345 350
Thr Arg Glu Ser Gly Tyr Pro Gln Val Phe Tyr Gly Asp Met Tyr Gly
355 360 365
Thr Lys Gly Asp Ser Gln Arg Glu Ile Pro Ala Leu Lys His Lys Ile
370 375 380
Glu Pro Ile Leu Lys Ala Arg Lys Gln Tyr Ala Tyr Gly Ala Gln His
385 390 395 400
Asp Tyr Phe Asp His His Asp Ile Val Gly Trp Thr Arg Glu Gly Asp
405 410 415
Ser Ser Val Ala Asn Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro
420 425 430
Gly Gly Ala Lys Arg Met Tyr Val Gly Arg Gln Asn Ala Gly Glu Thr
435 440 445
Trp His Asp Ile Thr Gly Asn Arg Ser Glu Pro Val Val Ile Asn Ser
450 455 460
Glu Gly Trp Gly Glu Phe His Val Asn Gly Gly Ser Val Ser Ile Tyr
465 470 475 480
Val Gln Arg
(2) INFORMATION FOR SEQ ID NO: 5:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 480 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: protein
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 5:
Val Asn Gly Thr Leu Met Gln Tyr Phe Glu Trp Tyr Thr Pro Asn Asp
1 5 10 15
Gly Gln His Trp Lys Arg Leu Gln Asn Asp Ala Glu His Leu Ser Asp
20 25 30
Ile Gly Ile Thr Ala Val Trp Ile Pro Pro Ala Tyr Lys Gly Leu Ser
35 40 45
Gln Ser Asp Asn Gly Tyr Gly Pro Tyr Asp Leu Tyr Asp Leu Gly Glu
50 55 60
Phe Gln Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr Lys Ser Glu
65 70 75 80
Leu Gln Asp Ala Ile Gly Ser Leu His Ser Arg Asn Val Gln Val Tyr
85 90 95
Gly Asp Val Val Leu Asn His Lys Ala Gly Ala Asp Ala Thr Glu Asp
100 105 110
Val Thr Ala Val Glu Val Asn Pro Ala Asn Arg Asn Gln Glu Thr Ser
115 120 125
Glu Glu Tyr Gln Ile Lys Ala Trp Thr Asp Phe Arg Phe Pro Gly Arg
130 135 140
Gly Asn Thr Tyr Ser Asp Phe Lys Trp His Trp Tyr His Phe Asp Gly
145 150 155 160
Ala Asp Trp Asp Glu Ser Arg Lys Ile Ser Arg Ile Phe Lys Phe Arg
165 170 175
Gly Glu Gly Lys Ala Trp Asp Trp Glu Val Ser Ser Glu Asn Gly Asn
180 185 190
Tyr Asp Tyr Leu Met Tyr Ala Asp Val Asp Tyr Asp His Pro Asp Val
195 200 205
Val Ala Glu Thr Lys Lys Trp Gly Ile Trp Tyr Ala Asn Glu Leu Ser
210 215 220
Leu Asp Gly Phe Arg Ile Asp Ala Ala Lys His Ile Lys Phe Ser Phe
225 230 235 240
Leu Arg Asp Trp Val Gln Ala Val Arg Gln Ala Thr Gly Lys Glu Met
245 250 255
Phe Thr Val Ala Glu Tyr Trp Gln Asn Asn Ala Gly Lys Leu Glu Asn
260 265 270
Tyr Leu Asn Lys Thr Ser Phe Asn Gln Ser Val Phe Asp Val Pro Leu
275 280 285
His Phe Asn Leu Gln Ala Ala Ser Ser Gln Gly Gly Gly Tyr Asp Met
290 295 300
Arg Arg Leu Leu Asp Gly Thr Val Val Ser Arg His Pro Glu Lys Ala
305 310 315 320
Val Thr Phe Val Glu Asn His Asp Thr Gln Pro Gly Gln Ser Leu Glu
325 330 335
Ser Thr Val Gln Thr Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu
340 345 350
Thr Arg Glu Ser Gly Tyr Pro Gln Val Phe Tyr Gly Asp Met Tyr Gly
355 360 365
Thr Lys Gly Thr Ser Pro Lys Glu Ile Pro Ser Leu Lys Asp Asn Ile
370 375 380
Glu Pro Ile Leu Lys Ala Arg Lys Glu Tyr Ala Tyr Gly Pro Gln His
385 390 395 400
Asp Tyr Ile Asp His Pro Asp Val Ile Gly Trp Thr Arg Glu Gly Asp
405 410 415
Ser Ser Ala Ala Lys Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro
420 425 430
Gly Gly Ser Lys Arg Met Tyr Ala Gly Leu Lys Asn Ala Gly Glu Thr
435 440 445
Trp Tyr Asp Ile Thr Gly Asn Arg Ser Asp Thr Val Lys Ile Gly Ser
450 455 460
Asp Gly Trp Gly Glu Phe His Val Asn Asp Gly Ser Val Ser Ile Tyr
465 470 475 480
(2) INFORMATION FOR SEQ ID NO: 6:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 485 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 6:
His His Asn Gly Thr Asn Gly Thr Met Met Gln Tyr Phe Glu Trp Tyr
1 5 10 15
Leu Pro Asn Asp Gly Asn His Trp Asn Arg Leu Asn Ser Asp Ala Ser
20 25 30
Asn Leu Lys Ser Lys Gly Ile Thr Ala Val Trp Ile Pro Pro Ala Trp
35 40 45
Lys Gly Ala Ser Gln Asn Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr
50 55 60
Asp Leu Gly Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly
65 70 75 80
Thr Arg Ser Gln Leu Gln Ala Ala Val Thr Ser Leu Lys Asn Asn Gly
85 90 95
Ile Gln Val Tyr Gly Asp Val Val Met Asn His Lys Gly Gly Ala Asp
100 105 110
Ala Thr Glu Met Val Arg Ala Val Glu Val Asn Pro Asn Asn Arg Asn
115 120 125
Gln Glu Val Thr Gly Glu Tyr Thr Ile Glu Ala Trp Thr Arg Phe Asp
130 135 140
Phe Pro Gly Arg Gly Asn Thr His Ser Ser Phe Lys Trp Arg Trp Tyr
145 150 155 160
His Phe Asp Gly Val Asp Trp Asp Gln Ser Arg Arg Leu Asn Asn Arg
165 170 175
Ile Tyr Lys Phe Arg Gly His Gly Lys Ala Trp Asp Trp Glu Val Asp
180 185 190
Thr Glu Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Ile Asp Met
195 200 205
Asp His Pro Glu Val Val Asn Glu Leu Arg Asn Trp Gly Val Trp Tyr
210 215 220
Thr Asn Thr Leu Gly Leu Asp Gly Phe Arg Ile Asp Ala Val Lys His
225 230 235 240
Ile Lys Tyr Ser Phe Thr Arg Asp Trp Ile Asn His Val Arg Ser Ala
245 250 255
Thr Gly Lys Asn Met Phe Ala Val Ala Glu Phe Trp Lys Asn Asp Leu
260 265 270
Gly Ala Ile Glu Asn Tyr Leu Gln Lys Thr Asn Trp Asn His Ser Val
275 280 285
Phe Asp Val Pro Leu His Tyr Asn Leu Tyr Asn Ala Ser Lys Ser Gly
290 295 300
Gly Asn Tyr Asp Met Arg Asn Ile Phe Asn Gly Thr Val Val Gln Arg
305 310 315 320
His Pro Ser His Ala Val Thr Phe Val Asp Asn His Asp Ser Gln Pro
325 330 335
Glu Glu Ala Leu Glu Ser Phe Val Glu Glu Trp Phe Lys Pro Leu Ala
340 345 350
Tyr Ala Leu Thr Leu Thr Arg Glu Gln Gly Tyr Pro Ser Val Phe Tyr
355 360 365
Gly Asp Tyr Tyr Gly Ile Pro Thr His Gly Val Pro Ala Met Arg Ser
370 375 380
Lys Ile Asp Pro Ile Leu Glu Ala Arg Gln Lys Tyr Ala Tyr Gly Lys
385 390 395 400
Gln Asn Asp Tyr Leu Asp His His Asn Ile Ile Gly Trp Thr Arg Glu
405 410 415
Gly Asn Thr Ala His Pro Asn Ser Gly Leu Ala Thr Ile Met Ser Asp
420 425 430
Gly Ala Gly Gly Ser Lys Trp Met Phe Val Gly Arg Asn Lys Ala Gly
435 440 445
Gln Val Trp Ser Asp Ile Thr Gly Asn Arg Thr Gly Thr Val Thr Ile
450 455 460
Asn Ala Asp Gly Trp Gly Asn Phe Ser Val Asn Gly Gly Ser Val Ser
465 470 475 480
Ile Trp Val Asn Lys
485
(2) INFORMATION FOR SEQ ID NO: 7:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 485 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 7:
His His Asn Gly Thr Asn Gly Thr Met Met Gln Tyr Phe Glu Trp Tyr
1 5 10 15
Leu Pro Asn Asp Gly Asn His Trp Asn Arg Leu Arg Asp Asp Ala Ala
20 25 30
Asn Leu Lys Ser Lys Gly Ile Thr Ala Val Trp Ile Pro Pro Ala Trp
35 40 45
Lys Gly Thr Ser Gln Asn Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr
50 55 60
Asp Leu Gly Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly
65 70 75 80
Thr Arg Asn Gln Leu Gln Ala Ala Val Thr Ser Leu Lys Asn Asn Gly
85 90 95
Ile Gln Val Tyr Gly Asp Val Val Met Asn His Lys Gly Gly Ala Asp
100 105 110
Gly Thr Glu Ile Val Asn Ala Val Glu Val Asn Arg Ser Asn Arg Asn
115 120 125
Gln Glu Thr Ser Gly Glu Tyr Ala Ile Glu Ala Trp Thr Lys Phe Asp
130 135 140
Phe Pro Gly Arg Gly Asn Asn His Ser Ser Phe Lys Trp Arg Trp Tyr
145 150 155 160
His Phe Asp Gly Thr Asp Trp Asp Gln Ser Arg Gln Leu Gln Asn Lys
165 170 175
Ile Tyr Lys Phe Arg Gly Thr Gly Lys Ala Trp Asp Trp Glu Val Asp
180 185 190
Thr Glu Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Val Asp Met
195 200 205
Asp His Pro Glu Val Ile His Glu Leu Arg Asn Trp Gly Val Trp Tyr
210 215 220
Thr Asn Thr Leu Asn Leu Asp Gly Phe Arg Ile Asp Ala Val Lys His
225 230 235 240
Ile Lys Tyr Ser Phe Thr Arg Asp Trp Leu Thr His Val Arg Asn Thr
245 250 255
Thr Gly Lys Pro Met Phe Ala Val Ala Glu Phe Trp Lys Asn Asp Leu
260 265 270
Gly Ala Ile Glu Asn Tyr Leu Asn Lys Thr Ser Trp Asn His Ser Val
275 280 285
Phe Asp Val Pro Leu His Tyr Asn Leu Tyr Asn Ala Ser Asn Ser Gly
290 295 300
Gly Tyr Tyr Asp Met Arg Asn Ile Leu Asn Gly Ser Val Val Gln Lys
305 310 315 320
His Pro Thr His Ala Val Thr Phe Val Asp Asn His Asp Ser Gln Pro
325 330 335
Gly Glu Ala Leu Glu Ser Phe Val Gln Gln Trp Phe Lys Pro Leu Ala
340 345 350
Tyr Ala Leu Val Leu Thr Arg Glu Gln Gly Tyr Pro Ser Val Phe Tyr
355 360 365
Gly Asp Tyr Tyr Gly Ile Pro Thr His Gly Val Pro Ala Met Lys Ser
370 375 380
Lys Ile Asp Pro Leu Leu Gln Ala Arg Gln Thr Phe Ala Tyr Gly Thr
385 390 395 400
Gln His Asp Tyr Phe Asp His His Asp Ile Ile Gly Trp Thr Arg Glu
405 410 415
Gly Asn Ser Ser His Pro Asn Ser Gly Leu Ala Thr Ile Met Ser Asp
420 425 430
Gly Pro Gly Gly Asn Lys Trp Met Tyr Val Gly Lys Asn Lys Ala Gly
435 440 445
Gln Val Trp Arg Asp Ile Thr Gly Asn Arg Thr Gly Thr Val Thr Ile
450 455 460
Asn Ala Asp Gly Trp Gly Asn Phe Ser Val Asn Gly Gly Ser Val Ser
465 470 475 480
Val Trp Val Lys Gln
485
(2) INFORMATION FOR SEQ ID NO: 8:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 485 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 8:
His His Asn Gly Thr Asn Gly Thr Met Met Gln Tyr Phe Glu Trp His
1 5 10 15
Leu Pro Asn Asp Gly Asn His Trp Asn Arg Leu Arg Asp Asp Ala Ser
20 25 30
Asn Leu Arg Asn Arg Gly Ile Thr Ala Ile Trp Ile Pro Pro Ala Trp
35 40 45
Lys Gly Thr Ser Gln Asn Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr
50 55 60
Asp Leu Gly Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly
65 70 75 80
Thr Arg Ser Gln Leu Glu Ser Ala Ile His Ala Leu Lys Asn Asn Gly
85 90 95
Val Gln Val Tyr Gly Asp Val Val Met Asn His Lys Gly Gly Ala Asp
100 105 110
Ala Thr Glu Asn Val Leu Ala Val Glu Val Asn Pro Asn Asn Arg Asn
115 120 125
Gln Glu Ile Ser Gly Asp Tyr Thr Ile Glu Ala Trp Thr Lys Phe Asp
130 135 140
Phe Pro Gly Arg Gly Asn Thr Tyr Ser Asp Phe Lys Trp Arg Trp Tyr
145 150 155 160
His Phe Asp Gly Val Asp Trp Asp Gln Ser Arg Gln Phe Gln Asn Arg
165 170 175
Ile Tyr Lys Phe Arg Gly Asp Gly Lys Ala Trp Asp Trp Glu Val Asp
180 185 190
Ser Glu Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Val Asp Met
195 200 205
Asp His Pro Glu Val Val Asn Glu Leu Arg Arg Trp Gly Glu Trp Tyr
210 215 220
Thr Asn Thr Leu Asn Leu Asp Gly Phe Arg Ile Asp Ala Val Lys His
225 230 235 240
Ile Lys Tyr Ser Phe Thr Arg Asp Trp Leu Thr His Val Arg Asn Ala
245 250 255
Thr Gly Lys Glu Met Phe Ala Val Ala Glu Phe Trp Lys Asn Asp Leu
260 265 270
Gly Ala Leu Glu Asn Tyr Leu Asn Lys Thr Asn Trp Asn His Ser Val
275 280 285
Phe Asp Val Pro Leu His Tyr Asn Leu Tyr Asn Ala Ser Asn Ser Gly
290 295 300
Gly Asn Tyr Asp Met Ala Lys Leu Leu Asn Gly Thr Val Val Gln Lys
305 310 315 320
His Pro Met His Ala Val Thr Phe Val Asp Asn His Asp Ser Gln Pro
325 330 335
Gly Glu Ser Leu Glu Ser Phe Val Gln Glu Trp Phe Lys Pro Leu Ala
340 345 350
Tyr Ala Leu Ile Leu Thr Arg Glu Gln Gly Tyr Pro Ser Val Phe Tyr
355 360 365
Gly Asp Tyr Tyr Gly Ile Pro Thr His Ser Val Pro Ala Met Lys Ala
370 375 380
Lys Ile Asp Pro Ile Leu Glu Ala Arg Gln Asn Phe Ala Tyr Gly Thr
385 390 395 400
Gln His Asp Tyr Phe Asp His His Asn Ile Ile Gly Trp Thr Arg Glu
405 410 415
Gly Asn Thr Thr His Pro Asn Ser Gly Leu Ala Thr Ile Met Ser Asp
420 425 430
Gly Pro Gly Gly Glu Lys Trp Met Tyr Val Gly Gln Asn Lys Ala Gly
435 440 445
Gln Val Trp His Asp Ile Thr Gly Asn Lys Pro Gly Thr Val Thr Ile
450 455 460
Asn Ala Asp Gly Trp Ala Asn Phe Ser Val Asn Gly Gly Ser Val Ser
465 470 475 480
Ile Trp Val Lys Arg
485
(2) INFORMATION FOR SEQ ID NO: 9:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1455 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 9:
CATCATAATG GAACAAATGG TACTATGATG CAATATTTCG AATGGTATTT GCCAAATGAC 60
GGGAATCATT GGAACAGGTT GAGGGATGAC GCAGCTAACT TAAAGAGTAA AGGGATAACA 120
GCTGTATGGA TCCCACCTGC ATGGAAGGGG ACTTCCCAGA ATGATGTAGG TTATGGAGCC 180
TATGATTTAT ATGATCTTGG AGAGTTTAAC CAGAAGGGGA CGGTTCGTAC AAAATATGGA 240
ACACGCAACC AGCTACAGGC TGCGGTGACC TCTTTAAAAA ATAACGGCAT TCAGGTATAT 300
GGTGATGTCG TCATGAATCA TAAAGGTGGA GCAGATGGTA CGGAAATTGT AAATGCGGTA 360
GAAGTGAATC GGAGCAACCG AAACCAGGAA ACCTCAGGAG AGTATGCAAT AGAAGCGTGG 420
ACAAAGTTTG ATTTTCCTGG AAGAGGAAAT AACCATTCCA GCTTTAAGTG GCGCTGGTAT 480
CATTTTGATG GGACAGATTG GGATCAGTCA CGCCAGCTTC AAAACAAAAT ATATAAATTC 540
AGGGGAACAG GCAAGGCCTG GGACTGGGAA GTCGATACAG AGAATGGCAA CTATGACTAT 600
CTTATGTATG CAGACGTGGA TATGGATCAC CCAGAAGTAA TACATGAACT TAGAAACTGG 660
GGAGTGTGGT ATACGAATAC ACTGAACCTT GATGGATTTA GAATAGATGC AGTGAAACAT 720
ATAAAATATA GCTTTACGAG AGATTGGCTT ACACATGTGC GTAACACCAC AGGTAAACCA 780
ATGTTTGCAG TGGCTGAGTT TTGGAAAAAT GACCTTGGTG CAATTGAAAA CTATTTGAAT 840
AAAACAAGTT GGAATCACTC GGTGTTTGAT GTTCCTCTCC ACTATAATTT GTACAATGCA 900
TCTAATAGCG GTGGTTATTA TGATATGAGA AATATTTTAA ATGGTTCTGT GGTGCAAAAA 960
CATCCAACAC ATGCCGTTAC TTTTGTTGAT AACCATGATT CTCAGCCCGG GGAAGCATTG 1020
GAATCCTTTG TTCAACAATG GTTTAAACCA CTTGCATATG CATTGGTTCT GACAAGGGAA 1080
CAAGGTTATC CTTCCGTATT TTATGGGGAT TACTACGGTA TCCCAACCCA TGGTGTTCCG 1140
GCTATGAAAT CTAAAATAGA CCCTCTTCTG CAGGCACGTC AAACTTTTGC CTATGGTACG 1200
CAGCATGATT ACTTTGATCA TCATGATATT ATCGGTTGGA CAAGAGAGGG AAATAGCTCC 1260
CATCCAAATT CAGGCCTTGC CACCATTATG TCAGATGGTC CAGGTGGTAA CAAATGGATG 1320
TATGTGGGGA AAAATAAAGC GGGACAAGTT TGGAGAGATA TTACCGGAAA TAGGACAGGC 1380
ACCGTCACAA TTAATGCAGA CGGATGGGGT AATTTCTCTG TTAATGGAGG GTCCGTTTCG 1440
GTTTGGGTGA AGCAA 1455
(2) INFORMATION FOR SEQ ID NO: 10:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1455 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 10:
CATCATAATG GGACAAATGG GACGATGATG CAATACTTTG AATGGCACTT GCCTAATGAT 60
GGGAATCACT GGAATAGATT AAGAGATGAT GCTAGTAATC TAAGAAATAG AGGTATAACC 120
GCTATTTGGA TTCCGCCTGC CTGGAAAGGG ACTTCGCAAA ATGATGTGGG GTATGGAGCC 180
TATGATCTTT ATGATTTAGG GGAATTTAAT CAAAAGGGGA CGGTTCGTAC TAAGTATGGG 240
ACACGTAGTC AATTGGAGTC TGCCATCCAT GCTTTAAAGA ATAATGGCGT TCAAGTTTAT 300
GGGGATGTAG TGATGAACCA TAAAGGAGGA GCTGATGCTA CAGAAAACGT TCTTGCTGTC 360
GAGGTGAATC CAAATAACCG GAATCAAGAA ATATCTGGGG ACTACACAAT TGAGGCTTGG 420
ACTAAGTTTG ATTTTCCAGG GAGGGGTAAT ACATACTCAG ACTTTAAATG GCGTTGGTAT 480
CATTTCGATG GTGTAGATTG GGATCAATCA CGACAATTCC AAAATCGTAT CTACAAATTC 540
CGAGGTGATG GTAAGGCATG GGATTGGGAA GTAGATTCGG AAAATGGAAA TTATGATTAT 600
TTAATGTATG CAGATGTAGA TATGGATCAT CCGGAGGTAG TAAATGAGCT TAGAAGATGG 660
GGAGAATGGT ATACAAATAC ATTAAATCTT GATGGATTTA GGATCGATGC GGTGAAGCAT 720
ATTAAATATA GCTTTACACG TGATTGGTTG ACCCATGTAA GAAACGCAAC GGGAAAAGAA 780
ATGTTTGCTG TTGCTGAATT TTGGAAAAAT GATTTAGGTG CCTTGGAGAA CTATTTAAAT 840
AAAACAAACT GGAATCATTC TGTCTTTGAT GTCCCCCTTC ATTATAATCT TTATAACGCG 900
TCAAATAGTG GAGGCAACTA TGACATGGCA AAACTTCTTA ATGGAACGGT TGTTCAAAAG 960
CATCCAATGC ATGCCGTAAC TTTTGTGGAT AATCACGATT CTCAACCTGG GGAATCATTA 1020
GAATCATTTG TACAAGAATG GTTTAAGCCA CTTGCTTATG CGCTTATTTT AACAAGAGAA 1080
CAAGGCTATC CCTCTGTCTT CTATGGTGAC TACTATGGAA TTCCAACACA TAGTGTCCCA 1140
GCAATGAAAG CCAAGATTGA TCCAATCTTA GAGGCGCGTC AAAATTTTGC ATATGGAACA 1200
CAACATGATT ATTTTGACCA TCATAATATA ATCGGATGGA CACGTGAAGG AAATACCACG 1260
CATCCCAATT CAGGACTTGC GACTATCATG TCGGATGGGC CAGGGGGAGA GAAATGGATG 1320
TACGTAGGGC AAAATAAAGC AGGTCAAGTT TGGCATGACA TAACTGGAAA TAAACCAGGA 1380
ACAGTTACGA TCAATGCAGA TGGATGGGCT AATTTTTCAG TAAATGGAGG ATCTGTTTCC 1440
ATTTGGGTGA AACGA 1455
(2) INFORMATION FOR SEQ ID NO: 11:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1548 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 11:
GCCGCACCGT TTAACGGCAC CATGATGCAG TATTTTGAAT GGTACTTGCC GGATGATGGC 60
ACGTTATGGA CCAAAGTGGC CAATGAAGCC AACAACTTAT CCAGCCTTGG CATCACCGCT 120
CTTTGGCTGC CGCCCGCTTA CAAAGGAACA AGCCGCAGCG ACGTAGGGTA CGGAGTATAC 180
GACTTGTATG ACCTCGGCGA ATTCAATCAA AAAGGGACCG TCCGCACAAA ATACGGAACA 240
AAAGCTCAAT ATCTTCAAGC CATTCAAGCC GCCCACGCCG CTGGAATGCA AGTGTACGCC 300
GATGTCGTGT TCGACCATAA AGGCGGCGCT GACGGCACGG AATGGGTGGA CGCCGTCGAA 360
GTCAATCCGT CCGACCGCAA CCAAGAAATC TCGGGCACCT ATCAAATCCA AGCATGGACG 420
AAATTTGATT TTCCCGGGCG GGGCAACACC TACTCCAGCT TTAAGTGGCG CTGGTACCAT 480
TTTGACGGCG TTGATTGGGA CGAAAGCCGA AAATTGAGCC GCATTTACAA ATTCCGCGGC 540
ATCGGCAAAG CGTGGGATTG GGAAGTAGAC ACGGAAAACG GAAACTATGA CTACTTAATG 600
TATGCCGACC TTGATATGGA TCATCCCGAA GTCGTGACCG AGCTGAAAAA CTGGGGGAAA 660
TGGTATGTCA ACACAACGAA CATTGATGGG TTCCGGCTTG ATGCCGTCAA GCATATTAAG 720
TTCAGTTTTT TTCCTGATTG GTTGTCGTAT GTGCGTTCTC AGACTGGCAA GCCGCTATTT 780
ACCGTCGGGG AATATTGGAG CTATGACATC AACAAGTTGC ACAATTACAT TACGAAAACA 840
GACGGAACGA TGTCTTTGTT TGATGCCCCG TTACACAACA AATTTTATAC CGCTTCCAAA 900
TCAGGGGGCG CATTTGATAT GCGCACGTTA ATGACCAATA CTCTCATGAA AGATCAACCG 960
ACATTGGCCG TCACCTTCGT TGATAATCAT GACACCGAAC CCGGCCAAGC GCTGCAGTCA 1020
TGGGTCGACC CATGGTTCAA ACCGTTGGCT TACGCCTTTA TTCTAACTCG GCAGGAAGGA 1080
TACCCGTGCG TCTTTTATGG TGACTATTAT GGCATTCCAC AATATAACAT TCCTTCGCTG 1140
AAAAGCAAAA TCGATCCGCT CCTCATCGCG CGCAGGGATT ATGCTTACGG AACGCAACAT 1200
GATTATCTTG ATCACTCCGA CATCATCGGG TGGACAAGGG AAGGGGGCAC TGAAAAACCA 1260
GGATCCGGAC TGGCCGCACT GATCACCGAT GGGCCGGGAG GAAGCAAATG GATGTACGTT 1320
GGCAAACAAC ACGCTGGAAA AGTGTTCTAT GACCTTACCG GCAACCGGAG TGACACCGTC 1380
ACCATCAACA GTGATGGATG GGGGGAATTC AAAGTCAATG GCGGTTCGGT TTCGGTTTGG 1440
GTTCCTAGAA AAACGACCGT TTCTACCATC GCTCGGCCGA TCACAACCCG ACCGTGGACT 1500
GGTGAATTCG TCCGTTGGAC CGAACCACGG TTGGTGGCAT GGCCTTGA 1548
(2) INFORMATION FOR SEQ ID NO: 12:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1920 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(ix) FEATURE:
(A) NAME/KEY: CDS
(B) LOCATION:421..1872
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 12:
CGGAAGATTG GAAGTACAAA AATAAGCAAA AGATTGTCAA TCATGTCATG AGCCATGCGG 60
GAGACGGAAA AATCGTCTTA ATGCACGATA TTTATGCAAC GTTCGCAGAT GCTGCTGAAG 120
AGATTATTAA AAAGCTGAAA GCAAAAGGCT ATCAATTGGT AACTGTATCT CAGCTTGAAG 180
AAGTGAAGAA GCAGAGAGGC TATTGAATAA ATGAGTAGAA GCGCCATATC GGCGCTTTTC 240
TTTTGGAAGA AAATATAGGG AAAATGGTAC TTGTTAAAAA TTCGGAATAT TTATACAACA 300
TCATATGTTT CACATTGAAA GGGGAGGAGA ATCATGAAAC AACAAAAACG GCTTTACGCC 360
CGATTGCTGA CGCTGTTATT TGCGCTCATC TTCTTGCTGC CTCATTCTGC AGCAGCGGCG 420
GCA AAT CTT AAT GGG ACG CTG ATG CAG TAT TTT GAA TGG TAC ATG CCC 468
AAT GAC GGC CAA CAT TGG AGG CGT TTG CAA AAC GAC TCG GCA TAT TTG 516
GCT GAA CAC GGT ATT ACT GCC GTC TGG ATT CCC CCG GCA TAT AAG GGA 564
ACG AGC CAA GCG GAT GTG GGC TAC GGT GCT TAC GAC CTT TAT GAT TTA 612
GGG GAG TTT CAT CAA AAA GGG ACG GTT CGG ACA AAG TAC GGC ACA AAA 660
GGA GAG CTG CAA TCT GCG ATC AAA AGT CTT CAT TCC CGC GAC ATT AAC 708
GTT TAC GGG GAT GTG GTC ATC AAC CAC AAA GGC GGC GCT GAT GCG ACC 756
GAA GAT GTA ACC GCG GTT GAA GTC GAT CCC GCT GAC CGC AAC CGC GTA 804
ATT TCA GGA GAA CAC CTA ATT AAA GCC TGG ACA CAT TTT CAT TTT CCG 852
GGG CGC GGC AGC ACA TAC AGC GAT TTT AAA TGG CAT TGG TAC CAT TTT 900
GAC GGA ACC GAT TGG GAC GAG TCC CGA AAG CTG AAC CGC ATC TAT AAG 948
TTT CAA GGA AAG GCT TGG GAT TGG GAA GTT TCC AAT GAA AAC GGC AAC 996
TAT GAT TAT TTG ATG TAT GCC GAC ATC GAT TAT GAC CAT CCT GAT GTC 1044
GCA GCA GAA ATT AAG AGA TGG GGC ACT TGG TAT GCC AAT GAA CTG CAA 1092
TTG GAC GGT TTC CGT CTT GAT GCT GTC AAA CAC ATT AAA TTT TCT TTT 1140
TTG CGG GAT TGG GTT AAT CAT GTC AGG GAA AAA ACG GGG AAG GAA ATG 1188
TTT ACG GTA GCT GAA TAT TGG CAG AAT GAC TTG GGC GCG CTG GAA AAC 1236
TAT TTG AAC AAA ACA AAT TTT AAT CAT TCA GTG TTT GAC GTG CCG CTT 1284
CAT TAT CAG TTC CAT GCT GCA TCG ACA CAG GGA GGC GGC TAT GAT ATG 1332
AGG AAA TTG CTG AAC GGT ACG GTC GTT TCC AAG CAT CCG TTG AAA TCG 1380
GTT ACA TTT GTC GAT AAC CAT GAT ACA CAG CCG GGG CAA TCG CTT GAG 1428
TCG ACT GTC CAA ACA TGG TTT AAG CCG CTT GCT TAC GCT TTT ATT CTC 1476
ACA AGG GAA TCT GGA TAC CCT CAG GTT TTC TAC GGG GAT ATG TAC GGG 1524
ACG AAA GGA GAC TCC CAG CGC GAA ATT CCT GCC TTG AAA CAC AAA ATT 1572
GAA CCG ATC TTA AAA GCG AGA AAA CAG TAT GCG TAC GGA GCA CAG CAT 1620
GAT TAT TTC GAC CAC CAT GAC ATT GTC GGC TGG ACA AGG GAA GGC GAC 1668
AGC TCG GTT GCA AAT TCA GGT TTG GCG GCA TTA ATA ACA GAC GGA CCC 1716
GGT GGG GCA AAG CGA ATG TAT GTC GGC CGG CAA AAC GCC GGT GAG ACA 1764
TGG CAT GAC ATT ACC GGA AAC CGT TCG GAG CCG GTT GTC ATC AAT TCG 1812
GAA GGC TGG GGA GAG TTT CAC GTA AAC GGC GGG TCG GTT TCA ATT TAT 1860
GTT CAA AGA TAG AAGAGCAGAG AGGACGGATT TCCTGAAGGA AATCCGTTTT 1912
TTTATTTT 1920
(2) INFORMATION FOR SEQ ID NO: 13:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1455 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 13:
CATCATAATG GAACAAATGG TACTATGATG CAATATTTCG AATGGTATTT GCCAAATGAC 60
GGGAATCATT GGAACAGGTT GAGGGATGAC GCAGCTAACT TAAAGAGTAA AGGGATAACA 120
GCTGTATGGA TCCCACCTGC ATGGAAGGGG ACTTCCCAGA ATGATGTAGG TTATGGAGCC 180
TATGATTTAT ATGATCTTGG AGAGTTTAAC CAGAAGGGGA CGGTTCGTAC AAAATATGGA 240
ACACGCAACC AGCTACAGGC TGCGGTGACC TCTTTAAAAA ATAACGGCAT TCAGGTATAT 300
GGTGATGTCG TCATGAATCA TAAAGGTGGA GCAGATGGTA CGGAAATTGT AAATGCGGTA 360
GAAGTGAATC GGAGCAACCG AAACCAGGAA ACCTCAGGAG AGTATGCAAT AGAAGCGTGG 420
ACAAAGTTTG ATTTTCCTGG AAGAGGAAAT AACCATTCCA GCTTTAAGTG GCGCTGGTAT 480
CATTTTGATG GGACAGATTG GGATCAGTCA CGCCAGCTTC AAAACAAAAT ATATAAATTC 540
AGGGGAACAG GCAAGGCCTG GGACTGGGAA GTCGATACAG AGAATGGCAA CTATGACTAT 600
CTTATGTATG CAGACGTGGA TATGGATCAC CCAGAAGTAA TACATGAACT TAGAAACTGG 660
GGAGTGTGGT ATACGAATAC ACTGAACCTT GATGGATTTA GAATAGATGC AGTGAAACAT 720
ATAAAATATA GCTTTACGAG AGATTGGCTT ACACATGTGC GTAACACCAC AGGTAAACCA 780
ATGTTTGCAG TGGCTGAGTT TTGGAAAAAT GACCTTGGTG CAATTGAAAA CTATTTGAAT 840
AAAACAAGTT GGAATCACTC GGTGTTTGAT GTTCCTCTCC ACTATAATTT GTACAATGCA 900
TCTAATAGCG GTGGTTATTA TGATATGAGA AATATTTTAA ATGGTTCTGT GGTGCAAAAA 960
CATCCAACAC ATGCCGTTAC TTTTGTTGAT AACCATGATT CTCAGCCCGG GGAAGCATTG 1020
GAATCCTTTG TTCAACAATG GTTTAAACCA CTTGCATATG CATTGGTTCT GACAAGGGAA 1080
CAAGGTTATC CTTCCGTATT TTATGGGGAT TACTACGGTA TCCCAACCCA TGGTGTTCCG 1140
GCTATGAAAT CTAAAATAGA CCCTCTTCTG CAGGCACGTC AAACTTTTGC CTATGGTACG 1200
CAGCATGATT ACTTTGATCA TCATGATATT ATCGGTTGGA CAAGAGAGGG AAATAGCTCC 1260
CATCCAAATT CAGGCCTTGC CACCATTATG TCAGATGGTC CAGGTGGTAA CAAATGGATG 1320
TATGTGGGGA AAAATAAAGC GGGACAAGTT TGGAGAGATA TTACCGGAAA TAGGACAGGC 1380
ACCGTCACAA TTAATGCAGA CGGATGGGGT AATTTCTCTG TTAATGGAGG GTCCGTTTCG 1440
GTTTGGGTGA AGCAA 1455
(2) INFORMATION FOR SEQ ID NO: 14:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1455 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 14:
CATCATAATG GGACAAATGG GACGATGATG CAATACTTTG AATGGCACTT GCCTAATGAT 60
GGGAATCACT GGAATAGATT AAGAGATGAT GCTAGTAATC TAAGAAATAG AGGTATAACC 120
GCTATTTGGA TTCCGCCTGC CTGGAAAGGG ACTTCGCAAA ATGATGTGGG GTATGGAGCC 180
TATGATCTTT ATGATTTAGG GGAATTTAAT CAAAAGGGGA CGGTTCGTAC TAAGTATGGG 240
ACACGTAGTC AATTGGAGTC TGCCATCCAT GCTTTAAAGA ATAATGGCGT TCAAGTTTAT 300
GGGGATGTAG TGATGAACCA TAAAGGAGGA GCTGATGCTA CAGAAAACGT TCTTGCTGTC 360
GAGGTGAATC CAAATAACCG GAATCAAGAA ATATCTGGGG ACTACACAAT TGAGGCTTGG 420
ACTAAGTTTG ATTTTCCAGG GAGGGGTAAT ACATACTCAG ACTTTAAATG GCGTTGGTAT 480
CATTTCGATG GTGTAGATTG GGATCAATCA CGACAATTCC AAAATCGTAT CTACAAATTC 540
CGAGGTGATG GTAAGGCATG GGATTGGGAA GTAGATTCGG AAAATGGAAA TTATGATTAT 600
TTAATGTATG CAGATGTAGA TATGGATCAT CCGGAGGTAG TAAATGAGCT TAGAAGATGG 660
GGAGAATGGT ATACAAATAC ATTAAATCTT GATGGATTTA GGATCGATGC GGTGAAGCAT 720
ATTAAATATA GCTTTACACG TGATTGGTTG ACCCATGTAA GAAACGCAAC GGGAAAAGAA 780
ATGTTTGCTG TTGCTGAATT TTGGAAAAAT GATTTAGGTG CCTTGGAGAA CTATTTAAAT 840
AAAACAAACT GGAATCATTC TGTCTTTGAT GTCCCCCTTC ATTATAATCT TTATAACGCG 900
TCAAATAGTG GAGGCAACTA TGACATGGCA AAACTTCTTA ATGGAACGGT TGTTCAAAAG 960
CATCCAATGC ATGCCGTAAC TTTTGTGGAT AATCACGATT CTCAACCTGG GGAATCATTA 1020
GAATCATTTG TACAAGAATG GTTTAAGCCA CTTGCTTATG CGCTTATTTT AACAAGAGAA 1080
CAAGGCTATC CCTCTGTCTT CTATGGTGAC TACTATGGAA TTCCAACACA TAGTGTCCCA 1140
GCAATGAAAG CCAAGATTGA TCCAATCTTA GAGGCGCGTC AAAATTTTGC ATATGGAACA 1200
CAACATGATT ATTTTGACCA TCATAATATA ATCGGATGGA CACGTGAAGG AAATACCACG 1260
CATCCCAATT CAGGACTTGC GACTATCATG TCGGATGGGC CAGGGGGAGA GAAATGGATG 1320
TACGTAGGGC AAAATAAAGC AGGTCAAGTT TGGCATGACA TAACTGGAAA TAAACCAGGA 1380
ACAGTTACGA TCAATGCAGA TGGATGGGCT AATTTTTCAG TAAATGGAGG ATCTGTTTCC 1440
ATTTGGGTGA AACGA 1455
(2) INFORMATION FOR SEQ ID NO: 15:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 60 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/ KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Forward Primer FSA"
(ix) FEATURE:
(A) NAME/KEY: misc-feature
(B) LOCATION: 22-27,29,31-33,41
(D): OTHER INFORMATION: /Note= 1: 35% A, 65% C
2: 83% G, 17% A
3: 63% G, 37% T
4: 86% G, 14% A
5: 85% G, 15% C
6: 50% T, 50% C
7: 95% A, 5%G
8: 58% G, 37% A, 5% T
9: 86% C, 13% A, 1% G
10: 83% T, 17% G
11: 92% G, 8% C
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 15:
caaaatcgta tctacaaatt c123456a7g 8910tgggatt
11ggaagtaga ttcggaaaat 60
(2) INFORMATION FOR SEQ ID NO: 16:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Reverse Primer RSA"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 16:
gaatttgtag atacgatttt g 21
(2) INFORMATION FOR SEQ ID NO: 17:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 24 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer B1"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 17:
CGATTGCTGA CGCTGTTATT TGCG 24
(2) INFORMATION FOR SEQ ID NO: 18:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 24 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer Y2"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 18:
CTTGTTCCCT TGTCAGAACC AATG 24
(2) INFORMATION FOR SEQ ID NO: 19:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer 101458"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 19:
GTCATAGTTG CCGAAATCTG TATCGACTTC 30
(2) INFORMATION FOR SEQ ID NO: 20:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 35 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer 101638"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 20:
CCCAGTCCCA CGTACGTCCC CTGAATTTATATA TTTTG 35
(2) INFORMATION FOR SEQ ID NO: 21:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 38 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Oligo 1"
(A) NAME/KEY: misc-feature
(B) LOCATION: 12
(D): OTHER INFORMATION: /Note=N= 25% A, 25% C, 25% G, 25% T.
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 21:
CCCAGTCCCA GNTCTTTCCC CTGAATTTAT ATATTTTG 38
(2) INFORMATION FOR SEQ ID NO: 22:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 25 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer X2"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 22:
GCGTGGACAA AGTTTGATTT TCCTG 25
(2) INFORMATION FOR SEQ ID NO: 23:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer DA01"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 23:
CCTAATGATG GGAATCACTG G 21
2) INFORMATION FOR SEQ ID NO: 24:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 24 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer DA03"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 24:
GCATTGGATG CTTTTGAACA ACCG 24
2) INFORMATION FOR SEQ ID NO: 25:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 26 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer DA07"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 25:
CGCAAAATGA TATCGGGTAT GGAGCC 26
(2) INFORMATION FOR SEQ ID NO: 26:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 29 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/ KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer DA20"
(ix) FEATURE:
(A) NAME/KEY: misc-feature
(B) LOCATION: 13,14
(D): OTHER INFORMATION: /Note:S= mixture of C and G
W= mixture of A and T
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 26:
GTGATGAACC ACSWAGGTGG AGCTGATGC 29
(2) INFORMATION FOR SEQ ID NO: 27:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/ KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer DA14"
(ix) FEATURE:
(A) NAME/KEY: misc-feature
(B) LOCATION: 13,14
(D): OTHER INFORMATION: /Note:R= mixture of A and G
Y= mixture of C and T
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 27:
GATGGTGTAT GGRYCAATCA CGACAATTCC 30
2) INFORMATION FOR SEQ ID NO: 28:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 28 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer DA15"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 28:
GGTGTATGGG ATAACTCACG ACAATTCC 28
2) INFORMATION FOR SEQ ID NO: 29:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 28 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer DA16"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 29:
GGTGTATGGG ATCTCTCACG ACAATTCC 28
2) INFORMATION FOR SEQ ID NO: 30:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 32 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer DA17"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 30:
GGGATCAATC ACGAAATTTC CAAAATCGTA TC 32
2) INFORMATION FOR SEQ ID NO: 31:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 32 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer DA18"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 31:
GGGATCAATC ACGACTCTTC CAAAATCGTA TC 32
2) INFORMATION FOR SEQ ID NO: 32:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 34 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer DA06"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 32:
GGAAATTATG ATTATATCAT GTATGCAGAT GTAG 34
2) INFORMATION FOR SEQ ID NO: 33:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer DA09"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 33:
GCTGAATTTT GGTCGAATGA TTTAGGTGCC 30
2) INFORMATION FOR SEQ ID NO: 34:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer DA11"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 34:
GCTGAATTTT GGTCGAATGA TTTAGGTGCC 30
2) INFORMATION FOR SEQ ID NO: 35:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 27 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer DA21"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 35:
GAATTTTGGA AGTACGATTT AGGTCGG 27
(2) INFORMATION FOR SEQ ID NO: 36:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 29 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/ KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer DA12"
(ix) FEATURE:
(A) NAME/KEY: misc-feature
(B) LOCATION: 12,13
(D): OTHER INFORMATION: /Note:R= mixture of A and G
Y= mixture of C and T
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 36:
GGAAAAACGA TRYCGGTGCC TTGGAGAAC 29
(2) INFORMATION FOR SEQ ID NO: 37:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 27 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/ KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer DA13"
(ix) FEATURE:
(A) NAME/KEY: misc-feature
(B) LOCATION: 14,15
(D): OTHER INFORMATION: /Note:R= mixture of A and G
Y= mixture of C and T
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 37
GATTTAGGTG CCTRYCAGAA CTATTTA 27
2) INFORMATION FOR SEQ ID NO: 38:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 26 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer DA08"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 38:
CCCCCTTCAT GAGAATCTTT ATAACG 26
2) INFORMATION FOR SEQ ID NO: 39:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 25 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer DA04"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 39:
GAATCCGAAC CTCATTACAC ATTCG 25
2) INFORMATION FOR SEQ ID NO: 40:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 38 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer DA05"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 40:
CGGATGGACT CGAGAAGGAA ATACCACG 38
2) INFORMATION FOR SEQ ID NO: 41:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 31 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer DA10"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 41:
CGTAGGGCAA AATCAGGCCG GTCAAGTTTG G 31
2) INFORMATION FOR SEQ ID NO: 42:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 31 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer DA22"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 42:
CATAACTGGA AATCGCCCGG GAACAGTTAC G 31
(2) INFORMATION FOR SEQ ID NO: 43:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 36 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/ KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer DA19"
(ix) FEATURE:
(A) NAME/KEY: misc-feature
(B) LOCATION: 12
(D): OTHER INFORMATION: /Note:W= mixture of A and T
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 43
CTGGAAATAA AWCCGGAACA GTTACG 36
2) INFORMATION FOR SEQ ID NO: 44:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 32 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer DA23"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 44:
GGAAATAAAC CAGGACCCGT TACGATCAAT GC 32
2) INFORMATION FOR SEQ ID NO: 45:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 28 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer DA32"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 45:
GAGGCTTGGA CTAGGTTTGA TTTTCCAG 28
2) INFORMATION FOR SEQ ID NO: 46:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer DA31"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 46:
GCTGAATTTT GGCGCAATGA TTTAGGTGCC 30
2) INFORMATION FOR SEQ ID NO: 47:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 34 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer bm4"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 47:
GTGTTTGACG TCCCGCTTCA TGAGAATTTA CAGG 34
2) INFORMATION FOR SEQ ID NO: 48:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 34 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer bm5"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 48:
GTGTTTGACG TCCCGCTTCA TAAGAATTTA CAGG 34
2) INFORMATION FOR SEQ ID NO: 49:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 34 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer bm6"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 49:
GTGTTTGACG TCCCGCTTCA TGCCAATTTA CAGG 34
2) INFORMATION FOR SEQ ID NO: 50:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 32 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer bm8"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 50:
AGGGAATCCG GATACCCTGA GGTTTTCTAC GG 32
2) INFORMATION FOR SEQ ID NO: 51:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 34 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer bm11"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 51:
GATGTGGTTT TGGATCATAA GGCCGGCGCT GATG 34
2) INFORMATION FOR SEQ ID NO: 52
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 22 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer p1"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 52:
CTGTTATTAA TGCCGCCAAA CC 22
2) INFORMATION FOR SEQ ID NO: 53:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 24 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer p2"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 53:
GGAAAAGAAA TGTTTACGGT TGCG 24
2) INFORMATION FOR SEQ ID NO: 54:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 25 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer p3"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 54:
GAAATGAAGC GGAACATCAA ACACG 25
2) INFORMATION FOR SEQ ID NO: 55:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer p4"
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 55:
GTATGATTTA GGAGAATTCC 20
(2) INFORMATION FOR SEQ ID NO: 56:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 34 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/ KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer bl1"
(ix) FEATURE:
(A) NAME/KEY: misc-feature
(B) LOCATION: 1
(D): OTHER INFORMATION: /Note:P=phosphate group
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 56:
PCCAGCGCGC CTAGGTCACG CTGCCAATAT TCAG 34
(2) INFORMATION FOR SEQ ID NO: 57:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 34 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: other nucleic acid
(ix) FEATURE:
(A) NAME/ KEY: misc-feature:
(B) OTHER INFORMATION: /desc = "Primer bl2"
(ix) FEATURE:
(A) NAME/KEY: misc-feature
(B) LOCATION: 1
(D): OTHER INFORMATION: /Note:P=phosphate group
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 57:
PCCAGCGCGC CTAGGTCATC CTGCCAATAT TCAG 34
(2) INFORMATION FOR SEQ ID NO: 58:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 2084 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: DNA (genomic)
(ix) FEATURE:
(A) NAME/KEY: CDS
(B) LOCATION:343..1794
(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 58:
GCCCCGCACA TACGAAAAGA CTGGCTGAAA ACATTGAGCC TTTGATGACT GATGATTTGG 60
CTGAAGAAGT GGATCGATTG TTTGAGAAAA GAAGAAGACC ATAAAAATAC CTTGTCTGTC 120
ATCAGACAGG GTATTTTTTA TGCTGTCCAG ACTGTCCGCT GTGTAAAAAT AAGGAATAAA 180
GGGGGGTTGT TATTATTTTA CTGATATGTA AAATATAATT TGTATAAGAA AATGAGAGGG 240
AGAGGAAACA TGATTCAAAA ACGAAAGCGG ACAGTTTCGT TCAGACTTGT GCTTATGTGC 300
ACGCTGTTAT TTGTCAGTTT GCCGATTACA AAAACATCAG CC GTA AAT GGC ACG 354
CTG ATG CAG TAT TTT GAA TGG TAT ACG CCG AAC GAC GGC CAG CAT TGG 402
AAA CGA TTG CAG AAT GAT GCG GAA CAT TTA TCG GAT ATC GGA ATC ACT 450
GCC GTC TGG ATT CCT CCC GCA TAC AAA GGA TTG AGC CAA TCC GAT AAC 498
GGA TAC GGA CCT TAT GAT TTG TAT GAT TTA GGA GAA TTC CAG CAA AAA 546
GGG ACG GTC AGA ACG AAA TAC GGC ACA AAA TCA GAG CTT CAA GAT GCG 594
ATC GGC TCA CTG CAT TCC CGG AAC GTC CAA GTA TAC GGA GAT GTG GTT 642
TTG AAT CAT AAG GCT GGT GCT GAT GCA ACA GAA GAT GTA ACT GCC GTC 690
GAA GTC AAT CCG GCC AAT AGA AAT CAG GAA ACT TCG GAG GAA TAT CAA 738
ATC AAA GCG TGG ACG GAT TTT CGT TTT CCG GGC CGT GGA AAC ACG TAC 786
AGT GAT TTT AAA TGG CAT TGG TAT CAT TTC GAC GGA GCG GAC TGG GAT 834
GAA TCC CGG AAG ATC AGC CGC ATC TTT AAG TTT CGT GGG GAA GGA AAA 882
GCG TGG GAT TGG GAA GTA TCA AGT GAA AAC GGC AAC TAT GAC TAT TTA 930
ATG TAT GCT GAT GTT GAC TAC GAC CAC CCT GAT GTC GTG GCA GAG ACA 978
AAA AAA TGG GGT ATC TGG TAT GCG AAT GAA CTG TCA TTA GAC GGC TTC 1026
CGT ATT GAT GCC GCC AAA CAT ATT AAA TTT TCA TTT CTG CGT GAT TGG 1074
GTT CAG GCG GTC AGA CAG GCG ACG GGA AAA GAA ATG TTT ACG GTT GCG 1122
GAG TAT TGG CAG AAT AAT GCC GGG AAA CTC GAA AAC TAC TTG AAT AAA 1170
ACA AGC TTT AAT CAA TCC GTG TTT GAT GTT CCG CTT CAT TTC AAT TTA 1218
CAG GCG GCT TCC TCA CAA GGA GGC GGA TAT GAT ATG AGG CGT TTG CTG 1266
GAC GGT ACC GTT GTG TCC AGG CAT CCG GAA AAG GCG GTT ACA TTT GTT 1314
GAA AAT CAT GAC ACA CAG CCG GGA CAG TCA TTG GAA TCG ACA GTC CAA 1362
ACT TGG TTT AAA CCG CTT GCA TAC GCC TTT ATT TTG ACA AGA GAA TCC 1410
GGT TAT CCT CAG GTG TTC TAT GGG GAT ATG TAC GGG ACA AAA GGG ACA 1458
TCG CCA AAG GAA ATT CCC TCA CTG AAA GAT AAT ATA GAG CCG ATT TTA 1506
AAA GCG CGT AAG GAG TAC GCA TAC GGG CCC CAG CAC GAT TAT ATT GAC 1554
CAC CCG GAT GTG ATC GGA TGG ACG AGG GAA GGT GAC AGC TCC GCC GCC 1602
AAA TCA GGT TTG GCC GCT TTA ATC ACG GAC GGA CCC GGC GGA TCA AAG 1650
CGG ATG TAT GCC GGC CTG AAA AAT GCC GGC GAG ACA TGG TAT GAC ATA 1698
ACG GGC AAC CGT TCA GAT ACT GTA AAA ATC GGA TCT GAC GGC TGG GGA 1746
GAG TTT CAT GTA AAC GAT GGG TCC GTC TCC ATT TAT GTT CAG AAA TAA 1794
GGTAATAAAA AAACACCTCC AAGCTGAGTG CGGGTATCAG CTTGGAGGTG CGTTTATTTT 1854
TTCAGCCGTA TGACAAGGTC GGCATCAGGT GTGACAAATA CGGTATGCTG GCTGTCATAG 1914
GTGACAAATC CGGGTTTTGC GCCGTTTGGC TTTTTCACAT GTCTGATTTT TGTATAATCA 1974
ACAGGCACGG AGCCGGAATC TTTCGCCTTG GAAAAATAAG CGGCGATCGT AGCTGCTTCC 2034
AATATGGATT GTTCATCGGG ATCGCTGCTT TTAATCACAA CGTGGGATCC 2084
5368.204-WO
33
Claims (38)
- SEQ ID NO:4에 도시된 아미노산 서열을 가지는 B. 리케니포미스 (B. licheniformis) α-아밀라제의 변이체로서, 상기 변이체는 α- 아밀라제 활성을 가지고 있고, 다음 치환: K458R 및 P459T 중 하나 또는 둘을 포함하는 것을 특징으로 하는 변이체.
- 제 1 항에 있어서, 변이체가 위치 D183 + G184가 결실되고, 또한 다음의 치환: K458R; 및 P459T 중 하나 또는 둘을 갖는 것을 특징으로 하는 변이체.
- 삭제
- 삭제
- 제 1 항 또는 제 2 항에 따르는 α-아밀라제 변이체를 암호화하는 DNA 서열을 포함하는 DNA 구조체.
- 제 5 항에 따른 DNA 구조체를 운반하는 재조합 발현 벡터.
- 제 5 항에 따른 DNA 구조체로 형질전환된 세포.
- 제 7 항에 있어서, 미생물인 것을 특징으로 하는 세포.
- 제 8 항에 있어서, 박테리아 또는 균류인 것을 특징으로 하는 세포.
- 제 9 항에 있어서, 그람 양성 박테리아인 것을 특징으로 하는 세포.
- 비-먼지유발 과립, 안정화된 액체 또는 보호된 효소 중 어느 하나의 형태로, 제 1 항 또는 제 2 항에 따르는 α-아밀라제 변이체를 포함하는 세제 첨가제.
- 제 11 항에 있어서, 첨가제 g 당 0.02 내지 200 mg 의 효소 단백질을 함유하는 것을 특징으로 하는 세제 첨가제.
- 제 11 항에 있어서, 프로테아제, 리파아제, 페록시다제, 다른 녹말분해효소 및 셀룰라제로 구성되는 군으로부터 선택된 다른 효소를 더 포함하는 것을 특징으로 하는 세제 첨가제.
- 제 1 항 또는 제 2 항에 따르는 α-아밀라제 변이체를 포함하는 세제 조성물.
- 제 14 항에 있어서, 프로테아제, 리파아제, 페록시다아제, 다른 녹말분해 효소 및 셀룰라제로 구성되는 군으로부터 선택된 다른 효소를 더 포함하는 것을 특징으로 하는 세제 조성물.
- 제 1 항 또는 제 2 항에 따르는 α-아밀라제 변이체를 포함하는 수동 또는 자동 식기세척용 세제 조성물.
- 제 16 항에 있어서, 프로테아제, 리파아제, 페록시다아제, 다른 녹말 분해 효소 및 셀룰라제로 구성되는 군으로부터 선택된 다른 효소를 포함하는 것을 더 특징으로 하는 식기세척용 세제 조성물.
- 제 1 항 또는 제 2 항에 따르는 α-아밀라제 변이체를 포함하는 수동 또는 자동 세탁물 세척 조성물.
- 제 18 항에 있어서, 프로테아제, 리파아제, 페록시다제, 다른 녹말 분해 효소 및 셀룰라제로 구성되는 군으로부터 선택된 다른 효소를 더 포함하는 것을 특징으로 하는 세탁물 세척 조성물.
- 제 10 항에 있어서, 그람 양성 박테리아는 바실러스 서브틸리스 (Bacillus subtilis), 바실러스 리케니포미스 (Bacillus licheniformis), 바실러스 렌투스 (Bacillus lentus), 바실러스 브레비스 (Bacillus brevis), 바실러스 스테로테르모필루스 (Bacillus stearothermophilus), 바실러스 알칼로필루스 (Bacillus alkalophilus), 바실러스 리케파시엔스 (Bacillus amyloliquefaciens), 바실러스 코아굴란스 (Bacillus coagulans), 바실러스 설귤란스 (Bacillus circulans), 바실러스 로투스(Bacillus lautus) 및 바실러스 투린지엔시스(Bacillus thuringiensis)로 이루어지는 군으로부터 선택되는 것을 특징으로 하는 세포.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DK1240/97 | 1997-10-30 | ||
DK124097 | 1997-10-30 | ||
DK93698 | 1998-07-14 | ||
DKPA199800936 | 1998-07-14 | ||
PCT/DK1998/000471 WO1999023211A1 (en) | 1997-10-30 | 1998-10-30 | α-AMYLASE MUTANTS |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20010031424A KR20010031424A (ko) | 2001-04-16 |
KR100770721B1 true KR100770721B1 (ko) | 2007-10-29 |
Family
ID=60293649
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020007004453A KR100770721B1 (ko) | 1997-10-30 | 1998-10-30 | α-아밀라제 돌연변이체 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100770721B1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3321360A3 (en) * | 2013-01-03 | 2018-06-06 | Novozymes A/S | Alpha-amylase variants and polynucleotides encoding same |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1995010603A1 (en) * | 1993-10-08 | 1995-04-20 | Novo Nordisk A/S | Amylase variants |
WO1995035382A2 (en) * | 1994-06-17 | 1995-12-28 | Genecor International Inc. | NOVEL AMYLOLYTIC ENZYMES DERIVED FROM THE B. LICHENIFORMIS α-AMYLASE, HAVING IMPROVED CHARACTERISTICS |
WO1996023874A1 (en) * | 1995-02-03 | 1996-08-08 | Novo Nordisk A/S | A method of designing alpha-amylase mutants with predetermined properties |
WO1996023873A1 (en) * | 1995-02-03 | 1996-08-08 | Novo Nordisk A/S | Amylase variants |
-
1998
- 1998-10-30 KR KR1020007004453A patent/KR100770721B1/ko not_active IP Right Cessation
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1995010603A1 (en) * | 1993-10-08 | 1995-04-20 | Novo Nordisk A/S | Amylase variants |
WO1995035382A2 (en) * | 1994-06-17 | 1995-12-28 | Genecor International Inc. | NOVEL AMYLOLYTIC ENZYMES DERIVED FROM THE B. LICHENIFORMIS α-AMYLASE, HAVING IMPROVED CHARACTERISTICS |
WO1996023874A1 (en) * | 1995-02-03 | 1996-08-08 | Novo Nordisk A/S | A method of designing alpha-amylase mutants with predetermined properties |
WO1996023873A1 (en) * | 1995-02-03 | 1996-08-08 | Novo Nordisk A/S | Amylase variants |
Also Published As
Publication number | Publication date |
---|---|
KR20010031424A (ko) | 2001-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6673589B2 (en) | α-amylase mutants | |
US6197565B1 (en) | α-Amylase variants | |
CA2416967C (en) | Alpha-amylase mutants with altered properties | |
EP2298875B1 (en) | Variants with altered properties | |
US6187576B1 (en) | α-amylase mutants | |
US6528298B1 (en) | α-amylase mutants | |
US20020155574A1 (en) | Alpha-amylase mutants with altered properties | |
US20150132823A1 (en) | Alpha-Amylase Variants | |
KR100770721B1 (ko) | α-아밀라제 돌연변이체 | |
DK1676913T3 (en) | Alpha-amylase variants |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
AMND | Amendment | ||
N231 | Notification of change of applicant | ||
A201 | Request for examination | ||
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
J201 | Request for trial against refusal decision | ||
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
B701 | Decision to grant | ||
GRNT | Written decision to grant | ||
LAPS | Lapse due to unpaid annual fee |