JP2003116567A - 遺伝子クラスター - Google Patents
遺伝子クラスターInfo
- Publication number
- JP2003116567A JP2003116567A JP2001316578A JP2001316578A JP2003116567A JP 2003116567 A JP2003116567 A JP 2003116567A JP 2001316578 A JP2001316578 A JP 2001316578A JP 2001316578 A JP2001316578 A JP 2001316578A JP 2003116567 A JP2003116567 A JP 2003116567A
- Authority
- JP
- Japan
- Prior art keywords
- leu
- ala
- ser
- gly
- asp
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P20/00—Technologies relating to chemical industry
- Y02P20/50—Improvements relating to the production of bulk chemicals
- Y02P20/52—Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts
Landscapes
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Acyclic And Carbocyclic Compounds In Medicinal Compositions (AREA)
Abstract
(57)【要約】
【課題】HMG−CoA還元酵素阻害剤ML−236B
生産菌のML−236B生産能を改善することを特徴と
するDNA等の提供。 【解決手段】ペニシリウム・シトリナム(Penici
llium citrinum)由来の特定の塩基配列
を含むことからなり、ML−236B生産菌内に導入さ
れることにより、ML236B生産菌のML−236B
生産能を改善することを特徴とするDNA。
生産菌のML−236B生産能を改善することを特徴と
するDNA等の提供。 【解決手段】ペニシリウム・シトリナム(Penici
llium citrinum)由来の特定の塩基配列
を含むことからなり、ML−236B生産菌内に導入さ
れることにより、ML236B生産菌のML−236B
生産能を改善することを特徴とするDNA。
Description
【0001】
【発明の属する技術分野】本発明は、HMG−CoA還
元酵素阻害剤ML−236B生産菌のML−236B生
産能を改善することを特徴とするDNA、該DNAとハ
イブリダイズする核酸分子、該DNAを組み込んだ組換
えDNAベクター、該組換えDNAベクターで形質転換
された宿主細胞、ML−236Bの製造法等に関する。
元酵素阻害剤ML−236B生産菌のML−236B生
産能を改善することを特徴とするDNA、該DNAとハ
イブリダイズする核酸分子、該DNAを組み込んだ組換
えDNAベクター、該組換えDNAベクターで形質転換
された宿主細胞、ML−236Bの製造法等に関する。
【0002】
【従来の技術】高脂血症改善薬として臨床において使用
されているHMG−CoA還元酵素阻害剤プラバスタチ
ンは、ペニシリウム・シトリナムが生産するML−23
6Bをストレプトミセス・カルボフィラス(Streptomyc
es carbophilus)により微生物変換することにより得ら
れる(Endo, A., et al., J. Antibiot.,29, 1346(197
6):Matsuoka, S., et al., Eur. J. Biochem., 184, 7
07(1989)記載)。
されているHMG−CoA還元酵素阻害剤プラバスタチ
ンは、ペニシリウム・シトリナムが生産するML−23
6Bをストレプトミセス・カルボフィラス(Streptomyc
es carbophilus)により微生物変換することにより得ら
れる(Endo, A., et al., J. Antibiot.,29, 1346(197
6):Matsuoka, S., et al., Eur. J. Biochem., 184, 7
07(1989)記載)。
【0003】プラバスタチンの前駆体ML−236B、
及び、プラバスタチンと部分構造を共有するHMG−C
oA阻害剤ロバスタチンは、ともにポリケチドを経て生
合成されることが示されている(Moore, R. N., et a
l., J. Am. Chem. Soc., 107, 3694(1985):Shiao, M.
and Don, H. S., Proc. Natl. Sci. Counc. ROC., 11,
223(1987)記載)。
及び、プラバスタチンと部分構造を共有するHMG−C
oA阻害剤ロバスタチンは、ともにポリケチドを経て生
合成されることが示されている(Moore, R. N., et a
l., J. Am. Chem. Soc., 107, 3694(1985):Shiao, M.
and Don, H. S., Proc. Natl. Sci. Counc. ROC., 11,
223(1987)記載)。
【0004】ポリケチドとは、酢酸、プロピオン酸、酪
酸などの低分子カルボン酸残基の連続的な縮合反応から
生じるβ―ケト炭素鎖から導かれる化合物の総称であ
り、各β―ケトカルボニル基の縮合・還元様式により、
多様な構造が導かれる(Hopwood,D. A. and Sherman,
D. H., Annu. Rev. Genet., 24, 37-66(1990):Hutchin
son, C. R. and Fujii, I., Annu. Rev. Genet., 49, 2
01-238(1995)記載)。
酸などの低分子カルボン酸残基の連続的な縮合反応から
生じるβ―ケト炭素鎖から導かれる化合物の総称であ
り、各β―ケトカルボニル基の縮合・還元様式により、
多様な構造が導かれる(Hopwood,D. A. and Sherman,
D. H., Annu. Rev. Genet., 24, 37-66(1990):Hutchin
son, C. R. and Fujii, I., Annu. Rev. Genet., 49, 2
01-238(1995)記載)。
【0005】ポリケチドの合成を担うポリケチド・シン
ターゼ(Polyketide Synthase:以
下、「PKS」という。)は糸状菌や細菌の有する酵素
であることが知られており、糸状菌では該酵素の分子生
物学的研究がなされている(Feng, G. H. and Leonard,
T. J., J. Bacteriol.,177, 6246(1995):Takano, Y.,
et al. Mol. Gen. Genet., 249, 162(1995)記載)。ロ
バスタチン生産菌であるアスペルギルス・テレウス(As
pergillus terreus)については、トリオールPKS遺
伝子の解析がなされている(特表平9−504436号
公報記載)。
ターゼ(Polyketide Synthase:以
下、「PKS」という。)は糸状菌や細菌の有する酵素
であることが知られており、糸状菌では該酵素の分子生
物学的研究がなされている(Feng, G. H. and Leonard,
T. J., J. Bacteriol.,177, 6246(1995):Takano, Y.,
et al. Mol. Gen. Genet., 249, 162(1995)記載)。ロ
バスタチン生産菌であるアスペルギルス・テレウス(As
pergillus terreus)については、トリオールPKS遺
伝子の解析がなされている(特表平9−504436号
公報記載)。
【0006】ところで、糸状菌の二次代謝産物の生合成
関連遺伝子は、ゲノム上でクラスターを形成しているこ
とが少なくない。ポリケチドの生合成系にて、該系に関
与する遺伝子クラスターの存在が知られている。アスペ
ルギルス・フラヴァス(Aspergillus flavus)、アスペ
ルギルス・パラシティカス(Aspergillus parasiticu
s)の生産するポリケチドであるアフラトキシンの生合
成では、PKSその他ポリケチドの生合成に関与する酵
素蛋白質をコードする遺伝子がクラスター構造を形成し
ていることが知られており、両菌のアフラトキシン生合
成関連遺伝子のゲノム比較解析が行なわれている(Yu,
J., et al, Appl. Environ. Microbiol., 61, 2365(199
5)記載)。アスペルギルス・ニジュランス(Aspergillu
s nidulans)の生産するステリグマトシスチンの生合成
においては、生合成関連遺伝子が、ゲノム上の連続する
約60kbの領域においてクラスター構造を形成してい
ることが報告されている(Brown, D. W., et al., Pro
c. Natl. Acad. Sci. USA, 93,1418(1996)記載)。ペニ
シリウム・シトリナム(Penicillium citrinum)のML
−236B生合成に関連するDNA(以下「ML−23
6B生合成関連DNA」という)は、特開2001−1
12487において記載されている。その中で、mlc
A、mlcB、mlcC、mlcD、mlcE、mlc
Rの6種類の異なる構造遺伝子が示されている。しか
し、ML−236Bの生合成に必要とされる生合成遺伝
子のすべては見出されていなかった。
関連遺伝子は、ゲノム上でクラスターを形成しているこ
とが少なくない。ポリケチドの生合成系にて、該系に関
与する遺伝子クラスターの存在が知られている。アスペ
ルギルス・フラヴァス(Aspergillus flavus)、アスペ
ルギルス・パラシティカス(Aspergillus parasiticu
s)の生産するポリケチドであるアフラトキシンの生合
成では、PKSその他ポリケチドの生合成に関与する酵
素蛋白質をコードする遺伝子がクラスター構造を形成し
ていることが知られており、両菌のアフラトキシン生合
成関連遺伝子のゲノム比較解析が行なわれている(Yu,
J., et al, Appl. Environ. Microbiol., 61, 2365(199
5)記載)。アスペルギルス・ニジュランス(Aspergillu
s nidulans)の生産するステリグマトシスチンの生合成
においては、生合成関連遺伝子が、ゲノム上の連続する
約60kbの領域においてクラスター構造を形成してい
ることが報告されている(Brown, D. W., et al., Pro
c. Natl. Acad. Sci. USA, 93,1418(1996)記載)。ペニ
シリウム・シトリナム(Penicillium citrinum)のML
−236B生合成に関連するDNA(以下「ML−23
6B生合成関連DNA」という)は、特開2001−1
12487において記載されている。その中で、mlc
A、mlcB、mlcC、mlcD、mlcE、mlc
Rの6種類の異なる構造遺伝子が示されている。しか
し、ML−236Bの生合成に必要とされる生合成遺伝
子のすべては見出されていなかった。
【0007】
【発明が解決しようとする課題】本発明者らは、ペニシ
リウム・シトリナムのML−236B生合成に関与する
酵素の遺伝子又は遺伝子クラスターをML-236B生
産菌のゲノムDNAライブラリーよりクローニングし、
得られた組換えDNAベクターを用いてML−236B
を形質転換することにより該生産菌のML−236Bの
生産性が向上することを見出し、本発明を完成した。
リウム・シトリナムのML−236B生合成に関与する
酵素の遺伝子又は遺伝子クラスターをML-236B生
産菌のゲノムDNAライブラリーよりクローニングし、
得られた組換えDNAベクターを用いてML−236B
を形質転換することにより該生産菌のML−236Bの
生産性が向上することを見出し、本発明を完成した。
【0008】
【課題を解決するための手段】本発明は、(1)配列表
の配列番号1のヌクレオチド番号1乃至72149で示
される塩基配列からなり、ML−236B生産菌内に導
入されることにより該菌のML−236B生産能を改善
することを特徴とするDNA、(2)配列表の配列番号
1のヌクレオチド番号1乃至42758で示される塩基
配列からなり、ML−236B生産菌内に導入されるこ
とにより該菌のML−236B生産能を改善することを
特徴とするDNA、(3)配列表の配列番号1のヌクレ
オチド番号11614乃至47918で示される塩基配
列からなり、ML−236B生産菌内に導入されること
により該菌のML−236B生産能を改善することを特
徴とするDNA、(4)配列表の配列番号1のヌクレオ
チド番号36135乃至72149で示される塩基配列
からなり、ML−236B生産菌内に導入されることに
より該菌のML−236B生産能を改善することを特徴
とするDNA、(5)配列表の配列番号1のヌクレオチ
ド番号25979乃至63419で示される塩基配列か
らなり、ML−236B生産菌内に導入されることによ
り該菌のML−236B生産能を改善することを特徴と
するDNA。(6)請求項1乃至3記載のDNAとハイ
ブリダイズし、ML−236B生産菌内に導入されるこ
とにより該菌のML−236B生産能を改善することを
特徴とするDNA、(7)(1)乃至(3)記載のDN
Aとストリンジェントな条件下でハイブリダイズし、M
L−236B生産菌内に導入されることにより該菌のM
L−236B生産能を改善することを特徴とするDN
A、(8)(1)乃至(5)のいずれか一つに記載のD
NAを含む組換えDNAベクター、(9)プラスミドp
ML42(FERM BP−7723)である(8)記
載の組換えDNAベクター、(10)プラスミドpML
45(FERM BP−7724)である(8)記載の
組換えDNAベクター、(11)プラスミドpML51
(FERM BP−7725)である、(8)記載の組
換えDNAベクター、(12)(7)乃至(10)記載
の組換えDNAベクターで形質転換された宿主細胞、
(13)ML−236B生産菌であることを特徴とする
(11)記載の宿主細胞、(14)ペニシリウム・シト
リナム(Penicillium citrinum)であることを特徴とす
る、(12)記載の宿主細胞、(15)大腸菌であるこ
とを特徴とする、(12)記載の宿主細胞、(16)1
2乃至15記載の宿主細胞を培養し、次いで該培養物か
らML−236Bを回収することを特徴とする、ML−
236Bの製造法に関する。
の配列番号1のヌクレオチド番号1乃至72149で示
される塩基配列からなり、ML−236B生産菌内に導
入されることにより該菌のML−236B生産能を改善
することを特徴とするDNA、(2)配列表の配列番号
1のヌクレオチド番号1乃至42758で示される塩基
配列からなり、ML−236B生産菌内に導入されるこ
とにより該菌のML−236B生産能を改善することを
特徴とするDNA、(3)配列表の配列番号1のヌクレ
オチド番号11614乃至47918で示される塩基配
列からなり、ML−236B生産菌内に導入されること
により該菌のML−236B生産能を改善することを特
徴とするDNA、(4)配列表の配列番号1のヌクレオ
チド番号36135乃至72149で示される塩基配列
からなり、ML−236B生産菌内に導入されることに
より該菌のML−236B生産能を改善することを特徴
とするDNA、(5)配列表の配列番号1のヌクレオチ
ド番号25979乃至63419で示される塩基配列か
らなり、ML−236B生産菌内に導入されることによ
り該菌のML−236B生産能を改善することを特徴と
するDNA。(6)請求項1乃至3記載のDNAとハイ
ブリダイズし、ML−236B生産菌内に導入されるこ
とにより該菌のML−236B生産能を改善することを
特徴とするDNA、(7)(1)乃至(3)記載のDN
Aとストリンジェントな条件下でハイブリダイズし、M
L−236B生産菌内に導入されることにより該菌のM
L−236B生産能を改善することを特徴とするDN
A、(8)(1)乃至(5)のいずれか一つに記載のD
NAを含む組換えDNAベクター、(9)プラスミドp
ML42(FERM BP−7723)である(8)記
載の組換えDNAベクター、(10)プラスミドpML
45(FERM BP−7724)である(8)記載の
組換えDNAベクター、(11)プラスミドpML51
(FERM BP−7725)である、(8)記載の組
換えDNAベクター、(12)(7)乃至(10)記載
の組換えDNAベクターで形質転換された宿主細胞、
(13)ML−236B生産菌であることを特徴とする
(11)記載の宿主細胞、(14)ペニシリウム・シト
リナム(Penicillium citrinum)であることを特徴とす
る、(12)記載の宿主細胞、(15)大腸菌であるこ
とを特徴とする、(12)記載の宿主細胞、(16)1
2乃至15記載の宿主細胞を培養し、次いで該培養物か
らML−236Bを回収することを特徴とする、ML−
236Bの製造法に関する。
【0009】
【発明の実施の形態】以下、本発明をより詳細に説明す
る。本発明は、ML−236B生産菌内に導入されるこ
とにより該生産菌のML−236B生産能を改善するこ
とを特徴とする、該生産菌のゲノムに由来するML−2
36B生合成遺伝子及び遺伝子クラスター等に関する。
る。本発明は、ML−236B生産菌内に導入されるこ
とにより該生産菌のML−236B生産能を改善するこ
とを特徴とする、該生産菌のゲノムに由来するML−2
36B生合成遺伝子及び遺伝子クラスター等に関する。
【0010】本発明において、ML−236B生産菌と
は、ML−236B生産能を先天的に有する微生物をい
う。ML−236B生産菌としては、例えば、ペニシリ
ウム(Penicillium)属に属するML−236B生産菌
が挙げられ、ペニシリウム・シトリナム、ペニシリウム
・ブレビコンパクタム(Penicilium brevicompactum:B
rown, A. G., et al., J. Chem. Soc. Perkin-1., 1165
(1976)記載)、ペニシリウム・シクロピウム(Penicill
ium cyclopium:Doss, S.L.,et al., J. Natl. Prod.,
49, 357(1986)記載)等が例示される。さらに、これら
以外に、ユーペニシリウム・エスピー M6603(Eu
penicillium sp.M6603:Endo, A., et al., J. Antibio
t.-Tokyo, 39, 1609(1986)記載)、ペシロミセス・ビリ
ディス FERM P−6236(Paecilomyces virid
is FERM P-6236:特開昭58−98092号公報記
載)、ペシロミセス・エスピー M2016(Paecilom
yces sp.M2016:Endo, A., et al., J. Antibiot.-Toky
o, 39, 1609(1986)記載)、トリコデルマ・ロンギブラ
チアタム M6735(Trichoderma longibrachiatum
M6735:Endo, A., et al., J. Antibiot.-Tokyo, 39, 1
609(1986)記載)、ヒポミセス・クリソスペルムス I
FO 7798(Hypomyces chrysospermus IFO 7798:
Endo, A., et al., J. Antibiot.-Tokyo, 39, 1609(198
6)記載)、グリオクラディウム・エスピー YJ−95
15(Gliocladium sp. YJ-9515:WO9806867
号公報記載)、トリコデルマ・ビリデ IFO 583
6(Trichoderma viride IFO 5836:特公昭62−19
15号公報記載)、ユーペニシリウム・レチクリスポル
ム IFO 9022(Eupenicillium reticulisporum
IFO 9022:特公昭62−19159号公報記載)等が
挙げられる。ML−236B生産菌としてはこれらのう
ち、好適にはペニシリウム・シトリナムであり、より好
適にはペニシリウム・シトリナム SANK13380
株およびその変異株を挙げることができる。ペニシリウ
ム・シトリナム SANK13380株は、平成4年
(1992年)12月22日付けで独立行政法人産業技
術総合研究所特許生物寄託センターに国際寄託され、受
託番号FERM BP−4129を付された。
は、ML−236B生産能を先天的に有する微生物をい
う。ML−236B生産菌としては、例えば、ペニシリ
ウム(Penicillium)属に属するML−236B生産菌
が挙げられ、ペニシリウム・シトリナム、ペニシリウム
・ブレビコンパクタム(Penicilium brevicompactum:B
rown, A. G., et al., J. Chem. Soc. Perkin-1., 1165
(1976)記載)、ペニシリウム・シクロピウム(Penicill
ium cyclopium:Doss, S.L.,et al., J. Natl. Prod.,
49, 357(1986)記載)等が例示される。さらに、これら
以外に、ユーペニシリウム・エスピー M6603(Eu
penicillium sp.M6603:Endo, A., et al., J. Antibio
t.-Tokyo, 39, 1609(1986)記載)、ペシロミセス・ビリ
ディス FERM P−6236(Paecilomyces virid
is FERM P-6236:特開昭58−98092号公報記
載)、ペシロミセス・エスピー M2016(Paecilom
yces sp.M2016:Endo, A., et al., J. Antibiot.-Toky
o, 39, 1609(1986)記載)、トリコデルマ・ロンギブラ
チアタム M6735(Trichoderma longibrachiatum
M6735:Endo, A., et al., J. Antibiot.-Tokyo, 39, 1
609(1986)記載)、ヒポミセス・クリソスペルムス I
FO 7798(Hypomyces chrysospermus IFO 7798:
Endo, A., et al., J. Antibiot.-Tokyo, 39, 1609(198
6)記載)、グリオクラディウム・エスピー YJ−95
15(Gliocladium sp. YJ-9515:WO9806867
号公報記載)、トリコデルマ・ビリデ IFO 583
6(Trichoderma viride IFO 5836:特公昭62−19
15号公報記載)、ユーペニシリウム・レチクリスポル
ム IFO 9022(Eupenicillium reticulisporum
IFO 9022:特公昭62−19159号公報記載)等が
挙げられる。ML−236B生産菌としてはこれらのう
ち、好適にはペニシリウム・シトリナムであり、より好
適にはペニシリウム・シトリナム SANK13380
株およびその変異株を挙げることができる。ペニシリウ
ム・シトリナム SANK13380株は、平成4年
(1992年)12月22日付けで独立行政法人産業技
術総合研究所特許生物寄託センターに国際寄託され、受
託番号FERM BP−4129を付された。
【0011】ゲノムDNAライブラリーの作成法として
は、通常真核生物のゲノムDNAライブラリーを作製す
るための方法であれば特に限定されないが、例えば、マ
ニアティスらの方法(Maniatis, T., et al., Molecula
r cloning, a laboratory manual, 2nd ed., Cold Spri
ng Harbor Laboratory, Cold Spring Harbor, N.Y.(198
9)記載)等が挙げられる。
は、通常真核生物のゲノムDNAライブラリーを作製す
るための方法であれば特に限定されないが、例えば、マ
ニアティスらの方法(Maniatis, T., et al., Molecula
r cloning, a laboratory manual, 2nd ed., Cold Spri
ng Harbor Laboratory, Cold Spring Harbor, N.Y.(198
9)記載)等が挙げられる。
【0012】ML−236B生産菌のゲノムDNAは、
該生産菌培養物から菌体を回収して物理的に破砕した
後、核内DNAを抽出、精製することにより得られる。
該生産菌培養物から菌体を回収して物理的に破砕した
後、核内DNAを抽出、精製することにより得られる。
【0013】ML−236B生産菌の培養は、各ML−
236B生産菌に適した条件下で行なうことができる。
好適なML−236B生産菌であるペニシリウム・シト
リナムの培養は、該菌体を培養したスラントから、MB
G3−8培地(組成;7%(w/v)グリセリン、3%(w/v)
グルコース、1%(w/v)大豆粉、1%(w/v)ペプトン(極
東製薬工業(株)製)、1%(w/v)コーンスチープリカ
ー(ホーネンコーポレーション(株)製)、0.5%(w
/v)硝酸ナトリウム 、0.1%(w/v)硫酸マグネシウム
七水和物、pH6.5)へ該菌体を接種し、22乃至2
8℃、3乃至7日間、振盪しつつ保温することにより行
なうことができる。該スラントは、溶解させたPGA寒
天培地(組成;200g/L馬鈴薯抽出液、15%(w/v)
グリセリン、2%(w/v)寒天)を試験管に注ぎ、傾斜さ
せつつ固化させたものに、白金耳を用いてペニシリウム
・シトリナムを接種し、22乃至28℃、7乃至15日
間保温することにより作製する。該スラントを0乃至4
℃で保存することにより、該スラント上で該菌を継続的
に生存させることができる。
236B生産菌に適した条件下で行なうことができる。
好適なML−236B生産菌であるペニシリウム・シト
リナムの培養は、該菌体を培養したスラントから、MB
G3−8培地(組成;7%(w/v)グリセリン、3%(w/v)
グルコース、1%(w/v)大豆粉、1%(w/v)ペプトン(極
東製薬工業(株)製)、1%(w/v)コーンスチープリカ
ー(ホーネンコーポレーション(株)製)、0.5%(w
/v)硝酸ナトリウム 、0.1%(w/v)硫酸マグネシウム
七水和物、pH6.5)へ該菌体を接種し、22乃至2
8℃、3乃至7日間、振盪しつつ保温することにより行
なうことができる。該スラントは、溶解させたPGA寒
天培地(組成;200g/L馬鈴薯抽出液、15%(w/v)
グリセリン、2%(w/v)寒天)を試験管に注ぎ、傾斜さ
せつつ固化させたものに、白金耳を用いてペニシリウム
・シトリナムを接種し、22乃至28℃、7乃至15日
間保温することにより作製する。該スラントを0乃至4
℃で保存することにより、該スラント上で該菌を継続的
に生存させることができる。
【0014】液体培地で培養したML−236B生産菌
の菌体は、遠心分離により、固体培地で培養した該菌の
菌体は、セル・スクレーパー等でかきとることにより、
それぞれ回収することができる。
の菌体は、遠心分離により、固体培地で培養した該菌の
菌体は、セル・スクレーパー等でかきとることにより、
それぞれ回収することができる。
【0015】菌体の物理的破砕は、菌体を液体窒素等で
凍結しつつ乳鉢と乳棒ですり潰すことにより行なうこと
ができる。破砕された菌体の核内DNAの抽出は、ドデ
シル硫酸ナトリウム(sodium dodecyls
ulfate:以下、「SDS」という。)等の界面活
性剤を用いて行なうことができる。抽出されたゲノムD
NAは、フェノール・クロロホルム抽出を行なうことに
より除タンパクされ、エタノール沈澱を行なうことによ
り沈澱として回収することができる。
凍結しつつ乳鉢と乳棒ですり潰すことにより行なうこと
ができる。破砕された菌体の核内DNAの抽出は、ドデ
シル硫酸ナトリウム(sodium dodecyls
ulfate:以下、「SDS」という。)等の界面活
性剤を用いて行なうことができる。抽出されたゲノムD
NAは、フェノール・クロロホルム抽出を行なうことに
より除タンパクされ、エタノール沈澱を行なうことによ
り沈澱として回収することができる。
【0016】得られたゲノムDNAは適当な制限酵素で
限定分解させ、断片化することができる。限定分解に使
用される制限酵素としては、通常入手可能な制限酵素で
あれば特に限定されないが、例えば、Sau3AI等を
挙げることができる。断片化されたDNAをゲル電気泳
動に供し、適当なサイズのゲノムDNAを含むゲルから
DNAを回収する。DNA断片のサイズには特に限定は
ないが、好適には20kb以上である。
限定分解させ、断片化することができる。限定分解に使
用される制限酵素としては、通常入手可能な制限酵素で
あれば特に限定されないが、例えば、Sau3AI等を
挙げることができる。断片化されたDNAをゲル電気泳
動に供し、適当なサイズのゲノムDNAを含むゲルから
DNAを回収する。DNA断片のサイズには特に限定は
ないが、好適には20kb以上である。
【0017】ゲノムDNAライブラリー作製用のDNA
ベクターとしては、該DNAベクターで形質転換された
宿主細胞内で複製されるのに必要な塩基配列を有するも
のであれば特に限定されないが、例えば、プラスミドベ
クター、ファージベクター、コスミドベクター、BAC
ベクター等が挙げられ、好適にはコスミドベクターであ
る。また、これらDNAベクターは発現ベクターであっ
てもよい。さらに、該DNAベクターは、該DNAベク
ターで形質転換された宿主細胞に表現形質(表現型;P
henotype)の選択性を付与する塩基配列を有し
ていることが好ましい。
ベクターとしては、該DNAベクターで形質転換された
宿主細胞内で複製されるのに必要な塩基配列を有するも
のであれば特に限定されないが、例えば、プラスミドベ
クター、ファージベクター、コスミドベクター、BAC
ベクター等が挙げられ、好適にはコスミドベクターであ
る。また、これらDNAベクターは発現ベクターであっ
てもよい。さらに、該DNAベクターは、該DNAベク
ターで形質転換された宿主細胞に表現形質(表現型;P
henotype)の選択性を付与する塩基配列を有し
ていることが好ましい。
【0018】該DNAベクターは、クローニング及び機
能発現の双方に適用できるものであることが好ましい。
該DNAベクターとしては、複数の微生物群に形質転換
可能なシャトルベクターを用いることが好ましい。該シ
ャトルベクターは、少なくとも一方の微生物群の宿主細
胞において複製されるのに必要な塩基配列を有する。ま
た、シャトルベクターは複数の微生物群の宿主にそれぞ
れ表現形質の選択性を付与する塩基配列を有しているこ
とが好ましい。
能発現の双方に適用できるものであることが好ましい。
該DNAベクターとしては、複数の微生物群に形質転換
可能なシャトルベクターを用いることが好ましい。該シ
ャトルベクターは、少なくとも一方の微生物群の宿主細
胞において複製されるのに必要な塩基配列を有する。ま
た、シャトルベクターは複数の微生物群の宿主にそれぞ
れ表現形質の選択性を付与する塩基配列を有しているこ
とが好ましい。
【0019】該シャトルベクターにより形質転換される
微生物群の組合わせとしては、一方の微生物群がクロー
ニングに適用でき、且つ他方がML−236B生産能を
有していれば特に限定されないが、例えば、細菌及び糸
状菌の組合わせ、酵母及び糸状菌の組合わせ等が挙げら
れ、好適には細菌及び糸状菌の組合わせである。細菌と
しては、通常遺伝子工学に使用されるものであれば特に
限定されないが、例えば、大腸菌、枯草菌等を挙げるこ
とができ、好適には大腸菌であり、より好適には大腸菌
XL1−BlueMR株である。酵母としては、通常遺
伝子工学に用いられるものであれば特に限定されない
が、例えば、サッカロミセス・セレビシエ(Saccharomy
ces cerevisiae)等を挙げることができる。糸状菌とし
ては、上述のML−236B生産菌等が挙げられる。な
お、本発明において微生物群は、細菌、糸状菌及び酵母
から選択される。
微生物群の組合わせとしては、一方の微生物群がクロー
ニングに適用でき、且つ他方がML−236B生産能を
有していれば特に限定されないが、例えば、細菌及び糸
状菌の組合わせ、酵母及び糸状菌の組合わせ等が挙げら
れ、好適には細菌及び糸状菌の組合わせである。細菌と
しては、通常遺伝子工学に使用されるものであれば特に
限定されないが、例えば、大腸菌、枯草菌等を挙げるこ
とができ、好適には大腸菌であり、より好適には大腸菌
XL1−BlueMR株である。酵母としては、通常遺
伝子工学に用いられるものであれば特に限定されない
が、例えば、サッカロミセス・セレビシエ(Saccharomy
ces cerevisiae)等を挙げることができる。糸状菌とし
ては、上述のML−236B生産菌等が挙げられる。な
お、本発明において微生物群は、細菌、糸状菌及び酵母
から選択される。
【0020】このようなシャトルベクターとしては、例
えば、適当な表現型選択マーカー遺伝子及びコス(co
s)部位を有するコスミドベクター等を挙げることがで
き、好適には大腸菌ハイグロマイシンBホスフォトラン
スフェラーゼ遺伝子配列を有するプラスミドpSAK3
33(特開平3−262486号公報記載)にコスミド
ベクターpWE15(STRATAGENE社製)の有
するコス(cos)部位を挿入して作製されたpSAK
cos1が挙げられるが、これらに限定されない。pS
AKcos1の構築手順については特開2000−11
2487図1に記載されている。
えば、適当な表現型選択マーカー遺伝子及びコス(co
s)部位を有するコスミドベクター等を挙げることがで
き、好適には大腸菌ハイグロマイシンBホスフォトラン
スフェラーゼ遺伝子配列を有するプラスミドpSAK3
33(特開平3−262486号公報記載)にコスミド
ベクターpWE15(STRATAGENE社製)の有
するコス(cos)部位を挿入して作製されたpSAK
cos1が挙げられるが、これらに限定されない。pS
AKcos1の構築手順については特開2000−11
2487図1に記載されている。
【0021】上述のML−236B生産菌ゲノムDNA
断片をライゲーションしたシャトルベクターを宿主細胞
に導入することにより、所望のゲノムDNAライブラリ
ーが完成する。宿主細胞には、好適には大腸菌、より好
適には大腸菌XL1−BlueMR株がそれぞれ使用さ
れる。宿主細胞が大腸菌の場合、該導入はin vit
roパッケージングにより行なう。本発明において、形
質転換とは、in vitroパッケージングによる外
来DNAの導入も意味し、in vitroパッケージ
ングにより外来DNAを導入された細胞も形質転換細胞
の意味に包含される。
断片をライゲーションしたシャトルベクターを宿主細胞
に導入することにより、所望のゲノムDNAライブラリ
ーが完成する。宿主細胞には、好適には大腸菌、より好
適には大腸菌XL1−BlueMR株がそれぞれ使用さ
れる。宿主細胞が大腸菌の場合、該導入はin vit
roパッケージングにより行なう。本発明において、形
質転換とは、in vitroパッケージングによる外
来DNAの導入も意味し、in vitroパッケージ
ングにより外来DNAを導入された細胞も形質転換細胞
の意味に包含される。
【0022】ペニシリウム・シトリナム SANK13
380株およびその変異株からのML−236B生合成
遺伝子及び遺伝子クラスターは、特開2000−112
487に記載の方法、あるいは本発明における実施例に
より単離できる。所望のクローンのスクリーニングに
は、抗体又は核酸プローブを用い、好適には、核酸プロ
ーブを用いる。該核酸プローブは、特開2000−11
2487において公開された塩基配列に基づいて、ゲノ
ムDNAの部分塩基配列からなるオリゴヌクレオチドプ
ローブの合成により、またオリゴヌクレオチドプライマ
ーを作製し、ゲノムDNAあるいはpML48(特開2
000−112487公報記載)を鋳型としたポリメラ
ーゼ連鎖反応(Polymerase chain r
eaction:以下、「PCR」という。:Saiki,
R. K., et al., Science, 239, 487(1988)記載)を行な
うことにより、又は、pML48の制限酵素消化断片を
取得することにより、作製することができる。
380株およびその変異株からのML−236B生合成
遺伝子及び遺伝子クラスターは、特開2000−112
487に記載の方法、あるいは本発明における実施例に
より単離できる。所望のクローンのスクリーニングに
は、抗体又は核酸プローブを用い、好適には、核酸プロ
ーブを用いる。該核酸プローブは、特開2000−11
2487において公開された塩基配列に基づいて、ゲノ
ムDNAの部分塩基配列からなるオリゴヌクレオチドプ
ローブの合成により、またオリゴヌクレオチドプライマ
ーを作製し、ゲノムDNAあるいはpML48(特開2
000−112487公報記載)を鋳型としたポリメラ
ーゼ連鎖反応(Polymerase chain r
eaction:以下、「PCR」という。:Saiki,
R. K., et al., Science, 239, 487(1988)記載)を行な
うことにより、又は、pML48の制限酵素消化断片を
取得することにより、作製することができる。
【0023】組換えDNAベクターpML48を保持す
る、形質転換大腸菌 E.colipML48 SAN
K71199は平成11年(1999年)7月7日付け
で独立行政法人産業技術総合研究所特許生物寄託センタ
ーに国際寄託され、受託番号FERM BP−6780
を付されている。
る、形質転換大腸菌 E.colipML48 SAN
K71199は平成11年(1999年)7月7日付け
で独立行政法人産業技術総合研究所特許生物寄託センタ
ーに国際寄託され、受託番号FERM BP−6780
を付されている。
【0024】核酸プローブの標識は、放射性標識及び非
放射性標識に大別される。放射性標識に使用される放射
性核種としては、通常使用されるものであれば特に限定
されないが、例えば、32P、35S、14C等を挙げること
ができ、好適には32Pである。非放射性標識に用いる試
薬としては、通常核酸の標識に用いられるものであれば
特に限定されないが、例えば、ジゴキシゲニン、ビオチ
ン等が挙げられ、好適にはジゴキシゲニンである。核酸
プローブを標識する方法としては、通常使用される方法
であれば特に限定されないが、例えば、標識基質を用い
たPCRにより該産物中に取り込ませる方法、ニック・
トランスレーション法、ランダム・プライマー法、末端
標識法、標識基質を用いてオリゴヌクレオチドDNAを
合成する方法等を挙げることができ、核酸プローブの種
類等によりこれらの方法から適宜選択できる。
放射性標識に大別される。放射性標識に使用される放射
性核種としては、通常使用されるものであれば特に限定
されないが、例えば、32P、35S、14C等を挙げること
ができ、好適には32Pである。非放射性標識に用いる試
薬としては、通常核酸の標識に用いられるものであれば
特に限定されないが、例えば、ジゴキシゲニン、ビオチ
ン等が挙げられ、好適にはジゴキシゲニンである。核酸
プローブを標識する方法としては、通常使用される方法
であれば特に限定されないが、例えば、標識基質を用い
たPCRにより該産物中に取り込ませる方法、ニック・
トランスレーション法、ランダム・プライマー法、末端
標識法、標識基質を用いてオリゴヌクレオチドDNAを
合成する方法等を挙げることができ、核酸プローブの種
類等によりこれらの方法から適宜選択できる。
【0025】上述の通り作製された標識核酸プローブを
用い、ゲノムDNAライブラリーから目的クローンをス
クリーニングすることができる。該スクリーニング方法
としては、通常遺伝子クローニングに使用される方法で
あれば特に限定されないが、好適にはコロニー・ハイブ
リダイゼーション法(Maniatis, T., et al., Molecula
r cloning, a laboratory manual, 2nd ed., Cold Spri
ng Harbor Laboratory,Cold Spring Harbor, N. Y.(198
9)記載)を使用することができる。コロニー・ハイブリ
ダイゼーションに用いるコロニーの培養は、各宿主細胞
に適した条件下で行なうことができ、好適な宿主細胞で
ある大腸菌の形質転換体の培養は、LB寒天培地(1%
(w/v)トリプトン、0.5%(w/v)イーストエキストラク
ト、0.5%(w/v)塩化ナトリウム、1.5%(w/v)アガ
ロース)上で、30乃至37℃、18時間乃至2日間保
温することにより行なうことができる。コロニー・ハイ
ブリダイゼーションにより得られる陽性クローンからの
組換えDNAベクターの調製は、該陽性クローンの培養
物からプラスミドを抽出及び精製することによりなされ
る。
用い、ゲノムDNAライブラリーから目的クローンをス
クリーニングすることができる。該スクリーニング方法
としては、通常遺伝子クローニングに使用される方法で
あれば特に限定されないが、好適にはコロニー・ハイブ
リダイゼーション法(Maniatis, T., et al., Molecula
r cloning, a laboratory manual, 2nd ed., Cold Spri
ng Harbor Laboratory,Cold Spring Harbor, N. Y.(198
9)記載)を使用することができる。コロニー・ハイブリ
ダイゼーションに用いるコロニーの培養は、各宿主細胞
に適した条件下で行なうことができ、好適な宿主細胞で
ある大腸菌の形質転換体の培養は、LB寒天培地(1%
(w/v)トリプトン、0.5%(w/v)イーストエキストラク
ト、0.5%(w/v)塩化ナトリウム、1.5%(w/v)アガ
ロース)上で、30乃至37℃、18時間乃至2日間保
温することにより行なうことができる。コロニー・ハイ
ブリダイゼーションにより得られる陽性クローンからの
組換えDNAベクターの調製は、該陽性クローンの培養
物からプラスミドを抽出及び精製することによりなされ
る。
【0026】形質転換宿主細胞の培養物からのプラスミ
ドの調製は、該宿主細胞の菌体を回収し、ゲノムDNA
やタンパク質を除去することによりなされる。好適な宿
主細胞である大腸菌の形質転換体の培養物からのプラス
ミドの調製は、マニアティスらのアルカリ法(Maniati
s, T., et al., Molecular cloning, a laboratory man
ual, 2nd ed., Cold Spring Harbor Laboratory, Cold
Spring Harbor, N. Y.(1989)記載)により行なうことが
できる。また、より純度の高いプラスミドを得るための
キットが市販されており、このようなキットとして、例
えば、Plasmid Mini Kit(QIAGE
N社製)が好適に使用される。さらに、プラスミドの大
量調製を行うキットが市販されており、このようなキッ
トとして、例えば、Plasmid Maxi Kit
(QIAGEN社製)が好適に使用される。
ドの調製は、該宿主細胞の菌体を回収し、ゲノムDNA
やタンパク質を除去することによりなされる。好適な宿
主細胞である大腸菌の形質転換体の培養物からのプラス
ミドの調製は、マニアティスらのアルカリ法(Maniati
s, T., et al., Molecular cloning, a laboratory man
ual, 2nd ed., Cold Spring Harbor Laboratory, Cold
Spring Harbor, N. Y.(1989)記載)により行なうことが
できる。また、より純度の高いプラスミドを得るための
キットが市販されており、このようなキットとして、例
えば、Plasmid Mini Kit(QIAGE
N社製)が好適に使用される。さらに、プラスミドの大
量調製を行うキットが市販されており、このようなキッ
トとして、例えば、Plasmid Maxi Kit
(QIAGEN社製)が好適に使用される。
【0027】得られたプラスミドのDNA濃度は、DN
A試料を適宜希釈して波長260nmにおける吸光度を
測定し、吸光度1=DNA50μg/mlとして算出す
ることができる。DNAの純度は、波長280及び26
0nmの吸光度の比率から算出することができる。
A試料を適宜希釈して波長260nmにおける吸光度を
測定し、吸光度1=DNA50μg/mlとして算出す
ることができる。DNAの純度は、波長280及び26
0nmの吸光度の比率から算出することができる。
【0028】本発明において新たに取得された組換えD
NAベクターであるpML42は、平成13年9月4日
付けで独立行政法人産業技術総合研究所特許生物寄託セ
ンターに国際寄託され、受託番号FERM BP−77
23を付された。また、組換えDNAベクターpML4
5は、平成13年9月4日付けで独立行政法人産業技術
総合研究所特許生物寄託センターに国際寄託され、受託
番号FERM BP−7724を付された。また、組換
えDNAベクターpML51は、平成13年9月4日付
けで独立行政法人産業技術総合研究所特許生物寄託セン
ターに国際寄託され、受託番号FERM BP−772
5を付された。
NAベクターであるpML42は、平成13年9月4日
付けで独立行政法人産業技術総合研究所特許生物寄託セ
ンターに国際寄託され、受託番号FERM BP−77
23を付された。また、組換えDNAベクターpML4
5は、平成13年9月4日付けで独立行政法人産業技術
総合研究所特許生物寄託センターに国際寄託され、受託
番号FERM BP−7724を付された。また、組換
えDNAベクターpML51は、平成13年9月4日付
けで独立行政法人産業技術総合研究所特許生物寄託セン
ターに国際寄託され、受託番号FERM BP−772
5を付された。
【0029】DNAの塩基配列は、マキサム−ギルバー
トの化学修飾法 (Maxiam, A. M. M.and Gilbert, W.,
Methods in Enzymology, 65, 499(1980)記載)又はジデ
オキシヌクレオチド鎖終結法 (Messing, J. and Vieir
a, J., Gene, 19, 269(1982)記載)等により決定でき
る。なお、塩基配列決定に供するプラスミドDNAとし
ては、より純度の高い標品が好ましい。
トの化学修飾法 (Maxiam, A. M. M.and Gilbert, W.,
Methods in Enzymology, 65, 499(1980)記載)又はジデ
オキシヌクレオチド鎖終結法 (Messing, J. and Vieir
a, J., Gene, 19, 269(1982)記載)等により決定でき
る。なお、塩基配列決定に供するプラスミドDNAとし
ては、より純度の高い標品が好ましい。
【0030】pML42の挿入塩基配列は、配列表の配
列番号1のヌクレオチド番号1乃至42758に示され
る。pML45の挿入塩基配列は、配列表の配列番号1
のヌクレオチド番号11614乃至47918に示され
る。pML51の挿入塩基配列は、配列表の配列番号1
のヌクレオチド番号36135乃至72149に示され
る。また、特開2000−112487に記載のpML
48の挿入塩基配列は、配列表の配列番号1のヌクレオ
チド番号29581乃至63783に示される。通常ゲ
ノムDNAの塩基配列は同種内において遺伝的多型(ポ
リモルフィズム:polymorphysm)を有して
いる。また、DNAクローニングの過程及び塩基配列決
定の過程において、ヌクレオチドの置換等が一定の確率
で生じ得る。従って、本発明は、配列表の配列番号1の
ヌクレオチド番号1乃至72149に示される塩基配列
およびその相補鎖を有するDNAにハイブリダイズする
DNA、及び配列表の配列番号1およびその相補鎖を有
するDNAにストリンジェントな条件下でハイブリダイ
ズするDNAをも包合する。これらDNAとしては、配
列表の配列番号1のヌクレオチド番号1乃至72149
に示される塩基配列およびその相補鎖に1つ以上のヌク
レオチドの置換、欠失及び/又は付加が生じたもの、並
びに、ML−236B又はその誘導体を生産する、ペニ
シリウム・シトリナム SANK13380株以外の微
生物に由来するものであり、該微生物に導入されること
により該菌のML−236B又はその誘導体の生産能を
改善する機能を有するものをも包合する。
列番号1のヌクレオチド番号1乃至42758に示され
る。pML45の挿入塩基配列は、配列表の配列番号1
のヌクレオチド番号11614乃至47918に示され
る。pML51の挿入塩基配列は、配列表の配列番号1
のヌクレオチド番号36135乃至72149に示され
る。また、特開2000−112487に記載のpML
48の挿入塩基配列は、配列表の配列番号1のヌクレオ
チド番号29581乃至63783に示される。通常ゲ
ノムDNAの塩基配列は同種内において遺伝的多型(ポ
リモルフィズム:polymorphysm)を有して
いる。また、DNAクローニングの過程及び塩基配列決
定の過程において、ヌクレオチドの置換等が一定の確率
で生じ得る。従って、本発明は、配列表の配列番号1の
ヌクレオチド番号1乃至72149に示される塩基配列
およびその相補鎖を有するDNAにハイブリダイズする
DNA、及び配列表の配列番号1およびその相補鎖を有
するDNAにストリンジェントな条件下でハイブリダイ
ズするDNAをも包合する。これらDNAとしては、配
列表の配列番号1のヌクレオチド番号1乃至72149
に示される塩基配列およびその相補鎖に1つ以上のヌク
レオチドの置換、欠失及び/又は付加が生じたもの、並
びに、ML−236B又はその誘導体を生産する、ペニ
シリウム・シトリナム SANK13380株以外の微
生物に由来するものであり、該微生物に導入されること
により該菌のML−236B又はその誘導体の生産能を
改善する機能を有するものをも包合する。
【0031】なお、本発明において、ハイブリダイズと
は、2本の一本鎖核酸同士が互いに相補的な領域又は相
補性の高い領域において二本鎖を形成することをいい、
ストリンジェントな条件とは、ハイブリダイゼーション
液の組成が6×SSC(1×SSCの組成は、150m
M NaCl、15mM クエン酸三ナトリウム。)で
あり且つハイブリダイゼーションを行なう際の保温温度
が55℃の場合をいう。ゲノムDNA配列中の遺伝子領
域の推定は、既存の遺伝子解析プログラム(Gene
Findingプログラム(以下、「GRAIL」とい
う。)及び配列の相同性検索プログラム(BLASTN
及びBLASTX)により行なうことができる。
は、2本の一本鎖核酸同士が互いに相補的な領域又は相
補性の高い領域において二本鎖を形成することをいい、
ストリンジェントな条件とは、ハイブリダイゼーション
液の組成が6×SSC(1×SSCの組成は、150m
M NaCl、15mM クエン酸三ナトリウム。)で
あり且つハイブリダイゼーションを行なう際の保温温度
が55℃の場合をいう。ゲノムDNA配列中の遺伝子領
域の推定は、既存の遺伝子解析プログラム(Gene
Findingプログラム(以下、「GRAIL」とい
う。)及び配列の相同性検索プログラム(BLASTN
及びBLASTX)により行なうことができる。
【0032】GRAILはゲノム配列の「遺伝子配列ら
しさ」を評価する7つのパラメータに分割し、それらの
結果をニューラルネット法を用いて統合することによ
り、ゲノムDNA上の構造遺伝子を検索するプログラム
(Uberbacher, E. C. & Mural, R. J., Proc. Natl. Ac
ad. Sci. USA., 88, 11261(1991)記載)であり、Apo
Com GRAIL Toolkit(APOCOM社
製)が好適に使用される。BLASTは核酸配列及びア
ミノ酸配列の相同性検索を行なうアルゴリズム(Altech
ul, S. F., Madden, T. L., et al., Nucl. Acids Re
s.,25, 3389(1997)記載)を用いたプログラムである。
しさ」を評価する7つのパラメータに分割し、それらの
結果をニューラルネット法を用いて統合することによ
り、ゲノムDNA上の構造遺伝子を検索するプログラム
(Uberbacher, E. C. & Mural, R. J., Proc. Natl. Ac
ad. Sci. USA., 88, 11261(1991)記載)であり、Apo
Com GRAIL Toolkit(APOCOM社
製)が好適に使用される。BLASTは核酸配列及びア
ミノ酸配列の相同性検索を行なうアルゴリズム(Altech
ul, S. F., Madden, T. L., et al., Nucl. Acids Re
s.,25, 3389(1997)記載)を用いたプログラムである。
【0033】ゲノムDNA配列を適当な長さに分割し、
BLASTNを用いて遺伝子データベースに対し相同性
検索することにより、被検DNA配列上の構造遺伝子の
位置及び方向を推定することができる。また、分割され
たゲノムDNA配列を6つの翻訳フレーム(センス配列
及びアンチセンス配列に各々3つずつ)に従ってアミノ
酸配列に翻訳し、該アミノ酸配列のペプチド・データベ
ースに対する相同性検索をBLASTXにより行なうこ
とにより、被検DNA配列上の構造遺伝子の位置及び方
向の推定を行なうこともできる。さらに、真核生物にお
いては、ゲノムDNA配列中に含まれる構造遺伝子のコ
ード領域がイントロン配列により分断されている場合が
あり、このようなギャップを有する構造遺伝子の解析に
はギャップ含有配列用のBLASTがより有効であり、
Gapped−BLAST(BLAST2:WISCO
NSIN GCG package ver. 10.
0に搭載)が好適に使用される。
BLASTNを用いて遺伝子データベースに対し相同性
検索することにより、被検DNA配列上の構造遺伝子の
位置及び方向を推定することができる。また、分割され
たゲノムDNA配列を6つの翻訳フレーム(センス配列
及びアンチセンス配列に各々3つずつ)に従ってアミノ
酸配列に翻訳し、該アミノ酸配列のペプチド・データベ
ースに対する相同性検索をBLASTXにより行なうこ
とにより、被検DNA配列上の構造遺伝子の位置及び方
向の推定を行なうこともできる。さらに、真核生物にお
いては、ゲノムDNA配列中に含まれる構造遺伝子のコ
ード領域がイントロン配列により分断されている場合が
あり、このようなギャップを有する構造遺伝子の解析に
はギャップ含有配列用のBLASTがより有効であり、
Gapped−BLAST(BLAST2:WISCO
NSIN GCG package ver. 10.
0に搭載)が好適に使用される。
【0034】本発明において得られた組換えDNAベク
ターpML42、pML45、pML51の挿入配列上
には、20の構造遺伝子の存在が推定され、それぞれを
mlcA、mlcB、mlcC、mlcD、mlcE、
mlcF、mlcG、mlcH、mlcR、orf1、
orf11、orf12、orf13、orf14、o
rf15、orf16、orf17、orf18、or
f19、orf20と命名した。これらの構造遺伝子の
うち、mlcA、mlcB、mlcC、mlcD、ml
cE及びmlcRの6つの遺伝子については、特開20
00−112487において記載されている。
ターpML42、pML45、pML51の挿入配列上
には、20の構造遺伝子の存在が推定され、それぞれを
mlcA、mlcB、mlcC、mlcD、mlcE、
mlcF、mlcG、mlcH、mlcR、orf1、
orf11、orf12、orf13、orf14、o
rf15、orf16、orf17、orf18、or
f19、orf20と命名した。これらの構造遺伝子の
うち、mlcA、mlcB、mlcC、mlcD、ml
cE及びmlcRの6つの遺伝子については、特開20
00−112487において記載されている。
【0035】これらの構造遺伝子は配列表の配列番号1
に示される塩基配列上にコード領域を有する。
に示される塩基配列上にコード領域を有する。
【0036】本発明においては、新規に14の構造遺伝
子を見出し、その中で、ML−236Bの生合成に関与
する3つの構造遺伝子mlcF、mlcG及びmlcH
を見出すことができる。
子を見出し、その中で、ML−236Bの生合成に関与
する3つの構造遺伝子mlcF、mlcG及びmlcH
を見出すことができる。
【0037】ノーザンブロット・ハイブリダイゼーショ
ン法により、構造遺伝子の発現を調べることができる。
ン法により、構造遺伝子の発現を調べることができる。
【0038】ノーザンブロット・ハイブリダイゼーショ
ンに供するML−236B生産菌の全RNAは、該菌の
培養物より得ることができる。好適なML−236B生
産菌であるペニシリウム・シトリナムの培養は、該菌の
スラントからMGB3−8培地に該菌を接種し、22乃
至28℃、1乃至4日間、振盪しつつ保温することによ
り行なうことができる。
ンに供するML−236B生産菌の全RNAは、該菌の
培養物より得ることができる。好適なML−236B生
産菌であるペニシリウム・シトリナムの培養は、該菌の
スラントからMGB3−8培地に該菌を接種し、22乃
至28℃、1乃至4日間、振盪しつつ保温することによ
り行なうことができる。
【0039】ML−236B生産菌からのRNAの抽出
は、通常全RNAを調製するのに使用される方法であれ
ば特に限定されないが、例えば、グアニジン・チオシア
ネート・ホットフェノール法、グアニジン・チオシアネ
ート−グアニジン・塩酸法等が挙げられる。また、より
純度の高い全RNAを調製するための市販キットとして
は、例えば、RNeasy Plant Mini K
it(キアゲン社製)等が挙げられる。さらに、mRN
Aは、全RNAをオリゴ(dT)カラムに添加し、該カ
ラムに吸着した画分を回収することにより得ることがで
きる。
は、通常全RNAを調製するのに使用される方法であれ
ば特に限定されないが、例えば、グアニジン・チオシア
ネート・ホットフェノール法、グアニジン・チオシアネ
ート−グアニジン・塩酸法等が挙げられる。また、より
純度の高い全RNAを調製するための市販キットとして
は、例えば、RNeasy Plant Mini K
it(キアゲン社製)等が挙げられる。さらに、mRN
Aは、全RNAをオリゴ(dT)カラムに添加し、該カ
ラムに吸着した画分を回収することにより得ることがで
きる。
【0040】RNAのメンブレンへのトランスファー、
プローブの調製、ハイブリダイゼーション及びシグナル
の検出はマニアティスらの方法(Maniatis T., et al.,
Molecular cloning, a laboratory manual, 2nd ed.,
Cold Spring Harbor Laboratory, Cold Spring Harbor,
N.Y.(1989)記載)により行うことができる。各構造遺
伝子の5’−末端及び3’−末端の解析は、RACE
(rapid amplification of c
DNA ends)法により行なうことができる。RA
CEは、mRNAを鋳型とし、塩基配列が決定されてい
る領域から塩基配列が決定されていない5’−末端又は
3’−末端領域までを含むcDNAを、RT−PCRの
応用により取得する方法である(Frohman. M. A., et a
l.,Proc. Natl. Acad. Sci. U.S.A.,85, 8998(1988)記
載)。
プローブの調製、ハイブリダイゼーション及びシグナル
の検出はマニアティスらの方法(Maniatis T., et al.,
Molecular cloning, a laboratory manual, 2nd ed.,
Cold Spring Harbor Laboratory, Cold Spring Harbor,
N.Y.(1989)記載)により行うことができる。各構造遺
伝子の5’−末端及び3’−末端の解析は、RACE
(rapid amplification of c
DNA ends)法により行なうことができる。RA
CEは、mRNAを鋳型とし、塩基配列が決定されてい
る領域から塩基配列が決定されていない5’−末端又は
3’−末端領域までを含むcDNAを、RT−PCRの
応用により取得する方法である(Frohman. M. A., et a
l.,Proc. Natl. Acad. Sci. U.S.A.,85, 8998(1988)記
載)。
【0041】RT−PCRとはmRNAを鋳型として、
逆転写酵素(reverse transcripta
se)でcDNAを合成した後、PCRを行なう方法
(逆転写PCR:reverse transcrip
tation−PCR)のことをいう。
逆転写酵素(reverse transcripta
se)でcDNAを合成した後、PCRを行なう方法
(逆転写PCR:reverse transcrip
tation−PCR)のことをいう。
【0042】5’RACEは以下の方法に従う。mRN
Aを鋳型とし、塩基配列中の公知の部分に基いて設計さ
れたアンチセンス側のオリゴヌクレオチドDNA(1)
をプライマーとした逆転写酵素反応によりcDNA第一
鎖を合成した後、ターミナルデオキシヌクレオチヂルト
ランスフェラーゼにより該cDNA第一鎖の3’−末端
にホモポリメリックな(homopolymeric:
単一塩基からなる)ヌクレオチド鎖を付加させる。該c
DNA第一鎖を鋳型とし且つ該ホモポリメリックな塩基
配列に相補的な塩基配列を含むセンス側のオリゴヌクレ
オチドDNA、及び、アンチセンス側に存在し且つオリ
ゴヌクレオチドDNA(1)より3’−側に存在するオ
リゴヌクレオチドDNA(2)をプライマーとしたPC
Rによって、5’−末端領域の二本鎖cDNAを増幅さ
せる方法である(Frohman, M. A.,Methods in Enzymo
l., 218, 340(1993)記載)。5’RACE用のキットが
市販されており、このようなキットとして、例えば、
5’RACE Systemfor Rapid Am
plification of cDNA ends,
Version 2.0(ギブコ社製)等が好適に使用
される。
Aを鋳型とし、塩基配列中の公知の部分に基いて設計さ
れたアンチセンス側のオリゴヌクレオチドDNA(1)
をプライマーとした逆転写酵素反応によりcDNA第一
鎖を合成した後、ターミナルデオキシヌクレオチヂルト
ランスフェラーゼにより該cDNA第一鎖の3’−末端
にホモポリメリックな(homopolymeric:
単一塩基からなる)ヌクレオチド鎖を付加させる。該c
DNA第一鎖を鋳型とし且つ該ホモポリメリックな塩基
配列に相補的な塩基配列を含むセンス側のオリゴヌクレ
オチドDNA、及び、アンチセンス側に存在し且つオリ
ゴヌクレオチドDNA(1)より3’−側に存在するオ
リゴヌクレオチドDNA(2)をプライマーとしたPC
Rによって、5’−末端領域の二本鎖cDNAを増幅さ
せる方法である(Frohman, M. A.,Methods in Enzymo
l., 218, 340(1993)記載)。5’RACE用のキットが
市販されており、このようなキットとして、例えば、
5’RACE Systemfor Rapid Am
plification of cDNA ends,
Version 2.0(ギブコ社製)等が好適に使用
される。
【0043】3’RACEは、mRNAの3’−末端に
存在するポリA領域を利用する方法である。すなわち、
mRNAを鋳型として、オリゴd(T)アダプターをプ
ライマーとした逆転写酵素反応によりcDNA第一鎖を
合成した後、該cDNA第一鎖を鋳型として、塩基配列
中の公知の部分に基いて設計されたセンス側のオリゴヌ
クレオチドDNA(3)、及び、アンチセンス側のオリ
ゴd(T)アダプターをプライマーとしたPCRによっ
て、3’−末端領域の二本鎖cDNAを増幅させる方法
である。3’RACE用のキットが市販されており、こ
のようなキットとして、例えば、Ready−To−G
o T−primed First−Strand K
it(アマシャム ファルマシア バイオテク社製)が
好適に使用される。
存在するポリA領域を利用する方法である。すなわち、
mRNAを鋳型として、オリゴd(T)アダプターをプ
ライマーとした逆転写酵素反応によりcDNA第一鎖を
合成した後、該cDNA第一鎖を鋳型として、塩基配列
中の公知の部分に基いて設計されたセンス側のオリゴヌ
クレオチドDNA(3)、及び、アンチセンス側のオリ
ゴd(T)アダプターをプライマーとしたPCRによっ
て、3’−末端領域の二本鎖cDNAを増幅させる方法
である。3’RACE用のキットが市販されており、こ
のようなキットとして、例えば、Ready−To−G
o T−primed First−Strand K
it(アマシャム ファルマシア バイオテク社製)が
好適に使用される。
【0044】RACEにおける塩基配列中の公知の部分
に基いたプライマーの設計には、上記遺伝子解析ソフト
による解析、ノーザンブロット・ハイブリダイゼーショ
ン法による解析結果が好適に利用できる。上記遺伝子解
析ソフトによる解析、ノーザンブロット・ハイブリダイ
ゼーション法による解析、5’−末端、3’−末端の解
析により、ゲノムDNA配列上の構造遺伝子の方向、並
びに、構造遺伝子中の転写開始点の位置、翻訳開始コド
ンの位置、翻訳終止コドン及びその位置を推定すること
ができる。これらの情報に基づいて、各構造遺伝子及び
そのcDNAを取得することが可能である。
に基いたプライマーの設計には、上記遺伝子解析ソフト
による解析、ノーザンブロット・ハイブリダイゼーショ
ン法による解析結果が好適に利用できる。上記遺伝子解
析ソフトによる解析、ノーザンブロット・ハイブリダイ
ゼーション法による解析、5’−末端、3’−末端の解
析により、ゲノムDNA配列上の構造遺伝子の方向、並
びに、構造遺伝子中の転写開始点の位置、翻訳開始コド
ンの位置、翻訳終止コドン及びその位置を推定すること
ができる。これらの情報に基づいて、各構造遺伝子及び
そのcDNAを取得することが可能である。
【0045】ML−236B生合成遺伝子を含む組換え
DNAベクターの機能発現は、該組換えDNAベクター
で細胞を形質転換し、該形質転換細胞のML−236B
生産能を測定することにより行なうことができる。機能
発現を行なう細胞としては、上述のML−236B生産
菌又はML−236B非生産菌を用いることができる。
ML−236B非生産菌としては、該DNAベクターで
形質転換される細胞であれば特に限定されないが、例え
ば、上述のML−236B生産菌のML−236B非生
産変異株等が挙げられる。該変異株を形質転換すること
によりML−236Bの生産が回復すれば、該組換えD
NAベクターが所望の機能を有すると推定することがで
きる。
DNAベクターの機能発現は、該組換えDNAベクター
で細胞を形質転換し、該形質転換細胞のML−236B
生産能を測定することにより行なうことができる。機能
発現を行なう細胞としては、上述のML−236B生産
菌又はML−236B非生産菌を用いることができる。
ML−236B非生産菌としては、該DNAベクターで
形質転換される細胞であれば特に限定されないが、例え
ば、上述のML−236B生産菌のML−236B非生
産変異株等が挙げられる。該変異株を形質転換すること
によりML−236Bの生産が回復すれば、該組換えD
NAベクターが所望の機能を有すると推定することがで
きる。
【0046】また、ML−236B生産菌を形質転換し
て、ML−236Bの生産性が向上すれば、該組換えD
NAベクターが所望の機能を有すると推定することがで
きる。このような組換えDNAベクターとしては、例え
ば、pML42、pML45、pML51のようなML
−236B生合成遺伝子を複数含む組換えDNAベクタ
ーを挙げることができ、特にML−236Bの生合成に
関わる構造遺伝子を全て含むことが好ましい。また、上
述した構造遺伝子をそれぞれ単独で発現する組換えDN
Aベクターであってもよい。
て、ML−236Bの生産性が向上すれば、該組換えD
NAベクターが所望の機能を有すると推定することがで
きる。このような組換えDNAベクターとしては、例え
ば、pML42、pML45、pML51のようなML
−236B生合成遺伝子を複数含む組換えDNAベクタ
ーを挙げることができ、特にML−236Bの生合成に
関わる構造遺伝子を全て含むことが好ましい。また、上
述した構造遺伝子をそれぞれ単独で発現する組換えDN
Aベクターであってもよい。
【0047】該構造遺伝子に対応するcDNAの取得法
としては、各構造遺伝子の塩基配列に基づいて設計され
得るプライマーを用いたRT−PCRによるクローニン
グ、DNAプローブを用いたcDNAライブラリーから
のクローニング等が挙げられる。
としては、各構造遺伝子の塩基配列に基づいて設計され
得るプライマーを用いたRT−PCRによるクローニン
グ、DNAプローブを用いたcDNAライブラリーから
のクローニング等が挙げられる。
【0048】RT−PCRに用いるプライマーは、各構
造遺伝子の塩基配列に基づいて適当なものを設計するこ
とができるが、設計にはプライマー設計用のソフトウエ
アを用いることもできる。プライマー設計用のソフトウ
エアとしては例えば、DNASIS(日立ソフトウェア
エンジニアリング(株)製)を用いることができる。こ
れらの方法で取得できるcDNAを機能発現させるため
には、完全長のcDNAを得ることが好ましい。また、
RT−PCRにより機能発現し得るcDNAを取得する
ためには、該RT−PCR産物が本来の位置に翻訳開始
コドンを含み且つ該翻訳開始コドンより開始される翻訳
フレーム中には本来の位置以外に翻訳終止コドンを含ま
ないようにプライマーを設計することが必須である。M
L−236B生産微生物体内での機能発現に適したDN
Aベクター(以下、「発現ベクター」という。)として
は、ML−236B生産微生物を形質転換することがで
き、且つML−236B生合成促進cDNAの塩基配列
に対応するアミノ酸配列を含むことからなるポリペプチ
ドをML−236B生産微生物体内で機能発現させるこ
とができ、且つ宿主細胞内で安定に保持され、且つ宿主
細胞内で複製されるのに必要な塩基配列を有しているも
のであれば、特に限定されない。機能発現のための形質
転換法は、宿主細胞に依存して適宜選択される。例えば
好適なML−236B生産菌であるペニシリウム・シト
リナムの形質転換は、ペニシリウム・シトリナムの胞子
からプロトプラストを調製し、該プロトプラストに組換
えDNAベクターを導入することにより行なうことがで
きる(Nara, F., etal., Curr. Genet. 23, 28(1993)記
載)。
造遺伝子の塩基配列に基づいて適当なものを設計するこ
とができるが、設計にはプライマー設計用のソフトウエ
アを用いることもできる。プライマー設計用のソフトウ
エアとしては例えば、DNASIS(日立ソフトウェア
エンジニアリング(株)製)を用いることができる。こ
れらの方法で取得できるcDNAを機能発現させるため
には、完全長のcDNAを得ることが好ましい。また、
RT−PCRにより機能発現し得るcDNAを取得する
ためには、該RT−PCR産物が本来の位置に翻訳開始
コドンを含み且つ該翻訳開始コドンより開始される翻訳
フレーム中には本来の位置以外に翻訳終止コドンを含ま
ないようにプライマーを設計することが必須である。M
L−236B生産微生物体内での機能発現に適したDN
Aベクター(以下、「発現ベクター」という。)として
は、ML−236B生産微生物を形質転換することがで
き、且つML−236B生合成促進cDNAの塩基配列
に対応するアミノ酸配列を含むことからなるポリペプチ
ドをML−236B生産微生物体内で機能発現させるこ
とができ、且つ宿主細胞内で安定に保持され、且つ宿主
細胞内で複製されるのに必要な塩基配列を有しているも
のであれば、特に限定されない。機能発現のための形質
転換法は、宿主細胞に依存して適宜選択される。例えば
好適なML−236B生産菌であるペニシリウム・シト
リナムの形質転換は、ペニシリウム・シトリナムの胞子
からプロトプラストを調製し、該プロトプラストに組換
えDNAベクターを導入することにより行なうことがで
きる(Nara, F., etal., Curr. Genet. 23, 28(1993)記
載)。
【0049】プロトプラストの調製は以下の方法によっ
て行なうことができる。ペニシリウム・シトリナムを培
養したスラントからPGA寒天培地のプレートへ該菌を
接種し、22乃至28℃、10乃至14日間保温し、該
プレートから胞子を回収し、該胞子1×107乃至1×
109個を50乃至100mlのYPL−20培地(組
成;0.1%(w/v)イーストエキストラクト(Difc
o社製)、0.5%(w/v)ポリペプトン(日本製薬
(株)製)、20%(w/v)ラクトース、pH5.0)に
接種し、22乃至28℃、18時間乃至2日間保温す
る。該培養物から発芽胞子を回収し、細胞壁分解酵素で
処理し、プロトプラストを得る。細胞壁分解酵素として
は、ペニシリウム・シトリナムの細胞壁を分解するもの
であり且つ該菌に他に有害な作用を及ぼさないものであ
れば特に限定されないが、例えば、ザイモリアーゼ、キ
チナーゼ等が挙げられる。
て行なうことができる。ペニシリウム・シトリナムを培
養したスラントからPGA寒天培地のプレートへ該菌を
接種し、22乃至28℃、10乃至14日間保温し、該
プレートから胞子を回収し、該胞子1×107乃至1×
109個を50乃至100mlのYPL−20培地(組
成;0.1%(w/v)イーストエキストラクト(Difc
o社製)、0.5%(w/v)ポリペプトン(日本製薬
(株)製)、20%(w/v)ラクトース、pH5.0)に
接種し、22乃至28℃、18時間乃至2日間保温す
る。該培養物から発芽胞子を回収し、細胞壁分解酵素で
処理し、プロトプラストを得る。細胞壁分解酵素として
は、ペニシリウム・シトリナムの細胞壁を分解するもの
であり且つ該菌に他に有害な作用を及ぼさないものであ
れば特に限定されないが、例えば、ザイモリアーゼ、キ
チナーゼ等が挙げられる。
【0050】形質転換されたML−236B生産菌の培
養は、各宿主細胞に適した条件下で行なうことができる
が、好適なML−236B生産菌であるペニシリウム・
シトリナムの形質転換体の場合は、ML−236Bを生
産させる前に、形質転換された該菌のプロトプラストを
適当な条件下で培養することにより予め細胞壁を再生さ
せておく。
養は、各宿主細胞に適した条件下で行なうことができる
が、好適なML−236B生産菌であるペニシリウム・
シトリナムの形質転換体の場合は、ML−236Bを生
産させる前に、形質転換された該菌のプロトプラストを
適当な条件下で培養することにより予め細胞壁を再生さ
せておく。
【0051】該細胞壁の再生は、形質転換したペニシリ
ウム・シトリナムのプロトプラストを封入したVGS中
層寒天培地(組成;Vogel最小培地、2%(w/v)グ
ルコース、1Mグルシトール、2%(w/v)寒天)をVG
S下層寒天培地(組成;Vogel最小培地、2%(w/
v)グルコース、1Mグルシトール、2.7%(w/v)寒
天)及びVGS上層寒天培地(組成;Vogel最小培
地、2%(w/v)グルコース、1Mグルシトール、1.5
%(w/v)寒天)で挟み、22乃至28℃、7乃至15日
間保温することにより行なうことができる。得られた菌
株はPGA培地上で、22乃至28℃で保温しつつ継代
培養する。該菌株をPGA培地で作製したスラントに白
金耳を用いて接種し、22乃至28℃、10乃至14日
間保温し、0乃至4℃で保存する。
ウム・シトリナムのプロトプラストを封入したVGS中
層寒天培地(組成;Vogel最小培地、2%(w/v)グ
ルコース、1Mグルシトール、2%(w/v)寒天)をVG
S下層寒天培地(組成;Vogel最小培地、2%(w/
v)グルコース、1Mグルシトール、2.7%(w/v)寒
天)及びVGS上層寒天培地(組成;Vogel最小培
地、2%(w/v)グルコース、1Mグルシトール、1.5
%(w/v)寒天)で挟み、22乃至28℃、7乃至15日
間保温することにより行なうことができる。得られた菌
株はPGA培地上で、22乃至28℃で保温しつつ継代
培養する。該菌株をPGA培地で作製したスラントに白
金耳を用いて接種し、22乃至28℃、10乃至14日
間保温し、0乃至4℃で保存する。
【0052】上述の通り細胞壁を再生させたペニシリウ
ム・シトリナムの形質転換体を培養したスラントから、
MBG3−8培地(組成;7%(w/v)グリセリン、3%
(w/v)グルコース、1%(w/v)大豆粉、1%(w/v)ペプト
ン(極東製薬工業(株)製)、1%(w/v)コーンスチー
プリカー(ホーネンコーポレーション(株)製)、0.
5%(w/v)硝酸ナトリウム 、0.1%(w/v)硫酸マグネ
シウム七水和物、pH6.5)へ該形質転換体を接種
し、22乃至28℃、7乃至12日間、振盪しつつ保温
することにより、ML−236Bを効率よく生産するこ
とができる。なお、宿主細胞のペニシリウム・シトリナ
ムについても、全く同様の液体培養によりML−236
Bを生産させることができる。
ム・シトリナムの形質転換体を培養したスラントから、
MBG3−8培地(組成;7%(w/v)グリセリン、3%
(w/v)グルコース、1%(w/v)大豆粉、1%(w/v)ペプト
ン(極東製薬工業(株)製)、1%(w/v)コーンスチー
プリカー(ホーネンコーポレーション(株)製)、0.
5%(w/v)硝酸ナトリウム 、0.1%(w/v)硫酸マグネ
シウム七水和物、pH6.5)へ該形質転換体を接種
し、22乃至28℃、7乃至12日間、振盪しつつ保温
することにより、ML−236Bを効率よく生産するこ
とができる。なお、宿主細胞のペニシリウム・シトリナ
ムについても、全く同様の液体培養によりML−236
Bを生産させることができる。
【0053】ML−236B生産菌の培養物からのML
−236Bの精製は、通常天然物の精製に使用される諸
技法を組み合わせることによりなされる。該技法として
は、特に限定されないが、例えば、遠心分離、濾過によ
る固液分離、アルカリ又は酸処理、有機溶媒による抽
出、転溶、吸着及び分配等の各種クロマトグラフィー、
結晶化等が挙げられる。ML−236Bは、ヒドロキシ
酸体とラクトン体の両方の形をとり、相互に変換し、更
に、ヒドロキシ酸体は安定な塩を形成する。このような
物理化学的特質を利用して、ML−236Bのヒドロキ
シ酸体(以下、「遊離型ヒドロキシ酸」という。)、M
L−236Bのヒドロキシ酸塩(以下、「ヒドロキシ酸
塩」という。)、又はML−236Bのラクトン体(以
下、「ラクトン」という。)を得ることができる。
−236Bの精製は、通常天然物の精製に使用される諸
技法を組み合わせることによりなされる。該技法として
は、特に限定されないが、例えば、遠心分離、濾過によ
る固液分離、アルカリ又は酸処理、有機溶媒による抽
出、転溶、吸着及び分配等の各種クロマトグラフィー、
結晶化等が挙げられる。ML−236Bは、ヒドロキシ
酸体とラクトン体の両方の形をとり、相互に変換し、更
に、ヒドロキシ酸体は安定な塩を形成する。このような
物理化学的特質を利用して、ML−236Bのヒドロキ
シ酸体(以下、「遊離型ヒドロキシ酸」という。)、M
L−236Bのヒドロキシ酸塩(以下、「ヒドロキシ酸
塩」という。)、又はML−236Bのラクトン体(以
下、「ラクトン」という。)を得ることができる。
【0054】ML−236B生産菌の培養物から精製し
たML−236Bを、加熱下又は常温下でアルカリ加水
分解することにより開環し、ヒドロキシ酸塩に変換し、
該反応溶液を酸性にした後濾過し、濾液を水と混和しな
い有機溶媒で抽出することにより、目的化合物を遊離型
ヒドロキシ酸として得ることができる。水と混和しない
有機溶媒としては、特に限定されるものではないが、例
えば、ヘキサン、ヘプタン等の脂肪族炭化水素類、ベン
ゼン、トルエン等の芳香族炭化水素類、メチレンクロリ
ド、クロロホルム等のハロゲン化炭化水素類、ジエチル
エーテル等のエーテル類、蟻酸エチル、酢酸エチル等の
エステル類、それら2種以上の混合溶媒等が挙げられ
る。
たML−236Bを、加熱下又は常温下でアルカリ加水
分解することにより開環し、ヒドロキシ酸塩に変換し、
該反応溶液を酸性にした後濾過し、濾液を水と混和しな
い有機溶媒で抽出することにより、目的化合物を遊離型
ヒドロキシ酸として得ることができる。水と混和しない
有機溶媒としては、特に限定されるものではないが、例
えば、ヘキサン、ヘプタン等の脂肪族炭化水素類、ベン
ゼン、トルエン等の芳香族炭化水素類、メチレンクロリ
ド、クロロホルム等のハロゲン化炭化水素類、ジエチル
エーテル等のエーテル類、蟻酸エチル、酢酸エチル等の
エステル類、それら2種以上の混合溶媒等が挙げられ
る。
【0055】また、この遊離型ヒドロキシ酸を、水酸化
ナトリウム等のアルカリ金属塩類の水溶液に転溶するこ
とにより、目的化合物をヒドロキシ酸塩として得ること
ができる。
ナトリウム等のアルカリ金属塩類の水溶液に転溶するこ
とにより、目的化合物をヒドロキシ酸塩として得ること
ができる。
【0056】さらに、この遊離型ヒドロキシ酸を、有機
溶媒中で加熱して脱水するか、又は他の方法により閉環
することにより、目的化合物をラクトンとして得ること
ができる。
溶媒中で加熱して脱水するか、又は他の方法により閉環
することにより、目的化合物をラクトンとして得ること
ができる。
【0057】このようにして得ることができる遊離型ヒ
ドロキシ酸、ヒドロキシ酸塩及びラクトンは、カラムク
ロマトグラフィー等により精製、単離することが可能で
ある。
ドロキシ酸、ヒドロキシ酸塩及びラクトンは、カラムク
ロマトグラフィー等により精製、単離することが可能で
ある。
【0058】カラムクロマトグラフィーの担体として
は、特に限定されるものではないが、例えば、セファデ
ックス LH−20(アマシャム ファルマシア バイ
オテク社製)、ダイヤイオン HP−20(三菱化学
(株)製)、シリカゲル、逆相系担体等が挙げられ、好
適にはC18系の担体である。
は、特に限定されるものではないが、例えば、セファデ
ックス LH−20(アマシャム ファルマシア バイ
オテク社製)、ダイヤイオン HP−20(三菱化学
(株)製)、シリカゲル、逆相系担体等が挙げられ、好
適にはC18系の担体である。
【0059】ML−236Bの定量法としては、通常有
機化合物の定量に用いられる方法であれば特に限定され
ないが、例えば、逆相高速液体クロマトグラフィー(:
以下、「逆相HPLC」という。)法等が挙げられる。
逆相HPLC法による定量は、ML−236B生産菌の
培養物をアルカリ加水分解し、可溶性画分をC18カラ
ムを用いた逆相HPLCに供し、紫外吸収を測定し、該
吸収を定量化することにより行なうことができる。C1
8カラムとしては、通常の逆相HPLCに使用されるC
18カラムであれば特に限定されないが、例えば、SS
C−ODS−262(直径6mm、長さ100mm:セ
ンシュー科学(株)製)等が挙げられる。移動相として
は、通常逆相HPLCに使用される溶媒であれば特に限
定されないが、例えば、75%(v/v)メタノール−0.
1%(v/v)トリエチルアミン−0.1%(v/v)酢酸等が挙
げられる。移動相に流速2ml/分の75%(v/v)メタ
ノール−0.1%(v/v)トリエチルアミン−0.1%(v/
v)酢酸を用いてSSC−ODS−262カラムにML−
236Bを室温で添加すると、約4.0分後に溶出され
る。ML−236Bの検出は、HPLC用UV検出器を
用いて行なうことができ、UV検出器の吸収波長は、2
20乃至280nmであり、好適には220乃至260
nm、より好適には236nmである。
機化合物の定量に用いられる方法であれば特に限定され
ないが、例えば、逆相高速液体クロマトグラフィー(:
以下、「逆相HPLC」という。)法等が挙げられる。
逆相HPLC法による定量は、ML−236B生産菌の
培養物をアルカリ加水分解し、可溶性画分をC18カラ
ムを用いた逆相HPLCに供し、紫外吸収を測定し、該
吸収を定量化することにより行なうことができる。C1
8カラムとしては、通常の逆相HPLCに使用されるC
18カラムであれば特に限定されないが、例えば、SS
C−ODS−262(直径6mm、長さ100mm:セ
ンシュー科学(株)製)等が挙げられる。移動相として
は、通常逆相HPLCに使用される溶媒であれば特に限
定されないが、例えば、75%(v/v)メタノール−0.
1%(v/v)トリエチルアミン−0.1%(v/v)酢酸等が挙
げられる。移動相に流速2ml/分の75%(v/v)メタ
ノール−0.1%(v/v)トリエチルアミン−0.1%(v/
v)酢酸を用いてSSC−ODS−262カラムにML−
236Bを室温で添加すると、約4.0分後に溶出され
る。ML−236Bの検出は、HPLC用UV検出器を
用いて行なうことができ、UV検出器の吸収波長は、2
20乃至280nmであり、好適には220乃至260
nm、より好適には236nmである。
【0060】紫外吸収に基づいて定量化されたML−2
36Bの量を形質転換していない菌と形質転換した菌で
比較することによりML−236Bの生合成に関わる遺
伝子の機能発現を確認することができる。そして、機能
発現が確認された遺伝子を有する所望の組換えDNAベ
クターは、ML−236Bの生産性の改善に有用であ
る。
36Bの量を形質転換していない菌と形質転換した菌で
比較することによりML−236Bの生合成に関わる遺
伝子の機能発現を確認することができる。そして、機能
発現が確認された遺伝子を有する所望の組換えDNAベ
クターは、ML−236Bの生産性の改善に有用であ
る。
【0061】
【実施例】以下に実施例を挙げ、本発明をさらに詳細に
説明するが、本発明はこれらに限定されるものではな
い。 実施例1.ペニシリウム・シトリナム SANK133
80株のゲノムDNAの調製 1)ペニシリウム・シトリナム SANK13380株
の培養 ペニシリウム・シトリナム SANK13380株の種
菌の培養はPGA寒天培地(20%(w/v)馬鈴薯、15
%(w/v)グリセロール、2%(w/v)寒天)を用いたスラン
トにて行なった。すなわち、ペニシリウム・シトリナム
SANK13380株を白金耳により接種し、26℃
にて14日間保温した。このスラントは4℃で保存し
た。本培養は、液体通気培養にて行なった。上述のスラ
ント5mm角の菌体を50mlのMBG3−8培地(組
成;7%(w/v)グリセリン、3%(w/v)グルコース、1%
(w/v)大豆粉、1%(w/v)ペプトン(極東製薬工業(株)
製)、1%(w/v)コーンスチープリカー(ホーネンコー
ポレーション(株)製)、0.5%(w/v)硝酸ナトリウ
ム 、0.1%(w/v)硫酸マグネシウム七水和物、pH
6.5)を入れた500ml容の三角フラスコに接種
し、26℃、210rpmの条件下で5日間振盪培養し
た。
説明するが、本発明はこれらに限定されるものではな
い。 実施例1.ペニシリウム・シトリナム SANK133
80株のゲノムDNAの調製 1)ペニシリウム・シトリナム SANK13380株
の培養 ペニシリウム・シトリナム SANK13380株の種
菌の培養はPGA寒天培地(20%(w/v)馬鈴薯、15
%(w/v)グリセロール、2%(w/v)寒天)を用いたスラン
トにて行なった。すなわち、ペニシリウム・シトリナム
SANK13380株を白金耳により接種し、26℃
にて14日間保温した。このスラントは4℃で保存し
た。本培養は、液体通気培養にて行なった。上述のスラ
ント5mm角の菌体を50mlのMBG3−8培地(組
成;7%(w/v)グリセリン、3%(w/v)グルコース、1%
(w/v)大豆粉、1%(w/v)ペプトン(極東製薬工業(株)
製)、1%(w/v)コーンスチープリカー(ホーネンコー
ポレーション(株)製)、0.5%(w/v)硝酸ナトリウ
ム 、0.1%(w/v)硫酸マグネシウム七水和物、pH
6.5)を入れた500ml容の三角フラスコに接種
し、26℃、210rpmの条件下で5日間振盪培養し
た。
【0062】2)ペニシリウム・シトリナム SANK
13380株の培養物からのゲノムDNAの調製 1)の培養物を、室温、1000×Gの条件下で10分
間遠心分離し、菌体を回収した。湿重量3gの菌体を、
ドライアイスで冷却した乳鉢上で粉末になるまで破砕し
た。菌体破砕物を20mlの62.5mM EDTA・
2Na(和光純薬(株)製)−5%(w/v)SDS−50
mM Tris(和光純薬(株)製)−塩酸(和光純薬
(株)製)緩衝液(pH8.0)で満たした遠心管に入
れ、穏やかに混合した後、0℃にて1時間静置した。1
0mM Tris−塩酸−0.1mM EDTA・2N
a(pH8.0:以下「TE」という。)で飽和した1
0mlのフェノールを添加し、50℃にて1時間穏やか
に攪拌した。室温、10000×Gの条件下で10分間
遠心分離した後、15mlの上層(水相)を別の遠心管
にとり、0.5倍容のTE飽和フェノール及び0.5倍
容のクロロホルム溶液を加え、2分間穏やかに攪拌した
後、室温、10000×Gの条件下で10分間遠心分離
した(以下、「フェノール・クロロホルム抽出」とい
う。)。10mlの上層(水相)に10mlの8M 酢
酸アンモニウム(pH7.5)及び25mlの2−プロ
パノール(和光純薬(株)製)を添加し、−80℃にて
15分間冷却した後、4℃、10000×Gの条件下で
10分間遠心分離した。沈澱を5mlのTEに溶解させ
た後、20μlの10mg/mlリボヌクレアーゼA
(Sigma社製)及び250単位のリボヌクレアーゼ
T1(GIBCO社製)を添加し、37℃にて20分間
保温した。これに20mlの2−プロパノールを添加
し、穏やかに混合した後、糸状のゲノムDNAをパスツ
ールピペットの先端に巻きつけ、1mlのTEに溶解さ
せた。このDNA溶液に0.1倍容の3M 酢酸ナトリ
ウム(pH6.5)及び2.5倍容のエタノールを加
え、−80℃にて15分冷却した後、4℃、10000
×Gの条件下で5分間遠心分離した(以下、「エタノー
ル沈澱」という。)。得られた沈澱を200μlのTE
に溶解し、ゲノムDNA画分とした。
13380株の培養物からのゲノムDNAの調製 1)の培養物を、室温、1000×Gの条件下で10分
間遠心分離し、菌体を回収した。湿重量3gの菌体を、
ドライアイスで冷却した乳鉢上で粉末になるまで破砕し
た。菌体破砕物を20mlの62.5mM EDTA・
2Na(和光純薬(株)製)−5%(w/v)SDS−50
mM Tris(和光純薬(株)製)−塩酸(和光純薬
(株)製)緩衝液(pH8.0)で満たした遠心管に入
れ、穏やかに混合した後、0℃にて1時間静置した。1
0mM Tris−塩酸−0.1mM EDTA・2N
a(pH8.0:以下「TE」という。)で飽和した1
0mlのフェノールを添加し、50℃にて1時間穏やか
に攪拌した。室温、10000×Gの条件下で10分間
遠心分離した後、15mlの上層(水相)を別の遠心管
にとり、0.5倍容のTE飽和フェノール及び0.5倍
容のクロロホルム溶液を加え、2分間穏やかに攪拌した
後、室温、10000×Gの条件下で10分間遠心分離
した(以下、「フェノール・クロロホルム抽出」とい
う。)。10mlの上層(水相)に10mlの8M 酢
酸アンモニウム(pH7.5)及び25mlの2−プロ
パノール(和光純薬(株)製)を添加し、−80℃にて
15分間冷却した後、4℃、10000×Gの条件下で
10分間遠心分離した。沈澱を5mlのTEに溶解させ
た後、20μlの10mg/mlリボヌクレアーゼA
(Sigma社製)及び250単位のリボヌクレアーゼ
T1(GIBCO社製)を添加し、37℃にて20分間
保温した。これに20mlの2−プロパノールを添加
し、穏やかに混合した後、糸状のゲノムDNAをパスツ
ールピペットの先端に巻きつけ、1mlのTEに溶解さ
せた。このDNA溶液に0.1倍容の3M 酢酸ナトリ
ウム(pH6.5)及び2.5倍容のエタノールを加
え、−80℃にて15分冷却した後、4℃、10000
×Gの条件下で5分間遠心分離した(以下、「エタノー
ル沈澱」という。)。得られた沈澱を200μlのTE
に溶解し、ゲノムDNA画分とした。
【0063】実施例2.ペニシリウム・シトリナム S
ANK13380株のゲノムDNAライブラリーの作製 1)ゲノムDNA断片の調製 実施例1において得られたペニシリウム・シトリナム
SANK13380株のゲノムDNA(約50μg)を
含む100μlの水溶液に、0.25単位のSau3A
I(宝酒造(株)製)を添加した後、10、30、6
0、90及び120秒経過後に20μlずつサンプリン
グし、各サンプルに20μlずつの0.5M EDTA
(pH8.0)を加えて制限酵素反応を停止した。アガ
ロースゲル電気泳動により、得られた部分消化DNA断
片を分離し、30kb以上の大きさをもつDNA断片を
含むアガロースゲルを回収した。回収したゲルを細かく
砕き、ウルトラフリーC3遠心式ろ過ユニット(日本ミ
リポア(株)製)に入れた。−80℃にて15分間冷却
し、ゲルを凍結した後、37℃にて10分間保温してゲ
ルを融解した。5000×G、5分間遠心分離し、DN
A抽出液を得た。このDNA抽出液について、フェノー
ル・クロロホルム抽出及びエタノール沈澱を行ない、得
られた沈澱を少量のTEに溶解した。
ANK13380株のゲノムDNAライブラリーの作製 1)ゲノムDNA断片の調製 実施例1において得られたペニシリウム・シトリナム
SANK13380株のゲノムDNA(約50μg)を
含む100μlの水溶液に、0.25単位のSau3A
I(宝酒造(株)製)を添加した後、10、30、6
0、90及び120秒経過後に20μlずつサンプリン
グし、各サンプルに20μlずつの0.5M EDTA
(pH8.0)を加えて制限酵素反応を停止した。アガ
ロースゲル電気泳動により、得られた部分消化DNA断
片を分離し、30kb以上の大きさをもつDNA断片を
含むアガロースゲルを回収した。回収したゲルを細かく
砕き、ウルトラフリーC3遠心式ろ過ユニット(日本ミ
リポア(株)製)に入れた。−80℃にて15分間冷却
し、ゲルを凍結した後、37℃にて10分間保温してゲ
ルを融解した。5000×G、5分間遠心分離し、DN
A抽出液を得た。このDNA抽出液について、フェノー
ル・クロロホルム抽出及びエタノール沈澱を行ない、得
られた沈澱を少量のTEに溶解した。
【0064】2)DNAベクター pSAKcos1の
前処理 pSAKcos1(特開2001−112487実施例
1記載)を制限酵素BamHI(宝酒造(株)社製)に
より消化した後、65℃にて30分間アルカリフォスフ
ァターゼ(宝酒造(株)製)反応を行った。反応終了液
について、フェノール・クロロホルム抽出及びエタノー
ル沈澱を行ない、得られた沈澱を少量のTEに溶解し
た。
前処理 pSAKcos1(特開2001−112487実施例
1記載)を制限酵素BamHI(宝酒造(株)社製)に
より消化した後、65℃にて30分間アルカリフォスフ
ァターゼ(宝酒造(株)製)反応を行った。反応終了液
について、フェノール・クロロホルム抽出及びエタノー
ル沈澱を行ない、得られた沈澱を少量のTEに溶解し
た。
【0065】3)ライゲーション及びin vitro
パッケージング 上記1)記載のゲノムDNA断片(2μg)及び上記
2)記載の前処理済みpSAKcos1(1μg)を混
合し、DNA ligation kit Ver.2
(宝酒造(株)製)を用い、16℃にて16時間ライゲ
ーション反応を行なった。反応終了液について、フェノ
ール・クロロホルム抽出及びエタノール沈澱を行ない、
得られた沈澱を5μlのTEに溶解させた。ライゲーシ
ョン生成物溶液を、GIGAPAK II Gold
(STRATAGENE社製)キットを用いたin v
itroパッケージングに供し、組換えDNAベクター
を含む形質転換大腸菌を得た。形質転換大腸菌のコロニ
ーを形成させたプレートに3mlのLB培地を注ぎ、セ
ルスクレーパーを用いてプレート上のコロニーを回収し
た(回収液1という)。さらに3mlのLB培地でプレ
ートを洗浄、回収した(回収液2という。)。回収液1
及び2の混合液にグリセリンを終濃度18%となるよう
加えたものを大腸菌菌体液と称し、ペニシリウム・シト
リナム SANK13380株のゲノムDNAライブラ
リーとして、−80℃にて保存した。
パッケージング 上記1)記載のゲノムDNA断片(2μg)及び上記
2)記載の前処理済みpSAKcos1(1μg)を混
合し、DNA ligation kit Ver.2
(宝酒造(株)製)を用い、16℃にて16時間ライゲ
ーション反応を行なった。反応終了液について、フェノ
ール・クロロホルム抽出及びエタノール沈澱を行ない、
得られた沈澱を5μlのTEに溶解させた。ライゲーシ
ョン生成物溶液を、GIGAPAK II Gold
(STRATAGENE社製)キットを用いたin v
itroパッケージングに供し、組換えDNAベクター
を含む形質転換大腸菌を得た。形質転換大腸菌のコロニ
ーを形成させたプレートに3mlのLB培地を注ぎ、セ
ルスクレーパーを用いてプレート上のコロニーを回収し
た(回収液1という)。さらに3mlのLB培地でプレ
ートを洗浄、回収した(回収液2という。)。回収液1
及び2の混合液にグリセリンを終濃度18%となるよう
加えたものを大腸菌菌体液と称し、ペニシリウム・シト
リナム SANK13380株のゲノムDNAライブラ
リーとして、−80℃にて保存した。
【0066】実施例3.ペニシリウム・シトリナム S
ANK13380株のゲノムDNAライブラリーのスク
リーニング 1)メンブレンの調製 ペニシリウム・シトリナム SANK13380株のゲ
ノムDNAライブラリーとして保存した大腸菌菌体液
(実施例2記載)を、LB寒天培地のプレートに、プレ
ート1枚あたり5000乃至10000個のコロニーが
生育するよう希釈して撒いた。このプレートを26℃に
て18時間保温した後、4℃にて1時間冷却した。ナイ
ロンメンブレン(HybondTM−N+、アマシャム
ファルマシアバイオテク社製)をプレートにのせ、1分
間接触させた。コロニーを付着させたメンブレンをプレ
ートから注意深く離し、コロニー接触面を上にして、2
00mlの1.5M塩化ナトリウム−0.5規定水酸化
ナトリウムに7分間、200mlの1.5M塩化ナトリ
ウム−0.5M Tris-塩酸−1mM EDTA(p
H7.5)に3分間ずつ2回浸した後、400mlの2
×SSCで洗浄した。洗浄したメンブレンを30分間風
乾した。
ANK13380株のゲノムDNAライブラリーのスク
リーニング 1)メンブレンの調製 ペニシリウム・シトリナム SANK13380株のゲ
ノムDNAライブラリーとして保存した大腸菌菌体液
(実施例2記載)を、LB寒天培地のプレートに、プレ
ート1枚あたり5000乃至10000個のコロニーが
生育するよう希釈して撒いた。このプレートを26℃に
て18時間保温した後、4℃にて1時間冷却した。ナイ
ロンメンブレン(HybondTM−N+、アマシャム
ファルマシアバイオテク社製)をプレートにのせ、1分
間接触させた。コロニーを付着させたメンブレンをプレ
ートから注意深く離し、コロニー接触面を上にして、2
00mlの1.5M塩化ナトリウム−0.5規定水酸化
ナトリウムに7分間、200mlの1.5M塩化ナトリ
ウム−0.5M Tris-塩酸−1mM EDTA(p
H7.5)に3分間ずつ2回浸した後、400mlの2
×SSCで洗浄した。洗浄したメンブレンを30分間風
乾した。
【0067】2)ハイブリダイゼーション
プローブの調製は、特開2000−112487記載の
DNAを制限酵素EcoRIで消化し、アガロースゲル
電気泳動後、得られた遺伝子断片DNA9.8kbを用
いて行なった。該遺伝子断片(1μg)をDIG DN
A Labelling Kit(ロシュ・ダイアグノ
スティックス社製)で標識し、使用直前に10分間煮沸
後急冷した。ハイブリダイゼーション液(DIGイージ
ーハイブ:ロシュ・ダイアグノスティックス社製)に
1)記載のメンブレンを浸し、20rpmで振盪しつ
つ、42℃にて2時間プレハイブリダイゼーションを行
なった後、上述の標識プローブをハイブリダイゼーショ
ン液に加え、マルチシェーカー・オーブンHB(TAI
TEC社製)を用い、20rpmで振盪しつつ42℃に
て18時間ハイブリダイゼーションを行なった。ハイブ
リダイゼーションを行なったメンブレンについて、2×
SSCを用いた室温、20分間の洗浄を3回、0.1×
SSCを用いた68℃、30分間の洗浄を2回、それぞ
れ行なった。洗浄したメンブレンをDIG Lumin
escent DetectionKit for N
ucleic Acids(ロシュ・ダイアグノスティ
ックス社製)で処理し、X線フィルム(ルミフィルム:
ロシュ・ダイアグノスティックス社製)に露光した。現
像は富士メディカルフィルムプロセサーFPM800
A:富士写真フィルム社製)を用いて行なった。1)及
び2)記載の操作をスクリーニングという。一回目のス
クリーニングで陽性シグナルが検出されたクローンのコ
ロニー周辺をかきとってLB培地に懸濁した後、適宜希
釈してプレートに撒いて培養し、同様に二回目のスクリ
ーニングを行ない、陽性クローンを純化した。
DNAを制限酵素EcoRIで消化し、アガロースゲル
電気泳動後、得られた遺伝子断片DNA9.8kbを用
いて行なった。該遺伝子断片(1μg)をDIG DN
A Labelling Kit(ロシュ・ダイアグノ
スティックス社製)で標識し、使用直前に10分間煮沸
後急冷した。ハイブリダイゼーション液(DIGイージ
ーハイブ:ロシュ・ダイアグノスティックス社製)に
1)記載のメンブレンを浸し、20rpmで振盪しつ
つ、42℃にて2時間プレハイブリダイゼーションを行
なった後、上述の標識プローブをハイブリダイゼーショ
ン液に加え、マルチシェーカー・オーブンHB(TAI
TEC社製)を用い、20rpmで振盪しつつ42℃に
て18時間ハイブリダイゼーションを行なった。ハイブ
リダイゼーションを行なったメンブレンについて、2×
SSCを用いた室温、20分間の洗浄を3回、0.1×
SSCを用いた68℃、30分間の洗浄を2回、それぞ
れ行なった。洗浄したメンブレンをDIG Lumin
escent DetectionKit for N
ucleic Acids(ロシュ・ダイアグノスティ
ックス社製)で処理し、X線フィルム(ルミフィルム:
ロシュ・ダイアグノスティックス社製)に露光した。現
像は富士メディカルフィルムプロセサーFPM800
A:富士写真フィルム社製)を用いて行なった。1)及
び2)記載の操作をスクリーニングという。一回目のス
クリーニングで陽性シグナルが検出されたクローンのコ
ロニー周辺をかきとってLB培地に懸濁した後、適宜希
釈してプレートに撒いて培養し、同様に二回目のスクリ
ーニングを行ない、陽性クローンを純化した。
【0068】3)組換えDNAベクターの大腸菌からの
回収 得られた陽性クローンを、マニアティスら(Maniatis,
T., et al., Molecularcloning, a laboratory manual,
2nd ed., Cold Spring Harbor Laboratory, Cold Spri
ng Harbor, N.Y.(1989)記載)の方法に従って培養し
た。すなわち、2mlのLB培地を含む24ml容の試
験管に各コロニーを接種し、37℃にて18時間、振盪
培養した。この培養物からの組換えDNAベクターの調
製は、アルカリ法(Maniatis, T.,et al., Molecular c
loning, a laboratory manual, 2nd ed., Cold Spring
Harbor Laboratory, Cold Spring Harbor, N.Y.(1989)
記載)によった。すなわち、1.5mlの培養液を、室
温、10000×Gの条件下で2分間遠心分離し、沈澱
より菌体を回収した。菌体に100μlの50mMグル
コース−25mM Tris-塩酸−10mM EDTA
(pH8.0) を加えて懸濁し、200μlの0.2
規定水酸化ナトリウム−1%(w/v)SDSを加えて穏や
かに攪拌し、溶菌させた。これに150μlの3M 酢
酸カリウム−11.5%(w/v)氷酢酸を加えてタンパク
質を変成させ、室温、10000×Gの条件下で10分
間遠心分離し、上清を回収した。上清について、フェノ
ール・クロロホルム抽出及びエタノール沈澱を行ない、
得られた沈澱を40μg/mlのリボヌクレアーゼA
(Sigma社製)を含有する50μlのTEに溶解さ
せた。各組換えDNAベクターを制限酵素消化して電気
泳動に供し、電気泳動パターンの異なる組換えDNAベ
クター中の挿入塩基配列を、DNAシークエンサー(モ
デル377:パーキンエルマー・ジャパン社製)を用い
て決定した。本発明において見出された陽性クローンか
ら得られた、組換えDNAベクターのうち、pML4
2、pML45、pML51は、平成13年(2001
年)9月4日付けで独立行政法人産業技術総合研究所特
許生物寄託センターに国際寄託され、それぞれ受託番号
FERM BP−7723、FERM BP−772
4、FERM BP−7725を付された。
回収 得られた陽性クローンを、マニアティスら(Maniatis,
T., et al., Molecularcloning, a laboratory manual,
2nd ed., Cold Spring Harbor Laboratory, Cold Spri
ng Harbor, N.Y.(1989)記載)の方法に従って培養し
た。すなわち、2mlのLB培地を含む24ml容の試
験管に各コロニーを接種し、37℃にて18時間、振盪
培養した。この培養物からの組換えDNAベクターの調
製は、アルカリ法(Maniatis, T.,et al., Molecular c
loning, a laboratory manual, 2nd ed., Cold Spring
Harbor Laboratory, Cold Spring Harbor, N.Y.(1989)
記載)によった。すなわち、1.5mlの培養液を、室
温、10000×Gの条件下で2分間遠心分離し、沈澱
より菌体を回収した。菌体に100μlの50mMグル
コース−25mM Tris-塩酸−10mM EDTA
(pH8.0) を加えて懸濁し、200μlの0.2
規定水酸化ナトリウム−1%(w/v)SDSを加えて穏や
かに攪拌し、溶菌させた。これに150μlの3M 酢
酸カリウム−11.5%(w/v)氷酢酸を加えてタンパク
質を変成させ、室温、10000×Gの条件下で10分
間遠心分離し、上清を回収した。上清について、フェノ
ール・クロロホルム抽出及びエタノール沈澱を行ない、
得られた沈澱を40μg/mlのリボヌクレアーゼA
(Sigma社製)を含有する50μlのTEに溶解さ
せた。各組換えDNAベクターを制限酵素消化して電気
泳動に供し、電気泳動パターンの異なる組換えDNAベ
クター中の挿入塩基配列を、DNAシークエンサー(モ
デル377:パーキンエルマー・ジャパン社製)を用い
て決定した。本発明において見出された陽性クローンか
ら得られた、組換えDNAベクターのうち、pML4
2、pML45、pML51は、平成13年(2001
年)9月4日付けで独立行政法人産業技術総合研究所特
許生物寄託センターに国際寄託され、それぞれ受託番号
FERM BP−7723、FERM BP−772
4、FERM BP−7725を付された。
【0069】実施例4.組換えDNAベクターpML4
2、pML45およびpML51の挿入配列の解析
(1) 実施例3で得られたpML42、pML45およびpM
L51を各種制限酵素で消化し、pUC119(宝酒造
(株)製)に組込むことにより、サブクローニングし
た。得られたクローンの有する挿入配列の塩基配列を、
DNAシークエンサーモデル377(パーキンエルマー
・ジャパン社製)を用いて決定することにより、pML
42、pML45、pML51の全塩基配列を決定し
た。pML42の挿入配列は全42758塩基であっ
た。pML45の挿入配列は全36305塩基であっ
た。pML51の挿入配列は全36015塩基であっ
た。pML42の挿入塩基配列は、配列表の配列番号1
のヌクレオチド番号1乃至42758に示される。pM
L45の挿入塩基配列は、配列表の配列番号1のヌクレ
オチド番号11614乃至47918に示される。pM
L51の挿入塩基配列は、配列表の配列番号1のヌクレ
オチド番号36135乃至72149に示される。ま
た、特開2000−112487に記載のpML48の
挿入塩基配列は、配列表の配列番号1のヌクレオチド番
号29581乃至63783に示される。該挿入配列上
の構造遺伝子の存在について、遺伝子検索プログラムG
RAIL(Apocom GRAIL Toolki
t:APOCOM社製)及び相同性検索プログラムBL
AST(Gapped−BLAST(BLAST2):
WISCONSIN GCG package ve
r.10.0に搭載)を用いて解析した。その結果、p
ML48中に確認していた6種類の構造遺伝子であるm
lcA、mlcB、mlcC、mlcD、mlcE、m
lcR(特開2000−112487記載)に加え、新
たに、14種類の異なる遺伝子の存在が推定され、それ
ぞれをmlcF、mlcG、mlcH、ORF1、OR
F11、ORF12、ORF13、ORF14、ORF
15、ORF16、ORF17、ORF18、ORF1
9、ORF20と命名した。配列表の配列番号1のヌク
レオチド番号31058乃至40738に逆向きにml
cA遺伝子が、43941乃至52035に逆向きにm
lcB遺伝子が、41375乃至43060にmlcC
遺伝子が、53900乃至57471にmlcD遺伝子
が、58051乃至60238に逆向きにmlcE遺伝
子が、29672乃至30427にmlcF遺伝子が、
29218乃至27957に逆向きにmlcG遺伝子
が、26015乃至26153にmlcH遺伝子が、乃
至にmlcR遺伝子が、65161乃至66954にo
rf1が、24110乃至25552にorf11が、
21902乃至23790にorf12が、19612
乃至21581に逆向きにorf13が、18290乃
至19360に逆向きにorf14が、15873乃至
17140に逆向きにorf15が13149乃至14
414にorf16が10206乃至12307にor
f17が、7325乃至9268にorf18が、52
44乃至6815に逆向きにorf19が、1099乃
至2397に逆向きにorf20がそれぞれ存在すると
推定された。本実施例の結果を図1および表1に記載し
た。なお、図1は制限酵素地図と各構造遺伝子を表す。
図中の矢印は各orfの向きを表し、矢印の下の11乃
至20の数字はorf11乃至20を表す。また、図中
の各アルファベットについては、BはBamHIをKは
KpnIを表す。
2、pML45およびpML51の挿入配列の解析
(1) 実施例3で得られたpML42、pML45およびpM
L51を各種制限酵素で消化し、pUC119(宝酒造
(株)製)に組込むことにより、サブクローニングし
た。得られたクローンの有する挿入配列の塩基配列を、
DNAシークエンサーモデル377(パーキンエルマー
・ジャパン社製)を用いて決定することにより、pML
42、pML45、pML51の全塩基配列を決定し
た。pML42の挿入配列は全42758塩基であっ
た。pML45の挿入配列は全36305塩基であっ
た。pML51の挿入配列は全36015塩基であっ
た。pML42の挿入塩基配列は、配列表の配列番号1
のヌクレオチド番号1乃至42758に示される。pM
L45の挿入塩基配列は、配列表の配列番号1のヌクレ
オチド番号11614乃至47918に示される。pM
L51の挿入塩基配列は、配列表の配列番号1のヌクレ
オチド番号36135乃至72149に示される。ま
た、特開2000−112487に記載のpML48の
挿入塩基配列は、配列表の配列番号1のヌクレオチド番
号29581乃至63783に示される。該挿入配列上
の構造遺伝子の存在について、遺伝子検索プログラムG
RAIL(Apocom GRAIL Toolki
t:APOCOM社製)及び相同性検索プログラムBL
AST(Gapped−BLAST(BLAST2):
WISCONSIN GCG package ve
r.10.0に搭載)を用いて解析した。その結果、p
ML48中に確認していた6種類の構造遺伝子であるm
lcA、mlcB、mlcC、mlcD、mlcE、m
lcR(特開2000−112487記載)に加え、新
たに、14種類の異なる遺伝子の存在が推定され、それ
ぞれをmlcF、mlcG、mlcH、ORF1、OR
F11、ORF12、ORF13、ORF14、ORF
15、ORF16、ORF17、ORF18、ORF1
9、ORF20と命名した。配列表の配列番号1のヌク
レオチド番号31058乃至40738に逆向きにml
cA遺伝子が、43941乃至52035に逆向きにm
lcB遺伝子が、41375乃至43060にmlcC
遺伝子が、53900乃至57471にmlcD遺伝子
が、58051乃至60238に逆向きにmlcE遺伝
子が、29672乃至30427にmlcF遺伝子が、
29218乃至27957に逆向きにmlcG遺伝子
が、26015乃至26153にmlcH遺伝子が、乃
至にmlcR遺伝子が、65161乃至66954にo
rf1が、24110乃至25552にorf11が、
21902乃至23790にorf12が、19612
乃至21581に逆向きにorf13が、18290乃
至19360に逆向きにorf14が、15873乃至
17140に逆向きにorf15が13149乃至14
414にorf16が10206乃至12307にor
f17が、7325乃至9268にorf18が、52
44乃至6815に逆向きにorf19が、1099乃
至2397に逆向きにorf20がそれぞれ存在すると
推定された。本実施例の結果を図1および表1に記載し
た。なお、図1は制限酵素地図と各構造遺伝子を表す。
図中の矢印は各orfの向きを表し、矢印の下の11乃
至20の数字はorf11乃至20を表す。また、図中
の各アルファベットについては、BはBamHIをKは
KpnIを表す。
【0070】
【表1】
【0071】実施例5.構造遺伝子mlcF、mlcGお
よびmlcHの発現解析 1)ペニシリウム・シトリナム SANK13380の
全RNAの調製 ペニシリウム・シトリナム SANK13380株を培
養したスラント(実施例1記載)より5mm角の菌体を
10mlのMGB3−8培地を入れた100ml容の三
角フラスコに接種し、26℃にて2日乃至3日間、振盪
培養した。培養物からの全RNAの調製は、グアニジン
・イソチオシアネート法を利用したRNeasy Pl
ant Mini Kit(キアゲン社製)を用いて行
った。すなわち、培養物を、室温、5000×Gの条件
下で10分間遠心分離して菌体を回収し、湿重量2gの
菌体を液体窒素により凍結した後、乳鉢上で粉末になる
まで破砕した。この破砕物をグアニジン・イソチオシア
ネートを含む4mlの菌体溶解バッファー(このキット
に含まれる。)に懸濁した。懸濁液をこのキットに含ま
れるQIAshredderスピンカラム10本に45
0μlずつ分注し、室温、1000×G、10分間遠心
分離した後、溶出液をそれぞれ回収した:各溶出液に2
25μlずつのエタノールを加えた後、このキットに含
まれるRNAミニスピンカラムに添加した。このカラム
をこのキットに含まれる洗浄用緩衝液で洗浄した後、5
0μlずつのリボヌクレアーゼ・フリー蒸留水で吸着物
を溶出させ、溶出液を全RNA画分とした。
よびmlcHの発現解析 1)ペニシリウム・シトリナム SANK13380の
全RNAの調製 ペニシリウム・シトリナム SANK13380株を培
養したスラント(実施例1記載)より5mm角の菌体を
10mlのMGB3−8培地を入れた100ml容の三
角フラスコに接種し、26℃にて2日乃至3日間、振盪
培養した。培養物からの全RNAの調製は、グアニジン
・イソチオシアネート法を利用したRNeasy Pl
ant Mini Kit(キアゲン社製)を用いて行
った。すなわち、培養物を、室温、5000×Gの条件
下で10分間遠心分離して菌体を回収し、湿重量2gの
菌体を液体窒素により凍結した後、乳鉢上で粉末になる
まで破砕した。この破砕物をグアニジン・イソチオシア
ネートを含む4mlの菌体溶解バッファー(このキット
に含まれる。)に懸濁した。懸濁液をこのキットに含ま
れるQIAshredderスピンカラム10本に45
0μlずつ分注し、室温、1000×G、10分間遠心
分離した後、溶出液をそれぞれ回収した:各溶出液に2
25μlずつのエタノールを加えた後、このキットに含
まれるRNAミニスピンカラムに添加した。このカラム
をこのキットに含まれる洗浄用緩衝液で洗浄した後、5
0μlずつのリボヌクレアーゼ・フリー蒸留水で吸着物
を溶出させ、溶出液を全RNA画分とした。
【0072】2)ノーザンブロット・ハイブリダイゼー
ション 20μgのペニシリウム・シトリナム SANK133
80の全RNAを含む2.25μlの水溶液に、あらか
じめ121℃にて20分間オートクレーブ滅菌しておい
た1μlの10×MOPS(200mM 3−モルフォ
リノプロパンスルホン酸、50mM 酢酸ナトリウム、
10mM EDTA・2Na、pH7.0:同仁化学研
究所(株)製)、1.75μlのホルムアルデヒド及び
5μlのホルムアミドを添加して混合し、RNAサンプ
ルとした。このRNAサンプルを、65℃にて10分間
保温した後、氷水中で急冷し、アガロースゲル電気泳動
に供した。電気泳動のゲルは、10mlの10×MOP
S及び1gの AgaroseL03「TAKARA」
(宝酒造(株)製)を72mlのピロカルボニック・ア
シッド・ジエチルエステル(Sigma社製)処理水に
混合し、加熱してアガロースを溶解させた後冷却させ、
18mlのホルムアルデヒドを添加することにより作製
した。電気泳動用バッファーは、1×MOPS(10×
MOPSを水で10倍希釈したもの。)を使用した。ゲ
ル中のRNAを、10×SSC中でナイロンメンブレン
(HybondTM−N+、アマシャム ファルマシア
バイオテク社製)へトランスファーした。プローブに
は、pML45挿入配列を下記表2記載の制限酵素1及
び2で消化することにより得られるDNA断片(a、b及
びc)を用いた。
ション 20μgのペニシリウム・シトリナム SANK133
80の全RNAを含む2.25μlの水溶液に、あらか
じめ121℃にて20分間オートクレーブ滅菌しておい
た1μlの10×MOPS(200mM 3−モルフォ
リノプロパンスルホン酸、50mM 酢酸ナトリウム、
10mM EDTA・2Na、pH7.0:同仁化学研
究所(株)製)、1.75μlのホルムアルデヒド及び
5μlのホルムアミドを添加して混合し、RNAサンプ
ルとした。このRNAサンプルを、65℃にて10分間
保温した後、氷水中で急冷し、アガロースゲル電気泳動
に供した。電気泳動のゲルは、10mlの10×MOP
S及び1gの AgaroseL03「TAKARA」
(宝酒造(株)製)を72mlのピロカルボニック・ア
シッド・ジエチルエステル(Sigma社製)処理水に
混合し、加熱してアガロースを溶解させた後冷却させ、
18mlのホルムアルデヒドを添加することにより作製
した。電気泳動用バッファーは、1×MOPS(10×
MOPSを水で10倍希釈したもの。)を使用した。ゲ
ル中のRNAを、10×SSC中でナイロンメンブレン
(HybondTM−N+、アマシャム ファルマシア
バイオテク社製)へトランスファーした。プローブに
は、pML45挿入配列を下記表2記載の制限酵素1及
び2で消化することにより得られるDNA断片(a、b及
びc)を用いた。
【0073】
【表2】
ノーザンブロット・ハイブリダイゼーションのプローブ
プロ 制限 制限酵素認識部位の 制限 制限酵素認識部位のーブ 酵素1 ヌクレオチド番号* 酵素2 ヌクレオチド番号*
a EcoRI 29810〜29815 EcoRI 30912〜30917
b BglII 27434〜27441 BglII 29772〜29777c SacI 25838〜25843
_____SacI__27106〜27111
*各ヌクレオチド番号は、配列表の配列番号1に基く。
プローブは上記DNA断片(a、b及びc)1μgをD
IG DNA Labeling Kit(ロシュ・ダ
イアグノスティックス社製)で標識し、使用直前に10
分間煮沸急冷したものを用いた。ハイブリダイゼーショ
ン液(DIGイージーハイブ:ロシュ・ダイアグノステ
ィックス社製)に上記メンブレンを浸し、20rpmで
振盪しつつ、42℃にて2時間プレハイブリダイゼーシ
ョンを行なった後、上述の標識プローブをハイブリダイ
ゼーション液に添加し、マルチシェーカー・オーブンH
B(タイテック社製)を用い20rpmで振盪しつつ4
2℃にて18時間ハイブリダイゼーションを行なった。
ハイブリダイゼーションを行なったメンブレンについ
て、2×SSCを用いた室温、20分間の洗浄を3回、
0.1×SSCを用いた55℃、30分間の洗浄を2
回、それぞれ行なった。洗浄したメンブレンをDIG
Luminescent DetectionKit
for Nucleic Acids(ロシュ・ダイア
グノスティックス社製)で処理し、X線フィルム(ルミ
フィルム:ロシュ・ダイアグノスティックス社製)に露
光した。現像は富士メディカルフィルムプロセサーFP
M800A(富士写真フィルム社製)を用いて行なっ
た。本実施例の結果を図2に記載した。
IG DNA Labeling Kit(ロシュ・ダ
イアグノスティックス社製)で標識し、使用直前に10
分間煮沸急冷したものを用いた。ハイブリダイゼーショ
ン液(DIGイージーハイブ:ロシュ・ダイアグノステ
ィックス社製)に上記メンブレンを浸し、20rpmで
振盪しつつ、42℃にて2時間プレハイブリダイゼーシ
ョンを行なった後、上述の標識プローブをハイブリダイ
ゼーション液に添加し、マルチシェーカー・オーブンH
B(タイテック社製)を用い20rpmで振盪しつつ4
2℃にて18時間ハイブリダイゼーションを行なった。
ハイブリダイゼーションを行なったメンブレンについ
て、2×SSCを用いた室温、20分間の洗浄を3回、
0.1×SSCを用いた55℃、30分間の洗浄を2
回、それぞれ行なった。洗浄したメンブレンをDIG
Luminescent DetectionKit
for Nucleic Acids(ロシュ・ダイア
グノスティックス社製)で処理し、X線フィルム(ルミ
フィルム:ロシュ・ダイアグノスティックス社製)に露
光した。現像は富士メディカルフィルムプロセサーFP
M800A(富士写真フィルム社製)を用いて行なっ
た。本実施例の結果を図2に記載した。
【0074】各シグナルは各プローブの塩基配列と相同
な転写産物の存在を示す。pML45挿入配列上に存在
が推定される新規の構造遺伝子のうち、mlcF、ml
cG、及びmlcHはペニシリウム・シトリナム SA
NK13380株内で転写されていることが確認され
た。
な転写産物の存在を示す。pML45挿入配列上に存在
が推定される新規の構造遺伝子のうち、mlcF、ml
cG、及びmlcHはペニシリウム・シトリナム SA
NK13380株内で転写されていることが確認され
た。
【0075】実施例6. 5’RACEによる5’−末
端配列の決定 各構造遺伝子の5’−末端領域を含むcDNAの取得
は、5’RACE System for Rapid
Amplification of cDNAEnd
s,Version 2.0(GIBCO社製)を用い
て行なった。pML48の挿入配列上の各構造遺伝子に
おいて、コード領域であり且つ該遺伝子の5’−末端近
傍に位置すると考えられる塩基配列に基いて設計された
アンチセンス側のオリゴヌクレオチドDNAを2種類作
製した。表3に、各構造遺伝子のより3’−側に位置す
る塩基配列に基いて設計されたアンチセンス側のオリゴ
ヌクレオチドDNA(1)の塩基配列を、表4に、より
5’−側に位置する塩基配列に基いて設計されたアンチ
センス側のオリゴヌクレオチドDNA(2)の塩基配列
を、それぞれ記載した。
端配列の決定 各構造遺伝子の5’−末端領域を含むcDNAの取得
は、5’RACE System for Rapid
Amplification of cDNAEnd
s,Version 2.0(GIBCO社製)を用い
て行なった。pML48の挿入配列上の各構造遺伝子に
おいて、コード領域であり且つ該遺伝子の5’−末端近
傍に位置すると考えられる塩基配列に基いて設計された
アンチセンス側のオリゴヌクレオチドDNAを2種類作
製した。表3に、各構造遺伝子のより3’−側に位置す
る塩基配列に基いて設計されたアンチセンス側のオリゴ
ヌクレオチドDNA(1)の塩基配列を、表4に、より
5’−側に位置する塩基配列に基いて設計されたアンチ
センス側のオリゴヌクレオチドDNA(2)の塩基配列
を、それぞれ記載した。
【0076】
【表3】
5’RACEによる5’−末端配列解析に用いるオリゴヌクレオチドDNA(
1)
遺伝子 配列表の配列番号:塩基配列 配列番号1中での ヌクレオチド番号
mlcF 配列番号42:catttgctgttgatggagc 30076-30094
mlcG 配列番号43:gacctattgctttgtagcac 28286-28305mlcH 配列番号44:tctgatcagaacgacgagc
__26887-26905__
【0077】
【表4】
5’RACEによる5’−末端配列解析に用いるオリゴヌクレオチドDNA(
2)
遺伝子 配列表の配列番号:塩基配列 配列番号1中での
_ヌクレオチド番号
mlcF 配列番号45:tcagagaaggccactatgcc 30032-30051
mlcG 配列番号46:cttctgcgccattcttcttgg 28520-28540mlcH 配列番号47:agatttgcaccatagatccac
____26736-26756
【0078】オリゴヌクレオチドDNA(1)をプライ
マーとし、ペニシリウム・シトリナムSANK1338
0株の全RNAを鋳型とした逆転写反応によりcDNA
第一鎖を合成した。すなわち、1μgの全RNA、2.
5pmolのオリゴヌクレオチドDNA(1)、1μl
のSUPER SCRIPTTM II revers
e transcriptase(このキットに含まれ
る。)を含む24μlの反応液を、16℃にて1時間保
温した後、生成物をこのキットに含まれるGLASSM
AXスピンカートリッジに添加してcDNA第一鎖を精
製した。cDNA第一鎖の3’−末端に、このキットに
含まれるterminal deoxyribonuc
leotidyl transferaseによりポリ
C鎖を付加させた。3’−末端にポリC鎖の付加したc
DNA第一鎖、40pmolのオリゴヌクレオチドDN
A(2)及び40pmolのAbriged Anch
or Primer(このキットに含まれる)を含む5
0μlの反応液を、94℃にて2分間保温し、続いて、
94℃にて30秒、55℃にて30秒、及び、72℃に
て2分間を1サイクルとする反応を35回行なった後、
72℃にて5分間、4℃にて18時間保温した。得られ
た産物をアガロースゲル電気泳動に供した後、ゲルから
DNAを回収し、フェノール・クロロホルム抽出及びエ
タノール沈澱により産物を精製し、エタノール沈殿を行
ない、得られた沈殿を少量のTEに溶解した。ここで得
られたDNA断片、TAクローニング・システムpCR
2.1(Invitrogen社製)を用いて、このキ
ットに含まれるプラスミドpCR2.1にライゲーショ
ンし、形質転換株を得た。得られた形質転換株より常法
により、プラスミドを抽出し5’−末端を含むcDNA
断片の塩基配列を決定し、転写開始点を決定した。表5
に、各構造遺伝子の転写開始点の存在する配列番号を記
載した。
マーとし、ペニシリウム・シトリナムSANK1338
0株の全RNAを鋳型とした逆転写反応によりcDNA
第一鎖を合成した。すなわち、1μgの全RNA、2.
5pmolのオリゴヌクレオチドDNA(1)、1μl
のSUPER SCRIPTTM II revers
e transcriptase(このキットに含まれ
る。)を含む24μlの反応液を、16℃にて1時間保
温した後、生成物をこのキットに含まれるGLASSM
AXスピンカートリッジに添加してcDNA第一鎖を精
製した。cDNA第一鎖の3’−末端に、このキットに
含まれるterminal deoxyribonuc
leotidyl transferaseによりポリ
C鎖を付加させた。3’−末端にポリC鎖の付加したc
DNA第一鎖、40pmolのオリゴヌクレオチドDN
A(2)及び40pmolのAbriged Anch
or Primer(このキットに含まれる)を含む5
0μlの反応液を、94℃にて2分間保温し、続いて、
94℃にて30秒、55℃にて30秒、及び、72℃に
て2分間を1サイクルとする反応を35回行なった後、
72℃にて5分間、4℃にて18時間保温した。得られ
た産物をアガロースゲル電気泳動に供した後、ゲルから
DNAを回収し、フェノール・クロロホルム抽出及びエ
タノール沈澱により産物を精製し、エタノール沈殿を行
ない、得られた沈殿を少量のTEに溶解した。ここで得
られたDNA断片、TAクローニング・システムpCR
2.1(Invitrogen社製)を用いて、このキ
ットに含まれるプラスミドpCR2.1にライゲーショ
ンし、形質転換株を得た。得られた形質転換株より常法
により、プラスミドを抽出し5’−末端を含むcDNA
断片の塩基配列を決定し、転写開始点を決定した。表5
に、各構造遺伝子の転写開始点の存在する配列番号を記
載した。
【0079】
【表5】
【0080】実施例7. 3’RACEによる3’−末
端配列の決定 各構造遺伝子の3’−末端領域を含むcDNAの取得
は、Ready To Go:T−Primed Fi
rst−Strand kit(ファルマシア社製)を
用いて行なった。pML48の挿入塩基配列上の各構造
遺伝子において、コード領域であり、構造遺伝子の3’
−末端近傍に位置すると考えられるセンス側のオリゴヌ
クレオチドDNA(3)を1種類ずつ作製した。表6に
各構造遺伝子について作製したオリゴヌクレオチドDN
A(3)の塩基配列を表示した。
端配列の決定 各構造遺伝子の3’−末端領域を含むcDNAの取得
は、Ready To Go:T−Primed Fi
rst−Strand kit(ファルマシア社製)を
用いて行なった。pML48の挿入塩基配列上の各構造
遺伝子において、コード領域であり、構造遺伝子の3’
−末端近傍に位置すると考えられるセンス側のオリゴヌ
クレオチドDNA(3)を1種類ずつ作製した。表6に
各構造遺伝子について作製したオリゴヌクレオチドDN
A(3)の塩基配列を表示した。
【0081】
【表6】
3’RACEによる3’−末端配列解析に用いるオリゴヌクレオチドDNA(
3)
_
遺伝子 配列表の配列番号:塩基配列 配列番号1中での ヌクレオチド番号
_
mlcF 配列番号23:atgagtccagcgaggattac 29672-29691
mlcG 配列番号24:tatgaagctgctcggtatgc 28759-28778mlcH
____配列番号25:gcgatgaatgccaaagactac 26273-26293
【0082】オリゴヌクレオチドDNA(3)をプライ
マーとし、ペニシリウム・シトリナムSANK1338
0株の全RNA(1μg)を鋳型とした逆転写反応によ
りcDNA第一鎖を合成した。cDNA第一鎖、40p
molのオリゴヌクレオチドDNA(3)及びNotI
−d(T)18プライマー(このキットに含まれる。)
を含む100μlの反応液を、94℃にて2分間保温
し、続いて、94℃にて30秒、55℃にて30秒、及
び、72℃にて2分間を1サイクルとする反応を35回
行なった後、72℃にて5分間、4℃にて18時間保温
した。得られた産物をアガロースゲル電気泳動に供した
後、ゲルからDNAを回収し、フェノール・クロロホル
ム抽出及びエタノール沈澱により産物を精製し、実施例
6記載の方法に準じてpCR2.1を用いてクローニン
グした。得られた形質転換体からプラスミドを抽出し、
cDNAの3’−側断片の塩基配列を決定した。各構造
遺伝子の転写終結点を表7に記載した。
マーとし、ペニシリウム・シトリナムSANK1338
0株の全RNA(1μg)を鋳型とした逆転写反応によ
りcDNA第一鎖を合成した。cDNA第一鎖、40p
molのオリゴヌクレオチドDNA(3)及びNotI
−d(T)18プライマー(このキットに含まれる。)
を含む100μlの反応液を、94℃にて2分間保温
し、続いて、94℃にて30秒、55℃にて30秒、及
び、72℃にて2分間を1サイクルとする反応を35回
行なった後、72℃にて5分間、4℃にて18時間保温
した。得られた産物をアガロースゲル電気泳動に供した
後、ゲルからDNAを回収し、フェノール・クロロホル
ム抽出及びエタノール沈澱により産物を精製し、実施例
6記載の方法に準じてpCR2.1を用いてクローニン
グした。得られた形質転換体からプラスミドを抽出し、
cDNAの3’−側断片の塩基配列を決定した。各構造
遺伝子の転写終結点を表7に記載した。
【0083】
【表7】
【0084】以上の通り、各構造遺伝子の存在、その方
向及びその位置が明らかとなった。これらの情報に基い
て、各構造遺伝子の転写産物及び翻訳産物を取得するこ
とが可能である。
向及びその位置が明らかとなった。これらの情報に基い
て、各構造遺伝子の転写産物及び翻訳産物を取得するこ
とが可能である。
【0085】実施例8.構造遺伝子mlcA、mlc
B、mlcC、mlcD、mlcE、mlcF、mlc
G、mlcH及びmlcR、orf1、orf11、o
rf12、orf13、orf14、orf15、or
f16、orf17、orf18、orf19及びor
f20に対応する各cDNA配列の決定 1)構造遺伝子mlcAに対応するcDNA配列の決定 TAKARA LA PCR kit ver1.1
(宝酒造(株)製)を用いてcDNA第1鎖を合成し
た。所望のcDNAの全長又はその部分領域を増幅する
ために配列表1中のゲノムDNA塩基配列を基に多種の
プライマーを設計し、該cDNA第1鎖を鋳型として以
下の条件によるPCRを行った。片側50pmolずつ
のプライマーを添加し、50μlの反応溶液中で、Ta
kara Thermal cycler MP−30
00を用い、94℃にて30秒、62℃にて30秒、7
2℃にて5分からなる反応サイクルを30回反復した。
PCR産物は実施例6記載の方法に従ってそれぞれプラ
スミドpCR2.1へ挿入し、大腸菌を形質転換した。
形質転換大腸菌から得られた組換プラスミドの各挿入配
列のヌクレオチド配列と構造遺伝子mlcAのヌクレオ
チド配列とを比較することにより、エキソンとイントロ
ンの構造を決定した。このようにして、構造遺伝子ml
cAに対応するcDNAの配列が決定され(配列表の配
列番号2)、該cDNAによりコードされるポリペプチ
ドのアミノ酸配列が推定された(配列表の配列番号
3)。また、該ポリペプチドの機能が、アミノ酸配列の
相同性検索により推定された。構造遺伝子mlcAによ
りコードされるポリペプチドと最も高い相同性を示すア
ミノ酸配列を有する公知物質はロバスタチン生合成遺伝
子クラスター上に存在するLNKS(lovE)であ
り、60%同一であった。
B、mlcC、mlcD、mlcE、mlcF、mlc
G、mlcH及びmlcR、orf1、orf11、o
rf12、orf13、orf14、orf15、or
f16、orf17、orf18、orf19及びor
f20に対応する各cDNA配列の決定 1)構造遺伝子mlcAに対応するcDNA配列の決定 TAKARA LA PCR kit ver1.1
(宝酒造(株)製)を用いてcDNA第1鎖を合成し
た。所望のcDNAの全長又はその部分領域を増幅する
ために配列表1中のゲノムDNA塩基配列を基に多種の
プライマーを設計し、該cDNA第1鎖を鋳型として以
下の条件によるPCRを行った。片側50pmolずつ
のプライマーを添加し、50μlの反応溶液中で、Ta
kara Thermal cycler MP−30
00を用い、94℃にて30秒、62℃にて30秒、7
2℃にて5分からなる反応サイクルを30回反復した。
PCR産物は実施例6記載の方法に従ってそれぞれプラ
スミドpCR2.1へ挿入し、大腸菌を形質転換した。
形質転換大腸菌から得られた組換プラスミドの各挿入配
列のヌクレオチド配列と構造遺伝子mlcAのヌクレオ
チド配列とを比較することにより、エキソンとイントロ
ンの構造を決定した。このようにして、構造遺伝子ml
cAに対応するcDNAの配列が決定され(配列表の配
列番号2)、該cDNAによりコードされるポリペプチ
ドのアミノ酸配列が推定された(配列表の配列番号
3)。また、該ポリペプチドの機能が、アミノ酸配列の
相同性検索により推定された。構造遺伝子mlcAによ
りコードされるポリペプチドと最も高い相同性を示すア
ミノ酸配列を有する公知物質はロバスタチン生合成遺伝
子クラスター上に存在するLNKS(lovE)であ
り、60%同一であった。
【0086】2)構造遺伝子mlcBに対応するcDN
A配列の決定 1)と同様に、構造遺伝子mlcBに対応するcDNA
のヌクレオチド配列が決定され(配列表の配列番号
4)、該cDNAによりコードされるポリペプチドのア
ミノ酸配列が推定された(配列表の配列番号5)。ま
た、該ポリペプチドの機能が、アミノ酸配列の相同性検
索により推定された。構造遺伝子mlcBによりコード
されるポリペプチドと最も高い相同性を示すアミノ酸配
列を有する公知物質はロバスタチン生合成遺伝子クラス
ター上に存在するLDKS(lovF)であり、61%
同一であった。
A配列の決定 1)と同様に、構造遺伝子mlcBに対応するcDNA
のヌクレオチド配列が決定され(配列表の配列番号
4)、該cDNAによりコードされるポリペプチドのア
ミノ酸配列が推定された(配列表の配列番号5)。ま
た、該ポリペプチドの機能が、アミノ酸配列の相同性検
索により推定された。構造遺伝子mlcBによりコード
されるポリペプチドと最も高い相同性を示すアミノ酸配
列を有する公知物質はロバスタチン生合成遺伝子クラス
ター上に存在するLDKS(lovF)であり、61%
同一であった。
【0087】3)構造遺伝子mlcCに対応するcDN
A配列の決定 1)と同様に、構造遺伝子mlcCに対応するcDNA
のヌクレオチド配列が決定され(配列表の配列番号
6)、該cDNAによりコードされるポリペプチドのア
ミノ酸配列が推定された(配列表の配列番号7)。ま
た、該ポリペプチドの機能が、アミノ酸配列の相同性検
索により推定された。構造遺伝子mlcCによりコード
されるポリペプチドと最も高い相同性を示すアミノ酸配
列を有する公知物質はロバスタチン生合成遺伝子クラス
ター上に存在するlovAであり、72%同一であっ
た。
A配列の決定 1)と同様に、構造遺伝子mlcCに対応するcDNA
のヌクレオチド配列が決定され(配列表の配列番号
6)、該cDNAによりコードされるポリペプチドのア
ミノ酸配列が推定された(配列表の配列番号7)。ま
た、該ポリペプチドの機能が、アミノ酸配列の相同性検
索により推定された。構造遺伝子mlcCによりコード
されるポリペプチドと最も高い相同性を示すアミノ酸配
列を有する公知物質はロバスタチン生合成遺伝子クラス
ター上に存在するlovAであり、72%同一であっ
た。
【0088】4)構造遺伝子mlcDに対応するcDN
A配列の決定 1)と同様に、構造遺伝子mlcDに対応するcDNA
のヌクレオチド配列が決定され(配列表の配列番号
8)、該cDNAによりコードされるポリペプチドのア
ミノ酸配列が推定された(配列表の配列番号9)。ま
た、該ポリペプチドの機能が、アミノ酸配列の相同性検
索により推定された。構造遺伝子mlcDによりコード
されるポリペプチドと最も高い相同性を示すアミノ酸配
列を有する公知物質はロバスタチン生合成遺伝子クラス
ター上に存在するORF8であり、63%同一であっ
た。
A配列の決定 1)と同様に、構造遺伝子mlcDに対応するcDNA
のヌクレオチド配列が決定され(配列表の配列番号
8)、該cDNAによりコードされるポリペプチドのア
ミノ酸配列が推定された(配列表の配列番号9)。ま
た、該ポリペプチドの機能が、アミノ酸配列の相同性検
索により推定された。構造遺伝子mlcDによりコード
されるポリペプチドと最も高い相同性を示すアミノ酸配
列を有する公知物質はロバスタチン生合成遺伝子クラス
ター上に存在するORF8であり、63%同一であっ
た。
【0089】5)構造遺伝子mlcEに対応するcDN
A配列の決定 1)と同様に、構造遺伝子mlcEに対応するcDNA
のヌクレオチド配列が決定され(配列表の配列番号1
0)、該cDNAによりコードされるポリペプチドのア
ミノ酸配列が推定された(配列表の配列番号11)。ま
た、該ポリペプチドの機能が、アミノ酸配列の相同性検
索により推定された。構造遺伝子mlcEによりコード
されるポリペプチドと最も高い相同性を示すアミノ酸配
列を有する公知物質はロバスタチン生合成遺伝子クラス
ター上に存在するORF10であり、70%同一であっ
た。
A配列の決定 1)と同様に、構造遺伝子mlcEに対応するcDNA
のヌクレオチド配列が決定され(配列表の配列番号1
0)、該cDNAによりコードされるポリペプチドのア
ミノ酸配列が推定された(配列表の配列番号11)。ま
た、該ポリペプチドの機能が、アミノ酸配列の相同性検
索により推定された。構造遺伝子mlcEによりコード
されるポリペプチドと最も高い相同性を示すアミノ酸配
列を有する公知物質はロバスタチン生合成遺伝子クラス
ター上に存在するORF10であり、70%同一であっ
た。
【0090】6)構造遺伝子mlcFに対応するcDN
A配列の決定 1)と同様に、構造遺伝子mlcFに対応するcDNA
のヌクレオチド配列が決定され(配列表の配列番号1
2)、該cDNAによりコードされるポリペプチドのア
ミノ酸配列が推定された(配列表の配列番号13)。ま
た、該ポリペプチドの機能が、アミノ酸配列の相同性検
索により推定された。構造遺伝子mlcFによりコード
されるポリペプチドと最も高い相同性を示すアミノ酸配
列を有する公知物質はロバスタチン生合成遺伝子クラス
ター上に存在するORF5であり、57%同一であっ
た。
A配列の決定 1)と同様に、構造遺伝子mlcFに対応するcDNA
のヌクレオチド配列が決定され(配列表の配列番号1
2)、該cDNAによりコードされるポリペプチドのア
ミノ酸配列が推定された(配列表の配列番号13)。ま
た、該ポリペプチドの機能が、アミノ酸配列の相同性検
索により推定された。構造遺伝子mlcFによりコード
されるポリペプチドと最も高い相同性を示すアミノ酸配
列を有する公知物質はロバスタチン生合成遺伝子クラス
ター上に存在するORF5であり、57%同一であっ
た。
【0091】7)構造遺伝子mlcGに対応するcDN
A配列の決定 1)と同様に、構造遺伝子mlcGに対応するcDNA
のヌクレオチド配列が決定され(配列表の配列番号1
4)、該cDNAによりコードされるポリペプチドのア
ミノ酸配列が推定された(配列表の配列番号15)。ま
た、該ポリペプチドの機能が、アミノ酸配列の相同性検
索により推定された。構造遺伝子mlcGによりコード
されるポリペプチドと最も高い相同性を示すアミノ酸配
列を有する公知物質はロバスタチン生合成遺伝子クラス
ター上に存在するlovCであり、70%同一であっ
た。
A配列の決定 1)と同様に、構造遺伝子mlcGに対応するcDNA
のヌクレオチド配列が決定され(配列表の配列番号1
4)、該cDNAによりコードされるポリペプチドのア
ミノ酸配列が推定された(配列表の配列番号15)。ま
た、該ポリペプチドの機能が、アミノ酸配列の相同性検
索により推定された。構造遺伝子mlcGによりコード
されるポリペプチドと最も高い相同性を示すアミノ酸配
列を有する公知物質はロバスタチン生合成遺伝子クラス
ター上に存在するlovCであり、70%同一であっ
た。
【0092】8)構造遺伝子mlcHに対応するcDN
A配列の決定 1)と同様に、構造遺伝子mlcHに対応するcDNA
のヌクレオチド配列が決定され(配列表の配列番号1
6)、該cDNAによりコードされるポリペプチドのア
ミノ酸配列が推定された(配列表の配列番号17)。ま
た、該ポリペプチドの機能が、アミノ酸配列の相同性検
索により推定された。構造遺伝子mlcHによりコード
されるポリペプチドと最も高い相同性を示すアミノ酸配
列を有する公知物質はロバスタチン生合成遺伝子クラス
ター上に存在するlovDであり、75%同一であっ
た。
A配列の決定 1)と同様に、構造遺伝子mlcHに対応するcDNA
のヌクレオチド配列が決定され(配列表の配列番号1
6)、該cDNAによりコードされるポリペプチドのア
ミノ酸配列が推定された(配列表の配列番号17)。ま
た、該ポリペプチドの機能が、アミノ酸配列の相同性検
索により推定された。構造遺伝子mlcHによりコード
されるポリペプチドと最も高い相同性を示すアミノ酸配
列を有する公知物質はロバスタチン生合成遺伝子クラス
ター上に存在するlovDであり、75%同一であっ
た。
【0093】9)構造遺伝子mlcRに対応するcDN
A配列の決定 1)と同様に、構造遺伝子mlcRに対応するcDNA
のヌクレオチド配列が決定され(配列表の配列番号1
8)、該cDNAによりコードされるポリペプチドのア
ミノ酸配列が推定された(配列表の配列番号19)。ま
た、該ポリペプチドの機能が、アミノ酸配列の相同性検
索により推定された。構造遺伝子mlcRによりコード
されるポリペプチドと最も高い相同性を示すアミノ酸配
列を有する公知物質はロバスタチン生合成遺伝子クラス
ター上に存在するlovEであり、34%同一であっ
た。
A配列の決定 1)と同様に、構造遺伝子mlcRに対応するcDNA
のヌクレオチド配列が決定され(配列表の配列番号1
8)、該cDNAによりコードされるポリペプチドのア
ミノ酸配列が推定された(配列表の配列番号19)。ま
た、該ポリペプチドの機能が、アミノ酸配列の相同性検
索により推定された。構造遺伝子mlcRによりコード
されるポリペプチドと最も高い相同性を示すアミノ酸配
列を有する公知物質はロバスタチン生合成遺伝子クラス
ター上に存在するlovEであり、34%同一であっ
た。
【0094】10)orf1に対応するcDNA配列の
決定 1)と同様に、orf1に対応するcDNAのヌクレオ
チド配列が決定され(配列表の配列番号20)、該cD
NAによりコードされるポリペプチドのアミノ酸配列が
推定された(配列表の配列番号21)。
決定 1)と同様に、orf1に対応するcDNAのヌクレオ
チド配列が決定され(配列表の配列番号20)、該cD
NAによりコードされるポリペプチドのアミノ酸配列が
推定された(配列表の配列番号21)。
【0095】11)orf11に対応するcDNA配列
の決定 1)と同様に、orf11に対応するcDNAのヌクレ
オチド配列が決定され(配列表の配列番号22)、該c
DNAによりコードされるポリペプチドのアミノ酸配列
が推定された(配列表の配列番号23)。
の決定 1)と同様に、orf11に対応するcDNAのヌクレ
オチド配列が決定され(配列表の配列番号22)、該c
DNAによりコードされるポリペプチドのアミノ酸配列
が推定された(配列表の配列番号23)。
【0096】12)orf12に対応するcDNA配列
の決定 1)と同様に、orf12に対応するcDNAのヌクレ
オチド配列が決定され(配列表の配列番号24)、該c
DNAによりコードされるポリペプチドのアミノ酸配列
が推定された(配列表の配列番号25)。
の決定 1)と同様に、orf12に対応するcDNAのヌクレ
オチド配列が決定され(配列表の配列番号24)、該c
DNAによりコードされるポリペプチドのアミノ酸配列
が推定された(配列表の配列番号25)。
【0097】13)orf13に対応するcDNA配列
の決定 1)と同様に、orf13に対応するcDNAのヌクレ
オチド配列が決定され(配列表の配列番号26)、該c
DNAによりコードされるポリペプチドのアミノ酸配列
が推定された(配列表の配列番号27)。
の決定 1)と同様に、orf13に対応するcDNAのヌクレ
オチド配列が決定され(配列表の配列番号26)、該c
DNAによりコードされるポリペプチドのアミノ酸配列
が推定された(配列表の配列番号27)。
【0098】14)orf14に対応するcDNA配列
の決定 1)と同様に、orf14に対応するcDNAのヌクレ
オチド配列が決定され(配列表の配列番号28)、該c
DNAによりコードされるポリペプチドのアミノ酸配列
が推定された(配列表の配列番号29)。
の決定 1)と同様に、orf14に対応するcDNAのヌクレ
オチド配列が決定され(配列表の配列番号28)、該c
DNAによりコードされるポリペプチドのアミノ酸配列
が推定された(配列表の配列番号29)。
【0099】15)orf15に対応するcDNA配列
の決定 1)と同様に、orf15に対応するcDNAのヌクレ
オチド配列が決定され(配列表の配列番号30)、該c
DNAによりコードされるポリペプチドのアミノ酸配列
が推定された(配列表の配列番号31)。
の決定 1)と同様に、orf15に対応するcDNAのヌクレ
オチド配列が決定され(配列表の配列番号30)、該c
DNAによりコードされるポリペプチドのアミノ酸配列
が推定された(配列表の配列番号31)。
【0100】16)orf16に対応するcDNA配列
の決定 1)と同様に、orf16に対応するcDNAのヌクレ
オチド配列が決定され(配列表の配列番号32)、該c
DNAによりコードされるポリペプチドのアミノ酸配列
が推定された(配列表の配列番号33)。
の決定 1)と同様に、orf16に対応するcDNAのヌクレ
オチド配列が決定され(配列表の配列番号32)、該c
DNAによりコードされるポリペプチドのアミノ酸配列
が推定された(配列表の配列番号33)。
【0101】17)orf17に対応するcDNA配列
の決定 1)と同様に、orf17に対応するcDNAのヌクレ
オチド配列が決定され(配列表の配列番号34)、該c
DNAによりコードされるポリペプチドのアミノ酸配列
が推定された(配列表の配列番号35)。
の決定 1)と同様に、orf17に対応するcDNAのヌクレ
オチド配列が決定され(配列表の配列番号34)、該c
DNAによりコードされるポリペプチドのアミノ酸配列
が推定された(配列表の配列番号35)。
【0102】18)orf18に対応するcDNA配列
の決定 1)と同様に、orf18に対応するcDNAのヌクレ
オチド配列が決定され(配列表の配列番号36)、該c
DNAによりコードされるポリペプチドのアミノ酸配列
が推定された(配列表の配列番号37)。
の決定 1)と同様に、orf18に対応するcDNAのヌクレ
オチド配列が決定され(配列表の配列番号36)、該c
DNAによりコードされるポリペプチドのアミノ酸配列
が推定された(配列表の配列番号37)。
【0103】19)orf19に対応するcDNA配列
の決定 1)と同様に、orf19に対応するcDNAのヌクレ
オチド配列が決定され(配列表の配列番号38)、該c
DNAによりコードされるポリペプチドのアミノ酸配列
が推定された(配列表の配列番号39)。
の決定 1)と同様に、orf19に対応するcDNAのヌクレ
オチド配列が決定され(配列表の配列番号38)、該c
DNAによりコードされるポリペプチドのアミノ酸配列
が推定された(配列表の配列番号39)。
【0104】20)orf20に対応するcDNA配列
の決定 1)と同様に、orf20に対応するcDNAのヌクレ
オチド配列が決定され(配列表の配列番号40)、該c
DNAによりコードされるポリペプチドのアミノ酸配列
が推定された(配列表の配列番号41)。 実施例9.pML45組換えDNAベクターによる形質
転換 ペニシリウム・シトリナムの形質転換は、ナラらの方法
(Nara, F., et al., Curr. Genet. 23, 28(1993)記
載)に従った。
の決定 1)と同様に、orf20に対応するcDNAのヌクレ
オチド配列が決定され(配列表の配列番号40)、該c
DNAによりコードされるポリペプチドのアミノ酸配列
が推定された(配列表の配列番号41)。 実施例9.pML45組換えDNAベクターによる形質
転換 ペニシリウム・シトリナムの形質転換は、ナラらの方法
(Nara, F., et al., Curr. Genet. 23, 28(1993)記
載)に従った。
【0105】1)プロトプラストの調製
ペニシリウム・シトリナム SANK13380株を培
養したスラントより、白金耳を用いてPGA寒天培地に
接種し、26℃にて14日間保温した。該培養物よりペ
ニシリウム・シトリナム SANK13380株の胞子
を回収し、1×108個の胞子を80mlのYPL−2
0培地に接種し、26℃にて1日間保温した。胞子の発
芽を顕微鏡観察により確認した後、発芽胞子を、室温、
5000×Gの条件下で10分間遠心分離して胞子を沈
澱として回収した。胞子を滅菌水で3回洗浄した後、プ
ロトプラスト化を行なった。すなわち、200mgのザ
イモリアーゼ20T(生化学工業(株)製)及び100
mgのキチナーゼ(Sigma社製)を10mlの0.
55M 塩化マグネシウムに溶解し、室温、5000×
Gの条件下で10分間遠心分離して得られた上清を酵素
液とし、20mlの酵素液及び湿重量0.5gの発芽胞
子を100ml容三角フラスコに入れ、30℃にて60
分間穏やかに振盪し、発芽胞子がプロトプラスト化した
ことを顕微鏡観察により確認した後、反応液を3G−2
ガラスフィルター(HARIO社製)で濾過した。該濾
液を、室温、1000×Gの条件下で10分間遠心分離
し、プロトプラストを沈澱として回収した。
養したスラントより、白金耳を用いてPGA寒天培地に
接種し、26℃にて14日間保温した。該培養物よりペ
ニシリウム・シトリナム SANK13380株の胞子
を回収し、1×108個の胞子を80mlのYPL−2
0培地に接種し、26℃にて1日間保温した。胞子の発
芽を顕微鏡観察により確認した後、発芽胞子を、室温、
5000×Gの条件下で10分間遠心分離して胞子を沈
澱として回収した。胞子を滅菌水で3回洗浄した後、プ
ロトプラスト化を行なった。すなわち、200mgのザ
イモリアーゼ20T(生化学工業(株)製)及び100
mgのキチナーゼ(Sigma社製)を10mlの0.
55M 塩化マグネシウムに溶解し、室温、5000×
Gの条件下で10分間遠心分離して得られた上清を酵素
液とし、20mlの酵素液及び湿重量0.5gの発芽胞
子を100ml容三角フラスコに入れ、30℃にて60
分間穏やかに振盪し、発芽胞子がプロトプラスト化した
ことを顕微鏡観察により確認した後、反応液を3G−2
ガラスフィルター(HARIO社製)で濾過した。該濾
液を、室温、1000×Gの条件下で10分間遠心分離
し、プロトプラストを沈澱として回収した。
【0106】2)形質転換
1)で得られたプロトプラストを30mlの0.55M
塩化マグネシウム溶液で2回、30mlの0.55M
塩化マグネシウム−50mM 塩化カルシウム−10m
M 3−モルフォリノプロパンスルホン酸(pH6.
3:以下、「MCM溶液」という。)で1回それぞれ洗
浄し、100μlの4%(w/v)ポリエチレングリコール
8000−10mM 3−モルフォリノプロパンスルホ
ン酸−0.0025%(w/v)ヘパリン(Sigma社
製)−50mM 塩化マグネシウム(pH6.3:以
下、「形質転換用溶液」という。)に懸濁した。約5×
107個のプロトプラストを含む96μlの形質転換溶
液及び120μgのpML45DNAを含む10μlの
TEを混合し、氷上で30分間静置した。これに1.2
mlの20%(w/v)ポリエチレングリコール−50mM
塩化マグネシウム−10mM3−モルフォリノプロパン
スルホン酸(pH6.3)を加えて穏やかにピペッティ
ングし、室温、20分間静置した。これに10mlのM
CM溶液を加えて穏やかに混合し、室温、1000×G
の条件下で10分間遠心分離した。沈澱より形質転換プ
ロトプラストを回収した。
塩化マグネシウム溶液で2回、30mlの0.55M
塩化マグネシウム−50mM 塩化カルシウム−10m
M 3−モルフォリノプロパンスルホン酸(pH6.
3:以下、「MCM溶液」という。)で1回それぞれ洗
浄し、100μlの4%(w/v)ポリエチレングリコール
8000−10mM 3−モルフォリノプロパンスルホ
ン酸−0.0025%(w/v)ヘパリン(Sigma社
製)−50mM 塩化マグネシウム(pH6.3:以
下、「形質転換用溶液」という。)に懸濁した。約5×
107個のプロトプラストを含む96μlの形質転換溶
液及び120μgのpML45DNAを含む10μlの
TEを混合し、氷上で30分間静置した。これに1.2
mlの20%(w/v)ポリエチレングリコール−50mM
塩化マグネシウム−10mM3−モルフォリノプロパン
スルホン酸(pH6.3)を加えて穏やかにピペッティ
ングし、室温、20分間静置した。これに10mlのM
CM溶液を加えて穏やかに混合し、室温、1000×G
の条件下で10分間遠心分離した。沈澱より形質転換プ
ロトプラストを回収した。
【0107】3)形質転換プロトプラストにおける細胞
壁の再生 2)で得られた形質転換プロトプラストを5mlの液状
のVGS中層寒天培地に懸濁し、固化した10mlのV
GS下層寒天培地プレートに重層した。該プレートを、
26℃にて1日間培養した後、プレート1枚につき5m
gのハイグロマイシンB(Hygromycin B:
Sigma社製)を含む10mlの液状のVGS上層寒
天培地を重層した(ハイグロマイシンBの終濃度は20
0μg/ml)。26℃にて14日間保温して得られた
菌株を、200μg/mlのハイグロマイシンBを含有
するPGA寒天培地上で継代培養した後、PGA寒天培
地で作製したスラントに植え継ぎ、26℃にて14日間
保温した。これを形質転換株という。該スラントは4℃
で保存した。
壁の再生 2)で得られた形質転換プロトプラストを5mlの液状
のVGS中層寒天培地に懸濁し、固化した10mlのV
GS下層寒天培地プレートに重層した。該プレートを、
26℃にて1日間培養した後、プレート1枚につき5m
gのハイグロマイシンB(Hygromycin B:
Sigma社製)を含む10mlの液状のVGS上層寒
天培地を重層した(ハイグロマイシンBの終濃度は20
0μg/ml)。26℃にて14日間保温して得られた
菌株を、200μg/mlのハイグロマイシンBを含有
するPGA寒天培地上で継代培養した後、PGA寒天培
地で作製したスラントに植え継ぎ、26℃にて14日間
保温した。これを形質転換株という。該スラントは4℃
で保存した。
【0108】実施例10.ペニシリウム・シトリナムの
形質転換 ペニシリウム・シトリナムの形質転換は、ナラらの方法
(Nara, F., et al., Curr. Genet. 23, 28 (1993)記
載)に従った。 1)構造遺伝子mlcF、mlcG及びmlcHを含む
遺伝子断片の取得 pML45 5μgを200μlの反応溶液中で、37
℃、2時間、制限酵素MluI、KpnI(ともに宝酒
造(株)製)で消化した。制限酵素処理後に、1%アガ
ロースゲルにて、電気泳動を行ない、mlcF、mlc
G及びmlcHを含む目的とする9.6kbの遺伝子断
片をアガロースゲルより回収した。DNA Blunt
ing Kit(宝酒造(株)製)を用い、該遺伝子断
片の末端を平滑化し、制限酵素SmaI(宝酒造(株)
製)にて、37℃で、1時間反応後、65℃、30分
間、アルカリフォスファターゼ処理を行なった、染色体
組込型シャトルベクターpPTR I DNA(宝酒造
(株)製)のSmaI部位にDNA ligation
kit Ver.2(宝酒造(株)製)を用いて連結
し、大腸菌のコンピーテント・セルJM109株(宝酒
造(株)製)を形質転換した。その結果、組換えDNA
ベクターで形質転換された大腸菌株が得られた。形質転
換大腸菌より抽出したプラスミドをpFGH96と命名
した。
形質転換 ペニシリウム・シトリナムの形質転換は、ナラらの方法
(Nara, F., et al., Curr. Genet. 23, 28 (1993)記
載)に従った。 1)構造遺伝子mlcF、mlcG及びmlcHを含む
遺伝子断片の取得 pML45 5μgを200μlの反応溶液中で、37
℃、2時間、制限酵素MluI、KpnI(ともに宝酒
造(株)製)で消化した。制限酵素処理後に、1%アガ
ロースゲルにて、電気泳動を行ない、mlcF、mlc
G及びmlcHを含む目的とする9.6kbの遺伝子断
片をアガロースゲルより回収した。DNA Blunt
ing Kit(宝酒造(株)製)を用い、該遺伝子断
片の末端を平滑化し、制限酵素SmaI(宝酒造(株)
製)にて、37℃で、1時間反応後、65℃、30分
間、アルカリフォスファターゼ処理を行なった、染色体
組込型シャトルベクターpPTR I DNA(宝酒造
(株)製)のSmaI部位にDNA ligation
kit Ver.2(宝酒造(株)製)を用いて連結
し、大腸菌のコンピーテント・セルJM109株(宝酒
造(株)製)を形質転換した。その結果、組換えDNA
ベクターで形質転換された大腸菌株が得られた。形質転
換大腸菌より抽出したプラスミドをpFGH96と命名
した。
【0109】2)プロトプラストの調製
ペニシリウム・シトリナム SANK13380株を培
養したスラントより、白金耳を用いてPGA寒天培地に
接種し、26℃にて14日間保温した。該培養物よりペ
ニシリウム・シトリナム SANK13380株の胞子
を回収し、1×108個の胞子を80mlのYPL−2
0培地に接種し、26℃にて1日間保温した。胞子の発
芽を顕微鏡観察により確認した後、発芽胞子を、室温、
5000×Gの条件下で10分間遠心分離して胞子を沈
澱として回収した。胞子を滅菌水で3回洗浄した後、プ
ロトプラスト化を行なった。すなわち、200mgのザ
イモリアーゼ20T(生化学工業(株)製)及び100
mgのキチナーゼ(Sigma社製)を10mlの0.
55M 塩化マグネシウムに溶解し、室温、5000×
Gの条件下で10分間遠心分離して得られた上清を酵素
液とし、20mlの酵素液及び湿重量0.5gの発芽胞
子を100ml容三角フラスコに入れ、30℃にて60
分間穏やかに振盪し、発芽胞子がプロトプラスト化した
ことを顕微鏡観察により確認した後、反応液を3G−2
ガラスフィルター(HARIO社製)で濾過した。該濾
液を、室温、1000×Gの条件下で10分間遠心分離
し、プロトプラストを沈澱として回収した。
養したスラントより、白金耳を用いてPGA寒天培地に
接種し、26℃にて14日間保温した。該培養物よりペ
ニシリウム・シトリナム SANK13380株の胞子
を回収し、1×108個の胞子を80mlのYPL−2
0培地に接種し、26℃にて1日間保温した。胞子の発
芽を顕微鏡観察により確認した後、発芽胞子を、室温、
5000×Gの条件下で10分間遠心分離して胞子を沈
澱として回収した。胞子を滅菌水で3回洗浄した後、プ
ロトプラスト化を行なった。すなわち、200mgのザ
イモリアーゼ20T(生化学工業(株)製)及び100
mgのキチナーゼ(Sigma社製)を10mlの0.
55M 塩化マグネシウムに溶解し、室温、5000×
Gの条件下で10分間遠心分離して得られた上清を酵素
液とし、20mlの酵素液及び湿重量0.5gの発芽胞
子を100ml容三角フラスコに入れ、30℃にて60
分間穏やかに振盪し、発芽胞子がプロトプラスト化した
ことを顕微鏡観察により確認した後、反応液を3G−2
ガラスフィルター(HARIO社製)で濾過した。該濾
液を、室温、1000×Gの条件下で10分間遠心分離
し、プロトプラストを沈澱として回収した。
【0110】3)pML48による形質転換
2)で得られたプロトプラストを30mlの0.55M
塩化マグネシウム溶液で2回、30mlの0.55M
塩化マグネシウム−50mM 塩化カルシウム−10
mM 3−モルフォリノプロパンスルホン酸(pH6.
3:以下、「MCM溶液」という。)で1回それぞれ洗
浄し、100μlの4%(w/v)ポリエチレングリコール
8000−10mM 3−モルフォリノプロパンスルホ
ン酸−0.0025%(w/v)ヘパリン(Sigma社
製)−50mM 塩化マグネシウム(pH6.3:以
下、「形質転換用溶液」という。)に懸濁した。約5×
107個のプロトプラストを含む96μlの形質転換溶
液及び120μgのpML48DNAを含む10μlの
TEを混合し、氷上で30分間静置した。これに1.2
mlの20%(w/v)ポリエチレングリコール−50mM
塩化マグネシウム−10mM 3−モルフォリノプロ
パンスルホン酸(pH6.3)を加えて穏やかにピペッ
ティングし、室温、20分間静置した。これに10ml
のMCM溶液を加えて穏やかに混合し、室温、1000
×Gの条件下で10分間遠心分離した。沈澱より形質転
換プロトプラストを回収した。
塩化マグネシウム溶液で2回、30mlの0.55M
塩化マグネシウム−50mM 塩化カルシウム−10
mM 3−モルフォリノプロパンスルホン酸(pH6.
3:以下、「MCM溶液」という。)で1回それぞれ洗
浄し、100μlの4%(w/v)ポリエチレングリコール
8000−10mM 3−モルフォリノプロパンスルホ
ン酸−0.0025%(w/v)ヘパリン(Sigma社
製)−50mM 塩化マグネシウム(pH6.3:以
下、「形質転換用溶液」という。)に懸濁した。約5×
107個のプロトプラストを含む96μlの形質転換溶
液及び120μgのpML48DNAを含む10μlの
TEを混合し、氷上で30分間静置した。これに1.2
mlの20%(w/v)ポリエチレングリコール−50mM
塩化マグネシウム−10mM 3−モルフォリノプロ
パンスルホン酸(pH6.3)を加えて穏やかにピペッ
ティングし、室温、20分間静置した。これに10ml
のMCM溶液を加えて穏やかに混合し、室温、1000
×Gの条件下で10分間遠心分離した。沈澱より形質転
換プロトプラストを回収した。
【0111】4)形質転換プロトプラストにおける細胞
壁の再生 3)で得られた形質転換プロトプラストを5mlの液状
のVGS中層寒天培地に懸濁し、固化した10mlのV
GS下層寒天培地プレートに重層した。該プレートを、
26℃にて1日間培養した後、プレート1枚につき5m
gのピリチアミン(宝酒造(株)製)を含む10mlの
液状のVGS上層寒天培地を重層した(ピリチアミンの
終濃度は0.1μg/ml)。26℃にて14日間保温
して得られた菌株を、0.1μg/mlのピリチアミン
を含有するPGA寒天培地上で継代培養した後、PGA
寒天培地で作製したスラントに植え継ぎ、26℃にて1
4日間保温した。これを形質転換株ML−48という。
該スラントは4℃で保存した。
壁の再生 3)で得られた形質転換プロトプラストを5mlの液状
のVGS中層寒天培地に懸濁し、固化した10mlのV
GS下層寒天培地プレートに重層した。該プレートを、
26℃にて1日間培養した後、プレート1枚につき5m
gのピリチアミン(宝酒造(株)製)を含む10mlの
液状のVGS上層寒天培地を重層した(ピリチアミンの
終濃度は0.1μg/ml)。26℃にて14日間保温
して得られた菌株を、0.1μg/mlのピリチアミン
を含有するPGA寒天培地上で継代培養した後、PGA
寒天培地で作製したスラントに植え継ぎ、26℃にて1
4日間保温した。これを形質転換株ML−48という。
該スラントは4℃で保存した。
【0112】5)pFGH96による形質転換
1)で得られたプラスミドpFGH96を用いて4)で
得られた形質転換株ML−48を形質転換した。形質転
換株ML−48のプロトプラスト化、形質転換は、上記
2)、3)と同様に行なった。形質転換プロトプラスト
の再生は、ハイグロマイシンBの代りに、0.1μg/
mlのピリチアミン(宝酒造(株)製)を用いたことを
除いては4)と同様に行なった。その結果、形質転換株
ML48−FGHを得た。形質転換株ML48−FGH
はペニシリウム・シトリナム SANK13380株に
比べML−236Bの生産能が改善する。
得られた形質転換株ML−48を形質転換した。形質転
換株ML−48のプロトプラスト化、形質転換は、上記
2)、3)と同様に行なった。形質転換プロトプラスト
の再生は、ハイグロマイシンBの代りに、0.1μg/
mlのピリチアミン(宝酒造(株)製)を用いたことを
除いては4)と同様に行なった。その結果、形質転換株
ML48−FGHを得た。形質転換株ML48−FGH
はペニシリウム・シトリナム SANK13380株に
比べML−236Bの生産能が改善する。
【0113】
【発明の効果】本発明においてML−236B生産菌よ
り得られたDNAは、該生産菌内に導入されることによ
り該生産菌のML−236B生産能を改善しうる。ま
た、該DNA上には、20の構造遺伝子の存在が示唆さ
れ、その方向及びその位置が明らかとなった。これらの
うち少なくとも9つの構造遺伝子はそれぞれML−23
6Bの生産へ関与しており、本発明により、それぞれの
構造遺伝子に対応するcDNAを取得することが可能に
なる。
り得られたDNAは、該生産菌内に導入されることによ
り該生産菌のML−236B生産能を改善しうる。ま
た、該DNA上には、20の構造遺伝子の存在が示唆さ
れ、その方向及びその位置が明らかとなった。これらの
うち少なくとも9つの構造遺伝子はそれぞれML−23
6Bの生産へ関与しており、本発明により、それぞれの
構造遺伝子に対応するcDNAを取得することが可能に
なる。
【図1】pML42、pML45、pML48およびpM
L51の位置と構造遺伝子の解析。
L51の位置と構造遺伝子の解析。
【図2】mlcF、mlcGおよびmlcH遺伝子のノ
ーザンブロット解析
ーザンブロット解析
【配列表】
SEQUENCE LISTING
<110> SANKYO CO., LTD.
<120> DNAs related to the biosynthesis of ML-236B
<130> 2001159SU
<140>
<141>
<160> 50
<170> PatentIn Ver. 2.1
<210> 1
<211> 72149
<212> DNA
<213> Penicillium citrinum
<400> 1
gatctcagat aacagtcgcc cttcatgggt cacccatctt aacgggttcc aaaatttaat 60
tcggacacga aaagaacgcc ccggtcgctc atgtcacagt caagatctgg ccagtttctt 120
caatcgttac ttcgccttcc acttagttct agcccgcact gcatttcggg tcacccctcc 180
ctcatctcat atatcgcctc ttctgccgga cagtatactg gaaaaatcag acacgattga 240
tccgtacatg ggattgagcc ctgctctctt attgatgatc gatcaagtag cagaattagc 300
atgggctcgg gaggatggca acataaaaat caaccgtaaa gatgctcatc aactcaagac 360
ggacctcgat agccttcaac aaaagatacc cacagaaaat atcgatccta atatggagtg 420
tgctgcaatc gcagaagcga acaggctcgg ggcccttctt cttctccacg agatctgttc 480
gagcaaagaa cctattaatc gctctggtat cccgacagtg gaatctgagg agaagaatgt 540
ttatgtcgaa cggatattgg cattgatgtt ggaaaagaag gtaaatatga tgcgtactgc 600
agttacgcct ttatggcctc tcttcctggc agggtgctgt gctcgcaggg aagaggagag 660
ggtcactgta ttacagttgt ttaaagatct ggagggtatt cgtcgatttg gtgtatgtat 720
attcttctat ctatttccct gttggttgac taatgactcg ttgttcctca gaacattacc 780
cctgcgattg aagttgtgga aatggtctgg cgccagcggg atctgtcggt acaagatgaa 840
agaagactcc agaaaaggct cagtgcacag cggcagaaag attccttgca agaaacccgg 900
ttctcgtggg agcatgccat ggtcatgttg ggcgggtgga agctcagctt gacttgagct 960
tctacgtggt aataaaggct tttgtttatg ttctcttgta tatattctag gaagattatc 1020
tcaatttgta tgaccagaag ttaaactgtg tgctaattat tcaacctcat tcaatctcgc 1080
acctcttatc tggacaaatc atagtttaga agcatggctt ctttcacgta tctgtctacc 1140
cttccaccct gtaaggtcgc tcaactccat ttccggatcc aaatgcgcta gattcttcgc 1200
agtactcttc tgcccagccc tccattgcca ttgactgacg atctctgggt ccagagtccc 1260
ctcaagcaaa tccgcgacat attttccaac gacaggaagg aacttgaacc catgtgctga 1320
tccgccggtt gccaggaaga gacttttgtg agcaggatga ggggtgacaa ggaaatgccg 1380
atcagccgta tcagcatccc agcacagccg tgtatagcag aagggtctgt ctgcaagttc 1440
ggggagcaca cgtcgcaagt tccggcgcat ttgggcttcg atctcaagag ggaggccatc 1500
ggtgggtgcc tgaacaaacg tgtgtgggac agaagtggtg ataccagact tggtggtttg 1560
cacgttggtg atgaattgac tgtgagccat cttgaagatc ccatcttctt gaggtgggaa 1620
gaagtagccc agctcgagat tatccataat gggcatcgag gcatagtgtt tcgtttcgga 1680
aggggtcagc tgtatatgag cgacactgtg ccccttggca gttaactggc ccttcacgtc 1740
tagtagcgaa ggtgtccaag ctcctgcggc taagatgacc acatccgcct cgtgtctcgt 1800
gccatctgct gtgacgactc ccttgcactc gcccgtaata tcatccagta tcaactcttg 1860
cacatccccc ttcgtcttcc ccgaaatgta tttcacccct ttctcctgag aagcgcctgc 1920
catccgctcg atagctgtac cagcagctgc ccacccggcc gttgggttcc acacattgat 1980
attccatcca tccagcttgc ccgtgacaac agagaagcga gtacggatct gatccggcgt 2040
gagcttctca agaccctgta ctccaagcct cttacatgtc tcaatcgaac cctcgacaaa 2100
gggccgggac aggttcgctg cgctgagaat ccacccgggg acatggtaga gcccacgaaa 2160
cagggaccaa gaccgccacg cttcaataga ctcgattcca agacgtgcat atagaggttc 2220
gttgtagtcg ctgcggataa ccttgctgat atcggtagag gctgcttcgc aagagggagg 2280
ggcgtatgga tccagcacgc ggatggaagt gtaaccgcgc tgtgaaaggt ggtatgcggt 2340
cgaagtgccg aagcagcctg ctccaacgat gaggatccgc gtgtctttgt ccatcatgtg 2400
agttaaattg ctttcgcgac ttggtttaac ctctcaaact ttgagggtgg cgcctccata 2460
tttattaagg cattttgctc cgtcctgcct tctttcagag aatctgatct cgctaccagc 2520
ttcctcacgc acaaccatat gcatcttcta agataccatc gtgtgcgggg aagaaatcta 2580
ctgcttcgtt ctgaccttcc aataaagatc tcaaagcttg agggacggag attctccgag 2640
tggagagagt gctcgtttcg accttctttt acctcaacat ttccccaact aaagaattgc 2700
ctaaacgatt aatctttctt cattccatgg ccttggtatt gacaattaaa ttactcagag 2760
actacctaca acataggtaa taactatgta aaggaggccc ccctgaggat ctcctttatc 2820
aatcatcgcg gccaatcttc tctttcatgc tgcttgctct ttggccggtc gcgttgctat 2880
ctgtcacact cctacctctt ctatcgttat aggtacctca tctgcatcta actctgcgag 2940
tagcttatct atcgctaaga agcaccacta agaaggccag tcaatataaa tggacggtta 3000
gaacattcaa attagcttaa ttagaggacg acagttttaa aagaacatat ataattttaa 3060
gacctaatag tcataggagt tttaacaata cttaatagat taatatctga tgtactacag 3120
tggatccttg gctacggtca aagccaatat atcttgactg ccgccgcttc aaggagggtg 3180
ctcagagtca ggctcactgt aaggcatcaa tgggctcagg atcatcgtct atctagggat 3240
ctgaataatc cagcatgatt aaaaaaaacc actcatgaca acccgaatga cttcaccaaa 3300
tggatgtcat gtctgagttt ccactttact ccgctgcgag atctgtacgg cactacgaac 3360
acttatcctt tacgttacta gtctttaatt aataaatata gtttcggtca tttccagggt 3420
ttaggggaaa caatgaatct atatatgtta aatacttcca agattacaag agattctacg 3480
agtataggta tctagtagag ctacttgcgg agtgcgcctc cccaaattat caatattcgg 3540
cggaattaaa aagacgagtt gccatgagat ctgcttatgg ctggtgcact aacgctagca 3600
agataagaca gaatccttaa caaaaagcac acgcaccgaa aggcataaca acaggctaat 3660
ctttcacagg cttccgcact cttctggaaa ggtcagtgga ttgagataat ttacggccaa 3720
ttttacgtta agatgaatga catctatctg caattcggct ttttttttcg cggagagagt 3780
ccttcagatg cacgcaggtg cgcttaagct caccgcttat tccacagttg gcggattcta 3840
acttccgaat tattgcctcg aatgaaccgc tttcattttg gtcgctccag gccggccaca 3900
tctggtgtcg atcatcggcg ctgcggaggt tccaagggtg acttgatgaa tcggaactat 3960
gacctcttct tttggcagat ggttctgttc gaattgggca acctgcaatg tttgcgggaa 4020
tccccgcctc aagtgaccag cctgattctt cgcagagaga acgatgcaaa caaagacctc 4080
cgcaggccaa atttgactgt tgtagattct cgtgggactc cgtcaccggc agatgtcttg 4140
agtcggactt ggccggcagc gacgacgacg tcaagtcggt tatcagggaa taatgagaat 4200
aatgagtttt tcccagcata attacaaata atactaactt actgatatcg gctgtcagta 4260
cttcacgtca cttttgtctg ataaagtctc gtttctgatt gctactgagg atcatgattg 4320
ttgttggtta gtcagagaag gccggaattt cctatggatt cctaccaatg catacaccga 4380
tactcatcag acggaaaatg ctatctggtc gttatgccat tgtaaggcca gtcggtaacc 4440
aaaaactaaa gttcattaaa tgttgaaaat cttgaccaga gcacgttcga gcagcatgaa 4500
agtggtcacc ataagtaagc attttgcact atgcttgtca ggccctatca ttccagccat 4560
ctcattgacg tctgtttctg ccttctgctt tctcagacat tatctcgtct cgctcctgtc 4620
gtttttggga cttttcgggc atgtctacta tccctctgag cccaaaagaa aaagaaaaga 4680
aaagaaaaga aatgaaaaga aaagagaaaa agcgccaagc aactacagtg ctcgagtttt 4740
actccaagaa agaaatctgg ccgtgcagga atcccgaagg ccactgaatt ggtactgagc 4800
gcaaccatcg gaaagttcca cctcgaagcg tctggtgtaa tataaccaaa ttcctttgtg 4860
cggtgccccg tcaacgcttt cagatctgct aacaccacct tgatattcga aattattcgg 4920
gggcagcaaa tgagctctcg gtgctttgtg taatgttgtt ggtaggatca atgacaacag 4980
tgaaacgggc tctacggtcc ctgatgccat tttcagcaca ctctatcaac tcctgttgtt 5040
cttttgcttt tactagttta agaatgatga agataaaagc aaatcgcaga caaatatgta 5100
aaaagaatga tgattcgcaa gaaagaatcg cctagataca tgttccctag gaatcaaatg 5160
tatcgtacgt ttatctgatg cccaattttc gtcatcctct ttcgaatcca ccatgcgtct 5220
tgtgttaact ggtactttgt ctctcagaca actgaagttt tctcataact tcgccggaac 5280
atctcgtcaa cgtggacaag gtagtaggta ccgggagcca gggtgtcgac gcttcccaca 5340
ggggtatagt tcttctgctg gtaggctttc tcccggaggt cgcacatcta tttattcatg 5400
ttagaaacaa actacctaga cagtatgccc ccgaagcaga caacaagaaa atagcatacc 5460
tcgttgtaga actccggcga gaccggcgtg cgactttcca agcgctcatt caatcgcacc 5520
tgccccgcga tccgcgaagt atcacccttg acacggaaac taaatagagt gctagccaga 5580
ccactgccat agctgaacat gccaatgcgc ttgttctgca gttgctcact agggacattg 5640
ctcagcaagc tcaccagtcc agagtagaca ctagcagtgt acatattccc gcaatttgta 5700
ggtgctgtaa tagatggctg cacacgctta gagaacttct ccttgctcaa cccgatgcaa 5760
gtcttctcaa tttctttgtc tgtcagagac gcagtctgct caatatcgcg gaccgctgcc 5820
ggaacgtcat caaaatggct aggctccgtc cggagatcgt tgaataatag acgaccgtag 5880
gccttagaga cgagcttgca gttaggcgca tggaagacaa agtactcaaa ggtatccaag 5940
aaactgccct gggcttttgc agctccgttc gttaacccgc cacttttcgg cagagattta 6000
gtacgatatt tctggtagca gttgtccaat gcctcgagat aacacgtatt agagtactgt 6060
ccatcgacaa gggggtactc cgatttgaag ttccccttat agaagtcgta gacgtgcttc 6120
atatacgttc cccggaaggg ctctaggact aggggcgcat tagggctaat cagcatagcc 6180
acacagccgg cgccgccggt cgggcgggcg gcgggcttgt cgtacagagc gatgtcgccc 6240
gcgacgacaa tagcgtcgcg accgtcccag gcggacgatt ccacccagtt aatcgcattc 6300
aacaaggcat tagttccacc atagcaagcg ttgtatgtgt cgactccctc gatgtcggtg 6360
ttctctccga aaagttgcat gagtaccgac ttgcaagact tggatttgtc gagcagcgtt 6420
tccgttccca cttccaagcg gccaattgtg tttgggtcaa tctggtactt tgccagcagg 6480
gacgagaccg ccgtgagcgc catggaatag aggtctatga atatggccac atcacattag 6540
cgaagagcac ggagcctgga ctttaacctt tctatacctt cgcgatcatc acagaaactc 6600
atcttctgtt gacccaggcc aattgtgaat ttcccagtgc tggcacctag atatgtctca 6660
agctcgcttt gcggcacata ctacacacgc ggcattcagt tagttacttc ataggttcaa 6720
ttgcaattgc aatgtaaatg ctaaatcata ctcactcgac tggggaaata aatttcgaga 6780
gccttgatgc ccacattttg ggctttggag gtcataattc tcacagctag cgccgactga 6840
tgggtctatg aagaaaatga gagaaagaac ttggaatagt agaaagagat caagaaaaga 6900
cctggagagt agaaaagtac caaaggttca ccgcactaat ttatttggcg attgagctag 6960
tcgaaatgag ggcgtatgta ctgccgtcgg aagcatcgcg atggggccaa ataggctaca 7020
actgtgacgg ctcctacggt gtacattcga gcatcaagtc taggaaatgg aaccaagata 7080
gcggtatttt agtaattcaa ttcaagtacg gagtatttca attcgaatgt ttcaaacgtc 7140
ggtgattttc ctttttcgaa atcggtgcga gtcgcttgag gaatgatcag caacaaagga 7200
taaatgtgtc cgctgcggat actcttgaat tccactacaa tacccaaatc atggactatc 7260
tagcgatctg gcagcatttt cagtcatcca gtcagcgggg tttgggtaag ctctggcatt 7320
cagcatggac acctggggcg gtattggctg ggtcaactac tctggtattg tgcaattata 7380
tcccattcca ttgccatttg atagctgagt gtgatttcat gtcaatctta ggtcctgatt 7440
tacatcactg tgactgtaat ttacaatctt tatctccatc ctctctcggg gtttccgggt 7500
cccttctggg cccgatcatc cttggtgtgt gcagtcccta atcaattaca agatccagta 7560
ttgatgaaga atcacagtta tggagaattt accattctat gggtggtcga tttcaccgcg 7620
ccatcgaccg acaacacaaa aaatacggtc tggtccatcg atttgcaccg ggccagagtt 7680
gtactaacca ccaccgcagg acacgtcgtt cggatctcac ccaacgagct ctcatttgca 7740
tcggttgaat cctggaaagc catctacggc caccaggtct caggaaagcc agtacccatt 7800
aaaagccagt tctacgagat ctacggggct ggcttcactt cactctgtat cgggagtgag 7860
cgtgacccca agaagcatgg tcgtatgcgc aagctgcttt cagccgcatt tgctacgaag 7920
tcactagtcg agcaagaggt cattgtcgcg caagcgatcg atttatttat tgatcagctc 7980
ggtcgaaaag gcggccctga aaccagtggg ctggatttga cgaaatggta tgagatggct 8040
gcctttgaca ttctcgggga gatggcgttt ggagaaagtt tcaactgcat taaatctggt 8100
gcgtatattt ctgtttactg cgcttccaaa ttgtcttcct aattctttaa aggcgagccg 8160
cacttctggt ctgagctggt gctcgatcat ctatatttca ttacgcttat cgacaattta 8220
cgtcggattc ctttgcttgt aaggatcacc agattgctgt tcccttcaaa tctcgcagtc 8280
cgtaatcgga actcggaata cagcagaggc caggtagcaa agtgtgtttt ttgctacatt 8340
tagtacttca gattgtatag cataaactga cgttgactag acgactgtcc aagccaacgg 8400
ctaggaaaga ctttcttaca accatggtga agcactttga agatggaaac cttgaaaagg 8460
aggaactgac tgcacacgtc tccactcttg tgtacgctct tctttccaat cccacacagc 8520
ctgtcaatgt atgaacaaga caaactgatt caactatgac tacctttaga attgcagggg 8580
gtgaaacgat tgctaccttc ctcggcgctg tgacatatca tttgctacag tcgcaagtct 8640
gtcacgaaaa gctgaaaaac gagattcgag ggcatttcgc caagtccgaa gatatcaatg 8700
cgacggaagc acggaagctt ccatatttgc aagctgtcat tgacgaaggc cttcgcatat 8760
accctcctgg ctcgcagggc ttccctcgtg tatcaaccgg aatgttgata ggaagtacct 8820
gggtgcctcc cggtgtatgc acccctatcc cacacttggc agtgagtcat gaactaacaa 8880
catatcgaaa caggctgaaa tatatactag tgcttggaca gtcacacaca gtgaagaata 8940
cttctcggag ccaatgaagt tcaagcctga tagatggctt gaccagggct cgaccgacgt 9000
gaaagaagcc agccagccat tttcgcttgg tccccggggg tgcctgggcc aaaagtccgt 9060
ttccacatta atcttttgga tgaaatagtg gctaatctga tgatctagtt tcgcaatgat 9120
ggagatcaat ctgatcctag ccaagatgtt ctggcgatac gatctggaac tcctagaccc 9180
gaacttagac tgggaagggc agagccatat gcatgttatg tggtggaagc cagagctccc 9240
ggttcgattt tttgaaaggc aagcgtagag tggtgtcgct tgatgacttc caccggttcc 9300
cgacacaaac tgtgtccacc ggtggtaagc ctggaccgtg aatacacatg tcaactcgag 9360
acaagtccat ggaacgaggt acacagtcca agatgataac gcacaacttg atatctcaac 9420
caccagttct ttgtatctaa ttgtgggcca atagtcgtag ataactcttc tcagtaccga 9480
gtatttcgta ctccatatca attccactga gaagtggcat cactatggga tcggcatgga 9540
cattgctacg agatggatat ctatgtatcc aactcaacga tacaatcaat ccacttcttc 9600
tccaccccct tccgaggtgg gacaatacct agtaaaaata acgctagaag gcaacagacc 9660
atcgttgttg cgttgctttg gtatcaagct gttttttatc acatttaccg attaccacgg 9720
ttctcgccca tgtgcacctg tggacaggtt ggattctgtt aagcttttcc ggaaggaatc 9780
cgcaccgtga attcaggaac gccaatagtc ttgcgcgcta aatatttagc tcaataccat 9840
agcgttaccg tcttcgggta cttcggggag tccgcatcgg tcaatcaccc gcctttctcc 9900
actcacccgg cttttacctc ttggggatgt ggacaggtcc aatttgctag gttagtttgt 9960
ttgcgtgaat gcgtaaaggt tttgttttgt tttatctttt tttttttttt cagttgattg 10020
cccttcaaat tagtatttgt cttgccccct cgagggcaaa ccaaaaaacc tgtctgtcca 10080
gcgcaccacc agactaaccc aaggcacgat taatccgagg tacgaactgc gttggaccac 10140
attcgaggtt gagacaaagg aagagctcgt gctttctatt atttgcgctg cttgcagacc 10200
tttctatgag aatgaacgac gcaaagatcg tcaccaaaga gcaaatagag cccgttgacc 10260
agaatgcgaa caccaacggc ctttattcgc aatggaggaa gaaggttttg ggcccatggg 10320
cctcggtttg tgtcgtcgta gcgcttgtca tagccatgct tttggtgtgt tgaagaagaa 10380
taggctacta tcacttattt actcgaccat gactaactgt ctttggatca tctaggtcgc 10440
attggatatg gtatgaatat ctgaaatccc cttaatttga ataaagtgag ccgtattaat 10500
gtttttctag aatattgttg cgacggcgat tcccaaaata acagatgaat ttcacagctt 10560
ggatcaggtt ggatggtatg gatctgcctt tttcgttgga ctggtggcgt tccaagccgt 10620
ctggggtaaa atctaccggt tttttcctct aaaggctacg tttatggttg cgatcgtgct 10680
ttttgaggca ggtagcttga tatgcggtat gattcttatc ctccgccacg acttgtttgg 10740
ccgttttcta atattcttac gcccgacagc ggtctcccag aacagcatca ccttaatcgc 10800
tggacgcgca attactgggg caggaggatc tggagtaaca agcgggtgtt acatcattat 10860
tgccaatatt gctgccccag agaaacgtgc tgcatatacg ggcattttag gcgcgacgta 10920
cgggatcgcg agcattatgg gccctttagt aggaggtgca ttcactgatc aattgacgtg 10980
gcgttggtgg tatgtgaatc aaagcctgac gctgcatgga aactctcact cactatagaa 11040
ctgctacgat ttctagtttc tggatcaatc tccccatcgg atttgccgcg gtagtccttt 11100
tgcttttgac tttctcaacc ccggcctctg caaaacccat caagtccaca tggatcgaga 11160
tactacgcca tgtggatttg ctaagtgtgg ttattattat cgcctcattt gtgtgttacc 11220
tccttgccat gcaatggggt ggcgtatcaa agtcctggga ctctgctgat gtgattggga 11280
ccattgttgg ttggatcgtc ctcctagtag tgtttgcggc gctgcaatgg tctcagggcg 11340
agtacgcatt aatcgtcccg cgactcgttc aaaataaagt cattgcagtc tgtgcggcct 11400
tcaatgctct gtaagtattt ttttacctct cagctccagg atacgagaag tatgcccttt 11460
ctaactatgt atttagtctt gctggagcat atttcatcat tgtgtactac atgccgatat 11520
atttccaaac aattgggtca tcttctgctc tccggagtgg aatacagact ctacctctga 11580
tcctgtctgc atgtaagcaa actattgggc ttggatccca actgacaact aactgatgaa 11640
tctgtctagc cgttttctca ttgaccggag gagttgtcct ggctgcattt ggtaatttcc 11700
agtaccactt gatcatcggc tctaccctat tgacaattgg gtgtggcctg ctctacacgc 11760
tacagataac attgtccact ggagcatacg ttgggtatca gctccttgct ggagtcggag 11820
tcggcatcgc catgcaagtt cctgtcgtcg ctgctcaagg gcttgtggaa atgaaggaca 11880
tatcttctgt gacatccatt ttactctgta ggtttcctgc atctatgcat acattaggat 11940
tctccaagct aatcatcata atccagtttt ccaaaccatg ggcggagcgt acttcatttc 12000
cgccggcgaa agtgcgttca ccaaccaaat gattagtacc atctcaaaaa ttgccccaga 12060
tctgaattcc gctaaggtgg tcagtgttgg cgcgactgaa atccacaaaa tatactcagg 12120
gccagcactg actgccgttc tcgaggctta tatgagcggg tttcggactg cgtggattat 12180
ttgcatcgcg gcagcaggtc tcgcctttgt catcagtctg ttaccacttt tcgttagggt 12240
aaacggaaag gtacagtccg atcaggagga tcatagtcag tcacatctga cgcaaatttc 12300
cgtctagtta aatcgtcatg gaaagctcgc cagtggatga gaaacaaaat tgttcaaaat 12360
gatacctgaa ggcatatttg cttgaacagt cagctttctg atgtttattc ccaaggtgcg 12420
ttagatttgg agtggcgaag atgggaaaag gaatttgtgc aatttagctg gccactgagg 12480
agacagacgc aatgtcagtg aggttaggcg caaaagctct atctatctta ggcagtgagc 12540
ctgcctcagc acaaatagat attacctttc ttaactgttc tcaaagaaac agccgcgaaa 12600
ccctagaagg atagaaaaag aaagaaaaag aaagaaaaag aaaaagacat agaatagaat 12660
aggagtcata gacaatattc cagatttgta aagaaaagag aaattatatc catgacaaga 12720
ggcagggtct gagtctgcaa aaaagtcata gtttttagat ccacccagcg gggacgttga 12780
aaatgcaaag agtaagagcg agagaattag aacatccttt cccacagata tcccgggact 12840
cagcagagcg agagtaagca aatgaatgat gtagaccata acattcagga atcatgtaca 12900
gataacagag gtctgttgtg ctatctcctc caaaagctct atgtctgttc ctcaagtgct 12960
agtcaacttc cagatctctt catctattct tactccgctc tgacttcgtt gtgtgagcgc 13020
gggatcgagg gttcaataca tcaatatcga tagaatgtag aatggtgtct attgcgccag 13080
agttggtata aaagcttttc gataccctga acgaagtcat atatgagagt aagataaaca 13140
catctgatca tggtttcaat gtccacacag catcttcgta tccttggcgt ggctgcagct 13200
tgacctggac atcatgatcg ggggagtcca ttgcggcagc aatggtatgt ccatgggcac 13260
cgggaaagtc ccatgccccc ttcgtaggtg agatatcgaa tgcagccacc aaaaatccca 13320
aagccgaaag caactggcta gtagcctgat gccgccctgc gcatagtgaa acaccaccgc 13380
caaaaggtcg gaacccgttt ttgggcacgc ggtaatctgg atgacctttg atgaatcgct 13440
tattgttgaa ctggcacaca gttgggcccc aaagatcttc ggcagagtgg atgatattgt 13500
tcggtagttc catcacactg tctttcttca ccaggtactg atcgttcaag acaatgtcct 13560
cggtcacgat gcgactggag atgccacaag tgcgcatgcg gagtgtttcc tgcatcgtcg 13620
cgtacagcag gggacagtct tgcttgatat cggccgatcg gagagttagc tttggtcgac 13680
cgtcgggctg ggtttcgcgg ataatgatct tgtccagttc accgcgcagc tcatcgagga 13740
gacctggcgt cgaccagatg taataagtca tccagaagcc cgcaggaacg gtattagtca 13800
agacaccgat gatcatcgtg acctccaatc ggccgatgtc atcaattgga atccccttgg 13860
caattgcaac ttcgtatcgt tgcttggcca tttctgaccc ctcgttgtga cccccttgcc 13920
ggaaataatc gatgaaaccg ttccatgcat ccgaacgccc cttgtcgccc tgtggagttg 13980
tccagctggc tttgggggtg ataagtaggt tgctgaccgc gtagtcgaac tccctatatg 14040
gatttcagtc agcgtggact tggtcttggt aagtaatgag agcatgccta ccaaaagccg 14100
ttttcaacct tcggatcctt gaacggattt ttgggtccgt aaattgcatt ggtagaagac 14160
atgctgaaat tgtggcggaa ccattcaaga agatgaatgg tcgtctcttt gtgctgaagc 14220
cccccaatag aatcattgag atcggtgatt accgcatcag tgaccttttc taggagtggt 14280
ccaggtgcca gagtgtgatg aatctgcttg agcactgcgt tcatgtatcc attggcggaa 14340
ttgggtccgg taacatcttc tctgagggca gacgccgccc gtcccttcga gccggacagc 14400
cgttcgataa ccatggccgc aattggacca aatgcgatgg ctttggggtt tcggtcaacg 14460
ctcgtgagta gctctggggt gttgaccaca tatacgcgac cccctggaac gggcaaacta 14520
tagataggta gcttgtactt tttgctgctg atatgttagc tgggcatgac ctttgtcgca 14580
tgaattctga ggttgtatta gagaacttac ccaatctcaa caaaatatct tgaacctttg 14640
ttgtaaatat taatagcatg gcctaaaagg gggagacgtg cagggacgta gaaaggctct 14700
tttgggtcac ccgaaggcca gagaacgaaa cgagccaaag caaaagcgac cactgcgata 14760
gcgatccatg tcttgagcga cagcaatgtt atatttagcc cgatggtctc catggttcaa 14820
ccgtccgctt ggattcgaga tcagccagct agataatggc tgaatgtgaa aaccaagtca 14880
aagaagacaa aggtcttgct acatcgtcgc aaatatatag tggccatttt aaggcggcct 14940
tgctgcttgg cttaactctt ctcgagtgtg tgatgtctgc catctaccca cgctagcggc 15000
ggtcggaggt ccatactccc gcaattgcca cgttctctta ggctccgaaa atgatacctt 15060
gacgtggttc ctgaaaagga aattgcccga acaatagagt caatctttcg ggtatatcaa 15120
tgcgaaaagg gggccaataa ctatgctcaa tttggggtga cagcaactgt cccagtcagg 15180
tccaaaggcc agcatctcga atagaacctg atttgcataa tttatctaac gttctcttgc 15240
tcgtggaata atttatcttc ggtccttcgt atagctccct acggtgaatc gcgattgccg 15300
ccgaagccta ctcagtagtg acattggtca tggcatgagc gtcgaatgtt aaaccaaggt 15360
cctcagattg gcgataatga cctttgttgt agaaattgta ttcactggta gagatggagg 15420
ccttccgtct ccttttctac tccatctttc tctcttctca agtcgatcaa gtttctactt 15480
tgcctgactt tccagagtag actcaagagc ttttctcaaa atttgaatac atgattctac 15540
tttagaagac agttggaaca acaaatctac tagaaagact ggaagaagca cataggatag 15600
ggggtcaact tactcaaact tctatatgtc tagtttctct cttttctcct cgctggaatt 15660
gaagcaataa taaattcaag gacacttcaa aattctcagt cgcagcatat ccaagtttta 15720
actcttctag ctctaatcct gtcatttcct tgtctaccct tcagctagca gatcgcgttg 15780
aaccataaaa tgttggtact agataaaaat tcaaatcaaa caggaaccac aaaacaaagt 15840
ccctccacgg atgtcaatat ctgcatcttc agctaatcca ctttggtgta tcggagcgtc 15900
gtgtgactcc acagctcatt gccactcatt tgatattcca gtcctttcat atatgctttt 15960
gtagcctcgc tgcagccagc ggagagcaac tgtgcacaca tgtcatcatg gacaagctcc 16020
cactcacgga caattggcca aagaatgcgc ttcgaggcat caaaactgag attggtctca 16080
gtcgctacca ccataaccgc agaacagaga aaagagccct cctggtgacc catctttgat 16140
gccttgagct ccttctccca gctgaaaata tcgttcacga cggagatatg cttggcgcag 16200
ttctgctcta agggtgatag catttgcagt tcatcagtgg tcaggttgat acccatgaca 16260
aaacgcatca aggcagaaag aagcctgaga atcaaggttg tatcagtaag ttgactccgt 16320
aaagacatgc ttgacagttc aaatacaaaa tatgggaaga gaaacatacg cttttccaac 16380
gtccttctct cgatattcca gatattgacc cagctcgttg attttgagac gggtgttgtc 16440
tgtctgggct cgcatgaacg tgaatgtggg ctcgagaatc tcatccgcca gcttcttgtc 16500
atgtgctcgc atttgttccc aaagatcata cataatgtat tcaactggaa tgttgcctga 16560
tttgaaaaga gggtattaat ttcatcgttc catggtgaaa ttggtcatcg ctacttacgg 16620
tcaggcagaa catcgccgcg acaaatgggc attaaatttt cattgtatgc cttgccatcc 16680
gcgaaagaca tttcctccaa caaatctaaa cataccatgt caacaagttt cgcttgggta 16740
gaatgcattc tatagaggga taccctctag taggactagg ctcaccgtcg ataaggaaga 16800
gcactgttag cagaagacat gcgaacttga tacgatcgtc actggccaaa gggaagtaaa 16860
ggcatgtcac tctcgaaaaa ccagcttcga tgaacttctt tcttgctcgc tcgtcgggaa 16920
aaggccagtg gtgcaagaag tactcatcca cctcacgaga aacagtgttc attcgcggtt 16980
ggcactcgga tacccagtgg gagggagccg gttgccatgg ccttgccttc acggtggacc 17040
tattggacag ttgaagaaaa ggtgttgggc atgaagatga ctcttgagtt gttggcaaat 17100
tgagtgccac atgggagtct tggacggtaa gcgaaagcat attggcggtg gggtctctag 17160
taagatagtt tcaaatttca ggtgtacttc gcttttcata tatgtagatc accttcccat 17220
cttcctgggt gaaatacccc gaaactaaat cataccccga aactatatca taccccttcc 17280
tagaaagtgt ccatcatcta accgagatgg tattcaatcc gaaggatgcc ggagctgcgg 17340
gtaatccagg ctatgtcaat agtgtgaagc tatagacaaa aagggcaact ctccgaggta 17400
taaggcatgc taaaagctcc tactacagta tgcatagata ccaattgagg tatatcgcag 17460
cacctttttg tagtaattga gcaatatttc caccttgtgt ctttctaaga tccactgcca 17520
tgtggagtga acagtcgcaa tagagatccc cttataggga cagagagtat tctacagtac 17580
cctagttacg aatgaaatga attggcttcg tggcaggtgg aaagagttcg gcgatcaaac 17640
gtggacttct tccgaaaagt ctgcgttgtc ctctccaaag gcccattaag gcagcaagga 17700
gacgtaggga tctctccgaa agctggatac cacatgaaca aagggccaat ttactaagaa 17760
tgtagatccg atgcgacaaa tttatcaaat atgaagaaga aagaaaaagg agaaaaggaa 17820
gaggaaatct cccacgaagg aaatccagca tccagctatc tgaccccagt cagacaggaa 17880
cagctctttc atccttttgg ggcattgccc atgtttgaca gaccgctctc tcggtattgc 17940
ttcataggaa gaacataatg tatcgatact ctgatctctg cttctgtgat cttaacagat 18000
ttatacaata atacatctgt gggacagatt ttttatttat cttcatagat atatttaact 18060
ttcaacctac gagtattgga gggaaggtag agatgaaagt tagagaactt caccatcata 18120
cctgggataa gccatcgcag tatctctaca aaggtcttgt caccagaact tcttatacaa 18180
ctgagacaaa atgctcagga cagacctagg agaatcctat atggattgga aaagattcca 18240
gtaagttcta aacggaattc aagtaccaga attacaactt ccacagacgt taacgcatat 18300
ccgtaagccg ttgctgaaac gttgtcatat ccgtattcca tttcccaaac cactgctgcc 18360
gcaggtcggc aattggctct tcaagctccg tccatttgtc acccagagta agaattaccc 18420
ggccattcca gcgaccctga cattgaatga cctctgtcgt gtccttgcca tatccttcga 18480
cctggtgcgg ctgcgaagct accgccgaaa aggctatcgc caacccaaca tgatgagcac 18540
tactgacagg tgctcccgca gcgattatag gtttggcaag gtctttcggg agaagttttg 18600
tgatagtagc tgcaggtgcc accgcgttga ttgttgctcc gagagccggc acggtagaac 18660
gaagagctcg tacaaggcca atcagcttga gatatcctag tcagccagca aaattcaact 18720
ttcccggacc ttcgtttagt ccaaggccac tcgacttact cccagtttgg ttgagctata 18780
tacagggaga ctttgctctg gcgaataggc cgtcgcactg ctggtgatga ccagactccc 18840
tccagggccc tgttgccgaa aggcacgtag tcccagcttg atgaaattca atacagctcg 18900
gtagttgaca tcgataattc tgtatttagg ctcttctagt tcaccgtgct cgtcgtaagt 18960
gtcaacgaag tagtcgcatt cctgggatac gcccgcattg gcgacggcga tgtcgacgtg 19020
tccgatttcc tggaaagctt ggcgcagact aggccaatcg gcgacattgc aatgtcggta 19080
gtggatctta tctcggaatt gagattcttt gttggaagaa gcctcatctt cctcaatcga 19140
attgagatcc aatgtatgca cagtcgcccc cttgctggcg agtatctgtg cggctaccaa 19200
accgatcccg gagcagccgc ctttgcgaaa tcactgagaa ttagattttt ttggctttcg 19260
aaattattta gacagtgcta taggggtgat taccagtgat gatagccacc tttccagtca 19320
gatcggggat gtcgtcctca gtgattttaa gagatgccat ggtgaataca agactgtgtt 19380
tcttgatatt ttaggctcac ttctactgat gtttattata taaactggcc tcagaacact 19440
atcttgtatg tatttgatac cgtttgtgac tccggccgag cccggtgctt tacccaaaag 19500
ggtaactaac ataacgggta tccacaggcg ccagggtttc aaacgaccac gatgaccagt 19560
gtaaagtccg aagaacatgt agtaactttg ccggcccttc ttctttttga atcatttccg 19620
aggggaaact cggaaccgca actctggctt cttccataat aggtgcatgc ggagatcctg 19680
ttgcaggtct atattttcgt tgacgggtgt aaaatcgtaa ctaaaatgca acttggcaag 19740
ggtcactcgc atttccaacc aagcaaggct agcctccgaa tcagaactgt ttcaagaagg 19800
tggttccttg ttttttgtct tgggggttct taccttcttc ccagacatga tcgcgatcct 19860
agcgagaaag gctggctagc ctcgccaaat tgctcttttc catcctgcag ccatcgatcg 19920
ggatcaaatg tccaaggatt ctcaaaattc ttcggatcaa ggcttgccgc aaggggattt 19980
gtggacacga tcacctactg tgtgattagt aatacattgc gtaaaaagga ggctgaaagg 20040
ggatttactc ttcgggaaca aaatgtccgt ccaccatggc tcctcctttg gggacaaccc 20100
tgggaaggcc tagtggaaga ggcggtacca tcctcattgc ctctaggcag ataacatgca 20160
ggtaccggag tctcgcagtg gatgagccgt tgatctcttc gtagctgtcg aaggcacttc 20220
gcacctcctt ctggagcttc ctggtaatct ccgggtaacg ggaaagatag tatgcgacga 20280
ccagtagagt agtcgctgtt gtctcactcc ccgcaatgct gaaacccatt agcaactcac 20340
tcgtttaaat gcggagggta ttaaaactga cacaaaatcg gaggcatgcg ctgcgagttg 20400
cgtatcggat acctcttggt caaattcact cctttcgcgt agcaagtaac tcatgaaatc 20460
cgatcttggg cttttgctgg cgattctcct acaaaatata ttagctaaaa catctcggag 20520
acgatcccag cactgggcga aggcagactt agatcaaacc ttttgacaag atccatagtg 20580
ttagactcat gcttgataga gcccgcaatc aagcgacgtg cccattctgg gttcagtcgc 20640
atgtaaagtc tgcccatcca tggaaatctt tggatagtat cggaaagact agcctggccc 20700
atactctcta acacaactga gatccatgga tgtgtcttgc ctatatacaa cgactaagtt 20760
agcccgctac ccttagcata gctcacttta gtgctttgaa gttaattacc tgtatcgacg 20820
cccccaaaag actccccaaa tgccagatcg ccaataatat caaaagtgag aagattaaac 20880
cagtttgtca agtccactcc ctgcggatga gaaccaactt cccccacctt ttggacaaat 20940
ttatcaatgg tactggtgat tagtccctct tgctcgcgca gagatcggtc cgaaaatgca 21000
gtggataaaa accgacgcat cgcactgtgt ttctctgggt cccgttcact cactatggag 21060
tgtgctttat cagcaaaatt ccctccatca tagaaggaac ttttgatgaa tcctgcacgg 21120
cctcgctgag tcccgtagat gtccctccaa gactgagctg tgctgaatga tagctcggtg 21180
ggggaaacgc ggaccacaga acctgaatgg cgttagaggg taatcaatag ggttcggata 21240
aacgatcatg atagcacacc atattttttg tgcaggctga gcatttccca tggctgtcga 21300
ccactgaggt agctcatcga gtacggtacc tatgaccgaa attagcgctc atgctgttat 21360
catgttgtca agggctaagg ccgacgttgg tcagggctga cagtccggga cctgggaact 21420
ttgacaattg atcaaagtac actctccaaa tccccaactt gagaatgaag gcaacaagca 21480
actgaacgaa aagtaattgt tagatccctc aggcttcctc aatgttcaat catacgtact 21540
actggcattg caatgcctaa gaaagacccg aaaccctcca tgttgcccca agtaataact 21600
cggaatgcaa ggtattgaca gcaatgattc agctcactct cgttttgctt ttttattaat 21660
aattactcta catttaatcg ctatataagc atgaccagcg ttcaacagcc ccatatttat 21720
gagttccgac gagaatgttt tgggattctt ccgagggcct aaccttttta cagcgcaaga 21780
ccgacggaat cttgccagtc cggcggatgt acaccaacat cccttcctct gtgattgcat 21840
aaaatcactg attccgaaat aataaaagtc atttgttagt taatcctgac tttcaacaac 21900
catggctttt ggcccgtatg ttgcctacgg agcactagca ctagccgcct acaagattgc 21960
aaaacttttc ttttttgtat ttcaagcccg aaagacaggt ctgcctcatg ttctcactcc 22020
atttctggag acagaagtaa ttgcgtttct tctcacgcca attctgcgta ccgtgtacca 22080
tgcccatctc gataaagaaa ctggatggcc aagatggtgt cggttcattg tcaaagactg 22140
gtcctgggag gataaacgaa gagctcacga ggagtatggt gatgtgtttc tcgttgtttc 22200
ccccgagggc atcatctgtt atagcgccga tgcagccatg gggtgggatg tcatgaaccg 22260
aagaaaggat tttaccaagc cgcgagataa atacagttga gtgaatccat atttgttata 22320
atagctatct tgctaattgg cattcgatag aaattctcga gccgtatggc cccaatgttg 22380
ccaccgccga aggcggaaca taccgattcc acgtcagggt caccgcgtcg agtttcaatg 22440
accaaagcgg cgtaaatgac ctggtaatgt cggagaccat acatcagacg cagcagctgt 22500
gcaaactgtg ggtcaaggga gcagctcctg aactacaagc cggtgtgaac tctcttactc 22560
tggcggtcat ctccttggct ggatttgggc agcgattgga tgtgggtggc aagagcaaaa 22620
aagggataaa ggttcctcag gaagccaaga tgagctttct ccacgccatt agtgatacca 22680
caaaatacat ggtttccatt ctgcttctac ctggctggct gctgaagttg accccgttac 22740
gcaaggccca ctttgcacat caagcattgg actattactt gcggcaattg attcgagaca 22800
agaggaaaca gctggtgcaa gatataaatc atcaggatgg gactagcaac cgcggaaacc 22860
tgctcactgc cgtcctgcga gcatctctaa ccgacggcga tttggccaaa gcgggagggg 22920
ctcgcaagga cgcgtttact gaagaggaga ctatggggaa tctgttcatt tatctcctgg 22980
caggtatgta tatgcgtaat gaggcgggat aatgacatct gaaacacagg aagtgacaat 23040
caataggcta cgagaccacc gcgaacgcta ttatgtatgg tcttttcttg ctcgccctac 23100
accctgaaat ccaggaaaag gtcatttgcg aagtggaccg agtctgggct gaagcaaatg 23160
catccggacg cgaatccctt tcatatcaac atgatttcga caaatttgtc tacacctacg 23220
ggtttatggt aagctctcca tggacccttc gccccggata aactaggttc tgacgtatct 23280
gattttcaac agtacgaatc tttccgtttg ttcccaggag tgacattgat cacgaagata 23340
gccaatgggg accagccagt tcatgtcagt aactcgtcgg gcgtgacaac aacacatatc 23400
ctgtcctcgg gcatacgtgt atacttgtct gcgcctggcg tccattacca cccccgatac 23460
tggcctgaac caaataagat caatcctcag cgctggatgc agaacttctc caacgagtcg 23520
agtggaaaac gagttgttgc agcggaccga tcccgtcaga tgaaagggac tctcttaacc 23580
ttttctgatg gtgcgcgggc atgtttagga cggaggtttg cccaagcgga atacattgca 23640
ttctttgcgg cgtttctgaa aggtcaccgt gtgaagatcc gtcctgatca cgatcggcaa 23700
actgtttgga gagacattta tctcaagagt gctgggcaga tcacattggc tccgttagat 23760
acaacaggcc ttgtaattga acgacgatga agaaaagttt attgcggtta atttgagtgg 23820
ttcgattgta tagcaaagac cgaacgcgta atttgaaaca ctacatactg cccaggtgtc 23880
agccatgtgt acatcgatct tcacaatata tccttttctg gtctatacat atttttgatg 23940
agaaatcgtc ggggaaatac tgttttcggg ttaggcccga tttaggcgca gcttctttcc 24000
agtcctatcg actctcacca ttccaaaaat agtgagttaa tatagatcca gaatcttaca 24060
actatctgtc gaggattacg gtccagcaat agctggctat ttcgtcacta tgcatcattt 24120
cagttctttg gatgagatta tgccagttat tgaactgcca ttcgtgctgt gtttccctca 24180
ctcggatgca tcaattccgc aaactgtttc agtccttcgg gagggactct ccaaggttta 24240
tgccaagtta ctatttctta ctggcaacct ccagcaagtc gaaaatgctg ggctcagacc 24300
tggaagtttc gccgtggaat caaacccatc cgagccgcct accctttcag ttcgagacat 24360
gacgagcggc tctagtacag attggagttg gacataccat gatctccgtg aacggggatt 24420
tcccatgagt ctgctgaacc gggacgttct cgccccgact gatccctgtt cagggcgtac 24480
aagactcttg gctgcacaag caaatttcat tccgggaggc tgcctgttat acgtctcaac 24540
ctcgcacgcc ttcgcggacg cctttggact ctctaccttg ctatgtgagt ggagtcggca 24600
atgccgtgat gctcttggca ccagtgacga aataccgaat gttagcaggc agaaggaaat 24660
ttccacggca ttggatcaag actcgccctg tcgcagtcta gtcgttcaac cctatagtcc 24720
cacgtcagcg gtctatgagc gtctcaaatc caaaccaatt ctgtggcatg ttttggggtt 24780
ggattggaga cccaaagaac gaagcagtcg gatattgatg tctcagatcc ctccgtcgcc 24840
tgtgaggtcg tgtatattct ctattaccgc aaattctgtc gagaagttga ggcaagtggc 24900
tctagggggg tcttctggtg ttccaaaatc ttcacagtct atttccacgg acgatgcact 24960
gggggccctg ctttggagct gccttatgag agctcgtttg acggaacgag aaagtttcga 25020
gaaccccaag gaagcgacaa tgatgcgagc ggtcaacgtg cgcaaactcc tgtctgttcc 25080
agaaacacat cttggcaaca cgattcttta tgccgtgaca aagctgtcca ttgatctgct 25140
cgccactagg ggcacagacc atttgaatgt tgttgctcag agtttgcggg aatctctcga 25200
cgagctgaga gactctagta tggttcaaga ggcggtagaa ttggcaaaca acatcccgga 25260
tgtccgcggc atgggactct catttcccac gtgggttgcg gagaacatgg tgtttagttc 25320
tctttctcga ttgccgctac tagactggga tttcggaagt atatctcacg ggggcttggg 25380
caagccggac agaatgcgat tccccgacaa gtgttttgaa ggtataacct ttactatgcc 25440
ccagcgacca gacggatcac tggaaatcat gatcaccatg aaagcagtgg atatggagat 25500
attgatgacc gatcaaacct tcactgagtt cttcagcttt gtatctgagt gaggatgact 25560
attccagtga ttagcactgg aggtatatag tttcttccag ggttcctttt atgcctgccc 25620
aaagccagcc ctggagtcaa tttgatgtac taaccaggca tcaactttgt caacaagccc 25680
tcgagcgcta cgtatatata tttatacccc cgtggacctt gatagttgag ccaattgaat 25740
cgcatcattc caaggttctt ctcacttaac aatgaaatat acatttccaa tgtttccttc 25800
agcctgatta ctcctaaatt attctttcaa gcgagctcgt ggtctcccga atggtggact 25860
gtactgaata ggcatagagg cgtcaaactc ccgacaccga ataacaccgt gacgccgatc 25920
tcgcagattc cttctgagtg tttaaaatat cagctgcacc attccatttt tgataggcac 25980
ggcaattatc tccgatcacc atactcagcg aaagatggcg cccagcatag atgttattcc 26040
cactgctgct tccacggcag caggaatgat ttcagacatg gaagcggcat ttaagtcggc 26100
cgttaaatta aagcaaatcc ccggggccgt tgtcatggcc aggagcatga acggtacgtg 26160
atgttttctg gactatcttg cacatctctt ggcagaacaa cacattgacg acttgtattc 26220
ttaataggtg acattgatta cacgcggtgc tttggggcga gaacggttga gcgcgatgaa 26280
tgccaaagac taccaccaat ggaaatcgac acacccttgc gacttgccag tgcaacaaaa 26340
cttctcacca caataatggc cttgcagtgt atggaacaag gtctggtgga cctcgatgag 26400
aatgtcaaca ggcttcttcc cgatttgagc gacatgcaag tcttgactgg ctttgacgcg 26460
gccggtaacg ccataatgag ggatcgcgaa gggattatca agttgaggtt cgtatcatga 26520
tgaagcgatg ttgcgccatg tctattgatt ccttgttaac gtgtacattg ccatggctct 26580
taaaggcacc tcttgactca cacttcgggt ctctcttacg cattcctaca tcctctccta 26640
caggaataca tggccaaggg ttacctcaag acagccgaga aattcggcat tcaaagtcga 26700
ctcgctcctc ctgcaatcaa cgaccccgga gtagagtgga tctatggtgc aaatctcgac 26760
tgggccggta agcttatcga gcgcgccacc ggtgtggacc tggaggaatt catgcagaag 26820
aatatttgcg agcctctagg tatcaccgat atgacattca agctgcagca gcggcctgac 26880
atgcttgctc gtcgttctga tcagacgcgc cgtaatgaga atgggagtct gcgatacgac 26940
gactcggttt atttccgcca tgacggggag gagtgcttcg ggggacaggg cgttttctgc 27000
ggcccggagt catatatgaa ggtccttaac tccttgatga agcatgacgg tctcctcttg 27060
aagaaagaca caattgagct tatgttccag cccgctctgg acgcggagct cgaaaagaaa 27120
atgaatgatc acatggatac cacgccgcac atcaactacg gcgcagcatt gcccccggtt 27180
atgaggagaa actttgggct tggtggaatt atcgctatgg gcgatctcga tggtcataat 27240
tggcggcggg aggggtccct cacctttggt ggcggaccga atattgtttg ggtgcgtatt 27300
ttgattgatt taactgcaat ctttggcagg ttcacagaca tatattaacg catatatagc 27360
aaatcgatcc gacggtaggg ctttgtaccc tggttgtttt ccagctagag ccctggaatg 27420
atccgatttg caaagatctc actcgcaagt tcgaaaaagc gatgtactca caggtgaaat 27480
gccgcaacta gttagagact aggtacatga gacccatgta aatgatttac aagtattcaa 27540
gtccaatttt tataattagt ctactacttt gcgcatagca aattcaacgc cacagcgctg 27600
gagaatacca tgacgcctac ctaggtagtc actgtgttga gctggcccga taaatctcat 27660
cagaaatggt gcattatgtc tgtgcggtat ttgaatgttt gtggaacagg atcattgatc 27720
tctcgctctc gctctcgatg gatcaatata gctgccagta ttgataaaca actaaccctc 27780
tagcccagat agagaaaaga aaaaaaaaaa aaaaaaaaag aagagagata gtggatggac 27840
aaaccagggt caagtaatca tgtacaatcg cctaaccggg tatcaacgct ctcaacacac 27900
acatgtcatg gtcactgggc attcatttat tctatatttg attgcaagta ttaaacttaa 27960
acggaaaacc gaaccacaat cttctctccc gacagctctc cattcctaac agtctccata 28020
ccctgcttga cctgctccag cccaccatca atgacacgca aggggtgatg atacagcttg 28080
tcctcctcga caagccttga ggcgacttgc cagagttcgg tgccgaaaag acgcacctct 28140
tcgctcgcct cacagccgta cggtgcaggc caagttgagc cctcgccgaa gatagtcgga 28200
ccgagggtcc agtccgaagt gaccatcttg cgtgtggccg cgtgctcggg gaaggggttc 28260
agcgcgacgt atcgtccgcc ggcacgacct attgctttgt agcacgtcga tgtggactca 28320
acgttaatga tgcagtccaa ggcataagcg agattgtttc tggtgtaatc acgctacgaa 28380
tatataggat taattgggag tgcaatcaag caatgttatt gatgtgaagg gggtttatgt 28440
ttgtgcaggg gttaaaacaa accaaggaaa agactcacaa ttttttgtgc acaatctgcg 28500
tcgcggtagt cgaatacctc ttctgcgcca ttcttcttgg caagatcgaa gttcttatga 28560
gaacaggtag cgatcggtgt gtatccagac ctatgaattc aaggtcagac ctgacactga 28620
atcaaacgaa taatttttgc aaaatcgaaa acccatacaa tctcataaac tgcattgcaa 28680
tggtggccgt agcagtgctg ccaccataaa tcaggacgta agtctttttg ctaggcttag 28740
tctcgctgta cggcaatggc ataccgagca gcttcatagc caagccagtg gtactaatac 28800
cggcaggaag cgacgccgcg gcttcccagg tcatcgaatc tgggattttg gcccagatgc 28860
gaccgcgggt gattgtgtac tgcgaaaagg cgccctgttc aggcgtccgc ggacacatct 28920
cgttctgagc cccaaaaaca cggtctccca ccttgacatg ggtgatttcg gatcccacag 28980
caacaacagt gccggcatag tcagtaccta gacaggcaaa tggcgtggca aagtcgcctc 29040
gcatcttagt gtcactggga ttgacagcga cggcatggat gcggacgtag acctggtccg 29100
cgggcagctt cggagtcggg gcgtcatccc agatcaccac ctcgtctttg tcgtttactg 29160
tgaggattgt ctgtttcacc ggtgggatga aactcccttc agtcatggca acgcccattg 29220
tgtgtgtggt gttaggttcg attgatgtga atcagcttga tgcgtcaagg ctgcctgtga 29280
ttgaataaat acaaagaatg ctttttaata tctttatcct aatatgcaag atacctatag 29340
gtcttttgct tacgacttgc tgcccccaac atttcgggcg gctcttcgtg cggcgccatc 29400
gggatacggc gttgttcggc gttagcaaaa tgccgatagt ttcaaaagtc ttcatgcact 29460
cccacggagg caagttggct ttgtcgactg atttcggtta ccaagcacag gaatcacagc 29520
agaacagtca tctcagatta ggcgtattgg tgtggttcat cccctttggt tgccaggtag 29580
gatcaatact acgtcgttgt tatttccttg tcagtaatga ctaacaaatt ccccagaaca 29640
gacgaagtca cagctcacac cacaagagaa aatgagtcca gcgaggatta cagatttctc 29700
gccaggcaaa ccgagaaaag ctctcttatg catccacggt gccgggtgct cagcagccat 29760
attccgcgtc cagatctcta aactgcgcgt ggcgttgaaa aacgagtttg aattcgtata 29820
tgcgaccgcg ccgtttagct ccagccccgg acccggcgtg cttcctgtct tccaaggcat 29880
gggtccatac tacacctggt tccaaaagca tcatgacgcc gttacaaaca cgacaacccc 29940
cacggtgggc gatagagtag cggctgtgat cgggcctgtg caaaagaccg tccaagattg 30000
gtctataact aacccacagg cacccattgt cggcatagtg gccttctctg agggcgcatt 30060
ggtcgccact ttgctgctcc atcaacagca aatgggaaaa ctgccatggt ttccgaaaat 30120
gagcattgct gttttgattt gctgtttcta tagcgatgaa gccagagatt acatgagagc 30180
cgaggcgcaa gacgacgacg acaagctaat aatcaacgtg ccgacactgc atcttcacgg 30240
tcgtcaagat tttgctctcc aagggtcgag acagatggtt gaaacacatt acctgcctca 30300
gaatgcagat gtactcgagt ttcagggaaa gcataatttt cccaacagac cgagtgatgt 30360
ccaggagacg gtcaagcgct tccaacagct atatcaaaag gtcaagatgt caggttcatt 30420
tgtctaggtg agacaacagg gtatatagca aggctctggc tctcatgcct agtccatacc 30480
acatttttac tgaacaaatt tgaatagttc taatcttaca cggtttgaat gctcaccttc 30540
caagggtgat ttagttatag tggtcgcgac catctcataa atatttcgtg aacatatttt 30600
ggatagatca tggaaggctc gttctgaaca ggcatgacag acatctaaaa ccactcgatc 30660
accacaacaa ggcactaaac cagtaactat ggaactattt gcaatggcgt cgaatttata 30720
tacaggatgg attgaaatca attccaagcc ttggaggttt caccttcctc acagagtctt 30780
tcgaaacgcg ctaccgaggt atatttatca ccgttacggt actctgaacc gcgctatcta 30840
acttgatgtt acgattgctg caataaagaa gagcaacgaa ggtagaagta attttgacaa 30900
agatacaaga cgaattcgct atttgtagat gaatatgcgt gtgtcaattg agccgaattc 30960
aggatagatt tgccatctgc tctattgcca atttctaatc catctttatc atgaacaaca 31020
ctcaaaccac acatctgaat tcacggcgct gaacgatcta ggccaacttc agagccgggt 31080
tcatcgagaa catagtgagg attgaagaaa agtggtctac aaaggcctga gcgtgctcag 31140
ggccatacag cgagctctga agtttgacat gaatgagtgg gtccttggta gggtcatccc 31200
acatctcgag aacgatgtca taaggagtgc gctcacggga agcgagaaca ctcgtcattt 31260
tggcattgcc aattgagcca ctctccgctt gaccctgctt gtaatcaaag acagcctgga 31320
acaagggggc gtgtgtctga gtcttgggtt cctcgcctga ggtagggaga ttcaggccta 31380
gacagtcgag gatgacgcca tacggcaccc gcgcgtgttg catggcctca cgcacactgt 31440
ccttggtggc tacaaggtgc tcgccgaatg tcttgctgcc gacgaactca tcaaagcgca 31500
ggggaagcac gttagcgaaa aagcccatcg ccgaaatttc ttccatggtg gatcggttgg 31560
tttcggcgag gccgatggtt atgtctttgc tgccggtaag acgcgccaac aaaacgtggt 31620
aggcggccag gtagaactgc atgggggttg ccttgtgctt gcggctccgc tctttgattc 31680
ggaaggcgac catgggatct aaacgagcaa ttgcttcata ctgctgccac gtgaatggct 31740
gtatttgctg ctgctctgaa ttggcagcag ggtcattgat cagattcatg atgggaagca 31800
cggttggcgc agatgacgag actttgctat gcatggactt ccagaacgcg atatcgtccc 31860
ccattcgccc attttccagg ttttcccgct gttggacggc tagatcagag aattgggtcg 31920
atggtcgctg cattttcacc ccgctgtaaa tctgcccgat ctcattgaac aggttttctg 31980
ttgttgagcc atcaccaact aatctgtggt agccgattac caacaggtgg tcatctgtgc 32040
cccagtagaa atcaacgagt ctgagagtgt cacctgtgga gatgctatag tttgtcttct 32100
cgagtttccg gtactcttcc tctgcctccg cagcgttgtt cacctgaaca aagtgcactc 32160
tgttctccgg gttcttgaga accacttgga cgggaccatt taaatcgctg ctatagtcat 32220
cgccagtaac aaagcacgta cggaagatct cgtgacggcg caatgaggct ttcagagccc 32280
gcctcaaccg gtcgaggtca atggtaccct tcatgaacat gccaatagtg ttgttgaaga 32340
tggtatgatc ttttaccatt tgttgctgcc tccaggaata ctcctggcca agggacaacc 32400
tctcgcgacg aagaatctta cggcctccct gctcattatc gtcctcttgc tcttcatcct 32460
cttcggctga cgacgcatct gtgctggtag cagagcttgc ttcatcatgg ctgtctgttg 32520
gtgtcggaga agccccgctg tccgaggttc ccgtggaatc accaatttgc aacagcagcg 32580
gaatggatgt agctgggagt cgggtggccg cgtcgtcggc aagatcagcg acagaagcac 32640
cgccaagtac cctcaagagt gggaggtcaa ggtagagttg ctttgagaac catgagccga 32700
cagtcactgc acccaaggag tcgacacctt gatcaatgag aggaatggtt gggtccacgc 32760
tctccccgtc cgaaacttgg agggtaacac ggagtttctc agatagacca tctgcaactt 32820
tgttagtttg aactcgatat caggaaacgc atgagagata acttaccaat cacgatttgc 32880
cgaacttggt ctaaagttgt tgcttgtttg agctggtcgg caatggagcc tttagaccct 32940
gatccattgt cgccaccgtc tccgcgttga ccgggaattt tgaagtttcc gaaacgaggg 33000
tcgttgaagt aaataattcg atcttgaagc gcagggtcaa gatctgggat acccgtggta 33060
agctcaaggt ccgccatgtc aatgaccgtc ttgcgctgtg gttgctgccg ggcacgctgg 33120
tcagacacga ccgcttcggc gaaaagcgtg tgcagctcat gctcttcaac tgagtcaaac 33180
atgaaacgga tagcatcaaa gtcctcctcc atctcggccc tcgtgacaaa ccctacaccg 33240
taaacggcac caatatcgat ggttgatccc tgtggttgtg cgttagtaac ttgacgtcga 33300
tgcatgataa ttcaggggta gaaaataccg ccaatcctct ggcgcaccgt tgctgggcca 33360
gagcctgtag gtaggcattc gcagcgccat agttggactg gccaggattg ccaataactg 33420
caacaatgga cgaaaacatg atgaagaagt cgagcgcctt gctgcccgtc tgttcggaga 33480
accgttcatg aagaatgcgt gctccttgta ccttgggctt caacaccatg tccatcatct 33540
ggtggtccat gttcttcagc atgacatcct gcagcaccaa aggcccgaac gcgatgccgg 33600
caacaggtgg caacttcata tcgacaagct tgccaaggcc agcatcgact gaatcctcat 33660
tggcaacatc cctaaagaaa gtaattggat aagtaaacga ggatgtggta gcaaggtgtg 33720
atgtgatatc aatcaactta cattgacaga acggtgatgt caccaccaag tgcctccatg 33780
ttggcgatcc atttgggatc aagtcgaggg ttccggctag tgagcacaac atggcgggcg 33840
ccatgcaaga tcatccagcg acagagagag cgaccaaggt ccccggtaag accaacaagc 33900
aaatacgtct tcttgttgga aaataagtta ccagagtcga tggggcaaat cctagcggac 33960
acctcatttt ccttccagtc gatgacggtg gccagattga agcgttggtc attgtggttg 34020
acagagagct gaccaggcaa gagaatttgt gtggctgtaa taactttctc agtgtcgtcg 34080
acagtcgacg cagagacggt attttttgcc attgccacag agtgctcgag gattggaata 34140
tcctcaacat gactaacttt gtatgtggaa gctgtacttc ggataagata gtcaccactg 34200
tacatgaagc aactgggtgg tagcaacttg gccaaacggt tggttatccc ggcagcagtc 34260
cggtcggtag acaagtcaaa gaatgccatc atgtttgtcg gcaggctgtg tttcagccga 34320
gcgtcggttt ccttggcatg taatcggatc caaggagccg gaatagtttt gacgtcggac 34380
agagttgttg ccaaatgaac ctgaacaccg taggttttgg ccgactccag aattgctttg 34440
acgcagaaga ttgggggctc cataatcaga attgatgcat cagagccaaa ggactgagcg 34500
ctagagagaa ttgtttcggc aaggagggct gcagctgtgg acaacaagaa ggaactatcc 34560
tcgccttccg ccatgttatc gggcagacta tgcatgtagt ttctcggtac atgcagtata 34620
gatccattct tctcagccag ggcgactaca ggcacctcac atgtattctc cagaatactg 34680
ccctgcacga catggaagta tccgagatgg cccacgcgaa ttgcctgggg aagagcgtag 34740
cgaacacgaa cagttgcttt tccagcatga cgagcgtctt ctaacgaatc acacgtctcg 34800
gttgactcaa gatagtacat cgatgaggat gctcccctcg cctctttcag tgcaatggcc 34860
gtcttggacg aattaaagtt accgaaaatt ggacgacgag acgagttcat acggtcgttc 34920
ctagcaatat cctgcttcaa acgagggacc caggcacgac ccttgcacca gtacacttcg 34980
ggctcatgag tccatgttat tgattccaaa agctgatcat cgctctcctc gaagcgcaaa 35040
agttgctcaa cgaagaattt ggtgtctagg ttctccacag tatcgacatc gaagacgtgc 35100
gttcccaagt cagggttctc gagcttgatt gtcctcaaca ttccgatggt gctggcctgg 35160
tggggatgat caatccaggc attctctgtc agccacatca tgcgtccggc gtagaagaga 35220
agagacttga ctgcctcaaa cttgtcctct tcaaggttgc aaaacacttc atcatcaagt 35280
tccgagagga tgacaaaagt cgacttaggc tgcaaggccg ggtcgtcgag aacactttcc 35340
agccgcttga cggagtggat gtgtctatgc ggtagggcag ctttcatgtc gttcaaaatg 35400
cgttcggttt ttgtcgattc gccaccgata accactaatg gcgggtatga gtccttcaat 35460
ggagcagaaa gtggatcata caaacgctca acggtggcat ccacagcatg tgtactgaag 35520
acagacggga tcaaatcatc ctctcgatca agtgtccgac tatcgacgcc agagaaccca 35580
actctcttga gggtatgctc ccattggtca acggaccccg aggcactcaa agcacgagtt 35640
tcgtcttctc cagtccatcg atcagcgaaa agcccagaga tgaaggcgag gcgagcaggc 35700
tcgcgatggg tgaccccgaa agtaaccaag tgaccacccg gcttgagcaa ggaccttatg 35760
tgagccaatt tttcctcgaa gttggagctg gcatggagga catcggatgc aataatcaga 35820
tcgtaggagt gaggcttgaa tccttgctct gctgggcttc tgttgatgtc tagtgcctca 35880
aactgcatga gaccgtcgaa ttcggaaagt tgttcacggg ccttgccaat aacatccgcc 35940
gagatgtcag tgcaagtgta actgttgaaa ccaagttgag gtgatgcaag aacgcgcttc 36000
gtggcgatgc ctgtacccaa gcctaaaaag cgaacgacag attagcaaac tgcctagtta 36060
cttacatttc agattcgact taccgatctc aaggatatca atggattggt agcgatgagc 36120
aatttggcta accagatcct gaacgacgtg tattgctgag ccaaaggcga gcttgttggt 36180
atagtactcg gtgaacaacc catcgcggtt catgatatcc aaaggatccc cgttcccgcg 36240
aacaattgaa attaattctt tgcctaccct ttggatcagg cgcacatgtg ggtgggacga 36300
gttgcttcaa gtaaaaggtt aatataaaag aatgaaaaaa cacggaacag ctttgggtgt 36360
acctttcaca catttgctca atgtgaacag aagtgtcctc ctcccaagac tcctggtacc 36420
actgatggtg gccagcccga gcatcggcct gaacctggtc acaccattca atgtacttct 36480
gggaatggag gtcggcattt tgacggtcgt cgggggttat ctgggctagg aaggatttga 36540
tgtagaagta aacgattcgc tcgatggtca gaatgtcctc cttgtcccga gctatgatca 36600
acgtcgcagg gtcctccagc agtttttcgg gcgtgagggg tccccagacc cactttgcga 36660
agattcggtg gtcggtcgaa gcagtcgggg gagagaaagg cttaaagaca atgttatcaa 36720
cttggaaaag cgttgtcttg gtcgaatcgt acaccgtgat gtcgccgctc aggaaatcac 36780
ccttgtcgtg tgtgttgatt gtgtcaaacg caagctcggt ttcaccagaa ttacccgccg 36840
atatacagag cgatggaatc agagtcactc tgtcaacgtg agtaggcacg tacaatgagc 36900
gtaggcgacg atctcctgga gaggaatacg ctccaatgac agtctggaac gcgatgtcca 36960
ggggcgctgg gtggagcaag aggggctcat tgcgcaattc atccttaagt ggaaggaaag 37020
ccaaggtgcc gctagctttg gagtcggccc ttctcatggt ctgcaaacga cggaagtctt 37080
tgctgtagtc atacccaagg aggtcaagtt cccgatagaa gaaatcgatg ttgacattgt 37140
tcatctgggg gtactcttcc tcaggtggcg gcaaaagctg cgatgacggt gatgcctcgc 37200
caagggttat gacgatttgg cctttggcgg atgtcgaaag ctcactctcc tttgccagac 37260
aggaatcaat aacaaatttg accgtgactt ggccatccgc atcattgtca ctggtgactt 37320
cggctgtcaa gttcagctcc acggaggtgt tttcatcttc aaacacgatg gctttgttga 37380
tgctcatgtc caagatttcc aggagctgaa cttgggcggc acgctcacca gccaccttca 37440
tggcagcttc catggccata attatgtacc cagcagcggg gaacacagtc tggccttgta 37500
gcgcatgacc gtcgagccat tccagatccc ggggcctgat gaagtttgtc cactggaagg 37560
tcgatgctgt gctgtaagaa gaaagctttc caagcagaag atggggcgca cctccacgaa 37620
gatgctggcg ggtggagcga gattctgccc agtattgacg agtatgatcc caagagtatg 37680
tgggcaatga ctttgacagg ttttgaacgg cacgatcggg ccggacttgt tgtacgaagc 37740
cctcggcgtc gatactccga actccgaaac gctcccaaat gtatcccaga cctccagcaa 37800
aagcgtccac atcgtcaacg tttcgtgcca agcacccggt atacggcagc tccacaccgg 37860
caagagcatc cttgatggtg gctagacacg gacccttgag agcagggtgg gcgccaattt 37920
cgatggcgac gtcgattaga cgatgagtga tgactgcttt ctgcacagcc tgcgagaaca 37980
agaccggaga gacgagattg tctttccaat aagcgggcat cacatcctgt acagtcattt 38040
gcttgctggt ctcgtggacg gcagagaacc aagcaacact atcgttacct tggccatcgg 38100
caacagcaca gtcgcactcc agcaatgcct tgacatatgg agctgcgcat gggtgcatgt 38160
gatgcgaatg gtaggccttg tcaactctca agattctggc aaaagtggat tcatcctcca 38220
agacaccttc aacgtgctgg atagcatcca tgtcgccgga gaaggtcaca ctatccggtg 38280
aattgctagc ggcgacgcag acccgaccct caaaggcttc gagctcgcat agttcctttg 38340
cgtcatcgta cgacatacct gccgctagca tagcgcctgt ctggccgctt ggagaagagg 38400
catgctccgc ggacacaact ccacgcagat gcgcaatacg gatagcttga gtggcactga 38460
tgaatcctgc cgcaaaggca caggcaatct cacctgaact gtggccgaca attgcactga 38520
actcgatacc agctgcagcg agaagtcgga ccagaacgat ttgtacggcg cagcatagag 38580
gctgggagaa gctggcgagt ctgacgtttg aggcatcccc ttcaagcatg agctggtcat 38640
acagtgtcca cgtaggccga tacttttcag gcagtgtttg cagtgaatta tccagctctt 38700
cgagaatgcc tctcacaaat ggcataccca ccatgagctt cttcagcatg cccggccact 38760
gtgcaccttg gccagtaaag acacctagta cgcgagggtt gtcattcgcg tcggtgcgga 38820
agtcggtgac gacctcaccg tccgcgatgg cagcctccag tgccgcgcgg gctacttcct 38880
tgttgtgtgc tgcaatcgca cgacggaagg gcaagataga ccgtttctca agtaaggtat 38940
atgcgatatc atgcatgtcc acgtcatcat gcgtttccag aaattggagc atattttcta 39000
gcgttgcctt catggagcgc tgcgacttcg atgaaagcac aaggggcaag ctgcatgcat 39060
ctgcatctga ggtcacctct gttaccactg ctgtcggctt gtgtggagga gccatatact 39120
cttcgataat agcatgggca tttgtaccac caaatcctga tgtgtttata tgtttagcta 39180
acttcacttt cgttctcaag aagtgcagtt gaatccttac caaatgaatt aacgctgact 39240
ctgcgaggct gcccgggcgc aacaatcggc cattctgtgg cctccgttgc aattttcaag 39300
tgcgtataga acggagcgac acggggactg atcttctcaa acagcaggtt tggcgggatc 39360
acgccatttc gtacagcaaa cgatgccttc attaagcccg caataccagc agtgccttcc 39420
gtgtgaccga gaactgtctt gatgctgccg acaaaaagct catctttctc gccgtcgctg 39480
tcgattgttc catccttgtg tccgaagaag gctgttgcaa tagcctcagc ttcctgtggg 39540
tcaccggctg gtgtaccagt tcctgggatc ttcgtgttag ggagagagag actttctgca 39600
acttccataa ggctgatact tccagggaat accacttacc atgggcttca aagaactggc 39660
agcgttcctg ggggttggta atatcaagac cagccttggc atatgtggcc cgaatgaggg 39720
cttcttgtgc gctatggttt ggcattgtga tacctgtcgt tcggccatct tggttgatac 39780
cggtctctcg gataacacac tcgatactgt ccccgtcgcg cagtgcctgg ctcagcgttt 39840
tcaggacaat agagcaaaca ccttcctaaa aagcagttac aggaggtcag tgccatcttg 39900
ctttttttga aaggaattga tgcattgtca acttactcct ctggcatatc catcggcagc 39960
agcatcccac attcgagatc taccattggg ggacagcatg ttcaatttgc tctccattac 40020
aaaggtcatg gggcccaata tcagattcgc accggctgca accgccatgg tactctcgcc 40080
cgttctaagc tgttggacgg ccagatgcac ggcagctaag gatgaactac aggctgtgtc 40140
gatcgtcatc tgcagaatca gtcaggaatc tgtcagcact tgacgaagtc gggctcgctc 40200
aatgagtggc actcacactc ggcccatgcc agtcgaagaa gtatgataca cggttggagg 40260
ccacactgac agctaccccc gtggcagagt atgtaggaat actatccaat tcacgcgtca 40320
cgatagtctc atagtcatgc gtcatcatac cgacgtacac agcagtagag gatccttgaa 40380
ggccttggat ccgtaggcct gcgttggata cagcttcata gaccgtctcc agcagcagcc 40440
tttgctgtgg gtcaatcgtt tcggcctctc cagcttggat gttgaagaaa gaggcatcaa 40500
aaccgcgtag atcctcctgc agcaagtatg caaagggtgc gttcgtgcgc ccggggtgag 40560
tgccatcggg gctgtaaaat gtatcgacgt caaatctctc cttagggatc ttggtctgta 40620
catcccgggg ctctttgagc agctcccaaa gttttgatgg tgtgttgaca ccacctggaa 40680
accgacaacc gcttcccact accacaattg gctcgtttgg atagttggct tgatccataa 40740
ctgctgatcc tgtttttggg cgataggatt gggattaaac cttgtcttgc gtcagtagat 40800
cttctcactg catgccgggc acaacatttg ttcttacaga atcgcagagt tgaatctctg 40860
agcgaacaag ccggccttgc aaccgatacc gtcgttatat ttacttgcac gtatcagtac 40920
tcatctagat tcggacaatt tcaagatcca ttctagtact caaatgcccc cacttcccag 40980
caatgcaagc tcggcaccta gcaaaccctc ccggcgtcat tcggtgcacg aatagccatt 41040
cctccatacg gcgttattcg gtcacacgag gctgaatgaa tcaaacgtga atatcaattg 41100
gctgtatcaa ggtgaaaccg agtttttcac tcggattgtt cttgtgctgc tcggtgaagc 41160
tgctcctaaa ggaaacaacc gaactgcccc atccaggtaa acttcgattg gggggggggt 41220
tttttttttt tcaaggttga ctggaagagt gctctcggcc acaaaatccc agaagcatta 41280
gtgctgttat tcgattataa accgtcgcag cgctctcatt cttcgctctt tcttcttttc 41340
cactggtgtg cataggtcct atctgtctca cgcaatgctc ggccaggttc ttctgaccgt 41400
cgaatcgtac caatgggtat cgacccctca agcccttgtg gcggtcgcag tgcttcttag 41460
tctcatcgcc taccgtttgc gggggcgcca gtccgaactg caagtctata atcccaaaaa 41520
atggtgggag ttgacgacca tgagggctag gcaggacttc gatacgtatg gtccgagctg 41580
gatcgaagct tggttctcga aaaacgacaa gcccctgcgc ttcattgttg attccggcta 41640
ttgcaccatc ctcccatcgt ccatggccga cgagtttcgg aaaatcaaag atatgtgcat 41700
gtacaagttt ttggcggatg tatgacctct gaattttcca ttgttgtaac tcaatgacgt 41760
ctctaagatt ctgatgaatg tataggactt tcactctcat ctccctggat tcgacgggtt 41820
caaggaaatc tgccaggatg cacatcttgt caacaaagtt gttttgaacc agttacaaac 41880
ccaagccccc aagtacacaa agccattggc taccttggcc gacgctacta ttgccaagtt 41940
gttcggtaaa agcgagggta agtgtcaatt tttctgtctt gagcattgag cctctggctg 42000
acataccgcg aatatactag agtggcaaac cgcacctgtc tattccaatg gattggacct 42060
tgtcacacga acagtcacac tcattatggt cggcgacaaa atctgccaca atgaggagtg 42120
gctggatatt gcaaagaacc atgccgtgag tgtggcggta caagctcgcc aacttcgcgt 42180
atggcccatg ctactgcgac cgctcgctca ctggtttcaa ccgcaaggac gcaaattgcg 42240
tgaccaagtg cgccgcgcac gaaagatcat tgatcctgag attcagcgac gacgtgctga 42300
aaaggccgca tgtgtagcga agggcgtgca gccgccccag tacgtcgata ccatgcaatg 42360
gtttgaagac accgccgacg gccgctggta cgatgtggcg ggtgctcagc tcgctatgga 42420
tttcgccggc atctacgcct cgacggatct tttcgtcggt gcccttgtgg acattgccag 42480
gcacccagac cttattcagc ctctccgcca agagatccgc actgtaatcg gagaaggggg 42540
ctggacgcct gcctctctgt tcaagctgaa gctcctcgac agctgcatga aagagacgca 42600
gcgaatcaag ccggtcgagt gcgccactat gcgcagtacc gctctcagag acatcactct 42660
atccaatggc ctcttcattc ccaagggcga gttggccgct gtggctgcag accgcatgaa 42720
caaccctgat gtgtgggaaa accccgaaaa ttatgatccc taccgattta tgcgcatgcg 42780
cgaggatcca gacaaggcct tcaccgctca attggagaat accaacggtg atcacatcgg 42840
cttcggctgg aacccacgcg cttgtcccgg gcggttcttc gcctcgaagg aaatcaagat 42900
tctcctcgct catatactga ttcagtatga tgtgaagcct gtaccaggag acgatgacaa 42960
atactaccgt cacgctttta gcgttcgtat gcatccaacc acaaagctca tggtacgccg 43020
gcgcaacgag gacatcccgc tccctcatga ccggtgctaa gatataacac gcaaactaaa 43080
acaaatatgc atccgtcccc aggcttattc caatagtttc cgtcccagag aaactaggtg 43140
ctgtattagt cgagtaggtt agtaaaataa aacgcatttt attcgattgt gatgccttct 43200
ttgtaatcga acgtggtgta gactttggct atgtgcgaga gacagaaaca cagagagaga 43260
gaagggagag agtgtgtatt cctgctacgc agagcggcca tctgcttcta taccgccagc 43320
tacaccgcca cgtagggaag tcggcagtaa tgaagctttt ctcccggtac aatcaccgat 43380
ctccccattc tctcaggcgt tgactggcgc ttacgatgac gagggcttag gctctgttaa 43440
gtcttgatgt tcctactcaa catccccgac taggcgaaag agaggacggc gcaacgacgt 43500
ggacacaagt actccctccc gccttccgac tacatatcca caatctgtac ccactgcccg 43560
tgccaacgcc tttcgaccgt tcaacgcgca tttacaaggc ttgcgggaat cataatggag 43620
agaaaaagag agaacttttg acagtcaagc ctccgaggtg ctaagacagc ttccctggta 43680
gtataaaaag cattcactct tccgacttcg agaacgagtg cacatgtgta ctttgttgct 43740
tctcagggcc actgtaatgg tatttcaggt atctctattt actgctatcc agaagtcagg 43800
cattaaatag tcaggctcag cccaggctcg attcagattg gattcaggct tcagaccatg 43860
gccgctatgc tccttcgtac tatacctccg tcgagctata cccgcttggc cagacaaaag 43920
gcttcactga acccttcaac ttaactgcat ttcgccacaa ctaactcgac gaggccggcg 43980
atggtgttac cattcatgag ctcaaagatc gacacatcaa catggatttc agatgtgatc 44040
cagtttcgaa gttcaatggc gacgagtgag tctacgccga cacctgccag gtttttggac 44100
gaggacatgt cgtcttctgc cagaccaaac attcgcatca gcttttccgt cattgctttg 44160
aggacgatag aaatggcctc gtcgtgagag gtgaccctgc ttagttgggc ccgcacgcca 44220
tctggtcctt ttttatgcga agagacaaag gattggtctg catgaaggac ttggcggtat 44280
ttaagtccca caaaccgctg ttcctgtatc cagtttgcct cggtccagtg agcacccggg 44340
gatgtgttga ttcctgtaac cacagctgcg ggaggtgatg gaaattgagg ggaagaacac 44400
aggattgcct tctccaacac atccatgacg tccttttcat gcataggctt gtaacctatt 44460
ctagcgagcc ggtcggccac accacggcca gtttcagcca cgtatccaac agacttgacc 44520
atgcccaagt caatggtgac agccggcatg ccatgggctc tccggtggtg cgcaagtgcg 44580
tcctggaatg caccagcagc tgcgtaattg gcctggcctg ccccacccat gaccccaaca 44640
agggatgaga gcatcacgaa gaagtcaaca tcctgtgcga tcttgtgaag ataccaacta 44700
ccctgtactt ttgggcgtgt tgctgcatta aattcatcca atgtcattcg cgatagaagc 44760
gcgtccttga gaaccatggc accttgtatg atacctcgaa ttggcggtgc atgtgcttct 44820
tcgcacaacc ggagcacctt ggtgacctga tcttgatctg agatgtcaca tgcgtgtaga 44880
tagacagcgc actgttgatt ttgcaagctg gttatgaatg gactggcctt tgcacttctc 44940
gataggataa tcaagtgctt cgcgccatga tcaacaagcc actgacagat ctgctttcca 45000
attcccccca gcccaccagc aactaggtaa gaactgtcag gcttcagctt cagcgagaac 45060
cctccatcgc cgactgggac cagttcgtcc ccagatacat tgaccacaac tttgccaaca 45120
tgctgaccac tctgcatcgt acggaaggcc ttctcgatgt ttgacaagga gtgctgctgg 45180
attggaccaa tcaagccaat cgcttttgtc tcgaggagtt ttgtgacatg gttcaacgct 45240
tcggatactt cttcactttt ggctctttgc cacgagagaa gatcaattga tgtgaaagag 45300
acgtcccggg tgaatggcag catgtcaagt ctgctgtttt gctccaggtc cttttttcca 45360
atctcaacaa atctgccgaa ttcggccatg cagtcaaagc ttgcttggag gagttgacct 45420
gccaatgagt ttagaacgac atgaacgcca agtccgcccg tgtaggcttt gatgccgtcg 45480
acgaataagt cattcctgct cgagaagata tgatccggat tgatgccgaa tttatcgccg 45540
acaaagtcac gcttggcttg agttcccgct gtgacgaaga cctcggcacc cgcaagctgg 45600
gacaaaatga tcgctgcttg accgacgcct ccagctccac tgtggatcaa gactctttcg 45660
cctcgtcgta gctttgccgt ggtataaagc gcaatatatg cggtagtgaa agccaggggg 45720
accgaagcgg cttctgggaa gcccatttcg tccggaatac ggacgacatt agtgtacggc 45780
gtctgtgttc tggtcgccca atggcctttc agtagtgcac atacgcggtc ccctaatctg 45840
aggccttggc tagcggcagc agctccaccg agctttgtga tcactccggc gcattcgaag 45900
cccatcacac ggttggcctc caattgaccc atggcaacca tgacatcccg aaaattgaga 45960
ccgaaagctt tgggttcgat ttctacccaa tcatccggaa gatccttgcc ttcacgtcct 46020
tcgtcgtctc gaaattgcag ggagtctaag agccctggcg tctcaacctc catccgcaga 46080
cgacgcccgg gttgctcgaa cggctgcagt gtgacctcaa ccgcttcttg gtccttccag 46140
tgcgggtcat tgaaaagtcg cggtacgtgg atgacgccgt ttctctctgc aaattcaaac 46200
tccttgtctt cggaaaggtc gccgaggcgg ccattgaaga tattgcagat agcatacagg 46260
gactcgtggg tgtatgcgtt tcgagaagga tcgagatcca acgatacata ttccttcccg 46320
ttattttcgt tgcggatggt acgcagcaga ccaatatgta gagctttcca tggatcctcg 46380
gagctcatgg ctgctcctct agacacccag agaagtgcgt tgcagttatt cagcatcgcg 46440
gtgatggatt tgaaggtctc gcttcccacc tctccaagga gcgaggactc catttcccca 46500
agaaaaatgc atgtccttcc agtggtatct acctcgccca gagcgttgat cgatgggcta 46560
gaactggtct tttcacaaat tgctgcctgg agactttcca gccaagatga aggaggtcgg 46620
agcgctccgt gcagcaaaag cacctccgat tctgccactg tatccggggt tgtattctct 46680
tttctagccg tcgatagcat tgtgctgatc atgtaaaact catcgtcttc acaatcacga 46740
acctccaatt ccacaccgtt gaaaccgctc gtgtccaaca tggtgttcca aagatcggta 46800
gtgagcgatg gcgtcgactt ccgctcaggc tcctcactga gccaccaacc tggcaacagt 46860
ccgaaggtaa agaacaaatc gagctgatcc ctggtagtct caaccaaaat caagttgccc 46920
ccaggcttga gcaattttcg aacgttactc agtgttcgtt tcatgcatcg agttgcatgc 46980
aggacctggc aagccacgac cacatcgtag gtggcacatt caaacccttg ttgctcggga 47040
tcgctttcaa tatccaattt tttgaaagtc atcacgtctt gccaatccgc aaattgctca 47100
cgcgccgact cgaaaaaccc ggcagacaca tcggtgaagt cataacgatc gatcggcttg 47160
gtgtttccca atgcattgac aataagcttt gtgcagccgc ccgtgcctcc gccaatctcc 47220
aaaatgcgag aacgcgggtt cttgtgggcg caaagtcgga tcagctcgct ggcttgtgcg 47280
tttgatcggc tccatttgat tgcgttgacg tagtatctgc ttagcagctg atcttgcatc 47340
atcaactcaa gtggctctgt ttcgcggcgt agcattgcta ttaactgagg tcctagacga 47400
gaaatcatct cgccattgac gctttctcca gcgactctgg cctgtaggca tttcttctgc 47460
tcagcatcgt cacttagcca gtcgcaactg gctgggctga gcttgttttg tctcgcaagg 47520
tccaattgga cattcatcca atcgaaatac ttctgaaggt ggccatccag atgttggata 47580
tcagaatttg tcaaatcagt gacagcctcc tgtataaagt tgatcgtgca tcttcggagg 47640
tccatcatga gttccgtttc tttcgtctca gcctcagtgc tcaacttttc tttgagccaa 47700
gtggagtcac ccaagctgat gtcaggggcc caaacccagg agctgcaggc attttctgtg 47760
tcgttggagt ctgacttttg gtcagagaag ctgcttccaa ccgactggaa aacaaggcct 47820
tcaatctcta tgactgggat tccgtccgag ggagaagaac cgctatcata gtcatcaaac 47880
actgccaagt cggtagagaa ggattgagag ttgcgatcct tgatgctggc ctgtgcgtcc 47940
agagcatcac cagcctccaa gtcagccagg ctagaggata ttttgacatt tcttagcctc 48000
cttggtacca tggccgtttt catacgtgtt cccgcgtagg gtaacaccgt gtatgccgcc 48060
tggatcaccg agtccagagt agtaggatgg acgatgtgtc gattctcgta cgagtgaggc 48120
atagccgagg cagtgtcagc aatggaaaat ctgcaaaacg agccctgtcc attgttttga 48180
attcgctgaa tgttctgaaa aatgggtccg tggcatatcc cattcgcgtg taaggactcc 48240
cagagatcgt tgggatcaat gctccggtta tctgagccta gattcaacct gcgtgaggct 48300
tccacagttg aacagtcaag gtggcttctt tcgctctccg aacgtattaa tccggtgcag 48360
tgttctgtcc aggtattatt ttcgcccgaa attgagtgca cagaaaattg atgccagttc 48420
tttgtgccga gggacctttc ctcacatgaa cggatcgtta ggcgcaggtc aacctctgct 48480
tctgcatcag cgggtattat gagagcctgc gcgagttcaa cgtcacgcaa gttgtagttg 48540
atgctagccc ccgcaactgg tgggcagact tgtgaaaacc cctcgatggc catgctgatg 48600
aagccagctc ccggaaagat gatgctcgaa ccaacgacgt gatctcgtat ccatggaata 48660
tctgacagac ggagaacatg tttccattta ggcgcgaatt gaggagagag agattcccgt 48720
gagcctatca aagtgtgagg cggatgggtt ctctgtttgg actcacgact gccgcgaggc 48780
tctctccaat aacgggtttg gtgattccac gggtacgccg gcaaatcgct cagtaccttc 48840
actctgggct cttttcttcc atgaggaaag tttatagcgt ccattttgag cccataaccc 48900
ttgcttatca actccgtagc agcacgatac attgtctcca acgagcttct gccgcgagaa 48960
aggcaactga gatagtttat atctgttcct ttcagaccca gatcctgcat gacttggttg 49020
attggaccac caagcgctcc gtgaggccct atttcaataa tcacatcgac ggctttctct 49080
ttggtgttgg gatcaaagca catctcgcgg agtgaggact cgaactctac cggctgtagc 49140
atactatcca tccagtgtgt gggatccaat agcaatttaa gatcggtcat gcgactacca 49200
gtcttaggtg atgaatataa tacacccttt gaggtgtcag cattgggatt gtcgttgttg 49260
ttatccgagt tgaacagatc tctcagtgac gccccaaagg catctgccat tggtcgcatg 49320
tggcttgaat ggaaggcttc agtgactttc agtttcctgg taaagatgcc atcggcgtgt 49380
aacaactttt caagtttctc gattgcaccc aaatctcccg acaccgtcac actacattga 49440
ctgttgatac atccaaccac cacacagccg tcctcctggt tgagacgcga aatgtaaaca 49500
ttggtctcac tgcgaccaag acccaccgcc atcattcctc ctttggctgc caatgcgggc 49560
ttgggcttag tggtcaatac accgcgtata taagtgatcc caatggccga ccgcgcggat 49620
aaagccccag ctgcgtaggc agcagcagcc tctccacttg agtgactggt tatccccgtt 49680
ggccgaattc cccatgacca aaggagacgc acaagtgcaa tttggatagc ggttgacagt 49740
ggtagactgt attcggcatc atttacccga gtcgtcagct catcacggtg gagctcctct 49800
gtgcaattga atgttagtac ctcaagcttg atacagtatt acttttcccg ggctcgcaac 49860
ttacccataa aattccaact cgcgcccagt tgcttgatgt agccatcaca ttcaagaatc 49920
gcctgtttga atactgggaa tgtattgacc agctctctgc ccattgcatg ccactgcgcc 49980
ccctgaccgg tgaatacaaa tccgagccgt actttctcat tcgctcgttt tggttgattg 50040
gactcatcgc tgagggcaga aacaaggccg ccaaggctgt ctgctacata cactgacgtc 50100
catggcagaa tggaacggcg agagcctagt gtataggcga ggctggcgag gaagggttcc 50160
ccgtcaatgt cagcgacgga tttaatgtag tctcgcaggc ttgctatcgt tcgccgacaa 50220
gcttgctcgt ccttggcacg cacaacgtat atgcggctct gtttggaacc atcctcaacc 50280
ctaccatgct cagagttacc attgacatgc acttgatcct ctggcagggc caatgatgcg 50340
cgatcatatg attccaaaat gacgtgagca ttcgaaccac caaagccgaa gttattgaca 50400
gatgcgcgac gagtcccatc tttcacaggc cagtcttgag cagacatggg gatctttgaa 50460
acattaacct ttgaaacata taactgaatc tgcgaatgcg caaagcctta ccttgatgtt 50520
cttttggtca agcatcagct tgctgttctt ttgcaggaac cgcgcattag ggggaatcaa 50580
gcccttctcc aaggccaagg ccaccttgat tatactggcc aggccactgg cggcttctgt 50640
atggccaata tttgctttca cagagccaag gtgcagagga tgtcctttaa aagctgctga 50700
aattgctgag atttcaaggg ggtcaccagt tggtgttcca gttccgtggg cctccacgta 50760
cgaggtcaac gacatatcta gcccagcctt atcgtaacac tcctggatca gacttttctg 50820
cgccacatca ctcggcgcag taattgcggg tgttttgcca tcctggttca gcgctgtctc 50880
tcgaatgacg gctcggatag ggtcttggtc tcgcaacgcg ttagggaggg cctttattac 50940
cagagcggca attccttccc cgcgaccata tccattcgct cgaggatcaa aagagtacga 51000
gataccatcc ggggacaaaa atctgtcatt gagcaacaag gattgcttag ttcaagactc 51060
tcgatctgga atcttcttcg gaaaactcac cccaggtttg acatcgtaac aaaaacatcg 51120
ggattgagca gaagatttgc accgataacg atggctgtat ctgactcccc agtacgtaag 51180
ctctggcacg ccaagtgcag tgcggtcaat gtcgtcgaac aggccgtgtc aaccgtcacg 51240
ctgggaccac gtaagtcgta gaagtgtgat atccggttcg aaagcattgt tcctgagttg 51300
ccagttatga aataacgcgg aactgtctcg gggtcacgat tgagcgaatc ctgatagtcg 51360
tggtacatga cacccccaaa caccgacgta ttagagcctg ccataccatc gatggtgata 51420
ccggctggat gatggtcagt gacgtttgct tacagtgagg atgacccaca ctacatacca 51480
ctctccagcg attcgtagac cacctcaagc ataagccgat actgcggatc catgcactgt 51540
ccaatattag atctctgcgt cccgggttag atcaattgaa ataatcatac gctggcgacc 51600
tctgtggtca tgttgaagaa cgcggcgtca aataaagcag gatcctcgtc gatgaagtgt 51660
ccacccttta cgtgggtcta tccagtcatc cttggagtca gtaaccaagc ttcagtgatg 51720
ctcaaatctt gtgtcaaata ttcaaaacaa gatataaatg catgcatgtt agatactcac 51780
ggacccgacc ctttcgccat tcgggtggta tactcctctc acattgaatc gcgaggaggg 51840
gaccttagac caggcactgc ctcctctttc aaccatttcc caaagcttct gtggactcgt 51900
tgcatctcca gcaaatcgac atcccattcc aactatggca atgggcgtgg atgtgttaga 51960
gcaagccgag cctgccattg cggttgcggt tgcggttgcg gttgcggttg cggttacggc 52020
gggggtattg ttcattccaa cgttgtttca ttgactgata tatcagtcgc cctggtgata 52080
aaaccgttga tagtcttcca acagtctaca ggtccctggc atagctatag atgcataagc 52140
tgcccccgac acgtgattca tagttcgggg tttgttttca tcttggacgt gacacgatat 52200
tcgctctgtg cccatgggaa accccggacc accatgctat gctcggggca ataccttaga 52260
ggtaccggtt cgggaggcat tgtctgtcgt cacgataatc ccgagtcaaa acgccgatgg 52320
gaaaccgtcg aacaagacga aacaggtcag gccggccagg tagttttcgg gtataatgga 52380
ggctgtcaga atccgatact ccgtacacag atgcgaaata cgcatacgag ctatcaaacc 52440
aaacgaatcc aaaagccttg gaaaagcttg gaaaggctta gtgggtaatc ctgtcccaag 52500
gtttgttgag ggcctgagcg cagggtgggt cctgtaagca gttggtaatt caatttccaa 52560
caatacacaa tccccaaaat ttgcattatc ggttgactaa gacaagcaaa caaaatatat 52620
gcaggaagcg caattcatcg cgagcaaacg atcatcatga gcatgtgacc ctttcctctt 52680
ttttctactt cggaaggcgg catgatcatc tgtcagaact cccaatcggg agcaatacca 52740
taccttacgg caccccactc agacccatgc acaaagaaaa tccatgcgcc gaatattgaa 52800
gccttggcaa caaagccccg tgtaactccg aaggtatcca aagaccgaga gacgccgatt 52860
tgagagacac gtacggaggt ccacacaaaa tgttcccgag tctatacact atactccaaa 52920
ctgacttctt gtctacctgg gtatcttgtt caggttgctg tttactgaga taaatgatac 52980
cggggggggg gggggggggg ggggttgaca ctggcttttc gtggacagaa taatacccat 53040
acatccctgc gtaagtagtc gtttcgagaa gaatgtgttt cgtggtgcat tactccgtag 53100
gcacaatata tttccattcc tcacgaagtg gcctcgtccg ggcgtgatcg atgcagcttg 53160
ccgccccacc aaaaaaggac cacaatacga gtcagattag aaacgtctaa caggacgtct 53220
atgtaagagg acgctccttt gtatgtcgga tctaggcatg acaaaataac tatacctagg 53280
tagtgttctg tcttattggt catttggcct actttcggaa caatcttgga agttcacatt 53340
cctaggtatc agggcaattg attggtgtcc ccagaattct tttttctcga ataaaggata 53400
aatttatgca taaaaacctt ggaaactgag catagttatg agcacaaata ctagttttca 53460
gtgcaattgg tcctactatc ctttgcttgg taccccttac caattatacc ctaggcagca 53520
gttgacaccg gtcatgaatc cattcataaa ggtggaccag atgcagggat aaggaagcga 53580
atctttccgc tgcctcagcc tcaggggcgc gcgccatttg ttattttctt ctactcattt 53640
cccgtaccta ggaactgttc agttgtccct cccaacccct tgggccgaac aaccttcctc 53700
caatctacga cggcagatta tacctaggcg cctaaccgat taggttgctc attcgatttt 53760
ggaggtatgc actttatctc aagccctaat tcccaattga agtgcttttc cgtccccatt 53820
tgcagagctg actagattct tttctcagag actacctagc tataggtacc actccaagct 53880
gtagcacaga cctttcagca tggtcgcttc gttgctaccc tctcgctttc gcggtaggga 53940
atcaatgaat cagcagcacc ctctacgctc gggaaatcgg gcattgacct ccacactcca 54000
atttctatcc aaaacggcgt gtctacaccc gatccatacc gtttgcacca tagctattct 54060
agctagtacc acatacgttg gactactcaa agacagcttc ttccatggcc ccgcaaacgt 54120
tgataaagca gaatggggct ctttggtcga aggaagtcga agcttgatca ccggcccaca 54180
gaatggctgg aagtggcaga gcttcgacgg ggatgcagat gttctcggag atttcaacca 54240
tcaagcacta atgaccttgg tattcccggg gtcatatggg gttgcatctc aagcagcctc 54300
accattcctt gctcccctcc ctgtgaacct atctgtgatt gaccttccct caacgtcgag 54360
ccctttaacc gcctattcga aagataaagt tttcgccttc tctgtggaat acagcagcgc 54420
gccggaactc gtggctgctg ttcaagaaat ccccaacaac agtgccgacc tgaaattgca 54480
ggagacgcaa ttgatcgaga tggaacgcca gatgtggatc atgaaggctg ccagggctca 54540
cacaaaacgc agccttgctc aatgggtgca cgatacctgg acagagtctc ttgatcttat 54600
caagagcgct caaacgctcg acgtggttgt catggtgcta ggttatatat caatgcactt 54660
gactttcgtc tcactcttcc tcagcatgaa aaaattggga tcgaaggttt ggctggctac 54720
aagcgtcctt ttgtcgtcaa catttgcctt tctcctcggt ctcgacgtgg ccataagact 54780
aggggttccg atgagcatga ggttgctatc cgaaggcctc cccttcttgg tggtgatcgt 54840
tggctttgag aagagcatca ctctgaccag ggctgttttg tcctatgctg tgcagcaccg 54900
aaagccccag aagatacagt ctgaccaggg tagcgtgaca gccattgctg aaagtaccat 54960
caattacgcc gtacgaagcg ccattcggga gaagggttac aatatcgtgt gccactacgt 55020
ggtcgagatc ctgctcctag ttatcggtgc tgtcttaggc atccaaggtg ggctacagca 55080
cttctgtgtt ctagctgcat tgatcctgtt ctttgactgt ctgctgctgt ttacattcta 55140
cactgcgatt ctgtctatca agctcgaggt aaaccgcctc aaacgtcata tcaacatgcg 55200
gtacgcgttg gaagatgagg gtctcagtca gcggacggcg gagagtgtcg cgaccagcaa 55260
tgatgcccaa gacagtgcac gtacatatct gtttggcaat gatatgaaag gcagcagtgt 55320
tccgaagttc aaattctgga tggtcgttgg tttccttatc gtcaacctcg tcaacatcgg 55380
ctccaccctt ttccaagcct cttctagtgg atcgttgtcc agtatatcat cttggaccga 55440
aagtctgagc ggatcggcca ttaaaccccc gcttgagccc ttcaaggtag ctggaagtgg 55500
actagatgaa ctacttttcc aggcaagagg gcgcggtcaa tcgactatgg tcactgtcct 55560
cgcccccatc aagtacgaac tagagtatcc ttccattcac cgtggtacct cgcagctaca 55620
cgagtatgga gttggtggaa aaatggtcgg tagcctgctc accagcctgg aagatcccgt 55680
cctctccaaa tgggtgtttg tggcacttgc cctaagtgtc gctctgaaca gctatctgtt 55740
caaggccgcc agactgggaa tcaaagatcc taatctcccg agtcacccag ttgatccagt 55800
tgagcttgac caggccgaaa gcttcaacgc tgcccagaac cagacccctc agattcaatc 55860
aagtctccaa gctcctcaga ccagagtgtt cactcctacc accaccgaca gtgacagtga 55920
tgcctcatta gtcttaatta aagcatctct aaaggtcact aagcgagcag aaggaaagac 55980
agccactagt gaacttcccg tgtctcgcac acaaatcgaa ctggacaatt tgctgaagca 56040
gaacacaatc agcgagttga acgatgagga tgtcgttgcc ttgtctttgc ggggaaaggt 56100
tcccgggtat gccctagaga agagtctcaa agactgcact cgtgccgtca aggttcgccg 56160
ctctatcatt tcgaggacac cggctaccgc agagcttaca agtatgctgg agcactcgaa 56220
gctgccgtac gaaaactacg cctgggaacg cgtgctcggt gcatgttgcg agaacgttat 56280
tggctatatg ccagtccctg ttggcgtcgc cggtcctatt gttatcgacg gcaagagtta 56340
tttcattcct atggcaacca ccgagggcgt cctcgtcgct agtgctagcc gtggcagtaa 56400
ggcaatcaac ctcggtggcg gtgccgtgac agtcctgact ggcgacggta tgacacgagg 56460
cccgtgtgtg aagtttgatg tccttgaacg agctggtgct gctaagatct ggctcgattc 56520
ggacgtcggc cagaccgtaa tgaaagaagc cttcaattca accagcagat ttgcgcgctt 56580
acaaagtatg cggacaacta tcgccggtac tcacttatat attcgattta agactactac 56640
tggcgacgct atgggaatga atatgatttc taagggcgtg gagcatgcac tgaatgttat 56700
ggcgacagag gcaggtttca gcgatatgaa tattattacc ctatcaggaa attactgtac 56760
ggataagaaa ccttcagctt tgaattggat cgatggacgg ggcaagggca ttgtggccga 56820
agccatcata ccggcgaacg ttgtcaggga tgtcttaaag agcgatgtgg atagcatggt 56880
tcagctcaac atatcgaaaa atctgattgg gtccgctatg gctggctcag ttggcggctt 56940
caacgcccaa gctgccaatc ttgcggcagc cattttcatt gccacaggtc aggatccggc 57000
gcaagttgtg gagagcgcta actgcatcac tctcatgaac aagtaagttg aaagcggccg 57060
cttacttgga aacattcact aatcctgttt agtcttcgcg gatcgcttca aatctctgtc 57120
tccatgccgt ctattgaggt tggaacgttg ggcggtggta cgattctgga gccccagggc 57180
gcaatgcttg acatgcttgg tgtccgcgga tcacacccga ccactcccgg tgagaatgca 57240
cgtcaacttg cgcgcatcat cggaagcgct gttttggctg gggagctctc gctatgtgct 57300
gccctagccg ccggtcacct ggtcaaggcg cacatggcgc acaaccgttc tgccccggca 57360
tcttcagccc cttctcgaag tgtctccccg tcaggcggaa ccaggacagt ccctgttcct 57420
aacaatgcac tgaggccgag tgctgcagct actgatcggg ctcgacgctg attaggtcgg 57480
aatcttagga gcattccaag ctccgtaccc cctccagtgg attcattgca ggaggatcat 57540
attttttctc attggttgtt attgtcataa ttttcaaaag cacaatgcaa tgagacaggc 57600
aggtggtaga gtgaacggcc agaaagggta tctcatgttt atatgttgtt gaaatttacg 57660
atgcaagtag tagggaagaa gaatatataa agagatggtc cttttccaga gagtgtttag 57720
gtctgatccc tcataattat ttaatgagtg aaagctttgt tcaagctata acttactgag 57780
taggttgaat gttgatctga ttcattcctg aggtatcagg attgatgcct gaaacatcaa 57840
tcatccattg tcagatgccg taactaacta actatgaatc tcaacatagt tatatgttgc 57900
caatctagcc acggtgacta gaaccttgag atggacttag actagacatg ggtcgcgggc 57960
aatgacatat agaatctttg aaatcgacat taattaagta tgtggagatt ctttgtggag 58020
gcacggtaat gtgtctatct agcaacgcgg tcaagcatca gtctcaggca cagcccgggt 58080
gtcgtttttg gttgcaatct tccgccatcc cattccaaag gcaaacacaa acgtgcacgc 58140
cgtagctccc actgctaagt aaaaagtatg atcaacggcg agactgtaag cttttacaac 58200
ccctggaagg ttattcttgc tgaccacatc tctgaagcca gtcgcccctg ctgccgtcac 58260
ggcctgcgtg tcgacagtgg gcgcatactt gctcaggcca gttctcaaac cggacccaaa 58320
gacaaggtta gcaaagtcca ggaagagcga tcctccaaac gtctgtccaa acacggcgag 58380
agaaattccg agggcacctt gttcgggcga aagcgtgctt tggatggcga tgataggctg 58440
gccattgagt attgatgtca gcgtctagcg gttgcatgct cttcttgctt tgatacaaag 58500
ccgaaagcgt gagagatgat caaaggtttc atagcttacc gtttgcatgc cacaaccacg 58560
accgaagccc gcgataaatt ggtacatgac ccatttcaca gttgatgtat ggggctggaa 58620
ggtggatacc agacctgcgc ctatggcgac gagaacagcg ctgcctaggg cccaaggcaa 58680
atagtatcct gtctttccaa ctggtgcgtc atatgtcagt atacacgata tccaagcccg 58740
atgtcagacg gttgtggcaa gaaaggagcc atagaaatgg acggggtgga gaaaaatgtg 58800
tacgcgagtt tcacttactt gcgaagccag aaaccatagc cataatgact tgtccaagaa 58860
ttccaggcaa catgtacaca ccactcagtg tgggagaaac atccttcaca gcctggaagt 58920
agatcggtag atagtaggaa aagacaagca aggagccaga gaaaaagccc ataaataaac 58980
aagagcacca cacttgtcgt ttaccagcca ctgagccagg aatcatggca acagcatcgc 59040
caacatgacg ctcccatagc acgaacgcaa tcagagcaaa ccctccgcca cagaacaggc 59100
cgatgatgac ggaacttcgc caggtgtagg tcgaccctcc ccattctagt gcgagggaaa 59160
tcatggttgc gaaggctgca aagaccacaa agcctacaag gtccagtttg cgaagtgtgg 59220
attttatgtt ggccattggt ttgtcggtcg agagttcgct gtccgtggat gaaattcggt 59280
cgggtatggt gatgacgaga aggaggaatg cagcgacagc gccgatgggg agattgatat 59340
aaaagcctga attccaagtg agaacatgga caacaatcat aaaaaggcca aaggtcaaca 59400
tacaccatcg ccaagtggcg tgttgagtga aagcacctcc gagcagtggt ccacagacaa 59460
tggcaatctg actaactgaa aacatattgt cagacgacga accgttcgtt tggggtacat 59520
cagatcttga gatgacatac gacccatcat cactccaatc aaaacttcat atgcgaggtc 59580
agcgtgtaca cggcacccag cagacttcca aaaatcggtt cccttacctg gttgcttgtg 59640
cttaggagca gctgttgaga ggattgtgag ggctccgttg acaagacctg agcctcccat 59700
tccagcaacg gcccgcccaa caatcaacat ggtggaagat cttgcggcac cgcatagcac 59760
cgagcctagt tcaaaaatac agaggaaggc aaagaaagtg tacttcaagc ccaagagtgt 59820
atacaattta ccggccaggg gctggagagc acagctaaat atgatgttag ctaatctgtt 59880
cgtacaatga acaaggtcaa ggagaacaga gccatactta gccagaagat aagcactgcc 59940
gtaccaccct acatcgttca gagagtggaa ctcgcttgtg atatgtggga ttgcctgtgg 60000
ctggagtcaa ttgactgtgc tgcgctctgt tctgaggtag ccaccatctt accgtgacga 60060
taatggacat atcaaggagc atcaaaaatg ctacgaaagt aactgaagca accaccagcc 60120
cgagcttgag gcctgtgatg tgctgggact tggactcagt cgcttcgagc gtgtcatttt 60180
gactttcttc cttctgtggc cttggttccc cttctttagg gggtagaggt tctgacatcg 60240
cgcaattcct tccgactttt gcttcaaggg gcggtgtgaa tctctactgc gcggcgcttc 60300
tatagtacct gtgttttggt gtatgaatga tctcgctctc gttgtttcgt taaggtccgc 60360
tagcctgaag tcagattgat ggatggggat caggggaaat tggcgacgtc tttaattttg 60420
cttttctttg ttaccggaag tgttgcggta ttagcgtgtc tgggcttatt tacgacgcac 60480
aagatgcatt gaactggccc cactgctaga tctcactagt attgtggttg taatttacct 60540
atactccata ttgactgggc aggttttgaa cacaacccac acccccccat actacacatt 60600
agttttgcat attttcctgg gggccaaaaa aaccccaaaa ggcttcaata ttttgcggcc 60660
aatggagagt gtaactaatt tggcccacac tccggtggta tcaatcggat ctcactgcat 60720
atatgatgaa agcaagaggg ggcaggagat acgctcttta ttggctgtct gcgcgaagct 60780
gggcaaatgc aaataaaaag acaaacaacc agctggaaga ccgggcgaca aacatggttt 60840
acctaacacc ctcgatccca acaatgtgca tgttaatcaa tgtgctccgt ggggagtatg 60900
aactataaca tacgaagcag ccattcatgt caaaaaaaaa accaggcgaa tgggcgtcgt 60960
caacggtttc acataagtac tatattgtac taactacccg tgagactgga gagaacagtc 61020
tcgcgcgaag aaacgataag agcatcggtc atatcggtcc atctcggtct aagtgtatga 61080
gaatattccg acgtgaatcc atccgtcagt gatcaatgtc tccaagtaat tcatcatttc 61140
aattaccctc gctttactcc gtagaataca agaccttact agcgcaaaca agtgggggct 61200
aacggtgtga tctccttccg ttgcggccgc cacctcggtt ccagccgtaa tacgacgacc 61260
cgtctatcgc gaccccctag ccttggccat ttttggcgtt acagtaaagc tttggagaga 61320
aacgccaagg gaaaatgcta gccaccaatt ctataaatta ctcttcacat gcagctagta 61380
tcactggtaa gtctacgggg cacatgtaaa atttttatta ctttctaata atctttccaa 61440
gttcttttcc acggggcccc aatgcttaaa atactcaaaa gacgtgaaaa acctgcaagg 61500
ccgccagtga tatcacacgt aatgcctcaa cagcctgatt ccgagccatt atatgctgtt 61560
tgatgatctc aaattgagat ggcgagcgct ggatctggga aattggtagt gggattggta 61620
tagaaacgta agtgcagaag accatgtaat aagtacatat ggaggctatg tgatggcccg 61680
atctagtttc ttcaatatag cgctgggtat aaaaaaaagc aggggctttc tcagggtaat 61740
gtcgcagtct acaacgagtg gcgtccactg acagggaaag gcgagcgggg ctatgctacc 61800
ttcaatttcc atagaggggg gatgcaccat ctccgacaat ctatagttac tcaaacaggt 61860
acggtactaa gcaatattgt gtttcttcgc taatgcgaat atttccttat agcaacgtcg 61920
caacacattt atcgtcttcc ctgaggcctt tgttgacttg ggctcttcgt ctccggcttc 61980
gtcactccaa agcacagata ggagacgaga ggccggcgtt atggttttat tttcagcgcc 62040
aaggatttgc cacgatgtgc ttggcatatc tgataggacc tattccccct ctcccggtca 62100
gcgcattgct gatgtatgca agggaagaaa agactggtgg ttatcggtcc cacttactag 62160
acgaatagat gccgcagccc cgtgctcctg tgctatcccc aaagcagtct caatctcact 62220
caatagtcga aggcttacac gcaatgtcgt gcatgcagaa gataaggcgt gcatgaatgg 62280
gtcgagatgt gaaatgagct cgccgatatg aagattagag tgaaacgagg gaagtgcttc 62340
ggctcttcca ttgtcatttc tagtggttga gccagaccag taccaatcca ttcgtgtgct 62400
ttgcttttgt ccacaaggtt gggctttcat cacctcggat agtagcagct gggaaagtga 62460
tgtcatgatt ttgacagaca acatgtagca atgcaccgcc atgaacaagt tcttggtttg 62520
cagacaccca tctaacatgc tgctattgct gctcgtgatc acacgttctt gaagatgtag 62580
tagcaatcta ccaaaggcat tcaaaaagtc ccctatcggg tctaggaaga agctttagcg 62640
acaatcaaga ggcagtaaac aggcagaatt gaaaatctca cagcttaaaa ttttttgctt 62700
gggccattcc acagtcaccc cgtggagtat tacctctagg tcctgtgaca catccgacag 62760
actttcgaaa aggtctcgtt gcgtgttgct tgtgttggat tgtccggatg acgagttccc 62820
ctctacttcg aggtcaaaca gcgatggcga gacaggcgcc gttgcatcca aagggccttc 62880
aaagtcgtag cctagatctg gtatccccga agattcattg ctgttggcat cgtcgcgaaa 62940
tgtatttggc tgaggccagc cgccgggaaa cgactcggga tcatcaaagt tgattgatgt 63000
atcatagaat tgcagggttg ccgctgatgg ttctgataat gtttccttga gtgccgaggt 63060
gccaatatgc gtaggtggtg agcagtaagg tggaggagtc tctgccaatg atgagaagac 63120
cgtagaagat gtcgcggtca tcggttgtga ggtttctgtg gctcttgtag ttccagctgc 63180
ggcttcttta tgtaaattgc gcttgggtag cctttcgctg tacacacacc ttaatccggc 63240
ttgttgacaa cgttgacact gagcacggac taaattggca ttgctaccgg tacatttgag 63300
cttttgtgca tgacaccggt cacatgagcg tcgaaacgcg cgacggcgta ggttcgtcgg 63360
aatcgttgca tgcggcaggg acataattat tggattaaga tcaaataatg tgaggtgaga 63420
ctttgcatgt tcctggatct ttatgtattg gaattggaga gtaagctcgt gcaggagata 63480
agttcaggtc gtcttgctgg aagacttact aagttatatg caaacaagtg ttttcgagcg 63540
gacaccaaaa gccaatagtc ttactatgaa tgtcttttca gtcacccgga gaaatactct 63600
tagcctctgc tcttatgcga gctcatcaaa gctgggcata cataccccat ccagcgccac 63660
gtattacact agaaagagtt ctaaaagaaa tagattcggc cccccatctg gctatcatat 63720
atgccagatg aaatacctgt aacgtggggc ataaaaaggc aggctctagt ctaccagcag 63780
atctagtata tgcgcataag cagggacatt gaagaccaag cccaatccgg tttgacctac 63840
agcaagagaa attggcgagc aggtggactt cttttattga ctagtgctga tgctgtctac 63900
tgcgcgggac ttttgacgca ttgcggagcc ctagagactt ggaagtgcgt tgggtctccg 63960
agtgaataca gtggtgtcgc gtcagtattt gatctcgaat actttggaat ctacttttga 64020
cctgagggct ctccatatca actagctagt tgattactat attcaattgg atcaaattct 64080
ggaaatttcc accctggcac ctgggcagga cgagaaagtg ggttctaggt cgaggtccct 64140
gaggtcaaat acttatgttg cacctctata aatctctcac tttgataact catatttttc 64200
tgtatttaat acctagacac agcctcggta tcttcaaaac aagtttcagt agattcacgg 64260
aagcaaaagg tcccccttgg caaccttaca ccatttagcc acctgagcaa ttacacccat 64320
ctgaatatgc cataggtctc tcgccaaggg catccccatc ctagtccctt acgcgaatct 64380
cttataggct gctcccttca ctgacagtta gttaaagatc gaccgtagat cggattccgt 64440
aattgccacg gcccacgagt aatattacac tgaagtatcc cgttggacca ggttggtaca 64500
cccgggaaga catactgtaa cagagtgaaa actctgccca ggcggagtag tatcggaatc 64560
ctcccgtccg tcgcggcccg ccccataagt ccaggctcca ccaacgtagc agcgagcctg 64620
ccactaggac cattgtggaa tagtgaatca attcgaaatc aatctgcaac gagcggtccg 64680
ccggtgacaa tacaccgaac tagggaatgt cgcagtgagg gaggagcaaa tatggaatgt 64740
acaaaggttt cattgaatat tgattgctaa taaaattagg tgattcgtct tgtgggcaat 64800
tacagaagga cgtaaaattc agcctctggc attgcgttct taacaggact actctgtatt 64860
catatggtac tatcagtgat tgagactagg gagtatgtaa cttactgagg ggaaattttc 64920
tagtctgaaa tcccgacctt agacagctta gcaatatctc gctgtcatag gcgaggctaa 64980
attaatccag cctgcagacc aatctaacat tctgtgggat atacgaaaga ttttgggggc 65040
catcttgctc atcctatggg cctcggcctg aaatacctcc cgataggtga tttaaatcag 65100
ccgaagccct acgaaagata tggcctctag cattgtgatt actgctggtt tggaattcga 65160
atgatgttcg cgactttccg gtacagctcc caggaggaat ccttgcaagt tgaacattcc 65220
ccaagtccga cgaatcgtaa tggtcattat cgatcggcat gtgataattg ccgagcgaga 65280
aaggtatgtt tcttttggta tgcctcttgg ttccatcgca ctggatactt aggaggtcca 65340
tagccaattg atcttgcttg agttcccgat aataatcaaa atgatgtgct aacttgctat 65400
tttagcttcg atgcgatggt cagagagaag ggtgcgaacg atgccgtgat cgccgggttt 65460
cttgtgacta ctccgaggga agactagatg gaaagcgacg gcgaaaggat caggtggctg 65520
gtctgatgat ggaaaatcct acatcagatg gacaagatag cagcttcaaa gacctaccta 65580
gtcatatgcc tattcaaaat ccgccaccat ccgactcaac ggagtcaatg gagctgtcaa 65640
gcccctccgt cgcgaatctg atggacatga cgccctttga catcatgtca ttagacctct 65700
tcatcaacag ttcgccagat gaacggtcca gtttggaaaa tgggtctatc cgaacgacaa 65760
gtactactga cagccatagg gtaaataagc acggtaaaat ccctaaacct catacttgcc 65820
ttgatcgcga ataaccttgc taatccacgc cttcgaaaca aaccagtgaa tataccagat 65880
tgctcaatga atcagattat cggcctctca ccagcgctca ccccagcggt actcagtcat 65940
caaacccata aatccaatcc tgcggacaat gggctttccg ttcatgtaga tacctaccaa 66000
tccaccacgc acctgactcc acaccaaccg acgacacatc aatcggctac acactcaccg 66060
actgcacacc aaccgactgc acaccaaccg actgcacacc aaccgactgc acaccaaccg 66120
actgcacacc aaccgactgc acaccaaccg actgcacacc aaccgactgc acaccaaccg 66180
actgcacacc aaccgactgc acaccaaccg actgcacacc aaccgactgc acaccaaccg 66240
actgcacacc aaccgactgc acaccaaccg actgcacacc aaccgactgc acaccaaccg 66300
actgcacacc aaccgactgc acaccaaccg actgcacacc aaccgactgc acaccaaccg 66360
actgcacacc aaccgactgc acaccaaccg actgcacacc aaccgactgc acaccaacaa 66420
tcttcaatag aacactgcca ctgtgtagat gacgccctcc aggtcattga gaagatagag 66480
ggaatcacga gacaggtcac gcctttgatt ccggactatg cgctagtagt tcaaagaacg 66540
gcaatggact actgcagtag gatcatggaa tgcggcgttt gcagcatgat ctctaggaat 66600
ataatgttgg ctctggttgt gtgtgagaag ctcgctgttc ttttgcacgg gacgctgctg 66660
ccggggggtt ggagaaagag tatacaaagt cagctccacg gtcattaccc cgctgtgctc 66720
agatatccaa aacggaccga ggaatctgtc attttagggt cgtatagaag cagcgaccag 66780
aaggaatggg ccgctgtagt tactttgctg ttcacatttc aggaacatcg tctgcagaag 66840
ttgatcgggg atctgaaaca cctggcagcc agcaaccact ggcatgtgca cgtatccatg 66900
ttggagttaa tggaaaaagg gagcgcatta ccccagacta tagggacaag ctagacaatt 66960
ggattccttg tagacgattt agtttctgtt tctttttgcc tctaatgctc cttcacccct 67020
tgtgctcatt tcttcgagat tctggtctaa atttatgtct gttcctcttc aaaattaagt 67080
tcaatgagta caactgcgat tgttctgctt tcttgctgtc attgaccagc acatgaattg 67140
cgttctcatt tgagctggat acgaggatca tgatttaata gtatgcttag aaaaacctca 67200
aatctcaagt tagttgtgta cactactcat caaattcaga tggtttttat ttgattaatc 67260
cacaaaagga ggaatacaca gatattatgg acgatatcac tatattactt ggaacttagt 67320
tgttccgaga ctttttctca ttagttggac catttgaata tgtatcattc tcaagatccc 67380
tagatctgtt atttgctccg atagtaggac caggttattc attgatcggg gttcaacaaa 67440
ggtcctggac ttgacgagga ccccagaagg acctagatga acggctggag gacctggccg 67500
agtgtccgaa aaagaagctg acggtgtggt tgaaggtgtg gttgaagcag tggccgaaga 67560
agcggccgaa ggctggtcga agaagaaaca agacaacagg ggcgagaaac agatcagaac 67620
ctagaagtga ttacacaaga aaggcccgag aagccacctg agaactcgct ctatcaaacg 67680
ttttaccata tgccagagga tatacttggc gactttctca gtagagggct tgaggggcag 67740
aagatgaggc cagacgcgag gctacattag cagcaagaat aatcccggcg agagggttta 67800
gagggggcaa ggtgaagaaa ttgcgcaaag catagaagag gtcctgtagg ggaaattgac 67860
gttagggcta gggtttaggg gtagttttga tcgatttctt tgtattcctc ttctgtatct 67920
ttgatttggt cttaggtctt attagcttta atatcattaa gggtatcatt atagatagga 67980
ggattaataa cagcgttacg cacagctaac tggttgtcgc taggttagca cgaatcggga 68040
tatacttctc tagtgtcctg cagtctgcca actgtcaacg atctgtctct caaccgtacc 68100
tttgccttac gggtcttatg cgggctaagt ccttttgagg gtatcgagga gtgatgccag 68160
gcagtgcgct gaatagatct ataccgaagt attggtctat tcgcagtggt tgtcaggtta 68220
taatcaaaca agagagtctg tagttcaaaa ggtaatcaca agtaacaatg tatgattgaa 68280
gacgaagaac taaactagat acatgaatga gtgtccttat atatccttga gttcttcctg 68340
cgtagatgtg tagaaggtag gttggtagat ttgccttggc aaaatctact cgtcgaccgt 68400
ctaccgttct actacttgca tgatcacgtg ttctgtggtt cccaaaatgg tggtttctgt 68460
caaagtgcaa ggtcaaatac atggatttac aaggtattat accatgcaaa tcatgtgact 68520
tcgagtacca tgcataccat atattacgtt tagtcatcat taccgctcag attgttgaaa 68580
tagcgggttt tgtcatttta gttaattaga gttcttcatc tatgccattt gtacccatac 68640
gttgcaatac agacagattt ctgtcagttt ccggcgcagg ggaatgttgt taccgatagt 68700
aacatatgta acggatatcc tctgccggtg ggtcatgatc agggcggatc atgcccttga 68760
tccctgagca tgagcatgat cgtggtttct tttttcctcg aacacctggg gacgcctggg 68820
tataggatgt tgcacgcgat ctgatgacag ataaatcggt tggttctcgg tggcccatca 68880
gtaagtctcc acattgattg gtgactagca tgcccgtaac aatatccaac agacaatttt 68940
gattgcaagt gactacctac ccaccctctt caacattagt catttccacc ggagaaaact 69000
atcctaacca cctgcgcatt ttaagcagca cttgtgtaga atatacccaa aaaaccaaaa 69060
agaaaaacac ctacaacacc tacctaccta ccatgccgtc tatcaatccc caccaccaac 69120
actttcatca tactcatcca ccctcctaaa cagccccatc ccgttcccca cctcctacct 69180
tcctaatggc atccaacaac gcataagtcc ccaatatcgc ctccatgccg cggtcacttg 69240
ttccatacga caactatacc tcgccctctt ctgtacctgc tccaatccca gtctgatcac 69300
cacctttcac aaatacattg agaccaaagt atccattgcc aggcttccaa gcaaccactt 69360
ccccattttg ctccatgtga ttccagagct gatgcgtctt tattgaactc acaaacggaa 69420
acttccgccc catccgcttc ttataaaccg atatctcatc cacaggccgt agcagccacc 69480
acgaagctcg tgttccgact atgtagatgc tgcaagggag ggatgtgatc catgcaaaac 69540
gtgcacccca tacagccctc tttttcgcct ggcgccagca tgaaatggta aaggacgagt 69600
tgtttgcgtt tgtagaagag gacgacgagg gagacttctg ttccttgctc ggtgtcgaat 69660
ttgaagcggg aggcgttggg tagagctccg caaagcccat aaagcccata gcccaaccca 69720
acccaacccg caaatgggct gggctttggg ccctaccttc gagcccaccg gtgggctacg 69780
ggcctaagga gaagcccaat gcgggttaat gggcccccaa aatgggcccc aaacagtaca 69840
aatatgccaa gaattcagaa gttgaacacc cttttcgggt tttttaaatt acctttcgtt 69900
ttaccccgtt tataggcttt attctaaagg taatatttta ttgatttaaa tggtttagaa 69960
ttaattacta gttatacctc taaaccacgt ttaaaaacgc gataaaacac gtcctttaaa 70020
taatttataa attacagaag ttcacttaga aagtagtagt actcctatct agatcctaaa 70080
tatatatcaa ggagtaaaat aaccttttta tagtatctcg acctctacta gtcggattgt 70140
ctttgaaatt aaaatatata cttataacta tagctattgt tattataaac gctaaatttg 70200
aattttatat gactagtaaa agggtcagaa tacaatattg tataccgatt acaagatgcc 70260
ggttgaaccc cttttaatgg gctttaatgg gggccttatg ggcccccttg atgggctggg 70320
agactttcac cgtcatgatc aactctggga aggagaccac gtatcttcgg gaaggcaagg 70380
ggaagcggat ccagtcatca atctcatgaa tgaatttgct ctaagcagtc tacttgaacg 70440
aggcacaaag acatggtacg gtgtaggaca gagtggagac tgcgagtcta ccatcgatct 70500
ccgcctggtg tcggaaattt ttttattttt cacggtcgcg tcatgaagga agcctaatac 70560
cgcaaatggc aacaagagaa tactgtagcc tgtatatcgc ttcggcagtt gaaccctgga 70620
ttgaggtaca agtgtgatag ttcatctata tgaggaaatc cagctatttg tagttgcagc 70680
agctcatctc cctgctgcct agcggagggt ctgcctaaca ggcagccact cctataggct 70740
atagatctat atacatcacg tgacctagga tccaactctc cccctgtgcc aaggactcga 70800
aggggcagcg gcgtccacat tccctatcct aataagtata ccggaaagac cgtttttctt 70860
tatcagttag atccgaaaat gcaacaactt ccgatgtctc cacagttgac tgggcttcct 70920
tatcacggcg gttgttttcc cattggcaaa gaactccata ggaaataatg gcgactatag 70980
ccacaactag acaaccgaga agaccctcat atcctcgcga atatgatggt gcatcgtcgg 71040
aacggaaaca ctggggacca atgatgtttc caatacaata cgccaagaag aagatggcgt 71100
tcatggtcaa tttcttgcta tggccgctgg tgttggccat tggaagcgaa gtcgacagca 71160
cgtatggcgc ccaataggtg tagaagacgt agtatgctgc cagaagacct tgctggttct 71220
cacgtggcag cttccacatt aggatggcac agaccatggg aactagattg gccacggcga 71280
taatgttgca acgggagttg ggcacgctag cagcaatgaa acctagcagg atctgccaca 71340
ccgtcgcaag cacaccggtg gggataccca acacggtagt gatcaacggg gaatacccca 71400
gaccggtcac gataatagcc gaaaaggtca ccagaccacc attagggatg ttctgggcca 71460
acgaaaagag cgccagaagc caagtcttgg ggtcacttaa gcactcgcgc acttggtacc 71520
acttgatggt tttatcttcc atgccggtat tgttgtcttt gacgcgctcg aggcagacga 71580
atttctcacg atccgagaaa taccagcatt gcacagggga atcgggcaag aatatgtaca 71640
atacaccagc ccagaggacg gagaatgcac ccaacacaat gaaaagcaat ctccagggtg 71700
ctaatgccgt gtttgtttgg ccgataccgt agctgaccac gcccgagaag acggaggaga 71760
gctggttaaa ccaaaacgcg acacgaagtg gctgctcact tgtcttccac cacataaccg 71820
tcaaaatgct ggaaattggg aacacggcgg cttctgtcat gcccatcaag aagcgcaccg 71880
tagctaagcc agcaaagttc tgtgttgccg cagtacacag tagcagaact gcccacccca 71940
agaccatgcc aacatacagc ttggccacag gaagtcgctg aatgagaagc gctgcagggt 72000
actcaaaggc gaggtatcca aagtagaaga ttgagcctac ccaagagtac tcatcgccag 72060
tcaagtgggt gtctttcttc atgccgtaga tggccgcgtt cgagatgatg actttatcaa 72120
tggcagccaa aaccactgta accatgatc 72149
<210> 2
<211> 9096
<212> DNA
<213> Penicillium citrinum
<220>
<221> CDS
<222> (1)..(9096)
<400> 2
atg gat caa gcc aac tat cca aac gag cca att gtg gta gtg gga agc 48
Met Asp Gln Ala Asn Tyr Pro Asn Glu Pro Ile Val Val Val Gly Ser
1 5 10 15
ggt tgt cgg ttt cca ggt ggt gtc aac aca cca tca aaa ctt tgg gag 96
Gly Cys Arg Phe Pro Gly Gly Val Asn Thr Pro Ser Lys Leu Trp Glu
20 25 30
ctg ctc aaa gag ccc cgg gat gta cag acc aag atc cct aag gag aga 144
Leu Leu Lys Glu Pro Arg Asp Val Gln Thr Lys Ile Pro Lys Glu Arg
35 40 45
ttt gac gtc gat aca ttt tac agc ccc gat ggc act cac ccc ggg cgc 192
Phe Asp Val Asp Thr Phe Tyr Ser Pro Asp Gly Thr His Pro Gly Arg
50 55 60
acg aac gca ccc ttt gca tac ttg ctg cag gag gat cta cgc ggt ttt 240
Thr Asn Ala Pro Phe Ala Tyr Leu Leu Gln Glu Asp Leu Arg Gly Phe
65 70 75 80
gat gcc tct ttc ttc aac atc caa gct gga gag gcc gaa acg att gac 288
Asp Ala Ser Phe Phe Asn Ile Gln Ala Gly Glu Ala Glu Thr Ile Asp
85 90 95
cca cag caa agg ctg ctg ctg gag acg gtc tat gaa gct gta tcc aac 336
Pro Gln Gln Arg Leu Leu Leu Glu Thr Val Tyr Glu Ala Val Ser Asn
100 105 110
gca ggc cta cgg atc caa ggc ctt caa gga tcc tct act gct gtg tac 384
Ala Gly Leu Arg Ile Gln Gly Leu Gln Gly Ser Ser Thr Ala Val Tyr
115 120 125
gtc ggt atg atg acg cat gac tat gag act atc gtg acg cgt gaa ttg 432
Val Gly Met Met Thr His Asp Tyr Glu Thr Ile Val Thr Arg Glu Leu
130 135 140
gat agt att cct aca tac tct gcc acg ggg gta gct gtc agt gtg gcc 480
Asp Ser Ile Pro Thr Tyr Ser Ala Thr Gly Val Ala Val Ser Val Ala
145 150 155 160
tcc aac cgt gta tca tac ttc ttc gac tgg cat ggg ccg agt atg acg 528
Ser Asn Arg Val Ser Tyr Phe Phe Asp Trp His Gly Pro Ser Met Thr
165 170 175
atc gac aca gcc tgt agt tca tcc tta gct gcc gtg cat ctg gcc gtc 576
Ile Asp Thr Ala Cys Ser Ser Ser Leu Ala Ala Val His Leu Ala Val
180 185 190
caa cag ctt aga acg ggc gag agt acc atg gcg gtt gca gcc ggt gcg 624
Gln Gln Leu Arg Thr Gly Glu Ser Thr Met Ala Val Ala Ala Gly Ala
195 200 205
aat ctg ata ttg ggc ccc atg acc ttt gta atg gag agc aaa ttg aac 672
Asn Leu Ile Leu Gly Pro Met Thr Phe Val Met Glu Ser Lys Leu Asn
210 215 220
atg ctg tcc ccc aat ggt aga tct cga atg tgg gat gct gct gcc gat 720
Met Leu Ser Pro Asn Gly Arg Ser Arg Met Trp Asp Ala Ala Ala Asp
225 230 235 240
gga tat gcc aga gga gaa ggt gtt tgc tct att gtc ctg aaa acg ctg 768
Gly Tyr Ala Arg Gly Glu Gly Val Cys Ser Ile Val Leu Lys Thr Leu
245 250 255
agc cag gca ctg cgc gac ggg gac agt atc gag tgt gtt atc cga gag 816
Ser Gln Ala Leu Arg Asp Gly Asp Ser Ile Glu Cys Val Ile Arg Glu
260 265 270
acc ggt atc aac caa gat ggc cga acg aca ggt atc aca atg cca aac 864
Thr Gly Ile Asn Gln Asp Gly Arg Thr Thr Gly Ile Thr Met Pro Asn
275 280 285
cat agc gca caa gaa gcc ctc att cgg gcc aca tat gcc aag gct ggt 912
His Ser Ala Gln Glu Ala Leu Ile Arg Ala Thr Tyr Ala Lys Ala Gly
290 295 300
ctt gat att acc aac ccc cag gaa cgc tgc cag ttc ttt gaa gcc cat 960
Leu Asp Ile Thr Asn Pro Gln Glu Arg Cys Gln Phe Phe Glu Ala His
305 310 315 320
gga act ggt aca cca gcc ggt gac cca cag gaa gct gag gct att gca 1008
Gly Thr Gly Thr Pro Ala Gly Asp Pro Gln Glu Ala Glu Ala Ile Ala
325 330 335
aca gcc ttc ttc gga cac aag gat gga aca atc gac agc gac ggc gag 1056
Thr Ala Phe Phe Gly His Lys Asp Gly Thr Ile Asp Ser Asp Gly Glu
340 345 350
aaa gat gag ctt ttt gtc ggc agc atc aag aca gtt ctc ggt cac acg 1104
Lys Asp Glu Leu Phe Val Gly Ser Ile Lys Thr Val Leu Gly His Thr
355 360 365
gaa ggc act gct ggt att gcg ggc tta atg aag gca tcg ttt gct gta 1152
Glu Gly Thr Ala Gly Ile Ala Gly Leu Met Lys Ala Ser Phe Ala Val
370 375 380
cga aat ggc gtg atc ccg cca aac ctg ctg ttt gag aag atc agt ccc 1200
Arg Asn Gly Val Ile Pro Pro Asn Leu Leu Phe Glu Lys Ile Ser Pro
385 390 395 400
cgt gtc gct ccg ttc tat acg cac ttg aaa att gca acg gag gcc aca 1248
Arg Val Ala Pro Phe Tyr Thr His Leu Lys Ile Ala Thr Glu Ala Thr
405 410 415
gaa tgg ccg att gtt gcg ccc ggg cag cct cgc aga gtc agc gtt aat 1296
Glu Trp Pro Ile Val Ala Pro Gly Gln Pro Arg Arg Val Ser Val Asn
420 425 430
tca ttt gga ttt ggt ggt aca aat gcc cat gct att atc gaa gag tat 1344
Ser Phe Gly Phe Gly Gly Thr Asn Ala His Ala Ile Ile Glu Glu Tyr
435 440 445
atg gct cct cca cac aag ccg aca gca gtg gta aca gag gtg acc tca 1392
Met Ala Pro Pro His Lys Pro Thr Ala Val Val Thr Glu Val Thr Ser
450 455 460
gat gca gat gca tgc agc ttg ccc ctt gtg ctt tca tcg aag tcg cag 1440
Asp Ala Asp Ala Cys Ser Leu Pro Leu Val Leu Ser Ser Lys Ser Gln
465 470 475 480
cgc tcc atg aag gca acg cta gaa aat atg ctc caa ttt ctg gaa acg 1488
Arg Ser Met Lys Ala Thr Leu Glu Asn Met Leu Gln Phe Leu Glu Thr
485 490 495
cat gat gac gtg gac atg cat gat atc gca tat acc tta ctt gag aaa 1536
His Asp Asp Val Asp Met His Asp Ile Ala Tyr Thr Leu Leu Glu Lys
500 505 510
cgg tct atc ttg ccc ttc cgt cgt gcg att gca gca cac aac aag gaa 1584
Arg Ser Ile Leu Pro Phe Arg Arg Ala Ile Ala Ala His Asn Lys Glu
515 520 525
gta gcc cgc gcg gca ctg gag gct gcc atc gcg gac ggt gag gtc gtc 1632
Val Ala Arg Ala Ala Leu Glu Ala Ala Ile Ala Asp Gly Glu Val Val
530 535 540
acc gac ttc cgc acc gac gcg aat gac aac cct cgc gta cta ggt gtc 1680
Thr Asp Phe Arg Thr Asp Ala Asn Asp Asn Pro Arg Val Leu Gly Val
545 550 555 560
ttt act ggc caa ggt gca cag tgg ccg ggc atg ctg aag aag ctc atg 1728
Phe Thr Gly Gln Gly Ala Gln Trp Pro Gly Met Leu Lys Lys Leu Met
565 570 575
gtg ggt atg cca ttt gtg aga ggc att ctc gaa gag ctg gat aat tca 1776
Val Gly Met Pro Phe Val Arg Gly Ile Leu Glu Glu Leu Asp Asn Ser
580 585 590
ctg caa aca ctg cct gaa aag tat cgg cct acg tgg aca ctg tat gac 1824
Leu Gln Thr Leu Pro Glu Lys Tyr Arg Pro Thr Trp Thr Leu Tyr Asp
595 600 605
cag ctc atg ctt gaa ggg gat gcc tca aac gtc aga ctc gcc agc ttc 1872
Gln Leu Met Leu Glu Gly Asp Ala Ser Asn Val Arg Leu Ala Ser Phe
610 615 620
tcc cag cct cta tgc tgc gcc gta caa atc gtt ctg gtc cga ctt ctc 1920
Ser Gln Pro Leu Cys Cys Ala Val Gln Ile Val Leu Val Arg Leu Leu
625 630 635 640
gct gca gct ggt atc gag ttc agt gca att gtc ggc cac agt tca ggt 1968
Ala Ala Ala Gly Ile Glu Phe Ser Ala Ile Val Gly His Ser Ser Gly
645 650 655
gag att gcc tgt gcc ttt gcg gca gga ttc atc agt gcc act caa gct 2016
Glu Ile Ala Cys Ala Phe Ala Ala Gly Phe Ile Ser Ala Thr Gln Ala
660 665 670
atc cgt att gcg cat ctg cgt gga gtt gtg tcc gcg gag cat gcc tct 2064
Ile Arg Ile Ala His Leu Arg Gly Val Val Ser Ala Glu His Ala Ser
675 680 685
tct cca agc ggc cag aca ggc gct atg cta gcg gca ggt atg tcg tac 2112
Ser Pro Ser Gly Gln Thr Gly Ala Met Leu Ala Ala Gly Met Ser Tyr
690 695 700
gat gac gca aag gaa cta tgc gag ctc gaa gcc ttt gag ggt cgg gtc 2160
Asp Asp Ala Lys Glu Leu Cys Glu Leu Glu Ala Phe Glu Gly Arg Val
705 710 715 720
tgc gtc gcc gct agc aat tca ccg gat agt gtg acc ttc tcc ggc gac 2208
Cys Val Ala Ala Ser Asn Ser Pro Asp Ser Val Thr Phe Ser Gly Asp
725 730 735
atg gat gct atc cag cac gtt gaa ggt gtc ttg gag gat gaa tcc act 2256
Met Asp Ala Ile Gln His Val Glu Gly Val Leu Glu Asp Glu Ser Thr
740 745 750
ttt gcc aga atc ttg aga gtt gac aag gcc tac cat tcg cat cac atg 2304
Phe Ala Arg Ile Leu Arg Val Asp Lys Ala Tyr His Ser His His Met
755 760 765
cac cca tgc gca gct cca tat gtc aag gca ttg ctg gag tgc gac tgt 2352
His Pro Cys Ala Ala Pro Tyr Val Lys Ala Leu Leu Glu Cys Asp Cys
770 775 780
gct gtt gcc gat ggc caa ggt aac gat agt gtt gct tgg ttc tct gcc 2400
Ala Val Ala Asp Gly Gln Gly Asn Asp Ser Val Ala Trp Phe Ser Ala
785 790 795 800
gtc cac gag acc agc aag caa atg act gta cag gat gtg atg ccc gct 2448
Val His Glu Thr Ser Lys Gln Met Thr Val Gln Asp Val Met Pro Ala
805 810 815
tat tgg aaa gac aat ctc gtc tct ccg gtc ttg ttc tcg cag gct gtg 2496
Tyr Trp Lys Asp Asn Leu Val Ser Pro Val Leu Phe Ser Gln Ala Val
820 825 830
cag aaa gca gtc atc act cat cgt cta atc gac gtc gcc atc gaa att 2544
Gln Lys Ala Val Ile Thr His Arg Leu Ile Asp Val Ala Ile Glu Ile
835 840 845
ggc gcc cac cct gct ctc aag ggt ccg tgt cta gcc acc atc aag gat 2592
Gly Ala His Pro Ala Leu Lys Gly Pro Cys Leu Ala Thr Ile Lys Asp
850 855 860
gct ctt gcc ggt gtg gag ctg ccg tat acc ggg tgc ttg gca cga aac 2640
Ala Leu Ala Gly Val Glu Leu Pro Tyr Thr Gly Cys Leu Ala Arg Asn
865 870 875 880
gtt gac gat gtg gac gct ttt gct gga ggt ctg gga tac att tgg gag 2688
Val Asp Asp Val Asp Ala Phe Ala Gly Gly Leu Gly Tyr Ile Trp Glu
885 890 895
cgt ttc gga gtt cgg agt atc gac gcc gag ggc ttc gta caa caa gtc 2736
Arg Phe Gly Val Arg Ser Ile Asp Ala Glu Gly Phe Val Gln Gln Val
900 905 910
cgg ccc gat cgt gcc gtt caa aac ctg tca aag tca ttg ccc aca tac 2784
Arg Pro Asp Arg Ala Val Gln Asn Leu Ser Lys Ser Leu Pro Thr Tyr
915 920 925
tct tgg gat cat act cgt caa tac tgg gca gaa tct cgc tcc acc cgc 2832
Ser Trp Asp His Thr Arg Gln Tyr Trp Ala Glu Ser Arg Ser Thr Arg
930 935 940
cag cat ctt cgt gga ggt gcg ccc cat ctt ctg ctt gga aag ctt tct 2880
Gln His Leu Arg Gly Gly Ala Pro His Leu Leu Leu Gly Lys Leu Ser
945 950 955 960
tct tac agc aca gca tcg acc ttc cag tgg aca aac ttc atc agg ccc 2928
Ser Tyr Ser Thr Ala Ser Thr Phe Gln Trp Thr Asn Phe Ile Arg Pro
965 970 975
cgg gat ctg gaa tgg ctc gac ggt cat gcg cta caa ggc cag act gtg 2976
Arg Asp Leu Glu Trp Leu Asp Gly His Ala Leu Gln Gly Gln Thr Val
980 985 990
ttc ccc gct gct ggg tac ata att atg gcc atg gaa gct gcc atg aag 3024
Phe Pro Ala Ala Gly Tyr Ile Ile Met Ala Met Glu Ala Ala Met Lys
995 1000 1005
gtg gct ggt gag cgt gcc gcc caa gtt cag ctc ctg gaa atc ttg gac 3072
Val Ala Gly Glu Arg Ala Ala Gln Val Gln Leu Leu Glu Ile Leu Asp
1010 1015 1020
atg agc atc aac aaa gcc atc gtg ttt gaa gat gaa aac acc tcc gtg 3120
Met Ser Ile Asn Lys Ala Ile Val Phe Glu Asp Glu Asn Thr Ser Val
1025 1030 1035 1040
gag ctg aac ttg aca gcc gaa gtc acc agt gac aat gat gcg gat ggc 3168
Glu Leu Asn Leu Thr Ala Glu Val Thr Ser Asp Asn Asp Ala Asp Gly
1045 1050 1055
caa gtc acg gtc aaa ttt gtt att gat tcc tgt ctg gca aag gag agt 3216
Gln Val Thr Val Lys Phe Val Ile Asp Ser Cys Leu Ala Lys Glu Ser
1060 1065 1070
gag ctt tcg aca tcc gcc aaa ggc caa atc gtc ata acc ctt ggc gag 3264
Glu Leu Ser Thr Ser Ala Lys Gly Gln Ile Val Ile Thr Leu Gly Glu
1075 1080 1085
gca tca ccg tca tcg cag ctt ttg ccg cca cct gag gaa gag tac ccc 3312
Ala Ser Pro Ser Ser Gln Leu Leu Pro Pro Pro Glu Glu Glu Tyr Pro
1090 1095 1100
cag atg aac aat gtc aac atc gat ttc ttc tat cgg gaa ctt gac ctc 3360
Gln Met Asn Asn Val Asn Ile Asp Phe Phe Tyr Arg Glu Leu Asp Leu
1105 1110 1115 1120
ctt ggg tat gac tac agc aaa gac ttc cgt cgt ttg cag acc atg aga 3408
Leu Gly Tyr Asp Tyr Ser Lys Asp Phe Arg Arg Leu Gln Thr Met Arg
1125 1130 1135
agg gcc gac tcc aaa gct agc ggc acc ttg gct ttc ctt cca ctt aag 3456
Arg Ala Asp Ser Lys Ala Ser Gly Thr Leu Ala Phe Leu Pro Leu Lys
1140 1145 1150
gat gaa ttg cgc aat gag ccc ctc ttg ctc cac cca gcg ccc ctg gac 3504
Asp Glu Leu Arg Asn Glu Pro Leu Leu Leu His Pro Ala Pro Leu Asp
1155 1160 1165
atc gcg ttc cag act gtc att gga gcg tat tcc tct cca gga gat cgt 3552
Ile Ala Phe Gln Thr Val Ile Gly Ala Tyr Ser Ser Pro Gly Asp Arg
1170 1175 1180
cgc cta cgc tca ttg tac gtg cct act cac gtt gac aga gtg act ctg 3600
Arg Leu Arg Ser Leu Tyr Val Pro Thr His Val Asp Arg Val Thr Leu
1185 1190 1195 1200
att cca tcg ctc tgt ata tcg gcg ggt aat tct ggt gaa acc gag ctt 3648
Ile Pro Ser Leu Cys Ile Ser Ala Gly Asn Ser Gly Glu Thr Glu Leu
1205 1210 1215
gcg ttt gac aca atc aac aca cac gac aag ggt gat ttc ctg agc ggc 3696
Ala Phe Asp Thr Ile Asn Thr His Asp Lys Gly Asp Phe Leu Ser Gly
1220 1225 1230
gac atc acg gtg tac gat tcg acc aag aca acg ctt ttc caa gtt gat 3744
Asp Ile Thr Val Tyr Asp Ser Thr Lys Thr Thr Leu Phe Gln Val Asp
1235 1240 1245
aac att gtc ttt aag cct ttc tct ccc ccg act gct tcg acc gac cac 3792
Asn Ile Val Phe Lys Pro Phe Ser Pro Pro Thr Ala Ser Thr Asp His
1250 1255 1260
cga atc ttc gca aag tgg gtc tgg gga ccc ctc acg ccc gaa aaa ctg 3840
Arg Ile Phe Ala Lys Trp Val Trp Gly Pro Leu Thr Pro Glu Lys Leu
1265 1270 1275 1280
ctg gag gac cct gcg acg ttg atc ata gct cgg gac aag gag gac att 3888
Leu Glu Asp Pro Ala Thr Leu Ile Ile Ala Arg Asp Lys Glu Asp Ile
1285 1290 1295
ctg acc atc gag cga atc gtt tac ttc tac atc aaa tcc ttc cta gcc 3936
Leu Thr Ile Glu Arg Ile Val Tyr Phe Tyr Ile Lys Ser Phe Leu Ala
1300 1305 1310
cag ata acc ccc gac gac cgt caa aat gcc gac ctc cat tcc cag aag 3984
Gln Ile Thr Pro Asp Asp Arg Gln Asn Ala Asp Leu His Ser Gln Lys
1315 1320 1325
tac att gaa tgg tgt gac cag gtt cag gcc gat gct cgg gct ggc cac 4032
Tyr Ile Glu Trp Cys Asp Gln Val Gln Ala Asp Ala Arg Ala Gly His
1330 1335 1340
cat cag tgg tac cag gag tct tgg gag gag gac act tct gtt cac att 4080
His Gln Trp Tyr Gln Glu Ser Trp Glu Glu Asp Thr Ser Val His Ile
1345 1350 1355 1360
gag caa atg tgt gaa agc aac tcg tcc cac cca cat gtg cgc ctg atc 4128
Glu Gln Met Cys Glu Ser Asn Ser Ser His Pro His Val Arg Leu Ile
1365 1370 1375
caa agg gta ggc aaa gaa tta att tca att gtt cgc ggg aac ggg gat 4176
Gln Arg Val Gly Lys Glu Leu Ile Ser Ile Val Arg Gly Asn Gly Asp
1380 1385 1390
cct ttg gat atc atg aac cgc gat ggg ttg ttc acc gag tac tat acc 4224
Pro Leu Asp Ile Met Asn Arg Asp Gly Leu Phe Thr Glu Tyr Tyr Thr
1395 1400 1405
aac aag ctc gcc ttt ggc tca gca ata cac gtc gtt cag gat ctg gtt 4272
Asn Lys Leu Ala Phe Gly Ser Ala Ile His Val Val Gln Asp Leu Val
1410 1415 1420
agc caa att gct cat cgc tac caa tcc att gat atc ctt gag atc ggc 4320
Ser Gln Ile Ala His Arg Tyr Gln Ser Ile Asp Ile Leu Glu Ile Gly
1425 1430 1435 1440
ttg ggt aca ggc atc gcc acg aag cgc gtt ctt gca tca cct caa ctt 4368
Leu Gly Thr Gly Ile Ala Thr Lys Arg Val Leu Ala Ser Pro Gln Leu
1445 1450 1455
ggt ttc aac agt tac act tgc act gac atc tcg gcg gat gtt att ggc 4416
Gly Phe Asn Ser Tyr Thr Cys Thr Asp Ile Ser Ala Asp Val Ile Gly
1460 1465 1470
aag gcc cgt gaa caa ctt tcc gaa ttc gac ggt ctc atg cag ttt gag 4464
Lys Ala Arg Glu Gln Leu Ser Glu Phe Asp Gly Leu Met Gln Phe Glu
1475 1480 1485
gca cta gac atc aac aga agc cca gca gag caa gga ttc aag cct cac 4512
Ala Leu Asp Ile Asn Arg Ser Pro Ala Glu Gln Gly Phe Lys Pro His
1490 1495 1500
tcc tac gat ctg att att gca tcc gat gtc ctc cat gcc agc tcc aac 4560
Ser Tyr Asp Leu Ile Ile Ala Ser Asp Val Leu His Ala Ser Ser Asn
1505 1510 1515 1520
ttc gag gaa aaa ttg gct cac ata agg tcc ttg ctc aag ccg ggt ggt 4608
Phe Glu Glu Lys Leu Ala His Ile Arg Ser Leu Leu Lys Pro Gly Gly
1525 1530 1535
cac ttg gtt act ttc ggg gtc acc cat cgc gag cct gct cgc ctc gcc 4656
His Leu Val Thr Phe Gly Val Thr His Arg Glu Pro Ala Arg Leu Ala
1540 1545 1550
ttc atc tct ggg ctt ttc gct gat cga tgg act gga gaa gac gaa act 4704
Phe Ile Ser Gly Leu Phe Ala Asp Arg Trp Thr Gly Glu Asp Glu Thr
1555 1560 1565
cgt gct ttg agt gcc tcg ggg tcc gtt gac caa tgg gag cat acc ctc 4752
Arg Ala Leu Ser Ala Ser Gly Ser Val Asp Gln Trp Glu His Thr Leu
1570 1575 1580
aag aga gtt ggg ttc tct ggc gtc gat agt cgg aca ctt gat cga gag 4800
Lys Arg Val Gly Phe Ser Gly Val Asp Ser Arg Thr Leu Asp Arg Glu
1585 1590 1595 1600
gat gat ttg atc ccg tct gtc ttc agt aca cat gct gtg gat gcc acc 4848
Asp Asp Leu Ile Pro Ser Val Phe Ser Thr His Ala Val Asp Ala Thr
1605 1610 1615
gtt gag cgt ttg tat gat cca ctt tct gct cca ttg aag gac tca tac 4896
Val Glu Arg Leu Tyr Asp Pro Leu Ser Ala Pro Leu Lys Asp Ser Tyr
1620 1625 1630
ccg cca tta gtg gtt atc ggt ggc gaa tcg aca aaa acc gaa cgc att 4944
Pro Pro Leu Val Val Ile Gly Gly Glu Ser Thr Lys Thr Glu Arg Ile
1635 1640 1645
ttg aac gac atg aaa gct gcc cta ccg cat aga cac atc cac tcc gtc 4992
Leu Asn Asp Met Lys Ala Ala Leu Pro His Arg His Ile His Ser Val
1650 1655 1660
aag cgg ctg gaa agt gtt ctc gac gac ccg gcc ttg cag cct aag tcg 5040
Lys Arg Leu Glu Ser Val Leu Asp Asp Pro Ala Leu Gln Pro Lys Ser
1665 1670 1675 1680
act ttt gtc atc ctc tcg gaa ctt gat gat gaa gtg ttt tgc aac ctt 5088
Thr Phe Val Ile Leu Ser Glu Leu Asp Asp Glu Val Phe Cys Asn Leu
1685 1690 1695
gaa gag gac aag ttt gag gca gtc aag tct ctt ctc ttc tac gcc gga 5136
Glu Glu Asp Lys Phe Glu Ala Val Lys Ser Leu Leu Phe Tyr Ala Gly
1700 1705 1710
cgc atg atg tgg ctg aca gag aat gcc tgg att gat cat ccc cac cag 5184
Arg Met Met Trp Leu Thr Glu Asn Ala Trp Ile Asp His Pro His Gln
1715 1720 1725
gcc agc acc atc gga atg ttg agg aca atc aag ctc gag aac cct gac 5232
Ala Ser Thr Ile Gly Met Leu Arg Thr Ile Lys Leu Glu Asn Pro Asp
1730 1735 1740
ttg gga acg cac gtc ttc gat gtc gat act gtg gag aac cta gac acc 5280
Leu Gly Thr His Val Phe Asp Val Asp Thr Val Glu Asn Leu Asp Thr
1745 1750 1755 1760
aaa ttc ttc gtt gag caa ctt ttg cgc ttc gag gag agc gat gat cag 5328
Lys Phe Phe Val Glu Gln Leu Leu Arg Phe Glu Glu Ser Asp Asp Gln
1765 1770 1775
ctt ttg gaa tca ata aca tgg act cat gag ccc gaa gtg tac tgg tgc 5376
Leu Leu Glu Ser Ile Thr Trp Thr His Glu Pro Glu Val Tyr Trp Cys
1780 1785 1790
aag ggt cgt gcc tgg gtc cct cgt ttg aag cag gat att gct agg aac 5424
Lys Gly Arg Ala Trp Val Pro Arg Leu Lys Gln Asp Ile Ala Arg Asn
1795 1800 1805
gac cgt atg aac tcg tct cgt cgt cca att ttc ggt aac ttt aat tcg 5472
Asp Arg Met Asn Ser Ser Arg Arg Pro Ile Phe Gly Asn Phe Asn Ser
1810 1815 1820
tcc aag acg gcc att gca ctg aaa gag gcg agg gga gca tcc tca tcg 5520
Ser Lys Thr Ala Ile Ala Leu Lys Glu Ala Arg Gly Ala Ser Ser Ser
1825 1830 1835 1840
atg tac tat ctt gag tca acc gag acg tgt gat tcg tta gaa gac gct 5568
Met Tyr Tyr Leu Glu Ser Thr Glu Thr Cys Asp Ser Leu Glu Asp Ala
1845 1850 1855
cgt cat gct gga aaa gca act gtt cgt gtt cgc tac gct ctt ccc cag 5616
Arg His Ala Gly Lys Ala Thr Val Arg Val Arg Tyr Ala Leu Pro Gln
1860 1865 1870
gca att cgc gtg ggc cat ctc gga tac ttc cat gtc gtg cag ggc agt 5664
Ala Ile Arg Val Gly His Leu Gly Tyr Phe His Val Val Gln Gly Ser
1875 1880 1885
att ctg gag aat aca tgt gag gtg cct gta gtc gcc ctg gct gag aag 5712
Ile Leu Glu Asn Thr Cys Glu Val Pro Val Val Ala Leu Ala Glu Lys
1890 1895 1900
aat gga tct ata ctg cat gta ccg aga aac tac atg cat agt ctg ccc 5760
Asn Gly Ser Ile Leu His Val Pro Arg Asn Tyr Met His Ser Leu Pro
1905 1910 1915 1920
gat aac atg gcg gaa ggc gag gat agt tcc ttc ttg ttg tcc aca gct 5808
Asp Asn Met Ala Glu Gly Glu Asp Ser Ser Phe Leu Leu Ser Thr Ala
1925 1930 1935
gca gcc ctc ctt gcc gaa aca att ctc tct agc gct cag tcc ttt ggc 5856
Ala Ala Leu Leu Ala Glu Thr Ile Leu Ser Ser Ala Gln Ser Phe Gly
1940 1945 1950
tct gat gca tca att ctg att atg gag ccc cca atc ttc tgc gtc aaa 5904
Ser Asp Ala Ser Ile Leu Ile Met Glu Pro Pro Ile Phe Cys Val Lys
1955 1960 1965
gca att ctg gag tcg gcc aaa acc tac ggt gtt cag gtt cat ttg gca 5952
Ala Ile Leu Glu Ser Ala Lys Thr Tyr Gly Val Gln Val His Leu Ala
1970 1975 1980
aca act ctg tcc gac gtc aaa act att ccg gct cct tgg atc cga tta 6000
Thr Thr Leu Ser Asp Val Lys Thr Ile Pro Ala Pro Trp Ile Arg Leu
1985 1990 1995 2000
cat gcc aag gaa acc gac gct cgg ctg aaa cac agc ctg ccg aca aac 6048
His Ala Lys Glu Thr Asp Ala Arg Leu Lys His Ser Leu Pro Thr Asn
2005 2010 2015
atg atg gca ttc ttt gac ttg tct acc gac cgg act gct gcc ggg ata 6096
Met Met Ala Phe Phe Asp Leu Ser Thr Asp Arg Thr Ala Ala Gly Ile
2020 2025 2030
acc aac cgt ttg gcc aag ttg cta cca ccc agt tgc ttc atg tac agt 6144
Thr Asn Arg Leu Ala Lys Leu Leu Pro Pro Ser Cys Phe Met Tyr Ser
2035 2040 2045
ggt gac tat ctt atc cga agt aca gct tcc aca tac aaa gtt agt cat 6192
Gly Asp Tyr Leu Ile Arg Ser Thr Ala Ser Thr Tyr Lys Val Ser His
2050 2055 2060
gtt gag gat att cca atc ctc gag cac tct gtg gca atg gca aaa aat 6240
Val Glu Asp Ile Pro Ile Leu Glu His Ser Val Ala Met Ala Lys Asn
2065 2070 2075 2080
acc gtc tct gcg tcg act gtc gac gac act gag aaa gtt att aca gcc 6288
Thr Val Ser Ala Ser Thr Val Asp Asp Thr Glu Lys Val Ile Thr Ala
2085 2090 2095
aca caa att ctc ttg cct ggt cag ctc tct gtc aac cac aat gac caa 6336
Thr Gln Ile Leu Leu Pro Gly Gln Leu Ser Val Asn His Asn Asp Gln
2100 2105 2110
cgc ttc aat ctg gcc acc gtc atc gac tgg aag gaa aat gag gtg tcc 6384
Arg Phe Asn Leu Ala Thr Val Ile Asp Trp Lys Glu Asn Glu Val Ser
2115 2120 2125
gct agg att tgc ccc atc gac tct ggt aac tta ttt tcc aac aag aag 6432
Ala Arg Ile Cys Pro Ile Asp Ser Gly Asn Leu Phe Ser Asn Lys Lys
2130 2135 2140
acg tat ttg ctt gtt ggt ctt acc ggg gac ctt ggt cgc tct ctc tgt 6480
Thr Tyr Leu Leu Val Gly Leu Thr Gly Asp Leu Gly Arg Ser Leu Cys
2145 2150 2155 2160
cgc tgg atg atc ttg cat ggc gcc cgc cat gtt gtg ctc act agc cgg 6528
Arg Trp Met Ile Leu His Gly Ala Arg His Val Val Leu Thr Ser Arg
2165 2170 2175
aac cct cga ctt gat ccc aaa tgg atc gcc aac atg gag gca ctt ggt 6576
Asn Pro Arg Leu Asp Pro Lys Trp Ile Ala Asn Met Glu Ala Leu Gly
2180 2185 2190
ggt gac atc acc gtt ctg tca atg gat gtt gcc aat gag gat tca gtc 6624
Gly Asp Ile Thr Val Leu Ser Met Asp Val Ala Asn Glu Asp Ser Val
2195 2200 2205
gat gct ggc ctt ggc aag ctt gtc gat atg aag ttg cca cct gtt gcc 6672
Asp Ala Gly Leu Gly Lys Leu Val Asp Met Lys Leu Pro Pro Val Ala
2210 2215 2220
ggc atc gcg ttc ggg cct ttg gtg ctg cag gat gtc atg ctg aag aac 6720
Gly Ile Ala Phe Gly Pro Leu Val Leu Gln Asp Val Met Leu Lys Asn
2225 2230 2235 2240
atg gac cac cag atg atg gac atg gtg ttg aag ccc aag gta caa gga 6768
Met Asp His Gln Met Met Asp Met Val Leu Lys Pro Lys Val Gln Gly
2245 2250 2255
gca cgc att ctt cat gaa cgg ttc tcc gaa cag acg ggc agc aag gcg 6816
Ala Arg Ile Leu His Glu Arg Phe Ser Glu Gln Thr Gly Ser Lys Ala
2260 2265 2270
ctc gac ttc ttc atc atg ttt tcg tcc att gtt gca gtt att ggc aat 6864
Leu Asp Phe Phe Ile Met Phe Ser Ser Ile Val Ala Val Ile Gly Asn
2275 2280 2285
cct ggc cag tcc aac tat ggc gct gcg aat gcc tac cta cag gct ctg 6912
Pro Gly Gln Ser Asn Tyr Gly Ala Ala Asn Ala Tyr Leu Gln Ala Leu
2290 2295 2300
gcc cag caa cgg tgc gcc aga gga ttg gcg gga tca acc atc gat att 6960
Ala Gln Gln Arg Cys Ala Arg Gly Leu Ala Gly Ser Thr Ile Asp Ile
2305 2310 2315 2320
ggt gcc gtt tac ggt gta ggg ttt gtc acg agg gcc gag atg gag gag 7008
Gly Ala Val Tyr Gly Val Gly Phe Val Thr Arg Ala Glu Met Glu Glu
2325 2330 2335
gac ttt gat gct atc cgt ttc atg ttt gac tca gtt gaa gag cat gag 7056
Asp Phe Asp Ala Ile Arg Phe Met Phe Asp Ser Val Glu Glu His Glu
2340 2345 2350
ctg cac acg ctt ttc gcc gaa gcg gtc gtg tct gac cag cgt gcc cgg 7104
Leu His Thr Leu Phe Ala Glu Ala Val Val Ser Asp Gln Arg Ala Arg
2355 2360 2365
cag caa cca cag cgc aag acg gtc att gac atg gcg gac ctt gag ctt 7152
Gln Gln Pro Gln Arg Lys Thr Val Ile Asp Met Ala Asp Leu Glu Leu
2370 2375 2380
acc acg ggt atc cca gat ctt gac cct gcg ctt caa gat cga att att 7200
Thr Thr Gly Ile Pro Asp Leu Asp Pro Ala Leu Gln Asp Arg Ile Ile
2385 2390 2395 2400
tac ttc aac gac cct cgt ttc gga aac ttc aaa att ccc ggt caa cgc 7248
Tyr Phe Asn Asp Pro Arg Phe Gly Asn Phe Lys Ile Pro Gly Gln Arg
2405 2410 2415
gga gac ggt ggc gac aat gga tca ggg tct aaa ggc tcc att gcc gac 7296
Gly Asp Gly Gly Asp Asn Gly Ser Gly Ser Lys Gly Ser Ile Ala Asp
2420 2425 2430
cag ctc aaa caa gca aca act tta gac caa gtt cgg caa atc gtg att 7344
Gln Leu Lys Gln Ala Thr Thr Leu Asp Gln Val Arg Gln Ile Val Ile
2435 2440 2445
gat ggt cta tct gag aaa ctc cgt gtt acc ctc caa gtt tcg gac ggg 7392
Asp Gly Leu Ser Glu Lys Leu Arg Val Thr Leu Gln Val Ser Asp Gly
2450 2455 2460
gag agc gtg gac cca acc att cct ctc att gat caa ggt gtc gac tcc 7440
Glu Ser Val Asp Pro Thr Ile Pro Leu Ile Asp Gln Gly Val Asp Ser
2465 2470 2475 2480
ttg ggt gca gtg act gtc ggc tca tgg ttc tca aag caa ctc tac ctt 7488
Leu Gly Ala Val Thr Val Gly Ser Trp Phe Ser Lys Gln Leu Tyr Leu
2485 2490 2495
gac ctc cca ctc ttg agg gta ctt ggc ggt gct tct gtc gct gat ctt 7536
Asp Leu Pro Leu Leu Arg Val Leu Gly Gly Ala Ser Val Ala Asp Leu
2500 2505 2510
gcc gac gac gcg gcc acc cga ctc cca gct aca tcc att ccg ctg ctg 7584
Ala Asp Asp Ala Ala Thr Arg Leu Pro Ala Thr Ser Ile Pro Leu Leu
2515 2520 2525
ttg caa att ggt gat tcc acg gga acc tcg gac agc ggg gct tct ccg 7632
Leu Gln Ile Gly Asp Ser Thr Gly Thr Ser Asp Ser Gly Ala Ser Pro
2530 2535 2540
aca cca aca gac agc cat gat gaa gca agc tct gct acc agc aca gat 7680
Thr Pro Thr Asp Ser His Asp Glu Ala Ser Ser Ala Thr Ser Thr Asp
2545 2550 2555 2560
gcg tcg tca gcc gaa gag gat gaa gag caa gag gac gat aat gag cag 7728
Ala Ser Ser Ala Glu Glu Asp Glu Glu Gln Glu Asp Asp Asn Glu Gln
2565 2570 2575
gga ggc cgt aag att ctt cgt cgc gag agg ttg tcc ctt ggc cag gag 7776
Gly Gly Arg Lys Ile Leu Arg Arg Glu Arg Leu Ser Leu Gly Gln Glu
2580 2585 2590
tat tcc tgg agg cag caa caa atg gta aaa gat cat acc atc ttc aac 7824
Tyr Ser Trp Arg Gln Gln Gln Met Val Lys Asp His Thr Ile Phe Asn
2595 2600 2605
aac act att ggc atg ttc atg aag ggt acc att gac ctc gac cgg ttg 7872
Asn Thr Ile Gly Met Phe Met Lys Gly Thr Ile Asp Leu Asp Arg Leu
2610 2615 2620
agg cgg gct ctg aaa gcc tca ttg cgc cgt cac gag atc ttc cgt acg 7920
Arg Arg Ala Leu Lys Ala Ser Leu Arg Arg His Glu Ile Phe Arg Thr
2625 2630 2635 2640
tgc ttt gtt act ggc gat gac tat agc agc gat tta aat ggt ccc gtc 7968
Cys Phe Val Thr Gly Asp Asp Tyr Ser Ser Asp Leu Asn Gly Pro Val
2645 2650 2655
caa gtg gtt ctc aag aac ccg gag aac aga gtg cac ttt gtt cag gtg 8016
Gln Val Val Leu Lys Asn Pro Glu Asn Arg Val His Phe Val Gln Val
2660 2665 2670
aac aac gct gcg gag gca gag gaa gag tac cgg aaa ctc gag aag aca 8064
Asn Asn Ala Ala Glu Ala Glu Glu Glu Tyr Arg Lys Leu Glu Lys Thr
2675 2680 2685
aac tat agc atc tcc aca ggt gac act ctc aga ctc gtt gat ttc tac 8112
Asn Tyr Ser Ile Ser Thr Gly Asp Thr Leu Arg Leu Val Asp Phe Tyr
2690 2695 2700
tgg ggc aca gat gac cac ctg ttg gta atc ggc tac cac aga tta gtt 8160
Trp Gly Thr Asp Asp His Leu Leu Val Ile Gly Tyr His Arg Leu Val
2705 2710 2715 2720
ggt gat ggc tca aca aca gaa aac ctg ttc aat gag atc ggg cag att 8208
Gly Asp Gly Ser Thr Thr Glu Asn Leu Phe Asn Glu Ile Gly Gln Ile
2725 2730 2735
tac agc ggg gtg aaa atg cag cga cca tcg acc caa ttc tct gat cta 8256
Tyr Ser Gly Val Lys Met Gln Arg Pro Ser Thr Gln Phe Ser Asp Leu
2740 2745 2750
gcc gtc caa cag cgg gaa aac ctg gaa aat ggg cga atg ggg gac gat 8304
Ala Val Gln Gln Arg Glu Asn Leu Glu Asn Gly Arg Met Gly Asp Asp
2755 2760 2765
atc gcg ttc tgg aag tcc atg cat agc aaa gtc tcg tca tct gcg cca 8352
Ile Ala Phe Trp Lys Ser Met His Ser Lys Val Ser Ser Ser Ala Pro
2770 2775 2780
acc gtg ctt ccc atc atg aat ctg atc aat gac cct gct gcc aat tca 8400
Thr Val Leu Pro Ile Met Asn Leu Ile Asn Asp Pro Ala Ala Asn Ser
2785 2790 2795 2800
gag cag cag caa ata cag cca ttc acg tgg cag cag tat gaa gca att 8448
Glu Gln Gln Gln Ile Gln Pro Phe Thr Trp Gln Gln Tyr Glu Ala Ile
2805 2810 2815
gct cgt tta gat ccc atg gtc gcc ttc cga atc aaa gag cgg agc cgc 8496
Ala Arg Leu Asp Pro Met Val Ala Phe Arg Ile Lys Glu Arg Ser Arg
2820 2825 2830
aag cac aag gca acc ccc atg cag ttc tac ctg gcc gcc tac cac gtt 8544
Lys His Lys Ala Thr Pro Met Gln Phe Tyr Leu Ala Ala Tyr His Val
2835 2840 2845
ttg ttg gcg cgt ctt acc ggc agc aaa gac ata acc atc ggc ctc gcc 8592
Leu Leu Ala Arg Leu Thr Gly Ser Lys Asp Ile Thr Ile Gly Leu Ala
2850 2855 2860
gaa acc aac cga tcc acc atg gaa gaa att tcg gcg atg ggc ttt ttc 8640
Glu Thr Asn Arg Ser Thr Met Glu Glu Ile Ser Ala Met Gly Phe Phe
2865 2870 2875 2880
gct aac gtg ctt ccc ctg cgc ttt gat gag ttc gtc ggc agc aag aca 8688
Ala Asn Val Leu Pro Leu Arg Phe Asp Glu Phe Val Gly Ser Lys Thr
2885 2890 2895
ttc ggc gag cac ctt gta gcc acc aag gac agt gtg cgt gag gcc atg 8736
Phe Gly Glu His Leu Val Ala Thr Lys Asp Ser Val Arg Glu Ala Met
2900 2905 2910
caa cac gcg cgg gtg ccg tat ggc gtc atc ctc gac tgt cta ggc ctg 8784
Gln His Ala Arg Val Pro Tyr Gly Val Ile Leu Asp Cys Leu Gly Leu
2915 2920 2925
aat ctc cct acc tca ggc gag gaa ccc aag act cag aca cac gcc ccc 8832
Asn Leu Pro Thr Ser Gly Glu Glu Pro Lys Thr Gln Thr His Ala Pro
2930 2935 2940
ttg ttc cag gct gtc ttt gat tac aag cag ggt caa gcg gag agt ggc 8880
Leu Phe Gln Ala Val Phe Asp Tyr Lys Gln Gly Gln Ala Glu Ser Gly
2945 2950 2955 2960
tca att ggc aat gcc aaa atg acg agt gtt ctc gct tcc cgt gag cgc 8928
Ser Ile Gly Asn Ala Lys Met Thr Ser Val Leu Ala Ser Arg Glu Arg
2965 2970 2975
act cct tat gac atc gtt ctc gag atg tgg gat gac cct acc aag gac 8976
Thr Pro Tyr Asp Ile Val Leu Glu Met Trp Asp Asp Pro Thr Lys Asp
2980 2985 2990
cca ctc att cat gtc aaa ctt cag agc tcg ctg tat ggc cct gag cac 9024
Pro Leu Ile His Val Lys Leu Gln Ser Ser Leu Tyr Gly Pro Glu His
2995 3000 3005
gct cag gcc ttt gta gac cac ttt tct tca atc ctc act atg ttc tcg 9072
Ala Gln Ala Phe Val Asp His Phe Ser Ser Ile Leu Thr Met Phe Ser
3010 3015 3020
atg aac ccg gct ctg aag ttg gcc 9096
Met Asn Pro Ala Leu Lys Leu Ala
3025 3030
<210> 3
<211> 3032
<212> PRT
<213> Penicillium citrinum
<400> 3
Met Asp Gln Ala Asn Tyr Pro Asn Glu Pro Ile Val Val Val Gly Ser
1 5 10 15
Gly Cys Arg Phe Pro Gly Gly Val Asn Thr Pro Ser Lys Leu Trp Glu
20 25 30
Leu Leu Lys Glu Pro Arg Asp Val Gln Thr Lys Ile Pro Lys Glu Arg
35 40 45
Phe Asp Val Asp Thr Phe Tyr Ser Pro Asp Gly Thr His Pro Gly Arg
50 55 60
Thr Asn Ala Pro Phe Ala Tyr Leu Leu Gln Glu Asp Leu Arg Gly Phe
65 70 75 80
Asp Ala Ser Phe Phe Asn Ile Gln Ala Gly Glu Ala Glu Thr Ile Asp
85 90 95
Pro Gln Gln Arg Leu Leu Leu Glu Thr Val Tyr Glu Ala Val Ser Asn
100 105 110
Ala Gly Leu Arg Ile Gln Gly Leu Gln Gly Ser Ser Thr Ala Val Tyr
115 120 125
Val Gly Met Met Thr His Asp Tyr Glu Thr Ile Val Thr Arg Glu Leu
130 135 140
Asp Ser Ile Pro Thr Tyr Ser Ala Thr Gly Val Ala Val Ser Val Ala
145 150 155 160
Ser Asn Arg Val Ser Tyr Phe Phe Asp Trp His Gly Pro Ser Met Thr
165 170 175
Ile Asp Thr Ala Cys Ser Ser Ser Leu Ala Ala Val His Leu Ala Val
180 185 190
Gln Gln Leu Arg Thr Gly Glu Ser Thr Met Ala Val Ala Ala Gly Ala
195 200 205
Asn Leu Ile Leu Gly Pro Met Thr Phe Val Met Glu Ser Lys Leu Asn
210 215 220
Met Leu Ser Pro Asn Gly Arg Ser Arg Met Trp Asp Ala Ala Ala Asp
225 230 235 240
Gly Tyr Ala Arg Gly Glu Gly Val Cys Ser Ile Val Leu Lys Thr Leu
245 250 255
Ser Gln Ala Leu Arg Asp Gly Asp Ser Ile Glu Cys Val Ile Arg Glu
260 265 270
Thr Gly Ile Asn Gln Asp Gly Arg Thr Thr Gly Ile Thr Met Pro Asn
275 280 285
His Ser Ala Gln Glu Ala Leu Ile Arg Ala Thr Tyr Ala Lys Ala Gly
290 295 300
Leu Asp Ile Thr Asn Pro Gln Glu Arg Cys Gln Phe Phe Glu Ala His
305 310 315 320
Gly Thr Gly Thr Pro Ala Gly Asp Pro Gln Glu Ala Glu Ala Ile Ala
325 330 335
Thr Ala Phe Phe Gly His Lys Asp Gly Thr Ile Asp Ser Asp Gly Glu
340 345 350
Lys Asp Glu Leu Phe Val Gly Ser Ile Lys Thr Val Leu Gly His Thr
355 360 365
Glu Gly Thr Ala Gly Ile Ala Gly Leu Met Lys Ala Ser Phe Ala Val
370 375 380
Arg Asn Gly Val Ile Pro Pro Asn Leu Leu Phe Glu Lys Ile Ser Pro
385 390 395 400
Arg Val Ala Pro Phe Tyr Thr His Leu Lys Ile Ala Thr Glu Ala Thr
405 410 415
Glu Trp Pro Ile Val Ala Pro Gly Gln Pro Arg Arg Val Ser Val Asn
420 425 430
Ser Phe Gly Phe Gly Gly Thr Asn Ala His Ala Ile Ile Glu Glu Tyr
435 440 445
Met Ala Pro Pro His Lys Pro Thr Ala Val Val Thr Glu Val Thr Ser
450 455 460
Asp Ala Asp Ala Cys Ser Leu Pro Leu Val Leu Ser Ser Lys Ser Gln
465 470 475 480
Arg Ser Met Lys Ala Thr Leu Glu Asn Met Leu Gln Phe Leu Glu Thr
485 490 495
His Asp Asp Val Asp Met His Asp Ile Ala Tyr Thr Leu Leu Glu Lys
500 505 510
Arg Ser Ile Leu Pro Phe Arg Arg Ala Ile Ala Ala His Asn Lys Glu
515 520 525
Val Ala Arg Ala Ala Leu Glu Ala Ala Ile Ala Asp Gly Glu Val Val
530 535 540
Thr Asp Phe Arg Thr Asp Ala Asn Asp Asn Pro Arg Val Leu Gly Val
545 550 555 560
Phe Thr Gly Gln Gly Ala Gln Trp Pro Gly Met Leu Lys Lys Leu Met
565 570 575
Val Gly Met Pro Phe Val Arg Gly Ile Leu Glu Glu Leu Asp Asn Ser
580 585 590
Leu Gln Thr Leu Pro Glu Lys Tyr Arg Pro Thr Trp Thr Leu Tyr Asp
595 600 605
Gln Leu Met Leu Glu Gly Asp Ala Ser Asn Val Arg Leu Ala Ser Phe
610 615 620
Ser Gln Pro Leu Cys Cys Ala Val Gln Ile Val Leu Val Arg Leu Leu
625 630 635 640
Ala Ala Ala Gly Ile Glu Phe Ser Ala Ile Val Gly His Ser Ser Gly
645 650 655
Glu Ile Ala Cys Ala Phe Ala Ala Gly Phe Ile Ser Ala Thr Gln Ala
660 665 670
Ile Arg Ile Ala His Leu Arg Gly Val Val Ser Ala Glu His Ala Ser
675 680 685
Ser Pro Ser Gly Gln Thr Gly Ala Met Leu Ala Ala Gly Met Ser Tyr
690 695 700
Asp Asp Ala Lys Glu Leu Cys Glu Leu Glu Ala Phe Glu Gly Arg Val
705 710 715 720
Cys Val Ala Ala Ser Asn Ser Pro Asp Ser Val Thr Phe Ser Gly Asp
725 730 735
Met Asp Ala Ile Gln His Val Glu Gly Val Leu Glu Asp Glu Ser Thr
740 745 750
Phe Ala Arg Ile Leu Arg Val Asp Lys Ala Tyr His Ser His His Met
755 760 765
His Pro Cys Ala Ala Pro Tyr Val Lys Ala Leu Leu Glu Cys Asp Cys
770 775 780
Ala Val Ala Asp Gly Gln Gly Asn Asp Ser Val Ala Trp Phe Ser Ala
785 790 795 800
Val His Glu Thr Ser Lys Gln Met Thr Val Gln Asp Val Met Pro Ala
805 810 815
Tyr Trp Lys Asp Asn Leu Val Ser Pro Val Leu Phe Ser Gln Ala Val
820 825 830
Gln Lys Ala Val Ile Thr His Arg Leu Ile Asp Val Ala Ile Glu Ile
835 840 845
Gly Ala His Pro Ala Leu Lys Gly Pro Cys Leu Ala Thr Ile Lys Asp
850 855 860
Ala Leu Ala Gly Val Glu Leu Pro Tyr Thr Gly Cys Leu Ala Arg Asn
865 870 875 880
Val Asp Asp Val Asp Ala Phe Ala Gly Gly Leu Gly Tyr Ile Trp Glu
885 890 895
Arg Phe Gly Val Arg Ser Ile Asp Ala Glu Gly Phe Val Gln Gln Val
900 905 910
Arg Pro Asp Arg Ala Val Gln Asn Leu Ser Lys Ser Leu Pro Thr Tyr
915 920 925
Ser Trp Asp His Thr Arg Gln Tyr Trp Ala Glu Ser Arg Ser Thr Arg
930 935 940
Gln His Leu Arg Gly Gly Ala Pro His Leu Leu Leu Gly Lys Leu Ser
945 950 955 960
Ser Tyr Ser Thr Ala Ser Thr Phe Gln Trp Thr Asn Phe Ile Arg Pro
965 970 975
Arg Asp Leu Glu Trp Leu Asp Gly His Ala Leu Gln Gly Gln Thr Val
980 985 990
Phe Pro Ala Ala Gly Tyr Ile Ile Met Ala Met Glu Ala Ala Met Lys
995 1000 1005
Val Ala Gly Glu Arg Ala Ala Gln Val Gln Leu Leu Glu Ile Leu Asp
1010 1015 1020
Met Ser Ile Asn Lys Ala Ile Val Phe Glu Asp Glu Asn Thr Ser Val
1025 1030 1035 1040
Glu Leu Asn Leu Thr Ala Glu Val Thr Ser Asp Asn Asp Ala Asp Gly
1045 1050 1055
Gln Val Thr Val Lys Phe Val Ile Asp Ser Cys Leu Ala Lys Glu Ser
1060 1065 1070
Glu Leu Ser Thr Ser Ala Lys Gly Gln Ile Val Ile Thr Leu Gly Glu
1075 1080 1085
Ala Ser Pro Ser Ser Gln Leu Leu Pro Pro Pro Glu Glu Glu Tyr Pro
1090 1095 1100
Gln Met Asn Asn Val Asn Ile Asp Phe Phe Tyr Arg Glu Leu Asp Leu
1105 1110 1115 1120
Leu Gly Tyr Asp Tyr Ser Lys Asp Phe Arg Arg Leu Gln Thr Met Arg
1125 1130 1135
Arg Ala Asp Ser Lys Ala Ser Gly Thr Leu Ala Phe Leu Pro Leu Lys
1140 1145 1150
Asp Glu Leu Arg Asn Glu Pro Leu Leu Leu His Pro Ala Pro Leu Asp
1155 1160 1165
Ile Ala Phe Gln Thr Val Ile Gly Ala Tyr Ser Ser Pro Gly Asp Arg
1170 1175 1180
Arg Leu Arg Ser Leu Tyr Val Pro Thr His Val Asp Arg Val Thr Leu
1185 1190 1195 1200
Ile Pro Ser Leu Cys Ile Ser Ala Gly Asn Ser Gly Glu Thr Glu Leu
1205 1210 1215
Ala Phe Asp Thr Ile Asn Thr His Asp Lys Gly Asp Phe Leu Ser Gly
1220 1225 1230
Asp Ile Thr Val Tyr Asp Ser Thr Lys Thr Thr Leu Phe Gln Val Asp
1235 1240 1245
Asn Ile Val Phe Lys Pro Phe Ser Pro Pro Thr Ala Ser Thr Asp His
1250 1255 1260
Arg Ile Phe Ala Lys Trp Val Trp Gly Pro Leu Thr Pro Glu Lys Leu
1265 1270 1275 1280
Leu Glu Asp Pro Ala Thr Leu Ile Ile Ala Arg Asp Lys Glu Asp Ile
1285 1290 1295
Leu Thr Ile Glu Arg Ile Val Tyr Phe Tyr Ile Lys Ser Phe Leu Ala
1300 1305 1310
Gln Ile Thr Pro Asp Asp Arg Gln Asn Ala Asp Leu His Ser Gln Lys
1315 1320 1325
Tyr Ile Glu Trp Cys Asp Gln Val Gln Ala Asp Ala Arg Ala Gly His
1330 1335 1340
His Gln Trp Tyr Gln Glu Ser Trp Glu Glu Asp Thr Ser Val His Ile
1345 1350 1355 1360
Glu Gln Met Cys Glu Ser Asn Ser Ser His Pro His Val Arg Leu Ile
1365 1370 1375
Gln Arg Val Gly Lys Glu Leu Ile Ser Ile Val Arg Gly Asn Gly Asp
1380 1385 1390
Pro Leu Asp Ile Met Asn Arg Asp Gly Leu Phe Thr Glu Tyr Tyr Thr
1395 1400 1405
Asn Lys Leu Ala Phe Gly Ser Ala Ile His Val Val Gln Asp Leu Val
1410 1415 1420
Ser Gln Ile Ala His Arg Tyr Gln Ser Ile Asp Ile Leu Glu Ile Gly
1425 1430 1435 1440
Leu Gly Thr Gly Ile Ala Thr Lys Arg Val Leu Ala Ser Pro Gln Leu
1445 1450 1455
Gly Phe Asn Ser Tyr Thr Cys Thr Asp Ile Ser Ala Asp Val Ile Gly
1460 1465 1470
Lys Ala Arg Glu Gln Leu Ser Glu Phe Asp Gly Leu Met Gln Phe Glu
1475 1480 1485
Ala Leu Asp Ile Asn Arg Ser Pro Ala Glu Gln Gly Phe Lys Pro His
1490 1495 1500
Ser Tyr Asp Leu Ile Ile Ala Ser Asp Val Leu His Ala Ser Ser Asn
1505 1510 1515 1520
Phe Glu Glu Lys Leu Ala His Ile Arg Ser Leu Leu Lys Pro Gly Gly
1525 1530 1535
His Leu Val Thr Phe Gly Val Thr His Arg Glu Pro Ala Arg Leu Ala
1540 1545 1550
Phe Ile Ser Gly Leu Phe Ala Asp Arg Trp Thr Gly Glu Asp Glu Thr
1555 1560 1565
Arg Ala Leu Ser Ala Ser Gly Ser Val Asp Gln Trp Glu His Thr Leu
1570 1575 1580
Lys Arg Val Gly Phe Ser Gly Val Asp Ser Arg Thr Leu Asp Arg Glu
1585 1590 1595 1600
Asp Asp Leu Ile Pro Ser Val Phe Ser Thr His Ala Val Asp Ala Thr
1605 1610 1615
Val Glu Arg Leu Tyr Asp Pro Leu Ser Ala Pro Leu Lys Asp Ser Tyr
1620 1625 1630
Pro Pro Leu Val Val Ile Gly Gly Glu Ser Thr Lys Thr Glu Arg Ile
1635 1640 1645
Leu Asn Asp Met Lys Ala Ala Leu Pro His Arg His Ile His Ser Val
1650 1655 1660
Lys Arg Leu Glu Ser Val Leu Asp Asp Pro Ala Leu Gln Pro Lys Ser
1665 1670 1675 1680
Thr Phe Val Ile Leu Ser Glu Leu Asp Asp Glu Val Phe Cys Asn Leu
1685 1690 1695
Glu Glu Asp Lys Phe Glu Ala Val Lys Ser Leu Leu Phe Tyr Ala Gly
1700 1705 1710
Arg Met Met Trp Leu Thr Glu Asn Ala Trp Ile Asp His Pro His Gln
1715 1720 1725
Ala Ser Thr Ile Gly Met Leu Arg Thr Ile Lys Leu Glu Asn Pro Asp
1730 1735 1740
Leu Gly Thr His Val Phe Asp Val Asp Thr Val Glu Asn Leu Asp Thr
1745 1750 1755 1760
Lys Phe Phe Val Glu Gln Leu Leu Arg Phe Glu Glu Ser Asp Asp Gln
1765 1770 1775
Leu Leu Glu Ser Ile Thr Trp Thr His Glu Pro Glu Val Tyr Trp Cys
1780 1785 1790
Lys Gly Arg Ala Trp Val Pro Arg Leu Lys Gln Asp Ile Ala Arg Asn
1795 1800 1805
Asp Arg Met Asn Ser Ser Arg Arg Pro Ile Phe Gly Asn Phe Asn Ser
1810 1815 1820
Ser Lys Thr Ala Ile Ala Leu Lys Glu Ala Arg Gly Ala Ser Ser Ser
1825 1830 1835 1840
Met Tyr Tyr Leu Glu Ser Thr Glu Thr Cys Asp Ser Leu Glu Asp Ala
1845 1850 1855
Arg His Ala Gly Lys Ala Thr Val Arg Val Arg Tyr Ala Leu Pro Gln
1860 1865 1870
Ala Ile Arg Val Gly His Leu Gly Tyr Phe His Val Val Gln Gly Ser
1875 1880 1885
Ile Leu Glu Asn Thr Cys Glu Val Pro Val Val Ala Leu Ala Glu Lys
1890 1895 1900
Asn Gly Ser Ile Leu His Val Pro Arg Asn Tyr Met His Ser Leu Pro
1905 1910 1915 1920
Asp Asn Met Ala Glu Gly Glu Asp Ser Ser Phe Leu Leu Ser Thr Ala
1925 1930 1935
Ala Ala Leu Leu Ala Glu Thr Ile Leu Ser Ser Ala Gln Ser Phe Gly
1940 1945 1950
Ser Asp Ala Ser Ile Leu Ile Met Glu Pro Pro Ile Phe Cys Val Lys
1955 1960 1965
Ala Ile Leu Glu Ser Ala Lys Thr Tyr Gly Val Gln Val His Leu Ala
1970 1975 1980
Thr Thr Leu Ser Asp Val Lys Thr Ile Pro Ala Pro Trp Ile Arg Leu
1985 1990 1995 2000
His Ala Lys Glu Thr Asp Ala Arg Leu Lys His Ser Leu Pro Thr Asn
2005 2010 2015
Met Met Ala Phe Phe Asp Leu Ser Thr Asp Arg Thr Ala Ala Gly Ile
2020 2025 2030
Thr Asn Arg Leu Ala Lys Leu Leu Pro Pro Ser Cys Phe Met Tyr Ser
2035 2040 2045
Gly Asp Tyr Leu Ile Arg Ser Thr Ala Ser Thr Tyr Lys Val Ser His
2050 2055 2060
Val Glu Asp Ile Pro Ile Leu Glu His Ser Val Ala Met Ala Lys Asn
2065 2070 2075 2080
Thr Val Ser Ala Ser Thr Val Asp Asp Thr Glu Lys Val Ile Thr Ala
2085 2090 2095
Thr Gln Ile Leu Leu Pro Gly Gln Leu Ser Val Asn His Asn Asp Gln
2100 2105 2110
Arg Phe Asn Leu Ala Thr Val Ile Asp Trp Lys Glu Asn Glu Val Ser
2115 2120 2125
Ala Arg Ile Cys Pro Ile Asp Ser Gly Asn Leu Phe Ser Asn Lys Lys
2130 2135 2140
Thr Tyr Leu Leu Val Gly Leu Thr Gly Asp Leu Gly Arg Ser Leu Cys
2145 2150 2155 2160
Arg Trp Met Ile Leu His Gly Ala Arg His Val Val Leu Thr Ser Arg
2165 2170 2175
Asn Pro Arg Leu Asp Pro Lys Trp Ile Ala Asn Met Glu Ala Leu Gly
2180 2185 2190
Gly Asp Ile Thr Val Leu Ser Met Asp Val Ala Asn Glu Asp Ser Val
2195 2200 2205
Asp Ala Gly Leu Gly Lys Leu Val Asp Met Lys Leu Pro Pro Val Ala
2210 2215 2220
Gly Ile Ala Phe Gly Pro Leu Val Leu Gln Asp Val Met Leu Lys Asn
2225 2230 2235 2240
Met Asp His Gln Met Met Asp Met Val Leu Lys Pro Lys Val Gln Gly
2245 2250 2255
Ala Arg Ile Leu His Glu Arg Phe Ser Glu Gln Thr Gly Ser Lys Ala
2260 2265 2270
Leu Asp Phe Phe Ile Met Phe Ser Ser Ile Val Ala Val Ile Gly Asn
2275 2280 2285
Pro Gly Gln Ser Asn Tyr Gly Ala Ala Asn Ala Tyr Leu Gln Ala Leu
2290 2295 2300
Ala Gln Gln Arg Cys Ala Arg Gly Leu Ala Gly Ser Thr Ile Asp Ile
2305 2310 2315 2320
Gly Ala Val Tyr Gly Val Gly Phe Val Thr Arg Ala Glu Met Glu Glu
2325 2330 2335
Asp Phe Asp Ala Ile Arg Phe Met Phe Asp Ser Val Glu Glu His Glu
2340 2345 2350
Leu His Thr Leu Phe Ala Glu Ala Val Val Ser Asp Gln Arg Ala Arg
2355 2360 2365
Gln Gln Pro Gln Arg Lys Thr Val Ile Asp Met Ala Asp Leu Glu Leu
2370 2375 2380
Thr Thr Gly Ile Pro Asp Leu Asp Pro Ala Leu Gln Asp Arg Ile Ile
2385 2390 2395 2400
Tyr Phe Asn Asp Pro Arg Phe Gly Asn Phe Lys Ile Pro Gly Gln Arg
2405 2410 2415
Gly Asp Gly Gly Asp Asn Gly Ser Gly Ser Lys Gly Ser Ile Ala Asp
2420 2425 2430
Gln Leu Lys Gln Ala Thr Thr Leu Asp Gln Val Arg Gln Ile Val Ile
2435 2440 2445
Asp Gly Leu Ser Glu Lys Leu Arg Val Thr Leu Gln Val Ser Asp Gly
2450 2455 2460
Glu Ser Val Asp Pro Thr Ile Pro Leu Ile Asp Gln Gly Val Asp Ser
2465 2470 2475 2480
Leu Gly Ala Val Thr Val Gly Ser Trp Phe Ser Lys Gln Leu Tyr Leu
2485 2490 2495
Asp Leu Pro Leu Leu Arg Val Leu Gly Gly Ala Ser Val Ala Asp Leu
2500 2505 2510
Ala Asp Asp Ala Ala Thr Arg Leu Pro Ala Thr Ser Ile Pro Leu Leu
2515 2520 2525
Leu Gln Ile Gly Asp Ser Thr Gly Thr Ser Asp Ser Gly Ala Ser Pro
2530 2535 2540
Thr Pro Thr Asp Ser His Asp Glu Ala Ser Ser Ala Thr Ser Thr Asp
2545 2550 2555 2560
Ala Ser Ser Ala Glu Glu Asp Glu Glu Gln Glu Asp Asp Asn Glu Gln
2565 2570 2575
Gly Gly Arg Lys Ile Leu Arg Arg Glu Arg Leu Ser Leu Gly Gln Glu
2580 2585 2590
Tyr Ser Trp Arg Gln Gln Gln Met Val Lys Asp His Thr Ile Phe Asn
2595 2600 2605
Asn Thr Ile Gly Met Phe Met Lys Gly Thr Ile Asp Leu Asp Arg Leu
2610 2615 2620
Arg Arg Ala Leu Lys Ala Ser Leu Arg Arg His Glu Ile Phe Arg Thr
2625 2630 2635 2640
Cys Phe Val Thr Gly Asp Asp Tyr Ser Ser Asp Leu Asn Gly Pro Val
2645 2650 2655
Gln Val Val Leu Lys Asn Pro Glu Asn Arg Val His Phe Val Gln Val
2660 2665 2670
Asn Asn Ala Ala Glu Ala Glu Glu Glu Tyr Arg Lys Leu Glu Lys Thr
2675 2680 2685
Asn Tyr Ser Ile Ser Thr Gly Asp Thr Leu Arg Leu Val Asp Phe Tyr
2690 2695 2700
Trp Gly Thr Asp Asp His Leu Leu Val Ile Gly Tyr His Arg Leu Val
2705 2710 2715 2720
Gly Asp Gly Ser Thr Thr Glu Asn Leu Phe Asn Glu Ile Gly Gln Ile
2725 2730 2735
Tyr Ser Gly Val Lys Met Gln Arg Pro Ser Thr Gln Phe Ser Asp Leu
2740 2745 2750
Ala Val Gln Gln Arg Glu Asn Leu Glu Asn Gly Arg Met Gly Asp Asp
2755 2760 2765
Ile Ala Phe Trp Lys Ser Met His Ser Lys Val Ser Ser Ser Ala Pro
2770 2775 2780
Thr Val Leu Pro Ile Met Asn Leu Ile Asn Asp Pro Ala Ala Asn Ser
2785 2790 2795 2800
Glu Gln Gln Gln Ile Gln Pro Phe Thr Trp Gln Gln Tyr Glu Ala Ile
2805 2810 2815
Ala Arg Leu Asp Pro Met Val Ala Phe Arg Ile Lys Glu Arg Ser Arg
2820 2825 2830
Lys His Lys Ala Thr Pro Met Gln Phe Tyr Leu Ala Ala Tyr His Val
2835 2840 2845
Leu Leu Ala Arg Leu Thr Gly Ser Lys Asp Ile Thr Ile Gly Leu Ala
2850 2855 2860
Glu Thr Asn Arg Ser Thr Met Glu Glu Ile Ser Ala Met Gly Phe Phe
2865 2870 2875 2880
Ala Asn Val Leu Pro Leu Arg Phe Asp Glu Phe Val Gly Ser Lys Thr
2885 2890 2895
Phe Gly Glu His Leu Val Ala Thr Lys Asp Ser Val Arg Glu Ala Met
2900 2905 2910
Gln His Ala Arg Val Pro Tyr Gly Val Ile Leu Asp Cys Leu Gly Leu
2915 2920 2925
Asn Leu Pro Thr Ser Gly Glu Glu Pro Lys Thr Gln Thr His Ala Pro
2930 2935 2940
Leu Phe Gln Ala Val Phe Asp Tyr Lys Gln Gly Gln Ala Glu Ser Gly
2945 2950 2955 2960
Ser Ile Gly Asn Ala Lys Met Thr Ser Val Leu Ala Ser Arg Glu Arg
2965 2970 2975
Thr Pro Tyr Asp Ile Val Leu Glu Met Trp Asp Asp Pro Thr Lys Asp
2980 2985 2990
Pro Leu Ile His Val Lys Leu Gln Ser Ser Leu Tyr Gly Pro Glu His
2995 3000 3005
Ala Gln Ala Phe Val Asp His Phe Ser Ser Ile Leu Thr Met Phe Ser
3010 3015 3020
Met Asn Pro Ala Leu Lys Leu Ala
3025 3030
<210> 4
<211> 7689
<212> DNA
<213> Penicillium citrinum
<220>
<221> CDS
<222> (1)..(7689)
<400> 4
atg aac aat acc ccc gcc gta acc gca acc gca acc gca acc gca acc 48
Met Asn Asn Thr Pro Ala Val Thr Ala Thr Ala Thr Ala Thr Ala Thr
1 5 10 15
gca acc gca atg gca ggc tcg gct tgc tct aac aca tcc acg ccc att 96
Ala Thr Ala Met Ala Gly Ser Ala Cys Ser Asn Thr Ser Thr Pro Ile
20 25 30
gcc ata gtt gga atg gga tgt cga ttt gct gga gat gca acg agt cca 144
Ala Ile Val Gly Met Gly Cys Arg Phe Ala Gly Asp Ala Thr Ser Pro
35 40 45
cag aag ctt tgg gaa atg gtt gaa aga gga ggc agt gcc tgg tct aag 192
Gln Lys Leu Trp Glu Met Val Glu Arg Gly Gly Ser Ala Trp Ser Lys
50 55 60
gtc ccc tcc tcg cga ttc aat gtg aga gga gta tac cac ccg aat ggc 240
Val Pro Ser Ser Arg Phe Asn Val Arg Gly Val Tyr His Pro Asn Gly
65 70 75 80
gaa agg gtc ggg tcc acc cac gta aag ggt gga cac ttc atc gac gag 288
Glu Arg Val Gly Ser Thr His Val Lys Gly Gly His Phe Ile Asp Glu
85 90 95
gat cct gct tta ttt gac gcc gcg ttc ttc aac atg acc aca gag gtc 336
Asp Pro Ala Leu Phe Asp Ala Ala Phe Phe Asn Met Thr Thr Glu Val
100 105 110
gcc agc tgc atg gat ccg cag tat cgg ctt atg ctt gag gtg gtc tac 384
Ala Ser Cys Met Asp Pro Gln Tyr Arg Leu Met Leu Glu Val Val Tyr
115 120 125
gaa tcg ctg gag agt gcc ggt atc acc atc gat ggt atg gca ggc tct 432
Glu Ser Leu Glu Ser Ala Gly Ile Thr Ile Asp Gly Met Ala Gly Ser
130 135 140
aat acg tcg gtg ttt ggg ggt gtc atg tac cac gac tat cag gat tcg 480
Asn Thr Ser Val Phe Gly Gly Val Met Tyr His Asp Tyr Gln Asp Ser
145 150 155 160
ctc aat cgt gac ccc gag aca gtt ccg cgt tat ttc ata act ggc aac 528
Leu Asn Arg Asp Pro Glu Thr Val Pro Arg Tyr Phe Ile Thr Gly Asn
165 170 175
tca gga aca atg ctt tcg aac cgg ata tca cac ttc tac gac tta cgt 576
Ser Gly Thr Met Leu Ser Asn Arg Ile Ser His Phe Tyr Asp Leu Arg
180 185 190
ggt ccc agc gtg acg gtt gac acg gcc tgt tcg acg aca ttg acc gca 624
Gly Pro Ser Val Thr Val Asp Thr Ala Cys Ser Thr Thr Leu Thr Ala
195 200 205
ctg cac ttg gcg tgc cag agc tta cgt act ggg gag tca gat aca gcc 672
Leu His Leu Ala Cys Gln Ser Leu Arg Thr Gly Glu Ser Asp Thr Ala
210 215 220
atc gtt atc ggt gca aat ctt ctg ctc aat ccc gat gtt ttt gtt acg 720
Ile Val Ile Gly Ala Asn Leu Leu Leu Asn Pro Asp Val Phe Val Thr
225 230 235 240
atg tca aac ctg gga ttt ttg tcc ccg gat ggt atc tcg tac tct ttt 768
Met Ser Asn Leu Gly Phe Leu Ser Pro Asp Gly Ile Ser Tyr Ser Phe
245 250 255
gat cct cga gcg aat gga tat ggt cgc ggg gaa gga att gcc gct ctg 816
Asp Pro Arg Ala Asn Gly Tyr Gly Arg Gly Glu Gly Ile Ala Ala Leu
260 265 270
gta ata aag gcc ctc cct aac gcg ttg cga gac caa gac cct atc cga 864
Val Ile Lys Ala Leu Pro Asn Ala Leu Arg Asp Gln Asp Pro Ile Arg
275 280 285
gcc gtc att cga gag aca gcg ctg aac cag gat ggc aaa aca ccc gca 912
Ala Val Ile Arg Glu Thr Ala Leu Asn Gln Asp Gly Lys Thr Pro Ala
290 295 300
att act gcg ccg agt gat gtg gcg cag aaa agt ctg atc cag gag tgt 960
Ile Thr Ala Pro Ser Asp Val Ala Gln Lys Ser Leu Ile Gln Glu Cys
305 310 315 320
tac gat aag gct ggg cta gat atg tcg ttg acc tcg tac gtg gag gcc 1008
Tyr Asp Lys Ala Gly Leu Asp Met Ser Leu Thr Ser Tyr Val Glu Ala
325 330 335
cac gga act gga aca cca act ggt gac ccc ctt gaa atc tca gca att 1056
His Gly Thr Gly Thr Pro Thr Gly Asp Pro Leu Glu Ile Ser Ala Ile
340 345 350
tca gca gct ttt aaa gga cat cct ctg cac ctt ggc tct gtg aaa gca 1104
Ser Ala Ala Phe Lys Gly His Pro Leu His Leu Gly Ser Val Lys Ala
355 360 365
aat att ggc cat aca gaa gcc gcc agt ggc ctg gcc agt ata atc aag 1152
Asn Ile Gly His Thr Glu Ala Ala Ser Gly Leu Ala Ser Ile Ile Lys
370 375 380
gtg gcc ttg gcc ttg gag aag ggc ttg att ccc cct aat gcg cgg ttc 1200
Val Ala Leu Ala Leu Glu Lys Gly Leu Ile Pro Pro Asn Ala Arg Phe
385 390 395 400
ctg caa aag aac agc aag ctg atg ctt gac caa aag aac atc aag atc 1248
Leu Gln Lys Asn Ser Lys Leu Met Leu Asp Gln Lys Asn Ile Lys Ile
405 410 415
ccc atg tct gct caa gac tgg cct gtg aaa gat ggg act cgt cgc gca 1296
Pro Met Ser Ala Gln Asp Trp Pro Val Lys Asp Gly Thr Arg Arg Ala
420 425 430
tct gtc aat aac ttc ggc ttt ggt ggt tcg aat gct cac gtc att ttg 1344
Ser Val Asn Asn Phe Gly Phe Gly Gly Ser Asn Ala His Val Ile Leu
435 440 445
gaa tca tat gat cgc gca tca ttg gcc ctg cca gag gat caa gtg cat 1392
Glu Ser Tyr Asp Arg Ala Ser Leu Ala Leu Pro Glu Asp Gln Val His
450 455 460
gtc aat ggt aac tct gag cat ggt agg gtt gag gat ggt tcc aaa cag 1440
Val Asn Gly Asn Ser Glu His Gly Arg Val Glu Asp Gly Ser Lys Gln
465 470 475 480
agc cgc ata tac gtt gtg cgt gcc aag gac gag caa gct tgt cgg cga 1488
Ser Arg Ile Tyr Val Val Arg Ala Lys Asp Glu Gln Ala Cys Arg Arg
485 490 495
acg ata gca agc ctg cga gac tac att aaa tcc gtc gct gac att gac 1536
Thr Ile Ala Ser Leu Arg Asp Tyr Ile Lys Ser Val Ala Asp Ile Asp
500 505 510
ggg gaa ccc ttc ctc gcc agc ctc gcc tat aca cta ggc tct cgc cgt 1584
Gly Glu Pro Phe Leu Ala Ser Leu Ala Tyr Thr Leu Gly Ser Arg Arg
515 520 525
tcc att ctg cca tgg acg tca gtg tat gta gca gac agc ctt ggc ggc 1632
Ser Ile Leu Pro Trp Thr Ser Val Tyr Val Ala Asp Ser Leu Gly Gly
530 535 540
ctt gtt tct gcc ctc agc gat gag tcc aat caa cca aaa cga gcg aat 1680
Leu Val Ser Ala Leu Ser Asp Glu Ser Asn Gln Pro Lys Arg Ala Asn
545 550 555 560
gag aaa gta cgg ctc gga ttt gta ttc acc ggt cag ggg gcg cag tgg 1728
Glu Lys Val Arg Leu Gly Phe Val Phe Thr Gly Gln Gly Ala Gln Trp
565 570 575
cat gca atg ggc aga gag ctg gtc aat aca ttc cca gta ttc aaa cag 1776
His Ala Met Gly Arg Glu Leu Val Asn Thr Phe Pro Val Phe Lys Gln
580 585 590
gcg att ctt gaa tgt gat ggc tac atc aag caa ctg ggc gcg agt tgg 1824
Ala Ile Leu Glu Cys Asp Gly Tyr Ile Lys Gln Leu Gly Ala Ser Trp
595 600 605
aat ttt atg gag gag ctc cac cgt gat gag ctg acg act cgg gta aat 1872
Asn Phe Met Glu Glu Leu His Arg Asp Glu Leu Thr Thr Arg Val Asn
610 615 620
gat gcc gaa tac agt cta cca ctg tca acc gct atc caa att gca ctt 1920
Asp Ala Glu Tyr Ser Leu Pro Leu Ser Thr Ala Ile Gln Ile Ala Leu
625 630 635 640
gtg cgt ctc ctt tgg tca tgg gga att cgg cca acg ggg ata acc agt 1968
Val Arg Leu Leu Trp Ser Trp Gly Ile Arg Pro Thr Gly Ile Thr Ser
645 650 655
cac tca agt gga gag gct gct gct gcc tac gca gct ggg gct tta tcc 2016
His Ser Ser Gly Glu Ala Ala Ala Ala Tyr Ala Ala Gly Ala Leu Ser
660 665 670
gcg cgg tcg gcc att ggg atc act tat ata cgc ggt gta ttg acc act 2064
Ala Arg Ser Ala Ile Gly Ile Thr Tyr Ile Arg Gly Val Leu Thr Thr
675 680 685
aag ccc aag ccc gca ttg gca gcc aaa gga gga atg atg gcg gtg ggt 2112
Lys Pro Lys Pro Ala Leu Ala Ala Lys Gly Gly Met Met Ala Val Gly
690 695 700
ctt ggt cgc agt gag acc aat gtt tac att tcg cgt ctc aac cag gag 2160
Leu Gly Arg Ser Glu Thr Asn Val Tyr Ile Ser Arg Leu Asn Gln Glu
705 710 715 720
gac ggc tgt gtg gtg gtt gga tgt atc aac agt caa tgt agt gtg acg 2208
Asp Gly Cys Val Val Val Gly Cys Ile Asn Ser Gln Cys Ser Val Thr
725 730 735
gtg tcg gga gat ttg ggt gca atc gag aaa ctt gaa aag ttg tta cac 2256
Val Ser Gly Asp Leu Gly Ala Ile Glu Lys Leu Glu Lys Leu Leu His
740 745 750
gcc gat ggc atc ttt acc agg aaa ctg aaa gtc act gaa gcc ttc cat 2304
Ala Asp Gly Ile Phe Thr Arg Lys Leu Lys Val Thr Glu Ala Phe His
755 760 765
tca agc cac atg cga cca atg gca gat gcc ttt ggg gcg tca ctg aga 2352
Ser Ser His Met Arg Pro Met Ala Asp Ala Phe Gly Ala Ser Leu Arg
770 775 780
gat ctg ttc aac tcg gat aac aac aac gac aat ccc aat gct gac acc 2400
Asp Leu Phe Asn Ser Asp Asn Asn Asn Asp Asn Pro Asn Ala Asp Thr
785 790 795 800
tca aag ggt gta tta tat tca tca cct aag act ggt agt cgc atg acc 2448
Ser Lys Gly Val Leu Tyr Ser Ser Pro Lys Thr Gly Ser Arg Met Thr
805 810 815
gat ctt aaa ttg cta ttg gat ccc aca cac tgg atg gat agt atg cta 2496
Asp Leu Lys Leu Leu Leu Asp Pro Thr His Trp Met Asp Ser Met Leu
820 825 830
cag ccg gta gag ttc gag tcc tca ctc cgc gag atg tgc ttt gat ccc 2544
Gln Pro Val Glu Phe Glu Ser Ser Leu Arg Glu Met Cys Phe Asp Pro
835 840 845
aac acc aaa gag aaa gcc gtc gat gtg att att gaa ata ggg cct cac 2592
Asn Thr Lys Glu Lys Ala Val Asp Val Ile Ile Glu Ile Gly Pro His
850 855 860
gga gcg ctt ggt ggt cca atc aac caa gtc atg cag gat ctg ggt ctg 2640
Gly Ala Leu Gly Gly Pro Ile Asn Gln Val Met Gln Asp Leu Gly Leu
865 870 875 880
aaa gga aca gat ata aac tat ctc agt tgc ctt tct cgc ggc aga agc 2688
Lys Gly Thr Asp Ile Asn Tyr Leu Ser Cys Leu Ser Arg Gly Arg Ser
885 890 895
tcg ttg gag aca atg tat cgt gct gct acg gag ttg ata agc aag ggt 2736
Ser Leu Glu Thr Met Tyr Arg Ala Ala Thr Glu Leu Ile Ser Lys Gly
900 905 910
tat ggg ctc aaa atg gac gct ata aac ttt cct cat gga aga aaa gag 2784
Tyr Gly Leu Lys Met Asp Ala Ile Asn Phe Pro His Gly Arg Lys Glu
915 920 925
ccc aga gtg aag gta ctg agc gat ttg ccg gcg tac ccg tgg aat cac 2832
Pro Arg Val Lys Val Leu Ser Asp Leu Pro Ala Tyr Pro Trp Asn His
930 935 940
caa acc cgt tat tgg aga gag cct cgc ggc agt cgt gag tcc aaa cag 2880
Gln Thr Arg Tyr Trp Arg Glu Pro Arg Gly Ser Arg Glu Ser Lys Gln
945 950 955 960
aga acc cat ccg cct cac act ttg ata ggc tca cgg gaa tct ctc tct 2928
Arg Thr His Pro Pro His Thr Leu Ile Gly Ser Arg Glu Ser Leu Ser
965 970 975
cct cat ttc gcg cct aaa tgg aaa cat gtt ctc cgt ctg tca gat att 2976
Pro His Phe Ala Pro Lys Trp Lys His Val Leu Arg Leu Ser Asp Ile
980 985 990
cca tgg ata cga gat cac gtc gtt ggt tcg agc atc atc ttt ccg gga 3024
Pro Trp Ile Arg Asp His Val Val Gly Ser Ser Ile Ile Phe Pro Gly
995 1000 1005
gct ggc ttc atc agc atg gcc atc gag ggg ttt tca caa gtc tgc cca 3072
Ala Gly Phe Ile Ser Met Ala Ile Glu Gly Phe Ser Gln Val Cys Pro
1010 1015 1020
cca gtt gcg ggg gct agc atc aac tac aac ttg cgt gac gtt gaa ctc 3120
Pro Val Ala Gly Ala Ser Ile Asn Tyr Asn Leu Arg Asp Val Glu Leu
1025 1030 1035 1040
gcg cag gct ctc ata ata ccc gct gat gca gaa gca gag gtt gac ctg 3168
Ala Gln Ala Leu Ile Ile Pro Ala Asp Ala Glu Ala Glu Val Asp Leu
1045 1050 1055
cgc cta acg atc cgt tca tgt gag gaa agg tcc ctc ggc aca aag aac 3216
Arg Leu Thr Ile Arg Ser Cys Glu Glu Arg Ser Leu Gly Thr Lys Asn
1060 1065 1070
tgg cat caa ttt tct gtg cac tca att tcg ggc gaa aat aat acc tgg 3264
Trp His Gln Phe Ser Val His Ser Ile Ser Gly Glu Asn Asn Thr Trp
1075 1080 1085
aca gaa cac tgc acc gga tta ata cgt tcg gag agc gaa aga agc cac 3312
Thr Glu His Cys Thr Gly Leu Ile Arg Ser Glu Ser Glu Arg Ser His
1090 1095 1100
ctt gac tgt tca act gtg gaa gcc tca cgc agg ttg aat cta ggc tca 3360
Leu Asp Cys Ser Thr Val Glu Ala Ser Arg Arg Leu Asn Leu Gly Ser
1105 1110 1115 1120
gat aac cgg agc att gat ccc aac gat ctc tgg gag tcc tta cac gcg 3408
Asp Asn Arg Ser Ile Asp Pro Asn Asp Leu Trp Glu Ser Leu His Ala
1125 1130 1135
aat ggg ata tgc cac gga ccc att ttt cag aac att cag cga att caa 3456
Asn Gly Ile Cys His Gly Pro Ile Phe Gln Asn Ile Gln Arg Ile Gln
1140 1145 1150
aac aat gga cag ggc tcg ttt tgc aga ttt tcc att gct gac act gcc 3504
Asn Asn Gly Gln Gly Ser Phe Cys Arg Phe Ser Ile Ala Asp Thr Ala
1155 1160 1165
tcg gct atg cct cac tcg tac gag aat cga cac atc gtc cat cct act 3552
Ser Ala Met Pro His Ser Tyr Glu Asn Arg His Ile Val His Pro Thr
1170 1175 1180
act ctg gac tcg gtg atc cag gcg gca tac acg gtg tta ccc tac gcg 3600
Thr Leu Asp Ser Val Ile Gln Ala Ala Tyr Thr Val Leu Pro Tyr Ala
1185 1190 1195 1200
gga aca cgt atg aaa acg gcc atg gta cca agg agg cta aga aat gtc 3648
Gly Thr Arg Met Lys Thr Ala Met Val Pro Arg Arg Leu Arg Asn Val
1205 1210 1215
aaa ata tcc tct agc ctg gct gac ttg gag gct ggt gat gct ctg gac 3696
Lys Ile Ser Ser Ser Leu Ala Asp Leu Glu Ala Gly Asp Ala Leu Asp
1220 1225 1230
gca cag gcc agc atc aag gat cgc aac tct caa tcc ttc tct acc gac 3744
Ala Gln Ala Ser Ile Lys Asp Arg Asn Ser Gln Ser Phe Ser Thr Asp
1235 1240 1245
ttg gca gtg ttt gat gac tat gat agc ggt tct tct ccc tcg gac gga 3792
Leu Ala Val Phe Asp Asp Tyr Asp Ser Gly Ser Ser Pro Ser Asp Gly
1250 1255 1260
atc cca gtc ata gag att gaa ggc ctt gtt ttc cag tcg gtt gga agc 3840
Ile Pro Val Ile Glu Ile Glu Gly Leu Val Phe Gln Ser Val Gly Ser
1265 1270 1275 1280
agc ttc tct gac caa aag tca gac tcc aac gac aca gaa aat gcc tgc 3888
Ser Phe Ser Asp Gln Lys Ser Asp Ser Asn Asp Thr Glu Asn Ala Cys
1285 1290 1295
agc tcc tgg gtt tgg gcc cct gac atc agc ttg ggt gac tcc act tgg 3936
Ser Ser Trp Val Trp Ala Pro Asp Ile Ser Leu Gly Asp Ser Thr Trp
1300 1305 1310
ctc aaa gaa aag ttg agc act gag gct gag acg aaa gaa acg gaa ctc 3984
Leu Lys Glu Lys Leu Ser Thr Glu Ala Glu Thr Lys Glu Thr Glu Leu
1315 1320 1325
atg atg gac ctc cga aga tgc acg atc aac ttt ata cag gag gct gtc 4032
Met Met Asp Leu Arg Arg Cys Thr Ile Asn Phe Ile Gln Glu Ala Val
1330 1335 1340
act gat ttg aca aat tct gat atc caa cat ctg gat ggc cac ctt cag 4080
Thr Asp Leu Thr Asn Ser Asp Ile Gln His Leu Asp Gly His Leu Gln
1345 1350 1355 1360
aag tat ttc gat tgg atg aat gtc caa ttg gac ctt gcg aga caa aac 4128
Lys Tyr Phe Asp Trp Met Asn Val Gln Leu Asp Leu Ala Arg Gln Asn
1365 1370 1375
aag ctc agc cca gcc agt tgc gac tgg cta agt gac gat gct gag cag 4176
Lys Leu Ser Pro Ala Ser Cys Asp Trp Leu Ser Asp Asp Ala Glu Gln
1380 1385 1390
aag aaa tgc cta cag gcc aga gtc gct gga gaa agc gtc aat ggc gag 4224
Lys Lys Cys Leu Gln Ala Arg Val Ala Gly Glu Ser Val Asn Gly Glu
1395 1400 1405
atg att tct cgt cta gga cct cag tta ata gca atg cta cgc cgc gaa 4272
Met Ile Ser Arg Leu Gly Pro Gln Leu Ile Ala Met Leu Arg Arg Glu
1410 1415 1420
aca gag cca ctt gag ttg atg atg caa gat cag ctg cta agc aga tac 4320
Thr Glu Pro Leu Glu Leu Met Met Gln Asp Gln Leu Leu Ser Arg Tyr
1425 1430 1435 1440
tac gtc aac gca atc aaa tgg agc cga tca aac gca caa gcc agc gag 4368
Tyr Val Asn Ala Ile Lys Trp Ser Arg Ser Asn Ala Gln Ala Ser Glu
1445 1450 1455
ctg atc cga ctt tgc gcc cac aag aac ccg cgt tct cgc att ttg gag 4416
Leu Ile Arg Leu Cys Ala His Lys Asn Pro Arg Ser Arg Ile Leu Glu
1460 1465 1470
att ggc gga ggc acg ggc ggc tgc aca aag ctt att gtc aat gca ttg 4464
Ile Gly Gly Gly Thr Gly Gly Cys Thr Lys Leu Ile Val Asn Ala Leu
1475 1480 1485
gga aac acc aag ccg atc gat cgt tat gac ttc acc gat gtg tct gcc 4512
Gly Asn Thr Lys Pro Ile Asp Arg Tyr Asp Phe Thr Asp Val Ser Ala
1490 1495 1500
ggg ttt ttc gag tcg gcg cgt gag caa ttt gcg gat tgg caa gac gtg 4560
Gly Phe Phe Glu Ser Ala Arg Glu Gln Phe Ala Asp Trp Gln Asp Val
1505 1510 1515 1520
atg act ttc aaa aaa ttg gat att gaa agc gat ccc gag caa caa ggg 4608
Met Thr Phe Lys Lys Leu Asp Ile Glu Ser Asp Pro Glu Gln Gln Gly
1525 1530 1535
ttt gaa tgt gcc acc tac gat gtg gtc gtg gct tgc cag gtc ctg cat 4656
Phe Glu Cys Ala Thr Tyr Asp Val Val Val Ala Cys Gln Val Leu His
1540 1545 1550
gca act cga tgc atg aaa cga aca ctg agt aac gtt cga aaa ttg ctc 4704
Ala Thr Arg Cys Met Lys Arg Thr Leu Ser Asn Val Arg Lys Leu Leu
1555 1560 1565
aag cct ggg ggc aac ttg att ttg gtt gag act acc agg gat cag ctc 4752
Lys Pro Gly Gly Asn Leu Ile Leu Val Glu Thr Thr Arg Asp Gln Leu
1570 1575 1580
gat ttg ttc ttt acc ttc gga ctg ttg cca ggt tgg tgg ctc agt gag 4800
Asp Leu Phe Phe Thr Phe Gly Leu Leu Pro Gly Trp Trp Leu Ser Glu
1585 1590 1595 1600
gag cct gag cgg aag tcg acg cca tcg ctc act acc gat ctt tgg aac 4848
Glu Pro Glu Arg Lys Ser Thr Pro Ser Leu Thr Thr Asp Leu Trp Asn
1605 1610 1615
acc atg ttg gac acg agc ggt ttc aac ggt gtg gaa ttg gag gtt cgt 4896
Thr Met Leu Asp Thr Ser Gly Phe Asn Gly Val Glu Leu Glu Val Arg
1620 1625 1630
gat tgt gaa gac gat gag ttt tac atg atc agc aca atg cta tcg acg 4944
Asp Cys Glu Asp Asp Glu Phe Tyr Met Ile Ser Thr Met Leu Ser Thr
1635 1640 1645
gct aga aaa gag aat aca acc ccg gat aca gtg gca gaa tcg gag gtg 4992
Ala Arg Lys Glu Asn Thr Thr Pro Asp Thr Val Ala Glu Ser Glu Val
1650 1655 1660
ctt ttg ctg cac gga gcg ctc cga cct cct tca tct tgg ctg gaa agt 5040
Leu Leu Leu His Gly Ala Leu Arg Pro Pro Ser Ser Trp Leu Glu Ser
1665 1670 1675 1680
ctc cag gca gca att tgt gaa aag acc agt tct agc cca tcg atc aac 5088
Leu Gln Ala Ala Ile Cys Glu Lys Thr Ser Ser Ser Pro Ser Ile Asn
1685 1690 1695
gct ctg ggc gag gta gat acc act gga agg aca tgc att ttt ctt ggg 5136
Ala Leu Gly Glu Val Asp Thr Thr Gly Arg Thr Cys Ile Phe Leu Gly
1700 1705 1710
gaa atg gag tcc tcg ctc ctt gga gag gtg gga agc gag acc ttc aaa 5184
Glu Met Glu Ser Ser Leu Leu Gly Glu Val Gly Ser Glu Thr Phe Lys
1715 1720 1725
tcc atc acc gcg atg ctg aat aac tgc aac gca ctt ctc tgg gtg tct 5232
Ser Ile Thr Ala Met Leu Asn Asn Cys Asn Ala Leu Leu Trp Val Ser
1730 1735 1740
aga gga gca gcc atg agc tcc gag gat cca tgg aaa gct cta cat att 5280
Arg Gly Ala Ala Met Ser Ser Glu Asp Pro Trp Lys Ala Leu His Ile
1745 1750 1755 1760
ggt ctg ctg cgt acc atc cgc aac gaa aat aac ggg aag gaa tat gta 5328
Gly Leu Leu Arg Thr Ile Arg Asn Glu Asn Asn Gly Lys Glu Tyr Val
1765 1770 1775
tcg ttg gat ctc gat cct tct cga aac gca tac acc cac gag tcc ctg 5376
Ser Leu Asp Leu Asp Pro Ser Arg Asn Ala Tyr Thr His Glu Ser Leu
1780 1785 1790
tat gct atc tgc aat atc ttc aat ggc cgc ctc ggc gac ctt tcc gaa 5424
Tyr Ala Ile Cys Asn Ile Phe Asn Gly Arg Leu Gly Asp Leu Ser Glu
1795 1800 1805
gac aag gag ttt gaa ttt gca gag aga aac ggc gtc atc cac gta ccg 5472
Asp Lys Glu Phe Glu Phe Ala Glu Arg Asn Gly Val Ile His Val Pro
1810 1815 1820
cga ctt ttc aat gac ccg cac tgg aag gac caa gaa gcg gtt gag gtc 5520
Arg Leu Phe Asn Asp Pro His Trp Lys Asp Gln Glu Ala Val Glu Val
1825 1830 1835 1840
aca ctg cag ccg ttc gag caa ccc ggg cgt cgt ctg cgg atg gag gtt 5568
Thr Leu Gln Pro Phe Glu Gln Pro Gly Arg Arg Leu Arg Met Glu Val
1845 1850 1855
gag acg cca ggg ctc tta gac tcc ctg caa ttt cga gac gac gaa gga 5616
Glu Thr Pro Gly Leu Leu Asp Ser Leu Gln Phe Arg Asp Asp Glu Gly
1860 1865 1870
cgt gaa ggc aag gat ctt ccg gat gat tgg gta gaa atc gaa ccc aaa 5664
Arg Glu Gly Lys Asp Leu Pro Asp Asp Trp Val Glu Ile Glu Pro Lys
1875 1880 1885
gct ttc ggt ctc aat ttt cgg gat gtc atg gtt gcc atg ggt caa ttg 5712
Ala Phe Gly Leu Asn Phe Arg Asp Val Met Val Ala Met Gly Gln Leu
1890 1895 1900
gag gcc aac cgt gtg atg ggc ttc gaa tgc gcc gga gtg atc aca aag 5760
Glu Ala Asn Arg Val Met Gly Phe Glu Cys Ala Gly Val Ile Thr Lys
1905 1910 1915 1920
ctc ggt gga gct gct gcc gct agc caa ggc ctc aga tta ggg gac cgc 5808
Leu Gly Gly Ala Ala Ala Ala Ser Gln Gly Leu Arg Leu Gly Asp Arg
1925 1930 1935
gta tgt gca cta ctg aaa ggc cat tgg gcg acc aga aca cag acg ccg 5856
Val Cys Ala Leu Leu Lys Gly His Trp Ala Thr Arg Thr Gln Thr Pro
1940 1945 1950
tac act aat gtc gtc cgt att ccg gac gaa atg ggc ttc cca gaa gcc 5904
Tyr Thr Asn Val Val Arg Ile Pro Asp Glu Met Gly Phe Pro Glu Ala
1955 1960 1965
gct tcg gtc ccc ctg gct ttc act acc gca tat att gcg ctt tat acc 5952
Ala Ser Val Pro Leu Ala Phe Thr Thr Ala Tyr Ile Ala Leu Tyr Thr
1970 1975 1980
acg gca aag cta cga cga ggc gaa aga gtc ttg atc cac agt gga gct 6000
Thr Ala Lys Leu Arg Arg Gly Glu Arg Val Leu Ile His Ser Gly Ala
1985 1990 1995 2000
gga ggc gtc ggt caa gca gcg atc att ttg tcc cag ctt gcg ggt gcc 6048
Gly Gly Val Gly Gln Ala Ala Ile Ile Leu Ser Gln Leu Ala Gly Ala
2005 2010 2015
gag gtc ttc gtc aca gcg gga act caa gcc aag cgt gac ttt gtc ggc 6096
Glu Val Phe Val Thr Ala Gly Thr Gln Ala Lys Arg Asp Phe Val Gly
2020 2025 2030
gat aaa ttc ggc atc aat ccg gat cat atc ttc tcg agc agg aat gac 6144
Asp Lys Phe Gly Ile Asn Pro Asp His Ile Phe Ser Ser Arg Asn Asp
2035 2040 2045
tta ttc gtc gac ggc atc aaa gcc tac acg ggc gga ctt ggc gtt cat 6192
Leu Phe Val Asp Gly Ile Lys Ala Tyr Thr Gly Gly Leu Gly Val His
2050 2055 2060
gtc gtt cta aac tca ttg gca ggt caa ctc ctc caa gca agc ttt gac 6240
Val Val Leu Asn Ser Leu Ala Gly Gln Leu Leu Gln Ala Ser Phe Asp
2065 2070 2075 2080
tgc atg gcc gaa ttc ggc aga ttt gtt gag att gga aaa aag gac ctg 6288
Cys Met Ala Glu Phe Gly Arg Phe Val Glu Ile Gly Lys Lys Asp Leu
2085 2090 2095
gag caa aac agc aga ctt gac atg ctg cca ttc acc cgg gac gtc tct 6336
Glu Gln Asn Ser Arg Leu Asp Met Leu Pro Phe Thr Arg Asp Val Ser
2100 2105 2110
ttc aca tca att gat ctt ctc tcg tgg caa aga gcc aaa agt gaa gaa 6384
Phe Thr Ser Ile Asp Leu Leu Ser Trp Gln Arg Ala Lys Ser Glu Glu
2115 2120 2125
gta tcc gaa gcg ttg aac cat gtc aca aaa ctc ctc gag aca aaa gcg 6432
Val Ser Glu Ala Leu Asn His Val Thr Lys Leu Leu Glu Thr Lys Ala
2130 2135 2140
att ggc ttg att ggt cca atc cag cag cac tcc ttg tca aac atc gag 6480
Ile Gly Leu Ile Gly Pro Ile Gln Gln His Ser Leu Ser Asn Ile Glu
2145 2150 2155 2160
aag gcc ttc cgt acg atg cag agt ggt cag cat gtt ggc aaa gtt gtg 6528
Lys Ala Phe Arg Thr Met Gln Ser Gly Gln His Val Gly Lys Val Val
2165 2170 2175
gtc aat gta tct ggg gac gaa ctg gtc cca gtc ggc gat gga ggg ttc 6576
Val Asn Val Ser Gly Asp Glu Leu Val Pro Val Gly Asp Gly Gly Phe
2180 2185 2190
tcg ctg aag ctg aag cct gac agt tct tac cta gtt gct ggt ggg ctg 6624
Ser Leu Lys Leu Lys Pro Asp Ser Ser Tyr Leu Val Ala Gly Gly Leu
2195 2200 2205
ggg gga att gga aag cag atc tgt cag tgg ctt gtt gat cat ggc gcg 6672
Gly Gly Ile Gly Lys Gln Ile Cys Gln Trp Leu Val Asp His Gly Ala
2210 2215 2220
aag cac ttg att atc cta tcg aga agt gca aag gcc agt cca ttc ata 6720
Lys His Leu Ile Ile Leu Ser Arg Ser Ala Lys Ala Ser Pro Phe Ile
2225 2230 2235 2240
acc agc ttg caa aat caa cag tgc gct gtc tat cta cac gca tgt gac 6768
Thr Ser Leu Gln Asn Gln Gln Cys Ala Val Tyr Leu His Ala Cys Asp
2245 2250 2255
atc tca gat caa gat cag gtc acc aag gtg ctc cgg ttg tgc gaa gaa 6816
Ile Ser Asp Gln Asp Gln Val Thr Lys Val Leu Arg Leu Cys Glu Glu
2260 2265 2270
gca cat gca ccg cca att cga ggt atc ata caa ggt gcc atg gtt ctc 6864
Ala His Ala Pro Pro Ile Arg Gly Ile Ile Gln Gly Ala Met Val Leu
2275 2280 2285
aag gac gcg ctt cta tcg cga atg aca ttg gat gaa ttt aat gca gca 6912
Lys Asp Ala Leu Leu Ser Arg Met Thr Leu Asp Glu Phe Asn Ala Ala
2290 2295 2300
aca cgc cca aaa gta cag ggt agt tgg tat ctt cac aag atc gca cag 6960
Thr Arg Pro Lys Val Gln Gly Ser Trp Tyr Leu His Lys Ile Ala Gln
2305 2310 2315 2320
gat gtt gac ttc ttc gtg atg ctc tca tcc ctt gtt ggg gtc atg ggt 7008
Asp Val Asp Phe Phe Val Met Leu Ser Ser Leu Val Gly Val Met Gly
2325 2330 2335
ggg gca ggc cag gcc aat tac gca gct gct ggt gca ttc cag gac gca 7056
Gly Ala Gly Gln Ala Asn Tyr Ala Ala Ala Gly Ala Phe Gln Asp Ala
2340 2345 2350
ctt gcg cac cac cgg aga gcc cat ggc atg ccg gct gtc acc att gac 7104
Leu Ala His His Arg Arg Ala His Gly Met Pro Ala Val Thr Ile Asp
2355 2360 2365
ttg ggc atg gtc aag tct gtt gga tac gtg gct gaa act ggc cgt ggt 7152
Leu Gly Met Val Lys Ser Val Gly Tyr Val Ala Glu Thr Gly Arg Gly
2370 2375 2380
gtg gcc gac cgg ctc gct aga ata ggt tac aag cct atg cat gaa aag 7200
Val Ala Asp Arg Leu Ala Arg Ile Gly Tyr Lys Pro Met His Glu Lys
2385 2390 2395 2400
gac gtc atg gat gtg ttg gag aag gca atc ctg tgt tct tcc cct caa 7248
Asp Val Met Asp Val Leu Glu Lys Ala Ile Leu Cys Ser Ser Pro Gln
2405 2410 2415
ttt cca tca cct ccc gca gct gtg gtt aca gga atc aac aca tcc ccg 7296
Phe Pro Ser Pro Pro Ala Ala Val Val Thr Gly Ile Asn Thr Ser Pro
2420 2425 2430
ggt gct cac tgg acc gag gca aac tgg ata cag gaa cag cgg ttt gtg 7344
Gly Ala His Trp Thr Glu Ala Asn Trp Ile Gln Glu Gln Arg Phe Val
2435 2440 2445
gga ctt aaa tac cgc caa gtc ctt cat gca gac caa tcc ttt gtc tct 7392
Gly Leu Lys Tyr Arg Gln Val Leu His Ala Asp Gln Ser Phe Val Ser
2450 2455 2460
tcg cat aaa aaa gga cca gat ggc gtg cgg gcc caa cta agc agg gtc 7440
Ser His Lys Lys Gly Pro Asp Gly Val Arg Ala Gln Leu Ser Arg Val
2465 2470 2475 2480
acc tct cac gac gag gcc att tct atc gtc ctc aaa gca atg acg gaa 7488
Thr Ser His Asp Glu Ala Ile Ser Ile Val Leu Lys Ala Met Thr Glu
2485 2490 2495
aag ctg atg cga atg ttt ggt ctg gca gaa gac gac atg tcc tcg tcc 7536
Lys Leu Met Arg Met Phe Gly Leu Ala Glu Asp Asp Met Ser Ser Ser
2500 2505 2510
aaa aac ctg gca ggt gtc ggc gta gac tca ctc gtc gcc att gaa ctt 7584
Lys Asn Leu Ala Gly Val Gly Val Asp Ser Leu Val Ala Ile Glu Leu
2515 2520 2525
cga aac tgg atc aca tct gaa atc cat gtt gat gtg tcg atc ttt gag 7632
Arg Asn Trp Ile Thr Ser Glu Ile His Val Asp Val Ser Ile Phe Glu
2530 2535 2540
ctc atg aat ggt aac acc atc gcc ggc ctc gtc gag tta gtt gtg gcg 7680
Leu Met Asn Gly Asn Thr Ile Ala Gly Leu Val Glu Leu Val Val Ala
2545 2550 2555 2560
aaa tgc agt 7689
Lys Cys Ser
<210> 5
<211> 2563
<212> PRT
<213> Penicillium citrinum
<400> 5
Met Asn Asn Thr Pro Ala Val Thr Ala Thr Ala Thr Ala Thr Ala Thr
1 5 10 15
Ala Thr Ala Met Ala Gly Ser Ala Cys Ser Asn Thr Ser Thr Pro Ile
20 25 30
Ala Ile Val Gly Met Gly Cys Arg Phe Ala Gly Asp Ala Thr Ser Pro
35 40 45
Gln Lys Leu Trp Glu Met Val Glu Arg Gly Gly Ser Ala Trp Ser Lys
50 55 60
Val Pro Ser Ser Arg Phe Asn Val Arg Gly Val Tyr His Pro Asn Gly
65 70 75 80
Glu Arg Val Gly Ser Thr His Val Lys Gly Gly His Phe Ile Asp Glu
85 90 95
Asp Pro Ala Leu Phe Asp Ala Ala Phe Phe Asn Met Thr Thr Glu Val
100 105 110
Ala Ser Cys Met Asp Pro Gln Tyr Arg Leu Met Leu Glu Val Val Tyr
115 120 125
Glu Ser Leu Glu Ser Ala Gly Ile Thr Ile Asp Gly Met Ala Gly Ser
130 135 140
Asn Thr Ser Val Phe Gly Gly Val Met Tyr His Asp Tyr Gln Asp Ser
145 150 155 160
Leu Asn Arg Asp Pro Glu Thr Val Pro Arg Tyr Phe Ile Thr Gly Asn
165 170 175
Ser Gly Thr Met Leu Ser Asn Arg Ile Ser His Phe Tyr Asp Leu Arg
180 185 190
Gly Pro Ser Val Thr Val Asp Thr Ala Cys Ser Thr Thr Leu Thr Ala
195 200 205
Leu His Leu Ala Cys Gln Ser Leu Arg Thr Gly Glu Ser Asp Thr Ala
210 215 220
Ile Val Ile Gly Ala Asn Leu Leu Leu Asn Pro Asp Val Phe Val Thr
225 230 235 240
Met Ser Asn Leu Gly Phe Leu Ser Pro Asp Gly Ile Ser Tyr Ser Phe
245 250 255
Asp Pro Arg Ala Asn Gly Tyr Gly Arg Gly Glu Gly Ile Ala Ala Leu
260 265 270
Val Ile Lys Ala Leu Pro Asn Ala Leu Arg Asp Gln Asp Pro Ile Arg
275 280 285
Ala Val Ile Arg Glu Thr Ala Leu Asn Gln Asp Gly Lys Thr Pro Ala
290 295 300
Ile Thr Ala Pro Ser Asp Val Ala Gln Lys Ser Leu Ile Gln Glu Cys
305 310 315 320
Tyr Asp Lys Ala Gly Leu Asp Met Ser Leu Thr Ser Tyr Val Glu Ala
325 330 335
His Gly Thr Gly Thr Pro Thr Gly Asp Pro Leu Glu Ile Ser Ala Ile
340 345 350
Ser Ala Ala Phe Lys Gly His Pro Leu His Leu Gly Ser Val Lys Ala
355 360 365
Asn Ile Gly His Thr Glu Ala Ala Ser Gly Leu Ala Ser Ile Ile Lys
370 375 380
Val Ala Leu Ala Leu Glu Lys Gly Leu Ile Pro Pro Asn Ala Arg Phe
385 390 395 400
Leu Gln Lys Asn Ser Lys Leu Met Leu Asp Gln Lys Asn Ile Lys Ile
405 410 415
Pro Met Ser Ala Gln Asp Trp Pro Val Lys Asp Gly Thr Arg Arg Ala
420 425 430
Ser Val Asn Asn Phe Gly Phe Gly Gly Ser Asn Ala His Val Ile Leu
435 440 445
Glu Ser Tyr Asp Arg Ala Ser Leu Ala Leu Pro Glu Asp Gln Val His
450 455 460
Val Asn Gly Asn Ser Glu His Gly Arg Val Glu Asp Gly Ser Lys Gln
465 470 475 480
Ser Arg Ile Tyr Val Val Arg Ala Lys Asp Glu Gln Ala Cys Arg Arg
485 490 495
Thr Ile Ala Ser Leu Arg Asp Tyr Ile Lys Ser Val Ala Asp Ile Asp
500 505 510
Gly Glu Pro Phe Leu Ala Ser Leu Ala Tyr Thr Leu Gly Ser Arg Arg
515 520 525
Ser Ile Leu Pro Trp Thr Ser Val Tyr Val Ala Asp Ser Leu Gly Gly
530 535 540
Leu Val Ser Ala Leu Ser Asp Glu Ser Asn Gln Pro Lys Arg Ala Asn
545 550 555 560
Glu Lys Val Arg Leu Gly Phe Val Phe Thr Gly Gln Gly Ala Gln Trp
565 570 575
His Ala Met Gly Arg Glu Leu Val Asn Thr Phe Pro Val Phe Lys Gln
580 585 590
Ala Ile Leu Glu Cys Asp Gly Tyr Ile Lys Gln Leu Gly Ala Ser Trp
595 600 605
Asn Phe Met Glu Glu Leu His Arg Asp Glu Leu Thr Thr Arg Val Asn
610 615 620
Asp Ala Glu Tyr Ser Leu Pro Leu Ser Thr Ala Ile Gln Ile Ala Leu
625 630 635 640
Val Arg Leu Leu Trp Ser Trp Gly Ile Arg Pro Thr Gly Ile Thr Ser
645 650 655
His Ser Ser Gly Glu Ala Ala Ala Ala Tyr Ala Ala Gly Ala Leu Ser
660 665 670
Ala Arg Ser Ala Ile Gly Ile Thr Tyr Ile Arg Gly Val Leu Thr Thr
675 680 685
Lys Pro Lys Pro Ala Leu Ala Ala Lys Gly Gly Met Met Ala Val Gly
690 695 700
Leu Gly Arg Ser Glu Thr Asn Val Tyr Ile Ser Arg Leu Asn Gln Glu
705 710 715 720
Asp Gly Cys Val Val Val Gly Cys Ile Asn Ser Gln Cys Ser Val Thr
725 730 735
Val Ser Gly Asp Leu Gly Ala Ile Glu Lys Leu Glu Lys Leu Leu His
740 745 750
Ala Asp Gly Ile Phe Thr Arg Lys Leu Lys Val Thr Glu Ala Phe His
755 760 765
Ser Ser His Met Arg Pro Met Ala Asp Ala Phe Gly Ala Ser Leu Arg
770 775 780
Asp Leu Phe Asn Ser Asp Asn Asn Asn Asp Asn Pro Asn Ala Asp Thr
785 790 795 800
Ser Lys Gly Val Leu Tyr Ser Ser Pro Lys Thr Gly Ser Arg Met Thr
805 810 815
Asp Leu Lys Leu Leu Leu Asp Pro Thr His Trp Met Asp Ser Met Leu
820 825 830
Gln Pro Val Glu Phe Glu Ser Ser Leu Arg Glu Met Cys Phe Asp Pro
835 840 845
Asn Thr Lys Glu Lys Ala Val Asp Val Ile Ile Glu Ile Gly Pro His
850 855 860
Gly Ala Leu Gly Gly Pro Ile Asn Gln Val Met Gln Asp Leu Gly Leu
865 870 875 880
Lys Gly Thr Asp Ile Asn Tyr Leu Ser Cys Leu Ser Arg Gly Arg Ser
885 890 895
Ser Leu Glu Thr Met Tyr Arg Ala Ala Thr Glu Leu Ile Ser Lys Gly
900 905 910
Tyr Gly Leu Lys Met Asp Ala Ile Asn Phe Pro His Gly Arg Lys Glu
915 920 925
Pro Arg Val Lys Val Leu Ser Asp Leu Pro Ala Tyr Pro Trp Asn His
930 935 940
Gln Thr Arg Tyr Trp Arg Glu Pro Arg Gly Ser Arg Glu Ser Lys Gln
945 950 955 960
Arg Thr His Pro Pro His Thr Leu Ile Gly Ser Arg Glu Ser Leu Ser
965 970 975
Pro His Phe Ala Pro Lys Trp Lys His Val Leu Arg Leu Ser Asp Ile
980 985 990
Pro Trp Ile Arg Asp His Val Val Gly Ser Ser Ile Ile Phe Pro Gly
995 1000 1005
Ala Gly Phe Ile Ser Met Ala Ile Glu Gly Phe Ser Gln Val Cys Pro
1010 1015 1020
Pro Val Ala Gly Ala Ser Ile Asn Tyr Asn Leu Arg Asp Val Glu Leu
1025 1030 1035 1040
Ala Gln Ala Leu Ile Ile Pro Ala Asp Ala Glu Ala Glu Val Asp Leu
1045 1050 1055
Arg Leu Thr Ile Arg Ser Cys Glu Glu Arg Ser Leu Gly Thr Lys Asn
1060 1065 1070
Trp His Gln Phe Ser Val His Ser Ile Ser Gly Glu Asn Asn Thr Trp
1075 1080 1085
Thr Glu His Cys Thr Gly Leu Ile Arg Ser Glu Ser Glu Arg Ser His
1090 1095 1100
Leu Asp Cys Ser Thr Val Glu Ala Ser Arg Arg Leu Asn Leu Gly Ser
1105 1110 1115 1120
Asp Asn Arg Ser Ile Asp Pro Asn Asp Leu Trp Glu Ser Leu His Ala
1125 1130 1135
Asn Gly Ile Cys His Gly Pro Ile Phe Gln Asn Ile Gln Arg Ile Gln
1140 1145 1150
Asn Asn Gly Gln Gly Ser Phe Cys Arg Phe Ser Ile Ala Asp Thr Ala
1155 1160 1165
Ser Ala Met Pro His Ser Tyr Glu Asn Arg His Ile Val His Pro Thr
1170 1175 1180
Thr Leu Asp Ser Val Ile Gln Ala Ala Tyr Thr Val Leu Pro Tyr Ala
1185 1190 1195 1200
Gly Thr Arg Met Lys Thr Ala Met Val Pro Arg Arg Leu Arg Asn Val
1205 1210 1215
Lys Ile Ser Ser Ser Leu Ala Asp Leu Glu Ala Gly Asp Ala Leu Asp
1220 1225 1230
Ala Gln Ala Ser Ile Lys Asp Arg Asn Ser Gln Ser Phe Ser Thr Asp
1235 1240 1245
Leu Ala Val Phe Asp Asp Tyr Asp Ser Gly Ser Ser Pro Ser Asp Gly
1250 1255 1260
Ile Pro Val Ile Glu Ile Glu Gly Leu Val Phe Gln Ser Val Gly Ser
1265 1270 1275 1280
Ser Phe Ser Asp Gln Lys Ser Asp Ser Asn Asp Thr Glu Asn Ala Cys
1285 1290 1295
Ser Ser Trp Val Trp Ala Pro Asp Ile Ser Leu Gly Asp Ser Thr Trp
1300 1305 1310
Leu Lys Glu Lys Leu Ser Thr Glu Ala Glu Thr Lys Glu Thr Glu Leu
1315 1320 1325
Met Met Asp Leu Arg Arg Cys Thr Ile Asn Phe Ile Gln Glu Ala Val
1330 1335 1340
Thr Asp Leu Thr Asn Ser Asp Ile Gln His Leu Asp Gly His Leu Gln
1345 1350 1355 1360
Lys Tyr Phe Asp Trp Met Asn Val Gln Leu Asp Leu Ala Arg Gln Asn
1365 1370 1375
Lys Leu Ser Pro Ala Ser Cys Asp Trp Leu Ser Asp Asp Ala Glu Gln
1380 1385 1390
Lys Lys Cys Leu Gln Ala Arg Val Ala Gly Glu Ser Val Asn Gly Glu
1395 1400 1405
Met Ile Ser Arg Leu Gly Pro Gln Leu Ile Ala Met Leu Arg Arg Glu
1410 1415 1420
Thr Glu Pro Leu Glu Leu Met Met Gln Asp Gln Leu Leu Ser Arg Tyr
1425 1430 1435 1440
Tyr Val Asn Ala Ile Lys Trp Ser Arg Ser Asn Ala Gln Ala Ser Glu
1445 1450 1455
Leu Ile Arg Leu Cys Ala His Lys Asn Pro Arg Ser Arg Ile Leu Glu
1460 1465 1470
Ile Gly Gly Gly Thr Gly Gly Cys Thr Lys Leu Ile Val Asn Ala Leu
1475 1480 1485
Gly Asn Thr Lys Pro Ile Asp Arg Tyr Asp Phe Thr Asp Val Ser Ala
1490 1495 1500
Gly Phe Phe Glu Ser Ala Arg Glu Gln Phe Ala Asp Trp Gln Asp Val
1505 1510 1515 1520
Met Thr Phe Lys Lys Leu Asp Ile Glu Ser Asp Pro Glu Gln Gln Gly
1525 1530 1535
Phe Glu Cys Ala Thr Tyr Asp Val Val Val Ala Cys Gln Val Leu His
1540 1545 1550
Ala Thr Arg Cys Met Lys Arg Thr Leu Ser Asn Val Arg Lys Leu Leu
1555 1560 1565
Lys Pro Gly Gly Asn Leu Ile Leu Val Glu Thr Thr Arg Asp Gln Leu
1570 1575 1580
Asp Leu Phe Phe Thr Phe Gly Leu Leu Pro Gly Trp Trp Leu Ser Glu
1585 1590 1595 1600
Glu Pro Glu Arg Lys Ser Thr Pro Ser Leu Thr Thr Asp Leu Trp Asn
1605 1610 1615
Thr Met Leu Asp Thr Ser Gly Phe Asn Gly Val Glu Leu Glu Val Arg
1620 1625 1630
Asp Cys Glu Asp Asp Glu Phe Tyr Met Ile Ser Thr Met Leu Ser Thr
1635 1640 1645
Ala Arg Lys Glu Asn Thr Thr Pro Asp Thr Val Ala Glu Ser Glu Val
1650 1655 1660
Leu Leu Leu His Gly Ala Leu Arg Pro Pro Ser Ser Trp Leu Glu Ser
1665 1670 1675 1680
Leu Gln Ala Ala Ile Cys Glu Lys Thr Ser Ser Ser Pro Ser Ile Asn
1685 1690 1695
Ala Leu Gly Glu Val Asp Thr Thr Gly Arg Thr Cys Ile Phe Leu Gly
1700 1705 1710
Glu Met Glu Ser Ser Leu Leu Gly Glu Val Gly Ser Glu Thr Phe Lys
1715 1720 1725
Ser Ile Thr Ala Met Leu Asn Asn Cys Asn Ala Leu Leu Trp Val Ser
1730 1735 1740
Arg Gly Ala Ala Met Ser Ser Glu Asp Pro Trp Lys Ala Leu His Ile
1745 1750 1755 1760
Gly Leu Leu Arg Thr Ile Arg Asn Glu Asn Asn Gly Lys Glu Tyr Val
1765 1770 1775
Ser Leu Asp Leu Asp Pro Ser Arg Asn Ala Tyr Thr His Glu Ser Leu
1780 1785 1790
Tyr Ala Ile Cys Asn Ile Phe Asn Gly Arg Leu Gly Asp Leu Ser Glu
1795 1800 1805
Asp Lys Glu Phe Glu Phe Ala Glu Arg Asn Gly Val Ile His Val Pro
1810 1815 1820
Arg Leu Phe Asn Asp Pro His Trp Lys Asp Gln Glu Ala Val Glu Val
1825 1830 1835 1840
Thr Leu Gln Pro Phe Glu Gln Pro Gly Arg Arg Leu Arg Met Glu Val
1845 1850 1855
Glu Thr Pro Gly Leu Leu Asp Ser Leu Gln Phe Arg Asp Asp Glu Gly
1860 1865 1870
Arg Glu Gly Lys Asp Leu Pro Asp Asp Trp Val Glu Ile Glu Pro Lys
1875 1880 1885
Ala Phe Gly Leu Asn Phe Arg Asp Val Met Val Ala Met Gly Gln Leu
1890 1895 1900
Glu Ala Asn Arg Val Met Gly Phe Glu Cys Ala Gly Val Ile Thr Lys
1905 1910 1915 1920
Leu Gly Gly Ala Ala Ala Ala Ser Gln Gly Leu Arg Leu Gly Asp Arg
1925 1930 1935
Val Cys Ala Leu Leu Lys Gly His Trp Ala Thr Arg Thr Gln Thr Pro
1940 1945 1950
Tyr Thr Asn Val Val Arg Ile Pro Asp Glu Met Gly Phe Pro Glu Ala
1955 1960 1965
Ala Ser Val Pro Leu Ala Phe Thr Thr Ala Tyr Ile Ala Leu Tyr Thr
1970 1975 1980
Thr Ala Lys Leu Arg Arg Gly Glu Arg Val Leu Ile His Ser Gly Ala
1985 1990 1995 2000
Gly Gly Val Gly Gln Ala Ala Ile Ile Leu Ser Gln Leu Ala Gly Ala
2005 2010 2015
Glu Val Phe Val Thr Ala Gly Thr Gln Ala Lys Arg Asp Phe Val Gly
2020 2025 2030
Asp Lys Phe Gly Ile Asn Pro Asp His Ile Phe Ser Ser Arg Asn Asp
2035 2040 2045
Leu Phe Val Asp Gly Ile Lys Ala Tyr Thr Gly Gly Leu Gly Val His
2050 2055 2060
Val Val Leu Asn Ser Leu Ala Gly Gln Leu Leu Gln Ala Ser Phe Asp
2065 2070 2075 2080
Cys Met Ala Glu Phe Gly Arg Phe Val Glu Ile Gly Lys Lys Asp Leu
2085 2090 2095
Glu Gln Asn Ser Arg Leu Asp Met Leu Pro Phe Thr Arg Asp Val Ser
2100 2105 2110
Phe Thr Ser Ile Asp Leu Leu Ser Trp Gln Arg Ala Lys Ser Glu Glu
2115 2120 2125
Val Ser Glu Ala Leu Asn His Val Thr Lys Leu Leu Glu Thr Lys Ala
2130 2135 2140
Ile Gly Leu Ile Gly Pro Ile Gln Gln His Ser Leu Ser Asn Ile Glu
2145 2150 2155 2160
Lys Ala Phe Arg Thr Met Gln Ser Gly Gln His Val Gly Lys Val Val
2165 2170 2175
Val Asn Val Ser Gly Asp Glu Leu Val Pro Val Gly Asp Gly Gly Phe
2180 2185 2190
Ser Leu Lys Leu Lys Pro Asp Ser Ser Tyr Leu Val Ala Gly Gly Leu
2195 2200 2205
Gly Gly Ile Gly Lys Gln Ile Cys Gln Trp Leu Val Asp His Gly Ala
2210 2215 2220
Lys His Leu Ile Ile Leu Ser Arg Ser Ala Lys Ala Ser Pro Phe Ile
2225 2230 2235 2240
Thr Ser Leu Gln Asn Gln Gln Cys Ala Val Tyr Leu His Ala Cys Asp
2245 2250 2255
Ile Ser Asp Gln Asp Gln Val Thr Lys Val Leu Arg Leu Cys Glu Glu
2260 2265 2270
Ala His Ala Pro Pro Ile Arg Gly Ile Ile Gln Gly Ala Met Val Leu
2275 2280 2285
Lys Asp Ala Leu Leu Ser Arg Met Thr Leu Asp Glu Phe Asn Ala Ala
2290 2295 2300
Thr Arg Pro Lys Val Gln Gly Ser Trp Tyr Leu His Lys Ile Ala Gln
2305 2310 2315 2320
Asp Val Asp Phe Phe Val Met Leu Ser Ser Leu Val Gly Val Met Gly
2325 2330 2335
Gly Ala Gly Gln Ala Asn Tyr Ala Ala Ala Gly Ala Phe Gln Asp Ala
2340 2345 2350
Leu Ala His His Arg Arg Ala His Gly Met Pro Ala Val Thr Ile Asp
2355 2360 2365
Leu Gly Met Val Lys Ser Val Gly Tyr Val Ala Glu Thr Gly Arg Gly
2370 2375 2380
Val Ala Asp Arg Leu Ala Arg Ile Gly Tyr Lys Pro Met His Glu Lys
2385 2390 2395 2400
Asp Val Met Asp Val Leu Glu Lys Ala Ile Leu Cys Ser Ser Pro Gln
2405 2410 2415
Phe Pro Ser Pro Pro Ala Ala Val Val Thr Gly Ile Asn Thr Ser Pro
2420 2425 2430
Gly Ala His Trp Thr Glu Ala Asn Trp Ile Gln Glu Gln Arg Phe Val
2435 2440 2445
Gly Leu Lys Tyr Arg Gln Val Leu His Ala Asp Gln Ser Phe Val Ser
2450 2455 2460
Ser His Lys Lys Gly Pro Asp Gly Val Arg Ala Gln Leu Ser Arg Val
2465 2470 2475 2480
Thr Ser His Asp Glu Ala Ile Ser Ile Val Leu Lys Ala Met Thr Glu
2485 2490 2495
Lys Leu Met Arg Met Phe Gly Leu Ala Glu Asp Asp Met Ser Ser Ser
2500 2505 2510
Lys Asn Leu Ala Gly Val Gly Val Asp Ser Leu Val Ala Ile Glu Leu
2515 2520 2525
Arg Asn Trp Ile Thr Ser Glu Ile His Val Asp Val Ser Ile Phe Glu
2530 2535 2540
Leu Met Asn Gly Asn Thr Ile Ala Gly Leu Val Glu Leu Val Val Ala
2545 2550 2555 2560
Lys Cys Ser
<210> 6
<211> 1554
<212> DNA
<213> Penicillium citrinum
<220>
<221> CDS
<222> (1)..(1554)
<400> 6
atg ctc ggc cag gtt ctt ctg acc gtc gaa tcg tac caa tgg gta tcg 48
Met Leu Gly Gln Val Leu Leu Thr Val Glu Ser Tyr Gln Trp Val Ser
1 5 10 15
acc cct caa gcc ctt gtg gcg gtc gca gtg ctt ctt agt ctc atc gcc 96
Thr Pro Gln Ala Leu Val Ala Val Ala Val Leu Leu Ser Leu Ile Ala
20 25 30
tac cgt ttg cgg ggg cgc cag tcc gaa ctg caa gtc tat aat ccc aaa 144
Tyr Arg Leu Arg Gly Arg Gln Ser Glu Leu Gln Val Tyr Asn Pro Lys
35 40 45
aaa tgg tgg gag ttg acg acc atg agg gct agg cag gac ttc gat acg 192
Lys Trp Trp Glu Leu Thr Thr Met Arg Ala Arg Gln Asp Phe Asp Thr
50 55 60
tat ggt ccg agc tgg atc gaa gct tgg ttc tcg aaa aac gac aag ccc 240
Tyr Gly Pro Ser Trp Ile Glu Ala Trp Phe Ser Lys Asn Asp Lys Pro
65 70 75 80
ctg cgc ttc att gtt gat tcc ggc tat tgc acc atc ctc cca tcg tcc 288
Leu Arg Phe Ile Val Asp Ser Gly Tyr Cys Thr Ile Leu Pro Ser Ser
85 90 95
atg gcc gac gag ttt cgg aaa atc aaa gat atg tgc atg tac aag ttt 336
Met Ala Asp Glu Phe Arg Lys Ile Lys Asp Met Cys Met Tyr Lys Phe
100 105 110
ttg gcg gat gac ttt cac tct cat ctc cct gga ttc gac ggg ttc aag 384
Leu Ala Asp Asp Phe His Ser His Leu Pro Gly Phe Asp Gly Phe Lys
115 120 125
gaa atc tgc cag gat gca cat ctt gtc aac aaa gtt gtt ttg aac cag 432
Glu Ile Cys Gln Asp Ala His Leu Val Asn Lys Val Val Leu Asn Gln
130 135 140
tta caa acc caa gcc ccc aag tac aca aag cca ttg gct acc ttg gcc 480
Leu Gln Thr Gln Ala Pro Lys Tyr Thr Lys Pro Leu Ala Thr Leu Ala
145 150 155 160
gac gct act att gcc aag ttg ttc ggt aaa agc gag gag tgg caa acc 528
Asp Ala Thr Ile Ala Lys Leu Phe Gly Lys Ser Glu Glu Trp Gln Thr
165 170 175
gca cct gtc tat tcc aat gga ttg gac ctt gtc aca cga aca gtc aca 576
Ala Pro Val Tyr Ser Asn Gly Leu Asp Leu Val Thr Arg Thr Val Thr
180 185 190
ctc att atg gtc ggc gac aaa atc tgc cac aat gag gag tgg ctg gat 624
Leu Ile Met Val Gly Asp Lys Ile Cys His Asn Glu Glu Trp Leu Asp
195 200 205
att gca aag aac cat gcc gtg agt gtg gcg gta caa gct cgc caa ctt 672
Ile Ala Lys Asn His Ala Val Ser Val Ala Val Gln Ala Arg Gln Leu
210 215 220
cgc gta tgg ccc atg cta ctg cga ccg ctc gct cac tgg ttt caa ccg 720
Arg Val Trp Pro Met Leu Leu Arg Pro Leu Ala His Trp Phe Gln Pro
225 230 235 240
caa gga cgc aaa ttg cgt gac caa gtg cgc cgc gca cga aag atc att 768
Gln Gly Arg Lys Leu Arg Asp Gln Val Arg Arg Ala Arg Lys Ile Ile
245 250 255
gat cct gag att cag cga cga cgt gct gaa aag gcc gca tgt gta gcg 816
Asp Pro Glu Ile Gln Arg Arg Arg Ala Glu Lys Ala Ala Cys Val Ala
260 265 270
aag ggc gtg cag ccg ccc cag tac gtc gat acc atg caa tgg ttt gaa 864
Lys Gly Val Gln Pro Pro Gln Tyr Val Asp Thr Met Gln Trp Phe Glu
275 280 285
gac acc gcc gac ggc cgc tgg tac gat gtg gcg ggt gct cag ctc gct 912
Asp Thr Ala Asp Gly Arg Trp Tyr Asp Val Ala Gly Ala Gln Leu Ala
290 295 300
atg gat ttc gcc ggc atc tac gcc tcg acg gat ctt ttc gtc ggt gcc 960
Met Asp Phe Ala Gly Ile Tyr Ala Ser Thr Asp Leu Phe Val Gly Ala
305 310 315 320
ctt gtg gac att gcc agg cac cca gac ctt att cag cct ctc cgc caa 1008
Leu Val Asp Ile Ala Arg His Pro Asp Leu Ile Gln Pro Leu Arg Gln
325 330 335
gag atc cgc act gta atc gga gaa ggg ggc tgg acg cct gcc tct ctg 1056
Glu Ile Arg Thr Val Ile Gly Glu Gly Gly Trp Thr Pro Ala Ser Leu
340 345 350
ttc aag ctg aag ctc ctc gac agc tgc atg aaa gag acg cag cga atc 1104
Phe Lys Leu Lys Leu Leu Asp Ser Cys Met Lys Glu Thr Gln Arg Ile
355 360 365
aag ccg gtc gag tgc gcc act atg cgc agt acc gct ctc aga gac atc 1152
Lys Pro Val Glu Cys Ala Thr Met Arg Ser Thr Ala Leu Arg Asp Ile
370 375 380
act cta tcc aat ggc ctc ttc att ccc aag ggc gag ttg gcc gct gtg 1200
Thr Leu Ser Asn Gly Leu Phe Ile Pro Lys Gly Glu Leu Ala Ala Val
385 390 395 400
gct gca gac cgc atg aac aac cct gat gtg tgg gaa aac ccc gaa aat 1248
Ala Ala Asp Arg Met Asn Asn Pro Asp Val Trp Glu Asn Pro Glu Asn
405 410 415
tat gat ccc tac cga ttt atg cgc atg cgc gag gat cca gac aag gcc 1296
Tyr Asp Pro Tyr Arg Phe Met Arg Met Arg Glu Asp Pro Asp Lys Ala
420 425 430
ttc acc gct caa ttg gag aat acc aac ggt gat cac atc ggc ttc ggc 1344
Phe Thr Ala Gln Leu Glu Asn Thr Asn Gly Asp His Ile Gly Phe Gly
435 440 445
tgg aac cca cgc gct tgt ccc ggg cgg ttc ttc gcc tcg aag gaa atc 1392
Trp Asn Pro Arg Ala Cys Pro Gly Arg Phe Phe Ala Ser Lys Glu Ile
450 455 460
aag att ctc ctc gct cat ata ctg att cag tat gat gtg aag cct gta 1440
Lys Ile Leu Leu Ala His Ile Leu Ile Gln Tyr Asp Val Lys Pro Val
465 470 475 480
cca gga gac gat gac aaa tac tac cgt cac gct ttt agc gtt cgt atg 1488
Pro Gly Asp Asp Asp Lys Tyr Tyr Arg His Ala Phe Ser Val Arg Met
485 490 495
cat cca acc aca aag ctc atg gta cgc cgg cgc aac gag gac atc ccg 1536
His Pro Thr Thr Lys Leu Met Val Arg Arg Arg Asn Glu Asp Ile Pro
500 505 510
ctc cct cat gac cgg tgc 1554
Leu Pro His Asp Arg Cys
515
<210> 7
<211> 518
<212> PRT
<213> Penicillium citrinum
<400> 7
Met Leu Gly Gln Val Leu Leu Thr Val Glu Ser Tyr Gln Trp Val Ser
1 5 10 15
Thr Pro Gln Ala Leu Val Ala Val Ala Val Leu Leu Ser Leu Ile Ala
20 25 30
Tyr Arg Leu Arg Gly Arg Gln Ser Glu Leu Gln Val Tyr Asn Pro Lys
35 40 45
Lys Trp Trp Glu Leu Thr Thr Met Arg Ala Arg Gln Asp Phe Asp Thr
50 55 60
Tyr Gly Pro Ser Trp Ile Glu Ala Trp Phe Ser Lys Asn Asp Lys Pro
65 70 75 80
Leu Arg Phe Ile Val Asp Ser Gly Tyr Cys Thr Ile Leu Pro Ser Ser
85 90 95
Met Ala Asp Glu Phe Arg Lys Ile Lys Asp Met Cys Met Tyr Lys Phe
100 105 110
Leu Ala Asp Asp Phe His Ser His Leu Pro Gly Phe Asp Gly Phe Lys
115 120 125
Glu Ile Cys Gln Asp Ala His Leu Val Asn Lys Val Val Leu Asn Gln
130 135 140
Leu Gln Thr Gln Ala Pro Lys Tyr Thr Lys Pro Leu Ala Thr Leu Ala
145 150 155 160
Asp Ala Thr Ile Ala Lys Leu Phe Gly Lys Ser Glu Glu Trp Gln Thr
165 170 175
Ala Pro Val Tyr Ser Asn Gly Leu Asp Leu Val Thr Arg Thr Val Thr
180 185 190
Leu Ile Met Val Gly Asp Lys Ile Cys His Asn Glu Glu Trp Leu Asp
195 200 205
Ile Ala Lys Asn His Ala Val Ser Val Ala Val Gln Ala Arg Gln Leu
210 215 220
Arg Val Trp Pro Met Leu Leu Arg Pro Leu Ala His Trp Phe Gln Pro
225 230 235 240
Gln Gly Arg Lys Leu Arg Asp Gln Val Arg Arg Ala Arg Lys Ile Ile
245 250 255
Asp Pro Glu Ile Gln Arg Arg Arg Ala Glu Lys Ala Ala Cys Val Ala
260 265 270
Lys Gly Val Gln Pro Pro Gln Tyr Val Asp Thr Met Gln Trp Phe Glu
275 280 285
Asp Thr Ala Asp Gly Arg Trp Tyr Asp Val Ala Gly Ala Gln Leu Ala
290 295 300
Met Asp Phe Ala Gly Ile Tyr Ala Ser Thr Asp Leu Phe Val Gly Ala
305 310 315 320
Leu Val Asp Ile Ala Arg His Pro Asp Leu Ile Gln Pro Leu Arg Gln
325 330 335
Glu Ile Arg Thr Val Ile Gly Glu Gly Gly Trp Thr Pro Ala Ser Leu
340 345 350
Phe Lys Leu Lys Leu Leu Asp Ser Cys Met Lys Glu Thr Gln Arg Ile
355 360 365
Lys Pro Val Glu Cys Ala Thr Met Arg Ser Thr Ala Leu Arg Asp Ile
370 375 380
Thr Leu Ser Asn Gly Leu Phe Ile Pro Lys Gly Glu Leu Ala Ala Val
385 390 395 400
Ala Ala Asp Arg Met Asn Asn Pro Asp Val Trp Glu Asn Pro Glu Asn
405 410 415
Tyr Asp Pro Tyr Arg Phe Met Arg Met Arg Glu Asp Pro Asp Lys Ala
420 425 430
Phe Thr Ala Gln Leu Glu Asn Thr Asn Gly Asp His Ile Gly Phe Gly
435 440 445
Trp Asn Pro Arg Ala Cys Pro Gly Arg Phe Phe Ala Ser Lys Glu Ile
450 455 460
Lys Ile Leu Leu Ala His Ile Leu Ile Gln Tyr Asp Val Lys Pro Val
465 470 475 480
Pro Gly Asp Asp Asp Lys Tyr Tyr Arg His Ala Phe Ser Val Arg Met
485 490 495
His Pro Thr Thr Lys Leu Met Val Arg Arg Arg Asn Glu Asp Ile Pro
500 505 510
Leu Pro His Asp Arg Cys
515
<210> 8
<211> 3519
<212> DNA
<213> Penicillium citrinum
<220>
<221> CDS
<222> (1)..(3519)
<400> 8
atg gtc gct tcg ttg cta ccc tct cgc ttt cgc ggt agg gaa tca atg 48
Met Val Ala Ser Leu Leu Pro Ser Arg Phe Arg Gly Arg Glu Ser Met
1 5 10 15
aat cag cag cac cct cta cgc tcg gga aat cgg gca ttg acc tcc aca 96
Asn Gln Gln His Pro Leu Arg Ser Gly Asn Arg Ala Leu Thr Ser Thr
20 25 30
ctc caa ttt cta tcc aaa acg gcg tgt cta cac ccg atc cat acc gtt 144
Leu Gln Phe Leu Ser Lys Thr Ala Cys Leu His Pro Ile His Thr Val
35 40 45
tgc acc ata gct att cta gct agt acc aca tac gtt gga cta ctc aaa 192
Cys Thr Ile Ala Ile Leu Ala Ser Thr Thr Tyr Val Gly Leu Leu Lys
50 55 60
gac agc ttc ttc cat ggc ccc gca aac gtt gat aaa gca gaa tgg ggc 240
Asp Ser Phe Phe His Gly Pro Ala Asn Val Asp Lys Ala Glu Trp Gly
65 70 75 80
tct ttg gtc gaa gga agt cga agc ttg atc acc ggc cca cag aat ggc 288
Ser Leu Val Glu Gly Ser Arg Ser Leu Ile Thr Gly Pro Gln Asn Gly
85 90 95
tgg aag tgg cag agc ttc gac ggg gat gca gat gtt ctc gga gat ttc 336
Trp Lys Trp Gln Ser Phe Asp Gly Asp Ala Asp Val Leu Gly Asp Phe
100 105 110
aac cat caa gca cta atg acc ttg gta ttc ccg ggg tca tat ggg gtt 384
Asn His Gln Ala Leu Met Thr Leu Val Phe Pro Gly Ser Tyr Gly Val
115 120 125
gca tct caa gca gcc tca cca ttc ctt gct ccc ctc cct gtg aac cta 432
Ala Ser Gln Ala Ala Ser Pro Phe Leu Ala Pro Leu Pro Val Asn Leu
130 135 140
tct gtg att gac ctt ccc tca acg tcg agc cct tta acc gcc tat tcg 480
Ser Val Ile Asp Leu Pro Ser Thr Ser Ser Pro Leu Thr Ala Tyr Ser
145 150 155 160
aaa gat aaa gtt ttc gcc ttc tct gtg gaa tac agc agc gcg ccg gaa 528
Lys Asp Lys Val Phe Ala Phe Ser Val Glu Tyr Ser Ser Ala Pro Glu
165 170 175
ctc gtg gct gct gtt caa gaa atc ccc aac aac agt gcc gac ctg aaa 576
Leu Val Ala Ala Val Gln Glu Ile Pro Asn Asn Ser Ala Asp Leu Lys
180 185 190
ttg cag gag acg caa ttg atc gag atg gaa cgc cag atg tgg atc atg 624
Leu Gln Glu Thr Gln Leu Ile Glu Met Glu Arg Gln Met Trp Ile Met
195 200 205
aag gct gcc agg gct cac aca aaa cgc agc ctt gct caa tgg gtg cac 672
Lys Ala Ala Arg Ala His Thr Lys Arg Ser Leu Ala Gln Trp Val His
210 215 220
gat acc tgg aca gag tct ctt gat ctt atc aag agc gct caa acg ctc 720
Asp Thr Trp Thr Glu Ser Leu Asp Leu Ile Lys Ser Ala Gln Thr Leu
225 230 235 240
gac gtg gtt gtc atg gtg cta ggt tat ata tca atg cac ttg act ttc 768
Asp Val Val Val Met Val Leu Gly Tyr Ile Ser Met His Leu Thr Phe
245 250 255
gtc tca ctc ttc ctc agc atg aaa aaa ttg gga tcg aag gtt tgg ctg 816
Val Ser Leu Phe Leu Ser Met Lys Lys Leu Gly Ser Lys Val Trp Leu
260 265 270
gct aca agc gtc ctt ttg tcg tca aca ttt gcc ttt ctc ctc ggt ctc 864
Ala Thr Ser Val Leu Leu Ser Ser Thr Phe Ala Phe Leu Leu Gly Leu
275 280 285
gac gtg gcc ata aga cta ggg gtt ccg atg agc atg agg ttg cta tcc 912
Asp Val Ala Ile Arg Leu Gly Val Pro Met Ser Met Arg Leu Leu Ser
290 295 300
gaa ggc ctc ccc ttc ttg gtg gtg atc gtt ggc ttt gag aag agc atc 960
Glu Gly Leu Pro Phe Leu Val Val Ile Val Gly Phe Glu Lys Ser Ile
305 310 315 320
act ctg acc agg gct gtt ttg tcc tat gct gtg cag cac cga aag ccc 1008
Thr Leu Thr Arg Ala Val Leu Ser Tyr Ala Val Gln His Arg Lys Pro
325 330 335
cag aag ata cag tct gac cag ggt agc gtg aca gcc att gct gaa agt 1056
Gln Lys Ile Gln Ser Asp Gln Gly Ser Val Thr Ala Ile Ala Glu Ser
340 345 350
acc atc aat tac gcc gta cga agc gcc att cgg gag aag ggt tac aat 1104
Thr Ile Asn Tyr Ala Val Arg Ser Ala Ile Arg Glu Lys Gly Tyr Asn
355 360 365
atc gtg tgc cac tac gtg gtc gag atc ctg ctc cta gtt atc ggt gct 1152
Ile Val Cys His Tyr Val Val Glu Ile Leu Leu Leu Val Ile Gly Ala
370 375 380
gtc tta ggc atc caa ggt ggg cta cag cac ttc tgt gtt cta gct gca 1200
Val Leu Gly Ile Gln Gly Gly Leu Gln His Phe Cys Val Leu Ala Ala
385 390 395 400
ttg atc ctg ttc ttt gac tgt ctg ctg ctg ttt aca ttc tac act gcg 1248
Leu Ile Leu Phe Phe Asp Cys Leu Leu Leu Phe Thr Phe Tyr Thr Ala
405 410 415
att ctg tct atc aag ctc gag gta aac cgc ctc aaa cgt cat atc aac 1296
Ile Leu Ser Ile Lys Leu Glu Val Asn Arg Leu Lys Arg His Ile Asn
420 425 430
atg cgg tac gcg ttg gaa gat gag ggt ctc agt cag cgg acg gcg gag 1344
Met Arg Tyr Ala Leu Glu Asp Glu Gly Leu Ser Gln Arg Thr Ala Glu
435 440 445
agt gtc gcg acc agc aat gat gcc caa gac agt gca cgt aca tat ctg 1392
Ser Val Ala Thr Ser Asn Asp Ala Gln Asp Ser Ala Arg Thr Tyr Leu
450 455 460
ttt ggc aat gat atg aaa ggc agc agt gtt ccg aag ttc aaa ttc tgg 1440
Phe Gly Asn Asp Met Lys Gly Ser Ser Val Pro Lys Phe Lys Phe Trp
465 470 475 480
atg gtc gtt ggt ttc ctt atc gtc aac ctc gtc aac atc ggc tcc acc 1488
Met Val Val Gly Phe Leu Ile Val Asn Leu Val Asn Ile Gly Ser Thr
485 490 495
ctt ttc caa gcc tct tct agt gga tcg ttg tcc agt ata tca tct tgg 1536
Leu Phe Gln Ala Ser Ser Ser Gly Ser Leu Ser Ser Ile Ser Ser Trp
500 505 510
acc gaa agt ctg agc gga tcg gcc att aaa ccc ccg ctt gag ccc ttc 1584
Thr Glu Ser Leu Ser Gly Ser Ala Ile Lys Pro Pro Leu Glu Pro Phe
515 520 525
aag gta gct gga agt gga cta gat gaa cta ctt ttc cag gca aga ggg 1632
Lys Val Ala Gly Ser Gly Leu Asp Glu Leu Leu Phe Gln Ala Arg Gly
530 535 540
cgc ggt caa tcg act atg gtc act gtc ctc gcc ccc atc aag tac gaa 1680
Arg Gly Gln Ser Thr Met Val Thr Val Leu Ala Pro Ile Lys Tyr Glu
545 550 555 560
cta gag tat cct tcc att cac cgt ggt acc tcg cag cta cac gag tat 1728
Leu Glu Tyr Pro Ser Ile His Arg Gly Thr Ser Gln Leu His Glu Tyr
565 570 575
gga gtt ggt gga aaa atg gtc ggt agc ctg ctc acc agc ctg gaa gat 1776
Gly Val Gly Gly Lys Met Val Gly Ser Leu Leu Thr Ser Leu Glu Asp
580 585 590
ccc gtc ctc tcc aaa tgg gtg ttt gtg gca ctt gcc cta agt gtc gct 1824
Pro Val Leu Ser Lys Trp Val Phe Val Ala Leu Ala Leu Ser Val Ala
595 600 605
ctg aac agc tat ctg ttc aag gcc gcc aga ctg gga atc aaa gat cct 1872
Leu Asn Ser Tyr Leu Phe Lys Ala Ala Arg Leu Gly Ile Lys Asp Pro
610 615 620
aat ctc ccg agt cac cca gtt gat cca gtt gag ctt gac cag gcc gaa 1920
Asn Leu Pro Ser His Pro Val Asp Pro Val Glu Leu Asp Gln Ala Glu
625 630 635 640
agc ttc aac gct gcc cag aac cag acc cct cag att caa tca agt ctc 1968
Ser Phe Asn Ala Ala Gln Asn Gln Thr Pro Gln Ile Gln Ser Ser Leu
645 650 655
caa gct cct cag acc aga gtg ttc act cct acc acc acc gac agt gac 2016
Gln Ala Pro Gln Thr Arg Val Phe Thr Pro Thr Thr Thr Asp Ser Asp
660 665 670
agt gat gcc tca tta gtc tta att aaa gca tct cta aag gtc act aag 2064
Ser Asp Ala Ser Leu Val Leu Ile Lys Ala Ser Leu Lys Val Thr Lys
675 680 685
cga gca gaa gga aag aca gcc act agt gaa ctt ccc gtg tct cgc aca 2112
Arg Ala Glu Gly Lys Thr Ala Thr Ser Glu Leu Pro Val Ser Arg Thr
690 695 700
caa atc gaa ctg gac aat ttg ctg aag cag aac aca atc agc gag ttg 2160
Gln Ile Glu Leu Asp Asn Leu Leu Lys Gln Asn Thr Ile Ser Glu Leu
705 710 715 720
aac gat gag gat gtc gtt gcc ttg tct ttg cgg gga aag gtt ccc ggg 2208
Asn Asp Glu Asp Val Val Ala Leu Ser Leu Arg Gly Lys Val Pro Gly
725 730 735
tat gcc cta gag aag agt ctc aaa gac tgc act cgt gcc gtc aag gtt 2256
Tyr Ala Leu Glu Lys Ser Leu Lys Asp Cys Thr Arg Ala Val Lys Val
740 745 750
cgc cgc tct atc att tcg agg aca ccg gct acc gca gag ctt aca agt 2304
Arg Arg Ser Ile Ile Ser Arg Thr Pro Ala Thr Ala Glu Leu Thr Ser
755 760 765
atg ctg gag cac tcg aag ctg ccg tac gaa aac tac gcc tgg gaa cgc 2352
Met Leu Glu His Ser Lys Leu Pro Tyr Glu Asn Tyr Ala Trp Glu Arg
770 775 780
gtg ctc ggt gca tgt tgc gag aac gtt att ggc tat atg cca gtc cct 2400
Val Leu Gly Ala Cys Cys Glu Asn Val Ile Gly Tyr Met Pro Val Pro
785 790 795 800
gtt ggc gtc gcc ggt cct att gtt atc gac ggc aag agt tat ttc att 2448
Val Gly Val Ala Gly Pro Ile Val Ile Asp Gly Lys Ser Tyr Phe Ile
805 810 815
cct atg gca acc acc gag ggc gtc ctc gtc gct agt gct agc cgt ggc 2496
Pro Met Ala Thr Thr Glu Gly Val Leu Val Ala Ser Ala Ser Arg Gly
820 825 830
agt aag gca atc aac ctc ggt ggc ggt gcc gtg aca gtc ctg act ggc 2544
Ser Lys Ala Ile Asn Leu Gly Gly Gly Ala Val Thr Val Leu Thr Gly
835 840 845
gac ggt atg aca cga ggc ccg tgt gtg aag ttt gat gtc ctt gaa cga 2592
Asp Gly Met Thr Arg Gly Pro Cys Val Lys Phe Asp Val Leu Glu Arg
850 855 860
gct ggt gct gct aag atc tgg ctc gat tcg gac gtc ggc cag acc gta 2640
Ala Gly Ala Ala Lys Ile Trp Leu Asp Ser Asp Val Gly Gln Thr Val
865 870 875 880
atg aaa gaa gcc ttc aat tca acc agc aga ttt gcg cgc tta caa agt 2688
Met Lys Glu Ala Phe Asn Ser Thr Ser Arg Phe Ala Arg Leu Gln Ser
885 890 895
atg cgg aca act atc gcc ggt act cac tta tat att cga ttt aag act 2736
Met Arg Thr Thr Ile Ala Gly Thr His Leu Tyr Ile Arg Phe Lys Thr
900 905 910
act act ggc gac gct atg gga atg aat atg att tct aag ggc gtg gag 2784
Thr Thr Gly Asp Ala Met Gly Met Asn Met Ile Ser Lys Gly Val Glu
915 920 925
cat gca ctg aat gtt atg gcg aca gag gca ggt ttc agc gat atg aat 2832
His Ala Leu Asn Val Met Ala Thr Glu Ala Gly Phe Ser Asp Met Asn
930 935 940
att att acc cta tca gga aat tac tgt acg gat aag aaa cct tca gct 2880
Ile Ile Thr Leu Ser Gly Asn Tyr Cys Thr Asp Lys Lys Pro Ser Ala
945 950 955 960
ttg aat tgg atc gat gga cgg ggc aag ggc att gtg gcc gaa gcc atc 2928
Leu Asn Trp Ile Asp Gly Arg Gly Lys Gly Ile Val Ala Glu Ala Ile
965 970 975
ata ccg gcg aac gtt gtc agg gat gtc tta aag agc gat gtg gat agc 2976
Ile Pro Ala Asn Val Val Arg Asp Val Leu Lys Ser Asp Val Asp Ser
980 985 990
atg gtt cag ctc aac ata tcg aaa aat ctg att ggg tcc gct atg gct 3024
Met Val Gln Leu Asn Ile Ser Lys Asn Leu Ile Gly Ser Ala Met Ala
995 1000 1005
ggc tca gtt ggc ggc ttc aac gcc caa gct gcc aat ctt gcg gca gcc 3072
Gly Ser Val Gly Gly Phe Asn Ala Gln Ala Ala Asn Leu Ala Ala Ala
1010 1015 1020
att ttc att gcc aca ggt cag gat ccg gcg caa gtt gtg gag agc gct 3120
Ile Phe Ile Ala Thr Gly Gln Asp Pro Ala Gln Val Val Glu Ser Ala
1025 1030 1035 1040
aac tgc atc act ctc atg aac aat ctt cgc gga tcg ctt caa atc tct 3168
Asn Cys Ile Thr Leu Met Asn Asn Leu Arg Gly Ser Leu Gln Ile Ser
1045 1050 1055
gtc tcc atg ccg tct att gag gtt gga acg ttg ggc ggt ggt acg att 3216
Val Ser Met Pro Ser Ile Glu Val Gly Thr Leu Gly Gly Gly Thr Ile
1060 1065 1070
ctg gag ccc cag ggc gca atg ctt gac atg ctt ggt gtc cgc gga tca 3264
Leu Glu Pro Gln Gly Ala Met Leu Asp Met Leu Gly Val Arg Gly Ser
1075 1080 1085
cac ccg acc act ccc ggt gag aat gca cgt caa ctt gcg cgc atc atc 3312
His Pro Thr Thr Pro Gly Glu Asn Ala Arg Gln Leu Ala Arg Ile Ile
1090 1095 1100
gga agc gct gtt ttg gct ggg gag ctc tcg cta tgt gct gcc cta gcc 3360
Gly Ser Ala Val Leu Ala Gly Glu Leu Ser Leu Cys Ala Ala Leu Ala
1105 1110 1115 1120
gcc ggt cac ctg gtc aag gcg cac atg gcg cac aac cgt tct gcc ccg 3408
Ala Gly His Leu Val Lys Ala His Met Ala His Asn Arg Ser Ala Pro
1125 1130 1135
gca tct tca gcc cct tct cga agt gtc tcc ccg tca ggc gga acc agg 3456
Ala Ser Ser Ala Pro Ser Arg Ser Val Ser Pro Ser Gly Gly Thr Arg
1140 1145 1150
aca gtc cct gtt cct aac aat gca ctg agg ccg agt gct gca gct act 3504
Thr Val Pro Val Pro Asn Asn Ala Leu Arg Pro Ser Ala Ala Ala Thr
1155 1160 1165
gat cgg gct cga cgc 3519
Asp Arg Ala Arg Arg
1170
<210> 9
<211> 1173
<212> PRT
<213> Penicillium citrinum
<400> 9
Met Val Ala Ser Leu Leu Pro Ser Arg Phe Arg Gly Arg Glu Ser Met
1 5 10 15
Asn Gln Gln His Pro Leu Arg Ser Gly Asn Arg Ala Leu Thr Ser Thr
20 25 30
Leu Gln Phe Leu Ser Lys Thr Ala Cys Leu His Pro Ile His Thr Val
35 40 45
Cys Thr Ile Ala Ile Leu Ala Ser Thr Thr Tyr Val Gly Leu Leu Lys
50 55 60
Asp Ser Phe Phe His Gly Pro Ala Asn Val Asp Lys Ala Glu Trp Gly
65 70 75 80
Ser Leu Val Glu Gly Ser Arg Ser Leu Ile Thr Gly Pro Gln Asn Gly
85 90 95
Trp Lys Trp Gln Ser Phe Asp Gly Asp Ala Asp Val Leu Gly Asp Phe
100 105 110
Asn His Gln Ala Leu Met Thr Leu Val Phe Pro Gly Ser Tyr Gly Val
115 120 125
Ala Ser Gln Ala Ala Ser Pro Phe Leu Ala Pro Leu Pro Val Asn Leu
130 135 140
Ser Val Ile Asp Leu Pro Ser Thr Ser Ser Pro Leu Thr Ala Tyr Ser
145 150 155 160
Lys Asp Lys Val Phe Ala Phe Ser Val Glu Tyr Ser Ser Ala Pro Glu
165 170 175
Leu Val Ala Ala Val Gln Glu Ile Pro Asn Asn Ser Ala Asp Leu Lys
180 185 190
Leu Gln Glu Thr Gln Leu Ile Glu Met Glu Arg Gln Met Trp Ile Met
195 200 205
Lys Ala Ala Arg Ala His Thr Lys Arg Ser Leu Ala Gln Trp Val His
210 215 220
Asp Thr Trp Thr Glu Ser Leu Asp Leu Ile Lys Ser Ala Gln Thr Leu
225 230 235 240
Asp Val Val Val Met Val Leu Gly Tyr Ile Ser Met His Leu Thr Phe
245 250 255
Val Ser Leu Phe Leu Ser Met Lys Lys Leu Gly Ser Lys Val Trp Leu
260 265 270
Ala Thr Ser Val Leu Leu Ser Ser Thr Phe Ala Phe Leu Leu Gly Leu
275 280 285
Asp Val Ala Ile Arg Leu Gly Val Pro Met Ser Met Arg Leu Leu Ser
290 295 300
Glu Gly Leu Pro Phe Leu Val Val Ile Val Gly Phe Glu Lys Ser Ile
305 310 315 320
Thr Leu Thr Arg Ala Val Leu Ser Tyr Ala Val Gln His Arg Lys Pro
325 330 335
Gln Lys Ile Gln Ser Asp Gln Gly Ser Val Thr Ala Ile Ala Glu Ser
340 345 350
Thr Ile Asn Tyr Ala Val Arg Ser Ala Ile Arg Glu Lys Gly Tyr Asn
355 360 365
Ile Val Cys His Tyr Val Val Glu Ile Leu Leu Leu Val Ile Gly Ala
370 375 380
Val Leu Gly Ile Gln Gly Gly Leu Gln His Phe Cys Val Leu Ala Ala
385 390 395 400
Leu Ile Leu Phe Phe Asp Cys Leu Leu Leu Phe Thr Phe Tyr Thr Ala
405 410 415
Ile Leu Ser Ile Lys Leu Glu Val Asn Arg Leu Lys Arg His Ile Asn
420 425 430
Met Arg Tyr Ala Leu Glu Asp Glu Gly Leu Ser Gln Arg Thr Ala Glu
435 440 445
Ser Val Ala Thr Ser Asn Asp Ala Gln Asp Ser Ala Arg Thr Tyr Leu
450 455 460
Phe Gly Asn Asp Met Lys Gly Ser Ser Val Pro Lys Phe Lys Phe Trp
465 470 475 480
Met Val Val Gly Phe Leu Ile Val Asn Leu Val Asn Ile Gly Ser Thr
485 490 495
Leu Phe Gln Ala Ser Ser Ser Gly Ser Leu Ser Ser Ile Ser Ser Trp
500 505 510
Thr Glu Ser Leu Ser Gly Ser Ala Ile Lys Pro Pro Leu Glu Pro Phe
515 520 525
Lys Val Ala Gly Ser Gly Leu Asp Glu Leu Leu Phe Gln Ala Arg Gly
530 535 540
Arg Gly Gln Ser Thr Met Val Thr Val Leu Ala Pro Ile Lys Tyr Glu
545 550 555 560
Leu Glu Tyr Pro Ser Ile His Arg Gly Thr Ser Gln Leu His Glu Tyr
565 570 575
Gly Val Gly Gly Lys Met Val Gly Ser Leu Leu Thr Ser Leu Glu Asp
580 585 590
Pro Val Leu Ser Lys Trp Val Phe Val Ala Leu Ala Leu Ser Val Ala
595 600 605
Leu Asn Ser Tyr Leu Phe Lys Ala Ala Arg Leu Gly Ile Lys Asp Pro
610 615 620
Asn Leu Pro Ser His Pro Val Asp Pro Val Glu Leu Asp Gln Ala Glu
625 630 635 640
Ser Phe Asn Ala Ala Gln Asn Gln Thr Pro Gln Ile Gln Ser Ser Leu
645 650 655
Gln Ala Pro Gln Thr Arg Val Phe Thr Pro Thr Thr Thr Asp Ser Asp
660 665 670
Ser Asp Ala Ser Leu Val Leu Ile Lys Ala Ser Leu Lys Val Thr Lys
675 680 685
Arg Ala Glu Gly Lys Thr Ala Thr Ser Glu Leu Pro Val Ser Arg Thr
690 695 700
Gln Ile Glu Leu Asp Asn Leu Leu Lys Gln Asn Thr Ile Ser Glu Leu
705 710 715 720
Asn Asp Glu Asp Val Val Ala Leu Ser Leu Arg Gly Lys Val Pro Gly
725 730 735
Tyr Ala Leu Glu Lys Ser Leu Lys Asp Cys Thr Arg Ala Val Lys Val
740 745 750
Arg Arg Ser Ile Ile Ser Arg Thr Pro Ala Thr Ala Glu Leu Thr Ser
755 760 765
Met Leu Glu His Ser Lys Leu Pro Tyr Glu Asn Tyr Ala Trp Glu Arg
770 775 780
Val Leu Gly Ala Cys Cys Glu Asn Val Ile Gly Tyr Met Pro Val Pro
785 790 795 800
Val Gly Val Ala Gly Pro Ile Val Ile Asp Gly Lys Ser Tyr Phe Ile
805 810 815
Pro Met Ala Thr Thr Glu Gly Val Leu Val Ala Ser Ala Ser Arg Gly
820 825 830
Ser Lys Ala Ile Asn Leu Gly Gly Gly Ala Val Thr Val Leu Thr Gly
835 840 845
Asp Gly Met Thr Arg Gly Pro Cys Val Lys Phe Asp Val Leu Glu Arg
850 855 860
Ala Gly Ala Ala Lys Ile Trp Leu Asp Ser Asp Val Gly Gln Thr Val
865 870 875 880
Met Lys Glu Ala Phe Asn Ser Thr Ser Arg Phe Ala Arg Leu Gln Ser
885 890 895
Met Arg Thr Thr Ile Ala Gly Thr His Leu Tyr Ile Arg Phe Lys Thr
900 905 910
Thr Thr Gly Asp Ala Met Gly Met Asn Met Ile Ser Lys Gly Val Glu
915 920 925
His Ala Leu Asn Val Met Ala Thr Glu Ala Gly Phe Ser Asp Met Asn
930 935 940
Ile Ile Thr Leu Ser Gly Asn Tyr Cys Thr Asp Lys Lys Pro Ser Ala
945 950 955 960
Leu Asn Trp Ile Asp Gly Arg Gly Lys Gly Ile Val Ala Glu Ala Ile
965 970 975
Ile Pro Ala Asn Val Val Arg Asp Val Leu Lys Ser Asp Val Asp Ser
980 985 990
Met Val Gln Leu Asn Ile Ser Lys Asn Leu Ile Gly Ser Ala Met Ala
995 1000 1005
Gly Ser Val Gly Gly Phe Asn Ala Gln Ala Ala Asn Leu Ala Ala Ala
1010 1015 1020
Ile Phe Ile Ala Thr Gly Gln Asp Pro Ala Gln Val Val Glu Ser Ala
1025 1030 1035 1040
Asn Cys Ile Thr Leu Met Asn Asn Leu Arg Gly Ser Leu Gln Ile Ser
1045 1050 1055
Val Ser Met Pro Ser Ile Glu Val Gly Thr Leu Gly Gly Gly Thr Ile
1060 1065 1070
Leu Glu Pro Gln Gly Ala Met Leu Asp Met Leu Gly Val Arg Gly Ser
1075 1080 1085
His Pro Thr Thr Pro Gly Glu Asn Ala Arg Gln Leu Ala Arg Ile Ile
1090 1095 1100
Gly Ser Ala Val Leu Ala Gly Glu Leu Ser Leu Cys Ala Ala Leu Ala
1105 1110 1115 1120
Ala Gly His Leu Val Lys Ala His Met Ala His Asn Arg Ser Ala Pro
1125 1130 1135
Ala Ser Ser Ala Pro Ser Arg Ser Val Ser Pro Ser Gly Gly Thr Arg
1140 1145 1150
Thr Val Pro Val Pro Asn Asn Ala Leu Arg Pro Ser Ala Ala Ala Thr
1155 1160 1165
Asp Arg Ala Arg Arg
1170
<210> 10
<211> 1659
<212> DNA
<213> Penicillium citrinum
<220>
<221> CDS
<222> (1)..(1659)
<400> 10
atg tca gaa cct cta ccc cct aaa gaa ggg gaa cca agg cca cag aag 48
Met Ser Glu Pro Leu Pro Pro Lys Glu Gly Glu Pro Arg Pro Gln Lys
1 5 10 15
gaa gaa agt caa aat gac acg ctc gaa gcg act gag tcc aag tcc cag 96
Glu Glu Ser Gln Asn Asp Thr Leu Glu Ala Thr Glu Ser Lys Ser Gln
20 25 30
cac atc aca ggc ctc aag ctc ggg ctg gtg gtt gct tca gtt act ttc 144
His Ile Thr Gly Leu Lys Leu Gly Leu Val Val Ala Ser Val Thr Phe
35 40 45
gta gca ttt ttg atg ctc ctt gat atg tcc att atc gtc acg gca atc 192
Val Ala Phe Leu Met Leu Leu Asp Met Ser Ile Ile Val Thr Ala Ile
50 55 60
cca cat atc aca agc gag ttc cac tct ctg aac gat gta ggg tgg tac 240
Pro His Ile Thr Ser Glu Phe His Ser Leu Asn Asp Val Gly Trp Tyr
65 70 75 80
ggc agt gct tat ctt ctg gct aac tgt gct ctc cag ccc ctg gcc ggt 288
Gly Ser Ala Tyr Leu Leu Ala Asn Cys Ala Leu Gln Pro Leu Ala Gly
85 90 95
aaa ttg tat aca ctc ttg ggc ttg aag tac act ttc ttt gcc ttc ctc 336
Lys Leu Tyr Thr Leu Leu Gly Leu Lys Tyr Thr Phe Phe Ala Phe Leu
100 105 110
tgt att ttt gaa cta ggc tcg gtg cta tgc ggt gcc gca aga tct tcc 384
Cys Ile Phe Glu Leu Gly Ser Val Leu Cys Gly Ala Ala Arg Ser Ser
115 120 125
acc atg ttg att gtt ggg cgg gcc gtt gct gga atg gga ggc tca ggt 432
Thr Met Leu Ile Val Gly Arg Ala Val Ala Gly Met Gly Gly Ser Gly
130 135 140
ctt gtc aac gga gcc ctc aca atc ctc tca aca gct gct cct aag cac 480
Leu Val Asn Gly Ala Leu Thr Ile Leu Ser Thr Ala Ala Pro Lys His
145 150 155 160
aag caa cca gtt ttg att gga gtg atg atg ggt ctt agt cag att gcc 528
Lys Gln Pro Val Leu Ile Gly Val Met Met Gly Leu Ser Gln Ile Ala
165 170 175
att gtc tgt gga cca ctg ctc gga ggt gct ttc act caa cac gcc act 576
Ile Val Cys Gly Pro Leu Leu Gly Gly Ala Phe Thr Gln His Ala Thr
180 185 190
tgg cga tgg tgc ttt tat atc aat ctc ccc atc ggc gct gtc gct gca 624
Trp Arg Trp Cys Phe Tyr Ile Asn Leu Pro Ile Gly Ala Val Ala Ala
195 200 205
ttc ctc ctt ctc gtc atc acc ata ccc gac cga att tca tcc acg gac 672
Phe Leu Leu Leu Val Ile Thr Ile Pro Asp Arg Ile Ser Ser Thr Asp
210 215 220
agc gaa ctc tcg acc gac aaa cca atg gcc aac ata aaa tcc aca ctt 720
Ser Glu Leu Ser Thr Asp Lys Pro Met Ala Asn Ile Lys Ser Thr Leu
225 230 235 240
cgc aaa ctg gac ctt gta ggc ttt gtg gtc ttt gca gcc ttc gca acc 768
Arg Lys Leu Asp Leu Val Gly Phe Val Val Phe Ala Ala Phe Ala Thr
245 250 255
atg att tcc ctc gca cta gaa tgg gga ggg tcg acc tac acc tgg cga 816
Met Ile Ser Leu Ala Leu Glu Trp Gly Gly Ser Thr Tyr Thr Trp Arg
260 265 270
agt tcc gtc atc atc ggc ctg ttc tgt ggc gga ggg ttt gct ctg att 864
Ser Ser Val Ile Ile Gly Leu Phe Cys Gly Gly Gly Phe Ala Leu Ile
275 280 285
gcg ttc gtg cta tgg gag cgt cat gtt ggc gat gct gtt gcc atg att 912
Ala Phe Val Leu Trp Glu Arg His Val Gly Asp Ala Val Ala Met Ile
290 295 300
cct ggc tca gtg gct ggt aaa cga caa gtg tgg tgc tct tgt tta ttt 960
Pro Gly Ser Val Ala Gly Lys Arg Gln Val Trp Cys Ser Cys Leu Phe
305 310 315 320
atg ggc ttt ttc tct ggc tcc ttg ctt gtc ttt tcc tac tat cta ccg 1008
Met Gly Phe Phe Ser Gly Ser Leu Leu Val Phe Ser Tyr Tyr Leu Pro
325 330 335
atc tac ttc cag gct gtg aag gat gtt tct ccc aca ctg agt ggt gtg 1056
Ile Tyr Phe Gln Ala Val Lys Asp Val Ser Pro Thr Leu Ser Gly Val
340 345 350
tac atg ttg cct gga att ctt gga caa gtc att atg gct atg gtt tct 1104
Tyr Met Leu Pro Gly Ile Leu Gly Gln Val Ile Met Ala Met Val Ser
355 360 365
ggc ttc gca att gga aag aca gga tac tat ttg cct tgg gcc cta ggc 1152
Gly Phe Ala Ile Gly Lys Thr Gly Tyr Tyr Leu Pro Trp Ala Leu Gly
370 375 380
agc gct gtt ctc gtc gcc ata ggc gca ggt ctg gta tcc acc ttc cag 1200
Ser Ala Val Leu Val Ala Ile Gly Ala Gly Leu Val Ser Thr Phe Gln
385 390 395 400
ccc cat aca tca act gtg aaa tgg gtc atg tac caa ttt atc gcg ggc 1248
Pro His Thr Ser Thr Val Lys Trp Val Met Tyr Gln Phe Ile Ala Gly
405 410 415
ttc ggt cgt ggt tgt ggc atg caa acg cct atc atc gcc atc caa agc 1296
Phe Gly Arg Gly Cys Gly Met Gln Thr Pro Ile Ile Ala Ile Gln Ser
420 425 430
acg ctt tcg ccc gaa caa ggt gcc ctc gga att tct ctc gcc gtg ttt 1344
Thr Leu Ser Pro Glu Gln Gly Ala Leu Gly Ile Ser Leu Ala Val Phe
435 440 445
gga cag acg ttt gga gga tcg ctc ttc ctg gac ttt gct aac ctt gtc 1392
Gly Gln Thr Phe Gly Gly Ser Leu Phe Leu Asp Phe Ala Asn Leu Val
450 455 460
ttt ggg tcc ggt ttg aga act ggc ctg agc aag tat gcg ccc act gtc 1440
Phe Gly Ser Gly Leu Arg Thr Gly Leu Ser Lys Tyr Ala Pro Thr Val
465 470 475 480
gac acg cag gcc gtg acg gca gca ggg gcg act ggc ttc aga gat gtg 1488
Asp Thr Gln Ala Val Thr Ala Ala Gly Ala Thr Gly Phe Arg Asp Val
485 490 495
gtc agc aag aat aac ctt cca ggg gtt gta aaa gct tac agt ctc gcc 1536
Val Ser Lys Asn Asn Leu Pro Gly Val Val Lys Ala Tyr Ser Leu Ala
500 505 510
gtt gat cat act ttt tac tta gca gtg gga gct acg gcg tgc acg ttt 1584
Val Asp His Thr Phe Tyr Leu Ala Val Gly Ala Thr Ala Cys Thr Phe
515 520 525
gtg ttt gcc ttt gga atg gga tgg cgg aag att gca acc aaa aac gac 1632
Val Phe Ala Phe Gly Met Gly Trp Arg Lys Ile Ala Thr Lys Asn Asp
530 535 540
acc cgg gct gtg cct gag act gat gct 1659
Thr Arg Ala Val Pro Glu Thr Asp Ala
545 550
<210> 11
<211> 553
<212> PRT
<213> Penicillium citrinum
<400> 11
Met Ser Glu Pro Leu Pro Pro Lys Glu Gly Glu Pro Arg Pro Gln Lys
1 5 10 15
Glu Glu Ser Gln Asn Asp Thr Leu Glu Ala Thr Glu Ser Lys Ser Gln
20 25 30
His Ile Thr Gly Leu Lys Leu Gly Leu Val Val Ala Ser Val Thr Phe
35 40 45
Val Ala Phe Leu Met Leu Leu Asp Met Ser Ile Ile Val Thr Ala Ile
50 55 60
Pro His Ile Thr Ser Glu Phe His Ser Leu Asn Asp Val Gly Trp Tyr
65 70 75 80
Gly Ser Ala Tyr Leu Leu Ala Asn Cys Ala Leu Gln Pro Leu Ala Gly
85 90 95
Lys Leu Tyr Thr Leu Leu Gly Leu Lys Tyr Thr Phe Phe Ala Phe Leu
100 105 110
Cys Ile Phe Glu Leu Gly Ser Val Leu Cys Gly Ala Ala Arg Ser Ser
115 120 125
Thr Met Leu Ile Val Gly Arg Ala Val Ala Gly Met Gly Gly Ser Gly
130 135 140
Leu Val Asn Gly Ala Leu Thr Ile Leu Ser Thr Ala Ala Pro Lys His
145 150 155 160
Lys Gln Pro Val Leu Ile Gly Val Met Met Gly Leu Ser Gln Ile Ala
165 170 175
Ile Val Cys Gly Pro Leu Leu Gly Gly Ala Phe Thr Gln His Ala Thr
180 185 190
Trp Arg Trp Cys Phe Tyr Ile Asn Leu Pro Ile Gly Ala Val Ala Ala
195 200 205
Phe Leu Leu Leu Val Ile Thr Ile Pro Asp Arg Ile Ser Ser Thr Asp
210 215 220
Ser Glu Leu Ser Thr Asp Lys Pro Met Ala Asn Ile Lys Ser Thr Leu
225 230 235 240
Arg Lys Leu Asp Leu Val Gly Phe Val Val Phe Ala Ala Phe Ala Thr
245 250 255
Met Ile Ser Leu Ala Leu Glu Trp Gly Gly Ser Thr Tyr Thr Trp Arg
260 265 270
Ser Ser Val Ile Ile Gly Leu Phe Cys Gly Gly Gly Phe Ala Leu Ile
275 280 285
Ala Phe Val Leu Trp Glu Arg His Val Gly Asp Ala Val Ala Met Ile
290 295 300
Pro Gly Ser Val Ala Gly Lys Arg Gln Val Trp Cys Ser Cys Leu Phe
305 310 315 320
Met Gly Phe Phe Ser Gly Ser Leu Leu Val Phe Ser Tyr Tyr Leu Pro
325 330 335
Ile Tyr Phe Gln Ala Val Lys Asp Val Ser Pro Thr Leu Ser Gly Val
340 345 350
Tyr Met Leu Pro Gly Ile Leu Gly Gln Val Ile Met Ala Met Val Ser
355 360 365
Gly Phe Ala Ile Gly Lys Thr Gly Tyr Tyr Leu Pro Trp Ala Leu Gly
370 375 380
Ser Ala Val Leu Val Ala Ile Gly Ala Gly Leu Val Ser Thr Phe Gln
385 390 395 400
Pro His Thr Ser Thr Val Lys Trp Val Met Tyr Gln Phe Ile Ala Gly
405 410 415
Phe Gly Arg Gly Cys Gly Met Gln Thr Pro Ile Ile Ala Ile Gln Ser
420 425 430
Thr Leu Ser Pro Glu Gln Gly Ala Leu Gly Ile Ser Leu Ala Val Phe
435 440 445
Gly Gln Thr Phe Gly Gly Ser Leu Phe Leu Asp Phe Ala Asn Leu Val
450 455 460
Phe Gly Ser Gly Leu Arg Thr Gly Leu Ser Lys Tyr Ala Pro Thr Val
465 470 475 480
Asp Thr Gln Ala Val Thr Ala Ala Gly Ala Thr Gly Phe Arg Asp Val
485 490 495
Val Ser Lys Asn Asn Leu Pro Gly Val Val Lys Ala Tyr Ser Leu Ala
500 505 510
Val Asp His Thr Phe Tyr Leu Ala Val Gly Ala Thr Ala Cys Thr Phe
515 520 525
Val Phe Ala Phe Gly Met Gly Trp Arg Lys Ile Ala Thr Lys Asn Asp
530 535 540
Thr Arg Ala Val Pro Glu Thr Asp Ala
545 550
<210> 12
<211> 753
<212> DNA
<213> Penicillium citrinum
<220>
<221> CDS
<222> (1)..(753)
<400> 12
atg agt cca gcg agg att aca gat ttc tcg cca ggc aaa ccg aga aaa 48
Met Ser Pro Ala Arg Ile Thr Asp Phe Ser Pro Gly Lys Pro Arg Lys
1 5 10 15
gct ctc tta tgc atc cac ggt gcc ggg tgc tca gca gcc ata ttc cgc 96
Ala Leu Leu Cys Ile His Gly Ala Gly Cys Ser Ala Ala Ile Phe Arg
20 25 30
gtc cag atc tct aaa ctg cgc gtg gcg ttg aaa aac gag ttt gaa ttc 144
Val Gln Ile Ser Lys Leu Arg Val Ala Leu Lys Asn Glu Phe Glu Phe
35 40 45
gta tat gcg acc gcg ccg ttt agc tcc agc ccc gga ccc ggc gtg ctt 192
Val Tyr Ala Thr Ala Pro Phe Ser Ser Ser Pro Gly Pro Gly Val Leu
50 55 60
cct gtc ttc caa ggc atg ggt cca tac tac acc tgg ttc caa aag cat 240
Pro Val Phe Gln Gly Met Gly Pro Tyr Tyr Thr Trp Phe Gln Lys His
65 70 75 80
cat gac gcc gtt aca aac acg aca acc ccc acg gtg ggc gat aga gta 288
His Asp Ala Val Thr Asn Thr Thr Thr Pro Thr Val Gly Asp Arg Val
85 90 95
gcg gct gtg atc ggg cct gtg caa aag acc gtc caa gat tgg tct ata 336
Ala Ala Val Ile Gly Pro Val Gln Lys Thr Val Gln Asp Trp Ser Ile
100 105 110
act aac cca cag gca ccc att gtc ggc ata gtg gcc ttc tct gag ggc 384
Thr Asn Pro Gln Ala Pro Ile Val Gly Ile Val Ala Phe Ser Glu Gly
115 120 125
gca ttg gtc gcc act ttg ctg ctc cat caa cag caa atg gga aaa ctg 432
Ala Leu Val Ala Thr Leu Leu Leu His Gln Gln Gln Met Gly Lys Leu
130 135 140
cca tgg ttt ccg aaa atg agc att gct gtt ttg att tgc tgt ttc tat 480
Pro Trp Phe Pro Lys Met Ser Ile Ala Val Leu Ile Cys Cys Phe Tyr
145 150 155 160
agc gat gaa gcc aga gat tac atg aga gcc gag gcg caa gac gac gac 528
Ser Asp Glu Ala Arg Asp Tyr Met Arg Ala Glu Ala Gln Asp Asp Asp
165 170 175
gac aag cta ata atc aac gtg ccg aca ctg cat ctt cac ggt cgt caa 576
Asp Lys Leu Ile Ile Asn Val Pro Thr Leu His Leu His Gly Arg Gln
180 185 190
gat ttt gct ctc caa ggg tcg aga cag atg gtt gaa aca cat tac ctg 624
Asp Phe Ala Leu Gln Gly Ser Arg Gln Met Val Glu Thr His Tyr Leu
195 200 205
cct cag aat gca gat gta ctc gag ttt cag gga aag cat aat ttt ccc 672
Pro Gln Asn Ala Asp Val Leu Glu Phe Gln Gly Lys His Asn Phe Pro
210 215 220
aac aga ccg agt gat gtc cag gag acg gtc aag cgc ttc caa cag cta 720
Asn Arg Pro Ser Asp Val Gln Glu Thr Val Lys Arg Phe Gln Gln Leu
225 230 235 240
tat caa aag gtc aag atg tca ggt tca ttt gtc 753
Tyr Gln Lys Val Lys Met Ser Gly Ser Phe Val
245 250
<210> 13
<211> 251
<212> PRT
<213> Penicillium citrinum
<400> 13
Met Ser Pro Ala Arg Ile Thr Asp Phe Ser Pro Gly Lys Pro Arg Lys
1 5 10 15
Ala Leu Leu Cys Ile His Gly Ala Gly Cys Ser Ala Ala Ile Phe Arg
20 25 30
Val Gln Ile Ser Lys Leu Arg Val Ala Leu Lys Asn Glu Phe Glu Phe
35 40 45
Val Tyr Ala Thr Ala Pro Phe Ser Ser Ser Pro Gly Pro Gly Val Leu
50 55 60
Pro Val Phe Gln Gly Met Gly Pro Tyr Tyr Thr Trp Phe Gln Lys His
65 70 75 80
His Asp Ala Val Thr Asn Thr Thr Thr Pro Thr Val Gly Asp Arg Val
85 90 95
Ala Ala Val Ile Gly Pro Val Gln Lys Thr Val Gln Asp Trp Ser Ile
100 105 110
Thr Asn Pro Gln Ala Pro Ile Val Gly Ile Val Ala Phe Ser Glu Gly
115 120 125
Ala Leu Val Ala Thr Leu Leu Leu His Gln Gln Gln Met Gly Lys Leu
130 135 140
Pro Trp Phe Pro Lys Met Ser Ile Ala Val Leu Ile Cys Cys Phe Tyr
145 150 155 160
Ser Asp Glu Ala Arg Asp Tyr Met Arg Ala Glu Ala Gln Asp Asp Asp
165 170 175
Asp Lys Leu Ile Ile Asn Val Pro Thr Leu His Leu His Gly Arg Gln
180 185 190
Asp Phe Ala Leu Gln Gly Ser Arg Gln Met Val Glu Thr His Tyr Leu
195 200 205
Pro Gln Asn Ala Asp Val Leu Glu Phe Gln Gly Lys His Asn Phe Pro
210 215 220
Asn Arg Pro Ser Asp Val Gln Glu Thr Val Lys Arg Phe Gln Gln Leu
225 230 235 240
Tyr Gln Lys Val Lys Met Ser Gly Ser Phe Val
245 250
<210> 14
<211> 1086
<212> DNA
<213> Penicillium citrinum
<220>
<221> CDS
<222> (1)..(1086)
<400> 14
atg ggc gtt gcc atg act gaa ggg agt ttc atc cca ccg gtg aaa cag 48
Met Gly Val Ala Met Thr Glu Gly Ser Phe Ile Pro Pro Val Lys Gln
1 5 10 15
aca atc ctc aca gta aac gac aaa gac gag gtg gtg atc tgg gat gac 96
Thr Ile Leu Thr Val Asn Asp Lys Asp Glu Val Val Ile Trp Asp Asp
20 25 30
gcc ccg act ccg aag ctg ccc gcg gac cag gtc tac gtc cgc atc cat 144
Ala Pro Thr Pro Lys Leu Pro Ala Asp Gln Val Tyr Val Arg Ile His
35 40 45
gcc gtc gct gtc aat ccc agt gac act aag atg cga ggc gac ttt gcc 192
Ala Val Ala Val Asn Pro Ser Asp Thr Lys Met Arg Gly Asp Phe Ala
50 55 60
acg cca ttt gcc tgt cta ggt act gac tat gcc ggc act gtt gtt gct 240
Thr Pro Phe Ala Cys Leu Gly Thr Asp Tyr Ala Gly Thr Val Val Ala
65 70 75 80
gtg gga tcc gaa atc acc cat gtc aag gtg gga gac cgt gtt ttt ggg 288
Val Gly Ser Glu Ile Thr His Val Lys Val Gly Asp Arg Val Phe Gly
85 90 95
gct cag aac gag atg tgt ccg cgg acg cct gaa cag ggc gcc ttt tcg 336
Ala Gln Asn Glu Met Cys Pro Arg Thr Pro Glu Gln Gly Ala Phe Ser
100 105 110
cag tac aca atc acc cgc ggt cgc atc tgg gcc aaa atc cca gat tcg 384
Gln Tyr Thr Ile Thr Arg Gly Arg Ile Trp Ala Lys Ile Pro Asp Ser
115 120 125
atg acc tgg gaa gcc gcg gcg tcg ctt cct gcc ggt att agt acc act 432
Met Thr Trp Glu Ala Ala Ala Ser Leu Pro Ala Gly Ile Ser Thr Thr
130 135 140
ggc ttg gct atg aag ctg ctc ggt atg cca ttg ccg tac agc gag act 480
Gly Leu Ala Met Lys Leu Leu Gly Met Pro Leu Pro Tyr Ser Glu Thr
145 150 155 160
aag cct agc aaa aag act tac gtc ctg att tat ggt ggc agc act gct 528
Lys Pro Ser Lys Lys Thr Tyr Val Leu Ile Tyr Gly Gly Ser Thr Ala
165 170 175
acg gcc acc att gca atg cag ttt atg aga ttg tct gga tac aca ccg 576
Thr Ala Thr Ile Ala Met Gln Phe Met Arg Leu Ser Gly Tyr Thr Pro
180 185 190
atc gct acc tgt tct cat aag aac ttc gat ctt gcc aag aag aat ggc 624
Ile Ala Thr Cys Ser His Lys Asn Phe Asp Leu Ala Lys Lys Asn Gly
195 200 205
gca gaa gag gta ttc gac tac cgc gac gca gat tgt gca caa aaa att 672
Ala Glu Glu Val Phe Asp Tyr Arg Asp Ala Asp Cys Ala Gln Lys Ile
210 215 220
cgt gat tac acc aga aac aat ctc gct tat gcc ttg gac tgc atc att 720
Arg Asp Tyr Thr Arg Asn Asn Leu Ala Tyr Ala Leu Asp Cys Ile Ile
225 230 235 240
aac gtt gag tcc aca tcg acg tgc tac aaa gca ata ggt cgt gcc ggc 768
Asn Val Glu Ser Thr Ser Thr Cys Tyr Lys Ala Ile Gly Arg Ala Gly
245 250 255
gga cga tac gtc gcg ctg aac ccc ttc ccc gag cac gcg gcc aca cgc 816
Gly Arg Tyr Val Ala Leu Asn Pro Phe Pro Glu His Ala Ala Thr Arg
260 265 270
aag atg gtc act tcg gac tgg acc ctc ggt ccg act atc ttc ggc gag 864
Lys Met Val Thr Ser Asp Trp Thr Leu Gly Pro Thr Ile Phe Gly Glu
275 280 285
ggc tca act tgg cct gca ccg tac ggc tgt gag gcg agc gaa gag gtg 912
Gly Ser Thr Trp Pro Ala Pro Tyr Gly Cys Glu Ala Ser Glu Glu Val
290 295 300
cgt ctt ttc ggc acc gaa ctc tgg caa gtc gcc tca agg ctt gtc gag 960
Arg Leu Phe Gly Thr Glu Leu Trp Gln Val Ala Ser Arg Leu Val Glu
305 310 315 320
gag gac aag ctg tat cat cac ccc ttg cgt gtc att gat ggt ggg ctg 1008
Glu Asp Lys Leu Tyr His His Pro Leu Arg Val Ile Asp Gly Gly Leu
325 330 335
gag cag gtc aag cag ggt atg gag act gtt agg aat gga gag ctg tcg 1056
Glu Gln Val Lys Gln Gly Met Glu Thr Val Arg Asn Gly Glu Leu Ser
340 345 350
gga gag aag att gtg gtt cgg ttt tcc gtt 1086
Gly Glu Lys Ile Val Val Arg Phe Ser Val
355 360
<210> 15
<211> 362
<212> PRT
<213> Penicillium citrinum
<400> 15
Met Gly Val Ala Met Thr Glu Gly Ser Phe Ile Pro Pro Val Lys Gln
1 5 10 15
Thr Ile Leu Thr Val Asn Asp Lys Asp Glu Val Val Ile Trp Asp Asp
20 25 30
Ala Pro Thr Pro Lys Leu Pro Ala Asp Gln Val Tyr Val Arg Ile His
35 40 45
Ala Val Ala Val Asn Pro Ser Asp Thr Lys Met Arg Gly Asp Phe Ala
50 55 60
Thr Pro Phe Ala Cys Leu Gly Thr Asp Tyr Ala Gly Thr Val Val Ala
65 70 75 80
Val Gly Ser Glu Ile Thr His Val Lys Val Gly Asp Arg Val Phe Gly
85 90 95
Ala Gln Asn Glu Met Cys Pro Arg Thr Pro Glu Gln Gly Ala Phe Ser
100 105 110
Gln Tyr Thr Ile Thr Arg Gly Arg Ile Trp Ala Lys Ile Pro Asp Ser
115 120 125
Met Thr Trp Glu Ala Ala Ala Ser Leu Pro Ala Gly Ile Ser Thr Thr
130 135 140
Gly Leu Ala Met Lys Leu Leu Gly Met Pro Leu Pro Tyr Ser Glu Thr
145 150 155 160
Lys Pro Ser Lys Lys Thr Tyr Val Leu Ile Tyr Gly Gly Ser Thr Ala
165 170 175
Thr Ala Thr Ile Ala Met Gln Phe Met Arg Leu Ser Gly Tyr Thr Pro
180 185 190
Ile Ala Thr Cys Ser His Lys Asn Phe Asp Leu Ala Lys Lys Asn Gly
195 200 205
Ala Glu Glu Val Phe Asp Tyr Arg Asp Ala Asp Cys Ala Gln Lys Ile
210 215 220
Arg Asp Tyr Thr Arg Asn Asn Leu Ala Tyr Ala Leu Asp Cys Ile Ile
225 230 235 240
Asn Val Glu Ser Thr Ser Thr Cys Tyr Lys Ala Ile Gly Arg Ala Gly
245 250 255
Gly Arg Tyr Val Ala Leu Asn Pro Phe Pro Glu His Ala Ala Thr Arg
260 265 270
Lys Met Val Thr Ser Asp Trp Thr Leu Gly Pro Thr Ile Phe Gly Glu
275 280 285
Gly Ser Thr Trp Pro Ala Pro Tyr Gly Cys Glu Ala Ser Glu Glu Val
290 295 300
Arg Leu Phe Gly Thr Glu Leu Trp Gln Val Ala Ser Arg Leu Val Glu
305 310 315 320
Glu Asp Lys Leu Tyr His His Pro Leu Arg Val Ile Asp Gly Gly Leu
325 330 335
Glu Gln Val Lys Gln Gly Met Glu Thr Val Arg Asn Gly Glu Leu Ser
340 345 350
Gly Glu Lys Ile Val Val Arg Phe Ser Val
355 360
<210> 16
<211> 1254
<212> DNA
<213> Penicillium citrinum
<220>
<221> CDS
<222> (1)..(1254)
<400> 16
atg gcg ccc agc ata gat gtt att ccc act gct gct tcc acg gca gca 48
Met Ala Pro Ser Ile Asp Val Ile Pro Thr Ala Ala Ser Thr Ala Ala
1 5 10 15
gga atg att tca gac atg gaa gcg gca ttt aag tcg gcc gtt aaa tta 96
Gly Met Ile Ser Asp Met Glu Ala Ala Phe Lys Ser Ala Val Lys Leu
20 25 30
aag caa atc ccc ggg gcc gtt gtc atg gcc agg agc atg aac ggt gac 144
Lys Gln Ile Pro Gly Ala Val Val Met Ala Arg Ser Met Asn Gly Asp
35 40 45
att gat tac acg cgg tgc ttt ggg gcg aga acg gtt gag cgc gat gaa 192
Ile Asp Tyr Thr Arg Cys Phe Gly Ala Arg Thr Val Glu Arg Asp Glu
50 55 60
tgc caa aga cta cca cca atg gaa atc gac aca ccc ttg cga ctt gcc 240
Cys Gln Arg Leu Pro Pro Met Glu Ile Asp Thr Pro Leu Arg Leu Ala
65 70 75 80
agt gca aca aaa ctt ctc acc aca ata atg gcc ttg cag tgt atg gaa 288
Ser Ala Thr Lys Leu Leu Thr Thr Ile Met Ala Leu Gln Cys Met Glu
85 90 95
caa ggt ctg gtg gac ctc gat gag aat gtc aac agg ctt ctt ccc gat 336
Gln Gly Leu Val Asp Leu Asp Glu Asn Val Asn Arg Leu Leu Pro Asp
100 105 110
ttg agc gac atg caa gtc ttg act ggc ttt gac gcg gcc ggt aac gcc 384
Leu Ser Asp Met Gln Val Leu Thr Gly Phe Asp Ala Ala Gly Asn Ala
115 120 125
ata atg agg gat cgc gaa ggg att atc aag ttg agg cac ctc ttg act 432
Ile Met Arg Asp Arg Glu Gly Ile Ile Lys Leu Arg His Leu Leu Thr
130 135 140
cac act tcg ggt ctc tct tac gca ttc cta cat cct ctc cta cag gaa 480
His Thr Ser Gly Leu Ser Tyr Ala Phe Leu His Pro Leu Leu Gln Glu
145 150 155 160
tac atg gcc aag ggt tac ctc aag aca gcc gag aaa ttc ggc att caa 528
Tyr Met Ala Lys Gly Tyr Leu Lys Thr Ala Glu Lys Phe Gly Ile Gln
165 170 175
agt cga ctc gct cct cct gca atc aac gac ccc gga gta gag tgg atc 576
Ser Arg Leu Ala Pro Pro Ala Ile Asn Asp Pro Gly Val Glu Trp Ile
180 185 190
tat ggt gca aat ctc gac tgg gcc ggt aag ctt atc gag cgc gcc acc 624
Tyr Gly Ala Asn Leu Asp Trp Ala Gly Lys Leu Ile Glu Arg Ala Thr
195 200 205
ggt gtg gac ctg gag gaa ttc atg cag aag aat att tgc gag cct cta 672
Gly Val Asp Leu Glu Glu Phe Met Gln Lys Asn Ile Cys Glu Pro Leu
210 215 220
ggt atc acc gat atg aca ttc aag ctg cag cag cgg cct gac atg ctt 720
Gly Ile Thr Asp Met Thr Phe Lys Leu Gln Gln Arg Pro Asp Met Leu
225 230 235 240
gct cgt cgt tct gat cag acg cgc cgt aat gag aat ggg agt ctg cga 768
Ala Arg Arg Ser Asp Gln Thr Arg Arg Asn Glu Asn Gly Ser Leu Arg
245 250 255
tac gac gac tcg gtt tat ttc cgc cat gac ggg gag gag tgc ttc ggg 816
Tyr Asp Asp Ser Val Tyr Phe Arg His Asp Gly Glu Glu Cys Phe Gly
260 265 270
gga cag ggc gtt ttc tgc ggc ccg gag tca tat atg aag gtc ctt aac 864
Gly Gln Gly Val Phe Cys Gly Pro Glu Ser Tyr Met Lys Val Leu Asn
275 280 285
tcc ttg atg aag cat gac ggt ctc ctc ttg aag aaa gac aca att gag 912
Ser Leu Met Lys His Asp Gly Leu Leu Leu Lys Lys Asp Thr Ile Glu
290 295 300
ctt atg ttc cag ccc gct ctg gac gcg gag ctc gaa aag aaa atg aat 960
Leu Met Phe Gln Pro Ala Leu Asp Ala Glu Leu Glu Lys Lys Met Asn
305 310 315 320
gat cac atg gat acc acg ccg cac atc aac tac ggc gca gca ttg ccc 1008
Asp His Met Asp Thr Thr Pro His Ile Asn Tyr Gly Ala Ala Leu Pro
325 330 335
ccg gtt atg agg aga aac ttt ggg ctt ggt gga att atc gct atg ggc 1056
Pro Val Met Arg Arg Asn Phe Gly Leu Gly Gly Ile Ile Ala Met Gly
340 345 350
gat ctc gat ggt cat aat tgg cgg cgg gag ggg tcc ctc acc ttt ggt 1104
Asp Leu Asp Gly His Asn Trp Arg Arg Glu Gly Ser Leu Thr Phe Gly
355 360 365
ggc gga ccg aat att gtt tgg caa atc gat ccg acg gta ggg ctt tgt 1152
Gly Gly Pro Asn Ile Val Trp Gln Ile Asp Pro Thr Val Gly Leu Cys
370 375 380
acc ctg gtt gtt ttc cag cta gag ccc tgg aat gat ccg att tgc aaa 1200
Thr Leu Val Val Phe Gln Leu Glu Pro Trp Asn Asp Pro Ile Cys Lys
385 390 395 400
gat ctc act cgc aag ttc gaa aaa gcg atg tac tca cag gtg aaa tgc 1248
Asp Leu Thr Arg Lys Phe Glu Lys Ala Met Tyr Ser Gln Val Lys Cys
405 410 415
cgc aac 1254
Arg Asn
<210> 17
<211> 418
<212> PRT
<213> Penicillium citrinum
<400> 17
Met Ala Pro Ser Ile Asp Val Ile Pro Thr Ala Ala Ser Thr Ala Ala
1 5 10 15
Gly Met Ile Ser Asp Met Glu Ala Ala Phe Lys Ser Ala Val Lys Leu
20 25 30
Lys Gln Ile Pro Gly Ala Val Val Met Ala Arg Ser Met Asn Gly Asp
35 40 45
Ile Asp Tyr Thr Arg Cys Phe Gly Ala Arg Thr Val Glu Arg Asp Glu
50 55 60
Cys Gln Arg Leu Pro Pro Met Glu Ile Asp Thr Pro Leu Arg Leu Ala
65 70 75 80
Ser Ala Thr Lys Leu Leu Thr Thr Ile Met Ala Leu Gln Cys Met Glu
85 90 95
Gln Gly Leu Val Asp Leu Asp Glu Asn Val Asn Arg Leu Leu Pro Asp
100 105 110
Leu Ser Asp Met Gln Val Leu Thr Gly Phe Asp Ala Ala Gly Asn Ala
115 120 125
Ile Met Arg Asp Arg Glu Gly Ile Ile Lys Leu Arg His Leu Leu Thr
130 135 140
His Thr Ser Gly Leu Ser Tyr Ala Phe Leu His Pro Leu Leu Gln Glu
145 150 155 160
Tyr Met Ala Lys Gly Tyr Leu Lys Thr Ala Glu Lys Phe Gly Ile Gln
165 170 175
Ser Arg Leu Ala Pro Pro Ala Ile Asn Asp Pro Gly Val Glu Trp Ile
180 185 190
Tyr Gly Ala Asn Leu Asp Trp Ala Gly Lys Leu Ile Glu Arg Ala Thr
195 200 205
Gly Val Asp Leu Glu Glu Phe Met Gln Lys Asn Ile Cys Glu Pro Leu
210 215 220
Gly Ile Thr Asp Met Thr Phe Lys Leu Gln Gln Arg Pro Asp Met Leu
225 230 235 240
Ala Arg Arg Ser Asp Gln Thr Arg Arg Asn Glu Asn Gly Ser Leu Arg
245 250 255
Tyr Asp Asp Ser Val Tyr Phe Arg His Asp Gly Glu Glu Cys Phe Gly
260 265 270
Gly Gln Gly Val Phe Cys Gly Pro Glu Ser Tyr Met Lys Val Leu Asn
275 280 285
Ser Leu Met Lys His Asp Gly Leu Leu Leu Lys Lys Asp Thr Ile Glu
290 295 300
Leu Met Phe Gln Pro Ala Leu Asp Ala Glu Leu Glu Lys Lys Met Asn
305 310 315 320
Asp His Met Asp Thr Thr Pro His Ile Asn Tyr Gly Ala Ala Leu Pro
325 330 335
Pro Val Met Arg Arg Asn Phe Gly Leu Gly Gly Ile Ile Ala Met Gly
340 345 350
Asp Leu Asp Gly His Asn Trp Arg Arg Glu Gly Ser Leu Thr Phe Gly
355 360 365
Gly Gly Pro Asn Ile Val Trp Gln Ile Asp Pro Thr Val Gly Leu Cys
370 375 380
Thr Leu Val Val Phe Gln Leu Glu Pro Trp Asn Asp Pro Ile Cys Lys
385 390 395 400
Asp Leu Thr Arg Lys Phe Glu Lys Ala Met Tyr Ser Gln Val Lys Cys
405 410 415
Arg Asn
<210> 18
<211> 1377
<212> DNA
<213> Penicillium citrinum
<220>
<221> CDS
<222> (1)..(1377)
<400> 18
atg tcc ctg ccg cat gca acg att ccg acg aac cta cgc cgt cgc gcg 48
Met Ser Leu Pro His Ala Thr Ile Pro Thr Asn Leu Arg Arg Arg Ala
1 5 10 15
ttt cga cgc tca tgt gac cgg tgt cat gca caa aag ctc aaa tgt acc 96
Phe Arg Arg Ser Cys Asp Arg Cys His Ala Gln Lys Leu Lys Cys Thr
20 25 30
ggt agc aat gcc aat tta gtc cgt gct cag tgt caa cgt tgt caa caa 144
Gly Ser Asn Ala Asn Leu Val Arg Ala Gln Cys Gln Arg Cys Gln Gln
35 40 45
gcc gga tta agg tgt gtg tac agc gaa agg cta ccc aag cgc aat tta 192
Ala Gly Leu Arg Cys Val Tyr Ser Glu Arg Leu Pro Lys Arg Asn Leu
50 55 60
cat aaa gaa gcc gca gct gga act aca aga gcc aca gaa acc tca caa 240
His Lys Glu Ala Ala Ala Gly Thr Thr Arg Ala Thr Glu Thr Ser Gln
65 70 75 80
ccg atg acc gcg aca tct tct acg gtc ttc tca tca ttg gca gag act 288
Pro Met Thr Ala Thr Ser Ser Thr Val Phe Ser Ser Leu Ala Glu Thr
85 90 95
cct cca cct tac tgc tca cca cct acg cat att ggc acc tcg gca ctc 336
Pro Pro Pro Tyr Cys Ser Pro Pro Thr His Ile Gly Thr Ser Ala Leu
100 105 110
aag gaa aca tta tca gaa cca tca gcg gca acc ctg caa ttc tat gat 384
Lys Glu Thr Leu Ser Glu Pro Ser Ala Ala Thr Leu Gln Phe Tyr Asp
115 120 125
aca tca atc aac ttt gat gat ccc gag tcg ttt ccc ggc ggc tgg cct 432
Thr Ser Ile Asn Phe Asp Asp Pro Glu Ser Phe Pro Gly Gly Trp Pro
130 135 140
cag cca aat aca ttt cgc gac gat gcc aac agc aat gaa tct tcg ggg 480
Gln Pro Asn Thr Phe Arg Asp Asp Ala Asn Ser Asn Glu Ser Ser Gly
145 150 155 160
ata cca gat cta ggc tac gac ttt gaa ggc cct ttg gat gca acg gcg 528
Ile Pro Asp Leu Gly Tyr Asp Phe Glu Gly Pro Leu Asp Ala Thr Ala
165 170 175
cct gtc tcg cca tcg ctg ttt gac ctc gaa gta gag ggg aac tcg tca 576
Pro Val Ser Pro Ser Leu Phe Asp Leu Glu Val Glu Gly Asn Ser Ser
180 185 190
tcc gga caa tcc aac aca agc aac acg caa cga gac ctt ttc gaa agt 624
Ser Gly Gln Ser Asn Thr Ser Asn Thr Gln Arg Asp Leu Phe Glu Ser
195 200 205
ctg tcg gat gtg tca cag gac cta gag gta ata ctc cac ggg gtg act 672
Leu Ser Asp Val Ser Gln Asp Leu Glu Val Ile Leu His Gly Val Thr
210 215 220
gtg gaa tgg ccc aag caa aaa att tta agc tac ccg ata ggg gac ttt 720
Val Glu Trp Pro Lys Gln Lys Ile Leu Ser Tyr Pro Ile Gly Asp Phe
225 230 235 240
ttg aat gcc ttt ggt aga ttg cta cta cat ctt caa gaa cgt gtg atc 768
Leu Asn Ala Phe Gly Arg Leu Leu Leu His Leu Gln Glu Arg Val Ile
245 250 255
acg agc agc aat agc agc atg tta gat ggg tgt ctg caa acc aag aac 816
Thr Ser Ser Asn Ser Ser Met Leu Asp Gly Cys Leu Gln Thr Lys Asn
260 265 270
ttg ttc atg gcg gtg cat tgc tac atg ttg tct gtc aaa atc atg aca 864
Leu Phe Met Ala Val His Cys Tyr Met Leu Ser Val Lys Ile Met Thr
275 280 285
tca ctt tcc cag ctg cta cta tcc gag gtg atg aaa gcc caa cct tgt 912
Ser Leu Ser Gln Leu Leu Leu Ser Glu Val Met Lys Ala Gln Pro Cys
290 295 300
gga caa aag caa agc aca cga atg gat tgg tac tgg tct ggc tca acc 960
Gly Gln Lys Gln Ser Thr Arg Met Asp Trp Tyr Trp Ser Gly Ser Thr
305 310 315 320
act aga aat gac aat gga aga gcc gaa gca ctt ccc tcg ttt cac tct 1008
Thr Arg Asn Asp Asn Gly Arg Ala Glu Ala Leu Pro Ser Phe His Ser
325 330 335
aat ctt cat atc ggc gag ctc att tca cat ctc gac cca ttc atg cac 1056
Asn Leu His Ile Gly Glu Leu Ile Ser His Leu Asp Pro Phe Met His
340 345 350
gcc tta tct tct gca tgc acg aca ttg cgt gta agc ctt cga cta ttg 1104
Ala Leu Ser Ser Ala Cys Thr Thr Leu Arg Val Ser Leu Arg Leu Leu
355 360 365
agt gag att gag act gct ttg ggg ata gca cag gag cac ggg gct gcg 1152
Ser Glu Ile Glu Thr Ala Leu Gly Ile Ala Gln Glu His Gly Ala Ala
370 375 380
gca tct att cgt cta gtc cta tca gat atg cca agc aca tcg tgg caa 1200
Ala Ser Ile Arg Leu Val Leu Ser Asp Met Pro Ser Thr Ser Trp Gln
385 390 395 400
atc ctt ggc gct gaa aat aaa acc ata acg ccg gcc tct cgt ctc cta 1248
Ile Leu Gly Ala Glu Asn Lys Thr Ile Thr Pro Ala Ser Arg Leu Leu
405 410 415
tct gtg ctt tgg agt gac gaa gcc gga gac gaa gag ccc aag tca aca 1296
Ser Val Leu Trp Ser Asp Glu Ala Gly Asp Glu Glu Pro Lys Ser Thr
420 425 430
aag gcc tca ggg aag acg ata aat gtg ttg cga cgt tgc tat aag gaa 1344
Lys Ala Ser Gly Lys Thr Ile Asn Val Leu Arg Arg Cys Tyr Lys Glu
435 440 445
ata ttc gca tta gcg aag aaa cac aat att gct 1377
Ile Phe Ala Leu Ala Lys Lys His Asn Ile Ala
450 455 460
<210> 19
<211> 459
<212> PRT
<213> Penicillium citrinum
<400> 19
Met Ser Leu Pro His Ala Thr Ile Pro Thr Asn Leu Arg Arg Arg Ala
1 5 10 15
Phe Arg Arg Ser Cys Asp Arg Cys His Ala Gln Lys Leu Lys Cys Thr
20 25 30
Gly Ser Asn Ala Asn Leu Val Arg Ala Gln Cys Gln Arg Cys Gln Gln
35 40 45
Ala Gly Leu Arg Cys Val Tyr Ser Glu Arg Leu Pro Lys Arg Asn Leu
50 55 60
His Lys Glu Ala Ala Ala Gly Thr Thr Arg Ala Thr Glu Thr Ser Gln
65 70 75 80
Pro Met Thr Ala Thr Ser Ser Thr Val Phe Ser Ser Leu Ala Glu Thr
85 90 95
Pro Pro Pro Tyr Cys Ser Pro Pro Thr His Ile Gly Thr Ser Ala Leu
100 105 110
Lys Glu Thr Leu Ser Glu Pro Ser Ala Ala Thr Leu Gln Phe Tyr Asp
115 120 125
Thr Ser Ile Asn Phe Asp Asp Pro Glu Ser Phe Pro Gly Gly Trp Pro
130 135 140
Gln Pro Asn Thr Phe Arg Asp Asp Ala Asn Ser Asn Glu Ser Ser Gly
145 150 155 160
Ile Pro Asp Leu Gly Tyr Asp Phe Glu Gly Pro Leu Asp Ala Thr Ala
165 170 175
Pro Val Ser Pro Ser Leu Phe Asp Leu Glu Val Glu Gly Asn Ser Ser
180 185 190
Ser Gly Gln Ser Asn Thr Ser Asn Thr Gln Arg Asp Leu Phe Glu Ser
195 200 205
Leu Ser Asp Val Ser Gln Asp Leu Glu Val Ile Leu His Gly Val Thr
210 215 220
Val Glu Trp Pro Lys Gln Lys Ile Leu Ser Tyr Pro Ile Gly Asp Phe
225 230 235 240
Leu Asn Ala Phe Gly Arg Leu Leu Leu His Leu Gln Glu Arg Val Ile
245 250 255
Thr Ser Ser Asn Ser Ser Met Leu Asp Gly Cys Leu Gln Thr Lys Asn
260 265 270
Leu Phe Met Ala Val His Cys Tyr Met Leu Ser Val Lys Ile Met Thr
275 280 285
Ser Leu Ser Gln Leu Leu Leu Ser Glu Val Met Lys Ala Gln Pro Cys
290 295 300
Gly Gln Lys Gln Ser Thr Arg Met Asp Trp Tyr Trp Ser Gly Ser Thr
305 310 315 320
Thr Arg Asn Asp Asn Gly Arg Ala Glu Ala Leu Pro Ser Phe His Ser
325 330 335
Asn Leu His Ile Gly Glu Leu Ile Ser His Leu Asp Pro Phe Met His
340 345 350
Ala Leu Ser Ser Ala Cys Thr Thr Leu Arg Val Ser Leu Arg Leu Leu
355 360 365
Ser Glu Ile Glu Thr Ala Leu Gly Ile Ala Gln Glu His Gly Ala Ala
370 375 380
Ala Ser Ile Arg Leu Val Leu Ser Asp Met Pro Ser Thr Ser Trp Gln
385 390 395 400
Ile Leu Gly Ala Glu Asn Lys Thr Ile Thr Pro Ala Ser Arg Leu Leu
405 410 415
Ser Val Leu Trp Ser Asp Glu Ala Gly Asp Glu Glu Pro Lys Ser Thr
420 425 430
Lys Ala Ser Gly Lys Thr Ile Asn Val Leu Arg Arg Cys Tyr Lys Glu
435 440 445
Ile Phe Ala Leu Ala Lys Lys His Asn Ile Ala
450 455
<210> 20
<211> 1596
<212> DNA
<213> Penicillium citrinum
<220>
<221> CDS
<222> (1)..(1596)
<400> 20
atg atg ttc gcg act ttc cgg tac agc tcc cag gag gaa tcc ttg caa 48
Met Met Phe Ala Thr Phe Arg Tyr Ser Ser Gln Glu Glu Ser Leu Gln
1 5 10 15
gtt gaa cat tcc cca agt ccg acg aat cgt aat ggt cat tat cga tcg 96
Val Glu His Ser Pro Ser Pro Thr Asn Arg Asn Gly His Tyr Arg Ser
20 25 30
gca tgt gat aat tgc cga gcg aga aag ctt cga tgc gat ggt cag aga 144
Ala Cys Asp Asn Cys Arg Ala Arg Lys Leu Arg Cys Asp Gly Gln Arg
35 40 45
gaa ggg tgc gaa cga tgc cgt gat cgc cgg gtt tct tgt gac tac tcc 192
Glu Gly Cys Glu Arg Cys Arg Asp Arg Arg Val Ser Cys Asp Tyr Ser
50 55 60
gag gga aga cta gat gga aag cga cgg cga aag gat cag gtg gct ggt 240
Glu Gly Arg Leu Asp Gly Lys Arg Arg Arg Lys Asp Gln Val Ala Gly
65 70 75 80
ctg atg atg gaa aat cct aca tca gat gga caa gat agc agc ttc aaa 288
Leu Met Met Glu Asn Pro Thr Ser Asp Gly Gln Asp Ser Ser Phe Lys
85 90 95
gac cta cct agt cat atg cct att caa aat ccg cca cca tcc gac tca 336
Asp Leu Pro Ser His Met Pro Ile Gln Asn Pro Pro Pro Ser Asp Ser
100 105 110
acg gag tca atg gag ctg tca agc ccc tcc gtc gcg aat ctg atg gac 384
Thr Glu Ser Met Glu Leu Ser Ser Pro Ser Val Ala Asn Leu Met Asp
115 120 125
atg acg ccc ttt gac atc atg tca tta gac ctc ttc atc aac agt tcg 432
Met Thr Pro Phe Asp Ile Met Ser Leu Asp Leu Phe Ile Asn Ser Ser
130 135 140
cca gat gaa cgg tcc agt ttg gaa aat ggg tct atc cga acg aca agt 480
Pro Asp Glu Arg Ser Ser Leu Glu Asn Gly Ser Ile Arg Thr Thr Ser
145 150 155 160
act act gac agc cat agg gta aat aag cac gtg aat ata cca gat tgc 528
Thr Thr Asp Ser His Arg Val Asn Lys His Val Asn Ile Pro Asp Cys
165 170 175
tca atg aat cag att atc ggc ctc tca cca gcg ctc acc cca gcg gta 576
Ser Met Asn Gln Ile Ile Gly Leu Ser Pro Ala Leu Thr Pro Ala Val
180 185 190
ctc agt cat caa acc cat aaa tcc aat cct gcg gac aat ggg ctt tcc 624
Leu Ser His Gln Thr His Lys Ser Asn Pro Ala Asp Asn Gly Leu Ser
195 200 205
gtt cat gta gat acc tac caa tcc acc acg cac ctg act cca cac caa 672
Val His Val Asp Thr Tyr Gln Ser Thr Thr His Leu Thr Pro His Gln
210 215 220
ccg acg aca cat caa tcg gct aca cac tca ccg act gca cac caa ccg 720
Pro Thr Thr His Gln Ser Ala Thr His Ser Pro Thr Ala His Gln Pro
225 230 235 240
act gca cac caa ccg act gca cac caa ccg act gca cac caa ccg act 768
Thr Ala His Gln Pro Thr Ala His Gln Pro Thr Ala His Gln Pro Thr
245 250 255
gca cac caa ccg act gca cac caa ccg act gca cac caa ccg act gca 816
Ala His Gln Pro Thr Ala His Gln Pro Thr Ala His Gln Pro Thr Ala
260 265 270
cac caa ccg act gca cac caa ccg act gca cac caa ccg act gca cac 864
His Gln Pro Thr Ala His Gln Pro Thr Ala His Gln Pro Thr Ala His
275 280 285
caa ccg act gca cac caa ccg act gca cac caa ccg act gca cac caa 912
Gln Pro Thr Ala His Gln Pro Thr Ala His Gln Pro Thr Ala His Gln
290 295 300
ccg act gca cac caa ccg act gca cac caa ccg act gca cac caa ccg 960
Pro Thr Ala His Gln Pro Thr Ala His Gln Pro Thr Ala His Gln Pro
305 310 315 320
act gca cac caa ccg act gca cac caa ccg act gca cac caa ccg act 1008
Thr Ala His Gln Pro Thr Ala His Gln Pro Thr Ala His Gln Pro Thr
325 330 335
gca cac caa ccg act gca cac caa ccg act gca cac caa ccg act gca 1056
Ala His Gln Pro Thr Ala His Gln Pro Thr Ala His Gln Pro Thr Ala
340 345 350
cac caa caa tct tca ata gaa cac tgc cac tgt gta gat gac gcc ctc 1104
His Gln Gln Ser Ser Ile Glu His Cys His Cys Val Asp Asp Ala Leu
355 360 365
cag gtc att gag aag ata gag gga atc acg aga cag gtc acg cct ttg 1152
Gln Val Ile Glu Lys Ile Glu Gly Ile Thr Arg Gln Val Thr Pro Leu
370 375 380
att ccg gac tat gcg cta gta gtt caa aga acg gca atg gac tac tgc 1200
Ile Pro Asp Tyr Ala Leu Val Val Gln Arg Thr Ala Met Asp Tyr Cys
385 390 395 400
agt agg atc atg gaa tgc ggc gtt tgc agc atg atc tct agg aat ata 1248
Ser Arg Ile Met Glu Cys Gly Val Cys Ser Met Ile Ser Arg Asn Ile
405 410 415
atg ttg gct ctg gtt gtg tgt gag aag ctc gct gtt ctt ttg cac ggg 1296
Met Leu Ala Leu Val Val Cys Glu Lys Leu Ala Val Leu Leu His Gly
420 425 430
acg ctg ctg ccg ggg ggt tgg aga aag agt ata caa agt cag ctc cac 1344
Thr Leu Leu Pro Gly Gly Trp Arg Lys Ser Ile Gln Ser Gln Leu His
435 440 445
ggt cat tac ccc gct gtg ctc aga tat cca aaa cgg acc gag gaa tct 1392
Gly His Tyr Pro Ala Val Leu Arg Tyr Pro Lys Arg Thr Glu Glu Ser
450 455 460
gtc att tta ggg tcg tat aga agc agc gac cag aag gaa tgg gcc gct 1440
Val Ile Leu Gly Ser Tyr Arg Ser Ser Asp Gln Lys Glu Trp Ala Ala
465 470 475 480
gta gtt act ttg ctg ttc aca ttt cag gaa cat cgt ctg cag aag ttg 1488
Val Val Thr Leu Leu Phe Thr Phe Gln Glu His Arg Leu Gln Lys Leu
485 490 495
atc ggg gat ctg aaa cac ctg gca gcc agc aac cac tgg cat gtg cac 1536
Ile Gly Asp Leu Lys His Leu Ala Ala Ser Asn His Trp His Val His
500 505 510
gta tcc atg ttg gag tta atg gaa aaa ggg agc gca tta ccc cag act 1584
Val Ser Met Leu Glu Leu Met Glu Lys Gly Ser Ala Leu Pro Gln Thr
515 520 525
ata ggg aca agc 1596
Ile Gly Thr Ser
530
<210> 21
<211> 532
<212> PRT
<213> Penicillium citrinum
<400> 21
Met Met Phe Ala Thr Phe Arg Tyr Ser Ser Gln Glu Glu Ser Leu Gln
1 5 10 15
Val Glu His Ser Pro Ser Pro Thr Asn Arg Asn Gly His Tyr Arg Ser
20 25 30
Ala Cys Asp Asn Cys Arg Ala Arg Lys Leu Arg Cys Asp Gly Gln Arg
35 40 45
Glu Gly Cys Glu Arg Cys Arg Asp Arg Arg Val Ser Cys Asp Tyr Ser
50 55 60
Glu Gly Arg Leu Asp Gly Lys Arg Arg Arg Lys Asp Gln Val Ala Gly
65 70 75 80
Leu Met Met Glu Asn Pro Thr Ser Asp Gly Gln Asp Ser Ser Phe Lys
85 90 95
Asp Leu Pro Ser His Met Pro Ile Gln Asn Pro Pro Pro Ser Asp Ser
100 105 110
Thr Glu Ser Met Glu Leu Ser Ser Pro Ser Val Ala Asn Leu Met Asp
115 120 125
Met Thr Pro Phe Asp Ile Met Ser Leu Asp Leu Phe Ile Asn Ser Ser
130 135 140
Pro Asp Glu Arg Ser Ser Leu Glu Asn Gly Ser Ile Arg Thr Thr Ser
145 150 155 160
Thr Thr Asp Ser His Arg Val Asn Lys His Val Asn Ile Pro Asp Cys
165 170 175
Ser Met Asn Gln Ile Ile Gly Leu Ser Pro Ala Leu Thr Pro Ala Val
180 185 190
Leu Ser His Gln Thr His Lys Ser Asn Pro Ala Asp Asn Gly Leu Ser
195 200 205
Val His Val Asp Thr Tyr Gln Ser Thr Thr His Leu Thr Pro His Gln
210 215 220
Pro Thr Thr His Gln Ser Ala Thr His Ser Pro Thr Ala His Gln Pro
225 230 235 240
Thr Ala His Gln Pro Thr Ala His Gln Pro Thr Ala His Gln Pro Thr
245 250 255
Ala His Gln Pro Thr Ala His Gln Pro Thr Ala His Gln Pro Thr Ala
260 265 270
His Gln Pro Thr Ala His Gln Pro Thr Ala His Gln Pro Thr Ala His
275 280 285
Gln Pro Thr Ala His Gln Pro Thr Ala His Gln Pro Thr Ala His Gln
290 295 300
Pro Thr Ala His Gln Pro Thr Ala His Gln Pro Thr Ala His Gln Pro
305 310 315 320
Thr Ala His Gln Pro Thr Ala His Gln Pro Thr Ala His Gln Pro Thr
325 330 335
Ala His Gln Pro Thr Ala His Gln Pro Thr Ala His Gln Pro Thr Ala
340 345 350
His Gln Gln Ser Ser Ile Glu His Cys His Cys Val Asp Asp Ala Leu
355 360 365
Gln Val Ile Glu Lys Ile Glu Gly Ile Thr Arg Gln Val Thr Pro Leu
370 375 380
Ile Pro Asp Tyr Ala Leu Val Val Gln Arg Thr Ala Met Asp Tyr Cys
385 390 395 400
Ser Arg Ile Met Glu Cys Gly Val Cys Ser Met Ile Ser Arg Asn Ile
405 410 415
Met Leu Ala Leu Val Val Cys Glu Lys Leu Ala Val Leu Leu His Gly
420 425 430
Thr Leu Leu Pro Gly Gly Trp Arg Lys Ser Ile Gln Ser Gln Leu His
435 440 445
Gly His Tyr Pro Ala Val Leu Arg Tyr Pro Lys Arg Thr Glu Glu Ser
450 455 460
Val Ile Leu Gly Ser Tyr Arg Ser Ser Asp Gln Lys Glu Trp Ala Ala
465 470 475 480
Val Val Thr Leu Leu Phe Thr Phe Gln Glu His Arg Leu Gln Lys Leu
485 490 495
Ile Gly Asp Leu Lys His Leu Ala Ala Ser Asn His Trp His Val His
500 505 510
Val Ser Met Leu Glu Leu Met Glu Lys Gly Ser Ala Leu Pro Gln Thr
515 520 525
Ile Gly Thr Ser
530
<210> 22
<211> 1440
<212> DNA
<213> Penicillium citrinum
<220>
<221> CDS
<222> (1)..(1440)
<400> 22
atg cat cat ttc agt tct ttg gat gag att atg cca gtt att gaa ctg 48
Met His His Phe Ser Ser Leu Asp Glu Ile Met Pro Val Ile Glu Leu
1 5 10 15
cca ttc gtg ctg tgt ttc cct cac tcg gat gca tca att ccg caa act 96
Pro Phe Val Leu Cys Phe Pro His Ser Asp Ala Ser Ile Pro Gln Thr
20 25 30
gtt tca gtc ctt cgg gag gga ctc tcc aag gtt tat gcc aag tta cta 144
Val Ser Val Leu Arg Glu Gly Leu Ser Lys Val Tyr Ala Lys Leu Leu
35 40 45
ttt ctt act ggc aac ctc cag caa gtc gaa aat gct ggg ctc aga cct 192
Phe Leu Thr Gly Asn Leu Gln Gln Val Glu Asn Ala Gly Leu Arg Pro
50 55 60
gga agt ttc gcc gtg gaa tca aac cca tcc gag ccg cct acc ctt tca 240
Gly Ser Phe Ala Val Glu Ser Asn Pro Ser Glu Pro Pro Thr Leu Ser
65 70 75 80
gtt cga gac atg acg agc ggc tct agt aca gat tgg agt tgg aca tac 288
Val Arg Asp Met Thr Ser Gly Ser Ser Thr Asp Trp Ser Trp Thr Tyr
85 90 95
cat gat ctc cgt gaa cgg gga ttt ccc atg agt ctg ctg aac cgg gac 336
His Asp Leu Arg Glu Arg Gly Phe Pro Met Ser Leu Leu Asn Arg Asp
100 105 110
gtt ctc gcc ccg act gat ccc tgt tca ggg cgt aca aga ctc ttg gct 384
Val Leu Ala Pro Thr Asp Pro Cys Ser Gly Arg Thr Arg Leu Leu Ala
115 120 125
gca caa gca aat ttc att ccg gga ggc tgc ctg tta tac gtc tca acc 432
Ala Gln Ala Asn Phe Ile Pro Gly Gly Cys Leu Leu Tyr Val Ser Thr
130 135 140
tcg cac gcc ttc gcg gac gcc ttt gga ctc tct acc ttg cta tgt gag 480
Ser His Ala Phe Ala Asp Ala Phe Gly Leu Ser Thr Leu Leu Cys Glu
145 150 155 160
tgg agt cgg caa tgc cgt gat gct ctt ggc acc agt gac gaa ata ccg 528
Trp Ser Arg Gln Cys Arg Asp Ala Leu Gly Thr Ser Asp Glu Ile Pro
165 170 175
aat gtt agc agg cag aag gaa att tcc acg gca ttg gat caa gac tcg 576
Asn Val Ser Arg Gln Lys Glu Ile Ser Thr Ala Leu Asp Gln Asp Ser
180 185 190
ccc tgt cgc agt cta gtc gtt caa ccc tat agt ccc acg tca gcg gtc 624
Pro Cys Arg Ser Leu Val Val Gln Pro Tyr Ser Pro Thr Ser Ala Val
195 200 205
tat gag cgt ctc aaa tcc aaa cca att ctg tgg cat gtt ttg ggg ttg 672
Tyr Glu Arg Leu Lys Ser Lys Pro Ile Leu Trp His Val Leu Gly Leu
210 215 220
gat tgg aga ccc aaa gaa cga agc agt cgg ata ttg atg tct cag atc 720
Asp Trp Arg Pro Lys Glu Arg Ser Ser Arg Ile Leu Met Ser Gln Ile
225 230 235 240
cct ccg tcg cct gtg agg tcg tgt ata ttc tct att acc gca aat tct 768
Pro Pro Ser Pro Val Arg Ser Cys Ile Phe Ser Ile Thr Ala Asn Ser
245 250 255
gtc gag aag ttg agg caa gtg gct cta ggg ggg tct tct ggt gtt cca 816
Val Glu Lys Leu Arg Gln Val Ala Leu Gly Gly Ser Ser Gly Val Pro
260 265 270
aaa tct tca cag tct att tcc acg gac gat gca ctg ggg gcc ctg ctt 864
Lys Ser Ser Gln Ser Ile Ser Thr Asp Asp Ala Leu Gly Ala Leu Leu
275 280 285
tgg agc tgc ctt atg aga gct cgt ttg acg gaa cga gaa agt ttc gag 912
Trp Ser Cys Leu Met Arg Ala Arg Leu Thr Glu Arg Glu Ser Phe Glu
290 295 300
aac ccc aag gaa gcg aca atg atg cga gcg gtc aac gtg cgc aaa ctc 960
Asn Pro Lys Glu Ala Thr Met Met Arg Ala Val Asn Val Arg Lys Leu
305 310 315 320
ctg tct gtt cca gaa aca cat ctt ggc aac acg att ctt tat gcc gtg 1008
Leu Ser Val Pro Glu Thr His Leu Gly Asn Thr Ile Leu Tyr Ala Val
325 330 335
aca aag ctg tcc att gat ctg ctc gcc act agg ggc aca gac cat ttg 1056
Thr Lys Leu Ser Ile Asp Leu Leu Ala Thr Arg Gly Thr Asp His Leu
340 345 350
aat gtt gtt gct cag agt ttg cgg gaa tct ctc gac gag ctg aga gac 1104
Asn Val Val Ala Gln Ser Leu Arg Glu Ser Leu Asp Glu Leu Arg Asp
355 360 365
tct agt atg gtt caa gag gcg gta gaa ttg gca aac aac atc ccg gat 1152
Ser Ser Met Val Gln Glu Ala Val Glu Leu Ala Asn Asn Ile Pro Asp
370 375 380
gtc cgc ggc atg gga ctc tca ttt ccc acg tgg gtt gcg gag aac atg 1200
Val Arg Gly Met Gly Leu Ser Phe Pro Thr Trp Val Ala Glu Asn Met
385 390 395 400
gtg ttt agt tct ctt tct cga ttg ccg cta cta gac tgg gat ttc gga 1248
Val Phe Ser Ser Leu Ser Arg Leu Pro Leu Leu Asp Trp Asp Phe Gly
405 410 415
agt ata tct cac ggg ggc ttg ggc aag ccg gac aga atg cga ttc ccc 1296
Ser Ile Ser His Gly Gly Leu Gly Lys Pro Asp Arg Met Arg Phe Pro
420 425 430
gac aag tgt ttt gaa ggt ata acc ttt act atg ccc cag cga cca gac 1344
Asp Lys Cys Phe Glu Gly Ile Thr Phe Thr Met Pro Gln Arg Pro Asp
435 440 445
gga tca ctg gaa atc atg atc acc atg aaa gca gtg gat atg gag ata 1392
Gly Ser Leu Glu Ile Met Ile Thr Met Lys Ala Val Asp Met Glu Ile
450 455 460
ttg atg acc gat caa acc ttc act gag ttc ttc agc ttt gta tct gag 1440
Leu Met Thr Asp Gln Thr Phe Thr Glu Phe Phe Ser Phe Val Ser Glu
465 470 475 480
<210> 23
<211> 480
<212> PRT
<213> Penicillium citrinum
<400> 23
Met His His Phe Ser Ser Leu Asp Glu Ile Met Pro Val Ile Glu Leu
1 5 10 15
Pro Phe Val Leu Cys Phe Pro His Ser Asp Ala Ser Ile Pro Gln Thr
20 25 30
Val Ser Val Leu Arg Glu Gly Leu Ser Lys Val Tyr Ala Lys Leu Leu
35 40 45
Phe Leu Thr Gly Asn Leu Gln Gln Val Glu Asn Ala Gly Leu Arg Pro
50 55 60
Gly Ser Phe Ala Val Glu Ser Asn Pro Ser Glu Pro Pro Thr Leu Ser
65 70 75 80
Val Arg Asp Met Thr Ser Gly Ser Ser Thr Asp Trp Ser Trp Thr Tyr
85 90 95
His Asp Leu Arg Glu Arg Gly Phe Pro Met Ser Leu Leu Asn Arg Asp
100 105 110
Val Leu Ala Pro Thr Asp Pro Cys Ser Gly Arg Thr Arg Leu Leu Ala
115 120 125
Ala Gln Ala Asn Phe Ile Pro Gly Gly Cys Leu Leu Tyr Val Ser Thr
130 135 140
Ser His Ala Phe Ala Asp Ala Phe Gly Leu Ser Thr Leu Leu Cys Glu
145 150 155 160
Trp Ser Arg Gln Cys Arg Asp Ala Leu Gly Thr Ser Asp Glu Ile Pro
165 170 175
Asn Val Ser Arg Gln Lys Glu Ile Ser Thr Ala Leu Asp Gln Asp Ser
180 185 190
Pro Cys Arg Ser Leu Val Val Gln Pro Tyr Ser Pro Thr Ser Ala Val
195 200 205
Tyr Glu Arg Leu Lys Ser Lys Pro Ile Leu Trp His Val Leu Gly Leu
210 215 220
Asp Trp Arg Pro Lys Glu Arg Ser Ser Arg Ile Leu Met Ser Gln Ile
225 230 235 240
Pro Pro Ser Pro Val Arg Ser Cys Ile Phe Ser Ile Thr Ala Asn Ser
245 250 255
Val Glu Lys Leu Arg Gln Val Ala Leu Gly Gly Ser Ser Gly Val Pro
260 265 270
Lys Ser Ser Gln Ser Ile Ser Thr Asp Asp Ala Leu Gly Ala Leu Leu
275 280 285
Trp Ser Cys Leu Met Arg Ala Arg Leu Thr Glu Arg Glu Ser Phe Glu
290 295 300
Asn Pro Lys Glu Ala Thr Met Met Arg Ala Val Asn Val Arg Lys Leu
305 310 315 320
Leu Ser Val Pro Glu Thr His Leu Gly Asn Thr Ile Leu Tyr Ala Val
325 330 335
Thr Lys Leu Ser Ile Asp Leu Leu Ala Thr Arg Gly Thr Asp His Leu
340 345 350
Asn Val Val Ala Gln Ser Leu Arg Glu Ser Leu Asp Glu Leu Arg Asp
355 360 365
Ser Ser Met Val Gln Glu Ala Val Glu Leu Ala Asn Asn Ile Pro Asp
370 375 380
Val Arg Gly Met Gly Leu Ser Phe Pro Thr Trp Val Ala Glu Asn Met
385 390 395 400
Val Phe Ser Ser Leu Ser Arg Leu Pro Leu Leu Asp Trp Asp Phe Gly
405 410 415
Ser Ile Ser His Gly Gly Leu Gly Lys Pro Asp Arg Met Arg Phe Pro
420 425 430
Asp Lys Cys Phe Glu Gly Ile Thr Phe Thr Met Pro Gln Arg Pro Asp
435 440 445
Gly Ser Leu Glu Ile Met Ile Thr Met Lys Ala Val Asp Met Glu Ile
450 455 460
Leu Met Thr Asp Gln Thr Phe Thr Glu Phe Phe Ser Phe Val Ser Glu
465 470 475 480
<210> 24
<211> 1683
<212> DNA
<213> Penicillium citrinum
<220>
<221> CDS
<222> (1)..(1683)
<400> 24
atg gct ttt ggc ccg tat gtt gcc tac gga gca cta gca cta gcc gcc 48
Met Ala Phe Gly Pro Tyr Val Ala Tyr Gly Ala Leu Ala Leu Ala Ala
1 5 10 15
tac aag att gca aaa ctt ttc ttt ttt gta ttt caa gcc cga aag aca 96
Tyr Lys Ile Ala Lys Leu Phe Phe Phe Val Phe Gln Ala Arg Lys Thr
20 25 30
ggt ctg cct cat gtt ctc act cca ttt ctg gag aca gaa gta att gcg 144
Gly Leu Pro His Val Leu Thr Pro Phe Leu Glu Thr Glu Val Ile Ala
35 40 45
ttt ctt ctc acg cca att ctg cgt acc gtg tac cat gcc cat ctc gat 192
Phe Leu Leu Thr Pro Ile Leu Arg Thr Val Tyr His Ala His Leu Asp
50 55 60
aaa gaa act gga tgg cca aga tgg tgt cgg ttc att gtc aaa gac tgg 240
Lys Glu Thr Gly Trp Pro Arg Trp Cys Arg Phe Ile Val Lys Asp Trp
65 70 75 80
tcc tgg gag gat aaa cga aga gct cac gag gag tat ggt gat gtg ttt 288
Ser Trp Glu Asp Lys Arg Arg Ala His Glu Glu Tyr Gly Asp Val Phe
85 90 95
ctc gtt gtt tcc ccc gag ggc atc atc tgt tat agc gcc gat gca gcc 336
Leu Val Val Ser Pro Glu Gly Ile Ile Cys Tyr Ser Ala Asp Ala Ala
100 105 110
atg ggg tgg gat gtc atg aac cga aga aag gat ttt acc aag ccg cga 384
Met Gly Trp Asp Val Met Asn Arg Arg Lys Asp Phe Thr Lys Pro Arg
115 120 125
gat aaa tac aaa att ctc gag ccg tat ggc ccc aat gtt gcc acc gcc 432
Asp Lys Tyr Lys Ile Leu Glu Pro Tyr Gly Pro Asn Val Ala Thr Ala
130 135 140
gaa ggc gga aca tac cga ttc cac gtc agg gtc acc gcg tcg agt ttc 480
Glu Gly Gly Thr Tyr Arg Phe His Val Arg Val Thr Ala Ser Ser Phe
145 150 155 160
aat gac caa agc ggc gta aat gac ctg gta atg tcg gag acc ata cat 528
Asn Asp Gln Ser Gly Val Asn Asp Leu Val Met Ser Glu Thr Ile His
165 170 175
cag acg cag cag ctg tgc aaa ctg tgg gtc aag gga gca gct cct gaa 576
Gln Thr Gln Gln Leu Cys Lys Leu Trp Val Lys Gly Ala Ala Pro Glu
180 185 190
cta caa gcc ggt gtg aac tct ctt act ctg gcg gtc atc tcc ttg gct 624
Leu Gln Ala Gly Val Asn Ser Leu Thr Leu Ala Val Ile Ser Leu Ala
195 200 205
gga ttt ggg cag cga ttg gat gtg ggt ggc aag agc aaa aaa ggg ata 672
Gly Phe Gly Gln Arg Leu Asp Val Gly Gly Lys Ser Lys Lys Gly Ile
210 215 220
aag gtt cct cag gaa gcc aag atg agc ttt ctc cac gcc att agt gat 720
Lys Val Pro Gln Glu Ala Lys Met Ser Phe Leu His Ala Ile Ser Asp
225 230 235 240
acc aca aaa tac atg gtt tcc att ctg ctt cta cct ggc tgg ctg ctg 768
Thr Thr Lys Tyr Met Val Ser Ile Leu Leu Leu Pro Gly Trp Leu Leu
245 250 255
aag ttg acc ccg tta cgc aag gcc cac ttt gca cat caa gca ttg gac 816
Lys Leu Thr Pro Leu Arg Lys Ala His Phe Ala His Gln Ala Leu Asp
260 265 270
tat tac ttg cgg caa ttg att cga gac aag agg aaa cag ctg gtg caa 864
Tyr Tyr Leu Arg Gln Leu Ile Arg Asp Lys Arg Lys Gln Leu Val Gln
275 280 285
gat ata aat cat cag gat ggg act agc aac cgc gga aac ctg ctc act 912
Asp Ile Asn His Gln Asp Gly Thr Ser Asn Arg Gly Asn Leu Leu Thr
290 295 300
gcc gtc ctg cga gca tct cta acc gac ggc gat ttg gcc aaa gcg gga 960
Ala Val Leu Arg Ala Ser Leu Thr Asp Gly Asp Leu Ala Lys Ala Gly
305 310 315 320
ggg gct cgc aag gac gcg ttt act gaa gag gag act atg ggg aat ctg 1008
Gly Ala Arg Lys Asp Ala Phe Thr Glu Glu Glu Thr Met Gly Asn Leu
325 330 335
ttc att tat ctc ctg gca ggc tac gag acc acc gcg aac gct att atg 1056
Phe Ile Tyr Leu Leu Ala Gly Tyr Glu Thr Thr Ala Asn Ala Ile Met
340 345 350
tat ggt ctt ttc ttg ctc gcc cta cac cct gaa atc cag gaa aag gtc 1104
Tyr Gly Leu Phe Leu Leu Ala Leu His Pro Glu Ile Gln Glu Lys Val
355 360 365
att tgc gaa gtg gac cga gtc tgg gct gaa gca aat gca tcc gga cgc 1152
Ile Cys Glu Val Asp Arg Val Trp Ala Glu Ala Asn Ala Ser Gly Arg
370 375 380
gaa tcc ctt tca tat caa cat gat ttc gac aaa ttt tac gaa tct ttc 1200
Glu Ser Leu Ser Tyr Gln His Asp Phe Asp Lys Phe Tyr Glu Ser Phe
385 390 395 400
cgt ttg ttc cca gga gtg aca ttg atc acg aag ata gcc aat ggg gac 1248
Arg Leu Phe Pro Gly Val Thr Leu Ile Thr Lys Ile Ala Asn Gly Asp
405 410 415
cag cca gtt cat gtc agt aac tcg tcg ggc gtg aca aca aca cat atc 1296
Gln Pro Val His Val Ser Asn Ser Ser Gly Val Thr Thr Thr His Ile
420 425 430
ctg tcc tcg ggc ata cgt gta tac ttg tct gcg cct ggc gtc cat tac 1344
Leu Ser Ser Gly Ile Arg Val Tyr Leu Ser Ala Pro Gly Val His Tyr
435 440 445
cac ccc cga tac tgg cct gaa cca aat aag atc aat cct cag cgc tgg 1392
His Pro Arg Tyr Trp Pro Glu Pro Asn Lys Ile Asn Pro Gln Arg Trp
450 455 460
atg cag aac ttc tcc aac gag tcg agt gga aaa cga gtt gtt gca gcg 1440
Met Gln Asn Phe Ser Asn Glu Ser Ser Gly Lys Arg Val Val Ala Ala
465 470 475 480
gac cga tcc cgt cag atg aaa ggg act ctc tta acc ttt tct gat ggt 1488
Asp Arg Ser Arg Gln Met Lys Gly Thr Leu Leu Thr Phe Ser Asp Gly
485 490 495
gcg cgg gca tgt tta gga cgg agg ttt gcc caa gcg gaa tac att gca 1536
Ala Arg Ala Cys Leu Gly Arg Arg Phe Ala Gln Ala Glu Tyr Ile Ala
500 505 510
ttc ttt gcg gcg ttt ctg aaa ggt cac cgt gtg aag atc cgt cct gat 1584
Phe Phe Ala Ala Phe Leu Lys Gly His Arg Val Lys Ile Arg Pro Asp
515 520 525
cac gat cgg caa act gtt tgg aga gac att tat ctc aag agt gct ggg 1632
His Asp Arg Gln Thr Val Trp Arg Asp Ile Tyr Leu Lys Ser Ala Gly
530 535 540
cag atc aca ttg gct ccg tta gat aca aca ggc ctt gta att gaa cga 1680
Gln Ile Thr Leu Ala Pro Leu Asp Thr Thr Gly Leu Val Ile Glu Arg
545 550 555 560
cga 1683
Arg
<210> 25
<211> 561
<212> PRT
<213> Penicillium citrinum
<400> 25
Met Ala Phe Gly Pro Tyr Val Ala Tyr Gly Ala Leu Ala Leu Ala Ala
1 5 10 15
Tyr Lys Ile Ala Lys Leu Phe Phe Phe Val Phe Gln Ala Arg Lys Thr
20 25 30
Gly Leu Pro His Val Leu Thr Pro Phe Leu Glu Thr Glu Val Ile Ala
35 40 45
Phe Leu Leu Thr Pro Ile Leu Arg Thr Val Tyr His Ala His Leu Asp
50 55 60
Lys Glu Thr Gly Trp Pro Arg Trp Cys Arg Phe Ile Val Lys Asp Trp
65 70 75 80
Ser Trp Glu Asp Lys Arg Arg Ala His Glu Glu Tyr Gly Asp Val Phe
85 90 95
Leu Val Val Ser Pro Glu Gly Ile Ile Cys Tyr Ser Ala Asp Ala Ala
100 105 110
Met Gly Trp Asp Val Met Asn Arg Arg Lys Asp Phe Thr Lys Pro Arg
115 120 125
Asp Lys Tyr Lys Ile Leu Glu Pro Tyr Gly Pro Asn Val Ala Thr Ala
130 135 140
Glu Gly Gly Thr Tyr Arg Phe His Val Arg Val Thr Ala Ser Ser Phe
145 150 155 160
Asn Asp Gln Ser Gly Val Asn Asp Leu Val Met Ser Glu Thr Ile His
165 170 175
Gln Thr Gln Gln Leu Cys Lys Leu Trp Val Lys Gly Ala Ala Pro Glu
180 185 190
Leu Gln Ala Gly Val Asn Ser Leu Thr Leu Ala Val Ile Ser Leu Ala
195 200 205
Gly Phe Gly Gln Arg Leu Asp Val Gly Gly Lys Ser Lys Lys Gly Ile
210 215 220
Lys Val Pro Gln Glu Ala Lys Met Ser Phe Leu His Ala Ile Ser Asp
225 230 235 240
Thr Thr Lys Tyr Met Val Ser Ile Leu Leu Leu Pro Gly Trp Leu Leu
245 250 255
Lys Leu Thr Pro Leu Arg Lys Ala His Phe Ala His Gln Ala Leu Asp
260 265 270
Tyr Tyr Leu Arg Gln Leu Ile Arg Asp Lys Arg Lys Gln Leu Val Gln
275 280 285
Asp Ile Asn His Gln Asp Gly Thr Ser Asn Arg Gly Asn Leu Leu Thr
290 295 300
Ala Val Leu Arg Ala Ser Leu Thr Asp Gly Asp Leu Ala Lys Ala Gly
305 310 315 320
Gly Ala Arg Lys Asp Ala Phe Thr Glu Glu Glu Thr Met Gly Asn Leu
325 330 335
Phe Ile Tyr Leu Leu Ala Gly Tyr Glu Thr Thr Ala Asn Ala Ile Met
340 345 350
Tyr Gly Leu Phe Leu Leu Ala Leu His Pro Glu Ile Gln Glu Lys Val
355 360 365
Ile Cys Glu Val Asp Arg Val Trp Ala Glu Ala Asn Ala Ser Gly Arg
370 375 380
Glu Ser Leu Ser Tyr Gln His Asp Phe Asp Lys Phe Tyr Glu Ser Phe
385 390 395 400
Arg Leu Phe Pro Gly Val Thr Leu Ile Thr Lys Ile Ala Asn Gly Asp
405 410 415
Gln Pro Val His Val Ser Asn Ser Ser Gly Val Thr Thr Thr His Ile
420 425 430
Leu Ser Ser Gly Ile Arg Val Tyr Leu Ser Ala Pro Gly Val His Tyr
435 440 445
His Pro Arg Tyr Trp Pro Glu Pro Asn Lys Ile Asn Pro Gln Arg Trp
450 455 460
Met Gln Asn Phe Ser Asn Glu Ser Ser Gly Lys Arg Val Val Ala Ala
465 470 475 480
Asp Arg Ser Arg Gln Met Lys Gly Thr Leu Leu Thr Phe Ser Asp Gly
485 490 495
Ala Arg Ala Cys Leu Gly Arg Arg Phe Ala Gln Ala Glu Tyr Ile Ala
500 505 510
Phe Phe Ala Ala Phe Leu Lys Gly His Arg Val Lys Ile Arg Pro Asp
515 520 525
His Asp Arg Gln Thr Val Trp Arg Asp Ile Tyr Leu Lys Ser Ala Gly
530 535 540
Gln Ile Thr Leu Ala Pro Leu Asp Thr Thr Gly Leu Val Ile Glu Arg
545 550 555 560
Arg
<210> 26
<211> 1473
<212> DNA
<213> Penicillium citrinum
<220>
<221> CDS
<222> (1)..(1473)
<400> 26
atg gag ggt ttc ggg tct ttc tta ggc att gca atg cca ttg ctt gtt 48
Met Glu Gly Phe Gly Ser Phe Leu Gly Ile Ala Met Pro Leu Leu Val
1 5 10 15
gcc ttc att ctc aag ttg ggg att tgg aga gtg tac ttt gat caa ttg 96
Ala Phe Ile Leu Lys Leu Gly Ile Trp Arg Val Tyr Phe Asp Gln Leu
20 25 30
tca aag ttc cca ggt ccc gga ctg tca gcc ctg acc aac gta ccg tac 144
Ser Lys Phe Pro Gly Pro Gly Leu Ser Ala Leu Thr Asn Val Pro Tyr
35 40 45
tcg atg agc tac ctc agt ggt cga cag cca tgg gaa atg ctc agc ctg 192
Ser Met Ser Tyr Leu Ser Gly Arg Gln Pro Trp Glu Met Leu Ser Leu
50 55 60
cac aaa aaa tat ggt tct gtg gtc cgc gtt tcc ccc acc gag cta tca 240
His Lys Lys Tyr Gly Ser Val Val Arg Val Ser Pro Thr Glu Leu Ser
65 70 75 80
ttc agc aca gct cag tct tgg agg gac atc tac ggg act cag cga ggc 288
Phe Ser Thr Ala Gln Ser Trp Arg Asp Ile Tyr Gly Thr Gln Arg Gly
85 90 95
cgt gca gga ttc atc aaa agt tcc ttc tat gat gga ggg aat ttt gct 336
Arg Ala Gly Phe Ile Lys Ser Ser Phe Tyr Asp Gly Gly Asn Phe Ala
100 105 110
gat aaa gca cac tcc ata gtg agt gaa cgg gac cca gag aaa cac agt 384
Asp Lys Ala His Ser Ile Val Ser Glu Arg Asp Pro Glu Lys His Ser
115 120 125
gcg atg cgt cgg ttt tta tcc act gca ttt tcg gac cga tct ctg cgc 432
Ala Met Arg Arg Phe Leu Ser Thr Ala Phe Ser Asp Arg Ser Leu Arg
130 135 140
gag caa gag gga cta atc acc agt acc att gat aaa ttt gtc caa aag 480
Glu Gln Glu Gly Leu Ile Thr Ser Thr Ile Asp Lys Phe Val Gln Lys
145 150 155 160
gtg ggg gaa gtt ggt tct cat ccg cag gga gtg gac ttg aca aac tgg 528
Val Gly Glu Val Gly Ser His Pro Gln Gly Val Asp Leu Thr Asn Trp
165 170 175
ttt aat ctt ctc act ttt gat att att ggc gat ctg gca ttt ggg gag 576
Phe Asn Leu Leu Thr Phe Asp Ile Ile Gly Asp Leu Ala Phe Gly Glu
180 185 190
tct ttt ggg ggc tcg ttg tat ata ggc aag aca cat cca tgg atc tca 624
Ser Phe Gly Gly Ser Leu Tyr Ile Gly Lys Thr His Pro Trp Ile Ser
195 200 205
gtt gtg tta gag agt atg ggc cag gct agt ctt tcc gat act atc caa 672
Val Val Leu Glu Ser Met Gly Gln Ala Ser Leu Ser Asp Thr Ile Gln
210 215 220
aga ttt cca tgg atg ggc aga ctt tac atg cga ctg aac cca gaa tgg 720
Arg Phe Pro Trp Met Gly Arg Leu Tyr Met Arg Leu Asn Pro Glu Trp
225 230 235 240
gca cgt cgc ttg att gcg ggc tct atc aag cat gag tct aac act atg 768
Ala Arg Arg Leu Ile Ala Gly Ser Ile Lys His Glu Ser Asn Thr Met
245 250 255
gat ctt gtc aaa agg aga atc gcc agc aaa agc cca aga tcg gat ttc 816
Asp Leu Val Lys Arg Arg Ile Ala Ser Lys Ser Pro Arg Ser Asp Phe
260 265 270
atg agt tac ttg cta cgc gaa agg agt gaa ttt gac caa gag gta tcc 864
Met Ser Tyr Leu Leu Arg Glu Arg Ser Glu Phe Asp Gln Glu Val Ser
275 280 285
gat acg caa ctc gca gcg cat gcc tcc gat ttt gtc att gcg ggg agt 912
Asp Thr Gln Leu Ala Ala His Ala Ser Asp Phe Val Ile Ala Gly Ser
290 295 300
gag aca aca gcg act act cta ctg gtc gtc gca tac tat ctt tcc cgt 960
Glu Thr Thr Ala Thr Thr Leu Leu Val Val Ala Tyr Tyr Leu Ser Arg
305 310 315 320
tac ccg gag att acc agg aag ctc cag aag gag gtg cga agt gcc ttc 1008
Tyr Pro Glu Ile Thr Arg Lys Leu Gln Lys Glu Val Arg Ser Ala Phe
325 330 335
gac agc tac gaa gag atc aac ggc tca tcc act gcg aga ctc cgg tac 1056
Asp Ser Tyr Glu Glu Ile Asn Gly Ser Ser Thr Ala Arg Leu Arg Tyr
340 345 350
ctg cat gtt atc tgc cta gag gca atg agg atg gta ccg cct ctt cca 1104
Leu His Val Ile Cys Leu Glu Ala Met Arg Met Val Pro Pro Leu Pro
355 360 365
cta ggc ctt ccc agg gtt gtc ccc aaa gga gga gcc atg gtg gac gga 1152
Leu Gly Leu Pro Arg Val Val Pro Lys Gly Gly Ala Met Val Asp Gly
370 375 380
cat ttt gtg atc gtg tcc aca aat ccc ctt gcg gca agc ctt gat ccg 1200
His Phe Val Ile Val Ser Thr Asn Pro Leu Ala Ala Ser Leu Asp Pro
385 390 395 400
aag aat ttt gag aat cct tgg aca ttt gat ccc gat cga tgg ctg cag 1248
Lys Asn Phe Glu Asn Pro Trp Thr Phe Asp Pro Asp Arg Trp Leu Gln
405 410 415
gat gga aaa gag caa ttt ggc gag gct agc cag cct ttc tcg cta gga 1296
Asp Gly Lys Glu Gln Phe Gly Glu Ala Ser Gln Pro Phe Ser Leu Gly
420 425 430
tcg cga tca tgt ctg gga aga agc ctt gct tgg ttg gaa atg cga gtg 1344
Ser Arg Ser Cys Leu Gly Arg Ser Leu Ala Trp Leu Glu Met Arg Val
435 440 445
acc ctt gcc aag ttg cat ttt agt tac gat ttt aca ccc gtc aac gaa 1392
Thr Leu Ala Lys Leu His Phe Ser Tyr Asp Phe Thr Pro Val Asn Glu
450 455 460
aat ata gac ctg caa cag gat ctc cgc atg cac cta tta tgg aag aag 1440
Asn Ile Asp Leu Gln Gln Asp Leu Arg Met His Leu Leu Trp Lys Lys
465 470 475 480
cca gag ttg cgg ttc cga gtt tcc cct cgg aaa 1473
Pro Glu Leu Arg Phe Arg Val Ser Pro Arg Lys
485 490
<210> 27
<211> 491
<212> PRT
<213> Penicillium citrinum
<400> 27
Met Glu Gly Phe Gly Ser Phe Leu Gly Ile Ala Met Pro Leu Leu Val
1 5 10 15
Ala Phe Ile Leu Lys Leu Gly Ile Trp Arg Val Tyr Phe Asp Gln Leu
20 25 30
Ser Lys Phe Pro Gly Pro Gly Leu Ser Ala Leu Thr Asn Val Pro Tyr
35 40 45
Ser Met Ser Tyr Leu Ser Gly Arg Gln Pro Trp Glu Met Leu Ser Leu
50 55 60
His Lys Lys Tyr Gly Ser Val Val Arg Val Ser Pro Thr Glu Leu Ser
65 70 75 80
Phe Ser Thr Ala Gln Ser Trp Arg Asp Ile Tyr Gly Thr Gln Arg Gly
85 90 95
Arg Ala Gly Phe Ile Lys Ser Ser Phe Tyr Asp Gly Gly Asn Phe Ala
100 105 110
Asp Lys Ala His Ser Ile Val Ser Glu Arg Asp Pro Glu Lys His Ser
115 120 125
Ala Met Arg Arg Phe Leu Ser Thr Ala Phe Ser Asp Arg Ser Leu Arg
130 135 140
Glu Gln Glu Gly Leu Ile Thr Ser Thr Ile Asp Lys Phe Val Gln Lys
145 150 155 160
Val Gly Glu Val Gly Ser His Pro Gln Gly Val Asp Leu Thr Asn Trp
165 170 175
Phe Asn Leu Leu Thr Phe Asp Ile Ile Gly Asp Leu Ala Phe Gly Glu
180 185 190
Ser Phe Gly Gly Ser Leu Tyr Ile Gly Lys Thr His Pro Trp Ile Ser
195 200 205
Val Val Leu Glu Ser Met Gly Gln Ala Ser Leu Ser Asp Thr Ile Gln
210 215 220
Arg Phe Pro Trp Met Gly Arg Leu Tyr Met Arg Leu Asn Pro Glu Trp
225 230 235 240
Ala Arg Arg Leu Ile Ala Gly Ser Ile Lys His Glu Ser Asn Thr Met
245 250 255
Asp Leu Val Lys Arg Arg Ile Ala Ser Lys Ser Pro Arg Ser Asp Phe
260 265 270
Met Ser Tyr Leu Leu Arg Glu Arg Ser Glu Phe Asp Gln Glu Val Ser
275 280 285
Asp Thr Gln Leu Ala Ala His Ala Ser Asp Phe Val Ile Ala Gly Ser
290 295 300
Glu Thr Thr Ala Thr Thr Leu Leu Val Val Ala Tyr Tyr Leu Ser Arg
305 310 315 320
Tyr Pro Glu Ile Thr Arg Lys Leu Gln Lys Glu Val Arg Ser Ala Phe
325 330 335
Asp Ser Tyr Glu Glu Ile Asn Gly Ser Ser Thr Ala Arg Leu Arg Tyr
340 345 350
Leu His Val Ile Cys Leu Glu Ala Met Arg Met Val Pro Pro Leu Pro
355 360 365
Leu Gly Leu Pro Arg Val Val Pro Lys Gly Gly Ala Met Val Asp Gly
370 375 380
His Phe Val Ile Val Ser Thr Asn Pro Leu Ala Ala Ser Leu Asp Pro
385 390 395 400
Lys Asn Phe Glu Asn Pro Trp Thr Phe Asp Pro Asp Arg Trp Leu Gln
405 410 415
Asp Gly Lys Glu Gln Phe Gly Glu Ala Ser Gln Pro Phe Ser Leu Gly
420 425 430
Ser Arg Ser Cys Leu Gly Arg Ser Leu Ala Trp Leu Glu Met Arg Val
435 440 445
Thr Leu Ala Lys Leu His Phe Ser Tyr Asp Phe Thr Pro Val Asn Glu
450 455 460
Asn Ile Asp Leu Gln Gln Asp Leu Arg Met His Leu Leu Trp Lys Lys
465 470 475 480
Pro Glu Leu Arg Phe Arg Val Ser Pro Arg Lys
485 490
<210> 28
<211> 921
<212> DNA
<213> Penicillium citrinum
<220>
<221> CDS
<222> (1)..(921)
<400> 28
atg gca tct ctt aaa atc act gag gac gac atc ccc gat ctg act gga 48
Met Ala Ser Leu Lys Ile Thr Glu Asp Asp Ile Pro Asp Leu Thr Gly
1 5 10 15
aag gtg gct atc atc act ggc ggc tgc tcc ggg atc ggt ttg gta gcc 96
Lys Val Ala Ile Ile Thr Gly Gly Cys Ser Gly Ile Gly Leu Val Ala
20 25 30
gca cag ata ctc gcc agc aag ggg gcg act gtg cat aca ttg gat ctc 144
Ala Gln Ile Leu Ala Ser Lys Gly Ala Thr Val His Thr Leu Asp Leu
35 40 45
aat tcg att gag gaa gat gag gct tct tcc aac aaa gaa tct caa ttc 192
Asn Ser Ile Glu Glu Asp Glu Ala Ser Ser Asn Lys Glu Ser Gln Phe
50 55 60
cga gat aag atc cac tac cga cat tgc aat gtc gcc gat tgg cct agt 240
Arg Asp Lys Ile His Tyr Arg His Cys Asn Val Ala Asp Trp Pro Ser
65 70 75 80
ctg cgc caa gct ttc cag gaa atc gga cac gtc gac atc gcc gtc gcc 288
Leu Arg Gln Ala Phe Gln Glu Ile Gly His Val Asp Ile Ala Val Ala
85 90 95
aat gcg ggc gta tcc cag gaa tgc gac tac ttc gtt gac act tac gac 336
Asn Ala Gly Val Ser Gln Glu Cys Asp Tyr Phe Val Asp Thr Tyr Asp
100 105 110
gag cac ggt gaa cta gaa gag cct aaa tac aga att atc gat gtc aac 384
Glu His Gly Glu Leu Glu Glu Pro Lys Tyr Arg Ile Ile Asp Val Asn
115 120 125
tac cga gct gta ttg aat ttc atc aag ctg gga cta cgt gcc ttt cgg 432
Tyr Arg Ala Val Leu Asn Phe Ile Lys Leu Gly Leu Arg Ala Phe Arg
130 135 140
caa cag ggc cct gga ggg agt ctg gtc atc acc agc agt gcg acg gcc 480
Gln Gln Gly Pro Gly Gly Ser Leu Val Ile Thr Ser Ser Ala Thr Ala
145 150 155 160
tat tcg cca gag caa agt ctc cct gta tat agc tca acc aaa ctg gga 528
Tyr Ser Pro Glu Gln Ser Leu Pro Val Tyr Ser Ser Thr Lys Leu Gly
165 170 175
ctg att ggc ctt gta cga gct ctt cgt tct acc gtg ccg gct ctc gga 576
Leu Ile Gly Leu Val Arg Ala Leu Arg Ser Thr Val Pro Ala Leu Gly
180 185 190
gca aca atc aac gcg gtg gca cct gca gct act atc aca aaa ctt ctc 624
Ala Thr Ile Asn Ala Val Ala Pro Ala Ala Thr Ile Thr Lys Leu Leu
195 200 205
ccg aaa gac ctt gcc aaa cct ata atc gct gcg gga gca cct gtc agt 672
Pro Lys Asp Leu Ala Lys Pro Ile Ile Ala Ala Gly Ala Pro Val Ser
210 215 220
agt gct cat cat gtt ggg ttg gcg ata gcc ttt tcg gcg gta gct tcg 720
Ser Ala His His Val Gly Leu Ala Ile Ala Phe Ser Ala Val Ala Ser
225 230 235 240
cag ccg cac cag gtc gaa gga tat ggc aag gac acg aca gag gtc att 768
Gln Pro His Gln Val Glu Gly Tyr Gly Lys Asp Thr Thr Glu Val Ile
245 250 255
caa tgt cag ggt cgc tgg aat ggc cgg gta att ctt act ctg ggt gac 816
Gln Cys Gln Gly Arg Trp Asn Gly Arg Val Ile Leu Thr Leu Gly Asp
260 265 270
aaa tgg acg gag ctt gaa gag cca att gcc gac ctg cgg cag cag tgg 864
Lys Trp Thr Glu Leu Glu Glu Pro Ile Ala Asp Leu Arg Gln Gln Trp
275 280 285
ttt ggg aaa tgg aat acg gat atg aca acg ttt cag caa cgg ctt acg 912
Phe Gly Lys Trp Asn Thr Asp Met Thr Thr Phe Gln Gln Arg Leu Thr
290 295 300
gat atg cgt 921
Asp Met Arg
305
<210> 29
<211> 307
<212> PRT
<213> Penicillium citrinum
<400> 29
Met Ala Ser Leu Lys Ile Thr Glu Asp Asp Ile Pro Asp Leu Thr Gly
1 5 10 15
Lys Val Ala Ile Ile Thr Gly Gly Cys Ser Gly Ile Gly Leu Val Ala
20 25 30
Ala Gln Ile Leu Ala Ser Lys Gly Ala Thr Val His Thr Leu Asp Leu
35 40 45
Asn Ser Ile Glu Glu Asp Glu Ala Ser Ser Asn Lys Glu Ser Gln Phe
50 55 60
Arg Asp Lys Ile His Tyr Arg His Cys Asn Val Ala Asp Trp Pro Ser
65 70 75 80
Leu Arg Gln Ala Phe Gln Glu Ile Gly His Val Asp Ile Ala Val Ala
85 90 95
Asn Ala Gly Val Ser Gln Glu Cys Asp Tyr Phe Val Asp Thr Tyr Asp
100 105 110
Glu His Gly Glu Leu Glu Glu Pro Lys Tyr Arg Ile Ile Asp Val Asn
115 120 125
Tyr Arg Ala Val Leu Asn Phe Ile Lys Leu Gly Leu Arg Ala Phe Arg
130 135 140
Gln Gln Gly Pro Gly Gly Ser Leu Val Ile Thr Ser Ser Ala Thr Ala
145 150 155 160
Tyr Ser Pro Glu Gln Ser Leu Pro Val Tyr Ser Ser Thr Lys Leu Gly
165 170 175
Leu Ile Gly Leu Val Arg Ala Leu Arg Ser Thr Val Pro Ala Leu Gly
180 185 190
Ala Thr Ile Asn Ala Val Ala Pro Ala Ala Thr Ile Thr Lys Leu Leu
195 200 205
Pro Lys Asp Leu Ala Lys Pro Ile Ile Ala Ala Gly Ala Pro Val Ser
210 215 220
Ser Ala His His Val Gly Leu Ala Ile Ala Phe Ser Ala Val Ala Ser
225 230 235 240
Gln Pro His Gln Val Glu Gly Tyr Gly Lys Asp Thr Thr Glu Val Ile
245 250 255
Gln Cys Gln Gly Arg Trp Asn Gly Arg Val Ile Leu Thr Leu Gly Asp
260 265 270
Lys Trp Thr Glu Leu Glu Glu Pro Ile Ala Asp Leu Arg Gln Gln Trp
275 280 285
Phe Gly Lys Trp Asn Thr Asp Met Thr Thr Phe Gln Gln Arg Leu Thr
290 295 300
Asp Met Arg
305
<210> 30
<211> 1038
<212> DNA
<213> Penicillium citrinum
<220>
<221> CDS
<222> (1)..(1038)
<400> 30
atg ctt tcg ctt acc gtc caa gac tcc cat gtg gca ctc aat ttg cca 48
Met Leu Ser Leu Thr Val Gln Asp Ser His Val Ala Leu Asn Leu Pro
1 5 10 15
aca act caa gag tca tct tca tgc cca aca cct ttt ctt caa ctg tcc 96
Thr Thr Gln Glu Ser Ser Ser Cys Pro Thr Pro Phe Leu Gln Leu Ser
20 25 30
aat agg tcc acc gtg aag gca agg cca tgg caa ccg gct ccc tcc cac 144
Asn Arg Ser Thr Val Lys Ala Arg Pro Trp Gln Pro Ala Pro Ser His
35 40 45
tgg gta tcc gag tgc caa ccg cga atg aac act gtt tct cgt gag gtg 192
Trp Val Ser Glu Cys Gln Pro Arg Met Asn Thr Val Ser Arg Glu Val
50 55 60
gat gag tac ttc ttg cac cac tgg cct ttt ccc gac gag cga gca aga 240
Asp Glu Tyr Phe Leu His His Trp Pro Phe Pro Asp Glu Arg Ala Arg
65 70 75 80
aag aag ttc atc gaa gct ggt ttt tcg aga gtg aca tgc ctt tac ttc 288
Lys Lys Phe Ile Glu Ala Gly Phe Ser Arg Val Thr Cys Leu Tyr Phe
85 90 95
cct ttg gcc agt gac gat cgt atc aag ttc gca tgt ctt ctg cta aca 336
Pro Leu Ala Ser Asp Asp Arg Ile Lys Phe Ala Cys Leu Leu Leu Thr
100 105 110
gtg ctc ttc ctt atc gac gat ttg ttg gag gaa atg tct ttc gcg gat 384
Val Leu Phe Leu Ile Asp Asp Leu Leu Glu Glu Met Ser Phe Ala Asp
115 120 125
ggc aag gca tac aat gaa aat tta atg ccc att tgt cgc ggc gat gtt 432
Gly Lys Ala Tyr Asn Glu Asn Leu Met Pro Ile Cys Arg Gly Asp Val
130 135 140
ctg cct gac cgc aac att cca gtt gaa tac att atg tat gat ctt tgg 480
Leu Pro Asp Arg Asn Ile Pro Val Glu Tyr Ile Met Tyr Asp Leu Trp
145 150 155 160
gaa caa atg cga gca cat gac aag aag ctg gcg gat gag att ctc gag 528
Glu Gln Met Arg Ala His Asp Lys Lys Leu Ala Asp Glu Ile Leu Glu
165 170 175
ccc aca ttc acg ttc atg cga gcc cag aca gac aac acc cgt ctc aaa 576
Pro Thr Phe Thr Phe Met Arg Ala Gln Thr Asp Asn Thr Arg Leu Lys
180 185 190
atc aac gag ctg ggt caa tat ctg gaa tat cga gag aag gac gtt gga 624
Ile Asn Glu Leu Gly Gln Tyr Leu Glu Tyr Arg Glu Lys Asp Val Gly
195 200 205
aaa gcg ctt ctt tct gcc ttg atg cgt ttt gtc atg ggt atc aac ctg 672
Lys Ala Leu Leu Ser Ala Leu Met Arg Phe Val Met Gly Ile Asn Leu
210 215 220
acc act gat gaa ctg caa atg cta tca ccc tta gag cag aac tgc gcc 720
Thr Thr Asp Glu Leu Gln Met Leu Ser Pro Leu Glu Gln Asn Cys Ala
225 230 235 240
aag cat atc tcc gtc gtg aac gat att ttc agc tgg gag aag gag ctc 768
Lys His Ile Ser Val Val Asn Asp Ile Phe Ser Trp Glu Lys Glu Leu
245 250 255
aag gca tca aag atg ggt cac cag gag ggc tct ttt ctc tgt tct gcg 816
Lys Ala Ser Lys Met Gly His Gln Glu Gly Ser Phe Leu Cys Ser Ala
260 265 270
gtt atg gtg gta gcg act gag acc aat ctc agt ttt gat gcc tcg aag 864
Val Met Val Val Ala Thr Glu Thr Asn Leu Ser Phe Asp Ala Ser Lys
275 280 285
cgc att ctt tgg cca att gtc cgt gag tgg gag ctt gtc cat gat gac 912
Arg Ile Leu Trp Pro Ile Val Arg Glu Trp Glu Leu Val His Asp Asp
290 295 300
atg tgt gca cag ttg ctc tcc gct ggc tgc agc gag gct aca aaa gca 960
Met Cys Ala Gln Leu Leu Ser Ala Gly Cys Ser Glu Ala Thr Lys Ala
305 310 315 320
tat atg aaa gga ctg gaa tat caa atg agt ggc aat gag ctg tgg agt 1008
Tyr Met Lys Gly Leu Glu Tyr Gln Met Ser Gly Asn Glu Leu Trp Ser
325 330 335
cac acg acg ctc cga tac acc aaa gtg gat 1038
His Thr Thr Leu Arg Tyr Thr Lys Val Asp
340 345
<210> 31
<211> 346
<212> PRT
<213> Penicillium citrinum
<400> 31
Met Leu Ser Leu Thr Val Gln Asp Ser His Val Ala Leu Asn Leu Pro
1 5 10 15
Thr Thr Gln Glu Ser Ser Ser Cys Pro Thr Pro Phe Leu Gln Leu Ser
20 25 30
Asn Arg Ser Thr Val Lys Ala Arg Pro Trp Gln Pro Ala Pro Ser His
35 40 45
Trp Val Ser Glu Cys Gln Pro Arg Met Asn Thr Val Ser Arg Glu Val
50 55 60
Asp Glu Tyr Phe Leu His His Trp Pro Phe Pro Asp Glu Arg Ala Arg
65 70 75 80
Lys Lys Phe Ile Glu Ala Gly Phe Ser Arg Val Thr Cys Leu Tyr Phe
85 90 95
Pro Leu Ala Ser Asp Asp Arg Ile Lys Phe Ala Cys Leu Leu Leu Thr
100 105 110
Val Leu Phe Leu Ile Asp Asp Leu Leu Glu Glu Met Ser Phe Ala Asp
115 120 125
Gly Lys Ala Tyr Asn Glu Asn Leu Met Pro Ile Cys Arg Gly Asp Val
130 135 140
Leu Pro Asp Arg Asn Ile Pro Val Glu Tyr Ile Met Tyr Asp Leu Trp
145 150 155 160
Glu Gln Met Arg Ala His Asp Lys Lys Leu Ala Asp Glu Ile Leu Glu
165 170 175
Pro Thr Phe Thr Phe Met Arg Ala Gln Thr Asp Asn Thr Arg Leu Lys
180 185 190
Ile Asn Glu Leu Gly Gln Tyr Leu Glu Tyr Arg Glu Lys Asp Val Gly
195 200 205
Lys Ala Leu Leu Ser Ala Leu Met Arg Phe Val Met Gly Ile Asn Leu
210 215 220
Thr Thr Asp Glu Leu Gln Met Leu Ser Pro Leu Glu Gln Asn Cys Ala
225 230 235 240
Lys His Ile Ser Val Val Asn Asp Ile Phe Ser Trp Glu Lys Glu Leu
245 250 255
Lys Ala Ser Lys Met Gly His Gln Glu Gly Ser Phe Leu Cys Ser Ala
260 265 270
Val Met Val Val Ala Thr Glu Thr Asn Leu Ser Phe Asp Ala Ser Lys
275 280 285
Arg Ile Leu Trp Pro Ile Val Arg Glu Trp Glu Leu Val His Asp Asp
290 295 300
Met Cys Ala Gln Leu Leu Ser Ala Gly Cys Ser Glu Ala Thr Lys Ala
305 310 315 320
Tyr Met Lys Gly Leu Glu Tyr Gln Met Ser Gly Asn Glu Leu Trp Ser
325 330 335
His Thr Thr Leu Arg Tyr Thr Lys Val Asp
340 345
<210> 32
<211> 1206
<212> DNA
<213> Penicillium citrinum
<220>
<221> CDS
<222> (1)..(1206)
<400> 32
atg gtt atc gaa cgg ctg tcc ggc tcg aag gga cgg gcg gcg tct gcc 48
Met Val Ile Glu Arg Leu Ser Gly Ser Lys Gly Arg Ala Ala Ser Ala
1 5 10 15
ctc aga gaa gat gtt acc gga ccc aat tcc gcc aat gga tac atg aac 96
Leu Arg Glu Asp Val Thr Gly Pro Asn Ser Ala Asn Gly Tyr Met Asn
20 25 30
gca gtg ctc aag cag att cat cac act ctg gca cct gga cca ctc cta 144
Ala Val Leu Lys Gln Ile His His Thr Leu Ala Pro Gly Pro Leu Leu
35 40 45
gaa aag gtc act gat gcg gta atc acc gat ctc aat gat tct att ggg 192
Glu Lys Val Thr Asp Ala Val Ile Thr Asp Leu Asn Asp Ser Ile Gly
50 55 60
ggg ctt cag cac aaa gag acg acc att cat ctt ctt gaa tgg ttc cgc 240
Gly Leu Gln His Lys Glu Thr Thr Ile His Leu Leu Glu Trp Phe Arg
65 70 75 80
cac aat ttc agc atg tct tct acc aat gca att tac gga ccc aaa aat 288
His Asn Phe Ser Met Ser Ser Thr Asn Ala Ile Tyr Gly Pro Lys Asn
85 90 95
ccg ttc aag gat ccg aag gtt gaa aac ggc ttt tgg gag ttc gac tac 336
Pro Phe Lys Asp Pro Lys Val Glu Asn Gly Phe Trp Glu Phe Asp Tyr
100 105 110
gcg gtc agc aac cta ctt atc acc ccc aaa gcc agc tgg aca act cca 384
Ala Val Ser Asn Leu Leu Ile Thr Pro Lys Ala Ser Trp Thr Thr Pro
115 120 125
cag ggc gac aag ggg cgt tcg gat gca tgg aac ggt ttc atc gat tat 432
Gln Gly Asp Lys Gly Arg Ser Asp Ala Trp Asn Gly Phe Ile Asp Tyr
130 135 140
ttc cgg caa ggg ggt cac aac gag ggg tca gaa atg gcc aag caa cga 480
Phe Arg Gln Gly Gly His Asn Glu Gly Ser Glu Met Ala Lys Gln Arg
145 150 155 160
tac gaa gtt gca att gcc aag ggg att cca att gat gac atc ggc cga 528
Tyr Glu Val Ala Ile Ala Lys Gly Ile Pro Ile Asp Asp Ile Gly Arg
165 170 175
ttg gag gtc acg atg atc atc ggt gtc ttg act aat acc gtt cct gcg 576
Leu Glu Val Thr Met Ile Ile Gly Val Leu Thr Asn Thr Val Pro Ala
180 185 190
ggc ttc tgg atg act tat tac atc tgg tcg acg cca ggt ctc ctc gat 624
Gly Phe Trp Met Thr Tyr Tyr Ile Trp Ser Thr Pro Gly Leu Leu Asp
195 200 205
gag ctg cgc ggt gaa ctg gac aag atc att atc cgc gaa acc cag ccc 672
Glu Leu Arg Gly Glu Leu Asp Lys Ile Ile Ile Arg Glu Thr Gln Pro
210 215 220
gac ggt cga cca aag cta act ctc cga tcg gcc gat atc aag caa gac 720
Asp Gly Arg Pro Lys Leu Thr Leu Arg Ser Ala Asp Ile Lys Gln Asp
225 230 235 240
tgt ccc ctg ctg tac gcg acg atg cag gaa aca ctc cgc atg cgc act 768
Cys Pro Leu Leu Tyr Ala Thr Met Gln Glu Thr Leu Arg Met Arg Thr
245 250 255
tgt ggc atc tcc agt cgc atc gtg acc gag gac att gtc ttg aac gat 816
Cys Gly Ile Ser Ser Arg Ile Val Thr Glu Asp Ile Val Leu Asn Asp
260 265 270
cag tac ctg gtg aag aaa gac agt gtg atg gaa cta ccg aac aat atc 864
Gln Tyr Leu Val Lys Lys Asp Ser Val Met Glu Leu Pro Asn Asn Ile
275 280 285
atc cac tct gcc gaa gat ctt tgg ggc cca act gtg tgc cag ttc aac 912
Ile His Ser Ala Glu Asp Leu Trp Gly Pro Thr Val Cys Gln Phe Asn
290 295 300
aat aag cga ttc atc aaa ggt cat cca gat tac cgc gtg ccc aaa aac 960
Asn Lys Arg Phe Ile Lys Gly His Pro Asp Tyr Arg Val Pro Lys Asn
305 310 315 320
ggg ttc cga cct ttt ggc ggt ggt gtt tca cta tgc gca ggg cgg cat 1008
Gly Phe Arg Pro Phe Gly Gly Gly Val Ser Leu Cys Ala Gly Arg His
325 330 335
cag gct act agc cag ttg ctt tcg gct ttg gga ttt ttg gtg gct gca 1056
Gln Ala Thr Ser Gln Leu Leu Ser Ala Leu Gly Phe Leu Val Ala Ala
340 345 350
ttc gat atc tca cct acg aag ggg gca tgg gac ttt ccc ggt gcc cat 1104
Phe Asp Ile Ser Pro Thr Lys Gly Ala Trp Asp Phe Pro Gly Ala His
355 360 365
gga cat acc att gct gcc gca atg gac tcc ccc gat cat gat gtc cag 1152
Gly His Thr Ile Ala Ala Ala Met Asp Ser Pro Asp His Asp Val Gln
370 375 380
gtc aag ctg cag cca cgc caa gga tac gaa gat gct gtg tgg aca ttg 1200
Val Lys Leu Gln Pro Arg Gln Gly Tyr Glu Asp Ala Val Trp Thr Leu
385 390 395 400
aaa cca 1206
Lys Pro
<210> 33
<211> 402
<212> PRT
<213> Penicillium citrinum
<400> 33
Met Val Ile Glu Arg Leu Ser Gly Ser Lys Gly Arg Ala Ala Ser Ala
1 5 10 15
Leu Arg Glu Asp Val Thr Gly Pro Asn Ser Ala Asn Gly Tyr Met Asn
20 25 30
Ala Val Leu Lys Gln Ile His His Thr Leu Ala Pro Gly Pro Leu Leu
35 40 45
Glu Lys Val Thr Asp Ala Val Ile Thr Asp Leu Asn Asp Ser Ile Gly
50 55 60
Gly Leu Gln His Lys Glu Thr Thr Ile His Leu Leu Glu Trp Phe Arg
65 70 75 80
His Asn Phe Ser Met Ser Ser Thr Asn Ala Ile Tyr Gly Pro Lys Asn
85 90 95
Pro Phe Lys Asp Pro Lys Val Glu Asn Gly Phe Trp Glu Phe Asp Tyr
100 105 110
Ala Val Ser Asn Leu Leu Ile Thr Pro Lys Ala Ser Trp Thr Thr Pro
115 120 125
Gln Gly Asp Lys Gly Arg Ser Asp Ala Trp Asn Gly Phe Ile Asp Tyr
130 135 140
Phe Arg Gln Gly Gly His Asn Glu Gly Ser Glu Met Ala Lys Gln Arg
145 150 155 160
Tyr Glu Val Ala Ile Ala Lys Gly Ile Pro Ile Asp Asp Ile Gly Arg
165 170 175
Leu Glu Val Thr Met Ile Ile Gly Val Leu Thr Asn Thr Val Pro Ala
180 185 190
Gly Phe Trp Met Thr Tyr Tyr Ile Trp Ser Thr Pro Gly Leu Leu Asp
195 200 205
Glu Leu Arg Gly Glu Leu Asp Lys Ile Ile Ile Arg Glu Thr Gln Pro
210 215 220
Asp Gly Arg Pro Lys Leu Thr Leu Arg Ser Ala Asp Ile Lys Gln Asp
225 230 235 240
Cys Pro Leu Leu Tyr Ala Thr Met Gln Glu Thr Leu Arg Met Arg Thr
245 250 255
Cys Gly Ile Ser Ser Arg Ile Val Thr Glu Asp Ile Val Leu Asn Asp
260 265 270
Gln Tyr Leu Val Lys Lys Asp Ser Val Met Glu Leu Pro Asn Asn Ile
275 280 285
Ile His Ser Ala Glu Asp Leu Trp Gly Pro Thr Val Cys Gln Phe Asn
290 295 300
Asn Lys Arg Phe Ile Lys Gly His Pro Asp Tyr Arg Val Pro Lys Asn
305 310 315 320
Gly Phe Arg Pro Phe Gly Gly Gly Val Ser Leu Cys Ala Gly Arg His
325 330 335
Gln Ala Thr Ser Gln Leu Leu Ser Ala Leu Gly Phe Leu Val Ala Ala
340 345 350
Phe Asp Ile Ser Pro Thr Lys Gly Ala Trp Asp Phe Pro Gly Ala His
355 360 365
Gly His Thr Ile Ala Ala Ala Met Asp Ser Pro Asp His Asp Val Gln
370 375 380
Val Lys Leu Gln Pro Arg Gln Gly Tyr Glu Asp Ala Val Trp Thr Leu
385 390 395 400
Lys Pro
<210> 34
<211> 1641
<212> DNA
<213> Penicillium citrinum
<220>
<221> CDS
<222> (1)..(1641)
<400> 34
atg aga atg aac gac gca aag atc gtc acc aaa gag caa ata gag ccc 48
Met Arg Met Asn Asp Ala Lys Ile Val Thr Lys Glu Gln Ile Glu Pro
1 5 10 15
gtt gac cag aat gcg aac acc aac ggc ctt tat tcg caa tgg agg aag 96
Val Asp Gln Asn Ala Asn Thr Asn Gly Leu Tyr Ser Gln Trp Arg Lys
20 25 30
aag gtt ttg ggc cca tgg gcc tcg gtt tgt gtc gtc gta gcg ctt gtc 144
Lys Val Leu Gly Pro Trp Ala Ser Val Cys Val Val Val Ala Leu Val
35 40 45
ata gcc atg ctt ttg aat att gtt gcg acg gcg att ccc aaa ata aca 192
Ile Ala Met Leu Leu Asn Ile Val Ala Thr Ala Ile Pro Lys Ile Thr
50 55 60
gat gaa ttt cac agc ttg gat cag gtt gga tgg tat gga tct gcc ttt 240
Asp Glu Phe His Ser Leu Asp Gln Val Gly Trp Tyr Gly Ser Ala Phe
65 70 75 80
ttc gtt gga ctg gtg gcg ttc caa gcc gtc tgg ggt aaa atc tac cgg 288
Phe Val Gly Leu Val Ala Phe Gln Ala Val Trp Gly Lys Ile Tyr Arg
85 90 95
ttt ttt cct cta aag gct acg ttt atg gtt gcg atc gtg ctt ttt gag 336
Phe Phe Pro Leu Lys Ala Thr Phe Met Val Ala Ile Val Leu Phe Glu
100 105 110
gca ggt agc ttg ata tgc gcg gtc tcc cag aac agc atc acc tta atc 384
Ala Gly Ser Leu Ile Cys Ala Val Ser Gln Asn Ser Ile Thr Leu Ile
115 120 125
gct gga cgc gca att act ggg gca gga gga tct gga gta aca agc ggg 432
Ala Gly Arg Ala Ile Thr Gly Ala Gly Gly Ser Gly Val Thr Ser Gly
130 135 140
tgt tac atc att att gcc aat att gct gcc cca gag aaa cgt gct gca 480
Cys Tyr Ile Ile Ile Ala Asn Ile Ala Ala Pro Glu Lys Arg Ala Ala
145 150 155 160
tat acg ggc att tta ggc gcg acg tac ggg atc gcg agc att atg ggc 528
Tyr Thr Gly Ile Leu Gly Ala Thr Tyr Gly Ile Ala Ser Ile Met Gly
165 170 175
cct tta gta gga ggt gca ttc act gat caa ttg acg tgg cgt tgg tgt 576
Pro Leu Val Gly Gly Ala Phe Thr Asp Gln Leu Thr Trp Arg Trp Cys
180 185 190
ttc tgg atc aat ctc ccc atc gga ttt gcc gcg gta gtc ctt ttg ctt 624
Phe Trp Ile Asn Leu Pro Ile Gly Phe Ala Ala Val Val Leu Leu Leu
195 200 205
ttg act ttc tca acc ccg gcc tct gca aaa ccc atc aag tcc aca tgg 672
Leu Thr Phe Ser Thr Pro Ala Ser Ala Lys Pro Ile Lys Ser Thr Trp
210 215 220
atc gag ata cta cgc cat gtg gat ttg cta agt gtg gtt att att atc 720
Ile Glu Ile Leu Arg His Val Asp Leu Leu Ser Val Val Ile Ile Ile
225 230 235 240
gcc tca ttt gtg tgt tac ctc ctt gcc atg caa tgg ggt ggc gta tca 768
Ala Ser Phe Val Cys Tyr Leu Leu Ala Met Gln Trp Gly Gly Val Ser
245 250 255
aag tcc tgg gac tct gct gat gtg att ggg acc att gtt ggt tgg atc 816
Lys Ser Trp Asp Ser Ala Asp Val Ile Gly Thr Ile Val Gly Trp Ile
260 265 270
gtc ctc cta gta gtg ttt gcg gcg ctg caa tgg tct cag ggc gag tac 864
Val Leu Leu Val Val Phe Ala Ala Leu Gln Trp Ser Gln Gly Glu Tyr
275 280 285
gca tta atc gtc ccg cga ctc gtt caa aat aaa gtc att gca gtc tgt 912
Ala Leu Ile Val Pro Arg Leu Val Gln Asn Lys Val Ile Ala Val Cys
290 295 300
gcg gcc ttc aat gct ctt ctt gct gga gca tat ttc atc att gtg tac 960
Ala Ala Phe Asn Ala Leu Leu Ala Gly Ala Tyr Phe Ile Ile Val Tyr
305 310 315 320
tac atg ccg ata tat ttc caa aca att ggg tca tct tct gct ctc cgg 1008
Tyr Met Pro Ile Tyr Phe Gln Thr Ile Gly Ser Ser Ser Ala Leu Arg
325 330 335
agt gga ata cag act cta cct ctg atc ctg tct gca tcc gtt ttc tca 1056
Ser Gly Ile Gln Thr Leu Pro Leu Ile Leu Ser Ala Ser Val Phe Ser
340 345 350
ttg acc gga gga gtt gtc ctg gct gca ttt ggt aat ttc cag tac cac 1104
Leu Thr Gly Gly Val Val Leu Ala Ala Phe Gly Asn Phe Gln Tyr His
355 360 365
ttg atc atc ggc tct acc cta ttg aca att ggg tgt ggc ctg ctc tac 1152
Leu Ile Ile Gly Ser Thr Leu Leu Thr Ile Gly Cys Gly Leu Leu Tyr
370 375 380
acg cta cag ata aca ttg tcc act gga gca tac gtt ggg tat cag ctc 1200
Thr Leu Gln Ile Thr Leu Ser Thr Gly Ala Tyr Val Gly Tyr Gln Leu
385 390 395 400
ctt gct gga gtc gga gtc ggc atc gcc atg caa gtt cct gtc gtc gct 1248
Leu Ala Gly Val Gly Val Gly Ile Ala Met Gln Val Pro Val Val Ala
405 410 415
gct caa ggg ctt gtg gaa atg aag gac ata tct tct gtg aca tcc att 1296
Ala Gln Gly Leu Val Glu Met Lys Asp Ile Ser Ser Val Thr Ser Ile
420 425 430
tta ctc ttt ttc caa acc atg ggc gga gcg tac ttc att tcc gcc ggc 1344
Leu Leu Phe Phe Gln Thr Met Gly Gly Ala Tyr Phe Ile Ser Ala Gly
435 440 445
gaa agt gcg ttc acc aac caa atg att agt acc atc tca aaa att gcc 1392
Glu Ser Ala Phe Thr Asn Gln Met Ile Ser Thr Ile Ser Lys Ile Ala
450 455 460
cca gat ctg aat tcc gct aag gtg gtc agt gtt ggc gcg act gaa atc 1440
Pro Asp Leu Asn Ser Ala Lys Val Val Ser Val Gly Ala Thr Glu Ile
465 470 475 480
cac aaa ata tac tca ggg cca gca ctg act gcc gtt ctc gag gct tat 1488
His Lys Ile Tyr Ser Gly Pro Ala Leu Thr Ala Val Leu Glu Ala Tyr
485 490 495
atg agc ggg ttt cgg act gcg tgg att att tgc atc gcg gca gca ggt 1536
Met Ser Gly Phe Arg Thr Ala Trp Ile Ile Cys Ile Ala Ala Ala Gly
500 505 510
ctc gcc ttt gtc atc agt ctg tta cca ctt ttc gtt agg gta aac gga 1584
Leu Ala Phe Val Ile Ser Leu Leu Pro Leu Phe Val Arg Val Asn Gly
515 520 525
aag gta cag tcc gat cag gag gat cat agt cag tca cat ctg acg caa 1632
Lys Val Gln Ser Asp Gln Glu Asp His Ser Gln Ser His Leu Thr Gln
530 535 540
att tcc gtc 1641
Ile Ser Val
545
<210> 35
<211> 547
<212> PRT
<213> Penicillium citrinum
<400> 35
Met Arg Met Asn Asp Ala Lys Ile Val Thr Lys Glu Gln Ile Glu Pro
1 5 10 15
Val Asp Gln Asn Ala Asn Thr Asn Gly Leu Tyr Ser Gln Trp Arg Lys
20 25 30
Lys Val Leu Gly Pro Trp Ala Ser Val Cys Val Val Val Ala Leu Val
35 40 45
Ile Ala Met Leu Leu Asn Ile Val Ala Thr Ala Ile Pro Lys Ile Thr
50 55 60
Asp Glu Phe His Ser Leu Asp Gln Val Gly Trp Tyr Gly Ser Ala Phe
65 70 75 80
Phe Val Gly Leu Val Ala Phe Gln Ala Val Trp Gly Lys Ile Tyr Arg
85 90 95
Phe Phe Pro Leu Lys Ala Thr Phe Met Val Ala Ile Val Leu Phe Glu
100 105 110
Ala Gly Ser Leu Ile Cys Ala Val Ser Gln Asn Ser Ile Thr Leu Ile
115 120 125
Ala Gly Arg Ala Ile Thr Gly Ala Gly Gly Ser Gly Val Thr Ser Gly
130 135 140
Cys Tyr Ile Ile Ile Ala Asn Ile Ala Ala Pro Glu Lys Arg Ala Ala
145 150 155 160
Tyr Thr Gly Ile Leu Gly Ala Thr Tyr Gly Ile Ala Ser Ile Met Gly
165 170 175
Pro Leu Val Gly Gly Ala Phe Thr Asp Gln Leu Thr Trp Arg Trp Cys
180 185 190
Phe Trp Ile Asn Leu Pro Ile Gly Phe Ala Ala Val Val Leu Leu Leu
195 200 205
Leu Thr Phe Ser Thr Pro Ala Ser Ala Lys Pro Ile Lys Ser Thr Trp
210 215 220
Ile Glu Ile Leu Arg His Val Asp Leu Leu Ser Val Val Ile Ile Ile
225 230 235 240
Ala Ser Phe Val Cys Tyr Leu Leu Ala Met Gln Trp Gly Gly Val Ser
245 250 255
Lys Ser Trp Asp Ser Ala Asp Val Ile Gly Thr Ile Val Gly Trp Ile
260 265 270
Val Leu Leu Val Val Phe Ala Ala Leu Gln Trp Ser Gln Gly Glu Tyr
275 280 285
Ala Leu Ile Val Pro Arg Leu Val Gln Asn Lys Val Ile Ala Val Cys
290 295 300
Ala Ala Phe Asn Ala Leu Leu Ala Gly Ala Tyr Phe Ile Ile Val Tyr
305 310 315 320
Tyr Met Pro Ile Tyr Phe Gln Thr Ile Gly Ser Ser Ser Ala Leu Arg
325 330 335
Ser Gly Ile Gln Thr Leu Pro Leu Ile Leu Ser Ala Ser Val Phe Ser
340 345 350
Leu Thr Gly Gly Val Val Leu Ala Ala Phe Gly Asn Phe Gln Tyr His
355 360 365
Leu Ile Ile Gly Ser Thr Leu Leu Thr Ile Gly Cys Gly Leu Leu Tyr
370 375 380
Thr Leu Gln Ile Thr Leu Ser Thr Gly Ala Tyr Val Gly Tyr Gln Leu
385 390 395 400
Leu Ala Gly Val Gly Val Gly Ile Ala Met Gln Val Pro Val Val Ala
405 410 415
Ala Gln Gly Leu Val Glu Met Lys Asp Ile Ser Ser Val Thr Ser Ile
420 425 430
Leu Leu Phe Phe Gln Thr Met Gly Gly Ala Tyr Phe Ile Ser Ala Gly
435 440 445
Glu Ser Ala Phe Thr Asn Gln Met Ile Ser Thr Ile Ser Lys Ile Ala
450 455 460
Pro Asp Leu Asn Ser Ala Lys Val Val Ser Val Gly Ala Thr Glu Ile
465 470 475 480
His Lys Ile Tyr Ser Gly Pro Ala Leu Thr Ala Val Leu Glu Ala Tyr
485 490 495
Met Ser Gly Phe Arg Thr Ala Trp Ile Ile Cys Ile Ala Ala Ala Gly
500 505 510
Leu Ala Phe Val Ile Ser Leu Leu Pro Leu Phe Val Arg Val Asn Gly
515 520 525
Lys Val Gln Ser Asp Gln Glu Asp His Ser Gln Ser His Leu Thr Gln
530 535 540
Ile Ser Val
545
<210> 36
<211> 1551
<212> DNA
<213> Penicillium citrinum
<220>
<221> CDS
<222> (1)..(1551)
<400> 36
atg gac acc tgg ggc ggt att ggc tgg gtc aac tac tct ggt att gtc 48
Met Asp Thr Trp Gly Gly Ile Gly Trp Val Asn Tyr Ser Gly Ile Val
1 5 10 15
ctg att tac atc act gtg act gta att tac aat ctt tat ctc cat cct 96
Leu Ile Tyr Ile Thr Val Thr Val Ile Tyr Asn Leu Tyr Leu His Pro
20 25 30
ctc tcg ggg ttt ccg ggt ccc ttc tgg gcc cga tca tcc ttg gtg tgt 144
Leu Ser Gly Phe Pro Gly Pro Phe Trp Ala Arg Ser Ser Leu Val Cys
35 40 45
gca gtc cct aat caa tta caa gat cca gta ttg atg aag aat cac agt 192
Ala Val Pro Asn Gln Leu Gln Asp Pro Val Leu Met Lys Asn His Ser
50 55 60
tat gga gaa ttt acc att cta tgg gtg gtc gat ttc acc gcg cca tcg 240
Tyr Gly Glu Phe Thr Ile Leu Trp Val Val Asp Phe Thr Ala Pro Ser
65 70 75 80
acc gac aac aca aaa aat acg gtc tgg tcc atc gat ttg cac cgg gcc 288
Thr Asp Asn Thr Lys Asn Thr Val Trp Ser Ile Asp Leu His Arg Ala
85 90 95
aga gtt gta cta acc acc acc gca gga cac gtc gtt cgg atc tca ccc 336
Arg Val Val Leu Thr Thr Thr Ala Gly His Val Val Arg Ile Ser Pro
100 105 110
aac gag ctc tca ttt gca tcg gtt gaa tcc tgg aaa gcc atc tac ggc 384
Asn Glu Leu Ser Phe Ala Ser Val Glu Ser Trp Lys Ala Ile Tyr Gly
115 120 125
cac cag gtc tca gga aag cca gta ccc att aaa agc cag ttc tac gag 432
His Gln Val Ser Gly Lys Pro Val Pro Ile Lys Ser Gln Phe Tyr Glu
130 135 140
atc tac ggg gct ggc ttc act tca ctc tgt atc ggg agt gag cgt gac 480
Ile Tyr Gly Ala Gly Phe Thr Ser Leu Cys Ile Gly Ser Glu Arg Asp
145 150 155 160
ccc aag aag cat ggt cgt atg cgc aag ctg ctt tca gcc gca ttt gct 528
Pro Lys Lys His Gly Arg Met Arg Lys Leu Leu Ser Ala Ala Phe Ala
165 170 175
acg aag tca cta gtc gag caa gag gtc att gtc gcg caa gcg atc gat 576
Thr Lys Ser Leu Val Glu Gln Glu Val Ile Val Ala Gln Ala Ile Asp
180 185 190
tta ttt att gat cag ctc ggt cga aaa ggc ggc cct gaa acc agt ggg 624
Leu Phe Ile Asp Gln Leu Gly Arg Lys Gly Gly Pro Glu Thr Ser Gly
195 200 205
ctg gat ttg acg aaa tgg tat gag atg gct gcc ttt gac att ctc ggg 672
Leu Asp Leu Thr Lys Trp Tyr Glu Met Ala Ala Phe Asp Ile Leu Gly
210 215 220
gag atg gcg ttt gga gaa agt ttc aac tgc att aaa tct ggc gag ccg 720
Glu Met Ala Phe Gly Glu Ser Phe Asn Cys Ile Lys Ser Gly Glu Pro
225 230 235 240
cac ttc tgg tct gag ctg gtg ctc gat cat cta tat ttc att acg ctt 768
His Phe Trp Ser Glu Leu Val Leu Asp His Leu Tyr Phe Ile Thr Leu
245 250 255
atc gac aat tta cgt cgg att cct ttg ctt gta agg atc acc aga ttg 816
Ile Asp Asn Leu Arg Arg Ile Pro Leu Leu Val Arg Ile Thr Arg Leu
260 265 270
ctg ttc cct tca aat ctc gca gtc cgt aat cgg aac tcg gaa tac agc 864
Leu Phe Pro Ser Asn Leu Ala Val Arg Asn Arg Asn Ser Glu Tyr Ser
275 280 285
aga ggc cag gta gca aaa cga ctg tcc aag cca acg gct agg aaa gac 912
Arg Gly Gln Val Ala Lys Arg Leu Ser Lys Pro Thr Ala Arg Lys Asp
290 295 300
ttt ctt aca acc atg gtg aag cac ttt gaa gat gga aac ctt gaa aag 960
Phe Leu Thr Thr Met Val Lys His Phe Glu Asp Gly Asn Leu Glu Lys
305 310 315 320
gag gaa ctg act gca cac gtc tcc act ctt gta att gca ggg ggt gaa 1008
Glu Glu Leu Thr Ala His Val Ser Thr Leu Val Ile Ala Gly Gly Glu
325 330 335
acg att gct acc ttc ctc ggc gct gtg aca tat cat ttg cta cag tcg 1056
Thr Ile Ala Thr Phe Leu Gly Ala Val Thr Tyr His Leu Leu Gln Ser
340 345 350
caa gtc tgt cac gaa aag ctg aaa aac gag att cga ggg cat ttc gcc 1104
Gln Val Cys His Glu Lys Leu Lys Asn Glu Ile Arg Gly His Phe Ala
355 360 365
aag tcc gaa gat atc aat gcg acg gaa gca cgg aag ctt cca tat ttg 1152
Lys Ser Glu Asp Ile Asn Ala Thr Glu Ala Arg Lys Leu Pro Tyr Leu
370 375 380
caa gct gtc att gac gaa ggc ctt cgc ata tac cct cct ggc tcg cag 1200
Gln Ala Val Ile Asp Glu Gly Leu Arg Ile Tyr Pro Pro Gly Ser Gln
385 390 395 400
ggc ttc cct cgt gta tca acc gga atg ttg ata gga agt acc tgg gct 1248
Gly Phe Pro Arg Val Ser Thr Gly Met Leu Ile Gly Ser Thr Trp Ala
405 410 415
gaa ata tat act agt gct tgg aca gtc aca cac agt gaa gaa tac ttc 1296
Glu Ile Tyr Thr Ser Ala Trp Thr Val Thr His Ser Glu Glu Tyr Phe
420 425 430
tcg gag cca atg aag ttc aag cct gat aga tgg ctt gac cag ggc tcg 1344
Ser Glu Pro Met Lys Phe Lys Pro Asp Arg Trp Leu Asp Gln Gly Ser
435 440 445
acc gac gtg aaa gaa gcc agc cag cca ttt tcg ctt ggt ccc cgg ggg 1392
Thr Asp Val Lys Glu Ala Ser Gln Pro Phe Ser Leu Gly Pro Arg Gly
450 455 460
tgc ctg ggc caa aag tcc atc aat ctg atc cta gcc aag atg ttc tgg 1440
Cys Leu Gly Gln Lys Ser Ile Asn Leu Ile Leu Ala Lys Met Phe Trp
465 470 475 480
cga tac gat ctg gaa ctc cta gac ccg aac tta gac tgg gaa ggg cag 1488
Arg Tyr Asp Leu Glu Leu Leu Asp Pro Asn Leu Asp Trp Glu Gly Gln
485 490 495
agc cat atg cat gtt atg tgg tgg aag cca gag ctc ccg gtt cga ttt 1536
Ser His Met His Val Met Trp Trp Lys Pro Glu Leu Pro Val Arg Phe
500 505 510
ttt gaa agg caa gcg 1551
Phe Glu Arg Gln Ala
515
<210> 37
<211> 517
<212> PRT
<213> Penicillium citrinum
<400> 37
Met Asp Thr Trp Gly Gly Ile Gly Trp Val Asn Tyr Ser Gly Ile Val
1 5 10 15
Leu Ile Tyr Ile Thr Val Thr Val Ile Tyr Asn Leu Tyr Leu His Pro
20 25 30
Leu Ser Gly Phe Pro Gly Pro Phe Trp Ala Arg Ser Ser Leu Val Cys
35 40 45
Ala Val Pro Asn Gln Leu Gln Asp Pro Val Leu Met Lys Asn His Ser
50 55 60
Tyr Gly Glu Phe Thr Ile Leu Trp Val Val Asp Phe Thr Ala Pro Ser
65 70 75 80
Thr Asp Asn Thr Lys Asn Thr Val Trp Ser Ile Asp Leu His Arg Ala
85 90 95
Arg Val Val Leu Thr Thr Thr Ala Gly His Val Val Arg Ile Ser Pro
100 105 110
Asn Glu Leu Ser Phe Ala Ser Val Glu Ser Trp Lys Ala Ile Tyr Gly
115 120 125
His Gln Val Ser Gly Lys Pro Val Pro Ile Lys Ser Gln Phe Tyr Glu
130 135 140
Ile Tyr Gly Ala Gly Phe Thr Ser Leu Cys Ile Gly Ser Glu Arg Asp
145 150 155 160
Pro Lys Lys His Gly Arg Met Arg Lys Leu Leu Ser Ala Ala Phe Ala
165 170 175
Thr Lys Ser Leu Val Glu Gln Glu Val Ile Val Ala Gln Ala Ile Asp
180 185 190
Leu Phe Ile Asp Gln Leu Gly Arg Lys Gly Gly Pro Glu Thr Ser Gly
195 200 205
Leu Asp Leu Thr Lys Trp Tyr Glu Met Ala Ala Phe Asp Ile Leu Gly
210 215 220
Glu Met Ala Phe Gly Glu Ser Phe Asn Cys Ile Lys Ser Gly Glu Pro
225 230 235 240
His Phe Trp Ser Glu Leu Val Leu Asp His Leu Tyr Phe Ile Thr Leu
245 250 255
Ile Asp Asn Leu Arg Arg Ile Pro Leu Leu Val Arg Ile Thr Arg Leu
260 265 270
Leu Phe Pro Ser Asn Leu Ala Val Arg Asn Arg Asn Ser Glu Tyr Ser
275 280 285
Arg Gly Gln Val Ala Lys Arg Leu Ser Lys Pro Thr Ala Arg Lys Asp
290 295 300
Phe Leu Thr Thr Met Val Lys His Phe Glu Asp Gly Asn Leu Glu Lys
305 310 315 320
Glu Glu Leu Thr Ala His Val Ser Thr Leu Val Ile Ala Gly Gly Glu
325 330 335
Thr Ile Ala Thr Phe Leu Gly Ala Val Thr Tyr His Leu Leu Gln Ser
340 345 350
Gln Val Cys His Glu Lys Leu Lys Asn Glu Ile Arg Gly His Phe Ala
355 360 365
Lys Ser Glu Asp Ile Asn Ala Thr Glu Ala Arg Lys Leu Pro Tyr Leu
370 375 380
Gln Ala Val Ile Asp Glu Gly Leu Arg Ile Tyr Pro Pro Gly Ser Gln
385 390 395 400
Gly Phe Pro Arg Val Ser Thr Gly Met Leu Ile Gly Ser Thr Trp Ala
405 410 415
Glu Ile Tyr Thr Ser Ala Trp Thr Val Thr His Ser Glu Glu Tyr Phe
420 425 430
Ser Glu Pro Met Lys Phe Lys Pro Asp Arg Trp Leu Asp Gln Gly Ser
435 440 445
Thr Asp Val Lys Glu Ala Ser Gln Pro Phe Ser Leu Gly Pro Arg Gly
450 455 460
Cys Leu Gly Gln Lys Ser Ile Asn Leu Ile Leu Ala Lys Met Phe Trp
465 470 475 480
Arg Tyr Asp Leu Glu Leu Leu Asp Pro Asn Leu Asp Trp Glu Gly Gln
485 490 495
Ser His Met His Val Met Trp Trp Lys Pro Glu Leu Pro Val Arg Phe
500 505 510
Phe Glu Arg Gln Ala
515
<210> 38
<211> 1359
<212> DNA
<213> Penicillium citrinum
<220>
<221> CDS
<222> (1)..(1359)
<400> 38
atg acc tcc aaa gcc caa aat gtg ggc atc aag gct ctc gaa att tat 48
Met Thr Ser Lys Ala Gln Asn Val Gly Ile Lys Ala Leu Glu Ile Tyr
1 5 10 15
ttc ccc agt cga tat gtg ccg caa agc gag ctt gag aca tat cta ggt 96
Phe Pro Ser Arg Tyr Val Pro Gln Ser Glu Leu Glu Thr Tyr Leu Gly
20 25 30
gcc agc act ggg aaa ttc aca att ggc ctg ggt caa cag aag atg agt 144
Ala Ser Thr Gly Lys Phe Thr Ile Gly Leu Gly Gln Gln Lys Met Ser
35 40 45
ttc tgt gat gat cgc gaa gac ctc tat tcc atg gcg ctc acg gcg gtc 192
Phe Cys Asp Asp Arg Glu Asp Leu Tyr Ser Met Ala Leu Thr Ala Val
50 55 60
tcg tcc ctg ctg gca aag tac cag att gac cca aac aca att ggc cgc 240
Ser Ser Leu Leu Ala Lys Tyr Gln Ile Asp Pro Asn Thr Ile Gly Arg
65 70 75 80
ttg gaa gtg gga acg gaa acg ctg ctc gac aaa tcc aag tct tgc aag 288
Leu Glu Val Gly Thr Glu Thr Leu Leu Asp Lys Ser Lys Ser Cys Lys
85 90 95
tcg gta ctc atg caa ctt ttc gga gag aac acc gac atc gag gga gtc 336
Ser Val Leu Met Gln Leu Phe Gly Glu Asn Thr Asp Ile Glu Gly Val
100 105 110
gac aca tac aac gct tgc tat ggt gga act aat gcc ttg ttg aat gcg 384
Asp Thr Tyr Asn Ala Cys Tyr Gly Gly Thr Asn Ala Leu Leu Asn Ala
115 120 125
att aac tgg gtg gaa tcg tcc gcc tgg gac ggt cgc gac gct att gtc 432
Ile Asn Trp Val Glu Ser Ser Ala Trp Asp Gly Arg Asp Ala Ile Val
130 135 140
gtc gcg ggc gac atc gct ctg tac gac aag ccc gcc gcc cgc ccg acc 480
Val Ala Gly Asp Ile Ala Leu Tyr Asp Lys Pro Ala Ala Arg Pro Thr
145 150 155 160
ggc ggc gcc ggc tgt gtg gct atg ctg att agc cct aat gcg ccc cta 528
Gly Gly Ala Gly Cys Val Ala Met Leu Ile Ser Pro Asn Ala Pro Leu
165 170 175
gtc cta gag ccc ttc cgg gga acg tat atg aag cac gtc tac gac ttc 576
Val Leu Glu Pro Phe Arg Gly Thr Tyr Met Lys His Val Tyr Asp Phe
180 185 190
tat aag ggg aac ttc aaa tcg gag tac ccc ctt gtc gat gga cag tac 624
Tyr Lys Gly Asn Phe Lys Ser Glu Tyr Pro Leu Val Asp Gly Gln Tyr
195 200 205
tct aat acg tgt tat ctc gag gca ttg gac aac tgc tac cag aaa tat 672
Ser Asn Thr Cys Tyr Leu Glu Ala Leu Asp Asn Cys Tyr Gln Lys Tyr
210 215 220
cgt act aaa tct ctg ccg aaa agt ggc ggg tta acg aac gga gct gca 720
Arg Thr Lys Ser Leu Pro Lys Ser Gly Gly Leu Thr Asn Gly Ala Ala
225 230 235 240
aaa gcc cag ggc agt ttc ttg gat acc ttt gag tac ttt gtc ttc cat 768
Lys Ala Gln Gly Ser Phe Leu Asp Thr Phe Glu Tyr Phe Val Phe His
245 250 255
gcg cct aac tgc aag ctc gtc tct aag gcc tac ggt cgt cta tta ttc 816
Ala Pro Asn Cys Lys Leu Val Ser Lys Ala Tyr Gly Arg Leu Leu Phe
260 265 270
aac gat ctc cgg acg gag cct agc cat ttt gat gac gtt ccg gca gcg 864
Asn Asp Leu Arg Thr Glu Pro Ser His Phe Asp Asp Val Pro Ala Ala
275 280 285
gtc cgc gat att gag cag act gcg tct ctg aca gac aaa gaa att gag 912
Val Arg Asp Ile Glu Gln Thr Ala Ser Leu Thr Asp Lys Glu Ile Glu
290 295 300
aag act tgc atc ggg ttg agc aag gag aag ttc tct aag cgt gtg cag 960
Lys Thr Cys Ile Gly Leu Ser Lys Glu Lys Phe Ser Lys Arg Val Gln
305 310 315 320
cca tct att aca gca cct aca aat tgc ggg aat atg tac act gct agt 1008
Pro Ser Ile Thr Ala Pro Thr Asn Cys Gly Asn Met Tyr Thr Ala Ser
325 330 335
gtc tac tct gga ctg gtg agc ttg ctg agc aat gtc cct agt gag caa 1056
Val Tyr Ser Gly Leu Val Ser Leu Leu Ser Asn Val Pro Ser Glu Gln
340 345 350
ctg cag aac aag cgc att ggc atg ttc agc tat ggc agt ggt ctg gct 1104
Leu Gln Asn Lys Arg Ile Gly Met Phe Ser Tyr Gly Ser Gly Leu Ala
355 360 365
agc act cta ttt agt ttc cgt gtc aag ggt gat act tcg cgg atc gcg 1152
Ser Thr Leu Phe Ser Phe Arg Val Lys Gly Asp Thr Ser Arg Ile Ala
370 375 380
ggg cag gtg cga ttg aat gag cgc ttg gaa agt cgc acg ccg gtc tcg 1200
Gly Gln Val Arg Leu Asn Glu Arg Leu Glu Ser Arg Thr Pro Val Ser
385 390 395 400
ccg gag ttc tac aac gag atg tgc gac ctc cgg gag aaa gcc tac cag 1248
Pro Glu Phe Tyr Asn Glu Met Cys Asp Leu Arg Glu Lys Ala Tyr Gln
405 410 415
cag aag aac tat acc cct gtg gga agc gtc gac acc ctg gct ccc ggt 1296
Gln Lys Asn Tyr Thr Pro Val Gly Ser Val Asp Thr Leu Ala Pro Gly
420 425 430
acc tac tac ctt gtc cac gtt gac gag atg ttc cgg cga agt tat gag 1344
Thr Tyr Tyr Leu Val His Val Asp Glu Met Phe Arg Arg Ser Tyr Glu
435 440 445
aaa act tca gtt gtc 1359
Lys Thr Ser Val Val
450
<210> 39
<211> 453
<212> PRT
<213> Penicillium citrinum
<400> 39
Met Thr Ser Lys Ala Gln Asn Val Gly Ile Lys Ala Leu Glu Ile Tyr
1 5 10 15
Phe Pro Ser Arg Tyr Val Pro Gln Ser Glu Leu Glu Thr Tyr Leu Gly
20 25 30
Ala Ser Thr Gly Lys Phe Thr Ile Gly Leu Gly Gln Gln Lys Met Ser
35 40 45
Phe Cys Asp Asp Arg Glu Asp Leu Tyr Ser Met Ala Leu Thr Ala Val
50 55 60
Ser Ser Leu Leu Ala Lys Tyr Gln Ile Asp Pro Asn Thr Ile Gly Arg
65 70 75 80
Leu Glu Val Gly Thr Glu Thr Leu Leu Asp Lys Ser Lys Ser Cys Lys
85 90 95
Ser Val Leu Met Gln Leu Phe Gly Glu Asn Thr Asp Ile Glu Gly Val
100 105 110
Asp Thr Tyr Asn Ala Cys Tyr Gly Gly Thr Asn Ala Leu Leu Asn Ala
115 120 125
Ile Asn Trp Val Glu Ser Ser Ala Trp Asp Gly Arg Asp Ala Ile Val
130 135 140
Val Ala Gly Asp Ile Ala Leu Tyr Asp Lys Pro Ala Ala Arg Pro Thr
145 150 155 160
Gly Gly Ala Gly Cys Val Ala Met Leu Ile Ser Pro Asn Ala Pro Leu
165 170 175
Val Leu Glu Pro Phe Arg Gly Thr Tyr Met Lys His Val Tyr Asp Phe
180 185 190
Tyr Lys Gly Asn Phe Lys Ser Glu Tyr Pro Leu Val Asp Gly Gln Tyr
195 200 205
Ser Asn Thr Cys Tyr Leu Glu Ala Leu Asp Asn Cys Tyr Gln Lys Tyr
210 215 220
Arg Thr Lys Ser Leu Pro Lys Ser Gly Gly Leu Thr Asn Gly Ala Ala
225 230 235 240
Lys Ala Gln Gly Ser Phe Leu Asp Thr Phe Glu Tyr Phe Val Phe His
245 250 255
Ala Pro Asn Cys Lys Leu Val Ser Lys Ala Tyr Gly Arg Leu Leu Phe
260 265 270
Asn Asp Leu Arg Thr Glu Pro Ser His Phe Asp Asp Val Pro Ala Ala
275 280 285
Val Arg Asp Ile Glu Gln Thr Ala Ser Leu Thr Asp Lys Glu Ile Glu
290 295 300
Lys Thr Cys Ile Gly Leu Ser Lys Glu Lys Phe Ser Lys Arg Val Gln
305 310 315 320
Pro Ser Ile Thr Ala Pro Thr Asn Cys Gly Asn Met Tyr Thr Ala Ser
325 330 335
Val Tyr Ser Gly Leu Val Ser Leu Leu Ser Asn Val Pro Ser Glu Gln
340 345 350
Leu Gln Asn Lys Arg Ile Gly Met Phe Ser Tyr Gly Ser Gly Leu Ala
355 360 365
Ser Thr Leu Phe Ser Phe Arg Val Lys Gly Asp Thr Ser Arg Ile Ala
370 375 380
Gly Gln Val Arg Leu Asn Glu Arg Leu Glu Ser Arg Thr Pro Val Ser
385 390 395 400
Pro Glu Phe Tyr Asn Glu Met Cys Asp Leu Arg Glu Lys Ala Tyr Gln
405 410 415
Gln Lys Asn Tyr Thr Pro Val Gly Ser Val Asp Thr Leu Ala Pro Gly
420 425 430
Thr Tyr Tyr Leu Val His Val Asp Glu Met Phe Arg Arg Ser Tyr Glu
435 440 445
Lys Thr Ser Val Val
450
<210> 40
<211> 1296
<212> DNA
<213> Penicillium citrinum
<220>
<221> CDS
<222> (1)..(1296)
<400> 40
atg atg gac aaa gac acg cgg atc ctc atc gtt gga gca ggc tgc ttc 48
Met Met Asp Lys Asp Thr Arg Ile Leu Ile Val Gly Ala Gly Cys Phe
1 5 10 15
ggc act tcg acc gca tac cac ctt tca cag cgc ggt tac act tcc atc 96
Gly Thr Ser Thr Ala Tyr His Leu Ser Gln Arg Gly Tyr Thr Ser Ile
20 25 30
cgc gtg ctg gat cca tac gcc cct ccc tct tgc gaa gca gcc tct acc 144
Arg Val Leu Asp Pro Tyr Ala Pro Pro Ser Cys Glu Ala Ala Ser Thr
35 40 45
gat atc agc aag gtt atc cgc agc gac tac aac gaa cct cta tat gca 192
Asp Ile Ser Lys Val Ile Arg Ser Asp Tyr Asn Glu Pro Leu Tyr Ala
50 55 60
cgt ctt gga atc gag tct att gaa gcg tgg cgg tct tgg tcc ctg ttt 240
Arg Leu Gly Ile Glu Ser Ile Glu Ala Trp Arg Ser Trp Ser Leu Phe
65 70 75 80
cgt ggg ctc tac cat gtc ccc ggg tgg att ctc agc gca gcg aac ctg 288
Arg Gly Leu Tyr His Val Pro Gly Trp Ile Leu Ser Ala Ala Asn Leu
85 90 95
tcc cgg ccc ttt gtc gag ggt tcg att gag aca tgt aag agg ctt gga 336
Ser Arg Pro Phe Val Glu Gly Ser Ile Glu Thr Cys Lys Arg Leu Gly
100 105 110
gta cag ggt ctt gag aag ctc acg ccg gat cag atc cgt act cgc ttc 384
Val Gln Gly Leu Glu Lys Leu Thr Pro Asp Gln Ile Arg Thr Arg Phe
115 120 125
tct gtt gtc acg ggc aag ctg gat gga tgg aat atc aat gtg tgg aac 432
Ser Val Val Thr Gly Lys Leu Asp Gly Trp Asn Ile Asn Val Trp Asn
130 135 140
cca acg gcc ggg tgg gca gct gct ggt aca gct atc gag cgg atg gca 480
Pro Thr Ala Gly Trp Ala Ala Ala Gly Thr Ala Ile Glu Arg Met Ala
145 150 155 160
ggc gct tct cag gag aaa ggg gtg aaa tac att tcg ggg aag acg aag 528
Gly Ala Ser Gln Glu Lys Gly Val Lys Tyr Ile Ser Gly Lys Thr Lys
165 170 175
ggg gat gtg caa gag ttg ata ctg gat gat att acg ggc gag tgc aag 576
Gly Asp Val Gln Glu Leu Ile Leu Asp Asp Ile Thr Gly Glu Cys Lys
180 185 190
gga gtc gtc aca gca gat ggc acg aga cac gag gcg gat gtg gtc atc 624
Gly Val Val Thr Ala Asp Gly Thr Arg His Glu Ala Asp Val Val Ile
195 200 205
tta gcc gca gga gct tgg aca cct tcg cta cta gac gtg aag ggc cag 672
Leu Ala Ala Gly Ala Trp Thr Pro Ser Leu Leu Asp Val Lys Gly Gln
210 215 220
tta act gcc aag ggg cac agt gtc gct cat ata cag ctg acc cct tcc 720
Leu Thr Ala Lys Gly His Ser Val Ala His Ile Gln Leu Thr Pro Ser
225 230 235 240
gaa acg aaa cac tat gcc tcg atg ccc att atg gat aat ctc gag ctg 768
Glu Thr Lys His Tyr Ala Ser Met Pro Ile Met Asp Asn Leu Glu Leu
245 250 255
ggc tac ttc ttc cca cct caa gaa gat ggg atc ttc aag atg gct cac 816
Gly Tyr Phe Phe Pro Pro Gln Glu Asp Gly Ile Phe Lys Met Ala His
260 265 270
agt caa ttc atc acc aac gtg caa acc acc aag tct ggt atc acc act 864
Ser Gln Phe Ile Thr Asn Val Gln Thr Thr Lys Ser Gly Ile Thr Thr
275 280 285
tct gtc cca cac acg ttt gtt cag gca ccc acc gat ggc ctc cct ctt 912
Ser Val Pro His Thr Phe Val Gln Ala Pro Thr Asp Gly Leu Pro Leu
290 295 300
gag atc gaa gcc caa atg cgc cgg aac ttg cga cgt gtg ctc ccc gaa 960
Glu Ile Glu Ala Gln Met Arg Arg Asn Leu Arg Arg Val Leu Pro Glu
305 310 315 320
ctt gca gac aga ccc ttc tgc tat aca cgg ctg tgc tgg gat gct gat 1008
Leu Ala Asp Arg Pro Phe Cys Tyr Thr Arg Leu Cys Trp Asp Ala Asp
325 330 335
acg gct gat cgg cat ttc ctt gtc acc cct cat cct gct cac aaa agt 1056
Thr Ala Asp Arg His Phe Leu Val Thr Pro His Pro Ala His Lys Ser
340 345 350
ctc ttc ctg gca acc ggc gga tca gca cat ggg ttc aag ttc ctt cct 1104
Leu Phe Leu Ala Thr Gly Gly Ser Ala His Gly Phe Lys Phe Leu Pro
355 360 365
gtc gtt gga aaa tat gtc gcg gat ttg ctt gag ggg act ctg gac cca 1152
Val Val Gly Lys Tyr Val Ala Asp Leu Leu Glu Gly Thr Leu Asp Pro
370 375 380
gag atc gtc agt caa tgg caa tgg agg gct ggg cag aag agt act gcg 1200
Glu Ile Val Ser Gln Trp Gln Trp Arg Ala Gly Gln Lys Ser Thr Ala
385 390 395 400
aag aat cta gcg cat ttg gat ccg gaa atg gag ttg agc gac ctt aca 1248
Lys Asn Leu Ala His Leu Asp Pro Glu Met Glu Leu Ser Asp Leu Thr
405 410 415
ggg tgg aag ggt aga cag ata cgt gaa aga agc cat gct tct aaa cta 1296
Gly Trp Lys Gly Arg Gln Ile Arg Glu Arg Ser His Ala Ser Lys Leu
420 425 430
<210> 41
<211> 432
<212> PRT
<213> Penicillium citrinum
<400> 41
Met Met Asp Lys Asp Thr Arg Ile Leu Ile Val Gly Ala Gly Cys Phe
1 5 10 15
Gly Thr Ser Thr Ala Tyr His Leu Ser Gln Arg Gly Tyr Thr Ser Ile
20 25 30
Arg Val Leu Asp Pro Tyr Ala Pro Pro Ser Cys Glu Ala Ala Ser Thr
35 40 45
Asp Ile Ser Lys Val Ile Arg Ser Asp Tyr Asn Glu Pro Leu Tyr Ala
50 55 60
Arg Leu Gly Ile Glu Ser Ile Glu Ala Trp Arg Ser Trp Ser Leu Phe
65 70 75 80
Arg Gly Leu Tyr His Val Pro Gly Trp Ile Leu Ser Ala Ala Asn Leu
85 90 95
Ser Arg Pro Phe Val Glu Gly Ser Ile Glu Thr Cys Lys Arg Leu Gly
100 105 110
Val Gln Gly Leu Glu Lys Leu Thr Pro Asp Gln Ile Arg Thr Arg Phe
115 120 125
Ser Val Val Thr Gly Lys Leu Asp Gly Trp Asn Ile Asn Val Trp Asn
130 135 140
Pro Thr Ala Gly Trp Ala Ala Ala Gly Thr Ala Ile Glu Arg Met Ala
145 150 155 160
Gly Ala Ser Gln Glu Lys Gly Val Lys Tyr Ile Ser Gly Lys Thr Lys
165 170 175
Gly Asp Val Gln Glu Leu Ile Leu Asp Asp Ile Thr Gly Glu Cys Lys
180 185 190
Gly Val Val Thr Ala Asp Gly Thr Arg His Glu Ala Asp Val Val Ile
195 200 205
Leu Ala Ala Gly Ala Trp Thr Pro Ser Leu Leu Asp Val Lys Gly Gln
210 215 220
Leu Thr Ala Lys Gly His Ser Val Ala His Ile Gln Leu Thr Pro Ser
225 230 235 240
Glu Thr Lys His Tyr Ala Ser Met Pro Ile Met Asp Asn Leu Glu Leu
245 250 255
Gly Tyr Phe Phe Pro Pro Gln Glu Asp Gly Ile Phe Lys Met Ala His
260 265 270
Ser Gln Phe Ile Thr Asn Val Gln Thr Thr Lys Ser Gly Ile Thr Thr
275 280 285
Ser Val Pro His Thr Phe Val Gln Ala Pro Thr Asp Gly Leu Pro Leu
290 295 300
Glu Ile Glu Ala Gln Met Arg Arg Asn Leu Arg Arg Val Leu Pro Glu
305 310 315 320
Leu Ala Asp Arg Pro Phe Cys Tyr Thr Arg Leu Cys Trp Asp Ala Asp
325 330 335
Thr Ala Asp Arg His Phe Leu Val Thr Pro His Pro Ala His Lys Ser
340 345 350
Leu Phe Leu Ala Thr Gly Gly Ser Ala His Gly Phe Lys Phe Leu Pro
355 360 365
Val Val Gly Lys Tyr Val Ala Asp Leu Leu Glu Gly Thr Leu Asp Pro
370 375 380
Glu Ile Val Ser Gln Trp Gln Trp Arg Ala Gly Gln Lys Ser Thr Ala
385 390 395 400
Lys Asn Leu Ala His Leu Asp Pro Glu Met Glu Leu Ser Asp Leu Thr
405 410 415
Gly Trp Lys Gly Arg Gln Ile Arg Glu Arg Ser His Ala Ser Lys Leu
420 425 430
<210> 42
<211> 19
<212> DNA
<213> Penicillium citrinum
<400> 42
catttgctgt tgatggagc 19
<210> 43
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 43
gacctattgc tttgtagcac 20
<210> 44
<211> 19
<212> DNA
<213> Penicillium citrinum
<400> 44
tctgatcaga acgacgagc 19
<210> 45
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 45
tcagagaagg ccactatgcc 20
<210> 46
<211> 21
<212> DNA
<213> Penicillium citrinum
<400> 46
cttctgcgcc attcttcttg g 21
<210> 47
<211> 21
<212> DNA
<213> Penicillium citrinum
<400> 47
agatttgcac catagatcca c 21
<210> 48
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 48
atgagtccag cgaggattac 20
<210> 49
<211> 20
<212> DNA
<213> Penicillium citrinum
<400> 49
tatgaagctg ctcggtatgc 20
<210> 50
<211> 21
<212> DNA
<213> Penicillium citrinum
<400> 50
gcgatgaatg ccaaagacta c 21
─────────────────────────────────────────────────────
フロントページの続き
(51)Int.Cl.7 識別記号 FI テーマコート゛(参考)
A61P 3/06 A61P 43/00 111
43/00 111 C12N 9/99
C12N 9/99 C12R 1:80
(C12P 7/42 C12N 15/00 ZNAA
C12R 1:80)
(C12P 17/06
C12R 1:80)
Fターム(参考) 4B024 AA01 BA80 CA04 DA06 DA11
EA04 FA15 GA11 GA21
4B064 AD32 AE46 CA02 CA05 DA06
4B065 AA26X AA67X AA67Y AB01
AC14 BA02 BA10 CA10 CA18
CA44
4C206 AA04 DB03 DB56 ZC20 ZC33
Claims (16)
- 【請求項1】配列表の配列番号1のヌクレオチド番号1
乃至72149で示される塩基配列からなり、ML−2
36B生産菌内に導入されることにより該菌のML−2
36B生産能を改善することを特徴とするDNA。 - 【請求項2】配列表の配列番号1のヌクレオチド番号1
乃至42758で示される塩基配列からなり、ML−2
36B生産菌内に導入されることにより該菌のML−2
36B生産能を改善することを特徴とするDNA。 - 【請求項3】配列表の配列番号1のヌクレオチド番号1
1614乃至47918で示される塩基配列からなり、
ML−236B生産菌内に導入されることにより該菌の
ML−236B生産能を改善することを特徴とするDN
A。 - 【請求項4】配列表の配列番号1のヌクレオチド番号3
6135乃至72149で示される塩基配列からなり、
ML−236B生産菌内に導入されることにより該菌の
ML−236B生産能を改善することを特徴とするDN
A。 - 【請求項5】配列表の配列番号1のヌクレオチド番号2
5979乃至63419で示される塩基配列からなり、
ML−236B生産菌内に導入されることにより該菌の
ML−236B生産能を改善することを特徴とするDN
A。 - 【請求項6】請求項1乃至5記載のDNAとハイブリダ
イズし、ML−236B生産菌内に導入されることによ
り該菌のML−236B生産能を改善することを特徴と
するDNA。 - 【請求項7】請求項1乃至5記載のDNAとストリンジ
ェントな条件下でハイブリダイズし、ML−236B生
産菌内に導入されることにより該菌のML−236B生
産能を改善することを特徴とするDNA。 - 【請求項8】請求項1乃至7のいずれか一つに記載のD
NAを含む組換えDNAベクター。 - 【請求項9】プラスミドpML42(FERM BP−
7723)である請求項8記載の組換えDNAベクタ
ー。 - 【請求項10】プラスミドpML45(FERM BP
−7724)である請求項8記載の組換えDNAベクタ
ー。 - 【請求項11】プラスミドpML51(FERM BP
−7725)である請求項8記載の組換えDNAベクタ
ー。 - 【請求項12】請求項7乃至10記載の組換えDNAベ
クターで形質転換された宿主細胞。 - 【請求項13】ML−236B生産菌であることを特徴
とする請求項12記載の宿主細胞。 - 【請求項14】ペニシリウム・シトリナム(Penicilliu
m citrinum)であることを特徴とする、請求項13記載
の宿主細胞。 - 【請求項15】大腸菌であることを特徴とする、請求項
12記載の宿主細胞。 - 【請求項16】請求項12乃至15記載の宿主細胞を培
養し、次いで該培養物からML−236Bを回収するこ
とを特徴とする、ML−236Bの製造法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001316578A JP2003116567A (ja) | 2001-10-15 | 2001-10-15 | 遺伝子クラスター |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001316578A JP2003116567A (ja) | 2001-10-15 | 2001-10-15 | 遺伝子クラスター |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2003116567A true JP2003116567A (ja) | 2003-04-22 |
Family
ID=19134573
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001316578A Pending JP2003116567A (ja) | 2001-10-15 | 2001-10-15 | 遺伝子クラスター |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2003116567A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009540811A (ja) * | 2006-06-22 | 2009-11-26 | ディーエスエム アイピー アセッツ ビー.ブイ. | プラバスタチンの産生 |
-
2001
- 2001-10-15 JP JP2001316578A patent/JP2003116567A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009540811A (ja) * | 2006-06-22 | 2009-11-26 | ディーエスエム アイピー アセッツ ビー.ブイ. | プラバスタチンの産生 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101690802B1 (ko) | 피리피로펜 a 생합성 유전자 | |
CA2360376C (en) | Novel carbonyl reductase, gene thereof and method of using the same | |
CN113227364A (zh) | 用于产生熊去氧胆酸及其前体的细胞和方法 | |
JP2003520580A (ja) | バニリンを生産するための酵素および遺伝子 | |
CN111527211A (zh) | 生产霉孢菌素样氨基酸的微生物及利用其生产霉孢菌素样氨基酸的方法 | |
TW201139680A (en) | Method for producing pyripyropene derivative by enzymatic process | |
US20070111293A1 (en) | Genes from a gene cluster | |
JP2003116567A (ja) | 遺伝子クラスター | |
TWI297358B (en) | Monacolin k biosynthesis genes | |
CN111944840A (zh) | 木霉菌Azaphilones类次级代谢产物的应用 | |
JP5524053B2 (ja) | ハーボキシジエンの生合成に関与するポリペプチドをコードするdna | |
JP3972068B2 (ja) | 遺伝子クラスター上の構造遺伝子 | |
TWI331630B (en) | Saponin-decomposing enzyme, gene thereof and large-scale production system f or producing soyasapogenol b | |
JPWO2002099109A1 (ja) | 新規なポリペプチド、そのポリペプチドをコードするdnaおよびそれらの用途 | |
KR100808307B1 (ko) | 신규한(알)-2-히드록시-3-페닐프로피온산(디-페닐유산)탈수소효소 및 이 것을 코드하는 유전자 | |
WO1998012205A1 (en) | Ivi-2, ivi-3 and ivi-4 loci of enterococcus faecalis polynucleotide, polypeptides and method of use therefor | |
JP2001095577A (ja) | 新規なポリペプチド、そのポリペプチドをコードするdna及びそれらの用途 | |
JP2003061682A (ja) | 還元酵素遺伝子及びその利用 | |
JP2001161375A (ja) | コレステロール・エステラーゼ遺伝子、組み換え体dna及びコレステロール・エステラーゼの製造法 | |
JP2002065282A (ja) | シイタケラッカーゼ遺伝子 | |
JPH0272878A (ja) | 組換えdna、それを含む形質転換体及びそれを用いたグルコースデヒドロゲナーゼの製造方法 | |
JP2001112487A (ja) | Ml−236b生合成関連dna | |
WO2001012814A1 (fr) | Adn lie a la biosynthese ml-236b | |
CA2458953A1 (en) | Novel genetic products obtained from ashbya gossypii, which are associated with transcription mechanisms, rna processing and/or translation | |
JPH09168389A (ja) | アスコルビン酸オキシダーゼをコードするdna |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20040824 |