JPH0870864A

JPH0870864A - New endonuclease 2 derived from superthrmophilic primordial microorganism

Info

Publication number: JPH0870864A
Application number: JP6209619A
Authority: JP
Inventors: Tadayuki Imanaka; 忠行今中; Masahiro Takagi; 昌広高木; Hirobumi Kakihara; 博文柿原; Motomu Nishioka; 求西岡
Original assignee: Toyobo Co Ltd
Current assignee: Toyobo Co Ltd
Priority date: 1994-09-02
Filing date: 1994-09-02
Publication date: 1996-03-19
Anticipated expiration: 2022-09-12
Also published as: JP3975452B2

Abstract

PURPOSE: To obtain a new endonuclease 2 which is a rare cutter, capable of cleaving specific sites of a specified double-stranded DNA sequence, having high thermostability and capable of greatly cleaving the DNA and facilitating the genetic manipulation. CONSTITUTION: This new endonuclease 2 is capable of cleaving sites indicated by arrows in a DNA sequence of formula I and producing a 3'-protruding cleaved site of 4 bases of CTAC or GTAG in its complementary chain and prepared from a superthermophilic primordial microorganism such as Pyrococcus furiosus KOD1 strain, has about 62kDa molecular weight and contains an amino acid sequence of formula II. Furthermore, the endonuclease 2 is obtained by culturing a recombinant host cell transformed with a DNA recombinant expression vector having a DNA, capable of coding the endonuclease 2 and inserted into an expression vector.

Description

Detailed Description of the Invention

【０００１】[0001]

【産業上の利用分野】本発明は新規な超好熱始原菌(Pyr
ococcus furiosus) ＫＯＤ１由来の新規エンドヌクレア
ーゼ２および該エンドヌクレアーゼをコ−ドする遺伝子
ならびに該遺伝子を使用するエンドヌクレアーゼ２を製
造する方法に関する。The present invention relates to a novel hyperthermophilic archaeon (Pyr
ococcus furiosus) KOD1 derived new endonuclease 2 and a gene encoding the endonuclease, and a method for producing the endonuclease 2 using the gene.

【０００２】[0002]

【従来の技術】エンドヌクレアーゼとはデオキシリボ核
酸（ＤＮＡ）、リボ核酸（ＲＮＡ）のヌクレオチド鎖を
途中から切断する酵素の総称である。特に制限酵素と称
されるエンドヌクレアーゼは特定の塩基配列を認識し、
特定の様式で二本鎖ＤＮＡを切断する酵素である。その
特異性的切断能は、遺伝子操作を容易にならしめ、現在
の遺伝子工学を始めとする分子生物学分野の研究に極め
て有用な酵素となっている。これまでに制限酵素は細
菌、放線菌、藍藻などから単離されており、その認識塩
基配列、切断様式の異なるものが約１５０種類程知られ
ている。2. Description of the Related Art Endonuclease is a general term for enzymes that cleave nucleotide chains of deoxyribonucleic acid (DNA) and ribonucleic acid (RNA) from the middle. In particular, endonucleases called restriction enzymes recognize specific base sequences,
An enzyme that cleaves double-stranded DNA in a specific fashion. Its specific cleavage ability facilitates gene manipulation and makes it an extremely useful enzyme for studies in the field of molecular biology including current genetic engineering. Up to now, restriction enzymes have been isolated from bacteria, actinomycetes, cyanobacteria, etc., and about 150 kinds of those having different recognition base sequences and cleavage modes are known.

【０００３】一般に制限酵素は塩基配列を認識してその
箇所で切断する。例えばSau3AIは下記配列を認識して矢
印の箇所で切断するため、４塩基認識と称されている。 Generally, a restriction enzyme recognizes a base sequence and cuts at that position. For example, Sau3AI recognizes the following sequence and cleaves at the position of the arrow, so it is called 4-base recognition.

【０００４】またBamHI は下記配列を認識して矢印の箇
所で切断するため、６塩基認識と称されている。さらにNotIは下記配列を認識して矢印の箇所で切断する
ため、８塩基認識と称されている。 BamHI recognizes the following sequence and cleaves at the position of the arrow, and is therefore called 6-base recognition. Furthermore, NotI recognizes the following sequence and cleaves at the position of the arrow, so it is called 8-base recognition.

【０００５】塩基配列が全くランダムであると仮定し
て、Sau3A の配列の表われる確率は（４⁴＝256 ）塩基
に１回、BamHI は（４⁶＝4096）塩基に１回、NotIは
（４⁸＝65536 ）塩基に１回の割合になる。したがって
Sau3A の切断断片は、平均 256塩基、BamHI は4096塩
基、NotIは 65536塩基の大きさになる。Assuming that the base sequence is completely random, the probability that the Sau3A sequence will appear is once every (4 ⁴ = 256) bases, BamHI once every (4 ⁶ = 4096) bases, and NotI ( 4 ⁸ = 65536) Once per base. Therefore
The cleavage fragment of Sau3A has an average size of 256 bases, BamHI has a size of 4096 bases, and NotI has a size of 65536 bases.

【０００６】他方、レアカッターと称されるものは認識
塩基の大きさに関係なく、ゲノムDNA 配列内の稀な塩基
配列を切断する酵素であり、それ故、切断断片が大き
い。またここに述べるイントロン (介在配列) 由来の酵
素は認識部位は不明とされており、切断の形のみが報告
されているに過ぎない研究途上の酵素ばかりである。On the other hand, what is called a rare cutter is an enzyme that cleaves a rare base sequence in a genomic DNA sequence regardless of the size of the recognition base, and therefore the cleavage fragment is large. In addition, the recognition site of the enzyme derived from the intron (intervening sequence) described here is unknown, and only the cleavage form has been reported.

【０００７】ところで、近年の遺伝子研究の研究対象と
して、ヒト・ゲノムに代表されるような、巨大ＤＮＡを
取り扱うようになってきた。かかる場合、ＤＮＡを比較
的大きい断片とする方が取扱い易い。そのため、ＤＮＡ
を大きく切断する多塩基認識、またはレア・カッターと
称されるエンドヌクレアーゼの開発、提供が必要になっ
てきた。一方、最近、ミトコンドリア、クロロプラス
ト、Ｔ偶数ファージの遺伝子にはイントロン（介在配
列）が存在し、そのイントロン（介在配列）がエンドヌ
クレアーゼをコードしていることが報告されるようにな
った。これらイントロンのコードするエンドヌクレアー
ゼは一般的にレア・カッターであり、ＤＮＡを大きく切
断することが知られている。従って、色々な切断様式の
異なるイントロンのコードするエンドヌクレアーゼが切
望されている。[0007] By the way, as a research target of recent gene research, huge DNA represented by human genome has come to be handled. In such a case, it is easier to handle the DNA into relatively large fragments. Therefore, DNA
It has become necessary to develop and provide an endonuclease called a rare cutter, which recognizes a large number of nucleotides that greatly cleaves. On the other hand, recently, it has been reported that genes of mitochondria, chloroplasts, and T-even phages have introns (intervening sequences), and the introns (intervening sequences) encode endonucleases. The endonucleases encoded by these introns are generally rare cutters and are known to largely cut DNA. Therefore, there is a strong demand for endonucleases encoded by introns having different cleavage patterns.

【０００８】[0008]

【発明が解決しようとする課題】本発明は従来公知のイ
ントロンのコードするエンドヌクレアーゼのいずれとも
異なる切断様式を示すイントロンのコードするエンドヌ
クレアーゼを提供するものである。DISCLOSURE OF THE INVENTION The present invention provides an intron-encoded endonuclease which exhibits a cleavage mode different from any of the conventionally known intron-encoded endonucleases.

【０００９】[0009]

【課題を解決するための手段】すなわち本発明は次の二
本鎖ＤＮＡ配列の矢印で示した箇所で切断し、ＣＴＡ
Ｃ、またはその相補鎖においては、ＧＴＡＧの４塩基の
３’突出の切断部位を生成するエンドヌクレアーゼ２で
ある。具体例としては超好熱始原菌、例えばパイロコッカス・
フリオサス(Pyrococcus furiosus）ＫＯＤ１株から調製
されたエンドヌクレアーゼ２がある。また超好熱始原
菌、パイロコッカス・フリオサス(Pyrococcus furiosu
s）ＫＯＤ１株由来の遺伝子を挿入した発現ベクターで
形質転換された組換え宿主細胞を用いて生産されエンド
ヌクレアーゼ２がある。本発明のエンドヌクレアーゼ２
は配列表・配列番号３に記載されるアミノ酸配列を含有
することが好ましい。これらのエンドヌクレアーゼ２は
分子量が約６２Ｋｄａである。[Means for Solving the Problems] That is, according to the present invention, the CTA is cleaved at a position indicated by an arrow in the following double-stranded DNA sequence.
In C, or its complementary strand, it is endonuclease 2 which produces a cleavage site for the 4'3 'overhang of GTAG. As a specific example, a hyperthermophilic archaeon, such as Pyrococcus
There is an endonuclease 2 prepared from Pyrococcus furiosus strain KOD1. In addition, a hyperthermophilic archaeon, Pyrococcus furiosu
s) Endonuclease 2 is produced using a recombinant host cell transformed with an expression vector into which a gene derived from the KOD1 strain has been inserted. Endonuclease 2 of the present invention
Preferably contains the amino acid sequence set forth in SEQ ID NO: 3 in the Sequence Listing. These endonucleases 2 have a molecular weight of about 62 Kda.

【００１０】また本発明は上記エンドヌクレアーゼ２を
コードする単離されたＤＮＡであり、具体的には配列表
・配列番号３に記載されるアミノ酸配列をコードする塩
基配列を含有する。また該ＤＮＡは配列表・配列番号２
に記載される塩基配列を含有することが好ましい。The present invention is also an isolated DNA encoding the above-mentioned endonuclease 2, and specifically contains a base sequence encoding the amino acid sequence set forth in SEQ ID NO: 3 in the Sequence Listing. Further, the DNA has the sequence listing, SEQ ID NO: 2
It preferably contains the nucleotide sequence described in 1.

【００１１】本発明は上記エンドヌクレアーゼ２をコー
ドする単離されたＤＮＡをベクターに挿入したＤＮＡ組
換えベクターである。The present invention is a DNA recombinant vector in which the isolated DNA encoding the above-mentioned endonuclease 2 is inserted into the vector.

【００１２】本発明はまた上記エンドヌクレアーゼ２を
コードする単離されたＤＮＡを発現ベクターに挿入した
ＤＮＡ組換え発現ベクターである。The present invention is also a DNA recombinant expression vector in which the isolated DNA encoding the above-mentioned endonuclease 2 is inserted into the expression vector.

【００１３】また本発明はエンドヌクレアーゼ２をコー
ドするＤＮＡを発現ベクターに挿入したＤＮＡ組換え発
現ベクターを用いて形質転換された組換え宿主細胞であ
る。The present invention is also a recombinant host cell transformed with a DNA recombinant expression vector in which a DNA encoding endonuclease 2 is inserted into the expression vector.

【００１４】さらに本発明はエンドヌクレアーゼ２をコ
ードするＤＮＡをベクターに挿入したＤＮＡ組換え発現
ベクターを用いて宿主細胞を形質転換し、得られた組換
え宿主細胞を培養し、培養物からエンドヌクレアーゼ２
を採取することを特徴とするエンドヌクレアーゼ２の製
造方法である。Further, according to the present invention, a host cell is transformed with a DNA recombinant expression vector in which a DNA encoding endonuclease 2 is inserted into the vector, the obtained recombinant host cell is cultured, and the endonuclease is removed from the culture. Two
Is a method for producing the endonuclease 2.

【００１５】また本発明は下記工程を含むことを特徴と
するエンドヌクレアーゼ２の精製方法である。（ａ）エンドヌクレアーゼ２をコードするＤＮＡを発現
ベクターに挿入したＤＮＡ組換え発現ベクターを用いて
形質転換した組換え宿主細胞を培養する。（ｂ）組換え宿主細胞を集めた後、破砕し、細胞抽出物
を調製する。（ｃ）宿主細胞由来の不純蛋白質を除去する工程。The present invention also provides a method for purifying endonuclease 2 which comprises the following steps. (A) A recombinant host cell transformed with a DNA recombinant expression vector in which a DNA encoding endonuclease 2 is inserted into an expression vector is cultured. (B) The recombinant host cells are collected and then crushed to prepare a cell extract. (C) A step of removing the impure protein derived from the host cell.

【００１６】本発明の遺伝子起源として使用した超好熱
始原菌の１種であるパイロコッカス・フリオサスＫＯＤ
１株は、鹿児島県小宝島の硫気抗から単離した菌株であ
る。該菌株の菌学的性質を以下に記載する。細胞形態球菌・二連球菌、鞭毛あり生育温度範囲６５〜１００℃ 最適生育温度９５℃ 生育ｐＨ範囲５〜９最適ｐＨ６最適塩濃度２〜３％栄養要求性従属栄養酸素要求性嫌気性細胞膜脂質エーテル型ＤＮＡのＧＣ含量３８％Pyrococcus furiosus KOD, which is one of the hyperthermophilic archaeon used as the gene source of the present invention
One strain is a strain isolated from sulfur gas turbine of Kotakarajima, Kagoshima Prefecture. The mycological properties of the strain are described below. Cell morphology Staphylococcus, dicocci, with flagella Growth temperature range 65-100 ° C Optimal growth temperature 95 ° C Growth pH range 5-9 Optimum pH 6 Optimum salt concentration 2-3% auxotrophy Heterotrophic oxygen demand Anaerobic cell membrane lipid GC content of ether type DNA 38%

【００１７】超好熱始原菌・パイロコッカス・フリオサ
スＫＯＤ１株は、直径約１μｍの球菌であり、複数の極
鞭毛を有していた。この菌株は、菌学的性質よりＰｆｕ
ＤＮＡポリメラーゼ生産菌(Pyrococcus furiosus）、
およびＴｌｉ（Ｖｅｎｔ）ＤＮＡポリメラーゼ生産菌(T
hermococcus litoralis)との菌縁関係が示唆された。The hyperthermophilic archaeon Pyrococcus furiosus KOD1 strain is a coccus having a diameter of about 1 μm and had a plurality of polar flagella. Due to the mycological properties, this strain is Pfu
DNA polymerase-producing bacterium (Pyrococcus furiosus),
And Tli (Vent) DNA polymerase producing bacteria (T
A relationship with hermococcus litoralis was suggested.

【００１８】本発明のエンドヌクレアーゼ２の遺伝子の
クローニングは、以下の方法により行う。超好熱始原菌
の一種、サーモコッカス・リトラリス（Thermococcus l
itoralis) はそのＤＮＡポリメラーゼ遺伝子内にイント
ロンを有しており、そのイントロンがエンドヌクレアー
ゼをコードしていることが報告されている（Francine B
Perler ら、Proc.Natl.Acad.Sci.,USA 1992) 。超好熱
始原菌であるパイロコッカス・フリオサス（Pyrococcus
furiosus)ＫＯＤ１株が、そのＤＮＡポリメラーゼ遺伝
子内にイントロンを有し、そのイントロンがエンドヌク
レアーゼをコードしているかを調べるために、まず該菌
のＤＮＡポリメラーゼ遺伝子を取得する。そのため、イ
ントロンの存在が報告されていないが、既知である同種
のパイロコッカス・フリオサス（Pyrococcus furiosus)
由来のＰｆｕ・ＤＮＡポリメラーゼの保存領域のアミノ
酸配列に基づき、プライマーを設計し合成する（例えば
配列番号４，５参照）。The cloning of the endonuclease 2 gene of the present invention is carried out by the following method. A type of hyperthermophilic archaeon, Thermococcus l
itoralis) has an intron in its DNA polymerase gene, and it has been reported that the intron encodes an endonuclease (Francine B
Perler et al., Proc.Natl.Acad.Sci., USA 1992). A hyperthermophilic archaeon, Pyrococcus
furiosus) KOD1 strain has an intron in its DNA polymerase gene, and in order to investigate whether the intron encodes an endonuclease, first, the DNA polymerase gene of the bacterium is obtained. Therefore, the presence of introns has not been reported, but the known homologous Pyrococcus furiosus
A primer is designed and synthesized based on the amino acid sequence of the conserved region of the derived Pfu DNA polymerase (see, for example, SEQ ID NOS: 4 and 5).

【００１９】まず超好熱始原菌ＫＯＤ１株の染色体ＤＮ
Ａを鋳型に、上記方法にて調製したプライマーを用いて
ＰＣＲ反応を行い、ＤＮＡ断片を増幅させる。増幅され
たＤＮＡ断片のＤＮＡ配列を決定し、当初設定したアミ
ノ酸配列をコードしていることを確認する。その後、該
ＤＮＡ断片をプローブとし、ＫＯＤ１株の染色体の制限
酵素分解産物に対し、サザンハイブリダイゼーションを
実施する。目的とするＤＮＡポリメラーゼ遺伝子を含む
断片のおおよその大きさを限定する（約４〜７Ｋｂ
ｐ）。First, the chromosome DN of the hyperthermophilic archaeon KOD1 strain
A PCR is carried out using A as a template and the primer prepared by the above method to amplify the DNA fragment. The DNA sequence of the amplified DNA fragment is determined to confirm that it encodes the initially set amino acid sequence. Then, Southern hybridization is carried out on the restriction enzyme degradation product of the chromosome of the KOD1 strain using the DNA fragment as a probe. Limit the approximate size of the fragment containing the DNA polymerase gene of interest (approximately 4-7 Kb
p).

【００２０】更に限定された４〜７ＫｂｐのＤＮＡ断片
をゲルから回収し、これを用いて、大腸菌にてＤＮＡラ
イブラリーを作製し、上記記載のＰＣＲ増幅ＤＮＡ断片
をプローブにしてコロニーハイブリダイゼーションを行
い、目的ＤＮＡ断片を含有するクローン株を取得する。Further, a limited DNA fragment of 4 to 7 Kbp was recovered from the gel, and using this, a DNA library was prepared in Escherichia coli, and colony hybridization was carried out using the PCR amplified DNA fragment described above as a probe. , Obtain a clone strain containing the target DNA fragment.

【００２１】クローン化したＫＯＤ１株由来のＤＮＡポ
リメラーゼ遺伝子を解析したところ、該遺伝子は５０１
０塩基（推定アミノ酸配列１６７０個）から構成されて
いた（配列表・配列番号１参照）。他のＤＮＡポリメラ
ーゼと比較したところ、該遺伝子には真核生物型である
α−ＤＮＡポリメラーゼの保存領域、Ｒｅｇｉｏｎ１〜
５が存在していた。また該遺伝子のＮ末端側に３’→
５’エキソヌクレアーゼモチーフであるＥＸＯ１〜３が
存在していた。超好熱始原菌ＫＯＤ１株由来の耐熱性Ｄ
ＮＡポリメラーゼ遺伝子の保存領域、Ｒｅｇｉｏｎ１、
２の内には、既知のパイロコッカス・フリオサス（Pyro
coccus friosus）と異なり、各々イントロン（介在配
列）、ＩＶＳ−Ａ，ＩＶＳ−Ｂが存在している。これら
の介在配列はオープンリーディングフレーム（ＯＲＦ）
を保存する形でつながっている。When the DNA polymerase gene derived from the cloned KOD1 strain was analyzed, it was found that the gene was 501.
It was composed of 0 bases (estimated amino acid sequence 1670) (see Sequence Listing, SEQ ID NO: 1). When compared with other DNA polymerases, the gene contains a conserved region of α-DNA polymerase that is a eukaryotic type, Region 1 to Region 1.
There were five. In addition, 3 '→ N-terminal side of the gene
Exo 1-3, which is the 5'exonuclease motif, was present. Heat resistance D derived from hyperthermophilic archaeon KOD1 strain
Conserved region of NA polymerase gene, Region1,
Among the two, known Pyrococcus furiosus (Pyro
Unlike coccus friosus), introns (intervening sequences), IVS-A and IVS-B are present respectively. These intervening sequences are open reading frames (ORFs)
Are connected in the form of saving.

【００２２】超好熱始原菌ＫＯＤ１株の耐熱性ＤＮＡポ
リメラーゼ遺伝子を、既知酵素であるパイロコッカス・
フリオサス（Pyrococcus furiosus)由来のＰｆｕＤＮ
Ａポリメラ−ゼ遺伝子、及びサーモコッカス・リトラリ
ス（Thermococcus litoralis）由来のＴｌｉ（Ｖｅｎ
ｔ）ＤＮＡポリメラーゼ遺伝子と比較したところ、ＫＯ
Ｄ１株由来の遺伝子には介在配列、ＩＶＳ−Ａ、ＩＶＳ
−Ｂが存在するが、ＰｆｕＤＮＡポリメラーゼの遺伝
子には介在配列は存在せず、またＴｌｉＤＮＡポリメ
ラーゼ遺伝子には、２種の介在配列が存在するものの、
その存在箇所は各々保存領域であるＲｅｇｉｏｎ２、３
の内であり、本発明のＫＯＤ１株の耐熱性ＤＮＡポリメ
ラーゼ遺伝子内の介在配列の位置とは大きく異なってい
る。The thermostable DNA polymerase gene of the hyperthermophilic archaeon KOD1 strain is derived from the known enzyme Pyrococcus.
Pfu DN from Furiosus (Pyrococcus furiosus)
A polymerase gene and Tli (Ven from Thermococcus litoralis)
t) When compared with the DNA polymerase gene, KO
Genes derived from strain D1 contain intervening sequences, IVS-A, IVS
-B is present, but the Pfu DNA polymerase gene has no intervening sequence, and the Tli DNA polymerase gene has two intervening sequences,
The existence locations are Regions 2 and 3 which are storage areas, respectively.
Which is significantly different from the position of the intervening sequence in the thermostable DNA polymerase gene of the KOD1 strain of the present invention.

【００２３】超好熱始原菌ＫＯＤ１株のＤＮＡポリメラ
ーゼ遺伝子が二つのイントロンを有し、それらがエンド
ヌクレアーゼをコードしていることが確認される。これ
らのイントロン由来のエンドヌクレアーゼを大腸菌で発
現させるため、配列表・配列番号１の１３７４〜２４５
３ｂｐ（ＩＶＳ−Ａ）、２７０８〜４３１６ｂｐ（ＩＶ
Ｓ−Ｂ）の介在配列をＰＣＲ遺伝子融合法によりそれぞ
れ取り除き、一方のイントロンのみを含有する遺伝子を
構築する。具体的には、介在配列を含むクローン化した
遺伝子を３組のプライマー（例えば、配列番号８〜１３
参照）の組み合わせによりＰＣＲ反応を行い、二つのイ
ントロンのうちどちらか一方のイントロンを含む２断片
を増幅する。ここで使用するプライマーを設計する際、
その末端に結合すべき断片の一部をその５’端に含ませ
ておく。次いで、結合すべき断片同士を用いてその末端
の重複する配列を利用してＰＣＲ反応を行い、各々断片
を結合する。次いで、Ｔ７プロモーターで誘導発現が可
能なプラスミドベクター、例えばｐＥＴ−８ｃにクロ−
ニングする。更に、この組換えプラスミドにて宿主細
胞、例えば大腸菌を形質転換し、この組換え大腸菌にて
ＫＯＤ１株イントロン由来のエンドヌクレアーゼ遺伝子
を誘導発現させる。It is confirmed that the DNA polymerase gene of the hyperthermophilic archaeon KOD1 strain has two introns and they encode an endonuclease. In order to express these intron-derived endonucleases in Escherichia coli, 1374 to 245 of Sequence Listing
3 bp (IVS-A), 2708-4316 bp (IV
The intervening sequence of S-B) is removed by the PCR gene fusion method to construct a gene containing only one intron. Specifically, the cloned gene containing the intervening sequence was labeled with three sets of primers (eg, SEQ ID NOs: 8-13).
PCR reaction is carried out by the combination of (see) and two fragments containing one of the two introns are amplified. When designing the primers used here,
A part of the fragment to be ligated to the end is included at the 5'end. Next, the fragments to be ligated are ligated to each other by PCR using the overlapping sequences at their ends. Then, a plasmid vector capable of inducible expression with the T7 promoter, such as pET-8c, was cloned into
To synchronize. Furthermore, a host cell such as Escherichia coli is transformed with this recombinant plasmid, and the endonuclease gene derived from the KOD1 strain intron is induced and expressed in this recombinant E. coli.

【００２４】本発明のエンドヌクレアーゼ２をコードす
るＤＮＡは具体的には配列表・配列番号３に記載される
アミノ酸配列をコードする塩基配列を含有する。さらに
配列表・配列番号２に記載される塩基配列を含有するこ
とが好ましい。これらのＤＮＡはエンドヌクレアーゼ２
活性を有する酵素をコードするかぎり、ＤＮＡの一部が
削除または置換されてもよい。またＤＮＡに他のＤＮＡ
が挿入されてもよい。本発明のエンドヌクレアーゼ２を
コードするＤＮＡのクローニング法は前記した通りであ
る。ＤＮＡの調製法はこれらのクローニング法に限ら
ず、IVS-A またはIVS-B のみを含有するDNA 断片を適当
な制限酵素で切り出し、またIVS-A またはIVS-B のみを
PCR で増幅させる方法などがある。The DNA encoding the endonuclease 2 of the present invention specifically contains a nucleotide sequence encoding the amino acid sequence shown in Sequence Listing / SEQ ID NO: 3. Further, it preferably contains the nucleotide sequence shown in Sequence Listing / SEQ ID NO: 2. These DNAs are endonuclease 2
Part of the DNA may be deleted or replaced as long as it encodes an active enzyme. In addition to DNA other DNA
May be inserted. The method for cloning the DNA encoding the endonuclease 2 of the present invention is as described above. The method for preparing DNA is not limited to these cloning methods, but a DNA fragment containing only IVS-A or IVS-B is cut out with an appropriate restriction enzyme, and only IVS-A or IVS-B is excised.
There are methods such as PCR amplification.

【００２５】本発明の組換えベクターは上記ＤＮＡをベ
クターに挿入したものである。ベクターとしては、ファ
ージおよびプラスミドが挙げられる。ファージの例とし
てはM13 系ベクター、λgt10、λgt11、λ-DASH 、λZA
P-IIなどが挙げられる。プラスミドの例としてはpUC18
、pBR322、pBluescript 、pSP 、pGW などが挙げられ
る。また本発明の組換え発現ベクターは上記ＤＮＡを発
現ベクターに挿入したものである。発現ベクターとして
は、ファージおよびプラスミドが挙げられる。ファージ
の例としてはλgt11、λZAP-IIなどが挙げられる。プラ
スミドの例としてはpUC18 、pBluescript 、pET-8Cなど
のpET 系が挙げられる。ベクターへの挿入法は、従来公
知の方法に従う。例えば挿入遺伝子同端の切断形状と相
補的な切断を行う制限酵素で上述のようなベクターを切
断した後、遺伝子を挿入し、ライゲース (連結酵素) を
用いて結合する。The recombinant vector of the present invention is obtained by inserting the above DNA into a vector. Vectors include phages and plasmids. Examples of phages are M13-based vectors, λgt10, λgt11, λ-DASH, λZA
P-II and the like. An example of a plasmid is pUC18
, PBR322, pBluescript, pSP, pGW, etc. The recombinant expression vector of the present invention is one in which the above DNA is inserted into an expression vector. Expression vectors include phages and plasmids. Examples of phage include λgt11, λZAP-II and the like. Examples of plasmids include pUC18, pBluescript, pET systems such as pET-8C. The method for inserting into a vector is in accordance with a conventionally known method. For example, the above vector is cleaved with a restriction enzyme that cuts complementary to the cut shape of the same end of the inserted gene, and then the gene is inserted and ligated using ligase (ligase).

【００２６】さらに本発明の組換え宿主細胞は上記ＤＮ
Ａ組換え発現ベクターを用いて形質転換されたものであ
る。宿主細胞としては、大腸菌、バチルス属、例えばバ
チルス・ズブチルス、各種のシュードモナス属細菌など
が挙げられる。形質導入法は、従来公知の方法に従う。
例えばファージ感染法あるいは各細胞のコンピテントセ
ルを用いる。また電気穿孔法によってＤＮＡを導入する
こともできる。Further, the recombinant host cell of the present invention is the above DN
It was transformed with the A recombinant expression vector. Examples of the host cell include Escherichia coli, Bacillus, such as Bacillus subtilis, and various Pseudomonas bacteria. The transduction method follows a conventionally known method.
For example, a phage infection method or competent cells of each cell is used. DNA can also be introduced by electroporation.

【００２７】本発明のエンドヌクレアーゼ２の製造方法
は、エンドヌクレアーゼ２をコ−ドするＤＮＡを発現ベ
クターに挿入したＤＮＡ組換え発現ベクターを用いて宿
主細胞を形質転換し、得られた組換え宿主細胞を培養
し、培養物からエンドヌクレア−ゼ２を採取する方法で
ある。具体例としては、ＫＯＤ１株由来の一つのイント
ロンを含む遺伝子を含むＤＮＡ組換え発現ベクター、例
えばｐＥＴ−８ｃプラスミドにより形質転換された宿主
細胞、例えば大腸菌を培地で培養し、誘導処理後に菌体
を遠心分離等にて回収する。回収した菌体は、適当な緩
衝液に懸濁後破砕し、熱処理を施し不純蛋白質の除去を
行う。The method for producing the endonuclease 2 of the present invention comprises the steps of transforming a host cell with a DNA recombinant expression vector in which a DNA encoding the endonuclease 2 is inserted into the expression vector, and obtaining the recombinant host This is a method of culturing cells and collecting endonuclease 2 from the culture. As a specific example, a DNA recombinant expression vector containing a gene containing one intron derived from the KOD1 strain, for example, a host cell transformed with a pET-8c plasmid, for example, Escherichia coli, is cultured in a medium, and cells are treated after induction treatment. Collect by centrifugation, etc. The collected cells are suspended in an appropriate buffer, crushed, and then heat-treated to remove impure proteins.

【００２８】本発明のエンドヌクレアーゼ２の精製法
は、下記工程を含む。（ａ）エンドヌクレアーゼ２をコードするＤＮＡを発現
ベクターに挿入したＤＮＡ組換え発現ベクターを用いて
形質転換した組換え宿主細胞を培養する。（ｂ）組換え宿主細胞を集めた後、破砕し、細胞抽出物
を調製する。（ｃ）宿主細胞由来の不純蛋白質を除去する。The method for purifying endonuclease 2 of the present invention comprises the following steps. (A) A recombinant host cell transformed with a DNA recombinant expression vector in which a DNA encoding endonuclease 2 is inserted into an expression vector is cultured. (B) The recombinant host cells are collected and then crushed to prepare a cell extract. (C) The impure protein derived from the host cell is removed.

【００２９】培地としては宿主細胞により、それぞれ異
なるが、例えばLB培地、Y 培地、2YT 培地、TB培地など
がよく用いられる。培養条件としては宿主細胞、使用培
地により、それぞれ異なるが、例えば約24時間以内で最
大培養力価を示すような条件であればよい。誘導処理と
しては、物理的条件の変化、例えば温度の上昇または下
降、光の照射等または化学処理、例えば糖の添加、イソ
プロピルチオ- β-D-ガラクトシドの添加等によってお
こなうことができる。菌体を回収する方法としては、遠
心分離、濾過などが用いられる。菌体の破砕方法として
は、物理的破砕法として、ホモジナイザー、超音波処
理、ダイノミル、フレンチプレンス等、化学処理法とし
て、界面活性剤、例えばSDS 、酵素、たとえばリゾチー
ム等で処理する方法がある。熱処理条件は７０℃以上、
好ましくは９０℃以上である。The medium to be used varies depending on the host cells, but for example, LB medium, Y medium, 2YT medium, TB medium and the like are often used. The culture conditions differ depending on the host cell and the medium used, but may be any conditions that show the maximum culture titer within about 24 hours, for example. The induction treatment can be carried out by changing physical conditions such as temperature increase or decrease, light irradiation or the like or chemical treatment such as sugar addition or isopropylthio-β-D-galactoside addition. Centrifugation, filtration or the like is used as a method for collecting the bacterial cells. As a method for crushing bacterial cells, there is a method of treating with a homogenizer, ultrasonic treatment, dynomill, French presence, etc. as a physical disruption method, and with a surfactant such as SDS, an enzyme such as lysozyme as a chemical treatment method. . The heat treatment conditions are 70 ° C or higher,
It is preferably 90 ° C. or higher.

【００３０】このようにして取得したエンドヌクレアー
ゼ２は分子量が約６２ＫＤａである。該エンドヌクレア
ーゼ２は次の二本鎖ＤＮＡ配列の矢印で示した箇所で切
断し、ＣＴＡＣ、またはその相補鎖においては、ＧＴＡ
Ｇの４塩基の３’突出の切断部位を生成するエンドヌク
レアーゼ２であることが確認された。 The endonuclease 2 thus obtained has a molecular weight of about 62 KDa. The endonuclease 2 cleaves at the position shown by the arrow in the following double-stranded DNA sequence, and in CTAC or its complementary strand, GTA
It was confirmed to be endonuclease 2 which produces a cleavage site of the 4'G 3'overhang.

【００３１】本発明のエンドヌクレアーゼ２は94℃、20
分間の熱処理後も十分にその活性を有し、図２に示され
るように熱処理後も酵素タンパクの存在は確認され、耐
熱性であることが示された。The endonuclease 2 of the present invention is 94 ° C., 20
It had sufficient activity even after heat treatment for a minute, and as shown in FIG. 2, the presence of the enzyme protein was confirmed even after heat treatment, indicating that it was thermostable.

【００３２】[0032]

【発明の効果】本発明のエンドヌクレアーゼ２は、高い
熱安定性を有し、レア・カッターであり、ＤＮＡを大き
く切断することに適した新規な酵素である。INDUSTRIAL APPLICABILITY The endonuclease 2 of the present invention has a high thermostability, is a rare cutter, and is a novel enzyme suitable for largely cutting DNA.

【００３３】[0033]

【実施例】次に本発明を実施例を用いて説明する。実施例１超好熱始原菌、パイロコッカス・フリオサス(Pyrococcu
s furiosus）ＫＯＤ１株由来のＤＮＡポリメラーゼ遺伝
子のクロ−ニング鹿児島県小宝島より単離した超好熱始原菌ＫＯＤ１株を
９５℃にて培養後、菌体を回収した。得られた菌体よ
り、常法に従い、超好熱始原菌ＫＯＤ１株の染色体ＤＮ
Ａを調製した。この調製した染色体ＤＮＡを鋳型に、パ
イロコッカス・フリオサス（Pyrococcus furiosus)由来
のＤＮＡポリメラーゼ（Ｐｆｕポリメラーゼ）をコード
する塩基配列に基づき設計・合成した２種のプライマー
（配列番号４，５）を用いて、ＰＣＲを行った。EXAMPLES The present invention will be described below with reference to examples. Example 1 Pyrococcus furiosus (Pyrococcu)
Cloning of a DNA polymerase gene derived from S. furiosus) KOD1 strain The hyperthermophilic archaeon KOD1 strain isolated from Kotakarajima, Kagoshima Prefecture was cultured at 95 ° C., and then the bacterial cells were recovered. Chromosomal DN of the hyperthermophilic archaeon KOD1 strain is obtained from the obtained bacterial cells according to a conventional method.
A was prepared. Using the prepared chromosomal DNA as a template, two kinds of primers (SEQ ID NOs: 4 and 5) designed and synthesized based on the nucleotide sequence encoding the DNA polymerase (Pfu polymerase) derived from Pyrococcus furiosus were used. , PCR was performed.

【００３４】このＰＣＲ増幅ＤＮＡ断片の塩基配列（配
列番号６）を決定し、アミノ酸配列（配列番号７）を決
定した後、この増幅断片をプローブとして、ＫＯＤ１株
染色体ＤＮＡ制限酵素処理産物に対しサザンハイブリダ
イゼーションを行い、ＤＮＡポリメラーゼをコードする
断片のサイズを求めた（約４〜７Ｋｂｐ）。The nucleotide sequence (SEQ ID NO: 6) of this PCR amplified DNA fragment was determined, and the amino acid sequence (SEQ ID NO: 7) was determined. Then, this amplified fragment was used as a probe for Southern digestion of the KOD1 strain chromosomal DNA restriction enzyme treated product. Hybridization was performed to determine the size of the fragment encoding the DNA polymerase (about 4-7 Kbp).

【００３５】更に、この大きさのＤＮＡ断片をアガロー
スゲルから回収し、プラスミドｐＢＳに挿入し、これら
の混合物により大腸菌(E.coli JM109)を形質転換し、ラ
イブラリ−を作製した。先にサザンハオブリダイゼーシ
ョンで使用したプローブを用いて、コロニーハイブリダ
イゼーションを行い、ライブラリーより、ＫＯＤ１株由
来のＤＮＡポリメラーゼ遺伝子を含有すると考えられる
クローン株（E.coli JM109/pBSKOD1）を取得した。Further, a DNA fragment of this size was recovered from an agarose gel, inserted into plasmid pBS, and E. coli (E. coli JM109) was transformed with the mixture of these to prepare a library. Colony hybridization was performed using the probe previously used in Southern hybridization, and a clone strain (E.coli JM109 / pBSKOD1) considered to contain the DNA polymerase gene derived from the KOD1 strain was obtained from the library.

【００３６】実施例２クローンされたＤＮＡ断片の塩基配列の決定実施例１で取得したクローン株、E.coli JM109/pBSKOD1
よりプラスミドpBSKOD1 を回収し、常法に従い塩基配列
の決定を行った (配列番号１）。更に、求められた塩基
配列よりアミノ酸配列を推定した（配列番号１）。ＫＯ
Ｄ１株由来のＤＮＡポリメラーゼ遺伝子は、５０１０塩
基からなり、１６７０個のアミノ酸がコードされてい
た。Example 2 Determination of nucleotide sequence of cloned DNA fragment E. coli JM109 / pBSKOD1 clone strain obtained in Example 1
The plasmid pBSKOD1 was recovered from the above and the nucleotide sequence was determined by a conventional method (SEQ ID NO: 1). Furthermore, the amino acid sequence was deduced from the determined base sequence (SEQ ID NO: 1). KO
The DNA polymerase gene derived from the D1 strain consisted of 5010 bases and encoded 1670 amino acids.

【００３７】実施例３発現組換えプラスミドの構築超好熱始原菌ＫＯＤ１株イントロン由来のエンドヌクレ
アーゼ１、２をそれぞれ発現する遺伝子を作成するた
め、２箇所のイントロン部分（配列番号１、ＩＶＳ−
Ａ：１３７４〜２４５３ｂｐ，ＩＶＳ−Ｂ：２７０８〜
４３１６ｂｐ）をＰＣＲ融合法により取り除いた。この
ＰＣＲ融合法とは、クローン株より回収したプラスミド
を鋳型に、３組のプライマーの組み合わせ（配列番号８
〜１３）で各々ＰＣＲを行い、一方のイントロンを除い
た２断片を増幅する。この際、ＰＣＲに用いるプライマ
ーは、他の断片と結合する側に結合相手と同様な配列が
くるように設計しておく。また、両端には別々の制限酵
素サイト（Ｎ末端側：ＥｃｏＲＶ、Ｃ末端側：ＢａｍＨ
Ｉ）が、創出されるように設計した。次いで、ＰＣＲ増
幅断片中、ＩＶＳ−Ａを含む断片と、Ｃ末端側に位置す
る断片を混合しＰＣＲ反応を各々の断片をプライマーと
して行い、イントロンＩＶＳ−Ａを含む遺伝子断片（ｐ
ｏｌ（△ｉｖｓ−ｂ））を取得した。これはエンドヌク
レアーゼ１をコードする遺伝子を含む。また、同様にＩ
ＶＳ−Ｂを含む断片と、Ｎ末端側に位置する断片を混合
しＰＣＲ反応を各々の断片をプライマーとして行い、イ
ントロンＩＶＳ−Ｂを含む遺伝子断片（ｐｏｌ（△ｉｖ
ｓ−ａ））を取得した。これはエンドヌクレアーゼ２を
コ−ドする遺伝子を含む（配列番号２）。これらの遺伝
子断片のＮ末端にＥｃｏＲＶ、Ｃ末端にＢａｍＨＩサイ
トを有する。Example 3 Construction of Expression Recombinant Plasmid In order to prepare genes respectively expressing endonucleases 1 and 2 derived from the hyperthermophilic archaeon KOD1 strain intron, two intron portions (SEQ ID NO: 1, IVS-
A: 1374 to 2453 bp, IVS-B: 2708 to
4316bp) was removed by the PCR fusion method. This PCR fusion method is a combination of 3 sets of primers (SEQ ID NO: 8) using a plasmid recovered from a clone strain as a template.
~ 13) PCR is carried out to amplify two fragments excluding one intron. At this time, the primers used for PCR are designed so that the sequence similar to that of the binding partner is present on the side that binds to other fragments. Separate restriction enzyme sites on both ends (N-terminal side: EcoRV, C-terminal side: BamH
I) was designed to be created. Then, among the PCR-amplified fragments, a fragment containing IVS-A and a fragment located on the C-terminal side are mixed and PCR reaction is carried out using each fragment as a primer, and a gene fragment containing intron IVS-A (p
ol (Δivs-b)) was obtained. It contains the gene encoding endonuclease 1. Similarly, I
A fragment containing VS-B and a fragment located on the N-terminal side were mixed and PCR was carried out using each fragment as a primer, and a gene fragment containing intron IVS-B (pol (Δiv
s-a)) was obtained. It contains the gene encoding endonuclease 2 (SEQ ID NO: 2). These gene fragments have EcoRV at the N-terminus and BamHI site at the C-terminus.

【００３８】さらに、同遺伝子をＴ７プロモータで誘導
可能な発現ベクターｐＥＴ−８ｃのＥｃｏＲＩ／Ｂａｍ
ＨＩサイト、先に創出した制限酵素サイトを利用しサブ
クローニングし、エンドヌクレアーゼ１を発現する発現
ベクターとしてｐＥＴ−ｐｏｌ（△ｉｖｓ−ｂ）を、エ
ンドヌクレアーゼ２を発現する発現ベクターとしてｐＥ
Ｔ−ｐｏｌ（△ｉｖｓ−ａ）を得た（図１）。Furthermore, EcoRI / Bam of the expression vector pET-8c capable of inducing the gene with the T7 promoter.
Using the HI site and the restriction enzyme site created earlier, subcloning, pET-pol (Δivs-b) as an expression vector expressing endonuclease 1, and pE as an expression vector expressing endonuclease 2
T-pol (Δivs-a) was obtained (FIG. 1).

【００３９】実施例４ＫＯＤ１株イントロン由来のエンドヌクレアーゼ１、２
の発現と精製実施例３で取得した発現組換えベクターｐＥＴ−ｐｏｌ
（△ｉｖｓ−ｂ）及びｐＥＴ−ｐｏｌ（△ｉｖｓ−ａ）
を用いて大腸菌を形質転換し、得られた形質転換体をＴ
Ｂ（Maniatisら、Molecular Cloning: A Laboratory Ma
nnual (1982)）培地で培養し、集菌１時間前にＴ７プロ
モーターの誘導処理をイソプロピルチオ−β-D- ガラク
トシドの添加により行った。培養液より菌体を遠心分離
等により回収し、緩衝液に懸濁後、超音波処理によって
菌体を破砕し、細胞抽出物を得た。更に、宿主細胞由来
の不純蛋白質を除去するために、細胞破砕液を９４℃に
て２０分処理し、宿主由来の不純蛋白質を不溶化した。
不溶画分を遠心分離にて除去し、ＫＯＤ１株イントロン
由来のエンドヌクレアーゼ１、２を得た。Example 4 Endonucleases 1 and 2 derived from KOD1 strain intron
Expression and Purification of Expression Recombinant Expression Vector pET-pol Obtained in Example 3
(Δivs-b) and pET-pol (Δivs-a)
Escherichia coli was transformed with E. coli and the resulting transformant was transformed into T
B (Maniatis et al., Molecular Cloning: A Laboratory Ma
(nnual (1982)) medium, and 1 hour before the harvest, the T7 promoter was induced by the addition of isopropylthio-β-D-galactoside. The cells were recovered from the culture solution by centrifugation or the like, suspended in a buffer solution, and then disrupted by ultrasonication to obtain a cell extract. Further, in order to remove the impure protein derived from the host cell, the cell lysate was treated at 94 ° C. for 20 minutes to insolubilize the impure protein derived from the host.
The insoluble fraction was removed by centrifugation to obtain endonucleases 1 and 2 derived from the KOD1 strain intron.

【００４０】実施例５ＫＯＤ１株イントロン由来エンドヌクレアーゼ１、２の
分子量実施例４で得られたＫＯＤ１株イントロン由来エンドヌ
クレアーゼの分子量をＳＤＳ−ＰＡＧＥ法によって求め
たところ、エンドヌクレアーゼ１、２の分子量はそれぞ
れ約４１ｋＤａ、約６２ｋＤａであった（図２）。Example 5 Molecular Weights of KOD1 Strain Intron-Derived Endonucleases 1 and 2 The molecular weights of the KOD1 strain intron-derived endonucleases obtained in Example 4 were determined by SDS-PAGE. They were about 41 kDa and about 62 kDa, respectively (Fig. 2).

【００４１】ＫＯＤ１株イントロン由来エンドヌクレア
ーゼ１、２の切断形式ＫＯＤ１株イントロン由来エンドヌクレアーゼ１、２
は、λ−ＤＮＡなどを基質としないため、以下のように
基質を作製し、その切断断片の塩基配列を決定すること
により、それぞれの切断形式を決定した（図４）。Cleavage format of KOD1 strain intron-derived endonucleases 1 and 2 KOD1 strain intron-derived endonucleases 1 and 2
Does not use λ-DNA or the like as a substrate, the substrate was prepared as described below, and the cleavage sequence was determined by determining the base sequence of the cleaved fragment (FIG. 4).

【００４２】該エンドヌクレアーゼ１の基質の一つとし
て、実施例３に記述した方法と同様にＰＣＲ融合法によ
りイントロンを含有しないＤＮＡポリメラーゼをコード
する遺伝子断片を構築した。即ち、イントロン（介在配
列）を有するＤＮＡポリメラーゼ遺伝子から、３組のプ
ライマー（配列番号８〜１３）の組み合わせによりＰＣ
Ｒ反応を行い、介在配列により分断される３断片を増幅
した。ここで使用するプライマーを設計する際、その末
端に結合すべき断片の一部をその５’端に含ませておい
た。次いで、結合すべき断片同士を用いてその末端の重
複する配列を利用してＰＣＲ反応を行い、各々断片を結
合した。更に得られた２種の断片を用い同様にＰＣＲ反
応を行い、介在配列を含まないＫＯＤ１株由来のＤＮＡ
ポリメラーゼ遺伝子、ｐｏｌ（△ｉｖｓ−ａ，△ｉｖｓ
−ｂ）を構築した（図３）。得られたｐｏｌ（△ｉｖｓ
−ａ，△ｉｖｓ−ｂ）と、実施例３に示した、ｐｏｌ
（△ｉｖｓ−ａ）を基質として用い、該エンドヌクレア
ーゼ１を作用させた時、いずれにおいてもイントロン
（介在配列）ＩＶＳ−Ａが欠失して融合したＲｅｇｉｏ
ｎ−１の部分で切断された断片を生じ、その断片の塩基
配列より、その切断様式は下記の様に、二本鎖ＤＮＡ配
列の矢印で示した箇所で切断し、ＡＧＡＴ、またはその
相補鎖に於いてはＡＴＣＴの４塩基３’突出の切断部位
を生成する事が判明した。 As one of the substrates for the endonuclease 1, a gene fragment encoding a DNA polymerase containing no intron was constructed by the PCR fusion method as in the method described in Example 3. That is, from a DNA polymerase gene having an intron (intervening sequence), a combination of 3 sets of primers (SEQ ID NOs: 8 to 13)
An R reaction was performed to amplify 3 fragments that were separated by the intervening sequence. When designing the primer used here, a part of the fragment to be bound to the end was included at the 5'end. Then, PCR was carried out by using the fragments to be ligated with each other and utilizing the overlapping sequences at their ends to ligate the fragments. Further, PCR was performed in the same manner using the obtained two kinds of fragments, and the DNA derived from the KOD1 strain containing no intervening sequence.
Polymerase gene, pol (Δivs-a, Δivs
-B) was constructed (Figure 3). The obtained pol (Δivs
-A, Δivs-b) and pol shown in Example 3.
When (Δivs-a) was used as a substrate and the endonuclease 1 was allowed to act, Regio was fused in which the intron (intervening sequence) IVS-A was deleted in all cases.
A fragment cleaved at the n-1 portion was produced, and the fragment was cleaved at the position indicated by the arrow in the double-stranded DNA sequence from the nucleotide sequence of the fragment as shown below, and AGAT, or its complementary strand Was found to generate a cleavage site of 4 bases 3'overhang of ATCT.

【００４３】また、該エンドヌクレアーゼ２に関して
も、同様にしてその切断様式を決定した。即ち、上述し
たｐｏｌ（△ｉｖｓ−ａ，△ｉｖｓ−ｂ）、及び実施例
３で述べたｐｏｌ（△ｉｖｓ−ｂ）を基質としてエンド
ヌクレア−ゼ２を作用させた時、いずれに於いてもイン
トロン（介在配列）ＩＶＳ−Ｂが欠失して融合したＲｅ
ｇｉｏｎ−２の部分で切断された断片を生じ、その断片
の塩基配列よりその切断様式は下記の様に、二本鎖ＤＮ
Ａ配列の矢印で示した箇所で切断し、ＣＴＡＣ、または
その相補鎖においてはＧＴＡＧの４塩基３’突出の切断
部位を生成することが判明した。 Further, the cleavage mode of the endonuclease 2 was also determined in the same manner. That is, when the endonuclease 2 was used as a substrate with the above-mentioned pol (Δivs-a, Δivs-b) and the pol (Δivs-b) described in Example 3, the intron was (Intervening sequence) Re fused with deletion of IVS-B
A fragment cleaved at the portion of gion-2 was produced. Based on the nucleotide sequence of the fragment, the cleavage pattern was as follows:
It was revealed that the cleavage occurred at the position indicated by the arrow in the A sequence, and a cleavage site of 4 bases 3 ′ overhang of GTAG was generated in CTAC or its complementary strand.

【００４４】[0044]

【配列表】配列番号１配列の長さ：５３４２配列の型：核酸（ＤＮＡ）鎖の数：２本鎖配列の種類：ｃＤＮＡ起源：超好熱始原菌株：ＫＯＤ１配列の特徴 156-5165 P CDS 1374-2453 介在配列 2708-4316 介在配列配列 GCTTGAGGGC CTGCGGTTAT GGGACGTTGC AGTTTGCGCC TACTCAAAGA TGCCGGTTTT 60 ATAACGGAGA AAAATGGGGA GCTATTACGA TCTCTCCTTG ATGTGGGGTT TACAATAAAG 120 CCTGGATTGT TCTACAAGAT TATGGGGGAT GAAAG ATG ATC CTC GAC ACT GAC 173 Met Ile Leu Asp Thr Asp 1 5 TAC ATA ACC GAG GAT GGA AAG CCT GTC ATA AGA ATT TTC AAG AAG GAA 221 Tyr Ile Thr Glu Asp Gly Lys Pro Val Ile Arg Ile Phe Lys Lys Glu 10 15 20 AAC GGC GAG TTT AAG ATT GAG TAC GAC CGG ACT TTT GAA CCC TAC TTC 269 Asn Gly Glu Phe Lys Ile Glu Tyr Asp Arg Thr Phe Glu Pro Tyr Phe 25 30 35 TAC GCC CTC CTG AAG GAC GAT TCT GCC ATT GAG GAA GTC AAG AAG ATA 317 Tyr Ala Leu Leu Lys Asp Asp Ser Ala Ile Glu Glu Val Lys Lys Ile 40 45 50 ACC GCC GAG AGG CAC GGG ACG GTT GTA ACG GTT AAG CGG GTT GAA AAG 365 Thr Ala Glu Arg His Gly Thr Val Val Thr Val Lys Arg Val Glu Lys 55 60 65 70 GTT CAG AAG AAG TTC CTC GGG AGA CCA GTT GAG GTC TGG AAA CTC TAC 413 Val Gln Lys Lys Phe Leu Gly Arg Pro Val Glu Val Trp Lys Leu Tyr 75 80 85 TTT ACT CAT CCG CAG GAC GTC CCA GCG ATA AGG GAC AAG ATA CGA GAG 461 Phe Thr His Pro Gln Asp Val Pro Ala Ile Arg Asp Lys Ile Arg Glu 90 95 100 CAT GGA GCA GTT ATT GAC ATC TAC GAG TAC GAC ATA CCC TTC GCC AAG 509 His Gly Ala Val Ile Asp Ile Tyr Glu Tyr Asp Ile Pro Phe Ala Lys 105 110 115 CGC TAC CTC ATA GAC AAG GGA TTA GTG CCA ATG GAA GGC GAC GAG GAG 557 Arg Tyr Leu Ile Asp Lys Gly Leu Val Pro Met Glu Gly Asp Glu Glu 120 125 130 CTG AAA ATG CTC GCC TTC GAC ATT CAA ACT CTC TAC CAT GAG GGC GAG 605 Leu Lys Met Leu Ala Phe Asp Ile Gln Thr Leu Tyr His Glu Gly Glu 135 140 145 150 GAG TTC GCC GAG GGG CCA ATC CTT ATG ATA AGC TAC GCC GAC GAG GAA 653 Glu Phe Ala Glu Gly Pro Ile Leu Met Ile Ser Tyr Ala Asp Glu Glu 155 160 165 GGG GCC AGG GTG ATA ACT TGG AAG AAC GTG GAT CTC CCC TAC GTT GAC 701 Gly Ala Arg Val Ile Thr Trp Lys Asn Val Asp Leu Pro Tyr Val Asp 170 175 180 GTC GTC TCG ACG GAG AGG GAG ATG ATA AAG CGC TTC CTC CGT GTT GTG 749 Val Val Ser Thr Glu Arg Glu Met Ile Lys Arg Phe Leu Arg Val Val 185 190 195 AAG GAG AAA GAC CCG GAC GTT CTC ATA ACC TAC AAC GGC GAC AAC TTC 797 Lys Glu Lys Asp Pro Asp Val Leu Ile Thr Tyr Asn Gly Asp Asn Phe 200 205 210 GAC TTC GCC TAT CTG AAA AAG CGC TGT GAA AAG CTC GGA ATA AAC TTC 845 Asp Phe Ala Tyr Leu Lys Lys Arg Cys Glu Lys Leu Gly Ile Asn Phe 215 220 225 230 GCC CTC GGA AGG GAT GGA AGC GAG CCG AAG ATT CAG AGG ATG GGC GAC 893 Ala Leu Gly Arg Asp Gly Ser Glu Pro Lys Ile Gln Arg Met Gly Asp 235 240 245 AGG TTT GCC GTC GAA GTG AAG GGA CGG ATA CAC TTC GAT CTC TAT CCT 941 Arg Phe Ala Val Glu Val Lys Gly Arg Ile His Phe Asp Leu Tyr Pro 250 255 260 GTG ATA AGA CGG ACG ATA AAC CTG CCC ACA TAC ACG CTT GAG GCC GTT 989 Val Ile Arg Arg Thr Ile Asn Leu Pro Thr Tyr Thr Leu Glu Ala Val 265 270 275 TAT GAA GCC GTC TTC GGT CAG CCG AAG GAG AAG GTT TAC GCT GAG GAA 1037 Tyr Glu Ala Val Phe Gly Gln Pro Lys Glu Lys Val Tyr Ala Glu Glu 280 285 290 ATA ACA CCA GCC TGG GAA ACC GGC GAG AAC CTT GAG AGA GTC GCC CGC 1085 Ile Thr Pro Ala Trp Glu Thr Gly Glu Asn Leu Glu Arg Val Ala Arg 295 300 305 310 TAC TCG ATG GAA GAT GCG AAG GTC ACA TAC GAG CTT GGG AAG GAG TTC 1133 Tyr Ser Met Glu Asp Ala Lys Val Thr Tyr Glu Leu Gly Lys Glu Phe 315 320 325 CTT CCG ATG GAG GCC CAG CTT TCT CGC TTA ATC GGC CAG TCC CTC TGG 1181 Leu Pro Met Glu Ala Gln Leu Ser Arg Leu Ile Gly Gln Ser Leu Trp 330 335 340 GAC GTC TCC CGC TCC AGC ACT GGC AAC CTC GTT GAG TGG TTC CTC CTC 1229 Asp Val Ser Arg Ser Ser Thr Gly Asn Leu Val Glu Trp Phe Leu Leu 345 350 355 AGG AAG GCC TAT GAG AGG AAT GAG CTG GCC CCG AAC AAG CCC GAT GAA 1277 Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala Pro Asn Lys Pro Asp Glu 360 365 370 AAG GAG CTG GCC AGA AGA CGG CAG AGC TAT GAA GGA GGC TAT GTA AAA 1325 Lys Glu Leu Ala Arg Arg Arg Gln Ser Tyr Glu Gly Gly Tyr Val Lys 375 380 385 390 GAG CCC GAG AGA GGG TTG TGG GAG AAC ATA GTG TAC CTA GAT TTT AGA 1373 Glu Pro Glu Arg Gly Leu Trp Glu Asn Ile Val Tyr Leu Asp Phe Arg 395 400 405 TGC CAT CCA GCC GAT ACG AAG GTT GTC GTC AAG GGG AAG GGG ATT ATA 1421 Cys His Pro Ala Asp Thr Lys Val Val Val Lys Gly Lys Gly Ile Ile 410 415 420 AAC ATC AGC GAG GTT CAG GAA GGT GAC TAT GTC CTT GGG ATT GAC GGC 1469 Asn Ile Ser Glu Val Gln Glu Gly Asp Tyr Val Leu Gly Ile Asp Gly 425 430 435 TGG CAG AGA GTT AGA AAA GTA TGG GAA TAC GAC TAC AAA GGG GAG CTT 1517 Trp Gln Arg Val Arg Lys Val Trp Glu Tyr Asp Tyr Lys Gly Glu Leu 440 445 450 GTA AAC ATA AAC GGG TTA AAG TGT ACG CCC AAT CAT AAG CTT CCC GTT 1565 Val Asn Ile Asn Gly Leu Lys Cys Thr Pro Asn His Lys Leu Pro Val 455 460 465 470 GTT ACA AAG AAC GAA CGA CAA ACG AGA ATA AGA GAC AGT CTT GCT AAG 1613 Val Thr Lys Asn Glu Arg Gln Thr Arg Ile Arg Asp Ser Leu Ala Lys 475 480 485 TCT TTC CTT ACT AAA AAA GTT AAG GGC AAG ATA ATA ACC ACT CCC CTT 1661 Ser Phe Leu Thr Lys Lys Val Lys Gly Lys Ile Ile Thr Thr Pro Leu 490 495 500 TTC TAT GAA ATA GGC AGA GCG ACA AGT GAG AAT ATT CCA GAA GAA GAG 1709 Phe Tyr Glu Ile Gly Arg Ala Thr Ser Glu Asn Ile Pro Glu Glu Glu 505 510 515 GTT CTC AAG GGA GAG CTC GCT GGC ATA CTA TTG GCT GAA GGA ACG CTC 1757 Val Leu Lys Gly Glu Leu Ala Gly Ile Leu Leu Ala Glu Gly Thr Leu 520 525 530 TTG AGG AAA GAC GTT GAA TAC TTT GAT TCA TCC CGC AAA AAA CGG AGG 1805 Leu Arg Lys Asp Val Glu Tyr Phe Asp Ser Ser Arg Lys Lys Arg Arg 535 540 545 550 ATT TCA CAC CAG TAT CGT GTT GAG ATA ACC ATT GGG AAA GAC GAG GAG 1853 Ile Ser His Gln Tyr Arg Val Glu Ile Thr Ile Gly Lys Asp Glu Glu 555 560 565 GAG TTT AGG GAT CGT ATC ACA TAC ATT TTT GAG CGT TTG TTT GGG ATT 1901 Glu Phe Arg Asp Arg Ile Thr Tyr Ile Phe Glu Arg Leu Phe Gly Ile 570 575 580 ACT CCA AGC ATC TCG GAG AAG AAA GGA ACT AAC GCA GTA ACA CTC AAA 1949 Thr Pro Ser Ile Ser Glu Lys Lys Gly Thr Asn Ala Val Thr Leu Lys 585 590 595 GTT GCG AAG AAG AAT GTT TAT CTT AAA GTC AAG GAA ATT ATG GAC AAC 1997 Val Ala Lys Lys Asn Val Tyr Leu Lys Val Lys Glu Ile Met Asp Asn 600 605 610 ATA GAG TCC CTA CAT GCC CCC TCG GTT CTC AGG GGA TTC TTC GAA GGC 2045 Ile Glu Ser Leu His Ala Pro Ser Val Leu Arg Gly Phe Phe Glu Gly 615 620 625 630 GAC GGT TCA GTA AAC AGG GTT AGG AGG AGT ATT GTT GCA ACC CAG GGT 2093 Asp Gly Ser Val Asn Arg Val Arg Arg Ser Ile Val Ala Thr Gln Gly 635 640 645 ACA AAG AAC GAG TGG AAG ATT AAA CTG GTG TCA AAA CTG CTC TCC CAG 2141 Thr Lys Asn Glu Trp Lys Ile Lys Leu Val Ser Lys Leu Leu Ser Gln 650 655 660 CTT GGT ATC CCT CAT CAA ACG TAC ACG TAT CAG TAT CAG GAA AAT GGG 2189 Leu Gly Ile Pro His Gln Thr Tyr Thr Tyr Gln Tyr Gln Glu Asn Gly 665 670 675 AAA GAT CGG AGC AGG TAT ATA CTG GAG ATA ACT GGA AAG GAC GGA TTG 2237 Lys Asp Arg Ser Arg Tyr Ile Leu Glu Ile Thr Gly Lys Asp Gly Leu 680 685 690 ATA CTG TTC CAA ACA CTC ATT GGA TTC ATC AGT GAA AGA AAG AAC GCT 2285 Ile Leu Phe Gln Thr Leu Ile Gly Phe Ile Ser Glu Arg Lys Asn Ala 695 700 705 710 CTG CTT AAT AAG GCA ATA TCT CAG AGG GAA ATG AAC AAC TTG GAA AAC 2333 Leu Leu Asn Lys Ala Ile Ser Gln Arg Glu Met Asn Asn Leu Glu Asn 715 720 725 AAT GGA TTT TAC AGG CTC AGT GAA TTC AAT GTC AGC ACG GAA TAC TAT 2381 Asn Gly Phe Tyr Arg Leu Ser Glu Phe Asn Val Ser Thr Glu Tyr Tyr 730 735 740 GAG GGC AAG GTC TAT GAC TTA ACT CTT GAA GGA ACT CCC TAC TAC TTT 2429 Glu Gly Lys Val Tyr Asp Leu Thr Leu Glu Gly Thr Pro Tyr Tyr Phe 745 750 755 GCC AAT GGC ATA TTG ACC CAT AAC TCC CTG TAC CCC TCA ATC ATC ATC 2477 Ala Asn Gly Ile Leu Thr His Asn Ser Leu Tyr Pro Ser Ile Ile Ile 760 765 770 ACC CAC AAC GTC TCG CCG GAT ACG CTC AAC AGA GAA GGA TGC AAG GAA 2525 Thr His Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Lys Glu 775 780 785 790 TAT GAC GTT GCC CCA CAG GTC GGC CAC CGC TTC TGC AAG GAC TTC CCA 2573 Tyr Asp Val Ala Pro Gln Val Gly His Arg Phe Cys Lys Asp Phe Pro 795 800 805 GGA TTT ATC CCG AGC CTG CTT GGA GAC CTC CTA GAG GAG AGG CAG AAG 2621 Gly Phe Ile Pro Ser Leu Leu Gly Asp Leu Leu Glu Glu Arg Gln Lys 810 815 820 ATA AAG AAG AAG ATG AAG GCC ACG ATT GAC CCG ATC GAG AGG AAG CTC 2669 Ile Lys Lys Lys Met Lys Ala Thr Ile Asp Pro Ile Glu Arg Lys Leu 825 830 835 CTC GAT TAC AGG CAG AGG GCC ATC AAG ATC CTG GCA AAC AGC ATC CTA 2717 Leu Asp Tyr Arg Gln Arg Ala Ile Lys Ile Leu Ala Asn Ser Ile Leu 840 845 850 CCC GAG GAA TGG CTT CCA GTC CTC GAG GAA GGG GAG GTT CAC TTC GTC 2765 Pro Glu Glu Trp Leu Pro Val Leu Glu Glu Gly Glu Val His Phe Val 855 860 865 870 AGG ATT GGA GAG CTC ATA GAC CGG ATG ATG GAG GAA AAT GCT GGG AAA 2813 Arg Ile Gly Glu Leu Ile Asp Arg Met Met Glu Glu Asn Ala Gly Lys 875 880 885 GTA AAG AGA GAG GGC GAG ACG GAA GTG CTT GAG GTC AGT GGG CTT GAA 2861 Val Lys Arg Glu Gly Glu Thr Glu Val Leu Glu Val Ser Gly Leu Glu 890 895 900 GTC CCG TCC TTT AAC AGG AGA ACT AAC AAG GCC GAG CTC AAG AGA GTA 2909 Val Pro Ser Phe Asn Arg Arg Thr Asn Lys Ala Glu Leu Lys Arg Val 905 910 915 AAG GCC CTG ATT AGG CAC GAT TAT TCT GGC AAG GTC TAC ACC ATC AGA 2957 Lys Ala Leu Ile Arg His Asp Tyr Ser Gly Lys Val Tyr Thr Ile Arg 920 925 930 CTG AAG TCG GGG AGG AGA ATA AAG ATA ACC TCT GGC CAC AGC CTC TTC 3005 Leu Lys Ser Gly Arg Arg Ile Lys Ile Thr Ser Gly His Ser Leu Phe 935 940 945 950 TCT GTG AGA AAC GGG GAG CTC GTT GAA GTT ACG GGC GAT GAA CTA AAG 3053 Ser Val Arg Asn Gly Glu Leu Val Glu Val Thr Gly Asp Glu Leu Lys 955 960 965 CCA GGT GAC CTC GTT GCA GTC CCG CGG AGA TTG GAG CTT CCT GAG AGA 3101 Pro Gly Asp Leu Val Ala Val Pro Arg Arg Leu Glu Leu Pro Glu Arg 970 975 980 AAC CAC GTG CTG AAC CTC GTT GAA CTG CTC CTT GGA ACG CCA GAA GAA 3149 Asn His Val Leu Asn Leu Val Glu Leu Leu Leu Gly Thr Pro Glu Glu 985 990 995 GAA ACT TTG GAC ATC GTC ATG ACG ATC CCA GTC AAG GGT AAG AAG AAC 3197 Glu Thr Leu Asp Ile Val Met Thr Ile Pro Val Lys Gly Lys Lys Asn 1000 1005 1010 TTC TTT AAA GGG ATG CTC AGG ACT TTG CGC TGG ATT TTC GGA GAG GAA 3245 Phe Phe Lys Gly Met Leu Arg Thr Leu Arg Trp Ile Phe Gly Glu Glu 1015 1020 1025 1030 AAG AGG CCC AGA ACC GCG AGA CGC TAT CTC AGG CAC CTT GAG GAT CTG 3293 Lys Arg Pro Arg Thr Ala Arg Arg Tyr Leu Arg His Leu Glu Asp Leu 1035 1040 1045 GGC TAT GTC CGG CTT AAG AAG ATC GGC TAC GAA GTC CTC GAC TGG GAC 3341 Gly Tyr Val Arg Leu Lys Lys Ile Gly Tyr Glu Val Leu Asp Trp Asp 1050 1055 1060 TCA CTT AAG AAC TAC AGA AGG CTC TAC GAG GCG CTT GTC GAG AAC GTC 3389 Ser Leu Lys Asn Tyr Arg Arg Leu Tyr Glu Ala Leu Val Glu Asn Val 1065 1070 1075 AGA TAC AAC GGC AAC AAG AGG GAG TAC CTC GTT GAA TTC AAT TCC ATC 3437 Arg Tyr Asn Gly Asn Lys Arg Glu Tyr Leu Val Glu Phe Asn Ser Ile 1080 1085 1090 CGG GAT GCA GTT GGC ATA ATG CCC CTA AAA GAG CTG AAG GAG TGG AAG 3485 Arg Asp Ala Val Gly Ile Met Pro Leu Lys Glu Leu Lys Glu Trp Lys 1095 1100 1105 1110 ATC GGC ACG CTG AAC GGC TTC AGA ATG AGA AAG CTC ATT GAA GTG GAC 3533 Ile Gly Thr Leu Asn Gly Phe Arg Met Arg Lys Leu Ile Glu Val Asp 1115 1120 1125 GAG TCG TTA GCA AAG CTC CTC GGC TAC TAC GTG AGC GAG GGC TAT GCA 3581 Glu Ser Leu Ala Lys Leu Leu Gly Tyr Tyr Val Ser Glu Gly Tyr Ala 1130 1135 1140 AGA AAG CAG AGG AAT CCC AAA AAC GGC TGG AGC TAC AGC GTG AAG CTC 3629 Arg Lys Gln Arg Asn Pro Lys Asn Gly Trp Ser Tyr Ser Val Lys Leu 1145 1150 1155 TAC AAC GAA GAC CCT GAA GTG CTG GAC GAT ATG GAG AGA CTC GCC AGC 3677 Tyr Asn Glu Asp Pro Glu Val Leu Asp Asp Met Glu Arg Leu Ala Ser 1160 1165 1170 AGG TTT TTC GGG AAG GTG AGG CGG GGC AGG AAC TAC GTT GAG ATA CCG 3725 Arg Phe Phe Gly Lys Val Arg Arg Gly Arg Asn Tyr Val Glu Ile Pro 1175 1180 1185 1190 AAG AAG ATC GGC TAC CTG CTC TTT GAG AAC ATG TGC GGT GTC CTA GCG 3773 Lys Lys Ile Gly Tyr Leu Leu Phe Glu Asn Met Cys Gly Val Leu Ala 1195 1200 1205 GAG AAC AAG AGG ATT CCC GAG TTC GTC TTC ACG TCC CCG AAA GGG GTT 3821 Glu Asn Lys Arg Ile Pro Glu Phe Val Phe Thr Ser Pro Lys Gly Val 1210 1215 1220 CGG CTG GCC TTC CTT GAG GGG TAC TCA TCG GCG ATG GCG ACG TCC ACC 3869 Arg Leu Ala Phe Leu Glu Gly Tyr Ser Ser Ala Met Ala Thr Ser Thr 1225 1230 1235 GAA CAA GAG ACT CAG GCT CTC AAC GAA AAG CGA GCT TTA GCG AAC CAG 3917 Glu Gln Glu Thr Gln Ala Leu Asn Glu Lys Arg Ala Leu Ala Asn Gln 1240 1245 1250 CTC GTC CTC CTC TTG AAC TCG GTG GGG GTC TCT GCT GTA AAA CTT GGG 3965 Leu Val Leu Leu Leu Asn Ser Val Gly Val Ser Ala Val Lys Leu Gly 1255 1260 1265 1270 CAC GAC AGC GGC GTT TAC AGG GTC TAT ATA AAC GAG GAG CTC CCG TTC 4013 His Asp Ser Gly Val Tyr Arg Val Tyr Ile Asn Glu Glu Leu Pro Phe 1275 1280 1285 GTA AAG CTG GAC AAG AAA AAG AAC GCC TAC TAC TCA CAC GTG ATC CCC 4061 Val Lys Leu Asp Lys Lys Lys Asn Ala Tyr Tyr Ser His Val Ile Pro 1290 1295 1300 AAG GAA GTC CTG AGC GAG GTC TTT GGG AAG GTT TTC CAG AAA AAC GTC 4109 Lys Glu Val Leu Ser Glu Val Phe Gly Lys Val Phe Gln Lys Asn Val 1305 1310 1315 AGT CCT CAG ACC TTC AGG AAG ATG GTC GAG GAC GGA AGA CTC GAT CCC 4157 Ser Pro Gln Thr Phe Arg Lys Met Val Glu Asp Gly Arg Leu Asp Pro 1320 1325 1330 GAA AAG GCC CAG AGG CTC TCC TGG CTC ATT GAG GGG GAC GTA GTG CTC 4205 Glu Lys Ala Gln Arg Leu Ser Trp Leu Ile Glu Gly Asp Val Val Leu 1335 1340 1345 1350 GAC CGC GTT GAG TCC GTT GAT GTG GAA GAC TAC GAT GGT TAT GTC TAT 4253 Asp Arg Val Glu Ser Val Asp Val Glu Asp Tyr Asp Gly Tyr Val Tyr 1355 1360 1365 GAC CTG AGC GTC GAG GAC AAC GAG AAC TTC CTC GTT GGC TTT GGG TTG 4301 Asp Leu Ser Val Glu Asp Asn Glu Asn Phe Leu Val Gly Phe Gly Leu 1370 1375 1380 GTC TAT GCT CAC AAC AGC TAC TAC GGT TAC TAC GGC TAT GCA AGG GCG 4349 Val Tyr Ala His Asn Ser Tyr Tyr Gly Tyr Tyr Gly Tyr Ala Arg Ala 1385 1390 1395 CGC TGG TAC TGC AAG GAG TGT GCA GAG AGC GTA ACG GCC TGG GGA AGG 4397 Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser Val Thr Ala Trp Gly Arg 1400 1405 1410 GAG TAC ATA ACG ATG ACC ATC AAG GAG ATA GAG GAA AAG TAC GGC TTT 4445 Glu Tyr Ile Thr Met Thr Ile Lys Glu Ile Glu Glu Lys Tyr Gly Phe 1415 1420 1425 1430 AAG GTA ATC TAC AGC GAC ACC GAC GGA TTT TTT GCC ACA ATA CCT GGA 4493 Lys Val Ile Tyr Ser Asp Thr Asp Gly Phe Phe Ala Thr Ile Pro Gly 1435 1440 1445 GCC GAT GCT GAA ACC GTC AAA AAG AAG GCT ATG GAG TTC CTC AAC TAT 4541 Ala Asp Ala Glu Thr Val Lys Lys Lys Ala Met Glu Phe Leu Asn Tyr 1450 1455 1460 ATC AAC GCC AAA CTT CCG GGC GCG CTT GAG CTC GAG TAC GAG GGC TTC 4589 Ile Asn Ala Lys Leu Pro Gly Ala Leu Glu Leu Glu Tyr Glu Gly Phe 1465 1470 1475 TAC AAA CGC GGC TTC TTC GTC ACG AAG AAG AAG TAT GCG GTG ATA GAC 4637 Tyr Lys Arg Gly Phe Phe Val Thr Lys Lys Lys Tyr Ala Val Ile Asp 1480 1485 1490 GAG GAA GGC AAG ATA ACA ACG CGC GGA CTT GAG ATT GTG AGG CGT GAC 4685 Glu Glu Gly Lys Ile Thr Thr Arg Gly Leu Glu Ile Val Arg Arg Asp 1495 1500 1505 1510 TGG AGC GAG ATA GCG AAA GAG ACG CAG GCG AGG GTT CTT GAA GCT TTG 4733 Trp Ser Glu Ile Ala Lys Glu Thr Gln Ala Arg Val Leu Glu Ala Leu 1515 1520 1525 CTA AAG GAC GGT GAC GTC GAG AAG GCC GTG AGG ATA GTC AAA GAA GTT 4781 Leu Lys Asp Gly Asp Val Glu Lys Ala Val Arg Ile Val Lys Glu Val 1530 1535 1540 ACC GAA AAG CTG AGC AAG TAC GAG GTT CCG CCG GAG AAG CTG GTG ATC 4829 Thr Glu Lys Leu Ser Lys Tyr Glu Val Pro Pro Glu Lys Leu Val Ile 1545 1550 1555 CAC GAG CAG ATA ACG AGG GAT TTA AAG GAC TAC AAG GCA ACC GGT CCC 4877 His Glu Gln Ile Thr Arg Asp Leu Lys Asp Tyr Lys Ala Thr Gly Pro 1560 1565 1570 CAC GTT GCC GTT GCC AAG AGG TTG GCC GCG AGA GGA GTC AAA ATA CGC 4925 His Val Ala Val Ala Lys Arg Leu Ala Ala Arg Gly Val Lys Ile Arg 1575 1580 1585 1590 CCT GGA ACG GTG ATA AGC TAC ATC GTG CTC AAG GGC TCT GGG AGG ATA 4973 Pro Gly Thr Val Ile Ser Tyr Ile Val Leu Lys Gly Ser Gly Arg Ile 1595 1600 1605 GGC GAC AGG GCG ATA CCG TTC GAC GAG TTC GAC CCG ACG AAG CAC AAG 5021 Gly Asp Arg Ala Ile Pro Phe Asp Glu Phe Asp Pro Thr Lys His Lys 1610 1615 1620 TAC GAC GCC GAG TAC TAC ATT GAG AAC CAG GTT CTC CCA GCC GTT GAG 5069 Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn Gln Val Leu Pro Ala Val Glu 1625 1630 1635 AGA ATT CTG AGA GCC TTC GGT TAC CGC AAG GAA GAC CTG CGC TAC CAG 5117 Arg Ile Leu Arg Ala Phe Gly Tyr Arg Lys Glu Asp Leu Arg Tyr Gln 1640 1645 1650 AAG ACG AGA CAG GTT GGT TTG AGT GCT TGG CTG AAG CCG AAG GGA ACT 5165 Lys Thr Arg Gln Val Gly Leu Ser Ala Trp Leu Lys Pro Lys Gly Thr 1655 1660 1665 1670 TGACCTTTCC ATTTGTTTTC CAGCGGATAA CCCTTTAACT TCCCTTTCAA AAACTCCCTT 5225 TAGGGAAAGA CCATGAAGAT AGAAATCCGG CGGCGCCCGG TTAAATACGC TAGGATAGAA 5285 GTGAAGCCAG ACGGCAGGGT AGTCGTCACT GCCCCGAGGG TTCAACGTTG AGAAGTT 5342[Sequence Listing] SEQ ID NO: 1 Sequence length: 5342 Sequence type: Nucleic acid (DNA) Number of strands: Double-stranded Sequence type: cDNA Origin: Hyperthermophilic archaeal strain: KOD1 Sequence characteristics 156-5165 P CDS 1374-2453 Intervening sequence 2708-4316 Intervening sequence GCTTGAGGGC CTGCGGTTAT GGGACGTTGC AGTTTGCGCC TACTCAAAGA TGCCGGTTTT 60 ATAACGGAGAGA AAAATGGGGA GCTATTACGA TCTCTCCTCT As As GAC ATCACAT GACATle GACTT AGTACTAC GACAATCAGACAG ATCATGACAG ATCAGAAAG GGA AAG CCT GTC ATA AGA ATT TTC AAG AAG GAA 221 Tyr Ile Thr Glu Asp Gly Lys Pro Val Ile Arg Ile Phe Lys Lys Glu 10 15 20 AAC GGC GAG TTT AAG ATT GAG TAC GAC CGG ACT TTT GAA CCC TAC TTC 269 Asn Gly Glu Phe Lys Ile Glu Tyr Asp Arg Thr Phe Glu Pro Tyr Phe 25 30 35 TAC GCC CTC CTG AAG GAC GAT TCT GCC ATT GAG GAA GTC AAG AAG ATA 317 Tyr Ala Leu Leu Lys Asp Asp Ser Ala Ile Glu Glu Val Lys Lys Ile 40 45 50 ACC GCC GAG AGG CAC GGG ACG GTT GTA ACG GTT AAG CGG GTT GAA AAG 365 Thr Ala Glu Arg His Gly Thr Val Val Thr Val Lys Arg Val Glu Lys 55 60 65 70 GTT CAG AAG AAG TTC CTC GGG AGA CCA GTT GAG GTC TGG AAA CTC TAC 413 Val Gln Lys Lys Phe Leu Gly Arg Pro Val Glu Val Trp Lys Leu Tyr 75 80 85 TTT ACT CAT CCG CAG GAC GTC CCA GCG ATA AGG GAC AAG ATA CGA GAG 461 Phe Thr His Pro Gln Asp Val Pro Ala Ile Arg Asp Lys Ile Arg Glu 90 95 100 CAT GGA GCA GTT ATT GAC ATC TAC GAG TAC GAC ATA CCC TTC GCC AAG 509 His Gly Ala Val Ile Asp Ile Tyr Glu Tyr Asp Ile Pro Phe Ala Lys 105 110 115 CGC TAC CTC ATA GAC AAG GGA TTA GTG CCA ATG GAA GGC GAC GAG GAG 557 Arg Tyr Leu Ile Asp Lys Gly Leu Val Pro Met Glu Gly Asp Glu Glu 120 125 130 CTG AAA ATG CTC GCC TTC GAC ATT CAA ACT CTC TAC CAT GAG GGC GAG 605 Leu Lys Met Leu Ala Phe Asp Ile Gln Thr Leu Tyr His Glu Gly Glu 135 140 145 150 GAG TTC GCC GAG GGG CCA ATC CTT ATG ATA AGC TAC GCC GAC GAG GAA 653 Glu Phe Ala Glu Gly Pro Ile Leu Met Ile Ser Tyr Ala Asp Glu Glu 155 160 165 GGG GCC AGG GTG ATA ACT TGG AAG AAC GTG GAT CTC CCC TAC GTT GAC 701 Gly Ala Arg Val Ile Thr Trp Lys Asn Val Asp Leu Pro Tyr Val Asp 170 175 180 GTC GTC TCG ACG GAG AGG GAG ATG ATA AAG CGC TTC CTC CGT GTT GTG 749 Val Val Ser Thr Glu Arg Glu Met Ile Lys Arg Phe Leu Arg Val Val 185 190 195 AAG GAG AAA GAC CCG GAC GTT CTC ATA ACC TAC AAC GGC GAC AAC TTC 797 Lys Glu Lys Asp Pro Asp Val Leu Ile Thr Tyr Asn Gly Asp Asn Phe 200 205 210 GAC TTC GCC TAT CTG AAA AAG CGC TGT GAA AAG CTC GGA ATA AAC TTC 845 Asp Phe Ala Tyr Leu Lys Lys Arg Cys Glu Lys Leu Gly Ile Asn Phe 215 220 225 230 GCC CTC GGA AGG GAT GGA AGC GAG CCG AAG ATT CAG AGG ATG GGC GAC 893 Ala Leu Gly Arg Asp Gly Ser Glu Pro Lys Ile Gln Arg Met Gly Asp 235 240 245 AGG TTT GCC GTC GAA GTG AAG GGA CGG ATA CAC TTC GAT CTC TAT CCT 941 Arg Phe Ala Val Glu Val Lys Gly Arg Ile His Phe Asp Leu Tyr Pro 250 255 260 GTG ATA AGA CGG ACG ATA AAC CTG CCC ACA TAC ACG CTT GAG GCC GTT 989 Val Ile Arg Arg Thr Ile Asn Leu Pro Thr Tyr Thr Leu Glu Ala Val 265 270 275 TAT GAA GCC GTC TTC GGT CAG CCG AAG GAGAAG GTT TAC GCT GAG GAA 1037 Tyr Glu Ala Val Phe Gly Gln Pro Lys Glu Lys Val Tyr Ala Glu Glu 280 285 290 ATA ACA CCA GCC TGG GAA ACC GGC GAG AAC CTT GAG AGA GTC GCC CGC 1085 Ile Thr Pro Ala Trp Glu Thr Gly Glu Asn Leu Glu Arg Val Ala Arg 295 300 305 310 TAC TCG ATG GAA GAT GCG AAG GTC ACA TAC GAG CTT GGG AAG GAG TTC 1133 Tyr Ser Met Glu Asp Ala Lys Val Thr Tyr Glu Leu Gly Lys Glu Phe 315 320 325 CTT CCG ATG GAG GCC CAG CTT TCT CGC TTA ATC GGC CAG TCC CTC TGG 1181 Leu Pro Met Glu Ala Gln Leu Ser Arg Leu Ile Gly Gln Ser Leu Trp 330 335 340 GAC GTC TCC CGC TCC AGC ACT GGC AAC CTC GTT GAG TGG TTC CTC CTC 1229 Asp Val Ser Arg Ser Ser Thr Gly Asn Leu Val Glu Trp Phe Leu Leu 345 350 355 AGG AAG GCC TAT GAG AGG AAT GAG CTG GCC CCG AAC AAG CCC GAT GAA 1277 Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala Pro Asn Lys Pro Asp Glu 360 365 370 AAG GAG CTG GCC AGA AGA CGG CAG AGC TAT GAA GGA GGC TAT GTA AAA 1325 Lys Glu Leu Ala Arg Arg Arg Gln Ser Tyr Glu Gly Gly Tyr Val Lys 375 380 385 390 GAG CCC GAG AGA G GG TTG TGG GAG AAC ATA GTG TAC CTA GAT TTT AGA 1373 Glu Pro Glu Arg Gly Leu Trp Glu Asn Ile Val Tyr Leu Asp Phe Arg 395 400 405 TGC CAT CCA GCC GAT ACG AAG GTT GTC GTC AAG GGG AAG GGG ATT ATA 1421 Cys His Pro Ala Asp Thr Lys Val Val Val Lys Gly Lys Gly Ile Ile 410 415 420 AAC ATC AGC GAG GTT CAG GAA GGT GAC TAT GTC CTT GGG ATT GAC GGC 1469 Asn Ile Ser Glu Val Gln Glu Gly Asp Tyr Val Leu Gly Ile Asp Gly 425 430 435 TGG CAG AGA GTT AGA AAA GTA TGG GAA TAC GAC TAC AAA GGG GAG CTT 1517 Trp Gln Arg Val Arg Lys Val Trp Glu Tyr Asp Tyr Lys Gly Glu Leu 440 445 450 GTA AAC ATA AAC GGG TTA AAG TGT ACG CCC AAT CAT AAG CTT CCC GTT 1565 Val Asn Ile Asn Gly Leu Lys Cys Thr Pro Asn His Lys Leu Pro Val 455 460 465 470 GTT ACA AAG AAC GAA CGA CAA ACG AGA ATA AGA GAC AGT CTT GCT AAG 1613 Val Thr Lys Asn Glu Arg Gln Thr Arg Ile Arg Asp Ser Leu Ala Lys 475 480 485 TCT TTC CTT ACT AAA AAA GTT AAG GGC AAG ATA ATA ACC ACT CCC CTT 1661 Ser Phe Leu Thr Lys Lys Val Lys Gly Lys Ile Ile Thr Thr Pro Leu 490 495 50 0 TTC TAT GAA ATA GGC AGA GCG ACA AGT GAG AAT ATT CCA GAA GAA GAG 1709 Phe Tyr Glu Ile Gly Arg Ala Thr Ser Glu Asn Ile Pro Glu Glu Glu 505 510 515 GTT CTC AAG GGA GAG CTC GCT GGC ATA CTA TTG GCT GAA GGA ACG CTC 1757 Val Leu Lys Gly Glu Leu Ala Gly Ile Leu Leu Ala Glu Gly Thr Leu 520 525 530 TTG AGG AAA GAC GTT GAA TAC TTT GAT TCA TCC CGC AAA AAA CGG AGG 1805 Leu Arg Lys Asp Val Glu Tyr Phe Asp Ser Ser Arg Lys Lys Arg Arg 535 540 545 550 ATT TCA CAC CAG TAT CGT GTT GAG ATA ACC ATT GGG AAA GAC GAG GAG 1853 Ile Ser His Gln Tyr Arg Val Glu Ile Thr Ile Gly Lys Asp Glu Glu 555 560 565 GAG TTT AGG GAT CGT ATC ACA TAC ATT TTT GAG CGT TTG TTT GGG ATT 1901 Glu Phe Arg Asp Arg Ile Thr Tyr Ile Phe Glu Arg Leu Phe Gly Ile 570 575 580 ACT CCA AGC ATC TCG GAG AAG AAA GGA ACT AAC GCA GTA ACA CTC AAA 1949 Thr Pro Ser Ile Ser Glu Lys Lys Gly Thr Asn Ala Val Thr Leu Lys 585 590 595 GTT GCG AAG AAG AAT GTT TAT CTT AAA GTC AAG GAA ATT ATG GAC AAC 1997 Val Ala Lys Lys Asn Val Tyr Leu Lys Val Lys Glu Ile Me t Asp Asn 600 605 610 ATA GAG TCC CTA CAT GCC CCC TCG GTT CTC AGG GGA TTC TTC GAA GGC 2045 Ile Glu Ser Leu His Ala Pro Ser Val Leu Arg Gly Phe Phe Glu Gly 615 620 625 630 GAC GGT TCA GTA AAC AGG GTT AGG AGG AGT ATT GTT GCA ACC CAG GGT 2093 Asp Gly Ser Val Asn Arg Val Arg Arg Ser Ile Val Ala Thr Gln Gly 635 640 645 ACA AAG AAC GAG TGG AAG ATT AAA CTG GTG TCA AAA CTG CTC TCC CAG 2141 Thr Lys Asn Glu Trp Lys Ile Lys Leu Val Ser Lys Leu Leu Ser Gln 650 655 660 CTT GGT ATC CCT CAT CAA ACG TAC ACG TAT CAG TAT CAG GAA AAT GGG 2189 Leu Gly Ile Pro His Gln Thr Tyr Thr Tyr Gln Tyr Gln Glu Asn Gly 665 670 675 AAA GAT CGG AGC AGG TAT ATA CTG GAG ATA ACT GGA AAG GAC GGA TTG 2237 Lys Asp Arg Ser Arg Tyr Ile Leu Glu Ile Thr Gly Lys Asp Gly Leu 680 685 690 ATA CTG TTC CAA ACA CTC ATT GGA TTC ATC AGT GAA AGA AAG AAC GCT 2285 Ile Leu Phe Gln Thr Leu Ile Gly Phe Ile Ser Glu Arg Lys Asn Ala 695 700 705 710 CTG CTT AAT AAG GCA ATA TCT CAG AGG GAA ATG AAC AAC TTG GAA AAC 2333 Leu Leu Asn Lys Ala Ile Ser Gln Arg Glu Met Asn Asn Leu Glu Asn 715 720 725 AAT GGA TTT TAC AGG CTC AGT GAA TTC AAT GTC AGC ACG GAA TAC TAT 2381 Asn Gly Phe Tyr Arg Leu Ser Glu Phe Asn Val Ser Thr Glu Tyr Tyr 730 735 740 GAG GGC AAG GTC TAT GAC TTA ACT CTT GAA GGA ACT CCC TAC TAC TTT 2429 Glu Gly Lys Val Tyr Asp Leu Thr Leu Glu Gly Thr Pro Tyr Tyr Phe 745 750 755 GCC AAT GGC ATA TTG ACC CAT AAC TCC CTG TAC CCC TCA ATC ATC ATC 2477 Ala Asn Gly Ile Leu Thr His Asn Ser Leu Tyr Pro Ser Ile Ile Ile 760 765 770 ACC CAC AAC GTC TCG CCG GAT ACG CTC AAC AGA GAA GGA TGC AAG GAA 2525 Thr His Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Lys Glu 775 780 785 790 TAT GAC GTT GCC CCA CAG GTC GGC CAC CGC TTC TGC AAG GAC TTC CCA 2573 Tyr Asp Val Ala Pro Gln Val Gly His Arg Phe Cys Lys Asp Phe Pro 795 800 805 GGA TTT ATC CCG AGC CTG CTT GGA GAC CTC CTA GAG GAG AGG CAG AAG 2621 Gly Phe Ile Pro Ser Leu Leu Gly Asp Leu Leu Glu Glu Arg Gln Lys 810 815 820 ATA AAG AAG AAG ATG AAG GCC ACG ATT GAC CCG ATC GAG AGG AAG CTC 2669 Ile Lys Lys Lys Met Lys Ala Thr Ile Asp Pro Ile Glu Arg Lys Leu 825 830 835 CTC GAT TAC AGG CAG AGG GCC ATC AAG ATC CTG GCA AAC AGC ATC CTA 2717 Leu Asp Tyr Arg Gln Arg Ala Ile Lys Ile Leu Ala Asn Ser Ile Leu 840 845 850 CCC GAG GAA TGG CTT CCA GTC CTC GAG GAA GGG GAG GTT CAC TTC GTC 2765 Pro Glu Glu Trp Leu Pro Val Leu Glu Glu Gly Glu Val His Phe Val 855 860 865 870 AGG ATT GGA GAG CTC ATA GAC CGG ATG ATG GAG GAA AAT GCT GGG AAA 2813 Arg Ile Gly Glu Leu Ile Asp Arg Met Met Glu Glu Asn Ala Gly Lys 875 880 885 GTA AAG AGA GAG GGC GAG ACG GAA GTG CTT GAG GTC AGT GGG CTT GAA 2861 Val Lys Arg Glu Gly Glu Thrlu Val Leu Glu Val Ser Gly Leu Glu 890 895 900 GTC CCG TCC TTT AAC AGG AGA ACT AAC AAG GCC GAG CTC AAG AGA GTA 2909 Val Pro Ser Phe Asn Arg Arg Thr Asn Lys Ala Glu Leu Lys Arg Val 905 910 915 AAG GCC CTG ATT AGG CAC GAT TAT TCT GGC AAG GTC TAC ACC ATC AGA 2957 Lys Ala Leu Ile Arg His Asp Tyr Ser Gly Lys Val Tyr Thr Ile Arg 920 925 930 CTG AAG TCG GGG AGG AGA ATA AAG ATA ACC TCT GGC CAC AGC CTC TTC TC 3005 Leu Lys Ser Gly Arg Arg Ile Lys Ile Thr Ser Gly His Ser Leu Phe 935 940 945 950 TCT GTG AGA AAC GGG GAG CTC GTT GAA GTT ACG GGC GAT GAA CTA AAG 3053 Ser Val Arg Asn Gly Glu Leu Val Glu Val Thr Gly Asp Glu Leu Lys 955 960 965 CCA GGT GAC CTC GTT GCA GTC CCG CGG AGA TTG GAG CTT CCT GAG AGA 3101 Pro Gly Asp Leu Val Ala Val Pro Arg Arg Leu Glu Leu Pro Glu Arg 970 975 980 AAC CAC GTG CTG AAC CTC GTT GAA CTG CTC CTT GGA ACG CCA GAA GAA 3149 Asn His Val Leu Asn Leu Val Glu Leu Leu Leu Gly Thr Pro Glu Glu 985 990 995 GAA ACT TTG GAC ATC GTC ATG ACG ATC CCA GTC AAG GGT AAG AAG AAC 3197 Glu Thr Leu Asp Ile Val Met Thr Ile Pro Val Lys Gly Lys Lys Asn 1000 1005 1010 TTC TTT AAA GGG ATG CTC AGG ACT TTG CGC TGG ATT TTC GGA GAG GAA 3245 Phe Phe Lys Gly Met Leu Arg Thr Leu Arg Trp Ile Phe Gly Glu Glu 1015 1020 1025 1030 AAG AGG CCC AGA ACC GCG AGA CGC TAT CTC AGG CAC CTT GAG GAT CTG 3293 Lys Arg Pro Arg Thr Ala Arg Arg Tyr Leu Arg His Leu Glu Asp Leu 1035 1040 1045 GGC TAT GTC CGG CTT AAG AAG ATC GGC TAC GAA GTC CTC GAC TGG GAC 3341 Gly Tyr Val Arg Leu Lys Lys Ile Gly Tyr Glu Val Leu Asp Trp Asp 1050 1055 1060 TCA CTT AAG AAC TAC AGA AGG CTC TAC GAG GCG CTT GTC GAG AAC GTC 3389 Ser Leu Lys Asn Tyr Arg Arg Leu Tyr Glu Ala Leu Val Glu Asn Val 1065 1070 1075 AGA TAC AAC GGC AAC AAG AGG GAG TAC CTC GTT GAA TTC AAT TCC ATC 3437 Arg Tyr Asn Gly Asn Lys Arg Glu Tyr Leu Val Glu Phe Asn Ser Ile 1080 1085 1090 CGG GAT GCA GTT GGC ATA ATG CCC CTA AAA GAG CTG AAG GAG TGG AAG 3485 Arg Asp Ala Val Gly Ile Met Pro Leu Lys Glu Leu Lys Glu Trp Lys 1095 1100 1105 1110 ATC GGC ACG CTG AAC GGC TTC AGA ATG AGA AAG CTC ATT GAA GTG GAC 3533 Ile Gly Thr Leu Asn Gly Phe Arg Met Arg Lys Leu Ile Glu Val Asp 1115 1120 1125 GAG TCG TTA GCA AAG CTC CTC GGC TAC TAC GTG AGC GAG GGC TAT GCA 3581 Glu Ser Leu Ala Lys Leu Leu Gly Tyr Tyr Val Ser Glu Gly Tyr Ala 1130 1135 1140 AGA AAG CAG AGG AAT CCC AAA AAC GGC TGG AGC TAC AGC GTG AAG CTC 3629 Arg Lys Gln Arg Asn Pro Lys Asn Gly Trp Ser Tyr Ser Val Lys Leu 11 45 1150 1155 TAC AAC GAA GAC CCT GAA GTG CTG GAC GAT ATG GAG AGA CTC GCC AGC 3677 Tyr Asn Glu Asp Pro Glu Val Leu Asp Asp Met Glu Arg Leu Ala Ser 1160 1165 1170 AGG TTT TTC GGG AAG GTG AGG CGG GGC AGG AAC TAC GTT GAG ATA CCG 3725 Arg Phe Phe Gly Lys Val Arg Arg Gly Arg Asn Tyr Val Glu Ile Pro 1175 1180 1185 1190 AAG AAG ATC GGC TAC CTG CTC TTT GAG AAC ATG TGC GGT GTC CTA GCG 3773 Lys Lys Ile Gly Tyr Leu Leu Phe Glu Asn Met Cys Gly Val Leu Ala 1195 1200 1205 GAG AAC AAG AGG ATT CCC GAG TTC GTC TTC ACG TCC CCG AAA GGG GTT 3821 Glu Asn Lys Arg Ile Pro Glu Phe Val Phe Thr Ser Pro Lys Gly Val 1210 1215 1220 CGG CTG GCC TTC CTT GAG GGG TAC TCA TCG GCG ATG GCG ACG TCC ACC 3869 Arg Leu Ala Phe Leu Glu Gly Tyr Ser Ser Ala Met Ala Thr Ser Thr 1225 1230 1235 GAA CAA GAG ACT CAG GCT CTC AAC GAA AAG CGA GCT TTA GCG AAC CAG 3917 Glu Gln Glu Thr Gln Ala Leu Asn Glu Lys Arg Ala Leu Ala Asn Gln 1240 1245 1250 CTC GTC CTC CTC TTG AAC TCG GTG GGG GTC TCT GCT GTA AAA CTT GGG 3965 Leu Val Leu Leu Leu Asn S er Val Gly Val Ser Ala Val Lys Leu Gly 1255 1260 1265 1270 CAC GAC AGC GGC GTT TAC AGG GTC TAT ATA AAC GAG GAG CTC CCG TTC 4013 His Asp Ser Gly Val Tyr Arg Val Tyr Ile Asn Glu Glu Leu Pro Phe 1275 1280 1285 GTA AAG CTG GAC AAG AAA AAG AAC GCC TAC TAC TCA CAC GTG ATC CCC 4061 Val Lys Leu Asp Lys Lys Lys Asn Ala Tyr Tyr Ser His Val Ile Pro 1290 1295 1300 AAG GAA GTC CTG AGC GAG GTC TTT GGG AAG GTT TTC CAG AAA AAC GTC 4109 Lys Glu Val Leu Ser Glu Val Phe Gly Lys Val Phe Gln Lys Asn Val 1305 1310 1315 AGT CCT CAG ACC TTC AGG AAG ATG GTC GAG GAC GGA AGA CTC GAT CCC 4157 Ser Pro Gln Thr Phe Arg Lys Met Val Glu Asp Gly Arg Leu Asp Pro 1320 1325 1330 GAA AAG GCC CAG AGG CTC TCC TGG CTC ATT GAG GGG GAC GTA GTG CTC 4205 Glu Lys Ala Gln Arg Leu Ser Trp Leu Ile Glu Gly Asp Val Val Leu 1335 1340 1345 1350 GAC CGC GTT GAG TCC GTT GAT GTG GAA GAC TAC GAT GGT TAT GTC TAT 4253 Asp Arg Val Glu Ser Val Asp Val Glu Asp Tyr Asp Gly Tyr Val Tyr 1355 1360 1365 GAC CTG AGC GTC GAG GAC AAC GAG AAC TTC CTC GTT GGC TTT GGG TTG 4301 Asp Leu Ser Val Glu Asp Asn Glu Asn Phe Leu Val Gly Phe Gly Leu 1370 1375 1380 GTC TAT GCT CAC AAC AGC TAC TAC GGT TAC TAC GGC TAT GCA AGG GCG 4349 Val Tyr Ala His Asn Ser Tyr Tyr Gly Tyr Tyr Gly Tyr Ala Arg Ala 1385 1390 1395 CGC TGG TAC TGC AAG GAG TGT GCA GAG AGC GTA ACG GCC TGG GGA AGG 4397 Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser Val Thr Ala Trp Gly Arg 1400 1405 1410 GAG TAC ATA ACG ATG ACC ATC AAG GAG ATA GAG GAA AAG TAC GGC TTT 4445 Glu Tyr Ile Thr Met Thr Ile Lys Glu Ile Glu Glu Lys Tyr Gly Phe 1415 1420 1425 1430 AAG GTA ATC TAC AGC GAC ACC GAC GGA TTT TTT GCC ACA ATA CCT GGA 44 Lys Val Ile Tyr Ser Asp Thr Asp Gly Phe Phe Ala Thr Ile Pro Gly 1435 1440 1445 GCC GAT GCT GAA ACC GTC AAA AAG AAG GCT ATG GAG TTC CTC AAC TAT 4541 Ala Asp Ala Glu Thr Val Lys Lys Lys Ala Met Glu Phe Leu Asn Tyr 1450 1455 1460 ATC AAC GCC AAA CTT CCG GGC GCG CTT GAG CTC GAG TAC GAG GGC TTC 4589 Ile Asn Ala Lys Leu Pro Gly Ala Leu Glu Leu Glu Tyr Glu Gly Phe 1465 1470 1475 TAC AA A CGC GGC TTC TTC GTC ACG AAG AAG AAG TAT GCG GTG ATA GAC 4637 Tyr Lys Arg Gly Phe Phe Val Thr Lys Lys Lys Tyr Ala Val Ile Asp 1480 1485 1490 GAG GAA GGC AAG ATA ACA ACG CGC GGA CTT GAG ATT GTG AGG CGT GAC 4685 Glu Glu Gly Lys Ile Thr Thr Arg Gly Leu Glu Ile Val Arg Arg Asp 1495 1500 1505 1510 TGG AGC GAG ATA GCG AAA GAG ACG CAG GCG AGG GTT CTT GAA GCT TTG 4733 Trp Ser Glu Ile Ala Lys Glu Thr Gln Ala Arg Val Leu Glu Ala Leu 1515 1520 1525 CTA AAG GAC GGT GAC GTC GAG AAG GCC GTG AGG ATA GTC AAA GAA GTT 4781 Leu Lys Asp Gly Asp Val Glu Lys Ala Val Arg Ile Val Lys Glu Val 1530 1535 1540 ACC GAA AAG CTG AGC AAG TAC GAG GTT CCG CCG GAG AAG CTG GTG ATC 4829 Thr Glu Lys Leu Ser Lys Tyr Glu Val Pro Pro Glu Lys Leu Val Ile 1545 1550 1555 CAC GAG CAG ATA ACG AGG GAT TTA AAG GAC TAC AAG GCA ACC GGT CCC 4877 His Glu Gln Ile Thr Arg Asp Leu Lys Asp Tyr Lys Ala Thr Gly Pro 1560 1565 1570 CAC GTT GCC GTT GCC AAG AGG TTG GCC GCG AGA GGA GTC AAA ATA CGC 4925 His Val Ala Val Ala Lys Arg Leu Ala Ala Arg Gly Val Lys Ile Arg 1575 1580 1585 1590 CCT GGA ACG GTG ATA AGC TAC ATC GTG CTC AAG GGC TCT GGG AGG ATA 4973 Pro Gly Thr Val Ile Ser Tyr Ile Val Leu Lys Gly Ser Gly Arg Ile 1595 1600 1605 GGC GAC AGG GCG ATA CCG TTC GAC GAG TTC GAC CCG ACG AAG CAC AAG 5021 Gly Asp Arg Ala Ile Pro Phe Asp Glu Phe Asp Pro Thr Lys His Lys 1610 1615 1620 TAC GAC GCC GAG TAC TAC ATT GAG AAC CAG GTT CTC CCA GCC GTT GAG 5069 Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn Gln Val Leu Pro Ala Val Glu 1625 1630 1635 AGA ATT CTG AGA GCC TTC GGT TAC CGC AAG GAA GAC CTG CGC TAC CAG 5117 Arg Ile Leu Arg Ala Phe Gly Tyr Arg Lys Glu Asp Leu Arg Tyr Gln 1640 1645 1650 AAG ACG AGA CAG GTT GGT TTG AGT GCT TGG CTG AAG CCG AAG GGA ACT 5165 Lys Thr Arg Gln Val Gly Leu Ser Ala Trp Leu Lys Pro Lys Gly Thr 1655 1660 1665 AGATGACCGATTCCTT CCTTAATC CCTTAATCCCTTTTACT CGGCGCCCGG TTAAATACGC TAGGATAGAA 5285 GTGAAGCCAG ACGGCAGGGT AGTCGTCACT GCCCCGAGGG TTCAACGTTG AGAAGTT 5342

【００４５】配列番号２配列の長さ：１６０８配列の型：核酸（ＤＮＡ）鎖の数：２本鎖配列の種類：ｃＤＮＡ配列 AGCATCCTAC CCGAGGAATG GCTTCCAGTC CTCGAGGAAG GGGAGGTTCA CTTCGTCAGG 60 ATTGGAGAGC TCATAGACCG GATGATGGAG GAAAATGCTG GGAAAGTAAA GAGAGAGGGC 120 GAGACGGAAG TGCTTGAGGT CAGTGGGCTT GAAGTCCCGT CCTTTAACAG GAGAACTAAC 180 AAGGCCGAGC TCAAGAGAGT AAAGGCCCTG ATTAGGCACG ATTATTCTGG CAAGGTCTAC 240 ACCATCAGAC TGAAGTCGGG GAGGAGAATA AAGATAACCT CTGGCCACAG CCTCTTCTCT 300 GTGAGAAACG GGGAGCTCGT TGAAGTTACG GGCGATGAAC TAAAGCCAGG TGACCTCGTT 360 GCAGTCCCGC GGAGATTGGA GCTTCCTGAG AGAAACCACG TGCTGAACCT CGTTGAACTG 420 CTCCTTGGAA CGCCAGAAGA AGAAACTTTG GACATCGTCA TGACGATCCC AGTCAAGGGT 480 AAGAAGAACT TCTTTAAAGG GATGCTCAGG ACTTTGCGCT GGATTTTCGG AGAGGAAAAG 540 AGGCCCAGAA CCGCGAGACG CTATCTCAGG CACCTTGAGG ATCTGGGCTA TGTCCGGCTT 600 AAGAAGATCG GCTACGAAGT CCTCGACTGG GACTCACTTA AGAACTACAG AAGGCTCTAC 660 GAGGCGCTTG TCGAGAACGT CAGATACAAC GGCAACAAGA GGGAGTACCT CGTTGAATTC 720 AATTCCATCC GGGATGCAGT TGGCATAATG CCCCTAAAAG AGCTGAAGGA GTGGAAGATC 780 GGCACGCTGA ACGGCTTCAG AATGAGAAAG CTCATTGAAG TGGACGAGTC GTTAGCAAAG 840 CTCCTCGGCT ACTACGTGAG CGAGGGCTAT GCAAGAAAGC AGAGGAATCC CAAAAACGGC 900 TGGAGCTACA GCGTGAAGCT CTACAACGAA GACCCTGAAG TGCTGGACGA TATGGAGAGA 960 CTCGCCAGCA GGTTTTTCGG GAAGGTGAGG CGGGGCAGGA ACTACGTTGA GATACCGAAG 1020 AAGATCGGCT ACCTGCTCTT TGAGAACATG TGCGGTGTCC TAGCGGAGAA CAAGAGGATT 1080 CCCGAGTTCG TCTTCACGTC CCCGAAAGGG GTTCGGCTGG CCTTCCTTGA GGGGTACTCA 1140 TCGGCGATGG CGACGTCCAC CGAACAAGAG ACTCAGGCTC TCAACGAAAA GCGAGCTTTA 1200 GCGAACCAGC TCGTCCTCCT CTTGAACTCG GTGGGGGTCT CTGCTGTAAA ACTTGGGCAC 1260 GACAGCGGCG TTTACAGGGT CTATATAAAC GAGGAGCTCC CGTTCGTAAA GCTGGACAAG 1320 AAAAAGAACG CCTACTACTC ACACGTGATC CCCAAGGAAG TCCTGAGCGA GGTCTTTGGG 1380 AAGGTTTTCC AGAAAAACGT CAGTCCTCAG ACCTTCAGGA AGATGGTCGA GGACGGAAGA 1440 CTCGATCCCG AAAAGGCCCA GAGGCTCTCC TGGCTCATTG AGGGGGACGT AGTGCTCGAC 1500 CGCGTTGAGT CCGTTGATGT GGAAGACTAC GATGGTTATG TCTATGACCT GAGCGTCGAG 1560 GACAACGAGA ACTTCCTCGT TGGCTTTGGG TTGGTCTATG CTCACAAC SEQ ID NO: 2 Sequence length: 1608 Sequence type: Nucleic acid (DNA) Number of strands: Double-stranded Sequence type: cDNA sequence AGCATCCTAC CCGAGGAATG GCTTCCAGTC CTCGAGGAAG GGGAGGTTCA CTTCGTCAGG 60 ATTGGAGAGC TCATAGACCG GATGATGGAG GAAAATGCTG GGAAAGTAAA GA GAAGTCCCGT CCTTTAACAG GAGAACTAAC 180 AAGGCCGAGC TCAAGAGAGT AAAGGCCCTG ATTAGGCACG ATTATTCTGG CAAGGTCTAC 240 ACCATCAGAC TGAAGTCGGG GAGGAGAATA AAGATAACCT CTGGCCACAG CCTCTTCTCT 300 GTGAGAAACG GGGAGCTCGT TGAAGTTACG GGCGATGAAC TAAAGCCAGG TGACCTCGTT 360 GCAGTCCCGC GGAGATTGGA GCTTCCTGAG AGAAACCACG TGCTGAACCT CGTTGAACTG 420 CTCCTTGGAA CGCCAGAAGA AGAAACTTTG GACATCGTCA TGACGATCCC AGTCAAGGGT 480 AAGAAGAACT TCTTTAAAGG GATGCTCAGG ACTTTGCGCT GGATTTTCGG AGAGGAAAAG 540 AGGCCCAGAA CCGCGAGACG CTATCTCAGG CACCTTGAGG ATCTGGGCTA TGTCCGGCTT 600 AAGAAGATCG GCTACGAAGT CCTCGACTGG GACTCACTTA AGAACTACAG AAGGCTCTAC 660 GAGGCGCTTG TCGAGAACGT CAGATACAAC GGCAACAAGA GGGAGTACCT CGTTGAATTC 720 AATTCCATCC GGGATGCAGT TGGCATAATG CCCCTAAAAG AGCTGAAGGA GTGGAAGATC 780 GGCACGCTGA ACGGCTTCAG AATGAGAAAG CTCATTGAAG TGGACGAGTC GTTAGCAAAG 840 CTCCTCGGCT ACTACGTGAG CGAGGGCTAT GCAAGAAAGC AGAGGAATCC CAAAAACGGC 900 TGGAGCTACA GCGTGAAGCT CTACAACGAA GACCCTGAAG TGCTGGACGA TATGGAGAGA 960 CTCGCCAGCA GGTTTTTCGG GAAGGTGAGG CGGGGCAGGA ACTACGTTGA GATACCGAAG 1020 AAGATCGGCT ACCTGCTCTT TGAGAACATG TGCGGTGTCC TAGCGGAGAA CAAGAGGATT 1080 CCCGAGTTCG TCTTCACGTC CCCGAAAGGG GTTCGGCTGG CCTTCCTTGA GGGGTACTCA 1140 TCGGCGATGG CGACGTCCAC CGAACAAGAG ACTCAGGCTC TCAACGAAAA GCGAGCTTTA 1200 GCGAACCAGC TCGTCCTCCT CTTGAACTCG GTGGGGGTCT CTGCTGTAAA ACTTGGGCAC 1260 GACAGCGGCG TTTACAGGGT CTATATAAAC GAGGAGCTCC CGTTCGTAAA GCTGGACAAG 1320 AAAAAGAACG CCTACTACTC ACACGTGATC CCCAAGGAAG TCCTGAGCGA GGTCTTTGGG 1380 AAGGTTTTCC AGAAAAACGT CAGTCCTCAG ACCTTCAGGA AGATGGTCGA GGACGGAAGA 1440 CTCGATCCCG AAAAGGCCCA GAGGCTCTCC TGGCTCATTG AGGGGGACGT AGTGCTCGAC 1500 CGCGTTGAGT CCGTTGATGT GGAAGACTAC GATGGTTATG TCTATGACCT GAGCGTCGAG 1560 GACAACGAG A ACTTCCTCGT TGGCTTTGGG TTGGTCTATG CTCACAAC

【００４６】配列番号３配列の長さ：５３７配列の型：アミノ酸トポロジー：直鎖状配列の種類：タンパク質配列 Ser Ile Leu Pro Glu Glu Trp Leu Pro Val Leu Glu Glu Gly Glu Val 1 5 10 15 His Phe Val Arg Ile Gly Glu Leu Ile Asp Arg Met Met Glu Glu Asn 20 25 30 Ala Gly Lys Val Lys Arg Glu Gly Glu Thr Glu Val Leu Glu Val Ser 35 40 45 Gly Leu Glu Val Pro Ser Phe Asn Arg Arg Thr Asn Lys Ala Glu Leu 50 55 60 Lys Arg Val Lys Ala Leu Ile Arg His Asp Tyr Ser Gly Lys Val Tyr 65 70 75 80 Thr Ile Arg Leu Lys Ser Gly Arg Arg Ile Lys Ile Thr Ser Gly His 85 90 95 Ser Leu Phe Ser Val Arg Asn Gly Glu Leu Val Glu Val Thr Gly Asp 100 105 110 Glu Leu Lys Pro Gly Asp Leu Val Ala Val Pro Arg Arg Leu Glu Leu 115 120 125 Pro Glu Arg Asn His Val Leu Asn Leu Val Glu Leu Leu Leu Gly Thr 130 135 140 Pro Glu Glu Glu Thr Leu Asp Ile Val Met Thr Ile Pro Val Lys Gly 145 150 155 160 Lys Lys Asn Phe Phe Lys Gly Met Leu Arg Thr Leu Arg Trp Ile Phe 165 170 175 Gly Glu Glu Lys Arg Pro Arg Thr Ala Arg Arg Tyr Leu Arg His Leu 180 185 190 Glu Asp Leu Gly Tyr Val Arg Leu Lys Lys Ile Gly Tyr Glu Val Leu 195 200 205 Asp Trp Asp Ser Leu Lys Asn Tyr Arg Arg Leu Tyr Glu Ala Leu Val 210 215 220 Glu Asn Val Arg Tyr Asn Gly Asn Lys Arg Glu Tyr Leu Val Glu Phe 225 230 235 240 Asn Ser Ile Arg Asp Ala Val Gly Ile Met Pro Leu Lys Glu Leu Lys 245 250 255 Glu Trp Lys Ile Gly Thr Leu Asn Gly Phe Arg Met Arg Lys Leu Ile 260 265 270 Glu Val Asp Glu Ser Leu Ala Lys Leu Leu Gly Tyr Tyr Val Ser Glu 275 280 285 Gly Tyr Ala Arg Lys Gln Arg Asn Pro Lys Asn Gly Trp Ser Tyr Ser 290 295 300 305 Val Lys Leu Tyr Asn Glu Asp Pro Glu Val Leu Asp Asp Met Glu Arg 310 315 320 Leu Ala Ser Arg Phe Phe Gly Lys Val Arg Arg Gly Arg Asn Tyr Val 325 330 335 Glu Ile Pro Lys Lys Ile Gly Tyr Leu Leu Phe Glu Asn Met Cys Gly 340 345 350 Val Leu Ala Glu Asn Lys Arg Ile Pro Glu Phe Val Phe Thr Ser Pro 355 360 365 Lys Gly Val Arg Leu Ala Phe Leu Glu Gly Tyr Ser Ser Ala Met Ala 370 375 380 385 Thr Ser Thr Glu Gln Glu Thr Gln Ala Leu Asn Glu Lys Arg Ala Leu 390 395 400 Ala Asn Gln Leu Val Leu Leu Leu Asn Ser Val Gly Val Ser Ala Val 405 410 415 Lys Leu Gly His Asp Ser Gly Val Tyr Arg Val Tyr Ile Asn Glu Glu 420 425 430 Leu Pro Phe Val Lys Leu Asp Lys Lys Lys Asn Ala Tyr Tyr Ser His 435 440 445 Val Ile Pro Lys Glu Val Leu Ser Glu Val Phe Gly Lys Val Phe Gln 450 455 460 465 Lys Asn Val Ser Pro Gln Thr Phe Arg Lys Met Val Glu Asp Gly Arg 470 475 480 Leu Asp Pro Glu Lys Ala Gln Arg Leu Ser Trp Leu Ile Glu Gly Asp 485 490 495 Val Val Leu Asp Arg Val Glu Ser Val Asp Val Glu Asp Tyr Asp Gly 500 505 510 Tyr Val Tyr Asp Leu Ser Val Glu Asp Asn Glu Asn Phe Leu Val Gly 515 520 525 Phe Gly Leu Val Tyr Ala His Asn 530 535 SEQ ID NO: 3 Sequence length: 537 Sequence type: Amino acid Topology: Linear Sequence type: Protein sequence Ser Ile Leu Pro Glu Glu Trp Leu Pro Val Leu Glu Glu Gly Glu Val 1 5 10 15 His Phe Val Arg Ile Gly Glu Leu Ile Asp Arg Met Met Glu Glu Asn 20 25 30 Ala Gly Lys Val Lys Arg Glu Gly Glu Thr Glu Val Leu Glu Val Ser 35 40 45 Gly Leu Glu Val Pro Ser Phe Asn Arg Arg Thr Asn Lys Ala Glu Leu 50 55 60 Lys Arg Val Lys Ala Leu Ile Arg His Asp Tyr Ser Gly Lys Val Tyr 65 70 75 80 Thr Ile Arg Leu Lys Ser Gly Arg Arg Ile Lys Ile Thr Ser Gly His 85 90 95 Ser Leu Phe Ser Val Arg Asn Gly Glu Leu Val Glu Val Thr Gly Asp 100 105 110 Glu Leu Lys Pro Gly Asp Leu Val Ala Val Pro Arg Arg Leu Glu Leu 115 120 125 Pro Glu Arg Asn His Val Leu Asn Leu Val Glu Leu Leu Leu Gly Thr 130 135 140 Pro Glu Glu Glu Thr Leu Asp Ile Val Met Thr Ile Pro Val Lys Gly 145 150 155 160 Lys Lys Asn Phe Phe Lys Gly Met Leu Arg Thr Leu Arg Trp Ile Phe 165 170 175 Gly Glu Glu Ly s Arg Pro Arg Thr Ala Arg Arg Tyr Leu Arg His Leu 180 185 190 Glu Asp Leu Gly Tyr Val Arg Leu Lys Lys Ile Gly Tyr Glu Val Leu 195 200 205 Asp Trp Asp Ser Leu Lys Asn Tyr Arg Arg Leu Tyr Glu Ala Leu Val 210 215 220 Glu Asn Val Arg Tyr Asn Gly Asn Lys Arg Glu Tyr Leu Val Glu Phe 225 230 235 240 Asn Ser Ile Arg Asp Ala Val Gly Ile Met Pro Leu Lys Glu Leu Lys 245 250 255 Glu Trp Lys Ile Gly Thr Leu Asn Gly Phe Arg Met Arg Lys Leu Ile 260 265 270 Glu Val Asp Glu Ser Leu Ala Lys Leu Leu Gly Tyr Tyr Val Ser Glu 275 280 285 Gly Tyr Ala Arg Lys Gln Arg Asn Pro Lys Asn Gly Trp Ser Tyr Ser 290 295 300 305 Val Lys Leu Tyr Asn Glu Asp Pro Glu Val Leu Asp Asp Met Glu Arg 310 315 320 Leu Ala Ser Arg Phe Phe Gly Lys Val Arg Arg Gly Arg Asn Tyr Val 325 330 335 Glu Ile Pro Lys Lys Ile Gly Tyr Leu Leu Phe Glu Asn Met Cys Gly 340 345 350 Val Leu Ala Glu Asn Lys Arg Ile Pro Glu Phe Val Phe Thr Ser Pro 355 360 365 Lys Gly Val Arg Leu Ala Phe Leu Glu Gly Tyr Ser Ser Ala Met Ala 370 375 380 385 Thr Ser Thr Gl u Gln Glu Thr Gln Ala Leu Asn Glu Lys Arg Ala Leu 390 395 400 Ala Asn Gln Leu Val Leu Leu Leu Asn Ser Val Gly Val Ser Ala Val 405 410 415 Lys Leu Gly His Asp Ser Gly Val Tyr Arg Val Tyr Ile Asn Glu Glu 420 425 430 Leu Pro Phe Val Lys Leu Asp Lys Lys Lys Asn Ala Tyr Tyr Ser His 435 440 445 Val Ile Pro Lys Glu Val Leu Ser Glu Val Phe Gly Lys Val Phe Gln 450 455 460 465 Lys Asn Val Ser Pro Gln Thr Phe Arg Lys Met Val Glu Asp Gly Arg 470 475 480 Leu Asp Pro Glu Lys Ala Gln Arg Leu Ser Trp Leu Ile Glu Gly Asp 485 490 495 Val Val Leu Asp Arg Val Glu Ser Val Asp Val Glu Asp Tyr Asp Gly 500 505 510 510 Tyr Val Tyr Asp Leu Ser Val Glu Asp Asn Glu Asn Phe Leu Val Gly 515 520 525 Phe Gly Leu Val Tyr Ala His Asn 530 535

【００４７】配列番号４配列の長さ：２４配列の型：核酸トポロジー：直鎖状配列の種類：合成ＤＮＡ配列 GGATTAGTGC CAATGGAAGG CGAC 24SEQ ID NO: 4 Sequence length: 24 Sequence type: Nucleic acid Topology: Linear Sequence type: Synthetic DNA Sequence GGATTAGTGC CAATGGAAGG CGAC 24

【００４８】配列番号５配列の長さ：２４配列の型：核酸トポロジー：直鎖状配列の種類：合成ＤＮＡ配列 GAGGGCGAAG TTTATTCCGA GCTT 24SEQ ID NO: 5 Sequence length: 24 Sequence type: Nucleic acid Topology: Linear Sequence type: Synthetic DNA Sequence GAGGGCGAAG TTTATTCCGA GCTT 24

【００４９】配列番号６配列の長さ：３２４配列の型：核酸（ＤＮＡ）トポロジー：直鎖状配列の種類：ｃＤＮＡ配列 GGATTAGTGC CAATGGAAGG CGACGAGGAG CTGAAAATGC TCGCCTTCGA CATTCAAACT 60 CTCTACCATG AGGGCGAGGA GTTCGCCGAG GGGCCAATCC TTATGATAAG CTACGCCGAC 120 GAGGAAGGGG CCAGGGTGAT AACTTGGAAG AACGTGGATC TCCCCTACGT TGACGTCGTC 180 TCGACGGAGA GGGAGATGAT AAAGCGCTTC CTCCGTGTTG TGAAGGAGAA AGACCCGGAC 240 GTTCTCATAA CCTACAACGG CGACAACTTC GACTTCGCCT ATCTGAAAAA GCGCTGTGAA 300 AAGCTCGGAA TAAACTTCGC CCTC 324SEQ ID NO: 6 Sequence length: 324 Sequence type: Nucleic acid (DNA) Topology: Linear Sequence type: cDNA sequence GGATTAGTGC CAATGGAAGG CGACGAGGAG CTGAAAATGC TCGCCTTCGA CATTCAAACT 60 CTCTACCATG AGGGCGAGGA GTTCGCCGCGAGGGGCCAGACCGCCGAGGAGTTCTACTAACATAGACGCAGAGGAGTTCTACTACGATAGACTCTACGATAGAC TGACGTCGTC 180 TCGACGGAGA GGGAGATGAT AAAGCGCTTC CTCCGTGTTG TGAAGGAGAA AGACCCGGAC 240 GTTCTCATAA CCTACAACGG CGACAACTTC GACTTCGCCT ATCTGAAAAA GCGCTGTGAA 300 AAGCTCGGAA TAAACTTCGC CCTC 324

【００５０】配列番号７配列の長さ：１０８配列の型：アミノ酸トポロジー：直鎖状配列の種類：タンパク質配列 Gly Leu Val Pro Met Glu Gly Asp Glu Glu Leu Lys Met Leu Ala Phe 1 5 10 15 Asp Ile Gln Thr Leu Tyr His Glu Gly Glu Glu Phe Ala Glu Gly Pro 20 25 30 Ile Leu Met Ile Ser Tyr Ala Asp Glu Glu Gly Ala Arg Val Ile Thr 35 40 45 Trp Lys Asn Val Asp Leu Pro Tyr Val Asp Val Val Ser Thr Glu Arg 50 55 60 Glu Met Ile Lys Arg Phe Leu Arg Val Val Lys Glu Lys Asp Pro Asp 65 70 75 80 Val Leu Ile Thr Tyr Asn Gly Asp Asn Phe Asp Phe Ala Tyr Leu Lys 85 90 95 Lys Arg Cys Glu Lys Leu Gly Ile Asn Phe Ala Leu 100 105SEQ ID NO: 7 Sequence length: 108 Sequence type: Amino acid Topology: Linear Sequence type: Protein sequence Gly Leu Val Pro Met Glu Gly Asp Glu Glu Leu Lys Met Leu Ala Phe 1 5 10 15 Asp Ile Gln Thr Leu Tyr His Glu Gly Glu Glu Phe Ala Glu Gly Pro 20 25 30 Ile Leu Met Ile Ser Tyr Ala Asp Glu Glu Gly Ala Arg Val Ile Thr 35 40 45 Trp Lys Asn Val Asp Leu Pro Tyr Val Asp Val Val Ser Thr Glu Arg 50 55 60 Glu Met Ile Lys Arg Phe Leu Arg Val Val Lys Glu Lys Asp Pro Asp 65 70 75 80 Val Leu Ile Thr Tyr Asn Gly Asp Asn Phe Asp Phe Ala Tyr Leu Lys 85 90 95 Lys Arg Cys Glu Lys Leu Gly Ile Asn Phe Ala Leu 100 105

【００５１】配列番号８配列の長さ：４２配列の型：核酸トポロジー：直鎖状配列の種類：合成ＤＮＡ配列 GCCATCAAGA TCCTGGCAAA CAGCTACTAC GGTTACTACG GC 42SEQ ID NO: 8 Sequence length: 42 Sequence type: Nucleic acid Topology: Linear Sequence type: Synthetic DNA sequence GCCATCAAGA TCCTGGCAAA CAGCTACTAC GGTTACTACG GC 42

【００５２】配列番号９配列の長さ：３２配列の型：核酸トポロジー：直鎖状配列の種類：合成ＤＮＡ配列 GATGGATCCA ACTTCTCAAC GTTGAACCCT CG 32SEQ ID NO: 9 Sequence length: 32 Sequence type: Nucleic acid Topology: Linear Sequence type: Synthetic DNA sequence GATGGATCCA ACTTCTCAAC GTTGAACCCT CG 32

【００５３】配列番号１０配列の長さ：４６配列の型：核酸トポロジー：直鎖状配列の種類：合成ＤＮＡ配列 GAACATAGTG TACCTAGATT TTAGATCCCT GTACCCCTCA ATCATC 46SEQ ID NO: 10 Sequence length: 46 Sequence type: Nucleic acid Topology: Linear Sequence type: Synthetic DNA sequence GAACATAGTG TACCTAGATT TTAGATCCCT GTACCCCTCA ATCATC 46

【００５４】配列番号１１配列の長さ：４２配列の型：核酸トポロジー：直鎖状配列の種類：合成ＤＮＡ配列 GCCGTAGTAA CCGTAGTAGC TGTTTGCCAG GATCTTGATG GC 42SEQ ID NO: 11 Sequence length: 42 Sequence type: Nucleic acid Topology: Linear Sequence type: Synthetic DNA sequence GCCGTAGTAA CCGTAGTAGC TGTTTGCCAG GATCTTGATG GC 42

【００５５】配列番号１２配列の長さ：３３配列の型：核酸トポロジー：直鎖状配列の種類：合成ＤＮＡ配列 ATCGATATCC TCGACACTGA CTACATAACC GAG 33SEQ ID NO: 12 Sequence length: 33 Sequence type: Nucleic acid Topology: Linear Sequence type: Synthetic DNA sequence ATCGATATCC TCGACACTGA CTACATAACC GAG 33

【００５６】配列番号１３配列の長さ：４６配列の型：核酸トポロジー：直鎖状配列の種類：合成ＤＮＡ配列 GATGATTGAG GGGTACAGGG ATCTAAAATC TAGGTACACT ATGTTC 46SEQ ID NO: 13 Sequence length: 46 Sequence type: Nucleic acid Topology: Linear Sequence type: Synthetic DNA sequence GATGATTGAG GGGTACAGGG ATCTAAAATC TAGGTACACT ATGTTC 46

[Brief description of drawings]

【図１】イントロンＩＶＳ−Ｂにコードされるエンドヌ
クレアーゼ２を発現するＤＮＡ組換え発現ベクターの構
築を示す。FIG. 1 shows the construction of a DNA recombinant expression vector expressing endonuclease 2 encoded by intron IVS-B.

【図２】エンドヌクレアーゼ１および２の分子量測定結
果を示す。FIG. 2 shows the results of measuring the molecular weight of endonucleases 1 and 2.

【図３】ｐｏｌ（Δｉｖｓ−ａ，Δｉｖｓ−ｂ）の構築
を示す。FIG. 3 shows the construction of pol (Δivs-a, Δivs-b).

【図４】エンドヌクレアーゼ２の切断様式を示す。FIG. 4 shows the cleavage mode of endonuclease 2.

フロントページの続き (51)Int.Cl.⁶ 識別記号庁内整理番号ＦＩ技術表示箇所Ｃ１２Ｎ 9/00 １０１ 15/09 ＺＮＡ //(Ｃ１２Ｎ 9/16 Ｃ１２Ｒ 1:19） (Ｃ１２Ｎ 1/21 Ｃ１２Ｒ 1:19） (Ｃ１２Ｎ 15/09 ＺＮＡＣ１２Ｒ 1:01）Ｃ１２Ｒ 1:01） Continuation of front page (51) Int.Cl. ⁶ Identification number Office reference number FI Technical display location C12N 9/00 101 15/09 ZNA // (C12N 9/16 C12R 1:19) (C12N 1/21 C12R 1 : 19) (C12N 15/09 ZNA C12R 1:01) C12R 1:01)

Claims

[Claims]

1. The following double-stranded DNA sequence is cleaved at the position indicated by the arrow, and in CTAC or its complementary strand,
Novel endonuclease 2 which produces a cleavage site for the 4 base 3'overhang of GTAG.

2. The endonuclease 2 according to claim 1, which has a molecular weight of about 62 Kda.

3. The endonuclease 2 according to claim 1, which is prepared from a hyperthermophilic archaeon.

4. The endonuclease 2 according to claim 1, which is produced by using a recombinant host cell.

5. The endonuclease 2 according to claim 1, which contains the amino acid sequence set forth in SEQ ID NO: 3 in the sequence listing.

6. The following double-stranded DNA sequence is cleaved at the position indicated by the arrow, and in CTAC or its complementary strand,
Pyrococcus furiosus KO, which produces a cleavage site for the 4 ′ 3 ′ overhang of GTAG
An endonuclease 2 having a molecular weight of about 62 Kda prepared from strain D1.

7. The following double-stranded DNA sequence is cleaved at the position indicated by the arrow, and in CTAC or its complementary strand,
The molecular weight produced by using a recombinant host cell transformed with a recombinant expression vector in which a DNA encoding an endonuclease 2 for generating a cleavage site of 4 bases of GTAG 4'is inserted is about 62 Ka. Endonuclease 2.

8. The following double-stranded DNA sequence is cleaved at the position indicated by the arrow, and in CTAC or its complementary strand,
An isolated DNA encoding endonuclease 2 which produces a cleavage site for the 4 base 3'overhang of GTAG.

9. The isolated DNA encoding the endonuclease 2 according to claim 8, which contains a base sequence encoding the amino acid sequence set forth in SEQ ID NO: 3 in the Sequence Listing.

10. The isolated DNA encoding the endonuclease 2 according to claim 8, which contains the base sequence shown in SEQ ID NO: 2 in the Sequence Listing.

11. A DNA recombinant vector in which the DNA according to claim 8 is inserted into a vector.

12. A DNA recombinant expression vector in which the DNA according to claim 8 is inserted into an expression vector.

13. The DN according to claim 12, wherein the expression vector is a pET-8c-derived vector.
A recombinant expression vector.

14. A recombinant host cell transformed with the DNA recombinant expression vector according to claim 12.

15. The recombinant host cell according to claim 14, wherein the host cell is Escherichia coli.

16. D encoding endonuclease 2
A host cell is transformed with a DNA recombinant expression vector in which NA is inserted in a vector, the resulting recombinant host cell is cultured, and endonuclease 2 is collected from the culture. A method for producing nuclease 2.

17. D encoding endonuclease 2
The method for producing the endonuclease 2 according to claim 16, wherein NA contains a nucleotide sequence encoding the amino acid sequence set forth in SEQ ID NO: 3 in the Sequence Listing.

18. D encoding endonuclease 2
The method for producing the endonuclease 2 according to claim 16, wherein NA contains the base sequence shown in Sequence Listing / SEQ ID NO: 2.

19. A method for purifying endonuclease 2 comprising the following steps. (A) A recombinant host cell transformed with a DNA recombinant expression vector in which a DNA encoding the endonuclease 2 is inserted into the expression vector is cultured. (B) The recombinant host cells are collected and then crushed to prepare a cell extract. (C) The impure protein derived from the host cell is removed.

20. D encoding endonuclease 2
The method for purifying endonuclease 2 according to claim 19, wherein NA contains a nucleotide sequence encoding the amino acid sequence set forth in SEQ ID NO: 3 in the sequence listing.

21. D encoding endonuclease 2
20. The method for purifying endonuclease 2 according to claim 19, wherein NA contains the base sequence shown in SEQ ID NO: 2 in the sequence listing.

22. The method for purifying endonuclease 2 according to claim 19, wherein the method for disrupting the host cell is sonication.

23. The method for purifying endonuclease 2 according to claim 19, wherein the step of removing the impure protein is a high temperature heat treatment.

24. The method for purifying endonuclease 2 according to claim 23, wherein the high temperature heat treatment condition is 70 ° C. or higher, preferably 90 ° C. or higher.