WO2021182508A1 - グルコースデヒドロゲナーゼ - Google Patents
グルコースデヒドロゲナーゼ Download PDFInfo
- Publication number
- WO2021182508A1 WO2021182508A1 PCT/JP2021/009515 JP2021009515W WO2021182508A1 WO 2021182508 A1 WO2021182508 A1 WO 2021182508A1 JP 2021009515 W JP2021009515 W JP 2021009515W WO 2021182508 A1 WO2021182508 A1 WO 2021182508A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- indicates
- amino acid
- small size
- chain aliphatic
- branched chain
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12M—APPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
- C12M1/00—Apparatus for enzymology or microbiology
- C12M1/40—Apparatus specially designed for the use of free, immobilised, or carrier-bound enzymes, e.g. apparatus containing a fluidised bed of immobilised enzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/10—Cells modified by introduction of foreign genetic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/26—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving oxidoreductase
- C12Q1/32—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving oxidoreductase involving dehydrogenase
Definitions
- the present invention relates to glucose dehydrogenase (glucose dehydrogenase). More specifically, the present invention relates to glucose dehydrogenase characterized by a specific amino acid region, a gene thereof, etc., and a method for screening and modifying glucose dehydrogenase.
- FAD-GDH FAD-dependent glucose dehydrogenase
- SMBG self-blood glucose measurement
- CGM continuous blood glucose measurement
- FAD-GDH FAD-dependent glucose dehydrogenase
- GDH glucose dehydrogenase
- V / I stands for V (valine) or I (isoleucine)
- G / A / S stands for G (glycine)
- F / W / Y represents F (phenylalanine), W (tryptophane) or Y (tyrosine)
- X represents an arbitrary amino acid residue).
- a glucose dehydrogenase comprising an amino acid sequence that is 40% or more identical to the amino acid sequence of any of SEQ ID NOs: 2 to 4.
- the condition that the numerical value of +11 amino acid residue + 12th amino acid residue + 13th amino acid residue) is 2.83 or more.
- Condition that is 66 or more The glucose dehydrogenase according to [2], wherein the amino acid region is satisfied.
- conservation region 1 consisting of an amino acid sequence composed of the following sequences
- F / Y indicates that it is an aromatic F or Y
- I / V indicates that it is an aromatic I or V
- I / V indicates that it is a branched chain aliphatic I.
- V means I or V of branched-chain aliphatic
- G / A means G or A of branched-chain aliphatic
- V / A / S / T
- S / A / G / C indicates that it is a very small size S, A, G or C.
- V / A / S / T indicates that it is a small size V, A, S or T
- I / V / L indicates that it is a branched chain aliphatic I, V or L.
- N / S indicates that it is a polar and small size N or S
- I / L indicates that it is a branched chain aliphatic I or L
- E / D indicates that it is a negatively charged E.
- conservation region 2 consisting of an amino acid sequence composed of the following sequences However, (N / S / T) indicates that it is a polar and small size N, S or T, and (V / L / A) indicates that it is an aliphatic V, L or A, and (I) / V / L) indicates that it is a branched chain aliphatic I, V or L, (I / V / L) indicates that it is a branched chain aliphatic I, V or L, and (A / P) / R) means A, P or R is; Conservation region 3 consisting of an amino acid sequence composed of the following sequences However, (A / T) means hydrophobic and small size A or T, (G / A) means extremely small size G or A, and (R / K) means positive charge.
- (G / A) means a very small size G or A
- (G / T) means a small size G or T
- (S / T) means a small size G or T.
- Small size S or T means is, (A / S / T) means small size A, S or T, (I / V / F) is branched chain aliphatic or aromatic Indicates that I, V or F of Conservation region 4 consisting of an amino acid sequence composed of the following sequences However, (A / V / C / E / D) indicates that it is a small size or negative charge A, V, C, E or D, and (A / S) is a very small size A or S. , (A / Y) means A or Y is, (R / T / A) means R, T or A, and (G / A) is the smallest size G or A.
- (Y / I / L) indicates that it is a branched-chain aliphatic or aromatic Y, I or L, and (W / Y / F / L / A / H / K / Q). Represents W, Y, F, L, A, H, K or Q: Conservation region 5 consisting of an amino acid sequence composed of the following sequences However, (I / V) indicates that it is a branched chain aliphatic I or V, (I / V) indicates that it is a branched chain aliphatic I or V, and (I / V / L) indicates that it is a branched chain aliphatic I or V.
- / G / I represents an aliphatic or positively charged K, R, A, G or I
- (S / T) represents a small size S or T
- (A / G / V / L / K / Q) indicates that it is A, G, V, L, K or Q
- (I / V / L) indicates that it is a branched chain aliphatic I, V or L.
- (I / V / L / A / H / R) indicates an aliphatic or positively charged I, V, L, A, H or R
- (I / V) is an aliphatic or positively charged I or It means that it is V
- (D / N / S) means that it is a polar and small size D, N or S
- Conservation region 6 consisting of an amino acid sequence composed of the following sequences However, (I / V) indicates that it is a branched chain aliphatic I or V, (D / N) indicates that it is a small size D or N, and (L / A / S / N) indicates that it is a small size D or N.
- Branched chain aliphatic or small size L, A, S or N (P / A / T) means small size P, A or T, (G / F / T) Indicates that it is hydrophobic G, F or T, (E / S) indicates that it is hydrophilic and polar E or S, and (L / M) indicates that it is hydrophobic L or M.
- (Q / V) means Q or V
- (D / E) means negative charge D or E
- Q / H means polar Q or H.
- (S / I / V / L) indicates a branched chain aliphatic or minimal size S, I, V or L
- (V / L / M / A / F) is a hydrophobic V, L
- (L / F) means that it is hydrophobic L or F
- (A / S) means that it is a very small size A or S
- (N / S / Y) represents N, S or Y
- (I / V / T) represents hydrophobic I, V or T
- (I / V / L) is a branched chain aliphatic compound.
- I, V or L of Conservation region 8 consisting of an amino acid sequence composed of the following sequences
- (I / M) indicates that it is hydrophobic I or M
- (L / M) indicates that it is hydrophobic L or M
- (P / S) indicates that it is a small size P or S.
- (R / K / E) means charged R, K or E
- (D / E / A / G / S / K) means D, E, A, G, S Or K
- (I / L / M / A / N / K) is I, L, M, A, N or K
- (I / V) is a branched chain aliphatic compound.
- (D / N / S) indicates that it is a polar and small size D, N or S;
- Conservation region 9 consisting of an amino acid sequence composed of the following sequences However, (Y / H) indicates that it is an aromatic Y or H, (G / D) indicates that it is a small size G or D, and (A / S / T / K) is A, It indicates that it is S, T or K, (L / V) indicates that it is a branched chain aliphatic L or V, and (I / V) indicates that it is a branched chain aliphatic I or V.
- conservation region 10 consisting of an amino acid sequence composed of the following sequences However, (Y / F) indicates that it is an aromatic Y or F, (A / G) indicates that it is a very small size A or G, and (I / L / V) indicates a branched chain aliphatic compound.
- (A / S) is a minimal size A or S
- (R / K / L) is a branched chain aliphatic or positively charged R, K or It means that it is L
- (A / I / T) means that it is hydrophobic A, I or T
- (A / S) means that it is a very small size A or S
- (D / E) indicates that it is a negative charge D or E
- (I / L / V / F / R / Q) indicates that it is I, L, V, F, R or Q, and (I / L).
- a method for preparing glucose dehydrogenase which comprises the following steps (1) to (3): (1) The step of preparing the glucose dehydrogenase gene according to [11] or [12]; (2) The step of expressing the gene; and (3) The step of recovering the expression product.
- a method for screening glucose dehydrogenase which comprises the following steps (i) and (ii): (I) A step of searching for an amino acid sequence showing 20% or more identity with respect to a known glucose dehydrogenase amino acid sequence using an amino acid sequence database; and (ii) the following amino acid sequences from the hit amino acid sequences.
- the amino acid region is further expanded.
- the sum of the values of CRAJ730103 (Normalized frequency of turn) listed in the database AAindex, that is, (the value of the 8th amino acid residue + the 12th amino acid residue).
- the condition that the value of the group + the value of the 13th amino acid residue) is 3.79 or less, and
- the sum of the values of TANS770109 (Normalized frequency of coil) listed in the database AAindex, that is, (8th amino acid residue).
- the condition that the numerical value of +11 amino acid residue + 12th amino acid residue + 13th amino acid residue) is 2.83 or more.
- the screening method according to [16] which selects those satisfying the above requirements.
- the amino acid region is further expanded.
- the total of the values of JANJ780101 (Average accessible surface area) listed in the database AAindex, that is, (the value of amino acid 3 + the value of amino acid 4) is 56.9 or more.
- (I / V) means I or V of branched-chain aliphatic
- (G / A) means G or A of branched-chain aliphatic
- (V) / A / S / T) indicates that it is a small size V, A, S or T
- (S / A / G / C) indicates that it is a very small size S, A, G or C
- (V / A / S / T) indicates that it is a small size V, A, S or T
- (I / V / L) indicates that it is a branched chain aliphatic I, V or L.
- (N / S) indicates that it is a polar and small size N or S
- (I / L) indicates that it is a branched chain aliphatic I or L
- (E / D) indicates that it is a negatively charged E. Or D
- Conservation region 2 consisting of an amino acid sequence composed of the following sequences However, (N / S / T) indicates that it is a polar and small size N, S or T, and (V / L / A) indicates that it is an aliphatic V, L or A, and (I) / V / L) indicates that it is a branched chain aliphatic I, V or L, (I / V / L) indicates that it is a branched chain aliphatic I, V or L, and (A / P) / R) means A, P or R is; Conservation region 3 consisting of an amino acid sequence composed of the following sequences However, (A / T) means hydrophobic and small size A or T, (G /
- (G / A) means a very small size G or A
- (G / T) means a small size G or T
- (S / T) means a small size G or T.
- Small size S or T means is, (A / S / T) means small size A, S or T, (I / V / F) is branched chain aliphatic or aromatic Indicates that I, V or F of Conservation region 4 consisting of an amino acid sequence composed of the following sequences However, (A / V / C / E / D) indicates that it is a small size or negative charge A, V, C, E or D, and (A / S) is a very small size A or S. , (A / Y) means A or Y is, (R / T / A) means R, T or A, and (G / A) is the smallest size G or A.
- (Y / I / L) indicates that it is a branched-chain aliphatic or aromatic Y, I or L, and (W / Y / F / L / A / H / K / Q). Represents W, Y, F, L, A, H, K or Q: Conservation region 5 consisting of an amino acid sequence composed of the following sequences However, (I / V) indicates that it is a branched chain aliphatic I or V, (I / V) indicates that it is a branched chain aliphatic I or V, and (I / V / L) indicates that it is a branched chain aliphatic I or V.
- / G / I represents an aliphatic or positively charged K, R, A, G or I
- (S / T) represents a small size S or T
- (A / G / V / L / K / Q) indicates that it is A, G, V, L, K or Q
- (I / V / L) indicates that it is a branched chain aliphatic I, V or L.
- (I / V / L / A / H / R) indicates an aliphatic or positively charged I, V, L, A, H or R
- (I / V) is an aliphatic or positively charged I or It means that it is V
- (D / N / S) means that it is a polar and small size D, N or S
- Conservation region 6 consisting of an amino acid sequence composed of the following sequences However, (I / V) indicates that it is a branched chain aliphatic I or V, (D / N) indicates that it is a small size D or N, and (L / A / S / N) indicates that it is a small size D or N.
- Branched chain aliphatic or small size L, A, S or N (P / A / T) means small size P, A or T, (G / F / T) Indicates that it is hydrophobic G, F or T, (E / S) indicates that it is hydrophilic and polar E or S, and (L / M) indicates that it is hydrophobic L or M.
- (Q / V) means Q or V
- (D / E) means negative charge D or E
- Q / H means polar Q or H.
- (S / I / V / L) indicates a branched chain aliphatic or minimal size S, I, V or L
- (V / L / M / A / F) is a hydrophobic V, L
- (L / F) means that it is hydrophobic L or F
- (A / S) means that it is a very small size A or S
- (N / S / Y) represents N, S or Y
- (I / V / T) represents hydrophobic I, V or T
- (I / V / L) is a branched chain aliphatic compound.
- I, V or L of Conservation region 8 consisting of an amino acid sequence composed of the following sequences
- (I / M) indicates that it is hydrophobic I or M
- (L / M) indicates that it is hydrophobic L or M
- (P / S) indicates that it is a small size P or S.
- (R / K / E) means charged R, K or E
- (D / E / A / G / S / K) means D, E, A, G, S Or K
- (I / L / M / A / N / K) is I, L, M, A, N or K
- (I / V) is a branched chain aliphatic compound.
- (D / N / S) indicates that it is a polar and small size D, N or S;
- Conservation region 9 consisting of an amino acid sequence composed of the following sequences However, (Y / H) indicates that it is an aromatic Y or H, (G / D) indicates that it is a small size G or D, and (A / S / T / K) is A, It indicates that it is S, T or K, (L / V) indicates that it is a branched chain aliphatic L or V, and (I / V) indicates that it is a branched chain aliphatic I or V.
- conservation region 10 consisting of an amino acid sequence composed of the following sequences However, (Y / F) indicates that it is an aromatic Y or F, (A / G) indicates that it is a very small size A or G, and (I / L / V) indicates a branched chain aliphatic compound.
- (A / S) is a minimal size A or S
- (R / K / L) is a branched chain aliphatic or positively charged R, K or It means that it is L
- (A / I / T) means that it is hydrophobic A, I or T
- (A / S) means that it is a very small size A or S
- (D / E) indicates that it is a negative charge D or E
- (I / L / V / F / R / Q) indicates that it is I, L, V, F, R or Q, and (I / L).
- a method for designing a modified glucose dehydrogenase which comprises the following steps (I) and (II): (I) An amino acid sequence showing 20% or more identity with respect to the amino acid sequence of a known glucose dehydrogenase or the amino acid sequence of a known glucose dehydrogenase, and the following sequence (SEQ ID NO: 1), that is, (However, the numbers above each amino acid residue in the formula are serial numbers from the N-terminal side, H / N represents H (histidine) or N (asparagin), and L / I / M is L (leucine).
- V / I stands for V (valine) or I (isoleucine)
- G / A / S stands for G (glycine)
- F / W / Y represents F (phenylalanine), W (tryptophane) or Y (tyrosine)
- X represents an arbitrary amino acid residue).
- the amino acid region is the sum of the values of CRAJ730103 (Normalized frequency of turn) listed in the database AAindex for the 8th amino acid residue, the 12th amino acid residue, and the 13th amino acid residue. That is, the condition that (the numerical value of the 8th amino acid residue + the numerical value of the 12th amino acid residue + the numerical value of the 13th amino acid residue) is 3.79 or less, For the 8th amino acid residue, the 11th amino acid residue, the 12th amino acid residue, and the 13th amino acid residue, the sum of the values of TANS770109 (Normalized frequency of coil) listed in the database AAindex, that is, (8th amino acid residue).
- TANS770109 Normalized frequency of coil
- step (II) the amino acid region is the sum of the numerical values of JANJ780101 (Average accessible surface area) listed in the database AAindex for the amino acid residue 3 and amino acid 4, that is, (amino acid 3).
- the numerical value of the residue + the numerical value of the 4th amino acid residue is 56.9 or more.
- (I / V) means I or V of branched-chain aliphatic
- (G / A) means G or A of branched-chain aliphatic
- (V) / A / S / T) indicates that it is a small size V, A, S or T
- (S / A / G / C) indicates that it is a very small size S, A, G or C
- (V / A / S / T) indicates that it is a small size V, A, S or T
- (I / V / L) indicates that it is a branched chain aliphatic I, V or L.
- (N / S) indicates that it is a polar and small size N or S
- (I / L) indicates that it is a branched chain aliphatic I or L
- (E / D) indicates that it is a negatively charged E. Or D
- Conservation region 2 consisting of an amino acid sequence composed of the following sequences However, (N / S / T) indicates that it is a polar and small size N, S or T, and (V / L / A) indicates that it is an aliphatic V, L or A, and (I) / V / L) indicates that it is a branched chain aliphatic I, V or L, (I / V / L) indicates that it is a branched chain aliphatic I, V or L, and (A / P) / R) means A, P or R is; Conservation region 3 consisting of an amino acid sequence composed of the following sequences However, (A / T) means hydrophobic and small size A or T, (G /
- (G / A) means a very small size G or A
- (G / T) means a small size G or T
- (S / T) means a small size G or T.
- Small size S or T means is, (A / S / T) means small size A, S or T, (I / V / F) is branched chain aliphatic or aromatic Indicates that I, V or F of Conservation region 4 consisting of an amino acid sequence composed of the following sequences However, (A / V / C / E / D) indicates that it is a small size or negative charge A, V, C, E or D, and (A / S) is a very small size A or S. , (A / Y) means A or Y is, (R / T / A) means R, T or A, and (G / A) is the smallest size G or A.
- (Y / I / L) indicates that it is a branched-chain aliphatic or aromatic Y, I or L, and (W / Y / F / L / A / H / K / Q). Represents W, Y, F, L, A, H, K or Q: Conservation region 5 consisting of an amino acid sequence composed of the following sequences However, (I / V) indicates that it is a branched chain aliphatic I or V, (I / V) indicates that it is a branched chain aliphatic I or V, and (I / V / L) indicates that it is a branched chain aliphatic I or V.
- / G / I represents an aliphatic or positively charged K, R, A, G or I
- (S / T) represents a small size S or T
- (A / G / V / L / K / Q) indicates that it is A, G, V, L, K or Q
- (I / V / L) indicates that it is a branched chain aliphatic I, V or L.
- (I / V / L / A / H / R) indicates an aliphatic or positively charged I, V, L, A, H or R
- (I / V) is an aliphatic or positively charged I or It means that it is V
- (D / N / S) means that it is a polar and small size D, N or S
- Conservation region 6 consisting of an amino acid sequence composed of the following sequences However, (I / V) indicates that it is a branched chain aliphatic I or V, (D / N) indicates that it is a small size D or N, and (L / A / S / N) indicates that it is a small size D or N.
- Branched chain aliphatic or small size L, A, S or N (P / A / T) means small size P, A or T, (G / F / T) Indicates that it is hydrophobic G, F or T, (E / S) indicates that it is hydrophilic and polar E or S, and (L / M) indicates that it is hydrophobic L or M.
- (Q / V) means Q or V
- (D / E) means negative charge D or E
- Q / H means polar Q or H.
- (S / I / V / L) indicates a branched chain aliphatic or minimal size S, I, V or L
- (V / L / M / A / F) is a hydrophobic V, L
- (L / F) means that it is hydrophobic L or F
- (A / S) means that it is a very small size A or S
- (N / S / Y) represents N, S or Y
- (I / V / T) represents hydrophobic I, V or T
- (I / V / L) is a branched chain aliphatic compound.
- I, V or L of Conservation region 8 consisting of an amino acid sequence composed of the following sequences
- (I / M) indicates that it is hydrophobic I or M
- (L / M) indicates that it is hydrophobic L or M
- (P / S) indicates that it is a small size P or S.
- (R / K / E) means charged R, K or E
- (D / E / A / G / S / K) means D, E, A, G, S Or K
- (I / L / M / A / N / K) is I, L, M, A, N or K
- (I / V) is a branched chain aliphatic compound.
- (D / N / S) indicates that it is a polar and small size D, N or S;
- Conservation region 9 consisting of an amino acid sequence composed of the following sequences However, (Y / H) indicates that it is an aromatic Y or H, (G / D) indicates that it is a small size G or D, and (A / S / T / K) is A, It indicates that it is S, T or K, (L / V) indicates that it is a branched chain aliphatic L or V, and (I / V) indicates that it is a branched chain aliphatic I or V.
- conservation region 10 consisting of an amino acid sequence composed of the following sequences However, (Y / F) indicates that it is an aromatic Y or F, (A / G) indicates that it is a very small size A or G, and (I / L / V) indicates a branched chain aliphatic compound.
- (A / S) is a minimal size A or S
- (R / K / L) is a branched chain aliphatic or positively charged R, K or It means that it is L
- (A / I / T) means that it is hydrophobic A, I or T
- (A / S) means that it is a very small size A or S
- (D / E) indicates that it is a negative charge D or E
- (I / L / V / F / R / Q) indicates that it is I, L, V, F, R or Q, and (I / L).
- step (IV) A step to confirm the glucose dehydrogenase activity of a protein consisting of the constructed modified amino acid sequence.
- a method for preparing glucose dehydrogenase which comprises the following steps (1) to (3): (1) A step of preparing glucose dehydrogenase by the screening method according to [16] to [20] or the design method according to [21] to [25]; (2) A step of culturing the microorganism expressing the glucose dehydrogenase; and (3) A step of recovering the expression product from the culture.
- the term “isolated” is used interchangeably with “purified”.
- isolated is used to distinguish a product produced without human intervention from its natural state, that is, the state that exists in nature, and is used for human manipulation. In the case of products produced with the intervention of, it is used to distinguish it from those that have not undergone an isolation step or a purification step. In the former case, the artificial operation of isolation results in an "isolated state” that is different from the natural state, and the isolated one is clearly and decisively different from the natural product itself. On the other hand, in the latter case, impurities are typically removed or the amount thereof is reduced by the isolation step or the purification step, and the purity is increased.
- the purity of the isolated enzyme is not particularly limited. However, if it is planned to be applied to applications that require high purity, it is preferable that the isolated enzyme has high purity.
- amino acid sequence is expressed so that the left end is the amino terminus and the right end is the carboxy terminus according to the conventional notation.
- each amino acid is represented by one letter as follows.
- the first aspect of the present invention provides GDH.
- the GDH of the present invention (hereinafter, also referred to as “the enzyme”) is characterized by two requirements (first requirement and second requirement).
- the first requirement is to have a unique amino acid region.
- the amino acid region peculiar to the present invention is an amino acid region found to be characteristic of GDH, and is composed of the following sequence (SEQ ID NO: 1).
- the numbers above each amino acid residue in the formula are serial numbers from the N-terminal side, and (H / N) indicates that it is H (histidine) or N (asparagin), and (L / I / M).
- the amino acid region that characterizes this enzyme corresponds to the sequence of 13 consecutive amino acid residues present near the 140th to 180th positions of FAD-GDH derived from filamentous fungi.
- FAD-GDH derived from Aspergillus oryzae SEQ ID NO: 21
- the amino acid region from the 156th amino acid residue to the 168th amino acid residue is the above-mentioned amino acid region.
- the known FAD-GDH In FAD-GDH (SEQ ID NO: 22) derived from Aspergillus terreus the amino acid region from the 149th amino acid residue to the 161st amino acid residue is the above amino acid region.
- the amino acid region from the 149th amino acid residue to the 161st amino acid residue is the Aspergillus turcosus.
- the amino acid region from the 149th amino acid residue to the 161st amino acid residue is the above amino acid region
- the FAD-GDH derived from Corniascus sepedonium SEQ ID NO: 4
- the 151st amino acid region is the above amino acid region.
- amino acid region that characterizes this enzyme is thought to form a progressive structure, but in the vicinity of the center, it is angled by the proline residue (amino acid 6th residue), so it has a slight secondary structure (loop-like structure). ).
- the first half is slightly away from the active center, and is considered to be involved in the maintenance of the structure on the surface of the enzyme.
- the latter part is close to the pathway toward the active center of the substrate and is considered to be involved in the characteristics of enzyme activity.
- rule 2 the amino acid region that characterizes this enzyme satisfies the following rule (referred to as "rule 2" for convenience of explanation) in addition to rule 1.
- Rule 2 is composed of the following two conditions. ⁇ Condition 1 of Rule 2> For the 8th amino acid residue, the 12th amino acid residue, and the 13th amino acid residue, the sum of the values of CRAJ730103 (Normalized frequency of turn) listed in the database AAindex, that is, (the value of the 8th amino acid residue + the 12th amino acid residue).
- Condition 1 of Rule 2 defines amino acids that form part of the substrate path to the active center. It is considered that some structural maintenance is required for these amino acids. In addition, since amino acids having a high numerical value under this condition are disadvantageous for the composition and maintenance of the extended structure, this condition is an important index for the relevant part. As condition 1 of rule 2, it is preferable that the total of the above numerical values satisfies 3.10 to 3.79.
- Condition 2 of Rule 2 also defines amino acids that form part of the substrate path to the active center. It is considered that some structural maintenance is required for these amino acids. In addition, since amino acids with low numerical values under this condition are disadvantageous for the composition and maintenance of the extended structure, this condition is an important index for the relevant part. As condition 2 of rule 2, it is preferable that the total of the above numerical values satisfies 2.87 or more, more preferably 2.87 to 5.22, and further preferably 2.87 to 3.55.
- Rule 3 the amino acid region that characterizes this enzyme satisfies the following rules (referred to as "Rule 3" for convenience of explanation) in addition to Rule 1 and Rule 2.
- Rule 3 is composed of the following conditions. ⁇ Conditions for Rule 3> For amino acid 3 and 4, the total of the values of JANJ780101 (Average accessible surface area) listed in the database AAindex, that is, (the value of amino acid 3 + the value of amino acid 4) is 66 or more. Condition that
- the 3rd amino acid residue and the 4th amino acid residue are present on the protein surface.
- This condition is an important indicator of the presence on the protein surface.
- the condition of Rule 3 it is preferable that the total of the above numerical values satisfies 100 or more, more preferably 116 or more, further preferably 116 to 172, and 116 to 116 to 172. It is particularly preferable that the conditions satisfy 131.
- the second requirement that characterizes this enzyme is that it contains an amino acid sequence that is 40% or more identical to the amino acid sequence of any of SEQ ID NOs: 2 to 4.
- the amino acid sequence identity here is 65% or more with the amino acid sequence of SEQ ID NO: 2, 85% or more with the amino acid sequence of SEQ ID NO: 3, and 55% with the amino acid sequence of SEQ ID NO: 4. That is all.
- Each amino acid sequence of SEQ ID NO: 2 to 4 is an amino acid sequence found to have GDH activity by the examination of the present inventors.
- amino acid sequence of SEQ ID NO: 2 is FAD-GDH derived from Aspergillus cristatus
- amino acid sequence of SEQ ID NO: 3 is FAD-GDH derived from Aspergillus turcosus
- amino acid sequence of SEQ ID NO: 4 Corresponds to FAD-GDH derived from Corynascus sepedonium, respectively.
- the identity with the reference amino acid sequence is high in that it has the same properties as the protein consisting of the amino acid sequence of any of SEQ ID NOs: 2 to 4. Therefore, the identity is preferably 50% or higher, 60% or higher, 70% or higher, 80% or higher, 90% or higher, 95% or higher, 98% or higher or 100% (that is, the reference amino acid sequence itself) (that is, the reference amino acid sequence itself). The higher the percentage of identity, the more preferable).
- 11 regions of the peculiar region (SEQ ID NO: 1) of the present invention and the preservation regions 1 to 10 described later are specified as regions having high storage stability in GDH.
- the difference in amino acid sequence has little effect on GDH activity, and more differences in amino acid sequence are allowed.
- the identity with the reference amino acid sequence (any of SEQ ID NOs: 2 to 4) in the region excluding the above 11 regions is 40% or more, 45% or more, 50% or more, 55% or more, 60% or more, 70%. 80% or more, 90% or more, 95% or more, or 98% or more (the higher the percentage of identity, the more preferable).
- the amino acid sequence of SEQ ID NO: 2 is 60% or more
- the amino acid sequence of SEQ ID NO: 3 is 80% or more
- the amino acid sequence of SEQ ID NO: 4 is 40% or more.
- the total length of this enzyme is not particularly limited, but is, for example, 530aa to 660aa, preferably 540aa to 620aa.
- Amino acid sequences showing the above identity show some differences from the reference amino acid sequence except when the identity is 100%. .. "Partial differences in amino acid sequence" are, for example, deletion, substitution of one or more amino acids in the amino acids constituting the amino acid sequence, addition or insertion of one or more amino acids to the amino acid sequence, or these. Caused by any combination of.
- the positions where the amino acid sequences differ are not particularly limited as long as they are parts other than the amino acid region according to the first requirement described above.
- differences in amino acid sequences may occur at a plurality of locations (locations).
- One of the typical examples of "partial difference in amino acid sequence” is 1 to 50 (preferably 1 to 10, more preferably 1 to 7, and even more preferably 1 to 7) of the amino acids constituting the amino acid sequence. 1-5, even more preferably 1-3) amino acid deletions, substitutions, 1-50 (preferably 1-10, even more preferably 1-7, even more preferred) with respect to the amino acid sequence. Is that the amino acid sequence is mutated (changed) by the addition, insertion, or combination of 1 to 5, more preferably 1 to 3) amino acids.
- an amino acid sequence showing the above identity can be obtained.
- conservative amino acid substitution means substituting an amino acid residue with an amino acid residue having a side chain having similar properties.
- Amino acid residues, depending on their side chain are basic side chains (eg lysine, arginine, histidine), acidic side chains (eg aspartic acid, glutamate), uncharged polar side chains (eg glycine, asparagine, glutamine, serine, threonine, tyrosine).
- Cysteine non-polar side chains (eg alanine, valine, leucine, isoleucine, proline, phenylalanine, methionine, tryptophan), ⁇ -branched side chains (eg threonine, valine, isoleucine), aromatic side chains (eg tyrosine, phenylalanine, It is classified into several families, such as tryptophan (histidine).
- Conservative amino acid substitutions are preferably substitutions between amino acid residues within the same family. It is preferable that the amino acid residue of the active center is maintained.
- the positions of the amino acid residues in the active center are the residue corresponding to the 502nd H and the residue corresponding to the 545th H in FAD-GDH (SEQ ID NO: 2) derived from Aspergillus cristatus, FAD- derived from Aspergillus tarcosus.
- the identity (%) of two amino acid sequences or two nucleic acids can be determined by, for example, the following procedure.
- the two sequences are lined up for optimal comparison (eg, a gap may be introduced in the first sequence to optimize alignment with the second sequence).
- a gap may be introduced in the first sequence to optimize alignment with the second sequence.
- Comparison of two sequences and determination of identity can be realized using a mathematical algorithm.
- mathematical algorithms that can be used to compare sequences include the algorithms described in Karlin and Altschul (1993) Proc. Natl. Acad. Sci. USA 90: 5873-77. Such algorithms are incorporated into the NBLAST and XBLAST programs (version 2.0) described in Altschul et al. (1990) J. Mol. Biol. 215: 403-10.
- Gapped BLAST described in Altschul et al. (1997) Amino Acids Research 25 (17): 3389-3402 is available.
- the default parameters of the corresponding programs eg XBLAST and NBLAST
- Examples of other mathematical algorithms available for sequence comparison are those described in Myers and Miller (1988) Comput Appl Biosci. 4: 11-17.
- the identity of the two amino acid sequences can be determined using the GAP program in the EMBOSS package, using the Blosum62 matrix, with a gap weight of 10 and a gap length weight of 2.
- the enzyme may be part of a larger protein (eg, a fusion protein).
- a larger protein eg, a fusion protein
- sequences added to the fusion protein include sequences useful for purification such as multiple histidine residues, additional sequences that ensure stability during recombinant production, cytochrome-like addition sequences that change reactivity, and the like. ..
- a polymer, an electron acceptor, a metal complex and the like may be chemically added.
- the enzyme is characterized by Requirement 3 in addition to Requirement 1 and 2 above.
- Requirement 3 Have one or more of the following storage areas 1 to 10.
- Aromatic F / W / Y / H Aliphatic: A / I / V / L / G Branched chain aliphatic: I / V / L Minimal size (minimal): G / A / S / C Small size (small): G / A / S / C / T / V / N / P / D Polarity: T / C / S / N / Q / D / E / Y / W / H / K / R Small size with polarity (polarity / small): S / N / C / T / D Charge: D / E / K / R / H Negative charge: D / E Positive charge: R / K / H Hydrophobicity: A / G / C / T / I / V / L
- Conservation region 1 is an amino acid residue corresponding to the 5th to 25th residues in FAD-GDH derived from A.cristatus GZAAS20.1005, and corresponds to the 5th to 25th residues in FAD-GDH derived from A.turcosus HMR AF 23. It is an amino acid residue, and is an amino acid residue corresponding to the 8th to 28th residues in FAD-GDH derived from Corynascus sepedonium NBRC 31363.
- the amino acid sequence defining the storage region 1 is composed of the following sequence (SEQ ID NO: 24). However, (F / Y) indicates that it is an aromatic F or Y. (I / V) indicates that it is an aromatic I or V.
- (I / V) indicates that it is a branched chain aliphatic I or V.
- (I / V) indicates that it is a branched chain aliphatic I or V.
- (G / A) indicates that it is a branched chain aliphatic G or A.
- (V / A / S / T) indicates that it is a small V, A, S or T.
- (S / A / G / C) means that it is the smallest S, A, G or C.
- (V / A / S / T) indicates that it is a small V, A, S or T.
- (I / V / L) indicates that it is a branched chain aliphatic I, V or L.
- (N / S) indicates that the polarity is small N or S.
- (I / L) indicates that it is a branched chain aliphatic I or L.
- (E / D) indicates that it is a
- the amino acid sequence defining the storage region 1 is composed of the following sequence (SEQ ID NO: 25).
- F / Y indicates that it is an aromatic F or Y.
- I / V indicates that it is a branched chain aliphatic I or V.
- I / V indicates that it is a branched chain aliphatic I or V.
- I / V indicates that it is a branched chain aliphatic I or V.
- G / A indicates that it is a very small G or A.
- T / A indicates that it is a small T or A.
- (S / C) indicates that it is a minimum S or C
- (V / A) indicates that it is a small V or A
- (I / V / L) indicates that it is a branched chain aliphatic I, V or L
- (E / D) indicates that it is a negatively charged E or D.
- the amino acid sequence defining the storage region 1 is composed of the following sequence (SEQ ID NO: 26).
- (I / V) indicates that it is a branched chain aliphatic I or V.
- (I / V) indicates that it is a branched chain aliphatic I or V.
- (T / A) indicates that it is a small T or A.
- (S / C) indicates that it is a minimum S or C
- V / A indicates that it is a small V or A
- (I / V / L) indicates that it is a branched chain aliphatic I, V or L.
- (E / D) indicates that it is a negatively charged E or D.
- the amino acid sequence defining the storage region 1 is composed of any of the following sequences.
- YDYVIVGGGTSGLVVANRLSE (FAD-GDH derived from A.cristatus GZAAS20.1005) (SEQ ID NO: 27)
- YDYIVVGGGACGLALANRLSD (FAD-GDH derived from A.turcosus HMR AF 23)
- FDYIIIGAGTSGLVIANRLSE (FAD-GDH derived from Corynascus sepedonium NBRC 31363) (SEQ ID NO: 29)
- Conservation region 2 is an amino acid residue corresponding to residues 30 to 37 in FAD-GDH derived from A.cristatus GZAAS20.1005, and corresponds to residues 30 to 37 in FAD-GDH derived from A.turcosus HMR AF 23. It is an amino acid residue, and is an amino acid residue corresponding to the 33rd to 40th residues in FAD-GDH derived from Corynascus sepedonium NBRC 31363.
- the amino acid sequence defining the storage region 2 is composed of the following sequence (SEQ ID NO: 30). However, (N / S / T) indicates that the polarity is small, N, S or T.
- V / L / A indicates that it is an aliphatic V, L or A.
- I / V / L indicates that it is a branched chain aliphatic I, V or L.
- I / V / L indicates that it is a branched chain aliphatic I, V or L.
- a / P / R means A, P or R means.
- the amino acid sequence defining the storage region 2 is composed of the following sequence (SEQ ID NO: 31).
- (S / T) means S or T
- (A / V / L) means A
- (V / I) means V or I
- V / I means V or I (A / R) indicates that it is A or R.
- the amino acid sequence defining the storage region 2 is composed of the following sequence (SEQ ID NO: 32).
- (V / L) means V or L
- (V / I) means V or I
- V / I) means V or I (A / R) indicates that it is A or R.
- the amino acid sequence defining the storage region 2 is composed of any of the following sequences.
- SVVVIEAG FAD-GDH derived from A.cristatus GZAAS20.1005
- SEQ ID NO: 33 SVLIIERG (FAD-GDH derived from A.turcosus HMR AF 23)
- TVAVIEPG FAD-GDH derived from Corynascus sepedonium NBRC 31363
- Conservation region 3 is an amino acid residue corresponding to residues 81 to 93 in FAD-GDH derived from A.cristatus GZAAS20.1005, and corresponds to residues 81 to 93 in FAD-GDH derived from A.turcosus HMR AF 23. It is an amino acid residue, and is an amino acid residue corresponding to the 83rd to 95th residues in FAD-GDH derived from Corynascus sepedonium NBRC 31363.
- the amino acid sequence defining the storage region 3 is composed of the following sequence (SEQ ID NO: 36). However, (A / T) indicates that it is hydrophobic and small A or T.
- (G / A) indicates that it is a very small G or A.
- (R / K) indicates that it is a positively charged R or K.
- (A / L) indicates that it is an aliphatic A or L
- (I / V / L / W) indicates that it is a branched chain aliphatic or aromatic I, V, L or W.
- (G / A) indicates that it is a very small G or A.
- (G / T) indicates that it is a small G or T.
- (S / T) means that a small S or T is (A / S / T) indicates that it is a small A, S or T.
- (I / V / F) represents a branched chain aliphatic or aromatic I, V or F.
- the amino acid sequence defining the storage region 3 is composed of the following sequence (SEQ ID NO: 37).
- (W / L) indicates that it is a branched chain aliphatic or aromatic W or L.
- S / T indicates that it is a small S or T.
- amino acid sequence defining the storage region 3 is composed of the following sequence (SEQ ID NO: 38). However, (S / T) indicates that it is a small S or T.
- the amino acid sequence defining the storage region 3 is composed of any of the following sequences.
- AGKALGGTSTING FAD-GDH derived from A.cristatus GZAAS20.1005
- SEQ ID NO: 39 AGKALGGTTTING (FAD-GDH derived from A.turcosus HMR AF 23)
- SEQ ID NO: 40 AGKAWGGTSTING (FAD-GDH derived from Corynascus sepedonium NBRC 31363) (SEQ ID NO: 41)
- Conservation region 4 is an amino acid residue corresponding to residues 208 to 218 in FAD-GDH derived from A.cristatus GZAAS20.1005, and corresponds to residues 209 to 219 in FAD-GDH derived from A.turcosus HMR AF 23. It is an amino acid residue, and is an amino acid residue corresponding to the 211th to 221st residues in FAD-GDH derived from Corynascus sepedonium NBRC 31363.
- the amino acid sequence defining the storage region 4 is composed of the following sequence (SEQ ID NO: 42).
- (A / V / C / E / D) indicates that it is a small or negatively charged A, V, C, E or D.
- (A / S) indicates that it is a minimum A or S
- (A / Y) means that A or Y is (R / T / A) means R, T or A
- (G / A) indicates that it is a very small G or A.
- (Y / I / L) indicates that it is a branched chain aliphatic or aromatic Y, I or L.
- (W / Y / F / L / A / H / K / Q) indicates that it is W, Y, F, L, A, H, K or Q.
- the amino acid sequence defining the storage region 4 is composed of the following sequence (SEQ ID NO: 43).
- E / C indicates that it is a small or negatively charged E or C.
- a / S indicates that it is a minimum A or S
- Y / L indicates that it is a branched chain aliphatic or aromatic Y or L.
- W / Y / H indicates that it is an aromatic W, Y or H.
- the amino acid sequence defining the storage region 4 is composed of the following sequence (SEQ ID NO: 44). However, (W / Y) indicates that it is an aromatic W or Y.
- the amino acid sequence defining the storage region 4 is composed of any of the following sequences.
- REDAARAYYWP FAD-GDH derived from A.cristatus GZAAS20.1005
- SEQ ID NO: 45 REDAARAYYYP (FAD-GDH derived from A.turcosus HMR AF 23)
- RCDSARAYLHP FD-GDH derived from Corynascus sepedonium NBRC 31363
- Conservation region 5 is an amino acid residue corresponding to residues 268 to 289 in FAD-GDH derived from A.cristatus GZAAS20.1005, and corresponds to residues 271 to 292 in FAD-GDH derived from A.turcosus HMR AF 23. It is an amino acid residue, and is an amino acid residue corresponding to the 272nd to 293th residues in FAD-GDH derived from Corynascus sepedonium NBRC 31363.
- the amino acid sequence defining the storage region 5 is composed of the following sequence (SEQ ID NO: 48). However, (I / V) indicates that it is a branched chain aliphatic I or V.
- (I / V) indicates that it is a branched chain aliphatic I or V.
- (I / V / L) indicates that it is a branched chain aliphatic I, V or L.
- (S / A) indicates that it is a minimum S or A.
- (S / T / A) indicates that it is a small S, T or A.
- (S / A) indicates that it is a minimum S or A.
- (I / L) indicates that it is a branched chain aliphatic I or L.
- (K / R / A / G / I) indicates that it is an aliphatic or positively charged K, R, A, G or I.
- (S / T) indicates that it is a small S or T
- (A / G / V / L / K / Q) means A, G, V, L, or K, Q.
- (I / V / L) indicates that it is a branched chain aliphatic I, V or L.
- (I / V / L / A / H / R) indicates that it is an aliphatic or positively charged I, V, L, A, H or R.
- (I / V) indicates that it is a branched chain aliphatic I or V.
- (D / N / S) indicates that the polarity is small, D, N or S.
- the amino acid sequence defining the storage region 5 is composed of the following sequence (SEQ ID NO: 49).
- (I / V) indicates that it is a branched chain aliphatic I or V.
- (T / A) indicates that it is a small T or A.
- (S / A) indicates that it is a minimum S or A.
- (I / L) indicates that it is a branched chain aliphatic I or L.
- R / I indicates that it is a branched chain aliphatic or positively charged R or I.
- (T / S) indicates that it is a polar / small T or S.
- (A / L) indicates that it is an aliphatic A or L
- (L / I / V) indicates that it is a branched chain aliphatic L, I or V.
- (L / R / A) represents an aliphatic or positively charged L, R or A.
- the amino acid sequence defining the storage region 5 is composed of the following sequence (SEQ ID NO: 50).
- T / A indicates that it is a small T or A.
- I / L indicates that it is a branched chain aliphatic I or L.
- R / I indicates that it is a branched chain aliphatic or positively charged R or I.
- T / S indicates that it is a polar / small T or S.
- L / I indicates that it is a branched chain aliphatic L or I.
- L / R represents an aliphatic or positively charged L or R.
- the amino acid sequence defining the storage region 5 is composed of any of the following sequences.
- EVILSTGSIRTPALLELSGVGN FAD-GDH derived from A.cristatus GZAAS20.1005
- SEQ ID NO: 51 EVILSAGSLISPAILERSGVGN (FAD-GDH derived from A.turcosus HMR AF 23)
- SEQ ID NO: 52 EVVLSAGALRTPLVLEASGVGN (FAD-GDH derived from Corynascus sepedonium NBRC 31363)
- Conservation region 6 is an amino acid residue corresponding to residues 302 to 314 in FAD-GDH derived from A.cristatus GZAAS20.1005, and corresponds to residues 305 to 317 in FAD-GDH derived from A.turcosus HMR AF 23. It is an amino acid residue, and is an amino acid residue corresponding to the 306th to 318th residues in FAD-GDH derived from Corynascus sepedonium NBRC 31363.
- the amino acid sequence defining the storage region 6 is composed of the following sequence (SEQ ID NO: 54). However, (I / V) indicates that it is a branched chain aliphatic I or V.
- (D / N) indicates that it is a small D or N
- (L / A / S / N) represents a branched chain aliphatic or small L, A, S or N.
- (P / A / T) indicates that it is a small P, A or T.
- (G / F / T) indicates that it is hydrophobic G, F or T.
- (E / S) indicates that it is hydrophilic polar E or S.
- (L / M) indicates that it is hydrophobic L or M
- (Q / V) means Q or V
- (D / E) indicates that it is a negatively charged D or E.
- (Q / H) indicates that it is polar Q or H.
- the amino acid sequence defining the storage region 6 is composed of the following sequence (SEQ ID NO: 55).
- V / I indicates that it is a branched chain aliphatic V or I.
- D / N indicates that it is a small D or N
- P / T / A indicates that it is a small P, T or A.
- T / G indicates that it is hydrophobic and small T or G.
- Q / V means Q or V
- D / E indicates that it is a negatively charged D or E.
- the amino acid sequence defining the storage region 6 is composed of the following sequence (SEQ ID NO: 56).
- V / I indicates that it is a branched chain aliphatic V or I.
- D / N indicates that it is a small D or N,
- P / T / A indicates that it is a small P, T or A.
- the amino acid sequence defining the storage region 6 is composed of any of the following sequences.
- VDLPTVGENLQDQ (FAD-GDH derived from A.cristatus GZAAS20.1005)
- SEQ ID NO: 57 INLATVGENLQDQ (FAD-GDH derived from A.turcosus HMR AF 23)
- SEQ ID NO: 58 IDLPGVGENLVEQ (FAD-GDH derived from Corynascus sepedonium NBRC 31363) (SEQ ID NO: 59)
- Conservation region 7 is an amino acid residue corresponding to residues 415 to 425 in FAD-GDH derived from A.cristatus GZAAS20.1005, and corresponds to residues 418 to 418 in FAD-GDH derived from A.turcosus HMR AF 23. It is an amino acid residue, and is an amino acid residue corresponding to the 420th to 430th residues in FAD-GDH derived from Corynascus sepedonium NBRC 31363.
- the amino acid sequence defining the storage region 7 is composed of the following sequence (SEQ ID NO: 60). However, (S / I / V / L) represents a branched chain aliphatic or minimal S, I, V or L.
- V / L / M / A / F indicates that it is hydrophobic V, L, M, A or F.
- L / F indicates that it is hydrophobic L or F
- a / S indicates that it is a minimum A or S
- N / S / Y means N
- I / V / T indicates that it is hydrophobic I, V or T.
- I / V / L indicates that it is a branched chain aliphatic I, V or L.
- the amino acid sequence defining the conserved region 7 is composed of the following sequence (SEQ ID NO: 61).
- (L / F) indicates that it is hydrophobic L or F
- (S / A) indicates that it is a minimum S or A.
- (N / S) means N or S
- (I / L) indicates that it is a branched chain aliphatic I or L.
- amino acid sequence defining the storage region 7 is composed of the following sequence (SEQ ID NO: 62). However, (S / A) indicates that it is a minimum S or A.
- the amino acid sequence defining the storage region 7 is composed of any of the following sequences.
- LLPFSRGNVHI FAD-GDH derived from A.cristatus GZAAS20.1005
- SEQ ID NO: 63 LLPFARGNVHI (FAD-GDH derived from A.turcosus HMR AF 23)
- SEQ ID NO: 64 LFPFSRGSVHL (FAD-GDH derived from Corynascus sepedonium NBRC 31363) (SEQ ID NO: 65)
- Conservation region 8 is an amino acid residue corresponding to residues 509 to 519 in FAD-GDH derived from A.cristatus GZAAS20.1005, and corresponds to residues 513 to 523 in FAD-GDH derived from A.turcosus HMR AF 23. It is an amino acid residue, and is an amino acid residue corresponding to the 517th to 527th residues in FAD-GDH derived from Corynascus sepedonium NBRC 31363.
- the amino acid sequence defining the storage region 8 is composed of the following sequence (SEQ ID NO: 66).
- (I / M) indicates that it is hydrophobic I or M
- (L / M) indicates that it is hydrophobic L or M
- (P / S) indicates that it is a small P or S.
- (R / K / E) indicates that it is a charged R, K or E.
- (D / E / A / G / S / K) means D, E, A, G, S or K
- (I / L / M / A / N / K) means I, L, M, A, N or K.
- (I / V) indicates that it is a branched chain aliphatic I or V.
- (D / N / S) indicates that the polarity is small, D, N or S.
- the amino acid sequence defining the storage region 8 is composed of the following sequence (SEQ ID NO: 67).
- S / D / E indicates that it is a minimal or negatively charged S
- D or E indicates that it is hydrophobic M or L
- S / D indicates that the polarity is small S or D.
- the amino acid sequence defining the storage region 8 is composed of the following sequence (SEQ ID NO: 68). However, (S / D / E) indicates that it is a minimal or negatively charged S, D or E. (S / D) indicates that the polarity is small S or D.
- the amino acid sequence defining the storage region 8 is composed of any of the following sequences.
- MMPRSMGGVVS FAD-GDH derived from A.cristatus GZAAS20.1005
- SEQ ID NO: 69 MMPREMGGVVD (FAD-GDH derived from A.turcosus HMR AF 23)
- SEQ ID NO: 70 MMPRALGGVVD (FAD-GDH derived from Corynascus sepedonium NBRC 31363) (SEQ ID NO: 71)
- Conservation region 9 is an amino acid residue corresponding to residues 524 to 536 in FAD-GDH derived from A.cristatus GZAAS20.1005, and corresponds to residues 528 to 540 in FAD-GDH derived from A.turcosus HMR AF 23. It is an amino acid residue, and is an amino acid residue corresponding to the 532nd to 544th residues in FAD-GDH derived from Corynascus sepedonium NBRC 31363.
- the amino acid sequence defining the storage region 9 is composed of the following sequence (SEQ ID NO: 72). However, (Y / H) indicates that it is an aromatic Y or H.
- G / D indicates that it is a small G or D
- a / S / T / K means A, S, T or K
- L / V indicates that it is a branched chain aliphatic L or V.
- I / V indicates that it is a branched chain aliphatic I or V.
- the amino acid sequence defining the conserved region 9 is composed of the following sequence (SEQ ID NO: 73).
- H / Y indicates that it is an aromatic H or Y.
- S / A indicates that it is a minimum S or A.
- I / V indicates that it is a branched chain aliphatic I or V.
- the amino acid sequence defining the storage region 9 is composed of any of the following sequences.
- VHGTSNVRIVDAS (FAD-GDH derived from A.cristatus GZAAS20.1005) (SEQ ID NO: 74)
- VYGTANVRVVDAS (FAD-GDH derived from A.turcosus HMR AF 23)
- SEQ ID NO: 75 VYGTANVRVVDAS (FAD-GDH derived from Corynascus sepedonium NBRC 31363)
- Conservation region 10 is an amino acid residue corresponding to residues 551 to 562 in FAD-GDH derived from A.cristatus GZAAS20.1005, and corresponds to residues 555 to 566 in FAD-GDH derived from A.turcosus HMR AF 23. It is an amino acid residue, and is an amino acid residue corresponding to the 559th to 570th residues in FAD-GDH derived from Corynascus sepedonium NBRC 31363.
- the amino acid sequence defining the storage region 10 is composed of the following sequence (SEQ ID NO: 77). However, (Y / F) indicates that it is an aromatic Y or F. (A / G) indicates that it is a minimum A or G.
- (I / L / V) indicates that it is a branched chain aliphatic I, L or V.
- a / S indicates that it is a minimum A or S
- R / K / L indicates that it is a branched chain aliphatic or positively charged R, K or L.
- a / I / T indicates that it is hydrophobic A, I or T.
- a / S indicates that it is a minimum A or S
- (D / E) indicates that it is a negatively charged D or E.
- (I / L / V / F / R / Q) means I, L, V, F, R or Q.
- (I / L) indicates that it is a branched chain aliphatic I or L.
- K / E / Q indicates that it is polar K, E or Q.
- the amino acid sequence defining the storage region 10 is composed of the following sequence (SEQ ID NO: 78).
- (A / G) indicates that it is a minimum A or G.
- (I / V / L) indicates that it is a branched chain aliphatic I, V or L.
- (S / A) indicates that it is a minimum S or A.
- (L / I) indicates that it is a branched chain aliphatic L or I.
- the amino acid sequence defining the storage region 10 is composed of the following sequence (SEQ ID NO: 79).
- (I / V) indicates that it is a branched chain aliphatic I or V.
- (S / A) indicates that it is a minimum S or A.
- (L / I) indicates that it is a branched chain aliphatic L or I.
- the amino acid sequence defining the storage region 10 is composed of any of the following sequences.
- YAIAERASDLIK FAD-GDH derived from A.cristatus GZAAS20.1005
- SEQ ID NO: 80 YAVAERAADIIK
- SEQ ID NO: 81 YGLAERASDIIK
- Corynascus sepedonium NBRC 31363 SEQ ID NO: 82
- the number of storage areas possessed is 1, 2, 3, 4, 5, 6, 7, 8, 9, or 10. Generally, it is better to have a large number of storage areas. Therefore, typically, the more conserved regions it has, the more preferred the enzyme will be, and in the most preferred embodiment it will have all of the conserved regions 1-10.
- This enzyme can be easily prepared by genetic engineering techniques. For example, it can be prepared by transforming an appropriate host cell (for example, Escherichia coli) with DNA encoding this enzyme and recovering the protein expressed in the transformed body. The recovered protein is appropriately purified according to the purpose. If this enzyme is obtained as a recombinant protein in this way, various modifications are possible. For example, if the DNA encoding this enzyme and another suitable DNA are inserted into the same vector and a recombinant protein is produced using the vector, it will consist of a recombinant protein to which any peptide or protein is linked. This enzyme can be obtained. Further, modifications may be made so as to add sugar chains and / or lipids, or to process the N-terminal or C-terminal. With the above modifications, it is possible to extract the recombinant protein, simplify the purification, add a biological function, and the like.
- an appropriate host cell for example, Escherichia coli
- the second aspect of the present invention provides nucleic acids related to this enzyme. That is, a gene encoding this enzyme is provided.
- the gene encoding this enzyme is typically utilized in the preparation of this enzyme. According to the genetic engineering preparation method using the gene encoding this enzyme, it is possible to obtain this enzyme in a more homogeneous state. In addition, this method can be said to be a suitable method when preparing a large amount of this enzyme.
- the use of the gene encoding this enzyme is not limited to the preparation of this enzyme.
- the nucleic acid can be used as a tool for experiments for the purpose of elucidating the mechanism of action of this enzyme, or as a tool for designing or producing a further mutant of the enzyme.
- the "gene encoding this enzyme” refers to a nucleic acid obtained by expressing this enzyme, not to mention a nucleic acid having a base sequence corresponding to the amino acid sequence of this enzyme. Also includes nucleic acids in which a sequence that does not encode an amino acid sequence is added to such nucleic acid. Also, codon degeneracy is taken into account.
- sequence of the gene encoding this enzyme examples include SEQ ID NO: 5 (sequence encoding FAD-GDH derived from Aspergillus cristatus), SEQ ID NO: 6 (sequence encoding FAD-GDH derived from Aspergillus tarcosus), SEQ ID NO: 7 (sequence number 7 The sequence encoding FAD-GDH derived from Corniascus sepedonium) is shown.
- the nucleic acid of the present invention has been isolated by using standard genetic engineering techniques, molecular biological techniques, biochemical techniques, etc. with reference to the sequence information disclosed in the present specification or the attached sequence table. Can be prepared in a fresh state.
- a nucleic acid having the same function as the protein encoded by the enzyme when compared with the base sequence of the gene encoding the present enzyme but having a different base sequence in some parts (hereinafter, "equivalent nucleic acid").
- a base sequence that defines an equivalent nucleic acid is also referred to as an "equivalent base sequence”).
- an enzyme characteristic of this enzyme consists of a base sequence containing substitution, deletion, insertion, addition, or inversion of one or more bases based on the base sequence of the nucleic acid encoding this enzyme.
- Nucleic acids encoding proteins with activity ie, GDH activity
- Base substitutions and deletions may occur at multiple sites.
- plural here means, for example, 2 to 40 bases, preferably 2 to 20 bases, and more preferably 2 to 10 bases, although it varies depending on the position and type of amino acid residues in the three-dimensional structure of the protein encoded by the nucleic acid. Is.
- the equivalent nucleic acid is 30% or more, 40% or more, 50% or more, 60% or more, 70% or more, 80% or more, 85 with respect to the reference base sequence (any of the sequences of SEQ ID NOs: 5 to 7). Has% or more, 90% or more, 92% or more, 95% or more, or 99% or more identity (the higher the percentage of identity, the more preferable).
- the equivalent nucleic acid has a moiety encoding a unique region of the invention and an amino acid sequence of 11 regions of storage regions 1-10.
- the equivalent nucleic acid of the preferred embodiment is a nucleotide sequence encoding the amino acid sequence of the specific region (SEQ ID NO: 1), an amino acid sequence of the conserved region 1 (for example, the amino acid sequence of SEQ ID NO: 24, preferably the amino acid sequence of SEQ ID NO: 25, and more.
- a nucleotide sequence encoding preferably the amino acid sequence of SEQ ID NO: 26
- an amino acid sequence of the storage region 2 for example, the amino acid sequence of SEQ ID NO: 30, preferably the amino acid sequence of SEQ ID NO: 31, more preferably the amino acid sequence of SEQ ID NO: 32).
- nucleotide sequence encoding the nucleotide sequence encoding the amino acid sequence of the conservation region 3 (for example, the nucleotide sequence of SEQ ID NO: 36, preferably the nucleotide sequence of SEQ ID NO: 37, more preferably the nucleotide sequence of SEQ ID NO: 38), the nucleotide sequence of the conservation region 4
- a nucleotide sequence encoding a sequence for example, an amino acid sequence of SEQ ID NO: 42, preferably an amino acid sequence of SEQ ID NO: 43, more preferably an amino acid sequence of SEQ ID NO: 44
- an amino acid sequence of a storage region 5 for example, an amino acid sequence of SEQ ID NO: 48,
- a nucleotide sequence encoding (preferably the amino acid sequence of SEQ ID NO: 56), an amino acid sequence of the storage region 7 (for example, the amino acid sequence of SEQ ID NO: 60, preferably the amino acid sequence of SEQ ID NO: 61, more preferably the amino acid sequence of SEQ ID NO: 62).
- the nucleotide sequence encoding the sequence for example, the amino acid sequence of SEQ ID NO: 72, preferably the amino acid sequence of SEQ ID NO: 73
- the amino acid sequence of the storage region 10 for example, the amino acid sequence of SEQ ID NO: 77, preferably the amino acid sequence of SEQ ID NO: 78. More preferably, it has a base sequence encoding (the amino acid sequence of SEQ ID NO: 79) as a part thereof.
- Equivalent nucleic acids as described above are, for example, restriction enzyme treatment, treatment with exonuclease, DNA ligase, etc., position-specific cloning method (Molecular Cloning, Third Edition, Chapter 13, Cold Spring Harbor Laboratory Press, New York) or random sudden. It can be obtained by introducing a mutation by a mutation introduction method (Molecular Cloning, Third Edition, Chapter 13, Cold Spring Harbor Laboratory Press, New York). Equivalent nucleic acids can also be obtained by other methods such as ultraviolet irradiation.
- the present invention further provides recombinant DNA containing the gene of the present invention (gene encoding the present enzyme).
- the recombinant DNA of the present invention is provided, for example, in the form of a vector.
- vector refers to a nucleic acid molecule capable of transporting a nucleic acid inserted therein into a target such as a cell.
- Escherichia coli-hosted vectors include M13 phage or its variants, ⁇ phage or its variants, pBR322 or its variants (pB325, pAT153, pUC8, etc.), and yeast-hosted vectors include pYepSec1, pMFa, pYES2.
- Etc., pAc, pVL, etc. can be exemplified as vectors having insect cells as hosts, pCDM8, pMT2PC, etc. can be exemplified as vectors using mammalian cells, and pUC19, etc. can be exemplified as vectors hosting filamentous fungi.
- the vector of the present invention is preferably an expression vector.
- the "expression vector” refers to a vector in which the nucleic acid inserted therein can be introduced into a target cell (host cell) and can be expressed in the cell.
- the expression vector usually contains a promoter sequence necessary for the expression of the inserted nucleic acid, an enhancer sequence that promotes the expression, and the like.
- Expression vectors containing selectable markers can also be used. When such an expression vector is used, the presence or absence (and its degree) of introduction of the expression vector can be confirmed by using a selectable marker.
- Insertion of the nucleic acid of the present invention into a vector, insertion of a selection marker gene (if necessary), insertion of a promoter (if necessary), etc. are standard recombinant DNA techniques (for example, Molecular Cloning, Third Edition, 1.84, Cold). It can be carried out using a well-known method using restriction enzymes and DNA ligase, which can refer to Spring Harbor Laboratory Press, New York).
- microorganisms such as Escherichia coli (Escherichia coli), Saccharomyces cerevisiae (Saccharomyces cerevisiae), and filamentous fungi (Aspergillus oryzae) as host cells, but recombinant DNA replicates. It can be used as long as it is a host cell capable of expressing the gene of this enzyme.
- Escherichia coli include Escherichia coli BL21 (DE3) pLysS when a T7 promoter is used, and Escherichia coli JM109 otherwise.
- Aspergillus oryzae RIB40 can be mentioned as an example of filamentous fungi.
- budding yeast include budding yeast SHY2, budding yeast AH22, and budding yeast INVSc1 (Invitrogen).
- the present invention provides a microorganism (that is, a transformant) carrying the recombinant DNA of the present invention.
- the microorganism of the present invention can be obtained by transfection or transformation using the vector of the present invention.
- the calcium chloride method Journal of Molecular Biology (J. Mol. Biol.), Vol. 53, p. 159 (1970)
- the Hanahan method Journal of Molecular Biology, Vol. 166, No. 557.
- SEM method Gene, Vol. 96, p. 23 (1990)]
- Chung et al.'S method Proceedings of the National Academy of Sciences of the USA, No. 86) Volume, p.
- a further aspect of the present invention relates to a method for preparing the enzyme.
- this enzyme is prepared by a genetic engineering method. Specifically, first, a gene encoding this enzyme is prepared (step (1)). Specifically, for example, a nucleic acid encoding any of the amino acid sequences of SEQ ID NOs: 2 to 4 is prepared.
- the "nucleic acid encoding any of the amino acid sequences of SEQ ID NOs: 2 to 4" is a nucleic acid from which a polypeptide having the amino acid sequence can be obtained when it is expressed, and the base corresponding to the amino acid sequence.
- nucleic acid consisting of a sequence
- an extra sequence (a sequence encoding an amino acid sequence or a sequence not encoding an amino acid sequence) may be added to such a nucleic acid.
- codon degeneracy is taken into account.
- Nucleic acid encoding any of the amino acid sequences of SEQ ID NOs: 2 to 4" is a standard genetic engineering method, molecular biological method, with reference to the sequence information disclosed in this specification or the attached sequence table. It can be prepared in an isolated state by using a biochemical method or the like.
- the prepared gene is expressed (step (2)).
- an expression vector into which the above gene is inserted is prepared, and the host cell is transformed using this.
- the transformant is cultured under the condition that the mutant enzyme which is an expression product is produced.
- the transformant may be cultured according to a conventional method.
- the carbon source used in the medium may be any assimilating carbon compound, and for example, glucose, shoe cloth, lactose, maltose, molasses, pyruvic acid and the like are used.
- the nitrogen source may be any available nitrogen compound, and for example, peptone, meat extract, yeast extract, casein hydrolyzate, soybean meal alkaline extract and the like are used.
- salts such as phosphates, carbonates, sulfates, magnesium, calcium, potassium, iron, manganese, and zinc, specific amino acids, specific vitamins, etc. are used as needed.
- the culture temperature can be set in consideration of the growth characteristics of the transformant to be cultured and the production characteristics of the mutant enzyme. It can be preferably set within the range of 30 ° C. to 40 ° C. (more preferably around 37 ° C.).
- the culturing time can be set in consideration of the growth characteristics of the transformant to be cultivated, the production characteristics of the mutant enzyme, and the like.
- the pH of the medium is adjusted within the range in which the transformant grows and the enzyme is produced.
- the pH of the medium is preferably about 6.0 to 9.0 (preferably around pH 7.0).
- the expression product (GDH) is recovered (step (3)).
- the culture solution containing the cells after culturing can be used as it is, or can be used as an enzyme solution after concentration, removal of impurities, etc., but in general, the expressed product is once recovered from the culture solution or cells. If the expressed product is a secretory protein, it can be recovered from the culture medium, and if it is not, it can be recovered from the cells.
- the culture supernatant is filtered and centrifuged to remove insoluble matter, and then concentrated under reduced pressure, membrane-concentrated, chromatographed using ammonium sulfate or sodium sulfate, methanol, ethanol, acetone, or the like.
- chromatography such as fractional precipitation, dialysis, heat treatment, isoelectric point treatment, gel filtration, adsorption chromatography, ion exchange chromatography, affinity chromatography (eg, Sephadex gel (GE Healthcare Bioscience)) Gel filtration by means of DEAE Sephadex CL-6B (GE Healthcare Bioscience), Octyl Sephadex CL-6B (GE Healthcare Bioscience), CM Sephadex CL-6B (GE Healthcare Bioscience), etc.
- a refined product of GDH can be obtained by performing purification.
- the cells are collected by filtering or centrifuging the culture solution, and then the cells are subjected to a mechanical method such as pressure treatment or sonication, or an enzyme d by lysozyme or the like.
- a refined product of GDH can be obtained by separating and purifying in the same manner as described above after destruction by a specific method.
- the degree of purification of the enzyme is not particularly limited, but for example, it can be purified to a state where the specific activity is 0.1 to 1000 (U / mg), preferably 1 to 500 (U / mg).
- the final form may be liquid or solid (including powder).
- the purified enzyme obtained as described above in powder form by, for example, freeze-drying, vacuum-drying, or spray-drying.
- the purified enzyme may be previously dissolved in a phosphate buffer solution, a triethanolamine buffer solution, a Tris-hydrochloric acid buffer solution, or a GOOD buffer solution.
- a phosphate buffer solution or a triethanolamine buffer solution can be used.
- examples of the GOOD buffer solution include PIPES, MES, and MOPS.
- the gene expression-expression product (GDH) is recovered using an appropriate host-vector system as described above, but a cell-free synthesis system may also be used.
- the "cell-free synthesis system refers to ribosomes derived from living cells (or obtained by genetic engineering techniques) rather than using living cells. It refers to the in vitro synthesis of the mRNA or protein encoded by a nucleic acid (DNA or mRNA) that is a template, using a transcription / translation factor or the like.
- a cell extract obtained by purifying a cell disruption solution as needed is generally used.
- Cell extracts generally contain various factors such as ribosomes and initiation factors required for protein synthesis, and various enzymes such as tRNA. When synthesizing proteins, various amino acids, energy sources such as ATP and GTP, and other substances necessary for protein synthesis such as creatine phosphate are added to this cell extract. Of course, at the time of protein synthesis, ribosomes, various factors, and / or various enzymes prepared separately may be supplemented as needed.
- cell-free transcription / translation system is used interchangeably with cell-free protein synthesis system, in vitro translation system or in vitro transcription / translation system.
- RNA is used as a template to synthesize proteins.
- total RNA, mRNA, in vitro transcript, etc. are used as the template RNA.
- DNA is used as a template in the other in vitro transcription / translation system.
- the template DNA should contain a ribosome binding region and preferably contains a suitable terminator sequence.
- in the in vitro transcription / translation system conditions are set in which factors necessary for each reaction are added so that the transcription reaction and the translation reaction proceed continuously.
- a further aspect of the present invention relates to the use of this enzyme.
- a glucose measurement method using this enzyme is provided.
- the amount of glucose in a sample is measured by utilizing the redox reaction by this enzyme.
- the present invention can be applied to various applications in which changes due to this reaction can be utilized.
- the present invention relates to, for example, measurement of blood glucose level (self-blood glucose measurement (SMBG) and continuous blood glucose measurement (CGM)), measurement of glucose contained in body fluids other than blood (for example, tears, saliva, interstitial fluid, urine, etc.), foods, etc. It is used for measuring glucose concentration in (seasoning, beverages, etc.).
- SMBG self-blood glucose measurement
- CGM continuous blood glucose measurement
- the present invention may be used to check the degree of fermentation in the process of producing a fermented food (for example, vinegar) or a fermented beverage (for example, beer or liquor).
- the present invention also provides a reagent for measuring glucose containing the present enzyme.
- the reagent is used in the above-mentioned glucose measurement method of the present invention.
- Serum albumin, proteins, surfactants, sugars, sugar alcohols, inorganic salts and the like may be added for the purpose of stabilizing the glucose measurement reagent and activating it during use.
- Glucose measurement reagents can also be a component of the measurement kit.
- the present invention also provides a kit (glucose measurement kit) containing the above-mentioned glucose measurement reagent.
- the kit of the present invention contains the above-mentioned reagent for measuring glucose as an essential component.
- a reaction reagent, a buffer solution, a glucose standard solution, a container and the like are included as arbitrary elements.
- An instruction manual is usually attached to the glucose measurement kit of the present invention.
- the present invention also provides a glucose sensor containing the present enzyme.
- a glucose sensor containing the present enzyme In a typical structure of the glucose sensor of the present invention, an electrode system having a working electrode and a counter electrode is formed on an insulating substrate, and a reagent layer containing the enzyme and a mediator is formed on the electrode system. More specifically, a reagent layer is usually coated on the working electrode.
- the present invention can also be applied to a face-to-face glucose sensor configured such that the working electrode and the counter electrode face each other.
- a measurement system including a reference electrode may be used.
- each electrode is not particularly limited.
- the working electrode and the electrode material of the counter electrode are gold (Au), carbon (C), platinum (Pt), and titanium (Ti).
- a ferricyan compound (potassium ferricyanide, etc.), a metal complex (lutenium complex, osmium complex, vanadium complex, etc.), a quinone compound (pyrroloquinoline quinone, etc.) and the like are used.
- a ferricyan compound potassium ferricyanide, etc.
- a metal complex lutenium complex, osmium complex, vanadium complex, etc.
- quinone compound pyrroloquinoline quinone, etc.
- the enzyme preparation of the present invention may contain excipients, buffers, suspensions, stabilizers, preservatives, preservatives, physiological saline and the like.
- excipient starch, dextrin, maltose, trehalose, lactose, sorbitol, D-mannitol, sucrose, glycerol, sugar ester and the like, derivatives thereof, and D-glucose derivatives can be used.
- As the buffer phosphate, citrate, acetate and the like can be used. Propylene glycol, ascorbic acid and the like can be used as the stabilizer.
- phenol benzalkonium chloride
- benzyl alcohol chlorobutanol
- methylparaben and the like can be used.
- ethanol benzalkonium chloride, paraoxybenzoic acid, chlorobutanol and the like can be used.
- Applications of the enzyme preparation include, for example, measurement of glucose, measurement of blood glucose level, and measurement of fermentation degree.
- GDH Glucose Dehydrogenase Screening Method
- the screening method of the present invention is useful as a means for identifying and obtaining a novel GDH.
- the following steps (i) and (ii) are performed.
- Steps to search for an amino acid sequence showing 20% or more identity with respect to a known GDH amino acid sequence using an amino acid sequence database (ii) From the hit amino acid sequences, the following sequence (sequence) Number 1), that is, (However, the numbers above each amino acid residue in the formula are serial numbers from the N-terminal side, H / N represents H (histidine) or N (asparagin), and L / I / M is L (leucine).
- V / I stands for V (valine) or I (isoleucine)
- G / A / S stands for G (glycine)
- F / W / Y represents F (phenylalanine), W (tryptophane) or Y (tyrosine)
- X represents an arbitrary amino acid residue
- an amino acid database is used to determine a sequence showing a predetermined homology to the amino acid sequence of a specific condition, that is, a known specific GDH (hereinafter referred to as "reference GDH") as a reference.
- reference GDH a known specific GDH
- This is the step to search.
- one GDH is used as the reference GDH, but a plurality of GDHs may be used in combination as the reference GDH, and a sequence showing a predetermined homology to all of them may be searched.
- an amino acid sequence showing 20% or more identity with respect to the amino acid sequence of the reference GDH is searched.
- the known GDH that is, the reference GDH is not particularly limited, and examples thereof include FAD-GDH derived from Aspergillus oryzae (for example, one having the amino acid sequence of SEQ ID NO: 22) and FAD-GDH derived from Aspergillus terreus (for example, of SEQ ID NO: 23). Those having an amino acid sequence) can be mentioned.
- the amino acid sequence database to be used is not particularly limited.
- Swiss-Prot http://www.expasy.org/sprot/
- PIR Databases such as http://pir.georgetown.edu/
- a sequence satisfying the above conditions is searched from the GMC oxidoreductase family.
- the search target is limited to the amino acid sequences of proteins (enzymes) belonging to the GMC oxidoreductase family to improve search efficiency.
- step (ii) following step (i) those having the amino acid region specified in Rule 1 are identified and selected from the hit amino acid sequences. If there is only one hit sequence, it will be confirmed whether or not it has the amino acid region specified in Rule 1, and if it does, it is judged to be promising. Since Rule 1 is as described in the first aspect of the present invention (2. Glucose dehydrogenase (GDH) column), the above description is incorporated and the details thereof will be omitted.
- GDH Glucose dehydrogenase
- the amino acid region defined by Rule 1 also satisfies Rule 2 (Conditions 1 and 2).
- Rule 2 an amino acid sequence having an amino acid region satisfying Rules 1 and 2 is selected. Since Rule 2 is as described in the first aspect of the present invention (2. Glucose dehydrogenase (GDH) column), the above description is incorporated and the details thereof will be omitted.
- the amino acid region defined in Rule 1 also satisfies Rule 3.
- an amino acid sequence having an amino acid region satisfying Rules 1 to 3 is selected. Since Rule 3 is as described in the first aspect of the present invention (2. Glucose dehydrogenase (GDH) column), the above description is incorporated and the details thereof will be omitted.
- step (iii) from the amino acid sequences selected in step (ii), those having the storage regions 1 to 10 described in the first aspect above are selected (step (iii)). If there is only one amino acid sequence selected in step (ii), it will be confirmed whether or not it has storage regions 1 to 10, and if it does, it is judged to be promising.
- Promising amino acid sequences will be selected by steps (i) and (ii), or steps (i) to (iii), and it is confirmed whether or not the selected amino acid sequences actually function as GDH. It is preferable to do so. That is, preferably, a step (step (iv)) of confirming the GDH activity of the protein consisting of the selected amino acid sequence is performed. If GDH activity is observed, it is identified as a promising novel GDH. Also, if the GDH activity is high, it will be identified as particularly promising. To confirm the GDH activity, for example, the activity measuring method shown in Examples described later may be used.
- a further aspect of the present invention relates to a method for designing modified GDH.
- the design method of the present invention is useful, for example, as a means of increasing the activity of known GDH. It can also be used as a means of converting a promising protein as GDH into GDH (that is, imparting GDH activity) by showing a certain degree of homology to known GDH.
- modified GDH is GDH obtained by partially modifying (modifying) an existing amino acid sequence. Therefore, there is a difference between the amino acid sequence before modification and the amino acid sequence after modification.
- Step (II) A step of constructing a modified amino acid sequence by identifying a region corresponding to the amino acid region in the prepared amino acid sequence and then modifying the region so as to correspond to the amino acid region.
- Step (I) is a step of preparing an amino acid sequence to be modified (referred to as "amino acid sequence to be modified").
- an amino acid sequence having 20% or more identity with respect to a known GDH amino acid sequence or a known GDH amino acid sequence that does not have the amino acid region specified in Rule 1 is selected.
- the amino acid sequence to be modified is selected.
- an amino acid sequence similar to the amino acid region for example, 1 to 4, preferably 1 to 3, more preferably 1 or 2 is the amino acid of Rule 1.
- Those having (different from the sequence) are designated as the amino acid sequence to be modified.
- the known GDH is not particularly limited.
- GDH GDH
- FAD-GDH derived from Aspergillus oryzae for example, one having the amino acid sequence of SEQ ID NO: 21
- FAD-GDH derived from Aspergillus terreus for example, one having the amino acid sequence of SEQ ID NO: 22
- Amino acid sequences showing 20% or more identity with respect to known GDH amino acid sequences are searched and identified by the method described in step (i) of the above aspect (5. Glucose dehydrogenase (GDH) screening method). do it.
- amino acid sequence showing 20% or more identity with respect to the known amino acid sequence of GDH As specific examples of the amino acid sequence showing 20% or more identity with respect to the known amino acid sequence of GDH, the amino acid sequence shown in SEQ ID NO: 8 (derived from Aspergillus weentii) and the amino acid sequence shown in SEQ ID NO: 9 ( Aspergillus Wentii (derived from Aspergillus weentii), amino acid sequence shown in SEQ ID NO: 10 (derived from Aspergillus thermomutatus), amino acid sequence shown in SEQ ID NO: 11 (derived from Aspergillus cristatus). be able to.
- step (II) following step (I) first, in the prepared amino acid sequence, a region corresponding to the amino acid region specified in Rule 1 (referred to as "modification target region") is specified.
- modification target region a region corresponding to the amino acid region specified in Rule 1
- a part of Rule 1 conditions related to the first half (1st amino acid residue to 6th amino acid residue), 2nd half (7th amino acid residue to 13th amino acid residue), 1st amino acid residue ⁇ Region to be modified using the criteria or conditions that satisfy the conditions for amino acid 5th residue, amino acid 5th to 9th amino acid residues, 7th amino acid residue to 11th amino acid residue, etc.
- the amino acid region defined by Rule 1 corresponds to a continuous 13 amino acid sequence existing in the vicinity of positions 140 to 180 of FAD-GDH derived from filamentous fungi.
- the modification target region is modified so as to correspond to the amino acid region specified in Rule 1. That is, the amino acid composition of the region to be modified is changed so that the condition of Rule 1 is satisfied.
- a modified amino acid sequence having an amino acid region defined in Rule 1 (a region to be modified is modified) is constructed.
- the amino acid region defined by Rule 1 also satisfies Rule 2 (Conditions 1 and 2).
- the region to be modified is modified so as to have an amino acid region that satisfies rules 1 and 2.
- a modified amino acid sequence having an amino acid region satisfying Rules 1 and 2 is constructed. Since Rule 2 is as described in the first aspect of the present invention (2. Glucose dehydrogenase (GDH) column), the above description is incorporated and the details thereof will be omitted.
- the amino acid region defined in Rule 1 also satisfies Rule 3.
- the region to be modified is modified so as to have an amino acid region that satisfies Rules 1 to 3.
- a modified amino acid sequence having an amino acid region satisfying Rules 1 to 3 is constructed. Since Rule 3 is as described in the first aspect of the present invention (2. Glucose dehydrogenase (GDH) column), the above description is incorporated and the details thereof will be omitted.
- step (III) it is confirmed whether the constructed modified amino acid sequence has the preservation regions 1 to 10 described in the first aspect above, and if not, the modified amino acid sequence is further modified to have it (step (III)). This step may be performed in parallel with step (II).
- step (IV)) of confirming the GDH activity of the protein consisting of the constructed modified amino acid sequence is performed. If improvement in GDH activity is observed, such as when GDH activity is improved from before modification or when modification causes GDH activity to be exhibited, a protein consisting of the constructed modified amino acid sequence is effectively modified. Identify as GDH.
- a further aspect of the present invention provides a method for preparing glucose dehydrogenase as an application of the above screening and design methods.
- this preparation method the following steps (1) to (3) are performed.
- Step of preparing glucose dehydrogenase by the screening method of the present invention or the design method of the present invention (2) Step of culturing the microorganism expressing the glucose dehydrogenase (3) Step of recovering the expression product from the culture
- glucose dehydrogenase is prepared by the screening method of the present invention or the design method of the present invention (step (1)).
- the prepared microorganism expressing glucose dehydrogenase is cultured (step (2)).
- the microorganism here is typically a wild strain or a mutant strain thereof that produces the glucose dehydrogenase when glucose dehydrogenase is prepared by using a screening method, or a transformant into which the gene for the glucose dehydrogenase has been introduced.
- the expression product is recovered from the culture (step (3)). This operation may be performed according to step (3) in the above-mentioned preparation method 1 for glucose dehydrogenase (GDH).
- the numbers above each amino acid residue in the formula are serial numbers from the N-terminal side, and (H / N) indicates that it is H (histidine) or N (asparagin), and (L / I / M). ) Indicates L (leucine), I (isoleucine) or M (methionine), (V / I) indicates V (valine) or I (isoleucine), and (G / A / S) Indicates G (glycine), A (alanine) or S (serine), (F / W / Y) indicates F (phenylalanine), W (tryptophane) or Y (tyrosine), and X Indicates that it is an arbitrary amino acid residue.
- Rule 2 Condition 1: For the 8th amino acid residue, the 12th amino acid residue, and the 13th amino acid residue, the sum of the values of CRAJ730103 (Normalized frequency of turn) listed in the database AAindex, that is, (8th amino acid residue). (Numerical value of +12 amino acid residue + Numerical value of 13th amino acid residue) satisfies the condition that it is 3.79 or less.
- Rule 2 Condition 2: For the 8th amino acid residue, the 11th amino acid residue, the 12th amino acid residue, and the 13th amino acid residue, the sum of the values of TANS770109 (Normalized frequency of coil) listed in the database AAindex, that is, The condition that (the numerical value of the 8th amino acid residue + the numerical value of the 11th amino acid residue + the numerical value of the 12th amino acid residue + the numerical value of the 13th amino acid residue) is 2.83 or more is satisfied.
- Rule 3 For amino acid 3 and 4, the sum of the values of JANJ780101 (Average accessible surface area) listed in the database AAindex, that is, (the value of amino acid 3 + the value of amino acid 4) Satisfies the condition that is 66 or more.
- An artificially synthesized gene was prepared for the gene, and DNA was amplified by PCR using the gene as a template. The amplified DNA was ligated to the yeast expression vector pYES2 and introduced into the S. cerevisiae strain by the protoplast method.
- Enzyme activity measurement method As a measurement principle, when GDH is allowed to act on D-glucose and Phenazine methosulfate (hereinafter abbreviated as "PMS"), glucose is oxidized while PMS is reduced. Reduced PMS reduces Nitrotetrazorium blue (hereinafter abbreviated as "NTB”). Diformazan pigments are formed when NTB is reduced by reduced PMS. Enzyme activity is measured by detecting this diformazan dye at 570 nm. The experimental procedure is as follows.
- the absorbances A3 (after 3 minutes) and A5 (after 5 minutes) of the reaction solution at a wavelength of 570 nm are measured.
- 50 mmol / LPIPES-NaOH buffer pH 6.5 containing 0.1% TrironX-100, 0.1% BSA, 1 mmol / L CaCl 2
- the FAD-GDH activity value was calculated by substituting the values of A3, A5, Ab3, and Ab5 into the following formula.
- the FAD-GDH activity of the sample prepared from the A. oryzae RIB40 strain culture medium into which the gene derived from the Corynascus sepedonium NBRC31363 strain was introduced was confirmed. It was also confirmed that the transformed RIB40 strain culture medium into which the GDH gene was not introduced as a subject did not show GDH activity. This sample showed FAD-GDH activity with good reproducibility. Furthermore, when the stability was confirmed, it was also found that the stability was significantly better than that of FAD-GDH derived from A. oryzae (Table 5).
- the enzyme having extremely excellent stability is highly practical and is useful, for example, in glucose measurement applications (particularly blood glucose measurement applications). The stability was calculated by comparing the residual activity rate after treatment at 50 ° C. for 20 minutes in 100 mmol / L phosphate buffer with the activity before treatment.
- A.wentii DTO 134E9 (NCBI Sequence ID: OJJ29827.1) Corresponding region: HNSNGPVQVSFKH (SEQ ID NO: 15) Enzyme overall length: SEQ ID NO: 8 (6)
- A.wentii DTO 134E9 (NCBI Sequence ID: OJJ29704.1) Corresponding area: HGTKGPLKVGWPS (SEQ ID NO: 16) Enzyme full length: SEQ ID NO: 9 (7)
- A.thermomutatus HMR AF 39 (NCBI Sequence ID: XP_026617872.1) Corresponding area: HGSRGPLKVAFPH (SEQ ID NO: 17) Enzyme full length: SEQ ID NO: 10 (8)
- A.cristatus GZAAS20.1005 NCBI Sequence ID: OJJ29827.1
- A.oryzae GDH-specific region NGKEGPLKVGWSG (SEQ ID NO: 19) Enzyme overall length: SEQ ID NO: 21 (10) A.terreus GDH-specific region: HGHEGPLDVAFTQ (SEQ ID NO: 20) Enzyme overall length: SEQ ID NO: 22
- FIG. 2 shows the identity between the known FAD-GDH sequence (A. oryzae-derived FAD-GDH and A. terreus-derived FAD-GDH) and the amino acid sequence of the novel FAD-GDH.
- the glucose dehydrogenase of the present invention is characterized by a newly discovered unique region.
- the glucose dehydrogenase of the present invention can be used for various purposes (for example, for a blood glucose meter).
- the information provided by the present application is useful for searching and identifying new GDH.
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Mycology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Sustainable Development (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Cell Biology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
新規なFAD-GDHを効率的に同定する手段を見出すこと、及び当該手段の用途・応用を図ること(例えば新規FAD-GDHやその遺伝子等の提供)を課題とする。 新たに見出された、FAD-GDH特有のアミノ酸領域及びそれを含む新規FAD-GDHが提供される。また、当該アミノ酸領域を利用したFAD-GDHのスクリーニング方法及び設計方法が提供される。
Description
本発明はグルコースデヒドロゲナーゼ(グルコース脱水素酵素)に関する。詳しくは、特定のアミノ酸領域で特徴付けられるグルコースデヒドロゲナーゼ及びその遺伝子等、並びにグルコースデヒドロゲナーゼのスクリーニング方法及び改変方法等に関する。
糖尿病患者は年々増加しており、糖尿病患者、特にインスリン依存性の患者は血糖値を日常的に監視し血糖をコントロールする必要がある。近年、酵素を用いてリアルタイムで簡便にかつ正確に測定できる自己血糖測定器で糖尿病患者の血糖値をチェック出来るようになった。グルコースセンサ(例えば、自己血糖測定器に使用されるセンサ)用として、グルコースオキシダーゼ(E.C.1.1.3.4)、PQQ依存性グルコースデヒドロゲナーゼ(E.C.1.1.5.2)(例えば特許文献1~3を参照)が開発されたが、酸素反応性、マルトース、ガラクトースへの反応性が問題となった。この問題を解決すべく、FAD依存性グルコースデヒドロゲナーゼ(以下、「FAD-GDH」と略称する)が開発された(例えば特許文献4~6、非特許文献1~4を参照)。血糖値の測定(自己血糖測定(SMBG)及び持続血糖測定(CGM))に有用なFAD-GDHの報告は多数あるが、その多くは糸状菌由来であり、glucose-methanol-choline (GMC) oxidoreductase familyに属し、アミノ酸配列の相同性は高く、従って立体構造も類似していると考えられている。
Studies on the glucose dehydrogenase of Aspergillus oryzae. I. Induction of its synthesis by p-benzoquinone and hydroquinone, T.C. Bak, and R. Sato, Biochim. Biophys.Acta, 139, 265-276(1967).
Studies on the glucose dehydrogenase of Aspergillus oryzae. II. Purification and physical and chemical properties, T.C. Bak, Biochim. Biophys. Acta, 139, 277-293 (1967).
Studies on the glucose dehydrogenase of Aspergillus oryzae. III. General enzymatic properties, T.C. Bak, Biochim. Biophys. Acta, 146, 317-327 (1967).
Studies on the glucose dehydrogenase of Aspergillus oryzae. IV. Histidyl residue as an active site, T.C. Bak, and R. Sato, Biochim. Biophys. Acta, 146, 328-335 (1967).
新たなFAD-GDHの同定/取得を目指す際には公知のグルコースデヒドロゲナーゼ(以下、「GDH」と略称することがある)の配列に対して相同性を示すタンパク質を検索するのが常套手段である。FAD-GDHに特徴的なアミノ酸保存領域(FAD結合部位など)が利用されることもあるが、試行錯誤を伴うのが通常であり、新規なFAD-GDHを効率的に同定することは難しい。そこで本発明は、血糖値の測定等の用途での利用や活用を期待できる、新規なFAD-GDHを効率的に同定する手段を見出すこと、及び当該手段の用途・応用を図ること(例えば新規FAD-GDHやその遺伝子等の提供)を課題とする。
上記課題を解決すべく検討を重ねた結果、FAD-GDHに特有のアミノ酸領域とそれを規定するルール(規則)が見出された。この知見を利用すれば効率的に新規FAD-GDHを同定/取得することができる。事実、複数の新規FAD-GDHの取得に成功した。
以上の知見及び成果に基づき、以下の発明が提供される。
[1]以下の配列(配列番号1)、即ち、
(但し、式中の各アミノ酸残基の上の数字はN末端側からの通し番号であり、H/NはH(ヒスチジン)又はN(アスパラギン)を表し、L/I/MはL(ロイシン)、I(イソロイシン)又はM(メチオニン)を表し、V/IはV(バリン)又はI(イソロイシン)を表し、G/A/SはG(グリシン)、A(アラニン)又はS(セリン)を表し、F/W/YはF(フェニルアラニン)、W(トリプトファン)又はY(チロシン)を表し、Xは任意のアミノ酸残基を表す)からなるアミノ酸領域を有し、
配列番号2~4のいずれかのアミノ酸配列と40%以上同一のアミノ酸配列を含む、グルコースデヒドロゲナーゼ。
[2]8番アミノ酸残基、12番アミノ酸残基、及び13番アミノ酸残基について、データベースAAindex収載のCRAJ730103(Normalized frequency of turn)の数値の合計、即ち、(8番アミノ酸残基の数値+12番アミノ酸残基の数値+13番アミノ酸残基の数値)が3.79以下であるとの条件と、
8番アミノ酸残基、11番アミノ酸残基、12番アミノ酸残基、及び13番アミノ酸残基について、データベースAAindex収載のTANS770109(Normalized frequency of coil)の数値の合計、即ち、(8番アミノ酸残基の数値+11番アミノ酸残基の数値+12番アミノ酸残基の数値+13番アミノ酸残基の数値)が2.83以上であるとの条件、
を前記アミノ酸領域が満足する、[1]に記載のグルコースデヒドロゲナーゼ。
[3]3番アミノ酸残基及び4番アミノ酸残基について、データベースAAindex収載のJANJ780101(Average accessible surface area)の数値の合計、即ち、(3番アミノ酸残基の数値+4番アミノ酸残基の数値)が66以上であるとの条件、
を前記アミノ酸領域が満足する、[2]に記載のグルコースデヒドロゲナーゼ。
[4]全長が530aa~630aaである、[1]~[3]のいずれか一項に記載のグルコースデヒドロゲナーゼ。
[5]そのアミノ酸配列が、配列番号2~4のいずれかのアミノ酸配列と50%以上同一のアミノ酸配列である、[1]~[4]のいずれか一項に記載のグルコースデヒドロゲナーゼ。
[6]そのアミノ酸配列が、配列番号2~4のいずれかのアミノ酸配列と60%以上同一のアミノ酸配列である、[1]~[4]のいずれか一項に記載のグルコースデヒドロゲナーゼ。
[7]以下の保存領域1~10の1つ以上を有する、[1]~[6]のいずれか一項に記載のグルコースデヒドロゲナーゼ:
以下の配列で構成されるアミノ酸配列からなる保存領域1
但し、(F/Y)は芳香族のF又はYであることを表し、(I/V)は芳香族のI又はVであることを表し、(I/V)は分岐鎖脂肪族のI又はVであることを表し、(I/V)は分岐鎖脂肪族のI又はVであることを表し、(G/A)は分岐鎖脂肪族のG又はAであることを表し、(V/A/S/T)は小サイズのV、A、S又はTであることを表し、(S/A/G/C)は極小サイズのS、A、G又はCであることを表し、(V/A/S/T)は小サイズのV、A、S又はTであることを表し、(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表し、(N/S)は極性で小サイズのN又はSであることを表し、(I/L)は分岐鎖脂肪族のI又はLであることを表し、(E/D)は負電荷のE又はDであることを表す;
以下の配列で構成されるアミノ酸配列からなる保存領域2
但し、(N/S/T)は極性で小サイズのN、S又はTであることを表し、(V/L/A)は脂肪族のV、L又はAであることを表し、(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表し、(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表し、(A/P/R)はA、P又Rはであることを表す;
以下の配列で構成されるアミノ酸配列からなる保存領域3
但し、(A/T)は疎水性で小サイズのA又はTであることを表し、(G/A)は極小サイズのG又はAであることを表し、(R/K)は正電荷のR又はKであることを表し、(A/L)は脂肪族のA又はLであることを表し、(I/V/L/W)は分岐鎖脂肪族又は芳香族のI、V、L又はWであることを表し、(G/A)は極小サイズのG又はAであることを表し、(G/T)は小サイズのG又はTであることを表し、(S/T)は小サイズのS又はTはであることを表し、(A/S/T)は小サイズのA、S又はTであることを表し、(I/V/F)は分岐鎖脂肪族又は芳香族のI、V又はFであることを表す;
以下の配列で構成されるアミノ酸配列からなる保存領域4
但し、(A/V/C/E/D)は小サイズ又は負電荷のA、V、C、E又はDであることを表し、(A/S)は極小サイズのA又はSであることを表し、(A/Y)はA又Yはであることを表し、(R/T/A)はR、T又はAであることを表し、(G/A)は極小サイズのG又はAであることを表し、(Y/I/L)は分岐鎖脂肪族又は芳香族のY、I又はLであることを表し、(W/Y/F/L/A/H/K/Q)はW、Y、F、L、A、H、K又はQであることを表す:
以下の配列で構成されるアミノ酸配列からなる保存領域5
但し、(I/V)は分岐鎖脂肪族のI又はVであることを表し、(I/V)は分岐鎖脂肪族のI又はVであることを表し、(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表し、(S/A)は極小サイズのS又はAであることを表し、(S/T/A)は小サイズのS、T又はAであることを表し、(S/A)は極小サイズのS又はAであることを表し、(I/L)は分岐鎖脂肪族のI又はLであることを表し、(K/R/A/G/I)は脂肪族又は正電荷のK、R、A、G又はIであることを表し、(S/T)は小サイズのS又はTであることを表し、(A/G/V/L/K/Q)はA、G、V、L、K又はQであることを表し、(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表し、(I/V/L/A/H/R)は脂肪族又は正電荷のI、V、L、A、H又はRであることを表し、(I/V)は分岐鎖脂肪族のI又はVであることを表し、(D/N/S)は極性で小サイズのD、N又はSであることを表す;
以下の配列で構成されるアミノ酸配列からなる保存領域6
但し、(I/V)は分岐鎖脂肪族のI又はVであることを表し、(D/N)は小サイズのD又はNであることを表し、(L/A/S/N)は分岐鎖脂肪族又は小サイズのL、A、S又はNであることを表し、(P/A/T)は小サイズのP、A又はTであることを表し、(G/F/T)は疎水性のG、F又はTであることを表し、(E/S)は親水性で極性のE又はSであることを表し、(L/M)は疎水性のL又はMであることを表し、(Q/V)はQ又はVであることを表し、(D/E)は負電荷のD又はEであることを表し、(Q/H)は極性のQ又はHであることを表す;
以下の配列で構成されるアミノ酸配列からなる保存領域7
但し、
(S/I/V/L)は分岐鎖脂肪族又は極小サイズのS、I、V又はLであることを表し、(V/L/M/A/F)は疎水性のV、L、M、A又はFであることを表し、(L/F)は疎水性のL又はFであることを表し、(A/S)は極小サイズのA又はSであることを表し、(N/S/Y)はN、S又はYであることを表し、(I/V/T)は疎水性のI、V又はTであることを表し、(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表す;
以下の配列で構成されるアミノ酸配列からなる保存領域8
但し、(I/M)は疎水性のI又はMであることを表し、(L/M)は疎水性のL又はMであることを表し、(P/S)は小サイズのP又はSであることを表し、(R/K/E)は荷電のR、K又はEであることを表し、(D/E/A/G/S/K)はD、E、A、G、S又はKであることを表し、(I/L/M/A/N/K)はI、L、M、A、N又はKであることを表し、(I/V)は分岐鎖脂肪族のI又はVであることを表し、(D/N/S)は極性で小サイズのD、N又はSであることを表す;
以下の配列で構成されるアミノ酸配列からなる保存領域9
但し、(Y/H)は芳香族のY又はHであることを表し、(G/D)は小サイズのG又はDであることを表し、(A/S/T/K)はA、S、T又はKであることを表し、(L/V)は分岐鎖脂肪族のL又はVであることを表し、(I/V)は分岐鎖脂肪族のI又はVであることを表す;
以下の配列で構成されるアミノ酸配列からなる保存領域10
但し、(Y/F)は芳香族のY又はFであることを表し、(A/G)は極小サイズのA又はGであることを表し、(I/L/V)は分岐鎖脂肪族のI、L又はVであることを表し、(A/S)は極小サイズのA又はSであることを表し、(R/K/L)は分岐鎖脂肪族又は正電荷のR、K又はLであることを表し、(A/I/T)は疎水性のA、I又はTであることを表し、(A/S)は極小サイズのA又はSであることを表し、(D/E)は負電荷のD又はEであることを表し、(I/L/V/F/R/Q)はI、L、V、F、R又はQであることを表し、(I/L)は分岐鎖脂肪族のI又はLであることを表し、(K/E/Q)は極性のK、E又はQであることを表す。
[8]保存領域1~10の全てを有する、[7]に記載のグルコースデヒドロゲナーゼ。
[9]配列番号2~4のいずれかのアミノ酸配列からなる、[1]~[8]のいずれか一項に記載のグルコースデヒドロゲナーゼ。
[10][1]~[9]のいずれか一項に記載のグルコースデヒドロゲナーゼを有効成分として含む酵素剤。
[11][1]~[9]のいずれか一項に記載のグルコースデヒドロゲナーゼをコードするグルコースデヒドロゲナーゼ遺伝子。
[12]以下の(A)~(C)からなる群より選択されるいずれかのDNAからなる、[11]に記載のグルコースデヒドロゲナーゼ遺伝子:
(A)配列番号2~4のいずれかのアミノ酸配列をコードするDNA;
(B)配列番号5~7のいずれかの塩基配列からなるDNA;
(C)配列番号5~7のいずれかの塩基配列と等価な塩基配列を有し、且つグルコースデヒドロゲナーゼ活性を有するタンパク質をコードするDNA。
[13][11]又は[12]に記載のグルコースデヒドロゲナーゼ遺伝子を含む組換えDNA。
[14][13]に記載の組換えDNAを保有する微生物。
[15]以下のステップ(1)~(3)を含む、グルコースデヒドロゲナーゼの調製法:
(1)[11]又は[12]に記載のグルコースデヒドロゲナーゼ遺伝子を用意するステップ;
(2)前記遺伝子を発現させるステップ;及び
(3)発現産物を回収するステップ。
[16]以下のステップ(i)及び(ii)を含む、グルコースデヒドロゲナーゼのスクリーニング方法:
(i)既知のグルコースデヒドロゲナーゼのアミノ酸配列に対して20%以上の同一性を示すアミノ酸配列を、アミノ酸配列データベースを利用して検索するステップ;及び
(ii)ヒットしたアミノ酸配列の中から、以下の配列(配列番号1)、即ち、
(但し、式中の各アミノ酸残基の上の数字はN末端側からの通し番号であり、H/NはH(ヒスチジン)又はN(アスパラギン)を表し、L/I/MはL(ロイシン)、I(イソロイシン)又はM(メチオニン)を表し、V/IはV(バリン)又はI(イソロイシン)を表し、G/A/SはG(グリシン)、A(アラニン)又はS(セリン)を表し、F/W/YはF(フェニルアラニン)、W(トリプトファン)又はY(チロシン)を表し、Xは任意のアミノ酸残基を表す)からなるアミノ酸領域を有するものを選抜するステップ。
[17]前記ステップ(ii)において、前記アミノ酸領域が、更に
8番アミノ酸残基、12番アミノ酸残基、及び13番アミノ酸残基について、データベースAAindex収載のCRAJ730103(Normalized frequency of turn)の数値の合計、即ち、(8番アミノ酸残基の数値+12番アミノ酸残基の数値+13番アミノ酸残基の数値)が3.79以下であるとの条件と、
8番アミノ酸残基、11番アミノ酸残基、12番アミノ酸残基、及び13番アミノ酸残基について、データベースAAindex収載のTANS770109(Normalized frequency of coil)の数値の合計、即ち、(8番アミノ酸残基の数値+11番アミノ酸残基の数値+12番アミノ酸残基の数値+13番アミノ酸残基の数値)が2.83以上であるとの条件、
を満足するものを選抜する、[16]に記載のスクリーニング方法。
[18]前記ステップ(ii)において、前記アミノ酸領域が、更に
3番アミノ酸残基及び4番アミノ酸残基について、データベースAAindex収載のJANJ780101(Average accessible surface area)の数値の合計、即ち、(3番アミノ酸残基の数値+4番アミノ酸残基の数値)が56.9以上であるとの条件、
を満足するものを選抜する、[17]に記載のスクリーニング方法。
[19]以下のステップ(iii)を更に含む、[16]~[18]のいずれか一項に記載のスクリーニング方法:
(iii)選抜されたアミノ酸配列の中から、以下の保存領域1~10を有するものを選抜するステップ:
以下の配列で構成されるアミノ酸配列からなる保存領域1
但し、(F/Y)は芳香族のF又はYであることを表し、(I/V)は芳香族のI又はVであることを表し、(I/V)は分岐鎖脂肪族のI又はVであることを表し、(I/V)は分岐鎖脂肪族のI又はVであることを表し、(G/A)は分岐鎖脂肪族のG又はAであることを表し、(V/A/S/T)は小サイズのV、A、S又はTであることを表し、(S/A/G/C)は極小サイズのS、A、G又はCであることを表し、(V/A/S/T)は小サイズのV、A、S又はTであることを表し、(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表し、(N/S)は極性で小サイズのN又はSであることを表し、(I/L)は分岐鎖脂肪族のI又はLであることを表し、(E/D)は負電荷のE又はDであることを表す;
以下の配列で構成されるアミノ酸配列からなる保存領域2
但し、(N/S/T)は極性で小サイズのN、S又はTであることを表し、(V/L/A)は脂肪族のV、L又はAであることを表し、(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表し、(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表し、(A/P/R)はA、P又Rはであることを表す;
以下の配列で構成されるアミノ酸配列からなる保存領域3
但し、(A/T)は疎水性で小サイズのA又はTであることを表し、(G/A)は極小サイズのG又はAであることを表し、(R/K)は正電荷のR又はKであることを表し、(A/L)は脂肪族のA又はLであることを表し、(I/V/L/W)は分岐鎖脂肪族又は芳香族のI、V、L又はWであることを表し、(G/A)は極小サイズのG又はAであることを表し、(G/T)は小サイズのG又はTであることを表し、(S/T)は小サイズのS又はTはであることを表し、(A/S/T)は小サイズのA、S又はTであることを表し、(I/V/F)は分岐鎖脂肪族又は芳香族のI、V又はFであることを表す;
以下の配列で構成されるアミノ酸配列からなる保存領域4
但し、(A/V/C/E/D)は小サイズ又は負電荷のA、V、C、E又はDであることを表し、(A/S)は極小サイズのA又はSであることを表し、(A/Y)はA又Yはであることを表し、(R/T/A)はR、T又はAであることを表し、(G/A)は極小サイズのG又はAであることを表し、(Y/I/L)は分岐鎖脂肪族又は芳香族のY、I又はLであることを表し、(W/Y/F/L/A/H/K/Q)はW、Y、F、L、A、H、K又はQであることを表す:
以下の配列で構成されるアミノ酸配列からなる保存領域5
但し、(I/V)は分岐鎖脂肪族のI又はVであることを表し、(I/V)は分岐鎖脂肪族のI又はVであることを表し、(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表し、(S/A)は極小サイズのS又はAであることを表し、(S/T/A)は小サイズのS、T又はAであることを表し、(S/A)は極小サイズのS又はAであることを表し、(I/L)は分岐鎖脂肪族のI又はLであることを表し、(K/R/A/G/I)は脂肪族又は正電荷のK、R、A、G又はIであることを表し、(S/T)は小サイズのS又はTであることを表し、(A/G/V/L/K/Q)はA、G、V、L、K又はQであることを表し、(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表し、(I/V/L/A/H/R)は脂肪族又は正電荷のI、V、L、A、H又はRであることを表し、(I/V)は分岐鎖脂肪族のI又はVであることを表し、(D/N/S)は極性で小サイズのD、N又はSであることを表す;
以下の配列で構成されるアミノ酸配列からなる保存領域6
但し、(I/V)は分岐鎖脂肪族のI又はVであることを表し、(D/N)は小サイズのD又はNであることを表し、(L/A/S/N)は分岐鎖脂肪族又は小サイズのL、A、S又はNであることを表し、(P/A/T)は小サイズのP、A又はTであることを表し、(G/F/T)は疎水性のG、F又はTであることを表し、(E/S)は親水性で極性のE又はSであることを表し、(L/M)は疎水性のL又はMであることを表し、(Q/V)はQ又はVであることを表し、(D/E)は負電荷のD又はEであることを表し、(Q/H)は極性のQ又はHであることを表す;
以下の配列で構成されるアミノ酸配列からなる保存領域7
但し、
(S/I/V/L)は分岐鎖脂肪族又は極小サイズのS、I、V又はLであることを表し、(V/L/M/A/F)は疎水性のV、L、M、A又はFであることを表し、(L/F)は疎水性のL又はFであることを表し、(A/S)は極小サイズのA又はSであることを表し、(N/S/Y)はN、S又はYであることを表し、(I/V/T)は疎水性のI、V又はTであることを表し、(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表す;
以下の配列で構成されるアミノ酸配列からなる保存領域8
但し、(I/M)は疎水性のI又はMであることを表し、(L/M)は疎水性のL又はMであることを表し、(P/S)は小サイズのP又はSであることを表し、(R/K/E)は荷電のR、K又はEであることを表し、(D/E/A/G/S/K)はD、E、A、G、S又はKであることを表し、(I/L/M/A/N/K)はI、L、M、A、N又はKであることを表し、(I/V)は分岐鎖脂肪族のI又はVであることを表し、(D/N/S)は極性で小サイズのD、N又はSであることを表す;
以下の配列で構成されるアミノ酸配列からなる保存領域9
但し、(Y/H)は芳香族のY又はHであることを表し、(G/D)は小サイズのG又はDであることを表し、(A/S/T/K)はA、S、T又はKであることを表し、(L/V)は分岐鎖脂肪族のL又はVであることを表し、(I/V)は分岐鎖脂肪族のI又はVであることを表す;
以下の配列で構成されるアミノ酸配列からなる保存領域10
但し、(Y/F)は芳香族のY又はFであることを表し、(A/G)は極小サイズのA又はGであることを表し、(I/L/V)は分岐鎖脂肪族のI、L又はVであることを表し、(A/S)は極小サイズのA又はSであることを表し、(R/K/L)は分岐鎖脂肪族又は正電荷のR、K又はLであることを表し、(A/I/T)は疎水性のA、I又はTであることを表し、(A/S)は極小サイズのA又はSであることを表し、(D/E)は負電荷のD又はEであることを表し、(I/L/V/F/R/Q)はI、L、V、F、R又はQであることを表し、(I/L)は分岐鎖脂肪族のI又はLであることを表し、(K/E/Q)は極性のK、E又はQであることを表す。
[20]
以下のステップ(iv)を更に含む、[16]~[19]のいずれか一項に記載のスクリーニング方法:
(iv)選抜されたアミノ酸配列からなるタンパク質のグルコースデヒドロゲナーゼ活性を確認するステップ。
[21]以下のステップ(I)及び(II)を含む、改変型グルコースデヒドロゲナーゼの設計方法:
(I)既知のグルコースデヒドロゲナーゼのアミノ酸配列、又は既知のグルコースデヒドロゲナーゼのアミノ酸配列に対して20%以上の同一性を示すアミノ酸配列であって、以下の配列(配列番号1)、即ち、
(但し、式中の各アミノ酸残基の上の数字はN末端側からの通し番号であり、H/NはH(ヒスチジン)又はN(アスパラギン)を表し、L/I/MはL(ロイシン)、I(イソロイシン)又はM(メチオニン)を表し、V/IはV(バリン)又はI(イソロイシン)を表し、G/A/SはG(グリシン)、A(アラニン)又はS(セリン)を表し、F/W/YはF(フェニルアラニン)、W(トリプトファン)又はY(チロシン)を表し、Xは任意のアミノ酸残基を表す)からなるアミノ酸領域を有しない、改変対象のアミノ酸配列を用意するステップ;及び
(II)用意したアミノ酸配列において前記アミノ酸領域に対応する領域を特定した後、該領域が前記アミノ酸領域に該当するように改変することによって改変型アミノ酸配列を構築するステップ。
[22]ステップ(II)において、前記アミノ酸領域が、更に
8番アミノ酸残基、12番アミノ酸残基、及び13番アミノ酸残基について、データベースAAindex収載のCRAJ730103(Normalized frequency of turn)の数値の合計、即ち、(8番アミノ酸残基の数値+12番アミノ酸残基の数値+13番アミノ酸残基の数値)が3.79以下であるとの条件と、
8番アミノ酸残基、11番アミノ酸残基、12番アミノ酸残基、及び13番アミノ酸残基について、データベースAAindex収載のTANS770109(Normalized frequency of coil)の数値の合計、即ち、(8番アミノ酸残基の数値+11番アミノ酸残基の数値+12番アミノ酸残基の数値+13番アミノ酸残基の数値)が2.83以上であるとの条件、
を満足するように改変する、[21]に記載の設計方法。
[23] ステップ(II)において、前記アミノ酸領域が、更に
3番アミノ酸残基及び4番アミノ酸残基について、データベースAAindex収載のJANJ780101(Average accessible surface area)の数値の合計、即ち、(3番アミノ酸残基の数値+4番アミノ酸残基の数値)が56.9以上であるとの条件、
を満足するように改変する、[22]に記載の設計方法。
[24]以下のステップ(III)を更に含む、[21]~[23]のいずれか一項に記載の設計方法
(III)構築した改変型アミノ酸配列が以下の保存領域1~10を有するか確認し、有しない場合には、有するように更に改変するステップ:
以下の配列で構成されるアミノ酸配列からなる保存領域1
但し、(F/Y)は芳香族のF又はYであることを表し、(I/V)は芳香族のI又はVであることを表し、(I/V)は分岐鎖脂肪族のI又はVであることを表し、(I/V)は分岐鎖脂肪族のI又はVであることを表し、(G/A)は分岐鎖脂肪族のG又はAであることを表し、(V/A/S/T)は小サイズのV、A、S又はTであることを表し、(S/A/G/C)は極小サイズのS、A、G又はCであることを表し、(V/A/S/T)は小サイズのV、A、S又はTであることを表し、(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表し、(N/S)は極性で小サイズのN又はSであることを表し、(I/L)は分岐鎖脂肪族のI又はLであることを表し、(E/D)は負電荷のE又はDであることを表す;
以下の配列で構成されるアミノ酸配列からなる保存領域2
但し、(N/S/T)は極性で小サイズのN、S又はTであることを表し、(V/L/A)は脂肪族のV、L又はAであることを表し、(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表し、(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表し、(A/P/R)はA、P又Rはであることを表す;
以下の配列で構成されるアミノ酸配列からなる保存領域3
但し、(A/T)は疎水性で小サイズのA又はTであることを表し、(G/A)は極小サイズのG又はAであることを表し、(R/K)は正電荷のR又はKであることを表し、(A/L)は脂肪族のA又はLであることを表し、(I/V/L/W)は分岐鎖脂肪族又は芳香族のI、V、L又はWであることを表し、(G/A)は極小サイズのG又はAであることを表し、(G/T)は小サイズのG又はTであることを表し、(S/T)は小サイズのS又はTはであることを表し、(A/S/T)は小サイズのA、S又はTであることを表し、(I/V/F)は分岐鎖脂肪族又は芳香族のI、V又はFであることを表す;
以下の配列で構成されるアミノ酸配列からなる保存領域4
但し、(A/V/C/E/D)は小サイズ又は負電荷のA、V、C、E又はDであることを表し、(A/S)は極小サイズのA又はSであることを表し、(A/Y)はA又Yはであることを表し、(R/T/A)はR、T又はAであることを表し、(G/A)は極小サイズのG又はAであることを表し、(Y/I/L)は分岐鎖脂肪族又は芳香族のY、I又はLであることを表し、(W/Y/F/L/A/H/K/Q)はW、Y、F、L、A、H、K又はQであることを表す:
以下の配列で構成されるアミノ酸配列からなる保存領域5
但し、(I/V)は分岐鎖脂肪族のI又はVであることを表し、(I/V)は分岐鎖脂肪族のI又はVであることを表し、(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表し、(S/A)は極小サイズのS又はAであることを表し、(S/T/A)は小サイズのS、T又はAであることを表し、(S/A)は極小サイズのS又はAであることを表し、(I/L)は分岐鎖脂肪族のI又はLであることを表し、(K/R/A/G/I)は脂肪族又は正電荷のK、R、A、G又はIであることを表し、(S/T)は小サイズのS又はTであることを表し、(A/G/V/L/K/Q)はA、G、V、L、K又はQであることを表し、(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表し、(I/V/L/A/H/R)は脂肪族又は正電荷のI、V、L、A、H又はRであることを表し、(I/V)は分岐鎖脂肪族のI又はVであることを表し、(D/N/S)は極性で小サイズのD、N又はSであることを表す;
以下の配列で構成されるアミノ酸配列からなる保存領域6
但し、(I/V)は分岐鎖脂肪族のI又はVであることを表し、(D/N)は小サイズのD又はNであることを表し、(L/A/S/N)は分岐鎖脂肪族又は小サイズのL、A、S又はNであることを表し、(P/A/T)は小サイズのP、A又はTであることを表し、(G/F/T)は疎水性のG、F又はTであることを表し、(E/S)は親水性で極性のE又はSであることを表し、(L/M)は疎水性のL又はMであることを表し、(Q/V)はQ又はVであることを表し、(D/E)は負電荷のD又はEであることを表し、(Q/H)は極性のQ又はHであることを表す;
以下の配列で構成されるアミノ酸配列からなる保存領域7
但し、
(S/I/V/L)は分岐鎖脂肪族又は極小サイズのS、I、V又はLであることを表し、(V/L/M/A/F)は疎水性のV、L、M、A又はFであることを表し、(L/F)は疎水性のL又はFであることを表し、(A/S)は極小サイズのA又はSであることを表し、(N/S/Y)はN、S又はYであることを表し、(I/V/T)は疎水性のI、V又はTであることを表し、(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表す;
以下の配列で構成されるアミノ酸配列からなる保存領域8
但し、(I/M)は疎水性のI又はMであることを表し、(L/M)は疎水性のL又はMであることを表し、(P/S)は小サイズのP又はSであることを表し、(R/K/E)は荷電のR、K又はEであることを表し、(D/E/A/G/S/K)はD、E、A、G、S又はKであることを表し、(I/L/M/A/N/K)はI、L、M、A、N又はKであることを表し、(I/V)は分岐鎖脂肪族のI又はVであることを表し、(D/N/S)は極性で小サイズのD、N又はSであることを表す;
以下の配列で構成されるアミノ酸配列からなる保存領域9
但し、(Y/H)は芳香族のY又はHであることを表し、(G/D)は小サイズのG又はDであることを表し、(A/S/T/K)はA、S、T又はKであることを表し、(L/V)は分岐鎖脂肪族のL又はVであることを表し、(I/V)は分岐鎖脂肪族のI又はVであることを表す;
以下の配列で構成されるアミノ酸配列からなる保存領域10
但し、(Y/F)は芳香族のY又はFであることを表し、(A/G)は極小サイズのA又はGであることを表し、(I/L/V)は分岐鎖脂肪族のI、L又はVであることを表し、(A/S)は極小サイズのA又はSであることを表し、(R/K/L)は分岐鎖脂肪族又は正電荷のR、K又はLであることを表し、(A/I/T)は疎水性のA、I又はTであることを表し、(A/S)は極小サイズのA又はSであることを表し、(D/E)は負電荷のD又はEであることを表し、(I/L/V/F/R/Q)はI、L、V、F、R又はQであることを表し、(I/L)は分岐鎖脂肪族のI又はLであることを表し、(K/E/Q)は極性のK、E又はQであることを表す。
[25]以下のステップ(IV)を更に含む、[21]~[24]のいずれか一項に記載の設計方法:
構築された改変型アミノ酸配列からなるタンパク質のグルコースデヒドロゲナーゼ活性を確認するステップ。
[26]以下のステップ(1)~(3)を含む、グルコースデヒドロゲナーゼの調製法:
(1)[16]~[20]に記載のスクリーニング方法又は[21]~[25]に記載の設計方法によってグルコースデヒドロゲナーゼを用意するステップ;
(2)前記グルコースデヒドロゲナーゼを発現する微生物を培養するステップ;及び
(3)培養物から発現産物を回収するステップ。
以上の知見及び成果に基づき、以下の発明が提供される。
[1]以下の配列(配列番号1)、即ち、
配列番号2~4のいずれかのアミノ酸配列と40%以上同一のアミノ酸配列を含む、グルコースデヒドロゲナーゼ。
[2]8番アミノ酸残基、12番アミノ酸残基、及び13番アミノ酸残基について、データベースAAindex収載のCRAJ730103(Normalized frequency of turn)の数値の合計、即ち、(8番アミノ酸残基の数値+12番アミノ酸残基の数値+13番アミノ酸残基の数値)が3.79以下であるとの条件と、
8番アミノ酸残基、11番アミノ酸残基、12番アミノ酸残基、及び13番アミノ酸残基について、データベースAAindex収載のTANS770109(Normalized frequency of coil)の数値の合計、即ち、(8番アミノ酸残基の数値+11番アミノ酸残基の数値+12番アミノ酸残基の数値+13番アミノ酸残基の数値)が2.83以上であるとの条件、
を前記アミノ酸領域が満足する、[1]に記載のグルコースデヒドロゲナーゼ。
[3]3番アミノ酸残基及び4番アミノ酸残基について、データベースAAindex収載のJANJ780101(Average accessible surface area)の数値の合計、即ち、(3番アミノ酸残基の数値+4番アミノ酸残基の数値)が66以上であるとの条件、
を前記アミノ酸領域が満足する、[2]に記載のグルコースデヒドロゲナーゼ。
[4]全長が530aa~630aaである、[1]~[3]のいずれか一項に記載のグルコースデヒドロゲナーゼ。
[5]そのアミノ酸配列が、配列番号2~4のいずれかのアミノ酸配列と50%以上同一のアミノ酸配列である、[1]~[4]のいずれか一項に記載のグルコースデヒドロゲナーゼ。
[6]そのアミノ酸配列が、配列番号2~4のいずれかのアミノ酸配列と60%以上同一のアミノ酸配列である、[1]~[4]のいずれか一項に記載のグルコースデヒドロゲナーゼ。
[7]以下の保存領域1~10の1つ以上を有する、[1]~[6]のいずれか一項に記載のグルコースデヒドロゲナーゼ:
以下の配列で構成されるアミノ酸配列からなる保存領域1
以下の配列で構成されるアミノ酸配列からなる保存領域2
以下の配列で構成されるアミノ酸配列からなる保存領域3
以下の配列で構成されるアミノ酸配列からなる保存領域4
以下の配列で構成されるアミノ酸配列からなる保存領域5
以下の配列で構成されるアミノ酸配列からなる保存領域6
以下の配列で構成されるアミノ酸配列からなる保存領域7
(S/I/V/L)は分岐鎖脂肪族又は極小サイズのS、I、V又はLであることを表し、(V/L/M/A/F)は疎水性のV、L、M、A又はFであることを表し、(L/F)は疎水性のL又はFであることを表し、(A/S)は極小サイズのA又はSであることを表し、(N/S/Y)はN、S又はYであることを表し、(I/V/T)は疎水性のI、V又はTであることを表し、(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表す;
以下の配列で構成されるアミノ酸配列からなる保存領域8
以下の配列で構成されるアミノ酸配列からなる保存領域9
以下の配列で構成されるアミノ酸配列からなる保存領域10
[8]保存領域1~10の全てを有する、[7]に記載のグルコースデヒドロゲナーゼ。
[9]配列番号2~4のいずれかのアミノ酸配列からなる、[1]~[8]のいずれか一項に記載のグルコースデヒドロゲナーゼ。
[10][1]~[9]のいずれか一項に記載のグルコースデヒドロゲナーゼを有効成分として含む酵素剤。
[11][1]~[9]のいずれか一項に記載のグルコースデヒドロゲナーゼをコードするグルコースデヒドロゲナーゼ遺伝子。
[12]以下の(A)~(C)からなる群より選択されるいずれかのDNAからなる、[11]に記載のグルコースデヒドロゲナーゼ遺伝子:
(A)配列番号2~4のいずれかのアミノ酸配列をコードするDNA;
(B)配列番号5~7のいずれかの塩基配列からなるDNA;
(C)配列番号5~7のいずれかの塩基配列と等価な塩基配列を有し、且つグルコースデヒドロゲナーゼ活性を有するタンパク質をコードするDNA。
[13][11]又は[12]に記載のグルコースデヒドロゲナーゼ遺伝子を含む組換えDNA。
[14][13]に記載の組換えDNAを保有する微生物。
[15]以下のステップ(1)~(3)を含む、グルコースデヒドロゲナーゼの調製法:
(1)[11]又は[12]に記載のグルコースデヒドロゲナーゼ遺伝子を用意するステップ;
(2)前記遺伝子を発現させるステップ;及び
(3)発現産物を回収するステップ。
[16]以下のステップ(i)及び(ii)を含む、グルコースデヒドロゲナーゼのスクリーニング方法:
(i)既知のグルコースデヒドロゲナーゼのアミノ酸配列に対して20%以上の同一性を示すアミノ酸配列を、アミノ酸配列データベースを利用して検索するステップ;及び
(ii)ヒットしたアミノ酸配列の中から、以下の配列(配列番号1)、即ち、
[17]前記ステップ(ii)において、前記アミノ酸領域が、更に
8番アミノ酸残基、12番アミノ酸残基、及び13番アミノ酸残基について、データベースAAindex収載のCRAJ730103(Normalized frequency of turn)の数値の合計、即ち、(8番アミノ酸残基の数値+12番アミノ酸残基の数値+13番アミノ酸残基の数値)が3.79以下であるとの条件と、
8番アミノ酸残基、11番アミノ酸残基、12番アミノ酸残基、及び13番アミノ酸残基について、データベースAAindex収載のTANS770109(Normalized frequency of coil)の数値の合計、即ち、(8番アミノ酸残基の数値+11番アミノ酸残基の数値+12番アミノ酸残基の数値+13番アミノ酸残基の数値)が2.83以上であるとの条件、
を満足するものを選抜する、[16]に記載のスクリーニング方法。
[18]前記ステップ(ii)において、前記アミノ酸領域が、更に
3番アミノ酸残基及び4番アミノ酸残基について、データベースAAindex収載のJANJ780101(Average accessible surface area)の数値の合計、即ち、(3番アミノ酸残基の数値+4番アミノ酸残基の数値)が56.9以上であるとの条件、
を満足するものを選抜する、[17]に記載のスクリーニング方法。
[19]以下のステップ(iii)を更に含む、[16]~[18]のいずれか一項に記載のスクリーニング方法:
(iii)選抜されたアミノ酸配列の中から、以下の保存領域1~10を有するものを選抜するステップ:
以下の配列で構成されるアミノ酸配列からなる保存領域1
以下の配列で構成されるアミノ酸配列からなる保存領域2
以下の配列で構成されるアミノ酸配列からなる保存領域3
以下の配列で構成されるアミノ酸配列からなる保存領域4
以下の配列で構成されるアミノ酸配列からなる保存領域5
以下の配列で構成されるアミノ酸配列からなる保存領域6
以下の配列で構成されるアミノ酸配列からなる保存領域7
(S/I/V/L)は分岐鎖脂肪族又は極小サイズのS、I、V又はLであることを表し、(V/L/M/A/F)は疎水性のV、L、M、A又はFであることを表し、(L/F)は疎水性のL又はFであることを表し、(A/S)は極小サイズのA又はSであることを表し、(N/S/Y)はN、S又はYであることを表し、(I/V/T)は疎水性のI、V又はTであることを表し、(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表す;
以下の配列で構成されるアミノ酸配列からなる保存領域8
以下の配列で構成されるアミノ酸配列からなる保存領域9
以下の配列で構成されるアミノ酸配列からなる保存領域10
[20]
以下のステップ(iv)を更に含む、[16]~[19]のいずれか一項に記載のスクリーニング方法:
(iv)選抜されたアミノ酸配列からなるタンパク質のグルコースデヒドロゲナーゼ活性を確認するステップ。
[21]以下のステップ(I)及び(II)を含む、改変型グルコースデヒドロゲナーゼの設計方法:
(I)既知のグルコースデヒドロゲナーゼのアミノ酸配列、又は既知のグルコースデヒドロゲナーゼのアミノ酸配列に対して20%以上の同一性を示すアミノ酸配列であって、以下の配列(配列番号1)、即ち、
(II)用意したアミノ酸配列において前記アミノ酸領域に対応する領域を特定した後、該領域が前記アミノ酸領域に該当するように改変することによって改変型アミノ酸配列を構築するステップ。
[22]ステップ(II)において、前記アミノ酸領域が、更に
8番アミノ酸残基、12番アミノ酸残基、及び13番アミノ酸残基について、データベースAAindex収載のCRAJ730103(Normalized frequency of turn)の数値の合計、即ち、(8番アミノ酸残基の数値+12番アミノ酸残基の数値+13番アミノ酸残基の数値)が3.79以下であるとの条件と、
8番アミノ酸残基、11番アミノ酸残基、12番アミノ酸残基、及び13番アミノ酸残基について、データベースAAindex収載のTANS770109(Normalized frequency of coil)の数値の合計、即ち、(8番アミノ酸残基の数値+11番アミノ酸残基の数値+12番アミノ酸残基の数値+13番アミノ酸残基の数値)が2.83以上であるとの条件、
を満足するように改変する、[21]に記載の設計方法。
[23] ステップ(II)において、前記アミノ酸領域が、更に
3番アミノ酸残基及び4番アミノ酸残基について、データベースAAindex収載のJANJ780101(Average accessible surface area)の数値の合計、即ち、(3番アミノ酸残基の数値+4番アミノ酸残基の数値)が56.9以上であるとの条件、
を満足するように改変する、[22]に記載の設計方法。
[24]以下のステップ(III)を更に含む、[21]~[23]のいずれか一項に記載の設計方法
(III)構築した改変型アミノ酸配列が以下の保存領域1~10を有するか確認し、有しない場合には、有するように更に改変するステップ:
以下の配列で構成されるアミノ酸配列からなる保存領域1
以下の配列で構成されるアミノ酸配列からなる保存領域2
以下の配列で構成されるアミノ酸配列からなる保存領域3
以下の配列で構成されるアミノ酸配列からなる保存領域4
以下の配列で構成されるアミノ酸配列からなる保存領域5
以下の配列で構成されるアミノ酸配列からなる保存領域6
以下の配列で構成されるアミノ酸配列からなる保存領域7
(S/I/V/L)は分岐鎖脂肪族又は極小サイズのS、I、V又はLであることを表し、(V/L/M/A/F)は疎水性のV、L、M、A又はFであることを表し、(L/F)は疎水性のL又はFであることを表し、(A/S)は極小サイズのA又はSであることを表し、(N/S/Y)はN、S又はYであることを表し、(I/V/T)は疎水性のI、V又はTであることを表し、(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表す;
以下の配列で構成されるアミノ酸配列からなる保存領域8
以下の配列で構成されるアミノ酸配列からなる保存領域9
以下の配列で構成されるアミノ酸配列からなる保存領域10
[25]以下のステップ(IV)を更に含む、[21]~[24]のいずれか一項に記載の設計方法:
構築された改変型アミノ酸配列からなるタンパク質のグルコースデヒドロゲナーゼ活性を確認するステップ。
[26]以下のステップ(1)~(3)を含む、グルコースデヒドロゲナーゼの調製法:
(1)[16]~[20]に記載のスクリーニング方法又は[21]~[25]に記載の設計方法によってグルコースデヒドロゲナーゼを用意するステップ;
(2)前記グルコースデヒドロゲナーゼを発現する微生物を培養するステップ;及び
(3)培養物から発現産物を回収するステップ。
1.用語
本明細書において用語「単離された」は「精製された」と交換可能に使用される。用語「単離された」は、人為的操作が介在することなく産生される物の場合、天然の状態、即ち、自然界において存在している状態のものと区別するために使用され、人為的操作が介在して生産される物の場合、単離工程又は精製工程を経ていないものと区別するために使用される。前者の場合、単離するという人為的操作によって、天然の状態とは異なる状態である「単離された状態」となり、単離されたものは天然物自体と明確且つ決定的に相違する。一方、後者の場合、典型的には、単離工程又は精製工程によって不純物が除去され又はその量が低減され、純度が高まる。単離された酵素の純度は特に限定されない。但し、純度の高いことが要求される用途への適用が予定されるのであれば、単離された酵素の純度は高いことが好ましい。
本明細書において用語「単離された」は「精製された」と交換可能に使用される。用語「単離された」は、人為的操作が介在することなく産生される物の場合、天然の状態、即ち、自然界において存在している状態のものと区別するために使用され、人為的操作が介在して生産される物の場合、単離工程又は精製工程を経ていないものと区別するために使用される。前者の場合、単離するという人為的操作によって、天然の状態とは異なる状態である「単離された状態」となり、単離されたものは天然物自体と明確且つ決定的に相違する。一方、後者の場合、典型的には、単離工程又は精製工程によって不純物が除去され又はその量が低減され、純度が高まる。単離された酵素の純度は特に限定されない。但し、純度の高いことが要求される用途への適用が予定されるのであれば、単離された酵素の純度は高いことが好ましい。
本明細書では慣例の標記法に従い左端がアミノ末端、右端がカルボキシ末端となるようにアミノ酸配列を表記する。また、各アミノ酸を以下の通り1文字で表記する。
A:アラニン、C:システイン、D:アスパラギン酸、E:グルタミン酸、F:フェニルアラニン、G:グリシン、H:ヒスチジン、I:イソロイシン、K:リジン、L:ロイシン、M:メチオニン、N:アスパラギン、P:プロリン、Q:グルタミン、R:アルギニン、S:セリン、T:スレオニン、V:バリン、W:トリプトファン、Y:チロシン
A:アラニン、C:システイン、D:アスパラギン酸、E:グルタミン酸、F:フェニルアラニン、G:グリシン、H:ヒスチジン、I:イソロイシン、K:リジン、L:ロイシン、M:メチオニン、N:アスパラギン、P:プロリン、Q:グルタミン、R:アルギニン、S:セリン、T:スレオニン、V:バリン、W:トリプトファン、Y:チロシン
2.グルコースデヒドロゲナーゼ(GDH)
本発明の第1の局面はGDHを提供する。本発明のGDH(以下、「本酵素」ともいう)は二つの要件(第1要件及び第2要件)によって特徴付けられる。第1要件は特有のアミノ酸領域を有することである。本発明における特有のアミノ酸領域とは、GDHに特徴的なものとして見出されたアミノ酸領域であり、以下の配列(配列番号1)で構成される。
但し、式中の各アミノ酸残基の上の数字はN末端側からの通し番号であり、(H/N)はH(ヒスチジン)又はN(アスパラギン)であることを表し、(L/I/M)はL(ロイシン)、I(イソロイシン)又はM(メチオニン)であることを表し、(V/I)はV(バリン)又はI(イソロイシン)であることを表し、(G/A/S)はG(グリシン)、A(アラニン)又はS(セリン)であることを表し、(F/W/Y)はF(フェニルアラニン)、W(トリプトファン)又はY(チロシン)であることを表し、Xは任意のアミノ酸残基であることを表す。尚、本願明細書を通して、当該配列(配列番号1)を規定するルールを、説明の便宜上、「ルール1」と呼ぶことにする。
本発明の第1の局面はGDHを提供する。本発明のGDH(以下、「本酵素」ともいう)は二つの要件(第1要件及び第2要件)によって特徴付けられる。第1要件は特有のアミノ酸領域を有することである。本発明における特有のアミノ酸領域とは、GDHに特徴的なものとして見出されたアミノ酸領域であり、以下の配列(配列番号1)で構成される。
本酵素を特徴付けるアミノ酸領域は、糸状菌由来FAD-GDHの140~180番目付近に存在する、連続した13アミノ酸残基の配列に相当する。例えば、公知のFAD-GDHであるAspergillus oryzae由来FAD-GDH(配列番号21)では156番目のアミノ酸残基から168番目のアミノ酸残基までが上記アミノ酸領域であり、同様に、公知のFAD-GDHであるAspergillus terreus由来FAD-GDH(配列番号22)では149番目のアミノ酸残基から161番目のアミノ酸残基までが上記アミノ酸領域である。一方、後述のアスペルギルス・クリステイタス(Aspergillus cristatus)由来FAD-GDH(配列番号2)では149番目のアミノ酸残基から161番目のアミノ酸残基までが上記アミノ酸領域であり、アスペルギルス・タルコサス(Aspergillus turcosus)由来FAD-GDH(配列番号3)では149番目のアミノ酸残基から161番目のアミノ酸残基までが上記アミノ酸領域であり、コルニアスカス・セペドニウム(Corynascus sepedonium)由来FAD-GDH(配列番号4)では151番目のアミノ酸残基から163番目のアミノ酸残基までが上記アミノ酸領域である。
本酵素を特徴付ける上記アミノ酸領域は、概ね進展構造を形成すると考えられるが、その中央付近では、プロリン残基(6番アミノ酸残基)により角度が付くため、若干の二次構造(ループ状の構造)をつくる。また、前半部は活性中心からやや離れており、酵素の表面上の構造維持に関与していると考えられる。他方、後半部分は、基質が活性中心へ向かう通路に近く、酵素活性の特性に関与していると考えられる。
本酵素を特徴付けるアミノ酸領域が、ルール1に加え以下のルール(説明の便宜上、「ルール2」と呼ぶ)を満足することが好ましい。ルール2は以下の二つの条件で構成される。
<ルール2の条件1>
8番アミノ酸残基、12番アミノ酸残基、及び13番アミノ酸残基について、データベースAAindex収載のCRAJ730103(Normalized frequency of turn)の数値の合計、即ち、(8番アミノ酸残基の数値+12番アミノ酸残基の数値+13番アミノ酸残基の数値)が3.79以下であるとの条件
<ルール2の条件2>
8番アミノ酸残基、11番アミノ酸残基、12番アミノ酸残基、及び13番アミノ酸残基について、データベースAAindex収載のTANS770109(Normalized frequency of coil)の数値の合計、即ち、(8番アミノ酸残基の数値+11番アミノ酸残基の数値+12番アミノ酸残基の数値+13番アミノ酸残基の数値)が2.83以上であるとの条件
<ルール2の条件1>
8番アミノ酸残基、12番アミノ酸残基、及び13番アミノ酸残基について、データベースAAindex収載のCRAJ730103(Normalized frequency of turn)の数値の合計、即ち、(8番アミノ酸残基の数値+12番アミノ酸残基の数値+13番アミノ酸残基の数値)が3.79以下であるとの条件
<ルール2の条件2>
8番アミノ酸残基、11番アミノ酸残基、12番アミノ酸残基、及び13番アミノ酸残基について、データベースAAindex収載のTANS770109(Normalized frequency of coil)の数値の合計、即ち、(8番アミノ酸残基の数値+11番アミノ酸残基の数値+12番アミノ酸残基の数値+13番アミノ酸残基の数値)が2.83以上であるとの条件
ルール2の条件1は、活性中心へ向かう基質の通り道の一部を構成するアミノ酸を規定する。これらのアミノ酸にはある程度の構造維持が必要になると考えられる。また、伸展構造の構成や維持には、この条件における数値が高いアミノ酸は不利になることから、この条件は当該部分の重要な指標となる。ルール2の条件1として、前記数値の合計が、3.10~3.79を満たす条件であること好ましい。
他方、ルール2の条件2も、活性中心へ向かう基質の通り道の一部を構成するアミノ酸を規定する。これらのアミノ酸にはある程度の構造維持が必要となると考えられる。また、伸展構造の構成や維持には、この条件における数値が低いアミノ酸は不利になることから、この条件は当該部分の重要な指標となる。ルール2の条件2として、前記数値の合計が、2.87以上を満たす条件であることが好ましく、2.87~5.22を満たす条件であることがより好ましく、2.87~3.55を満たす条件であることが更に好ましい。
本酵素を特徴付けるアミノ酸領域が、ルール1とルール2に加え以下のルール(説明の便宜上、「ルール3」と呼ぶ)を満足することが更に好ましい。ルール3は以下の条件で構成される。
<ルール3の条件>
3番アミノ酸残基及び4番アミノ酸残基について、データベースAAindex収載のJANJ780101(Average accessible surface area)の数値の合計、即ち、(3番アミノ酸残基の数値+4番アミノ酸残基の数値)が66以上であるとの条件
<ルール3の条件>
3番アミノ酸残基及び4番アミノ酸残基について、データベースAAindex収載のJANJ780101(Average accessible surface area)の数値の合計、即ち、(3番アミノ酸残基の数値+4番アミノ酸残基の数値)が66以上であるとの条件
3番アミノ酸残基及び4番アミノ酸残基はタンパク表面上に存在すると考えられる。この条件は、タンパク表面に存在することの重要な指標となる。ルール3の条件として、前記数値の合計が、100以上を満たす条件であることが好ましく、116以上を満たす条件であることがより好ましく、116~172を満たす条件であることが更に好ましく、116~131を満たす条件であることが特に好ましい。
本酵素を特徴付ける第2要件は、配列番号2~4のいずれかのアミノ酸配列と40%以上同一のアミノ酸配列を含むことである。好ましくは、ここでのアミノ酸配列の同一性は配列番号2のアミノ酸配列とは65%以上であり、配列番号3のアミノ酸配列とは85%以上であり、配列番号4のアミノ酸配列とは55%以上である。配列番号2~4の各アミノ酸配列は、本発明者らの検討によってGDH活性を有することが見出されたアミノ酸配列である。具体的には、配列番号2のアミノ酸配列はアスペルギルス・クリステイタス(Aspergillus cristatus)由来FAD-GDH、配列番号3のアミノ酸配列はアスペルギルス・タルコサス(Aspergillus turcosus)由来FAD-GDH、配列番号4のアミノ酸配列はコルニアスカス・セペドニウム(Corynascus sepedonium)由来FAD-GDHにそれぞれ対応する。
基準のアミノ酸配列(配列番号2~4のいずれか)との同一性は、配列番号2~4のいずれかのアミノ酸配列からなるタンパク質と同様の性質を有するという点では高い方が好ましい。従って、当該同一性は好ましくは50%以上、60%以上、70%以上、80%以上、90%以上、95%以上、98%以上又は100%(即ち、基準のアミノ酸配列自体)である(同一性のパーセンテージが高い程、より好ましいことになる)。
本願では、GDHにおいて保存性が高い領域として、本発明の特有領域(配列番号1)と後述の保存領域1~10の11領域が特定される。これらの領域を除いた領域においては、アミノ酸配列の相違によるGDH活性への影響は少なく、より多くのアミノ酸配列の相違が許容される。上記11領域を除いた領域における、基準のアミノ酸配列(配列番号2~4のいずれか)との同一性は40%以上、45%以上、50%以上、55%以上、60%以上、70%以上、80%以上、90%以上、95%以上又は98%以上である(同一性のパーセンテージが高い程、より好ましいことになる)。また、配列番号2のアミノ酸配列とは60%以上、配列番号3のアミノ酸配列とは80%以上、配列番号4のアミノ酸配列とは40%以上の同一性を示すことが好ましい。
本酵素の全長は特に限定されないが、例えば530aa~660aa、好ましくは540aa~620aaである。
上記の同一性(基準のアミノ酸配列に対して少なくとも40%の同一性)を示すアミノ酸配列は、同一性が100%の場合を除き、基準のアミノ酸配列との間で一部の相違が認められる。「アミノ酸配列の一部の相違」は、例えば、アミノ酸配列を構成するアミノ酸の中の1又は複数のアミノ酸の欠失、置換、アミノ酸配列に対して1又は複数のアミノ酸の付加、挿入、又はこれらの任意の組合せによって生じる。アミノ酸配列の相違する位置は、上記の第1要件に係るアミノ酸領域以外の部分である限りにおいて、特に限定されない。また、アミノ酸配列の相違が複数の箇所(場所)で生じていてもよい。
「アミノ酸配列の一部の相違」の典型例の一つは、アミノ酸配列を構成するアミノ酸の中の1~50個(好ましくは1~10個、更に好ましくは1~7個、更に更に好ましくは1~5個、より一層好ましくは1~3個)のアミノ酸の欠失、置換、アミノ酸配列に対して1~50個(好ましくは1~10個、更に好ましくは1~7個、更に更に好ましくは1~5個、より一層好ましくは1~3個)のアミノ酸の付加、挿入、又はこれらの組合せによりアミノ酸配列に変異(変化)が生じていることである。
好ましくは、GDH活性に必須でないアミノ酸残基において保存的アミノ酸置換を生じさせることによって、上記同一性を示すアミノ酸配列が得られる。ここでの「保存的アミノ酸置換」とは、あるアミノ酸残基を、同様の性質の側鎖を有するアミノ酸残基に置換することをいう。アミノ酸残基はその側鎖によって塩基性側鎖(例えばリシン、アルギニン、ヒスチジン)、酸性側鎖(例えばアスパラギン酸、グルタミン酸)、非荷電極性側鎖(例えばグリシン、アスパラギン、グルタミン、セリン、スレオニン、チロシン、システイン)、非極性側鎖(例えばアラニン、バリン、ロイシン、イソロイシン、プロリン、フェニルアラニン、メチオニン、トリプトファン)、β分岐側鎖(例えばスレオニン、バリン、イソロイシン)、芳香族側鎖(例えばチロシン、フェニルアラニン、トリプトファン、ヒスチジン)のように、いくつかのファミリーに分類されている。保存的アミノ酸置換は好ましくは、同一のファミリー内のアミノ酸残基間の置換である。活性中心のアミノ酸残基は維持されていることが好ましい。活性中心のアミノ酸残基の位置は、アスペルギルス・クリステイタス由来FAD-GDH(配列番号2)における502番目のHに相当する残基と545番目のHに相当する残基、アスペルギルス・タルコサス由来FAD-GDH(配列番号3)における506番目のHに相当する残基と549番目のHに相当する残基又はコルニアスカス・セペドニウム由来FAD-GDH(配列番号4)における510番目のHに相当する残基と553番目のHに相当する残基として推定することができる。
ところで、二つのアミノ酸配列又は二つの核酸(以下、これらを含む用語として「二つの配列」を使用する)の同一性(%)は例えば以下の手順で決定することができる。まず、最適な比較ができるよう二つの配列を並べる(例えば、第一の配列にギャップを導入して第二の配列とのアライメントを最適化してもよい)。第一の配列の特定位置の分子(アミノ酸残基又はヌクレオチド)が、第二の配列における対応する位置の分子と同じであるとき、その位置の分子が同一であるといえる。二つの配列の同一性は、その二つの配列に共通する同一位置の数の関数であり(すなわち、同一性(%)=同一位置の数/位置の総数×100)、好ましくは、アライメントの最適化に要したギャップの数およびサイズも考慮に入れる。
二つの配列の比較及び同一性の決定は数学的アルゴリズムを用いて実現可能である。配列の比較に利用可能な数学的アルゴリズムの具体例としては、KarlinおよびAltschul (1993) Proc. Natl. Acad. Sci. USA 90:5873-77に記載されたアルゴリズムがある。このようなアルゴリズムは、Altschulら (1990) J. Mol. Biol. 215:403-10に記載のNBLASTプログラムおよびXBLASTプログラム(バージョン2.0)に組み込まれている。本発明の核酸分子に等価なヌクレオチド配列を得るには例えば、NBLASTプログラムでscore=100、wordlength=12としてBLASTヌクレオチド検索を行えばよい。本酵素に等価なアミノ酸配列を得るには例えば、XBLASTプログラムでscore=50、wordlength=3としてBLASTポリペプチド検索を行えばよい。比較のためのギャップアライメントを得るためには、Altschulら (1997) Amino Acids Research 25(17):3389-3402に記載のGapped BLASTが利用可能である。BLASTおよびGapped BLASTを利用する場合は、対応するプログラム(例えばXBLASTおよびNBLAST)のデフォルトパラメータを使用することができる。詳しくはhttp://www.ncbi.nlm.nih.govを参照されたい。配列の比較に利用可能な他の数学的アルゴリズムの例としては、MyersおよびMiller (1988) Comput Appl Biosci. 4:11-17に記載のアルゴリズムがある。このようなアルゴリズムは、例えばGENESTREAMネットワークサーバー(IGH Montpellier、フランス)またはISRECサーバーで利用可能なALIGNプログラムに組み込まれている。アミノ酸配列の比較にALIGNプログラムを利用する場合は例えば、PAM120残基質量表を使用し、ギャップ長ペナルティ=12、ギャップペナルティ=4とすることができる。
二つのアミノ酸配列の同一性を、EMBOSSパッケージのGAPプログラムを用いて、Blosum 62マトリックスを使用し、ギャップ加重=10、ギャップ長加重=2として決定することができる。また、二つの塩基配列の同一性を、EMBOSSパッケージ(http://emboss.open-bio.org/で利用可能)のGAPプログラムを用いて、ギャップ加重=50、ギャップ長加重=3として決定することができる。
本酵素が、より大きいタンパク質(例えば融合タンパク質)の一部であってもよい。融合タンパク質において付加される配列としては、例えば、多重ヒスチジン残基のような精製に役立つ配列、組み換え生産の際の安定性を確保する付加配列、反応性を変化させるシトクローム様付加配列等が挙げられる。さらには、化学的にポリマー、電子受容体、金属錯体等が付加されていてもよい。
好ましくは、本酵素は上記の要件1、2に加えて要件3によって特徴付けられる。
要件3:以下の保存領域1~10の1つ以上を有する。
要件3:以下の保存領域1~10の1つ以上を有する。
テイラー(William Ramsay Taylor)のベン図を基にアミノ酸を以下のグループに分類し、保存領域を構成するアミノ酸残基の特定に利用した。
芳香族:F/W/Y/H
脂肪族:A/I/V/L/G
分岐鎖脂肪族:I/V/L
極小サイズ(極小):G/A/S/C
小サイズ(小):G/A/S/C/T/V/N/P/D
極性:T/C/S/N/Q/D/E/Y/W/H/K/R
極性で小サイズ(極性・小):S/N/C/T/D
荷電:D/E/K/R/H
負電荷:D/E
正電荷:R/K/H
疎水性:A/G/C/T/I/V/L/K/H/Y/W/F/M
疎水性で小サイズ(疎水性・小):A/T/G/C/V
親水性で極性(親水性極性):S/N/Q/D/E/R
芳香族:F/W/Y/H
脂肪族:A/I/V/L/G
分岐鎖脂肪族:I/V/L
極小サイズ(極小):G/A/S/C
小サイズ(小):G/A/S/C/T/V/N/P/D
極性:T/C/S/N/Q/D/E/Y/W/H/K/R
極性で小サイズ(極性・小):S/N/C/T/D
荷電:D/E/K/R/H
負電荷:D/E
正電荷:R/K/H
疎水性:A/G/C/T/I/V/L/K/H/Y/W/F/M
疎水性で小サイズ(疎水性・小):A/T/G/C/V
親水性で極性(親水性極性):S/N/Q/D/E/R
<保存領域1>
保存領域1はA.cristatus GZAAS20.1005由来FAD-GDHでは5~25残基目に相当するアミノ酸残基であり、A.turcosus HMR AF 23由来FAD-GDHでは5~25残基目に相当するアミノ酸残基であり、Corynascus sepedonium NBRC 31363由来FAD-GDHでは8~28残基目に相当するアミノ酸残基である。
保存領域1を規定するアミノ酸配列は、以下の配列(配列番号24)で構成される。
但し、
(F/Y)は芳香族のF又はYであることを表し、
(I/V)は芳香族のI又はVであることを表し、
(I/V)は分岐鎖脂肪族のI又はVであることを表し、
(I/V)は分岐鎖脂肪族のI又はVであることを表し、
(G/A)は分岐鎖脂肪族のG又はAであることを表し、
(V/A/S/T)は小のV、A、S又はTであることを表し、
(S/A/G/C)は極小のS、A、G又はCであることを表し、
(V/A/S/T)は小のV、A、S又はTであることを表し、
(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表し、
(N/S)は極性・小のN又はSであることを表し、
(I/L)は分岐鎖脂肪族のI又はLであることを表し、
(E/D)は負電荷のE又はDであることを表す。
保存領域1はA.cristatus GZAAS20.1005由来FAD-GDHでは5~25残基目に相当するアミノ酸残基であり、A.turcosus HMR AF 23由来FAD-GDHでは5~25残基目に相当するアミノ酸残基であり、Corynascus sepedonium NBRC 31363由来FAD-GDHでは8~28残基目に相当するアミノ酸残基である。
保存領域1を規定するアミノ酸配列は、以下の配列(配列番号24)で構成される。
(F/Y)は芳香族のF又はYであることを表し、
(I/V)は芳香族のI又はVであることを表し、
(I/V)は分岐鎖脂肪族のI又はVであることを表し、
(I/V)は分岐鎖脂肪族のI又はVであることを表し、
(G/A)は分岐鎖脂肪族のG又はAであることを表し、
(V/A/S/T)は小のV、A、S又はTであることを表し、
(S/A/G/C)は極小のS、A、G又はCであることを表し、
(V/A/S/T)は小のV、A、S又はTであることを表し、
(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表し、
(N/S)は極性・小のN又はSであることを表し、
(I/L)は分岐鎖脂肪族のI又はLであることを表し、
(E/D)は負電荷のE又はDであることを表す。
好ましくは、保存領域1を規定するアミノ酸配列は、以下の配列(配列番号25)で構成される。
但し、
(F/Y)は芳香族のF又はYであることを表し、
(I/V)は分岐鎖脂肪族のI又はVであることを表し、
(I/V)は分岐鎖脂肪族のI又はVであることを表し、
(I/V)は分岐鎖脂肪族のI又はVであることを表し、
(G/A)は極小のG又はAであることを表し、
(T/A)は小のT又はAであることを表し、
(S/C)は極小のS又はCであることを表し、
(V/A)は小のV又はAであることを表し、
(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表し、
(E/D)は負電荷のE又はDであることを表す。
(F/Y)は芳香族のF又はYであることを表し、
(I/V)は分岐鎖脂肪族のI又はVであることを表し、
(I/V)は分岐鎖脂肪族のI又はVであることを表し、
(I/V)は分岐鎖脂肪族のI又はVであることを表し、
(G/A)は極小のG又はAであることを表し、
(T/A)は小のT又はAであることを表し、
(S/C)は極小のS又はCであることを表し、
(V/A)は小のV又はAであることを表し、
(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表し、
(E/D)は負電荷のE又はDであることを表す。
より好ましくは、保存領域1を規定するアミノ酸配列は、以下の配列(配列番号26)で構成される。
但し、
(I/V)は分岐鎖脂肪族のI又はVであることを表し、
(I/V)は分岐鎖脂肪族のI又はVであることを表し、
(T/A)は小のT又はAであることを表し、
(S/C)は極小のS又はCであることを表し、
(V/A)は小のV又はAであることを表し、
(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表し、
(E/D)は負電荷のE又はDであることを表す。
(I/V)は分岐鎖脂肪族のI又はVであることを表し、
(I/V)は分岐鎖脂肪族のI又はVであることを表し、
(T/A)は小のT又はAであることを表し、
(S/C)は極小のS又はCであることを表し、
(V/A)は小のV又はAであることを表し、
(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表し、
(E/D)は負電荷のE又はDであることを表す。
更に好ましくは、保存領域1を規定するアミノ酸配列は、以下のいずれかの配列で構成される。
YDYVIVGGGTSGLVVANRLSE(A.cristatus GZAAS20.1005由来FAD-GDH)(配列番号27)
YDYIVVGGGACGLALANRLSD(A.turcosus HMR AF 23由来FAD-GDH)(配列番号28)
FDYIIIGAGTSGLVIANRLSE(Corynascus sepedonium NBRC 31363由来FAD-GDH)(配列番号29)
YDYVIVGGGTSGLVVANRLSE(A.cristatus GZAAS20.1005由来FAD-GDH)(配列番号27)
YDYIVVGGGACGLALANRLSD(A.turcosus HMR AF 23由来FAD-GDH)(配列番号28)
FDYIIIGAGTSGLVIANRLSE(Corynascus sepedonium NBRC 31363由来FAD-GDH)(配列番号29)
<保存領域2>
保存領域2はA.cristatus GZAAS20.1005由来FAD-GDHでは30~37残基目に相当するアミノ酸残基であり、A.turcosus HMR AF 23由来FAD-GDHでは30~37残基目に相当するアミノ酸残基であり、Corynascus sepedonium NBRC 31363由来FAD-GDHでは33~40残基目に相当するアミノ酸残基である。
保存領域2を規定するアミノ酸配列は、以下の配列(配列番号30)で構成される。
但し、
(N/S/T)は極性・小のN、S又はTであることを表し、
(V/L/A)は脂肪族のV、L又はAであることを表し、
(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表し、
(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表し、
(A/P/R)はA、P又Rはであることを表す。
保存領域2はA.cristatus GZAAS20.1005由来FAD-GDHでは30~37残基目に相当するアミノ酸残基であり、A.turcosus HMR AF 23由来FAD-GDHでは30~37残基目に相当するアミノ酸残基であり、Corynascus sepedonium NBRC 31363由来FAD-GDHでは33~40残基目に相当するアミノ酸残基である。
保存領域2を規定するアミノ酸配列は、以下の配列(配列番号30)で構成される。
(N/S/T)は極性・小のN、S又はTであることを表し、
(V/L/A)は脂肪族のV、L又はAであることを表し、
(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表し、
(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表し、
(A/P/R)はA、P又Rはであることを表す。
好ましくは、保存領域2を規定するアミノ酸配列は、以下の配列(配列番号31)で構成される。
但し、
(S/T)はS又はTであることを表し、
(A/V/L)はA、V、又はLであることを表し、
(V/I)はV又はIであることを表し、
(V/I)はV又はIであることを表し、
(A/R)はA又はRであることを表す。
(S/T)はS又はTであることを表し、
(A/V/L)はA、V、又はLであることを表し、
(V/I)はV又はIであることを表し、
(V/I)はV又はIであることを表し、
(A/R)はA又はRであることを表す。
より好ましくは、保存領域2を規定するアミノ酸配列は、以下の配列(配列番号 32)で構成される。
但し、
(V/L)はV又はLであることを表し、
(V/I)はV又はIであることを表し、
(V/I)はV又はIであることを表し、
(A/R)はA又はRであることを表す。
(V/L)はV又はLであることを表し、
(V/I)はV又はIであることを表し、
(V/I)はV又はIであることを表し、
(A/R)はA又はRであることを表す。
更に好ましくは、保存領域2を規定するアミノ酸配列は、以下のいずれかの配列で構成される。
SVVVIEAG(A.cristatus GZAAS20.1005由来FAD-GDH)(配列番号33)
SVLIIERG(A.turcosus HMR AF 23由来FAD-GDH)(配列番号34)
TVAVIEPG(Corynascus sepedonium NBRC 31363由来FAD-GDH)(配列番号35)
SVVVIEAG(A.cristatus GZAAS20.1005由来FAD-GDH)(配列番号33)
SVLIIERG(A.turcosus HMR AF 23由来FAD-GDH)(配列番号34)
TVAVIEPG(Corynascus sepedonium NBRC 31363由来FAD-GDH)(配列番号35)
<保存領域3>
保存領域3はA.cristatus GZAAS20.1005由来FAD-GDHでは81~93残基目に相当するアミノ酸残基であり、A.turcosus HMR AF 23由来FAD-GDHでは81~93残基目に相当するアミノ酸残基であり、Corynascus sepedonium NBRC 31363由来FAD-GDHでは83~95残基目に相当するアミノ酸残基である。
保存領域3を規定するアミノ酸配列は、以下の配列(配列番号36)で構成される。
但し、
(A/T)は疎水性・小のA又はTであることを表し、
(G/A)は極小のG又はAであることを表し、
(R/K)は正電荷のR又はKであることを表し、
(A/L)は脂肪族のA又はLであることを表し、
(I/V/L/W)は分岐鎖脂肪族又は芳香族のI、V、L又はWであることを表し、
(G/A)は極小のG又はAであることを表し、
(G/T)は小のG又はTであることを表し、
(S/T)は小のS又はTはであることを表し、
(A/S/T)は小のA、S又はTであることを表し、
(I/V/F)は分岐鎖脂肪族又は芳香族のI、V又はFであることを表す。
保存領域3はA.cristatus GZAAS20.1005由来FAD-GDHでは81~93残基目に相当するアミノ酸残基であり、A.turcosus HMR AF 23由来FAD-GDHでは81~93残基目に相当するアミノ酸残基であり、Corynascus sepedonium NBRC 31363由来FAD-GDHでは83~95残基目に相当するアミノ酸残基である。
保存領域3を規定するアミノ酸配列は、以下の配列(配列番号36)で構成される。
(A/T)は疎水性・小のA又はTであることを表し、
(G/A)は極小のG又はAであることを表し、
(R/K)は正電荷のR又はKであることを表し、
(A/L)は脂肪族のA又はLであることを表し、
(I/V/L/W)は分岐鎖脂肪族又は芳香族のI、V、L又はWであることを表し、
(G/A)は極小のG又はAであることを表し、
(G/T)は小のG又はTであることを表し、
(S/T)は小のS又はTはであることを表し、
(A/S/T)は小のA、S又はTであることを表し、
(I/V/F)は分岐鎖脂肪族又は芳香族のI、V又はFであることを表す。
好ましくは、保存領域3を規定するアミノ酸配列は、以下の配列(配列番号37)で構成される。
但し、
(W/L)は分岐鎖脂肪族又は芳香族のW又はLであることを表し、
(S/T)は小のS又はTであることを表す。
(W/L)は分岐鎖脂肪族又は芳香族のW又はLであることを表し、
(S/T)は小のS又はTであることを表す。
更に好ましくは、保存領域3を規定するアミノ酸配列は、以下のいずれかの配列で構成される。
AGKALGGTSTING(A.cristatus GZAAS20.1005由来FAD-GDH)(配列番号39)
AGKALGGTTTING(A.turcosus HMR AF 23由来FAD-GDH)(配列番号40)
AGKAWGGTSTING(Corynascus sepedonium NBRC 31363由来FAD-GDH)(配列番号41)
AGKALGGTSTING(A.cristatus GZAAS20.1005由来FAD-GDH)(配列番号39)
AGKALGGTTTING(A.turcosus HMR AF 23由来FAD-GDH)(配列番号40)
AGKAWGGTSTING(Corynascus sepedonium NBRC 31363由来FAD-GDH)(配列番号41)
<保存領域4>
保存領域4はA.cristatus GZAAS20.1005由来FAD-GDHでは208~218残基目に相当するアミノ酸残基であり、A.turcosus HMR AF 23由来FAD-GDHでは209~219残基目に相当するアミノ酸残基であり、Corynascus sepedonium NBRC 31363由来FAD-GDHでは211~221残基目に相当するアミノ酸残基である。
保存領域4を規定するアミノ酸配列は、以下の配列(配列番号42)で構成される。
但し、
(A/V/C/E/D)は小又は負電荷のA、V、C、E又はDであることを表し、
(A/S)は極小のA又はSであることを表し、
(A/Y)はA又Yはであることを表し、
(R/T/A)はR、T又はAであることを表し、
(G/A)は極小のG又はAであることを表し、
(Y/I/L)は分岐鎖脂肪族又は芳香族のY、I又はLであることを表し、
(W/Y/F/L/A/H/K/Q)はW、Y、F、L、A、H、K又はQであることを表す。
保存領域4はA.cristatus GZAAS20.1005由来FAD-GDHでは208~218残基目に相当するアミノ酸残基であり、A.turcosus HMR AF 23由来FAD-GDHでは209~219残基目に相当するアミノ酸残基であり、Corynascus sepedonium NBRC 31363由来FAD-GDHでは211~221残基目に相当するアミノ酸残基である。
保存領域4を規定するアミノ酸配列は、以下の配列(配列番号42)で構成される。
(A/V/C/E/D)は小又は負電荷のA、V、C、E又はDであることを表し、
(A/S)は極小のA又はSであることを表し、
(A/Y)はA又Yはであることを表し、
(R/T/A)はR、T又はAであることを表し、
(G/A)は極小のG又はAであることを表し、
(Y/I/L)は分岐鎖脂肪族又は芳香族のY、I又はLであることを表し、
(W/Y/F/L/A/H/K/Q)はW、Y、F、L、A、H、K又はQであることを表す。
好ましくは、保存領域4を規定するアミノ酸配列は、以下の配列(配列番号43)で構成される。
但し、
(E/C)は小又は負電荷のE又はCであることを表し、
(A/S)は極小のA又はSであることを表し、
(Y/L)は分岐鎖脂肪族又は芳香族のY又はLであることを表し、
(W/Y/H)は芳香族のW、Y又はHであることを表す。
(E/C)は小又は負電荷のE又はCであることを表し、
(A/S)は極小のA又はSであることを表し、
(Y/L)は分岐鎖脂肪族又は芳香族のY又はLであることを表し、
(W/Y/H)は芳香族のW、Y又はHであることを表す。
更に好ましくは、保存領域4を規定するアミノ酸配列は、以下のいずれかの配列で構成される。
REDAARAYYWP(A.cristatus GZAAS20.1005由来FAD-GDH)(配列番号45)
REDAARAYYYP(A.turcosus HMR AF 23由来FAD-GDH)(配列番号46)
RCDSARAYLHP(Corynascus sepedonium NBRC 31363由来FAD-GDH)(配列番号47)
REDAARAYYWP(A.cristatus GZAAS20.1005由来FAD-GDH)(配列番号45)
REDAARAYYYP(A.turcosus HMR AF 23由来FAD-GDH)(配列番号46)
RCDSARAYLHP(Corynascus sepedonium NBRC 31363由来FAD-GDH)(配列番号47)
<保存領域5>
保存領域5はA.cristatus GZAAS20.1005由来FAD-GDHでは268~289残基目に相当するアミノ酸残基であり、A.turcosus HMR AF 23由来FAD-GDHでは271~292残基目に相当するアミノ酸残基であり、Corynascus sepedonium NBRC 31363由来FAD-GDHでは272~293残基目に相当するアミノ酸残基である。
保存領域5を規定するアミノ酸配列は、以下の配列(配列番号48)で構成される。
但し、
(I/V)は分岐鎖脂肪族のI又はVであることを表し、
(I/V)は分岐鎖脂肪族のI又はVであることを表し、
(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表し、
(S/A)は極小のS又はAであることを表し、
(S/T/A)は小のS、T又はAであることを表し、
(S/A)は極小のS又はAであることを表し、
(I/L)は分岐鎖脂肪族のI又はLであることを表し、
(K/R/A/G/I)は脂肪族又は正電荷のK、R、A、G又はIであることを表し、
(S/T)は小のS又はTであることを表し、
(A/G/V/L/K/Q)はA、G、V、L、又はK、Qであることを表し、
(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表し、
(I/V/L/A/H/R)は脂肪族又は正電荷のI、V、L、A、H又はRであることを表し、
(I/V)は分岐鎖脂肪族のI又はVであることを表し、
(D/N/S)は極性・小のD、N又はSであることを表す。
保存領域5はA.cristatus GZAAS20.1005由来FAD-GDHでは268~289残基目に相当するアミノ酸残基であり、A.turcosus HMR AF 23由来FAD-GDHでは271~292残基目に相当するアミノ酸残基であり、Corynascus sepedonium NBRC 31363由来FAD-GDHでは272~293残基目に相当するアミノ酸残基である。
保存領域5を規定するアミノ酸配列は、以下の配列(配列番号48)で構成される。
(I/V)は分岐鎖脂肪族のI又はVであることを表し、
(I/V)は分岐鎖脂肪族のI又はVであることを表し、
(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表し、
(S/A)は極小のS又はAであることを表し、
(S/T/A)は小のS、T又はAであることを表し、
(S/A)は極小のS又はAであることを表し、
(I/L)は分岐鎖脂肪族のI又はLであることを表し、
(K/R/A/G/I)は脂肪族又は正電荷のK、R、A、G又はIであることを表し、
(S/T)は小のS又はTであることを表し、
(A/G/V/L/K/Q)はA、G、V、L、又はK、Qであることを表し、
(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表し、
(I/V/L/A/H/R)は脂肪族又は正電荷のI、V、L、A、H又はRであることを表し、
(I/V)は分岐鎖脂肪族のI又はVであることを表し、
(D/N/S)は極性・小のD、N又はSであることを表す。
好ましくは、保存領域5を規定するアミノ酸配列は、以下の配列(配列番号49)で構成される。
但し、
(I/V)は分岐鎖脂肪族のI又はVであることを表し、
(T/A)は小のT又はAであることを表し、
(S/A)は極小のS又はAであることを表し、
(I/L)は分岐鎖脂肪族のI又はLであることを表し、
(R/I)は分岐鎖脂肪族又は正電荷のR又はIであることを表し、
(T/S)は極性・小のT又はSであることを表し、
(A/L)は脂肪族のA又はLであることを表し、
(L/I/V)は分岐鎖脂肪族のL、I又はVであることを表し、
(L/R/A)は脂肪族又は正電荷のL、R又はAであることを表す。
(I/V)は分岐鎖脂肪族のI又はVであることを表し、
(T/A)は小のT又はAであることを表し、
(S/A)は極小のS又はAであることを表し、
(I/L)は分岐鎖脂肪族のI又はLであることを表し、
(R/I)は分岐鎖脂肪族又は正電荷のR又はIであることを表し、
(T/S)は極性・小のT又はSであることを表し、
(A/L)は脂肪族のA又はLであることを表し、
(L/I/V)は分岐鎖脂肪族のL、I又はVであることを表し、
(L/R/A)は脂肪族又は正電荷のL、R又はAであることを表す。
より好ましくは、保存領域5を規定するアミノ酸配列は、以下の配列(配列番号50)で構成される。
但し、
(T/A)は小のT又はAであることを表し、
(I/L)は分岐鎖脂肪族のI又はLであることを表し、
(R/I)は分岐鎖脂肪族又は正電荷のR又はIであることを表し、
(T/S)は極性・小のT又はSであることを表し、
(L/I)は分岐鎖脂肪族のL又はIであることを表し、
(L/R)は脂肪族又は正電荷のL又はRであることを表す。
(T/A)は小のT又はAであることを表し、
(I/L)は分岐鎖脂肪族のI又はLであることを表し、
(R/I)は分岐鎖脂肪族又は正電荷のR又はIであることを表し、
(T/S)は極性・小のT又はSであることを表し、
(L/I)は分岐鎖脂肪族のL又はIであることを表し、
(L/R)は脂肪族又は正電荷のL又はRであることを表す。
更に好ましくは、保存領域5を規定するアミノ酸配列は、以下のいずれかの配列で構成される。
EVILSTGSIRTPALLELSGVGN(A.cristatus GZAAS20.1005由来FAD-GDH)(配列番号51)
EVILSAGSLISPAILERSGVGN(A.turcosus HMR AF 23由来FAD-GDH)(配列番号52)
EVVLSAGALRTPLVLEASGVGN(Corynascus sepedonium NBRC 31363由来FAD-GDH)(配列番号53)
EVILSTGSIRTPALLELSGVGN(A.cristatus GZAAS20.1005由来FAD-GDH)(配列番号51)
EVILSAGSLISPAILERSGVGN(A.turcosus HMR AF 23由来FAD-GDH)(配列番号52)
EVVLSAGALRTPLVLEASGVGN(Corynascus sepedonium NBRC 31363由来FAD-GDH)(配列番号53)
<保存領域6>
保存領域6はA.cristatus GZAAS20.1005由来FAD-GDHでは302~314残基目に相当するアミノ酸残基であり、A.turcosus HMR AF 23由来FAD-GDHでは305~317残基目に相当するアミノ酸残基であり、Corynascus sepedonium NBRC 31363由来FAD-GDHでは306~318残基目に相当するアミノ酸残基である。
保存領域6を規定するアミノ酸配列は、以下の配列(配列番号54)で構成される。
但し、
(I/V)は分岐鎖脂肪族のI又はVであることを表し、
(D/N)は小のD又はNであることを表し、
(L/A/S/N)は分岐鎖脂肪族又は小のL、A、S又はNであることを表し、
(P/A/T)は小のP、A又はTであることを表し、
(G/F/T)は疎水性のG、F又はTであることを表し、
(E/S)は親水性極性のE又はSであることを表し、
(L/M)は疎水性のL又はMであることを表し、
(Q/V)はQ又はVであることを表し、
(D/E)は負電荷のD又はEであることを表し、
(Q/H)は極性のQ又はHであることを表す。
保存領域6はA.cristatus GZAAS20.1005由来FAD-GDHでは302~314残基目に相当するアミノ酸残基であり、A.turcosus HMR AF 23由来FAD-GDHでは305~317残基目に相当するアミノ酸残基であり、Corynascus sepedonium NBRC 31363由来FAD-GDHでは306~318残基目に相当するアミノ酸残基である。
保存領域6を規定するアミノ酸配列は、以下の配列(配列番号54)で構成される。
(I/V)は分岐鎖脂肪族のI又はVであることを表し、
(D/N)は小のD又はNであることを表し、
(L/A/S/N)は分岐鎖脂肪族又は小のL、A、S又はNであることを表し、
(P/A/T)は小のP、A又はTであることを表し、
(G/F/T)は疎水性のG、F又はTであることを表し、
(E/S)は親水性極性のE又はSであることを表し、
(L/M)は疎水性のL又はMであることを表し、
(Q/V)はQ又はVであることを表し、
(D/E)は負電荷のD又はEであることを表し、
(Q/H)は極性のQ又はHであることを表す。
好ましくは、保存領域6を規定するアミノ酸配列は、以下の配列(配列番号55)で構成される。
但し、
(V/I)は分岐鎖脂肪族のV又はIであることを表し、
(D/N)は小のD又はNであることを表し、
(P/T/A)は小のP、T又はAであることを表し、
(T/G)は疎水性・小のT又はGであることを表し、
(Q/V)はQ又はVであることを表し、
(D/E)は負電荷のD又はEであることを表す。
(V/I)は分岐鎖脂肪族のV又はIであることを表し、
(D/N)は小のD又はNであることを表し、
(P/T/A)は小のP、T又はAであることを表し、
(T/G)は疎水性・小のT又はGであることを表し、
(Q/V)はQ又はVであることを表し、
(D/E)は負電荷のD又はEであることを表す。
より好ましくは、保存領域6を規定するアミノ酸配列は、以下の配列(配列番号56)で構成される。
但し、
(V/I)は分岐鎖脂肪族のV又はIであることを表し、
(D/N)は小のD又はNであることを表し、
(P/T/A)は小のP、T又はAであることを表す。
(V/I)は分岐鎖脂肪族のV又はIであることを表し、
(D/N)は小のD又はNであることを表し、
(P/T/A)は小のP、T又はAであることを表す。
更に好ましくは、保存領域6を規定するアミノ酸配列は、以下のいずれかの配列で構成される。
VDLPTVGENLQDQ(A.cristatus GZAAS20.1005由来FAD-GDH)(配列番号57)
INLATVGENLQDQ(A.turcosus HMR AF 23由来FAD-GDH)(配列番号58)
IDLPGVGENLVEQ(Corynascus sepedonium NBRC 31363由来FAD-GDH)(配列番号59)
VDLPTVGENLQDQ(A.cristatus GZAAS20.1005由来FAD-GDH)(配列番号57)
INLATVGENLQDQ(A.turcosus HMR AF 23由来FAD-GDH)(配列番号58)
IDLPGVGENLVEQ(Corynascus sepedonium NBRC 31363由来FAD-GDH)(配列番号59)
<保存領域7>
保存領域7はA.cristatus GZAAS20.1005由来FAD-GDHでは415~425残基目に相当するアミノ酸残基であり、A.turcosus HMR AF 23由来FAD-GDHでは418~418残基目に相当するアミノ酸残基であり、Corynascus sepedonium NBRC 31363由来FAD-GDHでは420~430残基目に相当するアミノ酸残基である。
保存領域7を規定するアミノ酸配列は、以下の配列(配列番号60)で構成される。
但し、
(S/I/V/L)は分岐鎖脂肪族又は極小のS、I、V又はLであることを表し、
(V/L/M/A/F)は疎水性のV、L、M、A又はFであることを表し、
(L/F)は疎水性のL又はFであることを表し、
(A/S)は極小のA又はSであることを表し、
(N/S/Y)はN、S又はYであることを表し、
(I/V/T)は疎水性のI、V又はTであることを表し、
(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表す。
保存領域7はA.cristatus GZAAS20.1005由来FAD-GDHでは415~425残基目に相当するアミノ酸残基であり、A.turcosus HMR AF 23由来FAD-GDHでは418~418残基目に相当するアミノ酸残基であり、Corynascus sepedonium NBRC 31363由来FAD-GDHでは420~430残基目に相当するアミノ酸残基である。
保存領域7を規定するアミノ酸配列は、以下の配列(配列番号60)で構成される。
(S/I/V/L)は分岐鎖脂肪族又は極小のS、I、V又はLであることを表し、
(V/L/M/A/F)は疎水性のV、L、M、A又はFであることを表し、
(L/F)は疎水性のL又はFであることを表し、
(A/S)は極小のA又はSであることを表し、
(N/S/Y)はN、S又はYであることを表し、
(I/V/T)は疎水性のI、V又はTであることを表し、
(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表す。
好ましくは、保存領域7を規定するアミノ酸配列は、以下の配列(配列番号61)で構成される。
但し、
(L/F)は疎水性のL又はFであることを表し、
(S/A)は極小のS又はAであることを表し、
(N/S)はN又はSであることを表し、
(I/L)は分岐鎖脂肪族のI又はLであることを表す。
(L/F)は疎水性のL又はFであることを表し、
(S/A)は極小のS又はAであることを表し、
(N/S)はN又はSであることを表し、
(I/L)は分岐鎖脂肪族のI又はLであることを表す。
更に好ましくは、保存領域7を規定するアミノ酸配列は、以下のいずれかの配列で構成される。
LLPFSRGNVHI(A.cristatus GZAAS20.1005由来FAD-GDH)(配列番号63)
LLPFARGNVHI(A.turcosus HMR AF 23由来FAD-GDH)(配列番号64)
LFPFSRGSVHL(Corynascus sepedonium NBRC 31363由来FAD-GDH)(配列番号65)
LLPFSRGNVHI(A.cristatus GZAAS20.1005由来FAD-GDH)(配列番号63)
LLPFARGNVHI(A.turcosus HMR AF 23由来FAD-GDH)(配列番号64)
LFPFSRGSVHL(Corynascus sepedonium NBRC 31363由来FAD-GDH)(配列番号65)
<保存領域8>
保存領域8はA.cristatus GZAAS20.1005由来FAD-GDHでは509~519残基目に相当するアミノ酸残基であり、A.turcosus HMR AF 23由来FAD-GDHでは513~523残基目に相当するアミノ酸残基であり、Corynascus sepedonium NBRC 31363由来FAD-GDHでは517~527残基目に相当するアミノ酸残基である。
保存領域8を規定するアミノ酸配列は、以下の配列(配列番号66)で構成される。
但し、
(I/M)は疎水性のI又はMであることを表し、
(L/M)は疎水性のL又はMであることを表し、
(P/S)は小のP又はSであることを表し、
(R/K/E)は荷電のR、K又はEであることを表し、
(D/E/A/G/S/K)はD、E、A、G、S又はKであることを表し、
(I/L/M/A/N/K)はI、L、M、A、N又はKであることを表し、
(I/V)は分岐鎖脂肪族のI又はVであることを表し、
(D/N/S)は極性・小のD、N又はSであることを表す。
保存領域8はA.cristatus GZAAS20.1005由来FAD-GDHでは509~519残基目に相当するアミノ酸残基であり、A.turcosus HMR AF 23由来FAD-GDHでは513~523残基目に相当するアミノ酸残基であり、Corynascus sepedonium NBRC 31363由来FAD-GDHでは517~527残基目に相当するアミノ酸残基である。
保存領域8を規定するアミノ酸配列は、以下の配列(配列番号66)で構成される。
(I/M)は疎水性のI又はMであることを表し、
(L/M)は疎水性のL又はMであることを表し、
(P/S)は小のP又はSであることを表し、
(R/K/E)は荷電のR、K又はEであることを表し、
(D/E/A/G/S/K)はD、E、A、G、S又はKであることを表し、
(I/L/M/A/N/K)はI、L、M、A、N又はKであることを表し、
(I/V)は分岐鎖脂肪族のI又はVであることを表し、
(D/N/S)は極性・小のD、N又はSであることを表す。
好ましくは、保存領域8を規定するアミノ酸配列は、以下の配列(配列番号67)で構成される。
但し、
(S/D/E)は極小又は負電荷のS、D又はEであることを表し、
(M/L)は疎水性のM又はLであることを表し、
(S/D)は極性・小のS又はDであることを表す。
(S/D/E)は極小又は負電荷のS、D又はEであることを表し、
(M/L)は疎水性のM又はLであることを表し、
(S/D)は極性・小のS又はDであることを表す。
より好ましくは、保存領域8を規定するアミノ酸配列は、以下の配列(配列番号68)で構成される。
但し、
(S/D/E)は極小又は負電荷のS、D又はEであることを表し、
(S/D)は極性・小のS又はDであることを表す。
(S/D/E)は極小又は負電荷のS、D又はEであることを表し、
(S/D)は極性・小のS又はDであることを表す。
更に好ましくは、保存領域8を規定するアミノ酸配列は、以下のいずれかの配列で構成される。
MMPRSMGGVVS(A.cristatus GZAAS20.1005由来FAD-GDH)(配列番号69)
MMPREMGGVVD(A.turcosus HMR AF 23由来FAD-GDH)(配列番号70)
MMPRALGGVVD(Corynascus sepedonium NBRC 31363由来FAD-GDH)(配列番号71)
MMPRSMGGVVS(A.cristatus GZAAS20.1005由来FAD-GDH)(配列番号69)
MMPREMGGVVD(A.turcosus HMR AF 23由来FAD-GDH)(配列番号70)
MMPRALGGVVD(Corynascus sepedonium NBRC 31363由来FAD-GDH)(配列番号71)
<保存領域9>
保存領域9はA.cristatus GZAAS20.1005由来FAD-GDHでは524~536残基目に相当するアミノ酸残基であり、A.turcosus HMR AF 23由来FAD-GDHでは528~540残基目に相当するアミノ酸残基であり、Corynascus sepedonium NBRC 31363由来FAD-GDHでは532~544残基目に相当するアミノ酸残基である。
保存領域9を規定するアミノ酸配列は、以下の配列(配列番号72)で構成される。
但し、
(Y/H)は芳香族のY又はHであることを表し、
(G/D)は小のG又はDであることを表し、
(A/S/T/K)はA、S、T又はKであることを表し、
(L/V)は分岐鎖脂肪族のL又はVであることを表し、
(I/V)は分岐鎖脂肪族のI又はVであることを表す。
保存領域9はA.cristatus GZAAS20.1005由来FAD-GDHでは524~536残基目に相当するアミノ酸残基であり、A.turcosus HMR AF 23由来FAD-GDHでは528~540残基目に相当するアミノ酸残基であり、Corynascus sepedonium NBRC 31363由来FAD-GDHでは532~544残基目に相当するアミノ酸残基である。
保存領域9を規定するアミノ酸配列は、以下の配列(配列番号72)で構成される。
(Y/H)は芳香族のY又はHであることを表し、
(G/D)は小のG又はDであることを表し、
(A/S/T/K)はA、S、T又はKであることを表し、
(L/V)は分岐鎖脂肪族のL又はVであることを表し、
(I/V)は分岐鎖脂肪族のI又はVであることを表す。
好ましくは、保存領域9を規定するアミノ酸配列は、以下の配列(配列番号73)で構成される。
但し、
(H/Y)は芳香族のH又はYであることを表し、
(S/A)は極小のS又はAであることを表し、
(I/V)は分岐鎖脂肪族のI又はVであることを表す。
(H/Y)は芳香族のH又はYであることを表し、
(S/A)は極小のS又はAであることを表し、
(I/V)は分岐鎖脂肪族のI又はVであることを表す。
より好ましくは、保存領域9を規定するアミノ酸配列は、以下のいずれかの配列で構成される。
VHGTSNVRIVDAS(A.cristatus GZAAS20.1005由来FAD-GDH)(配列番号74)
VYGTANVRVVDAS(A.turcosus HMR AF 23由来FAD-GDH)(配列番号75)
VYGTANVRVVDAS(Corynascus sepedonium NBRC 31363由来FAD-GDH)(配列番号76)
VHGTSNVRIVDAS(A.cristatus GZAAS20.1005由来FAD-GDH)(配列番号74)
VYGTANVRVVDAS(A.turcosus HMR AF 23由来FAD-GDH)(配列番号75)
VYGTANVRVVDAS(Corynascus sepedonium NBRC 31363由来FAD-GDH)(配列番号76)
<保存領域10>
保存領域10はA.cristatus GZAAS20.1005由来FAD-GDHでは551~562残基目に相当するアミノ酸残基であり、A.turcosus HMR AF 23由来FAD-GDHでは555~566残基目に相当するアミノ酸残基であり、Corynascus sepedonium NBRC 31363由来FAD-GDHでは559~570残基目に相当するアミノ酸残基である。
保存領域10を規定するアミノ酸配列は、以下の配列(配列番号77)で構成される。
但し、
(Y/F)は芳香族のY又はFであることを表し、
(A/G)は極小のA又はGであることを表し、
(I/L/V)は分岐鎖脂肪族のI、L又はVであることを表し、
(A/S)は極小のA又はSであることを表し、
(R/K/L)は分岐鎖脂肪族又は正電荷のR、K又はLであることを表し、
(A/I/T)は疎水性のA、I又はTであることを表し、
(A/S)は極小のA又はSであることを表し、
(D/E)は負電荷のD又はEであることを表し、
(I/L/V/F/R/Q)はI、L、V、F、R又はQであることを表し、
(I/L)は分岐鎖脂肪族のI又はLであることを表し、
(K/E/Q)は極性のK、E又はQであることを表す。
保存領域10はA.cristatus GZAAS20.1005由来FAD-GDHでは551~562残基目に相当するアミノ酸残基であり、A.turcosus HMR AF 23由来FAD-GDHでは555~566残基目に相当するアミノ酸残基であり、Corynascus sepedonium NBRC 31363由来FAD-GDHでは559~570残基目に相当するアミノ酸残基である。
保存領域10を規定するアミノ酸配列は、以下の配列(配列番号77)で構成される。
(Y/F)は芳香族のY又はFであることを表し、
(A/G)は極小のA又はGであることを表し、
(I/L/V)は分岐鎖脂肪族のI、L又はVであることを表し、
(A/S)は極小のA又はSであることを表し、
(R/K/L)は分岐鎖脂肪族又は正電荷のR、K又はLであることを表し、
(A/I/T)は疎水性のA、I又はTであることを表し、
(A/S)は極小のA又はSであることを表し、
(D/E)は負電荷のD又はEであることを表し、
(I/L/V/F/R/Q)はI、L、V、F、R又はQであることを表し、
(I/L)は分岐鎖脂肪族のI又はLであることを表し、
(K/E/Q)は極性のK、E又はQであることを表す。
好ましくは、保存領域10を規定するアミノ酸配列は、以下の配列(配列番号78)で構成される。
但し、
(A/G)は極小のA又はGであることを表し、
(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表し、
(S/A)は極小のS又はAであることを表し、
(L/I)は分岐鎖脂肪族のL又はIであることを表す。
(A/G)は極小のA又はGであることを表し、
(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表し、
(S/A)は極小のS又はAであることを表し、
(L/I)は分岐鎖脂肪族のL又はIであることを表す。
より好ましくは、保存領域10を規定するアミノ酸配列は、以下の配列(配列番号79)で構成される。
但し、
(I/V)は分岐鎖脂肪族のI又はVであることを表し、
(S/A)は極小のS又はAであることを表し、
(L/I)は分岐鎖脂肪族のL又はIであることを表す。
(I/V)は分岐鎖脂肪族のI又はVであることを表し、
(S/A)は極小のS又はAであることを表し、
(L/I)は分岐鎖脂肪族のL又はIであることを表す。
更に好ましくは、保存領域10を規定するアミノ酸配列は、以下のいずれかの配列で構成される。
YAIAERASDLIK(A.cristatus GZAAS20.1005由来FAD-GDH)(配列番号80)
YAVAERAADIIK(A.turcosus HMR AF 23由来FAD-GDH)(配列番号81)
YGLAERASDIIK(Corynascus sepedonium NBRC 31363由来FAD-GDH)(配列番号82)
YAIAERASDLIK(A.cristatus GZAAS20.1005由来FAD-GDH)(配列番号80)
YAVAERAADIIK(A.turcosus HMR AF 23由来FAD-GDH)(配列番号81)
YGLAERASDIIK(Corynascus sepedonium NBRC 31363由来FAD-GDH)(配列番号82)
有する保存領域の数は1個、2個、3個、4個、5個、6個、7個、8個、9個又は10個である。通常、有する保存領域の数は多い方がよい。従って、典型的には、有する保存領域が多いほど、より好ましい態様の酵素となり、最も好ましい態様では保存領域1~10の全てを有することになる。
本酵素は、遺伝子工学的手法によって容易に調製することができる。例えば、本酵素をコードするDNAで適当な宿主細胞(例えば大腸菌)を形質転換し、形質転換体内で発現されたタンパク質を回収することにより調製することができる。回収されたタンパク質は目的に応じて適宜精製される。このように組換えタンパク質として本酵素を得ることにすれば種々の修飾が可能である。例えば、本酵素をコードするDNAと他の適当なDNAとを同じベクターに挿入し、当該ベクターを用いて組換えタンパク質の生産を行えば、任意のペプチドないしタンパク質が連結された組換えタンパク質からなる本酵素を得ることができる。また、糖鎖及び/又は脂質の付加や、あるいはN末端若しくはC末端のプロセッシングが生ずるような修飾を施してもよい。以上のような修飾により、組換えタンパク質の抽出、精製の簡便化、又は生物学的機能の付加等が可能である。
3.グルコースデヒドロゲナーゼ(GDH)をコードする核酸等
本発明の第2の局面は本酵素に関連する核酸を提供する。即ち、本酵素をコードする遺伝子が提供される。本酵素をコードする遺伝子は典型的には本酵素の調製に利用される。本酵素をコードする遺伝子を用いた遺伝子工学的調製法によれば、より均質な状態の本酵素を得ることが可能である。また、当該方法は大量の本酵素を調製する場合にも好適な方法といえる。尚、本酵素をコードする遺伝子の用途は本酵素の調製に限られない。例えば、本酵素の作用機構の解明などを目的とした実験用のツールとして、或いは酵素の更なる変異体をデザイン又は作製するためのツールとして、当該核酸を利用することもできる。
本発明の第2の局面は本酵素に関連する核酸を提供する。即ち、本酵素をコードする遺伝子が提供される。本酵素をコードする遺伝子は典型的には本酵素の調製に利用される。本酵素をコードする遺伝子を用いた遺伝子工学的調製法によれば、より均質な状態の本酵素を得ることが可能である。また、当該方法は大量の本酵素を調製する場合にも好適な方法といえる。尚、本酵素をコードする遺伝子の用途は本酵素の調製に限られない。例えば、本酵素の作用機構の解明などを目的とした実験用のツールとして、或いは酵素の更なる変異体をデザイン又は作製するためのツールとして、当該核酸を利用することもできる。
本明細書において「本酵素をコードする遺伝子」とは、それを発現させた場合に本酵素が得られる核酸のことをいい、本酵素のアミノ酸配列に対応する塩基配列を有する核酸は勿論のこと、そのような核酸にアミノ酸配列をコードしない配列が付加されてなる核酸をも含む。また、コドンの縮重も考慮される。
本酵素をコードする遺伝子の配列の例を配列番号5(アスペルギルス・クリステイタス由来FAD-GDHをコードする配列)、配列番号6(アスペルギルス・タルコサス由来FAD-GDHをコードする配列)、配列番号7(コルニアスカス・セペドニウム由来FAD-GDHをコードする配列)に示す。
本発明の核酸は、本明細書又は添付の配列表が開示する配列情報を参考にし、標準的な遺伝子工学的手法、分子生物学的手法、生化学的手法などを用いることによって、単離された状態に調製することができる。
本発明の他の態様では、本酵素をコードする遺伝子の塩基配列と比較した場合にそれがコードするタンパク質の機能は同等であるものの一部において塩基配列が相違する核酸(以下、「等価核酸」ともいう。また、等価核酸を規定する塩基配列を「等価塩基配列」ともいう)が提供される。等価核酸の例として、本酵素をコードする核酸の塩基配列を基準として1若しくは複数の塩基の置換、欠失、挿入、付加、又は逆位を含む塩基配列からなり、本酵素に特徴的な酵素活性(即ちGDH活性)を有するタンパク質をコードするDNAを挙げることができる。塩基の置換や欠失などは複数の部位に生じていてもよい。ここでの「複数」とは、当該核酸がコードするタンパク質の立体構造におけるアミノ酸残基の位置や種類によっても異なるが例えば2~40塩基、好ましくは2~20塩基、より好ましくは2~10塩基である。
等価核酸は、基準となる塩基配列(配列番号5~7のいずれかの配列)に対して、30%以上、40%以上、50%以上、60%以上、70%以上、80%以上、85%以上、90%以上、92%以上、95%以上、又は99%以上の同一性を有する(同一性のパーセンテージが高い程、より好ましいことになる)。好ましくは、等価核酸は、本発明の特有領域と保存領域1~10の11領域のアミノ酸配列をコードする部分を有する。従って、好ましい態様の等価核酸は、特有領域のアミノ酸配列(配列番号1)をコードする塩基配列、保存領域1のアミノ酸配列(例えば配列番号24のアミノ酸配列、好ましくは配列番号25のアミノ酸配列、より好ましくは配列番号26のアミノ酸配列)をコードする塩基配列、保存領域2のアミノ酸配列(例えば配列番号30のアミノ酸配列、好ましくは配列番号31のアミノ酸配列、より好ましくは配列番号32のアミノ酸配列)をコードする塩基配列、保存領域3のアミノ酸配列(例えば配列番号36のアミノ酸配列、好ましくは配列番号37のアミノ酸配列、より好ましくは配列番号38のアミノ酸配列)をコードする塩基配列、保存領域4のアミノ酸配列(例えば配列番号42のアミノ酸配列、好ましくは配列番号43のアミノ酸配列、より好ましくは配列番号44のアミノ酸配列)をコードする塩基配列、保存領域5のアミノ酸配列(例えば配列番号48のアミノ酸配列、好ましくは配列番号49のアミノ酸配列、より好ましくは配列番号50のアミノ酸配列)をコードする塩基配列、保存領域6のアミノ酸配列(例えば配列番号54のアミノ酸配列、好ましくは配列番号55のアミノ酸配列、より好ましくは配列番号56のアミノ酸配列)をコードする塩基配列、保存領域7のアミノ酸配列(例えば配列番号60のアミノ酸配列、好ましくは配列番号61のアミノ酸配列、より好ましくは配列番号62のアミノ酸配列)をコードする塩基配列、保存領域8のアミノ酸配列(例えば配列番号66のアミノ酸配列、好ましくは配列番号67のアミノ酸配列、より好ましくは配列番号68のアミノ酸配列)をコードする塩基配列、保存領域9のアミノ酸配列(例えば配列番号72のアミノ酸配列、好ましくは配列番号73のアミノ酸配列)をコードする塩基配列、及び保存領域10のアミノ酸配列(例えば配列番号77のアミノ酸配列、好ましくは配列番号78のアミノ酸配列、より好ましくは配列番号79のアミノ酸配列)をコードする塩基配列をその一部として有する。
以上のような等価核酸は例えば、制限酵素処理、エキソヌクレアーゼやDNAリガーゼ等による処理、位置指定突然変異導入法(Molecular Cloning, Third Edition, Chapter 13, Cold Spring Harbor Laboratory Press, New York)やランダム突然変異導入法(Molecular Cloning, Third Edition, Chapter 13, Cold Spring Harbor Laboratory Press, New York)による変異の導入などによって得られる。また、紫外線照射など他の方法によっても等価核酸を得ることができる。
本発明は更に、本発明の遺伝子(本酵素をコードする遺伝子)を含む組換えDNAを提供する。本発明の組換えDNAは例えばベクターの形態で提供される。本明細書において用語「ベクター」は、それに挿入された核酸を細胞等のターゲット内へと輸送することができる核酸性分子をいう。
使用目的(クローニング、タンパク質の発現)に応じて、また宿主細胞の種類を考慮して適当なベクターが選択される。大腸菌を宿主とするベクターとしてはM13ファージ又はその改変体、λファージ又はその改変体、pBR322又はその改変体(pB325、pAT153、pUC8など)等、酵母を宿主とするベクターとしてはpYepSec1、pMFa、pYES2等、昆虫細胞を宿主とするベクターとしてはpAc、pVL等、哺乳類細胞を宿主とするベクターとしてはpCDM8、pMT2PC等、糸状菌を宿主とするベクターとしてはpUC19等を例示することができる。
本発明のベクターは好ましくは発現ベクターである。「発現ベクター」とは、それに挿入された核酸を目的の細胞(宿主細胞)内に導入することができ、且つ当該細胞内において発現させることが可能なベクターをいう。発現ベクターは通常、挿入された核酸の発現に必要なプロモーター配列や、発現を促進させるエンハンサー配列等を含む。選択マーカーを含む発現ベクターを使用することもできる。かかる発現ベクターを用いた場合には、選択マーカーを利用して発現ベクターの導入の有無(及びその程度)を確認することができる。
本発明の核酸のベクターへの挿入、選択マーカー遺伝子の挿入(必要な場合)、プロモーターの挿入(必要な場合)等は標準的な組換えDNA技術(例えば、Molecular Cloning, Third Edition, 1.84, Cold Spring Harbor Laboratory Press, New Yorkを参照することができる、制限酵素及びDNAリガーゼを用いた周知の方法)を用いて行うことができる。
宿主細胞としては、取り扱いの容易さの点から、大腸菌(エシェリヒア・コリ)、出芽酵母(サッカロマイセス・セレビシエ)、糸状菌(アスペルギルス・オリゼ)などの微生物を用いることが好ましいが、組換えDNAが複製可能で且つ本酵素の遺伝子が発現可能な宿主細胞であれば利用可能である。大腸菌の例としてT7系プロモーターを利用する場合は大腸菌BL21(DE3)pLysS、そうでない場合は大腸菌JM109を挙げることができる。糸状菌の例としてアスペルギルス・オリゼ(Aspergillus oryzae)RIB40を挙げることができる。また、出芽酵母の例として出芽酵母SHY2、出芽酵母AH22あるいは出芽酵母INVSc1(インビトロジェン社)を挙げることができる。
本発明の更に、本発明の組換えDNAを保有する微生物(即ち形質転換体)を提供する。本発明の微生物は、上記本発明のベクターを用いたトランスフェクション乃至はトランスフォーメーションによって得ることができる。例えば、塩化カルシウム法(ジャーナル オブ モレキュラー バイオロジー(J.Mol. Biol.)、第53巻、第159頁 (1970))、ハナハン(Hanahan)法(ジャーナル オブ モレキュラー バイオロジー、第166巻、第557頁(1983))、SEM法(ジーン(Gene)、第96巻、第23頁(1990)〕、チャング(Chung)らの方法(プロシーディングズ オブ ザ ナショナル アカデミー オブ サイエンシーズ オブ ザ USA、第86巻、第2172頁(1989))、リン酸カルシウム共沈降法、エレクトロポーレーション(Potter,H. et al., Proc. Natl. Acad. Sci. U.S.A. 81, 7161-7165(1984))、リポフェクション(Felgner, P.L. et al., Proc. Natl. Acad. Sci. U.S.A. 84, 7413-7417(1984))等によって実施することができる。尚、本発明の微生物は、本酵素を生産することに利用することができる。
4.グルコースデヒドロゲナーゼ(GDH)の調製法1
本発明の更なる局面は本酵素の調製法に関する。本発明の調製法では本酵素を遺伝子工学的手法で調製する。具体的には、まず本酵素をコードする遺伝子を用意する(ステップ(1))。具体的には、例えば、配列番号2~4のいずれかのアミノ酸配列をコードする核酸を用意する。ここで、「配列番号2~4のいずれかのアミノ酸配列をコードする核酸」は、それを発現させた場合に当該アミノ酸配列を有するポリペプチドが得られる核酸であり、当該アミノ酸配列に対応する塩基配列からなる核酸は勿論のこと、そのような核酸に余分な配列(アミノ酸配列をコードする配列であっても、アミノ酸配列をコードしない配列であってもよい)が付加されていてもよい。また、コドンの縮重も考慮される。「配列番号2~4のいずれかのアミノ酸配列をコードする核酸」は、本明細書又は添付の配列表が開示する配列情報を参考にし、標準的な遺伝子工学的手法、分子生物学的手法、生化学的手法などを用いることによって、単離された状態に調製することができる。
本発明の更なる局面は本酵素の調製法に関する。本発明の調製法では本酵素を遺伝子工学的手法で調製する。具体的には、まず本酵素をコードする遺伝子を用意する(ステップ(1))。具体的には、例えば、配列番号2~4のいずれかのアミノ酸配列をコードする核酸を用意する。ここで、「配列番号2~4のいずれかのアミノ酸配列をコードする核酸」は、それを発現させた場合に当該アミノ酸配列を有するポリペプチドが得られる核酸であり、当該アミノ酸配列に対応する塩基配列からなる核酸は勿論のこと、そのような核酸に余分な配列(アミノ酸配列をコードする配列であっても、アミノ酸配列をコードしない配列であってもよい)が付加されていてもよい。また、コドンの縮重も考慮される。「配列番号2~4のいずれかのアミノ酸配列をコードする核酸」は、本明細書又は添付の配列表が開示する配列情報を参考にし、標準的な遺伝子工学的手法、分子生物学的手法、生化学的手法などを用いることによって、単離された状態に調製することができる。
ステップ(1)に続いて、用意した遺伝子を発現させる(ステップ(2))。例えば、まず上記遺伝子を挿入した発現ベクターを用意し、これを用いて宿主細胞を形質転換する。次に、発現産物である変異酵素が産生される条件下で形質転換体を培養する。形質転換体の培養は常法に従えばよい。培地に使用する炭素源としては資化可能な炭素化合物であればよく、例えばグルコース、シュークロース、ラクトース、マルトース、糖蜜、ピルビン酸などが使用される。また、窒素源としては利用可能な窒素化合物であればよく、例えばペプトン、肉エキス、酵母エキス、カゼイン加水分解物、大豆粕アルカリ抽出物などが使用される。その他、リン酸塩、炭酸塩、硫酸塩、マグネシウム、カルシウム、カリウム、鉄、マンガン、亜鉛などの塩類、特定のアミノ酸、特定のビタミンなどが必要に応じて使用される。
培養温度は培養対象の形質転換体の生育特性や変異型酵素の産生特性などを考慮して設定することができる。好ましくは30℃~40℃の範囲内(より好ましくは37℃付近)で設定することができる。培養時間は、培養対象の形質転換体の生育特性や変異型酵素の産生特性などを考慮して設定することができる。培地のpHは、形質転換体が生育し且つ酵素が産生される範囲内に調製される。好ましくは培地のpHを6.0~9.0程度(好ましくはpH7.0付近)とする。
続いて、発現産物(GDH)を回収する(ステップ(3))。培養後の菌体を含む培養液をそのまま、或いは濃縮、不純物の除去などを経た後に酵素溶液として利用することもできるが、一般的には培養液又は菌体より発現産物を一旦回収する。発現産物が分泌型タンパク質であれば培養液より、それ以外であれば菌体内より回収することができる。培養液から回収する場合には、例えば培養上清をろ過、遠心処理して不溶物を除去した後、減圧濃縮、膜濃縮、硫酸アンモニウムや硫酸ナトリウムを利用した塩析、メタノールやエタノール又はアセトンなどによる分別沈殿法、透析、加熱処理、等電点処理、ゲルろ過や吸着クロマトグラフィー、イオン交換クロマトグラフィー、アフィニティクロマトグラフィー等の各種クロマトグラフィー(例えば、セファデックス(Sephadex)ゲル(GEヘルスケアバイオサイエンス)などによるゲルろ過、DEAEセファロースCL-6B(GEヘルスケアバイオサイエンス)、オクチルセファロースCL-6B(GEヘルスケアバイオサイエンス)、CMセファロースCL-6B(GEヘルスケアバイオサイエンス))などを組み合わせて分離、精製を行ことによりGDHの精製品を得ることができる。他方、菌体内から回収する場合には、培養液をろ過、遠心処理等することによって菌体を採取し、次いで菌体を加圧処理、超音波処理などの機械的方法またはリゾチームなどによる酵素d的方法で破壊した後、上記と同様に分離、精製を行うことによりGDHの精製品を得ることができる。
酵素の精製度は特に限定されないが、例えば比活性が0.1~1000(U/mg)、好ましくは比活性が1~500(U/mg)の状態に精製することができる。また、最終的な形態は液体状であっても固体状(粉体状を含む)であってもよい。
上記のようにして得られた精製酵素を、例えば凍結乾燥や真空乾燥或いはスプレードライなどにより粉末化して提供することも可能である。その際、精製酵素を予めリン酸緩衝液、トリエタノールアミン緩衝液、トリス塩酸緩衝液やGOODの緩衝液に溶解させておいてもよい。好ましくは、リン酸緩衝液、トリエタノールアミン緩衝液を使用することができる。尚、ここでGOODの緩衝液としてはPIPES、MES又はMOPSが挙げられる。
通常は、以上のように適当な宿主-ベクター系を利用して遺伝子の発現~発現産物(GDH)の回収を行うが、無細胞合成系を利用することにしてもよい。ここで、「無細胞合成系(無細胞転写系、無細胞転写/翻訳系)」とは、生細胞を用いるのではく、生細胞由来の(或いは遺伝子工学的手法で得られた)リボソームや転写・翻訳因子などを用いて、鋳型である核酸(DNAやmRNA)からそれがコードするmRNAやタンパク質をin vitroで合成することをいう。無細胞合成系では一般に、細胞破砕液を必要に応じて精製して得られる細胞抽出液が使用される。細胞抽出液には一般に、タンパク質合成に必要なリボソーム、開始因子などの各種因子、tRNAなどの各種酵素が含まれる。タンパク質の合成を行う際には、この細胞抽出液に各種アミノ酸、ATP、GTPなどのエネルギー源、クレアチンリン酸など、タンパク質の合成に必要なその他の物質を添加する。勿論、タンパク質合成の際に、別途用意したリボソームや各種因子、及び/又は各種酵素などを必要に応じて補充してもよい。
タンパク質合成に必要な各分子(因子)を再構成した転写/翻訳系の開発も報告されている(Shimizu, Y. et al.: Nature Biotech., 19, 751-755, 2001)。この合成系では、バクテリアのタンパク質合成系を構成する3種類の開始因子、3種類の伸長因子、終結に関与する4種類の因子、各アミノ酸をtRNAに結合させる20種類のアミノアシルtRNA合成酵素、及びメチオニルtRNAホルミル転移酵素からなる31種類の因子の遺伝子を大腸菌ゲノムから増幅し、これらを用いてタンパク質合成系をin vitroで再構成している。本発明ではこのような再構成した合成系を利用してもよい。
用語「無細胞転写/翻訳系」は、無細胞タンパク質合成系、in vitro翻訳系又はinvitro転写/翻訳系と交換可能に使用される。In vitro翻訳系ではRNAが鋳型として用いられてタンパク質が合成される。鋳型RNAとしては全RNA、mRNA、in vitro転写産物などが使用される。他方のin vitro転写/翻訳系ではDNAが鋳型として用いられる。鋳型DNAはリボソーム結合領域を含むべきであって、また適切なターミネーター配列を含むことが好ましい。尚、in vitro転写/翻訳系では、転写反応及び翻訳反応が連続して進行するように各反応に必要な因子が添加された条件が設定される。
5.グルコースデヒドロゲナーゼの用途
本発明の更なる局面は本酵素の用途に関する。この局面ではまず、本酵素を用いたグルコース測定法が提供される。本発明のグルコース測定法では本酵素による酸化還元反応を利用して試料中のグルコース量を測定する。この反応による変化が利用できる各種用途に本発明を適用可能である。
本発明の更なる局面は本酵素の用途に関する。この局面ではまず、本酵素を用いたグルコース測定法が提供される。本発明のグルコース測定法では本酵素による酸化還元反応を利用して試料中のグルコース量を測定する。この反応による変化が利用できる各種用途に本発明を適用可能である。
本発明は例えば血糖値の測定(自己血糖測定(SMBG)及び持続血糖測定(CGM))、血液以外の体液(例えば涙、唾液、細胞間質液、尿等)に含まれるグルコースの測定、食品(調味料や飲料など)中のグルコース濃度の測定などに利用される。また、発酵食品(例えば食酢)又は発酵飲料(例えばビールや酒)の製造工程において発酵度を調べるために本発明を利用してもよい。
本発明はまた、本酵素を含むグルコース測定用試薬を提供する。当該試薬は上記の本発明のグルコース測定法に使用される。グルコース測定用試薬の安定化や使用時の活性化等を目的として、血清アルブミン、タンパク質、界面活性剤、糖類、糖アルコール、無機塩類等を添加してもよい。
グルコース測定用試薬を測定キットの構成要素にすることもできる。換言すれば、本発明は、上記グルコース測定用試薬を含むキット(グルコース測定用キット)も提供する。本発明のキットは必須の構成要素として上記グルコース測定用試薬を含む。また、反応用試薬、緩衝液、グルコース標準液、容器などを任意の要素として含む。尚、本発明のグルコース測定キットには通常、使用説明書が添付される。
本酵素を利用してグルコースセンサを構成することが可能である。即ち、本発明は、本酵素を含むグルコースセンサも提供する。本発明のグルコースセンサの典型的な構造では、絶縁性基板上に作用電極及び対極を備えた電極系が形成され、その上に本酵素とメディエータを含む試薬層が形成される。より詳細には、通常、作用電極上に試薬層がコートされる。作用電極と対極が向き合うように構成される、対面型のグルコースセンサにも本発明を適用可能である。一方、参照電極も備えた測定系を用いることにしてもよい。このような、いわゆる3電極系の測定系を用いれば、参照電極の電位を基準として作用電極の電位を表すことが可能となる。各電極の材料は特に限定されない。作用電極及び対極の電極材料の例を示せば、金(Au)、カーボン(C)、白金(Pt)、チタン(Ti)である。メディエータとしては、フェリシアン化合物(フェリシアン化カリウムなど)、金属錯体(ルテニウム錯体、オスミウム錯体、バナジウム錯体など)、キノン化合物(ピロロキノリンキノンなど)などが使用される。尚、グルコースセンサの構成、グルコースセンサを利用した電気化学的測定法については、例えば、バイオ電気化学の実際-バイオセンサ・バイオ電池の実用展開-(2007年3月発行、シーエムシー出版)に詳しい。
本酵素を酵素剤の形態で提供することもできる。本発明の酵素剤は有効成分(本酵素)の他、賦形剤、緩衝剤、懸濁剤、安定剤、保存剤、防腐剤、生理食塩水などを含有していてもよい。賦形剤としてはデンプン、デキストリン、マルトース、トレハロース、乳糖、ソルビトール、D-マンニトール、白糖、グリセロール、シュガーエステル等やその誘導体、D-グルコース誘導体を用いることができる。緩衝剤としてはリン酸塩、クエン酸塩、酢酸塩等を用いることができる。安定剤としてはプロピレングリコール、アスコルビン酸等を用いることができる。保存剤としてはフェノール、塩化ベンザルコニウム、ベンジルアルコール、クロロブタノール、メチルパラベン等を用いることができる。防腐剤としてはエタノール、塩化ベンザルコニウム、パラオキシ安息香酸、クロロブタノール等を用いることができる。酵素剤の用途としては例えば、グルコースの測定、血糖値の測定、発酵度の測定が挙げられる。
6.グルコースデヒドロゲナーゼ(GDH)のスクリーニング方法
本発明の更なる局面はGDHをスクリーニングする方法に関する。本発明のスクリーニング方法は、新規GDHを同定・取得する手段として有用である。本発明のスクリーニング方法では以下のステップ(i)及び(ii)を行う。
(i)既知のGDHのアミノ酸配列に対して20%以上の同一性を示すアミノ酸配列を、アミノ酸配列データベースを利用して検索するステップ
(ii)ヒットしたアミノ酸配列の中から、以下の配列(配列番号1)、即ち、
(但し、式中の各アミノ酸残基の上の数字はN末端側からの通し番号であり、H/NはH(ヒスチジン)又はN(アスパラギン)を表し、L/I/MはL(ロイシン)、I(イソロイシン)又はM(メチオニン)を表し、V/IはV(バリン)又はI(イソロイシン)を表し、G/A/SはG(グリシン)、A(アラニン)又はS(セリン)を表し、F/W/YはF(フェニルアラニン)、W(トリプトファン)又はY(チロシン)を表し、Xは任意のアミノ酸残基を表す)からなるアミノ酸領域を有するものを選抜するステップ
本発明の更なる局面はGDHをスクリーニングする方法に関する。本発明のスクリーニング方法は、新規GDHを同定・取得する手段として有用である。本発明のスクリーニング方法では以下のステップ(i)及び(ii)を行う。
(i)既知のGDHのアミノ酸配列に対して20%以上の同一性を示すアミノ酸配列を、アミノ酸配列データベースを利用して検索するステップ
(ii)ヒットしたアミノ酸配列の中から、以下の配列(配列番号1)、即ち、
ステップ(i)はアミノ酸データベースを利用して、特定の条件、即ち、基準となる既知の特定のGDH(以下、「基準GDH」と呼ぶ)のアミノ酸配列に対して所定の相同性を示す配列を検索するステップである。典型的には1つのGDHを基準GDHとするが、複数のGDHを基準GDHとして併用し、それらの全てに所定の相同性を示す配列を検索することにしてもよい。本発明では、基準GDHのアミノ酸配列に対して20%以上の同一性を示すアミノ酸配列が検索される。同一性を更に高めて(例えば、25%以上、30%以上、31%以上、32%以上、33%以上、34%以上、35%以上、36%以上、37%以上、38%以上、39%以上、40%以上)検索することにしてもよい。尚、類縁酵素(同一又は類似の活性等の発揮を期待できる酵素)の取得を目指す場合、配列同一性が高いものを検索するのが一般的である。換言すれば、従来の探索手段は配列同一性の高い類縁酵素を取得するのに向いている。対照的に本発明は、配列同一性が低い酵素の中から効率よく類縁酵素を見出すことを可能にするものであり、従来の探索手段とは一線を画する。
既知のGDH、即ち基準GDHは特に限定されず、その例として、アスペルギルス・オリゼ由来FAD-GDH(例えば配列番号22のアミノ酸配列を有するもの)及びアスペルギルス・テレウス由来FAD-GDH(例えば配列番号23のアミノ酸配列を有するもの)を挙げることができる。
利用するアミノ酸配列データベースは特に限定されない。例えば、Entrez Protein(http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=Protein)、Swiss-Prot(http://www.expasy.org/sprot/)、PIR(http://pir.georgetown.edu/)等のデータベースを利用することができる。
好ましくは、GMC oxidoreductase familyの中から上記条件を満たす配列を検索する。換言すれば、検索対象をGMC oxidoreductase familyに属するタンパク質(酵素)のアミノ酸配列に限定し、検索効率の向上等を図る。
ステップ(i)に続くステップ(ii)では、ヒットしたアミノ酸配列の中から、ルール1で規定されるアミノ酸領域を有するものを特定し、選抜する。ヒットした配列が一つの場合は、それが、ルール1で規定されるアミノ酸領域を有するか否かを確認することになり、有していれば有望であると判断される。ルール1については、本発明の第1の局面(2.グルコースデヒドロゲナーゼ(GDH)の欄)で説明した通りであるため、上記の説明を援用し、その詳細は省略する。
好ましい態様では、ルール1で規定されるアミノ酸領域がルール2(条件1、2)も満足する。換言すれば、ルール1、2を満足するアミノ酸領域を有するアミノ酸配列が選抜されることになる。ルール2については、本発明の第1の局面(2.グルコースデヒドロゲナーゼ(GDH)の欄)で説明した通りであるため、上記の説明を援用し、その詳細は省略する。
更に好ましい態様では、ルール1で規定されるアミノ酸領域がルール3も満足する。換言すれば、ルール1~3を満足するアミノ酸領域を有するアミノ酸配列が選抜されることになる。ルール3については、本発明の第1の局面(2.グルコースデヒドロゲナーゼ(GDH)の欄)で説明した通りであるため、上記の説明を援用し、その詳細は省略する。
好ましくは、ステップ(ii)で選抜したアミノ酸配列の中から、上記第1の局面で説明した保存領域1~10を有するものを選抜する(ステップ(iii))。ステップ(ii)で選抜したアミノ酸配列が一つの場合は、それが保存領域1~10を有するか否かを確認することになり、有していれば有望であると判断される。
ステップ(i)及び(ii)、或いはステップ(i)~(iii)によって、有望なアミノ酸配列が選抜されることになるが、選抜されたアミノ酸配列がGDHとして実際に機能するか否かを確認することが好ましい。即ち、好ましくは、選抜されたアミノ酸配列からなるタンパク質のGDH活性を確認するステップ(ステップ(iv))を行う。GDH活性が認められれば、有望な新規GDHであるとして同定される。また、GDH活性が高い場合、特に有望なものとして同定されることになる。尚、GDH活性の確認には例えば、後述の実施例に示した活性測定方法を用いればよい。
7.改変型グルコースデヒドロゲナーゼ(GDH)の設計方法
本発明の更なる局面は改変型GDHの設計方法に関する。本発明の設計方法は、例えば、既知のGDHの活性を高める手段として有用である。また、既知のGDHに対して一定の相同性を示し、GDHとして有望なタンパク質をGDH化する(即ちGDH活性を付与する)手段として利用することも可能である。用語「改変型GDH」とは、既存のアミノ酸配列の一部の変更(改変)によって得られるGDHである。従って、改変前のアミノ酸配列と改変後のアミノ酸配列の間には相違が認められる。
本発明の更なる局面は改変型GDHの設計方法に関する。本発明の設計方法は、例えば、既知のGDHの活性を高める手段として有用である。また、既知のGDHに対して一定の相同性を示し、GDHとして有望なタンパク質をGDH化する(即ちGDH活性を付与する)手段として利用することも可能である。用語「改変型GDH」とは、既存のアミノ酸配列の一部の変更(改変)によって得られるGDHである。従って、改変前のアミノ酸配列と改変後のアミノ酸配列の間には相違が認められる。
本発明の設計方法では以下のステップ(I)及び(II)が行われる。
(I)既知のGDHのアミノ酸配列、又は既知のGDHのアミノ酸配列に対して20%以上の同一性を示すアミノ酸配列であって、以下の配列(配列番号1)、即ち、
(但し、式中の各アミノ酸残基の上の数字はN末端側からの通し番号であり、H/NはH(ヒスチジン)又はN(アスパラギン)を表し、L/I/MはL(ロイシン)、I(イソロイシン)又はM(メチオニン)を表し、V/IはV(バリン)又はI(イソロイシン)を表し、G/A/SはG(グリシン)、A(アラニン)又はS(セリン)を表し、F/W/YはF(フェニルアラニン)、W(トリプトファン)又はY(チロシン)を表し、Xは任意のアミノ酸残基を表す)からなるアミノ酸領域を有しない、改変対象のアミノ酸配列を用意するステップ
(II)用意したアミノ酸配列において前記アミノ酸領域に対応する領域を特定した後、該領域が前記アミノ酸領域に該当するように改変することによって改変型アミノ酸配列を構築するステップ
(I)既知のGDHのアミノ酸配列、又は既知のGDHのアミノ酸配列に対して20%以上の同一性を示すアミノ酸配列であって、以下の配列(配列番号1)、即ち、
(II)用意したアミノ酸配列において前記アミノ酸領域に対応する領域を特定した後、該領域が前記アミノ酸領域に該当するように改変することによって改変型アミノ酸配列を構築するステップ
ステップ(I)は改変に供するアミノ酸配列(「改変対象アミノ酸配列」と呼ぶ)を用意するステップである。本発明では、既知のGDHのアミノ酸配列、又は既知のGDHのアミノ酸配列に対して20%以上の同一性を示すアミノ酸配列の中から、ルール1で規定されるアミノ酸領域を有しないものを選抜し、改変対象アミノ酸配列とする。好ましくは、ルール1で規定されるアミノ酸領域は有しないものの、当該アミノ酸領域に類似したアミノ酸配列(例えば1~4箇所、好ましくは1~3箇所、更に好ましくは1又は2箇所がルール1のアミノ酸配列と相違するもの)を有するものを改変対象アミノ酸配列とする。既知のGDHは特に限定されない。既知のGDHとして、アスペルギルス・オリゼ由来FAD-GDH(例えば配列番号21のアミノ酸配列を有するもの)及びアスペルギルス・テレウス由来FAD-GDH(例えば配列番号22のアミノ酸配列を有するもの)等を例示することができる。既知のGDHのアミノ酸配列に対して20%以上の同一性を示すアミノ酸配列については、上記の局面(5.グルコースデヒドロゲナーゼ(GDH)のスクリーニング方法)のステップ(i)で説明した手法によって検索・同定すればよい。既知のGDHのアミノ酸配列に対して20%以上の同一性を示すアミノ酸配列の具体例として、配列番号8に示すアミノ酸配列(アスペルギルス・ウェンティ(Aspergillus wentii)由来)、配列番号9に示すアミノ酸配列(アスペルギルス・ウェンティ(Aspergillus wentii)由来)、配列番号10に示すアミノ酸配列(アスペルギルス・サーモミューテタス(Aspergillus thermomutatus)由来)、配列番号11に示すアミノ酸配列(アスペルギルス・クリステイタス(Aspergillus cristatus)由来)を挙げることができる。
ステップ(I)に続くステップ(II)では、まず、用意したアミノ酸配列において、ルール1で規定されるアミノ酸領域に対応する領域(「改変対象領域」と呼ぶ)を特定する。例えば、ルール1の一部(前半部分(1番アミノ酸残基~6番アミノ酸残基)に関する条件、後半部分(7番アミノ酸残基~13番アミノ酸残基)に関する条件、1番アミノ酸残基~5番アミノ酸残基に関する条件、5番アミノ酸残基~9番アミノ酸残基に関する条件、7番アミノ酸残基~11番アミノ酸残基に関する条件等)を満たすという基準ないし条件を利用して改変対象領域を特定することができる。上記の通り、ルール1で規定されるアミノ酸領域は糸状菌由来FAD-GDHの140~180番目付近に存在する、連続した13アミノ酸配列に相当する。改変対象領域を特定する際には、位置に関する当該情報も併せて利用するとよい。
改変対象領域を特定した後、改変対象領域が、ルール1で規定されるアミノ酸領域に該当するように改変する。即ち、改変対象領域のアミノ酸構成に変更を加え、ルール1の条件を満足するようにする。この改変によって、ルール1で規定されるアミノ酸領域(改変対象領域が改変されたもの)を有する改変型アミノ酸配列が構築される。
好ましい態様では、ルール1で規定されるアミノ酸領域がルール2(条件1、2)も満足する。この態様ではルール1、2を満足するアミノ酸領域になるように改変対象領域が改変される。その結果、ルール1、2を満足するアミノ酸領域を有する改変型アミノ酸配列が構築されることになる。ルール2については、本発明の第1の局面(2.グルコースデヒドロゲナーゼ(GDH)の欄)で説明した通りであるため、上記の説明を援用し、その詳細は省略する。
更に好ましい態様では、ルール1で規定されるアミノ酸領域がルール3も満足する。この態様では、ルール1~3を満足するアミノ酸領域になるように改変対象領域が改変される。その結果、ルール1~3を満足するアミノ酸領域を有する改変型アミノ酸配列が構築されることになる。ルール3については、本発明の第1の局面(2.グルコースデヒドロゲナーゼ(GDH)の欄)で説明した通りであるため、上記の説明を援用し、その詳細は省略する。
好ましくは、構築した改変型アミノ酸配列が、上記の第1の局面で説明した保存領域1~10を有するか確認し、有しない場合には、有するように更に改変する(ステップ(III))。尚、このステップはステップ(II)と並行して行っても良い。
構築された改変型アミノ酸配列が実際にGDHの配列であるか否かを確認することが好ましい。即ち、好ましくは、構築された改変型アミノ酸配列からなるタンパク質のGDH活性を確認するステップ(ステップ(IV))を行う。改変前よりGDH活性が向上している場合や改変によってGDH活性を示すことになった場合等、GDH活性に関して改善が認められた場合、構築された改変型アミノ酸配列からなるタンパク質を有効な改変型GDHとして同定する。
8.グルコースデヒドロゲナーゼ(GDH)の調製法2
本発明の更なる局面は、上記のスクリーニング方法及び設計方法の応用として、グルコースデヒドロゲナーゼの調製法を提供する。この調製法では以下のステップ(1)~(3)を行う。
(1)本発明のスクリーニング方法又は本発明の設計方法によってグルコースデヒドロゲナーゼを用意するステップ
(2)前記グルコースデヒドロゲナーゼを発現する微生物を培養するステップ
(3)培養物から発現産物を回収するステップ
本発明の更なる局面は、上記のスクリーニング方法及び設計方法の応用として、グルコースデヒドロゲナーゼの調製法を提供する。この調製法では以下のステップ(1)~(3)を行う。
(1)本発明のスクリーニング方法又は本発明の設計方法によってグルコースデヒドロゲナーゼを用意するステップ
(2)前記グルコースデヒドロゲナーゼを発現する微生物を培養するステップ
(3)培養物から発現産物を回収するステップ
まず、本発明のスクリーニング方法又は本発明の設計方法によってグルコースデヒドロゲナーゼを用意する(ステップ(1))。次に、用意したグルコースデヒドロゲナーゼを発現する微生物を培養する(ステップ(2))。ここでの微生物は、典型的には、スクリーニング方法を利用してグルコースデヒドロゲナーゼを用意した場合は当該グルコースデヒドロゲナーゼを産生する野生株又はその変異株、或いは当該グルコースデヒドロゲナーゼの遺伝子を導入した形質転換体であり、設計方法を利用してグルコースデヒドロゲナーゼを用意した場合においては、当該グルコースデヒドロゲナーゼの遺伝子を導入した形質転換体である。ステップ(2)の後、培養物から発現産物を回収する(ステップ(3))。この操作は上記グルコースデヒドロゲナーゼ(GDH)の調製法1でのステップ(3)に準じて行えば良い。
<新規FAD-GDHの取得とGDHを規定する特有領域の特定>
新規FAD-GDHを同定することと、GDHを規定する特有のアミノ酸領域を見出すべく、以下の検討を行った。
1.人工合成遺伝子を用いたFAD-GDHの取得
NCBI BLASTを用いて網羅的な検索を実施し、以下に示す独自の指標(ルール1~3)から、A.cristatus、A.turcosusの2種のゲノム上に、FAD-GDH活性を示すことを期待できる2種類の遺伝子(「Asp.cristatus GZAAS20.1005, NCBI Sequence ID : ODM22452.1」、「Asp.turcosus HMR AF 23, NCBI Sequence ID : RHZ62616.1」)を見出した。当該遺伝子について人工合成遺伝子を用意し、それを鋳型としたPCRによってDNAの増幅を行った。増幅したDNAを酵母発現ベクターpYES2に連結し、プロトプラスト法によってS.cerevisiae株に導入した。
<指標>
ルール1:以下の配列(配列番号1)で構成されるアミノ酸領域(以下「GDH特有領域」と呼ぶ)を有する。
但し、式中の各アミノ酸残基の上の数字はN末端側からの通し番号であり、(H/N)はH(ヒスチジン)又はN(アスパラギン)であることを表し、(L/I/M)はL(ロイシン)、I(イソロイシン)又はM(メチオニン)であることを表し、(V/I)はV(バリン)又はI(イソロイシン)であることを表し、(G/A/S)はG(グリシン)、A(アラニン)又はS(セリン)であることを表し、(F/W/Y)はF(フェニルアラニン)、W(トリプトファン)又はY(チロシン)であることを表し、Xは任意のアミノ酸残基であることを表す。
ルール2の条件1:8番アミノ酸残基、12番アミノ酸残基、及び13番アミノ酸残基について、データベースAAindex収載のCRAJ730103(Normalized frequency of turn)の数値の合計、即ち、(8番アミノ酸残基の数値+12番アミノ酸残基の数値+13番アミノ酸残基の数値)が3.79以下であるとの条件を満たす。
ルール2の条件2:8番アミノ酸残基、11番アミノ酸残基、12番アミノ酸残基、及び13番アミノ酸残基について、データベースAAindex収載のTANS770109(Normalized frequency of coil)の数値の合計、即ち、(8番アミノ酸残基の数値+11番アミノ酸残基の数値+12番アミノ酸残基の数値+13番アミノ酸残基の数値)が2.83以上であるとの条件を満たす。
ルール3:3番アミノ酸残基及び4番アミノ酸残基について、データベースAAindex収載のJANJ780101(Average accessible surface area)の数値の合計、即ち、(3番アミノ酸残基の数値+4番アミノ酸残基の数値)が66以上であるとの条件を満たす。
新規FAD-GDHを同定することと、GDHを規定する特有のアミノ酸領域を見出すべく、以下の検討を行った。
1.人工合成遺伝子を用いたFAD-GDHの取得
NCBI BLASTを用いて網羅的な検索を実施し、以下に示す独自の指標(ルール1~3)から、A.cristatus、A.turcosusの2種のゲノム上に、FAD-GDH活性を示すことを期待できる2種類の遺伝子(「Asp.cristatus GZAAS20.1005, NCBI Sequence ID : ODM22452.1」、「Asp.turcosus HMR AF 23, NCBI Sequence ID : RHZ62616.1」)を見出した。当該遺伝子について人工合成遺伝子を用意し、それを鋳型としたPCRによってDNAの増幅を行った。増幅したDNAを酵母発現ベクターpYES2に連結し、プロトプラスト法によってS.cerevisiae株に導入した。
<指標>
ルール1:以下の配列(配列番号1)で構成されるアミノ酸領域(以下「GDH特有領域」と呼ぶ)を有する。
ルール2の条件1:8番アミノ酸残基、12番アミノ酸残基、及び13番アミノ酸残基について、データベースAAindex収載のCRAJ730103(Normalized frequency of turn)の数値の合計、即ち、(8番アミノ酸残基の数値+12番アミノ酸残基の数値+13番アミノ酸残基の数値)が3.79以下であるとの条件を満たす。
ルール2の条件2:8番アミノ酸残基、11番アミノ酸残基、12番アミノ酸残基、及び13番アミノ酸残基について、データベースAAindex収載のTANS770109(Normalized frequency of coil)の数値の合計、即ち、(8番アミノ酸残基の数値+11番アミノ酸残基の数値+12番アミノ酸残基の数値+13番アミノ酸残基の数値)が2.83以上であるとの条件を満たす。
ルール3:3番アミノ酸残基及び4番アミノ酸残基について、データベースAAindex収載のJANJ780101(Average accessible surface area)の数値の合計、即ち、(3番アミノ酸残基の数値+4番アミノ酸残基の数値)が66以上であるとの条件を満たす。
2.人工合成遺伝子を用いたFAD-GDH様遺伝子の取得
NCBI BLASTを用いて網羅的な検索を実施し、上記独自の指標に僅かに合致せず、FAD-GDH活性を示すことを期待できない4種類の遺伝子をA.wentii、A.thermomutatus、A.cristatusより見出した(「Asp. wentii DTO 134E9, NCBI Sequence ID : OJJ29827.1」、「Asp. wentii DTO 134E9, NCBI Sequence ID : OJJ29704.1」、「Asp. thermomutatus HMR AF 39, NCBI Sequence ID : XP_026617872.1」、「Asp. cristatus GZAAS20.1005, NCBI Sequence ID : ODM23900.1」)。当該遺伝子について人工合成遺伝子を用意し、それを鋳型としたPCRによってDNAの増幅を行った。増幅したDNAを酵母発現ベクターpYES2に連結し、プロトプラスト法によってS.cerevisiae株に導入した。
NCBI BLASTを用いて網羅的な検索を実施し、上記独自の指標に僅かに合致せず、FAD-GDH活性を示すことを期待できない4種類の遺伝子をA.wentii、A.thermomutatus、A.cristatusより見出した(「Asp. wentii DTO 134E9, NCBI Sequence ID : OJJ29827.1」、「Asp. wentii DTO 134E9, NCBI Sequence ID : OJJ29704.1」、「Asp. thermomutatus HMR AF 39, NCBI Sequence ID : XP_026617872.1」、「Asp. cristatus GZAAS20.1005, NCBI Sequence ID : ODM23900.1」)。当該遺伝子について人工合成遺伝子を用意し、それを鋳型としたPCRによってDNAの増幅を行った。増幅したDNAを酵母発現ベクターpYES2に連結し、プロトプラスト法によってS.cerevisiae株に導入した。
3.遺伝子情報を参考にした、FAD-GDH候補遺伝子の取得
上記の指標に基づき、各種ゲノムデータベースより網羅的な検索を実施した。その結果、CSFGデータベースのCorynascus sepedonium ATCC 9787のゲノム上に、FAD-GDH活性を示すことを期待できる遺伝子(CSFG Corse1p7_015851:アノテーション上はglucose oxidase)(配列番号23)を見出した。当該遺伝子配列を参考にプライマーを作成し、Corynascus sepedonium NBRC 31363のゲノムを鋳型としてPCRによってDNAの増幅を行った。増幅したDNAを糸状菌発現ベクター(α-Amylase改変プロモーター、A.oryzae FAD-GDHターミネータ、pyrG遺伝子を挿入させたpUC19)に連結し、プロトプラスト-PEG法によってAspergillus oryzae RIB40株に導入した。
上記の指標に基づき、各種ゲノムデータベースより網羅的な検索を実施した。その結果、CSFGデータベースのCorynascus sepedonium ATCC 9787のゲノム上に、FAD-GDH活性を示すことを期待できる遺伝子(CSFG Corse1p7_015851:アノテーション上はglucose oxidase)(配列番号23)を見出した。当該遺伝子配列を参考にプライマーを作成し、Corynascus sepedonium NBRC 31363のゲノムを鋳型としてPCRによってDNAの増幅を行った。増幅したDNAを糸状菌発現ベクター(α-Amylase改変プロモーター、A.oryzae FAD-GDHターミネータ、pyrG遺伝子を挿入させたpUC19)に連結し、プロトプラスト-PEG法によってAspergillus oryzae RIB40株に導入した。
4.酵素活性測定法
測定原理として、D-グルコースとPhenazine methosulfate(以下「PMS」と略称する)にGDHを作用させると、グルコースは酸化され、その一方でPMSは還元される。還元型PMSはNitrotetrazorium blue(以下「NTB」と略称する)を還元する。NTBが還元型PMSによって還元されるとジホルマザン色素が形成される。このジホルマザン色素を570nmで検出することにより酵素活性を測定する。実験手順は次の通りである。まず、50mmol/L PIPES-NaOH緩衝液pH6.5(0.5%TritonX-100含有)2.6mL、1.0mmol/L D-グルコース1mL、6.6mmol/L NTB溶液1mL、及び3.0mmol/L PMS溶液2mLを分光光度計用セルにいれ、37℃で10分間予備加温した。そこにFAD-GDH溶液0.1mLを加えて混和し、37℃で反応させた。反応開始後、3分経過した時点と5分経過した時点で反応液の波長570nmにおける吸光度A3(3分経過後)、A5(5分経過後)を測定する。別に、ブランクとして、FAD-GDH溶液の代わりに50mmol/LPIPES-NaOH緩衝液pH6.5(0.1%TrironX-100, 0.1%BSA,1mmol/L CaCl2含有)を用いて同様の操作を行い、吸光度Ab3(3分経過後)、Ab5(5分経過後)を測定した。A3、A5、Ab3、Ab5の値を以下の式に代入し、FAD-GDH活性値を算出した。
尚、式中の「2」は反応時間(分)を、「20」はジホルマザン色素のミリモル分子吸光係数の1/2を、「3.1」は総液量(mL)を、「0.1」はFAD-GDH溶液量(mL)を、「n」は試料希釈倍数をそれぞれ表す。
測定原理として、D-グルコースとPhenazine methosulfate(以下「PMS」と略称する)にGDHを作用させると、グルコースは酸化され、その一方でPMSは還元される。還元型PMSはNitrotetrazorium blue(以下「NTB」と略称する)を還元する。NTBが還元型PMSによって還元されるとジホルマザン色素が形成される。このジホルマザン色素を570nmで検出することにより酵素活性を測定する。実験手順は次の通りである。まず、50mmol/L PIPES-NaOH緩衝液pH6.5(0.5%TritonX-100含有)2.6mL、1.0mmol/L D-グルコース1mL、6.6mmol/L NTB溶液1mL、及び3.0mmol/L PMS溶液2mLを分光光度計用セルにいれ、37℃で10分間予備加温した。そこにFAD-GDH溶液0.1mLを加えて混和し、37℃で反応させた。反応開始後、3分経過した時点と5分経過した時点で反応液の波長570nmにおける吸光度A3(3分経過後)、A5(5分経過後)を測定する。別に、ブランクとして、FAD-GDH溶液の代わりに50mmol/LPIPES-NaOH緩衝液pH6.5(0.1%TrironX-100, 0.1%BSA,1mmol/L CaCl2含有)を用いて同様の操作を行い、吸光度Ab3(3分経過後)、Ab5(5分経過後)を測定した。A3、A5、Ab3、Ab5の値を以下の式に代入し、FAD-GDH活性値を算出した。
5.GDH活性の確認
形質転換酵母6種(FAD-GDH活性が期待できる2種と期待できない4種)の培養液より調製したサンプルのGDH活性を測定した。対象としてGDH遺伝子を導入していない形質転換酵母はGDH活性を示さないことも確認した。形質転換酵母6種の内、2種でGDH活性が再現よく示されたことから(図1)、FAD-GDHであることが判った。他の4種では再現よくGDH活性が示されなかったため(図1)、FAD-GDH類似遺伝子であることが判った。
形質転換酵母6種(FAD-GDH活性が期待できる2種と期待できない4種)の培養液より調製したサンプルのGDH活性を測定した。対象としてGDH遺伝子を導入していない形質転換酵母はGDH活性を示さないことも確認した。形質転換酵母6種の内、2種でGDH活性が再現よく示されたことから(図1)、FAD-GDHであることが判った。他の4種では再現よくGDH活性が示されなかったため(図1)、FAD-GDH類似遺伝子であることが判った。
活性が示された2種の安定性を確認した結果、2種類ともにA.oryzae由来FAD-GDHよりも大幅に安定性が良いことも判った(表4)。極めて安定性に優れた当該2種類の酵素は実用性が高く、例えばグルコース測定用途(特に血糖測定用途)において有用である。尚、安定性は、100mmol/Lリン酸緩衝液中50℃20分処理後の残存活性率を、処理前の活性との比較で算出した。
次に、Corynascus sepedonium NBRC31363株由来遺伝子を導入したA.oryzae RIB40株培養液より調製したサンプルのFAD-GDH活性を確認した。対象としてGDH遺伝子を導入していない形質転換RIB40株培養液はGDH活性を示さないことも確認した。本サンプルは再現よくFAD-GDH活性を示した。さらに安定性を確認したところ、A.oryzae由来FAD-GDHよりも大幅に安定性が良いことも判った(表5)。極めて安定性に優れた当該酵素は実用性が高く、例えばグルコース測定用途(特に血糖測定用途)において有用である。尚、安定性は、100mmol/Lリン酸緩衝液中50℃20分処理後の残存活性率を、処理前の活性との比較で算出した。
FAD-GDH活性を示すことが判明した3種の酵素のGDH特有領域の配列を以下に示す。また、酵素全長とそれをコードする遺伝子の配列も併せて示す。
(1)A.cristatus GZAAS20.1005(NCBI Sequence ID : ODM22452.1)
GDH特有領域:HGYDGPLHVGFNN(配列番号12)
酵素全長:配列番号2
遺伝子:配列番号5
(2)A.turcosus HMR AF 23(NCBI Sequence ID : RHZ62616.1)
GDH特有領域:HGKAGPLLVGWTY(配列番号13)
酵素全長:配列番号3
遺伝子:配列番号6
(3)Corynascus sepedonium NBRC 31363(Corynascus sepedonium ATCC 9787 CSFG Corse1p7_015851の配列をもとに独自にクローニング)
GDH特有領域:HGFRGPLHVGYTP(配列番号14)
酵素全長:配列番号4
遺伝子:配列番号7
(1)A.cristatus GZAAS20.1005(NCBI Sequence ID : ODM22452.1)
GDH特有領域:HGYDGPLHVGFNN(配列番号12)
酵素全長:配列番号2
遺伝子:配列番号5
(2)A.turcosus HMR AF 23(NCBI Sequence ID : RHZ62616.1)
GDH特有領域:HGKAGPLLVGWTY(配列番号13)
酵素全長:配列番号3
遺伝子:配列番号6
(3)Corynascus sepedonium NBRC 31363(Corynascus sepedonium ATCC 9787 CSFG Corse1p7_015851の配列をもとに独自にクローニング)
GDH特有領域:HGFRGPLHVGYTP(配列番号14)
酵素全長:配列番号4
遺伝子:配列番号7
一方、GDH特有領域の条件を満たさなかった4種の酵素の、GDH特有領域に相当する領域の配列と酵素全長の配列を以下に示す。
(5)A.wentii DTO 134E9(NCBI Sequence ID : OJJ29827.1)
相当する領域:HNSNGPVQVSFKH(配列番号15)
酵素全長:配列番号8
(6)A.wentii DTO 134E9(NCBI Sequence ID : OJJ29704.1)
相当する領域:HGTKGPLKVGWPS(配列番号16)
酵素全長:配列番号9
(7)A.thermomutatus HMR AF 39(NCBI Sequence ID : XP_026617872.1)
相当する領域:HGSRGPLKVAFPH(配列番号17)
酵素全長:配列番号10
(8)A.cristatus GZAAS20.1005(NCBI Sequence ID : ODM23900.1)
相当する領域:HGYEGPLKVGWPP(配列番号18)
酵素全長:配列番号11
(5)A.wentii DTO 134E9(NCBI Sequence ID : OJJ29827.1)
相当する領域:HNSNGPVQVSFKH(配列番号15)
酵素全長:配列番号8
(6)A.wentii DTO 134E9(NCBI Sequence ID : OJJ29704.1)
相当する領域:HGTKGPLKVGWPS(配列番号16)
酵素全長:配列番号9
(7)A.thermomutatus HMR AF 39(NCBI Sequence ID : XP_026617872.1)
相当する領域:HGSRGPLKVAFPH(配列番号17)
酵素全長:配列番号10
(8)A.cristatus GZAAS20.1005(NCBI Sequence ID : ODM23900.1)
相当する領域:HGYEGPLKVGWPP(配列番号18)
酵素全長:配列番号11
また、公知のFAD-GDHとして、A.oryzae由来FAD-GDHとA.terreus由来FAD-GDHのGDH特有領域の配列と酵素全長の配列を以下に示す。
(9)A.oryzae
GDH特有領域:NGKEGPLKVGWSG(配列番号19)
酵素全長:配列番号21
(10)A.terreus
GDH特有領域:HGHEGPLDVAFTQ(配列番号20)
酵素全長:配列番号22
(9)A.oryzae
GDH特有領域:NGKEGPLKVGWSG(配列番号19)
酵素全長:配列番号21
(10)A.terreus
GDH特有領域:HGHEGPLDVAFTQ(配列番号20)
酵素全長:配列番号22
尚、公知のFAD-GDHの配列(A.oryzae由来FAD-GDH及びA.terreus由来FAD-GDH)と新規FAD-GDHのアミノ酸配列の同一性を図2に示す。
本発明のグルコースデヒドロゲナーゼは、新たに見出された特有の領域で特徴付けられる。本発明のグルコースデヒドロゲナーゼは各種用途(例えば血糖測定器用)にその利用が図られる。一方、本願が提供する情報は新規GDHの探索、同定に有用である。
この発明は、上記発明の実施の形態及び実施例の説明に何ら限定されるものではない。特許請求の範囲の記載を逸脱せず、当業者が容易に想到できる範囲で種々の変形態様もこの発明に含まれる。本明細書の中で明示した論文、公開特許公報、及び特許公報などの内容は、その全ての内容を援用によって引用することとする。
Claims (26)
- 8番アミノ酸残基、12番アミノ酸残基、及び13番アミノ酸残基について、データベースAAindex収載のCRAJ730103(Normalized frequency of turn)の数値の合計、即ち、(8番アミノ酸残基の数値+12番アミノ酸残基の数値+13番アミノ酸残基の数値)が3.79以下であるとの条件と、
8番アミノ酸残基、11番アミノ酸残基、12番アミノ酸残基、及び13番アミノ酸残基について、データベースAAindex収載のTANS770109(Normalized frequency of coil)の数値の合計、即ち、(8番アミノ酸残基の数値+11番アミノ酸残基の数値+12番アミノ酸残基の数値+13番アミノ酸残基の数値)が2.83以上であるとの条件、
を前記アミノ酸領域が満足する、請求項1に記載のグルコースデヒドロゲナーゼ。 - 3番アミノ酸残基及び4番アミノ酸残基について、データベースAAindex収載のJANJ780101(Average accessible surface area)の数値の合計、即ち、(3番アミノ酸残基の数値+4番アミノ酸残基の数値)が66以上であるとの条件、
を前記アミノ酸領域が満足する、請求項2に記載のグルコースデヒドロゲナーゼ。 - 全長が530aa~630aaである、請求項1~3のいずれか一項に記載のグルコースデヒドロゲナーゼ。
- そのアミノ酸配列が、配列番号2~4のいずれかのアミノ酸配列と50%以上同一のアミノ酸配列である、請求項1~4のいずれか一項に記載のグルコースデヒドロゲナーゼ。
- そのアミノ酸配列が、配列番号2~4のいずれかのアミノ酸配列と60%以上同一のアミノ酸配列である、請求項1~4のいずれか一項に記載のグルコースデヒドロゲナーゼ。
- 以下の保存領域1~10の1つ以上を有する、請求項1~6のいずれか一項に記載のグルコースデヒドロゲナーゼ:
以下の配列で構成されるアミノ酸配列からなる保存領域1
以下の配列で構成されるアミノ酸配列からなる保存領域2
以下の配列で構成されるアミノ酸配列からなる保存領域3
以下の配列で構成されるアミノ酸配列からなる保存領域4
以下の配列で構成されるアミノ酸配列からなる保存領域5
以下の配列で構成されるアミノ酸配列からなる保存領域6
以下の配列で構成されるアミノ酸配列からなる保存領域7
(S/I/V/L)は分岐鎖脂肪族又は極小サイズのS、I、V又はLであることを表し、(V/L/M/A/F)は疎水性のV、L、M、A又はFであることを表し、(L/F)は疎水性のL又はFであることを表し、(A/S)は極小サイズのA又はSであることを表し、(N/S/Y)はN、S又はYであることを表し、(I/V/T)は疎水性のI、V又はTであることを表し、(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表す;
以下の配列で構成されるアミノ酸配列からなる保存領域8
以下の配列で構成されるアミノ酸配列からなる保存領域9
以下の配列で構成されるアミノ酸配列からなる保存領域10
- 保存領域1~10の全てを有する、請求項7に記載のグルコースデヒドロゲナーゼ。
- 配列番号2~4のいずれかのアミノ酸配列からなる、請求項1~8のいずれか一項に記載のグルコースデヒドロゲナーゼ。
- 請求項1~9のいずれか一項に記載のグルコースデヒドロゲナーゼを含む酵素剤。
- 請求項1~9のいずれか一項に記載のグルコースデヒドロゲナーゼをコードするグルコースデヒドロゲナーゼ遺伝子。
- 以下の(A)~(C)からなる群より選択されるいずれかのDNAからなる、請求項11に記載のグルコースデヒドロゲナーゼ遺伝子:
(A)配列番号2~4のいずれかのアミノ酸配列をコードするDNA;
(B)配列番号5~7のいずれかの塩基配列からなるDNA;
(C)配列番号5~7のいずれかの塩基配列と等価な塩基配列を有し、且つグルコースデヒドロゲナーゼ活性を有するタンパク質をコードするDNA。 - 請求項11又は12に記載のグルコースデヒドロゲナーゼ遺伝子を含む組換えDNA。
- 請求項13に記載の組換えDNAを保有する微生物。
- 以下のステップ(1)~(3)を含む、グルコースデヒドロゲナーゼの調製法:
(1)請求項11又は12に記載のグルコースデヒドロゲナーゼ遺伝子を用意するステップ;
(2)前記遺伝子を発現させるステップ;及び
(3)発現産物を回収するステップ。 - 以下のステップ(i)及び(ii)を含む、グルコースデヒドロゲナーゼのスクリーニング方法:
(i)既知のグルコースデヒドロゲナーゼのアミノ酸配列に対して20%以上の同一性を示すアミノ酸配列を、アミノ酸配列データベースを利用して検索するステップ;及び
(ii)ヒットしたアミノ酸配列の中から、以下の配列(配列番号1)、即ち、
- 前記ステップ(ii)において、前記アミノ酸領域が、更に
8番アミノ酸残基、12番アミノ酸残基、及び13番アミノ酸残基について、データベースAAindex収載のCRAJ730103(Normalized frequency of turn)の数値の合計、即ち、(8番アミノ酸残基の数値+12番アミノ酸残基の数値+13番アミノ酸残基の数値)が3.79以下であるとの条件と、
8番アミノ酸残基、11番アミノ酸残基、12番アミノ酸残基、及び13番アミノ酸残基について、データベースAAindex収載のTANS770109(Normalized frequency of coil)の数値の合計、即ち、(8番アミノ酸残基の数値+11番アミノ酸残基の数値+12番アミノ酸残基の数値+13番アミノ酸残基の数値)が2.83以上であるとの条件、
を満足するものを選抜する、請求項16に記載のスクリーニング方法。 - 前記ステップ(ii)において、前記アミノ酸領域が、更に
3番アミノ酸残基及び4番アミノ酸残基について、データベースAAindex収載のJANJ780101(Average accessible surface area)の数値の合計、即ち、(3番アミノ酸残基の数値+4番アミノ酸残基の数値)が56.9以上であるとの条件、
を満足するものを選抜する、請求項17に記載のスクリーニング方法。 - 以下のステップ(iii)を更に含む、請求項16~18のいずれか一項に記載のスクリーニング方法:
(iii)選抜されたアミノ酸配列の中から、以下の保存領域1~10を有するものを選抜するステップ:
以下の配列で構成されるアミノ酸配列からなる保存領域1
以下の配列で構成されるアミノ酸配列からなる保存領域2
以下の配列で構成されるアミノ酸配列からなる保存領域3
以下の配列で構成されるアミノ酸配列からなる保存領域4
以下の配列で構成されるアミノ酸配列からなる保存領域5
以下の配列で構成されるアミノ酸配列からなる保存領域6
以下の配列で構成されるアミノ酸配列からなる保存領域7
(S/I/V/L)は分岐鎖脂肪族又は極小サイズのS、I、V又はLであることを表し、(V/L/M/A/F)は疎水性のV、L、M、A又はFであることを表し、(L/F)は疎水性のL又はFであることを表し、(A/S)は極小サイズのA又はSであることを表し、(N/S/Y)はN、S又はYであることを表し、(I/V/T)は疎水性のI、V又はTであることを表し、(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表す;
以下の配列で構成されるアミノ酸配列からなる保存領域8
以下の配列で構成されるアミノ酸配列からなる保存領域9
以下の配列で構成されるアミノ酸配列からなる保存領域10
- 以下のステップ(iv)を更に含む、請求項16~19のいずれか一項に記載のスクリーニング方法:
(iv)選抜されたアミノ酸配列からなるタンパク質のグルコースデヒドロゲナーゼ活性を確認するステップ。 - 以下のステップ(I)及び(II)を含む、改変型グルコースデヒドロゲナーゼの設計方法:
(I)既知のグルコースデヒドロゲナーゼのアミノ酸配列、又は既知のグルコースデヒドロゲナーゼのアミノ酸配列に対して20%以上の同一性を示すアミノ酸配列であって、以下の配列(配列番号1)、即ち、
(II)用意したアミノ酸配列において前記アミノ酸領域に対応する領域を特定した後、該領域が前記アミノ酸領域に該当するように改変することによって改変型アミノ酸配列を構築するステップ。 - ステップ(II)において、前記アミノ酸領域が、更に
8番アミノ酸残基、12番アミノ酸残基、及び13番アミノ酸残基について、データベースAAindex収載のCRAJ730103(Normalized frequency of turn)の数値の合計、即ち、(8番アミノ酸残基の数値+12番アミノ酸残基の数値+13番アミノ酸残基の数値)が3.79以下であるとの条件と、
8番アミノ酸残基、11番アミノ酸残基、12番アミノ酸残基、及び13番アミノ酸残基について、データベースAAindex収載のTANS770109(Normalized frequency of coil)の数値の合計、即ち、(8番アミノ酸残基の数値+11番アミノ酸残基の数値+12番アミノ酸残基の数値+13番アミノ酸残基の数値)が2.83以上であるとの条件、
を満足するように改変する、請求項21に記載の設計方法。 - ステップ(II)において、前記アミノ酸領域が、更に
3番アミノ酸残基及び4番アミノ酸残基について、データベースAAindex収載のJANJ780101(Average accessible surface area)の数値の合計、即ち、(3番アミノ酸残基の数値+4番アミノ酸残基の数値)が56.9以上であるとの条件、
を満足するように改変する、請求項22に記載の設計方法。 - 以下のステップ(III)を更に含む、請求項21~23のいずれか一項に記載の設計方法
(III)構築した改変型アミノ酸配列が以下の保存領域1~10を有するか確認し、有しない場合には、有するように更に改変するステップ:
以下の配列で構成されるアミノ酸配列からなる保存領域1
以下の配列で構成されるアミノ酸配列からなる保存領域2
以下の配列で構成されるアミノ酸配列からなる保存領域3
以下の配列で構成されるアミノ酸配列からなる保存領域4
以下の配列で構成されるアミノ酸配列からなる保存領域5
以下の配列で構成されるアミノ酸配列からなる保存領域6
以下の配列で構成されるアミノ酸配列からなる保存領域7
(S/I/V/L)は分岐鎖脂肪族又は極小サイズのS、I、V又はLであることを表し、(V/L/M/A/F)は疎水性のV、L、M、A又はFであることを表し、(L/F)は疎水性のL又はFであることを表し、(A/S)は極小サイズのA又はSであることを表し、(N/S/Y)はN、S又はYであることを表し、(I/V/T)は疎水性のI、V又はTであることを表し、(I/V/L)は分岐鎖脂肪族のI、V又はLであることを表す;
以下の配列で構成されるアミノ酸配列からなる保存領域8
以下の配列で構成されるアミノ酸配列からなる保存領域9
以下の配列で構成されるアミノ酸配列からなる保存領域10
- 以下のステップ(IV)を更に含む、請求項21~24のいずれか一項に記載の設計方法:
構築された改変型アミノ酸配列からなるタンパク質のグルコースデヒドロゲナーゼ活性を確認するステップ。 - 以下のステップ(1)~(3)を含む、グルコースデヒドロゲナーゼの調製法:
(1)請求項16~20に記載のスクリーニング方法又は請求項21~25に記載の設計方法によってグルコースデヒドロゲナーゼを用意するステップ;
(2)前記グルコースデヒドロゲナーゼを発現する微生物を培養するステップ;及び
(3)培養物から発現産物を回収するステップ。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022507244A JPWO2021182508A1 (ja) | 2020-03-13 | 2021-03-10 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020044678 | 2020-03-13 | ||
JP2020-044678 | 2020-03-13 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2021182508A1 true WO2021182508A1 (ja) | 2021-09-16 |
Family
ID=77672374
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2021/009515 WO2021182508A1 (ja) | 2020-03-13 | 2021-03-10 | グルコースデヒドロゲナーゼ |
Country Status (2)
Country | Link |
---|---|
JP (1) | JPWO2021182508A1 (ja) |
WO (1) | WO2021182508A1 (ja) |
-
2021
- 2021-03-10 JP JP2022507244A patent/JPWO2021182508A1/ja active Pending
- 2021-03-10 WO PCT/JP2021/009515 patent/WO2021182508A1/ja active Application Filing
Non-Patent Citations (4)
Title |
---|
ANONYMOUS: "corse1p7_015851 (Corynascus sepedonium ATCC 9787)", FUNGAL GENOMICS, corse1p7_015851, 10 October 2018 (2018-10-10), Retrieved from the Internet <URL:https://gb.fungalgenomics.ca/portal/view/geneModelView.php?fullName=corse1p7_015851&flanking=> * |
DATABASE UniProtKb [online] 11 December 2019 (2019-12-11), XP055856943, retrieved from UniProt Database accession no. A0A1E3BNA3 * |
DATABASE UniProtKB 11 December 2019 (2019-12-11), "UniProtKB - A0A397HLZ6", XP055856946, retrieved from UniProt Database accession no. AOA397HLZ6 * |
KAZUSHIGE MORI; MITSUHARU NAKAJIMA; KATSUHIRO KOJIMA; KOUDAI MURAKAMI; STEFANO FERRI; KOJI SODE: "Screening of-derived FA-glucose dehydrogenases from fungal genome database", BIOTECHNOLOGY LETTERS, SPRINGER NETHERLANDS, DORDRECHT, vol. 33, no. 11, 12 July 2011 (2011-07-12), Dordrecht , pages 2255 - 2263, XP019957896, ISSN: 1573-6776, DOI: 10.1007/s10529-011-0694-5 * |
Also Published As
Publication number | Publication date |
---|---|
JPWO2021182508A1 (ja) | 2021-09-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9458434B2 (en) | Mutant enzyme and application thereof | |
JP5873796B2 (ja) | グルコース脱水素酵素 | |
US9260699B2 (en) | Glucose dehydrogenase | |
US9506042B2 (en) | Glucose dehydrogenase | |
JP6695802B2 (ja) | 変異酵素及びその用途 | |
JP2015084676A (ja) | 耐熱性に優れたフラビンアデニンジヌクレオチド依存性グルコースデヒドロゲナーゼ | |
WO2021182508A1 (ja) | グルコースデヒドロゲナーゼ | |
CN108350438B (zh) | 新型葡萄糖脱氢酶 | |
WO2019230614A1 (ja) | グルコースデヒドロゲナーゼの改良 | |
JP7044709B2 (ja) | グルコースデヒドロゲナーゼ | |
EP4170034A1 (en) | Novel transglutaminase | |
JP6127496B2 (ja) | ジアホラーゼ | |
JP7527969B2 (ja) | グルコースデヒドロゲナーゼ | |
WO2021125332A1 (ja) | 新規グルコースデヒドロゲナーゼ | |
WO2017122650A1 (ja) | フラビン結合型グルコース脱水素酵素 | |
JP6390776B2 (ja) | 耐熱性に優れたフラビンアデニンジヌクレオチド依存性グルコースデヒドロゲナーゼ | |
JP2017112860A (ja) | 新規グルコースデヒドロゲナーゼ | |
JP2017221147A (ja) | 新規グルコースデヒドロゲナーゼ | |
JP2014097050A (ja) | ジアホラーゼ | |
JP6036826B2 (ja) | Nad依存型グルコースデヒドロゲナーゼおよびその製造方法 | |
JP2017112858A (ja) | 新規グルコースデヒドロゲナーゼ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 21767100 Country of ref document: EP Kind code of ref document: A1 |
|
ENP | Entry into the national phase |
Ref document number: 2022507244 Country of ref document: JP Kind code of ref document: A |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 21767100 Country of ref document: EP Kind code of ref document: A1 |