WO2016088824A1 - セントロメアdna配列を含むベクター及びその用途 - Google Patents

セントロメアdna配列を含むベクター及びその用途 Download PDF

Info

Publication number
WO2016088824A1
WO2016088824A1 PCT/JP2015/083977 JP2015083977W WO2016088824A1 WO 2016088824 A1 WO2016088824 A1 WO 2016088824A1 JP 2015083977 W JP2015083977 W JP 2015083977W WO 2016088824 A1 WO2016088824 A1 WO 2016088824A1
Authority
WO
WIPO (PCT)
Prior art keywords
seq
base sequence
base
sequence
vector
Prior art date
Application number
PCT/JP2015/083977
Other languages
English (en)
French (fr)
Inventor
輝之 西
陶三 西山
徹 渡邉
雄二 大窪
Original Assignee
株式会社カネカ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社カネカ filed Critical 株式会社カネカ
Priority to JP2016562669A priority Critical patent/JP6754697B2/ja
Priority to EP15865749.4A priority patent/EP3228707B1/en
Publication of WO2016088824A1 publication Critical patent/WO2016088824A1/ja
Priority to US15/610,917 priority patent/US11214809B2/en

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • C12N15/815Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof

Definitions

  • the present invention relates to a vector containing a yeast centromere DNA sequence and its use.
  • next-generation sequencers has been used to decipher the genomes of many organisms as well as humans, and in addition to the base sequence, genome structure, gene expression information, epigenetic changes, and protein expression information. It became possible to understand changes in intracellular and extracellular metabolites.
  • genetic recombination by transformation for example, genomic integration of gene fragments and autonomously replicating vectors have been developed for a long time, and recently, large-scale genome editing , Genome shuffling, artificial chromosomes are being worked on.
  • genome editing such as genome integration is concerned about problems that cannot be inserted at the target position and unexpected effects due to large changes in genome structure.
  • autonomously replicating vectors are widely used in prokaryotes such as Escherichia coli, they are complicated to construct in eukaryotes such as yeast, and many autonomously replicating vectors for eukaryotes have centromeres. The problem is that it is unstable because it does not contain DNA sequences.
  • Non-patent Document 1 A DNA sequence of 125 bp was identified.
  • Non-patent Document 2 A long centromere DNA sequence has also been identified in Schizosaccharomyces pombe (Non-patent Document 2).
  • An autonomously replicating vector containing a centromere DNA sequence is used not only as a plasmid state depending on the host, but also as an artificial chromosome type added with telomeric DNA.
  • centromere DNA sequences beyond the host is very difficult due to differences in the proteins constituting the chromosome distribution.
  • Komagataella pastoris which has been used industrially for a long time, the centromere DNA sequence has not yet been identified.
  • An object of the present invention is to provide a vector having improved stability in a host cell. Such a vector is expected to be useful for various uses such as host improvement for industrial purposes.
  • the present inventors have identified the DNA sequences constituting the centromere for each of the four chromosomes possessed by Komagataela pastoris by comprehensive analysis of the base sequence of Komagataela pastoris chromosomal DNA. And it confirmed that the vector containing this sequence
  • the present invention includes the following inventions.
  • a site comprising at least one base sequence selected from the base sequences of any one of (a) to (d) and the upstream and downstream base sequences of any of (e) to (g),
  • the vector according to (7), wherein the upstream and downstream base sequences in the pair of base sequences of any one of (e) to (g) are base sequences of 1900 to 2800 bases, respectively.
  • the upstream or downstream base sequence is any of the following base sequences (h) to (k): (H) the nucleotide sequence shown in SEQ ID NO: 13, 16, 19, or 22; (I) a nucleotide sequence of a nucleic acid that hybridizes under stringent conditions with a nucleic acid consisting of a nucleotide sequence complementary to the nucleotide sequence shown in SEQ ID NO: 13, 16, 19, or 22; (J) a base sequence having 85% or more sequence identity with the base sequence shown in SEQ ID NO: 13, 16, 19, or 22; (K) a base sequence in which one or more base sequences are substituted, deleted, inserted and / or added in the base sequence shown in SEQ ID NO: 13, 16, 19, or 22; The vector according to any one of (2) to (8), wherein (10) In the base sequence pair of any one of (e) to (g), the upstream or downstream base sequence is any one of the following base sequences (
  • the autonomously replicating vector further comprises an autonomous replication sequence (ARS) and / or a centromere DNA sequence derived from a biological species different from the biological species from which any one of the base sequences (a) to (d) is derived.
  • ARS autonomous replication sequence
  • two nucleic acids hybridize under stringent conditions have the following meanings.
  • a 2 ⁇ concentration SSC solution composition of 1 ⁇ concentration SSC solution
  • the nucleic acid Y can be obtained as nucleic acid bound on the filter by washing the filter at 65 ° C.
  • a nucleic acid that hybridizes under stringent conditions after hybridization with nucleic acid Y at 65 ° C in the presence of 0.7 to 1.0 M NaCl using a filter with nucleic acid X immobilized, a 2 ⁇ concentration SSC solution (composition of 1 ⁇ concentration SSC solution) Is composed of 150 mM sodium chloride and 15 mM sodium citrate), and the nucleic acid Y can be obtained as nucleic acid bound on the filter by washing the filter at 65 ° C. And a nucleic acid that hybridizes under stringent conditions.
  • nucleic acid X and nucleic acid Y “hybridize with each other under stringent conditions”.
  • Nucleic acid Y is preferably washed with a 0.5-fold concentrated SSC solution at 65 ° C., more preferably with a 0.2-fold concentrated SSC solution at 65 ° C., and more preferably with a 0.1-fold concentrated SSC solution at 65 ° C.
  • the nucleic acid can be obtained as nucleic acid bound on the filter.
  • the reference nucleic acid X can be a nucleic acid X derived from a colony or plaque.
  • sequence identity of a base sequence can be determined using methods well known to those skilled in the art, sequence analysis software, and the like.
  • sequence analysis software for example, the BLAST algorithm blastn program and FASTA algorithm fasta program can be mentioned.
  • sequence identity of a certain base sequence to be evaluated with the base sequence Z is to align (align) the base sequence Z and the base sequence to be evaluated, and introduce a gap as necessary. This is a value expressed in% as the frequency of occurrence of the same base at the same site in the base sequence including the gap when the base coincidence between the two is maximized.
  • “one or more” relating to base substitution, deletion, insertion and / or addition refers to, for example, the base sequence shown in SEQ ID NOs: 12, 15, 18, 21 in the base sequence of (d) above. 1 to 500, 1 to 400, 1 to 300, 1 to 200, 1 to 190, 1 to 160, 1 to 130, 1 to 100, 1 to 75, 1 to 50 1 to 25, 1 to 20, 1 to 15, 1 to 10, 1 to 7, 1 to 5, 1 to 4, 1 to 3, or 1 or 2.
  • the base sequence of (k) or (o) in the base sequence shown in SEQ ID NO: 13, 14, 16, 17, 19, 20, 22, 23, for example, 1 to 1500, 1 to 1000, 1 to 500, 1 to 400, 1 to 395, 1 to 380, 1 to 350, 1 to 325, 1 to 300, 1 to 295, 1 to 250, 1 to 225, 1 to 200, 1 to 175, 1 to 150, 1 to 125, 1 to 100, 1 to 75, 1 to 50, 1 to 25, 1 to 20, 1 to Fifteen, one to ten, one to seven, one to five, one to four, one to three, or one or two.
  • the base sequence of (w) in the base sequence shown in SEQ ID NO: 41 or 85, for example, 1 to 100, 1 to 90, 1 to 80, 1 to 70, 1 to 60, 1 ⁇ 50, 1 ⁇ 40, 1 ⁇ 30, 1 ⁇ 25, 1 ⁇ 20, 1 ⁇ 15, 1 ⁇ 10, 1 ⁇ 7, 1 ⁇ 5, 1 ⁇ 4, 1 ⁇ 3, or 1 or 2.
  • nucleic acid can also be referred to as “polynucleotide” and refers to DNA or RNA, typically DNA.
  • the vector of the present invention can be stably maintained in the host. Furthermore, the vectors of the present invention can be amplified in the host. Therefore, according to the purpose of industrial use such as production of the target compound, the host cell is transformed with a vector for producing the target compound further incorporating a base sequence encoding the target compound into the vector of the present invention, It becomes possible to produce a compound efficiently.
  • nucleotide sequences shown in SEQ ID Nos: 1, 2, 3 and 4 have the following characteristic structures.
  • the base sequence shown in SEQ ID NO: 13 is linked upstream (5 ′ end side) of the base sequence shown in SEQ ID NO: 12, and downstream (3 ′ end side) of the base sequence shown in SEQ ID NO: 12 ) Is complementary to the base sequence shown in SEQ ID NO: 13 and has a structure in which the base sequence shown in SEQ ID NO: 14 is linked.
  • the base sequence shown in SEQ ID NO: 16 is linked upstream (5 ′ end side) of the base sequence shown in SEQ ID NO: 15, and downstream (3 ′ end side) of the base sequence shown in SEQ ID NO: 15 ) Is complementary to the base sequence shown in SEQ ID NO: 16 and has a structure in which the base sequence shown in SEQ ID NO: 17 is linked.
  • the base sequence shown in SEQ ID NO: 19 is linked upstream (5 ′ end side) of the base sequence shown in SEQ ID NO: 18, and downstream (3 ′ end side) of the base sequence shown in SEQ ID NO: 18 ) Is complementary to the base sequence shown in SEQ ID NO: 19 and has a structure in which the base sequence shown in SEQ ID NO: 20 is linked.
  • the base sequence shown in SEQ ID NO: 22 is linked upstream (5 ′ end side) of the base sequence shown in SEQ ID NO: 21, and downstream (3 ′ end side) of the base sequence shown in SEQ ID NO: 21 ) Is complementary to the base sequence shown in SEQ ID NO: 22 and has a structure in which the base sequence shown in SEQ ID NO: 23 is linked.
  • the present inventors have completed the vector of the present invention based on the above findings and the experimental results shown in the examples.
  • the vector of the present invention comprises at least any of the following base sequences (a) to (d): (A) the nucleotide sequence shown in SEQ ID NO: 12, 15, 18, or 21; (B) a nucleotide sequence of a nucleic acid that hybridizes under stringent conditions with a nucleic acid consisting of a nucleotide sequence complementary to the nucleotide sequence shown in SEQ ID NO: 12, 15, 18, or 21; (C) 85% or more, preferably 90% or more, more preferably 95% or more, still more preferably 97% or more, most preferably 99% or more of the sequence shown in SEQ ID NO: 12, 15, 18, or 21 Base sequences having identity; (D) a base sequence in which one or more bases are substituted, deleted, inserted and / or added in the base sequence shown in SEQ ID NO: 12, 15, 18, or 21; including.
  • the vector of the present invention has any one of the following base sequences (t) to (w): (T) the base sequence shown in SEQ ID NO: 41 or 42, or the base sequence shown in SEQ ID NO: 85 or 86 that is complementary to the base sequence shown in SEQ ID NO: 41 or 42, preferably the base shown in SEQ ID NO: 41 or 42 Sequence; (U) a base sequence of a nucleic acid that hybridizes under stringent conditions with a nucleic acid comprising a base sequence complementary to the base sequence represented by SEQ ID NO: 41, 42, 85, or 86, preferably SEQ ID NO: 41 or 42; (V) SEQ ID NO: 41, 42, 85 or 86, preferably 85% or more, preferably 90% or more, more preferably 95% or more, more preferably 97% or more, most preferably the nucleotide sequence shown in SEQ ID NO: 41 or 42 Preferably a nucleotide sequence having a sequence identity of 99% or more; (W) a
  • the vector according to this aspect is preferably usable as a vector having autonomous replication ability.
  • the base sequence of (w), SEQ ID NO: 41 or 85 or (u) or (v) (where the base sequence shown in SEQ ID NO: 41, 42, 85 or 86 is the base sequence shown in SEQ ID NO: 41 or 85) And preferably (u) or (v) (provided that the base sequence shown in SEQ ID NO: 41, 42, 85 or 86 is the base sequence shown in SEQ ID NO: 41), particularly preferably Is a partial base sequence consisting of consecutive m bases starting from the Nth base in the base sequence of SEQ ID NO: 41 (where m is 5 bases or more, preferably 10 bases or more and (111 ⁇ N + 1) bases or less) And an integer of 1 to 107, preferably 1 to 102).
  • m may be, for example, any one of 5, 6, 7, 8, 9, 10, 11, 12,... (111 ⁇ N + 1), and N is 1, 2, 3, 4,. Any one of them may be used.
  • SEQ ID NO: 42 or 86 or the above (u) or (v) (provided that the base sequence shown in SEQ ID NO: 41, 42, 85 or 86 is represented by SEQ ID NO: 42 or 86)
  • the base sequence shown in SEQ ID NO: 42 preferably (u) or (v) (provided that the base sequence shown in SEQ ID NO: 41, 42, 85 or 86 is the base sequence shown in SEQ ID NO: 42)
  • a partial base sequence consisting of consecutive m ′ bases starting from the N ′ base (where m ′ is 5 bases or more, preferably 10 bases or more and (218 -N '+ 1) is an integer of a base or less, and N' is an integer of 1 to 214,
  • the vector of the present invention has any of the following base sequences (h) to (k): (H) the nucleotide sequence shown in SEQ ID NO: 13, 16, 19, or 22; (I) a nucleotide sequence of a nucleic acid that hybridizes under stringent conditions with a nucleic acid consisting of a nucleotide sequence complementary to the nucleotide sequence shown in SEQ ID NO: 13, 16, 19, or 22; (J) 85% or more, preferably 90% or more, more preferably 95% or more, more preferably 97% or more, most preferably 99% or more of the sequence shown in SEQ ID NO: 13, 16, 19, or 22 Base sequences having identity; (K) a base sequence in which one or more bases are substituted, deleted, inserted and / or added in the base sequence shown in SEQ ID NO: 13, 16, 19, or 22; including.
  • the vector according to this aspect is preferably usable as a vector having autonomous replication ability.
  • the vector of the present invention has any one of the following base sequences (l) to (o): (L) a nucleotide sequence represented by SEQ ID NO: 14, 17, 20, or 23; (M) a base sequence of a nucleic acid that hybridizes under stringent conditions with a nucleic acid comprising a base sequence complementary to the base sequence shown in SEQ ID NO: 14, 17, 20, or 23; (N) 85% or more, preferably 90% or more, more preferably 95% or more, still more preferably 97% or more, most preferably 99% or more of the sequence shown in SEQ ID NO: 14, 17, 20, or 23 Base sequences having identity; (O) a base sequence in which one or more bases are substituted, deleted, inserted and / or added in the base sequence shown in SEQ ID NO: 14, 17, 20, or 23; including.
  • the vector according to this aspect is preferably usable as a vector having autonomous replication ability.
  • the vector of the present invention preferably comprises one, and more preferably two of the following (Feature 1) to (Feature 2).
  • the vector of the present invention for example, a vector containing any one of the base sequences (a) to (d) above can be stably maintained in the host.
  • “Stably retained” means that when introduced into a host cell, it is retained in the host cell even after passage through the host cell.
  • the vector of the present invention can be stably maintained, for example, with respect to a vector not containing any of the above base sequences (a) to (d).
  • it is not limited whether the vector is stably maintained for example, as described in Example 4, it is confirmed by introducing a reporter gene into the vector and measuring a change in the expression intensity of the reporter gene accompanying cell division. be able to.
  • the compound of the present invention is further transformed by transforming host cells using a vector for production of the target compound further incorporating a base sequence encoding the target compound into the vector of the present invention. Stable and efficient production is possible.
  • the vector containing at least one of the base sequences (a) to (d) is stably maintained in the host cell. It is presumed that the nucleic acid comprising the base sequence of any one of (a) to (d) can be used as centromere DNA that contributes to chromosome stabilization in the cell cycle of the host cell.
  • the vector of the present invention is preferably an autonomously replicating vector. If the vector of the present invention is an autonomously replicating type, the host can be improved without changing the genome sequence or genome structure of the host organism.
  • an autonomously replicating vector refers to a vector that is replicated independently of the host chromosome, and that is replicated within the host without being integrated into the host chromosome.
  • (D1) In the nucleotide sequence shown in SEQ ID NO: 12, 15, 18, or 21, 1 to 200, 1 to 190, 1 to 160, 1 to 130, 1 to 100, 1 to 75, 1 ⁇ 50, 1 ⁇ 25, 1 ⁇ 20, 1 ⁇ 15, 1 ⁇ 10, 1 ⁇ 7, 1 ⁇ 5, 1 ⁇ 4, 1 ⁇ 3, or 1 or 2 Base sequences in which bases are substituted, deleted, inserted and / or added; (D2) a base sequence in which one or more bases in total are added to the 5 ′ end and / or the 3 ′ end in the base sequence shown in SEQ ID NO: 12, 15, 18, or 21; (D3) a base sequence in which one or more bases in total are deleted from the 5 ′ end and / or the 3 ′ end in the base sequence shown in SEQ ID NO: 12, 15, 18, or 21; or (d4 ) A partial base sequence of the base sequence of (b) or (c) above, and in the base sequence shown in SEQ ID NO: 12, 15,
  • the base sequences located upstream (5 ′ end side) and downstream (3 ′ end side) of any one of the base sequences (a) to (d) are any of the following (e) to (g): A pair of base sequences; (E) a pair in which an upstream base sequence and a downstream base sequence are complementary base sequences; (F) a pair in which an upstream base sequence and a downstream base sequence are base sequences of nucleic acids that hybridize to each other under stringent conditions; (G) An upstream base sequence and a downstream base sequence are 85% or more, preferably 90% or more, more preferably 95% or more, still more preferably 97% or more, and most preferably 99%, with one complementary base sequence.
  • the upstream base sequence may be referred to as “base sequence A” and the downstream base sequence may be referred to as “base sequence B”. .
  • the pair of the base sequence A and the base sequence B is the pair (e).
  • the nucleotide sequence shown in (1) contains an autonomous replication sequence (ARS) in Komagataela pastoris. Therefore, when at least one of the base sequences (h) to (o) described later is used as the base sequence A and / or the base sequence B, the vector of this embodiment of the present invention is a yeast, for example, Komagataela sp. It can be used as an autonomously replicating vector in a strain, preferably the Komagataela pastoris strain.
  • ARS autonomous replication sequence
  • the vector of this embodiment of the present invention preferably comprises at least one of the above features 1 and 2 and the following feature 3, more preferably at least features 1 and 2, particularly preferably features. All of 1 to 3 are provided.
  • the vector of the present invention preferably has a binding ability to centromere protein (CENP), and more preferably, among the nucleic acid molecules constituting the vector of the present invention, the above-mentioned (a) to (d) And a site comprising at least one base sequence selected from the upstream and downstream base sequences of any of (e) to (g) above has a binding ability to CENP.
  • CENP is a group of centromere-specific proteins contained in the centromere region of eukaryotic chromosomes.
  • any one of the base sequences of (a) to (d) and any of the base sequences of (e) to (g) is a base of a region constituting a centromere in the chromosomal DNA of Komagataela pastoris Since it is a sequence or a base sequence equivalent thereto, it is considered that a site containing at least one base sequence selected from these base sequences in the vector of the present invention has a binding ability to CENP.
  • CENP-A is a histone H3 variant that is specifically localized in the centromere region, and is common to humans and yeasts.
  • the site of the vector of the present invention preferably has the ability to bind CENP such as CENP-A in Komagataela pastoris and other yeasts and other eukaryotes. Specifically, it is confirmed from the Examples that the portion of the nucleic acid molecule constituting the vector of the present invention that includes the nucleotide sequence represented by any of SEQ ID NOs: 12 to 23 has the ability to bind to CENP. .
  • the fact that the base sequence A is located upstream from any one of the base sequences (a) to (d) means that the base at the 3 ′ end of the base sequence A ( Base 1) is located upstream of the 5′-end base (referred to as base 2) of any of the base sequences (a) to (d), and base 1 and base 2 may be adjacent to each other, and a base sequence of any number of bases, for example, 1 to 1000, preferably 1 to 100, more preferably 1 to 10, is interposed between base 1 and base 2. Also good.
  • the base sequence B is located downstream of any one of the base sequences (a) to (d).
  • 4 may be adjacent to each other, and a base sequence of any number of bases, for example, 1 to 1000, preferably 1 to 100, more preferably 1 to 10, is interposed between base 3 and base 4. Also good.
  • the lower limit of the GC content of B is 0.8 and the upper limit is 1.2.
  • the GC content of the base sequence A and / or the base sequence B is preferably 41% or less.
  • the number of bases of the base sequence A and the base sequence B is not particularly limited, but is preferably 2800 bases or less, more preferably 1900 bases or more, respectively.
  • At least one of the base sequence A and the base sequence B is a partial base sequence of Komagataella yeast chromosomal DNA, for example, Komagataela pastoris chromosomal DNA.
  • the base sequence A is any one of the following base sequences (h) to (k): (H) the nucleotide sequence shown in SEQ ID NO: 13, 16, 19, or 22; (I) a nucleotide sequence of a nucleic acid that hybridizes under stringent conditions with a nucleic acid consisting of a nucleotide sequence complementary to the nucleotide sequence shown in SEQ ID NO: 13, 16, 19, or 22; (J) 85% or more, preferably 90% or more, more preferably 95% or more, more preferably 97% or more, most preferably 99% or more of the sequence shown in SEQ ID NO: 13, 16, 19, or 22 Base sequences having identity; (K) a base sequence in which one or more bases are substituted, deleted, inserted and / or added in the base sequence shown in SEQ ID NO: 13, 16, 19, or 22; It is.
  • the base sequences (h) to (k) are preferably base sequences that impart autonomous replication ability to the vector of the present invention.
  • “the base sequence shown in SEQ ID NO: 13, 16, 19, or 22” is preferably “the base sequence shown in SEQ ID NO: 16 or 19”.
  • (K1) In the base sequence shown in SEQ ID NO: 13, 16, 19, or 22, 1 to 400, 1 to 375, 1 to 350, 1 to 325, 1 to 295, 1 to 250, 1 ⁇ 225, 1 ⁇ 200, 1 ⁇ 175, 1 ⁇ 150, 1 ⁇ 125, 1 ⁇ 100, 1 ⁇ 75, 1 ⁇ 50, 1 ⁇ 25, 1 ⁇ 20, 1 Base sequence with ⁇ 15, 1-10, 1-7, 1-5, 1-4, 1-3, or 1 or 2 bases substituted, deleted, inserted and / or added ; (K2) In the base sequence shown in SEQ ID NO: 13, 16, 19, or 22, a base sequence in which one or more bases in total are added to the 5 ′ end and / or 3 ′ end, particularly to the 5 ′ end; (K3) Contiguous in the base sequence shown in SEQ ID NO: 13, 16, 19, or 22, for example, continuous from the 5 ′ end and / or 3 ′ end, particularly continuous from the 5 ′ end, in total
  • Examples of the sequence of (k3) include: (k4) SEQ ID NOs: 13, 16, 19, or 22 consecutive, for example, 5 to 1 and / or 3 to the end, 1 to 5, 1 to 10, 1 to 25, 1-50, 1-75, 1-100, 1-125, 1-150, 1-175, 1-200, 1-225, 1-250, 1-275, 1-300, 1-350, Examples include partial base sequences consisting of 1 to 400, 1 to 450, or 1 to 500 bases.
  • Examples of the sequence of (k4) include, for example, consecutive 1 to 5, 1 to 10, 1 to 25, 1 to 30, 1 to 40, 1 to 50, 1 to 60, 1 to 70, 1 to SEQ ID NO: 41 80, 1 to 90, or 1 to 100 bases, or 1 to 5, 1 to 10, 1 to 25, 1 to 30, 1 to 40, 1 to 50, 1 to 60, 1 to 70 of SEQ ID NO: 42 , 1-80, 1-90, 1-100 base, 1-110 base, 1-120 base, 1-130 base, 1-140 base, 1-150 base, 1-160 base, 1-170 base, 1 Examples include a partial base sequence consisting of ⁇ 180 bases, 1 ⁇ 190 bases, 1 ⁇ 200 bases, or 1 ⁇ 210 bases, particularly the base sequence of SEQ ID NO: 41 or 42.
  • a partial base sequence consisting of consecutive m bases starting from the Nth base (where m is 5 bases or more, preferably 10 bases or more And (111 ⁇ N + 1) bases or less, and N is an integer of 1 to 107, preferably up to 102.
  • m may be, for example, any one of 5, 6, 7, 8, 9, 10, 11, 12,... (111 ⁇ N + 1), and N is 1, 2, 3, 4,. Any one of them may be used.
  • m ′ may be any one of 5, 6, 7, 8, 9, 10, 11, 12... (218 ⁇ N ′ + 1), and N ′ is 1, 2, 3, 4 ,..., 214.
  • Examples of the sequence of (k5) include: (k6) the base sequence of the above (i) or (j) is continuous, for example, from the 5 ′ end and / or the 3 ′ end, 1 to 10, 1 to 25, 1 ⁇ 50, 1 ⁇ 75, 1 ⁇ 100, 1 ⁇ 125, 1 ⁇ 150, 1 ⁇ 175, 1 ⁇ 200, 1 ⁇ 225, 1 ⁇ 250, 1 ⁇ 275, 1 ⁇ 300, 1 ⁇ 350, 1 ⁇ 400 , 1 to 450, or a partial base sequence consisting of 1 to 500 bases.
  • SEQ ID NO: 12 15, 18, or 21 is “SEQ ID NO: 15” in any one of the base sequences of (a) to (d), any of (h) to (k) above
  • SEQ ID NO: 13, 16, 19, or 22 is preferably “SEQ ID NO: 16”, but is not particularly limited.
  • SEQ ID NO: 12 15, 18, or 21
  • SEQ ID NO: 18 in any one of the base sequences (a) to (d), any of (h) to (k) above
  • SEQ ID NO: 13, 16, 19, or 22 is preferably “SEQ ID NO: 19”, but is not particularly limited.
  • the base sequence B is any one of the following base sequences (l) to (o): (L) a nucleotide sequence represented by SEQ ID NO: 14, 17, 20, or 23; (M) a base sequence of a nucleic acid that hybridizes under stringent conditions with a nucleic acid comprising a base sequence complementary to the base sequence shown in SEQ ID NO: 14, 17, 20, or 23; (N) 85% or more, preferably 90% or more, more preferably 95% or more, still more preferably 97% or more, most preferably 99% or more of the sequence shown in SEQ ID NO: 14, 17, 20, or 23 Base sequences having identity; (O) a base sequence in which one or more bases are substituted, deleted, inserted and / or added in the base sequence shown in SEQ ID NO: 14, 17, 20, or 23; It is.
  • the base sequences (l) to (o) are preferably base sequences that impart autonomous replication ability to the vector of the present invention.
  • “the base sequence shown in SEQ ID NO: 14, 17, 20, or 23” is preferably “the base sequence shown in SEQ ID NO: 17 or 20”.
  • (O1) In the base sequence shown in SEQ ID NO: 14, 17, 20, or 23, 1 to 400, 1 to 375, 1 to 350, 1 to 325, 1 to 295, 1 to 250, 1 ⁇ 225, 1 ⁇ 200, 1 ⁇ 175, 1 ⁇ 150, 1 ⁇ 125, 1 ⁇ 100, 1 ⁇ 75, 1 ⁇ 50, 1 ⁇ 25, 1 ⁇ 20, 1 Base sequence with ⁇ 15, 1-10, 1-7, 1-5, 1-4, 1-3, or 1 or 2 bases substituted, deleted, inserted and / or added ; (O2) In the base sequence shown in SEQ ID NO: 14, 17, 20, or 23, a base sequence in which one or more bases in total are added to the 5 ′ end and / or 3 ′ end, particularly to the 3 ′ end; (O3) In the base sequence shown in SEQ ID NO: 14, 17, 20, or 23, a total of one or more bases that are continuous from the 5 ′ end and / or the 3 ′ end, particularly from the 3 ′
  • Examples of (o3) sequences include: (o4) SEQ ID NOs: 14, 17, 20, or 23 consecutive, eg, 5 to 1 and / or 3 ′ ends, 1 to 5, 1 to 10, 1 to 25, 1-50, 1-75, 1-100, 1-125, 1-150, 1-175, 1-200, 1-225, 1-250, 1-275, 1-300, 1-350, Examples include partial base sequences consisting of 1 to 400, 1 to 450, or 1 to 500 bases.
  • sequence of (o4) for example, 1 to 5, 1 to 10, 1 to 25, 1 to 30, 1 to 40, 1 to 50, 1 to 60, 1 to 70, 1 to 80, 1 to 90, or 1 to 100 bases, or 1 to 5, 1 to 10, 1 to 25, 1 to 30, 1 to 40, 1 to 50, 1 to 60, 1 to 70 of SEQ ID NO: 86 , 1-80, 1-90, 1-100 base, 1-110 base, 1-120 base, 1-130 base, 1-140 base, 1-150 base, 1-160 base, 1-170 base, 1 Examples include a partial base sequence consisting of ⁇ 180 bases, 1 ⁇ 190 bases, 1 ⁇ 200 bases, or 1 ⁇ 210 bases, in particular, the base sequence of SEQ ID NO: 85 or 86.
  • a partial base sequence consisting of consecutive m bases starting from the Nth base in the base sequence of SEQ ID NO: 85 (where m is 5 bases or more, preferably 10 bases or more And (111 ⁇ N + 1) bases or less, where N is an integer from 1 to 102).
  • m may be, for example, any one of 5, 6, 7, 8, 9, 10, 11, 12,... (111 ⁇ N + 1), and N is 1, 2, 3, 4,. Any one of them may be used.
  • a partial base sequence consisting of consecutive m ′ bases starting from the N ′ base (where m ′ is 5 bases or more) Preferably an integer of 10 bases or more and (218 ⁇ N ′ + 1) bases or less, and N ′ is an integer of 1 to 209).
  • m ′ may be any one of 5, 6, 7, 8, 9, 10, 11, 12... (218 ⁇ N ′ + 1), and N ′ is 1, 2, 3, 4 ,..., 214.
  • the base sequence of (m) or (n) is continuous, for example, continuous from the 5 ′ end and / or the 3 ′ end, 1 to 5, 1 to 10, 1 ⁇ 25, 1 ⁇ 50, 1 ⁇ 75, 1 ⁇ 100, 1 ⁇ 125, 1 ⁇ 150, 1 ⁇ 175, 1 ⁇ 200, 1 ⁇ 225, 1 ⁇ 250, 1 ⁇ 275, 1 ⁇ 300, 1 ⁇ 350 , 1 to 400, 1 to 450, or a partial base sequence consisting of 1 to 500 bases.
  • SEQ ID NO: 12 when “SEQ ID NO: 12, 15, 18, or 21” is “SEQ ID NO: 12” in any one of the base sequences (a) to (d), any one of (l) to (o) above In the base sequence, “SEQ ID NO: 14, 17, 20, or 23” is preferably “SEQ ID NO: 14”, but is not particularly limited.
  • SEQ ID NO: 12 15, 18, or 21 is “SEQ ID NO: 15” in any one of the base sequences of (a) to (d), any of (l) to (o) above
  • SEQ ID NO: 14, 17, 20, or 23 is preferably “SEQ ID NO: 17”, but is not particularly limited.
  • SEQ ID NO: 12 15, 18, or 21
  • SEQ ID NO: 18 in any one of the base sequences of (a) to (d)
  • SEQ ID NO: 14, 17, 20, or 23 is preferably “SEQ ID NO: 20”, but is not particularly limited.
  • SEQ ID NO: 12 15, 18, or 21 is “SEQ ID NO: 21” in any one of the base sequences of (a) to (d), any of (l) to (o) above
  • SEQ ID NO: 14, 17, 20, or 23 is preferably “SEQ ID NO: 23”, but is not particularly limited.
  • the base sequence A is any one of the following base sequences (t) to (w): (T) the nucleotide sequence set forth in SEQ ID NO: 41, 42, 85, or 86, preferably SEQ ID NO: 41 or 42; (U) a base sequence of a nucleic acid that hybridizes under stringent conditions with a nucleic acid comprising a base sequence complementary to the base sequence represented by SEQ ID NO: 41, 42, 85, or 86, preferably SEQ ID NO: 41 or 42; (V) SEQ ID NO: 41, 42, 85, or 86, preferably 85% or more, preferably 90% or more, more preferably 95% or more, more preferably 97% or more, with the base sequence shown in SEQ ID NO: 41 or 42, Most preferably a base sequence having a sequence identity of 99% or more; (W) a base sequence in which one or more bases are substituted, deleted,
  • the base sequences of (t) to (w) are any one of the above sequences, for example, any of the base sequences of (a) to (d), and any pair of base sequences of (e) to (g). It may be included as a whole or a partial sequence of the constituent upstream and / or downstream base sequences, any of the base sequences (h) to (o), or may be included separately from these sequences.
  • the base sequences (t) to (w) are preferably base sequences that impart autonomous replication ability to the vector of the present invention.
  • the base sequence of (w) is the partial base sequence of (u) or (v), and in the base sequence shown in SEQ ID NO: 41, 42, 85, or 86, one or more base sequences Includes a nucleotide sequence substituted, deleted, inserted and / or added.
  • the base sequence of (w), SEQ ID NO: 41 or 85 or (u) or (v) (where the base sequence shown in SEQ ID NO: 41, 42, 85 or 86 is the base sequence shown in SEQ ID NO: 41 or 85) And preferably (u) or (v) (provided that the base sequence shown in SEQ ID NO: 41, 42, 85 or 86 is the base sequence shown in SEQ ID NO: 41), particularly preferably Is a partial base sequence consisting of consecutive m bases starting from the Nth base in the base sequence of SEQ ID NO: 41 (where m is 5 bases or more, preferably 10 bases or more and (111 ⁇ N + 1) bases or less) And an integer of 1 to 107, preferably up to 102).
  • m may be, for example, any one of 5, 6, 7, 8, 9, 10, 11, 12,... (111 ⁇ N + 1), and N is 1, 2, 3, 4,. Any one of them may be used.
  • SEQ ID NO: 42 or 86 or the above (u) or (v) (provided that the base sequence shown in SEQ ID NO: 41, 42, 85 or 86 is represented by SEQ ID NO: 42 or 86)
  • the base sequence shown in SEQ ID NO: 42 preferably (u) or (v) (provided that the base sequence shown in SEQ ID NO: 41, 42, 85 or 86 is the base sequence shown in SEQ ID NO: 42)
  • a partial base sequence consisting of consecutive m ′ bases starting from the N ′ base (where m ′ is 5 bases or more, preferably 10 bases or more and (218 -N '+ 1) is an integer of a base or less, and N' is an integer from 1 to 214,
  • the base sequence B is preferably A base sequence complementary to the base sequence shown in SEQ ID NO: 41 or 42;
  • the base sequence of a nucleic acid that hybridizes under stringent conditions with the nucleic acid comprising the base sequence shown in SEQ ID NO: 41 or 42; 85% or more, preferably 90% or more, more preferably 95% or more, more preferably 97% or more, most preferably 99% or more of the sequence identity with the base sequence complementary to the base sequence shown in SEQ ID NO: 41 or 42 A nucleotide sequence having It is.
  • a particularly preferred combination of the base sequence A and the base sequence B is a base sequence pair of any of the following (p) to (s); (P) a pair that is upstream of the base sequence shown in SEQ ID NO: 13 and downstream is the base sequence shown in SEQ ID NO: 14; (Q) a base sequence shown in SEQ ID NO: 16 upstream, and a base sequence comprising the sequence shown in SEQ ID NO: 41 upstream, or a base sequence containing the sequence shown in SEQ ID NO: 41 upstream, and shown in SEQ ID NO: 41 downstream A pair which is a base sequence complementary to the base sequence including the sequence; (R) a base sequence shown in SEQ ID NO: 19 upstream, and a base sequence comprising the base sequence shown in SEQ ID NO: 20 downstream, or a base sequence containing the sequence shown in SEQ ID NO: 42 upstream, and shown in SEQ ID NO: 42 downstream A pair which is a base sequence complementary to the base sequence including the sequence; (S) a pair that is upstream of the base sequence shown
  • More preferred embodiments of the vectors of the present invention include: The nucleotide sequence of any one of (h) to (o) above (5 ′ end side) and / or downstream (3 ′ end side) of any one of the nucleotide sequences (a) to (d) A vector comprising at least one.
  • SEQ ID NO: 13, 14, 16, 17, 19, 20, 22, 23, 41, or 42 for example SEQ ID NO: 16, 17, 19, 20, 41, or 42, in particular SEQ ID NO: 16, 19, It has been confirmed that the base sequence shown in 41 or 42 contains an autonomous replication sequence (ARS) in Komagataela pastoris. Therefore, the vector of the present invention containing at least one of the nucleotide sequences (h) to (o) identical or equivalent to these nucleotide sequences can be used as an autonomously replicating vector.
  • ARS autonomous replication sequence
  • any one of the base sequences of (a) to (d) and any of the base sequences of (h) to (o) is a base of a region constituting a centromere in the chromosomal DNA of Komagataela pastoris Since it is a sequence or a base sequence equivalent thereto, it is considered that a site containing at least one base sequence selected from these base sequences in the vector of the present invention has a binding ability to CENP.
  • the vector of this embodiment includes at least one of the base sequences (h) to (k) upstream of any one of the base sequences (a) to (d).
  • At least one of the base sequences of (l) to (o) is included downstream of any of the base sequences of (a) to (d).
  • any one of the base sequences (a) to (d) and any one of the base sequences (h) to (o) may be directly adjacent to each other, and any arbitrary sequence may be interposed therebetween. May be present, for example, a base sequence of 1 to 1000, preferably 1 to 100, more preferably 1 to 10.
  • a preferred embodiment of any one of the base sequences (h) to (o) is as described in 1.2 above.
  • the vector of the present invention can be used to introduce a host cell and allow the host cell to retain the vector.
  • the vector of the present invention may be any vector as long as it can be used for the purpose of introducing a nucleic acid, a target gene, etc. into a host cell after transformation and expressing it in the host cell after transformation. Absent.
  • the “vector” is a nucleic acid molecule, and the base sequence X (the base sequence of any one of the above (a) to (d) described in detail in 1.1, 1.2 and 1.3 above) , Upstream and / or downstream base sequences constituting a pair of any of the base sequences (e) to (g), any of the bases (h) to (o) and (t) to (w) A sequence, or a plurality of these base sequences, including a base sequence in which a plurality of base sequences are linked (including a case where they are linked via another base sequence of an appropriate length). .
  • the vector of the present invention can also contain a base sequence of a foreign gene or an endogenous gene.
  • the “foreign gene” refers to a gene that is not inherently present in the host cell and is artificially incorporated into the vector
  • the “endogenous gene” refers to a host cell that is intrinsic as chromosomal DNA or cytoplasmic DNA. Is a gene that is artificially incorporated into a vector for the purpose of imparting the function of the gene to a vector or for the purpose of achieving enhanced expression of the gene.
  • the vector of the present invention further comprises a cloning site containing one or more restriction enzyme recognition sites, an auxotrophic gene (auxotrophic requirement) in addition to, or in place of, the base sequence of a foreign gene or endogenous gene.
  • the vectors of the present invention may further contain regulatory sequences such as promoters and terminators, overlapping regions for utilizing Clontech's In-Fusion cloning system, New England Biolabs Gibson Assembly system, and the like.
  • the vector of the present invention can further contain a centromere DNA sequence and a telomere DNA sequence derived from a biological species different from the biological species from which the base sequence X is derived, depending on the host.
  • a foreign gene or endogenous gene is a gene that is introduced for the purpose of production of substances, and is typically a nucleic acid that encodes a target polypeptide.
  • the foreign gene or endogenous gene can be included in the vector in a form inserted in an expression cassette.
  • the “expression cassette” refers to an expression system that contains a foreign gene or an endogenous gene and can make it expressable as a polypeptide.
  • “Expressable state” refers to a state in which a foreign gene or endogenous gene contained in the expression cassette is placed under the control of an element required for gene expression so that it can be expressed in a transformant. . Examples of the elements necessary for gene expression include the following promoters and the following terminators.
  • selectable marker genes examples include drug resistance genes such as ampicillin, Zeocin TM , kanamycin, tetracycline, and chloramphenicol.
  • the vectors of the present invention may contain more than one selectable marker to allow selection with different drugs.
  • reporter genes examples include LacZ, luciferase, and green fluorescent protein (GFP).
  • promoters examples include GAP promoter (glyceraldehyde-3-phosphate dehydrogenase promoter) derived from yeast species, AOX (alcohol oxidase) promoter, MOX (methanol oxidase) promoter, and FMD (formic acid). Dehydrogenase) promoter and the like.
  • GAP promoter glycosyl alcohol dehydrogenase promoter
  • AOX alcohol oxidase
  • MOX methanol oxidase
  • FMD formic acid
  • Dehydrogenase promoter and the like.
  • terminators examples include AOX terminators derived from yeast species, MOX terminators, ADH1 (alcohol dehydrogenase 1) terminators, and GAL10 terminators.
  • autonomous replication sequence is a prokaryote (E. coli, bacteria, actinomycetes, eubacteria, archaea, cyanobacteria, etc.), virus (DNA virus, RNA virus, etc.), eukaryote. It is the origin of replication of organisms (fungi, algae, protozoa, yeast, plants, animals, birds, poultry, mammals, humans, mice, etc.), preferably yeasts such as eukaryotes such as Komagataela pastoris. This is the region of the base sequence to be started.
  • the vector of the present invention may contain two or more autonomously replicating sequences in different species, for example. Examples of the autonomously replicating sequence that can be included in the vector of the present invention include any one of the base sequences (t) to (w) described above.
  • the centromere DNA sequence is a base sequence that forms a structure called a centromere and binds to the spindle.
  • a centromere binds to the spindle.
  • it is a region where the long arm and short arm of a chromosome intersect, and it is also called a centromere region because it is located approximately at the center of the chromosome.
  • a telomeric DNA sequence refers to a repetitive structure of a base sequence usually present at the terminal portion of chromosomal DNA, and has a function of preventing damage accompanying chromosome replication during cell division and maintaining stability.
  • a method for producing a YAC vector containing telomeric DNA includes a technique (telomere truncation) in which a cloned telomeric DNA sequence is introduced by homologous recombination to shorten a chromosome (Itzaki et al., NatureN Genet. (USA), 2nd. Vol., P.283-287, 1992).
  • target polypeptides encoded by foreign genes or endogenous genes include proteins, fusion proteins, antibodies, cytokines, enzymes, and the like.
  • the vector of the present invention can be a circular vector, a linear vector, a plasmid, an artificial chromosome or the like.
  • a vector is an artificially constructed nucleic acid molecule.
  • the nucleic acid molecule constituting the vector of the present invention is usually DNA, preferably double-stranded DNA, which may be circular or linear.
  • the vector of the present invention usually contains a nucleic acid fragment containing the above base sequence X or a nucleic acid fragment comprising the above base sequence X at one or more ends, for example, via a restriction enzyme recognition site. , Constructed by linking to other functional nucleic acid fragments as mentioned above.
  • the scope of the “vector” in the present invention includes the cloning site, the base sequence of the selectable marker gene, the base sequence of the reporter gene, ARS, the regulatory sequence, the overlap region, the base sequence of the foreign gene or endogenous gene, the centromere Not only forms in which DNA sequences, telomeric DNA sequences, etc. have already been added, but also forms in which these sequences can be added (for example, including a cloning site containing one or more restriction enzyme recognition sites to which these sequences can be added. Form) of nucleic acid molecules.
  • the vector of the present invention may be a genome integration vector or an autonomously replicating vector, but is preferably an autonomously replicating vector.
  • the genome integration type vector of the present invention can be prepared by incorporating the above base sequence X into a genome integration type vector.
  • the vector of the present invention can be prepared by incorporating the above base sequence X into an arbitrary vector.
  • the vector incorporating the base sequence X may be a vector having no autonomously replicating sequence in yeast, for example, a strain of the genus Komagataela, preferably a strain of Komagataela pastoris, or a vector having an autonomously replicating sequence in yeast.
  • Examples of vectors containing autonomously replicating sequences in yeast include YRp vectors and YCp vectors.
  • the YRp vector refers to a vector having a yeast ARS sequence
  • the YCp vector refers to a vector having a yeast centromere sequence and an ARS sequence.
  • the vector can be used as a YRp or YCp vector.
  • the base sequence X to the YRp or YCp vector, autonomous replication and stabilization of the vector in other hosts can be promoted.
  • the vector incorporating the above base sequence X is not particularly limited.
  • YEp vector, YRp vector, YCp vector, pPICHOLI http://www.mobitec.com/cms/products/bio/04_vector_sys/p_picholi_shuttle_vector.html
  • pHIP Journal of General Microbioiogy (1992), 138, 2405-2416.
  • the method for incorporating these into other vectors is not particularly limited, but a nucleic acid fragment containing the above-mentioned base sequence X and containing restriction enzyme recognition sites at both ends is transferred to a cloning site containing the corresponding restriction enzyme recognition sites in other vectors.
  • This can be achieved by using the insertion method, Clontech In-Fusion cloning system, New England Biolabs Gibson Assembly system, or the like.
  • an autonomously replicating sequence corresponding to the host can be included in the vector.
  • the base sequence X includes a sequence that functions as an autonomously replicating sequence for the host, it is not necessary to separately incorporate the autonomously replicating sequence into the vector.
  • SEQ ID NO: 12-23, 41, or 42 preferably SEQ ID NO: 16, 17, 19, 20, 41, or 42, more preferably SEQ ID NO: 16, 19, 41, or 42
  • the nucleotide sequence represented by any of these includes ARS in Komagataela pastoris, SEQ ID NOs: 12 to 23, 41, or 42, for example, SEQ ID NOs: 16, 17, 19, 20, 41, or 42, in particular, a vector comprising the nucleotide sequence represented by any one of SEQ ID NOs: 16, 19, 41, or 42 can be used as an autonomously replicating vector in yeast containing yeast of the genus Komagataela such as Komagataela pastoris At least experimentally confirmed.
  • the transformed vector of the present invention preferably exists as an autonomously replicating type in the host cell, but may be in a state of being integrated into the chromosome.
  • the vector of the present invention can also be in the form of an artificial chromosome vector.
  • Yeast artificial chromosome vectors generally contain a centromeric DNA sequence, a telomeric DNA sequence, and an autonomously replicating sequence (ARS).
  • ARS autonomously replicating sequence
  • the added base sequence a base sequence in which one of SEQ ID NOs: 22 and 23 is added to at least one of the upstream or downstream of the base sequence of SEQ ID NO: 21, is a centromere in yeast including Komagataela yeast such as Komagataela pastoris It has been confirmed that it functions as an ARS as well as a DNA sequence. Therefore, in the artificial chromosome vector, (h) to (d) upstream of and / or downstream of any one of the base sequences of (a) to (d), or any of the base sequences of (a) to (d).
  • the base sequence to which at least one of the base sequences of (o) is added is used as a centromere DNA sequence and ARS, a telomeric DNA sequence is incorporated at both ends of the vector, and a selection marker is further incorporated as necessary.
  • a YAC vector can be formed.
  • the vector of the present invention is preferably an autonomously replicating vector capable of autonomously replicating in host cells of a plurality of biological species.
  • Such an autonomously replicating vector includes any one of the base sequences (a) to (d) above, and further differs from the biological species from which any one of the base sequences (a) to (d) is derived. Examples include vectors containing ARS and / or centromere DNA sequences derived from biological species.
  • the vector of the present invention can autonomously replicate in Komagataela pastoris, but also a means conceivable for making the vector autonomously replicable using another species or another genus as a host, for example,
  • a human chromosome centromere DNA sequence can be cloned into a vector containing the base sequence X and used as a human artificial chromosome, or an ARS or centromere DNA sequence of Ogataea yeast can be cloned into the vector containing the base sequence X
  • a vector containing the above base sequence X can be used as a centromere from Komagataela pastoris. It may be possible to clone a gene group that encodes a protein group that constitutes and use it as an autonomously replicating vector in other genus species. It is also possible to combine with an autonomously replicating vector of E. coli as in this example.
  • the vector of the present invention can be stably maintained in the host cell as shown in the Examples, but the stability can be further improved by adjusting the combination with the selection marker and the vector size.
  • the stability of the vector can be improved by designing so that the growth is slowed or killed when the selection marker on the vector is dropped.
  • the vector of the present invention can be stably maintained in the host cell as shown in the Examples, but can be removed. For example, dropping is accomplished by performing subculture in a non-selective medium.
  • the method for producing the vector of the present invention is not particularly limited.
  • a total synthesis method, PCR method, Clontech In-Fusion cloning system, New England Biolabs Gibson Assembly system, or the like can be used.
  • Transformant also relates to a method for transforming a cell, including the step of introducing the vector of the present invention described in 1. above into the cell.
  • the present invention also relates to a transformant obtained by transforming a cell with the vector of the present invention described in 1. above.
  • a cell into which a vector is introduced and transformed is called a “host cell”, “host” or “transformant”.
  • host cells before and after transformation may be simply referred to as “cells”.
  • the cell used as the host is not particularly limited as long as the vector can be introduced into the cell.
  • host cells used for transformation include yeast, bacteria, fungi, insect cells, and animal cells.
  • yeast is preferable, and methanol-assimilating yeast is more preferable.
  • methanol-assimilating yeast is defined as yeast that can be cultivated using methanol as the only carbon source, but it was originally methanol-assimilating yeast, but it was assimilated by human modification or mutation. Yeast that has lost its performance is also included in the methanol-assimilating yeast in the present invention.
  • Examples of the methanol-assimilating yeast include yeasts belonging to the genus Pichia, the genus Ogataea, the genus Candida, the genus Torulopsis, the genus Komagataella, and the like.
  • Pichia ⁇ methanolica in the genus Ogataea, Ogataea angusta, Ogataea polymorpha, Ogataea polypolymorpha, minuta uta ), Candida genus Candida boidinii, and Komagataella genus Komagataella pastoris, Komagataella phaffii, etc. are preferable examples.
  • Komagataela yeast or Ogataea yeast are particularly preferable.
  • Komagataella pastoris As yeast of the genus Komagataella, Komagataella pastoris and Komagataella phaffii are preferable. Both Komagataela pastoris and Komagataela faffy have aliases for Pichia pastoris.
  • strains that can be used as the host include strains such as Komagataela pastoris ATCC 76273 (Y-11430, CBS7435) and Komagataela pastoris X-33. These strains can be obtained from American Type Culture Collection, Life Technologies, etc.
  • Ogataea genus yeast As the Ogataea genus yeast, Ogataea angusta, Ogataea polymorpha, and Ogataea parapolymorpha are preferable. These three are closely related species, all of which are also known as Hansenula polymorpha or Pichia angusta.
  • strains such as Ogata Air Angsta NCYC495 (ATCC14754), Ogata Air Polymorph 8V (ATCC34438), Ogata Air Parapolymorph DL-1 (ATCC26012). These strains can be obtained from the American Type Culture Collection.
  • derivatives derived from these Komagataela yeast and Ogataea yeast strains can also be used.
  • Komagataela pastoris GS115 strain available from Life Technologies
  • leucine-requiring strain Then, BY4329 derived from NCYC495, BY5242 derived from 8V, BY5243 derived from DL-1 (these can be sold from National BioResource Project), and the like.
  • derivatives derived from these strains can also be used.
  • the “transformant” refers to a transformed cell obtained by introducing the vector into the cell.
  • a method for introducing a vector into a host cell known methods can be appropriately used.
  • electroporation method, lithium acetate method, spheroplast method and the like can be mentioned. Is not to be done.
  • electroporation described in High efficiency transformation by electroporation of Pichia pastoris pretreated with lithium acetate and dithiothreitol Biotechniques. 2004 Jan; 36 (1): 152-4.
  • a vector containing a selection marker gene such as an auxotrophic complementary gene or a drug resistance gene is preferably used.
  • the selection marker is not particularly limited.
  • yeast when yeast is used as a host cell, vectors containing auxotrophic complementary genes such as URA3 gene, LEU2 gene, ADE1 gene, HIS4 gene, ARG4 gene as selection marker genes are used, respectively, uracil, leucine, adenine, histidine, Transformation is performed using an auxotrophic strain of arginine as a host, and a transformant can be selected by restoring the prototrophic strain phenotype.
  • a vector containing a drug resistance gene such as a G418 resistance gene, a Zeocin (trademark) resistance gene, or a hygromycin resistance gene
  • a drug resistance gene such as a G418 resistance gene, a Zeocin (trademark) resistance gene, or a hygromycin resistance gene
  • a selectable marker gene due to resistance on a medium containing G418, Zeocin (trademark) or hygromycin
  • Transformants can be selected.
  • an auxotrophic selection marker used when producing a yeast host cannot be used if the selection marker is not destroyed in the host. In this case, the selection marker may be destroyed in the host, and methods known to those skilled in the art can be used.
  • the number of copies of the vector introduced into one cell of the transformant is not particularly limited. One copy per cell may be present, or multiple copies of two or more copies may exist. One copy may exist as a circular vector, a linear vector, or an artificial chromosome, or may be incorporated into a host-derived chromosome. Multiple copies of two or more copies may all exist as a circular vector, a linear vector, or an artificial chromosome, or may be integrated into a host-derived chromosome, or both states occur simultaneously. Also good.
  • the multi-copy body having two or more copies may be a multi-copy body having two or more copies of the same vector or a multi-copy body having one or more different vectors.
  • the vector to be introduced into the transformant may exist as a circular vector after being transformed in a linear vector state and cyclized in the host cell, or transformed into a host vector after being transformed in the circular vector state. It may be cleaved in the cell and exist as a linear vector.
  • the culture conditions for the transformant are not particularly limited, and may be appropriately selected depending on the transformant.
  • any medium containing a nutrient source that can be assimilated by the transformant can be used.
  • the nutrient source include sugars such as glucose, sucrose and maltose, organic acids such as lactic acid, acetic acid, citric acid and propionic acid, alcohols such as methanol, ethanol and glycerol, hydrocarbons such as paraffin, soybean oil, Oils such as rapeseed oil, or carbon sources such as mixtures thereof, nitrogen sources such as ammonium sulfate, ammonium phosphate, urea, yeast extract, meat extract, peptone, corn steep liquor, and other inorganic salts, vitamins, etc.
  • a normal medium in which nutrient sources are appropriately mixed and blended can be used.
  • the vector of the present invention can be used for producing a target product.
  • the “target product” is a product produced by a transformant into which the vector of the present invention has been introduced, for example, secondary metabolites such as antibiotics, carotenoids and vitamins, proteins, fusion proteins, pharmaceuticals, Refers to antibodies, cytokines, enzymes and the like.
  • the desired product can be accumulated in the host or culture medium and recovered.
  • known purification methods can be used in appropriate combination.
  • the vector of the present invention can be used for screening a desired substance. For example, using vectors including genome editing enzymes such as CRISPR-Cas9, mutant DNA polymerase, cDNA or siRNA library, modified gene library of target production protein, promoter library, terminator library, untranslated region library, tag library, etc. Desired substances can be screened.
  • genome editing enzymes such as CRISPR-Cas9, mutant DNA polymerase, cDNA or siRNA library, modified gene library of target production protein, promoter library, terminator library, untranslated region library, tag library, etc.
  • Desired substances can be screened.
  • the vector of the present invention can be used for in vitro protein synthesis such as a cell-free protein synthesis system without using a transformant.
  • the plasmid used for transformation of yeast was constructed by using an E. coli E.coli DH5 ⁇ competent cell (manufactured by Takara Bio Inc.) or an E. coli E.coli E HST08 Premium Premium competent cell (manufactured by Takara Bio Inc.). And the resulting transformant was cultured and amplified. Preparation of the plasmid from the plasmid-carrying strain was performed using QIAprep spin miniprep kit (manufactured by QIAGEN).
  • centromere DNA sequence 1 (SEQ ID NO: 1), the centromere DNA sequence 2 (SEQ ID NO: 2), the centromere DNA sequence 3 (SEQ ID NO: 3), and the centromere DNA sequence 4 (SEQ ID NO: 4) used in the construction of the vector are Komagataela pastoris ATCC76273 Chromosomal DNA of the strain (the base sequence is described in EMBL (The European European Molecular Biology Laboratory) ACCESSION No.
  • centromere DNA sequence 1 is primer 3 (SEQ ID NO: 8)
  • centromere DNA sequence 2 is primer 4 (SEQ ID NO: 9)
  • centromere DNA sequence 3 was prepared by PCR using primer 5 (SEQ ID NO: 10)
  • centromere DNA sequence 4 was prepared by primer 6 (SEQ ID NO: 11).
  • the promoter-controlled Zeocin TM resistance gene (SEQ ID NO: 5) used in the construction of the vector was prepared by PCR using synthetic DNA as a template.
  • the promoter-controlled GFP gene (SEQ ID NO: 32) used in the construction of the vector was prepared by PCR using synthetic DNA as a template.
  • Prime STAR HS DNA Polymerase (manufactured by Takara Bio Inc.) or the like was used, and the reaction conditions were as described in the attached manual.
  • the chromosomal DNA was prepared using Gen Toru-kun (trademark) (manufactured by Takara Bio Inc. ) from Komagataela pastoris ATCC76273 strain under the conditions described therein.
  • Example 1 Zeocin (TM) HindIII recognition sequence and NotI recognition sequence upstream of the construction of the vector containing the resistance gene Zeocin (TM) resistance gene (SEQ ID NO: 5), a DNA fragment obtained by adding an EcoRI recognition sequence downstream sequence Prepared by PCR using the DNA fragment consisting of No. 5 as a template and primers 1 and 2 (SEQ ID Nos. 6 and 7) and inserted between the HindIII-EcoRI sites of pUC19 (Takara Bio, Code No. 3219) PUC-Z was prepared.
  • Example 2 Construction of a vector containing a GFP gene A DNA fragment comprising a HindIII recognition sequence and a NotI recognition sequence added upstream of a GFP gene (SEQ ID NO: 32) and an EcoRI recognition sequence downstream, and a DNA fragment consisting of SEQ ID NO: 32 as a template PUC-G was prepared by PCR using primers 15 and 16 (SEQ ID NOs: 33 and 34) and inserted between the HindIII-EcoRI sites of pUC19.
  • Example 3 Construction of an autonomously replicating vector containing SEQ ID NOs: 12, 15, 18, and 21 A DNA fragment having a NotI recognition sequence added upstream and downstream of SEQ ID NO: 12, and a DNA fragment consisting of SEQ ID NO: 1 as a template as a primer PUC-G-KNT1 was prepared by PCR using 7 and 8 (SEQ ID NOs: 24 and 25) and inserted between pUC-G NotI sites.
  • a DNA fragment with a NotI recognition sequence added upstream and downstream of SEQ ID NO: 15 was prepared by PCR using the DNA fragment consisting of SEQ ID NO: 2 as a template and primers 9 and 10 (SEQ ID NOs: 26 and 27), and this was prepared by pUC PUC-G-KNT2 was prepared by inserting between the NotI sites of -G.
  • a DNA fragment with a NotI recognition sequence added upstream and downstream of SEQ ID NO: 18 was prepared by PCR using the DNA fragment consisting of SEQ ID NO: 3 as a template and primers 11 and 12 (SEQ ID NOs: 28 and 29).
  • PUC-G-KNT3 was prepared by inserting between the NotI sites of -G.
  • a DNA fragment having a NotI recognition sequence added upstream and downstream of SEQ ID NO: 21 was prepared by PCR using the DNA fragment consisting of SEQ ID NO: 4 as a template and primers 13 and 14 (SEQ ID NOs: 30 and 31).
  • PUC-G-KNT4 was prepared by inserting between the NotI sites of -G.
  • Example 4 Acquisition of transformed yeast, fluorescence measurement Vector pUC-G containing the GFP gene constructed in Example 2 and vectors pUC-G-KNT1, pUC-G- containing the centromere DNA center sequence constructed in Example 3 Komagataela pastoris was transformed with KNT2, pUC-G-KNT3, and pUC-G-KNT4 as follows.
  • Komagataela pastoris ATCC76273 strain was inoculated into 3 ml of YPD medium (1% yeast extract bacto (Difco), 2% polypeptone (Nihon Pharmaceutical Co., Ltd.), 2% ⁇ glucose), shaken overnight at 30 °C, A preculture was obtained. Inoculate 500 ⁇ l of the obtained preculture into 50 ml of YPD medium, shake culture at 30 ° C. until OD600 reaches 1 to 1.5, collect cells (3000 ⁇ g, 10 minutes, 20 ° C.), and then add 250 ⁇ l of 1M DTT Resuspended in 10 ml of 50 mM potassium phosphate buffer, pH 7.5 containing (final concentration 25 mM).
  • YPD medium 1% yeast extract bacto (Difco), 2% polypeptone (Nihon Pharmaceutical Co., Ltd.), 2% ⁇ glucose
  • This suspension was incubated at 30 ° C. for 15 minutes, then collected (3000 ⁇ g, 10 minutes, 20 ° C.), and ice-cooled 50 ml of STM buffer (270 mM sucrose, 10 mM Tris-HCl, 1 mM magnesium chloride, pH7) .5) washed. The washings were collected (3000 ⁇ g, 10 minutes, 4 ° C.), washed again with 25 ml of ice-cold STM buffer, and then collected (3000 ⁇ g, 10 minutes, 4 ° C.). Finally, it was suspended in 250 ⁇ l of ice-cold STM buffer, which was used as a competent cell solution.
  • STM buffer 270 mM sucrose, 10 mM Tris-HCl, 1 mM magnesium chloride, pH7 .5
  • the pUC-G transformant showed a decrease in fluorescence, whereas pUC-G-KNT1, pUC-G- It was confirmed that the fluorescence of KNT2, pUC-G-KNT3, and pUC-G-KNT4 transformants was maintained. This indicates that the nucleic acids consisting of SEQ ID NOs: 12, 15, 18, and 21 exhibit an effect on the stability of the vector in the host.
  • Example 5 Construction of an autonomously replicating vector containing a centromere DNA sequence Primer 3 (SEQ ID NO: 8) using a DNA fragment added with a NotI recognition sequence upstream and downstream of SEQ ID NO: 1 as a DNA fragment consisting of SEQ ID NO: 1 PUC-Z-CEN1 was prepared by inserting it between NotI sites of pUC-Z.
  • a DNA fragment having a NotI recognition sequence added upstream and downstream of SEQ ID NO: 2 was prepared by PCR using the DNA fragment consisting of SEQ ID NO: 2 as a template and primer 4 (SEQ ID NO: 9), and this was prepared as NotI of pUC-Z.
  • PUC-Z-CEN2 was prepared by inserting between sites.
  • a DNA fragment having a NotI recognition sequence added upstream and downstream of SEQ ID NO: 3 was prepared by PCR using the DNA fragment consisting of SEQ ID NO: 3 as a template and primer 5 (SEQ ID NO: 10), and this was prepared as NotI of pUC-Z.
  • PUC-Z-CEN3 was prepared by inserting between sites.
  • a DNA fragment having a NotI recognition sequence added upstream and downstream of SEQ ID NO: 4 was prepared by PCR using the DNA fragment consisting of SEQ ID NO: 4 as a template and primer 6 (SEQ ID NO: 11), and this was prepared as NotI of pUC-Z.
  • PUC-Z-CEN4 was prepared by inserting between sites.
  • SEQ ID NO: 1 has a base sequence shown in SEQ ID NO: 13 upstream of the base sequence shown in SEQ ID NO: 12, and a base sequence complementary to the base sequence shown in SEQ ID NO: 13 downstream of the base sequence shown in SEQ ID NO: 12 ( SEQ ID NO: 14) is designed to be present.
  • SEQ ID NO: 2 has a base sequence shown in SEQ ID NO: 16 upstream of the base sequence shown in SEQ ID NO: 15, and a base sequence complementary to the base sequence shown in SEQ ID NO: 16 downstream of the base sequence shown in SEQ ID NO: 15 ( SEQ ID NO: 17) is designed to be present.
  • SEQ ID NO: 3 has a base sequence shown in SEQ ID NO: 19 upstream of the base sequence shown in SEQ ID NO: 18, and a base sequence complementary to the base sequence shown in SEQ ID NO: 19 downstream of the base sequence shown in SEQ ID NO: 18 ( SEQ ID NO: 20) is designed to be present.
  • SEQ ID NO: 4 has a base sequence shown in SEQ ID NO: 22 upstream of the base sequence shown in SEQ ID NO: 21, and a base sequence complementary to the base sequence shown in SEQ ID NO: 22 downstream of the base sequence shown in SEQ ID NO: 21 ( SEQ ID NO: 23) is designed to be present.
  • a DNA fragment having a NotI recognition sequence added upstream and downstream of the DNA sequence of SEQ ID NO: 13 was prepared by PCR using primers 3 and 17 (SEQ ID NOs: 8 and 35) using the DNA fragment consisting of SEQ ID NO: 1 as a template, This was inserted between NotI sites of pUC-Z to prepare pUC-Z-Comp1.
  • a DNA fragment having a NotI recognition sequence added upstream and downstream of the DNA sequence of SEQ ID NO: 16 was prepared by PCR using primers 4 and 18 (SEQ ID NOs: 9 and 36) using the DNA fragment of SEQ ID NO: 2 as a template, This was inserted between pUC-Z NotI sites to prepare pUC-Z-Comp2.
  • a DNA fragment having a NotI recognition sequence added upstream and downstream of the DNA sequence of SEQ ID NO: 19 was prepared by PCR using primers 5 and 19 (SEQ ID NOs: 10 and 37) using the DNA fragment of SEQ ID NO: 3 as a template, This was inserted between NotI sites of pUC-Z to prepare pUC-Z-Comp3.
  • a DNA fragment having a NotI recognition sequence added upstream and downstream of the DNA sequence of SEQ ID NO: 22 was prepared by PCR using primers 6 and 20 (SEQ ID NOS: 11 and 38) using the DNA fragment consisting of SEQ ID NO: 4 as a template, This was inserted between the NotI sites of pUC-Z to prepare pUC-Z-Comp4.
  • Example 6 Vector pUC-Z-CEN1 including centromere DNA sequences constructed in the vector pUC-Z and Example 5 containing Zeocin (TM) resistance gene constructed in obtaining a first embodiment of the transformed yeast, pUC-Z- CEN2, pUC-Z-CEN3, pUC-Z-CEN4, pUC-Z-Comp1, pUC-Z-Comp2, pUC-Z-Comp3, pUC-Z-Comp4, pUC-Z-Comp1KNT1, pUC-Z-Comp2KNT2, Using pUC-Z-Comp3KNT3 and pUC-Z-Comp4KNT4, Komagataella pastoris was transformed as follows.
  • TM Zeocin
  • Komagataela pastoris ATCC76273 strain was inoculated into 3 ml of YPD medium (1% yeast extract bacto (Difco), 2% polypeptone (Nihon Pharmaceutical Co., Ltd.), 2% ⁇ glucose), shaken overnight at 30 °C, A preculture was obtained. Inoculate 500 ⁇ l of the obtained preculture into 50 ml of YPD medium, shake culture at 30 ° C. until OD600 reaches 1 to 1.5, collect cells (3000 ⁇ g, 10 minutes, 20 ° C.), and then add 250 ⁇ l of 1M DTT Resuspended in 10 ml of 50 mM potassium phosphate buffer, pH 7.5 containing (final concentration 25 mM).
  • YPD medium 1% yeast extract bacto (Difco), 2% polypeptone (Nihon Pharmaceutical Co., Ltd.), 2% ⁇ glucose
  • This suspension was incubated at 30 ° C. for 15 minutes, then collected (3000 ⁇ g, 10 minutes, 20 ° C.), and ice-cooled 50 ml of STM buffer (270 mM sucrose, 10 mM Tris-HCl, 1 mM magnesium chloride, pH7) .5) washed. The washings were collected (3000 ⁇ g, 10 minutes, 4 ° C.), washed again with 25 ml of ice-cold STM buffer, and then collected (3000 ⁇ g, 10 minutes, 4 ° C.). Finally, it was suspended in 250 ⁇ l of ice-cold STM buffer, which was used as a competent cell solution.
  • STM buffer 270 mM sucrose, 10 mM Tris-HCl, 1 mM magnesium chloride, pH7 .5
  • YPDZeocin TM agar plate 1% yeast extract bacto (Difco), 2% polypeptone (Nihon Pharmaceutical), 2% glucose, 1.5% agarose, 0.01% Zeocin ( ( Trademark) (manufactured by Life Technologies) was applied to 100 ⁇ l, strains grown by static culture at 30 ° C. for 3 days were selected, and transformation efficiency (number of colonies per 1 ⁇ g of vector, cfu / ⁇ g) was calculated ( table 1).
  • Example 7 Confirmation of Plasmid Retention For each of the 12 types of transformed yeast obtained in Example 6, plasmid solutions were prepared from 10 strains of colonies using Easy Yeast Plasmid Isolation Kit (Clontech). Subsequently, when the obtained plasmid solution was introduced into E.
  • coli HST08 Premium competent cell manufactured by Takara Bio Inc.
  • Samples derived from transformed yeast are all LBAmp-selective agar plates (1% Trypton (Nacalai Tesque), 1% sodium chloride, 0.5% yeast extract bacto (Difco), 0.01% ampicillin sodium (Wako Pure Chemicals) E.
  • Example 8 Construction of vector containing Zeocin TM resistance gene and regulatory sequence HindIII recognition sequence, NotI recognition sequence upstream of Tmox sequence (SEQ ID NO: 82), which is the MOX terminator of Hansenula yeast, from upstream to downstream BamHI recognition sequence, SpeI recognition sequence, MunI recognition sequence, BglII recognition sequence, XbaI recognition sequence, and DNA fragment added with XbaI recognition sequence and EcoRI recognition sequence downstream from upstream, downstream of Tmox sequence, Amplified by PCR using primers 23 and 24 (SEQ ID NOS: 74 and 75) using the chromosomal DNA of polymorpha 8V (ATCC34438) as a template, and this was amplified by HindIII- of pUC19 (Takara Bio, Code No. 3219) PUC_Tmox was prepared by inserting between EcoRI sites.
  • SEQ ID NO: 82 which is the MOX terminator of Hansenula yeast
  • Primers 27 and 28 (SEQ ID NOs: 78 and 79) were used with DNA fragments with EcoRI recognition sequences added upstream and downstream of HpPgap (SEQ ID NO: 83), using chromosomal DNA of Ogata Air polymorpha 8V (ATCC34438) as a template. This was amplified by PCR and inserted between the MunI sites of pUC_Tmox to prepare pUC_HpPgap_Tmox. Since EcoRI cleavage ends and MunI cleavage ends can be ligated, it is possible to insert the DNA fragment added with EcoRI recognition sequence between the MunI sites of pUC_Tmox. The Ligated site is not cleaved by EcoRI.
  • Primers 25 and 26 using DNA fragments with BamHI recognition sequences added upstream and downstream of HpPgap (SEQ ID NO: 83), which is the GAP promoter of Hansenula yeast, using the chromosomal DNA of Ogata Air polymorpha 8V (ATCC34438) as a template. 76 and 77), and this was inserted between BamHI sites of pUC_HpPgap_Tmox to prepare pUC_HpPgap_HpPgap_Tmox.
  • a DNA fragment comprising an EcoRI recognition sequence upstream and downstream of a Zeocin TM resistance gene (base sequence from positions 681 to 1535 of SEQ ID NO: 5), a DNA comprising the base sequence of positions 681 to 1535 of SEQ ID NO: 5
  • pUC-Z2 is a vector comprising a nucleotide sequence consisting of SEQ ID NO: 84 between the HindIII and EcoRI sites of pUC19.
  • Example 9 Identification of autonomous replication sequences
  • the autonomous replication sequences in Comp2 and Comp3 were identified.
  • a DNA fragment comprising restriction enzyme recognition sequences upstream and downstream of each base sequence shortened by about 300 bp on the basis of about 1-2400 bp of Comp2 is a DNA comprising SEQ ID NO: 2.
  • a fragment was prepared by PCR using a primer as a template, and inserted into the restriction enzyme site of pUC-Z2, to prepare a vector.
  • Table 2 shows the sequences inserted into the vectors, the sequences of the primers used to amplify the fragments, and the restriction enzymes used to insert the amplified sequences into the vectors.
  • a DNA fragment containing a restriction enzyme recognition sequence upstream and downstream of the base sequence shortened by about 300 bp from 1-2400 bp is converted into a DNA comprising SEQ ID NO: 3.
  • a fragment was prepared by PCR using a primer as a template, and inserted into the restriction enzyme site of pUC-Z2, to prepare a vector.
  • Table 2 shows the sequences inserted into the vectors, the sequences of the primers used to amplify the fragments, and the restriction enzymes used to insert the amplified sequences into the vectors.
  • Comp2 SEQ ID NO: 16 1-111 (Comp2_1-111), 84-213 (Comp2_84-213), 191-291 (Comp2_191-291), 84-2699 (Comp2_84-2699)
  • a DNA fragment containing a restriction enzyme recognition sequence upstream and downstream of the base sequence is amplified by PCR using a DNA fragment consisting of SEQ ID NO: 2 as a template and inserted into a restriction enzyme recognition site of pUC-Z2.
  • a vector was prepared. Table 4 below shows the sequences inserted into the vectors, the sequences of the primers used to amplify the fragments, and the restriction enzymes used to insert the amplified sequences into the vectors.
  • Comp3_480-2699 has a very low transformation efficiency, which means that there is no autonomously replicating sequence in Comp3 other than the autonomously replicating sequence in the base sequence at positions 383-600 of SEQ ID NO: 19 (SEQ ID NO: 42). Suggests.
  • Example 10 Confirmation of transformation efficiency when autonomously replicating sequences and other sequences are combined In order to examine the transformation efficiency of vectors containing autonomously replicating sequences and other sequences, the following vectors were prepared.
  • a DNA fragment having a NotI recognition sequence added upstream and downstream of SEQ ID NO: 1 was prepared by PCR using the DNA fragment consisting of SEQ ID NO: 1 as a template and primer 3 (SEQ ID NO: 8), and this was pUC-Z2-ARS2 PUC-Z2-ARS2-CEN1 was prepared by inserting between NotI sites.
  • a DNA fragment having a NotI recognition sequence added upstream and downstream of SEQ ID NO: 3 was prepared by PCR using the DNA fragment consisting of SEQ ID NO: 3 as a template and primer 5 (SEQ ID NO: 10), and this was prepared as pUC-Z2-ARS2 PUC-Z2-ARS2-CEN3 was prepared by inserting between NotI sites.
  • a DNA fragment having a NotI recognition sequence added upstream and downstream of SEQ ID NO: 4 was prepared by PCR using the DNA fragment consisting of SEQ ID NO: 4 as a template and primer 6 (SEQ ID NO: 11), and this was pUC-Z2-ARS2 PUC-Z2-ARS2-CEN4 was prepared by inserting between NotI sites.
  • a DNA fragment having a NotI recognition sequence added upstream and downstream of the DNA sequence of SEQ ID NO: 13 was prepared by PCR using primers 3 and 17 (SEQ ID NOs: 8 and 35) using the DNA fragment consisting of SEQ ID NO: 1 as a template, This was inserted between NotI sites of pUC-Z2-ARS2 to prepare pUC-Z2-ARS2-Comp1.
  • a DNA fragment having a NotI recognition sequence added upstream and downstream of the DNA sequence of SEQ ID NO: 19 was prepared by PCR using primers 5 and 19 (SEQ ID NOs: 10 and 37) using the DNA fragment of SEQ ID NO: 3 as a template, This was inserted between NotI sites of pUC-Z2-ARS2 to prepare pUC-Z2-ARS2-Comp3.
  • a DNA fragment having a NotI recognition sequence added upstream and downstream of the DNA sequence of SEQ ID NO: 22 was prepared by PCR using primers 6 and 20 (SEQ ID NOS: 11 and 38) using the DNA fragment consisting of SEQ ID NO: 4 as a template, This was inserted between NotI sites of pUC-Z2-ARS2 to prepare pUC-Z2-ARS2-Comp4.
  • a DNA fragment having a NotI recognition sequence added upstream and downstream of a DNA sequence having the base sequence shown in SEQ ID NO: 19 upstream of the base sequence shown in SEQ ID NO: 18, a DNA fragment consisting of SEQ ID NO: 3 as a template, primer 5 and PUC-Z2-ARS2-Comp3KNT3 was prepared by PCR using 12 (SEQ ID NOs: 10 and 29) and inserted between NotI sites of pUC-Z2-ARS2.
  • Example 11 Confirmation of Plasmid Stability
  • the transformed yeast obtained in Example 6 was inoculated into 3 ml of YPD medium and cultured overnight at 30 ° C. with shaking.
  • 3 ⁇ l of this culture solution was inoculated into a new 3 ml of YPD medium and cultured overnight at 30 ° C. with shaking.
  • YPD agar plate 1% yeast extract bacto (Difco), 2% polypeptone (Nippon Pharmaceutical), 2% glucose, 1.5% agarose.
  • 96 strains grown by static culture at 30 ° C. for 3 days were selected, inoculated on YPD agar plates and YPDZeocin (trademark) selected agar plates, and statically cultured at 30 ° C. overnight.
  • pUC-Z-Comp1KNT1 or pUC-Z-Comp2KNT2 or pUC was compared with a sample derived from yeast transformed with pUC-Z-Comp1, pUC-Z-Comp2, pUC-Z-Comp3 or pUC-Z-Comp4.
  • the yeast-derived samples transformed with -Z-Comp3KNT3 or pUC-Z-Comp4KNT4 clearly had a large number of colonies that grew on both plates (Table 7). This indicates that as shown in Example 4, SEQ ID NOs: 12, 15, 18, and 21 have an effect on the stability of the vector.
  • Example 7 when a plasmid was prepared from the grown yeast and introduced into E. coli HST08 Premium competent cell, LBAmp selective agar plate (1% Trypton (manufactured by Nacalai Tesque), 1% ⁇ sodium chloride) , 0.5% yeast extract bacto (Difco), 0.01% ampicillin sodium (Wako Pure Chemical Industries)) was confirmed to have emerged, and a plasmid was prepared from the E. coli colony However, it has been confirmed that the prepared plasmid is the same as the vector introduced into yeast.
  • Example 12 Confirmation of plasmid stability when autonomously replicating sequences and other sequences are combined pUC-Z2-ARS2, pUC-Z2-ARS2-CEN1, pUC-Z2-ARS2-CEN4, pUC prepared in Example 10 Transformed yeast was prepared according to Example 6 using -Z2-ARS2-Comp1, pUC-Z2-ARS2-Comp4, pUC-Z2-ARS2-Comp1KNT1, and pUC-Z2-ARS2-Comp4KNT4.
  • the yeast-derived samples transformed with pUC-Z2-ARS2-Comp1KNT1 or pUC-Z2-ARS2-Comp4KNT4 clearly had a large number of colonies grown on both plates. As shown in Example 4, this indicates that SEQ ID NOs: 12 and 21 are effective for the stability of the vector.
  • the yeast-derived sample transformed with pUC-Z2-ARS2-CEN1 or pUC-Z2-ARS2-CEN4 had a larger number of colonies grown on both plates. This indicates that, as shown in Examples 4 and 11, a special stability effect is exhibited by the complementary base sequence upstream and downstream of the centromere DNA center sequence. Even in the subculture in the absence, the plasmid vector is stably maintained by having the centromere DNA sequence.
  • Example 13 Confirmation that pUC-Z2 vector is equivalent to pUC-Z vector Using pUC-Z2 prepared in Example 8 instead of pUC-Z, a vector was prepared according to Example 5, and When tested according to Examples 6 to 7 and Example 11, all of the results obtained using pUC-Z2 were the same as those obtained using pUC-Z.
  • Example 14 Confirmation that positions 681 to 1535 of SEQ ID NO: 5 and SEQ ID NO: 5 are equivalent. Performed using the nucleotide sequence of positions 681 to 1535 of SEQ ID NO: 5 instead of the base sequence of SEQ ID NO: 5. Vectors were prepared according to Examples 1 and 5, and these were tested according to Examples 6 to 7 and Example 11. As a result, even when the base sequence from positions 681 to 1535 of SEQ ID NO: 5 was used, SEQ ID NO: 5 The same result as that obtained using the base sequence was obtained.

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Mycology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

 本発明は、宿主細胞での安定性が向上したベクターを提供することを解決すべき課題とする。 本発明は、コマガタエラ・パストリスの染色体DNAのセントロメアDNA配列に含まれる配列番号1~4、12~23、41、42、85、又は86に示す塩基配列を含む、宿主細胞において安定的に保持されるベクターを提供する。本発明のベクターは、好ましくは、配列番号12、15、18、又は21に示す塩基配列の上流及び下流に相互に相補的な塩基配列を含む、自律複製型ベクターである。

Description

セントロメアDNA配列を含むベクター及びその用途
 本発明は、酵母のセントロメアDNA配列を含むベクター、及びその用途に関する。
 近年、次世代シーケンサーの開発等によってヒトだけでなく多くの生物のゲノムが解読され、その他オミクス解析による知見も合わせて塩基配列だけでなくゲノム構造、遺伝子発現情報、エピジェネティックな変化、タンパク質発現情報、細胞内外代謝物変化等も理解できるようになった。産業利用目的でそれらの生物を人為的に操作するために、古くから形質転換による遺伝子組換え、例えば遺伝子断片等のゲノム組込みや自律複製型ベクターが開発されてきており、最近では大規模ゲノム編集、ゲノムシャッフリング、人工染色体といった取り組みが行われている。しかし、ゲノム組込み等のゲノム編集は目的の位置に挿入されない課題やゲノム構造を大きく変化させてしまうことによる予期せぬ影響が懸念されている。また、自律複製型ベクターは大腸菌等の原核生物においては広く利用されているが、酵母などの真核生物においては構築が煩雑であることや、多くの真核生物用自律複製型ベクターにはセントロメアDNA配列が含まれないため不安定であることが課題となっている。
 そこで出芽酵母(Saccharomyces cerevisiae)においては、この課題を解決するためにセントロメアDNA配列の探索が行われ、DNA配列125bpが特定された(非特許文献1)。また分裂酵母(Schizosaccharomyces pombe)においても、長大なセントロメアDNA配列が特定されている(非特許文献2)。セントロメアDNA配列を含んだ自律複製型ベクターは宿主に応じてプラスミドの状態として用いられるだけでなく、テロメアDNAを付加した人工染色体型として用いる試みがなされている。しかし、宿主を超えてのセントロメアDNA配列の利用は染色体分配を構成するタンパク質等の違いから非常に難しい。古くから産業利用されてきたコマガタエラ・パストリス(Komagataella pastoris)においても自律複製配列はいくつか報告されているものの、セントロメアDNA配列の特定までには至っていなかった。
Trends Genet. 1990; 6: 150-154 J Cell Biol. 1991 Jan; 112(2): 191-201.
 本発明は、宿主細胞での安定性が向上したベクターを提供することを解決すべき課題とする。このようなベクターは、産業利用目的での宿主改良等の各種用途に有用であると期待される。
 本発明者らは、上記課題を解決すべく、コマガタエラ・パストリスの染色体DNAの塩基配列の網羅的解析により、コマガタエラ・パストリスが持つ4つの染色体のそれぞれについてセントロメアを構成するDNA配列を特定した。そして該配列又はその一部を含むベクターが宿主において安定的に保持されることを確認し、本発明を完成するに至った。
 すなわち、本発明は以下の発明を包含する。
(1)
 以下の(a)~(d)のいずれかの塩基配列;
 (a)配列番号12、15、18、又は21に示す塩基配列;
 (b)配列番号12、15、18、又は21に示す塩基配列に相補的な塩基配列からなる核酸とストリンジェントな条件下でハイブリダイズする核酸の塩基配列;
 (c)配列番号12、15、18、又は21に示す塩基配列と85%以上の配列同一性を有する塩基配列;
 (d)配列番号12、15、18、又は21に示す塩基配列において、1もしくは複数個の塩基配列が置換、欠失、挿入及び/又は付加した塩基配列;
を含むベクター。
(2)
 前記(a)~(d)のいずれかの塩基配列の上流と下流に位置する塩基配列が、以下の(e)~(g)のいずれかの塩基配列の対;
 (e)上流の塩基配列と下流の塩基配列とが相補的な塩基配列である対;
 (f)上流の塩基配列と下流の塩基配列とがストリンジェントな条件下で相互にハイブリダイズする核酸の塩基配列である対;
 (g)上流の塩基配列と下流の塩基配列とが一方の相補的な塩基配列と85%以上の配列同一性を有する塩基配列である対;
をそれぞれ含む、(1)に記載のベクター。
(3)
 前記(a)~(d)のいずれかに記載の塩基配列のGC含有率を1としたときの、前記(e)~(g)のいずれかに記載の上流及び/又は下流の塩基配列のGC含有率が0.8以上であり、1.2以下である(2)に記載のベクター。
(4)
 前記(e)~(g)のいずれかの塩基配列の対において、上流及び/又は下流の塩基配列のGC含有率が41%以下である(2)又は(3)に記載のベクター。
(5)
 前記(e)~(g)のいずれかの塩基配列の対において、上流及び下流の塩基配列の少なくとも一方が、コマガタエラ属酵母染色体DNAの塩基配列である、(2)~(4)のいずれか1つに記載のベクター。
(6)
 前記(a)~(d)のいずれかの塩基配列、並びに、前記(e)~(g)のいずれかの上流及び下流の塩基配列から選択される少なくとも1つの塩基配列を含む部位が、centromere protein(CENP)と結合能を有する(1)~(5)のいずれか1つに記載のベクター。
(7)
 前記(e)~(g)のいずれかの塩基配列の対において、上流及び下流の塩基配列がそれぞれ2800塩基以下の塩基配列である、(2)~(6)のいずれか1つに記載のベクター。
(8)
 前記(e)~(g)のいずれかの塩基配列の対において、上流及び下流の塩基配列がそれぞれ1900~2800塩基の塩基配列である、(7)に記載のベクター。
(9)
 前記(e)~(g)のいずれかの塩基配列の対において、上流又は下流の塩基配列が、以下の(h)~(k)のいずれかの塩基配列;
 (h)配列番号13、16、19、又は22に示す塩基配列;
 (i)配列番号13、16、19、又は22に示す塩基配列に相補的な塩基配列からなる核酸とストリンジェントな条件下でハイブリダイズする核酸の塩基配列;
 (j)配列番号13、16、19、又は22に示す塩基配列と85%以上の配列同一性を有する塩基配列; 
 (k)配列番号13、16、19、又は22に示す塩基配列において、1もしくは複数個の塩基配列が置換、欠失、挿入及び/又は付加した塩基配列;
である、(2)~(8)のいずれか1つに記載のベクター。
(10)
 前記(e)~(g)のいずれかの塩基配列の対において、上流又は下流の塩基配列が、以下の(l)~(o)のいずれかの塩基配列;
 (l)配列番号14、17、20、又は23に示す塩基配列;
 (m)配列番号14、17、20、又は23に示す塩基配列に相補的な塩基配列からなる核酸とストリンジェントな条件下でハイブリダイズする核酸の塩基配列;
 (n)配列番号14、17、20、又は23に示す塩基配列と85%以上の配列同一性を有する塩基配列; 
 (o)配列番号14、17、20、又は23に示す塩基配列において、1もしくは複数個の塩基配列が置換、欠失、挿入及び/又は付加した塩基配列;
である、(2)~(8)のいずれか1つに記載のベクター。
(11)
 前記(e)~(g)のいずれかの塩基配列の対において、上流及び下流の塩基配列が、以下の(p)~(s)のいずれかの塩基配列の対;
 (p)上流に配列番号13に示す塩基配列、及び、下流に配列番号14に示す塩基配列である対;
 (q)上流に配列番号16に示す塩基配列、及び、下流に配列番号17に示す塩基配列である対;
 (r)上流に配列番号19に示す塩基配列、及び、下流に配列番号20に示す塩基配列である対;
 (s)上流に配列番号22に示す塩基配列、及び、下流に配列番号23に示す塩基配列である対;
をそれぞれ含む、(2)~(8)のいずれか1つに記載のベクター。
(12)
 以下の(t)~(w)のいずれかの塩基配列;
 (t)配列番号41、42、85又は86に示す塩基配列;
 (u)配列番号41、42、85又は86に示す塩基配列に相補的な塩基配列からなる核酸とストリンジェントな条件下でハイブリダイズする核酸の塩基配列;
 (v)配列番号41、42、85又は86に示す塩基配列と85%以上の配列同一性を有する塩基配列;
 (w)配列番号41、42、85又は86に示す塩基配列において、1もしくは複数個の塩基が置換、欠失、挿入及び/又は付加した塩基配列;
を含む、(1)~(11)のいずれか1つに記載のベクター。
(13)
 さらにAutonomous replication sequence(ARS)を含む(1)~(12)のいずれか1つに記載のベクター。
(14)
 前記(a)~(d)のいずれかの塩基配列の、上流(5’末端側)及び/又は下流(3’末端側)に、前記(h)~(o)のいずれかの塩基配列、より好ましくは前記(h)及び(l)のいずれかの塩基配列、の少なくとも一つを含む、(1)に記載のベクター。
(15)
 自律複製型ベクターである、(1)~(14)のいずれか1つに記載のベクター。
(16)
 前記自律複製型ベクターが、前記(a)~(d)のいずれかの塩基配列が由来する生物種とは異なる生物種に由来するAutonomous replication sequence(ARS)及び/又はセントロメアDNA配列を更に含む、(15)に記載のベクター。
(17)
以下の(t)~(w)のいずれかの塩基配列;
 (t)配列番号41、42、85又は86に示す塩基配列;
 (u)配列番号41、42、85又は86に示す塩基配列に相補的な塩基配列からなる核酸とストリンジェントな条件下でハイブリダイズする核酸の塩基配列;
 (v)配列番号41、42、85又は86に示す塩基配列と85%以上の配列同一性を有する塩基配列;
 (w)配列番号41、42、85又は86に示す塩基配列において、1もしくは複数個の塩基が置換、欠失、挿入及び/又は付加した塩基配列;
を含むベクター。
(18)
 以下の(h)~(k)のいずれかの塩基配列;
 (h)配列番号13、16、19、又は22に示す塩基配列;
 (i)配列番号13、16、19、又は22に示す塩基配列に相補的な塩基配列からなる核酸とストリンジェントな条件下でハイブリダイズする核酸の塩基配列;
 (j)配列番号13、16、19、又は22に示す塩基配列と85%以上の配列同一性を有する塩基配列;
 (k)配列番号13、16、19、又は22に示す塩基配列において、1もしくは複数個の塩基が置換、欠失、挿入及び/又は付加した塩基配列;
を含むベクター。
(19)
 以下の(l)~(o)のいずれかの塩基配列;
 (l)配列番号14、17、20、又は23に示す塩基配列;
 (m)配列番号14、17、20、又は23に示す塩基配列に相補的な塩基配列からなる核酸とストリンジェントな条件下でハイブリダイズする核酸の塩基配列;
 (n)配列番号14、17、20、又は23に示す塩基配列と85%以上の配列同一性を有する塩基配列;
 (o)配列番号14、17、20、又は23に示す塩基配列において、1もしくは複数個の塩基が置換、欠失、挿入及び/又は付加した塩基配列;
を含むベクター。
(20)
 以下の(a)~(d)のいずれかの塩基配列;
 (a)配列番号12、15、18、又は21に示す塩基配列;
 (b)配列番号12、15、18、又は21に示す塩基配列に相補的な塩基配列からなる核酸とストリンジェントな条件下でハイブリダイズする核酸の塩基配列;
 (c)配列番号12、15、18、又は21に示す塩基配列と85%以上の配列同一性を有する塩基配列;
 (d)配列番号12、15、18、又は21に示す塩基配列において、1もしくは複数個の塩基配列が置換、欠失、挿入及び/又は付加した塩基配列;
を含まない、
(17)~(19)のいずれか1つに記載のベクター。
(21)
 (1)~(16)のいずれかのベクターではない、(17)~(19)のいずれか1つに記載のベクター。
(22)
 配列番号1~4のいずれかに示す塩基配列を含むベクター。
(23)
 (1)~(22)のいずれか1つに記載のベクターを細胞に導入する工程を含む、細胞の形質転換法。
(24)
 (1)~(23)のいずれか1つに記載のベクターにより細胞を形質転換して得られる形質転換体。
(25)
 細胞が酵母又は大腸菌である、(23)に記載の形質転換法又は(24)に記載の形質転換体。
(26)
 細胞がメタノール資化性酵母である、(25)に記載の形質転換法又は形質転換体。
(27)
 メタノール資化性酵母がコマガタエラ属酵母又はオガタエア属酵母である、(26)に記載の形質転換法又は形質転換体。
 本発明において、2つの核酸がストリンジェントな条件下でハイブリダイズするとは例えば以下の意味である。例えば、核酸Xを固定化したフィルターを用いて、0.7~1.0MのNaCl存在下、65℃で核酸Yとハイブリダイゼーションを行った後、2倍濃度のSSC溶液(1倍濃度のSSC溶液の組成は、150mM塩化ナトリウム、15mMクエン酸ナトリウムよりなる)を用い、65℃の条件下でフィルターを洗浄することにより、核酸Yがフィルター上に結合した核酸として取得できる場合に、核酸Yを「核酸Xとストリンジェントな条件下でハイブリダイズする核酸」と言うことができる。或いは核酸Xと核酸Yとが「ストリンジェントな条件下で相互にハイブリダイズする」ということができる。核酸Yは好ましくは65℃で0.5倍濃度のSSC溶液で洗浄、より好ましくは65℃で0.2倍濃度のSSC溶液で洗浄、更に好ましくは65℃で0.1倍濃度のSSC溶液で前記フィルターを洗浄することによりフィルター上に結合した核酸として取得できる核酸である。基準となる核酸Xは、コロニーまたはプラーク由来の核酸Xであることができる。
 本発明において塩基配列の配列同一性は、当業者に周知の方法、配列解析ソフトウェア等を使用して求めることができる。例えば、BLASTアルゴリズムのblastnプログラムやFASTAアルゴリズムのfastaプログラムが挙げられる。本発明において、ある評価対象塩基配列の、塩基配列Zとの「配列同一性」とは、塩基配列Zと評価対象塩基配列とを整列(アラインメント)させ、必要に応じてギャップを導入して、両者の塩基一致度が最も高くなるようにしたときの、ギャップ部分も含んだ塩基配列において同一部位に同一の塩基が出現する頻度を%で表示した値である。
 本発明において塩基の置換、欠失、挿入及び/又は付加に関する「1もしくは複数個」とは、例えば、前記(d)の塩基配列では、配列番号12、15、18、21に示す塩基配列において、1~500個、1~400個、1~300個、1~200個、1~190個、1~160個、1~130個、1~100個、1~75個、1~50個、1~25個、1~20個、1~15個、1~10個、1~7個、1~5個、1~4個、1~3個、又は1もしくは2個をいう。
 一方、前記(k)の塩基配列又は(o)の塩基配列では、配列番号13、14、16、17、19、20、22、23に示す塩基配列において、例えば、1~1500個、1~1000個、1~500個、1~400個、1~395個、1~380個、1~350個、1~325個、1~300個、1~295個、1~250個、1~225個、1~200個、1~175個、1~150個、1~125個、1~100個、1~75個、1~50個、1~25個、1~20個、1~15個、1~10個、1~7個、1~5個、1~4個、1~3個、又は1もしくは2個をいう。
 一方、前記(w)の塩基配列では、配列番号41又は85 に示す塩基配列において、例えば、1~100個、1~90個、1~80個、1~70個、1~60個、1~50個、1~40個、1~30個、1~25個、1~20個、1~15個、1~10個、1~7個、1~5個、1~4個、1~3個、又は1もしくは2個をいう。また、前記(w)の塩基配列では、配列番号42又は86に示す塩基配列において、例えば、1~210個、1~200個、1~190個、1~180個、1~170個、1~160個、1~150個、1~140個、1~130個、1~120個、1~110個、1~100個、1~90個、1~80個、1~70個、1~60個、1~50個、1~40個、1~30個、1~25個、1~20個、1~15個、1~10個、1~7個、1~5個、1~4個、1~3個、又は1もしくは2個をいう。
 本発明において「核酸」とは、「ポリヌクレオチド」と呼ぶこともでき、DNA又はRNAを指し、典型的にはDNAを指す。
 本明細書は本願の優先権の基礎となる日本国特許出願番号2014-245429号の開示内容を包含する。
 本発明のベクターは、宿主において安定的に保持されることができる。さらに、本発明のベクターは、宿主において増幅させることができる。したがって、目的化合物の生産等の産業利用目的に応じて、本発明のベクターに更に目的化合物をコードする塩基配列を組み込んだ目的化合物生産用ベクターを用いて、宿主細胞を形質転換することにより、該化合物を効率的に生産させることが可能となる。
 以下、本発明を、好ましい実施形態を用いて詳細に説明する。
1. セントロメアDNA配列を含むベクター
 本発明者らは、コマガタエラ・パストリスの4本の染色体DNAの塩基配列(EMBL (The European Molecular Biology Laboratory) ACCESSION No. FR839628~FR839631、J. Biotechnol. 154 (4), 312-320 (2011))の網羅的解析により、配列番号1、2、3及び4に示す塩基配列がコマガタエラ・パストリスの4本の染色体DNAに各々分かれて存在していることを見出した。
 本発明者らは更に配列番号1、2、3及び4に示す塩基配列が以下の特徴的な構造を有することを見出している。
 配列番号1の塩基配列は、配列番号12に示す塩基配列の上流(5’末端側)に配列番号13に示す塩基配列が連結し、また配列番号12に示す塩基配列の下流(3’末端側)に配列番号13に示す塩基配列と相補的な、配列番号14に示す塩基配列が連結した構造を有する。
 配列番号2の塩基配列は、配列番号15に示す塩基配列の上流(5’末端側)に配列番号16に示す塩基配列が連結し、また配列番号15に示す塩基配列の下流(3’末端側)に配列番号16に示す塩基配列と相補的な、配列番号17に示す塩基配列が連結した構造を有する。
 配列番号3の塩基配列は、配列番号18に示す塩基配列の上流(5’末端側)に配列番号19に示す塩基配列が連結し、また配列番号18に示す塩基配列の下流(3’末端側)に配列番号19に示す塩基配列と相補的な、配列番号20に示す塩基配列が連結した構造を有する。
 配列番号4の塩基配列は、配列番号21に示す塩基配列の上流(5’末端側)に配列番号22に示す塩基配列が連結し、また配列番号21に示す塩基配列の下流(3’末端側)に配列番号22に示す塩基配列と相補的な、配列番号23に示す塩基配列が連結した構造を有する。
 本発明者らは、上記知見及び実施例に示す実験結果をもとに、本発明のベクターを完成させるに至った。
1.1.本発明のベクターの特徴
 一態様において、本発明のベクターは、少なくとも以下の(a)~(d)のいずれかの塩基配列;
 (a)配列番号12、15、18、又は21に示す塩基配列;
 (b)配列番号12、15、18、又は21に示す塩基配列に相補的な塩基配列からなる核酸とストリンジェントな条件下でハイブリダイズする核酸の塩基配列;
 (c)配列番号12、15、18、又は21に示す塩基配列と85%以上、好ましくは90%以上、より好ましくは95%以上、さらに好ましくは97%以上、最も好ましくは99%以上の配列同一性を有する塩基配列;
 (d)配列番号12、15、18、又は21に示す塩基配列において、1もしくは複数個の塩基が置換、欠失、挿入及び/又は付加した塩基配列;
を含む。
 他の態様において、本発明のベクターは、以下の(t)~(w)のいずれかの塩基配列;
 (t)配列番号41若しくは42に示す塩基配列、又は配列番号41若しくは42に示す塩基配列に相補的な配列である配列番号85若しくは86に示す塩基配列、好ましくは配列番号41若しくは42に示す塩基配列;
 (u)配列番号41、42、85、又は86、好ましくは配列番号41又は42に示す塩基配列に相補的な塩基配列からなる核酸とストリンジェントな条件下でハイブリダイズする核酸の塩基配列;
 (v)配列番号41、42、85又は86、好ましくは配列番号41又は42に示す塩基配列と85%以上、好ましくは90%以上、より好ましくは95%以上、さらに好ましくは97%以上、最も好ましくは99%以上の配列同一性を有する塩基配列;
 (w)配列番号41、42、85又は86、好ましくは配列番号41又は42に示す塩基配列において、1もしくは複数個の塩基が置換、欠失、挿入及び/又は付加した塩基配列;
を含む。
 本態様に係るベクターは、好ましくは、自律複製能を有するベクターとして利用可能である。
 (w)の塩基配列の例として、配列番号41又は85或いは前記(u)又は(v)(ただし配列番号41、42、85又は86に示す塩基配列が、配列番号41又は85に示す塩基配列である場合)、好ましくは配列番号41或いは前記(u)又は(v)(ただし配列番号41、42、85又は86に示す塩基配列が、配列番号41に示す塩基配列である場合)、特に好ましくは配列番号41の塩基配列のうち、第N塩基から開始する連続したm個の塩基からなる部分塩基配列(ここでmは5塩基以上、好ましくは10塩基以上かつ(111-N+1)塩基以下の整数であり、Nは1~107、好ましくは1~102までの整数)が挙げられる。mは、例えば、5、6、7、8、9、10、11、12…(111-N+1)のうちいずれか1つであってよく、Nは1、2、3、4、…107のうちいずれか1つであってよい。同様に、(w)の塩基配列の例として、配列番号42又は86或いは前記(u)又は(v)(ただし配列番号41、42、85又は86に示す塩基配列が、配列番号42又は86に示す塩基配列である場合)、好ましくは配列番号42或いは前記(u)又は(v)(ただし配列番号41、42、85又は86に示す塩基配列が、配列番号42に示す塩基配列である場合)、特に好ましくは配列番号42の塩基配列のうち、第N'塩基から開始する連続したm'個の塩基からなる部分塩基配列(ここでm'は5塩基以上、好ましくは10塩基以上かつ(218-N'+1)塩基以下の整数であり、N'は1~214、好ましくは1~209までの整数)が挙げられる。m'は、例えば、5、6、7、8、9、10、11、12…(218-N'+1)のうちいずれか1つであってよく、N'は1、2、3、4、…214のうちいずれか1つであってよい。
 他の態様において、本発明のベクターは、以下の(h)~(k)のいずれかの塩基配列;
 (h)配列番号13、16、19、又は22に示す塩基配列;
 (i)配列番号13、16、19、又は22に示す塩基配列に相補的な塩基配列からなる核酸とストリンジェントな条件下でハイブリダイズする核酸の塩基配列;
 (j)配列番号13、16、19、又は22に示す塩基配列と85%以上、好ましくは90%以上、より好ましくは95%以上、さらに好ましくは97%以上、最も好ましくは99%以上の配列同一性を有する塩基配列;
 (k)配列番号13、16、19、又は22に示す塩基配列において、1もしくは複数個の塩基が置換、欠失、挿入及び/又は付加した塩基配列;
を含む。
 本態様に係るベクターは、好ましくは、自律複製能を有するベクターとして利用可能である。
 さらに他の態様において、本発明のベクターは、以下の(l)~(o)のいずれかの塩基配列;
 (l)配列番号14、17、20、又は23に示す塩基配列;
 (m)配列番号14、17、20、又は23に示す塩基配列に相補的な塩基配列からなる核酸とストリンジェントな条件下でハイブリダイズする核酸の塩基配列;
 (n)配列番号14、17、20、又は23に示す塩基配列と85%以上、好ましくは90%以上、より好ましくは95%以上、さらに好ましくは97%以上、最も好ましくは99%以上の配列同一性を有する塩基配列;
 (o)配列番号14、17、20、又は23に示す塩基配列において、1もしくは複数個の塩基が置換、欠失、挿入及び/又は付加した塩基配列;
を含む。
 本態様に係るベクターは、好ましくは、自律複製能を有するベクターとして利用可能である。
 本発明のベクターは以下の (特徴1)~(特徴2)のうち好ましくは1つ、より好ましくは2つを備える。
(特徴1) 本発明のベクター、例えば上記(a)~(d)のいずれかの塩基配列を含むベクターは、宿主において安定的に保持されることができる。「安定的に保持される」とは、宿主細胞に導入された場合に、該宿主細胞の継代培養を経ても宿主細胞内に保持されることを意味する。本発明のベクターは、例えば上記(a)~(d)のいずれかの塩基配列を含まないベクターに対して、安定的に保持されることができる。ベクターが安定的に保持されるかは、限定されないが、例えば実施例4に記載の様に、ベクターにレポーター遺伝子を導入し、細胞分裂に伴うレポーター遺伝子の発現強度の変化を測定することで確かめることができる。或いは、実施例11又は12に記載の様に、マーカー遺伝子を含むベクターを形質転換した宿主を非選択下で継代培養した後に、マーカー遺伝子が維持される頻度を調べることで確かめることができる。
 目的化合物の生産等の産業利用目的に応じて、本発明のベクターに更に目的化合物をコードする塩基配列を組み込んだ目的化合物生産用ベクターを用いて、宿主細胞を形質転換することにより、該化合物を安定的かつ効率的に生産させることが可能となる。
 実施例4の実験において確認されている通り、(a)~(d)のいずれかの塩基配列を少なくとも含むベクターは、宿主細胞中で安定的に維持される。(a)~(d)のいずれかの塩基配列からなる核酸は、宿主細胞の細胞周期における染色体の安定化に寄与するセントロメアDNAとして利用可能であると推定される。
(特徴2) 本発明のベクターは、好ましくは自律複製型ベクターである。本発明のベクターが自律複製型であれば、宿主生物のゲノム配列やゲノム構造を変化させること無く、宿主改良を行うことが可能である。
 本発明において自律複製型ベクターとは宿主の染色体とは独立に複製されるベクターであって、宿主染色体に組み込まれなくとも宿主内で複製されるベクターを指す。
 前記(d)の塩基配列としては特に、
(d1)配列番号12、15、18、又は21に示す塩基配列において、1~200個、1~190個、1~160個、1~130個、1~100個、1~75個、1~50個、1~25個、1~20個、1~15個、1~10個、1~7個、1~5個、1~4個、1~3個、又は1もしくは2個の塩基が置換、欠失、挿入及び/又は付加した塩基配列;
(d2)配列番号12、15、18、又は21に示す塩基配列において、5’端及び/又は3’端に、合計で1もしくは複数個の塩基が付加した塩基配列;
(d3)配列番号12、15、18、又は21に示す塩基配列において、5’端及び/又は3’端から連続する、合計で1もしくは複数個の塩基が欠失した塩基配列;或いは
(d4)前記(b)又は(c)の塩基配列の部分塩基配列であって、且つ、配列番号12、15、18、又は21に示す塩基配列において、1もしくは複数個の塩基配列が置換、欠失、挿入及び/又は付加した塩基配列
が好ましい。
1.2.本発明のベクターのより好ましい特徴
 本発明のベクターのより好ましい実施形態は、
 前記(a)~(d)のいずれかの塩基配列の上流(5’末端側)と下流(3’末端側)に位置する塩基配列が、以下の(e)~(g)のいずれかの塩基配列の対;
 (e)上流の塩基配列と下流の塩基配列とが相補的な塩基配列である対;
 (f)上流の塩基配列と下流の塩基配列とがストリンジェントな条件下で相互にハイブリダイズする核酸の塩基配列である対;
 (g)上流の塩基配列と下流の塩基配列とが一方の相補的な塩基配列と85%以上、好ましくは90%以上、より好ましくは95%以上、さらに好ましくは97%以上、最も好ましくは99%以上の配列同一性を有する塩基配列である対;
をそれぞれ含むことを特徴とする。
 以下、説明の便宜上、前記(e)~(g)のいずれかの塩基配列の対において、上流の塩基配列を「塩基配列A」、下流の塩基配列を「塩基配列B」と称する場合がある。
 特に好ましくは、塩基配列Aと塩基配列Bとの対は、前記(e)の対である。
 配列番号13、14、16、17、19、20、22、23、41、又は42、例えば配列番号16、17、19、20、41、又は42、特に配列番号16、19、41、又は42に示す塩基配列は、コマガタエラ・パストリスにおける自律複製配列(Autonomous replication sequence)(ARS)を含んでいることが確認されている。従って、前記塩基配列A及び/又は前記塩基配列Bとして後述する(h)~(o)の塩基配列の少なくとも一つを用いる場合、本発明のこの実施形態のベクターは、酵母、例えばコマガタエラ属の株、好ましくはコマガタエラ・パストリスの株における自律複製型ベクターとして利用することができる。
 本発明のこの実施形態のベクターは、上記の特徴1及び特徴2、並びに下記の特徴3のうち少なくとも1つを備えることが好ましく、より好ましくは少なくとも特徴1と特徴2を備え、特に好ましくは特徴1~3のいずれも備える。
(特徴3) 本発明のベクターは、好ましくは、centromere protein(CENP)との結合能を有し、より好ましくは、本発明のベクターを構成する核酸分子のうち、前記(a)~(d)のいずれかの塩基配列、並びに、前記(e)~(g)のいずれかの上流及び下流の塩基配列から選択される少なくとも1つの塩基配列を含む部位がCENPとの結合能を有する。CENPとは真核生物の染色体のセントロメア領域に含まれる、セントロメア特異的タンパク質の一群である。前記(a)~(d)のいずれかの塩基配列、並びに、前記(e)~(g)のいずれかの塩基配列は、いずれもコマガタエラ・パストリスの染色体DNAのうちセントロメアを構成する領域の塩基配列又はそれと等価な塩基配列であるから、本発明のベクターのうちこれらの塩基配列から選択される少なくとも1つの塩基配列を含む部位はCENPと結合能を有すると考えられる。CENPのうちCENP-Aはセントロメア領域に特異的に局在するヒストンH3バリアントであり、ヒト、酵母等に共通して存在する。すなわち、本発明のベクターの前記部位は、好ましくは、コマガタエラ・パストリス及び他の酵母、並びに他の真核生物におけるCENP-A等のCENPとの結合能を有する。具体的には、本発明のベクターを構成する核酸分子のうち、配列番号12~23のうち何れかで示される塩基配列を含む部位が、CENPとの結合能を有することが実施例から裏付けられる。
 本発明のこの実施形態のベクターにおいて、塩基配列Aが、前記(a)~(d)のいずれかの塩基配列よりも上流に位置しているとは、塩基配列Aの3’末端の塩基(塩基1とする)が、前記(a)~(d)のいずれかの塩基配列の5’末端の塩基(塩基2とする)よりも上流側に位置していることを指し、塩基1と塩基2とは隣接していてもよいし、塩基1と塩基2との間に任意の塩基数、例えば1~1000、好ましくは1~100、より好ましくは1~10の塩基配列が介在していてもよい。
 本発明のこの実施形態のベクターにおいて、塩基配列Bが、前記(a)~(d)のいずれかの塩基配列よりも下流に位置しているとは、前記(a)~(d)のいずれかの塩基配列の3’末端の塩基(塩基3とする)が、塩基配列Bの5’末端の塩基(塩基4とする)よりも上流側に位置していることを指し、塩基3と塩基4とは隣接していてもよいし、塩基3と塩基4との間に任意の塩基数、例えば1~1000、好ましくは1~100、より好ましくは1~10の塩基配列が介在していてもよい。
 本発明のこの実施形態のベクターでは、好ましくは、前記(a)~(d)のいずれかに記載の塩基配列のGC含有率を1としたときの、前記塩基配列A及び/又は前記塩基配列BのGC含有率の下限が0.8であり、上限が1.2である。また、好ましくは前記塩基配列A及び/又は前記塩基配列BのGC含有率が41%以下である。
 本発明のこの実施形態のベクターでは、前記塩基配列A及び前記塩基配列Bの塩基数は特に限定されないが、好ましくはそれぞれ2800塩基以下であり、より好ましくはそれぞれ1900塩基以上である。
 本発明のこの実施形態のベクターでは、好ましくは、前記塩基配列A及び前記塩基配列Bの少なくとも一方が、コマガタエラ属酵母染色体DNA、例えばコマガタエラ・パストリス染色体DNAの部分塩基配列である。
 本発明のこの実施形態のベクターでは、好ましくは前記塩基配列A及び前記塩基配列Bの一方、より好ましくは前記塩基配列Aが、以下の(h)~(k)のいずれかの塩基配列;
 (h)配列番号13、16、19、又は22に示す塩基配列;
 (i)配列番号13、16、19、又は22に示す塩基配列に相補的な塩基配列からなる核酸とストリンジェントな条件下でハイブリダイズする核酸の塩基配列;
 (j)配列番号13、16、19、又は22に示す塩基配列と85%以上、好ましくは90%以上、より好ましくは95%以上、さらに好ましくは97%以上、最も好ましくは99%以上の配列同一性を有する塩基配列;
 (k)配列番号13、16、19、又は22に示す塩基配列において、1もしくは複数個の塩基が置換、欠失、挿入及び/又は付加した塩基配列;
である。
 前記(h)~(k)の塩基配列は、好ましくは、本発明のベクターに自律複製能を付与する塩基配列である。前記(h)~(k)の塩基配列の各説明において「配列番号13、16、19、又は22に示す塩基配列」は好ましくは「配列番号16又は19に示す塩基配列」である。
 前記(k)の塩基配列としては特に、
(k1)配列番号13、16、19、又は22に示す塩基配列において、1~400個、1~375個、1~350個、1~325個、1~295個、1~250個、1~225個、1~200個、1~175個、1~150個、1~125個、1~100個、1~75個、1~50個、1~25個、1~20個、1~15個、1~10個、1~7個、1~5個、1~4個、1~3個、又は1もしくは2個の塩基が置換、欠失、挿入及び/又は付加した塩基配列;
(k2)配列番号13、16、19、又は22に示す塩基配列において、5’端及び/又は3’端に、特に5’端に、合計で1もしくは複数個の塩基が付加した塩基配列;
(k3)配列番号13、16、19、又は22に示す塩基配列において連続する、例えば5’端及び/又は3’端から連続する、特に5’端から連続する、合計で1もしくは複数個の塩基が欠失した塩基配列;或いは
(k5)前記(i)又は(j)の塩基配列の部分塩基配列であって、且つ、配列番号13、16、19、又は22に示す塩基配列において、1もしくは複数個の塩基配列が置換、欠失、挿入及び/又は付加した塩基配列
が好ましい。
 (k3)の配列の例として、(k4)配列番号13、16、19、又は22の連続する、例えば5’端及び/又は3’端から連続する、1~5、1~10、1~25、1~50、1~75、1~100、1~125、1~150、1~175、1~200、1~225、1~250、1~275、1~300、1~350、1~400、1~450、又は1~500塩基からなる部分塩基配列が挙げられる。(k4)の配列の例として、例えば配列番号41の連続する1~5、1~10、1~25、1~30、1~40、1~50、1~60、1~70、1~80、1~90、若しくは1~100塩基、又は配列番号42の連続する1~5、1~10、1~25、1~30、1~40、1~50、1~60、1~70、1~80、1~90、1~100塩基、1~110塩基、1~120塩基、1~130塩基、1~140塩基、1~150塩基、1~160塩基、1~170塩基、1~180塩基、1~190塩基、1~200塩基、若しくは1~210塩基からなる部分塩基配列、特に配列番号41又は42の塩基配列が挙げられる。(k4)の配列の好ましい例として、配列番号41の塩基配列のうち、第N塩基から開始する連続したm個の塩基からなる部分塩基配列(ここでmは5塩基以上、好ましくは10塩基以上かつ(111-N+1)塩基以下の整数であり、Nは1~107、好ましくは102までの整数)が挙げられる。mは、例えば、5、6、7、8、9、10、11、12…(111-N+1)のうちいずれか1つであってよく、Nは1、2、3、4、…107のうちいずれか1つであってよい。同様に、(k4)の塩基配列の例として、配列番号42の塩基配列のうち、第N'塩基から開始する連続したm'個の塩基からなる部分塩基配列(ここでm'は5塩基以上、好ましくは10塩基以上かつ(218-N'+1)塩基以下の整数であり、N'は1~214、好ましくは1~209までの整数)が挙げられる。m'は、例えば、5、6、7、8、9、10、11、12…(218-N'+1)のうちいずれか1つであってよく、N'は1、2、3、4、…214のうちいずれか1つであってよい。
 (k5)の配列の例として、(k6)前記(i)又は(j)の塩基配列の連続する、例えば5’端及び/又は3’端から連続する、1~10、1~25、1~50、1~75、1~100、1~125、1~150、1~175、1~200、1~225、1~250、1~275、1~300、1~350、1~400、1~450、又は1~500塩基からなる部分塩基配列が挙げられる。
 前記(a)~(d)のいずれかの塩基配列において「配列番号12、15、18、又は21」が「配列番号12」である場合には、前記(h)~(k)のいずれかの塩基配列において「配列番号13、16、19、又は22」が「配列番号13」であることが好ましいが、特に限定されない。
 前記(a)~(d)のいずれかの塩基配列において「配列番号12、15、18、又は21」が「配列番号15」である場合には、前記(h)~(k)のいずれかの塩基配列において「配列番号13、16、19、又は22」が「配列番号16」であることが好ましいが、特に限定されない。
 前記(a)~(d)のいずれかの塩基配列において「配列番号12、15、18、又は21」が「配列番号18」である場合には、前記(h)~(k)のいずれかの塩基配列において「配列番号13、16、19、又は22」が「配列番号19」であることが好ましいが、特に限定されない。
 前記(a)~(d)のいずれかの塩基配列において「配列番号12、15、18、又は21」が「配列番号21」である場合には、前記(h)~(k)のいずれかの塩基配列において「配列番号13、16、19、又は22」が「配列番号22」であることが好ましいが、特に限定されない。
 本発明のこの実施形態のベクターでは、好ましくは前記塩基配列A及び前記塩基配列Bの一方、より好ましくは前記塩基配列Bが、以下の(l)~(o)のいずれかの塩基配列;
 (l)配列番号14、17、20、又は23に示す塩基配列;
 (m)配列番号14、17、20、又は23に示す塩基配列に相補的な塩基配列からなる核酸とストリンジェントな条件下でハイブリダイズする核酸の塩基配列;
 (n)配列番号14、17、20、又は23に示す塩基配列と85%以上、好ましくは90%以上、より好ましくは95%以上、さらに好ましくは97%以上、最も好ましくは99%以上の配列同一性を有する塩基配列; 
 (o)配列番号14、17、20、又は23に示す塩基配列において、1もしくは複数個の塩基が置換、欠失、挿入及び/又は付加した塩基配列;
である。
 前記(l)~(o)の塩基配列は、好ましくは、本発明のベクターに自律複製能を付与する塩基配列である。前記(l)~(o)の塩基配列の各説明において「配列番号14、17、20、又は23に示す塩基配列」は好ましくは「配列番号17又は20に示す塩基配列」である。
 前記(o)の塩基配列としては特に、
(o1)配列番号14、17、20、又は23に示す塩基配列において、1~400個、1~375個、1~350個、1~325個、1~295個、1~250個、1~225個、1~200個、1~175個、1~150個、1~125個、1~100個、1~75個、1~50個、1~25個、1~20個、1~15個、1~10個、1~7個、1~5個、1~4個、1~3個、又は1もしくは2個の塩基が置換、欠失、挿入及び/又は付加した塩基配列;
(o2)配列番号14、17、20、又は23に示す塩基配列において、5’端及び/又は3’端に、特に3’端に、合計で1もしくは複数個の塩基が付加した塩基配列;
(o3)配列番号14、17、20、又は23に示す塩基配列において、5’端及び/又は3’端から連続する、特に3’端から連続する、合計で1もしくは複数個の塩基が欠失した塩基配列;或いは
(o5)前記(m)又は(n)の塩基配列の部分塩基配列であって、且つ、配列番号14、17、20、又は23に示す塩基配列において、1もしくは複数個の塩基配列が置換、欠失、挿入及び/又は付加した塩基配列
が好ましい。
 (o3)の配列の例として、(o4)配列番号14、17、20、又は23の連続する、例えば5’端及び/又は3’端から連続する、1~5、1~10、1~25、1~50、1~75、1~100、1~125、1~150、1~175、1~200、1~225、1~250、1~275、1~300、1~350、1~400、1~450、又は1~500塩基からなる部分塩基配列が挙げられる。(o4)の配列の例として、例えば配列番号85の連続する1~5、1~10、1~25、1~30、1~40、1~50、1~60、1~70、1~80、1~90、若しくは1~100塩基、又は配列番号86の連続する1~5、1~10、1~25、1~30、1~40、1~50、1~60、1~70、1~80、1~90、1~100塩基、1~110塩基、1~120塩基、1~130塩基、1~140塩基、1~150塩基、1~160塩基、1~170塩基、1~180塩基、1~190塩基、1~200塩基、若しくは1~210塩基からなる部分塩基配列、特に配列番号85又は86の塩基配列が挙げられる。(o4)の配列の好ましい例として、配列番号85の塩基配列のうち、第N塩基から開始する連続したm個の塩基からなる部分塩基配列(ここでmは5塩基以上、好ましくは10塩基以上かつ(111-N+1)塩基以下の整数であり、Nは1~102までの整数)が挙げられる。mは、例えば、5、6、7、8、9、10、11、12…(111-N+1)のうちいずれか1つであってよく、Nは1、2、3、4、…107のうちいずれか1つであってよい。同様に、(o4)の塩基配列の例として、配列番号86の塩基配列のうち、第N'塩基から開始する連続したm'個の塩基からなる部分塩基配列(ここでm'は5塩基以上、好ましくは10塩基以上かつ(218-N'+1)塩基以下の整数であり、N'は1~209までの整数)が挙げられる。m'は、例えば、5、6、7、8、9、10、11、12…(218-N'+1)のうちいずれか1つであってよく、N'は1、2、3、4、…214のうちいずれか1つであってよい。
 (o5)の配列の例として、(o6)前記(m)又は(n)の塩基配列の連続する、例えば5’端及び/又は3’端から連続する、1~5、1~10、1~25、1~50、1~75、1~100、1~125、1~150、1~175、1~200、1~225、1~250、1~275、1~300、1~350、1~400、1~450、又は1~500塩基からなる部分塩基配列が挙げられる。
 前記(a)~(d)のいずれかの塩基配列において「配列番号12、15、18、又は21」が「配列番号12」である場合には、前記(l)~(o)のいずれかの塩基配列において「配列番号14、17、20、又は23」が「配列番号14」であることが好ましいが、特に限定されない。
 前記(a)~(d)のいずれかの塩基配列において「配列番号12、15、18、又は21」が「配列番号15」である場合には、前記(l)~(o)のいずれかの塩基配列において「配列番号14、17、20、又は23」が「配列番号17」であることが好ましいが、特に限定されない。
 前記(a)~(d)のいずれかの塩基配列において「配列番号12、15、18、又は21」が「配列番号18」である場合には、前記(l)~(o)のいずれかの塩基配列において「配列番号14、17、20、又は23」が「配列番号20」であることが好ましいが、特に限定されない。
 前記(a)~(d)のいずれかの塩基配列において「配列番号12、15、18、又は21」が「配列番号21」である場合には、前記(l)~(o)のいずれかの塩基配列において「配列番号14、17、20、又は23」が「配列番号23」であることが好ましいが、特に限定されない。
 本発明のこの実施形態のベクターでは、好ましくは前記塩基配列A及び前記塩基配列Bの一方、より好ましくは前記塩基配列Aが、以下の(t)~(w)のいずれかの塩基配列;
 (t)配列番号41、42、85、又は86、好ましくは配列番号41又は42に示す塩基配列;
 (u)配列番号41、42、85、又は86、好ましくは配列番号41又は42に示す塩基配列に相補的な塩基配列からなる核酸とストリンジェントな条件下でハイブリダイズする核酸の塩基配列;
 (v)配列番号41、42、85、又は86、好ましくは配列番号41又は42に示す塩基配列と85%以上、好ましくは90%以上、より好ましくは95%以上、さらに好ましくは97%以上、最も好ましくは99%以上の配列同一性を有する塩基配列;
 (w)配列番号41、42、85、又は86、好ましくは配列番号41又は42に示す塩基配列において、1もしくは複数個の塩基が置換、欠失、挿入及び/又は付加した塩基配列;
である。(t)~(w)の塩基配列は、上記のいずれかの配列、例えば(a)~(d)のいずれかの塩基配列、(e)~(g)のいずれかの塩基配列の対を構成する上流及び/又は下流の塩基配列、前記(h)~(o)のいずれかの塩基配列の全体又は部分配列として含まれてもよいし、これらの配列とは別に含まれてもよい。
 前記(t)~(w)の塩基配列は、好ましくは、本発明のベクターに自律複製能を付与する塩基配列である。
 前記(w)の塩基配列は、前記(u)又は(v)の部分塩基配列であって、且つ、配列番号41、42、85、又は86に示す塩基配列において、1もしくは複数個の塩基配列が置換、欠失、挿入及び/又は付加した塩基配列も包含する。
 (w)の塩基配列の例として、配列番号41又は85或いは前記(u)又は(v)(ただし配列番号41、42、85又は86に示す塩基配列が、配列番号41又は85に示す塩基配列である場合)、好ましくは配列番号41或いは前記(u)又は(v)(ただし配列番号41、42、85又は86に示す塩基配列が、配列番号41に示す塩基配列である場合)、特に好ましくは配列番号41の塩基配列のうち、第N塩基から開始する連続したm個の塩基からなる部分塩基配列(ここでmは5塩基以上、好ましくは10塩基以上かつ(111-N+1)塩基以下の整数であり、Nは1~107、好ましくは102までの整数)が挙げられる。mは、例えば、5、6、7、8、9、10、11、12…(111-N+1)のうちいずれか1つであってよく、Nは1、2、3、4、…107のうちいずれか1つであってよい。同様に、(w)の塩基配列の例として、配列番号42又は86或いは前記(u)又は(v)(ただし配列番号41、42、85又は86に示す塩基配列が、配列番号42又は86に示す塩基配列である場合)、好ましくは配列番号42或いは前記(u)又は(v)(ただし配列番号41、42、85又は86に示す塩基配列が、配列番号42に示す塩基配列である場合)、特に好ましくは配列番号42の塩基配列のうち、第N'塩基から開始する連続したm'個の塩基からなる部分塩基配列(ここでm'は5塩基以上、好ましくは10塩基以上かつ(218-N'+1)塩基以下の整数であり、N'は1~214、好ましくは209までの整数)が挙げられる。m'は、例えば、5、6、7、8、9、10、11、12…(218-N'+1)のうちいずれか1つであってよく、N'は1、2、3、4、…214のうちいずれか1つであってよい。
 この実施形態において、塩基配列Bは、好ましくは、
 配列番号41又は42に示す塩基配列に相補的な塩基配列;
 配列番号41又は42に示す塩基配列からなる核酸とストリンジェントな条件下でハイブリダイズする核酸の塩基配列;
 配列番号41又は42に示す塩基配列に相補的な塩基配列と85%以上、好ましくは90%以上、より好ましくは95%以上、さらに好ましくは97%以上、最も好ましくは99%以上の配列同一性を有する塩基配列;
である。
 前記塩基配列A及び前記塩基配列Bの特に好ましい組み合わせは、以下の(p)~(s)のいずれかの塩基配列の対;
 (p)上流に配列番号13に示す塩基配列、及び、下流に配列番号14に示す塩基配列である対;
 (q)上流に配列番号16に示す塩基配列、及び、下流に配列番号17に示す塩基配列である対、又は上流に配列番号41に示す配列を含む塩基配列、及び下流に配列番号41に示す配列を含む塩基配列に相補的な塩基配列である対;
 (r)上流に配列番号19に示す塩基配列、及び、下流に配列番号20に示す塩基配列である対、又は上流に配列番号42に示す配列を含む塩基配列、及び下流に配列番号42に示す配列を含む塩基配列に相補的な塩基配列である対; 
 (s)上流に配列番号22に示す塩基配列、及び、下流に配列番号23に示す塩基配列である対;
である。
 前記(a)~(d)のいずれかの塩基配列において「配列番号12、15、18、又は21」が「配列番号12」である場合には、前記塩基配列A及び前記塩基配列B が前記(p)の対であることが好ましいが、特に限定されない。
 前記(a)~(d)のいずれかの塩基配列において「配列番号12、15、18、又は21」が「配列番号15」である場合には、前記塩基配列A及び前記塩基配列B が前記(q)の対であることが好ましいが、特に限定されない。
 前記(a)~(d)のいずれかの塩基配列において「配列番号12、15、18、又は21」が「配列番号18」である場合には、前記塩基配列A及び前記塩基配列B が前記(r)の対であることが好ましいが、特に限定されない。
 前記(a)~(d)のいずれかの塩基配列において「配列番号12、15、18、又は21」が「配列番号21」である場合には、前記塩基配列A及び前記塩基配列B が前記(s)の対であることが好ましいが、特に限定されない。
1.3.本発明のベクターの他の好ましい実施形態
 本発明のベクターのより好ましい実施形態は、
 前記(a)~(d)のいずれかの塩基配列の、上流(5’末端側)及び/又は下流(3’末端側)に、前記(h)~(o)のいずれかの塩基配列の少なくとも一つを含むベクターである。
 実施例では、配列番号13、14、16、17、19、20、22、23、41、又は42、例えば配列番号16、17、19、20、41、又は42、特に配列番号16、19、41、又は42に示す塩基配列が、コマガタエラ・パストリスにおける自律複製配列(Autonomous replication sequence)(ARS)を含んでいることが確認されている。従ってこれらの塩基配列と同一又は等価な前記(h)~(o)のいずれかの塩基配列の少なくとも一つを含む本発明のベクターは、自律複製型ベクターとして利用することができる。
 前記(a)~(d)のいずれかの塩基配列、並びに、前記(h)~(o)のいずれかの塩基配列は、いずれもコマガタエラ・パストリスの染色体DNAのうちセントロメアを構成する領域の塩基配列又はそれと等価な塩基配列であるから、本発明のベクターのうちこれらの塩基配列から選択される少なくとも1つの塩基配列を含む部位はCENPと結合能を有すると考えられる。
 この実施形態のベクターは、更に好ましくは、前記(a)~(d)のいずれかの塩基配列の上流に、前記(h)~(k)のいずれかの塩基配列の少なくとも1つが含まれる。
 この実施形態のベクターは、更に好ましくは、前記(a)~(d)のいずれかの塩基配列の下流に、前記(l)~(o)のいずれかの塩基配列の少なくとも1つが含まれる。
 この実施形態のベクターにおいて、前記(a)~(d)のいずれかの塩基配列と、前記(h)~(o)のいずれかの塩基配列とは直接隣接していてもよく、間に任意の塩基数、例えば1~1000、好ましくは1~100、より好ましくは1~10の塩基配列が介在していてもよい。
 前記(h)~(o)のいずれかの塩基配列の好適な実施形態は上記1.2において説明した通りである。
1.4.本発明のベクターの他の特徴
 本発明のベクターは、宿主細胞に導入して宿主細胞にベクターを保持させるのに用いることができる。
 本発明のベクターは、宿主細胞に導入させ、形質転換後の宿主細胞にて核酸や目的遺伝子等を発現させる用途に使用可能なものであればよく、現実に当該用途に用いられている必要はない。
 本発明において「ベクター」とは核酸分子であって、上記の塩基配列X(上記1.1、1.2及び1.3において詳述した前記(a)~(d)のいずれかの塩基配列、前記(e)~(g)のいずれかの塩基配列の対を構成する上流及び/又は下流の塩基配列、前記(h)~(o)及び(t)~(w)のいずれかの塩基配列、或いは、これらの塩基配列のうち複数が連結(適当な長さの他の塩基配列を介して連結する場合を含む)した塩基配列を説明するために「塩基配列X」と称する)を含む。本発明のベクターは、塩基配列Xに加えて、外来遺伝子又は内在性遺伝子の塩基配列等も含むことができる。ここで「外来遺伝子」とは、宿主細胞が本来的には有さず人為的にベクター中に組み込まれる遺伝子を指し、「内在性遺伝子」とは、宿主細胞が染色体DNAまたは細胞質DNAとして本来的に含む遺伝子であるが該遺伝子の機能をベクターに付与する目的で、或いは、該遺伝子の増強された発現を達成する目的で人為的にベクター中に組み込まれる遺伝子を指す。本発明のベクターは、さらに、外来遺伝子又は内在性遺伝子の塩基配列に加えて、またこれらの塩基配列に替えて、1つ以上の制限酵素認識部位を含むクローニングサイト、選択マーカー遺伝子(栄養要求性相補遺伝子、薬剤耐性遺伝子など)の塩基配列、レポーター遺伝子の塩基配列、及び/又は大腸菌等における複製起点等の自律複製配列(Autonomous replication sequence)(ARS)を含むことができる。クローニングサイトはレポーター遺伝子内に存在してもよく、これにより、レポーター遺伝子の機能の有無を調べることで、クローニングサイトへの遺伝子導入の有無を決定してもよい。本発明のベクターはさらに、プロモーター及びターミネーター等の調節配列、Clontech社のIn-FusionクローニングシステムやNew England Biolabs社のGibson Assembly システム等を利用するためのオーバーラップ領域も含むことができる。本発明のベクターは更に、宿主に応じて、塩基配列Xが由来する生物種とは異なる生物種に由来するセントロメアDNA配列、テロメアDNA配列を含むことができる。
 外来遺伝子又は内在性遺伝子は、物質生産等の目的で導入される遺伝子であり、典型的には目的ポリペプチドをコードする核酸である。外来遺伝子又は内在性遺伝子は発現カセットに挿入された形態でベクター中に含めることができる。「発現カセット」とは、外来遺伝子又は内在性遺伝子を含み、それをポリペプチドとして発現可能な状態にすることのできる発現システムをいう。「発現可能な状態」とは、当該発現カセットに含まれる外来遺伝子又は内在性遺伝子が、形質転換体内で発現可能なように、遺伝子発現に必要なエレメントの制御下に配置されている状態をいう。遺伝子発現に必要なエレメントには、例えば下記のプロモーター、下記のターミネーター等が挙げられる。
 本発明のベクターに含まれ得る選択マーカー遺伝子の例として、例えば、アンピシリン、Zeocin(商標)、カナマイシン、テトラサイクリン、及びクロラムフェニコール等の薬剤耐性遺伝子が挙げられる。本発明のベクターは、異なる薬剤での選択を可能とするために、二以上の選択マーカーを含んでもよい。本発明のベクターに含まれ得るレポーター遺伝子の例として、LacZ、ルシフェラーゼ、及び緑色蛍光タンパク質(GFP)等が挙げられる。本発明のベクターに含まれ得るプロモーターの例として、酵母種由来のGAPプロモーター(グリセルアルデヒド-3-リン酸デヒドロゲナーゼプロモーター)、AOX(アルコールオキシダーゼ)プロモーター、MOX(メタノールオキシダーゼ)プロモーター、及びFMD(ギ酸デヒドロゲナーゼ)プロモーター等が挙げられる。本発明のベクターに含まれ得るターミネーターの例として、酵母種由来のAOXターミネーター、MOXターミネーター、ADH1(アルコールデヒドロゲナーゼ1)のターミネーター、及びGAL10ターミネーター等が挙げられる。
 本発明において自律複製配列(Autonomous replication sequence)(ARS)とは、原核生物(大腸菌、細菌、放線菌、真正細菌、古細菌、ラン藻等)、ウィルス(DNAウィルス、RNAウィルス等)、真核生物(菌類、藻類、原生動物、酵母、植物、動物、鳥類、家禽、哺乳類、ヒト、マウス等)、好ましくは真核生物、例えばコマガタエラ・パストリス等の酵母の複製起点のことであり、複製が開始される塩基配列の領域である。本発明のベクターは、例えば異なる種における自律複製配列を二以上含んでもよい。本発明のベクターに含まれ得る自律複製配列の例として、上記の(t)~(w)のいずれかの塩基配列が挙げられる。
 本発明においてセントロメアDNA配列とは、動原体と呼ばれる構造を形成し、紡錘体が結合する塩基配列である。例えばヒトにおいて、染色体の長腕と短腕が交差する領域であり、染色体のほぼ中央に位置することからセントロメア領域とも呼ばれる。
 本発明においてテロメアDNA配列とは、通常染色体DNAの末端部分に存在する塩基配列の反復構造を指し、細胞分裂時の染色体の複製に伴う損傷を防ぎ安定性を維持する働きを有している。テロメアDNAを含むYACベクターの製法としては、クローン化したテロメアDNA配列を相同組換えにより導入し、染色体を短縮する手法(テロメアトランケーション)が挙げられる(Itzhakiら,Nature Genet.(USA),第2巻,p.283-287,1992年)。
 外来遺伝子又は内在性遺伝子がコードする目的ポリペプチドとしては、タンパク質、融合タンパク質、抗体、サイトカイン、酵素等が挙げられる。
 本発明のベクターは環状ベクター、直鎖状ベクター、プラスミド、人工染色体等であることができる。
 本発明においてベクターとは人為的に構築された核酸分子である。本発明のベクターを構成する核酸分子は、通常DNA、好ましくは二本鎖DNAであり、環状であっても、直鎖状であってもよい。本発明のベクターは、通常は、上記の塩基配列Xを含む核酸断片、或いは上記の塩基配列Xからなる核酸断片が、その両端又は一端に、例えば制限酵素認識部位を介して、1又は複数の、上記で挙げたような他の機能的核酸断片と連結されて構成される。
 本発明での「ベクター」の範囲には、上記のクローニングサイト、選択マーカー遺伝子の塩基配列、レポーター遺伝子の塩基配列、ARS、調節配列、オーバーラップ領域、外来遺伝子又は内在性遺伝子の塩基配列、セントロメアDNA配列、テロメアDNA配列等が既に付加されている形態だけでなく、これらの配列を付加可能な形態(例えば、これらの配列を付加可能な1つ以上の制限酵素認識部位を含むクローニングサイトを含む形態)の核酸分子も包含される。
 本発明のベクターはゲノム組込み型ベクターであってもよいし、自律複製型ベクターであってもよいが、好ましくは自律複製型ベクターである。本発明のゲノム組込み型ベクターは、上記の塩基配列Xをゲノム組み込み型ベクターに組み込むことにより作製することができる。
 本発明のベクターは、上記の塩基配列Xを任意のベクターに組み込むことにより作製することができる。塩基配列Xを組み込むベクターは、酵母、例えばコマガタエラ属の株、好ましくはコマガタエラ・パストリスの株における自律複製配列を有さないベクターであっても、酵母における自律複製配列を有するベクターであってもよい。酵母における自律複製配列を含むベクターの例として、YRpベクター又はYCpベクターが挙げられる。YRpベクターとは、酵母のARS配列を有するベクターを指し、YCpベクターとは、酵母のセントロメア配列及びARS配列を有するベクターを指す。したがって、上記塩基配列Xを酵母における自律複製配列を有さないベクターに加えることで、該ベクターをYRp又はYCpベクターとすることができる。また、上記塩基配列XをYRp又はYCpベクターに加えることで、他の宿主におけるベクターの自律複製及び安定化を促すことができる。
 上記の塩基配列Xを組み込むベクターは特に限定されないが、例えばYEpベクター、YRpベクター、YCpベクター、pPICHOLI(http://www.mobitec.com/cms/products/bio/04_vector_sys/p_picholi_shuttle_vector.html)、pHIP(Journal of General Microbioiogy (1992), 138, 2405-2416. Chromosomal targeting of replicating plasmids in the yeast Hansenula polymorpha)、pHRP(pHIPについて挙げた前記文献参照)、pHARS(Molecular and General Genetics MGG February 1986, Volume 202, Issue 2, pp 302-308, Transformation of the methylotrophic yeast Hansenula polymorpha by autonomous replication and integration vectors)、大腸菌由来プラスミドベクター(pUC18、pUC19、pBR322、pBluescript、pQE)、枯草菌由来プラスミドベクター(pHY300PLK、pMTLBS72)等を使用することができる。これらの他のベクターへの組み込み方法は特に限定されないが、上記の塩基配列Xを含み、両端に制限酵素認識部位を含む核酸断片を、他のベクターにおける対応する制限酵素認識部位を含むクローニングサイトに挿入する方法や、Clontech社のIn-FusionクローニングシステムやNew England Biolabs社のGibson Assembly システム等を使用することにより可能である。
 本発明のベクターを自律複製型ベクターとするためには、宿主に応じた自律複製配列(ARS)をベクター中に含めることができる。ただし、上記の塩基配列Xのなかに、宿主にとり自律複製配列として機能する配列が含まれる場合には、自律複製配列を別途ベクター中に組み込む必要はない。本発明の実施例では、配列番号12~23、41、又は42、好ましくは配列番号16、17、19、20、41、又は42、さらに好ましくは配列番号16、19、41、又は42のうち何れかで示される塩基配列が、コマガタエラ・パストリスにおけるARSを含んでいることが確認されており、配列番号12~23、41、又は42、例えば配列番号16、17、19、20、41、又は42、特に配列番号16、19、41、又は42のうち何れかで示される塩基配列を含むベクターはコマガタエラ・パストリス等のコマガタエラ属酵母を含む酵母での自律複製型ベクターとして利用可能であることは少なくとも実験的に確認されている。
 形質転換後の本発明のベクターは、宿主細胞内で自律複製型として存在している事が好ましいが、染色体に組み込まれている状態でもよい。
 本発明のベクターは、人工染色体ベクターの形態であることもできる。酵母人工染色体ベクター(YACベクター)は、一般に、セントロメアDNA配列、テロメアDNA配列、自律複製配列(ARS)を含む。
 実施例において、配列番号12、15、18又は21の塩基配列、或いは、配列番号12の塩基配列の上流又は下流の少なくとも一方に配列番号13及び14のうち一方が付加された塩基配列、配列番号15の塩基配列の上流又は下流の少なくとも一方に配列番号16及び17のうち一方が付加された塩基配列、配列番号18の塩基配列の上流又は下流の少なくとも一方に配列番号19及び20のうち一方が付加された塩基配列、配列番号21の塩基配列の上流又は下流の少なくとも一方に配列番号22及び23のうち一方が付加された塩基配列が、コマガタエラ・パストリス等のコマガタエラ属酵母を含む酵母でのセントロメアDNA配列として機能するとともに、ARSとしても機能することが確認されている。このため人工染色体ベクターにおいて、前記(a)~(d)のいずれかの塩基配列、或いは、前記(a)~(d)のいずれかの塩基配列の上流及び/又は下流に前記(h)~(o)のいずれかの塩基配列の少なくとも1つが付加された塩基配列を、セントロメアDNA配列及びARSとして利用し、ベクターの両端にテロメアDNA配列とを組み込み、必要に応じて更に選択マーカーとを組み込むことでYACベクターを形成することができる。
 本発明のベクターは、好ましくは、複数の生物種の宿主細胞において自律複製可能な自律複製ベクターである。このような自律複製ベクターとしては、前記(a)~(d)のいずれかの塩基配列を含み、更に、前記(a)~(d)のいずれかの塩基配列が由来する生物種とは異なる生物種に由来するARS及び/又はセントロメアDNA配列を含むベクターが挙げられる。具体的には、本発明のベクターをコマガタエラ・パストリスで自律複製可能であるだけでなく、他の種、或いは他の属を宿主として自律複製可能なベクターとするために考えられる手段としては、例えば上記塩基配列Xを含むベクターにヒト染色体のセントロメアDNA配列をクローニングしてヒト人工染色体として利用したり、上記塩基配列Xを含むベクターにオガタエア属酵母のARSやセントロメアDNA配列をクローニングして両属種での自律複製型ベクターとして利用したり、上記塩基配列Xを含むベクターに出芽酵母(Saccharomyces cerevisiae)や分裂酵母(Schizosaccharomyces pombe)のARSやセントロメアDNA配列をクローニングして両属種での自律複製型ベクターとして利用したり、上記塩基配列Xを含むベクターにコマガタエラ・パストリスのセントロメアを構成するタンパク質群をコードする遺伝子群をクローニングして他属種での自律複製型ベクターとして利用したりすることが考えられる。また、本実施例のように大腸菌の自律複製型ベクターと組み合わせることも可能である。
 本発明のベクターは実施例で示される通り、宿主細胞中で安定的に維持され得るが、選択マーカーとの組み合わせやベクターサイズを調整することによって安定性を更に向上させることもできる。例えば、ベクター上の選択マーカーが脱落した場合に生育が遅くなる又は死滅するように設計することで、ベクターの安定性を向上させることができる。
 本発明のベクターは実施例で示される通り、宿主細胞中で安定的に維持され得るが、脱落させることもできる。例えば、脱落は、非選択培地において継代培養を行うことで達成される。
 本発明のベクターの作製方法は特に限定されないが、例えば全合成法、PCR法、Clontech社のIn-FusionクローニングシステムやNew England Biolabs社のGibson Assembly システム等を使用することができる。
2. 形質転換体
 本発明はまた、上記1.に記載の本発明のベクターを細胞に導入する工程を含む、細胞の形質転換法に関する。
 本発明はまた、上記1.に記載の本発明のベクターにより細胞を形質転換して得られる形質転換体に関する。
 ベクターが導入され形質転換される細胞は「宿主細胞」、「宿主」又は「形質転換体」と呼ばれる。本明細書では形質転換前及び後の宿主細胞を単に「細胞」と呼ぶ場合がある。
 宿主として用いる細胞はベクターを導入することの出来る細胞であれば特に限定されない。
 形質転換に用いる宿主細胞としては、酵母、細菌、真菌、昆虫細胞、または動物細胞などが挙げられ、酵母が好ましく、メタノール資化性酵母がより好ましい。
 一般に、メタノール資化性酵母は、唯一の炭素源としてメタノールを利用して培養可能な酵母と定義されるが、本来メタノール資化性酵母であったが、人為的な改変あるいは変異によりメタノール資化性能を喪失した酵母も、本発明におけるメタノール資化性酵母に包含される。
 メタノール資化性酵母としては、ピキア(Pichia)属、オガタエア(Ogataea)属、キャンディダ(Candida)属、トルロプシス(Torulopsis)属、コマガタエラ(Komagataella)属などに属する酵母が挙げられる。ピキア(Pichia)属ではピキア・メタノリカ(Pichia methanolica)、オガタエア(Ogataea)属ではオガタエア・アングスタ(Ogataea angusta)、オガタエア・ポリモルファ(Ogataea polymorpha)、オガタエア・パラポリモルファ(Ogataea parapolymorpha)、オガタエア・ミヌータ(Ogataea minuta)、キャンディダ(Candida)属ではキャンディダ・ボイディニ(Candida boidinii)、コマガタエラ(Komagataella)属ではコマガタエラ・パストリス(Komagataella pastoris)、コマガタエラ・ファフィ(Komagataella phaffii)などが好ましい例として挙げられる。
 上記のメタノール資化性酵母のなかでも、コマガタエラ属酵母又はオガタエア属酵母が特に好ましい。
 コマガタエラ(Komagataella)属酵母としては、コマガタエラ・パストリス(Komagataella pastoris)、コマガタエラ・ファフィ(Komagataella phaffii)が好ましい。コマガタエラ・パストリスおよびコマガタエラ・ファフィはどちらもピキア・パストリス(Pichia pastoris)の別名を有する。
 具体的に宿主として使用できる株として、コマガタエラ・パストリスATCC76273(Y-11430、CBS7435)、コマガタエラ・パストリスX-33などの株が挙げられる。これらの株は、アメリカン・タイプ・カルチャー・コレクションやLife technologies社等から入手することができる。
 オガタエア(Ogataea)属酵母としては、オガタエア・アングスタ(Ogataea angusta)、オガタエア・ポリモルファ(Ogataea polymorpha)、オガタエア・パラポリモルファ(Ogataea parapolymorpha)が好ましい。これら3つは近縁種であり、いずれも、別名ハンゼヌラ・ポリモルファ(Hansenula polymorpha)、または別名ピキア・アングスタ(Pichia angusta)でも表される。
 具体的に使用できる株として、オガタエア・アングスタNCYC495(ATCC14754)、オガタエア・ポリモルファ8V(ATCC34438)、オガタエア・パラポリモルファDL-1(ATCC26012)などの株が挙げられる。これらの株は、アメリカン・タイプ・カルチャー・コレクション等から入手することができる。
 また、本発明においては、これらコマガタエラ属酵母やオガタエア属酵母の株からの誘導株も使用でき、例えばヒスチジン要求性であればコマガタエラ・パストリスGS115株(Life technologies社より入手可能)、ロイシン要求性株であれば、NCYC495由来のBY4329、8V由来のBY5242、DL-1由来のBY5243(これらはNational BioResource Projectから分譲可能)などが挙げられる。本発明においては、これらの株からの誘導株等も使用できる。
 本発明において、「形質転換体」とは、上記ベクターを細胞に導入することによって得られた、形質転換された細胞を指す。ベクターを宿主細胞へ導入する方法は公知の方法を適宜用いることができ、例えば宿主として酵母細胞を用いる場合、エレクトロポレーション法、酢酸リチウム法、スフェロプラスト法などが挙げられるが特にこれらに限定されるものではない。例えば、コマガタエラ・パストリスの形質転換法としては、High efficiency transformation by electroporation of Pichia pastoris pretreated with lithium acetate and dithiothreitol(Biotechniques. 2004 Jan;36(1):152-4.)に記載されているエレクトロポレーション法が一般的である。
 ベクターを宿主細胞に導入して形質転換する場合、栄養要求性相補遺伝子または薬剤耐性遺伝子などの選択マーカー遺伝子を含むベクターを用いることが好ましい。選択マーカーは特に限定されない。例えば宿主細胞として酵母を用いる場合は、選択マーカー遺伝子としてURA3遺伝子、LEU2遺伝子、ADE1遺伝子、HIS4遺伝子、ARG4遺伝子などの栄養要求性相補遺伝子を含むベクターを用い、それぞれウラシル、ロイシン、アデニン、ヒスチジン、アルギニンの栄養要求性株を宿主として形質転換を行い、原栄養株表現型の回復により形質転換体を選択することができる。また、選択マーカー遺伝子としてG418耐性遺伝子、Zeocin(商標)耐性遺伝子、ハイグロマイシン耐性遺伝子などの薬剤耐性遺伝子を含むベクターを用いる場合、それぞれG418、Zeocin(商標)、ハイグロマイシンを含む培地上における耐性により形質転換体を選択することができる。なお、酵母宿主を作製するときに用いる栄養要求性選択マーカーは、宿主において該選択マーカーが破壊されていない場合は、用いることができない。この場合、宿主において該選択マーカーを破壊すればよく、方法は当業者には公知の方法を用いることができる。
 形質転換体の1細胞に導入されるベクターのコピー数は特に限定されない。1細胞あたり1コピーでも良いし、2コピー以上の多コピー体として存在していてもよい。1コピー体は環状ベクター、直鎖状ベクター、人工染色体として存在する状態でもよいし、宿主由来の染色体に組み込まれた状態でもよい。2コピー以上の多コピー体は、全て環状ベクター、直鎖状ベクター、人工染色体として存在する状態でもよいし、全て宿主由来の染色体に組み込まれた状態でもよいし、両方の状態が同時に起こっていてもよい。
 2コピー以上の多コピー体は、同一のベクターを2コピー以上保有する多コピー体であっても、異なるベクターを1コピー以上ずつ保有する多コピー体であってもよい。
 形質転換体に導入されるベクターは、直鎖状ベクターの状態で形質転換して宿主細胞内にて環化されて環状ベクターとして存在してもよいし、環状ベクターの状態で形質転換して宿主細胞内にて切断されて直鎖状ベクターとして存在してもよい。
 形質転換体の培養条件は特に限定されず、形質転換体に応じて適宜選択すればよい。該培養においては、形質転換体が資化しうる栄養源を含む培地であれば何でも使用できる。該栄養源としては、グルコース、シュークロース、マルトース等の糖類、乳酸、酢酸、クエン酸、プロピオン酸等の有機酸類、メタノール、エタノール、グリセロール等のアルコール類、パラフィン等の炭化水素類、大豆油、菜種油等の油類、またはこれらの混合物等の炭素源、硫酸アンモニウム、リン酸アンモニウム、尿素、酵母エキス、肉エキス、ペプトン、コーンスチープリカー等の窒素源、更に、その他の無機塩、ビタミン類等の栄養源を適宜混合・配合した通常の培地を用いることができる。
 本発明のベクターは、目的の生産物を製造するために用いることができる。「目的の生産物」とは、本発明のベクターが導入された形質転換体が生産する生産物であって、例えば抗生物質、カロテノイドやビタミン等の二次代謝物質、タンパク質、融合タンパク質、医薬品、抗体、サイトカイン、酵素等を指す。
 例えば、本発明のベクターを細胞に導入することによって得られた形質転換体を、培養することで宿主中または培養液中に目的の生産物を蓄積させ、回収することができる。目的の生産物の回収方法については、公知の精製法を適当に組み合わせて用いることができる。
 本発明のベクターは、所望の物質をスクリーニングするために用いることができる。例えば、CRISPR-Cas9等のゲノム編集用酵素や変異型DNAポリメラーゼ、cDNA又はsiRNAライブラリ、目的生産タンパク質の改変遺伝子ライブラリ、プロモーターライブラリ、ターミネーターライブラリ、非翻訳領域ライブラリ、タグライブラリ等を含むベクターを用いて所望の物質をスクリーニングすることができる。
 更に、本発明のベクターは、形質転換体を用いずとも、無細胞タンパク質合成系のような生体外のタンパク質合成にも用いることができる。
 以下、実施例により本発明を詳細に説明するが、本発明はこれらにより限定されるものではない。なお、以下の実施例において用いた組換えDNA技術に関する詳細な操作方法などは、次の成書に記載されている:
Molecular Cloning 2nd Edition(Cold Spring Harbor Laboratory Press,1989)、Current Protocolsin Molecular Biology(Greene Publishing Associates and Wiley-Interscience)、Current Protocols in Molecular Biology(Greene Publishing Associates and Wiley-Interscience)。
 また、以下の実施例において、酵母の形質転換に用いるプラスミドは、構築したベクターを大腸菌E. coli DH5αコンピテントセル(タカラバイオ社製)もしくは大腸菌E. coli HST08 Premium コンピテントセル(タカラバイオ社製)にそれぞれ導入し、得られた形質転換体を培養して増幅することによって調製した。プラスミド保持株からのプラスミドの調製は、QIAprep spin miniprep kit(QIAGEN社製)を用いて行った。
 ベクターの構築において利用したセントロメアDNA配列1(配列番号1)、セントロメアDNA配列2(配列番号2)、セントロメアDNA配列3(配列番号3)、セントロメアDNA配列4(配列番号4)はコマガタエラ・パストリスATCC76273株の染色体DNA(塩基配列はEMBL (The European Molecular Biology Laboratory) ACCESSION No. FR839628~FR839631に記載)混合物をテンプレートにしてセントロメアDNA配列1はプライマー3(配列番号8)、セントロメアDNA配列2はプライマー4(配列番号9)、セントロメアDNA配列3はプライマー5(配列番号10)、セントロメアDNA配列4はプライマー6(配列番号11)、を用いてPCRで調製した。
 ベクターの構築において利用した、プロモーターで制御されたZeocin(商標)耐性遺伝子(配列番号5)は合成DNAをテンプレートにしてPCRで調製した。ベクターの構築において利用した、プロモーターで制御されたGFP遺伝子(配列番号32)は合成DNAをテンプレートにしてPCRで調製した。
 PCRにはPrime STAR HS DNA Polymerase(タカラバイオ社製)等を用い、反応条件は添付のマニュアルに記載の方法で行った。染色体DNAの調製は、コマガタエラ・パストリスATCC76273株からGenとるくん(商標)(タカラバイオ社製)等を用いて、これに記載の条件で実施した。
実施例1: Zeocin(商標)耐性遺伝子を含むベクターの構築
 Zeocin(商標)耐性遺伝子(配列番号5)の上流にHindIII認識配列とNotI認識配列、下流にEcoRI認識配列を付加したDNA断片を、配列番号5からなるDNA断片をテンプレートとしプライマー1および2(配列番号6および7)を用いたPCRにより調製し、これをpUC19 (タカラバイオ社製、Code No. 3219)のHindIII-EcoRIサイト間に挿入して、pUC-Zを調製した。
実施例2: GFP遺伝子を含むベクターの構築
 GFP遺伝子(配列番号32)の上流にHindIII認識配列とNotI認識配列、下流にEcoRI認識配列を付加したDNA断片を、配列番号32からなるDNA断片をテンプレートとしプライマー15および16(配列番号33および34)を用いたPCRにより調製し、これをpUC19のHindIII-EcoRIサイト間に挿入して、pUC-Gを調製した。
実施例3: 配列番号12、15、18、21を含む自律複製型ベクターの構築
 配列番号12の上流及び下流にNotI認識配列を付加したDNA断片を、配列番号1からなるDNA断片をテンプレートとしプライマー7及び8(配列番号24及び25)を用いたPCRにより調製し、これをpUC-GのNotIサイト間に挿入して、pUC-G-KNT1を調製した。
 配列番号15の上流及び下流にNotI認識配列を付加したDNA断片を、配列番号2からなるDNA断片をテンプレートとしプライマー9及び10(配列番号26及び27)を用いたPCRにより調製し、これをpUC-GのNotIサイト間に挿入して、pUC-G-KNT2を調製した。
 配列番号18の上流及び下流にNotI認識配列を付加したDNA断片を、配列番号3からなるDNA断片をテンプレートとしプライマー11及び12(配列番号28及び29)を用いたPCRにより調製し、これをpUC-GのNotIサイト間に挿入して、pUC-G-KNT3を調製した。
 配列番号21の上流及び下流にNotI認識配列を付加したDNA断片を、配列番号4からなるDNA断片をテンプレートとしプライマー13及び14(配列番号30及び31)を用いたPCRにより調製し、これをpUC-GのNotIサイト間に挿入して、pUC-G-KNT4を調製した。
実施例4: 形質転換酵母の取得、蛍光測定
 実施例2で構築したGFP遺伝子を含むベクターpUC-G及び実施例3で構築したセントロメアDNA中心配列を含むベクターpUC-G-KNT1、pUC-G-KNT2、pUC-G-KNT3、pUC-G-KNT4を用いて、以下のようにコマガタエラ・パストリスを形質転換した。
 コマガタエラ・パストリスATCC76273株を3mlのYPD培地(1% yeast extract bacto(Difco社製)、2% polypeptone(日本製薬社製)、2% glucose)に接種し、30℃で一晩振盪培養して、前培養液を得た。得られた前培養液500μlを50mlのYPD培地に接種し、OD600が1~1.5になるまで30℃で振盪培養後、集菌(3000×g、10分、20℃)し、250μlの1M DTT(終濃度25mM)を含む10mlの50mMリン酸カリウムバッファー,pH7.5に再懸濁した。
 この懸濁液を30℃で15分インキュベート後、集菌(3000×g、10分、20℃)し、予め氷冷した50mlのSTMバッファー(270mMスクロース, 10mM Tris-HCl, 1mM塩化マグネシウム, pH7.5)で洗浄した。洗浄液を集菌(3000×g、10分、4℃)し、25mlの氷冷STMバッファーで再度洗浄したのち、集菌(3000×g、10分、4℃)した。最終的に、250μlの氷冷STMバッファーに懸濁し、これをコンピテントセル溶液とした。
 このコンピテントセル溶液60μlとpUC-G溶液5μl(ベクター量として1 μg)又はpUC-G-KNT1溶液5μl(同1 μg)又はpUC-G-KNT2溶液5μl(同1μg)又はpUC-G-KNT3溶液5μl(同1 μg)又はpUC-G-KNT4溶液5μl(同1 μg)を混合し、エレクトロポレーション用キュベット(ディスポキュベット電極,電極間隔2mm;ビーエム機器社製)に移し入れ、7.5kV/cm、25μF、200Ωに供した後、菌体を1mlのYPD培地で懸濁し、30℃で2時間静置した。2時間静置後、集菌(3000×g、5分、室温)し、上清を廃棄した。残った菌体を30℃のYNB培地(0.17% Yeast Nitrogen Base Without Amino Acid(Difco社製))で再懸濁し、FACS(Fluorescence Activated Cell Sorting)法を用いて蛍光を発する形質転換細胞を収集した。収集した細胞を30℃で2時間静置培養中に蛍光顕微鏡により観察したところ、pUC-Gの形質転換体は蛍光の低下が確認されたのに対し、pUC-G-KNT1、pUC-G-KNT2、pUC-G-KNT3、pUC-G-KNT4の形質転換体は蛍光が維持されていることが確認された。これはつまり、配列番号12、15、18、21からなる核酸が、宿主中におけるベクターの安定性に対して効果を発揮していることを示している。
実施例5: セントロメアDNA配列を含む自律複製型ベクターの構築
 配列番号1の上流及び下流にNotI認識配列を付加したDNA断片を、配列番号1からなるDNA断片をテンプレートとしプライマー3(配列番号8)を用いたPCRにより調製し、これをpUC-ZのNotIサイト間に挿入して、pUC-Z-CEN1を調製した。
 配列番号2の上流及び下流にNotI認識配列を付加したDNA断片を、配列番号2からなるDNA断片をテンプレートとしプライマー4(配列番号9)を用いたPCRにより調製し、これをpUC-ZのNotIサイト間に挿入して、pUC-Z-CEN2を調製した。
 配列番号3の上流及び下流にNotI認識配列を付加したDNA断片を、配列番号3からなるDNA断片をテンプレートとしプライマー5(配列番号10)を用いたPCRにより調製し、これをpUC-ZのNotIサイト間に挿入して、pUC-Z-CEN3を調製した。
 配列番号4の上流及び下流にNotI認識配列を付加したDNA断片を、配列番号4からなるDNA断片をテンプレートとしプライマー6(配列番号11)を用いたPCRにより調製し、これをpUC-ZのNotIサイト間に挿入して、pUC-Z-CEN4を調製した。
 配列番号1は配列番号12に示す塩基配列の上流に配列番号13に示す塩基配列が存在し、また配列番号12に示す塩基配列の下流に配列番号13に示す塩基配列と相補的な塩基配列(配列番号14)が存在するように設計されている。
 配列番号2は配列番号15に示す塩基配列の上流に配列番号16に示す塩基配列が存在し、また配列番号15に示す塩基配列の下流に配列番号16に示す塩基配列と相補的な塩基配列(配列番号17)が存在するように設計されている。
 配列番号3は配列番号18に示す塩基配列の上流に配列番号19に示す塩基配列が存在し、また配列番号18に示す塩基配列の下流に配列番号19に示す塩基配列と相補的な塩基配列(配列番号20)が存在するように設計されている。
 配列番号4は配列番号21に示す塩基配列の上流に配列番号22に示す塩基配列が存在し、また配列番号21に示す塩基配列の下流に配列番号22に示す塩基配列と相補的な塩基配列(配列番号23)が存在するように設計されている。
 配列番号13のDNA配列の上流及び下流にNotI認識配列を付加したDNA断片を、配列番号1からなるDNA断片をテンプレートとしプライマー3及び17(配列番号8及び35)を用いたPCRにより調製し、これをpUC-ZのNotIサイト間に挿入して、pUC-Z-Comp1を調製した。
 配列番号16のDNA配列の上流及び下流にNotI認識配列を付加したDNA断片を、配列番号2からなるDNA断片をテンプレートとしプライマー4及び18(配列番号9及び36)を用いたPCRにより調製し、これをpUC-ZのNotIサイト間に挿入して、pUC-Z-Comp2を調製した。
 配列番号19のDNA配列の上流及び下流にNotI認識配列を付加したDNA断片を、配列番号3からなるDNA断片をテンプレートとしプライマー5及び19(配列番号10及び37)を用いたPCRにより調製し、これをpUC-ZのNotIサイト間に挿入して、pUC-Z-Comp3を調製した。
 配列番号22のDNA配列の上流及び下流にNotI認識配列を付加したDNA断片を、配列番号4からなるDNA断片をテンプレートとしプライマー6及び20(配列番号11及び38)を用いたPCRにより調製し、これをpUC-ZのNotIサイト間に挿入して、pUC-Z-Comp4を調製した。
 配列番号12に示す塩基配列の上流に配列番号13に示す塩基配列が存在するDNA配列の上流及び下流にNotI認識配列を付加したDNA断片を、配列番号1からなるDNA断片をテンプレートとしプライマー3及び8(配列番号8及び25)を用いたPCRにより調製し、これをpUC-ZのNotIサイト間に挿入して、pUC-Z-Comp1KNT1を調製した。
 配列番号15に示す塩基配列の上流に配列番号16に示す塩基配列が存在するDNA配列の上流及び下流にNotI認識配列を付加したDNA断片を、配列番号2からなるDNA断片をテンプレートとしプライマー4及び10(配列番号9及び27)を用いたPCRにより調製し、これをpUC-ZのNotIサイト間に挿入して、pUC-Z-Comp2KNT2を調製した。
 配列番号18に示す塩基配列の上流に配列番号19に示す塩基配列が存在するDNA配列の上流及び下流にNotI認識配列を付加したDNA断片を、配列番号3からなるDNA断片をテンプレートとしプライマー5及び12(配列番号10及び29)を用いたPCRにより調製し、これをpUC-ZのNotIサイト間に挿入して、pUC-Z-Comp3KNT3を調製した。
 配列番号21に示す塩基配列の上流に配列番号22に示す塩基配列が存在するDNA配列の上流及び下流にNotI認識配列を付加したDNA断片を、配列番号4からなるDNA断片をテンプレートとしプライマー6及び14(配列番号11及び31)を用いたPCRにより調製し、これをpUC-ZのNotIサイト間に挿入して、pUC-Z-Comp4KNT4を調製した。
実施例6: 形質転換酵母の取得
 実施例1で構築したZeocin(商標)耐性遺伝子を含むベクターpUC-Z及び実施例5で構築したセントロメアDNA配列を含むベクターpUC-Z-CEN1、pUC-Z-CEN2、pUC-Z-CEN3、pUC-Z-CEN4、pUC-Z-Comp1、pUC-Z-Comp2、pUC-Z-Comp3、pUC-Z-Comp4、pUC-Z-Comp1KNT1、pUC-Z-Comp2KNT2、pUC-Z-Comp3KNT3、pUC-Z-Comp4KNT4を用いて、以下のようにコマガタエラ・パストリスを形質転換した。
 コマガタエラ・パストリスATCC76273株を3mlのYPD培地(1% yeast extract bacto(Difco社製)、2% polypeptone(日本製薬社製)、2% glucose)に接種し、30℃で一晩振盪培養して、前培養液を得た。得られた前培養液500μlを50mlのYPD培地に接種し、OD600が1~1.5になるまで30℃で振盪培養後、集菌(3000×g、10分、20℃)し、250μlの1M DTT(終濃度25mM)を含む10mlの50mMリン酸カリウムバッファー,pH7.5に再懸濁した。
 この懸濁液を30℃で15分インキュベート後、集菌(3000×g、10分、20℃)し、予め氷冷した50mlのSTMバッファー(270mMスクロース, 10mM Tris-HCl, 1mM塩化マグネシウム, pH7.5)で洗浄した。洗浄液を集菌(3000×g、10分、4℃)し、25mlの氷冷STMバッファーで再度洗浄したのち、集菌(3000×g、10分、4℃)した。最終的に、250μlの氷冷STMバッファーに懸濁し、これをコンピテントセル溶液とした。
 このコンピテントセル溶液60μlとベクター溶液1μl(ベクター量として100 ng)を混合し、エレクトロポレーション用キュベット(ディスポキュベット電極,電極間隔2mm;ビーエム機器社製)に移し入れ、7.5kV/cm、25μF、200Ωに供した後、菌体を1mlのYPD培地で懸濁し、30℃で1時間静置した。1時間静置後、集菌(3000×g、5分、室温)し、上清861μlを廃棄した。残った溶液200μlで再懸濁し、YPDZeocin(商標)選択寒天プレート(1% yeast extract bacto(Difco社製)、2% polypeptone(日本製薬社製)、2% glucose、1.5%アガロース、0.01%Zeocin(商標) (Life Technologies社製))に100μl塗布し、30℃、3日間の静置培養で生育する株を選択し、形質転換効率(ベクター1μgあたりのコロニー数、cfu/μg)を算出した(表1)。
 その結果、pUC-Zの形質転換効率に対して、pUC-Z-CEN1、pUC-Z-CEN2、pUC-Z-CEN3、pUC-Z-CEN4、pUC-Z-Comp1、pUC-Z-Comp2、pUC-Z-Comp3、pUC-Z-Comp4、pUC-Z-Comp1KNT1、pUC-Z-Comp2KNT2、pUC-Z-Comp3KNT3、pUC-Z-Comp4KNT4は明らかに高い形質転換効率を示した。pUC-Zは自律複製配列を持たないため形質転換が起こらなかったと考えられ、pUC-Z-CEN1、pUC-Z-CEN2、pUC-Z-CEN3、pUC-Z-CEN4、pUC-Z-Comp1、pUC-Z-Comp2、pUC-Z-Comp3、pUC-Z-Comp4、pUC-Z-Comp1KNT1、pUC-Z-Comp2KNT2、pUC-Z-Comp3KNT3、pUC-Z-Comp4KNT4は自律複製配列を有するため自律複製型プラスミドとして形質転換酵母細胞に存在できることから、形質転換効率が向上したと考えられる。
Figure JPOXMLDOC01-appb-T000001
実施例7: プラスミド保持確認
 実施例6で得られた12種の形質転換酵母について、それぞれ10株のコロニー菌体から、Easy Yeast Plasmid Isolation Kit(クロンテック社製)を用いてプラスミド溶液を調製した。続いて、得られたプラスミド溶液をE. coli HST08 Premium コンピテントセル(タカラバイオ社製)に導入したところ、pUC-Z-CEN1、pUC-Z-CEN2、pUC-Z-CEN3、pUC-Z-CEN4、pUC-Z-Comp1、pUC-Z-Comp2、pUC-Z-Comp3、pUC-Z-Comp4、pUC-Z-Comp1KNT1、pUC-Z-Comp2KNT2、pUC-Z-Comp3KNT3、pUC-Z-Comp4KNT4によって形質転換された酵母由来のサンプルからは全てLBAmp選択寒天プレート(1% Trypton(ナカライテスク社製)、1% 塩化ナトリウム、0.5% yeast extract bacto(Difco社製)、0.01%アンピシリンナトリウム(和光純薬工業社製))上にE. coliコロニーが出現した。またそのE. coliコロニーからプラスミドを調製したところ、調製されたプラスミドが、酵母に導入したpUC-Z-CEN1、pUC-Z-CEN2、pUC-Z-CEN3、pUC-Z-CEN4、pUC-Z-Comp1、pUC-Z-Comp2、pUC-Z-Comp3、pUC-Z-Comp4、pUC-Z-Comp1KNT1、pUC-Z-Comp2KNT2、pUC-Z-Comp3KNT3、pUC-Z-Comp4KNT4であること、及びそれ以外の宿主由来の配列が存在しない事を配列解析によって確認した。これはつまり、pUC-Z-CEN1、pUC-Z-CEN2、pUC-Z-CEN3、pUC-Z-CEN4、pUC-Z-Comp1、pUC-Z-Comp2、pUC-Z-Comp3、pUC-Z-Comp4、pUC-Z-Comp1KNT1、pUC-Z-Comp2KNT2、pUC-Z-Comp3KNT3、pUC-Z-Comp4KNT4は自律複製配列を有するため自律複製型プラスミドとして形質転換酵母細胞に存在していることを示唆している。
実施例8: Zeocin(商標)耐性遺伝子及び調節配列を含むベクターの構築
 ハンゼヌラ酵母のMOXターミネーターであるTmox配列(配列番号82)の上流に、上流から下流に向かって、HindIII認識配列、NotI認識配列、BamHI認識配列、SpeI認識配列、MunI認識配列、BglII認識配列、及びXbaI認識配列、Tmox配列の下流に、上流から下流に向かって、XbaI認識配列、EcoRI認識配列を付加したDNA断片を、オガタエア・ポリモルファ8V(ATCC34438)株の染色体DNAをテンプレートとして、プライマー23及び24(配列番号74及び75)を用いたPCRにより増幅し、これをpUC19 (タカラバイオ社製、Code No. 3219)のHindIII-EcoRIサイト間に挿入して、pUC_Tmoxを調製した。
 HpPgap(配列番号83)の上流及び下流にEcoRI認識配列を付加したDNA断片を、オガタエア・ポリモルファ8V(ATCC34438)株の染色体DNAをテンプレートとして、プライマー27及び28(配列番号78及び79)を用いたPCRにより増幅し、これをpUC_TmoxのMunIサイト間に挿入して、pUC_HpPgap_Tmoxを調製した。EcoRI切断末端とMunI切断末端はLigation可能であるため、EcoRI認識配列を付加した上記DNA断片をpUC_TmoxのMunIサイト間に挿入することが可能である。なお、Ligationされた部位はEcoRIでは切断されない。
 ハンゼヌラ酵母のGAPプロモーターであるHpPgap(配列番号83)の上流及び下流にBamHI認識配列を付加したDNA断片を、オガタエア・ポリモルファ8V(ATCC34438)株の染色体DNAをテンプレートとして、プライマー25及び26(配列番号76及び77)を用いたPCRにより増幅し、これをpUC_HpPgap_TmoxのBamHIサイト間に挿入して、pUC_HpPgap_HpPgap_Tmoxを調製した。
 Zeocin(商標)耐性遺伝子(配列番号5の681位~1535位の塩基配列)の上流及び下流にEcoRI認識配列を付加したDNA断片を、配列番号5の681位~1535位の塩基配列からなるDNA断片をテンプレートとし、プライマー29及び30(配列番号80及び81)を用いたPCRにより調製し、これをpUC_HpPgap_HpPgap_TmoxのEcoRIサイト間に挿入して、pUC_HpPgap_HpPgap_Tmox_Zeo(以下、本ベクターを単に「pUC-Z2」とも称する)を調製した。pUC-Z2は、pUC19のHindIII及びEcoRIサイト間に配列番号84からなる塩基配列を含むベクターである。
実施例9:自律複製配列の特定
 本実施例では、Comp2及びComp3内の自律複製配列の特定を行った。
 まず、Comp2(配列番号16、全長2699塩基対)の約1-2400bpを基準に約300bpずつ短縮した各塩基配列の上流及び下流に制限酵素認識配列を含むDNA断片を、配列番号2からなるDNA断片をテンプレートとしプライマーを用いたPCRにより調製し、これをpUC-Z2の制限酵素部位に挿入して、ベクターを調製した。ベクターに挿入した配列、断片の増幅に用いたプライマーの配列、及び増幅した配列のベクターへの挿入に用いた制限酵素を以下の表2に示す。
 また、Comp3(配列番号19、全長2649塩基対)についても同様に、1-2400bpから約300bpずつ短くした塩基配列の上流及び下流に制限酵素認識配列を含むDNA断片を、配列番号3からなるDNA断片をテンプレートとしプライマーを用いたPCRにより調製し、これをpUC-Z2の制限酵素部位に挿入して、ベクターを調製した。ベクターに挿入した配列、断片の増幅に用いたプライマーの配列、及び増幅した配列のベクターへの挿入に用いた制限酵素を以下の表2に示す。
Figure JPOXMLDOC01-appb-T000002
 実施例6に記載の方法に従って、これらのベクターをコマガタエラ・パストリスに形質転換し、形質転換効率(cfu/μg)を算出し、形質転換効率が100以上である場合を+、100未満である場合を-とした(表3)。
 その結果、Comp2については、いずれの配列を含むベクターでも高い形質転換効率が認められたことから、配列番号16の1-291位の塩基配列中に自律複製配列が存在することが示唆された。
 Comp3については、1-300位の配列を除くいずれの配列の含むベクターでも高い形質転換効率が認められたことから、配列番号19の300-600位の塩基配列中に自律複製配列が存在することが示唆された。
Figure JPOXMLDOC01-appb-T000003
 続いて、Comp2(配列番号16)の1-111位(Comp2_1-111)、84-213位(Comp2_84-213)、191-291位(Comp2_191-291)、84-2699位(Comp2_84-2699)の塩基配列の上流及び下流に制限酵素認識配列を含むDNA断片を、配列番号2からなるDNA断片をテンプレートとしプライマーを用いたPCRにより増幅し、これをpUC-Z2の制限酵素認識部位に挿入して、ベクターを調製した。ベクターに挿入した配列、断片の増幅に用いたプライマーの配列、及び増幅した配列のベクターへの挿入に用いた制限酵素を以下の表4に示す。
 また、Comp3(配列番号19)についても、268-404位(Comp3_268-404)、383-503位(Comp3_383-503)、480-600位(Comp3_500-600)、268-503位(Comp3_268-503)、383-600位(Comp3_383-600)、480-2649位(Comp3_480-2649)の塩基配列の上流及び下流に制限酵素認識配列を含むDNA断片を、配列番号3からなるDNA断片をテンプレートとしてプライマーを用いたPCRにより増幅し、これをpUC-Z2の制限酵素部位に挿入して、ベクターを調製した。ベクターに挿入した配列、断片の増幅に用いたプライマーの配列、及び増幅した配列のベクターへの挿入に用いた制限酵素を以下の表4に示す。
Figure JPOXMLDOC01-appb-T000004
 実施例6に記載の方法に従って、これらのベクターをコマガタエラ・パストリスに形質転換し、形質転換効率(cfu/μg)を算出し、形質転換効率が100以上である場合を+、100未満である場合を-とした(表5)。
 その結果、Comp2については、Comp2_1-111を含むベクターにおいてのみ高い形質転換効率が認められたことから、配列番号16の1-111位の塩基配列(配列番号41)中に自律複製配列が存在することが示唆された。一方、Comp2_84-2699を含むベクターでは形質転換効率が極めて低く、これは配列番号16の1-111位の塩基配列(配列番号41)中の自律複製配列以外に、Comp2内に自律複製配列が存在しないことを示唆している。
 Comp3については、Comp3_383-600を含むベクターにおいてのみ高い形質転換効率が認められたことから、配列番号19の383-600位の塩基配列(配列番号42)中に自律複製配列が存在することが示唆された。一方、Comp3_480-2699では形質転換効率が極めて低く、これは配列番号19の383-600位の塩基配列(配列番号42)中の自律複製配列以外に、Comp3内に自律複製配列が存在しないことを示唆している。
Figure JPOXMLDOC01-appb-T000005
実施例10: 自律複製配列と他の配列を組合せた場合の形質転換効率の確認
 自律複製配列と他の配列を含むベクターの形質転換効率を調べるために、以下のベクターを調製した。
 配列番号16のDNA配列の1-111 bp(配列番号41)の上流及び下流にHindIIII認識配列を付加したDNA断片を、配列番号2からなるDNA断片をテンプレートとしプライマー21及び22(配列番号39及び40)を用いたPCRにより調製し、これをpUC-Z2のHindIIIサイト間に挿入して、pUC-Z2-ARS2を調製した。
 配列番号1の上流及び下流にNotI認識配列を付加したDNA断片を、配列番号1からなるDNA断片をテンプレートとしプライマー3(配列番号8)を用いたPCRにより調製し、これをpUC-Z2-ARS2のNotIサイト間に挿入して、pUC-Z2-ARS2-CEN1を調製した。
 配列番号3の上流及び下流にNotI認識配列を付加したDNA断片を、配列番号3からなるDNA断片をテンプレートとしプライマー5(配列番号10)を用いたPCRにより調製し、これをpUC-Z2-ARS2のNotIサイト間に挿入して、pUC-Z2-ARS2-CEN3を調製した。
 配列番号4の上流及び下流にNotI認識配列を付加したDNA断片を、配列番号4からなるDNA断片をテンプレートとしプライマー6(配列番号11)を用いたPCRにより調製し、これをpUC-Z2-ARS2のNotIサイト間に挿入して、pUC-Z2-ARS2-CEN4を調製した。
 配列番号13のDNA配列の上流及び下流にNotI認識配列を付加したDNA断片を、配列番号1からなるDNA断片をテンプレートとしプライマー3及び17(配列番号8及び35)を用いたPCRにより調製し、これをpUC-Z2-ARS2のNotIサイト間に挿入して、pUC-Z2-ARS2-Comp1を調製した。
 配列番号19のDNA配列の上流及び下流にNotI認識配列を付加したDNA断片を、配列番号3からなるDNA断片をテンプレートとしプライマー5及び19(配列番号10及び37)を用いたPCRにより調製し、これをpUC-Z2-ARS2のNotIサイト間に挿入して、pUC-Z2-ARS2-Comp3を調製した。
 配列番号22のDNA配列の上流及び下流にNotI認識配列を付加したDNA断片を、配列番号4からなるDNA断片をテンプレートとしプライマー6及び20(配列番号11及び38)を用いたPCRにより調製し、これをpUC-Z2-ARS2のNotIサイト間に挿入して、pUC-Z2-ARS2-Comp4を調製した。
 配列番号12に示す塩基配列の上流に配列番号13に示す塩基配列が存在するDNA配列の上流及び下流にNotI認識配列を付加したDNA断片を、配列番号1からなるDNA断片をテンプレートとしプライマー3及び8(配列番号8及び25)を用いたPCRにより調製し、これをpUC-Z2-ARS2のNotIサイト間に挿入して、pUC-Z2-ARS2-Comp1KNT1を調製した。
 配列番号18に示す塩基配列の上流に配列番号19に示す塩基配列が存在するDNA配列の上流及び下流にNotI認識配列を付加したDNA断片を、配列番号3からなるDNA断片をテンプレートとしプライマー5及び12(配列番号10及び29)を用いたPCRにより調製し、これをpUC-Z2-ARS2のNotIサイト間に挿入して、pUC-Z2-ARS2-Comp3KNT3を調製した。
 配列番号21に示す塩基配列の上流に配列番号22に示す塩基配列が存在するDNA配列の上流及び下流にNotI認識配列を付加したDNA断片を、配列番号4からなるDNA断片をテンプレートとしプライマー6及び14(配列番号11及び31)を用いたPCRにより調製し、これをpUC-Z2-ARS2のNotIサイト間に挿入して、pUC-Z2-ARS2-Comp4KNT4を調製した。
 実施例6に記載の方法に従って、これらのベクターをコマガタエラ・パストリスに形質転換し、形質転換効率(cfu/μg)を算出し、形質転換効率が100以上である場合を+、100未満である場合を-とした(表6)。
 その結果、いずれのベクターについても高い形質転換効率が認められたことから、ARS2に加えて、CEN1、CEN3、CEN4、Comp1、Comp3、Comp4、Comp1KNT1、Comp3KNT3、又はComp4KNT4を含むベクターが自律複製活性を有することが示された。
 これらのベクターについて、実施例7に記載の方法に従ってプラスミド保持確認を行ったところ、E.coli内で保持されており、いずれのベクターも自律複製型プラスミドとして形質転換酵母細胞に存在していることが示唆された。
Figure JPOXMLDOC01-appb-T000006
実施例11: プラスミドの安定性確認
 実施例6で得られた形質転換酵母を3mlのYPD培地に接種し、30℃で一晩振盪培養した。次にこの培養液3μlを新しい3mlのYPD培地に接種し、30℃で一晩振盪培養した。この操作を3回(3晩)繰り返した後、最終的に得られた培養液を希釈後、YPD寒天プレート(1% yeast extract bacto(Difco社製)、2% polypeptone(日本製薬社製)、2% glucose、1.5%アガロース)に塗布した。30℃、3日間の静置培養で生育してきた株を96株選択し、YPD寒天プレート及びYPDZeocin(商標)選択寒天プレートに接種して、30℃で一晩静置培養した。
 その結果、pUC-Z-Comp1又はpUC-Z-Comp2又はpUC-Z-Comp3又はpUC-Z-Comp4によって形質転換された酵母由来のサンプルに対しpUC-Z-Comp1KNT1又はpUC-Z-Comp2KNT2又はpUC-Z-Comp3KNT3又はpUC-Z-Comp4KNT4によって形質転換された酵母由来のサンプルは両方のプレートにて生育してきたコロニー数が明らかに多かった(表7)。これは実施例4でも示したように配列番号12、15、18、21がベクターの安定性に対して効果を発揮していることを示している。また、pUC-Z-Comp1KNT1又はpUC-Z-Comp2KNT2又はpUC-Z-Comp3KNT3又はpUC-Z-Comp4KNT4によって形質転換された酵母由来のサンプルに対しpUC-Z-CEN1又はpUC-Z-CEN2又はpUC-Z-CEN3又はpUC-Z-CEN4によって形質転換された酵母由来のサンプルは両方のプレートにて生育してきたコロニー数が明らかに多かった(表7)。これはつまり、セントロメアDNA中心配列の上流と下流が相補的な塩基配列となることによって特段の安定性効果が発揮されることを示しており、選択圧のない状態における継代培養においても、プラスミドベクターがセントロメアDNA配列を有することにより安定的に保持されていることを示している。
 尚、実施例7と同様に、生育した酵母からプラスミドを調製し、E. coli HST08 Premium コンピテントセルに導入したところ、LBAmp選択寒天プレート(1% Trypton(ナカライテスク社製)、1% 塩化ナトリウム、0.5% yeast extract bacto(Difco社製)、0.01%アンピシリンナトリウム(和光純薬工業社製))上にE. coliコロニーが出現したことを確認し、またそのE. coliコロニーからプラスミドを調製したところ、調製されたプラスミドが、酵母に導入したベクターと同一であることを確認している。
Figure JPOXMLDOC01-appb-T000007
実施例12: 自律複製配列と他の配列を組み合わせた場合のプラスミドの安定性確認
 実施例10で調製したpUC-Z2-ARS2、pUC-Z2-ARS2-CEN1、pUC-Z2-ARS2-CEN4、pUC-Z2-ARS2-Comp1、pUC-Z2-ARS2-Comp4、pUC-Z2-ARS2-Comp1KNT1、pUC-Z2-ARS2-Comp4KNT4を用いて、実施例6に従って形質転換酵母を調製した。
 続いて、この形質転換酵母を用いて、実施例11に従ってプラスミドの安定性確認を行った。
 結果を表8に示す。pUC-Z2-ARS2によって形質転換された酵母由来のサンプルは両方のプレートにて生育してきたコロニーは存在しなかった。これは、自律複製配列のみでは選択圧のない状態における継代培養においてプラスミドベクターが安定的に保持されないことを示している。
 一方、pUC-Z2-ARS2-Comp1KNT1又はpUC-Z2-ARS2-Comp4KNT4によって形質転換された酵母由来のサンプルは両方のプレートにて生育してきたコロニー数が明らかに多かった。これは実施例4でも示したように、配列番号12、21がベクターの安定性に対して効果を発揮していることを示している。また、pUC-Z2-ARS2-CEN1又はpUC-Z2-ARS2-CEN4によって形質転換された酵母由来のサンプルは両方のプレートにて生育してきたコロニー数がさらに多かった。これは、実施例4、11でも示したように、セントロメアDNA中心配列の上流と下流が相補的な塩基配列となることによって特段の安定性効果が発揮されることを示しており、選択圧のない状態における継代培養においても、プラスミドベクターがセントロメアDNA配列を有することにより安定的に保持されていることを示している。
Figure JPOXMLDOC01-appb-T000008
実施例13:pUC-Z2ベクターがpUC-Zベクターと同等であることの確認
 pUC-Zの代わりに実施例8で調製したpUC-Z2を用いて、実施例5に従ってベクターを調製し、これらについて、実施例6~7及び実施例11に従って試験したところ、いずれも、pUC-Z2を用いた場合でもpUC-Zを用いた場合と同様の結果が得られた。
実施例14:配列番号5と配列番号5の681位~1535位が同等であることの確認
 配列番号5の塩基配列の代わりに配列番号5の681位~1535位の塩基配列を用いて、実施例1及び5に従ってベクターを調製し、これらについて、実施例6~7及び実施例11に従って試験したところ、いずれも、配列番号5の681位~1535位の塩基配列を用いた場合でも配列番号5の塩基配列を用いた場合と同様の結果が得られた。
 本明細書で引用した全ての刊行物、特許及び特許出願はそのまま引用により本明細書に組み入れられるものとする。

Claims (24)

  1.  以下の(a)~(d)のいずれかの塩基配列;
     (a)配列番号12、15、18、又は21に示す塩基配列;
     (b)配列番号12、15、18、又は21に示す塩基配列に相補的な塩基配列からなる核酸とストリンジェントな条件下でハイブリダイズする核酸の塩基配列;
     (c)配列番号12、15、18、又は21に示す塩基配列と85%以上の配列同一性を有する塩基配列;
     (d)配列番号12、15、18、又は21に示す塩基配列において、1もしくは複数個の塩基が置換、欠失、挿入及び/又は付加した塩基配列;
    を含むベクター。
  2.  前記(a)~(d)のいずれかの塩基配列の上流と下流に位置する塩基配列が、以下の(e)~(g)のいずれかの塩基配列の対;
     (e)上流の塩基配列と下流の塩基配列とが相補的な塩基配列である対;
     (f)上流の塩基配列と下流の塩基配列とがストリンジェントな条件下で相互にハイブリダイズする核酸の塩基配列である対;
     (g)上流の塩基配列と下流の塩基配列とが一方の相補的な塩基配列と85%以上の配列同一性を有する塩基配列である対;
    をそれぞれ含む、請求項1に記載のベクター。
  3.  前記(a)~(d)のいずれかに記載の塩基配列のGC含有率を1としたときの、前記(e)~(g)のいずれかに記載の上流及び/又は下流の塩基配列のGC含有率が0.8以上であり、1.2以下である請求項2に記載のベクター。
  4.  前記(e)~(g)のいずれかの塩基配列の対において、上流及び/又は下流の塩基配列のGC含有率が41%以下である請求項2又は3に記載のベクター。
  5.  前記(e)~(g)のいずれかの塩基配列の対において、上流及び下流の塩基配列の少なくとも一方が、コマガタエラ属酵母染色体DNAの塩基配列である、請求項2~4のいずれか1項に記載のベクター。
  6.  前記(a)~(d)のいずれかの塩基配列、並びに、前記(e)~(g)のいずれかの上流及び下流の塩基配列から選択される少なくとも1つの塩基配列を含む部位が、centromere protein(CENP)と結合能を有する請求項1~5のいずれか1項に記載のベクター。
  7.  前記(e)~(g)のいずれかの塩基配列の対において、上流及び下流の塩基配列がそれぞれ2800塩基以下の塩基配列である、請求項2~6のいずれか1項に記載のベクター。
  8.  前記(e)~(g)のいずれかの塩基配列の対において、上流及び下流の塩基配列がそれぞれ1900~2800塩基の塩基配列である、請求項7に記載のベクター。
  9.  前記(e)~(g)のいずれかの塩基配列の対において、上流又は下流の塩基配列が、以下の(h)~(k)のいずれかの塩基配列;
     (h)配列番号13、16、19、又は22に示す塩基配列;
     (i)配列番号13、16、19、又は22に示す塩基配列に相補的な塩基配列からなる核酸とストリンジェントな条件下でハイブリダイズする核酸の塩基配列;
     (j)配列番号13、16、19、又は22に示す塩基配列と85%以上の配列同一性を有する塩基配列;
     (k)配列番号13、16、19、又は22に示す塩基配列において、1もしくは複数個の塩基が置換、欠失、挿入及び/又は付加した塩基配列;
    である、請求項2~8のいずれか1項に記載のベクター。
  10.  前記(e)~(g)のいずれかの塩基配列の対において、上流又は下流の塩基配列が、以下の(l)~(o)のいずれかの塩基配列;
     (l)配列番号14、17、20、又は23に示す塩基配列;
     (m)配列番号14、17、20、又は23に示す塩基配列に相補的な塩基配列からなる核酸とストリンジェントな条件下でハイブリダイズする核酸の塩基配列;
     (n)配列番号14、17、20、又は23に示す塩基配列と85%以上の配列同一性を有する塩基配列;
     (o)配列番号14、17、20、又は23に示す塩基配列において、1もしくは複数個の塩基が置換、欠失、挿入及び/又は付加した塩基配列;
    である、請求項2~8のいずれか1項に記載のベクター。
  11.  前記(e)~(g)のいずれかの塩基配列の対において、上流及び下流の塩基配列が、以下の(p)~(s)のいずれかの塩基配列の対;
     (p)上流に配列番号13に示す塩基配列、及び、下流に配列番号14に示す塩基配列である対;
     (q)上流に配列番号16に示す塩基配列、及び、下流に配列番号17に示す塩基配列である対;
     (r)上流に配列番号19に示す塩基配列、及び、下流に配列番号20に示す塩基配列である対;
     (s)上流に配列番号22に示す塩基配列、及び、下流に配列番号23に示す塩基配列である対;
    をそれぞれ含む、請求項2~8のいずれか1項に記載のベクター。
  12.  以下の(t)~(w)のいずれかの塩基配列;
     (t)配列番号41、42、85又は86に示す塩基配列;
     (u)配列番号41、42、85又は86に示す塩基配列に相補的な塩基配列からなる核酸とストリンジェントな条件下でハイブリダイズする核酸の塩基配列;
     (v)配列番号41、42、85又は86に示す塩基配列と85%以上の配列同一性を有する塩基配列;
     (w)配列番号41、42、85又は86に示す塩基配列において、1もしくは複数個の塩基が置換、欠失、挿入及び/又は付加した塩基配列;
    を含む、請求項1~11のいずれか1項に記載のベクター。
  13.  さらにAutonomous replication sequence(ARS)を含む請求項1~12のいずれか1項に記載のベクター。
  14.  自律複製型ベクターである、請求項1~13のいずれか1項に記載のベクター。
  15.  前記自律複製型ベクターが、前記(a)~(d)のいずれかの塩基配列が由来する生物種とは異なる生物種に由来するAutonomous replication sequence(ARS)及び/又はセントロメアDNA配列を更に含む、請求項14に記載のベクター。
  16. 以下の(t)~(w)のいずれかの塩基配列;
     (t)配列番号41、42、85又は86に示す塩基配列;
     (u)配列番号41、42、85又は86に示す塩基配列に相補的な塩基配列からなる核酸とストリンジェントな条件下でハイブリダイズする核酸の塩基配列;
     (v)配列番号41、42、85又は86に示す塩基配列と85%以上の配列同一性を有する塩基配列;
     (w)配列番号41、42、85又は86に示す塩基配列において、1もしくは複数個の塩基が置換、欠失、挿入及び/又は付加した塩基配列;
    を含むベクター。
  17.  以下の(h)~(k)のいずれかの塩基配列;
     (h)配列番号13、16、19、又は22に示す塩基配列;
     (i)配列番号13、16、19、又は22に示す塩基配列に相補的な塩基配列からなる核酸とストリンジェントな条件下でハイブリダイズする核酸の塩基配列;
     (j)配列番号13、16、19、又は22に示す塩基配列と85%以上の配列同一性を有する塩基配列;
     (k)配列番号13、16、19、又は22に示す塩基配列において、1もしくは複数個の塩基が置換、欠失、挿入及び/又は付加した塩基配列;
    を含むベクター。
  18.  以下の(l)~(o)のいずれかの塩基配列;
     (l)配列番号14、17、20、又は23に示す塩基配列;
     (m)配列番号14、17、20、又は23に示す塩基配列に相補的な塩基配列からなる核酸とストリンジェントな条件下でハイブリダイズする核酸の塩基配列;
     (n)配列番号14、17、20、又は23に示す塩基配列と85%以上の配列同一性を有する塩基配列;
     (o)配列番号14、17、20、又は23に示す塩基配列において、1もしくは複数個の塩基が置換、欠失、挿入及び/又は付加した塩基配列;
    を含むベクター。
  19.  配列番号1~4のいずれかに示す塩基配列を含むベクター。
  20.  請求項1~19のいずれか1項に記載のベクターを細胞に導入する工程を含む、細胞の形質転換法。
  21.  請求項1~19のいずれか1項に記載のベクターにより細胞を形質転換して得られる形質転換体。
  22.  細胞が酵母又は大腸菌である、請求項21に記載の形質転換体。
  23.  細胞がメタノール資化性酵母である、請求項22に記載の形質転換体。
  24.  メタノール資化性酵母がコマガタエラ属酵母又はオガタエア属酵母である、請求項23に記載の形質転換体。
PCT/JP2015/083977 2014-12-03 2015-12-03 セントロメアdna配列を含むベクター及びその用途 WO2016088824A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2016562669A JP6754697B2 (ja) 2014-12-03 2015-12-03 セントロメアdna配列を含むベクター及びその用途
EP15865749.4A EP3228707B1 (en) 2014-12-03 2015-12-03 Vector containing centromere dna sequence and use thereof
US15/610,917 US11214809B2 (en) 2014-12-03 2017-06-01 Vector containing centromere DNA sequence and use thereof

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2014-245429 2014-12-03
JP2014245429 2014-12-03

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US15/610,917 Continuation US11214809B2 (en) 2014-12-03 2017-06-01 Vector containing centromere DNA sequence and use thereof

Publications (1)

Publication Number Publication Date
WO2016088824A1 true WO2016088824A1 (ja) 2016-06-09

Family

ID=56091764

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2015/083977 WO2016088824A1 (ja) 2014-12-03 2015-12-03 セントロメアdna配列を含むベクター及びその用途

Country Status (4)

Country Link
US (1) US11214809B2 (ja)
EP (1) EP3228707B1 (ja)
JP (1) JP6754697B2 (ja)
WO (1) WO2016088824A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018110616A1 (ja) 2016-12-15 2018-06-21 株式会社カネカ 新規宿主細胞及びそれを用いた目的タンパク質の製造方法
WO2018139564A1 (ja) * 2017-01-27 2018-08-02 第一三共株式会社 メタノール資化性酵母の自律複製型プラスミド
WO2018235917A1 (ja) 2017-06-23 2018-12-27 株式会社カネカ メタノール資化性酵母内において高効率にベクターをアセンブルする方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113999870B (zh) * 2020-02-26 2024-02-20 森瑞斯生物科技(深圳)有限公司 一种表达cbdas的重组酿酒酵母及其构建方法和应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61181385A (ja) * 1984-12-04 1986-08-14 ベ−リンガ− インゲルハイム インタ−ナシヨナル ゲゼルシヤフト ミツト ベシユレンクテル ハフツンク 組換え安定多コピ−酵母ベクタ−
US20140244228A1 (en) * 2012-09-19 2014-08-28 Agency For Science, Technology And Research Codon optimization of a synthetic gene(s) for protein expression

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9617569B2 (en) * 2013-11-15 2017-04-11 Samsung Electronics Co., Ltd. Genetically engineered yeast cell producing lactate including acetaldehyde dehydrogenase, method of producing yeast cell, and method of producing lactate using the same
US10556935B2 (en) * 2014-07-31 2020-02-11 Primordial Genetics Inc. Compositions for improving cells and organisms

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61181385A (ja) * 1984-12-04 1986-08-14 ベ−リンガ− インゲルハイム インタ−ナシヨナル ゲゼルシヤフト ミツト ベシユレンクテル ハフツンク 組換え安定多コピ−酵母ベクタ−
US20140244228A1 (en) * 2012-09-19 2014-08-28 Agency For Science, Technology And Research Codon optimization of a synthetic gene(s) for protein expression

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
CLARKE, L. ET AL.: "Centromeres of budding and fission yeasts.", TRENDS GENET., vol. 6, no. 5, 1990, pages 150 - 154, XP025520561 *
KUBERL, A. ET AL.: "High-quality genome sequence of Pichia pastoris CBS7435.", J. BIOTECHNOL., vol. 154, 2011, pages 312 - 320, XP028240769 *
MALIK, H. S. ET AL.: "Major evolutionary transitions in centromere complexity.", CELL, vol. 138, no. 6, 2009, pages 1067 - 1082, XP055445814 *
MEHTA, G. D.: "Centromere identity: a challenge to be faced.", MOL.GENET. GENOMICS, vol. 284, 2010, pages 75 - 94, XP019849330 *
POLIZZI, C. ET AL.: "The chromatin structure of centromeres from fission yeast: differentiation of the central core that correlates with function.", J. CELL BIOL., vol. 112, no. 2, 1991, pages 191 - 201, XP055445813 *
See also references of EP3228707A4 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018110616A1 (ja) 2016-12-15 2018-06-21 株式会社カネカ 新規宿主細胞及びそれを用いた目的タンパク質の製造方法
WO2018139564A1 (ja) * 2017-01-27 2018-08-02 第一三共株式会社 メタノール資化性酵母の自律複製型プラスミド
WO2018235917A1 (ja) 2017-06-23 2018-12-27 株式会社カネカ メタノール資化性酵母内において高効率にベクターをアセンブルする方法

Also Published As

Publication number Publication date
US11214809B2 (en) 2022-01-04
EP3228707A4 (en) 2018-06-13
JPWO2016088824A1 (ja) 2017-09-14
US20170268013A1 (en) 2017-09-21
JP6754697B2 (ja) 2020-09-16
EP3228707B1 (en) 2020-09-23
EP3228707A1 (en) 2017-10-11

Similar Documents

Publication Publication Date Title
Wang et al. Efficient CRISPR–Cas9 mediated multiplex genome editing in yeasts
JP6833812B2 (ja) プロモーター変異体
US20090311749A1 (en) Method for methanol independent induction from methanol inducible promoters in Pichia
US11214809B2 (en) Vector containing centromere DNA sequence and use thereof
CN110408635B (zh) 一种含有链霉亲和素元件的核酸构建物在蛋白质表达、纯化中的应用
CN108949869A (zh) 无碳源阻遏毕赤酵母表达系统、其建立方法及应用
KR20200089734A (ko) 뉴클레아제 시스템의 녹-아웃에 의한 시험관 내 생합성 활성을 조절하기 위한 방법
WO2010087344A1 (ja) シゾサッカロミセス・ポンベの形質転換方法および形質転換体、ならびに異種蛋白質の製造方法
EP3356534B1 (en) Novel episomal plasmid vectors
JP2022078003A (ja) 耐酸性酵母遺伝子ベースの合成プロモーター
JP4721868B2 (ja) 宿主dnaの欠失対象領域の欠失方法
JP7181865B2 (ja) メタノール資化性酵母内において高効率にベクターをアセンブルする方法
JP2021101733A (ja) 新規宿主細胞及びそれを用いた目的タンパク質の製造方法
WO2017163946A1 (ja) 誘導型プロモーター
JP2013535185A (ja) 生産細胞株
JP4969068B2 (ja) タンパク質の高発現システム
JP4671394B2 (ja) キャンディダ・ユティリス由来のプロモーターdna
WO2021182456A1 (ja) 人工染色体ベクター及びその用途
CN112592954B (zh) 基因GliT作为筛选标记基因在抗性筛选中的应用
JP4587750B2 (ja) 転写活性化タンパク質をコードするキャンディダユティリス由来の遺伝子
WO2018110616A1 (ja) 新規宿主細胞及びそれを用いた目的タンパク質の製造方法
US20210348175A1 (en) Genetic toolbox for metabolic engineering of non-conventional yeast
US10351864B2 (en) Cloning vector
JP2007075013A (ja) rDNAコピー数の増加した酵母及びその酵母の利用
JP2024528145A (ja) タンパク質合成および分泌のための方法および組成物

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 15865749

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2016562669

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

REEP Request for entry into the european phase

Ref document number: 2015865749

Country of ref document: EP