WO2006033484A1 - 核酸マイクロアレイ及び核酸プローブの設計方法並びに遺伝子検出方法 - Google Patents

核酸マイクロアレイ及び核酸プローブの設計方法並びに遺伝子検出方法 Download PDF

Info

Publication number
WO2006033484A1
WO2006033484A1 PCT/JP2005/018222 JP2005018222W WO2006033484A1 WO 2006033484 A1 WO2006033484 A1 WO 2006033484A1 JP 2005018222 W JP2005018222 W JP 2005018222W WO 2006033484 A1 WO2006033484 A1 WO 2006033484A1
Authority
WO
WIPO (PCT)
Prior art keywords
nucleic acid
region
linker
sequence
length
Prior art date
Application number
PCT/JP2005/018222
Other languages
English (en)
French (fr)
Inventor
Hiroyuki Sasaki
Tadafumi Iino
Shinichi Mizuno
Hidetoshi Ozawa
Kosuke Tashiro
Original Assignee
Kyushu University, National University Corporation
Inter-University Research Institute, Research Organization Of Information And Systems
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyushu University, National University Corporation, Inter-University Research Institute, Research Organization Of Information And Systems filed Critical Kyushu University, National University Corporation
Priority to JP2006536446A priority Critical patent/JPWO2006033484A1/ja
Publication of WO2006033484A1 publication Critical patent/WO2006033484A1/ja

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips

Definitions

  • the present invention relates to a nucleic acid microarray (chip) in which a nucleic acid probe that hybridizes to a nucleic acid target to be detected is immobilized, a method for designing a nucleic acid probe, a method for preparing a nucleic acid target, and a gene detection method using the nucleic acid microarray.
  • a so-called nucleic acid microarray has a plurality of oligonucleic acids (nucleic acid probes) immobilized on a substrate and can detect a nucleic acid target complementary to the oligo DNA.
  • nucleic acid microarray is a generic term for the commonly used terms “DNA array”, “DNA microarray”, “DNA macroarray” and “DNA chip”. Therefore, the term “nucleic acid microarray” used in this specification does not mean only a high-density DNA array to which photolithography technology for manufacturing semiconductor integrated circuits is applied.
  • nucleic acid microarrays are known in which a nucleic acid probe that specifically hybridizes to a nucleic acid target derived from a known gene is immobilized for the purpose of detecting the expression level of the known gene. .
  • this gene detection method using a nucleic acid microarray first, mRNA is extracted from a biological sample, and a nucleic acid target group incorporating a fluorescent label is prepared by a reverse transcription reaction using the mRNA as a mirror shape. The prepared nucleic acid target group is brought into contact with the nucleic acid microarray.
  • the nucleic acid target group includes a nucleic acid target derived from the gene to be detected
  • the nucleic acid probe on the nucleic acid microarray and the target nucleic acid target are hybridized. Therefore, by scanning the fluorescence on the nucleic acid microarray, it is possible to detect the presence / absence and expression level of the gene to be detected in the biological sample.
  • a nucleic acid microarray in which 4096 types of nucleic acid probes are immobilized is disclosed
  • the nucleic acid probes are immobilized on a substrate in order from the terminal side. It has a spacer and a 6-base long region, and the 6-base long region is connected to the end of the C18 spacer via the 7th base (C / T mixture). Note that this 7th base is covalently bound to the C18 spacer.
  • the presence / absence and expression level of a gene can be analyzed even if the gene is unknown.
  • the nucleic acid microarray disclosed in Non-Patent Document 1 only the above 6-base long region contributes to high-prididization with the nucleic acid target.
  • the 6-base long region includes a sequence having a high GC content and a sequence having a low CG content. It is known that the difference in CG content greatly affects the Tm value ⁇ in hybridization.
  • Non-Patent Document 1 it is not possible to reliably prevent the cross-hy-pridization caused by the difference in Tm value of the 6-base long region.
  • the DNA chip disclosed in Patent Document 1 has a problem that an unknown or known gene cannot be accurately detected because cross-hybridization occurs.
  • Non-Patent Document 1 Nature Biotechnology, Vol. 22, No. 4, 418-426, 2004 Disclosure of the Invention
  • the present invention is intended to provide a nucleic acid microarray that reliably prevents cross hybridization and is excellent in detection sensitivity.
  • Another object of the present invention is to provide a method for designing a nucleic acid probe that can reliably prevent cross-hybridization.
  • an object of the present invention is to provide a method for preparing a nucleic acid target capable of reliably preventing cross-hybridization.
  • the present invention provides a cross-high pre-ization.
  • An object of the present invention is to provide a method for detecting a gene that is actually prevented and excellent in detection sensitivity.
  • the present invention that has achieved the above-described zero includes the following.
  • the Tm values of the complementary regions in the plurality of nucleic acid probes are in a substantially constant range.
  • the selection region is composed of n bases and has 4 n types of selection regions corresponding to all combinations of adenine, guanine, thymine and cytosine.
  • the nucleic acid probe may be configured such that the regulatory region sandwiches the selection region and the non-complementary region sandwiches the upper self-complementary region. preferable.
  • the length of the regulatory region located on the 3 ′ end side of the above self-selection region and the 5 ′ end side of the selection region may be different.
  • the plurality of nucleic acid probes are preferably all the same length.
  • the linker sequence can be, for example, the base sequence described in SEQ ID NO: 1.
  • this invention includes the following.
  • a nucleotide sequence of a nucleic acid probe comprising a selection region and a complementary region comprising a regulatory region complementary to all or part of the linker sequence
  • the step of designing the base sequence of the selection region corresponds to all combinations of adenine, guanine, thymine and cytosine for the selection region consisting of n bases 4 " It is preferable to design the type of nucleotide sequence and determine the length of the regulatory region for each nucleic acid probe so that the Tm value of the complementary region in the 4 "type of nucleic acid probe is in a substantially constant range.
  • the step of designing the length of the regulatory region includes a step of evaluating a bias of guanine and cytosine content (GC content) of each selected region in a plurality of nucleic acid probes. If there is a bias in the GC content of the selected region, the length of the regulatory region designed at the 3 'end of the selected region is different from the length of the regulatory region designed at the 5' end of the selected region. It can also be designed as follows.
  • this invention includes the following.
  • a nucleic acid probe comprising a selection region that specifically hybridizes to the above-mentioned unique sequence and a complementary region consisting of a regulatory region that is complementary to all or part of the above-mentioned linker sequence.
  • the Tm values of the complementary regions in the plurality of nucleic acid probes are in a substantially constant range.
  • the selected region consists of n bases, and includes adenine, guanine, and chimney. It is preferable to have 4 "types of selection regions corresponding to all combinations of proteins and cytosines.
  • the nucleic acid probe of _h has the above-mentioned regulatory region to which the above-mentioned selection region is selected.
  • the non-complementary region force S is configured to swallow the phase-trapping region.
  • the plurality of nucleic acid probes all have the same length.
  • the linker sequence can be, for example, a base sequence excluding the 25th to 32nd regions in the base sequence described in SEQ ID NO: 1.
  • FIG. 1 is a cross-sectional view of an essential part schematically showing a nucleic acid microarray according to the present invention.
  • FIG. 2 is a perspective view schematically showing a nucleic acid microarray according to the present invention.
  • FIG. 3 is a cross-sectional view of an essential part schematically showing a nucleic acid microarray according to the present invention.
  • FIG. 4 is a configuration diagram schematically showing the configuration of the nucleic acid target.
  • FIG. 5 is a cross-sectional view of an essential part schematically showing a nucleic acid microarray according to the present invention.
  • Figure 6 shows a hybrid of 297 nucleic acid probes.
  • FIG. 7 is a flowchart of a method for preparing a nucleic acid target according to the present invention.
  • FIG. 8-1 is a schematic diagram for explaining a method for preparing a nucleic acid target according to the present invention.
  • FIG. 8-2 is a schematic diagram for explaining how to prepare the nucleic acid target according to the present invention.
  • FIG. 6 is a scatter diagram of a part of a scan image and signal intensity in an example using a control yeast and an ethanolless yeast using a chip with a unique sequence derived from 0RF of all yeasts.
  • FIG. 10 A, B and C are the experimental results of Example 2.
  • 4 is a scatter diagram of a part of a scan image and a signal intensity in an example using a control yeast and an ethanol stress yeast using a chip having a unique sequence of 8 8 sequences.
  • the nucleic acid microarray according to the present invention comprises a substrate 1 and nucleic acid probes 2 immobilized on the substrate 1 for each type, and the spots partitioned for each type of the nucleic acid probe 2. Has three. As shown in FIG. 2, the spots 3 are arranged in a matrix on one main surface of the substrate 1.
  • the substrate 1 is not particularly limited as long as the nucleic acid probe can be immobilized, and a glass plate, a resin plate, or the like can be used.
  • a resin plate a plastic plate such as polyethylene, polypropylene, polystyrene, nylon and silicone, or a cellulose plate such as nitrocellulose and cellulose acetate can be used.
  • Immobilization of the nucleic acid probe 2 Depending on the method, it is possible to use a substrate 1 having a surface treated on one main surface. For example, a glass plate coated on one main surface with poly L-lysine can be used.
  • the shape of the substrate is not limited to a plate shape, but includes a spherical shape (bead).
  • the nucleic acid probe 2 is composed of a non-complementary region 4 consisting of a base sequence that does not contribute to hybridization, and a selection region 5 consisting of a base sequence that contributes to hybridization and specifically hybridizing to the nucleic acid target. And a complementary region 7 composed of a regulatory region 6 complementary to all or part of the linker sequence that is shared by the nucleic acid targets to be detected. Further, the nucleic acid probe 2 may be configured to have a spacer region 8 arranged between the substrate 1 in addition to the non-complementary region 4 and the complementary region 7.
  • nucleic acid microarray it is possible to design the selection region 5 if of n bases, adenine, Guanin, thymine and selected areas 5 of the 4 [pi types corresponding to all combinations of cytosine. That is, as the nucleic acid probe 2,
  • the selection region 5 has a length of 8 bases, 65536 kinds of base sequences can be designed, and 65536 kinds of nucleic acid probes 2 can be designed.
  • the base length of the selected region is not limited to eight, and may be any number. However, select If region 5 has a length of 5 bases, only 1024 types can be designed, which is considered insufficient for gene expression analysis using nucleic acid microarrays. On the other hand, if selection region 5 has a length of 10 bases, 1048576 types will be designed, and since it is estimated that there are about 32000 types of human genes, about 90% of genes are uniquely selected. It is considered possible. Therefore, the selection region 5 is preferably 6 to 10 bases long. '
  • the nucleic acid microarray according to the present invention preferably has the types corresponding to all combinations of the selection regions 5 as the nucleic acid probes 2, but does not necessarily have the types corresponding to all the combinations. .
  • the selection region 5 is 8 bases long, it has 95%, preferably 97%, more preferably 99% of the nucleic acid probes 2 out of 65536 nucleic acid probes 2,
  • gene expression analysis can be performed with excellent detection ability.
  • the selection region 5 when the selection region 5 has a length of 8 bases, the selection region 5 is different from the other nucleic acid probe 2 in comparison with the nucleic acid probe 2 in which the selection region 5 is entirely composed of only adenine, and only one terminal base of the selection region 5 is different. Even with a nucleic acid microarray having a nucleic acid probe 2 excluding the nucleic acid probe 2 and the like, gene expression analysis can be performed with excellent detection ability.
  • the regulatory region 6 included in the nucleic acid probe 2 has a base sequence complementary to all or a part of the linker sequence shared by the nucleic acid targets whose details will be described later.
  • a nucleic acid target 10 will be described as illustrated in FIG.
  • the nucleic acid target 10 is composed of a unique sequence 1 1 derived from mRNA extracted from a biological sample such as a cell or tissue, and a first linker 1 2 and a second linker 1 3 sandwiching the unique sequence 1 1 ( Collectively referred to as “linker one”).
  • the unique sequence 11 is derived from many types of mRNA derived from a biological sample, and therefore has a different sequence for each type of mRNA.
  • the linker sequence is a sequence common to all nucleic acid targets 10.
  • the base sequence of the linker is not particularly limited and may be any sequence.
  • the GC content in the linker is preferably 35 to 65%, more preferably 40 to 60%,
  • the base sequence of SEQ ID NO: 1 As an example of the first linker 1 2, the base sequence of SEQ ID NO: 1, An example of the second linker 13 is the base sequence of SEQ ID NO: 2. Examples of the linker sequence include a base sequence excluding the 25th to 32nd regions in the base sequence described in SEQ ID NO: 1. The method for preparing the nucleic acid target and the method for designing the base sequence of the linker will be described later.
  • the regulatory region 6 is composed of a base sequence complementary to the first linker 12 and the second linker 13 and is divided so as to sandwich the selection region 5 therebetween. That is, one of the regulatory regions 6 has a base sequence complementary to the first linker 12 and the other of the regulatory regions 6 has a base sequence complementary to the second linker 13.
  • the regulatory region 6 may have a different length. That is, the regulatory region 6 may consist of a base sequence complementary to a part of the linker. In the nucleic acid microarray according to the present invention, the length of the regulatory region 6 is determined so that the Tm values of the complementary region 7 consisting of the regulatory region 6 and the selection region 5 are close to each other in the plurality of nucleic acid probes 2. .
  • the selection region 5 determined in advance as described above is hybridized with the nucleic acid target 10 and the unique sequence 11 of the nucleic acid target 10 is detected, it is selected in each hybridization.
  • the Tm value varies depending on the base sequence of region 5.
  • the nucleic acid microarray treats each spot 3 under the same conditions (temperature, salt concentration, pH, etc.), the hybrids in each spot 3 cannot be formed stably.
  • the Tm value of the complementary region 7 contributing to hybridization is made close to all the nucleic acid probes 2 by designing the length of the regulatory region 6 appropriately. Can do.
  • the nucleic acid microarray of the present invention even when the base sequence of the selection region 5 is different, the hybridized nucleic acid probe 2 and the nucleic acid target 10 can be stably formed, and the cross-hybridization is possible. Ditherization can be reliably prevented.
  • the length of the control region 6 When designing the length of the regulatory region 6, first, the guanine and cytosine contents (GC content) of each selected region 5 in the designed plurality of nucleic acid probes 2 are calculated. Next, based on the calculated GC content, from a database that correlates the GC content with the optimal length of the regulatory region 6, The optimal length of the control region 6 is searched for each selection region 5. According to this database, when the GC content of the selected region 5 is high, the length of the control region 6 should be designed shorter, and when the GC content of the selected region 5 is low, the length of the control region 6 should be designed longer. It becomes.
  • the selection region 5 is 8 bases long, that is, the unique sequence 1 is 8 bases long.
  • 11 types of nucleic acid fragments having the base sequences shown in Table 1 were synthesized, RNA strand synthesis reactions using T7 RNA polymerase were performed using these nucleic acid fragments as cages, and the resulting RNA strands were nucleic acid targets. 1 0.
  • the obtained nucleic acid target 10 is fluorescently labeled by RNA chain synthesis using fluorescently labeled CTP.
  • the nucleic acid probe 2 has a selection region 5 complementary to the unique sequence shown in Table 1, and 2 to 10 bases complementary to the linker at both ends of the selection region 5 Prepare one with area 6. That is, nine kinds of nucleic acid probes 2 having 2 to 10 regulatory regions 6 are prepared for one selection area 5 selected from the above 11 kinds of unique sequences [corresponding 11 kinds of selection areas 5. Therefore, 99 types of nucleic acid probes 2 are prepared for 11 types of selected regions 5 corresponding to the 11 types of unique sequences. The Rukoto.
  • nucleic acid probes 2 having a single base mismatch are prepared for all 99 types of nucleic acid probes 2. Therefore, a total of 297 kinds of O nucleic acid probes 2 are prepared for the 11 kinds of selection regions 5 corresponding to the 11 kinds of unique sequences.
  • nucleic acid targets 10 are brought into contact with the nucleic acid micro-T "ray on which these 297 kinds of nucleic acid probes 2 are immobilized, and the nucleic acid probe 2 and the nucleic acid target 10 are hybridized.
  • 6xSSC + 50% formamide, 25 degrees The results of detecting hybrids in 297 nucleic acid probes from the fluorescent label of nucleic acid target 10 are shown in Fig. 6.
  • the horizontal axis shows the selected region 5
  • the GC content represents the length of control region 6.
  • “GC0” in Fig. 6 is a selection sequence 5 complementary to the unique sequence with a GC content of 0/8 in Table 1.
  • GC4min means a row of nucleic acid probes having a selection sequence 5 complementary to the unique sequence of “GC4mintarg” in Table 1
  • GC4med is complementary to the unique sequence of “GC4medtarg” in Table 1.
  • GC4max means a sequence of nucleic acid probes having a selection sequence 5 complementary to the unique sequence of “GC4maxtarg” in Table 1.
  • GC4min”, “GC4med”, and “GC4max” indicate forces S in which the GC content in the selected region 5 is the same as 4/8, and different Tm values depending on the positions of guanine and cytosine.
  • GC4min is GC content 4/8, and than also shows the lowest Tm value
  • GC4max is GC content 4/8, shows the highest Tm value.
  • “GC4med” has a GC content of 4/8 and shows an intermediate Tm value.
  • Fig. 6 there are three spots in the column that means a nucleic acid probe with a given GC content, but the spot on the left is the spot of the nucleic acid probe that perfectly matches the nucleic acid target 10, and The spot on the right is the spot of the nucleic acid probe that has a nucleotide mismatch with the nucleic acid target 10.
  • a cell surrounded by a thick frame means a cell having the highest relative signal in a perfect match nucleic acid probe having a selected region 5 having a predetermined GC content.
  • the shaded cells are inferior to the values of the cells surrounded by a thick frame, but the relative signal is relatively excellent in the perfect match nucleic acid probe having the selection region 5 of the predetermined & C content. Means a cell.
  • the length of the regulatory region 6 can be specifically designed based on the GC content of each selected region 5 consisting of 8 bases in the designed multiple nucleic acid probes 2. it can. Even if the selection region 5 in the nucleic acid probe 2 has a length other than 8 bases, a database can be similarly constructed and the length of the regulatory region 6 can be specifically designed.
  • the Tm value in the selected region 5 is the same value, there may be a case where the Tm value varies greatly depending on the position of guanine and cytosine.
  • a combination of sequences of GC content in the selected region 5 4 are type 17920, nearest-Neighbor method. - 25. and to calculate the Tm value by (RNA DNA hybrid) 0 2 ⁇ 57 94 and has a spread of Yes.
  • the Tm is calculated for all of the selected regions 5 having the same calculated GC content.
  • the length of the adjustment area 6 is designed to be short, and the Tm value is lower than the average Tm value. It is preferable to process the control region 6 so that the length of the control region 6 is designed to be long.
  • the calculation method of the Tm value is not particularly limited, and it is preferable to calculate by the Nearest-Nighbor method, which is evaluated to have high strength, and can use a known calculation method as appropriate.
  • the Tm value is given by the following equation. .
  • AS means the total change in adjacent entrobies (cal / mol ⁇ K) in Neubritt
  • ⁇ H means the sum of changes in adjacent enthalpy in Noblet (Kcal / raol)
  • R is the gas constant (1.987 cal / deg ⁇ mol)
  • Ct means the total mol concentration of the oligo (mol / 1)
  • Na + means the concentration of Na +.
  • the Tm of the base sequence “AGCTATGC” is calculated as follows using the Nearest- Neighbor method. First, when this base sequence is made into two adjacent bases, "AG”, “GC”, “CT”, “TA”, “AT”, “TG” and “GC” are obtained. Therefore, ⁇ and AS are calculated as follows.
  • the Tm value of selected area 5 can be calculated from the above equation and Table 3. Then, an average value (median value) is calculated from all Tm f values of a plurality of selected regions 5 having the same GC content. Then, the Tm value of each selected area 5 is compared with the average value (median value). If the Tm value of each selected area 5 is higher than the average value (median value), the length of the adjustment area 6 is shortened. If it is low, set the length of the control region 6 longer. More specifically, a database in which the GC content included in the selection region 5 consisting of 8 bases shown in Table 3 and the optimal length of the regulatory region 6 are associated is as shown in Table 5, for example.
  • the Tm value of the complementary region consisting of the selection region 5 and the regulatory region 6 can be made closer in the plurality of nucleic acid probes 2.
  • the length of the control region 6 can be designed.
  • the length of selection region 5 is 8 bases and all combinations (65536 ways) are designed as the base sequence of selection region 5, 1-24 in SEQ ID NO: 1 as the first linker 1 12
  • the 33rd to 45th nucleotide sequences in SEQ ID NO: 1 can be exemplified as the first nucleotide sequence and the second linker 13.
  • the non-complementary region 4 is composed of a base sequence that does not form a complementary strand with the nucleic acid target 10.
  • the base sequence of the non-complementary region 4 is not particularly limited as long as it does not form a complementary strand with the nucleic acid target 10. Further, as the non-complementary region 4, it is more preferable to set a non-complementary region so that it has the same base as that of the target linker sequence, since it is most difficult to form a hybrid strand.
  • the deviation of the GC content of each selected region 5 in the nucleic acid probe 2 is evaluated. Specifically, if the GC content in the 3 'end region from the center of the selected region 5 and the GC content in the 5' end region from the center of the selected region 5 are compared, there is a difference of 2 times or more. Therefore, it is evaluated that the selected region 5 has a bias in GC content. For example, when the base sequence of selection region 5 is “GCGCATATA”, the GC content in the region 3 ′ end side from the center of selection region 5 is small, and the GC content in the region 5 ′ end side from the center of selection region 5 It is estimated that there is a GC content bias in this selection area 5.
  • the length of the control region 6 on the higher GC content side is designed to be short.
  • the nucleic acid probe 2 designed as described above can be chemically synthesized by a nucleic acid synthesizing apparatus.
  • a nucleic acid synthesizer an apparatus called a DNA synthesizer, a fully automatic nucleic acid synthesizer, an automatic nucleic acid synthesizer, or the like can be used.
  • the nucleic acid probe 2 can be immobilized on the substrate 1 using a so-called spotter device.
  • the immobilization of the nucleic acid probe 2 on the substrate 1 is not limited at all. Any known spotter device can be used.
  • the immobilization density of the nucleic acid probe can be appropriately adjusted depending on the performance of the spotter device. For example, millions of spots 3 can be placed on a 1 inch x 3 inch (25 mm x 75 mm) slide glass substrate 1.
  • the selection region 5 has a length of 8 bases
  • 65536 kinds of nucleic acid probes 2 are synthesized, and 65536 spots 3 are required for each nucleic acid probe 2.
  • all the spots 3 may be formed using a plurality of substrates 1. That is, all combinations of the selection areas 5 are included in any one of the plurality of nucleic acid microarrays.
  • a plurality of nucleic acid microarrays in which all the spots 3 are formed can be used as a nucleic acid microarray set for a series of gene analysis tests.
  • a method for preparing a nucleic acid target used in the above-described nucleic acid microarray will be described with reference to the flowchart shown in FIG.
  • the method for preparing the nucleic acid target is shown schematically in Fig. 8-1 and Fig. 8-1.
  • step 1 (denoted as “S1” in FIG. 7, the following steps are also represented in the same manner), the analysis target is extracted from the biological sample.
  • Bio samples include, for example, human cells collected from patients suffering from a specific disease, living cells that are placed under specific conditions, living cells whose genome sequence is unknown, and the like. Mention may be made of cells that serve as controls for the cells.
  • the target organisms are not only eukaryotes but also all organisms including prokaryotes.
  • the biological sample is not limited at all.
  • the analysis target is a nucleic acid contained in the biological sample.
  • DNA includes the DNA of organelles such as genomic DNA and mitochondria, and is not limited in any way.
  • RNA includes mRNA, tRNA, ribosomal RNA, miRNA, etc., and there is no restriction on functional classification.
  • the technique for extracting the analysis target from the biological sample is not limited at all, and a known technique can be used.
  • the analysis target is mRNA
  • examples include guanidine monosalt cesium ultracentrifugation method, AGPC method (Acid guanid inium-Phenol-Chloroform method), ISOGEN method (RNA extraction kit, manufactured by Futtsubon Gene Co., Ltd.) be able to.
  • the RNA sample contains a large amount of ribosomal RNA, but it is desirable to remove it if it is not the subject of analysis.
  • the biological sample is a eukaryote and the analysis target is mRNA will be described.
  • nucleic acids containing DNA or RNA other than mRNA can be analyzed.
  • total RNA will be extracted for analysis.
  • the biological sample is a prokaryotic organism, the same steps can be taken except that mRNA is total RNA in the following explanation.
  • step 2 the extracted mRNA is converted to cDNA using reverse transcriptase, and further converted to double-stranded DNA using DNA polymerase or the like.
  • This double-stranded DNA is treated with the first restriction enzyme, and one end of this fragment becomes a restriction enzyme recognition sequence.
  • One end of the subsequent cDNA (eg, the 3 ′ end) or one end of the double-stranded cDNA (eg, the 3 ′ end), after the first restriction enzyme treatment A similar effect can be obtained in future processing by attaching one end of the fragment (for example, the 3 ′ end) to the carrier.
  • the carrier is not particularly limited, and for example, streptavidin beads, magnetic beads and the like can be used.
  • a restriction enzyme having 4 bases as a recognition sequence is preferably used.
  • the restriction enzyme that recognizes 4 bases has a higher frequency of recognition sequences than the restriction enzyme that recognizes 5 bases or more. It is possible to prepare various types of nucleic acid targets and perform more detailed gene expression analysis.
  • the first restriction enzyme is not particularly limited, but Taql (T i CGA), Nlal ll (CATG
  • step 2 mRNA fragments excluding mRNA fragments attached to the carrier are removed.
  • a nucleic acid fragment for example, the first restriction enzyme, excluding double-stranded synthesized cDNA fragments attached to the carrier, the carrier is recovered, and the recovered carrier is washed with a washing solution. Nucleic acid fragments can be removed except for cDNA fragments after double-stranded synthesis attached to the carrier.
  • the first linker 1 12 is ligated to a cDNA fragment having the first restriction enzyme recognition sequence at one end.
  • the first linker 112 is designed to have the first restriction enzyme recognition sequence at one end and the recognition sequence of Typells restriction enzyme in the middle, and then the nucleic acid synthesizer. It can be synthesized and prepared.
  • a cDNA fragment having the first linker 12 bound to one end is prepared.
  • a carrier is used in step 2
  • a cDNA fragment in which the first linkers 1 and 2 are bound to the end of the mRNA opposite to the end to which the carrier is attached is prepared.
  • Step 4 the cDNA fragment having the first linker 112 produced in Step 3 is cleaved with Typells restriction enzyme. Since the first linker has a recognition sequence for Typells restriction enzyme at a specific position, cDNA derived from mRNA derived from a biological sample is cleaved at a predetermined position when treated with Typells restriction enzyme. It will be.
  • Typells restriction enzyme is a restriction enzyme that cleaves the position of several bases to ⁇ H several bases outside the recognition sequence, for example, FokI (GGATG 9/13), MboII (GAAGA 8/7),
  • BsmFI GGGAC 10/14) etc.
  • TypellG restriction enzymes Mmel TCCRAC 20/18
  • Bsgl GTGCAG 16/14
  • the restriction enzyme is not limited as long as it is capable of cleaving a site that is a certain length away from the recognition site.
  • the carrier Remove the cDNA fragment containing the cDNA attached to. For example, by recovering the carrier from the solution after the Typells restriction enzyme treatment, cDNA fragments other than the cDNA fragment having the first linker 112 can be removed.
  • step 4 if the portion cleaved by Typel ls restriction enzyme becomes a protruding end, smoothing treatment is performed.
  • a smoothing process a known method can be used. For example, when a 3 ′ end protrusion occurs, a smoothing process using a Klenow fragment is used, and when a 5 ′ end protrusion occurs, T4 A method can be used in which DNA polymerase is smoothed by mooning and cutting off the protruding portion.
  • step 5 the second linker is connected (ligated) to the blunt end.
  • a promoter region may be bound to the second linker.
  • Promoter region Although t is not particularly limited, a T7 RNA promoter can be used.
  • This step 5 synthesizes a nucleic acid fragment containing the first linker 12, part of the cDNA from the biological sample (unique sequence 1 1 from the raw sample), the second linker 13 and the promoter region. be able to.
  • the unique sequence 11 is: ⁇ The sequence derived from the gene in the target cell, and the first linker 1 2 and the second linker 1 3 are common regardless of the type of the unique sequence 11 It is an array to do.
  • the unique sequence 11 1 reflects the presence / absence and / or current level of gene expression in the cell to be analyzed.
  • RNA strand is synthesized using the promoter region bound to the second linker 13. Specifically, the nucleic acid fragment from the first linker 1 2 obtained in Step 5, the unique sequence 1 1 derived from the biological sample 1 and the second linker 1 3 is used as a cage, and the ribonucleotide and fluorescently labeled ribonucleic acid. RNA strands are synthesized (transcription reaction) in a solution containing nucleotides and RKTA polymerase. This makes it possible to obtain a fluorescently labeled RNA strand that is complementary to one of the nucleic acid fragments obtained in Slap 5. That is, in this step 6, a nucleic acid target 10 consisting of the first linker 12, the unique sequence 11 and the second linker 1 is synthesized as fluorescently labeled RNA.
  • Cy3- UTP a commonly used fluorescently labeled nucleotide
  • Cy3-UTP to synthesize a fluorescently labeled RNA fragment derived from the target filament
  • Cy5-UTP to synthesize a fluorescently labeled RNA fragment derived from the control thread 01 cell.
  • the fluorescence is not limited to Cy3 or Cy5
  • the fluorescently labeled nucleotide may be ATP, GTP, CTP as well as UTP.
  • multiple types of labeled ribonuclei may be used. As described above, an increase in yield and an improvement in signal can be achieved by using the nucleic acid target 10 as a fluorescently labeled RNA strand.
  • RNA is synthesized using unlabeled ribonucleotides or biotin-labeled or aminoallyl-labeled ribonucleotides, and after synthesis, fluorescence is labeled by enzymatic reaction, enzymatic reaction, etc. Yes.
  • a nucleic acid labeling kit such as Lab el i TM.
  • the method for preparing nucleic acid target 10 described above is an example in which the fluorescently labeled RNA strand synthesized in step 6 is used as nucleic acid target 10.
  • the fluorescently labeled DNA strand obtained by synthesizing the fluorescently labeled DNA strand in Step 6 may be used as the nucleic acid target 10.
  • one of the nucleic acid fragments obtained in step 5 can be used as the nucleic acid target 1 O.
  • the first linker 12 and / or the second linker 13 is prepared in advance so as to contain a fluorescently labeled nucleotide. Then, the nucleic acid fragment obtained in Step 5 can be made into a single strand by heat treatment, and the obtained single-stranded nucleic acid fragment can be used as the nucleic acid target 10.
  • the gene detection method comprises a step of bringing a solution containing a nucleic acid target 10 into contact with a nucleic acid microarray having a nucleic acid probe 2, and then a nucleic acid hybridized to the nucleic acid probe 2 of the nucleic acid microarray. Detecting the target 1 0.
  • the gene detection method has a comprehensive meaning including a method for detecting the presence or absence of gene expression, a method for analyzing the expression level of a gene, a method for resolving gene expression changes, and the like.
  • the gene is not limited to a gene whose function and / or base sequence is known, and means that the gene includes an unknown function and / or base sequence.
  • this gene detection method is intended to detect any organism-derived gene. Can do.
  • any organism-derived gene can be targeted for detection without limiting the species.
  • gene expression analysis can be performed when gene expression levels in two states of a given species are compared.
  • the two states of biological species are, for example, healthy human subjects and patients suffering from certain diseases, cancer cells and normal cells, cells under certain conditions, and cells not under those conditions. Can.
  • the nucleic acid target 10 is prepared from the biological species in each state as described above. At this time, each nucleic acid target 10 is prepared so as to have a fluorescent label different from each other, for example, Cy3 and Cy5. Then, a solution containing these two types of nucleic acid targets 10 is brought into contact with the nucleic acid microarray, and two types of nucleic acid targets 2 are so-called competitively hybridized with the nucleic acid probe 2. Put it in.
  • the nucleic acid microarray according to the present invention is configured such that the Tm value of the complementary region 7 of the nucleic acid probe 2 that hybridizes with the nucleic acid target 10 is close to the plurality of nucleic acid probes 2. Therefore, when hybridizing two types of nucleic acid targets 2 to the nucleic acid probe 2, cross-hybridization can be reliably prevented. Thereby, according to this gene detection method, the expression level of the gene in the two states of the biological species can be accurately compared.
  • a unique sequence is searched for all 0RF (open 'reading' frame) from the genome database of all yeast genes, and a nucleic acid sequence having a selection region consisting of a base sequence complementary to the unique sequence.
  • gene expression analysis was performed in ethanol under ethanol stress using the prepared nucleic acid microarray. .
  • the restriction enzyme Taql present in 0RF Total number of recognition sequences 3 'in the recognition sequence (TCGA), and 8 bases 3' from that location (12 bases including recognition sites, corresponding to unique sequence) are counted using a computer
  • a unique database of yeast sequences was created.
  • the yeast unique sequence database contains a total of 12 bases of unique sequences consisting of the restriction enzyme Taql recognition sequence (TCGA) and the 8 bases following the recognition sequence.
  • 3 'UTR untranslated region on the 3' side of 0RF
  • these are also used as tags.
  • Aggregation of unique sequences is unique self-aligned column design programming. This product is obtained by cleaving the 0RF nucleotide IJ based on the specified restriction enzyme (in this case Taql), and searching for the recognition sequence located at the 3 'most of the recognition sequences in 0RF. It consists of a basic programming that extracts a predetermined number of bases (8 bases in this case) from the recognized recognition sequence and stores it as data, and can process tens of thousands of sequences at once.
  • the 355 gene has a Taq I recognition site within 200 bp of the 3 'UTR, which may be a tag. It was decided to add to. In fact, because there is an overlap in the tag sequence, 5335 types of tag sequences (corresponding to 6120 genes) were placed on this chip.
  • the yeast used the control yeast and the ethanol stress yeast which do not give any stimulus. Ethanol stress is in the logarithmic amplification phase A condition was added in which a yeast was exposed to ethanol at 7% for 30 minutes. Each yeast was centrifuged and collected, and RNA was isolated by the hot phenol method. The resulting RNA was recovered with oligo dT dynabeads, and then 3'-piotinated cDNA was synthesized with the SMART cDNA synthesis kit of Kuguchi tech and cleaved with the restriction enzyme Taql. . After cutting, streptavidin magnetic beads were added to recover 3 'biotinylated fragments.
  • the first linker was ligated and treated with Typells restriction enzyme Fokl to obtain a fragment containing the first linker and mRNA-derived sequence (unique sequence). After the fragment was made blunt, Ligation of the linker.
  • the product (tag) ligated with the first linker and the second linker is amplified by a PCR reaction using a primer placed on the linker, electrophoresed on a polyacrylamide gel, and the tag size is confirmed. Cut out the band corresponding to the extension tag and purify it. Next, this purified fragment is subjected to in vitro transcription using T7 RNA polymerase in a cage shape. This reaction was performed using an RNA synthesis kit (Megascript TM) manufactured by ambion.
  • fluorescent labeling was performed by adding 1/3 molar amount of Cy3- and Cy5-labeled UTP to vermillion-labeled UTP.
  • the synthesized fluorescently labeled RNA was purified using a column and used for hybridization on a chip.
  • the high-prisification buffer has a final concentration of 6 X SSC, 50 ° /. Consists of formamide concentration. After thermal denaturation at 70 ° C for 5 minutes, room temperature was reached, and 50 ⁇ 1 of this fluorescently labeled RNA solution was added to the DNA chip, and force pergrass was applied. The DNA chip was allowed to stand in a hybridization chamber that can be sealed, and subjected to hybridization at 25 degrees for 16 hours.
  • the DNA chip is washed with 2x SSC + 0.2% SDS, room temperature, 15 minutes wash, then 0.2x SSC + 0.2% SDS solution, room temperature, wash 15 minutes, then O. 2x SSC + 0.2 % SDS solution, 37 ° C, wash 15 minutes, then 0.2xSSC, room temperature, wash 4 minutes.
  • the DNA chip was centrifuged, dried by removing moisture, and then observed with a Fujifilm DNA chip scanner.
  • ATACTATC YDRrilGC biological process unknown molecular—solution unknown 0.46 EtOH UP
  • Table 7 shows the genes whose expression specifically decreased in response to ethanol stress, which was consistent with previous reports.
  • Table 8 shows the unique sequence of genes that did not match the ethanol stress-responsive genes reported so far, but whose expression levels were significantly changed relative to ethanol stress.
  • the gene having the unique sequence shown in Table 8 has not been reported as an ethanol stress responsive gene, it can be a candidate for a new ethanol stress responsive gene.
  • a gene having the unique sequence shown in Table 8 can be identified. The identified genes can be analyzed in detail by being used in gene functional analysis experiments.
  • nucleic acid probes having a selection region of 8 bases in length were designed for all combinations, and nucleic acid microarrays having 65536 types of nucleic acid probes immobilized thereon were prepared.
  • the yeast used was a control yeast that gave no stimulation and an ethanol stress yeast.
  • the linker was ligated.
  • the product (tag) ligated with the first linker and the second linker is amplified by a PCR reaction using a primer placed on the linker, electrophoresed on a polyacrylamide gel, and the tag size is confirmed. A band corresponding to the tag was cut out and purified.
  • this purified fragment is subjected to in vitro transcript ion reaction using T7 RNA polymerase in a cage shape.
  • This reaction was carried out using an ambion RNA synthesis kit (Megascript TM).
  • fluorescent labeling was performed by adding 1/3 molar amount of Cy3- and Cy5-labeled UTP to unlabeled UTP.
  • the synthesized fluorescently labeled RNA is purified using a column, Used for hybridization to the chip.
  • the concentration of the prepared fluorescently labeled RNA was measured, and 1 nmol of each was dissolved in 50 1 hybridization buffer.
  • the hybridization buffer consists of a final concentration of 6 X SSC and 50% formamide. After heat denaturation at 70 ° C. for 5 minutes, room temperature was reached, and 50 1 of this fluorescently labeled RNA solution was added to the DNA chip and covered with a cover glass. Place the DMA chip in a hybridization chamber that can be sealed, and perform hybridization at 25 ° C for 16 hours.
  • the DNA chip is washed with 2xSSC + 0.2% SDS solution, room temperature, washing 15 minutes, then 0.2xSSC + 0.2% SDS solution, room temperature, washing 15 minutes, then 0.2xSSC + 0.2% SDS
  • the solution was washed at 37 ° C, washed for 15 minutes, and then washed with 0.2xSSC, room temperature, washed for 4 minutes.
  • the DNA chip was centrifuged, dried by removing water, and then observed with a Fujifilm DNA chip scanner.
  • the chip was scanned with one of Fujinolem's DNA chip scanners.
  • the captured image was converted to a 16-bit TIFF image, and the signal was digitized using DNA chip analysis software.
  • the DNA chip analysis software used was Scan Alyze developed by Michael Eisen at Stanford University.
  • the obtained data was standardized and subjected to the total intensity method. In the total intensity method, standardization is performed assuming that half of the genes in the two comparison groups are up-regulated and half are down-regulated. After standardization, the ratio of signal expression in the control group and ethanol stress group was used as the ratio of gene expression. Those whose genes were changed more than 3 times were evaluated as being changed.
  • the gene was identified using a database created during chip design. ( Figure 10 shows results in A, B and C.) Industrial applicability
  • nucleic acid microarray In the nucleic acid microarray according to the present invention, cross-hybridization can be surely prevented, and excellent detection sensitivity can be achieved.
  • a nucleic acid that can be immobilized on a nucleic acid microarray having excellent detection sensitivity and that can reliably prevent cross-hybridization. Probes can be designed.
  • the gene detection method according to the present invention can reliably prevent cross-hy- pre-hydration and can detect a gene with excellent detection sensitivity.

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

クロスハイブリダイゼーションを確実に防止する (1)基板と、(2)ハイブリダイズに寄与しない塩基配列からなる非相補領域と、ハイブリダイズに寄与する塩基配列からなり、検出対象の核酸ターゲット群のうち特定の核酸ターゲットに対して特異的にハイブリダイズする選択領域及び検出対象の核酸ターゲットが共通して有するリンカー配列の全部または一部に対して相補的な調節領域からなる相補領域とを含み、上記基板上に固定された複数の核酸プローブとを備え、上記調節領域の長さは、上記複数の核酸プローブにおける相補領域のTm値を近づけるように設計されたことを特徴とする核酸マイクロアレイ。

Description

核酸マイクロアレイ及び核酸プローブの設計方法並びに遺伝子検出方法 技術分野
本発明は、 検出対象の核酸ターゲットにハイブリダィズする核酸プローブを固 定した核酸マイクロアレイ (チップ)、核酸プローブの設計方法及び核酸ターゲッ トの調製方法並びに当該核酸マイクロアレイを用いた遺伝子検出方法に関する。
明 背景技術
所謂、 核酸マイクロアレイは、 基板上に複数のオリゴ核酸 (核酸プローブ) を 固定してなり、 当該オリゴ DNAと相補的な核酸ターゲットを検出することができ る。 なお、 本明細書において使用する用語 "核酸マイクロアレイ" は、 一般に使 用されている用語 " DNAアレイ"、 "DNAマイクロアレイ"、 "DNAマクロアレイ" 及 ぴ " DNAチップ"の総称を意味する。 よって、 本明細書において使用する用語 "核 酸マイクロアレイ" は、 半導体集積回路製造用のフォ トリソグラフィー技術を応 用した高密度 DNAァレイのみを意味するものではない。
核酸マイクロアレイとしては、 従来、 既知の遺伝子の発現レベルを検出するこ とを目的として、 当該既知の遺伝子由来の核酸ターゲットに特異的にハイブリダ ィズする核酸プローブを固定化したものが知られている。 この核酸マイクロアレ ィを用いた遺伝子検出方法では、 先ず、 ある生体試料から mRNA を抽出し、 当該 mRNA を鏡型とする逆転写反応により蛍光標識を取り込んだ核酸ターゲット群を 調製し、 次に、 調製した核酸ターゲット群を核酸マイクロアレイに接触させる。 このとき、 核酸ターゲット群に検出対象の遺伝子に由来する核酸ターゲットが含 まれていれば、 核酸マイクロアレイ上の核酸プローブと目的の核酸ターゲットと がハイブリダィズすることとなる。 よって、 核酸マイクロアレイ上の蛍光をスキ ヤンすることによって、 生体試料における検出対象の遺伝子に関して発現の有無 及び発現レベルを検出することができる。
一方、 近年、 凡用マイクロアレイシステム (Universal i croarray System) と 称される転写解析プラットホームが紹介されている (非特許文献 1 )。 この非特許 文献 1には、 6塩基長の領域を有し、 アデニン ( 、 グァニン (G)、 チミン (T) 及ぴシトシン (C) からなる塩基の全ての組合せ (46=4096) からなる 4096種類の 核酸プローブを固定化した核酸マイクロアレイが開示されている。 非特許文献 1 に開示された核酸マイクロアレイにおいて、 核酸プローブは、 基板に固定化する 末端側から順に、 C6アミノ酸修飾リンカー、 C18スぺーサー及び上記 6塩基長の 領域を有している。 また、 上記 6塩基長の領域は、 C18 スぺーサ一の端部と 7番 目の塩基 (C/T 混合) を介して結合されている。 なお、 この 7番目の塩基は C18 スぺーサ一と共有結合によって結合している。
以上のように構成された核酸マイクロアレイによれば、 遺伝子が未知であって も、 遺伝子の発現の有無や発現レベルを解析することができる。 ところが、 非特 許文献 1に開示された核酸マイクロアレイにおいては、 上記 6塩基長の領域のみ が核酸ターゲットとのハイプリダイズに寄与する。 核酸マイクロアレイにおいて 上記 6塩基長の領域には、 GC含量の高い配列もあれば、 CG含量の低い配列もある。 CG含量の相違は、 ハイブリダイズにおける Tm値 {·こ大きく影響することが知られ ている。したがって、非特許文献 1に開示された核酉変マイクロアレイにおいては、 上記 6塩基長の領域の Tm値の違いに起因するクロスハイプリダイゼーシヨ ンを 確実に防止することができない。 言い換えると、 特許文献 1に開示された DNA チップにおいては、 クロスハイブリダィゼーシヨンが生じるため、 未知或いは既 知の遺伝子を正確に検出することができないといった問題がある。
非特許文献 1 Nature Biotechnology, Vol . 22, No. 4, 418—426, 2004 発明の開示
そこで、 本発明は上述したような実状に鑑み、 クロスハイプリダイゼーシヨン を確実に防止し、 検出感度に優れた核酸マイクロアレイを提供することを B的と する。 また、 本発明は、 クロスハイブリダィゼーシヨ ンを確実に防止できる核酸 プローブの設計方法を提供することを目的とする。 さらに、 本発明は、 - クロスハ イブリダィゼーションを確実に防止できる核酸ターゲットの調製方法を提供する' ことを目的とする。 さらにまた、 本発明は、. クロスハイプリダイゼーシヨンを確 実に防止し、 検出感度に優れた遺伝子検出方法を提供することを目的とする。 上述した 0的を達成した本発明は、 以下を包含する。
(1) 基板と、
ハイブリダィズに寄与しない塩基配列からなる非相補領域と、 ハイブリダィズ に寄与する塩基配列からなり、 検出対象の核酸ターゲット群のうち特定の核酸タ ーゲットに対して特異的にハイブリダィズする選択領域及び検出対象の核酸ター ゲットが共通して有するリンカー配列の全部または一部に対して相補 ή勺な調節領 域からなる相補領域とを含み、 上記基板上に固定された複数の核酸プローブとを 備え、
上記調節領域の長さは、上記複数の核酸プローブにおける相補領域の Tm値を近 づけるように設計されたことを特徵とする核酸マイクロアレイ。
上記(1)の核酸マイクロアレイにおいて、上記複数の核酸プローブにおける相補 領域の Tm値はほぼ一定の範囲内であることが好ましい。 また、 上記(1)の核酸マ イクロアレイにおいて、 上記選択領域が n個の塩基からなり、 アデニン、 グァニ ン、 チミン及びシトシンの全ての組合せに相当する 4n種類の選択領域 有するこ とが好ましい。 さらに、 上記(1)の核酸マイクロアレイにおいて、 上記核酸プロ一 ブは、 上記調節領域が上記選択領域を挟み込み、 上記非相補領域が上 f己相補領域 を挟み込むように構成されたものであることが好ましい。 また、 上記調節領域が 上記選択領域を挟み込むように構成された核酸プローブにおいて、 上言己選択領域 の 3 ' 末端側に位置する調節領域の長さと、 上記選択領域の 5 ' 末端側に位置する 調節領域の長さとが異なっていてもよい。上記(1)の核酸マイクロアレイ において、 上記複数の核酸プローブは全て同じ長さであることが好ましレ、。上記(1) の核酸マ イクロアレイにおいて、 上記リンカ一配列は例えば、 配列番号 1記載の塩基配列 とすることができる。
また、 本発明は以下を包含する。
(2) 生体試料由来のユニーク配列と、他の核酸ターゲットと共通する リンカ一 配列とを含む核酸プローブに対してハイブリダイズする核酸プローブであって、 ハイブリダイズに寄与しない塩基配列からなる非相捕領域と、 ハイブリ ダイズに 寄与する塩基配列からなり、 上記ユニーク配列に特異的にハイプリダイズする選 択領域及び上記リンカー配列の全部または一部に対して相補的な調節領域からな る相補領域とを含む核酸プローブの塩基配列を設計する方法であって、
複数の核酸プローブにおける上記選択領域の塩基配列を、 各核酸プローブにお ける選択領域が異なる塩基配列を有するように設計する工程と、
異なる選択領域を有する複数の核酸プローブにおける、各相補領域の Tm値が近 づくように上記リンカ一配列の塩基配列及び上記調節領域の長さを設計する工程 とを含む核酸プローブの設計方法。
上記(2)の設計方法において、 上記選択領域の塩基配列を設計する工程では、 n 個の塩基からなる選択領域に対して、 アデニン、 グァニン、 チミン及ぴシトシン の全ての組合せに相当する 4"種類の塩基配列を設計し、 4 "種類の核酸プローブに おける相補領域の Tm値がほぼ一定の範囲になるように、調節領域の長さを核酸プ ローブ毎に決定することが好ましい。 また、上記(2)の設計方法において、 上記調 節領域の長さを設計する工程は、 複数の核酸プローブにおける各選択領域のグァ ニン及びシトシン含量 (GC含量) の偏りを評価する工程を含み、 選択領域の GC 含量に偏りがある場合には、 当該選択領域の 3 ' 末端側に設計する調節領域の長 さと、 当該選択領域の 5 ' 末端側に設計する調節領域の長さとを異ならせるよう に設計することもできる。
さらに、 本発明は以下を包含する。
(3) 生体試料由来のユニーク配列と、他の核酸ターゲットと共通するリンカ一 配列とを含む核酸ターゲットを含む溶液を、 ハイプリダイズに寄与しない塩基配 列からなる非相補領域と、 ハイプリダイズに寄与する塩基配列からなり、 上記ュ ニーク配列に特異的にハイプリダイズする選択領域及び上記リンカー配列の全部 または一部に対して相補的な調節領域からなる相補領域とを含む核酸プローブを 基板上に固定してなる核酸マイクロアレイに対して接触させる工程と、
上記核酸マイクロアレイの核酸プローブにハイブリダイズした核酸ターゲット を検出する工程とを含む遺伝子検出方法。
上記(3)の遺伝子検出方法において、上記複数の核酸プローブにおける相補領域 の Tm値はほぼ一定の範囲内であることが好ましい。 また、 上記(3)の遺伝子検出 方法において、 上記選択領塽が n個の塩基からなり、 アデニン、 グァニン、 チミ ン及びシトシンの全ての組合せに相当する 4"種類の選択領域を有することが好 ましい。 さらに、 上記(3)の遺伝子検出方法において、 _h記核酸プローブは、 上記 調節領域が上記選択領域を挟み込み、 上記非相補領域力 S上記相捕領域を挾み込む ように構成されたものであることが好ましレ、。上記 (3)の遺伝子検出方法において、 上記複数の核酸プローブは全て同じ長さであることが好ましい。上記(3)の遺伝子 検出方法において、 上記リンカ一配列は例えば、 配列番号 1記載の塩基配列にお ける 25〜32番目の領域を除く塩基配列とすることができる。
本明細書は本願の優先権の基礎である日本国特許出願 2004- 278122号の明細書 および Zまたは図面に記載される内容を包含する。 図面の簡単な説明
図 1は、 本発明に係る核酸マイクロアレイを模式的に示す要部断面図である。 図 2は、 本発明に係る核酸マイクロアレイを模式的に示す斜視図である。
図 3は、 本発明に係る核酸マイクロアレイを模式的 ^こ示す要部断面図である。 図 4は、 核酸ターゲットの構成を模式的に示す構成図である。
図 5は、 本発明に係る核酸マイクロアレイを模式的に示す要部断面図である。 図 6は、 297 種類の核酸プローブにおけるハイブリタ、'ィズを核酸ターゲッ ト 1
0の蛍光標識から検出した結果を示す写真である。
図 7は、 本発明に係る核酸ターゲットの調製方法のフローチャートである。 図 8— 1は、 本発明に係る核酸ターゲットの調製方法を説明するための模式図 である。
図 8— 2は、 本発明に係る核酸ターゲットの調製方 を説明するための模式図 である。
図 9 A、 B及ぴ Cは、 実施例 1の実験結果。 全酵母の 0RFに由来するユニーク 配列のチップを用いコントロール酵母、 エタノールス卜レス酵母を用いた実施例 におけるスキヤン画像の一部とシグナル強度の散布図である。
図 1 0 A、 B及び Cは、 実施例 2の実験結果。 4 8信のユニーク配列のチップ を用いコントロール酵母、 エタノールストレス酵母を用いた実施例におけるスキ ヤン画像の一部とシグナル強度の散布図である。 発明を実施するための最良の形態
以下、 本発明を詳細に説明する。
本発明に係る核酸マイクロアレイは、 図 1に示すように、 基板 1と、 基板 1上 に種類毎に固定化された核酸プローブ 2とから構成され、 核酸プローブ 2の種類 毎に区画されたスポッ ト 3を有している。 スポッ ト 3は、 図 2に示すように、 基 板 1の一主面においてマトリックス状に配されている。
基板 1 としては、 核酸プローブを固定化できれば特に限定されず、 ガラス板及 び樹脂板等を使用することができる。 樹脂板としては、 ポリエチレン、 ポリプロ ピレン、 ポリスチレン、 ナイロン及びシリ コーン等のプラステイク板、 ニトロセ ルロース及びセルロースァセテ一ト等のセルロース板等を使用することができる, なお、 核酸プローブ 2の固定化方法によっては、 一主面に表面処理を施した基板 1を使用することもできる。 例えば、一主面をポリ L-リシンでコーティングした ガラス板を使用することができる。 また、 基板の形状は、 板状のものに限定した ものではなく、 球状のもの (ビーズ) などがある。
核酸プローブ 2は、 図 3に示すように、 ハイブリダィズに寄与しない塩基配列 からなる非相補領域 4と、 ハイブリダィズに寄与する塩基配列からなり、 核酸タ ーゲッ トに対して特異的にハイブリダィズする選択領域 5及ぴ検出対象の核酸タ ーゲッ トが共通して有するリンカー配列の全部または一部に対して相補的な調節 領域 6からなる相補領域 7とを含む。 また、 核酸プローブ 2は、 非相補領域 4及 び相補領域 7以外に、 基板 1 との間に配されるスぺーサー領域 8を有するような 構成であっても良い。
本発明に係る核酸マイクロアレイにおいて、 選択領域 5が n個の塩基からなる 場合、 アデニン、 グァニン、 チミン及びシトシンの全ての組合せに相当する 4Π種 類の選択領域 5を設計することができる。 すなわち、 核酸プローブ 2としては、
4"種類の選択領域 5に対応して 4 "種類を設計することができる。 一例として図 3 に示すように、 選択領域 5が 8塩基の長さからなる場合、 65536 通りの塩基配列 を設計することができ、 65536 通りの核酸プローブ 2を設計することができる。 なお、 選択領域の塩基長は 8個に限定されず、 如何なる数でもよい。 但し、 選択 領域 5が 5塩基長では 1024種類しか設計できないこととなり、核酸マイクロアレ ィを用いた遺伝子の発現解析には不十分であると考えられる。 一方、 選択領域 5 が 1 0塩基長では 1048576種類を設計することとなり、 ヒ トの遺伝子が約 32000 種類であると推定されていることからすると、約 90%の遺伝子を一意的に選択す ることができると考えられる。 したがって、 選択領域 5は、 6〜1 0塩基長であ ることが望ましい。 '
なお、 本発明に係る核酸マイクロアレイは、 核酸プローブ 2として、 選択領域 5の全ての組合せに相当する種類を有することが望ましいが、 必ずしも全ての組 合せに相当する種類を有していなくても良い。 例えば、 選択領域 5が 8塩基長か らなる場合、 65536 通りの核酸プローブ 2のうち 9 5 %、 好ましくは 9 7 %、 よ り好ましくは 9 9 %の核酸プローブ 2を有していれば、 核酸マイクロアレイとし ては、 優れた検出能で遺伝子発現解析を行うことができる。 より具体的に、 選択 領域 5が 8塩基長からなる場合、 選択領域 5が全てアデニンのみからなる核酸プ ローブ 2や、 他の核酸プローブ 2と比較して選択領域 5の末端 1塩基のみが相違 する核酸プローブ 2等を除いた、 核酸プローブ 2を有する核酸マイクロアレイで あっても、 優れた検出能で遺伝子発現解析を行うことができる。
また、 核酸プローブ 2に含まれる調節領域 6は、 詳細を後述する核酸ターゲッ トが共通して有するリンカー配列の全部または一部に対して相補的な塩基配列を 有している。 ここで、 核酸ターゲットの一例として、 図 4に示すように、 核酸タ ーゲッ ト 1 0を例示して説明する。 核酸ターゲッ ト 1 0は、 細胞や組織等の生体 試料から抽出した mRNAに由来するユニーク配列 1 1 と、ユニーク配列 1 1を挟み 込む第 1のリンカ一 1 2及び第 2のリンカ一 1 3 (まとめて単に 「リンカ一」 と 称する場合もある。) とを備えている。 核酸ターゲッ ト 1 0において、 ユニーク配 列 1 1は、 生体試料に由来する多種類の mRNAに由来しているため、 mRNAの種類 毎に異なる配列となる。 一方、 リンカ一配列は、 全ての核酸ターゲット 1 0にお いて共通する配列である。
リンカ一の塩基配列は、 特に限定されずいかなる配列であってもよい。 また、 リンカ一における GC含量は 35〜65%が好ましく、 40〜60%がより好ましく、 45
〜55°/。が最も好ましい。第 1のリンカー 1 2の一例としては配列番号 1の塩基配列、 第 2のリンカー 1 3の一例としては配列番号 2の塩基配列を挙げることができる。 リンカー配列としては、例えば、配列番号 1記載の塩基配列における 25〜32番目 の領域を除く塩基配列を例示することができる。 なお、 核酸ターゲッ トの調製方 法及びリンカ一の塩基配列設計方法については後述する。
調節領域 6は、 第 1のリンカー 1 2及び第 2のリンカー 1 3に相補的な塩基配 列からなり、 選択領域 5を挟み込むように分割されている。 すなわち、 調節領域 6の一方は第 1のリンカ一 1 2に相補的な塩基配列からなり、 調節領域 6の他方 は第 2のリンカ一 1 3に相補的な塩基配列からなる。
また、 図 5に示すように、 調節領域 6は異なる長さである場合がある。 すなわ ち、 調節領域 6は、 リンカ一の一部と相補的な塩基配列からなる場合がある。 本 発明に係る核酸マイクロアレイにおいては、 調節領域 6及び選択領域 5からなる 相補領域 7の Tm値が、 複数の核酸プローブ 2において、 近くなるように、 調節領 域 6の長さが決定されている。
仮に、 上述したように予め決定されている選択領域 5のみを核酸ターゲッ ト 1 0とハイブリダィズさせ、 核酸ターゲット 1 0のユニーク配列 1 1を検出するこ とを想定した場合、 各ハイブリダイズにおいて、 選択領域 5の塩基配列に応じて 異なる Tm値となる。一方で、核酸マイクロアレイは、各スポット 3を同一条件(温 度、 塩濃度、 pH等) で処理するため、 各スポッ ト 3におけるハイブリダィズを安 定して形成することができない。
これに対して、 本発明に係る核酸マイクロアレイにおいては、 調節領域 6の長 さを適宜調節して設計することで、 ハイブリダィズに寄与する相補領域 7の Tm 値を全ての核酸プローブ 2において近くすることができる。 これにより、 本発明 に係る核酸マイクロアレイによれば、 選択領域 5の塩基配列が異なる場合でも、 核酸プローブ 2と核酸ターゲッ ト 1 0とのハイプリダイズを安定して形成するこ とができ、 クロスハイブリダィゼーションを確実に防止することができる。
以下、 調節領域 6の長さを設計する方法について説明する。 調節領域 6の長さ を設計する際には、 先ず、 設計した複数の核酸プローブ 2における各選択領域 5 のグァニン及びシトシン含量 (GC含量) を算出する。 次に、 算出した GC含量に 基づいて、 GC 含量と最適な調節領域 6の長さとを関連付けたデータベースから、 各選択領域 5に最適な調節領域 6の長さを検索する。このデータベースによれば、 選択領域 5の GC含量が高い場合には調節領域 6の長さを短く設計し、選択領域 5 の GC含量が低い場合には調節領域 6の長さを長く設計すること となる。
ここで、 GC含量と最適な調節領域 6の長さとを関連付けたデータベースの作製 方法の一例を、 実験例とともに説明する。 本例では、 選択領域 5が 8塩基長、 す なわちユニーク配列 1が 8塩基長である場合を例示する。 本実験では、 表 1に 示す塩基配列を有する 1 1種類の核酸断片を合成し、これら核酸断片を铸型として T7RNAポリメラーゼを用いた RNA鎖合成反応を行い、 得られた RNA鎖を核酸ター ゲット 1 0としている。 なお、 得られた核酸ターゲット 1 0は、 蛍光標識 CTPを 用いた RNA鎖合成により蛍光標識されている。
表 1
名称 塩基配列 ユニーク酉己列 GC含量
GCOtarg CGGATGTTCGAATAATATTAGCTTGTAGCG ΑΤΑΑΓΑΤΤ 0/8
GCltarg CGGATGTTCGATATCATAAAGCTTGTAGCG TATCA.TAA 1/8
GC2targ CGGATGTTCGAAATCATGAAGCTTGTAGCG AATCA.TGA 2/8
GC3targ CGGATGTTCGAGTATGTTCAGCTTGTAGCG GTATG-TTC 3/8
GC4mmtarg CGGATGTTCGACGAAAGAGAGCTTGTAGCG CGAAA.GAG 4/8
GC4medtarg CGGATGTTCGATCATGCTGAGCTTGTAGCG TCATG-CTG 4/8
GC4maxtarg CGGATGTTCGATCCCCTTTAGCTTGTAGCG TCCCC TTT 4/8
GC5targ CGGATGTTCGACTGCAGGAAGCTTGTAGCG CTGCA.GGA 5/8
GC6targ CGGATGTTCGACAGGCTGCAGCTTGTAGCG CAGGCTGC 6/8
GC7targ CGGATGTTCGACGCAGGCCAGCTTGTAGCG CGCA&GCC 7/8
GC8targ CGGATGTTCGACGGCCCGCAGCTTGTAGCG CGGCCCGC 8/8 一方、 核酸プローブ 2としては、 表 1に示したユニーク配列に相補的な選択領 域 5を有し、 選択領域 5の両端にリンカーに相補的な 2〜10塩基の調節領域 6を 有するものを準備する。 すなわち、 上記 11種類のユニーク配列【こ対応する 1 1種 類の選択領域 5から選ばれる 1の選択領域 5について、 2〜10 基の調節領域 6 を有する 9種類の核酸プローブ 2を準備する。 よって、上記 11種類のユニーク配 列に対応する 11種類の選択領域 5について、 99種類の核酸プローブ 2を準備す ることとなる。 さらに、 これら 99種類の核酸プローブ 2全てについて、 1塩基ミ スマッチを有する 2種類の核酸プローブ 2も準備する。 よって、上記 11 種類のュ ニーク配列に対応する 11種類の選択領域 5について、合計で 297種類 O核酸プロ ーブ 2を準備することとなる。
そして、 これら 297種類の核酸プローブ 2を固定した核酸マイクロ T"レイに上 記 11種類の核酸ターゲット 1 0を接触させ、核酸プローブ 2と核酸ターゲット 1 0 とのハイブリダイゼーションを行う。 ハイブリダイゼーションの条件は Buffer; 6xSSC+50%ホルムアミ ド、 25度である。 297種類の核酸プローブにおける ハイブリダィズを核酸ターゲット 1 0の蛍光標識から検出した結果を図 6に示す 図 6中、横軸は選択領域 5の GC含量を意味しており、縦軸は調節領 6の長さ を意味している。 例えば図 6中 「GC0」 は、 表 1中 GC含量 0/8のユニーク配列に 相補的な選択配列 5を有する核酸プローブの列を意味する。 図 6中 「GC4min」 は 表 1における 「GC4mintarg」 のユニーク配列に相補的な選択配列 5を有する核酸 プローブの列を意味し、 「GC4med」 は表 1における 「GC4medtarg」 のユニーク配列 に相補的な選択配列 5を有する核酸プローブの列を意味し、 「GC4max」は表 1にお ける 「GC4maxtarg」 のユニーク配列に相補的な選択配列 5を有する核酸プローブ の列を意味する。 「GC4min」、 「GC4med」 及び 「GC4max」 は、 選択領域 5 における GC含量が 4/8と同じ値である力 S、グァニンとシトシンの存在位置により異なる Tm 値を示すものである。 「GC4min」 は GC含量が 4/8であり、最も低い Tm値を示すも のであり、 「GC4max」 は GC含量が4 /8であり、 最も高い Tm値を示すものである。 「GC4med」 は GC含量が 4/8であり、 中間程度の Tm値を示すものである。
また、図 6中、所定の GC含量の核酸プローブを意味する列に 3つのスポッ トが あるが、 左側のスポットが核酸ターゲット 1 0と完全にマッチする核酸プローブ のスポッ トであり、 中心及ぴ右側のスポットは核酸ターゲット 1 0と 1塩基ミス マッチする核酸プローブのスポットである。
よって、 図 6中、所定の GC含量の選択配列 5を意味する列において、左側のス ポッ トが強く検出されるとともに中央及び右側のスポッ トが検出されない長さ
(縦軸) 、 当該 GC含量の選択配列 5にとつて最適であることが判明する。 図 6 に示したスポッ ト検出結果に基づいて、 完全マッチ核酸プローブの蛍光シグナル を 1塩基ミスマッチ核酸プローブの蛍光シグナルで割って相対化した結果を表 2 に示す。
表 2
GC0 GC1 GC2 GC3 GC4min GC4med GC4max GC5 GC6 GC7 GC8
Figure imgf000013_0001
+ 表 2中、太枠で囲ったセルは、所定の GC含量の選択領域 5を有する完全マッチ 核酸プローブにおいて、 相対シグナルが最も高い値を示したセルを意味する。 ま た、影付きのセルは、太枠で囲ったセルの値より劣るが、所定の &C含量の選択領 城 5を有する完全マッチ核酸プローブにおいて、 相対シグナルが ヒ較的に優れた 値を示したセルを意味する。
図 6及び表 2に示した結果から、 8塩基長からなる選択領域 5に含まれる GC含 量と最適な調節領域 6の長さとを関連付けたデータベースを構築することができ る。 データベースは例えば表 3のように表すことができる。
表 3
- 11 - 差替え用紙(規則 26) GC含量 調節領域の塩基長
0 9
1 8
2 7
3 6
4 6
5 5
6 5
7 4
8 4
表 3に示したデータベースを用いれば、 設計した複数の核酸プローブ 2におけ る 8塩基長からなる各選択領域 5の GC含量に基づいて、調節領域 6の長さを具体 的に設計することができる。 なお、 核酸プローブ 2における選択領域 5が 8塩基 長以外であっても同様にデータベースを構築し、 調節領域 6の長さを具体的に設 計することができる。
ところで、選択領竑 5における GC含量が同じ値であっても、 グァニンとシトシ ンの存在位置によっては大きく異なる Tm値を示す場合がある。例えば、選択領域 5における GC含量が 4の配列の組合せは、 17920種類あり、 Nearest- Neighbor 法 (RNA - DNA hybrid) にて Tm値を計算すると 25. 0257. 94という広がりを持つ ている。
したがって、 調節鎮域 6の長さを設計する方法においては、 上述したように、 選択領域 5の GC含量を算出した後、 算出した GC含量が同じである複数の選択領 域 5の全てについて Tm値を算出し、 Tm値の平均値よりも高い Tm値を示す選択領 域 5については調節煩域 6の長さを短く設計し、 Tm値の平均値よりも低い Tm値 を示す選択領域 5につレ、ては調節領域 6の長さを長く設計するように処理するこ とが好ましい。
ここで、 Tm値の算出方法としては、 特に限定されず公知の算出方法を適宜使用 することができる力 正孩性が高いと評価されている Nearest- Neighbor法で計算 することが好ましい。 Nearest-Neighbor法によれば Tm値は下記式により与えら れる。 .
[数 1 ]
Τπι=1000ΔΗ/ {-10.8+AS+R ln(Ct/4)} - 273.15+16.6 log10[Na+]
ここで、 ASはノヽイブリットにおける隣接ェントロビー変化の合計 (cal/mol · K) を意味し、 Δ H はノヽイブリ ッ トにおける隣接ェンタルピー変化の合計 (Kcal/raol) を意味し、 Rは気体定数 (1.987cal/deg · mol) を意味し、 Ctはオリ ゴの total mol濃度 (mol/1) を意味し、 Na+は Na+のモ^^濃度を意味する。 本例 では、 Ct=0.5 M、 [Na+] =50mMとして計算している。 また、 3及び八11は表4で 与えられる。
表 4
AH(Kcal/mol) AS{cal/mol-k)
AA -9.1 -24
AG -7.8 -20.8
AC -6.5 -17.3
AT - 8.6 -23.9
GA - 5.6 -13.5
GG -11 -26.6
GC -11.1 - 26.7
GT - 6.5 -17.3
TA - 6 - 16.9
TG - 5.8 - 12.9
TC -5.6 -13.5
TT -9.1 -24
CA -5.8 -12.9
CG -11.9 -27.8
CC -11 -26.6
CT -7.8 -20.8
例えば、 塩基配列 "AGCTATGC" の Tmは、 Nearest- Neighbor 法で以下のように 計算される。 まずこの塩基配列を隣接 2塩基ずつにすると、 "AG"、 "GC"、 "CT"、 "TA"、 "AT"、 "TG" 及び " GC" となる。 よって、 ΔΗ及び AS 以下のように算出 さ る。
ΔΗ=-7.8—11.1—7.8-6.0—8.6-5.8—11.1= - 58.2kcal/mol
AS=-20.8-26.7-20.8-16.9—23.9—12.9—26.7= 148.7cal/mol · k
これを上記式に代入すると Tm = 9.83°Cとなる。
このようにして、上記式及び表 3から選択領域 5の Tm値を算出することができ る。 そして、 同じ GC含量である複数の選択領域 5の全 Tm f直から平均値 (中央値) を算出する。 その後、 各選択領域 5の Tm値と当該平均値 (中央値) とを比較し、 各選択領域 5の Tm値が平均値(中央値) よりも高い場合には調節領域 6の長さを 短く設計し、逆に低い場合には調節領域 6の長さを長く設 Ifする。より具体的に、 表 3に示した 8塩基長からなる選択領域 5に含まれる GC含量と最適な調節領域 6 の長さとを関連付けたデータベースは、 例えば、 表 5に示すようになる。
表 5
選択配列の
Tm値と中央値との比較 調節領域の長さ
GC含量
GCO Tm値中央値以下 9
GCO Tm値中央値以上 8
GC 1 Tm値中央値以下 8
GC 1 Tm値中央値以上 7
GC2 Tm値中央値以下 8
GC2 Tm値中央値以上 7
GC3 Tm値中央値以下 6
GC3 Tm値中央値以上 5
GC4 Tm値中央値以下 6
GZ4 Tm値中央値以上 5
GC5 Tm値中央値以下 5
GC5 Tm値中央値以上 4
GC6 Tm値中央値以下 4
GC6 Tm値中央値以上 3
GC7 Tm値中央値以下 4
GC7 Tm値中央値以上 3
GC8 Tm値中央値以下 4
GC8 Tm値中央値以上 3
5に示すデータベースを使用して調節領域の長さを設計することによって、 選択領域 5及び調節領域 6からなる相補領域の Tm値を、複数 核酸プローブ 2に おいてより近づけることができる。
以上のように、 調節領域 6の長さを設計することができる。 例えば、 選択領域 5の長さが 8塩基で、 選択領域 5の塩基配列として全ての組 せ (65536 通り) を設計した場合には、 第 1のリンカ一 1 2として配列番号 1における 1〜24番目 の塩基配列、第 2のリンカ一 1 3として配列番号 1における 33〜45番目の塩基配 列を例示することができる。
非相補領域 4は、 核酸ターゲット 1 0と相補鎖を形成しない塩基配列から構成 される。 非相補領域 4の塩基配列としては、 核酸ターゲット 1 0と相補鎖を形成 しなければ特に限定されない。 また、 非相補領域 4としては、 ターゲッ トのリン カー配列と同一の塩基になるように非相補領域を設定すれば、 最もハイプリ ッド 鎖を形成しにくいので、 より好ましい。
また、 調節領域 6の長さを設計する際には、 先ず、 核酸プローブ 2における各 選択領域 5の GC含量の偏りを評価する。 具体的には、 選択領域 5の中央から 3 ' 末端側の領域における GC含量と選択領域 5の中央から 5 '末端側の領域における GC含量とを比較して、 2倍以上の差がある場合には、 その選尺領域 5には GC含 量の偏りがあると評価する。 例えば、 選択領域 5の塩基配列が" GCGCATATA" であ る場合、 選択領域 5の中央から 3 ' 末端側の領域における GC含量が小さく、 選択 領域 5の中央から 5 ' 末端側の領域における GC含量が高くなつており、 この選択 領域 5に GC含量の偏りがあると評価する。
そして、 GC含量に偏りがあると評価された選択領域 5については、 GC含量が高 い側の調節領域 6の長さを短くするように設計する。 これによつて、 より GC含量 のバランスを考えた精密なハイプリダイゼーションを行うことも可能である。 一方、 上述したように設計された核酸プローブ 2は、 核酸合咸装置によって化 学的に合成することができる。 核酸合成装置としては、 DNA シンセサイザー、 全 自動核酸合成装置、核酸自動合成装置等と呼ばれる装置を使用することができる。 核酸プローブ 2を合成した後、 いわゆるスポッター装置を用いて、 基板 1上に核 酸プローブ 2を固定化することができる。 本発明に係る核酸マイクロアレイにお いては、 基板 1上への核酸プローブ 2の固定化には何ら限定されないため、 従来 公知のスポッター装置いずれも使用することができる。 ここで、 核酸プローブの 固定化密度は、 スポッター装置の性能に依存して適宜調節することができる。 例 えば、 1インチ X 3インチ (25mm X 75mm) のスライ ドガラス型の基板 1上に数百万 個のスポッ ト 3を配置することができる。
例えば、 上述したように、 選択領域 5を 8塩基長とした場合には 65536種類の 核酸プローブ 2を合成し、 各核酸プローブ 2に対して 65536個のスポッ ト 3が必 要となる。 1枚の基板 1上にこれら全てのスポッ ト 3を形成できない場合には、 複数枚の基板 1を用いて全てのスポッ ト 3を形成すればよい。 すなわち、 選択領 域 5の全ての組合せは、 複数の核酸マイクロアレイのうちいずれか 1の核酸マイ クロアレイに含まれていることとなる。 この場合には、 全てのスポッ ト 3が形成 された複数の核酸マイクロアレイを核酸マイクロアレイセッ トとして、 一連の遺 伝子解析試験に使用することができる。 ·
次に、 上述した核酸マイクロアレイに使用される核酸ターゲッ トの調製方法に ついて、 図 7に示すフローチャートを参照して説明する。 また、 核酸ターゲッ ト の調製方法を図 8— 1及び図 8— 2に模式的に示す。
先ずステップ 1 (図 7において 「S1」 と表記する。 以下のステップも同様に表 記する。) において、 生体試料から解析対象を抽出する。
生体試料としては、 例えば特定の疾患に罹患している患者から採取したヒ ト細 胞、 特定の条件下に置かれた生体由来の細胞、 ゲノムのシーケンスが未知な生体 由来の細胞、 及び、 これら細胞に対する対照となる細胞を挙げることができる。 対象とする生物は真核生物のみならず原核生物も含めたすべての生物となる。 生 体試料としては、 何ら限定されるものではない。
解析対象は生体試料に含まれる核酸である。 これには DNAと RNAが含まれる。 DNAにはゲノム DNAゃミ トコンドリァといった細胞小器官がもつ DNA等が含まれ、 何ら限定されるものではない。 また、 RNAには mRNAや tRNA、 リボソーム RNAや miRNA 等がすべて含まれるものであり、 機能上の分類には何ら制約されるもので はない。
生体試料から解析対象を抽出する手法としては、 何ら限定されず、 公知の手法 を使用することができる。例えば解析対象を mRNAとした場合、抽出方法としては グ ァ ニ ジ ン 一 塩 ィ匕 セ シ ウ ム 超 遠 心 法 、 AGPC 法 ( Acid guanid inium- Phenol- Chloroform法)、 ISOGEN法 (RNA抽出用キッ ト、 二ツボンジ ーン社製) 等を挙げることができる。 RNA試料にはリボソーム RNAが多量に含ま れるが、 これが解析対象でない場合には除去することが望ましい。 この場合、 生 体試料が真核生物のものであれば Ol igotex- dT30 (第一化学薬品社製) や Dynabeads 01 igo (dT) 25 (DYNAL社製) を使用した poly (A) RNA精製法等を挙げる ことができる。 生体試料が原核生物由来であれば、 MICROBExpress (Ambion社製) 等を使用した精製法が挙げることができる。
なお、 以下においては、 一例として、 生体試料が真核生物であり、 解析対象を mRNA とする場合を説明する。 しかしながら、本発明では、 DNAや、 mRNA以外の RNA を含む核酸を解析対象とすることができる。 特に、 生体試料が原核生物である場 合には、 解析対象としてトータル RNAを抽出することとなる。 生体試料が原核生 物である場合には、以下の説明において mRNAがトータル RNAとなる以外は、 同様 な工程を採ることができる。
次に、 ステップ 2において、 抽出した mRNAを逆転写酵素にて cDNAにし、 さら に DNAポリメラーゼ等を用いて二本鎖の DNAにする。 この二本鎖 DNAを第 1の制 限酵素で処理し、 この断片の一方端部は制限酵素認識配列となる。 ここで、 ステ ップ 1で抽出した mRNAの一方端部 (例えば、 3 ' 末端側の端部) を、 第 1の制限 酵素処理に先立って担体に付着させておく ことが好ましいが、 逆転写後の cDNA の一方端部 (例えば、 3 ' 末端側の端部) あるいは二本鎖合成後の cDNAの一方端 部 (例えば、 3 ' 末端側の端部)、 第一の制限酵素処理後の断片における一方端部 (例えば、 3 ' 末端側の端部) を担体に付着させても今後の処理上、 同様の効果 を得ることができる。 ステップ 1で抽出した核酸の一方端部を担体に付着させて おくことによって、 その後の操作において、 一方端部側の核酸断片を容易に分離 することができる。 担体としては、 特に限定されないが、 例えば、 ストレブトァ ビジンビーズ、 磁性ビーズ等を使用することができる。
ステップ 2において使用する第 1の制限酵素としては、 4塩基を認識配列とす る制限酵素を使用することが好ましい。 4塩基を認識配列とする制限酵素は、 認 識配列の出現頻度が 5塩基以上を認識とする制限酵素より高いため、 より多くの 種類の核酸ターゲッ トを準備することが可能となり、 より詳細な遺伝子発現解析 を行うことができる。 第 1の制限酵素としては、 特に限定されないが、 Taql (T i CGA)、 Nlal l l (CATG | )、 Mbol ( i GATC)、 Alul (AG I CT)、 Rsal (GT I AC)、 Msel (T J, TAA) , Mspl (C i CGG) , Acil (C | CGC) などがある。 また、 第 1の制限酵素を複 数種類用いても構わない。
また、 望ましくはステップ 2において、 担体に付着した mRNA断片を除く mRNA 断片を除去する。 あるいは担体に付着した二本鎖合成後の cDNA断片を除く、核酸 の断片、 例えば、 第 1の制限酵素による処理を行った後、 担体を回収し、 回収し た担体を洗浄液で洗浄することによって、 担体に付着した二本鎖合成後の cDNA 断片を除く、 核酸の断片を除去することができる。
次に、 ステップ 3において、 一方端部に第 1の制限酵素認識配列を有する cDNA 断片に対して、 第 1のリンカ一 1 2を結合 (ライゲーション) する。 ここで、 第 1のリンカ一 1 2は、 上述したように、 一方端に第 1の制限酵素認識配列、 中途 部に Typells制限酵素の認識配列を有するように設計した後、 核酸合成装置によ つて合成して準備しておくことができる。 本ステップ 3によって、 一方端部に第 1のリンカー 1 2を結合した cDNA断片が作製されることとなる。 なお、 ステップ 2において担体を使用した場合には、 mRNAにおける担体を付着した端部とは反対 側の端部に第 1のリンカー 1· 2を結合した cDNA断片が作製されることとなる。 次に、 ステップ 4においては、 ステップ 3で作製した第 1のリンカ一 1 2を有 する cDNA断片を、 Typells制限酵素により切断する。 第 1のリンカ一 1 2には所 定の位置に Typells制限酵素の認識配列が存在するため、 Typells制限酵素で処 理すると、 生体試料由来の mRNAに由来する cDNAが所定の位置で切断されること となる。 ここで、 Typells 制限酵素とは、 認識配列の外側の数塩基〜~ H数塩基の 位置を切断する制限酵素であり、例えば、 FokI (GGATG 9/13)、 MboII (GAAGA 8/7)、
BsmFI (GGGAC 10/14)などがある。 また、 同様に離れたところ切断する TypellGの 制限酵素である Mmel (TCCRAC 20/18)、 Bsgl (GTGCAG 16/14) なども使用するこ とができる。認識部位から一定の長さ離れた箇所を切断できる制限酵素であれば、 限定してものではない。
また、 ステップ 4では、 第 1のリンカー 1 2を有する mRNA断片を除いて、 担体 に付着した cDNAを含む cDNA断片を除去する。 例えば、 Typells制限酵素処理を 行った後の溶液から、 担体を回収することによって、 第 1のリンカ一 1 2を有す る cDNA断片以外の cDNA断片を除去することができる。
さらに、 ステップ 4では、 Typel ls 制限酵素により切断された部分が突出 端 となる場合には平滑化処理を行う。 平滑化処理としては、 公知の手法を使用する ことができるが、 例えば、 3'末端の突出が生じる場合には Klenow fragmentを用 いた平滑化処理、 また 5'末端の突出が生じる場合には T4 DNA polymeraseを月い て突出部分を削ることで平滑化する方法を使用することができる。
次に、 ステップ 5において、 平滑化した末端に対して第 2のリンカ一 1 3を結 合 (ライゲーシヨン) する。 ここで、 第 2のリンカ一 1 3には、 調節領域 6 に対 応する塩基配列の他にプロモータ領域が結合していてもよい。 プロモータ領: t或と しては、 特に限定されないが、 T7 RNAプロモータを使用することができる。 この ステップ 5によって、 第 1のリンカー 1 2、生体試料由来の cDNAの一部 (生ィ本試 料由来のユニーク配列 1 1 )、第2のリンカー1 3及びプロモータ領域を含む核酸 断片を合成することができる。 この核酸断片において、 ユニーク配列 1 1は: 斤 対象の細胞における遺伝子に由来する配列であり、 第 1のリンカ一 1 2及び第 2 のリンカ一 1 3はユニーク配列 1 1の種類に拘わらず共通する配列である。おた、 ユニーク配列 1 1は、解析対象の細胞における遺伝子の発現の有無及び/又は 現 レベルを反映している。
次に、 ステップ 6では、 第 2のリンカ一 1 3に結合したプロモータ領域を禾 J用 して、 蛍光標識 RNA鎖を合成する。 具体的には、 ステップ 5で得られた第 1のリ ンカー 1 2、 生体試料由来のユニーク配列 1 1及ぴ第 2のリンカー 1 3から よる 核酸断片を铸型とし、 リボヌクレオチド、 蛍光標識リボヌクレオチド及び RKTAポ リメラーゼを含む溶液中で RNA鎖を合成 (転写反応) する。 これにより、 スラッ プ 5で得られた核酸断片の一方の差に相補的で、 蛍光標識された RNA鎖を得るこ とができる。 すなわち、 本ステップ 6によって、 第 1のリンカ一 1 2、 ユニーク 配列 1 1及び第 2のリンカ一 1からなる核酸タ一ゲット 1 0が蛍光標識 RNA と して合成されることとなる。
ここで、 蛍光標識ヌクレオチドとしては、 一般的に使用されている、 Cy3— UTP 或レ、は Cy5 - UTPを使用することができる。 例えば、 Cy3-UTPを使用して解す斤対象 の糸 胞由来の蛍光標識 RNA断片を合成し、 Cy5- UTPを使用して対照となる糸 01胞由 来の蛍光標識 RNA断片を合成することもできる。 ただし、 蛍光は Cy3や Cy5に限 定したものではなく、 蛍光標識ヌクレオチドは、 UTP だけではなく、 ATP、 GTP、 CTPでも構わない。 あるいは複数種類の標識リボヌクレオチを用いても構わなレ、。 上述したように、 核酸ターゲット 1 0を蛍光標識 RNA鎖とすることによって、 収 量の増加及びシグナルの改善を達成することができる。
または、 蛍光標識リボヌクレオチドを用いずに未標識リボヌクレオチドまたは ビ才チン標識、 アミノアリル標識リボヌタレチドを用いて RNAを合成し、 合成後 にィ匕学反応、 酵素反応等によって蛍光を標識し核酸ターゲッ トとしても い。 Lab el i t™などの核酸標識キットを使えば可能である。
以上で説明した核酸ターゲット 1 0の調製方法では、 ステップ 6において合成 した蛍光標識 RNA鎖を核酸ターゲット 1 0とする例である。 しかしながら、 ステ ップ 6において蛍光標識 DNA鎖を合成して、 得られた蛍光標識 DNA鎖を核酸ター ゲット 1 0としてもよい。
また、 ステップ 5において得られた核酸断片のうち一方の鎖を核酸ターゲット 1 Oとして使用することもできる。 この場合、 予め蛍光標識ヌクレオチドを含有 するように第 1のリンカー 1 2及び/又は第 2のリンカー 1 3を調製しておく。そ して、 ステップ 5で得られた核酸断片を熱処理によって一本鎖とし、 得ら た一 本鎖の核酸断片を核酸ターゲット 1 0として使用することができる。
一方、 本発明に係る遺伝子検出方法は、 核酸ターゲット 1 0を含む溶液を、 核 酸プローブ 2を有する核酸マイクロアレイに対して接触させる工程と、 そ O後、 核酸マイクロアレイの核酸プローブ 2にハイブリダィズした核酸ターゲッ卜 1 0 を検出する工程とを含む。 ここで遺伝子検出方法とは、 遺伝子の発現の有無を検 出する方法、 遺伝子の発現レベルを解析する方法、 遺伝子の発現変化を解す斤する 方法等を含む包括的な意味である。 また、 遺伝子としては、機能及び/又は:^基配 列が既知の遺伝子に限定されず、機能及び/又は塩基配列が未知の遺伝子を含む意 味である。
また、 本遺伝子検出方法は、 如何なる生物由来の遺伝子を検出対象とす こと ができる。 言い換えると、 遺伝子検出方法においては、 上述した核酸マイクロア レイを用いることによって、 生物種を何ら限定することなく、 如何なる生物由来 の遺伝子を検出対象とすることができる。
本発明に係る遺伝子検出方法では、 例えば、 ある生物種の 2つの状態における 遺伝子の発現レベルを比較するといつた遺伝子発現解析を行うことができる。 生 物種の 2つの状態としてま、例えば、ヒ ト健常者と及び所定の疾患を患った患者、 癌細胞及ぴ正常細胞、 所定の条件下にある細胞及び当該条件下にない細胞等を挙 げることができる。
具体的には、 各状態にある生物種から核酸ターゲット 1 0をそれぞれ、 上述し たように調製する。このと き、各核酸ターゲット 1 0は、互いに異なる蛍光標識、 例えば Cy3及び Cy5をそ ぞれ有するように調製される。 そして、 これら 2種類 の核酸ターゲッ ト 1 0を含む溶液を核酸マイクロアレイに接触させて、 核酸プロ ーブ 2に対して 2種類の核酸ターゲット 2がいわゆる競合的ハイブリダィゼーシ ョンする条件下におく。
特に、 本発明に係る核酸マイクロアレイにおいては、 核酸ターゲット 1 0とハ イブリダイズする核酸プローブ 2の相補領域 7の Tm値が、複数の核酸プローブ 2 において近くなるように構成されている。 したがって、 核酸プローブ 2に対して 2種類の核酸ターゲット 2をハイプリダズする際に、 クロスハイブリダィゼーシ ヨンを確実に防止することができる。 これにより、 本遺伝子検出方法によれば、 生物種の 2つの状態における遺伝子の発現レベルを正確に比較することができる。 以下、 実施例を用いて本発明をより詳細に説明するが、 本発明の技術的範囲は 以下の実施例に限定されるものではなレ、。
〔実施例 1〕
本実施例では、 全酵母遺伝子のゲノムデータベースから全 0RF (オープン ' リ ーデイング ' フレーム) ίこ関してユニーク配列を検索し、 当該ユニーク配列と相 補的な塩基配列からなる選択領域を有する核酸プ口一ブを設計した。 本実施例で は、 作製した核酸マイクロアレイを用いて、 酵母におけるエタノールス トレス下 での遺伝子発現解析を行った。 .
先ず、 酵母の全ての 0RFデータベースから、 0RF内に存在する制限酵素 Taqlの 認識配列(TCGA)の中で最も 3 ' 側にある認識配列の場所、 その場所から 3 ' 側の 8 塩基 (認識部位を含むと 12 基、 ユニーク配列に相当する) を、 コンピューター を用いて集計し、 酵母のユニーク配列データベースを作成した。 すなわち、 酵母 のユニーク配列データベース こは、制限酵素 Taqlの認識配列(TCGA)と、 当該認識 配列に続く 8塩基とからなる、 計 1 2塩基のユニーク配列が含まれている。
また、 0RF内に Taql認識酉己列がない遺伝子については、 3 ' UTR (0RFの 3 ' 側 の非翻訳領域) 200bp以内に Taq I認識配列があるものについてはこれらもタグ として、 ユニーク配列データベースに格納した。 ユニーク配列の集計は、 独自に プロダラミングしたユニーク酉己列設計プロダラミングである。 このプロダラミン グは、 指定した制 ^酵素 (今回は Taql) をもとに 0RF の塩基配歹 IJを切断し、 0RF 内の認識配列のうち最も 3' 倜に位置する認識配列を検索し、 検索された認識配 列から所定の塩基数 (今回は 8塩基) を塩基配列から抜き出し、 データとして格 納する基本プログミグからなり、 一度に数万個の配列を処理が可 で、 得られた データを市販のデータベースソフ トで処理を行った。 0RF内に Ta q I認識部位が ない 910遺伝子のうち、 355遺伝子については 3 'UTRの 200bp以内に Taq I認ヽ識 部位があり、 これらがタグである可能性もあることから、 今回のチップに加える こととした。 実際には、 タグ酉己列に重複があるため、 今回のチップには、 5335種 類のタグ配列 (6120遺伝子に相当) を配置した。
次に、 ユニーク配列データベースから、 独自に作成したプローブ設計プロダラ ミングによってプローブの設言十を行った。 このプロダラミングはユニーク配列か ら、 配列中の GC含量を計算し、 GC含量ごとに、 表 3に従いユニーク配列ごとに 調節領域の長さを決定すると同時に非調節領域の長さ、 全体の配歹 IJの設計、 調節 領域 +ユニーク配列の Tm値の計算も同時に設計する。これをもとにプロ一ブ配列 データベースを作成した。 次に、 プローブ配列データベースの配列全てを核酸自動合成機にて合成オリゴ ヌクレオチドを作成し、これらの全てを 1枚のスライドグラス上にスポッ トした。 スポットの方法は、 アジレン ト社によるインクジエツト方式にて行った。
一方、 核酸ターゲットを調製するため、 酵母は何も刺激を与えないコントロー ル酵母とエタノールス トレス酵母を用いた。 エタノールス トレスは対数増幅期に ある酵母をエタノール濃度 7%下で 30分曝露する条件を加えた。 各々の酵母を遠 心分離し回収し、 ホットフエノーノレ法にて RNAを分離した。 得られた RNAをオリ ゴ dTダイナビーズにて mRNAを回収した後、 ク口ンテック社の smar t cDNA合成キ ッ トにて 3 ' ピオチン化 cDNAの合成を行い、 制限酵素 Taqlで切断を行った。 切 断後ス トレブトアビジン磁気ビーズを加え、 3 ' ビォチン化断片を回収した。 第 1 のリンカーをライゲーションし、 Typells制限酵素 Foklにて処理し、 第 1のリン カーと mRNA由来の配列 (ユニーク配列) を含む断片が得られ、 その断片を平滑末 端化した後、 第 2のリンカ一をライゲーシヨンする。 第 1のリンカ一と第 2のリ ンカーをライゲーシヨンした産物 (タグ) をリンカー上に配置したプライマーを 用いた PCR反応にて増幅し、 ポリアクリルアミ ドゲルに電気泳動し、 タグのサイ ズの確認及ぴタグに相当するバン ドを切り出し、 精製を行う。 次に、 この精製し た断片を鎵型に T7 RNAポリメラーゼを用いた in vitro transcription反応を行 う。 この反応は ambion社の RNA合成キット (Megascript™) を用いて行った。 合 成時に、 Cy3及び Cy5標識 UTPを朱標識 UTPの 1/3モル量加えるこ と蛍光標識を 行った。 合成した蛍光標識 RNAは、 カラムを用いて精製し、 チップへのハイブリ ダイゼーシヨンに用レ、た。
次に、 作成した蛍光標識 RNAの濃度を測定し、 それぞれ 1 n mol を 50 μ 1 のハ ィプリダイゼーションバッファー tこ溶角?した。 ハイプリダイゼーシ ヨンのパッフ ァ一は最終濃度が、 6 X SSC、 50°/。ホルムアミ ドの濃度からなる。 70 度で 5分熱変 性後、室温になったのち、 DNAチップ上に 50 μ 1 のこの蛍光標識 RNA溶液を加え、 力パーグラスをかけた。 密封でき るハイブリダィゼーシヨンチャンバ一内に DNA チップを静置し、 25度、 16時間、 ノ、イブリダィゼーシヨンを行った。 16時間後、 DNAチップを 2xSSC + 0. 2%SDS溶 ί 、 室温、 洗浄 15分、 次いで 0. 2x SSC + 0. 2%SDS 溶液、 室温、 洗浄 15分、 次いで O. 2xSSC + 0. 2%SDS溶液、 37度、 洗浄 15分、 次 いで、 0. 2xSSC、 室温、 洗浄 4分 ί亍つた。 DNAチップを遠心し、 水分を飛ばして乾 燥後、 フジフィルムの DNAチップスキャナーで観察を行った。
次に、 フジフィルムの DNAチップスキャナ一にてチップのスキヤ ンを つた。 取り込んだ画像は、 16ビッ トの TIFF画像に変換し、 DNAチップ解折ソフ トにて、 シグナルの数値化を行った。 DNA チップ解析ソフ トは米国スタンフォード大学の Michael Ei senの開発した Scan Alyzeを用いた。 得られたデータは標準化を行い total intens i ty法にて行った。 Total intens i ty法は、 比較対象となる 2群間の 遺伝子について、 半分が発現上昇し、 半分が発現低下するとィ反定して標準化を行 う。 標準化を行った後、 コントロール群とエタノールス トレス群とで、 シグナル の比をもって、 遺伝子発現の比とした。 3 倍以上遺伝子が変 1¾したものを変動し ていると評価した。 (図 9 A、 B及び Cに結果を示す。)
その結果、 エタノールストレスに応答して発現が特異的に変化する約 2 0 0個 の遺伝子を同定することができた。 エタノールス トレスに応答して発現が特異的 に上昇した遺伝子のなかでこれまでの報告と合致した遺伝子を表 6に示す。
表 6
ユニーク S列 ORF Name Functionl Functions Log2(Cy5/Cy3) 変動
TTCCATTG Y R093W PTR2 transport 1.64 EtOH UP
ATGGGCAC YHL024W 匪 4 molecular— function unknown 1.61 EtOH UP
TGCATTAT YDR406W PDR15 1.42 EtOH UP
CCTTCTAA YJL089W SIP4 transcription factor 1.30 EtOH UP
SRP-dependent, co-translational
CAGCAGAC YOL031C membrane targeting, molecular_function unknown 1.21 EtOH UP translocation*
CAGCATTG YJL016W biological_process unknown molecular_function unknown 1.10 EtOH UP
CAGGCAGT YOL083W biological_process unknown molecular_fu notion unknown 1.10 EtOH UP
TTGACTTC YOL157C bio]ogical— process unknown 0.97 EtOH UP
ATGACATC YOR173W biological_process unknown raolecular_function unknown 0.97 EtOH UP
AGGCGTAT YMR007W biological_process unknown molecular— function unknown 0.95 EtOH UP
TAGATTCC YLR177W biological— process unknown molecular— firaction unknown 0.91 EtOH UP
CAC2VAATG YDR490C PKH1 biological_process unknown 0.88 EtOH UP
AAAAGAAG YJR059W PTK2 polyamine transport 0.85 EtOH UP
TTCCTCAA YIR014W biological_process unknown mokcular一 function unknown 0.77 EtOH UP
TCCTGTCA YLE022C biological_process unknown molscular一 function unknown 0.76 EtOH UP
GGCCAAAT YML070W DAK1 glycerone kinase 0.74 EtOH UP
TAAAGAAT YNL009W IDP3 fatty acid beta-oxidation* isocitrate dehydrogenase (NADP+) 0.59 EtOH UP
ATTGTATG YML029W USA1 biological_process unknown molecular_function unknown 0.58 EtOH UP
ATTTATCA YDR518W EUG1 protein disulfide isomerase 0.57 EtOH UP
TCTACGAC YMR169C ALD3 stress response aldehyde dehydrogenase 0.48 EtOH UP
ATACTATC YDRrilGC biological— process unknown molecular— fonction unknown 0.46 EtOH UP
エタノールストレスに応答して発現が特異的に低下した遺伝子のなかでこれま での報告と合致した遺伝子を表 7に示す。
表 7
unique O F Name Ftmctionl Function^ Log2(Cy5/Cy3) 変動
TGACTCTG YGR200C ELP2 transcription -0.97262305 EtOH Down
TAGAGGCA YKL172W EBP2 rRNA processing molecular— function unknown -0.968914568 EtOH Down
AAAAAAAT YCR016W biological_pToc;ess unknown molecular— function unknown -0.960858881 EtOH Down
ATAAAAAA YHR066W SSFl molecular一 function unknown -0.889779389 EtOH Down
ATAAAAAA YHR066W SSFl molecular_function unknown -0.889779389 EtOH Down
TGTCGGTG YLR441C RPS1A protein biosynthesis structural protein of ribosome -0.773682847 EtOH Down
TAAATAAA YGR085C RPL11B protein biosynthesis* structural protein of ribosome ■0.714987695 EtOH Down
TAAATAAA YGR085C RPL11B protein biosynthesis* structural protein of ribosome •0.714987695 EtOH Down
TGCTTTCG YOR146W biological_proeess unknown raolecular_function unknown •0.630784571 EtOH Down
TTTTTTCT YLR198C biologicaljirocess unknown molecular— function unknown •0.548967183 EtOH Down
CAAGTCTG YPE.112C MRD1 biological_process unknown molecular_fanction unknown •0.436093122 EtOH Down
ATCTGATG YMR260C TIF11 protein synthesis initiation translation initiation factor -0.416561633 EtOH Down
また、 これまで報告されたエタノールス トレス応答性遺伝子とは合致しなかつ たが、 エタノールス トレスに対して発現量が有意に変化した遺伝子のユニーク配 列を表 8に示す。
表 8 unique Log2(Cy5/Cy3) unique Log2(Cy5/Cy3)
GAAGCAAA 8.79 CTCTGTAC 3.18
CAAGTAAT 8.07 AGTAGCAC 2.95
CGAATAAA 7.92 ACCAACGC 2.93
AATACTCC 7.47 ACGGGGCT 9.71
AATTACCA 7.33 GCAGGTGC 7.74
TACACTCA 7.09 GCCTTGCT 6.87
AGCTGTGA 4.04 CTCGTCCT 6.20
ACGACCTT 3.86 TCCCATGC 6.04
TTTGTAGG 3.29 TTACCGGG 6.03
ACATGCTC 3.18 CCCTATCG 5.98
表 8に示したユニーク配列を有する遺伝子は、 エタノールス トレス応答性遺伝 子としては報告されていないが、 新規なエタノールス トレス応答性遺伝子の候補 となり うる。 表 8に示したユニーク配列をプローブとして、 当該ユニーク配列を 有する遺伝子を同定することができる。 同定した遺伝子は、 遺伝子の機能解析実 験に供されることで、 その機能を詳細に解析することができる。
〔実施例 2〕
本実施例では、 8塩基長の選択領域を有する核酸プローブを、 全ての組合せに ついて設計し、 65536 種類の核酸プローブを固定した核酸マイクロアレイを作製 した。
プローブの設計
4 8種類 (65536種類) のユニーク配列をコンピューター用いて準備し、 各ュニ ーク配列ごとに GC含量を計算し、 表 3に従い、 調節領域の長さ (リンカ一長)、 非調節領域の長さを決定し、 プローブの配列を設計した。 これらはすべて独自に 設計したプログミングに基づくプローブ設計ソフトを用いて行った。 プローブ設 計時に各配列の Tm値も計算した。
チップの設計
Tm値が小さい順に、 チップ上に配置するように設計した。 今回のチップは 1枚 に 22000スポッ トしか配置できないため、 3枚のチップを用い、 Tm値の順に配置 した。 これらの配置に関するプログラムも設計し、 チップ上のユニーク配列とス ポッ トの場所 (座標)、 対象としている生物 (今回の実験では酵母) のユニーク配 列、 遺伝子、 機能などの情幸! ¾を有機的に結びつけるデータベースも同時に作成し た。
酵母からのターゲッ ト作成
酵母は何も刺激を与えないコントロール酵母とエタノールス トレス酵母を用い た。
エタノールストレスは対数増幅期にある酵母をエタノール濃度 7%下で 30分曝露 する条件を加えた。各々の酵母を遠心分離し回収し、ホッ トフヱノール法にて RNA を分離した。 得られた RNAをオリゴ dTダイナビーズにて mRNAを回収した後、 ク ロンテック社の smart cDNA合成キッ トにて 3 ' ビォチンィ匕 cDNAの合成を行い、 制限酵素 Taqlで切断を行った。切断後ストレプトアビジン磁気ビーズを加え、 3 ' ビォチン化断片を回収した。 第一リンカ一をライゲーシヨンし、 Typells 制限酵 素 Foklにて処理し、 第 1のリンカ一と mRNA由来の配列 (ユニーク配列) を含む 断片が得られ、 その断片を平滑末端化した後、 第 2のリンカ一をライゲーシヨン した。 第 1のリンカ一と第 2 のリンカーをライゲーションした産物 (タグ) をリ ンカー上に配置したプライマーを用いた PCR反応にて増幅し、 ポリアクリルアミ ドゲルに電気泳動し、タグのサイズの確認及びタグに相当するバンドを切り出し、 精製を行った。
次に、 この精製した断片を鎳型に T7 RNA ポリメラーゼを用いた in vitro transcript ion反応を行う。この反応は ambion社の RNA合成キッ 卜 (Megascript™) を用いて行った。 合成時に、 Cy3及び Cy5標識 UTPを未標識 UTPの 1/3モル量加 えることで蛍光標識を行った。合成した蛍光標識 RNAは、カラムを用いて精製し、 チップへのハイブリダイゼーションに用いた。
チップを用いたハイブリ実験の手順
作成した蛍光標識 RNAの濃度を測定し、 それぞれ 1 n mo lを 50 1のハイブリ ダイゼーションバッファ一に溶角军した。 ハイブリダイゼーションのバッファーは 最終濃度が、 6 X SSC、 50%ホルムアミ ドの濃度からなる。 70度で 5分熱変性後、 室温になったのち、 DNAチップ上に 50 1 のこの蛍光標識 RNA溶液を加え、 カバ 一グラスをかけた。 密封できるハイブリダイゼーションチヤンノく一内に DMAチッ プを静置し、 25 度、 16 時間、 ハイブリダィゼーシヨンを行う。 16 時間後、 DNA チップを 2xSSC + 0. 2%SDS溶液、室温、洗浄 15分、次いで 0. 2xSSC + 0. 2%SDS溶液、 室温、 洗浄 15分、 次いで 0. 2xSSC + 0. 2%SDS溶液、 37度、 洗浄 15分、 次レ、で、 0. 2xSSC, 室温、 洗浄 4分行った。 DNAチップを遠心し、 水分を飛ばして ¾燥後、 フジフィルムの DNAチップスキャナーで観察を行った。
シグナルの検出、 基準の設定と検出結果の評価
フジフイノレムの DNAチップスキャナ一にてチップのスキャンを行った。 取り込 んだ画像は、 16ビットの TIFF画像に変換し、 DNAチップ解析ソフトにて、 シグナ ルの数値化を行った。 DNAチップ解析ソフトは米国スタンフォード大学の Mi chae l Ei sen の開発した Scan Alyze を用いた。 得られたデータは標準化を行い tota l intens i ty法にて行った。 Total intens i ty法は、 比較対象となる 2群間の遺伝子 について、 半分が発現上昇し、 半分が発現低下すると仮定して標準化を行う。 標 準化を行った後、 コントロール群とエタノールス トレス群とで、 シグナルの比を もって、 遺伝子発現の比とした。 3倍以上遺伝子が変動したものを変動している と評価した。 遺伝子の同定は、 チップ設計時に作成したデータベースを用レ、て行 つた。 (図 1 0 A、 B及び Cに結果を示す。) 産業上の利用可能性
本発明に係る核酸マイクロアレイでは、 クロスハイブリダィゼーションを確実 に防止することができ、 優れた検出感度を達成することができる。 また、 本発明 に係る核酸プローブの設計方法では、 検出感度に優れた核酸マイクロアレイに固 定化することができる、 クロスハイブリダィゼーションを確実に防止できる核酸 プローブを設計することができる。 さらに、 本発明に係る遺伝子検出方法で 、 クロスハイプリダイゼーションを確実に防止でき、 優れた検出感度で遺伝子を検 出することができる。
本明細書で引用した全ての刊行物、 特許および特許出願をそのまま参考として本 明細書にとり入れるものとする。

Claims

請求の範囲
1 . 基板と、
ハイプリ ダイズに寄与しなレ、塩基配列からなる非相ネ甫領域と、 ハイプリダイズ に寄与する塩基配列からなり、 検出対象の核酸ターゲット群のうち特定の核酸タ ーゲットに対して特異的にハイブリダィズする選択領域及び検出対象の核酸ター ゲットが共通して有するリンカー配列の全部または一 §I こ対して相補的な調節領 域からなる相補領域とを含み、 上記基板上に固定された複数の核酸プローブとを 備え、
上記調節領域の長さは、上記複数の核酸プローブにおける相補領域の Tm値を近 づけるよう に設計されたことを特徴とする核酸マイクロアレイ。
2 . 上記選択領域が n個の塩基からなり、 アデニン、 グァニン、 チミン及び シトシンの全ての組合せに相当する 4n種類の選択領域を有することを特徴とす る請求項 1 記載の核酸マイクロアレイ。
3 . 上記核酸プローブは、 上記調節領域が上記選択領域を挟み込み、 上記非 相捕領域が上記相補領域を挟み込むように構成されたことを特徴とする請求項 1 記載の核酸マイクロアレイ。
4 . 上記選択領域の 3 ' 末端側に位置する調節領域の長さと、 上記選択領域 の 5 ' 末 側に位置する調節領域の長さとが異なることを特徴とする請求項 3記 載の核酸マイクロアレイ。
5 . 上記複数の核酸プローブは全て同じ長さであることを特徴とする請求項 1記載の核酸マイクロアレイ。
6 . 上記リンカー配列は配列番号 1記載の塩基配歹 IIにおける 25〜32番目の領 域を除く^:基配列であることを特徴とする請求項 1記載の核酸マイクロアレイ。
7 . 請求項 1、 3、 4、 5及び 6のいずれか一項言己載の DNAチップにおける 選択領域が n個の塩基からなり、 アデニン、 グァニン、 チミン及びシトシンの全 ての組合せに相当する 4n種類の選択領域の一部を有する、複数の核酸マイクロア レイから構成され、
上記 4"種類の選択領域は、上記複数の核酸マイクロアレイのうちいずれか 1の 核酸マイクロアレイに含まれていること特徴とする核酸マイクロアレイセッ ト。
8 . 生体試料由来のユニーク配列と、 他の核酸ターゲットと共通するリンカ 一配列とを含む核酸ターゲットに対してハイブリダイズする核酸プローブであつ て、 ハイブリダィズに寄与しない塩基配列からなる非相補領域と、 ハイブリダィ ズに寄与する塩基配列からなり、 上記ユニーク配列に特異的にノ、イブリダィズす る選択領域及び上記リンカ一配列の全部または一部に対して相浦的な調節領域か らなる相補領域とを含む核酸プロ一ブを設計する方法であって、
複数の核酸プローブにおける上記選択領域の塩基配列を、 各核酸プローブにお ける選択領域が異なる塩基配列を有するように設計する工程と、
異なる選択領域を有する複数の核酸プローブにおける、各相補領域の Tra値が近 づくように上記調節領域の長さを設計する工程とを含む核酸プローブの設計方法。
9 . 上記選択領域の塩基配列を設計する工程では、 n 個の塩基からなる選択 領域に対して、 アデニン、 グァニン、 チミン及びシトシンの全ての組合せに相当 する 4n種類の塩基配列を設計することを特徴とする請求項 8言己載の核酸プ口一 ブの設計方法。
1 0 . 上記調節領域の長さを設計する工程は、 複数の核酸プローブにおける 各選択領域のグァニン及びシトシン含量 (GC含量) を算出するェ程を含み、 選択 領域の GC含量が高い場合には調節領域の長さを短く設計し、 選 尺領域の GC含量 が低い場合には調節領域の長さを長く設計することを特徴とする請求項 8記載の 核酸プ口一プの設計方法。
1 1 . 上記調節領: !·或の長さを設計する工程は、上記 GC含量を算出する工程の 後、算出した GC含量が同じである複数の選択領域の全てについて Tm値を算出し、 値の平均値よりも高い Tm値を示す選択領域については調節鎮域の長さを短く 設計し、 Tm値の平均値よりも低い Tm値を示す選択領域については調節領域の長 さを長く設計することを特徴とする請求項 1 0記載の核酸プローブの設計方法。
1 2 . 上記調節領域の長さを設計する工程は、 複数の核酸プローブにおける 各選択領域のグァニン及びシトシン含量(GC含量)の偏りを評価する工程を含み、 選択領域の GC含量に偏りがある場合には、 当該選択領域の 3 ' 端側に設計する 調節領域の長さと、 当該選択領域の 5 ' 末端側に設計する調節慎域の長さとを異 ならせるように設計することを特徴とする請求項 8記載の核酸プローブの設計方 法。
1 3 . 生体試料から核酸を抽出する工程と、
抽出した核酸又は当該核酸を用いて合成された cDNA を第 1の制限酵素により 切断する工程と、
Typells 制限酵素認識酉己列を有する第 1のリンカ一を、 上記第 1の制限酵素に よる処理で形成された核酸又は cDNAの端部に結合する工程と、
第 1のリンカーを結合した核酸又は cDNAを、認識部位から一定の長さ離れた箇 所を切断できる Typells制」限酵素により切断して、 当該第 1のリンカー及び上記 核酸又は cDNAの一部を有する核酸断片を調製する工程と、
上記核酸断片における Typells制限酵素処理末端に第 2 のリンカーを結合する 工程とを含み、
生体試料由来のユニーク配列と第 1のリンカー及び第 2 のリンカーからなるリ ンカーとを含む核酸ターゲットを調製する核酸ターゲットの調製方法。
1 4 . 上記第 1の制限酵素により切断する工程に先立って、 生体試料から抽 出した核酸又は当該核酸を用いて合成された cDNA における一方端部を担体に付 着する工程と、
上記第 1の制限酵素により切断する工程の後、 上記担体に付着した核酸又は cDNAを分離する工程とを: Sに含み、
上記第 1 のリンカーを、上記担体に付着した核酸又は cDNAの端部に結合するこ とを特徴とする請求項 1 3記載の核酸ターゲットの調製方法。
1 5 . 上記第 2のリ ンカ一を結合する工程に先立って、 上記核酸又は cDNA を付着した担体を除去する工程を更に含むことを特徴とする請求項 1 3記載の核 酸ターゲッ トの調製方法。
1 6 . 上記第 2のリンカーに含まれるプロモータからの転写により蛍光標識 RNA 鎖を合成する工程を更に含むことを特徴とする請求項 1 3記載の核酸ターグ ットの調製方法。
1 7 . 生体試料由来のユニーク配列と、 他の核酸ターゲッ トと共通するリン カー配列とを含む核酸ターゲッ トを含む溶液を、 ハイプリダイズに寄与しない塩 基配列からなる非相補領域と、 ハイブリダィズに寄与する塩基配列からなり、 上 記ユニーク配列に特異的にハイブリダイズする選択領 及ぴ上記リンカー配列の 全部または一部に対して相補的な調節領域からなる相植領域とを含む核酸プロ一 ブを基板上に固定してなる核酸マイクロアレイに対して接触させる工程と、 上記核酸マイクロアレイの核酸プローブにハイブリダイズした核酸ターゲット を検出する工程とを含む遺伝子検出方法。
1 8 . 上記選択領域が n個の塩基からなり、 アデニン、 グァニン、 チミン及 ぴシトシンの全ての組合せに相当する 4n種類の選択領域を有することを特徴と する請求項 1 7記載の遺伝子検出方法。
1 9 . 上記核酸プローブは、 上記調節領域が上記選択領域を挟み込み、 上記 非相補領域が上記相補領域を挟み込むように構成されたことを特徴とする請求項 1 7記載の遺伝子検出方法。
2 0 . 上記複数の核酸プローブは全て同じ長さであることを特徴とする請求 項 1 7記載の遺伝子検出方法。
2 1 . 上記リンカ一配列は配列番号 1記載の塩基配歹 IJにおける 25〜32番目の 領域を除く塩基配列であることを特徴とする請求項 1 7記載の遺伝子検出方法。
PCT/JP2005/018222 2004-09-24 2005-09-26 核酸マイクロアレイ及び核酸プローブの設計方法並びに遺伝子検出方法 WO2006033484A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006536446A JPWO2006033484A1 (ja) 2004-09-24 2005-09-26 核酸マイクロアレイ及び核酸プローブの設計方法並びに遺伝子検出方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004278122 2004-09-24
JP2004-278122 2004-09-24

Publications (1)

Publication Number Publication Date
WO2006033484A1 true WO2006033484A1 (ja) 2006-03-30

Family

ID=36090217

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2005/018222 WO2006033484A1 (ja) 2004-09-24 2005-09-26 核酸マイクロアレイ及び核酸プローブの設計方法並びに遺伝子検出方法

Country Status (2)

Country Link
JP (1) JPWO2006033484A1 (ja)
WO (1) WO2006033484A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013147320A1 (ja) * 2012-03-29 2013-10-03 三菱レイヨン株式会社 βグロビン遺伝子の変異を検出するためのマイクロアレイ及びその検出方法
CN111748550A (zh) * 2019-03-29 2020-10-09 国立大学法人九州大学 核酸的标记方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000047767A1 (en) * 1999-02-11 2000-08-17 Astrazeneca Ab Oligonucleotide array and methods of use
JP2000342264A (ja) * 1999-06-02 2000-12-12 Hitachi Ltd ポリヌクレオチド検出チップ及びポリヌクレオチド検査装置
JP2003052385A (ja) * 2001-06-04 2003-02-25 Hitachi Ltd Dnaアレイ向けプローブ配列決定システム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000047767A1 (en) * 1999-02-11 2000-08-17 Astrazeneca Ab Oligonucleotide array and methods of use
JP2000342264A (ja) * 1999-06-02 2000-12-12 Hitachi Ltd ポリヌクレオチド検出チップ及びポリヌクレオチド検査装置
JP2003052385A (ja) * 2001-06-04 2003-02-25 Hitachi Ltd Dnaアレイ向けプローブ配列決定システム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ROTH ME ET AL: "Expression profiling using a hexamer-based universal microarray.", NAT BIOTECHNOL., vol. 22, no. 4, April 2004 (2004-04-01), pages 418 - 426, XP002994018 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013147320A1 (ja) * 2012-03-29 2013-10-03 三菱レイヨン株式会社 βグロビン遺伝子の変異を検出するためのマイクロアレイ及びその検出方法
CN111748550A (zh) * 2019-03-29 2020-10-09 国立大学法人九州大学 核酸的标记方法
CN111748550B (zh) * 2019-03-29 2023-11-24 国立大学法人九州大学 核酸的标记方法

Also Published As

Publication number Publication date
JPWO2006033484A1 (ja) 2008-05-15

Similar Documents

Publication Publication Date Title
CN111032881B (zh) 核酸的精确和大规模平行定量
EP3177740B1 (en) Digital measurements from targeted sequencing
US9388459B2 (en) Methods for genotyping
US6821724B1 (en) Methods of genetic analysis using nucleic acid arrays
US6268147B1 (en) Nucleic acid analysis using sequence-targeted tandem hybridization
US20070287151A1 (en) Methods and Means for Nucleic Acid Sequencing
CN1489632A (zh) 固相支持物上的核酸等温扩增
EP1645640A2 (en) Methods for amplifying and analyzing nucleic acids
KR20020008195A (ko) 폴리뉴클레오티드 서열 변형의 미세배열-기초 분석
KR20160096633A (ko) 핵산 프로브 및 게놈 단편을 검출하는 방법
US20020127575A1 (en) Partially double-stranded nucleic acids, methods of making, and use thereof
WO2007106509A2 (en) Methods and means for nucleic acid sequencing
WO2000026412A1 (en) Nucleic acid analysis using sequence-targeted tandem hybridization
CN102046811A (zh) 捕获核酸的方法和测定
US20020012913A1 (en) Nucleic acid analysis using complete n-mer arrays
US10174352B2 (en) Methods for amplification of nucleic acids on solid support
US6692915B1 (en) Sequencing a polynucleotide on a generic chip
JP5663491B2 (ja) 標的核酸の検出方法
US20070254284A1 (en) A nucleic acid detection method
EP1164201A1 (en) Reverse detection for identification and/or quantification of nucleotide target sequences on biochips
WO2006033484A1 (ja) 核酸マイクロアレイ及び核酸プローブの設計方法並びに遺伝子検出方法
WO2001049886A2 (en) Method of analyzing a nucleic acid
US20050095606A1 (en) Partially double-stranded nucleic acids, methods of making, and use thereof
US20100297622A1 (en) Method for high-throughput gene expression profile analysis
JP2002532070A (ja) 核酸配列を解析するためのアレイおよび方法

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KM KP KR KZ LC LK LR LS LT LU LV LY MA MD MG MK MN MW MX MZ NA NG NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SM SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LT LU LV MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
DPE1 Request for preliminary examination filed after expiration of 19th month from priority date (pct application filed from 20040101)
WWE Wipo information: entry into national phase

Ref document number: 2006536446

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase