WO2004092376A1 - Method of designing normally orthogonalized sequences, method of producing nucleic acids being normally orthogonalized sequences and nucleic acids obtained thereby - Google Patents

Method of designing normally orthogonalized sequences, method of producing nucleic acids being normally orthogonalized sequences and nucleic acids obtained thereby Download PDF

Info

Publication number
WO2004092376A1
WO2004092376A1 PCT/JP2004/005219 JP2004005219W WO2004092376A1 WO 2004092376 A1 WO2004092376 A1 WO 2004092376A1 JP 2004005219 W JP2004005219 W JP 2004005219W WO 2004092376 A1 WO2004092376 A1 WO 2004092376A1
Authority
WO
WIPO (PCT)
Prior art keywords
sequence
sequences
group
random
orthonormalized
Prior art date
Application number
PCT/JP2004/005219
Other languages
French (fr)
Japanese (ja)
Inventor
Masanobu Kiyohara
Nobuhiko Morimoto
Original Assignee
Olympus Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympus Corporation filed Critical Olympus Corporation
Priority to JP2005505396A priority Critical patent/JPWO2004092376A1/en
Publication of WO2004092376A1 publication Critical patent/WO2004092376A1/en

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA

Definitions

  • the present invention relates to a method for designing an orthonormalized sequence group, a method for producing a nucleic acid group which is an orthonormalized sequence, and a nucleic acid obtained by the method.
  • Nucleic acid sequence design techniques can be broadly divided into two categories. One is a design method in which the sequence of the genomic DNA or mRNA is targeted and the optimal sequence for detection is selected from the targets. The other is to design an artificial sequence with uniform thermal properties, which was conceived in the study of DNA combining (see, for example, Japanese Patent Application Laid-Open Publication No. 2001-151561).
  • the former is a technique for designing a nucleic acid used to detect a specific gene such as genomic mRNA, and is limited to sequences that hybridize to the specific gene of interest.
  • the design is done. Under such restrictions, for example, primers for PCR have similar melting temperatures (Tm values) and are complementary to each other by a distance of about several hundred bases that can be identified by electrophoresis.
  • Non-target sequences are selected.
  • Patents such as US Pat. No. 5,556,749, Patent No. 3,055,942, Japanese Patent Laid-Open No. 2000-258,568 and Japanese Patent Publication No. 0 0 1 — 2 5 8 5 7 6, USP 6 2 5 1 5 8 8, WO 0/4 6 3 6 3.
  • WO 0 Z 4 6 3 6 3 In order to improve the gene specificity as well as the specificity, the specificity is evaluated using the tuple information of other known genes of the target organism, and the Hamming distance is examined to determine whether or not there is a reaction with mismatch. I'm sure.
  • the latter artificial sequence design technology is not intended for gene detection, so there is freedom in sequence design, but it is necessary to design many types of sequences.
  • Ad 1 e ma n solves the Hamiltonian path by
  • the gene detection technology aims to detect without errors while observing the restriction of hybridizing to the sequence of the child.
  • SNP sensing1eNuc1eotidePo1ymorPhism
  • SNPs are said to exist at a ratio of one in hundreds of bases of a human gene. However, if the number required for detection is all performed in separate reaction solutions, the cost cannot be justified.
  • the tag sequence of the marker is attached to the IB.
  • Gene protein, and a sequence complementary to the tag sequence is fixed in the microarray to achieve general-purpose detection.
  • Microphone array called Sanole chip J GenFlex TM Tag Array power SA ffyetri
  • a human sequence called a tag or zip code is added to the end of the gene-specific probe sequence, and after detecting the gene on the probe side, the artificial sequence is amplified with a common primer. Quantitative detection is carried out depending on the width. ⁇ cL>, although the purpose is different, Lvnx ⁇ ⁇
  • 1 herap eutics offers a cloning system called Megaclone. In this method, different tag arrays are provided for each bead, so that closing can be performed more efficiently. .
  • the HeraPeutics uses a sequence base set of 3 to 6 bases that is unlikely to cause chromosomal hybridization. Then, a tag sequence of about 24 bases is generated and combined according to the combination.
  • the length of the nucleic acid is
  • there is a disadvantage that the number is limited to an integral multiple of the basic array on which the base is based. In other words, those methods could not generate a sequence group having useful thermochemical properties while having a prime length such as a 23 mer or a 29 mer.
  • EP 799 897 a sequence generated according to a standard, such as having at least 8 bases and having the same sequence without limitation in length, is added to the set. Suggest a way.
  • An object of the present invention is to provide a method for producing a nucleic acid group which is an orthonormalized sequence, a method for producing a nucleic acid group which is an orthonormalized sequence, and a nucleic acid obtained by the method.
  • such a sequence group and such a nucleic acid group have substantially the same melting temperature of their respective base sequences or nucleic acids, and are close to each other.
  • O The next structure is not stable o
  • the present invention provides the following methods as means for achieving the above-mentioned objectives.
  • this is a method for designing a group of normal 3 ⁇ 4-crossover sequences.
  • a plurality of base sequences are generated, and the average value of their melting temperatures is determined.
  • obtaining a candidate sequence based on a threshold limited by ⁇ t ° C of the average value, and orthonormalized sequences from candidate sequences obtained based on whether or not the sequence reacts independently
  • a method for designing a group of normal crossing sequences comprising obtaining a group is provided ⁇ 0
  • FIG. 1 is a block diagram illustrating one example of a digital computer that may be used in accordance with embodiments of the present invention.
  • FIG. 2 is a flowchart illustrating an example of the method according to one embodiment of the present invention.
  • FIG. 3 is a flowchart showing an example of a design method according to one embodiment of the present invention.
  • FIG. 4 is a flowchart showing one example of a design method according to one embodiment of the present invention.
  • FIG. 5 is a flowchart showing one example of a design method in one mode of the present invention.
  • FIG. 6 is a flowchart showing a part of a design method according to one embodiment of the present invention.
  • FIG. 7 is a flowchart showing a part of the design method according to one embodiment of the present invention.
  • FIG. 8 is a diagram illustrating an example of a method for examining self-complementarity.
  • FIG. 11 is a diagram showing an example of a method for confirming the existence of a mouth snow hydration.
  • Fig. 12 is a diagram showing an example of a method for confirming the presence of mouth hybridization.
  • FIG. 13 is a diagram showing a further example of a method for producing a candidate sequence.
  • Figure 14 shows the orthonormalized array list (1).
  • Figure 15 is a continuation of the list of orthonormal arrays (2); (1).
  • FIG. 16 is a continuation of the list of orthonormal arrays ( 3 ); (2).
  • Figure 17 is a continuation of the list of orthonormalized arrays (4); ( 3 ).
  • 18 is the continuation of the list of orthonormalized arrays (5); (4).
  • Figure 1 9 is list of orthonormal sequences (6); Ru Following 5 because of (5).
  • Figure 20 is a continuation of the list of orthonormalized arrays (7); ( 6 ).
  • Figure 21 is a continuation of the list of orthonormalized arrays ( 8 ); ( 7 ).
  • Figure 22 shows a normal array for verification using a microarray.
  • Figure 23 shows an orthonormal array for verification using a microarray.
  • Figure 24 shows an orthonormalized array for verification using a microarray.
  • Figure 25 shows an orthonormalized array for verification using a microarray.
  • Figure 26 shows an orthonormal array for verification using a microarray.
  • Figure 27 shows an orthonormal array for verification using a microarray.
  • FIG. 28 is a graph showing the result of the batch 1 in Example 2.
  • FIG. 29 is a graph showing the result of verification on batch 2 in Example 2.
  • FIG. 30 is a graph showing the verification result of the batch 3 in the second embodiment.
  • FIG. 31 is a graph showing the verification result of batch 4 in Example 2.
  • Figure 32 shows the verification results for batch 5 in Example 2.
  • FIG. 33 is a graph showing the verification result of the switch 6 in the second embodiment.
  • FIG. 34 is a graph showing the result of the verification of the knockout 7 in the second embodiment.
  • FIG. 35 is a graph showing the results of verification on the knockout 8 in the second embodiment.
  • FIG. 36 is a graph showing the verification result of -yh 9 in the second embodiment.
  • FIG. 37 is a graph showing the result of verification on Bakuchi 10 in Example 2.
  • FIG. 38 is a graph showing the verification result of the knock 11 in the second embodiment.
  • FIG. 39 is a graph showing the results of verification of the first embodiment according to the second embodiment.
  • FIG. 40 is a graph showing the verification results of the notch 13 in Example 2.
  • FIG. 41 is a graph showing the result of verification of the backlash 14 in the second embodiment.
  • the term "normal” in “orthogonal array” refers to maintaining the normality of thermal properties in multiple arrays, i.e., having a uniform melting temperature within a certain range. And. By maintaining the normality of thermal properties, for example, many distributions It is advantageous to carry out the reaction using the rows together.
  • orthogonalization in “orthogonalized array” is to make an array orthogonal, and all sequences included in one orthogonalized array group react independently. That is, the sequences included in one orthonormalized sequence group hardly or do not cause a reaction between ⁇ sequences other than the desired combination and the self sequence ⁇ . In other words, the sequences included in a group of orthogonalized sequences are less likely to cause cross-hybridization between sequences and undesired hybridization within their own sequences than ever before. Or not.
  • nucleic acid J can be any nucleic acid or nucleic acid analog represented by a base sequence.
  • nucleic acids include, for example, DNA, RNA, and peptide nucleic acids. is there.
  • base sequence J and “sequence” both refer to the arrangement of bases that make up a particular nucleic acid. Therefore, in this specification, "designing" a sequence J means that it is not always necessary to actually synthesize a nucleic acid having such a sequence. This is to create a sequence using a means and give a target sequence group. For example, given
  • the group of arrangements provided can be provided in the form of output on paper or a display, or can be provided in the form recorded on a medium. Such a sequence is also provided as an actually synthesized nucleic acid reflected in the nucleic acid.
  • base sequence is also provided as an actually synthesized nucleic acid reflected in the nucleic acid.
  • Sequence may be used interchangeably.
  • nucleic acid is based on the designed sequence. Indicates that a nucleic acid or nucleic acid analog containing a particular sequence is actually synthesized.
  • a method for designing an orthonormal sequence or a group of orthonormal sequences in which all the base sequences contained therein are orthonormal is as follows. First, a random array consisting of random arrays is created as a crude array that has not been selected by any of the finalizers. A random array is prepared in a quantity suitable for obtaining the average value, and the average value of these melting temperatures (hereinafter referred to as Tm m) is obtained. Next, the threshold value and the Tm value of the coarse array and z or a random array that is a newly generated coarse array are compared. The temperature range corresponding to the average value of the Tm soil 1 ⁇ is defined as the threshold.
  • a crude sequence having a Tm value falling within a certain range limited by a threshold is selected to obtain a group of candidate nucleotide sequences.
  • the average value of Tm “Temperature range 3 ⁇ 4J corresponding to 1 ⁇ of soil” is as described below.o
  • the Tm distribution shows almost normal distribution, and the conversion to standard normal distribution is performed. It is desirable to set the temperature range having a width corresponding to one to the Tm range after this operation, so that about one-third of the whole clears the T condition. Is possible 5. For example, in the case of 25 mer, approximately
  • each sequence included in the candidate nucleotide sequence group is The orthogonalization is performed by examining whether these are sequences that react independently. This can be done by analyzing the properties and / or structure of each nucleotide sequence included in the candidate nucleotide sequence group. By analyzing the properties and / or structure, the reaction within one sequence or between the sequences in a group is low, or the sequence consists of only those sequences that are not reactive. In this way, select the sequences contained in the target nucleotide sequence group '.
  • an orthonormalized array group is obtained.
  • an orthonormalization comprising a plurality of sequences that are orthonormalized to each other without actually synthesizing a nucleic acid. It is possible to design Also, according to such a method according to the present invention, it is possible to design an orthonormalized array group including more arrays in a short time.
  • embodiments of the present invention will be further described.
  • a means for randomly generating a base sequence is an example.
  • X. may use a well-known random number function, a random number table, a random number generator, and the like.
  • a random number for example, a base is made to correspond to a numerical value in advance, and a random number function, a random number table, or a numerical value generated by a random number generator may be replaced with a base.
  • random numbers may be generated by integers, decimal numbers, binary numbers, octal numbers, hexadecimal numbers, or the like. It may depend on how the random number function is called on the program. For example, a more efficient method is to generate a random number with two binary digits (0, 1, 2, 3),
  • the calculation of the Tm value for each generation of a random array is repeatedly performed, and after the generation of the random array, an average value is calculated based on all the obtained T values. After the generation of all random arrays, the Tm values of those arrays may be calculated and the average value may be calculated.
  • One method is to calculate the Tm value each time a random array is generated, and to calculate a new value. The average value for each generation of the random array may be obtained, and the average value may be used when the average value converges sufficiently.
  • a plurality of salt sequences created in this way at i 4 are thus referred to as a first coarse sequence group for convenience.
  • the method of determining the Tm value of each sequence included in the first crude sequence group may be based on the length of the GC or salt sequence included in the base sequence, or may be determined empirically or empirically. Alternatively, the Tm value may be determined by using the Nearest Neighbor method known per se, or 3 ⁇ 4. An experiment in which the Tm value of the nucleic acid represented by the base sequence was measured, The Tm value of the base sequence to be used as an S may be obtained based on data and / or empirical rules.
  • the lengths of the base sequences contained in the first crude sequence group are all the same, but they do not necessarily have to be the same length ⁇ and also differ within the range specified by the practitioner in advance
  • the length of the salt sequence created at random may be determined according to the purpose of use, even if the practitioner chooses it at will.
  • the first crude sequence was determined from the T value of each base sequence obtained. Calculate the mean of the group Tm.
  • the number of sequences included in the first crude sequence group for obtaining the average value, that is, the size of the first crude sequence group is, for example, about 100 or more.
  • the average value converges as the size of the coarse array group increases. However, a larger size requires more calculation time. For example, when an average value is calculated for 100 pieces, if the generated array is sufficiently random, the value will be a value very close to the value that converges. Therefore, considering the calculation accuracy of T m (that is, about one decimal place), an average of 100: ⁇ : is sufficient, and 1 0
  • the average value of the Tm is set as a median value, and a region having a temperature width corresponding to the one before and after the median value is set as a threshold value, and a certain range is set.
  • a candidate sequence group consisting of sequences having a Tm value included in a range limited by the temperature range corresponding to the average value ⁇ 1 ⁇ is obtained.
  • the Tm value of the randomly generated base sequence included in the crude sequence group is compared with the threshold, and the sequence that falls within the temperature range corresponding to the average value of 1 ⁇ is determined. Just select it.
  • a group may be formed by excluding sequences that do not fall within the temperature range corresponding to the average value ⁇ 1 unit.
  • the crude sequence group used to obtain the candidate sequence group is T m
  • the first coarse array group may be the first coarse array group used to calculate the average value, or may be the second coarse array group consisting of a part of the first coarse array group, or the first coarse array group.
  • Sequence group ⁇ C even if it is the second crude sequence group to which additional sequences created by
  • ⁇ A second group of crude sequences consisting of newly randomly generated sequences may be used.
  • the term “coarse sequence group” was used to indicate a plurality of coarse sequences, but the sequence used to obtain the candidate sequence group was designed without substantial groups. May be used.
  • the ⁇ m value may be calculated simultaneously with the production.
  • the obtained Tm value may be compared with a threshold value.
  • the lengths of the base sequences included in the second crude sequence group are preferably equal, but not necessarily equal.
  • the length of the base sequence created for the procedure may vary depending on the purpose of use, even if the practitioner chooses it at will. The length may be determined in advance.
  • each of the base sequences included in the candidate sequence is a sequence that reacts independently, and a target normal orthogonal sequence group is obtained.
  • the following (A) is used.
  • the existence of the self-complementary sequence in each sequence can be confirmed for each of the sequences contained in the target sequence group based on the base sequence. And means that there is more than one set of mutually complementary parts in one sequence.
  • the base used as a reference for determining that the sequence is a self-complementary sequence may be arbitrarily determined by the practitioner. For example, it may be determined that a self-complementary sequence is present when a complementary portion having a length of 2 bases or more is present in one base sequence, or it is possible to determine that a self-complementary sequence is present. Bases or more ⁇ 5 bases or more,, 6 bases or more, or X or more consecutive bases and a complementary base sequence included therein may be judged to have a self-complementary sequence. In the expression, “XJ is an integer of 2 or more. The number of bases may be selected depending on the use.
  • the base length for determining the presence of cross-noid hybridization may be determined by the practitioner in the same manner as the self-complementary sequence.
  • the degree of stability of the secondary structure of each sequence can be determined, for example, by empirical or empirical data on what secondary structure it can take when each sequence is present as a nucleic acid. It is possible to determine the degree of height based on it. For example, the degree of stability of the secondary structure of each sequence is calculated using a method known per se, such as intramolecular secondary structure; By comparing with a predetermined threshold value, the degree of stability may be determined.
  • the above three items namely (A), (B) and (C)
  • the analysis can be performed on all three items in any order.
  • any of (A) or (B) and (C) may be combined in any order.
  • (A;), (B) and (c) are all performed in the order of (A), (C) and (B) in consideration of efficiency, and (a), (c) and (b) It is preferable to exclude from the candidate sequence group when any of the above results is satisfied.
  • the sequence included in the candidate sequence group is a relatively short sequence, for example, if the sequence is 40 m er to 30 m er or less,
  • a sequence contained in one J candidate sequence group is a relatively long sequence mA.For example, when the sequence is 30 mer or more than 40 mer.
  • the complementary strand is also (A) as described above.
  • the frequency distribution of the average value of the Tm of the base sequences generated in the ⁇ and ⁇ follows the normal distribution, and the number of candidate sequences that can be found within a certain remark range is the average temperature at the center of the range.
  • We set the Tm value to artificially set the most fe when hitting the target, and randomly created it according to the present invention rather than HX-measuring multiple nucleic acids to approach it. Calculating the average temperature for the sequence will yield more, ie, the largest, set of target sequences.
  • the population (ie, the coarsely distributed group) and the candidate sequence group obtained as the / ⁇ result are ⁇ conventional It is possible to obtain a group with more candidates than means, in other words, a larger group
  • the population is narrowed down based on whether or not it is included in the range based on the threshold value of the temperature range corresponding to the average melting temperature of soil 1 ⁇ .
  • the threshold value of the temperature range corresponding to the average melting temperature of soil 1 ⁇ it is possible to narrow down the candidates very efficiently at first. That is, first, an array is selected in the value calculation with less ⁇ . ⁇ Calculate the characteristics of the noise elimination function ⁇ Since the secondary structure calculation is performed, unnecessary calculations are not performed.
  • the method for designing a group of orthonormalized arrays according to the present invention may be executed on a computer.
  • the method of counting orthonormalized arrays using a digital computer is
  • the arithmetic means calculates the average of the melting temperatures of the plurality of random arrays, and sets the threshold value.
  • the comparing means sets the average value in (1).
  • the threshold value is compared with the melting temperature of the random sequence. Only the sequence is selected, thereby detecting
  • the determination means determines whether or not each of the base sequences included in the candidate sequence group given in (3) is a sequence that independently reacts. ⁇ The sequence that is determined not to react independently from the target group is excluded from the candidate sequence group and an orthonormalized sequence group is formed. ⁇
  • a method for designing an orthonormalized sequence group using a digital computer includes the steps of (1) that a random sequence is provided by means for randomly generating a base sequence; The melting temperature of the random sequence given by is given by the arithmetic means, and the melting temperature is stored in the storage means.
  • An average value of the melting temperatures is given by a calculating means based on a plurality of melting temperatures given by repeating the above (1) and (2); (4) The calculating means gives a threshold based on the average value of the melting temperatures given by the above (3), and the comparing means gives a threshold. Comparing the threshold temperature with the melting temperature of the random sequence provided by the base sequence random generation means, and (5)
  • the judgment means (A) to (C) below make a judgment in (A) that the sequence has a white self-complementary sequence. And (B) the degree of stability of the primary structure, and (C) whether or not the sequence has a knosipip V dimension; (7) 6) BX measurement of the orthonormalized array group by selecting the sequence to be selected by the selecting unit as the result of the determination in 6) and selecting BX.
  • the orthonormalized array group that has been sifted may be output by output means such as a printer and a display for displaying the array, and may be recorded on a removable medium. May be provided.
  • the digital m-computer 1 which can be used in accordance with the present invention has at least a processing unit 2 such as a CPU, a program and a table, and an aid for recording information such as a processing result. It has a storage device 3, a keyboard for inputting information in parallel and an input unit 4 such as a mouse, and an output unit 5 for outputting information to the outside, which are connected to each other. Any general data known per se W
  • the auxiliary storage device 3 includes a program for causing the digital computer to execute a method for designing a normal orthogonal array, for example, a program for generating a random array, and an independent program.
  • G a program to recognize the force, for example, confirm the existence of a self-complementary sequence
  • the program for P ' the program for confirming the existence of cross-noisy hybridization, and the calculation of the intramolecular secondary structure free energy Stores programs for judging the level of the enolen regi.
  • the auxiliary storage device 3 includes a table for associating a random number with a base, and a table for associating a numerical value with a determination result in order to determine whether or not the sequence reacts independently. For example, information as desired may be stored.
  • the auxiliary storage device 3 of the digital computer includes, for example,
  • a program for calculating the average value of Tm. A program for creating random sequences, a table for associating random numbers with bases, a program for detecting the judgment of self-complementary sequences, and mouth shaving.
  • a program for judging the presence of redidation, a program for judging the degree of stability of the secondary structure in the molecule, etc. may be stored for each desired file. .
  • the above-described processing by the arithmetic means, the comparison means, the selection means, the description means and the determination means, and the base sequence random creation means is executed by the processing unit 2 in the form of a program previously stored in the trapping memory 3 O may be based on sensitive information
  • the digital computer may store the information (Random acces memory) for temporarily storing the image data.
  • the image processing unit further includes an image processing unit that generates an image data according to the instruction of the CPU based on a program or the like. You may do it.
  • An input to the input unit 15 of the operator gives an instruction to start the design to the device. At this time, the operator may input information on reaction conditions. These pieces of information may be stored in the auxiliary recording device 3 or the RAM.
  • the processing unit 2 executes a program for creating a random array stored in advance in the dp- Instructs the base sequence random generation means to generate a random sequence. Further, the processing unit 2 provides the arithmetic means with a preset auxiliary storage device.
  • the average value of ⁇ m is calculated, and a threshold is given based on the calculated value. Or instruct it to store in RAM
  • the processing unit 2 sets a preset and auxiliary device 3 in the auxiliary device 3.In accordance with the stored program and program for creating a random array, For the random array generation means, a laser having a range of Tm limited by the threshold given by 2b Instructs to select random sequences. The random array selected according to the conditions is temporarily stored in the RAM as a weather array.
  • the CPU 3 follows a program for ascertaining the existence of the self-trapping sequence stored in the pre-set and assisted B-fe device 3 according to a preset program. In order to judge the existence of the self-complementary sequence in the generated 'random sequence', it is not necessary to judge.
  • the random sequence having no self-complementary sequence is used as a candidate sequence.It is once assisted and stored in device 3 or RAM.2c and 2d are used until a sufficient number of random sequences or prospective sequences are obtained. 'Executed repeatedly
  • the processing unit 2 then proceeds to the cross-noise pre-daily processing set in advance and stored in the auxiliary storage device 3. According to the program for confirming the existence of the
  • the processing unit 2 performs a calculation of the intramolecular second-order free energy, which is set in advance and is considered by the auxiliary device 3, and follows a program for judging the level of the enenoregi. Therefore, for the judgment means, it was stored in the
  • the intramolecular secondary structure free energy to the target array was calculated. In addition, it is not necessary to judge the height according to a table which is set and assisted in advance and correlates the energy stored in the 'I'Ws device 3 with its height. The low random sequence of secondary structure free energy is selected and assisted as a candidate sequence.
  • the finally selected and remaining candidate sequences are orthonormalized array group ⁇ , ie, instruct to output a set of orthonormalized arrays from the desired output means.
  • the orthonormalized array group is output from the output means, and the method ends.
  • information on the reaction conditions input by the operator in ⁇ 2a is based on the length of the random sequence, the number of random sequences, the number of candidate sequences, the type of nucleic acid, and the existence of self-complementary sequences. Criteria for judging, criterion for judging the presence of cinnamon..Criteria for judging the presence of sine, and for judging the level of 4 and / or 7 or the intramolecular primary structure Information such as criteria may be ⁇ or information such as other conditions. Alternatively, this information may not be entered by the operator at 2a, but may be included in various programs pre-recorded in the auxiliary storage device 3, or may be any number. The conditions associated with the conditions so that selection can be made by combining these conditions.
  • Procedures may be performed as shown in the example of FIG. That is, the design is started (3a), after calculating the average value of Tm (3b), a random sequence is generated (3c), and the self-complementary sequence is eliminated (3d).
  • the above 3a to 3e are performed by the processing procedure shown in Fig. 2 and described above, and a set of orthonormal arrays is given without considering the molecular-secondary structure free energy ( 3 f)., End (3 g).
  • a set of orthonormal arrays is given without considering the molecular-secondary structure free energy ( 3 f)., End (3 g).
  • Such a method is particularly useful when the sequence of the orthonormal array to be obtained is short, and the design time can be shortened.
  • the procedure may be as shown in the example in FIG. That is, the design is started (4a), the average value of Tm is calculated (4b), the random sequence is generated (4c), and the self-complementary sequence is not excluded. Then, we check the cross-noid predication (4d), and then examine the free energy of the molecular-secondary structure (4e), and give a set of orthonormal arrays. (4 f) or end (4 g). Each processing may be performed in the same manner as the processing described above.
  • GC% final letter is the GC number included in the random sequence. % Is in a range, for example, 4
  • a random number is generated to obtain a random array
  • a candidate sequence is obtained by screening by value and an orthonormalized sequence is obtained by performing further screening on the candidate sequence
  • the correspondence between the number obtained by random numbers and bases is one-to-one. Even if it is 1, after all the desired selections have been completed, the values may be replaced with bases to obtain an orthonormalized sequence in the end, i.e., Once you have decided which value corresponds to which base, you may substitute the base at any stage. However, since the ⁇ m value and dG value make sense for the base sequence, it is important to consider that a correspondence is always required.
  • the above method shows an example of how many powers according to one embodiment of the present invention.Therefore, the method according to the present invention may be variously modified to the above-described example. Additional procedures may be added or omitted as long as it follows the invention
  • one orthonormalized sequence group may be used.
  • Let us express the calculation summary (for example, city in the case of the ⁇ ⁇ ⁇ ⁇ ⁇ ⁇ ⁇ ⁇ ⁇ ⁇ ⁇ ⁇ ⁇ ⁇ ⁇ ⁇ ⁇ ⁇ ⁇ ⁇ ⁇ ) and use them to calculate and react.
  • the nucleic acid consisting of the orthonormalized sequence itself is separated by affinity separation with the nucleic acid of the complementary sequence immobilized on a magnetic bead, or the nucleic acid white consisting of the orthonormalized sequence is converted to a PC.
  • nucleic acids corresponding to computational elements for example,
  • the length of the DNA is between 15 m er and 30 m er suitable for the primer.
  • the T m value not only the T m value but also the array of the calculation source is output, and it may be used as an auxiliary for the calculation of the T m value later. Approximately 1 000 pieces are calculated in total, and the average value is calculated. If candidates are generated with the Tm value limited around this average value, most candidate sequences can be generated '.
  • the threshold value is set to the Tm value determined in (1) above to obtain a random candidate sequence having a Tm value within the range.For example, generating a random number and substituting it with a base A random sequence, which is a coarser sequence, is created, its Tm value is calculated and compared with a threshold, and a sequence having a melting temperature within the range of the threshold is selected to form a group as a candidate sequence.
  • the Tm value is determined by the relationship between adjacent bases, or the Tm value can be calculated approximately from the GC content.
  • a random sequence is generated while restricting the GC content to be within a range of 40% to 70%, and the Tm value is calculated for the generated random sequence by, for example, the Nearest Neighbor method. May be calculated. Furthermore, the calculated Tm value is compared with the threshold value, and as a result, those that fall within a predetermined range are output as a horizontal array. Also, for example, in order to generate a random sequence, a self-known Mersenne Twister is used.
  • Candidate sequences with Tm values within a certain range are self-complementary, eg, palindomic sequences such as restriction enzyme recognition sequences (generally also called palindromes). If you have Take the structure. Since the band and the ⁇ ⁇ array can be easily obtained, they are preferably used for checking self-complementarity. A sequence that includes a mixed-mouth mix sequence is included in the candidate sequence group.
  • the means for further confirming self-trapping will be described below. For example, if the number of bases in the sequence is odd, compare the sequence from the base at the 5 'end of the nucleic acid sequence to the center base and the sequence from the base to the 3' end base of the nucleic acid sequence. If the sequences are complementary, immediately, if they match, they are determined to have self-capture.
  • a partial sequence B from the 14th base to the 3 ' If this partial-sequence A is read while shifting one base by six bases, six kinds of such bases with 25 bases are obtained.
  • One unit read contains six bases, which will be referred to as six tuples.
  • the sequence of> __ is shifted by one base at a time.
  • the random array is judged to be a self-trapping array.
  • the length of the tuple of>- is limited to 6 tuples. Not. In other words, this value may be changed depending on what criteria determine that self-trap is determined.
  • self-complementarity was determined based on whether there was a sequence that matched six consecutive bases.
  • the present invention is not limited to this condition, and the number of bases other than 6 bases, for example, 3 or
  • the determination may be made based on whether there is a continuous match of 4, 5, 7, 8, 9 or 10 or more consecutive bases.
  • the threshold value may be another condition, for example, the ratio of the complementary base to the length of the sequence to be compared. In other words, it is sufficient to set a certain condition in advance and use it as a threshold to eliminate auto-adoptive sequences.
  • Figure 9 shows the second example. First, as described above, one array
  • subarrays A and B Divide into two parts, subarrays A and B. This is controlled by shifting from the end to the center, and self-complementarity is determined by the number of consecutive complementary sequences, the number of complementary sequences, or the degree of complementarity. It may be a public notice.
  • FIG. 10 shows a third method.
  • one sequence is divided into partial sequences A and B, and the partial sequence B is converted into a complementary sequence. This is shifted one base at a time in the same manner as in the second method, and self-complementarity is determined based on the number of consecutive homologous sequences or the number of homologous sequences, or the degree of homology. What is necessary is just to judge.
  • Such a third method is similar to the first and second methods described above, except that the partial sequence A Check the complementarity of the salt.
  • the resulting sequence is randomly generated, the ⁇ T m value is aligned within a certain range, and the intramolecular structure is Next, further calculations were performed to form a set of sequences with low cross-disturbance among multiple sequences.
  • phase capture is also used in a reaction to be performed using an orthonormalized array obtained by the design method of the present invention in the future.
  • Figure 11 shows an example of the Pit method.
  • sequences P and Q of 25 bases are shown respectively.o
  • there is no gusset with more than 6 bases. Start with 6 bases ( Figure 11a) and compare the overlaps of 7 bases ( Figure 11b).
  • compare the overlaps of 8 bases (Fig. 11c). 0
  • the two sequences are shifted by one base at a time, and the length of the overlapped part is increased to increase all 25 bases.
  • the comparison is performed until the overlaps. After that, while performing the comparison, further shift in the same direction (Fig. 11d, Fig. 11e), and P
  • Eight bases are in an overlapping state, and both of them are two consecutive bases.
  • the overlapping portion is shifted in order, and among all the control states, there is one cross-hybridization condition that satisfies the above condition (i) and / or (ii). Then the random array at that time is removed from the surveillance array.
  • FIG. 12 shows an example of verifying the presence of cross-hybridization between two types of sequence R and sequence S and their four complementary sequences IJ.
  • sequence R of the sequence R is indicated by a line above the letter “RJ”
  • phase trap of the sequence S is indicated by a line above the letter “S”.
  • complementary strand of the sequence R is referred to as “R ,,” ⁇ the complementary strand of the sequence S.
  • the complementary strand may be verified at the time of
  • the verification of the hybridization may be performed for all sequences on a general basis.
  • the conditions for determining the presence of the crossover force S used in the method according to the embodiment of the present invention are not limited to the above-described example.
  • the case where one of (i) and (ii) is satisfied is determined to be the presence of the cross-noisy hybridization force s, but both (i) and (11) If there is a crossover noise You may decide.
  • 6 or more bases of (i) are replaced by 2, 3,
  • condition (ii) is not defined as 60% of the reference sequence, i.e., the sequence having overlaps, but the overlap is more than 10 bases.
  • the criterion may be changed according to the overlap length to be compared, for example, 60%, and when the number of bases is 10 or less, the total is 6 bases.
  • the ratio may be set by dividing the set ratio by the absolute number of bases to be matched.
  • a more precise cross-hyperidization may be verified by taking into account a complicated structure such as a bulge loop by a dynamic programming method.
  • a new random sequence may be randomly generated and added to the candidate sequence group during any of the steps included in the method and between the steps. .
  • verification of the existence of cross-hybridization can be performed, for example, by comparing a new random array with an array in the set of orthonormalized arrays and comparing the new random array to the cross-array.
  • nucleic acid having an orthonormal sequence obtained according to the present invention is used alone as a primer or a hybridization probe. Therefore, if such a nucleic acid is a nucleic acid that easily has an intramolecular structure, the reactivity becomes low, and the PCR amplification efficiency / hybridization efficiency deteriorates. The reaction efficiency increases as the free energy of the secondary structure increases. Therefore, the calculation of the free energy of the secondary structure can be used to select orthonormal arrays.
  • this calculation includes the dynamic programming method of Zucker et al., “Algorithms and Termodynamics for RNA Secondary Structure Prediction: A Practical GudeJ, RNA Biochemistry and Biotechnology, 11-43, J. Barciszewski & BFCClark, eds., NATO ASI Series, Kluwer Academic Publishers, (1999) ”). Also, if an appropriate threshold is given, it is possible to select arrays at this stage. However, this step can be difficult to perform due to the large amount of computation. In addition, it may be difficult to obtain a stable structure because the orthonormalized array itself is short. In such cases, the calculation of the free energy of the secondary structure may be omitted.
  • Additional candidate sequences may be generated at the end of each mouth hybridization check for a single sequence.
  • the orthonormalized sequence as described above may be used as a relatively long nucleic acid fragment by combining and linking a plurality of sequences at the time of use.
  • the orthonormalized sequence as described above may be used as a relatively long nucleic acid fragment by combining and linking a plurality of sequences at the time of use.
  • ⁇ 3 c, ⁇ a tone is preferable o If the concatenation of the sequences does not occur in any two sequences, do not use the combination that causes the open-sound V-dimension If the connection occurs in any two arrays, it is possible to use a lot of orthonormal arrays. Omit the regular H-association sequence o
  • a base sequence group designed by the method according to the present invention as described above and a nucleic acid synthesized based on the sequence.
  • the group of orthonormalized arrays provided by the method according to the embodiment of the present invention may be provided in a form output on paper or a display, or may be provided in a form provided on a medium. Such an arrangement may also be reflected in the nucleic acid.
  • the nucleic acid having such a sequence is chemically synthesized by a nucleic acid synthesizer or the like, or synthesized by other means for synthesizing a nucleic acid known per se.
  • the type of nucleic acid having such a sequence to be synthesized may be selected as desired by the practitioner.
  • the nucleic acid provided according to the embodiment of the present invention may be a nucleic acid represented by a sequence included in the orthonormalized sequence group provided according to the present invention. When used, it is sometimes necessary to use a combination of multiple types of sequences included in the same orthonormal sequence group in one reaction system.o
  • examples of the orthonormalized array group provided in accordance with a further embodiment of the present invention include 112 types of SEQ ID NO: 264 to SEQ ID NO: 375. Each of these arrays also has an orthonormalized array relationship with each other. Therefore, all of them may be used at once, or any one of them may be used. '
  • SEQ ID NO: 1 to SEQ ID NO: 375 may be provided as nucleic acids represented by the sequence, and those nucleic acids are also included in the scope of the present invention. .
  • a nucleic acid detection nucleic acid used in a nucleic acid probe-immobilized substrate represented by a DNA chip, a DNA microarray, etc.
  • a probe in a DN performing many reactions such as nucleic acid amplification and / or hybridization, in parallel and z or repeatedly
  • a method of manufacturing is provided.
  • the use of orthonormalized sequences J has been proposed by Suyama et al. (H. Yoshidaa 1dA. SUyama Solution) 3I SAT bybreadth I irstsearch? Pro C. of 5th Internationa 1 Meetingon DNAB ased C omputers 9-20 (1 9 9 9))) o H.Yoshidaand A.
  • T m values were equal to solve the combinatorial problem of the 3 SAT problem, and that the two-mer sequence sets were cross-dissociated with each other.
  • the method according to the embodiment of the present invention may be a method of an orthonormalized array by a full verification algorithm or a method of designing an orthonormalized array by a sequential addition algorithm. This method is also included in the present m o
  • the melting temperature (T m) is within a range
  • the x-nosie pre-division signal is one time as compared to the signal of the complete match. 0 1/0
  • BX. P1 is a column group that is an orthonormal array that is difficult to take a secondary structure. Also, a nucleic acid group synthesized based on the nucleic acid is provided.
  • SEQ ID NO: 107 to SEQ ID NO: 142, SEQ ID NO: 143 Chirara SEQ ID: 178, SEQ ID NO: 179 to SEQ ID NO: 214, SEQ ID NO: 215 to SEQ ID NO: 2 50, SEQ ID NO: 251 to SEQ ID NO: 263 are shown.
  • the base sequence was written from the 5th end to the 3rd end J1, the dG was written on the right, and the Tm value was shown on the right.
  • SEQ ID NO: 32 6 is SEQ ID NO: 32
  • SEQ ID NO: 32 8 is SEQ ID NO: 219
  • SEQ ID NO: 342 is SEQ ID NO: 175
  • SEQ ID NO: 343 is SEQ ID NO: 21
  • SEQ ID No. 37 2 is SEQ ID No. 16 6
  • SEQ ID No. 37 3 is SEQ ID No. 24 3
  • SEQ ID No. 37 4 is SEQ ID No. 37
  • SEQ ID No. 37 5 is SEQ ID No. 21 0 and This is an equivalent array.
  • one notch includes names 1 13, 37, 49, 61 73 and 85.
  • Two batches include names 2, 14 426, 38, 50, 62, 74 and 86.Batches have names 3, 15 and 2
  • Nozzles include the following items: Eight types of sequences are included in the remaining 14 cuts
  • the used primer is ⁇ ⁇ 5 with Cy3.
  • PCR which is “T GTG G G G G G G A A G G C A G T T A A C C A A” (sequence number 377), is a PTC one for each batch.
  • each amplification product was extracted from the 14 samples obtained for 14 batches using magnetic beads as follows. Magnetic beads (Dynabeads M-280 Streptavidin, Dynal) were collected in 40 ⁇ L fractions, and washed twice with 400 / i L of 2 XB & WB buffer. After washing, the obtained magnetic beads
  • the plate was washed twice with 2 X B & W B U f fer. Further, it was washed once with 200 ⁇ L of Mi 11 iQ water. The magnetic beads after washing were collected, suspended in 100 ⁇ L of Milli Q water-7 o, and then left standing for 10 minutes while stirring at 94 ° C, and the supernatant was removed. Was recovered quickly, and the amplified nucleic acid fragments were extracted and recovered.
  • the above extraction was performed on 14 samples obtained by PCR on 14 nositi, and 14 types of ssDNA derived from the amplification product were obtained.
  • FIG. 2f shows the fluorescence intensity from each quenole obtained after the addition of ssDNA derived from the amplification product of batch 1 to the microarray. As can be seen from the figure, as shown in FIG. 29, the high fluorescence intensity was obtained for the column on which the probe for detecting the sequence contained in batch 1 was immobilized. ⁇
  • a method for designing an orthonormalized sequence group including many markers that can be used for a wide range of uses and a method for synthesizing a nucleic acid according to a sequence designed by such a method.
  • the resulting nucleic acid was provided.

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

It is intended to provide a method of designing normally orthogonalized sequences, a method of producing nucleic acids which are normally orthogonalized sequences and nucleic acids obtained thereby. Namely, a method of designing normally orthogonalized sequences which comprises: first or preliminarily constructing a plural number of base sequences at random; determining the mean of the melting points thereof; obtaining candidate sequences based on a threshold restricted to a temperature range corresponding to the mean ± 1σ; and obtaining normally orthogonalized sequences from the candidate sequences depending on, as an indication, whether or not being a sequence reacting independently.

Description

明 細  Detail
正規直交化配列群の設計方法、 正規直交化配列でめる核酸群 の製造方法およびそれによ り 得られた核酸 Method for designing orthonormalized sequence group, method for producing nucleic acid group based on orthonormalized sequence, and nucleic acid obtained by the method
技術分野 Technical field
本発明は、 正規直交化配列群の設計方法、 正規直交化配列 である核酸群の製造方法おょぴそれによ り 得られた核酸に関 する。  The present invention relates to a method for designing an orthonormalized sequence group, a method for producing a nucleic acid group which is an orthonormalized sequence, and a nucleic acid obtained by the method.
背景技術 Background art
核酸の配列設計技術は、 大まかに 2つに分ける とができ る。 1 つはゲノ ム D N Aや m R N Aの配列をターゲッ ト と し、 その中から検出に最適な配列を選択する設計方法である。 も う 1 つは D N Aコ ンビユ ーティ ング (例えば、 特表 2 0 0 1 一 5 1 5 6 1 4 を参照されたい ) の研究の中で考えられた、 熱的性質の揃った人工配列を設計する技術である 前者はゲ ノ ムゃ m R N Aなどの特定の遺伝子を検出するために使用さ れる核酸の設計技術であ り 、 目的とする特定の遺伝子にハイ プリ ダイ ズする配列に制限して設計が行われる。 そのよ う な 制限の中で、 例えば、 P C R用のプライマーな らば融解温度 ( T m値) が類似し、 電気泳動などで識別可能な数百塩基程 度の長さだけ離れた、 互いに相補的でない配列が選択される。 このよ う な設計技術の発明 と しては、 U S P 5 5 5 6 7 4 9 、 特許第 3 0 5 5 9 4 2 号、 特開 2 0 0 1 - 2 5 8 5 6 8 、 特 開 2 0 0 1 — 2 5 8 5 7 6 、 U S P 6 2 5 1 5 8 8 、 W O 0 0 / 4 6 3 6 3 などがある。  Nucleic acid sequence design techniques can be broadly divided into two categories. One is a design method in which the sequence of the genomic DNA or mRNA is targeted and the optimal sequence for detection is selected from the targets. The other is to design an artificial sequence with uniform thermal properties, which was conceived in the study of DNA combining (see, for example, Japanese Patent Application Laid-Open Publication No. 2001-151561). The former is a technique for designing a nucleic acid used to detect a specific gene such as genomic mRNA, and is limited to sequences that hybridize to the specific gene of interest. The design is done. Under such restrictions, for example, primers for PCR have similar melting temperatures (Tm values) and are complementary to each other by a distance of about several hundred bases that can be identified by electrophoresis. Non-target sequences are selected. Patents such as US Pat. No. 5,556,749, Patent No. 3,055,942, Japanese Patent Laid-Open No. 2000-258,568 and Japanese Patent Publication No. 0 0 1 — 2 5 8 5 7 6, USP 6 2 5 1 5 8 8, WO 0/4 6 3 6 3.
特に W O 0 0 Z 4 6 3 6 3 はプローブやプライマ一の熱特 性だけでなく 、 遺伝子特異性を向上するために対象生物の他 の既知遺伝子のタ.プル情報を用いて特異性を評価し、 ハ ミ ン グ距離を調べて ミ スマ ツチで反応しないかを確かめている。 一方、 後者の人工配列設計技術は、 遺伝子の検出を対象と し ているわけではないので配列設計には自 由度があるが、 多く の種類の配列を設計する必要がある。 In particular, WO 0 Z 4 6 3 6 3 In order to improve the gene specificity as well as the specificity, the specificity is evaluated using the tuple information of other known genes of the target organism, and the Hamming distance is examined to determine whether or not there is a reaction with mismatch. I'm sure. On the other hand, the latter artificial sequence design technology is not intended for gene detection, so there is freedom in sequence design, but it is necessary to design many types of sequences.
例えば A d 1 e m a nは、 ハミル ト ン経路を解く ために、 For example, Ad 1 e ma n solves the Hamiltonian path by
7つの頂点に対応する配列を設計し 、 それら頂点を結ぶ 1 4 本の有向辺を表す D N Aで頂点の D N Aを連結する こ と で解 を求めた ( A d 1 e m a n , S c i e n c e , 2 6 ο :A sequence corresponding to the seven vertices was designed, and a solution was obtained by connecting the DNAs of the vertices with DNA representing 14 directional edges connecting the vertices (Ad 1 eman, Science, 26 ο:
1 0 2 1 - 2 4 ( 1 9 9 4 ) を参照されたい) 。 こ の方法で は、 2 1 種類の 2 0 m e r の核酸が反応に使用された。 しか しな力 S ら、 A d 1 e m a n が解いたのは 7頂点の大変小さい ハ ミ ル ト ン経路問題であつ て現実的な大き さ の問題ではない。10 2 1-2 4 (see 199 4)). In this method, 21 different 20 m er nucleic acids were used in the reaction. However, from the force S, Ad 1 eman solved a very small Hamiltonian path problem with seven vertices, not a problem of realistic size.
D N A コ ン ビユ ーティ ングが電子コ ンピュータ よ り 高速に計 算でき る'と考えられる のは数百頂点のハミル ト ン経路問題で ある。 これを解く にはヽ はるかに多く の数百種類の D N A配 列を設計する必要がある 。 あ しこれらの D Ν Αの配列の う ち、 頂点を表す D N Aの T m値が均一でなければ、 特定の頂点の 連結が進みやすくなる また、 ある有向辺の D N Aが 2 .次構 造を と つて しま う な らば 、 その経路が反応に使われな く な り 、 計算誤差を生むこ と になる。 It is a Hamiltonian path problem with hundreds of vertices that can be calculated faster than electronic computers. To solve this, we need to design far more hundreds of different types of DNA arrays. If the Tm value of the DNA representing the vertices is not uniform among these D-type sequences, the connection of specific vertices is likely to proceed. If this is not taken, the route will not be used for the reaction, and a calculation error will be generated.
以上のこ とカゝら D N A コ ン ビュ ティ ングの反応のために は、 ( 1 ) T m値がほぼ揃った、 ( 2 ) 2 次構造を と る こ と がない、 ( 3 ) 互いにク ロ スノ、ィ プリ ダイゼーショ ン しにく い、 配列を備 た核酸セ ッ 卜 を設計する必要がある。 このた めの設計法と しては 、 特許 3 1 8 5 8 5 3 号があるが、 特定 の反応に用いる こ と を意図 してお り 汎用性に乏 しレ、 As described above, for the reaction of DNA combing, (1) Tm values are almost uniform, (2) no secondary structure is obtained, and (3) mutual Losno, Implicitization It is necessary to design a nucleic acid set having a sequence. As a design method for this purpose, there is Patent No. 31855853, but it is intended to be used for a specific reaction and has low versatility.
遺伝子検出技術は 、 上に述ベたよ う に 子の配列にハィ プリ ダイ ズする とい う制限 守り なが ら 、 いかに誤り なく 検 出するかと い Ό こ と を 目指している。 と ころが、 最近注目 さ れている S N P ( s i n g 1 e N u c 1 e o t i d e P o 1 y m o r P h i s m ) ヽ 一塩基多型を検出する と き には 遺伝子の特定の塩 ¾を必ず含む位置でプ π一ブゃプライマー を設計する必要がある のでその配列によつては検出が困難に なる こ と 力 Sある た、 S N P はヒ ト遺伝子の場 数百塩基 に 1 つの割合で存在する と われるので 、 検出に必要な個数 を全て別々 の反応溶液で行う と コス トが見合わなかつに  As described above, the gene detection technology aims to detect without errors while observing the restriction of hybridizing to the sequence of the child. However, SNP (sing1eNuc1eotidePo1ymorPhism), which has recently attracted attention, is required to detect a single nucleotide polymorphism at a position that always contains a specific salt of a gene. Since it is necessary to design a π-prime primer, detection may be difficult depending on the sequence.SNPs are said to exist at a ratio of one in hundreds of bases of a human gene. However, if the number required for detection is all performed in separate reaction solutions, the cost cannot be justified.
こ の課題を解決する た め に、 蛍光識別 ビーズを使っ た To solve this problem, fluorescent identification beads were used.
Illumina 社の BeadArrayTM (登録商標) や、 C o r n e l l 大学の B a r a— n y らが実験してぃる 0 1 —ジップコー-ド 法などのマルチプレ ッ ク ス S N P検出法が提案されている。 Multiplex SNP detection methods such as Illumina's BeadArray (registered trademark) and the 0 1-zip code method that Barrany et al. Of Cornell University have experimented with have been proposed.
また IB.伝子ゃタ ンパク に目印のタ グ配列をつけヽ マィ ク ロ ア レィ に当該タ グ配列に相補的な配列を固定して < こ と で汎用な検出を 目指す、 「ュ二ノ —サノレチップ J と呼ばれる マイ ク 口 ァ レイ GenFlex™ Tag Array 力 S A f f y e t r i In addition, the tag sequence of the marker is attached to the IB. Gene protein, and a sequence complementary to the tag sequence is fixed in the microarray to achieve general-purpose detection. Microphone array called Sanole chip J GenFlex ™ Tag Array power SA ffyetri
X社から発売されている。 Released by Company X.
これらの方法では、 タグやジップコー ドと 呼ばれる人ェ配 列を遺 亍特異的なプロ一ブ配列の末端に付与し 、 プ 一ブ 側で遺伝子を検出 した後に、 人工配列を共通プライマーで増 幅する と によ つて、 定量的な検出を行っている□ cL>た、 目 的は異なるが Lvnx Γ Μ In these methods, a human sequence called a tag or zip code is added to the end of the gene-specific probe sequence, and after detecting the gene on the probe side, the artificial sequence is amplified with a common primer. Quantitative detection is carried out depending on the width. □ cL>, although the purpose is different, Lvnx Γ Μ
1 herap eutics社は Megaclo ne とい う ク ローニングシステムを提供してい 。 この方法ではビーズ毎 に異なる タ グ配列をつけてお く こ と によ り 、 ク ロ ―二ングを よ り 効率よ < 行 う方法でめ。。  1 herap eutics offers a cloning system called Megaclone. In this method, different tag arrays are provided for each bead, so that closing can be performed more efficiently. .
以上の技術の中で利用 される タ グゃジップコー ド配列は次 の特許はヽ B a r a n y らは W O 0 1 / 7 9 5 4 8 で示され る よ う な T m値やク ロ ス ノヽイブリ ダイゼーシ ョ ン特性を考慮 した 4塩基の配列セ ッ ト を選び、 それらの組み合わせによ り ジップ 一 ド、配列を生成する技術に基づく 。 一方 、 L y n The tag zip code arrangement used in the above technology is described in the following patents: Barany et al. Describe Tm values and cross-noise hybrids as shown in WO 01/79548. Based on the technology of selecting a four-base sequence set that takes into account the characteristics of the dissociation and generating a zip-and-sequence by combining them. On the other hand, L y n
T h e r a P e u t i c s 社は U S P 5 , 6 3 5 , 4 0 0 に ある よ う に、 3 〜 6塩基を単位と してク 口スハイプリ ダィゼ ーシ ヨ ンが起き にく い配列基本セ ッ ト を作り 、 それらの組み 合わせによ り 2 4塩基程度のタグ配列を生成してレヽる。 本 配列を組み合わせて設計する方法には 、 核酸の長さが、
Figure imgf000006_0001
の基と なった基本配列の整数倍に限定される欠点がある 。 即 ち、 それらの方法では、 2 3 m e r や 、 2 9 m e r な どの素 数長であ り なが ら有用な熱化学的性質をもつ配列群を生成す る こ とができなかった。
The HeraPeutics, as in USP 5, 635, and 400, uses a sequence base set of 3 to 6 bases that is unlikely to cause chromosomal hybridization. Then, a tag sequence of about 24 bases is generated and combined according to the combination. In the method of designing by combining the sequences, the length of the nucleic acid is
Figure imgf000006_0001
However, there is a disadvantage that the number is limited to an integral multiple of the basic array on which the base is based. In other words, those methods could not generate a sequence group having useful thermochemical properties while having a prime length such as a 23 mer or a 29 mer.
これに対して E P 7 9 9 8 9 7 では 、 長さ を限定せず 、 8 塩基以上連続して同一の配列をもたなレ、な どの基準に従い生 成した配列をセ ッ ト に追加する方法を提案している。  On the other hand, in EP 799 897, a sequence generated according to a standard, such as having at least 8 bases and having the same sequence without limitation in length, is added to the set. Suggest a way.
と ころが、 いずれの方法も 、 ; 冊 _C T m値のばらつきやク ロ スハイ ブリ ダイゼーシ ョ ンの問題がない配列だと考え られ るだけで、 実験によ るそれらの配列の性能の完全な検証は行 われていない However, both methods are considered to be arrays that do not have variances in _C Tm values or cross-hybridization problems. Validation is row Not
発明の開示 Disclosure of the invention
明が解決しよ つ とする IS題  IS subject that Akira is trying to solve
本発明の 目的は 、 正規直交化配列群の Ρス 5十力法 、 正規直交 化配列である核酸群の製造方法 よぴそれによ り 得られた核 酸を提供する こ と める。  An object of the present invention is to provide a method for producing a nucleic acid group which is an orthonormalized sequence, a method for producing a nucleic acid group which is an orthonormalized sequence, and a nucleic acid obtained by the method.
特に 、 そのよ ラ な配列群およぴそのよ う な核酸群はヽ そ に含まれる夫々の塩基配列または核酸の融解温度がほぼ均 ― であ り 、 互いにク 口スハイ ブ V ダィゼ一シヨ ンを起 し難 < 、 その ―次構造が安定ではない o  In particular, such a sequence group and such a nucleic acid group have substantially the same melting temperature of their respective base sequences or nucleic acids, and are close to each other. O The next structure is not stable o
課題を解決するための手段  Means for solving the problem
本発明は、 上記の 百的を達成するための手段と してヽ 以下 の方法を提供する。  The present invention provides the following methods as means for achieving the above-mentioned objectives.
即ち 、 正規 ¾·交化配列群の設計方法であってヽ 最初、 また は予めハ、ヽ作為に塩基配列を複数作.出する こ と と 、 それらの融 解温度の平均値を求める こ と と、 その平均値の ± t °Cで制限 される閾値を基に候補配列を得る こ と と、 独立して反応する 配列であるか否かを指標に得られた候補配列から正規直交化 配列群を得る こ と と を具備する正規 交化配列群の設計方法 が提供され ^ 0 In other words, this is a method for designing a group of normal ¾-crossover sequences.First, or in advance, a plurality of base sequences are generated, and the average value of their melting temperatures is determined. And obtaining a candidate sequence based on a threshold limited by ± t ° C of the average value, and orthonormalized sequences from candidate sequences obtained based on whether or not the sequence reacts independently A method for designing a group of normal crossing sequences comprising obtaining a group is provided ^ 0
図面の簡単な説明 BRIEF DESCRIPTION OF THE FIGURES
図 1 は 、 本発明の態様にねいて使用 され得る了ジタ ノレコ ン ピュ ―タの 1例を示すプロ クク図であるである o  FIG. 1 is a block diagram illustrating one example of a digital computer that may be used in accordance with embodiments of the present invention.
図 2 は 、 本発明の 1 態様でめ - s P5C B†方法の 1 例を示すフロ 一チャ一 トである。 図 3 は、 本発明の 1 態様である設計方法の 1 例を示すフロ ーチャ トであ ' FIG. 2 is a flowchart illustrating an example of the method according to one embodiment of the present invention. FIG. 3 is a flowchart showing an example of a design method according to one embodiment of the present invention.
図 4 は 、 本発明の 1 態様である設計方法の 1 例を示すフ ロ 一チャ トでめる。  FIG. 4 is a flowchart showing one example of a design method according to one embodiment of the present invention.
図 5 は 、 本発明の 1 態操であ 設計方法の 1 例を示すフ ロ ーチ トでめる  FIG. 5 is a flowchart showing one example of a design method in one mode of the present invention.
図 6 は 、 本発明の 1 態様である設計方法の一部を示すフ口 一チャ トである。  FIG. 6 is a flowchart showing a part of a design method according to one embodiment of the present invention.
図 7 は 、 本発明の 1 態様である設計方法の一部を示すフロ ーチャ一 トである。  FIG. 7 is a flowchart showing a part of the design method according to one embodiment of the present invention.
図 8 は 、 自 己相補性を検討するための方法の 1 例を示す図 である  FIG. 8 is a diagram illustrating an example of a method for examining self-complementarity.
図 9 は 、 自 己相補性を検討するための方法の 1 例を示す図 である - 図 1 0 は、 白 己相補性を検討するための方法の 1例を示す 図である  FIG. 9 is a diagram showing one example of a method for examining self-complementarity-FIG. 10 is a diagram showing one example of a method for examining self-complementarity
図 1 1 は、 ク 口 スノヽイブリ ダィゼーシ ョ ンの存在を確認す るための方法の 1 例を示す図である。  FIG. 11 is a diagram showing an example of a method for confirming the existence of a mouth snow hydration.
図 1 2 は、 ク 口スハイブリ ダィゼーショ ンの存在を確認す るための方法の 1 例を示す図である  Fig. 12 is a diagram showing an example of a method for confirming the presence of mouth hybridization.
図 1 3 は、 候補配列の作出方法の更なる例を示す図である。 図 1 4 は、 正規直交化配列の リ ス ト(1 )である。  FIG. 13 is a diagram showing a further example of a method for producing a candidate sequence. Figure 14 shows the orthonormalized array list (1).
図 1 5 は、 正規直交化配列の リ ス ト (2) ; ( 1 )の続きである。  Figure 15 is a continuation of the list of orthonormal arrays (2); (1).
1 6 は、 正規直交化配列の リ ス ト (3 ); (2)の続きである。 図 1 7 は、 正規直交化配列の リ ス ト(4) ; (3)の続きである。 1 8 は、 正規直交化配列の リ ス ト (5);(4)の続さである。 図 1 9 は、 正規直交化配列の リ ス ト (6);(5)の続き 5め る。 図 2 0 は、 正規直交化配列の リ ス ト (7);(6)の続さである。 図 2 1 は、 正規直交化配列の リ ス ト (8);(7)の続含である。 図 2 2 は、 マ イ ク ロ ア レイ に よ る検証用正規 交化配列16 is a continuation of the list of orthonormal arrays ( 3 ); (2). Figure 17 is a continuation of the list of orthonormalized arrays (4); ( 3 ). 18 is the continuation of the list of orthonormalized arrays (5); (4). Figure 1 9 is list of orthonormal sequences (6); Ru Following 5 because of (5). Figure 20 is a continuation of the list of orthonormalized arrays (7); ( 6 ). Figure 21 is a continuation of the list of orthonormalized arrays ( 8 ); ( 7 ). Figure 22 shows a normal array for verification using a microarray.
(1)である。 (1).
図 2 3 は、 マイ ク ロ ア レイ に よ る検証用正規直交化配列 Figure 23 shows an orthonormal array for verification using a microarray.
(2) ;(1)の続きである。 ( 2 ) Continuation of; (1).
図 2 4 は、 マイ ク ΰ ア レイ によ る検証用正規直交化配列 Figure 24 shows an orthonormalized array for verification using a microarray.
(3) ;(2)の続きである。 ( 3 ) Continuation of ( 2 ).
図 2 5 は、 マイ ク ロ ア レイ に よ る検証用正規直交化配列 Figure 25 shows an orthonormalized array for verification using a microarray.
(4) ;(3)の続きである。 (4) Continuation of; (3).
図 2 6 は、 マイ ク ロ ア レイ に よ る検証用正規直交化配列 Figure 26 shows an orthonormal array for verification using a microarray.
(5) ;(4)の続きである。 ' (5) Continuation of; (4). '
図 2 7 は、 マイ ク ロ ア レイ に よ る検証用正規直交化配列 Figure 27 shows an orthonormal array for verification using a microarray.
(6) ;(5)の続きである。 (6) Continuation of; (5).
図 2 8 は、 実施例 2 におけるバッチ 1 に関する結果を示す グラ フである。  FIG. 28 is a graph showing the result of the batch 1 in Example 2.
図 2 9 は、 実施例 2 におけるバッチ 2 に関する検証結果を 示すグラ フである。  FIG. 29 is a graph showing the result of verification on batch 2 in Example 2.
図 3 0 は、 実施例 2 におけるバッチ 3 に関する検証結果を 示すグラ フである。  FIG. 30 is a graph showing the verification result of the batch 3 in the second embodiment.
図 3 1 は、 実施例 2 におけるバッチ 4 に関する検証結果を 示すグラ フである。  FIG. 31 is a graph showing the verification result of batch 4 in Example 2.
図 3 2 は、 実施例 2 におけるバッチ 5 に関する検証結果を 示すグラフであ Figure 32 shows the verification results for batch 5 in Example 2. Graph
図 3 3 はヽ 施例 2 における / ッチ 6 に関する検証結果を 示すグラ フであな 。  FIG. 33 is a graph showing the verification result of the switch 6 in the second embodiment.
図 3 4 は 、 実施例 2 に けるノ^ クチ 7 に関する検証結果を 示すグラ フであ 0。  FIG. 34 is a graph showing the result of the verification of the knockout 7 in the second embodiment.
図 3 5 は 、 実施例 2 におけるノ^ クチ 8 に関する検証結果を 示すグラフである。  FIG. 35 is a graph showing the results of verification on the knockout 8 in the second embodiment.
図 3 6 は 、 実施例 2 に ける -yチ 9 に関する検証結果を 示すグラ フである。  FIG. 36 is a graph showing the verification result of -yh 9 in the second embodiment.
図 3 7 は 、 実施例 2 におけるバクチ 1 0 に関する検証結果 を示すグラ フである ο  FIG. 37 is a graph showing the result of verification on Bakuchi 10 in Example 2.
図 3 8 は 、 実施例 2 に けるノ^ クチ 1 1 に関する検証結果 を示すグラ フである ο  FIG. 38 is a graph showing the verification result of the knock 11 in the second embodiment.
図 3 9 は 、 実施例 2 におけるバ yチ 1 2 に関する検証結果 を示すグラ フである ο '  FIG. 39 is a graph showing the results of verification of the first embodiment according to the second embodiment.
図 4 0 は 、 実施例 2 にねけるノ ッ.チ 1 3 に関する検証結果 を示すグラ フである ο  FIG. 40 is a graph showing the verification results of the notch 13 in Example 2.
図 4 1 は 、 実施例 2 におけるバ クチ 1 4 に関する検証結果 を示すグラ フである ο  FIG. 41 is a graph showing the result of verification of the backlash 14 in the second embodiment.
発明を実施するための最良の形態 BEST MODE FOR CARRYING OUT THE INVENTION
1 . 用語の説明  1. Explanation of terms
こ こで使用される 「正規直交化配列」 における 「正規」 の 語は、 複数の配列において熱的性質の正規性を維持する こ と、 即ち、 融解温度が一定の範囲内で揃っている こ と を示す。 熱 的性質の正規性を維持する こ と によって、 例えば、 多く の配 列を纏めて使用 して反応を行 う こ と が有利に実行される。As used herein, the term "normal" in "orthogonal array" refers to maintaining the normality of thermal properties in multiple arrays, i.e., having a uniform melting temperature within a certain range. And. By maintaining the normality of thermal properties, for example, many distributions It is advantageous to carry out the reaction using the rows together.
「正規直交化配列」 における Γ直交化」 の語は、 配列に直交 性を持たせる こ とであ り 、 1 つの直交化配列群に含まれる全 ての配列は、 夫々独立 して反応する、 即ち、 1 つの正規直交 化配列群に含まれる配列はヽ 所望の組み合わせ以外の配列間 および自 己配列內において反応が生じ難いか、 または反応が 生じない。 言い換えれば、 1 つの直交化配列群に含まれる配 列は、 配列間でのク ロ スノヽィブリ ダィゼーシヨ ンや、 自 己配 列内での望まないハイ ブリ ダィゼーシ ヨ ンが従来よ り も生じ 難いか、 生じない。 The term “orthogonalization” in “orthogonalized array” is to make an array orthogonal, and all sequences included in one orthogonalized array group react independently. That is, the sequences included in one orthonormalized sequence group hardly or do not cause a reaction between {sequences other than the desired combination and the self sequence}. In other words, the sequences included in a group of orthogonalized sequences are less likely to cause cross-hybridization between sequences and undesired hybridization within their own sequences than ever before. Or not.
こ こで使用される 「核酸 J の語は、 塩基配列で表される核 酸および核酸類似物であればよい。 そのよ う な核酸は、 例え ば、 D N A、 R N A 、 およびぺプチ ド核酸である。  As used herein, the term "nucleic acid J" can be any nucleic acid or nucleic acid analog represented by a base sequence. Such nucleic acids include, for example, DNA, RNA, and peptide nucleic acids. is there.
こ こで使用される 「塩基配列 J および 「配列」 の語は共に、 特定の核酸を構成する塩基の並びを示すものである。 従って、 本明細書におい -て、 「配列 J を 「設計」 する という こ と は、. 必ずしもそのよ う な配列からなる核酸を実際に合成する必要 はな く 、 シミ ュ レ一シヨ ンなどの手段を利用 して配列を作出 し、 目的とする配列群を与える こ とである。 例えば、 与えら  As used herein, the terms "base sequence J" and "sequence" both refer to the arrangement of bases that make up a particular nucleic acid. Therefore, in this specification, "designing" a sequence J means that it is not always necessary to actually synthesize a nucleic acid having such a sequence. This is to create a sequence using a means and give a target sequence group. For example, given
-—、、  -— ,,
れた配列群は、 紙面および丁ィ スプレイ な どに出力された形 態で提供された り 、 媒体に記録された形態で提供され得る。 またそのよ う な配列は、 核酸に反映されて実際に合成された 核酸と しても提供される。 本明細書中では 「塩基配列」 とThe group of arrangements provided can be provided in the form of output on paper or a display, or can be provided in the form recorded on a medium. Such a sequence is also provided as an actually synthesized nucleic acid reflected in the nucleic acid. In this specification, "base sequence"
「配列」 は交換可能に使用 され得る。 “Sequence” may be used interchangeably.
こ こで、 「核酸」 の 「合成」 と は、 設計された配列を基に、 特定の配列を含む核酸または核酸類似物を実際に合成する こ と を示す。 - Here, the “synthesis” of “nucleic acid” is based on the designed sequence. Indicates that a nucleic acid or nucleic acid analog containing a particular sequence is actually synthesized. -
2 . 正規直交化配列群の設計方 fix 2. How to design orthonormal arrays
本発明の 1 態様に従 と 、 そこに含まれる全ての塩基配列 が互いに正規直交化配列 あ Ό正規直交化配列群を設計する 方法が提供される。 その概要は次の通 り でめる。 まず、 何れ の フ イ ノレタ一によって 選別を行っていない粗配列と して、 無作為な配列からなる ラ ンダム配列を作出する。 平均値を求 めるのに適 した数量だけのラ ンダム配列を作り 、 これらの融 解温度 (以下 、 T m ¼と記す) の平均値を求める。 次に、 前 記粗配列およぴ zまたは新たに作出 した粗配列である ラ ンダ ム配列の T m値と閾値と を比較する。 その T mの平均値土 1 σ に相当する温度範囲を閾値とする。 閾値で制限される一定 範囲に含まれる T m値を有する粗配列を選別して、 候補塩基 配列群を得る 。 こ こ で 、 T mの平均値 「土 1 σ に相当する温 度範 ¾ J と は 、 以下に説明する通 り である o T m分布はほぼ 正規分布を示し、 標準正規分布への変換を行つた後、 1 び に 相当する幅を持つ温度の範囲を T m範囲とする こ とが望ま し い。 これによ り 、 全体のおよそ 1 / 3 が T 条件をク リ アす る こ とが可能 5 め 。 例えば、 2 5 m e r の場合、 およそ土According to one embodiment of the present invention, there is provided a method for designing an orthonormal sequence or a group of orthonormal sequences in which all the base sequences contained therein are orthonormal. The outline is as follows. First, a random array consisting of random arrays is created as a crude array that has not been selected by any of the finalizers. A random array is prepared in a quantity suitable for obtaining the average value, and the average value of these melting temperatures (hereinafter referred to as Tm m) is obtained. Next, the threshold value and the Tm value of the coarse array and z or a random array that is a newly generated coarse array are compared. The temperature range corresponding to the average value of the Tm soil 1 σ is defined as the threshold. A crude sequence having a Tm value falling within a certain range limited by a threshold is selected to obtain a group of candidate nucleotide sequences. Here, the average value of Tm “Temperature range ¾J corresponding to 1 σ of soil” is as described below.o The Tm distribution shows almost normal distribution, and the conversion to standard normal distribution is performed. It is desirable to set the temperature range having a width corresponding to one to the Tm range after this operation, so that about one-third of the whole clears the T condition. Is possible 5. For example, in the case of 25 mer, approximately
2 °Cが ± 1 σ に相当する 。 また 、 厳密な 1 の値を用いなく ても、 それに近い値、 例えば小数第一位を四捨五入した値な どで十分でめる。 このよ う に して、 熱的性質の正規性を確立 した候捕塩基配列群が得られた ο 2 ° C corresponds to ± 1σ. Further, even if an exact value of 1 is not used, a value close to the value, for example, a value obtained by rounding off the first decimal place is sufficient. In this way, a set of target nucleotide sequences that established the normality of thermal properties was obtained.ο
続いて、 候補塩基配列群に含まれる夫々 の配列が、 それぞ れが独立して反応する配列であるか否かを検討して直交化を 行う。 これは、 候補塩基配列群に含まれる各塩基配列の性質 および/または構造を解析すればよい。 性質および/または 構造を解析する こ と によ り 、 1 配列内での反応や 1 群に含ま れる配列間での反応が低い、 またはそのよ う な反応性のない 配列のみで構成される よ う に候捕塩基配列群に含まれる配列 を選別する'。 Next, each sequence included in the candidate nucleotide sequence group is The orthogonalization is performed by examining whether these are sequences that react independently. This can be done by analyzing the properties and / or structure of each nucleotide sequence included in the candidate nucleotide sequence group. By analyzing the properties and / or structure, the reaction within one sequence or between the sequences in a group is low, or the sequence consists of only those sequences that are not reactive. In this way, select the sequences contained in the target nucleotide sequence group '.
以上の操作によつて正規直交化配列群が得られる。 のよ ラ な本発明に従 う正規直交化配列群の設計方法によればヽ 実 際に核酸を合成せずと も、 互いに正規直交化配列である複数 の配列からなる正規直交化.配列群を設計する こ と が可能であ る 。 また、 この よ う な本発明に従 う方法によれば 、 よ り 多 < の配列を含む正規直交化配列群を短時間に設計する こ と が可 能である。 以下に更に本発明の態様を説明する。  With the above operation, an orthonormalized array group is obtained. According to the method for designing a group of orthonormalized sequences according to the present invention, an orthonormalization comprising a plurality of sequences that are orthonormalized to each other without actually synthesizing a nucleic acid. It is possible to design Also, according to such a method according to the present invention, it is possible to design an orthonormalized array group including more arrays in a short time. Hereinafter, embodiments of the present invention will be further described.
本発明に従って、 無作為に塩基配列を作出する手段は 例 According to the present invention, a means for randomly generating a base sequence is an example.
X.ば、 それ自体公知の乱数関数、 乱数表および乱数発生装置 な どを利用 し よい 。 乱数を利用する場合には、 例えばヽ 数 値に予め塩基を対応させておき、 乱数関数、 乱数表または乱 数発生装置によ り発生された数値を塩基に置き換えればよい。 X. may use a well-known random number function, a random number table, a random number generator, and the like. When a random number is used, for example, a base is made to correspond to a numerical value in advance, and a random number function, a random number table, or a numerical value generated by a random number generator may be replaced with a base.
数ィ直への塩基の対応付けは実施者が任意に行つてよい 例 ば、 乱数の発生は整数、 小数、 2進数、 8進数 、 1 6進数 などで行われればよ く 、 また、 これらは乱数関数のプ グラ ム上での呼び出 し方に依存 してよい。 例えば、 よ り 効率的な 方法は、 2桁の 2進数 ( 0 、 1 、 2 、 3 ) で乱数を発生させ、 The practitioner may arbitrarily associate bases with numbers directly.For example, random numbers may be generated by integers, decimal numbers, binary numbers, octal numbers, hexadecimal numbers, or the like. It may depend on how the random number function is called on the program. For example, a more efficient method is to generate a random number with two binary digits (0, 1, 2, 3),
4つの塩基に対応させる方法である。 また、 発生させた 1 乱 を 1塩 に対応させる と い う 方法が望ま しい方法の 1 つで ある のよ う な方法で発生された配列はヽ 4つの配列が均 等に含ま ヽ T m値も比較的そろつたものになる This is a method to correspond to four bases. Also, one generated disturbance The sequence generated in such a way that the method of mapping to one salt is one of the desirable methods is that ヽ four sequences are evenly distributed ヽ Tm values are relatively uniform Become
また 、 ラ ンダム配列の生成毎に T m値を算出する こ とを繰 り 返して行い 、 ラ ンダム配列生成の終了 した後に 、 得られた 全ての T 値を基に平均値を算出 して も 、 全てのラ ンダム配 列の生成後に 、 それらの配列の T m値を算出 して平均値を求 めて よい あるレ、は、 ラ ンダム配列の生成毎に T m値を算 出 し 新たなラ ンダム配列の生成毎の平均値を求め、 平均値 が十分に収束したと ころで平均値と して よい。  Also, the calculation of the Tm value for each generation of a random array is repeatedly performed, and after the generation of the random array, an average value is calculated based on all the obtained T values. After the generation of all random arrays, the Tm values of those arrays may be calculated and the average value may be calculated.One method is to calculate the Tm value each time a random array is generated, and to calculate a new value. The average value for each generation of the random array may be obtained, and the average value may be used when the average value converges sufficiently.
このよ う に i 4ハ£、、作為に作出された複数の塩 配列をヽ 便宜上、 第 1 の粗配列群とする 。 第 1 の粗配列群に含まれる夫々 の配 列の T m値の求め方は 、 当該塩基配列に含まれる G C や塩 配列の長さな どから 、 理 冊的または経験的に行えばよい 例えば、 それ自 身公知の N e a r e s t N e i g h b o r 法を利用 して T m値を求めても よ く 、 或いは ¾.基配列に り 示される核酸の T m値を測定した実験 τ タ 、 その累積ァ一 タおよび/または経験則な どに基づいて 、 S的とする塩基配 列の T m値を求めればよい  A plurality of salt sequences created in this way at i 4 are thus referred to as a first coarse sequence group for convenience. The method of determining the Tm value of each sequence included in the first crude sequence group may be based on the length of the GC or salt sequence included in the base sequence, or may be determined empirically or empirically. Alternatively, the Tm value may be determined by using the Nearest Neighbor method known per se, or ¾. An experiment in which the Tm value of the nucleic acid represented by the base sequence was measured, The Tm value of the base sequence to be used as an S may be obtained based on data and / or empirical rules.
第 1 の粗配列群に含まれる塩基配列の長さは、 全て等 しい と が好ま しいが、 必ずし 等 しい長さでな く ても よ < 、 ま た予め実施者が特定した範囲で異なる長さ と して よい ハ 作為に作出 される塩 配列の長さ は、 実施者が任 に選択し ても、 使用 目的に応じて長さを決定して よい。  It is preferable that the lengths of the base sequences contained in the first crude sequence group are all the same, but they do not necessarily have to be the same length <and also differ within the range specified by the practitioner in advance The length of the salt sequence created at random may be determined according to the purpose of use, even if the practitioner chooses it at will.
次に、 得られた夫々 の塩基配列の T 値から第 1 の粗配列 群の T mの平均値を算出する。 当該平均値を得るための第 1 の粗配列群に含まれる配列の数、 即ち、 第 1 の粗配列群の大 さ さ は、 例えば 、 約 1 0 0 0以上であ り ヽ 好ま +しく は約 1 0Next, the first crude sequence was determined from the T value of each base sequence obtained. Calculate the mean of the group Tm. The number of sequences included in the first crude sequence group for obtaining the average value, that is, the size of the first crude sequence group is, for example, about 100 or more. About 10
0 0 0以上であ り 、 よ り好ま しく は約 1 0 0 0 0 0以上であ る 。 粗配列群の大き さは大きければ大きいほど平均値は収束 する。 しカゝ しなが ら、 大き く すればするほ ど計算時間が必要 となる。 例えば 、 1 0 0個で平均値を求めた場合 、 生成され た配列が十分にラ ンダムであるな らば、 収束する値にかな り 近い値となる。 従って、 T mの計算精度から考 て (即ち、 小数点 1 桁程度 ) 、 1 0 0 0個の平均^:で十分であ り 、 1 0It is not less than 0000, and more preferably not less than about 1000. The average value converges as the size of the coarse array group increases. However, a larger size requires more calculation time. For example, when an average value is calculated for 100 pieces, if the generated array is sufficiently random, the value will be a value very close to the value that converges. Therefore, considering the calculation accuracy of T m (that is, about one decimal place), an average of 100: ^: is sufficient, and 1 0
0 0 0個以上な らほぼ収束し終わる と考え られる 。 し力 しな がら、 1 0 0 0 0 0個以上の発生でも、 P e n t i u m 3It is considered that the convergence is almost completed when the number is more than 00. However, even if more than 100,000 occurrences occur, P e n t i u m 3
8 0 0 M H z. の場合な ら、 1 分以下程度とヽ -ほとんど時間は かか.らないので 、 最初に 1 回だけ行えばいい ·> - と を考慮すれ ば 、 1 0 0 0 0 0個以上行つても よいだろ o In the case of 800 MHz, it takes about 1 minute or less, and it takes almost no time, so it is only necessary to perform it once at the beginning. 0 or more may be o
次に、 当該 T mの平均値を中央値と して 、 その前後 1 び に 相当する温度幅を持つ領域を閾値と し、 一定範囲を設定する。  Next, the average value of the Tm is set as a median value, and a region having a temperature width corresponding to the one before and after the median value is set as a threshold value, and a certain range is set.
いて、 こ の平均値 ± 1 σ に相当する温度範囲で制限される 範囲に含まれる T m値を有する配列 らなる候補配列群を得 る 。 候補配列群を得るためには 粗配列群に含まれる無作為 に作出された塩基配列の T m値と、 閾値と を比較し、 平均値 土 1 σ に相当する温度範囲の範囲に入る配列を選択すればよ い 。 或いは、 平均値 ± 1 ひ に相当する温度範囲の範囲に入ら ない配列を除外して群を作ればよい。  Then, a candidate sequence group consisting of sequences having a Tm value included in a range limited by the temperature range corresponding to the average value ± 1σ is obtained. To obtain the candidate sequence group, the Tm value of the randomly generated base sequence included in the crude sequence group is compared with the threshold, and the sequence that falls within the temperature range corresponding to the average value of 1 σ is determined. Just select it. Alternatively, a group may be formed by excluding sequences that do not fall within the temperature range corresponding to the average value ± 1 unit.
候補配列群を得るために用いられる粗配列群は 、 T mの平 均値を求めるために用いた第 1 の粗配列群であつても < 第 1 の粗配列群の一部の配列からなる第 2 の粗配列群であつ ても よ く 、 または第 1 の粗配列群 κ ハ、、作為に作出された更な る配列を追加してなる第 2 の粗配列群であつても 或いは全The crude sequence group used to obtain the candidate sequence group is T m The first coarse array group may be the first coarse array group used to calculate the average value, or may be the second coarse array group consisting of a part of the first coarse array group, or the first coarse array group. Sequence group κC, even if it is the second crude sequence group to which additional sequences created by
< 新たに無作為に作出された配列からなる第 2 の粗配列群で めつても よい。 では便宜上 Γ粗配列群 」 の語を用い 複 数の粗配列を示 したが 、 候補配列群を得るために用いるハ、、作 為に作出される配列は 、 実質的な群が形成されずに使用 され ても よい。 例えば、 作出 と 同時に τ m値が算出されても よ<A second group of crude sequences consisting of newly randomly generated sequences may be used. For convenience, the term “coarse sequence group” was used to indicate a plurality of coarse sequences, but the sequence used to obtain the candidate sequence group was designed without substantial groups. May be used. For example, the τm value may be calculated simultaneously with the production.
< 、 また更に得られた T m値が閾値と比較されても よい 第 2 の粗配列群に含まれる塩基配列の長さ は、 全て等 しい とが好ま しいが、 必ずしも等 しい長さでな ぐてあ よ く ま た予め実施者が特定した範囲で異なる長さ と してあ よい 作為に作出される塩基配列の長さ は、 実施者が任 、に選択し ても、 使用 目的に応 じて長さを決定しても よい。 <, Or furthermore, the obtained Tm value may be compared with a threshold value. The lengths of the base sequences included in the second crude sequence group are preferably equal, but not necessarily equal. The length of the base sequence created for the procedure may vary depending on the purpose of use, even if the practitioner chooses it at will. The length may be determined in advance.
また、 約 X 1 塩基 約 X 2塩基 s 好ま し く は約 Y 1塩基 約 Y 2塩基の短い粗配列を作出 し れを組み合わせて得ら れる長い配列についても後述する よ う な手段によつて独 性 を検討し、 直交化を達成すればよい。 これに限定する もので はない'が、 例えば、 約 5塩基〜約 1 0塩基であつても、 好ま しく は約 1 0塩基〜 2 0塩基であつても よい。 また い配 列を組み合わせて長い配列を作るのな ら、 考え られる全ての 配列を生成する こ と が望ま しい そ ^ で、 現実的な時間で全 配列が生成可能であるだろ う と ヽわれる 2 0塩基 上限と し た 。 また、 めま り 短い配列では 長い配列を作成する と に 多く の連結部位が出現し、 結局は長い配列を生成してからク ロ スノヽィ プ リ を調べるの と 同 - じ と になって しま う のでヽ 下 限と して 5塩基を採用 した。 極端に言えば、 1塩基を連結し ていく と き 、 それは長い配列 乱数な どで生成してい -In addition, a long sequence obtained by creating a short crude sequence of about X1 bases and about X2 bases s or preferably about Y1 bases and about Y2 bases and combining the generated crude sequences by means described below. It is sufficient to consider uniqueness and achieve orthogonalization. Without limitation, it may be, for example, from about 5 bases to about 10 bases, or preferably from about 10 bases to 20 bases. In addition, if a long sequence is created by combining different sequences, it is desirable to generate all possible sequences, so it would be possible to generate the entire sequence in a realistic time2 The upper limit was set to 0 bases. Also, if you create a long array for a short array, Many ligation sites appeared, and after all, a long sequence was generated, which would be the same as examining a cross-nodule. Therefore, 5 bases were adopted as the lower limit. At the extreme, when one base is linked, it is generated as a long sequence random number.
< と と 同 じである o Same as <and o
次に、 得られた候捕配列群に含まれる全ての配列に レ、て、 それらの配列の性質おょぴノまたは構造を解析する。 その 果から、 候補配列群に含まれる夫々 の塩基配列について 、 独 立 して反応する配列である否かを確認し、 目的とする正規直 交化配列群を得る。 本発明の態様に従 う と 、 独立 して反応す る配列であるか否かを確認するためには、 以下の (A ) から Next, all the sequences contained in the obtained target sequence group are analyzed for their properties or structures. From the results, it is confirmed whether or not each of the base sequences included in the candidate sequence is a sequence that reacts independently, and a target normal orthogonal sequence group is obtained. According to the embodiment of the present invention, in order to confirm whether or not the sequence reacts independently, the following (A) is used.
( C ) の少なく と も 1 を解析すればよい ': It is sufficient to analyze at least 1 in (C) ':
( A ) 配列における 自 己相補配列の存在、  (A) the presence of a self-complementary sequence in the sequence,
( B ) 配列の二次構造の安定性の程度.、 および  (B) the degree of stability of the secondary structure of the sequence; and
( c ) 複数の配列の間でのク 口スハイプリ ダィゼ一シ 3 ンの存在 - - o  (c) Existence of mouth spanning between multiple sequences--o
こ の解析の結果、 以下の ( a ) から ( c ) の何れか 1 に該 当する場合には、 その配列を候補配列群から除外する  As a result of this analysis, if any of the following (a) to (c) applies, the sequence is excluded from the candidate sequence group
( a ) 1 の配列中 自 己相補配列が存在する、  (a) a self-complementary sequence exists in the sequence of 1;
( b ) 1 の配列の二次構 3 [口の安定性の程度が高い 、  (b) The secondary structure 3 of the sequence 1 [the degree of mouth stability is high,
( c ) 複数の配列の間にク Π ス /、イブリ ダイゼーシ ン が存在す ¾ o  (c) There is a cross / idle hybridization between multiple sequences.
各配列における 自 己相補配列の存在の確認は、 候捕配列群 に含まれる夫々 の配列についてヽ その塩基配列を基に行う とが可能で で、 「自 己相捕配列」 が 「存在 J する と は、 1 つの配列中に、 互いに相捕的な部分が 1 組以上存在 する こ と をい う。 また 、 自 己相補配列である と判定するため に基準と なる塩基 は 、 実施者が任 、に決定すればよい。 例 えぱ、 1 つの塩基配列中に、 2塩基長以上の相補的部分が存 在した場合に自 己相補配列が存在する と判定しても よ く 、 或 いはヽ' 3 塩基以上、 4 塩基以上ヽ 5 塩基以上、 , 6 塩基以 上 · · ·、 または X塩基以上の連続する塩基と それに相補的な 塩基配列が含まれる場合に自 己相補配列が存在する と判定し ても よい こで 「 X J は 2 以上の整数である。 また、 この よ う な塩基数は、 使用 的に応じて選択されても よい。 The existence of the self-complementary sequence in each sequence can be confirmed for each of the sequences contained in the target sequence group based on the base sequence. And means that there is more than one set of mutually complementary parts in one sequence. Further, the base used as a reference for determining that the sequence is a self-complementary sequence may be arbitrarily determined by the practitioner. For example, it may be determined that a self-complementary sequence is present when a complementary portion having a length of 2 bases or more is present in one base sequence, or it is possible to determine that a self-complementary sequence is present. Bases or more ヽ 5 bases or more,, 6 bases or more, or X or more consecutive bases and a complementary base sequence included therein may be judged to have a self-complementary sequence. In the expression, “XJ is an integer of 2 or more. The number of bases may be selected depending on the use.
複数の配列の間でク ス ハイ ブリ.ダィゼーショ ンが存在す る力 力 を確認するためには、 当該候補配列群に含まれる複 数の配列の間に、 少な < と も部分的な相捕性が存在するか否 かを確認すればよい ク ロ ス ノヽイ ブリ ダィゼ一ショ ンの存在 を判定するための基礎になる塩基長は、 自 己相補配列と 同様 に実施者が決定してよい  In order to confirm the power of cross hybridization between multiple sequences, a small <and partial interpolation between multiple sequences included in the candidate sequence group was performed. The base length for determining the presence of cross-noid hybridization may be determined by the practitioner in the same manner as the self-complementary sequence.
各配列の二次構造の安定性の程度は、 例えば、 各々 の配列 が核酸と して存在する場合に、 それが どのよ う な二次構造を 取り 得るかを ¾ ΒίϊΗ的にまたは経験的データ に基づいて導き出 し、 それを基に程度の高低を判定する こ と が可能である。 例 えば、 分子内 2次構 ;生白 由エ ネ ノレギ一計算など、 それ自身公 知の手段を用いて、 各配列の二次構造の安定性の程度を算出 し、 その結果と実施者が予め定めた閾値と を比較する こ と に よって、 安定性の程度の高低を判定すればよい。  The degree of stability of the secondary structure of each sequence can be determined, for example, by empirical or empirical data on what secondary structure it can take when each sequence is present as a nucleic acid. It is possible to determine the degree of height based on it. For example, the degree of stability of the secondary structure of each sequence is calculated using a method known per se, such as intramolecular secondary structure; By comparing with a predetermined threshold value, the degree of stability may be determined.
上記の 3 つの項目、 即ち、 ( A ) 、 ( B ) および ( C ) に ついての解析は、 3つの項目全てを順不同で行つて よい。 または、 ( A ) または ( B ) の何れかと 、 ( C ) と を組み合 わせて順不同で行っても よい。 ( A;) 、 ( B ) よび ( c ) の全てを行 う場合には、 効率を考える と ( A ) ( C ) ( B ) の順番で行い、 ( a ) 、 ( c ) および ( b ) の何れかの結果 に該当 した時点で候補配列群よ り 排除する こ とが好ま しい。 The above three items, namely (A), (B) and (C) The analysis can be performed on all three items in any order. Alternatively, any of (A) or (B) and (C) may be combined in any order. (A;), (B) and (c) are all performed in the order of (A), (C) and (B) in consideration of efficiency, and (a), (c) and (b) It is preferable to exclude from the candidate sequence group when any of the above results is satisfied.
例えば 、 候補配列群に含まれる配列が 、 比較的短い配列、 例えば、 4 0 m e r 力 ら 3 0 m e r 以 である場 は 、 当該 For example, if the sequence included in the candidate sequence group is a relatively short sequence, for example, if the sequence is 40 m er to 30 m er or less,
( A ) と ( C ) についての解析を行う こと が好ま しい 一 J 候補配列群に含まれる配列が、 比較的長い配列である m A 例えば、 3 0 m e r カゝら 4 0 m e r 以上である場合には、It is preferable to analyze (A) and (C) .A sequence contained in one J candidate sequence group is a relatively long sequence mA.For example, when the sequence is 30 mer or more than 40 mer. In
( A ) と ( B ) についての解析を行う こ と が好ま しい 。 しか しながら 、 何れの場合も ( A ) ヽ ( B ) および ( C ) の解析 を全て行つても よい。 It is preferable to analyze (A) and (B). However, in any case, the analysis of (A) ヽ (B) and (C) may be all performed.
また、 正規直交化配列群と して得られた配列を 、 2以上で 連結して使甩する可能性のある場合、 連結に り 生じる配列 In addition, when there is a possibility that two or more sequences obtained as an orthonormalized sequence group may be used by concatenation, the sequences resulting from the concatenation
(以下、 連結配列 と称す) W 、て も少な く と も ( A ) 、(Hereinafter referred to as a concatenated sequence) W, at least (A)
( Β ) および または ( c )- の 3 つの項目 を解析する こ とが、 望ま しい 。 候捕配列群に含まれる配列についての解析の後に、 連結配列の解析を行 場合は 例えば、 ( A ) および また は ( Β ) および/または ( C ) について解析すればよい It is desirable to analyze the three items (() and / or (c)-. If analysis of the concatenated sequence is performed after analysis of the sequences included in the target sequence group, for example, it is sufficient to analyze (A) and / or (お よ び) and / or (C)
また、 最終的に得られた正規直交化配列を使用する際に、 相補鎖を使用する こ とが必要でめる場合、 例えば、 ハイ プリ ダイゼーショ ンゃ Ρ C Rな どの反応を行う場合には、 候補配 列群に含まれる配列の相補鎖につ ヽても同様にク ロ スハィプ リ ダイゼーショ ンについての解析を行 う こ と が好ま しい。 In addition, when it is necessary to use the complementary strand when using the finally obtained orthonormalized sequence, for example, when performing a reaction such as high predication ゃ Ρ CR, The same applies to the cross strands of the complementary strands of the sequences included in the candidate sequence group. It is preferable to perform analysis on redidation.
の場合、 相補鎖について も 上述の記載 と 同様に ( A )In the case of, the complementary strand is also (A) as described above.
( B ) およぴ /または ( C ) の項巨 を解祈すればよい Pray for (B) and / or (C)
作 ^、 に発生させた塩基配列の T mの平均値の度数分布は 正規分布に従 ラ 従つて、 一定の 曰度範囲で見つ力 る候補配 列の数は 、 範囲の中心が平均温度に 致する時に一番多い feつて 人為的にめる T m値を設定しヽ それに近づく よ う に 複数の核酸を HX計する よ り も、 本発明に従 つ よ う に無作為に 作出 した配列について平均温度を算出する方が、 よ り 多く の、 即ち 最大の候捕配列群を得る こ とができ る 。 即ち、 T m値 をどのよ う なァルゴリ ズムで計算 した と しても、 本発明に従 えば /Πη果と して得られる母集団 (即ち 粗配冽群) よび 候補配列群はヽ 従来の手段に比べてよ 多 < の候補を含む集 団、 曰い換えれば よ り 大きな集団と 'して得る こ とが可能で ある  The frequency distribution of the average value of the Tm of the base sequences generated in the ^ and ^ follows the normal distribution, and the number of candidate sequences that can be found within a certain remark range is the average temperature at the center of the range. We set the Tm value to artificially set the most fe when hitting the target, and randomly created it according to the present invention rather than HX-measuring multiple nucleic acids to approach it. Calculating the average temperature for the sequence will yield more, ie, the largest, set of target sequences. In other words, no matter what algorithm the T m value is calculated for, according to the present invention, the population (ie, the coarsely distributed group) and the candidate sequence group obtained as the / Πη result are ヽ conventional It is possible to obtain a group with more candidates than means, in other words, a larger group
また更に、 .最も大さな母集団を作つた後に 、 融解温度の平 均値土 1 σ に相当する温度範囲の閾値を基に 疋範囲に含 まれるか否かによつて集団を絞 り 込む と によ り 、 あつ と も 効率よ く 候補を絞り 込むこ とができ る 即ち 、 最初に ΡΊ.算 の少な < て済む Τ 値計算で配列を選択し 多く の計算時間 を必要とするク π スノヽイブリ ダィゼ一シ a ン特性の計算ゃ 2 次構造計算を いて行 う ので、 無駄な計算を行わずに済み  Furthermore, after creating the largest population, the population is narrowed down based on whether or not it is included in the range based on the threshold value of the temperature range corresponding to the average melting temperature of soil 1σ. By doing so, it is possible to narrow down the candidates very efficiently at first. That is, first, an array is selected in the value calculation with less ΡΊ. π Calculate the characteristics of the noise elimination function ゃ Since the secondary structure calculation is performed, unnecessary calculations are not performed.
/Ρη 木と して短い計算時間で目的とする正規直交化配列群を得 る とが可能と なる  / Ρη tree makes it possible to obtain the desired orthonormalized array group in a short calculation time
3 テジタル ンピユ ータにおける笋行 ( i ) 正規直交化配列群の設計方法 3 Shinko at the Digital Computer (i) Orthonormalized array group design method
―、、 、、、· また、 本発明に従 う 正規直交化配列群の設計方法はヽ y ン タノレコ ン ピュータ において実行されても よい。 例 ばヽ デジ タノレコ ン ピュータを利用する正規直交化配列群の 計方法は、 —,,,,... The method for designing a group of orthonormalized arrays according to the present invention may be executed on a computer. For example, the method of counting orthonormalized arrays using a digital computer is
( 1 ) 演算手段によ り 、 複数のラ ンダム配列についての融解 温度の平均値が算出され、 閾値が設定される こ と とヽ ( 2 ) 比較手段によ り 、 前記 ( 1 ) で設定された閾値と 、 ラ ンダム 配列の融解温度とが比較される こ と と、 ( 3 ) 前記 ( 2 ) の 比較の結果から、 選択手段によ り 、 当該閾値によ り制限され る一定範囲に入る配列のみが選択されて、 それによつて候捕 (1) The arithmetic means calculates the average of the melting temperatures of the plurality of random arrays, and sets the threshold value. (2) The comparing means sets the average value in (1). (3) from the result of the comparison in (2) above, the threshold value is compared with the melting temperature of the random sequence. Only the sequence is selected, thereby detecting
.、ム  ., Mu
配列群を与えるこ と と 、 ( 4 ) 判定手段によ り 、 記 ( 3 ) で与えられた候補配列群に含まれる塩基配列について 夫々 が独立して反応する配列であるか否かが判定されヽ その ^口 Ϊ¾ ら 、 独立 して反応 しないと判定された配列が前記候捕配列 群から排除され、 正規直交化配列群が形成される *> - _ と と .、 を 具備すればよい。 · By providing the sequence group, (4) the determination means determines whether or not each of the base sequences included in the candidate sequence group given in (3) is a sequence that independently reacts.口 The sequence that is determined not to react independently from the target group is excluded from the candidate sequence group and an orthonormalized sequence group is formed. ·
また或いは、 デジタルコ ン ピュータ を利用する正規直交化 配列群の設計方法は、 ( 1 ) 塩基配列無作為作出手段によつ てラ ンダム配列が与え られる こ と と、 ( 2 ) 前記 ( 1 ) によ り 与えられたラ ンダム配列の融解温度が、 演算手段によつて 与 . られ、 その融解温度が記憶手段に記憶される - と と 、 Alternatively, a method for designing an orthonormalized sequence group using a digital computer includes the steps of (1) that a random sequence is provided by means for randomly generating a base sequence; The melting temperature of the random sequence given by is given by the arithmetic means, and the melting temperature is stored in the storage means.
( 3 ) 前記 ( 1 ) と前記 ( 2 ) の繰り 返しによ り 与 られた 複数の融解温度を基に、 演算手段によ って融解温度の平均値 が与えられる こ と と 、 ( 4 ) 前記 ( 3 ) によ り 与えられた融 解温度の平均値を基に演算手段が閾値を与え、 比較手段が 閾値の温度と、 塩基配列無作為作出手段によって与え られる ラ ンダム配列の融解温度 と を比較する こ と と 、 ( 5 ) 前記(3) An average value of the melting temperatures is given by a calculating means based on a plurality of melting temperatures given by repeating the above (1) and (2); (4) The calculating means gives a threshold based on the average value of the melting temperatures given by the above (3), and the comparing means gives a threshold. Comparing the threshold temperature with the melting temperature of the random sequence provided by the base sequence random generation means, and (5)
( 4 ) の比較の 果 に 、 当該閾値によ り 制限される範囲 内に融解温度を有する塩基配列を s 候捕配列と して記憶手 が記憶する こ と と 、 ( 6 ) 刖 S己 ( 5 ) に い し された候 補配列群について 、 判定手段が以下の ( A ) から ( C ) の事 項につレ、ての判定を行 つ と ( A ) 白 己相補配列を有する 配列でめ るが否か 、 よぴ /または ( B ) 一次構造の安定性 の程度の高低、 並びに ( C ) ク スノヽィプ V ダィゼ ショ ン を有する配列であるか否か ; ( 7 ) 刖記 ( 6 ) の判定の結果 を Sに 、 選択手段が選択するべき配列を選択する こ と によつ て、 正規直交化配列群を BX計する こ と と、 を具備すればよい。 As a result of the comparison of (4), it is found that the base sequence having a melting temperature within the range limited by the threshold is stored by the memory operator as the s-spectacle sequence, and (6) 刖 S 5) For the candidate sequence group obtained in (1), the judgment means (A) to (C) below make a judgment in (A) that the sequence has a white self-complementary sequence. And (B) the degree of stability of the primary structure, and (C) whether or not the sequence has a knosipip V dimension; (7) 6) BX measurement of the orthonormalized array group by selecting the sequence to be selected by the selecting unit as the result of the determination in 6) and selecting BX.
また 、 si f†された正規直交化配列群は、 それを表示するた めのプリ ンターおよびディ スプレイな どの出力手段によ り 出 力されて あ よ く 、 また 、 着脱可能な媒体に記録されて提供さ れて よい。  In addition, the orthonormalized array group that has been sifted may be output by output means such as a printer and a display for displaying the array, and may be recorded on a removable medium. May be provided.
( i i ) デジタルコ ン ピュータ  (ii) Digital computer
本発明に従つ設計方法を実行するために使用され得るデジ タルコンピュ一タの例を図 1 に示す。 本発明に従つて使用 さ れ得るデジタル m ン ピュ ータ 1 は、 少なく と も 、 C P Uな ど の処理部 2 、 プ グラムおよぴテーブル並びに処理結果な ど の情報を記録するための捕助記憶装置 3 、 並ぴに情報を入力 するためのキ一ホ ドおよぴマウス等の入力部 4 、 情報を外 部に出力するための出力部 5 を具備し、 それらは互いに接続 されていればよい また、 それ自身公知の一般的な何れのデ W An example of a digital computer that can be used to implement a design method according to the present invention is shown in FIG. The digital m-computer 1 which can be used in accordance with the present invention has at least a processing unit 2 such as a CPU, a program and a table, and an aid for recording information such as a processing result. It has a storage device 3, a keyboard for inputting information in parallel and an input unit 4 such as a mouse, and an output unit 5 for outputting information to the outside, which are connected to each other. Any general data known per se W
21 ジタノレコ ン ピュータ を利用 しても よい o 21 You may use a computer
補助記憶装置 3 には 、 当該デジタル ン ピュ一タに正規直 交化配列群の設計方法を実行させるためのプ Π グフム 、 例え ば、 ランダム配列を生成させるためのプ Π グラム 、 並びに独 立して反応する配列である力 ; g:力 を 認するためのプ口 グラ ム、 例えば、 自 己相補配列の存在を確き  The auxiliary storage device 3 includes a program for causing the digital computer to execute a method for designing a normal orthogonal array, for example, a program for generating a random array, and an independent program. G: a program to recognize the force, for example, confirm the existence of a self-complementary sequence
P' するためのプ口 グラ ム、 ク ロ ス ノヽイ ブ リ ダィ ゼーシ ョ ンの存在を確認する た めの プ口 グラ ム、 および分子内二次構造自 由ェネルギ一の計算を 行ってエネノレギ一の高低を判定するためのプ P グラムな どが 格納される。 また、 当該捕助記憶装置 3 には 、 乱数と塩基を 対応付けるためのテ ブル 、 および独 して反応する配列で あるか否かを判定するために数値と判定結果を対応付けるた めのテ一プルな ど、 所望に応じた情報が格納されても よい。  The program for P ', the program for confirming the existence of cross-noisy hybridization, and the calculation of the intramolecular secondary structure free energy Stores programs for judging the level of the enolen regi. The auxiliary storage device 3 includes a table for associating a random number with a base, and a table for associating a numerical value with a determination result in order to determine whether or not the sequence reacts independently. For example, information as desired may be stored.
当該デジタルコ ンピュ ' ~タの補助記憶装置 3 には、 例えば、 The auxiliary storage device 3 of the digital computer includes, for example,
T mの平均値を算出するためのプロ グラム .、 ランダム配列作 出のためのプロ グラムや、 乱数と塩基を対応付けるテ一ブル、 自 己相補配列の判定を検出ためのプロ グラム 、 ク 口スハィブ リ ダイゼ シ ョ ンの存在を判定するためのプ グラム 、 分子 内の二次構造の安定性の程度を判定するためのプ口 グラムな どが、 所望に応じたファィル毎に格納されて も よい。 A program for calculating the average value of Tm., A program for creating random sequences, a table for associating random numbers with bases, a program for detecting the judgment of self-complementary sequences, and mouth shaving. A program for judging the presence of redidation, a program for judging the degree of stability of the secondary structure in the molecule, etc. may be stored for each desired file. .
上述した演算手段 、 比較手段、 選択手段ヽ 記 手段および 判定手段、 並びに塩基配列無作為作出手段による処理は、 当 該処理部 2 において 、 捕助 己憶装 3 に予め記録されたプロ グラムおよび必要な情報に基づいて行われてよい o  The above-described processing by the arithmetic means, the comparison means, the selection means, the description means and the determination means, and the base sequence random creation means is executed by the processing unit 2 in the form of a program previously stored in the trapping memory 3 O may be based on sensitive information
また 、 所望に応じて 、 当該デジタル ン ピュ一タは 、 情報 を一時的に格納するための R A M (rando m acces s memory) ¾ί 具備してあ よ く ヽ プ グラム等に基づく 前記 C P Uの指示に 従って画像ァ一タ を生成する画像処理部な どを更に具備 して も よい。 In addition, if desired, the digital computer may store the information (Random acces memory) for temporarily storing the image data. The image processing unit further includes an image processing unit that generates an image data according to the instruction of the CPU based on a program or the like. You may do it.
( i ii ) 処理手順  (i ii) Processing procedure
図 2 に示 したフ Π チャ一 ト を用いて、 デジタノレコ ンビュ ータ によ る正規直交化配列群の設計方法の大まかな手続の流 れ'の例を説明する ο  Using the features shown in FIG. 2, an example of the general procedure flow of a method for designing an orthonormalized array group using a digital recorder will be described.ο
( 2 a ) オペレ一タ一の入力部 1 5への入力によ り 、 本装 置に対して設計開始の指示が出される。 この と きオペレータ 一は反応の条件に関する情報を入力 しても よい。 これ らの情 報はー且補助記 装置 3 または R A Mに格納されても よい。  (2a) An input to the input unit 15 of the operator gives an instruction to start the design to the device. At this time, the operator may input information on reaction conditions. These pieces of information may be stored in the auxiliary recording device 3 or the RAM.
( 2 b ) ォぺレ タ によ り 開始の指示が出される と、 処理 部 2 は、 予 •dp- め設 され補助記憶装置 3 に記憶されたラ ンダム 配列作出のためのプ グラムに従って、 塩基配列無作為作出 手段に対してラ ンダム配列を作出する よ う に指示する 更に、 処理部 2 は 、 演算手段に対して、 予め設定され補助記憶装置 (2b) When an instruction to start is issued by the operator, the processing unit 2 executes a program for creating a random array stored in advance in the dp- Instructs the base sequence random generation means to generate a random sequence. Further, the processing unit 2 provides the arithmetic means with a preset auxiliary storage device.
3 に Li '1恩されたラ ンダム配列の T mの平均値を算出するため のプロ グラムに従つて 、 Τ mの平均値を算出 し、 それを基に 閾値を与え れを補助記 装置 3 または R A Mに格納する よ う に指示する In accordance with the program for calculating the average value of T m of the random sequence benefited from Li′1, the average value of Τ m is calculated, and a threshold is given based on the calculated value. Or instruct it to store in RAM
( 2 c ) 2 b で閾値が与え られる と、 処理部 2 は、 予め設 定され補助 5し†思装置 3 に.記憶されたラ ンダム配列作出のため のプ 、 ロ グラ ムに従つて 、 ラ ンダム配列生成手段に対して、 2 b で与え られた閾値によ り 制限される範囲の T mを有する ラ ンダム配列を選別する よ フ に指示する。 条件に 合する選別 されたラ ンダム配列は、 候 配列と して一旦 R A Mに格納さ れる。 (2c) When the threshold value is given in 2b, the processing unit 2 sets a preset and auxiliary device 3 in the auxiliary device 3.In accordance with the stored program and program for creating a random array, For the random array generation means, a laser having a range of Tm limited by the threshold given by 2b Instructs to select random sequences. The random array selected according to the conditions is temporarily stored in the RAM as a weather array.
( 2 d ) 候補配列が生成される と、 C P U 3 は 、 予め設定 され捕助 Bし 'fe装置 3 に記憶された 自 己相捕配列の存在を確 w& するためのプ グラムに従つて、 生成された'ラ ンダム配列に おける 自 己相補配列の存在の i¾無を判定する よ Ό に指不す 。 自 己相補配列の存在 しないランダム配列はヽ 候補配列と して 一旦補助 Bし 装置 3 または R A Mに格納される 2 c と 2 d は充分な数のラ ンダム配列または候捕配列が得られるまで、 ' 繰り 返して実行される  (2d) When the candidate sequence is generated, the CPU 3 follows a program for ascertaining the existence of the self-trapping sequence stored in the pre-set and assisted B-fe device 3 according to a preset program. In order to judge the existence of the self-complementary sequence in the generated 'random sequence', it is not necessary to judge. The random sequence having no self-complementary sequence is used as a candidate sequence.It is once assisted and stored in device 3 or RAM.2c and 2d are used until a sufficient number of random sequences or prospective sequences are obtained. 'Executed repeatedly
( 2 e ) 充分な数のラ ンダム配列および /または候捕配列 が生成される と 、 次に処理部 2 は 、 予め設定され補助記憶装 置 3 に記憶されたク ロ スノヽィプリ ダイゼ一シ 3 ンの存在を確 認するためのプ口 グラムに従つて 、 判定手段に対して 、 補助 (2e) When a sufficient number of random arrays and / or target arrays have been generated, the processing unit 2 then proceeds to the cross-noise pre-daily processing set in advance and stored in the auxiliary storage device 3. According to the program for confirming the existence of the
Bし 'fe ¾· 3 または R A Mに格鈉された候補配列における ク 口 スハイブリ ダィゼ一シヨ ンの存在の有無を判定する よ に指 示し、 更に、 ク 口スハィプジ ダイゼーショ ンが存在しないラ ンダム配列を 候補配列と して補助記憶装置 3 または R A M に格納する よ に指示する Instruct the system to determine the presence or absence of the mouth hybridization in the candidate sequence stored in B or 'fe¾3 or RAM, and further determine the random sequence in which no mouth swap is present. Instructs storage in auxiliary storage device 3 or RAM as a candidate sequence
( 2 f ) 次に 、 処理部 2 は 、 予め設定され補助 し 装置 3 に 思 dれた分子内二次構 自 由ェネルギ の計算を行つて エネノレギ の高低を判定するためのプ P グラムに従つて 、 判 定手段に対して 、 補 '|思 置 3 または R A Mに格納された. 候捕配列にね'ける分子内二次構造自 由ェネルギ の計 を行 い、 予め設定され補助 し 'I'Ws装置 3 に 憶されたエネルギ と その高低を対応付ける判定基準と なるテ一ブルに従つてヽ 高 低を判定する よ う に指不し 、 更に 、 分子内二次構造自 由ェネ ルギ一の低いラ ンダム配列は、 選別され候補配列と して補助(2f) Next, the processing unit 2 performs a calculation of the intramolecular second-order free energy, which is set in advance and is considered by the auxiliary device 3, and follows a program for judging the level of the enenoregi. Therefore, for the judgment means, it was stored in the | supposition 3 or in the RAM. The intramolecular secondary structure free energy to the target array was calculated. In addition, it is not necessary to judge the height according to a table which is set and assisted in advance and correlates the energy stored in the 'I'Ws device 3 with its height. The low random sequence of secondary structure free energy is selected and assisted as a candidate sequence.
=α 捨 · = α discarded ·
置 3 または R A Mに格納される よ に指不一ヲ  Finger 3 or stored in RAM
( 2 g ) 処理部 2 は 、 当該プロ グラ ムに従って、 2 C から (2 g) The processing unit 2 starts from 2 C in accordance with the program.
2 f の手続を経て、 最終的に選別され残つた候補配列を正規 直交化配列群ヽ 即ち、 正規直交化配列の集合を所望の出力手 段から出力する よ う に指示をする' After the procedure of 2f, the finally selected and remaining candidate sequences are orthonormalized array group ヽ, ie, instruct to output a set of orthonormalized arrays from the desired output means.
( 2 ) 2 g において出力手段から正規直交化配列群が出 力され 、 本方法は終了する  (2) At 2 g, the orthonormalized array group is output from the output means, and the method ends.
上述ではヽ 2 a においてォペレ タ一が入力する反応条件 に関す 報は 、 ラ ンダム配列の長さ 、 ラ ンダム配列の数、 候補配列の数 、 核酸の種類 、 自 己相補配列の有ノハ、を判定する ための判定基準 、 ク 口 スノヽイブリ ダィゼ一..シ 3 ンの存在を判 定するための判定基準 、 4 よび/7または分子内一次構造自 由 ェネノレギ一の高低を判定するための判定基準な どの情報であ つてよ < 、 またはその他の条件な どの情報であつてよい。 或 いは、 これらの情報は 、 2 a においてオペレ タ一によ り入 力されるのではなく 、 予め補助記憶装置 3 に記 された種々 のプロ グラ ムに含まれても よ く 、 または幾つかの条件を組み 合わせて選択でさ る よ う に条件を めて対応付け られたテー m In the above, information on the reaction conditions input by the operator in ヽ 2a is based on the length of the random sequence, the number of random sequences, the number of candidate sequences, the type of nucleic acid, and the existence of self-complementary sequences. Criteria for judging, criterion for judging the presence of cinnamon..Criteria for judging the presence of sine, and for judging the level of 4 and / or 7 or the intramolecular primary structure Information such as criteria may be <or information such as other conditions. Alternatively, this information may not be entered by the operator at 2a, but may be included in various programs pre-recorded in the auxiliary storage device 3, or may be any number. The conditions associated with the conditions so that selection can be made by combining these conditions.
ブルと してて格納されていても よい May be stored as
上述した例では、 2 b においてランダム配列を生成する毎 2 d にねける 自 己相補配列を排除し、 2 b と 2 d を繰り 返 すとい う方法を示したが、 2 b における所望の数のラ ンダム 配列を全て作出 した後に、 2 d に進んでも よい。 また、 2 d の後に、 必要に応じて 2 b に戻っても よい。 In the above example, every time a random sequence is generated in 2b, the self-complementary sequence that is bounced to 2d is eliminated, and 2b and 2d are repeated. Although the method has been described, the process may proceed to 2d after all the desired number of random sequences in 2b are created. After 2 d, you may return to 2 b if necessary.
また、 図 3 の例に示すよ う に手続を しても よい。 即ち、 設 計を開始 ( 3 a ) し、 T mの平均値の算出 ( 3 b ) の後、 ラ ンダム配列を生成 ( 3 c ) し、 自 己相補配列を排除 ( 3 d ) し、 更にク ロ スハイ ブリ ダィゼーシ ヨ ンをチェ ック ( 3 e ) する。 以上の 3 a カゝら 3 e までは、 図 2 に示 し上述した処理 手順によ り 行い、 分子內二次構造自 由エネルギーに関する検 討を行わずに正規直交配列の集合を与えて ( 3 f ) .、 終了 ( 3 g ) しても よい。 このよ う な方法は、 得よ う とする正規 直交配列の配列が短い場合に特に有用であ り 、 設計時間が短 縮でき る。  Procedures may be performed as shown in the example of FIG. That is, the design is started (3a), after calculating the average value of Tm (3b), a random sequence is generated (3c), and the self-complementary sequence is eliminated (3d). Check (3e) the cross-hybridization. The above 3a to 3e are performed by the processing procedure shown in Fig. 2 and described above, and a set of orthonormal arrays is given without considering the molecular-secondary structure free energy ( 3 f)., End (3 g). Such a method is particularly useful when the sequence of the orthonormal array to be obtained is short, and the design time can be shortened.
また、 図 4 に示す例のよ う に手続を しても よい。 即ち、 設 計を開始 ( 4 a ) し、 . T mの平均値の算出 ( 4 b ) の後、 ラ ンダム-配列の-生成 ( 4 c ) し、 自 己相補配列の.排除を行わず に、 ク ロ ス ノヽィ プ リ ダイゼーシ ヨ ンをチェ ッ ク ( 4 d ) を し 次に分子內二次構造自 由エネルギーに関する検討行い ( 4 e ) を行い、 正規直交配列の集合を与えて ( 4 f ) 、 終了 ( 4 g ) しても よい。 各々 の処理は上述した処理と同様に行 えばよい。  The procedure may be as shown in the example in FIG. That is, the design is started (4a), the average value of Tm is calculated (4b), the random sequence is generated (4c), and the self-complementary sequence is not excluded. Then, we check the cross-noid predication (4d), and then examine the free energy of the molecular-secondary structure (4e), and give a set of orthonormal arrays. (4 f) or end (4 g). Each processing may be performed in the same manner as the processing described above.
また、 図 5 に示す例では、 設計を開始 ( 5 a ) し、 T mの 平均値の算出 ( 5 b ) の後、 ラ ンダム配列の生成 ( 5 c ) し た後に、 自 己相捕配列の排除 ( 5 d ) と、 ク ロ スハイブリ ダ ィゼーシヨ ンのチェ ック ( 5 e ) と、 分子内二次構造自 由ェ ネルギーに関する検討 ( 5 f ) と を、 実施者の所望に応じて 順不同で行い、 正規直交配列の集合を与えて ( 5 g ) 、 終了In the example shown in Fig. 5, after starting the design (5a), calculating the average value of Tm (5b), generating a random array (5c), Elimination (5d), cross-hybridization check (5e), and intramolecular secondary structure freedom The study on energy (5f) and are performed in any order as desired by the implementer, and a set of orthonormal arrays is given (5g).
( 5 h ) しても よい (5 h)
また、 図 2 力 ら図 5 の何れに示す例においても 、 所望に応 じて 、 例えば、 候補配列の数が予め疋めた数よ り も少な く な つ■■た場合な どに、 ラ ンダム配列の生成に戻 り 処理を行っても よい □  In addition, in any of the examples shown in FIG. 2 to FIG. 5, if desired, for example, when the number of candidate sequences becomes smaller than the number of the previously-listed sequences, Returning to random sequence generation may be performed □
また、 上述の何れの例においても、 2 c ゝ 3 c 、 4 c およ び 5 C (以下、 単に c と記す) では、 2 〜 5 b (以下、 端に b と記す) の平均値を基に閾値が与え られた後ヽ 当該閾値に よ り 制限される範囲の T mを有するか否力 で選別され、 候補 破裂が与え られる。 例えば、 図 6 に示すよ う に 乱数が発生 In each of the above examples, when 2 c ゝ 3 c, 4 c and 5 C (hereinafter simply referred to as “c”), the average value of 2 to 5 b (hereinafter referred to as “b” at the end) is calculated. After a threshold value is given to the base, it is selected based on whether or not it has a Tm within a range limited by the threshold value, and a candidate burst is given. For example, random numbers are generated as shown in Fig. 6.
( 6 c 1 ) され、 粗配列を得た後に、 τ m値による選另 IJ ( 6 c 2 ) が行われる。 しかしなが ら、 この 続は 、 図 7 に示す よ う に、 乱数が発生 ( 7 c 1 ) された %に、 予め定めた G(6c1), and after obtaining a coarse array, selection IJ (6c2) based on the τm value is performed. However, this continuation is, as shown in FIG. 7, a percentage of the random number generated (7 c 1),
C % フ ィ ゾレタ "による選別 ( 7 c 2 ) を行い 、 その後に'† m 値による; 1 別 ( 7 c 2 ) を行つても よい 。 G C %フイ ノレター はラ ンダム配列に含まれる G C の%がある範囲 、 例えば、 4(%), Followed by 'Cm value; 1 (7c2). GC% final letter is the GC number included in the random sequence. % Is in a range, for example, 4
0 % 〜 7 0 % あ 配列以外は除外すればよい 即ち、 無作 為に作出 されたラ ンダム配列の T m値を求める に、 配列に 含まれる塩基 G Cの %によってラ ンダム配列を選別すればよ レ、 その後 、 T m値による選別 ( 7 c 3 ) を行ラ 。 このよ う な手続を行 う こ と によ り 、 設計時間の短縮を行う こ とが可能 でめる。 0% to 70% A Other than the sequence may be excluded.In other words, to determine the Tm value of a randomly generated random sequence, if the random sequence is selected based on the% of base GC contained in the sequence, Then, sorting by Tm value (7c3) was performed. By performing such a procedure, the design time can be reduced.
また、 乱数を発生させてランダム配列を得て、 それを T m 値で >· 選別して候補配列を得て、 それに更なる選別を行 Ό こ と によ つて正規直交化配列を得る場 、 乱数によ り 得られる数 値と塩基と の対応付が 1 対 1 であれぱ、 所望する全ての選別 を終了 した後に、 数値から塩基への置換が行われて、 取終的 に正規直交化配列を得ても よレ、 即ち、 あ らカゝじめ、 どの値 をどの塩基に対応させるかを決めてお さ えすれぱ、 どの段 階で塩基に置き換 ても よい。 伹し 、 τ m値および d G値な どは 、 塩基の配列に対して意味をなすものである ので 、 必ず 対応関係が必要になる点を考慮する とが重要である Also, a random number is generated to obtain a random array, When a candidate sequence is obtained by screening by value and an orthonormalized sequence is obtained by performing further screening on the candidate sequence, the correspondence between the number obtained by random numbers and bases is one-to-one. Even if it is 1, after all the desired selections have been completed, the values may be replaced with bases to obtain an orthonormalized sequence in the end, i.e., Once you have decided which value corresponds to which base, you may substitute the base at any stage. However, since the τm value and dG value make sense for the base sequence, it is important to consider that a correspondence is always required.
以上の方法は、 本発明の 1態様につレ、ての'幾つ力 の例を示 したものであるから 、 本発明に従う方法は、 上記の例に種々 の変更を行っても よ く 、 本発明に従 う 限り 、 更なる手続を追 加しても 、 省略を行つても よい  The above method shows an example of how many powers according to one embodiment of the present invention.Therefore, the method according to the present invention may be variously modified to the above-described example. Additional procedures may be added or omitted as long as it follows the invention
4 . 基本セ ッ ト  4 Basic set
以下に 、 本発明に従 う正規直交化配列群の設計方法を するための基本セ ト とな 計算の例を説明する この Ρ Γ Ρ("算は、 デジタノレコ ンピュ一タにねける設計においても またそれ以外の設計において使用する こ と が可能である  In the following, an example of calculation as a basic set for designing the orthonormalized array group according to the present invention will be described. This Ρ Γ "(" calculation is also applied to a design for digital computer. Can be used in other designs
( 1 ) 融解温度の平均値 (即ち 、 中心融解温度) の算出 正規直交化配列を設計する場合 、 その配列の長さは最終的 に得よ う とする核酸やその使用 巨的 (例えば、 どのよ な反 応を行う かな ど) 、 合成コス 卜 よび Zまたはどの程度の種 類の配列が必要かなどを参考に決定すればよい。  (1) Calculation of average melting temperature (that is, central melting temperature) When designing an orthonormalized sequence, the length of the sequence is determined by the nucleic acid to be ultimately obtained or its use Such a reaction may be performed), the synthesis cost and Z or how many types of sequences are required may be determined.
例えば 、 D N Aコ ンピュ ―ティ ングに本発明に従 う正規直 交化配列を使用する場合に、 1 つの正規直交化配列群に 1 つ の計算要泰 (例 ばヽ ノヽ ミ ノレ ト ン経路問題の場合には都市) を表現させ 、 それらを用いて計算 - 反応を行 う と を考える。 その場 Π に 正規直交化配列からなる核酸自身をヽ 磁性ビ 一ズに固定した相補配列の核酸でァフ ィ ニティ一セパレーシ ヨ ンで分離した り 、 正規直交化配列からなる核酸白身を P CFor example, when the orthonormalized sequence according to the present invention is used for DNA computing, one orthonormalized sequence group may be used. Let us express the calculation summary (for example, city in the case of the ヽ ヽ ノ 経 路 経 路 問題 の 問題 問題 計算) and use them to calculate and react. In that case, the nucleic acid consisting of the orthonormalized sequence itself is separated by affinity separation with the nucleic acid of the complementary sequence immobilized on a magnetic bead, or the nucleic acid white consisting of the orthonormalized sequence is converted to a PC.
Rプライマ に用いて検出およぴ /または増幅反応した りす る こ と を考えるな らば 、 計算要素に対応する核酸 、 例えば、Considering detection and / or amplification reactions using R primers, nucleic acids corresponding to computational elements, for example,
D N Aの長さは 、 プライマ一に適する 1 5 m e r から 3 0 m e r であればよい とが自ずと分かる o Naturally, it is sufficient that the length of the DNA is between 15 m er and 30 m er suitable for the primer.
粗配列である ラ ンダム配列を生成し 、 生成されたそれぞれ のラ ンダム配列の T m値を計算 しヽ それを記録する と をデ ジタノレコ ン ピュ一タ に実行させるためのプロ グラムを作成し ても よい のと さ丁ータ と して残すのは少な < と あ T m値 だけでよい σ Τ m値の計算アルゴ V ズムは、 後に候補配列を 生成する と さに用いるの と 同様の計算式を用いてよい 。 例え ば 、 サ ン タ ルチ ア の ノヽ。 ラ メ ー タ ー(J. S taLucia, Jr. "A uniiied view of polymer, dumbbell, and oligonucleotide DNA nearest-neighbor thermodynamics." Proc. Natl. Acad. Sci. USA, 95: 1460-1465,· (1998))を利用 して計算 しても よい。 また、 こ の計算では、 T m値だけでなく 計算元の配列も出力 しておい て、 後の T m値計算に補助的に用いても よい。 総数で 1 0 0 0 0個程度を計算 し、 平均値を求める。 こ の平均値周 り で T m値を制限して候補を生成する と 、 も っ と も多く の候補配列 が生成でき る'。  Generate a random array that is a coarse array, calculate the Tm value of each generated random array, record it, and create a program to execute on a digital computer. The algorithm for calculating the σ Τ m value is the same as the calculation used for generating the candidate sequence later. Expressions may be used. For example, the knowledge of the local community. (1998) J. StaLucia, Jr. "A uniiied view of polymer, dumbbell, and oligonucleotide DNA nearest-neighbor thermodynamics." Proc. Natl. Acad. Sci. USA, 95: 1460-1465, (1998 )) May be used for calculation. In this calculation, not only the T m value but also the array of the calculation source is output, and it may be used as an auxiliary for the calculation of the T m value later. Approximately 1 000 pieces are calculated in total, and the average value is calculated. If candidates are generated with the Tm value limited around this average value, most candidate sequences can be generated '.
( 2 ) ラ ンダム配列の生成と候捕配列の選別 上記の ( 1 ) で決めた T m値を に閾ィ直を設定し その範 囲内の T m値を有する無作 な候補配列を得る 例えば 、 乱 数を発生 し、 塩基に置換する こ と によ り 粗配列である ラ ンダ ム配列 作出 し 、 その T m値を求め 閾値と比較 し 閾値の 範囲内の融解温度を有する配列を選択し 候補配列と して群 を作ればよい。 (2) Generation of random arrays and selection of target arrays The threshold value is set to the Tm value determined in (1) above to obtain a random candidate sequence having a Tm value within the range.For example, generating a random number and substituting it with a base A random sequence, which is a coarser sequence, is created, its Tm value is calculated and compared with a threshold, and a sequence having a melting temperature within the range of the threshold is selected to form a group as a candidate sequence.
それ自身公知の T m値を得るための と して、 N e a r e s t N e i g h b o r 法を使用 してよレ、 。 この方法では、 隣接塩基の関係によ り T m値が定まる 或いは、 G C含量か ら計算 しても、 近似的に T m値は計算でき る  To obtain the Tm value known per se, use the NearestsNeighbor method. In this method, the Tm value is determined by the relationship between adjacent bases, or the Tm value can be calculated approximately from the GC content.
例えば、 G C含量を 4 0 %〜 7 0 %の範囲に収まる よ つ に 制限しなが らラ ンダム配列を発生 し 、 発生されたランダム配 列について、 例えば N e a r e s t N e i g h b o r 法に よって T m値を計算 しても よい。 更にヽ 計 された T m値と 閾値を比較し、 その結果、 所定の範囲に収まる ものを侯捕配 列と して出力する。 また、 例えば、 ラ ンダムに配列を発生さ せ る た . め に 、 それ 自 身公知 の メ ルセ ンヌ の ツ イ ス タ ー For example, a random sequence is generated while restricting the GC content to be within a range of 40% to 70%, and the Tm value is calculated for the generated random sequence by, for example, the Nearest Neighbor method. May be calculated. Furthermore, the calculated Tm value is compared with the threshold value, and as a result, those that fall within a predetermined range are output as a horizontal array. Also, for example, in order to generate a random sequence, a self-known Mersenne Twister is used.
、丄 vlersenne Twister;例えば 、 W e b 上からダゥンロー ドする こ と が可能である , 丄 vlersenne Twister; for example, it is possible to download from Web
http :// www.math.keio. ac.jp/~matumoto/mt.html J な ど rlj个生能な 擬似乱数関数を用いても よい。 http://www.math.keio.ac.jp/~matumoto/mt.html A rlj-independent pseudorandom function such as J may be used.
( 3 ) 自 己相補配列の排除  (3) Elimination of self-complementary sequences
T m値が一定範囲に収まった候補配列が、 自 己相補的な、 例えば制限酵素の認識配列の よ う なパ リ ン ドロ ミ ッ ク配列 (一般的には、 回文配列と も称す) を持つ場合は、 分子内構 造を と る。 パ ン ド、 π ^ クク配列である こ と は、 容易に調ベ る こ と が可能でめるので、 白 己相補性の確認に好ま しく 使用 さ 1る。 候補配列群の中にパ リ ン ド口 ミ ッ ク配列を含む配列 が合った ¾口 候補配列群から排除する Candidate sequences with Tm values within a certain range are self-complementary, eg, palindomic sequences such as restriction enzyme recognition sequences (generally also called palindromes). If you have Take the structure. Since the band and the π ^ array can be easily obtained, they are preferably used for checking self-complementarity. A sequence that includes a mixed-mouth mix sequence is included in the candidate sequence group.
更なる 自 己相捕性を確認する手段を以下に説明する 。 例え ば、 配列の塩基数が奇 '数な らば、 核酸配列の 5 ' 端塩基力 ら 中央塩基までと 中央塩基から 3 ' 端塩基までの配列を比較 し、 例えば、 6塩基以上連続して配列が相補的な場合は、 即 ち、 マツチする場合は 、 自 己相捕性を有する と判定する。  The means for further confirming self-trapping will be described below. For example, if the number of bases in the sequence is odd, compare the sequence from the base at the 5 'end of the nucleic acid sequence to the center base and the sequence from the base to the 3' end base of the nucleic acid sequence. If the sequences are complementary, immediately, if they match, they are determined to have self-capture.
例えば 2 5塩基の配列を設計する場合を考える。 図 8 を 参照されたい 例えば 1 つのラ ンダム配列力 S 「 a t g c a t g c a t g c a t g c a t g c a t g c a 」 である とする。 こ の配列を次のよ う な 2つの部分に分ける。 1 3塩基目 の中 央配列を境に 5 端から 1 3塩基目までを部分配列 Aと し、 For example, consider the case of designing a sequence of 25 bases. See FIG. 8 For example, suppose that one random array force S is “atgcatgcatgccatgccatgcat”. This array is divided into the following two parts. From the 5th end to the 13th base from the middle sequence of the 13th base, the partial sequence A is defined as
1 4塩基目 から 2 5塩基目 の 3 ' .端までの部分配列 B とする。 この部-分配列 Aを 6一塩基ずつ 1 塩基ずら しながら読みと る と、 こ の よ う な 2 5塩基の士 ¾县ム口 には 6 種類が得られる。 読み取ら れた 1 単位には 6塩基含まれ 、 これを 6 タプルと呼ぶこ と に する。 A partial sequence B from the 14th base to the 3 '. If this partial-sequence A is read while shifting one base by six bases, six kinds of such bases with 25 bases are obtained. One unit read contains six bases, which will be referred to as six tuples.
残 り の半分の 5 ' 端から 1 4塩 から 2 5塩基目 までの 配列は、 まず 、 5 , と 3 , の向き を変 ヽ こ の中に前述 した For the other half of the sequence from the 14 'salt to the 25th base from the 5' end, first change the orientation of 5, and 3, as described above.
6種類の 6 タプルと相補的な配列が · - ない 、 >·_ と を 1 塩基ずつず ら しなが ら調ベる ^ _ 6 タプルと兀全にマツチする配列 かめった 口 には 、 そのラ ンダム配列は 、 自 己相捕的な配列 だと判断する ·>- のタプルの長さは 、 6 タプルに限定する も のではない。 即ち、 どのよ う な基準で自 己相捕だと判定する かによつて、 この値は変えても よい。 There is no sequence complementary to the 6 types of 6 tuples.- The sequence of> __ is shifted by one base at a time. The random array is judged to be a self-trapping array.The length of the tuple of>-is limited to 6 tuples. Not. In other words, this value may be changed depending on what criteria determine that self-trap is determined.
上記の例では、 6塩基連続してマッチする配列があるか否 かで自 己相補性を判定した。 しかしながら、 本発明はこの条 件に限定する も のではなく 、 6塩基以外の数、 例えば 、 3 、 In the above example, self-complementarity was determined based on whether there was a sequence that matched six consecutive bases. However, the present invention is not limited to this condition, and the number of bases other than 6 bases, for example, 3 or
4 、 5 、 7 、 8 、 9若しく は 1 0塩基連続またはそれ以上の 連続マ チがあるか否かで判定しても よい。 或いは 、 他の条 件 、 例 ば、 対照する配列の長さ に占める相補塩基の割合を 閾値と しても よい。 即ち、 予め一定の条件を設定しておき それを閾値と して自 相捕的な配列を排除すればよい The determination may be made based on whether there is a continuous match of 4, 5, 7, 8, 9 or 10 or more consecutive bases. Alternatively, the threshold value may be another condition, for example, the ratio of the complementary base to the length of the sequence to be compared. In other words, it is sufficient to set a certain condition in advance and use it as a threshold to eliminate auto-adoptive sequences.
以上の方法を、 自 己相補性の判定方法の第 1 の例とする と 以下のよ う な よび第 3 の方法も同様に 自 己相補性を判 Taking the above method as the first example of the method of determining self-complementarity, the following and third methods similarly determine self-complementarity.
- 定するために用いる とが可能である。  -Can be used to determine
図 9 に第 2 の例を示す。 まず、 上述のよ う に 1 つの配列を Figure 9 shows the second example. First, as described above, one array
2つの部分、 部分配列 Aと B に分ける。 これを、 末端から中 央までずら じながら対照し、 相補配列が何個連続するか、 ま たは相補配列が何個あるか、 或いは相補性の割合の大き さに よ り 自 己相補性を判疋 しても よい。 Divide into two parts, subarrays A and B. This is controlled by shifting from the end to the center, and self-complementarity is determined by the number of consecutive complementary sequences, the number of complementary sequences, or the degree of complementarity. It may be a public notice.
次に 、 図 1 0 に第 3 の方法を示す。 まず、 上述の第 1 およ び第 2 の方法の よ う に 1 つの配列を部分配列 Aと B に分ける いてヽ 部分配列 B を相補配列に変換する。 これを第 2 の方 法と 同様に 1塩基ずつずら して、 相同配列が何個連続するか または相同配列が何個あるか、 或いは相同性の割合の大き さ によ り 自 己相補性を判定すればよい。 このよ う な第 3 の方法 は 、 上述の第 1 およぴ第 2 の方法のよ う に、 部分配列 Aと の 塩 の相補性をチェ ックするのでな < 、 の同一性をチェNext, FIG. 10 shows a third method. First, as in the first and second methods described above, one sequence is divided into partial sequences A and B, and the partial sequence B is converted into a complementary sequence. This is shifted one base at a time in the same manner as in the second method, and self-complementarity is determined based on the number of consecutive homologous sequences or the number of homologous sequences, or the degree of homology. What is necessary is just to judge. Such a third method is similar to the first and second methods described above, except that the partial sequence A Check the complementarity of the salt.
- -
V クする ものである 。 従って、 のよ つ に処理を行えば 、 テ ジタルコ ンピュ ータ を用いて本方法を 施する 合のプ口 グ 実 V Therefore, if the processing is performed according to the method described above, the plug-in for applying this method using a digital computer is
ラ ムがよ り fe < 己; でき る。 Ram is more fe <me;
( 4 ) ク ロ ス /、ィ ブ リ ダィゼ シ a ンチェ ック  (4) Cross / bridging check
次に、 ク ロ ス ノヽィ ブ リ ダィゼ シ 3 ンの存在の有ハ、、を確認 する方法について説明する。  Next, a method for confirming the existence of the cross-noble decision 3 will be described.
例えば、 上述の ( 3 ) までの計算を全て行つた場合 、 それ によ り得られる配列は、 無作為に作出 されヽ T m値が一定範 囲に揃い、 且つ分子内構造をと り に < い配列群である 次に、 複数の配列間でのク ロ ス ノヽイブリ ダィゼ シヨ ンの少ない配 列の集合を形成するために更なる計算を行  For example, when all of the calculations up to (3) above are performed, the resulting sequence is randomly generated, the ヽ T m value is aligned within a certain range, and the intramolecular structure is Next, further calculations were performed to form a set of sequences with low cross-disturbance among multiple sequences.
ク ロ ス ノヽイブリ ダィゼーショ ンのチェ ク は、 将来的に本 発明の設計方法によ り 得ちれた正規直交化配列を用いて行お とする反応において、 その相捕鎖も.用い られる場合には、 候 配列:の相補鎖もチェ ッ ク の対象と じて考慮する必要があ る は、 1 つの例と して各候補配列の相補鎖 考慮し、 全な相補鎖以外の配列間では ク スノヽ ィ ブリ ダィゼ ―シ ンが生じないよ う isc g† Tる場 Π について述べる * - の計 算では、 どんな条件を満た したと きにク スハィ ブ V ダィゼ 一シヨ ンと判断するかも重要である  In the case of cross-noisy hybridization, the phase capture is also used in a reaction to be performed using an orthonormalized array obtained by the design method of the present invention in the future. In addition, it is necessary to consider the complementary strand of the target sequence as a target of the check.However, as an example, the complementary strand of each candidate sequence is considered.ヽ ブ リ 場 述 べ る ス c---------------------------------------------- is important
1 つの例と して、 3 0塩基以下の正規直交化配列を計算す る と きにはバノレジやループを形成 しなレ、と考え、 複数の配列 の間に、  As an example, when calculating an orthonormalized sequence of 30 bases or less, it is considered that no vano-resistor or loop is formed.
( 0 6塩基以上の連続 L たマッチがある ( ii ) 対照 した j配列の長さ の う ち、 6 0 %以上がマ ッ チ している (0 There are consecutive L matches of 6 bases or more (ii) More than 60% of the lengths of the j sequences compared matched
とい う条件の何れかに当て嵌ま る場合に 、 その配列は 、 ク 口 スノヽィプリ ダィゼ一シ ヨ ン している と判 と にする。 この判 条件を用いて 、 ク ロ スハィ プ y ダィゼ一 .ショ ンの検If any of the conditions apply, the sequence is deemed to be snooprid. Using this judgment condition, the cross-section y-dimension is examined.
Pit方法の 1 例を図 1 1 に示す。 対象と なる候補配列の例と し て、 夫々 2 5塩基の配列 P と Qを示す o 上記の条件では 6塩 基以上の連 eしたマ チがないこ とが条件なので 、 対照する 配列の重な •り は 6塩基から始める (図 1 1 a ) 次に 7塩基 の重な り を比較する (図 1 1 b ) 。 次に 8塩基の重な り を比 較する (図 1 1 c ) 0 この よ う に、 2つの配列を 1 塩基ずつ ずら していさ 、 重な り 部分の長さ を増やして 2 5塩基全てが 重なるまで比較を行 う 。 またその後、 .当該比較を行いなが ら、 同 じ方向 更にずら していき (図 1 1 d 、 図 1 1 e ) 、 P のFigure 11 shows an example of the Pit method. As examples of candidate sequences to be targeted, sequences P and Q of 25 bases are shown respectively.o Under the above conditions, there is no gusset with more than 6 bases. Start with 6 bases (Figure 11a) and compare the overlaps of 7 bases (Figure 11b). Next, compare the overlaps of 8 bases (Fig. 11c). 0 In this way, the two sequences are shifted by one base at a time, and the length of the overlapped part is increased to increase all 25 bases. The comparison is performed until the overlaps. After that, while performing the comparison, further shift in the same direction (Fig. 11d, Fig. 11e), and P
5, ¾と Qの 3, 端と が 6塩基重なるまでずら し 、 当該比較 を行 う ο の う な比較によつて 2つの配列に けるク ロス ハィ ブ V ダィゼ一シ ンの状態が把握でき る。 5. Shift ¾ and the end of Q to 6 bases until they overlap by 6 bases, and perform the comparison. Ο-like comparison allows you to grasp the state of the cross-hybrid V-diagnosis in the two sequences. You.
例えば 、 図 1 1 の ( b ) と ( c ) の場合は、 夫々 7塩基と For example, in the case of (b) and (c) in FIG. 11, 7 bases each
8塩基が重なつた状態であ り 、 両者と にその つ ちの連続し た 2つの塩基が相捕的 Cめ ·©。 Eight bases are in an overlapping state, and both of them are two consecutive bases.
また 図 1 1 の ( d ) は 2 2塩基が重なつた状態でめ る。 その う ちの 6個の塩基対が相捕的であ り 、 且つそれぞれは 2 個の塩基の連続の'マ Vチである 。 この配列 P と配列 Qの場合 は、 ( d ) の状態がヽ 最も多く の部分が相補的である 。 更に こ の場合の全長に対する相補部位の割合は 6 ÷ 2 2 = 0 . 2 7程度であ り 、 これは 6 0 %を下回る数値である。 従って、 上述の ( i i)の条件である、 「対照 した配列の長さ の う ち、 6 0 %以上がマッチしている」 には該当せず、 ク ロ スハイ プリ ダイゼ—ショ ンしている と は判定されない。 (D) in FIG. 11 shows a state in which 22 bases are overlapped. Six of the base pairs are complementary and each is a continuous 'match' of two bases. In the case of the sequences P and Q, the state of (d) is ヽ The most part is complementary. Further, in this case, the ratio of the complementary site to the total length is 6 2 2 = 0.2. It is about 7, which is less than 60%. Therefore, it does not fall under the condition (ii) described above, “60% or more of the lengths of the compared sequences match”, and cross-hybridization is performed. Is not determined.
この よ う に重な り 部分を順番にずら していき、 全ての対照 の状態の う ち、 上述の条件 ( i ) および/ または ( i i ) を満た すク ロスハイプリ ダイゼーシヨ ンが 1 つであ存在すればその 時点で したラ ンダム配列は候捕配列から除かれ  In this way, the overlapping portion is shifted in order, and among all the control states, there is one cross-hybridization condition that satisfies the above condition (i) and / or (ii). Then the random array at that time is removed from the surveillance array.
次にヽ 配列 R と配列 Sの 2種類の配列と 、 それらの相補配 歹 IJ らなる 4つの配列の間のク ロスノヽ ィブリ ダイゼーショ ン の存在を検証する例を図 1 2 に示す。 図中 、 配列 Rの相捕鎖 は 「 R J の文字の上部に線を付して示した 。 また 、 配列 S の 相捕鎖は 「 S」 の文字の上部に線を付して'示 した 。 明細書の 記載では 、 配列 Rの相補鎖を 「 " R,, 」 ヽ 配列 S の相補鎖を Next, FIG. 12 shows an example of verifying the presence of cross-hybridization between two types of sequence R and sequence S and their four complementary sequences IJ. In the figure, the sequence R of the sequence R is indicated by a line above the letter “RJ”, and the phase trap of the sequence S is indicated by a line above the letter “S”. . In the description of the specification, the complementary strand of the sequence R is referred to as “R ,,” ヽ the complementary strand of the sequence S.
「 " S 」 と記す 。 全ての組み合わせを考える と ( R , S ) Write "S". Considering all combinations (R, S)
»  »
( R , S J,:) 、 ( " R " , S ) 、 R S,, ;( の 4 通 り である。 しかしながら 、 これら全てを検証する必要はな い。 即ち 、 と " R ,, 、 s と " S " は相ネ ffi的な関係にあるの で A— T 、 G— Cぺァも相補鎖に変換した場合では単に Τ 一 (R, S J, :), ( "R", S), RS ,,;.. ( It are four copies of however, need not name to verify all words, the "R ,,, s And "S" are in a phase-neutral relationship, so that when A—T and G—C ぺ are also converted to complementary chains,
A 、 C ― Gペアにな り 、 相補鎖に変換した場合の 5 , → 3 , への向さの変更も 、 IPJ様に対照する二本の鎖と も反対になる 従ってヽ ( R , S ) と ( " R ,, , " S ,, ) 、 ( R , " S ,, ) と ( " R ', , S ) についての結果は同 じヽ 即ち、 相補鎖数お よびパグ ーンと も等 しいク ロスノヽイ ブリ ダィゼーショ ン状況 を示す。 こ の よ う な例を図 1 2 に示す。 こ の例では、 が 「 a t t g c c 'g j 、 " R " カ 「 c g g c a a t 」 、 S カ 「 g .t c c a a t 」 、 " 3,, カ 「 a t t g g a c 」 であ り 、 夫々 7 塩基の 例で あ る 。 左 力 ら 、 ( R , S ) 、 ( R , " S ,, ) 、 ( " R " , S ) 、 ( " R " , " S " ) を示 し、 夫々 の括弧書きの下方に、 各々 の組み合わせにおける全ての 対応パタ ー ンを示 した。 図 1 2 に示す通 り ( R , S ) とA, C-G pairs are formed, and the change in the direction of 5, → 3, when converted to a complementary strand, is also opposite to the two strands that contrast like IPJ. Therefore, ヽ (R, S ) And ("R ,,," S ,,), (R, "S ,,) and (" R ',, S) are the same. That is, the number of complementary strands and the pagoon are the same. Shows the same cross-noisy hybridization situation. Figure 12 shows such an example. In this example, "Attgcc'gj,""R","cggcaat","S," g.tccaat, "3,", "attggac", each of which is an example of 7 bases. The left force indicates (R, S), (R, "S ,,), (" R ", S), (" R "," S "), and below each parenthesis, All corresponding patterns in the combination are shown as (R, S) and
( " R S ) 、 ( R , " S ', ) と ( R , s ) は、 比較した結果が等しい。 このよ う に、 相補鎖についてのク 口 スノヽィプリ ダィゼーシ ヨ ンの検証は. ( R , S ) ねよび ( R,("R S), (R," S ',) and (R, s) compare equal. In this way, the verification of the mouth snoop priming scheme for the complementary strand is as follows: (R, S)
" S " ) のみでよい。 "S") only.
以上の方法でヽ すでに、 相補鎖を含まなレ、候 配列につい てのク 口スノヽ ブリ ダィゼーシ ョ ンの存在の確認を行つた後 で、 ク 口 スノヽィ ブリ ダィゼーシ ョ ンが存在しないと判定され た配列群に対して 、 更にそれらの相捕鎖と の間のク ロスハイ プリ ダィゼ —シ 3 ンの存在を検証しても よい 或いは、 相補 鎖を含まなレ、候捕配列につ \ヽてのク ロスノヽィブリ'ダイゼーシ'一 ヨ ンの存在の確認と共に相補鎖についても |BJ時に検証しても よい。 またヽ ク ス ノヽイブリ ダィゼーシ ョ ンの検証を全ての 配列について将当た り で行つても よい。  With the above method, after confirming the presence of a cloning sniffer for a sequence containing no complementary strand and a candidate sequence, it is determined that there is no lip snobbing already present. The presence of the cross-hybridase between the complementary sequence and the complementary sequence may be verified for the selected sequence group. In addition to confirming the presence of all cross-difficient 'Daisysee' ions, the complementary strand may be verified at the time of | BJ. In addition, the verification of the hybridization may be performed for all sequences on a general basis.
本発明の態様に従 う方法において使用される ク ロ ス ノヽィ ブ リ ダイゼ一 シ 3 ン力 S存在する と判定するための条件は、 上述 した例に限る ものではない 。 上述の例ではヽ ( i) と (ii ) の 何れかに当て嵌まる場合をク ロ スノヽイ ブリ ダィゼーショ ン力 s 存在する と判疋する と しているが、 (i) と ( 11 ) の両方に当 て嵌まる場合にク ロ スノヽ ィブリ ダィゼーシ 3 ンが存在する と 判定しても よい。 或いは、 (i ) の 6 塩基以上を、 2 、 3 、The conditions for determining the presence of the crossover force S used in the method according to the embodiment of the present invention are not limited to the above-described example. In the above example, the case where one of (i) and (ii) is satisfied is determined to be the presence of the cross-noisy hybridization force s, but both (i) and (11) If there is a crossover noise You may decide. Alternatively, 6 or more bases of (i) are replaced by 2, 3,
4 、 5以上と設定しても、 7 、 8 、 9 、 1 0以上と しても、 或いはそれ以上の数値以上と設定して い。 しかしながら、 精度と効率から 6塩基以上が好ま しい また、 設計しよ う と する正規直交化配列が長い場合には、 例えば、 例えば 7塩基 以上、 8塩基以上連続する こ と を条件とする こ と が好ま しい。 また、 ミ ス マ ッ チ条件に関する場合、 例えば、 7 5塩基以上 の場合な どは、 例えば 7塩基以上、 8塩基以上連続する こ と を条件とする こ とが望ま しい。 Even if it is set to 4, 5 or more, it is set to 7, 8, 9, 10 or more, or more than that. However, 6 bases or more are preferable from the viewpoint of accuracy and efficiency.If the orthonormal sequence to be designed is long, for example, it is necessary that, for example, 7 bases or more, 8 bases or more are continuous. Is preferred. In addition, in the case of mismatch conditions, for example, in the case of 75 bases or more, it is preferable that the conditions be continuous, for example, 7 bases or more, 8 bases or more.
( ii ) の条件は、 全ての場合に共通 して 、 対照 した配列、 即ち、 重な り を持たせた配列の 6 0 % と 定するのではなく 、 重な り 部分が 1 0塩基以上の場合は 6 0 % 、 1 0塩基以下の 場合は合計 6塩基とするなどのよ う にヽ 対照する重な り の長 さで判定基準を変更 しても よい。 或いは 、 マ ッチする塩基の 絶対数で、 設定する割合を区切って設定しても よい。 '  In all cases, the condition (ii) is not defined as 60% of the reference sequence, i.e., the sequence having overlaps, but the overlap is more than 10 bases. In this case, the criterion may be changed according to the overlap length to be compared, for example, 60%, and when the number of bases is 10 or less, the total is 6 bases. Alternatively, the ratio may be set by dividing the set ratio by the absolute number of bases to be matched. '
また更に、— 計算機資源が得られるな らば 、 ダイナミ ヅクプ - ロ グラ ミ ング法でバルジループなどの複雑な構造も考慮して、 よ り 精密なク ロ スハイ プリ ダイゼーシ ンを検証しても よい。 また、 本発明の態様に従 う設計方法では 、 当該方法に具備 される何れの工程の途中.および合間にヽ 新たなラ ンダム配列 を無作為に作出 して候補配列群に追加 しても よい。 そのよ う な場合、 ク ロ スハイ ブリ ダィゼーショ ンの存在の検証につい ては、 例えば、 新たなラ ンダム配列を正規直交化配列の集合 にある配列と対照 し、 その新たなラ ンダム配列がク ロ ス ノヽィ ブリ ダイゼーシ ョ ン しないかを検証すればよい ( 5 ) 分子内 2次構造の自 由エネルギーの計算 本発明に従って得られる正規直交化配列を有する核酸は、 単独でプライマーやハイプリ ダィゼーショ ンプローブと して 利用 される。 従って、 そのよ う な核酸が、 分子内構造を取り 易い核酸であれば、 反応性が低く な り 、 P C R増幅効率ゃハ ィプリ ダイゼーシヨ ン効率が悪化する。 この反応効率は、 2 次構造の 自 由エネルギーが大きいほど大きい。 従って、 2次 構造の自 由エネルギーを計算する こ と を、 正規直交化配列の 選別に活用する こ と が可能である。 例えば、 この計算には、 Z u c k e r ら の ダ イ ナ ミ ッ ク プ ロ グ ラ ミ ン グ 法 、 「 Algorithms and Termodynamics for RNA Secondary Structure Prediction : A Practical GudeJ , RNA Biochemistry and Biotechnology, 11-43, J.Barciszewski & B. F.C.Clark, eds. , NATO ASI Series, Kluwer Academic Publishers, (1999)」 を参 照されたい) な どが利用でき る。 また、 適切な閾値を与えて おけば、 この段階で配列の取捨選択が可能になる。 しかしな が ら、 こ の段階は計算量が多く て実行が困難な場合もある。 また、,正規直交化配列自身が短いために安定な構造を と り難 い場合もある。 これらのよ う な場合な どには、 2次構造の自 由エネルギーの計算を省略しても よい。 Furthermore, if computer resources can be obtained, a more precise cross-hyperidization may be verified by taking into account a complicated structure such as a bulge loop by a dynamic programming method. In the design method according to the embodiment of the present invention, a new random sequence may be randomly generated and added to the candidate sequence group during any of the steps included in the method and between the steps. . In such cases, verification of the existence of cross-hybridization can be performed, for example, by comparing a new random array with an array in the set of orthonormalized arrays and comparing the new random array to the cross-array. Verify that no snow hybridization (5) Calculation of Free Energy of Intramolecular Secondary Structure The nucleic acid having an orthonormal sequence obtained according to the present invention is used alone as a primer or a hybridization probe. Therefore, if such a nucleic acid is a nucleic acid that easily has an intramolecular structure, the reactivity becomes low, and the PCR amplification efficiency / hybridization efficiency deteriorates. The reaction efficiency increases as the free energy of the secondary structure increases. Therefore, the calculation of the free energy of the secondary structure can be used to select orthonormal arrays. For example, this calculation includes the dynamic programming method of Zucker et al., “Algorithms and Termodynamics for RNA Secondary Structure Prediction: A Practical GudeJ, RNA Biochemistry and Biotechnology, 11-43, J. Barciszewski & BFCClark, eds., NATO ASI Series, Kluwer Academic Publishers, (1999) ”). Also, if an appropriate threshold is given, it is possible to select arrays at this stage. However, this step can be difficult to perform due to the large amount of computation. In addition, it may be difficult to obtain a stable structure because the orthonormalized array itself is short. In such cases, the calculation of the free energy of the secondary structure may be omitted.
( 6 ) 基本セ ッ ト の所要時間  (6) Time required for basic set
以上の過程の中で、 最も時間のかかるのはク ロ スハイ ブリ ダイゼーシヨ ンチェ ックである。 また、 次に時間のかかるの は 2次構造の自 由エネルギーの計算である。 ク ロ スハイ プリ ダイゼーショ ンチェ ック は総当た り で計算するために正規直 交化配列の 合が大き く なるにつれて計算時間がかかり 、 新 たに試される候補配列はすでに集合の要素になつている配列 と ク π スノヽィブリ ダ ゼ一シ ョ ンを起こす可能性が高い。 よ つて集合は大き く なる につれて配列の種類の増加が鈍る傾向 にめる o The most time-consuming of these processes is the cross-hybridization check. The next time is the calculation of the free energy of the secondary structure. The cross-high pre-didation check is a straightforward As the size of the hybridized sequence increases, the computation time becomes longer, and the newly tested candidate sequence is likely to cause a π-snoob hybridization with the sequence already in the set. . Therefore, the number of array types tends to slow down as the set grows.o
T m値を制限した候補配列の生成は設計計算の律速段階に な らないので 、 ク 口スノヽィ ブリ ダィゼーシ ョ ンチェ ックが完 了するまでに 、 生成した.侯補配列リ ス ト を一括して作成し、 ク ロ スハィ ブリ ダイゼ ―シヨ ンチェ ック処理を しても よ Vヽし、 Since the generation of candidate sequences with a limited Tm value does not become the rate-determining stage of design calculation, they were generated before the completion of the Kiss-No-Snow Hybridization Check. Cross-hybridization-even with a short check process.
1 個の配列についてク 口スハイ ブリ ダイゼーショ ンチエ ック が終わるたびに更なる候補配列を生成 しても よい。 Additional candidate sequences may be generated at the end of each mouth hybridization check for a single sequence.
極短い正規直交化配列を設計する と き、 更なる候補配列を 生成 した と さには既出配列に相捕な配列が偶然できて しま う こ とがめる o これを防ぐために、 既に生成 した配列の リ ス ト を作つておき 、 対照 してからク ロ スノ、イブリ ダィゼ一シヨ ン テ ^ ヅク しても よい o また 、 こ の既出配列と対照する段階を― ク ロスハィ ブリ ダイゼ一ショ ンチェ ック の前に入れても よい。 また、 2 5 m e r 程度の長い配列になる と T m値の制限を し ていても同一な配列が生成する確率は低いので 、 特にこのよ う な処理をする必要はない o  When designing an extremely short orthonormalized sequence, it is possible that an additional sequence will be generated by chance when an additional candidate sequence is generated.o In order to prevent this, the sequence of already generated sequences must be re-created. You can make a list, check it, and then cross-check it before proceeding.o Also, check the step of comparing this sequence with the existing sequence in the cross-hybridization check. You may put it in front. In addition, if the length of the array is as long as 25 mer, the probability that the same array will be generated is low even if the Tm value is restricted.
また 、 既出配列と の対照をせずに済ます方法もある 。 例え ば 6塩基の正規直交化配列の設計をする とすれば、 全ての配 列は 4 6 ― 4 0 9 6種類だけである。 従って 、 配列をラ ンダ ムでなく 順に重複の無いよ う に配列生成しても よい。 その際 には、 T m値条件を満たさ ない配列が生成され一部の計算が 無駄になって しまつた と しても問題にな らないだろ フ o その よ う な手段を用いる例を図 1 3 に示す 例えば、 0 から 4 0There is also a method that does not need to make a comparison with the existing sequences. For example, if a 6-base orthonormal sequence is to be designed, all sequences are only 46-496 types. Therefore, arrays may be generated so that the arrays are not random and are not sequentially overlapped. In that case, an array that does not satisfy the T m value condition is generated, and some calculations are performed. It will not be a problem if it is wasted. Figure 13 shows an example of using such a method. For example, 0 to 40
9 5 までの 1 0進数を順に生成し、 それを図 1 3 のよ つ な剰 余を調べるアルゴ リ ズムによ り 4進数に変換すればよい o 4 進数の 0 を A、 1 を C 、 2 を G 、 3 を Tに対応する よ う に解 釈すれば、 1 0進数の 1 は、 4進数で 0 0 0 0 0 1 と な り 、 塩基配列 A A A A A C と解釈でき る o 例えば、 このよ つ な場 合な どにおいては、 本発明の態様に従 Ό正規直交化配列の設 計における、 ラ ンダム配列の作出に代わつて、 このよ う な逐 次的な配列の生成手段を利用 しても よい o It is sufficient to generate 10 decimal numbers up to 95 in order, and convert them to quaternary numbers using the algorithm for checking the remainder as shown in Fig.13.o A quaternary 0 is A, 1 is C, If 2 is interpreted to correspond to G and 3 to T, the decimal number 1 becomes 0 000 0 1 in quaternary number, which can be interpreted as the nucleotide sequence AAAAAC. In such a case, according to an embodiment of the present invention, instead of creating a random array in designing an orthonormal array, such a means for generating a sequential array is used. Also good o
5 . 組み合わせた正規直交化配列の F3X計計算  5. F3X total calculation of combined orthonormalized arrays
上に述べたよ う な正規直交化配列は 使用時に複数の配列 を組み合わせて連結し 、 比較的長い核酸断片と して使用 され て も よい。 実際に、 例えば、 A. d 1 e m a n の実験では 7 つ The orthonormalized sequence as described above may be used as a relatively long nucleic acid fragment by combining and linking a plurality of sequences at the time of use. In fact, for example, in the experiment of A. d 1 e ma n
'の都市に対応する D N Aを連結し用レ、ている (L . Adleman.'The city corresponding to the DNA is connected and used for (L. Adleman.
Molecular computation of solutions to ι combinatorial problems.Molecular computation of solutions to ι combinatorial problems.
Science, 266 (11) : 1021-1024, 1944) o こ こで、 正規直交化 配列の連結部分には新たな配列がでさ る こ と に注意しなけれ ばな らない。 よって 、 先に述べた方法によ り 設計された正規 直交化配列を使用する場合には、 その連結の形態などに応じ て、 連結部分において 、 新たなグロスノヽィプリ ダイゼ一ショ ンが起きないよ う にする必要がある ο そのためには 、 例えば 正規直交化配列群に含まれる任意の 2 つの配列を連結してで き る連結部分から両側の正規直交化配列の中央塩基までの配 列についても、 総当た り でク ロ スノ、ィ ブリ ダィゼーショ ンの 、、 Science, 266 (11): 1021-1024, 1944) o It must be noted here that a new sequence appears at the junction of the orthonormalized sequences. Therefore, when an orthonormal array designed by the above-described method is used, no new gross noise pre-division occurs at the connection part depending on the connection form or the like. Ο For this purpose, for example, the sequence from the connected part where any two sequences included in the orthonormalized sequence group can be connected to the central base of the orthonormalized sequence on both sides is also considered. , Gross profit, cross-noise, hybridization ,
Γ3 ハ、、 ■a 調 、 る こ とが好ま しい o 配列の連結が任意の 2配列で 起きないな らばヽ ク 口スノヽィ ノ V ダィゼ一シヨ ンを起こす組 み合わせを使用 しないよ う にすればよい た、 任意の 2配 列で 結が起き るな らば 、 もつ と 多く の正規直交化配列が 使える よ Ό に、 ク 口スノヽィ ブ V ダィゼ一ショ ンを起こす組み 合わせに関わる正規 H-交化配列を除けばよい o Γ3 c, ■ a tone is preferable o If the concatenation of the sequences does not occur in any two sequences, do not use the combination that causes the open-sound V-dimension If the connection occurs in any two arrays, it is possible to use a lot of orthonormal arrays. Omit the regular H-association sequence o
6 . 正規直交化配列群 よび核酸群  6. Orthonormalized sequences and nucleic acids
 >
本発明の更なる態様に従 つ とヽ 以上のよ う な本発明に従 う 方法によ つて設計された塩基配列群 よびその配列を基に合 成された核酸が提供される 0  According to a further aspect of the present invention, there are provided a base sequence group designed by the method according to the present invention as described above and a nucleic acid synthesized based on the sequence.
本発明の態様に従 う方法によ り 与え られた正規直交化配列 群は 、 紙面およびディ スプレィ な どに出力された形態で提供 された り ヽ 媒体に された形態で提供されても よい。 また そのよ う な配-列は 、 核酸に反映されても よい 。 そのよ う な配 列を有ずる核酸は 、 核酸 成装置などによ り 化学的に合成さ れてあ < 、 或いは他のそれ自身公知の核酸を合成するため の手段によつて 、 合成されて よい た、 合成されるその よ う な配列を有する核酸の種類はヽ 実施者の所望に応じて選 択すればよい。  The group of orthonormalized arrays provided by the method according to the embodiment of the present invention may be provided in a form output on paper or a display, or may be provided in a form provided on a medium. Such an arrangement may also be reflected in the nucleic acid. The nucleic acid having such a sequence is chemically synthesized by a nucleic acid synthesizer or the like, or synthesized by other means for synthesizing a nucleic acid known per se. In addition, the type of nucleic acid having such a sequence to be synthesized may be selected as desired by the practitioner.
本発明の態様に従い提供される核酸は 、 本発明に従い提供 される正規直交化配列群に含まれる配列によ り 示される核酸 であればよい。 使用する際は 、 時に 1 つの反応系において 同 じ正規直交化配列群に含まれる複数種類の配列を組み合わ せて使用する とが必要である o  The nucleic acid provided according to the embodiment of the present invention may be a nucleic acid represented by a sequence included in the orthonormalized sequence group provided according to the present invention. When used, it is sometimes necessary to use a combination of multiple types of sequences included in the same orthonormal sequence group in one reaction system.o
本発明の態様に従い提供される正規直交化配列群の例を、 図 1 4力ゝら図 2 1 に示す。 それらは配列番号 1 から配列番号Examples of orthonormalized arrays provided according to embodiments of the present invention, Fig. 14 Fig. 21 They are SEQ ID No. 1 to SEQ ID No.
2 6 3 である 。 これらの配列は、 何れも互いに正規直交化配 列の関係にある。 従って、 これら を全て一度に使用 しても、 何れの一部分を使用 しても よい。 また、 配列番号 2 6 4 力、ら 配冽番号 3 7 5 までの配列も正規直交化配列 千の 1例である。 従って、 これらの配列は何れも互いに正規直交化配列の関係 にある。 従つて、 これらを全て一度に使用 しても、 何れの一 部分を使用 しても よい。 2 6 3. All of these arrays are in an orthonormalized array relationship with each other. Therefore, they may be used all at once or any part thereof may be used. In addition, sequences up to SEQ ID NO: 264, and sequence numbers up to 375 are also an example of one thousand orthonormal arrays. Therefore, all of these arrays have a relationship of orthonormalized arrays. Therefore, they may be used all at once, or any one of them may be used.
また、 更なる本発明の態様に従い提供される正規直交化配 列群の例は、 配列番号 2 6 4 から配列番号 3 7 5 の 1 1 2種 類である。 これらの配列もまた、 何れも互いに正規直交化配 列の関係にある。 従って、 これらを全て一度に使用 しても、 何れの一部分を使用 しても よい。 '  Further, examples of the orthonormalized array group provided in accordance with a further embodiment of the present invention include 112 types of SEQ ID NO: 264 to SEQ ID NO: 375. Each of these arrays also has an orthonormalized array relationship with each other. Therefore, all of them may be used at once, or any one of them may be used. '
また、 配列番号 1 から配列番号 3 7 5 はヽ 当該配列によ り 示される核酸と して提供されても よ く 、 それらの核酸も本発 明の範.西内でめ 。。  In addition, SEQ ID NO: 1 to SEQ ID NO: 375 may be provided as nucleic acids represented by the sequence, and those nucleic acids are also included in the scope of the present invention. .
以上のよ う な本発明の態様に従 う と、 例えば 、 D N Aチッ プおよび D N Aマイ ク ロア レィ な どを代表とする核酸検出用 の核酸プロ一ブ固相化基体において使用される核酸検出用の プローブと しての用途、 多く の核酸増幅やノヽィプリ ダイゼー ショ ンな どの反応を並列および zまたは繰り 返して行 う D N According to the embodiment of the present invention as described above, for example, a nucleic acid detection nucleic acid used in a nucleic acid probe-immobilized substrate represented by a DNA chip, a DNA microarray, etc. For use as a probe in a DN, performing many reactions such as nucleic acid amplification and / or hybridization, in parallel and z or repeatedly
Aコ ンピューテ ィ ングなどにおレヽての用途など 、 多く の種類 の核酸を同時に使用する必要がある場合に有利に使用でき る 塩基配列群おょぴその配列を有する核酸を設計および Zまた は製造する方法が提供される。 D N A コ ン ビ ュ一ァィ ングに用いる配列と して 「正規直交 化配列 J を利用する こ と は、 陶山 らが提案している ( H . Y o s h i d a a 1 d A . S U y a m a S o 1 u t i o n t o 3一 S A T b y b r e a d t h I i r s t s e a r c h ? P r o C . o f 5 t h I n t e r n a t i o n a 1 M e e t i n g o n D N A B a s e d C o m p u t e r s 9 - 2 0 ( 1 9 9 9 ) ) を 参照されたい ) o H . Y o s h i d a a n d A . . S u y a m a , ( 1 9 9 9 ) において 彼らは、 3 S A T問題とい う組み合わせ問題を解く ために T m値が揃つた 、 互いにク ロ ス ヽィ ブリ ダィゼ一シヨ ンしに < い 2 2 m e r の配列セ ッ トを設計した しかしなが ら 通常、 こ のよ う な配列セ ッ ト を設計しても 互レヽに連結する と連結部分に新たな配列がで き るために、 ク スノヽイブリ ダィゼーショ ンを完全に避ける こ と'はできない o 当該文献に ける陶山の設計法は、 連結部 分にでき る配列もク 口 スノヽィブ V ダイゼニ 、ンョ ンを起こ し難 いよ う に HX 5十'して しま う こ とが特徴'である 。 しかし、 初めか ら連結部分を考慮して設計する と 、 配列設計の制限が厳しく な り 、 よ り 多 < の配列を設計でさなく なつて しま J cL フ"A A base sequence group that can be used advantageously when many types of nucleic acids need to be used simultaneously, such as in applications for computing, etc. A method of manufacturing is provided. The use of orthonormalized sequences J has been proposed by Suyama et al. (H. Yoshidaa 1dA. SUyama Solution) 3I SAT bybreadth I irstsearch? Pro C. of 5th Internationa 1 Meetingon DNAB ased C omputers 9-20 (1 9 9 9))) o H.Yoshidaand A. In (199 9), they found that the T m values were equal to solve the combinatorial problem of the 3 SAT problem, and that the two-mer sequence sets were cross-dissociated with each other. However, usually, even if such a set of sequences is designed, if they are connected to each other, a new sequence will be formed at the connected portion, so that the complete hybridization is completely completed. O The design method of Suyama in this document requires that the arrangement at the connection part also be D) The feature is that the HX 50 'is used to make it hard to cause mess, but if the design is made from the beginning with the connection part taken into account, the restrictions on the sequence design become severe. , So we can avoid designing more arrays.
D N Aコ ンピュ一ティ ングに用途を限らないな らば、 必ずし も全ての配列を連 a しないので 設計した後で改めて連結部 分を考慮して配列を選択する方が好ま しい ο If the application is not limited to DNA computing, it is not always necessary to connect all the sequences, so it is preferable to select the sequence after considering the connection part after designing ο
本発明の態様に従 う方法によれば、 上 cのよ Ό な従来の設 計方法の欠点を改善する こ と も可能であ り 、 広い用途に態様 可能な従来に比較して大きな母集団、 即ち、 正規直交化配列 である核酸群を設計する こ とが可能である o According to the method according to the embodiment of the present invention, it is possible to improve the drawbacks of the conventional design method as described in the above c, and to obtain a large population as compared with the conventional one which can be applied to a wide range of uses. , Ie, orthonormal array O It is possible to design a nucleic acid group that is
また、 本発明の態様に従 方法は、 全検証アルゴリ ズムに よる正規直交化配列の 法であっても 、 逐次追加ァノレゴ リ ズムによる正規'直交化配列の設計方法であっても よ く 、 何 れの方法も本発 mに今 a まれる o  Further, the method according to the embodiment of the present invention may be a method of an orthonormalized array by a full verification algorithm or a method of designing an orthonormalized array by a sequential addition algorithm. This method is also included in the present m o
本発明の態様に従 つ 方法によれば、 融解温度 ( T m慨 ) が 一疋範囲に収まつてレ、 る 、 ク スノヽィ プリ ダィゼ一ショ ンシ グナルが完全マ ッチの シグナルに比べて 1 0 0分の 1 でめ 、 According to the method according to the embodiments of the present invention, the melting temperature (T m) is within a range, and the x-nosie pre-division signal is one time as compared to the signal of the complete match. 0 1/0,
2次構造をと り にく い 、 正規直交化配列である 列群が BX. P1 される。 またヽ それを基に合成された核酸群が提供され 。 実施例 BX. P1 is a column group that is an orthonormal array that is difficult to take a secondary structure. Also, a nucleic acid group synthesized based on the nucleic acid is provided. Example
実施例 1 . 正規直交化配列の BX P十  Example 1. Orthonormalized array BX P
2 5塩基の正規直交化配列を ΙίΧ卩 し /こ 。 Ϊ¾Χ口 件は T m値 の中心温度を 6 0 °c と し、 土 2 °cの範囲と した。 また、 ク 口 スハイブリ ダィゼ一ショ ンは連続 6 以上のマ ッチがめる か、 および/または 1 0塩基以上で重な り の配列の 6 0 %が マ ッチしているかで判定した 計算は、 c P Uが P e n t i u m I I I 8 0 0 Μ Η Z ヽ R A M力 S 2 Gバイ 卜 、 o Sが 25 Orthorectified sequence of 5 bases is prepared. Ϊ¾Χ For the opening condition, the center temperature of the Tm value was set to 60 ° C, and the soil temperature was set to 2 ° C. In addition, the mouth hybridization is calculated based on whether or not 6 or more consecutive matches can be made and / or if 60% of the overlapping sequences with 10 or more bases are matched. c PU is Pentium III 800 0 Η Z ヽ RAM power S 2 G bytes, o S is
L i n u X k e r n e 1 2 . 2 . 1 8 の計算機を用い、 g c c にてコ ンパイルしたプ グラムを用いて行つた。 T m 値計算は 、 s a n t a L u c i a のパラメ ータ を用いて N e a r e s t N e i g h b o r 法によって行った o 自 己分子 内構造の自 由ェネノレギ一計算は 、 u c k e r のァノレゴリ ズ ムを用いて行つた。 以上の計算によって、 2 6 3 の配列から なる正規直交化配列群が得られた。 得られた正規直交化配列群を図 1 4 か ら図 2 1 までに、 夫々配列番号 1 から配列番号 3 4 、 配列番号 3 5 から配列番 号 7 0、 配列番号 7 1 から配列番号 1 0 6 、 配列番号 1 0 7 から配列番号 1 4 2 、 配列番号 1 4 3 力ゝら配列番号 1 7 8 、 配列番号 1 7 9 から配列番号 2 1 4、 配列番号 2 1 5 から配 列番号 2 5 0、 配列番号 2 5 1 から配列番号 2 6 3 を示 した。 配列番号の右には、 塩基配列を 5 , 末から 3 末 J1向に記载 し、 その右には d Gを記載し、 その右には T m値を示した。 実施例 2 . マイ ク 口ァレィ によ る検証実験 This was performed using a computer compiled by gcc using the computer of Linu X kernel 12.2.2.18. The T m value was calculated by the Nearest Neighbor method using the parameters of Santa Lucia. O The free calculation of the internal structure of the self molecule was performed using the ucker's anorego rhythm. By the above calculation, an orthonormalized array group consisting of 2 63 arrays was obtained. The obtained orthonormalized sequence groups are shown in FIGS. 14 to 21 as SEQ ID NOS: 1 to 34, SEQ ID NOS: 35 to SEQ ID NO: 70, and SEQ ID NOs: 71 to SEQ ID NO: 10 respectively. 6, SEQ ID NO: 107 to SEQ ID NO: 142, SEQ ID NO: 143 Chirara SEQ ID: 178, SEQ ID NO: 179 to SEQ ID NO: 214, SEQ ID NO: 215 to SEQ ID NO: 2 50, SEQ ID NO: 251 to SEQ ID NO: 263 are shown. On the right side of the SEQ ID No., the base sequence was written from the 5th end to the 3rd end J1, the dG was written on the right, and the Tm value was shown on the right. Example 2 Verification experiment using microphone array
( 1 ) 配列  (1) Array
上記の実施例 1 において記載した方法と 同様に、 更なる配 列を 1 1 2種類設計した これらの配列を図 2 2 から図 2 7 に示 し 。 これらの図の最も左には本明細書において极 う配 列に通 し番号である配列番号 2 6 4から配列番号 3 7 5 まで を記載した。 次の 「 n & e J (ネーム) の欄にはヽ 本正規 直交化配列群における番号であるネーム 1 からネ ム 1 1 2 ま での番号を記載し 71— 次に、 当該 1 1 2種 m配列の各配列 を左力 ら 5 ' カ ら 3 , の方向で示 した。 最も右には以下の検 証において用いた夫々 の配列を検出するためのプ口 ブ配列 を 5 ' 力 ら 3 ' の方向で記載した Similar to the method described in Example 1 above, these sequences in which 112 additional sequences were designed are shown in FIGS. 22 to 27. On the leftmost of these figures, SEQ ID NO: 264 to SEQ ID NO: 375, which are serial numbers of the sequences used in the present specification, are described. Include the following "n & e J column name 1 Karane beam 1 1 2 or number in a number inヽpresent orthonormal sequences group into the (name) 7 1 - Next, the 1 1 2 Each sequence of the species m-sequence is shown in the direction of 5 'to 3', and the rightmost column shows the probe sequence for detecting each sequence used in the following verification. Described in the 3 'direction
また、 配列番号 3 2 6 は配列番号 3 2 と、 配列番号 3 2 8 と配列番号 2 1 9 、 配列番号 3 4 2 は配列番号 1 7 5 と、 配 列番号 3 4 3 は配列番号 2 1 と、 配列番号 3 7 2 は配列番号 1 6 6 と、 配列番号 3 7 3 は配列番号 2 4 3 と、 配列番号 3 7 4 は配列番号 3 7 と、 配列番号 3 7 5 は配列番号 2 1 0 と 等 しい配列である。 In addition, SEQ ID NO: 32 6 is SEQ ID NO: 32, SEQ ID NO: 32 8 is SEQ ID NO: 219, SEQ ID NO: 342 is SEQ ID NO: 175, and SEQ ID NO: 343 is SEQ ID NO: 21 SEQ ID No. 37 2 is SEQ ID No. 16 6, SEQ ID No. 37 3 is SEQ ID No. 24 3, SEQ ID No. 37 4 is SEQ ID No. 37, SEQ ID No. 37 5 is SEQ ID No. 21 0 and This is an equivalent array.
( 2 ) マイ ク 口 ァ レイ  (2) Microphone array
8 X 1 4 の ク ェノレを具備するプレー ト を用意する。 このプ レー ト の各 ゥェルの夫々 に 、 ネーム 1 からネーム 1 1 2 を検 出するためのプ D一プ配列を 1 種類ずつ固相化 して、 マイ ク ロ ア レイ と した のよ う なマイ ク ロ ア レイ を 1 4枚作製 し た  Prepare a plate with 8 x 14 quinoles. It is as if a microarray was formed by immobilizing one type of D-D sequence for detecting each of the labels from name 1 to name 112 on each of the plates in this plate. Created 14 microcrorays
( 3 ) S"¾料の増幅  (3) Amplification of S "material
まず、 上記 ( 1 ) に記載の 1 1 2種類の配列、 即ち、 ネー ム 1 〜ネ ム 1 1 2 (配列番号 2 6 4 〜配列番号 3 7 5 ) First, there are 112 types of sequences described in the above (1), that is, name 1 to name 112 (SEQ ID NO: 264 to SEQ ID NO: 375)
8 種類ずつ纏めて 1 つのノ シチ と した。 各バ ッチに含まれる 配列ば次の通 り である。 Eight types were combined into one nosichi. The sequence included in each batch is as follows.
表 1 table 1
ハ、、ツチハ、、ツチ 'ヾツチ !ヾツチハ、、ツチハ、、ツチハ、、ツチハ、、ツチハ、、 vf ハ、、ツチハ、、ツチ 'ヾツチハ、、ツチハ、、ツチHa, Tsuchiha, Tsuchi 'ヾ Tsuchi!ヾ チ チ チ, ハ ハ, v ヾ, v チ チ ヾ ヾ ヾ ヾ ヾ ヾ ヾ ヾ
1 2 3 4 5 6 7 8 9 10 11 12 13 141 2 3 4 5 6 7 8 9 10 11 12 13 14
1 2 3 4 5 6 7 8 9 10 11 12 97 1051 2 3 4 5 6 7 8 9 10 11 12 97 105
13 14 15 16 17 18 19 20 21 22 23 24 98 10613 14 15 16 17 18 19 20 21 22 23 24 98 106
25 26 27 28 29 30 31 32 33 34 35 36 99 10725 26 27 28 29 30 31 32 33 34 35 36 99 107
37 38 39 40 41 42 43 44 45 46 47 48 100 10837 38 39 40 41 42 43 44 45 46 47 48 100 108
49 50 51 52 53 54 55 56 57 58 59 60 101 10949 50 51 52 53 54 55 56 57 58 59 60 101 109
61 62 63 64 65 66 67 68 69 70 71 72 102 11061 62 63 64 65 66 67 68 69 70 71 72 102 110
73 74 75 76 77 78 79 80 81 82 83 84 103 11173 74 75 76 77 78 79 80 81 82 83 84 103 111
85 86 87 88 89 90 91 92 93 94 95 96 104 112 85 86 87 88 89 90 91 92 93 94 95 96 104 112
表 1 に示される よ Ό に、 1 ノ ッチには、 ネ ーム 1 ヽ 1 3 、 ヽ 3 7 、 4 9 、 6 1 7 3 およぴ 8 5 が含まれる。 2バ ッチには 、 ネーム 2 、 1 4 ヽ 2 6 、 3 8 、 5 0 、 6 2 、 7 4 およぴ 8 6 が含まれる 3バクチには、 ネ一ム 3 、 1 5 、 2As shown in Table 1, one notch includes names 1 13, 37, 49, 61 73 and 85. Two batches include names 2, 14 426, 38, 50, 62, 74 and 86.Batches have names 3, 15 and 2
7 、 3 9 ヽ 5 1 、 6 3 、 7 5おょぴ 8 7が含まれる。 4バ、、ノ チにはヽ ネ一ム 4 ヽ 1 6 2 8 、 4 0 、 5 2 、 6 4 、 7 6 お ょぴ 8 8 が含まれる 同様に 、 表 1 に示される よ う に、 残り の 1 4 クチまでに 8種類ずつの配列が含まれる 7, 39 ヽ 51, 63, 75 ぴ 87 are included. Nozzles include the following items: Eight types of sequences are included in the remaining 14 cuts
全ての配列を 1 4 の Vチに振り 分けた後にヽ バッチ毎に 以下のよ な P C R増幅を行つた。 全てのノ 、ソチに共通 して o o o o  After allocating all the sequences to 14 V strands, the following PCR amplification was performed for each batch. O o o o
上τ  Upper τ
使用 したプラィマ一はヽ 5 を C y 3 でラ CO COOO C Cベ o o o o ルされた配列The used primer is 配 列 5 with Cy3.
「 G A T T C G T C G T G T G C C T T T G A C T G T T」 G A T T C G T C G T G T G C C T T T G A C T G T T
(配列番号 3 7 6 ) とヽ 5 mをビォチン化された配列 「 T(SEQ ID NO: 376) and the sequence 「T
T G T G A G G G G A A G G C A G T T A A C C A A」 (配 列番号 3 7 7 ) である P C Rは、 各バッチ毎に 、 P T C 一PCR, which is “T GTG G G G G G A A G G C A G T T A A C C A A” (sequence number 377), is a PTC one for each batch.
2 0 0 D N A E n g 1 n e ( MJ RE SEARCH, Inc . ) を用 いて以下の表 2 に記載のプ口 グラムを用 、て行つた。 The procedure was performed using the program described in Table 2 below using 200 DNA Eng 1ne (MJ RESEARCH, Inc.).
表 り  Expression
手順 温度 時間  Step Temperature Time
1 94°C  1 94 ° C
2 94 °C  2 94 ° C
3 60 °C  3 60 ° C
4 72 °C  4 72 ° C
5 GOT O 2 29 t i me s  5 GOT O 2 29 t i me s
6 72。C 0: 30  6 72. C 0:30
7 10。C e v er  7 10. C e ver
8 END 当該 P C R終了後、 1 4バッチについて得られた 1 4 のサ ンプルから、 夫々の増幅産物を磁気ビーズによ り 以下のよ う に抽 出 した。 磁気 ビーズ ( Dynabeads M-280 Streptavidin, Dynal) を 4 0 x L分取 し、 4 0 0 /i L の 2 X B & W B u f f e r d で 2 回洗浄した。 洗浄後、 得られた磁気ビーズを8 END After the completion of the PCR, each amplification product was extracted from the 14 samples obtained for 14 batches using magnetic beads as follows. Magnetic beads (Dynabeads M-280 Streptavidin, Dynal) were collected in 40 × L fractions, and washed twice with 400 / i L of 2 XB & WB buffer. After washing, the obtained magnetic beads
2 0 0 μ し の 2 X Β & W B u f f e r 濁した。 次に、 この懸濁液に対して当該 1 4 のサンプノレの う ちの 1 つを 2 0200 μm of 2XΒ & WBuffer became cloudy. Next, one of the 14 sample sampnoles was added to this suspension for 20%.
0 At L加えて 温で 3 0分間撹拌した。 次に 、 2 0 0 μ Lの0 At L was added and the mixture was stirred at room temperature for 30 minutes. Next, 200 μL
2 X B & W B U f f e r で 2 回洗浄した。 更に 2 0 0 μ L の M i 1 1 i Q水で 1 回洗浄した。 洗浄後の磁気ビ一ズを回 収し、 1 0 0 β Lの M i l l i Q水 -に懸濁し 7 o 次に 、 これ を 9 4 °cで 拌しなが ら 1 0分間放置し 、 上澄みだけを素早 く 回収し、 増幅された核酸断片を抽出 し回収 した 。 以上の抽 出を 1 4 ノ^シチについての P C Rで得られた, 1 4 のサンプル について行い 、 増幅産物に由来する s s D N Aを 1 4種類得 た-。 The plate was washed twice with 2 X B & W B U f fer. Further, it was washed once with 200 μL of Mi 11 iQ water. The magnetic beads after washing were collected, suspended in 100 βL of Milli Q water-7 o, and then left standing for 10 minutes while stirring at 94 ° C, and the supernatant was removed. Was recovered quickly, and the amplified nucleic acid fragments were extracted and recovered. The above extraction was performed on 14 samples obtained by PCR on 14 nositi, and 14 types of ssDNA derived from the amplification product were obtained.
これらの s S D N Aを 1 サンプル当た り 1 枚のマイ ク ロア レイ の全てのクェルに対して 、 1 ゥエル当た り 4 4 μ Lずつ 添力 tl した。 ハィブ y ダイゼーショ ンを行つた後に G e n e Ρ i x 4 0 0 0 (Laser/PMT= 100/650)を用いてス キ ャ ン し、 Q u a n t A r r a y ( PerkinElmer (製造元) の ソ フ ト ゥ ェ ァ) を用いたヒ ス ト グラム法によ り 、 C y 3 に由来する蛍光 強度を定量した。  Each of these sSDNAs was added to each of the wells of one microarray per sample in an amount of 44 μL per 1 μl. After performing y-dimensioning, scan using Genexix400 (Laser / PMT = 100/650) and use the software of Quant Array (PerkinElmer (manufacturer)). The fluorescence intensity derived from Cy 3 was quantified by the histogram method using).
その結果を図 2 8 力 ら図 4 1 に示す。 夫々 のグラ フの横軸 には、 ゥヱルの番号を示し、 縦軸には蛍光強度を示した。 ゥ ェルの番号は、 各配列のネームに対応する The results are shown in Figs. The horizontal axis of each graph indicates the cell number, and the vertical axis indicates the fluorescence intensity.ゥ The number of each well corresponds to the name of each sequence.
図 2 f 、 当該マイ ク 口ア レイ に対して 、 バッチ 1 の増幅 産物に由来する s s D N Aを添加 した後に得られる各クェノレ からの蛍光強度を示 した。 バッチ 1 に含まれる配列を検出す るためのプロ一ブが固相化されたゥュルにわいて高い蛍光強 度が得られた 様に、 図 2 9 力、ら図 4 1 は 、 夫々ヽ ノ^ッチ FIG. 2f shows the fluorescence intensity from each quenole obtained after the addition of ssDNA derived from the amplification product of batch 1 to the microarray. As can be seen from the figure, as shown in FIG. 29, the high fluorescence intensity was obtained for the column on which the probe for detecting the sequence contained in batch 1 was immobilized. ^
2 からバッチ 1 4までの増幅産物に由来する s s D N Aを当 該マィ ク ロアレィ に対して添加した後に得られる各クェルか らの蛍光強度を示した。 図 2 9 力 ら図 4 1 についても 、 夫々 のノ^ Vチに含まれる配列を検出するためのプローブが固相化 されたウエノレに いて高い蛍光強度が得られ れらの結 果から 、 本発明に従 う正規直交化配列は 、 互いにク スハイ ブ V ダィゼーシ a ンを生じないこ とが明 らかになつた 発明の効果 The fluorescence intensity from each quell obtained after adding ssDNA from the amplification products from 2 to batch 14 to the microarray was shown. Fig. 29 and Fig. 41 also show that the probe for detecting the sequence contained in each of the sticks had a high fluorescence intensity obtained on the solid-phased probe. The effect of the invention in which the orthonormalized arrays according to the invention clearly show that they do not generate crosshive V-dimensions with each other.
本発明によつて 、 広い用途に対応し得る多く の候捕を含む 正規直交化配列群を設計する方法、 そのよ つ な方法によ り 設 計された配列に従つて核酸を合成する方法ヽ それによ り 合成 された核酸が提供された。  According to the present invention, a method for designing an orthonormalized sequence group including many markers that can be used for a wide range of uses, and a method for synthesizing a nucleic acid according to a sequence designed by such a method. The resulting nucleic acid was provided.

Claims

請 求 の 範 囲 The scope of the claims
1 . 正規直交化配列群の設計方法であって、  1. A method of designing an orthonormalized array group,
( 1 ) 無作為に作出された複数のラ ンダム配列から、 それ らの配列の融解温度の平均値を求める こ と と、  (1) From a plurality of randomly generated sequences, determine the average of the melting temperatures of those sequences.
( 2 ) 前記 ( 1 ) で求めた平均値を基に閾値を決定し、 こ の閾値と、 無作為に作出されたラ ンダム配列の融解温度と を 比較する こ と と、  (2) determining a threshold value based on the average value obtained in (1), and comparing the threshold value with the melting temperature of a randomly generated random sequence;
( 3 ) 前記 ( 2 ) の比較の結果から、 前記閾値によ り 制限 される一定範囲内の融解温度を有する塩基配列のみを選択し て、 候補配列群を得る こ と と、  (3) selecting only a base sequence having a melting temperature within a certain range limited by the threshold from the result of the comparison in (2) to obtain a candidate sequence group;
( 4 ) 前記 ( 3 ) で得られた候補配列群に含まれる夫々 の 塩基配列について、 独立して反応する配列であるか否かを確 認する こ と、  (4) confirming whether or not each base sequence contained in the candidate sequence group obtained in (3) above is a sequence that reacts independently;
( 5 ) 前記 ( 4 ) の確認の結果を基に、 独立して反応しな いと判定された配列を前記候補配列群から排除する こ と によ り 、 正規直交化配列群を形成する こ と と、 —— ——  (5) Forming an orthonormalized sequence group by excluding, from the candidate sequence group, sequences determined not to react independently based on the results of the confirmation in (4) above. When, -- --
を具備する正規直交化配列群の設計方法。 A method for designing an orthonormalized array group comprising:
2 . 正規直交化配列群の設計方法であって、 前記 ( 4 ) に 記載の確認する こ とが、 前記 ( 3 ) で得られた候補配列群に 含まれる配列について、  2. A method for designing an orthonormalized sequence group, wherein the confirmation described in (4) above is performed for the sequences included in the candidate sequence group obtained in (3) above.
( A ) 各配列における 自 己相補配列の存在、 および/ま たは  (A) the presence of a self-complementary sequence in each sequence and / or
( B ) 各配列の二次構造の安定性の程度、 並びに  (B) the degree of stability of the secondary structure of each sequence, and
( C ) 複数の配列の間でのク ロスハイプリ ダイゼーショ ンの存在、 を解析する と によ り 行われる方法。 (C) presence of cross-hybridization between multiple sequences, The method performed by analyzing the.
3 . 正規直交化配列群の設計方法であつて、 刖 ( 5 ) の 独立 して反応しないと の判定が 、  3. A method for designing an orthonormalized array group, and the judgment that 刖 (5) does not respond independently is as follows:
( a ) 1 の配列における 自 己相捕配列が存在する こ と、 (a) The existence of a self-trapping array in the array of 1
( b ) 1 の配列の二次構造の安定性の程度が高いこ と、 およぴ (b) the degree of stability of the secondary structure of sequence 1 is high; and
( c ) 複数の配列の間にク スハィ プ リ ダィゼ一シ ヨ ン が存在する と、  (c) If there is a cross predication between multiple sequences,
の少なく と も何れか 1 に該当する場合に下される こ と を具備 する請求項 1 または 2 の何れか 1 項に記載の方法。 3. A method according to any one of the preceding claims, characterized in that the method is performed if at least one of the above is true.
4 . 正規直交化配列群の設計方法であつて、 前記 ( 4 ) に 記載の確認する こ とが 、  4. A method for designing an orthonormalized array group, wherein the confirmation described in (4) above is performed by:
( A ) 各配列にねける 自 己相補配列の存在、  (A) Existence of self-complementary sequence to each sequence,
( B ) 各配列の二次構造の安定性の程度、 およ.び  (B) Degree of secondary structure stability of each sequence, and
( c ) 複数の配列の間でのク スノヽィ プ リ ダィゼーシ ョ ンの存在 、  (c) the existence of x-nosie pre-division between multiple sequences,
の順番で行われ、 且つ (A ) から ( C ) の何れ力 の段階で、 ( a ) 1 の配列における 自 己相捕配列が存在する こ と、 ( b ) 1 の配列の二次構造の安定性の程度が高いこ と、 および In the order of (A) to (C), at any stage of (A) to (C), the existence of a self-trapping sequence in the sequence of (a) 1 exists, and (b) the secondary structure of the A high degree of stability, and
( c ) 複数の配列の間にク スハィ ブ リ ダィゼ一シ ヨ ン が存在する こ と、  (c) that there is a cross-division between multiple sequences;
に該当する結果が得られた時点でヽ それ以降の解析は行わず に、 そのよ う な結果の得られたラ ンダム配列を当該前記候捕 配列群から排除する請求項 3 に記 の方法 The method according to claim 3, wherein, when a result corresponding to the above is obtained, the random sequence obtained such a result is excluded from the group of the catching sequences without performing further analysis.
5 . 前記 ( 1 ) に記載の複数のラ ンダム配列からなる第 1 の粗配列群と、 前記 ( 2 ) における比較に用いられる ラ ンダ ム配列からなる第 2 の粗配列群は 異なる群である請求項 1 カ ら 4の何れか 1 項に記載の方法 5. The first group of crude sequences consisting of a plurality of random sequences described in (1) and the second group of crude sequences consisting of random sequences used for comparison in (2) are different groups. The method according to any one of claims 1 to 4
6 . 前記 ( 1 ) に記載の複数の ラ ンダム配列 と 、 前記 6. The plurality of random arrangements according to (1);
( 2 ) における比較に用いられる ラ ンダム配列は、 何れも長 さが等しい配列である請求項 1 から 5 の何れカゝ 1 項に記載の 方法。 The method according to any one of claims 1 to 5, wherein the random sequences used for the comparison in (2) are all sequences having the same length.
7 . 前記 ( 1 ) に記載の複数のラ ンダム配列からなる第 1 の粗配列群と、 前記 ( 2 ) における比較に用いられる ラ ンダ ム配列からなる第 2 の粗配列群が等しい請求項 6 に記載の方 法。  7. The first group of coarse arrays consisting of a plurality of random sequences according to (1) is equal to the second group of random arrays consisting of random sequences used for comparison in (2). The method described in.
8 . 前記閾値で制限される範囲が 、 各長さ における T mの 分布を正規分布と見た場合の ± 1 σ に相当する温度範囲であ 8. The range limited by the threshold is a temperature range corresponding to ± 1σ when the distribution of T m at each length is regarded as a normal distribution.
O 青求項 1 カゝら 7 の何れカゝ 1 項に記載の方法。 O The method according to any one of Items 1 to 7 of the blue item.
9 . 前記 ( 4 ) における独立 して反応する配列であるか否 かを確認する こ とが、 前記 ( 3 ) で得られた候補配列群に含 まれる塩基配列について行われる と 同時に、 それと対になる 相補鎖についても、 本来対になるベきでない他の全ての配列 に対して独立して反応する配列であるか否かを確認する こ と を具備する請求項 1 から 8 の何れか 1 項に記載の方法。  9. Confirmation of whether or not the sequence reacts independently in the above (4) is performed on the base sequence included in the candidate sequence group obtained in the above (3), and at the same time, The method according to any one of claims 1 to 8, further comprising the step of confirming whether or not the complementary strand is a sequence that independently reacts with all other sequences that should not be a pair. The method described in the section.
1 0 . デジタルコ ン ピュータ にわいて実行される正規直交 化配列群の設計方法であって、  10 0. A method for designing an orthonormalized array group to be executed on a digital computer,
' ( 1 ) 演算手段によ り 、 複数のラ ンダム配列についての融 解温度の平均値が算出 され、 閾値が設定される こ と と、 ( 2 ) 比較手段によ り m BB ( 1 ) で BX Atされた閾値と、 ラ ンダム配列の融解温度と が比較される と と、 '(1) The arithmetic means calculates the average of the melting temperatures of the plurality of random arrays and sets the threshold value. (2) When the threshold value of BX At at m BB (1) is compared with the melting temperature of the random sequence by the comparing means,
( 3 ) 前記 ( 2 ) の比較の結果カ ら、 選択手段によ り 、 当 該閾値によ り制限される一定範囲に入る配列のみが選択され て、 それによつて侯補配列群を与える こ と と  (3) From the result of the comparison in the above (2), only sequences that fall within a certain range limited by the threshold value are selected by the selection means, thereby giving candidate sequences. And and
( 4 ) 判定手段によ り 、 刖目己 ( 3 ) で与えられた候補配列 群に含まれる塩基配列について 、 夫々が独 して反応する配 列であるか否かが判定され、 その結果から 独立して反応し ないと判定された配列が fu記候補配列群から排除され 、 正規 直交化配列群が形成される こ と と、  (4) The determination means determines whether or not each of the base sequences contained in the candidate sequence group given in item (3) is a sequence that independently reacts, and from the result, Sequences determined not to react independently are excluded from the fu candidate sequence group to form an orthonormalized sequence group, and
を具備する正規直交化配列群の設計方法 Method for Designing Orthonormalized Arrays with A
1 1 . デジタノレコ ンピ タ において 行される正規-直交 化配列群の設計方法でめつて、  1 1. For the design method of the orthonormalized array group performed in the digital computer,
( 1 ) 塩基配列無作 作出手段によつてラ ンダム配列が与 えられる こ と と、  (1) Random sequences are provided by means of base sequence random production, and
( 2 ) 前記 ( 1 ) によ り 与え られたラ ンダム配列の融解温 度が、 演算手段によつて与 られ、 その融解温度が記憶手段 に目 Ί思される こ と と  (2) The melting temperature of the random sequence given in (1) is given by the arithmetic means, and the melting temperature is stored in the storage means.
( 3 ) m記 ( 1 ) と前記 ( 2 ) の繰り 返しによ り 与え られ た複数の融解温度を基に 、 演算手段によつて融解温度の平均 値が与え られる こ と と  (3) The average value of the melting temperature is given by the arithmetic means based on the plurality of melting temperatures given by the repetition of the notation (1) and the above (2).
( 4 ) 記 ( 3 によ り 与え られた融解温度の平均値を基 に演算手段が閾値を与 、 比較手段が、 閾値の温度と、 塩基 配列無作為作出手段によつて与えられる ラ ンダム配列の融解 (4) The calculation means gives a threshold value based on the average value of the melting temperatures given in (3), and the comparison means gives the threshold temperature and a random sequence given by the base sequence random creation means. Melting
,
を比較する こ と と ( 5 ) 記 ( 4 ) の比較の結果を に、 当該閾値によ り 制 限される範囲内に融解温度を有する塩基配列を、 候補配列と して記 手段が Sし 1¾する こ と と、 To compare (5) Based on the result of the comparison in the above (4), the base means having a melting temperature within the range limited by the threshold value is set as a candidate sequence by the writing means, and
( 6 ) BU IB ^ 5 ) において記憶された候補配列群について、 判定手段が以下の ( A ) 力 ら ( C ) の事項についての判定を (6) For the candidate sequence group stored in BU IB ^ 5), the judgment means judges the following items (A) to (C).
·>- 行ラ と ·>-Line la and
( A ) 自 己相補配列を有する配列であるか否 ~hゝ、 および (A) whether the sequence has a self-complementary sequence ~ h ~, and
/または / Or
( B ) 二次構造の安定性の程度の高低 、 並びに  (B) the degree of stability of the secondary structure, and
( C ) ク π スノヽ ィ プリ ダィゼ ―ショ ンを有する配列であ るか否かヽ  (C) Whether the array has a π-snoopy pre-division
( 7 ) 刖記 ( 6 ) の判定の結果を基に、 選択手段が選択す るベき配列を選択する こ と によつて、 正規直交化配列群を設 (7) Based on the result of the judgment in (6), the orthonormalized array group is set by selecting the array to be selected by the selection means.
- 計する と と、  -When you measure
を 備する方法 How to prepare
1 2 • W1記 ( 1 ) における塩基配列無作為作出手段による - ランダム配列の付与が、 乱数の発生と 、 予め決め られた対応 付けに従つて当該発生された乱数から塩 & の置き換えを行 つ と によ り 達成される請求項 1 1 に記載の方法 o  1 2 • By means of base sequence random creation in W1 (1)-Assignment of random sequences generates random numbers and replaces salts & from the generated random numbers according to a predetermined correspondence. The method of claim 11, which is achieved by
1 3 • 請求項 1 から 1 2 の何れか 1 項に記載の方法によつ て設計された正規直交化配列群に含まれる塩基配列を基に、 当 塩基配列を有する核酸を少な く と ¾ 2種類以上合成する 1 3 • Based on the base sequence included in the orthonormalized sequence group designed by the method according to any one of claims 1 to 12, reduce the number of nucleic acids having the base sequence to a minimum. Combine two or more types
·>· と を具備する正規直交化配列でめる核酸群の製造方法 o ·> · A method for producing a nucleic acid group obtained by an orthonormalized sequence comprising and o
1 4 • 複数種類の配列を組み合わせて使用するための請求 項 1 3 に記載の製造方法によ り 製造された核酸 1 4 • A nucleic acid produced by the production method according to claim 13 for use by combining a plurality of types of sequences.
1 5 . 前記核酸がペプチ ド核酸である こ と を特徴とする請 求項 1 4 に記載の核酸。 15. The nucleic acid according to claim 14, wherein the nucleic acid is a peptide nucleic acid.
PCT/JP2004/005219 2003-04-11 2004-04-12 Method of designing normally orthogonalized sequences, method of producing nucleic acids being normally orthogonalized sequences and nucleic acids obtained thereby WO2004092376A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005505396A JPWO2004092376A1 (en) 2003-04-11 2004-04-12 Method for designing orthonormalized sequence group, method for producing nucleic acid group which is orthonormalized sequence, and nucleic acid obtained thereby

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003108126 2003-04-11
JP2003-108126 2003-04-11

Publications (1)

Publication Number Publication Date
WO2004092376A1 true WO2004092376A1 (en) 2004-10-28

Family

ID=33295879

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2004/005219 WO2004092376A1 (en) 2003-04-11 2004-04-12 Method of designing normally orthogonalized sequences, method of producing nucleic acids being normally orthogonalized sequences and nucleic acids obtained thereby

Country Status (2)

Country Link
JP (1) JPWO2004092376A1 (en)
WO (1) WO2004092376A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012046859A1 (en) * 2010-10-07 2012-04-12 日本碍子株式会社 Identifying information carrier for identifying subject to be identified and utilization of same

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
ISHIZUKA A.: "DNA computer wa naze ugoku", NIKKEI BIOBUSINESS, vol. 21, 15 January 2003 (2003-01-15), pages 96 - 101, XP002984684 *
ROSE J.A. ET AL.: "Equilibrium analysis of the efficiency of an autonomous molecular computer", PHYS. REVIEW E., vol. 65, no. 2-1, 2002, pages 021910-1 - 021910-13, XP002984685 *
TOYAMA A.: "DNA computer no genjo to shorai", COMPUTER TODAY, vol. 109, 2002, pages 11 - 16, XP002984687 *
TOYAMA A.: "Hanyo-gata DNA computer o mezashite", CELL TECHNOLOGY, vol. 22, no. 3, 22 February 2003 (2003-02-22), pages 348 - 352, XP002984688 *
TOYAMA A.: "Hybrid DNA computer no hardware", THE JOURNAL OF THE INSTITUTE OF ELECTRICAL ENGINEERS OF JAPAN, vol. 122, no. 3, 2002, pages 160 - 163, XP002984686 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012046859A1 (en) * 2010-10-07 2012-04-12 日本碍子株式会社 Identifying information carrier for identifying subject to be identified and utilization of same

Also Published As

Publication number Publication date
JPWO2004092376A1 (en) 2006-07-06

Similar Documents

Publication Publication Date Title
AU2018210188B2 (en) Methods and systems for generation and error-correction of unique molecular index sets with heterogeneous molecular lengths
Kumar et al. SNP discovery through next-generation sequencing and its applications
Sperschneider et al. DotKnot: pseudoknot prediction using the probability dot plot under a refined energy model
Zuker Calculating nucleic acid secondary structure
AU2008201349B2 (en) Families of non-cross-hybridizing polynucleotides for use as tags and tag complements, manufacture and use thereof
EP2459753B1 (en) Sequence calibration method and sequence calibration device
CN110021351B (en) Method and system for analyzing base linkage strength and genotyping
US20150310165A1 (en) Efficient comparison of polynucleotide sequences
JP2022533801A (en) Fast forward sequencing by synthesis
US7167847B2 (en) DNA computer and a computation method using the same
JP5229895B2 (en) Nucleic acid standards
WO2004092376A1 (en) Method of designing normally orthogonalized sequences, method of producing nucleic acids being normally orthogonalized sequences and nucleic acids obtained thereby
US20160055293A1 (en) Systems, Algorithms, and Software for Molecular Inversion Probe (MIP) Design
US6994965B2 (en) Method for displaying results of hybridization experiment
Tulpan Recent patents and challenges on DNA microarray probe design technologies
KR101205619B1 (en) Design and selection of genetic targets for sequence resolved organism detection and identification
US7745117B2 (en) Methods for incorporating non-perfectly matched oligonucleotides into target-specific hybridization sequences
KR102322308B1 (en) Apparatus and method for expanding the amount of omics sequencing data from partial omics sequencing data
CN105787294A (en) Method for determining probe set, kit and use thereof
JP2005516296A5 (en)
Garbarine et al. An information theoretic method of microarray probe design for genome classification
US20050176007A1 (en) Discriminative analysis of clone signature
Rahmann Algorithms for probe selection and DNA microarray design.
Kamil et al. Computational Aspects of DNA Sequencing by Hybridization–a Survey
US7872120B2 (en) Methods for synthesizing a collection of partially identical polynucleotides

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LU MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2005505396

Country of ref document: JP

122 Ep: pct application non-entry in european phase