JP2011062085A - Apparatus for searching primer set, method and program for searching primer set - Google Patents

Apparatus for searching primer set, method and program for searching primer set Download PDF

Info

Publication number
JP2011062085A
JP2011062085A JP2009212703A JP2009212703A JP2011062085A JP 2011062085 A JP2011062085 A JP 2011062085A JP 2009212703 A JP2009212703 A JP 2009212703A JP 2009212703 A JP2009212703 A JP 2009212703A JP 2011062085 A JP2011062085 A JP 2011062085A
Authority
JP
Japan
Prior art keywords
primer
primer set
target gene
search
primers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009212703A
Other languages
Japanese (ja)
Inventor
Ko Fujifuchi
航 藤渕
Keiwa Chiba
啓和 千葉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
National Institute of Advanced Industrial Science and Technology AIST
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute of Advanced Industrial Science and Technology AIST filed Critical National Institute of Advanced Industrial Science and Technology AIST
Priority to JP2009212703A priority Critical patent/JP2011062085A/en
Publication of JP2011062085A publication Critical patent/JP2011062085A/en
Pending legal-status Critical Current

Links

Abstract

<P>PROBLEM TO BE SOLVED: To provide a method for searching for a primer set useful for sequencing a number of target genes with little cross hybridization with non-target genes. <P>SOLUTION: The method comprises: a step in which a database is constructed from whether hybridization of the candidate primers to be included in the primer set with the target genes and plural non-target genes occurs or not; a step in which the initial primer set is generated at random; and a searching step in which the following process is repeatedly conducted: the each evaluated value of the plural primer sets formed by exchanging a primer of the primer sets with plural other candidate primers are calculated based on the rates at which the primer sets hybridize with the target genes and the non-target genes, Ct and Cn, respectively; the primer sets are subjected to stochastic selection based on the calculated evaluated value; and the data of the primer set and its evaluated value are stored in the memory device. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、プライマーの探索を行う装置および方法に関し、特に大規模シークエンシングによる遺伝子発現量測定に用いる複数のプライマーの組み合わせ(以下、「プライマーセット」という)の探索に関する。   The present invention relates to an apparatus and method for searching for primers, and more particularly to searching for a combination of a plurality of primers (hereinafter referred to as “primer sets”) used for gene expression level measurement by large-scale sequencing.

近年DNAシークエンシングの分野では急速な大規模化が進み、ターゲット遺伝子を特定するために用いるプライマー配列に関しても、計算機を用いた大規模な設計が必要になってきている。   In recent years, in the field of DNA sequencing, rapid scale-up has progressed, and it has become necessary to design a large-scale design using a computer for primer sequences used to identify target genes.

プライマーを用いてターゲットとなる遺伝子群を特定し、配列を決定することにより、遺伝子発現量を絶対定量することが可能である。多数の遺伝子の発現量を一度に測定する実験は、生物学上重要であるが、多数の遺伝子群の発現量を効率よく測定するためには、1つのプライマーで複数の遺伝子を特定できるようなプライマーを、適切な組み合わせで用いる必要がある。   By specifying a target gene group using a primer and determining the sequence, it is possible to absolute quantitate the gene expression level. Experiments that measure the expression level of a large number of genes at once are important in biology, but in order to efficiently measure the expression level of a large number of genes, multiple genes can be identified with a single primer. Primers should be used in appropriate combinations.

少数のプライマーでなるべく多くの遺伝子を特定する試みは、これまでにもPCRの分野で行われてきた(例えば非特許文献1)。しかし、これらの研究において想定されているターゲット遺伝子の数は百遺伝子程度であった。   Attempts to identify as many genes as possible with a small number of primers have been made in the field of PCR (for example, Non-Patent Document 1). However, the number of target genes assumed in these studies was about one hundred genes.

Pesole G.他 著「GeneUp: a program to select short PCR primer pairs that occur in multiple members of sequence lists.」Biotechniques,1998 vol. 25, no1, pp. 112-123Pesole G. et al., “GeneUp: a program to select short PCR primer pairs that occur in multiple members of sequence lists.” Biotechniques, 1998 vol. 25, no1, pp. 112-123

多数のターゲット遺伝子および非ターゲット遺伝子を対象とした場合、プライマーの候補配列は膨大となる。全ての組み合わせを調べるには非現実的な時間が必要となる。一方で、非特許文献1で用いられているような、発見的なアルゴリズムを用いた探索では、局所最適解に陥る可能性がある。現実的な時間内に、最適なもしくは準最適な組み合わせを計算するアルゴリズムが必要である。   When a large number of target genes and non-target genes are targeted, the candidate sequences for primers are enormous. Examining all combinations requires unrealistic time. On the other hand, a search using a heuristic algorithm as used in Non-Patent Document 1 may fall into a local optimal solution. There is a need for an algorithm that calculates an optimal or sub-optimal combination within a realistic time.

また、シークエンシングにおいて、クロスハイブリダイゼーションが起きると、目的外の遺伝子が増幅されてしまう。従って、限られた種類のプライマーで、多くの目的遺伝子群をシークエンシングするために、クロスハイブリダイゼーションを最小限に抑えることが重要になる。   In addition, when cross-hybridization occurs in sequencing, a non-target gene is amplified. Therefore, it is important to minimize cross-hybridization in order to sequence many gene groups with a limited number of primers.

非特許文献1に記載されたプログラムは、排除したい少数の遺伝子配列リストを指定するオプション機能を有している。このオプション機能を利用して、目的としない遺伝子にハイブリダイズするプライマーを探索の対象から除外することにより、クロスハイブリダイゼーションを防止することができる。しかし、この方法では、排除したい遺伝子が多数となった場合には、探索対象のプライマーが大幅に限定されてしまう。   The program described in Non-Patent Document 1 has an optional function for designating a small number of gene sequence lists to be excluded. By utilizing this optional function, a primer that hybridizes to an unintended gene is excluded from the search target, thereby preventing cross-hybridization. However, in this method, when there are a large number of genes to be excluded, primers to be searched are greatly limited.

本発明は、上記背景に鑑み、非目的遺伝子群へのクロスハイブリダイゼーションが少なく、多くの目的遺伝子群をシークエンシングすることができるプライマーセットを、大規模に探索することのできるプライマー探索装置を提供することを目的とする。   In view of the above background, the present invention provides a primer search apparatus capable of searching a large-scale primer set that can sequence many target gene groups with little cross-hybridization to non-target gene groups. The purpose is to do.

本発明のプライマーセット探索方法は、目的遺伝子にハイブリダイズするプライマーセットを探索するための方法であって、複数の目的遺伝子と複数の非目的遺伝子の配列を入力するステップと、プライマーセットに含めるプライマーの探索条件を入力するステップと、前記探索条件に合致するプライマー候補が前記複数の目的遺伝子および前記複数の非目的遺伝子のそれぞれにハイブリダイズするか否かを求め、その結果を記憶したデータベースを生成するステップと、前記プライマーセットに含める個数のプライマーを前記プライマー候補からランダムに選択して初期のプライマーセットを生成するステップと、(1)プライマーセットに含まれるプライマーから一つのプライマーをランダムに選択し、(2)選択したプライマーを複数のプライマー候補のそれぞれと交換したときに生成される複数のプライマーセットについて、ハイブリダイズする目的遺伝子の割合Ctおよび非目的遺伝子の割合Cnを前記データベースに記憶されたデータに基づいて求め、(3)前記目的遺伝子の割合Ctと前記非目的遺伝子の割合Cnとに基づいて、複数のプライマーセットのそれぞれの評価値を計算し、(4)前記評価値に応じた確率値を与える確率分布と前記複数のプライマーセットのそれぞれの評価値とに基づいて、前記複数のプライマーセットから一つのプライマーセットを選択し、(5)選択したプライマーセットとその評価値を記憶部に記憶する、上記(1)〜(5)の処理を繰り返し行う探索ステップと、前記記憶部に記憶された複数のプライマーセットの中でその評価値が最も高かったプライマーセットを探索結果として出力するステップとを備える。   The primer set search method of the present invention is a method for searching for a primer set that hybridizes to a target gene, the step of inputting sequences of a plurality of target genes and a plurality of non-target genes, and primers included in the primer set A search condition is input, and whether or not primer candidates that match the search condition hybridize to each of the plurality of target genes and the plurality of non-target genes is generated, and a database storing the results is generated A step of randomly selecting the number of primers to be included in the primer set from the candidate primers to generate an initial primer set, and (1) randomly selecting one primer from the primers included in the primer set. (2) Multiple selected primers For a plurality of primer sets generated when exchanged with each of the primer candidates, the ratio Ct of the target gene to hybridize and the ratio Cn of the non-target gene are determined based on the data stored in the database, (3) Based on the ratio Ct of the target gene and the ratio Cn of the non-target gene, each evaluation value of the plurality of primer sets is calculated, and (4) a probability distribution that gives a probability value corresponding to the evaluation value and the plurality of the plurality of primer sets Based on each evaluation value of the primer set, one primer set is selected from the plurality of primer sets, and (5) the selected primer set and its evaluation value are stored in the storage unit, (1) to (1) 5) a search step for repeatedly performing the process, and evaluation of the plurality of primer sets stored in the storage unit There and a step of outputting as a search result highest was primer set.

本発明によれば、ハイブリダイズする目的遺伝子の割合Ctと非目的遺伝子の割合Cnとに基づいて計算した評価値を用いてプライマーセットを探索するので、非目的遺伝子へのクロスハイブリダイゼーションが少なく、かつ、多くの目的遺伝子にハイブリダイズするプライマーの組み合わせを求めることができる。   According to the present invention, since the primer set is searched using the evaluation value calculated based on the ratio Ct of the target gene to hybridize and the ratio Cn of the non-target gene, there is little cross-hybridization to the non-target gene, In addition, combinations of primers that hybridize to many target genes can be obtained.

実施の形態のプライマーセット探索装置の構成を示す図である。It is a figure which shows the structure of the primer set search apparatus of embodiment. 配列特異性データベースに記憶されたデータの例を示す図である。It is a figure which shows the example of the data memorize | stored in the sequence specificity database. 配列特異性を計算する専用回路について説明する。A dedicated circuit for calculating sequence specificity will be described. 配列特異性の計算に要する時間を示す図である。It is a figure which shows the time which calculation of sequence specificity requires. プライマーセット探索装置のハードウェア構成を示す図である。It is a figure which shows the hardware constitutions of a primer set search device. 実施の形態のプライマーセット探索装置の動作を示す図である。It is a figure which shows operation | movement of the primer set search apparatus of embodiment. プライマーの組み合わせ探索の動作を示す図である。It is a figure which shows the operation | movement of a primer combination search. 評価値について説明するための図である。It is a figure for demonstrating an evaluation value. プライマーセットを選択するための確率分布を示す図である。It is a figure which shows the probability distribution for selecting a primer set.

以下、本発明の実施の形態のプライマーセット探索装置およびプライマーセット探索方法について図面を参照しながら説明する。   Hereinafter, a primer set search device and a primer set search method according to an embodiment of the present invention will be described with reference to the drawings.

(第1の実施の形態)
図1は、第1の実施の形態のプライマーセット探索装置10の構成を示す図である。プライマーセット探索装置10は、cDNAライブラリ30に接続されている。cDNAライブラリ30には、cDNAの配列と、そのcDNAによって発現されるタンパク質の特徴(ヒト転写遺伝子、ハウスキーピング遺伝子等)が関連付けて記憶されている。cDNAライブラリ30には、例えば、数万個のcDNAのデータが記憶されている。
(First embodiment)
FIG. 1 is a diagram illustrating a configuration of a primer set search apparatus 10 according to the first embodiment. The primer set search device 10 is connected to the cDNA library 30. The cDNA library 30 stores the cDNA sequence in association with the characteristics of the protein expressed by the cDNA (human transcriptional gene, housekeeping gene, etc.). In the cDNA library 30, for example, data of tens of thousands of cDNAs are stored.

プライマーセット探索装置10は、cDNAライブラリ30から目的遺伝子を入力する目的遺伝子入力部11と、非目的遺伝子を入力する非目的遺伝子入力部12とを有している。目的遺伝子入力部11は、オペレータが目的遺伝子として取得したいcDNAの特徴のデータを入力すると、その特徴に関連付けられたcDNAをcDNAライブラリ30から読み出す。同様に、非目的遺伝子入力部12は、オペレータが非目的遺伝子としたいcDNAの特徴のデータを入力すると、その特徴に関連付けられたcDNAをcDNAライブラリ30から読み出す。   The primer set search apparatus 10 has a target gene input unit 11 for inputting a target gene from the cDNA library 30 and a non-target gene input unit 12 for inputting a non-target gene. When the operator inputs the data of the characteristics of the cDNA that the operator wants to acquire as the target gene, the target gene input unit 11 reads the cDNA associated with the characteristics from the cDNA library 30. Similarly, the non-target gene input unit 12 reads out the cDNA associated with the feature from the cDNA library 30 when the operator inputs the data of the feature of the cDNA desired to be the non-target gene.

プライマーセット探索装置10は、探索条件入力部13を有している。探索条件入力部13は、プライマーセットに含めるプライマーの個数と、プライマーの塩基長のデータの入力を受け付ける。探索条件の例としては、例えば、塩基長:10nt、プライマー数:20個である。この探索条件により、目的遺伝子をなるべくカバーして、非目的遺伝子をなるべくカバーしないような、例えば10ntのプライマー20個の組み合わせ(プライマーセット)を探索する。   The primer set search device 10 has a search condition input unit 13. The search condition input unit 13 receives input of the number of primers included in the primer set and the base length data of the primers. Examples of search conditions are, for example, base length: 10 nt and number of primers: 20. Based on this search condition, a search is made for a combination (primer set) of, for example, 20 primers of 10 nt that covers the target gene as much as possible and does not cover the non-target gene as much as possible.

プライマーセット探索装置10は、配列特異性計算部14を備えている。配列特異性計算部14は、探索条件として入力された塩基長のすべてのプライマー候補について、目的遺伝子および非目的遺伝子にハイブリダイズするか否かを求める機能を有している。例えば、10ntのプライマーであれば、410個のプライマー候補が存在する。このすべてのプライマー候補と、目的遺伝子および非目的遺伝子とのハイブリダイゼーションの可否を総当たりで計算し、その結果を配列特異性データベース(以下、「配列特異性DB」という)15に記憶する。 The primer set search apparatus 10 includes a sequence specificity calculation unit 14. The sequence specificity calculation unit 14 has a function of determining whether or not all candidate primers having a base length input as search conditions are hybridized to a target gene and a non-target gene. For example, if the primer is 10 nt, there are 410 candidate primers. Whether all of these primer candidates can be hybridized with the target gene and the non-target gene is calculated by brute force, and the result is stored in a sequence specificity database (hereinafter referred to as “sequence specificity DB”) 15.

プライマー候補が遺伝子(目的遺伝子、非目的遺伝子)にハイブリダイズするか否かは、遺伝子にプライマー候補の配列と相補的な配列が含まれているか否かによって判定する。遺伝子にプライマー候補の配列と相補的な配列を含む場合には、プライマー候補はその遺伝子にハイブリダイズすると判定する。プライマー候補の配列の全塩基に対して相補的でない場合にも、相補的な塩基を所定の割合(例えば、8割)以上含む配列が存在する場合には、その遺伝子にハイブリダイズすると判定してもよい。どの程度のマッチング率によってハイブリダイズすると判定するかの閾値は、当業者が適切に設定することが可能である。   Whether or not a primer candidate hybridizes to a gene (target gene, non-target gene) is determined by whether or not the gene contains a sequence complementary to the primer candidate sequence. If the gene contains a sequence complementary to the sequence of the candidate primer, it is determined that the candidate primer hybridizes to the gene. Even if it is not complementary to all the bases of the candidate primer sequence, if there is a sequence containing more than a predetermined percentage (for example, 80%) of complementary bases, it is determined to hybridize to that gene. Also good. The threshold for determining the degree of matching to be hybridized can be appropriately set by those skilled in the art.

図2は、配列特異性DB15に記憶されたデータの例を示している。ここでは簡単のため、目的遺伝子T1〜T6、非目的遺伝子N1〜N6に対して、プライマー候補P1〜P6がハイブリダイズするか否かのデータを示している。図中に「○」が記載してある組み合わせは、ハイブリダイズすることを示している。例えば、プライマー候補P1は、目的遺伝子T1、T3、T4と非目的遺伝子N1に対してハイブリダイズし、それ以外の遺伝子に対してはハイブリダイズしない。なお、配列特異性DB15には、目的遺伝子T1〜T6のいずれにもハイブリダイズしないプライマー候補は記憶しなくてもよい。すなわち、目的遺伝子T1〜T6のいずれにもハイブリダイズしないプライマーはプライマー候補から除外する。   FIG. 2 shows an example of data stored in the sequence specificity DB 15. Here, for the sake of simplicity, data on whether or not candidate primers P1 to P6 hybridize to the target genes T1 to T6 and the non-target genes N1 to N6 are shown. Combinations indicated by “◯” in the figure indicate that they are hybridized. For example, the candidate primer P1 hybridizes to the target genes T1, T3, T4 and the non-target gene N1, and does not hybridize to other genes. The sequence specificity DB 15 may not store candidate primers that do not hybridize to any of the target genes T1 to T6. That is, primers that do not hybridize to any of the target genes T1 to T6 are excluded from candidate primers.

配列特異性計算部14は、プライマー候補と遺伝子との膨大な数の組み合わせについて配列特異性計算を行う必要があるので、計算を高速に行うため、FPGA(Field Programmable Gate Array)等により専用回路を構成してもよい。専用回路については、後述する。   Since the sequence specificity calculation unit 14 needs to perform sequence specificity calculation for a huge number of combinations of primer candidates and genes, a dedicated circuit is used by FPGA (Field Programmable Gate Array) or the like for high speed calculation. It may be configured. The dedicated circuit will be described later.

プライマーセット探索装置10は、プライマー候補のTm値を計算する熱力学特性計算部16を備えている。Tm値は、プライマーのうち半数がターゲットの遺伝子にハイブリダイズする温度である。熱力学特性計算部16は、まず、プライマー配列とターゲット配列から、最近接塩基対法(Nearest Neighbor法)を用いて、ハイブリダイゼーション反応におけるギブス自由エネルギー変化ΔGを計算する。この際、熱力学特性計算部16は、Mg2+やNaなどのイオン濃度を考慮してもよい。 The primer set search apparatus 10 includes a thermodynamic characteristic calculation unit 16 that calculates Tm values of primer candidates. The Tm value is the temperature at which half of the primers hybridize to the target gene. The thermodynamic characteristic calculation unit 16 first calculates the Gibbs free energy change ΔG in the hybridization reaction from the primer sequence and the target sequence using the nearest base pair method (Nearest Neighbor method). At this time, the thermodynamic characteristic calculation unit 16 may consider the ion concentration of Mg 2+ , Na + or the like.

次に、下記の式(1)を用いて、温度Tにおけるハイブリダイゼーションの割合fを求める。
Next, the hybridization rate f at temperature T is determined using the following equation (1).

ここで、プライマー濃度Cp、気体定数Rには、実際にプライマーを用いてシークエンシングするときの条件を設定する。例えば、プライマー濃度Cpを0.5(μmol/l)、気体定数Rを1.9872(cal/mol K)とすることができる。熱力学特性計算部16は、f=0.5となるTを求め、Tm値とする。   Here, the primer concentration Cp and the gas constant R are set with conditions for actual sequencing using primers. For example, the primer concentration Cp can be 0.5 (μmol / l) and the gas constant R can be 1.9872 (cal / mol K). The thermodynamic characteristic calculation unit 16 obtains T at which f = 0.5 and sets it as the Tm value.

プライマーセット探索装置10は、プライマーセットを用いる温度条件として温度Tcを入力する温度条件入力部17を有している。温度条件入力部17は、温度条件Tcの上限値と下限値の入力を受け付ける。また、プライマーセット探索装置10は、温度条件Tcに合致しないTm値を有するプライマー候補を除外して配列特異性DB15を更新するデータベース更新部(以下、「DB更新部」という)18を備えている。   The primer set search apparatus 10 has a temperature condition input unit 17 that inputs a temperature Tc as a temperature condition using the primer set. The temperature condition input unit 17 receives input of an upper limit value and a lower limit value of the temperature condition Tc. In addition, the primer set search apparatus 10 includes a database update unit (hereinafter referred to as “DB update unit”) 18 that updates the sequence specificity DB 15 by excluding primer candidates having Tm values that do not match the temperature condition Tc. .

プライマーセット探索装置10は、配列特異性DB15に記憶されたデータを用いて、目的遺伝子になるべく多くハイブリダイズすると共に、非目的遺伝子に対するクロスハイブリダイゼーションがなるべく少ないプライマーセットを探索するプライマーセット探索部19を有している。プライマーセットの探索アルゴリズムについては後述する。   The primer set search device 10 uses the data stored in the sequence specificity DB 15 to hybridize as much as possible to the target gene and to search for a primer set with as little cross hybridization to the non-target gene as possible. have. The primer set search algorithm will be described later.

プライマーセット探索装置10は、プライマーセット探索部19にて探索されたプライマーセットを出力する出力部20を有している。出力部20は、探索されたプライマーセットを表示してもよいし、探索結果を他の装置に対して送信することにより、他の装置から出力させてもよい。   The primer set search apparatus 10 has an output unit 20 that outputs the primer set searched by the primer set search unit 19. The output unit 20 may display the searched primer set, or may output the search result from another device by transmitting the search result to the other device.

図3を参照して、配列特異性計算部14を構成する専用回路について説明する。図3では、b塩基長のプライマー候補と、目的遺伝子および非目的遺伝子とを比較する例を示している。図3では、プライマー候補の相補配列を「クエリー配列」、目的遺伝子及び非目的遺伝子を「データベース配列」と記載している。   With reference to FIG. 3, the dedicated circuit constituting the sequence specificity calculation unit 14 will be described. FIG. 3 shows an example in which a b-base length primer candidate is compared with a target gene and a non-target gene. In FIG. 3, the complementary sequence of the candidate primer is described as “query sequence”, and the target gene and non-target gene are described as “database sequence”.

専用回路は、塩基長b(nt)の配列どうしがマッチするかどうかを比較する配列比較ユニット40を有している。比較対象の配列に含まれる塩基を並列的に比較する。図3では、比較対象として塩基長b(nt)の2つの配列が入力され、配列に含まれるb個の塩基が同時に比較される。   The dedicated circuit has a sequence comparison unit 40 that compares whether the sequences having the base length b (nt) match each other. The bases contained in the sequences to be compared are compared in parallel. In FIG. 3, two sequences having a base length b (nt) are input as comparison targets, and b bases included in the sequences are simultaneously compared.

配列比較ユニット40には、閾値が入力される。配列比較ユニット40は、配列のマッチング率が閾値より高い場合に、ヒットすると判定する。例えば、閾値として「10」が入力された場合には、配列中の塩基のうちの10塩基以上が一致すれば、ヒットと判定する。なお、配列比較ユニット40に入力される閾値は、探索条件として入力された塩基長とマッチング率から計算される。配列比較ユニット40は、比較結果に基づいて「hit」情報を出力する。「hit」情報の値は、例えば、マッチした塩基数が閾値以上の場合に「1」、閾値未満の場合に「0」とする。   A threshold value is input to the sequence comparison unit 40. The sequence comparison unit 40 determines that a hit occurs when the sequence matching rate is higher than the threshold. For example, when “10” is input as the threshold value, a hit is determined if 10 or more of the bases in the sequence match. Note that the threshold value input to the sequence comparison unit 40 is calculated from the base length input as the search condition and the matching rate. The sequence comparison unit 40 outputs “hit” information based on the comparison result. The value of the “hit” information is, for example, “1” when the number of matched bases is greater than or equal to a threshold, and “0” when less than the threshold.

専用回路は、上記した配列比較ユニット40が32個集まって、32並列配列比較回路41を構成している。32並列配列比較回路41は、b塩基長の配列を(b+31)塩基長の配列を比較して32ビットの情報(「hit」)を出力する。専用回路は、さらに、32並列比較回路41を2並列化している。以上の構成により、専用回路は、スループットの高い配列特異性計算を行うことができる。   The dedicated circuit constitutes a 32 parallel arrangement comparison circuit 41 by collecting 32 arrangement comparison units 40 described above. The 32-parallel sequence comparison circuit 41 compares the b-base length sequence with the (b + 31) base-length sequence and outputs 32-bit information (“hit”). The dedicated circuit further has two parallel comparison circuits 41 in parallel. With the above configuration, the dedicated circuit can perform sequence specificity calculation with high throughput.

また、配列特異性計算のスループットをさらに高めるために、ターゲット遺伝子の配列を、1クロックで2塩基分シフトするシフト型のレジスタに収納し、計算対象であるレジスタの下位ビットのみを比較回路につないでもよい。通常は、比較回路への入力として、レジスタに収めたプライマー候補配列を用いるが、多数のプライマー候補について計算を行うには、レジスタの内容を入れ替えなければならない。上記した構造によって、比較回路への入力を、少ない論理リソースで高速に入れ替えることができ、下流に接続された32並列配列比較回路41のスループットを最大限に引き出すことができる。   In order to further increase the throughput of sequence specificity calculation, the target gene sequence is stored in a shift-type register that shifts by 2 bases in one clock, and only the lower bits of the register to be calculated are connected to the comparison circuit. But you can. Normally, primer candidate sequences stored in a register are used as an input to the comparison circuit. However, in order to calculate a large number of primer candidates, the contents of the register must be exchanged. With the above-described structure, the input to the comparison circuit can be switched at high speed with a small number of logical resources, and the throughput of the 32 parallel array comparison circuits 41 connected downstream can be maximized.

図4は、配列特異性(アラインメント)の計算時間を示す図である。実験条件は、ヒトERBB遺伝子3’端のプライマー候補配列(25nt)488個と、ヒトmRNAデータベースとのギャップなしアラインメントを行い、ヒットの閾値を80%として計算するのに要する時間を測定した(CPU:IntelXeon3.8GHz,OS:Linux)。C言語で実装したNaiveでは10000秒以上かかり、高速アライメントソフトウェアLASTを用いても1000秒近くかかった。FPGAに、上記専用回路を構成したシステムでは、10秒強でアライメントが可能であった。以上、配列特異性計算部14を構成する専用回路について説明した。   FIG. 4 is a diagram showing the calculation time of sequence specificity (alignment). The experimental condition was that 488 candidate primer sequences (25 nt) at the 3 ′ end of the human ERBB gene were aligned with the human mRNA database without gaps, and the time required to calculate the hit threshold as 80% was measured (CPU : Intel Xeon 3.8 GHz, OS: Linux). In the case of Naive implemented in C language, it took more than 10,000 seconds, and even using the high-speed alignment software LAST, it took nearly 1000 seconds. In a system in which the dedicated circuit is configured in the FPGA, alignment was possible in just over 10 seconds. Heretofore, the dedicated circuit constituting the sequence specificity calculation unit 14 has been described.

図5は、上記に説明したプライマーセット探索装置10のハードウェア構成を示す図である。プライマーセット探索装置10は、CPU50、RAM51、ROM52、通信インターフェース54、ハードディスク55、操作部56、ディスプレイ57がデータバス59によって接続されたコンピュータによって構成される。また、上記した配列特異性を計算する専用回路を有するFPGAボード58がコンピュータに装着される。CPU50が、ROM52に書き込まれたプログラム53に従って演算処理を実行することにより、上記したプライマーセット探索装置10の機能が実現される。このようなプログラム53は、本発明の範囲に含まれる。ハードディスク55には、配列特異性DB15のデータが記憶される。   FIG. 5 is a diagram showing a hardware configuration of the primer set search apparatus 10 described above. The primer set search apparatus 10 is configured by a computer in which a CPU 50, a RAM 51, a ROM 52, a communication interface 54, a hard disk 55, an operation unit 56, and a display 57 are connected by a data bus 59. Further, the FPGA board 58 having a dedicated circuit for calculating the sequence specificity is mounted on the computer. The function of the primer set search device 10 described above is realized by the CPU 50 executing arithmetic processing according to the program 53 written in the ROM 52. Such a program 53 is included in the scope of the present invention. The hard disk 55 stores data of the sequence specificity DB 15.

図6は、本実施の形態のプライマーセット探索装置10の動作を示す図である。まず、プライマーセット探索装置10は、目的遺伝子配列および非目的遺伝子配列の入力を受け付ける(S10)。具体的には、オペレータが、目的遺伝子の特徴および非目的遺伝子の特徴を指定すると、プライマーセット探索装置10は、その特徴に合致する目的遺伝子配列および非目的遺伝子配列をcDNAライブラリ30から読み出す。   FIG. 6 is a diagram illustrating the operation of the primer set search apparatus 10 of the present embodiment. First, the primer set search device 10 receives input of a target gene sequence and a non-target gene sequence (S10). Specifically, when the operator specifies the characteristics of the target gene and the characteristics of the non-target gene, the primer set search apparatus 10 reads out the target gene sequence and the non-target gene sequence that match the characteristics from the cDNA library 30.

次に、プライマーセット探索装置10は、探索条件として、プライマーセットに含めるプライマーの塩基長と、プライマーセットに含めるプライマーの数と、温度条件Tcの入力を受け付ける(S12)。プライマーセット探索装置10は、入力された塩基長のすべてのプライマーをプライマーセットに含めるプライマーの候補として扱う。   Next, the primer set search apparatus 10 receives input of the base length of the primer included in the primer set, the number of primers included in the primer set, and the temperature condition Tc as search conditions (S12). The primer set search apparatus 10 treats all primers having the input base length as candidate primers to be included in the primer set.

続いて、プライマーセット探索装置10は、それぞれのプライマー候補が、目的遺伝子および非目的遺伝子にハイブリダイズするか否かを計算し、計算結果に基づいて、図2に示すような配列特異性DB15を生成する(S14)。ここでは、ターゲットの遺伝子配列が、プライマーの配列に対して所定の閾値以上の割合でマッチングする相補的な配列を含んでいる場合に、ハイブリダイズすると判定する。この閾値は、システムの設計により適切に設定することができる。配列特異性DB15の生成に際して、いずれの目的遺伝子にもハイブリダイズしないプライマーは、プライマー候補から除外し、配列特異性DB15には含めないこととしてもよい。   Subsequently, the primer set search apparatus 10 calculates whether or not each candidate primer hybridizes to the target gene and the non-target gene, and based on the calculation result, the sequence specificity DB 15 as shown in FIG. Generate (S14). Here, when the target gene sequence includes a complementary sequence that matches the primer sequence at a ratio equal to or higher than a predetermined threshold value, it is determined to hybridize. This threshold value can be appropriately set depending on the system design. In the generation of the sequence specificity DB15, primers that do not hybridize to any target gene may be excluded from the primer candidates and not included in the sequence specificity DB15.

プライマーセット探索装置10は、最近接塩基対法(Nearest Neighbor法)を用いて、配列特異性DB15に記憶されたプライマー候補のTm値を求める。続いて、求めたTm値と入力された温度条件Tcとに基づいて、配列特異性DB15のデータを更新する(S16)。具体的には、温度条件Tcに合致しないTm値を有するプライマー候補を配列特異性DB15から削除する。このようなプライマー候補をあらかじめ配列特異性DB15から除外しておくことにより、プライマーセット探索のための計算の負荷を軽減できる。   The primer set search apparatus 10 obtains the Tm value of the candidate primer stored in the sequence specificity DB 15 using the nearest base pair method (Nearest Neighbor method). Subsequently, the data of the sequence specificity DB 15 is updated based on the obtained Tm value and the input temperature condition Tc (S16). Specifically, primer candidates having Tm values that do not match the temperature condition Tc are deleted from the sequence specificity DB 15. By excluding such primer candidates from the sequence specificity DB 15 in advance, it is possible to reduce the calculation load for the primer set search.

次に、プライマーセット探索装置10は、配列特異性DB15に記憶されたデータに基づいて、プライマー候補の中からプライマーセットに採用するプライマーの組み合わせを探索する(S18)。   Next, the primer set search device 10 searches for primer combinations to be adopted for the primer set from the primer candidates based on the data stored in the sequence specificity DB 15 (S18).

図7は、プライマーの組み合わせ探索の動作を示す図である。プライマーセット探索部19は、探索条件として入力されたプライマー数と同数のプライマー候補をランダムに選択し、初期プライマーセットを生成する(S30)。ここで、プライマー候補を選択する際には、同じプライマー候補を重複して選択することを許容してもよい。   FIG. 7 is a diagram illustrating an operation of searching for a combination of primers. The primer set search unit 19 randomly selects the same number of primer candidates as the number of primers input as a search condition, and generates an initial primer set (S30). Here, when selecting candidate primers, it may be allowed to select the same candidate candidates in duplicate.

次に、初期プライマーセットの評価値Sを求める(S32)。以下、プライマーセットを特定しないで評価値に言及するときは「評価値S」という。評価値Sは、ハイブリダイズする目的遺伝子の割合Ctが大きくなるほど高い値をとり、クロスハイブリダイズする非目的遺伝子の割合Cnが大きくなるほど低い値をとる。 Next, determine the evaluation value S 0 of the initial primer set (S32). Hereinafter, when the evaluation value is referred to without specifying the primer set, it is referred to as “evaluation value S”. The evaluation value S takes a higher value as the proportion Ct of the target gene to hybridize increases, and takes a lower value as the proportion Cn of the non-target gene to cross hybridize increases.

図8は、評価値Sについて説明するための図である。図8では、プライマー候補P1〜P6のうちの、プライマーP1、P3、P4の組み合わせからなるプライマーセットについて評価値Sを求める例を示している。   FIG. 8 is a diagram for explaining the evaluation value S. FIG. 8 shows an example in which the evaluation value S is obtained for a primer set composed of a combination of primers P1, P3, and P4 among the primer candidates P1 to P6.

図8に示すプライマーセットは、目的遺伝子T1〜T6のうちのT1〜T5をカバーしている。すなわち、プライマーP1が目的遺伝子T1、T3、T4にハイブリダイズし、プライマーP3が目的遺伝子T2、T4にハイブリダイズし、プライマーP4が目的遺伝子T1、T5にハイブリダイズする。従って、プライマーセットがカバーする目的遺伝子の割合Ctは5/6である。また、図8に示すプライマーセットは、非目的遺伝子N1、N3、N4にクロスハイブリダイズするので、クロスハイブリダイズする非目的遺伝子の割合Cnは3/6である。このように配列特異性DB15に記憶されたデータを用いて、プライマーセットがハイブリダイズする目的遺伝子の割合Ctおよび非目的遺伝子の割合Cnを求める。   The primer set shown in FIG. 8 covers T1 to T5 among the target genes T1 to T6. That is, primer P1 hybridizes to target genes T1, T3, T4, primer P3 hybridizes to target genes T2, T4, and primer P4 hybridizes to target genes T1, T5. Therefore, the ratio Ct of the target gene covered by the primer set is 5/6. Further, since the primer set shown in FIG. 8 cross-hybridizes to non-target genes N1, N3, and N4, the ratio Cn of non-target genes that cross-hybridize is 3/6. Using the data stored in the sequence specificity DB 15 as described above, the ratio Ct of the target gene to which the primer set hybridizes and the ratio Cn of the non-target gene are obtained.

評価値Sは、目的遺伝子の割合Ctおよび非目的遺伝子の割合Cnを用いて、例えば、以下の式(2)または式(3)によって求める。
なお、上記算式は例示であり、別の算式を用いて評価値Sを決定することもできる。
The evaluation value S is obtained by the following formula (2) or formula (3) using the ratio Ct of the target gene and the ratio Cn of the non-target gene, for example.
In addition, the said formula is an illustration and the evaluation value S can also be determined using another formula.

次に、プライマーセット探索部19は、プライマーセットの中から、1つのプライマーをランダムに選択する(S34)。説明の便宜上、選択されたプライマーをプライマーAという。プライマーセット探索部19は、プライマーAと交換する対象となるプライマーをプライマー候補の中から選択する(S36)。   Next, the primer set search unit 19 randomly selects one primer from the primer set (S34). For convenience of explanation, the selected primer is referred to as primer A. The primer set search unit 19 selects a primer to be exchanged with the primer A from the primer candidates (S36).

具体的には、プライマーセット探索部19は、プライマーセットに含まれるプライマーA以外のプライマー(例えば、プライマー数がc個であれば、プライマーA以外の(c−1)個のプライマー)と、ダイマーを形成しないプライマーを交換可能なプライマー候補として選択する。ここでは、説明の便宜上、交換する対象として、m個のプライマー候補が存在するとする。   Specifically, the primer set search unit 19 includes a primer other than the primer A included in the primer set (for example, if the number of primers is c, (c-1) primers other than the primer A) and a dimer. Primers that do not form are selected as exchangeable primer candidates. Here, for convenience of explanation, it is assumed that there are m primer candidates to be exchanged.

プライマーAを交換する前のプライマーセットの評価値Sとする。tは、プライマーセットに含まれるプライマーAを別のプライマー候補で交換する繰り返し処理を行なった回数を示す。初期プライマーセットの場合には、t=0である。プライマーセット探索装置10は、m個のプライマー候補のそれぞれで置き換えた後のm個のプライマーセットのそれぞれの評価値St+1,1,St+1,2,・・・St+1,mを計算する(S38)。 And the evaluation value S t of the primer sets of before replacing the primer A. t indicates the number of times of repeated processing for exchanging the primer A included in the primer set with another primer candidate. In the case of the initial primer set, t = 0. The primer set search apparatus 10 calculates the evaluation values S t + 1,1 , S t + 1,2 ,... S t + 1, m of the m primer sets after being replaced with each of the m primer candidates ( S38).

次に、プライマーセット探索部19は、評価値St+1,1,St+1,2,・・・St+1,mに基づいて、プライマーAと交換するプライマー候補を決定し、プライマーセットを決定する。具体的には、まず、評価値Sが大きいほど大きい確率値をとる確率分布と、計算されたプライマーセットの評価値St+1,1,St+1,2,・・・St+1,mとに基づいて、各プライマーセットを選択する確率値を決定する(S40)。 Next, the primer set search unit 19 determines a candidate primer to be exchanged with the primer A based on the evaluation values S t + 1,1 , S t + 1,2 ,... S t + 1, m and determines a primer set. Specifically, first, based on the probability distribution that takes a larger probability value as the evaluation value S is larger, and the calculated evaluation values S t + 1,1 , S t + 1 , 2 ,... S t + 1, m of the primer set. Then, a probability value for selecting each primer set is determined (S40).

図9は、確率分布を示す図である。図9に示す確率分布は、
をグラフ化したものである。式(4)において、min[a,b]は、aとbのうち小さい方を選択する関数である。このように、min関数を用いて1とexp{k (St+1,i−St)}とを比較して小さい方の値を採用する構成により、現在より評価値が高くなる場合は、全て1となり、等確率で選択されることになる。なお、min関数を用いないで、例えば、下記式(5)によって、確率分布を求めてもよい。
FIG. 9 is a diagram showing a probability distribution. The probability distribution shown in FIG.
Is a graph. In equation (4), min [a, b] is a function that selects the smaller of a and b. As described above, when the evaluation value is higher than the present value by using the smaller value by comparing 1 and exp {k (S t + 1, i −S t )} using the min function. , All become 1, and are selected with equal probability. In addition, you may obtain | require probability distribution by following formula (5), for example, without using min function.

プライマーセット探索部19は、常に評価値Sが最大のプライマーセットを選択するのではなく、確率分布を用いてプライマーセットを選択する。図9に示す例では、評価値St+1,1のプライマーセットが選択される確率値はP1、評価値St+1,2のプライマーセットが選択される確率値はP2、評価値St+1,3のプライマーセットが選択される確率値はP3である。プライマーセット探索部19は、評価値Sによって決まる確率値に従って、プライマーセットを決定し、プライマーセットの評価値Sを記憶部に記憶する(S42)。 The primer set search unit 19 does not always select a primer set having the maximum evaluation value S, but selects a primer set using a probability distribution. In the example shown in FIG. 9, the probability value that the primer set of the evaluation value S t + 1,1 is selected is P1, the probability value of the primer set of the evaluation value S t + 1,2 is P2, and the evaluation value S The probability value that the primer set of t + 1,3 is selected is P3. The primer set search unit 19 determines a primer set according to the probability value determined by the evaluation value S, and stores the evaluation value S of the primer set in the storage unit (S42).

プライマーセット探索部19は、プライマーセット探索の終了条件を満たすか否かを判定する(S44)。終了条件としては、例えば、プライマーセットの探索回数、すなわち、プライマーを交換した回数が所定の閾値nに達したこととすることができる。閾値nとしては、例えば、10000回のオーダーの値を設定することができる。与えられた探索条件においてハイブリダイズする目的遺伝子の数を最大とし、クロスハイブリダイゼーションを最小とする理想的な解に近いプライマーセットを求めることができる。   The primer set search unit 19 determines whether or not the primer set search end condition is satisfied (S44). As the termination condition, for example, the number of primer set searches, that is, the number of primer replacements, can reach a predetermined threshold value n. As the threshold value n, for example, an order value of 10,000 times can be set. A primer set close to an ideal solution that maximizes the number of target genes that hybridize under given search conditions and minimizes cross hybridization can be obtained.

プライマーセット探索部19は、終了条件を満たした場合には、記憶部に記憶された評価値Sが最大のプライマーセットを、探索結果として決定する(S46)。   When the termination condition is satisfied, the primer set search unit 19 determines a primer set having the maximum evaluation value S stored in the storage unit as a search result (S46).

図6に戻って、プライマーセット探索装置10は、プライマーセット探索部19にて探索されたプライマーセットを探索結果として出力する(S20)。以上、第1の実施の形態のプライマーセット探索装置10の構成および動作について説明した。   Returning to FIG. 6, the primer set search apparatus 10 outputs the primer set searched by the primer set search unit 19 as a search result (S20). Heretofore, the configuration and operation of the primer set search device 10 of the first embodiment have been described.

本実施の形態のプライマーセット探索装置10およびプライマーセット探索方法は、目的遺伝子にハイブリダイズするプライマーの割合Ctと非目的遺伝子にクロスハイブリダイズするプライマーの割合Cnとに基づいて求めたプライマーセットの評価値Sを用いて、プライマーセットを探索するので、クロスハイブリダイゼーションをできるだけ少なくし、かつ、できるだけ多くの目的遺伝子にハイブリダイズするプライマーセットを求めることができる。   The primer set search apparatus 10 and the primer set search method according to the present embodiment evaluate the primer set obtained based on the ratio Ct of the primer hybridizing to the target gene and the ratio Cn of the primer cross-hybridizing to the non-target gene. Since the primer set is searched using the value S, it is possible to obtain a primer set that minimizes cross-hybridization and hybridizes to as many target genes as possible.

また、プライマーセット探索装置10およびプライマーセット探索方法は、評価値が高くなるほど高い確率値をとる確率分布とプライマーセットの評価値とに基づいて、交換するプライマー候補を選択するので、局所最大に陥ることなく、適切なプライマーセットを探索することができる。   In addition, the primer set search apparatus 10 and the primer set search method select a candidate primer to be exchanged based on a probability distribution that takes a higher probability value as the evaluation value becomes higher and an evaluation value of the primer set, so that a local maximum is reached. It is possible to search for an appropriate primer set.

(第2の実施の形態)
次に、本発明の第2の実施の形態のプライマーセット探索装置10およびプライマーセット探索方法について説明する。第2の実施の形態のプライマーセット探索装置10の基本的な構成は、第1の実施の形態と同じであるが(図1参照)、第2の実施の形態のプライマーセット探索装置10は、プライマーセットの探索を行う際に、プライマーセットを選択するための確率分布を変化させる点が異なる。
(Second Embodiment)
Next, the primer set search device 10 and the primer set search method according to the second embodiment of the present invention will be described. The basic configuration of the primer set search device 10 of the second embodiment is the same as that of the first embodiment (see FIG. 1), but the primer set search device 10 of the second embodiment is The difference is that the probability distribution for selecting a primer set is changed when searching for the primer set.

第2の実施の形態では、評価値Sとして、
を用い、プライマー候補Aを別のプライマー候補と入れ替えたときの確率Piを、
によって求める。
In the second embodiment, as the evaluation value S,
, And the probability Pi when replacing candidate primer A with another candidate primer,
Ask for.

第2の実施の形態では、プライマーを交換する繰り返し処理ごとに、t+1回の繰り返し処理後に求めたプライマーセットの評価値St+1とt回の繰り返し処理後に求めたプライマーセットの評価値Sとを比較して、St+1<Sの場合には、kiを1.05倍し、確率分布を変更する。このように確率分布を変更することにより、評価値Si+1が前回の評価値Sより大きくなった場合には、kiを大きくすることにより、評価値Sが高いプライマーセットが選ばれる確率を高くする。これにより、与えられた探索条件においてハイブリダイズする目的遺伝子の数を最大とし、クロスハイブリダイゼーションを最小とする理想的な解に近いプライマーセットに早く辿り着くことができる。 In the second embodiment, for each iterative process of exchanging primer, and the evaluation value S t primer sets obtained after iteration evaluation value S t + 1 and t times primer sets obtained after t + 1 iterations process In comparison, if S t + 1 <S t , k i is multiplied by 1.05 to change the probability distribution. By changing the probability distribution in this way, when the evaluation value S i + 1 becomes larger than the previous evaluation value S i , the probability that a primer set having a high evaluation value S is selected is increased by increasing k i. Make it high. As a result, it is possible to quickly reach a primer set close to an ideal solution that maximizes the number of target genes that hybridize under a given search condition and minimizes cross hybridization.

本実施の形態では、プライマーセットの評価値S、St+1の大小関係に基づいて確率分布を変更する例を挙げたが、別の基準に従って確率分布を変更してもよい。例えば、プライマーAを交換する繰り返し処理を行なった回数に基づいて、確率分布を変更してもよい。 In the present embodiment, the example in which the probability distribution is changed based on the magnitude relationship between the evaluation values S t and S t + 1 of the primer set has been described. However, the probability distribution may be changed according to another criterion. For example, the probability distribution may be changed based on the number of times that the repetition process for exchanging the primer A is performed.

次に、本発明の実施例について説明する。
最初に実験条件について説明する。1000個の目的遺伝子配列をランダムに選択し、1000個の非目的遺伝子配列をハウスキーピング遺伝子からランダムに選択した。探索条件は、以下の表1に示すとおりである。
Next, examples of the present invention will be described.
First, experimental conditions will be described. 1000 target gene sequences were randomly selected, and 1000 non-target gene sequences were randomly selected from housekeeping genes. Search conditions are as shown in Table 1 below.

この探索条件で、2万回の繰り返し探索を行った。また、比較のため、Greedyアルゴリズムにより、プライマーセットの探索を行った。以下の表2に、探索されたプライマーセットによる目的遺伝子のカバー数と非目的遺伝子へのクロスハイブリダイゼーション数を示す。下記表において、括弧内は、目的遺伝子数から非目的遺伝子数を減算した値である。この数値が大きいほど、クロスハイブリダイゼーションが少なく、かつ、多くの目的遺伝子にハイブリダイズするプライマーセットであると評価できる。
Under this search condition, the search was repeated 20,000 times. For comparison, a primer set was searched by the Greedy algorithm. Table 2 below shows the number of target gene covers and the number of cross-hybridizations to non-target genes by the searched primer sets. In the following table, the values in parentheses are values obtained by subtracting the number of non-target genes from the number of target genes. It can be evaluated that the larger the numerical value, the less the cross-hybridization and the primer set that hybridizes to many target genes.

上記表2に示した結果によれば、目的遺伝子カバー数から非目的遺伝子へのクロスハイブリダイゼーション数を減算して、各実験結果を評価してみると、いずれの探索条件においても、本発明はGreedyアルゴリズムより適切な探索結果が得られたことが分かる。   According to the results shown in Table 2 above, subtracting the number of cross-hybridization from the target gene cover number to the non-target gene and evaluating each experimental result, the present invention is It can be seen that an appropriate search result was obtained from the Greedy algorithm.

以上、本発明のプライマーセット探索装置およびプライマーセット探索方法について、図面を参照して詳細に説明したが、本発明は上記した実施の形態に限定されるものではない。   As mentioned above, although the primer set search apparatus and primer set search method of the present invention have been described in detail with reference to the drawings, the present invention is not limited to the above-described embodiments.

上記した実施の形態では、プライマーセット探索の終了条件を、探索回数が予め設定された閾値に達したこととしたが、プライマーセット探索の終了条件はこれに限定されない。例えば、終了条件として、繰り返し処理ごとの評価値の振れ幅が一定の範囲内に収束したことや、評価値が所定の閾値を超えたことなどを終了条件としてもよい。   In the above-described embodiment, the primer set search end condition is that the search count has reached a preset threshold, but the primer set search end condition is not limited to this. For example, the end condition may be that the fluctuation width of the evaluation value for each repetition process has converged within a certain range, or that the evaluation value has exceeded a predetermined threshold.

上記した実施の形態では、熱力学特性計算部16にてプライマー候補のTm値を計算する例について説明したが、プライマー候補のTm値をあらかじめ記憶しておいてもよい。あるいは、一度求めたTm値を次回以降の探索のために蓄積していくこととしてもよい。これにより、プライマー候補のTm値を計算する時間を割愛、あるいは短縮することができ、より短時間で適切なプライマーセットの探索を行うことができる。   In the above-described embodiment, an example in which the Tm value of the primer candidate is calculated by the thermodynamic characteristic calculation unit 16 has been described. However, the Tm value of the primer candidate may be stored in advance. Alternatively, the Tm value obtained once may be accumulated for the next and subsequent searches. Thereby, the time for calculating the Tm value of the primer candidate can be omitted or shortened, and an appropriate primer set can be searched for in a shorter time.

上記した実施の形態では、配列特異性の計算を行った後に熱力学特性の計算を行ってプライマー候補の絞り込みを行う例について説明したが、先に熱力学特性の計算を行って、温度条件Tcに基づいてプライマー候補の絞り込みを行なってもよい。特に、プライマー候補の熱力学特性があらかじめ求めてある場合には、先に温度条件Tcによる絞り込みを行うことが有効である。   In the above-described embodiment, the example in which the calculation of the thermodynamic characteristics is performed and the primer candidates are narrowed down after the calculation of the sequence specificity has been described. However, the thermodynamic characteristics are calculated first and the temperature condition Tc is calculated. Based on the above, candidate primers may be narrowed down. In particular, when the thermodynamic characteristics of the primer candidate are obtained in advance, it is effective to narrow down the temperature condition Tc first.

本発明は、非目的遺伝子群へのクロスハイブリダイゼーションが少なく、かつ、多くの目的遺伝子群にハイブリダイズするプライマーセットを探索でき、シークエンシングに用いるプライマーセットを探索するプライマー探索装置等として有用である。   INDUSTRIAL APPLICABILITY The present invention is useful as a primer search device that searches for primer sets used for sequencing, and can search for primer sets that hybridize to many target gene groups with little cross-hybridization to non-target gene groups. .

10 プライマーセット探索装置
11 目的遺伝子入力部
12 非目的遺伝子入力部
13 探索条件入力部
14 配列特異性計算部
15 配列特異性DB
16 熱力学特性計算部
17 温度条件入力部
18 DB更新部
19 プライマーセット探索部
20 出力部
30 cDNAライブラリ
40 配列比較ユニット
41 32並列配列比較回路
50 CPU
51 RAM
52 ROM
53 プログラム
54 通信インターフェース
55 ハードディスク
56 操作部
57 ディスプレイ
58 FPGAボード
59 データバス
DESCRIPTION OF SYMBOLS 10 Primer set search apparatus 11 Target gene input part 12 Non-target gene input part 13 Search condition input part 14 Sequence specificity calculation part 15 Sequence specificity DB
16 thermodynamic characteristic calculation unit 17 temperature condition input unit 18 DB update unit 19 primer set search unit 20 output unit 30 cDNA library 40 sequence comparison unit 41 32 parallel sequence comparison circuit 50 CPU
51 RAM
52 ROM
53 Program 54 Communication Interface 55 Hard Disk 56 Operation Unit 57 Display 58 FPGA Board 59 Data Bus

Claims (15)

目的遺伝子にハイブリダイズするプライマーセットを探索するための方法であって、
複数の目的遺伝子と複数の非目的遺伝子の配列を入力するステップと、
プライマーセットに含めるプライマーの探索条件を入力するステップと、
前記探索条件に合致するプライマー候補が前記複数の目的遺伝子および前記複数の非目的遺伝子のそれぞれにハイブリダイズするか否かを求め、その結果を記憶したデータベースを生成するステップと、
前記プライマーセットに含める個数のプライマーを前記プライマー候補からランダムに選択して初期のプライマーセットを生成するステップと、
(1)プライマーセットに含まれるプライマーから一つのプライマーをランダムに選択し、(2)選択したプライマーを複数のプライマー候補のそれぞれと交換したときに生成される複数のプライマーセットについて、ハイブリダイズする目的遺伝子の割合Ctおよび非目的遺伝子の割合Cnを前記データベースに記憶されたデータに基づいて求め、(3)前記目的遺伝子の割合Ctと前記非目的遺伝子の割合Cnとに基づいて、複数のプライマーセットのそれぞれの評価値を計算し、(4)前記評価値に応じた確率値を与える確率分布と前記複数のプライマーセットのそれぞれの評価値とに基づいて、前記複数のプライマーセットから一つのプライマーセットを選択し、(5)選択したプライマーセットとその評価値を記憶部に記憶する、上記(1)〜(5)の処理を繰り返し行う探索ステップと、
前記記憶部に記憶された複数のプライマーセットの中でその評価値が最も高かったプライマーセットを探索結果として出力するステップと、
を備えるプライマーセット探索方法。
A method for searching for a primer set that hybridizes to a target gene,
Inputting sequences of a plurality of target genes and a plurality of non-target genes;
Entering search conditions for primers to be included in the primer set;
Determining whether or not primer candidates that match the search conditions hybridize to each of the plurality of target genes and the plurality of non-target genes, and generating a database storing the results;
Randomly selecting a number of primers to be included in the primer set from the primer candidates to generate an initial primer set;
(1) The purpose of hybridizing a plurality of primer sets generated when one primer is randomly selected from the primers included in the primer set, and (2) the selected primer is replaced with each of a plurality of candidate primers. Gene ratio Ct and non-target gene ratio Cn are obtained based on the data stored in the database, and (3) a plurality of primer sets based on the target gene ratio Ct and the non-target gene ratio Cn (4) One primer set from the plurality of primer sets based on a probability distribution that gives a probability value corresponding to the evaluation value and each evaluation value of the plurality of primer sets (5) Store the selected primer set and its evaluation value in the storage unit. A search step of performing repeatedly the process of serial (1) to (5),
Outputting a primer set having the highest evaluation value among a plurality of primer sets stored in the storage unit as a search result;
A primer set search method comprising:
前記データベースを生成するステップは、前記探索条件に合致するプライマーのうち、いずれの前記目的遺伝子にもハイブリダイズしないプライマーをプライマー候補から除外し、前記データベースに含めない請求項1に記載のプライマーセット探索方法。   2. The primer set search according to claim 1, wherein the step of generating the database excludes primers that do not hybridize to any of the target genes from primers that match the search conditions and does not include them in the database. Method. 前記プライマーセットの評価値は、目的遺伝子の割合Ctが大きいほど評価値が高く、非目的遺伝子の割合Cnが大きいほど評価値が低い請求項1または2に記載のプライマーセット探索方法。   The primer set search method according to claim 1 or 2, wherein the evaluation value of the primer set is higher as the ratio Ct of the target gene is higher and lower as the ratio Cn of the non-target gene is higher. 前記プライマーセットの評価値Sを、
S=Ct-α×Cn (ただし、α>0)
によって計算する請求項3に記載のプライマーセット探索方法。
The evaluation value S of the primer set is
S = Ct−α × Cn (where α> 0)
The primer set search method according to claim 3, which is calculated by:
前記プライマーセットの評価値Sを、
S=(Ct+α)/(Cn+β) (ただし、β≠0)
によって計算する請求項3に記載のプライマーセット探索方法。
The evaluation value S of the primer set is
S = (Ct + α) / (Cn + β) (where β ≠ 0)
The primer set search method according to claim 3, which is calculated by:
前記確率分布を、前記記憶部に記憶された評価値の変化に基づいて変更する請求項1〜5のいずれかに記載のプライマーセット探索方法。   The primer set search method according to any one of claims 1 to 5, wherein the probability distribution is changed based on a change in an evaluation value stored in the storage unit. 前記確率分布を、上記(1)〜(5)の処理の繰り返し回数に基づいて変更する請求項1〜5のいずれかに記載のプライマーセット探索方法。   The primer set search method according to any one of claims 1 to 5, wherein the probability distribution is changed based on the number of repetitions of the processes (1) to (5). 各プライマー候補のTm値を計算し、Tm値を前記データベースに記憶するステップと、
温度条件を入力するステップと、
入力された温度条件に合致しないTm値を有する前記プライマー候補を前記データベースから削除するステップと、
を備える請求項1〜7のいずれかに記載のプライマーセット探索方法。
Calculating a Tm value for each primer candidate and storing the Tm value in the database;
Entering temperature conditions;
Deleting the candidate primer having a Tm value that does not match the input temperature condition from the database;
The primer set search method according to any one of claims 1 to 7.
前記探索ステップは、一つのプライマーを交換するプライマー候補として、前記プライマーセットに含まれるプライマーとダイマーを形成しないプライマー候補を選択する請求項1〜8のいずれかに記載のプライマーセット探索方法。   The primer search method according to claim 1, wherein the search step selects a candidate primer that does not form a dimer with a primer contained in the primer set, as a candidate primer for exchanging one primer. 前記データベースを生成するステップは、プライマー候補の相補的塩基配列と所定の閾値以上の割合で一致する配列部分を有する前記目的遺伝子または前記非目的遺伝子を、前記プライマー候補がハイブリダイズする遺伝子として求める請求項1〜9のいずれかに記載のプライマーセット探索方法。   The step of generating the database includes obtaining the target gene or the non-target gene having a sequence portion that matches a complementary base sequence of a candidate primer at a ratio equal to or higher than a predetermined threshold as a gene to which the candidate primer hybridizes. Item 10. The primer set search method according to any one of Items 1 to 9. 前記データベースを作成するステップは、FPGA(Field Programmable Gate Array)にて生成された専用回路を用いて、プライマー候補が前記目的遺伝子または前記非目的遺伝子にハイブリダイズするか否かを計算する請求項1〜10のいずれかに記載のプライマーセット探索方法。   The step of creating the database calculates whether a candidate primer hybridizes to the target gene or the non-target gene by using a dedicated circuit generated by an FPGA (Field Programmable Gate Array). The primer set search method in any one of -10. 前記探索ステップは、上記(1)〜(5)の処理の繰り返し回数が所定の閾値に達したときに終了する請求項1〜11のいずれかに記載のプライマーセット探索方法。   The primer set search method according to claim 1, wherein the search step is ended when the number of repetitions of the processes (1) to (5) reaches a predetermined threshold value. 前記探索ステップは、前記記憶部に記憶されるプライマーセットの評価値が所定の閾値に達したときに終了する請求項1〜11のいずれかに記載のプライマーセット探索方法。   The primer set search method according to claim 1, wherein the search step ends when an evaluation value of the primer set stored in the storage unit reaches a predetermined threshold value. 目的遺伝子にハイブリダイズするプライマーセットを探索するためのプログラムであって、コンピュータに、
複数の目的遺伝子と複数の非目的遺伝子の配列を入力するステップと、
プライマーセットに含めるプライマーの探索条件を入力するステップと、
前記探索条件に合致するプライマー候補が前記複数の目的遺伝子および前記複数の非目的遺伝子のそれぞれにハイブリダイズするか否かを求め、その結果を記憶したデータベースを生成するステップと、
前記プライマーセットに含める個数のプライマーを前記プライマー候補からランダムに選択して初期のプライマーセットを生成するステップと、
(1)プライマーセットに含まれるプライマーから一つのプライマーをランダムに選択し、(2)選択したプライマーを複数のプライマー候補のそれぞれと交換したときに生成される複数のプライマーセットについて、ハイブリダイズする目的遺伝子の割合Ctおよび非目的遺伝子の割合Cnを前記データベースに記憶されたデータに基づいて求め、(3)前記目的遺伝子の割合Ctと前記非目的遺伝子の割合Cnとに基づいて、複数のプライマーセットのそれぞれの評価値を計算し、(4)前記評価値に応じた確率値を与える確率分布と前記複数のプライマーセットのそれぞれの評価値とに基づいて、前記複数のプライマーセットから一つのプライマーセットを選択し、(5)選択したプライマーセットとその評価値を記憶部に記憶する、上記(1)〜(5)の処理を繰り返し行うステップと、
前記記憶部に記憶された複数のプライマーセットの中でその評価値が最も高かったプライマーセットを探索結果として出力するステップと、
を実行させるプログラム。
A program for searching for a primer set that hybridizes to a target gene,
Inputting sequences of a plurality of target genes and a plurality of non-target genes;
Entering search conditions for primers to be included in the primer set;
Determining whether or not primer candidates that match the search conditions hybridize to each of the plurality of target genes and the plurality of non-target genes, and generating a database storing the results;
Randomly selecting a number of primers to be included in the primer set from the primer candidates to generate an initial primer set;
(1) The purpose of hybridizing a plurality of primer sets generated when one primer is randomly selected from the primers included in the primer set, and (2) the selected primer is replaced with each of a plurality of candidate primers. Gene ratio Ct and non-target gene ratio Cn are obtained based on the data stored in the database, and (3) a plurality of primer sets based on the target gene ratio Ct and the non-target gene ratio Cn (4) One primer set from the plurality of primer sets based on a probability distribution that gives a probability value corresponding to the evaluation value and each evaluation value of the plurality of primer sets (5) Store the selected primer set and its evaluation value in the storage unit. And a step to repeat the processing of the serial (1) to (5),
Outputting a primer set having the highest evaluation value among a plurality of primer sets stored in the storage unit as a search result;
A program that executes
目的遺伝子にハイブリダイズするプライマーセットを探索するための装置であって、
複数の目的遺伝子と複数の非目的遺伝子の配列を入力する手段と、
プライマーセットに含めるプライマーの探索条件を入力する手段と、
前記探索条件に合致するプライマー候補が前記複数の目的遺伝子および前記複数の非目的遺伝子のそれぞれにハイブリダイズするか否かを求め、その結果を記憶したデータベースを生成する手段と、
前記プライマーセットに含める個数のプライマーを前記プライマー候補からランダムに選択して初期のプライマーセットを生成する手段と、
(1)プライマーセットに含まれるプライマーから一つのプライマーをランダムに選択し、(2)選択したプライマーを複数のプライマー候補のそれぞれと交換したときに生成される複数のプライマーセットについて、ハイブリダイズする目的遺伝子の割合Ctおよび非目的遺伝子の割合Cnを前記データベースに記憶されたデータに基づいて求め、(3)前記目的遺伝子の割合Ctと前記非目的遺伝子の割合Cnとに基づいて、複数のプライマーセットのそれぞれの評価値を計算し、(4)前記評価値に応じた確率値を与える確率分布と前記複数のプライマーセットのそれぞれの評価値とに基づいて、前記複数のプライマーセットから一つのプライマーセットを選択し、(5)選択したプライマーセットとその評価値を記憶部に記憶する、上記(1)〜(5)の処理を繰り返し行う手段と、
前記記憶部に記憶された複数のプライマーセットの中でその評価値が最も高かったプライマーセットを探索結果として出力する手段と、
を備えるプライマーセット探索装置。
An apparatus for searching for a primer set that hybridizes to a target gene,
Means for inputting sequences of a plurality of target genes and a plurality of non-target genes;
Means for inputting search conditions for primers to be included in the primer set;
Means for determining whether or not primer candidates that match the search conditions hybridize to each of the plurality of target genes and the plurality of non-target genes, and generating a database storing the results;
Means for randomly selecting the number of primers to be included in the primer set from the candidate primers and generating an initial primer set;
(1) The purpose of hybridizing a plurality of primer sets generated when one primer is randomly selected from the primers included in the primer set, and (2) the selected primer is replaced with each of a plurality of candidate primers. Gene ratio Ct and non-target gene ratio Cn are obtained based on the data stored in the database, and (3) a plurality of primer sets based on the target gene ratio Ct and the non-target gene ratio Cn (4) One primer set from the plurality of primer sets based on a probability distribution that gives a probability value corresponding to the evaluation value and each evaluation value of the plurality of primer sets (5) Store the selected primer set and its evaluation value in the storage unit. Serial (1) and the means to repeat the process to (5),
Means for outputting a primer set having the highest evaluation value among a plurality of primer sets stored in the storage unit as a search result;
A primer set search device comprising:
JP2009212703A 2009-09-15 2009-09-15 Apparatus for searching primer set, method and program for searching primer set Pending JP2011062085A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009212703A JP2011062085A (en) 2009-09-15 2009-09-15 Apparatus for searching primer set, method and program for searching primer set

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009212703A JP2011062085A (en) 2009-09-15 2009-09-15 Apparatus for searching primer set, method and program for searching primer set

Publications (1)

Publication Number Publication Date
JP2011062085A true JP2011062085A (en) 2011-03-31

Family

ID=43949025

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009212703A Pending JP2011062085A (en) 2009-09-15 2009-09-15 Apparatus for searching primer set, method and program for searching primer set

Country Status (1)

Country Link
JP (1) JP2011062085A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013134341A1 (en) 2012-03-07 2013-09-12 Dow Agrosciences Llc Primer designing pipeline for targeted sequencing
WO2016159111A1 (en) * 2015-03-31 2016-10-06 富士フイルム株式会社 Method for determining gene state of fetus
WO2016159132A1 (en) * 2015-03-31 2016-10-06 富士フイルム株式会社 Method for designing primers to be subjected to polymerase chain reaction, and primer set
WO2018061638A1 (en) * 2016-09-30 2018-04-05 富士フイルム株式会社 METHOD FOR DETERMINING ORIGIN OF HUMAN GENOMIC DNA OF 100 pg OR LESS THEREFROM, METHOD FOR PERSONAL IDENTIFICATION, AND METHOD FOR ANALYZING DEGREE OF ENGRAFTMENT OF HEMATOPOIETIC STEM CELL

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
JPN6013003303; 社団法人情報処理学会研究報告 vol.86, 2008, pp.1-4 *
JPN6013003307; BMC Bioinformatics vol.8, 2007, pp.1-7 *
JPN6013003309; Proc. Natl. Acad. Sci. USA vol.95, no.4, 1998, pp.1460-1465 *
JPN6013003313; Methods Mol. Biol. vol.453, 2008, pp.1-33 *
JPN6013003317; Nucleic Acids Res. vol.34, 2006, pp.W665-W669 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013134341A1 (en) 2012-03-07 2013-09-12 Dow Agrosciences Llc Primer designing pipeline for targeted sequencing
WO2016159111A1 (en) * 2015-03-31 2016-10-06 富士フイルム株式会社 Method for determining gene state of fetus
WO2016159132A1 (en) * 2015-03-31 2016-10-06 富士フイルム株式会社 Method for designing primers to be subjected to polymerase chain reaction, and primer set
JPWO2016159111A1 (en) * 2015-03-31 2017-10-12 富士フイルム株式会社 How to determine the genetic status of a fetus
JPWO2016159132A1 (en) * 2015-03-31 2017-12-14 富士フイルム株式会社 Design method and primer set for primers used for polymerase chain reaction
US11306358B2 (en) 2015-03-31 2022-04-19 Fujifilm Corporation Method for determining genetic condition of fetus
WO2018061638A1 (en) * 2016-09-30 2018-04-05 富士フイルム株式会社 METHOD FOR DETERMINING ORIGIN OF HUMAN GENOMIC DNA OF 100 pg OR LESS THEREFROM, METHOD FOR PERSONAL IDENTIFICATION, AND METHOD FOR ANALYZING DEGREE OF ENGRAFTMENT OF HEMATOPOIETIC STEM CELL

Similar Documents

Publication Publication Date Title
WO2018061699A1 (en) Method for designing primers for multiplex pcr
Aach et al. CasFinder: Flexible algorithm for identifying specific Cas9 targets in genomes
Shepard et al. The peculiarities of large intron splicing in animals
Yousef et al. MicroRNA categorization using sequence motifs and k-mers
JP2011062085A (en) Apparatus for searching primer set, method and program for searching primer set
Hallström et al. A genomic approach to examine the complex evolution of laurasiatherian mammals
WO2018061693A1 (en) Method for designing primer for multiplex pcr
Adabor et al. Restricted-derestricted dynamic Bayesian network inference of transcriptional regulatory relationships among genes in cancer
Blazewicz et al. Graph algorithms for DNA sequencing–origins, current models and the future
Islam et al. A hybrid framework based on genetic algorithm and simulated annealing for RNA structure prediction with pseudoknots
Bi A Monte Carlo EM algorithm for de novo motif discovery in biomolecular sequences
Pancoska et al. Rational design of DNA sequences for nanotechnology, microarrays and molecular computers using Eulerian graphs
Blazewicz et al. RNA partial degradation problem: motivation, complexity, algorithm
Kwarciak et al. Tabu search algorithm for DNA sequencing by hybridization with multiplicity information available
Hu et al. Multimodal optimization evolutionary algorithm for RNA secondary structure prediction
Orenstein et al. Efficient design of compact unstructured RNA libraries covering all k-mers
Beretta et al. A machine learning approach for the integration of mirna-target predictions
Balla et al. Approximation Algorithms for the Primer Selection, Planted Motif Search, and Related Problems
JP4198707B2 (en) Method for selecting a probe from a group consisting of a plurality of polynucleotides
Chon et al. SSDPrimer: an SSD-based primer design method for a private sequence DB
Kléma et al. Knowledge-based subtractive integration of mRNA and miRNA expression profiles to differentiate myelodysplastic syndrome
Kwarciak et al. A multilevel ant colony optimization algorithm for classical and isothermic DNA sequencing by hybridization with multiplicity information available
Kang et al. A fast preprocessing algorithm to select gene-specific probes of DNA microarrays
Zarate Prediction of CRISPR-Cas9 Cleavage Efficiency through Markov Feature Engineering and Boosting-Based Transfer Learning
Jaziri et al. MetaExploArrays: a large-scale oligonucleotide probe design software for explorative DNA microarrays

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130129

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130604