JP2003125772A - コンピュータを利用して解析対象核酸塩基配列から最適なオリゴ核酸配列の候補を設計するためのコンピュータソフトウエアプログラム、その方法およびそのように設計されたオリゴ核酸配列が搭載されたオリゴ核酸アレイ - Google Patents

コンピュータを利用して解析対象核酸塩基配列から最適なオリゴ核酸配列の候補を設計するためのコンピュータソフトウエアプログラム、その方法およびそのように設計されたオリゴ核酸配列が搭載されたオリゴ核酸アレイ

Info

Publication number
JP2003125772A
JP2003125772A JP2002173467A JP2002173467A JP2003125772A JP 2003125772 A JP2003125772 A JP 2003125772A JP 2002173467 A JP2002173467 A JP 2002173467A JP 2002173467 A JP2002173467 A JP 2002173467A JP 2003125772 A JP2003125772 A JP 2003125772A
Authority
JP
Japan
Prior art keywords
sequence
double
command
length
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002173467A
Other languages
English (en)
Inventor
Hitoshi Fujimiya
仁 藤宮
Junichiro Miura
順一郎 三浦
Yoshiaki Aoki
良晃 青木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DAINAKOMU KK
Dynacom Co Ltd
Original Assignee
DAINAKOMU KK
Dynacom Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DAINAKOMU KK, Dynacom Co Ltd filed Critical DAINAKOMU KK
Priority to JP2002173467A priority Critical patent/JP2003125772A/ja
Publication of JP2003125772A publication Critical patent/JP2003125772A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 二本鎖結合温度若しくは融解温度(Tm)値
に関して高い精度を有するオリゴ核酸塩基配列を一度に
多数決定する。 【解決手段】 コンピュータに、二本鎖結合温度の許容
範囲の指定を受け付けて記憶させる第1の指令と、前記
コンピュータに、前記解析対象核酸塩基配列の中で、部
分配列の長さを伸ばしながら各長さでの二本鎖結合温度
を算出させる第2の指令と、前記コンピュータに、上記
手段で算出した二本鎖結合温度が前記指定手段で指定さ
れた許容範囲に入るかを判断させ、入る場合には当該長
さの部分配列を候補オリゴ核酸配列として出力させる第
3の指令と、を有する

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、解析対象核酸塩
基配列から最適なオリゴ核酸配列の候補を設計するため
のプログラムおよび方法に関するものである。
【0002】
【従来の技術】実験対象の遺伝子の細胞内での発現性を
解析する場合、一般的にDNAチップと称される素子が
利用される。このDNAチップは、数千から数万個の異
なる塩基配列情報を持つDNA断片やRNA断片をガラ
スやシリコンの基板上に配列してなるものである。
【0003】このDNAチップ上に配列された複数のD
NA断片やRNA断片の核酸配列は、キャプチャーと称
され、実験対象の特定の遺伝子と結合、つまりハイブリ
ダイゼーションを起こさせるために適宜配置されたもの
である。このようなDNAチップによれば、例えば健康
な細胞が病気の細胞に変化した際、この細胞中のどの遺
伝子がハイブリダイゼーションを起こすかを調べること
によって、病気の原因になる発現遺伝子を突き止めるこ
とが可能になる。
【0004】ここで、上記キャプチャーとして使用され
るDNA断片の核酸配列は、一般にライブラリから選択
される。ライブラリとは、細胞などから取得した遺伝子
の断片をクローニングして作られたDNAのサンプルの
集合体や、cDNAのサンプルの集合体である。ここ
で、cDNA(complementary DNA)とは、メッセン
ジャーRNAの全ての塩基に結合できるDNA配列の塩
基、つまり、メッセンジャーRNAに相補的に合成され
たDNAである。
【0005】しかし、研究者がこれらのキャプチャーと
なる実際のサンプルを入手するのは、実在するDNA断
片を細胞から入手したりする必要があり、時間、費用、
技術の面でも困難である。そのため、最近では、既に配
列情報が読み取られたゲノムの配列情報やEST(Ex
pressed Sequence Tag)と呼ばれ
るメッセンジャーRNAのポリA配列端末(ポリAと
は、−AAAAOH というRNAの端末に存在する配
列)の配列情報を同定した配列情報を用いて、数十塩基
長程度のオリゴ塩基配列を決定し、それを化学合成して
基盤上に載せる方法が使われているようになってきてい
る。ここで、オリゴ核酸とは、比較的短い塩基配列(例
えば、約200ベースペア)を有した核酸を称する。
【0006】従来、適切なオリゴ核酸配列の決定は、研
究者がライブラリ内の遺伝子や実験対象の遺伝子を部分
的に抜き出し、これらの配列を目視で比較・対比をし
て、配列に存在する相違点と共通点を探索することで成
されていた。しかし、近年DNAチップやDNAアレイ
の集積度が上がり、より多数の核酸断片が集積されるよ
うになってきている。このような探索を目視で行う事は
現実的ではない。そこで、基板上に配列する核酸断片の
塩基配列を決定するにあたり、コンピュータを使用する
ことがより一般的になってきている。
【0007】この様な技術として、従来、例えば特許第
3055942号に開示されたように、遺伝子配列デー
タソースのデータを利用したコンピュータ処理により共
通プローブや特異的プローブの設計を行えるオリゴプロ
ーブ設計ステーションがある。
【0008】しかし、このような現在のコンピュータに
よる処理技術は、ハイブリダイゼーション強度モデリン
グを計算し、それに基づいてユーザーが適切なプローブ
を選択するに過ぎないものであり、プローブの結合温度
の精度を上げるようなものではない。
【0009】すなわち、DNAチップ等用の多数の異な
ったプローブを設計する際、これらの全てのプローブは
同じ二本鎖結合温度を保持する必要がある。二本鎖結合
温度条件は、Tm値の温度によって与えられる。ここ
で、Tm値の温度とは、50パーセントの二重結合が二
本鎖に存在する時の温度であるが、これは、GC含有量
などによって決定される。ところが、GC含有量は、塩
基配列とその長さによって変化する。そのため、合成条
件として決めた塩基長で固有の配列を持ち、適切な温度
条件になる配列を決定する際、これら全ての必要条件を
満たす配列を決定するのはかなり困難である。
【0010】上記特許第3055942号に開示された
技術では、候補オリゴ核酸配列と特定遺伝子とのハイブ
リダイゼーション強度を二本鎖結合温度により求め、そ
の情報をユーザーに提示することで、最適温度条件にな
るプローブの選択を容易にするものである。しかし、こ
の技術で用いる候補のオリゴ核酸配列は、二本鎖結合温
度条件を考慮せずに決定された物であるから、上記のよ
うにしても候補オリゴ核酸配列の二本鎖結合温度に関す
る分散度を自体は小さくすることが出来ない。このた
め、候補オリゴ核酸配列から多くのプローブを得ようと
するとその分散度がかなり大きくなってしまう。発明者
等の分析によれば、従来の方法で求めたオリゴ核酸塩基
配列の二本鎖結合温度の誤差範囲は±20度にも達して
しまう。また、この誤差範囲を小さくしようとすると十
分な数のオリゴ核酸塩基配列が得られないという問題が
生じてしまう。
【0011】一方、オリゴ核酸配列を決定する必然性の
ある他の用途として、PCR法(ポリメラーゼ・チェイ
ン・リアクション法)等の遺伝子増幅手段を目的とした
プローブの設計がある。PCR法において、固有の塩基
配列部分を探してその部分を増幅することを目的とし
て、その増幅部の両端側開始位置に相当する数十塩基長
のプローブの塩基配列を設計しなければならない。キャ
プチャーの塩基配列設計の場合と同様に、この用途にお
いても、該当部位以外での二本鎖結合をしないような固
有の配列部分を設計しなければならない。また、二本鎖
結合温度に関しても同じ温度条件である必要がある。
【0012】上記の目的のため、設計したプローブは対
象となる遺伝子や混在する核酸に対して希望の部分だけ
を増幅するような、固有の配列である必要がある。ま
た、複数の配列対象を同時に増幅する場合もあり、この
際、それらの所望の結合部分に関する適切な配列と二本
鎖結合温度の条件をそれぞれが満足している必要があ
る。
【0013】上記公報には、このPCR法においてのプ
ローブ設計に関する技術も開示されているが、上述の理
由で、適宜な二本鎖結合温度条件を満たすような解決策
を提供していない。
【0014】
【発明が解決しようとする課題】上述したように、従来
の技術によれば、合成条件として決めた塩基長で固有の
配列を持ち、適切な温度条件になる配列を決定する際、
これら全ての必要条件を満たす配列を決定するのはかな
り困難であるという問題があった。
【0015】この発明は、このような事情に鑑みて成さ
れたものであり、二本鎖結合温度若しくは融解温度(T
m)値に関して高い精度を有するオリゴ核酸配列を一度
に多数決定することができるプログラム及び方法を提供
することを目的とする。
【0016】この発明のさらに詳しい目的は、オリゴ核
酸配列を決定する際に、所望の融解温度許容範囲を指定
して、その条件を満たすオリゴ核酸配列を決定すること
ができるプログラム及び方法を提供することにある。
【0017】
【課題を解決するための手段】上記課題を解決するた
め、この発明の第1の主要な観点によれば、コンピュー
タを利用して、解析対象核酸塩基配列から最適なオリゴ
核酸配列の候補を設計するためのプログラムであって、
前記コンピュータに、二本鎖結合温度の許容範囲の指定
を受け付けて記憶させる第1の指令と、前記コンピュー
タに、前記解析対象核酸塩基配列の中で、部分配列の長
さを伸ばしながらその長さでの二本鎖結合温度を算出さ
せる第2の指令と、前記コンピュータに、上記手段で算
出した二本鎖結合温度が前記指定手段で指定された許容
範囲に入るかを判断させ、入る場合には当該長さの部分
配列を候補オリゴ核酸配列として出力させる第3の指令
とを有することを特徴とするプログラムが提供される。
【0018】このような構成によれば、入力された二本
鎖結合温度の許容範囲に基づき、始点及び長さを変えな
がらこの二本鎖結合温度を満たすようなオリゴ核酸配列
を求めていくことができる。このことにより、二本鎖結
合温度条件を満たすオリゴ核酸配列を多数決定・出力す
ることができる。
【0019】この発明の1の実施形態によれば、前記第
2の指令は、前記解析析対象核酸配列中で二本鎖結合温
度を求める部分配列の始点を順次ずらし、ずらした始点
から部分配列の長さを伸ばすものである。この場合、前
記第2の指令は、前記第2の指令は、部分配列の二本鎖
結合温度が前記第3の指令で許容範囲から外れると判断
された場合に、それ以上長さを伸ばすことをせずに始点
を次にずらすものであることが好ましい。
【0020】また、この発明の別の1の実施形態によれ
ば、このプログラムはさらに、前記コンピュータに、前
記第3の指令によって出力された複数の候補オリゴ核酸
配列を表示させる第4の指令を有する。
【0021】また、この発明の更なる別の実施形態によ
れば、このプログラムはさらに、前記コンピュータに、
複数の解析対象核酸配列同士の相同を比較して、各解析
対象核酸配列に固有の配列部分と非固有な配列部分とを
識別させる第5の指令を有し、前記第2の指令は、前記
解析析対象核酸配列中で二本鎖結合温度を求める部分配
列の始点を順次ずらし、ずらした始点から部分配列の長
さを伸ばすものである。
【0022】この場合、前記第2の指令は、前記第3の
指令で前記部分配列の二本鎖結合温度が許容範囲から外
れると判断された場合に、それ以上長さを伸ばすことを
せずに始点を次にずらすものであることが望ましい。
【0023】また、前記第2の指令は、長さを伸ばした
部分配列が前記非固有の配列部分を含む場合に前記コン
ピュータに当該部分配列の二本鎖結合温度を算出するか
若しくは候補オリゴ核酸配列とするかを判断させる第6
の指令をさらに含み、前記第2の指令は、この第6の指
令により二本鎖結合温度を算出しない若しくは候補オリ
ゴ核酸配列としないと判断された場合に前記部分配列の
始点を次の固有の配列部分の先頭にずらすものであるこ
とが望ましい。この場合、前記第6の指令は、コンピュ
ータに、前記長さを伸ばした部分配列に含まれる固有の
配列部分と非固有の配列部分の比若しくは夫々の配列数
に基づいて当該部分配列の二本鎖結合温度を算出するか
若しくは候補オリゴ核酸配列とするかを判断させるもの
である。
【0024】さらに別の1の実施形態によれば、前記第
4の指令は、二本鎖結合温度許容範囲に入る部分配列に
前記非固有の配列部分が含まれている場合、その部分配
列を低グレードの候補オリゴ核酸配列として出力するも
のである。また、前記第2の指令は、各固有の配列部分
から二本鎖結合温度に達する長さの部分配列が得られな
い場合、この部分配列の長さを非固有の配列部分まで伸
ばし、二本鎖結合温度の許容値に入る部分配列を低グレ
ードの候補オリゴ核酸配列として出力するものであるこ
とが好ましい。
【0025】この発明の別の観点によれば、解析対象核
酸塩基配列から最適なオリゴ核酸配列の候補を設計する
ための方法であって、(a)二本鎖結合温度の許容範囲
を指定する工程と、(b)前記解析対象核酸塩基配列の
中で、部分配列の長さを伸ばしながらその長さでの二本
鎖結合温度を算出する工程と、(c)上記手段で算出し
た二本鎖結合温度が前記指定手段で指定された許容範囲
に入るかを判断し、入る場合には当該長さの部分配列を
候補オリゴ核酸配列として出力する工程とを有する方法
が提供される。
【0026】このような構成によれば、前記第1の観点
によるプログラムで実施することができる方法が提供さ
れる。
【0027】この発明の第3の主要な観点によれば、複
数のオリゴ核酸を分布させて実装してなるオリゴ核酸ア
レイであって、前記オリゴ核酸アレイは、所定の二本鎖
結合温度を有するように設計されてなる配列長さを有す
るものであることを特徴とするオリゴ核酸アレイが提供
される。
【0028】このような構成によれば、二本鎖結合温度
を基準として設計された可変長のオリゴ核酸配列を搭載
してなるオリゴ核酸アレイを得ることができる。これに
より、二本鎖結合温度に関して非常に高い精度を有する
オリゴ核酸アレイを実現できる。
【0029】なお、この発明の他の特徴及び顕著な効果
は、次の発明の実施の形態の項の記載を図面と共に参照
することで当業者にとって明確に理解することができ
る。
【0030】
【発明の実施の形態】以下、本発明の一実施形態を図に
示しながら説明する。図は発明を実施する形態の一例に
過ぎないものである。また、説明中の用語は特に述べな
い限り、この発明の属する分野において当業者が通常用
いるものを意味するものとする。
【0031】図1は、本実施形態のシステム及びプログ
ラムを説明するための全体構成図である。
【0032】このシステムは、CPU1、RAM2、キ
ーボードやマウス等の入力機器3、ディスプレイやプリ
ンタ等の出力機器4、モデム5が接続されてなるバス7
に、データ記憶部8とプログラム記憶部9が接続されて
なる。
【0033】データ記憶部8には、この発明に関係する
構成のみ挙げると、オリゴ核酸配列決定条件11と、解
析対象核酸塩基配列ファイル12と、参照専用塩基配列
ファイル15と、解析対象核酸塩基配列の類似性判別結
果13と、オリゴ核酸配列候補14とが格納されるよう
になっている。
【0034】オリゴ核酸配列決定条件11には、少なく
とも、二本鎖結合温度16とオリゴ核酸の長さ条件17
と、低グレードしきい値18が格納される。この実施形
態では、二本鎖結合温度16は、所望の二本鎖結合温度
Tmを基準として、例えば上限許容温度Tmu=Tm+3
℃、下限許容温度Tml=Tm−3℃からなる範囲が設定
される。また、長さ条件17は、ミスハイブリダイゼー
ションを有効に防止する目的で例えば50〜100塩基
(最低50塩基長、最長100塩基長)の範囲が設定さ
れる。
【0035】また、低グレードしきい値18は、候補オ
リゴ核酸配列中に含まれることが許容される非固有部分
の配列の数を、同じ候補オリゴ核酸配列中に含まれる固
有部分の配列の数に対する比として表したものである。
この実施形態では例えば50%に設定される。そして、
非固有部分の配列を一部に含む候補オリゴ核酸配列は
「低グレード」として出力され、固有部分のみからなる
候補オリゴ核酸配列とは区別される。
【0036】解析対象核酸塩基配列ファイル12は、ユ
ーザが収集した興味のある複数の核酸塩基配列を含むデ
ータである。前記参照専用塩基配列ファイル15は、c
DNA/ESTデータベース等の外部データベースから任意に
追加・設定された参照専用の塩基配列である。これらの
配列ファイル12、15は、前記モデム5を介して接続
した1又は2以上の特定の外部データベース19からダ
ウンロードしてなるデータであっても良い。
【0037】前記類似性判別結果13は、前記解析対象
核酸塩基配列同士、解析対象核酸配列と参照専用塩基配
列同士の類似性を判別することで、各解析対象塩基配列
について固有の配列部分と非固有の配列部分とを識別し
たものである。そして、前記オリゴ核酸配列候補14
は、前記類似性判別結果13と前記オリゴ核酸配列決定
条件11とに基づいて算出された様々な塩基長のオリゴ
核酸配列候補である。
【0038】一方、プログラム記憶部9には、同じくこ
の発明に関係する構成のみ挙げると、大きく分けて、オ
リゴ核酸塩基配列決定条件入力部20と、固有部分配列
フィルタ部21と、二本鎖結合温度条件フィルタ部22
と、オリゴ核酸塩基配列決定結果表示部23とが格納さ
れている。
【0039】これらの構成要素20〜23は実際には、
ハードディスク等の記録媒体に確保された一定の領域若
しくはその領域に格納されたコンピュータソフトウエア
の1又は2以上のプログラム命令からなり、前記CPU
1によってRAM2上に呼び出されて適宜実行されるこ
とでこの発明の機能を奏するようになっている。以下、
上記構成要素の詳しい構成及び機能を、このシステムに
より実行される実際のオリゴ核酸塩基配列決定手順と共
に説明する。
【0040】前記オリゴ核酸塩基配列決定条件入力部2
0は、例えば、前記ディスプレイ(出力機器4)上にユ
ーザ用の条件入力画面を表示する。この画面は、例えば
図2に25で示すようなもので、解析対象核酸塩基配列
ファイル名の入力ボックス26、二本鎖結合温度の上限
値・下限値の各入力ボックス27、28、配列長さ条件
の最小値及び最大値の各入力ボックス29、30、外部
データベース名の指定のための入力ボックス32を含
む。ユーザが各入力ボックス16〜32に値を入力若し
くは選択した後OKボタン31を押すことで、解析対象
核酸塩基配列ファイル12(外部データベース19)が
指定されると共に、前記オリゴ核酸配列決定条件11が
前記データ記憶部8に格納される。
【0041】前記固有部分配列フィルタ部21は、解析
対象核酸塩基配列ファイル12及び参照専用塩基配列フ
ァイル15から各核酸塩基配列情報を読み込み、各塩基
配列間の類似性を評価する機能を有する。類似性は塩基
に対応する文字列を単純比較することによって行う。こ
こで、適宜な配列を選択するのに塩基配列の正確な1対
1の相違比較が要求されるため、遺伝子配列検索で頻繁
に用いられる挿入欠失を加味したホモロジー検索は適し
ていない。あくまでも挿入欠失を想定しないで配列比較
を行うことが好ましい。そのためにギャップに対応して
いない検索手段が適している。
【0042】BLAST法を使用する場合には、ギャップ対
応前のものを用いデータベースサイズに依存して変化す
る期待値E-valueをかなりゆるく設定(高く設定)し、
小さな部分一致でも取出せるようにする。ここで、E-va
lueとは、特定のサイズのデータベースを検索したとき
に、実験対象の遺伝子の断片が見つかる期待値である。
さらに、それらで見つかった断片のスコアを参照し、し
きい値で与えたスコア以上のものを類似配列とする。こ
こで、スコアとは比較対象の一致度(一致する配列の長
さ若しくは類似度)に対応する量である。
【0043】図3は、解析対象核酸塩基配列のうちの1
本を取り出して示したものである。この図では、説明の
便宜のため、1本の解析対象核酸塩基配列を折り返して
複数行に亘って表示している。また、核酸の塩基情報
A、C、G、T(U)はすべて四角形で示されている。
【0044】上記固有配列フィルタ部21は、上述した
BLAST法によるホモロジー検索により、他の解析対象核
酸塩基配列若しくは参照専用塩基配列に部分一致したも
のを非固有部分配列(または、共通部分配列)として登
録していく。この図3では黒で塗りつぶして表示した部
分(図に33で示す)が非固有部分配列を示している。
したがって、白抜きのままの部分(図に34で示す)は
固有部分配列となる。
【0045】なお、BLAST法を用いない場合でも、適切
な配列幅を決めて、それを窓幅としながら、ずらして比
較する文字列一致検索の手法も利用できる。
【0046】このような方法で、所望のしきい値以上で
相互に一致する部分を検索し、ヒットした結果を非固有
部分配列(33)として登録していく。このとき、一致
文字列長を基本とするスコアと、一致した位置情報も登
録する。また必要に応じて、繰返しの配列部分を非固有
部分配列として除くことが好ましい。
【0047】そして、この固有部分配列フィルタ部21
は、すべての解析対象核酸配列を比較した後で、その比
較によって得られた結果(一致性/類似性の高い部分)
を解析対象核酸塩基配列毎に集計する。このことで、そ
の類似性の高い非固有配列部分33を消去した残りの配
列部分が、フィルタリングされた固有部分配列(また
は、相違部分配列)として出力されることになる(図に
34で示す部分)。図3は、このようにしてフィルタリ
ングされた結果である。このような類似判別後の塩基配
列が、前記類似性判別結果13としてデータ記憶部8内
に格納される。
【0048】二本鎖結合温度条件フィルタ部22は、前
記類似性判別結果13として得られた核酸塩基配列か
ら、指定された二本鎖結合温度条件に入る長さのオリゴ
核酸配列を決定する機能を奏する。
【0049】この二本鎖結合温度条件フィルタ部22
は、図1に示すように、始点設定処理部35と、長さ設
定部36と、二本鎖結合温度算出部37と、候補オリゴ
核酸配列決定部38とからなる。
【0050】二本鎖結合温度算出部37は、前記始点設
定部35で設定された始点から始まり前記長さ設定部3
6で設定された長さを有するオリゴ塩基配列の二本鎖結
合温度の算出を実行する。二本鎖結合温度の算定方法と
して、例えば、36塩基以下のものについては、Neares
t-Neighbor法(SantaLucia, J. Jr. Proc. Natl. Acad.
Sci. USA, 95, 1460-1465, 1998)を用い、37塩基以上
のものについては、J.Sambrook, E. F. Fritsch, T, Mo
lecular Cloning, p11.46: a laboratory Manual, Cold
Spring Harbor Laboratory Press, 1989に記載された
方法を用いることが現時点では好ましい。しかし、他の
方法であっても当然構わない。
【0051】前記候補オリゴ核酸配列決定部38は、前
記二本鎖結合温度算出部37が二本鎖結合温度を算出す
る度に、この算出結果を受取る。そして、前記オリゴ核
酸配列決定条件11として入力した二本鎖結合温度範
囲、及び長さ範囲に入るオリゴ核酸配列を候補として出
力する。このような処理を、前記始点ずらし配列長さを
伸ばしながら行なうことで、所望の二本鎖結合温度条件
に入る様々な長さのオリゴ核酸塩基配列の候補が得られ
ることになる。
【0052】以下、図4〜図6を用い、解析対象核酸塩
基配列のひとつと、それから温度を推定しながらオリゴ
核酸塩基配列の候補を取出す手順を詳細に説明する。
【0053】図4は、この手順を示す模式図である。
【0054】図中41は、図3と同様の類似性判別結果
である。この類似性判別結果の配列中、先頭の固有配列
部分34の中の先頭部位(n=1)から逐次配列を伸ば
しながら二本鎖結合温度を計算する。そして、あらかじ
め指定されている温度に入ったら、42に示すようにオ
リゴ核酸塩基配列の候補として保存する。そして、上限
温度Tmuを超える点まで伸張しながら候補として残し
ていく。
【0055】この例では図示を簡略化するため、前記条
件で設定した長さ17よりも短いものを候補として表示
しているが、実際には、上記設定した長さを満たす塩基
配列が候補として残される。そして上限Tmuに達した
ら、先頭位置をひとつずらし、新たな先頭部位から逐次
配列を伸ばしながら二本鎖結合温度を同様に計算する。
このことにより、図に43で示すように別の候補群が得
られる。
【0056】なお、固有部分配列の部分34が短く、固
有部分配列内では前記二本鎖結合温度を満たす長さの候
補が十分な数得られない場合には、スコアの小さい非固
有配列部分の塩基を徐々に加えて二本鎖結合温度条件を
満たす長さまで伸長し、得られたオリゴ核酸塩基配列の
低グレードの候補として表示する。具体的には、前記低
グレードしきい値18を参照し、前記被固有領域の部分
がこのしきい値18を超えるまで配列を伸ばし、超えた
ならば、先頭位置をずらすようにする。
【0057】なお、候補として出力するオリゴ核酸塩基
配列の長さとしては、50塩基長以上で、100塩基以
内が望ましい。この実施形態では、特定の長さ、60以
上で70以下などの値をしきい値として与えることによ
って、対象とする解析対象核酸塩基配列以外のサンプル
は確率的にプローブにハイブリダイズを起こしずらくな
り、ノイズを減らすことができる。
【0058】次に、図5のフローチャートを参照し、こ
のシステムによる実際の処理手順を説明する。
【0059】以下の説明及びフローチャートにおいて、
各定数及び変数は以下のように定義されているものとす
る。
【0060】n…各塩基核酸塩基配列の先頭からの配列
番号(図4に示す1,2,3,4…) nm…各塩基核酸塩基配列の最終塩基番号 PR(n)…固有配列部分の場合=1;非固有配列部分
の場合=0 ip…二本鎖結合温度を求めるオリゴ核酸配列の先頭位
置 ep…二本鎖結合温度を求めるオリゴ核酸配列の最終位
置 Tm(ip,ep)…先頭位置ipと終了位置epとの
間の配列の二本鎖結合温度 Tmu…二本鎖結合温度の上限値 Tml…二本鎖結合温度の下限値 Ls…配列長さの下限値 Ll…配列長さの上限値 Ln…低グレードしきい値(固有配列部分に対する許容
非固有領域長さの割合)
【0061】まず、工程S1で、n=1からn=nmま
でスキャンしながら順次PR値を設定していく。このこ
とで、解析対象配列の各塩基について、それが固有部分
配列領域に存在するならばPR(n)=1(図2の白抜
き部分34)、非固有部分配列領域に存在するならばP
R(n)=0(図2の黒塗りの部分33)が設定されて
いく。
【0062】次に、工程S2で、先頭位置番号ipと終
了位置番号epの初期値として、ip=1、ep=1を
設定する。次の工程S3では、終了位置番号が対象核酸
塩基配列の最終塩基番号nmに達しているかが判断され
達していない場合には、次の工程S4でipとep間の
部分配列の長さが前記配列長さの上限値Llを超えてい
るかが判断される。
【0063】超えている場合には先頭位置をずらす工程
S12(後で説明する)に移行し、超えていない場合に
は、工程S5で、前記低グレードしきい値Lnに基づ
き、ipとep間の配列の中の固有配列部分と非固有部
分配列の比がLnよりも大きいかがチェックされる。こ
の例では、Lnは50%である。したがって、ipとe
p間の配列において、PR(n)=1を有する塩基の数
の、PR(n)=0を有する塩基の数に対する比が50
%よりも大きいかをチェックする。
【0064】もし大きければ、先頭位置をずらす工程S
12に進み、小さければ二本鎖結合温度を求める工程S
6に進む。工程S6では、ipとep間の配列の二本鎖
結合温度Tm(ip,ep)値を計算して、工程S7に
進む。工程S7においては、Tm(ip,ep)値が二
本鎖結合温度の上限値Tmuよりも大きいかを判断す
る。もし大きければ、この配列を候補として残すことを
せず前記先頭をずらすための工程S12に進み、小さけ
れば次の工程S8に進む。一般に、配列がより長ければ
Tm値はより高くなるため、Tm(ip,ep)値がT
muよりも高いときには、これ以上部分塩基配列を伸ば
しても意味のないためである。
【0065】次に、工程S8において、Tm(ip,e
p)値がTmlよりも高いかをチェックする。高けれ
ば、この配列の二本鎖結合温度は上限値Tmuと下限値
Tmlの間に入っていると判断され、次の工程S9に進
む。この工程S9では、この配列の長さが下限値Lsを
上回っているかが判断され、上回っている場合には、こ
の配列(ip、ep)は候補オリゴ核酸配列と決定され
前記データ記憶部8に格納される。また、この候補オリ
ゴ核酸配列の一部に非固有配列部分が含まれる場合には
(工程S5の比が1以上の場合)、当該配列には低グレ
ードのフラグが立てられた状態で保存される。
【0066】工程S8で二本鎖結合温度が下限値よりも
低いと判断され、若しくは工程S9配列長さが短いと判
断された場合には、工程S11に進んで、前記最終位置
番号を一つ増やす(ep=ep+1)。そして、前記工
程S3〜S10を繰り返す。ここで、前記二本鎖結合温
度Tm(ip、ep)の計算は、一般に前回の計算結果
Tm(ip、ep−1)を利用することで積み上げ的に
かつ高速に行える。
【0067】このような工程を繰り返すことで、上記始
点を基点とする様々な長さの塩基配列が候補として保存
されていくことになる。
【0068】一方、前記工程S4、S5及びS7で条件
外と判断された場合には、工程S12で先頭位置をずら
す処理を行う。このため、S12では、(1)先頭位置
を一つシフトし、ここでは先頭位置番号ipを一つ増や
す(ip=ip+1)、(2)終了位置番号epをこの
先頭位置番号ipに合わせる(ep=ip)。このこと
で、先頭位置がずらされ長さもリセットされる。そし
て、上記工程S3〜S10を繰り返すことで、先頭位置
をずらしたオリゴ核酸配列が候補として逐次出力されて
いくことになる。
【0069】なお、先頭位置が非固有領域33に入った
場合には、前記工程S5でLnが100%と判断される
から、この非固有領域を抜けるまで上記二本鎖結合温度
は計算されないことになる。このことで、非固有領域は
スキップされることになる。つまり、非固有部分配列領
域を飛ばしながら、二本鎖結合温度がTmlとTmuの
間にあるような部分塩基配列だけを記憶保存していくこ
とができる。
【0070】そして、先頭位置ipがこの解析対象核酸
塩基配列の最終位置nmにまで移動したならば、前記工
程S3でこのことが検知され、全ての工程が終了する。
【0071】このような処理によれば、二本鎖結合温度
を基準とし、オリゴ核酸塩基配列の長さを可変にして候
補を決定していくことができるから、二本鎖結合温度を
より狭い範囲に入るように設計する場合でも多数のオリ
ゴ核酸配列を得ることができる。
【0072】このようにして得られたオリゴ核酸塩基配
列の候補は、前記データ記憶部8から、オリゴ核酸塩基
配列決定結果表示部23によって取り出され、ディスプ
レイ(出力機器4)上に表示される。
【0073】この設計結果は、基本的に、各解析対象核
酸塩基配列毎に表示されるが、必要であれば、たとえ
ば、オリゴ核酸塩基配列の長さ別にソート(分類)した
り、2次構造のとりやすさを評価し、2次構造のとりに
くいものを優先的に表示することが望ましい。
【0074】図6は、本実施例で決定したオリゴ核酸塩
基配列を実装したオリゴ核酸アレイ71である。このオ
リゴ核酸アレイ71は、ポリLリジン72をコートして
なるガラス基板73上に、スポット装置を使用して上記
オリゴ核酸塩基配列の候補から絞られた配列を所定の区
画74にそれぞれ実装してなるものである。このような
オリゴ核酸アレイ71によれば、それぞれの区画74ご
とにオリゴ核酸塩基配列の長さが異なっているが、それ
ぞれのスポットが適正な二本鎖結合温度範囲に入ってい
るため、ミスハイブリダイゼーションのない非常に使い
やすく安定した結果を得ることができる。
【0075】なお、この実施形態ではガラス基板73上
にオリゴ核酸塩基配列を実装する例を示したが、基板は
ガラス以外の樹脂などを利用することも可能である。ま
た、メンブレンにスポットしたアレイや、各オリゴ核酸
塩基配列が個別のエリアに存在するように区画化された
領域に埋め込まれた2次元状のアレイであれば、同様の
効果を得ることが可能である。
【0076】また、この発明は上述した一実施形態に限
定されるものではなく、発明の要旨を変更しない範囲で
種々変形可能である。例えば、上記一実施形態では、二
本鎖結合温度を求める前に、ステップS5を実行するこ
とで非固有領域をスキップしていたがこの方法に限定さ
れるものではない。すなわち、この方法では、候補オリ
ゴ核酸塩基配列の先頭は常に固有配列部分になるが、非
固有部分から開始されるものであっても良い。このた
め、例えば図7に示すように前記ステップS5を前記一
実施形態のステップS9の後に実行するようにしても良
い。このような構成によれば、先頭の塩基が固有配列部
分であるか非固有配列部分であるかを問わず、配列全体
として、固有配列部分と非固有部分配列の比がLn(例
えば50%)よりも小さければ候補として保存されるこ
とになる。なお、このようにして一部に非固有配列部分
を含む候補は低グレードの候補として出力されることに
なる(ステップS10)。このようにすることで、条件
を満たす候補の数をできるだけ増やすことが可能にな
る。
【0077】
【発明の効果】以上、説明したように本発明によれば、
二本鎖結合温度若しくは融解温度(Tm)値に関して高
い精度を有するオリゴ核酸配列を一度に多数決定するこ
とができるシステム及び方法を得ることができる。
【0078】また、このようにして得られたオリゴ核酸
配列を実装してなるオリゴ核酸アレイを得ることができ
る。
【図面の簡単な説明】
【図1】この発明の一実施形態を示すシステム構成図。
【図2】解析対象核酸塩基配列を示す模式図
【図3】解析対象塩基配列から候補オリゴ核酸配列を決
定する手順を説明するための模式図。
【図4】オリゴ核酸配列決定条件を入力するための入力
画面を示す図。
【図5】オリゴ核酸配列決定手順を説明するためのフロ
ーチャート。
【図6】この実施形態により得られたオリゴ核酸アレイ
を示す正面図。
【図7】他の実施形態に係るオリゴ核酸配列決定手順を
説明するためのフローチャート。
【符号の説明】
1…CPU 2…RAM 3…入力機器 4…出力機器 5…モデム 7…バス 8…データ記憶部 9…プログラム記憶部 11…オリゴ核酸配列決定条件 12…解析対象核酸塩基配列ファイル 13…類似性判別結果 14…オリゴ核酸配列候補 19…外部データベース 20…オリゴ核酸塩基配列決定条件入力部 21…固有部分配列フィルタ部 22…二本鎖結合温度条件フィルタ部 23…オリゴ核酸塩基配列決定結果表示部 26…入力ボックス 33…始点設定部 34…長さ設定部 35…二本鎖結合温度算出部 36…候補オリゴ核酸配列決定部 71…オリゴ核酸アレイ 73…ガラス基板 74…区画
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 17/50 638 C12N 15/00 F (72)発明者 青木 良晃 千葉県茂原市茂原643番地 株式会社ダイ ナコム内 Fターム(参考) 4B024 AA11 CA01 CA11 HA11 4B029 AA07 BB20 CC03 FA15 5B046 AA00 5B075 ND20 QS20 UU19 (54)【発明の名称】 コンピュータを利用して解析対象核酸塩基配列から最適なオリゴ核酸配列の候補を設計するため のコンピュータソフトウエアプログラム、その方法およびそのように設計されたオリゴ核酸配列 が搭載されたオリゴ核酸アレイ

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 コンピュータを利用して、解析対象核酸
    塩基配列から最適なオリゴ核酸配列の候補を設計するた
    めのコンピュータソフトウエアプログラムであって、 前記コンピュータに、二本鎖結合温度の許容範囲の指定
    を受け付けて記憶させる第1の指令と、 前記コンピュータに、前記解析対象核酸塩基配列の中
    で、部分配列の長さを伸ばしながら各長さでの二本鎖結
    合温度を算出させる第2の指令と、 前記コンピュータに、上記手段で算出した二本鎖結合温
    度が前記指定手段で指定された許容範囲に入るかを判断
    させ、入る場合には当該長さの部分配列を候補オリゴ核
    酸配列として出力させる第3の指令と、 を有することを特徴とするプログラム。
  2. 【請求項2】 請求項1記載のプログラムにおいて、 前記第2の指令は、前記解析析対象核酸配列中で二本鎖
    結合温度を求める部分配列の始点を順次ずらし、ずらし
    た始点から部分配列の長さを伸ばすものであることを特
    徴とするプログラム。
  3. 【請求項3】 請求項2記載のプログラムにおいて、 前記第2の指令は、部分配列の二本鎖結合温度が前記第
    3の指令で許容範囲から外れると判断された場合に、そ
    れ以上長さを伸ばすことをせずに始点を次にずらすもの
    であることを特徴とするプログラム。
  4. 【請求項4】 請求項1記載のプログラムにおいて、 このプログラムはさらに、 前記コンピュータに、前記第3の指令によって出力され
    た複数の候補オリゴ核酸配列を表示させる第4の指令を
    有することを特徴とするプログラム。
  5. 【請求項5】 請求項1記載のプログラムにおいて、 このプログラムはさらに、 前記コンピュータに、複数の解析対象核酸配列同士の相
    同を比較して、各解析対象核酸配列に固有の配列部分と
    非固有な配列部分とを識別させる第5の指令を有し、 前記第2の指令は、前記解析析対象核酸配列中で二本鎖
    結合温度を求める部分配列の始点を順次ずらし、ずらし
    た始点から部分配列の長さを伸ばすものであることを特
    徴とするプログラム。
  6. 【請求項6】 請求項5記載のプログラムにおいて、 前記第2の指令は、前記第3の指令で前記部分配列の二
    本鎖結合温度が許容範囲から外れると判断された場合
    に、それ以上長さを伸ばすことをせずに始点を次にずら
    すものであることを特徴とするプログラム。
  7. 【請求項7】 請求項5記載のプログラムにおいて、 前記第2の指令は、長さを伸ばした部分配列が前記非固
    有の配列部分を含む場合に前記コンピュータに当該部分
    配列の二本鎖結合温度を算出するか若しくは候補オリゴ
    核酸配列とするかを判断させる第6の指令をさらに含
    み、前記第2の指令は、この第6の指令により二本鎖結
    合温度を算出しない若しくは候補オリゴ核酸配列としな
    いと判断された場合に前記部分配列の始点を次の固有の
    配列部分の先頭にずらすものであることを特徴とするプ
    ログラム。
  8. 【請求項8】 請求項7記載のプログラムにおいて、 前記第6の指令は、コンピュータに、前記長さを伸ばし
    た部分配列に含まれる固有の配列部分と非固有の配列部
    分の比若しくは夫々の配列数に基づいて当該部分配列の
    二本鎖結合温度を算出するか若しくは候補オリゴ核酸配
    列とするかを判断させるものであることを特徴とするプ
    ログラム。
  9. 【請求項9】 請求項7記載のプログラムにおいて、 前記第4の指令は、二本鎖結合温度許容範囲に入る部分
    配列に前記非固有の配列部分が含まれている場合、その
    部分配列を低グレードの候補オリゴ核酸配列として出力
    するものであることを特徴とするプログラム。
  10. 【請求項10】 請求項5記載のプログラムにおいて、 前記第2の指令は、各固有の配列部分から二本鎖結合温
    度に達する長さの部分配列が得られない場合、この部分
    配列の長さを非固有の配列部分まで伸ばし、二本鎖結合
    温度の許容値に入る部分配列を低グレードの候補オリゴ
    核酸配列として出力するものであることを特徴とするプ
    ログラム。
  11. 【請求項11】 解析対象核酸塩基配列から最適なオリ
    ゴ核酸配列の候補を設計するための方法であって、
    (a) 二本鎖結合温度の許容範囲を指定する工程と、
    (b) 前記解析対象核酸塩基配列の中で、部分配列の
    長さを伸ばしながらその長さでの二本鎖結合温度を算出
    する工程と、(c) 上記手段で算出した二本鎖結合温
    度が前記指定手段で指定された許容範囲に入るかを判断
    し、入る場合には当該長さの部分配列を候補オリゴ核酸
    配列として出力する工程とを有することを特徴とする方
    法。
  12. 【請求項12】 請求項11に記載された方法におい
    て、(b)工程は、前記解析対象核酸配列中で二本鎖結
    合温度を求める部分配列の始点を順次ずらし、ずらした
    始点から部分配列の長さを伸ばすものであることを特徴
    とする方法。
  13. 【請求項13】 複数のオリゴ核酸を分布させて実装し
    てなるオリゴ核酸アレイであって、前記オリゴ核酸アレ
    イは、所定の二本鎖結合温度を有するように設計されて
    なる配列長さを有するものであることを特徴とするオリ
    ゴ核酸アレイ。
JP2002173467A 2001-06-20 2002-06-13 コンピュータを利用して解析対象核酸塩基配列から最適なオリゴ核酸配列の候補を設計するためのコンピュータソフトウエアプログラム、その方法およびそのように設計されたオリゴ核酸配列が搭載されたオリゴ核酸アレイ Pending JP2003125772A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002173467A JP2003125772A (ja) 2001-06-20 2002-06-13 コンピュータを利用して解析対象核酸塩基配列から最適なオリゴ核酸配列の候補を設計するためのコンピュータソフトウエアプログラム、その方法およびそのように設計されたオリゴ核酸配列が搭載されたオリゴ核酸アレイ

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2001225181 2001-06-20
JP2001-225181 2001-06-20
JP2002173467A JP2003125772A (ja) 2001-06-20 2002-06-13 コンピュータを利用して解析対象核酸塩基配列から最適なオリゴ核酸配列の候補を設計するためのコンピュータソフトウエアプログラム、その方法およびそのように設計されたオリゴ核酸配列が搭載されたオリゴ核酸アレイ

Publications (1)

Publication Number Publication Date
JP2003125772A true JP2003125772A (ja) 2003-05-07

Family

ID=26619277

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002173467A Pending JP2003125772A (ja) 2001-06-20 2002-06-13 コンピュータを利用して解析対象核酸塩基配列から最適なオリゴ核酸配列の候補を設計するためのコンピュータソフトウエアプログラム、その方法およびそのように設計されたオリゴ核酸配列が搭載されたオリゴ核酸アレイ

Country Status (1)

Country Link
JP (1) JP2003125772A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005024424A1 (ja) * 2003-08-29 2005-03-17 Olympus Corporation 遺伝子検査装置およびそれを用いた検出方法
JP2014525080A (ja) * 2011-07-05 2014-09-25 コーニンクレッカ フィリップス エヌ ヴェ バイオインフォマティクス文字セット及びマップされたバイオインフォマティクスフォントを用いたゲノム/プロテオミクス配列の表現、視覚化、比較及びレポーティング

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005024424A1 (ja) * 2003-08-29 2005-03-17 Olympus Corporation 遺伝子検査装置およびそれを用いた検出方法
JP2014525080A (ja) * 2011-07-05 2014-09-25 コーニンクレッカ フィリップス エヌ ヴェ バイオインフォマティクス文字セット及びマップされたバイオインフォマティクスフォントを用いたゲノム/プロテオミクス配列の表現、視覚化、比較及びレポーティング

Similar Documents

Publication Publication Date Title
Griffin et al. Prediction of RNA secondary structure by energy minimization
KR102587515B1 (ko) 타겟 핵산 분자에 대한 타겟 핵산서열 데이터 세트의 제공 방법
US7657382B2 (en) Method of designing primer and probe sets, primer and probe set designed by the method, kit comprising the sets, computer readable medium recorded thereon program to execute the method, and method of identifying target sequence using the sets
CN110669834A (zh) 一种基于转录组序列开发多态性ssr标记的方法
Bubb et al. Considerations in the analysis of plant chromatin accessibility data
US20030022200A1 (en) Systems for analysis of biological materials
JP2003125772A (ja) コンピュータを利用して解析対象核酸塩基配列から最適なオリゴ核酸配列の候補を設計するためのコンピュータソフトウエアプログラム、その方法およびそのように設計されたオリゴ核酸配列が搭載されたオリゴ核酸アレイ
JP4437171B2 (ja) 遺伝子の発現を解析する方法
WO2012096015A1 (ja) 核酸情報処理装置およびその処理方法
US7142989B2 (en) Computer software to computer-design optimum oligo-nucleic acid sequence candidate from nucleic acid base sequences analyzed and method thereof
US20030004939A1 (en) Search scheduling apparatus, program and recording medium having the same program recorded therein
JP2003099438A (ja) コンピュータを利用して解析対象核酸塩基配列から最適なオリゴ核酸配列の候補を設計するためのコンピュータソフトウエアプログラム及びその方法
EP1244815A2 (en) Method of analyzing a nucleic acid
JP2012146067A (ja) 核酸情報処理装置およびその処理方法
EP1134687B1 (en) Method for displaying results of hybridization experiments
JP2000285120A (ja) 遺伝子発現探索方法及びその装置
JP4109873B2 (ja) プローブ設計方法及び情報処理装置
CN109321646A (zh) 基于ngs读段与参考序列比对的虚拟pcr方法
US5948615A (en) Method for analysis of nucleic acid and DNA primer sets for use therein
JP2006053669A (ja) 遺伝子データ処理装置及び方法、遺伝子データ処理プログラム並びにそれを格納したコンピュータにより読み取り可能な記録媒体
JP2001258568A (ja) プライマー設計システム
JP2005190427A (ja) 配列を同定するための変異要素のセット抽出方法
US20030092053A1 (en) Storage medium, method for designing genotyping-microarray and computer system containing the same
WO2024024118A1 (ja) 抗体を選択するためのシステムおよびその作動方法
CN118006743A (zh) 适于枸杞花不同发育阶段荧光定量内参基因及其引物和应用

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060413