JP4250554B2 - Dnaプローブ設計装置及びdnaプローブ設計のための情報処理方法 - Google Patents

Dnaプローブ設計装置及びdnaプローブ設計のための情報処理方法 Download PDF

Info

Publication number
JP4250554B2
JP4250554B2 JP2004064494A JP2004064494A JP4250554B2 JP 4250554 B2 JP4250554 B2 JP 4250554B2 JP 2004064494 A JP2004064494 A JP 2004064494A JP 2004064494 A JP2004064494 A JP 2004064494A JP 4250554 B2 JP4250554 B2 JP 4250554B2
Authority
JP
Japan
Prior art keywords
base sequence
partial
probe
target
sequence data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004064494A
Other languages
English (en)
Other versions
JP2004318840A (ja
Inventor
裕人 吉井
寿文 福井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2004064494A priority Critical patent/JP4250554B2/ja
Priority to US10/805,292 priority patent/US7283912B2/en
Publication of JP2004318840A publication Critical patent/JP2004318840A/ja
Application granted granted Critical
Publication of JP4250554B2 publication Critical patent/JP4250554B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Description

本発明はいわゆるDNAマイクロアレイ等を用いた核酸配列解析システムに好適なオリゴヌクレオチドプローブの設計技術に関するものである。
従来より、特許文献1または特許文献2にあるように、DNAマイクロアレイを用いて遺伝子の発現やシークエンスを決定するシステムが知られている。これらの特許文献に開示されたシステムは、cDNAをスポットして作成されるDNAマイクロアレイとは異なり、試料とハイブリダイズさせるためのプローブをあらかじめ設計する必要がある。うまく適切なプローブを設計できれば、非常に高い確率で試料の中に存在する塩基配列の断片に対する情報が得られる。
このシステムにおいて、プローブとして用いられる塩基配列の長さは、長くても100ベース以上になることは珍しく、短いものでは数個の塩基配列からなるものまである。すなわち、上記特許文献で開示されたシステムでは、cDNAに比べて非常に短い塩基配列のプローブを用いて特定の塩基配列を捕らえることになる。このため、DNA中のプローブとして用いる部分の塩基配列の特異性が非常に高い必要がある。
上記のような特異性の高い部分を選び出すための従来の選択方法では、一般的な配列に対する特異性評価が行われる。例えば、人間のゲノム由来のDNAを対象としたDNAマイクロアレイを作成しようとした場合、人間の全ゲノム塩基配列に対する特異性を調べて、特異性の高い部分をプローブ塩基配列として選んでいた。
特開平10−272000号公報 特開平11−187900号公報
しかしながら、従来の選択方法では、非常に似ている塩基配列が検体の中に入っていて、かつ、それら類似した塩基配列があるグループに属する塩基配列と別のグループに属する塩基配列を含む場合、各塩基配列がそのグループに属するかを判定することは非常に困難であるという問題が存在していた。より具体的には、感染症などの判定を行う際に、同種の菌の別種類の株のDNA塩基配列には同じようなハイブリ強度を示し、かつ、別の種の菌のDNA塩基配列には異なるハイブリ強度を示すようなプローブを見つけ出すことが非常に困難であるという問題があった。
また、従来の方法では、非常に似ている塩基配列の中で、生物種に特異的な場所、かつ、多型には共通な場所を探そうとする場合、マルチプルアラインメントなどの方法を用いて、対象としている生物種の全ての多型の塩基配列を揃えて表示し、人間が目で見て妥当な部分を選んでいた。この従来法では、人間のミスが混入したり、人によるバラツキが生じていた。
本発明は、上記課題に鑑みてなされたものであり、正確かつ、再現性のあるプローブ設計を可能とすることを目的とする。
上記の目的を達成するための本発明によるDNAプローブ設計のための情報処理方法は以下の工程を備える。即ち、
情報処理装置によるDNAプローブ設計のための情報処理方法であって、
第1カウント手段が、ターゲットの塩基配列データを含む第1の塩基配列データ群について、設定された塩基数の部分塩基配列を前記ターゲットの塩基配列データの一端から他端まで順次に取り出すことにより前記第1の塩基配列データ群における複数の部分塩基配列を取得し、前記複数の部分塩基配列の各々の出現数をカウントすることにより得られた第1の頻度情報をメモリに記憶する第1カウント工程と、
第2カウント手段が、前記第1の塩基配列データ群とは区別されるべき第2の塩基配列データ群について、前記複数の部分塩基配列の各々の出現数をカウントすることにより得られた第2の頻度情報をメモリに記憶する第2カウント工程と、
表示手段が、前記第1及び第2カウント工程によってメモリに記憶された前記第1及び第2の頻度情報に基づいて各部分塩基配列の頻度を前記ターゲットの塩基配列の順に並べてそれぞれをグラフ表示する表示工程と、
出力手段が、前記複数の部分塩基配列の少なくとも一つを指示するユーザの指示操作に応じて指示された部分塩基配列の情報を出力する出力工程とを備える。
また、上記の目的を達成するための本発明の態様によるDNAプローブ設計のための情報処理方法は、
情報処理装置によるDNAプローブ設計のための情報処理方法であって、
第1カウント手段が、ターゲットの塩基配列データを含む第1の塩基配列データ群について、設定された塩基数の部分塩基配列を前記ターゲットの塩基配列データの一端から他端まで順次に取り出すことにより前記第1の塩基配列データ群における複数の部分塩基配列を取得し、前記複数の部分塩基配列の各々の出現数をカウントすることにより得られた第1の頻度情報をメモリに記憶する第1カウント工程と、
第2カウント手段が、前記第1の塩基配列群とは区別されるべき第2の塩基配列データ群について、前記複数の部分塩基配列の各々の出現数をカウントすることにより得られた第2の頻度情報をメモリに記憶する第2カウント工程と、
出力手段が、前記第1カウント工程で得られた前記第1の頻度情報と前記第2カウント工程で得られた前記第2の頻度情報とに基づいて部分塩基配列を抽出し抽出された部分塩基配列に基づいてプローブ候補の塩基配列を決定し、前記第1および第2の頻度情報とともに、各部分塩基配列の頻度を前記ターゲットの塩基配列の順に並べた時の該プローブ候補に対応する部分塩基配列に隣接する部分塩基配列の第1及び第2の頻度情報を出力し、更に該プローブ候補に対応する部分塩基配列の前記ターゲット塩基配列上の位置情報及び配列情報を出力する、出力工程とを備える。
本発明によれば、正確かつ、再現性のあるプローブ設計が可能となる。
以下、添付の図面に基づいて本発明の好適な実施形態を説明する。
<第1実施形態>
[プローブ設計方法の説明]
図2は第1実施形態によるプローブ設計方法が適用される情報処理装置の構成を示すブロック図である。本実施形態のプローブ設計方法は、外部記憶装置201、中央処理装置(CPU)202、メモリ203、入出力装置204から構成される装置に実装される。すなわち、一般的なパーソナルコンピュータ、ワークステーション等に実装可能である。
図2において、外部記憶装置201は、本実施形態のプローブ設計方法を実現するプログラムや、各種塩基配列データ及びパラメータ(DNA(オリゴヌクレオチド)プローブ長や融解温度等)を保持する。また、本実施形態によって選択されたプローブ配列そのものを保持する機能を持つ。中央処理装置(CPU)202はプローブ設計のプログラムを実行したり、すべての装置の制御を行なったりする。メモリ203は中央処理装置(CPU)202が使用するプログラム、及びサブルーチンやデータを一時的に記憶する。入出力装置204は、ディスプレイ、キーボード、ポインティングデバイス等を含み、ユーザとのインタラクションを行う。多くの場合、本実施形態のプローブ設計方法を実現するプログラム実行のトリガはこの入出力装置を介してユーザが出す。また、ユーザが結果を見たり、プログラムのパラメータ制御をこの入出力装置を介して行う。
図1は、第1実施形態によるプローブ設計方法の処理手順を説明するフローチャートである。101は自己塩基配列データであり、例えばターゲット塩基配列107がある特定の菌の特定株の塩基配列であった場合、ターゲット塩基配列107と同種の菌の種々の株が有する塩基配列のデータからなる。102は自己頻度テーブル作成ステップであり、自己塩基配列データ101に含まれる部分塩基配列の頻度をカウントして自己頻度テーブルを作成する。103はターゲット塩基配列と競合する競合塩基配列データであり、自己塩基配列データ101の菌種とは異なる種々の菌種の種々の株が有する塩基配列のデータからなる。104は競合頻度テーブル作成ステップであり、競合塩基配列データ103に含まれる部分塩基配列の頻度をカウントして競合頻度テーブルを作成するステップである。
108はプローブ評価ステップであり、自己頻度テーブル105と競合頻度テーブル106を用いて、ターゲット塩基配列107からプローブ候補を導き出す。109はプローブセット選択ステップであり、プローブ評価ステップ108の結果得られたプローブ候補から、より適切なプローブ候補のセットを選択する。なお、プローブセット選択ステップ110におけるプローブ候補の選別方法については後述するが、例えば、(1)塩基配列長、(2)融解温度、(3)2次構造の生成可能性、(4)塩基配列の類似性を利用して選別される。110は最終的に得られた最適プローブを示す。なお、
図1に示すプローブ設計処理において、入力はターゲット塩基配列107であり、出力は最適プローブ110である。
図1の各データ及び処理について詳述する前に、本発明のバックグラウンドとなる知識を説明する。図3はDNAマイクロアレイ上のハイブリダイゼーション(以降、ハイブリと略す場合がある)の様子を示した図である。生体内でほとんどの場合、DNA塩基列は2重らせん構造をしていて、その2本鎖の間の結合は塩基間の水素結合で実現されている。一方、RNA塩基列は1本で存在する場合が多い。塩基の種類はDNAの場合はACGTの4種類、RNAの場合はACGUの4種類であり、それぞれ水素結合ができる塩基対はA−T(U)、G−Cのペアとなっている。ハイブリダイゼーションとは、1本鎖状態の核酸分子同士がある部分の塩基配列を介して部分的に結合する状態をいい、本実施形態で想定している反応は、図3の上側の基板にくっついた核酸分子(プローブ)の方が下側の資料中にある核酸分子より短い。よって、資料中に存在する核酸分子がプローブ塩基配列を含む場合は、このハイブリダイゼーション反応はうまくいき、試料中のターゲット核酸分子はトラップされることとなる。
次に、図4を用いて感染症の菌を特定するDNAマイクロアレイの原理を説明する。図4で示したDNAマイクロアレイは、例えば、黄色ブドウ球菌を特定する目的で作られていると仮定する。図4の左側は、黄色ブドウ球菌野生株由来の処理系列であり、右側は大腸菌野生株由来の処理系列である。例えば、左側は黄色ブドウ球菌に感染した患者の血液を処理する流れで、右側は大腸菌に感染した患者の血液を処理する流れだと考えてよい。
どちらも基本的には同じ処理を行う。つまり、まず初めに例えば菌感染患者の血液や、痰などからDNAを抽出する(401、411)。この際に、一般的には、患者の体細胞由来の人間のDNAも含まれる可能性がある。抽出されたDNAが少ない場合、PCRなどの方法で増幅を行う。この際に蛍光物質もしくは蛍光物質を結合させることができる物質を標識として混入させるのが一般的である(402、412)。
増幅をしない場合は、抽出されたDNAを用いて、相補鎖を作りながら蛍光物質もしくは蛍光物質を結合させることができる物質を標識として混入させる、または、そのまま直接抽出されたDNAに蛍光物質もしくは蛍光物質を結合させることができる物質を標識として付加させる(403、413)。
通常、PCR増幅を行う場合、感染症の菌特定が目的であれば、いわゆる16sといわれるリボゾームRNA(16s rRNA)を構成する塩基配列の部分を増幅するのが一般的である。この場合、図4の左側の黄色ブドウ球菌のPCRプライマーと右側の大腸菌のPCRプライマーはほとんど同じものを使うこととなる。より具体的には、どんな菌の16s rRNAをコーディングしている部分でも増幅させることができるプライマーセットを用いて、マルチプレックスPCRを行うことが好ましい。この場合、結果的に、図4における右と左のどちらのハイブリ溶液(404、414)も複数の種類の塩基配列を含むものとなる。この理由は図5を参照して詳しく述べる。
これに対して、より詳しい塩基配列解析を行いたい場合は、例えば、黄色ブドウ球菌用のPCRプライマーセット、大腸菌用のPCRプライマーセットを別々に設定する。この場合、仮に菌のゲノムの特定部分だけを選択的に増幅するようにプライマーを設定すれば、ハイブリ溶液に含まれる塩基配列の種類は非常に限定される。それでも通常、自然界に存在する菌の株は数種類に及ぶので、ハイブリ溶液に存在する塩基配列の種類が1種類となることは稀である。
ここで黄色ブドウ球菌を判定する目的のために設計されたDNAマイクロアレイが正しく動作するならば、ハイブリ溶液404ではスポットがポジティブに反応し(405)、右側のハイブリ溶液414では、スポットがネガティブに反応する(415)。
これと全く同じように、大腸菌の存在を判定する目的のために設計されたDNAマイクロアレイが正しく動作するならば、ハイブリ溶液404ではスポットがネガティブに反応し、ハイブリ溶液414ではスポットがポジティブに反応する。もちろん、いろんな菌に対してそれぞれ特異的に反応する数種類のスポットを同時に並べたDNAマイクロアレイを用いて、感染菌の判定を行ってもかわまない。
次に、図5を用いて、図4のハイブリ溶液に複数の種類の塩基配列が存在する理由を説明する。通常、自然界に存在する菌は、突然変異を頻繁に起こす。その結果、淘汰を経て生き残った主要な数種類の株が同時に存在することがある。例えば、院内感染などで問題を起こす菌株は、通常は薬剤耐性がないはずの菌が、突然変異を起こすことによって薬剤耐性を獲得することで出現する。薬剤耐性を獲得した結果、殺菌努力を行っている衛生的な環境でも旺盛な繁殖力を持つ菌が出現したりする。このように、自然界に存在する同一の菌の塩基配列は、数種類のバリエーションをもつと考えるのが妥当である。
図5に示したのは、黄色ブドウ球菌にMu50とMW2の2種類の株のゲノム構造である。それぞれの株のゲノムの総塩基数はそれぞれ2,878,040と2,820,462と異なっている。なお、図5では、左から右への方向を5’末端から3’末端方向とし、これを順方向として塩基配列が示されている。更に16sのリボゾームRNA(16s rRNA)をコーディングしている部位は、Mu50の場合は順方向2箇所、逆方向3箇所の合計5箇所であるのに対して、MW2では順方向3箇所、逆方向3箇所の合計6箇所存在する。これらの16s rRNAの各部位の塩基配列はそれぞれ非常に似ているが、全く同じではない。つまり、調べようとている菌感染患者の体の中に存在する菌の株の種類がたとえ1種類であったとしても、図4のような一般的な処理でハイブリ溶液を調製すると複数種類の塩基配列がハイブリ溶液の中に存在することになる。この複数の塩基配列に対して同じようなハイブリ強度を示すプローブを設計することが本実施形態のプローブ設計方法の目的である。
この目的を達成するために本実施形態のプローブ設計方法は、図1に示した通り、ターゲット塩基配列と同じグループに属する塩基配列のセット(自己塩基配列データ101)と、そのグループに競合するグループに属する塩基配列のセット(競合塩基配列データ103)から別々に頻度テーブルを作成する。図4の例で言うと、例えば黄色ブドウ球菌の色々な株の色々な部位の16s rRNAの塩基配列の集合が自己塩基配列データ101となり、黄色ブドウ球菌以外の例えば大腸菌や、インフルエンザ菌などの種々の菌の色々な株の色々な部位の16s rRNAの塩基配列の集合が競合塩基配列データ103となる。
これらの塩基配列データから頻度テーブルを作成する様子を図6に示す。頻度テーブルの作成においては、塩基配列データに含まれる長さn(図6ではn=9)の部分配列の出現回数をカウントする。長さnの塩基配列のバリエーションは4のn乗なので、図6において、行の数は4nとなる。なお、図6において出現頻度が低いほど、その部分配列の特異性は高くなるので、例えば頻度にマイナス1をかけた数を特異性とする。
すなわち、自己頻度テーブル作成ステップ102は検出対象の菌種の種々の株の16s rRNAの塩基配列を記憶する自己塩基配列データ101を参照して、長さnの全ての部分塩基配列について出現回数をカウントし、その結果を図6の如くテーブル化し、自己頻度テーブル105とする。同様に、競合頻度テーブル作成ステップ104は検出対象の菌種以外の菌種(検出対象から区別されるべき菌種)の種々の株の16s rRNAの塩基配列を記憶する競合塩基配列データ101を参照して、長さnの全ての部分塩基配列について出現回数をカウントし、その結果を図6の如くテーブル化し、競合頻度テーブル106とする。
次に、図1のターゲット塩基配列107に対する部分列(n個の塩基からなる塩基配列)の頻度または特異性を上記頻度テーブルを用いて求める。この様子を示したのが図7である。このターゲット塩基配列107は、例えば、図5におけるMu50株の黄色ブドウ球菌の一番左の16s rRNAコーディング部位(配列X)などとなる。プローブ評価ステップ108では、自己頻度テーブル105及び競合頻度テーブル106を参照して、ターゲット塩基配列107から順次得られる部分列の頻度(特異性)を取得し、評価する。この様子をグラフに示したのが図8である。
図8の横軸はターゲット塩基配列の部分配列の位置であり、例えば16s rRNAの部分を調べたいとすれば、その長さは約1500程度となる。縦軸は、その位置における部分配列の特異性であり、例えば頻度テーブルの値にマイナス1をかけた数である。図8において、上段に示したグラフが図1における競合頻度テーブル106を元に導いた特異性を表し、下段に示したグラフが図1における自己頻度テーブル105を元に導いた特異性を表す。
例えば、図8のグラフの場合、配列の先頭から約2/3の部分、つまり約1000ベースぐらいの位置で、このターゲット塩基配列の特異性の高い部分が存在する。例えば、このターゲット塩基配列が図5のMu50株の最初の16s部分(配列X)だったとすると、この配列Xの1000ベースあたりの位置で、この配列に特有の塩基配列が存在し、それは、Mu50株のその他の16sの部位、または、黄色ブドウ球菌のMu50株以外の株の16s rRNA部位とは異なる配列であることを意味する。よって、この部分からプローブ候補を選択することは、好ましくない。また、上段のグラフにおいて特異性の低い部分は、他の種の菌との識別ができないことを意味しており、その部分からプローブ候補を選択することも好ましくない。
したがって、上段のグラフで山となっており(異種菌間で特異性が高い)、かつ下段のグラフで山となっていない部分(同種菌の異種株間で特異性が低い)よりプローブ候補を選択する。このことで、判定するべき菌とは異なる菌種に対しては特異性が高く(=頻度が低く)、判定するべき菌の色々な変異体に対しては特異性が低い(頻度が高い)プローブを選ぶことができる。すなわち、図8のように、各特異性を複数の部分塩基配列を基準に対比可能に表示することにより、ユーザは容易に適切なプローブ候補を選択できる。
この結果、同じ菌であれば、どのような株のどのような部位の16s rRNAコーディング配列がハイブリ溶液に含まれていても強いハイブリ反応を示し、かつ、他の菌のどのような株のどのような部位の16s rRNAコーディング配列がハイブリ溶液に含まれていても弱いハイブリ反応を示すプローブが選ばれることとなる。
なお、本発明のプローブ設計方法は、感染症の判別にのみ適用できるものではなく、一般的に同一と判断するべき塩基配列の対象の中に若干のバリエーションが存在するものなら何でも適用できる。例えば人間の個体判別によく用いられるMHCなどの判定などにも適用できる。
次に、図1のプローブセット選択ステップ109について説明する。図1のプローブ評価ステップ108で高い評価を得たプローブの中で、長さを揃えてプローブセットとするのが一番単純なプローブセット選択の方法である。しかしながら、ハイブリダイゼーション反応はプローブ塩基配列の長さよりも、その融解温度で決まる場合が一般的である。よって、例えば標準プローブ長n(本例ではn=24とする)を設定しておいて、その長さの前後数塩基の許容範囲(本例では±2とする)より得られる各プローブについて融解温度を求め、出来るだけ融解温度を一定にするように採用すべきプローブを決定することによって、より高い品質のプローブセットが得られる。
なお、塩基配列の融解温度は、その配列の塩基の混入率で求める方法や、いわゆるNearest Neighbor法と呼ばれる連続する2つの塩基配列の並び方から求める方法などが知られており、これらの方法を用いて融解温度を算出することができる。
また、塩基配列の長さが20を超えてくると、2次構造を形成して、プローブとして適切でない場合が発生する。これを防ぐために、例えばMichael Zuker氏の考案した“Calculating nucleic acid secondary structure.” (Current Opinion in Structural Biology, 10, 303-310, (2000)) に記載の方法などを用いて2次構造形成の可能性を計算し、2次構造を形成しやすいプローブは排除するようにしてもよい。
また、図1のプローブ評価ステップで説明した頻度テーブルを用いる方法は、あくまで特異性の目安としてプローブ候補を選ぶ方法であるので、実際に選ばれたプローブ群が似かよったものとなる可能性がある。したがって、プローブ候補がどの程度お互いに似ているかを、お互いのマッチングを取ることで調べ、似かよったプローブ候補を排除することが好ましい。例えば、N個のプローブ候補からプローブセットを選択するとすると、N(N−1)/2個のマッチングを取り、プローブ同士の塩基配列がお互いにどれぐらい異なっているかを評価して、異なる塩基数がより多いプローブセットを選ぶようにする。このことによって、より高い品質のプローブセットを選択することができる。なお、この方法は、いわゆるクロスハイブリダイゼーションを防ぐ方法と呼ばれる。
[プローブ設計装置のより詳細な説明]
図9〜図11を用いて第1実施形態のプローブ設計プログラムの動きを説明する。プローブ設計プログラムの動作はまずターゲット生物グループの選定(901)から始まる。例えば、感染症の原因菌特定のためのプローブを設計しようとしたとすると、ターゲット生物グループが、菌やウィルス、真菌などのゲノム情報が塩基配列データベース906から選ばれる。図9において、塩基配列データベース906は、NCBIなどの公共のデータベースや、自社のイントラネット上に構築された塩基配列データベースなどで、現在入手可能な最大量のデータが蓄積されたものを意味する。一方、ターゲット塩基配列データベース907は、ターゲット生物グループの選定(901)で選ばれた生物種のゲノム情報しか含まない。例えば、本プログラムを人間の体質判定のためのプローブ設計に適用した場合は、ターゲット塩基配列データベース907に格納される塩基配列は、例えばMHCのDRB1の部分の全アレルの情報などとなる。
次に、ターゲット生物種の選定を行う(902)。ターゲット生物種を選定すると、ターゲット塩基配列データベース907に含まれる塩基配列が自己塩基配列データと競合塩基配列データに分けられる。すなわち、ターゲット塩基配列データベース907に含まれる情報から、ターゲット生物種の複数の多型、複数のゲノム部位に対応する自己塩基配列データ908が抽出されるとともに、ターゲット塩基配列データベース907に含まれる、ターゲット生物種以外の生物種の複数の多型、複数のゲノム部位に対応する競合塩基配列データ909が抽出される。
次に、選ばれたターゲット生物種を元に自己頻度テーブル910(図1の自己頻度テーブル105に相当)と競合頻度テーブル911(図1の競合頻度テーブル106に相当)を作成する(903)。この頻度テープルの作成(903)のとき、通常は、ターゲットとするゲノム領域も設定する。例えば菌種の判別を行うプローブを設計する場合には、16s rRNAの部分が選ばれたりする。
より具体的に述べると、図4で述べたとおり、通常、DNAマイクロアレイを用いた実験を行う場合、PCRでターゲットとなる核酸を増幅する。この時、PCRプライマーで挟んだ領域のみが増幅されるので、ターゲット塩基配列データベース907の中のPCRで増幅される部分のみを用いて頻度テーブルを作成する。本プログラムを人間の体質判定のためのプローブ設計に適用した場合は、例えばターゲットとするDNA領域もMHCのDRB1の部分などに予め設定されるので、このDNA領域を設定する必要はない。また、例えばMHCのDRB1の解析であれば、たんぱく質発現に差を示さない3桁までのアレルを同一種として扱う。なお、ターゲットとする核酸領域、またはPCR増幅領域の指定は、通常、プログラムのプロパティとして設定し、UI(ユーザインターフェース)を使ってその都度設定することはない。
次にターゲット塩基配列の選定を行い(904)、そのターゲット塩基配列の部分列群の特異性を自己頻度テーブル910と競合頻度テーブル911を用いて評価し、プローブを選定する(905)。
図10は、ターゲット生物種の選定(902)からターゲット塩基配列の選定(904)までを行うユーザインターフェースの例を示したものである。まず、ターゲット菌種欄1001にターゲット菌種としての菌の一覧が表示される。ここで、例えば黄色ブドウ球菌(Staphylococcus aureus)を選ぶと、株表示欄1002に黄色ブドウ球菌の色々な株の色々な部位の16s rRNAを示す一覧が表示される。ここまでのインタラクションで、図9の902、903(ターゲット生物種の選定と頻度テーブルの作成)が実行される。株表示欄1002に示されている多型としての複数の株は、図5に示した株である。例えば、図10のように、株の名前、ゲノム上の位置、方向を示すことによって、それぞれの塩基配列の識別ができるようにする。
株表示欄1002の一覧の中で1つの配列を選ぶと、ターゲット塩基配列の選定(904)が実行される。図10に示したように黄色ブドウ球菌Mu50株の先頭の16s rRNAを選んだとすると、ターゲット塩基配列として図5の配列Xが選ばれたことになる。そして、デザインボタン1003を押すと、プローブ評価ステップ108に処理が移行し、デザイン画面が表示される。
図11は実際のデザイン画面の例を示した図である。1101から1104はグラフを示し、横軸は、例えば図10のようなUIで選ばれたターゲット塩基配列の位置を意味し、それぞれのグラフはそのターゲット塩基配列のそれぞれの位置の部分塩基配列に対する値をグラフ化したものである。グラフ1102とグラフ1103は、それぞれ図8の上段下段のグラフに対応しており、グラフ1102はそれぞれの位置の部分配列の競合塩基配列データに対する特異性をグラフ化したもの、グラフ1103はそれぞれの位置の部分配列の自己塩基配列データに対する特異性をグラフ化したものとなる。また、グラフ1101はそれぞれの位置の部分配列の人間のゲノムに対する特異性を示す。グラフ1104はそれぞれの位置の部分配列を先頭とする所定個数の塩基配列(本例では24個の塩基からなる塩基配列(24ベースの塩基配列))の融解温度を示す。
図8で説明したように、グラフ1102で山になっていて、グラフ1103で谷になっている場所でプローブを設定するのがよい。1105は情報欄であり、現在のターゲット生物種や各種のパラメータなどを表示する。なお、本実施形態ではデフォルトの塩基長として24が設定されており、これを基準にグラフ1104の融解温度が計算されている。1106は、設計したプローブのリストで、その位置は、ライン1107(点線)で表示される。1108の実線は“カレント”位置を示し、現在注目している位置で、その位置に対応する部分塩基配列(24ベースの塩基配列)は1109に表示され、その直前の部分の塩基配列は1110、その直後の部分の塩基配列は1111に表示される。本実施形態では前後10個の塩基からなる配列が示される。
また、図11のUIでは、1112に示すように、ターゲット塩基配列の中で塩基配列を検索する機能を持っている。
また、例えば、感染症の原因菌を特定するプローブを設計する場合は、人間のゲノムも含まれてくるので、例えばグラフ1101に示すように、人間のゲノムに対するターゲット塩基配列の部分配列の特異性を表示してもよい。また、プローブを設定するために実施例1で説明したように融解温度(Tm)を選択したプローブ間で出来るだけ似通った温度にする方がいい。これを実現するために、例えばグラフ1104では、その位置の部分塩基配列のTmをグラフとして表示する。
プローブ評価ステップ108では、グラフ1101〜1104を参照してユーザが指示した実線1108の移動に応じてプローブ候補の評価を行なう。このとき、例えば、実線1108を移動させていく間に指定可能な位置(グラフ1103において特異性がある第1の閾値よりも低く、グラフ1102において特異性がある第2の閾値よりも高い部分)に入った際にこれをユーザに報知する(例えば、実線1108の色を変える等)ように構成する。このようにすれば、ユーザはより容易に適切な部分塩基配列を見つけることができる。そして、実線1108が上記指定可能な位置にある間に、不図示の確定ボタンを押すことにより、当該位置に対応した部分塩基配列がプローブ候補として設定される。こうして設定されたプローブ候補はさらにプローブセット選択ステップ109でさらに絞り込まれ、適切なプローブセットが決定される。
なお、上記プローブ評価ステップ108において、グラフ1103で特異性が低く、グラフ1102で特異性が高い部分を自動的に抽出してユーザに提示するようにしてもよい。例えば、グラフ1103において特異性がある第1の閾値よりも低く、グラフ1102において特異性がある第2の閾値よりも高い部分を抽出してユーザに提示する。なお、上記で設計された塩基配列の相補的な配列も同様にプローブとして用いることができるので、これらを併せて表示する、或いは設計結果として提示するようにしてもよい。
<第2実施形態>
第1実施形態では、図11のように頻度情報を表示して、ユーザに適切な位置を選択させている。このように頻度情報を用いることで、ユーザは容易に適切なプローブ候補を選択できるのであるが、一般にマイクロアレイに設定するプローブの数は数百から数千と膨大である。よって、このような全てのプローブを頻度情報を元にしてユーザが設定していくのは、大変な時間と手間がかかることにもなりうる。また、第1実施形態で述べたように、単純に特異性の値を閾値と比較することにより自動的に部分塩基配列を抽出することもできる。しかしながら、この場合、(1)塩基長の全体に渡ってサーチとは多大な計算時間が必要となる、(2)類似した塩基配列が数多く抽出される可能性がある、(3)よって、塩基長の全体に渡って、適度に分散した位置から部分塩基配列を抽出することが困難である、といった課題がある。
そこで、第2実施形態においては、上記の課題を解決するプローブ設計の自動化方法について説明する。
第2実施形態によるプローブ設計方法が適用される情報処理装置の構成は第1実施形態(図2)と同様である。
図12は、第2実施形態によるプローブ設計方法の処理手順を説明するフローチャートである。第1実施形態(図1)と同様のステップ及びデータには同一の参照番号を付してある。
1201は全塩基配列データであり、実際には自己塩基配列データ101と競合塩基配列データ103の集合である。1202は共通配列データ作成ステップであり、全塩基配列データ1201に含まれる全ての塩基配列において共通する部分塩基配列を抽出し、共通領域データ1203を作成する。なお、共通する部分塩基配列は所定数以上の塩基からなる塩基配列(例えば20ベース以上の塩基長)であって、全ての塩基配列中に含まれるものを検索することにより得られたものとする。また、このよう共通領域は、例えば、マルチプルアライメント処理により得ることができる。
1211はプローブ評価ステップであり、自己頻度テーブル105と競合頻度テーブル106と共通領域データ1203を用いて、ターゲット塩基配列107からプローブ候補を導き出すステップである。プローブセット選択ステップ1212は、プローブ評価ステップ1211の結果得られたプローブ候補より最適なプローブセットを選択する。1213は最終的に得られた最適プローブを示す。なお、図12に示すプローブ設計処理において、入力はターゲット塩基配列107であり、出力は最適プローブ1213である。
ここで、本実施形態による自動プローブ設計について概要を説明する。プローブ設計の自動化のために、本実施形態では共通領域データ1203を利用する。共通領域データ1203は、共通領域データ作成ステップ1202により作成される。
共通領域データ作成ステップ1202では、自己塩基配列データ101と競合塩基配列データ103を合わせた全塩基配列データ1201を対象に、全塩基配列において共通に存在する部分配列を探し、その配列における位置と長さとを共通領域データ1203として保持する。例えば、細菌の16s rRNAにおいては、共通に存在する部分配列が似通った位置に存在することが分かっている。
ターゲット塩基配列107について共通領域データ1203を参照すると、図13のように、ターゲット塩基配列を意味する1301上では、共通領域1302、1303…1306…、とそれらの共通領域に挟まれた領域1312、1313、…、1315…とを区別することが可能になる。この共通領域に挟まれた各領域において、自己頻度テーブル105と競合頻度テーブル106とを参照することで、同種菌の異種株間での特異性が低くかつ異種菌間で特異性の高くなる位置を一箇所選択する。ターゲット塩基配列1301上には、共通領域は複数箇所あり、よって共通領域に挟まれている領域も複数存在するため、共通領域に挟まれている領域のある限り、同様の処理を機械的に繰り返すことで、ターゲット塩基配列1301の全長に渡ってプローブを設定することが可能となる。以上の処理については、複数の菌種に渡って多数のターゲット塩基配列107がある場合でも機械的に処理することが可能であり、よってコンピュータによる自動化が可能である。
なお、本実施形態のプローブ設計方法は、第1実施形態と同様に、感染症の判別にのみ適用できるものではなく、一般的に同一と判断するべき塩基配列の対象の中に若干のバリエーションが存在するものなら何でも適用できる。例えば人間の個体判別によく用いられるMHCなどの判定などにも適用できる。
また、共通領域データ作成ステップ106を通して作成された共通領域データ109は、多種の遺伝子を共通して増幅させることができるPCR用のユニバーサルプライマとしての利用も可能である。
[プローブ設計装置のより詳細な説明]
図14〜図16を用いて第2実施形態のプローブ設計プログラムの動きを説明する。14において第1実施形態(図9)と同様の処理及びデータについては同一の参照番号を付してある。図9に関して上述したように、ターゲット生物グループの選定(901)では、設計しようとするプローブに応じて選定されたターゲット生物グループに属する、菌やウィルス、真菌などのゲノム情報が塩基配列データベース906から選ばれ、ターゲット塩基配列データベース907に格納される。
次に、ターゲット生物種の選定(902)により、ターゲット塩基配列データベース907に含まれる塩基配列が自己塩基配列データと競合塩基配列データに分けられる。すなわち、ターゲット塩基配列データベース907に含まれる情報から、ターゲット生物種の複数の多型、複数のゲノム部位に対応する自己塩基配列データ908が抽出されるとともに、ターゲット塩基配列データベース907に含まれる、ターゲット生物種以外の生物種の複数の多型、複数のゲノム部位に対応する競合塩基配列データ909が抽出される。
次に、選ばれたターゲット生物種を元に自己頻度テーブル910と競合頻度テーブル911を作成する(903)。この頻度テープルの作成(903)のとき、通常は、ターゲットとするゲノム領域も設定する。例えば菌種の判別を行うプローブを設計する場合には、16s rRNAの部分が選ばれたりする。
頻度テーブルの作成(903)とともに、共通領域データ913(図12の共通領域データ1203に相当)を作成する(921)。即ち、ターゲット塩基配列データベース907に保持されている全ての塩基配列(912)に共通する部分配列の情報が共通領域データ913に格納される。頻度テーブルの作成については第1実施形態で詳述したとおりである。次にターゲット塩基配列の選定を行い(922)、そのターゲット塩基配列の部分列群の特異性を自己頻度テーブル910と競合頻度テーブル911と共通領域データ913を用いて評価し、プローブを選定する(923)。
図15は、ターゲット生物種の選定(902)からターゲット塩基配列の選定(922)までを行なうユーザインタフェースの例を示したものである。まず、ターゲット菌種欄1501にターゲット菌種としての菌の一覧が表示される。ここで、例えば黄色ブドウ球菌(Staphylococcus aureus)を選ぶと、塩基配列の表示欄である1502に黄色ブドウ球菌の種々の株の色々な部位の16S rRNAの塩基配列が一覧として表示される。ユーザはこの1502の表示欄から所望の株の所望の部位を選択できる。ここまでのインタラクションで、図14の902、903、921(ターゲット生物種の選定と頻度テーブル及び共通領域データの作成)が実行される。
例えば黄色ブドウ球菌であっても、図5に示すように、株ごとに複数の部位に16S rRNA領域があることから、任意の株における任意の位置の16S rRNA領域を選択可能にするために、表示欄1502にて選択された塩基配列に関する情報を表示欄1503に表示する。表示欄1503のように株名称、ゲノム上の位置の情報などを示すことにより、それぞれの塩基配列の識別が可能である。また、表示欄1503には、GIやACCESSION番号のような公共データベースにおいて一意に定められている識別番号を表示したり、同時にその識別番号から公共データベースの情報を表示できるような仕組を備えても良い。
塩基配列表示欄である1502は、複数の塩基配列の位置を調製して(例えば、マルチプルアライメント処理)して、表示しても良い。また、塩基配列表示欄である1502は、各塩基配列における共通領域に相当する部分を、色やフォントなどを変更することによって強調表示してもよい。
塩基配列を表示する表示欄1502の一覧の中で一つの配列を選ぶと、ターゲット塩基配列の選定(922)が実行される。図15に示したように黄色ブドウ球菌Mu50株の先頭の16s rRNAを選んだとすると、ターゲット塩基配列として図5の配列Xが選ばれたことになる。そして、デザインボタン1004を押すと、図16に示すようなデザイン画面が表示される。
図16は本実施形態によるデザイン画面の例を示した図である。インターフェースの構成は第1実施形態(図11)とほぼ同様であり、同様の構成要素には同一の参照番号を付してある。
1101から1104はグラフを示し、横軸は、例えば図15のようなUIで選ばれたターゲット塩基配列の位置を意味する。図11で上述したように、グラフ1102はそれぞれの位置の部分配列の競合塩基配列データに対する特異性をグラフ化したもの、グラフ1103はそれぞれの位置の部分配列の自己塩基配列データに対する特異性をグラフ化したものである。また、グラフ1101はそれぞれの位置の部分配列の人間のゲノムに対する特異性を示す。グラフ1104はそれぞれの位置の部分配列を先頭とする所定個数の塩基配列(本例では24個の塩基からなる塩基配列(24ベースの塩基配列))の融解温度を示す。
先に記したように、図15のようなUIにてターゲット塩基配列を選択した時点で、自己頻度テーブル910と競合頻度テーブル911と共通領域データ913を用いて、プローブの自動設計を行なうことも可能である。その場合は、図16のデザイン画面には既に作成されているプローブが表示されることとなる。また、作業者によりプローブ位置の編集(追加・削除も含む)も可能である。
グラフ1101、1102、1103に記されているポイント1601は、図14における共通領域データ912より導かれる共通領域データ913の位置を示している。共通領域の位置を示すポイント1114に挟まれているそれぞれの領域内において、グラフ1102で山になっていてグラフ1103で谷になっている場所を自動的に選択していくことにより、プローブが自動で設定される。なお、ユーザが操作して手動でプローブを設定(部分塩基配列を指定)するマニュアルモードを設けてもよいことは明らかである。このマニュアルモードにおいては、第1実施形態(図8或いは図11)でも説明したように、グラフ1102で山になっていて、グラフ1103で谷になっている場所でプローブを設定するのがよい。なお、この場合、ポイント1601として表示されている共通領域では部分塩基配列の先頭位置を指定できないように構成してもよい。
1105は情報欄であり、現在のターゲット生物種や各種のパラメータなどを表示する。なお、本実施形態ではデフォルトの塩基長として24が設定されており、これを基準にグラフ1104の融解温度が計算されている。1106は、設計したプローブのリストで、その位置は、ライン1107(点線)で表示される。1108の実線は“カレント”位置を示し、現在注目している位置で、その位置に対応する部分塩基配列(24ベースの塩基配列)は1109に表示され、その直前の部分の塩基配列は1110、その直後の部分の塩基配列は1111に表示される。本実施形態では前後10個の塩基からなる配列が示される。
なお、上記で設計された塩基配列の相補的な配列も同様にプローブとして用いることができるので、これらを併せて表示する、或いは設計結果として提示するようにしてもよいことはいうまでもない。
サーチボタン1112が押されると、ターゲット塩基配列よりプローブに適した部分塩基配列を抽出するべく、探索を開始する。上述しているように、第2実施形態では、自己頻度情報・競合頻度情報・共通領域情報を用いて部分塩基配列を検索し、プローブの自動設計を行う。以下、本実施形態のプローブ自動設計方法について図17を用いて、さらに詳細に説明する。図17は、感染症起炎菌用のプローブを、プローブ長を24±2、融解温度を50±1度という条件で作成する例である。
ターゲット塩基配列1401上に、1402〜1406までの5箇所の共通領域があるとした場合、まず共通領域1402と1403の間の領域1407でプローブ作成を試みる。共通領域1402と1403の間の領域1407においてプローブ作成に成功しようとしまいと、次の共通領域間の領域(共通領域1403と1404の間の領域)で同様にプローブ作成を試みる。そして、その次は共通領域1404と1405の間で、さらにその次は共通領域1405と1406の間で、というように順番に全ての共通領域に挟まれている間の領域でのプローブ作成を試みる。
プローブ作成の試みの手順は次のとおりである。領域1407内で、競合頻度グラフ1408から得られる他の菌種の塩基配列に対する特異性を示す指標が高く、かつ、自己頻度グラフ1409から得られる同一の菌種の塩基配列に対する特異性を示す指標が低い位置1410を抽出する。そして、その位置1410を基準に融解温度を調べるための候補となる部分配列群1411を作成する。本実施形態では、他の菌種の塩基配列に対する特異性を示す指標が最大の位置を検出し、この位置において同一の菌種の塩基配列に対する特異性を示す指標が所定値よりも低い場合に、候補位置の抽出に成功したものとする。候補位置の抽出に失敗した場合は、次の領域へ処理を移す。そして、ターゲット塩基配列1401より、候補位置1410を先頭に24塩基長の部分配列を取り出す。
次に、候補配列作成1411において、候補位置1410を先頭に取り出した24塩基長の部分配列に対して、先頭或いは末尾或いは両方に1〜2塩基を追加したり、削除したりすることにより、開始位置、終了位置、塩基長にバリエーションを持つ複数の候補部分塩基配列を作成する。そして、1412において、1411で得られた複数の候補配列のそれぞれについて融解温度を計算する。そして、1413において、想定している温度条件(本例では50±1度)の範囲内にあり、かつ、想定している温度(本例では50度)に最も近い融解温度を持つ配列を抽出する。このようにして、共通領域1402と共通領域1403の間の領域1407において、プローブ1414を求めることができる。なお、融解温度を計算した結果、1411で得られた複数の部分配列の全てについて、設定された条件に合う融解温度とならないことが判明した場合は、共通領域1402と共通領域1403の間でプローブを作成することをあきらめ、次の共通領域1403と共通領域1404に挟まれた領域におけるプローブ作成を試みる。
以上、図17にて説明したプローブの自動設計処理について、図18のフローチャートを参照してさらに説明する。
図18は、ターゲット遺伝子の核酸配列を選択後に、その核酸配列からプローブを自動的に選択する手順を示すフローチャートである。図15に示したフローチャートを、感染症の原因菌の16S rRNAを対象に、24塩基±2塩基の長さで、融解温度を50度±1度と設定する例により、以下、説明する。
まず、ターゲット遺伝子の核酸配列の5’側末端から3’側末端に向けて共通領域を探す(ステップS1501)。共通領域が存在すれば(ステップS1502)、ターゲット遺伝子の5’側末端から共通領域までの間を、1塩基ずつずらしながら競合頻度テーブルを参照し、競合朱に対して最も特異性の高くなる部分配列の位置を見つけだす(ステップS1503)。次に、この位置について自己頻度テーブルを参照し同種の塩基配列に対する特異性を調べ(ステップS1504)、同種の塩基配列に対する特異性が十分に低いと判断される値であるかどうかを判断する(ステップS1505)。十分に低いと判断する基準は、例えば自己頻度テーブルの各値の平均値より低いかどうか、あるいは、あらかじめ規定する任意の閾値より低いかどうか、等、状況に応じて決めておく。
同一種に対しても特異性の高い部分であると判断される場合は、ステップS1501に戻り、現在の位置の次にある共通領域より3’側に共通領域があるかどうかを確認する。ステップS1505にて、自己頻度テーブルから得られる特異性の値が十分に低いと判断された場合は、現在位置を基準に前後に塩基を追加或いは削除して22〜26塩基長となる部分配列を作成し(図17の1411)、作成されたそれぞれの部分配列について融解温度を計算する(ステップS1506)。そして、融解温度が50度に最も近くなる塩基配列を選び、その融解温度が49度から51度の間であればその塩基配列をプローブとする(ステップS1507〜S1509)。一方、選択した塩基配列の融解温度が49度〜51度の範囲に無い場合は、ステップS1501に戻り、現在の位置の次にある共通領域の、より3’側に共通領域があるかどうかを確認する。
このように、ターゲット塩基配列全体に対して、共通領域で区切った部分ごとに、その中での特異性を計算し、融解温度を計算することで、ターゲット塩基配列全体に分布するプローブセットを作成することができる。
[プローブセットの設計例及び実験例]
次に図19を用いて、上記実施形態のプローブ設計方法を用いて設計されたプローブを用いたDNAマイクロアレイの実験手順について説明する。
1201の“サンプル”とは対象としている核酸が含まれているはずの液体や個体である。例えば感染症の原因菌の特定をする場合、ヒト、家畜等の動物由来の血液、喀痰、胃液、膣分泌物、口腔内粘液等の体液、尿及び糞便のような排出物等細菌が存在すると思われるあらゆる物がサンプルとなる。また、食中毒、汚染の対象となる食品、飲料水及び温泉水のような環境中の水、空気清浄機や浄水器等のフィルタ等、細菌による汚染が引き起こされる可能性のある媒体がサンプルとして用いられることもある。さらに、輸出入時における検疫等の動植物も検体としてその対象となる。
次に、“生化学的増幅”方法を用いてサンプル1201を増幅する(1202)。例えば感染症の原因菌の特定をする場合、16s rRNA検出用に設計されたPCR反応用プライマーを用いてPCR法によって対象核酸を増幅したり、或いはPCR増幅物を元にさらにPCR反応等を行なって調製したりする。また、PCR以外のLAMP法などの増幅方法により調製してもよい。
その後で、生化学的増幅1202により増幅されたサンプル、またはサンプル1201そのものに、可視化のために各種標識法により標識する(ラベル混入1203)。この標識物質としては、通常Cy3, Cy5, Rodaminなどの蛍光物質が用いられる。また、生化学的増幅1202において標識分子を混入することもある。
こうして標識分子が付加された核酸は、DNAマイクロアレイ1204とハイブリダイゼーション反応(1205)を行う。この様子は、図3に示した通りである。例えば感染症の原因菌の特定をする場合、DNAマイクロアレイ1204は菌に特異的なプローブを基板に固定したものとなる。ここで、各菌に対応したプローブの設計は、例えば16s rRNAをコーディングしているゲノム部分より、上記で説明した方法で行う。なお、DNAマイクロアレイ1204のプローブを固定する担体(基板)は、ガラス基板、プラスチック基板、シリコンウェハー等の平面基板が考えられる。また、凹凸のある三次元構造体、ビーズのような球状のもの、棒状、紐状、糸状のもの等を用いても、本発明の実現形態、効果には影響ない。
通常、基板の表面はプローブDNAの固定化が可能なように処理したものが使用される。特に、表面に化学反応が可能となるように官能基を導入した物は、ハイブリダイゼーション反応の過程でプローブが安定に結合している為に、再現性の点で好ましい形態である。本実施形態で用いられる固定化方法は、例えば、マレイミド基とチオール(−SH)基との組合わせを用いる例が挙げられる。即ち核酸プローブの末端にチオール(−SH)基を結合させておき、固相表面がマレイミド基を有するように処理しておくことで、固相表面に供給された核酸プローブのチオール基と固相表面のマレイミド基とが反応して核酸プローブを固定化する。マレイミド基の導入方法としては、まず、ガラス基板にアミノシランカップリング剤を反応させ、次にそのアミノ基とEMCS試薬(N-(6-Maleimidocaproyloxy)succinimide :Dojin社製)との反応によりマレイミド基を導入する。DNAへのSH基の導入は、DNA自動合成機でDNAを合成する際に5'-Thiol-ModifierC6(Glen Research社製)を用いることにより行なうことができる。固定化に利用する官能基の組合わせとしては、上記したチオール基とマレイミド基の組合わせ以外にも、例えばエポキシ基(固相上)とアミノ基(核酸プローブ末端)の組合わせ等が挙げられる。また、各種シランカップリング剤による表面処理も有効であり、該シランカップリング剤により導入された官能基と反応可能な官能基を導入したオリゴヌクレオチドが用いられる。さらに、官能基を有する樹脂をコーティングする方法も利用可能である。
ハイブリダイゼーション反応1205を行った後、DNAマイクロアレイ1204の表面を洗浄し、プローブと結合していない核酸を剥がした後で、(通常は)乾燥し、1205の蛍光量を測定する。ここでは、DNAマイクロアレイ1204の基板に励起光を照射し、蛍光強度を測定した画像を得る(1206、1207)。
以下、図19を用いて説明した実験の流れを感染症の原因菌特定の目的を想定した具体的実験操作として説明する。なお、本発明にかかわる生物種類判定方法は、以下に述べる感染症の原因菌特定に限ったものではなく、MHCなどの人間の体質判定や、癌などの疾病に関わるDNA、RNAの解析に用いてもよい。
<1.プローブDNAの準備>
Enterobacter cloacae株検出用Probeとして配列番号59〜65に示す核酸配列(I−n)(nは数字)を設計した。具体的には、16s rRNAをコーディングしているゲノム部分より、上記第1実施形態或いは第2実施形態で説明したい方法を用いて設計した。なお、データベースは、NCBIデータベースを利用した。
配列番号59〜65(相補鎖配列は配列番号137〜143)に示したプローブは、DNAマイクロアレイに固定するための官能基として、合成後、定法に従って核酸の5'末端にチオール基を導入した。官能基の導入後、精製し、凍結乾燥した。凍結乾燥したプローブは、-30℃の冷凍庫に保存した。
黄色ブドウ球菌、表皮ブドウ球菌、大腸菌、肺炎桿菌、緑膿菌、セラチア菌、肺炎連鎖球菌、インフルエンザ菌、及びエンテロコッカス・フェカリス菌についても同様な手法により以下に示すプローブセットを設計した。
黄色ブドウ球菌:配列番号1〜9(相補鎖配列は配列番号79〜87)、
表皮ブドウ球菌:配列番号10〜16(相補鎖配列は配列番号88〜94)、
大腸菌:配列番号17〜23(相補鎖配列は配列番号95〜101)、
肺炎桿菌:配列番号24〜29(相補鎖配列は配列番号102〜107)、
緑膿菌:配列番号30〜37(相補鎖配列は配列番号108〜115)、
セラチア菌:配列番号38〜43(相補鎖配列は配列番号116〜121)、
肺炎連鎖球菌:配列番号44〜50(相補鎖配列は配列番号122〜128)、
インフルエンザ菌:配列番号51〜58(相補鎖配列は配列番号129〜136)、
エンテロコッカス・フェカリス菌:配列番号66〜72(相補鎖配列は配列番号144〜150)。
<2.検体増幅用PCR Primer の準備>
起炎菌検出用の為の16s rRNA核酸(標的核酸)増幅用PCR Primerとして表2に示す核酸配列を設計した。
具体的には、16s rRNAをコーディングしているゲノム部分を特異的に増幅するプローブセット、つまり約1500塩基長の16s rRNAコーディング領域の両端部分で、特異的な融解温度をできるだけ揃えたプライマーを設計した。なお、変異株や、ゲノム上に複数存在する16s rRNAコーディング領域も同時に増幅できるように複数種類のプライマーを設計した。
Figure 0004250554
表中に示したPrimerは、合成後、高速液体クロマトグラフィー(HPLC)により精製し、Forward Primerを3種、Reverse Primerを3種混合し、それぞれのPrimer濃度が、最終濃度10 pmol/μl となるようにTE緩衝液に溶解した。
<3.Enterobacter_cloacae Genome DNA(モデル検体)の抽出>
〈3−1.微生物の培養 & Genome DNA 抽出の前処理〉
まず、Enterobacter cloacae 標準株を、定法に従って培養した。この微生物培養液を1.5ml容量のマイクロチューブに1.0ml(OD600=0.7)採取し、遠心分離で菌体を回収した(8500rpm、5min、4℃)。上精を捨てた後、Enzyme Buffer(50mM Tris-HCl:p.H. 8.0、25mM EDTA)300μlを加え、ミキサーを用いて再縣濁した。再縣濁した菌液は、再度、遠心分離で菌体を回収した(8500rpm、5min、4℃)。上精を捨てた後、回収された菌体に、以下の酵素溶液を加え、ミキサーを用いて再縣濁した。
Lysozyme 50μl (20 mg/ml in Enzyme Buffer)
N-Acetylmuramidase SG 50μl (0.2 mg/ml in Enzyme Buffer)。
次に、酵素溶液を加え再縣濁した菌液を、37℃のインキュベーター内で30分間静置し、細胞壁の溶解処理を行った。
〈3−2.Genome抽出〉
以下に示す微生物のGenome DNA抽出は、核酸精製キット(MagExtractor -Genome-:TOYOBO社製)を用いて行った。
具体的には、まず、前処理した微生物縣濁液に溶解・吸着液750μlと磁性ビーズ40μlを加え、チューブミキサーを用いて、10分間激しく攪拌した(ステップ1)。
次に、分離用スタンド(Magical Trapper)にマイクロチューブをセットし、30秒間静置して磁性粒子をチューブの壁面に集め、スタンドにセットした状態のまま、上精を捨てた(ステップ2)。
次に、洗浄液 900 μl を加え、ミキサーで5sec程度攪拌して再縣濁を行った(ステップ3)。
次に、分離用スタンド(Magical Trapper)にマイクロチューブをセットし、30秒間静置して磁性粒子をチューブの壁面に集め、スタンドにセットした状態のまま、上精を捨てた(ステップ4)。
ステップ3、4を繰り返して2度目の洗浄(ステップ5)を行った後、70%エタノール 900 μl を加え、ミキサーで5sec程度攪拌して再縣濁した(ステップ6)。
次に、分離用スタンド(Magical Trapper)にマイクロチューブをセットし、30秒間静置して磁性粒子をチューブの壁面に集め、スタンドにセットした状態のまま、上精を捨てた(ステップ7)。
ステップ6、7を繰り返して70%エタノールによる2度目の洗浄(ステップ8)を行った後、回収された磁性粒子に純水 100 μl を加え、チューブミキサーで10分間攪拌を行った。
次に分離用スタンド(Magical Trapper)にマイクロチューブをセットし、30秒間静置して磁性粒子をチューブ壁面に集め、スタンドにセットした状態のまま、上精を新しいチューブに回収した。
〈3−3.回収したGenome DNAの検査〉
回収された微生物(Enterobacter cloacae 株)のGenome DNAは、定法に従って、アガロース電気泳動と260/280nmの吸光度測定を行い、その品質(低分子核酸の混入量、分解の程度)と回収量を検定した。
本実験操作では、約10μgのGenome DNA が回収され、Genome DNAのデグラデーションやrRNAの混入は認められなかった。回収したGenome DNAは、最終濃度50ng/μlとなるようにTE緩衝液に溶解し、以下の実験操作に使用した。
<4.DNAマイクロアレイの作製>
〈4−1.ガラス基板の洗浄〉
合成石英のガラス基板(サイズ:25mmx75mmx1mm、飯山特殊ガラス社製)を耐熱、耐アルカリ のラックに入れ、所定の濃度に調製した超音波洗浄用の洗浄液に浸した。一晩洗浄液中で浸した後、20分間超音波洗浄を行った。続いて基板を取り出し、軽く純水ですすいだ後、超純水中で20分超音波洗浄をおこなった。次に80℃に加熱した1N水酸化ナトリウム水溶液中に10分間基板を浸した。再び純水洗浄と超純水洗浄を行い、DNAチップ用の石英ガラス基板を用意した。
〈4−2.表面処理〉
シランカップリング剤KBM-603(信越シリコーン社製)を、1%の濃度となるように純水中に溶解させ、2時間室温で攪拌した。続いて、先に洗浄したガラス基板をシランカップリング剤水溶液に浸し、20分間室温で放置した。ガラス基板を引き上げ、軽く純水で表面を洗浄した後、窒素ガスを基板の両面に吹き付けて乾燥させた。次に乾燥した基板を120℃に加熱したオーブン中で1時間ベークし、カップリング剤処理を完結させ、基板表面にアミノ基を導入した。次いで同仁化学研究所社製のN-マレイミドカプロイロキシスクシイミド(N-(6-Maleimidocaproyloxy)succinimido)(以下EMCSと略す)を、ジメチルスルホキシドとエタノールの1:1混合溶媒中に最終濃度が0.3mg/mlとなるように溶解したEMCS溶液を用意した。ベークの終了したガラス基板を放冷し、調製したEMCS溶液中に室温で2時間浸した。この処理により、シランカップリング剤によって表面に導入されたアミノ基とEMCSのスクシイミド基が反応し、ガラス基板表面にマレイミド基が導入された。EMCS溶液から引き上げたガラス基板を、先述のMCSを溶解した混合溶媒を用いて洗浄し、さらにエタノールにより洗浄した後、窒素ガス雰囲気下で乾燥させた。
〈4−3.プローブDNA〉
実験操作1で作製した微生物検出用プローブを純水に溶解し、それぞれ、最終濃度(インク溶解時)10μMとなるように分注した後、凍結乾燥を行い、水分を除いた。
〈4−4.BJプリンターによるDNA吐出、および基板への結合〉
グリセリン7.5wt%、チオジグリコール7.5wt%、尿素7.5wt%、アセチレノールEH(川研ファインケミカル社製)1.0wt%を含む水溶液を用意した。続いて、先に用意した7種類のプローブ(表1)を上記の混合溶媒に規定濃度なるように溶解した。得られたDNA溶液をバブルジェット(登録商標)プリンター(商品名:BJF-850 キヤノン社製)用インクタンクに充填し、印字ヘッドに装着した。
なおここで用いたバブルジェット(登録商標)プリンターは平板への印刷が可能なように改造を施したものである。またこのバブルジェット(登録商標)プリンターは、所定のファイル作成方法に従って印字パターンを入力することにより、約5ピコリットルのDNA溶液を約120マイクロメートルピッチでスポッティングすることが可能となっている。
続いて、この改造バブルジェット(登録商標)プリンターを用いて、1枚のガラス基板に対して、印字操作を行い、アレイを作製した。印字が確実に行われていることを確認した後、30分間加湿チャンバー内に静置し、ガラス基板表面のマレイミド基と核酸プローブ末端のチオール基とを反応させた。
〈4−5.洗浄〉
30分間の反応後、100mMのNaClを含む10mMのリン酸緩衝液(pH7.0)により表面に残ったDNA溶液を洗い流し、ガラス基板表面に一本鎖DNAが固定したDNAマイクロアレイを得た。
<5.検体の増幅と標識化(PCR増幅&蛍光標識の取り込み)>
検体となる微生物DNAの増幅、および、標識化反応を以下に示す。
Figure 0004250554
上記組成の反応液を以下のプロトコールに従って、市販のサーマルサイクラーで増幅反応を行った。
Figure 0004250554
反応終了後、精製用カラム(QIAGEN QIAquick PCR Purification Kit)を用いてPrimerを除去した後、増幅産物の定量を行い、標識化検体とした。
<6.ハイブリダイゼーション>
<4.DNAマイクロアレイの作製>で作製したDNAマイクロアレイと<5.検体の増幅と標識化(PCR増幅&蛍光標識の取り込み)>で作製した標識化検体を用いて検出反応を行った。
〈6−1.DNAマイクロアレイのブロッキング〉
BSA(牛血清アルブミンFraction V:Sigma社製)を1wt%となるように100mM NaCl / 10mM Phosphate Bufferに溶解し、この溶液に<DNAマイクロアレイの作製>で作製したDNAマイクロアレイを室温で2時間浸し、ブロッキングを行った。ブロッキング終了後、0.1wt%SDS(ドデシル硫酸ナトリウム)を含む2xSSC溶液(NaCl 300mM 、Sodium Citrate (trisodium citrate dihydrate, C6H5Na3・2H2O) 30mM、p.H. 7.0)で洗浄を行った後、純水でリンスしてからスピンドライ装置で水切りを行った。
〈6−2.ハイブリダイゼーション〉
水切りしたDNAマイクロアレイをハイブリダイゼーション装置(Genomic Solutions Inc. Hybridization Station)にセットし、以下に示すハイブリダイゼーション溶液、条件でハイブリダイゼーション反応を行った。
・ハイブリダイゼーション溶液
6 x SSPE / 10% Form amide / Target (2nd PCR Products 全量)
(6xSSPE: NaCl 900mM、NaH2PO4・H2O 60mM、EDTA 6mM、p.H. 7.4)
・ハイブリダイゼーション条件
65 ℃ 3min → 92℃ 2min → 45℃ 3hr → Wash 2xSSC / 0.1% SDS at 25℃ → Wash 2 x SSC at 20℃ → (Rinse with H2O : Manual) → Spin dry(65℃で3分、92度で2分、45℃で3時間ハイブリダイゼーション反応させた後、2xSSC / 0.1% SDS、25℃で洗浄、2xSSC、20℃で洗浄後、純水でリンスしスピンドライした)。
<7.微生物の検出(蛍光測定)>
ハイブリダイゼーション反応終了後のDNAマイクロアレイをDNAマイクロアレイ用蛍光検出装置(Axon社製、GenePix 4000B)を用いで蛍光測定を行った。夫々のプローブで良好な判別結果が得られた。
以上説明したように、本実施形態によれば、DNAマイクロアレイシステムに最適なオリゴヌクレオチドプローブの設計が実現できる。このことにより、より確かな生物種、個体識別情報が得られるという効果がある。
<他の実施形態>
なお、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
プログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク,ハードディスク,光ディスク,光磁気ディスク,CD−ROM,CD−R,磁気テープ,不揮発性のメモリカード,ROMなどを用いることができる。
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
さらに、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
第1実施形態によるプローブ設計方法の概要を説明する図である。 第1実施形態によるプローブ設計方法が適用可能な情報処理装置の構成を示すブロック図である。 ハイブリダイゼーション反応を説明する図である。 感染症の判定用DNAマイクロアレイの実験手順を説明する図である。 黄色ブドウ球菌の異なる株のゲノム構造を説明する図である。 実施形態による頻度テーブルの例を示す図である。 ターゲット塩基配列の特異性をスキャンした例を示す図である。 競合頻度テーブルと自己頻度テーブルの値をグラフ化した図である。 第1実施形態によるプローブ設計方法を説明するフローチャートである。 第1実施形態によるプローブ設計方法におけるユーザインターフェースを示す図である。 第1実施形態によるプローブ設計方法におけるユーザインターフェースを示す図である。 第2実施形態によるプローブ設計方法の概要を説明する図である。 ターゲット塩基配列に存在する共通領域と、その共通領域に挟まれた部分を表す図である。 第2実施形態によるプローブ設計方法を説明するフローチャートである。 第2実施形態によるプローブ設計方法におけるユーザインターフェースを示す図である。 第2実施形態によるプローブ設計方法におけるユーザインターフェースを示す図である。 第2実施形態によるプローブの自動設計方法を説明する図である。 第2実施形態によるプローブの自動設計方法を説明するフローチャートである。 実施形態のプローブ設計方法で設計したプローブを用いて核酸解析を行う手順を説明する図である。

Claims (22)

  1. 情報処理装置によるDNAプローブ設計のための情報処理方法であって、
    第1カウント手段が、ターゲットの塩基配列データを含む第1の塩基配列データ群について、設定された塩基数の部分塩基配列を前記ターゲットの塩基配列データの一端から他端まで順次に取り出すことにより前記第1の塩基配列データ群における複数の部分塩基配列を取得し、前記複数の部分塩基配列の各々の出現数をカウントすることにより得られた第1の頻度情報をメモリに記憶する第1カウント工程と、
    第2カウント手段が、前記第1の塩基配列データ群とは区別されるべき第2の塩基配列データ群について、前記複数の部分塩基配列の各々の出現数をカウントすることにより得られた第2の頻度情報をメモリに記憶する第2カウント工程と、
    表示手段が、前記第1及び第2カウント工程によってメモリに記憶された前記第1及び第2の頻度情報に基づいて各部分塩基配列の頻度を前記ターゲットの塩基配列の順に並べてそれぞれをグラフ表示する表示工程と、
    出力手段が、前記複数の部分塩基配列の少なくとも一つを指示するユーザの指示操作に応じて指示された部分塩基配列の情報を出力する出力工程とを備えることを特徴とするDNAプローブ設計のための情報処理方法。
  2. 前記表示工程前記第1及び第2カウント工程によってメモリに保持された前記第1及び第2の頻度情報を、前記ターゲットの塩基配列を1つの軸とするグラフで表示し、
    前記指示操作は、前記グラフ上の所望の位置を指示することによりなされることを特徴とする請求項1に記載のDNAプローブ設計のための情報処理方法。
  3. 前記第1の塩基配列データ群と前記第2の塩基配列データ群に含まれる全ての塩基配列データに共通して存在する共通配列を抽出する抽出工程をさらに備え、
    前記表示工程は、前記グラフ上に、前記抽出工程で抽出された共通配列領域を示すことを特徴とする請求項2に記載のDNAプローブ設計のための情報処理方法。
  4. 前記出力工程において、前記共通配列領域ではユーザによる部分塩基配列の指示を受け付けないようにすることを特徴とする請求項3に記載のDNAプローブ設計のための情報処理方法。
  5. 情報処理装置によるDNAプローブ設計のための情報処理方法であって、
    第1カウント手段が、ターゲットの塩基配列データを含む第1の塩基配列データ群について、設定された塩基数の部分塩基配列を前記ターゲットの塩基配列データの一端から他端まで順次に取り出すことにより前記第1の塩基配列データ群における複数の部分塩基配列を取得し、前記複数の部分塩基配列の各々の出現数をカウントすることにより得られた第1の頻度情報をメモリに記憶する第1カウント工程と、
    第2カウント手段が、前記第1の塩基配列群とは区別されるべき第2の塩基配列データ群について、前記複数の部分塩基配列の各々の出現数をカウントすることにより得られた第2の頻度情報をメモリに記憶する第2カウント工程と、
    出力手段が、前記第1カウント工程で得られた前記第1の頻度情報と前記第2カウント工程で得られた前記第2の頻度情報とに基づいて部分塩基配列を抽出し抽出された部分塩基配列に基づいてプローブ候補の塩基配列を決定し、前記第1および第2の頻度情報とともに、各部分塩基配列の頻度を前記ターゲットの塩基配列の順に並べた時の該プローブ候補に対応する部分塩基配列に隣接する部分塩基配列の第1及び第2の頻度情報を出力し、更に該プローブ候補に対応する部分塩基配列の前記ターゲット塩基配列上の位置情報及び配列情報を出力する、出力工程とを備えることを特徴とするDNAプローブ設計のための情報処理方法。
  6. 前記出力工程は、前記第1カウント工程による頻度が第1所定値を超え、前記第2カウント工程による頻度が第2所定値を下まわる部分塩基配列を前記ターゲットの塩基配列より抽出することを特徴とする請求項5に記載のDNAプローブ設計のための情報処理方法。
  7. 前記第1の塩基配列データ群と前記第2の塩基配列データ群に含まれる全ての塩基配列データに共通して存在する共通配列を抽出する抽出工程をさらに備え、
    前記出力工程は、前記ターゲットの塩基配列の、前記抽出工程で抽出された共通配列からなる領域を除く領域より部分塩基配列を抽出することを特徴とする請求項5に記載のDNAプローブ設計のための情報処理方法。
  8. 前記出力工程は、前記抽出された部分塩基配列について融解温度を算出し、算出された融解温度に基づいて前記プローブ候補としての部分塩基配列を決定することを特徴とする請求項乃至7のいずれか1項に記載のプローブ設計のための情報処理方法。
  9. 前記出力工程は、前記抽出された部分塩基配列について、その前後に所定数の塩基を追加、削除することにより複数の部分塩基配列を派生し、該抽出及び派生された部分塩基配列の中から前記プローブ候補としての部分塩基配列を決定することを特徴とする請求項乃至8のいずれか1項に記載のDNAプローブ設計のための情報処理方法。
  10. 前記出力工程は、前記抽出された部分塩基配列について2次構造が形成される可能性を算出し、その算出結果に基づいて前記プローブ候補としての部分塩基配列を決定することを特徴とする請求項乃至9のいずれか1項に記載のプローブ設計のための情報処理方法。
  11. 前記出力工程は、前記抽出された部分塩基配列の相互のマッチング度を計算し、類似する部分塩基配列を排除することにより前記プローブ候補としての部分塩基配列を決定することを特徴とする請求項乃至10のいずれか1項に記載のDNAプローブ設計のための情報処理方法。
  12. 前記出力工程は、前記ターゲットの塩基配列における、前記共通配列からなる領域によって区切られた部分領域を単位として、繰り返されることを特徴とする請求項7に記載のDNAプローブ設計のための情報処理方法。
  13. 前記出力工程は、前記共通配列からなる領域によって区切られた複数の部分領域の各々から1つ以下の部分塩基配列を抽出することを特徴とする請求項12に記載のDNAプローブ設計のための情報処理方法。
  14. 前記出力工程は、前記複数の部分領域の各々より、前記第1カウント工程による頻度が最大であり、かつ、前記第2カウント工程による頻度が所定値以下となっている部分塩基配列を抽出することを特徴とする請求項13に記載のDNAプローブ設計のための情報処理方法。
  15. 前記出力工程は、前記複数の部分領域の各々より、前記第1カウント工程による頻度が所定値以上であり、かつ、前記第2カウント工程による頻度が所定値以下の部分塩基配列を抽出することを特徴とする請求項12に記載のDNAプローブ設計のための情報処理方法。
  16. 前記第1グループの塩基配列データ群はターゲットとする生物種の複数の多型を含む塩基配列データであり、前記第2グループの塩基配列データは前記ターゲットとする生物種以外の生物種の複数の多型を含む塩基配列データであることを特徴とする請求項1乃至15のいずれか1項に記載のDNAプローブ設計のための情報処理方法。
  17. ターゲットの塩基配列データを含む第1の塩基配列データ群について、設定された塩基数の部分塩基配列を前記ターゲットの塩基配列データの一端から他端まで順次に取り出すことにより前記第1の塩基配列データ群における複数の部分塩基配列を取得し、前記複数の部分塩基配列の各々の出現数をカウントして得られる第1の頻度情報をメモリに記憶する第1カウント手段と、
    前記第1の塩基配列データ群とは区別されるべき第2の塩基配列データ群について、前記複数の部分塩基配列の各々の出現数をカウントすることにより得られた第2の頻度情報をメモリに記憶する第2カウント手段と、
    前記第1及び第2カウント手段によってメモリに記憶された前記第1および第2の頻度情報に基づいて各部分塩基配列の頻度を前記ターゲットの塩基配列の順に並べてそれぞれをグラフ表示する表示手段と、
    前記複数の部分塩基配列の少なくとも一つを指示するユーザの指示操作に応じて指示された部分塩基配列の情報を出力する出力手段とを備えることを特徴とするDNAプローブ設計装置。
  18. 前記第1の塩基配列データ群と前記第2の塩基配列データ群に含まれる全ての塩基配列データに共通して存在する共通配列を抽出する抽出手段をさらに備え、
    前記表示手段は前記第1及び第2カウント手段によってメモリに保持された前記第1および第2の頻度情報を前記ターゲットの塩基配列を1つの軸とするグラフで表示するとともに、該グラフ上に前記抽出手段で抽出された共通配列の位置を示すことを特徴とする請求項17に記載のDNAプローブ設計装置。
  19. ターゲットの塩基配列データを含む第1の塩基配列データ群について、設定された塩基数の部分塩基配列を前記ターゲットの塩基配列データの一端から他端まで順次に取り出すことにより前記第1の塩基配列データ群における複数の部分塩基配列を取得し、前記複数の部分塩基配列の各々の出現数をカウントすることにより得られた第1の頻度情報をメモリに記憶する第1カウント手段と、
    前記第1の塩基配列群とは区別されるべき第2の塩基配列データ群について、前記複数の部分塩基配列の各々の出現数をカウントすることにより得られた第2の頻度情報をメモリに記憶する第2カウント手段と、
    前記第1カウント手段で得られた前記第1の頻度情報と前記第2カウント手段で得られた前記第2の頻度情報とに基づいて部分塩基配列抽出し、抽出された部分塩基配列に基づいてプローブ候補の塩基配列を決定し、前記第1および第2の頻度情報とともに、各部分塩基配列の頻度を前記ターゲットの塩基配列の順に並べた時の該プローブ候補に対応する部分塩基配列に隣接する部分塩基配列の第1及び第2の頻度情報を出力し、更に該プローブ候補に対応する部分塩基配列の前記ターゲット塩基配列上の位置情報及び配列情報を出力する、出力手段とを備えることを特徴とするDNAプローブ設計装置。
  20. 前記第1の塩基配列データ群と前記第2の塩基配列データ群に含まれる全ての塩基配列データに共通して存在する共通配列を抽出する抽出手段をさらに備え、
    前記出力手段は、前記ターゲットの塩基配列にける、前記抽出手段で抽出された共通配列からなる領域を除く領域より部分塩基配列を抽出することを特徴とする請求項19に記載のDNAプローブ設計装置。
  21. 請求項1乃至16のいずれか1項に記載のプローブ設計のための情報処理方法をコンピュータに実行させるための制御プログラム。
  22. 請求項1乃至16のいずれか1項に記載のプローブ設計のための情報処理方法をコンピュータに実行させるための制御プログラムを格納した記憶媒体。
JP2004064494A 2003-04-02 2004-03-08 Dnaプローブ設計装置及びdnaプローブ設計のための情報処理方法 Expired - Fee Related JP4250554B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004064494A JP4250554B2 (ja) 2003-04-02 2004-03-08 Dnaプローブ設計装置及びdnaプローブ設計のための情報処理方法
US10/805,292 US7283912B2 (en) 2003-04-02 2004-03-22 DNA probe design device and information processing method for DNA probe design

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003099464 2003-04-02
JP2004064494A JP4250554B2 (ja) 2003-04-02 2004-03-08 Dnaプローブ設計装置及びdnaプローブ設計のための情報処理方法

Publications (2)

Publication Number Publication Date
JP2004318840A JP2004318840A (ja) 2004-11-11
JP4250554B2 true JP4250554B2 (ja) 2009-04-08

Family

ID=33478828

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004064494A Expired - Fee Related JP4250554B2 (ja) 2003-04-02 2004-03-08 Dnaプローブ設計装置及びdnaプローブ設計のための情報処理方法

Country Status (2)

Country Link
US (1) US7283912B2 (ja)
JP (1) JP4250554B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004313181A (ja) * 2003-04-02 2004-11-11 Canon Inc 感染症起炎菌検出用プローブ及びプローブセット、ならびに担体及び遺伝子検査方法
JP5137441B2 (ja) * 2006-03-31 2013-02-06 キヤノン株式会社 プローブセット、プローブ固定担体及び検査方法
JP5137443B2 (ja) * 2006-03-31 2013-02-06 キヤノン株式会社 プローブセット、プローブ固定担体及び遺伝子検査方法
JP5137442B2 (ja) * 2006-03-31 2013-02-06 キヤノン株式会社 プローブセット、プローブ固定担体及び検査方法
JP5247009B2 (ja) * 2006-06-16 2013-07-24 独立行政法人理化学研究所 配列抽出装置、配列抽出方法、プログラムおよび記録媒体
JP5596893B2 (ja) * 2006-11-10 2014-09-24 キヤノン株式会社 プローブセット、プローブ固定担体及び遺伝子検査方法
JP2008118914A (ja) * 2006-11-10 2008-05-29 Canon Inc プローブ、プローブセット、プローブ固定担体及び遺伝子検査方法
JP5177712B2 (ja) * 2010-12-28 2013-04-10 国立医薬品食品衛生研究所長 競合的ハイブリダイゼーションにおける遺伝子データの補正方法及び補正装置
FR3029290B1 (fr) * 2014-12-01 2020-03-06 Biomerieux Procede d'estimation de l'affinite sonde-cible d'une puce a adn et procede de fabrication d'une puce a adn

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2878040A (en) 1954-11-16 1959-03-17 James C Hobbs Safe-weld pipe joint
US2820642A (en) * 1955-08-08 1958-01-21 Northrop Aircraft Inc Trailer for handling and transporting aircraft engines and other aircraft components
US6600996B2 (en) 1994-10-21 2003-07-29 Affymetrix, Inc. Computer-aided techniques for analyzing biological sequences
JP4313861B2 (ja) 1997-08-01 2009-08-12 キヤノン株式会社 プローブアレイの製造方法
JP2002286727A (ja) 2001-03-28 2002-10-03 Canon Inc プローブ担体、プローブ担体の製造方法及びそれに用いる装置

Also Published As

Publication number Publication date
JP2004318840A (ja) 2004-11-11
US20050026176A1 (en) 2005-02-03
US7283912B2 (en) 2007-10-16

Similar Documents

Publication Publication Date Title
JP5596893B2 (ja) プローブセット、プローブ固定担体及び遺伝子検査方法
JP5201818B2 (ja) プローブセット、プローブ固定担体及び遺伝子検査方法
JP5596892B2 (ja) プローブセット、プローブ固定担体及び遺伝子検査方法
JP5037905B2 (ja) プローブ、プローブセット、プローブ固定担体及び遺伝子検査方法
JP5596891B2 (ja) プローブセット、プローブ固定担体及び遺伝子検査方法
JP5596894B2 (ja) プローブセット、プローブ固定担体及び遺伝子検査方法
JP2008118904A (ja) プローブ、プローブセット、プローブ固定担体及び遺伝子検査方法
JP2004313181A (ja) 感染症起炎菌検出用プローブ及びプローブセット、ならびに担体及び遺伝子検査方法
JP2008118914A (ja) プローブ、プローブセット、プローブ固定担体及び遺伝子検査方法
WO2001071041A2 (en) Microarray-based analysis of polynucleotide sequence variations
JP2008118908A (ja) プローブ、プローブセット、プローブ固定担体及び遺伝子検査方法
JP2008118907A (ja) プローブ、プローブセット、プローブ固定担体及び遺伝子検査方法
US7923546B2 (en) Base sequence for control probe and method of designing the same
JP4250554B2 (ja) Dnaプローブ設計装置及びdnaプローブ設計のための情報処理方法
US20080254472A1 (en) Method for detecting nucleic acid in sample, method for designing probes, system for designing probes therefor
JP2006129828A (ja) 感染症起炎菌検出用プローブセット及び担体及び遺伝子検査方法
JP2004520838A (ja) 核酸分子の検出方法
JPH0690798A (ja) 黄色ブドウ球菌検出用プローブ及び検出方法
JP2007014351A (ja) 感染症検出用プローブ、遺伝子検出用のプローブ、感染症起炎菌増幅反応用プライマー、感染症起炎菌増幅反応用プライマーセット及び感染症起炎菌検出方法
JP2008118921A (ja) 生物種判定方法
JP2010029068A (ja) 内部標準dnaの製造方法
JP5137442B2 (ja) プローブセット、プローブ固定担体及び検査方法
JP5078409B2 (ja) プローブセット、プローブ固定担体及び検査方法
JP5137443B2 (ja) プローブセット、プローブ固定担体及び遺伝子検査方法
JP5121281B2 (ja) プローブセット、プローブ固定担体及び検査方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050427

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080620

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080819

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090113

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090119

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120123

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4250554

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130123

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140123

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees