JP2003330934A - 変異体配列解析装置、変異体配列解析方法、プログラム、および、記録媒体 - Google Patents

変異体配列解析装置、変異体配列解析方法、プログラム、および、記録媒体

Info

Publication number
JP2003330934A
JP2003330934A JP2002136164A JP2002136164A JP2003330934A JP 2003330934 A JP2003330934 A JP 2003330934A JP 2002136164 A JP2002136164 A JP 2002136164A JP 2002136164 A JP2002136164 A JP 2002136164A JP 2003330934 A JP2003330934 A JP 2003330934A
Authority
JP
Japan
Prior art keywords
sequence
information
region
fragment
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002136164A
Other languages
English (en)
Inventor
Kensaku Imai
建策 今井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Celestar Lexico Sciences Inc
Original Assignee
Celestar Lexico Sciences Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Celestar Lexico Sciences Inc filed Critical Celestar Lexico Sciences Inc
Priority to JP2002136164A priority Critical patent/JP2003330934A/ja
Priority to EP03723335A priority patent/EP1505517A4/en
Priority to PCT/JP2003/005893 priority patent/WO2003096223A1/ja
Priority to US10/513,928 priority patent/US20050164198A1/en
Publication of JP2003330934A publication Critical patent/JP2003330934A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R23/00Transducers other than those covered by groups H04R9/00 - H04R21/00
    • H04R23/008Transducers other than those covered by groups H04R9/00 - H04R21/00 using optical signals for detecting or generating sound
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/20Sequence assembly

Abstract

(57)【要約】 【課題】 シーケンシング実験から得られたシーケンシ
ングデータを活用してリアルタイムに変異体のDNA配
列等の変異状況等の確認を効率的に行うことのできる、
装置等を提供することを課題とする。 【解決手段】 配列決定の対象となる生物種(例えば、
耐性菌、腫瘍細胞、ウィルスなど)の変異体の全DNA
が取り出され、それらのショットガンライブラリーの作
成が行なわれる。これらのライブラリーの中からDNA
断片(フラグメント)を次々に取り出し、1フラグメン
トずつ自動DNAシーケンサー装置によるシーケンシン
グを行う。そして、シーケンサー装置から出力された変
異体の各DNA断片(フラグメント)の塩基配列などの
フラグメント配列情報をフラグメント配列データベース
に格納する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、変異体配列解析装
置、変異体配列解析方法、プログラム、および、記録媒
体に関し、特に、変異体のDNA配列についてアセンブ
ルと変異箇所の同定を効率的に実行することができる変
異体配列解析装置、変異体配列解析方法、プログラム、
および、記録媒体に関する。
【0002】
【従来の技術】現在、ペニシリン耐性肺炎球菌(PRS
P)、セファマイシン耐性肺炎球菌、メシチリン耐性黄
色ブドウ球菌(MRSA)などの多種の細菌に薬剤耐性
菌が出現しており、臨床現場で大きな問題となってい
る。さらに、何種類かの抗生物質に耐性を獲得した多剤
耐性サルモネラ菌、バンコマイシン耐性腸球菌(VR
E)、多剤耐性結核菌等の出現は深刻な問題をひきおこ
し、耐性菌治療の抜本的な対策が求められている。この
ような状況下において、耐性獲得機構の解明、耐性菌の
特徴確認、耐性菌治療の開発などに用いる重要な情報を
得るため、耐性菌の遺伝子解析が行われている。
【0003】また、このような耐性菌のみならず、エイ
ズウィルスや癌細胞などの塩基配列の変異による薬剤耐
性の獲得においては、多剤耐性遺伝子(MDRI)など
の関与が解明されており、これらの遺伝子変異の解析も
行われている。
【0004】ここで、従来技術による遺伝子解析におい
ては、最初に耐性菌などのDNAの塩基配列情報を解読
することが必要となるが、配列決定手法はランダム・シ
ョットガンシーケンシングが広く採用されている。この
手法によるゲノムの塩基配列決定からアノテーションの
付加までの手順を以下に示す(高木利久ら編集「ゲノム
情報生物学」(2000年)中山書店 第2頁から第1
8頁参照)。
【0005】[1.シーケンシングフラグメントの作
成]最初に、配列決定の対象となる生物種の全DNAが
取り出され、それらのショットガンライブラリーの作成
が行なわれる。これらのライブラリーの中からフラグメ
ントを次々に取り出し、1フラグメントずつ自動DNA
シーケンサー装置によるシーケンシングを行う。この
際、各フラグメントの両端から配列決定する場合と、一
方の端からの配列決定のみを行う方法とがある。
【0006】[2.ベースコールと配列品質の管理]シ
ーケンサー装置によってフラグメントの塩基配列が出力
されるが、最初にベースコールと配列品質の決定がなさ
れる。シーケンサー装置にはこれらの機能をもつソフト
ウェアが付属している場合が多い。また、波形データか
らベースコーリング、および、ベースコール配列の評価
を行うための単体のソフトウエア製品等も存在する。
【0007】[3.異種DNAや使用ベクターDNAな
どのコンタミネーションの除去]次に相同性解析を利用
して、クローニングベクターやシーケンスベクターなど
のコンタミネーション(汚染)の除去が行われる。
【0008】[4.フラグメント同士のオーバーラップ
の検出]アセンブル段階となると、全ライブラリーにわ
たってフラグメント同士のオーバーラップの検出が行わ
れ、アセンブル結果はそれぞれ保存される。
【0009】[5.クラスタリングとコンティグの形
成]その後、結果をまとめてクラスタリングとコンティ
グの形成が実行される。アセンブルの最初の段階では、
フラグメントの増加につれてコンテティグの数も増え、
個々のコンティグの大きさも増加していく。しかし、冗
長度(redundancy:フラグメント同士の重な
り程度)が1.0を超えるあたりから、コンティグ長の
合計の増加は鈍くなり、冗長度が5.0を超えるあたり
からはほとんど増加しなくなる。この段階からは、ライ
ブラリーから新たなフラグメントを投入してもコンティ
グ間のギャップはあまり埋まらなくなる。一方、比較的
長いコンティグの大部分の領域は平均冗長度程度を示す
フラグメント数でカバーされ、コンセンサス配列も安定
してくるため、コンティグ同士の比較解析やコンティグ
内のORF(open reading frame)
同定、転写単位同定などがこの段階から実行可能とな
る。これらのコンティグは、その両端や一部の重なりの
薄い領域を除いて、ほぼ正しいコンセンサス配列が決定
できている。
【0010】[6.コンティグ両端領域におけるプライ
マー設計とプライマーウォーキング]フラグメント数を
増やしてもギャップの数があまり減少しなくなる段階か
ら、ギャップフィリング段階に入る。ギャップを閉じる
方法としては、すべてコンティグ両端領域からその外側
へ向けたプライマーを設計、得られたプライマーを混合
し、PCR(polymerase chain re
action)によって全DNAからコンティグ間の橋
渡しをする(ブリッジ)クローンを得る。そして、その
クローンの両端をシーケンシングしてギャップを埋めて
いくというプライマーウォーキングが行われる。この方
法により、1回に1フラグメント分ずつコンティグを拡
大することが可能となる。得られた塩基配列を再度アセ
ンブルすることによりギャップを閉じていく。ギャップ
の長さが短い場合は1度のウォーキングでギャップが閉
じる場合もあるが、閉じないギャップはさらにこの操作
を行い、すべてのギャップが埋まるまで繰り返す。しか
し、複数の染色体に別れて存在するDNAでは、最後ま
で閉じないギャップも存在する。そのために、環状化の
ための処理が必要となる。
【0011】[7.アノテーション]まず、コーディン
グ領域予測プログラムなどを併用して、ORF領域が同
定される。それぞれのコーディング領域はアミノ酸に翻
訳され、アミノ酸配列からの機能同定も行われる。ま
た、他生物種ゲノムとの比較によるアノテーションを実
行し、いわゆるオーソログ(orthologue)関
係が同定される。並行して全ゲノムORFマップの作成
が行われ、それまでに遺伝子の機能が判明したものにつ
いては、それぞれ構造・機能別に区分されたマップが作
成される。
【0012】
【発明が解決しようとする課題】しかしながら、上述の
方法によりアセンブル処理を行うためには、多くの時間
や手間等を要するために、膨大かつ多種に渡る耐性菌な
どの変異後のDNAの塩基配列情報について迅速に解析
を行うことができないというシステム構造上の基本的問
題点を有していた。以下、この問題点の内容について、
一層具体的に説明する。
【0013】従来は変異体の全ゲノム配列を決定した
後、変異前の元の野生株などのDNA配列と比較して変
異部位を抽出していた。そのため、全ゲノムについてラ
イブラリーの調整やフラグメントの作成などを行う必要
がありウェット実験の負担が大きいという問題点を有し
ていた。また多量のフラグメント配列のアラインメント
を計算機上で実行してアセンブルした後、塩基配列の編
集(エディット)および確認する必要があり計算機側の
作業の負荷も大きいという問題点を有していた。
【0014】また、アセンブルを行う際にはフラグメン
ト配列の重複(冗長度)を必要とするため、重複の薄い
部分、すなわち冗長度の少ない部分やフラグメントの配
列品質の低い部分については、正確なアセンブルを行う
ことができないという問題点を有していた。
【0015】また、フラグメント配列の冗長度が薄い部
分やコンティグ同士を結合する際には、例えば、プライ
マーウォーキング法を採用した場合、コンティグの両端
に近い領域で配列にできるだけ特異性のある領域を利用
し、コンティグの両外側に向かうPCRプライマーを設
計する必要があるが、その都度、専用ソフトウェアなど
により人手を介して設計しなければならず、作業の自動
化や効率化を図ることができないという問題点を有して
いた。
【0016】また、従来のアセンブル結果を表示するゲ
ノムビューアなどのソフトウェアなどは、一画面上で表
示できない部分についてはスクロール表示するか、もし
くは、縦方向に画面分割を行うことにより情報を表示し
ていたが、長い塩基配列については、その冗長度や変異
部分について直感的に把握することが困難であった。
【0017】このように、従来のシステム等は数々の問
題点を有しており、その結果、システムの利用者および
管理者のいずれにとっても、利便性が悪く、また、利用
効率が悪いものであった。
【0018】すなわち、従来はあらゆる種についてゲノ
ムのシーケンシングが行われてきているが、これまでの
解析技術は主に新規(まったく未知)のゲノムシーケン
シングのための一般的な技術であって、不完全なマップ
をベースにしてアセンブリと照らしあいながら矛盾を解
消しながらコンティグを作成していくと言うものであ
る。それに対し、今後行われていく多くのゲノムシーケ
ンシングは、既知の高い相同性のあるゲノム配列が比較
対象としてあるという前提の元に、ゲノムのシーケンシ
ングを行うことが多くなるとともに、それを繰り返し大
量に解析していくことになる。また必ずしもゲノム全体
を決定できかつゲノム全体を網羅するほどのシーケンシ
ングは行わなくなる。本発明はそのような状況における
現実的な解析方法の一つである。
【0019】本発明は上記問題点に鑑みてなされたもの
で、シーケンシング実験から得られたシーケンシングデ
ータを活用してリアルタイムに変異体のDNA配列等の
変異状況等の確認を効率的に行うことのできる、変異体
配列解析装置、変異体配列解析方法、プログラム、およ
び、記録媒体を提供することを目的としている。
【0020】
【課題を解決するための手段】本発明は、変異体ゲノム
のコンセンサス配列を効率的に求めることを目的とす
る。すなわち、本発明は、従来から用いられた手法のよ
うに変異体ゲノムの各フラグメントをアセンブルするこ
とにより変異体のゲノム配列を決定するのではなく、各
フラグメントについて標準体(例えば野生株など)の配
列上における位置をアサインメントし、局所的に重なっ
たフラグメントから局所的なコンセンサス配列を決定し
ていき、このコンセンサス配列を結合することにより変
異体ゲノム全体のゲノム配列を決定するものである。
【0021】上述したように、従来のアセンブルを用い
る方法では、完全なゲノム配列を作成するために多量の
フラグメントについてシーケンス作業を行わなくてはな
らず、また、ゲノム全体に渡って大きな冗長性のあるも
のとなってもギャップがなかなか埋まらず、さらに、コ
ンティグの順番や向きなどを決定することも困難であっ
た。
【0022】本発明は、変異体の各フラグメントについ
て標準体の配列上における位置をアサインメントし、ア
サインメントできたフラグメントに基づいて局所的なコ
ンセンサス配列を決定していき、このコンセンサス配列
を結合することにより変異体ゲノム全体のゲノム配列を
決定するため、少ないフラグメントの場合であってもコ
ンティグの作成が容易であり、ギャップの特定(前後の
コンティグの特定、コンティグの向きの特定、距離の特
定など)が容易に行えるようになる。また、本発明で
は、アセンブリ作業を必要としないためフラグメントの
シーケンス作業中の任意のタイミングでそれまで解析し
たフラグメントデータを使った変異体のゲノム配列予想
が可能になる。また、本発明では、アセンブリ作業がな
いため、全体にわたる統計情報の抽出の計算も簡単に行
うことができるようになる。
【0023】また、本発明は、標準体の配列のうち実験
者(利用者)がゲノム配列を特定したい領域(注目領
域)を特定することにより、その注目領域に特化したフ
ラグメントのシーケンス作業を行うことが可能になり、
また、注目領域のシーケンス状況をリアルタイムに確認
することが可能になる。
【0024】また、本発明では、正確なコンセンサス配
列を完成するために、シーケンスされたフラグメントの
冗長度が薄い領域などを検出する。すなわち、局所的な
変異体ゲノムのコンセンサス配列の決定ができた場所が
変異の検出などができるが、決定できない場所(例え
ば、フラグメントの冗長度が低い部分やギャップ部分)
については、追加シーケンシング対象の場所として認識
することができ、さらに、そのシーケンシングに用いる
PCRプライマー配列を決定することができる。
【0025】このような目的を達成するため、請求項1
に記載の変異体配列解析装置は、変異体のDNA断片の
塩基配列に関するフラグメント配列情報(例えば、DN
Aシーケンサー装置から出力された変異体の各フラグメ
ントのDNA塩基配列情報であり、その波形情報や、配
列品質に関する情報や、シーケンシング実験に用いたベ
クターのDNA塩基配列などを含んでもよい)を格納す
るフラグメント配列格納手段と、変異前の元のDNA塩
基配列情報(例えば、DNA塩基配列の他に、アミノ酸
配列情報、生物種に関する情報、機能に関する情報など
を含んでもよい)を格納するゲノム情報格納手段と、上
記ゲノム情報格納手段にて格納された上記元のDNA塩
基配列情報のうち少なくとも一部の配列領域からなる注
目領域を選択する注目領域選択手段と、上記注目領域選
択手段にて選択された上記注目領域と、上記フラグメン
ト配列格納手段にて格納された上記フラグメント配列情
報との間の類似度を決定するホモロジー検索手段と、上
記ホモロジー検索手段にて決定された類似度に従って変
異体の配列決定に用いる上記フラグメント配列情報とし
て採用するか否かを判定するフラグメント採用可否判定
手段と、上記フラグメント採用可否判定手段にて採用す
ると判定された上記フラグメント配列情報と上記注目領
域とのアラインメントをとるアラインメント処理手段
と、上記アラインメント処理によるアラインメント結果
に基づいて変異体のコンセンサス配列を決定するコンセ
ンサス配列決定手段とを備えたことを特徴とする。
【0026】この装置によれば、変異体のDNA断片の
塩基配列に関するフラグメント配列情報を格納し、変異
前の元のDNA塩基配列情報を格納し、格納された元の
DNA塩基配列情報のうち少なくとも一部の配列領域か
らなる注目領域を選択し、選択された注目領域と格納さ
れたフラグメント配列情報との間の類似度を決定し、決
定された類似度に従って変異体の配列決定に用いるフラ
グメント配列情報として採用するか否かを判定し、採用
すると判定されたフラグメント配列情報と注目領域との
アラインメントをとり、アラインメント結果に基づいて
変異体のコンセンサス配列を決定するので、変異が予想
される注目領域を特定して、その注目領域にアサインメ
ントされた変異体のフラグメントからコンセンサス配列
を作成することにより変異部分のDNA塩基配列を効率
的に決定することができるようになる。
【0027】すなわち、従来は変異体の全ゲノム配列を
決定する作業をする必要があったため、全ゲノムについ
てライブラリーの調整やフラグメントの作成などを行な
う必要がありウェット実験の負担が大きく、また多量の
フラグメント配列のアラインメントを計算機上で実行し
てアセンブルした後、塩基配列の編集(エディット)お
よび確認する必要があり計算機側の作業の負荷も大きか
ったが、本装置によれば全ゲノム配列を決定する必要が
なく注目領域のみの実験および計算で済むため、各種の
資源を効率的に使用し、迅速かつ正確に変異体のDNA
塩基配列を決定することができるようになる。
【0028】また、従来のアセンブリはフラグメント配
列の重複(冗長度)を必要とするため、重複の薄い部
分、すなわち冗長度の少ない部分やフラグメントの配列
品質の低い部分等については、正確なアセンブルを行う
ことができなかったが、本装置によれば、アセンブリが
困難な部分についても変異前の元のDNA塩基配列情報
にアサインメントされたフラグメントを用いてコンセン
サス配列を作成することにより、高精度に塩基配列の同
定または推定をすることができるようになる。
【0029】また、請求項2に記載の変異体配列解析装
置は、請求項1に記載の変異体配列解析装置において、
上記コンセンサス配列決定手段にて決定された上記コン
センサス配列と、上記注目領域とを比較して変異情報を
決定する変異情報決定手段をさらに備えたことを特徴と
する。
【0030】この装置によれば、決定されたコンセンサ
ス配列と、注目領域とを比較して変異情報を決定するの
で、変異体の変異部分の配列を自動的に決定することが
できるようになる。
【0031】ここで、変異情報として、例えば、変異位
置、変異塩基、変異位置の冗長度、変異位置の配列品質
(波形データからのベースコーリングの確からしさや両
鎖シーケンスされているかなど)などの情報を含んでも
よい。また、複数の変異株における共通の変異情報を決
定してもよい。また、変異の相関している複数遺伝子領
域を抽出してもよい。
【0032】また、請求項3に記載の変異体配列解析装
置は、請求項1または2に記載の変異体配列解析装置に
おいて、上記アラインメント処理手段による上記アライ
ンメント結果に基づいて、上記注目領域を構成する各塩
基に対する上記フラグメントの冗長度を決定する冗長度
決定手段をさらに備えたことを特徴とする。
【0033】この装置によれば、アラインメント結果に
基づいて、注目領域を構成する各塩基に対するフラグメ
ントの冗長度を決定するので、アセンブル精度などを予
測するために重要な情報である冗長度を自動的に決定す
ることができるようになる。
【0034】また、請求項4に記載の変異体配列解析装
置は、請求項1から3のいずれか一つに記載の変異体配
列解析装置において、上記アラインメント処理手段によ
る上記アラインメント結果に基づいて、上記注目領域に
対する上記フラグメントのギャップ部分を特定するギャ
ップ情報を決定するギャップ情報決定手段をさらに備え
たことを特徴とする。
【0035】この装置によれば、アラインメント結果に
基づいて、注目領域に対するフラグメントのギャップ部
分を特定するギャップ情報を決定するので、変異体のD
NA塩基配列についてシーケンスできなかった部分、す
なわち、変異前の元のDNA塩基配列(注目領域)には
存在するが、各フラグメント(コンセンサス配列)には
存在しない塩基配列部分であるギャップ部分を自動的に
決定することができるようになる。
【0036】また、請求項5に記載の変異体配列解析装
置は、請求項1から4のいずれか一つに記載の変異体配
列解析装置において、上記注目領域、上記注目領域に関
するアノテーション情報、上記コンセンサス配列、上記
コンセンサス配列に関するアノテーション情報、上記冗
長度、上記変異情報、上記ギャップ情報、上記アライン
メント結果のうち少なくとも一つを含む処理結果を表示
する処理結果表示手段、をさらに備えたことを特徴とす
る。
【0037】この装置によれば、注目領域、注目領域に
関するアノテーション情報、コンセンサス配列、コンセ
ンサス配列に関するアノテーション情報、冗長度、変異
情報、ギャップ情報、アラインメント結果のうち少なく
とも一つを含む処理結果を表示するので、これらの有益
な情報を確認した利用者が新たな生物学的な知見の発見
を促進することができるようになる。
【0038】また、請求項6に記載の変異体配列解析装
置は、請求項5に記載の変異体配列解析装置において、
上記コンセンサス配列に関するアノテーション情報は、
上記コンセンサス配列のORF領域、制御領域、翻訳後
のアミノ酸配列、変異前の元のアミノ酸配列、変異後の
機能、変異前の元の機能、オーソログ関係に関する情報
のうち少なくとも一つを含むことを特徴とする。
【0039】これはコンセンサス配列に関するアノテー
ション情報の一例を一層具体的に示すものである。この
装置によれば、コンセンサス配列に関するアノテーショ
ン情報は、コンセンサス配列のORF領域、制御領域、
翻訳後のアミノ酸配列(置換変異、挿入や欠失によるフ
レームシフト変異など)、変異後の機能(遺伝子領域の
変異や制御領域の変異による機能変化や、変異の相関し
ている複数遺伝子領域による機能相関解析など)、オー
ソログ関係(同一変異を保有する他種の遺伝子の解析
や、系統解析など)に関する情報のうち少なくとも一つ
を含むので、既知のcDNAなどのゲノム情報データベ
ースを検索して、同種または他種の細胞等における類似
の配列や機能を検索しこれらの情報を決定することによ
り、これらの有益な情報を確認した利用者が新たな生物
学的な知見を発見することを促進することができるよう
になる。
【0040】また、請求項7に記載の変異体配列解析装
置は、請求項5または6に記載の変異体配列解析装置に
おいて、上記処理結果表示手段は、複数の出力装置に対
して、上記処理結果を当該出力装置数に分割して表示す
ることを特徴とする。
【0041】これは処理結果表示の一例を一層具体的に
示すものである。この装置によれば、複数の出力装置に
対して、処理結果を当該出力装置数に分割して表示する
ので、大型ディスプレイへのディスプレイ表示(例え
ば、横方向に長いディスプレイ等)に表示させた場合と
同様に、複数配置に対応したディスプレイ表示(例え
ば、横方向に複数のディスプレイを並置した場合には、
仮想的に横長ディスプレイとして表示する等)ができる
ようになる。
【0042】すなわち、本発明によれば、例えば、シー
ケンシング状況(重複度、ギャップ等)の確認や、変異
の挿入状況(遺伝子等の各種座位からの相対位置・数
量)の確認や、塩基配列の変異が引き起こすアミノ酸翻
訳への影響等の確認や、複数の耐性生物間の比較ゲノム
情報の確認などにおいて、解析作業を視覚的に容易に実
施することが可能になる。
【0043】また、請求項8に記載の変異体配列解析装
置は、請求項1から7のいずれか一つに記載の変異体配
列解析装置において、上記冗長度決定手段にて決定され
た上記冗長度および/または配列品質が予め定めた値よ
り低い配列領域、および/または、上記ギャップ情報決
定手段にて決定された上記ギャップ部分の配列領域を含
む上記フラグメントを作成するために用いるPCRプラ
イマーの塩基配列の候補を決定するプライマー配列決定
手段をさらに備えたことを特徴とする。
【0044】この装置によれば、決定された冗長度およ
び/または配列品質が予め定めた値より低い配列領域、
および/または、決定されたギャップ部分の配列領域を
含むフラグメントを作成するために用いるPCRプライ
マーの塩基配列の候補を決定するので、シーケンシング
の結果、ギャップ部分やフラグメントの重複が薄い部分
をカバーするためのフラグメントを作成するのに用いる
PCRプライマーを自動的に設計することができ、作業
の自動化や効率化を図ることができるようになる。
【0045】また、これにより、冗長度の薄い場所やギ
ャップ部分の特定以外においても、例えば、変異の検出
された部位の再確認実験支援や注目領域を使用した実験
支援などのためのPCRプライマー設計を効率的に行う
ことができるようになる。
【0046】また、請求項9に記載の変異体配列解析装
置は、請求項8に記載の変異体配列解析装置において、
上記プライマー配列決定手段は、上記冗長度決定手段に
て決定された上記冗長度および/または配列品質が予め
定めた値より低い配列領域、および/または、上記ギャ
ップ情報決定手段にて決定された上記ギャップ部分の配
列領域の外側に位置し、配列内で特異性が高い部分配列
を抽出する部分配列抽出手段と、上記部分配列抽出手段
にて抽出された上記部分配列のうち、予め定めた選択条
件に従って上記PCRプライマーの塩基配列の候補を決
定するプライマー候補選択手段とをさらに備えたことを
特徴とする。
【0047】これはプライマー配列決定の一例を一層具
体的に示すものである。この装置によれば、決定された
冗長度および/または配列品質が予め定めた値より低い
配列領域、および/または、決定されたギャップ部分の
配列領域の外側に位置し、配列内で特異性が高い部分配
列を抽出するので、プライマーウォーキングにおいて使
用するPCRプライマーがアニールする部位を一つに特
定することができるようになる。また、シングルコピー
を保証するための特異性の判断基準として、一般的な
(グローバルな)意味と、注目種野生株において明らか
に一箇所にしか存在しないという(ローカルな)意味の
2つの観点での特異性基準を使うことができる。
【0048】また、抽出された部分配列のうち、予め定
めた選択条件に従ってPCRプライマーの塩基配列の候
補を決定するので、例えば、プライマー同士がアニール
してダイマーを形成してしまうものや、部分的にGCあ
るいはATに偏るものや、自己相補配列を含みプライマ
ー自身が二次構造を形成してしまうものや、二本鎖DN
Aの50%が水素結合対を形成し、残りの50%が解離
している状態の温度である融解温度TmがPCRサイク
ルでまわす温度の上限と下限の間にならないものなどを
除外してPCRプライマーの塩基配列の候補を決定する
ことができるようになる。
【0049】また、請求項10に記載の変異体配列解析
装置は、請求項9に記載の変異体配列解析装置におい
て、上記部分配列は、塩基数が15以上から30以下の
塩基配列であることを特徴とする。
【0050】これは部分配列の一例を一層具体的に示す
ものである。この装置によれば、部分配列は、塩基数が
15以上から30以下(特に、好ましくは、20から2
5塩基)の塩基配列であるので、PCRを効率的に実行
することができるようになる。すなわち、14以下の塩
基数では鋳型とうまくアニールしない可能性が高くな
り、また、31以上の塩基数ではミスアニールの確率が
高くなるため、適切な塩基数を特定することにより品質
の高いプライマー配列を決定することができるようにな
る。
【0051】また、本発明は変異体配列解析方法に関す
るものであり、請求項11に記載の変異体配列解析方法
は、変異体のDNA断片の塩基配列に関するフラグメン
ト配列情報(例えば、DNAシーケンサー方法から出力
された変異体の各フラグメントのDNA塩基配列情報で
あり、その波形情報や、配列品質に関する情報や、シー
ケンシング実験に用いたベクターのDNA塩基配列など
を含んでもよい)を格納するフラグメント配列格納ステ
ップと、変異前の元のDNA塩基配列情報(例えば、D
NA塩基配列の他に、アミノ酸配列情報、生物種に関す
る情報、機能に関する情報などを含んでもよい)を格納
するゲノム情報格納ステップと、上記ゲノム情報格納ス
テップにて格納された上記元のDNA塩基配列情報のう
ち少なくとも一部の配列領域からなる注目領域を選択す
る注目領域選択ステップと、上記注目領域選択ステップ
にて選択された上記注目領域と、上記フラグメント配列
格納ステップにて格納された上記フラグメント配列情報
との間の類似度を決定するホモロジー検索ステップと、
上記ホモロジー検索ステップにて決定された類似度に従
って変異体の配列決定に用いる上記フラグメント配列情
報として採用するか否かを判定するフラグメント採用可
否判定ステップと、上記フラグメント採用可否判定ステ
ップにて採用すると判定された上記フラグメント配列情
報と上記注目領域とのアラインメントをとるアラインメ
ント処理ステップと、上記アラインメント処理によるア
ラインメント結果に基づいて変異体のコンセンサス配列
を決定するコンセンサス配列決定ステップとを含むこと
を特徴とする。
【0052】この方法によれば、変異体のDNA断片の
塩基配列に関するフラグメント配列情報を格納し、変異
前の元のDNA塩基配列情報を格納し、格納された元の
DNA塩基配列情報のうち少なくとも一部の配列領域か
らなる注目領域を選択し、選択された注目領域と格納さ
れたフラグメント配列情報との間の類似度を決定し、決
定された類似度に従って変異体の配列決定に用いるフラ
グメント配列情報として採用するか否かを判定し、採用
すると判定されたフラグメント配列情報と注目領域との
アラインメントをとり、アラインメント結果に基づいて
変異体のコンセンサス配列を決定するので、変異が予想
される注目領域を特定して、その注目領域にアサインメ
ントされた変異体のフラグメントからコンセンサス配列
を作成することにより変異部分のDNA塩基配列を効率
的に決定することができるようになる。
【0053】すなわち、従来は変異体の全ゲノム配列を
決定する作業をする必要があったため、全ゲノムについ
てライブラリーの調整やフラグメントの作成などを行な
う必要がありウェット実験の負担が大きく、また多量の
フラグメント配列のアラインメントを計算機上で実行し
てアセンブルした後、塩基配列の編集(エディット)お
よび確認する必要があり計算機側の作業の負荷も大きか
ったが、本方法によれば全ゲノム配列を決定する必要が
なく注目領域のみの実験および計算で済むため、各種の
資源を効率的に使用し、迅速かつ正確に変異体のDNA
塩基配列を決定することができるようになる。
【0054】また、従来のアセンブリはフラグメント配
列の重複(冗長度)を必要とするため、重複の薄い部
分、すなわち冗長度の少ない部分やフラグメントの配列
品質の低い部分等については、正確なアセンブルを行う
ことができなかったが、本方法によれば、アセンブリが
困難な部分についても変異前の元のDNA塩基配列情報
にアサインメントされたフラグメントを用いてコンセン
サス配列を作成することにより、高精度に塩基配列の同
定または推定をすることができるようになる。
【0055】また、請求項12に記載の変異体配列解析
方法は、請求項11に記載の変異体配列解析方法におい
て、上記コンセンサス配列決定ステップにて決定された
上記コンセンサス配列と、上記注目領域とを比較して変
異情報を決定する変異情報決定ステップをさらに含むこ
とを特徴とする。
【0056】この方法によれば、決定されたコンセンサ
ス配列と、注目領域とを比較して変異情報を決定するの
で、変異体の変異部分の配列を自動的に決定することが
できるようになる。
【0057】ここで、変異情報として、例えば、変異位
置、変異塩基、変異位置の冗長度、変異位置の配列品質
(波形データからのベースコーリングの確からしさや両
鎖シーケンスされているかなど)などの情報を含んでも
よい。また、複数の変異株における共通の変異情報を決
定してもよい。また、変異の相関している複数遺伝子領
域を抽出してもよい。
【0058】また、請求項13に記載の変異体配列解析
方法は、請求項11または12に記載の変異体配列解析
方法において、上記アラインメント処理ステップによる
上記アラインメント結果に基づいて、上記注目領域を構
成する各塩基に対する上記フラグメントの冗長度を決定
する冗長度決定ステップをさらに含むことを特徴とす
る。
【0059】この方法によれば、アラインメント結果に
基づいて、注目領域を構成する各塩基に対するフラグメ
ントの冗長度を決定するので、アセンブル精度などを予
測するために重要な情報である冗長度を自動的に決定す
ることができるようになる。
【0060】また、請求項14に記載の変異体配列解析
方法は、請求項11から13のいずれか一つに記載の変
異体配列解析方法において、上記アラインメント処理ス
テップによる上記アラインメント結果に基づいて、上記
注目領域に対する上記フラグメントのギャップ部分を特
定するギャップ情報を決定するギャップ情報決定ステッ
プをさらに含むことを特徴とする。
【0061】この方法によれば、アラインメント結果に
基づいて、注目領域に対するフラグメントのギャップ部
分を特定するギャップ情報を決定するので、変異体のD
NA塩基配列についてシーケンスできなかった部分、す
なわち、変異前の元のDNA塩基配列(注目領域)には
存在するが、各フラグメント(コンセンサス配列)には
存在しない塩基配列部分であるギャップ部分を自動的に
決定することができるようになる。
【0062】また、請求項15に記載の変異体配列解析
方法は、請求項11から14のいずれか一つに記載の変
異体配列解析方法において、上記注目領域、上記注目領
域に関するアノテーション情報、上記コンセンサス配
列、上記コンセンサス配列に関するアノテーション情
報、上記冗長度、上記変異情報、上記ギャップ情報、上
記アラインメント結果のうち少なくとも一つを含む処理
結果を表示する処理結果表示ステップ、をさらに含むこ
とを特徴とする。
【0063】この方法によれば、注目領域、注目領域に
関するアノテーション情報、コンセンサス配列、コンセ
ンサス配列に関するアノテーション情報、冗長度、変異
情報、ギャップ情報、アラインメント結果のうち少なく
とも一つを含む処理結果を表示するので、これらの有益
な情報を確認した利用者が新たな生物学的な知見の発見
を促進することができるようになる。
【0064】また、請求項16に記載の変異体配列解析
方法は、請求項15に記載の変異体配列解析方法におい
て、上記コンセンサス配列に関するアノテーション情報
は、上記コンセンサス配列のORF領域、制御領域、翻
訳後のアミノ酸配列、変異前の元のアミノ酸配列、変異
後の機能、変異前の元の機能、オーソログ関係に関する
情報のうち少なくとも一つを含むことを特徴とする。
【0065】これはコンセンサス配列に関するアノテー
ション情報の一例を一層具体的に示すものである。この
方法によれば、コンセンサス配列に関するアノテーショ
ン情報は、コンセンサス配列のORF領域、制御領域、
翻訳後のアミノ酸配列(置換変異、挿入や欠失によるフ
レームシフト変異など)、変異後の機能(遺伝子領域の
変異や制御領域の変異による機能変化や、変異の相関し
ている複数遺伝子領域による機能相関解析など)、オー
ソログ関係(同一変異を保有する他種の遺伝子の解析
や、系統解析など)に関する情報のうち少なくとも一つ
を含むので、既知のcDNAなどの遺伝子情報データベ
ースを検索して、同種または他種の細胞等における類似
の配列や機能を検索しこれらの情報を決定することによ
り、これらの有益な情報を確認した利用者が新たな生物
学的な知見を発見することを促進することができるよう
になる。
【0066】また、請求項17に記載の変異体配列解析
方法は、請求項15または16に記載の変異体配列解析
方法において、上記処理結果表示ステップは、複数の出
力方法に対して、上記処理結果を当該出力方法数に分割
して表示することを特徴とする。
【0067】これは処理結果表示の一例を一層具体的に
示すものである。この方法によれば、複数の出力方法に
対して、処理結果を当該出力方法数に分割して表示する
ので、大型ディスプレイへのディスプレイ表示(例え
ば、横方向に長いディスプレイ等)に表示させた場合と
同様に、複数配置に対応したディスプレイ表示(例え
ば、横方向に複数のディスプレイを並置した場合には、
仮想的に横長ディスプレイとして表示する等)ができる
ようになる。
【0068】すなわち、本発明によれば、例えば、シー
ケンシング状況(重複度、ギャップ等)の確認や、変異
の挿入状況(遺伝子等の各種座位からの相対位置・数
量)の確認や、塩基配列の変異が引き起こすアミノ酸翻
訳への影響等の確認や、複数の耐性生物間の比較ゲノム
情報の確認などにおいて、解析作業を視覚的に容易に実
施することが可能になる。
【0069】また、請求項18に記載の変異体配列解析
方法は、請求項11から17のいずれか一つに記載の変
異体配列解析方法において、上記冗長度決定ステップに
て決定された上記冗長度および/または配列品質が予め
定めた値より低い配列領域、および/または、上記ギャ
ップ情報決定ステップにて決定された上記ギャップ部分
の配列領域を含む上記フラグメントを作成するために用
いるPCRプライマーの塩基配列の候補を決定するプラ
イマー配列決定ステップをさらに含むことを特徴とす
る。
【0070】この方法によれば、決定された冗長度およ
び/または配列品質が予め定めた値より低い配列領域、
および/または、決定されたギャップ部分の配列領域を
含むフラグメントを作成するために用いるPCRプライ
マーの塩基配列の候補を決定するので、シーケンシング
の結果、ギャップ部分やフラグメントの重複が薄い部分
をカバーするためのフラグメントを作成するのに用いる
PCRプライマーを自動的に設計することができ、作業
の自動化や効率化を図ることができるようになる。
【0071】また、これにより、冗長度の薄い場所やギ
ャップ部分の特定以外においても、例えば、変異の検出
された部位の再確認実験支援や注目領域を使用した実験
支援などのためのPCRプライマー設計を効率的に行う
ことができるようになる。
【0072】また、請求項19に記載の変異体配列解析
方法は、請求項18に記載の変異体配列解析方法におい
て、上記プライマー配列決定ステップは、上記冗長度決
定ステップにて決定された上記冗長度および/または配
列品質が予め定めた値より低い配列領域、および/また
は、上記ギャップ情報決定ステップにて決定された上記
ギャップ部分の配列領域の外側に位置し、配列内で特異
性が高い部分配列を抽出する部分配列抽出ステップと、
上記部分配列抽出ステップにて抽出された上記部分配列
のうち、予め定めた選択条件に従って上記PCRプライ
マーの塩基配列の候補を決定するプライマー候補選択ス
テップとをさらに含むことを特徴とする。
【0073】これはプライマー配列決定の一例を一層具
体的に示すものである。この方法によれば、決定された
冗長度および/または配列品質が予め定めた値より低い
配列領域、および/または、決定されたギャップ部分の
配列領域の外側に位置し、配列内で特異性が高い部分配
列を抽出するので、プライマーウォーキングにおいて使
用するPCRプライマーがアニールする部位を一つに特
定することができるようになる。
【0074】また、抽出された部分配列のうち、予め定
めた選択条件に従ってPCRプライマーの塩基配列の候
補を決定するので、例えば、プライマー同士がアニール
してダイマーを形成してしまうものや、部分的にGCあ
るいはATに偏るものや、自己相補配列を含みプライマ
ー自身が二次構造を形成してしまうものや、二本鎖DN
Aの50%が水素結合対を形成し、残りの50%が解離
している状態の温度である融解温度TmがPCRサイク
ルでまわす温度の上限と下限の間にならないものなどを
除外してPCRプライマーの塩基配列の候補を決定する
ことができるようになる。
【0075】また、請求項20に記載の変異体配列解析
方法は、請求項19に記載の変異体配列解析方法におい
て、上記部分配列は、塩基数が15以上から30以下の
塩基配列であることを特徴とする。
【0076】これは部分配列の一例を一層具体的に示す
ものである。この方法によれば、部分配列は、塩基数が
15以上から30以下(特に、好ましくは、20から2
5塩基)の塩基配列であるので、PCRを効率的に実行
することができるようになる。すなわち、14以下の塩
基数では鋳型とうまくアニールしない可能性が高くな
り、また、31以上の塩基数ではミスアニールの確率が
高くなるため、適切な塩基数を特定することにより品質
の高いプライマー配列を決定することができるようにな
る。
【0077】また、本発明はプログラムに関するもので
あり、請求項21に記載のプログラムは、変異体のDN
A断片の塩基配列に関するフラグメント配列情報(例え
ば、DNAシーケンサープログラムから出力された変異
体の各フラグメントのDNA塩基配列情報であり、その
波形情報や、配列品質に関する情報や、シーケンシング
実験に用いたベクターのDNA塩基配列などを含んでも
よい)を格納するフラグメント配列格納ステップと、変
異前の元のDNA塩基配列情報(例えば、DNA塩基配
列の他に、アミノ酸配列情報、生物種に関する情報、機
能に関する情報などを含んでもよい)を格納するゲノム
情報格納ステップと、上記ゲノム情報格納ステップにて
格納された上記元のDNA塩基配列情報のうち少なくと
も一部の配列領域からなる注目領域を選択する注目領域
選択ステップと、上記注目領域選択ステップにて選択さ
れた上記注目領域と、上記フラグメント配列格納ステッ
プにて格納された上記フラグメント配列情報との間の類
似度を決定するホモロジー検索ステップと、上記ホモロ
ジー検索ステップにて決定された類似度に従って変異体
の配列決定に用いる上記フラグメント配列情報として採
用するか否かを判定するフラグメント採用可否判定ステ
ップと、上記フラグメント採用可否判定ステップにて採
用すると判定された上記フラグメント配列情報と上記注
目領域とのアラインメントをとるアラインメント処理ス
テップと、上記アラインメント処理によるアラインメン
ト結果に基づいて変異体のコンセンサス配列を決定する
コンセンサス配列決定ステップとを含む変異体配列解析
方法をコンピュータに実行させることを特徴とする。
【0078】このプログラムによれば、変異体のDNA
断片の塩基配列に関するフラグメント配列情報を格納
し、変異前の元のDNA塩基配列情報を格納し、格納さ
れた元のDNA塩基配列情報のうち少なくとも一部の配
列領域からなる注目領域を選択し、選択された注目領域
と格納されたフラグメント配列情報との間の類似度を決
定し、決定された類似度に従って変異体の配列決定に用
いるフラグメント配列情報として採用するか否かを判定
し、採用すると判定されたフラグメント配列情報と注目
領域とのアラインメントをとり、アラインメント結果に
基づいて変異体のコンセンサス配列を決定するので、変
異が予想される注目領域を特定して、その注目領域にア
サインメントされた変異体のフラグメントからコンセン
サス配列を作成することにより変異部分のDNA塩基配
列を効率的に決定することができるようになる。
【0079】すなわち、従来は変異体の全ゲノム配列を
決定する作業をする必要があったため、全ゲノムについ
てライブラリーの調整やフラグメントの作成などを行な
う必要がありウェット実験の負担が大きく、また多量の
フラグメント配列のアラインメントを計算機上で実行し
てアセンブルした後、塩基配列の編集(エディット)お
よび確認する必要があり計算機側の作業の負荷も大きか
ったが、本プログラムによれば全ゲノム配列を決定する
必要がなく注目領域のみの実験および計算で済むため、
各種の資源を効率的に使用し、迅速かつ正確に変異体の
DNA塩基配列を決定することができるようになる。
【0080】また、従来のアセンブリはフラグメント配
列の重複(冗長度)を必要とするため、重複の薄い部
分、すなわち冗長度の少ない部分やフラグメントの配列
品質の低い部分等については、正確なアセンブルを行う
ことができなかったが、本プログラムによれば、アセン
ブリが困難な部分についても変異前の元のDNA塩基配
列情報にアサインメントされたフラグメントを用いてコ
ンセンサス配列を作成することにより、高精度に塩基配
列の同定または推定をすることができるようになる。
【0081】また、請求項22に記載のプログラムは、
請求項21に記載のプログラムにおいて、上記コンセン
サス配列決定ステップにて決定された上記コンセンサス
配列と、上記注目領域とを比較して変異情報を決定する
変異情報決定ステップをさらに含むことを特徴とする。
【0082】このプログラムによれば、決定されたコン
センサス配列と、注目領域とを比較して変異情報を決定
するので、変異体の変異部分の配列を自動的に決定する
ことができるようになる。
【0083】ここで、変異情報として、例えば、変異位
置、変異塩基、変異位置の冗長度、変異位置の配列品質
(波形データからのベースコーリングの確からしさや両
鎖シーケンスされているかなど)などの情報を含んでも
よい。また、複数の変異株における共通の変異情報を決
定してもよい。また、変異の相関している複数遺伝子領
域を抽出してもよい。
【0084】また、請求項23に記載のプログラムは、
請求項21または22に記載のプログラムにおいて、上
記アラインメント処理ステップによる上記アラインメン
ト結果に基づいて、上記注目領域を構成する各塩基に対
する上記フラグメントの冗長度を決定する冗長度決定ス
テップをさらに含むことを特徴とする。
【0085】このプログラムによれば、アラインメント
結果に基づいて、注目領域を構成する各塩基に対するフ
ラグメントの冗長度を決定するので、アセンブル精度な
どを予測するために重要な情報である冗長度を自動的に
決定することができるようになる。
【0086】また、請求項24に記載のプログラムは、
請求項21から23のいずれか一つに記載のプログラム
において、上記アラインメント処理ステップによる上記
アラインメント結果に基づいて、上記注目領域に対する
上記フラグメントのギャップ部分を特定するギャップ情
報を決定するギャップ情報決定ステップをさらに含むこ
とを特徴とする。
【0087】このプログラムによれば、アラインメント
結果に基づいて、注目領域に対するフラグメントのギャ
ップ部分を特定するギャップ情報を決定するので、変異
体のDNA塩基配列についてシーケンスできなかった部
分、すなわち、変異前の元のDNA塩基配列(注目領
域)には存在するが、各フラグメント(コンセンサス配
列)には存在しない塩基配列部分であるギャップ部分を
自動的に決定することができるようになる。
【0088】また、請求項25に記載のプログラムは、
請求項21から24のいずれか一つに記載のプログラム
において、上記注目領域、上記注目領域に関するアノテ
ーション情報、上記コンセンサス配列、上記コンセンサ
ス配列に関するアノテーション情報、上記冗長度、上記
変異情報、上記ギャップ情報、上記アラインメント結果
のうち少なくとも一つを含む処理結果を表示する処理結
果表示ステップ、をさらに含むことを特徴とする。
【0089】このプログラムによれば、注目領域、注目
領域に関するアノテーション情報、コンセンサス配列、
コンセンサス配列に関するアノテーション情報、冗長
度、変異情報、ギャップ情報、アラインメント結果のう
ち少なくとも一つを含む処理結果を表示するので、これ
らの有益な情報を確認した利用者が新たな生物学的な知
見の発見を促進することができるようになる。
【0090】また、請求項26に記載のプログラムは、
請求項25に記載のプログラムにおいて、上記コンセン
サス配列に関するアノテーション情報は、上記コンセン
サス配列のORF領域、制御領域、翻訳後のアミノ酸配
列、変異前の元のアミノ酸配列、変異後の機能、変異前
の元の機能、オーソログ関係に関する情報のうち少なく
とも一つを含むことを特徴とする。
【0091】これはコンセンサス配列に関するアノテー
ション情報の一例を一層具体的に示すものである。この
プログラムによれば、コンセンサス配列に関するアノテ
ーション情報は、コンセンサス配列のORF領域、制御
領域、翻訳後のアミノ酸配列(置換変異、挿入や欠失に
よるフレームシフト変異など)、変異後の機能(遺伝子
領域の変異や制御領域の変異による機能変化や、変異の
相関している複数遺伝子領域による機能相関解析な
ど)、オーソログ関係(同一変異を保有する他種の遺伝
子の解析や、系統解析など)に関する情報のうち少なく
とも一つを含むので、既知のcDNAなどの遺伝子情報
データベースを検索して、同種または他種の細胞等にお
ける類似の配列や機能を検索しこれらの情報を決定する
ことにより、これらの有益な情報を確認した利用者が新
たな生物学的な知見を発見することを促進することがで
きるようになる。
【0092】また、請求項27に記載のプログラムは、
請求項25または26に記載のプログラムにおいて、上
記処理結果表示ステップは、複数の出力プログラムに対
して、上記処理結果を当該出力プログラム数に分割して
表示することを特徴とする。
【0093】これは処理結果表示の一例を一層具体的に
示すものである。このプログラムによれば、複数の出力
プログラムに対して、処理結果を当該出力プログラム数
に分割して表示するので、大型ディスプレイへのディス
プレイ表示(例えば、横方向に長いディスプレイ等)に
表示させた場合と同様に、複数配置に対応したディスプ
レイ表示(例えば、横方向に複数のディスプレイを並置
した場合には、仮想的に横長ディスプレイとして表示す
る等)ができるようになる。
【0094】すなわち、本発明によれば、例えば、シー
ケンシング状況(重複度、ギャップ等)の確認や、変異
の挿入状況(遺伝子等の各種座位からの相対位置・数
量)の確認や、塩基配列の変異が引き起こすアミノ酸翻
訳への影響等の確認や、複数の耐性生物間の比較ゲノム
情報の確認などにおいて、解析作業を視覚的に容易に実
施することが可能になる。
【0095】また、請求項28に記載のプログラムは、
請求項21から27のいずれか一つに記載のプログラム
において、上記冗長度決定ステップにて決定された上記
冗長度および/または配列品質が予め定めた値より低い
配列領域、および/または、上記ギャップ情報決定ステ
ップにて決定された上記ギャップ部分の配列領域を含む
上記フラグメントを作成するために用いるPCRプライ
マーの塩基配列の候補を決定するプライマー配列決定ス
テップをさらに含むことを特徴とする。
【0096】このプログラムによれば、決定された冗長
度および/または配列品質が予め定めた値より低い配列
領域、および/または、決定されたギャップ部分の配列
領域を含むフラグメントを作成するために用いるPCR
プライマーの塩基配列の候補を決定するので、シーケン
シングの結果、ギャップ部分やフラグメントの重複が薄
い部分をカバーするためのフラグメントを作成するのに
用いるPCRプライマーを自動的に設計することがで
き、作業の自動化や効率化を図ることができるようにな
る。
【0097】また、これにより、冗長度の薄い場所やギ
ャップ部分の特定以外においても、例えば、変異の検出
された部位の再確認実験支援や注目領域を使用した実験
支援などのためのPCRプライマー設計を効率的に行う
ことができるようになる。
【0098】また、請求項29に記載のプログラムは、
請求項28に記載のプログラムにおいて、上記プライマ
ー配列決定ステップは、上記冗長度決定ステップにて決
定された上記冗長度および/または配列品質が予め定め
た値より低い配列領域、および/または、上記ギャップ
情報決定ステップにて決定された上記ギャップ部分の配
列領域の外側に位置し、配列内で特異性が高い部分配列
を抽出する部分配列抽出ステップと、上記部分配列抽出
ステップにて抽出された上記部分配列のうち、予め定め
た選択条件に従って上記PCRプライマーの塩基配列の
候補を決定するプライマー候補選択ステップとをさらに
含むことを特徴とする。
【0099】これはプライマー配列決定の一例を一層具
体的に示すものである。このプログラムによれば、決定
された冗長度および/または配列品質が予め定めた値よ
り低い配列領域、および/または、決定されたギャップ
部分の配列領域の外側に位置し、配列内で特異性が高い
部分配列を抽出するので、プライマーウォーキングにお
いて使用するPCRプライマーがアニールする部位を一
つに特定することができるようになる。
【0100】また、抽出された部分配列のうち、予め定
めた選択条件に従ってPCRプライマーの塩基配列の候
補を決定するので、例えば、プライマー同士がアニール
してダイマーを形成してしまうものや、部分的にGCあ
るいはATに偏るものや、自己相補配列を含みプライマ
ー自身が二次構造を形成してしまうものや、二本鎖DN
Aの50%が水素結合対を形成し、残りの50%が解離
している状態の温度である融解温度TmがPCRサイク
ルでまわす温度の上限と下限の間にならないものなどを
除外してPCRプライマーの塩基配列の候補を決定する
ことができるようになる。
【0101】また、請求項30に記載のプログラムは、
請求項29に記載のプログラムにおいて、上記部分配列
は、塩基数が15以上から30以下の塩基配列であるこ
とを特徴とする。
【0102】これは部分配列の一例を一層具体的に示す
ものである。このプログラムによれば、部分配列は、塩
基数が15以上から30以下(特に、好ましくは、20
から25塩基)の塩基配列であるので、PCRを効率的
に実行することができるようになる。すなわち、14以
下の塩基数では鋳型とうまくアニールしない可能性が高
くなり、また、31以上の塩基数ではミスアニールの確
率が高くなるため、適切な塩基数を特定することにより
品質の高いプライマー配列を決定することができるよう
になる。
【0103】また、本発明は記録媒体に関するものであ
り、請求項31に記載の記録媒体は、上記請求項21か
ら30のいずれか一つに記載されたプログラムを記録し
たことを特徴とする。
【0104】この記録媒体によれば、当該記録媒体に記
録されたプログラムをコンピュータに読み取らせて実行
することによって、請求項21から30のいずれか一つ
に記載されたプログラムをコンピュータを利用して実現
することができ、これら各方法と同様の効果を得ること
ができる。
【0105】
【発明の実施の形態】以下に、本発明にかかる変異体配
列解析装置、変異体配列解析方法、プログラム、およ
び、記録媒体の実施の形態を図面に基づいて詳細に説明
する。なお、この実施の形態によりこの発明が限定され
るものではない。
【0106】[本発明の概要]以下、本発明の概要につ
いて説明し、その後、本発明の構成および処理等につい
て詳細に説明する。図1は本発明の基本原理を示す原理
構成図である。
【0107】本発明は、概略的に、以下の基本的特徴を
有する。まず、配列決定の対象となる生物種(例えば、
耐性菌、腫瘍細胞、ウィルスなど)の変異体の全DNA
が取り出され、それらのショットガンライブラリーの作
成が行なわれる。これらのライブラリーの中からDNA
断片(フラグメント)を次々に取り出し、1フラグメン
トずつ自動DNAシーケンサー装置によるシーケンシン
グを行う。すなわち、シーケンサー装置によってベース
コールと配列品質の決定がなされる。
【0108】そして、シーケンサー装置から出力された
変異体の各DNA断片(フラグメント)の塩基配列など
のフラグメント配列情報などをフラグメント配列データ
ベースに格納する(ステップSA−1)。
【0109】また、外部または内部のデータベースに格
納された変異前の元のDNA塩基配列情報(例えば、野
生株などのゲノム配列情報)を検索し、検索された元の
DNA塩基配列情報のうち少なくとも一部の配列領域か
らなる注目領域を選択する(ステップSA−2)。
【0110】ここで、注目領域の選択は、遺伝子の機能
情報などのアノテーション情報から所定の情報(例え
ば、機能など)を選択することにより自動的に対応する
配列領域を選択してもよく、また、利用者が塩基配列の
うち所望の領域を選択してもよい。
【0111】そして、選択された注目領域と、フラグメ
ント配列データベースに格納された各フラグメント配列
情報との間でBLASTやFASTAなどの既知の手法
によりホモロジーサーチを実行して類似度を決定する
(ステップSA−3)。ここで、ホモロジーサーチ結果
の類似していた部位だけではなく類似していなかった部
位がどれだけ存在していなかったかを評価してもよい。
すなわち、クエリーとしてのフラグメントがローカルに
ではなくクエリー全体として野生株ゲノムに類似してい
るかを評価してもよい。
【0112】そして、ホモロジーサーチ結果の各フラグ
メントの類似度に従って、予め定めた類似度を超えるフ
ラグメントを変異体の配列決定に用いるフラグメント配
列情報として採用するか否かを判定する(ステップSA
−4)。
【0113】ここで、他の判定基準として、ベクター配
列などの混入が少ないフラグメントや、注目領域にヒッ
トしたフラグメントの部位および長さなどが好適なフラ
グメントを選択するようにしてもよい。
【0114】そして、採用すると判定されたフラグメン
ト配列情報と注目領域とのアラインメントをとり、各フ
ラグメント配列について注目領域中の位置をアサインメ
ントする。そして、アラインメント結果に基づいて変異
体のコンセンサス配列を決定する(ステップSA−
5)。
【0115】ここで、コンセンサス配列に決定に当たっ
ては、DNAシーケンサー装置から出力された配列品質
情報を利用し、配列品質が低い部分については配列決定
時に低く重みづけを行うことにより、コンセンサス配列
の精度を高めてもよい。
【0116】また、決定されたコンセンサス配列と、注
目領域とを比較して変異情報を決定し、変異体の変異部
分の配列を自動的に決定する(ステップSA−5)。
【0117】また、アラインメント結果に基づいて、注
目領域を構成する各塩基に対するフラグメントの冗長度
を決定し、アセンブル精度などを予測するために重要な
情報である冗長度を自動的に決定する(ステップSA−
5)。
【0118】また、アラインメント結果に基づいて、注
目領域に対するフラグメントのギャップ部分(変異体の
DNA塩基配列についてシーケンスできなかった部分、
すなわち、変異前の元のDNA塩基配列(注目領域)に
は存在するが、各フラグメント(コンセンサス配列)に
は存在しない塩基配列部分)を特定する。
【0119】そして、野生株ゲノム上の注目領域に既知
の遺伝子座の情報を対応付ける。また、コーディング領
域予測プログラムなどを併用して、ORF領域が同定さ
れる。それぞれのORF領域はアミノ酸に翻訳され、ア
ミノ酸配列からの機能同定も行われる。また、他生物種
ゲノムとの比較によるアノテーションを実行し、いわゆ
るオーソログ(orthologue)関係が同定され
る。並行して全ゲノムORFマップの作成が行われ、そ
れまでに遺伝子の機能が判明したものについては、それ
ぞれ構造・機能別に区分されたマップが作成される(ス
テップSA−5)。
【0120】そして、注目領域、注目領域に関するアノ
テーション情報(アミノ酸配列情報、機能情報など)、
コンセンサス配列、コンセンサス配列に関するアノテー
ション情報(コンセンサス配列のORF領域、制御領
域、翻訳後のアミノ酸配列、変異前の元のアミノ酸配
列、変異後の機能、変異前の元の機能、オーソログ関係
に関する情報)、冗長度、変異情報(DNA塩基配列に
おける変異箇所および変異内容、アミノ酸配列における
変異箇所および変異内容など)、ギャップ情報、アライ
ンメント結果のうち少なくとも一つを含む処理結果を表
示する(ステップSA−6)。
【0121】また、複数の出力装置に対して、処理結果
を当該出力装置数に分割して表示してもよい。これによ
り、大型ディスプレイへのディスプレイ表示(例えば、
横方向に長いディスプレイ等)に表示させた場合と同様
に、複数配置に対応したディスプレイ表示(例えば、横
方向に複数のディスプレイを並置した場合には、仮想的
に横長ディスプレイとして表示する等)ができるように
なり、例えば、シーケンシング状況(重複度、ギャップ
等)の確認や、変異の挿入状況(遺伝子等の各種座位か
らの相対位置・数量)の確認や、塩基配列の変異が引き
起こすアミノ酸翻訳への影響等の確認や、複数の耐性生
物間の比較ゲノム情報の確認などにおいて、解析作業を
視覚的に容易に実施することが可能になる。
【0122】また、決定された冗長度および/または配
列品質が予め定めた値より低い配列領域、および/また
は、決定されたギャップ部分の配列領域がある場合に
は、その領域をカバーするフラグメントを作成して、再
度シーケンシングを行う必要がある。そこで、本発明で
は、かかる領域の外側に位置し、配列内で特異性が高い
部分配列を自動的に抽出し利用者に提示することによ
り、プライマーウォーキングにおいて使用するPCRプ
ライマーがアニールする部位を一つに特定することがで
きるようにする。これにより、例えば、変異の検出され
た部位の再確認実験支援や注目領域を使用した実験支援
などのためのPCRプライマー設計を効率的に行うこと
ができる
【0123】また、抽出された部分配列のうち、予め定
めたPCRプライマーの選択条件に従って、PCRプラ
イマーの塩基配列の候補を決定し利用者に提示すること
により、例えば、プライマー同士がアニールしてダイマ
ーを形成してしまうものや、部分的にGCあるいはAT
に偏るものや、自己相補配列を含みプライマー自身が二
次構造を形成してしまうものや、二本鎖DNAの50%
が水素結合対を形成し残りの50%が解離している状態
の温度である融解温度TmがPCRサイクルでまわす温
度の上限と下限の間にならないものなどを自動的に除外
してPCRプライマーの塩基配列の候補を決定すること
ができる。
【0124】[システム構成]まず、本システムの構成
について説明する。図2は、本発明が適用される本シス
テムの構成の一例を示すブロック図であり、該構成のう
ち本発明に関係する部分のみを概念的に示している。本
システムは、概略的に、変異体配列解析装置100と、
配列情報等に関する外部データベースやホモロジー検索
等の外部プログラム等を提供する外部システム200と
を、ネットワーク300を介して通信可能に接続して構
成されている。
【0125】図2においてネットワーク300は、変異
体配列解析装置100と外部システム200とを相互に
接続する機能を有し、例えば、インターネット等であ
る。
【0126】図2において外部システム200は、ネッ
トワーク300を介して、変異体配列解析装置100と
相互に接続され、利用者に対して配列情報等に関する外
部データベースやホモロジー検索やモチーフ検索等の外
部プログラムを実行するウェブサイトを提供する機能を
有する。
【0127】ここで、外部システム200は、WEBサ
ーバやASPサーバ等として構成してもよく、そのハー
ドウェア構成は、一般に市販されるワークステーショ
ン、パーソナルコンピュータ等の情報処理装置およびそ
の付属装置により構成してもよい。また、外部システム
200の各機能は、外部システム200のハードウェア
構成中のCPU、ディスク装置、メモリ装置、入力装
置、出力装置、通信制御装置等およびそれらを制御する
プログラム等により実現される。
【0128】図2において変異体配列解析装置100
は、概略的に、変異体配列解析装置100の全体を統括
的に制御するCPU等の制御部102、通信回線等に接
続されるルータ等の通信装置(図示せず)に接続される
通信制御インターフェース部104、入力装置112や
出力装置114に接続される入出力制御インターフェー
ス部108、および、各種のデータベースやテーブルな
どを格納する記憶部106を備えて構成されており、こ
れら各部は任意の通信路を介して通信可能に接続されて
いる。さらに、この変異体配列解析装置100は、ルー
タ等の通信装置および専用線等の有線または無線の通信
回線を介して、ネットワーク300に通信可能に接続さ
れている。
【0129】記憶部106に格納される各種のデータベ
ースやテーブル(フラグメント配列データベース106
a〜処理結果データ106c)は、固定ディスク装置等
のストレージ手段であり、各種処理に用いる各種のプロ
グラムやテーブルやファイルやデータベースやウェブペ
ージ用ファイル等を格納する。
【0130】これら記憶部106の各構成要素のうち、
フラグメント配列データベース106aは、DNAシー
ケンサー装置から出力された変異体の各フラグメントの
DNA塩基配列情報およびその配列品質情報や、シーケ
ンシング実験に用いたベクターなどのDNA塩基配列な
どを含む、フラグメント配列情報を格納するフラグメン
ト配列格納手段である。
【0131】また、ゲノム情報データベース106b
は、変異前の元のDNA塩基配列情報(DNA塩基配
列、アミノ酸配列情報、生物種に関する情報、機能に関
する情報などを含む)を格納するゲノム情報格納手段で
ある。ここで、ゲノム情報データベース106bは、イ
ンターネットを経由してアクセスする外部のデータベー
スであってもよく、また、これらのデータベースをコピ
ーしたり、オリジナルの配列情報を格納したり、さらに
独自のアノテーション情報等を付加したりして作成した
インハウスデータベースであってもよい。
【0132】また、処理結果データ106cは、制御部
102による各種の処理結果に関するデータを格納する
処理結果データ格納手段である。
【0133】また、図2において、通信制御インターフ
ェース部104は、変異体配列解析装置100とネット
ワーク300(またはルータ等の通信装置)との間にお
ける通信制御を行う。すなわち、通信制御インターフェ
ース部104は、他の端末と通信回線を介してデータを
通信する機能を有する。
【0134】また、図2において、入出力制御インター
フェース部108は、入力装置112や出力装置114
の制御を行う。ここで、出力装置114としては、モニ
タ(家庭用テレビを含む)の他、スピーカを用いること
ができる(なお、以下においては出力装置114をモニ
タとして記載する場合がある)。また、入力装置112
としては、キーボード、マウス、および、マイク等を用
いることができる。また、モニタも、マウスと協働して
ポインティングデバイス機能を実現する。
【0135】また、図2において、制御部102は、O
S(Operating System)等の制御プロ
グラム、各種の処理手順等を規定したプログラム、およ
び所要データを格納するための内部メモリを有し、これ
らのプログラム等により、種々の処理を実行するための
情報処理を行う。制御部102は、機能概念的に、フラ
グメント配列格納部102a、注目領域選択部102
b、ホモロジー検索部102c、フラグメント採用可否
判定部102d、アラインメント処理部102e、冗長
度決定部102f、コンセンサス配列決定部102g、
変異情報決定部102h、ギャップ情報決定部102
i、アノテーション情報決定部102j、処理結果表示
部102k、および、プライマー配列決定部102mを
備えて構成されている。
【0136】このうち、フラグメント配列格納部102
aは、変異体のDNA断片の塩基配列に関するフラグメ
ント配列情報を格納するフラグメント配列格納手段であ
る。また、注目領域選択部102bは、格納された元の
DNA塩基配列情報のうち少なくとも一部の配列領域か
らなる注目領域を選択する注目領域選択手段である。ま
た、ホモロジー検索部102cは、注目領域選択手段に
て選択された注目領域と、フラグメント配列格納手段に
て格納されたフラグメント配列情報との間の類似度を決
定するホモロジー検索手段である。
【0137】また、フラグメント採用可否判定部102
dは、ホモロジー検索手段にて決定された類似度に従っ
て変異体の配列決定に用いるフラグメント配列情報とし
て採用するか否かを判定するフラグメント採用可否判定
手段である。また、アラインメント処理部102eは、
フラグメント採用可否判定手段にて採用すると判定され
たフラグメント配列情報と注目領域とのアラインメント
をとるアラインメント処理手段である。
【0138】また、冗長度決定部102fは、アライン
メント処理手段によるアラインメント結果に基づいて、
注目領域を構成する各塩基に対するフラグメントの冗長
度を決定する冗長度決定手段である。また、コンセンサ
ス配列決定部102gは、アラインメント処理によるア
ラインメント結果に基づいて変異体のコンセンサス配列
を決定するコンセンサス配列決定手段である。
【0139】また、変異情報決定部102hは、コンセ
ンサス配列決定手段にて決定されたコンセンサス配列
と、注目領域とを比較して変異情報を決定する変異情報
決定手段である。また、ギャップ情報決定部102i
は、アラインメント処理手段によるアラインメント結果
に基づいて、注目領域に対するフラグメントのギャップ
部分を特定するギャップ情報を決定するギャップ情報決
定手段である。
【0140】また、アノテーション情報決定部102j
は、コンセンサス配列のORF領域、制御領域、翻訳後
のアミノ酸配列、変異前の元のアミノ酸配列、変異後の
機能、変異前の元の機能、オーソログ関係に関する情報
のうち少なくとも一つを含むアノテーション情報を決定
するアノテーション情報決定手段である。また、処理結
果表示部102kは、注目領域、注目領域に関するアノ
テーション情報、コンセンサス配列、コンセンサス配列
に関するアノテーション情報、冗長度、変異情報、ギャ
ップ情報、アラインメント結果のうち少なくとも一つを
含む処理結果を表示する処理結果表示手段である。
【0141】また、プライマー配列決定部102mは、
冗長度決定手段にて決定された冗長度および/または配
列品質が予め定めた値より低い配列領域、および/また
は、ギャップ情報決定手段にて決定されたギャップ部分
の配列領域を含むフラグメントを作成するために用いる
PCRプライマーの塩基配列の候補を決定するプライマ
ー配列決定手段であり、部分配列抽出部102nおよび
プライマー候補選択部102pを含んで構成される。
【0142】ここで、部分配列抽出部102nは、冗長
度決定手段にて決定された冗長度および/または配列品
質が予め定めた値より低い配列領域、および/または、
ギャップ情報決定手段にて決定されたギャップ部分の配
列領域の外側に位置し、配列内で特異性が高い部分配列
を抽出する部分配列抽出手段である。また、プライマー
候補選択部102pは、部分配列抽出手段にて抽出され
た部分配列のうち、予め定めた選択条件に従ってPCR
プライマーの塩基配列の候補を決定するプライマー候補
選択手段である。なお、これら各部によって行なわれる
処理の詳細については、後述する。
【0143】[システムの処理]次に、このように構成
された本実施の形態における本システムの処理の一例に
ついて、以下に図3〜図10を参照して詳細に説明す
る。
【0144】[メイン処理]まず、メイン処理の詳細に
ついて図3等を参照して説明する。図3は、本実施形態
における本システムのメイン処理の一例を示すフローチ
ャートである。
【0145】まず、変異体配列解析装置100は、フラ
グメント配列格納部102aの処理により、シーケンサ
ー装置から出力された変異体の各DNA断片(フラグメ
ント)の塩基配列などのフラグメント配列情報を入力装
置112またはネットワーク300を経由して取得し、
フラグメント配列データベース106aに格納する(ス
テップSB−1)。
【0146】ついで、変異体配列解析装置100は、注
目領域選択部102bの処理により注目領域選択処理を
実行する(ステップSB−2)。ここで、注目領域選択
処理の詳細について図4および図7を参照して説明す
る。図4は、本実施形態における本システムの注目領域
選択処理の一例を示すフローチャートである。
【0147】まず、注目領域選択部102bは、外部シ
ステム200の外部データベースにアクセスして、変異
前の元のDNA配列情報として、例えば野生株のDNA
配列情報およびそのアノテーション情報を取得し、ゲノ
ム情報データベース106bに格納する(ステップSC
−1)。また、予め、内部のゲノム情報データベース1
06bに外部データベースのうち所望の生物種などのデ
ータをコピーしておき、利用してもよい。
【0148】ついで、注目領域選択部102bは、野生
株のDNA配列情報およびアノテーション情報をモニタ
に出力する(ステップSC−2)。図7は、モニタに表
示される野生株ゲノム情報表示画面の一例を示す図であ
る。この図に示すように野生株ゲノム情報表示画面は、
例えば、既知の制御領域や遺伝子領域を図示する遺伝子
マップ上で表示された遺伝子領域や制御領域を一意に識
別するための番号または名称の表示領域MA−1、遺伝
子などの開始位置および終了位置からなるDNA配列位
置情報の表示領域MA−2、遺伝子などに対応する機能
などのアノテーション情報の表示領域MA−3、注目領
域の開始位置を入力するための入力ボックスMA−4、
注目領域の終了位置を入力するための入力ボックスMA
−5、注目領域に対応するアノテーション情報を入力す
るための入力ボックスMA−6、および、決定ボタンM
A−7を含んで構成されている。
【0149】ここで、利用者が表示領域MA−1からM
A−3の内容を確認して、入力ボックスMA−4からM
A−6に所望の注目領域の条件をキーボードなどの入力
装置112を用いて入力し、決定ボタンMA−7をマウ
スなどの入力装置112を用いて選択すると(ステップ
SC−3)、注目領域選択部102bは、利用者が選択
した注目領域の条件を記憶部106に格納する。
【0150】ここで、利用者は、注目領域の選択方法と
して、制御領域や遺伝子領域やその他の任意の領域のD
NA配列上の開始位置と終了位置を指定してもよく、ま
た、注目領域に対応するアノテーション情報(例えば、
遺伝子の機能など)を指定してもよい。
【0151】そして、利用者が注目領域に対応するアノ
テーション情報を入力した場合には、注目領域選択部1
02bはゲノム情報データベース106bにアクセスし
て、野生株のDNA配列情報から利用者により選択され
たアノテーション情報に対応するDNA配列領域を検索
して、注目領域として抽出する(ステップSC−4)。
これにて、注目領域選択処理が終了する。
【0152】再び図3に戻り、変異体配列解析装置10
0は、ホモロジー検索部102cの処理により、選択さ
れた注目領域と、フラグメント配列データベース106
aに格納された各フラグメント配列情報との間でBLA
STなどの既知の手法によりホモロジーサーチを実行し
て類似度を決定する(ステップSB−3)。
【0153】そして、変異体配列解析装置100は、フ
ラグメント採用可否判定部102dの処理により、フラ
グメント採用可否判定処理を実行する(ステップSB−
4)。ここで、フラグメント採用可否判定処理の詳細に
ついて図5を参照して説明する。図5は、本実施形態に
おける本システムのフラグメント採用可否判定処理の一
例を示すフローチャートである。
【0154】まず、フラグメント採用可否判定部102
dは、ホモロジーサーチ結果の各フラグメントの類似度
に従って、予め定めた類似度を超えるフラグメントを変
異体の配列決定に用いるフラグメント配列情報として採
用するか否かを判定する(ステップSD−1)。すなわ
ち、フラグメント採用可否判定部102dは、注目領域
と一定の類似度を満たさないフラグメントを除去する。
ここで、ホモロジーサーチ結果の類似していた部位だけ
ではなく類似していなかった部位がどれだけ存在してい
なかったかを評価してもよい。すなわち、クエリーとし
てのフラグメントがローカルにではなくクエリー全体と
して野生株ゲノムに類似しているかを評価してもよい。
【0155】そして、フラグメント採用可否判定部10
2dは、フラグメント配列データベース106aに格納
されたベクター配列とフラグメント配列とのホモロジー
をとり、ベクター配列が混入した部分を除去する(ステ
ップSD−2)。
【0156】そして、フラグメント採用可否判定部10
2dは、注目領域にヒットしたフラグメントの部位およ
び長さなどが好適なフラグメントを選択する(ステップ
SD−3)。すなわち、フラグメントの終端部分は配列
品質が劣化している場合が多いため、フラグメント採用
可否判定部102dは、部位や配列品質の情報などの条
件により、フラグメントの採用可否を判定する。
【0157】また、フラグメント採用可否判定部102
dは、各フラグメントの配列情報についてDNAポリメ
ラーゼによるミスシーケンシングの発生している確率を
求め、確率が高い領域を採用しないようにしてもよい。
これにて、フラグメント採用可否判定処理が終了する。
【0158】再び図3に戻り、変異体配列解析装置10
0は、アラインメント処理部102eの処理により、採
用すると判定されたフラグメント配列情報と注目領域と
のアラインメントをとる(ステップSB−5)。
【0159】そして、変異体配列解析装置100は、冗
長度決定部102fの処理により、アラインメント結果
に基づいて、注目領域を構成する各塩基に対するフラグ
メントの冗長度を決定し、アセンブル精度などを予測す
るために重要な情報である冗長度を自動的に決定する
(ステップSB−6)。
【0160】そして、変異体配列解析装置100は、コ
ンセンサス配列決定部102gの処理により、アライン
メント結果に基づいて変異体のコンセンサス配列を決定
する(ステップSB−7)。
【0161】ここで、コンセンサス配列決定部102g
は、DNAシーケンサー装置から出力された配列品質情
報を利用し、配列品質が低い部分については配列決定時
に低く重み付けを行うことにより、コンセンサス配列の
精度を高めてもよい。特に、冗長度の低い部位について
は、配列品質の高いフラグメントの配列情報に高い重み
付けを行うようにすることにより、コンセンサス配列の
品質を高めることができる。
【0162】そして、変異体配列解析装置100は、変
異情報決定部102hの処理により、決定されたコンセ
ンサス配列と、注目領域とを比較して変異情報を決定
し、変異体の変異部分の配列を自動的に決定する(ステ
ップSB−8)。
【0163】そして、変異体配列解析装置100は、ギ
ャップ情報決定部102iの処理により、アラインメン
ト結果に基づいて、注目領域に対するフラグメントのギ
ャップ部分(変異体のDNA塩基配列についてシーケン
スできなかった部分、すなわち、変異前の元のDNA塩
基配列(注目領域)には存在するが、各フラグメント
(コンセンサス配列)には存在しない塩基配列部分)を
特定する(ステップSB−9)。
【0164】そして、変異体配列解析装置100は、ア
ノテーション情報決定部102jの処理により、コーデ
ィング領域予測プログラムなどを併用して、ORF領域
が同定する。また、アノテーション情報決定部102j
は、それぞれのORF領域をアミノ酸に翻訳し、アミノ
酸配列からの機能同定も行う。また、アノテーション情
報決定部102jは、他生物種ゲノムとの比較によるア
ノテーションを実行し、いわゆるオーソログ(orth
ologue)関係を同定する。アノテーション情報決
定部102jは、全ゲノムORFマップの作成を行い、
遺伝子の機能が判明したものについては、それぞれ構造
・機能別に区分したマップを作成する(ステップSB−
10)。
【0165】そして、変異体配列解析装置100は、処
理結果表示部102kの処理により、注目領域、注目領
域に関するアノテーション情報(アミノ酸配列情報、機
能情報など)、コンセンサス配列、コンセンサス配列に
関するアノテーション情報(コンセンサス配列のORF
領域、制御領域、翻訳後のアミノ酸配列、変異前の元の
アミノ酸配列、変異後の機能、変異前の元の機能、オー
ソログ関係に関する情報)、冗長度、変異情報(DNA
塩基配列における変異箇所および変異内容、アミノ酸配
列における変異箇所および変異内容など)、ギャップ情
報、アラインメント結果のうち少なくとも一つを含む処
理結果を出力装置114に表示する(ステップSB−1
1)。
【0166】ここで、図8は、変異体配列解析装置10
0のモニタに表示される処理結果表示画面の一例を示す
図である。この図に示すように処理結果表示画面は、例
えば、野生株(変異前の元の生物種)の遺伝子の翻訳後
のアミノ酸配列情報を表示するための表示領域MB−
1、耐性菌(変異体)の遺伝子の翻訳後のアミノ酸配列
情報を表示するための表示領域MB−2、野生株のDN
Aの塩基配列情報を表示するための表示領域MB−3、
耐性株のコンセンサス配列(別実験で求めた場合)を表
示するための表示領域MB−4、本実験で求めた耐性株
のコンセンサス配列を表示するための表示領域MB−
5、野生株のDNAの塩基配列と耐性株のコンセンサス
配列との変異情報を表示するための表示領域MB−6、
別実験で求めた耐性株のコンセンサス配列と本実験で求
めた耐性株のコンセンサス配列との変異情報を表示する
ための表示領域MB−7、フラグメントの冗長度を表示
するための表示領域MB−8、および、各フラグメント
のDNAの塩基配列情報を表示するための表示領域MB
−9を含んで構成されている。
【0167】ここで、処理結果表示部102kは、図9
に示すように、複数の出力装置114に対して、処理結
果を当該出力装置数に分割して表示してもよい。ここ
で、図9は、モニタに並列表示された処理結果表示画面
の一例を示す図である。図9中の(A)から(D)は、
複数(図9の例においては4台)の出力装置114に処
理結果を分割(図9の例において4分割)して表示して
いる場合の、各出力装置114の表示内容を示す。
【0168】これにより、大型ディスプレイへのディス
プレイ表示(例えば、横方向に長いディスプレイ等)に
表示させた場合と同様に、複数配置に対応したディスプ
レイ表示(例えば、横方向に複数のディスプレイを並置
した場合には、仮想的に横長ディスプレイとして表示す
る等)ができるようになり、例えば、シーケンシング状
況(重複度、ギャップ等)の確認や、変異の挿入状況
(遺伝子等の各種座位からの相対位置・数量)の確認
や、塩基配列の変異が引き起こすアミノ酸翻訳への影響
等の確認や、複数の耐性生物間の比較ゲノム情報の確認
などにおいて、解析作業を視覚的に容易に実施すること
が可能になる。
【0169】また、図10は、変異体配列解析装置10
0のモニタに表示される複数の変異体に関する変異情報
の一覧表示画面の一例を示す図である。この図に示すよ
うに変異情報の一覧表示画面は、例えば、野生株の遺伝
子を一意に特定するための名称または番号を表示するた
めの表示領域MC−1、当該遺伝子のDNA配列上の開
始位置を表示するための表示領域MC−2、当該遺伝子
の終了位置を表示するための表示領域MC−3、当該遺
伝子の長さを表示するための表示領域MC−4、シーケ
ンシングの方向を表示するための表示領域MC−5、耐
性株1に関する情報を表示するための表示領域MC−
6、および、耐性株2に関する情報を表示するための表
示領域MC−7を含んで構成されている。
【0170】ここで、図10は、耐性株が2つの場合を
一例に説明している。また、耐性株に関する情報は、コ
ンセンサス配列決定時のフラグメントの冗長度(Re
d)、フラグメント配列数(Seqs)、コンセンサス
配列決定時のギャップ数(Gap)、および、変異情報
(Diff)を含んで構成される。変異情報は、置換し
た塩基とその位置(塩基の後ろのカッコ内に記載する)
とから構成される。これにて、メイン処理が終了する。
【0171】[プライマー配列決定処理]次に、プライ
マー配列決定処理の詳細について図6を参照して説明す
る。図6は、本実施形態における本システムのプライマ
ー配列決定処理の一例を示すフローチャートである。
【0172】上述の処理により決定された冗長度および
/または配列品質が予め定めた値より低い配列領域、お
よび/または、決定されたギャップ部分の配列領域があ
る場合には(ステップSE−1)、その領域をカバーす
るフラグメントを作成して、再度シーケンシングを行う
必要があるので、変異体配列解析装置100は、部分配
列抽出部102nの処理によりかかる領域の外側に位置
し、配列内で特異性が高い部分配列を自動的に抽出する
(ステップSE−2)。
【0173】ここで、部分配列抽出部102nによる特
異性が高い配列部分の抽出は、変異体のDNA配列の一
部分について全体配列(コンセンサス配列)を対象とし
てローカルアラインメントをとり、一定のホモロジース
コアを満たすものは他に類似配列が存在するものとして
除外することにより、他の部分に類似配列が存在しない
(特異性の高い)部分配列を抽出する。
【0174】そして、変異体配列解析装置100は、プ
ライマー候補選択部102pの処理により、抽出した配
列部分領域のうち、末端がGまたはCのものを選択する
(ステップSE−3)。これにより、PCRプライマー
のハイブリダイゼーション強度を上げることができるよ
うになる。
【0175】そして、プライマー候補選択部102p
は、抽出した配列部分領域のうち、相補的になる配列を
含まないものを選択する(ステップSE−4)。これに
より、プライマー自身が二次構造を構成するものを排除
することができるようになる。
【0176】そして、プライマー候補選択部102p
は、抽出した配列部分領域のうち、GまたはCの配列が
4連続以上となる配列を含まないものを選択する(ステ
ップSE−5)。これにより、テトラプレックスを防止
することができるようになる。
【0177】そして、プライマー候補選択部102p
は、抽出した配列部分領域のうち、融解温度TmがPC
Rサイクルで用いる温度の上限と下限の間になるものを
選択する(ステップSE−6)。これにより、PCR反
応を阻害するプライマーの使用を阻止することができる
ようになる。
【0178】また、プライマー候補選択部102pは、
この他に、例えば、プライマー同士がアニールしてダイ
マーを形成してしまうものや、部分的にGCあるいはA
Tに偏るものや、自己相補配列を含みプライマー自身が
二次構造を形成してしまうものや、二本鎖DNAの50
%が水素結合対を形成し残りの50%が解離している状
態の温度である融解温度TmがPCRサイクルでまわす
温度の上限と下限の間にならないものなどを自動的に除
外してPCRプライマーの塩基配列の候補を決定する。
【0179】そして、プライマー候補選択部102p
は、予め定めたPCRプライマーの選択条件に従って、
抽出された部分配列のうち、PCRプライマーの塩基配
列の候補を決定し出力装置114に表示することによ
り、PCRプライマーの作成を支援する情報を利用者に
提示する(ステップSE−7)。これにて、プライマー
配列決定処理が終了する。
【0180】[他の実施の形態]さて、これまで本発明
の実施の形態について説明したが、本発明は、上述した
実施の形態以外にも、上記特許請求の範囲に記載した技
術的思想の範囲内において種々の異なる実施の形態にて
実施されてよいものである。
【0181】例えば、変異部位の特定および抽出の際
に、ゲノム全体の中でより明らかに変異の検出ができた
部位を含む領域を野生株・変異株間の変異領域としてリ
スト出力してもよい。
【0182】また、野生株に対しての複数の変異株につ
いての変異部位等の統計解析(表現型と変異の相関解析
等)を出力してもよい。
【0183】また、変異体配列解析装置100がスタン
ドアローンの形態で処理を行う場合を一例に説明した
が、変異体配列解析装置100とは別筐体で構成される
クライアント端末からの要求に応じて処理を行い、その
処理結果を当該クライアント端末に返却するように構成
してもよい。
【0184】また、実施形態において説明した各処理の
うち、自動的に行なわれるものとして説明した処理の全
部または一部を手動的に行うこともでき、あるいは、手
動的に行なわれるものとして説明した処理の全部または
一部を公知の方法で自動的に行うこともできる。この
他、上記文書中や図面中で示した処理手順、制御手順、
具体的名称、各種の登録データや検索条件等のパラメー
タを含む情報、画面例、データベース構成については、
特記する場合を除いて任意に変更することができる。
【0185】また、変異体配列解析装置100に関し
て、図示の各構成要素は機能概念的なものであり、必ず
しも物理的に図示の如く構成されていることを要しな
い。例えば、変異体配列解析装置100の各部または各
装置が備える処理機能、特に制御部102にて行なわれ
る各処理機能については、その全部または任意の一部
を、CPU(Central Processing
Unit)および当該CPUにて解釈実行されるプログ
ラムにて実現することができ、あるいは、ワイヤードロ
ジックによるハードウェアとして実現することも可能で
ある。なお、プログラムは、後述する記録媒体に記録さ
れており、必要に応じて変異体配列解析装置100に機
械的に読み取られる。
【0186】すなわち、ROMまたはHDなどの記憶部
106などには、OS(Operating Syst
em)と協働してCPUに命令を与え、各種処理を行う
ためのコンピュータプログラムが記録されている。この
コンピュータプログラムは、RAM等にロードされるこ
とによって実行され、CPUと協働して制御部102を
構成する。また、このコンピュータプログラムは、変異
体配列解析装置100に対して任意のネットワーク30
0を介して接続されたアプリケーションプログラムサー
バに記録されてもよく、必要に応じてその全部または一
部をダウンロードすることも可能である。
【0187】また、本発明にかかるプログラムを、コン
ピュータ読み取り可能な記録媒体に格納することもでき
る。ここで、この「記録媒体」とは、フレキシブルディ
スク、光磁気ディスク、ROM、EPROM、EEPR
OM、CD−ROM、MO、DVD等の任意の「可搬用
の物理媒体」や、各種コンピュータシステムに内蔵され
るROM、RAM、HD等の任意の「固定用の物理媒
体」、あるいは、LAN、WAN、インターネットに代
表されるネットワークを介してプログラムを送信する場
合の通信回線や搬送波のように、短期にプログラムを保
持する「通信媒体」を含むものとする。
【0188】また、「プログラム」とは、任意の言語や
記述方法にて記述されたデータ処理方法であり、ソース
コードやバイナリコード等の形式を問わない。なお、
「プログラム」は必ずしも単一的に構成されるものに限
られず、複数のモジュールやライブラリとして分散構成
されるものや、OS(Operating Syste
m)に代表される別個のプログラムと協働してその機能
を達成するものをも含む。なお、実施の形態に示した各
装置において記録媒体を読み取るための具体的な構成、
読み取り手順、あるいは、読み取り後のインストール手
順等については、周知の構成や手順を用いることができ
る。
【0189】記憶部106に格納される各種のデータベ
ース等(フラグメント配列データベース106a〜処理
結果データ106c)は、RAM、ROM等のメモリ装
置、ハードディスク等の固定ディスク装置、フレキシブ
ルディスク、光ディスク等のストレージ手段であり、各
種処理やウェブサイト提供に用いる各種のプログラムや
テーブルやファイルやデータベースやウェブページ用フ
ァイル等を格納する。
【0190】また、変異体配列解析装置100は、既知
のパーソナルコンピュータ、ワークステーション等の情
報処理端末等の情報処理装置にプリンタやモニタやイメ
ージスキャナ等の周辺装置を接続し、該情報処理装置に
本発明の方法を実現させるソフトウェア(プログラム、
データ等を含む)を実装することにより実現してもよ
い。
【0191】さらに、変異体配列解析装置100の分散
・統合の具体的形態は図示のものに限られず、その全部
または一部を、各種の負荷等に応じた任意の単位で、機
能的または物理的に分散・統合して構成することができ
る。例えば、各データベースを独立したデータベース装
置として独立に構成してもよく、また、処理の一部をC
GI(Common Gateway Interfa
ce)を用いて実現してもよい。
【0192】また、ネットワーク300は、変異体配列
解析装置100と外部システム200とを相互に接続す
る機能を有し、例えば、インターネットや、イントラネ
ットや、LAN(有線/無線の双方を含む)や、VAN
や、パソコン通信網や、公衆電話網(アナログ/デジタ
ルの双方を含む)や、専用回線網(アナログ/デジタル
の双方を含む)や、CATV網や、IMT2000方
式、GSM方式またはPDC/PDC―P方式等の携帯
回線交換網/携帯パケット交換網や、無線呼出網や、B
luetooth等の局所無線網や、PHS網や、C
S、BSまたはISDB等の衛星通信網等のうちいずれ
かを含んでもよい。すなわち、本システムは、有線・無
線を問わず任意のネットワークを介して、各種データを
送受信することができる。
【0193】
【発明の効果】以上詳細に説明したように、本発明によ
れば、変異体のDNA断片の塩基配列に関するフラグメ
ント配列情報を格納し、変異前の元のDNA塩基配列情
報を格納し、格納された元のDNA塩基配列情報のうち
少なくとも一部の配列領域からなる注目領域を選択し、
選択された注目領域と格納されたフラグメント配列情報
との間の類似度を決定し、決定された類似度に従って変
異体の配列決定に用いるフラグメント配列情報として採
用するか否かを判定し、採用すると判定されたフラグメ
ント配列情報と注目領域とのアラインメントをとり、ア
ラインメント結果に基づいて変異体のコンセンサス配列
を決定するので、変異が予想される注目領域を特定し
て、その注目領域にアサインメントされた変異体のフラ
グメントからコンセンサス配列を作成することにより変
異部分のDNA塩基配列を効率的に決定することができ
る変異体配列解析装置、変異体配列解析方法、プログラ
ム、および、記録媒体を提供することができる。
【0194】また、これにより、従来は変異体の全ゲノ
ム配列を決定する作業をする必要があったため、全ゲノ
ムについてライブラリーの調整やフラグメントの作成な
どを行なう必要がありウェット実験の負担が大きく、ま
た多量のフラグメント配列のアラインメントを計算機上
で実行してアセンブルした後、塩基配列の編集(エディ
ット)および確認する必要があり計算機側の作業の負荷
も大きかったが、本装置によれば全ゲノム配列を決定す
る必要がなく注目領域のみの実験および計算で済むた
め、各種の資源を効率的に使用し、迅速かつ正確に変異
体のDNA塩基配列を決定することができる変異体配列
解析装置、変異体配列解析方法、プログラム、および、
記録媒体を提供することができる。
【0195】また、これにより、従来のアセンブリはフ
ラグメント配列の重複(冗長度)を必要とするため、重
複の薄い部分、すなわち冗長度の少ない部分やフラグメ
ントの配列品質の低い部分等については、正確なアセン
ブルを行うことができなかったが、本装置によれば、ア
センブリが困難な部分についても変異前の元のDNA塩
基配列情報にアサインメントされたフラグメントを用い
てコンセンサス配列を作成することにより、高精度に塩
基配列の同定または推定をすることができる変異体配列
解析装置、変異体配列解析方法、プログラム、および、
記録媒体を提供することができる。
【0196】また、本発明によれば、決定されたコンセ
ンサス配列と、注目領域とを比較して変異情報を決定す
るので、変異体の変異部分の配列を自動的に決定するこ
とができる変異体配列解析装置、変異体配列解析方法、
プログラム、および、記録媒体を提供することができ
る。
【0197】また、本発明によれば、アラインメント結
果に基づいて、注目領域を構成する各塩基に対するフラ
グメントの冗長度を決定するので、アセンブル精度など
を予測するために重要な情報である冗長度を自動的に決
定することができる変異体配列解析装置、変異体配列解
析方法、プログラム、および、記録媒体を提供すること
ができる。
【0198】また、本発明によれば、アラインメント結
果に基づいて、注目領域に対するフラグメントのギャッ
プ部分を特定するギャップ情報を決定するので、変異体
のDNA塩基配列についてシーケンスできなかった部
分、すなわち、変異前の元のDNA塩基配列(注目領
域)には存在するが、各フラグメント(コンセンサス配
列)には存在しない塩基配列部分であるギャップ部分を
自動的に決定することができる変異体配列解析装置、変
異体配列解析方法、プログラム、および、記録媒体を提
供することができる。
【0199】また、本発明によれば、注目領域、注目領
域に関するアノテーション情報、コンセンサス配列、コ
ンセンサス配列に関するアノテーション情報、冗長度、
変異情報、ギャップ情報、アラインメント結果のうち少
なくとも一つを含む処理結果を表示するので、これらの
有益な情報を確認した利用者が新たな生物学的な知見の
発見を促進することができる変異体配列解析装置、変異
体配列解析方法、プログラム、および、記録媒体を提供
することができる。
【0200】また、本発明によれば、コンセンサス配列
に関するアノテーション情報は、コンセンサス配列のO
RF領域、制御領域、翻訳後のアミノ酸配列(置換変
異、挿入や欠失によるフレームシフト変異など)、変異
後の機能(遺伝子領域の変異や制御領域の変異による機
能変化や、変異の相関している複数遺伝子領域による機
能相関解析など)、オーソログ関係(同一変異を保有す
る他種の遺伝子の解析や、系統解析など)に関する情報
のうち少なくとも一つを含むので、既知のcDNAなど
のゲノム情報データベースを検索して、同種または他種
の細胞等における類似の配列や機能を検索しこれらの情
報を決定することにより、これらの有益な情報を確認し
た利用者が新たな生物学的な知見を発見することを促進
することができる変異体配列解析装置、変異体配列解析
方法、プログラム、および、記録媒体を提供することが
できる。
【0201】また、本発明によれば、複数の出力装置に
対して、処理結果を当該出力装置数に分割して表示する
ので、大型ディスプレイへのディスプレイ表示(例え
ば、横方向に長いディスプレイ等)に表示させた場合と
同様に、複数配置に対応したディスプレイ表示(例え
ば、横方向に複数のディスプレイを並置した場合には、
仮想的に横長ディスプレイとして表示する等)ができる
変異体配列解析装置、変異体配列解析方法、プログラ
ム、および、記録媒体を提供することができる。
【0202】すなわち、本発明によれば、例えば、シー
ケンシング状況(重複度、ギャップ等)の確認や、変異
の挿入状況(遺伝子等の各種座位からの相対位置・数
量)の確認や、塩基配列の変異が引き起こすアミノ酸翻
訳への影響等の確認や、複数の耐性生物間の比較ゲノム
情報の確認などにおいて、解析作業を視覚的に容易に実
施することが可能になる変異体配列解析装置、変異体配
列解析方法、プログラム、および、記録媒体を提供する
ことができる。
【0203】また、本発明によれば、決定された冗長度
および/または配列品質が予め定めた値より低い配列領
域、および/または、決定されたギャップ部分の配列領
域を含むフラグメントを作成するために用いるPCRプ
ライマーの塩基配列の候補を決定するので、シーケンシ
ングの結果、ギャップ部分やフラグメントの重複が薄い
部分をカバーするためのフラグメントを作成するのに用
いるPCRプライマーを自動的に設計することができ、
作業の自動化や効率化を図ることができる変異体配列解
析装置、変異体配列解析方法、プログラム、および、記
録媒体を提供することができる。
【0204】また、本発明によれば、決定された冗長度
および/または配列品質が予め定めた値より低い配列領
域、および/または、決定されたギャップ部分の配列領
域の外側に位置し、配列内で特異性が高い部分配列を抽
出するので、プライマーウォーキングにおいて使用する
PCRプライマーがアニールする部位を一つに特定する
ことができる変異体配列解析装置、変異体配列解析方
法、プログラム、および、記録媒体を提供することがで
きる。
【0205】また、これにより、冗長度の薄い場所やギ
ャップ部分の特定以外においても、例えば、変異の検出
された部位の再確認実験支援や注目領域を使用した実験
支援などのためのPCRプライマー設計を効率的に行う
ことができ変異体配列解析装置、変異体配列解析方法、
プログラム、および、記録媒体を提供することができ
る。
【0206】また、本発明によれば、抽出された部分配
列のうち、予め定めた選択条件に従ってPCRプライマ
ーの塩基配列の候補を決定するので、例えば、プライマ
ー同士がアニールしてダイマーを形成してしまうもの
や、部分的にGCあるいはATに偏るものや、自己相補
配列を含みプライマー自身が二次構造を形成してしまう
ものや、二本鎖DNAの50%が水素結合対を形成し、
残りの50%が解離している状態の温度である融解温度
TmがPCRサイクルでまわす温度の上限と下限の間に
ならないものなどを除外してPCRプライマーの塩基配
列の候補を決定することができる変異体配列解析装置、
変異体配列解析方法、プログラム、および、記録媒体を
提供することができる。
【0207】さらに、本発明によれば、部分配列は、塩
基数が15以上から30以下(特に、好ましくは、20
から25塩基)の塩基配列であるので、PCRを効率的
に実行することができるようになる。すなわち、14以
下の塩基数では鋳型とうまくアニールしない可能性が高
くなり、また、31以上の塩基数ではミスアニールの確
率が高くなるため、適切な塩基数を特定することにより
品質の高いプライマー配列を決定することができる変異
体配列解析装置、変異体配列解析方法、プログラム、お
よび、記録媒体を提供することができる。
【図面の簡単な説明】
【図1】本発明の基本原理を示す原理構成図である。
【図2】本発明が適用される本システムの構成の一例を
示すブロック図である。
【図3】本実施形態における本システムのメイン処理の
一例を示すフローチャートである。
【図4】本実施形態における本システムの注目領域選択
処理の一例を示すフローチャートである。
【図5】本実施形態における本システムのフラグメント
採用可否判定処理の一例を示すフローチャートである。
【図6】本実施形態における本システムのプライマー配
列決定処理の一例を示すフローチャートである。
【図7】変異体配列解析装置100のモニタに表示され
る野生株ゲノム情報表示画面の一例を示す図である。
【図8】変異体配列解析装置100のモニタに表示され
る処理結果表示画面の一例を示す図である。
【図9】モニタに並列表示された処理結果表示画面の一
例を示す図である。
【図10】変異体配列解析装置100のモニタに表示さ
れる複数の変異体に関する変異情報の一覧表示画面の一
例を示す図である。
【符号の説明】
100 変異体配列解析装置 102 制御部 102a フラグメント配列格納部 102b 注目領域選択部 102c ホモロジー検索部 102d フラグメント採用可否判定部 102e アラインメント処理部 102f 冗長度決定部 102g コンセンサス配列決定部 102h 変異情報決定部 102i ギャップ情報決定部 102j アノテーション情報決定部 102k 処理結果表示部 102m プライマー配列決定部 102n 部分配列抽出部 102p プライマー候補選択部 104 通信制御インターフェース部 106 記憶部 106a フラグメント配列データベース 106b ゲノム情報データベース 106c 処理結果データ 108 入出力制御インターフェース部 112 入力装置 114 出力装置 200 外部システム 300 ネットワーク
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 4B029 AA07 AA27 BB20 FA15 4B063 QA13 QQ42 QQ52 QS39 5B075 ND20 PR06 QM08 UU19

Claims (31)

    【特許請求の範囲】
  1. 【請求項1】 変異体のDNA断片の塩基配列に関する
    フラグメント配列情報を格納するフラグメント配列格納
    手段と、 変異前の元のDNA塩基配列情報を格納するゲノム情報
    格納手段と、 上記ゲノム情報格納手段にて格納された上記元のDNA
    塩基配列情報のうち少なくとも一部の配列領域からなる
    注目領域を選択する注目領域選択手段と、 上記注目領域選択手段にて選択された上記注目領域と、
    上記フラグメント配列格納手段にて格納された上記フラ
    グメント配列情報との間の類似度を決定するホモロジー
    検索手段と、 上記ホモロジー検索手段にて決定された類似度に従って
    変異体の配列決定に用いる上記フラグメント配列情報と
    して採用するか否かを判定するフラグメント採用可否判
    定手段と、 上記フラグメント採用可否判定手段にて採用すると判定
    された上記フラグメント配列情報と上記注目領域とのア
    ラインメントをとるアラインメント処理手段と、 上記アラインメント処理によるアラインメント結果に基
    づいて変異体のコンセンサス配列を決定するコンセンサ
    ス配列決定手段と、 を備えたことを特徴とする変異体配列解析装置。
  2. 【請求項2】 上記コンセンサス配列決定手段にて決定
    された上記コンセンサス配列と、上記注目領域とを比較
    して変異情報を決定する変異情報決定手段、 をさらに備えたことを特徴とする請求項1に記載の変異
    体配列解析装置。
  3. 【請求項3】 上記アラインメント処理手段による上記
    アラインメント結果に基づいて、上記注目領域を構成す
    る各塩基に対する上記フラグメントの冗長度を決定する
    冗長度決定手段、 をさらに備えたことを特徴とする請求項1または2に記
    載の変異体配列解析装置。
  4. 【請求項4】 上記アラインメント処理手段による上記
    アラインメント結果に基づいて、上記注目領域に対する
    上記フラグメントのギャップ部分を特定するギャップ情
    報を決定するギャップ情報決定手段、 をさらに備えたことを特徴とする請求項1から3のいず
    れか一つに記載の変異体配列解析装置。
  5. 【請求項5】 上記注目領域、上記注目領域に関するア
    ノテーション情報、上記コンセンサス配列、上記コンセ
    ンサス配列に関するアノテーション情報、上記冗長度、
    上記変異情報、上記ギャップ情報、上記アラインメント
    結果のうち少なくとも一つを含む処理結果を表示する処
    理結果表示手段、 をさらに備えたことを特徴とする請求項1から4のいず
    れか一つに記載の変異体配列解析装置。
  6. 【請求項6】 上記コンセンサス配列に関するアノテー
    ション情報は、上記コンセンサス配列のORF領域、制
    御領域、翻訳後のアミノ酸配列、変異前の元のアミノ酸
    配列、変異後の機能、変異前の元の機能、オーソログ関
    係に関する情報のうち少なくとも一つを含むこと、 を特徴とする請求項5に記載の変異体配列解析装置。
  7. 【請求項7】 上記処理結果表示手段は、複数の出力装
    置に対して、上記処理結果を当該出力装置数に分割して
    表示すること、 を特徴とする請求項5または6に記載の変異体配列解析
    装置。
  8. 【請求項8】 上記冗長度決定手段にて決定された上記
    冗長度および/または配列品質が予め定めた値より低い
    配列領域、および/または、上記ギャップ情報決定手段
    にて決定された上記ギャップ部分の配列領域を含む上記
    フラグメントを作成するために用いるPCRプライマー
    の塩基配列の候補を決定するプライマー配列決定手段、 をさらに備えたことを特徴とする請求項1から7のいず
    れか一つに記載の変異体配列解析装置。
  9. 【請求項9】 上記プライマー配列決定手段は、 上記冗長度決定手段にて決定された上記冗長度および/
    または配列品質が予め定めた値より低い配列領域、およ
    び/または、上記ギャップ情報決定手段にて決定された
    上記ギャップ部分の配列領域の外側に位置し、配列内で
    特異性が高い部分配列を抽出する部分配列抽出手段と、 上記部分配列抽出手段にて抽出された上記部分配列のう
    ち、予め定めた選択条件に従って上記PCRプライマー
    の塩基配列の候補を決定するプライマー候補選択手段
    と、 をさらに備えたことを特徴とする請求項8に記載の変異
    体配列解析装置。
  10. 【請求項10】 上記部分配列は、塩基数が15以上か
    ら30以下の塩基配列であること、 を特徴とする請求項9に記載の変異体配列解析装置。
  11. 【請求項11】 変異体のDNA断片の塩基配列に関す
    るフラグメント配列情報を格納するフラグメント配列格
    納ステップと、 変異前の元のDNA塩基配列情報を格納するゲノム情報
    格納ステップと、 上記ゲノム情報格納ステップにて格納された上記元のD
    NA塩基配列情報のうち少なくとも一部の配列領域から
    なる注目領域を選択する注目領域選択ステップと、 上記注目領域選択ステップにて選択された上記注目領域
    と、上記フラグメント配列格納ステップにて格納された
    上記フラグメント配列情報との間の類似度を決定するホ
    モロジー検索ステップと、 上記ホモロジー検索ステップにて決定された類似度に従
    って変異体の配列決定に用いる上記フラグメント配列情
    報として採用するか否かを判定するフラグメント採用可
    否判定ステップと、 上記フラグメント採用可否判定ステップにて採用すると
    判定された上記フラグメント配列情報と上記注目領域と
    のアラインメントをとるアラインメント処理ステップ
    と、 上記アラインメント処理によるアラインメント結果に基
    づいて変異体のコンセンサス配列を決定するコンセンサ
    ス配列決定ステップと、 を含むことを特徴とする変異体配列解析方法。
  12. 【請求項12】 上記コンセンサス配列決定ステップに
    て決定された上記コンセンサス配列と、上記注目領域と
    を比較して変異情報を決定する変異情報決定ステップ、 をさらに含むことを特徴とする請求項11に記載の変異
    体配列解析方法。
  13. 【請求項13】 上記アラインメント処理ステップによ
    る上記アラインメント結果に基づいて、上記注目領域を
    構成する各塩基に対する上記フラグメントの冗長度を決
    定する冗長度決定ステップ、 をさらに含むことを特徴とする請求項11または12に
    記載の変異体配列解析方法。
  14. 【請求項14】 上記アラインメント処理ステップによ
    る上記アラインメント結果に基づいて、上記注目領域に
    対する上記フラグメントのギャップ部分を特定するギャ
    ップ情報を決定するギャップ情報決定ステップ、 をさらに含むことを特徴とする請求項11から13のい
    ずれか一つに記載の変異体配列解析方法。
  15. 【請求項15】 上記注目領域、上記注目領域に関する
    アノテーション情報、上記コンセンサス配列、上記コン
    センサス配列に関するアノテーション情報、上記冗長
    度、上記変異情報、上記ギャップ情報、上記アラインメ
    ント結果のうち少なくとも一つを含む処理結果を表示す
    る処理結果表示ステップ、 をさらに含むことを特徴とする請求項11から14のい
    ずれか一つに記載の変異体配列解析方法。
  16. 【請求項16】 上記コンセンサス配列に関するアノテ
    ーション情報は、上記コンセンサス配列のORF領域、
    制御領域、翻訳後のアミノ酸配列、変異前の元のアミノ
    酸配列、変異後の機能、変異前の元の機能、オーソログ
    関係に関する情報のうち少なくとも一つを含むこと、 を特徴とする請求項15に記載の変異体配列解析方法。
  17. 【請求項17】 上記処理結果表示ステップは、複数の
    出力方法に対して、上記処理結果を当該出力方法数に分
    割して表示すること、 を特徴とする請求項15または16に記載の変異体配列
    解析方法。
  18. 【請求項18】 上記冗長度決定ステップにて決定され
    た上記冗長度および/または配列品質が予め定めた値よ
    り低い配列領域、および/または、上記ギャップ情報決
    定ステップにて決定された上記ギャップ部分の配列領域
    を含む上記フラグメントを作成するために用いるPCR
    プライマーの塩基配列の候補を決定するプライマー配列
    決定ステップ、 をさらに含むことを特徴とする請求項11から17のい
    ずれか一つに記載の変異体配列解析方法。
  19. 【請求項19】 上記プライマー配列決定ステップは、 上記冗長度決定ステップにて決定された上記冗長度およ
    び/または配列品質が予め定めた値より低い配列領域、
    および/または、上記ギャップ情報決定ステップにて決
    定された上記ギャップ部分の配列領域の外側に位置し、
    配列内で特異性が高い部分配列を抽出する部分配列抽出
    ステップと、 上記部分配列抽出ステップにて抽出された上記部分配列
    のうち、予め定めた選択条件に従って上記PCRプライ
    マーの塩基配列の候補を決定するプライマー候補選択ス
    テップと、 をさらに含むことを特徴とする請求項18に記載の変異
    体配列解析方法。
  20. 【請求項20】 上記部分配列は、塩基数が15以上か
    ら30以下の塩基配列であること、 を特徴とする請求項19に記載の変異体配列解析方法。
  21. 【請求項21】 変異体のDNA断片の塩基配列に関す
    るフラグメント配列情報を格納するフラグメント配列格
    納ステップと、 変異前の元のDNA塩基配列情報を格納するゲノム情報
    格納ステップと、 上記ゲノム情報格納ステップにて格納された上記元のD
    NA塩基配列情報のうち少なくとも一部の配列領域から
    なる注目領域を選択する注目領域選択ステップと、 上記注目領域選択ステップにて選択された上記注目領域
    と、上記フラグメント配列格納ステップにて格納された
    上記フラグメント配列情報との間の類似度を決定するホ
    モロジー検索ステップと、 上記ホモロジー検索ステップにて決定された類似度に従
    って変異体の配列決定に用いる上記フラグメント配列情
    報として採用するか否かを判定するフラグメント採用可
    否判定ステップと、 上記フラグメント採用可否判定ステップにて採用すると
    判定された上記フラグメント配列情報と上記注目領域と
    のアラインメントをとるアラインメント処理ステップ
    と、 上記アラインメント処理によるアラインメント結果に基
    づいて変異体のコンセンサス配列を決定するコンセンサ
    ス配列決定ステップと、 を含む変異体配列解析方法をコンピュータに実行させる
    ことを特徴とするプログラム。
  22. 【請求項22】 上記コンセンサス配列決定ステップに
    て決定された上記コンセンサス配列と、上記注目領域と
    を比較して変異情報を決定する変異情報決定ステップ、 をさらに含むことを特徴とする請求項21に記載のプロ
    グラム。
  23. 【請求項23】 上記アラインメント処理ステップによ
    る上記アラインメント結果に基づいて、上記注目領域を
    構成する各塩基に対する上記フラグメントの冗長度を決
    定する冗長度決定ステップ、 をさらに含むことを特徴とする請求項21または22に
    記載のプログラム。
  24. 【請求項24】 上記アラインメント処理ステップによ
    る上記アラインメント結果に基づいて、上記注目領域に
    対する上記フラグメントのギャップ部分を特定するギャ
    ップ情報を決定するギャップ情報決定ステップ、 をさらに含むことを特徴とする請求項21から23のい
    ずれか一つに記載のプログラム。
  25. 【請求項25】 上記注目領域、上記注目領域に関する
    アノテーション情報、上記コンセンサス配列、上記コン
    センサス配列に関するアノテーション情報、上記冗長
    度、上記変異情報、上記ギャップ情報、上記アラインメ
    ント結果のうち少なくとも一つを含む処理結果を表示す
    る処理結果表示ステップ、 をさらに含むことを特徴とする請求項21から24のい
    ずれか一つに記載のプログラム。
  26. 【請求項26】 上記コンセンサス配列に関するアノテ
    ーション情報は、上記コンセンサス配列のORF領域、
    制御領域、翻訳後のアミノ酸配列、変異前の元のアミノ
    酸配列、変異後の機能、変異前の元の機能、オーソログ
    関係に関する情報のうち少なくとも一つを含むこと、 を特徴とする請求項25に記載のプログラム。
  27. 【請求項27】 上記処理結果表示ステップは、複数の
    出力プログラムに対して、上記処理結果を当該出力プロ
    グラム数に分割して表示すること、 を特徴とする請求項25または26に記載のプログラ
    ム。
  28. 【請求項28】 上記冗長度決定ステップにて決定され
    た上記冗長度および/または配列品質が予め定めた値よ
    り低い配列領域、および/または、上記ギャップ情報決
    定ステップにて決定された上記ギャップ部分の配列領域
    を含む上記フラグメントを作成するために用いるPCR
    プライマーの塩基配列の候補を決定するプライマー配列
    決定ステップ、 をさらに含むことを特徴とする請求項21から27のい
    ずれか一つに記載のプログラム。
  29. 【請求項29】 上記プライマー配列決定ステップは、 上記冗長度決定ステップにて決定された上記冗長度およ
    び/または配列品質が予め定めた値より低い配列領域、
    および/または、上記ギャップ情報決定ステップにて決
    定された上記ギャップ部分の配列領域の外側に位置し、
    配列内で特異性が高い部分配列を抽出する部分配列抽出
    ステップと、 上記部分配列抽出ステップにて抽出された上記部分配列
    のうち、予め定めた選択条件に従って上記PCRプライ
    マーの塩基配列の候補を決定するプライマー候補選択ス
    テップと、 をさらに含むことを特徴とする請求項28に記載のプロ
    グラム。
  30. 【請求項30】 上記部分配列は、塩基数が15以上か
    ら30以下の塩基配列であること、 を特徴とする請求項29に記載のプログラム。
  31. 【請求項31】 上記請求項21から30のいずれか一
    つに記載されたプログラムを記録したことを特徴とする
    コンピュータ読み取り可能な記録媒体。
JP2002136164A 2002-05-10 2002-05-10 変異体配列解析装置、変異体配列解析方法、プログラム、および、記録媒体 Pending JP2003330934A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2002136164A JP2003330934A (ja) 2002-05-10 2002-05-10 変異体配列解析装置、変異体配列解析方法、プログラム、および、記録媒体
EP03723335A EP1505517A4 (en) 2002-05-10 2003-05-12 MUTANTENSEQUENZANALYSIERER
PCT/JP2003/005893 WO2003096223A1 (fr) 2002-05-10 2003-05-12 Analyseur de sequences mutantes
US10/513,928 US20050164198A1 (en) 2002-05-10 2003-05-12 Mutant sequence analyzer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002136164A JP2003330934A (ja) 2002-05-10 2002-05-10 変異体配列解析装置、変異体配列解析方法、プログラム、および、記録媒体

Publications (1)

Publication Number Publication Date
JP2003330934A true JP2003330934A (ja) 2003-11-21

Family

ID=29416777

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002136164A Pending JP2003330934A (ja) 2002-05-10 2002-05-10 変異体配列解析装置、変異体配列解析方法、プログラム、および、記録媒体

Country Status (4)

Country Link
US (1) US20050164198A1 (ja)
EP (1) EP1505517A4 (ja)
JP (1) JP2003330934A (ja)
WO (1) WO2003096223A1 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010205206A (ja) * 2009-03-06 2010-09-16 Nippon Software Management Kk 塩基配列決定方法、塩基配列決定装置およびそのプログラム
WO2014132497A1 (ja) 2013-02-28 2014-09-04 株式会社日立ハイテクノロジーズ データ解析装置、及びその方法
JPWO2014115747A1 (ja) * 2013-01-25 2017-01-26 国立研究開発法人国立国際医療研究センター 結核菌の菌株の同定方法及び遺伝子変異の検出方法
JP2017097873A (ja) * 2015-11-18 2017-06-01 国立研究開発法人農業・食品産業技術総合研究機構 インフルエンザウイルス解析装置、インフルエンザウイルス解析方法及びインフルエンザウイルス解析プログラム
JP2018513445A (ja) * 2015-02-09 2018-05-24 10エックス ゲノミクス,インコーポレイテッド 構造変異の特定及びバリアントコールデータを用いたフェージングのためのシステム及び方法
KR20180060759A (ko) * 2016-11-29 2018-06-07 연세대학교 산학협력단 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스
KR20180060764A (ko) * 2016-11-29 2018-06-07 연세대학교 산학협력단 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5799484B2 (ja) * 2009-12-14 2015-10-28 トヨタ自動車株式会社 Dnaマイクロアレイにおけるプローブ設計方法、当該方法により設計されたプローブを有するdnaマイクロアレイ
US9824068B2 (en) 2013-12-16 2017-11-21 10X Genomics, Inc. Methods and apparatus for sorting data
CN104881592B (zh) * 2015-02-11 2018-04-06 哈尔滨工业大学深圳研究生院 一种dna序列比对中的打分方法
WO2019108851A1 (en) 2017-11-30 2019-06-06 10X Genomics, Inc. Systems and methods for nucleic acid preparation and analysis
CN110689918B (zh) * 2019-09-24 2022-12-09 上海宽慧智能科技有限公司 蛋白质三级结构的预测方法及系统
CN113299344A (zh) * 2021-06-23 2021-08-24 深圳华大医学检验实验室 基因测序分析方法、装置、存储介质和计算机设备

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3476310B2 (ja) * 1996-08-01 2003-12-10 富士通株式会社 蛋白質データベース・システム並びに蛋白質の名前および機能の表示方法
US6265546B1 (en) * 1997-12-22 2001-07-24 Genset Prostate cancer gene
AU2001236555A1 (en) * 2000-02-22 2001-09-03 Pe Corporation (Ny) Method and system for the assembly of a whole genome using a shot-gun data set
AU2001241075B2 (en) * 2000-03-10 2006-08-10 Daiichi Pharmaceutical Co., Ltd. Method of anticipating interaction between proteins

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010205206A (ja) * 2009-03-06 2010-09-16 Nippon Software Management Kk 塩基配列決定方法、塩基配列決定装置およびそのプログラム
JPWO2014115747A1 (ja) * 2013-01-25 2017-01-26 国立研究開発法人国立国際医療研究センター 結核菌の菌株の同定方法及び遺伝子変異の検出方法
WO2014132497A1 (ja) 2013-02-28 2014-09-04 株式会社日立ハイテクノロジーズ データ解析装置、及びその方法
US10192028B2 (en) 2013-02-28 2019-01-29 Hitachi High-Technologies Corporation Data analysis device and method therefor
JP2018513445A (ja) * 2015-02-09 2018-05-24 10エックス ゲノミクス,インコーポレイテッド 構造変異の特定及びバリアントコールデータを用いたフェージングのためのシステム及び方法
JP2017097873A (ja) * 2015-11-18 2017-06-01 国立研究開発法人農業・食品産業技術総合研究機構 インフルエンザウイルス解析装置、インフルエンザウイルス解析方法及びインフルエンザウイルス解析プログラム
KR20180060759A (ko) * 2016-11-29 2018-06-07 연세대학교 산학협력단 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스
KR20180060764A (ko) * 2016-11-29 2018-06-07 연세대학교 산학협력단 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스

Also Published As

Publication number Publication date
EP1505517A1 (en) 2005-02-09
EP1505517A4 (en) 2008-01-30
US20050164198A1 (en) 2005-07-28
WO2003096223A1 (fr) 2003-11-20

Similar Documents

Publication Publication Date Title
Wojcik et al. Protein-protein interaction map inference using interacting domain profile pairs
Lehner et al. A first-draft human protein-interaction map
Frishman et al. Combining diverse evidence for gene recognition in completely sequenced bacterial genomes
Keller et al. A novel hybrid gene prediction method employing protein multiple sequence alignments
Pazos et al. In silico two‐hybrid system for the selection of physically interacting protein pairs
Chen et al. Computational analyses of high-throughput protein-protein interaction data
JP2003330934A (ja) 変異体配列解析装置、変異体配列解析方法、プログラム、および、記録媒体
Das et al. CATH functional families predict functional sites in proteins
EP1477910A1 (en) Apparatus for managing gene expression data
Tang et al. usDSM: a novel method for deleterious synonymous mutation prediction using undersampling scheme
Yeger‐Lotem et al. Detection of regulatory circuits by integrating the cellular networks of protein–protein interactions and transcription regulation
JP3880417B2 (ja) 遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体
Kann et al. A structure-based method for protein sequence alignment
Pagel et al. DIMA 2.0—predicted and known domain interactions
Meinicke UFO: a web server for ultra-fast functional profiling of whole genome protein sequences
EP2209075A1 (en) Base sequence determination program, base sequence determination system and base sequence determination method
Goonesekere et al. Context‐specific amino acid substitution matrices and their use in the detection of protein homologs
JP5247009B2 (ja) 配列抽出装置、配列抽出方法、プログラムおよび記録媒体
Schächter Bioinformatics of large-scale protein interaction networks
JP4250443B2 (ja) 抗体設計装置、抗体設計方法、プログラム、および、記録媒体
WO2003056461A1 (fr) Dispositif de prediction de structure proteique, procede de prediction de structure proteique, programme et support d'enregistrement associes
Basenko et al. What is new in FungiDB: a web-based bioinformatics platform for omics-scale data analysis for fungal and oomycete species
AU2006228077B2 (en) Information management system, method, computer program, and storage device for large-scale in situ hybridization analysis
AU2003235071B2 (en) Information management system, method, computer program, and storage device for large-scale in situ hybridization analysis
JP2004002238A (ja) 活性部位予測方法、活性部位予測装置、プログラム、および、記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060110

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061024