WO2016114009A1

WO2016114009A1 - 融合遺伝子解析装置、融合遺伝子解析方法、及びプログラム

Info

Publication number: WO2016114009A1
Application number: PCT/JP2015/082934
Authority: WO
Inventors: 一哉土原; 慎吾松本; 幸代三牧
Original assignee: 国立研究開発法人国立がん研究センター
Priority date: 2015-01-16
Filing date: 2015-11-24
Publication date: 2016-07-21
Also published as: JP6691871B2; JPWO2016114009A1

Abstract

シーケンサから出力されるリード配列を取得するリード配列取得部と、取得したすべてのリード配列について相補配列を作成し、仮想相補配列として出力する仮想相補配列生成部と、リード配列と仮想相補配列をマッピング装置に供給し、マッピング装置による参照配列上へのマッピング結果を取得するマッピング情報取得部と、マッピング結果において、リード配列および対応する仮想相補配列が、それぞれ参照配列の２か所に分割されてマッピングされているものを候補リード配列として抽出し、抽出された候補リード配列の分割点をブレークポイント候補とする、候補リード配列抽出部と、ブレークポイント候補が所定の塩基数以内の近傍にある候補リード配列を１つのグループにまとめるグループ作成部と、グループを構成する候補リード配列の特徴や数に基づいて、各々のグループに含まれる候補リード配列が融合遺伝子由来のものであるか否かを判断するための情報を生成する、融合遺伝子判断情報生成部と、を備える。

Description

融合遺伝子解析装置、融合遺伝子解析方法、及びプログラム

　本発明は、融合遺伝子解析装置、融合遺伝子解析方法、及びプログラムに関する。

　近年、がん治療において融合遺伝子が注目されている。例えば、特許文献１には、シーケンシング機から得られた患者のゲノムデータを、ネットワーク上に分散したデータソースなどを利用して解析し、癌などに関わる突然変異の位置や、突然変異の結果として生じる疾病についての情報を提供するシステムが開示されている。

特開２０１４－１４６３１８号公報

　しかしながら、特許文献１に記載された方法では、シーケンシング機から得られるゲノムデータを特に絞り込むことなく解析しているため、解析に長い時間がかかるという問題点があった。また、シーケンシングやアラインメントの段階での解析エラーを排除する処理もないため、解析の精度も十分とはいえなかった。また、特許文献１には、融合遺伝子の検出と抽出については十分に記載されていない。

　そこで本発明の目的は、融合遺伝子解析の精度向上と時間短縮を実現することである。

本発明に係る融合遺伝子解析システムは、シーケンサから出力されるリード配列を取得するリード配列取得部と、取得したすべてのリード配列について相補配列を作成し、仮想相補配列として出力する仮想相補配列生成部と、前記リード配列と前記仮想相補配列をマッピング装置に供給し、前記マッピング装置による参照配列上へのマッピング結果を取得するマッピング情報取得部と、前記マッピング結果において、前記リード配列および対応する仮想相補配列が、それぞれ前記参照配列の２か所に分割されてマッピングされているものを候補リード配列として抽出し、抽出された候補リード配列の分割点をブレークポイント候補とする、候補リード配列抽出部と、前記ブレークポイント候補が所定の塩基数以内の近傍にある候補リード配列を１つのグループにまとめるグループ作成部と、前記グループを構成する候補リード配列の特徴や数に基づいて、各々のグループに含まれる候補リード配列が融合遺伝子由来のものであるか否かを判断するための情報を生成する、融合遺伝子判断情報生成部と、を備えたものである。

　また、候補リード配列抽出部は、２か所にマッピングされた前記リード配列と前記仮想相補配列の対応する断片が、同じ染色体上にマッピングされているものを候補リード配列として抽出するようにしてもよい。

　また、前記候補リード配列抽出部は、
　２か所にマッピングされた前記リード配列と前記仮想相補配列の各断片が、所定の塩基数以上の長さを有するものを候補リード配列として抽出するようにしてもよい。

　また、前記融合遺伝子判断情報生成部は、各々のグループに含まれる候補リード配列が融合遺伝子由来のものである可能性の高さに応じて各グループをランク付けするようにしてもよい。

　また、前記融合遺伝子判断情報生成部は、前記グループを構成する候補リード配列の数が多いグループのランクを高く設定するようにしてもよい。
　また、前記融合遺伝子判断情報生成部は、前記グループを構成する候補リード配列の一方の分割点に対して、もう一方の分割点が一定数以上存在する場合には、グループのランクを低く設定するようにしてもよい。

　本発明に係る融合遺伝子解析方法は、シーケンサから出力されるリード配列を取得する工程と、取得したすべてのリード配列について相補配列を作成し、仮想相補配列として出力する工程と、前記リード配列と前記仮想相補配列をマッピング装置に供給し、前記マッピング装置による参照配列上へのマッピング結果を取得する工程と、前記マッピング結果において、前記リード配列および対応する仮想相補配列が、それぞれ前記参照配列の２か所に分割されてマッピングされているものを候補リード配列として抽出し、抽出された候補リード配列の分割点をブレークポイント候補とする工程と、前記ブレークポイント候補が所定の塩基数以内の近傍にある候補リード配列を１つのグループにまとめる工程と、前記グループを構成する候補リード配列の特徴や数に基づいて、各々のグループに含まれる候補リード配列が融合遺伝子由来のものであるか否かを判断するための情報を生成する工程と、を含むものである。

　本発明に係るプログラムは、コンピュータを、シーケンサから出力されるリード配列を取得するリード配列取得部と、取得したすべてのリード配列について相補配列を作成し、仮想相補配列として出力する仮想相補配列生成部と、前記リード配列と前記仮想相補配列をマッピング装置に供給し、前記マッピング装置による参照配列上へのマッピング結果を取得するマッピング情報取得部と、前記マッピング結果において、前記リード配列および対応する仮想相補配列が、それぞれ前記参照配列の２か所に分割されてマッピングされているものを候補リード配列として抽出し、抽出された候補リード配列の分割点をブレークポイント候補とする、候補リード配列抽出部と、前記ブレークポイント候補が所定の塩基数以内の近傍にある候補リード配列を１つのグループにまとめるグループ作成部と、前記グループを構成する候補リード配列の特徴や数に基づいて、各々のグループに含まれる候補リード配列が融合遺伝子由来のものであるか否かを判断するための情報を生成する、融合遺伝子判断情報生成部と、して機能させるものである。

本発明によれば、融合遺伝子解析の精度向上と時間短縮を実現することができる。

本発明の実施の形態による、融合遺伝子解析システムの概要を示す図。本発明の実施の形態による、融合遺伝子解析装置の構成を示すブロック図。本発明の実施の形態による、マッピング結果を説明する図。本発明の実施の形態による、融合遺伝子解析システムの動作のフローチャート。本発明の実施の形態による、融合遺伝子解析システムによる、解析の結果を示す図。

　次に、本発明を実施するための形態について、図面を参照して詳細に説明する。
　図１は、本発明の実施の形態による融合遺伝子解析システム１０の構成を示すブロック図である。図に示すように、融合遺伝子解析システム１０は、融合遺伝子解析装置１００と、ＤＮＡシーケンサ２００、遺伝子マッピング装置３００を備えている。融合遺伝子解析装置１００と、ＤＮＡシーケンサ２００、および遺伝子マッピング装置３００は、通信回線５０を介して接続されている。

　図２は、融合遺伝子解析装置１００の構成を示すブロック図である。図に示すように、融合遺伝子解析装置１００は、リード配列取得部１０１、仮想相補配列生成部１０２、マッピング情報取得部１０３、候補リード配列抽出部１０４、グループ作成部１０５、融合遺伝子判断情報生成部１０６、表示装置１０７、入力装置１０８を備えている。

　融合遺伝子解析装置１００は、ＣＰＵ、ＲＯＭやＲＡＭ等のメモリ、各種の情報を格納する外部記憶装置、入力インタフェース、出力インタフェース、通信インタフェース及びこれらを結ぶバスを備える専用又は汎用のコンピュータを適用することができる。なお、融合遺伝子解析装置１００は、単一のコンピュータにより構成されるものであっても、通信回線を介して互いに接続された複数のコンピュータにより構成されるものであってもよい。

　リード配列取得部１０１、仮想相補配列生成部１０２、マッピング情報取得部１０３、候補リード配列抽出部１０４、グループ作成部１０５、融合遺伝子判断情報生成部１０６は、ＣＰＵがＲＯＭ等に格納された所定のプログラムを実行することにより実現される機能のモジュールに相当する。

　表示装置１０７は、ディスプレイ等の表示装置であり、融合遺伝子解析装置１００のＣＰＵから出力される画像信号を受けて、各種画像を表示するものである。
　入力装置１０８は、マウスやキーボード等を含む各種デバイスであり、ユーザが融合遺伝子解析装置１００に対して各種情報の入力を行う際に使用される。

　リード配列取得部１０１は、ＤＮＡシーケンサ２００から出力されるリード配列を取得する。ＤＮＡシーケンサ２００は、シングルエンドリード方式のものでも、ペアエンドリード方式のものでもよい。また、塩基配列の解析に用いるサンプルとしてはゲノムＤＮＡを用いる。さらに、特定領域の塩基配列のみを増幅したターゲットキャプチャーサンプルを用いることにより、解析の効率を高めることができる。

　仮想相補配列生成部１０２は、取得したすべてのリード配列について相補配列を作成し、仮想相補配列として出力する。具体的には、仮想相補配列生成部１０２は、各塩基Ａ（アデニン）、Ｔ（チミン）、Ｇ（グアニン）、Ｃ（シトシン）の配列で構成されるリード配列を入力とし、各塩基を相補的な塩基（Ａ→Ｔ、Ｔ→Ａ、Ｇ→Ｃ、Ｃ→Ｇ）に変換し、逆順に並べ替えたものを、仮想相補配列として出力する。

　これにより、シングルエンドリード方式のＤＮＡシーケンサ２００を用いた場合でも、ペアエンドリード方式のように、リード配列と相補配列の組を用いてマッピングを行うことができる。さらに、本実施形態では、取得したすべてのリード配列について仮想相補配列を作成しているため、一般のペアエンドリード方式のように、限られた範囲のみの相補配列が得られるだけではなく、リード配列全体の相補配列を得ることができる。

　マッピング情報取得部１０３は、リード配列と仮想相補配列を遺伝子マッピング装置３００に供給し、遺伝子マッピング装置３００による参照配列上へのマッピングの結果を取得する。マッピング装置３００は、例えばBWA(Burrows-Wheeler Alignment)-SW(smith-waterman)アルゴリズムにより、リード配列と仮想相補配列を参照配列上へマッピングする。

　候補リード配列抽出部１０４は、マッピング結果において、リード配列および対応する仮想相補配列が、それぞれ参照配列の２か所に分割されてマッピングされているものを候補リード配列として抽出し、抽出された候補リード配列の分割点をブレークポイント候補とする。

　融合遺伝子は、染色体間で塩基配列の位置が入れ替わる染色体転座や、染色体内の塩基配列の一部が消える間質性欠失、同一染色体内で塩基配列の位置が入れ替わる染色体逆位などによって、もともとは離れていた遺伝子同士が融合することにより形成される。

　リード配列に融合遺伝子が含まれている場合、マッピング結果においては、融合遺伝子由来のリード配列は融合箇所（ブレークポイント）を境界として２つに分割され、それぞれの断片が参照配列上の異なる位置にマッピングされる。また、仮想相補配列についても同じブレークポイントを境界として分割され、それぞれの断片が参照配列上で、対応するリード配列と同じ位置にマッピングされる。図３は、マッピング結果の例を示す図である。

　図３に示すように、リード配列（ｒ１）と仮想相補配列（ｒ１’）がそれぞれ２か所に分割され、それぞれの対応する配列が同じ領域にマッピングされている場合、候補リード配列抽出部１０４は、そのリード配列を候補リード配列として抽出する。さらに、その候補リード配列の２か所の分割点（ｂ１、ｂ２）をブレークポイント候補とする。

　なお、候補リード配列抽出部１０４が候補リード配列を抽出する際、さらに以下の条件（Ａ）～（Ｄ）を満たすもののみを抽出するようにしてもよい。

（Ａ）候補リード配列抽出部１０４は、分割されたリード配列と仮想相補配列がそれぞれ２か所（リード配列と仮想相補配列で合計４か所）のみにマッピングされ、かつ、２か所の断片を合わせることで完全なリード配列または仮想相補配列になる場合にのみ、候補リード配列とするようにしてもよい。

（Ｂ）候補リード配列抽出部１０４は、それぞれ２か所にマッピングされたリード配列と仮想相補配列の対応する断片が、同じ染色体上にマッピングされているものを候補リード配列として抽出するようにしてもよい。

（Ｃ）候補リード配列抽出部１０４は、それぞれ２か所にマッピングされたリード配列と仮想相補配列の各断片が、所定の塩基数以上の長さ（例えば１０塩基以上）を有するものを候補リード配列として抽出するようにしてもよい。これにより、１塩基のみの変異などによって分割されているものを除外することができる。

（Ｄ）候補リード配列抽出部１０４は、融合遺伝子が同一染色体内で塩基配列の位置が入れ替わる染色体逆位の場合、２か所のブレークポイント候補が１００万塩基以上離れているものを候補リード配列として抽出するようにしてもよい。

　グループ作成部１０５は、ブレークポイント候補が所定の塩基数以内の近傍にある候補リード配列を１つのグループにまとめる。
　図３において、候補リード配列ｒ２～ｒ４は、候補リード配列ｒ１とほぼ同じ位置にブレークポイント候補を有している。このような場合、グループ作成部１０５は、候補リード配列ｒ１～ｒ４を同じブレークポイント候補を有するものとして１つのグループにまとめる。具体的には、例えば、候補リード配列の分割点が４０塩基の誤差の範囲で同じであれば同じグループとするようにしてもよい。

　融合遺伝子判断情報生成部１０６は、グループを構成する候補リード配列の特徴や数に基づいて、各々のグループに含まれる候補リード配列が融合遺伝子由来のものであるか否かを判断するための情報（ランク付け）を生成する。

　まず、融合遺伝子判断情報生成部１０６は、各々のグループに含まれる候補リード配列が融合遺伝子由来のものである可能性の高さに応じて各グループをランク付けする。具体的には、各グループについて、以下の４つの絞り込み条件に当てはまるか否かの判定を行う。

（１）On gene判定
　融合遺伝子判断情報生成部１０６は、各グループのリード配列の分割された２つの断片について、遺伝子領域との重複があるかどうかを判定する。両方の断片が遺伝子領域と重複している場合には、条件を満たす（融合遺伝子である可能性が高い）と判定する。

（２）既知のターゲット遺伝子判定
　融合遺伝子判断情報生成部１０６は、（１）の条件を満たすグループについて、リード配列の分割された２つの断片が、融合遺伝子を構成する遺伝子として知られている遺伝子に該当するか否かを判定する。具体的には、RET,ROS1,ALKなどの受容体型チロシンキナーゼ遺伝子が含まれている場合には、条件を満たすと判定する。これらのキナーゼ遺伝子は、融合遺伝子判定に有効であると共に、治療薬の選択にも役立つという効果がある。

（３）In frame判定
　融合遺伝子判断情報生成部１０６は、（２）の条件を満たすグループについて、リード配列の断片のエクソン領域にフレームシフトが起こっていないかどうかを判定する。フレームシフトが起こっていない場合には、条件を満たすと判定する。エクソン領域にフレームシフトが起こっている場合、タンパク質が合成されないため癌治療のターゲットとしてはあまり適当ではないと考えられる。

（４）Coiled-Coil構造判定
　融合遺伝子判断情報生成部１０６は、（３）の条件を満たすグループについて、リード配列の断片の上流の遺伝子が、Coiled-Coil構造を持つか否かを判定し、Coiled-Coil構造を有する場合には、条件を満たすと判定する。例えば、RET,ROS1,ALKなどの受容体型チロシンキナーゼ遺伝子と融合する遺伝子断片の多くは、タンパク質間の相互作用をひきおこすCoiled-Coil構造を有しており、細胞外から増殖のシグナルを伝えるリガンドに非依存的にキナーゼを活性化することが知られている。

　融合遺伝子判断情報生成部１０６は、上記の（１）～（４）の判定条件について、多くの判定条件を満たしているグループほど高いランクを付与する。なお、上記のすべての条件について判定を行わず、一部の条件（例えば、（１）と（２））のみを用いてランク付けを行ってもよい。

　次に、融合遺伝子判断情報生成部１０６は、グループを構成する候補リード配列の数が多いグループのランクを高く設定する。例えば、候補リード配列の数が多いものほど、高いランクに設定する。また、グループを構成する候補リード配列の一方の分割点に対して、もう一方の分割点が一定数以上存在する場合は、マッピングの非特異性が疑われるため、ランクを低く設定するようにしてもよい。例えば、グループ内に、図３に示す分割点（ｂ１、ｂ２）の組を有する候補リード配列と、（ｂ３、ｂ４）という分割点の組を有する候補リード配列があり、ｂ１とｂ３は近接しているが、ｂ２とｂ４は離れている場合には、そのグループのランクを低く設定するようにしてもよい。

　融合遺伝子判断情報生成部１０６は、絞り込み条件によるランク付けと、グループを構成する候補リード配列数によるランク付けに基づいて、すべてのグループのランク付けを行う。例えば、絞り込み条件によるランク付けと、候補リード配列数によるランク付けをそれぞれポイントにし、総合ポイントが高いものほど上位のランクにするようにしてもよい。融合遺伝子判断情報生成部１０６は、候補リード配列をランクの高いものから順に並べたリストを、表示装置１０７に表示する。

　次に、融合遺伝子解析システム１０の動作について説明する。
　図４は、融合遺伝子解析システム１０の動作のフローチャートである。
　まず、リード配列取得部１０１が、ＤＮＡシーケンサ２００からリード配列を取得する（ステップＳ１）。
　次に、仮想相補配列生成部１０２が、取得したすべてのリード配列について相補配列を作成し、仮想相補配列として出力する（ステップＳ２）。

　次に、マッピング情報取得部１０３が、リード配列と仮想相補配列を遺伝子マッピング装置３００に入力する（ステップＳ３）。
　次に、遺伝子マッピング装置３００が、入力されたリード配列と仮想相補配列のマッピングを行う（ステップＳ４）。
　次に、マッピング情報取得部１０３が、遺伝子マッピング装置３００によるマッピングの結果を取得する（ステップＳ５）。

　次に、候補リード配列抽出部１０４が、遺伝子マッピング装置３００によるマッピング結果から、候補リード配列を抽出する（ステップＳ６）。
　さらに、候補リード配列抽出部１０４は、抽出した候補リード配列のブレークポイント候補を設定する（ステップＳ７）。

　次に、グループ作成部１０５は、ブレークポイント候補が所定の塩基数以内の近傍にある候補リード配列を１つのグループにまとめる（ステップＳ８）。
　次に、融合遺伝子判断情報生成部１０６は、融合遺伝子の絞り込み条件を用いて、各グループに含まれる候補リード配列が融合遺伝子由来のものである可能性のランク付けを行う（ステップＳ９）。

　次に、融合遺伝子判断情報生成部１０６は、グループを構成する候補リード配列の数に基づいて、各グループのランク付けを行う（ステップＳ１０）
　さらに、融合遺伝子判断情報生成部１０６は、絞り込み条件によるランク付けと、グループを構成する候補リード配列数によるランク付けに基づいて、すべてのグループのランク付けを行い、結果を表示装置１０７に表示する（ステップＳ１１）。

　以上のように、本実施形態によれば、シーケンサから出力されるすべてのリード配列に対して仮想相補配列を作成し、リード配列と仮想相補配列のマッピング結果に基づいて候補リード配列を抽出するようにしたので、マッピングをリード配列と仮想相補配列の２重で行うためマッピングの精度が向上し、融合遺伝子解析の精度も向上させることができる。

　また、ブレークポイント候補が近い候補リード配列を１つのグループにまとめ、グループを構成する候補リード配列の特徴や数に基づいて、候補リード配列をさらに絞り込むようにしたので、最終的に解析すべき候補リード配列の数を高い精度で限定することが可能となり、融合遺伝子解析の効率を向上させ、時間短縮を図ることができる。

（実施例）
　図５は、融合遺伝子解析システム１０による、解析の結果を示す図である。
　図５の例では、ＤＮＡシーケンサ２００として、MiSeq（イルミナ株式会社製）とIon Torrent（サーモフィッシャーサイエンティフィック株式会社製）を用い、３種類の細胞株AD09-232T（ALK-EML4融合遺伝子陽性）、HCC78（ROS1-SCL34A2融合遺伝子陽性）、LC2/ad（CCDC6-RET融合遺伝子陽性）のサンプルを解析した結果を示している。なお、MiSeqはペアエンドリード方式のシーケンサ、Ion Torrentはシングルエンドリード方式のシーケンサである。

　入力データの「総リード数」は、ＤＮＡシーケンサ２００から出力されるリード配列の数を示している。また、「リード配列／仮想相補配列」は、リード配列と仮想相補配列生成部１０２によって作成された仮想相補配列を合わせた数であり、総リード数の２倍に相当する。「マッピング結果」は、遺伝子マッピング装置３００によるマッピング後の延べリード数（リード配列と仮想相補配列の合計）を示している。ここでは、BWA-SW方式によりマッピングを行っている。

　「マップ箇所数別分類」には、各々のリードについて、リード配列と対応する仮想相補配列が、合わせて何か所にマップされているかによって分類した結果を示している。上述のように、リード配列と対応する仮想相補配列がそれぞれ２か所、すなわち合計で「４か所」にマッピングされているものが、候補リード配列として抽出される対象となる。さらに、候補リード配列抽出部１０４によって、上述の所定の条件で絞り込みが行われ、最終的に抽出された候補リード配列の数が「候補リード配列数」として示されている。

　さらに、グループ作成部１０５によってまとめられたグループの数が「グループ数」として示されている。さらに、融合遺伝子判断情報生成部１０６によってOn gene判定の条件を満たすと判定された候補リード配列の数が「On gene候補数」として示されている。さらに、On gene候補のうち、融合遺伝子判断情報生成部１０６によって、既知のターゲット遺伝子判定の条件を満たすと判定された候補リード配列の数が「RET/ROS1/ALK候補数」として示されている。「RET/ROS1/ALK候補数」を見ると、各サンプルについて、融合遺伝子の候補となるリード配列が６３９，９２４，２７１まで絞り込まれている。

　以上のように、各サンプルについて、融合遺伝子の候補リード数をシーケンサから出力される総リード数から大幅に減少させることができる。

　１０　融合遺伝子解析システム、５０　通信回線、１００　融合遺伝子解析装置、１０１　リード配列取得部、１０２　仮想相補配列生成部、１０３　マッピング情報取得部、１０４　候補リード配列抽出部、１０５　グループ作成部、１０６　融合遺伝子判断情報生成部、１０７　表示装置、１０８　入力装置、２００　ＤＮＡシーケンサ、３００　遺伝子マッピング装置

Claims

　シーケンサから出力されるリード配列を取得するリード配列取得部と、
　取得したすべてのリード配列について相補配列を作成し、仮想相補配列として出力する仮想相補配列生成部と、
　前記リード配列と前記仮想相補配列をマッピング装置に供給し、前記マッピング装置による参照配列上へのマッピング結果を取得するマッピング情報取得部と、
　前記マッピング結果において、前記リード配列および対応する仮想相補配列が、それぞれ前記参照配列の２か所に分割されてマッピングされているものを候補リード配列として抽出し、抽出された候補リード配列の分割点をブレークポイント候補とする、候補リード配列抽出部と、
　前記ブレークポイント候補が所定の塩基数以内の近傍にある候補リード配列を１つのグループにまとめるグループ作成部と、
　前記グループを構成する候補リード配列の特徴や数に基づいて、各々のグループに含まれる候補リード配列が融合遺伝子由来のものであるか否かを判断するための情報を生成する、融合遺伝子判断情報生成部と、を備えた融合遺伝子解析装置。
　前記候補リード配列抽出部は、
　２か所にマッピングされた前記リード配列と前記仮想相補配列の対応する断片が、同じ染色体上にマッピングされているものを候補リード配列として抽出する、請求項１に記載の融合遺伝子解析装置。
　前記候補リード配列抽出部は、
　２か所にマッピングされた前記リード配列と前記仮想相補配列の各断片が、所定の塩基数以上の長さを有するものを候補リード配列として抽出する、請求項１に記載の融合遺伝子解析装置。
　前記融合遺伝子判断情報生成部は、
　各々のグループに含まれる候補リード配列が融合遺伝子由来のものである可能性の高さに応じて各グループをランク付けする、請求項１に記載の融合遺伝子解析装置。
　前記融合遺伝子判断情報生成部は、
　前記グループを構成する候補リード配列の数が多いグループのランクを高く設定する、請求項４に記載の融合遺伝子解析装置。
　前記融合遺伝子判断情報生成部は、
　前記グループを構成する候補リード配列の一方の分割点に対して、もう一方の分割点が一定数以上存在する場合には、グループのランクを低く設定する、請求項４に記載の融合遺伝子解析装置。
　シーケンサから出力されるリード配列を取得する工程と、
　取得したすべてのリード配列について相補配列を作成し、仮想相補配列として出力する工程と、
　前記リード配列と前記仮想相補配列をマッピング装置に供給し、前記マッピング装置による参照配列上へのマッピング結果を取得する工程と、
　前記マッピング結果において、前記リード配列および対応する仮想相補配列が、それぞれ前記参照配列の２か所に分割されてマッピングされているものを候補リード配列として抽出し、抽出された候補リード配列の分割点をブレークポイント候補とする工程と、
　前記ブレークポイント候補が所定の塩基数以内の近傍にある候補リード配列を１つのグループにまとめる工程と、
　前記グループを構成する候補リード配列の特徴や数に基づいて、各々のグループに含まれる候補リード配列が融合遺伝子由来のものであるか否かを判断するための情報を生成する工程と、を含む融合遺伝子解析方法。
　コンピュータを、
　シーケンサから出力されるリード配列を取得するリード配列取得部と、
　取得したすべてのリード配列について相補配列を作成し、仮想相補配列として出力する仮想相補配列生成部と、
　前記リード配列と前記仮想相補配列をマッピング装置に供給し、前記マッピング装置による参照配列上へのマッピング結果を取得するマッピング情報取得部と、
　前記マッピング結果において、前記リード配列および対応する仮想相補配列が、それぞれ前記参照配列の２か所に分割されてマッピングされているものを候補リード配列として抽出し、抽出された候補リード配列の分割点をブレークポイント候補とする、候補リード配列抽出部と、
　前記ブレークポイント候補が所定の塩基数以内の近傍にある候補リード配列を１つのグループにまとめるグループ作成部と、
　前記グループを構成する候補リード配列の特徴や数に基づいて、各々のグループに含まれる候補リード配列が融合遺伝子由来のものであるか否かを判断するための情報を生成する、融合遺伝子判断情報生成部と、して機能させるプログラム。