JP2023524722A

JP2023524722A - 遺伝子の突然変異及び発現量を検出する方法及び装置

Info

Publication number: JP2023524722A
Application number: JP2022566482A
Authority: JP
Inventors: 媛媛洪; 琳蘇; 雪霞曽; 卓張; ▲チィ▼ 張; 小静林; 松霞尤; ▲イン▼ 楊; 維之陳
Original assignee: Genecast Biotechnology Co Ltd; Genecast Taizhou biotechnology Co ltd
Current assignee: Genecast Biotechnology Co Ltd; Genecast Taizhou biotechnology Co ltd
Priority date: 2020-10-29
Filing date: 2021-09-09
Publication date: 2023-06-13
Also published as: WO2022089033A1; CN112397144A; CN112397144B

Abstract

【要約】本発明は、遺伝子の突然変異及び発現量を検出する方法及び装置を開示する。該方法は、ＲＮＡを抽出し、破壊し、逆転写して、ｃＤＮＡを得るＳ１と、ｃＤＮＡで遺伝子ライブラリーを構築するＳ２と、キャプチャープローブを利用してターゲット領域に特異的にハイブリダイゼーションして遺伝子ライブラリーからターゲット遺伝子をキャプチャーかつ濃縮するＳ３と、ハイスループットシーケンサーでシークエンシングして、ＲＮＡ標的シークエンシングデータを取得するＳ４と、ＲＮＡ標的シークエンシングデータに示される遺伝子の突然変異及び発現量の変化を分析するＳ５と、を含み、Ｓ５は、具体的には、遺伝子発現量の分析Ｓ５１と、遺伝子過剰発現分析Ｓ５２と、遺伝子融合分析Ｓ５３と、融合に属する突然変異の発現量の分析Ｓ５４と、単一ヌクレオチド変異の分析Ｓ５５と、単一ヌクレオチド変異の突然変異の発現量の分析Ｓ５６と、を含む。本発明は、腫瘍関連遺伝子によって発現されるＲＮＡ転写物を効率的に濃縮し、腫瘍組織内のこれらの腫瘍遺伝子の発現量及び突然変異状況を分析することができる。【選択図】図１

Description

本発明は、生物学的技術分野に関し、具体的には、遺伝子の突然変異及び発現量を検出する方法及び装置に関する。

遺伝子突然変異とは、ゲノムＤＮＡ分子に、突然の、遺伝的変異（ｇｅｎｅｍｕｔａｔｉｏｎ）が発生する現象である。分子レベルから見ると、遺伝子変異とは、遺伝子の構造の塩基対の構成又は配列順次の変化が生じることである。遺伝子が十分に安定し、細胞分裂に正確に複製できるが、このような安定性は相対的である。所定の条件において、遺伝子は元の存在形態から別の新しい存在形態に突然変化することもでき、つまり、１つの部位に新しい遺伝子が突然生じ、既存の遺伝子を代替し、この遺伝子は突然変異遺伝子と呼ばれる。それにより、先祖には存在しなかった新しい性状が子孫の表現に突然に現れる。

遺伝子突然変異は生物学的進化の重要な要素の１つであるため、遺伝子突然変異の研究にはその理論的重要性に加えて幅広い生物学的意義を有する。一部の遺伝子突然変異は染色体の構造的変異によって引き起こされる。自然条件又は人的要因の影響により、染色体に生じる構造的変異としては、主に欠失、重複、逆位、転座が挙げられ、遺伝子融合も染色体に生じる構造的変異の一つである。

シークエンシング技術の開発、及びコストの削減に伴い、人間の健康の分野では、ヒト全ゲノムのシークエンシングは必ず今後の主な傾向であり、プレシジョンメディシンはシークエンシングの最終的な目的になる。ヒトゲノムの変異の正確なアノテーションは、プレシジョンメディシンを実現するための必要な手段である。

従来、通常の方法は、一般的には全ゲノムシークエンシングＷＧＳ又はＤＮＡｐａｎｅｌを利用してＳＮＶ、ＣＮＶ及び融合の検出を行う。しかし、ＤＮＡレベルでの突然変異の検出は、転写レベルでの突然変異の実際の表現を反映することができない。

本発明は、遺伝子の突然変異及び発現量を検出するために、遺伝子の突然変異及び発現量を検出する方法及び装置を提供することを目的とする。

本発明のＲＮＡ標的シークエンシング（ｔａｒｇｅｔｅｄＲＮＡｓｅｑｕｅｎｃｉｎｇ）に基づく遺伝子突然変異（遺伝子融合を含む）及び表現量の検出方法は、腫瘍関連遺伝子によって発現されるＲＮＡ転写物を効率的に濃縮し、かつこれらの遺伝子によって発現される転写物における、融合、一塩基及び多塩基置換（ＳＮＶ／ＭＮＶ）、挿入及び欠失突然変異（ｉｎｄｅｌ）等を含む複数種の突然変異タイプを完全に検出するとともに腫瘍組織内のこれらの腫瘍ドライバー遺伝子の発現量を分析することができる。

従来技術では、一般的には全ゲノムシークエンシングＷＧＳ又はＤＮＡｐａｎｅｌを利用してＳＮＶ、ＣＮＶ及び融合の検出を行う。従来方法のＤＮＡレベルでの突然変異の検出は、転写レベルでの突然変異の実際の表現を反映できず、ＲＮＡを利用して突然変異の検出を行うと、機能的関連性がより高くなる。例えば、２つのＳＮＶの突然変異頻度がいずれも１％であるが、発現量が異なるため、突然変異の臨床影響が異なる。本発明は、ＲＮＡｓｅｑの一般的な遺伝子発現量、遺伝子融合を検出できるだけではなく、ＤＮＡｐａｎｅｌのＳＮＶ及びＣＮＶを検出でき、かつ、様々な突然変異の発現量を検出することができる。１回の検出により、すべての突然変異タイプ及び相対発現量を覆うことを実現する。

本発明のシステムは、全トランスクリプトームを検出するＲＮＡｓｅｑと比較して、ターゲット遺伝子を標的とするＲＮＡｐａｎｅｌを実行し、シークエンシング費用が低く、かつターゲット領域を顕著に濃縮することができ、特に低発現の遺伝子又は突然変異に対する検出敏感性がより高い。かつ、ＤＮＡｐａｎｅｌの設計がエクソン及びイントロンを含む必要があることと比較して、ＲＮＡ標的シークエンシングｐａｎｅｌの設計はエクソン領域を含むだけでよく、それにより、プローブ及びシークエンシングコストをより節約し、臨床キットの開発により適用する。

上記目的を実現するために、本発明の一態様によれば、遺伝子の突然変異及び発現量を検出する方法を提供する。該方法は、検出対象サンプルのＲＮＡを抽出し、検出対象サンプルのＲＮＡを破壊し、逆転写して、ｃＤＮＡを得るＳ１と、ｃＤＮＡに対して末端修復、アダプターライゲーション及びライブラリー濃縮のステップを行って遺伝子ライブラリーを構築するＳ２と、キャプチャープローブを利用してターゲット領域に特異的にハイブリダイゼーションして遺伝子ライブラリーからターゲット遺伝子をキャプチャーかつ濃縮するＳ３と、ハイスループットシーケンサーでシークエンシングして、ＲＮＡ標的シークエンシングデータを取得するＳ４と、前記ＲＮＡ標的シークエンシングデータに示される遺伝子の突然変異及び発現量の変化を分析するＳ５と、を含み、Ｓ５は、具体的には、ＲＰＫＭ法を使用して検出サンプル中のターゲット遺伝子の発現量を定量的に評定する遺伝子発現量の分析Ｓ５１と、ベースラインサンプル集団を引き出し、ターゲット遺伝子のＲＰＫＭ値分布を分析して、ターゲット遺伝子発現量レベルの閾値を決定し、検出対象サンプルのターゲット遺伝子のＲＰＫＭ値に基づき、検出対象サンプルのターゲット遺伝子が過剰発現であるか否かを判断する遺伝子過剰発現分析Ｓ５２と、同じ遺伝子ファミリーに属する融合遺伝子、同じパラロググループに属する融合遺伝子、及び同じ遺伝子モデルに由来する融合遺伝子をフィルタリングし捨て、また、閾値に基づいて条件を満たさない融合遺伝子をフィルタリングして、検出サンプル中の融合遺伝子を取得する遺伝子融合分析Ｓ５３と、ハウスキーピング遺伝子発現の定量結果及びＳ５３で取得された遺伝子融合分析の結果に基づいて発現量の校正及び標準化を行って、融合遺伝子の相対発現量を得る融合に属する突然変異の相対発現量の分析Ｓ５４と、遺伝子アラインメントによって変異した単一ヌクレオチドを決定する単一ヌクレオチド変異の分析Ｓ５５と、単一ヌクレオチド変異の分析結果、ハウスキーピング遺伝子発現の定量結果、及び配列アラインメントの統計結果に基づき、単一ヌクレオチド変異の発現の定量分析を行って、単一ヌクレオチド変異の発現量を得る単一ヌクレオチド変異の発現量の分析Ｓ５６と、を含む。

さらに、Ｓ５は、低品質のシークエンシングデータとアダプター配列を含むｒｅａｄｓとをフィルタリングしかつ精度管理を行った後に、標準に適合するデータを得てＲＮＡ標的シークエンシングデータに示される遺伝子の突然変異及び発現量の変化を分析することをさらに含み、精度管理ステップは、低品質のシークエンシングデータとアダプター配列を含むｒｅａｄｓとをフィルタリングして得られたシークエンシングデータを参照ゲノムにアラインメントして、配列アラインメント結果を得て、アラインメント結果に対して品質管理評定を行い、１）配列再付着（ｒｅａｔｔａｃｈ）アラインメント率の閾値≧８０％、２）ターゲット領域のデータ量の閾値≧２Ｍ、３）発現したハウスキーピング遺伝子の個数≧４という３つの指標に適合する場合、後の分析を行うことを含む。

さらに、Ｓ５３において、閾値は下表に示される。

さらに、Ｓ５４において、発現量の校正及び標準化に使用される標準化式は下式である。

（ここで、ＳｅｅｄＲｅａｄｓ＋ＲｅｓｃｕｅＲｅａｄｓは融合ブレイクポイントにわたるｒｅａｄｓを表し、ＨＫＡはハウスキーピング遺伝子Ａを表し、ＨＫＢはハウスキーピング遺伝子Ｂを表し、ＨＫＣはハウスキーピング遺伝子Ｃを表し、ｃｏｕｎｔは参照ゲノムに対してアラインメントしたシークエンシング配列の配列数を表し、ｌｅｎｇｔｈは参照ゲノムに対してアラインメントしたシークエンシング配列の配列長を表す。）

さらに、Ｓ４においてペアエンドモード又はシングルエンドモードでシークエンシングする。さらに、Ｓ５６において、単一ヌクレオチド変異の発現量の計算式は以下のとおりである。

（ここで、ＧｅｎｅＡｖｅｒａｇｅＤｅｐｔｈは遺伝子の平均深さを表し、
ＡＬＴｃｏｕｎｔは突然変異の深さを表し、
ＨＫ＿ｅｘｐｒｅｓｓｉｏｎ＿Ｃｏｅｆｆｉｅｎｔは、サンプル中のハウスキーピング遺伝子の発現量及び標準品中のハウスキーピング遺伝子の発現量に基づいて発現量の変化係数を計算することを表す。）

本発明の別の態様によれば、遺伝子の突然変異及び発現量を検出する装置を提供する。該装置は、検出対象サンプルのＲＮＡを抽出し、検出対象サンプルのＲＮＡを破壊し、逆転写して、ｃＤＮＡを得るように設置されるＲＮＡ抽出モジュールと、ｃＤＮＡに対して末端修復、アダプターライゲーション及びライブラリー濃縮のステップを行って遺伝子ライブラリーを構築するように設置される遺伝子ライブラリー構築モジュールと、キャプチャープローブを利用してターゲット領域に特異的にハイブリダイゼーションして遺伝子ライブラリーからターゲット遺伝子をキャプチャーかつ濃縮するように設置されるターゲット遺伝子濃縮モジュールと、ハイスループットシーケンサーでシークエンシングして、ＲＮＡ標的シークエンシングデータを取得するように設置されるシークエンシングモジュールと、ＲＮＡ標的シークエンシングデータに示される遺伝子の突然変異及び発現量の変化を分析するように設置される分析モジュールと、を含み、分析モジュールは、具体的には、ＲＰＫＭ法を使用して検出サンプル中のターゲット遺伝子の発現量を定量的に評定するように設置される遺伝子発現量の分析サブモジュールと、ベースラインサンプル集団を引き出し、ターゲット遺伝子のＲＰＫＭ値分布を分析して、ターゲット遺伝子発現量レベルの閾値を決定し、検出対象サンプルのターゲット遺伝子のＲＰＫＭ値に基づき、検出対象サンプルのターゲット遺伝子が過剰発現であるか否かを判断するように設置される遺伝子過剰発現分析サブモジュールと、同じ遺伝子ファミリーに属する融合遺伝子、同じパラロググループに属する融合遺伝子、及び同じ遺伝子モデルに由来する融合遺伝子をフィルタリングし捨て、また、閾値に基づいて条件を満たさない融合遺伝子をフィルタリングして、検出サンプル中の融合遺伝子を取得するように設置される遺伝子融合分析サブモジュールと、ハウスキーピング遺伝子発現の定量結果及び遺伝子融合分析サブモジュールから取得された遺伝子融合分析の結果に基づいて発現量の校正及び標準化を行って、融合遺伝子の相対発現量を得るように設置される融合に属する突然変異の相対発現量の分析サブモジュールと、遺伝子アラインメントによって変異した単一ヌクレオチドを決定するように設置される単一ヌクレオチド変異分析サブモジュールと、単一ヌクレオチド変異の分析結果、ハウスキーピング遺伝子発現の定量結果、及び配列アラインメントの統計結果に基づき、単一ヌクレオチド変異の発現の定量分析を行って、単一ヌクレオチド変異の発現量を得るように設置される単一ヌクレオチド変異の発現量の分析サブモジュールと、を含む。

さらに、分析モジュールは、低品質のシークエンシングデータとアダプター配列を含むｒｅａｄｓとをフィルタリングしかつ精度管理を行った後に、標準に適合するデータを得てＲＮＡ標的シークエンシングデータに示される遺伝子の突然変異及び発現量の変化を分析するように設置されるフィルタリングサブモジュールをさらに含み、精度管理は、低品質のシークエンシングデータとアダプター配列を含むｒｅａｄｓとをフィルタリングして得られたシークエンシングデータを参照ゲノムにアラインメントして、配列アラインメント結果を得て、アラインメント結果に対して品質管理評定を行い、１）配列再付着アラインメント率の閾値≧８０％、２）ターゲット領域のデータ量の閾値≧２Ｍ、３）発現したハウスキーピング遺伝子の個数≧４という３つの指標に適合する場合、後の分析を行う。

さらに、遺伝子融合分析サブモジュールでは、閾値は下表に示される。

さらに、融合に属する突然変異の発現量の分析サブモジュールでは、発現量の校正及び標準化に使用される標準化式は以下のとおりである。

さらに、シークエンシングモジュールではペアエンドモード又はシングルエンドモードでシークエンシングする。

さらに、単一ヌクレオチド変異の発現量の分析サブモジュールでは、単一ヌクレオチド変異の発現量の計算式は以下のとおりである。

本発明の技術案を用いると、検出対象サンプルの全ＲＮＡ又はｍＲＮＡを検出対象として、ＲＮＡ標的シークエンシング（ｔａｒｇｅｔｅｄＲＮＡｓｅｑｕｅｎｃｉｎｇ）方法により、腫瘍関連遺伝子によって発現されるＲＮＡ転写物を効率的に濃縮し、かつこれらの遺伝子によって発現される転写物における、融合、一塩基及び多塩基置換（ＳＮＶ／ＭＮＶ）、挿入欠失突然変異（ｉｎｄｅｌ）等を含む複数種の突然変異タイプを完全に検出するとともに腫瘍組織内のこれらの腫瘍遺伝子の発現量を分析することができる。

本願の一部を構成する明細書の添付図面は本発明の更なる理解のために提供し、本発明の例示的な実施例及びその説明は本発明を説明するためのものであり、本発明の不適切な限定を構成できない。図面は、下記の通りである。

は本発明の実施形態に係る遺伝子の突然変異及び発現量を検出する方法の概略フローチャートである。は実施例におけるＲＮＡＰａｎｅｌとＲＮＡｓｅｑによるシークエンシング遺伝子の発現量の関連性を示す模式図である。は実施例における重要な腫瘍ドライバー遺伝子のＲＮＡＰａｎｅｌとＲＮＡｓｅｑによるシークエンシング遺伝子の発現量の関連性を示す模式図である。

なお、矛盾がない場合、本願の実施例及び実施例の特徴は、互いに組み合わせることができる。以下、図面を参照して実施例と結合して本発明を詳細に説明する。

液相プローブによってキャプチャーされるＲＮＡ標的シークエンシングは、従来のＲＮＡ－ｓｅｑと比較して、超高レベルのシークエンシングレベルで主な腫瘍ドライバー遺伝子によって発現される転写物及び融合に属する突然変異、活性化に属する突然変異、薬剤耐性突然変異を覆い、かつハウスキーピング遺伝子に対するすべての転写物の相対発現量情報を保持することができる。かつ、少量の腫瘍ターゲット遺伝子のみを覆うため、シークエンシングデータ量が少なく、コストが低く、臨床検出キットの開発により適用する。

ＤＮＡと比較して、ＲＮＡは下流の機能性タンパク質により近く、細胞機能経路の活性状態を解釈することにより適する。しかし、ＲＮＡで体細胞突然変異ＳＮＶ／Ｉｎｄｅｌを検出することが少なく、ＲＮＡ発現量でＤＮＡのコピー数分析を置換することもなく、主に、検出の精度に影響を与える要素がいくつかあるためであり、これらの要素は主に以下を含む。１）一本鎖、２）反転エラー、３）ＲＮＡ品質に起因するノイズ、４）発現量の影響により、非発現の突然変異が検出できないこと、及び５）転写レベルの突然変異により不一致を引き起こすこと等。これらの技術的課題に対して、本発明は、技術的な改善を行い、主に以下を含む。１）ＳＮＶ／Ｉｎｄｅｌの遺伝子リストを定着すること及びＲＮＡＳＮＶ突然変異のフィルタリング標準を最適化することによる、活性化に属する突然変異及び薬剤耐性突然変異ＳＮＶ／ｉｎｄｅｌの精度の向上、２）突然変異対立遺伝子転写物及び野生型対立遺伝子の相対発現量、３）融合に属する突然変異及び薬剤耐性点突然変異のシス（ｃｉｓ）分析及び相対発現量の関連分析、４）腫瘍ドライバー遺伝子のコピー数の増加と発現量との対応関係を確立し、ＲＮＡ発現量でＤＮＡのコピー数分析を置換することができること。

また、従来技術では、ＤＮＡｐａｎｅｌは融合検出において検出漏れの問題があり（原因は、ＤＮＡレベルの複雑な構造的変異によるＲＮＡレベルの融合、又はＤＮＡｐａｎｅｌプローブに、ブレイクポイントが覆われていないこと等である）、従って、融合検出はＲＮＡ法を補充とする必要がある。固形腫瘍に対する標的薬の実用的な突然変異（ａｃｔｉｏｎａｂｌｅｍｕｔａｔｉｏｎｓ）は、ＳＮＶ／ｉｎｄｅｌ／ＣＮＶを主として、従って、臨床サンプルＮＧＳの一次スクリーニングはＤＮＡ法を主とし、ＲＮＡ又はＦＩＳＨ／ＩＨＣ等のレビュー法を補助とし、プロセスが複雑であり、サンプルの需要量が高く、コストが高い等の問題をもたらす。本発明の古典的な実施例では、本発明は、ハイスループットシークエンシング（ＮＧＳ）によってｐａｎｅｌ内の腫瘍の主なＴＫＩ標的薬を含むすべての突然変異タイプをキャプチャーし、操作プロセスを大幅に簡略化し、サンプルを節約し、コストが削減する場合でのシークエンシングの深さを増やし、融合に属する突然変異と活性化点突然変異の精度を向上させ、かつドライバー遺伝子の発現量及び突然変異対立遺伝子の特異的発現量等のＤＮＡｐａｎｅｌが提供できない情報を取得し、腫瘍標的薬の選択に補助参照を提供する。

本発明のＲＮＡ標的シークエンシング（ｔａｒｇｅｔｅｄＲＮＡｓｅｑｕｅｎｃｉｎｇ）に基づく遺伝子の突然変異（遺伝子融合を含む）及び発現量の検出方法は、腫瘍関連遺伝子によって発現されるＲＮＡ転写物を効率的に濃縮し、かつこれらの遺伝子によって発現される転写物における、融合、一塩基及び多塩基置換（ＳＮＶ／ＭＮＶ）、挿入欠失突然変異（ｉｎｄｅｌ）等を含む複数種の突然変異タイプを完全に検出するとともに、腫瘍組織内のこれらの腫瘍ドライバー遺伝子の発現量を分析することができる。

本発明の実施形態では、ＲＮＡ標的シークエンシングデータの取得方法は、ＦＦＰＥサンプルから全ＲＮＡを抽出し、リボソームＲＮＡを除去する必要がなく、サンプル全ＲＮＡを破壊し、かつｃＤＮＡに逆転写するステップと、末端修復、アダプターライゲーション及びライブラリー濃縮を含むステップによって遺伝子ライブラリーを構築するステップと、キャプチャープローブはターゲット領域に特異的にハイブリダイゼーションできる核酸プローブを利用して、構築されるｃＤＮＡライブラリーからターゲット遺伝子をキャプチャーかつ濃縮するステップと、ハイスループットシーケンサーを利用してペアエンドモードでシークエンシングし、それによりＲＮＡ標的シークエンシングデータを取得するステップと、を含む。

本発明の典型的な実施形態によれば、遺伝子の突然変異及び発現量を検出する方法を提供する。図１に示すように、該方法は、検出対象サンプルのＲＮＡを抽出し、検出対象サンプルのＲＮＡを破壊し、逆転写して、ｃＤＮＡを得るＳ１と、ｃＤＮＡに対して末端修復、アダプターライゲーション及びライブラリー濃縮のステップを行って遺伝子ライブラリーを構築するＳ２と、キャプチャープローブを利用してターゲット領域に特異的にハイブリダイゼーションして遺伝子ライブラリーからターゲット遺伝子をキャプチャーかつ濃縮するＳ３と、ハイスループットシーケンサーでシークエンシングして、ＲＮＡ標的シークエンシングデータを取得するＳ４と、ＲＮＡ標的シークエンシングデータに示される遺伝子の突然変異及び発現量の変化を分析するＳ５と、を含み、Ｓ５は、具体的には、ＲＰＫＭ法を使用して検出サンプル中のターゲット遺伝子の発現量を定量的に評定する遺伝子発現量の分析Ｓ５１と、ベースラインサンプル集団を引き出し、ターゲット遺伝子のＲＰＫＭ値分布を分析して、ターゲット遺伝子発現量レベルの閾値を決定し、検出対象サンプルのターゲット遺伝子のＲＰＫＭ値に基づき、検出対象サンプルのターゲット遺伝子が過剰発現であるか否かを判断する遺伝子過剰発現分析Ｓ５２と、同じ遺伝子ファミリーに属する融合遺伝子、同じパラロググループに属する融合遺伝子、及び同じ遺伝子モデルに由来する融合遺伝子をフィルタリングし、また、閾値に基づいて条件を満たさない融合遺伝子をフィルタリングし捨てて、検出サンプル中の融合遺伝子を取得する遺伝子融合分析Ｓ５３と、ハウスキーピング遺伝子発現の定量結果及びＳ５３で取得された遺伝子融合分析の結果に基づいて発現量の校正及び標準化を行って、融合遺伝子の相対発現量を得る融合に属する突然変異の相対発現量の分析Ｓ５４と、遺伝子アラインメントによって変異した単一ヌクレオチドを決定する単一ヌクレオチド変異の分析Ｓ５５と、単一ヌクレオチド変異の分析結果、ハウスキーピング遺伝子発現の定量結果、及び配列アラインメントの統計結果に基づき、単一ヌクレオチド変異の発現の定量分析を行って、単一ヌクレオチド変異の発現量を得る単一ヌクレオチド変異の発現量の分析Ｓ５６と、を含む。

具体的には、本発明の一実施形態では、Ｓ５は、低品質のシークエンシングデータとアダプター配列を含むｒｅａｄｓとをフィルタリングしかつ精度管理を行った後、標準に適合するデータを得てＲＮＡ標的シークエンシングデータに示される遺伝子の突然変異及び発現量の変化を分析することをさらに含み、精度管理ステップは、低品質のシークエンシングデータとアダプター配列を含むｒｅａｄｓとをフィルタリングして得られたシークエンシングデータを参照ゲノムにアラインメントして、配列アラインメント結果を得て、アラインメント結果に対して品質管理評定を行い、１）配列再付着アラインメント率の閾値≧８０％、２）ターゲット領域のデータ量の閾値≧２Ｍ、３）ハウスキーピング遺伝子発現個数≧４という３つの指標に適合する場合、後の分析を行うことを含む。

好ましくは、Ｓ５３において、融合閾値は表１に示される。

好ましくは、Ｓ５４において、発現量の校正及び標準化に使用される標準化式は以下のとおりである。

好ましくは、Ｓ５６において、単一ヌクレオチド変異の発現量の計算式は以下のとおりである。

本発明の上記方法を容易に実施するために、本発明の一典型的な実施形態によれば、遺伝子の突然変異及び発現量を検出する装置を提供する。該装置は、ＲＮＡ抽出モジュールと、遺伝子ライブラリー構築モジュールと、ターゲット遺伝子濃縮モジュールと、シークエンシングモジュールと、分析モジュールとを含み、ＲＮＡ抽出モジュールは、検出対象サンプルの全ＲＮＡ又はｍＲＮＡを抽出し、検出対象サンプルのＲＮＡを破壊し、逆転写して、ｃＤＮＡを得るように設置され、遺伝子ライブラリー構築モジュールは、ｃＤＮＡに対して末端修復、アダプターライゲーション及びライブラリー濃縮のステップを行って遺伝子ライブラリーを構築するように設置され、ターゲット遺伝子濃縮モジュールは、キャプチャープローブを利用してターゲット領域に特異的にハイブリダイゼーションして遺伝子ライブラリーからターゲット遺伝子をキャプチャーかつ濃縮するように設置され、シークエンシングモジュールは、ハイスループットシーケンサーでシークエンシングして、ＲＮＡ標的シークエンシングデータを取得するように設置され、分析モジュールは、ＲＮＡ標的シークエンシングデータに示される遺伝子の突然変異及び発現量の変化を分析するように設置され、分析モジュールは、具体的には、遺伝子発現量の分析サブモジュールと、遺伝子過剰発現分析サブモジュールと、遺伝子融合分析サブモジュールと、融合に属する突然変異の発現量の分析サブモジュールと、単一ヌクレオチド変異分析サブモジュールと、単一ヌクレオチド突然変異の発現量の分析サブモジュールとを含み、遺伝子発現量の分析サブモジュールは、ＲＰＫＭ法を使用して検出サンプル中のターゲット遺伝子の発現量を定量的に評定するように設置され、遺伝子過剰発現分析サブモジュールは、ベースラインサンプル集団を引き出し、ターゲット遺伝子のＲＰＫＭ値分布を分析して、ターゲット遺伝子発現量レベルの閾値を決定し、検出対象サンプルのターゲット遺伝子のＲＰＫＭ値に基づき、検出対象サンプルのターゲット遺伝子が過剰発現であるか否かを判断するように設置され、遺伝子融合分析サブモジュールは、同じ遺伝子ファミリーに属する融合遺伝子、同じパラロググループに属する融合遺伝子、同じ遺伝子モデルに由来する融合遺伝子をフィルタリングし捨て、また、閾値に基づいて条件を満たさない融合遺伝子をフィルタリングして、検出サンプル中の融合遺伝子を取得するように設置され、融合に属する突然変異の相対発現量の分析サブモジュールは、ハウスキーピング遺伝子発現の定量結果及び遺伝子融合分析サブモジュールから取得された遺伝子融合分析の結果に基づいて発現量の校正及び標準化を行って、融合遺伝子の相対発現量を得るように設置され、単一ヌクレオチド変異分析サブモジュールは、遺伝子のアラインメントによって変異単一ヌクレオチドを決定するように設置され、単一ヌクレオチド変異の発現量の分析サブモジュールは、単一ヌクレオチド変異の分析結果、ハウスキーピング遺伝子発現の定量結果、及び配列アラインメントの統計結果に基づき、単一ヌクレオチド変異の発現の定量分析を行って、単一ヌクレオチド変異の発現量を得るように設置される。

具体的には、本発明の一実施形態では、分析モジュールは、低品質のシークエンシングデータとアダプター配列を含むｒｅａｄｓとをフィルタリングしかつ精度管理を行った後、標準に適合するデータを得てＲＮＡ標的シークエンシングデータに示される遺伝子の突然変異及び発現量の変化を分析するように設置されるフィルタリングサブモジュールをさらに含み、精度管理は、低品質のシークエンシングデータとアダプター配列を含むｒｅａｄｓとをフィルタリングして得られたシークエンシングデータを参照ゲノムにアラインメントして、配列アラインメント結果を得て、アラインメント結果に対して品質管理評定を行い、１）配列再付着アラインメント率の閾値≧８０％、２）ターゲット領域のデータ量の閾値≧２Ｍ、３）ハウスキーピング遺伝子発現個数≧４という３つの指標に適合する場合、後の分析を行うことを含む。

好ましくは、遺伝子融合分析サブモジュールでは、閾値は表１に示される。

好ましくは、融合に属する突然変異の発現量の分析サブモジュールでは、発現量の校正及び標準化に使用される標準化式は以下のとおりである。

好ましくは、単一ヌクレオチド突然変異の発現量の分析サブモジュールでは、単一ヌクレオチド変異の発現量の計算式は以下のとおりである。

従来技術では、一般的には全ゲノムシークエンシングＷＧＳ又はＤＮＡｐａｎｅｌを利用してＳＮＶ、ＣＮＶ及び融合の検出を行う。従来方法のＤＮＡレベルでの突然変異の検出は、転写レベルでの突然変異の実際の表現を反映できず、ＲＮＡを利用して突然変異を検出すると、機能的関連性が高くなる。例えば、２つのＳＮＶの突然変異頻度がいずれも１％であるが、発現量が異なるため、突然変異の臨床影響が異なる。本発明は、ＲＮＡｓｅｑの一般的な遺伝子発現量、遺伝子融合を検出できるだけではなく、ＤＮＡｐａｎｅｌのＳＮＶ及びＣＮＶを検出でき、かつ、様々な突然変異の発現量を検出することができる。１回の検出により、すべての突然変異タイプ及び相対発現量を覆うことを実現する。

本発明のシステムは、全トランスクリプトームを検出するＲＮＡｓｅｑと比較して、ターゲット遺伝子を標的とするＲＮＡｐａｎｅｌを実行し、シークエンシング費用が低く、かつターゲット領域を顕著に濃縮することができ、特に低発現の遺伝子又は突然変異に対する検出敏感性が高い。かつ、ＤＮＡｐａｎｅｌの設計がエクソン及びイントロンを覆う必要があることと比較して、ＲＮＡ標的シークエンシングｐａｎｅｌの設計はエクソン領域のみを覆うだけでよく、それにより、プローブ及びシークエンシングコストをより節約し、臨床キットの開発により適用する。

以下、実施例と組み合わせて本発明の有益な効果をさらに説明する。

実施例

一、実験

１．ＲＮＡ抽出：
肺ガン患者のパラフィン包埋病理切片を使用し、ＱｉａｇｅｎのＲＮｅａｓｙＦＦＰＥＫｉｔ（ＣａｔＮｏ．／ＩＤ：７３５０４）で全ＲＮＡ抽出を行った。ＱｕｂｉｔＲＮＡＨＳでＲＮＡの含有量を測定し、Ｌａｂｃｈｉｐ検出でＲＮＡに対する精度管理を検出した。

２．ハイブリダイゼーション前のヌクレオチドライブラリーの製造：
ＡＢｃｌｏｎａｌ社のｍＲＮＡ－ｓｅｑＬｉｂＰｒｅｐＭｏｄｕｌｅｆｏｒｉｌｌｕｍｉｎａでヌクレオチドライブラリーを構築し、ｃＤＮＡの逆転写、断片化、末端修復、アダプターライゲーション、ライブラリー濃縮等のステップを含む。構築されるライブラリーをＡｇｅｎｃｏｕｒｔＡＭｐｕｒｅＸＰ電磁ビーズで精製した後、Ｑｕｂｉｔ３．０及びＡｇｉｌｅｎｔ２１００キャピラリー電気泳動を濃度検出及び精度管理に使用した。

３．プローブキャプチャー及びハイブリダイゼーション：
選択された３６個の標的遺伝子（ＡＬＫ、ＥＳＲ１、ＦＧＦＲ１、ＮＲＧ１、ＲＥＴ、ＥＲＧ、ＢＲＡＦ、ＥＴＶ１、ＦＧＦＲ２、ＮＴＲＫ１、ＲＯＳ１、ＥＷＳＲ１、ＣＤ７４、ＥＴＶ４、ＦＧＦＲ３、ＮＴＲＫ２、ＳＬＣ３４Ａ２、ＭＥＴ、ＥＧＦＲ、ＥＴＶ５、ＦＧＦＲ４、ＮＴＲＫ３、ＳＬＣ４５Ａ３、ＰＰＡＲＧ、ＥＭＬ４、ＥＴＶ６、ＫＩＦ５Ｂ、ＰＤＧＦＲＡ、ＴＰＭ３、ＰＤＧＦＲＢ、ＳＦＴ２Ｄ３、ＣＮＴＦ、ＥＰＭ２Ａ、ＮＯＬ１０、ＨＥＡＴＲ４及びＲＰＧＲＩＰ１）に応じて、その転写物配列に基づいてｎｏｎ－ｏｖｅｒｌａｐｐｉｎｇのタイリイングプローブ（ｔｉｌｉｎｇｐｒｏｂｅ、全鎖被覆プローブ）配列を設計し、プローブ５’末端をビオチンで標識する。調製された２ｕｇのハイブリダイゼーション前のライブラリーを５ｕＬのＨｕｍａｎＣｏｔＤＮＡ（ＩＤＴ）、２ｕＬのｘＧｅｎＵｎｉｖｅｒｓａｌＢｌｏｃｋｅｒｓ－ＴＳＭｉｘと混合させ、真空遠心濃縮器で蒸発乾固（６０℃、約２０ｍｉｎ－１ｈｒ）した後、ハイブリダイゼーション溶液に再溶解し、室温で１０ｍｉｎインキュベートした後、ＰＣＲ装置に移して６５℃で１６ｈハイブリダイゼーションした。キャプチャーした一晩のハイブリダイゼーション生成物をストレプトアビジン電磁ビーズと混合させ、ＰＣＲ装置で４５ｍｉｎインキュベートした後、洗浄液で電磁ビーズを洗浄する。溶離生成物に対して次のＰＣＲ増幅実験を行い、後でＡｇｅｎｃｏｕｒｔＡＭＰｕｒｅＸＰ電磁ビーズで精製し、Ｑｕｂｉｔ３．０及びＡｇｉｌｅｎｔ２１００キャピラリー電気泳動で濃度測定及び精度管理を行った。

４．ハイスループットシークエンシング：ＩｌｌｕｍｉｎａＮｅｘｔｓｅｑ、Ｎｏｖａｓｅｑ等を使用し、ペアエンドモードでシークエンシングした。

二、シークエンシングデータ分析：
ＲＮＡｐａｎｅｌに基づいてｒｅａｄｓをキャプチャーしてオンラインシークエンシングを行って、元のシークエンシングのオフライン配列を得て、Ｔｒｉｍｍｏｍａｔｉｃ－０．３６で配列を以下のように処理して高品質シークエンシング配列を得た。

ａ）低品質のシークエンシング配列を除去する。

ｂ）アダプター配列を含むｒｅａｄｓを除去する。
高品質のシークエンシング配列（標準としては本分野の汎用標準を使用する）をＳＴＡＲで参照ゲノムにアラインメントして、配列アラインメント結果を得て、アラインメント結果に対して品質管理評定を行い、表２の指標を満たす場合、次のステップの分析（遺伝子発現量の分析、遺伝子融合分析、融合に属する突然変異の相対発現量の分析、ＳＮＶ分析、ＳＮＶ突然変異の発現量の分析を含む）を行った。

１．遺伝子発現量の分析
配列アラインメント結果及び参照ゲノムのアノテーションファイルに基づき、ＲＰＫＭ法で遺伝子発現量を定量的に評定し、ＲＰＫＭ式は以下のとおりである。

（Ｔｏｔａｌｅｘｏｎｒｅａｄｓは、遺伝子のすべてのエクソンにアラインメントした配列数であり、ＦｅａｔｕｒｅＣｏｕｎｔｓソフトウェアを使用して遺伝子アノテーションファイル及びアラインメント結果に基づいて評定する。
Ｍａｐｐｅｄｒｅａｄｓ（ｍｉｌｌｉｏｎｓ）は、ゲノムにアラインメントしたすべての配列数であり、アラインメント結果の統計結果に基づいて得られる。
Ｅｘｏｎｌｅｎｇｔｈ（ＫＢ）は、遺伝子のエクソンの長さであり、ゲノムのアノテーションファイルに基づいて算出される。）

２．遺伝子融合分析
高品質のシークエンシング配列を、ＦｕｓｉｏｎＭａｐを使用して遺伝子融合の識別に使用し、最初的な遺伝子融合結果を得て、遺伝子融合結果に基づいて以下の規則に従ってフィルタリングした。

１）遺伝子融合結果のＦｉｌｔｅｒは空きと標識され、意味は以下のとおりである。
ａ）同じ遺伝子ファミリーに属する融合遺伝子をフィルタリングし捨てた。
ｂ）同じパラロググループ（Ｅｎｓｅｍｂｌｖ７４で定義される。）に属する融合遺伝子をフィルタリングし捨てた。
ｃ）同じ遺伝子モデルに由来する融合遺伝子フィルタリングし捨てた。

２）設定された閾値に基づいて条件を満たさない融合遺伝子をフィルタリングし捨て、閾値標準は表３に示された。

３．融合に属する突然変異の発現量の分析
遺伝子融合結果及びハウスキーピング遺伝子の発現を識別した定量結果に基づいて校正及び標準化を行って、融合遺伝子の融合発現量の結果を得て、標準化式は以下のとおりである。

（ここで、ＳｅｅｄＲｅａｄｓ＋ＲｅｓｃｕｅＲｅａｄｓは融合ブレイクポイントにわたるｒｅａｄｓを表し、ＨＫＡはハウスキーピング遺伝子Ａを表し、ＨＫＢはハウスキーピング遺伝子Ｂを表し、ＨＫＣはハウスキーピング遺伝子Ｃを表し、ｃｏｕｎｔは参照ゲノムに対してアラインメントしたシークエンシング配列の配列数を表し、ｌｅｎｇｔｈは参照ゲノムに対してアラインメントしたシークエンシング配列の配列長を表し、例えば、ＨＫＡｃｏｕｎｔは参照ゲノムに対してアラインメントしたハウスキーピング遺伝子Ａのシークエンシング配列の配列数である。）

４．ＳＮＶ分析
分析プロセス：
１）シークエンシングデータを分析してアラインメントし、ｂａｍデータファイルを得て、
２）ＶａｒＤｉｃｔｃａｌｌｅｒで参照ゲノム（ｈｇ１９）にアラインメントした後の突然変異部位及び挿入欠失領域をキャプチャーし、結果ファイルはＶＣＦフォーマットであり、
３）ＶＣＦファイルをＡＮＮＯＶＡＲでアノテーションし、かつ一部の、アノテーションが正確ではない部位をｔｒａｎｓｖａｒで再びアノテーションして、すべての結果ファイルを得て、ここで、ｔｒａｎｓｖａｒでアノテーション結果を修正し、結果は正確かつ完全であり、
４）２回の結果を合併し、合併ファイルに対してプラス鎖及びマイナス鎖の修正を行ってｒｅａｄｓ数及びｆｒｅｑを統計し、
ここで、鎖バイアスを修正して、アノテーション結果を再度修正し、
５）エビデンス部位データベースでアノテーションをフィルタリングし、及び転写物サポートを選択し、
遺伝子突然変異及び遺伝子データベースモジュール：
ａ）異なる腫瘍、疾患の発生率が高い遺伝子を整理し、明確な標的部位及び化学療法薬に関連するホットスポット遺伝子リストを作成し、
ｂ）公開データベースは、ＥＸＡＣ／千人／ｇｎｏｍＡＤ／ＨＧＭＤ／ＯＭＩＭ／ｃｏｓｍｉｃを含み、
転写物の選択：薬物部位の転写物／Ｃｌｉｎｖａｒの病原性部位であるか否か／Ｔｒａｎｓｖａｒ結果には該転写物があるか否か／イントロンに位置する非ｓｐｌｉｃｅ／古典的な転写物があるか否か／エクソン領域にあるか否かを判断し、
７）検証により閾値標準を得て合併結果をフィルタリングし、最終的な結果を得て、
異なる遺伝子及びホットスポットに対して独立検証及び大量のサンプルの並行検証を行い、結果を可視化判断して修正し、最適な性能を算出した後に精度管理閾値標準を逆に導き出し、
フィルタリング標準：
ａ）シークエンシングの深さが１０よりも小さい突然変異部位をフィルタリングし、
ｂ）ブラックリストにおける突然変異をフィルタリングし、ホワイトリストにおける突然変異を保持し、
ｃ）ｆｏｒｗａｒｄ及びｒｅｖｅｒｓｅの、ｒｅａｄｓにサポートされていない突然変異をフィルタリングし、
ｄ）ｆｒｅｑ及びｓｕｐｐｏｒｔｒｅａｄｓの、要件を満たさない突然変異をフィルタリングする。

５．ＳＮＶ突然変異の発現量の分析
ＳＮＶ結果により、ハウスキーピング遺伝子発現の定量結果及び配列アラインメントの統計結果に基づき、ＳＮＶの発現の定量分析を行い、ＳＮＶの発現量を得た。

（ＧｅｎｅＡｖｅｒａｇｅＤｅｐｔｈは、遺伝子の平均深さであり、
ＨＫ＿ｅｘｐｒｅｓｓｉｏｎ＿Ｃｏｅｆｆｉｅｎｔは、サンプル中のハウスキーピング遺伝子の発現量及び標準品中のハウスキーピング遺伝子の発現量に基づいて発現量の変化係数を計算する）。

三、結果部分：

１．ＲＮＡｐａｎｅｌによる遺伝子融合検出の精度
ＤＮＡサンプルをペアリングすることで標的シークエンシングし、ＲＮＡサンプルの融合遺伝子の検出に対して一致性検証を行い、性能は表４に示された。ＤＮＡ融合が陰性の５７例のサンプルのうち、陰性と検出されたＲＮＡ融合が５２例であり、陽性と検出されたＲＮＡ融合が５例であった。従って、ＤＮＡとＲＮＡの融合検出結果の陰性一致性は５２／５７＝９１．２３％であった。ＲＮＡ融合の５例のサンプルの検出はいずれもＩＧＶでブレイクポイントの真実性を確認し、検出された条数はいずれもフィルタリング標準よりも高く、そのうちの３例に対して第一世代シーケンシングで融合の実際の存在が確認され、ＤＮＡに融合検出漏れが存在する可能性があることを説明した。臨床的検出された１６例のＤＮＡ融合陽性サンプルのうち、１６例のＲＮＡがいずれも陽性であると検出され、かつ検出融合形式はＤＮＡと一致し、ＲＮＡには融合可変スプライシングの検出が存在した。ＲＮＡ検出とＤＮＡ検出の陽性一致率は１６／１６＝１００％であり、陰性一致率は５２／５７＝９１．２３％であった。

２．ＲＮＡｐａｎｅｌによるＳＮＶ検出の精度
ＲＮＡｐａｎｅｌに覆われるｏｎｃｏｇｅｎｅ活性化に属する突然変異及び融合二次性薬剤耐性の一次及び二次突然変異部位（合計１１個の遺伝子、２２６個のｓｎｖ部位）の、ＤＮＡ標的シークエンシングとＲＮＡサンプルのペリングによるｓｎｖの検出結果の一致性を考察した。非小細胞肺ガンの臨床サンプルは合計４０例であり、２９例のＤＮＡ及びＲＮＡはいずれも検出されず、検出されたサンプルは合計１１例であり、突然変異は主にＥＧＦＲ遺伝子に集中した。ＲＮＡ及びＤＮＡの検出の考察範囲にｓｎｖ結果の陽性一致率と陰性一致率がいずれも１００％であった。結果は表５に示された。

３．ＲＮＡｐａｎｅｌによる遺伝子発現量検出の精度
３０例のＦＦＰＥでＲＮＡライブラリーを構築し、そしてそれぞれＲＮＡｓｅｑシークエンシングを行い及びＲＮＡｐａｎｅｌでキャプチャーした後にシークエンシングし、ＲＮＡｓｅｑとＲＮＡｐａｎｅｌによる遺伝子発現量検出の一致性を分析し、結果により、２種の方法がｐａｎｅｌに含まれるすべての遺伝子、発現量検出の一致性Ｒ値＞０．８であると示された。結果は図２のＲＮＡｓｅｑ及びＲＮＡｐａｎｅｌ遺伝子発現量の関連結果に示された。
ｐａｎｅｌ内の重要な腫瘍ドライバー遺伝子、例えばＡＬＫ、ＭＥＴ、ＮＴＲＫ、ＥＧＦＲ等について、ＲＮＡｓｅｑ及びＲＮＡｐａｎｅｌ遺伝子発現量のＲ値＞０．９であった。結果は図３に示された。

４．ＲＮＡ発現量でＤＮＡのコピー数分析を置換した
１６５例のＦＦＰＥサンプルをＲＮＡｐａｎｅｌでキャプチャーした後にシークエンシングし、ＥＧＦＲ遺伝子の発現量ｒｐｋｍ値分布を統計し、ＥＧＦＲ発現量の閾値を決定し、ＥＧＦＲ発現量のｔｏｐ１０％かつ切片が残されるサンプルに対して、免疫組織化（ＩＨＣ）実験及びＤＮＡ標的シークエンシングを行った。実験結果によれば、ＥＧＦＲ遺伝子の発現量及び免疫組織化は、すなわちタンパク質レベルの結果であり、ＤＮＡＣＮＶ結果と免疫組織化結果の一致性よりも高いことを示した。結果は表６に示された。

以上は本発明の好ましい実施例に過ぎず、本発明を限定するものではない。当業者にとって、本発明は様々な変更及び変化を有することができる。本発明の精神及び原理の範囲内で行われた修正、等価置換、改良等は、いずれも本発明の保護範囲内に含まれるべきである。

Claims

遺伝子の突然変異及び発現量を検出する方法であって、
検出対象サンプルのＲＮＡを抽出し、前記検出対象サンプルのＲＮＡを破壊し、逆転写して、ｃＤＮＡを得るＳ１と、
前記ｃＤＮＡに対して末端修復、アダプターライゲーション及びライブラリー濃縮のステップを行って遺伝子ライブラリーを構築するＳ２と、
キャプチャープローブを利用してターゲット領域に特異的にハイブリダイゼーションして前記遺伝子ライブラリーからターゲット遺伝子をキャプチャーかつ濃縮するＳ３と、
ハイスループットシーケンサーでシークエンシングして、ＲＮＡ標的シークエンシングデータを取得するＳ４と、
前記ＲＮＡ標的シークエンシングデータに示される遺伝子の突然変異及び発現量の変化を分析するＳ５と、を含み、
前記Ｓ５は、具体的には、
ＲＰＫＭ法を使用して前記検出対象サンプル中のターゲット遺伝子の発現量を定量的に評定する遺伝子発現量の分析Ｓ５１と、
ベースラインサンプル集団を引き出し、前記ターゲット遺伝子のＲＰＫＭ値分布を分析して、前記ターゲット遺伝子の発現量レベルの閾値を決定し、前記検出対象サンプルのターゲット遺伝子のＲＰＫＭ値に基づき、前記検出対象サンプルのターゲット遺伝子が過剰発現であるか否かを判断する遺伝子過剰発現分析Ｓ５２と、
同じ遺伝子ファミリーに属する融合遺伝子、同じパラロググループに属する融合遺伝子、及び同じ遺伝子モデルに由来する融合遺伝子をフィルタリングし捨て、また、閾値に基づいて条件を満たさない融合遺伝子をフィルタリングして、前記検出対象サンプル中の融合遺伝子を取得する遺伝子融合分析Ｓ５３と、
ハウスキーピング遺伝子発現の定量結果及び前記Ｓ５３で取得された遺伝子融合分析の結果に基づいて発現量の校正及び標準化を行って、融合遺伝子の相対発現量を得る融合に属する突然変異の相対発現量の分析Ｓ５４と、
遺伝子のアラインメントによって変異した単一ヌクレオチドを決定する単一ヌクレオチド変異の分析Ｓ５５と、
前記単一ヌクレオチド変異の分析結果、ハウスキーピング遺伝子発現の定量結果、及び配列アラインメントの統計結果に基づき、単一ヌクレオチド変異の発現の定量分析を行って、単一ヌクレオチド変異の発現量を得る単一ヌクレオチド変異の発現量の分析Ｓ５６と、を含むことを特徴とする遺伝子の突然変異及び発現量を検出する方法。
前記Ｓ５は、低品質のシークエンシングデータとアダプター配列を含むｒｅａｄｓとをフィルタリングしかつ精度管理を行った後に、標準に適合するデータを得て前記ＲＮＡ標的シークエンシングデータに示される遺伝子の突然変異及び発現量の変化を分析することをさらに含み、前記精度管理のステップは、
低品質のシークエンシングデータとアダプター配列を含むｒｅａｄｓとをフィルタリングして得られたシークエンシングデータを参照ゲノムにアラインメントして、配列アラインメント結果を得て、アラインメント結果に対して品質管理評定を行い、１）配列再付着アラインメント率の閾値≧８０％、２）ターゲット領域のデータ量の閾値≧２Ｍ、３）発現したハウスキーピング遺伝子の個数≧４という３つの指標に適合する場合、後の分析を行うことを含むことを特徴とする請求項１に記載の方法。
前記Ｓ５３において、前記閾値は下表に示されることを特徴とする請求項１に記載の方法。
前記Ｓ５４において、前記発現量の校正及び標準化に使用される標準化式は下式であることを特徴とする請求項１に記載の方法。

（ここで、ＳｅｅｄＲｅａｄｓ＋ＲｅｓｃｕｅＲｅａｄｓは融合ブレイクポイントにわたるｒｅａｄｓを表し、ＨＫＡはハウスキーピング遺伝子Ａを表し、ＨＫＢはハウスキーピング遺伝子Ｂを表し、ＨＫＣはハウスキーピング遺伝子Ｃを表し、ｃｏｕｎｔは参照ゲノムに対してアラインメントしたシークエンシング配列の配列数を表し、ｌｅｎｇｔｈは参照ゲノムに対してアラインメントしたシークエンシング配列の配列長を表す。）
前記Ｓ４においてペアエンドモード又はシングルエンドモードでシークエンシングすることを特徴とする請求項１に記載の方法。
前記Ｓ５６において、前記単一ヌクレオチド変異の発現量の計算式は以下のとおりであることを特徴とする請求項１に記載の方法。

（ここで、ＧｅｎｅＡｖｅｒａｇｅＤｅｐｔｈは遺伝子の平均深さを表し、
ＡＬＴｃｏｕｎｔは突然変異の深さを表し、
ＨＫ＿ｅｘｐｒｅｓｓｉｏｎ＿Ｃｏｅｆｆｉｅｎｔは、サンプル中のハウスキーピング遺伝子の発現量及び標準品中のハウスキーピング遺伝子の発現量に基づいて発現量の変化係数を計算することを表す。）
遺伝子の突然変異及び発現量を検出する装置であって、
検出対象サンプルのＲＮＡを抽出し、前記検出対象サンプルのＲＮＡを破壊し、逆転写して、ｃＤＮＡを得るように設置されるＲＮＡ抽出モジュールと、
前記ｃＤＮＡに対して末端修復、アダプターライゲーション及びライブラリー濃縮のステップを行って遺伝子ライブラリーを構築するように設置される遺伝子ライブラリー構築モジュールと、
キャプチャープローブを利用してターゲット領域に特異的にハイブリダイゼーションして前記遺伝子ライブラリーからターゲット遺伝子をキャプチャーかつ濃縮するように設置されるターゲット遺伝子濃縮モジュールと、
ハイスループットシーケンサーでシークエンシングして、ＲＮＡ標的シークエンシングデータを取得するように設置されるシークエンシングモジュールと、
前記ＲＮＡ標的シークエンシングデータに示される遺伝子の突然変異及び発現量の変化を分析するように設置される分析モジュールと、を含み、
前記分析モジュールは、具体的には、
ＲＰＫＭ法を使用して前記検出対象サンプル中のターゲット遺伝子の発現量を定量的に評定するように設置される遺伝子発現量分析サブモジュールと、
ベースラインサンプル集団を引き出し、前記ターゲット遺伝子のＲＰＫＭ値分布を分析して、前記ターゲット遺伝子の発現量レベルの閾値を決定して、前記検出対象サンプルのターゲット遺伝子のＲＰＫＭ値に基づき、前記検出対象サンプルのターゲット遺伝子が過剰発現であるか否かを判断するように設置される遺伝子過剰発現分析サブモジュールと、
同じ遺伝子ファミリーに属する融合遺伝子、同じパラロググループに属する融合遺伝子、及び同じ遺伝子モデルに由来する融合遺伝子をフィルタリングし捨て、また、閾値に基づいて条件を満たさない融合遺伝子をフィルタリングして、前記検出対象サンプル中の融合遺伝子を取得するように設置される遺伝子融合分析サブモジュールと、
ハウスキーピング遺伝子発現の定量結果及び前記遺伝子融合分析サブモジュールから取得された遺伝子融合分析の結果に基づいて発現量の校正及び標準化を行って、融合遺伝子の相対発現量を得るように設置される融合に属する突然変異の相対発現量の分析サブモジュールと、
遺伝子のアラインメントによって変異した単一ヌクレオチドを決定するように設置される単一ヌクレオチド変異分析サブモジュールと、
前記単一ヌクレオチド変異分析の結果、ハウスキーピング遺伝子発現の定量結果、及び配列アラインメントの統計結果に基づき、単一ヌクレオチド変異の発現の定量分析を行って、単一ヌクレオチド変異の発現量を得るように設置される単一ヌクレオチド変異の発現量の分析サブモジュールと、を含むことを特徴とする遺伝子の突然変異及び発現量を検出する装置。
前記分析モジュールは、低品質のシークエンシングデータとアダプター配列を含むｒｅａｄｓとをフィルタリングしかつ精度管理を行った後に、標準に適合するデータを得て前記ＲＮＡ標的シークエンシングデータに示される遺伝子の突然変異及び発現量の変化を分析するように設置されるフィルタリングサブモジュールをさらに含み、前記精度管理は、
低品質のシークエンシングデータとアダプター配列を含むｒｅａｄｓとをフィルタリングして得られたシークエンシングデータを参照ゲノムにアラインメントして、配列アラインメント結果を得て、アラインメント結果に対して品質管理評定を行い、１）配列再付着アラインメント率の閾値≧８０％、２）ターゲット領域のデータ量の閾値≧２Ｍ、３）発現したハウスキーピング遺伝子の個数≧４という３つの指標に適合する場合、後の分析を行うことを含むことを特徴とする請求項７に記載の装置。
前記遺伝子融合分析サブモジュールでは、前記閾値は下表に示されることを特徴とする請求項７に記載の装置。
前記融合に属する突然変異の発現量の分析サブモジュールでは、前記発現量の校正及び標準化に使用される標準化式は以下のとおりであることを特徴とする請求項７に記載の装置。

（ここで、ＳｅｅｄＲｅａｄｓ＋ＲｅｓｃｕｅＲｅａｄｓは融合ブレイクポイントにわたるｒｅａｄｓを表し、ＨＫＡはハウスキーピング遺伝子Ａを表し、ＨＫＢはハウスキーピング遺伝子Ｂを表し、ＨＫＣはハウスキーピング遺伝子Ｃを表し、ｃｏｕｎｔは参照ゲノムに対してアラインメントしたシークエンシング配列の配列数を表し、ｌｅｎｇｔｈは参照ゲノムに対してアラインメントしたシークエンシング配列の配列長を表す。）
前記シークエンシングモジュールではペアエンドモード又はシングルエンドモードでシークエンシングすることを特徴とする請求項７に記載の装置。
前記単一ヌクレオチド変異の発現量の分析サブモジュールでは、前記単一ヌクレオチド変異の発現量の計算式は以下のとおりであることを特徴とする請求項７に記載の装置。

（ここで、ＧｅｎｅＡｖｅｒａｇｅＤｅｐｔｈは遺伝子の平均深さを表し、
ＡＬＴｃｏｕｎｔは突然変異の深さを表し、
ＨＫ＿ｅｘｐｒｅｓｓｉｏｎ＿Ｃｏｅｆｆｉｅｎｔは、サンプル中のハウスキーピング遺伝子の発現量及び標準品中のハウスキーピング遺伝子の発現量に基づいて発現量の変化係数を計算することを表す。）