JP2019080501A - 品質評価方法、品質評価装置、プログラム、記録媒体、および品質管理試料 - Google Patents

品質評価方法、品質評価装置、プログラム、記録媒体、および品質管理試料 Download PDF

Info

Publication number
JP2019080501A
JP2019080501A JP2017208652A JP2017208652A JP2019080501A JP 2019080501 A JP2019080501 A JP 2019080501A JP 2017208652 A JP2017208652 A JP 2017208652A JP 2017208652 A JP2017208652 A JP 2017208652A JP 2019080501 A JP2019080501 A JP 2019080501A
Authority
JP
Japan
Prior art keywords
gene
quality
mutation
sequence
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017208652A
Other languages
English (en)
Other versions
JP7067896B2 (ja
Inventor
鈴木 健一郎
Kenichiro Suzuki
健一郎 鈴木
誓吾 鈴木
Seigo Suzuki
誓吾 鈴木
玲子 渡辺
Reiko Watanabe
玲子 渡辺
佐藤 淳
Atsushi Sato
佐藤  淳
賢一 澤
Kenichi Sawa
賢一 澤
健二郎 身野
Kenjiro Mino
健二郎 身野
明秀 岡
Akihide Oka
明秀 岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sysmex Corp
Original Assignee
Sysmex Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sysmex Corp filed Critical Sysmex Corp
Priority to JP2017208652A priority Critical patent/JP7067896B2/ja
Priority to US16/170,863 priority patent/US20190127807A1/en
Priority to CN201811245802.3A priority patent/CN109722470A/zh
Priority to EP18202846.4A priority patent/EP3476946A1/en
Priority to EP22165085.6A priority patent/EP4095262A3/en
Publication of JP2019080501A publication Critical patent/JP2019080501A/ja
Priority to JP2022075375A priority patent/JP2022093592A/ja
Application granted granted Critical
Publication of JP7067896B2 publication Critical patent/JP7067896B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6811Selection methods for production or design of target specific oligonucleotides or binding molecules
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Abstract

【課題】より精度の高い遺伝子検査の品質管理手法の提供。【解決手段】被検体から採取した試料中の遺伝子に対し、第1の種別の遺伝子変異および前記第1の種別とは異なる第2の種別の遺伝子変異を含む複数の種別の遺伝子変異を検査する遺伝子検査における品質評価方法であって、前記第1の種別の遺伝子変異を有する第1の標準遺伝子と、前記第2の種別の遺伝子変異を有する第2の標準遺伝子と、を含む品質管理試料を準備し、前記品質管理試料に含まれる遺伝子の配列情報を取得し、取得した前記配列情報に基づいて、前記遺伝子検査の品質を評価するための指標を出力する、品質評価方法。【選択図】図3

Description

本発明は、遺伝子検査の品質評価方法、品質評価装置、プログラム、記録媒体、および品質管理試料に関する。
近年の遺伝子検査技術の進展の中、被検体の遺伝子配列を解析し、被検体の特性に応じた治療法や薬剤を適切に選択する個別化医療への期待が高まっている。遺伝子配列の解析には、例えば、特定の疾患に関連する特定の遺伝子における異常や、タンパク質に翻訳されるエクソン領域における異常を、次世代シーケンサーを用いてハイスループットに解析するパネル検査が知られている。
非特許文献1には、次世代シーケンサーによる遺伝子検査の品質管理手法が記載されている。
Lih et al., Analytical Validation of the Next-Generation Sequencing Assay for a Nationwide Signal-Finding Clinical Trial, The Journal of Molecular Diagnostics, Vol. 19, No. 2, March 2017
しかし、遺伝子検査分野における品質管理は試行段階であり、遺伝子検査の標準的な品質管理手法として確立したものではない。例えば、非特許文献1に記載の技術を、複数の遺伝子を解析対象とするパネル検査の品質管理手法として用いた場合、品質評価の精度が低くなり得る。
本発明は、パネル検査等の複数の遺伝子を解析対象とした場合において、より精度の高い遺伝子検査の品質管理手法を提供することを主たる目的とする。
上記の課題を解決するために、本発明の一態様に係る品質評価方法は、被検体から採取した試料中の遺伝子に対し、第1の種別の遺伝子変異および前記第1の種別とは異なる第2の種別の遺伝子変異を含む複数の種別の遺伝子変異を検査する遺伝子検査における品質評価方法であって、第1の種別の遺伝子変異を有する第1の標準遺伝子と、第2の種別の遺伝子変異を有する第2の標準遺伝子と、を含む品質管理試料を準備し、品質管理試料に含まれる遺伝子の配列情報を取得し、取得した前記配列情報に基づいて、遺伝子検査の品質を評価するための指標を出力する。
上記の構成によれば、品質管理試料を解析することにより、遺伝子検査の品質を評価するための指標を出力する。品質管理試料には、遺伝子検査において検出対象となる変異種別の変異を有する標準遺伝子を少なくとも1つ含まれているため、遺伝子検査の品質を評価する上で、さまざまな変異種別に対応した指標を出力することができる。よって、十分な精度を有する遺伝子検査の品質管理が可能となる。
「被検体」とは、ヒト被検体並びにヒトではない被検体、例えば、哺乳類、無脊椎動物、脊椎動物、菌類、酵母、細菌、ウイルスおよび植物などを指す。本明細書の実施例はヒト被検体に関しているが、本発明の概念はヒト以外の任意の動物または植物などの生物由来のゲノムに適用でき、医療、獣医学および動物科学などの分野において有用である。
「試料」とは、検体またはサンプルとも換言でき、当該分野において標本、調製物と同義で用いられ、供給源としての生物材料(例えば、個体、体液、細胞株、組織培養物もしくは組織切片)から得られる、任意の調製物が意図される。
「品質管理試料」は、例えば、遺伝子の配列を解析するための前処理、およびシーケンサー2によって配列情報を読み取るための処理などを施すために調製された調製物を意図している。
「変異」とは、遺伝子のヌクレオチドの置換、欠失、または挿入、遺伝子の融合、もしくはコピー数多型が含まれる。「置換」は、遺伝子の配列のうち少なくとも1塩基が異なる塩基となる現象をいう。「置換」は、点突然変異および1塩基多型を含む。「欠失」および「挿入」は、「InDel(Insertion and/or Deletion)」とも記載される。InDelは、遺伝子の配列のうち少なくとも1塩基が挿入され、および/または欠失する現象である。「遺伝子の融合」は、染色体の転座等により、ある遺伝子の5’側の配列と、別の遺伝子の3’末端側の配列とが結合する現象をいう。「コピー数多型」とは、1細胞あたりのゲノム上のコピー数が、個体間で異なることをいう。具体的には、VNTR(Variable Nucleotide of Tandem Repeat、反復配列多型)、およびSTRP(Short Tandem Repeat Polymorphism、マイクロサテライト多型)、遺伝子増幅などが例示される。
第1の種別の遺伝子変異は、ヌクレオチドの置換、欠失、もしくは挿入、多型、遺伝子のコピー数異常または遺伝子融合であり、第2の種別の遺伝子変異は、ヌクレオチドの置換、欠失、もしくは挿入、多型、遺伝子のコピー数異常または遺伝子融合であって、第2の種類の遺伝子変異とは異なっていてもよい。
品質管理試料は、遺伝子検査において検出対象となる複数の変異種別の各々について、少なくとも1つの遺伝子変異を有する標準遺伝子を含んでいてもよい。
指標に基づいて、遺伝子検査の品質を評価してもよい。
品質管理試料に含まれる遺伝子の配列情報と共に、試料に含まれる遺伝子の配列情報を取得してもよい。
品質管理試料は変異を有さない遺伝子をさらに含んでいてもよい。
指標が所定の基準を満たすか否かに基づいて、遺伝子検査の品質を評価してもよい。
所定の基準が、遺伝子検査に用いられる第1遺伝子パネルと第1遺伝子パネルと異なる第2遺伝子パネルで異なっていてもよい。
品質管理試料に含まれる遺伝子の配列情報をシーケンサーにより取得し、指標が、シーケンサーによる配列情報の読み取り品質であってもよい。
指標は、シーケンサーによって読み取られた遺伝子配列中の各塩基の正確さを示していてもよい。
シーケンサーはフローセル上で遺伝子を増幅してクラスターを形成し、指標は、フローセルにおける各遺伝子のクラスターの近接度合を示してもよい。
品質管理試料に含まれる遺伝子の配列情報をシーケンサーにより取得し、指標は、シーケンサーで読み取られた塩基のうちターゲット領域の塩基の割合を示していてもよい。
指標は、取得した品質管理試料に含まれる遺伝子の配列情報のデプスを示していてもよい。
指標は、取得した品質管理試料に含まれる遺伝子の配列情報のデプスのばらつきを示していてもよい。
遺伝子が異なる複数の品質管理試料を準備し、複数の品質管理試料から調製する品質管理試料を選択してもよい。
遺伝子検査において解析対象とならない遺伝子であって、変異種別の変異を有する遺伝子を少なくとも1つ含む品質管理試料を調製してもよい。
複数の検査施設に接続された管理サーバ(3)に、指標を送信してもよい。
管理サーバ(3)から、品質の評価結果を受信してもよい。
本発明の一態様に係る品質評価装置(1)は、被検体から採取した試料中の遺伝子に対し、少なくとも、第1の種別の遺伝子変異と、第1の種別とは異なる第2の種別の遺伝子変異とを検査する遺伝子検査における品質を評価する品質評価装置(1)であって、前記第1の種別の遺伝子変異を有する第1の標準遺伝子と、第2の種別の遺伝子変異を有する第2の標準遺伝子と、を含む品質管理試料に含まれる遺伝子の配列情報を解析するデータ調整部(113)と、配列情報に基づいて、遺伝子検査の品質を評価するための指標を生成する品質管理部(117)と、を備えている。
上記の構成によれば、品質管理試料を解析して、遺伝子検査の品質を評価するための指標を生成する。品質管理試料には、遺伝子検査において検出対象となる変異種別の変異を有する標準遺伝子を少なくとも1つ含まれているため、遺伝子検査の品質を評価する上で、さまざまな変異種別に対応した指標を生成することができる。よって、品質評価装置にユーザに指標を提供することにより、十分な精度を有する遺伝子検査の品質管理が可能となる。
本発明の一態様に係るプログラムは、被検体から採取した試料中の遺伝子に対し、少なくとも、第1の種別の遺伝子変異と、前記第1の種別とは異なる第2の種別の遺伝子変異とを検査する遺伝子検査における品質評価プログラムであって、コンピュータに、前記第1の種別の遺伝子変異を有する第1の標準遺伝子と、前記第2の種別の遺伝子変異を有する第2の標準遺伝子と、を含む品質管理試料に含まれる遺伝子の配列情報を取得するステップと、取得した前記配列情報に基づいて、前記遺伝子検査の品質を評価するための指標を生成するステップと、を実行させるためのプログラムである。
上記の構成によれば、本発明の一態様に係る品質評価方法と同等の効果を奏する。
本発明の一態様に係る記録媒体は、本発明の一態様に係るプログラムを記録したコンピュータ読み取り可能な記録媒体である。
本発明の一態様に係る品質管理試料は、被検体から採取した試料中の遺伝子に対し、少なくとも、第1の種別の遺伝子変異と、前記第1の種別とは異なる第2の種別の遺伝子変異とを検査する遺伝子検査における品質管理試料であって、前記第1の種別の遺伝子変異を有する第1の標準遺伝子と、前記第2の種別の遺伝子変異を有する第2の標準遺伝子と、を含む。
上記の構成によれば、遺伝子検査において検出対象となる変異種別の変異を有する標準遺伝子を少なくとも1つ含まれている。それゆえ、遺伝子検査の品質を評価する上で、さまざまな変異種別に対応した指標を、品質管理試料を適用することによって生成することが可能となる。
本発明の一態様によれば、十分な精度を有する、遺伝子検査の品質管理手法を提供することができる。
本発明の一実施形態に係る遺伝子解析システムの典型的な適用例を示す図である。 遺伝子解析システムにおいて行われる主要な処理の例を示すシーケンス図である。 品質評価装置のソフトウェア構成の一例を含む機能ブロック図である。 試料の遺伝子配列を解析するための処理の流れの一例を示すフローチャートである。 試料DNAの塩基配列をシーケンサーによって解析するための前処理の手順の一例を説明するフローチャートである。 品質管理試料の一例を説明する図である。 遺伝子パネル関連情報データベースのデータ構造の例を示す図である。 品質管理試料の具体例を示す図である。 試料の断片化の工程(a)、およびインデックス配列およびアダプター配列の付与の工程(b)の例について説明する図である。 ハイブリダイズの工程の一例について説明する図である。 解析対象となるDNA断片を回収する工程の一例について説明する図である。 試料DNAの塩基配列をシーケンサーによって解析する手順の一例を説明するフローチャートである。 DNA断片をフローセルに供する工程の一例について説明する図である。 解析対象となるDNA断片を増幅する工程の一例について説明する図である。 シーケンシング工程の一例について説明する図である。 品質評価装置による解析の流れの一例を説明するフローチャートである。 リード配列情報のファイルフォーマットの一例を示す図である。 (a)は、データ調整部によるアライメントを説明する図であり、(b)は、データ調整部のアライメント結果のフォーマットの一例を示す図である。 参照配列データベースの構造例を示す図である。 参照配列データベースに含まれる参照配列(野生型の配列を示すものでないもの)に組み込まれる既知の変異の例を示す図である。 アライメントの詳細な工程の一例を説明するフローチャートである。 (a)は、スコア算出の一例を示す図であり、(b)は、スコア算出の他の例を示す図である。 変異同定部が生成する結果ファイルのフォーマットの一例を示す図である。 変異データベースの構造の一例を示す図である。 変異データベース中の変異情報の構造の詳細例を示す図である。 品質評価指標の一例を示す図である。 品質評価指標の一例を示す図である。 作成されるリポートの一例を示す図である。 置換変異を含む標準遺伝子の一例を示す図である。 融合変異を含む標準遺伝子の一例を示す図である。
〔実施形態1〕
以下、本発明の一実施形態について、詳細に説明する。
(遺伝子解析システム100の適用例)
まず、本発明の一実施形態に係る遺伝子解析システム100の概略について、図1を用いて説明する。図1は、本発明の一実施形態に係る遺伝子解析システム100の典型的な適用例を示す図である。遺伝子解析システム100は、遺伝子の配列情報を解析するシステムであって、少なくとも品質評価装置1と、管理サーバ3とを備えていればよい。
図1に示す遺伝子解析システム100は、検査機関120において実行される解析全般を管理する解析システム管理機関130、および医療機関210からの解析依頼に応じて、提供された試料を解析して、解析結果を医療機関210に提供する検査機関120において適用されている。
検査機関120は、医療機関210から提供された試料を検査・解析し、解析結果に基づいたレポートを作成し、医療機関210に該レポートを提供する機関である。検査機関120には、シーケンサー2、および品質評価装置1などが設置されているが、これに限定されるものではない。
解析システム管理機関130は、遺伝子解析システム100を利用する各検査機関120において実行される解析全般を管理する機関である。
医療機関210は、医師、看護師、薬剤師等が患者に対して診断、治療、調剤等の医療行為を行う機関であり、例えば、病院、診療所、薬局等が挙げられる。
(遺伝子解析システム100を適用例における処理)
続いて、図1に示す遺伝子解析システム100の適用例における処理の流れについて、図2を用いてより具体的に説明する。図2は、遺伝子解析システム100において行われる主要な処理の例を示すシーケンス図である。なお、図2に示された処理は、各機関で行われる処理の一部分に過ぎない。
<遺伝子解析システム利用の申請および利用開始>
まず、遺伝子解析システム100の利用を希望する検査機関120は、品質評価装置1を導入する。そして、遺伝子解析システム100の利用を解析システム管理機関130に申請する(ステップS101)。
検査機関120および解析システム管理機関130は複数の契約種別の中から、遺伝子解析システム100の利用に関して、事前に所望の契約を締結することができる。例えば、解析システム管理機関130から検査機関120に提供されるサービス内容、解析システム管理機関130が検査機関120に対して請求するシステム利用料の決定方法、およびシステム利用料の支払い方法などが異なる複数の契約種別から選択されたものであってもよい。解析システム管理機関130の管理サーバ3は、検査機関120からの申請に応じて、検査機関120との間で締結された契約の内容を特定する(ステップS102)。
次に、解析システム管理機関130によって管理されている管理サーバ3は、契約を締結した検査機関120の品質評価装置1に対して、検査機関IDを付与し、各種サービスの提供を開始する(ステップS103)。
品質評価装置1は、各種サービスを、管理サーバ3から受信する。各種サービスには、品質評価装置1から出力され得る遺伝子配列の解析結果、および該解析結果に基づくレポートなどを制御するためのプログラムや情報の提供が含まれる。これにより、品質評価装置1は、入力された遺伝子パネルに関する情報に適合した、解析結果およびレポートなどを出力できる。
遺伝子パネルは、多くの場合、プライマーやプローブなどの一揃いの試薬を含んでいる。なお、遺伝子パネルの解析はこれに限らず、一塩基多型(SNP、Single Nucleotide Polymorphism)、およびコピー数多型(CNV、Copy Number Polymorphism)などの多型の解析に用いられてもよい。また、遺伝子パネルは、解析対象遺伝子全体の変異などの量に関する情報(Tumor Mutation Burdenなどとも呼ばれる)の出力や、メチル化頻度の算出に用いられてもよい。
<検査機関120への解析依頼>
医療機関210では、医師等が必要に応じて、被検体の病変部位の組織および血液などの試料を採取する。採取した試料の解析を検査機関120に依頼する場合、例えば、医療機関210に設けられた通信端末5から解析依頼が送信される(ステップS105)。検査機関120に試料の解析を依頼する場合、医療機関210は、解析依頼の送信とともに、試料毎に付与された試料IDを検査機関120に提供する。試料毎に付与された試料IDは、各試料が採取された被検体の情報などと各試料とを対応付けるものである。
以下では、医療機関210が、パネル検査を検査機関120に解析を依頼する場合を例に挙げて説明する。なお、パネル検査は臨床検査に限らず、研究用途の検査も含む。
医療機関210から遺伝子パネル検査が依頼される場合、所望の遺伝子パネルが指定されてもよい。それゆえ、図2のステップS105において医療機関210から送信される解析依頼には、遺伝子パネルに関する情報が含まれ得る。ここで、遺伝子パネルに関する情報は、遺伝子パネルを特定するために用いられ得る情報であればよく、例えば遺伝子パネル名、およびパネル検査における解析対象となる遺伝子の名などであってよい。
<検査機関120での解析>
品質評価装置1は、医療機関210から解析依頼を受信する(S106)。さらに、品質評価装置1は、該解析依頼の送信元である医療機関210から試料を受け取る。
なお、検査機関120が医療機関210から依頼を受ける解析において用いられ得る遺伝子パネルは複数あり、かつ、解析対象となる遺伝子群は遺伝子パネル毎に決まっている。検査機関120は、複数の遺伝子パネルを解析の目的に合わせて使い分けることも可能である。すなわち、医療機関210から提供された第1試料について、第1の解析対象遺伝子群を解析するためには第1遺伝子パネルが使用され、第2試料について、第2の解析対象遺伝子群を解析するためには第2遺伝子パネルが使用され得る。
本実施形態では、たとえば、第1の種類の遺伝子変異は「置換」であり、第2の種類の遺伝子変異は「欠失」である。この場合、品質管理の対象となる遺伝子検査においては、少なくとも置換および欠失の有無、種類等が検査される。この実施形態では、第1の標準遺伝子は野生型遺伝子の配列に対して、特定の置換変異を含み、第2の標準遺伝子は野生が対電子の配列に対して、特定の欠失変位を含む。
品質評価装置1は、ユーザから、試料を解析するために使用する遺伝子パネルに関する情報の入力を受け付ける(ステップS107)。
検査機関120では、受け取った試料に対して遺伝子パネルを用いて前処理を行い、シーケンサー2を用いたシーケンシングが行われる(ステップS108)。
また、検査機関120では、通常の試料のシーケンシングとは別に、遺伝子パネルに対応する所定の品質管理試料に対して遺伝子パネルを用いて前処理を行い、シーケンサー2を用いたシーケンシングを行う(ステップS108)ことにより、精度管理を行っている。
品質管理試料を前処理、シーケンシング、および配列解析などの遺伝子検査に供した場合の結果は、パネル検査の品質評価指標として利用される。
遺伝子パネル毎に、1または複数の品質管理試料が対応付けられていてもよく、例えば、遺伝子パネル毎に、対応する品質管理試料が予め調製されていてもよい。また、品質管理試料は単独で測定してもよいし、医療機関210から提供された試料と共に測定してもよい。
ここで、品質管理試料は、第1の種別の遺伝子変異と、第1の種別とは異なる第2の種別の遺伝子変異を検査する遺伝子検査において用いる品質管理用の試料である。「品質管理試料」は、第1の種別の遺伝子変異を有する第1の標準遺伝子と、第2の種別の遺伝子変異を有する第2の標準遺伝子を含む調製物である。
前処理とは、試料に含まれるDNAなどの遺伝子を断片化して、断片化された遺伝子を回収するまでの処理が含まれ得る。また、シーケンシングとは、前処理にて回収された解析対象となる1または複数のDNA断片の配列を読み取る処理を含んでいる。シーケンサー2によるシーケンシングによって読み取られた配列情報は、リード配列情報として品質評価装置1に出力される。
また、前処理とは、試料および品質管理試料に含まれるDNAなどの遺伝子を断片化して、断片化された遺伝子を回収するまでの処理が含まれ得る。
リード配列は、シーケンシングによって得られたポリヌクレオチド配列を意味しており、シーケンサー2から出力される配列を指している。
シーケンシングとは、前処理にて回収された解析対象となる1または複数のDNA断片の配列を読み取る処理を含んでいる。シーケンサー2によるシーケンシングによって読み取られた配列情報は、リード配列情報として品質評価装置1に出力される。
シーケンサー2は、遺伝子配列の読み取り工程に関する品質評価指標であるクオリティスコアを含むリード配列情報を品質評価装置1に出力してもよい。また、シーケンサー2は、解析対象となるDNA断片の増幅工程に関する品質評価指標であるクラスター濃度を品質評価装置1に出力してもよい。なお、「クオリティスコア」、および「クラスター濃度」については、後に説明する。
なお、検査機関120が医療機関210から依頼を受ける解析において用いられ得る遺伝子パネルは複数あり、かつ、解析対象となる遺伝子群は遺伝子パネル毎に決まっている。検査機関120は、複数の遺伝子パネルを解析の目的に合わせて使い分けることも可能である。すなわち、医療機関210から提供された第1試料について、第1の解析対象遺伝子群を解析するためには第1遺伝子パネルが使用され、第2試料について、第2の解析対象遺伝子群を解析するためには第2遺伝子パネルが使用され得る。
品質評価装置1は、シーケンサー2からリード配列情報を取得して、遺伝子配列の解析を行う(ステップS109)。
なお、品質管理試料もまた、医療機関210からの試料のパネル検査において行われる工程と同じ工程にて処理され、品質管理試料の遺伝子の配列情報が解析される。品質管理試料を解析した結果に基づいて、パネル検査の品質を評価するための品質評価指標が生成される。
次に、品質評価装置1は、生成された品質評価指標に基づいて、パネル検査の品質を評価する(ステップS110)。具体的には、品質評価装置1は、品質評価指標毎に設定された評価基準と、生成された品質評価指標とを比較した比較結果に基づいて、各パネル検査の品質が評価され得る。
品質評価装置1は、ステップS109における解析結果、および品質管理試料を解析した結果に基づいて生成された指標に基づいてレポートを作成し(ステップS111)、作成したレポートを通信端末5に送信する(ステップS112)。レポートには、例えば、リード配列情報をアライメント結果のデータ、および同定された変異等に関するデータ等の品質評価装置1が解析した結果のデータ自身、およびパネル検査の品質に関する情報が含まれていてもよい。
なお、作成したレポートは検査機関120にて印刷されてもよく、例えば、検査機関120は作成されたレポートを紙媒体として医療機関210へ送付してもよい。
遺伝子解析システム100を利用する検査機関120の品質評価装置1は、管理サーバ3に、解析に用いた遺伝子パネルに関する情報、解析した遺伝子に関する情報、解析実績、および、行われた遺伝子検査について生成された品質評価指標などを通知する(ステップS114)。
管理サーバ3は、例えばネットワーク4を介して、遺伝子解析システム100を利用する各検査機関120の品質評価装置1から、検査機関ID、遺伝子パネルID、遺伝子ID、および解析実績などを取得する。また、管理サーバ3は、取得した検査機関ID、遺伝子パネルID、遺伝子ID、および解析実績などを対応付けて記憶する(ステップS115)。
なお、検査機関IDは、遺伝子の配列解析を行うユーザを特定する情報であり、品質評価装置1を利用するユーザ毎に付与されている識別情報であるユーザIDであってもよい。
遺伝子パネルIDは、対象となる遺伝子の解析に用いる遺伝子パネルを特定するために付与される識別情報である。遺伝子パネルに付与された遺伝子パネルIDは、遺伝子パネル名および該遺伝子パネルを提供している会社名などと対応付けられる。
遺伝子IDは、解析対象の遺伝子を特定するために遺伝子毎に付与された識別情報である。
(遺伝子解析システム100の構成)
遺伝子解析システム100は、遺伝子の配列情報を解析するシステムであって、少なくとも品質評価装置1と、管理サーバ3とを備える。品質評価装置1はイントラネットおよびインターネットなどのネットワーク4を介して管理サーバ3と接続されている。
(シーケンサー2)
シーケンサー2は、試料に含まれる遺伝子の塩基配列を読み取るために利用される塩基配列解析装置である。
本実施形態に係るシーケンサー2は、好ましくは、次世代シークエンシング技術を用いたシーケンシングを行う次世代シーケンサー、または第3世代のシーケンサーであることが好ましい。次世代シーケンサーは、近年開発の進められている一群の塩基配列解析装置であり、クローン的に増幅したDNAテンプレートまたは単独DNA分子をフローセル内で大量に並列処理を行うことによって、飛躍的に向上した解析能力を有している。
また、本実施形態において使用可能なシークエンシング技術は、同一の領域を重複して読むこと(ディープシーケンシング)により複数のリードを取得するシーケンシング技術であり得る。
本実施形態において使用可能なシークエンシング技術の例としては、イオン半導体シークエンシング、ピロシークエンシング(pyrosequencing)、可逆色素ターミネータを使用するシークエンシング・バイ・シンセシス(sequencing-by-synthesis)、シークエンシング・バイ・リゲーション(sequencing-by-ligation)、およびオリゴヌクレオチドのプローブ結紮によるシークエンシングなどの、サンガー法以外のシーケンス原理に基づく、1ラン当たりに多数のリードを取得可能なシーケンシング技術が挙げられる。
シーケンシングに用いるシーケンシングプライマーは特に限定されず、目的の領域を増幅させるのに適した配列に基づいて、適宜設定される。また、シーケンシングに用いられる試薬についても、用いるシーケンシング技術およびシーケンサー2に応じて好適な試薬を選択すればよい。前処理からシーケンシングまでの手順については、後に具体例を挙げて説明する。
(品質評価装置1の構成)
図3は品質評価装置1の構成の一例である。品質評価装置1は、シーケンサー2により読み取られたリード配列情報および解析対象となる複数の遺伝子を含む遺伝子パネルに関する情報とを取得する制御部11と、制御部11が取得した遺伝子パネルに関する情報に基づいた、リード配列情報の解析結果を出力する出力部13と、を備える装置である。品質評価装置1は、コンピュータを用いて構成することができる。例えば、制御部11は、CPU等のプロセッサであり、記憶部12は、ハードディスクドライブである。
また、記憶部12には、配列解析のためのプログラム、単一の参照配列を生成するためのプログラム等も記憶されている。出力部13は、ディスプレイ、プリンタ、スピーカ等を含む。入力部17は、キーボード、マウス、タッチセンサ等を含む。また、タッチセンサとディスプレイとが一体化されたタッチパネルのような、入力部および出力部の双方の機能を有する装置を用いてもよい。通信部14は、制御部11が外部の装置と通信するためのインターフェースである。
品質評価装置1は、品質評価装置1が備える各部を統括して制御する制御部11、解析実行部110が使用する各種データを記憶する記憶部12、出力部13、通信部14、および入力部17を備えている。制御部11は、解析実行部110および管理部116を備えている。さらに、解析実行部110は、配列データ読取部111、情報選択部112、データ調整部113、変異同定部114、およびレポート作成部115を備えている。記憶部12には、遺伝子パネル関連情報データベース121、参照配列データベース122、変異データベース123、および解析実績ログ151が記憶されている。
品質評価装置1は、解析毎に異なる遺伝子パネルが使用された場合であっても、使用された遺伝子パネルに対応した解析結果を含むレポートを作成する。遺伝子解析システム100を利用するユーザは、遺伝子パネルの種別によらず、共通の解析プログラムでパネル検査の結果を解析し、レポートを作成することが可能となる。よって、パネル検査を実施する場合に、遺伝子パネル毎に使用する解析プログラムを使い分けたり、解析プログラムに対して使用する遺伝子パネル毎に特殊な設定を行ったりしなければならないという煩わしさが解消され、ユーザの利便性が向上する。
品質評価装置1のユーザが入力部17から遺伝子パネルに関する情報を入力した場合、情報選択部112は、遺伝子パネル関連情報データベース121を参照し、入力された遺伝子パネルに関する情報に応じて、解析プログラムが解析対象の遺伝子の解析を実行するように、解析プログラムのアルゴリズムを制御する。
ここで、遺伝子パネルに関する情報は、シーケンサー2による測定に用いた遺伝子パネルを特定するものであればよく、例えば、遺伝子パネル名、遺伝子パネルの解析対象となっている遺伝子名、および遺伝子パネルIDなどである。
情報選択部112は、入力部17から入力された遺伝子パネルに関する情報に基づいて、該遺伝子パネルに関する情報が示す遺伝子パネルの解析対象である遺伝子に対応した解析を行うための解析アルゴリズムを変更する。
情報選択部112は、データ調整部113、変異同定部114、およびレポート作成部115の少なくとも何れか1つに対し、遺伝子パネルに関する情報に基づいた指示を出力する。この構成を採用することより、品質評価装置1は、リード配列情報の解析結果を、入力された遺伝子パネルに関する情報に基づいて出力することができる。
すなわち、情報選択部112は、解析対象となる複数の遺伝子を含む遺伝子パネルに関する情報を取得し、取得した遺伝子パネルに関する情報に基づいて、リード配列情報の解析結果が出力部13から出力されるように制御する機能ブロックである。
パネル検査を実施するユーザによってさまざまな試料に含まれる遺伝子が解析される場合、試料毎の解析対象遺伝子群に応じてさまざまな遺伝子パネルが用いられる。
すなわち、品質評価装置1は、第1試料から第1の解析対象遺伝子群を解析するための第1遺伝子パネルを用いて読み取られた第1リード配列情報、および第2試料から第2の解析対象遺伝子群を解析するための第2遺伝子パネルを用いて読み取られた第2リード配列情報を取得し得る。
品質評価装置1は、種々の組合せの解析対象遺伝子がさまざまな遺伝子パネルを用いて解析された場合であっても、情報選択部112を備えることにより、リード配列情報を解析した解析結果を適切に出力することができる。
すなわち、ユーザに対して、解析対象遺伝子毎にリード配列情報の解析に用いる解析プログラムを設定させたり、解析を行わせたりすることなく、遺伝子パネルに関する情報を選択させるだけで、各リード配列情報の解析結果を適切に出力することが可能である。
例えば、情報選択部112が、データ調整部113に対して遺伝子パネルに関する情報に基づいた指示を出力する場合には、データ調整部113によって該遺伝子パネルに関する情報を反映したアライメント処理などが行われる。
情報選択部112は、遺伝子パネルに関する情報に応じて、データ調整部113がリード配列情報のマッピングに用いる参照配列(野生型のゲノム配列および変異配列が組込まれた参照配列)を、遺伝子パネルに関する情報に対応する遺伝子に関する参照配列のみに限定するよう指示する。
この場合、データ調整部113による処理の結果には既に遺伝子パネルに関する情報が反映されているため、情報選択部112は、データ調整部113による処理の次に処理を行う変異同定部114に対して、遺伝子パネルに関する情報に基づいた指示を出力しなくてもよい。
例えば、情報選択部112が、変異同定部114に対し、遺伝子パネルに関する情報に基づいた指示を出力する場合には、変異同定部114によって該遺伝子パネルに関する情報を反映した処理が行われる。
例えば、情報選択部112は、遺伝子パネルに関する情報に応じて、変異同定部114が参照する変異データベース123の領域を、遺伝子パネルに関する情報に対応する遺伝子に関する変異のみに限定するよう指示する。これにより、変異同定部114による処理の結果に遺伝子パネルに関する情報が反映されることになる。
(試料の遺伝子配列を解析するための処理の流れ)
ここでは、試料および品質管理試料の遺伝子配列を解析するための処理の流れについて、図4を用いて説明する。図4は、試料の遺伝子配列を解析するための処理の流れの一例を示すフローチャートである。
まず図4のステップS31において、解析対象の遺伝子の配列を解析するための前処理が行われる。前処理には、試料および品質管理試料に含まれるDNAなどの遺伝子を断片化して、断片化された遺伝子を回収するまでの処理が含まれる。なお、医療機関210から提供された試料が組織および血液などである場合、組織または血液から遺伝子(例えば、DNA)を抽出する処理も含まれる。
次に、ステップS32において、前処理を終えた試料および品質管理試料に含まれる遺伝子の配列がシーケンサー2によって読み取られる。
このステップS32は、具体的には、前処理の後に回収された解析対象となる1または複数のDNA断片の配列が読み取られる工程である。リード配列情報は、この工程で読み取られた遺伝子配列を含んでいる。前処理の後に回収された解析対象となる1または複数のDNA断片は、「ライブラリ」と呼称されることもある。
続いて、品質管理試料を測定した場合、ステップS33において、品質評価装置1は、読み取られた遺伝子配列を解析し、配列中の変異の有無、変異の位置、変異の種別等を特定する。読み取られた遺伝子配列を解析することによって、検出された変異が同定される。
次に、ステップS34において、品質評価装置1は、パネル検査の品質を評価するための品質評価指標を生成する。品質評価装置1は、生成した品質評価指標に基づいて、行ったパネル検査の品質を評価してもよい。
最後に、品質評価装置1は、ステップS33にて同定された変異に関する情報等の解析結果、およびステップS34にて生成された品質評価指標などパネル検査の品質を示す情報を含むレポートを作成する。作成したレポートは、医療機関210に提供される。
(前処理)
続いて、図4のステップS31の前処理の手順について図5に示す流れに沿って説明する。図5は、試料DNAの塩基配列をシーケンサー2によって解析するための前処理の手順の一例を説明するフローチャートである。
試料および品質管理試料のそれぞれからDNAを抽出して配列解析を行う場合、まず、解析対象の遺伝子を含む試料、および用いる遺伝子パネルに対応する品質管理試料からDNAを抽出する(図5の(a)のステップ300)。
この場合、試料由来のDNA、および品質管理試料由来のDNAをそれぞれステップS301以降の処理を行う。
品質管理試料から抽出されたDNAに対して、試料から抽出されたDNAと同じ処理を行うことにより、パネル検査における配列解析の品質を評価するために有用な品質評価指標を生成することができる。
なお、品質管理試料の利用法は、これに限定されない。例えば、図5の(b)に示すように、ステップ300aにて品質管理試料のDNAのみを抽出し、ステップS301以降の処理を行ってもよい。
あるいは、図5の(c)に示すように、品質管理試料として変異を含む品質管理試料と、変異を含まない品質管理試料とを準備し、これらからDNAを抽出してもよい(ステップ300b)。
変異を含む品質管理試料由来のDNAの解析結果と、変異を含まない品質管理試料由来のDNAの解析結果とを比較することにより、パネル検査における配列解析の品質を評価するために有用な品質評価指標を生成することができる。
または、図5の(d)に示すように、解析対象の遺伝子を含む試料、変異を含む品質管理試料、および変異を含まない品質管理試料とからDNAを抽出してもよい(ステップ300c)。解析対象の遺伝子を含む試料が、血液試料および腫瘍細胞試料の組み合わせであってもよい。
なお、ステップS301以降の処理において、試料由来のDNA、および品質管理試料由来のDNAを個別に処理するのではなく、試料由来のDNA、および品質管理試料由来のDNAを混合して、ステップS301以降の処理を行ってもよい。これにより、ステップS301以降のすべての処理において、両者の条件が同じになるため、より正確な品質評価指標を生成し得る。また、シーケンサー2に用いるフローセルのレーンの一部を、品質管理試料から調製されたDNA断片のためだけに使用する必要が無くなる。これにより、限られた数のレーンを、解析対象の遺伝子を含む試料由来のDNA断片のために有効に用いることができる。
なお、この場合、(1)品質管理試料に含まれる標準遺伝子と、パネル検査の解析対象遺伝子とを適切に断片化してライブラリを調製するための試薬、および(2)品質管理試料に含まれる標準遺伝子とパネル検査の解析対象遺伝子とを断片化した後に、それぞれのDNA断片を適切に捕捉するためのRNAベイトを含む試薬を利用することが望ましい。
(品質管理試料)
一実施形態では、品質管理試料は、複数の標準遺伝子を含む組成物である。品質管理試料は、複数の標準遺伝子を混合することにより調製され得る。これらの標準遺伝子を混合して単一の容器に収容した試薬を品質管理試料としてユーザに提供することができる。また、品質管理試料として複数の標準遺伝子を別々の容器に収容してキットの形態としてユーザに提供されてもよい。品質管理試料は、溶液の状態であってもよいし、固体(粉末)の状態であってもよい。溶液で提供される場合の溶媒としては、水、TEバッファーなど当業者に公知の水性溶媒を使用することができる。
品質管理試料について、図6を用いて説明する。図6は、品質管理試料の一例を説明する図である。
図6の(a)は、遺伝子パネルを用いたパネル検査において解析対象となり得る遺伝子のリストを示している。このリストの中の1または複数の遺伝子が、遺伝子パネルの解析対象となる遺伝子として関連付けられている(図7のデータ121B参照)。
図6の(b)は、パネル検査において検出対象となる変異種別の例を示している。検出対象となる変異種別には、「SNV(一塩基多型)」、「Insertion(挿入)」および「Deletion(欠失)」(図中では、「InDel」と表記されている)、「CNV(コピー数多型)」、および「Fusion(融合)」を示している。
遺伝子パネルAに対応する品質管理試料A1は、SNVを含む標準遺伝子、Insertionを含む標準遺伝子、Deletionを含む標準遺伝子、CNVを含む標準遺伝子、およびFusionを含む標準遺伝子のうち、少なくとも2つ含んでいる。たとえば、品質管理試料A1は、標準遺伝子として、野生型に対して「SNV」を含む遺伝子Aの部分配列と、野生型に対して「Insertion」を含む遺伝子Bの部分配列を含む。
図6の(d)は、遺伝子パネルAを用いる遺伝子検査の解析結果と品質管理試料の解析結果の出力例である。この例では、遺伝子パネルAの解析結果として、GNA11、AKT1およびPIK3CAのSNV、EGFRのLong insertionおよびLong deletion、SLC34A2とROS1の融合遺伝子、CCDC6とRETの融合遺伝子、METの遺伝子増幅、MYC−Nの遺伝子増幅、およびMYC−Cの遺伝子増幅が検出されている。遺伝子パネルAの品質管理試料は、GNA11のSNVを含む標準遺伝子、AKT1のSNVを含む標準遺伝子、PIK3CAのSNVを含む標準遺伝子、EGFRのLong insertionを含む標準遺伝子、EGFRのLong deletionを含む標準遺伝子、SLC34A2とROS1の融合配列を含む標準遺伝子、CCDC6とRETの融合配列を含む標準遺伝子、METの遺伝子増幅を含む標準遺伝子、MYC−Nの遺伝子増幅を含む標準遺伝子、およびMYC−Cの遺伝子増幅を含む標準遺伝子を含有する。ここでは、品質管理試料が10種の標準遺伝子を含む例を示しているが、これに限定されない。
品質管理試料に含まれる第1の標準遺伝子と第2の標準遺伝子は、異なるDNA分子であってもよいし、これらが連結していてもよい。第1の標準遺伝子と第2の標準遺伝子が連結している場合は、第1の標準遺伝子の配列と、第2の標準遺伝子の配列とが直接連結されていてもよいし、第1の標準遺伝子の配列と、第2の標準遺伝子の配列との間にスペーサー配列を介在させてもよい。
当該スペーサー配列は、遺伝子検査に供される検体に含まれる可能性の低い配列が好ましい。たとえば、アデニン塩基のみが複数個(たとえば、100個)連続した配列であり得る。
標準遺伝子は、解析対象の遺伝子パネルに含まれる遺伝子であってもよいし、含まれない遺伝子であってもよい。遺伝子検査の対象となる生物種の遺伝子であってもよいし、異なる生物種の遺伝子であってもよい。たとえば、遺伝子検査の対象がヒトである場合は、ヒト以外の動物、植物、細菌などの遺伝子であり得る。
標準遺伝子の合成方法は特に限定されない。たとえば、公知のDNA合成機で合成することができる。また、鋳型となる生物由来の遺伝子をPCRにより増幅し、精製することにより取得してもよい。DNA合成機で合成した標準遺伝子を鋳型としてPCR増幅し、精製することにより取得してもよい。
標準遺伝子の長さは特に限定されない。たとえば、標準遺伝子の長さは50ヌクレオチド以上であり得る。PCRで増幅する場合は、2000ヌクレオチド以内であれば簡便に増幅することができ、好適である。DNA合成機で合成する場合は数kbpまで合成することができる。
品質管理試料中の標準遺伝子の濃度は特に限定されない。たとえば、検体中のDNA濃度と同程度とすることができる。
品質管理試料中の標準遺伝子は、1本鎖であってもよいし、2本鎖であってもよい。また、直鎖状であってもよいし、環状であってもよい。
以下、品質管理試料の一調製例を具体的に説明する。
(1)置換変異を含む標準遺伝子の調製
配列番号1の配列を有する標準遺伝子を公知のDNA合成機で合成する。合成されたDNAを、DNAポリメラーゼ、dNTPsおよび緩衝液を含む市販の試薬を用いて、PCRにより増幅する。配列番号1の配列は、図29に示される。この配列は、PIK3CA遺伝子のエクソン20の配列であり、野生型PIK3CA遺伝子の3140番目のAのGへの置換(A3140G)を含む(A3140Gについては、米国特許公報第8026053号参照。米国特許公報第8026053号は参照として本明細書に組み込まれる)。配列番号1の配列は、476merの長さであり、A3140Gの置換変異は204番目の位置に存在する。なお、野生型PIK3CA遺伝子のコード配列は、配列番号2に示される。
増幅産物を、アガロースゲル電気泳動に供し、500bp付近のバンド部分を切り出す。切り出されたゲルを定法により精製する。精製後、DNAを定量し、TEバッファーで任意の濃度に希釈することにより配列番号1の配列を有する標準遺伝子が取得される。
(2)融合変異を含む標準遺伝子の調製
配列番号3の配列を有する標準遺伝子を公知のDNA合成機で合成する。合成されたDNAを、DNAポリメラーゼ、dNTPsおよび緩衝液を含む市販の試薬を用いて、PCRにより増幅する。配列番号3の配列は、図30に示される。配列番号3の配列は、EEML4遺伝子およびALK遺伝子の融合遺伝子の部分配列である。配列番号3の配列において、1〜500番目の配列がEML4遺伝子に由来し、501〜1000番目の配列がALK遺伝子に由来する(図30参照)。EML4−ALK融合遺伝子は、GenBank Accession No.AB663645.1に登録されている。配列番号3の配列は、GenBank Accession No.AB663645.1の1158〜2157番目の配列である。
上記(1)と同様にして配列番号3の配列を有する標準遺伝子が取得される。
(3)標準遺伝子を含む品質管理試料の調製
配列番号1の配列を有する標準DNA分子と配列番号3の配列を有する標準DNA分子とを任意の濃度で混合し、品質管理試料が調製される。この品質管理試料は、検体と混合され、配列解析用試料が調製される。
(4)解析
調整された配列解析用試料を用いて次世代シーケンサー(例えば、イルミナ社NextSeq500)を用いた遺伝子パネル検査の品質が評価される。この遺伝子パネルは、PIK3CA遺伝子およびEML4−ALK融合遺伝子を含む複数の遺伝子を標的遺伝子とする。配列解析用試料中の検体由来のゲノムDNAおよび標準遺伝子は、前処理(断片化、DNA濃縮、タグプライマーを用いたPCR増幅等)および配列解析に供され、標的遺伝子の配列情報が取得される。配列解析に際して品質管理のための指標が取得され、標準DNA分子の配列解析の指標に基づき、標的遺伝子の解析結果の品質が評価される。ユーザは当該品質評価の結果に基づき、解析対象遺伝子の解析結果の信頼性を判断することができる。
上記の例は、(3)において品質管理試料と、検体とが混合されるが、品質管理試料と、検体とを混合せず、各々を配列解析に供してもよい。
また、同じ遺伝子パネルを用いたパネル検査が繰り返し行われる場合、同じ品質管理試料が繰り返し使用されてもよい。図7のデータ121Dに示すように、各品質管理試料に含まれる標準遺伝子および変異種別が異なる複数種類の品質管理試料が、各遺伝子パネルに対応する品質管理試料として複数用意されていてもよい。
標準遺伝子の組み合わせが異なる複数の品質管理試料をパネル検査毎、週毎、月毎に使い分けることにより、パネル検査において変異を検出する処理の品質を評価するための品質評価指標を、より多様な標準遺伝子の変異を検出することによって生成することができる。よって、パネル検査の品質管理の網羅性が向上する。
例えば、遺伝子パネルAに対応する品質管理試料である品質管理試料Aと品質管理試料Bを図8に示す。品質管理試料Aに含まれる標準遺伝子a1、標準遺伝子a2、標準遺伝子a3が、品質管理試料Bでは、標準遺伝子b1、標準遺伝子b2、標準遺伝子b3にそれぞれ変更されている。
次に、図9の(a)に示すように、試料(検体由来のゲノムDNAおよび/または標準遺伝子)を、シーケンサー2で配列を読み取るための長さに断片化する(図5のステップS301)。試料DNAの断片化は、例えば、超音波処理や、核酸を断片化する試薬による処理などの公知の方法によって行うことができる。得られるDNA断片(核酸断片)は、例えば、数十から数百bpの長さであり得る。
続いて、図9の(b)に示すように、ステップS301で得られたDNA断片の両端(3´末端および5´末端)に、使用するシーケンサー2の種類やシーケンシングプロトコルに対応するアダプター配列を付与する(図5のステップS302)。但し、本工程は、シーケンサー2が、イルミナ社のシーケンサー、または、イルミナ社のシーケンサーと同様の方式を採用する装置である場合には必須の工程であるが、他の種類のシーケンサー2を用いる場合には、省略できる場合もある。
アダプター配列は、後の工程においてシーケンシングを実行するために使用する配列であり、一実施形態において、Bridge PCR法において、フローセルに固定化したオリゴDNAにハイブリダイズするための配列であり得る。
一態様において、図9の(b)の上段に示すように、DNA断片の両端に直接アダプター配列(例えば、図9中のアダプター1配列およびアダプター2配列)を付加してもよい。DNA断片へのアダプター配列の付加は、当該分野において公知の手法を用いることができる。例えば、DNA配列を平滑化し、アダプター配列をライゲーションしてもよい。
DNA断片へのアダプター配列の付加は、当該分野において公知の手法を用いることができる。例えば、DNA断片を平滑化し、インデックス配列をライゲーションした後に、さらに、アダプター配列をライゲーションさせてもよい。
次に、図10に示すように、アダプター配列を付与したDNA断片に対し、ビオチン化RNAベイトライブラリをハイブリダイズさせる(図5のステップS303)。
ビオチン化RNAベイトライブラリは、解析対象となる遺伝子とハイブリダイズするビオチン化RNA(以下、RNAベイトと称する。)によって構成されている。RNAベイトの長さは任意であるが、例えば、特異性を高めるために120bp程度のロングオリゴRNAベイトを使用してもよい。
なお、本実施形態におけるシーケンサー2を用いたパネル検査では、多数の遺伝子(例えば、100以上)が解析対象の遺伝子となる。
パネル検査で用いられる試薬には、当該多数の遺伝子の各々に対応するRNAベイトのセットが含まれる。パネルが異なれば、検査対象の遺伝子の数および種類が異なるため、パネル検査で用いられる試薬に含まれるRNAベイトのセットも異なる。解析対象の遺伝子とは異なる遺伝子を標準遺伝子として用いる場合は、標準遺伝子に結合するベイトも用意する必要がある。
そして、図11に示すように、解析対象となるDNA断片を回収する(図5のステップS304)。詳細には、図11の上段に示すように、ビオチン化RNAベイトライブラリをハイブリダイズさせたDNA断片に対し、ストレプトアビジンと磁性ビーズとが結合したストレプトアビジン磁性ビーズを混合する。
これにより、図11の中段に示すように、ストレプトアビジン磁性ビーズのストレプトアビジン部分と、RNAベイトのビオチン部分とが結合する。そして、図11の下段に示すように、ストレプトアビジン磁性ビーズを、磁石で集磁するとともに、RNAベイトとハイブリダイズしていない断片(即ち、解析対象とならないDNA断片)を洗浄により除去する。
これにより、RNAベイトとハイブリダイズしたDNA断片、すなわち、解析対象となるDNA断片を選択・濃縮することができる。シーケンサー2は、このように複数のRNAベイトを用いて選択されたDNA断片の核酸配列を読み取ることによって複数のリード配列を取得する。
(シーケンサー2によるリード配列の読み取り)
続いて、図13〜図15を適宜参照しながら、図4のステップS32の手順について図12に示す流れに沿って説明する。図12は、試料DNAの塩基配列をシーケンサー2によって解析する手順の一例を説明するフローチャートである。
図13の左欄から中央欄に示すように、濃縮されたDNA断片からストレプトアビジン磁性ビーズおよびRNAベイトを外し、PCR法によって増幅することにより、前処理を完了させる。
まず、図13の右欄に示すように、増幅されたDNA断片の配列をフローセルにアプライする(図12のステップS305)。
続いて、図14に示すように、フローセル上において、Bridge PCR法により、解析対象となるDNA断片を増幅する(図12のステップS306)。
すなわち、解析対象となるDNA断片(例えば、図14中のTemplate DNA)は、上述した前処理によって、両末端に2種類の異なるアダプター配列(例えば、図14中のアダプター1配列およびアダプター2配列)が付加された状態であり(図14の「1」)、このDNA断片を1本鎖にし、5’末端側のアダプター1配列をフローセル上に固定させる(図14の「2」)。
フローセル上には予め5’末端側のアダプター2配列が固定されており、DNA断片の3’末端側のアダプター2配列が、フローセル上の5’末端側のアダプター2配列と結合することにより、橋渡しをしたような状態となり、ブリッジが形成される(図14の「3」)。
この状態でDNAポリメラーゼによってDNA伸長反応を行い(図14の「4」)、変性させると、2本の1本鎖DNA断片が得られる(図14の「5」)。
このようなブリッジの形成、DNA伸長反応および変性をこの順に繰り返すことにより、多数の1本鎖DNA断片を局所的に増幅固定させて、クラスターを形成することができる(図14の「6」〜「10」)。
そして、図15に示すように、クラスターを形成する1本鎖DNAを鋳型として、Sequencing−by−synthesisにより、配列を読み取る(図12のステップS307)。
まず、フローセル上に固定された1本鎖DNA(図15の上段左欄)に対し、DNAポリメラーゼ、および、蛍光標識され、3’末端側がブロックされたdNTPを添加し(図15の上段中央欄)、さらに、シーケンスプライマーを添加する(図15の上段右欄)。
シーケンスプライマーは、例えば、アダプター配列の一部分にハイブリダイズするように設計されていればよい。換言すれば、シーケンスプライマーは、試料DNA由来のDNA断片を増幅するように設計されていればよく、インデックス配列を付加した場合には、さらにインデックス配列を増幅するように設計されていればよい。
シーケンスプライマーを添加後、DNAポリメラーゼによって3’末端ブロック蛍光dNTPの1塩基伸長反応を行う。3’末端側がブロックされたdNTPを用いるため、1塩基分伸長したところで、ポリメラーゼ反応は停止する。そして、DNAポリメラーゼを除去し(図15の中段右欄)、1塩基伸長した1本鎖DNA(図15の下段右欄)に対し、レーザー光により塩基に結合している蛍光物質を励起させて、そのときに起こる発光を写真として記録する(図15の下段左欄)。
写真は、蛍光顕微鏡を用いて、4種類の塩基を決定させるために、波長フィルタを変更しながら、A、C、G、Tそれぞれに対応する蛍光色毎に撮影する。すべての写真を取り込んだ後、写真データから塩基を決定する。そして、蛍光物質および3’末端側をブロックしている保護基を除去して、次のポリメラーゼ反応に進む。この流れを1サイクルとして、2サイクル目、3サイクル目と繰り返していくことにより、全長をシーケンシングすることができる。
以上の手法によれば、解析できる鎖長は150塩基×2までに達し、ピコタイタープレートよりもはるかに小さい単位での解析が可能であるため、高密度化することにより、1回の解析において40〜200Gbという膨大な配列情報を入手することができる。
(c.遺伝子パネル)
シーケンサー2によるリード配列の読み取りに用いられる遺伝子パネルは、上述したように、複数の解析対象を一度のランで解析するための解析キットを意味し、一実施形態において、特定の疾病に関する複数の遺伝子配列を解析するための解析キットであり得る。
本明細書中にて使用される場合、用語「キット」は、特定の材料を内包する容器(例えば、ボトル、プレート、チューブ、ディッシュなど)を備えた包装が意図される。好ましくは各材料を使用するための指示書を備える。本明細書中にてキットの局面において使用される場合、「備えた(備えている)」は、キットを構成する個々の容器のいずれかの中に内包されている状態が意図される。また、キットは、複数の異なる組成物を1つに梱包した包装であり得、ここで、組成物の形態は上述したような形態であり得、溶液形態の場合は容器中に内包されていてもよい。
キットは、物質Aおよび物質Bを同一の容器に混合して備えていても別々の容器に備えていてもよい。「指示書」には、キット中の各構成を、治療および/または診断に適用する手順が示されている。なお、「指示書」は、紙またはその他の媒体に書かれていても印刷されていてもよく、あるいは磁気テープ、コンピュータ読み取り可能ディスクまたはテープ、CD−ROMなどのような電子媒体に付されてもよい。キットはまた、希釈剤、溶媒、洗浄液またはその他の試薬を内包した容器を備え得る。さらに、キットは、治療および/または診断に適用するために必要な器具をあわせて備えていてもよい。
一実施形態において、遺伝子パネルは、上述した、品質管理試料、核酸を断片化する試薬、ライゲーション用試薬、洗浄液、PCR試薬(dNTP、DNAポリメラーゼなど)などの試薬、および磁性ビーズのうち一つ以上を備えていてもよい。また、遺伝子パネルは、断片化したDNAにアダプター配列を付加するためのオリゴヌクレオチド、断片化したDNAにインデックス配列を付加するためのオリゴヌクレオチド、RNAベイトライブラリなどのうち一つ以上を備えていてもよい。
特に、各遺伝子パネルが備えるインデックス配列は、当該遺伝子パネル固有の、当該遺伝子パネルを識別するための配列であり得る。また、各遺伝子パネルが備えるRNAベイトライブラリは、当該遺伝子パネルの各検査遺伝子に対応するRNAベイトを含む、当該遺伝子パネル固有のライブラリであり得る。
(配列データ読取部111、データ調整部113、変異同定部114)
続いて、解析実行部110の配列データ読取部111、データ調整部113、および変異同定部114について、図17〜図25を適宜参照しながら、図16に示す処理の流れに沿って説明する。図16は、品質評価装置1による解析の流れの一例を説明するフローチャートである。なお、図16に示す処理は、図2に示すステップS109、および図4に示すステップS33に対応している。
<配列データ読取部111>
まず、図16のステップS11において、配列データ読取部111は、シーケンサー2から提供されたリード配列情報を読み込む。
リード配列情報は、シーケンサー2で読み取られた塩基配列を示すデータである。シーケンサー2は、特定の遺伝子パネルを用いて得られた多数の核酸断片をシーケンシングして、それらの配列情報を読み取り、リード配列情報として品質評価装置1に提供する。
一態様において、リード配列情報には、読み取られた配列と共に、配列中の各塩基のクオリティスコアが含まれていてもよい。また、被検体の病変部位から採取されたFFPE試料をシーケンサー2に供して得られたリード配列情報と、同被検体の血液試料をシーケンサー2に供して得られたリード配列情報との両方が、品質評価装置1に入力される。
図17は、リード配列情報のファイルフォーマットの一例を示す図である。図22に示す例では、リード配列情報には、配列名、配列、および、クオリティスコアが含まれている。配列名は、シーケンサー2が出力するリード配列情報に付与された配列IDなどであってもよい。配列は、シーケンサー2で読み取られた塩基配列を示す。クオリティスコアは、シーケンサー2による塩基割当が正しく行われない確率を示す。任意の塩基のシーケンスクオリティスコア(Q)は、次の式により表される。
Q=−10log10
この式において、Eは、塩基割当が正しく行われない確率の推定値を表す。Q値が高いほど、エラーの確率が低いことを意味する。Q値が低いほど、そのリードは使用できない部分が大きくなる。
また、偽陽性の変異割当も増加し、結果の精度が低下する恐れがある。なお、「偽陽性」は、リード配列が判定対象となる真の変異を有していないにもかかわらず、変異を有すると判断されることを意味する。
なお、「陽性」は、リード配列が判定対象となる真の変異を有していることを意味し、「陰性」は、リード配列が対象となる変異を有していないことを意味する。例えば、クオリティスコアが20であれば、エラーの確率は100分の1であり、したがって、読み取った遺伝子配列中の各塩基の正確さ(「ベースコールの精度」とも呼ばれる)は99%であることを意味する。
<データ調整部113>
続いて、図16のステップS12において、データ調整部113は、配列データ読取部111が読み込んだリード配列情報に基づいて、リード配列情報に含まれる各核酸断片のリード配列のアライメントを実行する。
図18の(a)は、データ調整部113によるアライメントを説明する図である。データ調整部113は、参照配列データベース122に格納された参照配列(参照配列情報)を参照し、各核酸断片のリード配列を、リード配列情報の比較対象とすべき参照配列に対してマッピングすることにより、アライメントを実行する。一態様において、参照配列データベース122には、各解析対象の遺伝子に対応する参照配列が複数種類格納されている。
また、データ調整部113は、被検体の病変部位から採取されたFFPE試料をシーケンサー2に供して得られたリード配列情報と、同被検体の血液試料をシーケンサー2に供して得られたリード配列情報との両方について、アライメントを実行する。
図18の(b)は、データ調整部113のアライメント結果のフォーマットの一例を示す図である。アライメント結果のフォーマットは、リード配列、参照配列およびマッピング位置をそれぞれ特定し得るものであれば特に限定されないが、図18の(b)のように、参照配列情報、リード配列名、ポジション情報、マップ品質および配列を含むものであってもよい。
参照配列情報は、参照配列データベース122における参照配列名(参照配列ID)、参照配列の配列長などを示す情報である。リード配列名は、アライメント対象となった各リード配列の名称(リード配列ID)を示す情報である。ポジション情報は、リード配列の最左塩基がマッピングされた参照配列上の位置(Leftmost mapping position)を示す情報である。マップ品質は、当該リード配列に対応するマッピング品質を示す情報である。配列は、各リード配列に対応する塩基配列(例: …GTAAGGCACGTCATA…)を示す情報である。
図19は、参照配列データベース122の構造例を示す図である。図19に示すように、参照配列データベース122には、野生型の配列を示す参照配列(例えば、染色体#1〜23のゲノム配列)と、野生型の配列に対して既知の変位が組み込まれた参照配列とが記憶されている。
さらに、参照配列データベース122中の各参照配列には、遺伝子パネルに関する情報を示すメタデータが付与されている。各参照配列に付与する遺伝子パネルに関する情報は、例えば、各参照配列が対応する解析対象の遺伝子を直接的または間接的に示すものであり得る。
一実施形態において、情報選択部112は、データ調整部113が参照配列データベース122から参照配列を取得する際に、入力された遺伝子パネルに関する情報と、各参照配列のメタデータとを参照して、当該遺伝子パネルに関する情報に対応する参照配列を選択するよう制御してもよい。
例えば、一態様において、情報選択部112は、入力された遺伝子パネルに関する情報によって特定される解析対象の遺伝子に対応する参照配列を選択するようデータ調整部113を制御してもよい。これにより、データ調整部113は、使用された遺伝子パネルに関連する参照配列のみに対するマッピングを行えばよいため、解析の効率を向上させることができる。
また、他の実施形態において、情報選択部112は、上記制御を行わなくともよい。その場合、情報選択部112は、後述するように、変異同定部114またはレポート作成部115を制御すればよい。
図20は、参照配列データベース122に含まれる参照配列(野生型の配列を示すものでないもの)に組み込まれる既知の変異の例を示す図である。既知の変異は、外部のデータベース(例えば、COSMIC、ClinVarなど)に登録された変異であり、図20に示すように、染色体位置、遺伝子名および変異が特定されているものである。図25の例では、アミノ酸の変異が特定されているが、核酸の変異が特定されていてもよい。変異種別は、特に限定されず、置換、挿入、欠失など様々な変異であってもよく、他の染色体の一部の配列または逆相補配列が結合している変異であってもよい。
図21は、図16のステップS12におけるアライメントの詳細な工程の一例を説明するフローチャートである。一態様において、図16のステップS12におけるアライメントは、図21に示すステップS401〜S205によって実行される。
図21のステップS401において、データ調整部113は、配列データ読取部111が取得したリード配列情報に含まれる各核酸断片のリード配列のうち、アライメントを行っていないものを選択して、参照配列データベース122から取得した参照配列と比較する。そして、ステップS402において、データ調整部113は、リード配列との一致度が所定の基準を満たす参照配列上の位置を特定する。ここで、一致度とは、取得したリード配列情報と参照配列とがどの程度一致しているかを示す値であり、例えば、一致する塩基の数や割合などが一例として挙げられる。
一態様において、データ調整部113は、リード配列と参照配列の一致度を示すスコアを算出する。一致度を示すスコアは、例えば2つの配列間の同一性のパーセンテージ(percentage identity)とすることができる。データ調整部113は、例えば、リード配列の塩基と参照配列の塩基とが同一となる位置の数を特定し、一致した位置の数を求め、一致した位置の数を参照配列と比較されたリード配列の塩基数(比較ウィンドウの塩基数)で除算することによってパーセンテージを算出する。
図22の(a)は、スコア算出の一例を示す図である。一態様において、図22の(a)に示す位置において、リード配列R1と参照配列との一致度のスコアは、リード配列13塩基中13塩基が一致しているため100%となり、リード配列R2と参照配列との一致度のスコアは、リード配列13塩基中12塩基が一致しているため92.3%となる。
また、データ調整部113は、リード配列と参照配列の一致度を示すスコアの計算において、リード配列が参照配列に対して所定の変異(例えば、挿入・欠失(InDel : Insertion/Deletion))を含む場合には、通常の計算よりも低いスコアが付くように計算してもよい。
一態様において、データ調整部113は、リード配列が参照配列に対して挿入および欠失の少なくとも一方を含む配列について、例えば、上述したような通常計算で算出されたスコアに、挿入・欠失に対応する塩基数に応じた重み係数を乗算することで、スコアを補正してもよい。重み係数Wは、例えば、W={1−(1/100)×(挿入・欠失に対応する塩基数)}で計算してもよい。
図22の(b)は、スコア算出の他の例を示す図である。一態様において、図22の(b)に示す位置において、リード配列R3と参照配列との一致度のスコアは、通常計算では、リード配列17塩基(欠失を示す*も一塩基として計算)中15塩基が一致しているため88%となり、補正後のスコアは88%×0.98=86%となる。また、リード配列R4と参照配列との一致度のスコアは、通常計算では、リード配列21塩基中17塩基が一致しているため81%となり、補正後のスコアは81%×0.96=77.8%となる。
データ調整部113は、各参照配列に対するリード配列のマッピング位置を変えながら一致度のスコアを算出することにより、リード配列との一致度が所定の基準を満たす参照配列上の位置を特定する。その際、動的計画法、FASTA法、BLAST法などの当該分野において公知のアルゴリズムを使用してもよい。
図21に戻り、次に、データ調整部113は、リード配列との一致度が所定の基準を満たす参照配列上の位置が単一の位置であった場合には(ステップS203にてNO)、当該位置にリード配列をアライメントし、リード配列との一致度が所定の基準を満たす参照配列上の位置が複数の位置であった場合には(ステップS403にてYES)、データ調整部113は、最も一致度が高い位置に、リード配列をアライメントする(ステップS404)。
そして、データ調整部113は、配列データ読取部111が取得したリード配列情報に含まれる全リード配列をアライメントしていない場合には(ステップS405にてNO)、ステップS401に戻り、リード配列情報に含まれる全リード配列をアライメントした場合には(ステップS405にてYES)、ステップS12の処理を完了する。
<変異同定部114>
続いて、図16に戻り、ステップS13において、変異同定部114は、被検体の病変部位から採取された試料を供して得られたリード配列がアライメントされた参照配列の配列(アライメント配列)と、同被検体の血液試料を供して得られたリード配列がアライメントされた参照配列の配列(いわゆる、アライメント配列)とを比較する。
そして、図16のステップS14において、両アライメント配列間の相違を、変異として抽出する。例えば、同じ解析対象の遺伝子の同じ位置に対する血液検体由来のアライメント配列がATCGAであり、腫瘍組織由来のアライメント配列がATCCAであれば、変異同定部114は、GとCとの相違を変異として抽出する。
一態様において、変異同定部114は、抽出した変異に基づいて結果ファイルを生成する。図23は、変異同定部114が生成する結果ファイルのフォーマットの一例を示す図である。当該フォーマットは、例えば、Variant Call Format(VCF)に基づくものであり得る。
図23に示すように、結果ファイルには、抽出された変異毎に、位置情報、参照塩基および変異塩基が記述されている。位置情報は、参照ゲノム上の位置を示し、例えば、染色体番号と、該染色体上の位置とを含む。参照塩基は、上記位置情報が示す位置における参照塩基(A,T,C,Gなど)を示す。変異塩基は、参照塩基の変異後の塩基を示す。参照塩基は、血液検体由来のアライメント配列上の塩基であり、変異塩基は、腫瘍組織由来のアライメント配列上の塩基である。
なお、図23において、参照塩基がC、変異塩基がGである変異は、置換変異の例であり、参照塩基がC、変異塩基がCTAGである変異は、挿入(Insertion)変異の例であり、参照塩基がTCG、変異塩基がTである変異は、欠失(Deletion)変異の例である。また、変異塩基がG]17:198982]、]13:123456]T、C[2:321682[、または、[17:198983[Aである変異は、他の染色体の一部の配列または逆相補配列が結合している変異の例である。
図16に戻り、続いて、ステップS15において、変異同定部114は、変異データベース123を検索する。そして、ステップS16において、変異同定部114は、変異データベース123の変異情報を参照して、結果ファイルに含まれる変異にアノテーションを付与することで、変異を同定する。
図24は、変異データベース123の構造の一例を示す図である。変異データベース123は、例えば、COSMICやClinVarなどの外部データベースを基に構築される。また、一態様において、データベース中の各変異情報には、遺伝子パネルに関する情報に関するメタデータが付与されている。図24に示す例では、データベース中の各変異情報には、解析対象の遺伝子の遺伝子IDがメタデータとして付与されている。
図25は、変異データベース123中の変異情報の構造の詳細例を示す図である。図25に示すように、一態様において、変異データベース123に含まれる変異情報には、変異ID、変異の位置情報(例えば、「CHROM」、および「POS」)、「REF」、「ALT」、「Annotation」が含まれていてもよい。変異IDは、変異を識別するための識別子である。
変異の位置情報のうち、「CHROM」は染色体番号を示し、「POS」は染色体番号上の位置を示す。「REF」は、野生型(Wild type)における塩基を示し、「ALT」は、変異後の塩基を示す。「Annotation」は、変異に関する情報を示す。「Annotation」は、例えば、「EGFR C2573G」、「EGFR L858R」といったアミノ酸の変異を示す情報であってもよい。例えば、「EGFR C2573G」は、タンパク質「EGFR」の2573残基目のシステインがグリシンに置換した変異であることを示す。
上記の例のように、変異情報の「Annotation」は、塩基情報に基づく変異を、アミノ酸情報に基づく変異に変換するための情報であってもよい。この場合、変異同定部114は、参照した「Annotation」の情報に基づいて、塩基情報に基づく変異を、アミノ酸情報に基づく変異に変換可能である。
変異同定部114は、結果ファイルに含まれる変異を特定する情報(例えば、変異の位置情報と変異に対応する塩基情報)をキーとして、変異データベース123を検索する。例えば、変異同定部114は、「CHROM」、「POS」、「REF」および「ALT」の情報のいずれかをキーとして変異データベース123を検索してもよい。変異同定部114は、血液検体由来のアライメント配列と、病変部位由来のアライメント配列とを比較することで抽出した変異が変異データベース123に登録されていた場合に、当該変異を試料中に存在する変異として同定し、結果ファイルに含まれる当該変異にアノテーション(例えば、「EGFR L858R」、「BRAF V600E」など)を付与する。
(レポート作成部115)
レポート作成部115は、変異同定部114が出力した情報、および情報選択部112から提供される遺伝子パネルに関する情報に基づいてレポートを作成する(図2のステップS110、および図4のステップS35に対応)。作成されるレポートに掲載される情報は、遺伝子パネルに関する情報、および同定された変異に関する情報を含んでいる。
レポート作成部115は、情報選択部112が情報選択部112からの遺伝子パネルに関する情報に基づいて、レポートに掲載する対象を取捨選択し、選択されなかった情報はレポートから削除する。あるいは、情報選択部112が、入力部17を介して入力された遺伝子パネルに関する情報に対応する遺伝子に関連する情報を、レポートに掲載する対象として選択し、選択されなかった情報はレポートから削除されるよう、レポート作成部115を制御する構成であってもよい。
(出力部13)
レポート作成部115によって作成されたレポートは、リード配列情報の解析結果として、出力部13から、医療機関210に設置された端末装置5にデータ送信されてもよい(図2のステップS111に対応)。あるいは、品質評価装置1と接続されているプリンタ(図示せず)に送信され、該プリンタによって印刷された後に、紙媒体として、検査機関120から医療機関210へ送付されてもよい。
(品質評価指標)
品質評価試料を測定することにより得られた、品質評価指標は、例えば、以下のようなものが挙げられる。
・指標(i):シーケンサー2によるリード配列情報の読み取り品質を示す品質評価指標。
・指標(ii):複数の解析対象となる遺伝子に含まれる塩基のうちシーケンサー2で読み取られた塩基の割合を示す品質評価指標。
・指標(iii):リード配列情報のデプスを示す品質評価指標。
・指標(iv):リード配列情報のデプスのばらつきを示す品質評価指標。
・指標(v):品質管理試料に含まれる各標準遺伝子が有する変異が全て検出されたか否かを示す品質評価指標。
そして、指標(i)には、
指標(i−1):クオリティスコア、および
指標(i−2):クラスター濃度
が含まれ得る。
ここでは、上記の品質評価指標について、図26から図28を用いて説明する。
指標(i−1):クオリティスコア
クオリティスコアは、シーケンサー2によって読み取られた遺伝子配列中の各塩基の正確さを示す指標である。
例えば、シーケンサー2からFASTQファイルでリード配列情報が出力される場合、クオリティスコアもリード配列情報に含まれている(図17参照)。なお、クオリティスコアの詳細については、既に説明されているため、ここではその説明を省略する。
指標(i−2):クラスター濃度
シーケンサー2は、フローセル上で多数の1本鎖DNA断片を局所的に増幅固定させて、クラスターを形成する(図14の9参照)。そして、蛍光顕微鏡を用いてフローセル上のクラスター群を撮像し、A、C、G、Tそれぞれに対応する蛍光色(すなわち、蛍光波長が異なっている)を検出することによって配列を読み取っていく。クラスター密度は、シーケンシングを行うときのフローセル上に形成した、各遺伝子のクラスターがどの程度近接し合っているかを示す指標である。
例えば、クラスターの密度が過度に高くなり、クラスター同士が過度に近接したり重なり合ったりしてしまうと、フローセルを撮像した画像のコントラストすなわちS/N比が低くなるため、蛍光顕微鏡のフォーカスが取りにくくなる。それゆえ、蛍光を正しく検出することができなくなり、その結果、配列を正確に読み取ることができなくなる。
指標(ii):シーケンサー2で読み取られた塩基のうちシーケンサー2で読み取られたターゲット領域の塩基の割合を示す品質評価指標
この指標は、シーケンサー2により読み取られた塩基(ターゲット領域以外も含む)のうち、どれだけのターゲット領域の塩基が読み取られたかを示す指標であり、読み取られた塩基の総数と、ターゲット領域の塩基の総数との比として算出され得る。
指標(iii)リード配列情報のデプスを示す品質評価指標。
この指標は、解析対象となる遺伝子に含まれる各塩基について、その塩基を読み取ったリード配列情報の総数に基づく指標であり、読み取られた塩基のうちデプスが所定の値以上である塩基の総数と、読み取られた塩基の総数との比として算出され得る。
なお、デプス(depth)とは、同一の塩基について読み取ったリード配列情報の総数を意味している。
図26には、解析対象の遺伝子の全長がT塩基であり、読み取られた領域の塩基がt1塩基であった場合における、読み取られた各塩基のデプスを示すグラフを示している。このグラフの、横軸は塩基の位置であり、縦軸は各塩基のデプスである。図26に示す例では、読み取られた領域のt1塩基のうち、デプスが所定の値(例えば100)以上の領域の総塩基数は(t2+t3)塩基である。この場合、指標(iii)は、(t2+t3)/t1の値として生成される。
指標(iv):リード配列情報のデプスのばらつきを示す品質評価指標。
この指標は、デプスの均一性を示す指標である。読み取られた領域のうちのある部分を読み取ったリード配列情報だけが極端に多い場合、デプスの均一性は低く、読み取られた領域にわたって比較的万遍なくリード配列情報が存在している場合、デプスの均一性は高い。デプスの均一性は、これに限定されるものではないが、例えば、四分位範囲(IQR)を用いて数値化することができる。IQRが高いほど均一性が低く、IQRが低いほど均一性が高いことを示す。
指標(v):品質管理試料に含まれる各標準遺伝子が有する変異が全て検出されたか否かを示す品質評価指標。
この指標は、品質管理試料に含まれる各標準遺伝子が有する変異が検出されて、正しく同定されたことを示す指標である。図27に示す品質管理試料Aに含まれる各標準遺伝子が有する変異(「Variant」の欄を参照)は既知の変異である。これらの変異の位置、変異種別などを正しく同定できたか否かを品質評価指標として用いる。
図28は、レポート作成部115によって作成されたレポートの一例を示す図である。この例に示すレポートの左上の部分には、被検体IDを示す「患者ID」、「患者の性別」、「患者の病名」、医療機関210において該被検体を担当する医師の名前である「担当医師名」、および医療機関名を示す「機関名」が記載されている。
その下には、遺伝子パネルに関する情報として、「Aパネル」という遺伝子パネル名も含まれている。さらに、品質管理試料を用いた処理および解析結果などから得られた品質評価指標「QC指標」も、レポートに出力されている。
このレポートでは、「検出された遺伝子変異および関連薬剤」という欄に、変異同定部114によって同定された変異に関する情報と、薬剤に関するリストが含まれている。
なお、品質評価指標が所定の基準を下回った場合、検出された遺伝子変異に「*」を付すことができる。また、それに限らず、信頼性が低い旨を示すコメントを付すことができる。
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
1 品質評価装置
2 シーケンサー
3 管理サーバ
4 ネットワーク
11 制御部
13 出力部
100 遺伝子解析システム
117 品質管理部
121 遺伝子パネル関連情報データベース
122 参照配列データベース
124 薬剤データベース
125 リファレンスデータベース
126 品質評価基準

Claims (22)

  1. 被検体から採取した試料中の遺伝子に対し、第1の種別の遺伝子変異および前記第1の種別とは異なる第2の種別の遺伝子変異を含む複数の種別の遺伝子変異を検査する遺伝子検査における品質評価方法であって、
    前記第1の種別の遺伝子変異を有する第1の標準遺伝子と、前記第2の種別の遺伝子変異を有する第2の標準遺伝子と、を含む品質管理試料を準備し、
    前記品質管理試料に含まれる遺伝子の配列情報を取得し、
    取得した前記配列情報に基づいて、前記遺伝子検査の品質を評価するための指標を出力する、ことを特徴とする品質評価方法。
  2. 前記第1の種別の遺伝子変異は、ヌクレオチドの置換、欠失、もしくは挿入、多型、遺伝子のコピー数異常または遺伝子融合であり、
    前記第2の種別の遺伝子変異は、ヌクレオチドの置換、欠失、もしくは挿入、多型、遺伝子のコピー数異常または遺伝子融合であって、前記第2の種類の遺伝子変異とは異なる、請求項1記載の品質評価方法。
  3. 前記品質管理試料は、前記遺伝子検査において検出対象となる複数の変異種別の各々について、少なくとも1つの遺伝子変異を有する標準遺伝子を含むことを特徴とする請求項1または2に記載の品質評価方法。
  4. 前記指標に基づいて、前記遺伝子検査の品質を評価することを特徴とする請求項1〜3のいずれか1項に記載の品質評価方法。
  5. 前記品質管理試料に含まれる遺伝子の配列情報と共に、試料に含まれる遺伝子の配列情報を取得することを特徴とする請求項1〜4のいずれか1項に記載の品質評価方法。
  6. 前記品質管理試料は変異を有さない遺伝子をさらに含むことを特徴とする請求項1〜5のいずれか1項に記載の品質評価方法。
  7. 前記指標が所定の基準を満たすか否かに基づいて、前記遺伝子検査の品質を評価することを特徴とする請求項1〜6のいずれか1項に記載の品質評価方法。
  8. 前記所定の基準が、前記遺伝子検査に用いられる第1遺伝子パネルと前記第1遺伝子パネルと異なる第2遺伝子パネルで異なることを特徴とする請求項7に記載の品質評価方法。
  9. 前記品質管理試料に含まれる遺伝子の配列情報をシーケンサーにより取得し、
    前記指標が、前記シーケンサーによる前記配列情報の読み取り品質であることを特徴とする請求項1〜8のいずれか1項に記載の品質評価方法。
  10. 前記指標は、前記シーケンサーによって読み取られた遺伝子配列中の各塩基の正確さを示すことを特徴とする請求項9に記載の品質評価方法。
  11. 前記シーケンサーはフローセル上で遺伝子を増幅してクラスターを形成し、
    前記指標は、前記フローセルにおける各遺伝子のクラスターの近接度合を示すことを特徴とする請求項9に記載の品質評価方法。
  12. 前記品質管理試料に含まれる遺伝子の配列情報をシーケンサーにより取得し、
    前記指標は、前記シーケンサーで読み取られた塩基のうちターゲット領域の塩基の割合を示すことを特徴とする請求項1〜11のいずれか1項に記載の品質評価方法。
  13. 前記指標は、取得した前記品質管理試料に含まれる遺伝子の配列情報のデプスを示すことを特徴とする請求項1〜12のいずれか1項に記載の品質評価方法。
  14. 前記指標は、取得した前記品質管理試料に含まれる遺伝子の配列情報のデプスのばらつきを示すことを特徴とする請求項1〜13のいずれか1項に記載の品質評価方法。
  15. 遺伝子が異なる複数の品質管理試料を準備し、前記複数の品質管理試料から調製する品質管理試料を選択することを特徴とする請求項1〜14のいずれか1項に記載の品質評価方法。
  16. 前記遺伝子検査において解析対象とならない遺伝子であって、前記変異種別の変異を有する遺伝子を少なくとも1つ含む品質管理試料を調製することを特徴とする請求項1〜15のいずれか1項に記載の品質評価方法。
  17. 複数の検査施設に接続された管理サーバに、前記指標を送信することを特徴とする請求項1〜16のいずれか1項に記載の品質評価方法。
  18. 前記管理サーバから、品質の評価結果を受信することを特徴とする請求項17に記載の品質評価方法。
  19. 被検体から採取した試料中の遺伝子に対し、少なくとも、第1の種別の遺伝子変異と、前記第1の種別とは異なる第2の種別の遺伝子変異とを検査する遺伝子検査における品質を評価する品質評価装置であって、
    前記第1の種別の遺伝子変異を有する第1の標準遺伝子と、前記第2の種別の遺伝子変異を有する第2の標準遺伝子と、を含む品質管理試料に含まれる遺伝子の配列情報を解析するデータ調整部と、
    前記配列情報に基づいて、前記遺伝子検査の品質を評価するための指標を生成する品質管理部と、を備えることを特徴とする品質評価装置。
  20. 被検体から採取した試料中の遺伝子に対し、少なくとも、第1の種別の遺伝子変異と、前記第1の種別とは異なる第2の種別の遺伝子変異とを検査する遺伝子検査におけるプログラムであって、
    コンピュータに、
    前記第1の種別の遺伝子変異を有する第1の標準遺伝子と、前記第2の種別の遺伝子変異を有する第2の標準遺伝子と、を含む品質管理試料に含まれる遺伝子の配列情報を取得するステップと、
    取得した前記配列情報に基づいて、前記遺伝子検査の品質を評価するための指標を生成するステップと、を実行させるためのプログラム。
  21. 請求項20に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
  22. 被検体から採取した試料中の遺伝子に対し、少なくとも、第1の種別の遺伝子変異と、前記第1の種別とは異なる第2の種別の遺伝子変異とを検査する遺伝子検査における品質管理試料であって、
    前記第1の種別の遺伝子変異を有する第1の標準遺伝子と、前記第2の種別の遺伝子変異を有する第2の標準遺伝子と、を含むことを特徴とする品質管理試料。
JP2017208652A 2017-10-27 2017-10-27 品質評価方法、品質評価装置、プログラム、および記録媒体 Active JP7067896B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2017208652A JP7067896B2 (ja) 2017-10-27 2017-10-27 品質評価方法、品質評価装置、プログラム、および記録媒体
US16/170,863 US20190127807A1 (en) 2017-10-27 2018-10-25 Quality evaluation method, quality evaluation apparatus, program, storage medium, and quality control sample
CN201811245802.3A CN109722470A (zh) 2017-10-27 2018-10-25 品质评价方法、装置、程序、记录介质、及品质管理试样
EP18202846.4A EP3476946A1 (en) 2017-10-27 2018-10-26 Quality evaluation method, quality evaluation apparatus, program, storage medium, and quality control sample
EP22165085.6A EP4095262A3 (en) 2017-10-27 2018-10-26 Quality evaluation method, quality evaluation apparatus, program, storage medium, and quality control sample
JP2022075375A JP2022093592A (ja) 2017-10-27 2022-04-28 品質評価方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017208652A JP7067896B2 (ja) 2017-10-27 2017-10-27 品質評価方法、品質評価装置、プログラム、および記録媒体

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2022075375A Division JP2022093592A (ja) 2017-10-27 2022-04-28 品質評価方法

Publications (2)

Publication Number Publication Date
JP2019080501A true JP2019080501A (ja) 2019-05-30
JP7067896B2 JP7067896B2 (ja) 2022-05-16

Family

ID=64051401

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2017208652A Active JP7067896B2 (ja) 2017-10-27 2017-10-27 品質評価方法、品質評価装置、プログラム、および記録媒体
JP2022075375A Pending JP2022093592A (ja) 2017-10-27 2022-04-28 品質評価方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2022075375A Pending JP2022093592A (ja) 2017-10-27 2022-04-28 品質評価方法

Country Status (4)

Country Link
US (1) US20190127807A1 (ja)
EP (2) EP3476946A1 (ja)
JP (2) JP7067896B2 (ja)
CN (1) CN109722470A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021145140A1 (ja) 2020-01-16 2021-07-22 株式会社リコー 遺伝子検査装置の性能評価用試料及びその調製方法、並びに、遺伝子検査装置の性能評価用デバイス、性能評価方法、性能評価プログラム及び性能評価装置

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6920251B2 (ja) * 2018-06-29 2021-08-18 シスメックス株式会社 解析方法、情報処理装置、プログラム
WO2023099209A1 (en) * 2021-12-03 2023-06-08 Koninklijke Philips N.V. Sessing quality of genomic regions studied for inclusion in standardized clinical formats
CN117594130A (zh) * 2024-01-19 2024-02-23 北京普译生物科技有限公司 纳米孔测序信号评价方法、装置、电子设备和存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050214792A1 (en) * 2001-05-25 2005-09-29 Maine Molecular Quality Controls, Inc. Compositions and methods relating to nucleic acid reference standards
US20100280837A1 (en) * 2000-09-06 2010-11-04 Egenomics, Inc. System and method for tracking and controlling infections
US20140129201A1 (en) * 2012-11-07 2014-05-08 Good Start Genetics, Inc. Validation of genetic tests
US20160244838A1 (en) * 2013-09-27 2016-08-25 Natera, Inc. Cell free dna diagnostic testing standards
WO2016193084A1 (en) * 2015-05-29 2016-12-08 Altergon Sa Methods, supports and kits for enhanced cgh analysis
JP2017505115A (ja) * 2013-12-20 2017-02-16 イルミナ インコーポレイテッド 断片化したゲノムdna試料におけるゲノム連結性情報の保存
JP2017510244A (ja) * 2013-12-11 2017-04-13 アキュラジェン, インコーポレイテッド 稀な配列変異体を検出するための組成物および方法
JP2017520821A (ja) * 2014-05-12 2017-07-27 エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft ウルトラディープシークエンシングにおける希少バリアントコール

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6785614B1 (en) * 2000-05-31 2004-08-31 The Regents Of The University Of California End sequence profiling
US20020090622A1 (en) * 2000-08-23 2002-07-11 Monisola Adeokun Chemical compounds
SI3296407T1 (sl) 2004-03-02 2019-09-30 The Johns Hopkins University Mutacije gena PIK3CA pri rakih pri ljudeh
JP4871618B2 (ja) 2006-03-14 2012-02-08 株式会社日立ハイテクノロジーズ 精度管理システム
WO2012027446A2 (en) * 2010-08-24 2012-03-01 Mayo Foundation For Medical Education And Research Nucleic acid sequence analysis
JP5484533B2 (ja) 2012-08-22 2014-05-07 シスメックス株式会社 管理装置、管理システム、および検体分析装置の精度管理方法
KR101770962B1 (ko) * 2013-02-01 2017-08-24 에스케이텔레콤 주식회사 유전자 서열 기반 개인 마커에 관한 정보를 제공하는 방법 및 이를 이용한 장치
WO2015070191A2 (en) * 2013-11-08 2015-05-14 MORRISON, Carl Systems and methods for detection of genomic variants
CN106480205A (zh) * 2016-11-11 2017-03-08 北京吉因加科技有限公司 用于同时检测多种突变类型的序列组合和探针
CN106636404A (zh) * 2016-12-23 2017-05-10 上海思路迪生物医学科技有限公司 基于高通量测序检测人egfr基因变异的质控方法及试剂盒

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100280837A1 (en) * 2000-09-06 2010-11-04 Egenomics, Inc. System and method for tracking and controlling infections
US20050214792A1 (en) * 2001-05-25 2005-09-29 Maine Molecular Quality Controls, Inc. Compositions and methods relating to nucleic acid reference standards
US20140129201A1 (en) * 2012-11-07 2014-05-08 Good Start Genetics, Inc. Validation of genetic tests
US20160244838A1 (en) * 2013-09-27 2016-08-25 Natera, Inc. Cell free dna diagnostic testing standards
JP2017510244A (ja) * 2013-12-11 2017-04-13 アキュラジェン, インコーポレイテッド 稀な配列変異体を検出するための組成物および方法
JP2017505115A (ja) * 2013-12-20 2017-02-16 イルミナ インコーポレイテッド 断片化したゲノムdna試料におけるゲノム連結性情報の保存
JP2017520821A (ja) * 2014-05-12 2017-07-27 エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft ウルトラディープシークエンシングにおける希少バリアントコール
WO2016193084A1 (en) * 2015-05-29 2016-12-08 Altergon Sa Methods, supports and kits for enhanced cgh analysis

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
GARGIS, AMY S ET AL.: "Assuring the quality of next-generation sequencing in clinical laboratory practice", NAT BIOTECHNOL., vol. No.30 Vol.11, JPN6020034538, November 2012 (2012-11-01), pages 1 - 8, ISSN: 0004345139 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021145140A1 (ja) 2020-01-16 2021-07-22 株式会社リコー 遺伝子検査装置の性能評価用試料及びその調製方法、並びに、遺伝子検査装置の性能評価用デバイス、性能評価方法、性能評価プログラム及び性能評価装置
JPWO2021145140A1 (ja) * 2020-01-16 2021-07-22

Also Published As

Publication number Publication date
JP7067896B2 (ja) 2022-05-16
EP3476946A1 (en) 2019-05-01
CN109722470A (zh) 2019-05-07
US20190127807A1 (en) 2019-05-02
JP2022093592A (ja) 2022-06-23
EP4095262A3 (en) 2023-03-15
EP4095262A2 (en) 2022-11-30

Similar Documents

Publication Publication Date Title
US20230295690A1 (en) Haplotype resolved genome sequencing
KR102356323B1 (ko) 서열 변이체 콜에 대한 검증방법 및 시스템
JP2022093592A (ja) 品質評価方法
JP7054133B2 (ja) 配列解析方法、配列解析装置、参照配列の生成方法、参照配列生成装置、プログラム、および記録媒体
US20200082911A1 (en) Analysis method, information processing apparatus, gene analysis system and non-transitory storage medium
US20200350035A1 (en) Gene analysis method, gene analysis apparatus, management server, gene analysis system, program, and storage medium
JP2023139180A (ja) 遺伝子解析方法および遺伝子解析装置
JP2019083011A5 (ja)
Nagy et al. Next-generation sequencing and mutational analysis: implications for genes encoding LINC complex proteins
JP7148681B2 (ja) レポートを作成する方法、情報処理装置、プログラム
WO2017009718A1 (en) Automatic processing selection based on tagged genomic sequences
JP6891151B2 (ja) 解析方法、情報処理装置、遺伝子解析システム、プログラム、記録媒体
Hambuch et al. Whole Genome Sequencing in the Clinical Laboratory

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200915

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20201104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210629

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20210826

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211021

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220301

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20220324

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220428

R150 Certificate of patent or registration of utility model

Ref document number: 7067896

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150