JP2023067270A - 制御方法、及び解析システム - Google Patents
制御方法、及び解析システム Download PDFInfo
- Publication number
- JP2023067270A JP2023067270A JP2021178344A JP2021178344A JP2023067270A JP 2023067270 A JP2023067270 A JP 2023067270A JP 2021178344 A JP2021178344 A JP 2021178344A JP 2021178344 A JP2021178344 A JP 2021178344A JP 2023067270 A JP2023067270 A JP 2023067270A
- Authority
- JP
- Japan
- Prior art keywords
- sample
- sequence data
- information
- nucleic acid
- library
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Biophysics (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Bioethics (AREA)
- Databases & Information Systems (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
【課題】第1の施設が取得した核酸配列データに基づいて第2の施設において同一被検者の複数の核酸配列データを用いた解析を行うコンピュータの制御方法及び解析システムを提供する。【解決手段】核酸情報送受信システム1において、遺伝子パネル検査において、解析依頼元施設10に設置され、核酸配列を読み取るシーケンサー2を用いて得られた核酸配列データを第2の施設に提供するデータ送信装置5と、依頼先施設30に設置され、同一の被検者の検体から調製された複数のライブラリー試料の夫々に対応する、核酸配列データを含む配列データセットを解析依頼元施設10からネットワーク11を介して受信し、第1及び第2核酸配列データを解析し、第1及び第2配列データの解析結果に基づく解析情報を出力する核酸配列解析装置7と、を備える。【選択図】図1
Description
本発明は、遺伝子パネル検査において、核酸配列を読み取るシーケンサーを用いて第1の施設で得られた核酸配列データを第2の施設で解析するためのコンピュータを制御する制御方法に関する。また、本発明は、遺伝子パネル検査において、核酸配列を読み取るシーケンサーを用いて第1の施設で得られた核酸配列データを第2の施設で解析する解析システムに関する。
がんゲノム医療の進展に伴い、医療施設において、遺伝子パネル検査を実施する体制の整備が進められている。その中には、新たな研究に活用するために、検査室に次世代シーケンサー(NGS)を導入し、遺伝子パネル検査を通じて得られた知見を蓄積する医療施設も増えてきている。
一方で、遺伝子パネル検査においては、バイオインフォマティシャンによるデータ解析が必須である。しかしながら、バイオインフォマティシャンの数は少なく、人材を確保することが難しい場合がある。そのため、遺伝子パネル検査の中で、医療施設で取得された核酸配列データの解析を、外部の専門機関に依頼したいというニーズがある。
特許文献1には、シーケンサーが核酸配列データを取得し、取得した核酸配列データをクラウド環境に送信し、クラウド環境により核酸配列データを解析するシステムが記載されている。上記特許文献1に記載のシステムによれば、シーケンサーで取得された核酸配列データを、クラウド環境により解析することが可能である。
NGSは、通常、同時に多数(例えば、16)の測定試料(ライブラリー)をまとめて測定するため、1回の測定で、複数の被検者から採取した複数のライブラリーの夫々に対応する複数の核酸配列データが得られる。更には、遺伝子パネル検査の種類によっては、同一被検者の検体から調製された複数のライブラリーそれぞれに対応する核酸配列データをセットにして解析することが必要な場合がある。
例えば、マッチドペア検査では、同一被検者から採取した腫瘍検体の核酸配列データと非腫瘍検体の核酸配列データとをセットで解析する。このような場合において、遺伝子パネル検査における核酸配列データの解析を外部に依頼する場合、外部の解析施設において、NGSで取得された複数の核酸配列データの中から、同一被検者の複数の検体に対応するそれぞれの核酸配列データの正しい組み合わせを抽出し、その正しい組み合わせの複数の核酸配列データを解析することが必要である。
しかし、上記特許文献1では、解析依頼元施設である医療施設が取得した複数の核酸配列データの中から、外部の解析施設において同一被検者の複数の核酸配列データを抽出し、当該被検者のために複数の核酸配列データを用いた解析を実行することは考慮されていなかった。
そこで、本発明の目的は、第1の施設が取得した核酸配列データに基づいて、第2の施設において同一被検者の複数の核酸配列データを用いた解析を正確かつ迅速に行うことが可能になる、制御方法、及び解析システムを提供することにある。
本発明の制御方法は、遺伝子パネル検査において、核酸配列を読み取るシーケンサーを用いて第1の施設で得られた核酸配列データを第2の施設で解析するためのコンピュータを制御する制御方法であって、同一の被検者の検体から調製された第1ライブラリー試料及び第2ライブラリー試料を含む複数のライブラリー試料の夫々に対応する、前記シーケンサーを用いて得られた複数の核酸配列データを含む配列データセットと、前記第1ライブラリー試料及び前記第2ライブラリー試料が前記同一の被検者の検体から調製されたことを表す紐づけ情報と、を前記第1の施設からネットワークを介して受信し、前記紐づけ情報により紐づけられた前記第1ライブラリー試料及び前記第2ライブラリー試料の夫々に対応する第1配列データ及び第2配列データを解析し、前記第1配列データの解析結果と前記第2配列データの解析結果とに基づく解析情報を出力する。
また、本発明の解析システムは、遺伝子パネル検査において、核酸配列を読み取るシーケンサーを用いて第1の施設で得られた核酸配列データを第2の施設で解析する解析システムであって、同一の被検者の検体から調製された第1ライブラリー試料及び第2ライブラリー試料を含む複数のライブラリー試料の夫々に対応する、前記シーケンサーを用いて得られた核酸配列データを含む配列データセットと、前記第1ライブラリー試料及び前記第2ライブラリー試料が前記同一の被検者の検体から調製されたことを表す紐づけ情報と、を前記第1の施設からネットワークを介して受信し、前記第1の施設から取得した前記配列データセット及び前記紐づけ情報を第2コンピュータに送信する第1コンピュータと、前記紐づけ情報により紐づけられた前記第1配列データ及び前記第2配列データを解析し、前記第1配列データの解析結果と前記第2配列データの解析結果とに基づく解析情報を出力する前記第2コンピュータと、を備える。
また、本発明の解析システムは、遺伝子パネル検査において、核酸配列を読み取るシーケンサーを用いて第1の施設で得られた核酸配列データを第2の施設で解析する解析システムであって、同一の被検者の検体から調製された第1ライブラリー試料及び第2ライブラリー試料を含む複数のライブラリー試料の夫々に対応する、前記シーケンサーを用いて得られた核酸配列データを含む配列データセットと、前記第1ライブラリー試料及び前記第2ライブラリー試料が前記同一の被検者の検体から調製されたことを表す紐づけ情報と、を前記第1の施設からネットワークを介して受信し、前記紐づけ情報により紐づけられた前記第1配列データ及び前記第2配列データを解析し、前記第1配列データの解析結果と前記第2配列データの解析結果とに基づく解析情報を出力するコンピュータを備える。
本発明によれば、第1の施設が取得した核酸配列データに基づいて、第2施設において同一被検者の複数の核酸配列データを用いた解析を正確かつ迅速に行うことが可能になる、制御方法、及び解析システムを提供できる。
以下、図面を参照しながら、本発明に係る制御方法及び解析システムの実施形態の例について詳細に説明する。以下で説明する実施形態はあくまでも例であって、本発明は以下の実施形態に限定されない。また、以下の各実施形態では、図面において同一構成に同一符号を付し、重複する説明を省略する。
以下の説明において、腫瘍は、良性上皮性腫瘍、良性非上皮性腫瘍、悪性上皮性腫瘍、悪性非上皮性腫瘍を含み得る。腫瘍の発生母地は、制限されない。腫瘍の発生母地として、(1)気管、気管支又は肺等の呼吸器系組織;(2)上咽頭、食道、胃、十二指腸、空腸、回腸、盲腸、虫垂、上行結腸、横行結腸、S状結腸、直腸又は肛門部等の消化管組織;(3)肝臓;(4)膵臓;(5)膀胱、尿管又は腎臓等の泌尿器系組織;(6)卵巣、卵管及び子宮等の女性生殖器系組織;(7)乳腺:(8)前立腺等の男性生殖器系組織;(9)皮膚;(10)視床下部、下垂体、甲状腺、副甲状腺、副腎等の内分泌系組織;(11)中枢神経系組織;(12)骨軟部組織;(13)骨髄、リンパ節等の造血系組織;(14)血管等を例示することができる。
以下の説明において、試料は、被検者から採取した組織、体液、排泄物等の検体から調製された試料であって、腫瘍細胞又は非腫瘍細胞に由来する核酸を含む。核酸は、デオキシリボ核酸(以下、DNAという)、又はリボ核酸(以下、RNAという)を含む。核酸は、細胞内に存在してもよいし、細胞が破壊したり死滅したりしたときに細胞外へ漏れ出ることによって、体液内に存在するものであってもよい。体液内に存在する核酸としては、例えば、cell free DNA(cfDNA)、及びcirculating tumor DNA(ctDNA)が挙げられる。体液は、例えば、血液、骨髄液、腹水、胸水、髄液等である。排泄物は、例えば大便、尿、喀痰である。検体として、腹腔内洗浄液や大腸洗浄液など、患者の体の一部を洗浄した後に得られる液体を用いてもよい。検体に含まれる核酸量は、核酸の配列を検出できる量であれば制限されない。また、非腫瘍細胞に由来する核酸配列データを取得する場合、非腫瘍細胞に由来する核酸を含む検体が用いられる。上記組織、体液等に含まれる非腫瘍細胞の濃度は、非腫瘍細胞に存在する核酸の配列を検出できる限り制限されない。ここで、腫瘍細胞が固形腫瘍に由来する場合には、非腫瘍細胞に由来する核酸を含む検体として、例えば、末梢血、口腔粘膜組織、皮膚組織等を使用することができる。腫瘍細胞が造血系組織に由来する場合には、非腫瘍細胞に由来する核酸を含む検体として、例えば、口腔粘膜組織、皮膚組織等を使用することができる。
検体は新鮮組織、新鮮凍結組織、パラフィン包埋組織等から採取することができる。検体の採取は公知の方法にしたがって行うことができる。また、以下の説明において、腫瘍細胞に由来する核酸を含む試料と、非腫瘍細胞に由来する核酸を含む試料とを、同一の被検者から採取する場合、非腫瘍細胞に由来する核酸を含む試料と、腫瘍細胞に由来する核酸を含む試料とは、同時期に採取されてもよいし、異なる時期に採取されてもよい。
核酸配列の解析対象となる遺伝子は、ヒトゲノム上に存在する遺伝子である限り、制限されない。好ましくは、腫瘍の発症、予後、治療効果に関連する遺伝子である。また、以下の説明において、遺伝子変異は、疾患に関連する変異であっても、遺伝子の配列多型であってもよい。遺伝子の「多型」は、SNV(Single Nucleotide Variant、一塩基多型)、VNTR(Variable Nucleotide of Tandem Repeat、反復配列多型)、STRP(Short Tandem Repeat Polymorphism)、及びマイクロサテライト多型などを含む。また遺伝子変異は、融合遺伝子変異であってもよい。
以下の説明において、核酸配列データは、核酸配列を反映したデータである限り制限されない。遺伝子変異に関する情報は、検体の採取元である被検者が保有する遺伝子変異に関する情報である限り制限されない。例えば、遺伝子変異に関する情報には、少なくとも変異が検出された遺伝子名を示すラベルを含み得る。好ましくは、遺伝子変異に関する情報は、変異が検出された遺伝子名を示すラベルと検出された核酸配列情報及び/又は変異により生じるアミノ酸配列の情報を含んでいてもよい。また、遺伝子変異に関する情報は、変異が検出された遺伝子のローカス情報、参照配列情報、被検者が保有する変異配列の情報を含んでいてもよい。また、遺伝子変異に関する情報は、変異が有るか無いかを検出した情報に限られず、例えば、遺伝子変異がある可能性を示唆する情報(例えば、モザイク変異)であってもよい。
(第1実施形態)
図1は、第1実施形態に係る、各施設に設置された核酸情報送受信システム1の概略構成図である。先ず、図1を用いて、核酸情報送受信システム1の概略構成と、核酸情報送受信システム1における主な情報の流れの概要について説明する。核酸情報送受信システム1は、シーケンサー2、ストレージ(記憶装置)3、データ送信装置5、及び解析システム4を備え、解析システム4は、受付装置6、及び核酸配列解析装置7を有する。データ送信装置5、受付装置6、及び核酸配列解析装置7は、インターネットであるネットワーク11を介して互いに接続されている。ネットワーク11には、更に変異情報データベース8が接続されている。
図1は、第1実施形態に係る、各施設に設置された核酸情報送受信システム1の概略構成図である。先ず、図1を用いて、核酸情報送受信システム1の概略構成と、核酸情報送受信システム1における主な情報の流れの概要について説明する。核酸情報送受信システム1は、シーケンサー2、ストレージ(記憶装置)3、データ送信装置5、及び解析システム4を備え、解析システム4は、受付装置6、及び核酸配列解析装置7を有する。データ送信装置5、受付装置6、及び核酸配列解析装置7は、インターネットであるネットワーク11を介して互いに接続されている。ネットワーク11には、更に変異情報データベース8が接続されている。
シーケンサー2、ストレージ3、及びデータ送信装置5は、解析依頼元施設10、例えば、病院(医療施設)、検査センター、又は生命医科学の研究所等に設置される。シーケンサー2は、次世代シーケンサー(NGS)である。以下、シーケンサーと言及した場合、それは次世代シーケンサーを指すものとする。シーケンサー2は、核酸の塩基配列情報を読み取る装置であり、例えば、MiSeqシステム(Illumina, Inc製)、NextSeq550システム(Illumina, Inc製)、Ion GeneStudio S5システム(Thermo Fisher Scientific, Inc製)、又はIon Torrent Genexusシステム(Thermo Fisher Scientific, Inc製)等を用いることができる。シーケンサー2は、1回のシーケンスランで、複数のライブラリー試料(例えば、16個)の核酸配列を読み取る。シーケンサー2は、1回のシーケンスランで、同一の被検者から採取した検体から調製した第1ライブラリー試料及び第2ライブラリー試料を含む複数のライブラリー試料の夫々から核酸配列を読み取り、各ライブラリー試料に対応する複数の核酸配列を含む配列データセットを生成する。シーケンサー2は、1回のシーケンスランで、1人の被検者に対応する配列データセットを生成してもよいし、複数の被検者に夫々対応する複数の配列データセットを生成してもよい。また、シーケンサー2には、第1ライブラリー試料及び第2ライブラリー試料が同一の被検者の検体から調製されたことを表す紐づけ情報が入力される。ライブラリー試料とは、核酸配列の読取用に調製された試料であり、ライブラリーとも呼ばれる。ライブラリー試料は、例えば、Onco Guide NCCオンコパネルキット(シスメックス株式会社製)を用いて調製することができる。紐づけ情報は、複数のライブラリー試料が同一の被検者の検体から調製されたことを表す情報である。紐づけ情報は、第1ライブラリー試料及び第2ライブラリー試料を識別するための試料識別情報と、第1ライブラリー試料及び第2ライブラリー試料に対応する検体の採取元である同一の被検者を識別するための被検者識別情報と、を含む。
シーケンサー2は、生成した配列データセットと紐づけ情報とに基づき、配列データセットと紐づけ情報とを含むシーケンスランデータを生成し、ストレージ3に記憶する。配列データセット、及びシーケンスランデータについては、以下で図4を用いて詳細に説明する。ストレージ3は、Network Attached Storage(NAS)である。NASは、ネットワークに直接接続可能な記憶装置として構成される。
データ送信装置5は、コンピュータである。データ送信装置5は、入力部5a、表示部5b、送受信部5c、及び制御装置5eを備え、制御装置5eは、制御部5fと、記憶部5gを含む。入力部5aは、データの入力に用いられ、キーボード及びマウスで構成される。表示部5bは、液晶パネルで構成され、画像を表示する。表示部5bは、有機ELパネルで構成されてもよい。入力部5a及び表示部5bが、タッチセンサとディスプレイとが一体化されたタッチパネルで構成されてもよい。送受信部5cは、データ送信装置5に接続されたネットワーク11を介して外部の装置とデータを送受信するためのインターフェースであり、例えばイーサネットに対応したインターフェースで構成される。制御部5fはCPUであり、記憶部5gはSSD及び半導体メモリで構成される。
データ送信装置5は、送受信部5cを介して、ストレージ3からシーケンスランデータを読み出し、送受信部5c及びネットワーク11を介して、シーケンスランデータを受付装置6に送信する。
受付装置6は、依頼受付施設20、例えば、サーバセンターに設置される。解析依頼元施設10と依頼受付施設20とは異なる施設である。受付装置6は、クラウドシステムを構成するコンピュータであってもよい。サーバセンターは、クラウドサービスプロバイダの施設であってもよいし、核酸配列の解析サービスを提供する企業の施設であってもよい。受付装置6は、コンピュータである。受付装置6は、入力部6a、表示部6b、送受信部6c、及び制御装置6eを有する。制御装置6eは、制御部6fと、記憶部6gを含む。入力部6a、表示部6b、送受信部6c、及び制御装置6eのハードウェア構成は、入力部5a、表示部5b、送受信部5c、及び制御装置5eと夫々同様である。受付装置6は、送受信部6c及びネットワーク11を介して、シーケンスランデータを核酸配列解析装置7に送信する。
核酸配列解析装置7は、依頼先施設30、例えば、データ解析施設に設置される。解析依頼元施設10と依頼先施設30とは異なる施設である。依頼受付施設20と依頼先施設30とは異なる施設であるが、同一の施設であってもよい。核酸配列解析装置7は、クラウドシステムを構成するコンピュータであってもよい。データ解析施設は、クラウドサービスプロバイダの施設であってもよいし、核酸配列の解析サービスを提供する企業の施設であってもよい。核酸配列解析装置7は、コンピュータである。核酸配列解析装置7は、入力部7a、表示部7b、送受信部7c及び制御装置7eを有する。制御装置7eは、制御部7fと記憶部7gを含む。入力部7a、表示部7b、送受信部7c及び制御装置7eのハードウェア構成は、入力部5a、表示部5b、送受信部5c、及び制御装置5eと夫々同様である。核酸配列解析装置7は、ネットワーク11を介して変異情報データベース8にアクセス可能になっている。
変異情報データベース8は、例えば、外部の公開配列情報データベース、又は公開既知変異情報データベースで構成される。核酸配列解析装置7の制御装置7eは、受付装置6から受信したシーケンスランデータに含まれる各核酸配列データを、変異情報データベース8に記憶されている参照核酸配列データと照合し、核酸配列データ毎に遺伝子の変異情報を生成する。
図2は、シーケンサー2が実行する処理について説明するフローチャートである。図2を参照して、シーケンサー2が実行する処理について説明する。最初に、ステップS1で、シーケンサー2は、シーケンスランID、症例ID、サンプルID、及びインデックスIDを受け付け、電子ファイルであるサンプルシートを生成する。シーケンスランIDは、シーケンスランデータを識別する情報である。サンプルシートは、症例ID、サンプルID、及びインデックスIDを含む。サンプルシートは、1回のシーケンスラン、すなわち、カートリッジ1枚につき1つ生成される。1回のシーケンスラン、すなわち、カートリッジ1枚では、複数のライブラリー試料(例えば、16個)の核酸配列が読み取られる。複数のライブラリー試料は、複数の被検者(例えば、8名)の腫瘍組織と非腫瘍組織(例えば、血液)の夫々から調製された複数の試料(例えば、16個)の夫々に試薬で前処理を施して、複数の試料に互いに異なるインデックス配列を付加することで作製される。第1実施形態では、各ライブラリー試料は、DNAから調製された試料である。症例IDは、各ライブラリー試料の採取元である被検者を識別する情報である。サンプルIDは、各ライブラリー試料を識別する情報である。インデックスIDは各ライブラリー試料に付加されたインデックス配列を識別する情報である。
図3は、サンプルシート35の一例を示す図である。図3に示す例では、サンプルIDと症例IDとが対応付けられている。症例IDが同一のライブラリー試料は、同一の被検者の検体から調製された試料である。サンプルシート35のサンプルIDは、試料識別情報の一例であり、症例IDは、被検者識別情報の一例であるとともに、複数のライブラリー試料が同一の被検者の検体から調製されたことを表す紐づけ情報の一例である。各サンプルIDには、インデックスIDとインデックス配列が更に対応付けられている。インデックス配列は、ライブラリー試料に付加されたインデックス配列を示す情報である。
例えば、サンプルIDが1010のライブラリー試料は、特定の疾患を有する被検者Aの検体から調製され、インデックスIDが001の試料である。このライブラリー試料のインデックス配列は、CGGATTGCである。シーケンサー2が読み取った核酸配列にCGGATTGCの部分核酸配列が含まれることを判定することで、その核酸配列データが、サンプルIDが1010のライブラリー試料の核酸配列データであることを識別できる。サンプルIDが2019のライブラリー試料は、特定の疾患を有する被検者Aの検体から調製され、インデックスIDが009の試料である。このライブラリー試料のインデックス配列は、ACTATGCAである。サンプルIDが1010のライブラリー試料と、サンプルIDが2019のライブラリー試料と、が同一の症例ID(A)を有することから、両ライブラリー試料が同一の被検者Aの検体から調製されたことが表されている。同様に、サンプルIDが1013のライブラリー試料と、サンプルIDが2021のライブラリー試料と、が同一の症例ID(B)を有することから、両ライブラリー試料が別の同一の被検者Bの検体から調製されたことが表されている。更に、第1実施形態では、サンプルIDが1から始まるIDである場合には、対応するライブラリー試料が、腫瘍細胞由来であることを示し、サンプルIDが2から始まるIDである場合には、対応するライブラリー試料が、非腫瘍細胞由来であることを示す。よって、サンプルシートのデータを参照すれば、同一の被検者に由来する複数のライブラリー試料と、各ライブラリー試料が腫瘍細胞由来のものか又は非腫瘍細胞由来のものかという情報と、を識別できる。
なお、サンプルシートの表記は、紐づけ情報を含む如何なる表記でもよい。例えば、図5、すなわち、変形例のサンプルシート35′を表す図に示すように、サンプルシート35に、各ライブラリー試料が腫瘍検体に由来するものか非腫瘍検体に由来するものかを識別するための腫瘍/非腫瘍IDの列を追加してもよい。サンプルシート35′では、Tが腫瘍検体由来であることを示し、Nが非腫瘍検体由来であることを示す。この場合、サンプルIDによって、対応するライブラリー試料が腫瘍細胞由来のものであるか、非腫瘍細胞由来を表す必要がなくなり、サンプルIDの付与が容易になる。
また、サンプルシートの表記は、例えば、図6(A)、すなわち、変形例のサンプルシート35′′を表す図に示すように、症例IDの列を省略してもよい。この場合、サンプルIDは、2つの文字、記号又は数字の組で構成されてもよい。そして、例えば、1つ目の文字、記号又は数字が、被検者を識別できる識別情報を示し、2つ目の文字、記号又は数字が、腫瘍検体又非腫瘍検体を識別できる識別情報を示していてもよい。例えば、サンプルシート35′′の表において、1つ目のアルファベットの大文字、「A」「B」「C」「D」が、検体を採取した被検者を示す識別情報でもよく、2つ目の大文字のアルファベットの「T」又は「N」において、「T」が腫瘍検体を示す識別情報であって、「N」が非腫瘍検体を示す識別情報でもよい。サンプルシート35′′では、サンプルIDによって、複数のライブラリー試料が同一の被検者の検体から調製されたことが表されている。例えば、サンプルIDがA-Tのライブラリー試料と、サンプルIDがA-Nのライブラリー試料は、いずれも被検者Aの検体から調製された試料であることが表されている。従って、サンプルシート35′′のサンプルIDは、複数のライブラリー試料が同一の被検者の検体から調製されたことを表す紐づけ情報の一例である。上記図3、図5、及び図6(A)を用いて説明した例では、紐づけ情報は、サンプルID又は症例IDである。従って、紐づけ情報は、複数のライブラリー試料が同一の被検者の検体から調製されたことを表すとともに、ライブラリー試料又は被検者を識別している。すなわち、上記図3、図5、及び図6(A)を用いて説明した例では、試料又は被検者を識別する情報を紐づけ情報としても活用しており、紐づけ情報を別途シーケンサー2に入力する必要がない。
図6(B)は、サンプルシートの他の変形例を示す図である。図6(B)に示すように、サンプルシート35′′′は、サンプルシート35と比較して、症例IDの列を含まず、ペアとなるサンプルIDの列を含む。ペアとなるサンプルIDは、対応するサンプルIDにより識別されるライブラリー試料の検体の採取元である被検者と同一の被検者の検体から調製されたライブラリー試料を識別するサンプルIDである。例えば、サンプルIDが1010のライブラリー試料については、ペアとなるサンプルIDが2019であることから、サンプルIDが2019のライブラリー試料が同一の被検者の検体から調製されたことを特定できる。従って、ペアとなるサンプルIDは、紐づけ情報の一例である。この例においては、ステップS1(図2参照)において、症例IDに代えて、ペアとなるサンプルIDがシーケンサー2に入力される。このように、試料又は被検者を識別する情報とは別に紐づけ情報となる情報をシーケンサー2に入力する場合、試料又は被検者を識別する情報を入力する必要がない。なお、サンプルシート35′′′では、腫瘍検体から調製されたライブラリー試料と、非腫瘍検体から調製されたライブラリー試料の両方にペアとなるサンプルIDが入力されているが、いずれか一方を省略してもよい。なお、サンプルシートの表記は、シーケンサー2において使用されている公知の表記に紐づけ情報を追加した表記でもよい。サンプルシートの表記は、各ライブラリー試料に関し、対応する被検者を識別できる情報と、ライブラリー試料が腫瘍細胞由来のものか非腫瘍細胞由来のものかを識別できる情報と、を認識できる表記であれば如何なる表記でもよい。
図2を再び参照し、次に、シーケンサー2が次いで実行する処理について説明する。シーケンサー2の使用者は、予め調製した複数のライブラリー試料(例えば、16個)を1枚のカートリッジの各ウェルに分注し、カートリッジをシーケンサー2にセットし、配列読取の開始を指示する。使用者から配列読取の開始が指示されると、シーケンサー2は、ステップS2で、複数のライブラリー試料の夫々に関して、核酸配列を読み取る。実施形態1では、シーケンサー2は、複数の被検者の夫々について、腫瘍検体から調製されたDNAのライブラリー試料と、非腫瘍検体から調製されたDNAのライブラリー試料と、を読み取る。続いて、シーケンサー2は、ステップS3で、シーケンスランデータを生成する。そして、次のステップS4で、生成したシーケンスランデータをストレージ3に記憶し、処理を終了する。
図4は、シーケンサー2が作成するシーケンスランデータ50の一例について説明する図である。シーケンスランデータ50は、電子ファイルを格納した電子フォルダであり、フォルダ名として、ステップS1で受け付けたシーケンスランID39が付与されている。シーケンスランデータ50には、サンプルシート35と、ステップS2で各ライブラリー試料から読み取った核酸配列データ37が格納されている。シーケンサー2は、各核酸配列データ37に含まれるインデックス配列38を、サンプルシート35に含まれる各インデックス配列と比較し、互いに同一のインデックス配列を有するサンプルIDと、核酸配列データ37とを対応付ける。また、同一の症例IDに対応する複数のサンプルIDにそれぞれ対応する複数の核酸配列データ37は、1の配列データセットを構成する。図4の例では、症例Aに対応するサンプルIDが1010のライブラリー試料及びサンプルIDが2019のライブラリー試料の夫々に対応する2つの核酸配列データ37が配列データセット37-1を構成し、症例Bに対応するサンプルIDが1013のライブラリー試料及びサンプルIDが2021のライブラリー試料の夫々に対応する2つの核酸配列データ37が配列データセット37-2を構成する。1回のシーケンスラン、すなわち1のシーケンスランデータ50に含まれる配列データセットの数は特に限定されないが、1回のシーケンスランでより多くの被検者の核酸配列を読み取るという観点から、5以上であることが好ましい。
図7は、データ送信装置5、受付装置6、及び核酸配列解析装置7の各制御部が実行する処理を説明するフローチャートである。図7を参照して、先ず、データ送信装置5の制御部5fが実行する処理について説明する。制御部5fは、データ送信装置5の使用者から、ストレージ3に記憶されているシーケンスランデータの解析指示を受けると、ステップS20で、解析依頼情報を受付装置6に送信する。解析依頼情報は、使用者が入力部5aを操作して入力する情報であって、被検者の症例情報、遺伝子パネル検査の種別情報、及び依頼元施設10の情報を含む。被検者の症例情報は、症例IDを含む。依頼元施設10の情報は、依頼元施設の名称及び依頼元施設を識別するための識別情報を含む。なお、解析依頼情報は、被検者の症例情報、遺伝子パネル検査の種別情報、及び依頼元施設10の情報のうちの少なくとも一つを含んでいればよい。また、例えば、依頼元施設10と依頼受付施設20との間で、シーケンスランデータ又は症例情報の送信を解析依頼とみなす旨の合意がある場合には、ステップS20の処理を省略してもよい。
制御部5fは、ステップS21で、シーケンスランデータをストレージ3から読み出し、受付装置6に送信する。制御部5fは、ステップS22で、表示部5bに症例登録画面を表示させ、症例情報の登録を受け付ける。症例情報は、腫瘍検体由来のライブラリー試料及び非腫瘍検体由来のライブラリー試料が同一の被検者から調製されたことを示す入力情報を含む。具体的には、入力情報は、腫瘍検体由来のライブラリー試料のサンプルIDと、非腫瘍検体由来のライブラリー試料のサンプルIDと、両サンプルIDに対応する1の症例IDと、を含む。
図8は、表示部5bに表示される症例登録画面40の一例を示す図である。図8に示すように、この症例登録画面40は、シーケンスランIDを登録する登録部40aと、症例IDを登録する登録部40bと、正常検体(非腫瘍検体)由来のライブラリー試料に関して、インデックスIDを登録する登録部40c、サンプルIDを登録する登録部40d、及びインデックス配列を登録する登録部40eと、腫瘍検体由来のライブラリー試料に関して、インデックスIDを登録する登録部40f、サンプルIDを登録する登録部40g、及びインデックス配列を登録する登録部40hと、登録釦40iとを表示する。登録部40a、登録部40c、登録部40fは、プルダウンリスト形式で構成されており、プルダウンリストを展開すると、制御部5fがストレージ3から読み出したシーケンスランデータのうち、後述する登録済みのフラグが付加されてないシーケンスランデータに含まれるシーケンスランID及びインデックスIDがリスト表示される。登録部40b、登録部40d、登録部40e、登録部40g、登録部40hは、使用者がキーボードを操作して数値、文字、又は記号を入力するように構成されている。データ送信装置5の使用者は、入力部5aを操作して、被検者毎に登録部40a~40hに情報を入力し、1の被検者の登録が終了すると、登録釦40iを選択する。データ送信装置5の使用者は、1のシーケンスランデータに含まれる全ての症例IDについて入力が完了するまで、被検者毎に登録部40a~40hに情報を入力し、登録釦40iを選択する操作を繰り返す。
登録部40a~40hは、登録部40a、登録部40c、及び登録部40f以外もプルダウンリスト形式で構成してもよいし、登録部40a、登録部40c、及び登録部40fを、数値等が入力されるように構成してもよい。また、登録部40e及び登録部40hは、登録部40c又は登録部40fにインデックスIDが入力されると、シーケンスランデータから対応するインデックス配列が読み出され、登録部40e又は登録部40hに表示するように構成してもよい。症例登録画面としては、正常検体(非腫瘍検体)と腫瘍検体の各ライブラリー試料に関して、対応する同一の被検者を識別できる情報を登録できる画面であれば、如何なる画面も採用できる。
図7を再度参照して、データ送信装置5の制御部5fが次いで実行する処理について説明する。ステップS22の処理が完了すると、すなわち、1のシーケンスランデータに含まれる全ての症例IDについて入力が完了し、登録釦40iが選択されると、制御部5fは、ステップS23で、ステップS22で登録部40a~40hに入力された症例情報を受付装置6に送信する。上述のとおり、症例情報には、腫瘍検体由来のライブラリー試料及び非腫瘍検体由来のライブラリー試料が同一の被検者から調製されたことを示す入力情報が含まれている。第1実施形態において、入力情報は、登録部40dを介して入力された正常検体のサンプルID、登録部40gを介して入力された腫瘍検体のサンプルID、及び登録部40bを介して入力された症例IDである。サンプルIDは、各ライブラリー試料を識別する情報であり、症例IDは、被検者を識別する情報である。制御部5fは、ステップS24で、ステップS21で受付装置6に送信したシーケンスランデータに対応するシーケンスランIDに、登録済みであることを示すフラグを付加する。
次に、受付装置6の制御部6fが実行する処理ついて説明する。制御部6fは、データ送信装置5から解析依頼情報の送信があると、ステップS30で、当該解析依頼情報を受信し、記憶部6gに記憶する。制御部6fは、データ送信装置5からシーケンスランデータの送信があると、ステップS31で、当該シーケンスランデータを受信し、記憶部6gに記憶する。また制御部6fは、データ送信装置5から症例情報の送信があると、ステップS32で、当該症例情報を受信し、記憶部6gに記憶する。制御部6fは、その後のステップS33で、整合性の検証を行い、ステップS31で記憶したシーケンスランデータに含まれる紐づけ情報がステップS32で記憶した症例情報に含まれる入力情報と整合するか否かを判定する。
図9は、制御部6fがステップS33で実行する整合性検証処理の詳細を説明するフローチャートである。制御部6fは、ステップS51で、記憶した症例情報から、シーケンスランID、症例ID、正常検体のサンプルID、及び腫瘍検体のサンプルIDを読み出す。シーケンスランIDは、症例登録画面40(図8参照)の登録部40aを介して入力された情報であり、症例IDは、登録部40bを介して入力された情報であり、正常検体のサンプルIDは、登録部40dを介して入力された情報であり、腫瘍検体のサンプルIDは、登録部40gを介して入力された情報である。制御部6fは、ステップS52で、読み出したシーケンスランIDと同一のシーケンスランIDが付与されているシーケンスランデータのサンプルシートに記載されている情報を読み出す。そして、制御部6fは、ステップS53で、ステップS51で症例情報から読みだした症例ID、正常検体のサンプルID、及び腫瘍検体のサンプルIDの組み合わせが、サンプルシートに存在しているか否かを判定する。
制御部6fは、ステップS53で否定判定すると(「No」の場合)、ステップS54で、データ送信装置5に、シーケンスランデータの紐づけ情報と、症例情報とが整合しないことを表すエラー通知を行い、ステップS34以降の処理(図7参照)を実行することなく、処理を終了する。エラー通知を受けたデータ送信装置5の制御部5fは、シーケンスランデータの紐づけ情報と、症例情報とが整合しないことを表すエラー情報を表示部5bに出力する。この出力によって、データ送信装置5の使用者は、サンプルシートの情報と、手入力した症例情報のうちの少なくとも一方に間違いが存在していることを認識できる。一方、受信装置6の制御部6fは、ステップS53で肯定判定すると(「Yes」の場合)、処理をステップS34(図7参照)に戻す。
実施形態1によれば、ステップS53で、シーケンスランデータの紐づけ情報と、症例情報とが整合しているか否かを判定し、それら2つの情報が整合しない場合、次のステップに移行せずに処理を終了するようになっている。したがって、各被検者において、その腫瘍検体に由来する核酸配列データと、その非腫瘍検体に由来する核酸配列データとを、当該被検者に正確に紐づけできる。よって、同一の被検者に由来する複数の核酸配列データの核酸配列解析を行うマッチドペア検査の場合にも、核酸配列データを取り違えて過った解析を行うことを確実に防止できる。
図7を再度参照して、受付装置6の制御部6fが次いで実行する処理について説明する。ステップS53(図9参照)で肯定判定されると、制御部6fは、ステップS34で、ステップS31で記憶したシーケンスランデータを核酸配列解析装置7に送信する。次に、核酸配列解析装置7の制御部7fが実行する処理ついて説明する。制御部7fは、ステップS40で、受付装置6から送信された解析依頼情報を受信し、記憶部7gに記憶する。制御部7fは、ステップS41で、受付装置6から送信されたシーケンスランデータを受信し、記憶部7gに記憶する。制御部7fは、ステップS42で、記憶したシーケンスランデータから1の配列データセットを読み出す。前述のとおり、配列データセットは、同一の症例IDに対応する複数の核酸配列データ37を含むため、制御部7fは、紐づけ情報である症例IDを検索キーとして、同一の症例IDと対応する複数の核酸配列データ37を、1の配列データセットとして抽出することができる。
制御部7fは、ステップS43で、ステップS42で抽出した配列データセットの各核酸配列データについて、変異情報データベース8の腫瘍細胞の核酸配列の情報を利用して変異の有無を解析する。制御部7fは、ステップS44で、その変異の有無に基づいて、解析結果レポートを作成する。制御部7fは、ステップS45で、解析結果レポートを受付装置6に送信する。ステップS43の処理は、以下で図10~図14を用いて詳細に説明する。解析結果レポートについては、以下で図15を用いて詳細に説明する。制御部7fは、ステップS46で、ステップS41で記憶したシーケンスランデータに含まれる全ての配列データセットが抽出されたか否かを判定する。制御部7fは、全ての配列データセットが抽出された場合(「Yes」の場合)、処理を終了し、全ての配列データセットが抽出されていない場合(「No」の場合)、処理をステップS42に戻し、ステップS42~S46の処理を再度実行する。
一方、受付装置6の制御部6fは、ステップS35で解析結果レポートを受信し、ステップS36で解析結果レポートをデータ送信装置5に送信し、処理を終了する。データ送信装置5の制御部5fは、ステップS25で、解析結果レポートを受信し、記憶部5gに記憶して処理を終了する。これにより、被検者の担当医は、任意のタイミングで、記憶部5gに記憶されている解析レポートを表示部5bに表示させ、閲覧することができる。
次に、図10を参照して、制御部7fによるステップS43の処理について詳細に説明する。図10は、核酸配列解析装置7の制御部7fが核酸配列を決定する際の処理手順の一例を示すフローチャートである。制御部7fは、ステップS61で、ステップS42で抽出した配列データセットから1の核酸配列データ37(以下、取得配列という)を取得する。また、制御部7fは、変異情報データベース8から参照配列をダウンロードし、記憶部7gに記憶する。
参照配列とは、取得配列が遺伝子上のどの領域に対応するか、及び取得配列が遺伝子上のどの変異に対応するかなどを判定するために、取得配列をマッピングする対象となる配列である。解析対象となる遺伝子毎に、参照配列として(1)野生型のエクソンの部分配列又は全配列である野生型参照配列が用いられ得る。また、参照配列として(2)野生型のエクソンの配列から公知の多型、変異を含む再編成配列を一繋がりに連結した単一の変異参照配列が用いられ得る。単一の変異参照配列とは、解析対象となる遺伝子毎に、該解析対象となる遺伝子に関する2つ以上の再編成配列を一繋がりに連結して生成される配列である。単一の変異参照配列は、取得配列をマッピングするときに、再編成配列を含む変異参照配列として用いられる。なお、2つ以上の再編成配列を一繋がりに連結された単一の変異参照配列に代えて、連結されていない2つ以上の再編成配列が変異参照配列として用いられてもよい。
図11は、単一の変異参照配列の生成方法の概略を示す概念図であり、外部の変異情報データベース8からダウンロードした公開既知変異情報を用いて、変異参照配列を生成する方法の一例を説明する概念図である。図11では、染色体位置「xxxx」の遺伝子「EGFR」に生じた変異「C797S」に関する情報が、研究機関Pから外部の変異情報データベース8に新たにアップロードされ、変異情報データベース8に記憶された場合を例に挙げている。研究機関Pからアップロードされた、遺伝子名「EGFR」の遺伝子の染色体位置「xxxx」に生じた変異「C797S」に関する情報は、外部の変異情報データベース8において、変異ID「yyyy」及びアップロード日「zz年z月z日」などと関連付けられて、公開既知変異情報として登録される。新たにアップロードされた情報としてここに例示した変異は、遺伝子「EGFR」から転写・翻訳された遺伝子産物であるタンパク質「EGFR」の797番目のアミノ酸残基がシステインからセリンに置換された変異である。なお、外部の変異情報データベース8には、このような変異に限定されず、多型、変異、及びメチル化などに関する情報が集められ、記憶されていてもよい。
変異情報データベース8は、外部の公開配列情報データベースや、公開既知変異情報データベース等である。公開配列情報データベースとしては、NCBI RefSeq(ウェブページ、www.ncbi.nlm.nih.gov/refseq/)、NCBI GenBank(ウェブページ、www.ncbi.nlm.nih.gov/genbank/)、UCSC Genome Browserなどが挙げられる。また、公開既知変異情報データベースとしては、COSMICデータベース(ウェブページ、www.sanger.ac.uk/genetics/CGP/cosmic/)、ClinVarデータベース(ウェブページ、www.ncbi.nlm.nih.gov/clinvar/)及びdbSNP(ウェブページ、www.ncbi.nlm.nih.gov/SNP/)などが挙げられる。なお、変異情報データベース8は、公開既知変異に関し、人種あるいは動物種別毎の頻度情報を含む公開既知変異情報データベースであってもよい。このような情報を有する公開既知変異情報データベースとしては、HapMap Genome Browser release #28、Human Genetic Variation Browser(ウェブページ、www.genome.med.kyoto-u.ac.jp/SnpDB/index.html)及び1000 Genomes(ウェブページ、www.1000genomes.org/)が挙げられる。
図10を再び参照し、制御部7fが次いで実行する処理について説明する。制御部7fは、ステップS62において、取得配列を参照配列と比較することにより、取得配列と参照配列との一致率が所定の基準を満たす参照配列上の位置を特定する。上記比較は、取得配列を参照配列上の複数の位置にマッピングすることにより行われる。一致率は、取得配列に含まれる塩基数に対する、取得配列と参照配列とが一致した塩基数の割合である。参照配列上の位置の特定は、マッピングした各位置において、取得配列と参照配列との一致率を算出し、算出した一致率が所定の閾値を超えた位置を特定することによって行われる。
制御部7fは、ステップS63において、参照配列上の複数の位置を特定したか、すなわち、参照配列上の複数の位置で一致率が所定の基準を満たしたかを判定する。取得配列が、参照配列上の単一の位置に一致した場合(「No」の場合)には、制御部7fは、ステップS65で、ステップS42で抽出した1の配列データセットに含まれる全ての取得配列について参照配列上の位置を特定したか否かを判定する。全ての取得配列について位置の特定を完了した場合(「Yes」)の場合には、制御部7fは、処理をステップS73(図12参照)に進める。一方、全ての取得配列について位置の特定が完了していない場合(「No」の場合)には、制御部7fは、処理をステップS62に戻し、処理を継続する。
ステップS63において、参照配列上の複数の位置に一致した場合(「Yes」の場合)には、制御部7fは、ステップS64で、複数の位置のうち、最も一致率が高い位置を、取得配列の参照配列上の位置として特定し、処理をステップS65に進める。
[変異検出]
<体細胞変異の検出>
次に、図12を参照して、制御部7fが、体細胞変異を検出する処理の一例について説明する。図12は、核酸配列解析装置7の制御部7fが体細胞変異を検出する処理を示すフローチャートである。
<体細胞変異の検出>
次に、図12を参照して、制御部7fが、体細胞変異を検出する処理の一例について説明する。図12は、核酸配列解析装置7の制御部7fが体細胞変異を検出する処理を示すフローチャートである。
制御部7fは、ステップS73において、ステップS61(図10参照)で取得した1の配列データセットに含まれる複数の核酸配列データのうち、腫瘍検体に由来するライブラリー試料の核酸配列データ(以下、腫瘍配列)について、ステップS62又はS64で特定した参照配列上の位置において、腫瘍配列と参照配列とに不一致があるか否かを判定する。制御部7fは、不一致がある場合(「Yes」の場合)、処理をステップS74に進め、不一致がない場合(「No」の場合)、処理をステップS83(図13参照)に進める。ステップS74において、制御部7fは、ステップS73で参照した配列データセットに含まれる核酸配列データのうち、非腫瘍検体に由来するライブラリー試料の核酸配列データ(以下、正常配列)について、ステップS62又はS64で特定した参照配列上の位置において、正常配列と参照配列とに不一致があるか否かを判定する。制御部7fは、不一致がない場合(「Yes」の場合)、処理をステップS75に進め、不一致がある場合(「No」の場合)、処理をステップS83に進める。
制御部7fは、ステップS75において、ステップS73で検出された不一致の塩基、すなわち変異を、体細胞変異と判定する。制御部7fは、ステップS76で、検出された体細胞変異に基づいて、変異情報データベース8に記憶されている変異情報データベースを検索する。
変異情報データベース8の変異情報データベースに記憶されている変異情報には、変異識別子(変異ID)、遺伝子名、変異の位置情報(例えば、「CHROM」、及び「POS」)、「REF」、「ALT」、「Annotation」が含まれている。変異IDは、変異を識別するための識別子である。変異の位置情報のうち、「CHROM」は染色体番号を示し、「POS」は染色体番号上の位置を示す。「REF」は、野生型(Wild type)における塩基を示し、「ALT」は、変異後の塩基を示す。「Annotation」は、変異に関する情報を示す。「Annotation」は、例えば、「EGFR C2573G」、「EGFR L858R」といったアミノ酸の変異を示す情報であってもよい。例えば、「EGFR C2573G」は、タンパク質「EGFR」の2573残基目のシステインがグリシンに置換した変異であることを示す。
制御部7fは、ステップS77において、ステップS76の検索結果に基づき、検出された体細胞変異に遺伝子名、アノテーション等の変異情報を付与する。なお、実施形態1において、ステップS76及びS77の処理は省略可能である。
<生殖細胞変異の検出>
次に、図13を参照して、制御部7fが、生殖細胞変異を検出する処理の一例について説明する。図13は、核酸配列解析装置7の制御部7fが生殖細胞変異を検出する処理を示すフローチャートである。制御部7fは、ステップS83において、ステップS61(図10参照)で取得した1の配列データセットに含まれる複数の核酸配列データのうち、非腫瘍検体に由来するライブラリー試料の核酸配列データ(正常配列)について、ステップS62又はS64で特定した参照配列上の位置において、正常配列と参照配列とに不一致があるか否かを判定する。制御部7fは、不一致がある場合(「Yes」の場合)、処理をステップS84に進め、不一致がない場合(「No」の場合)、処理をステップS44(図7参照)に進める。
次に、図13を参照して、制御部7fが、生殖細胞変異を検出する処理の一例について説明する。図13は、核酸配列解析装置7の制御部7fが生殖細胞変異を検出する処理を示すフローチャートである。制御部7fは、ステップS83において、ステップS61(図10参照)で取得した1の配列データセットに含まれる複数の核酸配列データのうち、非腫瘍検体に由来するライブラリー試料の核酸配列データ(正常配列)について、ステップS62又はS64で特定した参照配列上の位置において、正常配列と参照配列とに不一致があるか否かを判定する。制御部7fは、不一致がある場合(「Yes」の場合)、処理をステップS84に進め、不一致がない場合(「No」の場合)、処理をステップS44(図7参照)に進める。
制御部7fは、ステップS84において、ステップS83で検出された不一致の塩基、すなわち変異を、生殖細胞変異と判定する。制御部7fは、ステップS85で、検出された生殖細胞変異に基づいて、変異情報データベース8に記憶されている変異情報データベースを検索する。制御部7fは、ステップS86において、ステップS85の検索結果に基づき、検出された変異に遺伝子名、アノテーション等の変異情報を付与する。なお、実施形態1において、ステップS85及びS86の処理は省略可能である。
図14(A)は、体細胞変異を有する核酸配列の一例を示す図であり、図14(B)は、生殖細胞変異を有する核酸配列の一例を示す図である。図14(A)を参照すると、非腫瘍検体由来の配列データ(正常配列)には、参照配列との不一致がないが、腫瘍検体由来の配列データ(腫瘍配列)には、参照配列との不一致の塩基(参照配列がGであるのに対し、腫瘍配列がC)、すなわち変異がある。この場合、制御部7fは、ステップS75(図12参照)において、変異を体細胞変異と判定する。
一方、図14(B)を参照すると、非腫瘍検体由来の配列データ(正常配列)には、参照配列との不一致の塩基(参照配列がAであるのに対し、正常配列がT)、すなわち変異がある。この場合、制御部7fは、ステップS84(図13参照)において、変異を生殖細胞変異と判定する。
[解析結果レポート]
次に、ステップS44(図7参照)で作成される解析レポートの一例について説明する。図15は、解析レポートR1の一例を示す図である。図15に示すように、解析レポートR1は、解析結果のサマリを掲載するためのサマリレポートの領域S(以下、「サマリレポート領域S」ともいう)と、解析結果の詳細を掲載するための詳細レポートの領域D(以下、「詳細レポート領域D」ともいう)を含む。サマリレポート領域Sは、被検者や検査内容に関する情報が示される属性情報を示す領域S1(以下、「属性情報領域S1」ともいう)と、検出された全ての遺伝子変異のリストが示される領域S2(以下、「遺伝子変異リスト領域S2」ともいう)を含む。また、詳細レポート領域Dは、体細胞変異が検出された遺伝子とその変異の詳細情報が示される領域D1(以下、「遺伝子変異情報領域D1」ともいう)と、生殖細胞変異が検出された遺伝子とその変異の詳細情報が示される領域D2(以下、「生殖細胞変異情報領域D2」ともいう)を含む。
次に、ステップS44(図7参照)で作成される解析レポートの一例について説明する。図15は、解析レポートR1の一例を示す図である。図15に示すように、解析レポートR1は、解析結果のサマリを掲載するためのサマリレポートの領域S(以下、「サマリレポート領域S」ともいう)と、解析結果の詳細を掲載するための詳細レポートの領域D(以下、「詳細レポート領域D」ともいう)を含む。サマリレポート領域Sは、被検者や検査内容に関する情報が示される属性情報を示す領域S1(以下、「属性情報領域S1」ともいう)と、検出された全ての遺伝子変異のリストが示される領域S2(以下、「遺伝子変異リスト領域S2」ともいう)を含む。また、詳細レポート領域Dは、体細胞変異が検出された遺伝子とその変異の詳細情報が示される領域D1(以下、「遺伝子変異情報領域D1」ともいう)と、生殖細胞変異が検出された遺伝子とその変異の詳細情報が示される領域D2(以下、「生殖細胞変異情報領域D2」ともいう)を含む。
属性情報領域S1には、ステップS40で記憶部7gに記憶した情報に基づいて、患者識別子(患者ID)、担当医師名、医療機関名等の患者を識別するための情報や、遺伝子パネル等の検査項目を示す情報等が表示される。遺伝子変異リスト領域S2には、体細胞変異であるか生殖細胞変異であるかを問わず、検出された全ての遺伝子の変異が示される。遺伝子変異リスト領域S2の例において、EGFR、BRAF、BRCA1は遺伝子名を示し、L585R、V600E、K1183Rは各遺伝子における変異部位と変異により生じるアミノ酸の置換内容を示す。つまり、EGFR_L585Rは、EGFR遺伝子の585番目のコドンが、ロイシン(L)をコードする核酸配列からアルギニン(R)をコードする核酸配列に変異していることを示す。遺伝子変異リスト領域S2に表示される各種情報には、ステップS77及びステップS86において制御部7fが取得した情報が用いられる。
[第1実施形態の作用効果]
第1実施形態によれば、1の被検者の腫瘍検体の核酸配列データと非腫瘍検体の核酸配列データとをセットで解析するマッチドペア検査を行う場合において、受付装置6が、同一の被検者の検体から調製された第1ライブラリー試料及び第2ライブラリー試料を含む複数のライブラリー試料の夫々に対応する、シーケンサー2を用いて得られた複数の核酸配列データを含む配列データセット、及び第1ライブラリー試料及び第2ライブラリー試料が同一の被検者の検体から調製されたことを表す紐づけ情報を含むシーケンスランデータを、データ送信装置5からネットワーク11を介して受信して、そのシーケンスランデータを核酸配列の分析を行う核酸配列解析装置7に送信する。したがって、シーケンサー2を動作させる解析依頼元施設10が、核酸配列解析装置7が設置されている依頼先施設30と異なる施設であったとしても、核酸配列解析装置7で、配列データセットの中から、同一被検者の複数のライブラリー試料に対応するそれぞれの核酸配列データの正しい組み合わせを正確かつ迅速に抽出できる。よって、依頼先施設30で正しい組み合わせの複数の核酸配列データを解析することができ、同一被検者の複数の核酸配列データを用いた解析を正確かつ迅速に行うことが可能になる。また、第1実施形態では、腫瘍検体の核酸配列データを解析することで取得した体細胞変異の情報と、非腫瘍検体の核酸配列データを解析することで取得した生殖細胞変異の情報と、を合せて総合的に分析することで、より多くの情報に基づく分析を行うことができ、被検者に適した治療法を特定し易い。
第1実施形態によれば、1の被検者の腫瘍検体の核酸配列データと非腫瘍検体の核酸配列データとをセットで解析するマッチドペア検査を行う場合において、受付装置6が、同一の被検者の検体から調製された第1ライブラリー試料及び第2ライブラリー試料を含む複数のライブラリー試料の夫々に対応する、シーケンサー2を用いて得られた複数の核酸配列データを含む配列データセット、及び第1ライブラリー試料及び第2ライブラリー試料が同一の被検者の検体から調製されたことを表す紐づけ情報を含むシーケンスランデータを、データ送信装置5からネットワーク11を介して受信して、そのシーケンスランデータを核酸配列の分析を行う核酸配列解析装置7に送信する。したがって、シーケンサー2を動作させる解析依頼元施設10が、核酸配列解析装置7が設置されている依頼先施設30と異なる施設であったとしても、核酸配列解析装置7で、配列データセットの中から、同一被検者の複数のライブラリー試料に対応するそれぞれの核酸配列データの正しい組み合わせを正確かつ迅速に抽出できる。よって、依頼先施設30で正しい組み合わせの複数の核酸配列データを解析することができ、同一被検者の複数の核酸配列データを用いた解析を正確かつ迅速に行うことが可能になる。また、第1実施形態では、腫瘍検体の核酸配列データを解析することで取得した体細胞変異の情報と、非腫瘍検体の核酸配列データを解析することで取得した生殖細胞変異の情報と、を合せて総合的に分析することで、より多くの情報に基づく分析を行うことができ、被検者に適した治療法を特定し易い。
(第2実施形態)
第1実施形態では、配列データセットに、1の被検者から採取された腫瘍細胞由来のDNAの第1ライブラリー試料と、同一被検者から採取された非腫瘍細胞由来のDNAの第2ライブラリー試料が含まれる場合について説明した。第2実施形態では、配列データセットに、1の被検者から採取された腫瘍細胞由来のDNAの第1ライブラリー試料と、同一被検者から採取された腫瘍細胞由来のRNAの第2ライブラリー試料が含まれる。
第1実施形態では、配列データセットに、1の被検者から採取された腫瘍細胞由来のDNAの第1ライブラリー試料と、同一被検者から採取された非腫瘍細胞由来のDNAの第2ライブラリー試料が含まれる場合について説明した。第2実施形態では、配列データセットに、1の被検者から採取された腫瘍細胞由来のDNAの第1ライブラリー試料と、同一被検者から採取された腫瘍細胞由来のRNAの第2ライブラリー試料が含まれる。
RNAは、DNAの融合遺伝子変異に起因して生成される場合がある。よって、RNAの核酸配列を特定することで、DNAの融合遺伝子変異を特定できることがある。第2実施形態では、第1ライブラリー試料に対応する第1配列データの解析結果により融合遺伝子変異以外の体細胞変異の情報を取得することができ、第2ライブラリー試料に対応する第2配列データの解析結果により融合遺伝子変異の情報を取得することができる。
第2実施形態の核酸情報送受信システム1の概略構成は、図1に示した構成と同じである。また、データ送信装置5、受付装置6、及び核酸配列解析装置7の各制御部が実行する処理の概略は、図7に示した処理と同じである。図16は、第2実施形態でシーケンサー2が実行する処理について説明するフローチャートであり、図17は、第2実施形態で採用できるサンプルシート135の一例を示す図である。また、図18は、第2実施形態でデータ送信装置5の表示部5bに表示される症例登録画面の一例を示す図である。また、図19は、第2実施形態で、制御部6fがステップS33(図7参照)で実行する処理の詳細を説明するフローチャートである。
図16を参照して、シーケンサー2が実行する処理について説明する。最初に、ステップS1′で、シーケンサー2は、シーケンスランID、症例ID、サンプルID、及びインデックスIDを受け付け、電子ファイルであるサンプルシートを生成する。実施形態1と同様に、シーケンスランIDは、シーケンスランデータを識別する情報であり、サンプルシートは、症例ID、サンプルID、及びインデックスIDを含む。サンプルシートは、1回のシーケンスラン、すなわち、カートリッジ1枚につき1つ生成される。1回のシーケンスラン、すなわち、カートリッジ1枚では、複数のライブラリー試料(例えば、16個)の核酸配列が読み取られる。複数のライブラリー試料は、複数の被検者(例えば、8名)の腫瘍組織のDNAと腫瘍組織のRNAの夫々から調製された複数の試料(例えば、16個)の夫々に試薬で前処理を施して、複数の試料に互いに異なるインデックス配列を付加することで作製される。
図17は、サンプルシート135の一例を示す図である。図17に示す例では、サンプルIDと症例IDとが対応付けられている。症例IDが同一のライブラリー試料は、同一の被検者の検体から調製された試料であり、サンプルシート135の症例IDは、複数のライブラリー試料が同一の被検者の検体から調製されたことを表す紐づけ情報の一例である。各サンプルIDには、インデックスIDとインデックス配列が更に対応付けられている。インデックス配列は、ライブラリー試料に付加されたインデックス配列を示す情報である。
例えば、サンプルIDが1010のライブラリー試料は、特定の疾患を有する被検者Aの検体から調製され、インデックスIDが001の試料である。このライブラリー試料のインデックス配列は、CGGATTGCである。サンプルIDが3020のライブラリー試料は、特定の疾患を有する被検者Aの検体から調製され、インデックスIDが009の試料である。このライブラリー試料のインデックス配列は、ACTATGCAである。サンプルIDが1010のライブラリー試料と、サンプルIDが3020のライブラリー試料と、が同一の症例ID(A)を有することから、両ライブラリー試料が同一の被検者Aの検体から調製されたことが表されている。同様に、サンプルIDが1013のライブラリー試料と、サンプルIDが3024のライブラリー試料と、が同一の症例ID(B)を有することから、両ライブラリー試料が同一の被検者Bの検体から調製されたことが表されている。更に、第2実施形態では、サンプルIDが1から始まるIDである場合には、対応するライブラリー試料が、腫瘍細胞のDNA由来であることを示し、サンプルIDが3から始まるIDである場合には、対応するライブラリー試料が、腫瘍細胞のRNA由来であることを示す。よって、サンプルシートのデータを参照すれば、同一の被検者に由来する複数のライブラリー試料と、各ライブラリー試料がDNA由来のものか又はRNA由来のものかという情報と、を識別できる。
図16を再び参照し、次に、シーケンサー2が次いで実行する処理について説明する。シーケンサー2の使用者は、予め調製した複数のライブラリー試料(例えば、16個)を1枚のカートリッジの各ウェルに分注し、カートリッジをシーケンサー2にセットし、配列読取の開始を指示する。使用者から配列読取の開始が指示されると、シーケンサー2は、ステップS2′で、複数のライブラリー試料の夫々に関して、核酸配列を読み取る。実施形態2では、シーケンサー2は、複数の被検者の夫々について、腫瘍検体から調製されたDNAのライブラリー試料と、腫瘍検体から調製されたRNAのライブラリー試料と、を読み取る。続いて、シーケンサー2は、ステップS3′で、シーケンスランデータを生成する。シーケンスランデータは、図4で示したシーケンスランデータ50のサンプルシート35をサンプルシート135に置き換えたデータである。そして、次のステップS4′で、生成したシーケンスランデータをストレージ3に記憶し、処理を終了する。
なお、サンプルシートの表記は、各ライブラリー試料に関し、対応する被検者を識別できる情報と、ライブラリー試料がDNA由来ものかRNA由来のものかを識別できる情報と、を認識できる表記であれば如何なる表記でもよい。
図18に示すように、第2実施形態でデータ送信装置5の制御部5fが表示部5bに表示する症例登録画面としては、第1実施形態の症例登録画面40(図8参照)との比較において、「正常検体」という文言を「DNA検体」という文言に変更すると共に「腫瘍検体」という文言を「RNA検体」という文言に変更した症例登録画面140を採用できる。
図18に示すように、この症例登録画面140は、シーケンスランIDを登録する登録部40aと、症例IDを登録する登録部40bと、腫瘍検体のDNA由来のライブラリー試料に関して、インデックスIDを登録する登録部40c、サンプルIDを登録する登録部40d、及びインデックス配列を登録する登録部40eと、腫瘍検体のRNA由来のライブラリー試料に関して、インデックスIDを登録する登録部40f、サンプルIDを登録する登録部40g、及びインデックス配列を登録する登録部40hと、登録釦40iとを表示する。登録部40a、登録部40c、登録部40fは、プルダウンリスト形式で構成されており、プルダウンリストを展開すると、制御部5fがストレージ3から読み出したシーケンスランデータのうち、前述した登録済みのフラグが付加されてないシーケンスランデータに含まれるシーケンスランID及びインデックスIDがリスト表示される。登録部40b、登録部40d、登録部40e、登録部40g、登録部40hは、使用者がキーボードを操作して数値、文字、又は記号を入力するように構成されている。データ送信装置5の使用者は、入力部5aを操作して、被検者毎に登録部40a~40hに情報を入力し、1の被検者の登録が終了すると、登録釦40iを選択する。データ送信装置5の使用者は、1のシーケンスランデータに含まれる全ての症例IDについて入力が完了するまで、被検者毎に登録部40a~40hに情報を入力し、登録釦40iを選択する操作を繰り返す。
登録部40a~40hは、登録部40a、登録部40c、及び登録部40f以外もプルダウンリスト形式で構成してもよいし、登録部40a、登録部40c、及び登録部40fを、数値等が入力されるように構成してもよい。また、登録部40e及び登録部40hは、登録部40c又は登録部40fにインデックスIDが入力されると、シーケンスランデータから対応するインデックス配列が読み出され、登録部40e又は登録部40hに表示するように構成してもよい。症例登録画面としては、腫瘍検体のDNAと腫瘍検体のRNAの各ライブラリー試料に関して、対応する同一の被検者を識別できる情報を登録できる画面であれば、如何なる画面も採用できる。
図19は、制御部6fがステップS33(図7参照)で実行する処理の詳細を説明するフローチャートである。制御部6fは、ステップS51′で、記憶した症例情報から、シーケンスランID、症例ID、DNA検体のサンプルID、及びRNA検体のサンプルIDを読み出す。シーケンスランIDは、症例登録画面140(図18参照)の登録部40aを介して入力された情報であり、症例IDは、登録部40bを介して入力された情報であり、DNA検体のサンプルIDは、登録部40dを介して入力された情報であり、RNA検体のサンプルIDは、登録部40gを介して入力された情報である。制御部6fは、ステップS52′で、読み出したシーケンスランIDと同一のシーケンスランIDが付与されているシーケンスランデータのサンプルシートに記載されている情報を読み出す。そして、制御部6fは、ステップS53′で、ステップS51′で症例情報から読みだした症例ID、DNA検体のサンプルID、及びRNA検体のサンプルIDの組み合わせが、サンプルシートに存在しているか否かを判定する。
制御部6fは、ステップS53′で否定判定(「No」の場合)すると、ステップS54′で、データ送信装置5に、シーケンスランデータの紐づけ情報と、症例情報とが整合しないことを表すエラー通知を行い、ステップS34以降の処理(図7参照)を実行することなく、処理を終了する。
エラー通知を受けたデータ送信装置5の制御部5fは、シーケンスランデータの紐づけ情報と、症例情報とが整合しないことを表すエラー情報を表示部5bに出力する。この出力によって、データ送信装置5の使用者は、サンプルシートの情報と、手入力した症例情報のうちの少なくとも一方に間違いが存在していることを認識できる。一方、受信装置6の制御部6fは、ステップS53′で肯定判定(「Yes」の場合)すると、処理をステップS34(図7参照)に戻す。
実施形態2によれば、ステップS53′で、シーケンスランデータの紐づけ情報と、症例情報とが整合しているか否かを判定し、それら2つの情報が整合しない場合、次のステップに移行せずに処理を終了ようになっている。したがって、各被検者において、そのDNA検体に由来する核酸配列データと、そのRNA検体に由来する核酸配列データとを、当該被検者に正確に紐づけできる。よって、同一の被検者に由来する複数の核酸配列データの核酸配列解析を行うマッチドペア検査の場合にも、核酸配列データを取り違えて過った解析を行うことを確実に防止できる。
[第2実施形態の作用効果]
第2実施形態によれば、1の被検者の腫瘍検体由来のDNAの核酸配列データと腫瘍検体由来のRNAの核酸配列データとをセットで解析するマッチドペア検査を行う場合において、受付装置6が、同一の被検者の検体から調製された第1ライブラリー試料及び第2ライブラリー試料を含む複数のライブラリー試料の夫々に対応する、シーケンサー2を用いて得られた複数の核酸配列データを含む配列データセット、及び第1ライブラリー試料及び第2ライブラリー試料が同一の被検者の検体から調製されたことを表す紐づけ情報を含むシーケンスランデータを、データ送信装置5からネットワーク11を介して受信して、そのシーケンスランデータを核酸配列の分析を行う核酸配列解析装置7に送信する。したがって、シーケンサー2を動作させる解析依頼元施設10が、核酸配列解析装置7が設置されている依頼先施設30と異なる施設であったとしても、核酸配列解析装置7で、配列データセットの中から、同一被検者の複数のライブラリー試料に対応するそれぞれの核酸配列データの正しい組み合わせを正確かつ迅速に抽出できる。よって、依頼先施設30で正しい組み合わせの複数の核酸配列データを解析することができ、同一被検者の複数の核酸配列データを用いた解析を正確かつ迅速に行うことが可能になる。また、第2実施形態では、腫瘍検体のDNAの核酸配列データを解析することで取得した融合遺伝子変異以外の体細胞変異の情報と、腫瘍検体のRNAの核酸配列データを解析することで取得した融合遺伝子変異の情報と、を合せて総合的に分析することで、より多くの情報に基づく分析を行うことができ、被検者に適した治療法を特定し易い。
第2実施形態によれば、1の被検者の腫瘍検体由来のDNAの核酸配列データと腫瘍検体由来のRNAの核酸配列データとをセットで解析するマッチドペア検査を行う場合において、受付装置6が、同一の被検者の検体から調製された第1ライブラリー試料及び第2ライブラリー試料を含む複数のライブラリー試料の夫々に対応する、シーケンサー2を用いて得られた複数の核酸配列データを含む配列データセット、及び第1ライブラリー試料及び第2ライブラリー試料が同一の被検者の検体から調製されたことを表す紐づけ情報を含むシーケンスランデータを、データ送信装置5からネットワーク11を介して受信して、そのシーケンスランデータを核酸配列の分析を行う核酸配列解析装置7に送信する。したがって、シーケンサー2を動作させる解析依頼元施設10が、核酸配列解析装置7が設置されている依頼先施設30と異なる施設であったとしても、核酸配列解析装置7で、配列データセットの中から、同一被検者の複数のライブラリー試料に対応するそれぞれの核酸配列データの正しい組み合わせを正確かつ迅速に抽出できる。よって、依頼先施設30で正しい組み合わせの複数の核酸配列データを解析することができ、同一被検者の複数の核酸配列データを用いた解析を正確かつ迅速に行うことが可能になる。また、第2実施形態では、腫瘍検体のDNAの核酸配列データを解析することで取得した融合遺伝子変異以外の体細胞変異の情報と、腫瘍検体のRNAの核酸配列データを解析することで取得した融合遺伝子変異の情報と、を合せて総合的に分析することで、より多くの情報に基づく分析を行うことができ、被検者に適した治療法を特定し易い。
(第3実施形態)
第1及び第2実施形態では、配列データセットに、同一の被検者に由来するライブラリー試料が2つ存在する場合について説明した。第3実施形態では、配列データセットに、同一の被検者に由来するライブラリー試料が3つ存在する。3つのライブラリー試料は、夫々、腫瘍検体のDNA由来のライブラリー試料と、腫瘍検体のRNA由来のライブラリー試料と、非腫瘍検体のDNA由来のライブラリー試料である。
第1及び第2実施形態では、配列データセットに、同一の被検者に由来するライブラリー試料が2つ存在する場合について説明した。第3実施形態では、配列データセットに、同一の被検者に由来するライブラリー試料が3つ存在する。3つのライブラリー試料は、夫々、腫瘍検体のDNA由来のライブラリー試料と、腫瘍検体のRNA由来のライブラリー試料と、非腫瘍検体のDNA由来のライブラリー試料である。
第3実施形態の核酸情報送受信システム1の概略構成図は、図1に示した図と同じである。また、データ送信装置5、受付装置6、及び核酸配列解析装置7の各制御部が実行する処理の概略は、図7に示した処理と同じである。図20は、第3実施形態でシーケンサー2が実行する処理について説明するフローチャートであり、図21は、第3実施形態で採用できるサンプルシート235の一例を示す図である。また、図22は、第3実施形態でデータ送信装置5の表示部5bに表示される症例登録画面の一例を示す図である。また、図23は、第3実施形態で、制御部6fがステップS33(図7参照)で実行する処理の詳細を説明するフローチャートである。
図20を参照して、シーケンサー2が実行する処理について説明する。最初に、ステップS1′′で、シーケンサー2は、シーケンスランID、症例ID、サンプルID、及びインデックスIDを受け付け、電子ファイルであるサンプルシートを生成する。実施形態1及び2と同様に、シーケンスランIDは、シーケンスランデータを識別する情報であり、サンプルシートは、症例ID、サンプルID、及びインデックスIDを含む。サンプルシートは、1回のシーケンスラン、すなわち、カートリッジ1枚につき1つ生成される。1回のシーケンスラン、すなわち、カートリッジ1枚では、複数のライブラリー試料(例えば、15個)の核酸配列が読み取られる。複数のライブラリー試料は、複数の被検者(例えば、5名)の腫瘍組織のDNAと腫瘍組織のRNAと非腫瘍組織のDNAの夫々から調製された複数の試料(例えば、15個)の夫々に試薬で前処理を施して、複数の試料に互いに異なるインデックス配列を付加することで作製される。
図21は、サンプルシート235の一例を示す図である。図21に示す例では、サンプルIDと症例IDとが対応付けられている。症例IDが同一のライブラリー試料は、同一の被検者の検体から調製された試料であり、サンプルシート235の症例IDは、複数のライブラリー試料が同一の被検者の検体から調製されたことを表す紐づけ情報の一例である。各サンプルIDには、インデックスIDとインデックス配列が更に対応付けられている。インデックス配列は、ライブラリー試料に付加されたインデックス配列を示す情報である。
例えば、サンプルIDが1010のライブラリー試料は、特定の疾患を有する被検者Aの検体から調製され、インデックスIDが001の試料である。このライブラリー試料のインデックス配列は、CGGATTGCである。サンプルIDが2019のライブラリー試料は、特定の疾患を有する被検者Aの検体から調製され、インデックスIDが006の試料である。このライブラリー試料のインデックス配列は、ACTATGCAである。サンプルIDが3020のライブラリー試料は、特定の疾患を有する被検者Aの検体から調製され、インデックスIDが011の試料である。サンプルIDが1010のライブラリー試料と、サンプルIDが2019のライブラリー試料と、サンプルIDが3020のライブラリー試料と、が同一の症例ID(A)を有することから、各ライブラリー試料が同一の被検者Aの検体から調製されたことが表されている。同様に、サンプルIDが1013のライブラリー試料と、サンプルIDが2021のライブラリー試料と、サンプルIDが3024のライブラリー試料と、が同一の症例ID(B)を有することから、各ライブラリー試料が同一の被検者Bの検体から調製されたことが表されている。更に、第3実施形態では、サンプルIDが1から始まるIDである場合には、対応するライブラリー試料が、腫瘍細胞のDNA由来であることを示し、サンプルIDが2から始まるIDである場合には、対応するライブラリー試料が、非腫瘍細胞のDNA由来であることを示し、サンプルIDが3から始まるIDである場合には、対応するライブラリー試料が、腫瘍細胞のRNA由来であることを示す。よって、サンプルシートのデータを参照すれば、同一の被検者に由来する複数のライブラリー試料と、各ライブラリー試料がDNA由来のものか、RNA由来のものか、又は非腫瘍由来のものかという情報と、を識別できる。
図20を再び参照し、次に、シーケンサー2が次いで実行する処理について説明する。シーケンサー2の使用者は、予め調製した複数のライブラリー試料(例えば、15個)を1枚のカートリッジの各ウェルに分注し、カートリッジをシーケンサー2にセットし、配列読取の開始を指示する。使用者から配列読取の開始が指示されると、シーケンサー2は、ステップS2′′で、複数のライブラリー試料の夫々に関して、核酸配列を読み取る。実施形態3では、シーケンサー2は、複数の被検者の夫々について、腫瘍検体から調製されたDNAのライブラリー試料と、腫瘍検体から調製されたRNAのライブラリー試料と、非腫瘍検体から調製されたDNAのライブラリー試料と、を読み取る。続いて、シーケンサー2は、ステップS3′′で、シーケンスランデータを生成する。シーケンスランデータは、図4で示したシーケンスランデータ50のサンプルシート35をサンプルシート235に置き換えたデータである。そして、次のステップS4′′で、生成したシーケンスランデータをストレージ3に記憶し、処理を終了する。なお、サンプルシートの表記は、各ライブラリー試料に関し、対応する被検者を識別できる情報と、ライブラリー試料がDNA由来ものかRNA由来のものか、又は非腫瘍由来のものかを識別できる情報と、を認識できる表記であれば如何なる表記でもよい。
図22に示すように、第3実施形態でデータ送信装置5の制御部5fが表示部5bに表示する症例登録画面としては、第1実施形態の症例登録画面40(図8参照)との比較において、「腫瘍検体」という文言を「腫瘍検体(DNA)」という文言に変更すると共に、腫瘍検体のRNA由来のライブラリー試料に関する情報を登録するための登録部40j~40lを追加した症例登録画面240を採用できる。
図22に示すように、この症例登録画面240は、シーケンランIDを登録する登録部40aと、症例IDを登録する登録部40bと、非腫瘍検体のDNA由来のライブラリー試料に関して、インデックスIDを登録する登録部40c、サンプルIDを登録する登録部40d、及びインデックス配列を登録する登録部40eと、腫瘍検体のDNA由来のライブラリー試料に関して、インデックスIDを登録する登録部40f、サンプルIDを登録する登録部40g、及びインデックス配列を登録する登録部40hと、腫瘍検体のRNA由来のライブラリー試料に関して、インデックスIDを登録する登録部40j、サンプルIDを登録する登録部40k、及びインデックス配列を登録する登録部40lと、登録釦40iとを表示する。登録部40a、登録部40c、登録部40f、登録部40jは、プルダウンリスト形式で構成されており、プルダウンリストを展開すると、制御部5fがストレージ3から読み出したシーケンスランデータのうち、前述した登録済みのフラグが付加されてないシーケンスランデータに含まれるシーケンスランID及びインデックスIDがリスト表示される。登録部40b、登録部40d、登録部40e、登録部40g、登録部40h、登録部40k、登録部40lは、使用者がキーボードを操作して数値、文字、又は記号を入力するように構成されている。データ送信装置5の使用者は、入力部5aを操作して、被検者毎に登録部40a~40lに情報を入力し、1の被検者の登録が終了すると、登録釦40iを選択する。データ送信装置5の使用者は、1のシーケンスランデータに含まれる全ての症例IDについて入力が完了するまで、被検者毎に登録部40a~40lに情報を入力し、登録釦40iを選択する操作を繰り返す。
登録部40a~40lは、登録部40a、登録部40c、登録部40f、及び登録部40j以外もプルダウンリスト形式で構成してもよいし、登録部40a、登録部40c、登録部40f、及び登録部40jを、数値等が入力されるように構成してもよい。また、登録部40e、登録部40h及び登録部40lは、登録部40c、登録部40f、又は登録部jにインデックスIDが入力されると、シーケンスランデータから対応するインデックス配列が読み出され、登録部40e、登録部40f、又は登録部40lに表示するように構成してもよい。症例登録画面としては、腫瘍検体のDNAと腫瘍検体のRNAと非腫瘍検体のDNAの各ライブラリー試料に関して、対応する同一の被検者を識別できる情報を登録できる画面であれば、如何なる画面も採用できる。
図23は、制御部6fがステップS33(図7参照)で実行する処理の詳細を説明するフローチャートである。制御部6fは、ステップS51′′で、記憶した症例情報から、シーケンスランID、症例ID、DNA検体のサンプルID、RNA検体のサンプルID、及び非腫瘍検体のサンプルIDを読み出す。シーケンスランIDは、症例登録画面240(図22参照)の登録部40aを介して入力された情報であり、症例IDは、登録部40bを介して入力された情報であり、非腫瘍検体のサンプルIDは、登録部40dを介して入力された情報であり、DNA検体のサンプルIDは、登録部40gを介して入力された情報であり、RNA検体のサンプルIDは、登録部40kを介して入力された情報である。制御部6fは、ステップS52′′で、読み出したシーケンスランIDと同一のシーケンスランIDが付与されているシーケンスランデータのサンプルシートに記載されている情報を読み出す。そして、制御部6fは、ステップS53′′で、ステップS51′′で症例情報から読みだした症例ID、DNA検体のサンプルID、RNA検体のサンプルID、及び非腫瘍検体のサンプルIDの組み合わせが、サンプルシートに存在しているか否かを判定する。
制御部6fは、ステップS53′′で否定判定(「No」の場合)すると、ステップS54′′で、データ送信装置5に、シーケンスランデータの紐づけ情報と、症例情報とが整合しないことを表すエラー通知を行い、ステップS34以降の処理(図7参照)を実行することなく、処理を終了する。エラー通知を受けたデータ送信装置5の制御部5fは、シーケンスランデータの紐づけ情報と、症例情報とが整合しないことを表すエラー情報を表示部5bに出力する。この出力によって、データ送信装置5の使用者は、サンプルシートの情報と、手入力した症例情報のうちの少なくとも一方に間違いが存在していることを認識できる。一方、受信装置6の制御部6fは、ステップS53′′で肯定判定(「Yes」の場合)すると、処理をステップS34(図7参照)に戻す。
実施形態3によれば、ステップS53′′で、シーケンスランデータの紐づけ情報と、症例情報とが整合しているか否かを判定し、それら2つの情報が整合しない場合、次のステップに移行せずに処理を終了ようになっている。したがって、各被検者において、その腫瘍検体のDNA検体に由来する核酸配列データと、その腫瘍検体のRNA検体に由来する核酸配列データと、非腫瘍検体に由来する核酸配列データとを、当該被検者に正確に紐づけできる。よって、同一の被検者に由来する複数の核酸配列データの核酸配列解析を行うマッチドペア検査の場合にも、核酸配列データを取り違えて過った解析を行うことを確実に防止できる。
[第3実施形態の作用効果]
第3実施形態によれば、1の被検者の腫瘍検体由来のDNAの核酸配列データと腫瘍検体由来のRNAの核酸配列データと非腫瘍検体由来のDNAの核酸配列データとをセットで解析するマッチドペア検査を行う場合において、受付装置6が、同一の被検者の検体から調製された第1ライブラリー試料、第2ライブラリー試料及び第3ライブラリー試料を含む複数のライブラリー試料の夫々に対応する、シーケンサー2を用いて得られた複数の核酸配列データを含む配列データセット、及び第1ライブラリー試料、第2ライブラリー試料及び第3ライブラリー試料が同一の被検者の検体から調製されたことを表す紐づけ情報を含むシーケンスランデータを、データ送信装置5からネットワーク11を介して受信して、そのシーケンスランデータを核酸配列の分析を行う核酸配列解析装置7に送信する。したがって、シーケンサー2を動作させる解析依頼元施設10が、核酸配列解析装置7が設置されている依頼先施設30と異なる施設であったとしても、核酸配列解析装置7で、配列データセットの中から、同一被検者の複数のライブラリー試料に対応するそれぞれの核酸配列データの正しい組み合わせを正確かつ迅速に抽出できる。よって、依頼先施設30で正しい組み合わせの複数の核酸配列データを解析することができ、同一被検者の複数の核酸配列データを用いた解析を正確かつ迅速に行うことが可能になる。また、第3実施形態では、腫瘍検体のDNAの核酸配列データを解析することで取得した融合遺伝子変異以外の体細胞変異の情報と、腫瘍検体のRNAの核酸配列データを解析することで取得した融合遺伝子変異の情報と、非腫瘍検体のDNAの核酸配列データを解析することで取得した生殖細胞変異の情報と、を3つ合せて総合的に分析することで、より多くの情報に基づく分析を行うことができ、被検者に適した治療法を特定し易い。
第3実施形態によれば、1の被検者の腫瘍検体由来のDNAの核酸配列データと腫瘍検体由来のRNAの核酸配列データと非腫瘍検体由来のDNAの核酸配列データとをセットで解析するマッチドペア検査を行う場合において、受付装置6が、同一の被検者の検体から調製された第1ライブラリー試料、第2ライブラリー試料及び第3ライブラリー試料を含む複数のライブラリー試料の夫々に対応する、シーケンサー2を用いて得られた複数の核酸配列データを含む配列データセット、及び第1ライブラリー試料、第2ライブラリー試料及び第3ライブラリー試料が同一の被検者の検体から調製されたことを表す紐づけ情報を含むシーケンスランデータを、データ送信装置5からネットワーク11を介して受信して、そのシーケンスランデータを核酸配列の分析を行う核酸配列解析装置7に送信する。したがって、シーケンサー2を動作させる解析依頼元施設10が、核酸配列解析装置7が設置されている依頼先施設30と異なる施設であったとしても、核酸配列解析装置7で、配列データセットの中から、同一被検者の複数のライブラリー試料に対応するそれぞれの核酸配列データの正しい組み合わせを正確かつ迅速に抽出できる。よって、依頼先施設30で正しい組み合わせの複数の核酸配列データを解析することができ、同一被検者の複数の核酸配列データを用いた解析を正確かつ迅速に行うことが可能になる。また、第3実施形態では、腫瘍検体のDNAの核酸配列データを解析することで取得した融合遺伝子変異以外の体細胞変異の情報と、腫瘍検体のRNAの核酸配列データを解析することで取得した融合遺伝子変異の情報と、非腫瘍検体のDNAの核酸配列データを解析することで取得した生殖細胞変異の情報と、を3つ合せて総合的に分析することで、より多くの情報に基づく分析を行うことができ、被検者に適した治療法を特定し易い。
(第4実施形態)
第1実施形態では、データ送信装置5と、核酸配列解析装置7との情報のやり取りを、受付装置6を介して行う場合について説明したが、受付装置6と核酸配列解析装置7を1台のコンピュータで構成してもよい。
第1実施形態では、データ送信装置5と、核酸配列解析装置7との情報のやり取りを、受付装置6を介して行う場合について説明したが、受付装置6と核酸配列解析装置7を1台のコンピュータで構成してもよい。
図24は、第4実施形態に係る、各施設に設置された核酸情報送受信システム101の概略構成図である。核酸情報送受信システム101は、シーケンサー2、ストレージ(記憶装置)3、データ送信装置5、及び受付・解析システム104を備え、受付・解析システム104は、受付・解析装置107を有する。データ送信装置5、及び受付・解析装置107は、インターネットであるネットワーク11を介して互いに接続されている。ネットワーク11には、更に変異情報データベース8が接続されている。シーケンサー2、ストレージ(記憶装置)3、及びデータ送信装置5のハードウェア構成は、実施形態1と同じである。データ送信装置5は、ネットワーク11を介して受付・解析装置107とデータを送受信する。
受付・解析装置107は、依頼先施設130、例えば、データ解析施設に設置される。解析依頼元施設10と依頼先施設130とは異なる施設である。受付・解析装置107は、クラウドシステムを構成するコンピュータであってもよい。データ解析施設は、クラウドサービスプロバイダの施設であってもよいし、核酸配列の解析サービスを提供する企業の施設であってもよい。受付・解析装置107は、コンピュータである。受付・解析装置107は、入力部107a、表示部107b、送受信部107c及び制御装置107eを有する。制御装置107eは、制御部107fと記憶部107gを含む。入力部107a、表示部107b、送受信部107c及び制御装置107eのハードウェア構成は、データ送信装置の入力部5a、表示部5b、送受信部5c、及び制御装置5eと夫々同様である。受付・解析装置107は、ネットワーク11を介して変異情報データベース8にアクセス可能になっている。
図25は、データ送信装置5及び受付・解析装置107の各制御部が実行する処理を説明するフローチャートである。図25を参照して、先ず、データ送信装置5の制御部5fが実行する処理ついて説明する。制御部5fは、データ送信装置5の使用者から、ストレージ3に記憶されているシーケンスランデータの解析指示を受けると、ステップS20′で、解析依頼情報を受付装置6に送信する。制御部5fは、ステップS21′で、シーケンスランデータをストレージ3から読み出し、受付・解析装置107に送信する。
制御部5fは、ステップS22′で、表示部5bに症例登録画面を表示させ、症例情報の登録を受け付ける。症例登録画面としては、実施形態1~3で示した症例登録画面40、140、又は240を採用可能である。
ステップS22′の処理が完了すると、制御部5fは、ステップS23′で、ステップS22′で症例登録画面に入力された症例情報を受付・解析装置107に送信する。制御部5fは、ステップS24′で、ステップS21で受付・解析装置107に送信したシーケンスランデータに対応するシーケンスランIDに、登録済みであることを示すフラグを付加する。
次に、受付・解析装置107の制御部107fが実行する処理ついて説明する。制御部107fは、データ送信装置5から解析依頼情報の送信があると、ステップS30′で、当該解析依頼情報を受信し、記憶部107gに記憶する。制御部107fは、データ送信装置5からシーケンスランデータの送信があると、ステップS41′で、当該シーケンスランデータを受信し、記憶部107gに記憶する。また制御部107fは、データ送信装置5から症例情報の送信があると、ステップS32′で、当該症例情報を受信し、記憶部107gに記憶する。制御部107fは、その後のステップS33′で、整合性の検証を行い、ステップS41′で記憶したシーケンスランデータに含まれる紐づけ情報がステップS32′で記憶した症例情報に含まれる情報と整合するか否かを判定する。
制御部107fは、ステップS42′で、記憶したシーケンスランデータから1の配列データセットを読み出す。前述のとおり、配列データセットは、同一の症例IDに対応する複数の核酸配列データを含むため、制御部107fは、紐づけ情報である症例IDを検索キーとして、同一の症例IDと対応する複数の核酸配列データを、1の配列データセットとして抽出することができる。
制御部107fは、ステップS43′で、ステップS42′で抽出した配列データセットの各核酸配列データについて、変異情報データベース8の腫瘍細胞の核酸配列の情報を利用して変異の有無を解析する。制御部107fは、ステップS44′で、その変異の有無に基づいて、解析結果レポートを作成する。制御部107fは、ステップS45′で、解析結果レポートをデータ送信装置5に送信する。制御部107fは、ステップS46′で、ステップS41′で記憶したシーケンスランデータに含まれる全ての配列データセットが解析されたか否かを判定する。制御部107fは、全ての配列データセットが解析された場合(「Yes」の場合)、処理を終了し、全ての配列データセットが解析されていない場合(「No」の場合)、処理をステップS42′に戻し、ステップS42′~S46′の処理を再度実行する。
一方、データ送信装置5の制御部5fは、ステップS25′で、解析結果レポートを受信し、記憶部5gに記憶して処理を終了する。これにより、被検者の担当医は、任意のタイミングで、記憶部5gに記憶されている解析レポートを表示部5bに表示させ、閲覧することができる。
[第4実施形態の作用効果]
第4実施形態によれば、受付・解析システム104のハードウェア構成が簡略化される。また、シーケンスランデータの受信と解析を同一のコンピュータで行うことが可能であるため、シーケンスランデータの送受信に必要な時間を削減することができるとともに、ネットワーク11に大容量のデータが流れることによる通信速度の低下を抑止することができる。
第4実施形態によれば、受付・解析システム104のハードウェア構成が簡略化される。また、シーケンスランデータの受信と解析を同一のコンピュータで行うことが可能であるため、シーケンスランデータの送受信に必要な時間を削減することができるとともに、ネットワーク11に大容量のデータが流れることによる通信速度の低下を抑止することができる。
(第5実施形態)
第5実施形態は、実施形態1~4およびそれらの変形例を包括した実施形態である。核酸情報送受信システム101の概略構成としては、実施形態1~3の構成(図1参照)、又は実施形態4の構成(図24参照)のいずれを採用してもよい。図26は、第5実施形態のシーケンサー2が実行する処理について説明するフローチャートである。図26を参照して、シーケンサー2が実行する処理について説明する。最初に、ステップS1′′で、シーケンサー2は、シーケンスランID、症例ID、サンプルID、及びインデックスIDを受け付け、電子ファイルであるサンプルシートを生成する。
第5実施形態は、実施形態1~4およびそれらの変形例を包括した実施形態である。核酸情報送受信システム101の概略構成としては、実施形態1~3の構成(図1参照)、又は実施形態4の構成(図24参照)のいずれを採用してもよい。図26は、第5実施形態のシーケンサー2が実行する処理について説明するフローチャートである。図26を参照して、シーケンサー2が実行する処理について説明する。最初に、ステップS1′′で、シーケンサー2は、シーケンスランID、症例ID、サンプルID、及びインデックスIDを受け付け、電子ファイルであるサンプルシートを生成する。
次に、シーケンサー2の使用者は、予め調製した複数のライブラリー試料を1枚のカートリッジの各ウェルに分注し、カートリッジをシーケンサー2にセットし、配列読取の開始を指示する。使用者から配列読取の開始が指示されると、シーケンサー2は、ステップS2′′で、複数のライブラリー試料の夫々に関して、核酸配列を読み取る。第5実施形態では、シーケンサー2は、複数の被検者の夫々について、同一の被検者から採取され、調製された複数のライブラリー試料の核酸配列を読み取る。続いて、シーケンサー2は、ステップS3′′で、シーケンスランデータを生成する。そして、次のステップS4′′で、生成したシーケンスランデータをストレージ3に記憶し、処理を終了する。
図27は、ステップS42(図7参照)又はステップS42′(図25参照)で抽出した1の配列データセットに含まれる複数の核酸配列データの変異の種別を判定する処理を説明するフローチャートである。図27を参照して、制御部7f又は制御部107fが実行する処理について説明する。制御部7f又は制御部107fは、ステップS83′において、ステップS61(図10参照)で取得した1の配列データセットに含まれる複数の核酸配列データのうち、1の取得配列について、取得配列と参照配列とに不一致があるか否かを判定する。制御部7f又は制御部107fは、不一致がある場合(「Yes」の場合)、処理をステップS84′に進め、不一致がない場合(「No」の場合)、処理をステップS44(図7参照)又はステップS44′(図25参照)に進める。
制御部7f又は制御部107fは、ステップS84′において、ステップS83′で検出された不一致の塩基、すなわち変異の種別を決定する。制御部7f又は制御部107fは、ステップS99′において、取得した1の配列データセットに含まれる複数の核酸配列データの全てについて、参照配列と比較したか否かを判定する。核酸配列データの全てについて比較したと判定した場合(「Yes」の場合)、制御部7f又は制御部107fは、処理をステップS85′に進める。核酸配列データの全てについて比較していないと判定した場合(「No」の場合)、制御部7f又は制御部107fは、処理をステップS83′に戻す。
制御部7f又は制御部107fは、ステップS85′で、検出された各変異に基づいて、変異情報データベース8に記憶されている変異情報データベースを検索する。制御部7fは、ステップS86′において、ステップS85′の検索結果に基づき、検出された各変異に遺伝子名、アノテーション等を付与する。なお、第5実施形態において、ステップS85′及びS86′の処理は省略可能である。
[第5実施形態の作用効果]
第5実施形態によれば、シーケンサー2を動作させる解析依頼元施設10が、核酸配列解析装置7が設置されている依頼先施設30、又は受付・解析装置107が設置されている依頼先施設130と異なる施設であったとしても、核酸配列解析装置7又は受付・解析装置107で、配列データセットの中から、同一被検者の複数のライブラリー試料に対応するそれぞれの核酸配列データの正しい組み合わせを正確かつ迅速に抽出できる。よって、依頼先施設30又は130で正しい組み合わせの複数の核酸配列データを解析することができ、同一被検者の複数の核酸配列データを用いた解析を正確かつ迅速に行うことが可能になる。
第5実施形態によれば、シーケンサー2を動作させる解析依頼元施設10が、核酸配列解析装置7が設置されている依頼先施設30、又は受付・解析装置107が設置されている依頼先施設130と異なる施設であったとしても、核酸配列解析装置7又は受付・解析装置107で、配列データセットの中から、同一被検者の複数のライブラリー試料に対応するそれぞれの核酸配列データの正しい組み合わせを正確かつ迅速に抽出できる。よって、依頼先施設30又は130で正しい組み合わせの複数の核酸配列データを解析することができ、同一被検者の複数の核酸配列データを用いた解析を正確かつ迅速に行うことが可能になる。
(第6実施形態)
第5実施形態では、解析依頼情報の送信、及び整合性検証の処理を実行したが、第6実施形態では、解析依頼情報の送信、及び整合性検証の処理を実行しない点で第5実施形態と異なる。図28は、第6実施形態において、データ送信装置5、受付装置6、及び核酸配列解析装置7の各制御部が実行する処理を説明するフローチャートである。図29は、第6実施形態において、データ送信装置5及び受付・解析装置107の各制御部が実行する処理を説明するフローチャートである。図28に示すように、第6実施形態では、データ送信装置5の制御部5fは、ステップS21,S24、S25の処理を実行するが、ステップS20、S22、S23(図7参照)の処理は実行しない。受付装置6の制御部6fは、ステップS31、S34、S35、S36の処理を実行するが、ステップS30、S32、S33(図7参照)の処理は実行しない。核酸配列解析装置7の制御部7fは、ステップS41,S42、S43、S44、S45、S46の処理を実行するが、ステップS40(図7参照)の処理は実行しない。図29に示すように、第6実施形態では、データ送信装置5の制御部5fは、ステップS21′,S24′、S25′の処理を実行するが、ステップS20′、S22′、S23′(図25参照)の処理は実行しない。受付・解析装置107の制御部107fは、ステップS41′、S42′、S43′、S44′、S45′、S46′の処理を実行するが、ステップS30′、S32′、S33′(図25参照)の処理は実行しない。
第5実施形態では、解析依頼情報の送信、及び整合性検証の処理を実行したが、第6実施形態では、解析依頼情報の送信、及び整合性検証の処理を実行しない点で第5実施形態と異なる。図28は、第6実施形態において、データ送信装置5、受付装置6、及び核酸配列解析装置7の各制御部が実行する処理を説明するフローチャートである。図29は、第6実施形態において、データ送信装置5及び受付・解析装置107の各制御部が実行する処理を説明するフローチャートである。図28に示すように、第6実施形態では、データ送信装置5の制御部5fは、ステップS21,S24、S25の処理を実行するが、ステップS20、S22、S23(図7参照)の処理は実行しない。受付装置6の制御部6fは、ステップS31、S34、S35、S36の処理を実行するが、ステップS30、S32、S33(図7参照)の処理は実行しない。核酸配列解析装置7の制御部7fは、ステップS41,S42、S43、S44、S45、S46の処理を実行するが、ステップS40(図7参照)の処理は実行しない。図29に示すように、第6実施形態では、データ送信装置5の制御部5fは、ステップS21′,S24′、S25′の処理を実行するが、ステップS20′、S22′、S23′(図25参照)の処理は実行しない。受付・解析装置107の制御部107fは、ステップS41′、S42′、S43′、S44′、S45′、S46′の処理を実行するが、ステップS30′、S32′、S33′(図25参照)の処理は実行しない。
なお、本開示は、上記実施形態およびその変形例に限定されるものではなく、本願の特許請求の範囲に記載された事項およびその均等な範囲において種々の改良や変更が可能である。
例えば、解析システム4は、3台以上のコンピュータで構成されてもよい。また、第1のライブラリー試料を、1の被検者の1の腫瘍組織から採取された検体から調製し、第2のライブラリー試料を、同一の被検者の1の腫瘍組織とは異なる腫瘍組織から採取された検体から調製してもよい。例えば、第1のライブラリー試料を、1の被検者の大腸から採取された検体から調製し、第2のライブラリー試料を、同一の被検者の胃から採取された検体から調製してもよい。
1,101 核酸情報送受信システム、 2 シーケンサー、 3 ストレージ、 4,104 解析システム、 5 データ送信装置、 6 受付装置、 7 核酸配列解析装置、 8 変異情報データベース、 10 解析依頼元施設、 11 ネットワーク、 20 依頼受付施設、 30,130 依頼先施設、 35,35′,135,235,335 サンプルシート、 37 核酸配列データ、 38 インデックス、 40,140,240,340 症例登録画面、 50 シーケンスランデータ、 107 受付・解析装置。
Claims (17)
- 遺伝子パネル検査において、核酸配列を読み取るシーケンサーを用いて第1の施設で得られた核酸配列データを第2の施設で解析するためのコンピュータを制御する制御方法であって、
同一の被検者の検体から調製された第1ライブラリー試料及び第2ライブラリー試料を含む複数のライブラリー試料の夫々に対応する、前記シーケンサーを用いて得られた複数の核酸配列データを含む配列データセットと、前記第1ライブラリー試料及び前記第2ライブラリー試料が前記同一の被検者の検体から調製されたことを表す紐づけ情報と、を前記第1の施設からネットワークを介して受信し、
前記紐づけ情報により紐づけられた前記第1ライブラリー試料及び前記第2ライブラリー試料の夫々に対応する第1配列データ及び第2配列データを解析し、
前記第1配列データの解析結果と前記第2配列データの解析結果とに基づく解析情報を出力する、
制御方法。 - 第1コンピュータにより、前記配列データセット及び前記紐づけ情報を受信し、受信した前記配列データセット及び前記紐づけ情報を第2コンピュータに送信し、
前記第2コンピュータにより、前記第1配列データ及び前記第2配列データを解析し、前記解析情報を出力する、
請求項1に記載の制御方法。 - コンピュータにより、前記配列データセット及び前記紐づけ情報を受信し、前記第1配列データ及び前記第2配列データを解析し、前記解析情報を出力する、
請求項1に記載の制御方法。 - 前記第1ライブラリー試料が前記被検者の腫瘍検体から調製された試料であって、前記第2ライブラリー試料が前記被検者の非腫瘍検体から調製された試料であり、
前記解析情報が、前記第1配列データの解析結果に基づく体細胞変異の情報と、前記第2配列データの解析結果に基づく生殖細胞変異の情報とを含む、
請求項1から3のいずれか1つに記載の制御方法。 - 前記第1ライブラリー試料が、前記被検者の腫瘍検体に含まれるデオキシリボ核酸から調製された試料であって、前記第2ライブラリー試料が、前記腫瘍検体に含まれるリボ核酸から調製された試料であり、
前記解析情報が、前記第1配列データの解析結果に基づく体細胞変異の情報と、前記第2配列データの解析結果に基づく融合遺伝子変異の情報とを含む、
請求項1から3のいずれか1つに記載の制御方法。 - 前記配列データセットが、前記同一の被検者の非腫瘍検体から調製された第3ライブラリー試料に対応する第3配列データを更に含み、
前記紐づけ情報は、前記第1ライブラリー試料、及び前記第2ライブラリー試料に加えて、前記第3ライブラリー試料が前記同一の被検者の検体から調製されたことを表す情報であり、
前記第1配列データ、及び前記第2配列データの解析に加えて、前記第3配列データを更に解析し、
前記解析情報が、前記第1配列データの解析結果に基づく体細胞変異の情報、及び前記第2配列データの解析結果に基づく融合遺伝子変異の情報に加えて、前記第3配列データの解析結果に基づく生殖細胞変異の情報を更に含む、
請求項5に記載の制御方法。 - 前記非腫瘍検体が、前記被検者から採取した血液検体である、
請求項4又は6に記載の制御方法。 - 前記被検者の症例情報、前記遺伝子パネル検査の種別情報、及び前記第1の施設の情報のうちの少なくとも1つを含む解析依頼情報を、前記第1の施設から前記ネットワークを介して更に受信する、請求項1から7のいずれか1つに記載の制御方法。
- 人が前記第1の施設の第3コンピュータを操作して入力した、前記第1ライブラリー試料及び前記第2ライブラリー試料が前記同一の被検者の検体から調製されたことを表す入力情報を取得し、
前記紐づけ情報と前記入力情報を比較する、
請求項1から8のいずれか1つに記載の制御方法。 - 前記紐づけ情報と前記入力情報との間に整合があるか否かを判定し、
前記紐づけ情報と前記入力情報が整合している場合に、前記第1配列データ及び前記第2配列データの解析を実行する、
請求項9に記載の制御方法。 - 前記紐づけ情報と前記入力情報との間に整合があるか否かを判定し、
前記紐づけ情報と前記入力情報が不整合である場合に、
前記不整合に基づくエラー情報を、前記第1の施設に通知する、
請求項9又は10に記載の制御方法。 - 前記配列データセットとともに、別の同一の被検者の検体から調製された第4ライブラリー試料及び第5ライブラリー試料を含む複数のライブラリー試料の夫々に対応する、前記シーケンサーを用いて得られた複数の核酸配列データを含む別の配列データセットを受信する、
請求項1から11のいずれかに記載の制御方法。 - 前記第1ライブラリー試料、前記第2ライブラリー試料、前記第4ライブラリー試料、及び前記第5ライブラリー試料は、前記シーケンサーにより同一のシーケンスランで配列を読み取られた試料である、
請求項12に記載の制御方法。 - 前記配列データセット及び前記紐づけ情報の受信、前記第1配列データ及び前記第2配列データの解析、及び前記解析情報の出力を、クラウドシステムを構成するコンピュータにより実行する、
請求項1から13のいずれか1つに記載の制御方法。 - 前記紐づけ情報は、ライブラリー試料を識別するための試料識別情報、又はライブラリー試料の検体の採取元である被検者を識別するための被検者識別情報としても使用される、
請求項1から14のいずれか1つに記載の制御方法。 - 遺伝子パネル検査において、核酸配列を読み取るシーケンサーを用いて第1の施設で得られた核酸配列データを第2の施設で解析する解析システムであって、
同一の被検者の検体から調製された第1ライブラリー試料及び第2ライブラリー試料を含む複数のライブラリー試料の夫々に対応する、前記シーケンサーを用いて得られた核酸配列データを含む配列データセットと、前記第1ライブラリー試料及び前記第2ライブラリー試料が前記同一の被検者の検体から調製されたことを表す紐づけ情報と、を前記第1の施設からネットワークを介して受信し、前記第1の施設から取得した前記配列データセット及び前記紐づけ情報を第2コンピュータに送信する第1コンピュータと、
前記紐づけ情報により紐づけられた前記第1配列データ及び前記第2配列データを解析し、前記第1配列データの解析結果と前記第2配列データの解析結果とに基づく解析情報を出力する前記第2コンピュータと、を備える、
解析システム。 - 遺伝子パネル検査において、核酸配列を読み取るシーケンサーを用いて第1の施設で得られた核酸配列データを第2の施設で解析する解析システムであって、
同一の被検者の検体から調製された第1ライブラリー試料及び第2ライブラリー試料を含む複数のライブラリー試料の夫々に対応する、前記シーケンサーを用いて得られた核酸配列データを含む配列データセットと、前記第1ライブラリー試料及び前記第2ライブラリー試料が前記同一の被検者の検体から調製されたことを表す紐づけ情報と、を前記第1の施設からネットワークを介して受信し、前記紐づけ情報により紐づけられた前記第1配列データ及び前記第2配列データを解析し、前記第1配列データの解析結果と前記第2配列データの解析結果とに基づく解析情報を出力するコンピュータを備える、
解析システム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021178344A JP2023067270A (ja) | 2021-10-29 | 2021-10-29 | 制御方法、及び解析システム |
US18/049,803 US20230298689A1 (en) | 2021-10-29 | 2022-10-26 | Control method and analysis system |
CN202211323280.0A CN116072221A (zh) | 2021-10-29 | 2022-10-27 | 控制方法及解析系统 |
EP22204384.6A EP4174865A1 (en) | 2021-10-29 | 2022-10-28 | Control method and analysis system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021178344A JP2023067270A (ja) | 2021-10-29 | 2021-10-29 | 制御方法、及び解析システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023067270A true JP2023067270A (ja) | 2023-05-16 |
Family
ID=84044433
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021178344A Pending JP2023067270A (ja) | 2021-10-29 | 2021-10-29 | 制御方法、及び解析システム |
Country Status (4)
Country | Link |
---|---|
US (1) | US20230298689A1 (ja) |
EP (1) | EP4174865A1 (ja) |
JP (1) | JP2023067270A (ja) |
CN (1) | CN116072221A (ja) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9444880B2 (en) | 2012-04-11 | 2016-09-13 | Illumina, Inc. | Cloud computing environment for biological data |
JP7054133B2 (ja) * | 2017-11-09 | 2022-04-13 | 国立研究開発法人国立がん研究センター | 配列解析方法、配列解析装置、参照配列の生成方法、参照配列生成装置、プログラム、および記録媒体 |
JP6891150B2 (ja) * | 2018-08-31 | 2021-06-18 | シスメックス株式会社 | 解析方法、情報処理装置、遺伝子解析システム、プログラム、記録媒体 |
US20200258601A1 (en) * | 2018-10-17 | 2020-08-13 | Tempus Labs | Targeted-panel tumor mutational burden calculation systems and methods |
JP6883076B2 (ja) * | 2019-09-30 | 2021-06-09 | シスメックス株式会社 | 検査依頼をコンピュータにより管理する方法、管理装置、管理コンピュータプログラム、管理システム。 |
-
2021
- 2021-10-29 JP JP2021178344A patent/JP2023067270A/ja active Pending
-
2022
- 2022-10-26 US US18/049,803 patent/US20230298689A1/en active Pending
- 2022-10-27 CN CN202211323280.0A patent/CN116072221A/zh active Pending
- 2022-10-28 EP EP22204384.6A patent/EP4174865A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CN116072221A (zh) | 2023-05-05 |
EP4174865A1 (en) | 2023-05-03 |
US20230298689A1 (en) | 2023-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Rehm et al. | ACMG clinical laboratory standards for next-generation sequencing | |
US20180300456A1 (en) | Population based treatment recommender using cell free dna | |
Hanson-Smith et al. | PhyloBot: a web portal for automated phylogenetics, ancestral sequence reconstruction, and exploration of mutational trajectories | |
EP3631657B1 (en) | System and method for detecting gene fusion | |
US11901043B2 (en) | Sequence analysis method, sequence analysis apparatus, reference sequence generation method, reference sequence generation apparatus, program, and storage medium | |
JP2022516152A (ja) | 転移性組織サンプルのトランスクリプトームデコンボリューション | |
Staaf et al. | RNA sequencing-based single sample predictors of molecular subtype and risk of recurrence for clinical assessment of early-stage breast cancer | |
US20200402611A1 (en) | Method of analyzing nucleic acid sequence of patient sample, presentation method, presentation apparatus, and presentation program of analysis result, and system for analyzing nucleic acid sequence of patient sample | |
Sun et al. | PremPLI: a machine learning model for predicting the effects of missense mutations on protein-ligand interactions | |
Santander et al. | STEAK: A specific tool for transposable elements and retrovirus detection in high-throughput sequencing data | |
Saha et al. | Whole genome analysis of more than 10 000 SARS-CoV-2 virus unveils global genetic diversity and target region of NSP6 | |
Lin et al. | A general framework for integrative analysis of incomplete multiomics data | |
Feng et al. | An accurate regression of developmental stages for breast cancer based on transcriptomic biomarkers | |
Sukhadia et al. | ImaGene: A web-based software platform for tumor radiogenomic evaluation and reporting | |
Rosati et al. | Differential gene expression analysis pipelines and bioinformatic tools for the identification of specific biomarkers: A Review | |
JP2023067270A (ja) | 制御方法、及び解析システム | |
Singh et al. | Genome-wide association study meta-analysis of blood pressure traits and hypertension in sub-Saharan African populations: an AWI-Gen study | |
Poplin et al. | Challenges of accuracy in germline clinical sequencing data | |
Grabski et al. | Human endogenous retrovirus-K mRNA expression and genomic alignment data in hepatoblastoma | |
CN112582051A (zh) | 管理检查委托的方法、管理装置、存储介质、管理系统 | |
JP2021056892A (ja) | 専門家会議をコンピュータを用いて支援する方法、支援装置、専門家会議を支援するためのコンピュータプログラム、支援システム。 | |
Wang et al. | Development and Analytical Validation of a Targeted Next-Generation Sequencing Panel to Detect Actionable Mutations for Targeted Therapy | |
Shen | Genomic Informatics in the Healthcare System | |
Poo et al. | UASIS: universal automatic SNP identification system | |
Kahraman et al. | MTPpilot: an interactive software for visualization of NGS results in molecular tumor boards |