[実施の形態1]
図1は、ゲノム解析システム10を用いた処理の流れを説明する説明図である。ゲノムは、1つの個体、ここでは一人のヒトの遺伝情報全体を意味する。
患者から検体が採取される。検体は、腫瘍部と、正常部との両方からそれぞれ採取されることが望ましい。腫瘍部の検体は、病変部の生検または手術等により採取される。以下の説明では、腫瘍部から採取された検体を腫瘍検体と記載する。血液がん等、血液に異常がある患者を除き、正常部の検体は採血等により採取される場合が多い。血液がんの患者の場合には、血液から腫瘍部の検体が採取され、それ以外の正常組織から正常部の検体が採取される。
それぞれの検体から核酸、すなわちDNA(Deoxyribonucleic Acid)またはRNA(Ribonucleic Acid)が抽出される。以下の説明では、DNAが抽出される場合を例にして説明する。読取装置31によりDNAの塩基配列が読み取られ、ゲノムデータが作成される。ゲノムデータの詳細については後述する。以下の説明においては、読取装置31は次世代シーケンサである場合を例にして説明するが、読取装置31はDNAマイクロアレイその他塩基配列を読み取る任意の装置または機器であっても良い。
ゲノムデータが学習モデル53に入力される。学習モデル53から、臨床上意味のある遺伝子変異の予測が出力される。出力された遺伝子変異と、医学文献等から収集した情報を統合した統合DB(Database)52とに基づいて、報告書案が自動的に作成される。学習モデル53および統合DB52の詳細については後述する。
なお、学習モデル53から臨床上の意味の有無にかかわらず遺伝子変異の予測が出力されても良い。そのようにする場合、学習モデル53から出力された遺伝子変異と、統合DB52とに基づいて、臨床上意味のある変異が抽出されて、報告書案が自動的に作成される。
がん専門医および遺伝子学者等の専門家により構成されたエキスパートパネルが、報告書案をレビューし、必要に応じて修正することにより、報告書が完成する。患者の治療を担当する臨床医は、報告書を見て治療方針を判断する。報告書案および報告書の詳細については後述する。なお、エキスパートパネルによるレビューは行なわれなくても良い。このようにする場合、臨床医は、統合DB52から出力された報告書案を見て治療方針を判断する。
図2は、学習モデル53の生成方法を説明する説明図である。腫瘍部の検体を用いて病理検査が行なわれる。腫瘍部の検体から、腫瘍細胞を含む部分が切り取られる。切り取られた検体から、腫瘍部のDNAが抽出される。正常部の検体から、正常部のDNAが抽出される。正常部のDNAと、腫瘍部のDNAとが読取装置31に投入されて、ゲノムデータが作成される。
病理検査の結果と、ゲノムデータと、その他の検査数値とに基づいて、腫瘍の良悪性、原発がんであるか否か、腫瘍部検体中の腫瘍含有量、効果を期待できる薬剤等を専門家が判断して、診断データを作成する。
ゲノムデータと診断データとが関連づけられて教師データDB51(図5参照)に記録される。教師データDB51の詳細については後述する。教師データDB51に基づいて教師あり機械学習を行ない、学習モデル53が生成される。学習モデル53は、検体に含まれる塩基配列を読み取ったゲノムデータが入力された場合に、検体にかかる遺伝子変異に関する予測を出力する学習済モデルである。
図3は、統合DB52の概要を説明する説明図である。統合DB52は、複数の情報源から取得した遺伝子変異に関する医学情報と、当該医学情報の取得元とを関連づけて統合したDBである。情報源は、たとえば医学論文を公開するDB、国または研究機関等が、薬剤または治療法の臨床試験に関する情報を公開するDB、企業または大学等が発行した医療に関するプレスリリース等の公開情報を蓄積したDB等の、種々の医学情報DB58である。
医学情報DB58は、無償で公開されているDBであっても、有償で公開されているDBであっても良い。なお、有償で公開されているDBを使用する場合には、有償DBの提供元と、統合DB52の提供元との間で、適切なライセンス契約を締結する等の、ライセンス処理を行う。
それぞれの医学情報DB58には、異なるフォーマットで医学情報が記録されており、異なるタイミングで情報が更新される。それぞれの医学情報DB58にアクセスして、情報を収集してデータベース化するクローリングにより、統合DB52が作成される。
クローリングは適宜行なわれ、更新された統合DB52が作成される。それぞれの統合DB52は、たとえば更新日または更新日時等が判別できる状態でバージョン管理される。統合DB52の詳細については後述する。
なお、それぞれの統合DB52には、前のバージョンとの差分、または、任意のバージョンとの差分が記録され、必要に応じて任意の時点における統合DB52を構築できるように構成されても良い。差分を記録することにより、統合DB52の記録容量を節約できる。
図4は、ゲノムデータの概要を説明する説明図である。検体に対して前処理が行なわれる。具体的には、前述のとおり検体からDNAが抽出される。抽出されたDNAに対して、精製、断片化および増幅等の処理が行なわれる。断片化により、DNAは後工程で使用される読取装置31による読み取りに適した長さの断片に切断される。
読取装置31は、断片化されたそれぞれのDNAの塩基配列を順次読み取る。1本のDNA断片から読み取られた塩基配列に関する情報はリードと呼ばれる。リードには、個々の塩基について読み取りの信頼度を示すクオリティスコアも記録される。
それぞれのリードは、たとえば日本人の基準ゲノム配列(Japanese Reference Genome:JRG)、または、国際ヒトゲノム参照配列等の参照配列にマッピングされる。マッピング結果は、たとえばBAM形式、SAM形式またはCRAM形式のファイルに記録される。
マッピング結果と、参照配列との相違点、すなわち参照配列に対して検体のゲノムが変異している箇所の位置および変異内容等についての情報が、たとえばVCF形式またはBCF形式のファイルに記録される。
なお、VCF形式のファイルには、遺伝情報がコードされていないイントロンの変異、および、コードされたアミノ酸に変化を生じない同義変異等、臨床的な重要性の低い変異が多数含まれる。したがって、VCF形式のファイルから、治療方針等を定めるための情報を読み取るには、高度な専門知識を要する。
FASTQ形式のファイルおよび参照配列が与えられれば、公知の解析手法により、BAM形式、SAM形式、CRAM形式およびVCF形式のファイルに変換できる。以上に説明した、FASTQ形式、BAM形式、SAM形式、CRAM形式、VCF形式およびBCF形式のデータを総称して、ゲノムデータと呼ぶ。ゲノムデータは、ここに例示した形式以外の任意の形式のデータであっても良い。
たとえば、読取装置31がFASTQ形式のファイルを出力し、図示を省略する解析装置がBAM形式およびVCF形式のファイルに変換する。読取装置31が解析装置を内蔵し、直接BAM形式およびVCF形式のファイルを出力しても良い。後述する情報処理装置20(図5参照)が、FASTQ形式またはBAM形式のファイルを取得して、VCF形式に変換しても良い。
CNA(Copy Number Alteration:体細胞コピー数異常)解析を行なう場合には、患者から採取した複数の正常部の検体から得られたゲノムデータと、腫瘍部の検体から得られたゲノムデータとを比較する。
CNA解析には、PON(Panel Of Normals)の手法が使用されても良い。PONを用いる場合には、複数の人から採取された正常部検体について、たとえばBAM形式またはSAM形式のゲノムデータを作成し、保存しておく。患者から採取された腫瘍部の検体から得られたゲノムデータと、保存済のゲノムデータとを比較して、解析を行なう。
図5は、ゲノム解析システム10の構成を説明する説明図である。ゲノム解析システム10は、情報処理装置20、読取装置31およびデータサーバ32を備える。
情報処理装置20は、制御部21、主記憶装置22、補助記憶装置23、通信部24、およびバスを備える。制御部21は、本実施の形態のプログラムを実行する演算制御装置である。制御部21は、一もしくは複数のCPU(Central Processing Unit)、マルチコアCPUまたはGPU(Graphics Processing Unit)等により構成される。制御部21は、バスを介して情報処理装置20を構成するハードウェア各部と接続されている。
主記憶装置22は、SRAM(Static Random Access Memory)、DRAM(Dynamic Random Access Memory)、フラッシュメモリ等の記憶装置である。主記憶装置22には、制御部21が行なう処理の途中で必要な情報および制御部21で実行中のプログラムが一時的に保存される。
補助記憶装置23は、SRAM、フラッシュメモリまたはハードディスク等の記憶装置である。補助記憶装置23には、教師データDB51、統合DB52、学習モデル53、報告書案DB55、報告書DB56、制御部21に実行させるプログラム、およびプログラムの実行に必要な各種データが保存される。なお、教師データDB51、統合DB52、学習モデル53、報告書案DB55および報告書DB56は、情報処理装置20に接続された外部の大容量記憶装置、または、データサーバ32等に保存されていても良い。
通信部24は、情報処理装置20とネットワークとの間の通信を行なうインターフェイスである。
前述のとおり、読取装置31は、次世代シーケンサ、DNAマイクロアレイその他塩基配列を読み取る任意の装置または機器である。読取装置31が読み取った塩基配列に基づいて作成されたゲノムデータはデータサーバ32に記録される。制御部21は、通信部24およびネットワークを介してデータサーバ32に記録されたゲノムデータを取得できる。なお、制御部21は、データサーバ32を介さず、読取装置31から直接ゲノムデータを取得してもよい。
本実施の形態の情報処理装置20は、汎用のパソコン、タブレット、大型計算機、または、大型計算機上で動作する仮想マシンである。情報処理装置20は、複数のパソコン、タブレットまたは大型計算機等のハードウェアにより構成されても良い。情報処理装置20は、量子コンピュータにより構成されても良い。情報処理装置20は、読取装置31と一体化されていても良い。情報処理装置20は、いわゆるクラウドコンピューティングにより実現されても良い。
図6は、教師データDB51のレコードレイアウトを説明する説明図である。教師データDB51は、ゲノムデータと診断データとを関連づけて記録するDBである。図6には、教師データDB51の1つのレコードを示す。
教師データDB51は、検体フィールド、ゲノムデータフィールドおよび診断データフィールドを有する。検体フィールドは、正常部検体フィールドおよび腫瘍部検体フィールドを有する。ゲノムデータフィールドは、正常部ゲノムフィールドおよび腫瘍部ゲノムフィールドを有する。なお、教師データDB51は、正常部ゲノムフィールドを有さなくても良い。
診断データフィールドは、非同義体細胞変異フィールド、生殖細胞変異フィールドおよび腫瘍含有量フィールドを有する。非同義体細胞変異フィールドは、遺伝子フィールドおよびDNA変異フィールドを有する。生殖細胞変異フィールドは、遺伝子フィールドおよびDNA変異フィールドを有する。教師データDB51は、1組の教師データについて1つのレコードを有する。なお、診断データフィールドは、腫瘍含有量フィールドを有さなくてもよい。
正常部検体フィールドには、正常部の検体が採取された部位が記録される。腫瘍部検体フィールドには、腫瘍部の検体が採取された部位が記録される。正常部ゲノムフィールドには、正常部検体から取得したゲノムデータのファイル名が記録される。腫瘍部ゲノムフィールドには、腫瘍部検体から取得したゲノムデータのファイル名が記録される。
非同義体細胞変異フィールドのサブフィールドには、腫瘍部ゲノムに含まれる非同義体細胞変異、すなわちDNAの塩基配列にコードされたアミノ酸に変化を生じさせる体細胞変異を有する遺伝子と、変異内容とが記録される。体細胞変異は、正常部ゲノムには生じていないが、腫瘍部ゲノムには生じている変異を意味する。すなわち非同義体細胞変異は、腫瘍の特性に関する変異である。
たとえば、図6の非同義体細胞変異フィールドの1行目は、ARID1A(AT-rich interactive domain 1A)遺伝子の5164番目の塩基がC(シトシン)からT(チミン)に変異していることを示す。同様に2行目はTP53遺伝子の743番目の塩基がG(グアニン)からA(アデニン)に変異していることを示す。
生殖細胞変異フィールドのサブフィールドには、正常部ゲノムに含まれる変異を有する遺伝子と、変異内容とが記録される。たとえば、図6の生殖細胞変異フィールドの1行目は、BRAF遺伝子の1791番目の塩基がTからGに変異していることを示す。
非同義体細胞フィールドおよび生殖細胞変異フィールドには、検体から検出された遺伝子変異のうち、教師データに記録する必要がある任意の数の遺伝子が記録される。
なお、正常部の検体を採取してゲノムデータを取得する代わりに、日本人の基準ゲノム配列等の参照配列を使用する場合がある。このようにする場合には、生殖細胞変異に関する結果は、推定結果である。
診断データフィールドは、同義体細胞変異を記録する同義体細胞変異フィールドを有しても良い。非同義体細胞変異フィールドの代わりに体細胞変異フィールドを有し、同義体細胞変異と非同義体細胞変異の両方を記録しても良い。
腫瘍含有量フィールドには、腫瘍部から採取した検体の腫瘍含有量が記録される。腫瘍含有量は、たとえばヘテロSNP(Single Nucleotide Polymorphism)数に基づいて算出される。BAMファイルまたはSAMファイルに記録されたアリル頻度、または、BAMファイルまたはSAMファイルに記録されたデータから算出されたアリル頻度に基づいて、腫瘍含有量が算出されても良い。
病理検査により観察された有核細胞の数と腫瘍細胞の数との比、または、顕微鏡視野内で腫瘍細胞が占める面積に基づいて、腫瘍含有量が算出されても良い。腫瘍含有量の定義は任意であるが、教師データDB51に含まれるすべての教師データにおいて、統一した定義が用いられていることが望ましい。
図7は、統合DB52のレコードレイアウトを説明する説明図である。統合DB52は、複数の情報源から取得した遺伝子変異に関する医学情報と、当該医学情報の取得元とを関連づけて統合したDBである。統合DB52は、バージョンフィールド、ゲノム変異フィールドおよび知識データフィールドを有する。
バージョンフィールドには、統合DB52のバージョンが記録されている。本実施の形態では、統合DB52は更新日付で管理されている。
ゲノム変異フィールドは、検体フィールド、遺伝子フィールドおよび変異内容フィールドを有する。知識データフィールドは、発がん性フィールド、臨床的意義フィールド、対応薬剤フィールド、対応疾患フィールド、レベルフィールドおよび根拠情報フィールドを有する。統合DB52は、遺伝子変異に関する1件の医学情報について、1つのレコードを有する。
検体フィールドには、検体が採取された部位が記録される。遺伝子フィールドには、変異が検出された遺伝子が記録される。なお、複数の変異の組合せに関する医学情報が記録されたレコードにおいては、遺伝子フィールドに複数の遺伝子が記録される。
変異内容フィールドには、非同義体細胞変異または生殖細胞変異等の、変異の内容が記録される。なお、コードされたアミノ酸に変化が生じない同義体細胞変異に関する情報も統合DB52に記録される場合がある。
発がん性フィールドには、ゲノム変異の発がん性のレベルが記録される。臨床的意義フィールドには、ゲノム変異の臨床的意義が記録される。知識データフィールドは、発がん性フィールドと、臨床的意義フィールドは、いずれか一方のみを有してもよい。
対応薬剤フィールドには、ゲノム変異を有する患者に投与した場合に効果がある薬剤が記録される。対応薬剤フィールドに、治験中の薬剤が記録されても良い。対応疾患フィールドには、ゲノム変異に対応する疾患が記録される。レベルフィールドには、ゲノム変異の重要度のレベルが記録される。根拠情報フィールドには、レコードに記載された情報の根拠である文献、データベース名、または、情報に固有に付与されたID(Identifier)等の、根拠情報にアクセスするための情報が記録される。
知識データフィールドの各サブフィールドにおいて「−」は対応する情報がないことを意味する。
図8は、報告書DB56のレコードレイアウトを説明する説明図である。報告書DB56は、検体に関する情報と、検体に基づく診断データとを関連づけて記録したDBである。図8には、報告書DB56の1つのレコードを示す。
報告書DB56は、検体IDフィールド、検体フィールド、ゲノムデータフィールド、統合DBVer.フィールド、診断データフィールドおよびエキスパートIDフィールドを有する。検体フィールドは、正常部検体フィールドおよび腫瘍部検体フィールドを有する。ゲノムデータフィールドは、正常部ゲノムフィールドおよび腫瘍部ゲノムフィールドを有する。
診断データフィールドは、非同義体細胞変異フィールド、生殖細胞変異フィールドおよび腫瘍含有量フィールドを有する。非同義体細胞変異フィールドは、診断データフィールドおよび知識データフィールドを有する。診断データフィールドは、遺伝子フィールドおよびDNA変異フィールドを有する。知識データフィールドは、発がん性フィールド、臨床的意義フィールド、対応薬剤フィールド、対応疾患フィールド、レベルフィールドおよび根拠情報フィールドを有する。
生殖細胞変異フィールドは、診断データフィールドおよび知識データフィールドを有する。診断データフィールドは、遺伝子フィールドおよびDNA変異フィールドを有する。知識データフィールドは、臨床的意義フィールド、レベルフィールドおよび根拠情報フィールドを有する。報告書DB56は、1組の検体について、1つのレコードを有する。
検体IDフィールドには、1組の検体に固有に付与された検体IDが記録される。検体IDは、電子カルテシステム等と連携して、患者に紐付けられている。正常部検体フィールドには、正常部の検体が採取された部位が記録される。腫瘍部検体フィールドには、腫瘍部の検体が採取された部位が記録される。正常部ゲノムフィールドには、正常部検体から取得したゲノムデータのファイル名が記録される。腫瘍部ゲノムフィールドには、腫瘍部検体から取得したゲノムデータのファイル名が記録される。統合DBVer.フィールドには、報告書レコードの作成時に用いられた統合DB52のバージョンが記録される。
非同義体細胞変異フィールド中の診断データフィールドのサブフィールドには、非同義体細胞変異を有する遺伝子と、変異内容とが記録される。知識データフィールドの各サブフィールドには、診断データフィールドに記録された遺伝子変異に関連する医学情報が記録される。各サブフィールドに記録される情報は、図7を使用して説明した統合DB52中の同名のサブフィールドに記録される情報と同様であるため、説明を省略する。
生殖細胞変異フィールド中の診断データフィールドのサブフィールドには、生殖細胞変異を有する遺伝子と、変異内容とが記録される。知識データフィールドの各サブフィールドには、診断データフィールドに記録された遺伝子変異に関連する医学情報が記録される。各サブフィールドに記録される情報は、図7を使用して説明した統合DB52中の同名のサブフィールドに記録される情報と同様であるため、説明を省略する。
エキスパートIDフィールドには、後述するプログラムにより制御部21が自動的に作成した報告書案をレビューしたエキスパートパネルを構成した専門家にそれぞれ固有に付与された専門家IDが記録される。複数の専門家が参加する専門家グループに対して、1つのエキスパートIDが付与されてもよい。
報告書案DB55のレコードレイアウトは、エキスパートIDフィールドを有さない他は、図8を使用して説明した報告書DB56のレコードレイアウトと同一であるため、図示および詳細な説明を省略する。
図9は、学習モデル53を説明する説明図である。学習モデル53は、入力層531、中間層532および出力層533を備えるニューラルネットワークである。図9においては、学習モデル53はCNNである場合を例示する。なお、畳み込み層およびプーリング層については、図示を省略する。
学習モデル53の入力は、腫瘍部のゲノムデータ、正常部のゲノムデータ、腫瘍部検体が採取された部位および正常部検体が採取された部位である。ゲノムデータは、たとえばパイルアップされたアラインメント情報のテンソルであり、塩基配列、ストランド情報、ベースクオリティおよびマップクオリティ等を構成要素に含む。塩基配列は、A、T、G、Cの各塩基のカウントで表されてもよい。学習モデル53に入力されたデータは、図示を省略する畳み込み層およびプーリング層の繰り返しを介して、入力層531に入力する。
学習モデル53の出力は、たとえば診断データの各項目の確率である。具体的には、臨床的に意味のある変異それぞれが発生じている確率、および、腫瘍含有量が所定の値である確率である。たとえば図9において一番上の出力ノードには、BRCA遺伝子の6952番目の塩基がCからTに変異した体細胞変異が生じている確率が、2番目の出力ノードには、BRCA遺伝子の6952番目の塩基がCからTに変異した生殖細胞変異が生じている確率がそれぞれ出力される。
なお、体細胞は対立遺伝子を含むため、検体の体細胞は父親由来の「BRCA遺伝子の6952番目の塩基」と、母親由来の「BRCA遺伝子の6952番目の塩基」とを有する。したがって、体細胞の変異には、父親由来の遺伝子と母親由来遺伝子との双方が変異している場合、父親由来の遺伝子のみが変異している場合、および、母親由来の遺伝子のみが変異している場合が含まれる。
たとえば、学習モデル53の出力は、HomoRef、Hetero、および、HomoAltのスコアであってもよい。HomoRef、Hetero、および、HomoAltは、deepvariant等のゲノム解析用バリアントコーラーで使用される指標である。
図9の一番下の出力ノードには、腫瘍含有量が10パーセントである確率が出力される。出力ノードは、たとえば10パーセント刻み等の任意の腫瘍含有量である確率を出力するノードを含む。
学習モデル53は、入力層531にゲノムデータおよび検体採取部位が入力された場合に、出力層533に臨床的に意味のあるそれぞれの変異が生じている、および、所定の腫瘍含有量である確率を出力する。学習段階においては、制御部21は、ゲノムデータおよび検体採取部位と、臨床上の意味のある変異の有無および腫瘍含有量に関する診断データとを関連づけて記録した教師データDB51を用いて、誤差逆伝播法等を用いて中間層532のパラメータを演算することにより、教師あり機械学習を行なう。
教師あり機械学習は、たとえばロジスティック回帰、SVM(Support Vector Machine)、ランダムフォレスト、CNN、RNNまたは、XGBoost(eXtreme Gradient Boosting)等の任意の手法により行なえる。
学習モデル53は任意のコンピュータを用いて生成されても良い。生成された学習モデル53は、ネットワーク等を介して情報処理装置20に送信されて、補助記憶装置23に記録される。教師あり学習の代わりに、半教師あり学習が用いられてもよい。
図10は、報告書60の例を説明する説明図である。報告書60は、報告書DB56のレコードに記録された情報、および、電子カルテに記録された情報を、ユーザが閲覧しやすい形式に整形して作成される。報告書60は、書誌事項欄61、コメント欄62、非同義体細胞変異欄63、生殖細胞変異欄64および解析欄65を含む。
書誌事項欄61は、ID欄611、患者情報欄612、検体欄613、病理組織診断欄614および検体番号欄615を含む。ID欄611には、患者に固有に付与された患者IDが表示される。患者情報欄612には、患者の性別および年齢が表示される。なお、患者情報欄612は、表示されなくてもよい。
検体欄613には、ゲノム解析に用いた正常部検体および腫瘍部検体が表示される。図10において「FFPE(Formalin Fixed Paraffin Embedded)肺」は、ホルマリン固定パラフィン包埋を行なった肺組織であることを意味する。
病理組織診断欄614には、検体を顕微鏡で観察する病理診断による所見が表示される。検体番号欄615には、検体に固有に付与された検体番号が表示される。書誌事項欄61に表示される情報は、図8を使用して説明した報告書レコードの検体IDをキーとして電子カルテシステムから取得される。
図11は、コメント欄62の例を説明する説明図である。図11Aから図11Cは、それぞれ異なる報告書に表示されるコメント欄62の例を示す。図11Aは、「Pathologic」すなわち病原性を有することが確実な生殖細胞変異が発見された検体に関する報告書のコメント欄62を示す。病原性を有する生殖細胞変異が生じた遺伝子および変異位置と、その根拠、ならびに生殖細胞変異に関する今後の対応についてのアドバイスが表示される。
図11Bは、腫瘍含有量が低い、すなわち腫瘍部検体の質に問題がある可能性がある検体に関する報告書のコメントの例を示す。図11Cは、腫瘍部検体にがん化変異が発見された検体に関するコメントの例を示す。がん化に関連する体細胞変異が生じた遺伝子と、その遺伝子に関連する臨床試験についての情報が表示される。
コメント欄62に表示される文章は、報告書DB56の診断フィールドに記録された情報に基づいて、公知の手法により定型文を組み合わせて作成される。検体に生じている複数の遺伝子変異うち、病原性または発がん性が高い遺伝子変異に関連する定型文を選択して表示することにより、遺伝子検査に関する知識が少ない臨床医であっても重要性の高い情報を速やかに把握できる。
図12は、非同義体細胞変異欄63の例を説明する説明図である。図12においては、図8に例示した報告書レコード中の非同義体細胞変異フィールドに基づいて表示される非同義体細胞変異欄63の例を示す。
非同義体細胞変異欄63は、遺伝子欄631、サイトバンド欄632、DNA変異欄633、アミノ酸変異欄634、アリル頻度欄635および知識データ欄636を含む。遺伝子欄631、DNA変異欄633および知識データ欄636には、それぞれ非同義体細胞変異フィールドに記録された情報が表示される。
サイトバンド欄632には、染色体上の遺伝子の位置が表示される。アミノ酸変異欄634には、DNA変異に起因するアミノ酸の変異が表示される。アリル頻度欄635には、たとえばBAMファイルまたはSAMファイルに記録されたアリル頻度、または、BAMファイルまたはSAMファイルに記録されたデータから算出されたアリル頻度が表示される。
非同義体細胞変異欄63の上部には、非同義体細胞変異欄63に記載していない体細胞変異も含めた総体細胞変異数および総体細胞変異頻度が表示される。総体細胞変異数および総体細胞変異頻度は、VCF形式のファイルから取得できる。
図13は、生殖細胞変異欄64の例を説明する説明図である。図13においては、図8に例示した報告書レコード中の生殖細胞変異フィールドに基づいて表示される生殖細胞変異欄64の例を示す。
生殖細胞変異欄64は、遺伝子欄641、サイトバンド欄642、DNA変異欄643、アミノ酸変異欄644、正常部アリル頻度欄647、腫瘍部アリル頻度欄648および知識データ欄645を含む。遺伝子欄641、DNA変異欄643および知識データ欄645には、それぞれ生殖細胞変異フィールドに記録された情報が表示される。
サイトバンド欄642には、染色体上の遺伝子の位置が表示される。アミノ酸変異欄644には、DNA変異に起因するアミノ酸の変異が記録される。正常部アリル頻度欄647には、たとえばBAM形式またはSAM形式のファイルに記録された正常部のアリル頻度が表示される。腫瘍部アリル頻度欄648には、たとえばBAM形式またはSAM形式のファイルに記録された腫瘍部のアリル頻度が表示される。
図14は、解析欄65の例を説明する説明図である。解析欄65は、推定腫瘍含有量欄651および変異頻度相関係数欄652を含む。推定腫瘍含有量欄651には、学習モデル53の出力に基づく推定腫瘍含有量が表示される。
変異頻度相関係数欄652には、正常部から採取した検体中の遺伝子変異頻度と、腫瘍部から採取した検体中の遺伝子変異頻度との相関係数が表示される。相関係数が高い場合には、正常部と異常部とで、同一の塩基が変異している場合が多く、同一患者由来の検体であると判定される。相関係数が閾値よりも低い場合には、検体の取り違え、または、コンタミネーション等の発生が疑われる。
変異頻度相関係数欄652は表示されなくても良い。たとえば、正常部検体を使用せずに解析を行なう場合には、変異頻度相関係数欄652は不要である。
ユーザが、図10から図14を使用して説明した各欄をたとえば右クリック等により選択した場合、制御部21は、報告書レコードの根拠情報フィールドに記録された情報を表示する。制御部21は、根拠情報フィールドに基づいて根拠情報へのリンクを表示するか、根拠情報自体を表示しても良い。ユーザは、報告書60の記載の根拠を閲覧することにより、報告書の信頼性を確認できる。
報告書60には、レビューを実施したエキスパートパネルの連絡先等が、表示されても良い。ユーザは、報告書60に基づいてエキスパートパネルへの質問、相談等を行なえる。
報告書は、検体に行なった前処理、読取装置31が塩基配列を読み取ったリード数、または、参照配列へのマッピング深度等の情報を含んでも良い。遺伝子検査に詳しい臨床医であれば、これらの情報に基づいて報告書の信頼度を判断できる。
図15は、プログラムの処理の流れを説明するフローチャートである。制御部21は、報告書作成要求に基づいてデータサーバ32からゲノムデータを取得する(ステップS501)。制御部21は、報告書案DB55に新規レコードを作成し、検体IDフィールド、検体フィールドおよびゲノムデータフィールドにそれぞれデータを記録する(ステップS502)。
制御部21は、取得したゲノムデータを学習モデル53に入力して、出力層533の各ノードの予測確率を取得する(ステップS503)。制御部21は、出力層533の遺伝子変異にかかるノードから所定の閾値以上の確率が出力された遺伝子変異を抽出する(ステップS504)。閾値は、遺伝子変異ごとに異なる値であっても、一定の値であっても良い。
制御部21は、出力層533の腫瘍含有量にかかるノードのうちの、最も確率が高いノードに基づいて、検体中の腫瘍含量を判定する(ステップS505)。制御部21は、ステップS502で作成した報告書案レコードの非同義体細胞変異フィールドまたは生殖細胞変異フィールドの診断データフィールドに、ステップS504で抽出した変異を、腫瘍含有量フィールドにステップS505で判定した腫瘍含有量をそれぞれ記録する(ステップS506)。
なお、腫瘍含有量は、図15に示すプログラムとは別の独立したプログラムにより算出されてもよい。そのようにする場合には、ステップS505は不要である。
制御部21は、報告書案レコードに記録された検体の採取部位と遺伝子変異とをキーとして統合DB52を検索し、抽出されたレコードの知識データフィールドから知識データを取得する(ステップS507)。制御部21は、報告書レコードに取得した知識データを記録する(ステップS508)。
制御部21は、報告書案レコードに記録されたすべての遺伝子変異の処理を終了したか否かを判定する(ステップS509)。終了していないと判定した場合(ステップS509でNO)、制御部21はステップS507に戻る。終了したと判定した場合(ステップS509でYES)、制御部21は報告書レコードに基づいて図10を使用して説明した報告書60の案を作成し、補助記憶装置23またはデータサーバ32に記録する(ステップS510)。
エキスパートパネルのメンバーである専門家は、定期的または不定期に開催されるエキスパート会議において報告書60の案をレビューし、必要に応じて修正する。エキスパート会議は、専門家が実際に1室に集合して行なわれても、テレビ会議または電話会議等で行なわれても良い。エキスパート会議は、チャットシステム等を用いた電子会議で行なわれても良い。
エキスパートパネルは、必要に応じてFASTQ形式、BAM形式、VCF形式等のゲノムデータを参照する。エキスパートパネルは、病理検査時に撮影された顕微鏡写真等を参照しても良い。エキスパートパネルは病理検査を担当した病理医、または、患者を担当する臨床医から情報収集しても良い。
制御部21は、エキスパート会議で決定された修正を受け付ける(ステップS511)。制御部21は、報告書案レコードに記録された情報を修正した報告書レコードを報告書DB56に記録する(ステップS512)。制御部21は、報告書レコードのエキスパートIDフィールドに、レビューを行なった専門家に固有に付与されたエキスパートIDを記録する。制御部21は処理を終了する。
制御部21は、メールその他任意の手段を用いて、臨床医に対して報告書が作成されたことを通知してもよい。制御部21は、電子カルテシステムに報告書をアップロードしても良い。制御部は、臨床医がゲノム解析システム10にログインした場合に、新規報告書があることを通知しても良い。
制御部21は、図15を使用して説明したプログラムの開始時に、報告書60を作成する統合DB52の日付の指定を受け付けても良い。日付の指定を受け付けた場合、制御部21はステップS507において指定した日付における最新の統合DB52を使用して、知識データを取得する。ステップS510において、制御部21は、指定された日付における最新情報に基づく報告書案を記録する。
たとえば、過去に判断された治療方針等の妥当性を検証する場合、その医療行為が行なわれた日付を指定して図15を使用して説明したプログラムを実行することにより、その日付における最新情報に基づく報告書案を作成できる。
報告書DB56に記録された情報、治療後の情報、および、投薬後の情報等に基づいて、教師データDB51にデータを追加して、学習モデル53の再学習を行なっても良い。専門家によるレビューが行なわれたデータを教師データに追加することにより、学習モデル53の精度を高めることができる。
本実施の形態によると、検体から読み取られた塩基配列に基づいて、臨床上重要な変異の自動抽出を行なう学習モデル53を提供できる。学習モデル53を使用することにより、遺伝子検査に関する高度な専門知識を有さない医師であっても、臨床上重要な遺伝子変異の有無を判断できる。
本実施の形態によると、統合DB52を使用することにより遺伝子変異に関する医学情報をユーザに提示するゲノム解析システム10を提供できる。遺伝子検査の分野は研究スピードが速く、頻繁に新たな知見が発表されるため、個々の医師が常に最新情報を把握することは困難である。統合DB52に基づいて、医学情報を提供されるとともに、その根拠も提示されるため、医師は必要に応じて根拠を確認して、患者に対して適切な医療を提供できる。
報告書案をエキスパートパネルでレビューして、エキスパートパネルによる修正を反映することにより、信頼性の高い報告書60を作成するゲノム解析システム10を提供できる。エキスパートパネルがレビューを行なうことにより、教師データDB51に含まれていない新しい情報に基づいて報告書60を作成できる。
臨床医が、遺伝子検査に関する専門知識を有する場合には、エキスパートパネルによるレビューを省略して、報告書案をそのまま報告書60に使用しても良い。患者本人または臨床医が報告書案およびゲノムデータを取得し、自ら選択した専門医に意見を求めても良い。
[実施の形態2]
本実施の形態は、DNAに加えてRNAの塩基配列の解析も行なうゲノム解析システム10に関する。実施の形態1と共通する部分については、説明を省略する。
本実施の形態においては、腫瘍部から採取された検体は3つに分けられる。1つは病理検査に、1つはDNAの解析に使用される。最後の1つは、前処理にてRNAが抽出されて、読取装置31によりRNAの塩基配列が読み取られ、DNAと同様の手法により解析される。
RNAを解析することにより、腫瘍部で発現している遺伝子異常に関する情報を得ることができる。腫瘍部で発現している遺伝子異常は、たとえば複数のDNAが転座または遺伝子再構成により融合した融合遺伝子、または、DNAがRNAに転写される際に、一部が脱落するエクソンスキッピングである。本実施の形態の報告書60には、たとえば非同義体細胞変異欄63と生殖細胞変異欄64との間に、RNAを解析して得た情報を表示するRNA欄66が表示される。
図16は、RNA欄66の例を説明する説明図である。図16Aと図16Bとは、それぞれ異なる報告書に表示されるRNA欄66の例を示す。図16Aは、RNAに異常が発見されない検体に関するRNA欄66の例を示す。図16Bは、融合遺伝子およびエクソンスキッピングが発見された検体に関するRNA欄66の例を示す。
図16Bに示すRNA欄66は、遺伝子欄661、変異欄667、サイトバンド欄662、リード数欄668および知識データ欄666を含む。遺伝子欄661には、RNAが転写された転写元の遺伝子が表示される。
変異欄667には、RNAの変異が表示される。たとえば図16Bの一番上の行には、PAX3遺伝子とFOXO1遺伝子との融合遺伝子が検出されたことが表示される。図16Bの一番下の行には、MET遺伝子のエクソン1スキッピングが検出されたことが表示される。
サイトバンド欄662には、染色体上の遺伝子の位置が表示される。リード数欄668には、読取装置31により読み取られたリードのうち、変異が検出されたリードの数および割合が表示される。リード数欄668に表示される情報は、FASTQ形式のファイルから読み取られる。知識データ欄666には、統合DB52から取得された情報が表示される。
本実施の形態によると、腫瘍で発現している遺伝子の異常を検出して、報告書60に表示するゲノム解析システム10を提供できる。
[実施の形態3]
本実施の形態は、統合DB52が更新された場合に、過去に出力した報告書60の変更点を示す追加報告書を出力するゲノム解析システム10に関する。実施の形態1と共通する部分については、説明を省略する。
図17は、変更履歴DBのレコードレイアウトを説明する説明図である。変更履歴DBは、統合DB52に記録された遺伝子変異と、知識データが変更された変更日とを関連づけて記録するDBである。変更履歴DBは、ゲノム変異フィールドおよび変更日フィールドを有する。
ゲノム変異フィールドは、腫瘍部検体フィールド、遺伝子フィールドおよび変異内容フィールドを有する。変更日フィールドは、第1変更日フィールド、第2変更日フィールド等、任意の数のサブフィールドを有する。変更履歴DBは、統合DB52に記録された1つの医学情報について、1つのレコードを有する。
腫瘍部検体フィールドには、検体が採取された部位が記録される。遺伝子フィールドには、変異が検出された遺伝子が記録される。なお、複数の変異の組合せに関する医学情報が記録されたレコードにおいては、遺伝子フィールドに複数の遺伝子が記録される。
第1変更日フィールドには、ゲノム変異フィールドに記録された遺伝子変異に関するレコードが統合DB52に記録された日付が記録される。第2変更日フィールド以降には、統合DB52に記録された医学情報が変更された日付が記録される。
図18は、実施の形態3の報告書DB56のレコードレイアウトを説明する説明図である。本実施の形態の報告書DB56は、図8を使用して説明した実施の形態1の報告書DB56に確認日フィールドが追加されている。確認日フィールドには、統合DB52の更新状況を確認した日付が記録される。
図19は、追加報告書を出力するプログラムの処理の流れを説明するフローチャートである。制御部21は、報告書DB56に記録された報告書レコードを取得する(ステップS521)。制御部21は、正常部検体フィールドおよび腫瘍部検体フィールドに記録された、検体が採取された部位を取得する(ステップS522)。制御部21は、確認日フィールドに記録された確認日を取得する(ステップS523)。
制御部21は、非同義体細胞変異フィールドまたは生殖細胞変異フィールドの遺伝子フィールドに記録された遺伝子変異を取得する(ステップS524)。制御部21はステップS522で取得した検体が採取された部位およびステップS524で取得した遺伝子変異をキーとして変更履歴DBを検索してレコードを抽出する。制御部21は、抽出したレコードの変更日フィールドに記録された日付と、ステップS523で取得した確認日とを比較し、確認日以後に知識データが変更されたか否か判定する(ステップS525)。
知識データが変更されていないと判定した場合(ステップS525でNO)、制御部21はステップS524に戻る。知識データが変更されたと判定した場合(ステップS525でYES)、制御部21はステップS522で取得した検体が採取された部位およびステップS524で取得した遺伝子変異をキーとして、最新の統合DB52を検索してレコードを抽出する。制御部21は、抽出したレコードから知識データを取得する(ステップS526)。
制御部21は、報告書レコードの知識データフィールドに、ステップS526で取得した知識データを記録する(ステップS527)。制御部21は報告書レコードのコピーを作成して、ステップS526で取得した知識データを記録しても良い。
制御部21は、ステップS521で取得した報告書レコードに記録されたすべての変異の処理を終了したか否かを判定する(ステップS528)。終了していないと判定した場合(ステップS528でNO)、制御部21はステップS524に戻る。
終了したと判定した場合(ステップS528でYES)、制御部21はステップS525で知識データが変更されていると判定した遺伝子変異があるか否かを判定する(ステップS529)。あると判定した場合(ステップS529でYES)、制御部21は臨床医に対して、報告書が変更されたことを通知する(ステップS530)。通知は、たとえば電子メールまたはメッセンジャー等の、任意の手段により行なえる。
制御部21は、ステップS530においてエキスパートパネルに対して通知を行ない、レビュー結果に基づく修正を受け付けた後に、臨床医、または、病院に対する通知を行なっても良い。知識データが変更されていると判定した遺伝子変異がないと判定した場合(ステップS529でNO)またはステップS530の終了後、制御部21は処理を終了するか否かを判定する(ステップS531)。
終了しないと判定した場合(ステップS531でNO)、制御部21はステップS521に戻る。終了すると判定した場合(ステップS531でYES)、制御部21は処理を終了する。
本実施の形態によると、過去に作成した報告書に関連する新たな医学情報が公開された場合に、追加報告書を出力するゲノム解析システム10を提供できる。臨床医は、治療中の患者に対して効果が期待できる薬剤、治験または治療法等に関する追加情報を受け取り、治療方針に反映させることができる。
制御部21は、追加情報を必要としない報告書60の指定を受け付けても良い。臨床医は、治療を終了した患者に関する報告書60等について追加報告書を必要としない旨を指定できる。制御部21は、ステップS521において、追加情報を必要としない報告書を取得対象から外すことにより、必要とされない追加報告書の作成を回避する。
[実施の形態4]
本実施の形態は、エキスパートパネルに参加した専門家に対してインセンティブを付与するゲノム解析システム10に関する。実施の形態1と共通する部分については、説明を省略する。
図20は、専門家DBのレコードレイアウトを説明する説明図である。専門家DBは、エキスパートパネルに参加する専門家に固有に付与されたエキスパートIDと、専門分野と、ポイントとを関連づけて記録するDBである。
専門家DBは、エキスパートIDフィールド、専門分野フィールドおよびポイントフィールドを有する。エキスパートIDフィールドには、エキスパートIDが記録される。専門分野フィールドには、専門家の専門分野が記録されている。ポイントフィールドには、専門家に付与されたポイントが記録されている。
専門家は、エキスパートパネルに参加して報告書案のレビューを行なうごとに、ポイントを獲得できる。専門家は溜まったポイントをたとえば、金券、報告書60の作成を依頼する際に利用できる報告書作成依頼券、または、学習モデル53を利用した遺伝子解析を依頼する際に利用できる学習モデル利用券等と交換できる。ポイントにより、専門家に対してエキスパートパネルに参加するインセンティブを与えることができる。
ポイントは、たとえば1回のレビューに5ポイントのように定められていても良い。エキスパートレビュー時の発言量または意見の内容に基づいて、たとえばエキスパートパネルのリーダが個々の専門家に付与するポイントを決定しても良い。エキスパートパネルへの参加頻度に基づいて、1回のレビューに付与されるポイントが定められても良い。
図21は、エキスパートパネルへの参加者を選択する画面の例を説明する説明図である。図21に示す画面は、エキスパートパネルの事務局担当者が使用するパソコン、タブレットまたはスマートフォン等の情報機器に表示される。事務局担当者が使用する情報機器は、ネットワークを介して情報処理装置20に接続されている。
エキスパートパネルへの参加者を選択する画面は、検体情報欄74、絞込条件欄75、再検索ボタン76、候補リスト77、確認ボタン78および依頼送信ボタン79を含む。検体情報欄74には、エキスパートパネルでのレビューを行なう検体に関する情報が表示されている。
絞込条件欄75には、専門家の絞込を行なう際に使用する項目が表示されている。ユーザは、各項目の先頭に表示されているチェックボックスを選択することにより、絞込条件を選択できる。なお、絞込条件欄75は、フリーキーワードを受け付ける欄を有しても良い。候補リスト77には、エキスパートパネルに参加する専門家の候補リストが表示されている。
ユーザは、絞込条件欄75を使用して、所望の条件を設定して、再検索ボタン76を選択する。設定された条件が、情報処理装置20に送信される。制御部21は、設定された条件に合う専門家を抽出して、ユーザの使用する情報機器に送信する。
候補リスト77に、設定された条件に合致する専門家のリストが表示される。ユーザは、候補リスト77の右端に表示されたチェックボックスを使用して、エキスパートパネルへの参加を依頼する専門家を選択する。
候補リスト77に表示される専門家の数が多すぎる場合、または、少なすぎる場合には、ユーザは絞込条件欄75の設定を適宜変更して、再検索を行なう。ユーザが確認ボタン78を選択した場合、選択された専門家の一覧が表示される。ユーザが依頼送信ボタン79を選択した場合、選択された専門家の一覧が情報処理装置20に送信される。
制御部21は、検体IDと、選択された専門家のエキスパートIDとを関連づけて、補助記憶装置23に記憶する。制御部21は、それぞれの専門家に対してURL(Uniform Resource Locator)を記載した電子メールを送信する。
図22は、エキスパートパネルへの参加依頼を確認する画面の例を説明する説明図である。図22は、専門家がURLにより示されたWEBサイトにアクセスした場合に、専門家の使用する情報機器に表示される画面である。
エキスパートパネルへの参加依頼を確認する画面は、依頼リスト72および参加ボタン71を含む。依頼リスト72には、専門家に参加を依頼するエキスパートパネルのリストが表示されている。それぞれのエキスパートパネルについて、検体の採取部位、患者情報、報告書60の作成を依頼した医療機関等の情報が表示されている。
専門家は、依頼リスト72を見て、参加を希望するエキスパートパネルについて参加ボタン71を選択する。制御部21は、参加ボタン71を選択した専門家が参加する電子会議室を設定し、報告書案をアップロードする。参加者は、電子会議室上で報告書のレビューを行なう。あらかじめ指名されたリーダが結論をまとめて、電子会議室を終了させる。なお、電子会議システムは従来から広く使用されているため、制御部21が行なう処理の詳細については説明を省略する。
電子会議室の終了後、制御部21はエキスパートパネルに参加した専門家にポイントを付与する。具体的には、制御部21は、専門家DBからエキスパートパネルに参加した専門家にかかるレコードを抽出し、ポイントフィールドにポイントを加算する。
図23は、実施の形態4の修正受付のサブルーチンの処理の流れを説明するフローチャートである。修正受付のサブルーチンは、エキスパートパネルへの専門家の参加を受け付け、参加した専門家にポイントを付与するサブルーチンである。修正受付のサブルーチンは、図15を使用して説明した実施の形態1のプログラムのステップS511の代わりに起動する。
制御部21は、専門家DBに登録された専門家ごとに図22を使用して説明したエキスパートパネル参加依頼画面を作成し、URLを記載したメールを送信して、参加依頼を通知する(ステップS541)。
制御部21は、専門家DBの専門分野フィールドに記録された専門分野に基づいて、どの専門家にどの報告書案のレビューを依頼するかを定めることができる。たとえば制御部21は、呼吸器から腫瘍部検体が採取された症例、および、呼吸器科から依頼された症例に関するエキスパートパネルについては、専門分野フィールドに呼吸器が登録された専門家に参加依頼を通知する。
制御部21は、専門家DBに登録された専門家をカテゴリごとに選択して、参加依頼を通知しても良い。制御部21は、専門家DBに登録された専門家全員に、参加依頼を通知しても良い。制御部21は、専門家による参加ボタン71の選択を受け付けることにより、エキスパートパネルへの参加を受け付ける(ステップS542)。制御部21は、それぞれのエキスパートパネルへの参加者を登録した電子会議室を設定する(ステップS543)。制御部21は、電子会議室へのアクセス情報を、それぞれの参加者に送信する。
制御部21は、電子会議室に報告書案をアップロードし、参加者が閲覧できる状態にする(ステップS544)。参加者は、電子会議室を通じて他の参加者とのコミュニュケーションを行ない、報告書案をレビューする。
あらかじめ指名されたリーダが結論をまとめて、電子会議室を終了する操作を行なう。制御部21は、終了操作を受け付ける(ステップS545)。制御部21は、電子会議室を閉鎖する(ステップS546)。制御部21は、専門家DBからエキスパートパネルに参加した専門家にかかるレコードを抽出し、ポイントフィールドにポイントを加算する(ステップS547)。制御部21は、処理を終了する。
本実施の形態によると、エキスパートパネルへの参加に対するインセンティブを与えるゲノム解析システム10を提供できる。学習モデル利用料金および報告書作成料金等で得る収益を、ポイントにより専門家に分配することで、エキスパートパネルに参加する専門家を確保しやすいゲノム解析システム10を提供できる。
それぞれのエキスパートパネルに参加するか否かを、専門家自身が決定できるため、意欲がある参加者を集められるゲノム解析システム10を提供できる。電子会議室を用いてエキスパートレビューを行なうため、多忙な専門家であってもエキスパートパネルに参加しやすいゲノム解析システム10を提供できる。
[実施の形態5]
本実施の形態は、統合DB52に記録される情報のレビューを専門家に依頼するゲノム解析システム10に関する。実施の形態4と共通する部分については、説明を省略する。
図24は、統合DBレビュー参加依頼画面の例を説明する説明図である。制御部21は、それぞれの専門家に対してURLを記載した電子メールを送信する。専門家がパソコンまたはスマートフォン等の情報機器を用いてURLにより示されたWEBサイトにアクセスした場合に、図24に示す統合DBレビュー参加依頼画面が情報機器に表示される。
統合DBレビュー参加依頼画面は、依頼リスト73および参加ボタン71を含む。依頼リスト73には、専門家にレビューを依頼する医学情報のリストが表示されている。それぞれの医学情報について、対象の遺伝子、DNA変異および情報源が表示されている。統合DBレビューの対象は、図24のNo.3に例示するように、特定の遺伝子変異に関係しない情報であっても良い。
専門家は、依頼リスト73を見て自分の専門領域である薬剤、疾患または治験に関する医学情報であるか否かを判断できる。専門家は、レビューへの参加を希望する場合には、参加ボタン71を選択する。制御部21は、参加ボタン71を選択した専門家が参加する電子会議室を設定し、報告書案をアップロードする。参加者は、電子会議室上で報告書のレビューを行なう。あらかじめ指名されたリーダが結論をまとめて、電子会議室を終了させる。
なお、レビューは1名の専門家が単独で実施しても良い。その場合には、電子会議室を使用しなくても良い。
制御部21は、レビュー結果に基づいて、統合DB52への新規レコードの追加、または既存レコードの更新を実行する。
図25は、統合DB52を更新するプログラムの処理の流れを説明するフローチャートである。以下の説明では、情報処理装置20が統合DB52の更新を行なう場合を例にして説明する。統合DB52の更新は情報処理装置20以外の情報機器で実行されても良い。
制御部21は、様々な医学情報DB58を巡回して、遺伝子変異に関する新たな医学情報を収集してデータベース化するクローリングを行なう(ステップS551)。クローリングは、クローラまたはロボットと呼ばれるプログラムにより実行される。クローリングは従来から広く行なわれているため、詳細については説明を省略する。
制御部21は、クローリングにより収集された医学情報を選択して、統合DB52に既に記録されている遺伝子変異に関する情報であるか否かを判定する(ステップS552)。統合DB52に記録されている遺伝子変異に関する情報であると判定した場合(ステップS552でYES)、制御部21は統合DB52に記録されている情報と同一の内容であるか否かを判定する(ステップS553)。
統合DB52に記録されている遺伝子変異に関する情報ではないと判定した場合(ステップS552でNO)、または、統合DB52に記録されている情報と同一の内容ではないとト判定した場合(ステップS553でNO)、制御部21は、処理中の医学情報がレビュー対象である旨を記録する(ステップS554)。
同一内容であると判定した場合(ステップS553でYES)、またはステップS554の終了後、制御部21はステップS551で収集した医学情報の処理を終了したか否かを判定する(ステップS555)。終了していないと判定した場合(ステップS555でNO)、制御部21はステップS552に戻る。
終了したと判定した場合(ステップS555でYES)、制御部21は、専門家DBに登録された専門家ごとに図24を使用して説明した統合DBレビュー参加依頼画面を作成し、URLを記載したメールを送信して、参加依頼を通知する(ステップS561)。
制御部21は、専門家による参加ボタン71の選択を受け付けることにより、レビューへの参加を受け付ける(ステップS562)。制御部21は、それぞれのレビューへの参加者を登録した電子会議室を設定する(ステップS563)。制御部21は、電子会議室へのアクセス情報を、それぞれの参加者に送信する。
制御部21は、電子会議室にクローリングにより収集した医学情報をアップロードし、参加者が閲覧できる状態にする(ステップS564)。参加者は、電子会議室を通じて他の参加者とのコミュニュケーションを行ない、医学情報をレビューする。
あらかじめ指名されたリーダが結論をまとめて、電子会議室を終了する操作を行なう。結論は、参加した専門家の多数決により決定されてもよい。制御部21は、終了操作を受け付ける(ステップS565)。制御部21は、電子会議室を閉鎖する(ステップS566)。制御部21は、専門家DBからレビューに参加した専門家にかかるレコードを抽出し、ポイントフィールドにポイントを加算する(ステップS567)。制御部21は、それぞれの医学情報に関するレビュー結果に基づいて、統合DB52を更新する(ステップS568)。制御部21は、処理を終了する。
本実施の形態によると、統合DB52に登録する情報をクローリングにより自動収集した後に、専門家によるレビューを経て統合DB52を更新するゲノム解析システム10を提供できる。クローリング技術を活用することにより、統合DB52に新しい医学情報を適宜反映させるゲノム解析システム10を提供できる。
収集した医学情報を統合DB52に登録する前に専門家によるレビューを実施することにより、統合DB52の信頼度を保ち、正確な報告書60を出力するゲノム解析システム10を提供できる。
学習モデル利用料金および報告書作成料金等で得る収益を、ポイントにより専門家に分配することで、レビューに参加する専門家を確保しやすいゲノム解析システム10を提供できる。
それぞれのレビューに参加するか否かを、専門家自身が決定できるため、意欲があるレビュー参加者を集められるゲノム解析システム10を提供できる。電子会議室を用いてレビューを行なうため、多忙な専門家であってもレビューに参加しやすいゲノム解析システム10を提供できる。
[実施の形態6]
図26は、ゲノムデータから臨床上意味のある遺伝子変異を予測する段階における情報処理装置20の機能ブロック図である。情報処理装置20は、ゲノムデータ取得部81と、ゲノムデータ入力部82と、出力部83とを有する。
ゲノムデータ取得部81は、検体に含まれる塩基配列を読み取ったゲノムデータを取得する。ゲノムデータ入力部82は、ゲノムデータを受け付けて遺伝子変異に関する予測を出力する学習モデル53に、ゲノムデータ取得部81が取得したゲノムデータを入力する。出力部83は、ゲノムデータ入力部82により入力されたゲノムデータに基づいて学習モデル53から出力された予測を出力する。
図27は、遺伝子変異と統合DB52とに基づいて報告書を作成する段階における情報処理装置20の機能ブロック図である。情報処理装置20は、第1受付部84と、第1出力部85と、第2受付部86と、第2出力部87とを有する。
第1受付部84は、検体から検出された遺伝子変異を受け付ける。第1出力部85は、第1受付部84が受け付けた遺伝子変異と、複数の情報源から取得した遺伝子変異に関する医学情報、医学情報の取得日および根拠情報を関連づけて統合した統合DB52とに基づいて、検体に関する解析結果と、統合DB52のバージョンとを関連づけて記録した報告書を出力する。
第2受付部86は、過去の日付、当該日付における報告書出力要求、および、検体から検出された遺伝子変異を受け付ける。第2出力部87は、第2受付部86が受け付けた遺伝子変異と、当該日付における統合DB52とに基づいて、検体に関する解析結果と、統合DB52のバージョンとを関連づけて記録した報告書を出力する。
[実施の形態7]
本実施の形態は、汎用のコンピュータ90とプログラム97とを組み合わせて動作させることにより、本実施の形態のゲノム解析システム10を実現する形態に関する。図28は、実施の形態7のゲノム解析システム10の構成を説明する説明図である。実施の形態1と共通する部分については、説明を省略する。
本実施の形態のゲノム解析システム10は、コンピュータ90と、読取装置31と、データサーバ32とを含む。
コンピュータ90は、制御部21、主記憶装置22、補助記憶装置23、通信部24、読取部29およびバスを備える。コンピュータ90は、汎用のパーソナルコンピュータ、タブレットまたはサーバコンピュータ等の情報機器である。
プログラム97は、可搬型記録媒体96に記録されている。制御部21は、読取部29を介してプログラム97を読み込み、補助記憶装置23に保存する。また制御部21は、コンピュータ90内に実装されたフラッシュメモリ等の半導体メモリ98に記憶されたプログラム97を読出しても良い。さらに、制御部21は、通信部24および図示しないネットワークを介して接続される図示しない他のサーバコンピュータからプログラム97をダウンロードして補助記憶装置23に保存しても良い。
プログラム97は、コンピュータ90の制御プログラムとしてインストールされ、主記憶装置22にロードして実行される。これにより、コンピュータ90は上述した情報処理装置20として機能する。
各実施例で記載されている技術的特徴(構成要件)はお互いに組合せ可能であり、組み合わせすることにより、新しい技術的特徴を形成することができる。
今回開示された実施の形態はすべての点で例示であって、制限的なものではないと考えられるべきである。本発明の範囲は、上記した意味ではなく、特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。