JP6737519B1

JP6737519B1 - プログラム、学習モデル、情報処理装置、情報処理方法および学習モデルの生成方法

Info

Publication number: JP6737519B1
Application number: JP2019041409A
Authority: JP
Inventors: 邦裕西村; 貴司青木; 俊貴竹内; 純井村
Original assignee: XCOO INC.
Current assignee: XCOO INC.
Priority date: 2019-03-07
Filing date: 2019-03-07
Publication date: 2020-08-12
Anticipated expiration: 2039-03-07
Also published as: JP2020144658A

Abstract

【課題】ゲノムデータから臨床上重要な変異の自動抽出を行なうプログラム等を提供すること。【解決手段】プログラムは、過去に行なわれた複数の遺伝子検査について、検体に含まれる塩基配列を読み取ったゲノムデータと、前記検体にかかる遺伝子変異とを関連づけて記録した教師データを取得し、前記ゲノムデータを入力、前記遺伝子変異を出力として、検体に含まれる塩基配列を読み取ったゲノムデータが入力された場合に、前記検体に基づく遺伝子変異に関する予測を出力する学習モデル５３を生成する処理をコンピュータに実行させる。【選択図】図１

Description

本発明は、プログラム、学習モデル、情報処理装置、情報処理方法および学習モデルの生成方法に関する。

生検、採血または手術等により患者から採取された検体を用いて病理検査、遺伝子検査等が行なわれる。遺伝子検査においては、シーケンサを用いて読み取った核酸の塩基配列を可視化するゲノム解析装置等が提案されている（特許文献１）

国際公開第２０１６−１７５３３０号

塩基配列の変異状態により、抗がん剤の効果が大きく異なる場合があることが知られている。がん患者の治療を担当する臨床医にとっては、治療方針の決定に寄与する変異に関する情報が重要である。

しかしながら、特許文献１に開示されたゲノム解析装置では、臨床上重要な変異の自動抽出は行なえない。

プログラムは、過去に行なわれた複数の遺伝子検査について、正常部ゲノムデータと、患者の腫瘍部から採取した検体に含まれる塩基配列を読み取った腫瘍部ゲノムデータと、前記患者にかかる遺伝子変異とを関連づけて記録した教師データを取得し、前記正常部ゲノムデータと前記腫瘍部ゲノムデータとを入力、前記遺伝子変異を出力として、正常部ゲノムデータと患者の腫瘍部から採取した検体に含まれる塩基配列を読み取った腫瘍部ゲノムデータとが入力された場合に、前記患者にかかる遺伝子変異に関する予測を出力する学習モデルを生成する処理をコンピュータに実行させる。

一つの側面では、検体から読み取られた塩基配列に基づいて、臨床上重要な変異の自動抽出を行なうプログラム等を提供することを目的とする。

ゲノム解析システムを用いた処理の流れを説明する説明図である。学習モデルの生成方法を説明する説明図である。統合ＤＢの概要を説明する説明図である。ゲノムデータの概要を説明する説明図である。ゲノム解析システムの構成を説明する説明図である。教師データＤＢのレコードレイアウトを説明する説明図である。統合ＤＢのレコードレイアウトを説明する説明図である。報告書ＤＢのレコードレイアウトを説明する説明図である。学習モデルを説明する説明図である。報告書の例を説明する説明図である。コメント欄の例を説明する説明図である。非同義体細胞変異欄の例を説明する説明図である。生殖細胞変異欄の例を説明する説明図である。解析欄の例を説明する説明図である。プログラムの処理の流れを説明するフローチャートである。ＲＮＡ欄の例を説明する説明図である。変更履歴ＤＢのレコードレイアウトを説明する説明図である。実施の形態３の報告書ＤＢのレコードレイアウトを説明する説明図である。追加報告書を出力するプログラムの処理の流れを説明するフローチャートである。専門家ＤＢのレコードレイアウトを説明する説明図である。エキスパートパネルへの参加者を選択する画面の例を説明する説明図である。エキスパートパネルへの参加依頼を確認する画面の例を説明する説明図である。実施の形態４の修正受付のサブルーチンの処理の流れを説明するフローチャートである。統合ＤＢレビュー参加依頼画面の例を説明する説明図である。統合ＤＢ５２を更新するプログラムの処理の流れを説明するフローチャートである。ゲノムデータから臨床上意味のある遺伝子変異を予測する段階の情報処理装置の機能ブロック図である。遺伝子変異と統合ＤＢ５２とに基づいて報告書を作成する段階における情報処理装置の機能ブロック図である。実施の形態７のゲノム解析システムの構成を説明する説明図である。

［実施の形態１］
図１は、ゲノム解析システム１０を用いた処理の流れを説明する説明図である。ゲノムは、１つの個体、ここでは一人のヒトの遺伝情報全体を意味する。

患者から検体が採取される。検体は、腫瘍部と、正常部との両方からそれぞれ採取されることが望ましい。腫瘍部の検体は、病変部の生検または手術等により採取される。以下の説明では、腫瘍部から採取された検体を腫瘍検体と記載する。血液がん等、血液に異常がある患者を除き、正常部の検体は採血等により採取される場合が多い。血液がんの患者の場合には、血液から腫瘍部の検体が採取され、それ以外の正常組織から正常部の検体が採取される。

それぞれの検体から核酸、すなわちＤＮＡ（Deoxyribonucleic Acid）またはＲＮＡ（Ribonucleic Acid）が抽出される。以下の説明では、ＤＮＡが抽出される場合を例にして説明する。読取装置３１によりＤＮＡの塩基配列が読み取られ、ゲノムデータが作成される。ゲノムデータの詳細については後述する。以下の説明においては、読取装置３１は次世代シーケンサである場合を例にして説明するが、読取装置３１はＤＮＡマイクロアレイその他塩基配列を読み取る任意の装置または機器であっても良い。

ゲノムデータが学習モデル５３に入力される。学習モデル５３から、臨床上意味のある遺伝子変異の予測が出力される。出力された遺伝子変異と、医学文献等から収集した情報を統合した統合ＤＢ（Database）５２とに基づいて、報告書案が自動的に作成される。学習モデル５３および統合ＤＢ５２の詳細については後述する。

なお、学習モデル５３から臨床上の意味の有無にかかわらず遺伝子変異の予測が出力されても良い。そのようにする場合、学習モデル５３から出力された遺伝子変異と、統合ＤＢ５２とに基づいて、臨床上意味のある変異が抽出されて、報告書案が自動的に作成される。

がん専門医および遺伝子学者等の専門家により構成されたエキスパートパネルが、報告書案をレビューし、必要に応じて修正することにより、報告書が完成する。患者の治療を担当する臨床医は、報告書を見て治療方針を判断する。報告書案および報告書の詳細については後述する。なお、エキスパートパネルによるレビューは行なわれなくても良い。このようにする場合、臨床医は、統合ＤＢ５２から出力された報告書案を見て治療方針を判断する。

図２は、学習モデル５３の生成方法を説明する説明図である。腫瘍部の検体を用いて病理検査が行なわれる。腫瘍部の検体から、腫瘍細胞を含む部分が切り取られる。切り取られた検体から、腫瘍部のＤＮＡが抽出される。正常部の検体から、正常部のＤＮＡが抽出される。正常部のＤＮＡと、腫瘍部のＤＮＡとが読取装置３１に投入されて、ゲノムデータが作成される。

病理検査の結果と、ゲノムデータと、その他の検査数値とに基づいて、腫瘍の良悪性、原発がんであるか否か、腫瘍部検体中の腫瘍含有量、効果を期待できる薬剤等を専門家が判断して、診断データを作成する。

ゲノムデータと診断データとが関連づけられて教師データＤＢ５１（図５参照）に記録される。教師データＤＢ５１の詳細については後述する。教師データＤＢ５１に基づいて教師あり機械学習を行ない、学習モデル５３が生成される。学習モデル５３は、検体に含まれる塩基配列を読み取ったゲノムデータが入力された場合に、検体にかかる遺伝子変異に関する予測を出力する学習済モデルである。

図３は、統合ＤＢ５２の概要を説明する説明図である。統合ＤＢ５２は、複数の情報源から取得した遺伝子変異に関する医学情報と、当該医学情報の取得元とを関連づけて統合したＤＢである。情報源は、たとえば医学論文を公開するＤＢ、国または研究機関等が、薬剤または治療法の臨床試験に関する情報を公開するＤＢ、企業または大学等が発行した医療に関するプレスリリース等の公開情報を蓄積したＤＢ等の、種々の医学情報ＤＢ５８である。

医学情報ＤＢ５８は、無償で公開されているＤＢであっても、有償で公開されているＤＢであっても良い。なお、有償で公開されているＤＢを使用する場合には、有償ＤＢの提供元と、統合ＤＢ５２の提供元との間で、適切なライセンス契約を締結する等の、ライセンス処理を行う。

それぞれの医学情報ＤＢ５８には、異なるフォーマットで医学情報が記録されており、異なるタイミングで情報が更新される。それぞれの医学情報ＤＢ５８にアクセスして、情報を収集してデータベース化するクローリングにより、統合ＤＢ５２が作成される。

クローリングは適宜行なわれ、更新された統合ＤＢ５２が作成される。それぞれの統合ＤＢ５２は、たとえば更新日または更新日時等が判別できる状態でバージョン管理される。統合ＤＢ５２の詳細については後述する。

なお、それぞれの統合ＤＢ５２には、前のバージョンとの差分、または、任意のバージョンとの差分が記録され、必要に応じて任意の時点における統合ＤＢ５２を構築できるように構成されても良い。差分を記録することにより、統合ＤＢ５２の記録容量を節約できる。

図４は、ゲノムデータの概要を説明する説明図である。検体に対して前処理が行なわれる。具体的には、前述のとおり検体からＤＮＡが抽出される。抽出されたＤＮＡに対して、精製、断片化および増幅等の処理が行なわれる。断片化により、ＤＮＡは後工程で使用される読取装置３１による読み取りに適した長さの断片に切断される。

読取装置３１は、断片化されたそれぞれのＤＮＡの塩基配列を順次読み取る。１本のＤＮＡ断片から読み取られた塩基配列に関する情報はリードと呼ばれる。リードには、個々の塩基について読み取りの信頼度を示すクオリティスコアも記録される。

それぞれのリードは、たとえば日本人の基準ゲノム配列（Japanese Reference Genome:JRG）、または、国際ヒトゲノム参照配列等の参照配列にマッピングされる。マッピング結果は、たとえばＢＡＭ形式、ＳＡＭ形式またはＣＲＡＭ形式のファイルに記録される。

マッピング結果と、参照配列との相違点、すなわち参照配列に対して検体のゲノムが変異している箇所の位置および変異内容等についての情報が、たとえばＶＣＦ形式またはＢＣＦ形式のファイルに記録される。

なお、ＶＣＦ形式のファイルには、遺伝情報がコードされていないイントロンの変異、および、コードされたアミノ酸に変化を生じない同義変異等、臨床的な重要性の低い変異が多数含まれる。したがって、ＶＣＦ形式のファイルから、治療方針等を定めるための情報を読み取るには、高度な専門知識を要する。

ＦＡＳＴＱ形式のファイルおよび参照配列が与えられれば、公知の解析手法により、ＢＡＭ形式、ＳＡＭ形式、ＣＲＡＭ形式およびＶＣＦ形式のファイルに変換できる。以上に説明した、ＦＡＳＴＱ形式、ＢＡＭ形式、ＳＡＭ形式、ＣＲＡＭ形式、ＶＣＦ形式およびＢＣＦ形式のデータを総称して、ゲノムデータと呼ぶ。ゲノムデータは、ここに例示した形式以外の任意の形式のデータであっても良い。

たとえば、読取装置３１がＦＡＳＴＱ形式のファイルを出力し、図示を省略する解析装置がＢＡＭ形式およびＶＣＦ形式のファイルに変換する。読取装置３１が解析装置を内蔵し、直接ＢＡＭ形式およびＶＣＦ形式のファイルを出力しても良い。後述する情報処理装置２０（図５参照）が、ＦＡＳＴＱ形式またはＢＡＭ形式のファイルを取得して、ＶＣＦ形式に変換しても良い。

ＣＮＡ（Copy Number Alteration：体細胞コピー数異常）解析を行なう場合には、患者から採取した複数の正常部の検体から得られたゲノムデータと、腫瘍部の検体から得られたゲノムデータとを比較する。

ＣＮＡ解析には、ＰＯＮ（Panel Of Normals）の手法が使用されても良い。ＰＯＮを用いる場合には、複数の人から採取された正常部検体について、たとえばＢＡＭ形式またはＳＡＭ形式のゲノムデータを作成し、保存しておく。患者から採取された腫瘍部の検体から得られたゲノムデータと、保存済のゲノムデータとを比較して、解析を行なう。

図５は、ゲノム解析システム１０の構成を説明する説明図である。ゲノム解析システム１０は、情報処理装置２０、読取装置３１およびデータサーバ３２を備える。

情報処理装置２０は、制御部２１、主記憶装置２２、補助記憶装置２３、通信部２４、およびバスを備える。制御部２１は、本実施の形態のプログラムを実行する演算制御装置である。制御部２１は、一もしくは複数のＣＰＵ（Central Processing Unit）、マルチコアＣＰＵまたはＧＰＵ（Graphics Processing Unit）等により構成される。制御部２１は、バスを介して情報処理装置２０を構成するハードウェア各部と接続されている。

主記憶装置２２は、ＳＲＡＭ（Static Random Access Memory）、ＤＲＡＭ（Dynamic Random Access Memory）、フラッシュメモリ等の記憶装置である。主記憶装置２２には、制御部２１が行なう処理の途中で必要な情報および制御部２１で実行中のプログラムが一時的に保存される。

補助記憶装置２３は、ＳＲＡＭ、フラッシュメモリまたはハードディスク等の記憶装置である。補助記憶装置２３には、教師データＤＢ５１、統合ＤＢ５２、学習モデル５３、報告書案ＤＢ５５、報告書ＤＢ５６、制御部２１に実行させるプログラム、およびプログラムの実行に必要な各種データが保存される。なお、教師データＤＢ５１、統合ＤＢ５２、学習モデル５３、報告書案ＤＢ５５および報告書ＤＢ５６は、情報処理装置２０に接続された外部の大容量記憶装置、または、データサーバ３２等に保存されていても良い。

通信部２４は、情報処理装置２０とネットワークとの間の通信を行なうインターフェイスである。

前述のとおり、読取装置３１は、次世代シーケンサ、ＤＮＡマイクロアレイその他塩基配列を読み取る任意の装置または機器である。読取装置３１が読み取った塩基配列に基づいて作成されたゲノムデータはデータサーバ３２に記録される。制御部２１は、通信部２４およびネットワークを介してデータサーバ３２に記録されたゲノムデータを取得できる。なお、制御部２１は、データサーバ３２を介さず、読取装置３１から直接ゲノムデータを取得してもよい。

本実施の形態の情報処理装置２０は、汎用のパソコン、タブレット、大型計算機、または、大型計算機上で動作する仮想マシンである。情報処理装置２０は、複数のパソコン、タブレットまたは大型計算機等のハードウェアにより構成されても良い。情報処理装置２０は、量子コンピュータにより構成されても良い。情報処理装置２０は、読取装置３１と一体化されていても良い。情報処理装置２０は、いわゆるクラウドコンピューティングにより実現されても良い。

図６は、教師データＤＢ５１のレコードレイアウトを説明する説明図である。教師データＤＢ５１は、ゲノムデータと診断データとを関連づけて記録するＤＢである。図６には、教師データＤＢ５１の１つのレコードを示す。

教師データＤＢ５１は、検体フィールド、ゲノムデータフィールドおよび診断データフィールドを有する。検体フィールドは、正常部検体フィールドおよび腫瘍部検体フィールドを有する。ゲノムデータフィールドは、正常部ゲノムフィールドおよび腫瘍部ゲノムフィールドを有する。なお、教師データＤＢ５１は、正常部ゲノムフィールドを有さなくても良い。

診断データフィールドは、非同義体細胞変異フィールド、生殖細胞変異フィールドおよび腫瘍含有量フィールドを有する。非同義体細胞変異フィールドは、遺伝子フィールドおよびＤＮＡ変異フィールドを有する。生殖細胞変異フィールドは、遺伝子フィールドおよびＤＮＡ変異フィールドを有する。教師データＤＢ５１は、１組の教師データについて１つのレコードを有する。なお、診断データフィールドは、腫瘍含有量フィールドを有さなくてもよい。

正常部検体フィールドには、正常部の検体が採取された部位が記録される。腫瘍部検体フィールドには、腫瘍部の検体が採取された部位が記録される。正常部ゲノムフィールドには、正常部検体から取得したゲノムデータのファイル名が記録される。腫瘍部ゲノムフィールドには、腫瘍部検体から取得したゲノムデータのファイル名が記録される。

非同義体細胞変異フィールドのサブフィールドには、腫瘍部ゲノムに含まれる非同義体細胞変異、すなわちＤＮＡの塩基配列にコードされたアミノ酸に変化を生じさせる体細胞変異を有する遺伝子と、変異内容とが記録される。体細胞変異は、正常部ゲノムには生じていないが、腫瘍部ゲノムには生じている変異を意味する。すなわち非同義体細胞変異は、腫瘍の特性に関する変異である。

たとえば、図６の非同義体細胞変異フィールドの１行目は、ＡＲＩＤ１Ａ（AT-rich interactive domain 1A）遺伝子の５１６４番目の塩基がＣ（シトシン）からＴ（チミン）に変異していることを示す。同様に２行目はＴＰ５３遺伝子の７４３番目の塩基がＧ（グアニン）からＡ（アデニン）に変異していることを示す。

生殖細胞変異フィールドのサブフィールドには、正常部ゲノムに含まれる変異を有する遺伝子と、変異内容とが記録される。たとえば、図６の生殖細胞変異フィールドの１行目は、ＢＲＡＦ遺伝子の１７９１番目の塩基がＴからＧに変異していることを示す。

非同義体細胞フィールドおよび生殖細胞変異フィールドには、検体から検出された遺伝子変異のうち、教師データに記録する必要がある任意の数の遺伝子が記録される。

なお、正常部の検体を採取してゲノムデータを取得する代わりに、日本人の基準ゲノム配列等の参照配列を使用する場合がある。このようにする場合には、生殖細胞変異に関する結果は、推定結果である。

診断データフィールドは、同義体細胞変異を記録する同義体細胞変異フィールドを有しても良い。非同義体細胞変異フィールドの代わりに体細胞変異フィールドを有し、同義体細胞変異と非同義体細胞変異の両方を記録しても良い。

腫瘍含有量フィールドには、腫瘍部から採取した検体の腫瘍含有量が記録される。腫瘍含有量は、たとえばヘテロＳＮＰ（Single Nucleotide Polymorphism）数に基づいて算出される。ＢＡＭファイルまたはＳＡＭファイルに記録されたアリル頻度、または、ＢＡＭファイルまたはＳＡＭファイルに記録されたデータから算出されたアリル頻度に基づいて、腫瘍含有量が算出されても良い。

病理検査により観察された有核細胞の数と腫瘍細胞の数との比、または、顕微鏡視野内で腫瘍細胞が占める面積に基づいて、腫瘍含有量が算出されても良い。腫瘍含有量の定義は任意であるが、教師データＤＢ５１に含まれるすべての教師データにおいて、統一した定義が用いられていることが望ましい。

図７は、統合ＤＢ５２のレコードレイアウトを説明する説明図である。統合ＤＢ５２は、複数の情報源から取得した遺伝子変異に関する医学情報と、当該医学情報の取得元とを関連づけて統合したＤＢである。統合ＤＢ５２は、バージョンフィールド、ゲノム変異フィールドおよび知識データフィールドを有する。

バージョンフィールドには、統合ＤＢ５２のバージョンが記録されている。本実施の形態では、統合ＤＢ５２は更新日付で管理されている。
ゲノム変異フィールドは、検体フィールド、遺伝子フィールドおよび変異内容フィールドを有する。知識データフィールドは、発がん性フィールド、臨床的意義フィールド、対応薬剤フィールド、対応疾患フィールド、レベルフィールドおよび根拠情報フィールドを有する。統合ＤＢ５２は、遺伝子変異に関する１件の医学情報について、１つのレコードを有する。

検体フィールドには、検体が採取された部位が記録される。遺伝子フィールドには、変異が検出された遺伝子が記録される。なお、複数の変異の組合せに関する医学情報が記録されたレコードにおいては、遺伝子フィールドに複数の遺伝子が記録される。

変異内容フィールドには、非同義体細胞変異または生殖細胞変異等の、変異の内容が記録される。なお、コードされたアミノ酸に変化が生じない同義体細胞変異に関する情報も統合ＤＢ５２に記録される場合がある。

発がん性フィールドには、ゲノム変異の発がん性のレベルが記録される。臨床的意義フィールドには、ゲノム変異の臨床的意義が記録される。知識データフィールドは、発がん性フィールドと、臨床的意義フィールドは、いずれか一方のみを有してもよい。

対応薬剤フィールドには、ゲノム変異を有する患者に投与した場合に効果がある薬剤が記録される。対応薬剤フィールドに、治験中の薬剤が記録されても良い。対応疾患フィールドには、ゲノム変異に対応する疾患が記録される。レベルフィールドには、ゲノム変異の重要度のレベルが記録される。根拠情報フィールドには、レコードに記載された情報の根拠である文献、データベース名、または、情報に固有に付与されたＩＤ（Identifier）等の、根拠情報にアクセスするための情報が記録される。

知識データフィールドの各サブフィールドにおいて「−」は対応する情報がないことを意味する。

図８は、報告書ＤＢ５６のレコードレイアウトを説明する説明図である。報告書ＤＢ５６は、検体に関する情報と、検体に基づく診断データとを関連づけて記録したＤＢである。図８には、報告書ＤＢ５６の１つのレコードを示す。

報告書ＤＢ５６は、検体ＩＤフィールド、検体フィールド、ゲノムデータフィールド、統合ＤＢＶｅｒ．フィールド、診断データフィールドおよびエキスパートＩＤフィールドを有する。検体フィールドは、正常部検体フィールドおよび腫瘍部検体フィールドを有する。ゲノムデータフィールドは、正常部ゲノムフィールドおよび腫瘍部ゲノムフィールドを有する。

診断データフィールドは、非同義体細胞変異フィールド、生殖細胞変異フィールドおよび腫瘍含有量フィールドを有する。非同義体細胞変異フィールドは、診断データフィールドおよび知識データフィールドを有する。診断データフィールドは、遺伝子フィールドおよびＤＮＡ変異フィールドを有する。知識データフィールドは、発がん性フィールド、臨床的意義フィールド、対応薬剤フィールド、対応疾患フィールド、レベルフィールドおよび根拠情報フィールドを有する。

生殖細胞変異フィールドは、診断データフィールドおよび知識データフィールドを有する。診断データフィールドは、遺伝子フィールドおよびＤＮＡ変異フィールドを有する。知識データフィールドは、臨床的意義フィールド、レベルフィールドおよび根拠情報フィールドを有する。報告書ＤＢ５６は、１組の検体について、１つのレコードを有する。

検体ＩＤフィールドには、１組の検体に固有に付与された検体ＩＤが記録される。検体ＩＤは、電子カルテシステム等と連携して、患者に紐付けられている。正常部検体フィールドには、正常部の検体が採取された部位が記録される。腫瘍部検体フィールドには、腫瘍部の検体が採取された部位が記録される。正常部ゲノムフィールドには、正常部検体から取得したゲノムデータのファイル名が記録される。腫瘍部ゲノムフィールドには、腫瘍部検体から取得したゲノムデータのファイル名が記録される。統合ＤＢＶｅｒ．フィールドには、報告書レコードの作成時に用いられた統合ＤＢ５２のバージョンが記録される。

非同義体細胞変異フィールド中の診断データフィールドのサブフィールドには、非同義体細胞変異を有する遺伝子と、変異内容とが記録される。知識データフィールドの各サブフィールドには、診断データフィールドに記録された遺伝子変異に関連する医学情報が記録される。各サブフィールドに記録される情報は、図７を使用して説明した統合ＤＢ５２中の同名のサブフィールドに記録される情報と同様であるため、説明を省略する。

生殖細胞変異フィールド中の診断データフィールドのサブフィールドには、生殖細胞変異を有する遺伝子と、変異内容とが記録される。知識データフィールドの各サブフィールドには、診断データフィールドに記録された遺伝子変異に関連する医学情報が記録される。各サブフィールドに記録される情報は、図７を使用して説明した統合ＤＢ５２中の同名のサブフィールドに記録される情報と同様であるため、説明を省略する。

エキスパートＩＤフィールドには、後述するプログラムにより制御部２１が自動的に作成した報告書案をレビューしたエキスパートパネルを構成した専門家にそれぞれ固有に付与された専門家ＩＤが記録される。複数の専門家が参加する専門家グループに対して、１つのエキスパートＩＤが付与されてもよい。

報告書案ＤＢ５５のレコードレイアウトは、エキスパートＩＤフィールドを有さない他は、図８を使用して説明した報告書ＤＢ５６のレコードレイアウトと同一であるため、図示および詳細な説明を省略する。

図９は、学習モデル５３を説明する説明図である。学習モデル５３は、入力層５３１、中間層５３２および出力層５３３を備えるニューラルネットワークである。図９においては、学習モデル５３はＣＮＮである場合を例示する。なお、畳み込み層およびプーリング層については、図示を省略する。

学習モデル５３の入力は、腫瘍部のゲノムデータ、正常部のゲノムデータ、腫瘍部検体が採取された部位および正常部検体が採取された部位である。ゲノムデータは、たとえばパイルアップされたアラインメント情報のテンソルであり、塩基配列、ストランド情報、ベースクオリティおよびマップクオリティ等を構成要素に含む。塩基配列は、Ａ、Ｔ、Ｇ、Ｃの各塩基のカウントで表されてもよい。学習モデル５３に入力されたデータは、図示を省略する畳み込み層およびプーリング層の繰り返しを介して、入力層５３１に入力する。

学習モデル５３の出力は、たとえば診断データの各項目の確率である。具体的には、臨床的に意味のある変異それぞれが発生じている確率、および、腫瘍含有量が所定の値である確率である。たとえば図９において一番上の出力ノードには、ＢＲＣＡ遺伝子の６９５２番目の塩基がＣからＴに変異した体細胞変異が生じている確率が、２番目の出力ノードには、ＢＲＣＡ遺伝子の６９５２番目の塩基がＣからＴに変異した生殖細胞変異が生じている確率がそれぞれ出力される。

なお、体細胞は対立遺伝子を含むため、検体の体細胞は父親由来の「ＢＲＣＡ遺伝子の６９５２番目の塩基」と、母親由来の「ＢＲＣＡ遺伝子の６９５２番目の塩基」とを有する。したがって、体細胞の変異には、父親由来の遺伝子と母親由来遺伝子との双方が変異している場合、父親由来の遺伝子のみが変異している場合、および、母親由来の遺伝子のみが変異している場合が含まれる。

たとえば、学習モデル５３の出力は、HomoRef、Hetero、および、HomoAltのスコアであってもよい。HomoRef、Hetero、および、HomoAltは、deepvariant等のゲノム解析用バリアントコーラーで使用される指標である。

図９の一番下の出力ノードには、腫瘍含有量が１０パーセントである確率が出力される。出力ノードは、たとえば１０パーセント刻み等の任意の腫瘍含有量である確率を出力するノードを含む。

学習モデル５３は、入力層５３１にゲノムデータおよび検体採取部位が入力された場合に、出力層５３３に臨床的に意味のあるそれぞれの変異が生じている、および、所定の腫瘍含有量である確率を出力する。学習段階においては、制御部２１は、ゲノムデータおよび検体採取部位と、臨床上の意味のある変異の有無および腫瘍含有量に関する診断データとを関連づけて記録した教師データＤＢ５１を用いて、誤差逆伝播法等を用いて中間層５３２のパラメータを演算することにより、教師あり機械学習を行なう。

教師あり機械学習は、たとえばロジスティック回帰、ＳＶＭ（Support Vector Machine）、ランダムフォレスト、ＣＮＮ、ＲＮＮまたは、ＸＧＢｏｏｓｔ（eXtreme Gradient Boosting）等の任意の手法により行なえる。

学習モデル５３は任意のコンピュータを用いて生成されても良い。生成された学習モデル５３は、ネットワーク等を介して情報処理装置２０に送信されて、補助記憶装置２３に記録される。教師あり学習の代わりに、半教師あり学習が用いられてもよい。

図１０は、報告書６０の例を説明する説明図である。報告書６０は、報告書ＤＢ５６のレコードに記録された情報、および、電子カルテに記録された情報を、ユーザが閲覧しやすい形式に整形して作成される。報告書６０は、書誌事項欄６１、コメント欄６２、非同義体細胞変異欄６３、生殖細胞変異欄６４および解析欄６５を含む。

書誌事項欄６１は、ＩＤ欄６１１、患者情報欄６１２、検体欄６１３、病理組織診断欄６１４および検体番号欄６１５を含む。ＩＤ欄６１１には、患者に固有に付与された患者ＩＤが表示される。患者情報欄６１２には、患者の性別および年齢が表示される。なお、患者情報欄６１２は、表示されなくてもよい。

検体欄６１３には、ゲノム解析に用いた正常部検体および腫瘍部検体が表示される。図１０において「ＦＦＰＥ（Formalin Fixed Paraffin Embedded）肺」は、ホルマリン固定パラフィン包埋を行なった肺組織であることを意味する。

病理組織診断欄６１４には、検体を顕微鏡で観察する病理診断による所見が表示される。検体番号欄６１５には、検体に固有に付与された検体番号が表示される。書誌事項欄６１に表示される情報は、図８を使用して説明した報告書レコードの検体ＩＤをキーとして電子カルテシステムから取得される。

図１１は、コメント欄６２の例を説明する説明図である。図１１Ａから図１１Ｃは、それぞれ異なる報告書に表示されるコメント欄６２の例を示す。図１１Ａは、「Pathologic」すなわち病原性を有することが確実な生殖細胞変異が発見された検体に関する報告書のコメント欄６２を示す。病原性を有する生殖細胞変異が生じた遺伝子および変異位置と、その根拠、ならびに生殖細胞変異に関する今後の対応についてのアドバイスが表示される。

図１１Ｂは、腫瘍含有量が低い、すなわち腫瘍部検体の質に問題がある可能性がある検体に関する報告書のコメントの例を示す。図１１Ｃは、腫瘍部検体にがん化変異が発見された検体に関するコメントの例を示す。がん化に関連する体細胞変異が生じた遺伝子と、その遺伝子に関連する臨床試験についての情報が表示される。

コメント欄６２に表示される文章は、報告書ＤＢ５６の診断フィールドに記録された情報に基づいて、公知の手法により定型文を組み合わせて作成される。検体に生じている複数の遺伝子変異うち、病原性または発がん性が高い遺伝子変異に関連する定型文を選択して表示することにより、遺伝子検査に関する知識が少ない臨床医であっても重要性の高い情報を速やかに把握できる。

図１２は、非同義体細胞変異欄６３の例を説明する説明図である。図１２においては、図８に例示した報告書レコード中の非同義体細胞変異フィールドに基づいて表示される非同義体細胞変異欄６３の例を示す。

非同義体細胞変異欄６３は、遺伝子欄６３１、サイトバンド欄６３２、ＤＮＡ変異欄６３３、アミノ酸変異欄６３４、アリル頻度欄６３５および知識データ欄６３６を含む。遺伝子欄６３１、ＤＮＡ変異欄６３３および知識データ欄６３６には、それぞれ非同義体細胞変異フィールドに記録された情報が表示される。

サイトバンド欄６３２には、染色体上の遺伝子の位置が表示される。アミノ酸変異欄６３４には、ＤＮＡ変異に起因するアミノ酸の変異が表示される。アリル頻度欄６３５には、たとえばＢＡＭファイルまたはＳＡＭファイルに記録されたアリル頻度、または、ＢＡＭファイルまたはＳＡＭファイルに記録されたデータから算出されたアリル頻度が表示される。

非同義体細胞変異欄６３の上部には、非同義体細胞変異欄６３に記載していない体細胞変異も含めた総体細胞変異数および総体細胞変異頻度が表示される。総体細胞変異数および総体細胞変異頻度は、ＶＣＦ形式のファイルから取得できる。

図１３は、生殖細胞変異欄６４の例を説明する説明図である。図１３においては、図８に例示した報告書レコード中の生殖細胞変異フィールドに基づいて表示される生殖細胞変異欄６４の例を示す。

生殖細胞変異欄６４は、遺伝子欄６４１、サイトバンド欄６４２、ＤＮＡ変異欄６４３、アミノ酸変異欄６４４、正常部アリル頻度欄６４７、腫瘍部アリル頻度欄６４８および知識データ欄６４５を含む。遺伝子欄６４１、ＤＮＡ変異欄６４３および知識データ欄６４５には、それぞれ生殖細胞変異フィールドに記録された情報が表示される。

サイトバンド欄６４２には、染色体上の遺伝子の位置が表示される。アミノ酸変異欄６４４には、ＤＮＡ変異に起因するアミノ酸の変異が記録される。正常部アリル頻度欄６４７には、たとえばＢＡＭ形式またはＳＡＭ形式のファイルに記録された正常部のアリル頻度が表示される。腫瘍部アリル頻度欄６４８には、たとえばＢＡＭ形式またはＳＡＭ形式のファイルに記録された腫瘍部のアリル頻度が表示される。

図１４は、解析欄６５の例を説明する説明図である。解析欄６５は、推定腫瘍含有量欄６５１および変異頻度相関係数欄６５２を含む。推定腫瘍含有量欄６５１には、学習モデル５３の出力に基づく推定腫瘍含有量が表示される。

変異頻度相関係数欄６５２には、正常部から採取した検体中の遺伝子変異頻度と、腫瘍部から採取した検体中の遺伝子変異頻度との相関係数が表示される。相関係数が高い場合には、正常部と異常部とで、同一の塩基が変異している場合が多く、同一患者由来の検体であると判定される。相関係数が閾値よりも低い場合には、検体の取り違え、または、コンタミネーション等の発生が疑われる。

変異頻度相関係数欄６５２は表示されなくても良い。たとえば、正常部検体を使用せずに解析を行なう場合には、変異頻度相関係数欄６５２は不要である。

ユーザが、図１０から図１４を使用して説明した各欄をたとえば右クリック等により選択した場合、制御部２１は、報告書レコードの根拠情報フィールドに記録された情報を表示する。制御部２１は、根拠情報フィールドに基づいて根拠情報へのリンクを表示するか、根拠情報自体を表示しても良い。ユーザは、報告書６０の記載の根拠を閲覧することにより、報告書の信頼性を確認できる。

報告書６０には、レビューを実施したエキスパートパネルの連絡先等が、表示されても良い。ユーザは、報告書６０に基づいてエキスパートパネルへの質問、相談等を行なえる。

報告書は、検体に行なった前処理、読取装置３１が塩基配列を読み取ったリード数、または、参照配列へのマッピング深度等の情報を含んでも良い。遺伝子検査に詳しい臨床医であれば、これらの情報に基づいて報告書の信頼度を判断できる。

図１５は、プログラムの処理の流れを説明するフローチャートである。制御部２１は、報告書作成要求に基づいてデータサーバ３２からゲノムデータを取得する（ステップＳ５０１）。制御部２１は、報告書案ＤＢ５５に新規レコードを作成し、検体ＩＤフィールド、検体フィールドおよびゲノムデータフィールドにそれぞれデータを記録する（ステップＳ５０２）。

制御部２１は、取得したゲノムデータを学習モデル５３に入力して、出力層５３３の各ノードの予測確率を取得する（ステップＳ５０３）。制御部２１は、出力層５３３の遺伝子変異にかかるノードから所定の閾値以上の確率が出力された遺伝子変異を抽出する（ステップＳ５０４）。閾値は、遺伝子変異ごとに異なる値であっても、一定の値であっても良い。

制御部２１は、出力層５３３の腫瘍含有量にかかるノードのうちの、最も確率が高いノードに基づいて、検体中の腫瘍含量を判定する（ステップＳ５０５）。制御部２１は、ステップＳ５０２で作成した報告書案レコードの非同義体細胞変異フィールドまたは生殖細胞変異フィールドの診断データフィールドに、ステップＳ５０４で抽出した変異を、腫瘍含有量フィールドにステップＳ５０５で判定した腫瘍含有量をそれぞれ記録する（ステップＳ５０６）。

なお、腫瘍含有量は、図１５に示すプログラムとは別の独立したプログラムにより算出されてもよい。そのようにする場合には、ステップＳ５０５は不要である。

制御部２１は、報告書案レコードに記録された検体の採取部位と遺伝子変異とをキーとして統合ＤＢ５２を検索し、抽出されたレコードの知識データフィールドから知識データを取得する（ステップＳ５０７）。制御部２１は、報告書レコードに取得した知識データを記録する（ステップＳ５０８）。

制御部２１は、報告書案レコードに記録されたすべての遺伝子変異の処理を終了したか否かを判定する（ステップＳ５０９）。終了していないと判定した場合（ステップＳ５０９でＮＯ）、制御部２１はステップＳ５０７に戻る。終了したと判定した場合（ステップＳ５０９でＹＥＳ）、制御部２１は報告書レコードに基づいて図１０を使用して説明した報告書６０の案を作成し、補助記憶装置２３またはデータサーバ３２に記録する（ステップＳ５１０）。

エキスパートパネルのメンバーである専門家は、定期的または不定期に開催されるエキスパート会議において報告書６０の案をレビューし、必要に応じて修正する。エキスパート会議は、専門家が実際に１室に集合して行なわれても、テレビ会議または電話会議等で行なわれても良い。エキスパート会議は、チャットシステム等を用いた電子会議で行なわれても良い。

エキスパートパネルは、必要に応じてＦＡＳＴＱ形式、ＢＡＭ形式、ＶＣＦ形式等のゲノムデータを参照する。エキスパートパネルは、病理検査時に撮影された顕微鏡写真等を参照しても良い。エキスパートパネルは病理検査を担当した病理医、または、患者を担当する臨床医から情報収集しても良い。

制御部２１は、エキスパート会議で決定された修正を受け付ける（ステップＳ５１１）。制御部２１は、報告書案レコードに記録された情報を修正した報告書レコードを報告書ＤＢ５６に記録する（ステップＳ５１２）。制御部２１は、報告書レコードのエキスパートＩＤフィールドに、レビューを行なった専門家に固有に付与されたエキスパートＩＤを記録する。制御部２１は処理を終了する。

制御部２１は、メールその他任意の手段を用いて、臨床医に対して報告書が作成されたことを通知してもよい。制御部２１は、電子カルテシステムに報告書をアップロードしても良い。制御部は、臨床医がゲノム解析システム１０にログインした場合に、新規報告書があることを通知しても良い。

制御部２１は、図１５を使用して説明したプログラムの開始時に、報告書６０を作成する統合ＤＢ５２の日付の指定を受け付けても良い。日付の指定を受け付けた場合、制御部２１はステップＳ５０７において指定した日付における最新の統合ＤＢ５２を使用して、知識データを取得する。ステップＳ５１０において、制御部２１は、指定された日付における最新情報に基づく報告書案を記録する。

たとえば、過去に判断された治療方針等の妥当性を検証する場合、その医療行為が行なわれた日付を指定して図１５を使用して説明したプログラムを実行することにより、その日付における最新情報に基づく報告書案を作成できる。

報告書ＤＢ５６に記録された情報、治療後の情報、および、投薬後の情報等に基づいて、教師データＤＢ５１にデータを追加して、学習モデル５３の再学習を行なっても良い。専門家によるレビューが行なわれたデータを教師データに追加することにより、学習モデル５３の精度を高めることができる。

本実施の形態によると、検体から読み取られた塩基配列に基づいて、臨床上重要な変異の自動抽出を行なう学習モデル５３を提供できる。学習モデル５３を使用することにより、遺伝子検査に関する高度な専門知識を有さない医師であっても、臨床上重要な遺伝子変異の有無を判断できる。

本実施の形態によると、統合ＤＢ５２を使用することにより遺伝子変異に関する医学情報をユーザに提示するゲノム解析システム１０を提供できる。遺伝子検査の分野は研究スピードが速く、頻繁に新たな知見が発表されるため、個々の医師が常に最新情報を把握することは困難である。統合ＤＢ５２に基づいて、医学情報を提供されるとともに、その根拠も提示されるため、医師は必要に応じて根拠を確認して、患者に対して適切な医療を提供できる。

報告書案をエキスパートパネルでレビューして、エキスパートパネルによる修正を反映することにより、信頼性の高い報告書６０を作成するゲノム解析システム１０を提供できる。エキスパートパネルがレビューを行なうことにより、教師データＤＢ５１に含まれていない新しい情報に基づいて報告書６０を作成できる。

臨床医が、遺伝子検査に関する専門知識を有する場合には、エキスパートパネルによるレビューを省略して、報告書案をそのまま報告書６０に使用しても良い。患者本人または臨床医が報告書案およびゲノムデータを取得し、自ら選択した専門医に意見を求めても良い。

［実施の形態２］
本実施の形態は、ＤＮＡに加えてＲＮＡの塩基配列の解析も行なうゲノム解析システム１０に関する。実施の形態１と共通する部分については、説明を省略する。

本実施の形態においては、腫瘍部から採取された検体は３つに分けられる。１つは病理検査に、１つはＤＮＡの解析に使用される。最後の１つは、前処理にてＲＮＡが抽出されて、読取装置３１によりＲＮＡの塩基配列が読み取られ、ＤＮＡと同様の手法により解析される。

ＲＮＡを解析することにより、腫瘍部で発現している遺伝子異常に関する情報を得ることができる。腫瘍部で発現している遺伝子異常は、たとえば複数のＤＮＡが転座または遺伝子再構成により融合した融合遺伝子、または、ＤＮＡがＲＮＡに転写される際に、一部が脱落するエクソンスキッピングである。本実施の形態の報告書６０には、たとえば非同義体細胞変異欄６３と生殖細胞変異欄６４との間に、ＲＮＡを解析して得た情報を表示するＲＮＡ欄６６が表示される。

図１６は、ＲＮＡ欄６６の例を説明する説明図である。図１６Ａと図１６Ｂとは、それぞれ異なる報告書に表示されるＲＮＡ欄６６の例を示す。図１６Ａは、ＲＮＡに異常が発見されない検体に関するＲＮＡ欄６６の例を示す。図１６Ｂは、融合遺伝子およびエクソンスキッピングが発見された検体に関するＲＮＡ欄６６の例を示す。

図１６Ｂに示すＲＮＡ欄６６は、遺伝子欄６６１、変異欄６６７、サイトバンド欄６６２、リード数欄６６８および知識データ欄６６６を含む。遺伝子欄６６１には、ＲＮＡが転写された転写元の遺伝子が表示される。

変異欄６６７には、ＲＮＡの変異が表示される。たとえば図１６Ｂの一番上の行には、ＰＡＸ３遺伝子とＦＯＸＯ１遺伝子との融合遺伝子が検出されたことが表示される。図１６Ｂの一番下の行には、ＭＥＴ遺伝子のエクソン１スキッピングが検出されたことが表示される。

サイトバンド欄６６２には、染色体上の遺伝子の位置が表示される。リード数欄６６８には、読取装置３１により読み取られたリードのうち、変異が検出されたリードの数および割合が表示される。リード数欄６６８に表示される情報は、ＦＡＳＴＱ形式のファイルから読み取られる。知識データ欄６６６には、統合ＤＢ５２から取得された情報が表示される。

本実施の形態によると、腫瘍で発現している遺伝子の異常を検出して、報告書６０に表示するゲノム解析システム１０を提供できる。

［実施の形態３］
本実施の形態は、統合ＤＢ５２が更新された場合に、過去に出力した報告書６０の変更点を示す追加報告書を出力するゲノム解析システム１０に関する。実施の形態１と共通する部分については、説明を省略する。

図１７は、変更履歴ＤＢのレコードレイアウトを説明する説明図である。変更履歴ＤＢは、統合ＤＢ５２に記録された遺伝子変異と、知識データが変更された変更日とを関連づけて記録するＤＢである。変更履歴ＤＢは、ゲノム変異フィールドおよび変更日フィールドを有する。

ゲノム変異フィールドは、腫瘍部検体フィールド、遺伝子フィールドおよび変異内容フィールドを有する。変更日フィールドは、第１変更日フィールド、第２変更日フィールド等、任意の数のサブフィールドを有する。変更履歴ＤＢは、統合ＤＢ５２に記録された１つの医学情報について、１つのレコードを有する。

腫瘍部検体フィールドには、検体が採取された部位が記録される。遺伝子フィールドには、変異が検出された遺伝子が記録される。なお、複数の変異の組合せに関する医学情報が記録されたレコードにおいては、遺伝子フィールドに複数の遺伝子が記録される。

第１変更日フィールドには、ゲノム変異フィールドに記録された遺伝子変異に関するレコードが統合ＤＢ５２に記録された日付が記録される。第２変更日フィールド以降には、統合ＤＢ５２に記録された医学情報が変更された日付が記録される。

図１８は、実施の形態３の報告書ＤＢ５６のレコードレイアウトを説明する説明図である。本実施の形態の報告書ＤＢ５６は、図８を使用して説明した実施の形態１の報告書ＤＢ５６に確認日フィールドが追加されている。確認日フィールドには、統合ＤＢ５２の更新状況を確認した日付が記録される。

図１９は、追加報告書を出力するプログラムの処理の流れを説明するフローチャートである。制御部２１は、報告書ＤＢ５６に記録された報告書レコードを取得する（ステップＳ５２１）。制御部２１は、正常部検体フィールドおよび腫瘍部検体フィールドに記録された、検体が採取された部位を取得する（ステップＳ５２２）。制御部２１は、確認日フィールドに記録された確認日を取得する（ステップＳ５２３）。

制御部２１は、非同義体細胞変異フィールドまたは生殖細胞変異フィールドの遺伝子フィールドに記録された遺伝子変異を取得する（ステップＳ５２４）。制御部２１はステップＳ５２２で取得した検体が採取された部位およびステップＳ５２４で取得した遺伝子変異をキーとして変更履歴ＤＢを検索してレコードを抽出する。制御部２１は、抽出したレコードの変更日フィールドに記録された日付と、ステップＳ５２３で取得した確認日とを比較し、確認日以後に知識データが変更されたか否か判定する（ステップＳ５２５）。

知識データが変更されていないと判定した場合（ステップＳ５２５でＮＯ）、制御部２１はステップＳ５２４に戻る。知識データが変更されたと判定した場合（ステップＳ５２５でＹＥＳ）、制御部２１はステップＳ５２２で取得した検体が採取された部位およびステップＳ５２４で取得した遺伝子変異をキーとして、最新の統合ＤＢ５２を検索してレコードを抽出する。制御部２１は、抽出したレコードから知識データを取得する（ステップＳ５２６）。

制御部２１は、報告書レコードの知識データフィールドに、ステップＳ５２６で取得した知識データを記録する（ステップＳ５２７）。制御部２１は報告書レコードのコピーを作成して、ステップＳ５２６で取得した知識データを記録しても良い。

制御部２１は、ステップＳ５２１で取得した報告書レコードに記録されたすべての変異の処理を終了したか否かを判定する（ステップＳ５２８）。終了していないと判定した場合（ステップＳ５２８でＮＯ）、制御部２１はステップＳ５２４に戻る。

終了したと判定した場合（ステップＳ５２８でＹＥＳ）、制御部２１はステップＳ５２５で知識データが変更されていると判定した遺伝子変異があるか否かを判定する（ステップＳ５２９）。あると判定した場合（ステップＳ５２９でＹＥＳ）、制御部２１は臨床医に対して、報告書が変更されたことを通知する（ステップＳ５３０）。通知は、たとえば電子メールまたはメッセンジャー等の、任意の手段により行なえる。

制御部２１は、ステップＳ５３０においてエキスパートパネルに対して通知を行ない、レビュー結果に基づく修正を受け付けた後に、臨床医、または、病院に対する通知を行なっても良い。知識データが変更されていると判定した遺伝子変異がないと判定した場合（ステップＳ５２９でＮＯ）またはステップＳ５３０の終了後、制御部２１は処理を終了するか否かを判定する（ステップＳ５３１）。

終了しないと判定した場合（ステップＳ５３１でＮＯ）、制御部２１はステップＳ５２１に戻る。終了すると判定した場合（ステップＳ５３１でＹＥＳ）、制御部２１は処理を終了する。

本実施の形態によると、過去に作成した報告書に関連する新たな医学情報が公開された場合に、追加報告書を出力するゲノム解析システム１０を提供できる。臨床医は、治療中の患者に対して効果が期待できる薬剤、治験または治療法等に関する追加情報を受け取り、治療方針に反映させることができる。

制御部２１は、追加情報を必要としない報告書６０の指定を受け付けても良い。臨床医は、治療を終了した患者に関する報告書６０等について追加報告書を必要としない旨を指定できる。制御部２１は、ステップＳ５２１において、追加情報を必要としない報告書を取得対象から外すことにより、必要とされない追加報告書の作成を回避する。

［実施の形態４］
本実施の形態は、エキスパートパネルに参加した専門家に対してインセンティブを付与するゲノム解析システム１０に関する。実施の形態１と共通する部分については、説明を省略する。

図２０は、専門家ＤＢのレコードレイアウトを説明する説明図である。専門家ＤＢは、エキスパートパネルに参加する専門家に固有に付与されたエキスパートＩＤと、専門分野と、ポイントとを関連づけて記録するＤＢである。

専門家ＤＢは、エキスパートＩＤフィールド、専門分野フィールドおよびポイントフィールドを有する。エキスパートＩＤフィールドには、エキスパートＩＤが記録される。専門分野フィールドには、専門家の専門分野が記録されている。ポイントフィールドには、専門家に付与されたポイントが記録されている。

専門家は、エキスパートパネルに参加して報告書案のレビューを行なうごとに、ポイントを獲得できる。専門家は溜まったポイントをたとえば、金券、報告書６０の作成を依頼する際に利用できる報告書作成依頼券、または、学習モデル５３を利用した遺伝子解析を依頼する際に利用できる学習モデル利用券等と交換できる。ポイントにより、専門家に対してエキスパートパネルに参加するインセンティブを与えることができる。

ポイントは、たとえば１回のレビューに５ポイントのように定められていても良い。エキスパートレビュー時の発言量または意見の内容に基づいて、たとえばエキスパートパネルのリーダが個々の専門家に付与するポイントを決定しても良い。エキスパートパネルへの参加頻度に基づいて、１回のレビューに付与されるポイントが定められても良い。

図２１は、エキスパートパネルへの参加者を選択する画面の例を説明する説明図である。図２１に示す画面は、エキスパートパネルの事務局担当者が使用するパソコン、タブレットまたはスマートフォン等の情報機器に表示される。事務局担当者が使用する情報機器は、ネットワークを介して情報処理装置２０に接続されている。

エキスパートパネルへの参加者を選択する画面は、検体情報欄７４、絞込条件欄７５、再検索ボタン７６、候補リスト７７、確認ボタン７８および依頼送信ボタン７９を含む。検体情報欄７４には、エキスパートパネルでのレビューを行なう検体に関する情報が表示されている。

絞込条件欄７５には、専門家の絞込を行なう際に使用する項目が表示されている。ユーザは、各項目の先頭に表示されているチェックボックスを選択することにより、絞込条件を選択できる。なお、絞込条件欄７５は、フリーキーワードを受け付ける欄を有しても良い。候補リスト７７には、エキスパートパネルに参加する専門家の候補リストが表示されている。

ユーザは、絞込条件欄７５を使用して、所望の条件を設定して、再検索ボタン７６を選択する。設定された条件が、情報処理装置２０に送信される。制御部２１は、設定された条件に合う専門家を抽出して、ユーザの使用する情報機器に送信する。

候補リスト７７に、設定された条件に合致する専門家のリストが表示される。ユーザは、候補リスト７７の右端に表示されたチェックボックスを使用して、エキスパートパネルへの参加を依頼する専門家を選択する。

候補リスト７７に表示される専門家の数が多すぎる場合、または、少なすぎる場合には、ユーザは絞込条件欄７５の設定を適宜変更して、再検索を行なう。ユーザが確認ボタン７８を選択した場合、選択された専門家の一覧が表示される。ユーザが依頼送信ボタン７９を選択した場合、選択された専門家の一覧が情報処理装置２０に送信される。

制御部２１は、検体ＩＤと、選択された専門家のエキスパートＩＤとを関連づけて、補助記憶装置２３に記憶する。制御部２１は、それぞれの専門家に対してＵＲＬ（Uniform Resource Locator）を記載した電子メールを送信する。

図２２は、エキスパートパネルへの参加依頼を確認する画面の例を説明する説明図である。図２２は、専門家がＵＲＬにより示されたＷＥＢサイトにアクセスした場合に、専門家の使用する情報機器に表示される画面である。

エキスパートパネルへの参加依頼を確認する画面は、依頼リスト７２および参加ボタン７１を含む。依頼リスト７２には、専門家に参加を依頼するエキスパートパネルのリストが表示されている。それぞれのエキスパートパネルについて、検体の採取部位、患者情報、報告書６０の作成を依頼した医療機関等の情報が表示されている。

専門家は、依頼リスト７２を見て、参加を希望するエキスパートパネルについて参加ボタン７１を選択する。制御部２１は、参加ボタン７１を選択した専門家が参加する電子会議室を設定し、報告書案をアップロードする。参加者は、電子会議室上で報告書のレビューを行なう。あらかじめ指名されたリーダが結論をまとめて、電子会議室を終了させる。なお、電子会議システムは従来から広く使用されているため、制御部２１が行なう処理の詳細については説明を省略する。

電子会議室の終了後、制御部２１はエキスパートパネルに参加した専門家にポイントを付与する。具体的には、制御部２１は、専門家ＤＢからエキスパートパネルに参加した専門家にかかるレコードを抽出し、ポイントフィールドにポイントを加算する。

図２３は、実施の形態４の修正受付のサブルーチンの処理の流れを説明するフローチャートである。修正受付のサブルーチンは、エキスパートパネルへの専門家の参加を受け付け、参加した専門家にポイントを付与するサブルーチンである。修正受付のサブルーチンは、図１５を使用して説明した実施の形態１のプログラムのステップＳ５１１の代わりに起動する。

制御部２１は、専門家ＤＢに登録された専門家ごとに図２２を使用して説明したエキスパートパネル参加依頼画面を作成し、ＵＲＬを記載したメールを送信して、参加依頼を通知する（ステップＳ５４１）。

制御部２１は、専門家ＤＢの専門分野フィールドに記録された専門分野に基づいて、どの専門家にどの報告書案のレビューを依頼するかを定めることができる。たとえば制御部２１は、呼吸器から腫瘍部検体が採取された症例、および、呼吸器科から依頼された症例に関するエキスパートパネルについては、専門分野フィールドに呼吸器が登録された専門家に参加依頼を通知する。

制御部２１は、専門家ＤＢに登録された専門家をカテゴリごとに選択して、参加依頼を通知しても良い。制御部２１は、専門家ＤＢに登録された専門家全員に、参加依頼を通知しても良い。制御部２１は、専門家による参加ボタン７１の選択を受け付けることにより、エキスパートパネルへの参加を受け付ける（ステップＳ５４２）。制御部２１は、それぞれのエキスパートパネルへの参加者を登録した電子会議室を設定する（ステップＳ５４３）。制御部２１は、電子会議室へのアクセス情報を、それぞれの参加者に送信する。

制御部２１は、電子会議室に報告書案をアップロードし、参加者が閲覧できる状態にする（ステップＳ５４４）。参加者は、電子会議室を通じて他の参加者とのコミュニュケーションを行ない、報告書案をレビューする。

あらかじめ指名されたリーダが結論をまとめて、電子会議室を終了する操作を行なう。制御部２１は、終了操作を受け付ける（ステップＳ５４５）。制御部２１は、電子会議室を閉鎖する（ステップＳ５４６）。制御部２１は、専門家ＤＢからエキスパートパネルに参加した専門家にかかるレコードを抽出し、ポイントフィールドにポイントを加算する（ステップＳ５４７）。制御部２１は、処理を終了する。

本実施の形態によると、エキスパートパネルへの参加に対するインセンティブを与えるゲノム解析システム１０を提供できる。学習モデル利用料金および報告書作成料金等で得る収益を、ポイントにより専門家に分配することで、エキスパートパネルに参加する専門家を確保しやすいゲノム解析システム１０を提供できる。

それぞれのエキスパートパネルに参加するか否かを、専門家自身が決定できるため、意欲がある参加者を集められるゲノム解析システム１０を提供できる。電子会議室を用いてエキスパートレビューを行なうため、多忙な専門家であってもエキスパートパネルに参加しやすいゲノム解析システム１０を提供できる。

［実施の形態５］
本実施の形態は、統合ＤＢ５２に記録される情報のレビューを専門家に依頼するゲノム解析システム１０に関する。実施の形態４と共通する部分については、説明を省略する。

図２４は、統合ＤＢレビュー参加依頼画面の例を説明する説明図である。制御部２１は、それぞれの専門家に対してＵＲＬを記載した電子メールを送信する。専門家がパソコンまたはスマートフォン等の情報機器を用いてＵＲＬにより示されたＷＥＢサイトにアクセスした場合に、図２４に示す統合ＤＢレビュー参加依頼画面が情報機器に表示される。

統合ＤＢレビュー参加依頼画面は、依頼リスト７３および参加ボタン７１を含む。依頼リスト７３には、専門家にレビューを依頼する医学情報のリストが表示されている。それぞれの医学情報について、対象の遺伝子、ＤＮＡ変異および情報源が表示されている。統合ＤＢレビューの対象は、図２４のＮｏ．３に例示するように、特定の遺伝子変異に関係しない情報であっても良い。

専門家は、依頼リスト７３を見て自分の専門領域である薬剤、疾患または治験に関する医学情報であるか否かを判断できる。専門家は、レビューへの参加を希望する場合には、参加ボタン７１を選択する。制御部２１は、参加ボタン７１を選択した専門家が参加する電子会議室を設定し、報告書案をアップロードする。参加者は、電子会議室上で報告書のレビューを行なう。あらかじめ指名されたリーダが結論をまとめて、電子会議室を終了させる。

なお、レビューは１名の専門家が単独で実施しても良い。その場合には、電子会議室を使用しなくても良い。

制御部２１は、レビュー結果に基づいて、統合ＤＢ５２への新規レコードの追加、または既存レコードの更新を実行する。

図２５は、統合ＤＢ５２を更新するプログラムの処理の流れを説明するフローチャートである。以下の説明では、情報処理装置２０が統合ＤＢ５２の更新を行なう場合を例にして説明する。統合ＤＢ５２の更新は情報処理装置２０以外の情報機器で実行されても良い。

制御部２１は、様々な医学情報ＤＢ５８を巡回して、遺伝子変異に関する新たな医学情報を収集してデータベース化するクローリングを行なう（ステップＳ５５１）。クローリングは、クローラまたはロボットと呼ばれるプログラムにより実行される。クローリングは従来から広く行なわれているため、詳細については説明を省略する。

制御部２１は、クローリングにより収集された医学情報を選択して、統合ＤＢ５２に既に記録されている遺伝子変異に関する情報であるか否かを判定する（ステップＳ５５２）。統合ＤＢ５２に記録されている遺伝子変異に関する情報であると判定した場合（ステップＳ５５２でＹＥＳ）、制御部２１は統合ＤＢ５２に記録されている情報と同一の内容であるか否かを判定する（ステップＳ５５３）。

統合ＤＢ５２に記録されている遺伝子変異に関する情報ではないと判定した場合（ステップＳ５５２でＮＯ）、または、統合ＤＢ５２に記録されている情報と同一の内容ではないとト判定した場合（ステップＳ５５３でＮＯ）、制御部２１は、処理中の医学情報がレビュー対象である旨を記録する（ステップＳ５５４）。

同一内容であると判定した場合（ステップＳ５５３でＹＥＳ）、またはステップＳ５５４の終了後、制御部２１はステップＳ５５１で収集した医学情報の処理を終了したか否かを判定する（ステップＳ５５５）。終了していないと判定した場合（ステップＳ５５５でＮＯ）、制御部２１はステップＳ５５２に戻る。

終了したと判定した場合（ステップＳ５５５でＹＥＳ）、制御部２１は、専門家ＤＢに登録された専門家ごとに図２４を使用して説明した統合ＤＢレビュー参加依頼画面を作成し、ＵＲＬを記載したメールを送信して、参加依頼を通知する（ステップＳ５６１）。

制御部２１は、専門家による参加ボタン７１の選択を受け付けることにより、レビューへの参加を受け付ける（ステップＳ５６２）。制御部２１は、それぞれのレビューへの参加者を登録した電子会議室を設定する（ステップＳ５６３）。制御部２１は、電子会議室へのアクセス情報を、それぞれの参加者に送信する。

制御部２１は、電子会議室にクローリングにより収集した医学情報をアップロードし、参加者が閲覧できる状態にする（ステップＳ５６４）。参加者は、電子会議室を通じて他の参加者とのコミュニュケーションを行ない、医学情報をレビューする。

あらかじめ指名されたリーダが結論をまとめて、電子会議室を終了する操作を行なう。結論は、参加した専門家の多数決により決定されてもよい。制御部２１は、終了操作を受け付ける（ステップＳ５６５）。制御部２１は、電子会議室を閉鎖する（ステップＳ５６６）。制御部２１は、専門家ＤＢからレビューに参加した専門家にかかるレコードを抽出し、ポイントフィールドにポイントを加算する（ステップＳ５６７）。制御部２１は、それぞれの医学情報に関するレビュー結果に基づいて、統合ＤＢ５２を更新する（ステップＳ５６８）。制御部２１は、処理を終了する。

本実施の形態によると、統合ＤＢ５２に登録する情報をクローリングにより自動収集した後に、専門家によるレビューを経て統合ＤＢ５２を更新するゲノム解析システム１０を提供できる。クローリング技術を活用することにより、統合ＤＢ５２に新しい医学情報を適宜反映させるゲノム解析システム１０を提供できる。

収集した医学情報を統合ＤＢ５２に登録する前に専門家によるレビューを実施することにより、統合ＤＢ５２の信頼度を保ち、正確な報告書６０を出力するゲノム解析システム１０を提供できる。

学習モデル利用料金および報告書作成料金等で得る収益を、ポイントにより専門家に分配することで、レビューに参加する専門家を確保しやすいゲノム解析システム１０を提供できる。

それぞれのレビューに参加するか否かを、専門家自身が決定できるため、意欲があるレビュー参加者を集められるゲノム解析システム１０を提供できる。電子会議室を用いてレビューを行なうため、多忙な専門家であってもレビューに参加しやすいゲノム解析システム１０を提供できる。

［実施の形態６］
図２６は、ゲノムデータから臨床上意味のある遺伝子変異を予測する段階における情報処理装置２０の機能ブロック図である。情報処理装置２０は、ゲノムデータ取得部８１と、ゲノムデータ入力部８２と、出力部８３とを有する。

ゲノムデータ取得部８１は、検体に含まれる塩基配列を読み取ったゲノムデータを取得する。ゲノムデータ入力部８２は、ゲノムデータを受け付けて遺伝子変異に関する予測を出力する学習モデル５３に、ゲノムデータ取得部８１が取得したゲノムデータを入力する。出力部８３は、ゲノムデータ入力部８２により入力されたゲノムデータに基づいて学習モデル５３から出力された予測を出力する。

図２７は、遺伝子変異と統合ＤＢ５２とに基づいて報告書を作成する段階における情報処理装置２０の機能ブロック図である。情報処理装置２０は、第１受付部８４と、第１出力部８５と、第２受付部８６と、第２出力部８７とを有する。

第１受付部８４は、検体から検出された遺伝子変異を受け付ける。第１出力部８５は、第１受付部８４が受け付けた遺伝子変異と、複数の情報源から取得した遺伝子変異に関する医学情報、医学情報の取得日および根拠情報を関連づけて統合した統合ＤＢ５２とに基づいて、検体に関する解析結果と、統合ＤＢ５２のバージョンとを関連づけて記録した報告書を出力する。

第２受付部８６は、過去の日付、当該日付における報告書出力要求、および、検体から検出された遺伝子変異を受け付ける。第２出力部８７は、第２受付部８６が受け付けた遺伝子変異と、当該日付における統合ＤＢ５２とに基づいて、検体に関する解析結果と、統合ＤＢ５２のバージョンとを関連づけて記録した報告書を出力する。

［実施の形態７］
本実施の形態は、汎用のコンピュータ９０とプログラム９７とを組み合わせて動作させることにより、本実施の形態のゲノム解析システム１０を実現する形態に関する。図２８は、実施の形態７のゲノム解析システム１０の構成を説明する説明図である。実施の形態１と共通する部分については、説明を省略する。

本実施の形態のゲノム解析システム１０は、コンピュータ９０と、読取装置３１と、データサーバ３２とを含む。

コンピュータ９０は、制御部２１、主記憶装置２２、補助記憶装置２３、通信部２４、読取部２９およびバスを備える。コンピュータ９０は、汎用のパーソナルコンピュータ、タブレットまたはサーバコンピュータ等の情報機器である。

プログラム９７は、可搬型記録媒体９６に記録されている。制御部２１は、読取部２９を介してプログラム９７を読み込み、補助記憶装置２３に保存する。また制御部２１は、コンピュータ９０内に実装されたフラッシュメモリ等の半導体メモリ９８に記憶されたプログラム９７を読出しても良い。さらに、制御部２１は、通信部２４および図示しないネットワークを介して接続される図示しない他のサーバコンピュータからプログラム９７をダウンロードして補助記憶装置２３に保存しても良い。

プログラム９７は、コンピュータ９０の制御プログラムとしてインストールされ、主記憶装置２２にロードして実行される。これにより、コンピュータ９０は上述した情報処理装置２０として機能する。

各実施例で記載されている技術的特徴（構成要件）はお互いに組合せ可能であり、組み合わせすることにより、新しい技術的特徴を形成することができる。
今回開示された実施の形態はすべての点で例示であって、制限的なものではないと考えられるべきである。本発明の範囲は、上記した意味ではなく、特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。

１０ゲノム解析システム
２０情報処理装置
２１制御部
２２主記憶装置
２３補助記憶装置
２４通信部
２９読取部
３１読取装置
３２データサーバ
５１教師データＤＢ
５２統合ＤＢ
５３学習モデル
５３１入力層
５３２中間層
５３３出力層
５５報告書案ＤＢ
５６報告書ＤＢ
５８医学情報ＤＢ
６０報告書
６１書誌事項欄
６１１ＩＤ欄
６１２患者情報欄
６１３検体欄
６１４病理組織診断欄
６１５検体番号欄
６２コメント欄
６３非同義体細胞変異欄
６３１遺伝子欄
６３２サイトバンド欄
６３３ＤＮＡ変異欄
６３４アミノ酸変異欄
６３５アリル頻度欄
６３６知識データ欄
６４生殖細胞変異欄
６４１遺伝子欄
６４２サイトバンド欄
６４３ＤＮＡ変異欄
６４４アミノ酸変異欄
６４５知識データ欄
６４７正常部アリル頻度欄
６４８腫瘍部アリル頻度欄
６５解析欄
６５１推定腫瘍含有量欄
６５２変異頻度相関係数欄
６６ＲＮＡ欄
６６１遺伝子欄
６６２サイトバンド欄
６６６知識データ欄
６６７変異欄
６６８リード数欄
７１参加ボタン
７２依頼リスト
７３依頼リスト
７４検体情報欄
７５絞込条件欄
７６再検索ボタン
７７候補リスト
７８確認ボタン
７９依頼送信ボタン
８１ゲノムデータ取得部
８２ゲノムデータ入力部
８３出力部
８４第１受付部
８５第１出力部
８６第２受付部
８７第２出力部
９０コンピュータ
９６可搬型記録媒体
９７プログラム
９８半導体メモリ

Claims

過去に行なわれた複数の遺伝子検査について、正常部ゲノムデータと、患者の腫瘍部から採取した検体に含まれる塩基配列を読み取った腫瘍部ゲノムデータと、前記患者にかかる遺伝子変異とを関連づけて記録した教師データを取得し、
前記正常部ゲノムデータと前記腫瘍部ゲノムデータとを入力、前記遺伝子変異を出力として、正常部ゲノムデータと患者の腫瘍部から採取した検体に含まれる塩基配列を読み取った腫瘍部ゲノムデータとが入力された場合に、前記患者にかかる遺伝子変異に関する予測を出力する学習モデルを生成する
処理をコンピュータに実行させるプログラム。
前記学習モデルは、変異が生じた塩基の予測位置を出力する
請求項１に記載のプログラム。
前記学習モデルは、腫瘍部から採取した前記検体の腫瘍含有量の予測を出力する
請求項１または請求項２に記載のプログラム。
正常部ゲノムデータと患者の腫瘍部から採取した検体に含まれる塩基配列を読み取った腫瘍部ゲノムデータとを取得し、
正常部ゲノムデータと患者の腫瘍部から採取した検体に含まれる塩基配列を読み取った腫瘍部ゲノムデータとが入力された場合に、前記患者にかかる遺伝子変異に関する予測を出力する学習モデルに、取得した前記正常部ゲノムデータと前記腫瘍部ゲノムデータとを入力し、
前記学習モデルから出力された遺伝子変異に関する予測を出力する
処理をコンピュータに実行させるプログラム。
報告書出力要求を受け付けた場合、
正常部ゲノムデータと患者の腫瘍部から採取した検体に含まれる塩基配列を読み取った腫瘍部ゲノムデータとを、正常部ゲノムデータと患者の腫瘍部から採取した検体に含まれる塩基配列を読み取った腫瘍部ゲノムデータとが入力された場合に、前記患者にかかる遺伝子変異に関する予測を出力する学習モデルに入力し、前記学習モデルから出力された遺伝子変異に関する予測と、複数の情報源から取得した遺伝子変異に関する医学情報、前記医学情報の取得日および根拠情報を関連づけて統合した統合ＤＢとに基づいて、前記患者にかかる遺伝子変異に関する解析結果と、前記統合ＤＢのバージョンとを関連づけて記録した報告書を出力し、
過去の日付および当該日付における報告書出力要求を受け付けた場合、前記予測と、前記日付における統合ＤＢとに基づいて、前記患者にかかる遺伝子変異に関する解析結果と、前記統合ＤＢのバージョンとを関連づけて記録した報告書を出力する
処理をコンピュータに実行させるプログラム。
前記報告書は、前記遺伝子変異に関する予測をキーとして、前記統合ＤＢから抽出した医学情報を含む
請求項５に記載のプログラム。
遺伝子変異に関する医学情報が追加されることにより前記統合ＤＢが更新された場合、前記遺伝子変異に関する予測と、更新された統合ＤＢとに基づいて、追加報告書を出力する
請求項５または請求項６に記載のプログラム。
前記統合ＤＢの更新に関するレビュー依頼を専門家に送信し、
送信したレビュー依頼に対するレビュー結果を受け付け、
受け付けたレビュー結果に対するインセンティブを前記専門家と関連づけて記録する
請求項７に記載のプログラム。
正常部ゲノムデータと、患者の腫瘍部から採取した検体に含まれる塩基配列を読み取った腫瘍部ゲノムデータとを取得し、
正常部ゲノムデータと患者の腫瘍部から採取した検体に含まれる塩基配列を読み取った腫瘍部ゲノムデータとが入力された場合に、前記患者にかかる遺伝子変異に関する予測を出力する学習モデルに、取得した前記正常部ゲノムデータと前記腫瘍部ゲノムデータとを入力し、
入力された前記正常部ゲノムデータと前記腫瘍部ゲノムデータとに基づいて前記学習モデルから出力された遺伝子変異に関する予測を取得し、
取得した前記予測と、複数の情報源から取得した遺伝子変異に関する医学情報、前記医学情報の取得日および根拠情報を関連づけて統合した統合ＤＢとに基づいて、前記検体に関する解析結果と、前記統合ＤＢのバージョンとを関連づけて記録した報告書を出力する
処理をコンピュータに実行させるプログラム。
前記報告書のレビュー依頼を専門家に送信し、
送信したレビュー依頼に対するレビュー結果を受け付け、
受け付けたレビュー結果に対するインセンティブを前記専門家と関連づけて記録する
請求項５から請求項９のいずれか一つに記載のプログラム。
前記インセンティブは、金券、報告書作成依頼券、または、学習モデル利用券である
請求項８または請求項１０に記載のプログラム。
前記インセンティブは、前記レビュー結果に基づいて変動する
請求項８、１０または１１に記載のプログラム。
前記正常部ゲノムデータは、患者の正常部から採取した検体に含まれる塩基配列を読み取ったゲノムデータである
請求項１から請求項１２のいずれか一つに記載のプログラム。
正常部ゲノムデータと、被験者の腫瘍部から採取した検体に含まれる塩基配列を読み取った腫瘍部ゲノムデータとが入力される入力層と、
前記被験者にかかる遺伝子変異に関する予測を出力する出力層と、
過去に行なわれた複数の遺伝子検査について、正常部ゲノムデータと、患者の腫瘍部から採取した検体に含まれる塩基配列を読み取った腫瘍部ゲノムデータと、前記患者にかかる遺伝子変異とを関連づけて記録した教師データを用いてパラメータが学習された中間層とを備え、
正常部ゲノムデータと、被験者の腫瘍部から採取した検体に含まれる塩基配列を読み取った腫瘍部ゲノムデータとが前記入力層に入力された場合に、前記中間層による演算を経て前記被験者にかかる遺伝子変異に関する予測を前記出力層から出力するように
コンピュータを機能させる学習モデル。
正常部ゲノムデータと患者の腫瘍部から採取した検体に含まれる塩基配列を読み取った腫瘍部ゲノムデータとを、正常部ゲノムデータと患者の腫瘍部から採取した検体に含まれる塩基配列を読み取った腫瘍部ゲノムデータとが入力された場合に、前記患者にかかる遺伝子変異に関する予測を出力する学習モデルに入力し、前記学習モデルから出力された遺伝子変異に関する予測を受け付ける第１受付部と、
前記第１受付部が受け付けた遺伝子変異に関する予測と、複数の情報源から取得した遺伝子変異に関する医学情報、前記医学情報の取得日および根拠情報を関連づけて統合した統合ＤＢとに基づいて、前記患者の遺伝子変異に関する解析結果と、前記統合ＤＢのバージョンとを関連づけて記録した報告書を出力する第１出力部と、
過去の日付、当該日付における報告書出力要求、および、前記予測を受け付ける第２受付部と、
前記第２受付部が受け付けた前記予測と、前記日付における統合ＤＢとに基づいて、前記患者の遺伝子変異に関する解析結果と、前記統合ＤＢのバージョンとを関連づけて記録した報告書を出力する第２出力部と
を備える情報処理装置。
正常部ゲノムデータと患者の腫瘍部から採取した検体に含まれる塩基配列を読み取った腫瘍部ゲノムデータとを取得するゲノムデータ取得部と、
正常部ゲノムデータと患者の腫瘍部から採取した検体に含まれる塩基配列を読み取った腫瘍部ゲノムデータとが入力された場合に前記患者にかかる遺伝子変異に関する予測を出力する学習モデルに、取得した前記正常部ゲノムデータと前記腫瘍部ゲノムデータとを入力するゲノムデータ入力部と、
前記学習モデルから出力された遺伝子変異に関する予測を出力する出力部と
を備える情報処理装置。
正常部ゲノムデータと患者の腫瘍部から採取した検体に含まれる塩基配列を読み取った腫瘍部ゲノムデータとを取得し、
正常部ゲノムデータと患者の腫瘍部から採取した検体に含まれる塩基配列を読み取った腫瘍部ゲノムデータとが入力された場合に、前記患者にかかる遺伝子変異に関する予測を出力する学習モデルに、取得した前記正常部ゲノムデータと前記腫瘍部ゲノムデータとを入力し、
前記学習モデルから出力された遺伝子変異に関する予測を出力する
処理をコンピュータに実行させる情報処理方法。
過去に行なわれた複数の遺伝子検査について、正常部ゲノムデータと、患者の腫瘍部から採取した検体に含まれる塩基配列を読み取った腫瘍部ゲノムデータと、前記患者にかかる遺伝子変異とを関連づけて記録した教師データを取得し、
前記正常部ゲノムデータと前記腫瘍部ゲノムデータとを入力、前記遺伝子変異を出力として、正常部ゲノムデータと患者の腫瘍部から採取した検体に含まれる塩基配列を読み取った腫瘍部ゲノムデータとが入力された場合に、前記患者にかかる遺伝子変異に関する予測を出力する学習モデルを生成する
処理をコンピュータに実行させる学習モデルの生成方法。