WO2022163401A1

WO2022163401A1 - 学習装置、学習方法、学習済みモデル、及びプログラム

Info

Publication number: WO2022163401A1
Application number: PCT/JP2022/001350
Authority: WO
Inventors: 祐太日朝
Original assignee: 富士フイルム株式会社
Priority date: 2021-01-26
Filing date: 2022-01-17
Publication date: 2022-08-04
Also published as: US20230368880A1; JPWO2022163401A1

Abstract

精度の高い高品質な学習データを使用して、精度の高い読影レポートを出力する学習済みモデルを生成する学習装置、学習方法、プログラム、及びその学習方法で学習が行われた学習済みモデルを提供する。学習装置は、プロセッサ（１２９）と、メモリ（１１４）と、学習モデル（１３０）と、を備える。プロセッサ（１２９）は、Ｘ線ＣＴ画像（２０２）を投影して疑似単純Ｘ線画像（２０４）を生成し、学習モデル（１２６）に疑似単純Ｘ線画像（２０４）を入力する処理と、第１の読影レポート（２０６）を変換して疑似単純Ｘ線画像（２０４）に対しての第２の読影レポート（２０８）を生成する処理と、学習モデル（１２６）が入力された疑似単純Ｘ線画像（２０４）に基づいて出力した、疑似単純Ｘ線画像（２０４）に対する推定レポート（２１０）と、第２の読影レポート（２０８）との誤差を取得する処理と、誤差を使用して、学習モデル（１２６）を学習させる処理と、を行う。

Description

学習装置、学習方法、学習済みモデル、及びプログラム

　本発明は、学習装置、学習方法、学習済みモデル、及びプログラムに関し、特に、読影レポートの出力に関して学習を行う学習装置、学習方法、学習済みモデル、及びプログラムに関する。

　従来、医師等により単純Ｘ線画像から疾患などが読影され、その読影結果が読影レポートにまとめられてきた。しかし、単純Ｘ線画像の読影は、医師によっても容易ではなく、読影レポートの精度が低くなってしまうことがある。ここで、単純Ｘ線画像とは、Ｘ線を照射しその陰影を平面に写して得られた２次元画像である。

　近年では、機械学習の技術を利用して、入力された単純Ｘ線画像に対して読影レポートを出力するように学習が行われた学習済みモデルの提案が行われている。

　例えば、非特許文献１及び非特許文献２には、胸部Ｘ線画像（単純Ｘ線画像）を入力し、読影レポートを出力する機械学習に関する技術が記載されている。

Yuan, Jianbo, et al., "Automatic radiology report generation based on multi-view image fusion and medical concept enrichment.", MICCAI, 2019. Li, Christy Y., et al. "Knowledge-driven encode, retrieve, paraphrase for medical image report generation.", AAAI, 2019.

　ここで、非特許文献１及び非特許文献２に記載された技術では、学習データとして２次元情報を有する単純Ｘ線画像及びその読影レポートが使用されている。上述したように、単純Ｘ線画像の読影レポートの作成は医師等によっても容易ではなく、読影レポートの精度が低い場合がある。この理由の１つとして、単純Ｘ線画像では、本来３次元的な形状を有する臓器等が２次元画像として写し出されているために、臓器同士が重なって写し出されたり、本来の臓器の形状の把握が困難であったりする場合がある。そして、このような精度の低い読影レポートを使用して学習が行われた学習済みモデルは、精度の高い読影レポートを出力することができない可能性がある。

　本発明はこのような事情に鑑みてなされたもので、その目的は、精度の高い高品質な学習データを使用して、精度の高い読影レポートを出力する学習済みモデルを生成する学習装置、学習方法、プログラム、及びその学習方法で学習が行われた学習済みモデルを提供することである。

　上記目的を達成するための、本発明の一の態様である学習装置は、プロセッサと、３次元情報を有するＸ線ＣＴ画像及びＸ線ＣＴ画像に対する第１の読影レポートの学習データセットを記憶するメモリと、２次元情報を有する単純Ｘ線画像から読影レポートを生成する学習モデルと、を備える学習装置であって、プロセッサは、Ｘ線ＣＴ画像を投影して疑似単純Ｘ線画像を生成し、学習モデルに疑似単純Ｘ線画像を入力する処理と、第１の読影レポートを変換して疑似単純Ｘ線画像に対しての第２の読影レポートを生成する処理と、学習モデルが入力された疑似単純Ｘ線画像に基づいて出力した、疑似単純Ｘ線画像に対する推定レポートと、第２の読影レポートとの誤差を取得する処理と、誤差を使用して、学習モデルを学習させる処理と、を行う。

　本態様によれば、３次元情報を有するＸ線ＣＴ画像及びＸ線ＣＴ画像に対する第１の読影レポートの学習データセットから、疑似単純Ｘ線画像と疑似単純Ｘ線に対する第２の読影レポートを生成し、この疑似単純Ｘ線画像と第２の読影レポートとを使用して学習が行われる。これにより、本態様は、情報量の多いＸ線ＣＴ画像と第１の読影レポートに基づく疑似Ｘ線画像と第２の読影レポートにより学習が行われるので、精度の高い読影レポートを出力するように学習を行うことができる。

　好ましくは、第２の読影レポートを生成する処理は、第１の読影レポートに含まれる臓器ラベルを、第２の読影レポートの臓器ラベルに変換することにより、第１の読影レポートから第２の読影レポートを生成する。

　好ましくは、第２の読影レポートを生成する処理は、第１の読影レポートに含まれる疾患ラベルを、第２の読影レポートの疾患ラベルに変換することにより、第１の読影レポートから第２の読影レポートを生成する。

　好ましくは、第２の読影レポートを生成する処理は、第１の読影レポートに対応する第１の知識グラフを、第２の読影レポートに対応する第２の知識グラフに変換し、変換に基づいて、第２の読影レポートを生成する。

　好ましくは、メモリは、第１の姿勢の被検体を撮影したＸ線ＣＴ画像を記憶し、学習モデルは、第２の姿勢の被検体を撮影した単純Ｘ線画像から読影レポートを生成する場合には、疑似単純Ｘ線画像を入力する処理は、第１の姿勢のＸ線ＣＴ画像から第２の姿勢の疑似単純Ｘ線画像を生成して、学習モデルに第２の姿勢の疑似単純Ｘ線画像を入力する。

　好ましくは、疑似単純Ｘ線画像を入力する処理は、Ｘ線ＣＴ画像から第１の方向に投影した疑似単純Ｘ線画像と、第２の方向に投影した疑似単純Ｘ線画像とを生成し、学習モデルに第１の方向に投影した疑似単純Ｘ線画像と、第２の方向に投影した疑似単純Ｘ線画像とを入力する。

　好ましくは、メモリは、単純Ｘ線画像と単純Ｘ線画像の疾患ラベルとの追加の学習データセットを記憶し、誤差を取得する処理は、学習モデルが、疾患ラベルを参照して出力した、疑似単純Ｘ線画像に対する推定レポートと、第２の読影レポートとの誤差を取得する。

　好ましくは、メモリは、単純Ｘ線画像と単純Ｘ線画像に対する第３の読影レポートとの追加の学習データセットを記憶し、誤差を取得する処理は、学習モデルが入力された疑似単純Ｘ線画像に基づいて出力した、疑似単純Ｘ線画像に対する推定レポートと第２の読影レポートとの誤差、及び、学習モデルが入力された単純Ｘ線画像に基づいて出力した、単純Ｘ線画像に対する推定レポートと第３の読影レポートとの誤差を取得する。

　本発明の他の態様である学習方法は、プロセッサが、メモリに記憶された３次元情報を有するＸ線ＣＴ画像及びＸ線ＣＴ画像に対する第１の読影レポートの学習データセットを使用して、２次元情報を有する単純Ｘ線画像から読影レポートを生成する学習モデルを学習させる学習方法であって、Ｘ線ＣＴ画像を投影して疑似単純Ｘ線画像を生成し、学習モデルに疑似単純Ｘ線画像を入力するステップと、第１の読影レポートを変換して疑似単純Ｘ線画像に対しての第２の読影レポートを生成するステップと、学習モデルが入力された疑似単純Ｘ線画像に基づいて出力した、疑似単純Ｘ線画像に対する推定レポートと、第２の読影レポートとの誤差を取得するステップと、誤差を使用して、学習モデルを学習させるステップと、を含む。

　好ましくは、第２の読影レポートを生成するステップは、第１の読影レポートに含まれる臓器ラベルを、第２の読影レポートの臓器ラベルに変換することにより、第１の読影レポートから第２の読影レポートを生成する。

　好ましくは、第２の読影レポートを生成するステップは、第１の読影レポートに含まれる疾患ラベルを、第２の読影レポートの疾患ラベルに変換することにより、第１の読影レポートから第２の読影レポートを生成する。

　好ましくは、第２の読影レポートを生成するステップは、第１の読影レポートに対応する第１の知識グラフを、第２の読影レポートに対応する第２の知識グラフに変換し、変換に基づいて、第２の読影レポートを生成する。

　本発明の他の態様である学習プログラムは、上述の学習方法における各ステップの処理を、プロセッサに実行させる。

　本発明の他の態様である学習済みモデルは、上述の学習方法により学習が行われる。

　本発明によれば、３次元情報を有するＸ線ＣＴ画像及びＸ線ＣＴ画像に対する第１の読影レポートの学習データセットから、疑似単純Ｘ線画像と疑似単純Ｘ線に対する第２の読影レポートを生成し、この疑似単純Ｘ線画像と第２の読影レポートとを使用して学習が行われるので、情報量の多いＸ線ＣＴ画像と第１の読影レポートに基づく疑似Ｘ線画像と第２の読影レポートにより学習が行われ、精度の高い読影レポートを出力するように学習を行うことができる。

図１は、学習装置のハードウェア構成の実施形態を示すブロック図である。図２は、学習装置の主な機能を説明するブロック図である。図３は、学習データセットの一例であるＸ線ＣＴ画像と第１の読影レポートとを説明する図である。図４は、疑似画像生成部を説明する図である。図５は、レポート生成部を説明する図である。図６は、レポート生成部が備える臓器ラベル変換リストの例を示す図である。図７は、３次元臓器ラベルと２次元臓器ラベルとの対応関係に関して説明する図である。図８は、疾患ラベル変換リストを説明する図である。図９は、レポート生成部の第１のレポートから第２のレポートの変換に関して説明する図である。図１０は、学習モデル、誤差取得部、及び学習制御部を説明する機能ブロック図である。図１１は、学習装置を使用した学習方法、及びプログラムによりプロセッサが実行する各ステップを説明する図である。図１２は、臥位のＸ線ＣＴ画像を立位のＸ線ＣＴ画像に変換する体位変換部に関して説明する図である。図１３は、疑似画像生成部が２つの方向の疑似Ｘ線画像を生成することを説明する図である。図１４は、レポート生成部が備える解剖知識グラフの変換の例に関して説明する図である。図１５は、Ｘ線ＣＴ画像における解剖知識グラフを概念的に示す図である。図１６は、Ｘ線ＣＴ画像における解剖知識グラフを概念的に示す図である。図１７は、単純Ｘ線画像における解剖知識グラフを概念的に示す図である。図１８は、レポート生成部が備える疾患知識グラフの変換の例に関して示した図である。図１９は、解剖知識グラフ及び疾患知識グラフを備えるレポート生成部の第１のレポートから第２のレポートの変換に関して説明する図である。図２０は、追加の学習データセットを説明する図である。図２１は、学習モデルの学習に関して説明を行う図である。図２２は、追加の学習データセットを説明する図である。図２３は、学習モデルの学習に関して説明を行う図である。

　以下、添付図面にしたがって本発明に係る学習装置、学習方法、学習済みモデル、及びプログラムの好ましい実施の形態について説明する。

　図１は、学習装置のハードウェア構成の実施形態を示すブロック図である。

　図１に示す学習装置１００はコンピュータで構成される。コンピュータは、パーソナルコンピュータであってもよいし、ワークステーションであってもよく、また、サーバコンピュータであってもよい。学習装置１００は、通信部１１２、メモリ（記憶部）１１４、学習モデル１２６、操作部１１６、ＣＰＵ（Central Processing Unit）１１８、ＧＰＵ（Graphics Processing Unit）１１９、ＲＡＭ（Random Access Memory）１２０、ＲＯＭ（Read Only Memory）１２２、及び表示部１２４を備える。なお、ＣＰＵ１１８及びＧＰＵ１１９はプロセッサ１２９を構成する。また、プロセッサ１２９においてＧＰＵ１１９は省略されてもよい。

　通信部１１２は、有線又は無線により外部装置との通信処理を行い、外部装置との間で情報のやり取りを行うインターフェースである。

　メモリ１１４は、例えば、ハードディスク装置、光ディスク、光磁気ディスク、若しくは半導体メモリ、又はこれらの適宜の組み合わせを用いて構成される記憶装置を含んで構成される。メモリ１１４には、学習処理及び／又は画像生成処理等の画像処理に必要な各種プログラムやデータ等が記憶される。メモリ１１４に記憶されているプログラムがＲＡＭ１２０にロードされ、これをプロセッサ１２９が実行することにより、コンピュータは、プログラムで規定される各種の処理を行う手段として機能する。なおメモリには、以下に説明する学習データセットも記憶される。

　操作部１１６は、学習装置１００に対する各種の操作入力を受け付ける入力インターフェースである。操作部１１６は、例えば、キーボード、マウス、タッチパネル、操作ボタン、若しくは、音声入力装置、又はこれらの適宜の組み合わせであってよい。

　プロセッサ１２９は、ＲＯＭ１２２又はメモリ１１４等に記憶された各種のプログラムを読み出し、各種の処理を実行する。ＲＡＭ１２０は、プロセッサ１２９の作業領域として使用される。また、ＲＡＭ１２０は、読み出されたプログラム及び各種のデータを一時的に記憶する記憶部として用いられる。

　表示部１２４は、各種の情報が表示される出力インターフェースである。表示部１２４は、例えば、液晶ディスプレイ、有機ＥＬ（organic electro-luminescence:ＯＥＬ）ディスプレイ、若しくは、プロジェクタ、又はこれらの適宜の組み合わせであってよい。

　学習モデル１２６は、ＣＮＮ（Convolutional Neural Network）で構成される。学習モデル１２６は、後で説明するようにＸ線ＣＴ画像から生成された疑似単純Ｘ線画像が入力され、入力された疑似単純Ｘ線画像に基づいて読影レポートが生成される。学習装置１００における学習モデル１２６は、未学習のものであり、本発明に係る学習装置１００は、学習モデル１２６を機械学習させるものである。

　＜第１の実施形態＞
　第１の実施形態に関して説明する。なお、以下の説明では、胸部を撮影した３次元情報を有するＸ線ＣＴ画像から疑似単純Ｘ線画像を生成し、疑似単純Ｘ線画像の読影レポートを出力する学習モデルの学習に関して説明する。

　図２は、本実施形態の学習装置１００の主な機能を説明するブロック図である。

　学習装置１００は主に、メモリ１１４、プロセッサ１２９、及び学習モデル１２６で構成される（図１参照）。プロセッサ１２９は、学習データ取得部１３０、疑似画像生成部１３２、レポート生成部１３４、誤差取得部１３６、及び学習制御部１３８の機能を実現する。

　学習データ取得部１３０は、メモリ１１４に記憶されている学習に使用する学習データセットを取得する。例えば学習データセットは、患者の胸部を撮影したＸ線ＣＴ画像とそのＸ線画像に対する第１の読影レポートで構成される。なお、第１の読影レポートは、医師等によりＸ線ＣＴ画像を読影することにより作成されたレポートである。

　図３は、学習データセットの一例であるＸ線ＣＴ画像と第１の読影レポート２０６とを説明する図である。

　学習データセット２００は、一組のＸ線ＣＴ画像２０２と第１の読影レポート２０６とで構成されている。メモリ１１４は複数の学習データセット２００を記憶しており、これらの複数の学習データセット２００を使用して学習モデル１２６の学習が行われる。

　Ｘ線ＣＴ画像２０２は、実際に被検体である患者を撮影して得られる。Ｘ線ＣＴ画像２０２は、３次元情報（３次元の空間情報）を有する。したがって、Ｘ線ＣＴ画像２０２に基づいて読影レポート（第１の読影レポート２０６）を生成する場合には、医師は３次元情報により臓器等を観察することができる。したがって、医師は、２次元情報を有する単純Ｘ線画像に基づいて読影レポートを作成する場合に比べて、３次元情報を有するＸ線ＣＴ画像２０２に基づく場合の方が、より詳細に且つ精度の高い読影レポートを作成することができる。なお、Ｘ線ＣＴ画像２０２において、断面６００Ｓ，６００Ｃ，６００Ａはそれぞれサジタル方向、コロナル方向、アキシャル方向の断面である。また、図示した胸部を撮影したＸ線ＣＴ画像２０２はＸ線ＣＴ画像の一例であり、他の部位を撮影したＸ線ＣＴ画像も本実施形態に用いられる。

　第１の読影レポート２０６は、Ｘ線ＣＴ画像２０２から読影された情報を有する。第１の読影レポート２０６は、Ｘ線ＣＴ画像２０２から読影することが可能な解剖学的構造情報を有する。Ｘ線ＣＴ画像２０２は３次元情報を有するので、医師は例えば肺に関してより細かい区域に分けて観察を行うことができる。したがって、第１の読影レポート２０６には、「右区域Ｓ４及びＳ５に不整形な充実性腫瘤を認めます。」と記載されている。また、第１の読影レポート２０６は、Ｘ線ＣＴ画像２０２から読影することが可能な疾患ラベルを有する。Ｘ線ＣＴ画像２０２は３次元情報を有するので、医師は例えば辺縁の形状に関してより詳細な観察を行うことができる。したがって、第１の読影レポート２０６には、「辺縁は鋸歯状でスピキュラを伴い、胸膜陥入像も認めます。」と記載されている。

　学習データ取得部１３０は、学習データセット２００をメモリ１１４から取得し、Ｘ線ＣＴ画像２０２を疑似画像生成部１３２に送り、第１の読影レポート２０６をレポート生成部１３４に送る。

　図４は、疑似画像生成部１３２を説明する図である。

　疑似画像生成部１３２は、入力された３次元情報を有するＸ線ＣＴ画像２０２から２次元情報を有する疑似単純Ｘ線画像２０４を生成する。疑似画像生成部１３２は、様々な手法により、Ｘ線ＣＴ画像２０２から疑似単純Ｘ線画像２０４を生成することができる。例えば疑似画像生成部１３２は、文献（A method to produce and validate a digitally reconstructed radiograph-based computer simulation for optimisation of chest radiographs acquired with a computed radiography imaging system, C S MOORE, The British Journal of Radiology, 84 (2011), 890-902）に記載されているＤＲＲ（post-digitally reconstructed radiograph)手法によって、Ｘ線ＣＴ画像２０２から疑似単純Ｘ線画像２０４の生成を行う。

　図５は、レポート生成部１３４を説明する図である。

　レポート生成部１３４は、入力された第１の読影レポート２０６に基づいて第２の読影レポート２０８を生成する。レポート生成部１３４は、様々な手法により第１の読影レポート２０６から第２の読影レポート２０８を生成することができる。例えばレポート生成部１３４は、変換リストを備え、変換リストに基づいて第１の読影レポート２０６に記載された文言を変換して第２の読影レポート２０８を生成する。具体的にはレポート生成部１３４は、臓器ラベル変換リスト２０５Ａ（図６）を備え、第１の読影レポート２０６で使用されている臓器ラベルを、第２の読影レポート２０８の臓器ラベルに変換することにより、第１の読影レポートから第２の読影レポートを生成する。また、レポート生成部１３４は、疾患ラベル変換リスト２０５Ｂ（図８）を備え、第１の読影レポート２０６で使用されている疾患ラベルを、第２の読影レポート２０８の疾患ラベルに変換することにより、第１の読影レポート２０６から第２の読影レポートを生成する。なお、臓器ラベル変換リスト２０５Ａ及び疾患ラベル変換リスト２０５Ｂは具体例であり、レポート生成部１３４は他の変換リストを備え、その変換リストにより第１の読影レポート２０６から第２の読影レポート２０８を生成してもよい。

　図６は、レポート生成部１３４が備える臓器ラベル変換リスト２０５Ａの例を示す図である。なお、図６では、右肺の臓器ラベル変換リストを示し、左肺の臓器ラベル変換リストの図示は省略されている。

　臓器ラベル変換リスト２０５Ａに示すように、右肺における３次元臓器ラベルの各々は、２次元臓器ラベルに変換される。具体的には、３次元臓器ラベルの右肺の区域Ｓ１～区域Ｓ３は、２次元臓器ラベルでは右肺上Ｔ１となる。また、右区域Ｓ４～右区域Ｓ６は、２次元臓器ラベルでは右肺下Ｔ３となる。また、区域Ｓ７～区域Ｓ１０は、２次元臓器ラベルでは右肺中Ｔ２となる。ここで３次元臓器ラベルは、３次元情報を有するＸ線ＣＴ画像２０２に基づいて比較的細かく区域が分けられている。一方、２次元臓器ラベルは、２次元情報を有する単純Ｘ線画像に対応し、比較的大まかに区域が分けられている。以下に３次元臓器ラベルと２次元臓器ラベルとの対応関係に関して説明する。

　図７は、３次元臓器ラベルと２次元臓器ラベルとの対応関係に関して説明する図である。

　Ｘ線ＣＴ画像２０２から得られる解剖学的構造情報により、臓器ラベル２２０が付される。Ｘ線ＣＴ画像２０２は、臓器の３次元情報を有するので、図示するように左右の各々の肺を１０個の区域（区域Ｓ１～区域Ｓ１０）にラベルが付与される。Ｘ線ＣＴ画像２０２では肺の３次元情報を有するので、肺の表側と裏側を観察することができるので、肺を細かな区域に分けてラベルを付与することができる。

　一方、単純Ｘ線画像は２次元情報を有するので、臓器ラベル２２２が付される。単純Ｘ線画像は、図示するように左右の各々の肺を３個の区域（肺上Ｔ１、肺中Ｔ２、肺下Ｔ３）にラベルが付与される。単純Ｘ線画像では、肺の３次元情報が無いので、肺の表側と裏側を観察することができないので、肺を３個の区域に分けてラベルを付与することができる。なお、上述したＸ線ＣＴ画像２０２及び単純Ｘ線画像における肺の区域の設け方は、一例であり、他の形態で肺の区域を設けてもよい。このように、レポート生成部１３４は、臓器ラベル変換リスト２０５Ａを用いることにより、第１の読影レポート２０６から第２の読影レポート２０８を生成する。

　図８は、レポート生成部１３４が備える疾患ラベル変換リスト２０５Ｂを説明する図である。

　図示した疾患ラベル変換リスト２０５Ｂに示すように、３次元疾患ラベルの各々は、２次元疾患ラベルに変換される。具体的には、３次元疾患ラベルのスピキュラ、鋸歯状、分葉状は、２次元疾患ラベルでは不整形と変換される。また、３次元疾患ラベルの石灰化は、２次元疾患ラベルでは「○○」と変換される。また、３次元疾患ラベルの空洞は、２次元疾患ラベルでは「××」と変換される。ここで、３次元疾患ラベルは、３次元情報を有するＸ線ＣＴ画像２０２に基づいて比較的詳細な疾患ラベルが付される。一方、２次元疾患ラベルは、２次元情報を有する単純Ｘ線画像に対応し、比較大まかな疾患ラベルが付与される。なお、上述したＸ線ＣＴ画像２０２及び単純Ｘ線画像における肺の疾患ラベルは、一例であり、他の形態で肺の疾患ラベルを付与してもよい。このように、レポート生成部１３４は、疾患ラベル変換リスト２０５Ｂを用いることにより、第１の読影レポート２０６から第２の読影レポート２０８を生成する。

　図９は、上述した臓器ラベル変換リスト２０５Ａ及び疾患ラベル変換リスト２０５Ｂを備えるレポート生成部１３４の第１のレポートから第２のレポートの変換に関して説明する図である。

　図示するように、レポート生成部１３４は、臓器ラベル変換リスト２０５Ａに基づいて、第１の読影レポート２０６の「右区域Ｓ４及びＳ５」を「右肺下」に変換して、第２の読影レポート２０８を生成する。また、レポート生成部１３４は、疾患ラベル変換リスト２０５Ｂに基づいて、第１の読影レポート２０６の「鋸歯状でスピキュラ」を「不整形」に変換することにより、第２の読影レポート２０８を生成する。

　以上で説明したように、レポート生成部１３４は、変換リストを備え、その変換リストに基づいて第１の読影レポート２０６から第２の読影レポート２０８を生成する。なお上記では、レポート生成部１３４が変換リストを用いて第１の読影レポート２０６から第２の読影レポート２０８を生成する例について説明したが、本態様はこれに限定されるものではない。例えば、レポート生成部１３４は、学習済みモデルで構成され、第１の読影レポート２０６から第２の読影レポート２０８を生成してもよい。

　図１０は、学習モデル１２６、誤差取得部１３６、及び学習制御部１３８を説明する機能ブロック図である。

　学習モデル１２６は、深層学習（ディープラーニング）モデルの一つである畳み込みニューラルネットワーク（ＣＮＮ）で構成される。

　学習モデル１２６は、複数のレイヤー構造を有し、複数の重みパラメータを保持している。学習モデル１２６は、重みパラメータが初期値から最適値に更新されることで、未学習モデルから学習済みモデルに変化しうる。学習モデル１２６の重みパラメータの初期値は、任意の値でもよいし、例えば、公知の読影レポートを出力する学習済みモデルの重みパラメータを適用してもよい。

　この学習モデル１２６は、入力層１２６Ａと、畳み込み層とプーリング層から構成された複数セットを有する中間層１２６Ｂと、出力層１２６Ｃとを備え、各層は複数の「ノード」が「エッジ」で結ばれる構造となっている。

　入力層１２６Ａには、学習データセット２００のうちの疑似単純Ｘ線画像２０４が入力される。

　中間層１２６Ｂは、畳み込み層やプーリング層などを有し、入力層１２６Ａから入力した画像から特徴を抽出する部分である。畳み込み層は、前の層で近くにあるノードにフィルタ処理し（フィルタを使用した畳み込み演算を行い）、「特徴マップ」を取得する。プーリング層は、畳み込み層から出力された特徴マップを縮小して新たな特徴マップとする。「畳み込み層」は、画像からのエッジ抽出等の特徴抽出の役割を担い、「プーリング層」は抽出された特徴が、平行移動などによる影響を受けないようにロバスト性を与える役割を担う。なお、中間層１２６Ｂには、畳み込み層とプーリング層とが交互に配置される場合に限らず、畳み込み層が連続する場合や正規化層も含まれる。また、最終段の畳み込み層convは、疑似単純Ｘ線画像２０４から読影される事象を示す特徴マップを出力する部分である。

　出力層１２６Ｃは、学習モデル１２６の出力結果（推定レポート２１０）を出力する部分である。

　誤差取得部１３６は、学習モデル１２６の出力層１２６Ｃから出力される出力結果（推定レポート２１０）と、疑似単純Ｘ線画像２０４に対応する第２の読影レポート２０８とを取得し、両者間の誤差を算出する。誤差の算出方法は、例えば、ジャッカード係数やダイス係数を用いることが考えられる。

　学習制御部１３８は、誤差取得部１３６により算出された誤差を元に、誤差逆伝播法により、第２の読影レポート２０８と学習モデル１２６の出力との特徴量空間での距離を最小化させ、又は類似度を最大化させるべく、学習モデル１２６の重みパラメータを調整する。

　このパラメータの調整処理を繰り返し行い、誤差取得部１３６により算出される誤差が収束するまで繰り返し学習を行う。

　このようにして学習用データセットを使用し、重みパラメータが最適化された学習済みの学習モデル１２６を作成する。

　次に、学習装置１００を使用した学習方法に関して説明する。

　図１１は、学習装置１００を使用した学習方法、及び学習プログラムによりプロセッサが実行する各ステップを説明する図である。

　先ず、学習データ取得部１３０は、メモリ１１４に記憶されている学習データセット（Ｘ線ＣＴ画像２０２及び第１の読影レポート２０６）２００を取得する（ステップＳ１０）。その後、Ｘ線ＣＴ画像２０２は疑似画像生成部１３２に送られ、疑似画像生成部１３２はＸ線ＣＴ画像２０２に基づいて疑似単純Ｘ線画像２０４を生成する（ステップＳ１１）。次に、レポート生成部１３４は、臓器ラベル変換リスト２０５Ａに基づいて第１の読影レポート２０６の臓器ラベル２２０を変換する（ステップＳ１２）。また、レポート生成部１３４は、疾患ラベル変換リストに基づいて第１の読影レポート２０６の疾患ラベルを変換する（ステップＳ１３）。このラベルの変換により、レポート生成部１３４は第２の読影レポート２０８を生成する。次に、学習モデル１２６は、入力された疑似単純Ｘ線画像２０４に基づいて推定レポート２１０を出力する（ステップＳ１４）。その後、誤差取得部１３６は、推定レポート２１０と第２の読影レポート２０８との誤差を取得し（ステップＳ１５）、学習制御部１３８は、取得された誤差に基づいて学習モデル１２６を学習させる（ステップＳ１６）。

　以上で説明したように、本実施形態によれば、３次元情報を有するＸ線ＣＴ画像２０２及びＸ線ＣＴ画像２０２に対する第１の読影レポート２０６の学習データセット２００から、疑似単純Ｘ線画像２０４と疑似単純Ｘ線画像２０４に対する第２の読影レポート２０８を生成し、この疑似単純Ｘ線画像２０４と第２の読影レポート２０８とを使用して学習が行われる。これにより、本態様は精度の高い読影レポートを出力するように学習を行うことができる。また、本実施形態の学習方法で学習が行われた学習済みモデルによれば、単純Ｘ線画像が入力されて、入力された単純Ｘ線画像の精度の高い読影レポートを出力することができる。

　＜第２の実施形態＞
　以上で説明した例では、立位のＸ線ＣＴ画像２０２から立位の疑似単純Ｘ線画像２０４が生成される例に関して説明した。しかしながら、本実施形態では、臥位（第１の姿勢）のＸ線ＣＴ画像２０２がメモリ１１４に記憶されている場合でも、立位（第２の姿勢）の疑似単純Ｘ線画像２０４を生成して学習モデル１２６に入力することができる。

　図１２は、臥位のＸ線ＣＴ画像を立位のＸ線ＣＴ画像に変換する体位変換部１５０に関して説明する図である。なお、体位変換部１５０は、例えば学習データ取得部１３０に備えられる。

　体位変換部１５０は、メモリ１１４に記憶された臥位のＸ線ＣＴ画像２０２Ａを立位のＸ線ＣＴ画像に変換する。体位変換部１５０は、様々な手法により臥位のＸ線ＣＴ画像２０２Ａを立位のＸ線ＣＴ画像２０２Ｂに変換することができる。例えば体位変換部１５０は、機械学習が行われた学習済みモデルで構成され、入力された臥位のＸ線ＣＴ画像２０２Ａから立位のＸ線ＣＴ画像２０２Ｂを出力してもよい。

　このように、本実施形態では、臥位のＸ線ＣＴ画像２０２Ａを立位のＸ線ＣＴ画像２０２Ｂに変換する。そして、疑似画像生成部１３２により、変換された立位のＸ線ＣＴ画像２０２Ｂから疑似単純Ｘ線画像２０４が生成される。したがって、臥位で撮影されたＸ線ＣＴ画像でも適切に本実施形態に用いることができる。

　＜第３の実施形態＞
　以上で説明した例では、Ｘ線ＣＴ画像２０２に基づいてＡＰ（Anterior（前）からPosterior（後ろ））像又はＰＡ（Posterior（後ろ）からAnterior（前））像の疑似単純Ｘ線画像２０４に基づいて、推定レポート２１０を生成する例について説明した。しかしながら、本実施形態では、他の方向の像、例えば側方像（Lateral）から、撮影した疑似Ｘ線画像を生成して、その疑似Ｘ線画像に基づいて推定レポート２１０を生成する。

　図１３は、疑似画像生成部１３２が２つの方向の疑似Ｘ線画像を生成することを説明する図である。

　疑似画像生成部１３２は、Ｘ線ＣＴ画像２０２に基づいて、ＡＰ方向（第１の方向）に投影した疑似単純Ｘ線画像２０４ａとＬＡＴ（Lateral）方向（第２の方向）に投影した疑似単純Ｘ線画像２０４ｂとを生成する。疑似画像生成部１３２は、公知の技術により、ＡＰ方向の疑似単純Ｘ線画像２０４ａ及びＬＡＴ方向の疑似単純Ｘ線画像ｂを生成することができる。例えば疑似画像生成部１３２は、上述したＤＲＲ手法により、ＡＰ方向の疑似単純Ｘ線画像２０４ａと、ＬＡＴ方向の疑似単純Ｘ線画像２０４ｂとを生成する。

　このように、本実施形態では、Ｘ線ＣＴ画像２０２に基づいて、ＡＰ方向に投影した疑似単純Ｘ線画像２０４ａとＬＴ方向に投影した疑似単純Ｘ線画像２０４ｂとを生成する。そして、ＡＰ方向に投影した疑似単純Ｘ線画像２０４ａとＬＡＴ方向に投影した疑似単純Ｘ線画像２０４ｂとが学習モデル１２６に入力されるので、より精度高い読影レポートを出力するように学習が行われる。

　＜第４の実施形態＞
　以上で説明した例では、レポート生成部１３４は、臓器ラベル変換リスト２０５Ａ及び疾患ラベル変換リスト２０５Ｂを備える例に関して説明を行った。本実施形態では、レポート生成部１３４は知識グラフを変換し、その変換に基づいて、第１の読影レポート２０６から第２の読影レポート２０８を生成する。具体的には、レポート生成部１３４は、第１の読影レポート２０６に対応する第１の知識グラフを、第２の読影レポート２０８に対応する第２の知識グラフに変換し、その変換に基づいて推定レポート２１０を生成する。例えばレポート生成部１３４は、Ｘ線ＣＴ画像用解剖知識グラフ（第１の知識グラフ）及びＸ線ＣＴ画像用疾患知識グラフ（第１の知識グラフ）を備え、それぞれの知識グラフを単純Ｘ線画像用解剖知識グラフ（第２の知識グラフ）及び単純Ｘ線画像用疾患知識グラフ（第２の知識グラフ）に変換を行う。そして、レポート生成部１３４は、その変換に基づいて第２の読影レポートを生成する。

　図１４は、レポート生成部１３４が備える解剖知識グラフの変換の例に関して説明する図である。

　図１４において、符号２５０では、Ｘ線ＣＴ画像用解剖知識グラフが示されている。Ｘ線ＣＴ画像２０２は、３次元情報を有しているので、肺の区域をより細かく分けることができる。

　図１５及び図１６は、Ｘ線ＣＴ画像２０２における解剖知識グラフを概念的に示す図である。図１５は肺の内側面から見た場合の区域を示す図であり、図１６は肺の外側面から見た場合の区域を示す図である。

　図１５における符号２６０及び図１６における符号２６４では、右肺の区域が示されている。右肺はＳ１～Ｓ１０の１０個の区域に分けられている。なお、Ｓ４区域は、内側面から観察することができないので図１６において図示されている。一方、図１５における符号２６２及び図１６における符号２６６では、左肺の区域が示されている。左肺は、右肺と同様にＳ１～Ｓ１０の区域に分けられているが、Ｓ１とＳ２とは同じ区域（Ｓ１＋２と表記）であるので、９個の区域に分けられている。このように、Ｘ線ＣＴ画像２０２では、３次元情報を有しているので、上述したように右肺及び左肺の各々をＳ１区域からＳ１０区域に分けることができる。

　図１４において、符号２５２及び符号２５４で示した解剖知識グラフは、単純Ｘ線画像（ＡＰ像及びＬａｔｅｒａｌ像）のものである。単純Ｘ線画像では、ＡＰ像では右肺及び左肺の各々を３つの区域に、Ｌａｔｅｒａｌ像では肺を２つの区域に分けている。

　図１７は、単純Ｘ線画像における解剖知識グラフを概念的に示す図である。

　ＡＰ像の単純Ｘ線画像２６８ａの右肺は、右肺上部Ｕ１、右肺中部Ｕ２、右肺下部Ｕ３の区域が設けられ、左肺は、左肺上部Ｕ４、左肺中部Ｕ５、左肺下部Ｕ６の区域が設けられる。また、Ｌａｔｅｒａｌ像の単純Ｘ線画像２６８ｂの肺は、上部Ｕ７、及び下部Ｕ８の区域が設けられている。

　図１４で示した、Ｘ線ＣＴ画像用解剖知識グラフ２５０では、肺は右肺と左肺とに分岐し、左肺は左上葉と左下葉に分岐する。左上葉は、左Ｓ１＋Ｓ２区域、左Ｓ３区域、左Ｓ４区域左Ｓ５区域に分岐する。左下葉は、左Ｓ６区域、左Ｓ８区域、左Ｓ９区域、及び左Ｓ１０区域に分岐する。右肺は、右上葉、右中葉、及び右下葉に分岐する。右上葉は右Ｓ１区域、右Ｓ２区域、及び右Ｓ３区域に分岐する。右中葉は右Ｓ４区域、及び右Ｓ５区域に分岐する。右下葉は右Ｓ６区域、右Ｓ８区域、右Ｓ９区域、及び右Ｓ１０区域に分岐する。

　図１４で示した、単純Ｘ線画像用解剖知識グラフでは、ＡＰ像の単純Ｘ線画像２６８ａの解剖知識グラフと、Ｌａｔｅｒａｌ像の単純Ｘ線画像２６８ｂの解剖知識グラフとが示されている。ＡＰ像の単純Ｘ線画像の解剖知識グラフでは肺は左肺と右肺に分岐される。左肺は、左上部、左中部、及び左下部に分岐される。また、右肺は、右上部、右中部、及び右下部に分岐される。また、Ｌａｔｅｒａｌ方向の単純Ｘ線画像の解剖知識グラフでは上部と下部とに分岐される。そして、レポート生成部１３４は、図１４の矢印で示すようにＸ線ＣＴ画像用解剖知識グラフ２５０から、単純Ｘ線画像用解剖知識グラフ２５２及び２５４に変換し、この変換に基づいて第１の読影レポート２０６から第２の読影レポート２０８を生成する。

　図１８は、レポート生成部１３４が備える疾患知識グラフの変換の例に関して示した図である。

　図１８に示した疾患知識グラフは、結節に関する疾患知識グラフでの例である。なお、図１８では知識グラフで表記すると煩雑になるので、テーブルとして記載している。

　Ｘ線ＣＴ画像用疾患知識グラフ２７０は、カテゴリが吸収値、境界、形状、辺縁性状、内部性状、周辺組織との関係に分岐される。吸収値の分類対象（クラス）は、充実性、部分充実側、すりガラス型に分類される。境界は、明瞭と不明瞭とに分類される。形状は、不整形と類円型とに分類される。辺縁性状は、不整、平滑、鋸歯状、スピキュラ、分葉状、直線状に分類される。内部性状は、気管支透亮像、石灰化、空洞、脂肪に分類される。周辺組織との関係は、胸膜陥入と胸膜接触とに分類される。

　一方、単純Ｘ線画像用疾患知識グラフ２７２では、吸収値は、肺組織と同様の吸収係数のため視認が容易でないので、充実性にのみ分類される。境界は、Ｘ線ＣＴ画像用疾患知識グラフ２７０と同様に、明瞭、不明瞭に分類される。形状も、Ｘ線ＣＴ画像用疾患知識グラフ２７０と同様に、不整形、類円型に分類される。単純Ｘ線画像では全体的な形状しか視認できないので、辺縁性状の記載はされない。内部性状は、骨と同等の吸収係数のため視認可能となり、石灰化が分類される。周辺組織との関係は、撮影方向によっては胸膜陥入と胸膜接触とに分類される。そして、レポート生成部１３４は、図１８の矢印で示すようにＸ線ＣＴ画像用疾患知識グラフ２７０から、単純Ｘ線画像用疾患知識グラフ２７２に変換し、この変換に基づいて第１の読影レポート２０６から第２の読影レポート２０８を生成する。

　図１９は、上述した解剖知識グラフ及び疾患知識グラフを備えるレポート生成部１３４の第１のレポートから第２のレポートの変換に関して説明する図である。

　レポート生成部１３４は、解剖知識グラフの変換に基づいて、第１の読影レポート２８０の「右区域Ｓ４及びＳ５」を「右肺下」に変換して、第２の読影レポート２８２を生成する。また、レポート生成部１３４は、疾患知識グラフの変換に基づいて、第１の読影レポート２８０の「辺縁は鋸歯状でスピキュラを伴い、」を削除することにより、第２の読影レポート２８２を生成する。

　以上で説明したように、本実施形態では、レポート生成部１３４は、解剖知識グラフ及び疾患知識グラフをＸ線ＣＴ画像用から単純Ｘ線画像用に変換し、その変換に基づいて、第１の読影レポート２８０から第２の読影レポート２８２を生成する。

　＜第５の実施形態＞
　＜第１の例＞
　次に、学習モデル１２６の学習の他の実施形態（第１の例）に関して説明する。上述した実施形態では、学習モデル１２６に疑似単純Ｘ線画像２０４を入力して、学習モデル１２６から出力される推定レポートと第２の読影レポートとの誤差を最小にするように、学習が行われる例について説明を行った。本例では、前述の学習に加えて追加の学習データセットである実Ｘ線画像及び実Ｘ線画像の疾患ラベルを利用して学習モデル１２６の学習が行われる。

　図２０は、本例で使用される追加の学習データセットを説明する図である。

　追加の学習データセット３００は、実単純Ｘ線画像３０２及び疾患ラベル３０４で構成される。ここで、実単純Ｘ線画像３０２は、胸部を例えばＡＰ方向で実際に撮影を行ったＸ線画像である。また、疾患ラベル３０４は、実単純Ｘ線画像３０２を医師が読影することにより付与されたラベルであり、例えば結節の有無を示すラベルである。追加の学習データセットは、具体的には、NIH(National institutes of health) Chest X-ray Dataset等で取得される。

　図２１は、本例における学習モデル１２６の学習に関して説明を行う図である。

　本例では、学習モデル１２６に疑似単純Ｘ線画像２０４と実単純Ｘ線画像３０２とが入力される。なお、学習モデル１２６には、例えば疑似単純Ｘ線画像２０４と実単純Ｘ線画像３０２とが交互に入力される。そして、学習モデル１２６は推定レポート２１０を出力する。ここで、疑似単純Ｘ線画像２０４と実単純Ｘ線画像３０２とは、同じ被検体に関しての画像としているが、異なる被写体であってもよい。

　学習モデル１２６は、DenseNet（Densely connected convolutional networks）１２７Ａと知識グラフ１２７Ｂとで構成されている。ここでDenseNet１２７Ａは、複数の密ブロック（Dense Block）と、密ブロックの前後の複数の遷移層（Transition Layer）とを含み、クラス分類（例えば疾患検出）のタスクで高い性能を示すネットワーク構造を有する。密ブロック内では、スキップ接続を全ての層に課すことで、勾配消失の削減を行う。遷移層としては、畳み込み層及び／又はプーリング層が設けられている。また、知識グラフ１２７Ｂから読影レポートを出力する手法としては例えば、文献（Li, Christy Y., et al. "Knowledge-driven encode, retrieve, paraphrase for medical image report generation.", AAAI, 2019.）に記載された技術が使用される。知識グラフ１２７Ｂは、DenseNet１２７Ａからの出力に基づいて推定レポート２１０を出力する。知識グラフ１２７Ｂは例えば、解剖知識グラフ３０６及び疾患知識グラフ３０８で構成される。ここで、疑似Ｘ線画像から疾患知識グラフへの変換の学習において、実Ｘ線画像と疾患ラベルとを用いて補助を行う。具体的には、学習モデル１２６の知識グラフ１２７Ｂの部分空間に疾患ラベル（結節の有無）を加えて、実Ｘ線画像に結節の有無のラベルを誤差に加える。これにより、学習モデル１２６は、疾患ラベル３０４を参照して推定レポート２１０を出力することになり、より精度の高い読影レポートを出力するように学習が行われる。

　＜第２の例＞
　次に、学習モデル１２６の学習の他の実施形態（第２の例）に関して説明する。本例では、前述の学習に加えて追加の学習データセットである実Ｘ線画像及び実Ｘ線画像の疾患ラベルを利用して学習モデル１２６の学習が行われる。

　図２２は、本例で使用される追加の学習データセットを説明する図である。

　追加の学習データセット３２０は、実単純Ｘ線画像３０２及び読影レポート（第３の読影レポート）３２２で構成される。ここで、読影レポート３２２は、例えば医師が実単純Ｘ線画像３０２を実際に読影し作成した読影レポートである。

　図２３は、本例における学習モデル１２６の学習に関して説明を行う図である。なお、既に説明を行った箇所は同じ符号を付し説明は省略する。

　本例では、学習モデル１２６に疑似単純Ｘ線画像２０４と実単純Ｘ線画像３０２とが入力される。なお、学習モデル１２６には、例えば疑似単純Ｘ線画像２０４と実単純Ｘ線画像３０２とが交互に入力される。そして、学習モデル１２６は、疑似単純Ｘ線画像２０４に対する推定レポート２１０と、実単純Ｘ線画像３０２に対する推定レポート３２４とを出力する。ここで、疑似単純Ｘ線画像２０４と実単純Ｘ線画像３０２とで同一のDenseNet１２７Ａと知識グラフ１２７Ｂとを使用して学習が行われる。具体的には、疑似単純Ｘ線画像２０４が入力された場合には、前述したように推定レポート２１０を出力し、推定レポート２１０と第２の読影レポートとの誤差により、学習モデル１２６の学習が行われる。一方、実単純Ｘ線画像３０２が入力された場合には、同じくDenseNet１２７Ａと知識グラフ１２７Ｂとを介して、推定レポート３２４が出力される。そして、誤差取得部１３６は、出力された推定レポート３２４と追加の学習データセット３２０の一部の読影レポート３２２との誤差を取得し、学習制御部１３８はその誤差に基づいて学習モデル１２６の学習を行わせる。

　以上で説明したように、学習モデル１２６は、疑似単純Ｘ線画像２０４を使用した学習に加えて実単純Ｘ線画像３０２を使用した学習が行われる。このような学習により、より精度の高い読影レポートを出力する学習済みモデルを生成することができる。

　＜その他＞
　上記実施形態において、各種の処理を実行する処理部（processing unit）のハードウェア的な構造は、次に示すような各種のプロセッサ（processor）である。各種のプロセッサには、ソフトウェア（プログラム）を実行して各種の処理部として機能する汎用的なプロセッサであるＣＰＵ（Central Processing Unit）、ＦＰＧＡ（Field Programmable Gate Array）などの製造後に回路構成を変更可能なプロセッサであるプログラマブルロジックデバイス（Programmable Logic Device：ＰＬＤ）、ＡＳＩＣ（Application Specific Integrated Circuit）などの特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路などが含まれる。

　１つの処理部は、これら各種のプロセッサのうちの１つで構成されていてもよいし、同種又は異種の２つ以上のプロセッサ（例えば、複数のＦＰＧＡ、あるいはＣＰＵとＦＰＧＡの組み合わせ）で構成されてもよい。また、複数の処理部を１つのプロセッサで構成してもよい。複数の処理部を１つのプロセッサで構成する例としては、第１に、クライアントやサーバなどのコンピュータに代表されるように、１つ以上のＣＰＵとソフトウェアの組合せで１つのプロセッサを構成し、このプロセッサが複数の処理部として機能する形態がある。第２に、システムオンチップ（System On Chip：ＳｏＣ）などに代表されるように、複数の処理部を含むシステム全体の機能を１つのＩＣ（Integrated Circuit）チップで実現するプロセッサを使用する形態がある。このように、各種の処理部は、ハードウェア的な構造として、上記各種のプロセッサを１つ以上用いて構成される。

　さらに、これらの各種のプロセッサのハードウェア的な構造は、より具体的には、半導体素子などの回路素子を組み合わせた電気回路（circuitry）である。

　上述の各構成及び機能は、任意のハードウェア、ソフトウェア、或いは両者の組み合わせによって適宜実現可能である。例えば、上述の処理ステップ（処理手順）をコンピュータに実行させるプログラム、そのようなプログラムを記録したコンピュータ読み取り可能な記録媒体（非一時的記録媒体）、或いはそのようなプログラムをインストール可能なコンピュータに対しても本発明を適用することが可能である。

　以上で本発明の例に関して説明してきたが、本発明は上述した実施の形態に限定されず、本発明の趣旨を逸脱しない範囲で種々の変形が可能であることは言うまでもない。

１００　　：学習装置
１１２　　：通信部
１１４　　：メモリ
１１６　　：操作部
１１８　　：ＣＰＵ
１２０　　：ＲＡＭ
１２２　　：ＲＯＭ
１２４　　：表示部
１２６　　：学習モデル
１２９　　：プロセッサ
１３０　　：学習データ取得部
１３２　　：疑似画像生成部
１３４　　：レポート生成部
１３６　　：誤差取得部
１３８　　：学習制御部
２００　　：学習データセット
２０２　　：Ｘ線ＣＴ画像
２０４　　：疑似単純Ｘ線画像
２０５Ａ　：臓器ラベル変換リスト
２０５Ｂ　：疾患ラベル変換リスト
２０６　　：第１の読影レポート
２０８　　：第２の読影レポート
２１０　　：推定レポート

Claims

　プロセッサと、３次元情報を有するＸ線ＣＴ画像及び前記Ｘ線ＣＴ画像に対する第１の読影レポートの学習データセットを記憶するメモリと、２次元情報を有する単純Ｘ線画像から読影レポートを生成する学習モデルと、を備える学習装置であって、
　前記プロセッサは、
　前記Ｘ線ＣＴ画像を投影して疑似単純Ｘ線画像を生成し、前記学習モデルに前記疑似単純Ｘ線画像を入力する処理と、
　前記第１の読影レポートを変換して前記疑似単純Ｘ線画像に対しての第２の読影レポートを生成する処理と、
　前記学習モデルが入力された前記疑似単純Ｘ線画像に基づいて出力した、前記疑似単純Ｘ線画像に対する推定レポートと、前記第２の読影レポートとの誤差を取得する処理と、
　前記誤差を使用して、前記学習モデルを学習させる処理と、
　を行う学習装置。
　前記第２の読影レポートを生成する処理は、前記第１の読影レポートに含まれる臓器ラベルを、前記第２の読影レポートの臓器ラベルに変換することにより、前記第１の読影レポートから前記第２の読影レポートを生成する請求項１に記載の学習装置。
　前記第２の読影レポートを生成する処理は、前記第１の読影レポートに含まれる疾患ラベルを、前記第２の読影レポートの疾患ラベルに変換することにより、前記第１の読影レポートから前記第２の読影レポートを生成する請求項１又は２に記載の学習装置。
　前記第２の読影レポートを生成する処理は、
　前記第１の読影レポートに対応する第１の知識グラフを、前記第２の読影レポートに対応する第２の知識グラフに変換し、前記変換に基づいて、前記第２の読影レポートを生成する請求項１に記載の学習装置。
　前記メモリは、第１の姿勢の被検体を撮影した前記Ｘ線ＣＴ画像を記憶し、前記学習モデルは、第２の姿勢の被検体を撮影した前記単純Ｘ線画像から読影レポートを生成する場合には、
　前記疑似単純Ｘ線画像を入力する処理は、前記第１の姿勢の前記Ｘ線ＣＴ画像から前記第２の姿勢の前記疑似単純Ｘ線画像を生成して、前記学習モデルに前記第２の姿勢の前記疑似単純Ｘ線画像を入力する請求項１から４のいずれか１項に記載の学習装置。
　前記疑似単純Ｘ線画像を入力する処理は、前記Ｘ線ＣＴ画像から第１の方向に投影した前記疑似単純Ｘ線画像と、第２の方向に投影した前記疑似単純Ｘ線画像とを生成し、前記学習モデルに前記第１の方向に投影した前記疑似単純Ｘ線画像と、前記第２の方向に投影した前記疑似単純Ｘ線画像とを入力する請求項１から５のいずれか１項に記載の学習装置。
　前記メモリは、前記単純Ｘ線画像と前記単純Ｘ線画像の疾患ラベルとの追加の学習データセットを記憶し、
　前記誤差を取得する処理は、前記学習モデルが、前記疾患ラベルを参照して出力した、前記疑似単純Ｘ線画像に対する前記推定レポートと、前記第２の読影レポートとの誤差を取得する請求項１から６のいずれか１項に記載の学習装置。
　前記メモリは、前記単純Ｘ線画像と前記単純Ｘ線画像に対する第３の読影レポートとの追加の学習データセットを記憶し、
　前記誤差を取得する処理は、前記学習モデルが入力された前記疑似単純Ｘ線画像に基づいて出力した、前記疑似単純Ｘ線画像に対する推定レポートと前記第２の読影レポートとの誤差、及び、前記学習モデルが入力された前記単純Ｘ線画像に基づいて出力した、前記単純Ｘ線画像に対する推定レポートと前記第３の読影レポートとの誤差を取得する請求項１から６のいずれか１項に記載の学習装置。
　プロセッサが、メモリに記憶された３次元情報を有するＸ線ＣＴ画像及び前記Ｘ線ＣＴ画像に対する第１の読影レポートの学習データセットを使用して、２次元情報を有する単純Ｘ線画像から読影レポートを生成する学習モデルを学習させる学習方法であって、
　前記Ｘ線ＣＴ画像を投影して疑似単純Ｘ線画像を生成し、前記学習モデルに前記疑似単純Ｘ線画像を入力するステップと、
　前記第１の読影レポートを変換して前記疑似単純Ｘ線画像に対しての第２の読影レポートを生成するステップと、
　前記学習モデルが入力された前記疑似単純Ｘ線画像に基づいて出力した、前記疑似単純Ｘ線画像に対する推定レポートと、前記第２の読影レポートとの誤差を取得するステップと、
　前記誤差を使用して、前記学習モデルを学習させるステップと、
　を含む学習方法。
　前記第２の読影レポートを生成するステップは、前記第１の読影レポートに含まれる臓器ラベルを、前記第２の読影レポートの臓器ラベルに変換することにより、前記第１の読影レポートから前記第２の読影レポートを生成する請求項９に記載の学習方法。
　前記第２の読影レポートを生成するステップは、前記第１の読影レポートに含まれる疾患ラベルを、前記第２の読影レポートの疾患ラベルに変換することにより、前記第１の読影レポートから前記第２の読影レポートを生成する請求項９又は１０に記載の学習方法。
　前記第２の読影レポートを生成するステップは、
　前記第１の読影レポートに対応する第１の知識グラフを、前記第２の読影レポートに対応する第２の知識グラフに変換し、前記変換に基づいて、前記第２の読影レポートを生成する請求項９に記載の学習方法。
　請求項９から１２のいずれか１項に記載の学習方法における各ステップの処理を、前記プロセッサに実行させる学習プログラム。
　非一時的かつコンピュータ読取可能な記録媒体であって、請求項１３に記載のプログラムが記録された記録媒体。
　請求項９から１２のいずれか１項に記載の学習方法により学習が行われた学習済みモデル。