WO2023224022A1

WO2023224022A1 - プログラム、情報処理方法、及び情報処理装置

Info

Publication number: WO2023224022A1
Application number: PCT/JP2023/018208
Authority: WO
Inventors: 圭亮上村; 伸彦菅野; 正樹 ▲高▼尾; 英敏濱田; 嘉伸佐藤; 義人大竹; 懿谷; まあぜん崇風
Original assignee: 国立大学法人大阪大学; 国立大学法人奈良先端科学技術大学院大学
Priority date: 2022-05-20
Filing date: 2023-05-16
Publication date: 2023-11-23

Abstract

少ない症例数で高精度にＸ線画像から体組織量に関する情報を取得することが可能なプログラム等を提供する。コンピュータは、対象部位のＸ線画像と、前記対象部位のＣＴ（Computed Tomography：コンピュータ断層撮影）画像から得られる体組織量に関する情報とを含む訓練データを取得する。そして、コンピュータは、取得した訓練データを用いて、Ｘ線画像を入力した場合に前記Ｘ線画像中の対象部位の体組織量に関する情報を出力する学習モデルを生成する。

Description

プログラム、情報処理方法、及び情報処理装置

　本開示は、プログラム、情報処理方法、及び情報処理装置に関する。

　高齢者の骨折は、生活機能の低下を招き、要介護状態となる可能性がある。そこで、骨密度を計測して骨粗鬆症の診断を行い、適切な治療を早期に行うことによって、骨折を予防することが重要であると考えられている。骨密度の計測には、２種類のエネルギーレベルのＸ線の透過率の差に基づいて骨密度（骨量）を測定するＤＸＡ（Dual-energy X-ray Absorptiometry：二重エネルギーＸ線吸収測定）装置を使用することが推奨されている。しかし、ＤＸＡ装置は、被検者を臥位姿勢で撮影するベッドタイプの装置であるので、設置スペースを確保する必要があり、また、高価格にもかかわらず用途が限られることから普及率は低い。

　一方、レントゲン装置（Ｘ線装置）は多くの医療機関に設置されている。そこで、非特許文献１～３では、Ｘ線画像とＤＸＡ装置による計測結果（骨密度）とのペアを訓練データに用いて学習することにより、Ｘ線画像から骨密度を予測するモデルを生成する技術が提案されている。

Chen-I Hsieh et al.，「Automated bone mineral density prediction and fracture risk assessment using plain radiographs via deep learning」，NATURE COMMUNICATIONS，12:5472（2021） Ryoungwoo Jang et al.，「Prediction of osteoporosis from simple hip radiography using deep learning algorithm」，Scientific Reports，11:19997（2021） Norio Yamamoto et al.，「Deep Learning for Osteoporosis Classification Using Hip Radiographs and Patient Clinical Covariates」，Biomolecules 2020,10,1534

　しかし、非特許文献１～３に開示された技術では、大量の訓練データを学習する必要があり、訓練データの収集処理及び学習処理の処理負担が大きい。

　本開示は、少ない症例数で高精度にＸ線画像から体組織量に関する情報を取得することが可能なプログラム等を提供することを目的とする。

　本開示の一態様に係るプログラムは、対象部位のＸ線画像と、前記対象部位のＣＴ（Computed Tomography：コンピュータ断層撮影）画像から得られる体組織量に関する情報とを含む訓練データを取得し、取得した訓練データを用いて、Ｘ線画像を入力した場合に前記Ｘ線画像中の対象部位の体組織量に関する情報を出力する学習モデルを生成する処理をコンピュータに実行させる。

　本開示の一態様にあっては、少ない症例数で高精度にＸ線画像から体組織量に関する情報を取得することができる。

情報処理装置の構成例を示すブロック図である。学習モデルの概要を示す説明図である。学習モデルの概要を示す説明図である。学習モデルの概要を示す説明図である。訓練データの生成処理手順の一例を示すフローチャートである。訓練用のＤＲＲ画像の生成処理の説明図である。学習モデルの生成処理手順の一例を示すフローチャートである。骨密度の推定処理手順の一例を示すフローチャートである。画面例を示す説明図である。予測ＤＲＲ画像から推定された骨密度と、ＤＸＡ装置で計測された骨密度との関係を示す図表である。予測ＤＲＲ画像から推定された骨密度と、ＤＸＡ装置で計測された骨密度との関係を示す図表である。実施形態２の学習モデルの概要を示す説明図である。実施形態２の訓練データの生成処理手順の一例を示すフローチャートである。実施形態２の骨密度の推定処理手順の一例を示すフローチャートである。画面例を示す説明図である。実施形態３の学習モデルの概要を示す説明図である。実施形態３の訓練データの生成処理手順の一例を示すフローチャートである。筋肉量の推定処理手順の一例を示すフローチャートである。画面例を示す説明図である。実施形態４の骨密度の推定処理手順の一例を示すフローチャートである。画面例を示す説明図である。実施形態５の骨密度及び筋肉量の推定処理手順の一例を示すフローチャートである。画面例を示す説明図である。位置合わせ処理手順の一例を示すフローチャートである。位置合わせ処理の説明図である。位置合わせ処理の説明図である。位置合わせ処理の説明図である。位置合わせ処理の説明図である。実施形態７の訓練データの生成処理手順の一例を示すフローチャートである。骨領域に基づく位置合わせ処理の効果を示す説明図である。骨領域に基づく位置合わせ処理の効果を示す説明図である。実施形態８の学習モデルの構成例を示す説明図である。筋肉量に関する損失のフィードバック処理の効果を示す説明図である。筋肉量に関する損失のフィードバック処理の効果を示す説明図である。

　以下に、本開示のプログラム、情報処理方法、及び情報処理装置について、その実施形態を示す図面に基づいて説明する。

（実施形態１）
　対象部位をＸ線装置で撮影したＸ線画像に基づいて、対象部位の骨密度（体組織量に関する情報）を推定する情報処理装置について説明する。骨量減少及び骨粗鬆症の診断には一般的に腰椎又は大腿骨近位部の骨密度が用いられる。従って、本実施形態では、対象部位を大腿骨近位部とし、大腿骨近位部を撮影範囲内に含むＸ線画像（股関節Ｘ線正面画像）から大腿骨近位部の骨密度を推定する構成について説明する。しかし、対象部位は大腿骨近位部に限定されず、腰椎、胸椎等、他の部位であってもよい。

　図１は情報処理装置の構成例を示すブロック図である。情報処理装置１０は、種々の情報処理及び情報の送受信が可能な装置であり、例えばパーソナルコンピュータ、サーバコンピュータ、ワークステーション等である。情報処理装置１０は、医療機関、検査機関又は研究機関等に設置されて利用される。情報処理装置１０は、複数のコンピュータを含んで構成されるマルチコンピュータであってもよく、１台の装置内に仮想的に構築された仮想マシンによって実現されてもよい。情報処理装置１０をサーバコンピュータで構成する場合、情報処理装置１０は、医療機関等に設置されたローカルサーバであってもよく、インターネット等のネットワークを介して通信接続されたクラウドサーバであってもよい。以下では、情報処理装置１０が１台のコンピュータであるものとして説明する。

　情報処理装置１０は、例えば股関節Ｘ線正面画像に基づいて、大腿骨近位部の骨密度を推定する。具体的には後述のように、情報処理装置１０は、所定の訓練データを学習する機械学習を事前に行い、股関節Ｘ線正面画像を入力として、当該股関節Ｘ線正面画像中の大腿骨近位部の骨密度に関する情報（体組織量に関する情報）を出力する学習モデル１２Ｍを用意しておく。そして、情報処理装置１０は、股関節Ｘ線正面画像を学習モデル１２Ｍに入力することで、大腿骨近位部の骨密度に関する情報を学習モデル１２Ｍから取得する。本実施形態では、骨密度に関する情報として、ＣＴ画像中の大腿骨近位部３次元領域の投影像であるＤＲＲ画像（Digital Reconstructed Radiograph：ＣＴ画像の特定部位の３次元領域（関心領域）から投影シミュレーションにより得られるＸ線画像）を用いる。ＣＴ画像の各画素値は、骨密度に対応したＣＴ値であるので、ＣＴ画像中の特定の骨領域から生成されるＤＲＲ画像は、骨密度の分布を示すことができ、例えば骨密度が高いほど高い輝度値（画素値）となる。従って、本実施形態の学習モデル１２Ｍは、股関節Ｘ線正面画像が入力された場合に、Ｘ線画像内に含まれている大腿骨近位部のＤＲＲ画像（体組織量を表す画像）を予測して出力するように構成されている。また、情報処理装置１０は、学習モデル１２Ｍを用いて予測されたＤＲＲ画像から、当該大腿骨近位部の骨密度を算出することにより、Ｘ線画像から骨密度を取得することができる。骨は密度が低下するとＸ線画像中の撮影状態が変化するので、本実施形態では、学習モデル１２Ｍを用いて、Ｘ線画像中の骨領域の骨密度の状態に対応したＤＲＲ画像を予測することができる。

　情報処理装置１０は、制御部１１、記憶部１２、通信部１３、入力部１４、表示部１５、読み取り部１６等を有し、これらの各部はバスを介して相互に接続されている。制御部１１は、ＣＰＵ（Central Processing Unit）、ＭＰＵ（Micro-Processing Unit）、ＧＰＵ（Graphics Processing Unit）、ＡＩチップ（ＡＩ用半導体）等の１又は複数のプロセッサを含む。制御部１１は、記憶部１２に記憶してあるプログラム１２Ｐを適宜実行することにより、情報処理装置１０が行うべき処理を実行する。

　記憶部１２は、ＲＡＭ（Random Access Memory）、フラッシュメモリ、ハードディスク、ＳＳＤ（Solid State Drive）等を含む。記憶部１２は、制御部１１が実行するプログラム１２Ｐ（プログラム製品）及びプログラム１２Ｐの実行に必要な各種のデータ等を予め記憶している。また記憶部１２は、制御部１１がプログラム１２Ｐを実行する際に発生するデータ等を一時的に記憶する。更に記憶部１２は、後述する学習モデル１２Ｍを記憶する。学習モデル１２Ｍは、股関節Ｘ線正面画像が入力された場合に、当該Ｘ線画像内に含まれている大腿骨近位部のＤＲＲ画像を出力するように学習されたモデルである。学習モデル１２Ｍは、人工知能ソフトウェアを構成するプログラムモジュールとしての利用が想定される。記憶部１２には、学習モデル１２Ｍを定義する情報として、学習モデル１２Ｍが備える層の情報、各層を構成するノードの情報、ノード間の重み（結合係数）等の情報が記憶される。

　また記憶部１２は、医療画像ＤＢ１２ａ及び訓練ＤＢ１２ｂを記憶する。医療画像ＤＢ１２ａは、学習モデル１２Ｍの学習用に用意された股関節Ｘ線正面画像及びＣＴ画像が対応付けて記憶してある。学習用に用いる医療画像には、ＤＸＡ装置によって骨密度正常症例、骨粗鬆症例、骨量減少例のいずれかと診断された被検者の股関節Ｘ線正面画像及びＣＴ画像が含まれる。訓練ＤＢ１２ｂは、学習モデル１２Ｍの学習処理に用いられる訓練データを記憶しており、情報処理装置１０が後述する訓練データの生成処理を行うことにより、訓練ＤＢ１２ｂに訓練データが記憶される。学習モデル１２Ｍ、医療画像ＤＢ１２ａ及び訓練ＤＢ１２ｂは、情報処理装置１０に接続された他の記憶装置に記憶されてもよく、情報処理装置１０が通信可能な他の記憶装置に記憶されてもよい。

　通信部１３は、有線通信又は無線通信によって、インターネット又はＬＡＮ（Local Area Network）等のネットワークＮに接続するための通信モジュールであり、ネットワークＮを介して他の装置との間で情報の送受信を行う。入力部１４は、ユーザによる操作入力を受け付け、操作内容に対応した制御信号を制御部１１へ送出する。表示部１５は、液晶ディスプレイ又は有機ＥＬディスプレイ等であり、制御部１１からの指示に従って各種の情報を表示する。入力部１４の一部及び表示部１５は一体として構成されたタッチパネルであってもよい。なお、入力部１４及び表示部１５は必須ではなく、情報処理装置１０は、接続されたコンピュータを通じて操作を受け付け、表示すべき情報を外部の表示装置へ出力する構成でもよい。

　読み取り部１６は、ＣＤ（Compact Disc）、ＤＶＤ（Digital Versatile Disc）、ＵＳＢ（Universal Serial Bus）メモリ、ＳＤカード、マイクロＳＤカード、コンパクトフラッシュ（登録商標）等の可搬型記憶媒体１０ａに記憶された情報を読み取る。記憶部１２に記憶されるプログラム１２Ｐ（プログラム製品）及び各種のデータは、制御部１１が読み取り部１６を介して可搬型記憶媒体１０ａから読み取って記憶部１２に記憶してもよく、制御部１１が通信部１３を介して他の装置からダウンロードして記憶部１２に記憶してもよい。

　図２～図３Ｂは学習モデル１２Ｍの概要を示す説明図である。なお、図２は股関節Ｘ線正面画像の半割画像から大腿骨近位部の関心領域のＤＲＲ画像が予測される様子を概念的に示しており、図３Ａ及び図３Ｂは学習モデル１２Ｍの学習時の様子を概念的に示している。また、図３Ａは識別器の学習時の様子を示し、図３Ｂは生成器の学習時の様子を示す。図２に示すように、学習モデル１２Ｍは、股関節Ｘ線正面画像における、骨密度の推定対象とする側の大腿骨近位部を含む半割画像を入力として、関心領域のＤＲＲ画像を予測するように学習済みのモデルである。なお、学習モデル１２Ｍに入力される半割Ｘ線画像は、左大腿骨近位部を含むＸ線画像であってもよく、右大腿骨近位部を含むＸ線画像であってもよい。右大腿骨近位部を含むＸ線画像を学習モデル１２Ｍに入力する場合、半割Ｘ線画像を左右反転させた後に学習モデル１２Ｍに入力する。これにより、左大腿骨近位部の計測だけでなく右大腿骨近位部の計測も可能である。

　本実施形態では、学習モデル１２ＭとしてＧＡＮ（Generative Adversarial Network）を用いる。図２～図３Ｂに示す学習モデル１２Ｍはｐｉｘ２ｐｉｘで構成されている。ＧＡＮは、入力データから出力データを生成する生成器（Generator）と、生成器が生成したデータの真偽を識別する識別器（Discriminator）とを備え、生成器及び識別器が競合して敵対的に学習を行うことでネットワークを構築する。生成器は、入力データから潜在変数を抽出するエンコーダと、抽出した潜在変数から出力データを生成するデコーダとを有するモジュールである。

　学習モデル１２Ｍは、訓練用のＸ線画像（股関節Ｘ線正面画像の半割画像）と、訓練用のＤＲＲ画像とを関連付けた訓練データを用意し、この訓練データを用いて未学習の学習モデルを学習させることにより生成される。訓練用のＸ線画像及びＤＲＲ画像は、ＤＸＡ装置によって骨密度正常症例、骨粗鬆症例、骨量減少例のいずれかと診断された被検者の股関節Ｘ線正面画像及びＤＲＲ画像であることが望ましい。本実施形態の情報処理装置１０は、訓練用に用意されたＸ線画像及びＤＲＲ画像を用いて学習を行い、Ｘ線画像からＤＲＲ画像を予測する学習モデル１２Ｍを生成する。

　学習工程において、情報処理装置１０は、図３Ｂに示す生成器のパラメータ（重み等）の更新と、図３Ａに示す識別器のパラメータの更新とを交互に行い、誤差関数の変化が収束した時点で学習終了とする。識別器のパラメータの更新では、情報処理装置１０は、生成器のパラメータを固定した上で訓練用のＸ線画像を生成器に入力する。生成器は訓練用のＸ線画像の入力を受け付け、出力データとしてＤＲＲ画像（対象部位の体組織量に関する情報）を生成する。そして情報処理装置１０は、生成器の入出力に相当するＸ線画像（訓練用のＸ線画像）及びＤＲＲ画像（生成器が生成したＤＲＲ画像）のペアを偽のデータとし、訓練データに含まれるＸ線画像及びＤＲＲ画像のペアを真のデータとして識別器に与え、識別器に真偽の識別を行わせる。情報処理装置１０は、偽のデータが入力された場合に偽値を出力し、真のデータが入力された場合に真値を出力するように識別器のパラメータを更新する。更新されるパラメータは、識別器におけるノード間の重み（結合係数）等であり、パラメータの最適化の方法は誤差逆伝播法、最急降下法等を用いることができる。

　生成器のパラメータの更新では、識別器のパラメータを固定し、図３Ｂに示すように学習を行う。ここでは情報処理装置１０は、訓練用のＸ線画像を生成器に入力し、生成器が生成したＤＲＲ画像を識別器に入力した場合に、真偽の判定を間違える（真と判定してしまう）ように、かつ、訓練用のＸ線画像と似た特徴（画像勾配が類似する、識別器の中間層の出力分布の統計量が類似する、等）の画像が生成されるように生成器のパラメータを更新する。ここでも、更新されるパラメータは、生成器におけるノード間の重み（結合係数）等であり、パラメータの最適化の方法は誤差逆伝播法、最急降下法等を用いることができる。これにより、図２に示すように、Ｘ線画像が入力された場合に、Ｘ線画像中の大腿骨近位部のＤＲＲ画像を出力する学習モデル１２Ｍが生成される。

　情報処理装置１０は、このような学習モデル１２Ｍを予め用意しておき、Ｘ線画像からＤＲＲ画像を生成（予測）する際に用いる。学習モデル１２Ｍを用いて実際にＸ線画像からＤＲＲ画像を予測する場合、情報処理装置１０は、図２に示すように生成器のみを用いる。学習モデル１２Ｍの学習は他の学習装置で行われてもよい。他の学習装置で学習が行われて生成された学習済みの学習モデル１２Ｍは、例えばネットワークＮ経由又は可搬型記憶媒体１０ａ経由で学習装置から情報処理装置１０にダウンロードされて記憶部１２に記憶される。なお、学習済みの学習モデル１２Ｍは、Ｘ線画像からＤＲＲ画像を生成する生成器のみが学習装置から情報処理装置１０にダウンロードされてもよい。

　学習モデル１２Ｍは、ｐｉｘ２ｐｉｘのほかに、ＣｙｃｌｅＧＡＮ、ＳｔａｒＧＡＮ等のＧＡＮであってもよい。また、学習モデル１２ＭはＧＡＮに限定されず、ＶＡＥ（Variational Autoencoder）、ＣＮＮ（Convolutional Neural Network）（例えばＵ－ｎｅｔ）等のニューラルネットワーク、あるいはその他の学習アルゴリズムに基づくモデルであってもよく、複数の学習アルゴリズムを組み合わせて構成されてもよい。

　ここで、学習モデル１２Ｍの学習に用いる訓練用のＤＲＲ画像の生成処理について説明する。図４は訓練データの生成処理手順の一例を示すフローチャート、図５は訓練用のＤＲＲ画像の生成処理の説明図である。以下の処理は、情報処理装置１０の制御部１１が、記憶部１２に記憶してあるプログラム１２Ｐに従って実行するが、他の情報処理装置又は学習装置で行われてもよい。以下の処理では、訓練データの生成に用いるＸ線画像及びＣＴ画像として、被検者の骨盤及び左右の大腿骨を含む領域が撮影された股関節Ｘ線正面画像及びＣＴ画像のペアがそれぞれ対応付けて医療画像ＤＢ１２ａに記憶されているものとする。

　情報処理装置１０の制御部１１は、医療画像ＤＢ１２ａに記憶してある股関節Ｘ線正面画像及びＣＴ画像のペアを１つ読み出す（Ｓ１１）。まず制御部１１は、読み出したＣＴ画像に対して輝度値のキャリブレーション処理を実行し（Ｓ１２）、ＣＴ画像における各輝度値（ＣＴ値）を補正する。ＣＴで計測される各画素の輝度値（ＣＴ値）は、Ｘ線ＣＴ装置の個体差、設置環境及び撮影条件等の違いに起因してズレが生じるため、計測値のズレを補正するキャリブレーションを行う必要がある。ＣＴ画像のキャリブレーション処理は、例えばＸ線ＣＴ装置の設置時、管球等の部品の交換時、撮影開始時、又は定期的に取得されたキャリブレーション用データを用いて行われる。キャリブレーション用データは、予め特性が既知の物質で作製されたファントムをＸ線ＣＴ装置で撮影し、得られた放射線密度（ＨＵ（Hounsfield units）で表されるＣＴ値）と、当該物質の組織密度とに基づいて生成される。具体的には、ファントムを通過して得られた放射線密度を、当該物質の組織密度に変換するための変換式が、キャリブレーション用データに用いられる。

　また、キャリブレーション処理は、International Journal of Computer Assisted Radiology and Surgery（IJCARS）誌に掲載された（2021年3月17日にオンラインで公開）、本発明者である「上村圭亮」等著の論文名「Automated segmentation of an intensity calibration phantom in clinical CT images using a convolutional neural network」の論文に記載された方法を用いることができる。当該論文には、複数の既知の組織密度の物質（カルシウム含有量が異なる物質）を含むファントムを被検者と共にＸ線ＣＴ装置で撮影し、ＣＮＮを用いて、得られたＣＴ画像から、ファントムの各物質の撮影領域を自動で抽出する技術が開示されている。当該論文の開示技術を用いることにより、ＣＴ画像から抽出された各物質の撮影領域のＣＴ値（放射線密度）に基づいて、当該ＣＴ値を各物質の組織密度に変換するためのキャリブレーション用データを生成できる。このように生成されたキャリブレーション用データを用いて、被検者の撮影領域のＣＴ値に対してキャリブレーション処理を行うことにより、被検者における正確な組織密度を取得できる。

　次に制御部１１は、ステップＳ１２でキャリブレーション処理を行ったＣＴ画像に対して、セグメンテーションＤＮＮ（Deep Neural Network）を用いて、ＣＴ画像中の各画素を骨領域、筋肉領域、及びその他の領域の複数領域（筋骨格領域）のいずれかに分類する処理を行う（Ｓ１３）。ＣＴ画像の各画素を筋骨格領域に分類する処理は、例えば、IEEE Transactions on Medical Imaging, VOL.39, No.4, April 2020のP.1030-1040に掲載された、本発明者である「大竹義人」等著の論文名「Automated Muscle Segmentation from Clinical CT Using Bayesian U-Net for Personalized Musculoskeletal Modeling」の論文に記載された方法を用いることができる。当該論文には、ＣＴ画像を入力とし、入力されたＣＴ画像の各画素を骨領域、筋肉領域、及びその他の領域のいずれかに分類し、各画素に領域毎のラベルを対応付けた分類済みのＣＴ画像（筋骨格ラベル画像）を出力する筋骨格セグメンテーションモデルが開示されている。当該論文に開示された筋骨格セグメンテーションモデルは、Bayesian Ｕ－ｎｅｔで構成されている。これにより、図５中（１）に示すように、ＣＴ画像から、ＣＴ画像中の各画素が３つの領域のいずれかに分類され、領域毎のラベルが対応付けられた筋骨格ラベル画像を取得できる。なお、図５では、筋骨格ラベル画像中の各画素は、分類された領域、及び筋肉の種類等に応じた色（濃淡）で模式的に表されている。

　制御部１１は、図５中（２）に示すように、ＣＴ画像から生成された筋骨格ラベル画像に基づいて、ＣＴ画像から骨領域のデータを抽出する（Ｓ１４）。そして、制御部１１は、図５中（３）に示すように、抽出した骨領域のデータ（ＣＴ画像）から、関心領域（ここでは左大腿骨近位部）のデータを抽出する（Ｓ１５）。なお、骨領域から関心領域を抽出する処理は、例えばテンプレートを用いたパターンマッチングによって行うことができる。この場合、左大腿骨近位部の形状を示すテンプレートを予め記憶部１２に記憶しておき、制御部１１は、骨領域のＣＴ画像からテンプレートに一致する領域の有無を判断し、テンプレートに一致する領域を骨領域から抽出することにより、骨領域中の関心領域のデータを抽出できる。なお、骨領域から関心領域を抽出する処理は、例えば、骨領域のＣＴ画像が入力された場合に、骨領域中の関心領域（左大腿骨近位部の領域）を出力するように機械学習された学習モデルを用いて行うこともできる。この場合、制御部１１は、骨領域のＣＴ画像を学習モデルに入力し、学習モデルからの出力情報に基づいて、骨領域中の関心領域を特定して抽出することができる。

　次に制御部１１は、ステップＳ１１で取得したＸ線画像（股関節Ｘ線正面画像）と、ステップＳ１５で抽出したＣＴ画像中の関心領域とにおいて、２つの画像中の撮影対象（ここでは左大腿骨近位部）の位置合わせを行う（Ｓ１６）。制御部１１は、Ｘ線画像に対して、各画素の画素値に基づいて画像の輝度勾配（エッジ）を検出し、検出した輝度勾配に基づいて、Ｘ線画像中の撮影対象を特定する。なお、制御部１１は、Ｘ線画像中の撮影対象の特定を、予め用意したテンプレートを用いたパターンマッチングによって行ってもよく、予め学習させた学習モデルを用いて行ってもよい。そして、制御部１１は、ＣＴ画像中の関心領域（撮影対象である左大腿骨近位部）に対して、Ｘ線画像中の撮影対象に一致する撮影方向を特定し、特定した方向から関心領域を見た状態のＣＴ画像を生成する。これにより、図５中（４）に示すように、Ｘ線画像中の撮影対象との位置合わせが行われた関心領域のＣＴ画像を取得できる。

　なお、Ｘ線画像中の撮影対象とＣＴ画像中の撮影対象との位置合わせは、例えば、The Journal of Arthroplasty 33(2018)のP.595-600に掲載された、本発明者である「上村圭亮」等著の論文名「Can Anatomic Measurements of Stem Anteversion Angle Be Considered as the Functional Anteversion Angle?」の論文に記載された方法を用いることができる。当該論文には、骨盤及び大腿骨のＣＴ画像に対して、階層的統計形状モデルを用いたセグメンテーションを行ってＣＴ画像中の骨盤及び大腿骨を特定し、ＣＴ画像中の骨盤及び大腿骨と、Ｘ線画像中の骨盤及び大腿骨との位置合わせ（対応付け）を行う技術が開示されている。また、Ｘ線画像及びＣＴ画像の位置合わせは、Physics in Medicine and Biology 60(2015)のP.2075-2090に掲載された、本発明者である「大竹義人」等著の論文名「3D-2D registration in mobile radiographs: algorithm development and preliminary clinical evaluation」の論文に記載された方法を用いることができる。当該論文には、ＣＴ画像を平行移動及び回転させることによって、Ｘ線画像の撮影方向と同じ方向から撮影対象を見た状態のＣＴ画像を生成する技術が開示されている。

　そして、制御部１１は、Ｘ線画像中の撮影対象（左大腿骨近位部）との位置合わせが行われた関心領域（左大腿骨近位部）のＣＴ画像から、ＣＴ画像の各画素をＸ線画像の撮影方向と同じ方向に投影した関心領域のＤＲＲ画像を生成する（Ｓ１７）。制御部１１は、ＣＴ画像において、Ｘ線画像の撮影方向と同じ方向に並ぶ各画素値（輝度値、ボクセル値）の積算値を算出し、算出した積算値を、関心領域のＤＲＲ画像の各画素値とする。これにより、図５中（５）に示すような関心領域のＤＲＲ画像が得られ、ＤＲＲ画像中の各画素値は、各位置での骨密度に対応する値となる。

　制御部１１は、ステップＳ１１で取得した股関節Ｘ線正面画像から、左大腿骨近位部を含む半割画像を抽出する（Ｓ１８）。具体的には、制御部１１は、股関節Ｘ線正面画像を左右方向の中央で半分に分割した右半分の領域（左大腿骨を含む領域）を抽出する。制御部１１は、抽出したＸ線画像（股関節Ｘ線正面画像の半割画像）と、ステップＳ１７で生成した関心領域のＤＲＲ画像とを対応付けて訓練データとして訓練ＤＢ１２ｂに記憶する（Ｓ１９）。制御部１１は、医療画像ＤＢ１２ａに記憶してあるＸ線画像及びＣＴ画像のうちで、上述した訓練データの生成処理が行われていない未処理の画像があるか否かを判断する（Ｓ２０）。未処理の画像があると判断した場合（Ｓ２０：ＹＥＳ）、制御部１１はステップＳ１１の処理に戻り、訓練データの生成が未処理のＸ線画像及びＣＴ画像について、ステップＳ１１～Ｓ１９の処理を実行する。未処理の画像がないと判断した場合（Ｓ２０：ＮＯ）、制御部１１は、一連の処理を終了する。上述した処理により、医療画像ＤＢ１２ａに記憶してあるＸ線画像及びＣＴ画像に基づいて、学習モデル１２Ｍの学習に用いる訓練データを生成して訓練ＤＢ１２ｂに蓄積することができる。上述した処理では、訓練データの生成に用いるＸ線画像及びＣＴ画像は、医療画像ＤＢ１２ａに記憶してある例で説明したが、制御部１１は、他の装置に記憶してあるＸ線画像及びＣＴ画像を、例えばネットワークＮ経由又は可搬型記憶媒体１０ａ経由で取得する構成でもよい。例えば、制御部１１は、電子カルテサーバに記憶されている電子カルテデータからＸ線画像及びＣＴ画像を取得する構成でもよい。また、上述した処理では、ＣＴ画像から骨領域の関心領域を抽出した後に、Ｘ線画像との位置合わせを行う構成であるが、Ｘ線画像との位置合わせを行った後に、ＣＴ画像から関心領域を抽出する構成でもよい。

　次に、上述した処理によって生成した訓練データを学習して学習モデル１２Ｍを生成する処理について説明する。図６は学習モデル１２Ｍの生成処理手順の一例を示すフローチャートである。以下の処理は、情報処理装置１０の制御部１１が記憶部１２に記憶してあるプログラム１２Ｐに従って実行するが、他の学習装置で行われてもよい。また、図４に示した訓練データの生成処理と、図６に示す学習モデル１２Ｍの生成処理とは各別の装置で行われてもよい。

　情報処理装置１０の制御部１１は、訓練ＤＢ１２ｂから訓練データを１つ取得する（Ｓ３１）。具体的には、制御部１１は、訓練ＤＢ１２ｂに記憶してある股関節Ｘ線正面画像の半割画像（具体的には、左大腿骨近位部の領域を含むＸ線画像）及びＤＲＲ画像のペアを１つ読み出す。制御部１１は、読み出した訓練データを用いて学習モデル１２Ｍの学習処理を行う（Ｓ３２）。ここでは、制御部１１は、上述した手順によって学習モデル１２Ｍの生成器及び識別器のパラメータの更新を行い、訓練データに含まれるＸ線画像を入力した場合に、Ｘ線画像中の大腿骨近位部のＤＲＲ画像を生成して出力する学習モデル１２Ｍを生成する。

　制御部１１は、訓練ＤＢ１２ｂに記憶してある訓練データのうちで、学習処理が行われていない未処理の訓練データがあるか否かを判断する（Ｓ３３）。未処理の訓練データがあると判断した場合（Ｓ３３：ＹＥＳ）、制御部１１は、ステップＳ３１の処理に戻り、学習処理が未処理の訓練データについてステップＳ３１～Ｓ３２の処理を実行する。未処理の訓練データがないと判断した場合（Ｓ３３：ＮＯ）、制御部１１は一連の処理を終了する。上述した学習処理により、大腿骨近位部の領域を含むＸ線画像を入力することによって、当該大腿骨近位部のＤＲＲ画像を出力する学習モデル１２Ｍが生成される。

　上述したような訓練データを用いた学習処理を繰り返し行うことにより、学習モデル１２Ｍを更に最適化することができる。また、既に学習済みの学習モデル１２Ｍについても、上述した学習処理を行うことによって再学習させることができ、この場合、精度がより高い学習モデル１２Ｍを生成できる。なお、本実施形態の学習モデル１２Ｍは、ＣＴ画像から筋骨格領域を高精度に分類するセグメンテーション技術と、Ｘ線画像中の対象部位とＣＴ画像中の対象部位とを高精度に位置合わせする技術とを用いて、ＣＴで得られる豊富な３次元データと、Ｘ線画像とを空間的に高精度に対応付けることができた訓練データを用いて学習が行われる。そのため、大量の症例数（訓練データ）を必要とせず、高精度のＤＲＲ画像の生成が可能な学習モデル１２Ｍを実現できる。

　次に、上述したように生成された学習モデル１２Ｍを用いて、被検者の大腿骨近位部を含む股関節Ｘ線正面画像から当該大腿骨近位部の骨密度を推定する処理について説明する。図７は骨密度の推定処理手順の一例を示すフローチャート、図８は画面例を示す説明図である。以下の処理は、情報処理装置１０の制御部１１が、記憶部１２に記憶してあるプログラム１２Ｐに従って実行する。なお、以下では、学習モデル１２Ｍを用いてＸ線画像から生成されたＤＲＲ画像を予測ＤＲＲ画像という。

　情報処理装置１０の制御部１１は、患者等の被検者の骨盤及び左右の大腿骨を含む領域をＸ線装置で撮影した股関節Ｘ線正面画像を取得する（Ｓ４１）。制御部１１は、例えば電子カルテサーバに記憶されている電子カルテデータから、骨密度の推定を行いたい患者の股関節Ｘ線正面画像を取得する。また、被検者の股関節Ｘ線正面画像が可搬型記憶媒体１０ａに記憶されている場合、制御部１１は、読み取り部１６によって可搬型記憶媒体１０ａから当該股関節Ｘ線正面画像を読み取ってもよい。

　制御部１１は、取得した股関節Ｘ線正面画像から、骨密度を測定する側の大腿骨近位部を含む半割画像を抽出する（Ｓ４２）。具体的には、制御部１１は、股関節Ｘ線正面画像を左右方向の中央で半分に分割した右半分の領域（左大腿骨を含む領域）を抽出する。なお、制御部１１は、被検者の右大腿骨近位部の骨密度を測定する場合、股関節Ｘ線正面画像の左半分の領域（右大腿骨を含む領域）を抽出した後に左右反転させる処理を実行しておく。制御部１１は、ステップＳ４２で抽出したＸ線画像の半割画像に基づいて、当該Ｘ線画像中の大腿骨近位部の予測ＤＲＲ画像を生成する（Ｓ４３）。具体的には、制御部１１は、大腿骨近位部を含むＸ線画像（股関節Ｘ線正面画像の半割画像）を学習モデル１２Ｍに入力し、当該Ｘ線画像中の大腿骨近位部の予測ＤＲＲ画像を、学習モデル１２Ｍからの出力情報として取得する。

　制御部１１は、生成した大腿骨近位部の予測ＤＲＲ画像から、当該大腿骨近位部の骨密度を算出する（Ｓ４４）。予測ＤＲＲ画像の各画素値は、骨密度に対応した値となっており、制御部１１は、例えば予測ＤＲＲ画像中の各画素値の平均値を算出することによって、当該大腿骨近位部の骨密度を算出する。制御部１１は、骨密度（ＢＭＤ：Bone Mineral Density）に加えて、当該骨密度から算出される若年成人比較の結果（ＹＡＭ：Young Adult Mean）、及び同年齢比較の結果を算出する。制御部１１は、算出した検査結果を、例えば電子カルテサーバの電子カルテデータに記憶する（Ｓ４５）。

　制御部１１は、検査結果を表示する画面を生成して、例えば表示部１５に出力し（Ｓ４６）、表示部１５に表示させて処理を終了する。例えば制御部１１は、図８に示すような検査結果画面を生成する。図８に示す画面は、被検者の識別情報（例えば患者ＩＤ、患者氏名等）と、股関節Ｘ線正面画像及びその撮影日時とを表示する。更に、図８に示す画面は、当該股関節Ｘ線正面画像に基づく骨密度の検査結果として、予測ＤＲＲ画像、予測ＤＲＲ画像中の対象部位名（図８では左大腿骨近位部）、予測ＤＲＲ画像から推定された骨密度、若年成人比較、同年齢比較を表示する。また、例えば、骨密度、若年成人比較、又は同年齢比較の各数値に対応付けて、医師等に提示すべきコメントが記憶部１２に記憶されている場合、制御部１１は、算出した検査結果（骨密度、若年成人比較、又は同年齢比較）に対応するコメントを記憶部１２から読み出し、図８に示すように、検査結果画面に表示させてもよい。

　上述した処理により、医療機関等で一般的に使用されているＸ線装置を用いて撮影された股関節Ｘ線正面画像から、当該股関節Ｘ線正面画像中の大腿骨近位部の骨密度を推定することができる。また、本実施形態では、股関節Ｘ線正面画像から生成された大腿骨近位部の予測ＤＲＲ画像と、予測ＤＲＲ画像から推定された骨密度とを医師等に提示することができる。よって、医師は、予測ＤＲＲ画像及び推定された骨密度によって患者の大腿骨近位部の状態を判断することができる。

　本実施形態では、学習モデル１２Ｍが、Ｘ線画像中の大腿骨近位部の撮影状態の特徴を自動抽出して予測ＤＲＲ画像の生成を行うので、ＤＸＡ装置等を用いた検査を行うことなく、Ｘ線装置での撮影を行うだけで骨密度の推定が可能となる。従って、健康診断又は小規模なクリニックでも撮影されるＸ線画像から対象部位の骨密度の推定が可能となるので、骨密度の測定検査を手軽に実施することができる。よって、骨量減少又は骨粗鬆症の早期診断及び早期治療介入が可能となり、骨量減少又は骨粗鬆症に伴う骨折を予防し、健康寿命の延伸に寄与することが期待される。

　本実施形態では、上述したように、Ｘ線画像中の対象部位（大腿骨近位部）と、ＣＴ画像中の対象部位との空間的な位置合わせを高精度で実現できる。よって、高精度に位置合わせされたＸ線画像及びＣＴ画像（ＤＲＲ画像）による訓練データを用いることにより、大量の訓練データを学習させることなく、高精度の予測ＤＲＲ画像の生成が可能となる。例えば、変形性股関節症の患者から収集したＸ線画像及びＣＴ画像から生成された２００ペアの訓練データを用いて学習を行った学習モデル１２Ｍを用いてＸ線画像から予測ＤＲＲ画像を生成し、予測ＤＲＲ画像から推定された大腿骨近位部の骨密度と、ＤＸＡ装置を用いて計測された当該大腿骨近位部の骨密度との比較結果を図９Ａ及び図９Ｂに示す。図９Ａ及び図９Ｂは、予測ＤＲＲ画像から推定された骨密度と、ＤＸＡ装置で計測された骨密度との関係を示す図表である。図９Ａに示す図表と、図９Ｂに示す図表とはそれぞれ、異なる医療機関のＸ線装置及びＤＸＡ装置で収集されたＸ線画像及び骨密度（ＢＭＤ）による検証結果を示している。

　図９Ａの図表は、横軸に予測ＤＲＲ画像から推定された大腿骨近位部の骨密度を示し、縦軸にＤＸＡ装置で計測された当該大腿骨近位部の骨密度を示す。図９Ｂの図表は、横軸にＤＸＡ装置で計測された大腿骨近位部の骨密度を示し、縦軸に予測ＤＲＲ画像から推定された当該大腿骨近位部の骨密度を示す。図９Ａ及び図９Ｂの図表から分かるように、予測ＤＲＲ画像から推定された大腿骨近位部の骨密度と、ＤＸＡ装置で計測された当該大腿骨近位部の骨密度とは高い線形相関を示した。具体的には、図９Ａに示す医療機関では、０．８６１の相関係数が得られ、予測ＤＲＲ画像から推定された骨密度と、ＤＸＡ装置で計測された骨密度との平均誤差（平均絶対誤差）は０．０６ｇ／ｃｍ２であった。また、図９Ｂに示す医療機関では、０．８６９の相関係数が得られ、予測ＤＲＲ画像から推定された骨密度と、ＤＸＡ装置で計測された骨密度との平均誤差は０．０７ｇ／ｃｍ２であった。このように、少ない数の訓練データで学習した学習モデル１２Ｍであっても、ＤＸＡ装置での計測結果と同程度の骨密度の予測が可能である。よって、訓練データの収集処理及び学習処理における作業負荷を軽減できる。

　本実施形態では、学習モデル１２Ｍを用いて大腿骨近位部を含むＸ線画像から当該大腿骨近位部の予測ＤＲＲ画像を生成し、予測ＤＲＲ画像から当該大腿骨近位部の骨密度を推定する構成について説明した。しかし、骨密度の推定対象の部位は、大腿骨近位部のほかに、腰椎、胸椎、頸椎、鎖骨、肋骨、手の骨、足の骨、あるいは、それらの特定部位等であってもよい。他の部位についても同様の処理によって訓練データの生成及び学習モデルの生成が行われ、学習モデルを用いた骨密度の推定が可能である。

　本実施形態において、訓練データの生成処理、訓練データを用いた学習モデル１２Ｍの学習処理、学習モデル１２Ｍを用いた骨密度の推定処理は、情報処理装置１０がローカルで行う構成に限定されない。例えば、上述した各処理を実行する情報処理装置をそれぞれ設けてもよい。また、訓練データの生成処理及び学習モデル１２Ｍの学習処理を実行するサーバを設けてもよい。この場合、情報処理装置１０が、訓練データに使用するＸ線画像及びＣＴ画像をサーバへ送信し、サーバが、当該Ｘ線画像及びＣＴ画像から訓練データを生成し、生成した訓練データを用いた学習処理によって学習モデル１２Ｍを生成して情報処理装置１０へ送信するように構成される。よって、情報処理装置１０は、サーバから取得した学習モデル１２Ｍを用いて対象部位の骨密度の推定処理を実現できる。また、学習モデル１２Ｍを用いた骨密度の推定処理を実行するサーバを設けてもよい。この場合、情報処理装置１０は、被検者のＸ線画像をサーバへ送信し、サーバが、学習モデル１２Ｍを用いた予測ＤＲＲ画像の生成処理及び骨密度の推定処理を行い、生成した予測ＤＲＲ画像及び推定した骨密度を情報処理装置１０へ送信するように構成される。このような構成とした場合であっても、上述した本実施形態と同様の処理が可能であり、同様の効果が得られる。

（実施形態２）
　上述した実施形態１では、対象部位（例えば、大腿骨近位部）のＸ線画像から当該対象部位の予測ＤＲＲ画像を生成し、予測ＤＲＲ画像から当該対象部位の骨密度を推定する構成について説明した。本実施形態では、骨密度を推定したい対象部位とは異なる部位のＸ線画像から、骨密度を推定したい対象部位の骨密度を推定する情報処理装置について説明する。本実施形態の情報処理装置は、実施形態１の情報処理装置１０と同様の構成を有するので、構成についての説明は省略する。なお、本実施形態の情報処理装置１０は、図１に示す構成に加えて、記憶部１２に骨密度推定用学習モデル１２Ｍ１（図１０参照）を記憶している。また、本実施形態の医療画像ＤＢ１２ａには、骨密度を推定したい対象部位とは異なる部位のＸ線画像及びＣＴ画像と、骨密度を推定したい対象部位についてＤＸＡ装置で計測した骨密度とが対応付けて記憶されている。本実施形態は、胸部Ｘ線画像から大腿骨近位部の骨密度を推定する構成とするので、医療画像ＤＢ１２ａには、被検者の胸部のＸ線画像及びＣＴ画像と、当該被検者の大腿骨近位部についてＤＸＡ装置で計測した骨密度とが記憶されている。なお、医療画像ＤＢ１２ａに記憶される骨密度は、骨量減少及び骨粗鬆症の診断に用いられる部位の骨密度であればよく、腰椎、骨盤又は大腿骨の骨密度であってもよく、あるいは、全身の骨密度の平均値又は中央値等であってもよい。

　図１０は実施形態２の学習モデル１２Ｍ，１２Ｍ１の概要を示す説明図である。本実施形態の情報処理装置１０は、大腿骨近位部の骨密度を推定する際に、大腿骨近位部とは異なる部位、例えば胸部Ｘ線撮影で撮影される肋骨、鎖骨、胸椎等の部位のＸ線画像から学習モデル１２Ｍを用いて当該部位の予測ＤＲＲ画像を生成する。そして、情報処理装置１０は、生成した予測ＤＲＲ画像から、骨密度推定用学習モデル１２Ｍ１（第２の学習モデル）を用いて大腿骨近位部の骨密度を推定する。なお、大腿骨近位部の骨密度の推定に用いるＸ線画像の撮影部位は、肋骨、鎖骨、胸椎等に限定されず、大腿骨近位部が撮影されていないＸ線画像中の各骨を用いることができる。

　骨密度推定用学習モデル１２Ｍ１は、所定の訓練データを学習済みの機械学習モデルであり、被検者の胸部のＣＴ画像から生成されたＤＲＲ画像を入力とし、当該被検者の大腿骨近位部の骨密度を出力するように学習してある。骨密度推定用学習モデル１２Ｍ１は、人工知能ソフトウェアを構成するプログラムモジュールとしての利用が想定される。骨密度推定用学習モデル１２Ｍ１は、例えばＣＮＮで構成されるが、ロジスティック回帰、線形回帰等の他のアルゴリズムを用いて構成されてもよく、複数のアルゴリズムを組み合わせて構成されてもよい。人間の骨の骨密度は、身体の各骨で同様に低下すると考えられるので、ＣＴ画像の撮影対象の骨の骨密度と、撮影対象以外の骨の骨密度とは強い相関関係を有すると考えられる。従って、本実施形態では、骨密度推定用学習モデル１２Ｍ１を用いて、ＣＴ画像（ＤＲＲ画像）から予想される、当該撮影対象以外の部位の骨密度を推定することができる。

　骨密度推定用学習モデル１２Ｍ１は、訓練用のＤＲＲ画像と訓練用（正解）の骨密度とを関連付けた訓練データを用意し、この訓練データを用いて未学習の学習モデル１２Ｍ１を機械学習させることにより生成される。訓練用のＤＲＲ画像は、例えばＤＸＡ装置によって骨密度正常症例、骨粗鬆症例、骨量減少例のいずれかと診断された被検者の胸部を撮影したＣＴ画像から生成されたＤＲＲ画像を用いることができ、訓練用の骨密度は、ＤＸＡ装置を用いて計測した当該被検者の大腿骨近位部の骨密度を用いることができる。本実施形態の情報処理装置１０は、訓練用に用意されたＤＲＲ画像及び骨密度を用いて学習を行い、ＤＲＲ画像から、当該ＤＲＲ画像の撮影対象以外の部位の骨密度を出力する骨密度推定用学習モデル１２Ｍ１を生成する。

　骨密度推定用学習モデル１２Ｍ１は、訓練用のＤＲＲ画像が入力された場合に、正解の骨密度を出力するように学習する。学習処理において学習モデル１２Ｍ１は、入力されたＤＲＲ画像に基づく演算を行い、演算結果である出力値を算出する。そして、学習モデル１２Ｍ１は、算出した出力値と正解の骨密度とを比較し、両者が近似するように、演算処理に用いるパラメータを最適化する。当該パラメータは、骨密度推定用学習モデル１２Ｍ１におけるノード間の重み（結合係数）等であり、パラメータの最適化の方法は誤差逆伝播法、最急降下法等を用いることができる。これにより、胸部ＣＴ画像から生成されたＤＲＲ画像が入力された場合に、大腿骨近位部の骨密度を出力する学習モデル１２Ｍ１が生成される。骨密度推定用学習モデル１２Ｍ１の学習も他の学習装置で行われてもよい。

　図１１は実施形態２の訓練データの生成処理手順の一例を示すフローチャートである。図１１に示す処理は、図４に示す処理において、ステップＳ１１の代わりにステップＳ５１を追加し、ステップＳ１８を削除し、ステップＳ１９，Ｓ２０の間にステップＳ５２を追加したものである。図４と同じステップについては説明を省略する。なお、本実施形態では、医療画像ＤＢ１２ａに、学習モデル１２Ｍ，１２Ｍ１の学習用として、各被検者の胸部を撮影した胸部Ｘ線画像及び胸部ＣＴ画像と、ＤＸＡ装置で計測した各被検者の大腿骨近位部の骨密度とが対応付けて記憶してあるものとする。

　本実施形態の情報処理装置１０の制御部１１は、医療画像ＤＢ１２ａから、胸部Ｘ線画像、胸部ＣＴ画像、及び大腿骨近位部の骨密度のセットを１つ読み出す（Ｓ５１）。そして、制御部１１は、図４中のステップＳ１２～Ｓ１７，Ｓ１９と同様の処理を実行する。即ち、制御部１１は、胸部ＣＴ画像に対してキャリブレーション処理を実行し（Ｓ１２）、胸部ＣＴ画像の各画素を骨領域、筋肉領域、及びその他の領域のいずれかに分類し（Ｓ１３）、胸部ＣＴ画像から骨領域のデータを抽出する（Ｓ１４）。そして、制御部１１は、抽出した骨領域のＣＴ画像から、関心領域（例えば肋骨）のデータを抽出し（Ｓ１５）、ステップＳ５１で取得した胸部Ｘ線画像と、ステップＳ１５で抽出したＣＴ画像中の関心領域とにおいて、撮影対象（ここでは肋骨）の位置合わせを行う（Ｓ１６）。更に、制御部１１は、位置合わせが行われた関心領域（肋骨）のＣＴ画像から関心領域のＤＲＲ画像を生成し（Ｓ１７）、ステップＳ５１で取得したＸ線画像と、ステップＳ１７で生成した関心領域のＤＲＲ画像とを対応付けて、学習モデル１２Ｍの学習用の訓練データとして訓練ＤＢ１２ｂに記憶する（Ｓ１９）。なお、本実施形態では、医療画像ＤＢ１２ａから読み出した胸部Ｘ線画像をそのまま訓練データに用いるが、図４中のステップＳ１８のように、読み出したＸ線画像から、訓練データに用いる領域を抽出する処理を行ってもよい。

　また、制御部１１は、ステップＳ１７で生成した関心領域のＤＲＲ画像と、ステップＳ５１で取得した大腿骨近位部の骨密度とを対応付けて、骨密度推定用学習モデル１２Ｍ１の学習用の訓練データとして記憶部１２に記憶する（Ｓ５２）。なお、制御部１１は、骨密度推定用学習モデル１２Ｍ１の学習用の訓練データを蓄積するＤＢを記憶部１２に用意しておき、このＤＢに生成した訓練データを記憶させてもよい。その後、制御部１１は、ステップＳ２０の処理に移行する。上述した処理により、医療画像ＤＢ１２ａに記憶してあるＸ線画像、ＣＴ画像、及び骨密度に基づいて、学習モデル１２Ｍの学習に用いる訓練データを生成して訓練ＤＢ１２ｂに蓄積することができると共に、骨密度推定用学習モデル１２Ｍ１の学習に用いる訓練データを生成してＤＢに蓄積することができる。

　本実施形態において、骨密度推定用学習モデル１２Ｍ１の生成は、図６に示す学習処理と同様の処理によって実現できる。なお、骨密度推定用学習モデル１２Ｍ１の生成処理では、図６中のステップＳ３１で、制御部１１は、記憶部１２に記憶してある関心領域（ここでは肋骨）のＤＲＲ画像及び大腿骨近位部の骨密度のペアを読み出す。またステップＳ３２で、制御部１１は、訓練データに含まれるＤＲＲ画像を骨密度推定用学習モデル１２Ｍ１に入力し、骨密度推定用学習モデル１２Ｍ１からの出力情報を取得する。制御部１１は、取得した出力情報と、訓練データに含まれる大腿骨近位部の骨密度とを比較し、両者が近似するように、例えば誤差逆伝播法を用いて、骨密度推定用学習モデル１２Ｍ１におけるノード間の重み等のパラメータを最適化する。上述した処理により、肋骨のＣＴ画像から生成されたＤＲＲ画像を入力することによって、大腿骨近位部の骨密度を出力する骨密度推定用学習モデル１２Ｍ１が生成される。

　次に、学習モデル１２Ｍ，１２Ｍ１を用いて、被検者の胸部Ｘ線画像から当該被検者の大腿骨近位部の骨密度を推定する処理について説明する。図１２は実施形態２の骨密度の推定処理手順の一例を示すフローチャート、図１３は画面例を示す説明図である。情報処理装置１０の制御部１１は、被検者の胸部をＸ線装置で撮影した胸部Ｘ線画像を取得する（Ｓ６１）。ここでも制御部１１は、例えば電子カルテデータから、骨密度の推定を行いたい被検者の胸部Ｘ線画像を取得する。

　制御部１１は、取得した胸部Ｘ線画像を学習モデル１２Ｍに入力し、当該Ｘ線画像中の対象部位（ここでは肋骨）の予測ＤＲＲ画像を生成する（Ｓ６２）。制御部１１は、肋骨の予測ＤＲＲ画像を学習モデル１２Ｍの出力情報として取得する。なお、本実施形態では、取得した胸部Ｘ線画像をそのまま学習モデル１２Ｍに入力するが、図７中のステップＳ４２のように、取得したＸ線画像から、大腿骨近位部の骨密度の推定に用いる対象部位の領域を抽出する処理を行い、抽出した領域のＸ線画像を学習モデル１２Ｍに入力する構成でもよい。大腿骨近位部の骨密度の推定に用いる対象部位は、肋骨のほかに、鎖骨、胸椎等とすることができる。

　制御部１１は、ステップＳ６２で生成した肋骨の予測ＤＲＲ画像を骨密度推定用学習モデル１２Ｍ１に入力し、当該被検者の大腿骨近位部の骨密度を推定する（Ｓ６３）。なお、制御部１１は、大腿骨近位部の骨密度を骨密度推定用学習モデル１２Ｍ１の出力情報として取得する。制御部１１は、推定した骨密度（ＢＭＤ）から、若年成人比較（ＹＡＭ）及び同年齢比較の結果を示す数値を算出する（Ｓ６４）。そして、制御部１１は、検査結果を、例えば電子カルテデータに記憶し（Ｓ６５）、検査結果を表示する画面を生成して表示部１５に出力する（Ｓ６６）。ここでは制御部１１は、例えば図１３に示す検査結果画面を生成する。図１３に示す画面は、被検者の識別情報と、胸部Ｘ線画像及びその撮影日時とを表示し、当該胸部Ｘ線画像に基づく骨密度の検査結果として、肋骨の予測ＤＲＲ画像、予測ＤＲＲ画像中の対象部位名（図１３では肋骨）、予測ＤＲＲ画像から推定された大腿骨近位部の骨密度、若年成人比較、同年齢比較を表示する。ここでも、検査結果（骨密度、若年成人比較、又は同年齢比較）に対応するコメントが記憶部１２に記憶してある場合、制御部１１は、検査結果に対応するコメントを記憶部１２から読み出して検査結果画面に表示させてもよい。

　本実施形態においても、上述した実施形態１と同様の効果が得られる。また本実施形態では、Ｘ線装置を用いて撮影された胸部Ｘ線画像から、当該被検者の大腿骨近位部の骨密度を推定することができる。よって、本実施形態では、例えば健康診断で胸部Ｘ線画像を撮影した場合に、当該胸部Ｘ線画像から被検者の大腿骨近位部の骨密度の推定が可能となり、骨密度の測定検査を他の検査の際により手軽に実施することが可能となる。そのため、骨密度測定が検査目的でない被検者に対しても、骨量減少又は骨粗鬆症の可能性を診断でき、早期診断及び早期治療介入が可能となる。

　また、本実施形態では、胸部Ｘ線画像から生成された所定部位（例えば肋骨）の予測ＤＲＲ画像と、予測ＤＲＲ画像から推定された大腿骨近位部の骨密度とを医師等に提示することができる。よって、医師は、所定部位の予測ＤＲＲ画像及び推定された大腿骨近位部の骨密度によって患者の肋骨及び大腿骨近位部の状態を判断し、骨量減少又は骨粗鬆症の診断を行うことができる。なお、骨密度の推定対象は大腿骨近位部に限定されず、任意の各部位とすることができ、骨密度の推定に用いるＸ線画像の撮影対象は、骨密度の推定対象の部位以外の部位であればよい。

　本実施形態において、学習モデル１２Ｍ及び骨密度推定用学習モデル１２Ｍ１は１つの学習モデルで構成されてもよい。具体的には、例えば胸部Ｘ線画像を入力とし、当該胸部Ｘ線画像の被検者の大腿骨近位部の骨密度を出力するように学習モデルを構成することもできる。また、本実施形態において、骨密度推定用学習モデル１２Ｍ１の代わりに、学習モデル１２Ｍを用いて胸部Ｘ線画像から生成された所定部位（例えば肋骨）の予測ＤＲＲ画像を入力とし、当該予測ＤＲＲ画像から大腿骨近位部の予測ＤＲＲ画像を生成して出力するように学習された学習モデルを用いてもよい。この場合、肋骨の予測ＤＲＲ画像から、当該被検者の大腿骨近位部のＤＲＲ画像を推定することができ、推定された大腿骨近位部のＤＲＲ画像に基づいて大腿骨近位部の骨密度を推定することが可能となる。更に、例えば胸部Ｘ線画像を入力とし、当該胸部Ｘ線画像の被検者の大腿骨近位部の予測ＤＲＲ画像を生成して出力するように学習された学習モデルを用いてもよい。この場合にも、胸部Ｘ線画像から、当該被検者の大腿骨近位部のＤＲＲ画像を推定することができるので、大腿骨近位部のＤＲＲ画像に基づいて大腿骨近位部の骨密度を推定することが可能となる。本実施形態においても、上述した実施形態１で適宜説明した変形例の適用が可能である。

（実施形態３）
　上述した実施形態１では、対象部位（大腿骨近位部等の骨領域）のＸ線画像から当該対象部位の予測ＤＲＲ画像を生成し、予測ＤＲＲ画像から当該対象部位の骨密度を推定する構成について説明した。本実施形態では、対象部位（例えば下腹部、臀部等の筋肉領域）のＸ線画像から当該対象部位の筋肉領域の予測ＤＲＲ画像を生成し、生成した予測ＤＲＲ画像から当該対象部位の筋肉量を推定する情報処理装置について説明する。本実施形態の情報処理装置は、実施形態１の情報処理装置１０と同様の構成を有するので、構成についての説明は省略する。なお、本実施形態の医療画像ＤＢ１２ａには、筋肉量を推定したい部位（筋肉領域）のＸ線画像及びＣＴ画像が対応付けて記憶されている。

　図１４は実施形態３の学習モデル１２Ｍａの概要を示す説明図である。本実施形態の学習モデル１２Ｍａは、図２に示す実施形態１の学習モデル１２Ｍと同様の構成を有し、同様の学習処理によって生成される。なお、本実施形態の学習モデル１２Ｍａは、例えば、股関節Ｘ線正面画像（臀部のＸ線画像）と、臀部（下腹部）をＸ線ＣＴ装置で撮影したＣＴ画像から生成された臀部の筋肉領域のＤＲＲ画像とを訓練データに用いて、臀部のＸ線画像が入力された場合に、当該臀部の筋肉領域のＤＲＲ画像（予測ＤＲＲ画像、筋肉量に関する情報）を出力するように学習されている。図１４に示す例では、学習モデル１２Ｍａは、大臀筋、中臀筋、ハムストリングス等の複数の筋肉領域のＤＲＲ画像を生成するが、いずれか１つの筋肉領域のＤＲＲ画像を生成するように構成されていてもよい。例えば、サルコペニアの診断に利用できる筋肉領域があれば、当該筋肉領域のＤＲＲ画像を生成するように学習モデル１２Ｍａを生成してもよい。

　以下に、本実施形態の学習モデル１２Ｍａの学習に用いる訓練データの生成処理について説明する。図１５は実施形態３の訓練データの生成処理手順の一例を示すフローチャートである。図１５に示す処理は、図４に示す処理において、ステップＳ１４の代わりにステップＳ７１を追加し、ステップＳ１５～Ｓ１６，Ｓ１８を削除し、ステップＳ１７，Ｓ１９の代わりにステップＳ７２～Ｓ７３を追加したものである。図４と同じステップについては説明を省略する。

　本実施形態の情報処理装置１０の制御部１１は、図４中のステップＳ１１～Ｓ１３と同様の処理を行う。即ち、制御部１１は、医療画像ＤＢ１２ａからＸ線画像（股関節Ｘ線正面画像）及びＣＴ画像のペアを読み出し、読み出したＣＴ画像に対して輝度値のキャリブレーション処理を実行した後、ＣＴ画像中の各画素を骨領域、筋肉領域、及びその他の領域（筋骨格領域）に分類する。これにより、図５中（１）に示すように、ＣＴ画像中の各画素が各領域に分類された筋骨格ラベル画像を取得できる。本実施形態では、制御部１１は、筋骨格ラベル画像に基づいて、ＣＴ画像から筋肉領域のデータを抽出する（Ｓ７１）。制御部１１は、筋肉の種類毎に筋肉領域のデータ（ＣＴ画像）を抽出する。

　制御部１１は、抽出した筋肉領域のデータ（ＣＴ画像）から、ＣＴ画像の各画素を所定方向に投影した筋肉領域のＤＲＲ画像を生成する（Ｓ７２）。例えばＸ線画像が、被検者の背面から前面へ通過した放射線を受光して得られていた場合、制御部１１は、筋肉領域のＣＴ画像の各画素を、被検者の背面から前面への方向に投影したＤＲＲ画像を生成する。ここでも、制御部１１は、ＣＴ画像において、所定方向に並ぶ各画素値（輝度値、ボクセル値）の積算値をＤＲＲ画像の各画素値とする。よって、本実施形態では、筋肉領域のＤＲＲ画像中の各画素値は、各位置での筋肉密度（筋肉量）に対応する値となる。なお、制御部１１は、ステップＳ１１で取得したＸ線画像と、ステップＳ７１で抽出した筋肉領域のＣＴ画像とにおいて、各画像中の撮影対象（ここでは各筋肉）の位置合わせを行い、位置合わせ後のＣＴ画像の各画素を、Ｘ線画像の撮影方向と同じ方向に投影したＤＲＲ画像を生成してもよい。

　制御部１１は、ステップＳ１１で取得したＸ線画像と、ステップＳ７２で生成した筋肉領域のＤＲＲ画像とを対応付けて訓練データとして訓練ＤＢ１２ｂに記憶する（Ｓ７３）。その後、制御部１１は、ステップＳ２０の処理に移行する。上述した処理により、医療画像ＤＢ１２ａに記憶してあるＸ線画像及びＣＴ画像に基づいて、本実施形態の学習モデル１２Ｍａの学習に用いる訓練データを生成して訓練ＤＢ１２ｂに蓄積できる。このように生成された訓練データを用いることにより、本実施形態では、図６に示す学習処理と同様の処理によって学習モデル１２Ｍａを生成できる。

　次に、学習モデル１２Ｍａを用いて、被検者の股関節Ｘ線正面画像から当該被検者の臀部の筋肉量を推定する処理について説明する。図１６は筋肉量の推定処理手順の一例を示すフローチャート、図１７は画面例を示す説明図である。図１６に示す処理は、図７に示す処理において、ステップＳ４２を削除し、ステップＳ４３～Ｓ４４の代わりにステップＳ８１～Ｓ８２を追加したものである。図７と同じステップについては説明を省略する。

　情報処理装置１０の制御部１１は、被検者の股関節Ｘ線正面画像を取得する（Ｓ４１）。制御部１１は、股関節Ｘ線正面画像に基づいて、当該Ｘ線画像中の筋肉領域の予測ＤＲＲ画像を生成する（Ｓ８１）。具体的には、制御部１１は、股関節Ｘ線正面画像を学習モデル１２Ｍａに入力し、当該Ｘ線画像中の臀部の筋肉領域の予測ＤＲＲ画像を、学習モデル１２Ｍａからの出力情報として取得する。そして、制御部１１は、生成した筋肉領域の予測ＤＲＲ画像から、当該臀部における各筋肉の筋肉量を算出する（Ｓ８２）。本実施形態では、予測ＤＲＲ画像の各画素値は、筋肉密度（筋密度）に対応した値となっており、制御部１１は、予測ＤＲＲ画像中の各画素値の平均値を算出することによって、当該筋肉領域における筋肉密度を算出する。また、制御部１１は、算出した筋肉密度と、当該筋肉領域の体積とに基づいて当該筋肉領域における筋肉量を算出する。なお、制御部１１は、予測ＤＲＲ画像中の各画素値に基づいて、各１画素分の筋肉量を算出し、各画素に対応する筋肉量を積算することにより、当該筋肉領域における筋肉量を算出してもよい。更に、制御部１１は、各筋肉領域における筋肉量に基づいて、被検者の身体全体の筋肉量を予測してもよい。例えば、被検者の大臀筋、中臀筋、ハムストリングス等の各筋肉の筋肉量と、当該被検者の全身の筋肉量とを対応付けて登録しておくことにより、予測ＤＲＲ画像から推定された各筋肉の筋肉量から当該被検者の全身の筋肉量が予測できる。また、制御部１１は、各筋肉領域における筋肉量に基づいて、被検者の上肢の筋肉量、又は下肢の筋肉量等を予測してもよい。

　制御部１１は、算出した各筋肉の筋肉密度及び筋肉量を含む検査結果を、例えば電子カルテデータに記憶し（Ｓ４５）、図１７に示すような検査結果画面を生成して表示部１５に出力する（Ｓ４６）。図１７に示す画面は、被検者の識別情報と、股関節Ｘ線正面画像及びその撮影日時とを表示する。また、図１７に示す画面は、当該股関節Ｘ線正面画像に基づく筋肉量の検査結果として、各筋肉の予測ＤＲＲ画像、予測ＤＲＲ画像中の対象部位名（図１７では大臀筋、中臀筋、ハムストリングス）、予測ＤＲＲ画像から推定された筋肉量を表示する。また、筋肉密度又は筋肉量に対応付けて、医師等に提示すべきコメントが記憶部１２に記憶されている場合、制御部１１は、算出した検査結果（筋肉密度又は筋肉量）に対応するコメントを記憶部１２から読み出し、図１７に示すように検査結果画面に表示させてもよい。

　上述した処理により、本実施形態では、Ｘ線装置を用いて撮影された股関節Ｘ線正面画像から、当該股関節Ｘ線正面画像中の筋肉領域の筋肉量を推定することができる。また、本実施形態では、股関節Ｘ線正面画像から生成された筋肉領域の予測ＤＲＲ画像と、予測ＤＲＲ画像から推定された筋肉量とを医師等に提示することができる。よって、医師は、予測ＤＲＲ画像及び推定された筋肉量によって患者の筋肉の状態を判断することができる。本実施形態では、学習モデル１２Ｍａが、Ｘ線画像中の筋肉領域の撮影状態の特徴を自動抽出して筋肉領域の予測ＤＲＲ画像の生成を行うので、ＤＸＡ装置等を用いた検査を行うことなく、Ｘ線装置での撮影を行うだけで筋肉量の推定が可能となる。従って、健康診断又は小規模なクリニックでも撮影されるＸ線画像から対象部位の筋肉量の推定が可能となるので、筋肉量の測定検査を手軽に実施することが可能となる。よって、加齢により筋肉量及び筋力が低下するサルコペニアの早期診断が可能となり、サルコペニアの発症及び進行を予防及び抑制し、健康寿命の延伸に寄与することが期待される。

　本実施形態においても、少ない数の訓練データによる学習によって、Ｘ線画像から、当該Ｘ線画像中の筋肉領域の予測ＤＲＲ画像を高精度に生成できる学習モデル１２Ｍａを実現できる。よって、本実施形態では、Ｘ線画像から、ＤＸＡ装置での計測結果と同程度の筋肉量及び筋肉密度の予測が可能となり、訓練データの収集処理及び学習処理における作業負荷を軽減できる。

　本実施形態では、学習モデル１２Ｍａを用いて臀部（下腹部）のＸ線画像から当該臀部の筋肉領域の予測ＤＲＲ画像を生成し、予測ＤＲＲ画像から当該臀部の筋肉密度及び筋肉量を推定する構成について説明した。筋肉密度及び筋肉量の推定対象の部位は、臀部のほかに、上肢、下肢、胸部、腹部、全身等であってもよい。他の部位についても同様の処理によって訓練データの生成及び学習モデルの生成が行われ、学習モデルを用いた筋肉密度及び筋肉量の推定が可能となる。

　本実施形態においても、上述した実施形態１～２と同様の効果が得られる。また本実施形態では、Ｘ線装置を用いて撮影された対象部位のＸ線画像から、当該対象部位の筋肉量を推定することができる。よって、筋肉量の測定検査をより手軽に実施することが可能となるので、筋肉量に不安を感じていない被検者に対しても、サルコペニア等の疾患の可能性を診断でき、サルコペニアの早期診断及び早期治療介入が可能となる。また、本実施形態においても、上述した実施形態１～２で適宜説明した変形例の適用が可能である。

（実施形態４）
　実施形態１の構成と実施形態２の構成とを組み合わせた実施形態について説明する。即ち、本実施形態では、対象部位を撮影したＸ線画像から当該対象部位の予測ＤＲＲ画像を生成し、生成した予測ＤＲＲ画像に基づいて当該対象部位の骨密度を推定すると共に、当該対象部位とは異なる部位の骨密度を推定する情報処理装置について説明する。本実施形態の情報処理装置は、実施形態１，２の情報処理装置１０と同様の構成を有するので、構成についての説明は省略する。即ち、本実施形態の情報処理装置１０は、対象部位のＸ線画像から当該対象部位の予測ＤＲＲ画像を生成する学習モデル１２Ｍと、対象部位のＤＲＲ画像から当該対象部位とは異なる部位の骨密度を推定する骨密度推定用学習モデル１２Ｍ１とを有する。以下の例では、学習モデル１２Ｍは、大腿骨近位部のＸ線画像から大腿骨近位部の予測ＤＲＲ画像を生成するモデルとし、骨密度推定用学習モデル１２Ｍ１は、大腿骨近位部のＤＲＲ画像から肋骨の骨密度を推定するモデルとする。しかし、学習モデル１２Ｍ，１２Ｍ１はこのような構成に限定されず、また、学習モデル１２Ｍ，１２Ｍ１のそれぞれについて複数種類のモデルが用意されていてもよい。例えば、学習モデル１２Ｍとして、骨盤のＸ線画像から骨盤のＤＲＲ画像を生成（予測）するモデル、胸部のＸ線画像から肋骨、鎖骨、又は胸椎のＤＲＲ画像を生成するモデル等が更に用意されていてもよい。また、骨密度推定用学習モデル１２Ｍ１として、大腿骨近位部、骨盤、又は大腿骨のＤＲＲ画像から肋骨、鎖骨、胸椎、腰椎、頸椎、手の骨、又は足の骨の骨密度を推定するモデル、肋骨、鎖骨、又は胸椎のＤＲＲ画像から大腿骨近位部、腰椎、頸椎、手の骨、又は足の骨の骨密度を推定するモデル等が用意されていてもよい。

　本実施形態の情報処理装置１０は、図１１及び図６に示す処理の実行が可能であり、図１１に示す処理によって学習モデル１２Ｍ，１２Ｍ１の学習用の訓練データを生成し、図６に示す処理によって学習モデル１２Ｍ，１２Ｍ１の学習処理を実行する。

　次に、学習モデル１２Ｍ，１２Ｍ１を用いて、被検者の股関節Ｘ線正面画像から当該被検者の大腿骨近位部の骨密度と肋骨の骨密度とを推定する処理について説明する。図１８は実施形態４の骨密度の推定処理手順の一例を示すフローチャート、図１９は画面例を示す説明図である。図１８に示す処理は、図７に示す処理において、ステップＳ４６の後にステップＳ９１～Ｓ９６を追加したものである。図７と同じステップについては説明を省略する。情報処理装置１０の制御部１１は、図７中のステップＳ４１～Ｓ４６と同様の処理を実行する。これにより、情報処理装置１０は、被検者の股関節Ｘ線正面画像から当該被検者の大腿骨近位部の骨密度を推定し、図８に示すような検査結果画面を表示する。

　制御部１１は、Ｘ線画像の撮影対象以外の部位の骨密度を推定すべきか否かを判断する（Ｓ９１）。例えば、図１９に示すように検査結果画面には、Ｘ線画像の撮影対象以外の部位を選択するための入力欄が設けられており、制御部１１は、入力欄を介して他の部位が入力された場合、入力された部位の骨密度を推定すべきであると判断する。なお、図１９に示す例では、入力欄に任意の部位を選択するためのプルダウンメニューが設けてあり、医師等が、他の部位の骨密度を確認したい場合、プルダウンメニューによって所望の部位を選択する。制御部１１は、他の部位の骨密度を推定しないと判断した場合（Ｓ９１：ＮＯ）、即ち、入力欄に他の部位が入力されなかった場合、処理を終了する。

　制御部１１は、他の部位の骨密度を推定すると判断した場合（Ｓ９１：ＹＥＳ）、入力欄に入力された部位に基づいて、対象部位用の骨密度推定用学習モデル１２Ｍ１を選択する（Ｓ９２）。ここでは、ステップＳ４３で大腿骨近位部の予測ＤＲＲ画像が生成されており、骨密度の推定対象の他の部位として肋骨が選択されているので、制御部１１は、大腿骨近位部のＤＲＲ画像から肋骨の骨密度を推定するための骨密度推定用学習モデル１２Ｍ１を選択する。そして、制御部１１は、選択した骨密度推定用学習モデル１２Ｍ１に対して、ステップＳ４３で生成した大腿骨近位部の予測ＤＲＲ画像を入力し、骨密度推定用学習モデル１２Ｍ１からの出力情報に基づいて、当該被検者の肋骨（他の部位）の骨密度を推定する（Ｓ９３）。その後、制御部１１は、図１２中のステップＳ６４～Ｓ６５と同様の処理を実行し（Ｓ９４～Ｓ９５）、得られた検査結果を、表示中の検査結果画面に出力する（Ｓ９６）。これにより、図１９に示すように、股関節Ｘ線正面画像から推定された大腿骨近位部の骨密度に加えて、当該被検者の肋骨の骨密度を表示することができる。

　本実施形態においても、上述した各実施形態と同様の効果が得られる。また本実施形態では、対象部位を撮影したＸ線画像から、当該対象部位の骨密度だけでなく、他の部位の骨密度を推定して提示することができる。よって、本実施形態では、健康診断又は通院時に撮影したＸ線画像に基づいて、当該Ｘ線画像の撮影対象の部位の骨密度だけでなく、他の部位の骨密度も推定することができる。従って、骨密度を確認したい部位以外の部位のＸ線画像を撮影した場合であっても、骨密度を確認したい部位の骨密度を予測できるので、骨量減少又は骨粗鬆症の早期診断及び早期治療介入につながる可能性がある。また、本実施形態においても、上述した各実施形態で適宜説明した変形例の適用が可能である。

（実施形態５）
　実施形態１の構成と実施形態３の構成とを組み合わせた実施形態について説明する。即ち、本実施形態では、対象部位を撮影したＸ線画像から当該対象部位の骨領域における骨密度を推定すると共に、当該対象部位の筋肉領域における筋肉量を推定する情報処理装置について説明する。本実施形態の情報処理装置は、実施形態１，３の情報処理装置１０と同様の構成を有するので、構成についての説明は省略する。即ち、本実施形態の情報処理装置１０は、対象部位のＸ線画像から当該対象部位の骨領域の予測ＤＲＲ画像を生成する学習モデル１２Ｍと、対象部位のＸ線画像から当該対象部位の筋肉領域の予測ＤＲＲ画像を生成する学習モデル１２Ｍａとを有する。以下の例では、学習モデル１２Ｍは、股関節Ｘ線正面画像から大腿骨近位部の予測ＤＲＲ画像を生成するモデルとし、学習モデル１２Ｍａは、股関節Ｘ線正面画像から臀部の筋肉領域の予測ＤＲＲ画像を生成するモデルとする。しかし、学習モデル１２Ｍ，１２Ｍａはこのような構成に限定されず、また、学習モデル１２Ｍ，１２Ｍａのそれぞれについて複数種類のモデルが用意されていてもよい。例えば、学習モデル１２Ｍとして、胸部のＸ線画像から肋骨、鎖骨、又は胸椎のＤＲＲ画像を生成（予測）するモデルが用意されていてもよく、学習モデル１２Ｍａとして、胸部のＸ線画像から大胸筋、小胸筋、鎖骨下筋、前鋸筋、又は肋間筋のＤＲＲ画像を生成するモデルが用意されていてもよい。

　本実施形態の情報処理装置１０は、図４，図６及び図１５に示す処理の実行が可能であり、図４に示す処理によって学習モデル１２Ｍの学習用の訓練データを生成し、図１５に示す処理によって学習モデル１２Ｍａの学習用の訓練データを生成し、図６に示す処理によって学習モデル１２Ｍ，１２Ｍａの学習処理を実行する。

　次に、学習モデル１２Ｍ，１２Ｍａを用いて、被検者の股関節Ｘ線正面画像から当該被検者の大腿骨近位部の骨密度と臀部の筋肉量とを推定する処理について説明する。図２０は実施形態５の骨密度及び筋肉量の推定処理手順の一例を示すフローチャート、図２１は画面例を示す説明図である。図２０に示す処理は、図７に示す処理において、ステップＳ４１，Ｓ４２の間にステップＳ１０１を追加し、ステップＳ４６の後にステップＳ１０２～Ｓ１０６を追加したものである。図７と同じステップについては説明を省略する。

　情報処理装置１０の制御部１１は、被検者の股関節Ｘ線正面画像を取得した後（Ｓ４１）、取得したＸ線画像に基づいて、大腿骨近位部の骨密度を推定すべきか否かを判断する（Ｓ１０１）。例えば、医師等が、メニュー画面（図示せず）を介して、Ｘ線画像の撮影対象に対して、骨領域の骨密度の推定を行うか、筋肉領域の筋肉量の推定を行うかを指定する。メニュー画面を介して骨領域の骨密度の推定が指定された場合、制御部１１は、大腿骨近位部の骨密度を推定すると判断し（Ｓ１０１：ＹＥＳ）、図７中のステップＳ４２～Ｓ４６と同様の処理を実行する。これにより、情報処理装置１０は、被検者の股関節Ｘ線正面画像から当該被検者の大腿骨近位部の骨密度を推定し、図８に示すような検査結果画面を表示する。

　制御部１１は、大腿骨近位部の骨密度を推定しないと判断した場合（Ｓ１０１：ＮＯ）、ステップＳ１０２の処理に移行し、取得したＸ線画像の撮影対象である臀部の筋肉領域の筋肉量を推定すべきか否かを判断する（Ｓ１０２）。メニュー画面を介して筋肉領域の筋肉量の推定が指定されなかった場合、制御部１１は、臀部の筋肉量を推定しないと判断し（Ｓ１０２：ＮＯ）、処理を終了する。一方、メニュー画面を介して筋肉領域の筋肉量の推定が指定された場合、制御部１１は、臀部の筋肉量を推定すると判断し（Ｓ１０２：ＹＥＳ）、図１６中のステップＳ８１～Ｓ８２、Ｓ４５と同様の処理を実行する（Ｓ１０３～Ｓ１０５）。これにより、情報処理装置１０は、被検者の股関節Ｘ線正面画像から当該被検者の臀部の筋肉領域の筋肉量を推定し、得られた検査結果を、表示中の検査結果画面に出力する（Ｓ１０６）。よって、図２１に示すように、股関節Ｘ線正面画像から推定された大腿骨近位部の骨密度に加えて、当該被検者の臀部の筋肉量を表示することができる。上述した処理により、対象部位のＸ線画像から、対象部位の骨領域の骨密度と筋肉領域の筋肉量とを推定することができ、骨密度及び筋肉量のいずれを又は両方を推定対象とすべきかは、医師等のユーザからの指定によって適宜切り替えることができる。

　本実施形態においても、上述した各実施形態と同様の効果が得られる。また本実施形態では、対象部位を撮影したＸ線画像から、当該対象部位の骨領域の骨密度だけでなく、当該対象部位の筋肉領域の筋肉量を推定して提示することができる。よって、撮影対象における骨の状態と筋肉の状態とを確認することができるので、骨量減少又は骨粗鬆症の早期診断、並びに、サルコペニア等の疾患の早期診断が可能となる。本実施形態においても、上述した各実施形態で適宜説明した変形例の適用が可能である。

（実施形態６）
　上述した実施形態１～５において、同じ被検者の同じ撮影対象を撮影したＸ線画像（単純Ｘ線画像）とＣＴ画像とにおいて、情報処理装置が、Ｘ線画像中の骨領域（対象部位又は関心領域）と、ＣＴ画像中の骨領域（対象部位又は関心領域）とを位置合わせする処理について説明する。本実施形態の情報処理装置は、実施形態１～５の情報処理装置１０と同様の構成を有するので、構成についての説明は省略する。

　図２２は位置合わせ処理手順の一例を示すフローチャート、図２３Ａ～図２４Ｂは位置合わせ処理の説明図である。図２２に示す位置合わせ処理は、図４及び図１１中のステップＳ１６の処理である。よって、本実施形態では、情報処理装置１０の制御部１１は、図４及び図１１のステップＳ１５の処理後に、図２２の処理を実行し、その後、図４及び図１１のステップＳ１７の処理を実行する。以下では、骨盤を関心領域とし、股関節Ｘ線正面画像中の骨盤とＣＴ画像中の骨盤との位置合わせを例に説明するが、位置合わせに用いる骨領域は関心領域に限定されない。Ｘ線画像及びＣＴ画像中に撮影された任意の骨領域を位置合わせに用いることができる。例えば股関節Ｘ線正面画像では、骨盤のほかに、大腿骨、大腿骨近位部等を位置合わせに用いてもよい。

　図４及び図１１のステップＳ１５の処理後、制御部１１は、ステップＳ１１で取得したＸ線画像（ここでは股関節Ｘ線正面画像）中の関心領域（ここでは骨盤）を特定する（Ｓ１１１）。Ｘ線画像中の関心領域を特定する処理は、例えば関心領域の形状を示すテンプレートを用いたパターンマッチングによって行うことができ、また、例えばＸ線画像が入力された場合に、Ｘ線画像中の関心領域を出力するように機械学習された学習モデルを用いて行うことができる。これにより、例えば図２３Ａに示すＸ線画像中に実線で示す骨盤の領域が特定される。

　次に制御部１１は、ステップＳ１５で抽出したＣＴ画像中の関心領域に基づいて、当該関心領域の疑似ＤＲＲ画像を生成する（Ｓ１１２）。ここでは制御部１１は、骨盤の疑似ＤＲＲ画像を生成する。具体的には、制御部１１は、図２３Ｂに示すように、ＣＴ画像中の関心領域（骨盤の３次元ＣＴ画像）をＸ線撮影系の３次元仮想空間に、所定の投影条件（仮想のＸ線源に対する位置及び角度）で配置し、当該関心領域を、仮想のＸ線源から２次元Ｘ線撮像面上に投影した疑似ＤＲＲ画像（投影画像）を生成する。ここで、Ｘ線画像の撮影時とＣＴ画像の撮影時とにおける撮影条件（例えば被検者の姿勢、関節の屈曲角度等）が異なるので、ＣＴ画像から生成した疑似ＤＲＲ画像中の関心領域の輪郭と、Ｘ線画像中の関心領域の輪郭とは一致しない。図２４Ａでは、Ｘ線画像中の関心領域の輪郭Ｐ１を実線で示しており、疑似ＤＲＲ画像中の関心領域の輪郭Ｐ２を破線で示している。本実施形態では、制御部１１が、ＣＴ画像中の関心領域の投影条件を更新することにより、Ｘ線画像中の関心領域の輪郭Ｐ１と、疑似ＤＲＲ画像中の関心領域の輪郭Ｐ２との相関値が最大となる投影条件を特定する。このような投影条件によって、図２４Ｂに示すように、疑似ＤＲＲ画像中の関心領域がＸ線画像中の関心領域に対して正確に位置合わせされた疑似ＤＲＲ画像を得ることができる。

　よって、制御部１１は、ステップＳ１１１で特定したＸ線画像中の関心領域の輪郭と、ステップＳ１１２で生成した疑似ＤＲＲ画像中の関心領域の輪郭との相関値を算出し（Ｓ１１３）、算出した相関値が最大であるか否かを判断する（Ｓ１１４）。制御部１１は、相関値が最大ではないと判断する場合（Ｓ１１４：ＮＯ）、関心領域のＣＴ画像から疑似ＤＲＲ画像を生成する際の投影条件を更新し（Ｓ１１５）、更新後の投影条件でステップＳ１１２～Ｓ１１４の処理を繰り返す。制御部１１は、算出した相関値が最大であると判断するまで、ステップＳ１１２～Ｓ１１５の処理を繰り返し、相関値が最大であると判断した場合（Ｓ１１４：ＹＥＳ）、即ち、相関値が最大となる疑似ＤＲＲ画像を生成できた場合、このときの投影条件を特定する（Ｓ１１６）。

　本実施形態では、制御部１１は、ステップＳ１１２～Ｓ１１５の処理を、例えば本発明者である「大竹義人」等著の論文名「3D-2D registration in mobile radiographs: algorithm development and preliminary clinical evaluation」の論文に記載された方法を用いて行うことができる。当該論文では、ＣＴ画像中の対象部位（骨領域、ここでは骨盤）の３次元領域から生成される当該対象部位のＤＲＲ画像（ここでは疑似ＤＲＲ画像）における輪郭と、実Ｘ線画像中の対象部位の輪郭との位置合わせの達成を、「Ｘ線画像とＤＲＲ画像のそれぞれの濃淡勾配強度画像の相関の最大化」と定義し、共分散行列適応進化戦略（ＣＭＡ－ＥＳ：Covariance matrix adaptation evolution strategy）を用いて、上記の相関を最大化する配置（投影条件、具体的には撮影系に対して対象部位の３次元的な位置及び角度）を求める方法を開示している。よって、制御部１１は、共分散行列適応進化戦略を用いて、Ｘ線画像中の関心領域の輪郭と、疑似ＤＲＲ画像の輪郭との相関値が最大となる疑似ＤＲＲ画像を特定することにより、特定した疑似ＤＲＲ画像における投影条件を特定することができる。このような投影条件では、図２４Ｂに示すように、疑似ＤＲＲ画像中の関心領域の輪郭Ｐ２が、Ｘ線画像中の関心領域の輪郭Ｐ１に対して高精度に位置合わせされた、当該関心領域の疑似ＤＲＲ画像を生成することができる。なお、ステップＳ１１４で制御部１１は、算出した相関値が所定値以上であるか否かを判断し、所定値以上であると判断した場合に、ステップＳ１１６の処理に移行する構成でもよい。

　その後、制御部１１は、図４及び図１１のステップＳ１７の処理に移行し、関心領域のＣＴ画像を、ステップＳ１１６で特定した投影条件に従った投影方向で投影したＤＲＲ画像を生成する（Ｓ１７）。具体的には、制御部１１は、関心領域のＣＴ画像において、ステップＳ１１６で特定した投影条件に従った投影方向に並ぶ各画素の画素値（輝度値、ボクセル値）の積算値を算出し、算出した積算値を、関心領域のＤＲＲ画像の各画素値とする。これにより、Ｘ線画像中の対象部位（関心領域）の撮影条件（Ｘ線源に対する位置及び角度）と同じ投影条件での対象部位のＤＲＲ画像が生成され、Ｘ線画像中の対象部位と正確に位置合わせされた当該対象部位のＤＲＲ画像が得られる。その後、制御部１１は、図４のステップＳ１８～Ｓ１９の処理を実行することにより、Ｘ線画像（股関節Ｘ線正面画像）の半割画像と、Ｘ線画像の撮影方向と同じ方向で投影した関心領域のＤＲＲ画像とを対応付けて、学習モデル１２Ｍの学習用の訓練データを生成することができる。また、制御部１１は、図１１のＳ１９，Ｓ５２を実行することにより、Ｘ線画像と、Ｘ線画像の撮影方向と同じ方向で投影した関心領域のＤＲＲ画像とを対応付けて学習モデル１２Ｍの学習用の訓練データを生成し、当該関心領域のＤＲＲ画像と、ステップＳ５１で取得した関心領域の骨密度とを対応付けて骨密度推定用学習モデル１２Ｍ１の学習用の訓練データを生成できる。

　上述した処理により、対象部位（骨領域である関心領域）のＸ線画像と、Ｘ線画像中の対象部位に対して高精度に位置合わせされた当該対象部位のＤＲＲ画像とが関連付けられた訓練データが生成されて訓練ＤＢ１２ｂに蓄積される。なお、骨領域は硬組織であるので、Ｘ線画像の撮影時とＣＴ画像の撮影時とにおいて変形しないと考えられる。よって、本実施形態のようにＣＴ画像からＤＲＲ画像を生成する際の条件（投影条件）を最適化することによる位置合わせ処理によって、Ｘ線画像中の対象部位（骨領域）の輪郭と、ＣＴ画像から生成されるＤＲＲ画像中の対象部位の輪郭とを正確に位置合わせすることができる。また、本実施形態の情報処理装置１０は、図６に示す処理の実行が可能であり、上述したように生成された訓練データを用いて図６に示す処理によって学習モデル１２Ｍの学習処理を実行することにより、Ｘ線画像から高精度のＤＲＲ画像を予測できる学習モデル１２Ｍを実現できる。更に、本実施形態の情報処理装置１０は、図７、図１２、図１８及び図２０に示す処理の実行が可能であり、上述したように生成された学習モデル１２Ｍを用いることにより、Ｘ線画像から高精度に予測されたＤＲＲ画像によって、対象部位の骨密度を高精度に推定することができ、高精度の検査結果が得られる。

　上述した処理では、図４に示す処理において、ステップＳ１５でＣＴ画像から抽出した関心領域に基づいて、Ｘ線画像とＣＴ画像とにおける関心領域の位置合わせを行う構成であるが、この構成に限定されない。例えば、ステップＳ１４でＣＴ画像から抽出された骨領域に基づいて、Ｘ線画像とＣＴ画像とにおける骨領域の位置合わせを行う構成でもよい。この場合、情報処理装置１０の制御部１１は、図４中のステップＳ１４の処理後に、図２２に示す位置合わせ処理を実行し、位置合わせ処理後のＣＴ画像に基づいてステップＳ１５及びステップＳ１７の処理を実行する。具体的には、制御部１１は、位置合わせ処理後のＣＴ画像から、関心領域（例えば左大腿骨近位部）のデータを抽出し（Ｓ１５）、抽出した関心領域のＣＴ画像から、ステップＳ１１６で特定した投影条件に従った投影方向で投影したＤＲＲ画像を生成する（Ｓ１７）。なお、ここでの図２２に示す処理では、ステップＳ１４で抽出した骨領域を関心領域として、ステップＳ１１１～Ｓ１１６の処理を実行する。その後、制御部１１は、ステップＳ１８～Ｓ１９の処理を実行する。このような処理でも、対象部位（関心領域）のＸ線画像と、Ｘ線画像中の対象部位に対して高精度に位置合わせされた当該対象部位のＤＲＲ画像とが関連付けられた訓練データが生成されて訓練ＤＢ１２ｂに蓄積される。このように生成された訓練データを用いて学習モデル１２Ｍの学習処理を実行することにより、Ｘ線画像から高精度のＤＲＲ画像を予測できる学習モデル１２Ｍを実現できる。また、このように生成された学習モデル１２Ｍを用いることにより、Ｘ線画像からＤＲＲ画像を高精度に予測することができ、高精度に予測されたＤＲＲ画像によって、対象部位の骨密度を高精度に推定することが可能となる。

　本実施形態では、上述した位置合わせ処理以外の処理は、上述した各実施形態と同様であり、上述した各実施形態と同様の効果が得られる。また本実施形態では、Ｘ線画像中の対象部位と、ＣＴ画像中の対象部位との空間的な位置合わせを高精度に行うことができる。よって、このようなＸ線画像と、当該Ｘ線画像と高精度に位置合わせされたＣＴ画像から生成されたＤＲＲ画像とを訓練データに用いることにより、大量の症例数（訓練データ）を必要とせず、Ｘ線画像からＤＲＲ画像を高精度に予測する学習モデル１２Ｍを実現できる。また、本実施形態においても、上述した各実施形態で適宜説明した変形例の適用が可能である。

（実施形態７）
　上述した実施形態１，３に、上述した実施形態６の構成を適用し、情報処理装置が、Ｘ線画像及びＣＴ画像中の骨領域に基づいてＸ線画像及びＣＴ画像中の撮影対象（対象部位又は関心領域）の位置合わせを行い、位置合わせ後のＣＴ画像に基づいて、学習モデル１２Ｍ，１２Ｍａの学習に用いる訓練データを生成する処理について説明する。本実施形態の情報処理装置は、実施形態１，３の情報処理装置１０と同様の構成を有するので、構成についての説明は省略する。即ち、本実施形態の情報処理装置１０は、学習モデル１２Ｍ，１２Ｍａを有する。

　図２５は実施形態７の訓練データの生成処理手順の一例を示すフローチャートである。図２５に示す処理は、図４に示す処理において、ステップＳ１５，Ｓ１６の代わりにステップＳ１２１～Ｓ１２６を追加し、ステップＳ１９，Ｓ２０の間にステップＳ１２７～Ｓ１２９を追加したものである。図４と同じステップについては説明を省略する。

　本実施形態の情報処理装置１０の制御部１１は、図４中のステップＳ１１～Ｓ１４の処理を実行する。なお、ステップＳ１４で制御部１１は、ＣＴ画像から生成された筋骨格ラベル画像に基づいて、ＣＴ画像から任意の骨領域のデータを抽出する。例えば図５に示すＣＴ画像では、制御部１１は、骨盤、大腿骨、大腿骨近位部等の骨領域、あるいは、これらの骨領域の複数又は全部を抽出してもよい。ＣＴ画像中の骨領域を抽出した後、制御部１１は、ＣＴ画像から抽出した骨領域に基づいて、図２２中のステップＳ１１１～Ｓ１１６と同様の処理を実行する（Ｓ１２１～Ｓ１２６）。具体的には、制御部１１は、Ｘ線画像において、ＣＴ画像から抽出した骨領域と同じ骨領域を特定する（Ｓ１２１）。

　次に制御部１１は、ステップＳ１４で抽出したＣＴ画像中の骨領域に基づいて、当該骨領域の疑似ＤＲＲ画像を生成する（Ｓ１２２）。そして、制御部１１は、ステップＳ１２１で特定したＸ線画像中の骨領域の輪郭と、ステップＳ１２２で生成した疑似ＤＲＲ画像中の骨領域の輪郭との相関値を算出し（Ｓ１２３）、算出した相関値が最大であるか否かを判断する（Ｓ１２４）。制御部１１は、相関値が最大ではないと判断する場合（Ｓ１２４：ＮＯ）、骨領域のＣＴ画像から疑似ＤＲＲ画像を生成する際の投影条件を更新し（Ｓ１２５）、更新後の投影条件でステップＳ１２２～Ｓ１２４の処理を繰り返す。制御部１１は、算出した相関値が最大であると判断するまで、ステップＳ１２２～Ｓ１２５の処理を繰り返し、相関値が最大であると判断した場合（Ｓ１２４：ＹＥＳ）、即ち、相関値が最大となる疑似ＤＲＲ画像を生成できた場合、このときの投影条件を特定する（Ｓ１２６）。本実施形態でも、制御部１１は、ステップＳ１２２～Ｓ１２５の処理を、共分散行列適応進化戦略を用いて、Ｘ線画像中の骨領域の輪郭と疑似ＤＲＲ画像の輪郭との相関値が最大となる、疑似ＤＲＲ画像における投影条件を特定する。

　その後、制御部１１は、関心領域（ここでは大腿骨近位部等の骨領域）のＣＴ画像に基づいて、ステップＳ１２６で特定した投影条件に従った投影方向で投影したＤＲＲ画像を生成する（Ｓ１７）。即ち、制御部１１は、Ｘ線画像における関心領域の撮影方向と同じ方向から見た状態の関心領域のＤＲＲ画像を生成する。そして、制御部１１は、ステップＳ１１で取得した股関節Ｘ線正面画像から、左大腿骨近位部を含む半割画像を抽出し（Ｓ１８）、抽出したＸ線画像（股関節Ｘ線正面画像の半割画像）と、ステップＳ１７で生成した関心領域のＤＲＲ画像とを対応付けて訓練データとして訓練ＤＢ１２ｂに記憶する（Ｓ１９）。これにより、対象部位（関心領域である骨領域）のＸ線画像と、Ｘ線画像中の対象部位に対して高精度に位置合わせされＣＴ画像から生成された当該対象部位のＤＲＲ画像とが関連付けられた訓練データが蓄積される。

　次に、制御部１１は、図１５中のステップＳ７１～Ｓ７３と同様の処理を実行する（Ｓ１２７～Ｓ１２９）。具体的には、制御部１１は、筋骨格ラベル画像に基づいて、ＣＴ画像から骨領域のデータを消去し、筋肉領域のデータを抽出する（Ｓ１２７）。ここでも制御部１１は、筋肉の種類毎に関心領域とし、それぞれの関心領域（筋肉領域）のデータ（ＣＴ画像）を抽出する。また制御部１１は、抽出した関心領域（筋肉領域）のデータ（ＣＴ画像）に基づいて、ステップＳ１２６で特定した投影条件に従った投影方向で投影したＤＲＲ画像を生成する（Ｓ１２８）。そして、制御部１１は、ステップＳ１１で取得したＸ線画像と、ステップＳ１２８で生成した関心領域（筋肉領域）のＤＲＲ画像とを対応付けて訓練データとして訓練ＤＢ１２ｂに記憶する（Ｓ１２９）。その後、制御部１１は、ステップＳ２０の処理に移行する。

　上述した処理により、Ｘ線画像及びＣＴ画像における撮影対象（対象部位又は関心領域）に対して骨領域に基づく位置合わせが行われ、位置合わせ後のＸ線画像及びＣＴ画像に基づいて、本実施形態の学習モデル１２Ｍ，１２Ｍａを効率よく学習させることが可能な訓練データを生成できる。このように生成された訓練データを用いて図６に示す学習処理を実行することにより、本実施形態の情報処理装置１０は、Ｘ線画像から当該Ｘ線画像の撮影対象である骨領域のＤＲＲ画像を高精度に予測できる学習モデル１２Ｍ、及び、Ｘ線画像から当該Ｘ線画像の撮影対象である筋肉領域のＤＲＲ画像を高精度に予測できる学習モデル１２Ｍａを生成できる。また、本実施形態の情報処理装置１０は、学習モデル１２Ｍ，１２Ｍａを用いることにより、Ｘ線画像から高精度に予測された骨領域のＤＲＲ画像、及び、Ｘ線画像から高精度に予測された筋肉領域のＤＲＲ画像を生成することができ、対象部位の骨密度及び筋肉量を高精度に推定することができる。

　図２６Ａ及び図２６Ｂは骨領域に基づく位置合わせ処理の効果を示す説明図である。図２６Ａは、本実施形態で示したＸ線画像及びＣＴ画像に対して骨領域に基づく位置合わせ処理を行わずに、Ｘ線画像とＣＴ画像から生成されたＤＲＲ画像とを対応付けた訓練データによって学習させた学習モデル１２Ｍａを用いてＸ線画像から筋肉領域の予測ＤＲＲ画像を生成し、生成した予測ＤＲＲ画像から算出（推定）した当該筋肉領域の筋肉量（具体的には除脂肪筋肉量）と、ＣＴ画像から計測された当該筋肉領域の筋肉量（具体的には除脂肪筋肉量）との関係を示す図表である。図２６Ａの図表は、縦軸に予測ＤＲＲ画像から推定された除脂肪筋肉量を示し、横軸にＣＴ画像から計測された除脂肪筋肉量を示し、図２６Ａ左側には中殿筋の図表を、右側には腸骨筋の図表をそれぞれ示す。図２６Ｂは、本実施形態で示したＸ線画像及びＣＴ画像に対して骨領域に基づく位置合わせ処理を行った後に、Ｘ線画像とＣＴ画像から生成されたＤＲＲ画像とを対応付けた訓練データによって学習させた学習モデル１２Ｍａを用いてＸ線画像から筋肉領域の予測ＤＲＲ画像を生成し、生成した予測ＤＲＲ画像から算出（推定）した当該筋肉領域の筋肉量（具体的には除脂肪筋肉量）と、ＣＴ画像から計測された当該筋肉領域の筋肉量（具体的には除脂肪筋肉量）との関係を示す図表である。図２６Ｂの図表も、縦軸に予測ＤＲＲ画像から推定された除脂肪筋肉量を示し、横軸にＣＴ画像から計測された除脂肪筋肉量を示し、図２６Ｂ左側には中殿筋の図表を、右側には腸骨筋の図表をそれぞれ示す。図２６Ａ及び図２６Ｂに示す図表は、例えば変形性股関節症の患者から収集したＸ線画像及びＣＴ画像から生成された３９０ペアの訓練データを用いて学習した学習モデル１２Ｍａを用いて、５２５人の患者から収集したＸ線画像から予測された予測ＤＲＲ画像から推定した除脂肪筋肉量と、各患者のＣＴ画像から計測した除脂肪筋肉量との比較結果（検証結果）を示している。

　図２６Ａ左側及び図２６Ｂ左側の図表から分かるように、中殿筋の除脂肪筋肉量について、本実施形態の位置合わせを行わない場合の、予測ＤＲＲ画像からの推定値とＣＴ画像からの計測値との相関係数（ＰＣＣ：Pearson Correlation Coefficient）は0.340であり、本実施形態の位置合わせを行った場合の相関係数は0.776であり、本実施形態の位置合わせを行った方が高い相関値が得られた。同様に、図２６Ａ右側及び図２６Ｂ右側の図表から分かるように、腸骨筋の除脂肪筋肉量について、本実施形態の位置合わせを行わない場合の相関係数は0.250であり、本実施形態の位置合わせを行った場合の相関係数は0.804であり、本実施形態の位置合わせを行った方が高い相関値が得られた。よって、本実施形態の位置合わせ処理によって撮影対象が位置合わせされた後のＸ線画像及びＣＴ画像によって生成された訓練データを用いて学習モデル１２Ｍａを学習させることにより、少ない数の訓練データで学習した学習モデル１２Ｍａであっても、ＣＴ画像からの計測値と同程度の筋肉量の推定が可能なＤＲＲ画像を予測できる学習モデル１２Ｍａを実現できる。よって、訓練データの収集処理及び学習処理における作業負荷を軽減できる。

　図２６Ａ及び図２６Ｂの図表では、中殿筋及び腸骨筋の除脂肪筋肉量について、本実施形態の位置合わせを行った方が、より正確な除脂肪筋肉量が得られることを示したが、本発明者による検証処理では、中殿筋及び腸骨筋の筋肉体積についても同様の結果が得られた。なお、除脂肪筋肉量は、ＣＴ画像内のそれぞれの筋肉領域（個別筋肉領域）内のＣＴ値（画素値）に基づいて、各画素における筋肉と脂肪との割合を算出し、算出した割合に基づいて各画素の筋肉量を算出し、各画素の筋肉量の合計によって算出された筋肉量である。筋肉体積は、ＣＴ画像内のそれぞれの筋肉領域（個別筋肉領域）の体積を示す。

　本実施形態では、Ｘ線画像及びＣＴ画像に対して骨領域に基づいて位置合わせ処理を行うことにより、位置合わせ処理後のＸ線画像及びＣＴ画像は、筋肉領域についても正確に位置合わせされた状態となる。このように位置合わせされたＸ線画像中の筋肉領域と、ＣＴ画像から生成された当該筋肉領域のＤＲＲ画像とによる訓練データを用いて学習モデル１２Ｍａを学習させることにより、ＣＴ画像から計測された各筋肉領域の筋肉量（例えば除脂肪筋肉量、筋肉体積）と同程度の筋肉量の推定が可能な筋肉領域のＤＲＲ画像を予測できる学習モデル１２Ｍａを実現できる。また、本実施形態では、位置合わせされたＣＴ画像から骨領域のデータを消去することにより、骨領域の影響を排除したＣＴ画像（筋肉領域のデータ）を抽出し、このようなＣＴ画像を用いることにより、学習モデル１２Ｍａの学習に用いる訓練データを高精度に生成することができる。よって、本実施形態では、学習モデル１２Ｍを用いてＸ線画像から生成される骨領域の予測ＤＲＲ画像によって、骨密度を高精度に推定できるだけでなく、学習モデル１２Ｍａを用いてＸ線画像から生成される筋肉領域の予測ＤＲＲ画像によって、筋肉量を高精度に推定することが可能となる。

　本実施形態では、学習モデル１２Ｍ，１２Ｍａの学習に用いる訓練データを生成する際に、Ｘ線画像及びＣＴ画像中の撮影対象を骨領域に基づいて位置合わせする処理以外は、上述した各実施形態と同様であり、上述した各実施形態と同様の効果が得られる。また本実施形態では、骨領域に基づく位置合わせが行われたＸ線画像及びＣＴ画像に基づいて、学習モデル１２Ｍの学習に用いる訓練データだけでなく、学習モデル１２Ｍａの学習に用いる訓練データを生成するので、Ｘ線画像から当該Ｘ線画像中の筋肉領域のＤＲＲ画像を高精度に予測する学習モデル１２Ｍａを実現できる。本実施形態においても、上述した各実施形態で適宜説明した変形例の適用が可能である。

（実施形態８）
　上述した実施形態３，７において、対象部位（例えば下腹部、臀部等）のＸ線画像から当該対象部位に含まれる筋肉領域（例えば大殿筋、中殿筋、腸骨筋等）の予測ＤＲＲ画像を生成する学習モデル１２Ｍａの変形例について説明する。本実施形態の情報処理装置は、実施形態１，３，７の情報処理装置１０と同様の構成を有するので、構成についての説明は省略する。

　図２７は実施形態８の学習モデル１２Ｍｂの構成例を示す説明図である。学習モデル１２Ｍｂは、対象部位のＸ線画像を入力とし、入力されたＸ線画像に基づいて、当該対象部位に含まれる筋肉領域のＤＲＲ画像及び筋肉量を予測する演算を行い、演算結果を出力するように学習済みのモデルである。図２７に示す学習モデル１２Ｍｂは、股関節Ｘ線正面画像を入力とし、大殿筋のＤＲＲ画像及び筋肉量を予測する構成である。なお、学習モデル１２Ｍｂは、この構成に限定されず、例えば、股関節Ｘ線正面画像を入力とし、中殿筋、腸骨筋等の他の筋肉領域のＤＲＲ画像及び筋肉量を予測する構成でもよく、複数の筋肉領域についてそれぞれのＤＲＲ画像及び筋肉量を予測する構成でもよい。また、学習モデル１２Ｍｂは、胸部Ｘ線正面画像を入力とし、大胸筋、小胸筋、鎖骨下筋、前鋸筋、肋間筋、僧帽筋、広背筋、大円筋、脊柱起立筋等の筋肉領域のＤＲＲ画像及び筋肉量を予測する構成でもよい。筋肉量は、例えば除脂肪筋肉量、筋肉体積、筋肉密度等、筋肉に関する何らかの量を示す情報を用いることができる。

　本実施形態の学習モデル１２Ｍｂは、画像変換層１２Ｍｂ１及び筋肉量予測層１２Ｍｂ２を有する。学習モデル１２Ｍｂの入力データであるＸ線画像は、画像変換層１２Ｍｂ１に入力され、画像変換層１２Ｍｂ１は、入力されたＸ線画像に基づいて、当該Ｘ線画像に含まれる筋肉領域（例えば大殿筋）のＤＲＲ画像を生成して出力する。画像変換層１２Ｍｂ１によって生成された筋肉領域のＤＲＲ画像は、筋肉量予測層１２Ｍｂ２に入力され、筋肉量予測層１２Ｍｂ２は、入力された筋肉領域のＤＲＲ画像に基づいて、当該筋肉領域の筋肉量（例えば除脂肪筋肉量、筋肉体積、筋肉密度等）を予測して出力する。

　画像変換層１２Ｍｂ１は、例えば、ｐｉｘ２ｐｉｘ、ＣｙｃｌｅＧＡＮ、ＳｔａｒＧＡＮ等のＧＡＮ、ＶＡＥ、ＣＮＮ（例えばＵ－ｎｅｔ）等のニューラルネットワーク、あるいはその他の学習アルゴリズムに基づくモデルで構成されてもよく、複数の学習アルゴリズムを組み合わせて構成されてもよい。なお、画像変換層１２Ｍｂ１がｐｉｘ２ｐｉｘで構成される場合、画像変換層１２Ｍｂ１は、図１４に示す学習モデル１２Ｍａと同様の構成を有してもよい。筋肉量予測層１２Ｍｂ２は、例えばＣＮＮ、ランダムフォレスト、ＳＶＭ（Support Vector Machine）、Transformer等のアルゴリズムを用いて構成することができ、複数のアルゴリズムを組み合わせて構成してもよい。なお、学習モデル１２Ｍｂは筋肉量予測層１２Ｍｂ２を備えていなくてもよく、筋肉量予測層１２Ｍｂ２の代わりに、情報処理装置１０の制御部１１が、画像変換層１２Ｍｂ１によって生成された筋肉領域のＤＲＲ画像中の各画素の画素値（輝度値）の総和に基づいて、当該筋肉領域の筋肉量を算出する処理を行う構成でもよい。

　本実施形態の学習モデル１２Ｍｂは、訓練用のＸ線画像（股関節Ｘ線正面画像）と、正解となる大殿筋のＤＲＲ画像及び当該大殿筋の筋肉量とを関連付けた訓練データを用いて学習することにより生成される。訓練用のＸ線画像、正解のＤＲＲ画像及び筋肉量は、例えばＤＸＡ装置によって骨密度正常症例、骨粗鬆症例、骨量減少例のいずれかと診断された被検者の股関節Ｘ線正面画像、ＤＲＲ画像、及び筋肉量であることが望ましい。なお、正解の大殿筋のＤＲＲ画像は、臀部（下腹部）をＸ線ＣＴ装置で撮影したＣＴ画像から生成された大殿筋（筋肉領域）のＤＲＲ画像を用いることができる。また、正解の大殿筋の筋肉量は、ＣＴ画像中の筋肉領域（大殿筋）内のＣＴ値（輝度値）から、各画素における筋肉と脂肪との割合に基づいて算出した各画素の筋肉量の合計によって算出された大殿筋の筋肉量を用いてもよく、ＤＸＡ装置によって測定された大殿筋の筋肉量を用いてもよい。

　本実施形態の学習モデル１２Ｍｂは、訓練データに含まれるＸ線画像が入力された場合に、訓練データに含まれる正解のＤＲＲ画像及び筋肉量を出力するように学習する。学習処理において学習モデル１２Ｍｂは、入力されたＸ線画像に基づいて演算を行い、入力されたＸ線画像中の大殿筋のＤＲＲ画像及び筋肉量を予測し、予測結果を出力する。そして、学習モデル１２Ｍｂは、予測したＤＲＲ画像と正解のＤＲＲ画像とを比較すると共に、予測した筋肉量と正解の筋肉量とを比較し、それぞれが近似するように、画像変換層１２Ｍｂ１及び筋肉量予測層１２Ｍｂ２におけるノード間の重み（結合係数）等のパラメータを、最急降下法、誤差逆伝播法等を用いて最適化する。即ち、本実施形態では、学習モデル１２Ｍｂの学習処理において、学習モデル１２Ｍｂが生成した筋肉領域のＤＲＲ画像に基づく筋肉量と、正解の筋肉量との差異（誤差、筋肉量に関する損失）をフィードバックすることができる。よって、本実施形態の学習処理によれば、Ｘ線画像が入力された場合に、Ｘ線画像に含まれる筋肉領域のＤＲＲ画像及び筋肉量をより高精度に予測する学習モデル１２Ｍｂが生成される。

　なお、本実施形態の学習モデル１２Ｍｂは、筋肉量予測層１２Ｍｂ２を備えない構成でもよい。この場合、学習モデル１２Ｍｂの学習処理において、情報処理装置１０の制御部１１は、学習モデル１２ＭｂにＸ線画像を入力して学習モデル１２Ｍｂから筋肉領域のＤＲＲ画像を取得し、取得したＤＲＲ画像から、当該筋肉領域の筋肉量を算出する。そして、制御部１１は、算出した筋肉量と、正解の筋肉量との差分を算出し、算出した差分が小さくなるように（算出した筋肉量が正解の筋肉量に近似するように）学習モデル１２Ｍｂ（画像変換層１２Ｍｂ１）を学習させてもよい。このような学習処理においても、学習モデル１２Ｍｂが生成した筋肉領域のＤＲＲ画像に基づく筋肉量と、正解の筋肉量との差異（誤差、筋肉量に関する損失）をフィードバックすることができ、入力されたＸ線画像に含まれる筋肉領域のＤＲＲ画像及び筋肉量を高精度に予測できる学習モデル１２Ｍｂを生成できる。

　本実施形態の情報処理装置１０は、図２５に示す処理の実行が可能であり、図２５に示す処理によって学習モデル１２Ｍｂの学習用の訓練データを生成し、図６に示す処理によって学習モデル１２Ｍｂの学習処理を実行する。なお、図２５に示す処理において、情報処理装置１０の制御部１１は、ステップＳ１２８の処理後、ステップＳ１２８で生成した筋肉領域のＤＲＲ画像に基づいて、当該筋肉領域の筋肉量を算出する。そして、制御部１１は、ステップＳ１２９で、ステップＳ１１で取得したＸ線画像と、ステップＳ１２８で生成した関心領域（筋肉領域）のＤＲＲ画像と、ＤＲＲ画像から算出した筋肉量とを対応付けて訓練データとして訓練ＤＢ１２ｂに記憶する。なお、当該筋肉領域の筋肉量は、ＤＸＡ装置によって測定された筋肉量を用いてもよく、この場合、制御部１１は、例えばステップＳ１１でＸ線画像及びＣＴ画像と共にＤＸＡ装置で測定された筋肉量を取得し、取得した筋肉量を訓練データに用いることができる。また、図６に示す処理において、制御部１１は、ステップＳ３１で、記憶部１２に記憶してあるＸ線画像、ＤＲＲ画像及び筋肉量のセットを１つ読み出し、ステップＳ３２で、読み出した訓練データを用いて学習モデル１２Ｍｂの学習処理を行う。更に、本実施形態の情報処理装置１０は、図１６に示す処理の実行が可能であり、上述したように生成された学習モデル１２Ｍｂを用いることにより、Ｘ線画像中の筋肉領域のＤＲＲ画像を高精度に予測し、予測したＤＲＲ画像によって、筋肉領域の筋肉量を高精度に推定することができる。

　図２８Ａ及び図２８Ｂは筋肉量に関する損失のフィードバック処理の効果を示す説明図である。図２８Ａは、上述したように筋肉量に関する損失のフィードバック処理を行わずに学習した学習モデル（例えば学習モデル１２Ｍａ）を用いてＸ線画像から筋肉領域の予測ＤＲＲ画像を生成し、生成した予測ＤＲＲ画像から算出（推定）した当該筋肉領域の筋肉量（具体的には除脂肪筋肉量）と、ＣＴ画像から計測された当該筋肉領域の筋肉量（具体的には除脂肪筋肉量）との関係を示す図表である。図２８Ａの図表は、縦軸に予測ＤＲＲ画像から推定された除脂肪筋肉量を示し、横軸にＣＴ画像から計測された除脂肪筋肉量を示し、図２８Ａ左側には中殿筋の図表を、右側には腸骨筋の図表をそれぞれ示す。図２８Ｂは、上述したように筋肉量に関する損失のフィードバック処理を行って学習した学習モデル１２Ｍｂを用いてＸ線画像から筋肉領域の予測ＤＲＲ画像を生成し、生成した予測ＤＲＲ画像から算出（推定）した当該筋肉領域の筋肉量（具体的には除脂肪筋肉量）と、ＣＴ画像から計測された当該筋肉領域の筋肉量（具体的には除脂肪筋肉量）との関係を示す図表である。図２８Ｂの図表は、縦軸に予測ＤＲＲ画像から推定された除脂肪筋肉量を示し、横軸にＣＴ画像から計測された除脂肪筋肉量を示し、図２８Ｂ左側には中殿筋の図表を、右側には腸骨筋の図表をそれぞれ示す。図２８Ａ及び図２８Ｂに示す図表は、例えば変形性股関節症の患者から収集したＸ線画像及びＣＴ画像から生成された３９０ペアの訓練データを用いて学習した学習モデル１２Ｍｂを用いて、５２５人の患者から収集したＸ線画像から予測された予測ＤＲＲ画像から推定した除脂肪筋肉量と、各患者のＣＴ画像から計測した除脂肪筋肉量との比較結果（検証結果）を示している。

　図２８Ａ左側及び図２８Ｂ左側の図表から分かるように、中殿筋の除脂肪筋肉量について、上述した筋肉量に関する損失のフィードバック処理を行わない場合の、予測ＤＲＲ画像からの推定値とＣＴ画像からの計測値との相関係数は0.776であり、フィードバック処理を行った場合の相関係数は0.874であり、筋肉量に関する損失のフィードバック処理を行った方が高い相関値が得られた。同様に、図２８Ａ右側及び図２８Ｂ右側の図表から分かるように、腸骨筋の除脂肪筋肉量について、筋肉量に関する損失のフィードバック処理を行わない場合の相関係数は0.804であり、フィードバック処理を行った場合の相関係数は0.861であり、筋肉量に関する損失のフィードバック処理を行った方が高い相関値が得られた。よって、学習モデル１２Ｍｂの学習処理の際に筋肉量に関する損失のフィードバック処理を行うことにより、少ない数の訓練データで学習した学習モデル１２Ｍｂであっても、ＣＴ画像からの計測値と同程度の筋肉量の推定が可能なＤＲＲ画像を予測できる学習モデル１２Ｍｂを実現できる。

　本実施形態においても、図２８Ａ及び図２８Ｂの図表では、中殿筋及び腸骨筋の除脂肪筋肉量について、学習モデル１２Ｍｂの学習処理の際に筋肉量に関する損失のフィードバック処理を行った方が、より正確な除脂肪筋肉量が得られることを示したが、本発明者による検証処理では、中殿筋及び腸骨筋の筋肉体積についても同様の結果が得られた。

　本実施形態では、学習モデル１２Ｍｂの学習の際に、学習モデル１２Ｍｂ（画像変換層１２Ｍｂ１）が生成した筋肉領域のＤＲＲ画像から算出される当該筋肉領域の筋肉量について、正解の筋肉量との誤差（損失）をフィードバックする処理以外は、上述した各実施形態と同様であり、上述した各実施形態と同様の効果が得られる。また本実施形態では、学習モデル１２Ｍｂの学習処理において、画像変換層１２Ｍｂ１が生成したＤＲＲ画像と正解のＤＲＲ画像との誤差に加えて、筋肉量の誤差（損失）をフィードバックすることができるので、Ｘ線画像から当該Ｘ線画像中の筋肉領域のＤＲＲ画像をより高精度に予測できる学習モデル１２Ｍｂを実現できる。本実施形態においても、上述した各実施形態で適宜説明した変形例の適用が可能である。

　上述した各実施形態は、学習モデル１２Ｍ，１２Ｍａ，１２Ｍｂの入力データとして、レントゲン装置（Ｘ線装置）で対象部位を撮影した単純Ｘ線画像を用いる構成であるが、この構成に限定されない。例えば、ＤＸＡ装置で得られるＸ線画像を、学習モデル１２Ｍ，１２Ｍａ，１２Ｍｂの入力データに用いる構成でもよい。このような構成とした場合でも、通常のＸ線画像（レントゲン装置で撮影したＸ線画像）を入力データに用いる場合と同様の処理の実行が可能であり、同様の効果が得られる。また、上述した各実施形態において、学習モデル１２Ｍ，１２Ｍａ，１２Ｍｂの訓練データに用いる正解のＤＲＲ画像（ＣＴ画像から得られる対象部位の体組織量に関する情報）の代わりに、ＭＲＩ（Magnetic Resonance Imaging：磁気共鳴画像法）画像等、対象部位の筋肉及び骨の組成を推定できる３次元画像から得られる２次元画像（体組織量に関する情報）を訓練データに用いる構成でもよい。このような構成とした場合でも、ＣＴ画像から得られるＤＲＲ画像を用いる場合と同様の処理の実行が可能であり、同様の効果が得られる。

　今回開示された実施の形態はすべての点で例示であって、制限的なものではないと考えられるべきである。本発明の範囲は、上記した意味ではなく、請求の範囲によって示され、請求の範囲と均等の意味及び範囲内でのすべての変更が含まれることが意図される。

　１０　　　情報処理装置
　１１　　　制御部
　１２　　　記憶部
　１３　　　通信部
　１４　　　入力部
　１５　　　表示部
　１２ａ　　医療画像ＤＢ
　１２ｂ　　訓練ＤＢ
　１２Ｍ　　学習モデル
　１２Ｍａ　学習モデル
　１２Ｍ１　骨密度推定用学習モデル

Claims

　対象部位のＸ線画像と、前記対象部位のＣＴ（Computed Tomography：コンピュータ断層撮影）画像から得られる体組織量に関する情報とを含む訓練データを取得し、
　取得した訓練データを用いて、Ｘ線画像を入力した場合に前記Ｘ線画像中の対象部位の体組織量に関する情報を出力する学習モデルを生成する
　処理をコンピュータに実行させるプログラム。
　前記Ｘ線画像を入力した場合に、前記対象部位の体組織量を表す画像を出力する前記学習モデルを生成する
　処理を前記コンピュータに実行させる請求項１に記載のプログラム。
　前記ＣＴ画像に基づく前記対象部位の位置と、前記Ｘ線画像に基づく前記対象部位の位置との位置合わせを行い、
　位置合わせ後の前記ＣＴ画像から得られる前記対象部位の体組織量に関する情報を含む前記訓練データを取得する
　処理を前記コンピュータに実行させる請求項１又は２に記載のプログラム。
　前記ＣＴ画像に基づいて、前記ＣＴ画像中の前記対象部位を、骨領域及び筋肉領域を含む複数領域に分類し、
　分類された前記ＣＴ画像中の骨領域の骨密度に関する情報を含む前記訓練データを取得し、
　前記訓練データを用いて、Ｘ線画像を入力した場合に前記Ｘ線画像中の前記骨領域の骨密度に関する情報を出力する前記学習モデルを生成する
　処理を前記コンピュータに実行させる請求項１～３のいずれか１つに記載のプログラム。
　前記ＣＴ画像に基づいて、前記ＣＴ画像中の前記対象部位を、骨領域及び筋肉領域を含む複数領域に分類し、
　分類された前記ＣＴ画像中の筋肉領域の筋肉量に関する情報を含む前記訓練データを取得し、
　前記訓練データを用いて、Ｘ線画像を入力した場合に前記Ｘ線画像中の前記筋肉領域の筋肉量に関する情報を出力する前記学習モデルを生成する
　処理を前記コンピュータに実行させる請求項１～４のいずれか１つに記載のプログラム。
　前記学習モデルは、入力されたＸ線画像から前記対象部位の体組織量に関する情報を生成する生成器と、前記生成器が生成した体組織量に関する情報の真偽を識別する識別器とを有し、
　前記生成器及び識別器を敵対的に学習させることで前記学習モデルを生成する
　処理を前記コンピュータに実行させる請求項１～５のいずれか１つに記載のプログラム。
　前記対象部位のＣＴ画像から得られる前記対象部位の体組織量に関する情報と、前記対象部位とは異なる部位の体組織量に関する情報とを含む訓練データを取得し、
　取得した訓練データを用いて、前記対象部位の体組織量に関する情報を入力した場合に前記対象部位とは異なる部位の体組織量に関する情報を出力する第２の学習モデルを生成する
　処理を前記コンピュータに実行させる請求項１～６のいずれか１つに記載のプログラム。
　前記ＣＴ画像中の前記対象部位に含まれる骨領域を投影した画像と、前記Ｘ線画像中の前記対象部位に含まれる骨領域との相関値が最大となる投影条件を特定し、
　特定した投影条件で前記ＣＴ画像中の前記対象部位を投影した投影画像から得られる前記対象部位の体組織量に関する情報を含む前記訓練データを取得する
　処理を前記コンピュータに実行させる請求項１～７のいずれか１つに記載のプログラム。
　特定した前記投影条件で前記ＣＴ画像中の前記対象部位を投影した投影画像から骨領域のデータを消去し、
　前記骨領域のデータが消去された前記投影画像中の筋肉領域の筋肉量に関する情報を含む前記訓練データを取得し、
　前記訓練データを用いて、Ｘ線画像を入力した場合に前記Ｘ線画像中の筋肉領域の筋肉量に関する情報を出力する前記学習モデルを生成する
　処理を前記コンピュータに実行させる請求項８に記載のプログラム。
　前記訓練データは、前記対象部位のＸ線画像と、前記対象部位のＣＴ画像から得られる前記対象部位の筋肉領域を表す画像と、前記筋肉領域の筋肉量とを含み、
　前記学習モデルは、Ｘ線画像を入力した場合に前記Ｘ線画像中の筋肉領域を示す画像を出力するように構成してあり、
　前記訓練データに含まれるＸ線画像を入力した場合に前記学習モデルが出力する前記Ｘ線画像中の筋肉領域を示す画像に基づいて算出される筋肉量が、前記訓練データに含まれる筋肉量に近似するように前記学習モデルを学習させる
　処理を前記コンピュータに実行させる請求項１～９のいずれか１つに記載のプログラム。
　対象部位のＸ線画像を取得し、
　対象部位のＸ線画像と、前記対象部位のＣＴ画像から得られる体組織量に関する情報とを含む訓練データを用いて学習されており、Ｘ線画像を入力した場合に前記Ｘ線画像中の対象部位の体組織量に関する情報を出力する学習モデルに、取得した前記Ｘ線画像を入力して前記対象部位の体組織量に関する情報を出力する
　処理をコンピュータに実行させるプログラム。
　出力する前記体組織量に関する情報は、前記対象部位の体組織量を表す画像である
　請求項１１に記載のプログラム。
　出力する前記体組織量に関する情報は、前記対象部位の骨密度である
　請求項１１又は１２に記載のプログラム。
　前記Ｘ線画像中の対象部位とは異なる部位の体組織量に関する情報をさらに出力する
　処理を前記コンピュータに実行させる請求項１１～１３のいずれか１つに記載のプログラム。
　出力する前記体組織量に関する情報は、前記対象部位の筋肉量である
　請求項１１～１４のいずれか１つに記載のプログラム。
　前記学習モデルは、前記ＣＴ画像中の前記対象部位に含まれる骨領域を投影した画像と、前記Ｘ線画像中の前記対象部位に含まれる骨領域との相関値が最大となる投影条件で前記ＣＴ画像中の前記対象部位を投影した投影画像から骨領域のデータが消去された前記投影画像中の筋肉領域の筋肉量に関する情報を含む前記訓練データを用いて、Ｘ線画像を入力した場合に前記Ｘ線画像中の筋肉領域の筋肉量に関する情報を出力するように学習してある
　請求項１１～１５のいずれか１つに記載のプログラム。
　前記学習モデルは、前記対象部位のＸ線画像と、前記対象部位のＣＴ画像から得られる前記対象部位の筋肉領域を表す画像と、前記筋肉領域の筋肉量とを含む前記訓練データを用いて、前記訓練データに含まれるＸ線画像を入力した場合に出力する前記Ｘ線画像中の筋肉領域を示す画像に基づいて算出される筋肉量が、前記訓練データに含まれる筋肉量に近似するように学習してある
　請求項１１～１６のいずれか１つに記載のプログラム。
　対象部位のＸ線画像を取得し、
　対象部位のＸ線画像と、前記対象部位のＣＴ画像から得られる体組織量に関する情報とを含む訓練データを用いて学習されており、Ｘ線画像を入力した場合に前記Ｘ線画像中の対象部位の体組織量に関する情報を出力する学習モデルに、取得した前記Ｘ線画像を入力して前記対象部位の体組織量に関する情報を出力する
　処理をコンピュータが実行する情報処理方法。
　制御部を有する情報処理装置において、
　前記制御部が、
　対象部位のＸ線画像を取得し、
　対象部位のＸ線画像と、前記対象部位のＣＴ画像から得られる体組織量に関する情報とを含む訓練データを用いて学習されており、Ｘ線画像を入力した場合に前記Ｘ線画像中の対象部位の体組織量に関する情報を出力する学習モデルに、取得した前記Ｘ線画像を入力して前記対象部位の体組織量に関する情報を出力する
　情報処理装置。