JP7408000B1

JP7408000B1 - 骨粗鬆症による骨折の推測及び予測の少なくとも一方の方法、骨折スコア出力方法、学習モデル生成方法、学習モデル、骨粗鬆症による骨折のリスク因子推定方法、グラフ作成方法、プログラム、情報処理装置、並びに、学習データセット作成方法

Info

Publication number: JP7408000B1
Application number: JP2023101241A
Authority: JP
Inventors: 威久山本
Original assignee: Individual
Current assignee: Individual
Priority date: 2022-06-20
Filing date: 2023-06-20
Publication date: 2024-01-04
Anticipated expiration: 2043-06-20
Also published as: JP2024003774A

Abstract

【課題】骨折推測・予測方法、骨折スコア出力方法、学習モデル及び生成方法、リスク因子推定方法、プログラム、情報処理装置、学習データセット作成方法を提供する。【解決手段】学習モデルに臨床情報を入力し骨折スコアを出力させ、学習モデルは骨折の有無及び骨折数から選ばれた１種以上を判定された各被験者の臨床情報を入力され骨折スコアを出力する機械学習し、臨床情報は、年齢、身長、体重、ＢＭＩ、骨密度、骨代謝マーカー、腎機能マーカー、骨格筋量マーカー、既存身長低下、初経年齢、閉経年齢、閉経からの年数、経過期間の長さ、ＦＲＡＸ結果、骨密度予測値、骨量減少率予測値等から選ばれる４種以上のデータを含み、各被験者の骨折スコアは判定結果と４種以上のデータを含む５種以上の観測変数を設ける共分散構造分析で判定結果の観測変数に対し直接的に有意な因果関係が認められる潜在変数の因子得点である、骨折スコア出力方法である。【選択図】図１

Description

本発明は、骨粗鬆症による骨折の推測及び予測の少なくとも一方の方法と、推測や予測の指標となる骨折スコアを出力する方法と、骨折スコアを出力可能な学習モデル及びその生成方法と、骨粗鬆症による骨折のリスク因子推定方法と、プログラムと、情報処理装置と、学習データセット作成方法とに関する。また、本発明は、骨粗鬆症や骨折に限られない合併症（ある病気が原因となって起こる他の病気）について、合併症のリスク因子推定方法に関する。

ヒトの骨量は、学童期から思春期に増加し、２０歳前後で最大値を示した後、安定的に推移する。その後、女性では、一般的に５０歳前後で閉経により女性ホルモン（エストロゲン）が急激に枯渇し、閉経後１０年ほどの間に骨量が著しく減少し、骨量減少または骨粗鬆症と診断される領域へと進行する。骨粗鬆症は、２０００年に米国立衛生研究所（ＮＩＨ）のコンセンサス会議で「骨強度の低下を特徴とし、骨折リスクが増大しやすくなる骨格疾患」と定義された。ここでの骨強度は、骨密度（bone mineral density：以下「ＢＭＤ」ともいう）と骨質という２つの要因からなる（骨強度＝ＢＭＤ＋骨質）。ＢＭＤは骨強度のほぼ７０％を説明でき、残る３０％は骨質（例えば、骨の微細構造、骨代謝回転、微小骨折（マイクロクラック）又は骨組織の石灰化度等）で説明できるとされる。つまり、骨粗鬆症では、ＢＭＤ低下や骨質劣化により骨強度が低下し、骨折の危険性が増す。骨粗鬆症において骨折は、骨強度低下という病状進行に伴って生じ得る合併症の一つといえる。骨粗鬆症による骨折は、骨強度低下により、わずかな外力で生じ得る非外傷性の骨折で、「骨粗鬆症性骨折」又は「脆弱性骨折」ともいわれる。

日本では超高齢化社会を迎え、骨粗鬆症患者数が増え続けている。近年、日本において腰椎又は大腿骨近位部で骨粗鬆症と診断された患者数は、男性で約３００万人、女性で約９８０万人といわれ（非特許文献１参照）、女性で圧倒的に多い。骨粗鬆症による骨折は、患者のＱＯＬ（quality of life）やＡＤＬ（activities of daily living）を著しく低下させ、入院治療のために医療費の個人負担額や国の医療保険費用を増大させ、医療経済を悪化させる社会問題となっている。また、骨粗鬆症による腰椎や胸椎の骨折は、別名で「いつのまにか骨折」ともいい、強い疼痛を伴わず患者の自覚なく生じる場合が多く、１つ目の骨折が生じると２つ目の骨折が生じるリスクが約３倍になるといわれる。これらの問題を改善するには、例えば、検診で骨粗鬆症を早期段階で発見し、適切な薬物治療や患者指導（リエゾン）で早期予防・治療を図ることが、臨床医学での重要な課題と考えられる。

従来、骨粗鬆症による骨折リスクの定量的評価方法としては、世界保健機関（ＷＨＯ）の提唱（非特許文献２）に基づき、骨折確率算定モデルによる骨折リスク評価ツールであるＦＲＡＸ（登録商標、以下同じ）が活用されている。ＦＲＡＸでは、大腿骨近位部骨折、上腕骨近位部骨折、橈骨遠位端骨折及び臨床椎体骨折をまとめて「主要骨粗鬆症性骨折」としている。ここでの「臨床椎体骨折」は、腰背部痛等の明らかな症状があり、エックス線写真により椎体骨折が確認されたものを指す。ＦＲＡＸを用いる場合、例えば、インターネットで非特許文献３に係るウェブサイトにアクセスし、骨粗鬆症による骨折リスクを予測される対象者について少なくとも次の１１種の骨折危険因子を入力すると、対象者の大腿骨近位部骨折と主要骨粗鬆症性骨折とについて１０年間での発生確率が算出される。１１種の骨折危険因子は、年齢、性別、体重、身長、骨折歴（骨折既往）の有無、両親の大腿骨近位部骨折歴の有無、現在の喫煙の有無、糖質コルチコイドの経口投与の有無、関節リウマチの確定診断の有無、続発性骨粗鬆症との間で強い関連性がある疾患（例えばＩ型糖尿病又は甲状腺機能亢進症等）の有無、及び、１日３単位（１単位：エタノール８～１０ｇ）以上のアルコール摂取の有無である。この１１種の骨折危険因子に、さらに、大腿骨近位部ＢＭＤを加え、合計１２種の骨折危険因子を入力してもよい。非特許文献１には、ＢＭＤが７０％ＹＡＭよりも大きく８０％ＹＡＭ未満である対象者（ただし、７５歳以上の女性を除く）について、「ＦＲＡＸの１０年間の主要骨粗鬆症性骨折確率１５％以上」を、骨粗鬆症の治療開始基準とする旨、記載されている。

また、特許文献１に記載されたように、本願に係る発明者は以前に、人工ニューラルネットワーク（Artificial Neural Network：以下「ＡＮＮ」ともいう）に機械学習させた学習モデルを用い、閉経後女性での将来の骨量を予測する方法を創作した。この学習モデルは、閉経後の任意の時点のＢＭＤ等の情報を入力されると、その時点から５年以上経過した第２時点のＢＭＤと、この５年以上の経過期間内の骨量減少率（bone loss rate：以下「ＢＬＲ」ともいう）とを出力するように機械学習したモデルであり、以下「ＢＬＲ予測値を出力可能な学習モデル」ともいう。この学習モデルで、ＢＭＤと共に入力するデータとして、年齢、身長、体重、体格指数（body mass index：以下「ＢＭＩ」ともいう）、体脂肪率、除脂肪体重、体脂肪量、初経年齢、閉経年齢、閉経後経過年数、及び、これらの数値を間接的に示す情報から選ばれた１種以上の臨床データが挙げられる。

また、特許文献２に記載されたように、本願に係る発明者は以前に、川崎病又はＩｇＡ血管炎での合併症発生リスク予測方法を創作した。このリスク予測方法では、合併症発生の有無を判定された川崎病又はＩｇＡ血管炎の患者について、この患者での前記判定の結果及び３種以上の臨床データの各々を観測変数として、共分散構造分析を行う。また、この患者の３種以上の臨床データと、共分散構造分析により算出されたサンプルスコア（潜在変数の因子得点）との関係を機械学習した学習済みモデルを生成する。生成された学習済みモデルは、新規患者の３種以上の臨床データを入力されると、この新規患者の合併症発生リスクに関するサンプルスコアの予測値を出力可能である。

特許第６５８５８６９号公報特許第６９８６６５０号公報特許第６７０３４１２号公報

骨粗鬆症の予防と治療ガイドライン作成委員会、「骨粗鬆症の予防と治療ガイドライン２０１５年版」、一般社団法人日本骨粗鬆症学会、一般社団法人日本骨代謝学会、公益財団法人骨粗鬆症財団、２０１５年「WHO scientific group on the assessment of osteoporosis at primary health care level」、World Health Organization、Summary Meeting Report Brussels, Belgium 2004 「ＦＲＡＸ骨折リスク評価ツール」、[online]、［令和４年２月１０日検索］、インターネット、<URL: https://www.sheffield.ac.uk/FRAX/tool.aspx?lang=jp > Paul Deurenberg、他２名、「Body mass index as a measure of body fatness: age- and sex-specific prediction formulas」、British Journal of Nutrition、１９９１年、第６５巻、第２号、pp.105-114 笠松隆洋、他４名、「和歌山県下一漁村住民の骨密度調査（第１報）地域代表性のある集団での性・年齢別骨密度値」、日本衛生学雑誌、１９９６年、第５０巻、第６号、pp.1084-1092 吉村典子、他３名、「和歌山県下一漁村住民の骨密度調査（第２報）骨密度に影響を与える要因の分析」、日本衛生学雑誌、１９９６年、第５１巻、第３号、pp.677-684 N. Yoshimura、他５名、「Determinants of Bone Loss in a Rural Japanese Community: The Taiji Study」、Osteoporosis International、１９９８年１１月、第８巻、第６号、pp.604-610

しかし、閉経後女性は、ＢＭＤ減少に関連する体質に個人差が大きく（特許文献１参照）、骨粗鬆症による新規骨折の予測が難しい。また、前述したＦＲＡＸ（非特許文献１乃至３参照）には、主要骨粗鬆症性骨折（特に椎体骨折）の予測精度が低い問題と、評価結果が年齢に大きく依存している問題とがある。例えば、医療機関を受診した７５歳以上の女性らの９０％以上の例では、ＦＲＡＸを用いて主要骨粗鬆症骨折の発生確率を求めると、骨折発生確率２０％以上の評価結果が算出される。仮に、この評価結果を受容すれば、ほぼ全ての女性は７５歳以上になると薬物治療に該当しかねない。この問題を避けるために、日本骨粗鬆症学会は、ＦＲＡＸによる評価結果に基づく薬物治療開始を、女性では７５歳未満に限るように規定している（非特許文献１参照）。７５歳未満の女性でも、５０歳前後と比べて６０歳代、７０歳代前半と高齢になるほど、実際の骨折発生確率と比べてＦＲＡＸで高すぎる骨折発生確率が算出されやすく、実態との乖離が大きくなり予測精度が低下することが、日常診療の現場で問題になっている。また、特許文献１に記載された方法では、予測される対象が将来の骨量（ＢＭＤ又はＢＬＲ）であり、新規骨折ではない。骨量と比べて、骨粗鬆症による新規骨折の発生には、既知の要因だけでなく未知の要因も含めて、数多くの要因が少しずつ関連すると考えられ、予測が難しい。このように、従来、骨粗鬆症医療の日常診療の現場では、閉経後女性の骨粗鬆症による新規骨折を予測することが困難である。

また、一般的に医師は、骨粗鬆症による既存骨折の有無を診断する際に、エックス線撮影又はＭＲＩ等で取得した骨の画像により画像診断している。仮に、このような骨の画像が無ければ、従来、医師にとっては、既存骨折の有無を診断することが難しい。このため、従来、大勢の閉経後女性（大勢の受診者）が骨粗鬆症検診を受ける場合には、全ての受診者が一律にエックス線撮影等を受けている。しかし、大半の受診者は「既存骨折なし」と画像診断され、「既存骨折あり」と画像診断される受診者は比較的少人数に留まる場合が多い。従来、多くの受診者は、「既存骨折なし」と診断される可能性が高いにも関わらずエックス線撮影等を受ける必要があり、検診担当医は、大勢の受診者を次々と短時間で画像診断しなければならないといえる。本願に係る発明者は、新規に骨粗鬆症検診を受ける受診者らについて、例えば骨の画像なしでも、骨粗鬆症による既存骨折が生じている可能性が高いか否かを推測可能な方法があれば望ましいと考えた。そのような方法があれば、既存骨折が生じている可能性が高いと推測された少人数の受診者に絞って、エックス線撮影等で骨の画像を生成し画像診断すればよいと考えられる。既存骨折の可能性が低いと推測された多くの受診者らは、エックス線撮影等を免れ、検診担当医は、絞られた少人数の受診者一人ひとりに時間をかけ慎重に診断しやすくなると期待される。

ここで、本願に係る発明者は、前述の合併症発生リスク予測方法（特許文献２）を創作した経験から、共分散構造分析及び機械学習に基づき、骨粗鬆症による骨折の推測方法や予測方法を創作することを考えた。しかし、どのような臨床データを使用すれば比較的高精度の推測や予測が可能となるのか、病気ごとに異なる。可能であれば、骨粗鬆症や骨折に限られず合併症について、合併症を発生させるリスク因子となる臨床データを推定可能な方法があれば、望ましいと考えられる。

そこで、本発明の課題は、共分散構造分析及び機械学習に基づく、閉経後女性の骨粗鬆症による骨折の推測及び予測の少なくとも一方の方法と、推測や予測の指標となる骨折スコアを出力する方法と、骨折スコアを出力可能な学習モデル及びその生成方法と、骨粗鬆症による骨折のリスク因子推定方法と、プログラムと、情報処理装置と、学習データセット作成方法と、合併症のリスク因子推定方法とを提供することにある。

上記した課題を解決するために、一実施形態に係る骨折スコア出力方法は、閉経後である第１時点での骨粗鬆症による既存骨折の有無、前記第１時点での前記既存骨折の骨折数、前記第１時点を過ぎてから後の第２時点までの経過期間内での骨粗鬆症による新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた１種以上に関する骨折スコアを出力する方法であって、
前記骨折スコアを出力可能な学習モデルに対象者の前記第１時点での臨床情報を入力して前記対象者の前記骨折スコアを出力する処理を情報処理装置に実行させるステップを含み、
前記骨折スコアを出力可能な学習モデルは、前記第１時点での前記既存骨折の有無、前記第１時点での前記既存骨折の骨折数、前記経過期間内での前記新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた１種以上を判定された各被験者の前記第１時点での前記臨床情報を入力されると、前記各被験者の前記骨折スコアを出力するように機械学習したものであり、
前記第１時点での前記臨床情報は、年齢、身長、体重、ＢＭＩ、骨密度、骨代謝マーカー検査値、腎機能マーカー検査値、骨格筋量マーカー検査値、既存の身長低下、初経年齢、閉経年齢、閉経時から前記第１時点までの年数、前記経過期間の長さ、ＦＲＡＸ（登録商標）による骨折リスク評価結果、前記第２時点の骨密度予測値、前記経過期間内の骨量減少率予測値、及び、これらのいずれかを間接的に示すデータからなる群より選ばれる４種以上の臨床データを含み、
前記各被験者の前記骨折スコアは、前記判定の結果と、前記各被験者の前記４種以上の臨床データと、を含む５種以上の観測変数が設けられ共分散構造分析が行われる場合に、前記判定の結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータである。

斯かる骨折スコア出力方法によれば、使用する学習モデルは、各被験者の第１時点での臨床情報に含まれる４種以上の臨床データと、各被験者についての共分散構造分析により算出される潜在変数の因子得点に関するデータである骨折スコアとの関係を、機械学習し生成されたモデルである。この学習モデルに、対象者の第１時点での臨床情報に含まれる４種以上の臨床データを入力することより、対象者の骨折スコアを出力可能である。この学習モデルにより出力される対象者の骨折スコアは、機械学習に供した各被験者の骨折スコア（潜在変数の因子得点に関するデータ）が、既存骨折の有無、既存骨折の骨折数、新規骨折の有無及び新規骨折の骨折数から選ばれたどの１種以上の判定結果に基づくものであるかに由来して、既存骨折の有無、既存骨折の骨折数、新規骨折の有無及び新規骨折の骨折数から選ばれた１種以上についての推測及び予測の少なくとも一方の指標となる。臨床情報に含まれる４種以上の臨床データは、従来の骨粗鬆症医療に関する日常診療の現場で取得可能なデータである。ここで説明したことは、以下に述べる、骨粗鬆症による骨折の推測及び予測の少なくとも一方の方法、学習モデル及びその生成方法、骨粗鬆症による骨折のリスク因子推定方法、プログラム、情報処理装置並びに学習データセット作成方法でも同様である。

一実施形態に係る骨粗鬆症による骨折の推測及び予測の少なくとも一方の方法は、前記骨折スコア出力方法により前記対象者の前記骨折スコアを出力し、出力された前記対象者の前記骨折スコアと前記骨折スコアの閾値との比較結果に基づいて、前記対象者についての、前記第１時点での前記既存骨折の有無の推測結果、前記第１時点での前記既存骨折の骨折数の推測結果、前記経過期間内での前記新規骨折の有無の予測結果、及び、前記経過期間内での前記新規骨折の骨折数の予測結果から選ばれた１種以上に関する結果データを出力する処理を情報処理装置に実行させ得る。

一実施形態に係る学習モデル生成方法は、閉経後である第１時点での骨粗鬆症による既存骨折の有無、前記第１時点での前記既存骨折の骨折数、前記第１時点を過ぎてから後の第２時点までの経過期間内での骨粗鬆症による新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた１種以上を判定された各被験者の前記第１時点での臨床情報が入力されると前記各被験者の骨折スコアを出力する学習モデルを、機械学習により生成するステップを含み、
前記第１時点での前記臨床情報は、年齢、身長、体重、ＢＭＩ、骨密度、骨代謝マーカー検査値、腎機能マーカー検査値、骨格筋量マーカー検査値、既存の身長低下、初経年齢、閉経年齢、閉経時から前記第１時点までの年数、前記経過期間の長さ、ＦＲＡＸ（登録商標）による骨折リスク評価結果、前記第２時点の骨密度予測値、前記経過期間内の骨量減少率予測値、及び、これらのいずれかを間接的に示すデータから選ばれた４種以上の臨床データを含み、
前記各被験者の前記骨折スコアは、前記判定の結果と、前記４種以上の臨床データと、を含む５種以上の観測変数が設けられて共分散構造分析が行われる場合に、前記判定の結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータである。

一実施形態に係る学習モデルは、閉経後である第１時点での骨粗鬆症による既存骨折の有無、前記第１時点での前記既存骨折の骨折数、前記第１時点を過ぎてから後の第２時点までの経過期間内での骨粗鬆症による新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた１種以上に関する骨折スコアを出力可能な学習モデルであって、
前記学習モデルは、前記第１時点での前記既存骨折の有無、前記第１時点での前記既存骨折の骨折数、前記経過期間内での前記新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた１種以上を判定された各被験者の前記第１時点での臨床情報が入力されると前記各被験者の前記骨折スコアを出力するように重み付け値が機械学習されたものであり、且つ、対象者の前記第１時点での前記臨床情報が入力される場合には前記対象者の前記臨床情報に対して前記重み付け値に基づく演算を行って前記対象者の前記骨折スコアを出力するように情報処理装置を機能させるものであり、
前記第１時点での前記臨床情報には、年齢、身長、体重、ＢＭＩ、骨密度、骨代謝マーカー検査値、腎機能マーカー検査値、骨格筋量マーカー検査値、既存の身長低下、初経年齢、閉経年齢、閉経時から前記第１時点までの年数、前記経過期間の長さ、ＦＲＡＸ（登録商標）による骨折リスク評価結果、前記第２時点の骨密度予測値、前記経過期間内の骨量減少率予測値、及び、これらのいずれかを間接的に示すデータから選ばれた４種以上の臨床データを含み、
前記各被験者の前記骨折スコアは、前記判定の結果と、前記各被験者の前記４種以上の臨床データと、を含む５種以上の観測変数が設けられて共分散構造分析が行われる場合に、前記判定の結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータである。

一実施形態に係る骨粗鬆症による骨折のリスク因子推定方法は、前記学習モデルに基づいて、応答曲面法により、前記各被験者を含む被験者らの前記臨床情報と前記被験者らの前記骨折スコアとの関係を示す応答曲面を生成し、生成される前記応答曲面に骨折リスク陽性領域が含まれている場合には、推定されるリスク因子を特定する処理を情報処理装置に実行させるステップを含み、
前記骨折リスク陽性領域は、前記学習モデルに基づいて、前記骨折スコアの値を示す第１軸と前記４種以上の臨床データから選択された１種の臨床データの値を示す第２軸とを有し且つ前記応答曲面と前記骨折スコアのカットオフ値との関係を示す二次元グラフ又は三次元グラフを作成する処理を情報処理装置に実行させる場合に、作成される前記二次元グラフ又は前記三次元グラフに含まれる前記応答曲面において前記骨折スコアの値が前記カットオフ値よりも高値となる部分の領域であり、
前記推定されるリスク因子は、少なくとも、前記第２軸における前記選択された１種の臨床データの値に関するものであり得る。

一実施形態に係るプログラムは、前記対象者の前記第１時点での前記臨床情報を取得し、取得した該臨床情報を前記学習モデルに入力して前記対象者の前記骨折スコアを出力する処理を情報処理装置に実行させ得る。

一実施形態に係る前記学習モデルを有する情報処理装置は、前記学習モデルが記憶される記憶部と、前記対象者の前記第１時点での前記臨床情報を取得した場合に、所得した該臨床情報を前記学習モデルに入力して前記対象者の前記骨折スコアを出力する処理を実行する演算部と、を備え得る。

一実施形態に係る学習データセット作成方法は、閉経後である第１時点での骨粗鬆症による既存骨折の有無、前記第１時点での前記既存骨折の骨折数、前記第１時点を過ぎてから後の第２時点までの経過期間内での骨粗鬆症による新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた１種以上を判定された各被験者の前記判定の結果と、前記各被験者の前記第１時点での４種以上の臨床データと、を含む５種以上の観測変数を設けて共分散構造分析を行い、前記判定の結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータを取得するステップを含み、
前記第１時点での前記４種以上の臨床データは、年齢、身長、体重、ＢＭＩ、骨密度、骨代謝マーカー検査値、腎機能マーカー検査値、骨格筋量マーカー検査値、既存の身長低下、初経年齢、閉経年齢、閉経時から前記第１時点までの年数、前記経過期間の長さ、ＦＲＡＸ（登録商標）による骨折リスク評価結果、前記第２時点の骨密度予測値、前記経過期間内の骨量減少率予測値、及び、これらのいずれかを間接的に示すデータから選ばれる。

一実施形態に係る合併症のリスク因子推定方法は、病気に関する受診者らの臨床情報に基づいて、前記病気で発生する場合がある合併症のリスク因子を推定する方法であって、
前記受診者らに含まれる各受診者は、前記病気に関して診察された第１診察時点では前記合併症が発生していないことを診断され、且つ、前記第１診察時点を過ぎてから後の第２診察時点までの経過観察期間内での前記合併症の発生の有無を判定する診断をされた者であり、
前記方法は、前記各受診者の臨床情報が入力されると前記各受診者の合併症発生スコアを出力するように機械学習した学習モデルに基づいて、応答曲面法により前記受診者らの前記臨床情報と前記受診者らの前記合併症発生スコアとの関係を示す応答曲面を生成し、生成される前記応答曲面に合併症発生リスク陽性領域が含まれる場合には推定されるリスク因子を特定する処理を情報処理装置に実行させるステップを含み、
前記各受診者の前記臨床情報は、前記第１診察時点における前記各受診者に関する４種以上の臨床データを含み、
前記各受診者の前記合併症発生スコアは、前記各受診者の前記判定の結果と、前記各受診者の前記４種以上の臨床データと、を含む５種以上の観測変数が設けられて共分散構造分析が行われる場合に、前記判定の結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータであり、
前記合併症発生リスク陽性領域は、前記学習モデルに基づいて、前記合併症発生スコアの値を示す第１軸と前記４種以上の臨床データから選択された１種の臨床データの値を示す第２軸とを有し且つ前記応答曲面と前記合併症発生スコアのカットオフ値との関係を示す二次元グラフ又は三次元グラフを作成する処理を情報処理装置に実行させる場合に、作成される前記二次元グラフ又は前記三次元グラフに含まれる前記応答曲面において前記合併症発生スコアの値が前記カットオフ値よりも高値となる部分の領域であり、
前記推定されるリスク因子は、少なくとも、前記第２軸における前記選択された１種の臨床データの値に関するものである。

斯かる合併症のリスク因子推定方法によれば、使用する学習モデルは、各受診者の第１診察時点での臨床情報に含まれる４種以上の臨床データと、各受診者についての共分散構造分析により算出される潜在変数の因子得点に関するデータである合併症発生スコアとの関係を、機械学習し生成されたモデルである。この学習モデルに基づいて、応答曲面法により、受診者らの臨床情報と合併症発生スコアとを反映させた応答曲面を生成可能である。生成される応答曲面において、該応答曲面での合併症発生スコアの値がカットオフ値よりも高値である合併症発生リスク陽性領域が含まれる場合には、機械学習に供した４種以上の臨床データのうちに、合併症のリスク因子と推定される臨床データが少なくとも１種は含まれている。生成される応答曲面を含む二次元グラフ又は三次元グラフを作成し、作成される二次元グラフ又は三次元グラフに含まれる応答曲面に合併症発生リスク陽性領域が形成されている場合には、この場合の二次元グラフ又は三次元グラフが有する第２軸が示す選択された１種の臨床データの値は、合併症のリスク因子に関する値と推定され得る。

以上に説明した各実施形態によれば、共分散構造分析及び機械学習に基づく、閉経後女性の骨粗鬆症による骨折の推測及び予測の少なくとも一方の方法と、推測や予測の指標となる骨折スコアを出力する方法と、骨折スコアを出力可能な学習モデル及びその生成方法と、骨粗鬆症による骨折のリスク因子推定方法と、プログラムと、情報処理装置と、学習データセット作成方法と、合併症のリスク因子推定方法とを提供可能である。

実施形態１に係る骨粗鬆症による骨折の推測・予測方法と、該方法に含まれ得る、学習データセット作成方法、学習モデル生成方法及び骨折スコア出力方法とについて、一例を示すフローチャートである。各被験者の第１時点及び第２時点と、対象者の第１時点及び第２時点との時系列関係の一例を説明する図である。構造方程式モデリング（ＳＥＭ）で共分散構造分析を行う場合に作成し得るパスモデルを示し、それぞれ、（ａ）は探索的因子分析モデルの例を示すパス図、（ｂ）は確認的因子分析モデルのパスモデルの例を示すパス図、（ｃ）は２つの探索的因子分析モデルを含む２次因子モデルのパスモデルの例を示すパス図である。実施形態１又は２に係る学習モデル生成方法で用い得るＡＮＮにおける構成の一例を示す模式図である。試験例１－１に係る学習モデルに基づいて応答曲面法により作成された、被験者らの経過観察期間内での新規骨折の有無に関する複数の三次元グラフのうちの、（ａ）は、Ｘ軸が初診時正規化血中Ｃｒ（クレアチニン）検査値を示し、Ｙ軸が初診時正規化ＢＡＰ（骨型アルカリフォスファターゼ）検査値を示す場合の三次元グラフの一例であり、（ｂ）は、Ｘ軸が初診時正規化ＢＭＤ計測値を示し、Ｙ軸が初診時正規化身長を示す場合の三次元グラフの一例である。（ａ）及び（ｂ）共に、Ｚ軸は被験者らの骨折スコアを示し、このことは図６（ｃ）乃至図６（ｆ）でも同様である。（ｃ）乃至（ｆ）の各々は、図５（ａ）及び図５（ｂ）と同様に作成された三次元グラフの他の例で、それぞれＸ軸及びＹ軸で示す臨床データの組み合わせが異なる。実施形態１又は実施形態２に係る、骨粗鬆症による骨折の推測・予測方法と、骨折スコア出力方法との各々について、他の例を示すフローチャートである。実施形態１に係る学習モデルを有する情報処理装置の一例の機能構成を示すブロック図である。実施形態２に係る骨粗鬆症による骨折の推測・予測方法と、該方法に含まれ得る、学習データセット作成方法、学習モデル生成方法及び骨折スコア出力方法とについて、一例を示すフローチャートである。実施形態２に係る学習モデルを有する情報処理装置の一例の機能構成を示すブロック図である。ＢＬＲ（予測値）を出力可能な学習モデルを生成する機械学習で、ＡＮＮの構成を示す模式図である。詳細は特許文献１に記載された実施例１ａを参照。試験例１－１でＳＥＭにより平均共分散構造分析の演算を実行し、確定したパスモデルを示すパス図である。図１２、図１６、図２０、図２４、図２８及び図３１で各々、長方形は観測変数を、大きい楕円は潜在変数を、ｅは誤差変数を、矢印は因果関係が存在するパスを意味する。２０２０年１月末の検診時に「新規骨折あり」と判定された被験者らと「新規骨折なし」と判定された被験者らとで、試験例１－１に係る平均共分散構造分析で算出された骨折スコア（潜在変数の因子得点）を比較する箱ひげ図である。図１３、図１７、図２１及び図２５の各々で、破線はカットオフ値（骨折スコアの閾値）の高さを示し、四角（箱）は２５％分位点から７５％分位点までの範囲を示し、この四角（箱）から上下へ延びる線（ひげ）は１０％分位点から９０％分位点までの範囲を示す。試験例１－１の機械学習におけるＡＮＮの構成を示す模式図である。試験例１－１で、機械学習に用いた各受診者の骨折スコアと、学習モデルにより出力された各受診者の骨折スコアとの相関関係を示すグラフである。図１５、図１９、図２３、図２７、図３０及び図３３の各々で、縦軸は機械学習に用いた各被験者の骨折スコア（潜在変数の因子得点）を示し、横軸は学習モデルにより出力された各被験者の骨折スコアを示す。試験例１－２、試験例１８、試験例２０及び試験例２１の各々で、ＳＥＭにより平均共分散構造分析の演算を実行し、確定したパスモデルを示すパス図である。初診時に「既存骨折あり」と判定された被験者らと「既存骨折なし」と判定された被験者らとで、試験例１－２に係る平均共分散構造分析で算出された骨折スコア（潜在変数の因子得点）を比較する箱ひげ図である。試験例１－２の機械学習におけるＡＮＮの構成を示す模式図である。試験例１－２で、機械学習に用いた各受診者の骨折スコアと、学習モデルにより出力された各受診者の骨折スコアとの相関関係を示すグラフである。試験例４－１でＳＥＭにより平均共分散構造分析の演算を実行し、確定したパスモデルを示すパス図である。２０２０年１月末の検診時に「新規骨折あり」と判定された被験者らと「新規骨折なし」と判定された被験者らとで、試験例４－１に係る平均共分散構造分析で算出された骨折スコアを比較する箱ひげ図である。試験例４－１の機械学習におけるＡＮＮの構成を示す模式図である。試験例４－１で、機械学習に用いた各受診者の骨折スコアと、学習モデルにより出力された各受診者の骨折スコアとの相関関係を示すグラフである。試験例４－２及び試験例１９の各々で、ＳＥＭにより平均共分散構造分析の演算を実行し、確定したパスモデルを示すパス図である。初診時に「既存骨折あり」と判定された被験者らと「既存骨折なし」と判定された被験者らとで、試験例４－２に係る平均共分散構造分析で算出された骨折スコアを比較する箱ひげ図である。試験例４－２の機械学習におけるＡＮＮの構成を示す模式図である。試験例４－２で、機械学習に用いた各受診者の骨折スコアと、学習モデルにより出力された各受診者の骨折スコアとの相関関係を示すグラフである。試験例５－１でＳＥＭにより平均共分散構造分析の演算を実行し、確定したパスモデルを示すパス図である。試験例５－１の機械学習におけるＡＮＮの構成を示す模式図である。試験例５－１で、機械学習に用いた各受診者の骨折スコアと、学習モデルにより出力された各受診者の骨折スコアとの相関関係を示すグラフである。試験例５－２でＳＥＭにより平均共分散構造分析の演算を実行し、確定したパスモデルを示すパス図である。試験例５－２の機械学習におけるＡＮＮの構成を示す模式図である。試験例５－２で、機械学習に用いた各受診者の骨折スコアと、学習モデルにより出力された各受診者の骨折スコアとの相関関係を示すグラフである。試験例２４に係る学習モデルに基づいて応答曲面法により生成された、応答曲面を含む三次元グラフの一例である。試験例２５に係る学習モデルに基づいて応答曲面法により生成された、応答曲面を含む三次元グラフの一例である。

本明細書における「女性」は、生物学的な性別が女性であるヒトである。ヒトの健常な身体では、古い骨が破骨細胞に吸収される骨吸収と、新しい骨が骨芽細胞により作られ補充される骨形成と、による骨代謝回転（骨リモデリングともいう）が起こっている。また、女性ホルモンの一種であるエストロゲンは、主に卵巣から分泌され、骨吸収を抑制する作用がある。初経から閉経までの期間中の女性は、エストロゲンにより、骨吸収が抑制されて骨強度低下しにくい恩恵を受けているともいえる。閉経後女性では、卵巣のエストロゲン分泌機能が低下し、エストロゲン欠乏により骨吸収が亢進し、これに骨形成が追随しきれず、骨強度が低下するといわれている。一般的に、女性で妊娠や産後の無月経の期間を除き、月経が１２ヵ月以上にわたり来ないと、閉経と判定される。この際、過去にふり返って最後の月経が来た時点を「閉経時」としている。一方、例えば子宮摘出された等の場合であっても、卵巣のエストロゲン分泌機能が維持されている状態では閉経とみなされない。このような場合、臨床上、血液検査により、エストロゲンの一種であるエストラジオールの血中濃度が２０ｐｇ／ｍＬ以下、且つ、血中の卵胞刺激ホルモン（ＦＳＨ）の活性値が４０ｍＩＵ／ｍＬ以上であるときに、卵巣機能低下（閉経）と判定される。本明細書における「閉経」は、自然閉経であるか又は人為的な閉経であるかを問わない。人為的な閉経として、例えば、卵巣摘出による外科的閉経又は薬物摂取による閉経等が挙げられるが、これらの例に限られない。

本明細書における「骨折」は、骨粗鬆症による骨折であり、疼痛を伴う臨床骨折に限らず、疼痛を伴わない形態骨折（例えば疼痛を伴わない椎体の圧潰変形）も含まれる。本明細書における「既存骨折」は、閉経後のある任意の時点（以下「第１時点」ともいう）で既に発生していた骨折である。第１時点は、閉経後の時点であれば特に限定されないが、例えば、一般臨床の場合は骨粗鬆症診療での初診時若しくは初回エックス線像撮影を伴う診察時でもよく、又は、治験の場合は登録時若しくは薬剤投与開始時でもよい。本明細書における「新規骨折」は、第１時点より後に発生する骨折であり、第１時点では正常（骨折していない）と判定された骨が、第１時点より後のある任意の時点（以下「第２時点」ともいう）では新たに骨折と判定されるものである。後述する各被験者の第２時点は、本明細書に記載された各実施形態に係る方法の実施時点から見て過去の時点であり得るが、一方、後述する対象者の第２時点は、各実施形態に係る方法の実施時点から見て未来の時点であり得る。本明細書における「骨折数」は、骨折が生じた骨の数である。本明細書における「経過観察期間」は、第１時点を過ぎてから（第１時点の直後から）第２時点までの期間である。本明細書における「推測」は、骨折を推し量ることである。本明細書では、対象者で過去に生じた骨折（対象者の既存骨折）を推し量る場合に主に「推測」と記載しているが、字義としては、対象者で未来に生じる骨折（対象者の新規骨折）を推し量る場合も「推測」の一種と言える。本明細書における「予測」は、推測の一種であり、対象者については未来に生じる骨折（対象者の新規骨折）を推し量る場合を指す。本明細書における「推測・予測」は、推測及び予測のうちの少なくとも一方を意味する。「推測・予測」は、対象者で過去に生じた骨折（対象者の既存骨折）を推し量る場合には「推測」に限定されてもよく又は対象者で未来に生じる骨折（対象者の新規骨折）を推し量る場合には「予測」に限定されてもよい。

本明細書には、臨床情報（臨床データを含む情報）や医師（医師から指示を受けた者を含む。以下同じ。）による判定結果を取得し使用する旨を記載している。臨床データや判定結果の生成過程で、医師が各被験者又は対象者に対して行う場合がある手術、治療又は診断を含む工程は、本発明に含まれない。本発明の各実施形態では、各被験者若しくは対象者について身体測定、問診、骨密度（ＢＭＤ）計測若しくは画像診断等が行われて、既に生成された臨床データ若しくは判定結果を取得すればよい。本発明には、このようなデータ取得から、対象者の骨折スコア、推測・予測結果、又は、二次元グラフ若しくは三次元グラフを含む資料が生成され示されるまでの過程が含まれ得る。その後、対象者の骨折スコア、推測・予測結果又は資料を参考にして、医師が対象者に対して行い得る手術、治療又は診断を含む過程は、本発明に含まれない。以下、本発明に係る実施形態の例を、図面を参照して幾つか説明する。以下に説明する図面の記載では、同一又は類似の部分に同一又は類似の符号を付している。

＜実施形態１＞
図１に示すように、実施形態１に係る骨粗鬆症による骨折の推測・予測方法Ｓ１０ａは、学習データセット作成方法Ｓ３０ａと、学習モデル生成方法Ｓ２０ａと、骨折スコア出力方法Ｓ１５ａとを含み得る。学習データセット作成方法Ｓ３０ａは、各被験者の臨床情報及び判定結果取得ステップＳ３１ａと、各被験者の臨床情報正規化ステップＳ３２と、各被験者の骨折スコア算出ステップＳ３３ａとを含み得る。

学習データセット作成方法Ｓ３０ａでは、骨折スコアを出力可能な学習モデルの生成に適した学習データセットを作成するために、複数名の閉経後女性を被験者らとする。各被験者は、第１時点での既存骨折の有無、第１時点での既存骨折の骨折数、経過観察期間内での新規骨折の有無、及び、経過観察期間内での新規骨折の骨折数から選ばれた１種以上を、既に判定された閉経後女性である。各被験者は、好ましくは、第１時点での既存骨折の有無と経過観察期間内での新規骨折の有無とを既に判定された閉経後女性であるか、又は、第１時点での既存骨折の骨折数と経過観察期間内での新規骨折の骨折数とを既に判定された閉経後女性である。医療機関の骨粗鬆症外来を閉経後に２回以上受診した女性を被験者とする場合には、閉経後の初回受診時を第１時点とし、初回受診時より後に受診した時点（２回目以降の任意の受診時）を第２時点としてもよい。被験者どうしで第１時点が同じ日で、その後の第２時点も被験者どうしで同じ日でもよいが、図２に例示するように、被験者Ａでの第１時点は２００６年１月で第２時点は２０１２年１月であり、被験者Ｂでの第１時点は２０１４年１月で第２時点は２０２０年１月である等、被験者どうしで第１時点及び第２時点の各々が異なる日でもよい。閉経時から第１時点までの期間の長さや、経過観察期間の長さが、被験者ごとに異なってもよく又は同じでもよい。各被験者の経過観察期間の長さは、推測・予測精度向上の観点では例えば１年以上、２年以上又は３年以上でもよく、好ましくは５年以上、更に好ましくは１０年以上であり、必要以上の長期化を避ける観点では例えば２５年以下又は２０年以下、好ましくは１５年以下である。被験者らの人数は、推測・予測精度向上の観点では例えば３０名以上又は５０名以上でもよく、好ましくは１００名以上であり、１００名を超えて人数が多いほど更に好ましい。

閉経の要因ごとに特化して骨折を推測・予測する場合、各被験者を、自然閉経した女性に限定してもよく又は人為的に閉経した女性に限定してもよい。なお、早期閉経は、骨粗鬆症により骨強度低下し骨折するリスクを高める危険因子である。例えば卵巣摘出等により人為的に早期閉経した女性では、骨粗鬆症による骨折リスクが高くなりやすい。骨粗鬆症による骨折の早期予防・治療を図る診断を支援する観点では、人為的に閉経した女性での骨折を推測可能又は予測可能とすることに、大きな意義がある。様々な閉経後女性で幅広く骨折を推測可能又は予測可能とする観点では、閉経の要因で被験者を限定しないことが望ましい。各被験者の第１時点での年齢は、閉経後であれば本発明の目的に反しない限り特に限定されない。例えば、早期閉経した女性に特化して骨折を推測・予測する場合には、各被験者の第１時点での年齢が４０歳未満でもよい。各被験者の第１時点での年齢は、例えば４０歳以上７５歳未満でもよく、閉経後のＢＭＤ減少に個人差が大きい年代での骨折の推測・予測精度向上を図る観点では、４５歳以上７０歳未満でもよく又は５０歳以上６５歳未満でもよい。ＦＲＡＸでの予測精度が低い年代の女性に特化して骨折を推測・予測する場合、各被験者の第１時点での年齢が７５歳以上９０歳未満でもよい。様々な閉経後女性で推測・予測精度を高める観点では、被験者らには、幅広い年代の閉経後女性が含まれることが好ましい。

図１及び図２に示す、各被験者の臨床情報及び判定結果取得ステップＳ３１ａでは、前述した学習データセットを作成するために、各被験者の臨床情報を取得する。該臨床情報は、各被験者についての、第１時点での年齢、第１時点での身長、第１時点での体重、第１時点でのＢＭＩ、第１時点でのＢＭＤ、第１時点での骨代謝マーカー検査値、第１時点での腎機能マーカー検査値、第１時点での骨格筋量マーカー検査値、第１時点で既存の身長低下、初経年齢、閉経年齢、閉経時から第１時点までの年数、経過観察期間の長さ、第１時点での１１種又は１２種の骨折危険因子に基づくＦＲＡＸ（登録商標）による骨折リスク評価結果（以下「ＦＲＡＸ結果」ともいう）、第１時点でのＢＭＤ及び他の臨床データに基づく第２時点のＢＭＤ予測値（以下、略して「ＢＭＤ予測値」ともいう）、第１時点でのＢＭＤ及び他の臨床データに基づく経過観察期間内の骨量減少率（ＢＬＲ）予測値（以下、略して「ＢＬＲ予測値」ともいう）、及び、これらのいずれかを間接的に示すデータから選ばれた４種以上の臨床データを含む。推測・予測精度向上の観点では、各被験者の臨床情報は、ここで幾つか例示した臨床データのうち、例えば５種以上又は６種以上を含んでもよく、好ましくは７種以上又は８種以上を含み、臨床応用しやすい高精度な推測・予測をしやすい観点では９種以上を含むのが更に好ましく、９種を超えてデータ項目数が増えると更により好ましい。

臨床データの例として挙げた「間接的に示すデータ」は、当業者であれば目的とする臨床データの値を概ね推定可能な他のデータ、又は、何らかの変換を行えば目的とする臨床データの値を概算可能な他のデータである。例えば、ある被験者の年齢を月齢（例えば６００月齢）で表した場合、月齢の数値を１２で割り算する変換（例えば６００／１２＝５０）をすれば、目的とする年齢の値（例えば５０歳）を概算可能であり、月齢は年齢を間接的に示すデータに該当する。このように、目的とするデータ（例えば年齢）の数値と相関する他の数値データ（例えば月齢）は、目的とするデータを間接的に示すデータの一種といえる。

各被験者の臨床情報に含まれる４種以上の臨床データは、第１時点にある被験者に関する臨床データであればよい。該臨床データは、被験者ごとの第１時点で生成された臨床データに限らず、第１時点にある被験者に関する臨床データであれば、第１時点よりも後に生成された臨床データも含まれる。例えば、医療機関では、被験者ごとに第１時点で採取した血液の検査を外注する場合に、外注先から検査結果を得るのに数日待つことになるが、このように第１時点から数日後に得られる検査結果でも第１時点にある被験者に関する臨床データといえる。また、第１時点での年齢は、第１時点よりも後の時点（例えば第２時点）でも、各被験者に問診で「以前の初診時（第１時点）での年齢」を質問する等すれば、被験者の記憶に基づいて生成可能である。例えば、「第２時点での年齢」から「経過観察期間の長さ」を引き算すれば、「第１時点での年齢」を算出可能であり、「第２時点での年齢」と「経過観察期間の長さ」との組み合わせは「第１時点での年齢」を間接的に示すデータに該当する。第１時点での身長と体重との各々は、例えば第１時点で被験者の身体計測を行う等すれば、生成し取得可能なデータである。第１時点でのＢＭＩは、第１時点での身長及び体重から算出可能なデータである。第１時点での身長と体重とが明らかであれば、第１時点の後にＢＭＩを算出してもよい。身長と体重とＢＭＩとの三者は、このうちの二者のデータがあれば残る一者のデータを算出可能であり、この三者のうち二者のデータの組み合わせは残る一者を間接的に示すデータに該当する。

第１時点でのＢＭＤは、骨粗鬆症医療の現場で計測可能な方法による計測値であればよい。例えば、超音波骨密度測定法（ＱＵＳ）、定量的ＣＴ測定法（ＱＣＴ）、ＭＤ（Microdensitometry）法、又は、二重エネルギーＸ線吸収測定法（dual-energy X-ray absorptiometry：以下「ＤＸＡ」ともいう）等の方法によるＢＭＤ計測値が挙げられる。放射線被曝を避ける観点では、ＱＵＳによるＢＭＤ計測値が好ましい。ＢＭＤ計測の標準方法と重視されており、計測時間が短く、誤差や放射線被爆量が少ない観点では、ＤＸＡによるＢＭＤ計測値が好ましい。ＤＸＡは、骨に２種類のＸ線を照射し、骨を他の組織と区別してＢＭＤ（ｇ／ｃｍ^２）を計測する方法である。ＢＭＤ計測値の単位は、ｇ／ｃｍ^２又はｇ／ｃｍ^３でもよいが、若年成人比較％（percent of Young Adult Mean：以下「％ＹＡＭ」ともいう）でもよい。％ＹＡＭは、若年齢のＢＭＤ平均値（基準値）を１００％として比較したＢＭＤの高さを示す単位であり、骨粗鬆症診断基準で用いられている。この診断基準では、ＢＭＤが７０％ＹＡＭ以下である場合、骨粗鬆症と診断される。

ＢＭＤを計測する身体部位は、本発明の目的に反しない限り特に限定されず、骨折を推測・予測する価値があるという観点では、一般的に骨粗鬆症による骨折が生じるリスクが比較的に高い部位でもよい。例えば、上腕骨、橈骨、肋骨、頚椎、胸椎、腰椎、骨盤、大腿骨、下腿骨及び中足骨からなる群より選ばれた１箇所以上の身体部位に含まれる、少なくとも一部の領域が挙げられる。骨盤には、仙骨、座骨及び恥骨が含まれる。下腿骨には脛骨や腓骨が含まれる。同様の観点から、ＢＭＤを計測する身体部位は、上腕骨近位部、橈骨遠位部、頚椎、胸椎、腰椎及び大腿骨近位部からなる群より選ばれた１箇所以上の身体部位に含まれる、少なくとも一部の領域が好ましい。同様の観点に加えて、骨折するとＱＯＬ及びＡＤＬの著しい低下を伴う部位について骨粗鬆症の早期予防・治療を図る観点から、ＢＭＤを計測する部位は、頚椎、胸椎、腰椎及び大腿骨近位部からなる群より選ばれた１箇所以上の身体部位に含まれる、少なくとも一部の領域が好ましい。ここでの「一部の領域」は、大腿骨では例えば大腿骨近位部等の領域が挙げられ、大腿骨近位部では例えば、大腿骨頸部、転子部又はｗａｒｄ三角等の領域が挙げられる。

骨代謝マーカーとして例えば、骨形成マーカー、骨吸収マーカー又は骨質マーカー等が挙げられる。骨代謝マーカー検査値は、例えば、骨粗鬆症に関する学術論文（いわゆるエビデンス）でＢＭＤ低下又は骨折リスクの予測因子として活用できる可能性が論じられた１種以上の骨代謝マーカーの計測値でもよく、臨床応用しやすい観点では、骨粗鬆症医療の現場で活用されている１種以上の骨代謝マーカーの計測値が好ましい。骨代謝マーカーとして、骨形成マーカーでは例えばオステオカルシン（ＯＣ）又はＩ型プロコラーゲン－Ｎ－プロペプチド（ＰＩＮＰ）等が挙げられ、骨吸収マーカーでは例えばＩ型コラーゲン架橋Ｎ－テロペプチド（ＮＴＸ）又は骨型酒石酸抵抗性酸性フォスファターゼ５ｂ（ＴＲＡＣＰ－５ｂ）等が挙げられ、骨質マーカーでは例えば低カルボキシル化オステオカルシン（ｕｃＯＣ）等が挙げられるが、これらの例に限られない。例えば、骨型アルカリフォスファターゼ（bone specific alkaline phosphatase：以下「ＢＡＰ」ともいう）は、骨形成と骨吸収との両方の指標を兼ねており、骨代謝回転マーカーの一種ともいえる。骨粗鬆症医療の現場で活用されており、ＢＭＤ減少と有意な関連性がある観点から、骨代謝マーカー検査値として更に好ましくは、ＢＡＰ計測値である。一般的に骨代謝マーカーは、血液検査により血中又は血清中での濃度又は活性値を測定される場合があり、又は、尿検査により尿中での濃度又は活性値を測定される場合がある。

腎臓では、腸内からカルシウム吸収を促進する活性型ビタミンＤが生成される。このため、腎機能には、骨強度や骨折リスクとの関連性が認められる。腎機能マーカー検査値は、従来、日常診療の現場で腎機能評価に使用されている計測値でもよく、例えば、血中のクレアチニン（creatinine：以下「Ｃｒ」ともいう）濃度、推算糸球体濾過量（ｅＧＦＲ）、血中シスタチンＣ濃度又は血中尿素窒素（ＢＵＮ）濃度等の計測値が挙げられる。骨格筋量の影響を除外したい場合、腎機能マーカーとしてシスタチンＣが好ましい。また、中高年日本人女性では、骨格筋量とＢＭＤとに関連性があることが知られている。フレイル高齢者では筋肉量低下するほど転倒し骨折するリスクが高まると考えられ、骨格筋量マーカー検査値の減少と、骨粗鬆症による骨折リスクとの間には、関連性があると考えられる。骨格筋量マーカー検査値は、従来、骨格筋量の評価に使用されているマーカーの計測値でもよく、例えば、血中Ｃｒ濃度、血中Ｃｒ／シスタチンＣ比、血中クレアチンキナーゼ（ＣＰＫ）活性又は血中アルドラーゼ（ＡＬＤ）活性等の計測値が挙げられる。従来、日常診療の現場で活用され、腎機能と骨格筋量とを兼ねた評価指標である観点では、腎機能マーカー検査値及び骨格筋量マーカー検査値として好ましくは、血中Ｃｒ濃度又は血清中Ｃｒ濃度の計測値である。

骨粗鬆症患者は、背骨の椎体の圧潰変形（椎体の骨粗鬆症による骨折の一種）により身長低下し得る。第１時点で既存の身長低下は、若年時（例えば２５歳頃）の最大身長と、閉経後の第１時点に計測した身長とを比べて、低下した身長量に関する数値データでもよい。または、例えば、身長低下量の数値データを所定の閾値（例えば４．０ｃｍ）と比較した結果に基づき、この数値データが閾値以上である場合に「身長低下あり」と判定し、閾値未満である場合に「身長低下なし」と判定した結果でもよい。身長低下データは、例えば問診と身体計測との組み合わせにより生成可能である。ただし、各被験者が記憶に基づいて「若年時の最大身長」を自己申告する場合、最大身長に関する記憶が曖昧であると生成される身長低下データが不正確になりやすい難点がある。あるいは、閉経後女性で高度な脊柱変形が認められる場合、椎体でＢＭＤ低下していることが知られている。このため、第１時点での脊柱変形について、被験者ごとに医師が一定基準に基づき「第１時点で脊柱変形あり」又は「第１時点で脊柱変形なし」と判定した結果を、「第１時点での身長低下」を間接的に示す臨床データとして取得してもよい（非特許文献１参照）。

対象者の経過観察期間内での新規骨折の有無及び新規骨折の骨折数の少なくとも一方を予測する場合には、頚椎、胸椎及び腰椎の少なくとも１つの身体部位における第１時点での既存骨折の有無や骨折数について、各被験者で例えばＸ線撮影又はＭＲＩ等により画像診断し、一定基準に基づき「第１時点で既存骨折あり」又は「第１時点で既存骨折なし」と判定した結果を、「第１時点の身長低下」を間接的に示す臨床データとして取得してもよい。ここでの画像診断は、医師による既存骨折の有無又は骨折数の判定であるのが好ましい。または、ここでの画像診断では、Ｘ線若しくはＭＲＩ等による骨の画像を含む更に他の臨床情報と、医師による骨折判定結果との関係を機械学習した、骨折判定結果を出力可能な学習モデルを予め準備し、該学習モデルに各被験者の骨の画像データを含む更に他の臨床情報を入力し、この学習モデルにより骨折判定結果を出力させてもよい。一方、対象者の第１時点での既存骨折の有無又は既存骨折の骨折数を推測する場合には、各被験者の第１時点での既存骨折の有無又は骨折数を判定した結果は、各被験者の臨床情報に含める臨床データとして取得すべきではなく、後述する骨折判定結果に該当するデータとして取得するのがよい。

初経年齢と、閉経年齢と、閉経時から第１時点までの年数とは、それぞれ、例えば問診等により生成可能な臨床データである。これらのデータは、前述した年齢と同様に各被験者の記憶に基づき生成し得るデータであり、第１時点に限らず、第１時点の後でも生成可能である。「閉経年齢」と「閉経時から第１時点までの経過年数」との和は、第１時点での年齢に等しいため、「閉経年齢」と「閉経時から第１時点までの年数」との組み合わせは、第１時点での年齢を間接的に示すデータに該当する。同様の理由から、「初経年齢」と「初経から閉経までの期間の長さ」との組み合わせは、閉経年齢を間接的に示すデータに該当する。同様に「初経から閉経までの期間の長さ」と「閉経年齢」との組み合わせは、初経年齢を間接的に示すデータに該当する。初経から閉経までの期間の長さは、女性が卵巣由来のエストロゲンにより骨吸収を抑えられていた期間の長さに関連する。

「経過観察期間の長さ」の臨床データは、この長さが各被験者で同じである場合、データ取得しなくてもよい。または、この期間の長さが各被験者で異なる場合、推測・予測精度向上の観点から、「経過観察期間の長さ」をデータ取得するのが好ましい。「第１時点での年齢」と「第２時点での年齢」との組み合わせは、後者の年齢から前者の年齢を引き算することにより、「経過観察期間の長さ」を間接的に示すデータに該当する。

前記ＦＲＡＸ結果は、例えば、被験者ごとに第１時点で身体計測、問診及びＢＭＤ計測を行い、少なくとも１１種の骨折危険因子（第１時点での年齢、性別、第１時点での体重、第１時点での身長、両親の大腿骨近位部骨折歴の有無、第１時点よりも前に生じた骨折既往の有無、第１時点での喫煙の有無、糖質コルチコイドの経口投与の有無、関節リウマチの確定診断の有無、続発性骨粗鬆症との間で強い関連性がある疾患（例えばＩ型糖尿病又は甲状腺機能亢進症等）の有無、及び、１日３単位（１単位：エタノール８～１０ｇ）以上のアルコール摂取の有無）データを取得し、インターネットで非特許文献３に係るウェブサイトにアクセスして１１種の骨折危険因子データを入力すれば、非特許文献２に基づく骨折確率算定モデルにより算出される、１０年間の骨折発生確率を示すデータである。この１１種の骨折危険因子データだけでなく、第１時点での大腿骨近位部ＢＭＤ計測値データも取得して入力し（つまり合計１２種の骨折危険因子データを入力し）、前記ＦＲＡＸ結果の臨床データを算出してもよい。ＦＲＡＸに入力するこれらの骨折危険因子データが、各被験者の第１時点に関するデータであれば、第１時点の後にＦＲＡＸに入力して前記ＦＲＡＸ結果を算出してもよい。大腿骨近位部骨折の推測・予測に特化した学習モデルを生成しようとする場合には、前記ＦＲＡＸ結果として、大腿骨近位部骨折の１０年間の発生確率を示すデータを採用するのが好ましい。または、大腿骨近位部以外の身体部位での骨折について骨折スコアを出力可能な学習モデルを生成しようとする場合には、前記ＦＲＡＸ結果として、主要骨粗鬆症性骨折の１０年間の発生確率を示すデータを採用するのが好ましい。あるいは、大腿骨近位部骨折の発生確率を示すデータと、主要骨粗鬆症性骨折の発生確率を示すデータとの両方を、前記ＦＲＡＸ結果として採用してもよい。５０歳前後と比べて高齢になるほど前記ＦＲＡＸ結果の予測精度は低下し、臨床上で一般的に７５歳以上の女性での前記ＦＲＡＸ結果に基づく診断が禁じられている観点では、例えば７５歳以上、７０歳以上、６５歳以上又は６０歳以上の被験者については、前記ＦＲＡＸ結果を欠損値としてもよい。

経過観察期間内の骨量減少率（ＢＬＲ）は、各被験者の第１時点と第２時点とでそれぞれＢＭＤを計測し、例えば次の数式１により算出可能な骨量データである。次の数式１でＢＬＲの単位として（％ＹＡＭ／年）を例示しているが、この単位に限定されない。第１時点における臨床情報に含まれ得る、前記ＢＭＤ予測値（第１時点のＢＭＤ及び他の臨床データに基づく第２時点のＢＭＤ予測値）と、前記ＢＬＲ予測値（第１時点のＢＭＤ及び他の臨床データに基づく第１時点から第２時点までの期間内のＢＬＲ予測値）とは、それぞれ、第１時点で取得可能なＢＭＤ計測値や他の臨床情報のデータを、前述したＢＬＲ予測値を出力可能な学習モデルに入力すると、該学習モデルにより出力される臨床データであり、詳細は後述する。各被験者の「第２時点のＢＭＤ計測値」は、前記ＢＭＤ予測値を間接的に示すデータに該当する。ただし、臨床データの項目としては、第２時点のＢＭＤ計測値よりも、前記ＢＭＤ予測値の方が、骨折スコアを出力可能な学習モデルとして、統計上の信頼性が高いモデルを生成しやすく好ましい。同じ理由により、各被験者の経過観察期間内のＢＬＲは、前記ＢＬＲ予測値を間接的に示すデータに概要するが、臨床データの項目としては、経過観察期間内のＢＬＲよりも、前記ＢＬＲ予測値の方が好ましい。

各被験者の臨床情報には、前述した４種以上の臨床データに該当しない１種以上のデータでも、第１時点の各被験者に関する臨床データであり、骨粗鬆症による骨折との間で直接的又は間接的な因果関係を有するデータであれば、推測・予測精度向上に貢献し得る観点から、４種以上の臨床データとは別に、その他のデータとして各被験者の臨床情報に含める形で取得してもよい。

図１及び図２に示す各被験者の臨床情報及び判定結果取得ステップＳ３１ａでは、各被験者について、第１時点での既存骨折の有無、第１時点での既存骨折の骨折数、経過観察期間内での新規骨折の有無、及び、経過観察期間内での新規骨折の骨折数から選ばれた１種以上に関する判定結果（以下「骨折判定結果」ともいう）のデータも取得する。ここでの「骨折の有無」は、「骨折あり」又は「骨折なし」のいずれかの判定結果である。また、ここでの骨折数は、骨折があると判定された骨の数である。骨粗鬆症による骨折を推測・予測しようとする身体部位を特に限定しない場合には、例えば、第１時点での腰椎の既存骨折が１つ、経過観察期間内での胸椎の新規骨折が１つ及び大腿骨近位部の新規骨折が１つと判定されたときに、骨折判定結果としては「既存骨折の骨折数１つ、新規骨折の骨折数２つ」となる。このように、第１時点で既存骨折と判定された骨折は、その後の経過観察期間内での新規骨折には該当しない。骨折判定結果は、医師の画像診断による判定結果であるのが好ましい。または、骨折判定結果は、前述した骨折判定結果を出力可能な学習モデルを予め準備し、該学習モデルに各被験者の骨の画像データを含む更に他の臨床情報を入力し、この学習モデルにより出力された骨折判定結果でもよい。

骨折判定結果は、骨粗鬆症による骨折を推測・予測しようとする身体部位について、第１時点で、又は、第１時点及び第２時点の各々で、エックス線撮影又はＭＲＩ等により各被験者から得られた骨の画像により、骨粗鬆症による骨折の有無及び骨折数の少なくとも一方を、医師が一定基準に従って画像診断し判定した結果であることが好ましい。通常、医師は、第１時点及び第２時点の各々でＸ線撮影又はＭＲＩ等による骨の画像を観察し判定する。または、第１時点及び第２時点の各々での骨の画像に基づき、後日に医師が判定する若しくは上記した学習モデルに骨折判定結果を出力させてもよい。医師の判定基準は、各被験者で概ね一定の基準に従っていればよい。一例を挙げると、椎体（頚椎、胸椎又は腰椎）骨折を判定する場合には、例えば、椎体変形の半定量法（ＳＱ）評価法（非特許文献１参照）により、骨折が疑われる椎体について隣接椎体と比較した椎体高（前縁高、中央高若しくは後縁高）又は減少率を、所定の閾値と比較した結果に基づき「骨折あり」又は「骨折なし」と判定する基準でもよい。この例に限らず、例えば骨粗鬆症に関する学術論文（いわゆるエビデンス）又は日本骨粗鬆症学会が発行する骨粗鬆症医療に関するガイドライン（例えば非特許文献１）に記載される、一定水準を満たす判定基準であればよい。骨折判定結果は、身体の特定部位に限定せず、脆弱性骨折を生じ得る部位全般で、骨折の有無及び骨折数の少なくとも一方を判定した結果でもよい。または、身体の限られた部位での骨折の推測・予測に特化した学習モデルを生成しようとする場合、その部位に限定して骨折の有無及び骨折数の少なくとも一方を判定した結果でもよい。例えば、推測・予測の対象を腰椎の骨折に限定した場合でも、腰椎は５つの椎体（Ｌ１乃至Ｌ５）を含み、骨折数の判定結果は０乃至５のいずれかの数となる。骨折数の判定結果では、例えば、骨折数が「０」、骨折数が「１」（重症骨粗鬆症と判断）、骨折数が「２以上」（超重症骨粗鬆症と判断）というように、骨折数が所定数以上である場合に「所定数以上」に分類されてもよい。既に述べたように、医師が骨折の有無を判定する診断の工程は、本発明に含まれない。ステップＳ３１ａでは、医師の診断により既に生成された骨折判定結果を取得してもよく、又は、前述した学習モデルにより出力された骨折判定結果を取得してもよい。

図１に示す各被験者の臨床情報正規化ステップＳ３２では、後に共分散構造分析や機械学習を効率良く行う観点から、各被験者の臨床情報に含まれる４種以上の臨床データと、各被験者の骨折判定結果とを、それぞれ情報処理装置で演算しやすいように正規化してもよい。正規化は、データを一定の規則に基づいて利用しやすいように変形する処理である。正規化後データは、正規化前データを概ね再現可能であるため、正規化前データを間接的に示すデータに該当する。例えば、「第１時点で身長低下あり」又は「第１時点で身長低下なし」等の数値ではないデータは、「身長低下あり」を１．０に変換し、「身長低下なし」を０に変換する等して正規化してもよい。例えば、年齢などの数値データは、次の数式２により０以上１．０以下の範囲内に含まれるように正規化してもよい。

機械学習では入力変数に０又は１．０の近似値が含まれていなければ演算しやすい観点から、各被験者の臨床情報に含まれる４種以上の臨床データ各々を０．１０以上０．９０以下の範囲内に含まれるように正規化してもよい。例えば「身長低下あり」又は「身長低下なし」等の数値でないデータは、「身長低下あり」を０．９０に変換し、「身長低下なし」を０．１０に変換する等して正規化するのが好ましい。同様の観点から、臨床情報に含まれ得る例えば「第１時点での年齢」等の数値データは、次の数式３により０．１０以上０．９０以下の範囲内に含まれるように正規化するのが好ましい。

各被験者の骨折判定結果は、後の共分散構造分析で観測変数の一種として用いられるが、更に後の機械学習で特に用いられない。このため、骨折の有無に関する骨折判定結果は例えば、「骨折あり」及び「骨折なし」のいずれか一方を０に変換し、残る他方を１．０に変換するように正規化するのが好ましい。身体の部位別に骨折の有無に関する骨折判定結果を取得した場合、部位別に「骨折あり」又は「骨折なし」の判定結果に応じて、部位別に０又は１．０に正規化するのが好ましい。一方、骨折数に関する骨折判定結果は、数であり、正規化が必須でない。

推測・予測精度向上の観点では、骨折数に関する骨折判定結果は、例えば、骨折数が任意の数未満（例えば骨折数２未満）である場合に０に変換し、骨折数が任意の数以上（例えば骨折数２以上）である場合に１．０に変換するのが好ましい。同様の観点から、複数セットの正規化した骨折判定結果を含む、データセットを作成してもよい。例えば、骨折判定結果が「骨折数０」、「骨折数１」又は「骨折数２以上」のいずれかに分類されるように判定した結果である場合は、「骨折数０」を０へと変換し且つ「骨折数１」及び「骨折数２以上」を１．０へと変換したセットＡと、「骨折数０」及び「骨折数１」を０へと変換し且つ「骨折数２以上」を１．０へと変換したセットＢと、が生成されるように骨折数に関する骨折判定結果を正規化してもよい

各被験者の臨床情報に含まれる４種以上の臨床データと、各被験者の骨折判定結果とについて、先のステップＳ３１ａで正規化後データを取得できる場合、ステップＳ３２を省略可能である。例えば、ステップＳ３１ａでデータ取得時に、骨折判定結果が既に０又は１．０で記録されている場合、このデータを更に正規化することは特に要しない。

共分散構造分析は、複数の変数（複数種のデータ）間の関係を検討可能な統計分析手法の一つである。各被験者の骨折スコア算出ステップＳ３３ａでは、情報処理装置を用いて共分散構造分析を行い、骨折スコアを算出する。このためには、各被験者について５種以上の観測変数を設ける。観測変数とは、実際に観測（計測）されたデータ又はその正規化後データである。５種以上の観測変数の内訳は、各被験者の第１時点における臨床情報に含まれる４種以上の臨床データと、各被験者の骨折判定結果との組み合わせである。共分散構造分析で各観測変数として用いるデータは、数値データであればよく、必ずしも０以上１．０以下の範囲内にある数値データでなくてもよい。共分散構造分析を行う際、各被験者の骨折判定結果に係る観測変数に対して、直接的な因果関係を有すると仮定される潜在変数を設ける（潜在変数から骨折判定結果の観測変数へ直接パスを設ける）。潜在変数とは、実際には観測（計測）されていない仮説的なデータである。５種以上の観測変数と、潜在変数とを設けた上で、情報処理装置に共分散構造分析を行うよう演算処理を実行させる。それにより、情報処理装置に、骨折判定結果に係る観測変数に対して、直接的な統計学的に有意な因果関係が認められた潜在変数について、因子得点のデータを算出させる。ここでの有意とは、潜在変数から骨折判定結果に係る観測変数への直接パスについて、標準化直接効果を検証した場合に、例えばｐ＜０．０５、好ましくはｐ＜０．００１の値が得られることである。算出された因子得点の数値データそのもの又は該数値データを再現可能な範囲内で正規化させたデータを、各被験者の骨折スコアとする。ここで算出される潜在変数の因子得点は、「サンプルスコア」ともいわれる（特許文献２参照）。

共分散構造分析に用いる情報処理装置は、共分散構造分析の演算処理が可能であれば特に限定されない。例えば、市販のパーソナルコンピュータで、ＡＭＯＳ（Analysis of Moment Structure）、ＳＡＳ（Statistical Analysis System）、ＬＩＳＲＥＬ（Linear Structure Relations）、又はＥＱＳ（Structural Equation Modeling Software）等の統計解析ソフトウェアを用いて共分散構造分析を行うことができる。推測・予測精度向上の観点から、各被験者の骨折スコア算出ステップＳ３３ａでは、平均共分散構造分析を行うのが好ましい。平均共分散構造分析は、ある変数の平均値と他の変数の平均値との差である切片を変数間の関係に導入し、推定すべきパス係数や分散にこの切片を含める共分散構造分析である。平均共分散構造分析では、ある被験者について観測変数として用いる臨床データに欠損値が含まれている場合、該欠損値の代わりに、他に観測変数として用いる臨床データどうしの関係から算出された数値が補われる。このため、平均共分散構造分析では、欠損値が含まれていても演算処理を実行可能という観点からも好ましい。パスモデルを用いて直感的に統計解析を行うことが可能な観点では、構造方程式モデリング（Structural Equation Modeling：以下「ＳＥＭ」ともいう）により共分散構造分析を行うのが好ましく、ＳＥＭにより平均共分散構造分析を行うのが更に好ましい。例えばＡＭＯＳでは、ＳＥＭにより平均共分散構造分析を行うことができる。

ＳＥＭのパスモデルとして例えば、図３（ａ）示すように複数の観測変数に対して１つの潜在変数が直接的な因果関係を有する探索的因子分析モデル、図３（ｂ）に示すように各観測変数に対して２つ以上の潜在変数が直接的な因果関係を有し且つ潜在変数間に相関関係を有する確認的因子分析モデル、図３（ｃ）に示すように探索的因子分析モデルを複数含んで成る二次因子モデル、又はこれらのモデルで少なくとも一部の観測変数どうしの間に有意と認められる因果関係が規定されるように変形させたモデル等が挙げられる。パスモデルにおいて、単方向矢印は因果関係を表し、矢印の元にある変数が矢印の先にある変数に対して影響を及ぼすことを仮定する。図３（ａ）乃至図３（ｃ）で記載省略しているが、パスモデルにおける単方向矢印にはいずれもパス係数が与えられ、潜在変数から各観測変数へ単方向矢印に与えられるパス係数はいずれも意味のあるもの（統計学的に有意なもの）と仮定する。パスモデルにおいて双方向矢印は、相関関係を表す。図３（ａ）乃至図３（ｃ）で省略しているが、パスモデルにおける双方向矢印にはいずれも相関係数が与えられ、各相関関係の大小を判別可能である。識別問題（パスモデルにより定まる観測変数と潜在変数との関係を規定する関係式が数学的な解を有するか否かの問題）を解きやすい観点では、パスモデルは、図３（ａ）に例示する探索的因子分析モデル、又は、このモデルで一部の観測変数どうしの間に因果関係若しくは相関関係の存在が仮定されるように変形させたモデルが好ましい。

共分散構造分析における計算結果の妥当性や、パスモデルがデータに適合しているか否かを評価するには、例えば、カイ二乗（以下「χ^２」という。）統計量、残差平方平均平方根（Root Mean square Residual：以下「ＲＭＲ」という。）、適合度指標（Goodness of Fit Index：以下「ＧＦＩ」という。）、修正適合度指標（Adjusted Goodness of Fit Index：ＡＧＦＩ）、赤池情報量基準（Akaike's Information Criterion：以下「ＡＩＣ」という。）又はRoot Mean Square Error of Approximation（以下「ＲＭＳＥＡ」という。）等の指標を用いてもよい。一般的に例えば、χ^２統計量から「パスモデルがデータに適合している」との仮説が棄却されない、ＧＦＩ値やＡＧＦＩ値が所定の閾値（例えば０．９）以上である、又はＲＭＳＥＡ値が所定の閾値（例えば０．０８０）未満である等の条件を数多く満たすほど、共分散構造分析の計算結果やパスモデルの信頼性が高い。パスモデルに含まれるパス係数の信頼性を評価するには、例えばｔ検定又はワルド検定等を行えばよい。例えばＡＭＯＳを用いてＳＥＭにより共分散構造分析を行う場合、ここで例示した指標や方法により、共分散構造分析の計算結果やパスモデルについて信頼性を検討でき、前述した標準化直接効果も検証可能である。作成したパスモデルは、そのＲＭＳＥＡ値が例えば０．０８０未満である場合、好ましくは０．０５０未満である場合、信頼できる統計モデルとして共分散構造分析に用いるのがよい。ＲＭＳＥＡ値が０．０８０以上である場合、そのままではパスモデルを信頼できないため、ＲＭＳＥＡ値が０．０８０未満になるように、例えば観測変数として用いる４種以上の臨床データの組み合わせを再考してパスモデルを修正してもよい。同様の観点から、パスモデルのＲＭＳＥＡ値が０．０８０以上になる４種以上の臨床データの組み合わせは、後の機械学習で４種以上の入力変数の組み合わせとして用いないのが好ましい。

各被験者の骨折判定結果が骨折数に関するもので複数セットある場合には、１セットの骨折判定結果ごとに１種の観測変数とし、この１種の観測変数ごとに、該観測変数に対して直接的な因果関係を有すると仮定される潜在変数を１つ設けて、共分散構造分析により各潜在変数の因子得点を算出することが好ましい。演算処理を効率よく実行させる観点では、パスモデルごとに設ける、骨折判定結果に係る観測変数と、潜在変数とは、それぞれ１種に留めることが好ましい。例えば、骨折判定結果が、「骨折数０」を０へと変換し且つ「骨折数１」及び「骨折数２以上」を１．０へと変換したセットＡと、「骨折数０」及び「骨折数１」を０へと変換し且つ「骨折数２以上」を１．０へと変換したセットＢと、を含むように正規化されている場合には、骨折判定結果に係る観測変数としてセットＡのみを使用し共分散構造分析を行って潜在変数の因子得点Ａを算出させ、これとは別に、骨折判定結果に係る観測変数としてセットＢのみを使用し共分散構造分析を行って潜在変数の因子得点Ｂを算出させることが好ましい。このようにして算出された潜在変数の因子得点Ａは「骨折数０及び骨折数１のいずれか」又は「骨折数２以上」という分類を反映した数値になっており、潜在変数の因子得点Ｂは「骨折数０」又は「骨折数１及び２以上のいずれか」という分類を反映した数値になっている。

以上に説明した学習データセット作成方法Ｓ３０ａでは、第１時点での各被験者について、４種以上の臨床データを含む臨床情報と、共分散構造分析により算出される潜在変数の因子得点に関するデータである各被験者の骨折スコアと、を含む学習データセットを作成可能である。さらに、以下に説明する学習モデル生成方法Ｓ２０ａでは、骨折学習ステップＳ３４ａと、骨折学習後選別ステップＳ３５とを含み得る。

骨折学習ステップＳ３４ａでは、各被験者の臨床情報に含まれる４種以上の臨床データを入力変数（独立変数）とし、上述した各被験者の骨折スコア算出ステップＳ３３ａで得られた各被験者の骨折スコア（潜在変数の因子得点に関するデータ）を出力変数（従属変数）とし、入力変数と出力変数との関係をＡＮＮ（人工ニューラルネットワーク）に機械学習させる。ＡＮＮは、ヒト脳での神経学的処理を模した計算技術に基づく情報処理システムで、入力変数と出力変数とが存在するシステムのモデル化に用いられている。ステップＳ３４ａで使用可能なＡＮＮとして、例えばパーセプトロンが層状につなぎ合わされた多層パーセプトロンが挙げられる。多層パーセプトロンとして図４に例示するように、入力層５２と、一層の中間層５５と、出力層５８とを有する三層型のＡＮＮ５０が挙げられる。各層（５２、５５、５８）に人工ニューロン（artificial neuron：以下「ＡＮ」という）が幾つか設けられる。ＡＮはノードともいわれる。入力層５２に設けられた各ＡＮ（５３ａ乃至５３ｄ）は、ネットワーク５４を介して中間層５５に設けられた各ＡＮ（５６ａ乃至５６ｃ）に接続される。中間層５５に設けられた各ＡＮ（５６ａ乃至５６ｃ）は、ネットワーク５７を介して、出力層５８に設けられたＡＮ５９に接続される。

ＡＮＮ５０に機械学習させる際、例えば入力層５２に設けられた各ＡＮ（５３ａ乃至５３ｄ）に、入力変数とする４種以上の臨床データのうちのいずれか１種を入力する。また、例えば出力層５８に設けられたＡＮ５９に、出力変数とする各被験者の骨折スコアを入力する。その上で情報処理装置に演算させると、入力層５２に設けられた各ＡＮ（５３ａ乃至５３ｄ）に入力された入力変数が、中間層５５へ向けて出力される。各ネットワーク（５４、５７）は、重み付け値Ｗ_ｉｊを有する。中間層５５に設けられた各ＡＮ（５６ａ乃至５６ｃ）と出力層５８に設けられたＡＮ５９とでは、次の数式４で例示するように、前層からの入力値Ｓ_ｉと重み付け値Ｗ_ｉｊの積和計算と、シグモイド関数を用いた変数変換がされ、出力層５８で計算式が出力される。この計算式により算出される数値と、正解（事前に出力層５８に入力された出力変数（各被験者の骨折スコア））との誤差が計算され、誤差がゼロになるように、しきい値ｈ_ｉ及び重みＷ_ｉｊが修正される。機械学習したＡＮＮでは、入力変数（独立変数）と出力変数（従属変数）との間に存在する関係が見出されている。このため、骨折スコアを出力可能な学習モデルを、生成させることができる。

図４に例示するＡＮＮ５０に限らず、図１に示す骨折学習ステップＳ３４ａでは例えば、入力層と、一層以上の中間層と、出力層とを有するＡＮＮに機械学習させればよい。機械学習させるＡＮＮとして、入力層及び出力層という二層からなる単純パーセプトロンのみを採用するのは、推測・予測精度の大幅な悪化を招くため避けるべきである。過学習を避ける観点から、ＡＮＮにおける中間層の数は、四層以下又は三層以下でもよく、好ましくは二層以下である。本発明の目的に反しない限り、入力層、一層以上の中間層、及び出力層を有する階層型ＡＮＮを２つ以上組み合わせた状態で機械学習させてもよい。ＡＮＮで用いられる動作関数は、例えば動径基底関数又はヘビ関数でもよいが、信頼性が高い観点から、数式４のようなシグモイド関数が好ましい。機械学習の方法は例えば、共役勾配降下法、準ニュートン法又はレーベンバーグ・マーカート法等でもよいが、初学者でも市販の統計解析用ソフトウェアを用いて実施しやすい観点では、正則化させて行ったり又は誤差逆伝搬法を行ったりするのが好ましく、加えて学習時間を短縮させる観点から誤差伝搬法と補修学習法を併用するのが更に好ましい。学習データに隠れた法則性を抽出しやすい観点では、誤差伝搬法と成長抑制学習法を併用するのが更に好ましい。

推測・予測精度向上の観点では、機械学習での入力変数として、各被験者の第１時点における臨床情報として挙げた臨床データの例のうち、例えば５種以上又は６種以上を用いてもよく、好ましくは７種以上又は８種以上を用い、臨床応用しやすく推測・予測精度向上の観点では９種以上を用いるのが更に好ましく、９種を超えてデータ項目が多くなると更により好ましい。入力変数には、前述したその他のデータが更に含まれてもよい。学習効率の悪化を避ける観点では、入力変数として用いる各被験者の臨床データは、例えば２０種以下、好ましくは１５種以下である。推測・予測精度向上の観点では、入力変数と出力変数とを入力し、誤差修正までの演算処理を情報処理装置に繰り返し（例えば５０回以上）実行させ、見出された入力変数と出力変数との関係が各々異なる複数の学習モデルを生成させるのが好ましい。

各被験者の骨折スコア（潜在変数の因子得点に関するデータ）が骨折数に関する骨折判定結果を反映して複数セットある場合には、１セットの骨折スコアごとに１種の出力変数とし、入力変数と出力変数との関係をＡＮＮに機械学習させることが好ましい。例えば、各被験者の骨折スコア（潜在変数の因子得点）Ａが「骨折数０」又は「骨折数１及び２以上のいずれか」という分類を反映した数値であり、各被験者の骨折スコア（潜在変数の因子得点）Ｂが「骨折数０及び１のいずれか」又は「骨折数２以上」という分類を反映した数値である場合には、骨折スコアＡを１種の出力変数とし、骨折スコアＢを他の１種の出力変数として、ＡＮＮに機械学習させることが好ましい。効率よく機械学習させる観点では、機械学習の際に設ける出力変数を１種に留めることが好ましい。例えば、骨折スコアＡのみを出力変数として機械学習させた学習モデルＡと、骨折スコアＢのみを出力変数として機械学習させた学習モデルＢと、を生成させることが好ましい。この場合、学習モデルＡは「骨折数０」又は「骨折数１及び２以上のいずれか」に分類する推測・予測に適した統計モデルとなっており、学習モデルＢは「骨折数０及び１のいずれか」又は「骨折数２以上」に分類する推測・予測に適した統計モデルとなっている。

骨折学習後選別ステップＳ３５では、先のステップＳ３４ａで複数の学習モデルを生成させた場合に、推測・予測精度向上の観点から、各学習モデルで推測・予測精度の高さを検証し、比較的高精度な学習モデルを選定してもよい。例えば、市販の統計解析ソフトウェアを用い、各学習モデルで単純交差検証法又はＫ分割交差検証法（例えば五分割交差検証法）を行って決定係数Ｒ^２を算出し、該Ｒ^２値が比較的大きい学習モデルを選定してもよい。このＲ^２値は、入力変数が出力変数をどの程度に説明可能か表す指標で、０に近い値ほど説明できず、１．０に近い値ほど説明できることを意味する。構造が単純で出力誤差が小さい学習モデルを選出する観点から、学習モデルごとに、ＡＩＣや、シュワルツのベイジアン情報量基準（Schwartz's Bayesian information criterion：以下「ＢＩＣ」という）を検証し、ＡＩＣ又はＢＩＣで比較的高値を示した学習モデルを選出候補から外すのが好ましい。市販の統計ソフトウェアでＡＩＣやＢＩＣを検証できる。ＡＩＣやＢＩＣが低値な学習モデルは、推測・予測精度が高く、統計モデルとして好ましい。ただし、機械学習に用いた各被験者の学習データセットにはよく適合しても、過学習に陥って、機械学習後に新規入力する閉経後女性の臨床データにはあまり適合せず、汎用性を欠いたモデルになっている場合があり得る。このため、選定した学習モデルで、新規の臨床データセットを入力し、所望する推測・予測精度で骨折スコアを出力可能か検証するのが好ましい。先のステップＳ３４ａで生成した学習モデルが１つしかない場合や、ある程度の推測・予測精度があれば充分な場合には、骨折学習後選別ステップＳ３５を省略してもよい。

以上に説明した学習モデル生成方法Ｓ２０ａによれば、臨床情報として挙げた臨床データはいずれも、例えば、問診、身体計測、ＢＭＤ計測若しくは血液検査等をする、又は、ＦＲＡＸ（非特許文献３）若しくは特許文献１に記載された学習モデルを使用する等すれば、従来の骨粗鬆症医療における日常診療の現場でも生成し取得可能なデータである。各被験者の骨折スコア（潜在変数の因子得点に関するデータ）は、各被験者の臨床情報に含まれる４種以上の臨床データと、各被験者の骨折判定結果とから、共分散構造分析により算出可能である。このため、従来の骨粗鬆症医療の日常診療の現場でも、骨折スコアを出力可能な学習モデルを生成可能であり、前述した学習データセットは、この学習モデルの生成に適している。以下に説明する骨折スコア出力方法Ｓ１５ａでは、この学習モデルを用い、対象者の骨折スコアを出力可能である。

骨折スコア出力方法Ｓ１５ａは、骨折スコアを出力可能な学習モデルに、対象者とする任意の閉経後女性の第１時点での臨床情報を入力し、この対象者の骨折スコアを出力する処理を、情報処理装置に実行させる。骨折スコア出力方法Ｓ１５ａは、前述したステップＳ３１ａ、Ｓ３２、Ｓ３３ａ、Ｓ３４ａ及びＳ３５を含み得ることに加えて、対象者の臨床情報取得ステップＳ４１ａと、対象者の臨床情報正規化ステップＳ４２と、対象者の骨折スコア出力ステップＳ４３ａとを更に含み得る。

対象者の臨床情報取得ステップＳ４１ａでは、対象者の第１時点での臨床情報を取得する。該臨床情報は、対象者についての、第１時点での年齢、第１時点での身長、第１時点での体重、第１時点でのＢＭＩ、第１時点での骨密度（ＢＭＤ）、第１時点での骨代謝マーカー検査値、第１時点での腎機能マーカー検査値、第１時点での骨格筋量マーカー検査値、第１時点で既存の身長低下、初経年齢、閉経年齢、閉経時から第１時点までの経過年数、経過観察期間の長さ、前記ＦＲＡＸ結果、前記ＢＭＤ予測値、前記ＢＬＲ予測値、及びこれらのいずれかを間接的に示すデータからなる群より選ばれた４種以上の臨床データである。該４種以上の臨床データは、各被験者の４種以上の臨床データと同様に、第１時点の対象者に基づく臨床データであれば、対象者の第１時点で生成される臨床データに限らず、対象者の第１時点よりも後に生成される臨床データでもよい。推測・予測精度向上の観点では、ここで臨床情報として挙げた臨床データの例のうち、例えば５種以上又は６種以上を取得してもよく、好ましくは７種以上又は８種以上を取得し、臨床応用しやすい高精度な骨折スコアを得る観点では９種以上を取得するのが更に好ましく、９種を超えて多くのデータ項目数を取得すると更により好ましい。通常は、骨折スコアを出力可能な学習モデルを準備（例えば生成）後にステップＳ４１ａを実施し、この場合、図２に示すように、各被験者の少なくとも第１時点と比べて、対象者の第１時点は、暦の上で後になる。図１に示す、対象者の臨床情報取得ステップＳ４１ａ及び後続の各ステップ（Ｓ４２、Ｓ４３a及びＳ４５）は、対象者の第１時点で記録された対象者の臨床情報に基づき、対象者の第１時点から幾らか期間経過した後に実施してもよいが、期間経過に伴って推測・予測結果の価値が下がることを避ける観点では対象者の第１時点の直後に実施するのが好ましい。

推測・予測精度向上の観点から、対象者の臨床情報取得ステップＳ４１ａで取得する４種以上の臨床データは、前述したステップＳ３１ａで取得して骨折学習ステップＳ３４ａで入力変数とした各被験者の４種以上の臨床データの組み合わせに対応する、概ね同項目の臨床データの組み合わせが好ましい。このため、仮に、前述した各被験者の臨床情報でのデータ項目の一種としてその他のデータを取得し、該データを入力変数の一項目とて機械学習に用いた場合、対象者でも対応する同種のその他のデータを更に取得するのがよい。対象者の経過観察期間の長さは、このデータの取得時（ステップＳ４１ａ実施時）から見て対象者の第２時点が未来にある場合には、「経過観察期間の長さの予定値」であればよい。この予定値は、任意の値でもよく、又は、対象者が定期的に骨粗鬆症外来を受診している場合（例えば３年ごとに受診している場合）には次回の受診予定日までの期間の長さ（例えば３年）でもよい。この予定値は、前述した各被験者の臨床データの例として挙げた「経過観察期間の長さ」に対応する概ね同項目の臨床データといえる。医師が対象者について「経過観察期間の長さの予定値（例えば次回検診までの期間の長さの予定値）」を検討する場合、ステップＳ４１ａでは、既に生成（例えば医師により仮決定）された経過観察期間の長さの予定値をデータ取得すればよい。

対象者の臨床情報正規化ステップＳ４２では、推測・予測精度向上の観点から、対象者について先のステップＳ４１ａで得た４種以上の臨床データを、情報処理装置で演算しやすいように正規化してもよい。例えば、前述したステップＳ３２と同様にして、ステップＳ４２では、対象者の４種以上の臨床データを正規化するのが好ましい。ただし、各被験者とは異なり、通常、対象者についての各ステップ（Ｓ４１ａ、Ｓ４２、Ｓ４３ａ及びＳ４５）を実施する際、対象者について前述した画像診断による骨折判定結果は生成されていないため、対象者では骨折判定結果を正規化することを特に要しない。先のステップＳ４１ａで既に正規化された臨床データを取得可能な場合、対象者の臨床情報正規化ステップＳ４２は省略可能である。

対象者の骨折スコア出力ステップＳ４３ａでは、骨折スコアを出力可能な学習モデルを有する情報処理装置に、対象者の臨床情報に含まれる４種以上の臨床データを入力し、対象者の骨折スコアを出力する処理を実行させる。例えば、学習モデルの入力層に設けられたＡＮごとに、対象者の臨床情報に含まれる４種以上の臨床データ又はその正規化データ（入力変数）のうち１種を入力し、出力層に設けられたＡＮから対象者の骨折スコアを出力する処理を、情報処理装置に実行させる。

学習モデルにより出力される対象者の骨折スコアは、対象者についての、第１時点での既存骨折の有無の推測、第１時点での既存骨折の骨折数の推測、経過観察期間内での新規骨折の有無の予測、及び、経過観察期間内での新規骨折の骨折数の予測から選ばれた１種以上の指標となる数値データである。出力された対象者の骨折スコアと、骨折スコアの閾値（例えばカットオフ値）との比較結果に基づき、対象者について、第１時点での既存骨折の有無の推測結果、第１時点での既存骨折の骨折数の推測結果、経過観察期間内での新規骨折の有無の予測結果、及び、経過観察期間内での新規骨折の骨折数の予測結果から選ばれた１種以上に関する結果が、明確となる。例えば、対象者の骨折スコアがカットオフ値の所定値未満である場合に「対象者には第１時点で既存骨折がない」という推測結果が示唆され、対象者の骨折スコアがカットオフ値の所定値以上である場合に「対象者には第１時点で既存骨折がある」という推測結果が示唆される。あるいは、対象者の骨折スコアがカットオフ値の所定値未満である場合に「対象者では経過観察期間内に新規骨折が生じない」という予測結果が示唆され、骨折スコアがカットオフ値の所定値以上である場合に「対象者では経過観察期間内に新規骨折が生じる」という予測結果が示唆される。

対象者の骨折スコア出力ステップＳ４３ａで使用する学習モデルが、各被験者の骨折数に関する骨折判定結果を観測変数として共分散構造分析により算出された潜在変数の因子得点（各被験者の骨折スコア）を出力変数として機械学習したものである場合に、この学習モデルに対象者の臨床情報を入力して出力される対象者の骨折スコアは、対象者の骨折数の推測・予測に関する数値となっている。この場合、学習モデルにより出力された対象者の骨折スコアと、骨折数ごとの閾値との比較に基づき、例えば、「対象者の初診時（第１時点）での既存骨折数が０」を示す推測結果を出力したり、「対象者の経過観察期間内での新規骨折数が１つ」を示す予測結果を出力したりし得る。また、「骨折数が所定数未満」又は「骨折数が所定数以上」のいずれかに分類する複数種の学習モデルを使用することにより、対象者の骨折数の推測・予測に適した、対象者の複数の骨折スコアを出力させることもできる。例えば、「骨折数０」又は「骨折数１及び２以上のいずれか」に分類する学習モデルＡと、「骨折数０及び１のいずれか」又は「骨折数２以上」に分類する学習モデルＢとを組み合わせて使用することにより、学習モデルＡからは「骨折数１以上」が陽性又は陰性のいずれかの推測・予測に適した対象者の骨折スコアＡを出力させ、学習モデルＢからは「骨折数２以上」が陽性又は陰性のいずれかの推測・予測に適した対象者の骨折スコアＢを出力させるように使用することも可能である。また、例えば、骨折数が１つと推測・予測される場合は「重症」に分類し、骨折数が２以上と推測・予測される場合は「超重症」に分類するというように、骨折数に応じて骨粗鬆症又は骨折の重症度を分類し、対象者での骨粗鬆症又は骨折の重症度を示す推測・予測結果を出力する応用も可能である。将来的には、ここで骨折スコアの値について幾つか例示したような判断基準を知っている者（例えば臨床統計学に慣れた医師）にとって、学習モデルにより出力された対象者の骨折スコアの数値そのものが、対象者の骨粗鬆症による骨折の推測・予測結果を示しているも同然と分かるようになる可能性もあり得ると考えられる。

以上に説明した骨折スコア出力方法Ｓ１５ａによれば、各被験者の臨床情報に含まれる４種以上の臨床データと、共分散構造分析により算出された各被験者の骨折スコア（潜在変数の因子得点）と、を学習データセットに含めた機械学習により生成された学習モデルを用いることにより、対象者での骨粗鬆症による骨折を推測・予測する指標となる、対象者の骨折スコアを出力することができる。このため、例えば、骨粗鬆症医療の日常診療の現場で、担当医が対象者の骨粗鬆症や既存骨折を早期発見したり、対象者で今後に生じる可能性が高いと予測される新規骨折を未然に抑える予防・治療方針を早期決定する診断をしたりしやすいように、担当医を支援可能である。骨折スコア出力方法Ｓ１５ａは、例えば、骨粗鬆症医療の担当医にとって、骨粗鬆症の早期予防・治療を図る方針を決定する診断をする際、判断材料となる情報の一つとして、対象者の骨折スコアを対象者の第１時点又はその後の数日以内に入手するのに適した方法といえる。担当医は、「骨粗鬆症外来の受診者が第１時点で既存骨折を生じている」旨の推測結果又は「今後の経過観察期間内に新規骨折が生じる」旨の予測結果を、第１時点の直後（例えば受診者が病院で骨粗鬆症検診のために身体計測等を受けた時点（第１時点）の後、帰宅前に担当医から検診の結果説明を受けるために担当医がいる診察室前で順番待ちをしている時点）で得られた場合、担当医は直ぐに骨折スコアに基づく推測・予測結果を受診者に伝えた上で、骨粗鬆症や骨折の早期予防・治療を図るための方針として、例えば、処方を第一選択薬（活性型ビタミンＤ_３製剤又はカルシウム製剤等）から第二選択薬（例えばビスホスホネート製剤）へと変更する提案をしやすいと期待される。特に、対象者の臨床情報として例えば９種以上の臨床データを用いて骨折スコアを出力する場合、臨床応用しやすい水準の高精度な骨折スコアが出力されやすく、担当医は、既存骨折の有無又は近い将来に新規骨折が生じるリスクの高さを対象者に分かりやすく説明しやすくなり、骨粗鬆症や骨折の早期予防・治療を図る方針へと変更することを対象者に納得してもらいやすくなると期待される。

対象者の骨折スコアが「対象者の経過観察期間内での新規骨折の有無」を予測する指標となっている場合、予測結果における対象者の経過観察期間の長さは、各被験者の経過観察期間の長さに応じた長さになっていると考えられる。このため、例えば、「対象者の初診時（第１時点）から約３年以内での新規骨折の有無」を予測しようとする場合には、経過観察期間の長さが約３年である閉経後女性らを被験者らとして、各被験者の臨床情報及び判定結果取得ステップＳ３１ａを実施するのがよい。また、対象者の骨折スコアが推測又は予測のいずれの指標になるのかは、例えば、ステップＳ３１ａで各被験者としてどのような時期に骨折した閉経後女性を選定し、且つ、推測又は予測のいずれに対応する骨折判定結果を取得し共分散構造分析（各被験者の骨折スコア算出ステップＳ３３ａ）に供したのかに応じて変化すると考えられる。例えば、既存骨折が生じてから約３年後に第１時点を迎えて「第１時点で既存骨折あり」と判定された被験者が多い場合には、その判定結果（推測に対応する骨折判定結果）を観測変数の１種として共分散構造分析を行い、算出された潜在変数の因子得点（各被験者の骨折スコア）を出力変数として機械学習させると、生成する学習モデルから出力可能な対象者の骨折スコアは、「対象者の第１時点で発生から約３年以内程度の既存骨折があるか否かの推測結果」の指標として適していると考えられる。または、「各被験者で数年以上の経過観察期間内での新規骨折の有無に関する判定結果（予測に対応する判定結果）」を用いて、共分散構造分析を行い、算出された潜在変数の因子得点を出力変数として機械学習させると、生成する学習モデルから出力される骨折スコアは、「対象者で経過観察期間内に新規骨折が生じるか否かの予測結果」の指標として適していると考えられるが、意外にも、この場合の骨折スコアは、「対象者の第１時点での既存骨折の有無の推測結果」の指標としても適している場合がある（後述する表７の試験例１－１を参照）。このため、学習モデルにより出力される対象者の骨折スコアが、推測又は予測のいずれの指標となるのか明確には区別できない場合がある。そのように明確に区別できない場合の骨折スコアでも、対象者での骨粗鬆症による骨折の推測及び予測のうちの少なくとも一方の指標になっているといえる。

骨折スコア出力方法Ｓ１５ａにより出力される対象者の骨折スコアは、推測又は予測のいずれの指標となるかを問わず、例えば、大勢の閉経後女性（大勢の対象者）が受診する骨粗鬆症検診では、対象者ごとにエックス線撮影又はＭＲＩによる画像診断を要するか否かをスクリーニングする指標として有用と考えられる。例えば、骨粗鬆症検診時における対象者の検査結果（対象者の第１時点における４種以上の臨床データ）を取得して骨折スコア出力方法Ｓ１５ａを実施し、対象者の骨折スコアを出力し、該骨折スコアの数値に基づき骨折の可能性が高いと示唆される対象者については、さらに、検診担当医が骨の画像診断を行うように運用すれば、骨折スコア出力方法Ｓ１５ａにより、検診担当医が対象者について骨粗鬆症や骨折の予防・治療を図る早期診断をすることを効果的に支援可能と期待される。

骨折スコアの閾値（例えばカットオフ値）の所定値の高さは、各被験者の臨床情報とした４種以上の臨床データでのデータ項目の組み合わせや、医師が各被験者について骨折の有無を判定した基準等に応じて、変化する場合がある。例えば、骨粗鬆症による椎体骨折が生じたか否かに関して、画像診断により圧迫骨折が疑われる椎体について、隣接椎体と比較して椎体高の低下量が２０％以上である場合に「骨折あり」と判定するのか、又は、この低下量が４０％以上である場合に「骨折あり」と判定するのか、判定基準値に応じて骨折スコアの閾値における所定値の高さが変化し得る。判定基準値が高くなれば、骨折スコアの閾値の所定値も大きくなり得る。骨粗鬆症による骨折の推測・予測方法Ｓ１０ａでは、対象者の骨折スコア出力ステップＳ４３ａの後、学習モデルにより出力された対象者の骨折スコアと、骨折スコアの閾値との比較結果に基づき、対象者についての、第１時点での既存骨折の有無を示す推測結果、第１時点での既存骨折の骨折数を示す推測結果、経過観察期間内での新規骨折の有無を示す予測結果、及び、経過観察期間内での新規骨折の骨折数から選ばれた１種以上の推測・予測結果を出力する処理を情報処理装置に実行させる結果出力ステップＳ４５を更に含む。このように出力させた場合、骨粗鬆症による骨折の推測・予測方法Ｓ１０ａの実施者が統計処理に慣れていなくても、分かりやすい推測・予測結果を入手しやすい。

または、結果出力ステップＳ４５では、学習モデルにより出力された対象者の骨折スコアのデータを、該学習モデルを有する情報処理装置から出力（例えば送信）し、少なくとも１つのユーザ端末へ入力（例えば受信）させてもよい。その上で、該ユーザ端末において、骨折スコアとその閾値との比較結果に基づき、対象者についての、第１時点での既存骨折の有無を示す推測結果、第１時点での既存骨折の骨折数を示す推測結果、経過観察期間内での新規骨折の有無を示す予測結果、及び、経過観察期間内での新規骨折の骨折数から選ばれた１種以上の推測・予測結果を出力する処理をユーザ端末に実行させるのが好ましい。

上述した推測・予測結果を出力する際、推測・予測結果の出力とは別に、骨折スコアを出力可能な学習モデルに基づいて、被験者らの臨床情報と、被験者らの骨折スコアと、の関係を示す応答曲面を応答曲面法により生成し、生成された応答曲面と骨折スコア閾値（例えばカットオフ値）との位置関係を示す二次元グラフ又は三次元グラフのデータを生成する処理を、情報処理装置に実行させてもよい。応答曲面法は、統計的手法の一種であり、被験者どうしの間で連続していない骨折スコア及び臨床データの値から近似式を作成し、近似式により連続的な曲面（応答曲面）を作成可能である。例えば、ＡＭＯＳ等の市販の統計解析ソフトウェアには、応答曲面法による応答曲面を含む三次元グラフを作成可能な機能が実装されている。このような統計解析ソフトウェアと、骨折スコアを出力可能な学習モデルとがあれば、応答曲面法により応答曲面を作成する処理を情報処理装置に実行させることができる。二次元グラフを作成する場合に該二次元グラフは、骨折スコアの値を示す第１軸と、機械学習に供した４種以上の臨床データから選択された１種の臨床データの値を示す第２軸とを有するグラフである。三次元グラフを作成する場合に該三次元グラフは、前記第１軸と、前記第２軸と、機械学習に供した４種以上の臨床データから選択された他の１種の臨床データの値を示す第３軸とを有するグラフである。なお、応答曲面の全体像は、本来、機械学習に供した入力変数の種類数（例えば１２種）と、出力変数の種類数（例えば骨折スコアという１種）との合計数（例えば１３）次元グラフで描かれるはずのものであるが、そのような多次元の全体像は視認困難である。応答曲面について二次元の断面が二次元グラフに描かれるか又は三次元の断片が三次元グラフに描かれるかすれば、応答曲面と骨折スコア閾値との位置関係を、視覚的に確認しやすい。二次元グラフ又は三次元グラフは、以下に例示するように活用可能である。

骨粗鬆症医療の担当医は、対象者（新規受診者）を診察する際、対象者の骨折スコア又は推測・予測結果を対象者に伝え、今後の骨粗鬆症による骨折の予防・治療方針を対象者と相談する際、上述した二次元グラフ又は三次元グラフを活用可能である。担当医は、診察室で、ＰＣのモニターにグラフを表示してもよく又はグラフが記載された資料をプリンターでプリントアウトしてもよい。二次元グラフを活用する場合、担当医は、二次元グラフに示された応答曲面での第２軸の臨床データの値を仮に変化（増加又は減少）させる場合に、応答曲面上で第１軸（骨折スコア）の値がどのように増加又は減少し、これに伴い応答曲面上の骨折スコアの値と骨折スコア閾値との関係がどのように変化するのか、対象者に対して視覚的に説明可能である。例えば、骨折スコア閾値がカットオフ値である場合に、応答曲面上の第２軸の臨床データの値を仮に増加又は減少させることにより応答曲面上の骨折スコアの値がカットオフ値よりも高値となるように変化するときには、今後、実際に対象者の臨床データの値がそのように変化すれば対象者で骨粗鬆症による骨折が生じるであろうと予測される。そのように骨折スコアの値を変化させる要因となり得る臨床データ（第２軸）の値は、骨粗鬆症による骨折を発生させるリスク因子と推定される。担当医は、このようなグラフと共に推測・予測結果を対象者に伝えることにより、対象者に推測・予測結果を説明しやすくなり、対象者は骨粗鬆症の早期予防・治療を図る方針に納得しやすくなると期待される。あるいは、前述した三次元グラフを活用する場合は、第２軸で示される臨床データの値の変化だけでなく、併せて、第３軸で示される臨床データの値の変化に伴い、応答曲面上の骨折スコアの値と骨折スコア閾値との位置関係がどのように変化するのか対象者に対して視覚的に説明可能なため、更に好ましい。応答曲面上の骨折スコアの値がカットオフ値よりも高値となる領域が三次元グラフに含まれている場合、この三次元グラフの第２軸で示される臨床データと第３軸で示される臨床データとの組み合わせは、骨粗鬆症による骨折を発生させるリスク因子の組み合わせと推定される。担当医は、このようにグラフを活用すると、対象者ごとに一人ひとり異なる体質（遺伝的素因、環境要因）に応じて、対象者ごとに適した骨粗鬆症を早期予防・治療の方針を対象者に説明しやすい。なお、既に述べたとおり、対象者の骨折スコア、推測・予測結果又はグラフ等の出力や表示は本発明に含まれ得るが、その後に医師が骨折スコア等を参考にして対象者に手術、治療又は診断する工程は本発明に含まれない。

図５（ａ）で一例として、後述の試験例１－１に係る学習モデルにより出力された骨折スコア（新規骨折スコア）を示すＺ軸（第１軸）と、初診時（第１時点）の正規化された血中Ｃｒ検査値（初診時正規化血中Ｃｒ検査値）を示すＸ軸（第２軸）と、初診時（第１時点）の正規化された血中ＢＡＰ検査値（初診時正規化血中ＢＡＰ検査値）を示すＹ軸（第３軸）と、を有する三次元グラフ９０ａを示す。該三次元グラフ９０ａは、各被験者の４種以上の臨床データを入力変数とし、各被験者の骨折スコア（潜在変数の因子得点）を出力変数として、統計解析ソフトウェア（SAS Institute Inc.製、ＪＭＰ（登録商標）version 8.0）に入力し、機械学習により生成された学習モデルに基づいて応答曲面法により作成されたグラフである。ＪＭＰに限らず、統計処理ソフトウェア分野の当業者は、任意の方法で応答曲面法によりグラフ作成可能である。この三次元グラフ９０ａには、骨折スコアの閾値の高さ（図５（ａ）ではカットオフ値＝１．０８）を示す閾値表示９５と、骨折スコアを出力可能な学習モデルに基づいて応答曲面法により生成された応答曲面９２ａとが示されている。応答曲面９２ａには、閾値表示９５よりも骨折スコアが高値である骨折リスク陽性の予測領域９９と、閾値表示９５よりも骨折スコアが低値である骨折リスク陰性の予測領域９７とが含まれている。

この三次元グラフ９０ａは、対象者（骨粗鬆症外来の新規受診者）を初診時（第１時点）に検査し、対象者から取得した４種以上の臨床データを試験例１－１に係る学習モデルに入力し、該学習モデルに入力された対象者の４種以上の臨床データにおいて初診時正規化Ｃｒ検査値が０．２以下で且つ初診時正規化ＢＡＰ検査値が０．５以上で、その結果として該学習モデルにより出力された対象者の骨折スコアが閾値（１．０８）よりも高値である場合に、検査後の診察時に担当医が対象者と今後の骨粗鬆症による骨折の予防・治療方針を相談する際、活用するのが好ましいと考えられるグラフである。この場合に、対象者の骨折スコアは、三次元グラフ９０ａの応答曲面９２ａ上に当てはめて考えると、閾値表示９５よりも上側にある骨折リスク陽性の予測領域９９内に位置することとなる。このため、三次元グラフ９０ａは、仮に、対象者が初診前のように骨粗鬆症の予防・治療を試みなければ「初診時（第１時点）から例えば１０年後の検診予定時（第２時点）までの経過観察期間内に新規骨折が生じる」という予測結果を示唆している。一方、応答曲面９２ａでは、仮に、初診時正規化Ｃｒ検査値を０．２よりも幾らか高値へと変化させるか又は初診時正規化ＢＡＰ検査値を０．５未満の値へと変化させる場合には、骨折スコアが閾値表示９５よりも低値である骨折リスク陰性の予測領域９７内へと移行することが示唆されている。つまり、今後、対象者が正規化Ｃｒ検査値を０．３以上へと増加させたり、正規化ＢＡＰ検査値を０．５未満へと低下させたりすることができれば、対象者において数年以内での新規骨折の発生を避けやすいことを示唆している。このように三次元グラフ９０ａを活用することにより、担当医は、対象者に対して、例えば、骨格筋量を増やすことによりＣｒ検査値を高めたり、ビスホスホネート製剤の投薬により骨代謝回転を抑えてＢＡＰ検査値を低くしたりする等、対象者の体質（遺伝的素因、環境要因）に応じて骨粗鬆症による骨折を早期予防・治療を図る診断をしやすくなる。つまり、グラフの生成により、このような担当医の診断を支援することができる。

図５（ａ）では、ＢＡＰ検査値とＣｒ検査値との組み合わせが、骨折スコアの値の高さに強く影響した例を挙げた。入力変数として機械学習に供した４種以上の臨床データのうちのどの臨床データが骨折スコアの値の高さに強く影響するかは、第２軸（Ｘ軸）として選択された臨床データと、第３軸（Ｙ軸）として選択された臨床データと、の組み合わせをそれぞれ変更した複数の三次元グラフを見比べてみると、分かりやすい。つまり、前述したように本来は多次元グラフに描かれるはずである応答曲面の全体像に対して、第２軸（Ｘ軸）及び第３軸（Ｙ軸）の各々として選択された臨床データに応じて、作成される三次元グラフごとに、多次元の全体像の断片として生成される応答曲面の形状が異なり、生成される断片としての応答曲面と閾値表示９５との位置関係も異なる。例えば、図５（ａ）に示した三次元グラフ９０ａと比べて、図５（ｂ）に示す三次元グラフ９０ｂや、図６（ｃ）乃至図６（ｆ）に示す三次元グラフ９０ｃ乃至９０ｆでは、第２軸（Ｘ軸）及び第３軸（Ｙ軸）の各々として選択した臨床データの組み合わせが異なり、この組み合わせの違いに応じて、各々の応答曲線（９２ａ乃至９２ｆ）は形状が異なり且つ閾値表示９５との位置関係も異なっている。このため、担当医は、一人ひとり体質が異なる対象者に応じて、今後に早期予防・治療を図らない場合には対象者の骨折スコアが骨折リスク陽性の予測領域９９へ移行する可能性があり、且つ、今後に早期予防・治療を図る場合には対象者の骨折スコアが骨折リスク陰性の予測領域９７へと移行する可能性があることを、対象者に説明しやすい任意のグラフを選んで対象者への説明に使用可能である。例えば、図５（ｂ）に示す三次元グラフ９０ｂは、後述の試験例１－１に係る学習モデルに基づいて応答曲面法により作成された多数の三次元グラフのうちの１種であり、初診時（第１時点）に低ＢＭＤ且つ高身長であると、応答曲面９２ｂ上での骨折スコアの値が閾値表示９５よりも高い骨折リスク陽性の予測領域９９へと移行しやすいことが分かりやすいグラフになっている。例えば、担当医は、初診時（第１時点）でのＢＭＤ計測値データ及び身長データが三次元グラフ９０ｂの骨折リスク陽性の予測領域９９に含まれるか又はその近傍に含まれるような低ＢＭＤ且つ高身長の対象者に対して、三次元グラフ９０ｂを見せ、今後の経過観察期間内に新規骨折が発生することを避けるために、ＢＭＤ低下を抑えるビスホスホネート製剤を処方する等の早期予防・治療方針を提案すればよいと考えられる。

図１に示すステップＳ４１ａ及びＳ４２は、学習モデルを使用しないため、例えば学習モデルの生成前でも実施可能である。一方、対象者の骨折スコア出力ステップＳ４３ａは、骨折スコアを出力可能な学習モデルを準備（例えば生成）後に実施する。このため、学習モデルを準備（生成）後にステップＳ４１ａ、Ｓ４２及びＳ４３ａをまとめて実施するのが効率良く好ましい。対象者は、被験者らに含まれない者でもよく、又は、被験者らに含まれる者でもよい。例えば、仮に、図２に示す被験者Ｂと対象者Ｚとが同一人である場合、被験者として２０１４年１月（被験者の第１時点、４８歳）に臨床情報を取得され、２０２０年１月（被験者の第２時点、５４歳）に「経過観察期間内での新規骨折の有無」を医師に判定され、骨折スコアを出力可能な学習モデルが生成された後、同じ女性が今度は対象者として２０２２年６月（対象者の第１時点、５６歳）に臨床情報を取得され、その後の未来である２０２７年６月（対象者の第２時点、６１歳）までの経過観察期間内に新規骨折が生じるか否か予測する指標となる骨折スコアを出力されてもよい。被験者らに幅広い年代の閉経後女性を含めれば、被験者であった女性を対象者とする場合でも、比較的高精度の推測・予測結果を出力しやすい。

簡便に実施可能な観点では、図１に示す骨折スコア出力方法Ｓ１５ａや骨粗鬆症による骨折の推測・予測方法Ｓ１０ａにおけるステップＳ３１ａ、Ｓ３２、Ｓ３３ａ、Ｓ３４ａ及びＳ３５に代えて、図７に示すように、学習モデル生成方法（図１、Ｓ２０ａ）により予め生成された、骨折スコアを出力可能な学習モデルを準備するステップＳ２９ｂを含む、骨折スコア出力方法Ｓ１５ｂや骨粗鬆症による骨折の推測・予測方法Ｓ１０ｂが好ましい。

実施形態１に係る学習モデルは、図１に示す学習モデル生成方法Ｓ２０ａにより生成された、骨折スコアを出力可能な学習モデルである。既に説明したように、この学習モデルは、第１時点での既存骨折の有無、第１時点での既存骨折の骨折数、経過観察期間内での新規骨折の有無及び経過観察期間内での新規骨折の骨折数から選ばれた１種以上を判定された各被験者について、該各被験者の第１時点における臨床情報に含まれる４種以上の臨床データが図４に例示するＡＮＮ５０の入力層５２に入力され、出力層５８が各被験者の骨折スコア（潜在変数の因子得点）を出力するように、例えば前述した数式４で示した重み付け値Ｗ_ｉｊが機械学習されたものでもよい。この学習モデルは、入力層５２に対象者の第１時点の臨床情報（４種以上の臨床データ）が入力される場合、該臨床情報に対して例えば重み付け値Ｗ_ｉｊに基づく演算を行い、出力層５８から対象者の骨折スコアを出力するように、情報処理装置を機能させるためのものである。

図７に示す骨折スコア出力方法Ｓ１５ｂや骨粗鬆症による骨折の推測・予測方法Ｓ１０ｂを実施するユーザ（例えば、骨粗鬆症医療の担当医又は該担当医を補助する医療従事者等）は、図８に例示するように、骨折スコアを出力可能な学習モデル７２を有する情報処理装置６１ａを使用してもよい。該情報処理装置６１ａは、種々の情報処理や情報の送受信が可能な、例えばパーソナルコンピュータ又はサーバコンピュータ等である。情報処理装置６１ａは、例えば、制御部６２ａ、表示部６３ａ、入力部６４ａ及び記憶部７０ａを備えていてもよい。

制御部６２ａは、記憶部７０ａに記憶されたプログラム７１ａを読み出して実行することにより、情報処理装置６１ａに係る種々の演算処理、制御処理などを行うプロセッサであり、例えば少なくとも１つのＣＰＵ（Central Processing Unit）等を有する。記憶部７０ａは、各種データを記憶するメモリである。メモリには、ＲＡＭ（Random Access Memory）と不揮発性メモリとが含まれる。ＲＡＭは、制御部６２ａが演算処理を実行するために必要なデータを一時的に記憶する。不揮発性メモリは、例えばハードディスクドライブを含み、制御部６２ａが処理を実行するためのプログラム７１ａと、骨折スコアを出力可能な学習モデル７２とを記憶保持する。不揮発性メモリは、学習モデル７２を生成した機械学習で学習データセットとして用いられた、被験者らの骨折学習データベース７３を、更に記憶保持してもよい。表示部６３ａは、例えば液晶ディスプレイ又は有機ＥＬディスプレイ等の表示装置であり、制御部６２ａから与えられた画像を表示する。入力部６４ａは、例えばキーボード又はタッチパネル等の入力インターフェイスであり、ユーザからの操作入力を受け付ける。制御部６２ａは、ユーザにより入力部６４ａを介して情報処理装置６１ａに対象者の臨床情報が入力された場合、該臨床情報を学習モデル７２に適用し、対象者の骨折スコアを出力する処理を実行する演算部として機能する。出力された骨折スコアは、そのまま数値データとして表示部６３ａに表示されてもよい。ユーザに分かりやすい観点では、出力された骨折スコアとその閾値との比較結果に基づき、対象者についての、第１時点での既存骨折の有無を示す推測結果又は経過観察期間内での新規骨折の有無を示す予測結果が表示部６３ａに表示されるように、情報処理装置６１ａを機能させるのが好ましい。

情報処理装置６１ａは、さらに、第１の通信部６５ａを備えるのが好ましい。第１の通信部６５ａは、通信に関する処理を行うための処理回路等を含み、少なくとも１つのユーザ端末８１との間で例えばインターネット又は病院内イントラネット等の通信ネットワーク８０を介して情報の送受信を行う。第１の通信部６５ａには、この送受信のためのアンテナが含まれてもよい。ユーザ端末８１として例えば、骨粗鬆症医療の担当医が所持しているスマートフォン８２、この担当医が勤務病院で受診者（対象者）を診察する診察室に設けられたパーソナルコンピュータ８３、又は、この担当医を補助する医療従事者が所持しているノートＰＣ８４等が挙げられ、これらの例に限定されない。ユーザ端末８１には、情報処理装置６１ａとの間で通信ネットワーク８０を介してデータ送受信することにより、骨折スコアを出力可能な学習モデル７２を用いて、図７に示す骨粗鬆症による骨折の推測・予測方法Ｓ１０ｂの実施に適した、アプリケーションソフトウェアがインストールされているのが好ましい。例えば、対象者の骨折スコア出力ステップＳ４３ａで、ユーザが対象者について４種以上の臨床データを図８に示すユーザ端末８１に入力した場合、入力された４種以上の臨床データがユーザ端末８１から送信され、通信ネットワーク８０及び第１の通信部６５ａを介して情報処理装置６１ａで受信され、制御部６２ａは、受信した４種以上の臨床データを学習モデル７２に適用して対象者の骨折スコアを出力する処理を実行してもよい。出力された骨折スコアデータは、第１の通信部６５ａから送信され、通信ネットワーク８０を介してユーザ端末８１で受信されてもよい。該ユーザ端末８１で、不図示のプロセッサと前述したアプリケーションプログラムとにより、骨折スコアがその閾値と比較された結果、ユーザ端末８１のディスプレイに、骨折スコアに基づき対象者についての第１時点での既存骨折の有無若しくは既存骨折の骨折数を示す推測結果又は経過観察期間内での新規骨折の有無若しくは新規骨折の骨折数を示す予測結果が表示されるのが好ましい。このように、骨折スコアを出力可能な学習モデル７２を有する情報処理装置６１ａと、ユーザ端末８１と、を含む骨折推測・予測システム６０ａが、病院に設けられるのが好ましい。骨折推測・予測システム６０ａには、図示しないが、更に、例えば、対象者からの問診に対する回答（年齢等）データや血液検査結果等が入力される情報処理端末、身長計若しくは体重計等の身体計測機器、又は、ＢＭＤ計測装置等、対象者の第１時点における４種以上の臨床データ生成手段との間で、対象者の臨床データを送受信可能に構成されてもよい。

＜実施形態２＞
図９には、実施形態２に係る骨粗鬆症による骨折の推測・予測方法Ｓ１０ｃと、該方法Ｓ１０ｃに含まれ得る、学習データセット作成方法Ｓ３０ｃ、学習モデル生成方法Ｓ２０ｃ及び骨折スコア出力方法Ｓ１５ｃとを示す。これらの方法（Ｓ１０ｃ、Ｓ１５ｃ、Ｓ２０ｃ、Ｓ３０ｃ）の説明にあたり、図１を用いて説明した各方法（Ｓ１０ａ、Ｓ１５ａ、Ｓ２０ａ及びＳ３０ａ）と比べて、共通事項の説明を適宜省略し、異なる事項を主に説明する。図９に示す学習データセット作成方法Ｓ３０ｃでは、各被験者の他の臨床情報及びＢＭＤデータ取得ステップＳ２１と、各被験者の他の臨床情報正規化ステップＳ２２と、ＢＬＲ（骨量減少率）学習ステップＳ２４と、ＢＬＲ学習後選別ステップＳ２５とを含み得ることにより、ＢＬＲ（予測値）を出力可能な学習モデルを生成しやすく構成されている。学習データセット作成方法Ｓ３０ｃでは、さらに、各被験者の臨床情報及び判定結果取得ステップＳ３１ｃと、各被験者の臨床情報正規化ステップＳ３２と、各被験者の骨折スコア算出ステップＳ３３ａとを含み得る。

各被験者の他の臨床情報及びＢＭＤデータ取得ステップＳ２１では、ＢＬＲ（予測値）を出力可能な学習モデルの生成に適した学習データセットを作成するために、複数名の閉経後女性を被験者らとする。この被験者らに含まれる各被験者（他の各被験者）は、閉経後における任意の第１時点と、該第１時点から後の第２時点とで、各々、ＢＭＤを既に計測された女性である。このステップＳ２１での被験者らについて、その他の事項は、図１を用いて説明したステップＳ３１ａに関して前述した被験者らと同様である。

その上で、図９に示すステップＳ２１では、各被験者の他の臨床情報を取得する。該他の臨床情報には、各被験者について、第１時点での年齢、第１時点での身長、第１時点での体重、第１時点でのＢＭＩ、第１時点での体脂肪率、第１時点での除脂肪体重、第１時点での体脂肪量、初経年齢、閉経年齢、閉経時から第１時点までの年数、及び、これらのいずれかを間接的に示すデータから選ばれた１種以上の他の臨床データが含まれる。推測・予測精度向上の観点では、各被験者の他の臨床情報には、ここで挙げた他の臨床データの例のうち、例えば２種以上又は３種以上、好ましくは４種以上又は５種以上、更に好ましくは６種以上又は７種以上が含まれる。図１に示す各被験者の臨床情報及び判定結果取得ステップＳ３１ａに関して前述した各被験者の臨床情報と、図９に示すステップＳ２１で取得する各被験者の他の臨床情報とでは、含まれるデータ項目のうち少なくとも一部が重複してもよい。各被験者の他の臨床情報に含まれ得るデータ項目のうち、第１時点での年齢、第１時点での身長、第１時点での体重、第１時点でのＢＭＩ、初経年齢、閉経年齢、閉経時から第１時点までの経過年数、及び「間接的に示すデータ」については、図１に示すステップＳ３１ａに関して既に説明したとおりである。

第１時点での体脂肪率は、例えば、水中体重秤量法、空気置換法、皮下脂肪厚法（キャリバー法）、生体インピーダンス法又は前述したＤＸＡにより計測しデータ生成可能である。測定誤差を小さく抑える観点と、体脂肪率だけでなくＢＭＤも計測可能な観点とから、ＤＸＡにより生成された体脂肪率の計測値を取得するのが好ましい。または、体脂肪率を計測するコストを削減する観点では、次の数式５により算出された体脂肪率のデータを取得するのも好ましい（非特許文献４参照）。また、第１時点の体重と、第１時点の体脂肪率との数値データが明らかになれば、第１時点の除脂肪体重と、第１時点の体脂肪量とを算出可能である。このため、「第１時点の体重」と「第１時点の体脂肪率」との組み合わせは、「第１時点の除脂肪体重」と「第１時点の体脂肪量」との各々を間接的に示すデータに該当する。

図９に示すステップＳ２１では、各被験者について、第１時点のＢＭＤと、第２時点のＢＭＤと、もデータ取得する。ＢＭＤ計測方法や、ＢＭＤを計測する身体部位は、図１に示す各被験者の臨床情報及び判定結果取得ステップＳ３１ａに関して説明したとおりである。その上で、各被験者について、第１時点のＢＭＤと第２時点のＢＭＤとから、前述した数式１により「経過観察期間内のＢＬＲ」を算出しデータ取得する。

図９に示す、各被験者の他の臨床情報正規化ステップＳ２２では、図１を用いて説明したステップＳ３２と同様に、各被験者の他の臨床データを正規化する。第１時点のＢＭＤと、第２時点のＢＭＤとは、同様に正規化してもよいが、推測・予測精度向上の観点では、正規化しないでＢＭＤ計測値のままにしておくのが好ましい。

図９に示すＢＬＲ学習ステップＳ２４では、各被験者の他の臨床情報に含まれる１種以上の他の臨床データと、各被験者の第１時点のＢＭＤとをそれぞれ入力変数（独立変数）とし、各被験者の第２時点のＢＭＤと、各被験者の経過観察期間内のＢＬＲとを出力変数（従属変数）とし、入力変数と出力変数との関係をＡＮＮに機械学習させる。推測・予測精度向上の観点から、各被験者の他の臨床情報における例えば２種以上又は３種以上、好ましくは４種以上又は５種以上、更に好ましくは６種以上又は７種以上の他の臨床データを、入力変数に含めて機械学習させるのが望ましい。このような機械学習により、ＢＬＲ（予測値）を出力可能な学習モデルが生成される。ステップＳ２４について、その他の事項は、図１に示す骨折学習ステップＳ３４ａでの説明と同様である。

図９に示すＢＬＲ学習後選別ステップＳ２５では、先のステップＳ２４で複数の学習モデルを生成した場合、推測・予測精度向上のために、各学習モデルで精度の高さを検証し、推測・予測精度が高い学習モデルを選定してもよい。先のステップＳ２４で生成した学習モデルが１つのみの場合や、精度がある程度あれば充分な場合、ステップＳ２５を省略してもよい。ステップＳ２５について、その他の事項は、図１に示す骨折学習後選別ステップＳ３５での説明と同様である。

図９に示すステップＳ２１乃至Ｓ２５を経て、ＢＬＲ（予測値）を出力可能な学習モデルが生成される。この学習モデルでは、経過観察期間内のＢＬＲ（予測値）と共に、第２時点のＢＭＤ（予測値）も出力可能である。この学習モデルは、本願に係る発明者が以前に開発したものであり、詳細は特許文献１を参照する。

各被験者の臨床情報及び判定結果取得ステップＳ３１ｃでは、骨折スコアを出力可能な学習モデルの生成に適した学習データセットを作成するために、複数名の閉経後女性を被験者らとする。ここで選定される各被験者は、前述した骨折判定結果を既にデータ生成された閉経後女性である。このステップＳ３１ｃで選定される被験者らは、先のステップＳ２１で選定された被験者らと比べて、少なくとも一部の被験者が同一人でもよく、又は、同一人が一人もいなくてもよい（全ての被験者が別人でもよい）。

また、各被験者の臨床情報及び判定結果取得ステップＳ３１ｃでは、該ステップＳ３１ｃで選定した各被験者の第１時点における臨床情報と、各被験者での骨折判定結果とを取得する。ここで取得する各被験者の臨床情報には、図１を用いて説明したステップＳ３１ａと同様に４種以上の臨床データが含まれるが、この４種以上のうちに、前記ＢＭＤ予測値、前記ＢＬＲ予測値及びこれらのいずれかを間接的に示すデータからなる群より選ばれた１種以上の臨床データが含まれる。先のステップＳ２１で選定された被験者らと、ステップＳ３１ｃとで、選定された被験者らのうち少なくとも一部の被験者が同一人である（重複している）場合、先のステップＳ２１で取得した１種以上の他の臨床データと全く同じデータについては、ステップＳ３１ｃで４種以上の臨床データとして改めて取得することは特に要さない。全く同じデータである場合、１種以上の他の臨床データから４種以上の臨床データへ流用すればよい。その他の事項について、図９に示すステップＳ３１ｃは、図１を用いて説明したステップＳ３１ａと同様である。

図９に示す各被験者の臨床情報正規化ステップＳ３２は、図１を用いて説明したステップＳ３２と同様でよい。

図９に示す各被験者の骨折スコア算出ステップＳ３３ｃは、図１を用いて説明したステップＳ３３ａと比べて、次に説明する事項が異なる。図９に示す各被験者の骨折スコア算出ステップＳ３３ｃでは、５種以上の観測変数のうちの１種として各被験者の骨折判定結果を選定し、残る４種以上の観測変数のうちには、前記ＢＭＤ予測値、前記ＢＬＲ予測値及びこれらのいずれかを間接的に示すデータからなる群より選ばれた１種以上の臨床データが少なくとも含まれる。その他は、図１を用いて説明したステップＳ３３ａと同様に共分散構造分析を行い、各被験者の骨折判定結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータを算出し、該データを各被験者の骨折スコアとして扱う。５種以上の観測変数に、前記ＢＭＤ予測値を含めるが、前記ＢＬＲ予測値を含めない場合、予測精度向上の観点から、５種以上の観測変数に「経過観察期間の長さ」も含めるのが好ましい。以上に説明した学習データセット作成方法Ｓ３０ｃでは、骨折スコアを出力可能な学習モデルの生成に適した学習データセットを作成しやすい。

学習モデル生成方法Ｓ２０ｃでは、上記した学習データセット作成方法Ｓ３０ｃの後、さらに、骨折学習ステップＳ３４ｃと、骨折学習後選別ステップＳ３５とを含み得る。図１を用いて説明したステップＳ３４ａと比べて、図９に示す骨折学習ステップＳ３４ｃでは、次に説明する事項が異なる。図９に示す骨折学習ステップＳ３４ｃでは、入力変数とする各被験者の４種以上の臨床データのうちに、前記ＢＭＤ予測値、前記ＢＬＲ予測値及びこれらのいずれかを間接的に示すデータからなる群より選ばれた１種以上の臨床データを少なくとも含まれる。また、出力変数として、先のステップＳ３３ｃで算出された骨折スコア（潜在変数の因子得点）を入力し、入力変数と出力変数との関係をＡＮＮに機械学習させ、骨折スコアを出力可能な学習モデルを１つ以上生成する。入力変数として各被験者について、前記ＢＭＤ予測値を含めるが、前記ＢＬＲ予測値を含めない場合、推測・予測精度向上の観点から、入力変数のデータ項目の１種として、各被験者の「経過観察期間の長さ」も含めるのが好ましい。

図９に示す骨折学習後選別ステップＳ３５は、図１を用いて説明したステップＳ３５と同様でよい。

図９に示す学習モデル生成方法Ｓ２０ｃでは、図１を用いて説明した学習モデル生成方法Ｓ２０ａと比べて、共分散構造分析での５種以上の観測変数と機械学習での４種以上の入力変数との各々に、前記ＢＭＤ予測値、前記ＢＬＲ予測値及びこれらのいずれかを間接的に示すデータからなる群より選ばれた１種以上の臨床データが含まれており、骨折の予測精度が更に高まりやすい。このため、図９に示すステップＳ２１乃至Ｓ２５、Ｓ３１ｃ、Ｓ３２及びＳ３３ｃの組み合わせは、骨折スコアを出力可能な学習モデル生成に更に適した学習データセット作成方法Ｓ３０ｃとして機能させやすい。

骨折スコア出力方法Ｓ１５ｃは、図１を用いて説明した骨折スコア出力方法Ｓ１５ａと概ね同様に構成されているが、次に説明する事項が異なる。図９に示す骨折スコア出力方法Ｓ１５ｃでは、ＢＬＲ（予測値）を出力可能な学習モデルと、骨折スコアを出力可能な学習モデルとを併用する。骨折スコア出力方法Ｓ１５ｃは、前述したステップＳ２１乃至Ｓ２５、Ｓ３１ｃ、Ｓ３２、Ｓ３３ｃ、Ｓ３４ｃ及びＳ３５を含み得る方法であり、さらに、対象者の臨床情報取得ステップＳ４１ｃと、対象者の臨床情報正規化ステップＳ４２と、対象者の骨折スコア出力ステップＳ４３ｃとを含み得る。

対象者の臨床情報取得ステップＳ４１ｃは、図１を用いて説明したステップＳ４１ａと概ね同様であるが、次に説明する事項が異なる。図９に示す対象者の臨床情報取得ステップＳ４１ｃでは、前述した対象者の第１時点における臨床情報に含まれる４種以上の臨床データを取得する際、前記ＢＭＤ予測値及び前記ＢＬＲ予測値の少なくとも一方を含めてデータ取得する。これら予測値データは、対象者の第１時点のＢＭＤと、対象者の第１時点における他の臨床情報とを、ＢＬＲ（予測値）を出力可能な学習モデル（例えば特許文献１に記載された学習モデル）に入力すると出力され得る。この入力のために、対象者の臨床情報取得ステップＳ４１ｃでは、対象者の第１時点のＢＭＤと、対象者の他の臨床情報（第１時点での年齢、第１時点での身長、第１時点での体重、第１時点でのＢＭＩ、初経年齢、閉経年齢、閉経時から第１時点までの経過年数、第１時点での体脂肪率、第１時点での除脂肪体重、第１時点での体脂肪量及びこれらのいずれかを間接的に示すデータからなる群より選ばれた１種以上の他の臨床データ）と、を取得してもよい。なお、対象者の臨床情報に含まれる４種以上の臨床データと、対象者の他の臨床情報に含まれる１種以上の他の臨床データとの間で、重複するデータ項目がある場合、重複するデータは互いに流用してもよい。両者の間で重複する可能性があるデータ項目は、第１時点での年齢、第１時点での身長、第１時点でのＢＭＩ、初経年齢、閉経年齢、閉経時から第１時点までの経過年数、又はこれらのいずれかを間接的に示すデータである。

図９に示す対象者の臨床情報正規化ステップＳ４２は、図１を用いて説明したステップＳ４２と同様である。

図９に示す対象者の骨折スコア出力ステップＳ４３ｃは、図１を用いて説明したステップＳ４３ａと概ね同様であるが、次に説明する事項が異なる。図９に示すステップＳ４３ｃでは、骨折スコアを出力可能な学習モデルに、対象者の第１時点における臨床情報に含まれる４種以上の臨床データを適用する際、少なくとも、前記ＢＭＤ予測値、前記ＢＬＲ予測値及びこれらのいずれかの正規化後データからなる群より選ばれた１種以上の臨床データを適用（学習モデルの入力層に入力）する。

以上に説明した骨折スコア出力方法Ｓ１５ｃでは、骨折スコアを出力可能な学習モデルに適用する対象者の臨床情報に、前記ＢＭＤ予測値、前記ＢＬＲ予測値及びこれらのいずれかの正規化後データから選ばれた１種以上の臨床データが含まれており、経過期間内で新規骨折の有無又は経過観察期間内での新規骨折の骨折数に関する予測結果について高精度な指標となる骨折スコアが出力されやすい。骨粗鬆症による骨折の推測・予測方法Ｓ１０ｃでは、骨折スコア出力方法Ｓ１５ｃに加えて、さらに、図１を用いて説明した結果出力ステップＳ４５と同様にしてステップＳ４５を実施してもよい。

簡便に実施可能な観点では、図９に示す骨折スコア出力方法Ｓ１５ｃや骨粗鬆症による骨折の推測・予測方法Ｓ１０ｃにおけるステップＳ２１乃至Ｓ２５、Ｓ３１ｃ、Ｓ３２、Ｓ３３ｃ、Ｓ３４ｃ及びＳ３５に代えて、図７に示すように、学習モデル生成方法（図９、Ｓ２０ｃ）により予め生成された、骨折スコアを出力可能な学習モデルを準備するステップＳ２９ｄを含む、骨折スコア出力方法Ｓ１５ｄや骨粗鬆症による骨折の推測・予測方法Ｓ１０ｄが好ましい。このステップＳ２９ｄでは、予め生成された、ＢＬＲ（予測値）を出力可能な学習モデルも準備するのが好ましい。

実施形態２に係る骨折スコアを出力可能な学習モデルは、前述した実施形態１に係る学習モデルと概ね同様に構成されているが、以下に説明する事項が異なる。実施形態２に係る学習モデルは、その機械学習の際に図４に例示する入力層５２に入力される各被験者の臨床情報に含まれる４種以上の臨床データのうちに、前記ＢＭＤ予測値、前記ＢＬＲ予測値及びこれらのいずれかを間接的に示すデータからなる群より選ばれた１種以上の臨床データが少なくとも含まれる。また、対象者の骨折スコアを出力する際、入力層５２に入力される対象者の臨床情報における４種以上の臨床データのうちに、前記ＢＭＤ予測値、前記ＢＬＲ予測値及びこれらのいずれかの正規化後データからなる群より選ばれた１種以上の臨床データが含まれる。ここで述べた予測値のデータは、例えばＢＬＲ（予測値）を出力可能な学習モデルにより、出力し取得可能なデータである。

図７に示す骨折スコア出力方法Ｓ１５ｄや骨粗鬆症による骨折の推測・予測方法Ｓ１０ｄを実施するユーザは、図１０に例示する、骨折スコアを出力可能な学習モデル７２を有する情報処理装置６１ａと、ＢＬＲ（予測値）を出力可能な学習モデル７７を有する情報処理装置６１ｃと、少なくとも１つのユーザ端末８１と、を備える骨折推測・予測システム６０ｃを使用してもよい。情報処理装置６１ａとユーザ端末８１とは、図８を用いて既に説明したように構成されてもよい。

図１０に示す情報処理装置６１ｃは、制御部６２ｃ、表示部６３ｃ、入力部６４ｃ及び記憶部７０ｃを備えてもよく、これらの構成はこの順で、前述した情報処理装置６１ａの制御部６２ａ、表示部６３ａ、入力部６４ａ及び記憶部７０ａと概ね同様に構成されていてもよい。記憶部７０ｃには、プログラム７１ｃと、ＢＬＲ（予測値）を出力可能な学習モデル７７とが記憶されている。記憶部７０ｃに、さらに、ＢＬＲ（予測値）を出力可能な学習モデル７７の機械学習に用いた、被験者らのＢＬＲ学習データベース７８が記憶されていてもよい。情報処理装置６１ｃには、情報処理装置６１ａにおける第２の通信部６６ａとの間で他の通信ネットワーク８５を介してデータ送受信可能なように、通信部６６ｃが備えられてもよい。通信部６６ｃは、第２の通信部６６ａと同様に構成されてもよい。他の通信ネットワーク８５は例えば、病院内イントラネットでもよい。

上記した骨折推測・予測システム６０ｃを使用するユーザは、例えば、ユーザ端末８１に、対象者の臨床情報に含まれる４種以上の臨床データと、対象者の第１時点のＢＭＤと、対象者の他の臨床情報に含まれる１種以上の他の臨床データとを入力してもよい。入力された臨床情報、第１時点のＢＭＤ及び他の臨床情報は、ユーザ端末８１の通信部から送信され、通信ネットワーク８０を介して情報処理装置６１ａの第１の通信部６５ａで受信されてもよい。受信された対象者の臨床情報、第１時点のＢＭＤ及び他の臨床情報のうち、第１時点のＢＭＤ及び他の臨床情報は、第２の通信部６６ａから送信され、他の通信ネットワーク８５を介して情報処理装置６１ｃの通信部６６ｃで受信され、ＢＬＲ（予測値）を出力可能な学習モデル７７に入力されることにより、対象者について、前記ＢＭＤ予測値、前記ＢＬＲ予測値及びこれらのいずれかの正規化後データからなる群より選ばれた１種以上のデータが出力されるように、２つの情報処理装置（６１ａ及び６１ｃ）を機能させてもよい。ＢＬＲ（予測値）を出力可能な学習モデルにより出力された予測値又はその正規化後データは、情報処理装置６１ｃの通信部６６ｃから送信され、他の通信ネットワーク８５を介して情報処理装置６１ａの第２の通信部６６ａで受信された後、対象者の臨床情報に含まれる４種以上の臨床データの一部として、骨折スコアを出力可能な学習モデル７２に入力され、対象者の骨折スコアが出力されるように２つの情報処理装置（６１ａ及び６１ｃ）を機能させてもよい。出力された骨折スコアは、情報処理装置６１ａの第１の通信部６５ａから送信され、通信ネットワーク８０を介してユーザ端末８１で受信されるように機能させてもよい。ユーザ端末８１で受信した対象者の骨折スコアと、骨折スコアの閾値との比較結果に基づき、対象者の第１時点での既存骨折の有無を示す推測結果又は経過観察期間内での新規骨折の有無を示す予測結果を出力する処理を実行するように、ユーザ端末８１を機能させてもよい。骨折スコアの閾値や、参考資料として前述の三次元グラフ（図５及び図６、９０ａ乃至９０ｆ）が、ユーザ端末８１の記憶部に予め記憶されていてもよく又は情報処理装置６１ａからユーザ欄末８１へデータ送信されてもよい。

図示しないが、骨折スコアを出力可能な学習モデルを有する情報処理装置と、ＢＬＲ（予測値）を出力可能な学習モデルを有する情報処理装置とは、同じ一つの情報処理装置でもよい。例えば、骨折スコアを出力可能な学習モデルと、ＢＬＲ（予測値）を出力可能な学習モデルとは、同じ１つの情報処理装置の記憶部に記憶され、この情報処理装置に対象者の臨床情報、第１時点のＢＭＤ及び他の臨床情報が入力される場合、２つの学習モデルが連動して対象者の骨折スコアを出力するように構成されていてもよい。

本願に係る発明者は、本発明を完成させる過程で、骨粗鬆症による骨折の推測・予測について次のように考えた。従来、骨粗鬆症による骨折について、未来の新規骨折の予測が困難で、且つ、レントゲン撮影等による骨の画像なしでは既存骨折の推測が困難である理由としては、骨粗鬆症による骨折との間で高い相関関係を有する指標が、発見されていないことが考えられる。そのような指標が、閉経後女性ごとに個人差ある体質（遺伝的素因、環境要因）に潜在しているのか又は実在していないのか、明らかでない。この考えに基づき、本願に係る発明者は、共分散構造分析に着目した。従来、共分散構造分析は、社会学、心理学又はマーケティング等の分野で、幾つかの未知の因子が含まれる複雑な問題の分析に活用されていた（例えば特許文献３参照）が、臨床医学分野で合併症発生と体質との因果関係を説明するために有効活用された前例は、ほとんどなかった。臨床医学では、複数の臨床的指標の間に複雑な関連性が存在する場合があり、骨粗鬆症による骨折の推測・予測に共分散構造分析を活用できる可能性があると考えた。そこで、閉経後女性の体質に「骨粗鬆症による骨折の発生に対して直接的に有意な因果関係を有する未知の指標」が潜在しているものと仮想し（そのような指標が実在していなくてもよい）、ここで「骨粗鬆症による骨折の発生」を「骨折判定結果」に置き換え且つ「未知の指標」を「潜在変数」に置き換えて、共分散構造分析により「骨折判定結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数」の因子得点を算出することを考えた。その上で、算出された潜在変数の因子得点（各被験者の骨折スコア）を含む学習データセットにより、ＡＮＮに機械学習させ、骨折スコアを出力可能な学習モデルを生成し、該学習モデルに対象者の骨折スコアを出力させることを考え、本発明を完成させるに至った。

なお、本発明とは異なり、共分散構造分析は行うが機械学習を行わない場合、新規な対象者について骨折スコアを出力できない欠点がある。また、骨粗鬆症により骨折を生じる様々な要因が詳細には解明されていない現状で、前述した「未知の指標」が具体的には何であるか不明であり、この未知の指標に該当するデータ（つまり、骨折スコアに該当するデータ）を各被験者で実測するのは不可能と考えられる。このため、本発明とは異なり、共分散構造分析で算出される潜在変数の因子得点（各被験者の骨折スコア）を学習データセットに含めることなく機械学習を行う場合、各被験者で実測可能なデータ及び骨折判定結果のみを学習データセットとして、機械学習を行うことになる。しかし、骨折の有無に関する骨折判定結果そのものは、例えば「骨折あり」の場合は１．０、「骨折なし」の場合は０というように、不連続なデータである。骨折数に関する骨折判定結果そのものも、０以上の整数に限られ、不連続なデータである。そのように不連続なデータを出力変数とする機械学習で生成される学習モデルでは、骨折判定結果との間で高い相関関係を有するスコアを出力不可能という欠点がある。つまり、本発明では、共分散構造分析と機械学習との組み合わせにより、両者それぞれの欠点を互いに補完させ、新規な対象者の骨折スコアを学習モデルにより出力可能なのである。

＜合併症のリスク因子推定方法＞
前述した図５（ａ）、図５（ｂ）、及び、図６（ｃ）乃至図６（ｆ）では、第１軸（Ｚ軸）で骨折スコアの値を示す三次元グラフにおいて、応答曲面法により生成される応答曲面（９２ａ乃至９２ｆ）に骨折スコアの値が閾値表示９５（カットオフ値）よりも高値となる骨折リスク陽性の予測領域９９が形成される場合に、その三次元グラフの第２軸（Ｘ軸）に示される臨床データと第３軸（Ｚ軸）に示される臨床データとの組み合わせが、骨粗鬆症という病気の合併症の一種である骨折を発生させるリスク因子の組み合わせと推定され得ることを説明した。また、後述するように、それぞれ、試験例２２では骨粗鬆症による新規骨折を発生させるリスク因子の組み合わせを推定でき、試験例２３では骨粗鬆症による既存骨折数１を発生させるリスク因子の組み合わせを推定でき、試験例２４では川崎病（ＫＤ）の合併症の１種である冠動脈拡大病変（ＣＡＬ）を発生させるリスク因子の組み合わせを推定でき、試験例２５ではＩｇＡ血管炎（ＩｇＡＶ）の合併症の１種である紫斑病性腎炎（ＰＮ）で高度蛋白尿を伴う症例を発生させるリスク因子の組み合わせを推定できた。これらの合併症はいずれも、発生の正確な作用機序が未だ不明で、従来は発生の推測・予測が難しかったにも関わらず、後述の試験例２２乃至試験例２５で合併症発生のリスク因子を推定可能であったことを考慮すると、試験例２２乃至試験例２５の手法は、多種多様な病気の様々な合併症に関して、合併症発生のリスク因子を探索可能又は推定可能な汎用性を有していると考えられる。このため、一実施形態に係る合併症のリスク因子推定方法において、リスク因子を探索又は推定しようとする合併症と、この合併症を誘発させる場合がある病気との組み合わせは、特に限定されないが、例えば次の例が挙げられる。

上記した病気の例は、特に限定されないが、例えば、代謝疾患又は血管炎でもよく、骨代謝疾患又は血管炎でもよく、好ましくは、骨粗鬆症、川崎病又はＩｇＡ血管炎が挙げられる。一般的に骨粗鬆症で誘発され得る合併症としては、例えば、骨折、神経麻痺、歩行障害、逆流性食道炎、直腸膀胱障害又は廃用症候群等の後遺症が挙げられる。特に、骨粗鬆症の合併症としての廃用症候群は、筋肉の衰え、関節拘縮、心機能低下、起立性低血圧、血栓症、２次膀胱炎、鬱又はせん妄等を伴う場合があり、廃用症候群を発生させるリスク因子を探索し推定することは社会的意義が大きい。また、骨粗鬆症が、骨を形成するコラーゲンの遺伝子異常を伴う遺伝性骨粗鬆症である場合に、その合併症としては、緑内障、脳動脈瘤又は大動脈解離等の後遺症が挙げられる。川崎病の合併症としては、冠動脈拡大病変（ＣＡＬ）、冠動脈瘤（ＣＡＡ）、心筋炎、不整脈、心原性ショック、肝障害、腎障害又は脳症等の後遺症が挙げられる。なお、ＣＡＬは冠動脈径計測値がＺスコアで例えば２．０ＳＤ以上、２．５ＳＤ以上又は３．０ＳＤ以上となった病態で、ＣＡＡは冠動脈径計測値がＺスコアで５．０ＳＤ以上又は１０ＳＤ以上となった病態であり得る。ＣＡＬには、心筋炎が先行して発生する症例もある。ＩｇＡ血管炎で誘発され得る合併症としては、例えば、紫斑病性腎炎（ＰＮ）、ＰＮで且つ高度蛋白尿を伴う症例、ネフローゼ又は腎不全等の後遺症が挙げられる。

合併症のリスク因子を推定するには、病気に関する各受診者（各被験者）の臨床情報及び合併症発生スコア（潜在変数の因子得点）を含む学習データセットを作成し、該学習データセットにより、各受診者の臨床情報と各受診者の合併症発生スコア（潜在変数の因子得点）との関係をＡＮＮに機械学習させて、合併症発生スコアを出力可能な学習モデルを生成させる。このためには、各受診者（各被験者）としては、病気に関して診察された第１診察時点（第１時点）では合併症が発生していないことを診断され、且つ、第１診察時点（第１時点）を過ぎてから後の第２診察時点（第２時点）までの経過観察期間内での合併症の発生の有無を判定する診断をされた者を選定する。第１診察時点での各受診者は、病気に関して医療機関で受診し、第１時点でその病気に罹患していると診断された者でもよく又は第１時点で罹患していないと診断された者でもよい。第１診察時点は、例えば、各被験者が病気に関して入院後に一次（初回）治療を受けていない時点でもよく、その後に一次（初回）治療を受けている途中の時点も含まれてもよい。第１診察時点を過ぎてから第２診断時点までの経過期間の長さは、特に限定されず、リスク因子を探索又は推定しようとする合併症と、その合併症を誘発する場合がある病気との組み合わせに応じて、その病気で一般的に第１診察時点を過ぎてから合併症発生に至るまでにかかると考えられる期間よりも幾らか長い期間に設定すればよい。各受診者についてその他の事項は、前述の学習データセット作成方法（Ｓ３０ａ、Ｓ３０ｃ）に関して説明した各被験者と同様でよい。

合併症のリスク因子推定に関して、学習データセットを作成するための各受診者（各被験者）の臨床情報は、第１診察時点における各受診者に基づいて生成し取得可能な４種以上の臨床データを含む。ここでの４種以上の臨床データの各々は、リスク因子と推定されるか否かを探索し確認しようとする候補となる臨床データともいえる。例えば、合併症のリスク因子推定方法の実施者が、第１診察時点での各受診者に基づいて生成し取得可能な様々な臨床データのうちから「リスク因子と推定されるか否か探索する候補にしたい」と考える任意の臨床データを、４種以上選定して取得すればよい。様々な医療機関でリスク因子の推定方法を実施しやすい観点では、二次医療機（入院治療が可能な一般的な病院）の日常診療の現場で、一般的に取得されている様々な臨床データのうちから、４種以上の臨床データをリスク因子の候補として選定するのが好ましい。同様の観点から、４種以上の臨床データは、第１診察時点での各受診者に基づいて、身体計測、問診、体液（血液又は尿等）検査、及び、リスク因子を推定しようとする合併症やその原因となり得る病気の診断で一般的に使用される機器での測定、から選ばれた１種以上により得られるデータであるのが好ましい。

病気が川崎病である場合に、各受診者の４種以上の臨床データは、例えば、性別、第１診察時点での月齢、第１診察時点での冠動脈径、第１診察時点での全身性血管炎マーカー検査値、第１診察時点での高サイトカイン血症マーカー検査値、第１診察時点での静注用免疫グロブリン（ＩＶＩＧ）不応予測スコア得点、一次治療で抗炎症療法を受けた回数、及びこれらを間接的に示すデータから選ばれた４種以上の臨床データであることが好ましい。冠動脈径は、左冠動脈主幹部、左冠動脈前下行枝近位部、左冠動脈回旋枝及び右冠動脈近位部から選ばれた１種以上の部位における冠動脈直径の最大値であることが好ましく、実測値をＬＭＳ法により変換したＺスコアであることも好ましい。全身性血管炎マーカー検査値として例えば、赤血球沈降速度、血清補体価、又は、血中若しくは血清中の、ペントラキシンスーパーファミリー濃度、免疫複合体濃度、プロカルシトニン濃度、フィブリン分解産物濃度、及びこれらのいずれかに代用可能なマーカー検査値が挙げられる。ペントラキシンスーパーファミリーとして例えば、ペントラキシン－３、アミロイドＰ又はＣ反応性蛋白（ＣＲＰ）等が挙げられる。高サイトカイン血症マーカー検査値としては、例えば、血中若しくは血清中の、ＴＮＦ－α、インターフェロン、ＩＬ－１β、ＭＣＰ－１若しくはＩＬ－６等の抗炎症性サイトカイン濃度検査値、又は、尿中β２マイクログロブリン濃度等が挙げられ、簡便な観点では尿中におけるβ２マイクログロブリンのクレアチニンに対する濃度比（尿中β２ＭＧ／Ｃｒ）であるのが好ましい。ＩＶＩＧ不応予測スコア得点としては、例えば、小林スコア、江上スコア又は佐野スコアの得点が挙げられる。一次治療で抗炎症療法を受けた回数としては、例えば、アスピリン（登録商標）投与、ＩＶＩＧ投与、静注用メチルプレドニゾロンパルス（ＩＶＭＰ）投与、プレドニゾロン（ＰＳＬ）投与、インフリキシマブ投与、ウリナスタチン投与、シクロスポリンＡ（ＣｓＡ）投与及び血症交換から選ばれた１種以上の処置を受けた回数が挙げられる（詳細は特許文献２参照）。

病気がＩｇＡ血管炎である場合に、各受診者の４種以上の臨床データは、第１診察時点での月齢、第１診察時点での全身性血管炎マーカー検査値、第１診察時点での腹痛の有無、第１診察時点での即時性アレルギー疾患の有無、第１診察時点での血中ＩｇＡ検査値、第１診察時点での血中ＩｇＥ検査値、初回治療で抗炎症療法を受けた回数、及びこれらを間接的に示すデータから選ばれた４種以上の臨床データであることが好ましい。ここでの全身性血管炎マーカー検査値は、川崎病での４種以上の臨床データの説明で述べた全身性血管炎マーカー検査値でもよいが、血中におけるフィブリン分解産物であるＤダイマー（血中ＦＤＰ・Ｄダイマー）濃度検査値であるのが好ましい。即時型アレルギー疾患として例えば、アナフィラキシーショック、アレルギー性鼻炎、結膜炎、気管支喘息、蕁麻疹又はアトピー性皮膚炎等が挙げられる。初回治療で抗炎症両方を受けた回数としては、例えば、ＰＳＬ投与、ＩＶＭＰ投与、シクロホスファミド投与、アザチオプリン投与、ミコフェノール酸モフェチル投与、ＣｓＡ投与及び血漿交換から選ばれた１種以上の処置を受けた回数が挙げられる（詳細は特許文献２参照）。

学習データセットに含まれる各受診者の合併症発生スコアは、各受診者での経過観察期間内での合併症の発生の有無に関する判定の結果と、各受診者の４種以上の臨床データと、を含む合計５種以上の観測変数を設けて共分散構造分析を行い、判定の結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータである。その他、前述の学習データセット作成方法（Ｓ３０ａ、Ｓ３０ｃ）や、学習モデル生成方法（Ｓ２０ａ、Ｓ２０ｃ）と同様にして、共分散構造分析及び機械学習を行い、合併症発生スコアを出力可能な学習モデルを生成可能であり、好ましい事項も前述の方法（Ｓ２０ａ、Ｓ２０ｃ、Ｓ３０ａ、Ｓ３０ｃ）と同様である。共分散構造分析の演算を行う際、パスモデルが収束しにくい場合には、観測変数とする４種以上の臨床データの組み合わせを、適宜、他の４種以上の臨床データの組み合わせに変更し、パスモデルについてベイズ法による標準化総合効果の平均値が０．３以上又は０．４以上となり、好ましくは０．５以上のなるべく高値となり、且つ、この平均値のｐ値が例えばｐ＜０．０５となる組み合わせ、好ましくはｐ＜０．０１となる組み合わせを探せばパスモデルを収束可能である。例えばＡＭＯＳ等、共分散構造分析を実施可能な市販の統計ソフトウェアには、ベイズ法による検定機能が実装されているものがある。また、リスク因子を推定しようと試みる病気の合併症に関する学術論文（いわゆるエビデンス）を幾つか読むと、その合併症を発生させる可能性が高いと考えられるリスク因子の候補に適した４種以上の臨床データの組み合わせを比較的見出しやすく、そのような４種以上の臨床データの組み合わせを観測変数として共分散構造分析を行えば、パスモデルが比較的収束しやすい。合併症発生スコアのカットオフ値は、後述の試験例１－１で説明するＲＯＣ解析により算出可能である。

また、前述の図５（ａ）、図５（ｂ）、及び、図６（ｃ）乃至図６（ｆ）について説明した手法と同様にして、合併症発生スコアを出力可能な学習モデルに基づいて、応答曲面法により、受診者らの臨床情報と受診者らの合併症発生スコアとの関係を示す応答曲面を生成し、生成される応答曲面に合併症発生リスク陽性領域が含まれる場合には、推定されるリスク因子を特定する処理を情報処理装置に実行させることで、合併症の発生について推定されるリスク因子の組み合わせを探索可能である。生成された応答曲面と、合併症発生スコアのカットオフ値を示す閾値表示と、受診者らの合併症発生スコアの値を示す第１軸と、４種以上の臨床データから選択された１種の臨床データの値を示す第２軸と、４種以上の臨床データから選択された他の１種の臨床データの値を示す第３軸とを含む三次元グラフを情報処理装置に作成させることができる。該三次元グラフに含まれる応答曲面において、合併症発生スコアがカットオフ値よりも高値である合併症発生リスク陽性の予測領域が形成されている場合には、その場合の三次元グラフにおいて、第２軸が示す選択された１種の臨床データと、第３軸が示す選択された他の１種の臨床データとの組み合わせは、合併症発生のリスク因子として推定される組み合わせである。推定されたリスク因子の組み合わせは、新規受診者の体質に合わせて、新規受診者で今後の合併症発生を避けるテーラーメイド医療の方針決定に活用可能である。三次元グラフは、新規受診者に対して、今後の合併症発生を避けるための早期予防・治療方針の説明資料として活用可能である。

合併症発生のリスク因子として推定される有用な臨床データの組み合わせを探索する観点から、本来は５次元以上のグラフに描かれるはずの応答曲面の全体像に対して、第２軸及び第３軸の各々で選択される１種の臨床データの組み合わせを変更した三次元グラフを、多数作成するのが好ましい。作成した三次元グラフごとに、グラフ中において、応答曲面とカットオフ値との位置関係や、応答曲面における合併症発生スコア最大値の高さは、異なっている。多数作成した三次元グラフのうちから、応答曲面における合併症発生スコア最大値が大きいものから順に順位付けし、順位が高い三次元グラフほど、その三次元グラフの第２軸及び第３軸の各々で示す選択された臨床データの組み合わせは、合併症発生のリスク因子として有用と推定される組み合わせとなる。このため、合併症発生スコアを出力可能な学習モデルに基づいて、リスク因子として有用と推定される臨床データの組み合わせを順位付けする処理を情報処理装置に実行させることが、好ましい。

本明細書により開示されるものには、以下のものが含まれる。
（１）
閉経後である第１時点での骨粗鬆症による既存骨折の有無、前記第１時点での前記既存骨折の骨折数、前記第１時点を過ぎてから後の第２時点までの経過期間内での骨粗鬆症による新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた１種以上に関する骨折スコアを出力する方法であって、
前記骨折スコアを出力可能な学習モデルに対象者の前記第１時点での臨床情報を入力して前記対象者の前記骨折スコアを出力する処理を情報処理装置に実行させるステップを含み、
前記骨折スコアを出力可能な学習モデルは、前記第１時点での前記既存骨折の有無、前記第１時点での前記既存骨折の骨折数、前記経過期間内での前記新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた１種以上を判定された各被験者の前記第１時点での前記臨床情報を入力されると、前記各被験者の前記骨折スコアを出力するように機械学習したものであり、
前記第１時点での前記臨床情報は、年齢、身長、体重、ＢＭＩ、骨密度、骨代謝マーカー検査値、腎機能マーカー検査値、骨格筋量マーカー検査値、既存の身長低下、初経年齢、閉経年齢、閉経時から前記第１時点までの年数、前記経過期間の長さ、ＦＲＡＸ（登録商標）による骨折リスク評価結果、前記第２時点の骨密度予測値、前記経過期間内の骨量減少率予測値、及び、これらのいずれかを間接的に示すデータからなる群より選ばれる４種以上の臨床データを含み、
前記各被験者の前記骨折スコアは、前記判定の結果と、前記各被験者の前記４種以上の臨床データと、を含む５種以上の観測変数が設けられ共分散構造分析が行われる場合に、前記判定の結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータである、骨折スコア出力方法。
（２）
前記骨量減少率予測値は、骨量減少率を出力可能な学習モデルに前記第１時点での骨密度と前記第１時点での他の臨床情報とを入力して前記骨量減少率予測値を出力する処理を情報処理装置に実行させて出力される臨床データであり、
前記骨量減少率を出力可能な学習モデルは、前記第１時点と前記第２時点とで骨密度を計測された各被験者についての、前記第１時点での骨密度と、前記第１時点での前記他の臨床情報とを入力されると、前記第２時点での骨密度と、前記経過期間内での骨量減少率とを出力するように機械学習したものであり、
前記第１時点での前記他の臨床情報は、年齢、身長、体重、ＢＭＩ、体脂肪率、除脂肪体重、体脂肪量、初経年齢、閉経年齢、閉経時から前記第１時点までの年数、及び、これらのいずれかを間接的に示すデータから選ばれた１種以上の他の臨床データを含む、前記（１）に記載された骨折スコア出力方法。
（３）
前記骨密度は、上腕骨近位部、橈骨遠位部、頚椎、胸椎、腰椎及び大腿骨近位部から選ばれた１箇所以上の身体部位における少なくとも一部の領域についてのものである、前記（１）に記載された骨折スコア出力方法。
（４）
前記（１）乃至（３）のいずれかに記載された骨折スコア出力方法により前記対象者の前記骨折スコアを出力し、出力された前記対象者の前記骨折スコアと前記骨折スコアの閾値との比較結果に基づいて、前記対象者についての、前記第１時点での前記既存骨折の有無の推測結果、前記第１時点での前記既存骨折の骨折数の推測結果、前記経過期間内での前記新規骨折の有無の予測結果、及び、前記経過期間内での前記新規骨折の骨折数の予測結果から選ばれた１種以上に関する結果データを出力する処理を情報処理装置に実行させる、骨粗鬆症による骨折の推測及び予測の少なくとも一方の方法。
（５）
閉経後である第１時点での骨粗鬆症による既存骨折の有無、前記第１時点での前記既存骨折の骨折数、前記第１時点を過ぎてから後の第２時点までの経過期間内での骨粗鬆症による新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた１種以上を判定された各被験者の前記第１時点での臨床情報が入力されると前記各被験者の骨折スコアを出力する学習モデルを、機械学習により生成するステップを含み、
前記第１時点での前記臨床情報は、年齢、身長、体重、ＢＭＩ、骨密度、骨代謝マーカー検査値、腎機能マーカー検査値、骨格筋量マーカー検査値、既存の身長低下、初経年齢、閉経年齢、閉経時から前記第１時点までの年数、前記経過期間の長さ、ＦＲＡＸ（登録商標）による骨折リスク評価結果、前記第２時点の骨密度予測値、前記経過期間内の骨量減少率予測値、及び、これらのいずれかを間接的に示すデータから選ばれた４種以上の臨床データを含み、
前記各被験者の前記骨折スコアは、前記判定の結果と、前記４種以上の臨床データと、を含む５種以上の観測変数が設けられて共分散構造分析が行われる場合に、前記判定の結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータである、学習モデル生成方法。
（６）
閉経後である第１時点での骨粗鬆症による既存骨折の有無、前記第１時点での前記既存骨折の骨折数、前記第１時点を過ぎてから後の第２時点までの経過期間内での骨粗鬆症による新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた１種以上に関する骨折スコアを出力可能な学習モデルであって、
前記学習モデルは、前記第１時点での前記既存骨折の有無、前記第１時点での前記既存骨折の骨折数、前記経過期間内での前記新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた１種以上を判定された各被験者の前記第１時点での臨床情報が入力されると前記各被験者の前記骨折スコアを出力するように重み付け値が機械学習されたものであり、且つ、対象者の前記第１時点での前記臨床情報が入力される場合には前記対象者の前記臨床情報に対して前記重み付け値に基づく演算を行って前記対象者の前記骨折スコアを出力するように情報処理装置を機能させるものであり、
前記第１時点での前記臨床情報には、年齢、身長、体重、ＢＭＩ、骨密度、骨代謝マーカー検査値、腎機能マーカー検査値、骨格筋量マーカー検査値、既存の身長低下、初経年齢、閉経年齢、閉経時から前記第１時点までの年数、前記経過期間の長さ、ＦＲＡＸ（登録商標）による骨折リスク評価結果、前記第２時点の骨密度予測値、前記経過期間内の骨量減少率予測値、及び、これらのいずれかを間接的に示すデータから選ばれた４種以上の臨床データを含み、
前記各被験者の前記骨折スコアは、前記判定の結果と、前記各被験者の前記４種以上の臨床データと、を含む５種以上の観測変数が設けられて共分散構造分析が行われる場合に、前記判定の結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータである、学習モデル。
（７）
前記（６）に記載された学習モデルに基づいて、応答曲面法により、前記各被験者を含む被験者らの前記臨床情報と前記被験者らの前記骨折スコアとの関係を示す応答曲面を生成し、生成される前記応答曲面に骨折リスク陽性領域が含まれている場合には、推定されるリスク因子を特定する処理を情報処理装置に実行させるステップを含み、
前記骨折リスク陽性領域は、前記学習モデルに基づいて、前記骨折スコアの値を示す第１軸と前記４種以上の臨床データから選択された１種の臨床データの値を示す第２軸とを有し且つ前記応答曲面と前記骨折スコアのカットオフ値との関係を示す二次元グラフ又は三次元グラフを作成する処理を情報処理装置に実行させる場合に、作成される前記二次元グラフ又は前記三次元グラフに含まれる前記応答曲面において前記骨折スコアの値が前記カットオフ値よりも高値となる部分の領域であり、
前記推定されるリスク因子は、少なくとも、前記第２軸における前記選択された１種の臨床データの値に関するものである、骨粗鬆症による骨折のリスク因子推定方法。
（８）
前記対象者の前記第１時点での前記臨床情報を取得し、取得した該臨床情報を前記（６）に記載された学習モデルに入力して前記対象者の前記骨折スコアを出力する処理を情報処理装置に実行させるプログラム。
（９）
前記学習モデルが記憶される記憶部と、
前記対象者の前記第１時点での前記臨床情報を取得した場合に、所得した該臨床情報を前記学習モデルに入力して前記対象者の前記骨折スコアを出力する処理を実行する演算部と、
を備える、前記（６）に記載された学習モデルを有する情報処理装置。
（１０）
閉経後である第１時点での骨粗鬆症による既存骨折の有無、前記第１時点での前記既存骨折の骨折数、前記第１時点を過ぎてから後の第２時点までの経過期間内での骨粗鬆症による新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた１種以上を判定された各被験者の前記判定の結果と、前記各被験者の前記第１時点での４種以上の臨床データと、を含む５種以上の観測変数を設けて共分散構造分析を行い、前記判定の結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータを取得するステップを含み、
前記第１時点での前記４種以上の臨床データは、年齢、身長、体重、ＢＭＩ、骨密度、骨代謝マーカー検査値、腎機能マーカー検査値、骨格筋量マーカー検査値、既存の身長低下、初経年齢、閉経年齢、閉経時から前記第１時点までの年数、前記経過期間の長さ、ＦＲＡＸ（登録商標）による骨折リスク評価結果、前記第２時点の骨密度予測値、前記経過期間内の骨量減少率予測値、及び、これらのいずれかを間接的に示すデータから選ばれる、学習データセット作成方法。
（１１）
病気に関する受診者らの臨床情報に基づいて、前記病気で発生する場合がある合併症のリスク因子を推定する方法であって、
前記受診者らに含まれる各受診者は、前記病気に関して診察された第１診察時点では前記合併症が発生していないことを診断され、且つ、前記第１診察時点を過ぎてから後の第２診察時点までの経過観察期間内での前記合併症の発生の有無を判定する診断をされた者であり、
前記方法は、前記各受診者の臨床情報が入力されると前記各受診者の合併症発生スコアを出力するように機械学習した学習モデルに基づいて、応答曲面法により前記受診者らの前記臨床情報と前記受診者らの前記合併症発生スコアとの関係を示す応答曲面を生成し、生成される前記応答曲面に合併症発生リスク陽性領域が含まれる場合には推定されるリスク因子を特定する処理を情報処理装置に実行させるステップを含み、
前記各受診者の前記臨床情報は、前記第１診察時点における前記各受診者に関する４種以上の臨床データを含み、
前記各受診者の前記合併症発生スコアは、前記各受診者の前記判定の結果と、前記各受診者の前記４種以上の臨床データと、を含む５種以上の観測変数が設けられて共分散構造分析が行われる場合に、前記判定の結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータであり、
前記合併症発生リスク陽性領域は、前記学習モデルに基づいて、前記合併症発生スコアの値を示す第１軸と前記４種以上の臨床データから選択された１種の臨床データの値を示す第２軸とを有し且つ前記応答曲面と前記合併症発生スコアのカットオフ値との関係を示す二次元グラフ又は三次元グラフを作成する処理を情報処理装置に実行させる場合に、作成される前記二次元グラフ又は前記三次元グラフに含まれる前記応答曲面において前記合併症発生スコアの値が前記カットオフ値よりも高値となる部分の領域であり、
前記推定されるリスク因子は、少なくとも、前記第２軸における前記選択された１種の臨床データの値に関するものである、合併症のリスク因子推定方法。

本発明は、その趣旨を逸脱しない範囲で当業者の知識に基づいて種々なる改良、修正、又は変形を加えた態様でも実施できる。また、同一の作用または効果が生じる範囲内で、いずれかの発明特定事項を他の技術に置換した形態で実施してもよい。

以下に本発明の試験例などを説明するが、本発明は以下の試験例に限定されない。

箕面市立病院は、大阪市郊外にある二次医療機関（入院治療可能な一般病院）で、骨粗鬆症外来を行っており、少なくとも本願出願当時には、多数の閉経後女性が定期的に検診を受けていた。本願に係る発明者は、この病院でオプトアウトを利用し、骨粗鬆症外来の受診者らのうち、初診時に記録された臨床データ項目数が比較的に多い受診者２３３名を被験者らとし、後ろ向き研究を行った。後ろ向き研究は、疾病の要因と発症との関連を調べる研究手法の一種である。研究開始時点から過去にふり返り、初診時（第１時点）に、「骨粗鬆症による既存骨折が生じていた」と判定された各受診者と、「骨粗鬆症による既存骨折は生じていなかった」と判定された各受診者とで、初診時の臨床データを比較した。同様に、２０２０年１月末の検診時（第２時点）に、「初診時（第１時点）から２０２０年１月末の検診時（第２時点）までの経過観察期間内に骨粗鬆症による新規骨折が生じた」と判定された各受診者と、「経過観察期間内に新規骨折が生じなかった」と判定された各受診者らとで、初診時の臨床データを比較し、骨折に至った要因を検証した。箕面市立病院の倫理審査委員会は、この研究を承認し、インフォームドコンセントの必要性を断念することも承認した。全ての方法は、ヘルシンキ宣言と関連性がある指針に従って実施した。

本願に係る発明者は、骨粗鬆症による骨折のリスク因子として１）ＢＭＤが低値、２）骨代謝マーカー（骨代謝回転）検査値が高値、３）前記ＦＲＡＸ結果が高値、４）身長低下量が大きい又は低体重、５）閉経年齢が低い、６）生活習慣病（糖尿病、高脂血症又は慢性閉塞性肺疾患）罹患、及び７）腎機能低下（血中Ｃｒ検査値の上昇）の７種があると考えた。また、箕面市立病院の骨粗鬆症外来では、二次医療機関の骨粗鬆症検診で一般的に用いられる機器、手法及び市販の臨床検査キット等により、各受診者の身体計測、問診、ＤＸＡによる腰椎ＢＭＤ計測、血液検査、尿検査、並びに、胸椎及び腰椎のレントゲン撮影による画像診断を行ってきた。受診者（被験者）２３３名について、初診時の検査等で取得した様々な臨床データから、上記７種の要因のうちの１種以上に関連し得る臨床データに基づくプロフィールを、次の表１に示した。

受診者２３３名に含まれる各受診者は、それぞれ第１時点（初診時）が異なるが、第２時点は２０２０年１月末の検診時で共通であった。受診者２３３名には、４０歳未満で早期閉経した女性が十数名含まれ、初診時年齢７５歳以上の女性が４４名含まれていた。一部の受診者らからデータ取得できず、ｎ数が２３３未満になった（つまり欠損値を含む）データ項目が幾つかあった。例えば、７５歳以上の女性でＦＲＡＸに基づく診断を避けていたため、受診者４４名では初診時の前記ＦＲＡＸ結果をデータ取得していなかった（２３３名－４４名＝１８９名）。受診者５７名では、若年時の最大身長を忘れた等の理由で、初診時既存身長低下をデータ取得できなかった（２３３名－５７名＝１７６名）。受診者２３３名のうち、表１に示すデータ項目に欠損値がない受診者は１４１名であった。表１に示す初診時ＢＬＲ予測値は、各被験者について、初診時の他の臨床データと、初診時及び２０２０年１月末の検診時の各々で計測したＢＭＤ計測値とを、本願に係る発明者が以前に生成したＢＬＲ（予測値）を出力可能な学習モデル（特許文献１の実施例１ａ）に入力し、該学習モデルにより出力されたデータである。

この以前に生成した学習モデルは、和歌山県太一町の地域住民を被験者らとする疫学的研究（Taiji Cohort Study、非特許文献５乃至７参照）で取得された多数の臨床情報のうち、閉経後女性１３５名分の臨床情報において、１９９３年６月及び２００３年６月の各々の検診時で得られた他の臨床データに基づき、三層型ＡＮＮに入力変数と出力変数との関係を機械学習させ生成した統計モデルである。この機械学習では、図１１に示すように、入力変数として入力層に、１９９３年６月検診時のＢＭＤ計測値は正規化せず入力し、１９９３年６月検診時における年齢、身長、体重、初経年齢、閉経年齢、閉経後経過年数（閉経時から１９９３年６月検診時までの経過年数）、体脂肪率、除脂肪体重及び体脂肪率の各々は、前述した数式３で正規化後に入力した。この機械学習の出力変数として、２００３年６月検診時のＢＭＤ計測値と、１９９３年６月検診時から２００３年６月検診時までの期間内のＢＬＲと、を出力層に入力した。ここでのＢＭＤ計測値は、Ｈｏｌｏｇｉｃ社製ＱＤＲ－１０００を用いたＤＸＡによる腰椎Ｌ２からＬ４のＢＭＤ計測値であった。ここでのＢＬＲは、１９９３年６月及び２００３年６月の各々の検診時でのＢＭＤ計測値に基づき、前述した数式１により算出した（詳細は特許文献１参照）。つまり、表１に示す「初診時ＢＬＲ予測値」は、箕面市立病院の受診者２３３名での初診時腰椎ＢＭＤ計測値と、前述の数式３で正規化した他の臨床情報（初診時正規化年齢、初診時正規化身長、初診時正規化体重、初診時正規化ＢＭＩ、正規化初経年齢、正規化閉経年齢、閉経時から初診時までの正規化経過年数、初診時正規化体脂肪率、初診時正規化除脂肪体重及び初診時正規化体脂肪率）を、予め生成した学習モデル（ＢＬＲ（予測値）を出力可能な学習モデル）の入力層に入力して出力させた、各受診者の初診時から１０年後までの期間内のＢＬＲ予測値データであった。

受診者２３３名の胸椎及び腰椎の少なくとも一方に関して、初診時（第１時点）での骨粗鬆症による既存骨折の有無に関する判定結果（以下「既存骨折判定結果」ともいう）と、初診時（第１時点）から２０２０年１月末の検診時（第２時点）までの経過観察期間内での骨粗鬆症による新規骨折の有無に関する判定結果（以下「新規骨折判定結果」ともいう）とについて、箕面市立病院の骨粗鬆症外来で整形外科医を含む担当医らが一定基準で判定した結果を、次の表２に示した。これらの判定結果は、担当医らにより、「骨折あり」の場合は１．０と記録され、「骨折なし」の場合は０と記録された。「いつのまにか骨折」といわれるように、初診時に「既存骨折あり」と判定された４９名では、この既存骨折が初診時よりも何年前に発生したものか不明で、初診時よりも１０年以上前に発生していた可能性が考えられた。各受診者は、初診時から２０２０年１月末まで毎年１回は骨粗鬆症外来を受診しており、経過観察期間内に「新規骨折あり」と２０２０年１月末の検診時に判定された１０名では、毎年の検診での電子カルテの記載から、「初診時（第１時点）よりも後の新規骨折発生時点から２０２０年１月末の検診時（第２時点）までの期間の長さ」が、平均５．５年程度と考えられた。

以下に記載する幾つかの試験例では、統計分析において、ｐ＜０．０５である場合に統計的に有意と認め、０．０５＜ｐ＜０．１０である場合に傾向があると認めた。スチューデントｔ検定又はχ^２検定を行う際は、ＪＭＰ（登録商標）version 8.0（SAS Institute Inc.製ソフトウェア）を用いた。ＳＥＭによる平均共分散構造分析は、ＡＭＯＳ２３．０（ＩＢＭ－ＳＰＳＳ社製）を用いて行った。平均共分散構造分析では、ＲＭＳＥＡ値が０．０８０未満、且つ、パスモデルの適合に関するＲ^２値が０．９５を上回る場合に、統計学的有意性があり信頼できる統計モデルとした。ＲＭＳＥＡ値が０．０５０未満で、ＣＦＩ（comparative fit index）値が０．９５よりも大きく、パスモデル適合に関するＲ^２値が１．０００である場合、更に統計的有意性があり信頼できる統計モデルと判断した。

＜試験例１－１＞
各受診者について、骨粗鬆症による新規骨折の発生を予測可能か、共分散構造分析と機械学習との組み合わせにより検証した。このために、各受診者について表１に示す臨床情報のうち１２種の臨床データを観測変数とし、表２に示す新規骨折判定結果も観測変数とした。次の表３に示すように合計１３種の観測変数を選定し、図１２に示すパスモデルを作成した。このパスモデルでは、各被験者の新規骨折判定結果に係る観測変数に対して、直接的な因果関係を有すると仮定される潜在変数を設けた。このパスモデルを用いてＳＥＭによる平均共分散構造分析の演算を実行し、潜在変数の因子得点を算出し、各受診者の骨折スコアとした。スチューデントｔ検定により、新規骨折判定結果と、骨折スコア（潜在変数の因子得点）との間で、統計的有意性を分析した。図１２に示すパスモデルでは、０．３を上回る相関係数とｐ＜０．００１という有意なｐ値とに基づいて、潜在変数と結果との間の標準化されたパスで最大の係数値を示した複数のパスを選定した。

図１２に示すパスモデルの評価結果では、表３に示すように、ＲＭＳＥＡ値が０．０３３で、ＡＩＣが１８０で、ＣＦＩが０．９９１で、パスモデル適合に関するＲ^２値は１．０００で、優れた適合（統計的有意性）が示された。このパスモデルで、潜在変数と「新規骨折判定結果に係る観測変数」との標準化パス係数は、標準化直接効果として１．６７（ｐ＜０．００１）であり、潜在変数から「新規骨折判定結果に係る観測変数」に対して直接的な有意な因果関係が認められた。このパスモデルで、標準化総合効果は０．４４８で、ベイズ法による標準化総合効果の平均値±標準誤差は０．４０９±０．００４１（ｐ＜０．００１）であった。

図１３に示すように、「新規骨折あり」と判定された受診者１０名の骨折スコア（潜在変数の因子得点）は、「新規骨折なし」と判定された受診者２２３名の骨折スコア（潜在変数の因子得点）と比べて、著しく高値であった（ｐ＜０．０００１）。このため、骨折スコアの高さに基づき、新規骨折判定結果を予測可能なことが示唆された。骨折スコアに基づき「新規骨折あり」又は「新規骨折なし」を判別するカットオフ値を決定するために、受信者動作特性（Receiver Operating Characteristic：以下「ＲＯＣ」ともいう）解析を行った。ＲＯＣ解析では、各被験者の骨折スコア（潜在変数の因子得点）を用いて「（潜在変数の感度）＋（潜在変数の特異度）－１」の値を計算し、被験者らでの最大値が算出された場合に、その最大値の元になった被験者の骨折スコアの数値が、骨折スコアのカットオフ値（骨折スコアの閾値）となる。ＲＯＣ解析で示されたカットオフ値は１．０８であった。

ＡＮＮによる機械学習では、パスモデル（図１２）で観測変数とした１３種の臨床データから新規骨折判定結果を除き、残る１２種の臨床データを選定した。図１４及び次の表４に示すように、この１２種の臨床データ各々を数式３で正規化し、入力変数とした。出力変数は、ＳＥＭによる平均共分散構造分析で算出された、各受診者の骨折スコアとした。三層型ＡＮＮで、入力層に１２種の入力変数を入力し、出力層で出力変数とした骨折スコアを出力するように機械学習させ、統計学的モデル（学習モデル）を生成した。この機械学習を繰り返して多数の学習モデルを生成する際、０．０１、０．０２及び０．０４のオーバーフィットペナルティにより、中間層で２つから４つのノードが選定された。多数の学習モデルで、０．８１以上のＲ^２値（ｒ＝０．９）と、五分割交差検証法のＲ^２値０．６４（ｒ＝０．８）とが測定された。多数の学習モデルから、過学習のモデルを避け、Ｒ^２値が比較的に大きいモデルを１つ選定し、試験例１－１に係る学習モデルとした。この学習モデルでは、ノード数は３で、オーバーフィットペナルティは０．０４で、五分割交差検証法によるＲ^２値は０．５６であった。試験例１－１に係る学習モデルで、機械学習に用いた１２種の入力変数を入力層に入力し、各受診者の骨折スコア（予測値）を出力させた。平均共分散構造分析により算出された骨折スコア（潜在変数の因子得点）と、試験例１－１に係る学習モデルにより出力された骨折スコア（予測値）とでは、図１５及び次の表４に示したように、関連性の高さとしてＲ^２＝０．９４０という高値が示された。このため、学習モデルから出力された骨折スコア（予測値）は、潜在変数の因子得点と高度に相関しているといえる。

試験例１－１に係る学習モデルにより出力された各受診者の骨折スコア（予測値）について、カットオフ値（骨折スコアの閾値）１．０８と比較し、カットオフ値以上の受診者を「新規骨折あり」と予測し、カットオフ値未満の受診者を「新規骨折なし」と予測する基準で、各被験者で新規骨折の有無を判別した。その結果、予測精度として、表４に示したように、Ｃ統計量（c-index）が０．８６５で、感度が８３．３％（５／６）で、特異度が８９．６％（１２１／１３５）であり、試験例１－１に係る学習モデルでは骨粗鬆症による新規骨折の有無を高精度に予測可能なことが示唆された。なお、平均共分散構造分析では、臨床データに欠損値が含まれている場合、他の臨床データどうしの関係から、欠損値に対して自動的に適当な値が代入され演算処理が実行される。一方、ＡＮＮや学習モデルでは、入力する臨床データに欠損値が含まれている受診者について、機械学習したり予測値を出力したりすることができない。このため、平均共分散構造分析では受診者ら２３３名全員について演算処理を実行したが、ＡＮＮや学習モデルでは、入力変数とする１２種の臨床データに欠損値がない１４１名について機械学習し骨折スコアを出力した。

＜試験例１－２＞
試験例１－１と比べて、前述の表２に示した「新規骨折判定結果」に代わり「既存骨折判定結果」データを用い、その他は同様にして検証した。図１６に示すパスモデルを作成し、平均共分散構造分析により骨折スコア（潜在変数の因子得点）を算出させた。試験例１－２で作成した場合のパスモデル（図１６）では、表３に示した評価がされ、優れた適合（統計的有意性）が示され、潜在変数から「既存骨折判定結果に係る観測変数」に対して直接的な有意な因果関係が認められた。図１７に示すように、「既存骨折あり」と判定された受診者４９名の骨折スコアは、「既存骨折なし」と判定された受診者１８４名の骨折スコアと比べて、著しく高値であった（ｐ＜０．０００１）。このため、骨折スコアの高さに基づき、既存骨折判定結果を推測可能なことが示唆された。ＲＯＣ解析により算出された「既存骨折あり」又は「既存骨折なし」を判別するカットオフ値（骨折スコアの閾値）は０．２７であった。図１８及び表４に示したように機械学習を繰り返し行い、生成された多数の学習モデルから過学習のモデルを避け、Ｒ^２値が比較的に大きいモデルを１つ選定し、試験例１－２に係る学習モデルとした。平均共分散構造分析で算出された骨折スコアと、試験例１－２に係る学習モデルにより出力された骨折スコア（推測値）とでは、図１９及び表４に示したように、関連性の高さとしてＲ^２＝０．９１５という高値が示された。骨折スコア（推測値）とカットオフ値０．２７との比較により、各受診者で既存骨折の有無を判別したところ、表４に示した推測精度であった。試験例１－２に係る学習モデルで骨粗鬆症による既存骨折の有無を高精度に推測可能なことが、示唆された。

＜参考試験例２＞
受診者２３３名のうち初診時年齢が７５歳未満である１８９名について、初診時の前記ＦＲＡＸ結果で骨折発生確率１５％以上である場合に「新規骨折あり」と予測し、この確率が１５％未満である場合に「新規骨折なし」と予測する条件で、ＦＲＡＸ（登録商標）による新規骨折判定結果の予測精度を検証したところ、次の表５に示す結果であった。ＦＲＡＸと比べて、試験例１－１に係る学習モデルでは、予測精度が高いことが示唆された。

＜参考試験例３＞
受診者２３３名のうち臨床データに欠損値がない１４１名について、初診時年齢、初診時身長、初診時体重、初診時ＢＭＩ、初診時身長低下、初診時の前記ＦＲＡＸ結果、初診時ＢＬＲ予測値、初診時ＢＭＤ計測値、閉経年齢、初経年齢、初診時血中Ｃｒ検査値及び初診時ＢＡＰ検査値の臨床データを用い、ＳＰＳＳ version 23.0（ＩＢＭ－ＳＰＳＳ社製ソフトウェア）の多変量ロジスチック回帰分析により新規骨折判定結果の予測精度を検証したところ、表５に示す結果であった。多変量ロジスチック回帰分析と比べて、試験例１－１に係る学習モデルでは、予測精度が高いことが示唆された。

＜再検証Ｉ＞
再検証Ｉでは、実験例１－１及び実験例１－２の各学習モデルを臨床応用可能か、新たなデータセットで検証した。２０２０年２月以降に初めて箕面市立病院の骨粗鬆症外来を受診した閉経後女性（以下「新規受診者」ともいう）を、対象者とした。初診時（第１時点）が２０２０年２月から２０２１年１月末までの期間内である新規受診者２７名について、次の表６に示す１２種の臨床データと、既存骨折判定結果とを新たなデータセットに含めた。なお、この２７名のうちで初診時年齢が７５歳以上の者は４名であった。

新規受診者２７名のうち、前述の担当医らに「既存骨折あり（骨折数１）」と判定された新規受診者は、３名であった。問診によると、初診前の骨折発生時から初診時までの期間の長さは、３名とも３年以内であった。この２７名は、初診時から２０２１年１月末までの経過観察期間が１年未満と短く、経過観察期間内に「新規骨折が生じた」と担当医らに判定された新規受診者は、１名もいなかった。このため、新規受診者らで新規骨折判定結果の予測精度を再検証することはできなかった。代わりに、新規受診者２７名のうちＢＬＲ予測値に欠損値がない２３名で、既存骨折判定結果の推測精度を再検証した。

試験例１－１及び試験例１－２の各学習モデルに対して、表６に示した１２種の臨床データを前述の数式３で正規化後に入力した。試験例１－１の再検証では、試験例１－１に係る学習モデルにより出力された各新規受診者の骨折スコア（推測値）を、カットオフ値１．０８と比較し、各新規受診者で既存骨折の有無を判別した。試験例１－２の再検証では、試験例１－２に係る学習モデルにより出力された各新規受診者の骨折スコア（推測値）を、カットオフ値０．２７と比較し、各新規受診者で既存骨折の有無を判別した。これら再検証Ｉの結果を次の表７に示した。

表４と比べて表７で推測精度が低下したが、表７は各新規受診者（新規症例）での推測結果で、臨床応用を検討する上で学習モデルは許容可能な推測精度を有すると考えられる。表７から明らかなように、試験例１－２よりも試験例１－１の方が、意外にも、各新規受診者で既存骨折判定結果を高精度に推測でき、優れた汎用性を示した。その理由は不明だが、臨床経験上、骨粗鬆症患者に「１つ目の骨折発生時点から間もない時期ほど、２つ目の骨折が発生するリスクが高い」要素が潜んでいると考えられ、おそらく、試験例１－２よりも試験例１－１の方がこの要素を幾らか含めて学習できたことに因るものと考えられる。つまり、学習データセットの元になった受診者らで「初診時の何年前に生じた既存骨折か」を特定できず、試験例１－２の学習に「骨折の発生時点から初診時までの期間の長さ」要素があまり含まれず、且つ、この期間の長さが受診者らと新規受診者らとの間で大幅に異なるため、試験例１－２で各新規受診者に対する推測精度が低下しやすかったのであろうと考えられる。一方、試験例１－１の学習では、初診時から２０２０年１月末の検診時までの経過観察期間内での新規骨折の有無を出力したので、期間の長さの要素をある程度は学習し、各新規受診者に対して高い推測精度を発揮しやすかったのであろうと考えられる。同じ理由から、仮に、試験例１－１で新規症例について新規骨折判定結果の予測精度を評価できる機会があれば、同様に高い予測精度が発揮されやすいと考えられる。

＜再検証ＩＩ＞
再検証ＩＩでは、上述した再検証Ｉの新規受診者２７名に、初診時（第１時点）が２０２０年４月から２０２２年９月末までの期間内である新規受診者３３名を加え、合計６０名を対象者とした。この新規受診者６０名のプロフィールを、次の表８に示した。再検証Ｉと同様に、新規受診者６０名のうち表８に示した１２種の臨床データに欠損値がない４１名について、１２種の臨床データを試験例１－１に係る学習モデルに入力し、学習モデルにより出力された骨折スコア（推測値）により初診時（第１時点）の既存骨折判定結果を推測可能か検証した。この再検証ＩＩでは前述の表７に示した結果が得られ、再検証Ｉと同程度の推測精度が認められた。

＜試験例４－１＞
前述した試験例１－１と比べて、観測変数や入力変数で「初診時ＢＬＲ予測値」を削減する他は同様に試験し、新規骨折判定結果を予測可能か検証した。図２０に示したパスモデルを用いて平均共分散構造分析により骨折スコア（潜在変数の因子得点）を算出させた。このパスモデル（図２０）では、後述の表９に示した評価結果で、優れた適合（統計的有意性）と、潜在変数から「新規骨折判定結果に係る観測変数」に対して直接的に有意な因果関係とが認められた。ＲＯＣ解析による骨折スコアのカットオフ値は１．０８であった。図２１に示したように、「新規骨折あり」と判定された被験者らでは、「新規骨折なし」と判定された被験者らと比べて、骨折スコアが著しく高値（ｐ＜０．０００１）で、骨折スコアの高さに基づき新規骨折判定結果を推測可能なことが示唆された。

また、前述した試験例１－１と比べて、次の表１０及び図２２に示す１１種の入力変数（欠損値のない受診者１４３名）を選定した他は、同様にしてＡＮＮに繰り返し学習させ、生成した多数のモデルから同様に１つのモデルを選定した。選定された試験例４－１に係る学習モデルでは、オーバーフィットペナルティは０．０４、五分割交差検証法によるＲ^２値は０．５１であった。平均共分散構造分析で算出した骨折スコアと、試験例４－１に係る学習モデルにより出力した骨折スコア（予測値）との関連性は、図２３に示すようにＲ^２＝０．９５６であった。各受診者の骨折スコア（予測値）をカットオフ値１．０８と比較し、各受診者で新規骨折の有無を判別したところ、次の表１０に示した予測精度であり、試験例４－１でも新規骨折判定結果を高精度に予測可能なことが示唆された。

＜試験例４－２＞
前述した試験例１－２と比べて、観測変数や入力変数で「初診時ＢＬＲ予測値」を削減する他は同様に試験し、既存骨折判定結果を推測可能か検証した。図２４に示すパスモデルで平均共分散構造分析を行い、骨折スコア（潜在変数の因子得点）を算出した。パスモデル（図２４）では、前述の表９に示した評価結果が得られ、優れた適合（統計的有意性）と、潜在変数から「既存骨折判定結果に係る観測変数」に対して直接的な有意な因果関係と、が認められた。ＲＯＣ解析による骨折スコアのカットオフ値は０．２７であった。図２５に示すように、「既存骨折あり」と判定された被験者らでは、「既存骨折なし」と判定された被験者らと比べて、骨折スコアが著しく高値（ｐ＜０．０００１）で、骨折スコアの高さに基づき既存骨折判定結果を推測可能なことが示唆された。表１０に示した１１種の臨床データ（欠損値のない受診者１４３名）を入力変数とし、図２６に示すようにＡＮＮに繰り返し学習させ、生成した多数のモデルから選定した試験例４－２に係る学習モデルでは、オーバーフィットペナルティは０．０４で、五分割交差検証法によるＲ^２値は０．６００であった。平均共分散構造分析で算出した骨折スコアと、試験例４－２に係る学習モデルにより出力した骨折スコア（推測値）との関連性はＲ^２＝０．８８１であった（図２７）。各受診者の骨折スコア（推測値）をカットオフ値と比較し、各受診者で既存骨折の有無を判別したところ、表１０に示した推測精度で、試験例４－２でも既存骨折判定結果を高精度に推測可能なことが示唆された。

＜試験例５－１＞
前述した試験例１－１と比べて、観測変数や入力変数から「初診時血中Ｃｒ検査値」及び「初診時ＢＡＰ検査値」を削減する他は同様に試験し、新規骨折判定結果を予測可能か検証した。図２８に示すパスモデルで平均共分散構造分析を行い、骨折スコア（潜在変数の因子得点）を算出させた。このパスモデル（図２８）では、優れた適合（統計的有意性）と、潜在変数で「既存骨折判定結果に係る観測変数」に対して直接的に有意な因果関係と、が認められた（前述の表９）。ＲＯＣ解析による骨折スコアのカットオフ値は１．１５であった。表１０に示した１０種の臨床データ（欠損値のない受診者１４１名）を入力変数とし、図２９に示したようにＡＮＮに繰り返し学習させ、生成した多数の学習モデルから試験例５－１に係る学習モデルを選定した。平均共分散構造分析で算出した骨折スコアと、試験例５－１に係る学習モデルにより出力した骨折スコア（予測値）との関連性を示すＲ^２値は０．８３５であった（図３０及び表１０）。骨折スコア（予測値）をＲＯＣ解析によるカットオフ値と比較し、新規骨折の有無を判別したところ、前述の表１１に示す予測精度で、試験例５－１でも新規骨折判定結果を高精度に予測可能なことが示唆された。

＜試験例５－２＞
前述した試験例１－２と比べて、観測変数や入力変数から「初診時血中Ｃｒ検査値」及び「初診時ＢＡＰ検査値」を削減する他は同様に試験し、既存骨折判定結果を推測可能か検証した。図３１に示すパスモデルで平均共分散構造分析を行い、骨折スコア（潜在変数の因子得点）を算出した。パスモデル（図３１）では、表１１に示した評価結果が得られ、優れた適合（統計的有意性）と、潜在変数から「既存骨折判定結果に係る観測変数」に対して直接的な有意な因果関係とが認められた。ＲＯＣ解析による骨折スコアのカットオフ値は０．４１であった。表１０に示した１０種の臨床データ（欠損値のない受診者１４１名）を入力変数とし、図３２に示したようにＡＮＮに繰り返し学習させ、生成した多数の学習モデルから試験例５－２に係る学習モデルを選定した。平均共分散構造分析で算出した骨折スコアと、試験例５－２に係る学習モデルにより出力した骨折スコア（推測値）との関連性はＲ^２＝０．８９５であった（図３３）。各受診者の骨折スコア（推測値）をＲＯＣ解析によるカットオフ値と比較し、既存骨折の有無を判別したところ、表１１に示した推測精度であった。試験例５－２でも、既存骨折を高精度に推測可能なことが示唆された。

＜試験例６乃至１３＞
試験例６乃至１３の各々では、前述した試験例１－１と比べて、次の表１１に示したように観測変数や入力変数として用いるデータ項目を幾つか削減した他は、同様にして、新規骨折判定結果を予測可能か検証した。表１１に示した正規化していない臨床データを観測変数として用いたいずれのパスモデルでも、優れた適合（統計的有意性）と、潜在変数で「新規骨折判定結果に係る観測変数」に対して直接的な有意な因果関係と、が認められた。表１１に示した入力変数（正規化した臨床データ）と出力変数（潜在変数の因子得点）とによりＡＮＮに繰り返し学習させ、生成した多数の学習モデルから試験例ごとに１つの学習モデルを選定した。平均共分散構造分析で算出した骨折スコアと、選定した学習モデルにより出力した骨折スコア（予測値）との関連性を示すＲ^２値は、表１１に示したようにいずれも高値であった。骨折スコア（予測値）をＲＯＣ解析によるカットオフ値と比較し、新規骨折の有無を判別したところ、表１１に示した予測精度であった。このため、例えば、学習データセットに含まれる受診者らの臨床データに測定誤差が少ない等、質の高い臨床データセットを取得できる場合には、新規骨折判定結果を高精度に予測できる可能性が示唆された。

＜試験例１４乃至１７＞
試験例１４乃至１７の各々では、前述した試験例１－１と比べて、次の表１２に示すように観測変数や入力変数として用いるデータ項目を幾つか削減した他は、同様にして、新規骨折判定結果を予測可能か検証した。次の表１２に示した正規化していない臨床データを観測変数として用いたいずれのパスモデルでも、優れた適合（統計的有意性）と、潜在変数で「新規骨折判定結果に係る観測変数」に対して直接的な有意な因果関係と、が認められた。表１２に示した入力変数（正規化した臨床データ）と出力変数（潜在変数の因子得点）とによりＡＮＮに繰り返し学習させ、生成した多数の学習モデルから試験例ごとに１つの学習モデルを選定した。平均共分散構造分析で算出した骨折スコア（潜在変数の因子得点）と、選定した学習モデルにより出力した骨折スコア（予測値）との関連性を示すＲ^２値は、表１２に示したように高値であった。骨折スコア（予測値）をＲＯＣ解析によるカットオフ値と比較し、新規骨折の有無を判別したところ、表１２に示した精度であった。観測変数や入力変数として用いる臨床データが４種でも、例えばデータに測定誤差が少ない等、質の高い学習データセットを作成できる場合に、新規骨折判定結果を高精度に予測できる可能性が示唆された。

＜試験例１８＞
初診時に既存骨折数０と判定された各受診者と、初診時に既存骨折数１と判定された各受診者とを判別する推測可能か、共分散構造分析と機械学習との組み合わせにより検証した。前述した試験例１－２と比べて、以下に説明することの他は同様にして検証した。

試験例１８では、前述した受診者２３３名（表１）のうち、初診時の既存骨折数０と判定された１７９名と、初診時の既存骨折数１と判定された２９名とからなる合計２０８名の受診者を選定した。この２０８名のプロフィールを次の表１３に示した。２０８名の臨床情報から、１２種の臨床データと、既存骨折判定結果（骨折数０又は１）とを、後述の表１４に示したように合計１３種の観測変数として選定し、図１６に示すパスモデルを作成した。このパスモデルを用い平均共分散構造分析により、骨折数０又は１の判別に関する既存骨折スコア（潜在変数の因子得点）を算出させた。試験例１８で作成した場合のこのパスモデル（図１６）では、後述の表１５に示した評価結果が得られ、優れた適合（統計的有意性）と、潜在変数から「既存骨折判定結果に係る観測変数」に対して直接的に有意な因果関係とが認められた。ＲＯＣ解析による既存骨折スコアのカットオフ値は０．５３であった。「初診時の既存骨折数０」と判定された受診者らでは、「初診時の既存骨折数１」と判定された受診者らと比べて、既存骨折スコアが著しく高値で（ｐ＜０．０００１）、既存骨折スコアの高さに基づき既存骨折判定結果（骨折数０又は１）を推測可能なことが示唆された。

表１４に示した１２種の臨床データを入力変数とし、図１８に示したようにＡＮＮに繰り返し学習させ、生成した多数のモデルから選定した試験例１８に係る学習モデルでは、オーバーフィットペナルティは０．０１で、五分割交差検証法によるＲ^２値は０．６０２であった。平均共分散構造分析で算出した既存骨折スコアと、試験例１８に係る学習モデルにより出力した既存骨折スコア（推測値）との関連性はＲ^２＝０．９３３であった。各受診者の骨折スコア（推測値）をカットオフ値と比較し、各受診者で既存骨折数が０又は１のいずれか判別したところ、次の表１５に示した精度であった。試験例１８で、初診時の既存骨折数（０又は１）を高精度に推測可能なことが示唆された。

＜試験例１９＞
試験例１９では、以下に説明することの他は、上述した試験例１８と同様にして検証した。表１４に示したように、試験例１８と比べて観測変数からＢＬＲ予測値を削減し、図２４に示すパスモデルを作成し、平均共分散構造分析により、骨折数０又は１の判別に関する既存骨折スコア（潜在変数の因子得点）を算出させた。この試験例１９で作成した場合のパスモデル（図２４）では、表１５に示した評価結果が得られ、優れた適合（統計的有意性）と、潜在変数から「既存骨折判定結果に係る観測変数」に対して直接的に有意な因果関係とが認められた。ＲＯＣ解析による既存骨折スコアのカットオフ値は０．４９であった。「初診時の既存骨折数０」と判定された受診者らでは、「初診時の既存骨折数１」と判定された受診者らと比べて、既存骨折スコアが著しく高値で（ｐ＜０．０００１）、既存骨折スコアの高さに基づき既存骨折判定結果（骨折数０又は１）を推測可能なことが示唆された。ＢＬＲ予測値を含まない１１種の臨床データを入力変数として使用し（表１４）、図２６に示したようにＡＮＮに繰り返し学習させ、生成した多数のモデルから選定した試験例１９に係る学習モデルでは、オーバーフィットペナルティは０．０１で、五分割交差検証法によるＲ^２値は０．５１７であった。平均共分散構造分析で算出した既存骨折スコアと、試験例１９に係る学習モデルにより出力した既存骨折スコア（推測値）との関連性はＲ^２＝０．９５１であった。各受診者の骨折スコア（推測値）をカットオフ値と比較し、各受診者で既存骨折数が０又は１のいずれか判別したところ、表１５に示した精度であった。試験例１９で、初診時の既存骨折数（０又は１）を高精度に推測可能なことが示唆された。

＜試験例２０＞
初診時に既存骨折数０と判定された各受診者と、初診時に既存骨折数２と判定された各受診者とを判別する推測可能か、共分散構造分析と機械学習との組み合わせにより検証した。前述した試験例１－２と比べて、以下に説明することの他は同様にして検証した。

試験例２０では、前述した受診者２３３名（表１）のうち、初診時の既存骨折数０と判定された１７９名と、初診時の既存骨折数２と判定された１５名とからなる合計１９４名の受診者を選定した。この１９４名のプロフィールを表１６に示した。この１９４名の臨床情報から、１２種の臨床データと、既存骨折判定結果（骨折数０又は２）とを、表１４に示したように合計１３種の観測変数として選定し、図１６に示したパスモデルを作成した。このパスモデルを用い平均共分散構造分析により、骨折数０又は２の判別に関する既存骨折スコア（潜在変数の因子得点）を算出させた。この試験例２０で作成した場合のパスモデル（図１６）では、表１５に示した評価結果が得られ、優れた適合（統計的有意性）と、潜在変数から「既存骨折判定結果に係る観測変数」に対して直接的に有意な因果関係とが認められた。ＲＯＣ解析による既存骨折スコアのカットオフ値は０．４５であった。「初診時の既存骨折数０」と判定された受診者らでは、「初診時の既存骨折数２」と判定された受診者らと比べて、既存骨折スコアが著しく高値で（ｐ＜０．０００１）、既存骨折スコアの高さに基づき既存骨折判定結果（骨折数０又は２）を推測可能なことが示唆された。表１４に示した１２種の臨床データを入力変数とし、図２６に示したようにＡＮＮに繰り返し学習させ、生成した多数のモデルから選定した試験例２０に係る学習モデルでは、オーバーフィットペナルティは０．０１で、五分割交差検証法によるＲ^２値は０．６５３であった。平均共分散構造分析で算出した既存骨折スコアと、試験例２１に係る学習モデルにより出力した既存骨折スコア（推測値）との関連性はＲ^２＝０．９７６であった。各受診者の骨折スコア（推測値）をカットオフ値と比較し、各受診者で既存骨折数が０又は３のいずれか判別したところ、表１５に示した精度であった。試験例２０で、初診時の既存骨折数（０又は３）を高精度に推測可能なことが示唆された。

＜試験例２１＞
初診時に既存骨折数０と判定された各受診者と、初診時に既存骨折数３と判定された各受診者とを判別する推測可能か、共分散構造分析と機械学習との組み合わせにより検証した。前述した試験例１－２と比べて、以下に説明することの他は同様にして検証した。

試験例２１では、前述した受診者２３３名（表１）のうち、初診時の既存骨折数０と判定された１７９名と、初診時の既存骨折数３と判定された１０名とからなる合計１８９名の受診者を選定した。この１８９名のプロフィールを表１７に示した。この１８９名の臨床情報から、１２種の臨床データと、既存骨折判定結果（骨折数０又は３）とを、表１４に示したように合計１３種の観測変数として選定し、図１６に示したパスモデルを作成した。このパスモデルを用い平均共分散構造分析により、骨折数０又は３の判別に関する既存骨折スコア（潜在変数の因子得点）を算出させた。この試験例２１で作成した場合のパスモデル（図１６）では、表１５に示した評価結果が得られ、優れた適合（統計的有意性）と、潜在変数から「既存骨折判定結果に係る観測変数」に対して直接的に有意な因果関係とが認められた。ＲＯＣ解析による既存骨折スコアのカットオフ値は１．６１であった。「初診時の既存骨折数０」と判定された受診者らでは、「初診時の既存骨折数２」と判定された受診者らと比べて、既存骨折スコアが著しく高値で（ｐ＜０．０００１）、既存骨折スコアの高さに基づき既存骨折判定結果（骨折数０又は３）を推測可能なことが示唆された。表１４に示した１２種の臨床データを入力変数とし、図２６に示したようにＡＮＮに繰り返し学習させ、生成した多数のモデルから選定した試験例２１に係る学習モデルでは、オーバーフィットペナルティは０．０２で、五分割交差検証法によるＲ^２値は０．５１２であった。平均共分散構造分析で算出した既存骨折スコアと、試験例２１に係る学習モデルにより出力した既存骨折スコア（推測値）との関連性はＲ^２＝０．９９１であった。各受診者の骨折スコア（推測値）をカットオフ値と比較し、各受診者で既存骨折数が０又は２のいずれか判別したところ、表１５に示した精度であった。試験例２１で、初診時の既存骨折数（０又は３）を高精度に推測可能なことが示唆された。

＜再検証ＩＩＩ＞
再検証ＩＩＩでは、前述した再検証ＩＩと同じ新規受診者６０名（表８）を対象者らとし、前述した試験例１８及び試験例１９の各々に係る学習モデルを用い、初診時に既存骨折なし（骨折数０）と判定された新規受診者５２名と、初診時に既存骨折あり（骨折数１）と判定された新規受診者８名と、を判別可能か検討した。このためには、試験例１８に係る学習モデルに、新規受診者らの１２種の臨床データ（欠損値のない新規受診者名）を入力変数として入力し、各新規受診者の既存骨折スコア（推測値）を出力させ、出力された既存骨折スコアとカットオフ値０．５３とを比較することにより、各新規受診者の骨折数が０又は１のいずれか判別した。また、試験例１９の再試験例１９に係る学習モデルに、新規受診者らのＢＬＲ予測値を除く１１種の臨床データ（欠損値のない新規受診者４１名）を入力変数として入力し、各新規受診者の既存骨折スコア（推測値）を出力させ、出力された既存骨折スコアとカットオフ値０．４９とを比較することにより、各新規受診者の骨折数が０又は１のいずれか判別した。これら判別の結果を次の表１８に示した。

表１８から明らかなように、試験例１８及び試験例１９の各々に係る学習モデルから出力された既存骨折スコアにより、初診時に既存骨折数１と判別された各新規受診者と、初診時に既存骨折数０と判別された各新規受診者とを、高精度で判別する推測可能なことが示唆された。表１５と比べて表１８では推測精度が低下したが、表１８は各新規受診者（新規症例）での推測結果であり、臨床応用を検討する上で、学習モデルは許容可能な推測精度を有すると考えられる。なお、一般的に閉経後女性の一人ひとりでＢＬＲの値が異なる原因は、正確には未だ解明されていないが、一人ひとりの体質の違いのみならず、一人ひとりのリン摂取量の違いを反映し、リン摂取量が多ければＢＬＲの値が増加することが報告されている。試験例１８（ＢＬＲ予測値あり）で試験例１９（ＢＬＲ予測値なし）よりも高い推測精度が示された理由は、正確には不明であるが、試験例１８では入力変数にＢＬＲ予測値を含むことにより、各受診者において「一人ひとりで体質やリン摂取量が異なること」と「既存骨折数が０又は１のいずれかであること」との関係性を含めて機械学習できたことに因ると考えられる。

新規受診者（対象者）６０名（表８）には「初診時の既存骨折数２以上」と判定された者がいなかったので、本願に係る発明者は、試験例２０（既存骨折数０又は２の判別）や試験例２１（既存骨折数０又は３の判別）を再検証することができなかった。試験例１８や試験例１９（既存骨折数０又は１）の再検証で高い推測精度（表１８）が示されたため、試験例２０や試験例２１も再検証できる新規受診者（既存骨折数２以上）がいれば、同様に高い推測精度を示すであろうと考えられる。試験例１８、試験例２０及び試験例２１の各学習モデルを組み合わせて使用すれば、既存骨折数０乃至３である対象者らに含まれる各対象者を、骨折数０、骨折数１、骨折数２又は骨折数３のいずれかに高精度に分類する推測可能と考えられる。また、経過観察期間内での新規骨折の骨折数を０、１、２又は３のいずれかに高精度に分類する予測可能な学習モデルについては、新規骨折数１以上の受診者（被験者）や新規受診者（対象者）の症例が不足し検証できなかったが、試験例１－１乃至試験例２１での推測・予測精度の高さを考えると、そのような症例が十分にあれば高い予測精度を有することを実証可能であろうと考えられる。

＜試験例２２＞
市販の統計解析ソフトウェア（SAS Institute Inc.製、ＪＭＰ（登録商標）version 8.0）をインストールした市販のＰＣで、前述した試験例１－１に係る学習モデルを生成し、この統計解析ソフトウェアに実装された機能により、試験例１－１に係る学習モデルに基づき、機械学習に供した受診者らの入力変数（１２種の臨床データ）及び出力変数（潜在変数の因子得点）を反映した応答曲面を生成させた。この応答曲面の全体像は、本来は１３次元グラフに描かれるはずのものであるが、この統計解析ソフトウェアにより視認可能な三次元グラフへと加工された。三次元グラフで、第１軸（Ｚ軸）は骨折スコアの大きさを示す軸とし、第２軸（Ｘ軸）及び第３軸（Ｙ軸）の各々は１種の入力変数（１種の臨床データ）を示す軸とした。１２種の入力変数から任意の２種の組み合わせを選択する場合の数は、６６通りある。市販の統計ソフトウェアにより、それぞれ第２軸（Ｘ軸）及び第３軸（Ｙ軸）のデータ項目の組み合わせが異なる三次元グラフを幾つか作成した。作成したうちの大半の三次元グラフでは、応答曲面上の骨折スコアの値がカットオフ値１．０８以下で、応答曲面は閾値表示の下側にある骨折リスク陰性の予測領域のみを形成していた。このような三次元グラフで第２軸（Ｘ軸）及び第３軸（Ｙ軸）として選定した臨床データ項目の組み合わせは、骨粗鬆症による骨折のリスク因子として不適当と考えられる。

一方、作成したうちの幾つかの三次元グラフ（図５（ａ）、図５（ｂ）、及び、図６（ｃ）乃至図６（ｆ））では、応答曲面上の骨折スコアの値がカットオフ値１．０８を上回る部分があり、応答曲面の一部が閾値表示の下側から上側へと突出した骨折リスク陽性の予測領域が含まれていた。これらの三次元図に示された応答曲面での骨折スコア最高値の大きさに基づいて、推定される「新規骨折あり」リスク因子組み合わせの有用性を順位付けすると、１位（図６（ｃ））：低ＢＭＤ且つ高年齢（骨折スコア最高値５）、同点１位（図５（ｂ））：低ＢＭＤ且つ高身長（骨折スコア最高値５）、３位（図５（ａ））：低Ｃｒ且つ高ＢＡＰ（骨折スコア最高値約４）、同点３位（図６（ｆ））：低Ｃｒ且つ高年齢（骨折スコア最高値約４）、５位（図６（ｄ））：低Ｃｒ且つ高ＢＬＲ予測値（骨折スコア最高値約３）、同点５位（図６（ｅ））：低Ｃｒ且つ低ＦＲＡＸ結果（骨折スコア最高値約３）であった。これらの結果は、本願に係る発明者が事前に考えた前述のリスク因子１）乃至７）に関連しており、考えが正しかったことが示唆された。カットオフ値に対して、応答曲面上の骨折スコア最高値が高値である臨床データ項目の組み合わせほど（順位が上位のものほど）、新規症例でも、骨粗鬆症による新規骨折リスク因子として活用可能と推定された。

＜試験例２３＞
上述の試験例２２で述べたＰＣにおいて、試験例１－１に係る学習モデルに代えて試験例１９に係る学習モデルを使用した他は、試験例２２と同様にして被験者らの応答曲線を生成させ、第２軸（Ｘ軸）及び第３軸（Ｙ軸）として選定した被験者らの臨床データ項目の組み合わせがそれぞれ異なる三次元グラフを６６通り作成した。大半の三次元グラフでは、応答曲面上の骨折スコア最高値が、カットオフ値０．５３よりも低値であった。一方、幾つかの三次元グラフでは、応答曲面上の骨折スコア最高値がカットオフ値よりも高値で、応答曲面の一部に骨折（既存骨折数１）リスク陽性の推測領域が形成されていた。これら三次元図に示された応答曲面上の骨折スコア最高値の大きさに基づいて、推定される「既存骨折数１」リスク因子の組み合わせの有用性を順位付けすると、次の表１９に示す結果となった。順位が上位の組み合わせほど、骨粗鬆症による既存骨折数１のリスク因子として、有用と推定されたと考えられる。

＜試験例２４＞
特許文献２に記載された「第３期研究（実施例１－１）」で生成した学習モデル（以下「試験例２４に係る学習モデル」ともいう）に基づいて、応答曲面法により、川崎病（ＫＤ）合併症（冠動脈拡大病変：ＣＡＬ）発生のリスク因子の組み合わせを推定しようと試みた。なお、試験例２４に係る学習モデルは、以下の方法で作成した統計モデルである。

２００２年３月から２０１８年１２月に箕面市立病院でＫＤ急性期医療を受けた小児３１４名（男児１８５名、女児１２９名）を、被験者らとした。各被験者からは、ＫＤと診断され入院後の一次治療前及び一次治療中の診察時（第１診察時点）に、次の７種の臨床データを含む臨床情報が取得された。７種の臨床データは、性別、一次治療前の冠動脈径（直径）最大値（Ｚスコア）、一次治療前の月齢、一次治療前の血清中ＣＲＰ濃度、一次治療前のＬｏｇ尿中β２ＭＧ／Ｃｒ、一次治療前のＩＶＩＧ不応予測スコア（佐野スコア）得点、及び、一次治療中にＩＶＭＰ投与を受けた回数であった。また、各被験者からは、一次治療の処置を終えた直後から経過観察期間３０日以内の診察時（第２診察時点）に、次の合併症判定結果が取得された。合併症判定結果は、ＫＤ急性期医療担当医により、第２診察時点の冠動脈径最大値（直径、Ｚスコア）が３．０ＳＤ以上の場合に「ＣＡＬ発生あり」と判定され、３．０ＳＤ未満の場合に「ＣＡＬ発生なし」と判定された結果であった。７種の臨床データの各々と合併症判定結果とを合計８種の観測変数とし、合併症判定結果に係る観測変数に対して直接的に有意な因果関係が認められると仮定された潜在変数を設け、ＳＥＭによる平均共分散構造分析を行い、潜在変数の因子得点（合併症発生スコア）を算出させた。その上で、各被験者の正規化させた７種の臨床データを入力変数とし、各被験者の合併症発生スコア（潜在変数の因子得点）を出力変数とし、入力変数と出力変数との関係をＡＮＮに機械学習させた。この試験例２４において、パスモデルの標準化総合効果は０．７４１（ｐ＜０．００１）で、潜在変数から「合併症判定結果に係る観測変数」への直接的に有意な因果関係が認められた。ＲＯＣ解析による合併症発生スコアのカットオフ値は２．０であった。機械学習で生成された試験例２４に係る学習モデルでは、各被験者の合併症発生スコア（潜在変数の因子得点）と該学習モデルに出力させた各被験者の合併症発生スコア（予測値）との相関関係がＲ^２＝０．８９で、Ｃ統計量が０．８６０で、感度が７２．７％（８／１１）で、特異度が９９．１％（２３２／２３４）で、各被験者の第２診察時点でのＣＡＬ発生の有無を高精度に予測可能なことが示唆された（詳細は特許文献２参照）。

試験例２２で述べたＰＣで前述の統計解析ソフトウェアを使用し、上述の試験例２４に係る学習モデルに基づいて、応答曲面法により、被験者らの７種の臨床データ及び合併症判定結果を反映させた８次元の応答曲面を作成した。その上で、同じ統計解析ソフトウェアにより、第１軸（Ｚ軸）を被験者らの合併症発生スコア（潜在変数の因子得点）とし、第２軸（Ｘ軸）及び第３軸（Ｙ軸）の各々を被験者らの７種の臨床データから選択された１種の臨床データ項目として、多数の三次元グラフを作成した。作成したうちの大半の三次元グラフでは、応答曲面上の合併症発生スコア（潜在変数の因子得点）最大値が、閾値表示（カットオフ値２．０）を下回っていた。

一方、幾つかの三次元グラフでは、応答曲面上の合併症発生スコア最高値がカットオフ値よりも高値で、応答曲面の一部に合併症（冠動脈径最大値（Ｚスコア）３．０ＳＤ以上のＣＡＬ）発生リスク陽性の予測領域が形成されていた。これら三次元図に示された応答曲面の合併症発生スコア最高値の大きさに基づいて、合併症（Ｚスコア３．０ＳＤ以上のＣＡＬ）発生のリスク因子として推定される組み合わせ有用性を順位付けすると、有用性が高いものから順に、１位：「一次治療前の（正規化）血清中ＣＲＰ検査値」と「一次治療前の（正規化）尿中β２ＭＧ／Ｃｒ」との組み合わせ、２位：「一次治療前の（正規化）尿中β２ＭＧ／Ｃｒ」と「一次治療前の（正規化）ＩＶＩＧ不応スコア（佐野スコア）得点」との組み合わせ、３位：「一次治療前の冠動脈径最大値（Ｚスコア）」と「一次治療前の（正規化）尿中β２ＭＧ／Ｃｒ」との組み合わせ、４位：「一次治療前の冠動脈径最大値（Ｚスコア）」と「一次治療前の（正規化）血清中ＣＲＰ検査値」との組み合わせ、５位：「一次治療前の（正規化）血清中ＣＲＰ検査値」と「一次治療前の（正規化）ＩＶＩＧ不応スコア（佐野スコア）得点」との組み合わせであった。これらの組み合わせは、順位が上位の組み合わせほど、ＫＤ一時治療後の経過観察期間内での合併症（Ｚスコア３．０以上のＣＡＬ）発生のリスク因子として、有用と推定されたと考えられる。

上記順位が３位の三次元グラフを、図３４に示した。なお、一次治療前（第１診察時点）で既に冠動脈径最大値（Ｚスコア）３．０ＳＤ以上である場合は、一次治療前で既に「ＣＡＬ発生あり」との判定が確定し得るため、上記の順位付けで合併症発生のリスク因子として推定される候補から除外した。図３４において一次治療前の冠動脈径最大値（Ｚスコア）３．０ＳＤ未満の部分では、「一次治療前の冠動脈径最大値（Ｚスコア）が１．５ＳＤあたり」で且つ「一次治療前の尿中β２ＭＧ／Ｃｒ検査値が正規化していない状態で約６０ｍｇ／ｇＣｒ以上」である領域において、応答曲線の合併症発生スコア（潜在変数の因子得点）の値が閾値表示（カットオフ値２．０）を上回り、合併症発生リスク陽性の予測領域を形成し、ＫＤ合併症（ＣＡＬ）発生のリスク因子の組み合わせとして有用と推定されたと考えられる。

＜試験例２５＞
特許文献２に記載された「ＩｇＡＶにおいてＰＮで高度蛋白尿を伴う症例発生予測：実施例２－１」と比べて、被験者の人数を増やし、合併症発生の判定基準を「尿蛋白／Ｃｒ比が２．０以上」へと高める変更をした他は、同様にして試験例２５に係る学習モデルを生成した。具体的には、以下に説明する手法により生成した。

１９９６年１０月から２０２１年１０月に箕面市立病院でＩｇＡＶと診断され入院治療を受けた小児１４４名（男児７０名、女児７４名、平均年齢８．２歳）を、被験者らとした。各被験者からは、ＩｇＡＶと診断され入院後の初回治療前及び初回治療中の診察時（第１診察時点）に、次の６種の臨床データを含む臨床情報が取得された。６種の臨床データは、性別、初回治療前の月齢、初回治療前の血中ＦＤＰ・Ｄダイマー濃度、初回治療前の即時型アレルギー疾患の有無、初回治療前の腹痛の有無、及び、初回治療でのＰＳＬ経口投与の有無であった。初回治療の処置を終えた直後から経過観察期間約３０日を経た診察時（第２診察時点）に、一部の被験者らは担当医によりＰＮ発生と診断された。ＰＮ発生と診断された被験者らで尿化学検査を行い、尿蛋白／Ｃｒ比が２．０以上である場合に「ＰＮで高度蛋白尿を伴う症例が発生」と判定した。６種の臨床データの各々と合併症（ＰＮで高度蛋白尿を伴う症例発生の有無）判定結果とを合計７種の観測変数とし、合併症判定結果に係る観測変数に対して直接的に有意な因果関係が認められると仮定された潜在変数を設け、ＳＥＭによる平均共分散構造分析を行い、潜在変数の因子得点（合併症発生スコア）を算出させた。その上で、各被験者の正規化させた６種の臨床データを入力変数とし、各被験者の合併症発生スコア（潜在変数の因子得点）を出力変数とし、入力変数と出力変数との関係をＡＮＮに機械学習させた。この試験例２５では、パスモデルの標準化総合効果でｐ＜０．００１が示され、潜在変数から「合併症判定結果に係る観測変数」への直接的に有意な因果関係が認められた。機械学習で生成された試験例２５に係る学習モデルでは、各被験者の合併症発生スコア（潜在変数の因子得点）と該学習モデルに出力させた各被験者の合併症発生スコア（予測値）との相関関係を示すＲ^２値が高値で、Ｃ統計量が０．８７で、感度が８０．０％（４／５）で、特異度が９４．４％で、各被験者の第２診察時点においてＰＮで高度尿蛋白を伴う症例発生の有無を高精度に予測可能なことが示唆された（詳細は特許文献２参照）。

試験例２２で述べたＰＣで前述の統計解析ソフトウェアを使用し、上述の試験例２５に係る学習モデルに基づいて、応答曲面法により、被験者らの６種の臨床データ及び合併症判定結果を反映させた７次元の応答曲面を作成した。その上で、同じ統計解析ソフトウェアにより、第１軸（Ｚ軸）を被験者らの合併症発生スコア（潜在変数の因子得点）とし、第２軸（Ｘ軸）及び第３軸（Ｙ軸）の各々を被験者らの６種の臨床データから選択された１種の臨床データ項目として、多数の三次元グラフを作成した。多数を作成したうちの大半の三次元グラフでは、応答曲面上の合併症発生スコア（潜在変数の因子得点）最大値が、閾値表示（カットオフ値）を下回っていた。

一方、幾つかの三次元グラフでは、応答曲面上の合併症発生スコア最高値がカットオフ値よりも高値で、応答曲面の一部に合併症（ＰＮで尿蛋白／Ｃｒ比が２．０以上の高度蛋白尿を伴う症例）発生リスク陽性の予測領域が形成されていた。これら三次元グラフに示された応答曲面の合併症発生スコア最高値の大きさに基づいて、合併症（ＰＮで尿蛋白／Ｃｒ比が２．０以上の高度蛋白尿を伴う症例）発生のリスク因子として推定される組み合わせ有用性を順位付けすると、有用性が高いものから順に、１位：「初回治療前の（正規化）ＰＳＬ経口投与の有無」と「初回治療前の（正規化）腹痛の有無」との組み合わせ、２位：「初回治療前の（正規化）月齢」と「初回治療前の（正規化）ＦＤＰ・Ｄダイマー検査値」との組み合わせ、３位：「初回治療前の（正規化）ＦＤＰ・Ｄダイマー検査値」と「（正規化）性別が男性」との組み合わせであった。これらの組み合わせは、順位が上位の組み合わせほど、ＩｇＡＶ初回治療後の経過観察期間内での合併症（ＰＮ且つ尿蛋白／Ｃｒ比が２．０以上の高度蛋白尿を伴う症例）発生のリスク因子として、有用と推定されたと考えられる。

上記した順位が２位の三次元グラフを、図３５に示した。この三次元グラフでは、「初回治療前の（正規化）血中ＦＤＰ・Ｄダイマー高濃度」且つ「初回治療前の（正規化）高月齢」の部分で、応答曲線上の合併症発生スコア（潜在変数の因子得点）値が閾値表示（カットオフ値）を上回り、合併症発生リスク陽性の予測領域を形成していた。「初回治療前の（正規化）血中ＦＤＰ・Ｄダイマー高濃度」且つ「初回治療前の（正規化）高月齢」の組み合わせが、ＩｇＡＶ合併症（ＰＮで尿蛋白／Ｃｒ比が２．０以上の高度蛋白尿を伴う症例）発生のリスク因子の組み合わせとして、有用と推定されたと考えられる。

Ｓ１０ａ，Ｓ１０ｂ，Ｓ１０ｃ，Ｓ１０ｄ：骨粗鬆症による骨折の推測・予測方法、Ｓ１５ａ，Ｓ１５ｂ，Ｓ１５ｃ，Ｓ１５ｄ：骨折スコア出力方法、Ｓ２０ａ，Ｓ２０ｃ：学習モデル生成方法、Ｓ３０ａ，Ｓ３０ｃ：学習データセット作成方法、５０：ＡＮＮ、５２：入力層、５５：中間層、５８：出力層、６０ａ，６０ｃ：骨折推測・予測システム、６１ａ，６１ｃ：情報処理装置、６２ａ，６２ｃ：制御部、７０ａ，７０ｃ：記憶部、７２：骨折スコアを出力可能な学習モデル、７３：骨折学習データベース、７７：ＢＬＲ（予測値）を出力可能な学習モデル、７８：ＢＬＲ学習データベース、８１：少なくとも１つのユーザ端末、９０ａ，９０ｂ，９０ｃ，９０ｄ，９０ｅ，９０ｆ：三次元グラフ、９２ａ，９２ｂ，９２ｃ，９２ｄ，９２ｅ，９２ｆ：応答曲面、９５：閾値表示、９７：骨折リスク陰性の予測領域、９９：骨折リスク陽性の予測領域

Claims

閉経後である第１時点での骨粗鬆症による既存骨折の有無、前記第１時点での前記既存骨折の骨折数、前記第１時点を過ぎてから後の第２時点までの経過期間内での骨粗鬆症による新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた１種以上に関する骨折スコアを出力する方法であって、
前記骨折スコアを出力可能な学習モデルに対象者の前記第１時点での臨床情報を入力して前記対象者の前記骨折スコアを出力する処理を情報処理装置に実行させるステップを含み、
前記骨折スコアを出力可能な学習モデルは、前記第１時点での前記既存骨折の有無、前記第１時点での前記既存骨折の骨折数、前記経過期間内での前記新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた１種以上を判定された各被験者の前記第１時点での前記臨床情報を入力されると、前記各被験者の前記骨折スコアを出力するように機械学習したものであり、
前記第１時点での前記臨床情報は、年齢、身長、体重、ＢＭＩ、骨密度、骨代謝マーカー検査値、腎機能マーカー検査値、骨格筋量マーカー検査値、既存の身長低下、初経年齢、閉経年齢、閉経時から前記第１時点までの年数、前記経過期間の長さ、ＦＲＡＸ（登録商標）による骨折リスク評価結果、前記第２時点の骨密度予測値、前記経過期間内の骨量減少率予測値、及び、これらのいずれかを間接的に示すデータからなる群より選ばれる４種以上の臨床データを含み、
前記各被験者の前記骨折スコアは、前記判定の結果と、前記各被験者の前記４種以上の臨床データと、を含む５種以上の観測変数が設けられ共分散構造分析が行われる場合に、前記判定の結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータである、骨折スコア出力方法。
前記骨量減少率予測値は、骨量減少率を出力可能な学習モデルに前記第１時点での骨密度と前記第１時点での他の臨床情報とを入力して前記骨量減少率予測値を出力する処理を情報処理装置に実行させて出力される臨床データであり、
前記骨量減少率を出力可能な学習モデルは、前記第１時点と前記第２時点とで骨密度を計測された各被験者についての、前記第１時点での骨密度と、前記第１時点での前記他の臨床情報とを入力されると、前記第２時点での骨密度と、前記経過期間内での骨量減少率とを出力するように機械学習したものであり、
前記第１時点での前記他の臨床情報は、年齢、身長、体重、ＢＭＩ、体脂肪率、除脂肪体重、体脂肪量、初経年齢、閉経年齢、閉経時から前記第１時点までの年数、及び、これらのいずれかを間接的に示すデータから選ばれた１種以上の他の臨床データを含む、請求項１に記載された骨折スコア出力方法。
前記骨密度は、上腕骨近位部、橈骨遠位部、頚椎、胸椎、腰椎及び大腿骨近位部から選ばれた１箇所以上の身体部位における少なくとも一部の領域についてのものである、請求項１に記載された骨折スコア出力方法。
請求項１乃至請求項３のいずれか一項に記載された骨折スコア出力方法により前記対象者の前記骨折スコアを出力し、出力された前記対象者の前記骨折スコアと前記骨折スコアの閾値との比較結果に基づいて、前記対象者についての、前記第１時点での前記既存骨折の有無の推測結果、前記第１時点での前記既存骨折の骨折数の推測結果、前記経過期間内での前記新規骨折の有無の予測結果、及び、前記経過期間内での前記新規骨折の骨折数の予測結果から選ばれた１種以上に関する結果データを出力する処理を情報処理装置に実行させる、骨粗鬆症による骨折の推測及び予測の少なくとも一方の方法。
閉経後である第１時点での骨粗鬆症による既存骨折の有無、前記第１時点での前記既存骨折の骨折数、前記第１時点を過ぎてから後の第２時点までの経過期間内での骨粗鬆症による新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた１種以上を判定された各被験者の前記第１時点での臨床情報が入力されると前記各被験者の骨折スコアを出力する学習モデルを、機械学習により生成するステップを含み、
前記第１時点での前記臨床情報は、年齢、身長、体重、ＢＭＩ、骨密度、骨代謝マーカー検査値、腎機能マーカー検査値、骨格筋量マーカー検査値、既存の身長低下、初経年齢、閉経年齢、閉経時から前記第１時点までの年数、前記経過期間の長さ、ＦＲＡＸ（登録商標）による骨折リスク評価結果、前記第２時点の骨密度予測値、前記経過期間内の骨量減少率予測値、及び、これらのいずれかを間接的に示すデータから選ばれた４種以上の臨床データを含み、
前記各被験者の前記骨折スコアは、前記判定の結果と、前記４種以上の臨床データと、を含む５種以上の観測変数が設けられて共分散構造分析が行われる場合に、前記判定の結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータである、学習モデル生成方法。
閉経後である第１時点での骨粗鬆症による既存骨折の有無、前記第１時点での前記既存骨折の骨折数、前記第１時点を過ぎてから後の第２時点までの経過期間内での骨粗鬆症による新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた１種以上に関する骨折スコアを出力可能な学習モデルであって、
前記学習モデルは、前記第１時点での前記既存骨折の有無、前記第１時点での前記既存骨折の骨折数、前記経過期間内での前記新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた１種以上を判定された各被験者の前記第１時点での臨床情報が入力層に入力されると出力層が前記各被験者の前記骨折スコアを出力するように重み付け値が機械学習されたものであり、且つ、対象者の前記第１時点での前記臨床情報が前記入力層に入力される場合には前記対象者の前記臨床情報に対して前記重み付け値に基づく演算を行って前記出力層が前記対象者の前記骨折スコアを出力するように情報処理装置を機能させるものであり、
前記第１時点での前記臨床情報には、年齢、身長、体重、ＢＭＩ、骨密度、骨代謝マーカー検査値、腎機能マーカー検査値、骨格筋量マーカー検査値、既存の身長低下、初経年齢、閉経年齢、閉経時から前記第１時点までの年数、前記経過期間の長さ、ＦＲＡＸ（登録商標）による骨折リスク評価結果、前記第２時点の骨密度予測値、前記経過期間内の骨量減少率予測値、及び、これらのいずれかを間接的に示すデータから選ばれた４種以上の臨床データを含み、
前記各被験者の前記骨折スコアは、前記判定の結果と、前記各被験者の前記４種以上の臨床データと、を含む５種以上の観測変数が設けられて共分散構造分析が行われる場合に、前記判定の結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータである、学習モデル。
請求項６に記載された学習モデルに基づいて、応答曲面法により、前記各被験者を含む被験者らの前記臨床情報と前記被験者らの前記骨折スコアとの関係を示す応答曲面を生成し、生成される前記応答曲面に骨折リスク陽性領域が含まれている場合には、推定されるリスク因子を特定する処理を情報処理装置に実行させるステップを含み、
前記骨折リスク陽性領域は、前記学習モデルに基づいて、前記骨折スコアの値を示す第１軸と前記４種以上の臨床データから選択された１種の臨床データの値を示す第２軸とを有し且つ前記応答曲面と前記骨折スコアのカットオフ値との関係を示す二次元グラフ又は三次元グラフを作成する処理を情報処理装置に実行させる場合に、作成される前記二次元グラフ又は前記三次元グラフに含まれる前記応答曲面において前記骨折スコアの値が前記カットオフ値よりも高値となる部分の領域であり、
前記推定されるリスク因子は、少なくとも、前記第２軸における前記選択された１種の臨床データの値に関するものである、骨粗鬆症による骨折のリスク因子推定方法。
請求項６に記載された学習モデルに基づいて、応答曲面法により、前記各被験者を含む被験者らの前記臨床情報と前記被験者らの前記骨折スコアとの関係を示す応答曲面を生成し、生成される前記応答曲面と前記骨折スコアの閾値との関係を示すグラフのデータを生成する処理を情報処理装置に実行させるステップを含み、
前記グラフは、
前記骨折スコアの値を示す第１軸と、前記４種以上の臨床データから選択された１種の臨床データの値を示す第２軸と、前記応答曲面に関する表示と、前記骨折スコアの閾値に関する表示と、を含む二次元グラフである、又は、
前記第１軸と、前記第２軸と、前記４種以上の臨床データから選択された他の１種の臨床データの値を示す第３軸と、前記応答曲面に関する表示と、前記骨折スコアの閾値に関する表示と、を含む三次元グラフである、
グラフ作成方法。
前記対象者の前記第１時点での前記臨床情報を取得し、取得した該臨床情報を請求項６に記載された学習モデルに入力して前記対象者の前記骨折スコアを出力する処理を情報処理装置に実行させるプログラム。
前記学習モデルが記憶される記憶部と、
前記対象者の前記第１時点での前記臨床情報を取得した場合に、所得した該臨床情報を前記学習モデルに入力して前記対象者の前記骨折スコアを出力する処理を実行する演算部と、
を備える、請求項６に記載された学習モデルを有する情報処理装置。
学習モデルを生成する機械学習に用いる学習データセットの作成方法であって、
前記作成方法は、
閉経後である第１時点での骨粗鬆症による既存骨折の有無、前記第１時点での前記既存骨折の骨折数、前記第１時点を過ぎてから後の第２時点までの経過期間内での骨粗鬆症による新規骨折の有無、及び、前記経過期間内での前記新規骨折の骨折数から選ばれた１種以上を判定された各被験者の前記判定の結果と、
前記各被験者の、前記第１時点での年齢、前記第１時点での身長、前記第１時点での体重、前記第１時点でのＢＭＩ、前記第１時点での骨密度、前記第１時点での骨代謝マーカー検査値、前記第１時点での腎機能マーカー検査値、前記第１時点での骨格筋量マーカー検査値、前記第１時点で既存の身長低下、初経年齢、閉経年齢、閉経時から前記第１時点までの年数、前記経過期間の長さ、前記第１時点のＦＲＡＸ（登録商標）による骨折リスク評価結果、前記第１時点での前記第２時点の骨密度予測値、前記第１時点での前記経過期間内の骨量減少率予測値、及び、これらのいずれかを間接的に示すデータから選ばれた４種以上の臨床データと、
を含む５種以上の観測変数が設けられた条件下において、情報処理装置に共分散構造分析を行って前記判定の結果に係る観測変数に対して直接的に有意な因果関係が認められる潜在変数の因子得点に関するデータを取得する処理を実行させるステップを含み、
前記４種以上の臨床データ及び前記ステップで取得された前記潜在変数の因子得点に関するデータを含む前記学習データセットを作成する、学習データセット作成方法。