JP2024003782A - 統合失調スペクトラム障害に関する情報を提供するための診断支援システム、診断支援装置、診断支援方法、及び支援プログラム - Google Patents

統合失調スペクトラム障害に関する情報を提供するための診断支援システム、診断支援装置、診断支援方法、及び支援プログラム Download PDF

Info

Publication number
JP2024003782A
JP2024003782A JP2023103547A JP2023103547A JP2024003782A JP 2024003782 A JP2024003782 A JP 2024003782A JP 2023103547 A JP2023103547 A JP 2023103547A JP 2023103547 A JP2023103547 A JP 2023103547A JP 2024003782 A JP2024003782 A JP 2024003782A
Authority
JP
Japan
Prior art keywords
data
learning
classifier
group
subject
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023103547A
Other languages
English (en)
Inventor
孝彦 河島
Takahiko Kawashima
淳 宮田
Atsushi Miyata
俊哉 村井
Toshiya Murai
歩 山下
Ayumi Yamashita
光男 川人
Mitsuo Kawato
英彦 ▲高▼橋
Hidehiko Takahashi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ATR Advanced Telecommunications Research Institute International
Tokyo Medical and Dental University NUC
Kyoto University NUC
Original Assignee
ATR Advanced Telecommunications Research Institute International
Tokyo Medical and Dental University NUC
Kyoto University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ATR Advanced Telecommunications Research Institute International, Tokyo Medical and Dental University NUC, Kyoto University NUC filed Critical ATR Advanced Telecommunications Research Institute International
Publication of JP2024003782A publication Critical patent/JP2024003782A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Magnetic Resonance Imaging Apparatus (AREA)

Abstract

【課題】脳計測データから統合失調スペクトラム障害(以下、障害)の診断支援をする診断支援システム、装置、方法、プログラムを提供する。【解決手段】第1被検者の障害の情報を提供する診断支援システムであり、第2被検者よりなる学習対象群から得た脳機能的結合相関値を用いて、統合失調症の識別処理をする学習装置を備え、前記対象群は障害の診断ラベルを有する第1群と有さない第2群とを含み、前記識別学習装置は、前記第2被検者に関し前記識別処理をする演算装置を含み、前記演算装置は各前記第2被検者の複数の脳領野ペア間の脳機能的結合相関値に基づく特徴量を前記第1群と前記第2群から抽出したデータに関し、前記診断ラベルの有無を学習する教師あり学習を繰り返し、複数個の識別サブモデルを生成し、前記サブモデルの統合出力と、前記第1被検者の脳活動計測結果に基づいて当該第1被検者の統合失調症識別情報を出力する診断支援装置を備える。【選択図】図13

Description

本明細書には、統合失調スペクトラム障害に関する情報を提供するための診断支援システム、診断支援装置、診断支援方法、及び支援プログラムが開示される。
(バイオマーカー)
生体内の生物学的変化を定量的に把握するため、生体情報を数値化・定量化した指標のことを「バイオマーカー」と呼ぶ。
FDA(米国食品医薬品局)はバイオマーカーの位置づけを、「正常なプロセスや病的プロセス、あるいは治療に対する薬理学的な反応の指標として客観的に測定・評価される項目」としている。また疾患の状態や変化、治癒の程度を特徴づけるバイオマーカーは、新薬の臨床試験での有効性を確認するためのサロゲートマーカー(代用マーカー)として使われる。血糖値やコレステロール値などは、生活習慣病の指標として代表的なバイオマーカーである。尿や血液中に含まれる生体由来の物質だけでなく、心電図、血圧、PET画像、骨密度、肺機能なども含まれる。またゲノム解析やプロテオーム解析が進んできたことによって、DNAやRNA、生体蛋白等に関連したさまざまなバイオマーカーが見出されている。
バイオマーカーは、疾患にかかった後の治療効果の測定だけでなく、疾患を未然に防ぐための日常的な指標として疾患の予防に、さらに副作用を回避した有効な治療法を選択する個別化医療への応用が期待されている。
ただし、神経・精神疾患の場合、生化学的もしくは分子遺伝学的観点から客観的な指標として利用可能な分子マーカーなども研究されているものの、検討段階というべき状況である。
一方で、NIRS(Near-infraRed Spectroscopy)技術を用いて、生体光計測により計測されたヘモグロビン信号から特徴量に応じて、統合失調スペクトラム障害、うつ病などの精神疾患について分類を行う疾患判定システムなども報告がある(特許文献1)。
(脳活動に基づくバイオマーカー)
一方で、核磁気共鳴映像法(MRI:Magnetic Resonance Imaging)では、血流量の変化に応じて、検出される信号に変化が現れることを用いて、外部刺激等に対する脳の活動部位を視覚化することも可能である。このような核磁気共鳴映像法を、特に、fMRI(functional MRI)と呼ぶ。
fMRIでは、装置としては通常のMRI装置に、さらに、fMRI計測に必要なハードおよびソフトを装備したものが使用される。
ここで、血流量の変化がNMR信号強度に変化をもたらすのは、血液中の酸素化および脱酸素化ヘモグロビンは磁気的な性質が異なることを利用している。酸素化ヘモグロビンは反磁性体の性質があり、周りに存在する水の水素原子の緩和時間に影響を与えないのに対し、脱酸素化ヘモグロビンは常磁性体であり、周囲の磁場を変化させる。したがって、脳が刺激を受け、局部血流が増大し、酸素化ヘモグロビンが増加すると、その変化分をMRI信号として検出する事ができる。このような被検者への刺激は、たとえば、視覚による刺激や聴覚による刺激、あるいは所定の課題(タスク)の実行等が用いられる(たとえば、特許文献2)。
ここで、脳機能研究においては、微小静脈や毛細血管における赤血球中の脱酸素化ヘモグロビンの濃度が減少する現象(BOLD効果)に対応した水素原子の核磁気共鳴信号(MRI信号)の上昇を測定することによって脳の活動の測定が行われている。
このように、fMRI装置により計測される脳活動を反映した血中酸素濃度依存信号をBOLD信号(Blood Oxygen Level Dependent Signal)と呼ぶ。
特に、人の運動機能に関する研究では、被検者に何らかの運動を行わせつつ、上記MRI装置によって脳の活動を測定することが行われている。
ところで、ヒトの場合、非侵襲的な脳活動の計測が必要であり、この場合、fMRIデータから、より詳細な情報を抽出できるデコーディング技術が発達してきている(たとえば、非特許文献1)。特に、fMRIが脳におけるボクセル単位(volumetric pixel : voxel)で脳活動を解析することで、脳活動の空間的パターンから、刺激入力や認識状態を推定することが可能となっている。
さらに、このようなデコーディング技術を発展させた技術として、特許文献3には、神経・精神疾患に対して、脳機能画像法によるバイオマーカーを実現するための脳活動解析方法が開示されている。この方法では、健常群、患者群において測定された安静時機能的結合的MRIのデータから、それぞれの被検者について、所定の脳領域間の活動度の相関行列を導出する。被検者の疾患/健常ラベルを含む被検者の属性と相関行列とについて正則化正準相関解析により特徴抽出が行われる。正則化正準相関解析の結果に基づいて、スパースロジスティック回帰(Sparse Logistic Regression: SLR)による分類分析によりバイオマーカーとして機能する分類器が生成される。このような機械学習の技術により、安静時のfMRI データから導き出される脳領野間の結合にもとづいて神経疾患の診断結果を予測可能であることが示された。しかも、その予測性能の検証は1つの施設において計測された脳活動のみではなく、他の施設で計測された脳活動に対しても、ある程度の汎化が可能であることが示された。
さらに、このようなバイオマーカーについて、汎化性能を向上させるための技術改良もなされている(特許文献4)。
また、最近では、米国のヒューマンコネクトームプロジェクトのように、大規模な脳画像データを得て共有することは、基礎的な神経科学研究と、精神疾患の診断および治療のような臨床応用の間のギャップを埋めることにとって重要な意味を持つ、と認識されている (非特許文献2)。
2013年には、日本の国立研究開発法人 日本医療研究開発機構が、8つの研究所が2,239のサンプルおよび5つの疾患を含む複数サイトの安静時の機能的磁気共鳴(安静時の機能MRI)データを収集し、公にSRPBS(Strategic Research Program for Brain Sciences,https://www.amed.go.jp/program/list/01/04/001_nopro.html)の複数サイトの複数疾患のデータベース(https://bicr-resource.atr.jp/decnefpro/)を通じてそれらを共有するという、デコーディッドニューロフィードバック(DecNef)プロジェクトを組織した。このプロジェクトは、完全に独立したコホートに汎化することができる、いくつかの精神疾患の、安静時の機能的なコネクティビティ(安静時の機能的結合MRI)に基づくバイオマーカーを同定した。
ただし、大規模に脳画像データを収集することは、健常者についても、そして、特に、患者に対しては容易ではない。
さらに、大規模なデータ収集をするために、複数のサイトでの計測を実施すると、各計測サイトでの計測データのサイト間差が問題となる。
たとえば、複数の計測サイトで、MRI計測をした場合の計測データのサイト間差を評価するために、複数のサイトへ多数の参加者が移動しつつ測定を受けるという、いわゆる「トラベリングサブジェクト」を採用することにより、安静時の機能的なコネクティビティに対する測定バイアスの効果を調査するという試みも実施されている(非特許文献3、非特許文献4、非特許文献5)。
再表2006-132313号公報 特開2011-000184号公報 特開2015-62817号公報 特開2017-196523号公報 特開2020-062369号公報
Kamitani Y, Tong F. Decoding the visual and subjective contents of the human brain. Nat Neurosci. 2005; 8: 679-85. Glasser MF, et al. The Human Connectome Project's neuroimaging approach. Nat Neurosci 19, 1175-1187 (2016). Noble S, et al. Multisite reliability of MR-based functional connectivity. Neuroimage 146, 959-970 (2017). Pearlson G. Multisite collaborations and large databases in psychiatric neuroimaging advantages, problems, and challenges. Schizophr Bull 35, 1-2 (2009).
以上のように、機能的磁気共鳴画像法などの脳機能画像法による統合失調スペクトラム障害の治療への応用を考えた場合、たとえば、上述したようなバイオマーカーとして、脳機能画像法による脳活動の解析は、非侵襲的な機能マーカーとして、診断法の開発、根本治療を実現するための創薬に向けた標的分子の探索・同定などへの応用も期待される。
これまで、統合失調スペクトラム障害に対しては、遺伝子を用いた実用的なバイオマーカーの完成には至っておらず、それゆえに、薬物の効果判定などが困難であるため、治療薬の開発も困難であった。
脳活動の計測データに基づいて、機械学習により判別器を生成し、これをバイオマーカーとして実用化させるためには、1つの施設において計測された脳活動に対して機械学習により生成されたバイオマーカーの予測精度の向上が必要である。また、このようにして生成されたバイオマーカーが、他の施設において計測された脳活動に対しても、汎化可能であることが必要である。
すなわち、脳活動の計測データに基づく、機械学習により判別器を構築する際には、主な2つの課題が存在する。
第1の課題は、小標本サイズの問題である。
被験者の人数であるデータ量Nが、計測された脳活動計測データの次元Mよりはるかに小さいので、判別器のパラメータは、容易に訓練データに過剰適合することになる。
この過剰適合のために、構築された判別器は、新しくサンプリングされたテストデータについては、非常に貧弱なパフォーマンスを示すことになる。これは、これらのテストデータは判別器を訓練するのに使用されていないものだからである。
したがって、判別器の望ましい汎化に対して本質的な特徴量だけを識別し利用するために正則化を適切に導入する必要がある。
第2の課題は、構築された判別器が、訓練データが集められたサイトとは異なる撮像サイトで走査されたMRIデータに対しても、よいパフォーマンスを維持する場合のみ、判別器が臨床的に有用で、科学的に信頼できるということである。
これは撮像サイトにわたる、いわゆる汎化能力である。
統合失調スペクトラム障害と関連する大規模な脳画像データを集める際には、脳画像は、1つのサイトで取得できるデータの量には制限があるため、複数のサイトから取得する必要がある。しかしながら、複数サイトでの脳画像データを取得する場合、サイト間差は最も大きな障壁となる。
すなわち、臨床応用では、異なるサイトで走査されたデータに、特定のサイトで取得したデータを使用して訓練された判別器を汎化することができないことはしばしば観測され
ている。
このため、上述したヒューマンコネクトームプロジェクトでは、これまでのところ、単一サイトで、単一のスキャナを用いた計測を行うこととされている。
この発明は、上記のような問題点を解決するためになされたものであって、その目的は、複数施設から取得された脳計測データに基づいて、各施設における測定バイアスを調整および補正することが可能な機能的結合相関値の調整方法、機能的結合相関値の調整システムを提供することである。
この発明は、他の目的は、複数施設から取得された脳計測データをハーモナイズして、統合失調スペクトラム障害に対しての診断を支援するための診断支援システム、診断支援装置、診断支援方法、及び支援プログラムを提供することである。
本発明のある実施形態は、第1の被検者の脳活動の計測結果に基づいて、前記第1の被検者についての統合失調スペクトラム障害に関する情報を提供するための診断支援システムに関する。前記システムは、年齢が所定の範囲に分布する第2の被検者よりなる学習対象群から取得した脳機能的結合相関値の計測結果に対して、統合失調症の識別処理を実行するための識別学習装置を備える。前記学習対象群は、統合失調スペクトラム障害の診断ラベルを有する第1の群と前記統合失調スペクトラム障害の診断ラベルを有さない第2の群とを含む。前記識別学習装置は、前記複数の第2の被検者について、前記識別処理を実行するための演算装置と記憶装置とを含む。前記演算装置は、分類器の生成処理において、i)各前記複数の第2の被検者について、所定の複数の脳領野ペア間の脳活動の時間相関をそれぞれ表す複数の脳機能的結合相関値に基づく特徴量を前記記憶装置に格納し、ii)前記記憶装置に格納された前記特徴量のうちから、所定数の第2の被検者についてのデータを前記1の群と前記第2の群とで年齢がマッチングするようにサブサンプリングし、サブサンプリングされたデータに基づいて、教師あり機械学習で前記診断ラベルの有無を学習する第1の処理を、複数回繰り返して、複数個の識別サブモデルをそれぞれ生成し、iii)前記複数個の識別サブモデルからの出力を統合して出力する分類器を生成する第2の処理を実行する。前記診断支援システムは、前記第1の被検者の脳活動の計測結果のデータを入力として前記分類器からの出力に基づいて、当該第1の被検者について、統合失調症に対する識別情報を診断支援情報として出力する診断支援装置を、備える。
本発明のある実施形態は、第1の被検者の脳活動の計測結果に基づいて、前記第1の被検者についての統合失調スペクトラム障害に関する情報を提供するための診断支援装置に関する。前記診断支援装置は、年齢が所定の範囲に分布する複数の第2の被検者よりなる学習対象群から取得した脳機能的結合相関値の計測結果に対して、統合失調症の識別処理を実行するための識別学習装置と通信可能に接続され、前記学習対象群は、統合失調スペクトラム障害の診断ラベルを有する第1の群と前記統合失調スペクトラム障害の診断ラベルを有さない第2の群とを含み、前記識別学習装置は、前記複数の第2の被検者について、前記識別処理を実行するための演算装置と記憶装置とを含む。前記演算装置は、分類器の生成処理において、i)各前記複数の第2の被検者について、所定の複数の脳領野ペア間の脳活動の時間相関をそれぞれ表す複数の脳機能的結合相関値に基づく特徴量を前記記憶装置に格納し、ii)前記記憶装置に格納された前記特徴量のうちから、所定数の第2の被検者についてのデータを前記第1の群と前記第2の群とで年齢がマッチングするようにサブサンプリングし、サブサンプリングされたデータに基づいて、教師あり機械学習で前記診断ラベルの有無を学習する第1の処理を、複数回繰り返して、複数個の識別サブモデルをそれぞれ生成し、iv)前記複数個の識別サブモデルからの出力を統合して出力する分類器を生成する第2の処理を実行する。前記診断支援装置は、前記第1の被検者の脳活動の計測結果のデータを入力として前記分類器からの出力に基づいて、当該第1の被検者について、統合失調症に対する識別情報を診断支援情報として出力する。
本発明のある実施形態は、第1の被検者の脳活動の計測結果に基づいて、前記第1の被検者についての統合失調スペクトラム障害に関する情報を提供するための診断支援方法に関する。前記診断支援方法は、第1の被検者の脳活動の計測結果のデータを入力として、分類器からの出力に基づいて、当該第1の被検者について、統合失調症に対する識別情報を診断支援情報として出力することを含む。前記分類器は、年齢が所定の範囲に分布する複数の第2の被検者よりなる学習対象群であって、統合失調スペクトラム障害の診断ラベルを有する第1の群と前記統合失調スペクトラム障害の診断ラベルを有さない第2の群とを含む学習対象群から取得した脳機能的結合相関値の計測結果に対して、統合失調症の識別処理を実行するための機械学習であって、各前記複数の第2の被検者について、所定の複数の脳領野ペア間の脳活動の時間相関をそれぞれ表す複数の脳機能的結合相関値に基づく特徴量のうちから、所定数の第2の被検者についてのデータを前記第1の群と前記第2の群とで年齢がマッチングするようにサブサンプリングし、サブサンプリングされたデータに基づいて、教師あり機械学習で前記診断ラベルの有無を学習する第1の処理を、複数回繰り返して、複数個の識別サブモデルをそれぞれ生成することを含む識別学習処理と、前記複数個の識別サブモデルからの出力を統合して出力する分類器を生成する第2の処理によって生成される。
本発明のある実施形態は、第1の被検者についての統合失調スペクトラム障害に関する情報を提供するための診断支援プログラムに関する。前記診断支援プログラムは、コンピュータに実行させたときに、コンピュータに、前記第1の被検者の脳活動の計測結果のデータを入力として、分類器からの出力に基づいて、当該第1の被検者について、統合失調症に対する識別情報を診断支援情報として出力するステップを実行させる。前記分類器は、年齢が所定の範囲に分布する複数の第2の被検者よりなる学習対象群であって、統合失調スペクトラム障害の診断ラベルを有する第1の群と前記統合失調スペクトラム障害の診断ラベルを有さない第2の群とを含む学習対象群から取得した脳機能的結合相関値の計測結果に対して、統合失調症の識別処理を実行するための機械学習であって、各前記複数の第2の被検者について、所定の複数の脳領野ペア間の脳活動の時間相関をそれぞれ表す複数の脳機能的結合相関値に基づく特徴量のうちから、所定数の第2の被検者についてのデータを前記1の群と前記第2の群とで年齢がマッチングするようにサブサンプリングし、サブサンプリングされたデータに基づいて、教師あり機械学習で前記診断ラベルの有無を学習する第1の処理を、複数回繰り返して、複数個の識別サブモデルをそれぞれ生成することを含む識別学習処理と、前記複数個の識別サブモデルからの出力を統合して出力する分類器を生成する第2の処理によって生成される。
好ましくは、前記演算装置は、前記第1の処理において、サブサンプリングされたデータに基づいて、教師あり機械学習で前記診断ラベルの有無を学習する処理を、それぞれ異なる複数種類の機械学習モデルについて、複数回繰り返して、前記複数種類の異なる機械学習モデルごとに識別の確率を出力する複数個の識別サブモデルをそれぞれ生成し、前記第2の処理において、前記複数種類の異なる機械学習モデルごとに前記複数個の識別サブモデルからの出力の識別の確率を平均し、さらに、前記複数種類の機械学習モデルについて平均したものを出力するように前記分類器を生成する。
好ましくは、前記特徴量選択を伴う機械学習法は、正則化ロジスティック回帰法である。
好ましくは、前記第1の群に属する前記第2の被検者の各々には、統合失調症の特定の症候の程度を表すスコア情報が関連づいており、前記記憶装置は、前記スコア情報を格納しており、前記演算装置は、前記第1の処理において、教師あり機械学習として、特徴量選択を伴う機械学習法を実行して、前記複数個の識別器モデルを学習する処理において選択される前記特徴量の重要度に応じて、複数の上位特徴量を選択し、前記選択された上位特徴量に基づいて、機械学習により、前記スコア情報を予測するスコア予測モデルを生成し、前記診断支援装置は、前記スコア予測モデルの出力を、前記診断支援情報として出力する。好ましくは、前記スコア情報は、PDI(ピーターズ妄想質問紙)スコアである。
好ましくは、前記演算装置は、前記スコア予測モデルの機械学習として、複数種類の異なる機械学習モデルによるアンサンブル学習を実行する。より好ましくは、前記複数種類の機械学習モデルが、正則化ロジスティック回帰、ランダムフォレスト、ライト勾配ブースティングマシン、サポートベクターマシン、及びパーセプトロンである。
ここで、第1の被検者は、統合失調スペクトラム障害に関する情報の提供を要する者である。
この発明によれば、複数の施設で計測される脳の活動の計測データに対して、統合失調スペクトラム障害について、脳機能画像法による脳活動バイオマーカシステム、脳活動バイオマーカシステムのプログラムを実現することが可能となる。
複数の計測サイトに設置されたMRI計測システムにより計測されたデータについて、ハーモナイゼーション処理を説明するための概念図である。 被検者の脳の関心領域(ROI:Region of Interest)について、安静時の機能的結合の相関を示す相関行列を抽出する手続きを示す概念図である。 「測定パラメータ」および「被検者属性データ」の内容の例を示す概念図である。 各計測サイトに設置されるMRI装置100.i(1≦i≦Ns)の全体構成を示す模式図である。 データ処理部32のハードウェアブロック図である。 本実施の形態のrs-fcMRI法において、サイト間を移動しながら計測を受ける移動被検者によるサイト間差の評価手法を説明するための概念図である。 相関行列から、バイオマーカーとなる分類器を生成する過程を説明する概念図である。 ハーモナイゼーション処理、分類器生成処理、分類処理を実行する識別学習装置300の構成を説明するための機能ブロック図である。 ハーモナイゼーション処理、分類器生成処理、分類処理を実行する識別学習装置300の構成をより詳しく説明するための機能ブロック図である。 ハーモナイゼーション処理を説明するためのフローチャートである。 分類処理部3000が、被検者に対する疾患あるいは健常ラベルについての分類器を生成する処理を示すフローチャートである。 ハーモナイゼーション処理が実行された後に、新たな計測サイトが追加された場合のハーモナイゼーション処理を説明するための概念図である。 実施の形態1の概要を説明するための概念図である。(a)分類器生成過程の概要を示す。(b)予測処理の概要を示す。 データ収集、推定処理および対象者の脳活動計測を、分散して処理する場合の一例を示す機能ブロック図である。 分類器を生成するための機械学習の手続きを説明するためのフローチャートである。 SSD診断に寄与する脳の機能的結合を示す。 SSD診断に寄与する脳の機能的結合を示す。 SSD診断に寄与する脳の機能的結合を示す。 SSD診断に寄与する脳の機能的結合を示す。 分類器を用いたSSDの診断支援処理の流れを示すフローチャートである。 データ収集、推定処理および対象者の脳活動計測を、分散して処理する場合の一例を示す機能ブロック図である。 機械学習モデルに対するアンサンブル学習処理の流れを示す。 機械学習モデルに対するアンサンブル学習処理の流れを示す。 アンサンブル分類モデルを用いたSSDの診断支援処理の流れを示すフローチャートである。 データ収集、推定処理および対象者の脳活動計測を、分散して処理する場合の一例を示す機能ブロック図である。 実施の形態3に係るスコア予測モデルの構築方法の概要を説明するための概念図である。(a)は、説明変数として使用する機能的結合に順位付けを行う工程を示す概念図である。(b)は、説明変数として使用する上位特徴量(機能的結合)の数を変えて症状スコア予測モデルを構築し、最良のモデルを選択する工程を示す概念図である。 機械学習モデルに対するアンサンブル学習処理の流れを示す。 スコア予測モデルを使用し症状のスコアを予測する際の処理の流れを示す。 学習用のデータセットのデモグラフィック特性を示す。 学習用のデータセットのデモグラフィック特性を示す。 には、各計測サイトにおける撮像プロトコルを示す。 には、各計測サイトにおける撮像プロトコルを示す。 には、SSD診断に寄与する機能的結合の脳内分布と、出現頻度を示す。 正則化ロジスティック回帰分類器の分類精度を示す。図29(a)はDiscovery datasetについて予測を行った結果を示す。図29(b)はIndependent datasetについて予測を行った結果を示す。 アンサンブル分類モデルの分類精度を示す。図30(a)はDiscovery datasetについて予測を行った結果を示す。図30(b)はIndependent datasetについて予測を行った結果を示す。 アンサンブル学習モデルのスコア予測精度を示す。図31(a)はDiscovery datasetについて予測を行った結果を示す。図31(b)はIndependent datasetについて予測を行った結果を示す。 線形回帰モデルのスコア予測精度を示す。図32(a)はDiscovery datasetについて予測を行った結果を示す。図32(b)はIndependent datasetについて予測を行った結果を示す。 線形回帰モデルにてPDI totalスコアを予測した際に、説明変数として用いた機能的結合の数と、Independent datasetでの予測性能を示す。黒く塗りつぶされたセルは、MAE又はrが有意水準P<0.05を満たしているセルを示す。
以下、本発明の実施の形態のMRI計測システムの構成について、図に従って説明する。なお、以下の実施の形態において、同じ符号を付した構成要素および処理工程は、同一または相当するものであり、必要でない場合は、その説明は繰り返さない。
また、本実施の形態では、複数の施設に設置された「脳活動計測装置」、より具体的には、「MRI計測システム」によって、脳の複数の領野間の脳活動を時系列で計測し、これらの領野間の時間相関のパターンに基づいて、被検者を分類するものとして本発明を説明する。
そして、このような「MRI計測システム」が、複数の異なる施設に設置されており、後述するように、これらの計測施設(計測サイト)間での計測に対するサイト間差を、測定機器を原因とする測定バイアスと、計測サイトにおける被検者のポピュレーションによる差(標本バイアス)とを独立に評価する。その上で、各計測サイトにおける計測値について、測定バイアスの効果を除いてサイト間差を補正する処理を実施することで、計測サイト間での測定結果に対する調和処理(ハーモナイゼーション)を実現する。
[実施の形態1]
図1は、複数の計測サイトに設置されたMRI計測システムにより計測されたデータについて、ハーモナイゼーション処理を説明するための概念図である。
図1を参照して、計測サイトMS.1~MS.Ns(Ns:サイト数)には、それぞれ、MRI装置100.1~100.Nsが設置されているものとする。
また、計測サイトMS.1~MS.Nsにおいては、それぞれ、被検者群PA.1~PA.Nsの計測が行われる。被検者群PA.1~PA.Nsの各々には、少なくとも2つ以上に分類される群、たとえば、患者群と健常群とが含まれるものとする。また、患者群としては、特に限定されないが、たとえば、精神疾患の患者、より特定的には、「統合失調スペクトラム障害」の群が相当するものとする。
そして、各計測サイトにおいては、原則として、MRI装置の仕様上、可能な範囲で、統一した計測プロトコルで被検者の計測が実施されるものとする。
ここで、特に限定されないが、計測プロトコルとしては、たとえば、以下のような内容が規定されているものとする。
1)頭部のスキャンを実行する方向
たとえば、頭部の後側(posterior:以下、“P”と略記する)から前側(anterior:以下、“A”と略記する)に向かう方向(以下、「P→A方向」と呼ぶ)と、逆の方向、すなわち、前側から後側に向かう方向(以下、「A→P方向」と呼ぶ)にスキャンを行うのかを規定する必要がある。状況によっては、両方の場合のスキャンを行うことを規定することもあり得る。
MRI装置によって、デフォルトの方向が違っていたり、あるいは、両方を任意に設定できない場合もあり得る。
スキャンの方向は、たとえば、画像としての「ひずみ方」を規定する可能性があり、プロトコルとして、条件を設定する。
2)脳構造画像の撮像条件
いわゆるスピンエコー法により、「T1強調画像」や「T2強調画像」のいずれか、または両方を撮像する条件を設定する。
3)脳機能画像の撮像条件
fMRI(functional Magnetic Resonance Imaging)法により、「安静時」の被検者の脳機能画像を撮像する条件を設定する。
4)拡散強調画像の撮像条件
拡散強調画像(DWI:diffusion (weighted) image)を撮像するか否か、そしてその条件について設定する。
拡散強調画像とは、MRI撮像のシーケンスの一種で、水分子の拡散運動を画像化したものである。通常用いられるスピンエコー法のパルス系列では拡散による信号の減衰は無視できるが、大きな傾斜磁場が長時間にわたって印加されると、その間の各磁化ベクトルの移動によって生じる位相のずれが無視できなくなり、拡散が活発な領域ほど低信号として現れる、ことを利用するものである。
5)EPI歪みを画像処理で補正するための撮像
たとえば、EPI歪みを画像処理で補正するための1つの方法として、「フィールドマップ法」が知られており、空間歪みの補正に対する撮像の条件を設定する。
フィールドマップ法は、多重エコー時間によってEPI画像を収集し、これらのEPI画像に基づいてEPI歪みの量を算出する。フィールドマップ法を適用して、新規の画像
に含まれるEPI歪みを補正することができる。異なるエコー時間による同一の解剖学的構造の一組の画像を前提として、EPI歪みを計算して、画像の歪みを補正することが可能である。
たとえば、以下の公知文献に、「フィールドマップ法」が開示されている。
公知文献:特開2015-112474号明細書
なお、計測プロトコルには、上記の条件の中から適宜、必要となるシーケンス部分を抜き出してもよいし、必要に応じて、他のシーケンスやその条件を追加してもよい。
再び、図1を参照して、各計測サイトMS.1~MS.Nsにおいて、計測を行う被検者として採用することを、「サンプリングする」と呼び、各計測サイトでのサンプリングの偏りにより生じる、計測値のサイト間差の原因を、「標本バイアス」と呼ぶ。
たとえば、上述した例では、従来の診断基準で、「統合失調スペクトラム障害」と診断される患者には、実は、いくつかのサブタイプが含まれることが知られている。
また、「健常群」と呼ばれる被検者の群であっても、その中には、複数のサブタイプが存在することが一般であり、その点では、「健常群」においても、「標本バイアス」が存在することになる。
また、MRI装置100.1~100.Nsも、各計測サイトで決して同一計測特性を有するMRI装置が使用されているとは言えない。
たとえば、MRI装置の製造メーカ、MRI装置の型番、MRI装置の静磁場強度、MRI装置における(送)受信コイルのコイル数(チャンネル数)、等々、MRI装置の条件、MRI装置の計測条件などの測定条件に応じて、計測データのサイト間差異が生じうる。このような測定条件により生じるサイト間差異のことを「測定バイアス」と呼ぶ。
仮に、同一のMRI装置の製造メーカの同一の型番のMRI装置であっても、装置の固有な個性により、完全に同一の計測特性を実現するとも、必ずしも言えない。
ここで、(送)受信コイルは、計測される信号のSN比を向上させることを目的として、「マルチアレイコイル」が採用されることが一般的である。「受信コイルのコイル数」とは、マルチアレイコイルを構成する「エレメントコイル」の個数を指す。個々のエレメントコイルの感度を高め,この出力を束ねることで受信感度の向上を図るものである。
そして、後に説明するような手法により、本実施の形態では、「標本バイアス」と「測定バイアス」とを独立に評価することを可能とする。
再び、図1を参照して、各計測サイトMS.1~MS.Nsのそれぞれからの計測関連データDA100.1~DA100.Nsは、データセンター200内の記憶装置210
に集積され、格納される。
ここで、「計測関連データ」には、各計測サイトでの「測定パラメータ」と、各計測サイトにおいて計測された「患者群データ」および「健常群データ」とが含まれる。
さらに、「患者群データ」および「健常群データ」には、それぞれ、各々の被検者に対応して「患者のMRI計測データ」および「健常者のMRI計測データ」とが含まれる。
以下では、このような「計測関連データ」について説明する。
図2は、被検者の脳の関心領域(ROI:Region of Interest)について、安静時の機能的結合の相関を示す相関行列を抽出する手続きを示す概念図である。
ここで、図1において、「患者群データ」および「健常群データ」における、「患者のMRI計測データ」および「健常者のMRI計測データ」には、少なくとも、以下のようなデータが含まれる。
i)相関行列のデータを算出するための時系列の「脳機能画像データ」、および/または、相関行列のデータ自身
すなわち、図1における識別学習装置300が、記憶装置210内に格納されたデータに基づいて、後述するような脳活動バイオマーカーを算出する際の基礎となるデータとして、これらのデータが使用される。
ここで、相関行列のデータについては、時系列の「脳機能画像データ」に基づいて、各計測サイトで計算された後に、記憶装置210内に格納され、識別学習装置300が、この記憶装置210内の相関行列のデータに基づいて、脳活動バイオマーカーを算出する、という構成とすることができる。
あるいは、時系列の「脳機能画像データ」が記憶装置210内に格納され、識別学習装置300が、この記憶装置210内の「脳機能画像データ」に基づいて、相関行例のデータを算出し、さらに、脳活動バイオマーカーを算出する、という構成とすることも可能である。
したがって、「患者のMRI計測データ」および「健常者のMRI計測データ」の各々については、少なくとも、相関行列のデータを算出するための時系列の「脳機能画像データ」、および、相関行列のデータ自身のいずれか一方が含まれることになる。
ii)被検者の構造画像データ、および、拡散強調画像データ
なお、特に限定されないが、EPI歪みを画像処理で補正する処理については、各計測サイトで演算処理がされた後に、記憶装置210内にデータが格納される構成とすることができる。
また、特に、限定されないが、個人情報保護の観点から、記憶装置210内へデータが格納される前に、各計測サイトにおいて、匿名加工処理を実行する構成とすることが可能である。ただし、匿名加工処理については、識別学習装置300を運営する主体が、法規制上、個人情報を扱うことが認められている場合は、識別学習装置300において実行する構成としてもよい。
図2に戻って、図2(a)に示すように、リアルタイムで測定した安静時のfMRIのn個(n:自然数)の時刻分のfMRIデータから、各関心領域の平均的な「活動度」を算出し、図2(b)に示すように、脳領域間(関心領域間)の機能的なコネクティビティ
(「活動度の相関値」)の相関行列を算出する。
機能的なコネクティビティは、各参加者に対して2つの脳領域間の安静時の機能MRIの血中酸素濃度に依存する(BOLD)信号の時間的な相関性として計算される。
ここで、関心領域としては、上述したようにNc領域を考えているので、相関行列における独立な非対角成分は、対称性を考慮すると、
Nc×(Nc-1)/2(個)
ということになる(「×」は乗算、「-」は減算、「/」は除算を示す)。
関心領域の設定の方法としては、以下のような方法が想定される。
方法1)“解剖学的な脳領野に基づいて、関心領域を定義する。”
ここでは、脳活動バイオマーカーのために、たとえば、関心領域として140の領域を採用する。
つまり、この方法では、ROIについては、Brain Sulci Atlas (BAL)に含まれる137のROIに加え、 Automated Anatomical Labeling Atlas の小脳(左右)及び虫部のROIを用いる。これら合計140のROI間の機能的結合を特徴量として用いる。
ここで、Brain Sulci Atlas (BAL)およびAutomated Anatomical Labeling Atlasについては、以下に開示がある。
公知文献:Perrot et al., Med Image Anal, 15(4), 2011
公知文献:Tzourio-Mazoyer et al., Neuroimage, 15(1), 2002
このような関心領域としては、たとえば、以下のような領域である。
背内側前頭前皮質(DMPFC)
前頭前野腹内側部(VMPFC)
前帯状皮質(ACC)
小脳虫部、
左視床、
右下頭頂葉、
右尾状核、
右中後頭葉、
右中帯状皮質
ただし、採用する脳の領野は、このような領域に限定されるものではない。
たとえば、対象とする神経・精神疾患に応じて、選択する領域を変更してもよい。
方法2) “機能的なコネクティビティを、全体の脳をカバーする機能的な脳地図の脳領域に基づいて、定義する。”
ここで、このような機能的な脳地図の脳領域については、以下のような文献にも開示がされており、特に限定されないが、たとえば、268のノード(脳領域)から成る、という構成とすることができる。
公知文献:Noble S, et al. Multisite reliability of MR-based functional connectivity. Neuroimage 146,959-970 (2017).
公知文献:Finn ES, et al. Functional connectome fingerprinting: identifying individuals using patterns of brain connectivity. Nat Neurosci 18, 1664-1671 (2015).
公知文献:Rosenberg MD, et al. A neuromarker of sustained attention from whole-brain functional connectivity. Nat Neurosci 19, 165-171 (2016).
公知文献:Shen X, Tokoglu F, Papademetris X, Constable RT. Groupwise whole-brain parcellation from resting-state fMRI data for network node identification. Neuroimage 82, 403-415 (2013).
以下では、「方法2」の機能的な脳地図の脳領域に基づいて機能的なコネクティビティを定義する方法を用いるものとして説明する。
たとえば、タンジェント法や部分相関法のような機能的なコネクティビティの計測に対するいくつかの候補がある。
しかしながら、以下では、ピアソンの相関係数を使用する。
前処理されたBOLD信号の可能なノード組の各々の時間経過の間についてのフィッシャーのz変換後のピアソンの相関係数が計算され、要素がそれぞれ2つのノード間のコネクティビティの強度を表わす、379×379の対照的な結合マトリックスを構築するために使用される。
この場合、結合マトリックスの下三角行列の71,631個(つまり、[379×(379-1)/2])の結合強度(コネクティビティ)の値が使用されることになる。
このような相関行列の要素の算出については、特に限定されないが、たとえば、以下のように実行することが可能である。
安静時脳活動データから、各被検者について、異なる関心領域(Region of interest、 ROI)間の機能的結合(Functional connectivity, FC)を計算する。FCは安静時脳活動解析において一般的に利用される特徴量であり、異なるROIの時系列信号間のピアソンの相関係数により定義される。
まず、各ROIに含まれる全ボクセルの平均信号の時系列を抽出する。
特に限定されないが、安静時の機能MRIデータは、以下のような前処理が実施される。データの最初の10秒間は、T1平衡を考慮に入れるために廃棄される。前処理ステップは、スライスタイミングの校正、リアラインメント、T1強調による構造画像による区画化、モントリオール神経学研究所(MNI)空間への規格化、および6mmの半値全幅の等方性のガウスカーネルによる空間スムージングを含んでいる。
相関行列(コネクティビティマトリックス)の分析については、ROIは、最大に類似するボクセルをクラスター化するために開発された上述したような379個ノードの灰白質地図によって記述される。BOLD信号の時間的経過は、これらの379個のROIから抽出される。スプーリアス変化のいくつかを除去するために、6つの運動パラメータ、全脳上の平均信号、白質および脳脊髄液のような12の回帰パラメータによる線形回帰を使用する。微分係数と二次の項もすべてのパラメータに対して含まれる。
バンドパスフィルタは、低周波の変動に分析を制限するために、0.01Hzと0.08Hzの間の通過帯域を備えた第1オーダーのバターワース・フィルタを使用して、時系列に適用される。
回帰後の残差系列を機能的結合と関連する時系列信号値と考え、異なるROIの時系列間でピアソンの相関係数を計算する。
図3は、「測定パラメータ」および「被検者属性データ」の内容の例を示す概念図である。
「被検者属性データ」は、図1における「患者群データ」または「健常群データ」において、「患者のMRI計測データ」および「健常者のMRI計測データ」に、それぞれ関連づけて格納されているものとする。
図3(a)に示すように、「測定パラメータ」は、計測サイトを識別するためのサイトIDと、サイト名と、測定パラメータを識別するための条件IDと、計測装置に関する情報と、計測条件に関する情報とを含む。
「測定パラメータ」は、「計測装置に関する情報」と「計測条件に関する情報」とを含む。
「計測装置に関する情報」には、各計測サイトにおいて被検者の脳活動を計測するためのMRI装置のメーカ名と、型番と、(送)受信コイル数とを含む。
なお、「計測装置に関する情報」は、これらのものに限られず、たとえば、静磁場強度、シム調整後の磁場の均一性、等々の他の計測装置の性能を表す指標などを含んでいてもよい。
「計測条件に関する情報」には、画像再構成時の位相エンコードの方向(P→AまたはA→P)、画像種類(T1強調、T2強調、拡散強調など)、撮像シーケンス(スピンエコーなど)、撮像中の被検者の開眼/閉眼、等々の情報が含まれる。
「計測条件に関する情報」も、これらのものに限られるものではない。
図3(b)に示されるように、「被検者属性データ」は、被検者の識別ができないように仮名制御した被検者仮ID,その被検者を計測した際の測定条件を表す条件ID、被検者の属性情報とを含む。
そして、「被検者の属性情報」としては、被検者の性別、年齢、健常または疾患のいずれかを示すラベル、医師による被検者の診断病名、被検者への投薬履歴、診断履歴などの情報が含まれる。
なお、「被検者の属性情報」は、必要に応じて、たとえば、計測サイトにおいて、匿名加工処理が行われているものとする。
たとえば、年齢や性別などについては、準識別子(同一属性)のデータがk件以上になるようにデータを変換するなどの処理を行うことで、個人が特定される確率をk分の1以下に低減し特定を困難にする「k-匿名性」を維持するように加工することができる。ここで、「準識別子」とは、「年齢」「性別」「居住地」など単体では特定できないが、組み合わせることで個人の特定が可能になる属性をいう。
また、投薬履歴や診断履歴は、日付のランダム化やシフト化など、必要に応じて、匿名化のための処理を行う。
そして、以下では、「患者のMRI計測データ」および「健常者のMRI計測データ」で、上述した方法で、各被検者の脳領野間の各々について経時的な活動の相関として算出される機能的結合のことを、各領野間について総称して「機能的なコネクティビティConnectivity」と呼ぶことにする。脳領野ごとに、機能的なコネクティビティを区別する必要がある場合は、後述するように、下添え字を付加して区別するものとする。
(MRI装置の構成)
図4は、各計測サイトに設置されるMRI装置100.i(1≦i≦Ns)の全体構成を示す模式図である。
図4においては、1番目の計測サイトのMRI装置100.1を、例示的に、詳しく説明している。他のMRI装置100.2~100.Nsについても、基本的な構成は同様である。
図4に示すように、MRI装置100.1は、被検者2の関心領域に制御された磁場を付与してRF波を照射する磁場印加機構11と、この被検者2からの応答波(NMR信号)を受信してアナログ信号を出力する受信コイル20と、この被検者2に付与される磁場を制御するとともにRF波の送受信を制御する駆動部21と、この駆動部21の制御シーケンスを設定するとともに各種データ信号を処理して画像を生成するデータ処理部32とを備える。
なお、ここで、被検者2が載置される円筒形状のボアの中心軸をZ軸にとりZ軸と直交する水平方向にX軸及び鉛直方向にY軸を定義する。
MRI装置100.1は、このような構成であるので、磁場印加機構11により印加される静磁場により、被検者2を構成する原子核の核スピンは、磁場方向(Z軸)に配向するとともに、この原子核に固有のラーモア周波数でこの磁場方向を軸とする歳差運動を行う。
そして、このラーモア周波数と同じRFパルスを照射すると、原子は共鳴しエネルギーを吸収して励起され、核磁気共鳴現象(NMR現象;Nuclear Magnetic Resonance)が生じる。この共鳴の後に、RFパルス照射を停止すると、原子はエネルギーを放出して元の定常状態に戻る緩和過程で、ラーモア周波数と同じ周波数の電磁波(NMR信号)を出力する。
この出力されたNMR信号を被検者2からの応答波として受信コイル20で受信し、データ処理部32において、被検者2の関心領域が画像化される。
磁場印加機構11は、静磁場発生コイル12と、傾斜磁場発生コイル14と、RF照射部16と、被検者2をボア中に載置する寝台18とを備える。
被検者2は、寝台18に、たとえば、仰臥する。被検者2は、特に限定されないが、たとえば、プリズムメガネ4により、Z軸に対して垂直に設置されたディスプレイ6に表示される画面を見ることができる。このディスプレイ6の画像により、必要に応じて、被検者2に視覚刺激が与えることもできる。なお、被検者2への視覚刺激は、被検者2の目前にプロジェクタにより画像が投影される構成であってもよい。
このような視覚刺激は、被検者にニューロフィードバックを行う場合は、フィードバック情報の提示に相当する。
駆動部21は、静磁場電源22と、傾斜磁場電源24と、信号送信部26と、信号受信部28と、寝台18をZ軸方向の任意位置に移動させる寝台駆動部30とを備える。
データ処理部32は、操作者(図示省略)から各種操作や情報入力を受け付ける入力部40と、被検者2の関心領域に関する各種画像及び各種情報を画面表示する表示部38と、各種処理を実行させるプログラム・制御パラメータ・画像データ(構造画像等)及びその他の電子データを記憶する記憶部36と、駆動部21を駆動させる制御シーケンスを発生させるなどの各機能部の動作を制御する制御部42と、駆動部21との間で各種信号の送受信を実行するインタフェース部44と、関心領域に由来する一群のNMR信号からなるデータを収集するデータ収集部46と、このNMR信号のデータに基づいて画像を形成する画像処理部48と、ネットワークとの間で通信を実行するためのネットワークインタフェース部50を備える。
また、データ処理部32は、専用コンピュータである場合の他、各機能部を動作させる機能を実行する汎用コンピュータであって、記憶部36にインストールされたプログラムに基づいて、指定された演算やデータ処理や制御シーケンスの発生をさせるものである場合も含まれる。以下では、データ処理部32は、汎用コンピュータであるものとして説明する。
静磁場発生コイル12は、Z軸周りに巻回される螺旋コイルに静磁場電源22から供給される電流を流して誘導磁場を発生させ、ボアにZ軸方向の静磁場を発生させるものである。このボアに形成される静磁場の均一性の高い領域に被検者2の関心領域を設定することになる。ここで、静磁場コイル12は、より詳しくは、たとえば、4個の空芯コイルから構成され、その組み合わせで内部に均一な磁界を作り、被検者2の体内の所定の原子核、より特定的には水素原子核のスピンに配向性を与える。
傾斜磁場発生コイル14は、Xコイル、Yコイル及びZコイル(図示省略)から構成され、円筒形状を示す静磁場発生コイル12の内周面に設けられる。
なお、傾斜磁場の均一性を向上させるためにシムコイル(図示せず)が設けられ、「シム調整」が実施される。
これらXコイル、Yコイル及びZコイルは、それぞれX軸方向、Y軸方向及びZ軸方向を順番に切り替えながら、ボア内の均一磁場に対し傾斜磁場を重畳させ、静磁場に強度勾配を付与する。Zコイルは励起時に、磁界強度をZ方向に傾斜させて共鳴面を限定し、Yコイルは、Z方向の磁界印加の直後に短時間の傾斜を加えて検出信号にY座標に比例した位相変調を加え(位相エンコーディング)、Xコイルは、続いてデータ採取時に傾斜を加えて、検出信号にX座標に比例した周波数変調を与える(周波数エンコーディング)。
この重畳される傾斜磁場の切り替えは、制御シーケンスに従って、Xコイル、Yコイル及びZコイルにそれぞれ異なるパルス信号が送信部24から出力されることにより実現される。これにより、NMR現象が発現する被検者2の位置を特定することができ、被検者2の画像を形成するのに必要な三次元座標上の位置情報が与えられる。
ここで、上述のように、3組の直交する傾斜磁場を用いて、それぞれにスライス方向、位相エンコード方向、および周波数エンコード方向を割り当ててその組み合わせにより様々な角度から撮影を行える。たとえば、一般にX線CT装置で撮像されるものと同じ方向のトランスバーススライスに加えて、それと直交するサジタルスライスやコロナルスライス、更には面と垂直な方向が3組の直交する傾斜磁場の軸と平行でないオブリークスライス等について撮像することができる。
RF照射部16は、制御シーケンスに従って信号送信部33から送信される高周波信号に基づいて、被検者2の関心領域にRF(Radio Frequency)パルスを照射するものである。
なお、RF照射部16は、図1において、磁場印加機構11に内蔵されているが、寝台18に設けられたり、あるいは、受信コイル20と一体化されて、送受信コイル20として構成されていてもよい。
受信コイル20は、被検者2からの応答波(NMR信号)を検出するものであって、このNMR信号を高感度で検出するために、被検者2に近接して配置されている。
ここで、受信コイル20には、NMR信号の電磁波がそのコイル素線を切ると電磁誘導に基づき微弱電流が生じる。この微弱電流は、信号受信部28において増幅され、さらにアナログ信号からデジタル信号に変換されデータ処理部32に送られる。
(送)受信コイル20については、上述の通り、SN比の向上のためにマルチアレイコイルが使用される。
すなわち、静磁界にZ軸傾斜磁界を加えた状態にある被検者2に、共鳴周波数の高周波電磁界を、RF照射部16を通じて印加すると、磁界の強さが共鳴条件になっている部分の所定の原子核、たとえば、水素原子核が、選択的に励起されて共鳴し始める。共鳴条件に合致した部分(たとえば、被検者2の所定の厚さの断層)にある所定の原子核が励起され、(古典的な描像では)スピンがいっせいに回転する。励起パルスを止めると、受信コイル20には、今度は、回転しているスピンが放射する電磁波が信号を誘起し、しばらくの間、この信号が検出される。この信号によって、被検者2の体内の、所定の原子を含んだ組織を観察する。そして、信号の発信位置を知るために、XとYの傾斜磁界を加えて信号を検知する、という構成になっている。
画像処理部48は、記憶部36に構築されているデータに基づき、励起信号を繰り返し与えつつ検出信号を測定し、1回目のフーリエ変換計算により、共鳴の周波数をX座標に還元し、2回目のフーリエ変換でY座標を復元して画像を得て、表示部38に対応する画像を表示する。
たとえば、このようなMRIシステムにより、上述したBOLD信号をリアルタイムで撮像し、制御部42により、時系列に撮像される画像について、後に説明するような解析処理を行うことで、安静時機能的結合的MRI(rs-fcMRI)の撮像を行うことが可能となる。
図4においては、MRI装置100.1および他の計測サイトにおけるMRI装置100.2~100.Nsからの計測データ、測定パラメータ、被検者属性データが、データセンター200内の通信インタフェース202を介して記憶装置210に集積され、格納される。さらに、識別学習装置300は、通信インタフェース204を介して、記憶装置210内のデータにアクセスする構成となっている。
図5は、データ処理部32のハードウェアブロック図である。
データ処理部32のハードウェアとしては、上述のとおり、特に限定されないが、汎用コンピュータを使用することが可能である。
図5において、データ処理部32のコンピュータ本体2010は、メモリドライブ2020、ディスクドライブ2030に加えて、演算装置(CPU)2040と、ディスクドライブ2030及びメモリドライブ2020に接続されたバス2050と、ブートアップ
プログラム等のプログラムを記憶するためのROM2060とに接続され、アプリケーションプログラムの命令を一時的に記憶するとともに一時記憶空間を提供するためのRAM2070と、アプリケーションプログラム、システムプログラム、およびデータを記憶するための不揮発性記憶装置2080と、通信インタフェース2090とを含む。通信インタフェース2090は、駆動部21等と信号の授受を行うためのインタフェース部44および図示しないネットワークを介して他のコンピュータと通信するためのネットワークインタフェース50に相当する。なお、不揮発性記憶装置2080としては、ハードディスク(HDD)やソリッドステートドライブ(SSD:Solid State Drive)などを使用することが可能である。不揮発性記憶装置2080が、記憶部36に相当する。
CPU2040が、プログラムに基づいて実行する演算処理により、データ処理部32の各機能、たとえば、制御部42、データ収集部46、画像処理部48の各機能が実現される。
データ処理部32に、上述した実施の形態の機能を実行させるプログラムは、CD-ROM2200、またはメモリ媒体2210に記憶されて、ディスクドライブ2030またはメモリドライブ2020に挿入され、さらに不揮発性記憶装置2080に転送されても良い。プログラムは実行の際にRAM2070にロードされる。
データ処理部32は、さらに、入力装置としてのキーボード2100およびマウス2110と、出力装置としてのディスプレイ2120とを備える。キーボード2100およびマウス2110が入力部40に相当し、ディスプレイ2120が表示部38に相当する。
上述したようなデータ処理部32として機能するためのプログラムは、コンピュータ本体2010に、情報処理装置等の機能を実行させるオペレーティングシステム(OS)は、必ずしも含まなくても良い。プログラムは、制御された態様で適切な機能(モジュール)を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいれば良い。データ処理部32がどのように動作するかは周知であり、詳細な説明は省略する。
また、上記プログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。
また、識別学習装置300内のハードウェアも、演算処理装置が並列化されていたり、GPGPU(General-purpose computing on graphics processing units)が使用される等の構成上の相違はあり得るものの、基本的な構成は、図5に示したものと同様である。
(脳活動バイオマーカーのハーモナイゼーション)
精神疾患と関連したビッグデータを収集するときには、1つのサイトが大規模な脳画像データ(人間の疾患と関係するコネクトーム)を集めることが、ほとんど不可能であるので、複数のサイトから画像データを収集することが必要である。
MRI装置(スキャナ)の型、プロトコルおよび患者層を完全に制御するのは難しい。したがって、収集したデータを解析するには、異種条件下で撮像された脳画像データが用いられる。
特に、疾患要因はサイト要因と交絡する傾向があるので、そのような異種条件下のデータに機械学習技術を適用することで疾患要因を抽出する場合、サイト間差は最も大きな障壁となる。
1つのサイト(あるいは病院)は、ほんの少数のタイプの精神疾患(例えば、サイトA
からは主として統合失調スペクトラム障害、およびサイトBからは主として自閉症)をサンプリングしがちであるので、交絡が生じることになる。
適切にそのような異種条件下のデータを管理するために、サイト間のデータをハーモナイズ(調和)させることが必要である。
サイト間差は、本質的に2つのタイプのバイアスを含んでいる。
技術的なバイアス(つまり測定バイアス)および生物学的なバイアス(つまり標本バイアス)である。
測定バイアスは、撮像パラメータ、電界の強さ、MRI装置メーカおよびスキャナの型のようなMRIスキャナの特性の違いを含んでおり、標本バイアスは、サイト間の被検者のグループの相違に関連している。
以下では、標本バイアスとは独立に、測定バイアスと評価して計測データをハーモナイズするための手法について説明する。
ハーモナイゼーションは、トラベリングサブジェクト法により行う。
(トラベリングサブジェクト法のハーモナイゼーション)
図6は、本実施の形態のrs-fcMRI法において、サイト間を移動しながら計測を受ける移動被検者(以下、「トラベリングサブジェクト」)によるサイト間差の評価手法を説明するための概念図である。
トラベリングサブジェクト法は、トラベリングサブジェクトのデータセットを使用して、測定バイアスだけを除くことができるようなハーモナイゼーション法について説明する。
図6を参照して、計測サイトMS.1~Ms.Nsのサイトを横断して測定バイアスを評価するために、トラベリングサブジェクトTS1(人数:Nts人)のデータセットを取得する。
健康なNts人の参加者の安静時脳活動が、Ns個のサイトの各々で撮像されるものとして、Ns個のサイトは、患者データを撮像したすべてのサイトを含んでいるものとする。
取得されたトラベリングサブジェクトのデータセットは、データセンター200における記憶装置210に移動被検者データとして格納される。
そして、特開2020-062369号公報、及び公知文献山下に記載の方法に従って、識別学習装置300において、「脳活動バイオマーカーのハーモナイズ方法」のための処理が実行される。
図7は、図2で説明したような相関行列から、バイオマーカーとなる分類器を生成する過程を説明する概念図である。
図7に示すように、健常群、患者群において測定された安静時機能的結合的MRIのデータから、それぞれの被検者について、識別学習装置300が、脳領域間(関心領域間)の活動度の相関行列を導出する。
続いて、相関行列の非対角成分について、後述するようにして、対応する測定バイアスを導出しておき、その測定バイアスを相関行例の要素の値から減算することで、ハーモナイゼーション処理を実行する。
さらに、ハーモナイゼーション処理が行われた相関行列の要素値と、各被検者についての診断ラベル(統合失調スペクトラム障害の診断ラベルあるいは健常ラベル)との間で、過学習を抑制する正則化処理を行いながら、特徴選択を伴う回帰処理を行い、分類器を生成する。
図8および図9は、データセンター200の記憶装置210に格納されたデータに基づき、ハーモナイゼーション処理、分類器生成処理、分類処理を実行する識別学習装置300の構成を説明するための機能ブロック図である。
図5においても説明したように、識別学習装置300は、図5に示した構成と同等のハードウェア構成を有する。そこで、以下では、識別学習装置300内のハードウェア部分については、図5中の対応する符号に“´”を付して説明することにする。
図8を参照して、識別学習装置300は、記憶装置210からのデータおよび計算途中で生成されるデータを格納するための記憶装置2080´と、記憶装置2080´内のデータに対して、演算処理を実行する演算装置2040´とを含む。演算装置2040´としては、たとえば、CPUが相当する。
演算装置2040´は、プログラムの実行により、患者群および健常群のMRI測定データ3102について相関行列の要素を算出し、相関行列データ3106として、記憶装置2080´に格納するための相関行列算出部3002と、ハーモナイゼーション処理を実行するハーモナイゼーション算出部3020と、ハーモナイゼーション処理の結果に基づいて、分類器の生成処理および生成された分類器による分類処理を実行する分類処理部3000とを含む。
図9は、図8の構成をより詳しく説明する機能ブロック図であり、図10は、ハーモナイゼーション処理を説明するためのフローチャートである。
図9および図10を参照して、まず、データセンター200の記憶装置210には、各計測サイトから被検者(健常者および患者)のfMRI計測データ、被検者の属性データ、測定パラメータが収集される(図10 S102)。
続いて、トラベリングサブジェクトTS1の脳活動が、特に限定されないが、たとえば、所定の周期(たとえば、1年周期)で、各計測サイトを巡回して計測され、データセンター200の記憶装置210には、各計測サイトからトラベリングサブジェクトのfMRI計測データ、被検者の属性データ、測定パラメータが収集される(図10 S104)。
ハーモナイゼーション算出部3020は、上述したようなGLMM(一般化線形混合モデル)を用いることで、機能的コネクティビティについて、各計測サイトの測定バイアスを評価する(図10 S106)。
このようにして算出された各計測サイトの測定バイアスを、ハーモナイゼーション算出部3020は、記憶装置2080に測定バイアスデータ3108として格納する(図10 S108)。
(分類器生成処理)
図11は、図9に示した分類処理部3000が、被検者に対する疾患あるいは健常ラベルについての分類器を生成する処理を示すフローチャートである。
このような分類器は、被検者を診断するための補助情報(支援情報)を提供する。
図9および図11を参照して、相関値補正処理部3004は、記憶装置2080´に格納されている計測サイトごとの測定バイアスデータ3108を読出し(図11 S202)、分類器生成の機械学習のための訓練対象となる各被検者の相関行列の非対角成分について、以下の式のようにして、ハーモナイゼーション処理を実行する。
Figure 2024003782000002
ここで、機能的コネクティビティConnectivityは、ハーモナイゼーション前の機能的コネクティビティベクトルを表し、Csubは、ハーモナイゼーション後の機能的コネクティビティベクトルを表す。また、m(ハット)(以下、文字xの頭部に^が付されたものを“x(ハット)”と表記する)は、上述したようなL2正則化による最小二乗回帰により評価された計測サイトにおける測定バイアスを表す。これにより、機能的コネクティビティConnectivityが計測された計測サイトに対応する測定バイアスが、機能的コネクティビティConnectivityから減算され、ハーモナイゼーション処理を受けることになる(図11 S204)。補正処理が実行された後のデータは、補正後相関値データ3110として、記憶装置2080´に格納される。
なお、以下の文献にも記載されるように、疾患要因は、脳全体のコネクティビティに関係しているわけではなく、コネクティビティの特定の部分集合に関係している、と仮定する。
公知文献:Yahata N, et al. A small number of abnormal brain connections predicts adult autism spectrum disorder. Nat Commun 7, 11254 (2016).
そこで、続いて、分類器生成部3008により、被検者についての疾患名又は健常ラベルを含む被検者の診断ラベルと紐付けられた補正処理後の機能的なコネクティビティとを使用して、特徴選択のための正則化ロジスティック回帰を実行して分類器を生成する(図11 S206)。
まず、ロジスティック関数は、参加者が疾患クラスに属する確率を以下のように定義するために使用される。
Figure 2024003782000003
ここで、ysubは、参加者のクラスラベル(診断ラベルが「疾患」のときには、y=1であり、診断ラベルが「健常者」のときには、y=0)であり、wは、重みベクトルを表す。
正則化ロジスティック回帰としては、L1正則化によるLASSO(least absolute shrinkage and selection operator)を使用するロジスティックスの回帰分析を実施することができ、上述したような、71,631個の結合の中から、機能的なコネクティビティの最適な部分集合を選択する。
すなわち、ここで、重みベクトルwは、以下の関数Jを最小化するように決定される。
Figure 2024003782000004
ここで、nsubは、分類器を生成するための被検者数であり、λは、評価に適用される縮小量を制御するハイパーパラメータを表わす。
なお、過学習を抑制して、特徴選択とモデル化を実行するための手法としては、LASSOによる正則化ロジスティック回帰に限定されるものではなく、たとえば、以下の文献に開示されるようなスパースロジスティック回帰や、他のスパースベイズ推定法など、他の手法を使用してもよい。
公知文献:Okito Yamashita, Masa aki Sato, Taku Yoshioka, Frank Tong, and Yukiyasu Kamitani. “Sparse Estimation automatically selects voxels relevant for the decoding of fMRI activity patterns.” NeuroImage, Vol. 42, No. 4, pp. 1414-1
429, 2008.
以上により、疾患に対する分類器(脳活動バイオマーカーの分類器として機能する)が生成され、分類器生成部3008は、分類器を特定するための情報を記憶装置2080´に、分類器データ3112として格納する(図11 S208)。
なお、たとえば、分類器の分類性能は、トレーニングデータを使用して、交差検証の手続きによって評価することとすることができる。
以上のような処理は、上述したように、特に限定されないが、所定の期間(たとえば、1年)ごとに実施されるものとしてよい。
そして、いずれかの計測サイトに、新たに1人の被検者についての機能的コネクティビティの計測が実行された場合、当該計測サイトの測定バイアスは、所定期間の間は一定と仮定できるので、分類器出力値算出部3010は、入力される当該被検者についての入力データの相関行列の要素の値から、上述した手続きですでに算出されている当該入力データが計測された計測サイトに対応する「測定バイアス」を減算することにより、ハーモナイゼーション処理を実行する。そして、上述した手続きにより、すでに図11の手続きで作成されている「分類器」により、当該被検者についての分類ラベルを分類結果として出力する。
分類結果は、「SSD」「健常」の二者のいずれかを示す値であってもよいし、あるいは、「疾患」「健常」の少なくとも一方の確率を示す値であってもよい。
なお、分類器出力値算出部3010が実施する分類処理に際して、入力される「入力データ」としては、被検者の脳機能活動を表すMRI計測データそのものであってもよいし、あるいは、各計測サイトにおいて被検者の脳機能活動を表すMRI計測データから相関行列の値を計算した後の相関行列の非対角要素である相関値そのもののデータであってもよい。
(新たな計測サイトが追加された場合のハーモナイゼーション算出処理)
図12は、図6において説明したような手続きにより、ハーモナイゼーション処理が実行された後に、新たな計測サイトが追加された場合のハーモナイゼーション処理を説明するための概念図である。
図12を参照して、(Ns+1)個目の計測サイトMS.Ns+1が新たに加わった場合、改めて、トラベリングサブジェクトTS1を、また、この(Ns+1)個の計測サイト全体について、巡回させ、上述したハーモナイゼーション算出処理と同様の手続きを行い、測定バイアスを改めて算出することが可能である。
特開2020-062369号公報、及び公知文献山下に記載の方法に従って処理を実行するシステムにより、複数の施設で計測される脳の活動の計測データに対して、各施設における測定バイアスを調整および補正することが可能である。これにより、複数の施設での計測データに基づく、脳機能的結合相関値を調整することが可能となる。
また、特開2020-062369号公報、及び公知文献山下に記載の方法に従って処理を実行するシステムによれば、複数の施設で計測される脳の活動の計測データをハーモナイズして、健常または疾患の状態を客観的に判断するためのデータを提供することが可能な脳活動分類器のハーモナイズ方法、脳活動分類器のハーモナイズシステム、脳活動解析システムおよび脳活動解析方法を実現することができる。
あるいは、特開2020-062369号公報、及び公知文献山下に記載の方法に従って処理を実行するシステムによれば、複数の施設で計測される脳の活動の計測データに対して、神経・精神疾患について、脳機能画像法によるバイオマーカー装置、バイオマーカー装置のプログラムを実現することが可能となる。
(被検者の年齢を考慮した分類器生成処理)
上記(分類器生成処理)では、ハーモナイゼーション処理、及び分類器生成処理の概要を説明した。しかし、統合失調スペクトラム障害に関する情報を提供する場合、年齢によるROIsの違いや、機能的結合の強度の違いが生じる可能性もある。そこで、できる限り年齢による影響を防ぐため分類器を生成する際に、年齢を考慮して行うことが好ましい。
本実施形態では、被検者の年齢を考慮した分類器を生成する態様について説明する。
図13は、本実施形態の概要を示す図である。図13(a)は、分類器生成処理の概要を示す。分類器を生成するにあたり、健常群、患者群において測定された安静時機能的結合的MRIのデータから、それぞれの被検者について、識別学習装置300が、脳領域間(関心領域間)の活動度の相関行列を導出した後に、学習用データをサブサンプリングする(図13(a)でHCおよびSSDと表記したデータ)。このサブサンプリングにおいては、脳領域間(関心領域間)の活動度の相関行列に対応する健常者又は患者の年齢層に応じて、識別学習装置300が導出した脳領域間(関心領域間)の活動度の相関行列のデータセットに対して、各年齢層のサンプル数が一致するように、アンダーサンプリングを行う。図13(a)においては、例示的に10回のサブサンプリングおよびアンダーサンプリングを行い、それぞれのデータを用いて教師あり学習法により機械学習アルゴリズムで分類器の学習を実施する。各サブサンプリング後の学習用データの一部のデータを検証データとして用いてハイパーパラメータの調整をするために、サブサンプリング後の学習用データで学習した分類器(「分類器サブモデル」という)の各々の学習においては、それぞれ、たとえば、10回反復交差検証を行い、ハイパーパラメータの調整を行う。
図13の例では、「テストデータ」と「トレーニングデータ」を設定して、10回反復交差検証を行い、かつ、各交差検証のループ内でサブサンプリングを10回行うことで、合計100個の分類器を生成している。
なお、ここでは、「年齢層」とは、たとえば、10歳ごとに、10代、20代、30代、…というような区分でもよいし、他の所定の年齢の間隔で分けた層であってもよい。図13の処理においては、学習用にサブサンプルしたHCのデータおよびSSDのデータにおいて、各年齢層のデータ数が一致するように、アンダーサンプリングを実施するものとしている。
図14は、データ収集、推定処理および対象者の脳活動計測を、分散して処理する場合の一例を示す機能ブロック図である。
図14を参照して、サイト100.1~100.Nは、患者群、健常群のデータを脳活動計測装置により計測する施設であり、管理サーバ200´は、サイト100.1~100.Nsからの計測データを管理する。
識別学習装置300は、サーバ200´に格納されたデータから分類器を生成する。
また、識別学習装置300のハーモナイゼーション算出部3020は、サイト100.1~100.NsおよびMRI計測装置410のサイトを含めて、ハーモナイゼーシ
ョン処理を実行するものとする。
MRI装置410は、識別学習装置300上の分類器の結果を利用する別サイトに設けられており、特定の被検者について脳活動のデータを計測する。
コンピュータ400は、診断補助装置として機能し、MRI装置410が設けられる別サイトに設置され、MRI装置410の測定データから特定被検者の脳の機能的結合の相関データを算出し、機能的結合の相関データを識別学習装置300に送信して、返信されてくる分類器の結果を利用する。
サーバ200´は、サイト100.1~100.Nsから送信されてくる患者群および健常群のMRI測定データ3102と、MRI測定データ3102に関連付けられた被検者の属性情報3104とを格納し、識別学習装置300からのアクセスに従って、これらのデータを識別学習装置300に送信する。
識別学習装置300は、通信インタフェース2090を介して、サーバ200からのMRI測定データ3102および被検者の属性情報3104を受信する。
なお、サーバ200´、識別学習装置300、コンピュータ400のハードウェアの構成は、基本的に、図5で説明した「データ処理部32」の構成と同様であるので、その説明は繰り返さない。
図14に戻って、相関行列算出部3002、相関値補正処理部3004、分類器生成部3008および分類器出力値算出部3010、ならびに、機能的結合の相関行列データ3106、測定バイアスデータ3108、補正後相関値データ3110および分類器データ3112については、上記において説明したのと同様であるので、その説明は、繰り返さない。
MRI装置410は、診断ラベルの推定対象となる被検者の脳活動データを計測し、コンピュータ400の処理装置4040は、計測されたMRI測定データ4102を不揮発性記憶装置4100に格納する。
さらに、コンピュータ400の処理装置4040は、MRI測定データ4102に基づいて、相関行列算出部3002と同様にして、機能的結合の相関行列のデータ4106を算出し、不揮発性記憶装置4100に格納する。
コンピュータ400のユーザから診断の対象となる疾患が指定され、当該ユーザの送信の指示に従い、コンピュータ400が、機能的結合の相関行列のデータ4106を識別学習装置300に送信する。これに応じて、識別学習装置300は、MRI装置410の設置されるサイトに対応したハーモナイゼーション処理を実行して、分類器出力値算出部3010は、指定された診断ラベルについての分類結果を算出し、識別学習装置300は、通信インタフェース2090を介して、コンピュータ400に送信する。
コンピュータ400では、図示しない表示装置などを介して、ユーザに対して、分類結果を知らせる。
このような構成とすることで、より多くの被検者について収集したデータに基づいて、分類器による診断ラベルの推定結果を提供することが可能となる。
また、サーバ200と識別学習装置300とを別個の管理者が管理する形態とすることも可能で、その場合、サーバ200にアクセスできるコンピュータを制限することで、サーバ200に格納される被検者の情報のセキュリティを向上させることも可能となる。
さらに、識別学習装置300の運営主体からみると、「分類器による分類のサービスを受ける側(コンピュータ400)」に対して、分類器についての情報や「測定バイアス」に関する情報は、一切提供しなくても、「分類結果を提供するサービス」を行うことが可能となる。
なお、以上の実施の形態1および実施の形態2の説明では、脳機能画像法により脳活動を時系列に計測するための脳活動検出装置としては、リアルタイムfMRIを用いるものとして説明した。ただし、脳活動検出装置として、上述したfMRI、脳磁計、近赤外光計測装置(NIRS)、脳波計、またはこれらの組み合わせを使用することができる。たとえば、これらの組合せを用いる場合、fMRIとNIRSとは、脳内の血流変化に関連する信号を検出するものであり、高空間分解能である。一方で、脳磁計や脳波計は、脳活動に伴う電磁場の変化を検出するための高時間分解能であるという特徴をもつ。したがって、たとえば、fMRIと脳磁計とを組み合わせれば、空間的にも時間的にも高分解能で脳活動を計測することができる。あるいは、NIRSと脳波計とを組み合わせても、同様に空間的にも時間的にも高分解能で脳活動を計測するシステムを小型で携帯可能な大きさで構成することも可能である。
以上のような構成により、神経・精神疾患に対して、脳機能画像法によるバイオマーカーとして機能する脳活動解析装置および脳活動解析方法を実現することが可能となる。
また、以上の説明では、被検者の属性として「診断ラベル」を含んだ場合について、正則化ロジスティック回帰による分類器の生成により、当該分類器をバイオマーカーとして機能させる例について説明したが、本発明は、必ずしもこのような場合に限定されず、事前に機械学習の対象となる測定結果を得る対象の被検者群が、客観的な方法により、複数のクラスに分けられており、被検者の脳領域間(関心領域間)の活動度の相関(結合)を測定し、測定結果に対する機械学習により、クラスに対する分類器が生成できるものであれば、他の分類のために使用されるものであってもよい。
また、上述のとおり、このような分類は、ある属性に属する可能性を確率として表示するものであってもよい。
したがって、たとえば、ある「訓練」や「行動パターン」をとることが、被検者にとっての健康増進に役立つかを客観的に評価することができる。また、実際には、疾患に至っていない状態(「未病」)であっても、ある「食物」「飲料」等のような摂取物や、ある活動などが、より健康状態に近づくために効果があるのか、ということを客観的に評価することも可能である。
また、未病の状態においても、上述したように、たとえば、「健常である確率は、○○%」といような表示が出力されれば、ユーザに対して、健康状態について客観的な数値としての表示を行うことができる。このとき、出力されるのは、必ずしも確率でなくとも、「健康度合いの連続値、たとえば、健常である確率」をスコアに変換したものを表示することとしてもよい。このような表示を行うことで、本実施の形態の装置を、診断の支援以外にも、ユーザの健康管理のための装置として使用することも可能である。
以上の説明では、すべての計測サイトについて、平等に、トラベリングサブジェクトが移動して計測を行うことにより、測定バイアスを評価するとの構成であった。
本実施形態は、拠点となる「拠点計測サイトMS.1~MS.Ns」について、トラベリングサブジェクトTS1が巡回していることを前提とする。
これに対して、たとえば、これらの拠点計測サイトMS.1~MS.Nsのうちの拠点計測サイトMS.2については、予め配下となるMS2.1~MS2.nが存在するとして、新たに「計測サイトMS.2.n+1」が追加された場合は、この配下の範囲でトラベリングサブジェクトTS2が巡回する。他の拠点計測サイトについても同様である。
すなわち、拠点計測サイトMS.2の測定バイアスは、トラベリングサブジェクトTS1で評価された値に固定して、計測サイトMS.2、MS2.1、MS2.n,MS2.n+1について、トラベリングサブジェクトTS2が巡回した計測結果に基づいて、測定バイアスを決定するという構成とすることも可能である。
たとえば、「拠点計測サイトMS.1~MS.Ns」は、予め定められた地域ごとに存在すとして、日本国内の北海道、東北、関東、…、関西、…九州というような各地域に、1か所ずつ設置されており、配下サイトというのは、たとえば、その地域の1つの関西に位置する計測サイト、というような構成とすることも考えられる。
あるいは、「拠点計測サイトMS.1~MS.Ns」は、予め定められたMRI装置の機種ごとに定められていてもよい。この場合、配下の計測サイトは、拠点サイトと同一のMRI装置の機種が設置された計測サイトということになる。
あるいは、「拠点計測サイトMS.1~MS.Ns」は、予め定められた地域ごとに、定められたMRI装置の機種ごとに定められていてもよい。この場合、配下の計測サイトは、拠点サイトと同一の地域内で、同一のMRI装置の機種が設置された計測サイトということになる。
以下では、精神疾患のうち、統合失調スペクトラム障害を例として、すなわち、従来の症候に基づく診断手法により医師によって統合失調スペクトラム障害と診断された患者群を例として、分類器を生成する処理を説明する。すなわち、図14に示した分類器生成部3008が、患者群と健常群とを分類するための診断の補助情報を出力するような分類器を生成するために実行する処理の他の例を説明する。
そこで、以下では、機能的結合に基づいて、健常群(HC)およびSSD患者を識別する統合失調スペクトラム障害(以下、「SSD」と略記する場合がある)分類器を構築する手続きについて説明する。
そして、SSD診断と関係する機能的結合を特定するために、どの機能的結合が分類器の構築に重要であるのかについても検討する。
既述したように、機械学習アルゴリズムを使用する信頼できる分類器および回帰モデルの構築については、多数の撮像サイトから集められた大規模なサンプルサイズのデータを用いることが必要である。
図15に、SSD分類器に対する学習処理の流れを示す。SSD分類器に対する学習処理が開始されると、予め準備された(記憶装置2080´に格納された)機能的結合の相関行列のデータを使用して、相関行列算出部3002が、結合マトリックスの成分を算出し学習用データの準備を行う(S300)。
続いて、ハーモナイゼーション算出部3020が、測定バイアスを算出して、ハーモナイゼーション処理を実施する(S302)。
上述のとおり、ハーモナイゼーション処理は、トラベリングサブジェクトを用いた方法が望ましいが、他の方法であってもよい。
続いて、分類器生成部3008は、学習用データに対して、いわゆる「入れ子構造の交差検証(Nested Cross Validation)」の手法を修正した方法により、SSD分類器を生成する。
まず、分類器生成部3008は、学習用データに対して、「K分割交差検証」(K:自然数)(外側の交差検証)を使用して学習処理を実行するために、たとえば、K=10として、学習用データを10分割する(S304)。
すなわち、分類器生成部3008は、K分割(10分割)されたうちの1つの部分データセットを検証用の「テストデータセット」とし、残りの(K-1)分割(9分割)分のデータを訓練データセット(トレーニングデータセット)に設定する(S308,S310)。
続いて、分類器生成部3008は、トレーニングデータセットに対して、アンダーサンプリング処理およびサブサンプリング処理を実行する(S312)。
ここで、「アンダーサンプリング処理」とは、トレーニングデータセットにおいて、分類の対象となる特定の属性データ(2種以上)にそれぞれ対応するデータの数がそろっていない場合に、この数をそろえるために数が多い方の属性のデータを除いて同数となるように行う処理を意味する。アンダーサンプリング処理を行う際、年齢が所定の範囲に分布する健常者又は患者のデータがサンプリングされる。
ここでは、トレーニングデータセットにおいて、SSD患者群の各年齢層の被検者数と、健常群の各年齢層の被検者数が等しくないために、これをそろえるためのアンダーサンプリング処理を行う。
さらに、「サブサンプリング処理」とは、トレーニングデータセットから所定数のサンプルをランダムに抽出することで学習用データを生成する処理を意味する。
すなわち、ステップS308、S312、S314、S316、S318、S322を経由して、K回繰り返される交差検証において、各交差検証では、トレーニングデータセットがSSD患者および健常者HCの数ならびにSD患者と健常者HCの各年齢層の数に関して不均衡であるので、分類器を構築するためのアンダーサンプリング方法を行うこととし、かつ、サブサンプリング処理として、所定数、たとえば、116人のSSD患者および617人の健常者が、トレーニングデータセットからランダムにサンプリングされる。
なお、116又は617人という数値は、このような値に限定されるものではなく、学習用データセット中のデータ数(データセット1では733人)、分割数K(ここでは、たとえば、K=10)、並びに、分類の対象となる特定の属性に含まれるデータ数の不均衡の程度に応じて、適宜、上述したようなアンダーサンプリングが可能となるように決定される。
このようなサブサンプリング処理を実行するのは、アンダーサンプリングは、除外されたデータを使用して分類器が学習することができなくなるという点で不利であるため、この不利を除去するために、無作為抽出手続き(つまりサブサンプリング)を、M回(M:自然数、たとえば、M=10)繰り返す処理である。
続いて、分類器生成部3008は、サブサンプリングされたサブサンプル1~10の各々に対して、ハイパーパラメータの調整処理を実行する(S314.1~S314.10)。
ここで、各サブサンプルにおいて、以下のようなロジスティック関数を使用することで、分類器サブモデルが生成される。このようなロジスティック関数は、サブサンプル内において、SSDクラスに属する参加者の可能性を以下のように定義するために使用される。
Figure 2024003782000005
ここで、ysubは、参加者のクラス・ラベル(SSD,y=1;HC,y=0)を表わし、csubは、与えられた参加者に対するFCベクトルを表わし、wは重みベクトルを表わす。
重みベクトルwは、以下の評価関数(コスト関数)を最小化するように決定される(LASSO計算)。
Figure 2024003782000006
LASSO計算では、コスト関数において、重みベクトルの各要素の絶対値(1次)の総和(L1ノルム)が第2項として存在する。
ここで、λはハイパーパラメータを表わし、評価に適用される収縮量をコントロールする。
分類器生成部3008は、各サブサンプルにおいて、これも特に限定されないが、所定数のデータをハイパ-パラメータ調整用データとし、残りのデータ(たとえば、n=250または248人のデータ)を用いて重みベクトルwを決定する。このとき、分類器生成部3008は、特に限定されないが、たとえば、ハイパーパラメータλが0<λ≦1.0であるものとして、この区間を、P等分(P:自然数)、たとえば25等分した各値のλを使用して、上記のようなLASSO計算により、重みベクトルwを決定する。
このとき、上述の通り、「入れ子構造の交差検証」として、ハイパーパラメータの調整については、「内側の交差検証」として実行する。内側の交差検証では、外側の交差検証の「テストデータセット」は、使用されない。
その上で、分類器生成部3008は、生成された各λの値に対応するロジスティック関数によりハイパ-パラメータ調整用データについて分類性能を比較し、最も分類性能の高いλに対応するロジスティック関数を決定する(ハイパーパラメータの調整処理)。
続いて、分類器生成部3008は、現在の交差検証のループの中で生成された各サブサンプルに対応するロジスティック関数の出力値の平均を出力するものとして「分類器サブモデル」を設定する(S316)。
続いて、分類器生成部3008は、分類に使用した機能的結合の名称とそれぞれの機能的結合が使用された回数を分類器データ3112の一部として記憶装置2080´に記録する(S317)。この記録された情報に基づいて、どの機能的結合が分類器の構築に重要であるのか決定することができる。
分類器生成部3008は、ステップS310で準備されたテストデータセットを入力として、現在の交差検証のループの中で生成された分類器サブモデルの検証を実行する(S318)。
なお、アンダーサンプリングとサブサンプリングにより、サブサンプルを生成して、各サブサンプルにおいて、特徴選択を実行して分類器サブモデルを生成する方法としては、上記のようなLASSO法とハイパーパラメータの調整とを実行する方法以外に、他のスパースモデリングの手法を利用してもよい。
分類器生成部3008は、交差検証のループをK回(ここでは10回)分終了していないと判断すると(S322でN)、K分割されたデータにおいて、それまでのループで使用したのとは異なる別の部分データセットをテストデータセットに設定し、残りの部分データセットをトレーニングデータセットに設定して(S308,S310)、処理を繰り返す。
一方で、分類器生成部3008は、交差検証のループをK回(10回)分終了している場合(S322でY)、入力データに対して、K×M個(この場合は、10×10=100個)のロジスティック関数(分類器)の出力の平均を出力するものとして、SSDに対する分類器モデル(SSD分類器)を生成する(S320)。
SSD分類器の出力(診断の確率値)が、0.5を超えるときは、SSD患者を示す指標と見なすことができる。
さらに、本実施の形態でも、このようにして生成されたSSD分類器の性能の評価指標として、マシューズ相関係数(MCC:Matthews correlation coefficients)、ROC曲線(Receiver Operatorating Characteristic curve、受信者動作特性曲線)についてのROC曲線下面積(AUC: area under the curve)、正確度(Accuracy)、感度(Sensitivity)、特異度(Specificity)を使用する。
なお、それぞれのサブサンプルにおいて特徴選択された特徴量(この場合、測定バイアスに対するハーモナイゼーション処理後の相関行列の要素)を使用して、対象疾患(たとえば、SSD)の分類器を生成する手法は、このような複数個の分類器サブモデルの出力の平均処理によるものに限られず、特徴選択された特徴量に対して、他のモデリング手法、特に、他のスパースモデリング手法を使用して分類器を生成する構成としてもよい。
(SSD診断に寄与する機能的結合の特定)
SSDの診断に寄与する脳の機能的結合の特定は、分類器生成部3008が、ステップS317において記憶した、分類に使用した機能的結合の名称とそれぞれの機能的結合が使用された回数に基づいて行う。診断ラベルをシャッフルして permutation test を施行し、例えばp < 0.05となる回数を上回る機能的結合をSSDの診断に寄与する脳の機能的結合として出力する。抽出される機能的結合を図16-1~図16-4に示す。なお、p値は、例えば< 0.01等としてもよい。あるいは、他の一例としては、機能的結合が各サブサンプルでの学習において分類器の構築に使用された回数でランキングしたものを「重要度」とし、ランキングの上位の所定数の機能的結合を選択することを「特徴量の重要度に応じて、複数の上位特徴量を選択」する、という構成とすることもできる。
また、SSDの診断に寄与する脳の機能的結合の特定は、上記正則化ロジスティック回帰だけでなく、後述する実施の形態の2において使用する、他の複数の機械学習アルゴリズムが分類に使用した機能的結合の名称とそれぞれの機能的結合が使用された回数に基づいて行ってもよい。
(分類器を用いた診断支援)
図13(b)に戻り、生成された分類器を使用した予測方法の概要について説明する。生成された100個の分類器のそれぞれに、統合失調スペクトラム障害に関する情報の提供を要する被検者の図2で説明したような相関行列を入力し、それぞれの分類器から統合失調スペクトラム障害の診断ラベルが付される確率を出力する。それぞれのラベルについて100個の分類器から出力された確率の平均値を求め、その平均値が予測確率として出力される。また、統合失調スペクトラム障害の診断ラベルが付される確率に替えて、健常ラベルが付される確率を出力してもよい。
図17は、分類器出力値算出部3010が行う分類器を用いたSSDの診断支援処理の流れを示すフローチャートである。
識別学習装置300は、コンピュータ400から、統合失調スペクトラム障害に関する情報の提供を要する被検者の脳の機能的結合の相関行列データを取得する。
演算装置2040´は、取得した相関行列データを相関行列データ3106として、記憶装置2080´に格納する(S400)。次に、取得した相関行列データに対してハーモナイゼーション算出部3020がハーモナイゼーション処理を実行する(S402)。ハーモナイゼーション処理の結果を、分類器出力値算出部3010が図15のステップS320において生成された分類器に入力(S404)し、分類器は出力値を出力する(S406)。分類器出力値算出部3010は、出力値を診断ラベルに紐付けられた基準値と比較する。基準値は例えば、50%等の確率の値でありうる。指定された診断ラベルがSSDのラベルである時、分類器出力値算出部3010は、分類器からの出力値が基準値を超える場合(S408において「Y」の場合)、分類結果としてSSDを示唆することを示すラベルを出力する(S412)。分類器出力値算出部3010は、分類器からの出力値が基準値を超えない場合(S408において「N」の場合)、分類結果としてSSDを示唆しないことを示すラベルを出力する(S414)
識別学習装置300は、分類器出力値算出部3010が出力したラベルを、診断支援情報としてコンピュータ400に送信する。
[実施の形態2]
実施の形態1では、機械学習アルゴリズムとして正則化ロジスティック回帰を使用する形態を説明した。本実施形態では、正則化ロジスティック回帰に加え、他の複数の機械学習アルゴリズムを組み合わせて、統合失調スペクトラム障害に対する識別情報を診断支援情報として出力する。機械学習アルゴリズムは特に制限されないが、例えば、ランダムフォレスト、ライト勾配ブースティングマシン、サポートベクターマシン、パーセプトロン等を挙げることができる。
(アンサンブル分類モデル生成処理)
図18は、データ収集、推定処理および対象者の脳活動計測を、分散して処理する場合の一例を示す機能ブロック図である。図18に示す構成は、基本的には図14に示す構成と同様であるので、各機能ブロックの説明は、図14の説明をここに援用する。但し、本実施形態においては、機械学習アルゴリズムが実施の形態1とは異なるため、図14における分類器生成部3008、分類器出力値算出部3010、及び分類器データ3112は、それぞれ図18において分類器生成部30081、分類器出力値算出部30101、及び分類器データ31121として異なる符号を付している。
図19-1及び図19-2に、機械学習モデルに対するアンサンブル学習処理の流れを示す。図19-1において、分類器生成部30081が行うステップS500、S502、S504、S508、S510、S512は、それぞれ図15のS300、S302、S304、S308、S310、S312と同様である。
分類器生成部30081は、図15おけるステップS314.1~S314.10と同様にサブサンプリングされたサブサンプル1~10の各々に対して、ハイパーパラメータの調整処理を実行する(S514.1~S514.10)。ただし、本実施形態では、例示的に5つの異なる機械学習アルゴリズムを訓練するため、ハイパーパラメータの調整処理は、訓練する機械学習アルゴリズムにより異なる。したがって、分類器生成部30081は、各機械学習アルゴリズムに応じて、ハイパーパラメータを調整する。
分類器生成部30081は、現在の交差検証のループの中で生成された各サブサンプルに対応する機械学習アルゴリズムの出力値の平均を出力するものとして「分類器nサブモデル」を設定する(S516)。ここで、分類器nは、各機械学習アルゴリズムに対応するため、5種類の機械学習アルゴリズムを訓練する際には、nは、1,2,3,4,5となる。
分類器生成部30081は、ステップS510で準備されたテストデータセットを入力として、現在の交差検証のループの中で生成された分類器サブモデルの検証を実行する(S518)。
分類器生成部30081は、交差検証のループをK回(ここでは10回)分終了していないと判断すると(S522でN)、K分割されたデータにおいて、それまでのループで使用したのとは異なる別の部分データセットをテストデータセットに設定し、残りの部分データセットをトレーニングデータセットに設定して(S508,S510)、処理を繰り返す。
一方で、分類器生成部30081は、交差検証のループをK回(10回)分終了している場合(S522でY)、入力データに対して、K×M個(この場合は、10×10=100個)の分類器nの出力の平均を出力するものとして、SSDに対する分類器nモデルを生成する(S520)。
ステップS520に続いて、分類器生成部30081は、図19-2に示すステップS524に進む。ステップS524においての複数の(ここでは5種)の機械学習アルゴリズムの全てについて分類器nを生成した場合(「Y」の場合)、分類器生成部30081は、ステップS526に進み、入力データに対して、K×M×n個(この場合は、(10×10=100個)×5=500個)のアンサンブル分類器の出力の平均を出力するものとして、SSDに対するアンサンブル分類器モデルを生成する(S526)。ステップS524において全てについて分類器nを生成していない場合(「N」の場合)、分類器生成部30081は、ステップS514へ戻り、分類器を生成していない機械学習アルゴリズムを使用して、分類器n+1を生成する。
(アンサンブル分類モデルを用いた診断支援)
図20は、分類器出力値算出部30101が行うアンサンブル分類モデルを用いたSSDの診断支援処理の流れを示すフローチャートである。図20の各ステップは、基本的には図17を用いて説明した各ステップと同様である。
図20において、ステップS600、及びS602は、それぞれ図17におけるステップS300、及びS302に対応する。
図20のステップS604において、ハーモナイゼーション処理の結果を、分類器出力値算出部30101が図19-2のステップS526において生成されたアンサンブル分類モデルに入力し、アンサンブル分類モデルは出力値を出力する(S606)。
図20において、ステップS608、S612及びS614は、それぞれ図17におけるステップS308、S312及びS314に対応する。
識別学習装置300は、分類器出力値算出部30101が出力したラベルを、診断支援情報としてコンピュータ400に送信する。
[実施の形態3]
実施の形態1及び2では、被検者に関する統合失調スペクトラム障害に対する識別情報を出力する形態について説明した。本実施形態は、統合失調スペクトラム障害に伴う症状の予測を行う。ここでは、例示的にピーターズ妄想質問紙を用いたPDIスコアの予測を行う。
(症状スコア予測モデル生成処理)
図21は、データ収集、推定処理および対象者の脳活動計測を、分散して処理する場合の一例を示す機能ブロック図である。図21に示す構成は、基本的には図14に示す構成と同様であるので、各機能ブロックの説明は、図14の説明をここに援用する。但し、本実施形態においては、機械学習アルゴリズムが実施の形態1とは異なるため、図14における分類器生成部3008、分類器出力値算出部3010、及び分類器データ3112は、それぞれ図21において分類器生成部30082、分類器出力値算出部30102、及び分類器データ31122として異なる符号を付している。
図22は、本実施の形態係る症状スコア予測モデルの構築方法の概要を説明するための概念図である。図22aは、説明変数として使用する機能的結合に順位付けを行う工程を示す概念図である。機能的結合に順位付けは、上記(SSD診断に寄与する機能的結合の特定)の項で述べ方法により行うことができる。図22bは、説明変数として使用する上位特徴量(上位機能的結合)の数を変えて症状スコア予測モデルを構築し、最良のモデルを選択する工程を示す概念図である。上位特徴量として使用する機能的結合の最適な数は、Pareto frontのKnee pointとして決定できる。
Pareto frontに関しては、以下の公知文献がある。
公知文献:Jahan, A., Edwards, K. L., & Bahraminasab, M., Multi-criteria Decision Analysis, 2nd ed. (Amsterdam: Elsevier, 2013), pp. 63-65
Knee pointの同定方法に関しては、以下の公知文献がある。
公知文献:V. Satopaa, J. Albrecht, D. Irwin and B. Raghavan, "Finding a "Kneedle" in a Haystack: Detecting Knee Points in System Behavior," 2011 31st International Conference on Distributed Computing Systems Workshops, Minneapolis, MN, USA, 2011, pp. 166-171, doi: 10.1109/ICDCSW.2011.20.
図23に、機械学習モデルに対するアンサンブル学習処理の流れを示す。図23において、分類器生成部30082が行うステップS700、及びS702は、それぞれ図15のS300、及びS302と同様である。
続いて、分類器生成部30082は、ハーモナイゼーション処理後のデータセット(例えば、717人)のうち、妄想スコア(たとえば、PDIスコア)を取得済みの統合失調スペクトラム障害の参加者(例えば、73人)についてのデータを学習用データセットとして取得する(S704)。
但し、学習用データセットは、上記実施の形態1、又は実施の形態2において、SSDの診断に寄与すると特定された脳の機能的結合の相関行列データから生成される(S705)。機能的結合に順位付けは、図16-1~図16-4に記載の機能的結合が各サブサンプルでの学習において分類器の構築に使用された回数でランキングしたものを「重要度」とし、最も使用された回数が多い機能的結合を特徴量としての重要度第1位としてランキングする。第2位以下の特徴量は、使用回数に応じて降順にランキングされる。使用回数が同じ特徴量がある場合には、図16-1~図16-4に記載のロジスティック回帰係数(平均)の絶対値が高い方を上位とする。回帰モデルに説明変数として入力される特徴量は、ランキングの上位から選択される所定数の特徴量である。所定数とは、1~47から選択される整数である。
続いて、分類器生成部30082は、予測に使用する機械学習モデルの設定を行う(S706)。機械学習モデルには、説明変数としてランキングの上位から選択される1~47までの所定数の特徴量の群(47通り)のそれぞれを個々の機械学習モデルに入力し、最も精度のよい上位特徴量の数を決定する。最も精度のよい上位特徴量の数は、Pareto frontのKnee pointとして同定することができる。設定される機械学習モデルは、正則化ロジスティック回帰を含む複数の機械学習アルゴリズムである。機械学習アルゴリズムは、教師あり機械学習法を実行可能なアルゴリズムである限り特に制限されないが、例えば、正則化ロジスティック回帰、ランダムフォレスト、ライト勾配ブースティングマシン、サポートベクターマシン、パーセプトロン等を挙げることができる。好ましくは、機械学習モデルに説明変数として入力される上位特徴量の数は、1~22の間から選択される。より好ましくは、パーセプトロンの上位特徴量の数は7であり、その他の機械学習モデルに関しては、22である。
分類器生成部30082は、ステップS707において、全機械学習モデルから予測モデルを生成したかを判定する。ステップS707において、予測モデルが生成されていない機械学習モデルがない場合(「N」の場合)、分類器生成部3008は、ステップS708に進む。
続いて、分類器生成部30082は、学習用データに対して、いわゆる「K分割交差検証」の手法により、予測尺度の回帰モデルを生成する。
まず、分類器生成部30082は、学習用データに対して、「K分割交差検証」を使用して学習処理を実行するために、たとえば、K=10として、学習用データを10分割する(S708)。
すなわち、分類器生成部30082は、K分割(たとえば、10分割)されたうちの1つの部分データセットを検証用の「テストデータセット」とし、残りの(K-1)分割(9分割)分のデータを訓練データセット(トレーニングデータセット)に設定する(S710,S712)。
続いて、分類器生成部30082は、以下の式のように、SSDの診断に寄与すると決定された特定の脳の機能的結合(今回は、図16-1~図16-4に示す47の機能的結合)の値に基づいた学習用データセットを使用して、PDIスコアを予測するために直線回帰モデルを構築する。
すなわち、直線回帰モデルを構築するために、PDIスコアを有する学習用データセットに、LASSO法を使用して、分類器生成部30082は、以下のように直線回帰を使用して、回帰サブモデルi(i=1~K)を生成する(S714)。
(予測PDIsub)=wTcsub
ここで、予測BDIsubは、参加者のBDIスコアを表わす。csubは、参加者の機能的結合ベクトルを表わす。また、wは、直線回帰の重みベクトルを表わす。なお、回帰モデルとしては、直線回帰モデルに限定されるものではなく、他の関数形の回帰モデルを用いてもよい。
続いて、ステップS712で準備されたテストデータセットを入力として、現在の交差検証のループの中で設定された機械学習モデルの検証を実行する(S716)。
続いて、分類器生成部30082は、交差検証のループをK回(10回)分終了していないと判断すると(S718でN)、K分割されたデータにおいて、それまでのループで使用したのとは異なる別の部分データセットをテストデータセットに設定し、残りの部分データセットをトレーニングデータセットに設定して(S710,S712)、処理を繰り返す。
一方で、分類器生成部30082は、交差検証のループをK回(10回)分終了している場合(S718でY)、回帰サブモデルi(i=1~K)の出力の平均を出力するものとして、妄想スコアに対する回帰モデル(サブ予測モデル)を生成する(S720)。ここでは、このような脳の機能的結合の部分集合を説明変数として、回帰モデルを構築する。
分類器生成部30082は、ステップS706に戻り別の機械学習モデルを設定する。ステップS707において、全ての機械学習モデルを設定していると判断した場合(「Y」の場合)、分類器生成部30082は、ステップS706~S720の処理によって設定された全ての機械学習モデルの出力の平均を出力とする、スコア予測モデルを生成する(S722)。
ただし、このような手続きでは、分割間での情報リークを引き起こして、トレーニングデータセットに対する学習結果は、過適応を起こす可能性がある。
そこで、以下に説明するように、独立した検証データセットにこの回帰モデルを適用することにより、汎化性能も確認する。
ここで、ステップS706~S720に代えて、ステップS706において機械学習モデルとして線形回帰モデルを設定してもよい。線形回帰モデルとして、好ましくは、重回帰分析である。重回帰分析として、例えば、最小二乗法を挙げることができる。
(スコア予測処理)
図24に、分類器出力値算出部30102が、図23のステップS722において生成したスコア予測モデルを使用し症状のスコアを予測する際の処理の流れを示す。
図24において、ステップS800、及びS802は、それぞれ図17におけるステップS300、及びS302に対応する。
図24のステップS804において、ハーモナイゼーション処理の結果を、分類器出力値算出部30102がスコア予測モデルに入力し、スコア予測モデルは出力値を出力する(S806)。ここで、スコア予測モデルに入力される結果は、上記図23のステップS706において抽出された特定の機能的結合に対応する結果である。出力値は、予測スコアとして使用可能である。
[効果の検証]
1.データ
図25及び図26に学習用のデータセットのデモグラフィック特性を示す。被検者には、健常者及びSSD患者を含む。Discovery dataset として健常者617名、SSD患者116名のデータを使用した。Discovery datasetは東京大学、昭和大学、京都大学(TimTrio)、広島大学の1施設において取得された。Independent datasetとして健常者404名、SSD患者198名のデータを使用した。Independent datasetは、京都大学(Trio, Prisma)、及び広島大学の3施設、Taipei Medical University、Johns Hopkins University及びCOBRE(The Center for Biomedical Research Excellenceが提供する、統合失調症、健常の被検者の公開データセットで、MRIデータ、人口学的・臨床的データが含まれる。http://fcon_1000.projects.nitrc.org/indi/retro/cobre.html)から取得した。Discovery datasetについては、Traveling subject data (n=9) により測定バイアスを除去した。Independent datasetは、Traveling subject dataが存在しないため、ComBat を適用した。
なお、Combat処理については、たとえば、以下の文献に開示がある。
公知文献:Johnson WE, Li C, Rabinovic A. “Adjusting batch effects in microarray expression data using empirical Bayes methods.” Biostatistics 8, 118-127 (2007).
図27には、各計測サイトにおける撮像プロトコルを示す。
2.結果
(1)SSD診断に寄与する機能的結合
permutation testにおいて、選択された回数においてp < 0.05を上回る機能的結合は、図16-1~図16-4に示すとおりである。図28には、SSD診断に寄与する機能的結合の脳内分布と、出現頻度を示す。最も頻度が高いネットワークは、Subcortical(皮質下)であり、続いてAttention(注意)、Motor(運動)であった。
(2)正則化ロジスティック回帰分類器の分類精度
図29に正則化ロジスティック回帰分類器の分類精度を示す。図29(a)はDiscovery datasetについて予測を行った結果を示す。図29(b)はIndependent datasetについて予測を行った結果を示す。Discovery datasetのAUCは0.876、Accuracyは0.796、Sensitivityは0.816、Specificityは0.793、MCC(Matthews Correlation Coefficient)は0.484であり高い分類精度を示した。また、Independent datasetを使用した場合も、AUCは0.824、Accuracyは0.773、Sensitivityは0.692、Specificityは0.811、MCCは0.49であり高い分類精度を示した。したがって、正則化ロジスティック回帰を利用した分類器は分類精度が高いことが示された。
(3)アンサンブル分類モデルの分類精度
図30にアンサンブル分類モデルの分類精度を示す。図30(a)はDiscovery datasetについて予測を行った結果を示す。図30(b)はIndependent datasetについて予測を行った結果を示す。Discovery datasetのAUCは0.876、Accuracyは0.794、Sensitivityは0.807、Specificityは0.791、MCCは0.475であり高い分類精度を示した。また、Independent datasetを使用した場合も、AUCは0.841、Accuracyは0.775、Sensitivityは0.747、Specificityは0.788、MCCは0.512であり高い分類精度を示した。したがって、アンサンブル分類モデルは分類精度が高いことが示された。
(4)スコア予測精度
ハーモナイゼーション処理後のデータセットのうち、妄想スコア(たとえば、PDIスコア)を取得済みの統合失調スペクトラム障害の参加者73名のデータセットを使用して、モデルの構築と、スコアの予測精度を評価した。モデルの構築において、モデルがパーセプトロンの場合は重要度の上位ランキング第7位までの機能的結合を説明変数として使用し、それ以外については、重要度の上位ランキング第22位までの機能的結合を説明変数として使用した。
図31に、正則化ロジスティック回帰、ランダムフォレスト、ライト勾配ブースティングマシン、サポートベクターマシン、パーセプトロンを用いたアンサンブル学習モデルによるスコア予測精度を示す。図31(a)はDiscovery datasetについて予測を行った結果を示す。図31(b)はIndependent datasetについて予測を行った結果を示す。Discovery datasetの相関係数rは0.428であり、平均絶対誤差(MAE:Mean Absolute Error)は32.5であった。Independent datasetの相関係数rは0.326であり、平均絶対誤差(MAE:Mean Absolute Error)は53.6であった。いずれもスコア予測が可能であると考えられた。
(5)スコア予測精度
図32に、最小二乗法によるスコア予測精度を示す。図32(a)はDiscovery datasetについて予測を行った結果を示す。図32(b)はIndependent datasetについて予測を行った結果を示す。Discovery datasetの相関係数rは0.268であり、平均絶対誤差(MAE:Mean Absolute Error)は39.6であった。Independent datasetの相関係数rは0.317であり、平均絶対誤差(MAE:Mean Absolute Error)は57.5であった。いずれもスコア予測が可能であると考えられた。
(6)説明変数として使用する上位特徴量の数と予測精度
図33に、説明変数として使用した上位特徴量の数と、線形回帰モデルにてPDI totalスコアを予測した際の、説明変数として用いた機能的結合の数と、Independent datasetでの予測性能を示す。MAEはPermutation testにより算出し、相関係数rは無相関検定により算出した。図33中のpは、無相関検定における相関係数rの値を示す。図33中の黒塗りのセルは、MAEがPermutation testにおいて有意水準がP<0.05(58.3146573557387以下)となるか、相関係数rが有意水準p<0.05を満たしているセルである。MAEが有意に小さくなる最小の機能的結合数は5、rが有意に大きくなる最小の機能的結合数は19であった。
300 識別学習装置、400 診断支援装置、2040´ 演算装置、2080´ 記憶装置

Claims (10)

  1. 第1の被検者の脳活動の計測結果に基づいて、前記第1の被検者についての統合失調スペクトラム障害に関する情報を提供するための診断支援システムであって、
    年齢が所定の範囲に分布する第2の被検者よりなる学習対象群から取得した脳機能的結合相関値の計測結果に対して、統合失調症の識別処理を実行するための識別学習装置を備え、前記学習対象群は、統合失調スペクトラム障害の診断ラベルを有する第1の群と前記統合失調スペクトラム障害の診断ラベルを有さない第2の群とを含み、
    前記識別学習装置は、
    前記複数の第2の被検者について、前記識別処理を実行するための演算装置と記憶装置とを含み、
    前記演算装置は、分類器の生成処理において、
    i)各前記複数の第2の被検者について、所定の複数の脳領野ペア間の脳活動の時間相関をそれぞれ表す複数の脳機能的結合相関値に基づく特徴量を前記記憶装置に格納し、
    ii)前記記憶装置に格納された前記特徴量のうちから、所定数の第2の被検者についてのデータを前記1の群と前記第2の群とで年齢がマッチングするようにサブサンプリングし、サブサンプリングされたデータに基づいて、教師あり機械学習で前記診断ラベルの有無を学習する第1の処理を、複数回繰り返して、複数個の識別サブモデルをそれぞれ生成し、
    iii)前記複数個の識別サブモデルからの出力を統合して出力する分類器を生成する第2の処理を実行し、
    前記第1の被検者の脳活動の計測結果のデータを入力として前記分類器からの出力に基づいて、当該第1の被検者について、統合失調症に対する識別情報を診断支援情報として出力する診断支援装置とを、備える、診断支援システム。
  2. 前記第1の群に属する前記第2の被検者の各々には、統合失調症の特定の症候の程度を表すスコア情報が関連づいており、前記記憶装置は、前記スコア情報を格納しており、
    前記演算装置は、前記第1の処理において、
    教師あり機械学習として、特徴量選択を伴う機械学習法を実行して、前記複数個の識別器モデルを学習する処理において選択される前記特徴量の重要度に応じて、複数の上位特徴量を選択し、
    前記選択された上位特徴量に基づいて、機械学習により、前記スコア情報を予測するスコア予測モデルを生成し、
    前記診断支援装置は、前記スコア予測モデルの出力を、前記診断支援情報として出力する、請求項1記載の診断支援システム。
  3. 前記特徴量選択を伴う機械学習法は、正規化ロジスティック回帰法である、請求項2記載の診断支援システム。
  4. 前記スコア情報は、PDI(ピーターズ妄想質問紙)スコアである、請求項2記載の診断支援システム。
  5. 前記演算装置は、
    前記スコア予測モデルの機械学習として、複数種類の異なる機械学習モデルによるアンサンブル学習を実行する、請求項2記載の診断支援システム。
  6. 前記演算装置は、
    前記第1の処理において、サブサンプリングされたデータに基づいて、教師あり機械学習で前記診断ラベルの有無を学習する処理を、それぞれ異なる複数種類の機械学習モデルについて、複数回繰り返して、前記複数種類の異なる機械学習モデルごとに識別の確率を出力する複数個の識別サブモデルをそれぞれ生成し、
    前記第2の処理において、前記複数種類の異なる機械学習モデルごとに前記複数個の識別サブモデルからの出力の識別の確率を平均し、さらに、前記複数種類の機械学習モデルについて平均したものを出力するように前記分類器を生成する、請求項1記載の診断支援システム。
  7. 前記複数種類の機械学習モデルが、正規化ロジスティック回帰、ランダムフォレスト、ライト勾配ブースティングマシン、サポートベクターマシン、及びパーセプトロンである、請求項5記載の診断支援システム。
  8. 第1の被検者の脳活動の計測結果に基づいて、前記第1の被検者についての統合失調スペクトラム障害に関する情報を提供するための診断支援装置であって、
    前記診断支援装置は、
    年齢が所定の範囲に分布する複数の第2の被検者よりなる学習対象群から取得した脳機能的結合相関値の計測結果に対して、統合失調症の識別処理を実行するための識別学習装置と通信可能に接続され、前記学習対象群は、統合失調スペクトラム障害の診断ラベルを有する第1の群と前記統合失調スペクトラム障害の診断ラベルを有さない第2の群とを含み、
    前記識別学習装置は、
    前記複数の第2の被検者について、前記識別処理を実行するための演算装置と記憶装置とを含み、
    前記演算装置は、分類器の生成処理において、
    i)各前記複数の第2の被検者について、所定の複数の脳領野ペア間の脳活動の時間相関をそれぞれ表す複数の脳機能的結合相関値に基づく特徴量を前記記憶装置に格納し、
    ii)前記記憶装置に格納された前記特徴量のうちから、所定数の第2の被検者についてのデータを前記第1の群と前記第2の群とで年齢がマッチングするようにサブサンプリングし、サブサンプリングされたデータに基づいて、教師あり機械学習で前記診断ラベルの有無を学習する第1の処理を、複数回繰り返して、複数個の識別サブモデルをそれぞれ生成し、
    iv)前記複数個の識別サブモデルからの出力を統合して出力する分類器を生成する第2の処理を実行し、
    前記診断支援装置は、前記第1の被検者の脳活動の計測結果のデータを入力として前記分類器からの出力に基づいて、当該第1の被検者について、統合失調症に対する識別情報を診断支援情報として出力する、前記診断支援装置。
  9. 第1の被検者の脳活動の計測結果に基づいて、前記第1の被検者についての統合失調スペクトラム障害に関する情報を提供するための診断支援方法であって、
    前記診断支援方法は、
    第1の被検者の脳活動の計測結果のデータを入力として、分類器からの出力に基づいて、当該第1の被検者について、統合失調症に対する識別情報を診断支援情報として出力することを含み、
    前記分類器は、
    年齢が所定の範囲に分布する複数の第2の被検者よりなる学習対象群であって、統合失調スペクトラム障害の診断ラベルを有する第1の群と前記統合失調スペクトラム障害の診断ラベルを有さない第2の群とを含む学習対象群から取得した脳機能的結合相関値の計測結果に対して、統合失調症の識別処理を実行するための機械学習であって、
    各前記複数の第2の被検者について、所定の複数の脳領野ペア間の脳活動の時間相関をそれぞれ表す複数の脳機能的結合相関値に基づく特徴量のうちから、所定数の第2の被検者についてのデータを前記第1の群と前記第2の群とで年齢がマッチングするようにサブサンプリングし、サブサンプリングされたデータに基づいて、教師あり機械学習で前記診断ラベルの有無を学習する第1の処理を、複数回繰り返して、複数個の識別サブモデルをそれぞれ生成することを含む識別学習処理と、
    前記複数個の識別サブモデルからの出力を統合して出力する分類器を生成する第2の処理
    によって生成される、
    前記診断支援方法。
  10. 第1の被検者についての統合失調スペクトラム障害に関する情報を提供するための診断支援プログラムであって、コンピュータに実行させたときに、コンピュータに、
    前記第1の被検者の脳活動の計測結果のデータを入力として、分類器からの出力に基づいて、当該第1の被検者について、統合失調症に対する識別情報を診断支援情報として出力するステップを実行させ、
    前記分類器は、
    年齢が所定の範囲に分布する複数の第2の被検者よりなる学習対象群であって、統合失調スペクトラム障害の診断ラベルを有する第1の群と前記統合失調スペクトラム障害の診断ラベルを有さない第2の群とを含む学習対象群から取得した脳機能的結合相関値の計測結果に対して、統合失調症の識別処理を実行するための機械学習であって、
    各前記複数の第2の被検者について、所定の複数の脳領野ペア間の脳活動の時間相関をそれぞれ表す複数の脳機能的結合相関値に基づく特徴量のうちから、所定数の第2の被検者についてのデータを前記第1の群と前記第2の群とで年齢がマッチングするようにサブサンプリングし、サブサンプリングされたデータに基づいて、教師あり機械学習で前記診断ラベルの有無を学習する第1の処理を、複数回繰り返して、複数個の識別サブモデルをそれぞれ生成することを含む識別学習処理と、
    前記複数個の識別サブモデルからの出力を統合して出力する分類器を生成する第2の処理
    によって生成される、
    前記診断支援プログラム。
JP2023103547A 2022-06-27 2023-06-23 統合失調スペクトラム障害に関する情報を提供するための診断支援システム、診断支援装置、診断支援方法、及び支援プログラム Pending JP2024003782A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2022103014 2022-06-27
JP2022103014 2022-06-27

Publications (1)

Publication Number Publication Date
JP2024003782A true JP2024003782A (ja) 2024-01-15

Family

ID=89533850

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023103547A Pending JP2024003782A (ja) 2022-06-27 2023-06-23 統合失調スペクトラム障害に関する情報を提供するための診断支援システム、診断支援装置、診断支援方法、及び支援プログラム

Country Status (1)

Country Link
JP (1) JP2024003782A (ja)

Similar Documents

Publication Publication Date Title
JP6903518B2 (ja) 脳活動解析システム、脳活動解析装置、及び脳活動解析プログラム
JP6497687B2 (ja) 脳活動解析システム及び方法
JP6722845B2 (ja) 判別装置、うつ症状の判別方法、うつ症状のレベルの判定方法、うつ病患者の層別化方法、うつ症状の治療効果の判定方法及び脳活動訓練装置
JP7247159B2 (ja) 脳活動分類器のハーモナイズシステム、及び脳活動分類器プログラム
JP5641531B1 (ja) 脳活動訓練装置および脳活動訓練システム
WO2020075737A1 (ja) 脳機能結合相関値の調整方法、脳機能結合相関値の調整システム、脳活動分類器のハーモナイズ方法、脳活動分類器のハーモナイズシステム、及び脳活動バイオマーカシステム
JP6875054B2 (ja) 脳活動訓練装置、脳活動訓練方法および脳活動訓練プログラム
JP7365496B2 (ja) 脳機能結合相関値のクラスタリング装置、脳機能結合相関値のクラスタリングシステム、脳機能結合相関値のクラスタリング方法、脳機能結合相関値の分類器プログラム、脳活動マーカー分類システムおよび脳機能結合相関値のクラスタリング分類器モデル
WO2019069955A1 (ja) 判別装置、うつ症状の判別方法、うつ症状のレベルの判定方法、うつ病患者の層別化方法、うつ症状の治療効果の判定方法及び脳活動訓練装置
JP2024003782A (ja) 統合失調スペクトラム障害に関する情報を提供するための診断支援システム、診断支援装置、診断支援方法、及び支援プログラム
WO2022014682A1 (ja) 脳機能結合相関値のクラスタリング装置、脳機能結合相関値のクラスタリングシステム、脳機能結合相関値のクラスタリング方法、脳機能結合相関値の分類器プログラムおよび脳活動マーカー分類システム
CN111867464B (zh) 脑活动训练装置、脑活动训练方法以及脑活动训练程序
Lawrence Imaging biomarkers in the hyper-acute phase following traumatic brain injury
KR20240027714A (ko) 예측 연령 차이를 이용한 동반 임상 치매 등급과 그 미래의 결과를 평가하는 방법 및 그 프로그램
Zhao Statistical methodologies for group comparisons of brain connectivity using multimodal neuroimaging data