JP6812022B2 - 脳機能結合相関値の調整方法、脳機能結合相関値の調整システム、脳活動分類器のハーモナイズ方法、脳活動分類器のハーモナイズシステム、および脳活動バイオマーカシステム - Google Patents

脳機能結合相関値の調整方法、脳機能結合相関値の調整システム、脳活動分類器のハーモナイズ方法、脳活動分類器のハーモナイズシステム、および脳活動バイオマーカシステム Download PDF

Info

Publication number
JP6812022B2
JP6812022B2 JP2019034887A JP2019034887A JP6812022B2 JP 6812022 B2 JP6812022 B2 JP 6812022B2 JP 2019034887 A JP2019034887 A JP 2019034887A JP 2019034887 A JP2019034887 A JP 2019034887A JP 6812022 B2 JP6812022 B2 JP 6812022B2
Authority
JP
Japan
Prior art keywords
measurement
brain
brain activity
subjects
classifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019034887A
Other languages
English (en)
Other versions
JP2020062369A (ja
Inventor
歩 山下
歩 山下
宙人 山下
宙人 山下
寛 今水
寛 今水
光男 川人
光男 川人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ATR Advanced Telecommunications Research Institute International
Original Assignee
ATR Advanced Telecommunications Research Institute International
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ATR Advanced Telecommunications Research Institute International filed Critical ATR Advanced Telecommunications Research Institute International
Priority to PCT/JP2019/039751 priority Critical patent/WO2020075737A1/ja
Priority to EP19870503.0A priority patent/EP3865061A4/en
Priority to US17/284,051 priority patent/US20210401289A1/en
Priority to CN201980066976.XA priority patent/CN112839577A/zh
Publication of JP2020062369A publication Critical patent/JP2020062369A/ja
Application granted granted Critical
Publication of JP6812022B2 publication Critical patent/JP6812022B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7203Signal processing specially adapted for physiological signals or for diagnostic purposes for noise prevention, reduction or removal
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/05Detecting, measuring or recording for diagnosis by means of electric currents or magnetic fields; Measuring using microwaves or radio waves 
    • A61B5/055Detecting, measuring or recording for diagnosis by means of electric currents or magnetic fields; Measuring using microwaves or radio waves  involving electronic [EMR] or nuclear [NMR] magnetic resonance, e.g. magnetic resonance imaging
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • A61B5/7267Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R33/00Arrangements or instruments for measuring magnetic variables
    • G01R33/20Arrangements or instruments for measuring magnetic variables involving magnetic resonance
    • G01R33/44Arrangements or instruments for measuring magnetic variables involving magnetic resonance using nuclear magnetic resonance [NMR]
    • G01R33/48NMR imaging systems
    • G01R33/4806Functional imaging of brain activation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R33/00Arrangements or instruments for measuring magnetic variables
    • G01R33/20Arrangements or instruments for measuring magnetic variables involving magnetic resonance
    • G01R33/44Arrangements or instruments for measuring magnetic variables involving magnetic resonance using nuclear magnetic resonance [NMR]
    • G01R33/48NMR imaging systems
    • G01R33/54Signal processing systems, e.g. using pulse sequences ; Generation or control of pulse sequences; Operator console
    • G01R33/56Image enhancement or correction, e.g. subtraction or averaging techniques, e.g. improvement of signal-to-noise ratio and resolution
    • G01R33/5608Data processing and visualization specially adapted for MR, e.g. for feature analysis and pattern recognition on the basis of measured MR data, segmentation of measured MR data, edge contour detection on the basis of measured MR data, for enhancing measured MR data in terms of signal-to-noise ratio by means of noise filtering or apodization, for enhancing measured MR data in terms of resolution by means for deblurring, windowing, zero filling, or generation of gray-scaled images, colour-coded images or images displaying vectors instead of pixels
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R33/00Arrangements or instruments for measuring magnetic variables
    • G01R33/20Arrangements or instruments for measuring magnetic variables involving magnetic resonance
    • G01R33/44Arrangements or instruments for measuring magnetic variables involving magnetic resonance using nuclear magnetic resonance [NMR]
    • G01R33/48NMR imaging systems
    • G01R33/58Calibration of imaging systems, e.g. using test probes, Phantoms; Calibration objects or fiducial markers such as active or passive RF coils surrounding an MR active material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/70ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to mental therapies, e.g. psychological therapy or autogenous training
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/40ICT specially adapted for the handling or processing of medical images for processing medical images, e.g. editing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment

Description

この発明は、複数の装置において脳機能画像法により計測される脳機能結合相関値を調整する技術、脳機能画像法を用いた脳活動分類器のハーモナイズ方法、脳活動分類器のハーモナイズシステム、および脳活動バイオマーカシステムに関する。
(バイオマーカー)
生体内の生物学的変化を定量的に把握するため、生体情報を数値化・定量化した指標のことを「バイオマーカー」と呼ぶ。
FDA(米国食品医薬品局)はバイオマーカーの位置づけを、「正常なプロセスや病的プロセス、あるいは治療に対する薬理学的な反応の指標として客観的に測定・評価される項目」としている。また疾患の状態や変化、治癒の程度を特徴づけるバイオマーカーは、新薬の臨床試験での有効性を確認するためのサロゲートマーカー(代用マーカー)として使われる。血糖値やコレステロール値などは、生活習慣病の指標として代表的なバイオマーカーである。尿や血液中に含まれる生体由来の物質だけでなく、心電図、血圧、PET画像、骨密度、肺機能なども含まれる。またゲノム解析やプロテオーム解析が進んできたことによって、DNAやRNA、生体蛋白等に関連したさまざまなバイオマーカーが見出されている。
バイオマーカーは、疾患にかかった後の治療効果の測定だけでなく、疾患を未然に防ぐための日常的な指標として疾患の予防に、さらに副作用を回避した有効な治療法を選択する個別化医療への応用が期待されている。
ただし、神経・精神疾患の場合、生化学的もしくは分子遺伝学的観点から客観的な指標として利用可能な分子マーカーなども研究されているものの、検討段階というべき状況である。
一方で、NIRS(Near-infraRed Spectroscopy)技術を用いて、生体光計測により計測されたヘモグロビン信号から特徴量に応じて、統合失調症、うつ病などの精神疾患について分類を行う疾患判定システムなども報告がある(特許文献1)。
(脳活動に基づくバイオマーカ)
一方で、核磁気共鳴映像法(MRI:Magnetic Resonance Imaging)では、血流量の変化に応じて、検出される信号に変化が現れることを用いて、外部刺激等に対する脳の活動部位を視覚化することも可能である。このような核磁気共鳴映像法を、特に、fMRI(functional MRI)と呼ぶ。
fMRIでは、装置としては通常のMRI装置に、さらに、fMRI計測に必要なハードおよびソフトを装備したものが使用される。
ここで、血流量の変化がNMR信号強度に変化をもたらすのは、血液中の酸素化および脱酸素化ヘモグロビンは磁気的な性質が異なることを利用している。酸素化ヘモグロビンは反磁性体の性質があり、周りに存在する水の水素原子の緩和時間に影響を与えないのに対し、脱酸素化ヘモグロビンは常磁性体であり、周囲の磁場を変化させる。したがって、脳が刺激を受け、局部血流が増大し、酸素化ヘモグロビンが増加すると、その変化分をMRI信号として検出する事ができる。このような被験者への刺激は、たとえば、視覚による刺激や聴覚による刺激、あるいは所定の課題(タスク)の実行等が用いられる(たとえば、特許文献2)。
ここで、脳機能研究においては、微小静脈や毛細血管における赤血球中の脱酸素化ヘモグロビンの濃度が減少する現象(BOLD効果)に対応した水素原子の核磁気共鳴信号(MRI信号)の上昇を測定することによって脳の活動の測定が行われている。
このように、fMRI装置により計測される脳活動を反映した血中酸素濃度依存信号をBOLD信号(Blood Oxygen Level Dependent Signal)と呼ぶ。
特に、人の運動機能に関する研究では、被験者に何らかの運動を行わせつつ、上記MRI装置によって脳の活動を測定することが行われている。
ところで、ヒトの場合、非侵襲的な脳活動の計測が必要であり、この場合、fMRIデータから、より詳細な情報を抽出できるデコーディング技術が発達してきている(たとえば、非特許文献1)。特に、fMRIが脳におけるボクセル単位(volumetric pixel : voxel)で脳活動を解析することで、脳活動の空間的パターンから、刺激入力や認識状態を推定することが可能となっている。
さらに、このようなデコーディング技術を発展させた技術として、特許文献3には、神経・精神疾患に対して、脳機能画像法によるバイオマーカーを実現するための脳活動解析方法が開示されている。この方法では、健常群、患者群において測定された安静時機能結合的MRIのデータから、それぞれの被験者について、所定の脳領域間の活動度の相関行列を導出する。被験者の疾患/健常ラベルを含む被験者の属性と相関行列とについて正則化正準相関解析により特徴抽出が行われる。正則化正準相関解析の結果に基づいて、スパースロジスティック回帰(Sparse Logistic Regression: SLR)による判別分析によりバイオマーカーとして機能する判別器が生成される。このような機械学習の技術により、安静時のfMRI データから導き出される脳領野間の結合にもとづいて神経疾患の診断結果を予測可能であることが示された。しかも、その予測性能の検証は1つの施設において計測された脳活動のみではなく、他の施設で計測された脳活動に対しても、ある程度の汎化が可能であることが示された。
さらに、このようなバイオマーカについて、汎化性能を向上させるための技術改良もなされている(特許文献4)。
また、最近では、米国のヒューマンコネクトームプロジェクトのように、大規模な脳画像データを得て共有することは、基礎的な神経科学研究と、精神疾患の診断および治療のような臨床応用の間のギャップを埋めることにとって重要な意味を持つ、と認識されている (非特許文献2)。
2013年には、日本の国立研究開発法人 日本医療研究開発機構が、8つの研究所が2,239のサンプルおよび5つの疾患を含む複数サイトの安静時の機能的磁気共鳴(安静時の機能MRI)データを収集し、公にSRPBS(Strategic Research Program for Brain Sciences,https://www.amed.go.jp/program/list/01/04/001_nopro.html)の複数サイトの複数疾患のデータベース(https://bicr-resource.atr.jp/decnefpro/)を通じてそれらを共有するという、デコーディッドニューロフィードバック(DecNef)プロジェクトを組織した。このプロジェクトは、完全に独立したコホートに汎化することができる、いくつかの精神疾患の、安静時の機能的なコネクティビティ(安静時の機能結合MRI)に基づくバイオマーカーを同定した。
ただし、大規模に脳画像データを収集することは、健常者についても、そして、特に、患者に対しては容易ではない。
さらに、大規模なデータ収集をするために、複数のサイトでの計測を実施すると、各計測サイトでの計測データのサイト間差が問題となる。
たとえば、複数の計測サイトで、MRI計測をした場合の計測データのサイト間差を評価するために、複数のサイトへ多数の参加者が移動しつつ測定を受けるという、いわゆる「トラベリングサブジェクト」を採用することにより、安静時の機能的なコネクティビティに対する測定バイアスの効果を調査するという試みも実施されている(非特許文献3、非特許文献4)。
再表2006−132313号公報
特開2011−000184号公報
特開2015−62817号公報
特開2017−196523号公報
Kamitani Y, Tong F. Decoding the visual and subjective contents of the human brain. Nat Neurosci. 2005; 8: 679-85.
Glasser MF, et al. The Human Connectome Project's neuroimaging approach. Nat Neurosci 19, 1175-1187 (2016).
Noble S, et al. Multisite reliability of MR-based functional connectivity. Neuroimage 146, 959-970 (2017).
Pearlson G. Multisite collaborations and large databases in psychiatric neuroimaging advantages, problems, and challenges. Schizophr Bull 35, 1-2 (2009).
以上のように、機能的磁気共鳴画像法などの脳機能画像法による脳活動の解析の神経・精神疾患の治療への応用を考えた場合、たとえば、上述したようなバイオマーカーとして、脳機能画像法による脳活動の解析は、非侵襲的な機能マーカーとして、診断法の開発、根本治療を実現するための創薬に向けた標的分子の探索・同定などへの応用も期待される。
たとえば、これまで、自閉症などの精神疾患に対しては、遺伝子を用いた実用的なバイオマーカーの完成には至っておらず、それゆえに、薬物の効果判定などが困難であるため、治療薬の開発も困難であった。
脳活動の計測データに基づいて、機械学習により判別器を生成し、これをバイオマーカーとして実用化させるためには、1つの施設において計測された脳活動に対して機械学習により生成されたバイオマーカーの予測精度の向上が必要である。また、このようにして生成されたバイオマーカーが、他の施設において計測された脳活動に対しても、汎化可能であることが必要である。
すなわち、脳活動の計測データに基づく、機械学習により判別器を構築する際には、主な2つの課題が存在する。
第1の課題は、小標本サイズの問題である。
被験者の人数であるデータ量Nが、計測された脳活動計測データの次元Mよりはるかに小さいので、判別器のパラメーターは、容易に訓練データに過剰適合することになる。
この過剰適合のために、構築された判別器は、新しくサンプリングされたテスト・データについては、非常に貧弱なパフォーマンスを示すことになる。これは、これらのテスト・データは判別器を訓練するのに使用されていないものだからである。
したがって、判別器の望ましい汎化に対して本質的な特徴量だけを識別し利用するために正則化を適切に導入する必要がある。
第2の課題は、構築された判別器が、訓練データが集められたサイトとは異なる撮像サイトで走査されたMRIデータに対しても、よいパフォーマンスを維持する場合のみ、判別器が臨床的に有用で、科学的に信頼できるということである。
これは撮像サイトにわたる、いわゆる汎化能力である。
精神疾患と関連する大規模な脳画像データを集める際には、脳画像は、1つのサイトで取得できるデータの量には制限があるため、複数のサイトから取得する必要がある。 しかしながら、複数サイトでの脳画像データを取得する場合、サイト間差は最も大きな障壁となる。
すなわち、臨床応用では、異なるサイトで走査されたデータに、特定のサイトで取得したデータを使用して訓練された判別器を汎化することができないことはしばしば観測されている。
このため、上述したヒューマンコネクトームプロジェクトでは、これまでのところ、単一サイトで、単一のスキャナを用いた計測を行うこととされている。
この発明は、上記のような問題点を解決するためになされたものであって、その目的は、複数施設から取得された脳計測データに基づいて、各施設における測定バイアスを調整および補正することが可能な機能結合相関値の調整方法、機能結合相関値の調整システムを提供することである。
この発明は、他の目的は、複数施設から取得された脳計測データをハーモナイズして、神経・精神疾患に対しての診断を支援するための脳機能画像法による判別処理を実現するための脳活動分類器のハーモナイズ方法、脳活動分類器のハーモナイズシステム、脳活動解析装置および脳活動解析方法を提供することである。
この発明の他の目的は、脳活動計測によるバイオマーカーを実現するための脳活動解析装置、脳活動解析方法および脳活動バイオマーカシステム、脳活動バイオマーカシステムのプログラムを提供することである。
この発明の1つの局面に従うと、複数の計測サイトで計測される被験者の脳機能結合相関値の補正を行うための脳機能結合相関値の調整方法であって、複数の計測サイトの各々において共通に計測対象となる複数の移動被験者に対して、各移動被験者の予め定められた複数の脳領域について脳活動を計測するステップと、複数の脳領域の組についての脳活動の時間相関を表す脳機能結合行列の所定の要素を各移動被験者について算出するステップと、一般化線形混合モデル法を用いることで、機能結合行列の所定の要素ごとに、複数の計測サイトおよび複数の移動被験者にわたる当該要素の平均に対する各計測サイトにおける固定効果として、測定バイアスを算出するステップと、各計測サイトで計測される被験者の脳活動の時間相関を表す脳機能結合行列の所定の要素である脳機能結合相関値を測定バイアスを用いて補正することで、調整値を得るステップとを含む。
この発明の他の局面に従うと、対象者の脳機能結合相関値の補正を行うための、脳機能結合相関値の調整システムであって、複数の被験者の脳活動を時系列で計測するために、複数の計測サイトにそれぞれ設けられた複数の脳活動計測装置と、脳機能結合相関値の補正を行うための計算処理システムとを備え、計算処理システムは、データを格納するための記憶装置を含み、記憶装置は、複数の計測サイトの各々において共通に計測対象となる複数の移動被験者に対して、各移動被験者の予め定められた複数の脳領域について脳活動を計測した結果を格納し、演算装置をさらに含み、演算装置は、複数の脳領域の組についての脳活動の時間相関を表す脳機能結合行列の所定の要素を各移動被験者について算出し、一般化線形混合モデル法を用いることで、機能結合行列の所定の要素ごとに、複数の計測サイトおよび複数の移動被験者にわたる当該要素の平均に対する各計測サイトにおける固定効果として、測定バイアスを算出し、各計測サイトで計測される被験者の脳活動の時間相関を表す脳機能結合行列の所定の要素である脳機能結合相関値を測定バイアスを用いて補正することで、調整値を算出する。
この発明のさらに他の局面に従うと、複数の計測サイトで計測される複数の被験者の少なくとも1つの属性に対する分類処理を実行するための脳活動分類器のハーモナイズ方法であって、複数の計測サイトの各々において共通に計測対象となる複数の移動被験者に対して、各移動被験者の予め定められた複数の脳領域について脳活動を計測するステップと、複数の脳領域の組についての脳活動の時間相関を表す脳機能結合行列の所定の要素を各移動被験者について算出するステップと、一般化線形混合モデル法を用いることで、機能結合行列の所定の要素ごとに、複数の計測サイトおよび複数の移動被験者にわたる当該要素の平均に対する各計測サイトにおける固定効果として、測定バイアスを算出するステップと、各計測サイトで計測される複数の訓練データ対象の被験者の脳活動の時間相関を表す脳機能結合行列の所定の要素である脳機能結合相関値を測定バイアスを用いて補正することで、調整値をそれぞれ得るステップと、調整値に基づいて、属性に対する分類器を、特徴選択を伴う機械学習法により生成するステップと、を備える。
好ましくは、各計測サイトで脳活動を計測される複数の訓練データ対象の被験者は、属性を有する第1の群と、属性を有さない第2の群とを含み、測定バイアスを算出するステップは、一般化線形混合モデル法を用いることで、機能結合行列の所定の要素ごとに、複数の計測サイトおよび複数の移動被験者並びに複数の訓練データ対象の被験者にわたる当該要素の平均に対する各計測サイトにおける固定効果として、測定バイアス並びに第1の群の標本バイアスおよび第2の群の標本バイアスを算出するステップを含む。
好ましくは、一般化線形混合モデル法においては、L2正規化による最小二乗回帰により、測定バイアスを算出する。
好ましくは、特徴選択を伴う機械学習法は、LASSO(least absolute shrinkage and selection operator)を使用するロジスティックスの回帰分析法である。
この発明のさらに他の局面に従うと、対象者の脳活動の計測結果に基づいて、少なくとも1つの属性に対する分類処理を実行するための脳活動分類器のハーモナイズシステムであって、複数の被験者の脳活動を時系列で計測するために、複数の計測サイトにそれぞれ設けられた複数の脳活動計測装置と、脳機能結合相関値の補正を行うための計算処理システムとを備え、計算処理システムは、データを格納するための記憶装置を含み、記憶装置は、複数の計測サイトの各々において共通に計測対象となる複数の移動被験者に対して、各移動被験者の予め定められた複数の脳領域について脳活動を計測した結果を格納し、演算装置をさらに含み、演算装置は、複数の脳領域の組についての脳活動の時間相関を表す脳機能結合行列の所定の要素を各移動被験者について算出し、一般化線形混合モデル法を用いることで、機能結合行列の所定の要素ごとに、複数の計測サイトおよび複数の移動被験者にわたる当該要素の平均に対する各計測サイトにおける固定効果として、測定バイアスを算出し、各計測サイトで計測される複数の訓練データ対象の被験者の脳活動の時間相関を表す脳機能結合行列の所定の要素である脳機能結合相関値を測定バイアスを用いて補正することで、調整値をそれぞれ算出し、調整値に基づいて、属性に対する分類器を、特徴選択を伴う機械学習法により生成する。
好ましくは、各計測サイトで脳活動を計測される複数の訓練データ対象の被験者は、属性を有する第1の群と、属性を有さない第2の群とを含み、演算装置は、測定バイアスを算出する際に、一般化線形混合モデル法を用いることで、機能結合行列の所定の要素ごとに、複数の計測サイトおよび複数の移動被験者並びに複数の訓練データ対象の被験者にわたる当該要素の平均に対する各計測サイトにおける固定効果として、測定バイアス並びに第1の群の標本バイアスおよび第2の群の標本バイアスを算出する。
好ましくは、一般化線形混合モデル法においては、L2正規化による最小二乗回帰により、測定バイアスを算出する。
好ましくは、特徴選択を伴う機械学習法は、LASSOを使用するロジスティックスの回帰分析法である。
この発明のさらに他の局面に従うと、対象者の脳活動の計測結果に基づいて、少なくとも1つの疾患の有無の属性に対する分類処理を実行するための脳活動分類器を用いた脳活動バイオマーカシステムであって、複数の被験者の脳活動を時系列で計測するために、複数の計測サイトにそれぞれ設けられた複数の脳活動計測装置と、脳機能結合相関値の補正を行うための計算処理システムとを備え、計算処理システムは、記憶装置と演算装置を含み、演算装置は、各計測サイトで計測される複数の被験者の脳活動の時間相関を表す脳機能結合行列の所定の要素である脳機能結合相関値を測定バイアスを除去するように補正することで、補正された調整値をそれぞれ算出して記憶装置に格納し、調整値に基づいて、疾患の有無の属性に対する分類器を、第1の特徴選択を伴う機械学習により生成する。
好ましくは、記憶装置は、複数の計測サイトの各々において共通に計測対象となる複数の移動被験者に対して、各移動被験者の予め定められた複数の脳領域について脳活動を計測した結果を予め格納しており、演算装置は、複数の脳領域の組についての脳活動の時間相関を表す脳機能結合行列の所定の要素を各移動被験者について算出し、一般化線形混合モデル法を用いることで、機能結合行列の所定の要素ごとに、複数の計測サイトおよび複数の移動被験者にわたる当該要素の平均に対する各計測サイトにおける固定効果として、測定バイアスを算出する。
好ましくは、前記演算装置は、複数の計測サイトのいずれかで計測された対象者についての計測データに基づいて、疾患の有無の属性に対する分類処理を実行する。
好ましくは、演算装置は、第1の特徴選択を伴う機械学習において、i)調整値を、機械学習用のトレーニングデータセットと検証用のテストデータセットとに分割し、ii)トレーニングデータセットに対して、アンダーサンプリングおよびサブサンプリングを所定数だけ実行して、所定数のサブサンプルを生成し、iii)サブサンプルごとにスパースモデリング法による特徴選択により分類器サブモデルを生成し、iv)特徴選択に基づいて、疾患の有無の属性に対する分類器を生成する。
好ましくは、第1の特徴選択を伴う機械学習は、外側の交差検証と内側の交差検証を有する入れ子構造の交差検証であり、演算装置は、入れ子構造の交差検証の処理において、i)外側の交差検証をK分割交差検証として、調整値を、機械学習用のトレーニングデータセットと検証用のテストデータセットとに分割し、ii)トレーニングデータセットに対して、アンダーサンプリングおよびサブサンプリングを所定数だけ実行して、所定数のサブサンプルを生成し、iii)K分割交差検証の各ループにおいて、内側の交差検証で、サブサンプルごとに分類器サブモデルを生成し、iv)分類器サブモデルに基づいて、疾患の有無の属性に対する分類器を生成する。
好ましくは、記憶装置は、複数の被験者ごとに、疾患の評価尺度の情報を格納しており、演算装置は、調整値に基づいて、疾患の評価尺度に対する回帰モデルを、第2の特徴選択を伴う機械学習により生成し、第1の特徴選択および第2の特徴選択により共通に抽出される脳機能結合を特定する。
この発明のさらに他の局面に従うと、対象者の脳活動の計測結果に基づいて、少なくとも1つの疾患の有無の属性に対する分類処理を実行するための脳活動分類器を用いた脳活動バイオマーカシステムの動作を制御するコンピュータプログラムであって、脳活動バイオマーカシステムは、複数の被験者の脳活動を時系列で計測するために、複数の計測サイトにそれぞれ設けられた複数の脳活動計測装置と、記憶装置と演算装置とを有し、脳機能結合相関値の補正を行うための計算処理システムと含み、コンピュータプログラムは、演算装置に、各計測サイトで計測される複数の被験者の脳活動の時間相関を表す脳機能結合行列の所定の要素である脳機能結合相関値を測定バイアスを除去するように補正することで、補正された調整値をそれぞれ算出して記憶装置に格納するステップと、調整値に基づいて、疾患の有無の属性に対する分類器を、第1の特徴選択を伴う機械学習により生成するステップと、を実行させる。
好ましくは、記憶装置は、複数の計測サイトの各々において共通に計測対象となる複数の移動被験者に対して、各移動被験者の予め定められた複数の脳領域について脳活動を計測した結果を予め格納しており、コンピュータプログラムは、演算装置に、複数の脳領域の組についての脳活動の時間相関を表す脳機能結合行列の所定の要素を各移動被験者について算出するステップと、一般化線形混合モデル法を用いることで、機能結合行列の所定の要素ごとに、複数の計測サイトおよび複数の移動被験者にわたる当該要素の平均に対する各計測サイトにおける固定効果として、測定バイアスを算出するステップと、を実行させる。
好ましくは、前記演算装置に、複数の計測サイトのいずれかで計測された対象者についての計測データに基づいて、疾患の有無の属性に対する分類処理を行うステップをさらに実行させる。
好ましくは、演算装置は、第1の特徴選択を伴う機械学習において、i)調整値を、機械学習用のトレーニングデータセットと検証用のテストデータセットとに分割するステップと、ii)トレーニングデータセットに対して、アンダーサンプリングおよびサブサンプリングを所定数だけ実行して、所定数のサブサンプルを生成するステップと、iii)サブサンプルごとにスパースモデリングによる特徴選択により分類器サブモデルを生成するステップと、iv)特徴選択に基づいて、疾患の有無の属性に対する分類器を生成するステップとを実行する。
好ましくは、第1の特徴選択を伴う機械学習は、外側の交差検証と内側の交差検証を有する入れ子構造の交差検証であり、演算装置は、入れ子構造の交差検証の処理において、
i)外側の交差検証をK分割交差検証として、調整値を、機械学習用のトレーニングデータセットと検証用のテストデータセットとに分割するステップと、ii)トレーニングデータセットに対して、アンダーサンプリングおよびサブサンプリングを所定数だけ実行して、所定数のサブサンプルを生成するステップと、iii)K分割交差検証の各ループにおいて、内側の交差検証で、サブサンプルごとに分類器サブモデルを生成するステップと、iv)分類器サブモデルに基づいて、疾患の有無の属性に対する分類器を生成するステップとを実行する。
好ましくは、記憶装置は、複数の被験者ごとに、疾患の評価尺度の情報を格納しており、演算装置は、調整値に基づいて、疾患の評価尺度に対する回帰モデルを、第2の特徴選択を伴う機械学習により生成するステップと、第1の特徴選択および第2の特徴選択により共通に抽出される脳機能結合を特定するステップとを実行する。
この発明によれば、複数の施設で計測される脳の活動の計測データに対して、各施設における測定バイアスを調整および補正することが可能である。これにより、複数の施設での計測データに基づく、脳機能結合相関値を調整することが可能となる。
また、この発明によれば、複数の施設で計測される脳の活動の計測データをハーモナイズして、健常または疾患の状態を客観的に判断するためのデータを提供することが可能な、脳活動分類器のハーモナイズ方法、脳活動分類器のハーモナイズシステム、脳活動解析システムおよび脳活動解析方法を実現することができる。
あるいは、この発明によれば、複数の施設で計測される脳の活動の計測データに対して、神経・精神疾患について、脳機能画像法による脳活動バイオマーカシステム、脳活動バイオマーカシステムのプログラムを実現することが可能となる。
複数の計測サイトに設置されたMRI計測システムにより計測されたデータについて、ハーモナイゼーション処理を説明するための概念図である。 被験者の脳の関心領域(ROI:Region of Interest)について、安静時の機能結合の相関を示す相関行列を抽出する手続きを示す概念図である。 「測定パラメータ」および「被験者属性データ」の内容の例を示す概念図である。 各計測サイトに設置されるMRI装置100.i(1≦i≦Ns)の全体構成を示す模式図である。 データ処理部32のハードウェアブロック図である。 本実施の形態のrs-fcMRI法において、サイト間を移動しながら計測を受ける移動被験者によるサイト間差の評価手法を説明するための概念図である。 被験者aのb番目の機能的なコネクティビティの表現を説明するための概念図である。 相関行列から、バイオマーカーとなる判別器を生成する過程を説明する概念図である。 ハーモナイゼーション処理、判別器生成処理、判別処理を実行する計算処理システム300の構成を説明するための機能ブロック図である。 ハーモナイゼーション処理、判別器生成処理、判別処理を実行する計算処理システム300の構成をより詳しく説明するための機能ブロック図である。 ハーモナイゼーション処理を説明するためのフローチャートである。 判別処理部3000が、被験者に対する疾患あるいは健常ラベルについての判別器を生成する処理を示すフローチャートである。 ハーモナイゼーション処理が実行された後に、新たな計測サイトが追加された場合のハーモナイゼーション処理を説明するための概念図である。 ハーモナイゼーション処理に使用する、多疾患データベースのデータとトラベリングサブジェクトのデータセットとを示す概念図である。 SRPBSの多疾患データセットの内容を示す図である。 各計測サイトにおける撮像プロトコルを示す図である。 主成分分析によるサイト間差および疾患効果を視覚化を示すグラフである。 階層的クラスタリング分析による樹状図である。 各要因についての寄与サイズを示す図である。 「標本バイアス」の背景にあるメカニズムを示す概念図である。 ハーモナイゼーションプロセスの影響を視覚化した図であり、図17と対比される図である。 MDDに対する分類器の分類性能を示す図である。 SCZに対する分類器の分類性能を示す図である。 MDD分類器の独立コホートに対する性能を示す図である。 SCZ分類器の独立コホートに対する性能を示す図である。 独立したコホートの中の実年齢および予測された年齢の散布図を示す図である。 独立したコホートの中の実年齢および予測された年齢の散布図を示す図である。 データ収集、推定処理および対象者の脳活動計測を、分散して処理する場合の一例を示す機能ブロック図である。 実施の形態3のトラべりンングサブジェクトの巡回方式を示す図である。 学習用のデータセット(データセット1)のデモグラフィック特性を示す図である。 独立検証のデータセット(データセット2)のデモグラフィック特性を示す図である。 分類器を生成するための機械学習の手続きを説明するためのフローチャートである。 全撮像サイトについて、学習用データセットに対するMDDの予測性能(出力の確率分布)を示す図である。 各撮像サイトについて、学習用データセットに対するMDDの予測性能(分類器の出力の確率分布)を示す図である。 独立した検証データセットにおけるMDDの分類器の出力の確率分布を示す図である。 各撮像サイトについて、独立検証データセットに対するMDDの分類器の出力の確率分布を示す図である。 精神疾患(たとえば、大うつ病性障害)の診断と症候とに、共通な脳内の機能的結合を導き出す手続きの概念図である。 症候の評価尺度(たとえば、ベックうつ病自己評価尺度II)を予測するような回帰モデル生成する手続きを説明するためのフローチャートである。 学習用データセットに基づいて生成された回帰モデルの予測性能を示す図である。 独立した検証データセットにおけるBDIスコアに対する回帰モデルの性能を示す図である。 MDD分類器とBDI回帰モデルの双方の構築において、共通する7つの脳の機能的結合FCの空間分布を示す図である。 共通する7つの脳の機能的結合FCの特性を示すリストを示す図である。 共通の機能的結合FCにおける学習用データセットおよび独立した検証データセットの間の機能的結合FCの値を示す図である。
以下、本発明の実施の形態のMRI計測システムの構成について、図に従って説明する。なお、以下の実施の形態において、同じ符号を付した構成要素および処理工程は、同一または相当するものであり、必要でない場合は、その説明は繰り返さない。
また、本実施の形態では、複数の施設に設置された「脳活動計測装置」、より具体的には、「MRI計測システム」によって、脳の複数の領野間の脳活動を時系列で計測し、これらの領野間の時間相関のパターンに基づいて、被験者を分類するものとして本発明を説明する。
そして、このような「MRI計測システム」が、複数の異なる施設に設置されており、後述するように、これらの計測施設(計測サイト)間での計測に対するサイト間差を、測定機器を原因とする測定バイアスと、計測サイトにおける被験者のポピュレーションによる差(標本バイアス)とを独立に評価する。その上で、各計測サイトにおける計測値について、測定バイアスの効果を除いてサイト間差を補正する処理を実施することで、計測サイト間での測定結果に対する調和処理(ハーモナイゼーション)を実現する。
[実施の形態1]
図1は、複数の計測サイトに設置されたMRI計測システムにより計測されたデータについて、ハーモナイゼーション処理を説明するための概念図である。
図1を参照して、計測サイトMS.1〜MS.Ns(Ns:サイト数)には、それぞれ、MRI装置100.1〜100.Nsが設置されているものとする。
また、計測サイトMS.1〜MS.Nsにおいては、それぞれ、被験者群PA.1〜PA.Nsの計測が行われる。被験者群PA.1〜PA.Nsの各々には、少なくとも2つ以上に分類される群、たとえば、患者群と健常者群とが含まれるものとする。また、患者群としては、特に限定されないが、たとえば、精神疾患の患者、より特定的には、「大うつ病の患者」の群が相当するものとする。
そして、各計測サイトにおいては、原則として、MRI装置の仕様上、可能な範囲で、統一した計測プロトコルで被験者の計測が実施されるものとする。
ここで、特に限定されないが、計測プロトコルとしては、たとえば、以下のような内容が規定されているものとする。
1)頭部のスキャンを実行する方向
たとえば、頭部の後側(posterior:以下、“P”と略記する)から前側(anterior:以下、“A”と略記する)に向かう方向(以下、「P→A方向」と呼ぶ)と、逆の方向、すなわち、前側から後側に向かう方向(以下、「A→P方向」と呼ぶ)にスキャンを行うのかを規定する必要がある。状況によっては、両方の場合のスキャンを行うことを規定することもあり得る。
MRI装置によって、デフォルトの方向が違っていたり、あるいは、両方を任意に設定できない場合もあり得る。
スキャンの方向は、たとえば、画像としての「ひずみ方」を規定する可能性があり、プロトコルとして、条件を設定する。
2)脳構造画像の撮像条件
いわゆるスピンエコー法により、「T1強調画像」や「T2強調画像」のいずれか、または両方を撮像する条件を設定する。
3)脳機能画像の撮像条件
fMRI(functional Magnetic Resonance Imaging)法により、「安静時」の被験者の脳機能画像を撮像する条件を設定する。
4)拡散強調画像の撮像条件
拡散強調画像(DWI:diffusion (weighted) image)を撮像するか否か、そしてその条件について設定する。
拡散強調画像とは、MRI撮像のシーケンスの一種で、水分子の拡散運動を画像化したものである。通常用いられるスピンエコー法のパルス系列では拡散による信号の減衰は無視できるが、大きな傾斜磁場が長時間にわたって印加されると、その間の各磁化ベクトルの移動によって生じる位相のずれが無視できなくなり、拡散が活発な領域ほど低信号として現れる、ことを利用するものである。
5)EPI歪みを画像処理で補正するための撮像
たとえば、EPI歪みを画像処理で補正するための1つの方法として、「フィールドマップ法」が知られており、空間歪みの補正に対する撮像の条件を設定する。
フィールドマップ法は、多重エコー時間によってEPI画像を収集し、これらのEPI画像に基づいてEPI歪みの量を算出する。フィールドマップ法を適用して、新規の画像に含まれるEPI歪みを補正することができる。異なるエコー時間による同一の解剖学的構造の一組の画像を前提として、EPI歪みを計算して、画像の歪みを補正することが可能である。
たとえば、以下の公知文献に、「フィールドマップ法」が開示されている。
公知文献1 : 特開2015-112474号明細書
なお、計測プロトコルには、上記の条件の中から適宜、必要となるシーケンス部分を抜き出してもよいし、必要に応じて、他のシーケンスやその条件を追加してもよい。
再び、図1を参照して、各計測サイトMS.1〜MS.Nsにおいて、計測を行う被験者として採用することを、「サンプリングする」と呼び、各計測サイトでのサンプリングの偏りにより生じる、計測値のサイト間差の原因を、「標本バイアス」と呼ぶ。
たとえば、上述した例では、従来の診断基準で、「大うつ病」と診断される患者には、実は、いくつかのサブタイプが含まれることが知られている。
典型的には、メランコリー型うつ病、非メランコリー型うつ病、治療抵抗性うつ病などである。各計測サイトでは、当該計測サイトの病院に来院する患者の地域性に由来する性向の偏りや、当該病院での診断の傾向等々のさまざまの要因により、一口に、「大うつ病」の患者といったとしても、その患者群に含まれるサブタイプの分布が均一であるとは、必ずしも言えない。この結果、各計測サイトの患者群には、そのサブタイプの分布に、偏りが生じることが、むしろ一般的であり、その結果、上述した「標本バイアス」が生じると考えられる。
また、「健常群」と呼ばれる被験者の群であっても、その中には、複数のサブタイプが存在することが一般であり、その点では、「健常群」においても、「標本バイアス」が存在することになる。
また、MRI装置100.1〜100.Nsも、各計測サイトで決して同一計測特性を有するMRI装置が使用されているとは言えない。
たとえば、MRI装置の製造メーカ、MRI装置の型番、MRI装置の静磁場強度、MRI装置における(送)受信コイルのコイル数(チャンネル数)、等々、MRI装置の条件、MRI装置の計測条件などの測定条件に応じて、計測データのサイト間差異が生じうる。このような測定条件により生じるサイト間差異のことを「測定バイアス」と呼ぶ。
仮に、同一のMRI装置の製造メーカの同一の型番のMRI装置であっても、装置の固有な個性により、完全に同一の計測特性を実現するとも、必ずしも言えない。
ここで、(送)受信コイルは、計測される信号のSN比を向上させることを目的として、「マルチアレイコイル」が採用されることが一般的である。「受信コイルのコイル数」とは、マルチアレイコイルを構成する「エレメントコイル」の個数を指す。個々のエレメントコイルの感度を高め,この出力を束ねることで受信感度の向上を図るものである。
そして、後に説明するような手法により、本実施の形態では、「標本バイアス」と「測定バイアス」とを独立に評価することを可能とする。
再び、図1を参照して、各計測サイトMS.1〜MS.Nsのそれぞれからの計測関連データDA100.1〜DA100.Nsは、データセンター200内の記憶装置210に集積され、格納される。
ここで、「計測関連データ」には、各計測サイトでの「測定パラメータ」と、各計測サイトにおいて計測された「患者群データ」および「健常群データ」とが含まれる。
さらに、「患者群データ」および「健常群データ」には、それぞれ、各々の被験者に対応して「患者のMRI計測データ」および「健常者のMRI計測データ」とが含まれる。
以下では、このような「計測関連データ」について説明する。
図2は、被験者の脳の関心領域(ROI:Region of Interest)について、安静時の機能結合の相関を示す相関行列を抽出する手続きを示す概念図である。
ここで、図1において、「患者群データ」および「健常群データ」における、「患者のMRI計測データ」および「健常者のMRI計測データ」には、少なくとも、以下のようなデータが含まれる。
i)相関行列のデータを算出するための時系列の「脳機能画像データ」、および/または、相関行列のデータ自身
すなわち、図1における計算処理システム300が、記憶装置210内に格納されたデータに基づいて、後述するような脳活動バイオマーカを算出する際の基礎となるデータとして、これらのデータが使用される。
ここで、相関行列のデータについては、時系列の「脳機能画像データ」に基づいて、各計測サイトで計算された後に、記憶装置210内に格納され、計算処理システム300が、この記憶装置210内の相関行列のデータに基づいて、脳活動バイオマーカを算出する、という構成とすることができる。
あるいは、時系列の「脳機能画像データ」が記憶装置210内に格納され、計算処理システム300が、この記憶装置210内の「脳機能画像データ」に基づいて、相関行例のデータを算出し、さらに、脳活動バイオマーカを算出する、という構成とすることも可能である。
したがって、「患者のMRI計測データ」および「健常者のMRI計測データ」の各々については、少なくとも、相関行列のデータを算出するための時系列の「脳機能画像データ」、および、相関行列のデータ自身のいずれか一方が含まれることになる。
ii)被験者の構造画像データ、および、拡散強調画像データ
なお、特に限定されないが、EPI歪みを画像処理で補正する処理については、各計測サイトで演算処理がされた後に、記憶装置210内にデータが格納される構成とすることができる。
また、特に、限定されないが、個人情報保護の観点から、記憶装置210内へデータが格納される前に、各計測サイトにおいて、匿名加工処理を実行する構成とすることが可能である。ただし、匿名加工処理については、計算処理システム300を運営する主体が、法規制上、個人情報を扱うことが認められている場合は、計算処理システム300において実行する構成としてもよい。
図2に戻って、図2(a)に示すように、リアルタイムで測定した安静時のfMRIのn個(n:自然数)の時刻分のfMRIデータから、各関心領域の平均的な「活動度」を算出し、図2(b)に示すように、脳領域間(関心領域間)の機能的なコネクティビティ(「活動度の相関値」)の相関行列を算出する。
機能的なコネクティビティは、各参加者に対して2つの脳領域間の安静時の機能MRIの血中酸素濃度に依存する(BOLD)信号の時間的な相関性として計算される。
ここで、関心領域としては、上述したようにNc領域を考えているので、相関行列における独立な非対角成分は、対称性を考慮すると、
Nc×(Nc−1)/2(個)
ということになる。
関心領域の設定の方法としては、以下のような方法が想定される。

方法1)“解剖学的な脳領野に基づいて、関心領域を定義する。”
ここでは、脳活動バイオマーカーのために、たとえば、関心領域として140の領域を採用する。
つまり、この方法では、ROIについては、Brain Sulci Atlas (BAL)に含まれる137のROIに加え、 Automated Anatomical Labeling Atlas の小脳(左右)及び虫部のROIを用いる。これら合計140のROI間の機能的結合FCを特徴量として用いる。
ここで、Brain Sulci Atlas (BAL)およびAutomated Anatomical Labeling Atlasについては、以下に開示がある。
公知文献2:Perrot et al., Med Image Anal, 15(4), 2011
公知文献3:Tzourio-Mazoyer et al., Neuroimage, 15(1), 2002
このような関心領域としては、たとえば、以下のような領域である。
背内側前頭前皮質(DMPFC)
前頭前野腹内側部(VMPFC)
前帯状皮質(ACC)
小脳虫部、
左視床、
右下頭頂葉、
右尾状核、
右中後頭葉、
右中帯状皮質
ただし、採用する脳の領野は、このような領域に限定されるものではない。
たとえば、対象とする神経・精神疾患に応じて、選択する領域を変更してもよい。
方法2) “機能的なコネクティビティを、全体の脳をカバーする機能的な脳地図の脳領域に基づいて、定義する。”
ここで、このような機能的な脳地図の脳領域については、以下にような文献にも開示がされており、特に限定されないが、たとえば、268のノード(脳領域)から成る、という構成とすることができる。
公知文献4:Noble S, et al. Multisite reliability of MR-based functional connectivity. Neuroimage 146,959-970 (2017).
公知文献5:Finn ES, et al. Functional connectome fingerprinting: identifying individuals using patterns of brain connectivity. Nat Neurosci 18, 1664-1671 (2015).
公知文献6:Rosenberg MD, et al. A neuromarker of sustained attention from whole-brain functional connectivity. Nat Neurosci 19, 165-171 (2016).
公知文献7:Shen X, Tokoglu F, Papademetris X, Constable RT. Groupwise whole-brain parcellation from resting-state fMRI data for network node identification. Neuroimage 82, 403-415 (2013).

以下では、「方法2」の機能的な脳地図の脳領域に基づいて機能的なコネクティビティを定義する方法を用いるものとして説明する。
たとえば、タンジェント法や部分相関法のような機能的なコネクティビティの計測に対するいくつかの候補がある。
しかしながら、以下では、ピアソンの相関係数を使用する。
前処理されたBOLD信号の可能なノード組の各々の時間経過の間についてのフィッシャーのz変換後のピアソンの相関係数が計算され、要素がそれぞれ2つのノード間のコネクティビティの強度を表わす、268×268の対照的な結合マトリックスを構築するために使用される。
この場合、結合マトリックスの下三角行列の35,778個(つまり、(268×267)/2)の結合強度(コネクティビティ)の値が使用されることになる。
このような相関行列の要素の算出については、特に限定されないが、たとえば、以下のように実行することが可能である。
安静時脳活動データから、各被験者について、異なる関心領域(Region of interest、 ROI)間の機能的結合(Functional connectivity, FC)を計算する。FCは安静時脳活動解析において一般的に利用される特徴量であり、異なるROIの時系列信号間のピアソンの相関係数により定義される。
まず、各ROIに含まれる全ボクセルの平均信号の時系列を抽出する。
特に限定されないが、安静時の機能MRIデータは、以下のような前処理が実施される。データの最初の10秒間は、T1平衡を考慮に入れるために廃棄される。前処理ステップは、スライスタイミングの校正、リアラインメント、T1強調による構造画像による区画化、モントリオール神経学研究所(MNI)空間への規格化、および6mmの半値全幅の等方性のガウスカーネルによる空間スムージングを含んでいる。
相関行列(コネクティビティマトリックス)の分析については、ROIは、最大に類似するボクセルをクラスター化するために開発された上述したような268個ノードの灰白質地図によって記述される。BOLD信号の時間的経過は、これらの268個のROIから抽出される。スプーリアス変化のいくつかを除去するために、6つの運動パラメーター、全脳上の平均信号、白質および脳脊髄液のような36の回帰パラメータによる線形回帰を使用する。微分係数と二次の項もすべてのパラメーターに対して含まれる。
バンドパスフィルタは、低周波の変動に分析を制限するために、0.01Hzと0.08Hzの間の通過帯域を備えた第1オーダーのバターワース・フィルタを使用して、時系列に適用される。
回帰後の残差系列を機能的結合と関連する時系列信号値と考え、異なるROIの時系列間でピアソンの相関係数を計算する。
図3は、「測定パラメータ」および「被験者属性データ」の内容の例を示す概念図である。
「被験者属性データ」は、図1における「患者群データ」または「健常群データ」において、「患者のMRI計測データ」および「健常者のMRI計測データ」に、それぞれ関連づけて格納されているものとする。
図3(a)に示すように、計測サイトを識別するためのサイトIDと、サイト名と、測定パラメータを識別するための条件IDと、計測装置に関する情報と、計測条件に関する情報とを含む。
「測定パラメータ」は、「計測装置に関する情報」と「計測条件に関する情報」とを含む。
「計測装置に関する情報」には、各計測サイトにおいて被験者の脳活動を計測するためのMRI装置のメーカ名と、型番と、(送)受信コイル数とを含む。
なお、「計測装置に関する情報」は、これらのものに限られず、たとえば、静磁場強度、シム調整後の磁場の均一性、等々の他の計測装置の性能を表す指標などを含んでいてもよい。
「計測条件に関する情報」には、画像再構成時の位相エンコードの方向(P→AまたはA→P)、画像種類(T1強調、T2強調、拡散強調など)、撮像シーケンス(スピンエコーなど)、撮像中の被験者の開眼/閉眼、等々の情報が含まれる。
「計測条件に関する情報」も、これらのものに限られるものではない。
図3(b)に示されるように、「被験者属性データ」は、被験者の識別ができないように仮名制御した被験者仮ID,その被験者を計測した際の測定条件を表す条件ID、被験者の属性情報とを含む。
そして、「被験者の属性情報」としては、被験者の性別、年齢、健常または疾患のいずれかを示すラベル、医師による被験者の診断病名、被験者への投薬履歴、診断履歴などの情報が含まれる。
なお、「被験者の属性情報」は、必要に応じて、たとえば、計測サイトにおいて、匿名加工処理が行われているものとする。
たとえば、年齢や性別などについては、準識別子(同一属性)のデータがk件以上になるようにデータを変換するなどの処理を行うことで、個人が特定される確率をk分の1以下に低減し特定を困難にする「k-匿名性」を維持するように加工することができる。ここで、「準識別子」とは、「年齢」「性別」「居住地」など単体では特定できないが、組み合わせることで個人の特定が可能になる属性をいう。
また、投薬履歴や診断履歴は、日付のランダム化やシフト化など、必要に応じて、匿名化のための処理を行う。
そして、以下では、「患者のMRI計測データ」および「健常者のMRI計測データ」で、上述した方法で、各被験者の脳領野間の各々について経時的な活動の相関として算出される機能的結合のことを、各領野間について総称して「機能的なコネクティビティConnectivity」と呼ぶことにする。脳領野ごとに、機能的なコネクティビティを区別する必要がある場合は、後述するように、下添え字を付加して区別するものとする。
(MRI装置の構成)
図4は、各計測サイトに設置されるMRI装置100.i(1≦i≦Ns)の全体構成を示す模式図である。
図4においては、1番目の計測サイトのMRI装置100.1を、例示的に、詳しく説明している。他のMRI装置100.2〜100.Nsについても、基本的な構成は同様である。
図4に示すように、MRI装置100.1は、被検者2の関心領域に制御された磁場を付与してRF波を照射する磁場印加機構11と、この被検者2からの応答波(NMR信号)を受信してアナログ信号を出力する受信コイル20と、この被検者2に付与される磁場を制御するとともにRF波の送受信を制御する駆動部21と、この駆動部21の制御シーケンスを設定するとともに各種データ信号を処理して画像を生成するデータ処理部32とを備える。
なお、ここで、被検者2が載置される円筒形状のボアの中心軸をZ軸にとりZ軸と直交する水平方向にX軸及び鉛直方向にY軸を定義する。
MRI装置100.1は、このような構成であるので、磁場印加機構11により印加される静磁場により、被検者2を構成する原子核の核スピンは、磁場方向(Z軸)に配向するとともに、この原子核に固有のラーモア周波数でこの磁場方向を軸とする歳差運動を行う。
そして、このラーモア周波数と同じRFパルスを照射すると、原子は共鳴しエネルギーを吸収して励起され、核磁気共鳴現象(NMR現象;Nuclear Magnetic Resonance)が生じる。この共鳴の後に、RFパルス照射を停止すると、原子はエネルギーを放出して元の定常状態に戻る緩和過程で、ラーモア周波数と同じ周波数の電磁波(NMR信号)を出力する。
この出力されたNMR信号を被検者2からの応答波として受信コイル20で受信し、データ処理部32において、被検者2の関心領域が画像化される。
磁場印加機構11は、静磁場発生コイル12と、傾斜磁場発生コイル14と、RF照射部16と、被検者2をボア中に載置する寝台18とを備える。
被験者2は、寝台18に、たとえば、仰臥する。被験者2は、特に限定されないが、たとえば、プリズムメガネ4により、Z軸に対して垂直に設置されたディスプレイ6に表示される画面を見ることができる。このディスプレイ6の画像により、必要に応じて、被験者2に視覚刺激が与えることもできる。なお、被験者2への視覚刺激は、被験者2の目前にプロジェクタにより画像が投影される構成であってもよい。
このような視覚刺激は、被験者にニューロフィードバックを行う場合は、フィードバック情報の提示に相当する。
駆動部21は、静磁場電源22と、傾斜磁場電源24と、信号送信部26と、信号受信部28と、寝台18をZ軸方向の任意位置に移動させる寝台駆動部30とを備える。
データ処理部32は、操作者(図示略)から各種操作や情報入力を受け付ける入力部40と、被検者2の関心領域に関する各種画像及び各種情報を画面表示する表示部38と、各種処理を実行させるプログラム・制御パラメータ・画像データ(構造画像等)及びその他の電子データを記憶する記憶部36と、駆動部21を駆動させる制御シーケンスを発生させるなどの各機能部の動作を制御する制御部42と、駆動部21との間で各種信号の送受信を実行するインタフェース部44と、関心領域に由来する一群のNMR信号からなるデータを収集するデータ収集部46と、このNMR信号のデータに基づいて画像を形成する画像処理部48と、ネットワークとの間で通信を実行するためのネットワークインタフェース部50を備える。
また、データ処理部32は、専用コンピュータである場合の他、各機能部を動作させる機能を実行する汎用コンピュータであって、記憶部36にインストールされたプログラムに基づいて、指定された演算やデータ処理や制御シーケンスの発生をさせるものである場合も含まれる。以下では、データ処理部32は、汎用コンピュータであるものとして説明する。
静磁場発生コイル12は、Z軸周りに巻回される螺旋コイルに静磁場電源22から供給される電流を流して誘導磁場を発生させ、ボアにZ軸方向の静磁場を発生させるものである。このボアに形成される静磁場の均一性の高い領域に被検者2の関心領域を設定することになる。ここで、静磁場コイル12は、より詳しくは、たとえば、4個の空芯コイルから構成され、その組み合わせで内部に均一な磁界を作り、被験者2の体内の所定の原子核、より特定的には水素原子核のスピンに配向性を与える。
傾斜磁場発生コイル14は、Xコイル、Yコイル及びZコイル(図示省略)から構成され、円筒形状を示す静磁場発生コイル12の内周面に設けられる。
なお、傾斜磁場の均一性を向上させるためにシムコイル(図示せず)が設けられ、「シム調整」が実施される。
これらXコイル、Yコイル及びZコイルは、それぞれX軸方向、Y軸方向及びZ軸方向を順番に切り替えながら、ボア内の均一磁場に対し傾斜磁場を重畳させ、静磁場に強度勾配を付与する。Zコイルは励起時に、磁界強度をZ方向に傾斜させて共鳴面を限定し、Yコイルは、Z方向の磁界印加の直後に短時間の傾斜を加えて検出信号にY座標に比例した位相変調を加え(位相エンコーディング)、Xコイルは、続いてデータ採取時に傾斜を加えて、検出信号にX座標に比例した周波数変調を与える(周波数エンコーディング)。
この重畳される傾斜磁場の切り替えは、制御シーケンスに従って、Xコイル、Yコイル及びZコイルにそれぞれ異なるパルス信号が送信部24から出力されることにより実現される。これにより、NMR現象が発現する被検者2の位置を特定することができ、被検者2の画像を形成するのに必要な三次元座標上の位置情報が与えられる。
ここで、上述のように、3組の直交する傾斜磁場を用いて、それぞれにスライス方向、位相エンコード方向、および周波数エンコード方向を割り当ててその組み合わせにより様々な角度から撮影を行える。たとえば、一般にX線CT装置で撮像されるものと同じ方向のトランスバーススライスに加えて、それと直交するサジタルスライスやコロナルスライス、更には面と垂直な方向が3組の直交する傾斜磁場の軸と平行でないオブリークスライス等について撮像することができる。
RF照射部16は、制御シーケンスに従って信号送信部33から送信される高周波信号に基づいて、被検者2の関心領域にRF(Radio Frequency)パルスを照射するものである。
なお、RF照射部16は、図1において、磁場印加機構11に内蔵されているが、寝台18に設けられたり、あるいは、受信コイル20と一体化されて、送受信コイル20として構成されていてもよい。
受信コイル20は、被検者2からの応答波(NMR信号)を検出するものであって、このNMR信号を高感度で検出するために、被検者2に近接して配置されている。
ここで、受信コイル20には、NMR信号の電磁波がそのコイル素線を切ると電磁誘導に基づき微弱電流が生じる。この微弱電流は、信号受信部28において増幅され、さらにアナログ信号からデジタル信号に変換されデータ処理部32に送られる。
(送)受信コイル20については、上述の通り、SN比の向上のためにマルチアレイコイルが使用される。
すなわち、静磁界にZ軸傾斜磁界を加えた状態にある被験者2に、共鳴周波数の高周波電磁界を、RF照射部16を通じて印加すると、磁界の強さが共鳴条件になっている部分の所定の原子核、たとえば、水素原子核が、選択的に励起されて共鳴し始める。共鳴条件に合致した部分(たとえば、被験者2の所定の厚さの断層)にある所定の原子核が励起され、(古典的な描像では)スピンがいっせいに回転する。励起パルスを止めると、受信コイル20には、今度は、回転しているスピンが放射する電磁波が信号を誘起し、しばらくの間、この信号が検出される。この信号によって、被験者2の体内の、所定の原子を含んだ組織を観察する。そして、信号の発信位置を知るために、XとYの傾斜磁界を加えて信号を検知する、という構成になっている。
画像処理部48は、記憶部36に構築されているデータに基づき、励起信号を繰り返し与えつつ検出信号を測定し、1回目のフーリエ変換計算により、共鳴の周波数をX座標に還元し、2回目のフーリエ変換でY座標を復元して画像を得て、表示部38に対応する画像を表示する。
たとえば、このようなMRIシステムにより、上述したBOLD信号をリアルタイムで撮像し、制御部42により、時系列に撮像される画像について、後に説明するような解析処理を行うことで、安静時機能結合的MRI(rs-fcMRI)の撮像を行うことが可能となる。
図4においては、MRI装置100.1および他の計測サイトにおけるMRI装置100.2〜100.Nsからの計測データ、測定パラメータ、被験者属性データが、データセンター200内の通信インタフェース202を介して記憶装置210に集積され、格納される。さらに、計算処理システム300は、通信インタフェース204を介して、記憶装置210内のデータにアクセスする構成となっている。
図5は、データ処理部32のハードウェアブロック図である。
データ処理部32のハードウェアとしては、上述のとおり、特に限定されないが、汎用コンピュータを使用することが可能である。
図5において、データ処理部32のコンピュータ本体2010は、メモリドライブ2020、ディスクドライブ2030に加えて、演算装置(CPU)2040と、ディスクドライブ2030及びメモリドライブ2020に接続されたバス2050と、ブートアッププログラム等のプログラムを記憶するためのROM2060とに接続され、アプリケーションプログラムの命令を一時的に記憶するとともに一時記憶空間を提供するためのRAM2070と、アプリケーションプログラム、システムプログラム、およびデータを記憶するための不揮発性記憶装置2080と、通信インタフェース2090とを含む。通信インタフェース2090は、駆動部21等と信号の授受を行うためのインタフェース部44および図示しないネットワークを介して他のコンピュータと通信するためのネットワークインタフェース50に相当する。なお、不揮発性記憶装置2080としては、ハードディスク(HDD)やソリッドステートドライブ(SSD:Solid State Drive)などを使用することが可能である。不揮発性記憶装置2080が、記憶部36に相当する。
CPU2040が、プログラムに基づいて実行する演算処理により、データ処理部32の各機能、たとえば、制御部42、データ収集部46、画像処理部48の各機能が実現される。
データ処理部32に、上述した実施の形態の機能を実行させるプログラムは、CD−ROM2200、またはメモリ媒体2210に記憶されて、ディスクドライブ2030またはメモリドライブ2020に挿入され、さらに不揮発性記憶装置2080に転送されても良い。プログラムは実行の際にRAM2070にロードされる。
データ処理部32は、さらに、入力装置としてのキーボード2100およびマウス2110と、出力装置としてのディスプレイ2120とを備える。キーボード2100およびマウス2110が入力部40に相当し、ディスプレイ2120が表示部38に相当する。
上述したようなデータ処理部32として機能するためのプログラムは、コンピュータ本体2010に、情報処理装置等の機能を実行させるオペレーティングシステム(OS)は、必ずしも含まなくても良い。プログラムは、制御された態様で適切な機能(モジュール)を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいれば良い。データ処理部32がどのように動作するかは周知であり、詳細な説明は省略する。
また、上記プログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。
また、計算処理システム300内のハードウェアも、演算処理装置が並列化されていたり、GPGPU(General-purpose computing on graphics processing units)が使用される等の構成上の相違はあり得るものの、基本的な構成は、図5に示したものと同様である。
(脳活動バイオマーカのハーモナイゼーション)
精神疾患と関連したビッグデータを収集するときには、1つのサイトが大規模な脳画像データ(人間の疾患と関係するコネクトーム)を集めることが、ほとんど不可能であるので、複数のサイトから画像データを収集することが必要である。
MRI装置(スキャナー)の型、プロトコルおよび患者層を完全に制御するのは難しい。したがって、収集したデータを解析するには、異種条件下で撮像された脳画像データが用いられる。
特に、疾患要因はサイト要因と交絡する傾向があるので、そのような異種条件下のデータに機械学習技術を適用することで疾患要因を抽出する場合、サイト間差は最も大きな障壁となる。
1つのサイト(あるいは病院)は、ほんの少数のタイプの精神疾患(例えば、サイトAからは主として統合失調症、およびサイトBからは主として自閉症)をサンプリングしがちであるので、交絡が生じることになる。
適切にそのような異種条件下のデータを管理するために、サイト間のデータをハーモナイズ(調和)させることが必要である。
サイト間差は、本質的に2つのタイプのバイアスを含んでいる。
技術的なバイアス(つまり測定バイアス)および生物学的なバイアス(つまり標本バイアス)である。
測定バイアスは、撮像パラメーター、電界の強さ、MRI装置メーカーおよびスキャナの型のようなMRIスキャナの特性の違いを含んでおり、標本バイアスは、サイト間の被験者のグループの相違に関連している。
以下では、標本バイアスとは独立に、測定バイアスと評価して計測データをハーモナイズするための手法について説明する。
(トラベリングサブジェクト法のハーモナイゼーション)
図6は、本実施の形態のrs-fcMRI法において、サイト間を移動しながら計測を受ける移動被験者(以下、「トラベリングサブジェクト」)によるサイト間差の評価手法を説明するための概念図である。
以下に説明するように、本実施の形態では、トラベリングサブジェクトのデータセットを使用して、測定バイアスだけを除くことができるようなハーモナイゼーション法について説明する。
図6を参照して、計測サイトMS.1〜Ms.Nsのサイトを横断して測定バイアスを評価するために、トラベリングサブジェクトTS1(人数:Nts人)のデータセットを取得する。
健康なNts人の参加者の安静時脳活動が、Ns個のサイトの各々で撮像されるものとして、Ns個のサイトは、患者データを撮像したすべてのサイトを含んでいるものとする。
取得されたトラベリングサブジェクトのデータセットは、データセンター200における記憶装置210に移動被験者データとして格納される。
そして、後述するように、計算処理システム300において、「脳活動バイオマーカーのハーモナイズ方法」のための処理が実行される。
トラベリングサブジェクトのデータセットは健常者群だけを含む。また、参加者はすべてのサイトにわたって同じとする。したがって、トラベリングサブジェクトについては、サイト間差は「測定バイアス」のみから成る。
以下に説明する本実施の形態のハーモナイゼーション法では、「脳活動バイオマーカーのハーモナイズ方法」として、各計測サイトにおける計測データについて、「測定バイアス」の影響を除いて補正する処理を行う。
つまり、以下では、「測定バイアス」および「標本バイアス」を、「統計モデリング」手法のなかの「一般化線形混合モデル(GLMM:Generalized Linear Mixed Model)」を用いて評価する。
ここで、通常は、GLM(Generalized Linear Model:一般化線形モデル)は、「応答変数」の確率分布を説明する「説明変数」を組み込んだモデルである。GLMには、「確率分布」「リンク関数」「線形予測子」という主に3つの部品があり、この部品の組み合わせかたを指定することによって、さまざまなタイプのデータを表現できる。
さらに、GLMM(一般化線形混合モデル)は、GLMでは説明できない「人間が測定できない・測定しなかった個体差など」を組み込むことができる統計モデルである。GLMMでは、たとえば、対象がいくつかの部分集合(たとえば、計測場所が異なる部分集合)からなるような場合も、その場所差をモデルに組み込むことができる。別の言い方をすれば、複数の確率分布を部品とする(混合させた)モデルということになる。
たとえば、GLMMについては、以下の文献に開示がある。
公知文献8:久保 拓弥著、「データ解析のための統計モデリング入門」、岩波書店、2012年 第1刷、2017年 第14刷
ただし、以下に説明する本実施の形態の統計モデルでは、通常、「効果」と呼ばれるものについて、「バイアス」と「要因(ファクター)」という用語を、「バイアス」に関しては「測定バイアス」と「標本バイアス」に使用し、「要因(ファクター)」に関しては、その他の要因(被験者要因や疾患要因)に関して使用する。
そして、以下の解析は、単純なGLMMの流れとは異なり、「固定効果」と「ランダム効果」という分け方をせずに要因の解析を行う。これは、通常、GLMMを使用すると、ランダム効果に関しては分散のみが推定され、各要因の効果の大きさがわからなくなるからである。そこで、以下では、各要因の効果の大きさを評価するために、各要因について、平均0の固定効果となるように、以下のように変数を変換して、推定を行う。
i) 各々の機能的なコネクティビティに対する相関値のすべてのサイトにわたる平均からの偏差として、各サイトの測定バイアスを定義する。
ii) 健常者および精神疾患の患者の標本バイアスは、互いに異なると仮定する。したがって、健常者群及び各疾患を有する患者群に対して個別に、各サイトの標本バイアスを計算する。
iii) 疾患要因は、健常群の値からの偏差として定義する。
すなわち、以下では、患者が含まれるデータセットと、トラベリングサブジェクトのデータセットに対して、一般化線形混合効果モデルを以下のように適用する。
トラベリングサブジェクトが、Nts人であり、Ns個の計測サイトのうち、健常者の計測が行われたサイト数をNsh個とし、ある疾患(ここでは、添え字“dis”で表現する)の患者の計測が行われたサイトの個数をNsd個とする。
参加者要因(p)、測定バイアス(m)、標本バイアス(Shc, Sdis)および精神疾患要因(d)は、患者に対する計測結果のデータセットおよびトラベリングサブジェクトのデータセットからのすべての参加者の機能的なコネクティビティの相関値に、回帰モデルを適合させることにより評価される。
以下では、ベクトルは小文字(例えば、m)によって表示され、ベクトルはすべて列ベクトルであると仮定される。
ベクトルの要素は、mkのように添字によって表示される。
脳領野間のn個の相関値からなる機能的コネクティビティベクトル(列ベクトルとする)の回帰モデルは、以下の式のように表される。
参加者の特性を表わすために、1-of-Kのバイナリーコード体系を使用し、サイトkに属する測定バイアスmに対するターゲットベクトル(たとえば、xm)は、1に等しい要素k以外は、全てゼロに等しい。
参加者がどんなクラス(健常者、患者、トラベリングサブジェクト)にも属さなければ、ターゲットベクトルは、すべての要素が0に等しいベクトルである。
上付きの添字Tは、マトリックスかベクトルの置換を表示し、xTは行ベクトルを表わす。
ここで、mは、測定バイアス(Ns×1の列ベクトル)を表し、shcは、健常群の標本バイアス(Nsh×1の列ベクトル)を表し、sdisは、患者の標本バイアス(Nsd×1の列ベクトル)を表し、dは、疾患要因(2×1の列ベクトル、健常および疾患を要素とする)、pは、参加者要因(Nts×1の列ベクトル)を表し、constは、すべての計測サイトからの全ての参加者(健常者、患者、トラベリングサブジェクトを含む)にわたる機能的コネクティビティの平均を表し、e〜N(0,γ-1)は、ノイズを表す。
なお、ここでは、説明の簡略化のための疾患の種類は1種類であるものとして説明している。疾患の種類が複数ある場合については、後述する。
各機能的なコネクティビティの相関値に対しては、回帰モデルの計画行列がランク不足であるので、L2正規化による最小二乗回帰を使用して、それぞれのパラメータを評価する。なお、L2正規化による最小二乗回帰法以外にも、たとえば、ベイズ推定法など別の評価方法を用いることも可能である。
上記のような回帰計算の後には、被験者aのb番目のコネクティビティは、以下のように記述できる:
図7は、被験者aのb番目の機能的なコネクティビティの表現を説明するための概念図である。
図7においては、1項目と2項目のターゲットベクトルの意義と、測定バイアスベクトルおよび健常者の標本バイアスベクトルについて示している。
第3項目以降についても同様である。
図8は、図2で説明したような相関行列から、バイオマーカーとなる判別器を生成する過程を説明する概念図である。
図5に示すように、健常群、患者群において測定された安静時機能結合的MRIのデータから、それぞれの被験者について、計算処理システム300が、脳領域間(関心領域間)の活動度の相関行列を導出する。
続いて、相関行列の非対角成分について、後述するようにして、対応する測定バイアスを導出しておき、その測定バイアスを相関行例の要素の値から減算することで、ハーモナイゼーション処理を実行する。
さらに、ハーモナイゼーション処理が行われた相関行列の要素値と、各被験者についての疾患ラベル(疾患あるいは健常を示すラベル)との間で、過学習を抑制し、特徴選択を伴う判別モデルを算出して(たとえば、正則化ロジスティック回帰を実施して)、判別器を生成する。
図9および図10は、データセンター200の記憶装置210に格納されたデータに基づき、ハーモナイゼーション処理、判別器生成処理、判別処理を実行する計算処理システム300の構成を説明するための機能ブロック図である。
図5においても説明したように、計算処理システム300は、図5に示した構成と同等のハードウェア構成を有する。そこで、以下では、計算処理システム300内のハードウェア部分については、図5中の対応する符号に“´”を付して説明することにする。
図9を参照して、計算処理システム300は、記憶装置210からのデータおよび計算途中で生成されるデータを格納するための記憶装置2080´と、記憶装置2080´内のデータに対して、演算処理を実行する演算装置2040´とを含む。演算装置2040´としては、たとえば、CPUが相当する。
演算装置2040´は、プログラムの実行により、患者群および健常群のMRI計測データ3102について相関行列の要素を算出し、相関行列データ3106として、記憶装置2080´に格納するための相関行列算出部3002と、ハーモナイゼーション処理を実行するハーモナイゼーション算出部3020と、ハーモナイゼーション処理の結果に基づいて、判別器の生成処理および生成された判別器による判別処理を実行する判別処理部3000とを含む。
図10は、図9の構成をより詳しく説明する機能ブロック図であり、図11は、ハーモナイゼーション処理を説明するためのフローチャートである。
図10および図11を参照して、まず、データセンター200の記憶装置210には、各計測サイトから被験者(健常者および患者)のfMRI計測データ、被験者の属性データ、測定パラメータが収集される(図11 S102)。
続いて、トラベリングサブジェクトTS1の脳活動が、特に限定されないが、たとえば、所定の周期(たとえば、1年周期)で、各計測サイトを巡回して計測され、データセンター200の記憶装置210には、各計測サイトからトラベリングサブジェクトのfMRI計測データ、被験者の属性データ、測定パラメータが収集される(図11 S104)。
ハーモナイゼーション算出部3020は、上述したようなGLMM(一般化線形混合モデル)を用いることで、機能的コネクティビティについて、各計測サイトの測定バイアスを評価する(図11 S106)。
このようにして算出された各計測サイトの測定バイアスを、ハーモナイゼーション算出部3020は、記憶装置2080に測定バイアスデータ3108として格納する(図11 S108)。
(判別器生成処理)
図12は、図10に示した判別処理部3000が、被験者に対する疾患あるいは健常ラベルについての判別器を生成する処理を示すフローチャートである。
このような判別器(あるいは分類器)は、被験者を診断するための補助情報(支援情報)を提供する。
図10および図12を参照して、相関値補正処理部3004は、記憶装置2080´に格納されている各計測サイトごとの測定バイアスデータ3108を読出し(図12 S202)、判別器生成の機械学習のための訓練対象となる各被験者の相関行列の非対角成分について、以下の式のようにして、ハーモナイゼーション処理を実行する。
ここで、機能的コネクティビティConnectivityは、ハーモナイゼーション前の機能的コネクティビティベクトルを表し、Csubは、ハーモナイゼーション後の機能的コネクティビティベクトルを表す。また、m(ハット)(以下、文字xの頭部に^が付されたものを“x(ハット)”と表記する)は、上述したようなL2正規化による最小二乗回帰により評価された計測サイトにおける測定バイアスを表す。これにより、機能的コネクティビティConnectivityが計測された計測サイトに対応する測定バイアスが、機能的コネクティビティConnectivityから減算され、ハーモナイゼーション処理を受けることになる(図12 S204)。補正処理が実行された後のデータは、補正後相関値データ3110として、記憶装置2080´に格納される。
なお、以下の文献にも記載されるように、疾患要因は、脳全体のコネクティビティに関係しているわけではなく、コネクティビティの特定の部分集合に関係している、と仮定する。
公知文献9:Yahata N, et al. A small number of abnormal brain connections predicts adult autism spectrum disorder. Nat Commun 7, 11254 (2016).
そこで、続いて、判別器生成部3008により、被験者についての疾患/健常ラベルを含む被験者の疾患ラベルと補正処理後の機能的なコネクティビティとについて、特徴選択のための正則化ロジスティック回帰を実行して判別器を生成する(図12 S206)。
まず、ロジスティック関数は、参加者が疾患クラスに属する確率を以下のように定義するために使用される。
ここで、ysubは、参加者のクラスラベル(診断ラベルが「疾患」のときには、y=1であり、診断ラベルが「健常者」のときには、y=0)であり、wは、重みベクトルを表す。
正則化ロジスティック回帰としては、L1正則化によるLASSO(least absolute shrinkage and selection operator)を使用するロジスティックスの回帰分析を実施することができ、上述したような、35,778個の結合の中から、機能的なコネクティビティの最適な部分集合を選択する。
すなわち、ここで、重みベクトルwは、以下の関数Jを最小化するように決定される。
ここで、nsubは、判別器を生成するための被験者数であり、λは、評価に適用される縮小量を制御するハイパーパラメーターを表わす。
なお、過学習を抑制して、特徴選択とモデル化を実行するための手法としては、LASSOによる正則化ロジスティック回帰に限定されるものではなく、たとえば、以下の文献に開示されるようなスパースロジスティック回帰や、他のスパースベイズ推定法など、他の手法を使用してもよい。
公知文献10:Okito Yamashita, Masa aki Sato, Taku Yoshioka, Frank Tong, and Yukiyasu Kamitani. “Sparse Estimation automatically selects voxels relevant for the decoding of fMRI activity patterns.” NeuroImage, Vol. 42, No. 4, pp. 1414-1429, 2008.
以上により、疾患に対する判別器(脳活動バイオマーカの分類器として機能する)が生成され、判別器生成部3008は、判別器を特定するための情報を記憶装置2080´に、判別器データ3112として格納する(図12 S208)。
なお、たとえば、判別器の分類性能は、トレーニング・データを使用して、交差検証の手続きによって評価することとすることができる。
以上のような処理は、上述したように、特に限定されないが、所定の期間(たとえば、1年)ごとに実施されるものとしてよい。
そして、いずれかの計測サイトに、新たに1人の被験者についての機能的コネクティビティの計測が実行された場合、当該計測サイトの測定バイアスは、所定期間の間は一定と仮定できるので、判別値算出部3010は、入力される当該被験者についての入力データの相関行列の要素の値から、上述した手続きですでに算出されている当該入力データが計測された計測サイトに対応する「測定バイアス」を減算することにより、ハーモナイゼーション処理を実行する。そして、上述した手続きにより、すでに図12の手続きで作成されている「判別器」により、当該被験者についての判別ラベルを判別結果として出力する。
判別結果は、「疾患」「健常」の二者のいずれかを示す値であってもよいし、あるいは、「疾患」「健常」の少なくとも一方の確率を示す値であってもよい。
なお、判別値算出部3010が実施する判別処理に際して、入力される「入力データ」としては、被験者の脳機能活動を表すMRI計測データそのものであってもよいし、あるいは、各計測サイトにおいて被験者の脳機能活動を表すMRI計測データから相関行列の値を計算した後の相関行列の非対角要素である相関値そのもののデータであってもよい。
(新たな計測サイトが追加された場合のハーモナイゼーション算出処理)
図13は、図6において説明したような手続きにより、ハーモナイゼーション処理が実行された後に、新たな計測サイトが追加された場合のハーモナイゼーション処理を説明するための概念図である。
図13を参照して、(Ns+1)個目の計測サイトMS.Ns+1が新たに加わった場合、改めて、トラベリングサブジェクトTS1を、また、この(Ns+1)個の計測サイト全体について、巡回させ、上述したハーモナイゼーション算出処理と同様の手続きを行い、測定バイアスを改めて算出することが可能である。
以上説明したような実施の形態1のような処理を実行するシステムにより、複数の施設で計測される脳の活動の計測データに対して、各施設における測定バイアスを調整および補正することが可能である。これにより、複数の施設での計測データに基づく、脳機能結合相関値を調整することが可能となる。
また、実施の形態1のような処理を実行するシステムによれば、複数の施設で計測される脳の活動の計測データをハーモナイズして、健常または疾患の状態を客観的に判断するためのデータを提供することが可能な脳活動分類器のハーモナイズ方法、脳活動分類器のハーモナイズシステム、脳活動解析システムおよび脳活動解析方法を実現することができる。
あるいは、実施の形態1のような処理を実行するシステムによれば、複数の施設で計測される脳の活動の計測データに対して、神経・精神疾患について、脳機能画像法によるバイオマーカー装置、バイオマーカ装置のプログラムを実現することが可能となる。
[実施の形態1の変形例]
なお、以上の説明では、各計測サイトでは、以下の被験者のデータが取得されていることを前提として、ハーモナイゼーション算出処理について説明した。
i)患者のデータ
ii)健常者のデータ
iii)トラベリングサブジェクトのデータ
ただし、上述した「測定バイアス」の評価のみを目的とするのであれば、トラベリングサブジェクトについて計測したデータに基づいて、GLMM(一般化線形混合モデル)により、「測定バイアス」を評価することとしてもよい。
すなわち、トラベリングサブジェクトが、Nts人であるとする。
参加者要因(p)、測定バイアス(m)は、トラベリングサブジェクトのデータセットからのすべての参加者の機能的なコネクティビティの相関値に、回帰モデルを適合させることにより評価される。
ここでも、ベクトルは小文字(例えば、m)によって表示され、ベクトルはすべて列ベクトルであると仮定される。
ベクトルの要素は、mkのように添字によって表示される。
脳領野間のn個の相関値からなる機能的コネクティビティベクトル(列ベクトルとする)の回帰モデルは、以下の式のように表される。
参加者の特性を表わすために、1-of-Kのバイナリーコード体系を使用し、サイトkに属する測定バイアスmに対するターゲットベクトル(たとえば、xm)は、1に等しい要素k以外は、全てゼロに等しい。
上付きの添字Tは、マトリックスかベクトルの置換を表示し、xTは行ベクトルを表わす。
以上のような構成によって、「測定バイアス」を算出して、ハーモナイゼーション処理を実行する構成とすることも可能である。
実施の形態1の手法と、実施の形態1の変形例の手法との相違点しては,実施の形態1の変形例の手法のようにトラベリングサブジェクトのみを使用する場合には、標本バイアスは考慮しなくてよくなるという利点がある反面、実施の形態1の手法のように患者のデータと健常者のデータとの双方を含んだ方が、推定に使用されるデータ数が多くなるという利点がある。
したがって、標本バイアスを考慮しないことによる測定バイアスの推定精度の向上と、データ数が多いことによる測定バイアスの推定精度の向上とは、互いにトレードオフの関係にあるといえる。
そこで、特に限定されないが、たとえば、現実の運用の中で、各計測サイトにおいて使用する参加者(患者および健常者)のデータ数については、実験的に最適化をすることも可能である。その場合、特に限定されないが、各計測サイトから抽出する参加者の人数を割り振っておき、各計測サイトでは、ランダムに当該人数分のデータを抽出することとしてもよい。
[実際の脳活動計測結果に対するデータおよびその解析]
以下では、実際に公開されている多疾患データベースのデータに対して、上述したようなハーモナイゼーション処理を実行した結果について説明する。
図14は、ハーモナイゼーション処理に使用する、多疾患データベースのデータとトラベリングサブジェクトのデータセットとを示す概念図である。
図14(a)にしめすように、脳科学に対する戦略的研究プログラム(SRPBS:Strategic Research Program for Brain Sciences)における多疾患データベース(https://bicr-resource.atr.jp/decnefpro/)として、公開されているデータを患者群および健常群のデータセットを使用する。
多疾患データセットとして、複数の計測サイト(図14では、サイト1、サイト2、サイト3を、典型的に示す)で計測されたデータは、サイト間差として、精神疾患の患者についてのサンプリングバイアスと、健常者についてのサンプリングバイアスと、測定バイアスとを含む。
一方、図14(b)に示すように、トラベリングサブジェクトについてのデータセットは、複数の計測サイト(図14では、サイト1、サイト2、サイト3を、典型的に示す)で計測されたデータは、サイト間差として、測定バイアスのみを含む。
データセットの同時分析によってサイト間差を測定バイアスおよび標本バイアスに分割することができ、安静時の機能的なコネクティビティ上のそれらの効果サイズを精神疾患のものと定量的に比較する。
測定バイアスについては、定量的に、異なる撮像パラメーター、MRI装置メーカー、各MRIスキャナ中の受信コイルのおよび数について、効果の大きさを比較した。
さらに、メカニズムの根本的な「標本バイアス」に関する2つの対立仮説を検討した: 第1の仮説は、サイトがそれぞれ共通の母集団からの被験者をサンプリングすると仮定する。
この状況では、標本バイアスは、被験者の無作為抽出のために生じることになり、それは、サイト間の偶然の患者の特性の差に帰着する。
第2の仮説は、サイトがそれぞれ異なる部分母集団からの被験者をサンプリングすると仮定する。
この状況では、標本バイアスは、異なる特性を備えた部分母集団からサンプリングするために生じることになる。
例えば、大うつ病性障害の患者の同じ母集団からデータを集めることを複数のサイトが計画すると仮定する。
大うつ病性障害のサブタイプは、非定型うつ病やメランコリー型うつ病のような母集団内に存在する。したがって、1つの部分母集団は、非定型うつ病の多くの患者を含む一方、別の部分母集団は、メランコリー型うつ病の多くの患者を含む可能性がある。
したがって、いくつかの実例では、非定型うつ病はサイトAの患者において、より出現頻度が高く、一方で、メランコリー型うつ病は、サイトBの患者においてより出現頻度が高いかもしれない。
大規模データセットを集めるための基本的なプロトコルは、このような2つの仮説の間で異なることになる。したがって、SRPBSデータセットの特性を最も適切に反映する仮説を決定することが必要である。
前者の仮定の下では、少数のサイトであっても、単に、多くの被験者からデータを集めることが必要になるだけである。
後者の仮定の下では、真に代表的なデータを得るためには、複数のサイトからデータを取得することが、必要となる。
サイト間差に関連したこれらの制限を克服するために、トラベリングサブジェクトのデータセットを使用して、測定バイアスだけを除くことができるようなハーモナイゼーション法を実行する。
新しく提案する方法および既存の方法によってハーモナイズされた複数サイトの安静時の機能結合MRIデータに基づいて、被験者の情報(属性)(例えば、年齢)の回帰モデルおよび精神疾患のバイオマーカーを構築した。
これらの予測モデルの性能が、ハーモナイゼーションの方法に基づいて、どのように変わるか調べた。(使用したデータセット) 以下のような3つの安静時の機能MRIデータセットを使用した: (1)SRPBSの複数疾患のデータセット、
(2)19人のトラベリングサブジェクトデータセット、および
(3)独立した検証用データセット。(SRPBSの多疾患のデータセット)
図15は、SRPBSの多疾患データセットの内容を示す図である。
9つのサイトで診察された、5つの異なる疾患患者および健常な対照群(HC)を含んだこのデータセットは、以下の合計805人の参加者が含まれていた: 9つのサイトからの482人の健常者、5つのサイトからの、161人の大うつ病(MDD)患者、1つのサイトからの49人の自閉症(ASD)患者、1つのサイトからの65人の強迫障害(OCD)の患者、また3つのサイトからの48人の統合失調症(SCZ)患者のデータが含まれる。
図16は、各計測サイトにおける撮像プロトコルを示す図である。
安静時の機能MRIデータは、3つのサイト以外のすべてで統一された撮像プロトコルを使用して得られた。(http://www.cns.atr.jp/rs-fmri-protocol-2/) このデータセットのサイト間差は、測定および標本バイアスの両方を含んでいた。
バイアス評価については、統一プロトコルを使用して得られたデータのみを使用した。
なお、OCD患者はこの統一プロトコルを使用して、スキャンされなかったので、OCDのために疾患要因を評価することは行っていない。
表中の略号は、以下のようである。
ATT:国際電気通信基礎技術研究所のシーメンスTimTrioスキャナ; ATV:国際電気通信基礎技術研究所のシーメンスVerioスキャナ; KUT:京都大学のシーメンスTimTrioスキャナ; SWA:昭和大学; HUH:広島大学病院; HKH:ヒロシマKajikawa病院; COI:COI(広島大学); KPM:京都府立医科大学; UTO:東京大学; ASD:自閉症障害。
MDD:大うつ病性障害。
OCD:強迫障害。
SCZ:統合失調症。
SIE:シーメンスfMRI装置。
GE:GE fMRI装置。
PHI:フィリップスfMRI装置。(トラベリングサブジェクトのデータセット) SRPBSデータセット中の計測サイトを横断して測定バイアスを評価するために、トラベリングサブジェクトのデータセットを取得した。
健康な9人の参加者(すべての男性; 年齢層: 24−32歳; 平均年齢: 27±2.6歳)が、12のサイトの各々で撮像され、12のサイトにはSRPBSデータセットを撮像した9つのサイトを含んでおり、合計411セッションの操作が実施された。
SRPBSの複数疾患のデータセットと同じ撮像プロトコルを使用して、このデータセットを得ることを試みたものの、各サイトのパラメーター・セッティングあるいは慣習的なスキャン条件の制限のために、サイト間では、撮像プロトコルにいくつかの違いがあった
たとえば、2つの位相エンコード方式の方向(P→AとA→P)、3社のMRIメーカー(シーメンス、GEおよびフィリップス)、4つのコイル・チャンネル数(8、12、24および32)および7つのスキャナ・タイプ(TimTrio、Verio、Skyra、スペクトル、MR750W、SignaHDxtおよびAchieva)というような相違が存在する。
同じ9人の参加者が12のサイトにわたって撮像されたので、このデータセットのサイト間差は測定バイアスのみを含んでいた。(独立した検証データセット) 安静時の機能結合MRIデータに基づいた、精神疾患の分類器および参加者の年齢を予測するモデルの汎化性能を検証するために、2つの疾患および7つのサイトをカバーする独立した検証コホートのデータを取得した。
このデータには、合計625人の参加者が含まれていた。
すなわち、6つのサイトからの476人の健常群(HCs)、2つのサイトからのMDDの93人の患者、および1つのサイトからのSCZの56人の患者のデータが取得された。
(サイト間差と疾患効果の視覚化)
最初に、主成分分析(PCA:principal component analysis)によって、SRPBS複数疾患の安静時の機能結合MRIデータセットにおける、サイト間差および疾患効果を視覚化した。
図17は、このような主成分分析によるサイト間差および疾患効果を視覚化を示すグラフである。
ここでの主成分分析は、教師なしの学習による次元低減手法に相当する。
被験者の機能的なコネクティビティは、上述したように、各参加者に対して2つの脳領域間の安静時の機能MRIの血中酸素濃度に依存する(BOLD)信号の時間的な相関性(ピアソンの相関係数を使用)として計算された。
機能的なコネクティビティは、全体の脳をカバーする268のノード(つまり脳領域)から成る機能的な脳地図に基づいて、定義される。
機能結合の相関を表すマトリックスの下三角行列の35,778個(つまり、(268×267)/2)の結合強度(コネクティビティ)の値が使用される。
図17に示すように、SRPBS複数疾患のデータセット中の参加者のデータはすべて、最初の2つの主成分から成る2つの軸の上でプロットされた。
すなわち、SRPBS複数疾患のデータセットのすべての参加者は、小さい薄い色のマーカーによって示されるように、最初の2つの主成分(PC)へ投影されている。 各サイトのすべての健常な対照群間の平均および各精神疾患内の平均は、濃い色がつけられたマーカとして示される。マーカーの色は、サイトを表わし、形は精神疾患を表わす。
主成分1に対して、HUHサイトが明瞭に分離しており、それは、データの中の分散のほとんどを説明するほどであった。
ASDの患者はSWAのサイトのみでスキャンされた。したがって、このサイトでスキャンされたASD(▲)の患者および健常群HC(●)の平均は、ほとんど同一の位置へプロットされている。
図17では、複数疾患のデータセットにおけるPCAによる次元削減が示される。
(バイアス評価)
定量的に安静時の機能結合MRIデータのサイト間差を調べるために、測定バイアス、標本バイアスおよび診断の要因を特定した。
上述したように、各々の機能的なコネクティビティに対する相関値のすべてのサイトにわたる平均からの偏差として、各サイトの測定バイアスを定義した。健常者および精神疾患の患者の標本バイアスは、互いに異なると仮定する。
したがって、健常者群及び各疾患を有する患者群に対して個別に、各サイトの標本バイアスを計算した。
疾患要因は、健常群の値からの偏差として定義された。
複数のサイトでサンプリングされた患者群であったという理由で、標本バイアスは、MDDとSCZの患者に対して評価された。 統一プロトコルを使用してはOCDの患者がスキャンされなかったので、疾患要因は、MDD、SCZおよびASDに対して評価された。サイト間で2つのタイプのバイアスは、同時に変化するので、SRPBS複数疾患のデータセットだけを使用してサイト間差を測定バイアスおよびサンプリングに分離するのは難しい。
対照的に、トラベリングサブジェクトのデータセットでは、参加者は固定されているので、測定バイアスのみを含んでいた。
トラベリングサブジェクトをSRPBS複数疾患のデータセットと組み合わせることによって、異なるサイトによって影響を受けた異なる要因として、同時に測定バイアスおよびサンプリングを評価した。機能的なコネクティビティに対する両方のタイプのバイアスと疾患の要因の効果を評価するために、以下のように、「線形混合効果モデル」を利用した。
(SRPBS複数疾患のデータセットに対する線形混合効果モデル)
線形混合効果モデルでは、SRPBS複数疾患のデータセットの各被験者のコネクティビティの相関値は、固定効果およびランダム効果からなる。
固定効果は、ベースラインとしてすべての参加者およびすべてのサイトをにわたる平均相関値と、測定バイアス、標本バイアスおよび疾患要因の和を含む。
参加者の要因(つまり個人差)およびスキャン間の変化の結合した効果は、ランダム効果と見なされる。

(バイアスおよび要因の評価の詳細) 参加者要因(p)、測定バイアス(m)、標本バイアス(shc, smdd, sscz)および精神疾患要因(d)は、SRPBS複数疾患のデータセットおよびトラベリングサブジェクトのデータセットからのすべての参加者の機能的なコネクティビティの相関値に回帰モデルを適合させることにより評価された。
この例では、ベクトルは小文字の太字(例えばm)によって表示され、ベクトルはすべて列ベクトルであると仮定される。
ベクトルの要素は、mkのように添字によって表示される。
上述したのと同様に、参加者の特性を表わすために、1-of-Kのバイナリーコード体系を使用し、サイトkに属する測定バイアスmに対するターゲットベクトル(たとえば、xm)は、1に等しい要素k以外は、全てゼロに等しい。
したがって、参加者がどんなクラスにも属さなければ、ターゲットベクトルは、すべての要素が0に等しいベクトルである。
上付きの添字Tは、マトリックスかベクトルの置換を表示し、xTは行ベクトルを表わす。
各コネクティビティについては、回帰モデルは以下のように書くことができる。
ここで、mは、測定バイアス(12サイト×1)を表し、shcは、健常群の標本バイアス(6サイト×1)を表し、smddは、MDD患者の標本バイアス(3サイト×1)を表し、ssczは、SCZ患者の標本バイアス(3サイト×1)を表し、dは、疾患要因(3疾患×1)、pは、参加者要因(9人のトラベリングサブジェクト×1)を表し、constは、すべてのサイトからの全ての参加者にわたる機能的コネクティビティの平均を表し、e〜N(0,γ-1)は、ノイズを表す。
各機能的なコネクティビティの相関値に対しては、L2正規化による正規の通常の最小二乗回帰を使用して、それぞれのパラメーターを評価した。
正規化が適用されない場合、健常群に対する測定バイアスと標本バイアスの間のスプリアス反相関、および健常群に対する標本バイアスと精神疾患の患者に対する標本バイアスの間の擬似相関を観察した。これらの擬似相関の絶対平均を最小化するためにハイパーパラメーター・ラムダ調整した。
(トラベリングサブジェクトのデータセットに対する線形混合効果モデル)
トラベリングサブジェクトのデータセットに対する線形混合効果モデルは、トラベリングサブジェクトのデータセットにおいて特定のスキャンに対する各参加者のコネクティビティの相関値は、固定効果およびランダム効果からなる。
固定効果は、すべての参加者およびすべてのサイトをにわたる平均相関値と、参加者要因と、測定バイアスとの和を含む。
スキャン間の変化は、ランダム効果と見なされた。
各参加者に対して、すべての参加者にわたった平均からの脳機能コネクティビティの相関値の偏差として、参加者要因を定義した。
2つの異なるデータセットの機能的なコネクティビティの相関値に、同時に前述の2つの回帰モデルをフィッティングさせることにより、すべてのバイアスおよび要因を評価した。 この回帰分析においては、SRPBS複数疾患のデータセットの中で、統一された撮像プロトコルを使用してスキャンされた参加者、およびトラベリングサブジェクトのデータセットのすべての参加者からのデータを使用した。
以上を要約すると、バイアスあるいは各要因は、それぞれ、コネクティビティの相関値の数(つまり35,778個)を反映する次元を含んだベクトルとして評価された。 このさらなる分析に含まれるベクトルは、12サイトでの測定バイアスと、6つのサイトでのHCの標本バイアスと、3つのサイトでのMDD患者に対する標本バイアスと、3つのサイトでのSCZ患者に対する標本バイアスと、9人のトラベリングサブジェクトの参加者要因と、MDD、SCZおよびASDの診断の要因である。
(寄与サイズの分析)
定量的に要因間の大きさの関係を確認するために、線形混合効果モデルにおいて、寄与サイズを計算し比較して、各タイプのバイアスおよび要因が、どの程度、データの分散を説明するのかを決定した。 モデルに適合した後、被験者aからのb番目のコネクティビティは、以下のように記述できる。
例えば、このモデル中で、測定バイアス(つまり最初の項)の寄与サイズは、以下の通り計算された。
ここで、Nmは,各要因の要素の数を表わし、Nは、コネクティビティの数を表し、Nsは、被験者の数を表し、Contribution sizemは、測定バイアスの寄与サイズの大きさを表す。
これらの式は、測定バイアス(例えば、位相エンコーディング方向、スキャナ、コイルおよびfMRIメーカー)と関係する個々の要因の寄与サイズを評価するために使用された。
特に、測定バイアスをこれらの要因へ分解し、その後、関連するパラメーターが評価された。
他のパラメーターは、それ以前に評価したものと同じ値に固定された。
寄与サイズの評価からは、以下のことが分かった。
1)機能的なコネクティビティに対する測定バイアスの効果サイズは、参加者要因より小さいことを示すものの、ほとんど疾患要因のものより大きく、測定バイアスが精神疾患に関する研究で重大な制限となることことを示唆する。
2)標本バイアスにおける最も大きな分散は、MDD要因の分散よりも有意に大きく、標本バイアスにおける最も小さな分散は、疾患要因に対する分散の2分の1であった。
このことは、標本バイアスは、また、精神疾患に関する研究で重大な制限となることを示唆する。
3)参加者要因の標準偏差は、SCZ,MDD,およびASDの疾患要因に対する標準偏差の約2倍であった。したがって、健常者の母集団内における個人の変動は、すべての機能結合を考慮した場合は、SCZ,MDD,およびASDの患者間よりも大きかった。
4)さらに、測定バイアスの標準偏差は、疾患要因の標準偏差よりも、大抵は大きく、一方で、サンプリンバイアスの標準偏差は、疾患要因の標準偏差と同程度であった。
そのような関係性は、精神疾患あるいは発達障害に対する、安静時の機能結合MRIに基づく分類器を開発することを、大変、困難なものにしている。非常に少ない数の疾患に特定的な、あるいは、測定サイトに独立な異常な機能結合を、多数の結合から選択できる場合にのみ、複数のサイトについて、ロバストで、汎化可能な分類器を生成することを可能とする。
(測定バイアスに対する階層的クラスタリング分析)
各サイトkに対して、測定バイアスmk(N×1、ここで、Nは、機能的なコネクティビティの個数)間のピアソンの相関係数を計算し、測定バイアスにわたる相関係数に基づいた階層的クラスタリング分析を行なった。
図18は、階層的クラスタリング分析による樹状図である。
樹状図中の各リンケージの高さは、そのリンクによって連結されたクラスタ間で非類似性(1−r)を表わす。
測定バイアスの特性を調べるにあたり、12か所のサイトに対して、評価された測定バイアスベクトルの類似性が、位相エンコードの方向、MRIメーカー、コイル・タイプおよびスキャナ・タイプのようなMRIスキャナの特定の特性を反映するものかどうかを調べた。
測定バイアスに対する同様のパターンのクラスタを発見するために、階層的クラスタ分析を使用した。
その結果、図18に示すように、12のサイトの測定バイアスは、最初のレベルで、位相エンコードの方向のクラスタに分割された。
測定バイアスは、第2のレベルで、fMRIメーカーのクラスタに分割され、さらに、コイル・タイプ・クラスタへさらに分割され、そして、スキャナ・モデル・クラスタに分割された。
図19は、各要因についての寄与サイズを示す図である。
図19に示すように、各要因の寄与を評価するために、同じモデルを使用することにより、定量的に要因の大きさの関係を確認した。
寄与サイズは、位相エンコーディング方向(0.0391)に対して最大であり、続いて、fMRIメーカー(0.0318)、コイル・タイプ(0.0239)およびスキャナ・モデル(0.0152)が、これに続くという関係であった。
これらにより、測定バイアスに影響を及ぼす主な要因が、位相エンコーディング方向、続いて、fMRIメーカー、コイル・タイプおよびスキャナ・モデルの相違であることを示す。
(部分母集団の中からサンプリングによる標本バイアス)
上述したような「標本バイアス」の背景にあるメカニズムの2つの択一的なモデルを調べた。
図20は、「標本バイアス」の背景にあるメカニズムを示す概念図である。
図20(a)に示す「単一の母集団のモデル」では、参加者が共通の母集団からサンプリングされると仮定するものである。
各参加者の機能的なコネクティビティの相関値は、ガウス分布から生成される。
図20(b)に示す「異なる部分母集団のモデル」では、標本バイアスは、部分的には参加者が各サイトで異なる部分母集団の中からサンプリングされることにより生じると仮定している。
部分母集団の平均がサイト間で異なり、ガウス分布から生成される。
さらに、各参加者の機能的なコネクティビティの相関値は、各サイトで部分母集団の平均に基づいて、ガウス分布から生成される。
いずれのモデルが複数のサイトにわたって、ビッグデータを集めるのに、よりふさわしいか決めることが必要である。
なぜなら、もしも前者のモデルが正しい場合、サイトの数が少なくても、取得されたデータは、参加者の数を増加させることにより母集団を表わすために使用されうる。一方で、後者のモデルが正しい場合、非常に大きなサンプル・サイズである場合でさえ、1つのサイトは、真実の全母集団分布を表わすとは言えないので、データは多くのサイトから集められるべきである。
各モデルについては、各サイトの参加者の数が機能的なコネクティビティにおける標本バイアスに対する効果をどのように決定するかについて、最初に調べた。機能的なコネクティビティにわたる標本バイアスに対する分散値に基づいて、効果の大きさを測定した。
どの値が使用されるかに基づいた相違が本質的にあるわけではないものの、統計分析を単純化するために標準偏差の代わりに分散を使用した。
モデルが、それぞれ参加者の数と、標本バイアスの分散の間の異なる関係性を表わすことを理論付けた。
したがって、修正された赤池情報量基準(AICc)とベイズ情報量基準(BIC)とを比較することにより、このデータにおける実際の関係性を、いずれのモデルが表しているのかを調べた。さらに、1つのサイトを除いたすべてのサイトをモデル生成に使用して、標本バイアスの分散を残りのサイトにそのモデルで予測するという予測性能に対する一サイト抜き交差検証を行った。その後、2つのモデル間の予測性能を比較した。
それらの結果からは、このデータに対しては、単一の母集団のモデルより異なる部分母集団のモデルがよりよく適合することを示した。(異なる部分母集団のモデル: AICc = -108.80およびBIC= -113.22; 単一の母集団のモデル: AICc = -96.71およびBIC = -97.92) 。
さらに、予測性能は、単一の母集団のモデルより異なる部分母集団のモデルには有意により高かった。(絶対誤差に適用されたウィルコクソンの符号付順位検定では、以下の通り: p = 0.0469、サイン・ランク= 19、n = 6)
この結果は、標本バイアスが、単一の大きな母集団からの無作為抽出によってもたらされるだけでなく、異なる部分母集団の中からサンプリングすることによっても引き起こされることを示している。
標本バイアスは、有限な数のサイトおよび参加者から得られた測定に基づいて、健常対照群または患者のデータの真の単一の分布の評価をしようとする場合には、主要な制限となることを表している。
(ハーモナイゼーション効果の視覚化)
次に、トラベリングサブジェクトのデータセットを使用して、測定バイアスだけを除くことを可能とするハーモナイゼーション法について説明する。
上述のとおり、線形混合効果モデルを使用して、測定バイアスを標本バイアスとは別に評価した。
この方法により、SRPBSの複数疾患のデータセットから測定バイアスだけを取り除き、生物学的な情報を含んでいる標本バイアスを維持することができる。
(トラベリングサブジェクトのハーモナイゼーション)
測定バイアスを評価するために、HKHサイトでの位相エンコーディング方向が、SRPBS複数疾患のデータセットとトラベリングサブジェクトのデータセットの間で異なっていたので、以下では、測定バイアスとは別個に、式中に位相エンコード要因(paq)を含めることとした。
測定バイアスおよび位相エンコード要因は、SRPBS複数疾患のデータセットおよびトラベリングサブジェクトのデータセットを結合したものに、回帰モデルを適合させることにより評価された。
回帰モデルは、以下のようになる。
ここで、paは、位相エンコード要因(2つの位相エンコード方向×1)を表わす。
各機能的なコネクティビティの相関値に正規のLS正規化による最小二乗法回帰で正規化を実行して使用して、パラメーターをそれぞれ評価した。
サイト間差は、評価されたサイト間差および位相エンコード要因を引くことにより除去された。
したがって、標本バイアスがハーモナイズされた機能的なコネクティビティの相関値は以下のようになる。
ここで、mは、評価された測定バイアスを表し、pa(ハット)は、評価された位相エンコード要因を表わす。
図21は、ハーモナイゼーションプロセスの影響を視覚化した図であり、図17と対比される図である。
図21では、SRPBSの複数疾患のデータセットから測定バイアスだけを除いた後にデータをプロットした。
図17ではハーモナイゼーションの前のデータを反映しており、図17に示されたデータと比較して、図21においては、HUHサイトは、原点側(つまり母集団の平均)により近くなるように、大きく移動しており、また他のサイトから大きく離れるということはなくなった。
図21に示した結果は、図17で見られたようなHUHサイトの分離は、測定バイアスによりもたらされており、それは、ハーモナイゼーションによって取り除かれうることを示している。
さらに、ハーモナイゼーションは、同じサイトでスキャンされた患者と健常者群とを識別するのにも有効であった。
ASDの患者は、SWAのサイトのみでスキャンされたので、このサイトでスキャンされたASD患者(▲)および健常者(○)の平均は、図17では、ほとんど同一の位置へプロットされている。
しかしながら、2つのシンボルは、図21では、お互いに明白に分離されている。 ハーモナイゼーションのない最初の2つのPCにおいては、精神疾患(ASD)の影響を観察することができなかったものの、測定バイアスの除去をすることで、検知できるようになったことを意味する。
(MDDとSCZに対する分類器)
定量的にハーモナイゼーション法を評価するために、安静時の機能結合MRIデータに基づいて健常者群と患者を識別するために、SRPBSの複数疾患のデータセットを使用して、精神疾患用バイオマーカーを構築し、SRPBSの複数疾患データセットからのサイト間差の除去のための4つの異なるハーモナイゼーション法を比較した。
(1)線形混合効果モデルを使用して、トラベリングサブジェクトのデータセット(つまりトラベリングサブジェクトの方法)とSRPBSの複数疾患のデータセットを組み合わせることにより、測定バイアスは、標本バイアスとは別個に評価する方法
(2)ComBat法の使用による、一般にゲノミクスの中で使用されてきたバッチ効力修正ツールを使用して、サイト間差はモデル化され除去された;
なお、ComBat法については、たとえば、以下の文献に開示がある。
公知文献11: Johnson WE, Li C, Rabinovic A,”Adjusting batch effects in microarray expression data using empirical Bayes methods.” Biostatistics 8, 118-127 (2007).
(3)一般化線形モデル(GLM)を使用して、測定バイアスはSRPBSの多疾患データセットのみを使用して、生物学の共変量(例えば診断または年齢)に対する調節を行うことなく、評価された(つまりGLM法)。
たとえば、GLM法については、以下の文献に開示がある。
公知文献12:Fortin JP, et al. Harmonization of cortical thickness measurements across scanners and sites. Neuroimage 167, 104-120 (2017).
(4)GLM法の使用して、測定バイアスは、SRPBSの複数疾患のデータセットのみ、生物学の共変量に対する調整を行って評価された方法(つまり、調整されたGLM方法)
この方法についても、上述した公知文献12に開示がある。
さらに、これらの4つの方法を非ハーモナイゼーション法(生データのままの方法)と比較した。
複数サイト・データに注目することを目的とし、複数のサイトからサンプリングされたMDDとSCZを持った患者からのデータをターゲットとした。
そこで、各分類器を構築するために、機械学習技術は、以下の2つの場合に適用された。
(1)SRPBS複数疾患のデータセットからの健常者群およびMDD患者に対するすべての機能的なコネクティビティデータ(5つのサイトからの135人のMDD患者、9つのサイトからの425人の健常者群)あるいは
(2)SRPBS複数疾患のデータセットからの健常者群およびSCZ患者に対するすべての機能的なコネクティビティデータ(3つのサイトからの44人のSCZ患者、9つのサイトからの425人の健常者群)。
上述したように、特徴選択のためのLASSO法を使用するロジスティックスの回帰分析を実施して、35,778個の結合の中から、機能的なコネクティビティの最適な部分集合を選択した。
モデルの汎化性能は、完全に独立した検証コホートのためのデータセットを部分的に使用してテストされた。
図22は、MDDに対する分類器の分類性能を示す図である。
図23は、SCZに対する分類器の分類性能を示す図である。
分類器のトレーニングの中に、参加者のデータをすべて使用することを保証するために、分類器の生成の手続きを100回(つまり再サンプリング)繰り返し、分類器性能の平均値は、トレーニング・データセットにおける分類器性能を示すといえるようにした。
図22および図23において、診断ラベルが疾患を示す確率が0.5を超えることは、対象が精神疾患であるとの診断のための補助情報(支援情報)を提供するものと考えられる。
図22および図23の左側の列に示すように、トレーニング・データセットにおける診断支援情報の確率の分布は、0.5というしきい値によって、精神疾患の患者と健常とが明白に分離されることが明らかになった(各グラフ中の中央のライン)。
これに対して、図22および図23の右側の列に示すように、独立したコホートの中の診断支援情報の確率の分布は、トラベリングサブジェクト法とComBat法の方法に対してのみ、0.5のしきい値によって、精神疾患の患者と健常群とが分離されることを明らかにしている。
したがって、独立したコホートでは、非常に低い感度(0.5未満)および過度に高い特異性が、GLM法及び調整GLM法に対して観測されたものの、中程度の感度(約0.5)および過度に高い特異度が、MDDとSCZに対する分類器に対する生データのままの方法に対して観察された。
これは、患者と健常者とが健常者として、区別されることなく分類されたので、過度に高い特異度が観察されたことになる。
この結果は、GLM法および調整GLM法が、サイト間差を削除することができず、むしろ、否定的に分類に影響を与えた可能性を示す。
図24は、MDD分類器の独立コホートに対する性能を示す図である。
図25は、SCZ分類器の独立コホートに対する性能を示す図である。
独立したコホートへの汎化は、分類器の再チューニングなしで直接検討された。
ここでは、分類器の性能として、マシューズ相関係数(MCC:Matthews correlation coefficients)、ROC曲線(Receiver Operatorating Characteristic curve、受信者動作特性曲線)についてのROC曲線下面積(AUC: area under the curve)、正確度(Accuracy)、感度(Sensitivity)、特異度(Specificity)を使用した。
分類器出力は、参加者がMDDまたはSCZのクラスへ分類されている確率として定義される。
トラベリングサブジェクトのデータセット(つまりトラベリングサブジェクト法)を使用してハーモナイゼーション法を開発し、それは既存のハーモナイゼーション法と比較した結果、精神疾患の分類器の汎化性能、および、後述するような参加者の年齢を予測するための回帰モデルの開発に関して、トラベリングサブジェクト法およびComBat法は、他の従来のGLM法に基づいたハーモナイゼーション法より性能が上であることを実証している。
さらに、標本バイアスと測定バイアスを識別することができない、GLM法に基づいたハーモナイゼーション法の汎化性能は、データがサイトにわたってハーモナイズされていない生データのままの方法よりさらに悪いことが分かった。
ComBat法は、MDD分類器および後述する年齢の回帰モデルに対して、最も高い性能を達成したが、それはSCZ分類器に対しては、生データのままの方法よりも劣っていた。このような結果となったのは、SCZの患者が少数(n=48)であったという理由で、ComBat法が、測定バイアスとターゲット属性の関連とを、明確に区別することができなかった可能性を示す。
対照的に、トラベリングサブジェクトの方法は、測定バイアスだけをハーモナイズするので、この方法は、分類器と回帰モデルに対して、他の従来のGLM法に基づいたハーモナイゼーション法より性能が上であった。
(4つのハーモナイゼーション法に基づいた参加者の年齢の回帰モデル)
さらにハーモナイゼーション法の有効性を調査するために、参加者の年齢を予測するために、生データのままの方法と同様に4つの異なるハーモナイゼーション法を使用して、回帰モデルを構築し、モデルの予測性能を比較した。
各回帰モデルを構築するために、機械学習技術が、健常者群からのすべての機能的なコネクティビティデータに適用された(9つのサイトからの425人の健常者)のデータが使用された。
線形回帰は、LASSO法を使用して適用され、合計35,778個のコネクティビティの中からの機能的なコネクティビティの最適な部分集合を選択した。予測性能は、10分割交差検証の手続きを使用して、トレーニング・データセットの中で評価された。
モデルの汎化性能は、ATR TimTrio、ATR VerioおよびATR Prismaサイト(223人のHC)から得られた完全に独立した検証コホート・データセットを部分的に使用して調べられた。 独立したコホートへの汎化はモデルの再チューニングなしで検討された。
図26および図27は、独立したコホートの中の実年齢および予測された年齢の散布図を示す図である。
実線は、予測された年齢からの実年齢の線形回帰を示す。平均の絶対誤差(MAE:Mean Absolute Error)および相関係数(r)は各グラフ中で示される。
各データポイントは、1人の参加者を表わす。図26(a)は、トラベリングサブジェクト法に対する結果、図26(b)は、ComBat法に対する結果を示す。
図27(c)は、GLM方法に対する結果、図27(d)調整GLM方法に対する結果、あるいは図27(e)生データのままの方法(つまり、データはサイトを横断して調和させていない)に対する結果を示す。
図26に示すように、ComBat法は、最低の平均絶対誤差(MAE)値および最も高いr値を達成したものの、トラベリングサブジェクト法は2番目に低いMAE価値および2番目に高いr値を達成した。
さらに、ComBat法およびトラベリングサブジェクト法のMAE値は生データのままの方法より有意に低かった(両側ペアt-検定; ComBat: p = 3.1×10-20、t = -10.18、df = 222; トラベリングサブジェクト:p = 6.3 × 10-8, t = -5.5, df = 222)。
これらの結果は、ComBat法およびトラベリングサブジェクト法が、汎化性能に関して参加者の年齢を予測するために回帰モデルを構築する他のハーモナイゼーション法より性能が上であったことを示す。
以上の結果により、トラベリングサブジェクト法は、他の方法に比べて、複数施設での計測データに対するハーモナイゼーション方法として、汎化性能の観点からも、より多くの属性の分類に対して普遍的に適用できるという点でも、優れた方法であるということができる。
[実施の形態2]
実施の形態1では、脳活動計測装置(fMRI装置)で、複数の測定場所で計測された脳活動データを計測し、この脳活動データに基づいて、バイオマーカーの生成およびバイオマーカーによる診断ラベルの推定(予測)を行う構成として、分散処理により行う一例の構成を説明した。
ただし、i)バイオマーカーを機械学習により訓練するための脳活動データの計測(データ収集)、ii)バイオマーカーの機械学習による生成処理および特定の被験者についてのバイオマーカーによる診断ラベルの推定(予測)の処理(推定処理)、iii)上記特定の被験者についての脳活動データの計測(対象者の脳活動計測)を、それぞれ、異なる施設で分散して実行する構成とすることも可能である。
図28は、データ収集、推定処理および対象者の脳活動計測を、分散して処理する場合の一例を示す機能ブロック図である。
図28を参照して、サイト100.1〜100.Nは、患者群、健常者群のデータを脳活動計測装置により計測する施設であり、管理サーバ200´は、サイト100.1〜100.Nsからの計測データを管理する。
計算処理システム300は、サーバ200´に格納されたデータから判別器を生成する。
また、計算処理システム300のハーモナイゼーション算出部3020は、サイト100.1〜100.NsおよびMRI計測装置410のサイトを含めて、ハーモナイゼーション処理を実行するものとする。
MRI装置410は、計算処理システム300上の判別器の結果を利用する別サイトに設けられており、特定の被験者について脳活動のデータを計測する。
コンピュータ400は、MRI装置410が設けられる別サイトに設置され、MRI装置410の測定データから特定被験者の脳の機能結合の相関データを算出し、機能結合の相関データを計算処理システム300に送信して、返信されてくる判別器の結果を利用する。
サーバ200´は、サイト100.1〜100.Nsから送信されてくる患者群および健常者群のMRI測定データ3102と、MRI測定データ3102に関連付けられた被験者の人属性情報3104とを格納し、計算処理システム300からのアクセスに従って、これらのデータを計算処理システム300に送信する。
計算処理システム300は、通信インタフェース2090を介して、サーバ200からのMRI測定データ3102および被験者の人属性情報3104を受信する。
なお、サーバ200´、計算処理システム300、コンピュータ400のハードウェアの構成は、基本的に、図5で説明した「データ処理部32」の構成と同様であるので、その説明は繰り返さない。
図28に戻って、相関行列算出部3002、相関値補正処理部3004、判別器生成部3008および判別値算出部3010、ならびに、機能結合の相関行列のデータ3106、測定バイアスデータ3108、補正後相関値データ3110および判別器データ3112については、実施の形態1で説明したのと同様であるので、その説明は、繰り返さない。
MRI装置410は、診断ラベルの推定対象となる被検者の脳活動データを計測し、コンピュータ400の処理装置4040は、計測されたMRI測定データ4102を不揮発性記憶装置4100に格納する。
さらに、コンピュータ400の処理装置4040は、MRI測定データ4102に基づいて、相関行列算出部3002と同様にして、機能結合の相関行列のデータ4106を算出し、不揮発性記憶装置4100に格納する。
コンピュータ400のユーザから診断の対象となる疾患が指定され、当該ユーザの送信の指示に従い、コンピュータ400が、機能結合の相関行列のデータ4106を計算処理システム300に送信する。これに応じて、計算処理システム300は、MRI装置410の設置されるサイトに対応したハーモナイゼーション処理を実行して、判別値算出部3010は、指定された診断ラベルについての判別結果を算出し、計算処理システム300は、通信インタフェース2090を介して、コンピュータ400に送信する。
コンピュータ400では、図示しない表示装置などを介して、ユーザに対して、判別結果を知らせる。
このような構成とすることで、より多くの被験者について収集したデータに基づいて、判別器による診断ラベルの推定結果を提供することが可能となる。
また、サーバ200と計算処理システム300とを別個の管理者が管理する形態とすることも可能で、その場合、サーバ200にアクセスできるコンピュータを制限することで、サーバ200に格納される被験者の情報のセキュリティを向上させることも可能となる。
さらに、計算処理システム300の運営主体からみると、「判別器による判別のサービスを受ける側(コンピュータ400)」に対して、判別器についての情報や「測定バイアス」に関する情報は、一切提供しなくても、「判別結果を提供するサービス」を行うことが可能となる。
なお、以上の実施の形態1および実施の形態2の説明では、脳機能画像法により脳活動を時系列に計測するための脳活動検出装置としては、リアルタイムfMRIを用いるものとして説明した。ただし、脳活動検出装置として、上述したfMRI、脳磁計、近赤外光計測装置(NIRS)、脳波計、またはこれらの組み合わせを使用することができる。たとえば、これらの組合せを用いる場合、fMRIとNIRSとは、脳内の血流変化に関連する信号を検出するものであり、高空間分解能である。一方で、脳磁計や脳波計は、脳活動に伴う電磁場の変化を検出するための高時間分解能であるという特徴をもつ。したがって、たとえば、fMRIと脳磁計とを組み合わせれば、空間的にも時間的にも高分解能で脳活動を計測することができる。あるいは、NIRSと脳波計とを組み合わせても、同様に空間的にも時間的にも高分解能で脳活動を計測するシステムを小型で携帯可能な大きさで構成することも可能である。
以上のような構成により、神経・精神疾患に対して、脳機能画像法によるバイオマーカーとして機能する脳活動解析装置および脳活動解析方法を実現することが可能となる。
また、以上の説明では、被験者の属性として「診断ラベル」を含んだ場合について、機械学習による判別器の生成により、当該判別器をバイオマーカーとして機能させる例について説明したが、本発明は、必ずしもこのような場合に限定されず、事前に機械学習の対象となる測定結果を得る対象の被験者群が、客観的な方法により、複数のクラスに分けられており、被験者の脳領域間(関心領域間)の活動度の相関(結合)を測定し、測定結果に対する機械学習により、クラスに対する判別器が生成できるものであれば、他の判別のために使用されるものであってもよい。
また、上述のとおり、このような判別は、ある属性に属する可能性を確率として表示するものであってもよい。
したがって、たとえば、ある「訓練」や「行動パターン」をとることが、被験者にとっての健康増進に役立つかを客観的に評価することができる。また、実際には、疾患に至っていない状態(「未病」)であっても、ある「食物」「飲料」等のような摂取物や、ある活動などが、より健康状態に近づくために効果があるのか、ということを客観的に評価することも可能である。
また、未病の状態においても、上述したように、たとえば、「健常である確率は、○○%」といような表示が出力されれば、ユーザに対して、健康状態について客観的な数値としての表示を行うことができる。このとき、出力されるのは、必ずしも確率でなくとも、「健康度合いの連続値、たとえば、健常である確率」をスコアに変換したものを表示することとしてもよい。このような表示を行うことで、本実施の形態の装置を、診断の支援以外にも、ユーザの健康管理のための装置として使用することも可能である。
[実施の形態3]
以上の説明では、すべての計測サイトについて、平等に、トラベリングサブジェクトが移動して計測を行うことにより、測定バイアスを評価するとの構成であった。
図29は、実施の形態3のトラべリングサブジェクトの巡回方式を示す図である。
図29に示すように、拠点となる「拠点計測サイトMS.1〜MS.Ns」について、トラベリングサブジェクトTS1が巡回していることを前提とする。
これに対して、たとえば、これらの拠点計測サイトMS.1〜MS.Nsのうちの拠点計測サイトMS.2については、予め配下となるMS2.1〜MS2.nが存在するとして、新たに「計測サイトMS.2.n+1」が追加された場合は、この配下の範囲でトラベリングサブジェクトTS2が巡回する。他の拠点計測サイトについても同様である。
すなわち、拠点計測サイトMS.2の測定バイアスは、トラベリングサブジェクトTS1で評価された値に固定して、計測サイトMS.2、MS2.1、MS2.n,MS2.n+1について、トラベリングサブジェクトTS2が巡回した計測結果に基づいて、測定バイアスを決定するという構成とすることも可能である。
たとえば、「拠点計測サイトMS.1〜MS.Ns」は、予め定められた地域ごとに存在すとして、日本国内の北海道、東北、関東、…、関西、…九州というような各地域に、1か所ずつ設置されており、配下サイトというのは、たとえば、その地域の1つの関西に位置する計測サイト、というような構成とすることも考えられる。
あるいは、「拠点計測サイトMS.1〜MS.Ns」は、予め定められたMRI装置の機種ごとに定められていてもよい。この場合、配下の計測サイトは、拠点サイトと同一のMRI装置の機種が設置された計測サイトということになる。
あるいは、「拠点計測サイトMS.1〜MS.Ns」は、予め定められた地域ごとに、定められたMRI装置の機種ごとに定められていてもよい。この場合、配下の計測サイトは、拠点サイトと同一の地域内で、同一のMRI装置の機種が設置された計測サイトということになる。
このような構成であっても、実施の形態1と同様の効果を奏することが可能である。
[実施の形態4]
以下では、精神疾患のうち、大うつ病性障害を例として、すなわち、従来の症候に基づく診断手法により医師によって大うつ病性障害と診断された患者群を例として、分類器を生成する処理を説明する。すなわち、図10または図28に示した判別器生成部3008が、患者群と健常群とを判別するための診断の補助情報を出力するような分類器を生成するために実行する処理の他の例を説明する。
そこで、以下では、機能的結合FCに基づいて、健常群(HC)およびMDD患者を識別するMDD分類器を構築する手続きについて説明する。
そして、MDD診断と関係する機能的結合FCを特定するために、どの機能的結合FCが分類器の構築に重要であるのかについても検討する。
さらに、以下では、ベックうつ病自己評価尺度IIに対する回帰モデルを構築する。ベックうつ病自己評価尺度(BDI)IIは抑うつの症候の重症度の測定に対する最も広く用いられているテストのうちの1つである。
その上で、どの機能的結合FCが、回帰モデルに対して、抑うつの症候群と関係するFCを識別するために、重要であるのかを検討する。
更に、MDD診断に関連する機能的結合FCと、抑うつの症候と関係する機能的結合の間で共通の安静時機能的結合FCを検討する。
既述したように、機械学習アルゴリズムを使用する信頼できる分類器および回帰モデルの構築については、多数の撮像サイトから集められた大規模なサンプルサイズのデータを用いることが必要である。
そこで、以下では、4つの異なる撮像サイトから集められたMDD患者を含む、約700人の参加者の学習用の安静時fMRIデータセットを使用して検討する。
図30は、このような学習用のデータセット(データセット1)のデモグラフィック特性を示す図である。
データセット1は、上述したSRPBS中のデータである。
図31は、独立検証のデータセット(データセット2)のデモグラフィック特性を示す図である。
データセット2も、基本的には、上述したSRPBS中のデータである。
すなわち、以下の分析では、2つの安静時機能的MRI(rs-fMRI)データセットを使用する
(1)図30に示すように、データセット1は、713人の参加者に対するデータを含んでいる(4つのサイトから564人の健常群HC、3つのサイトからの149人のMDD患者群)。
(2)図31に示すように、データセット2は、449人の参加者に対するデータを含んでいる(4つのサイトからの264人の健常群HC 、4つのサイトからの185人のMDD患者群)。
また、併せて「抑うつの症候」は、各データセットの大部分の参加者から得られたベックうつ病自己評価尺度(BDI:Beck Depression Inventory)IIを使用して評価されている。
データセット1は、「学習用データセット」であり、MDDの分類器およびBDIの直線回帰モデルを構築するのに使用される。
参加者は、それぞれ10分間の単一の安静時機能的MRI(rs-fMRI)セッションにて計測が実行されている。
ここでも、統一された撮像プロトコルの下で安静時機能的MRI(rs-fMRI)データをが取得されている(http://www.cns.atr.jp/rs-fmri-protocol-2/)。
ただし、実施の形態1と同様に、画像診断がすべてのサイトで同じパラメーターを使用して行なわれたことを保証することは実際には困難であり、2つの位相変調方式の方向(P→AとA→P)、2社のMRI装置メーカー(シーメンスとGE)、コイルの3つの異なる数(12,24,32)および3つの型番のスキャナが計測に使用されている。
安静時機能的MRI(rs-fMRI)のスキャン中に、参加者は、原則として、以下のような教示がされている。
「リラックスしてください。眠らないでください。中央の十字線マーク上を注視して、特定のことに関して考えないでください。」
データセットにおける「デモグラフィック特性」は、いわゆる「人口統計学」において使用される特性であって、年齢、性別、などの他、診断名のような表中の属性を含む。
なお、図30および図31において、括弧中の人数は、BDIスコアのデータを有する参加者の数を示す。
デモグラフィック分布は、すべて学習用データセットの中でMDDとHCの個体群間で一致する(p>0.05)。
データセット2は、 「独立した検証データセット」であり、MDDの分類器およびBDIの回帰モデルをテストするために使用される。
データセット2に対する撮像を行ったサイトは、データセット1に含まれていない。
年齢のデモグラフィックな分布は独立した検証データセットの中でMDDとHCの個体群間で一致しているものの(p>0.05)、性比のデモグラフィックな分布は独立した検証データセットの中でMDDとHCの個体群間で一致していない(p<0.05)。
(安静時機能的結合FCマトリックスの前処理および計算)
データの最初の10秒間はT1平衡を考慮に入れるために廃棄される。
前処理のステップは、スライスタイミングの校正、頭部に見られる体動アーチファクトの補正を行うためのリアライン処理、脳機能画像(EPI画像)と形態画像の共登録(co-registration)、歪補正、T1強調構造画像の分割、モントリオール神経学研究所(MNI)空間への正規化および、6mmの半値幅の等方性のガウスカーネルによる空間の平滑化などの処理を実施する。
このような前処理のパイプライン処理については、たとえば、以下のサイトに開示がある。
http://fmriprep.readthedocs.io/en/latest/workflows.html
(脳領域の区画化(パーセレーション:Parcellation))
脳領域のパーセレーションについては、ヒューマンコネクトームプロジェクト(HCP)スタイルの「表面ベースの方法」でデータを分析するために、以下のサイトに開示されるようなツールボックスを使用した(ciftifyツールボックスバージョン2.0.2)。
https://edickie.github.io/ciftify/#/
このツールボックスは、使用するデータ(それらはHCPパイプラインに必要なT2強調画像を欠いている)を分析することを、HCP類似の表面ベースのパイプラインの中で可能にするものである。
そして、以下の解析では、関心領域(ROI)として、以下の公知文献に開示される379の表面ベースの区画(皮質の360の区画+皮質下の19の区画)を使用する。
公知文献:Glasser, M.F., Coalson, T.S., Robinson, E.C., Hacker, C.D., Harwell, J., Yacoub, E., et al. (2016). A multi-modal parcellation of human cerebral cortex. Nature 536(7615), 171-178. doi: 10.1038/nature18933.
BOLD信号の時間的変化は、これらの379個の関心領域(ROI)から抽出される。
さらに、以下の文献に開示されるような解剖学的な自動標識付(AAL)およびNeurosynth(http://neurosynth.org/locations/)の使用により、重要なROIの解剖学的名称、およびROIを含む内在性の脳ネットワークの名称を特定する。
公知文献:Tzourio-Mazoyer, N., Landeau, B., Papathanassiou, D., Crivello, F., Etard, O., Delcroix, N., et al. (2002). Automated anatomical labeling of activations in SPM using a macroscopic anatomical parcellation of the MNI MRI single-subject brain. Neuroimage 15(1), 273-289. doi: 10.1006/nimg.2001.0978.
(生理的な雑音回帰)
生理的な雑音回帰は、以下の文献に開示されるCompCorを適用して実行される。
公知文献:Behzadi, Y., Restom, K., Liau, J., and Liu, T.T. (2007). A component based noise correction method (CompCor) for BOLD and perfusion based fMRI. Neuroimage 37(1), 90-101. doi: 10.1016/j.neuroimage.2007.04.042.
いくつかのスプーリアスの源(余計な信号源)を除去するために、6つの運動パラメーター、全脳、など回帰母数を備えた直線回帰が使用される。
(時間的なフィルタリング)
時間的なバンドパスフィルターが、0.01Hzと0.08Hzの間の通過帯域を備えたバターワース・フィルタを使用して、時系列データに適用され、BOLD活動の特性である低周波の変動に分析が限定される。
(頭部運動)
フレームの位置ずれ(FD:Frame-wise displacement)が、個々の機能的なセッションにおいて計算され、頭部運動による機能的結合FCのスプーリアスの変化を低減するために、FD>0.5mmであるボリュームが除去される。
FDは、スカラ量(つまり並進運動と回転における絶対的な変位の加算)として時間的に連続する2つのボリュームの間の頭部運動を表わす。
上述したような具体的なデータセットでは、スクラビングの後に除去されたボリュームの比率が、(平均±3標準偏差)を超過した場合、その参加者のデータは分析から除外される。その結果、データセット全体では、35人の参加者が除去された。
したがって、学習用データセットの中で683人の参加者(545人のHC、138人のMDD)を使用し、独立した検証データセットの中で444人の参加者(263人のHC、181人のMDDを患者)のデータが、以下の分析に対して使用される。
(機能的結合(FC)マトリックスの計算)
本実施の形態の具体例においては、機能的結合FCは、各参加者につき379個の関心領域(ROI)にわたってBOLD信号の時間的な相関として計算される。
機能的結合の計算では、特に限定されないが、ここでも、ピアソンの相関係数を使用する。
個々の可能な組のROIの前処理されたBOLD信号の時間的経過間のフィッシャーのz変換されたピアソンの相関係数が計算され、要素がそれぞれ2つのROIの間の結合の強度を表わす、379行×379列の対称的な結合マトリックスが構築される。
さらに、分析のために、結合マトリックスの下三角行列の71,631(=(379×378)/2)の機能的結合FCの値が使用される。
(サイト効果の制御)
また、以下では、機能的結合FCの上のサイト効果を制御するために、実施の形態1〜3で説明したような学習用データセットに対するトラベリングサブジェクトのハーモナイゼーション方法を使用するものとして説明する。
ただし、ハーモナイゼーション方法としては、この方法に限定されるものではなく、たとえば、上述したようなComBat法など他の方法を使用してもよい。
トラベリングサブジェクトのハーモナイゼーション方法を使用することで、純粋なサイト間差(測定バイアス)を除去することが可能となる。
なお、独立した検証データセットに含まれたサイトに対しては、トラベリングサブジェクトのデータセットが存在しなかったので、独立した検証データセットの中でサイト効果のコントロールのためには、ComBat法によるハーモナイゼーション方法を使用している。
(訓練データセットにおけるMDDに対する分類器)
分類器の訓練データとして、上述したような学習用データセットを使用して、MDDのためのバイオマーカーを構築する。それは、71,631の機能的結合FCの値に基づいて、健常群(健常(HC)との診断ラベルの個体群)およびMDD患者群(大うつ病性障害との診断ラベルの個体群)を識別するものである。
図32は、このような分類器を生成するための機械学習の手続きを説明するためのフローチャートである。
以下に説明するように、MDDに対する分類器(以下、「MDD分類器」と呼ぶ)の生成のための学習処理において、L1正則化(LASSO: least absolute shrinkage and selection operator)によるロジスティク回帰分析(スパースモデリング法の1つ)を使用して、71,631個の機能的結合FCの中からの機能的結合FCの最適な部分集合を選択する。
一般に、L1正則化を使用すると、いくつかのパラメータ(以下の説明では、ウェイトの要素)を0にすることができる。つまり、特徴選択を行っていることになり、スパースモデルになる。ただし、スパースモデリングの手法としては、このような手法には限定されず、後述するように、変分ベイズ法や、変分ベイズ法をロジスティック回帰に応用したスパースロジスティック回帰(SLR:Sparse Logistic Regression)を用いるなど、他の手法を用いることも可能である。
図32を参照して、MDD分類器に対する学習処理が開始されると(S100)、予め準備され(記憶装置2080´に格納され)た学習データセットを使用して(S102)、相関行列算出部3002が、結合マトリックスの成分を算出する。
続いて、ハーモナイゼーション算出部3020が、測定バイアスを算出して、ハーモナイゼーション処理を実施する(S104)。
上述のとおり、ハーモナイゼーション処理は、トラベリングサブジェクトを用いた方法が望ましいが、他の方法であってもよい。
続いて、判別器生成部3008は、学習用データに対して、いわゆる「入れ子構造の交差検証(Nested Cross Validation)」の手法を修正した方法により、MDD分類器を生成する。
まず、判別器生成部3008は、学習用データに対して、「K分割交差検証」(K:自然数)(外側の交差検証)を使用して学習処理を実行するために、たとえば、K=10として、学習用データを10分割する。
すなわち、判別器生成部3008は、K分割(10分割)されたうちの1つの部分データセットを検証用の「テストデータセット」とし、残りの(K−1)分割(9分割)分のデータを訓練データセット(トレーニングデータセット)に設定する(S108,S110)。
続いて、判別器生成部3008は、トレーニングデータセットに対して、アンダーサンプリング処理およびサブサンプリング処理を実行する(S112)。
ここで、「アンダーサンプリング処理」とは、トレーニングデータセットにおいて、分類の対象となる特定の属性データ(2種以上)にそれぞれ対応するデータの数がそろっていない場合に、この数をそろえるために数が多い方の属性のデータを除いて同数となるように行う処理を意味する。
ここでは、トレーニングデータセットにおいて、MDD患者群の被験者数と、健常群の被験者数が等しくないために、これをそろえるための処理を行う。
さらに、「サブサンプリング処理」とは、トレーニングデータセットから所定数のサンプルをランダムに抽出する処理を意味する。
すなわち、ステップS108〜S118、S122を経由して、K回繰り返される交差検証において、各交差検証では、トレーニングデータセットがMDD患者および健常者HCの数に関して不均衡であるので、分類器を構築するためのアンダーサンプリング方法を行うこととし、かつ、サブサンプリング処理として、所定数、たとえば、130人のMDD患者および同数の130人の健常者が、トレーニングデータセットからランダムにサンプリングされる。
なお、130人という数値は、このような値に限定されるものではなく、学習データセット中のデータ数(データセット1では683人)、分割数K(ここでは、たとえば、K=10)、並びに、分類の対象となる特定の属性に含まれるデータ数の不均衡の程度に応じて、適宜、上述したようなアンダーサンプリングが可能となるように決定される。
このようなサブサンプリング処理を実行するのは、アンダーサンプリングは、除外されたデータを使用して分類器が学習することができなくなるという点で不利であるため、この不利を除去するために、無作為抽出手続き(つまりサブサンプリング)を、M回(M:自然数、たとえば、M=10)繰り返す処理である。
続いて、判別器生成部3008は、サブサンプリングされたサブサンプル1〜10の各々に対して、ハイパーパラメータの調整処理を実行する(S114.1〜S114.10)。
ここで、各サブサンプルにおいて、以下のようなロジスティック関数を使用することで、分類器サブモデルが生成される。このようなロジスティック関数は、サブサンプル内において、MDDクラスに属する参加者の可能性を以下のように定義するために使用される。
ここで、ysubは、参加者のクラス・ラベル(MDD, y=1; HC, y=0)を表わし、csubは、与えられた参加者に対するFCベクトルを表わし、wはウェイトベクトルを表わす。
ウェイトベクトルwは、以下の評価関数(コスト関数)を最小化するように決定される(LASSO計算)。
LASSO計算では、コスト関数において、ウェイトベクトルの各要素の絶対値(1次)の総和(L1ノルム)が第2項として存在する。
ここで、λはハイパーパラメーターを表わし、評価に適用される収縮量をコントロールする。
判別器生成部3008は、各サブサンプルにおいて、これも特に限定されないが、所定数のデータをハイパ―パラメータ調整用データとし、残りのデータ(たとえば、n=250または248人のデータ)を用いてウェイトベクトルwを決定する。このとき、判別器生成部3008は、特に限定されないが、たとえば、ハイパーパラメータλが0<λ≦1.0であるものとして、この区間を、P等分(P:自然数)、たとえば25等分した各値のλを使用して、上記のようなLASSO計算により、ウェイトベクトルwを決定する。
このとき、上述の通り、「入れ子構造の交差検証」として、ハイパーパラメータの調整については、「内側の交差検証」として実行する。内側の交差検証では、外側の交差検証の「テストデータセット」は、使用されない。
その上で、判別器生成部3008は、生成された各λの値に対応するロジスティック関数によりハイパ―パラメータ調整用データについて判別性能を比較し、最も判別性能の高いλに対応するロジスティック関数を決定する(ハイパーパラメータの調整処理)。
続いて、判別器生成部3008は、現在の交差検証のループの中で生成された各サブサンプルに対応するロジスティック関数の出力値の平均を出力するものとして「分類器サブモデル」を設定する(S116)。
判別器生成部3008は、ステップS110で準備されたテストデータセットを入力として、現在の交差検証のループの中で生成された分類器サブモデルの検証を実行する(S118)。
なお、アンダーサンプリングとサブサンプリングにより、サブサンプルを生成して、各サブサンプルにおいて、特徴選択を実行して分類器サブモデルを生成する方法としては、上記のようなLASSO法とハイパーパラメタの調整とを実行する方法以外に、他のスパースモデリングの手法を利用していもよい。
判別器生成部3008は、交差検証のループをK回(ここでは10回)分終了していないと判断すると(S122でN)、K分割されたデータにおいて、それまでのループで使用したのとは異なる別の部分データセットをテストデータセットに設定し、残りの部分データセットをトレーニングデータセットに設定して(S108,S110)、処理を繰り返す。
一方で、判別器生成部3008は、交差検証のループをK回(10回)分終了している場合(S122でY)、入力データに対して、K×M個(この場合は、10×10=100個)のロジスティック関数(分類器)の出力の平均を出力するものとして、MDDに対する分類器モデル(MDD分類器)を生成する(S120)。
MDD分類器の出力(診断の確率値)が、0.5を超えるときは、MDD患者を示す指標と見なすことができる。
さらに、本実施の形態でも、このようにして生成されたMDD分類器の性能の評価指標として、マシューズ相関係数(MCC:Matthews correlation coefficients)、ROC曲線(Receiver Operatorating Characteristic curve、受信者動作特性曲線)についてのROC曲線下面積(AUC: area under the curve)、正確度(Accuracy)、感度(Sensitivity)、特異度(Specificity)を使用する。
なお、それぞれのサブサンプルにおいて特徴選択された特徴量(この場合、測定バイアスに対するハーモナイゼーション処理後の相関行列の要素)を使用して、対象疾患(たとえば、MDD)の分類器を生成する手法は、このような複数個の分類器サブモデルの出力の平均処理によるものに限られず、特徴選択された特徴量に対して、他のモデリング手法、特に、他のスパースモデリング手法を使用して分類器を生成する構成としてもよい。
図33は、全撮像サイトについて、学習用データセットに対するMDDの予測性能(出力の確率分布)を示す図である。
学習用データセットに対して、0.5のしきい値によって、分類器モデルからの出力において、MDD患者と健常者の個体群に対応する2つの診断の確率分布が、明白に、右(MDD)と左(HC)へ分離されている。
分類器モデルは、MDD患者を66%の正確度でHC個体群から分離する。
対応するAUCは、0.77であり、高い識別力を示した。
また、MCCは、約0.33である。
図34は、各撮像サイトについて、学習用データセットに対するMDDの予測性能(分類器の出力の確率分布)を示す図である。
図34から、全データセットだけでなく3つの撮像サイト(サイト1、サイト2、サイト4)の個々のデータセットのに対して、ほとんど同じ程度に高い分類精度が達成されることがわかる。
なお、サイト3(SWA)のデータセットには、単に健常者群があるだけであるが、その確率分布は、他のサイトの健常者群のものに相当している。
(分類器の汎化性能)
図35は、独立した検証データセットにおけるMDDの分類器の出力の確率分布を示す図である。
すなわち、独立した検証データセットを使用して、分類器モデルの汎化性能がテストされる。
MDDに対して、図32の処理において100個(10分割×10サブサンプリング)のロジスティック関数の分類器が機械学習により生成されており、独立した検証データセットを、生成された100個の分類器のすべて(分類器の集合としての分類器モデル)に入力する。
そして、各参加者につき100個の分類器の出力の平均(診断の確率)をとり、平均された診断の確率値が>0.5だった場合、その参加者の診断ラベルとして、大うつ病性障害が該当するものとする。
独立した検証データセットにおいて、約70%の精度で、生成された分類器モデルは、MDD個体群をHC個体群から分離している。
対応するAUCは、0.75となり、高い識別能力となる能力を示した(並べかえ検定p<0.01)。
独立検証データセットに対して、0.5のしきい値によって、分類器モデルからの出力において、MDD患者と健常者の個体群に対応する2つの診断の確率分布が、明白に、右(MDD)と左(HC)へ分離されている。
感度は68%であり、特異度は71%である。これは、0.38という高いMCC値となっている(並べかえ検定 p<0.01)。
図36は、各撮像サイトについて、独立検証データセットに対するMDDの分類器の出力の確率分布を示す図である。
4つの撮像サイトの全データセットだけでなく個々のデータセットに対して高い分類精度が達成されることがわかる。
なお、以上の説明では、図32に示したようなフローチャートにより生成された、K×M個のロジスティック関数(分類器)の出力の平均が、分類器モデル(MDD分類器)となる例について説明した。
このような構成により、複数の計測サイトにおいて異なる計測装置により計測された脳活動情報(時系列の安静時fMRI画像情報)に基づいて、十分な汎化性能を有して、健常群と患者群とを分類することが可能な分類器を生成することが可能となる。
ただし、ハーモナイゼーション処理の後に、MDD分類器を構成する手続きは、このようなものに必ずしも限定されず、たとえば、以下の文献に開示されるような「スパースモデリング」の手法きにより、「診断ラベル」に対応するMDD分類器を生成してもよい。
文献:特許第6341513号
文献:特許第6195329号
たとえば、特許第6195329号では、健常群、患者群において測定された安静時機能結合的MRIのデータから、所定の脳領域間の活動度の相関行列を導出する。被験者の診断ラベルを含む被験者の属性と相関行列とについて正則化正準相関解析(SCCA:Sparse Canonical Correlation Analysis)により、診断ラベルのみに対応する正準変数と接続する相関行例の要素を抽出する。正則化正準相関解析の特徴抽出により得られた相関行列の要素の第1の和集合に対して、1個抜き交差検証によるスパースロジスティク回帰(SLR)で、相関行列の要素の第2の和集合を抽出する。第2の和集合に対して、スパースロジスティク回帰による判別分析により判別器が生成される。
スパースロジスティック回帰は、ロジスティック回帰分析をベイズ推定の枠組みに拡張した手法であり、特徴ベクトルの次元圧縮を判別のための重み推定と同時に行う手法である。データの特徴ベクトルの次元数が非常に高く、不要な特徴量が多く含まれている場合に有用である。不要な特徴量に対しては線形判別分析における重みパラメータをゼロにし(すなわち、特徴選択を行い)、判別に関連するごく少数の特徴量だけを取り出す(スパース性)。
スパースロジスティック回帰では得られた特徴データに対して、分類するクラスへの所属する確率pをクラス毎に求め、最大値を出力したクラスに割り当てる。pはロジスティック回帰式によって出力される。重みの推定はARD(Automatic Relevance determination)によって行われ、クラス判別への貢献が少ない特徴量は、重みが0に近づくことで計算から除外される。
なお、このようなスパースロジスティック回帰については、以下の文献に開示がある。
文献:Okito Yamashita, Masa aki Sato, Taku Yoshioka, Frank Tong, and Yukiyasu Kamitani. ”Sparse Estimation automatically selects voxels relevant for the decoding of fMRI activity patterns.” NeuroImage, Vol. 42, No. 4, pp. 1414-1429, 2008.
文献:相良和彦、田中靖人、竹市博臣、山下宙人、長谷川良平、岡部達哉、前田太郎著、「ブレインコミュニケーション−脳と社会の通信手段−」、電子情報通信学会編、コロナ社、平成23年4月25日初版第1刷発行
(診断と症候に共通する脳機能結合の抽出)
従来は、以下の文献にも示されるように、安静時脳機能結合に基づいて健常群(HC)とMDD患者群とを識別するバイオマーカーを構築する場合に、(医師による従来の症候に基づく手法での)MDDの診断に基づいている。
文献:Ichikawa, N., Lisi, G., Yahata, N., Okada, G., Takamura, M., Yamada, M., et al. (2017). Identifying melancholic depression biomarker using whole-brain functional connectivity. arXiv.
しかしながら、多くの研究で、既存の臨床診断のカテゴリーと神経生物学的な異常の間の明瞭な関連性を見出すことの困難さが指摘されている。
このような困難は、症候や、疫学調査や、医師の経験といったようなものが複雑に混合した情報に、各患者の診断が基づくという事実によっていると考えられる。
複数の疾患について、構造的、機能的および遺伝的な異常の高度に合併した病的状態は、この問題をさらに難しくさせる。
このような背景の下で、脳科学的な理解に基づいたMDDの診断および治療のためには、MDD診断と関係する機能的結合と抑うつの症候に関係する安静時機能的結合とを比較しつつ、このような症候に関連する機能的結合を調べることが必要になる。
そこで、以下では、診断と症候と関係する安静時機能的結合FCを自動的に客観的に識別するような機械学習アルゴリズムについて説明する。
図37は、このように、精神疾患(たとえば、大うつ病性障害)の診断と症候とに、共通な脳内の機能的結合を導き出す手続きの概念図である。
すなわち、これまでに説明したように、安静時の脳機能結合に基づいて、健常群(HC)および患者群(たとえば、MDD患者群)を識別するような分類器が生成される。
一方で、以下に説明するように、安静時の脳機能結合に基づいて、症候の評価尺度(たとえば、ベックうつ病自己評価尺度II)の回帰モデルを構築する。その後、診断と関係する脳機能結合と、症候と関係する脳機能結合の間の共通部分を抽出する。
図38は、このような症候の評価尺度(たとえば、ベックうつ病自己評価尺度II)を予測するような回帰モデル生成する手続きを説明するためのフローチャートである。
図38を参照して、評価尺度の回帰モデルに対する学習処理が開始されると(S200)、予め準備され(記憶装置2080´に格納され)た学習データセットを使用して(S202)、相関行列算出部3002が、結合マトリックスの成分を算出する。
続いて、ハーモナイゼーション算出部3020が、測定バイアスを算出して、ハーモナイゼーション処理を実施する(S204)。
上述のとおり、ハーモナイゼーション処理は、トラベリングサブジェクトを用いた方法が望ましいが、他の方法であってもよい。
続いて、判別器生成部3008は、ハーモナイゼーション処理後のデータセットのうち、症候評価尺度(たとえば、BDIスコア)を取得済みの参加者についてのデータを学習用データセットとして取得する(S206)。
続いて、判別器生成部3008は、学習用データに対して、いわゆる「K分割交差検証」の手法により、評価尺度の回帰モデルを生成する。
まず、判別器生成部3008は、学習用データに対して、「K分割交差検証」を使用して学習処理を実行するために、たとえば、K=10として、学習用データを10分割する。
すなわち、判別器生成部3008は、K分割(たとえば、10分割)されたうちの1つの部分データセットを検証用の「テストデータセット」とし、残りの(K−1)分割(9分割)分のデータを訓練データセット(トレーニングデータセット)に設定する(S210,S212)。
続いて、判別器生成部3008は、以下の式のように、71,631の機能的結合FCの値に基づいた学習用データセットを使用して、BDIスコアを予測するために直線回帰モデルを構築する。
すなわち、直線回帰モデルを構築するために、BDIスコアを有する学習用データセットに、LASSO法を使用して、判別器生成部3008は、以下のように直線回帰を使用して、回帰サブモデルi(i=1〜K)を生成する(S214)。
(予測BDIsub)=wTsub
ここで、予測BDIsubは、参加者のBDIスコアを表わす。csubは、参加者の機能的結合FCベクトルを表わす。また、wは、直線回帰のウェイトベクトルを表わす。
なお、回帰モデルとしては、直線回帰モデルに限定されるものではなく、他の関数形の回帰モデルを用いてもよい。
続いて、テストデータセットにより、回帰サブモデルiの検証が実行される(S216)。
続いて、判別器生成部3008は、交差検証のループをK回(10回)分終了していないと判断すると(S218でN)、K分割されたデータにおいて、それまでのループで使用したのとは異なる別の部分データセットをテストデータセットに設定し、残りの部分データセットをトレーニングデータセットに設定して(S210,S212)、処理を繰り返す。
一方で、判別器生成部3008は、交差検証のループをK回(10回)分終了している場合(S218でY)、トレーニングデータセット中の10分割のデータセット中で、サブモデルの生成のために選択された機能的結合FCを統合した脳の機能的結合の部分集合を抽出し(S220)、このような脳の機能的結合の部分集合を説明変数として、回帰モデルを構築する(S222)。
ただし、このような手続きでは、分割間での情報リークを引き起こして、トレーニングデータセットに対する学習結果は、過適応を起こす可能性がある。
そこで、以下に説明するように、独立した検証データセットにこの回帰モデルを適用することにより、汎化性能も確認する。
図39は、学習用データセットに基づいて生成された回帰モデルの予測性能を示す図である。
図39に示すように、回帰モデルにより予測されたBDIスコアと実測されたBDIスコアとの間の平均絶対誤差(MAE)およびピアソンの相関係数rも併せて示す。
統計的に有意な相関でBDIスコアがよく予測されることがわかる(r=0.62およびp=5.3×10-52; 平均の絶対誤差=6.24)。
図40は、独立した検証データセットにおけるBDIスコアに対する回帰モデルの性能を示す図である。
図40は、測定されたBDIおよび予測されたBDIの散布図である。
ここでも、統計的に有意な相関でBDIスコアがよく予測されることがわかる(r =0.21、p=9.1×10-6;平均の絶対誤差=11.8)。
図41は、MDD分類器とBDI回帰モデルの双方の構築において、共通する7つの脳の機能的結合FCの空間分布を示す図である。
すなわち、図41では、診断と症候の間の共通の機能結合が、後ろ、左、右および上部から見た図として示される。半球間結合は後部と平面図の中でのみ示される。
図42は、図41に示した共通する7つの脳の機能的結合FCの特性を示すリストを示す図である。
図42では、共通の機能結合およびBDIスコアの回帰モデル中のウェイト(重み)が示される。
図41および図42に示される共通な機能的結合FCを抽出するにあたっては、まず、MDD分類器からの診断と関係する重要な機能的結合FC、およびBDI回帰モデルからの症候と関係する重要な機能的結合FCが、判別器生成部3008により、抽出される。
具体的には、判別器生成部3008は、各機能的結合FCが10分割交差検証においてLASSO計算によって選択された回数をカウントする。
このようなのカウント数が二項検定による偶然より有意に高かった場合、機能的結合FCを重要であると判定される。
以上説明したような具体例では、1つの交差検証当たりに、MDD分類器で使用される機能的結合FCの数が、平均で329.1だったので(このFCの数は、10個のサブサンプリングで少なくとも1回以上選択された数である)、診断と関係するFCに関して、B(10,329/71,631)として回数の二項分布を仮定する。
その後、ボンフェローニの訂正の後に、0.05/71,631として有意水準を設定する。
以上の具体例の場合、判別器生成部3008は、10分割交差検証において3回以上選択されたFCは、診断と関係する重要なFCと判断することになる。
同様に、症候と関係するFCに関しては、BDI回帰モデルの中で使用された機能的結合FCの数は、1分割の交差検証当たり平均で3.4であったので、B(10,3/71,631)として回数の二項分布を仮定する。
以上の具体例の場合、判別器生成部3008は、10分割交差検証において1回以上選択されたFCは、症候と関係する重要なFCと判断することになる。
機械学習アルゴリズムによってMDD患者群と健常群HCとの間の分類器およびBDIスコアの回帰モデルのデータから自動的にかつ客観的に、診断と関係する340個の機能的結合FC、および症候と関係する21の機能的結合FCが特定される。
7つの機能的結合FCが、340個の機能的結合FCと21個の機能的結合FCの間で共通していた。
図43は、共通の機能的結合FCにおける学習用データセットおよび独立した検証データセットの間の機能的結合FCの値を示す図である。
図43に示すように、7つの共通する機能的結合FCの平均の機能的結合の値は、学習用データセット、および独立した検証データセットの間で非常に類似していた。
この結果は、7つの機能的結合FCがMDDおよび抑うつの症候の神経基盤を特徴づけることにおいて信頼できることを示唆する。
したがって、以上説明したような方法によれば、複数のサイトで集められたMDD患者群および健常群HCの安静時fMRIデータを使用して、機能的結合FCの全脳のパターンを用いることにより、脳画像検査に基づいた信頼できるMDDに対する分類器およびBDIの回帰モデルを構築できることが示される。
MDD分類器は、独立した検証データセットに対して高い汎化された予測性能AUCおよびMCCを達成した。
更に、高い汎化された予測性能は、独立した検証データセットの全データセットだけでなく4つの撮像サイトのデータセットに対して個別にも達成される。これらの検証データセットは学習用データセットに含まれていない。
しかも、独立した検証データセット中の撮像プロトコルは学習用データセットとは、厳密には異なっていたが、この汎化が達成された。
脳の機能的結合FCに基づいて独立した検証データに汎化したMDD分類器の成功裏に構築するというだけでなく、MDDサブタイプに対する制限のないMDDに対する汎化された分類に成功していることになる。
また、以上説明したような機械学習アルゴリズムは、信頼性をもって、機能的結合FCを疾患(たとえば、MDD)の分類器および症候の評価尺度(たとえば、BDIスコア)の回帰モデルの両方に共通して重要な機能的結合FCを抽出することができる。
さらに、以下のように、MDDに関して、診断と症候に共通な7つの機能的結合FCの特性として、以下のような点があることも示される。
第1に、機能的結合FCの強さに関して、7つのFCはすべて、MDD個体群では、ハイポコネクティビティ(hypoconnectivity)を示す(すなわち、機能的結合FCの強さはHC個体群よりMDD個体群ではより0に近くなる)。
第2に、7つの機能的結合FCは、内在性の機能的なネットワークへの寄与に関しては、密接にデフォルト・モード・ネットワークおよび顕著性ネットワークと関係がある。
これらの7つの機能的結合FCを含む13の脳領域から、5つの部位がデフォルト・モード・ネットワークに属し、5つの部位が顕著性ネットワークに属した。
更に、6つの機能的結合FCがデフォルト・モード・ネットワークあるいは顕著性ネットワークのいずれかにノード(ROI)を持っている。
7つの機能的結合FCのうちの2つの機能的結合FCは、2つのネットワーク間の結合であった。
2つの機能的結合FCはデフォルト・モード・ネットワーク内の結合であり、1つの機能的結合FCは顕著性ネットワーク内の結合であった。
デフォルト・モード・ネットワークおよび顕著性ネットワークは、従来から、抑うつに関与するとの報告があり、上記のような結果は、これらと矛盾しない。
バイオマーカーは、患者を診断する目的で開発されているが、焦点は、治療の目標を決定するバイオマーカーを特定することに移りつつある(つまり、診断と治療を融合するバイオマーカー)。それはより多くの個別化された治療アプローチを可能とする。
上述したような手続きで抽出された共通な機能的結合FCは、MDDの診断だけでなく抑うつの症候と関係があるので、この7つの機能的結合FCはMDDに対する診断と治療を融合するバイオマーカーの有望な候補である。
したがって、抑うつ症候の改善を実現するために、たとえば、以下の文献に開示されるような手法により、これらの機能的結合FCに対して、機能結合ニューロフィードバックトレーニングのような機能結合に介入する方法を使用することが可能となる。
文献:Yamada, T., Hashimoto, R.I., Yahata, N., Ichikawa, N., Yoshihara, Y., Okamoto, Y., et al. (2017). Resting-State Functional Connectivity-Based Biomarkers and Functional MRI-Based Neurofeedback for Psychiatric Disorders: A Challenge for Developing Theranostic Biomarkers. Int J Neuropsychopharmacol 20(10), 769-781. doi: 10.1093/ijnp/pyx059.
今回開示された実施の形態は、本発明を具体的に実施するための構成の例示であって、本発明の技術的範囲を制限するものではない。本発明の技術的範囲は、実施の形態の説明ではなく、特許請求の範囲によって示されるものであり、特許請求の範囲の文言上の範囲および均等の意味の範囲内での変更が含まれることが意図される。
2 被験者、6 ディスプレイ、10 MRI装置、11 磁場印加機構、12 静磁場発生コイル、14 傾斜磁場発生コイル、16 RF照射部、18 寝台、20 受信コイル、21 駆動部、22 静磁場電源、24 傾斜磁場電源、26 信号送信部、28 信号受信部、30寝台駆動部、32 データ処理部、36 記憶部、38 表示部、40 入力部、42 制御部、44 インタフェース部、46 データ収集部、48 画像処理部、50 ネットワークインタフェース。

Claims (22)

  1. 複数の計測サイトで計測される被験者の脳機能結合相関値の補正を行うための調整方法であって、
    複数の計測サイトの各々において共通に計測対象となる複数の移動被験者に対して、各前記移動被験者の予め定められた複数の脳領域について脳活動を計測するステップと、
    前記複数の脳領域の組についての脳活動の時間相関を表す脳機能結合行列の所定の要素を各前記移動被験者について算出するステップと、
    一般化線形混合モデル法を用いることで、前記機能結合行列の所定の要素ごとに、前記複数の計測サイトおよび前記複数の移動被験者にわたる当該要素の平均に対する各計測サイトにおける固定効果として、測定バイアスを算出するステップと、
    各前記計測サイトで計測される被験者の脳活動の時間相関を表す脳機能結合行列の所定の要素である脳機能結合相関値を前記測定バイアスを用いて補正することで、調整値を得るステップとを含む、脳機能結合相関値の調整方法。
  2. 対象者の脳機能結合相関値の補正を行うための調整システムであって、
    複数の被験者の脳活動を時系列で計測するために、複数の計測サイトにそれぞれ設けられた複数の脳活動計測装置と、
    前記脳機能結合相関値の補正を行うための計算処理システムとを備え、
    前記計算処理システムは、
    データを格納するための記憶装置を含み、前記記憶装置は、前記複数の計測サイトの各々において共通に計測対象となる複数の移動被験者に対して、各前記移動被験者の予め定められた複数の脳領域について脳活動を計測した結果を格納し、
    演算装置をさらに含み、前記演算装置は、
    前記複数の脳領域の組についての脳活動の時間相関を表す脳機能結合行列の所定の要素を各前記移動被験者について算出し、
    一般化線形混合モデル法を用いることで、前記機能結合行列の所定の要素ごとに、前記複数の計測サイトおよび前記複数の移動被験者にわたる当該要素の平均に対する各計測サイトにおける固定効果として、測定バイアスを算出し、
    各前記計測サイトで計測される被験者の脳活動の時間相関を表す脳機能結合行列の所定の要素である脳機能結合相関値を前記測定バイアスを用いて補正することで、調整値を算出する、脳機能結合相関値の調整システム。
  3. 複数の計測サイトで計測される複数の被験者の少なくとも1つの属性に対する分類処理を実行するための脳活動分類器のハーモナイズ方法であって、
    前記複数の計測サイトの各々において共通に計測対象となる複数の移動被験者に対して、各前記移動被験者の予め定められた複数の脳領域について脳活動を計測するステップと、
    前記複数の脳領域の組についての脳活動の時間相関を表す脳機能結合行列の所定の要素を各前記移動被験者について算出するステップと、
    一般化線形混合モデル法を用いることで、前記機能結合行列の所定の要素ごとに、前記複数の計測サイトおよび前記複数の移動被験者にわたる当該要素の平均に対する各計測サイトにおける固定効果として、測定バイアスを算出するステップと、
    各前記計測サイトで計測される複数の訓練データ対象の被験者の脳活動の時間相関を表す脳機能結合行列の所定の要素である脳機能結合相関値を前記測定バイアスを用いて補正することで、調整値をそれぞれ得るステップと、
    前記調整値に基づいて、前記属性に対する分類器を、特徴選択を伴う機械学習法により生成するステップと、を備える、脳活動分類器のハーモナイズ方法。
  4. 各前記計測サイトで脳活動を計測される前記複数の訓練データ対象の被験者は、前記属性を有する第1の群と、前記属性を有さない第2の群とを含み、
    前記測定バイアスを算出するステップは、
    一般化線形混合モデル法を用いることで、前記機能結合行列の所定の要素ごとに、前記複数の計測サイトおよび前記複数の移動被験者並びに前記複数の訓練データ対象の被験者にわたる当該要素の平均に対する各計測サイトにおける固定効果として、前記測定バイアス並びに前記第1の群の標本バイアスおよび前記第2の群の標本バイアスを算出するステップを含む、請求項3記載の脳活動分類器のハーモナイズ方法。
  5. 前記一般化線形混合モデル法においては、L2正規化による最小二乗回帰により、前記測定バイアスを算出する請求項3または4記載の脳活動分類器のハーモナイズ方法。
  6. 前記特徴選択を伴う機械学習法は、LASSO(least
    absolute shrinkage and selection operator)を使用するロジスティックスの回帰分析法である、請求項3〜5のいずれか1項に記載の脳活動分類器のハーモナイズ方法。
  7. 対象者の脳活動の計測結果に基づいて、少なくとも1つの属性に対する分類処理を実行するための脳活動分類器のハーモナイズシステムであって、
    複数の被験者の予め定められた複数の脳領域について脳活動を時系列で計測するために、複数の計測サイトにそれぞれ設けられた複数の脳活動計測装置と、
    前記複数の脳領域の組についての脳活動の時間相関を表す脳機能結合行列の所定の要素である脳機能結合相関値の補正を行うための計算処理システムとを備え、
    前記計算処理システムは、
    データを格納するための記憶装置を含み、前記記憶装置は、前記複数の計測サイトの各々において共通に計測対象となる複数の移動被験者に対して、各前記移動被験者の前記複数の脳領域について脳活動を計測した結果を格納し、
    演算装置をさらに含み、前記演算装置は、
    記脳機能結合行列の所定の要素を各前記移動被験者について算出し、
    一般化線形混合モデル法を用いることで、前記機能結合行列の所定の要素ごとに、前記複数の計測サイトおよび前記複数の移動被験者にわたる当該要素の平均に対する各計測サイトにおける固定効果として、測定バイアスを算出し、
    各前記計測サイトで計測される複数の訓練データ対象の被験者の前記脳機能結合相関値を前記測定バイアスを用いて補正することで、調整値をそれぞれ算出し、
    前記調整値に基づいて、前記属性に対する分類器を、特徴選択を伴う機械学習法により生成する、脳活動分類器のハーモナイズシステム。
  8. 各前記計測サイトで脳活動を計測される前記複数の訓練データ対象の被験者は、前記属性を有する第1の群と、前記属性を有さない第2の群とを含み、
    前記演算装置は、前記測定バイアスを算出する際に、
    一般化線形混合モデル法を用いることで、前記機能結合行列の所定の要素ごとに、前記複数の計測サイトおよび前記複数の移動被験者並びに前記複数の訓練データ対象の被験者にわたる当該要素の平均に対する各計測サイトにおける固定効果として、前記測定バイアス並びに前記第1の群の標本バイアスおよび前記第2の群の標本バイアスを算出する、請求項7記載の脳活動分類器のハーモナイズシステム。
  9. 前記一般化線形混合モデル法においては、L2正規化による最小二乗回帰により、前記測定バイアスを算出する請求項7または8記載の脳活動分類器のハーモナイズシステム。
  10. 前記特徴選択を伴う機械学習法は、LASSOを使用するロジスティックスの回帰分析法である、請求項7〜9のいずれか1項に記載の脳活動分類器のハーモナイズシステム。
  11. 対象者の脳活動の計測結果に基づいて、少なくとも1つの疾患の有無の属性に対する分類処理を実行するための脳活動分類器を用いた脳活動バイオマーカシステムであって、
    複数の被験者の予め定められた複数の脳領域について脳活動を時系列で計測するために、複数の計測サイトにそれぞれ設けられた複数の脳活動計測装置と、
    前記複数の脳領域の組についての脳活動の時間相関を表す脳機能結合行列の所定の要素である脳機能結合相関値の補正を行うための計算処理システムとを備え、前記計算処理システムは、記憶装置と演算装置を含み、前記演算装置は、
    各前記計測サイトで計測される複数の被験者の前記脳機能結合相関値を測定バイアスを除去するように補正することで、
    補正された調整値をそれぞれ算出して前記記憶装置に格納し、
    前記調整値に基づいて、前記疾患の有無の属性に対する分類器を、第1の特徴選択を伴う機械学習により生成する、脳活動バイオマーカシステム。
  12. 前記記憶装置は、前記複数の計測サイトの各々において共通に計測対象となる複数の移動被験者に対して、各前記移動被験者の予め定められた複数の脳領域について脳活動を計測した結果を予め格納しており、
    前記演算装置は、
    前記複数の脳領域の組についての脳活動の時間相関を表す脳機能結合行列の所定の要素を各前記移動被験者について算出し、
    一般化線形混合モデル法を用いることで、前記機能結合行列の所定の要素ごとに、前記複数の計測サイトおよび前記複数の移動被験者にわたる当該要素の平均に対する各計測サイトにおける固定効果として、前記測定バイアスを算出する、請求項11記載の脳活動バイオマーカシステム。
  13. 前記演算装置は、前記複数の計測サイトのいずれかで計測された対象者についての計測データに基づいて、前記疾患の有無の属性に対する分類処理を実行する、請求項11または12記載の脳活動バイオマーカシステム。
  14. 前記演算装置は、前記第1の特徴選択を伴う機械学習において、
    i)前記調整値を、機械学習用のトレーニングデータセットと検証用のテストデータセットとに分割し、
    ii)前記トレーニングデータセットに対して、アンダーサンプリングおよびサブサンプリングを所定数だけ実行して、前記所定数のサブサンプルを生成し、
    iii)前記サブサンプルごとにスパースモデリング法による特徴選択により分類器サブモデルを生成し、
    iv)前記特徴選択に基づいて、前記疾患の有無の属性に対する分類器を生成する、
    請求項11〜13のいずれか1項に記載の脳活動バイオマーカシステム。
  15. 前記第1の特徴選択を伴う機械学習は、外側の交差検証と内側の交差検証を有する入れ子構造の交差検証であり、
    前記演算装置は、前記入れ子構造の交差検証の処理において、
    i)前記外側の交差検証をK分割交差検証として、前記調整値を、機械学習用のトレーニングデータセットと検証用のテストデータセットとに分割し、
    ii)前記トレーニングデータセットに対して、アンダーサンプリングおよびサブサンプリングを所定数だけ実行して、前記所定数のサブサンプルを生成し、
    iii)前記K分割交差検証の各ループにおいて、前記内側の交差検証で、前記サブサンプルごとに分類器サブモデルを生成し、
    iv)前記分類器サブモデルに基づいて、前記疾患の有無の属性に対する分類器を生成する、請求項11〜13のいずれか1項に記載の脳活動バイオマーカシステム。
  16. 前記記憶装置は、前記複数の被験者ごとに、前記疾患の評価尺度の情報を格納しており、
    前記演算装置は、
    前記調整値に基づいて、前記疾患の評価尺度に対する回帰モデルを、第2の特徴選択を伴う機械学習により生成し、
    前記第1の特徴選択および前記第2の特徴選択により共通に抽出される脳機能結合を特定する、請求項11〜15のいずれか1項に記載の脳活動バイオマーカシステム。
  17. 対象者の脳活動の計測結果に基づいて、少なくとも1つの疾患の有無の属性に対する分類処理を実行するための脳活動分類器を用いた脳活動バイオマーカシステムの動作を制御するコンピュータプログラムであって、
    前記脳活動バイオマーカシステムは、
    複数の被験者の予め定められた複数の脳領域について脳活動を時系列で計測するために、複数の計測サイトにそれぞれ設けられた複数の脳活動計測装置と、
    記憶装置と演算装置とを有し、前記複数の脳領域の組についての脳活動の時間相関を表す脳機能結合行列の所定の要素である脳機能結合相関値の補正を行うための計算処理システムと含み、
    前記コンピュータプログラムは、前記演算装置に、
    各前記計測サイトで計測される複数の被験者の前記脳機能結合相関値を測定バイアスを除去するように補正することで、補正された調整値をそれぞれ算出して前記記憶装置に格納するステップと、
    前記調整値に基づいて、前記疾患の有無の属性に対する分類器を、第1の特徴選択を伴う機械学習により生成するステップと、を実行させる、コンピュータプログラム。
  18. 前記記憶装置は、前記複数の計測サイトの各々において共通に計測対象となる複数の移動被験者に対して、各前記移動被験者の予め定められた複数の脳領域について脳活動を計測した結果を予め格納しており、
    前記コンピュータプログラムは、前記演算装置に、
    前記複数の脳領域の組についての脳活動の時間相関を表す脳機能結合行列の所定の要素を各前記移動被験者について算出するステップと、
    一般化線形混合モデル法を用いることで、前記機能結合行列の所定の要素ごとに、前記複数の計測サイトおよび前記複数の移動被験者にわたる当該要素の平均に対する各計測サイトにおける固定効果として、測定バイアスを算出するステップと、
    を実行させる、請求項17記載のコンピュータプログラム。
  19. 前記演算装置に、前記複数の計測サイトのいずれかで計測された対象者についての計測データに基づいて、前記疾患の有無の属性に対する分類処理を行うステップをさらに実行させる、請求項17または18記載のコンピュータプログラム。
  20. 前記演算装置は、前記第1の特徴選択を伴う機械学習において、
    i)前記調整値を、機械学習用のトレーニングデータセットと検証用のテストデータセットとに分割するステップと、
    ii)前記トレーニングデータセットに対して、アンダーサンプリングおよびサブサンプリングを所定数だけ実行して、前記所定数のサブサンプルを生成するステップと、
    iii)前記サブサンプルごとにスパースモデリングによる特徴選択により分類器サブモデルを生成するステップと、
    iv)前記特徴選択に基づいて、前記疾患の有無の属性に対する分類器を生成するステップとを実行する、請求項17〜19のいずれか1項に記載のコンピュータプログラム。
  21. 前記第1の特徴選択を伴う機械学習は、外側の交差検証と内側の交差検証を有する入れ子構造の交差検証であり、
    前記演算装置は、前記入れ子構造の交差検証の処理において、
    i)前記外側の交差検証をK分割交差検証として、前記調整値を、機械学習用のトレーニングデータセットと検証用のテストデータセットとに分割するステップと、
    ii)前記トレーニングデータセットに対して、アンダーサンプリングおよびサブサンプリングを所定数だけ実行して、前記所定数のサブサンプルを生成するステップと、
    iii)前記K分割交差検証の各ループにおいて、前記内側の交差検証で、前記サブサンプルごとに分類器サブモデルを生成するステップと、
    iv)前記分類器サブモデルに基づいて、前記疾患の有無の属性に対する分類器を生成するステップとを実行する、請求項17〜19のいずれか1項に記載のコンピュータプログラム。
  22. 前記記憶装置は、前記複数の被験者ごとに、前記疾患の評価尺度の情報を格納しており、
    前記演算装置は、
    前記調整値に基づいて、前記疾患の評価尺度に対する回帰モデルを、第2の特徴選択を伴う機械学習により生成するステップと、
    前記第1の特徴選択および前記第2の特徴選択により共通に抽出される脳機能結合を特定するステップとを実行する、請求項17〜21のいずれか1項に記載コンピュータプログラム。
JP2019034887A 2018-10-11 2019-02-27 脳機能結合相関値の調整方法、脳機能結合相関値の調整システム、脳活動分類器のハーモナイズ方法、脳活動分類器のハーモナイズシステム、および脳活動バイオマーカシステム Active JP6812022B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
PCT/JP2019/039751 WO2020075737A1 (ja) 2018-10-11 2019-10-09 脳機能結合相関値の調整方法、脳機能結合相関値の調整システム、脳活動分類器のハーモナイズ方法、脳活動分類器のハーモナイズシステム、及び脳活動バイオマーカシステム
EP19870503.0A EP3865061A4 (en) 2018-10-11 2019-10-09 BRAIN FUNCTIONAL CONNECTIVITY CORRELATION VALUE ADJUSTMENT METHOD, BRAIN FUNCTIONAL CONNECTIVITY CORRELATION VALUE ADJUSTMENT SYSTEM, BRAIN ACTIVITY CLASSIFIER HARMONIZATION METHOD, BRAIN ACTIVITY CLASSIFIER HARMONIZATION SYSTEM AND BRAIN ACTIVITY BIOMARKER
US17/284,051 US20210401289A1 (en) 2018-10-11 2019-10-09 Brain functional connectivity correlation value adjustment method, brain functional connectivity correlation value adjustment system, brain activity classifier harmonization method, brain activity classifier harmonization system, and brain activity biomarker system
CN201980066976.XA CN112839577A (zh) 2018-10-11 2019-10-09 脑功能连接相关值的调整方法、脑功能连接相关值的调整系统、脑活动分类器的协调方法、脑活动分类器的协调系统以及脑活动生物标记物系统

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018192842 2018-10-11
JP2018192842 2018-10-11

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2020204081A Division JP7247159B2 (ja) 2018-10-11 2020-12-09 脳活動分類器のハーモナイズシステム、及び脳活動分類器プログラム

Publications (2)

Publication Number Publication Date
JP2020062369A JP2020062369A (ja) 2020-04-23
JP6812022B2 true JP6812022B2 (ja) 2021-01-13

Family

ID=70387934

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2019034887A Active JP6812022B2 (ja) 2018-10-11 2019-02-27 脳機能結合相関値の調整方法、脳機能結合相関値の調整システム、脳活動分類器のハーモナイズ方法、脳活動分類器のハーモナイズシステム、および脳活動バイオマーカシステム
JP2020204081A Active JP7247159B2 (ja) 2018-10-11 2020-12-09 脳活動分類器のハーモナイズシステム、及び脳活動分類器プログラム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2020204081A Active JP7247159B2 (ja) 2018-10-11 2020-12-09 脳活動分類器のハーモナイズシステム、及び脳活動分類器プログラム

Country Status (3)

Country Link
EP (1) EP3865061A4 (ja)
JP (2) JP6812022B2 (ja)
CN (1) CN112839577A (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4176805A1 (en) * 2020-07-02 2023-05-10 Advanced Telecommunications Research Institute International Estimation system, estimation method, program, estimation model, brain activity training device, brain activity training method, and brain activity training program
US11699232B2 (en) 2021-09-01 2023-07-11 Omniscient Neurotechnology Pty Limited Brain hub explorer
CN114052668B (zh) * 2022-01-17 2022-06-17 北京航空航天大学杭州创新研究院 一种基于脑磁图数据的脑功能分析方法
CN114862834B (zh) * 2022-05-31 2023-04-25 太原理工大学 一种静息态功能磁共振影像数据分类方法
KR102510756B1 (ko) * 2022-09-07 2023-03-16 서울대학교병원 수술 중 또는 수술 후 뇌졸중 예측 장치 및 방법
CN117454154A (zh) * 2023-12-22 2024-01-26 江西农业大学 一种面向偏标记数据的鲁棒特征选择方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2992824B1 (en) * 2013-05-01 2021-12-29 Advanced Telecommunications Research Institute International Brain activity analysis device and brain activity analysis method
JP5641531B1 (ja) * 2013-05-01 2014-12-17 株式会社国際電気通信基礎技術研究所 脳活動訓練装置および脳活動訓練システム
JP6492356B2 (ja) * 2013-12-16 2019-04-03 株式会社国際電気通信基礎技術研究所 脳活動訓練装置および脳活動訓練方法
JP6583719B2 (ja) 2015-07-24 2019-10-02 国立研究開発法人情報通信研究機構 情報処理装置の作動方法および推定システム
US11382556B2 (en) * 2015-11-24 2022-07-12 Advanced Telecommunications Research Institute International Brain activity analyzing apparatus, brain activity analyzing method, program and biomarker apparatus
WO2017136285A1 (en) * 2016-02-01 2017-08-10 The Board Of Trustees Of The Leland Stanford Junior University Method and systems for analyzing functional imaging data

Also Published As

Publication number Publication date
JP2020062369A (ja) 2020-04-23
EP3865061A1 (en) 2021-08-18
JP7247159B2 (ja) 2023-03-28
CN112839577A (zh) 2021-05-25
EP3865061A4 (en) 2022-07-27
JP2021037397A (ja) 2021-03-11

Similar Documents

Publication Publication Date Title
WO2020075737A1 (ja) 脳機能結合相関値の調整方法、脳機能結合相関値の調整システム、脳活動分類器のハーモナイズ方法、脳活動分類器のハーモナイズシステム、及び脳活動バイオマーカシステム
JP6812022B2 (ja) 脳機能結合相関値の調整方法、脳機能結合相関値の調整システム、脳活動分類器のハーモナイズ方法、脳活動分類器のハーモナイズシステム、および脳活動バイオマーカシステム
JP7140348B2 (ja) 判別装置、うつ症状の判別方法、うつ症状のレベルの判定方法、うつ病患者の層別化方法、うつ症状の治療効果の判定方法及び脳活動訓練装置
JP6497687B2 (ja) 脳活動解析システム及び方法
JP6903518B2 (ja) 脳活動解析システム、脳活動解析装置、及び脳活動解析プログラム
EP2992823B1 (en) Brain activity training device
Fennema-Notestine et al. Feasibility of multi-site clinical structural neuroimaging studies of aging using legacy data
Ing et al. Identification of neurobehavioural symptom groups based on shared brain mechanisms
WO2021205996A1 (ja) 脳機能結合相関値のクラスタリング装置、脳機能結合相関値のクラスタリングシステム、脳機能結合相関値のクラスタリング方法、脳機能結合相関値の分類器プログラム、脳活動マーカー分類システムおよび脳機能結合相関値のクラスタリング分類器モデル
WO2019069955A1 (ja) 判別装置、うつ症状の判別方法、うつ症状のレベルの判定方法、うつ病患者の層別化方法、うつ症状の治療効果の判定方法及び脳活動訓練装置
CN111867464A (zh) 脑活动训练装置、脑活动训练方法以及脑活动训练程序
JP7057995B2 (ja) 哺乳動物におけるうつ病の病態プロファイルを検出するバイオマーカーとその利用
WO2022014682A1 (ja) 脳機能結合相関値のクラスタリング装置、脳機能結合相関値のクラスタリングシステム、脳機能結合相関値のクラスタリング方法、脳機能結合相関値の分類器プログラムおよび脳活動マーカー分類システム
JP2024003782A (ja) 統合失調スペクトラム障害に関する情報を提供するための診断支援システム、診断支援装置、診断支援方法、及び支援プログラム

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20191213

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200401

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200901

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201001

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201110

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201209

R150 Certificate of patent or registration of utility model

Ref document number: 6812022

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S804 Written request for registration of cancellation of exclusive licence

Free format text: JAPANESE INTERMEDIATE CODE: R314803

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S804 Written request for registration of cancellation of exclusive licence

Free format text: JAPANESE INTERMEDIATE CODE: R314803

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250