JP2022188295A - 機械学習ベースの診断分類器 - Google Patents

機械学習ベースの診断分類器 Download PDF

Info

Publication number
JP2022188295A
JP2022188295A JP2022168741A JP2022168741A JP2022188295A JP 2022188295 A JP2022188295 A JP 2022188295A JP 2022168741 A JP2022168741 A JP 2022168741A JP 2022168741 A JP2022168741 A JP 2022168741A JP 2022188295 A JP2022188295 A JP 2022188295A
Authority
JP
Japan
Prior art keywords
machine learning
user
features
mental health
test
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022168741A
Other languages
English (en)
Inventor
モニカ シャルマ メレム
Sharma Mellem Monika
ユール リュー
yuelu Liu
ペルベズ アハマド
Ahammad Parvez
カベサス ウンベルト アンドレス ゴンザレス
Andres Gonzalez Cabezas Humberto
ウィリアム ジェイ. マーティン
J Martin William
パブロ クリスチャン ゲルズベルグ
Christian Gersberg Pablo
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Neumora Therapeutics Inc
Original Assignee
Blackthorn Therapeutics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Blackthorn Therapeutics Inc filed Critical Blackthorn Therapeutics Inc
Publication of JP2022188295A publication Critical patent/JP2022188295A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/20ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Image Analysis (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

【課題】患者のメンタルヘルスをスクリーニングするためのシステム及び方法を提供する。【解決手段】複数の質問(たとえば、17個の質問)を含む単一の診断横断的な質問票を使用して複数の異なるメンタルヘルス障害を同時に診断するように動作する診断横断的分類器を生成するための、機械学習を利用するシステム及び方法。機械学習技法を使用して、トレーニングデータを処理することによって、診断横断的な項目レベルの質問を特徴として含む統計モデルを構築して、対象のグループを健康またはメンタルヘルス障害の可能性があるものとして分類するスクリーニングを作成する。複数の自己記入式のメンタルヘルス質問票から質問のサブセットを選択及び使用して、短時間で、任意で遠隔及び反復的に、医師の関与なしに、複数のメンタルヘルス障害にわたって対象を自律的にスクリーニングする。【選択図】図1

Description

関連出願の相互参照
本出願は米国特許法第119条の下で、2018年5月1日に出願され「Machine Learning-Based Diagnostic Classifier」と題された米国仮出願第62/665,243号の優先権を主張し、その内容全体が参照により本明細書に組み込まれている。
分野
本開示は概して医療診断ツールに関し、より詳細には、機械学習ベースのメンタルヘルス診断ツールのためのシステム及び方法に関する。
背景
メンタルヘルスのスクリーニング及び診断には、クリニック内で患者と高度なトレーニングを受けた専門家との間で時間のかかる面談を行う必要がある。現在利用可能な遠隔で実施される自己評価は個別の診断カテゴリに基づく傾向があり、これは、介入を必要とする診断横断的なまたは無症状の行動変化を明らかにすることができない場合がある。
概要
本開示の様々な例は、患者のメンタルヘルスをスクリーニングするためのシステム及び方法を対象とする。第1の実施形態では、例示的なシステムは、ディスプレイ、マイクロフォン、カメラ、メモリ、及び制御システムを含む。カメラは、ディスプレイの前の画像をキャプチャするように配置され、ビデオデータを出力するように構成される。メモリは、機械実行可能コードを含む機械可読媒体を含み、ユーザのメンタルヘルスを評価する方法を実行するための命令が記憶されている。制御システムは、メモリに結合され、1つまたは複数のプロセッサを含み、機械実行可能コードを実行する。これは、制御システムに、次の一連のステップを実行させる。
制御システムは、テストを開始する指示をユーザインターフェースから受け取ると、テストアプリケーションを実行する。制御システムは、テストを停止する指示を受け取ると、テストアプリケーションを終了する。テストアプリケーションは、(1)各質問のテキスト及び回答を含むメンタルヘルス質問票からの一連の質問をディスプレイに表示することと、(2)カメラによって記録されたライブビデオデータをディスプレイに表示することと、(3)カメラによってテストビデオデータのセットを記録することと、(4)マイクロフォンによってテストオーディオデータのセットを記録することと、(5)一連の質問のそれぞれに対する回答をユーザインターフェースを介して受け取って、回答の選択を生成することと、(6)機械学習モデルを使用して、回答の選択、テストビデオデータのセット、及びオーディオデータのセットを処理することによって、ユーザのメンタルヘルス表示を出力することと、を含む。
一部の例では、テストアプリケーションを停止する指示は、制御システムによる、カメラによってキャプチャされる画像内にユーザの顔がないという判定である。
一部の例では、マイクロフォンによって記録することは、制御システムによって、ユーザが話していると判定すると、記録を開始することを含む。
一部の例では、制御システムは、追加のステップを実行するように構成され、これは、テストビデオデータのセットとテストオーディオデータのセットとを受け取ることを含む。受け取ったテストビデオデータのセットは前処理されて、複数のビデオセグメントが識別され、各ビデオセグメントは、一連の質問の中の1つの質問に対応し、時間ウィンドウを含む。受け取ったテストオーディオデータのセットは前処理されて、複数のオーディオセグメントが識別され、各オーディオセグメントは、一連の質問の中の1つの質問に対応し、時間ウィンドウを含む。
一部の例では、複数のオーディオセグメント及び複数のビデオセグメントは前処理されて、重複する時間ウィンドウが識別される。制御システムは、識別された重複する時間ウィンドウに基づいて、統合されたオーディオ及びビデオセグメントのセットを出力する。
一部の例では、機械学習モデルは、一般化線形モデル、回帰モデル、ロジスティック回帰モデル、及び/または教師あり機械学習分類モデルのうちのいずれかである。
一部の例では、機械学習モデルは、一連のステップを実行することによって生成される一般化線形モデルである。これらのステップは、複数の個人についてのラベル付きトレーニングデータを受け取ることを実施する。ラベル付きトレーニングデータは、(1)複数の個人のそれぞれが1つまたは複数のメンタルヘルス障害を有するか否かの表示と、(2)トレーニングテスト中に記録した複数の個人のそれぞれについて記録されたオーディオ及びビデオデータと、(3)複数の個人のそれぞれからの質問票への回答の選択と、を含む。次いで、これらのステップは、ラベル付きトレーニングデータから複数の特徴を決定することと、複数の特徴に基づいて、教師あり様式で初期機械学習モデルをトレーニングすることと、を実施する。次いで、これらのステップは、初期機械学習モデルのトレーニングに基づいて、複数の特徴のそれぞれについて重要性尺度を抽出することを実施する。次いで、複数の特徴についての抽出された重要性尺度に基づいて、複数のサブセット機械学習モデルが生成される。次いで、生成された複数のサブセット機械学習モデルの分類性能が評価され、評価に基づいて、サブセット機械学習モデルの少なくとも1つが一般化線形モデルとして選択される。
一部の例では、メンタルヘルス表示は、ユーザが複数のメンタルヘルス障害のうちの1つを有する可能性を特定し、複数のメンタルヘルス障害は、神経精神障害、統合失調症、及び/または双極性障害を含む。一部の例では、メンタルヘルス表示は、ユーザが患者であるか健常対照であるかを識別する。
本開示の第2の実施形態は、ディスプレイ、マイクロフォン、カメラ、メモリ、及び制御システムを含むシステムを提供する。カメラは、ディスプレイの前の画像をキャプチャするように配置され、ビデオデータを出力するように構成される。メモリは、機械実行可能コードを含む機械可読媒体を含み、ユーザのメンタルヘルスを評価する方法を実行するための命令が記憶されている。制御システムは、メモリに結合され、1つまたは複数のプロセッサを含み、機械実行可能コードを実行する。これは、制御システムに、次の一連のステップを実行させる。
制御システムは、テストを開始する指示をユーザインターフェースから受け取ると、テストアプリケーションを実行する。制御システムは、テストを停止する指示を受け取ると、テストアプリケーションを終了する。テストアプリケーションは、(1)ユーザが読むためにディスプレイにテキストを表示することと、(2)カメラによってテスト中にテストビデオデータのセットを記録することと、(3)カメラによって記録されたライブビデオデータを表示するウィンドウをディスプレイに表示することと、(4)テスト中にテストビデオデータのセットを継続的に処理することと、(5)マイクロフォンによってテスト中にテストオーディオデータのセットを記録することと、(6)テストオーディオデータのセット及びテストビデオデータのセットを処理して、オーディオ及びビデオ特徴を識別し、オーディオ及びビデオ特徴をメモリに記憶することと、を実施する。継続的に処理するステップは、ユーザの顔を識別することと、顔の複数のピクセルの全てがフレーム内にあるか否かを判定することと、を実施する。顔がフレームの外側にある場合、処理するステップは、テストの停止を提供する。
一部の例では、表示されたテキストは、各質問についてのテキスト及び回答を含むメンタルヘルス質問票からの一連の質問を含む。
一部の例では、オーディオ及びビデオ特徴のそれぞれは、一連の質問の中の質問に対応する。
第2の実施形態の追加の例は、第1の実施形態に関して提供される。
本開示の第3の実施形態は、患者のメンタルヘルスをスクリーニングするためのシステムを提供し、このシステムは、メモリ及び制御システムを含む。メモリは、機械実行可能コードを含む機械可読媒体を含み、ユーザのメンタルヘルスを評価する方法を実行するための命令が記憶されている。制御システムは、メモリに結合され、1つまたは複数のプロセッサを含み、機械実行可能コードを実行する。これにより、制御システムは、(1)メンタルヘルス質問票からの一連の質問に対するユーザからの回答を表す回答データのセットを受け取ることと、(2)ユーザがテキストを読んでいる間のユーザの顔を表す、テスト中に記録されたテストビデオデータのセットを受け取ることと、(3)テストビデオデータのセットを処理して、ビデオ特徴のセットを出力することと、(4)ユーザがテキストを読んでいる間のユーザの声を表す、テスト中に記録されたテストオーディオデータのセットを受け取ることと、(5)オーディオデータのセットを処理して、オーディオ特徴のセットを出力することと、(6)機械学習モデルを使用して、回答データのセット、ビデオ特徴のセット、及びオーディオ特徴のセットを処理することによって、ユーザのメンタルヘルスの表示を出力することと、を行う。一部の例では、機械学習モデルは、一般化線形モデル、回帰モデル、ロジスティック回帰モデル、及び/または教師あり機械学習分類モデルのうちのいずれかである。第3の実施形態の追加の実施形態は、第1及び第2の実施形態に関して上記に提供した通りである。
本開示の第4の実施形態は、機械学習トレーニングシステムを提供する。このシステムは、少なくとも1つの非一時的プロセッサ可読記憶媒体と、少なくとも1つのプロセッサとを含む。記憶媒体は、プロセッサ実行可能命令またはデータの少なくとも1つを記憶する。プロセッサは、少なくとも1つの非一時的プロセッサ可読記憶媒体に通信可能に結合されている。動作において、少なくとも1つのプロセッサは、ラベル付きトレーニングデータを受け取るように構成される。トレーニングデータは、複数の個人のそれぞれが複数のメンタルヘルス障害のうちの1つまたは複数を有するか否かを示す複数の個人についてのデータを含む。トレーニングデータは、(1)メンタルヘルス質問票への回答と、(2)ビデオデータ及びオーディオデータと、を追加で含む。メンタルヘルス質問票は、複数の個人に対して実施された。ビデオデータ及びオーディオデータは、複数の個人のそれぞれがデジタルディスプレイからのテキストを読んでいる間に、記録された。ビデオデータは、個人の顔を含むビデオデータの部分を識別するように処理され、オーディオデータは、個人の声を表す音を識別するように処理される。プロセッサは、回答、オーディオデータ、及びビデオデータを処理して、複数の特徴を出力するようにさらに構成される。次いで、プロセッサは、受け取ったトレーニングデータに基づいて、教師あり様式で初期機械学習モデルをトレーニングする。次いで、プロセッサは、トレーニングされた初期機械学習モデルから複数の特徴のそれぞれについて重要性尺度を抽出する。次いで、プロセッサは、複数の特徴についての抽出された重要性尺度に基づいて、複数のサブセット機械学習モデルを生成する。次いで、プロセッサは、生成された複数のサブセット機械学習モデルの分類性能を評価する。次いで、プロセッサは、複数のサブセット機械学習モデルの少なくとも1つを診断分類器として選択する。次いで、プロセッサは、診断分類器の特徴を、スクリーニングツールとして後で使用するために、少なくとも1つの非一時的プロセッサ可読記憶媒体に記憶する。
一部の例では、選択されたサブセット機械学習モデルは、複数の特徴の一部分を含み、その部分は、閾値を上回る重要性尺度を有する特徴から選択される。
一部の例では、複数の特徴のうちの少なくとも20個の特徴は、閾値を上回る重要性尺度を有し、前記部分は少なくとも10個の特徴及び20個未満の特徴を含む。
一部の例では、サブセット機械学習モデルのそれぞれは、複数の特徴の部分の、異なる選択を含む。
一部の例では、診断分類器は、個人を、健康であるか、または一般的なメンタルヘルスの問題を有すると識別するメンタルヘルス表示を出力する。
一部の例では、診断分類器は、個人を、健康であるか、または特定のメンタルヘルスの問題を有すると識別するメンタルヘルス表示を出力する。
一部の例では、診断分類器は、個人を、第1の特定のメンタルヘルス障害を有するか、または第2の特定のメンタルヘルス障害を有すると識別するメンタルヘルス表示を出力する。
一部の例では、診断分類器は、個人がメンタルヘルス障害を発症するリスクを特定するメンタルヘルス表示を出力する。
一部の例では、ラベル付きトレーニングデータは、複数の個人のうちの各個人について、個人が健康であるか否か、個人が一般的なメンタルヘルスの問題を有するか否か、個人が1つまたは複数の特定のメンタルヘルス障害を有するか否か、個人に一般的なメンタルヘルスの問題を発症するリスクがあるか否か、及び/または個人に1つまたは複数の特定のメンタルヘルス障害を発症するリスクがあるか否か、のうちの少なくとも1つの表示をさらに含む。
一部の例では、初期機械学習モデルをトレーニングすることは、ロジスティック回帰を用いたk分割交差検証を使用することを含む。
一部の例では、サブセット機械学習モデルのそれぞれは、複数の特徴の、異なる組み合わせを含む。
一部の例では、ラベル付きトレーニングデータは、機能的測定データまたは生理学的測定データの少なくとも1つを含む。
一部の例では、第4の実施形態は、診断分類器の特徴をスクリーニングツールとして使用して、治療反応をテストする少なくとも1つの臨床試験における中間結果またはエンドポイント結果の少なくとも1つを評価することを実施する。
[本発明1001]
ディスプレイと、
マイクロフォンと、
前記ディスプレイの前の画像をキャプチャするように配置され、ビデオデータを出力するように構成されたカメラと、
ユーザインターフェースと、
ユーザのメンタルヘルスを評価する方法を実行するための命令が記憶された機械実行可能コードを含む機械可読媒体を含むメモリと、
1つまたは複数のプロセッサを含む、前記メモリに結合された制御システムであって、前記機械実行可能コードを実行して、前記制御システムに、
テストを開始する指示を前記ユーザインターフェースから受け取ると、前記制御システムによってテストアプリケーションを実行することと、
前記制御システムによって、前記テストを停止する指示を受け取ると、前記テストアプリケーションを終了することと、
を行わせるように構成されている、前記制御システムと、
を備え、
前記テストアプリケーションが、
各質問のテキスト及び回答を含むメンタルヘルス質問票からの一連の質問を前記ディスプレイに表示することと、
前記カメラによって記録されたライブビデオデータを前記ディスプレイに表示することと、
前記カメラによってテストビデオデータのセットを記録することと、
前記マイクロフォンによってテストオーディオデータのセットを記録することと、
回答の選択を生成するために、前記一連の質問のそれぞれに対する回答を前記ユーザインターフェースを介して受け取ることと、
前記ユーザのメンタルヘルス表示を出力するために、機械学習モデルを使用して、前記回答の選択、前記テストビデオデータのセット、及び前記オーディオデータのセットを処理すること、
を含む、
患者のメンタルヘルスをスクリーニングするためのシステム。
[本発明1002]
前記テストアプリケーションを停止する前記指示が、
前記制御システムによる、前記カメラによってキャプチャされる画像内にユーザの顔がないという判定
を含む、本発明1001のシステム。
[本発明1003]
前記マイクロフォンによって記録することが、
前記ユーザが話していると前記制御システムによって判定すると、前記記録を開始すること
をさらに含む、本発明1001のシステム。
[本発明1004]
前記制御システムが、
前記テストビデオデータのセットと前記テストオーディオデータのセットとを受け取ることと、
複数のビデオセグメントを識別するために、前記受け取ったテストビデオデータのセットを前処理することであって、各ビデオセグメントが、前記一連の質問の中の1つの質問に対応し、かつ時間ウィンドウを含む、前記前処理することと、
複数のオーディオセグメントを識別するために、前記受け取ったテストオーディオデータのセットを前処理することであって、各オーディオセグメントが、前記一連の質問の中の1つの質問に対応し、かつ時間ウィンドウを含む、前記前処理することと、
を行うようにさらに構成されている、本発明1001のシステム。
[本発明1005]
前記制御システムが、
重複する時間ウィンドウを識別するために、前記複数のオーディオセグメント及び前記複数のビデオセグメントを前処理することと、
前記識別された重複する時間ウィンドウに基づいて、統合されたオーディオ及びビデオセグメントのセットを出力することと、
を行うようにさらに構成されている、本発明1004のシステム。
[本発明1006]
前記機械学習モデルが、一般化線形モデル、回帰モデル、ロジスティック回帰モデル、及び教師あり機械学習分類モデルのうちの少なくとも1つである、本発明1001のシステム。
[本発明1007]
前記機械学習モデルが一般化線形モデルを含み、
前記一般化線形モデルが、
複数の個人のそれぞれが1つまたは複数のメンタルヘルス障害を有するか否かを示す前記複数の個人についてのラベル付きトレーニングデータを受け取ることであって、前記ラベル付きトレーニングデータが、
トレーニングテスト中に記録した前記複数の個人のそれぞれについて記録されたオーディオ及びビデオデータと、
前記複数の個人のそれぞれからの前記質問票への回答の選択と、
を含む、前記受け取ることと、
前記ラベル付きトレーニングデータから複数の特徴を決定することと、
前記複数の特徴に基づいて、教師あり様式で初期機械学習モデルをトレーニングすることと、
前記初期機械学習モデルの前記トレーニングに基づいて、前記複数の特徴のそれぞれについて重要性尺度を抽出することと、
前記複数の特徴についての前記抽出された重要性尺度に基づいて、複数のサブセット機械学習モデルを生成することと、
前記生成された複数のサブセット機械学習モデルの分類性能を評価することと、
前記サブセット機械学習モデルの少なくとも1つを前記一般化線形モデルとして選択することと、
によって生成される、本発明1001のシステム。
[本発明1008]
前記メンタルヘルス表示が、前記ユーザが複数のメンタルヘルス障害のうちの1つを有する可能性を特定し、前記複数のメンタルヘルス障害が、神経精神障害、統合失調症、及び双極性障害を含む、本発明1001のシステム。
[本発明1009]
前記メンタルヘルス表示が、前記ユーザが患者であるか健常対照であるかを識別する、本発明1001のシステム。
[本発明1010]
ディスプレイと、
マイクロフォンと、
前記ディスプレイの前の画像をキャプチャし、ビデオデータを出力するように構成されたカメラと、
ユーザインターフェースと、
方法を実行するための命令が記憶された機械実行可能コードを含む機械可読媒体を含むメモリと、
1つまたは複数のプロセッサを含む、前記メモリに結合された制御システムであって、前記機械実行可能コードを実行して、前記制御システムに、
テストを開始する指示を前記ユーザインターフェースを介して受け取り、前記テストを停止する指示を受け取るまでテストアプリケーションを実行すること、
を行わせるように構成されている、前記制御システムと、
を備え、
前記テストアプリケーションが、
前記ユーザが読むために前記ディスプレイにテキストを表示することと、
前記テスト中にテストビデオデータのセットを前記カメラによって記録することと、
前記カメラによって記録されたライブビデオデータを表示するウィンドウを前記ディスプレイに表示することと、
前記テスト中に、
前記ユーザの顔を識別する、
前記顔の複数のピクセルの全てがフレーム内にあるか否かを判定する、及び
前記顔が前記フレームの外側にある場合に前記テストを停止する
ために、前記テストビデオデータのセットを継続的に処理することと、
前記テスト中にテストオーディオデータのセットを前記マイクロフォンによって記録することと、
オーディオ及びビデオ特徴を識別するために、前記テストオーディオデータのセット及び前記テストビデオデータのセットを処理して、前記オーディオ及びビデオ特徴を前記メモリに記憶することと、
を含む、
患者のメンタルヘルスをスクリーニングするためのシステム。
[本発明1011]
前記表示されたテキストが、各質問についてのテキスト及び回答を含むメンタルヘルス質問票からの一連の質問を含む、本発明1010のシステム。
[本発明1012]
前記オーディオ及びビデオ特徴のそれぞれが、前記一連の質問の中の質問に対応する、本発明1011のシステム。
[本発明1013]
前記テストオーディオデータのセット及び前記テストビデオデータのセットを処理することが、
重複する時間ウィンドウを識別するために、前記テストオーディオデータ及び前記テストビデオデータのセットを前処理することと、
前記識別された重複する時間ウィンドウに基づいて、統合されたオーディオ及びビデオセグメントのセットを出力することと、
前記ユーザのメンタルヘルス状態を特定するために、前記統合されたオーディオ及びビデオセグメントのセットを機械学習モデルによって処理することと、
をさらに含む、本発明1010のシステム。
[本発明1014]
前記機械学習モデルが、一般化線形モデル、回帰モデル、ロジスティック回帰モデル、及び教師あり機械学習分類モデルのうちの少なくともの1つである、本発明1013のシステム。
[本発明1015]
前記機械学習モデルが一般化線形モデルを含み、
前記一般化線形モデルが、
複数の個人のそれぞれが1つまたは複数のメンタルヘルス障害を有するか否かを示す前記複数の個人についてのラベル付きトレーニングデータを受け取ることであって、前記ラベル付きトレーニングデータが、
トレーニングテスト中に記録した前記複数の個人のそれぞれについて記録されたオーディオ及びビデオデータと、
前記複数の個人のそれぞれからの前記質問票への回答の選択と、
を含む、前記受け取ることと、
前記ラベル付きトレーニングデータから複数の特徴を決定することと、
前記複数の特徴に基づいて、教師あり様式で初期機械学習モデルをトレーニングすることと、
前記初期機械学習モデルの前記トレーニングに基づいて、前記複数の特徴のそれぞれについて重要性尺度を抽出することと、
前記複数の特徴についての前記抽出された重要性尺度に基づいて、複数のサブセット機械学習モデルを生成することと、
前記生成された複数のサブセット機械学習モデルの分類性能を評価することと、
前記サブセット機械学習モデルの少なくとも1つを前記一般化線形モデルとして選択することと、
によって生成される、本発明1013のシステム。
[本発明1016]
方法を実行するための命令が記憶された機械実行可能コードを含む機械可読媒体を含むメモリと、
1つまたは複数のプロセッサを含む、前記メモリに結合された制御システムであって、前記機械実行可能コードを実行して、前記制御システムに、
メンタルヘルス質問票からの一連の質問に対するユーザからの回答を表す回答データのセットを受け取ることと、
前記ユーザがテキストを読んでいる間の前記ユーザの顔を表す、テスト中に記録されたテストビデオデータのセットを受け取ることと、
ビデオ特徴のセットを出力するために、前記テストビデオデータのセットを処理することと、
前記ユーザがテキストを読んでいる間の前記ユーザの声を表す、前記テスト中に記録されたテストオーディオデータのセットを受け取ることと、
オーディオ特徴のセットを出力するために、前記オーディオデータのセットを処理することと、
前記ユーザのメンタルヘルスの表示を出力するために、機械学習モデルを使用して、前記回答データのセット、前記ビデオ特徴のセット、及び前記オーディオ特徴のセットを処理することと、
を行わせるように構成されている、前記制御システムと、
を備える、
患者のメンタルヘルスをスクリーニングするためのシステム。
[本発明1017]
前記機械学習モデルが、一般化線形モデル、回帰モデル、ロジスティック回帰モデル、及び教師あり機械学習分類モデルのうちの少なくとも1つである、本発明1016のシステム。
[本発明1018]
前記機械学習モデルが一般化線形モデルを含み、
前記一般化線形モデルが、
複数の個人のそれぞれが1つまたは複数のメンタルヘルス障害を有するか否かを示す前記複数の個人についてのラベル付きトレーニングデータを受け取ることであって、前記ラベル付きトレーニングデータが、
トレーニングテスト中に記録した前記複数の個人のそれぞれについて記録されたオーディオ及びビデオデータと、
前記複数の個人のそれぞれからの前記質問票への回答の選択と、
を含む、前記受け取ることと、
前記ラベル付きトレーニングデータから複数の特徴を決定することと、
前記複数の特徴に基づいて、教師あり様式で初期機械学習モデルをトレーニングすることと、
前記初期機械学習モデルの前記トレーニングに基づいて、前記複数の特徴のそれぞれについて重要性尺度を抽出することと、
前記複数の特徴についての前記抽出された重要性尺度に基づいて、複数のサブセット機械学習モデルを生成することと、
前記生成された複数のサブセット機械学習モデルの分類性能を評価することと、
前記サブセット機械学習モデルの少なくとも1つを前記一般化線形モデルとして選択することと、
によって生成される、本発明1016のシステム。
[本発明1019]
プロセッサ実行可能命令またはデータの少なくとも1つを記憶する少なくとも1つの非一時的プロセッサ可読記憶媒体と、
前記少なくとも1つの非一時的プロセッサ可読記憶媒体に通信可能に結合された少なくとも1つのプロセッサと、
を備え、
動作において、前記少なくとも1つのプロセッサが、
複数の個人のそれぞれが複数のメンタルヘルス障害のうちの1つまたは複数を有するか否かを示す前記複数の個人についてのデータを含むラベル付きトレーニングデータを受け取ることであって、前記ラベル付きトレーニングデータが、
前記複数の個人に実施されたメンタルヘルス質問票への回答と、
前記複数の個人のそれぞれがデジタルディスプレイからのテキストを読んでいる間に記録されたビデオデータ及びオーディオデータであって、前記ビデオデータが、前記個人の顔を含む前記ビデオデータの部分を識別するように処理され、前記オーディオデータが、前記個人の声を表す音を識別するように処理される、前記ビデオデータ及び前記オーディオデータと、
をさらに含む、前記受け取ることと、
複数の特徴を出力するために、前記回答、前記オーディオデータ、及び前記ビデオデータを処理することと、
前記受け取ったトレーニングデータに基づいて、教師あり様式で初期機械学習モデルをトレーニングすることと、
前記トレーニングされた初期機械学習モデルから前記複数の特徴のそれぞれについて重要性尺度を抽出することと、
前記複数の特徴についての前記抽出された重要性尺度に基づいて、複数のサブセット機械学習モデルを生成することと、
前記生成された複数のサブセット機械学習モデルの分類性能を評価することと、
前記複数のサブセット機械学習モデルの少なくとも1つを診断分類器として選択することと、
前記診断分類器の前記特徴を、スクリーニングツールとして後で使用するために、前記少なくとも1つの非一時的プロセッサ可読記憶媒体に記憶することと、
を行うように構成されている、
機械学習トレーニングシステム。
[本発明1020]
前記選択されたサブセット機械学習モデルが、前記複数の特徴の一部分を含み、前記部分が、閾値を上回る重要性尺度を有する特徴から選択される、本発明1019の機械学習システム。
[本発明1021]
前記複数の特徴のうちの少なくとも20個の特徴が、前記閾値を上回る重要性尺度を有し、前記部分が少なくとも10個の特徴及び20個未満の特徴を含む、本発明1020の機械学習システム。
[本発明1022]
前記サブセット機械学習モデルのそれぞれが、前記複数の特徴の前記部分の、異なる選択を含む、本発明1020の機械学習システム。
[本発明1023]
前記診断分類器が、個人を、健康であるか、または一般的なメンタルヘルスの問題を有すると識別するメンタルヘルス表示を出力するように構成されている、本発明1019の機械学習システム。
[本発明1024]
前記診断分類器が、個人を、健康であるか、または特定のメンタルヘルスの問題を有すると識別するメンタルヘルス表示を出力するように構成されている、本発明1019の機械学習システム。
[本発明1025]
前記診断分類器が、個人を、第1の特定のメンタルヘルス障害を有するか、または第2の特定のメンタルヘルス障害を有すると識別するメンタルヘルス表示を出力するように構成されている、本発明1019の機械学習システム。
[本発明1026]
前記診断分類器が、個人のメンタルヘルス障害を発症するリスクを特定するメンタルヘルス表示を出力するように構成されている、本発明1019の機械学習システム。
[本発明1027]
前記ラベル付きトレーニングデータが、
前記複数の個人のうちの各個人について、前記個人が健康であるか否か、前記個人が一般的なメンタルヘルスの問題を有するか否か、前記個人が1つまたは複数の特定のメンタルヘルス障害を有するか否か、前記個人に一般的なメンタルヘルスの問題を発症するリスクがあるか否か、または前記個人に1つまたは複数の特定のメンタルヘルス障害を発症するリスクがあるか否か、のうちの少なくとも1つの表示
をさらに含む、本発明1019の機械学習システム。
[本発明1028]
前記初期機械学習モデルをトレーニングすることが、ロジスティック回帰を用いたk分割交差検証を使用することをさらに含む、本発明1019の機械学習システム。
[本発明1029]
前記サブセット機械学習モデルのそれぞれが、前記複数の特徴の、異なる組み合わせを含む、本発明1019の機械学習システム。
[本発明1030]
前記ラベル付きトレーニングデータが、機能的測定データまたは生理学的測定データの少なくとも1つをさらに含む、本発明1019の機械学習システム。
[本発明1031]
治療反応をテストする少なくとも1つの臨床試験における中間結果またはエンドポイント結果の少なくとも1つを評価するために、前記診断分類器の前記特徴をスクリーニングツールとして使用すること
をさらに含む、本発明1019の機械学習システム。
上記の概要は、本開示の各実施形態または全ての態様を表すことを意図するものではない。むしろ、前述の概要は、本明細書に記載の新規の態様及び特徴のうちの一部の一例を提供するにすぎない。上記の特徴及び利点、ならびに本発明の他の特徴及び利点は、本発明を実施するための代表的な実施形態及びモードの以下の詳細な説明から、付属の図面及び添付の特許請求の範囲と合わせて、より明らかになろう。
図面において、同一の参照番号は、同様の要素または行為を特定する。図面中の要素の大きさ及び相対的な位置は、必ずしも縮尺通りではない。たとえば、様々な要素の形状及び角度は必ずしも縮尺通りではなく、これらの要素の一部は、図面の視認性を向上させるために、任意に拡大及び配置し得る。さらに、描画した要素の特定の形状は、必ずしも特定の要素の実際の形状に関する情報を伝える意図はなく、単に図面における認識の容易さのために選択されている場合がある。
本開示の1つの非限定的な例示した実施態様による、機械学習ベースの診断横断的分類器をトレーニング及び実装するためのシステムが構成され、開始され、動作し得る例示的な環境を示すネットワーク図である。 構成された方法で機械学習ベースの診断横断的分類器の一実施形態を実行するのに適した例示的なコンピューティングシステムのブロック図である。 本開示の1つの例示した実施態様による、診断横断的分類器システムを動作させる方法の流れ図である。 本開示の1つの非限定的な例示した実施態様による、初期機械学習分類器の受診者動作特性(ROC)曲線を示すグラフである。 本開示の1つの非限定的な例示した実施態様による、1~578個の特徴を含む複数のサブセット機械学習モデルのROC曲線下面積を示すグラフである。 本開示の1つの非限定的な例示した実施態様による、複数のサブセット機械学習モデルの精度スコアを示すグラフである。 本開示の一実施形態による、例示的なシステムを提供する図である。 本開示の一実施形態による、データを受け取って分析するための例示的な方法論を示す図である。 本開示の一実施形態による、データを受け取って分析するための例示的な方法論を示す図である。 本開示の一実施形態による、データを受け取って分析するための例示的な方法論を示す図である。 本開示の一実施形態による、オーディオ及びビデオデータを処理する例示的な方法論を示す図である。 本開示の一実施形態による、機械学習モデルを用いて入力を分析するための例示的な方法論を示す図である。 本開示の一実施形態による、スマートフォン上の例示的なユーザインターフェースを示す図である。 本開示の一実施形態による、スマートフォン上の例示的なユーザインターフェースを示す図である。
詳細な説明
以下の説明では、様々な開示した実施態様の完全な理解を提供するために、特定の具体的な詳細を述べている。しかしながら、関連技術の当業者は、これらの具体的な詳細の1つまたは複数なしで、または他の方法、コンポーネント、材料などを用いて、実施態様が実践され得ることを認識するであろう。他の例では、コンピュータシステム、サーバコンピュータ及び/または通信ネットワークに関連するよく知られている構造については、実施態様の説明を不必要に曖昧にしないように、詳細に図示も説明もしていない。
文脈上別段の必要性がない限り、本明細書及びそれに続く特許請求の範囲全体を通じて、「備える」という語は「含む」と同義であり、包括的なまたは制限のないものである(すなわち、列挙されていない追加の要素または方法の行為を除外するものではない)。
本明細書全体を通じた「一実施態様」または「実施態様」への言及は、その実施態様に関連して説明する特定の特徴、構造、または特性が少なくとも1つの実施態様に含まれることを意味する。このため、本明細書全体の様々な場所での「一実施態様における」または「実施態様における」という語句の出現は、必ずしも全て同じ実施態様について言及しているわけではない。さらに、特定の特徴、構造、または特性は、1つまたは複数の実施態様において任意の好適な方法で組み合わせられ得る。
本明細書及び添付の特許請求の範囲において使用する場合、単数形「1つの(a)」、「1つの(an)」、及び「その(the)」は、文脈上別様に明記しない限り、複数の指示対象を含む。「または」という用語は一般に、文脈上別様に明記しない限り、「及び/または」を含む意味で使用していることにも留意されたい。
本明細書に設けている見出し及び本開示の要約は、便宜上のものにすぎず、実施態様の範囲または意味を解釈するものではない。
本明細書では、機械学習手法を使用して、メンタルヘルス障害を評価するための一連の広範な質問票から最も有益な質問を選択することにより、それらの障害について人々をスクリーニングするシステム及び方法について説明する。これらのスクリーニングは高速で非常に高精度であり、任意の個人による自己申告のみに依存している(メンタルヘルスの専門家によって実施される必要はない)。スクリーニングの主な目的に基づいていくつかのスクリーニングを作成することができ、たとえば、1)診断横断的スクリーニング(個人が健康であるか、一般的なメンタルヘルスの問題を有するかを判定するため)、2)特定の障害のスクリーニング(個人が健康であるか、統合失調症やADHDなどの特定のメンタルヘルス障害を有するかを判定するため)、または、3)鑑別診断スクリーニング(個人がある特定のメンタルヘルス障害を有するか、または他の特定のメンタルヘルス障害を有するか、たとえば、ADHDではなく統合失調症かを判定するため)、などである。この手法は、特定のメンタルヘルス障害のサブセットのみを予測することに限定されず、その理由は、メンタルヘルスの問題、症状、またはメンタルヘルスもしくはその他の障害における行動的次元(たとえば、パーキンソン病における鬱病、てんかんにおける精神病、多発性硬化症における認知症(White et al.,2012))の予測にこの手法が適用され得るためである。この手法はまた、質問/質問票のみを入力特徴として使用するメンタルヘルスの問題の予測に限定されず、その理由は、機能的タイプの測定(たとえば、スマートフォンユーザインタラクション)、または生理学的タイプの測定(たとえば、磁気共鳴画像法、脳波記録、脳磁図、皮質脳波記録、ポジトロン放出断層撮影、単一光子放射型コンピュータ断層撮影)もまた、効率的かつ正確なメンタルヘルススクリーニングのために有益な、選択元となる予測特徴のセットを提供できるためである。
この手法は、機械学習手法を使用して複数の質問票から質問のサブセットを組み合わせて選択するという新規の手法を採用することの利点を強調しており、単一の質問票のみに基づく他の診断横断的スクリーニング(たとえば、Kessler et al.,2002、Kessler et al.,2003)よりも優れている。そのような手法は、メンタルヘルス障害を有さない場合があるが、それを発症するリスクがあり得る個人を特定するのにも役立ち得る(たとえば、モデルの誤分類を識別し、リスクのある個人の別個のグループとしてラベル付けするためのさらなるモデルを構築することによる)。
これらのスクリーニングは迅速であり、自己申告の回答に依存するので、この一連のスクリーニングは、電話、タブレット、またはコンピュータアプリ(たとえば、モバイルアプリ、webブラウザアプリなど)から実施することができ、収集されたデータはローカルデバイス上で、またはクラウドコンピューティング環境内で処理され、個人の同意を得て主治医またはメンタルヘルス専門家に送信される。
これらのスクリーニングを使用し得る用途は無数にある。以下に、本開示のスクリーニングが使用され得るいくつかの非限定的な適用例を列挙する。これらのスクリーニングは、メンタルヘルス障害を有し得るか否かを評価するために、どの個人でも使用することができる。これらのスクリーニングを使用して、所与の母集団(たとえば、州、国民、ホームレス、軍隊、学校、民族など)におけるメンタルヘルスの問題の発生率及び有病率を推定することができる。これらのスクリーニングを使用して、治療反応をテストする臨床試験の中間結果及びエンドポイント結果の両方を評価することができる。これらのスクリーニングを、メンタルヘルスの問題が予想される患者のプライマリケアスクリーニングツールとして使用して、非効率的で不必要な紹介を減らすことができる。これらのスクリーニングを使用して、救急科の環境でメンタルヘルスの問題が疑われる患者を迅速に選別することができる。これらのスクリーニングを使用して、メンタルヘルス障害のある個人を募集する研究に登録されているが、医師による障害の評価を受けることができない個人によって自己申告された障害の可能性をチェックすることができる。これらのスクリーニングは、精神疾患の特定及び治療が企業の生産性の低下よりも安価であることがわかっていることから、職場で使用することができる(Kessler et al.,2009)。
機械学習システムは、プロセッサ実行可能命令またはデータの少なくとも1つを記憶する少なくとも1つの非一時的プロセッサ可読記憶媒体と、少なくとも1つの非一時的プロセッサ可読記憶媒体に通信可能に結合された少なくとも1つのプロセッサと、を含むものとして要約され得、動作において、少なくとも1つのプロセッサは、複数の個人のそれぞれが複数のメンタルヘルス障害のうちの1つまたは複数を有するか否かを示す複数の個人についてのデータを含むラベル付きトレーニングデータを受け取ることであって、ラベル付きトレーニングデータは、1つまたは複数の特徴をそれぞれが含む複数の自己記入式のメンタルヘルス質問票に対する、個人のうちの少なくとも一部の項目レベルの返答をさらに含む、受け取ることと、受け取ったトレーニングデータに少なくとも部分的に基づいて、教師あり様式で初期機械学習モデルをトレーニングすることと、トレーニングされた初期機械学習モデルから複数の自己記入式のメンタルヘルス質問票内の複数の特徴のそれぞれについて重要性尺度を抽出することと、複数の特徴についての抽出された重要性尺度に少なくとも部分的に基づいて、複数のサブセット機械学習モデルを生成することと、生成された複数のサブセット機械学習モデルの分類性能を評価することと、サブセット機械学習モデルの少なくとも1つを診断分類器として選択することと、診断分類器の特徴を、スクリーニングツールとして後で使用するために、少なくとも1つの非一時的プロセッサ可読記憶媒体に記憶することと、を行う。選択されたサブセット機械学習モデルは、重要性尺度によって決定される上位N個の重要な特徴のうちのM個を含み得、Mは10~20の整数であり、Nは20より大きい整数である。診断分類器は、個人が複数のメンタルヘルス障害のうちの1つを有するか否かを判定するように動作し得る。
選択されたサブセット機械学習モデルは、少なくとも次の特徴、すなわち、「できるだけ他の人を喜ばせたい」、「じっと座っていられないほど落ち着かないことがよくある」、「理由がわからず気分が幸せから悲しみに変わることがよくある」、「一人でするのが楽しいこともあるが、大抵は他の人と一緒にするほうが楽しいと思う」、「私はほとんどの人よりも感傷的である」、「私は自分がする全てのことで優れていたい」、「人々は私をかなり自由奔放で自発的な人だと考えている」、「私は必要なもの全てを人々から真に得ることは決してないと感じている」、「なじみのない環境では、自分で驚くほど積極的で社交的なことが多い」、「私は決断を下す前に、長い間物事について考えることを好む」、「アイデアやひらめきが思い浮かぶのが速すぎて、全てを表現できないことがある」、「私にはたくさんの趣味がある」、「私は自分の問題を自分自身に留めておくことを好む」、「私の注意は他のことに移りやすいので、長い間同じ興味を保つのは難しい」、「やりがいのある部分が完了した後、プロジェクトの最終的な詳細をまとめるのに苦労する頻度はどれくらいか」、「簡単だとしても、仕事をゆっくり始めることを好む」、「大抵、私はほとんどの人よりも将来何かがうまくいかないかもしれないと心配している」のサブセットを含み得る。動作において、少なくとも1つのプロセッサは、ロジスティック回帰を用いたk分割交差検証を使用して初期機械学習モデルをトレーニングし得る。サブセット機械学習モデルのそれぞれは、初期機械学習モデルの特徴の、異なる組み合わせを含み得る。サブセット機械学習モデルのそれぞれは、重要性尺度によって決定される初期機械学習モデルの、異なる数の上位の重要な特徴を含み得る。当業者には容易に理解されるように、これらの質問の変形も、開示したシステム及び方法で使用することができる。本開示の様々な例において、いくつかの追加の質問を使用することができ、置換的/代替的な質問を使用することができ、または質問の一部を省略することができる。
本開示の1つまたは複数の実施態様は、機械学習を利用して、本明細書では特徴とも呼ぶ複数の質問(たとえば、17個の質問)を含む単一の診断横断的な質問票を使用して複数の異なるメンタルヘルス障害を同時に診断するように動作する診断横断的分類器を生成するためのシステム及び方法を対象とする。大まかに言うと、本開示の発明者らは、上記の障壁の少なくとも一部を克服するために、自動的にスコア付けされる、迅速で診断横断的な自己記入式のメンタルヘルススクリーニングを開発するための機械学習技法を実装した。以下で説明する例は、説明の目的で質問/質問票を入力特徴として含むことに留意されるべきであるが、本明細書に開示するシステム及び方法は、質問/質問票のみを入力特徴として使用するメンタルヘルスの問題の予測に限定されないことが理解されるべきであり、その理由は、機能的タイプの測定(たとえば、スマートフォンユーザインタラクション)、または生理学的タイプの測定(たとえば、磁気共鳴画像法、脳波記録、脳磁図、皮質脳波記録、ポジトロン放出断層撮影、単一光子放射型コンピュータ断層撮影)もまた、効率的かつ正確なメンタルヘルススクリーニングのために有益な、選択元となる予測特徴のセットを提供できるためである。さらに、本明細書で論じる実施態様を使用して、診断横断的スクリーニング、特定の障害のスクリーニング、鑑別診断スクリーニング、または他のタイプのスクリーニングを提供し得る。
以下でさらに説明するように、機械学習技法を使用して、ラベル付きトレーニングデータを処理することによって、診断横断的な項目レベルの質問を特徴として含む統計モデルを構築して、対象のグループを健康またはメンタルヘルス障害の可能性があるものとして分類するスクリーニングを作成し得る。ラベル付きトレーニングデータは、統合失調症、双極性障害、または注意欠陥多動性障害(ADHD)などであるがこれらに限定されない複数の障害のうちの1つまたは複数を各個人が有するか否かを示す複数の個人のデータを含み得る。各個人について、ラベル付きトレーニングデータは、複数の自己記入式のメンタルヘルス質問票(たとえば、5つの質問票、10個の質問票、20個の質問票)に対する項目レベルの返答も含む。
機械学習技法を使用して、複数の自己記入式のメンタルヘルス質問票から、20個を超える質問(たとえば、200個の質問、600個の質問)の中の15~20個の質問などの質問のサブセットを選択及び使用して、短時間(たとえば、5分未満)で、任意で遠隔及び反復的に、医師の関与なしに、複数のメンタルヘルス障害にわたって対象を自律的にスクリーニングし得る。本開示の実施態様の様々な特徴について、図面を参照して以下でさらに論じる。
図1は、診断横断的分類器(TDC:trans-diagnostic classifier)システム100を生成及び実装するためのシステムが構成及び開始され得る例示的な環境を示すネットワーク図である。具体的には、TDCシステム100の一実施形態は、1つまたは複数のコンピューティングシステム102上で実行されるように図示しており、たとえば、例示した実施形態では、オンラインで動作し、1つまたは複数のインターフェース104(たとえば、グラフィカルユーザインターフェース(GUI)、アプリケーションプログラミングインターフェース(API))を提供して、クライアントコンピューティングシステム106の1人または複数のリモートユーザが、1つまたは複数の介在するコンピュータネットワーク108を介してTDCシステム100と対話して、1つまたは複数の診断横断的分類器を生成、変更、及び使用できるようにする。
1人または複数のユーザ(たとえば、研究者、医師、患者)は、クライアントコンピューティングシステム106を使用して、コンピュータネットワーク108を介してTDCシステム100と対話して、TDCを生成し、生成したTDCを使用して、複数のメンタルヘルス障害についてスクリーニングし得る。少なくとも一部の実施態様では、1つまたは複数のシステムを使用して分類器を生成し得、1つまたは複数の異なるシステムを使用して分類器をスクリーニングツールとして実装し得る。TDCシステム100は、TDCコントローラコンポーネント110(たとえば、1つまたは複数のプロセッサ)と、TDCデータストレージコンポーネント112(たとえば、1つまたは複数の非一時的プロセッサ可読記憶媒体)と、インターフェース104と、他のTDCコンポーネント114(たとえば、プロセッサ、データストレージ、有線/無線インターフェース、入力/出力デバイス)と、を含み得る。図示の例では、TDCデータストレージコンポーネント112は、ラベル付きトレーニングデータ116と、1つまたは複数の初期機械学習モデル118と、1つまたは複数のサブセット機械学習モデル120と、複数のメンタルヘルス障害について対象をスクリーニングするために使用され得る1つまたは複数の出力診断横断的分類器122と、を記憶する。これらの各コンポーネントについて、以下で説明する。
ネットワーク108は、たとえば、インターネットなどの様々な異なるパーティによって運用され得るリンクされたネットワークの公共的にアクセス可能なネットワークであり得、TDCシステム100は、ネットワーク108を介してあらゆるユーザまたは特定のユーザのみに利用可能である。他の実施形態では、ネットワーク108は、非特権ユーザが完全にまたは部分的にアクセス不可能な、企業または大学のネットワークなどのプライベートネットワークであり得る。さらに他の実施形態では、ネットワーク108は、インターネットにアクセスできる、及び/またはインターネットからアクセスできる1つまたは複数のプライベートネットワークを含み得る。このように、図示の実施形態のTDCシステム100は、1つまたは複数のコンピュータネットワーク108を介して様々なユーザをサポートするようにオンラインで実装されるが、他の実施形態では、代わりにTDCシステム100のコピーが他の方法で、たとえば、単一のユーザまたは関連するユーザのグループ(たとえば、会社または他の組織)をサポートするように実装され得、これはたとえば、1つまたは複数のコンピュータネットワーク108が、代わりに会社または他の組織の内部コンピュータネットワークであり、TDCシステムのそのようなコピーが、任意で会社または他の組織の外部の他のユーザが利用できない場合である。TDCシステム100のオンラインバージョン及び/またはTDCシステムのローカルコピーバージョンは、一部の実施形態及び状況では、1人または複数のユーザが、TDCシステム100を使用してメンタルヘルス障害に関して1人または複数の個人をスクリーニングするなどのために、TDCシステムの様々な動作を使用するための様々な料金を支払うような、料金ベースの方法で動作し得る。さらに、TDCシステム100及び/またはその各コンポーネントは、1つまたは複数のプロセッサ(図示せず)によって1つまたは複数のコンピューティングシステム(図示せず)上で実行されるソフトウェア命令を含み得、たとえば、それらのプロセッサ及びコンピューティングシステムを、それらにプログラムされた機能の実行に関する専用のマシンとして動作するように構成する。
図2は、本明細書に記載の様々な実施形態を実施するのに適した例示的なプロセッサベースのデバイス204を示している。たとえば、プロセッサベースのデバイス204は、図1のコンピューティングシステム102またはクライアントコンピューティングシステム106の1つを表し得る。必須ではないが、実施形態の一部は、1つまたは複数のプロセッサによって実行されるプログラムアプリケーションモジュール、オブジェクト、またはマクロなど、プロセッサ実行可能命令またはロジックの一般的な状況で説明する。関連技術の当業者は、記載した実施形態ならびに他の実施形態が、スマートフォン及びタブレットコンピュータなどのハンドヘルドデバイス、ウェアラブルデバイス、マルチプロセッサシステム、マイクロプロセッサベースのまたはプログラム可能な家庭用電化製品、パーソナルコンピュータ(「PC」)、ネットワークPC、ミニコンピュータ、メインフレームコンピュータなどを含む、様々なプロセッサベースのシステム構成で実施できることを理解するであろう。
プロセッサベースのデバイス204は、たとえば、サーバコンピュータ、クラウドベースのコンピューティングシステム、デスクトップコンピュータ、スマートフォンまたはタブレットコンピュータの形態をとり得、これは、1つまたは複数のプロセッサ206と、システムメモリ208と、システムメモリ208を含む様々なシステムコンポーネントをプロセッサ(複数可)206に結合するシステムバス210と、を含む。プロセッサベースのデバイス204は、本明細書では単数形で言及することがあるが、これは実施形態を単一のシステムに限定することを意図しておらず、その理由は、特定の実施形態では、2つ以上のシステムまたは他のネットワーク化されたコンピューティングデバイスが関与するためである。市販のシステムの非限定的な例には、様々なメーカーのARMプロセッサ、Intel Corporation,U.S.A.のCoreマイクロプロセッサ、IBMのPowerPCマイクロプロセッサ、Sun Microsystems,Inc.のSparcマイクロプロセッサ、Hewlett-Packard CompanyのPA-RISCシリーズマイクロプロセッサ、Motorola Corporationの68xxxシリーズマイクロプロセッサが含まれるが、これらに限定されない。
プロセッサ(複数可)206は、1つまたは複数の中央処理装置(CPU)、マイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)などの任意のロジック処理ユニットであり得る。別様に明記しない限り、図2に示す様々なブロックの構造及び動作は従来の設計のものである。結果として、そのようなブロックは、関連技術の当業者には理解されると思われるので、本明細書でさらに詳細に説明する必要はない。
システムバス210は、メモリコントローラを用いたメモリバス、周辺バス、及びローカルバスを含む、任意の知られているバス構造またはバスアーキテクチャを採用し得る。システムメモリ208は、読み取り専用メモリ(「ROM」)212及びランダムアクセスメモリ(「RAM」)214を含む。ROM212の一部を形成できる基本入出力システム(「BIOS」)216は、起動中などに、プロセッサベースのデバイス204内の要素間で情報を転送するのを支援する基本ルーチンを含む。一部の実施形態は、データ、命令、及び電力のために別々のバスを使用し得る。
プロセッサベースのデバイス204はまた、1つまたは複数のソリッドステートメモリ、たとえば、フラッシュメモリまたはソリッドステートドライブ(SSD)218を含み得、これは、コンピュータ可読命令、データ構造、プログラムモジュール、及びプロセッサベースのデバイス204の他のデータの不揮発性ストレージを提供する。図示していないが、プロセッサベースのデバイス204は、他の非一時的コンピュータ可読またはプロセッサ可読媒体、たとえば、ハードディスクドライブ、光ディスクドライブ、またはメモリカード媒体ドライブを使用することができる。
プログラムモジュールをシステムメモリ208に記憶することができ、たとえば、オペレーティングシステム230、1つまたは複数のアプリケーションプログラム232、他のプログラムまたはモジュール234、ドライバ236、及びプログラムデータ238などである。
アプリケーションプログラム232は、たとえば、パン/スクロール232aを含み得る。そのようなパン/スクロールロジックは、中央部分及び少なくとも1つの周縁部分を有する領域を含むユーザインターフェース要素にポインタ(たとえば、指、スタイラス、カーソル)が入った時及び/または場所を特定するロジックを含み得るが、これに限定されない。そのようなパン/スクロールロジックは、ユーザインターフェース要素の少なくとも1つの要素が動いているように見えるはずの方向及び速度を決定し、表示を更新させて、少なくとも1つの要素を、決定した方向に決定した速度で動いているように見せるロジックを含み得るが、これに限定されない。パン/スクロールロジック232aは、たとえば、1つまたは複数の実行可能命令として記憶され得る。パン/スクロールロジック232aは、たとえば、タッチセンシティブディスプレイ、またはコンピュータのマウスもしくはトラックボール、あるいはその他のユーザインターフェースデバイスからのデータなど、ポインタの動きを特徴付けるデータを使用してユーザインターフェースオブジェクトを生成するためのプロセッサ及び/またはマシン実行可能ロジックもしくは命令を含み得る。
システムメモリ208はまた、プロセッサベースのデバイス204が、ユーザコンピューティングシステム、インターネット上のウェブサイト、企業イントラネット、または以下に説明する他のネットワークなどの他のシステムにアクセスしてデータを交換できるようにするための、サーバ及び/またはウェブクライアントもしくはブラウザなどの通信プログラム240を含み得る。図示の実施形態の通信プログラム240は、ハイパーテキストマークアップ言語(HTML)、拡張マークアップ言語(XML)またはワイヤレスマークアップ言語(WML)など、マークアップ言語ベースであり、ドキュメントの構造を表すためにドキュメントのデータに追加された構文的に区切られた文字を使用するマークアップ言語を用いて動作する。多数のサーバ及び/またはWebクライアントもしくはブラウザが市販されており、たとえば、CaliforniaのMozilla Corporation及びWashingtonのMicrosoftのものなどがある。
図2にはシステムメモリ208に記憶されるものとして示しているが、オペレーティングシステム230、アプリケーションプログラム232、その他のプログラム/モジュール234、ドライバ236、プログラムデータ238ならびにサーバ及び/またはブラウザ240は、多種多様な非一時的プロセッサ可読媒体のうちの他のもの(たとえば、ハードディスクドライブ、光ディスクドライブ、SSD、及び/またはフラッシュメモリ)に記憶することができる。
ユーザは、カーソルを制御する指244a、スタイラス244bによって、またはコンピュータのマウスもしくはトラックボール244cによって、タッチスクリーン248などの入力デバイスなどを通じて、ポインタを介してコマンド及び情報を入力することができる。他の入力デバイスには、マイクロフォン、ジョイスティック、ゲームパッド、タブレット、スキャナ、生体測定スキャンデバイスなどを含めることができる。これら及び他の入力デバイス(すなわち、「I/Oデバイス」)は、タッチスクリーンコントローラなどのインターフェース246、及び/またはユーザ入力をシステムバス210に結合するユニバーサルシリアルバス(「USB」)インターフェースを介してプロセッサ(複数可)206に接続されるが、パラレルポート、ゲームポート、もしくはワイヤレスインターフェースまたはシリアルポートなどの他のインターフェースが使用され得る。タッチスクリーン248は、タッチスクリーン248を介して表示する画像データまたは画像情報を受け取るためのビデオアダプタなどのビデオインターフェース250を介してシステムバス210に結合することができる。図示していないが、プロセッサベースのデバイス204は、スピーカー、バイブレータ、触覚アクチュエータまたは触覚エンジンなどの他の出力デバイスを含むことができる。
プロセッサベースのデバイス204は、1つまたは複数のネットワーク214a、214bなどの1つまたは複数の通信チャネルを介して1つまたは複数のリモートコンピュータ、サーバ、及び/またはデバイスと通信するための論理接続のうちの1つまたは複数を使用してネットワーク化された環境で動作する。これらの論理接続は、1つまたは複数のLAN及び/またはWAN、たとえば、インターネット、及び/またはセルラー通信ネットワークなどを介して、コンピュータが通信できるようにする任意の知られている方法を容易にし得る。そのようなネットワーク環境は、有線及び無線の企業規模のコンピュータネットワーク、イントラネット、エクストラネット、インターネット、ならびに他のタイプの通信ネットワーク、たとえば、通信ネットワーク、セルラーネットワーク、ページングネットワーク、及びその他のモバイルネットワークなどにおいてよく知られている。
ネットワーク環境で使用される場合、プロセッサベースのデバイス204は、インターネット214aまたはセルラーネットワークなどのネットワークを介して通信を確立するための1つまたは複数のネットワークの有線または無線通信インターフェース252a、256(たとえば、ネットワークインターフェースコントローラ、セルラー無線、WI-FI無線、Bluetooth無線)を含み得る。
ネットワーク化された環境では、プログラムモジュール、アプリケーションプログラム、もしくはデータ、またはそれらの一部を、サーバコンピューティングシステム(図示せず)に記憶することができる。関連技術の当業者は、図2に示すネットワーク接続は、コンピュータ間の通信を確立する方法のほんの一部の例であり、無線を含む他の接続が使用され得ることを認識するであろう。
便宜上、プロセッサ(複数可)206、システムメモリ208、ならびにネットワーク及び通信インターフェース252a、256は、システムバス210を介して互いに通信可能に結合され、それによって上記のコンポーネント間の接続を提供するものとして示している。プロセッサベースのデバイス204の代替の実施形態では、上記のコンポーネントは、図2に示すものとは異なる方法で通信可能に結合され得る。たとえば、上記のコンポーネントの1つまたは複数は、他のコンポーネントに直接結合され得、または中間コンポーネント(図示せず)を介して互いに結合され得る。一部の実施形態では、システムバス210は省略され、コンポーネントは適切な接続を使用して互いに直接結合される。
図3は、本開示の技法に従ってTDCシステムを動作させる方法300の高レベル流れ図である。方法300は、たとえば、図1のTDCシステム100によって実行され得る。
方法300は302から始まり、ここで、TDCシステムの少なくとも1つのプロセッサは、ラベル付きトレーニングデータを受け取る。上記のように、ラベル付きトレーニングデータは、統合失調症、双極性障害、または注意欠陥多動性障害(ADHD)などであるがこれらに限定されない複数のメンタルヘルス障害のうちの1つまたは複数を各個人が有するか否かを示す複数の個人のデータを含み得る。各個人について、ラベル付きトレーニングデータは、複数の自己記入式のメンタルヘルス質問票(たとえば、5つの質問票、10個の質問票、20個の質問票)に対する項目レベルの返答も含む。一部の例では、トレーニングデータは、複数の個人のそれぞれがデジタルディスプレイからのテキストを読んでいる間に記録されたビデオデータ及びオーディオデータを含む。一部の例では、ビデオデータは、個人の顔を構成するビデオデータの部分を識別するように処理され、オーディオデータは、個人の声を表す音を識別するように処理される。
少なくとも一部の実施態様では、ラベル付きトレーニングデータは、神経精神医学フェノミクスのためのUCLAコンソーシアムから公開されているデータセットで構成され、これは、健康な個人(130人の対象)と、メンタルヘルス専門家によるDSM障害に関する構造化臨床面接の実施後に、統合失調症(50人の対象)、双極性障害(49人の対象)、ADHD(43人の対象)を含む、神経精神障害を有すると診断された個人との両方における、記憶及び認知制御機能の次元構造の理解にフォーカスしたものである。
全ての参加者は、複数の自己記入式のメンタルヘルス質問票に項目レベルの返答を提供した。本明細書で論じる例示的な実施形態では、合計578個の個別の質問に対する個人の返答が使用された。質問は以下の尺度/質問票、すなわち、ホプキンス症状チェックリスト(HSCL)、成人自己申告尺度v1.1スクリーナー(ASRS)、バラット衝動性尺度(BIS-11)、ディックマン機能・非機能衝動性尺度、多次元的パーソナリティ質問票(MPQ)-コントロール下位尺度、衝動性・冒険性(Venturesomeness)・共感尺度(IVE)、双極II型障害のリスクを高める特徴の尺度、分類学的方法で選択されたGolden&Meehlの7つのMMPI項目、軽躁性パーソナリティ尺度(HPS)、チャップマン尺度(知覚異常、社会的無快感症、身体的無快感症)、ならびに気質性格検査(TCI)、から得られた。他の実施態様では、1つまたは複数の異なる尺度/質問票、あるいは1つまたは複数の尺度/質問票の様々な組み合わせが使用され得ることを理解されたい。
304において、TDCシステムの少なくとも1つのプロセッサは、ラベル付きトレーニングデータを使用して初期機械学習分類器またはモデルをトレーニングする。たとえば、少なくとも一部の実施態様では、ロジスティック回帰を用いたk分割交差検証(たとえば、10分割交差検証)を使用して、578個の個別の質問のスコアに基づいて1つまたは複数のメンタルヘルス障害があると診断された患者から健常対照(HC)の個人を分類する。個々の質問を全て使用して、このシステムは対象を「HC」または「患者」のいずれかに平均精度79%で分類するように動作した。図4は、受診者動作特性(ROC)曲線、他の評価指標を示すグラフ400であり、これは曲線下面積(AUC)の平均が0.88であった(最大で1)。
306において、TDCシステムの少なくとも1つのプロセッサは、回帰係数から578個の質問または特徴についての特徴の重要性の尺度を抽出または取得する。
308において、質問のリストを短くしても同等の分類能力が得られるか否かを調べるために、TDCシステムは、本明細書ではサブセットMLモデルとも呼ぶ一連のモデルを生成し、最も重要な特徴から開始して重要な順に特徴を追加する。たとえば、第1のサブセットMLモデルは最も重要な特徴のみを含み得、第2のサブセットMLモデルは上位2つの重要な特徴を含み得、第3のサブセットMLモデルは上位3つの重要な特徴を含み得る、などである。
310において、TDCシステムの少なくとも1つのプロセッサは、生成されたサブセットMLモデルの少なくとも一部の性能を評価し得る。図5は、1つの特徴(すなわち、最も重要な特徴)から全ての特徴までを含むサブセットMLモデルのROC曲線下面積を示すグラフ500である。図6は、サブセットMLモデルのそれぞれの精度スコアを示すグラフ600である。
質問の様々なサブセット(すなわち、質問1~578)にわたる分類器の性能は、AUCが0.8から0.97まで変化することがわかった。さらに、91%の精度及び0.95のAUCには、17個の特徴のみが必要であることがわかった。これは、分類器ベースのスクリーニングでは、特徴数が多いほど必ずしも優れているとは限らないことを示している。特に、上位17個の特徴には、性格及び気質に関する不均衡な数の質問が、衝動性、気分、及び躁病に関するさらなる質問と共に含まれていた。例示的な実施形態では、上位17個の特徴または質問は、最も重要な特徴から順に、以下の質問を含む。
(1)「できるだけ他の人を喜ばせたい」(tci28t)、
(2)「じっと座っていられないほど落ち着かないことがよくある」(chaphypo8)、
(3)「理由がわからず気分が幸せから悲しみに変わることがよくある」(bipolariil)、
(4)「一人でするのが楽しいこともあるが、大抵は他の人と一緒にするほうが楽しいと思う」(chapsoc8)、
(5)「私はほとんどの人よりも感傷的である」(tci55t)、
(6)「私は自分がする全てのことで優れていたい」(tci72p)、
(7)「人々は私をかなり自由奔放で自発的な人だと考えている」(mpq243)、
(8)「私は必要なもの全てを人々から真に得ることは決してないと感じている」(bipolarii26)、
(9)「なじみのない環境では、自分で驚くほど積極的で社交的なことが多い」(chaphypo7)、
(10)「私は決断を下す前に、長い間物事について考えることを好む」(tci61t)、
(11)「アイデアやひらめきが思い浮かぶのが速すぎて、全てを表現できないことがある」(chaphypo5)、
(12)「私にはたくさんの趣味がある」(dicks)、
(13)「私は自分の問題を自分自身に留めておくことを好む」(tci68t)、
(14)「私の注意は他のことに移りやすいので、長い間同じ興味を保つのは難しい」(tci35t)、
(15)「やりがいのある部分が完了した後、プロジェクトの最終的な詳細をまとめるのに苦労する頻度はどれくらいか」(finaldetail)、
(16)「簡単だとしても、仕事をゆっくり始めることを好む」(tci189p)、及び、
(17)「大抵、私はほとんどの人よりも将来何かがうまくいかないかもしれないと心配している」(tci81t)。
当業者には容易に理解されるように、これらの質問の変形も、開示したシステム及び方法で使用することができる。本開示の様々な例において、いくつかの追加の質問を使用することができ、置換的/代替的な質問を使用することができ、または質問の一部を省略することができる。
312において、TDCシステムの少なくとも1つのプロセッサは、性能評価に基づいて、サブセットMLモデルの1つまたは複数を診断横断的分類器として選択する。たとえば、TDCシステムの少なくとも1つのプロセッサは、上記にリストした上位17個の特徴を含むサブセットMLモデルを診断横断的分類器として選択し得る。次いで、選択された診断横断的分類器を使用して、短期間(たとえば、5分未満)で、任意で遠隔及び反復的に、医師の関与なしに、複数のメンタルヘルス障害にわたって対象をスクリーニングし得る。
少なくとも一部の実施態様では、上記の技法を追加的または代替的に使用して、個々の診断のための特定のスクリーニング、たとえば、健康か統合失調症かを分類するスクリーニング、または健康か双極性かを分類するスクリーニングなどを生成し得る。上記の診断横断的スクリーニングと同様に、これらのスクリーニングのそれぞれは、既存のスクリーニング方法よりも迅速なスクリーニングを可能にする、本明細書で使用する技法を使用して決定される関連する質問の短いリストを含み得る。
例示的なスクリーニングシステム
本開示では、本開示の様々な実施形態を実行するために様々なシステムを使用できることを企図している。図7Aは、図7B、図7C、図7D、図8、及び図9のそれぞれの方法720、730、740、800、及び900を含む本開示の様々な方法を実行するように構成することができる例示的なシステム700Aを提示する。具体的には、システム700Aは、ディスプレイ702、ユーザ704、カメラ706、カメラの視野706a、ユーザインターフェース708、リモートコンピューティングデバイス710、及びマイクロフォン712を含む。
カメラ706は、カメラの前の領域(領域706a)の視覚データをキャプチャし、視覚データをディスプレイ702及びリモートコンピューティングデバイス710に送信する。図7Aに示すように、ユーザ704は、カメラ706の視野内に座る。そのような例では、カメラ706は、ユーザ704の顔の映像をキャプチャする。一部の例では、カメラ706は、ライブビデオ映像、写真、または非可視波長の画像/ビデオを撮影するように構成することができる。一部の例では、カメラ706は、リモートコンピューティングデバイス710またはローカルプロセッサもしくはコンピューティングデバイスからの命令に基づいて、記録を開始または停止するように構成される。たとえば、処理を実行するアプリケーションまたはプログラムは、リモートサーバ、コンピューティングデバイス、またはローカルプロセッサによって実行され得る。カメラ706は、ディスプレイ702及びリモートコンピューティングデバイス710またはローカルコンピューティングデバイスに通信可能に結合される。一部の例では、スマートフォンがこれらの各機能を実行する。
ユーザインターフェース708は、ユーザ704から入力を受け取るように構成される。たとえば、ユーザインターフェース708は、キーボード、タッチスクリーン、モバイルデバイス、または当技術分野で知られている、入力を受け取るための他の任意のデバイスとすることができる。ユーザ704は、ディスプレイ702上のプロンプトに応答して、ユーザインターフェース708上でデータを入力する。たとえば、ディスプレイ702は一連のメンタルヘルスの質問を出力し、ユーザ704はユーザインターフェース708上で各質問に対する回答を入力する。ユーザインターフェース708は、入力をディスプレイ702に直接表示するように構成され、データをリモートコンピューティングデバイス710に中継するように構成される。
マイクロフォン712は、ユーザ704などからの聴覚入力を受け取るように構成される。マイクロフォンは、リモートコンピューティングデバイス710からの指示に基づいて、記録を開始または停止するように構成される。マイクロフォンは、オーディオデータをリモートコンピューティングデバイス710に送信するように構成される。一部の例では、マイクロフォンは、ユーザのスマートフォンのものとすることができる。
ディスプレイ702は、カメラ706、リモートコンピューティングデバイス710、及びユーザインターフェース708からデータを受け取るように構成される。たとえば、ディスプレイ702は、カメラ706によってキャプチャされた視覚データを表示する。他の例では、ディスプレイ702は、ユーザインターフェースから受け取った入力を表示する。ディスプレイ702は、一部の例では、カメラ706及びマイクロフォン712に直接結合され、他の例では、カメラ706及びマイクロフォン712は、それらのデータをリモートコンピューティングデバイス710に送信し、次いでリモートコンピューティングデバイス710は、データを処理し、処理したデータに従ってディスプレイ702に指示する。他の例では、ディスプレイ702は、リモートコンピューティングデバイス710から受け取ったデータを表示する。リモートコンピューティングデバイス710からの例示的なデータには、メンタルヘルス質問票からの質問、回答ボックス、回答選択肢、回答データ、メンタルヘルス表示、または他の任意の情報が含まれる。一部の例では、ディスプレイ702はスマートフォンのものである。
本開示ではまた、当業者によって容易に企図されるように、システム702において2つ以上のディスプレイ702を使用できることを企図している。たとえば、1つのディスプレイは、ユーザ704が見ることができ、さらなるディスプレイは、研究者は見ることができるが、ユーザ704は見ることができない。複数のディスプレイは、リモートコンピューティングデバイス710による指示に従って、同一のまたは異なる情報を出力することができる。
リモートコンピューティングデバイス710は、ディスプレイ702、カメラ706、ユーザインターフェース708、及びマイクロフォン712に通信可能に結合することができる。たとえば、通信は有線または無線とすることができる。リモートコンピューティングデバイス710は、図7B~図9に従って企図される任意の方法(以下でさらに説明する)を実行するように構成される。リモートコンピューティングデバイス710は、ディスプレイ702、カメラ706、ユーザインターフェース708、及びマイクロフォン712からの入力を処理及び/または記憶することができる。
一部の例では、システム700は、スマートフォンなどの単一のデバイスを有するユーザ704とすることができる。スマートフォンは、ディスプレイ702、カメラ706、ユーザインターフェース708、コンピューティングデバイス710、及びマイクロフォン710を有することができる。たとえば、ユーザ704は、ディスプレイ702上のテキストを読み、メンタルヘルス質問票に返答している間、自分の顔の前にスマートフォンを保持することができる。図10A~図10Bを簡単に参照すると、例示的なインターフェース設計が示されている。図7Aと同様のラベルが、対応する要素に使用されている。図10Aは、ユーザが読むためのテキストを表示する画面1000Aを示しており、図10Bは、ビデオデータが記録されているときにユーザの顔を表示する画面1000Bを示している。図10A~図10Bは、開示したシステム及び方法が、ユーザがアクセスしやすいローカルデバイス上でどのように実行できるかを示している。
スクリーニング中の声/顔認識用のテストアプリケーション
図7Bは、本開示の例示的な実施態様による例示的な方法論700Bを示している。方法論700Bは、ユーザにテストを提供し、図7Aに関して上記で論じたように、システム700Aによって実施することができる。
方法論700Bは、ステップ720において、テストアプリケーションの実行及び終了を制御することを実施する。テストアプリケーションは、コンピューティングデバイス(たとえば、図7Aのリモートコンピューティングデバイス710)に記憶されるソフトウェアアプリケーションとすることができる。ステップ720は、テストを開始する指示を受け取ると、テストアプリケーションを実行することを実施する。一部の例では、この指示は、コンピューティングデバイスに通信可能に結合されたユーザインターフェース(たとえば、図7aのユーザインターフェース708)からのものである。
ステップ720は、コンピューティングデバイスがテストを停止する指示を受け取るまで、テストアプリケーションを実行することを実施する。一部の例では、この指示はユーザインターフェースからのものである。一部の例では、テストを停止する指示は、カメラによってキャプチャされた画像内にユーザの顔がないと、コンピューティングデバイスによって判定することを含む。
ステップ720に従ってテストが実行されている間に、方法論700Bはステップ721に進む。ステップ721は、一連の質問を表示することを実施する。例示的な一連の質問は、メンタルヘルス質問票からの質問を含み、各質問のテキスト及び回答の両方を含む。
ステップ720に従ってテストが実行されている間に、方法論700Bはステップ722を実施することができる。ステップ722は、ライブビデオデータを表示することを実施する。一部の例では、ディスプレイの前の画像をキャプチャするように配置されたカメラ(たとえば、図7Aに示すように、ディスプレイ702の前に位置するユーザ704の視覚データをキャプチャするカメラ706)からライブビデオデータが収集される。一部の例では、ライブビデオデータが記録され、次いでディスプレイに表示され、他の例では、ライブビデオデータが同時に記録及び表示される。ディスプレイをユーザに向けることができる。
ステップ720に従ってテストが実行されている間に、方法論700Bはステップ723を実施することができる。ステップ723は、(たとえば、図7Aのカメラ706及びマイクロフォン712からの)テストビデオデータ及びテストオーディオデータを記録することを実施する。一部の例では、オーディオデータ及びビデオデータは、ステップ722における質問の表示に対応するセグメントに記録され、他の例では、ステップ722において質問が提示されている間に、中断されないストリームでデータが収集される。ステップ723の一部の例では、ビデオ及びオーディオデータは、図7Cの方法論730に従って前処理される。
一部の例では、マイクロフォン(たとえば、図7Aのマイクロフォン712)は、ユーザが話しているとコンピューティングデバイスが判定すると、オーディオデータを記録する。一部の例では、ユーザが話していないとコンピューティングデバイスが判定すると、マイクロフォンはオーディオデータの記録を停止する。
ステップ720に従ってテストが実行されている間に、方法論700Bはステップ724を実施することができる。ステップ724は、一連の質問(ステップ721で実施された質問)のそれぞれに対する回答を受け取ることを実施する。回答はユーザインターフェースで受け取られる。一部の例では、回答は、多項選択式の質問の選択、テキストによる返答、または当業者によって企図される他の任意のユーザ入力を含む。
ステップ720に従ってテストが実行されている間に、方法論700Bはステップ725を実施することができる。ステップ725は、ステップ724において受け取られた回答と、ステップ723において記録されたテストビデオデータ及びテストオーディオデータとを処理することを実施する。一部の例では、この処理は、コンピューティングデバイスにおいて機械学習モデルを使用して実行され、ユーザのメンタルヘルス表示を出力する。本開示の一部の例では、ステップ725は、図7Dの方法740に関して以下でさらに説明するように、回答、テストビデオデータ、及びテストオーディオデータの処理を実行する。
一部の例では、出力されたメンタルヘルス表示は、ユーザがいくつかのメンタルヘルス障害のいずれか1つを有する可能性を識別する。メンタルヘルス障害には、神経精神障害、統合失調症、及び双極性障害が含まれる。一部の例では、メンタルヘルス表示は、ユーザが患者であるか健常対照であるかを識別する。
図7Bのステップ721、722、723、724、及び725は、ステップ720でテストアプリケーションが開始された後に順次行うことができる。方法論700Bの一部の例では、ステップ721、722、723、724、及び725が同時に及び/または任意の組み合わせで行われる。方法論700Bの一部の例では、ステップ721、722、723、724、及び725の一部、またはステップ721、722、723、724、及び725の任意のサブセットが、リモートコンピューティングデバイスからの指示に従って反復または省略される。したがって、本開示では、当業者によって容易に企図されるように、本開示の一実施形態において、ステップ720、721、722、723、724、及び725の上記の説明の任意の組み合わせを使用できることを企図している。
ここで図7Cの方法論730を参照すると、本開示の様々な実施形態による、オーディオデータ及び視覚データを前処理するための例示的な方法論が示されている。ステップ731において、方法論730は、テストビデオデータ及びテストオーディオデータを受け取ることを実施する。一部の例では、テストビデオデータ及びテストオーディオデータは、図7Bの方法論700Bまたは本開示の他の実施形態に従って記録される。
ステップ732は、テストビデオデータを前処理してビデオセグメントを識別することを実施する。各ビデオセグメントは、一連の質問(たとえば、図7Bの方法論700Bに関して説明したテストの質問)のうちの1つの質問に対応し、時間ウィンドウを含み、時間ウィンドウは、ビデオセグメントの継続時間と、ビデオセグメントが発生する記録データの期間とを提供する。一部の例では、時間ウィンドウは、開始時刻、停止時刻、及び継続時間長のいずれかを含む。一部の例では、ビデオセグメントは、質問がディスプレイにいつ表示されたかに応じて、コンピューティングデバイスからの指示に基づいて識別される。
ステップ733は、テストオーディオデータを前処理してオーディオセグメントを識別することを実施する。各オーディオセグメントは、一連の質問の中の1つの質問に対応し、時間ウィンドウを含み、時間ウィンドウは、ステップ732の時間ウィンドウに関連して提供されたものである。一部の例では、オーディオセグメントは、質問がディスプレイにいつ表示されたかに応じて、コンピューティングデバイスからの指示に基づいて識別される。一部の例では、オーディオセグメントは、コンピューティングデバイスによる、ユーザが話しているか否かの判定に基づいて識別される。
ステップ734は、ステップ732のビデオセグメント及びステップ733のオーディオセグメントを前処理して、重複する時間ウィンドウを識別することを実施する。ステップ735は、重複する時間ウィンドウに基づいて、統合されたオーディオ及びビデオセグメントを出力することを実施する。一部の例では、統合されたオーディオ及びビデオセグメントは、リモートコンピューティングデバイスに記憶される。
ここで図7Dの方法論740を参照すると、本開示の様々な実施形態による、機械学習モデルを使用して入力を分析し、メンタルヘルス表示を出力するための例示的な方法論が示されている。一部の例では、機械学習モデルは、一般化線形モデル、回帰モデル、ロジスティック回帰モデル、及び教師あり機械学習分類モデルのいずれかである。一部の例では、機械学習モデルは、以下でさらに説明するモデル及びアルゴリズムのいずれかである。
ステップ741において、方法論740は、複数の個人についてのメンタルヘルス障害状態に関するラベル付きトレーニングデータを受け取ることを実施する。一部の例では、ラベル付きトレーニングデータは、各個人が1つまたは複数のメンタルヘルス障害を有するか否かを識別する。一部の例では、ラベル付きトレーニングデータは、個人のそれぞれについて記録されたオーディオ及びビデオデータ(たとえば、図7Bの方法論700Bまたは本開示の他の任意の実施形態によるオーディオ及びビデオデータ記録)を含む。ラベル付きトレーニングデータはまた、メンタルヘルス質問票への回答の選択を含むことができる。一部の例では、ラベル付きトレーニングデータは、各個人について、個人が健康であるか否か、個人が一般的なメンタルヘルスの問題を有するか否か、個人が1つまたは複数の特定のメンタルヘルス障害を有するか否か、個人に一般的なメンタルヘルスの問題を発症するリスクがあるか否か、あるいは個人に1つまたは複数の特定のメンタルヘルス障害を発症するリスクがあるか否か、のいずれかの指示を含む。一部の例では、ラベル付きトレーニングデータは、機能的及び/または生理学的測定データを含む。
ステップ742において、方法論740は、ステップ741のラベル付きトレーニングデータから特徴を決定することを実施する。特徴は、当技術分野で知られている任意の方法に従って決定される。
ステップ743において、方法論740は、ステップ742で決定された特徴に基づいて、教師あり様式で初期機械学習モデルをトレーニングすることを実施する。一部の例では、この初期機械学習モデルをトレーニングすることは、ロジスティック回帰を用いたk分割交差検証を使用することを含む。
ステップ744において、方法論740は、各特徴について重要性尺度を抽出することを実施する。これらの重要性尺度は、トレーニングされた初期機械学習モデルに基づいて選択される。
ステップ745において、方法論740は、ステップ744の抽出された重要性尺度に基づいて、複数のサブセット機械学習モデルを生成することを実施する。ステップ746において、方法論740は、ステップ745から生成されたサブセット機械学習モデルの分類性能を評価することを実施する。一部の例では、サブセット機械学習モデルのそれぞれは、異なる特徴の選択を含む。一部の例では、サブセット機械学習モデルは、閾値を超える重要性尺度を有する特徴のみを含む。
ステップ747において、方法論740は、サブセット機械学習モデルのうちの1つを一般化線形学習モデルとして選択することを実施する。この選択は、ステップ746で評価された分類性能に基づく。選択されたサブセット機械学習モデルは、ステップ742から決定された複数の特徴の一部分を含む。特徴の一部分は、閾値を超える(ステップ744で決定された)重要性尺度を有する特徴から選択される。一部の例では、2つ以上のサブセット機械学習モデルが選択される。
ステップ747の一部の例では、ステップ742で決定された複数の特徴のうちの少なくとも20個の特徴が、閾値を超える重要性尺度を有するように、閾値が設定される。一部の例では、閾値は、10~20個の特徴の一部分を選択するように設定される。
ステップ747の一部の例では、サブセット機械学習モデルの少なくとも1つが診断分類器として選択される。診断分類器の特徴は、後でスクリーニングツールとして使用するためにリモートコンピューティングデバイスに記憶される。一部の例では、診断分類器はメンタルヘルス表示を出力する。メンタルヘルス表示は、(1)ユーザを健康であるかまたは一般的なメンタルヘルスの問題を有すると識別することと、(2)ユーザを健康であるかまたは特定のメンタルヘルスの問題を有すると識別することと、(3)ユーザを、第1の特定のメンタルヘルス障害を有するか、または第2の特定のメンタルヘルス障害を有すると識別することと、(4)個人のメンタルヘルス障害を発症するリスクを特定することと、のいずれかとすることができる。
次いで、選択された機械学習モデルを使用して、本開示で実施されるように、入力データのいずれかを処理することができる。一部の例では、診断分類器の特徴は、治療反応をテストする臨床試験の中間結果及び/またはエンドポイント結果を評価するためのスクリーニングツールとして使用される。
全体として、図7Bの方法720及び図7Cの方法730は、異なるモダリティで入力を受け取るアルゴリズムを提供する。方法論740は、方法720及び730からの入力の処理を実施して、最も高い予測値を有する特徴に基づいてアルゴリズムを出力する(予測値は重要性尺度に基づいて決定することができる)。たとえば、方法720及び730の様々な実施形態は、メンタルヘルス質問票データ、声データ、及び/またはビデオデータを受け取る。方法論740は、全ての入力を受け取り、入力に基づいて特徴を決定し、それらの特徴のいずれが最も高い予測値を有するかを決定する。最も高い予測値を有する特徴を組み込んだ機械学習モデルを構築することができる。
したがって、モデル、方法論、及びモデルビルダーは特に価値があり、様々な異なる尺度の計器、ビデオデータ及びオーディオデータを含む複数のモダリティからの特徴を効率的に組み合わせて、単一のモダリティモデルよりも往々にして正確であり得るマルチモーダルモデルを構築するように設計される。たとえば、従来の技術では、モダリティの新しい組み合わせごとに新しいモデルを構築してトレーニングする必要があるので、特に、ノイズを出力にあまり入れることなくモダリティを効率的に組み合わせることは完全に非現実的であり、その理由は、従来の技術は、様々なモダリティからの特徴をテストしてそれらを単一のモデルに組み込むことができないためである。具体的には、一部の例では、追加の特徴は精度が低くなり得るので、モダリティを組み合わせるための1つの鍵は、各モダリティから適切な特徴を組み込むことである。開示した技術は、それらの効率的なテスト及び組み合わせを可能にする処理及びモデルを提供する。
さらに、メンタルヘルスのスクリーナー及びモデルは、2つ以上のモダリティを調べることで恩恵を受けることが多く、一部の例では、はるかに優れた精度を生み出し得る。たとえば、尺度ベースの質問からの回答のみを処理すると、記述(statement)を読んでいる間の声のトーン及び顔の表情、ならびに記述が読まれた速度などの他のものをキャプチャできない場合がある。この特徴は患者のメンタルヘルスの評価にとって非常に重要であり得、その理由は、たとえば、記述は様々な声のトーンで読まれたり、同じ声のトーンであるが異なる顔の表情で話されたりし得、これらは全て異なる感情及びメンタルヘルス状態表示を伝えるためである。
このモデルは次いで、診断ツールとして使用することができる。たとえば、追加のメンタルヘルス質問票データ、声データ、及び/またはビデオデータをモデルに入力して、患者のメンタルヘルス表示を決定することができる。
したがって、本開示の方法は、様々なメンタルヘルス障害を予測する特徴を決定することができる機械学習アルゴリズムを提供する。たとえば、機械学習モデルは、第1の特定のメンタルヘルス障害に関連するメンタルヘルス表示が第1の特徴のセットに依存していると判定することができ、この第1の特徴のセットは、任意の入力モダリティからのものとすることができる(たとえば、鬱病のメンタルヘルス表示は、声のトーン及び顔の表情に依存し得る)。機械学習モデルはさらに、第2の特定のメンタルヘルス障害に関連するメンタルヘルス表示が第2の特徴のセットに依存していると判定することができ、この第2の特徴のセットは、任意の入力モダリティからのものとすることができる(たとえば、不安のメンタルヘルス表示は、吃音のオーディオデータまたは話者の頻繁な自己言及に依存し得る)。したがって、異なる特徴が異なるメンタルヘルス障害に対して決定論的であり得るが、同じアルゴリズムを異なるメンタルヘルス障害及び異なる入力データに使用することができる。一部の例では、開示したアルゴリズムは、提供される入力データに基づいて、提供できるメンタルヘルス表示を自動的に調整する。
オーディオ及びビデオ記録を収集するためのアプリケーション
図8は、本開示の例示的な実施態様による例示的な方法論800を示している。方法論800は、テストをユーザに実施する方法を提供し、図7Aに関して上記で論じたように、システム700Aによって実施することができる。
方法論800は、ステップ810において、テストアプリケーションの実行及び終了を制御することを実施する。テストアプリケーションは、コンピューティングデバイス(たとえば、図7Aのリモートコンピューティングデバイス710)に記憶されたソフトウェアアプリケーションとすることができる。ステップ810は、テストを開始する指示を受け取ると、テストアプリケーションを実行することを実施する。
ステップ810に従ってテストが実行されている間に、方法論800はステップ820を実施することができる。ステップ820は、テストビデオデータ及びテストオーディオデータを記録することを実施する。テストビデオデータは、カメラ(たとえば、図7Aのカメラ706)によってキャプチャすることができ、テストオーディオデータは、マイクロフォン(たとえば、図7Aのマイクロフォン712)によってキャプチャすることができる。
ステップ810に従ってテストが実行されている間に、方法論800はステップ830を実施することができる。ステップ830は、カメラによって記録されたライブビデオデータを表示し、ユーザが読むためにディスプレイにテキストを表示することを実施する。一部の例では、テキストは、ユーザのメンタルヘルスに関連する一連の質問または記述を含む。ユーザがテキストを読み上げると、マイクロフォンがオーディオデータをキャプチャする。一部の例では、表示されたテキストは、質問テキストと各質問の回答選択とを含む、メンタルヘルス質問票からの一連の質問を含む。
ステップ810に従ってテストが実行されている間に、方法論800はステップ840を実施することができる。ステップ840は、ステップ820において記録されたテストビデオデータのセットを処理して、ユーザの顔を識別し、ユーザの顔がカメラの視野内にあるときを特定することを実施する。一部の例では、ステップ840は、複数のピクセルをユーザの顔に割り当て、ユーザの顔の複数のピクセルの全てが、カメラによってキャプチャされたフレーム内にあるか否かを判定することをさらに含む。顔がカメラによってキャプチャされたフレームの外側にあると判定された場合、ステップ840はテストを停止することを実施する。ステップ840の他の例では、複数のピクセルがユーザの顔の境界に割り当てられ、このステップはさらに、ユーザの顔の境界が、カメラによってキャプチャされたフレーム内にあるか否かを判定することを実施する。本開示はさらに、当技術分野で知られているように、ユーザの顔がカメラの視野内にあることを確認するための任意の方法を使用できることを企図している。
ステップ810に従ってテストが実行されている間に、方法論800はステップ850を実施することができる。ステップ850は、テストオーディオデータ及びテストビデオデータを処理してオーディオ及びビデオ特徴を識別することを実施する。オーディオ及びビデオ特徴は、コンピューティングデバイスのメモリに記憶される。ステップ850の一部の例では、テストオーディオデータ及びテストビデオデータを処理することは、上記の図7Dの方法740に関して実施された通りである。一部の例では、オーディオ及びビデオ特徴は、一連の質問の中の特定の質問に対応する。
一部の例では、ステップ850の前、間、または後に、当業者によって容易に企図されるように、図7C及び図7Dの方法730及び740が、テストオーディオデータ及びテストビデオデータに適用される。
方法論800の一部の例では、ステップ810でテストアプリケーションが開始された後に、ステップ820、830、840、及び850が順次行われる。一部の例では、ステップ820、830、840、及び850は同時に及び/または任意の組み合わせで行われる。一部の例では、ステップ820、830、840、及び850の一部、またはステップ820、830、840、及び850の任意のサブセットが、リモートコンピューティングデバイスからの指示に従って反復または省略される。したがって、本開示では、当業者によって容易に企図されるように、本開示の一実施形態において、ステップ820、830、840、及び850の任意の組み合わせを使用できることを企図している。
スクリーニング結果を出力するための対話型のテストアプリケーション
図9は、本開示の例示的な実施態様による例示的な方法論900を示している。方法論900は、テストをユーザに実施する方法を提供し、図7Aに関して上記で論じたように、システム700Aによって実施することができる。
方法論900は、ステップ910において、回答データのセットを受け取ることを実施する。一部の例では、回答データは、メンタルヘルス質問票からの一連の質問に対するユーザからの回答を含む。
次いで、方法論900は、ステップ920において、テストビデオデータ及びテストオーディオデータのセットを受け取ることを実施する。一部の例では、テストビデオデータ及びテストオーディオデータが、カメラ及びマイクロフォン(たとえば、図7Aのカメラ706及びマイクロフォン712)によって記録される。テストビデオデータは、テスト(たとえば、図7B及び図8の方法論700B及び800のテスト)中に記録され、ユーザがテキストを読んでいる間のユーザの顔を含む。たとえば、テキストは、図8の方法論800に従って表示される。テストオーディオデータのセットもテスト中に記録され、ユーザがテキストを読んでいる間のユーザの声を表す。
次いで、方法論900のステップ930は、テストビデオデータのセットを処理してビデオ特徴を出力することを実施する。ステップ940は、テストオーディオデータのセットを処理してオーディオ特徴を出力することを実施する。一部の例では、ステップ930~940は、図7Cの方法730に従って実行される。
方法論900はさらに、ステップ950において、回答データのセット、ビデオ特徴のセット、及びオーディオ特徴のセットを処理してメンタルヘルス表示を出力することを実施する。一部の例では、ステップ950は、図7Dの方法論740に関して上記で論じたように実行される。
機械学習の実施態様
本開示の様々な態様は、当業者によって容易に理解されるように、機械学習アルゴリズムによって実行することができる。一部の例では、図7Bのステップ725、方法論740、図8のステップ850、及び図9のステップ950は、教師ありまたは教師なしのアルゴリズムによって実行することができる。たとえば、システムは、(1)決定木(「DT」)、(2)ベイジアンネットワーク(「BN」)、(3)人工ニューラルネットワーク(「ANN」)、または(4)サポートベクターマシン(「SVM」)を含む、より基本的な機械学習ツールを利用し得る。他の例では、深層学習アルゴリズム、または他のより高度な機械学習アルゴリズム、たとえば、畳み込みニューラルネットワーク(「CNN」)、またはカプセルネットワーク(「CapsNet」)が使用され得る。
DTは、入力データを、決定木の連続する各ステップで尋ねられる質問に一致させる分類グラフである。DTプログラムは、質問への回答に基づいて木の「分岐」を下りる(たとえば、最初の分岐:ユーザは質問を読む前に休止したか?はいまたはいいえ。分岐2:ユーザは質問を読んでいる間に吃音をしたか?はいまたはいいえ、など)。
ベイジアンネットワーク(「BN」)は、与えられた独立変数に基づいて何かが真である尤度に基づき、確率的関係に基づいてモデル化される。BNは、ある変数の、他の変数または複数の変数に基づく尤度を決定する確率的関係に純粋に基づく。たとえば、BNは、位置データ、タイムスタンプデータ、以前のアラート、及び本開示によって企図される他の任意の情報の間の関係をモデル化することができる。具体的には、質問のタイプと、ユーザの聴覚データの特定の特徴とがわかっている場合、BNを使用して、ユーザが特定のメンタルヘルス障害を有する確率を計算することができる。このように、効率的なBNアルゴリズムを使用して、入力データに基づいて推論を行うことができる。
人工ニューラルネットワーク(「ANN」)は、動物の中枢神経系に触発された計算モデルである。これらはノードのネットワークを介して入力を出力にマッピングする。しかしながら、BNとは異なり、ANNでは、ノードは必ずしも実際の変数を表すとは限らない。したがって、ANNは、観察者にとって既知の変数によって表されないノードの隠れ層を有し得る。ANNはパターン認識が可能である。それらの計算方法は、様々な入力データに基づいてメンタルヘルス障害を予測する間に発生し得る複雑で不明確な処理を理解しやすくする。
サポートベクターマシン(「SVM」)は、機械学習統計と、ある種の極限関連構造を備えたベクトル空間(線形空間の次元数を表す線形代数の概念)とを利用するフレームワークから生まれた。場合によっては、それらは、入力を2つの分類に簡単に分離する新しい座標系を決定し得る。たとえば、SVMは、異なる分類のイベントに由来する2つの点集合を分離する線を特定することができる。
ディープニューラルネットワーク(DNN)は、最近開発され、多くのバリエーションを有する非常に複雑な関係をモデル化することが可能である。過去数十年の間に多くの研究者によってANNなどのアルゴリズムに関連する課題に取り組むために、様々なDNNのアーキテクチャが提案されてきた。これらのタイプのDNNは、CNN(畳み込みニューラルネットワーク)、RBM(制限付きボルツマンマシン)、LSTM(長短期記憶)などである。それらは全てANNの理論に基づいている。それらは、ANNに関連する逆伝搬誤差の減衰の課題を克服することにより、より優れた性能を示す。
機械学習モデルには、検出するように設計された関心対象の特徴を識別するためのトレーニングデータが必要である。たとえば、ネットワークにランダムに割り当てられた初期重みを適用したり、深層学習アルゴリズムの逆伝搬を使用して勾配降下法を適用したりするなど、様々な方法を利用して機械学習モデルを形成し得る。他の例では、この技法を使用してトレーニングすることなく、1つまたは2つの隠れ層を有するニューラルネットワークを使用することができる。
一部の例では、機械学習モデルは、ラベル付きデータ、または特定のユーザ入力を表すデータを使用してトレーニングすることができる。他の例では、データには結果のみがラベル付けされ、機械学習アルゴリズムをトレーニングするために様々な関連データが入力され得る。
たとえば、特定のメンタルヘルス障害が入力データに適合するか否かを判定するために、本明細書に開示する様々なデータを入力する様々な機械学習モデルが利用され得る。一部の例では、入力データは、分野の専門家に、特定の状況に応じて関連する規則にラベルを付けてもらうことによって、ラベル付けされる。それに応じて、トレーニングデータに関する機械学習アルゴリズムへの入力によって、様々なデータが健常対照または患者からのものとして識別される。
本開示のコンピュータ及びハードウェア実施態様
本明細書の開示は、任意のタイプのハードウェア及び/またはソフトウェアで実装され得ること、ならびに事前にプログラムされた汎用コンピューティングデバイスであり得ることを最初に理解されたい。たとえば、システムは、サーバ、パーソナルコンピュータ、ポータブルコンピュータ、シンクライアント、または任意の適切な1つまたは複数のデバイスを使用して実装され得る。本開示及び/またはそのコンポーネントは、単一の場所にある単一のデバイスであり得、または電気ケーブル、光ファイバーケーブルなどの任意の通信媒体を介して、または無線方式で任意の適切な通信プロトコルを使用して相互に接続される単一または複数の場所にある複数のデバイスであり得る。
本開示は、特定の機能を実行する複数のモジュールを有するものとして本明細書で例示及び説明していることにも留意されたい。これらのモジュールは、明確にする目的でのみ、それらの機能に基づいて概略的に示しているにすぎず、必ずしも特定のハードウェアまたはソフトウェアを表していないことを理解されたい。この点で、これらのモジュールは、説明した特定の機能を実質的に実行するように実装されたハードウェア及び/またはソフトウェアであり得る。また、モジュールは、本開示内で互いに組み合わせられ得、または所望の特定の機能に基づいて追加のモジュールに分割され得る。したがって、本開示は、本発明を限定するものと解釈されるべきではなく、単にその1つの例示的な実施態様を説明するためのものと理解されるべきである。
コンピューティングシステムは、クライアント及びサーバを含むことができる。クライアント及びサーバは、概して互いに離れており、典型的には通信ネットワークを介してやりとりする。クライアント及びサーバの関係は、コンピュータプログラムがそれぞれのコンピュータ上で動作し、互いにクライアント-サーバの関係を有することにより生じる。一部の実施態様において、サーバは、(たとえば、クライアントデバイスと対話するユーザにデータを表示し、そのユーザからユーザ入力を受け取る目的で)データ(たとえば、HTMLページ)をクライアントデバイスに送信する。(たとえば、ユーザインタラクションの結果として)クライアントデバイスで生成されたデータは、クライアントデバイスからサーバにおいて受信することができる。
本明細書に記載の主題の実施態様は、バックエンドコンポーネントをデータサーバなどとして含む、もしくはミドルウェアコンポーネント、たとえば、アプリケーションサーバを含む、またはフロントエンドコンポーネント、たとえば、ユーザがそれを通じて本明細書に記載の主題の一実施態様とやりとりできるグラフィカルユーザインターフェースもしくはウェブブラウザを有するクライアントコンピュータを含む、コンピューティングシステム内で、あるいは1つまたは複数のそのようなバックエンド、ミドルウェア、またはフロントエンドコンポーネントの任意の組み合わせで、実装することができる。システムのコンポーネントは、あらゆる形式または媒体のデジタルデータ通信、たとえば、通信ネットワークによって相互接続することができる。通信ネットワークの例には、ローカルエリアネットワーク(「LAN」)及びワイドエリアネットワーク(「WAN」)、インターネットワーク(たとえば、インターネット)、ならびにピアツーピアネットワーク(たとえば、アドホックピアツーピアネットワーク)が含まれる。
本明細書に記載の主題及び動作の実施態様は、デジタル電子回路で、または本明細書に開示した構造及びそれらの構造的均等物を含むコンピュータソフトウェア、ファームウェア、またはハードウェアで、あるいはそれらのうちの1つまたは複数の組み合わせで実装することができる。本明細書に記載の主題の実施態様は、1つまたは複数のコンピュータプログラム、すなわち、データ処理装置による実行のために、またはその動作を制御するためにコンピュータ記憶媒体上にコード化されたコンピュータプログラム命令の1つまたは複数のモジュールとして実装することができる。あるいは、またはさらに、プログラム命令は、人工的に生成された伝搬信号、たとえば、データ処理装置によって実行するために適切な受信機装置に送信される情報を符号化するために生成される機械生成の電気、光、または電磁信号に符号化することができる。コンピュータ記憶媒体は、コンピュータ可読記憶デバイス、コンピュータ可読記憶基板、ランダムもしくはシリアルアクセスメモリアレイもしくはデバイス、またはそれらのうちの1つまたは複数の組み合わせとすることができ、またはそれらに含めることができる。また、コンピュータ記憶媒体は伝搬信号ではないが、コンピュータ記憶媒体は、人工的に生成された伝搬信号に符号化されたコンピュータプログラム命令のソースまたは宛先とすることができる。コンピュータ記憶媒体はまた、1つまたは複数の別個の物理的コンポーネントまたは媒体(たとえば、複数のCD、ディスク、または他の記憶デバイス)とすることができ、またはそれらに含めることができる。
本明細書に記載の動作は、1つまたは複数のコンピュータ可読記憶デバイスに記憶された、または他のソースから受け取ったデータに対して、「データ処理装置」によって実行される動作として実装することができる。
「データ処理装置」という用語は、データを処理するためのあらゆる種類の装置、デバイス、及び機械を含み、たとえば、プログラム可能なプロセッサ、コンピュータ、システムオンチップ、もしくは複数のもの、または前述の組み合わせを含む。装置は、FPGA(フィールドプログラマブルゲートアレイ)またはASIC(特定用途向け集積回路)などの専用の論理回路を含むことができる。装置はまた、ハードウェアに加えて、当該のコンピュータプログラムの実行環境を作成するコード、たとえば、プロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、クロスプラットフォーム実行時環境、仮想マシン、またはそれらのうちの1つまたは複数の組み合わせを構成するコードを含むことができる。装置及び実行環境は、ウェブサービス、分散コンピューティング、グリッドコンピューティングインフラストラクチャなど、様々な異なるコンピューティングモデルインフラストラクチャを実現することができる。
コンピュータプログラム(別名、プログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプト、またはコード)は、コンパイル型言語もしくはインタプリタ型言語、宣言型言語もしくは手続き型言語を含む、任意の形態のプログラム言語で書くことができ、また、任意の形態で、たとえば、独立型プログラムとして、またはモジュール、コンポーネント、サブルーチン、オブジェクト、もしくはコンピューティング環境での使用に好適な他の単位として展開することができる。コンピュータプログラムは、ファイルシステムのファイルに対応し得るが、必須ではない。プログラムは、他のプログラムまたはデータ(たとえば、マークアップ言語の文書に記憶される1つまたは複数のスクリプト)を保持するファイルの一部分に、当該のプログラム専用の単一のファイルに、あるいは複数の連携ファイル(たとえば、1つまたは複数のモジュール、サブプログラム、またはコードの一部分を記憶するファイル)に記憶することができる。コンピュータプログラムは、1つのコンピュータ上で、または1つの場所に位置するかもしくは複数の場所に分散され、通信ネットワークによって相互接続される複数のコンピュータ上で、実行されるように展開することができる。
本明細書に記載の処理及びロジックフローは、1つまたは複数のプログラム可能なプロセッサが、1つまたは複数のコンピュータプログラムを実行して、入力データに作用して出力を生成することによりアクションを行うことによって、実行することができる。処理及びロジックフローは、専用論理回路、たとえば、FPGA(フィールドプログラマブルゲートアレイ)またはASIC(特定用途向け集積回路)によって実行することもでき、装置をこれらとして実装することもできる。
コンピュータプログラムの実行に適したプロセッサは、たとえば、汎用及び専用マイクロプロセッサの両方、任意の種類のデジタルコンピュータの任意の1つまたは複数のプロセッサを含む。一般に、プロセッサは、読み取り専用メモリ、ランダムアクセスメモリ、またはその両方から命令及びデータを受け取る。コンピュータの必須の要素は、命令に従ってアクションを実行するためのプロセッサ、ならびに命令及びデータを記憶するための1つまたは複数のメモリデバイスである。一般に、コンピュータはまた、データを記憶するための1つまたは複数の大容量記憶デバイス、たとえば、磁気ディスク、光磁気ディスク、または光ディスクを含み、またはこれらからデータを受信するか、これらにデータを転送するか、またはその両方を行うように動作可能に結合される。しかしながら、コンピュータはそのようなデバイスを有する必要はない。また、コンピュータは、他のデバイス、たとえば、ほんの数例を挙げると、携帯電話、携帯情報端末(PDA)、モバイルオーディオまたはビデオプレーヤー、ゲームコンソール、全地球測位システム(GPS)受信機、またはポータブルストレージデバイス(たとえば、ユニバーサルシリアルバス(USB)フラッシュドライブ)に組み込むことができる。コンピュータプログラム命令及びデータを記憶するのに適したデバイスは、たとえば、EPROM、EEPROM、及びフラッシュメモリデバイスなどの半導体メモリデバイス、内部ハードディスク及び着脱可能ディスクなどの磁気ディスク、光磁気ディスク、ならびにCD-ROM及びDVD-ROMディスクを含む、全ての形式の不揮発性メモリ、媒体、及びメモリデバイスを含む。プロセッサ及びメモリは、専用の論理回路によって補完することができ、またはこれに組み込むことができる。
結論
上記の種々の方法及び技法は、本発明を実施するいくつかの手段を提供する。当然ながら、必ずしも記載した全ての目的または利点を、本明細書に記載した任意の特定の実施形態に従って達成できるとは限らないことを理解されたい。よって、たとえば、当業者は、本明細書で教示または示唆した他の目的または利点を必ずしも達成することなく、本明細書で教示した1つの利点または利点群を達成または最適化するように、これらの方法を実行できることを認識するであろう。様々な代替例について本明細書において言及している。一部の実施形態は、1つの、他の、またはいくつかの特徴を具体的に含むが、他のものは、1つの、他の、またはいくつかの特徴を具体的に除外し、さらに他のものは、1つの、他の、またはいくつかの有利な特徴を含めることによって特定の特徴を軽減することを理解されたい。
さらに、当業者は、異なる実施形態からの様々な特徴の適用可能性を認識するであろう。同様に、上記で議論した様々な要素、特徴、及びステップ、ならびにそのような各要素、特徴、またはステップの他の知られている均等物は、当業者によって様々な組み合わせで使用して、本明細書に記載の原理に従う方法を実行することができる。様々な要素、特徴、及びステップの中で、一部は具体的に含まれ、その他は多様な実施形態で具体的に除外される。
本出願は特定の実施形態及び実施例の文脈で開示したが、当業者によって、本出願の実施形態が、具体的に開示した実施形態を超えて他の代替的な実施形態及び/または使用法ならびにそれらの修正例及び均等物に及ぶことは理解されよう。
一部の実施形態では、本出願の特定の実施形態を説明する文脈で(特に、以下の特許請求の範囲の特定の文脈で)使用する「1つの(a)」及び「1つの(an)」及び「その(the)」という語ならびに類似の指示対象は、単数形及び複数形の両方を含むように解釈することができる。本明細書での値の範囲の記述は単に、範囲内に入る各個別の値を個々に指す簡単な方法として役立つことを意図している。本明細書で別段の指示のない限り、各個別の値は、本明細書で個別に列挙されているかのように、本明細書に組み込まれる。本明細書に記載の全ての方法は、本明細書で別段の指示のない限り、または文脈上明らかに矛盾しない限り、任意の好適な順序で行うことができる。本明細書の特定の実施形態に関して提供する任意の及び全ての例、または例示的な文言(たとえば、「~など」)の使用は、単に本出願をより理解しやすくすることを意図しており、別途特許請求される本出願の範囲を限定するものではない。本明細書中のいかなる文言も、本出願の実施に不可欠な任意の特許請求していない要素を示すものと解釈されるべきではない。
本出願の特定の実施形態を本明細書に記載している。それらの実施形態の変形は、前述の説明を読むと、当業者には明らかになろう。当業者がそのような変形を適宜使用することができ、本明細書に具体的に記載した以外の方法で本出願を実施できることを企図している。したがって、本出願の多くの実施形態は、適用法によって許容されるように本明細書に添付される特許請求の範囲に列挙した主題の全ての修正及び均等物を含む。また、本明細書で別段の指示のない限り、または文脈上明らかに矛盾しない限り、それらの全ての可能な変形における上述の要素の任意の組み合わせが本出願によって包含される。
本主題の特定の実施態様を説明してきた。他の実施態様は、以下の特許請求の範囲内にある。場合によっては、特許請求の範囲に列挙したアクションは、異なる順序で実行され、それでも望ましい結果を達成することができる。さらに、添付の図面に示した処理は、望ましい結果を達成するために、図示した特定の順序または順次的な順序を必ずしも必要としない。
本明細書で参照される全ての特許、特許出願、特許出願公開、ならびに記事、書籍、明細書、刊行物、文書、物品、及び/または同様のものなどの他の資料は、この引用によってそれらの全体が全ての目的のために本明細書に組み込まれるが、それらに関連する出願経過、本文書と不一致であるかもしくは矛盾するもの、または現在もしくは今後本文書に関連する特許請求の範囲の最も広い範囲に関して限定的な影響を有し得るものは除外される。例として、組み込まれる資料のいずれかに関連する用語の説明、定義、及び/または用法と、本文書に関連するものとの間に不一致または矛盾がある場合、本文書における用語の説明、定義、及び/または用法が優先するものとする。
最後に、本明細書で開示した本出願の実施形態は、本出願の実施形態の原理の例示であることを理解されたい。使用できる他の修正は、本出願の範囲内とすることができる。よって、限定ではなく例として、本出願の実施形態の代替的な構成を本明細書の教示に従って利用することができる。したがって、本出願の実施形態は、図示及び説明した正確なものに限定されない。
参考文献
Figure 2022188295000002

Claims (17)

  1. ディスプレイと、
    マイクロフォンと、
    前記ディスプレイの前の画像をキャプチャするように配置され、ビデオデータを出力するように構成されたカメラと、
    ユーザインターフェースと、
    ユーザのメンタルヘルスを評価する方法を実行するための命令が記憶された機械実行可能コードを含む機械可読媒体を含むメモリと、
    1つまたは複数のプロセッサを含む、前記メモリに結合された制御システムであって、前記機械実行可能コードを実行して、前記制御システムに、
    テストアプリケーションを実行すること
    を行わせるように構成されている、前記制御システムと、
    を備え、
    前記テストアプリケーションは、機械可読コードを含み、前記機械可読コードは、実行されたときに、
    前記カメラによって記録されたライブビデオデータを前記ディスプレイに表示することと、
    前記カメラによってテストビデオデータのセットを記録することと、
    前記マイクロフォンによってテストオーディオデータのセットを記録することと、
    前記テストビデオデータの複数のピクセルを前記ユーザの顔に割り当てるために、前記テストビデオデータを処理することと、
    前記ユーザの顔の表情を含むビデオ特徴を出力するために、前記複数のピクセルを処理することと、
    前記ユーザの声を表す音を識別し、かつ、前記ユーザの声のトーンを含むオーディオ特徴を出力するために、前記テストオーディオデータを処理することと、
    機械学習モデルを使用して、前記オーディオ特徴及び前記ビデオ特徴を処理することと、
    前記ユーザが複数のメンタルヘルス障害の少なくとも1つを有するか否かの表示を出力することと、
    を実行し、
    前記機械学習モデルは決定木を含み、前記機械学習モデルは、複数の個人から記録されたオーディオデータ及びビデオデータを含みかつ前記複数の個人のそれぞれが前記複数のメンタルヘルス障害の1つを有するか否かを示すラベルを有するトレーニングデータのセットによって、事前にトレーニングされたものである、
    患者のメンタルヘルスをスクリーニングするためのシステム。
  2. 前記マイクロフォンによって記録することが、
    前記ユーザが話していると前記制御システムによって判定すると、前記記録を開始すること
    をさらに含む、請求項1に記載のシステム。
  3. 前記制御システムが、
    前記テストビデオデータのセットと前記テストオーディオデータのセットとを受け取ることと、
    複数のビデオセグメントを識別するために、前記受け取ったテストビデオデータのセットを前処理することであって、各ビデオセグメントが、一連の質問の中の1つの質問に対応し、かつ時間ウィンドウを含む、前記前処理することと、
    複数のオーディオセグメントを識別するために、前記受け取ったテストオーディオデータのセットを前処理することであって、各オーディオセグメントが、前記一連の質問の中の1つの質問に対応し、かつ時間ウィンドウを含む、前記前処理することと、
    を行うようにさらに構成されている、請求項1に記載のシステム。
  4. 前記制御システムが、
    重複する時間ウィンドウを識別するために、前記複数のオーディオセグメント及び前記複数のビデオセグメントを前処理することと、
    前記識別された重複する時間ウィンドウに基づいて、統合されたオーディオセグメント及びビデオセグメントのセットを出力することと、
    を行うようにさらに構成されている、請求項3に記載のシステム。
  5. ディスプレイと、
    マイクロフォンと、
    前記ディスプレイの前の画像をキャプチャし、ビデオデータを出力するように構成されたカメラと、
    ユーザインターフェースと、
    方法を実行するための命令が記憶された機械実行可能コードを含む機械可読媒体を含むメモリと、
    1つまたは複数のプロセッサを含む、前記メモリに結合された制御システムであって、前記機械実行可能コードを実行して、前記制御システムに、
    テストを開始する指示を前記ユーザインターフェースを介して受け取り、前記テストを停止する指示を受け取るまでテストアプリケーションを実行すること、
    を行わせるように構成されている、前記制御システムと、
    を備え、
    前記テストアプリケーションが、
    前記ユーザが読むために前記ディスプレイにテキストを表示することと、
    前記テスト中にテストビデオデータのセットを前記カメラによって記録することと、
    前記カメラによって記録されたライブビデオデータを表示するウィンドウを前記ディスプレイに表示することと、
    前記テスト中に、
    前記ユーザの顔を識別する、
    前記顔の複数のピクセルの全てがフレーム内にあるか否かを判定する、及び
    前記顔が前記フレームの外側にある場合に前記テストを停止する
    ために、前記テストビデオデータのセットを継続的に処理することと、
    前記テスト中にテストオーディオデータのセットを前記マイクロフォンによって記録することと、
    前記ユーザの声のトーンを含むオーディオ特徴及び前記ユーザの顔の表情を含むビデオ特徴を識別するために、前記テストオーディオデータのセット及び前記テストビデオデータのセットを処理することと、
    機械学習モデルを使用して、前記オーディオ特徴及び前記ビデオ特徴を処理することと、
    前記ユーザがメンタルヘルス障害を有すると分類されるか否かに関する、前記ユーザのメンタルヘルス表示を出力することと、
    を含み、
    前記機械学習モデルは、複数の個人から記録されたオーディオデータ及びビデオデータを含みかつ前記複数の個人のそれぞれが複数のメンタルヘルス障害の1つを有するか否かを示すラベルを有するトレーニングデータのセットによって、事前にトレーニングされたものである、
    患者のメンタルヘルスをスクリーニングするためのシステム。
  6. 前記表示されたテキストが、各質問についてのテキスト及び回答を含むメンタルヘルス質問票からの一連の質問を含む、請求項5に記載のシステム。
  7. 前記オーディオ特徴及びビデオ特徴のそれぞれが、前記一連の質問の中の質問に対応する、請求項6に記載のシステム。
  8. 前記テストオーディオデータのセット及び前記テストビデオデータのセットを処理することが、
    重複する時間ウィンドウを識別するために、前記テストオーディオデータ及び前記テストビデオデータのセットを前処理することと、
    前記識別された重複する時間ウィンドウに基づいて、統合されたオーディオセグメント及びビデオセグメントのセットを出力することと、
    前記ユーザのメンタルヘルス状態を特定するために、前記統合されたオーディオセグメント及びビデオセグメントのセットを機械学習モデルによって処理することと、
    をさらに含む、請求項5に記載のシステム。
  9. 前記機械学習モデルが、一般化線形モデル、回帰モデル、ロジスティック回帰モデル、及び教師あり機械学習分類モデルのうちの少なくともの1つである、請求項8に記載のシステム。
  10. 方法を実行するための命令が記憶された機械実行可能コードを含む機械可読媒体を含むメモリと、
    1つまたは複数のプロセッサを含む、前記メモリに結合された制御システムであって、前記機械実行可能コードを実行して、前記制御システムに
    前記ユーザがテキストを読んでいる間の前記ユーザの顔を表す、テストビデオデータのセットを受け取ることと、
    前記ユーザの顔の表情のセットを含むビデオ特徴のセットを出力するために、前記テストビデオデータのセットを処理することであって、前記ビデオデータの複数のピクセルを前記ユーザの顔に割り当てることを含む、処理することと、
    前記ユーザがテキストを読んでいる間の前記ユーザの声を表す、テストオーディオデータのセットを受け取ることと、
    前記ユーザの声のトーンを含むオーディオ特徴のセットを出力するために、前記オーディオデータのセットを処理することであって、前記ユーザの声を表す音を識別することを含む、処理することと、
    メンタルヘルス障害に関する前記ユーザのメンタルヘルスの表示を出力するために、機械学習モデルを使用して、前記ビデオ特徴のセット、及び前記オーディオ特徴のセットを処理することと、
    前記ユーザがメンタルヘルス障害を有するか否かの表示を出力すること
    を行わせるように構成されている、前記制御システムと、
    を備える、
    患者のメンタルヘルスをスクリーニングするためのシステムであって、
    前記機械学習モデルは、一般化線形モデル、回帰モデル、ロジスティック回帰モデル、及び教師あり機械学習分類モデルのうちの少なくとも1つであり、前記機械学習モデルは、複数の個人から記録されたオーディオデータ及びビデオデータを含みかつ前記複数の個人のそれぞれが複数のメンタルヘルス障害の1つを有するか否かを示すラベルを有するトレーニングデータのセットによって、事前にトレーニングされたものである、
    前記システム。
  11. プロセッサ実行可能命令またはデータの少なくとも1つを記憶する少なくとも1つの非一時的プロセッサ可読記憶媒体と、
    前記少なくとも1つの非一時的プロセッサ可読記憶媒体に通信可能に結合された少なくとも1つのプロセッサと、
    を備え、
    動作において、前記少なくとも1つのプロセッサが、
    ユーザがデジタルディスプレイからのテキストを読んでいる間に記録されたビデオデータ及びオーディオデータであって、前記ビデオデータが、前記ユーザの顔を含む前記ビデオデータの部分の第1のセットを識別するように処理され、前記オーディオデータが、前記ユーザの声を表す音を含む部分の第2のセットを識別するように処理される、前記ビデオデータ及び前記オーディオデータを、受け取ることと、
    前記部分の第1のセットに由来する前記ユーザの顔の表情に関する第1の特徴のセット及び前記部分の第2のセットからの前記ユーザの声のトーンに関する第2の特徴のセットを含む、複数の特徴を出力するために、前記オーディオデータ、及び前記ビデオデータを処理することと、
    前記ユーザがメンタルヘルス障害を有するか否かの表示を出力するために、前記第1の特徴のセット及び前記第2の特徴のセットを機械学習モデルで処理することと、
    を行うように構成されている、
    機械学習トレーニングシステムであって、
    前記機械学習モデルは、複数の個人からのラベル付きオーディオデータ及びビデオデータであって、メンタルヘルス質問票に対する返答に基いて前記複数の個人がメンタルヘルス障害を有するか否かを示すラベルを有する前記ラベル付きオーディオデータ及びビデオデータによって、事前にトレーニングされた、一般化線系モデルを含む、
    前記機械学習トレーニングシステム。
  12. 前記ラベル付きトレーニングデータが、機能的測定データまたは生理学的測定データの少なくとも1つをさらに含む、請求項11に記載の機械学習システム。
  13. 前記機械学習モデルが、
    複数の個人のそれぞれが1つ又は複数のメンタルヘルス障害を有するか否かを示す、前記複数の個人についてのラベル付きトレーニングデータを受け取ることであって、前記ラベル付きトレーニングデータが、
    トレーニングテスト中に記録した前記複数の個人のそれぞれについて記録されたオーディオデータ及びビデオデータ
    を含む、前記受け取ることと、
    前記ラベル付きトレーニングデータから複数の特徴を決定することと、
    前記複数の特徴に基づいて、教師あり様式で初期機械学習モデルをトレーニングすることと、
    前記初期機械学習モデルの前記トレーニングに基づいて、前記複数の特徴のそれぞれについて重要性尺度を抽出することと、
    前記複数の特徴についての前記抽出された重要性尺度に基づいて、複数のサブセット機械学習モデルを生成することと、
    前記生成された複数のサブセット機械学習モデルの分類性能を評価することと、
    前記サブセット機械学習モデルの少なくとも1つを前記機械学習モデルとして選択することと、
    によって生成される、請求項11に記載の機械学習システム。
  14. 前記選択されたサブセット機械学習モデルが、前記複数の特徴の一部分を含み、前記部分が、閾値を上回る重要性尺度を有する特徴から選択される、請求項13に記載の機械学習システム。
  15. 前記複数の特徴のうちの少なくとも20個の特徴が、閾値を上回る重要性尺度を有し、前記複数の特徴の前記部分が少なくとも10個の特徴及び20個未満の特徴を含む、請求項14に記載の機械学習システム。
  16. 前記サブセット機械学習モデルのそれぞれが、前記複数の特徴の前記部分の、異なる選択を含む、請求項14に記載の機械学習システム。
  17. 前記初期機械学習モデルをトレーニングすることが、ロジスティック回帰を用いたk分割交差検証を使用することをさらに含む、請求項13に記載の機械学習システム。
JP2022168741A 2018-05-01 2022-10-21 機械学習ベースの診断分類器 Pending JP2022188295A (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201862665243P 2018-05-01 2018-05-01
US62/665,243 2018-05-01
PCT/US2019/030149 WO2019213221A1 (en) 2018-05-01 2019-05-01 Machine learning-based diagnostic classifier
JP2020561043A JP7165207B2 (ja) 2018-05-01 2019-05-01 機械学習ベースの診断分類器

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2020561043A Division JP7165207B2 (ja) 2018-05-01 2019-05-01 機械学習ベースの診断分類器

Publications (1)

Publication Number Publication Date
JP2022188295A true JP2022188295A (ja) 2022-12-20

Family

ID=68385492

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2020561043A Active JP7165207B2 (ja) 2018-05-01 2019-05-01 機械学習ベースの診断分類器
JP2022168741A Pending JP2022188295A (ja) 2018-05-01 2022-10-21 機械学習ベースの診断分類器

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2020561043A Active JP7165207B2 (ja) 2018-05-01 2019-05-01 機械学習ベースの診断分類器

Country Status (5)

Country Link
US (5) US11715564B2 (ja)
EP (1) EP3787481B1 (ja)
JP (2) JP7165207B2 (ja)
CA (1) CA3098131A1 (ja)
WO (1) WO2019213221A1 (ja)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3787481B1 (en) 2018-05-01 2023-08-23 Neumora Therapeutics, Inc. Machine learning-based diagnostic classifier
US20190385711A1 (en) 2018-06-19 2019-12-19 Ellipsis Health, Inc. Systems and methods for mental health assessment
EP3811245A4 (en) 2018-06-19 2022-03-09 Ellipsis Health, Inc. MENTAL HEALTH ASSESSMENT SYSTEMS AND METHODS
US11103171B2 (en) 2018-10-23 2021-08-31 BlackThor Therapeutics, Ine. Systems and methods for screening, diagnosing, and stratifying patients
EP3921850A1 (en) * 2019-02-06 2021-12-15 AIC Innovations Group, Inc. Biomarker identification
US20220189181A1 (en) * 2019-02-25 2022-06-16 Koninklijke Philips N.V. Determining a relative cognitive capability of a subject
AU2020248351A1 (en) * 2019-03-22 2021-11-11 Cognoa, Inc. Personalized digital therapy methods and devices
US20210183481A1 (en) 2019-12-17 2021-06-17 Mahana Therapeutics, Inc. Method and system for remotely monitoring the psychological state of an application user based on average user interaction data
US11562828B2 (en) 2019-12-26 2023-01-24 Kpn Innovations, Llc. Methods and systems for customizing treatments
US11687778B2 (en) 2020-01-06 2023-06-27 The Research Foundation For The State University Of New York Fakecatcher: detection of synthetic portrait videos using biological signals
CA3174390A1 (en) * 2020-04-03 2021-10-07 Aifred Health Systems and methods for treatment selection
US11726784B2 (en) 2020-04-09 2023-08-15 Micron Technology, Inc. Patient monitoring using edge servers having deep learning accelerator and random access memory
US11388365B2 (en) * 2020-06-30 2022-07-12 Microsoft Technology Licensing, Llc Video profile creation system
US20220044108A1 (en) * 2020-08-06 2022-02-10 Micron Technology, Inc. Real time medical image processing using deep learning accelerator with integrated random access memory
US20230363679A1 (en) * 2020-09-17 2023-11-16 The Penn State Research Foundation Systems and methods for assisting with stroke and other neurological condition diagnosis using multimodal deep learning
CN112185558A (zh) * 2020-09-22 2021-01-05 珠海中科先进技术研究院有限公司 基于深度学习的心理健康及康复评定方法、装置及介质
CN112231477B (zh) * 2020-10-20 2023-09-22 淮阴工学院 一种基于改进胶囊网络的文本分类方法
KR102513645B1 (ko) * 2021-01-05 2023-03-27 주식회사 제네시스랩 기계학습모델을 이용하여 우울증예비진단정보를 제공하는 방법, 시스템 및 컴퓨터-판독가능 매체
US20220300993A1 (en) * 2021-03-18 2022-09-22 Jio Platforms Limited System and method for conducting a survey by a survey bot
US20220310215A1 (en) * 2021-03-29 2022-09-29 Bend Health, Inc. Mental health platform
KR102518690B1 (ko) * 2021-08-26 2023-04-05 한국로봇융합연구원 학습 모델 기반의 발달 장애 조기 선별을 위한 데이터를 정제하기 위한 장치 및 이를 위한 방법
US20230063441A1 (en) * 2021-09-01 2023-03-02 Emed Labs, Llc Image processing and presentation techniques for enhanced proctoring sessions
WO2023049354A1 (en) * 2021-09-23 2023-03-30 Behavidence Inc. System and method of monitoring mental health conditions
GB202116425D0 (en) * 2021-11-15 2021-12-29 Limbic Ltd User triage diagnosis method and system
CN114224288B (zh) * 2021-12-13 2023-10-31 中国人民解放军军事科学院军事医学研究院 检测癫痫脑电信号的微型胶囊神经网络训练方法及设备
KR102454737B1 (ko) * 2021-12-17 2022-10-19 주식회사 하이 심리 상태 분류 서버, 단말기, 심리 상태 분류 방법, 및 심리 상태 분류 서비스를 제공하는 방법
CN114564990B (zh) * 2022-02-28 2024-02-20 合肥工业大学 一种基于多通道反馈胶囊网络的脑电信号分类方法
WO2023178437A1 (en) * 2022-03-25 2023-09-28 Nuralogix Corporation System and method for contactless predictions of vital signs, health risks, cardiovascular disease risk and hydration from raw videos
US20230317246A1 (en) * 2022-04-01 2023-10-05 BeMe Health, Inc. System and method for facilitating mental health assessment and enhancing mental health via facial recognition

Family Cites Families (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5660176A (en) 1993-12-29 1997-08-26 First Opinion Corporation Computerized medical diagnostic and treatment advice system
AU2003204909B2 (en) 2002-06-28 2005-06-23 Pathfinder Psychological Consultancy Pty Ltd Computer-aided system and method for self-assessment and personalised mental health consultation
US8064662B2 (en) 2006-07-17 2011-11-22 Siemens Medical Solutions Usa, Inc. Sparse collaborative computer aided diagnosis
WO2009103156A1 (en) 2008-02-20 2009-08-27 Mcmaster University Expert system for determining patient treatment response
US20090307179A1 (en) 2008-03-19 2009-12-10 Brandon Colby Genetic analysis
US11562323B2 (en) * 2009-10-01 2023-01-24 DecisionQ Corporation Application of bayesian networks to patient screening and treatment
WO2011047358A1 (en) 2009-10-15 2011-04-21 Crescendo Bioscience Biomarkers and methods for measuring and monitoring inflammatory disease activity
US20130245396A1 (en) * 2010-06-07 2013-09-19 Affectiva, Inc. Mental state analysis using wearable-camera devices
WO2013006704A1 (en) 2011-07-05 2013-01-10 Hunt Robert Don Systems and methods for clinical evaluation of psychiatric disorders
NZ624695A (en) 2011-10-24 2016-03-31 Harvard College Enhancing diagnosis of disorder through artificial intelligence and mobile health technologies without compromising accuracy
US20130337420A1 (en) * 2012-06-19 2013-12-19 International Business Machines Corporation Recognition and Feedback of Facial and Vocal Emotions
US10102341B2 (en) 2012-08-16 2018-10-16 Ginger.io, Inc. Method for managing patient quality of life
US10068060B2 (en) * 2012-08-16 2018-09-04 Ginger.io, Inc. Method for modeling behavior and psychotic disorders
CN103903074B (zh) * 2012-12-24 2018-10-30 华为技术有限公司 一种视频交流的信息处理方法及装置
US9579457B2 (en) 2013-03-15 2017-02-28 Flint Hills Scientific, L.L.C. Method, apparatus and system for automatic treatment of pain
EP3000088A4 (en) 2013-05-23 2018-06-27 Iphenotype LLC Method and system for maintaining or improving wellness
US9626493B2 (en) * 2013-06-08 2017-04-18 Microsoft Technology Licensing, Llc Continuous digital content protection
WO2015018517A1 (en) * 2013-08-05 2015-02-12 Mr. PD Dr. NIKOLAOS KOUTSOULERIS Adaptive pattern recognition for psychosis risk modelling
US10874340B2 (en) * 2014-07-24 2020-12-29 Sackett Solutions & Innovations, LLC Real time biometric recording, information analytics and monitoring systems for behavioral health management
WO2016028495A1 (en) 2014-08-22 2016-02-25 Sri International Systems for speech-based assessment of a patient's state-of-mind
EP3229684B1 (en) 2014-12-08 2020-04-01 Rutgers, The State University of New Jersey Methods for measuring physiologically relevant motion
US10176163B2 (en) * 2014-12-19 2019-01-08 International Business Machines Corporation Diagnosing autism spectrum disorder using natural language processing
US20160224763A1 (en) 2015-01-18 2016-08-04 Discharge IQ, Inc. Method and system for remote patient monitoring, communications and notifications to reduce readmissions
CN104657929A (zh) 2015-02-25 2015-05-27 潘晓东 基于多媒体的认知心理健康状况并行测试的方法及系统
WO2017003547A1 (en) 2015-06-30 2017-01-05 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Method and system for a mobile health platform
US20170018007A1 (en) 2015-07-15 2017-01-19 Edmond Defrank Integrated mobile device management system
WO2017106770A1 (en) 2015-12-18 2017-06-22 Cognoa, Inc. Platform and system for digital personalized medicine
JP6590689B2 (ja) 2015-12-25 2019-10-16 キヤノン株式会社 検査システム、携帯情報端末および検査方法
US20170262609A1 (en) 2016-03-08 2017-09-14 Lyra Health, Inc. Personalized adaptive risk assessment service
WO2017210502A1 (en) 2016-06-03 2017-12-07 Yale University Methods and apparatus for predicting depression treatment outcomes
JP2018015327A (ja) 2016-07-28 2018-02-01 株式会社リコー 診断装置、診断方法、プログラム
DE112017004740T5 (de) * 2016-09-21 2019-09-05 Trayt Inc. Plattform zur bewertung und behandlung von individuen durch die beschaffung von informationen von gruppen von ressourcen
WO2018074996A1 (en) 2016-10-17 2018-04-26 Morehouse School Of Medicine Mental health assessment method and kiosk-based system for implementation
WO2018090009A1 (en) * 2016-11-14 2018-05-17 Cognoa, Inc. Methods and apparatus for evaluating developmental conditions and providing control over coverage and reliability
WO2018148365A1 (en) * 2017-02-09 2018-08-16 Cognoa, Inc. Platform and system for digital personalized medicine
BR112019019157A2 (pt) 2017-03-17 2020-04-14 Blackthorn Therapeutics Inc antagonistas de receptor de capa-opiode e produtos e métodos relacionados aos mesmos
US20180342329A1 (en) * 2017-05-24 2018-11-29 Happie Home, Inc. Happie home system
EP3692547B1 (en) 2017-10-02 2024-01-03 Neumora Therapeutics, Inc. Methods and tools for detecting a neurobehavioral phenotype in a subject
JP2020537579A (ja) * 2017-10-17 2020-12-24 ラオ、サティシュ 神経障害を識別及び監視するための機械学習ベースのシステム
US20190117143A1 (en) * 2017-10-23 2019-04-25 Massachusetts Institute Of Technology Methods and Apparatus for Assessing Depression
US10789456B2 (en) * 2017-12-28 2020-09-29 Adobe Inc. Facial expression recognition utilizing unsupervised learning
US10375187B1 (en) * 2018-01-23 2019-08-06 Todd Jeremy Marlin Suicide and alarming behavior alert/prevention system
US20190239791A1 (en) * 2018-02-05 2019-08-08 Panasonic Intellectual Property Management Co., Ltd. System and method to evaluate and predict mental condition
EP3787481B1 (en) 2018-05-01 2023-08-23 Neumora Therapeutics, Inc. Machine learning-based diagnostic classifier
US20190385711A1 (en) 2018-06-19 2019-12-19 Ellipsis Health, Inc. Systems and methods for mental health assessment
WO2020047253A1 (en) 2018-08-31 2020-03-05 Blackthorn Therapeutics, Inc. Multimodal biomarkers predictive of transdiagnostic symptom severity
EP3844780A4 (en) 2018-08-31 2022-06-22 Blackthorn Therapeutics, Inc. SYSTEM AND METHODS FOR IDENTIFICATION OF DIAGNOSTIC FEATURES IN MENTAL HEALTH DISORDERS

Also Published As

Publication number Publication date
US11715564B2 (en) 2023-08-01
US11676732B2 (en) 2023-06-13
EP3787481A1 (en) 2021-03-10
JP2021523441A (ja) 2021-09-02
CA3098131A1 (en) 2019-11-07
US20190341152A1 (en) 2019-11-07
US20190355474A1 (en) 2019-11-21
JP7165207B2 (ja) 2022-11-02
US20230343463A1 (en) 2023-10-26
WO2019213221A1 (en) 2019-11-07
EP3787481B1 (en) 2023-08-23
US11139083B2 (en) 2021-10-05
US20210398685A1 (en) 2021-12-23
US20230343461A1 (en) 2023-10-26
EP3787481A4 (en) 2022-01-12

Similar Documents

Publication Publication Date Title
JP7165207B2 (ja) 機械学習ベースの診断分類器
CN108780663B (zh) 数字个性化医学平台和系统
US20220392637A1 (en) Multimodal dynamic attention fusion
US10918331B2 (en) Method and apparatus for determining health status
JP2022505676A (ja) 患者のスクリーニング、診断、及び層別化のためのシステム及び方法
JP7311637B2 (ja) 認知トレーニング及び監視のためのシステム及び方法
Javed et al. Artificial intelligence for cognitive health assessment: State-of-the-art, open challenges and future directions
WO2022232382A1 (en) Multi-modal input processing
Derbali et al. Autism spectrum disorder detection: Video games based facial expression diagnosis using deep learning
JP2022548966A (ja) 行動障害、発達遅延、および神経学的障害の効率的な診断
CA3157380A1 (en) Systems and methods for cognitive diagnostics for neurological disorders: parkinson's disease and comorbid depression
US11972336B2 (en) Machine learning platform and system for data analysis
KR20210142921A (ko) 안면 표정 인식을 이용한 기분장애 진단을 위한 정보 제공 방법
US20230411008A1 (en) Artificial intelligence and machine learning techniques using input from mobile computing devices to diagnose medical issues
US20220230755A1 (en) Systems and Methods for Cognitive Diagnostics for Neurological Disorders: Parkinson's Disease and Comorbid Depression
Kumar et al. Automatic Grading System of Parkinson's Disease using Smart App for Remote Monitoring System
US20210319893A1 (en) Avatar assisted telemedicine platform systems, methods for providing said systems, and methods for providing telemedicine services over said systems
Fadhel Expect the Behavior of Autism Spectrum Disorder at children Using Deep learning
Du et al. GAME: Generalized deep learning model towards multimodal data integration for early screening of adolescent mental disorders
Irfan et al. Machine learning in neurological disorders: A multivariate LSTM and AdaBoost approach to Alzheimer's disease time series analysis
Kyriazakos et al. The Role of Big Data and Artificial Intelligence in Clinical Research and Digital

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221118

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221118

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20230817

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240130

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20240216