JP2022188295A

JP2022188295A - 機械学習ベースの診断分類器

Info

Publication number: JP2022188295A
Application number: JP2022168741A
Authority: JP
Inventors: モニカシャルマメレム; Sharma Mellem Monika; ユールリュー; yuelu Liu; ペルベズアハマド; Ahammad Parvez; カベサスウンベルトアンドレスゴンザレス; Andres Gonzalez Cabezas Humberto; ウィリアムジェイ．マーティン; J Martin William; パブロクリスチャンゲルズベルグ; Christian Gersberg Pablo
Original assignee: Blackthorn Therapeutics Inc
Current assignee: Neumora Therapeutics Inc
Priority date: 2018-05-01
Filing date: 2022-10-21
Publication date: 2022-12-20
Also published as: US11715564B2; US11676732B2; EP3787481A1; JP2021523441A; CA3098131A1; US20190341152A1; US20190355474A1; JP7165207B2; US20230343463A1; WO2019213221A1; EP3787481B1; US11139083B2; US20210398685A1; US20230343461A1; EP3787481A4

Abstract

【課題】患者のメンタルヘルスをスクリーニングするためのシステム及び方法を提供する。【解決手段】複数の質問（たとえば、１７個の質問）を含む単一の診断横断的な質問票を使用して複数の異なるメンタルヘルス障害を同時に診断するように動作する診断横断的分類器を生成するための、機械学習を利用するシステム及び方法。機械学習技法を使用して、トレーニングデータを処理することによって、診断横断的な項目レベルの質問を特徴として含む統計モデルを構築して、対象のグループを健康またはメンタルヘルス障害の可能性があるものとして分類するスクリーニングを作成する。複数の自己記入式のメンタルヘルス質問票から質問のサブセットを選択及び使用して、短時間で、任意で遠隔及び反復的に、医師の関与なしに、複数のメンタルヘルス障害にわたって対象を自律的にスクリーニングする。【選択図】図１

Description

関連出願の相互参照
本出願は米国特許法第１１９条の下で、２０１８年５月１日に出願され「ＭａｃｈｉｎｅＬｅａｒｎｉｎｇ－ＢａｓｅｄＤｉａｇｎｏｓｔｉｃＣｌａｓｓｉｆｉｅｒ」と題された米国仮出願第６２／６６５，２４３号の優先権を主張し、その内容全体が参照により本明細書に組み込まれている。

分野
本開示は概して医療診断ツールに関し、より詳細には、機械学習ベースのメンタルヘルス診断ツールのためのシステム及び方法に関する。

背景
メンタルヘルスのスクリーニング及び診断には、クリニック内で患者と高度なトレーニングを受けた専門家との間で時間のかかる面談を行う必要がある。現在利用可能な遠隔で実施される自己評価は個別の診断カテゴリに基づく傾向があり、これは、介入を必要とする診断横断的なまたは無症状の行動変化を明らかにすることができない場合がある。

概要
本開示の様々な例は、患者のメンタルヘルスをスクリーニングするためのシステム及び方法を対象とする。第１の実施形態では、例示的なシステムは、ディスプレイ、マイクロフォン、カメラ、メモリ、及び制御システムを含む。カメラは、ディスプレイの前の画像をキャプチャするように配置され、ビデオデータを出力するように構成される。メモリは、機械実行可能コードを含む機械可読媒体を含み、ユーザのメンタルヘルスを評価する方法を実行するための命令が記憶されている。制御システムは、メモリに結合され、１つまたは複数のプロセッサを含み、機械実行可能コードを実行する。これは、制御システムに、次の一連のステップを実行させる。

制御システムは、テストを開始する指示をユーザインターフェースから受け取ると、テストアプリケーションを実行する。制御システムは、テストを停止する指示を受け取ると、テストアプリケーションを終了する。テストアプリケーションは、（１）各質問のテキスト及び回答を含むメンタルヘルス質問票からの一連の質問をディスプレイに表示することと、（２）カメラによって記録されたライブビデオデータをディスプレイに表示することと、（３）カメラによってテストビデオデータのセットを記録することと、（４）マイクロフォンによってテストオーディオデータのセットを記録することと、（５）一連の質問のそれぞれに対する回答をユーザインターフェースを介して受け取って、回答の選択を生成することと、（６）機械学習モデルを使用して、回答の選択、テストビデオデータのセット、及びオーディオデータのセットを処理することによって、ユーザのメンタルヘルス表示を出力することと、を含む。

一部の例では、テストアプリケーションを停止する指示は、制御システムによる、カメラによってキャプチャされる画像内にユーザの顔がないという判定である。

一部の例では、マイクロフォンによって記録することは、制御システムによって、ユーザが話していると判定すると、記録を開始することを含む。

一部の例では、制御システムは、追加のステップを実行するように構成され、これは、テストビデオデータのセットとテストオーディオデータのセットとを受け取ることを含む。受け取ったテストビデオデータのセットは前処理されて、複数のビデオセグメントが識別され、各ビデオセグメントは、一連の質問の中の１つの質問に対応し、時間ウィンドウを含む。受け取ったテストオーディオデータのセットは前処理されて、複数のオーディオセグメントが識別され、各オーディオセグメントは、一連の質問の中の１つの質問に対応し、時間ウィンドウを含む。

一部の例では、複数のオーディオセグメント及び複数のビデオセグメントは前処理されて、重複する時間ウィンドウが識別される。制御システムは、識別された重複する時間ウィンドウに基づいて、統合されたオーディオ及びビデオセグメントのセットを出力する。

一部の例では、機械学習モデルは、一般化線形モデル、回帰モデル、ロジスティック回帰モデル、及び／または教師あり機械学習分類モデルのうちのいずれかである。

一部の例では、機械学習モデルは、一連のステップを実行することによって生成される一般化線形モデルである。これらのステップは、複数の個人についてのラベル付きトレーニングデータを受け取ることを実施する。ラベル付きトレーニングデータは、（１）複数の個人のそれぞれが１つまたは複数のメンタルヘルス障害を有するか否かの表示と、（２）トレーニングテスト中に記録した複数の個人のそれぞれについて記録されたオーディオ及びビデオデータと、（３）複数の個人のそれぞれからの質問票への回答の選択と、を含む。次いで、これらのステップは、ラベル付きトレーニングデータから複数の特徴を決定することと、複数の特徴に基づいて、教師あり様式で初期機械学習モデルをトレーニングすることと、を実施する。次いで、これらのステップは、初期機械学習モデルのトレーニングに基づいて、複数の特徴のそれぞれについて重要性尺度を抽出することを実施する。次いで、複数の特徴についての抽出された重要性尺度に基づいて、複数のサブセット機械学習モデルが生成される。次いで、生成された複数のサブセット機械学習モデルの分類性能が評価され、評価に基づいて、サブセット機械学習モデルの少なくとも１つが一般化線形モデルとして選択される。

一部の例では、メンタルヘルス表示は、ユーザが複数のメンタルヘルス障害のうちの１つを有する可能性を特定し、複数のメンタルヘルス障害は、神経精神障害、統合失調症、及び／または双極性障害を含む。一部の例では、メンタルヘルス表示は、ユーザが患者であるか健常対照であるかを識別する。

本開示の第２の実施形態は、ディスプレイ、マイクロフォン、カメラ、メモリ、及び制御システムを含むシステムを提供する。カメラは、ディスプレイの前の画像をキャプチャするように配置され、ビデオデータを出力するように構成される。メモリは、機械実行可能コードを含む機械可読媒体を含み、ユーザのメンタルヘルスを評価する方法を実行するための命令が記憶されている。制御システムは、メモリに結合され、１つまたは複数のプロセッサを含み、機械実行可能コードを実行する。これは、制御システムに、次の一連のステップを実行させる。

制御システムは、テストを開始する指示をユーザインターフェースから受け取ると、テストアプリケーションを実行する。制御システムは、テストを停止する指示を受け取ると、テストアプリケーションを終了する。テストアプリケーションは、（１）ユーザが読むためにディスプレイにテキストを表示することと、（２）カメラによってテスト中にテストビデオデータのセットを記録することと、（３）カメラによって記録されたライブビデオデータを表示するウィンドウをディスプレイに表示することと、（４）テスト中にテストビデオデータのセットを継続的に処理することと、（５）マイクロフォンによってテスト中にテストオーディオデータのセットを記録することと、（６）テストオーディオデータのセット及びテストビデオデータのセットを処理して、オーディオ及びビデオ特徴を識別し、オーディオ及びビデオ特徴をメモリに記憶することと、を実施する。継続的に処理するステップは、ユーザの顔を識別することと、顔の複数のピクセルの全てがフレーム内にあるか否かを判定することと、を実施する。顔がフレームの外側にある場合、処理するステップは、テストの停止を提供する。

一部の例では、表示されたテキストは、各質問についてのテキスト及び回答を含むメンタルヘルス質問票からの一連の質問を含む。

一部の例では、オーディオ及びビデオ特徴のそれぞれは、一連の質問の中の質問に対応する。

第２の実施形態の追加の例は、第１の実施形態に関して提供される。

本開示の第３の実施形態は、患者のメンタルヘルスをスクリーニングするためのシステムを提供し、このシステムは、メモリ及び制御システムを含む。メモリは、機械実行可能コードを含む機械可読媒体を含み、ユーザのメンタルヘルスを評価する方法を実行するための命令が記憶されている。制御システムは、メモリに結合され、１つまたは複数のプロセッサを含み、機械実行可能コードを実行する。これにより、制御システムは、（１）メンタルヘルス質問票からの一連の質問に対するユーザからの回答を表す回答データのセットを受け取ることと、（２）ユーザがテキストを読んでいる間のユーザの顔を表す、テスト中に記録されたテストビデオデータのセットを受け取ることと、（３）テストビデオデータのセットを処理して、ビデオ特徴のセットを出力することと、（４）ユーザがテキストを読んでいる間のユーザの声を表す、テスト中に記録されたテストオーディオデータのセットを受け取ることと、（５）オーディオデータのセットを処理して、オーディオ特徴のセットを出力することと、（６）機械学習モデルを使用して、回答データのセット、ビデオ特徴のセット、及びオーディオ特徴のセットを処理することによって、ユーザのメンタルヘルスの表示を出力することと、を行う。一部の例では、機械学習モデルは、一般化線形モデル、回帰モデル、ロジスティック回帰モデル、及び／または教師あり機械学習分類モデルのうちのいずれかである。第３の実施形態の追加の実施形態は、第１及び第２の実施形態に関して上記に提供した通りである。

本開示の第４の実施形態は、機械学習トレーニングシステムを提供する。このシステムは、少なくとも１つの非一時的プロセッサ可読記憶媒体と、少なくとも１つのプロセッサとを含む。記憶媒体は、プロセッサ実行可能命令またはデータの少なくとも１つを記憶する。プロセッサは、少なくとも１つの非一時的プロセッサ可読記憶媒体に通信可能に結合されている。動作において、少なくとも１つのプロセッサは、ラベル付きトレーニングデータを受け取るように構成される。トレーニングデータは、複数の個人のそれぞれが複数のメンタルヘルス障害のうちの１つまたは複数を有するか否かを示す複数の個人についてのデータを含む。トレーニングデータは、（１）メンタルヘルス質問票への回答と、（２）ビデオデータ及びオーディオデータと、を追加で含む。メンタルヘルス質問票は、複数の個人に対して実施された。ビデオデータ及びオーディオデータは、複数の個人のそれぞれがデジタルディスプレイからのテキストを読んでいる間に、記録された。ビデオデータは、個人の顔を含むビデオデータの部分を識別するように処理され、オーディオデータは、個人の声を表す音を識別するように処理される。プロセッサは、回答、オーディオデータ、及びビデオデータを処理して、複数の特徴を出力するようにさらに構成される。次いで、プロセッサは、受け取ったトレーニングデータに基づいて、教師あり様式で初期機械学習モデルをトレーニングする。次いで、プロセッサは、トレーニングされた初期機械学習モデルから複数の特徴のそれぞれについて重要性尺度を抽出する。次いで、プロセッサは、複数の特徴についての抽出された重要性尺度に基づいて、複数のサブセット機械学習モデルを生成する。次いで、プロセッサは、生成された複数のサブセット機械学習モデルの分類性能を評価する。次いで、プロセッサは、複数のサブセット機械学習モデルの少なくとも１つを診断分類器として選択する。次いで、プロセッサは、診断分類器の特徴を、スクリーニングツールとして後で使用するために、少なくとも１つの非一時的プロセッサ可読記憶媒体に記憶する。

一部の例では、選択されたサブセット機械学習モデルは、複数の特徴の一部分を含み、その部分は、閾値を上回る重要性尺度を有する特徴から選択される。

一部の例では、複数の特徴のうちの少なくとも２０個の特徴は、閾値を上回る重要性尺度を有し、前記部分は少なくとも１０個の特徴及び２０個未満の特徴を含む。

一部の例では、サブセット機械学習モデルのそれぞれは、複数の特徴の部分の、異なる選択を含む。

一部の例では、診断分類器は、個人を、健康であるか、または一般的なメンタルヘルスの問題を有すると識別するメンタルヘルス表示を出力する。

一部の例では、診断分類器は、個人を、健康であるか、または特定のメンタルヘルスの問題を有すると識別するメンタルヘルス表示を出力する。

一部の例では、診断分類器は、個人を、第１の特定のメンタルヘルス障害を有するか、または第２の特定のメンタルヘルス障害を有すると識別するメンタルヘルス表示を出力する。

一部の例では、診断分類器は、個人がメンタルヘルス障害を発症するリスクを特定するメンタルヘルス表示を出力する。

一部の例では、ラベル付きトレーニングデータは、複数の個人のうちの各個人について、個人が健康であるか否か、個人が一般的なメンタルヘルスの問題を有するか否か、個人が１つまたは複数の特定のメンタルヘルス障害を有するか否か、個人に一般的なメンタルヘルスの問題を発症するリスクがあるか否か、及び／または個人に１つまたは複数の特定のメンタルヘルス障害を発症するリスクがあるか否か、のうちの少なくとも１つの表示をさらに含む。

一部の例では、初期機械学習モデルをトレーニングすることは、ロジスティック回帰を用いたｋ分割交差検証を使用することを含む。

一部の例では、サブセット機械学習モデルのそれぞれは、複数の特徴の、異なる組み合わせを含む。

一部の例では、ラベル付きトレーニングデータは、機能的測定データまたは生理学的測定データの少なくとも１つを含む。

一部の例では、第４の実施形態は、診断分類器の特徴をスクリーニングツールとして使用して、治療反応をテストする少なくとも１つの臨床試験における中間結果またはエンドポイント結果の少なくとも１つを評価することを実施する。

[本発明1001]
ディスプレイと、
マイクロフォンと、
前記ディスプレイの前の画像をキャプチャするように配置され、ビデオデータを出力するように構成されたカメラと、
ユーザインターフェースと、
ユーザのメンタルヘルスを評価する方法を実行するための命令が記憶された機械実行可能コードを含む機械可読媒体を含むメモリと、
1つまたは複数のプロセッサを含む、前記メモリに結合された制御システムであって、前記機械実行可能コードを実行して、前記制御システムに、
テストを開始する指示を前記ユーザインターフェースから受け取ると、前記制御システムによってテストアプリケーションを実行することと、
前記制御システムによって、前記テストを停止する指示を受け取ると、前記テストアプリケーションを終了することと、
を行わせるように構成されている、前記制御システムと、
を備え、
前記テストアプリケーションが、
各質問のテキスト及び回答を含むメンタルヘルス質問票からの一連の質問を前記ディスプレイに表示することと、
前記カメラによって記録されたライブビデオデータを前記ディスプレイに表示することと、
前記カメラによってテストビデオデータのセットを記録することと、
前記マイクロフォンによってテストオーディオデータのセットを記録することと、
回答の選択を生成するために、前記一連の質問のそれぞれに対する回答を前記ユーザインターフェースを介して受け取ることと、
前記ユーザのメンタルヘルス表示を出力するために、機械学習モデルを使用して、前記回答の選択、前記テストビデオデータのセット、及び前記オーディオデータのセットを処理すること、
を含む、
患者のメンタルヘルスをスクリーニングするためのシステム。
[本発明1002]
前記テストアプリケーションを停止する前記指示が、
前記制御システムによる、前記カメラによってキャプチャされる画像内にユーザの顔がないという判定
を含む、本発明1001のシステム。
[本発明1003]
前記マイクロフォンによって記録することが、
前記ユーザが話していると前記制御システムによって判定すると、前記記録を開始すること
をさらに含む、本発明1001のシステム。
[本発明1004]
前記制御システムが、
前記テストビデオデータのセットと前記テストオーディオデータのセットとを受け取ることと、
複数のビデオセグメントを識別するために、前記受け取ったテストビデオデータのセットを前処理することであって、各ビデオセグメントが、前記一連の質問の中の1つの質問に対応し、かつ時間ウィンドウを含む、前記前処理することと、
複数のオーディオセグメントを識別するために、前記受け取ったテストオーディオデータのセットを前処理することであって、各オーディオセグメントが、前記一連の質問の中の1つの質問に対応し、かつ時間ウィンドウを含む、前記前処理することと、
を行うようにさらに構成されている、本発明1001のシステム。
[本発明1005]
前記制御システムが、
重複する時間ウィンドウを識別するために、前記複数のオーディオセグメント及び前記複数のビデオセグメントを前処理することと、
前記識別された重複する時間ウィンドウに基づいて、統合されたオーディオ及びビデオセグメントのセットを出力することと、
を行うようにさらに構成されている、本発明1004のシステム。
[本発明1006]
前記機械学習モデルが、一般化線形モデル、回帰モデル、ロジスティック回帰モデル、及び教師あり機械学習分類モデルのうちの少なくとも1つである、本発明1001のシステム。
[本発明1007]
前記機械学習モデルが一般化線形モデルを含み、
前記一般化線形モデルが、
複数の個人のそれぞれが1つまたは複数のメンタルヘルス障害を有するか否かを示す前記複数の個人についてのラベル付きトレーニングデータを受け取ることであって、前記ラベル付きトレーニングデータが、
トレーニングテスト中に記録した前記複数の個人のそれぞれについて記録されたオーディオ及びビデオデータと、
前記複数の個人のそれぞれからの前記質問票への回答の選択と、
を含む、前記受け取ることと、
前記ラベル付きトレーニングデータから複数の特徴を決定することと、
前記複数の特徴に基づいて、教師あり様式で初期機械学習モデルをトレーニングすることと、
前記初期機械学習モデルの前記トレーニングに基づいて、前記複数の特徴のそれぞれについて重要性尺度を抽出することと、
前記複数の特徴についての前記抽出された重要性尺度に基づいて、複数のサブセット機械学習モデルを生成することと、
前記生成された複数のサブセット機械学習モデルの分類性能を評価することと、
前記サブセット機械学習モデルの少なくとも1つを前記一般化線形モデルとして選択することと、
によって生成される、本発明1001のシステム。
[本発明1008]
前記メンタルヘルス表示が、前記ユーザが複数のメンタルヘルス障害のうちの1つを有する可能性を特定し、前記複数のメンタルヘルス障害が、神経精神障害、統合失調症、及び双極性障害を含む、本発明1001のシステム。
[本発明1009]
前記メンタルヘルス表示が、前記ユーザが患者であるか健常対照であるかを識別する、本発明1001のシステム。
[本発明1010]
ディスプレイと、
マイクロフォンと、
前記ディスプレイの前の画像をキャプチャし、ビデオデータを出力するように構成されたカメラと、
ユーザインターフェースと、
方法を実行するための命令が記憶された機械実行可能コードを含む機械可読媒体を含むメモリと、
1つまたは複数のプロセッサを含む、前記メモリに結合された制御システムであって、前記機械実行可能コードを実行して、前記制御システムに、
テストを開始する指示を前記ユーザインターフェースを介して受け取り、前記テストを停止する指示を受け取るまでテストアプリケーションを実行すること、
を行わせるように構成されている、前記制御システムと、
を備え、
前記テストアプリケーションが、
前記ユーザが読むために前記ディスプレイにテキストを表示することと、
前記テスト中にテストビデオデータのセットを前記カメラによって記録することと、
前記カメラによって記録されたライブビデオデータを表示するウィンドウを前記ディスプレイに表示することと、
前記テスト中に、
前記ユーザの顔を識別する、
前記顔の複数のピクセルの全てがフレーム内にあるか否かを判定する、及び
前記顔が前記フレームの外側にある場合に前記テストを停止する
ために、前記テストビデオデータのセットを継続的に処理することと、
前記テスト中にテストオーディオデータのセットを前記マイクロフォンによって記録することと、
オーディオ及びビデオ特徴を識別するために、前記テストオーディオデータのセット及び前記テストビデオデータのセットを処理して、前記オーディオ及びビデオ特徴を前記メモリに記憶することと、
を含む、
患者のメンタルヘルスをスクリーニングするためのシステム。
[本発明1011]
前記表示されたテキストが、各質問についてのテキスト及び回答を含むメンタルヘルス質問票からの一連の質問を含む、本発明1010のシステム。
[本発明1012]
前記オーディオ及びビデオ特徴のそれぞれが、前記一連の質問の中の質問に対応する、本発明1011のシステム。
[本発明1013]
前記テストオーディオデータのセット及び前記テストビデオデータのセットを処理することが、
重複する時間ウィンドウを識別するために、前記テストオーディオデータ及び前記テストビデオデータのセットを前処理することと、
前記識別された重複する時間ウィンドウに基づいて、統合されたオーディオ及びビデオセグメントのセットを出力することと、
前記ユーザのメンタルヘルス状態を特定するために、前記統合されたオーディオ及びビデオセグメントのセットを機械学習モデルによって処理することと、
をさらに含む、本発明1010のシステム。
[本発明1014]
前記機械学習モデルが、一般化線形モデル、回帰モデル、ロジスティック回帰モデル、及び教師あり機械学習分類モデルのうちの少なくともの1つである、本発明1013のシステム。
[本発明1015]
前記機械学習モデルが一般化線形モデルを含み、
前記一般化線形モデルが、
複数の個人のそれぞれが1つまたは複数のメンタルヘルス障害を有するか否かを示す前記複数の個人についてのラベル付きトレーニングデータを受け取ることであって、前記ラベル付きトレーニングデータが、
トレーニングテスト中に記録した前記複数の個人のそれぞれについて記録されたオーディオ及びビデオデータと、
前記複数の個人のそれぞれからの前記質問票への回答の選択と、
を含む、前記受け取ることと、
前記ラベル付きトレーニングデータから複数の特徴を決定することと、
前記複数の特徴に基づいて、教師あり様式で初期機械学習モデルをトレーニングすることと、
前記初期機械学習モデルの前記トレーニングに基づいて、前記複数の特徴のそれぞれについて重要性尺度を抽出することと、
前記複数の特徴についての前記抽出された重要性尺度に基づいて、複数のサブセット機械学習モデルを生成することと、
前記生成された複数のサブセット機械学習モデルの分類性能を評価することと、
前記サブセット機械学習モデルの少なくとも1つを前記一般化線形モデルとして選択することと、
によって生成される、本発明1013のシステム。
[本発明1016]
方法を実行するための命令が記憶された機械実行可能コードを含む機械可読媒体を含むメモリと、
1つまたは複数のプロセッサを含む、前記メモリに結合された制御システムであって、前記機械実行可能コードを実行して、前記制御システムに、
メンタルヘルス質問票からの一連の質問に対するユーザからの回答を表す回答データのセットを受け取ることと、
前記ユーザがテキストを読んでいる間の前記ユーザの顔を表す、テスト中に記録されたテストビデオデータのセットを受け取ることと、
ビデオ特徴のセットを出力するために、前記テストビデオデータのセットを処理することと、
前記ユーザがテキストを読んでいる間の前記ユーザの声を表す、前記テスト中に記録されたテストオーディオデータのセットを受け取ることと、
オーディオ特徴のセットを出力するために、前記オーディオデータのセットを処理することと、
前記ユーザのメンタルヘルスの表示を出力するために、機械学習モデルを使用して、前記回答データのセット、前記ビデオ特徴のセット、及び前記オーディオ特徴のセットを処理することと、
を行わせるように構成されている、前記制御システムと、
を備える、
患者のメンタルヘルスをスクリーニングするためのシステム。
[本発明1017]
前記機械学習モデルが、一般化線形モデル、回帰モデル、ロジスティック回帰モデル、及び教師あり機械学習分類モデルのうちの少なくとも1つである、本発明1016のシステム。
[本発明1018]
前記機械学習モデルが一般化線形モデルを含み、
前記一般化線形モデルが、
複数の個人のそれぞれが1つまたは複数のメンタルヘルス障害を有するか否かを示す前記複数の個人についてのラベル付きトレーニングデータを受け取ることであって、前記ラベル付きトレーニングデータが、
トレーニングテスト中に記録した前記複数の個人のそれぞれについて記録されたオーディオ及びビデオデータと、
前記複数の個人のそれぞれからの前記質問票への回答の選択と、
を含む、前記受け取ることと、
前記ラベル付きトレーニングデータから複数の特徴を決定することと、
前記複数の特徴に基づいて、教師あり様式で初期機械学習モデルをトレーニングすることと、
前記初期機械学習モデルの前記トレーニングに基づいて、前記複数の特徴のそれぞれについて重要性尺度を抽出することと、
前記複数の特徴についての前記抽出された重要性尺度に基づいて、複数のサブセット機械学習モデルを生成することと、
前記生成された複数のサブセット機械学習モデルの分類性能を評価することと、
前記サブセット機械学習モデルの少なくとも1つを前記一般化線形モデルとして選択することと、
によって生成される、本発明1016のシステム。
[本発明1019]
プロセッサ実行可能命令またはデータの少なくとも1つを記憶する少なくとも1つの非一時的プロセッサ可読記憶媒体と、
前記少なくとも1つの非一時的プロセッサ可読記憶媒体に通信可能に結合された少なくとも1つのプロセッサと、
を備え、
動作において、前記少なくとも1つのプロセッサが、
複数の個人のそれぞれが複数のメンタルヘルス障害のうちの1つまたは複数を有するか否かを示す前記複数の個人についてのデータを含むラベル付きトレーニングデータを受け取ることであって、前記ラベル付きトレーニングデータが、
前記複数の個人に実施されたメンタルヘルス質問票への回答と、
前記複数の個人のそれぞれがデジタルディスプレイからのテキストを読んでいる間に記録されたビデオデータ及びオーディオデータであって、前記ビデオデータが、前記個人の顔を含む前記ビデオデータの部分を識別するように処理され、前記オーディオデータが、前記個人の声を表す音を識別するように処理される、前記ビデオデータ及び前記オーディオデータと、
をさらに含む、前記受け取ることと、
複数の特徴を出力するために、前記回答、前記オーディオデータ、及び前記ビデオデータを処理することと、
前記受け取ったトレーニングデータに基づいて、教師あり様式で初期機械学習モデルをトレーニングすることと、
前記トレーニングされた初期機械学習モデルから前記複数の特徴のそれぞれについて重要性尺度を抽出することと、
前記複数の特徴についての前記抽出された重要性尺度に基づいて、複数のサブセット機械学習モデルを生成することと、
前記生成された複数のサブセット機械学習モデルの分類性能を評価することと、
前記複数のサブセット機械学習モデルの少なくとも1つを診断分類器として選択することと、
前記診断分類器の前記特徴を、スクリーニングツールとして後で使用するために、前記少なくとも1つの非一時的プロセッサ可読記憶媒体に記憶することと、
を行うように構成されている、
機械学習トレーニングシステム。
[本発明1020]
前記選択されたサブセット機械学習モデルが、前記複数の特徴の一部分を含み、前記部分が、閾値を上回る重要性尺度を有する特徴から選択される、本発明1019の機械学習システム。
[本発明1021]
前記複数の特徴のうちの少なくとも20個の特徴が、前記閾値を上回る重要性尺度を有し、前記部分が少なくとも10個の特徴及び20個未満の特徴を含む、本発明1020の機械学習システム。
[本発明1022]
前記サブセット機械学習モデルのそれぞれが、前記複数の特徴の前記部分の、異なる選択を含む、本発明1020の機械学習システム。
[本発明1023]
前記診断分類器が、個人を、健康であるか、または一般的なメンタルヘルスの問題を有すると識別するメンタルヘルス表示を出力するように構成されている、本発明1019の機械学習システム。
[本発明1024]
前記診断分類器が、個人を、健康であるか、または特定のメンタルヘルスの問題を有すると識別するメンタルヘルス表示を出力するように構成されている、本発明1019の機械学習システム。
[本発明1025]
前記診断分類器が、個人を、第1の特定のメンタルヘルス障害を有するか、または第2の特定のメンタルヘルス障害を有すると識別するメンタルヘルス表示を出力するように構成されている、本発明1019の機械学習システム。
[本発明1026]
前記診断分類器が、個人のメンタルヘルス障害を発症するリスクを特定するメンタルヘルス表示を出力するように構成されている、本発明1019の機械学習システム。
[本発明1027]
前記ラベル付きトレーニングデータが、
前記複数の個人のうちの各個人について、前記個人が健康であるか否か、前記個人が一般的なメンタルヘルスの問題を有するか否か、前記個人が1つまたは複数の特定のメンタルヘルス障害を有するか否か、前記個人に一般的なメンタルヘルスの問題を発症するリスクがあるか否か、または前記個人に1つまたは複数の特定のメンタルヘルス障害を発症するリスクがあるか否か、のうちの少なくとも1つの表示
をさらに含む、本発明1019の機械学習システム。
[本発明1028]
前記初期機械学習モデルをトレーニングすることが、ロジスティック回帰を用いたｋ分割交差検証を使用することをさらに含む、本発明1019の機械学習システム。
[本発明1029]
前記サブセット機械学習モデルのそれぞれが、前記複数の特徴の、異なる組み合わせを含む、本発明1019の機械学習システム。
[本発明1030]
前記ラベル付きトレーニングデータが、機能的測定データまたは生理学的測定データの少なくとも1つをさらに含む、本発明1019の機械学習システム。
[本発明1031]
治療反応をテストする少なくとも1つの臨床試験における中間結果またはエンドポイント結果の少なくとも1つを評価するために、前記診断分類器の前記特徴をスクリーニングツールとして使用すること
をさらに含む、本発明1019の機械学習システム。
上記の概要は、本開示の各実施形態または全ての態様を表すことを意図するものではない。むしろ、前述の概要は、本明細書に記載の新規の態様及び特徴のうちの一部の一例を提供するにすぎない。上記の特徴及び利点、ならびに本発明の他の特徴及び利点は、本発明を実施するための代表的な実施形態及びモードの以下の詳細な説明から、付属の図面及び添付の特許請求の範囲と合わせて、より明らかになろう。

図面において、同一の参照番号は、同様の要素または行為を特定する。図面中の要素の大きさ及び相対的な位置は、必ずしも縮尺通りではない。たとえば、様々な要素の形状及び角度は必ずしも縮尺通りではなく、これらの要素の一部は、図面の視認性を向上させるために、任意に拡大及び配置し得る。さらに、描画した要素の特定の形状は、必ずしも特定の要素の実際の形状に関する情報を伝える意図はなく、単に図面における認識の容易さのために選択されている場合がある。

本開示の１つの非限定的な例示した実施態様による、機械学習ベースの診断横断的分類器をトレーニング及び実装するためのシステムが構成され、開始され、動作し得る例示的な環境を示すネットワーク図である。構成された方法で機械学習ベースの診断横断的分類器の一実施形態を実行するのに適した例示的なコンピューティングシステムのブロック図である。本開示の１つの例示した実施態様による、診断横断的分類器システムを動作させる方法の流れ図である。本開示の１つの非限定的な例示した実施態様による、初期機械学習分類器の受診者動作特性（ＲＯＣ）曲線を示すグラフである。本開示の１つの非限定的な例示した実施態様による、１～５７８個の特徴を含む複数のサブセット機械学習モデルのＲＯＣ曲線下面積を示すグラフである。本開示の１つの非限定的な例示した実施態様による、複数のサブセット機械学習モデルの精度スコアを示すグラフである。本開示の一実施形態による、例示的なシステムを提供する図である。本開示の一実施形態による、データを受け取って分析するための例示的な方法論を示す図である。本開示の一実施形態による、データを受け取って分析するための例示的な方法論を示す図である。本開示の一実施形態による、データを受け取って分析するための例示的な方法論を示す図である。本開示の一実施形態による、オーディオ及びビデオデータを処理する例示的な方法論を示す図である。本開示の一実施形態による、機械学習モデルを用いて入力を分析するための例示的な方法論を示す図である。本開示の一実施形態による、スマートフォン上の例示的なユーザインターフェースを示す図である。本開示の一実施形態による、スマートフォン上の例示的なユーザインターフェースを示す図である。

詳細な説明
以下の説明では、様々な開示した実施態様の完全な理解を提供するために、特定の具体的な詳細を述べている。しかしながら、関連技術の当業者は、これらの具体的な詳細の１つまたは複数なしで、または他の方法、コンポーネント、材料などを用いて、実施態様が実践され得ることを認識するであろう。他の例では、コンピュータシステム、サーバコンピュータ及び／または通信ネットワークに関連するよく知られている構造については、実施態様の説明を不必要に曖昧にしないように、詳細に図示も説明もしていない。

文脈上別段の必要性がない限り、本明細書及びそれに続く特許請求の範囲全体を通じて、「備える」という語は「含む」と同義であり、包括的なまたは制限のないものである（すなわち、列挙されていない追加の要素または方法の行為を除外するものではない）。

本明細書全体を通じた「一実施態様」または「実施態様」への言及は、その実施態様に関連して説明する特定の特徴、構造、または特性が少なくとも１つの実施態様に含まれることを意味する。このため、本明細書全体の様々な場所での「一実施態様における」または「実施態様における」という語句の出現は、必ずしも全て同じ実施態様について言及しているわけではない。さらに、特定の特徴、構造、または特性は、１つまたは複数の実施態様において任意の好適な方法で組み合わせられ得る。

本明細書及び添付の特許請求の範囲において使用する場合、単数形「１つの（ａ）」、「１つの（ａｎ）」、及び「その（ｔｈｅ）」は、文脈上別様に明記しない限り、複数の指示対象を含む。「または」という用語は一般に、文脈上別様に明記しない限り、「及び／または」を含む意味で使用していることにも留意されたい。

本明細書に設けている見出し及び本開示の要約は、便宜上のものにすぎず、実施態様の範囲または意味を解釈するものではない。

本明細書では、機械学習手法を使用して、メンタルヘルス障害を評価するための一連の広範な質問票から最も有益な質問を選択することにより、それらの障害について人々をスクリーニングするシステム及び方法について説明する。これらのスクリーニングは高速で非常に高精度であり、任意の個人による自己申告のみに依存している（メンタルヘルスの専門家によって実施される必要はない）。スクリーニングの主な目的に基づいていくつかのスクリーニングを作成することができ、たとえば、１）診断横断的スクリーニング（個人が健康であるか、一般的なメンタルヘルスの問題を有するかを判定するため）、２）特定の障害のスクリーニング（個人が健康であるか、統合失調症やＡＤＨＤなどの特定のメンタルヘルス障害を有するかを判定するため）、または、３）鑑別診断スクリーニング（個人がある特定のメンタルヘルス障害を有するか、または他の特定のメンタルヘルス障害を有するか、たとえば、ＡＤＨＤではなく統合失調症かを判定するため）、などである。この手法は、特定のメンタルヘルス障害のサブセットのみを予測することに限定されず、その理由は、メンタルヘルスの問題、症状、またはメンタルヘルスもしくはその他の障害における行動的次元（たとえば、パーキンソン病における鬱病、てんかんにおける精神病、多発性硬化症における認知症（Ｗｈｉｔｅｅｔａｌ．，２０１２））の予測にこの手法が適用され得るためである。この手法はまた、質問／質問票のみを入力特徴として使用するメンタルヘルスの問題の予測に限定されず、その理由は、機能的タイプの測定（たとえば、スマートフォンユーザインタラクション）、または生理学的タイプの測定（たとえば、磁気共鳴画像法、脳波記録、脳磁図、皮質脳波記録、ポジトロン放出断層撮影、単一光子放射型コンピュータ断層撮影）もまた、効率的かつ正確なメンタルヘルススクリーニングのために有益な、選択元となる予測特徴のセットを提供できるためである。

この手法は、機械学習手法を使用して複数の質問票から質問のサブセットを組み合わせて選択するという新規の手法を採用することの利点を強調しており、単一の質問票のみに基づく他の診断横断的スクリーニング（たとえば、Ｋｅｓｓｌｅｒｅｔａｌ．，２００２、Ｋｅｓｓｌｅｒｅｔａｌ．，２００３）よりも優れている。そのような手法は、メンタルヘルス障害を有さない場合があるが、それを発症するリスクがあり得る個人を特定するのにも役立ち得る（たとえば、モデルの誤分類を識別し、リスクのある個人の別個のグループとしてラベル付けするためのさらなるモデルを構築することによる）。

これらのスクリーニングは迅速であり、自己申告の回答に依存するので、この一連のスクリーニングは、電話、タブレット、またはコンピュータアプリ（たとえば、モバイルアプリ、ｗｅｂブラウザアプリなど）から実施することができ、収集されたデータはローカルデバイス上で、またはクラウドコンピューティング環境内で処理され、個人の同意を得て主治医またはメンタルヘルス専門家に送信される。

これらのスクリーニングを使用し得る用途は無数にある。以下に、本開示のスクリーニングが使用され得るいくつかの非限定的な適用例を列挙する。これらのスクリーニングは、メンタルヘルス障害を有し得るか否かを評価するために、どの個人でも使用することができる。これらのスクリーニングを使用して、所与の母集団（たとえば、州、国民、ホームレス、軍隊、学校、民族など）におけるメンタルヘルスの問題の発生率及び有病率を推定することができる。これらのスクリーニングを使用して、治療反応をテストする臨床試験の中間結果及びエンドポイント結果の両方を評価することができる。これらのスクリーニングを、メンタルヘルスの問題が予想される患者のプライマリケアスクリーニングツールとして使用して、非効率的で不必要な紹介を減らすことができる。これらのスクリーニングを使用して、救急科の環境でメンタルヘルスの問題が疑われる患者を迅速に選別することができる。これらのスクリーニングを使用して、メンタルヘルス障害のある個人を募集する研究に登録されているが、医師による障害の評価を受けることができない個人によって自己申告された障害の可能性をチェックすることができる。これらのスクリーニングは、精神疾患の特定及び治療が企業の生産性の低下よりも安価であることがわかっていることから、職場で使用することができる（Ｋｅｓｓｌｅｒｅｔａｌ．，２００９）。

機械学習システムは、プロセッサ実行可能命令またはデータの少なくとも１つを記憶する少なくとも１つの非一時的プロセッサ可読記憶媒体と、少なくとも１つの非一時的プロセッサ可読記憶媒体に通信可能に結合された少なくとも１つのプロセッサと、を含むものとして要約され得、動作において、少なくとも１つのプロセッサは、複数の個人のそれぞれが複数のメンタルヘルス障害のうちの１つまたは複数を有するか否かを示す複数の個人についてのデータを含むラベル付きトレーニングデータを受け取ることであって、ラベル付きトレーニングデータは、１つまたは複数の特徴をそれぞれが含む複数の自己記入式のメンタルヘルス質問票に対する、個人のうちの少なくとも一部の項目レベルの返答をさらに含む、受け取ることと、受け取ったトレーニングデータに少なくとも部分的に基づいて、教師あり様式で初期機械学習モデルをトレーニングすることと、トレーニングされた初期機械学習モデルから複数の自己記入式のメンタルヘルス質問票内の複数の特徴のそれぞれについて重要性尺度を抽出することと、複数の特徴についての抽出された重要性尺度に少なくとも部分的に基づいて、複数のサブセット機械学習モデルを生成することと、生成された複数のサブセット機械学習モデルの分類性能を評価することと、サブセット機械学習モデルの少なくとも１つを診断分類器として選択することと、診断分類器の特徴を、スクリーニングツールとして後で使用するために、少なくとも１つの非一時的プロセッサ可読記憶媒体に記憶することと、を行う。選択されたサブセット機械学習モデルは、重要性尺度によって決定される上位Ｎ個の重要な特徴のうちのＭ個を含み得、Ｍは１０～２０の整数であり、Ｎは２０より大きい整数である。診断分類器は、個人が複数のメンタルヘルス障害のうちの１つを有するか否かを判定するように動作し得る。

選択されたサブセット機械学習モデルは、少なくとも次の特徴、すなわち、「できるだけ他の人を喜ばせたい」、「じっと座っていられないほど落ち着かないことがよくある」、「理由がわからず気分が幸せから悲しみに変わることがよくある」、「一人でするのが楽しいこともあるが、大抵は他の人と一緒にするほうが楽しいと思う」、「私はほとんどの人よりも感傷的である」、「私は自分がする全てのことで優れていたい」、「人々は私をかなり自由奔放で自発的な人だと考えている」、「私は必要なもの全てを人々から真に得ることは決してないと感じている」、「なじみのない環境では、自分で驚くほど積極的で社交的なことが多い」、「私は決断を下す前に、長い間物事について考えることを好む」、「アイデアやひらめきが思い浮かぶのが速すぎて、全てを表現できないことがある」、「私にはたくさんの趣味がある」、「私は自分の問題を自分自身に留めておくことを好む」、「私の注意は他のことに移りやすいので、長い間同じ興味を保つのは難しい」、「やりがいのある部分が完了した後、プロジェクトの最終的な詳細をまとめるのに苦労する頻度はどれくらいか」、「簡単だとしても、仕事をゆっくり始めることを好む」、「大抵、私はほとんどの人よりも将来何かがうまくいかないかもしれないと心配している」のサブセットを含み得る。動作において、少なくとも１つのプロセッサは、ロジスティック回帰を用いたｋ分割交差検証を使用して初期機械学習モデルをトレーニングし得る。サブセット機械学習モデルのそれぞれは、初期機械学習モデルの特徴の、異なる組み合わせを含み得る。サブセット機械学習モデルのそれぞれは、重要性尺度によって決定される初期機械学習モデルの、異なる数の上位の重要な特徴を含み得る。当業者には容易に理解されるように、これらの質問の変形も、開示したシステム及び方法で使用することができる。本開示の様々な例において、いくつかの追加の質問を使用することができ、置換的／代替的な質問を使用することができ、または質問の一部を省略することができる。

本開示の１つまたは複数の実施態様は、機械学習を利用して、本明細書では特徴とも呼ぶ複数の質問（たとえば、１７個の質問）を含む単一の診断横断的な質問票を使用して複数の異なるメンタルヘルス障害を同時に診断するように動作する診断横断的分類器を生成するためのシステム及び方法を対象とする。大まかに言うと、本開示の発明者らは、上記の障壁の少なくとも一部を克服するために、自動的にスコア付けされる、迅速で診断横断的な自己記入式のメンタルヘルススクリーニングを開発するための機械学習技法を実装した。以下で説明する例は、説明の目的で質問／質問票を入力特徴として含むことに留意されるべきであるが、本明細書に開示するシステム及び方法は、質問／質問票のみを入力特徴として使用するメンタルヘルスの問題の予測に限定されないことが理解されるべきであり、その理由は、機能的タイプの測定（たとえば、スマートフォンユーザインタラクション）、または生理学的タイプの測定（たとえば、磁気共鳴画像法、脳波記録、脳磁図、皮質脳波記録、ポジトロン放出断層撮影、単一光子放射型コンピュータ断層撮影）もまた、効率的かつ正確なメンタルヘルススクリーニングのために有益な、選択元となる予測特徴のセットを提供できるためである。さらに、本明細書で論じる実施態様を使用して、診断横断的スクリーニング、特定の障害のスクリーニング、鑑別診断スクリーニング、または他のタイプのスクリーニングを提供し得る。

以下でさらに説明するように、機械学習技法を使用して、ラベル付きトレーニングデータを処理することによって、診断横断的な項目レベルの質問を特徴として含む統計モデルを構築して、対象のグループを健康またはメンタルヘルス障害の可能性があるものとして分類するスクリーニングを作成し得る。ラベル付きトレーニングデータは、統合失調症、双極性障害、または注意欠陥多動性障害（ＡＤＨＤ）などであるがこれらに限定されない複数の障害のうちの１つまたは複数を各個人が有するか否かを示す複数の個人のデータを含み得る。各個人について、ラベル付きトレーニングデータは、複数の自己記入式のメンタルヘルス質問票（たとえば、５つの質問票、１０個の質問票、２０個の質問票）に対する項目レベルの返答も含む。

機械学習技法を使用して、複数の自己記入式のメンタルヘルス質問票から、２０個を超える質問（たとえば、２００個の質問、６００個の質問）の中の１５～２０個の質問などの質問のサブセットを選択及び使用して、短時間（たとえば、５分未満）で、任意で遠隔及び反復的に、医師の関与なしに、複数のメンタルヘルス障害にわたって対象を自律的にスクリーニングし得る。本開示の実施態様の様々な特徴について、図面を参照して以下でさらに論じる。

図１は、診断横断的分類器（ＴＤＣ：ｔｒａｎｓ－ｄｉａｇｎｏｓｔｉｃｃｌａｓｓｉｆｉｅｒ）システム１００を生成及び実装するためのシステムが構成及び開始され得る例示的な環境を示すネットワーク図である。具体的には、ＴＤＣシステム１００の一実施形態は、１つまたは複数のコンピューティングシステム１０２上で実行されるように図示しており、たとえば、例示した実施形態では、オンラインで動作し、１つまたは複数のインターフェース１０４（たとえば、グラフィカルユーザインターフェース（ＧＵＩ）、アプリケーションプログラミングインターフェース（ＡＰＩ））を提供して、クライアントコンピューティングシステム１０６の１人または複数のリモートユーザが、１つまたは複数の介在するコンピュータネットワーク１０８を介してＴＤＣシステム１００と対話して、１つまたは複数の診断横断的分類器を生成、変更、及び使用できるようにする。

１人または複数のユーザ（たとえば、研究者、医師、患者）は、クライアントコンピューティングシステム１０６を使用して、コンピュータネットワーク１０８を介してＴＤＣシステム１００と対話して、ＴＤＣを生成し、生成したＴＤＣを使用して、複数のメンタルヘルス障害についてスクリーニングし得る。少なくとも一部の実施態様では、１つまたは複数のシステムを使用して分類器を生成し得、１つまたは複数の異なるシステムを使用して分類器をスクリーニングツールとして実装し得る。ＴＤＣシステム１００は、ＴＤＣコントローラコンポーネント１１０（たとえば、１つまたは複数のプロセッサ）と、ＴＤＣデータストレージコンポーネント１１２（たとえば、１つまたは複数の非一時的プロセッサ可読記憶媒体）と、インターフェース１０４と、他のＴＤＣコンポーネント１１４（たとえば、プロセッサ、データストレージ、有線／無線インターフェース、入力／出力デバイス）と、を含み得る。図示の例では、ＴＤＣデータストレージコンポーネント１１２は、ラベル付きトレーニングデータ１１６と、１つまたは複数の初期機械学習モデル１１８と、１つまたは複数のサブセット機械学習モデル１２０と、複数のメンタルヘルス障害について対象をスクリーニングするために使用され得る１つまたは複数の出力診断横断的分類器１２２と、を記憶する。これらの各コンポーネントについて、以下で説明する。

ネットワーク１０８は、たとえば、インターネットなどの様々な異なるパーティによって運用され得るリンクされたネットワークの公共的にアクセス可能なネットワークであり得、ＴＤＣシステム１００は、ネットワーク１０８を介してあらゆるユーザまたは特定のユーザのみに利用可能である。他の実施形態では、ネットワーク１０８は、非特権ユーザが完全にまたは部分的にアクセス不可能な、企業または大学のネットワークなどのプライベートネットワークであり得る。さらに他の実施形態では、ネットワーク１０８は、インターネットにアクセスできる、及び／またはインターネットからアクセスできる１つまたは複数のプライベートネットワークを含み得る。このように、図示の実施形態のＴＤＣシステム１００は、１つまたは複数のコンピュータネットワーク１０８を介して様々なユーザをサポートするようにオンラインで実装されるが、他の実施形態では、代わりにＴＤＣシステム１００のコピーが他の方法で、たとえば、単一のユーザまたは関連するユーザのグループ（たとえば、会社または他の組織）をサポートするように実装され得、これはたとえば、１つまたは複数のコンピュータネットワーク１０８が、代わりに会社または他の組織の内部コンピュータネットワークであり、ＴＤＣシステムのそのようなコピーが、任意で会社または他の組織の外部の他のユーザが利用できない場合である。ＴＤＣシステム１００のオンラインバージョン及び／またはＴＤＣシステムのローカルコピーバージョンは、一部の実施形態及び状況では、１人または複数のユーザが、ＴＤＣシステム１００を使用してメンタルヘルス障害に関して１人または複数の個人をスクリーニングするなどのために、ＴＤＣシステムの様々な動作を使用するための様々な料金を支払うような、料金ベースの方法で動作し得る。さらに、ＴＤＣシステム１００及び／またはその各コンポーネントは、１つまたは複数のプロセッサ（図示せず）によって１つまたは複数のコンピューティングシステム（図示せず）上で実行されるソフトウェア命令を含み得、たとえば、それらのプロセッサ及びコンピューティングシステムを、それらにプログラムされた機能の実行に関する専用のマシンとして動作するように構成する。

図２は、本明細書に記載の様々な実施形態を実施するのに適した例示的なプロセッサベースのデバイス２０４を示している。たとえば、プロセッサベースのデバイス２０４は、図１のコンピューティングシステム１０２またはクライアントコンピューティングシステム１０６の１つを表し得る。必須ではないが、実施形態の一部は、１つまたは複数のプロセッサによって実行されるプログラムアプリケーションモジュール、オブジェクト、またはマクロなど、プロセッサ実行可能命令またはロジックの一般的な状況で説明する。関連技術の当業者は、記載した実施形態ならびに他の実施形態が、スマートフォン及びタブレットコンピュータなどのハンドヘルドデバイス、ウェアラブルデバイス、マルチプロセッサシステム、マイクロプロセッサベースのまたはプログラム可能な家庭用電化製品、パーソナルコンピュータ（「ＰＣ」）、ネットワークＰＣ、ミニコンピュータ、メインフレームコンピュータなどを含む、様々なプロセッサベースのシステム構成で実施できることを理解するであろう。

プロセッサベースのデバイス２０４は、たとえば、サーバコンピュータ、クラウドベースのコンピューティングシステム、デスクトップコンピュータ、スマートフォンまたはタブレットコンピュータの形態をとり得、これは、１つまたは複数のプロセッサ２０６と、システムメモリ２０８と、システムメモリ２０８を含む様々なシステムコンポーネントをプロセッサ（複数可）２０６に結合するシステムバス２１０と、を含む。プロセッサベースのデバイス２０４は、本明細書では単数形で言及することがあるが、これは実施形態を単一のシステムに限定することを意図しておらず、その理由は、特定の実施形態では、２つ以上のシステムまたは他のネットワーク化されたコンピューティングデバイスが関与するためである。市販のシステムの非限定的な例には、様々なメーカーのＡＲＭプロセッサ、ＩｎｔｅｌＣｏｒｐｏｒａｔｉｏｎ，Ｕ．Ｓ．Ａ．のＣｏｒｅマイクロプロセッサ、ＩＢＭのＰｏｗｅｒＰＣマイクロプロセッサ、ＳｕｎＭｉｃｒｏｓｙｓｔｅｍｓ，Ｉｎｃ．のＳｐａｒｃマイクロプロセッサ、Ｈｅｗｌｅｔｔ－ＰａｃｋａｒｄＣｏｍｐａｎｙのＰＡ－ＲＩＳＣシリーズマイクロプロセッサ、ＭｏｔｏｒｏｌａＣｏｒｐｏｒａｔｉｏｎの６８ｘｘｘシリーズマイクロプロセッサが含まれるが、これらに限定されない。

プロセッサ（複数可）２０６は、１つまたは複数の中央処理装置（ＣＰＵ）、マイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）などの任意のロジック処理ユニットであり得る。別様に明記しない限り、図２に示す様々なブロックの構造及び動作は従来の設計のものである。結果として、そのようなブロックは、関連技術の当業者には理解されると思われるので、本明細書でさらに詳細に説明する必要はない。

システムバス２１０は、メモリコントローラを用いたメモリバス、周辺バス、及びローカルバスを含む、任意の知られているバス構造またはバスアーキテクチャを採用し得る。システムメモリ２０８は、読み取り専用メモリ（「ＲＯＭ」）２１２及びランダムアクセスメモリ（「ＲＡＭ」）２１４を含む。ＲＯＭ２１２の一部を形成できる基本入出力システム（「ＢＩＯＳ」）２１６は、起動中などに、プロセッサベースのデバイス２０４内の要素間で情報を転送するのを支援する基本ルーチンを含む。一部の実施形態は、データ、命令、及び電力のために別々のバスを使用し得る。

プロセッサベースのデバイス２０４はまた、１つまたは複数のソリッドステートメモリ、たとえば、フラッシュメモリまたはソリッドステートドライブ（ＳＳＤ）２１８を含み得、これは、コンピュータ可読命令、データ構造、プログラムモジュール、及びプロセッサベースのデバイス２０４の他のデータの不揮発性ストレージを提供する。図示していないが、プロセッサベースのデバイス２０４は、他の非一時的コンピュータ可読またはプロセッサ可読媒体、たとえば、ハードディスクドライブ、光ディスクドライブ、またはメモリカード媒体ドライブを使用することができる。

プログラムモジュールをシステムメモリ２０８に記憶することができ、たとえば、オペレーティングシステム２３０、１つまたは複数のアプリケーションプログラム２３２、他のプログラムまたはモジュール２３４、ドライバ２３６、及びプログラムデータ２３８などである。

アプリケーションプログラム２３２は、たとえば、パン／スクロール２３２ａを含み得る。そのようなパン／スクロールロジックは、中央部分及び少なくとも１つの周縁部分を有する領域を含むユーザインターフェース要素にポインタ（たとえば、指、スタイラス、カーソル）が入った時及び／または場所を特定するロジックを含み得るが、これに限定されない。そのようなパン／スクロールロジックは、ユーザインターフェース要素の少なくとも１つの要素が動いているように見えるはずの方向及び速度を決定し、表示を更新させて、少なくとも１つの要素を、決定した方向に決定した速度で動いているように見せるロジックを含み得るが、これに限定されない。パン／スクロールロジック２３２ａは、たとえば、１つまたは複数の実行可能命令として記憶され得る。パン／スクロールロジック２３２ａは、たとえば、タッチセンシティブディスプレイ、またはコンピュータのマウスもしくはトラックボール、あるいはその他のユーザインターフェースデバイスからのデータなど、ポインタの動きを特徴付けるデータを使用してユーザインターフェースオブジェクトを生成するためのプロセッサ及び／またはマシン実行可能ロジックもしくは命令を含み得る。

システムメモリ２０８はまた、プロセッサベースのデバイス２０４が、ユーザコンピューティングシステム、インターネット上のウェブサイト、企業イントラネット、または以下に説明する他のネットワークなどの他のシステムにアクセスしてデータを交換できるようにするための、サーバ及び／またはウェブクライアントもしくはブラウザなどの通信プログラム２４０を含み得る。図示の実施形態の通信プログラム２４０は、ハイパーテキストマークアップ言語（ＨＴＭＬ）、拡張マークアップ言語（ＸＭＬ）またはワイヤレスマークアップ言語（ＷＭＬ）など、マークアップ言語ベースであり、ドキュメントの構造を表すためにドキュメントのデータに追加された構文的に区切られた文字を使用するマークアップ言語を用いて動作する。多数のサーバ及び／またはＷｅｂクライアントもしくはブラウザが市販されており、たとえば、ＣａｌｉｆｏｒｎｉａのＭｏｚｉｌｌａＣｏｒｐｏｒａｔｉｏｎ及びＷａｓｈｉｎｇｔｏｎのＭｉｃｒｏｓｏｆｔのものなどがある。

図２にはシステムメモリ２０８に記憶されるものとして示しているが、オペレーティングシステム２３０、アプリケーションプログラム２３２、その他のプログラム／モジュール２３４、ドライバ２３６、プログラムデータ２３８ならびにサーバ及び／またはブラウザ２４０は、多種多様な非一時的プロセッサ可読媒体のうちの他のもの（たとえば、ハードディスクドライブ、光ディスクドライブ、ＳＳＤ、及び／またはフラッシュメモリ）に記憶することができる。

ユーザは、カーソルを制御する指２４４ａ、スタイラス２４４ｂによって、またはコンピュータのマウスもしくはトラックボール２４４ｃによって、タッチスクリーン２４８などの入力デバイスなどを通じて、ポインタを介してコマンド及び情報を入力することができる。他の入力デバイスには、マイクロフォン、ジョイスティック、ゲームパッド、タブレット、スキャナ、生体測定スキャンデバイスなどを含めることができる。これら及び他の入力デバイス（すなわち、「Ｉ／Ｏデバイス」）は、タッチスクリーンコントローラなどのインターフェース２４６、及び／またはユーザ入力をシステムバス２１０に結合するユニバーサルシリアルバス（「ＵＳＢ」）インターフェースを介してプロセッサ（複数可）２０６に接続されるが、パラレルポート、ゲームポート、もしくはワイヤレスインターフェースまたはシリアルポートなどの他のインターフェースが使用され得る。タッチスクリーン２４８は、タッチスクリーン２４８を介して表示する画像データまたは画像情報を受け取るためのビデオアダプタなどのビデオインターフェース２５０を介してシステムバス２１０に結合することができる。図示していないが、プロセッサベースのデバイス２０４は、スピーカー、バイブレータ、触覚アクチュエータまたは触覚エンジンなどの他の出力デバイスを含むことができる。

プロセッサベースのデバイス２０４は、１つまたは複数のネットワーク２１４ａ、２１４ｂなどの１つまたは複数の通信チャネルを介して１つまたは複数のリモートコンピュータ、サーバ、及び／またはデバイスと通信するための論理接続のうちの１つまたは複数を使用してネットワーク化された環境で動作する。これらの論理接続は、１つまたは複数のＬＡＮ及び／またはＷＡＮ、たとえば、インターネット、及び／またはセルラー通信ネットワークなどを介して、コンピュータが通信できるようにする任意の知られている方法を容易にし得る。そのようなネットワーク環境は、有線及び無線の企業規模のコンピュータネットワーク、イントラネット、エクストラネット、インターネット、ならびに他のタイプの通信ネットワーク、たとえば、通信ネットワーク、セルラーネットワーク、ページングネットワーク、及びその他のモバイルネットワークなどにおいてよく知られている。

ネットワーク環境で使用される場合、プロセッサベースのデバイス２０４は、インターネット２１４ａまたはセルラーネットワークなどのネットワークを介して通信を確立するための１つまたは複数のネットワークの有線または無線通信インターフェース２５２ａ、２５６（たとえば、ネットワークインターフェースコントローラ、セルラー無線、ＷＩ－ＦＩ無線、Ｂｌｕｅｔｏｏｔｈ無線）を含み得る。

ネットワーク化された環境では、プログラムモジュール、アプリケーションプログラム、もしくはデータ、またはそれらの一部を、サーバコンピューティングシステム（図示せず）に記憶することができる。関連技術の当業者は、図２に示すネットワーク接続は、コンピュータ間の通信を確立する方法のほんの一部の例であり、無線を含む他の接続が使用され得ることを認識するであろう。

便宜上、プロセッサ（複数可）２０６、システムメモリ２０８、ならびにネットワーク及び通信インターフェース２５２ａ、２５６は、システムバス２１０を介して互いに通信可能に結合され、それによって上記のコンポーネント間の接続を提供するものとして示している。プロセッサベースのデバイス２０４の代替の実施形態では、上記のコンポーネントは、図２に示すものとは異なる方法で通信可能に結合され得る。たとえば、上記のコンポーネントの１つまたは複数は、他のコンポーネントに直接結合され得、または中間コンポーネント（図示せず）を介して互いに結合され得る。一部の実施形態では、システムバス２１０は省略され、コンポーネントは適切な接続を使用して互いに直接結合される。

図３は、本開示の技法に従ってＴＤＣシステムを動作させる方法３００の高レベル流れ図である。方法３００は、たとえば、図１のＴＤＣシステム１００によって実行され得る。

方法３００は３０２から始まり、ここで、ＴＤＣシステムの少なくとも１つのプロセッサは、ラベル付きトレーニングデータを受け取る。上記のように、ラベル付きトレーニングデータは、統合失調症、双極性障害、または注意欠陥多動性障害（ＡＤＨＤ）などであるがこれらに限定されない複数のメンタルヘルス障害のうちの１つまたは複数を各個人が有するか否かを示す複数の個人のデータを含み得る。各個人について、ラベル付きトレーニングデータは、複数の自己記入式のメンタルヘルス質問票（たとえば、５つの質問票、１０個の質問票、２０個の質問票）に対する項目レベルの返答も含む。一部の例では、トレーニングデータは、複数の個人のそれぞれがデジタルディスプレイからのテキストを読んでいる間に記録されたビデオデータ及びオーディオデータを含む。一部の例では、ビデオデータは、個人の顔を構成するビデオデータの部分を識別するように処理され、オーディオデータは、個人の声を表す音を識別するように処理される。

少なくとも一部の実施態様では、ラベル付きトレーニングデータは、神経精神医学フェノミクスのためのＵＣＬＡコンソーシアムから公開されているデータセットで構成され、これは、健康な個人（１３０人の対象）と、メンタルヘルス専門家によるＤＳＭ障害に関する構造化臨床面接の実施後に、統合失調症（５０人の対象）、双極性障害（４９人の対象）、ＡＤＨＤ（４３人の対象）を含む、神経精神障害を有すると診断された個人との両方における、記憶及び認知制御機能の次元構造の理解にフォーカスしたものである。

全ての参加者は、複数の自己記入式のメンタルヘルス質問票に項目レベルの返答を提供した。本明細書で論じる例示的な実施形態では、合計５７８個の個別の質問に対する個人の返答が使用された。質問は以下の尺度／質問票、すなわち、ホプキンス症状チェックリスト（ＨＳＣＬ）、成人自己申告尺度ｖ１．１スクリーナー（ＡＳＲＳ）、バラット衝動性尺度（ＢＩＳ－１１）、ディックマン機能・非機能衝動性尺度、多次元的パーソナリティ質問票（ＭＰＱ）－コントロール下位尺度、衝動性・冒険性（Ｖｅｎｔｕｒｅｓｏｍｅｎｅｓｓ）・共感尺度（ＩＶＥ）、双極ＩＩ型障害のリスクを高める特徴の尺度、分類学的方法で選択されたＧｏｌｄｅｎ＆Ｍｅｅｈｌの７つのＭＭＰＩ項目、軽躁性パーソナリティ尺度（ＨＰＳ）、チャップマン尺度（知覚異常、社会的無快感症、身体的無快感症）、ならびに気質性格検査（ＴＣＩ）、から得られた。他の実施態様では、１つまたは複数の異なる尺度／質問票、あるいは１つまたは複数の尺度／質問票の様々な組み合わせが使用され得ることを理解されたい。

３０４において、ＴＤＣシステムの少なくとも１つのプロセッサは、ラベル付きトレーニングデータを使用して初期機械学習分類器またはモデルをトレーニングする。たとえば、少なくとも一部の実施態様では、ロジスティック回帰を用いたｋ分割交差検証（たとえば、１０分割交差検証）を使用して、５７８個の個別の質問のスコアに基づいて１つまたは複数のメンタルヘルス障害があると診断された患者から健常対照（ＨＣ）の個人を分類する。個々の質問を全て使用して、このシステムは対象を「ＨＣ」または「患者」のいずれかに平均精度７９％で分類するように動作した。図４は、受診者動作特性（ＲＯＣ）曲線、他の評価指標を示すグラフ４００であり、これは曲線下面積（ＡＵＣ）の平均が０．８８であった（最大で１）。

３０６において、ＴＤＣシステムの少なくとも１つのプロセッサは、回帰係数から５７８個の質問または特徴についての特徴の重要性の尺度を抽出または取得する。

３０８において、質問のリストを短くしても同等の分類能力が得られるか否かを調べるために、ＴＤＣシステムは、本明細書ではサブセットＭＬモデルとも呼ぶ一連のモデルを生成し、最も重要な特徴から開始して重要な順に特徴を追加する。たとえば、第１のサブセットＭＬモデルは最も重要な特徴のみを含み得、第２のサブセットＭＬモデルは上位２つの重要な特徴を含み得、第３のサブセットＭＬモデルは上位３つの重要な特徴を含み得る、などである。

３１０において、ＴＤＣシステムの少なくとも１つのプロセッサは、生成されたサブセットＭＬモデルの少なくとも一部の性能を評価し得る。図５は、１つの特徴（すなわち、最も重要な特徴）から全ての特徴までを含むサブセットＭＬモデルのＲＯＣ曲線下面積を示すグラフ５００である。図６は、サブセットＭＬモデルのそれぞれの精度スコアを示すグラフ６００である。

質問の様々なサブセット（すなわち、質問１～５７８）にわたる分類器の性能は、ＡＵＣが０．８から０．９７まで変化することがわかった。さらに、９１％の精度及び０．９５のＡＵＣには、１７個の特徴のみが必要であることがわかった。これは、分類器ベースのスクリーニングでは、特徴数が多いほど必ずしも優れているとは限らないことを示している。特に、上位１７個の特徴には、性格及び気質に関する不均衡な数の質問が、衝動性、気分、及び躁病に関するさらなる質問と共に含まれていた。例示的な実施形態では、上位１７個の特徴または質問は、最も重要な特徴から順に、以下の質問を含む。
（１）「できるだけ他の人を喜ばせたい」（ｔｃｉ２８ｔ）、
（２）「じっと座っていられないほど落ち着かないことがよくある」（ｃｈａｐｈｙｐｏ８）、
（３）「理由がわからず気分が幸せから悲しみに変わることがよくある」（ｂｉｐｏｌａｒｉｉｌ）、
（４）「一人でするのが楽しいこともあるが、大抵は他の人と一緒にするほうが楽しいと思う」（ｃｈａｐｓｏｃ８）、
（５）「私はほとんどの人よりも感傷的である」（ｔｃｉ５５ｔ）、
（６）「私は自分がする全てのことで優れていたい」（ｔｃｉ７２ｐ）、
（７）「人々は私をかなり自由奔放で自発的な人だと考えている」（ｍｐｑ２４３）、
（８）「私は必要なもの全てを人々から真に得ることは決してないと感じている」（ｂｉｐｏｌａｒｉｉ２６）、
（９）「なじみのない環境では、自分で驚くほど積極的で社交的なことが多い」（ｃｈａｐｈｙｐｏ７）、
（１０）「私は決断を下す前に、長い間物事について考えることを好む」（ｔｃｉ６１ｔ）、
（１１）「アイデアやひらめきが思い浮かぶのが速すぎて、全てを表現できないことがある」（ｃｈａｐｈｙｐｏ５）、
（１２）「私にはたくさんの趣味がある」（ｄｉｃｋｓ）、
（１３）「私は自分の問題を自分自身に留めておくことを好む」（ｔｃｉ６８ｔ）、
（１４）「私の注意は他のことに移りやすいので、長い間同じ興味を保つのは難しい」（ｔｃｉ３５ｔ）、
（１５）「やりがいのある部分が完了した後、プロジェクトの最終的な詳細をまとめるのに苦労する頻度はどれくらいか」（ｆｉｎａｌｄｅｔａｉｌ）、
（１６）「簡単だとしても、仕事をゆっくり始めることを好む」（ｔｃｉ１８９ｐ）、及び、
（１７）「大抵、私はほとんどの人よりも将来何かがうまくいかないかもしれないと心配している」（ｔｃｉ８１ｔ）。
当業者には容易に理解されるように、これらの質問の変形も、開示したシステム及び方法で使用することができる。本開示の様々な例において、いくつかの追加の質問を使用することができ、置換的／代替的な質問を使用することができ、または質問の一部を省略することができる。

３１２において、ＴＤＣシステムの少なくとも１つのプロセッサは、性能評価に基づいて、サブセットＭＬモデルの１つまたは複数を診断横断的分類器として選択する。たとえば、ＴＤＣシステムの少なくとも１つのプロセッサは、上記にリストした上位１７個の特徴を含むサブセットＭＬモデルを診断横断的分類器として選択し得る。次いで、選択された診断横断的分類器を使用して、短期間（たとえば、５分未満）で、任意で遠隔及び反復的に、医師の関与なしに、複数のメンタルヘルス障害にわたって対象をスクリーニングし得る。

少なくとも一部の実施態様では、上記の技法を追加的または代替的に使用して、個々の診断のための特定のスクリーニング、たとえば、健康か統合失調症かを分類するスクリーニング、または健康か双極性かを分類するスクリーニングなどを生成し得る。上記の診断横断的スクリーニングと同様に、これらのスクリーニングのそれぞれは、既存のスクリーニング方法よりも迅速なスクリーニングを可能にする、本明細書で使用する技法を使用して決定される関連する質問の短いリストを含み得る。

例示的なスクリーニングシステム
本開示では、本開示の様々な実施形態を実行するために様々なシステムを使用できることを企図している。図７Ａは、図７Ｂ、図７Ｃ、図７Ｄ、図８、及び図９のそれぞれの方法７２０、７３０、７４０、８００、及び９００を含む本開示の様々な方法を実行するように構成することができる例示的なシステム７００Ａを提示する。具体的には、システム７００Ａは、ディスプレイ７０２、ユーザ７０４、カメラ７０６、カメラの視野７０６ａ、ユーザインターフェース７０８、リモートコンピューティングデバイス７１０、及びマイクロフォン７１２を含む。

カメラ７０６は、カメラの前の領域（領域７０６ａ）の視覚データをキャプチャし、視覚データをディスプレイ７０２及びリモートコンピューティングデバイス７１０に送信する。図７Ａに示すように、ユーザ７０４は、カメラ７０６の視野内に座る。そのような例では、カメラ７０６は、ユーザ７０４の顔の映像をキャプチャする。一部の例では、カメラ７０６は、ライブビデオ映像、写真、または非可視波長の画像／ビデオを撮影するように構成することができる。一部の例では、カメラ７０６は、リモートコンピューティングデバイス７１０またはローカルプロセッサもしくはコンピューティングデバイスからの命令に基づいて、記録を開始または停止するように構成される。たとえば、処理を実行するアプリケーションまたはプログラムは、リモートサーバ、コンピューティングデバイス、またはローカルプロセッサによって実行され得る。カメラ７０６は、ディスプレイ７０２及びリモートコンピューティングデバイス７１０またはローカルコンピューティングデバイスに通信可能に結合される。一部の例では、スマートフォンがこれらの各機能を実行する。

ユーザインターフェース７０８は、ユーザ７０４から入力を受け取るように構成される。たとえば、ユーザインターフェース７０８は、キーボード、タッチスクリーン、モバイルデバイス、または当技術分野で知られている、入力を受け取るための他の任意のデバイスとすることができる。ユーザ７０４は、ディスプレイ７０２上のプロンプトに応答して、ユーザインターフェース７０８上でデータを入力する。たとえば、ディスプレイ７０２は一連のメンタルヘルスの質問を出力し、ユーザ７０４はユーザインターフェース７０８上で各質問に対する回答を入力する。ユーザインターフェース７０８は、入力をディスプレイ７０２に直接表示するように構成され、データをリモートコンピューティングデバイス７１０に中継するように構成される。

マイクロフォン７１２は、ユーザ７０４などからの聴覚入力を受け取るように構成される。マイクロフォンは、リモートコンピューティングデバイス７１０からの指示に基づいて、記録を開始または停止するように構成される。マイクロフォンは、オーディオデータをリモートコンピューティングデバイス７１０に送信するように構成される。一部の例では、マイクロフォンは、ユーザのスマートフォンのものとすることができる。

ディスプレイ７０２は、カメラ７０６、リモートコンピューティングデバイス７１０、及びユーザインターフェース７０８からデータを受け取るように構成される。たとえば、ディスプレイ７０２は、カメラ７０６によってキャプチャされた視覚データを表示する。他の例では、ディスプレイ７０２は、ユーザインターフェースから受け取った入力を表示する。ディスプレイ７０２は、一部の例では、カメラ７０６及びマイクロフォン７１２に直接結合され、他の例では、カメラ７０６及びマイクロフォン７１２は、それらのデータをリモートコンピューティングデバイス７１０に送信し、次いでリモートコンピューティングデバイス７１０は、データを処理し、処理したデータに従ってディスプレイ７０２に指示する。他の例では、ディスプレイ７０２は、リモートコンピューティングデバイス７１０から受け取ったデータを表示する。リモートコンピューティングデバイス７１０からの例示的なデータには、メンタルヘルス質問票からの質問、回答ボックス、回答選択肢、回答データ、メンタルヘルス表示、または他の任意の情報が含まれる。一部の例では、ディスプレイ７０２はスマートフォンのものである。

本開示ではまた、当業者によって容易に企図されるように、システム７０２において２つ以上のディスプレイ７０２を使用できることを企図している。たとえば、１つのディスプレイは、ユーザ７０４が見ることができ、さらなるディスプレイは、研究者は見ることができるが、ユーザ７０４は見ることができない。複数のディスプレイは、リモートコンピューティングデバイス７１０による指示に従って、同一のまたは異なる情報を出力することができる。

リモートコンピューティングデバイス７１０は、ディスプレイ７０２、カメラ７０６、ユーザインターフェース７０８、及びマイクロフォン７１２に通信可能に結合することができる。たとえば、通信は有線または無線とすることができる。リモートコンピューティングデバイス７１０は、図７Ｂ～図９に従って企図される任意の方法（以下でさらに説明する）を実行するように構成される。リモートコンピューティングデバイス７１０は、ディスプレイ７０２、カメラ７０６、ユーザインターフェース７０８、及びマイクロフォン７１２からの入力を処理及び／または記憶することができる。

一部の例では、システム７００は、スマートフォンなどの単一のデバイスを有するユーザ７０４とすることができる。スマートフォンは、ディスプレイ７０２、カメラ７０６、ユーザインターフェース７０８、コンピューティングデバイス７１０、及びマイクロフォン７１０を有することができる。たとえば、ユーザ７０４は、ディスプレイ７０２上のテキストを読み、メンタルヘルス質問票に返答している間、自分の顔の前にスマートフォンを保持することができる。図１０Ａ～図１０Ｂを簡単に参照すると、例示的なインターフェース設計が示されている。図７Ａと同様のラベルが、対応する要素に使用されている。図１０Ａは、ユーザが読むためのテキストを表示する画面１０００Ａを示しており、図１０Ｂは、ビデオデータが記録されているときにユーザの顔を表示する画面１０００Ｂを示している。図１０Ａ～図１０Ｂは、開示したシステム及び方法が、ユーザがアクセスしやすいローカルデバイス上でどのように実行できるかを示している。

スクリーニング中の声／顔認識用のテストアプリケーション
図７Ｂは、本開示の例示的な実施態様による例示的な方法論７００Ｂを示している。方法論７００Ｂは、ユーザにテストを提供し、図７Ａに関して上記で論じたように、システム７００Ａによって実施することができる。

方法論７００Ｂは、ステップ７２０において、テストアプリケーションの実行及び終了を制御することを実施する。テストアプリケーションは、コンピューティングデバイス（たとえば、図７Ａのリモートコンピューティングデバイス７１０）に記憶されるソフトウェアアプリケーションとすることができる。ステップ７２０は、テストを開始する指示を受け取ると、テストアプリケーションを実行することを実施する。一部の例では、この指示は、コンピューティングデバイスに通信可能に結合されたユーザインターフェース（たとえば、図７ａのユーザインターフェース７０８）からのものである。

ステップ７２０は、コンピューティングデバイスがテストを停止する指示を受け取るまで、テストアプリケーションを実行することを実施する。一部の例では、この指示はユーザインターフェースからのものである。一部の例では、テストを停止する指示は、カメラによってキャプチャされた画像内にユーザの顔がないと、コンピューティングデバイスによって判定することを含む。

ステップ７２０に従ってテストが実行されている間に、方法論７００Ｂはステップ７２１に進む。ステップ７２１は、一連の質問を表示することを実施する。例示的な一連の質問は、メンタルヘルス質問票からの質問を含み、各質問のテキスト及び回答の両方を含む。

ステップ７２０に従ってテストが実行されている間に、方法論７００Ｂはステップ７２２を実施することができる。ステップ７２２は、ライブビデオデータを表示することを実施する。一部の例では、ディスプレイの前の画像をキャプチャするように配置されたカメラ（たとえば、図７Ａに示すように、ディスプレイ７０２の前に位置するユーザ７０４の視覚データをキャプチャするカメラ７０６）からライブビデオデータが収集される。一部の例では、ライブビデオデータが記録され、次いでディスプレイに表示され、他の例では、ライブビデオデータが同時に記録及び表示される。ディスプレイをユーザに向けることができる。

ステップ７２０に従ってテストが実行されている間に、方法論７００Ｂはステップ７２３を実施することができる。ステップ７２３は、（たとえば、図７Ａのカメラ７０６及びマイクロフォン７１２からの）テストビデオデータ及びテストオーディオデータを記録することを実施する。一部の例では、オーディオデータ及びビデオデータは、ステップ７２２における質問の表示に対応するセグメントに記録され、他の例では、ステップ７２２において質問が提示されている間に、中断されないストリームでデータが収集される。ステップ７２３の一部の例では、ビデオ及びオーディオデータは、図７Ｃの方法論７３０に従って前処理される。

一部の例では、マイクロフォン（たとえば、図７Ａのマイクロフォン７１２）は、ユーザが話しているとコンピューティングデバイスが判定すると、オーディオデータを記録する。一部の例では、ユーザが話していないとコンピューティングデバイスが判定すると、マイクロフォンはオーディオデータの記録を停止する。

ステップ７２０に従ってテストが実行されている間に、方法論７００Ｂはステップ７２４を実施することができる。ステップ７２４は、一連の質問（ステップ７２１で実施された質問）のそれぞれに対する回答を受け取ることを実施する。回答はユーザインターフェースで受け取られる。一部の例では、回答は、多項選択式の質問の選択、テキストによる返答、または当業者によって企図される他の任意のユーザ入力を含む。

ステップ７２０に従ってテストが実行されている間に、方法論７００Ｂはステップ７２５を実施することができる。ステップ７２５は、ステップ７２４において受け取られた回答と、ステップ７２３において記録されたテストビデオデータ及びテストオーディオデータとを処理することを実施する。一部の例では、この処理は、コンピューティングデバイスにおいて機械学習モデルを使用して実行され、ユーザのメンタルヘルス表示を出力する。本開示の一部の例では、ステップ７２５は、図７Ｄの方法７４０に関して以下でさらに説明するように、回答、テストビデオデータ、及びテストオーディオデータの処理を実行する。

一部の例では、出力されたメンタルヘルス表示は、ユーザがいくつかのメンタルヘルス障害のいずれか１つを有する可能性を識別する。メンタルヘルス障害には、神経精神障害、統合失調症、及び双極性障害が含まれる。一部の例では、メンタルヘルス表示は、ユーザが患者であるか健常対照であるかを識別する。

図７Ｂのステップ７２１、７２２、７２３、７２４、及び７２５は、ステップ７２０でテストアプリケーションが開始された後に順次行うことができる。方法論７００Ｂの一部の例では、ステップ７２１、７２２、７２３、７２４、及び７２５が同時に及び／または任意の組み合わせで行われる。方法論７００Ｂの一部の例では、ステップ７２１、７２２、７２３、７２４、及び７２５の一部、またはステップ７２１、７２２、７２３、７２４、及び７２５の任意のサブセットが、リモートコンピューティングデバイスからの指示に従って反復または省略される。したがって、本開示では、当業者によって容易に企図されるように、本開示の一実施形態において、ステップ７２０、７２１、７２２、７２３、７２４、及び７２５の上記の説明の任意の組み合わせを使用できることを企図している。

ここで図７Ｃの方法論７３０を参照すると、本開示の様々な実施形態による、オーディオデータ及び視覚データを前処理するための例示的な方法論が示されている。ステップ７３１において、方法論７３０は、テストビデオデータ及びテストオーディオデータを受け取ることを実施する。一部の例では、テストビデオデータ及びテストオーディオデータは、図７Ｂの方法論７００Ｂまたは本開示の他の実施形態に従って記録される。

ステップ７３２は、テストビデオデータを前処理してビデオセグメントを識別することを実施する。各ビデオセグメントは、一連の質問（たとえば、図７Ｂの方法論７００Ｂに関して説明したテストの質問）のうちの１つの質問に対応し、時間ウィンドウを含み、時間ウィンドウは、ビデオセグメントの継続時間と、ビデオセグメントが発生する記録データの期間とを提供する。一部の例では、時間ウィンドウは、開始時刻、停止時刻、及び継続時間長のいずれかを含む。一部の例では、ビデオセグメントは、質問がディスプレイにいつ表示されたかに応じて、コンピューティングデバイスからの指示に基づいて識別される。

ステップ７３３は、テストオーディオデータを前処理してオーディオセグメントを識別することを実施する。各オーディオセグメントは、一連の質問の中の１つの質問に対応し、時間ウィンドウを含み、時間ウィンドウは、ステップ７３２の時間ウィンドウに関連して提供されたものである。一部の例では、オーディオセグメントは、質問がディスプレイにいつ表示されたかに応じて、コンピューティングデバイスからの指示に基づいて識別される。一部の例では、オーディオセグメントは、コンピューティングデバイスによる、ユーザが話しているか否かの判定に基づいて識別される。

ステップ７３４は、ステップ７３２のビデオセグメント及びステップ７３３のオーディオセグメントを前処理して、重複する時間ウィンドウを識別することを実施する。ステップ７３５は、重複する時間ウィンドウに基づいて、統合されたオーディオ及びビデオセグメントを出力することを実施する。一部の例では、統合されたオーディオ及びビデオセグメントは、リモートコンピューティングデバイスに記憶される。

ここで図７Ｄの方法論７４０を参照すると、本開示の様々な実施形態による、機械学習モデルを使用して入力を分析し、メンタルヘルス表示を出力するための例示的な方法論が示されている。一部の例では、機械学習モデルは、一般化線形モデル、回帰モデル、ロジスティック回帰モデル、及び教師あり機械学習分類モデルのいずれかである。一部の例では、機械学習モデルは、以下でさらに説明するモデル及びアルゴリズムのいずれかである。

ステップ７４１において、方法論７４０は、複数の個人についてのメンタルヘルス障害状態に関するラベル付きトレーニングデータを受け取ることを実施する。一部の例では、ラベル付きトレーニングデータは、各個人が１つまたは複数のメンタルヘルス障害を有するか否かを識別する。一部の例では、ラベル付きトレーニングデータは、個人のそれぞれについて記録されたオーディオ及びビデオデータ（たとえば、図７Ｂの方法論７００Ｂまたは本開示の他の任意の実施形態によるオーディオ及びビデオデータ記録）を含む。ラベル付きトレーニングデータはまた、メンタルヘルス質問票への回答の選択を含むことができる。一部の例では、ラベル付きトレーニングデータは、各個人について、個人が健康であるか否か、個人が一般的なメンタルヘルスの問題を有するか否か、個人が１つまたは複数の特定のメンタルヘルス障害を有するか否か、個人に一般的なメンタルヘルスの問題を発症するリスクがあるか否か、あるいは個人に１つまたは複数の特定のメンタルヘルス障害を発症するリスクがあるか否か、のいずれかの指示を含む。一部の例では、ラベル付きトレーニングデータは、機能的及び／または生理学的測定データを含む。

ステップ７４２において、方法論７４０は、ステップ７４１のラベル付きトレーニングデータから特徴を決定することを実施する。特徴は、当技術分野で知られている任意の方法に従って決定される。

ステップ７４３において、方法論７４０は、ステップ７４２で決定された特徴に基づいて、教師あり様式で初期機械学習モデルをトレーニングすることを実施する。一部の例では、この初期機械学習モデルをトレーニングすることは、ロジスティック回帰を用いたｋ分割交差検証を使用することを含む。

ステップ７４４において、方法論７４０は、各特徴について重要性尺度を抽出することを実施する。これらの重要性尺度は、トレーニングされた初期機械学習モデルに基づいて選択される。

ステップ７４５において、方法論７４０は、ステップ７４４の抽出された重要性尺度に基づいて、複数のサブセット機械学習モデルを生成することを実施する。ステップ７４６において、方法論７４０は、ステップ７４５から生成されたサブセット機械学習モデルの分類性能を評価することを実施する。一部の例では、サブセット機械学習モデルのそれぞれは、異なる特徴の選択を含む。一部の例では、サブセット機械学習モデルは、閾値を超える重要性尺度を有する特徴のみを含む。

ステップ７４７において、方法論７４０は、サブセット機械学習モデルのうちの１つを一般化線形学習モデルとして選択することを実施する。この選択は、ステップ７４６で評価された分類性能に基づく。選択されたサブセット機械学習モデルは、ステップ７４２から決定された複数の特徴の一部分を含む。特徴の一部分は、閾値を超える（ステップ７４４で決定された）重要性尺度を有する特徴から選択される。一部の例では、２つ以上のサブセット機械学習モデルが選択される。

ステップ７４７の一部の例では、ステップ７４２で決定された複数の特徴のうちの少なくとも２０個の特徴が、閾値を超える重要性尺度を有するように、閾値が設定される。一部の例では、閾値は、１０～２０個の特徴の一部分を選択するように設定される。

ステップ７４７の一部の例では、サブセット機械学習モデルの少なくとも１つが診断分類器として選択される。診断分類器の特徴は、後でスクリーニングツールとして使用するためにリモートコンピューティングデバイスに記憶される。一部の例では、診断分類器はメンタルヘルス表示を出力する。メンタルヘルス表示は、（１）ユーザを健康であるかまたは一般的なメンタルヘルスの問題を有すると識別することと、（２）ユーザを健康であるかまたは特定のメンタルヘルスの問題を有すると識別することと、（３）ユーザを、第１の特定のメンタルヘルス障害を有するか、または第２の特定のメンタルヘルス障害を有すると識別することと、（４）個人のメンタルヘルス障害を発症するリスクを特定することと、のいずれかとすることができる。

次いで、選択された機械学習モデルを使用して、本開示で実施されるように、入力データのいずれかを処理することができる。一部の例では、診断分類器の特徴は、治療反応をテストする臨床試験の中間結果及び／またはエンドポイント結果を評価するためのスクリーニングツールとして使用される。

全体として、図７Ｂの方法７２０及び図７Ｃの方法７３０は、異なるモダリティで入力を受け取るアルゴリズムを提供する。方法論７４０は、方法７２０及び７３０からの入力の処理を実施して、最も高い予測値を有する特徴に基づいてアルゴリズムを出力する（予測値は重要性尺度に基づいて決定することができる）。たとえば、方法７２０及び７３０の様々な実施形態は、メンタルヘルス質問票データ、声データ、及び／またはビデオデータを受け取る。方法論７４０は、全ての入力を受け取り、入力に基づいて特徴を決定し、それらの特徴のいずれが最も高い予測値を有するかを決定する。最も高い予測値を有する特徴を組み込んだ機械学習モデルを構築することができる。

したがって、モデル、方法論、及びモデルビルダーは特に価値があり、様々な異なる尺度の計器、ビデオデータ及びオーディオデータを含む複数のモダリティからの特徴を効率的に組み合わせて、単一のモダリティモデルよりも往々にして正確であり得るマルチモーダルモデルを構築するように設計される。たとえば、従来の技術では、モダリティの新しい組み合わせごとに新しいモデルを構築してトレーニングする必要があるので、特に、ノイズを出力にあまり入れることなくモダリティを効率的に組み合わせることは完全に非現実的であり、その理由は、従来の技術は、様々なモダリティからの特徴をテストしてそれらを単一のモデルに組み込むことができないためである。具体的には、一部の例では、追加の特徴は精度が低くなり得るので、モダリティを組み合わせるための１つの鍵は、各モダリティから適切な特徴を組み込むことである。開示した技術は、それらの効率的なテスト及び組み合わせを可能にする処理及びモデルを提供する。

さらに、メンタルヘルスのスクリーナー及びモデルは、２つ以上のモダリティを調べることで恩恵を受けることが多く、一部の例では、はるかに優れた精度を生み出し得る。たとえば、尺度ベースの質問からの回答のみを処理すると、記述（ｓｔａｔｅｍｅｎｔ）を読んでいる間の声のトーン及び顔の表情、ならびに記述が読まれた速度などの他のものをキャプチャできない場合がある。この特徴は患者のメンタルヘルスの評価にとって非常に重要であり得、その理由は、たとえば、記述は様々な声のトーンで読まれたり、同じ声のトーンであるが異なる顔の表情で話されたりし得、これらは全て異なる感情及びメンタルヘルス状態表示を伝えるためである。

このモデルは次いで、診断ツールとして使用することができる。たとえば、追加のメンタルヘルス質問票データ、声データ、及び／またはビデオデータをモデルに入力して、患者のメンタルヘルス表示を決定することができる。

したがって、本開示の方法は、様々なメンタルヘルス障害を予測する特徴を決定することができる機械学習アルゴリズムを提供する。たとえば、機械学習モデルは、第１の特定のメンタルヘルス障害に関連するメンタルヘルス表示が第１の特徴のセットに依存していると判定することができ、この第１の特徴のセットは、任意の入力モダリティからのものとすることができる（たとえば、鬱病のメンタルヘルス表示は、声のトーン及び顔の表情に依存し得る）。機械学習モデルはさらに、第２の特定のメンタルヘルス障害に関連するメンタルヘルス表示が第２の特徴のセットに依存していると判定することができ、この第２の特徴のセットは、任意の入力モダリティからのものとすることができる（たとえば、不安のメンタルヘルス表示は、吃音のオーディオデータまたは話者の頻繁な自己言及に依存し得る）。したがって、異なる特徴が異なるメンタルヘルス障害に対して決定論的であり得るが、同じアルゴリズムを異なるメンタルヘルス障害及び異なる入力データに使用することができる。一部の例では、開示したアルゴリズムは、提供される入力データに基づいて、提供できるメンタルヘルス表示を自動的に調整する。

オーディオ及びビデオ記録を収集するためのアプリケーション
図８は、本開示の例示的な実施態様による例示的な方法論８００を示している。方法論８００は、テストをユーザに実施する方法を提供し、図７Ａに関して上記で論じたように、システム７００Ａによって実施することができる。

方法論８００は、ステップ８１０において、テストアプリケーションの実行及び終了を制御することを実施する。テストアプリケーションは、コンピューティングデバイス（たとえば、図７Ａのリモートコンピューティングデバイス７１０）に記憶されたソフトウェアアプリケーションとすることができる。ステップ８１０は、テストを開始する指示を受け取ると、テストアプリケーションを実行することを実施する。

ステップ８１０に従ってテストが実行されている間に、方法論８００はステップ８２０を実施することができる。ステップ８２０は、テストビデオデータ及びテストオーディオデータを記録することを実施する。テストビデオデータは、カメラ（たとえば、図７Ａのカメラ７０６）によってキャプチャすることができ、テストオーディオデータは、マイクロフォン（たとえば、図７Ａのマイクロフォン７１２）によってキャプチャすることができる。

ステップ８１０に従ってテストが実行されている間に、方法論８００はステップ８３０を実施することができる。ステップ８３０は、カメラによって記録されたライブビデオデータを表示し、ユーザが読むためにディスプレイにテキストを表示することを実施する。一部の例では、テキストは、ユーザのメンタルヘルスに関連する一連の質問または記述を含む。ユーザがテキストを読み上げると、マイクロフォンがオーディオデータをキャプチャする。一部の例では、表示されたテキストは、質問テキストと各質問の回答選択とを含む、メンタルヘルス質問票からの一連の質問を含む。

ステップ８１０に従ってテストが実行されている間に、方法論８００はステップ８４０を実施することができる。ステップ８４０は、ステップ８２０において記録されたテストビデオデータのセットを処理して、ユーザの顔を識別し、ユーザの顔がカメラの視野内にあるときを特定することを実施する。一部の例では、ステップ８４０は、複数のピクセルをユーザの顔に割り当て、ユーザの顔の複数のピクセルの全てが、カメラによってキャプチャされたフレーム内にあるか否かを判定することをさらに含む。顔がカメラによってキャプチャされたフレームの外側にあると判定された場合、ステップ８４０はテストを停止することを実施する。ステップ８４０の他の例では、複数のピクセルがユーザの顔の境界に割り当てられ、このステップはさらに、ユーザの顔の境界が、カメラによってキャプチャされたフレーム内にあるか否かを判定することを実施する。本開示はさらに、当技術分野で知られているように、ユーザの顔がカメラの視野内にあることを確認するための任意の方法を使用できることを企図している。

ステップ８１０に従ってテストが実行されている間に、方法論８００はステップ８５０を実施することができる。ステップ８５０は、テストオーディオデータ及びテストビデオデータを処理してオーディオ及びビデオ特徴を識別することを実施する。オーディオ及びビデオ特徴は、コンピューティングデバイスのメモリに記憶される。ステップ８５０の一部の例では、テストオーディオデータ及びテストビデオデータを処理することは、上記の図７Ｄの方法７４０に関して実施された通りである。一部の例では、オーディオ及びビデオ特徴は、一連の質問の中の特定の質問に対応する。

一部の例では、ステップ８５０の前、間、または後に、当業者によって容易に企図されるように、図７Ｃ及び図７Ｄの方法７３０及び７４０が、テストオーディオデータ及びテストビデオデータに適用される。

方法論８００の一部の例では、ステップ８１０でテストアプリケーションが開始された後に、ステップ８２０、８３０、８４０、及び８５０が順次行われる。一部の例では、ステップ８２０、８３０、８４０、及び８５０は同時に及び／または任意の組み合わせで行われる。一部の例では、ステップ８２０、８３０、８４０、及び８５０の一部、またはステップ８２０、８３０、８４０、及び８５０の任意のサブセットが、リモートコンピューティングデバイスからの指示に従って反復または省略される。したがって、本開示では、当業者によって容易に企図されるように、本開示の一実施形態において、ステップ８２０、８３０、８４０、及び８５０の任意の組み合わせを使用できることを企図している。

スクリーニング結果を出力するための対話型のテストアプリケーション
図９は、本開示の例示的な実施態様による例示的な方法論９００を示している。方法論９００は、テストをユーザに実施する方法を提供し、図７Ａに関して上記で論じたように、システム７００Ａによって実施することができる。

方法論９００は、ステップ９１０において、回答データのセットを受け取ることを実施する。一部の例では、回答データは、メンタルヘルス質問票からの一連の質問に対するユーザからの回答を含む。

次いで、方法論９００は、ステップ９２０において、テストビデオデータ及びテストオーディオデータのセットを受け取ることを実施する。一部の例では、テストビデオデータ及びテストオーディオデータが、カメラ及びマイクロフォン（たとえば、図７Ａのカメラ７０６及びマイクロフォン７１２）によって記録される。テストビデオデータは、テスト（たとえば、図７Ｂ及び図８の方法論７００Ｂ及び８００のテスト）中に記録され、ユーザがテキストを読んでいる間のユーザの顔を含む。たとえば、テキストは、図８の方法論８００に従って表示される。テストオーディオデータのセットもテスト中に記録され、ユーザがテキストを読んでいる間のユーザの声を表す。

次いで、方法論９００のステップ９３０は、テストビデオデータのセットを処理してビデオ特徴を出力することを実施する。ステップ９４０は、テストオーディオデータのセットを処理してオーディオ特徴を出力することを実施する。一部の例では、ステップ９３０～９４０は、図７Ｃの方法７３０に従って実行される。

方法論９００はさらに、ステップ９５０において、回答データのセット、ビデオ特徴のセット、及びオーディオ特徴のセットを処理してメンタルヘルス表示を出力することを実施する。一部の例では、ステップ９５０は、図７Ｄの方法論７４０に関して上記で論じたように実行される。

機械学習の実施態様
本開示の様々な態様は、当業者によって容易に理解されるように、機械学習アルゴリズムによって実行することができる。一部の例では、図７Ｂのステップ７２５、方法論７４０、図８のステップ８５０、及び図９のステップ９５０は、教師ありまたは教師なしのアルゴリズムによって実行することができる。たとえば、システムは、（１）決定木（「ＤＴ」）、（２）ベイジアンネットワーク（「ＢＮ」）、（３）人工ニューラルネットワーク（「ＡＮＮ」）、または（４）サポートベクターマシン（「ＳＶＭ」）を含む、より基本的な機械学習ツールを利用し得る。他の例では、深層学習アルゴリズム、または他のより高度な機械学習アルゴリズム、たとえば、畳み込みニューラルネットワーク（「ＣＮＮ」）、またはカプセルネットワーク（「ＣａｐｓＮｅｔ」）が使用され得る。

ＤＴは、入力データを、決定木の連続する各ステップで尋ねられる質問に一致させる分類グラフである。ＤＴプログラムは、質問への回答に基づいて木の「分岐」を下りる（たとえば、最初の分岐：ユーザは質問を読む前に休止したか？はいまたはいいえ。分岐２：ユーザは質問を読んでいる間に吃音をしたか？はいまたはいいえ、など）。

ベイジアンネットワーク（「ＢＮ」）は、与えられた独立変数に基づいて何かが真である尤度に基づき、確率的関係に基づいてモデル化される。ＢＮは、ある変数の、他の変数または複数の変数に基づく尤度を決定する確率的関係に純粋に基づく。たとえば、ＢＮは、位置データ、タイムスタンプデータ、以前のアラート、及び本開示によって企図される他の任意の情報の間の関係をモデル化することができる。具体的には、質問のタイプと、ユーザの聴覚データの特定の特徴とがわかっている場合、ＢＮを使用して、ユーザが特定のメンタルヘルス障害を有する確率を計算することができる。このように、効率的なＢＮアルゴリズムを使用して、入力データに基づいて推論を行うことができる。

人工ニューラルネットワーク（「ＡＮＮ」）は、動物の中枢神経系に触発された計算モデルである。これらはノードのネットワークを介して入力を出力にマッピングする。しかしながら、ＢＮとは異なり、ＡＮＮでは、ノードは必ずしも実際の変数を表すとは限らない。したがって、ＡＮＮは、観察者にとって既知の変数によって表されないノードの隠れ層を有し得る。ＡＮＮはパターン認識が可能である。それらの計算方法は、様々な入力データに基づいてメンタルヘルス障害を予測する間に発生し得る複雑で不明確な処理を理解しやすくする。

サポートベクターマシン（「ＳＶＭ」）は、機械学習統計と、ある種の極限関連構造を備えたベクトル空間（線形空間の次元数を表す線形代数の概念）とを利用するフレームワークから生まれた。場合によっては、それらは、入力を２つの分類に簡単に分離する新しい座標系を決定し得る。たとえば、ＳＶＭは、異なる分類のイベントに由来する２つの点集合を分離する線を特定することができる。

ディープニューラルネットワーク（ＤＮＮ）は、最近開発され、多くのバリエーションを有する非常に複雑な関係をモデル化することが可能である。過去数十年の間に多くの研究者によってＡＮＮなどのアルゴリズムに関連する課題に取り組むために、様々なＤＮＮのアーキテクチャが提案されてきた。これらのタイプのＤＮＮは、ＣＮＮ（畳み込みニューラルネットワーク）、ＲＢＭ（制限付きボルツマンマシン）、ＬＳＴＭ（長短期記憶）などである。それらは全てＡＮＮの理論に基づいている。それらは、ＡＮＮに関連する逆伝搬誤差の減衰の課題を克服することにより、より優れた性能を示す。

機械学習モデルには、検出するように設計された関心対象の特徴を識別するためのトレーニングデータが必要である。たとえば、ネットワークにランダムに割り当てられた初期重みを適用したり、深層学習アルゴリズムの逆伝搬を使用して勾配降下法を適用したりするなど、様々な方法を利用して機械学習モデルを形成し得る。他の例では、この技法を使用してトレーニングすることなく、１つまたは２つの隠れ層を有するニューラルネットワークを使用することができる。

一部の例では、機械学習モデルは、ラベル付きデータ、または特定のユーザ入力を表すデータを使用してトレーニングすることができる。他の例では、データには結果のみがラベル付けされ、機械学習アルゴリズムをトレーニングするために様々な関連データが入力され得る。

たとえば、特定のメンタルヘルス障害が入力データに適合するか否かを判定するために、本明細書に開示する様々なデータを入力する様々な機械学習モデルが利用され得る。一部の例では、入力データは、分野の専門家に、特定の状況に応じて関連する規則にラベルを付けてもらうことによって、ラベル付けされる。それに応じて、トレーニングデータに関する機械学習アルゴリズムへの入力によって、様々なデータが健常対照または患者からのものとして識別される。

本開示のコンピュータ及びハードウェア実施態様
本明細書の開示は、任意のタイプのハードウェア及び／またはソフトウェアで実装され得ること、ならびに事前にプログラムされた汎用コンピューティングデバイスであり得ることを最初に理解されたい。たとえば、システムは、サーバ、パーソナルコンピュータ、ポータブルコンピュータ、シンクライアント、または任意の適切な１つまたは複数のデバイスを使用して実装され得る。本開示及び／またはそのコンポーネントは、単一の場所にある単一のデバイスであり得、または電気ケーブル、光ファイバーケーブルなどの任意の通信媒体を介して、または無線方式で任意の適切な通信プロトコルを使用して相互に接続される単一または複数の場所にある複数のデバイスであり得る。

本開示は、特定の機能を実行する複数のモジュールを有するものとして本明細書で例示及び説明していることにも留意されたい。これらのモジュールは、明確にする目的でのみ、それらの機能に基づいて概略的に示しているにすぎず、必ずしも特定のハードウェアまたはソフトウェアを表していないことを理解されたい。この点で、これらのモジュールは、説明した特定の機能を実質的に実行するように実装されたハードウェア及び／またはソフトウェアであり得る。また、モジュールは、本開示内で互いに組み合わせられ得、または所望の特定の機能に基づいて追加のモジュールに分割され得る。したがって、本開示は、本発明を限定するものと解釈されるべきではなく、単にその１つの例示的な実施態様を説明するためのものと理解されるべきである。

コンピューティングシステムは、クライアント及びサーバを含むことができる。クライアント及びサーバは、概して互いに離れており、典型的には通信ネットワークを介してやりとりする。クライアント及びサーバの関係は、コンピュータプログラムがそれぞれのコンピュータ上で動作し、互いにクライアント－サーバの関係を有することにより生じる。一部の実施態様において、サーバは、（たとえば、クライアントデバイスと対話するユーザにデータを表示し、そのユーザからユーザ入力を受け取る目的で）データ（たとえば、ＨＴＭＬページ）をクライアントデバイスに送信する。（たとえば、ユーザインタラクションの結果として）クライアントデバイスで生成されたデータは、クライアントデバイスからサーバにおいて受信することができる。

本明細書に記載の主題の実施態様は、バックエンドコンポーネントをデータサーバなどとして含む、もしくはミドルウェアコンポーネント、たとえば、アプリケーションサーバを含む、またはフロントエンドコンポーネント、たとえば、ユーザがそれを通じて本明細書に記載の主題の一実施態様とやりとりできるグラフィカルユーザインターフェースもしくはウェブブラウザを有するクライアントコンピュータを含む、コンピューティングシステム内で、あるいは１つまたは複数のそのようなバックエンド、ミドルウェア、またはフロントエンドコンポーネントの任意の組み合わせで、実装することができる。システムのコンポーネントは、あらゆる形式または媒体のデジタルデータ通信、たとえば、通信ネットワークによって相互接続することができる。通信ネットワークの例には、ローカルエリアネットワーク（「ＬＡＮ」）及びワイドエリアネットワーク（「ＷＡＮ」）、インターネットワーク（たとえば、インターネット）、ならびにピアツーピアネットワーク（たとえば、アドホックピアツーピアネットワーク）が含まれる。

本明細書に記載の主題及び動作の実施態様は、デジタル電子回路で、または本明細書に開示した構造及びそれらの構造的均等物を含むコンピュータソフトウェア、ファームウェア、またはハードウェアで、あるいはそれらのうちの１つまたは複数の組み合わせで実装することができる。本明細書に記載の主題の実施態様は、１つまたは複数のコンピュータプログラム、すなわち、データ処理装置による実行のために、またはその動作を制御するためにコンピュータ記憶媒体上にコード化されたコンピュータプログラム命令の１つまたは複数のモジュールとして実装することができる。あるいは、またはさらに、プログラム命令は、人工的に生成された伝搬信号、たとえば、データ処理装置によって実行するために適切な受信機装置に送信される情報を符号化するために生成される機械生成の電気、光、または電磁信号に符号化することができる。コンピュータ記憶媒体は、コンピュータ可読記憶デバイス、コンピュータ可読記憶基板、ランダムもしくはシリアルアクセスメモリアレイもしくはデバイス、またはそれらのうちの１つまたは複数の組み合わせとすることができ、またはそれらに含めることができる。また、コンピュータ記憶媒体は伝搬信号ではないが、コンピュータ記憶媒体は、人工的に生成された伝搬信号に符号化されたコンピュータプログラム命令のソースまたは宛先とすることができる。コンピュータ記憶媒体はまた、１つまたは複数の別個の物理的コンポーネントまたは媒体（たとえば、複数のＣＤ、ディスク、または他の記憶デバイス）とすることができ、またはそれらに含めることができる。

本明細書に記載の動作は、１つまたは複数のコンピュータ可読記憶デバイスに記憶された、または他のソースから受け取ったデータに対して、「データ処理装置」によって実行される動作として実装することができる。

「データ処理装置」という用語は、データを処理するためのあらゆる種類の装置、デバイス、及び機械を含み、たとえば、プログラム可能なプロセッサ、コンピュータ、システムオンチップ、もしくは複数のもの、または前述の組み合わせを含む。装置は、ＦＰＧＡ（フィールドプログラマブルゲートアレイ）またはＡＳＩＣ（特定用途向け集積回路）などの専用の論理回路を含むことができる。装置はまた、ハードウェアに加えて、当該のコンピュータプログラムの実行環境を作成するコード、たとえば、プロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、クロスプラットフォーム実行時環境、仮想マシン、またはそれらのうちの１つまたは複数の組み合わせを構成するコードを含むことができる。装置及び実行環境は、ウェブサービス、分散コンピューティング、グリッドコンピューティングインフラストラクチャなど、様々な異なるコンピューティングモデルインフラストラクチャを実現することができる。

コンピュータプログラム（別名、プログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプト、またはコード）は、コンパイル型言語もしくはインタプリタ型言語、宣言型言語もしくは手続き型言語を含む、任意の形態のプログラム言語で書くことができ、また、任意の形態で、たとえば、独立型プログラムとして、またはモジュール、コンポーネント、サブルーチン、オブジェクト、もしくはコンピューティング環境での使用に好適な他の単位として展開することができる。コンピュータプログラムは、ファイルシステムのファイルに対応し得るが、必須ではない。プログラムは、他のプログラムまたはデータ（たとえば、マークアップ言語の文書に記憶される１つまたは複数のスクリプト）を保持するファイルの一部分に、当該のプログラム専用の単一のファイルに、あるいは複数の連携ファイル（たとえば、１つまたは複数のモジュール、サブプログラム、またはコードの一部分を記憶するファイル）に記憶することができる。コンピュータプログラムは、１つのコンピュータ上で、または１つの場所に位置するかもしくは複数の場所に分散され、通信ネットワークによって相互接続される複数のコンピュータ上で、実行されるように展開することができる。

本明細書に記載の処理及びロジックフローは、１つまたは複数のプログラム可能なプロセッサが、１つまたは複数のコンピュータプログラムを実行して、入力データに作用して出力を生成することによりアクションを行うことによって、実行することができる。処理及びロジックフローは、専用論理回路、たとえば、ＦＰＧＡ（フィールドプログラマブルゲートアレイ）またはＡＳＩＣ（特定用途向け集積回路）によって実行することもでき、装置をこれらとして実装することもできる。

コンピュータプログラムの実行に適したプロセッサは、たとえば、汎用及び専用マイクロプロセッサの両方、任意の種類のデジタルコンピュータの任意の１つまたは複数のプロセッサを含む。一般に、プロセッサは、読み取り専用メモリ、ランダムアクセスメモリ、またはその両方から命令及びデータを受け取る。コンピュータの必須の要素は、命令に従ってアクションを実行するためのプロセッサ、ならびに命令及びデータを記憶するための１つまたは複数のメモリデバイスである。一般に、コンピュータはまた、データを記憶するための１つまたは複数の大容量記憶デバイス、たとえば、磁気ディスク、光磁気ディスク、または光ディスクを含み、またはこれらからデータを受信するか、これらにデータを転送するか、またはその両方を行うように動作可能に結合される。しかしながら、コンピュータはそのようなデバイスを有する必要はない。また、コンピュータは、他のデバイス、たとえば、ほんの数例を挙げると、携帯電話、携帯情報端末（ＰＤＡ）、モバイルオーディオまたはビデオプレーヤー、ゲームコンソール、全地球測位システム（ＧＰＳ）受信機、またはポータブルストレージデバイス（たとえば、ユニバーサルシリアルバス（ＵＳＢ）フラッシュドライブ）に組み込むことができる。コンピュータプログラム命令及びデータを記憶するのに適したデバイスは、たとえば、ＥＰＲＯＭ、ＥＥＰＲＯＭ、及びフラッシュメモリデバイスなどの半導体メモリデバイス、内部ハードディスク及び着脱可能ディスクなどの磁気ディスク、光磁気ディスク、ならびにＣＤ－ＲＯＭ及びＤＶＤ－ＲＯＭディスクを含む、全ての形式の不揮発性メモリ、媒体、及びメモリデバイスを含む。プロセッサ及びメモリは、専用の論理回路によって補完することができ、またはこれに組み込むことができる。

結論
上記の種々の方法及び技法は、本発明を実施するいくつかの手段を提供する。当然ながら、必ずしも記載した全ての目的または利点を、本明細書に記載した任意の特定の実施形態に従って達成できるとは限らないことを理解されたい。よって、たとえば、当業者は、本明細書で教示または示唆した他の目的または利点を必ずしも達成することなく、本明細書で教示した１つの利点または利点群を達成または最適化するように、これらの方法を実行できることを認識するであろう。様々な代替例について本明細書において言及している。一部の実施形態は、１つの、他の、またはいくつかの特徴を具体的に含むが、他のものは、１つの、他の、またはいくつかの特徴を具体的に除外し、さらに他のものは、１つの、他の、またはいくつかの有利な特徴を含めることによって特定の特徴を軽減することを理解されたい。

さらに、当業者は、異なる実施形態からの様々な特徴の適用可能性を認識するであろう。同様に、上記で議論した様々な要素、特徴、及びステップ、ならびにそのような各要素、特徴、またはステップの他の知られている均等物は、当業者によって様々な組み合わせで使用して、本明細書に記載の原理に従う方法を実行することができる。様々な要素、特徴、及びステップの中で、一部は具体的に含まれ、その他は多様な実施形態で具体的に除外される。

本出願は特定の実施形態及び実施例の文脈で開示したが、当業者によって、本出願の実施形態が、具体的に開示した実施形態を超えて他の代替的な実施形態及び／または使用法ならびにそれらの修正例及び均等物に及ぶことは理解されよう。

一部の実施形態では、本出願の特定の実施形態を説明する文脈で（特に、以下の特許請求の範囲の特定の文脈で）使用する「１つの（ａ）」及び「１つの（ａｎ）」及び「その（ｔｈｅ）」という語ならびに類似の指示対象は、単数形及び複数形の両方を含むように解釈することができる。本明細書での値の範囲の記述は単に、範囲内に入る各個別の値を個々に指す簡単な方法として役立つことを意図している。本明細書で別段の指示のない限り、各個別の値は、本明細書で個別に列挙されているかのように、本明細書に組み込まれる。本明細書に記載の全ての方法は、本明細書で別段の指示のない限り、または文脈上明らかに矛盾しない限り、任意の好適な順序で行うことができる。本明細書の特定の実施形態に関して提供する任意の及び全ての例、または例示的な文言（たとえば、「～など」）の使用は、単に本出願をより理解しやすくすることを意図しており、別途特許請求される本出願の範囲を限定するものではない。本明細書中のいかなる文言も、本出願の実施に不可欠な任意の特許請求していない要素を示すものと解釈されるべきではない。

本出願の特定の実施形態を本明細書に記載している。それらの実施形態の変形は、前述の説明を読むと、当業者には明らかになろう。当業者がそのような変形を適宜使用することができ、本明細書に具体的に記載した以外の方法で本出願を実施できることを企図している。したがって、本出願の多くの実施形態は、適用法によって許容されるように本明細書に添付される特許請求の範囲に列挙した主題の全ての修正及び均等物を含む。また、本明細書で別段の指示のない限り、または文脈上明らかに矛盾しない限り、それらの全ての可能な変形における上述の要素の任意の組み合わせが本出願によって包含される。

本主題の特定の実施態様を説明してきた。他の実施態様は、以下の特許請求の範囲内にある。場合によっては、特許請求の範囲に列挙したアクションは、異なる順序で実行され、それでも望ましい結果を達成することができる。さらに、添付の図面に示した処理は、望ましい結果を達成するために、図示した特定の順序または順次的な順序を必ずしも必要としない。

本明細書で参照される全ての特許、特許出願、特許出願公開、ならびに記事、書籍、明細書、刊行物、文書、物品、及び／または同様のものなどの他の資料は、この引用によってそれらの全体が全ての目的のために本明細書に組み込まれるが、それらに関連する出願経過、本文書と不一致であるかもしくは矛盾するもの、または現在もしくは今後本文書に関連する特許請求の範囲の最も広い範囲に関して限定的な影響を有し得るものは除外される。例として、組み込まれる資料のいずれかに関連する用語の説明、定義、及び／または用法と、本文書に関連するものとの間に不一致または矛盾がある場合、本文書における用語の説明、定義、及び／または用法が優先するものとする。

最後に、本明細書で開示した本出願の実施形態は、本出願の実施形態の原理の例示であることを理解されたい。使用できる他の修正は、本出願の範囲内とすることができる。よって、限定ではなく例として、本出願の実施形態の代替的な構成を本明細書の教示に従って利用することができる。したがって、本出願の実施形態は、図示及び説明した正確なものに限定されない。

参考文献

Claims

ディスプレイと、
マイクロフォンと、
前記ディスプレイの前の画像をキャプチャするように配置され、ビデオデータを出力するように構成されたカメラと、
ユーザインターフェースと、
ユーザのメンタルヘルスを評価する方法を実行するための命令が記憶された機械実行可能コードを含む機械可読媒体を含むメモリと、
１つまたは複数のプロセッサを含む、前記メモリに結合された制御システムであって、前記機械実行可能コードを実行して、前記制御システムに、
テストアプリケーションを実行すること
を行わせるように構成されている、前記制御システムと、
を備え、
前記テストアプリケーションは、機械可読コードを含み、前記機械可読コードは、実行されたときに、
前記カメラによって記録されたライブビデオデータを前記ディスプレイに表示することと、
前記カメラによってテストビデオデータのセットを記録することと、
前記マイクロフォンによってテストオーディオデータのセットを記録することと、
前記テストビデオデータの複数のピクセルを前記ユーザの顔に割り当てるために、前記テストビデオデータを処理することと、
前記ユーザの顔の表情を含むビデオ特徴を出力するために、前記複数のピクセルを処理することと、
前記ユーザの声を表す音を識別し、かつ、前記ユーザの声のトーンを含むオーディオ特徴を出力するために、前記テストオーディオデータを処理することと、
機械学習モデルを使用して、前記オーディオ特徴及び前記ビデオ特徴を処理することと、
前記ユーザが複数のメンタルヘルス障害の少なくとも１つを有するか否かの表示を出力することと、
を実行し、
前記機械学習モデルは決定木を含み、前記機械学習モデルは、複数の個人から記録されたオーディオデータ及びビデオデータを含みかつ前記複数の個人のそれぞれが前記複数のメンタルヘルス障害の１つを有するか否かを示すラベルを有するトレーニングデータのセットによって、事前にトレーニングされたものである、
患者のメンタルヘルスをスクリーニングするためのシステム。
前記マイクロフォンによって記録することが、
前記ユーザが話していると前記制御システムによって判定すると、前記記録を開始すること
をさらに含む、請求項１に記載のシステム。
前記制御システムが、
前記テストビデオデータのセットと前記テストオーディオデータのセットとを受け取ることと、
複数のビデオセグメントを識別するために、前記受け取ったテストビデオデータのセットを前処理することであって、各ビデオセグメントが、一連の質問の中の１つの質問に対応し、かつ時間ウィンドウを含む、前記前処理することと、
複数のオーディオセグメントを識別するために、前記受け取ったテストオーディオデータのセットを前処理することであって、各オーディオセグメントが、前記一連の質問の中の１つの質問に対応し、かつ時間ウィンドウを含む、前記前処理することと、
を行うようにさらに構成されている、請求項１に記載のシステム。
前記制御システムが、
重複する時間ウィンドウを識別するために、前記複数のオーディオセグメント及び前記複数のビデオセグメントを前処理することと、
前記識別された重複する時間ウィンドウに基づいて、統合されたオーディオセグメント及びビデオセグメントのセットを出力することと、
を行うようにさらに構成されている、請求項３に記載のシステム。
ディスプレイと、
マイクロフォンと、
前記ディスプレイの前の画像をキャプチャし、ビデオデータを出力するように構成されたカメラと、
ユーザインターフェースと、
方法を実行するための命令が記憶された機械実行可能コードを含む機械可読媒体を含むメモリと、
１つまたは複数のプロセッサを含む、前記メモリに結合された制御システムであって、前記機械実行可能コードを実行して、前記制御システムに、
テストを開始する指示を前記ユーザインターフェースを介して受け取り、前記テストを停止する指示を受け取るまでテストアプリケーションを実行すること、
を行わせるように構成されている、前記制御システムと、
を備え、
前記テストアプリケーションが、
前記ユーザが読むために前記ディスプレイにテキストを表示することと、
前記テスト中にテストビデオデータのセットを前記カメラによって記録することと、
前記カメラによって記録されたライブビデオデータを表示するウィンドウを前記ディスプレイに表示することと、
前記テスト中に、
前記ユーザの顔を識別する、
前記顔の複数のピクセルの全てがフレーム内にあるか否かを判定する、及び
前記顔が前記フレームの外側にある場合に前記テストを停止する
ために、前記テストビデオデータのセットを継続的に処理することと、
前記テスト中にテストオーディオデータのセットを前記マイクロフォンによって記録することと、
前記ユーザの声のトーンを含むオーディオ特徴及び前記ユーザの顔の表情を含むビデオ特徴を識別するために、前記テストオーディオデータのセット及び前記テストビデオデータのセットを処理することと、
機械学習モデルを使用して、前記オーディオ特徴及び前記ビデオ特徴を処理することと、
前記ユーザがメンタルヘルス障害を有すると分類されるか否かに関する、前記ユーザのメンタルヘルス表示を出力することと、
を含み、
前記機械学習モデルは、複数の個人から記録されたオーディオデータ及びビデオデータを含みかつ前記複数の個人のそれぞれが複数のメンタルヘルス障害の１つを有するか否かを示すラベルを有するトレーニングデータのセットによって、事前にトレーニングされたものである、
患者のメンタルヘルスをスクリーニングするためのシステム。
前記表示されたテキストが、各質問についてのテキスト及び回答を含むメンタルヘルス質問票からの一連の質問を含む、請求項５に記載のシステム。
前記オーディオ特徴及びビデオ特徴のそれぞれが、前記一連の質問の中の質問に対応する、請求項６に記載のシステム。
前記テストオーディオデータのセット及び前記テストビデオデータのセットを処理することが、
重複する時間ウィンドウを識別するために、前記テストオーディオデータ及び前記テストビデオデータのセットを前処理することと、
前記識別された重複する時間ウィンドウに基づいて、統合されたオーディオセグメント及びビデオセグメントのセットを出力することと、
前記ユーザのメンタルヘルス状態を特定するために、前記統合されたオーディオセグメント及びビデオセグメントのセットを機械学習モデルによって処理することと、
をさらに含む、請求項５に記載のシステム。
前記機械学習モデルが、一般化線形モデル、回帰モデル、ロジスティック回帰モデル、及び教師あり機械学習分類モデルのうちの少なくともの１つである、請求項８に記載のシステム。
方法を実行するための命令が記憶された機械実行可能コードを含む機械可読媒体を含むメモリと、
１つまたは複数のプロセッサを含む、前記メモリに結合された制御システムであって、前記機械実行可能コードを実行して、前記制御システムに
前記ユーザがテキストを読んでいる間の前記ユーザの顔を表す、テストビデオデータのセットを受け取ることと、
前記ユーザの顔の表情のセットを含むビデオ特徴のセットを出力するために、前記テストビデオデータのセットを処理することであって、前記ビデオデータの複数のピクセルを前記ユーザの顔に割り当てることを含む、処理することと、
前記ユーザがテキストを読んでいる間の前記ユーザの声を表す、テストオーディオデータのセットを受け取ることと、
前記ユーザの声のトーンを含むオーディオ特徴のセットを出力するために、前記オーディオデータのセットを処理することであって、前記ユーザの声を表す音を識別することを含む、処理することと、
メンタルヘルス障害に関する前記ユーザのメンタルヘルスの表示を出力するために、機械学習モデルを使用して、前記ビデオ特徴のセット、及び前記オーディオ特徴のセットを処理することと、
前記ユーザがメンタルヘルス障害を有するか否かの表示を出力すること
を行わせるように構成されている、前記制御システムと、
を備える、
患者のメンタルヘルスをスクリーニングするためのシステムであって、
前記機械学習モデルは、一般化線形モデル、回帰モデル、ロジスティック回帰モデル、及び教師あり機械学習分類モデルのうちの少なくとも１つであり、前記機械学習モデルは、複数の個人から記録されたオーディオデータ及びビデオデータを含みかつ前記複数の個人のそれぞれが複数のメンタルヘルス障害の１つを有するか否かを示すラベルを有するトレーニングデータのセットによって、事前にトレーニングされたものである、
前記システム。
プロセッサ実行可能命令またはデータの少なくとも１つを記憶する少なくとも１つの非一時的プロセッサ可読記憶媒体と、
前記少なくとも１つの非一時的プロセッサ可読記憶媒体に通信可能に結合された少なくとも１つのプロセッサと、
を備え、
動作において、前記少なくとも１つのプロセッサが、
ユーザがデジタルディスプレイからのテキストを読んでいる間に記録されたビデオデータ及びオーディオデータであって、前記ビデオデータが、前記ユーザの顔を含む前記ビデオデータの部分の第１のセットを識別するように処理され、前記オーディオデータが、前記ユーザの声を表す音を含む部分の第２のセットを識別するように処理される、前記ビデオデータ及び前記オーディオデータを、受け取ることと、
前記部分の第１のセットに由来する前記ユーザの顔の表情に関する第１の特徴のセット及び前記部分の第２のセットからの前記ユーザの声のトーンに関する第２の特徴のセットを含む、複数の特徴を出力するために、前記オーディオデータ、及び前記ビデオデータを処理することと、
前記ユーザがメンタルヘルス障害を有するか否かの表示を出力するために、前記第１の特徴のセット及び前記第２の特徴のセットを機械学習モデルで処理することと、
を行うように構成されている、
機械学習トレーニングシステムであって、
前記機械学習モデルは、複数の個人からのラベル付きオーディオデータ及びビデオデータであって、メンタルヘルス質問票に対する返答に基いて前記複数の個人がメンタルヘルス障害を有するか否かを示すラベルを有する前記ラベル付きオーディオデータ及びビデオデータによって、事前にトレーニングされた、一般化線系モデルを含む、
前記機械学習トレーニングシステム。
前記ラベル付きトレーニングデータが、機能的測定データまたは生理学的測定データの少なくとも１つをさらに含む、請求項１１に記載の機械学習システム。
前記機械学習モデルが、
複数の個人のそれぞれが１つ又は複数のメンタルヘルス障害を有するか否かを示す、前記複数の個人についてのラベル付きトレーニングデータを受け取ることであって、前記ラベル付きトレーニングデータが、
トレーニングテスト中に記録した前記複数の個人のそれぞれについて記録されたオーディオデータ及びビデオデータ
を含む、前記受け取ることと、
前記ラベル付きトレーニングデータから複数の特徴を決定することと、
前記複数の特徴に基づいて、教師あり様式で初期機械学習モデルをトレーニングすることと、
前記初期機械学習モデルの前記トレーニングに基づいて、前記複数の特徴のそれぞれについて重要性尺度を抽出することと、
前記複数の特徴についての前記抽出された重要性尺度に基づいて、複数のサブセット機械学習モデルを生成することと、
前記生成された複数のサブセット機械学習モデルの分類性能を評価することと、
前記サブセット機械学習モデルの少なくとも１つを前記機械学習モデルとして選択することと、
によって生成される、請求項１１に記載の機械学習システム。
前記選択されたサブセット機械学習モデルが、前記複数の特徴の一部分を含み、前記部分が、閾値を上回る重要性尺度を有する特徴から選択される、請求項１３に記載の機械学習システム。
前記複数の特徴のうちの少なくとも２０個の特徴が、閾値を上回る重要性尺度を有し、前記複数の特徴の前記部分が少なくとも１０個の特徴及び２０個未満の特徴を含む、請求項１４に記載の機械学習システム。
前記サブセット機械学習モデルのそれぞれが、前記複数の特徴の前記部分の、異なる選択を含む、請求項１４に記載の機械学習システム。
前記初期機械学習モデルをトレーニングすることが、ロジスティック回帰を用いたｋ分割交差検証を使用することをさらに含む、請求項１３に記載の機械学習システム。