JP6804779B2 - 軽度の認知機能障害の推定システム、軽度の認知機能障害の推定装置、及び軽度の認知機能障害の有無を推定するためのプログラム - Google Patents

軽度の認知機能障害の推定システム、軽度の認知機能障害の推定装置、及び軽度の認知機能障害の有無を推定するためのプログラム Download PDF

Info

Publication number
JP6804779B2
JP6804779B2 JP2019128769A JP2019128769A JP6804779B2 JP 6804779 B2 JP6804779 B2 JP 6804779B2 JP 2019128769 A JP2019128769 A JP 2019128769A JP 2019128769 A JP2019128769 A JP 2019128769A JP 6804779 B2 JP6804779 B2 JP 6804779B2
Authority
JP
Japan
Prior art keywords
subject
time
mild cognitive
question
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019128769A
Other languages
English (en)
Other versions
JP2020127703A5 (ja
JP2020127703A (ja
Inventor
厳 増岡
厳 増岡
伯秀 舞草
伯秀 舞草
Original Assignee
日本テクトシステムズ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本テクトシステムズ株式会社 filed Critical 日本テクトシステムズ株式会社
Publication of JP2020127703A publication Critical patent/JP2020127703A/ja
Publication of JP2020127703A5 publication Critical patent/JP2020127703A5/ja
Application granted granted Critical
Publication of JP6804779B2 publication Critical patent/JP6804779B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Medical Treatment And Welfare Office Work (AREA)

Description

本発明は、被検者の音声データを用いて軽度の認知機能障害の有無を推定する軽度の認知機能障害の推定システム及び軽度の認知機能障害の推定装置に関する。
超高齢化社会を迎えつつある現在、医療機関を受診する認知症発症者の数は急激に増加しており、2015年の世界アルツハイマー報告によると、2015年に全世界で4,680万人の認知症発症者が存在し、2050年までに1億3,150万人に増加すると予想されている。現在のところ認知症に対する決定的な治療法は確立されていないものの、軽度の認知機能障害が認められる段階での発見により以後の認知症の進行を遅くできる可能性があるため、認知症の早期発見方法の開発が強く望まれている。
これまでに実施されてきた代表的な認知症のスクリーニング手法として、改訂長谷川式簡易知能評価スケール(HDS−R)や、ミニメンタルステート検査(MMSE)などが挙げられる。これらは音声諮問を主とした手法であるが、スクリーニングの実施に要する時間が長い、十分なトレーニングを受けた検査者でなければ実施が難しい、などの問題点が指摘されている。そこで、これらの問題点を解消する技術として、被検者の音声データから抽出された音声特徴量を使用した機械学習によって専門医による診断結果を推定する自動識別技術が検討されてきた。これらの自動識別技術は被検者が認知症か否かを確定するものでは無く、認知症か否かの診断はむしろ米国精神医学会による診断マニュアルであるDiagnostic and Statistical Manual of Mental Disorders−5(DSM−5)などに基づき専門家により慎重になされるべきであるが、認知機能障害の疑いがあることを早期に被検者或いはその関係者に知らせることにより早期治療の開始につなげることが可能になる。
例えば、非特許文献1(情報処理学会研究報告Vol.2017−SLP−117 No.8,pp1−6(2017))には、認知症の早期発見を目標として、臨床的認知症尺度(CDR)のスコアが0(健常)、0.5(認知症の疑い)、及び1(軽度認知症)の被検者を対象とし、HDS−Rの各質問に対する被検者の回答の正誤、回答音声に対する発話スタイル分析より定義される音声素性、及び、回答音声に対する音声認識結果より定義される言語素性を用い、各種機械学習法を用いて専門医による診断結果(CDRスコア0、0.5、1)を予測する実験の結果が報告されている。この文献では、音声素性として、音声からの感情認識や発話スタイル認識で広く使われているopenSMILE(非特許文献2(http://audeering.com/technology/opensmile)参照)のemobaseといわれる音声特徴量セットが使用されており、言語素性として、CSJ−Kaldiによる認識結果に対するキーワード素性が使用されており、8種類の識別器が機械学習のために使用されている。emobaseは、音声強度・音圧・12のメル周波数ケプストラム係数・ピッチ・ピッチの包絡・音声プロバビリティ・8の線スペクトル対・0交差比の計26種類の特徴量とこれらの特徴量の時間差分のそれぞれに対して19種類の統計量(最大・最小・範囲・平均・最大/最小の絶対値・線形近似の傾き/切片/誤差・放物線近似の誤差・標準偏差・分布の歪度/尖度・第k四分位数(k=1,2,3)・第1−2四分位範囲・第2−3四分位範囲・第1−3四分位範囲)を求めた、合計988種類(26×2×19)の短期的音声特徴量から構成される統計的な音声特徴量セットである。そして、使用された識別器の種類によって識別精度が上下するものの、HDS−Rにおける日時の見当識に関する質問に関する正解点数のみを用いた識別では0.56〜0.63の精度が得られたのに対し、上記質問に対する回答音声から抽出された音声素性のみを用いた識別では0.47〜0.55の精度しか得られず、上記質問に対する回答音声から抽出された言語素性のみを用いた識別では0.43〜0.56の精度しか得られず、上記質問に対する回答の正解点数に対して音声・言語素性を追加した識別でも0.34〜0.64の精度に留まったことが示されている。したがって、上述の結果から判断される限り、機械学習によるCDRスコアの識別の精度の向上のためには音声特徴量の追加が有効に作用しなかったことが分かる。
非特許文献3(日本音響学会2018年春季研究発表会講演論文集 1−Q−44(2018))は、重症度が軽度である認知症発症者に限定した検討ではないが、統計的パラメトリック音声合成の合成音声品質に有効である変調スペクトル(非特許文献4(IEEE/ACM Trans,on Audio,Speech and Language Processing,Vol.24,No.4,pp755−767(2016))参照)を導入した自動識別技術を提案している。変調スペクトルは、音声特徴量時系列の対数パワースペクトルとして定義され、音声特徴量時系列の時間変動をフーリエ基底を用いて表現した長期的な音声特徴量である。変調スペクトルは任意の短期的音声特徴量の時間変化から算出可能であるが、この文献では、識別性能が高い変調スペクトルとしてメル周波数ケプストラム係数の変調スペクトルが採用されており、modcepといわれるメル周波数ケプストラム係数の変調スペクトルのケプストラム(変調ケプストラム)の低次成分が上述したemobaseと共に音声特徴量セットとして用いられている。そして、HDS−Rの質問に対する回答時の音声データから抽出された上記音声特徴量セットに含まれる音声特徴量と4種類の識別器を使用し、アルツハイマー型認知症発症者と健常者との2値分類タスクを行ったところ、emobaseを用いた場合には識別率が47.2〜54.2%であったのに対し、modcepを用いた場合には識別率が51.9〜56.5%であり、emobaseとmodcepの結合ベクトルを用いた場合には識別率が47.2〜55.1%であり、modcepが識別率を向上させたことが報告されている。しかしながら、音声特徴量のみを用いた自動識別における識別率はこの文献においても57%以下に留まっている。
なお、自動識別技術のために使用可能な音声特徴量セットはemobase及びmodcepの他にも存在し、Tsanas features、YAAFE features等、多くの音声特徴量セットが知られている(例えば、非特許文献5(PLos ONE 12(10):e0185613(2017))の表2参照)。
情報処理学会研究報告Vol.2017−SLP−117 No.8,pp1−6(2017) http://audeering.com/technology/opensmile 日本音響学会2018年春季研究発表会講演論文集 1−Q−44(2018) IEEE/ACM Trans,on Audio,Speech and Language Processing,Vol.24,No.4,pp755−767(2016) PLos ONE 12(10):e0185613(2017) https://www.chiba.med.or.jp/personnel/nursing/download/text2012_10.pdf
音声データを使用した機械学習によって専門医による診断結果を推定する自動識別技術は、簡便性及び迅速性の点で極めて優れているものの、上述したようにこれまでの検討において満足できる正答率の値が得られているとは言えない。また、軽度の認知機能障害が認められる段階での発見により以後の認知症の進行を遅くできる可能性があるため、軽度の認知機能障害が認められる段階での自動識別を可能にする技術が望まれる。
そこで、本発明の目的は、音声データを使用することにより簡便且つ迅速に被検者における軽度の認知機能障害の有無を推定する軽度の認知機能障害の推定システムであって、向上した正答率を有する推定システムを提供することである。
発明者らは、軽度の認知機能障害の疑いの有無を短時間に且つ高い正答率で識別することに適した質問を発見すべく、代表的な認知症のスクリーニング手法であって且つ長期間にわたる実績を有しているHDS−Rに着目して検討を行った。以下に、HDS−Rの各質問及び正解点数を示す。HDS−Rの総合得点は30点満点であり、20点以下で認知症の疑いが高まるとされている。また、各質問における正解点数の算出のためのルールは質問毎に定められており、例えば、質問1に関する回答が実年齢±2である場合には正解点数が1点とされ、それ以外の場合は誤答として正解点数が0点とされる。
Figure 0006804779
発明者らはまず、専門家により認知症発症者と診断された者の中からHDS−Rの総合得点が14点以上である者を「軽度の認知機能障害発症者」として選定した。すなわち、本発明に関する限り、「軽度の認知機能障害」の語は「認知症において認められるHDS−Rの総合得点が14点以上である認知機能障害」を意味する。HDS−Rは認知症の重症度の判定のために使用されるものではないが、一方で各重症度群間のHDS−Rの総合得点に有意差が認められており、重症度が軽度の群の平均得点が19±5点であることが知られている(非特許文献6(https://www.chiba.med.or.jp/personnel/nursing/download/text2012_10.pdf)参照)ため、本発明ではこの情報を基に「軽度の認知機能障害」の語を上述のように定義した。
発明者らは次に、健常者と軽度の認知機能障害発症者に関し、HDS−Rの各質問に対する回答の正解点数のみを用いた健常/軽度の認知機能障害の自動識別、及び、HDS−Rの各質問に対する回答時の音声データから抽出した音声特徴量のみを用いた健常/軽度の認知機能障害の自動識別における正答率を評価した。なお、正答率とは、以下の式から算出される値である。
正答率=(真陽性者数+真陰性者数)/(被検者数)
その結果、以下で詳細を示すが、HDS−Rの各質問に対する回答の正解点数のみを用いた自動識別においては、質問7、すなわち、3つの言葉の遅延再生に関する質問を用いた場合の正答率が最も高く、次いで、質問2、すなわち、日時の見当識に関する質問を用いた場合の正答率が高かった。HDS−Rの各質問に対する回答時の音声データから抽出した音声特徴量のみを用いた自動識別では、質問の種類による影響は小さく正答率が0.6前後であり、質問2〜9に関しては、非特許文献1における結果と同様に、音声特徴量のみを用いた場合の正答率の値が正解点数のみを用いた場合の正答率の値より低かった。
質問7、すなわち、3つの言葉の遅延再生に関する質問に対する回答の正解点数を用いた自動識別における正答率は0.9にも達し、極めて高い値であった。したがって、質問7が軽度の認知機能障害の有無の推定のために極めて優れていることが分かる。しかし、この質問の開始から回答を得るまでには比較的長い時間を要するため、評価の簡便性及び迅速性の点で問題がある。そこで、発明者らは、回答の正解点数のみを用いた自動識別において次に正答率の値が高く、質問の開始から回答を得るまでに要する時間が短時間で済む質問2、すなわち、日時の見当識に関する質問に着目し、この質問に対する回答時の音声データを使用した自動識別における正答率の向上方法を検討した。日時の見当識に関する質問は、被検者における軽度の認知機能障害の有無を推定するための検査サーバと被検者が質問に対する回答を音声で入力するために使用する被検者端末とがインターネット回線等の通信回線を介して接続されている場合でも、検査サーバが回答の正誤を自動判定することができる点でも好適である。
その結果、発明者らは、被検者の質問2に対する回答の正解点数と、この質問に対する回答時の音声データから抽出した音声特徴量に加えて、被検者の年齢も用いて機械学習による自動識別を行うと、正答率が質問7に関する正答率に匹敵するまでに向上することを発見し、本発明を完成させた。以下に詳細に示すが、年齢のみを用いた自動識別の正答率は、質問2に対する回答の正解点数のみを用いた自動識別における正答率より低い値が得られている。しかしながら、年齢の導入は正答率の向上に効果的に寄与した。また、質問2に対する質問の正解点数とこの質問に対する回答時の音声データから抽出した音声特徴量とを用いた自動識別、及び、質問2に対する回答の正解点数と年齢とを用いた自動識別の場合には、満足できる正答率の向上が得られなかった。
そこで、本発明はまず、
通信回線を介して接続された検査サーバと被検者端末とを含む、被検者における軽度の認知機能障害の有無を推定する軽度の認知機能障害の推定システムであって、
上記検査サーバが、
健常者及び軽度の認知機能障害発症者のそれぞれについての、年齢と、日時の見当識に関する質問に対する回答の正解点数と、上記日時の見当識に関する質問に対する回答時の音声データから抽出された1種以上の音声特徴量と、から成る学習データに基づき軽度の認知機能障害の有無を出力するように学習させられた識別器と、
上記被検者端末から送信された、上記被検者についての、年齢情報と、上記日時の見当識に関する質問に対する回答の情報と、上記日時の見当識に関する質問に対する回答時の音声データと、を含む被検者情報を受信するデータ取得部と、
上記被検者情報に基づき、上記回答の正解点数を取得すると共に、上記音声データから上記1種以上の音声特徴量を抽出するデータ解析部と、
上記被検者についての年齢と上記正解点数と上記1種以上の音声特徴量とを上記識別器に入力し、上記識別器から出力された上記被検者における軽度の認知機能障害の有無を推定結果として上記被検者端末に送信する推定結果出力部と
を備えていることを特徴とする軽度の認知機能障害の推定システムに関する。本発明はまた、通信回線を介して接続された検査サーバと被検者端末とによって被検者における軽度の認知機能障害の有無を推定するためのプログラムであって、
上記検査サーバ用のコンピュータに、
健常者及び軽度の認知機能障害発症者のそれぞれについての、年齢と、日時の見当識に関する質問に対する回答の正解点数と、上記日時の見当識に関する質問に対する回答時の音声データから抽出された1種以上の音声特徴量と、から成る学習データに基づき軽度の認知機能障害の有無を出力するように学習させられた識別器を構成するステップと、
上記被検者端末から送信された、上記被検者についての、年齢情報と、上記日時の見当識に関する質問に対する回答の情報と、上記日時の見当識に関する質問に対する回答時の音声データと、を含む被検者情報を受信するステップと、
上記被検者情報に基づき、上記回答の正解点数を取得すると共に、上記音声データから上記1種以上の音声特徴量を抽出するステップと、
上記被検者についての年齢と上記正解点数と上記1種以上の音声特徴量とを上記識別器に入力し、上記識別器から出力された上記被検者における軽度の認知機能障害の有無を推定結果として上記被検者端末に送信するステップと
を実行させ、
上記被検者端末用のコンピュータに、
上記被検者についての、年齢情報と、上記日時の見当識に関する質問に対する回答の情報と、上記日時の見当識に関する質問に対する回答時の音声データと、を含む被検者情報を取得し、取得した被検者情報を上記検査サーバに対して送信するステップと、
上記検査サーバから送信された、上記検査サーバの識別器が出力した上記被検者における軽度の認知機能障害の有無に関する推定結果を受信し、受信した推定結果を上記被検者に対して提示するステップと
を実行させる
ことを特徴とするプログラムに関する。
本発明はまた、
被検者における軽度の認知機能障害の有無を推定する軽度の認知機能障害の推定装置であって、
健常者及び軽度の認知機能障害発症者のそれぞれについての、年齢と、日時の見当識に関する質問に対する回答の正解点数と、上記日時の見当識に関する質問に対する回答時の音声データから抽出された1種以上の音声特徴量と、から成る学習データに基づき軽度の認知機能障害の有無を出力するように学習させられた識別器と、
上記被検者についての、年齢情報と、上記日時の見当識に関する質問に対する回答の情報と、上記日時の見当識に関する質問に対する回答時の音声データと、を含む被検者情報を取得するデータ取得部と、
上記被検者情報に基づき、上記回答の正解点数を取得すると共に、上記音声データから上記1種以上の音声特徴量を抽出するデータ解析部と、
上記被検者についての年齢と上記正解点数と上記1種以上の音声特徴量とを上記識別器に入力し、上記識別器から出力された上記被検者における軽度の認知機能障害の有無を推定結果として出力する推定結果出力部と
を備えていることを特徴とする軽度の認知機能障害の推定装置に関する。本発明はまた、被検者における軽度の認知機能障害の有無を推定するためのプログラムであって、
コンピュータに、
健常者及び軽度の認知機能障害発症者のそれぞれについての、年齢と、日時の見当識に関する質問に対する回答の正解点数と、上記日時の見当識に関する質問に対する回答時の音声データから抽出された1種以上の音声特徴量と、から成る学習データに基づき軽度の認知機能障害の有無を出力するように学習させられた識別器を構成するステップと、
上記被検者についての、年齢情報と、上記日時の見当識に関する質問に対する回答の情報と、上記日時の見当識に関する質問に対する回答時の音声データと、を含む被検者情報を取得するステップと、
上記被検者情報に基づき、上記回答の正解点数を取得すると共に、上記音声データから上記1種以上の音声特徴量を抽出するステップと、
上記被検者についての年齢と上記正解点数と上記1種以上の音声特徴量とを上記識別器に入力し、上記識別器から出力された上記被検者における軽度の認知機能障害の有無を推定結果として出力するステップと
を実行させることを特徴とするプログラムに関する。
なお、本発明において、日時の見当識に関する質問はHDS−Rの質問2に限定されず、例えば季節に関する質問が含まれていても良く、年、月、日及び曜日に関する質問の一部を欠いていても良い。また、上記データ取得部は、各被検者について年齢と日時の見当識に関する質問に対する回答の正解点数とを特定するために必要になる年齢情報及び上記質問に対する回答の情報を、タッチパネル式ディスプレーやキーボード等を介して文字列として取得しても良く、音声データとして取得しても良い。音声データとして取得された場合には、上記データ解析部が、年齢を問う質問に対する回答時の音声データから被検者の年齢を特定し、日時の見当識に関する質問に対する回答時の音声データから回答の正解点数を特定すると共に1種以上の音声特徴量を抽出し、得られたデータが上記推定結果出力部において被検者における軽度の認知機能障害の有無を推定するために使用される。
本発明の軽度の認知機能障害の推定システム及び軽度の認知機能障害の推定装置により、被検者における軽度の認知機能障害の有無を簡便且つ迅速にしかも高い正答率で推定することができる。
第1の実施の形態の軽度の認知機能障害の推定システムの構成の概略を示す図である。 図1に示す軽度の認知機能障害の推定システムの機能ブロック図である。 図2に示す識別器による機械学習のプロセスを示すフローチャートである。 図1に示す軽度の認知機能障害の推定システムによる軽度の認知機能障害の推定のプロセスを示すフローチャートである。 第2の実施の形態の軽度の認知機能障害の推定装置の機能ブロック図である。 HDS−Rの各質問に対する正解点数のみを使用した自動識別における正答率と、各質問に対する回答時の音声データから抽出された音声特徴量のみを使用した自動識別における正答率と、年齢のみを使用した自動識別における正答率と、を比較した図である。 音声特徴量セットとしてmodcepを使用し、識別器として勾配ブースティング木を使用した場合の、HDS−Rの質問2に対する回答の正解点数と回答時の音声データから抽出された音声特徴量と年齢とを使用した自動識別における正答率を、正解点数のみを使用した自動識別における正答率、正解点数と音声特徴量とを使用した自動識別における正答率、及び、正解点数と年齢とを使用した自動識別における正答率と比較した図である。 音声特徴量セットとしてemobaseを使用し、識別器として勾配ブースティング木を使用した場合の、HDS−Rの質問2に対する回答の正解点数と回答時の音声データから抽出された音声特徴量と年齢とを使用した自動識別における正答率を、正解点数のみを使用した自動識別における正答率、正解点数と音声特徴量とを使用した自動識別における正答率、及び、正解点数と年齢とを使用した自動識別における正答率と比較した図である。 音声特徴量セットとしてemobaseとmodcepとの結合ベクトルを使用し、識別器として勾配ブースティング木を使用した場合の、HDS−Rの質問2に対する回答の正解点数と回答時の音声データから抽出された音声特徴量と年齢とを使用した自動識別における正答率を、正解点数のみを使用した自動識別における正答率、正解点数と音声特徴量とを使用した自動識別における正答率、及び、正解点数と年齢とを使用した自動識別における正答率と比較した図である。
以下、本発明の軽度の認知機能障害の推定システム及び軽度の認知機能障害の推定装置の実施の形態について説明するが、本発明の軽度の認知機能障害の推定システム及び軽度の認知機能障害の推定装置は以下の実施の形態に限定されず、本発明の趣旨を逸脱しない範囲での変更が可能である。
第1の実施の形態
図1は、本実施の形態の軽度の認知機能障害の推定システム1の構成の概略を示した図である。軽度の認知機能障害の推定システム1は、このシステム1を利用する被検者に関する情報を入出力するための被検者端末20と、被検者端末20から提供された情報を基に上記被検者における軽度の認知機能障害の有無を推定して推定結果を被検者端末20に提供する検査サーバ10と、を含んでおり、検査サーバ10と被検者端末20とはインターネット回線等の通信回線30により接続されている。検査サーバ10は、演算処理部、通信部、記憶部等を備えた一般的なコンピュータにより構成されており、記憶部に記憶されているソフトウェア(処理プログラム)との協働により、検査サーバ10として動作するように構成されている。被検者端末20は、演算処理部、通信部、データの入出力のためのタッチパネル式ディスプレー20a、音声入力用マイク20b、及び音声出力用スピーカ20c等を備えた一般的なコンピュータにより構成されており、検査サーバ10から被検者端末20に提供されるアプリケーションソフトにより被検者端末20として動作するように構成されている。
図2は、図1に示す検査サーバ10、被検者端末20及び通信回線30から構成される軽度の認知機能障害の推定システム1の機能ブロック図である。理解の容易のため、被検者端末20は一台のみを示している。
被検者端末20は、データ入力部21と推定結果表示部22とを必須の構成要素として有している。データ入力部21は、タッチパネル式ディスプレー20a上の表示及び/又はスピーカ20cからの音声出力を介して被検者の年齢を問う質問と日時の見当識に関する質問とを提示し、被検者の年齢に関する情報と上記日時の見当識に関する質問に対する被検者の回答に関する情報とをタッチパネル式ディスプレー20aを介して取得すると共に、上記日時の見当識に関する質問に対する被検者の回答時の音声データをマイク20bを介して取得し、取得したデータを被検者情報として検査サーバ10に通信回線30を介して送信するものである。推定結果表示部22は、検査サーバ10から通信回線30を介して送信された、上記被検者における軽度の認知機能障害の有無に関する推定結果を、タッチパネル式ディスプレー20a上の表示及び/又はスピーカ20cからの音声出力を介して上記被検者に提示するものである。
検査サーバ10は、学習データ記憶部12と識別器13とを有する学習処理部11と、データ取得部14と、音声特徴量抽出部16と正解点数確認部17と年齢情報確認部18を有するデータ解析部15と、推定結果出力部19とを必須の構成要素として有している。
学習処理部11は、被検者についての年齢と日時の見当識に関する質問に対する回答の正解点数と上記質問に対する回答時の音声データから抽出された1種以上の音声特徴量とが識別器13に入力された際に、被検者における軽度の認知機能障害の有無を出力しうるように、識別器13に対して機械学習を施すものである。被検者についての年齢の特定と上記質問に対する回答の正解点数の特定と上記質問に対する回答時の音声データからの上記1種以上の音声特徴量の抽出とは、後述するデータ解析部15によって行われる。学習データ記憶部12には、機械学習のための学習データとして、健常者及び軽度の認知機能障害発症者のそれぞれについての、年齢と、被検者に対して提示されたものと同一の日時の見当識に関する質問に対する回答の正解点数と、上記質問に対する回答時の音声データから抽出された上記1種以上の音声特徴量と、から成るデータが軽度の認知機能障害の有無に関するデータと関連付けられて記憶されている。
上記日時の見当識に関する質問に対する回答時の音声データから抽出される音声特徴量は、1種以上であれば良く、複数種類の音声特徴量から成る公知の音声特徴量セットも特に限定なく使用することができる。このような音声特徴量セットとしては、非特許文献1,3において採用されているemobase及び非特許文献3において採用されているmodcepに加えて、avec2011、avec2013、emo_large、emobase2010、IS09_emotion、IS10_paraling、IS10_paraling_compat、IS11_speaker_state、IS12_speaker_trait、IS12_speaker_trait_compat、IS13_ComParE、Essentia descriptors、MPEG7 descriptors、KTU features、jAudio features、YAAFE features、Tsanas featuresなどが挙げられる。これらの音声特徴量セットに含まれる音声特徴量の結合ベクトル、例えばemobaseとmodcepとの結合ベクトル、から成るセットを音声特徴量セットとして使用することもできる。
識別器としては、2値分類タスクのために使用可能な公知の識別器を特に限定なく使用することができ、ロジスティック回帰、サポートベクトルマシーン、決定木、ランダムフォレスト、勾配ブースティング木、ランダムフォレストと勾配ブースティング木とを組み合わせたアンサンブル学習であるXGブースティング、パーセプトロン、畳み込みニューラルネットワーク、再起型ニューラルネットワーク、残差ネットワーク、単純ベイズ、k−近似法などの教師あり学習法において使用される識別器が挙げられる。識別器としてランダムフォレスト、勾配ブースティング、又はXGブースティングを使用すると、比較的少ない数の学習データであっても高い正答率を得ることができるため好ましい。
学習処理部11は、軽度の認知機能障害の推定システム1が稼働する前の準備段階において動作し、上記学習データを用いた機械学習により識別器13を最適化する役割を果たす。図3は、学習処理部11が行う処理を示すフローチャートを示している。ステップS101において、学習処理部11は、学習処理のために使用していない未処理の学習データ、すなわち、健常者及びの軽度の認知機能障害発症者のそれぞれについての、年齢と、日時の見当識に関する質問に対する回答の正解点数と、上記質問に対する回答時の音声データから抽出された1種以上の音声特徴量と、軽度の認知機能障害の発症の有無と、が関連付けられたデータがあるか否かをチェックし、未処理の学習データがある場合にはステップS102に処理を進め、未処理の学習データがない場合には、ステップS104に処理を進めて一連の処理を終了する。未処理の学習データがある場合、すなわち、学習処理部11の最初の稼働の前に学習データ記憶部12に記憶されている学習データや、最初の稼働後に学習データ記憶部12に追加された学習データがある場合には、学習処理部11は、ステップS102において、未処理の学習データを学習データ記憶部12から取得し、ステップS103において、識別器13が出力する健常/軽度の認知機能障害の出力結果と正解値と差が最小になるように学習処理を施す。なお、学習処理に先だって、学習データを構成する年齢、正解点数及び各音声特徴量のデータに対してそれぞれ平均値を0、標準偏差を1とする白色化処理が施される。このステップS103の後、学習処理部11は再度ステップS101に戻って処理を継続する。
データ取得部14は、被検者端末20から通信回線30を介して送信された、被検者の年齢に関する情報と、上記日時の見当識に関する質問に対する被検者の回答に関する情報と、上記日時の見当識に関する質問に対する被検者の回答時の音声データと、から成る被検者情報を受信し、データ解析部15に送信するものである。
データ解析部15は、音声特徴量抽出部16と正解点数確認部17と年齢情報確認部18とを有している。音声特徴量抽出部16は、日時の見当識に関する質問に対する被検者の回答時の音声データから上記1種以上の音声特徴量を抽出するものである。正解点数確認部17は、日時の見当識に関する質問に対する被検者の回答の情報を基にして回答の正解点数を特定するものである。年齢情報確認部18は、被検者の年齢情報を基にして被検者の年齢を特定するものである。データ解析部15は、音声特徴量抽出部16と正解点数確認部17と年齢情報確認部18とにそれぞれの処理を実行させ、実行結果を受信した後、処理が終了したことを推定結果出力部19に送信する。
推定結果出力部19は、データ解析部15からの処理終了の信号を受信した後、データ解析部15が取得した上記被検者についての年齢と上記正解点数と上記1種以上の音声特徴量のそれぞれのデータを読み出し、読み出したデータを識別器13に入力し、識別器13に上記被検者についての健常/軽度の認知機能障害の二値分類タスクを実行させ、識別器13による出力結果を推定結果として被検者端末20に送信するものである。
次に、軽度の認知機能障害の推定システム1における具体的な処理について説明する。図4は、軽度の認知機能障害の推定システム1による被検者における軽度の認知機能障害の有無の推定のプロセスを示すフローチャートである。以下では、被検者が補助者の支援を受けて軽度の認知機能障害の推定システム1を利用することを仮定して説明するが、被検者が単独でこのシステム1を利用することができることはもちろんである。
軽度の認知機能障害の推定システム1の利用を希望する被検者を支援する補助者が被検者端末20を操作してこのシステム1にアクセスすると、被検者端末20のデータ入力部21は、タッチパネル式ディスプレー20a上の表示及び/又はスピーカ20cからの音声出力を介してシステム1の説明をした上で、「まずあなたの年齢を教えてください。」或いは「まずあなたの生年月日を教えてください。」というような被検者の年齢を問う質問を、ディスプレー20a上の表示及び/又はスピーカ20cからの音声出力を介して被検者及び補助者に提示する(S1)。これに対し、補助者は上記被検者の年齢を問う質問に対応する情報をタッチパネル式ディスプレー20aに表示された入力用画像の表示に従ってデータ入力部21に入力する(S2)。補助者は被検者の年齢や生年月日についての正確な情報を予め保険証等を参照して確認しておくのが好ましい。次いで、データ入力部21は、タッチパネル式ディスプレー20a上の表示及び/又はスピーカ20cからの音声出力を介して、「次の質問に対する答えを声で教えてください」と説明した上で、「今日は何年の何月何日ですか?」、「何曜日ですか?」というような日時の見当識に関する質問を被検者及び補助者に提示する(S3)。これに対し、被検者は、「平成○○年の〇○月○○日です。」、「○曜日です。」というような上記質問に対する回答を、マイク20bを介してデータ入力部21に入力する(S4)。このとき、補助者は被検者にマイク20bを向けるなどして回答の入力を促すことが好ましい。
次いで、データ入力部21はさらに、タッチパネル式ディスプレー20a上の表示及び/又はスピーカ20cからの音声出力を介して、「確認のため、先ほどの質問に対する回答を画面の表示に従って入力して下さい」というような、日時の見当識に関する質問に対する被検者の回答を確認するための情報の入力を促し、補助者はタッチパネル式ディスプレー20aに表示された入力用画像の表示に従って被検者の回答の情報をデータ入力部21に入力する(S5)。確認のための情報の入力は、「平成○○年〇○月○○日」、「○曜日」というような音声による回答をそのまま繰り返すものであっても良く、例えば年、月、日、曜日の一つの回答だけが誤っていた場合に「○,○,○,×」のような回答の正誤を入力するものであっても良い。データ入力部21は、ステップS2,S4,S5で得られた情報を被検者情報としてまとめて検査サーバ10に通信回線30を介して送信する(S6)。
検査サーバ10におけるデータ取得部14は、被検者端末20からの上記被検者についての被検者情報を受信してデータ解析部15に送信する(S7)。データ解析部15は、まず、音声特徴量抽出部16に対し、上記被検者情報のうちの日時の見当識に関する質問に対する回答時の音声データを送信し、この音声データから上記被検者についての1種以上の音声特徴量を抽出させ、抽出結果を受信する(S8)。音声特徴量抽出部16は、学習データ記憶部12に記憶されている1種以上の音声特徴量と同一の種類の音声特徴量を、この音声特徴量に対応する抽出ルールに従って抽出する。次いで、データ解析部15は、正解点数確認部17に対し、上記被検者情報のうちの日時の見当識に関する質問に対する回答の情報を送信し、上記被検者についての回答の正解点数を特定させ、特定結果を受信する(S9)。正解点数確認部17は、送信された回答の情報の形式に従った確認ルールに従って正解点数を特定する。HDS−Rの質問2が日時の見当識に関する質問として採用された場合には、年、月、日、曜日のそれぞれに各1点が割り振られ、正解を得た回答の合計得点が正解点数となるが、「平成○○年〇○月○○日」、「○曜日」のような形式で回答の情報が送信された場合には、回答における年、月、日、曜日と検査日の年、月、日、曜日とが対比されて正誤が判断されて正解点数が特定され、「○,○,○,×」のような形式で回答の情報が送信された場合には、正解(○)の数が正解点数として特定される。次いで、データ解析部15は、年齢情報確認部18に対し、上記被検者情報のうちの年齢の情報を送信し、上記被検者の年齢を特定させ、特定結果を受信する(S10)。年齢情報確認部18は、送信された年齢の情報の形式に従った確認ルールに従って年齢を特定する。年齢そのものが送信された場合には、送信された年齢がそのまま被検者の年齢として特定され、年齢の情報が生年月日の形式で送信された場合には、検査日と生年月日との差から年齢が特定される。
次いで、データ解析部15が推定結果出力部19に対して処理が終了したことを示す信号を送信すると、推定結果出力部19は、データ解析部15が取得した上記被検者についての年齢と上記正解点数と上記1種以上の音声特徴量とを上述した学習済みの識別器13に入力し(S11)、識別器13に健常/軽度の認知機能障害の二値分類タスクを実行させ、識別器13による出力結果を受信し(S12)、被検者端末20に対して通信回線30を介して出力結果を送信する(S13)。
被検者端末20の推定結果表示部22は、上記被検者における軽度の認知機能障害の有無に関する出力結果を受信し(S14)、出力結果を軽度の認知機能障害の推定システム1における推定結果として、被検者端末20のタッチパネル式ディスプレー20a上の表示及び/又はスピーカ20cからの音声出力を介して被検者及び補助者に提示し(S15)、処理を終了する。被検者の認知機能が健常であるとの出力結果が得られた場合には、「あなたの認知機能には問題がありません。」というような推定結果が被検者及び補助者に提示され、被検者に軽度の認知機能障害が認められるとの出力結果が得られた場合には、「あなたの認知機能が低下している可能性があります。専門家による診察をお勧めします。」というような推定結果が被検者及び補助者に提示される。
第2の実施の形態
本発明の第2の実施の形態は、通信回線を介さずに単一の装置として働く軽度の認知機能障害の推定装置である。軽度の認知機能障害の推定装置40は、演算処理部、記憶部、データの入出力のためのタッチパネル式ディスプレー、音声入力用マイク、音声出力用スピーカ等を有する一般的なコンピュータシステムにより構成されており、記憶部に記憶されているソフトウェア(処理プログラム)との協働により、軽度の認知機能障害の推定装置40として動作するように構成されている。
図5は、軽度の認知機能障害の推定装置40の機能ブロック図である。軽度の認知機能障害の推定装置40は、学習データ記憶部42と識別器43とを有する学習処理部41と、データ取得部44と、音声特徴量抽出部46と正解点数確認部47と年齢情報確認部48を有するデータ解析部45と、推定結果出力部49とを必須の構成要素として有している。このうち、学習データ記憶部42と識別器43とを有する学習処理部41は、第1の実施の形態の軽度の認知機能障害の推定システム1の検査サーバ10における学習データ記憶部12と識別器13とを有する学習処理部11と同じ機能を有しており、音声特徴量抽出部46と正解点数確認部47と年齢情報確認部48を有するデータ解析部45は、第1の実施の形態の軽度の認知機能障害の推定システム1の検査サーバ10における音声特徴量抽出部16と正解点数確認部17と年齢情報確認部18を有するデータ解析部15と同じ機能を有している。
データ取得部44は、タッチパネル式ディスプレー上の表示及び/又はスピーカからの音声出力を介して被検者の年齢を問う質問と日時の見当識に関する質問とを提示し、被検者の年齢に関する情報と、上記日時の見当識に関する質問に対する被検者の回答に関する情報とをタッチパネル式ディスプレーを介して取得し、上記日時の見当識に関する質問に対する被検者の回答時の音声データをマイクを介して取得し、取得したデータを被検者情報としてデータ解析部45に送信するものである。推定結果出力部49は、データ解析部45からの処理終了の信号を受信した後、データ解析部45が取得した上記被検者についての年齢と上記日時の見当識に関する質問に対する回答の正解点数と上記日時の見当識に関する質問に対する回答時の音声データから抽出された1種以上の音声特徴量とを読み出し、読み出したデータを識別器43に入力し、識別器43に上記被検者についての健常/軽度の認知機能障害の二値分類タスクを実行させ、識別器13による出力結果を推定結果として、タッチパネル式ディスプレー上の表示及び/又はスピーカからの音声出力を介して提示するものである。
第2の実施の形態の軽度の認知機能障害の推定装置40は、第1の実施の形態の軽度の認知機能障害の推定システム1と比較して、データ取得部44が通信回線を介して被検者端末から提供された被検者情報を受信せず、データ取得部44が自ら被検者情報を取得する点と、推定結果出力部49が被検者における軽度の認知機能障害の有無の推定結果を通信回線を介して被検者端末に送信せず、推定結果出力部49が自ら軽度の認知機能障害の推定装置40に備えられているタッチパネル式ディスプレー及び/又はスピーカを介して推定結果を提示する点を除いて同一であるため、これ以上の説明を省略する。
変形形態
第1の実施の形態の軽度の認知機能障害の推定システム1及び第2の実施の形態の軽度の認知機能障害の推定装置40の変形形態では、データ取得部14,44によって、被検者についての年齢情報と日時の見当識に関する質問に対する被検者の回答とが音声データによって取得される。この場合には、図4のステップS2において、被検者についての年齢情報をタッチパネル式ディスプレーからの入力によって得るプロセスに代えて音声によって得るプロセスが実行され、また、図4のステップS5のプロセス、すなわち、日時の見当識に関する質問に対する回答をステップS4において音声データで得た後にタッチパネル式ディスプレーからの入力によって確認するプロセスは不要である。この変形形態では、正解点数確認部17,47が、日時の見当識に関する質問に対する被検者の回答時の音声データにS−JNASなどに基づく高齢者用音声認識器を適用して音声データを文字列に変換した後、被検者における回答の正解点数を特定し、年齢情報確認部18,48が、被検者の年齢を問う質問に対する回答時の音声データに同様の音声認識器を適用して音声データを文字列に変換した後、被検者の年齢を特定する。
本発明を以下の実施例を用いて説明するが、本発明は以下の実施例に限定されない。
(1)実験条件
以下に、本実験の参加者及び参加者におけるHDS−Rの総合得点の分布を示す。表中の軽度の認知機能障害発症者は、DSM−5に基づき専門家により認知症発症者であると診断された者のうち、HDS−Rの点数が14〜25点である者により構成されている。
Figure 0006804779
HDS−Rの各質問に対する回答時の音声データの録音は、医療機関の診断室において、収録参加者(健常者又は軽度の認知機能障害発症者)と診断者の2者、若しくは、収録参加者の付き添いを含む3者により実施された。収録音声のサンプリング周波数は48kHz、ファイル形式はRIFF WAVであり、音声分析時に16kHzにダウンサンプリングして音声を正規化した。収録参加者の音声データは、収録音声データから手作業で切りだした。
表2に示されている健常者及び軽度の認知機能障害発症者のそれぞれにおける年齢、HDS−Rの各質問に対する回答の正解点数、及び各質問に対する回答時の音声データから抽出された音声特徴量から成るデータを基にして、健常/軽度の認知機能障害の自動識別における正答率を評価した。音声データから抽出する音声特徴量を含む音声特徴量セットとしては、非特許文献1,3において採用されているemobase、非特許文献3において採用されているmodcep(但し、フーリエ変換長を2048、フレームシフトを5msecに設定。音声特徴量の種類の数は20。)、及び、上記emobaseと上記modcepとの結合ベクトルからなるセット(以下、「emobase+modcep」と表す。)の3種を用いた。また、音声特徴量を含むデータを用いた自動識別のための識別器として、勾配ブースティング木(GBC)、ランダムフォレスト(RF)及びサポートベクトルマシーン(SVM)の3種を用いた。これらの識別器はscikit−learnライブラリ(https://github.com/scikit−learn/scikit−learn,version0.19.1)を用いて準備した。但し、各識別器のハイパーパラメータをチューニングする目的で、線形サポートベクトルマシーンのコストパラメータ、RBFカーネルサポートベクトルマシーンのコストパラメータ及びガンマパラメータ、ランダムフォレストの推定器の数及びクラスウェイト、勾配ブースティング木の推定器の数及び最大深度のそれぞれを最適化するためにグリッドサーチを使用した。
上記識別器を用いた自動識別の評価に当たっては、表2に示した健常者と軽度の認知機能障害発症者を任意の5グループに分け、4グループのデータを識別器に学習させるための学習データとして使用し、残りの1グループのデータを正答率の算出のために用いた。なお、識別器に学習用データを入力するにあたっては、年齢、正解点数、音声特徴量の各データを白色化した後に入力した。また、正答率の算出は、正答率の算出のためのグループを変えた評価を5回繰り返すクロスバリデーションにより行った。
(2)予備検討:正解点数のみを用いた識別/年齢のみを用いた識別/音声特徴量のみを用いた識別
本発明による健常/軽度の認知機能障害の自動識別の評価に先だって、年齢のみを用いた場合の自動識別における正答率と、HDS−Rの各質問に対する回答の正解点数のみを用いた場合の自動識別における正答率と、HDS−Rの各質問に対する回答時の音声データから抽出された音声特徴量のみを用いた場合の自動識別における正答率と、を評価した。表3に、得られた正答率の値をまとめて示す。
Figure 0006804779
但し、機械学習は本来一次元のデータを用いた機械学習には適さないため、正解点数のみを用いた自動識別における各質問についての正答率の値及び年齢のみを用いた自動識別における正答率の値は、最も正答率が高くなるように識別のカットオフ値を定めた上で得た。仮に一次元のデータを用いて機械学習により正答率を得たとしても、表中の正答率を超えることは無いと考えられる。
図6には、音声特徴量セットしてmodcepを使用し、識別器として勾配ブースティング木(GBC)を使用することによって得られた、HDS−Rの各質問に対する回答時の音声データから抽出された音声特徴量のみを用いた場合の自動識別における正答率の値を、正解点数のみを用いた自動識別における各質問についての正答率の値及び年齢のみを用いた自動識別における正答率の値と共に示した。
表3或いは図6から把握されるように、HDS−Rの各質問に対する回答の正解点数のみを用いた自動識別では、質問の種類に応じて正答率が大きく変化した。質問7、すなわち、3つの言葉の遅延再生に関する質問を用いた場合の正答率が最も高く、次いで、質問2、すなわち、日時の見当識に関する質問を用いた場合の正答率が高く、いずれも年齢のみを用いた場合の正答率よりも高かった。質問7に対する回答の正解点数のみを用いた場合の正答率は0.9にも達し、この質問が健常/軽度の認知機能障害の自動識別に関して極めて優れた質問であることが分かる。しかしながら、この質問の開始から回答を得るまでには比較的長い時間を要するため、評価の簡便性及び迅速性の点で問題がある。
また、表3或いは図6から把握されるように、HDS−Rの各質問に対する回答時の音声データから抽出した音声特徴量のみを用いた自動識別に関しては、音声特徴量セットの種類、識別器の種類、及び質問の種類の相違による影響は比較的小さく、正答率が0.6前後であった。表3から把握されるように、音声特徴量のみを用いた自動識別における正答率の値はほとんどが0.5を超えているため、健常/軽度の認知機能障害の識別のために音声特徴量は有効であるといえるが、満足できる正答率には至っていない。また、質問2〜9に関しては、非特許文献1における結果と同様に、音声特徴量のみを用いた場合の正答率の値が正解点数のみを用いた場合の正答率の値より低くなる傾向があった。
(3)年齢と正解点数と音声特徴量を用いた識別
上述したように、質問7に対する回答の正解点数のみを用いた場合の正答率は極めて高いものの、評価の簡便性及び迅速性の点で問題があるため、次に正解点数のみを用いた自動識別における正答率が高く、しかも質問の開始から回答を得るまでに要する時間が短時間で済む質問2に対する回答時の音声データを使用した自動識別を検討した。以下、音声特徴量セットしてmodcep又はemobaseを使用した結果について説明する。
表4に、被検者についての年齢と質問2に対する回答の正解点数と質問2に対する回答時の音声データから抽出された音声特徴量とを用いた自動識別(本発明)における正解率を、質問2に対する回答の正解点数のみを用いた自動識別における正答率、質問2に対する回答の正解点数と音声特徴量とを用いた自動識別における正答率、及び質問2に対する回答の正解点数と年齢とを用いた自動識別における正答率と比較して示す。
Figure 0006804779
また、表5に、質問2に代えて質問7を用いた比較実験の結果を示す。
Figure 0006804779
表5から把握されるように、質問7に対する回答を用いた場合には、正解点数と音声特徴量とを用いた自動識別、正解点数と年齢とを用いた自動識別、及び年齢と正解点数と音声特徴量とを用いた自動識別のいずれにおける正答率も、正解点数のみを用いた自動識別における正答率より低かった。特に、識別器としてサポートベクトルマシーン(SVM)を用いたときに、音声特徴量を含むデータを用いた自動識別の正答率の低下が著しく、音声特徴量セットとしてemobaseを用いるとmodcepを用いた場合に比較してさらに顕著に正答率が低下した。一般的に機械学習を安定に行うためには多くの学習データが必要であることが知られているが、表2に示されている健常者及び軽度の認知機能障害発症者の数では、サポートベクトルマシーンを用いた機械学習を安定に行うためには不足しており、この不足の効果が、20種類の音声特徴量を含むmodcepを用いた場合よりも、988種類の音声特徴量を含むemobaseを用いた場合に、より顕著に表れたと考えられる。健常者及び軽度の認知機能障害発症者の数が増加すれば、サポートベクトルマシーンを用いてもランダムフォレスト或いは勾配ブースティング木を用いたときと同様の正答率が得られると期待される。
しかし、表4から把握されるように、質問2に対する回答を用いると、識別器としてランダムフォレスト(RF)或いは勾配ブースティング木(GBC)を用いた場合には、年齢と正解点数と音声特徴量とを用いた自動識別における正答率が向上し、質問7に対する回答の正解点数のみを用いた自動識別における正答率(0.903)に匹敵するまで向上した正答率が得られた。しかし、識別器としてサポートベクトルマシーン(SVM)を用いた場合には、質問7に対する回答を用いた場合と同様に、健常者及び軽度の認知機能障害発症者の数の不足が手伝って、音声特徴量を含むデータを用いた自動識別の正答率が低下し、音声特徴量としてemobaseを用いるとmodcepを用いた場合に比較してさらに顕著に正答率が低下した。健常者及び軽度の認知機能障害発症者の数が増加すれば、サポートベクトルマシーンを用いてもランダムフォレスト或いは勾配ブースティング木を用いたときと同様の正答率が得られると期待される。
emobaseは988種類の短期的音声特徴量から構成される統計的な音声特徴量のセットであり、modcepは音声特徴量時系列の時間変動を表現した20種類の長期的な音声特徴量を含むセットであり、両者は特に時間的性質の点で相違するが、表4から把握されるように、上述した音声特徴量の性質の相違に関わらず、健常/軽度の認知機能障害の自動識別のために、被検者についての年齢と質問2に対する回答の正解点数と質問2に対する回答時の音声データから抽出された音声特徴量とを用いた自動識別が有効であることが分かる。特に、識別器として勾配ブースティング木(GBC)を用いた場合には、以下に示すように、年齢と正解点数と音声特徴量とを用いた自動識別における正答率の向上が顕著であった。
(4)音声特徴量セットの影響
図7に、音声特徴量セットしてmodcepを使用し、識別器として勾配ブースティング木を使用した場合の、HDS−Rの質問2に対する回答の正解点数と回答時の音声データから抽出された音声特徴量と年齢とを使用した自動識別(本発明)における正答率を、正解点数のみを使用した自動識別における正答率、正解点数と音声特徴量とを使用した自動識別における正答率、及び正解点数と年齢とを使用した自動識別における正答率と比較した結果を示す。
図8には、音声特徴量セットとしてemobaseを使用し、識別器として勾配ブースティング木を使用した場合の、HDS−Rの質問2に対する回答の正解点数と回答時の音声データから抽出された音声特徴量と年齢とを使用した自動識別(本発明)における正答率を、正解点数のみを使用した自動識別における正答率、正解点数と音声特徴量とを使用した自動識別における正答率、及び正解点数と年齢とを使用した自動識別における正答率と比較した結果を示す。
さらに、図9には、音声特徴量セットとしてemobase+modcepを使用し、識別器として勾配ブースティング木を使用した場合の、HDS−Rの質問2に対する回答の正解点数と回答時の音声データから抽出された音声特徴量と年齢とを使用した自動識別(本発明)における正答率を、正解点数のみを使用した自動識別における正答率、正解点数と音声特徴量とを使用した自動識別における正答率、及び正解点数と年齢とを使用した自動識別における正答率と比較した結果を示す。
図7〜図9から把握されるように、正解点数と音声特徴量とを用いた自動識別及び正解点数と年齢とを用いた自動識別における正答率の向上は、正解点数のみを用いた自動識別における正答率と比較して顕著であるとは言えず、図7における正解点数と音声特徴量とを用いた自動識別においてはむしろ正答率が低下したが、年齢と正解点数と音声特徴量とを用いた自動識別(本発明)における正答率は顕著に向上しており、しかも、年齢と正解点数と音声特徴量とを用いた自動識別における正答率は、時間的性質の点で相違する音声特徴量セット(emobase,modcep)或いはその結合ベクトルのセット(emobase+modcep)のいずれを用いてもほぼ同じ値であった。したがって、HDS−Rの質問2に対する回答の正解点数と回答時の音声データから抽出された音声特徴量と年齢とを使用した自動識別(本発明)は、健常/軽度の認知機能障害の自動識別のために極めて有効であり、音声特徴量の性質の相違に依存せずに高い正答率が得られることが分かった。
(5)フィールドテスト
音声特徴量セットとしてmodcepを使用し、識別器として学習済みの勾配ブースティング木を使用した軽度の認知機能障害の推定システムを構築し、このシステムが新たな被検者における認知機能の変化を正しく判定しうるか否かを評価するフィールドテストを実施した。このテストの被検者は、文書同意が得られた75歳以上の、認知症専門の医療機関においてDSM−5によりアルツハイマー型の軽度認知症若しくは軽度認知障害(MCI)であると診断された者及び地域の高年齢者団体を通じて自主的に参加した健常者とした。これらの被検者に予め臨床的認知症尺度(CDR)を実施し、CDRスコアに基づき、CDR0群(健常、62名)、CDR0.5群(認知症疑い若しくは軽度認知障害、13名)、及びCDR1群(軽度認知症、15名)に分類した。CDRによる分類と上記システムによる判定結果とを比較することにより、上記システムの臨床的な妥当性が評価される。なお、CDR1群は本明細書において定義された「軽度の認知機能障害発症者」に包含される。
フィールドテストの結果、上記システムは、CDR0群の約90%を「認知機能良好」と判定し、CDR1群の約90%を「認知機能の変化あり」と判定し、いずれの群においても高い正答率を示した。また、上記システムは軽度の認知機能障害の推定システムであるが、興味深いことに、CDR0.5群の約70%を「認知機能の変化あり」と判定し、上記システムの軽度認知障害(MCI)の有無の推定に対する有効性が認められた。
以上の結果から、上記システムが数十秒という極めて短い時間で臨床的に妥当な判定を与えたことがわかる。
本発明の軽度の認知機能障害の推定システム及び軽度の認知機能障害の推定装置により、被検者における軽度の認知機能障害の有無を簡便且つ迅速にしかも高い正答率で推定することができるため、軽度の認知機能障害が認められる段階での治療開始につなげることができる。
1 軽度の認知機能障害の推定システム
10 検査サーバ
20 被検者端末
30 通信回線
13 識別器
14 データ取得部
15 データ解析部
19 推定結果出力部
40 軽度の認知機能障害の推定装置
43 識別器
44 データ取得部
45 データ解析部
49 推定結果出力部

Claims (6)

  1. 通信回線を介して接続された検査サーバと被検者端末とを含む、被検者における軽度の認知機能障害の有無を推定する軽度の認知機能障害の推定システムであって、
    前記検査サーバが、
    健常者及び軽度の認知機能障害発症者のそれぞれについての、年齢と、日時の見当識に関する質問に対する回答の正解点数と、前記日時の見当識に関する質問に対する回答時の音声データから抽出された1種以上の音声特徴量と、から成る学習データに基づき軽度の認知機能障害の有無を出力するように学習させられた識別器と、
    前記被検者端末から送信された、前記被検者についての、年齢情報と、前記日時の見当識に関する質問に対する回答の情報と、前記日時の見当識に関する質問に対する回答時の音声データと、を含む被検者情報を受信するデータ取得部と、
    前記被検者情報に基づき、前記回答の正解点数を取得すると共に、前記音声データから前記1種以上の音声特徴量を抽出するデータ解析部と、
    前記被検者についての年齢と前記正解点数と前記1種以上の音声特徴量とを前記識別器に入力し、前記識別器から出力された前記被検者における軽度の認知機能障害の有無を推定結果として前記被検者端末に送信する推定結果出力部と
    を備えていることを特徴とする軽度の認知機能障害の推定システム。
  2. 前記データ取得部が、前記被検者情報に代えて、前記被検者についての年齢を問う質問と前記日時の見当識に関する質問のそれぞれに対する回答時の音声データを被検者音声情報として受信し、
    前記データ解析部が、前記被検者音声情報に基づき、年齢を問う質問に対する回答時の音声データから前記被検者の年齢を特定し、日時の見当識に関する質問に対する回答時の音声データから前記回答の正解点数を特定すると共に前記1種以上の音声特徴量を抽出する、請求項1に記載の軽度の認知機能障害の推定システム。
  3. 前記識別器が、ランダムフォレスト、勾配ブースティング木、又はXGブースティングである、請求項1又は2に記載の軽度の認知機能障害の推定システム。
  4. 通信回線を介して接続された検査サーバと被検者端末とによって被検者における軽度の認知機能障害の有無を推定するためのプログラムであって、
    前記検査サーバ用のコンピュータに、
    健常者及び軽度の認知機能障害発症者のそれぞれについての、年齢と、日時の見当識に関する質問に対する回答の正解点数と、前記日時の見当識に関する質問に対する回答時の音声データから抽出された1種以上の音声特徴量と、から成る学習データに基づき軽度の認知機能障害の有無を出力するように学習させられた識別器を構成するステップと、
    前記被検者端末から送信された、前記被検者についての、年齢情報と、前記日時の見当識に関する質問に対する回答の情報と、前記日時の見当識に関する質問に対する回答時の音声データと、を含む被検者情報を受信するステップと、
    前記被検者情報に基づき、前記回答の正解点数を取得すると共に、前記音声データから前記1種以上の音声特徴量を抽出するステップと、
    前記被検者についての年齢と前記正解点数と前記1種以上の音声特徴量とを前記識別器に入力し、前記識別器から出力された前記被検者における軽度の認知機能障害の有無を推定結果として前記被検者端末に送信するステップと
    を実行させ、
    前記被検者端末用のコンピュータに、
    前記被検者についての、年齢情報と、前記日時の見当識に関する質問に対する回答の情報と、前記日時の見当識に関する質問に対する回答時の音声データと、を含む被検者情報を取得し、取得した被検者情報を前記検査サーバに対して送信するステップと、
    前記検査サーバから送信された、前記検査サーバの識別器が出力した前記被検者における軽度の認知機能障害の有無に関する推定結果を受信し、受信した推定結果を前記被検者に対して提示するステップと
    を実行させる
    ことを特徴とするプログラム。
  5. 被検者における軽度の認知機能障害の有無を推定する軽度の認知機能障害の推定装置であって、
    健常者及び軽度の認知機能障害発症者のそれぞれについての、年齢と、日時の見当識に関する質問に対する回答の正解点数と、前記日時の見当識に関する質問に対する回答時の音声データから抽出された1種以上の音声特徴量と、から成る学習データに基づき軽度の認知機能障害の有無を出力するように学習させられた識別器と、
    前記被検者についての、年齢情報と、前記日時の見当識に関する質問に対する回答の情報と、前記日時の見当識に関する質問に対する回答時の音声データと、を含む被検者情報を取得するデータ取得部と、
    前記被検者情報に基づき、前記回答の正解点数を取得すると共に、前記音声データから前記1種以上の音声特徴量を抽出するデータ解析部と、
    前記被検者についての年齢と前記正解点数と前記1種以上の音声特徴量とを前記識別器に入力し、前記識別器から出力された前記被検者における軽度の認知機能障害の有無を推定結果として出力する推定結果出力部と
    を備えていることを特徴とする軽度の認知機能障害の推定装置。
  6. 被検者における軽度の認知機能障害の有無を推定するためのプログラムであって、
    コンピュータに、
    健常者及び軽度の認知機能障害発症者のそれぞれについての、年齢と、日時の見当識に関する質問に対する回答の正解点数と、前記日時の見当識に関する質問に対する回答時の音声データから抽出された1種以上の音声特徴量と、から成る学習データに基づき軽度の認知機能障害の有無を出力するように学習させられた識別器を構成するステップと、
    前記被検者についての、年齢情報と、前記日時の見当識に関する質問に対する回答の情報と、前記日時の見当識に関する質問に対する回答時の音声データと、を含む被検者情報を取得するステップと、
    前記被検者情報に基づき、前記回答の正解点数を取得すると共に、前記音声データから前記1種以上の音声特徴量を抽出するステップと、
    前記被検者についての年齢と前記正解点数と前記1種以上の音声特徴量とを前記識別器に入力し、前記識別器から出力された前記被検者における軽度の認知機能障害の有無を推定結果として出力するステップと
    を実行させることを特徴とするプログラム。
JP2019128769A 2018-07-24 2019-07-10 軽度の認知機能障害の推定システム、軽度の認知機能障害の推定装置、及び軽度の認知機能障害の有無を推定するためのプログラム Active JP6804779B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2018138111 2018-07-24
JP2018138111 2018-07-24
JP2019028627 2019-02-20
JP2019028627 2019-02-20

Publications (3)

Publication Number Publication Date
JP2020127703A JP2020127703A (ja) 2020-08-27
JP2020127703A5 JP2020127703A5 (ja) 2020-10-15
JP6804779B2 true JP6804779B2 (ja) 2020-12-23

Family

ID=72175177

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019128769A Active JP6804779B2 (ja) 2018-07-24 2019-07-10 軽度の認知機能障害の推定システム、軽度の認知機能障害の推定装置、及び軽度の認知機能障害の有無を推定するためのプログラム

Country Status (1)

Country Link
JP (1) JP6804779B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007282992A (ja) * 2006-04-19 2007-11-01 Sky Kk 認知症診断支援システム
JP4876207B2 (ja) * 2010-06-11 2012-02-15 国立大学法人 名古屋工業大学 認知機能障害危険度算出装置、認知機能障害危険度算出システム、及びプログラム
WO2012165602A1 (ja) * 2011-05-31 2012-12-06 国立大学法人名古屋工業大学 認知機能障害判別装置、認知機能障害判別システム、およびプログラム
JP6263308B1 (ja) * 2017-11-09 2018-01-17 パナソニックヘルスケアホールディングス株式会社 認知症診断装置、認知症診断方法、及び認知症診断プログラム

Also Published As

Publication number Publication date
JP2020127703A (ja) 2020-08-27

Similar Documents

Publication Publication Date Title
Luz et al. Detecting cognitive decline using speech only: The adresso challenge
Singh et al. Robust detection of Parkinson's disease using harvested smartphone voice data: A telemedicine approach
Yalamanchili et al. Real-time acoustic based depression detection using machine learning techniques
Kong et al. A neural model for predicting dementia from language
Hustad et al. Speech development between 30 and 119 months in typical children I: Intelligibility growth curves for single-word and multiword productions
JPWO2015122026A1 (ja) 疾患検出システムおよび疾患検出方法
Luz et al. Multilingual alzheimer’s dementia recognition through spontaneous speech: a signal processing grand challenge
CN115862868A (zh) 心理测评系统、平台、电子设备及存储介质
US20230233136A1 (en) Voice characteristic-based method and device for predicting alzheimer's disease
Makiuchi et al. Speech paralinguistic approach for detecting dementia using gated convolutional neural network
Hashim et al. Analysis of timing pattern of speech as possible indicator for near-term suicidal risk and depression in male patients
Kothalkar et al. Automatic screening to detect’at risk’child speech samples using a clinical group verification framework
Yang et al. Attention guided learnable time-domain filterbanks for speech depression detection
Selvakumari et al. A voice activity detector using SVM and Naïve Bayes classification algorithm
Albury et al. Relationship between Clinician Language and the success of behavioral weight loss interventions: a mixed-methods cohort study
Yamada et al. A mobile application using automatic speech analysis for classifying Alzheimer's disease and mild cognitive impairment
JP6804779B2 (ja) 軽度の認知機能障害の推定システム、軽度の認知機能障害の推定装置、及び軽度の認知機能障害の有無を推定するためのプログラム
Hason et al. Spontaneous speech feature analysis for alzheimer's disease screening using a random forest classifier
US20240023877A1 (en) Detection of cognitive impairment
RU2559689C2 (ru) Способ определения риска развития заболеваний индивида по его голосу и аппаратно-программный комплекс для реализации способа
JP7307507B2 (ja) 病態解析システム、病態解析装置、病態解析方法、及び病態解析プログラム
Cebola et al. Speech-Based Supervised Learning Towards the Diagnosis of Amyotrophic Lateral Sclerosis.
Ihor et al. Exploring multimodal data approach in natural language processing based on speech recognition algorithms
Kumar et al. Can you hear me now? Clinical applications of audio recordings
Biswas et al. Can ChatGPT be Your Personal Medical Assistant?

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200903

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200903

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20200903

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20200910

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201124

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201126

R150 Certificate of patent or registration of utility model

Ref document number: 6804779

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250