WO2019087758A1

WO2019087758A1 - 認知機能評価装置、認知機能評価システム、認知機能評価方法、及び、プログラム

Info

Publication number: WO2019087758A1
Application number: PCT/JP2018/038346
Authority: WO
Inventors: 角　貞幸; 亮佑南雲; 賢吾阿部; 松村　吉浩; 西山　高史; 中島　博文; 孝司笹部; 誠苅安; 貴子吉村; 稔外山
Original assignee: パナソニックＩｐマネジメント株式会社
Priority date: 2017-11-02
Filing date: 2018-10-15
Publication date: 2019-05-09
Also published as: US20210177340A1; TWI680453B; JP6337362B1; US11918372B2; CN111315302A; JP2019083902A; TW201923734A; CN111315302B

Abstract

認知機能評価装置（１００）は、被評価者が指示された文に従って発話した音声を示す文音声データを取得する取得部（１１０）と、取得部（１１０）が取得した文音声データから、当該文音声データに基づく特徴量を算出する算出部（１２０）と、算出部（１２０）が算出した特徴量と、人が発した音声を示す音声データと当該人の認知機能との関係を示す参照データ（１５１）とを照合することにより、被評価者の認知機能を評価する評価部（１３０）と、被評価者に発話させる文を出力し、且つ、評価部（１３０）が評価した評価結果を出力する出力部（１４０）と、を備える。

Description

認知機能評価装置、認知機能評価システム、認知機能評価方法、及び、プログラム

　本発明は、認知機能評価装置、認知機能評価システム、認知機能評価方法、及び、プログラムに関する。

　従来から、認知機能を評価するテストとして、認知機能が評価される患者である被評価者がテスト用紙に解答を記載する方法である改訂長谷川式簡易知能評価スケール（ＨＤＳ－Ｒ）、ＭＭＳＥ（Ｍｉｎｉ－Ｍｅｎｔａｌ　Ｓｔａｔｅ　Ｅｘａｍｉｎａｔｉｏｎ：ミニメンタルステート検査）、ＣＤＲ（Ｃｌｉｎｉｃａｌ　Ｄｅｍｅｎｔｉａ　Ｒａｔｉｎｇ）等がある。これらは、一定のトレーニングの受けた医師、臨床心理士等が、被評価者に対して医療機関で行うものである。

　ここで、テスト用紙を用いた評価方法においては、長いテスト時間を要して被評価者の負担を強いることが問題となる。また、繰り返し被評価者に対してテストを実行する場合、同じテストであるために、被評価者が答えを記憶してしまう問題がある。この問題を解決するために、医者等が被評価者に実施するテストにおける質疑応答を音声収録し、被評価者の音声を分析する技術が開示されている（例えば、特許文献１参照）。

国際公開第２０１２／１６５６０２号

　認知機能の評価には、簡便に、且つ、精度良く被評価者の認知機能の評価をすることが要求されている。

　そこで、本発明は、簡便に、且つ、精度良く被評価者の認知機能の評価が可能な認知機能評価装置等の提供を目的とする。

　本発明の一態様に係る認知機能評価装置は、被評価者が指示された文に従って発話した音声を示す文音声データを取得する取得部と、前記取得部が取得した前記文音声データから、当該文音声データに基づく特徴量を算出する算出部と、前記算出部が算出した前記特徴量と、人が発した音声を示す音声データと当該人の認知機能との関係を示す参照データとを照合することにより、前記被評価者の認知機能を評価する評価部と、前記被評価者に発話させる前記文を出力し、且つ、前記評価部が評価した評価結果を出力する出力部と、を備える。

　また、本発明の一態様に係る認知機能評価システムは、上記認知機能評価装置と、前記被評価者の音声を検出する集音装置と、前記出力部が出力した前記文及び前記評価結果を表示する表示装置と、を備える。

　また、本発明の一態様に係る認知機能評価方法は、コンピュータが実行する認知機能評価方法であって、被評価者に発話させる文を出力する文出力ステップと、被評価者が発話した音声を示す文音声データを取得する取得ステップと、前記取得ステップで取得した前記文音声データから、当該文音声データに基づく特徴量を算出する算出ステップと、前記算出ステップで算出した前記特徴量と、人が発した音声を示す音声データと当該人の認知機能との関係を示す参照データとを照合することにより、前記被評価者の認知機能を評価する評価ステップと、前記評価ステップで評価した評価結果を出力する評価結果出力ステップと、を含む。

　また、本発明は、認知機能評価方法に含まれるステップをコンピュータに実行させるプログラムとして実現されてもよい。

　本発明に係る認知機能評価装置等によれば、簡便に、且つ、精度良く被評価者の認知機能の評価が可能となる。

図１は、実施の形態に係る認知機能評価システムの構成を示す図である。図２は、実施の形態に係る認知機能評価装置及び認知機能評価システムの特徴的な機能構成を示すブロック図である。図３は、実施の形態に係る認知機能評価装置が被評価者の認知機能を評価する処理手順を示すフローチャートである。図４は、取得部が被評価者の文音声データを取得する方法の一例を示す図である。図５は、被評価者が発話した音声を示す文音声データの一例を示す図である。図６は、文音声データから算出部が算出するフォルマント周波数を説明するための図である。図７は、文音声データから算出部が算出するフォルマント周波数の時間変化の一例を示す図である。図８は、評価部が評価する文音声データの特徴量の一例を説明するための図である。図９は、評価部が評価する文音声データの特徴量の別の一例を説明するための図である。図１０は、人がＭｏＣＡテストを受けた際に獲得したスコアを示す図である。図１１は、表示装置に表示される、認知機能が低下していることを示す画像の一例を示す図である。図１２は、被評価者の文音声データを取得する際に表示装置に表示させる画像の別の一例を示す図である。図１３は、実施の形態の変形例１に係る認知機能評価システムの構成を示す図である。図１４は、実施の形態の変形例２に係る認知機能評価システムの構成を示す図である。

　以下、実施の形態について、図面を参照しながら説明する。なお、以下で説明する実施の形態は、いずれも包括的又は具体的な例を示すものである。以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置位置及び接続形態、ステップ、ステップの順序等は、一例であり、本発明を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。

　なお、各図は模式図であり、必ずしも厳密に図示されたものではない。また、各図において、実質的に同一の構成に対しては同一の符号を付しており、重複する説明は省略又は簡略化される場合がある。

　また、以下の実施の形態において、方向を示す表現を用いている。例えば、平行とは、完全に平行であることを意味するだけでなく、実質的に平行とする、すなわち、例えば数％程度のずれを含むことも意味する。

　（実施の形態）
　［認知機能評価装置の構成］
　実施の形態に係る認知機能評価システムの構成に関して説明する。図１は、実施の形態に係る認知機能評価システムの構成を示す図である。

　認知機能評価システム２００は、被評価者Ｕが発した音声から、被評価者Ｕの認知機能を評価するための装置である。認知機能とは、認識したり、記憶したり、判断したりする能力を示す。一具体例として、認知機能評価装置１００は、認知症である人（認知症患者）かどうかを評価する。

　認知症とは、上述した認知機能の低下が見られる症状を示す。認知症の一具体例としては、アルツハイマー型認知症（ＡＤ：Ａｌｚｈｅｉｍｅｒ’ｓ　ｄｉｓｅａｓｅ）が挙げられる。認知症は自覚症状がないため、認知症患者の家族又は第三者等が認知症患者に病院での診察を促すことで、認知症患者は医師からの診察を受けることとなる。また、ＭｏＣＡ（Ｍｏｎｔｒｅａｌ　Ｃｏｇｎｉｔｉｖｅ　Ａｓｓｅｓｓｍｅｎｔ）テスト等の認知症の診断のためのバッチテストを被評価者Ｕが受けることにより、被評価者Ｕが認知症であるかどうかを確認することができる。

　しかしながら、ＭｏＣＡテストは、１５分程度の時間を要する。また、ＭｏＣＡテストは、被評価者Ｕの経時的な変化を診断するために、日をおいて複数回実行することで、被評価者Ｕが認知症であるかどうかの判定を行う必要がある。つまり、ＭｏＣＡテストは、被評価者Ｕが認知症であるかどうかを診断するために、長い期間を要する。

　ところで、認知症患者と、認知症ではない人（健常者）とでは、発話した単語が同じ単語であっても音声に違いがあることが知られている。

　認知機能評価システム２００は、被評価者Ｕの音声を解析することで、被評価者Ｕの認知機能の程度を精度良く評価する装置である。

　図１に示すように、認知機能評価システム２００は、認知機能評価装置１００と、被評価者Ｕの音声を検出する集音装置３００と、表示装置４００とを備える。

　認知機能評価装置１００は、集音装置３００によって、被評価者Ｕが発した音声を示す文音声データ（音声データ）を取得し、取得した文音声データから被評価者Ｕの認知機能を評価するコンピュータである。具体的には、認知機能評価装置１００は、被評価者Ｕに発話させる特定の文を示す文データ（言い換えると、当該文を含む画像データ）を表示装置４００に表示させ、且つ、被評価者Ｕが発話した音声を示す文音声データを、集音装置３００を介して取得する。

　集音装置３００は、被評価者Ｕが発した音声を検出して、検出した音声を示す文音声データを認知機能評価装置１００へ出力するマイクである。被評価者Ｕが発した音声を精度良く検出するために、集音装置３００の周囲には、遮音壁３１０及びポップガード３２０の少なくとも一方が配置されていてもよい。

　表示装置４００は、認知機能評価装置１００から出力される画像データに基づいた画像を表示する。具体的には、表示装置４００は、後述する出力部１４０（図２参照）が出力した被評価者Ｕに発話させる文を示す文データ及び被評価者Ｕの認知機能の評価結果を取得して表示する。表示装置４００は、具体的には、液晶パネル、又は、有機ＥＬパネル等によって構成されるモニタ装置である。表示装置４００として、テレビ、スマートフォン、タブレット端末等の情報端末が用いられてもよい。

　認知機能評価装置１００と、集音装置３００及び表示装置４００とは、文音声データ又は画像データを送受信可能であればよく、有線で接続されていてもよいし、無線通信可能に接続されていてもよい。

　認知機能評価装置１００は、集音装置３００によって検出された文音声データに基づいて被評価者Ｕの音声を分析し、分析した結果から被評価者Ｕの認知機能を評価し、評価した結果を示す画像を表示装置４００へ出力する。こうすることで、認知機能評価装置１００は、自覚症状がない認知症患者へ認知機能の程度を通知できるため、例えば、認知症患者に医師に診察を受けるように促すことができる。言い換えると、認知機能評価装置１００は、自覚症状がない認知症患者へ認知機能の程度を通知することで、認知症患者が医師に診察を受ける支援をすることができる。

　なお、認知機能評価装置１００は、例えば、パーソナルコンピュータであるが、サーバ装置であってもよい。

　図２は、実施の形態に係る認知機能評価装置１００の特徴的な機能構成を示すブロック図である。認知機能評価装置１００は、取得部１１０と、算出部１２０と、評価部１３０と、出力部１４０と、記憶部１５０と、指示部１６０とを備える。

　取得部１１０は、被評価者Ｕが指示された文に従って発話した音声を示す文音声データを取得する。具体的には、集音装置３００によって検出された文音声データを取得する。取得部１１０は、例えば、有線通信又は無線通信を行う通信インターフェースである。

　算出部１２０は、取得部１１０で取得した被評価者Ｕの文音声データを解析することで、当該文音声データに基づく特徴量を算出する処理部である。算出部１２０は、具体的には、プロセッサ、マイクロコンピュータ、又は、専用回路によってハードウェア的に実現される。

　例えば、出力部１４０が出力する文データが示す文は、母音を含む音節が連続した文字列を含み、算出部１２０は、母音の第一フォルマント周波数及び第二フォルマント周波数の変化量、当該母音の第一フォルマント周波数及び第二フォルマント周波数の変化にかかる所要時間、並びに、当該所要時間に対する当該変化量の比である変化率の少なくとも１つを特徴量として算出してもよい。

　第一フォルマント周波数は、人の音声の低周波数側から数えて１番目に見られる振幅のピーク周波数であり、舌の動きに関する特徴が反映されやすいことが知られている。また、認知症患者は、健常者と比較して舌をうまく動かせない場合が多い。そのため、第一フォルマント周波数は、健常者と認知症患者とで違いが生じやすいと考えられる。

　第二フォルマント周波数は、人の音声の低周波数側から数えて２番目に見られる振幅のピーク周波数であり、声帯音源が声道、唇や舌等の口腔、鼻腔等で生じる共鳴において、舌の位置に関する影響が反映されやすいことが知られている。また、認知症患者は、健常者と比較して舌やあごの位置を維持する運動機能が衰える場合が多い。そのため、第二フォルマント周波数及び振幅には、健常者と認知症患者とで違いが生じやすいと考えられる。

　また、例えば、出力部１４０が出力する文データが示す文は、母音を含む音節を複数含み、算出部１２０は、母音の第一フォルマント周波数、当該母音の第二フォルマント周波数、及び、当該母音の第一フォルマント周波数に対する当該母音の第二フォルマント周波数の比の少なくとも１つのばらつきを特徴量として算出してもよい。特徴量として算出されるばらつきの度合いは、例えば、標準偏差である。

　また、例えば、出力部１４０が出力する文データが示す文は、互いに異なる母音を含む音節を少なくとも３つ含み、算出部１２０は、母音の第一フォルマント周波数に対する当該母音の第二フォルマント周波数で形成される座標空間において、少なくとも３つの母音のそれぞれから算出される第一フォルマント周波数に対する第二フォルマント周波数の値をプロットすることで形成される多角形の形状及び面積の少なくとも一方を特徴量として算出してもよい。

　また、例えば、出力部１４０が出力する文データが示す文は、互いに異なる母音を含む音節を少なくとも２つ含み、算出部１２０は、母音の第一フォルマント周波数に対する当該母音の第二フォルマント周波数で形成される座標空間において、少なくとも２つの母音のそれぞれから算出される第一フォルマント周波数に対する第二フォルマント周波数の値をプロットした場合の位置関係を特徴量として算出してもよい。

　また、例えば、出力部１４０が出力する文データが示す文は、子音と当該子音に後続した母音（後続母音）とからなる音節を含み、算出部１２０は、当該子音と当該後続母音との音圧差を特徴量として算出してもよい。なお、本明細書において、後続母音とは、「ｋ」、「ｓ」、「ｔ」、「ｎ」、「ｈ」等の子音となる音素に続いて発話される、「ａ」、「ｉ」、「ｕ」、「ｅ」、「ｏ」等の母音となる音素を示す。例えば、「た（ｔａ）」の場合、「ｔ」が子音であり、「ａ」が当該子音に連続した後続母音である。子音と後続母音との音圧差とは、例えば、「た（ｔａ）」の場合、「ｔ」の音圧と、「ａ」の音圧との差である。子音及び当該子音に連続した後続母音とは、母音のみの音節以外のいわゆる開音節である。特に、特徴量を算出する際に採用される子音は、健常者と認知症患者とで違いが生じやすい「ｐ」、「ｔ」、「ｋ」等の閉鎖子音（いわゆる破裂音）であるとよい。

　また、例えば、算出部１２０は、被評価者Ｕの文の読み上げ時間を特徴量として算出してもよい。

　また、例えば、出力部１４０は、さらに、被評価者Ｕに文を複数回読み上げさせるための指示を出力し、算出部１２０は、被評価者Ｕが複数回発話した文のそれぞれの読み上げ時間から算出される当該読み上げ時間の変化量を特徴量として算出してもよい。

　評価部１３０は、算出部１２０が算出した上記いずれか又は任意に選択された複数の特徴量と、記憶部１５０に記憶されている参照データ１５１とを照合し、被評価者Ｕの認知機能を評価する。例えば、記憶部１５０には、参照データ１５１として、健常者と、軽度の認知症患者と、認知症患者とを区別するための特徴量の閾値が記憶されている。評価部１３０は、算出部１２０が算出した特徴量と、参照データ１５１として記憶されている閾値とを比較することで、被評価者Ｕが健常者であるか、軽度の認知症患者であるか、認知症患者であるかを評価する。評価部１３０は、例えば、プロセッサ、マイクロコンピュータ、又は、専用回路によって実現される。なお、算出部１２０及び評価部１３０は、それぞれの機能を併せ持つ１つのプロセッサ、マイクロコンピュータ、又は、専用回路で実現されてもよいし、プロセッサ、マイクロコンピュータ、又は、専用回路のうちの２つ以上の組み合わせによって実現されてもよい。

　出力部１４０は、被評価者Ｕに発話させる特定の文を示す文データ（画像データ）、及び、評価部１３０が評価した被評価者Ｕの認知機能の評価結果を表示装置４００へ出力する。出力部１４０は、例えば、有線通信又は無線通信を行う通信インターフェースである。例えば、出力部１４０が出力する文データが示す文は、子音及び当該子音に後続した母音（後続母音）からなる音節、並びに、母音のみからなる音節の少なくとも一方が連続した文字列を含まれていてもよい。つまり、出力部１４０が出力する文データが示す文には、開音節が連続して配置された文字列が含まれてもよい。

　また、例えば、出力部１４０が出力する文データが示す文は、閉鎖子音と後続母音とからなる文字が、５以上含まれていてもよい。具体的には、出力部１４０が出力する文データが示す文は、「きたかぜとたいようがでています」、「たんけんかはぼうけんがだいすきです」、及び、「きたからきたかたたたきき」の少なくとも１つの文字列を含んでいてもよい。

　記憶部１５０は、人が発した音声を示す音声データに基づく特徴量と、当該人の認知機能との関係を示す参照データ１５１が記憶されている記憶装置である。参照データ１５１は、被評価者Ｕの認知機能の評価が行われるときに評価部１３０によって参照される予め記憶部１５０に記憶されているデータである。記憶部１５０は、例えば、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）等によって実現される。

　また、記憶部１５０には、算出部１２０及び評価部１３０が実行するプログラム、被評価者Ｕに発話させる文を含む画像データ、及び、被評価者Ｕの認知機能の評価結果を出力する際に用いられる当該評価結果を示す画像データも記憶されている。

　指示部１６０は、被評価者Ｕに発話させる文を示す文データを出力部１４０に出力させる制御をする制御装置である。指示部１６０は、例えば、認知機能評価装置１００と通信可能に接続され、被評価者Ｕ、被評価者Ｕを補助する補助者等の認知機能評価装置１００のユーザが操作する図示しないタッチパネル、ボタン等のユーザインターフェースから被評価者Ｕの認知機能の評価を開始する旨を示す指示を取得した場合に、記憶部１５０に記憶されている予め作成された画像（例えば、図４の（ａ）に示す画像４１０）データを出力部１４０に出力させることで、被評価者Ｕに特定の文を発話させることを指示する。指示部１６０は、具体的には、プロセッサ、マイクロコンピュータ、又は、専用回路によって実現される。なお、算出部１２０、評価部１３０、及び、指示部１６０は、それぞれの機能を併せ持つ１つのプロセッサ、マイクロコンピュータ、又は、専用回路で実現されてもよいし、プロセッサ、マイクロコンピュータ、又は、専用回路のうちの２つ以上の組み合わせによって実現されてもよい。また、指示部１６０が実行する制御プログラムは、記憶部１５０に記憶されていてもよい。

　［認知機能評価方法の処理手順］
　続いて、認知機能評価装置１００が実行する認知機能評価方法における具体的な処理手順について説明する。

　まず、出力部１４０は、記憶部１５０に記憶されている、被評価者Ｕに発話させる文を示す文データを表示装置４００に出力する（ステップＳ１０１）。具体的には、ステップＳ１０１において、指示部１６０は、記憶部１５０に記憶されている、被評価者Ｕに発話させる指示をする特定の文を示す文データを出力部１４０に出力させる。表示装置４００は、出力部１４０から取得した文データが示す画像を表示する。

　次に、取得部１１０は、集音装置３００を介して被評価者Ｕの文音声データを取得する（ステップＳ１０２）。ステップＳ１０２において、例えば、被評価者Ｕは、「きたからきたかたたたきき」等の、表示装置４００に表示される文を発話する。取得部１１０は、集音装置３００を介して、被評価者Ｕが発した「きたからきたかたたたきき」等の音声を、文音声データとして取得する。

　次に、算出部１２０は、ステップＳ１０２で取得した文音声データに基づく特徴量を算出する（ステップＳ１０３）。ステップＳ１０３において、例えば、算出部１２０は、文音声データに含まれる「きたからきたかたたたきき」における最初に発話された「た」を抽出し、抽出した「た」における子音と後続母音との音圧差を特徴量として算出する。

　なお、上述したように、算出部１２０が算出する特徴量はこれに限定されない。算出部１２０が算出する特徴量の具体例については、後述する。

　次に、評価部１３０は、ステップＳ１０３で算出部１２０が算出した特徴量から、被評価者Ｕの認知機能を評価する（ステップＳ１０４）。ステップＳ１０４において、評価部１３０は、例えば、ステップＳ１０３で算出部１２０が算出した特徴量と、記憶部１５０に記憶された参照データ１５１とから、被評価者Ｕの認知機能を評価する。

　次に、出力部１４０は、評価部１３０が評価した被評価者Ｕの認知機能の評価結果を出力する（ステップＳ１０５）。ステップＳ１０５において、出力部１４０は、例えば、ステップＳ１０４で評価部１３０が評価した評価結果に対応する画像を記憶部１５０から取得して、表示装置４００へ取得した画像を送信する。

　表示装置４００は、出力部１４０が出力した画像を取得して、当該画像を表示させる。こうすることで、被評価者Ｕは、簡便に、認知機能の評価結果を確認することができる。

　図４は、図３に示すステップＳ１０１において、取得部１１０が被評価者Ｕの音声データを取得する方法の一例を示す図である。具体的には、図４の（ａ）は、認知機能評価装置１００が被評価者Ｕに発話させる前に表示装置４００に表示させる画像４１０の一例を示す図であり、図４の（ｂ）は、認知機能評価装置１００が被評価者Ｕの文音声データを取得する際に表示装置４００に表示させる画像４２０の一例を示す図であり、図４の（ｃ）は、表示装置４００に表示された文を被評価者Ｕが読み上げている様子を示す図である。

　図４の（ａ）に示すように、認知機能評価装置１００は、被評価者Ｕから文音声データを取得する前に、被評価者Ｕへ「マイクの前の丸いスクリーンに近づいて話してください」という文が含まれる画像４１０を表示装置４００に表示させる。なお、図４の（ａ）に示す文は、例えば、医者等が直接被評価者Ｕに説明してもよいし、録音した音声を被評価者Ｕに聞かせてもよい。

　次に、図４の（ｂ）に示すように、表示装置４００には、被評価者Ｕに発話させる文が含まれる画像４２０が表示される。画像４１０には、例えば、「きたからきたかたたたきき」という文が含まれる画像４２０を例示している。

　次に、図４の（ｃ）に示すように、被評価者Ｕは、画像４２０に含まれる文を発話する。図４の（ｃ）に示す例においては、算出部１２０は、例えば、「きたからきたかたたたきき」における、最初に発話された「た（ｔａ）」を抽出する。算出部１２０は、さらに、抽出したの「た（ｔａ）」における子音である「ｔ」と後続母音である「ａ」との音圧を算出し、算出したそれぞれの音圧から、「ｔ」と「ａ」との音圧差を特徴量として算出する。

　このように、被評価者Ｕが発話する文を画像４２０に表示させることで、医者等が当該文を声で被評価者Ｕに伝える場合と比較して、被評価者Ｕの音声を検出する場合にノイズが入りにくくなる。

　［特徴量の詳細］
　以下、認知機能評価装置１００が、被評価者Ｕの認知機能の程度を評価する際に用いる特徴量の詳細について説明する。

　図５は、被評価者Ｕが発話した音声を示す文音声データの一例を示す図である。具体的には、図５は、被評価者Ｕが「きたからきたかたたたきき」と発話した場合の文音声データを示すグラフである。図５に示すグラフの横軸は時間であり、縦軸はパワー（音圧）である。なお、図５のグラフの縦軸に示すパワーの単位は、デシベル（ｄＢ）である。

　図５に示すグラフには、「き」、「た」、「か」、「ら」、「き」、「た」、「か」、「た」、「た」、「た」、「き」、「き」に対応する音圧の変化が確認される。取得部１１０は、図３に示すステップＳ１０２において、被評価者Ｕから文音声データとして、図５に示すデータを取得する。算出部１２０は、例えば、図３に示すステップＳ１０３において、既知の方法により、図５に示す文音声データから、初めに出現する「た（ｔａ）」における「ｔ」及び「ａ」の各音圧を算出する。算出部１２０は、算出した「ｔ」及び「ａ」の各音圧から、「ｔ」及び「ａ」の音圧差ΔＰ１を特徴量として算出する。この場合、参照データ１５１には、音圧差ΔＰ１の閾値が含まれており、評価部１３０は、例えば、当該閾値以上であれば被評価者Ｕが認知症であると判定し、当該閾値未満であれば健常者であると評価をする。

　なお、特徴量は、複数の音圧差の標準偏差等のばらつきでもよい。この場合、算出部１２０は、例えば、図５に示す音圧差ΔＰ１～ΔＰ９までを算出して、各音圧差ΔＰ１～ΔＰ９の標準偏差を特徴量として算出する。音圧差の標準偏差は、健常者と比較して、認知症患者の方が、大きくなる。特徴量として音圧差の標準偏差を採用する場合、参照データ１５１には、当該標準偏差の値である閾値が含まれており、評価部１３０は、例えば、当該閾値以上であれば被評価者Ｕが認知症であると判定し、当該閾値未満であれば健常者である等の評価をする。標準偏差を算出する際に用いられる音圧差の数は、特に限定されず、２つでもよいし、３以上でもよい。

　図６は、文音声データから算出部１２０が算出するフォルマント周波数を説明するための図である。なお、図６に示すグラフの横軸は周波数［Ｈｚ］であり、縦軸は振幅である。

　図６に破線で示すように、文音声データの横軸を周波数に変換して得られるデータには、複数のピークが確認される。複数のピークのうち、周波数の最も低いピークの周波数は、第一フォルマント周波数Ｆ１である。また、第一フォルマント周波数Ｆ１の次に周波数の低いピークの周波数は、第二フォルマント周波数Ｆ２である。また、第二フォルマント周波数Ｆ２の次に周波数の低いピークの周波数は、第三フォルマント周波数Ｆ３である。このように、算出部１２０は、取得部１１０が取得した文音声データから既知の方法により母音の部分を抽出して、抽出した母音の部分の文音声データを、周波数に対する振幅にデータ変換することにより母音のスペクトルを算出して、フォルマント周波数を算出する。

　なお、図６に示すグラフは、被評価者Ｕから得られる文音声データを周波数に対する振幅のデータに変換し、その包絡線を求めることにより算出される。包絡線の計算には、例えば、ケプストラム分析、線形予測分析（Ｌｉｎｅａｒ　Ｐｒｅｄｉｃｔｉｖｅ　Ｃｏｄｉｎｇ：ＬＰＣ）等が採用される。

　図７は、音声データから算出部１２０が算出するフォルマント周波数の時間変化の一例を示す図である。具体的には、図７は、第一フォルマント周波数Ｆ１と、第二フォルマント周波数Ｆ２と、第三フォルマント周波数Ｆ３との周波数の時間変化の一例を説明するためのグラフである。

　例えば、認知機能評価装置１００は、被評価者Ｕに、「あいうえお」等の連続した複数の母音を含む音節を発話させる。具体的には、出力部１４０は、「あいうえお」等の連続した複数の母音を含む音節からなる文字列を含む文を示す文データを表示装置４００に出力し、当該文を表示装置４００に表示させることで、被評価者Ｕに「あいうえお」等の複数の母音を含む音節を発話させる。算出部１２０は、被評価者Ｕが発話した音声を示す文音声データから、複数の母音それぞれの第一フォルマント周波数Ｆ１及び第二フォルマント周波数Ｆ２を算出する。さらに、算出部１２０は、母音が連続した文字列の第一フォルマント周波数Ｆ１及び第二フォルマント周波数Ｆ２の変化量、母音が連続した文字列の第一フォルマント周波数Ｆ１及び第二フォルマント周波数Ｆ２の変化にかかる所要時間、並びに、当該所要時間に対する当該変化量の比である変化率の少なくとも１つを特徴量として算出する。

　第一フォルマント周波数Ｆ１並びに第二フォルマント周波数Ｆ２の変化量、所要時間、及び、変化率は、健常者と比較して、認知症患者の方が、それぞれ大きくなる。特徴量として変化量、所要時間、又は、変化率を採用する場合、参照データ１５１には、変化量、所要時間、又は、変化率の値である閾値が含まれており、評価部１３０は、例えば、当該閾値以上であれば被評価者Ｕが認知症であると判定し、当該閾値未満であれば健常者である等の評価をする。

　なお、被評価者Ｕに発話させる文に含まれる母音は、連続していなくてもよい。具体的には、出力部１４０は、「たいよう」等の「い」及び「う」のように、連続していない複数の母音からなる文字列を含む文を示す文データを表示装置４００に出力し、当該文を表示装置４００に表示させてもよい。このような場合、算出部１２０は、母音の第一フォルマント周波数Ｆ１、当該母音の第二フォルマント周波数Ｆ２、及び、当該母音の第一フォルマント周波数Ｆ１に対する当該母音の第二フォルマント周波数Ｆ２の比の少なくとも１つのばらつきを特徴量として算出してもよい。特徴量として算出されるばらつきの度合いは、例えば、標準偏差である。当該ばらつきは、健常者と比較して、認知症患者の方が、大きくなる。特徴量として当該ばらつき（具体的には、標準偏差）を採用する場合、参照データ１５１には、当該標準偏差の値である閾値が含まれており、評価部１３０は、例えば、当該閾値以上であれば被評価者Ｕが認知症であると判定し、当該閾値未満であれば健常者である等の評価をする。

　また、「きたからきたかたたたきき」のように、母音のみの音節はなく、子音と後続母音とからなる開音節のみからなる文の場合、算出部１２０は、例えば、後続母音の音素のみを抽出して、各後続母音のフォルマント周波数を算出して、当該フォルマント周波数の変化量、変化に係る所要時間、変化率等を算出してもよい。また、連続した母音の文字列は、後続母音と母音とが連続した文字列でもよい。

　なお、認知機能評価装置１００は、時間を測定するために、ＲＴＣ（Ｒｅａｌ　Ｔｉｍｅ　Ｃｌｏｃｋ）等の計時部を備えてもよい。

　図８は、評価部１３０が評価する文音声データの特徴量の一例を説明するための図である。なお、図８に示すグラフは、横軸が第一フォルマント周波数Ｆ１であり、縦軸が第二フォルマント周波数Ｆ２である。

　図８に示すように、算出部１２０は、一つの母音に対して、第一フォルマント周波数Ｆ１と第二フォルマント周波数Ｆ２とを算出することで、図８に示すグラフに一点プロットする。例えば、被評価者Ｕには、「あ」、「い」、「う」、「え」、「お」を発話させる。具体的には、出力部１４０は、「あ」、「い」、「う」、「え」、「お」を含む文を示す文データを表示装置４００に出力し、当該文を表示装置４００に表示させることで、被評価者Ｕに「あ」、「い」、「う」、「え」、「お」を発話させる。算出部１２０は、文音声データに含まれる「あ」、「い」、「う」、「え」、「お」それぞれの第一フォルマント周波数Ｆ１と第二フォルマント周波数Ｆ２とを算出する。こうすることで、算出部１２０は「あ」、「い」、「う」、「え」、「お」それぞれに対応する点を図８に示す座標空間にプロットする。このように、算出部１２０は、母音の第一フォルマント周波数Ｆ１に対する当該母音の第二フォルマント周波数Ｆ２で形成される座標空間（具体的には、図８に示す座標空間）において、少なくとも３つの母音のそれぞれから算出される第一フォルマント周波数Ｆ１に対する第二フォルマント周波数Ｆ２の比をプロットすることで形成される多角形の形状及び面積の少なくとも一方を特徴量として算出する。

　このように形成された多角形の面積は、健常者と比較して、認知症患者の方が、面積が小さくなる。特徴量として当該多角形の面積を採用する場合、参照データ１５１には、多角形の面積の値である閾値が含まれており、評価部１３０は、例えば、当該閾値以上であれば被評価者Ｕが健常者であると判定し、当該閾値未満であれば認知症である等の評価をする。

　また、このように形成された多角形の形状は、健常者と比較して、認知症患者の方が、各点の距離が近くなる。また、当該多角形が五角形の場合、当該多角形の形状は、健常者と比較して、認知症患者の方が、正五角形で近似した場合に、当該正五角形に対してゆがみが大きくなる。特徴量として当該多角形の形状を採用する場合、参照データ１５１には、多角形を構成する各点の距離、又は、正五角形で各点を近似した場合の各点からのずれ量の値である閾値が含まれており、評価部１３０は、例えば、当該閾値以上であれば被評価者Ｕが健常者であると判定し、当該閾値未満であれば認知症である等の評価をする。

　なお、プロットするために採用する母音は、子音に続く後続母音でもよいし、日本語ではなく外国語である場合には、「∧」（発音記号）等、日本語における母音である「ａ」、「ｉ」、「ｕ」、「ｅ」、「ｏ」以外でもよい。

　また、プロットする点の数は、各点から構成される多角形の形状及び面積の少なくとも一方を算出できればよく、３以上であればよい。

　図９は、評価部１３０が評価する文音声データの特徴量の別の一例を説明するための図である。

　図９に示すように、算出部１２０は、一つの母音に対して、第一フォルマント周波数Ｆ１と第二フォルマント周波数Ｆ２とを算出することで、図９に示すグラフに一点プロットする。例えば、認知機能評価装置１００は、被評価者Ｕに、「あい」、「あう」、「おい」等の連続した母音を含む音節を発話させる。具体的には、出力部１４０は、「あい」、「あう」、「おい」等の母音を含む音節が連続した文字列を含む文を示す文データを表示装置４００に出力し、当該文を表示装置４００に表示させることで、被評価者Ｕに「あい」、「あう」、「おい」等を発話させる。算出部１２０は、文音声データに含まれる、例えば「あい」のうちの「あ」及び「い」それぞれの第一フォルマント周波数Ｆ１と第二フォルマント周波数Ｆ２とを算出する。こうすることで、算出部１２０は「あ」、「い」それぞれに対応する点をプロットする。このように、出力部１４０が出力する文データが示す文は、連続した少なくとも２つの母音を含み、算出部１２０は、母音の第一フォルマント周波数Ｆ１に対する当該母音の第二フォルマント周波数Ｆ２で形成される座標空間（具体的には、図９に示す座標空間）において、少なくとも２つの母音のそれぞれから算出される第一フォルマント周波数Ｆ１に対する第二フォルマント周波数Ｆ２の比をプロットした場合の位置関係を特徴量として算出してもよい。

　また、このようにプロットされた各点は、健常者と比較して、認知症患者の方が、距離が近くなる。特徴量として当該各点の位置関係を採用する場合、参照データ１５１には、各点の距離である閾値が含まれており、評価部１３０は、例えば、当該閾値以上であれば被評価者Ｕが健常者であると判定し、当該閾値未満であれば認知症である等の評価をする。

　ところで、認知症の診断は、認知症の診断のためのバッチテストであるＭｏＣＡテストを人が受けることにより、当該人が認知症であるかどうかを特定することができる。

　図１０は、人がＭｏＣＡテストを受けた際に獲得したスコアを示す図である。

　本発明者らは、健常者（ＮＣ：Ｎｏｒｍａｌ　Ｃｏｎｔｒｏｌ）、軽度の認知症患者（ＭＣＩ：Ｍｉｌｄ　Ｃｏｇｎｉｔｉｖｅ　Ｉｎｐａｉｒｍｅｎｔ）及び認知症患者（ＡＤ）を含む複数の被評価者を集めて、ＭｏＣＡテストを実施した。ＮＣの被評価者数（Ｎｕｍｂｅｒ　ｏｆ　ｓｕｂｊｅｃｔｓ）は９０人とし、ＭＣＩの被評価者数は９４人とし、ＡＤの被評価者数は９３人とした。

　図１０から、ＮＣ、ＭＣＩ及びＡＤとでＭｏＣＡのスコアの平均値（ＭｏＣＡ　ａｖｅｒａｇｅ　ｓｃｏｒｅ）及びスコアの範囲（ＭｏＣＡ　ｓｃｏｒｅ　ｒａｎｇｅ）が異なることが確認できる。具体的には、ＮＣのＭｏＣＡのスコアの平均値は２７．４であり、ＭＣＩのＭｏＣＡのスコアの平均値は２２．１であり、ＡＤのＭｏＣＡのスコアの平均値は１６．２であった。

　また、ＭｏＣＡテストを受けた各人から、当該各人が発話した音声を示す音声データ（文音声データ）に基づく上述した特徴量を算出することで、音声データに基づく人の特徴量と当該人の認知機能との関係を示す参照データ１５１を作成する。例えば、評価部１３０によって被評価者ＵがＮＣか、ＭＣＩか、ＡＤかを判定する場合、上述した特徴量の閾値として、値の異なる２つの閾値（例えば、第一閾値及び第二閾値）が参照データ１５１となる。評価部１３０は、例えば、被評価者Ｕから取得した文音声データから算出される特徴量が、第一閾値未満であれば被評価者ＵをＮＣと評価し、第一閾値以上第二閾値未満であれば被評価者ＵをＭＣＩと評価し、第二閾値以上であれば被評価者ＵをＡＤと評価する。認知機能評価装置１００は、当該参照データ１５１を用いることで、被評価者Ｕの文音声データに基づく特徴量と参照データ１５１とから、被評価者Ｕの認知機能を簡便に評価することができる。なお、参照データ１５１として用いられる特徴量の閾値は、１つでもよいし、２以上でもよい。

　図１１は、表示装置４００に表示される、認知機能が低下していることを示す画像の一例を示す図である。

　表示装置４００は、評価部１３０が評価した評価結果として、図１１に示されるような画像４３０を表示する。画像４３０は、例えば、評価部１３０が被評価者Ｕの認知機能をＡＤと評価した場合に表示する画像の一例である。このように、表示装置４００は、評価部１３０が評価した評価結果を画像として表示する。こうすることで、例えば、被評価者Ｕが自宅等で認知機能評価装置１００を用いて認知機能を評価している場合には、認知機能評価装置１００は、被評価者Ｕに対して医者等の診察を促すことが可能である。

　ところで、図４の（ｃ）に示す「きたからきたかたたたきき」のように、被評価者Ｕに発話させる文は、一度ではなく、複数回発話させてもよい。

　図１２は、被評価者Ｕの文音声データを取得する際に表示装置４００に表示させる画像の別の一例を示す図である。

　図１２に示す画像４４０のように、出力部１４０が被評価者Ｕに発話させる文を含む文データには、当該文を複数回発話させる説明文が含まれていてもよい。例えば、算出部１２０は、被評価者Ｕの文の読み上げ時間を特徴量として算出する。文の読み上げ時間は、健常者と比較して、認知症患者の方が、長くなる。この場合、参照データ１５１には、読み上げ時間の閾値が含まれており、評価部１３０は、例えば、当該閾値以上であれば被評価者Ｕが認知症であると判定し、当該閾値未満であれば健常者である等の評価をする。

　ここで、被評価者Ｕに複数回同じ文章を読ませてもよい。具体的には、出力部１４０は、さらに、被評価者Ｕに文を複数回読み上げさせるための指示を出力し、算出部１２０は、被評価者Ｕが複数回発話した文のそれぞれの読み上げ時間から算出される当該読み上げ時間の変化量を特徴量として算出してもよい。

　なお、ここでいう変化量は、例えば、１回目に被評価者Ｕが文の読み上げにかかった時間が１０秒であり、２回目に被評価者Ｕが文の読み上げにかかった時間が８秒である場合、変化量は２秒である。また、被評価者Ｕに３回以上文を読み上げさせた場合、例えば、算出部１２０は、被評価者Ｕが文の１回の読み上げにかかった時間の標準偏差、又は、複数算出される変化量の平均値を特徴量として算出してもよい。

　文の読み上げ時間の変化量は、健常者と比較して、認知症患者の方が、大きくなる。この場合、参照データ１５１には、読み上げ時間の変化量が含まれており、評価部１３０は、例えば、当該閾値以上であれば被評価者Ｕが認知症であると判定し、当該閾値未満であれば健常者である等の評価をする。

　なお、図１２には、被評価者Ｕに文を３回発話させる指示について例示したが、２回でもよいし、４回以上でもよい。

　また、出力部１４０が被評価者Ｕに発話させる文を含む文データは、当該文を複数回発話させる説明文を含んでいてもよいし、被評価者Ｕに発話させる文を複数含んでいてもよい。

　［効果等］
　以上、実施の形態に係る認知機能評価装置１００は、被評価者Ｕが指示された文に従って発話した音声を示す文音声データを取得する取得部１１０と、取得部１１０が取得した文音声データから、当該文音声データに基づく特徴量を算出する算出部１２０と、算出部１２０が算出した特徴量と、人が発した音声を示す音声データと当該人の認知機能との関係を示す参照データ１５１とを照合することにより、被評価者Ｕの認知機能を評価する評価部１３０と、被評価者Ｕに発話させる文を出力し、且つ、評価部１３０が評価した評価結果を出力する出力部１４０と、を備える。

　これにより、認知機能評価装置１００によれば、評価部１３０で認知機能を正確に評価しやすい音声データを被評価者Ｕから取得することができる。そのため、認知機能評価装置１００によれば、簡便に、且つ、精度良く被評価者Ｕの認知機能を評価できる。

　例えば、被評価者Ｕに発話させる文は、子音及び当該子音に連続した後続母音、並びに、母音の少なくとも一方が連続した文字列を含んでもよい。

　つまり、評価部１３０が評価する音声データは、子音及び当該子音に後続した母音からなる音節、並びに、母音のみからなる音節の少なくとも一方が連続しているとよい。例えば、図５に示すように、子音である「ｔ」よりも、母音である「ａ」の方が、音圧が大きいことが分かる。このように、例えば、集音装置３００で集音した場合に、子音と比較して、母音の方が、集音しやすい。また、音及び当該子音に連続した後続母音、並びに、母音の少なくとも一方を連続して発話させることで、複数の母音を解析することができるため、より精度良く被評価者Ｕの認知機能を評価できる。

　また、例えば、被評価者Ｕに発話させる文は、「きたかぜとたいようがでています」、「たんけんかはぼうけんがだいすきです」、及び、「きたからきたかたたたきき」の少なくとも１つの文字列を含んでもよい。これらのように、出力部１４０が出力する文データが示す文は、閉鎖子音と当該閉鎖子音に後続した母音とからなる文字が、５以上含まれていてもよい。閉鎖子音は、ＡＤとＮＣとで音声データに違いが生じやすい。そのため、被評価者Ｕに発話させる文を、例えば、「きたかぜとたいようがでています」、「たんけんかはぼうけんがだいすきです」、及び、「きたからきたかたたたきき」とすることで、より精度良く被評価者Ｕの認知機能を評価できる。

　また、例えば、被評価者Ｕに発話させる文は、母音を含む音節が連続した文字列を含んでもよい。また、算出部１２０は、母音の第一フォルマント周波数Ｆ１及び第二フォルマント周波数Ｆ２の変化量、母音の第一フォルマント周波数Ｆ１及び第二フォルマント周波数Ｆ２の変化にかかる所要時間、並びに、当該所要時間に対する当該変化量の比である変化率の少なくとも１つを特徴量として算出してもよい。

　第一フォルマント周波数Ｆ１は、人の音声の低周波数側から数えて１番目に見られる振幅のピーク周波数であり、舌の動きに関する特徴が反映されやすいことが知られている。また、ＡＤは、ＮＣと比較して舌をうまく動かせない場合が多い。そのため、第一フォルマント周波数Ｆ１は、ＮＣとＡＤとで違いが生じやすいと考えられる。また、例えば、ＡＤは、舌やあごの位置を維持する運動機能が衰える場合が多いと考えらえる。そのため、ＡＤは、ＮＣと比較して、発する音声が安定しにくいことが考えられる。つまり。ＡＤは、ＮＣと比較して、発する音声がばらつくために、第一フォルマント周波数Ｆ１及び第二フォルマント周波数Ｆ２の時間変化が大きくなることが考えられる。そのため、第一フォルマント周波数Ｆ１及び第二フォルマント周波数Ｆ２の変化量、所要時間、及び、当該所要時間に対する当該変化量の比である変化率を特徴量として認知機能の評価に用いることで、より精度良く被評価者Ｕの認知機能の評価が可能となる。

　また、例えば、被評価者Ｕに発話させる文は、母音を含む音節を複数含んでもよい。また、算出部１２０は、母音の第一フォルマント周波数Ｆ１、当該母音の第二フォルマント周波数Ｆ２、及び、当該母音の第一フォルマント周波数Ｆ１に対する当該母音の第二フォルマント周波数Ｆ２の比の少なくとも１つのばらつきを特徴量として算出してもよい。

　上記のとおり、ＡＤは、ＮＣと比較して、発する音声がばらつくために、第一フォルマント周波数Ｆ１及び第二フォルマント周波数Ｆ２がばらつきやすい。また、フォルマント周波数には、個人差が生じることが推定される。さらに、第一フォルマント周波数Ｆ１と第二フォルマント周波数Ｆ２とには、個人ごとに相関がみられることが推定される。そのため、母音の第一フォルマント周波数Ｆ１に対する当該母音の第二フォルマント周波数Ｆ２の比のばらつきを特徴量とすることで、より精度良く被評価者Ｕの認知機能を評価できる。

　また、例えば、被評価者Ｕに発話させる文は、互いに異なる母音を含む音節を少なくとも３つ含んでもよい。また、算出部１２０は、母音の第一フォルマント周波数Ｆ１に対する当該母音の第二フォルマント周波数Ｆ２で形成される座標空間において、少なくとも３つの互いに異なる母音のそれぞれから算出される第一フォルマント周波数Ｆ１に対する第二フォルマント周波数Ｆ２の比をプロットすることで形成される多角形の形状及び面積の少なくとも一方を特徴量として算出してもよい。

　上記の通り、このように形成された多角形の面積は、健常者と比較して、認知症患者の方が、面積が小さくなる。また、このように形成された多角形の形状は、健常者と比較して、認知症患者の方が、各点の距離が近くなる。また、当該多角形が五角形の場合、当該多角形の形状は、健常者と比較して、認知症患者の方が、正五角形で近似した場合に、正五角形に対してゆがみが大きくなる。そのため、特徴量として、上記のように形成される多角形の形状及び面積の少なくとも一方を採用することで、より精度良く被評価者Ｕの認知機能の評価が可能となる。

　また、例えば、被評価者Ｕに発話させる文は、互いに異なる母音を含む音節を少なくとも２つ連続して含んでもよい。また、算出部１２０は、母音の第一フォルマント周波数Ｆ１に対する当該母音の第二フォルマント周波数Ｆ２で形成される座標空間において、少なくとも２つの母音のそれぞれから算出される第一フォルマント周波数Ｆ１に対する第二フォルマント周波数Ｆ２の比をプロットした場合の位置関係を特徴量として算出してもよい。

　上記の通り、このようにプロットされた各点は、健常者と比較して、認知症患者の方が、距離が近くなる。そのため、特徴量として、当該各点の位置関係を採用することで、より精度良く被評価者Ｕの認知機能の評価が可能となる。

　また、例えば、被評価者Ｕに発話させる文は、子音と当該子音に後続した母音とからなる音節を含んでもよい。また、算出部１２０は、子音と後続母音との音圧差を特徴量として算出してもよい。

　評価部１３０は、例えば、当該閾値以上であれば被評価者Ｕが認知症であると判定し、当該閾値未満であれば健常者である等の評価をする。また、例えば、特徴量は、複数の音圧差の標準偏差等のばらつきでもよい。この場合、算出部１２０は、例えば、図５に示す音圧差ΔＰ１～ΔＰ９までを算出して、各音圧差ΔＰ１～ΔＰ９の標準偏差を特徴量として算出する。音圧差の標準偏差は、健常者と比較して、認知症患者の方が、大きくなる。そのため、特徴量として音圧差を採用することで、より精度良く被評価者Ｕの認知機能の評価が可能となる。

　上記の通り、文の読み上げ時間は、健常者と比較して、認知症患者の方が、長くなる。そのため、特徴量として文の読み上げ時間を採用することで、より精度良く被評価者Ｕの認知機能の評価が可能となる。

　また、例えば、出力部１４０は、さらに、被評価者Ｕに文を複数回読み上げさせるための指示を出力してもよい。また、算出部１２０は、被評価者Ｕが複数回発話した文のそれぞれの読み上げ時間から算出される当該読み上げ時間の変化量を特徴量として算出してもよい。

　上記の通り、文の読み上げ時間の変化量は、健常者と比較して、認知症患者の方が、大きくなる。そのため、特徴量として文の読み上げ時間の変化量を採用することで、より精度良く被評価者Ｕの認知機能の評価が可能となる。

　また、例えば、認知機能評価装置１００は、参照データ１５１を記憶する記憶部１５０を備えてもよい。

　つまり、認知機能評価装置１００は、参照データ１５１を記憶している外部のサーバ装置等の通信することで、被評価者Ｕの認知機能の評価をしてもよいが、参照データ１５１を記憶している記憶装置である記憶部１５０を備えてもよい。これにより、認知機能評価装置１００は、外部のサーバ装置を通信するためのネットワークに接続することなく、被評価者Ｕの認知機能を評価することができる。そのため、認知機能評価装置１００の利便性は、向上される。

　また、実施の形態に係る認知機能評価システム２００は、認知機能評価装置１００と、被評価者Ｕの音声を検出する集音装置３００と、出力部１４０が出力した文及び評価結果を表示する表示装置４００と、を備える。

　これにより、認知機能評価システム２００は、表示装置４００によって被評価者Ｕに発話させる文を提示し、集音装置３００によって被評価者Ｕの音声を検出し、認知機能評価装置１００によって被評価者Ｕの認知機能を評価し、表示装置４００によって当該評価結果を表示できる。つまり、認知機能評価システム２００によれば、評価部１３０で認知機能を正確に評価しやすい音声データを被評価者Ｕから取得することができる。そのため、認知機能評価システム２００によれば、簡便に、且つ、精度良く被評価者Ｕの認知機能を評価できる。

　また、実施の形態に係る認知機能評価方法は、コンピュータ（具体的には、認知機能評価装置１００）が実行する認知機能評価方法であって、被評価者Ｕに発話させる文を出力する文出力ステップと、被評価者Ｕが発話した音声を示す文音声データを取得する取得ステップと、取得ステップで取得した文音声データから、当該文音声データに基づく特徴量を算出する算出ステップと、算出ステップで算出した特徴量と、人が発した音声を示す音声データと当該人の認知機能との関係を示す参照データとを照合することにより、被評価者Ｕの認知機能を評価する評価ステップと、評価ステップで評価した評価結果を出力する評価結果出力ステップと、を含む。

　これにより、本発明に係る認知機能評価方法によれば、認知機能を正確に評価しやすい音声データを被評価者Ｕから取得することができる。そのため、本発明に係る認知機能評価方法によれば、簡便に、且つ、精度良く被評価者Ｕの認知機能を評価できる。

　（変形例）
　続いて、実施の形態の変形例１及び変形例２に係る認知機能評価システムについて説明する。なお、実施の形態と同一の構成に関しては同一の符号を付しており、重複する説明は省略又は簡略化する場合がある。

　図１３は、実施の形態の変形例１に係る認知機能評価システムの構成を示す図である。

　実施の形態の変形例１に係る認知機能評価システム２００ａは、実施の形態に係る認知機能評価システム２００と同様に、認知機能評価装置１００と、集音装置３００と、表示装置４００とを備える。認知機能評価システム２００は、例えば、集音装置３００を覆うように、ポップガード３２０を備えてもよい。

　また、認知機能評価システム２００ａでは、指向性を有する集音装置３００が採用されている。ここで、集音装置３００及び表示装置４００は、集音装置３００が最大感度を示す方向（図１３に示す集音方向Ｖ２）と表示装置４００が課題情報を表示する表示面４０１の法線方向Ｖ１とが一致するように配置されている。具体的には、法線方向Ｖ１と集音方向Ｖ２とが平行となるように、集音装置３００及び表示装置４００は、机等の固定物に配置されている。なお、集音装置３００及び表示装置４００は、造営材等に固定されてもよい。また、認知機能評価システム２００ａは、集音装置３００及び表示装置４００の位置関係を固定するための固定具を備えてもよい。

　こうすることで、被評価者Ｕが表示装置４００を見ながら発話した場合においても、集音方向Ｖ２と、発話する方向とが一致しやすくなる。そのため、認知機能評価システム２００ａのような位置関係とすることで、集音装置３００は、被評価者Ｕの音声を正確に検出しやすくなる。

　続いて、実施の形態の変形例２に係る認知機能評価システムについて説明する。

　図１４は、実施の形態の変形例２に係る認知機能評価システムの構成を示す図である。

　実施の形態の変形例２に係る認知機能評価システム２００ｂは、実施の形態に係る認知機能評価システム２００と同様に、認知機能評価装置１００と、集音装置３００ａと、表示装置４００とを備える。

　集音装置３００ａは、集音装置３００と同様に、被評価者Ｕが発した音声を検出して、検出した音声を示す音声データを認知機能評価装置１００へ出力するマイクである。また、集音装置３００ａは、実施の形態に係る認知機能評価システム２００における集音装置３００と同様に、指向性を有する。

　認知機能評価システム２００ｂにおいては、集音装置３００ａと表示装置４００とが一体として形成されている。具体的には、集音装置３００ａと表示装置４００とは、同一の筐体に配置されている。集音装置３００ａと表示装置４００とを一体に形成する製造工程において、法線方向Ｖ１と集音方向Ｖ２とを一致するように形成しておけば、被評価者Ｕが認知機能評価システム２００ｂを利用する際に、法線方向Ｖ１及び集音方向Ｖ２がずれることが抑制される。

　（その他の実施の形態）
　以上、実施の形態、実施の形態の変形例１及び変形例２に係る認知機能評価装置等について説明したが、本発明は、上記実施の形態に限定されるものではない。

　また、上記実施の形態では、認知機能の低下の症状の一具体例として、アルツハイマー型認知症が挙げられた。しかしながら、認知機能とは、認識したり、記憶したり、判断したりする能力を示し、認知症とは、上述した認知機能の低下が見られる症状を示す。つまり、認知機能評価装置が評価する認知機能の程度は、アルツハイマー型認知症に限定されず、例えば、血管性認知症、酩酊の度合い等でもよい。

　また、上記実施の形態では、被評価者Ｕの認知機能の程度を評価するために、ＭｏＣＡテストのスコアとフォルマントの特徴量との関係性を示すデータを参照データ１５１として予め記憶部１５０が記憶している。しかしながら、参照データは、フォルマントの特徴量と照合することで認知機能の程度の評価をすることができるデータであればよく、ＭｏＣＡテストとフォルマントの特徴量との関係性を示すデータに限定されない。例えば、参照データは、ＭＭＳＥ（Ｍｉｎｉ－Ｍｅｎｔａｌ　Ｓｔａｔｅ　Ｅｘａｍｉｎａｔｉｏｎ：ミニメンタルステート検査）等のスコアとフォルマント周波数等の特徴量との関係を示すデータでもよい。

　また、上記実施の形態では、「閾値以上」、「閾値未満」等と記載したが、厳密な意味で記載するものではない。例えば、「閾値以上」と記載する場合においては、閾値よりも大きいことを意味してもよい。また、「閾値以上」、「閾値未満」と対比して記載する場合に、当該閾値を境に区別されることを意味し、それぞれ、「閾値より大きい」、「閾値以下」であることを意味してもよい。

　また、上記参照データにおける文音声データと認知症の程度との関係は、現時点における発明者らの上記被評価者らを集めたデータ分析によりものであるが、今後、より多くの被評価者を集めたデータ分析、条件を見直したデータ分析などが行われることにより評価基準が変更になる可能性がある。したがって、上記実施の形態では、特徴量として音圧差を採用する場合において、評価部は、例えば、当該閾値以上であれば被評価者Ｕが認知症であると判定し、当該閾値未満であれば健常者である等の評価をしたが、これに限定されない。例えば、当該閾値未満であれば被評価者Ｕが認知症であると判定し、当該閾値以上であれば健常者である等の評価をしてもよい。他の特徴量における閾値の扱いについても同様である。

　また、上記実施の形態では、被評価者から得られる文音声データのみを特徴量として算出して被評価者の認知機能を評価したが、他の既知の認知機能を評価できるデータを組み合わせて評価を実施してもよい。例えば、認知機能と歩幅、歩隔、歩行速度等の歩行に関する歩行データとには、相関があることが知られている。上記実施の形態で評価された被評価者の文音声データと、被評価者の歩行データとを組み合わせて認知機能の評価に用いることで、より精度良く被評価者の認知機能は評価され得る。

　また、本発明は、認知機能評価装置及び認知機能評価システムとして実現できるだけでなく、認知機能評価装置及び認知機能評価システムの行う各構成要素が行う処理をステップとして含むプログラム、及び、そのプログラムを記録したコンピュータ読み取り可能な記録媒体、例えば、フレキシブルディスク、ハードディスク、ＣＤ－ＲＯＭ、ＭＯ、ＤＶＤ、ＤＶＤ－ＲＯＭ、ＤＶＤ－ＲＡＭ、ＢＤ（Ｂｌｕ－ｒａｙ（登録商標）　Ｄｉｓｃ）、半導体メモリ等の記録媒体として実現することもできる。また、当該プログラムは、インターネット等の通信路で配信されてもよい。

　つまり、上記包括的又は具体的な態様は、システム、装置、集積回路、コンピュータプログラム又はコンピュータ読み取り可能な記録媒体で実現されてもよく、システム、装置、集積回路、コンピュータプログラム及び記録媒体の任意な組み合わせで実現されてもよい。例えば、認知機能評価装置が備える各構成要素は、一つの筐体内にある必要はなく、それぞれが異なる場所に配置されて各種データの送受信が可能に接続させていればよい。

　その他、各実施の形態に対して当業者が思いつく各種変形を施して得られる形態、又は、本発明の趣旨を逸脱しない範囲で各実施の形態における構成要素及び機能を任意に組み合わせることで実現される形態も本発明に含まれる。

　１００　認知機能評価装置
　１１０　取得部
　１２０　算出部
　１３０　評価部
　１４０　出力部
　１５０　記憶部
　１５１　参照データ
　２００、２００ａ、２００ｂ　認知機能評価システム
　３００、３００ａ　集音装置
　４００　表示装置
　Ｆ１　第一フォルマント周波数
　Ｆ２　第二フォルマント周波数
　Ｕ　被評価者
　ΔＰ１～ΔＰ９　音圧差

Claims

　被評価者が指示された文に従って発話した音声を示す文音声データを取得する取得部と、
　前記取得部が取得した前記文音声データから、当該文音声データに基づく特徴量を算出する算出部と、
　前記算出部が算出した前記特徴量と、人が発した音声を示す音声データと当該人の認知機能との関係を示す参照データとを照合することにより、前記被評価者の認知機能を評価する評価部と、
　前記被評価者に発話させる前記文を出力し、且つ、前記評価部が評価した評価結果を出力する出力部と、を備える
　認知機能評価装置。
　前記文は、子音及び当該子音に後続した母音からなる音節、並びに、母音のみからなる音節の少なくとも一方が連続した文字列を含む
　請求項１に記載の認知機能評価装置。
　前記文は、きたかぜとたいようがでています、たんけんかはぼうけんがだいすきです、及び、きたからきたかたたたききの少なくとも１つの文字列を含む
　請求項１に記載の認知機能評価装置。
　前記文は、母音を含む音節が連続した文字列を含み、
　前記算出部は、母音の第一フォルマント周波数及び第二フォルマント周波数の変化量、当該母音の第一フォルマント周波数及び第二フォルマント周波数の変化にかかる所要時間、並びに、前記所要時間に対する前記変化量の比である変化率の少なくとも１つを前記特徴量として算出する
　請求項１に記載の認知機能評価装置。
　前記文は、母音を含む音節を複数含み、
　前記算出部は、母音の第一フォルマント周波数、当該母音の第二フォルマント周波数、及び、当該母音の第一フォルマント周波数に対する当該母音の第二フォルマント周波数の比の少なくとも１つのばらつきを前記特徴量として算出する
　請求項１に記載の認知機能評価装置。
　前記文は、互いに異なる母音を含む音節を少なくとも３つ含み、
　前記算出部は、母音の第一フォルマント周波数に対する当該母音の第二フォルマント周波数で形成される座標空間において、前記少なくとも３つの母音のそれぞれから算出される第一フォルマント周波数に対する第二フォルマント周波数の比をプロットすることで形成される多角形の形状及び面積の少なくとも一方を前記特徴量として算出する
　請求項１に記載の認知機能評価装置。
　前記文は、互いに異なる母音を含む音節を少なくとも２つ連続して含み、
　前記算出部は、母音の第一フォルマント周波数に対する当該母音の第二フォルマント周波数で形成される座標空間において、前記少なくとも２つの母音のそれぞれから算出される第一フォルマント周波数に対する第二フォルマント周波数の比をプロットした場合の位置関係を前記特徴量として算出する
　請求項１に記載の認知機能評価装置。
　前記文は、子音と当該子音に後続した母音とからなる音節を含み、
　前記算出部は、前記子音と前記母音との音圧差を前記特徴量として算出する
　請求項１に記載の認知機能評価装置。
　前記算出部は、前記被評価者の前記文の読み上げ時間を前記特徴量として算出する
　請求項１に記載の認知機能評価装置。
　前記出力部は、さらに、前記被評価者に前記文を複数回読み上げさせるための指示を出力し、
　前記算出部は、前記被評価者が複数回発話した前記文のそれぞれの読み上げ時間から算出される当該読み上げ時間の変化量を前記特徴量として算出する
　請求項１に記載の認知機能評価装置。
　さらに、前記参照データを記憶する記憶部を備える
　請求項１～１０のいずれか１項に記載の認知機能評価装置。
　請求項１～１１のいずれか１項に記載の認知機能評価装置と、
　前記被評価者の音声を検出する集音装置と、
　前記出力部が出力した前記文及び前記評価結果を表示する表示装置と、を備える
　認知機能評価システム。
　コンピュータが実行する認知機能評価方法であって、
　被評価者に発話させる文を出力する文出力ステップと、
　被評価者が発話した音声を示す文音声データを取得する取得ステップと、
　前記取得ステップで取得した前記文音声データから、当該文音声データに基づく特徴量を算出する算出ステップと、
　前記算出ステップで算出した前記特徴量と、人が発した音声を示す音声データと当該人の認知機能との関係を示す参照データとを照合することにより、前記被評価者の認知機能を評価する評価ステップと、
　前記評価ステップで評価した評価結果を出力する評価結果出力ステップと、を含む
　認知機能評価方法。
　請求項１３に記載の認知機能評価方法をコンピュータに実行させるための
　プログラム。