JP6933335B2

JP6933335B2 - 推定方法、推定プログラムおよび推定装置

Info

Publication number: JP6933335B2
Application number: JP2017132959A
Authority: JP
Inventors: 修二篠原; 康宏大宮
Original assignee: PST CORPORATION,INC.; University of Tokyo NUC
Current assignee: PST CORPORATION,INC.; University of Tokyo NUC
Priority date: 2017-01-30
Filing date: 2017-07-06
Publication date: 2021-09-08
Anticipated expiration: 2037-07-06
Also published as: JP2018124533A

Description

本発明は、被験者の健康状態を推定する推定方法、推定プログラムおよび推定装置に関する。

人の脳の活動（すなわち、人の感情状態および健康状態）は、人が発話する音声に現れることが知られている。例えば、人が発話した音声の波形からピッチ周波数等を算出し、ピッチ周波数等と感情状態との対応関係を示す情報と、算出したピッチ周波数等のパラメータとに基づいて、人の感情状態を推定する技術が提案されている（例えば、特許文献１参照）。

国際公開第２００６／１３２１５９号

ピッチ周波数等のパラメータと感情状態との対応関係は、様々な状況や場面において発話された音声のサンプルデータを用いて、複数の人の各々に、各サンプルデータの音声を発話した人の感情状態（例えば、喜びや怒り等）を判定させることで生成される。しかしながら、パラメータと感情状態との対応関係を生成するにあたり、複数の人の各々による人の感情状態の判定は、音声のデータに含まれるノイズや、音声のデータに対するダウンサンプリング等による音質の劣化により、影響を受けやすいという問題がある。

一つの側面では、本件開示の推定方法、推定プログラムおよび推定装置は、音声のデータの取得環境に拘わらず、従来と比べて精度良く被験者の健康状態を推定できる技術を提供することを目的とする。

一つの観点による推定方法は、コンピュータによって、被験者が発話した音声における波形の変化の激しさの度合いを示す第１特徴量と、波形の変化の相関性を示す第２特徴量とを算出し、第１特徴量と第２特徴量との２次元空間に設定された健康な状態を示す健康領域と、被験者の第１特徴量と第２特徴量との位置とに基づいて被験者の健康状態を推定する。

別の観点による推定プログラムは、被験者が発話した音声における波形の変化の激しさの度合いを示す第１特徴量と、波形の変化の相関性を示す第２特徴量とを算出し、第１特徴量と第２特徴量との２次元空間に設定された健康な状態を示す健康領域と、被験者の第１特徴量と第２特徴量との位置とに基づいて被験者の健康状態を推定する処理をコンピュータに実行させる。

別の観点による推定装置は、被験者が発話した音声における波形の変化の激しさの度合いを示す第１特徴量と、波形の変化の相関性を示す第２特徴量とを算出する算出部と、第１特徴量と第２特徴量との２次元空間に設定された健康な状態を示す健康領域と、被験者の第１特徴量と第２特徴量との位置とに基づいて被験者の健康状態を推定する推定部とを有する。

本件開示の推定方法、推定プログラムおよび推定装置は、音声のデータの取得環境に拘わらず、従来と比べて精度良く被験者の健康状態を推定できる。

推定装置の一実施形態を示す図である。図１に示した携帯通信端末を介して取得した音声データの一例を示す図である。図１に示した算出部により算出された複数の人のゼロ点交差率およびハースト指数の分布の一例を示す図である。音声データの取得環境に応じたゼロ点交差率およびハースト指数の分布の一例を示す図である。図１に示した推定装置における推定処理の一例を示す図である。推定装置の別の実施形態を示す図である。図６に示した推定装置における推定処理の一例を示す図である。推定装置の別の実施形態を示す図である。１人の音声データを用いてウィンドウの各々において算出されたゼロ点交差率およびハースト指数の分布の一例を示す図である。図８に示した設定部により算出された健康な人の音声、軽症患者の音声および重症患者の音声それぞれの傾きの分布の一例を示す図である。図８に示した推定装置における推定処理の一例を示す図である。

以下、図面を用いて実施形態について説明する。

図１は、推定装置の一実施形態を示す。

図１に示した推定装置１００は、有線または無線を介して携帯通信端末２００に接続される。なお、推定装置１００は、ネットワークを介して携帯通信端末２００に接続されてもよい。すなわち、推定装置１００は、携帯通信端末２００とともに推定システムとして動作してもよい。

携帯通信端末２００は、携帯電話、スマートフォンあるいはタブレット型端末等である。携帯通信端末２００は、携帯通信端末２００に含まれるマイクロホンを介して被験者ＰＡが発話する音声の信号を取得し、取得した信号を所定のサンプリング周波数（例えば、１１キロヘルツ等）でサンプリングすることでデジタル信号の音声データを生成する。そして、携帯通信端末２００は、生成した音声データを推定装置１００に送信する。また、携帯通信端末２００は、推定装置１００により推定された結果を、携帯通信端末２００に含まれる有機ＥＬ（Organic Electro-Luminescence）や液晶等のディスプレイに表示する。

なお、携帯通信端末２００の代わりに、マイクロホンが、有線または無線を介して、推定装置１００に接続されてもよい。この場合、推定装置１００は、マイクロホンからの音声の信号を、所定のサンプリング周波数でサンプリングし、デジタル信号の音声データを取得してもよい。

推定装置１００は、ＣＰＵ（Central Processing Unit）等の演算処理装置と、ハードディスク装置等の記憶装置とを有するコンピュータ装置等である。推定装置１００は、例えば、演算処理装置が記憶装置に記憶された推定プログラムを実行することにより、算出部１０、設定部２０および推定部３０として機能する。なお、算出部１０、設定部２０および推定部３０は、ハードウェアにより実現されてもよい。

また、推定プログラムは、例えば、ＤＶＤ（Digital Versatile Disc）等の光ディスクやＵＳＢ（Universal Serial Bus）メモリ等の可搬型記憶媒体に記録して頒布されてもよい。あるいは、推定プログラムは、推定装置１００に含まれるネットワークインタフェースを介して、ネットワーク等を通じてダウンロードされ、推定装置１００の記憶装置に格納されてもよい。

また、推定装置１００は、携帯通信端末２００において実現されてもよい。すなわち、携帯通信端末２００に含まれるＣＰＵが、携帯通信端末２００に含まれるメモリ等の記憶部に記憶された推定プログラムを実行することにより、携帯通信端末２００は、算出部１０、設定部２０および推定部３０として機能してもよい。

算出部１０は、例えば、携帯通信端末２００を介して取得した被験者ＰＡの音声データを用いて、音声の音圧の波形が基準圧力を横切る単位時間あたりの回数（以下、“ゼロ点交差率”とも称される）を、音声における波形の変化の激しさの度合いとして算出する。また、算出部１０は、被験者ＰＡが発話した音声データを用いて、音声の波形における変化の相関性を示すハースト指数を算出する。算出部１０は、算出した被験者ＰＡのゼロ点交差率およびハースト指数を、設定部２０および推定部３０に出力する。ゼロ点交差率およびハースト指数は、第１特徴量および第２特徴量の一例である。算出部１０の動作、ゼロ点交差率およびハースト指数については、図２から図４で説明する。

設定部２０は、算出部１０が算出した被験者ＰＡのゼロ点交差率およびハースト指数から被験者ＰＡの健康状態を推定部３０が推定するために、うつ病等の病を患っていない健康な状態を示す健康領域を決定する。設定部２０は、決定した健康領域を示す情報を推定部３０に出力し、推定部３０に健康領域を設定する。例えば、算出部１０は、うつ病等の病を患っているか否かの健康状態が既知である複数の人の音声データを推定装置１００の記憶装置から読み出し、読み出した音声データから複数の人の各々のゼロ点交差率およびハースト指数を算出する。設定部２０は、ゼロ点交差率とハースト指数との２次元空間において、算出部１０により算出された複数の人のゼロ点交差率およびハースト指数の分布に対して、線形判別式やロジスティック回帰分析等の線形分類の処理を実行する。そして、設定部２０は、うつ病等を患っている人の領域と、うつ病等を患っていない健康な人の健康領域とを分ける境界線を決定する。設定部２０は、決定した境界線を含む健康領域を示す情報を推定部３０に出力する。

なお、健康領域を示す情報が、推定装置１００または外部のコンピュータ装置により予め決定され、推定装置１００の記憶装置に記憶されている場合、設定部２０は省略されてもよい。

推定部３０は、算出部１０により算出された被験者ＰＡのゼロ点交差率およびハースト指数と、設定部２０により設定された健康領域とに基づいて被験者ＰＡにおける健康状態（例えば、うつ状態等か否か）を推定する。そして、推定部３０は、推定した健康状態を示す情報を携帯通信端末２００に出力する。

図２は、図１に示した携帯通信端末２００を介して取得した音声データの一例を示す。図２は、携帯通信端末２００を介して取得した被験者ＰＡが発話した音声の音圧の時間変化を示す。なお、図２の横軸は時刻を示し、図２の縦軸は音圧を示す。

図２では、被験者ＰＡによる発話の音声データのうち、“ありがとう”と発話した発話単位のデータを示す。時刻ｔ０、ｔ１、ｔ２、ｔ３、ｔ４は、発話単位に含まれる“あ”、“り”、“が”、“と”、“う”の各語が発話された開始の時刻を示す。なお、“ありがとう”の発話単位のうち、“り”の語が発話された音声データに対する算出部１０の算出処理について説明するが、算出部１０は、“ありがとう”の他の語および他の発話単位に対しても、同一または同様に算出処理を実行する。

算出部１０は、携帯通信端末２００から取得した音声データを用いて、ゼロ点交差率およびハースト指数を、５１２等のサンプル数のウィンドウＷＤ毎に算出する。図２に示すように、音圧は各語の発話において大きく変化するため、例えば、算出部１０は、ゼロ点交差率を算出するために、ウィンドウＷＤより小さい３０等のサンプル数のウィンドウＷＤ１毎に音圧の平均値を算出し、各ウィンドウＷＤ１で算出した平均値を各ウィンドウＷＤ１の基準圧力とする。算出部１０は、各ウィンドウＷＤ１において、算出した基準圧力（平均値）を被験者ＰＡの音圧が横切る回数を計測し、ゼロ点交差率を算出する。算出部１０は、各ウィンドウＷＤ１で算出したゼロ点交差率の平均値をウィンドウＷＤのゼロ点交差率ＺＣＲとして算出する。

なお、算出部１０は、３０等のサンプル数のウィンドウＷＤ１の幅で移動平均して、各ウィンドウＷＤ１の基準圧力を算出してもよい。

一方、時刻ｔの音圧ｘ（ｔ）と時刻ｔから時間τ離れた音圧ｘ（ｔ＋τ）との差分の標準偏差σ（τ）は、式（１）に示すように関係付けられる。また、時間間隔τと標準偏差σ（τ）の間には、式（２）に示すようなべき則の関係があることが知られている。そして、式（２）におけるＨがハースト指数である。

例えば、ホワイトノイズのような音声データの場合、音声データの各データ間において互いに時間的な相関がないため、ハースト指数Ｈは“０”となる。また、音声データがホワイトノイズからピンクノイズやブラウンノイズになるに従い、すなわち音声の波形が時間的な相関性を有するに従い、ハースト指数Ｈは“０”より大きな値を示す。例えば、音声データがブラウンノイズの場合、ハースト指数Ｈは０．５となる。さらに、音声データがブラウンノイズより強い相関性を有する、すなわち音声データが過去の状態に依存する度合いが増すに従い、ハースト指数Ｈは、０．５から１の間の値を示す。

算出部１０は、例えば、ウィンドウＷＤにおいて、時間間隔τが１から１５の間の各τに対して音声データの標準偏差σ（τ）を求め、求めた各時間間隔τの標準偏差σ（τ）に対して回帰分析を実行することによりハースト指数Ｈを算出する。

算出部１０は、ウィンドウＷＤの幅の４分の１等の所定の間隔でウィンドウＷＤを移動させて、各ウィンドウＷＤにおけるゼロ点交差率ＺＣＲおよびハースト指数Ｈを算出する。そして、算出部１０は、算出した全てのウィンドウＷＤのゼロ点交差率ＺＣＲおよびハースト指数Ｈを平均し、平均したゼロ点交差率ＺＣＲおよびハースト指数Ｈを被験者ＰＡのゼロ点交差率およびハースト指数として推定部３０に出力する。

図３は、図１に示した算出部１０により算出された複数の人のゼロ点交差率ＺＣＲおよびハースト指数Ｈの分布の一例を示す。図３では、縦軸はゼロ点交差率ＺＣＲを示し、横軸はハースト指数Ｈを示す。また、図３では、うつ病等の病を患っている人のゼロ点交差率ＺＣＲおよびハースト指数Ｈをバツ印で示し、健康な人のゼロ点交差率ＺＣＲおよびハースト指数Ｈを丸印で示す。なお、図３に示したゼロ点交差率ＺＣＲおよびハースト指数Ｈの分布は、１２１８人の音声データを用いて生成されている。そして、１２１８人のうち、うつ病等の病を患っている人は６９７人であり、健康な人は５２１人である。

設定部２０は、図３に示した複数の人のゼロ点交差率ＺＣＲおよびハースト指数Ｈの分布に対して、線形判別式やロジスティック回帰分析等の線形分類の処理を実行する。設定部２０は、うつ病等の病を患っている人と、健康な人とを分ける破線で示した境界線を決定する。図３の場合、破線で示した境界線は、ＺＣＲ＝−０．２９９Ｈ＋０．２９９と表される。設定部２０は、破線で示した境界線より下側の領域を健康領域として、決定した境界線を含む健康領域の情報を推定部３０に出力し、推定部３０に健康領域を設定する。

なお、図３では、ゼロ点交差率ＺＣＲの縦軸およびハースト指数Ｈの横軸は、線形軸としたが、破線で示した境界線が指数関数やべき関数等で表される場合、境界線を直線で示すために対数軸にするのが好ましい。

図４は、音声データの取得環境に応じたゼロ点交差率ＺＣＲおよびハースト指数Ｈの分布の一例を示す。図４では、図３と同様に、縦軸はゼロ点交差率ＺＣＲを示し、横軸はハースト指数Ｈを示す。また、図４は、図３に示したゼロ点交差率ＺＣＲおよびハースト指数Ｈの分布から設定部２０により決定された境界線を破線で示す。

図４は、例えば、携帯通信端末２００が被験者ＰＡの音声を１１キロヘルツのサンプリング周波数でサンプリングした音声データを用いて算出されたゼロ点交差率ＺＣＲおよびハースト指数Ｈの分布を黒色の三角で示す。一方、携帯通信端末２００は、例えば、電話回線等を介して音声データを推定装置１００に送信するために、１１キロヘルツでサンプリングした被験者ＰＡの音声データを、８キロヘルツのサンプリング周波数でダウンサンプリングする。図４は、８キロヘルツにダウンサンプリングされた音声データを用いて算出されたゼロ点交差率ＺＣＲおよびハースト指数Ｈの分布を白色の矩形で示す。

図４に示すように、被験者ＰＡのゼロ点交差率ＺＣＲおよびハースト指数Ｈは、ダウンサンプリングによる音質の劣化（ノイズの増加）による影響を受けている。すなわち、ダウンサンプリングされた音声データのゼロ点交差率ＺＣＲは、ノイズが増加し、音声の音圧が基準圧力を横切る回数が増加するため、１１キロヘルツでサンプリングされた音声データのゼロ点交差率ＺＣＲと比べて大きな値を示す。一方、ダウンサンプリングされた音声のハースト指数Ｈは、ノイズが増加することにより音声データがホワイトノイズに近づくため、１１キロヘルツでサンプリングされた音声データのハースト指数Ｈと比べて小さな値を示す。

しかしながら、ゼロ点交差率ＺＣＲおよびハースト指数Ｈは、ダウンサンプリングによる影響を受けるが、互いに独立に変化するのではなく、関係性を有して変化する。すなわち、図４に示すように、ゼロ点交差率ＺＣＲおよびハースト指数Ｈは、ダウンサンプリング等による音質の劣化に対して、互いの相関性を有しつつ破線で示した境界線に沿って変化する。このため、ダウンサンプリング等による音質の劣化は、被験者ＰＡのゼロ点交差率ＺＣＲおよびハースト指数Ｈが健康領域に含まれるか否かを判定する推定部３０の動作に影響を与えない。すなわち、ゼロ点交差率ＺＣＲおよびハースト指数Ｈは、ダウンサンプリング等の音質の劣化に対してロバスト性を有する。そして、推定装置１００は、音声データの取得環境に拘わらず、従来と比べて精度良く被験者ＰＡの健康状態を推定できる。

図５は、図１に示した推定装置１００における推定処理の一例を示す。図５に示した処理は、推定装置１００の演算処理装置が推定装置１００の記憶装置に記憶された推定プログラムを実行することにより実現される。すなわち、図５に示した処理は、推定方法および推定プログラムの一実施形態を示す。

ステップＳ１００では、推定装置１００は、設定部２０により推定部３０に健康領域が設定されているか否かを判定する。推定部３０に健康領域が設定されている場合、推定装置１００の処理は、ステップＳ１４０に移る。一方、推定部３０に健康領域が設定されていない場合、推定装置１００の処理は、ステップＳ１１０に移る。

ステップＳ１１０では、算出部１０は、うつ病等の病を患っているか否かの健康状態が既知である複数の人の音声データを推定装置１００の記憶装置から読み出し、読み出した音声データからゼロ点交差率ＺＣＲおよびハースト指数Ｈを人毎に算出する。

次に、ステップＳ１２０では、設定部２０は、ステップＳ１１０で算出された複数の人のゼロ点交差率ＺＣＲおよびハースト指数Ｈの分布に対して、線形判別式やロジスティック回帰分析等の線形分類の処理を実行する。設定部２０は、うつ病等の病を患っている人の領域と、健康な人の健康領域とを分ける境界線を決定する。

次に、ステップＳ１３０では、設定部２０は、ステップＳ１２０で決定した境界線を含む健康領域の情報を推定部３０に出力し、推定部３０に健康領域を設定する。

次に、ステップＳ１４０では、算出部１０は、被験者ＰＡが発話した音声データを携帯通信端末２００から取得する。

次に、ステップＳ１５０では、算出部１０は、ステップＳ１４０で取得した音声データを用いて、被験者ＰＡのゼロ点交差率ＺＣＲおよびハースト指数Ｈを算出する。算出部１０は、算出した被験者ＰＡのゼロ点交差率およびハースト指数を推定部３０に出力する。

次に、ステップＳ１６０では、推定部３０は、ステップＳ１５０で算出された被験者ＰＡのゼロ点交差率ＺＣＲおよびハースト指数Ｈが、ステップＳ１３０で設定された健康領域内に位置するか否かを判定する。被験者ＰＡのゼロ点交差率ＺＣＲおよびハースト指数Ｈが健康領域内に位置する場合、推定装置１００の処理は、ステップＳ１７０に移る。一方、被験者ＰＡのゼロ点交差率ＺＣＲおよびハースト指数Ｈが健康領域外に位置する場合、推定装置１００の処理は、ステップＳ１８０に移る。

ステップＳ１７０では、推定部３０は、ステップＳ１５０で算出された被験者ＰＡのゼロ点交差率ＺＣＲおよびハースト指数Ｈが健康領域内に位置することから、被験者ＰＡは健康であると推定する。推定部３０は、推定した被験者ＰＡの健康状態を示す情報を、携帯通信端末２００に出力する。

なお、推定部３０は、例えば、ステップＳ１５０で算出された被験者ＰＡのゼロ点交差率ＺＣＲおよびハースト指数Ｈの位置と、健康領域の境界線との間の距離に応じて、被験者ＰＡの健康の度合いを推定してもよい。そして、推定部３０は、推定した被験者ＰＡの健康状態と健康の度合いとを示す情報を、携帯通信端末２００に出力してもよい。

ステップＳ１８０では、推定部３０は、ステップＳ１５０で算出された被験者ＰＡのゼロ点交差率ＺＣＲおよびハースト指数Ｈが健康領域外に位置することから、被験者ＰＡはうつ病等の病を患っていると推定する。推定部３０は、推定した被験者ＰＡの健康状態を示す情報を、携帯通信端末２００に出力する。

なお、推定部３０は、例えば、ステップＳ１５０で算出された被験者ＰＡのゼロ点交差率ＺＣＲおよびハースト指数Ｈの位置と、健康領域の境界線との間の距離に応じて、被験者ＰＡにおけるうつ病等の病の度合いを推定してもよい。そして、推定部３０は、推定した被験者ＰＡの健康状態と病の度合いとを示す情報を、携帯通信端末２００に出力してもよい。

そして、推定装置１００は、推定処理を終了する。推定装置１００は、携帯通信端末２００から被験者ＰＡの音声データを受信する度に、ステップＳ１００からステップＳ１８０の処理を繰り返し実行する。

なお、図５に示した処理において、健康領域の情報が、推定装置１００または外部のコンピュータ装置により予め決定され、推定装置１００の記憶装置に記憶されている場合、ステップＳ１００からステップＳ１３０の処理は、省略されてもよい。

以上、図１から図５に示した実施形態では、算出部１０は、携帯通信端末２００から取得した被験者ＰＡの音声データを用いて、被験者ＰＡのゼロ点交差率ＺＣＲおよびハースト指数Ｈを算出する。推定部３０は、算出された被験者ＰＡのゼロ点交差率ＺＣＲおよびハースト指数Ｈの位置と、設定部２０により設定された健康領域との比較に基づいて被験者ＰＡの健康状態を推定する。

そして、図４に示すように、ゼロ点交差率ＺＣＲおよびハースト指数Ｈは、ダウンサンプリング等による音質の劣化の影響を受けるが、互いに独立に変化するのではなく、関係性を有して変化する。このため、ダウンサンプリング等による音質の劣化は、被験者ＰＡのゼロ点交差率ＺＣＲおよびハースト指数Ｈが健康領域に含まれるか否かを判定する推定部３０の動作に影響を与えない。すなわち、推定装置１００は、音声データの取得環境に拘わらず、従来と比べて精度良く被験者ＰＡの健康状態を推定できる。

また、推定装置１００は、感情が消失しているといわれるうつ病等を患っている被験者ＰＡの音声データや、感情の推定が困難な長母音等を含む音声データ等からゼロ点交差率ＺＣＲおよびハースト指数Ｈを求めることができる。このため、推定装置１００は、音声のパラメータと感情状態との対応関係を示す情報を用いる従来と比べて、被験者ＰＡの健康状態を精度良く推定できる。

図６は、推定装置の別の実施形態を示す。図１で説明した要素と同一または同様の機能を有する要素については、同一または同様の符号を付し、これらについては、詳細な説明を省略する。

図６に示した推定装置１００Ａは、有線または無線を介して携帯通信端末２００に接続される。なお、推定装置１００Ａは、ネットワークを介して携帯通信端末２００に接続されてもよい。すなわち、推定装置１００Ａは、携帯通信端末２００とともに推定システムとして動作してもよい。

推定装置１００Ａは、ＣＰＵ等の演算処理装置と、ハードディスク装置等の記憶装置とを有するコンピュータ装置等である。推定装置１００Ａは、例えば、演算処理装置が記憶装置に記憶された推定プログラムを実行することにより、算出部１０、設定部２０ａおよび推定部３０として機能する。なお、算出部１０、設定部２０ａおよび推定部３０は、ハードウェアにより実現されてもよい。

また、推定装置１００Ａは、携帯通信端末２００において実現されてもよい。すなわち、携帯通信端末２００に含まれるＣＰＵが、携帯通信端末２００に含まれるメモリ等の記憶部に記憶された推定プログラムを実行することにより、携帯通信端末２００は、算出部１０、設定部２０ａおよび推定部３０として機能してもよい。

設定部２０ａは、例えば、式（３）に示される音声の波形モデルを用い、音声に含まれるノイズの割合に応じて変化するゼロ点交差率ＺＣＲとハースト指数Ｈとの関係性に基づいて、健康領域の境界線を決定する。
ｘ（ｔ＋１）＝α×ｘ（ｔ）＋ｓｃａｌｅ×ｒａｎｄ１×ＳＩＧＮ（ｒａｎｄ２，β）×ＳＩＧＮ（（ｘ（ｔ）−ｘ（ｔ−１）），０．０） …（３）
なお、ｘ（ｔ−１）、ｘ（ｔ）、ｘ（ｔ＋１）は、時刻ｔ−１、ｔ、ｔ＋１にサンプリングされた音声データを示す。αは、音声データｘ（ｔ）が過去の状態に依存する度合いを示す。例えば、αが０の場合、音声データｘ（ｔ）は、過去の状態に依存することなく独立した値を示し、ホワイトノイズであることを示す。

また、ｒａｎｄ１、ｒａｎｄ２は、０から１の間の一様乱数を示す。ｓｃａｌｅは、ｒａｎｄ１の一様乱数に応じて音声データｘ（ｔ）の波形が変動する変動量を調整し、例えば、０．１や０．２等の値に設定される。ＳＩＧＮは、式（４）に示す関数であり、音声データｘ（ｔ）の変動を決定する。

例えば、音声データｘ（ｔ）は、ｐ＞ｑの場合、増加または減少する状態を維持し、ｐ＜ｑの場合、増加から減少または減少から増加に状態を変化させる。また、音声データｘ（ｔ）は、ｐ＝ｑの場合、現在と同じ状態を維持し変化しない。βは、関数ＳＩＧＮを介して、ｒａｎｄ２の一様乱数に応じて音声データｘ（ｔ）の変動を調整する。例えば、αが１且つβが０．５に設定される場合、音声データｘ（ｔ）は、ブラウンノイズと同様の波形が再現される。なお、式（３）に示した音声の波形モデルは、一例であり、他の関数を用いて表されてもよい。

設定部２０ａは、例えば、αが１に設定された式（３）の音声の波形モデルを用いて、βを０から１の間で変化させ、各βの値における音声データｘ（ｔ）からゼロ点交差率ＺＣＲおよびハースト指数Ｈを、算出部１０と同様に算出する。そして、設定部２０ａは、算出した各βの値におけるゼロ点交差率ＺＣＲとハースト指数Ｈとの分布に対して最小二乗法等の回帰分析の処理を実行する。設定部２０ａは、各βの値のゼロ点交差率ＺＣＲとハースト指数Ｈとを通る直線を、境界線として決定する。式（３）に示した音声の波形モデルの場合、設定部２０ａにより決定された境界線は、ＺＣＲ＝−０．２９９Ｈ＋０．３０５で表され、波線で示した図３の境界線と類似する直線となる。これにより、推定装置１００Ａは、健康領域の境界線を決定するために複数の人の音声データを取得することなく、容易に健康領域の境界線を決定できる。

そして、設定部２０ａは、決定した境界線を含む健康領域の情報を推定部３０に出力し、推定部３０に健康領域を設定する。

なお、健康領域の情報が、推定装置１００または外部のコンピュータ装置により予め決定され、推定装置１００の記憶装置に記憶されている場合、設定部２０ａは省略されてもよい。

図７は、図６に示した推定装置１００Ａにおける推定処理の一例を示す。なお、図７に示したステップの処理のうち、図５に示したステップと同一または同様の処理を示すものについては、同一のステップ番号を付す。

図７に示した処理は、推定装置１００Ａの演算処理装置が推定装置１００Ａの記憶装置に記憶された推定プログラムを実行することにより実現される。すなわち、図７に示した処理は、推定方法および推定プログラムの別の実施形態を示す。

ステップＳ１００では、推定装置１００Ａは、設定部２０ａにより推定部３０に健康領域が設定されているか否かを判定する。推定部３０に健康領域が設定されている場合、推定装置１００Ａの処理は、ステップＳ１４０に移る。一方、推定部３０に健康領域が設定されていない場合、推定装置１００Ａの処理は、ステップＳ１２５に移る。

ステップＳ１２５では、設定部２０ａは、αが１に設定された式（３）の音声の波形モデルを用いて、βを０から１の間で変化させ、各βの値における音声データｘ（ｔ）からゼロ点交差率ＺＣＲおよびハースト指数Ｈを算出する。そして、設定部２０ａは、算出した各βの値におけるゼロ点交差率ＺＣＲとハースト指数Ｈとの分布に対して最小二乗法等の回帰分析の処理を実行し、各βの値のゼロ点交差率ＺＣＲとハースト指数Ｈとを通る直線を境界線として決定する。

次に、ステップＳ１３０では、設定部２０ａは、ステップＳ１２５で決定した境界線を含む健康領域の情報を推定部３０に出力し、推定部３０に健康領域を設定する。

次に、ステップＳ１６０では、推定部３０は、ステップＳ１５０で算出された被験者ＰＡのゼロ点交差率ＺＣＲおよびハースト指数Ｈが、ステップＳ１３０で設定された健康領域内に位置するか否かを判定する。被験者ＰＡのゼロ点交差率ＺＣＲおよびハースト指数Ｈが健康領域内に位置する場合、推定装置１００Ａの処理は、ステップＳ１７０に移る。一方、被験者ＰＡのゼロ点交差率ＺＣＲおよびハースト指数Ｈが健康領域外に位置する場合、推定装置１００Ａの処理は、ステップＳ１８０に移る。

そして、推定装置１００Ａは、推定処理を終了する。推定装置１００Ａは、携帯通信端末２００から被験者ＰＡの音声データを受信する度に、ステップＳ１００からステップＳ１８０の処理を繰り返し実行する。

なお、図７に示した処理において、健康領域の情報が、予め推定装置１００Ａまたは外部のコンピュータ装置により決定され、推定装置１００Ａの記憶装置に記憶されている場合、ステップＳ１００、ステップＳ１２５およびステップＳ１３０の処理は、省略されてもよい。

以上、図６および図７に示した実施形態では、算出部１０は、携帯通信端末２００を介して取得した被験者ＰＡの音声データを用いて、被験者ＰＡのゼロ点交差率ＺＣＲおよびハースト指数Ｈを算出する。推定部３０は、算出された被験者ＰＡのゼロ点交差率ＺＣＲおよびハースト指数Ｈの位置と、設定部２０により設定された健康領域との比較に基づいて被験者ＰＡの健康状態を推定する。

そして、図４に示すように、ゼロ点交差率ＺＣＲおよびハースト指数Ｈは、ダウンサンプリング等による音質の劣化の影響を受けるが、互いに独立に変化するのではなく、関係性を有して変化する。このため、ダウンサンプリング等による音質の劣化は、被験者ＰＡのゼロ点交差率ＺＣＲおよびハースト指数Ｈが健康領域に含まれるか否かを判定する推定部３０の動作に影響を与えない。すなわち、推定装置１００Ａは、音声データの取得環境に拘わらず、従来と比べて精度良く被験者ＰＡの健康状態を推定できる。

また、推定装置１００Ａは、感情が消失しているといわれるうつ病等を患っている被験者ＰＡの音声データや、感情の推定が困難な長母音等を含む音声データ等からゼロ点交差率ＺＣＲおよびハースト指数Ｈを求めることができる。このため、推定装置１００Ａは、音声のパラメータと感情状態との対応関係を示す情報を用いる従来と比べて、被験者ＰＡの健康状態を精度良く推定できる。

図８は、推定装置の別の実施形態を示す。図１で説明した要素と同一または同様の機能を有する要素については、同一または同様の符号を付し、これらについては、詳細な説明を省略する。

図８に示した推定装置１００Ｂは、有線または無線を介して携帯通信端末２００に接続される。なお、推定装置１００Ｂは、ネットワークを介して携帯通信端末２００に接続されてもよい。すなわち、推定装置１００Ｂは、携帯通信端末２００とともに推定システムとして動作してもよい。

推定装置１００Ｂは、ＣＰＵ等の演算処理装置と、ハードディスク装置等の記憶装置とを有するコンピュータ装置等である。推定装置１００Ｂは、例えば、演算処理装置が記憶装置に記憶された推定プログラムを実行することにより、算出部１０ａ、設定部２０ｂおよび推定部３０ａとして機能する。なお、算出部１０ａ、設定部２０ｂおよび推定部３０ａは、ハードウェアにより実現されてもよい。

また、推定装置１００Ｂは、携帯通信端末２００において実現されてもよい。すなわち、携帯通信端末２００に含まれるＣＰＵが、携帯通信端末２００に含まれるメモリ等の記憶部に記憶された推定プログラムを実行することにより、携帯通信端末２００は、算出部１０ａ、設定部２０ｂおよび推定部３０ａとして機能してもよい。

算出部１０ａは、例えば、図１に示した算出部１０と同様に、携帯通信端末２００を介して取得した被験者ＰＡの音声データを用いて、５１２等のサンプル数のウィンドウＷＤ毎にゼロ点交差率およびハースト指数を算出する。そして、算出部１０ａは、各ウィンドウＷＤで算出した被験者ＰＡのゼロ点交差率およびハースト指数を、設定部２０ｂおよび推定部３０ａに出力する。

設定部２０ｂは、算出部１０ａにより算出された被験者ＰＡの各ウィンドウＷＤのゼロ点交差率およびハースト指数を用いて、推定部３０ａが被験者ＰＡの健康状態を推定するために、うつ病等の病を患っていない健康な状態を示す健康領域を設定する。例えば、算出部１０ａは、うつ病等の病を患っているか否かの健康状態が既知である複数の人の音声データを推定装置１００Ｂの記憶装置から読み出し、読み出した音声データを用いて、複数の人の各々のゼロ点交差率およびハースト指数をウィンドウＷＤ毎に算出する。設定部２０ｂは、各ウィンドウＷＤで算出されたゼロ点交差率およびハースト指数による分布に対する一次関数による最小二乗法等の回帰分析を、複数の人の各々について実行する。そして、設定部２０ｂは、複数の人の各々における一次関数の傾きおよび切片の値を算出し、うつ病等を患っている人の音声領域と、うつ病等を患っていない健康な人の音声領域との境界を決定する。設定部２０ｂは、決定した境界を含む健康領域を示す情報を推定部３０ａに出力する。設定部２０ｂの動作については、図９で説明する。

なお、健康領域を示す情報が、推定装置１００Ｂまたは外部のコンピュータ装置により予め決定され、推定装置１００Ｂの記憶装置に記憶されている場合、設定部２０ｂは省略されてもよい。

推定部３０ａは、例えば、算出部１０ａにより算出された被験者ＰＡの各ウィンドウＷＤで算出されたゼロ点交差率およびハースト指数の分布に対して、設定部２０ｂと同様に、一次関数による最小二乗法等の回帰分析を実行する。そして、推定部３０ａは、被験者ＰＡにおける一次関数の傾きおよび切片を算出する。推定部３０ａは、被験者ＰＡの回帰分析の結果と設定部２０ｂにより設定された健康領域とに基づいて、被験者ＰＡにおける健康状態を推定する。推定部３０ａは、推定した健康状態を示す情報を携帯通信端末２００に出力する。推定部３０ａの動作については、図１０で説明する。

図９は、１人の音声データを用いてウィンドウＷＤの各々において算出されたゼロ点交差率ＺＣＲおよびハースト指数Ｈの分布の一例を示す。図９では、縦軸はゼロ点交差率ＺＣＲを示し、横軸はハースト指数Ｈを示す。

設定部２０ｂは、図９に示したゼロ点交差率ＺＣＲおよびハースト指数Ｈの分布に対して、破線で示した一次関数ＺＣＲ＝γＨ＋εによる最小二乗法を実行し、傾きγおよび切片εを算出する。設定部２０ｂは、例えば、複数の人の各々について算出した傾きγおよび切片εを用いて、うつ病を患っている人の音声と、健康な人の音声とを分類する境界を示す閾値を健康領域として決定する。設定部２０ｂは、決定した閾値を含む健康領域の情報を推定部３０ａに出力し、推定部３０ａに健康領域を設定する。

なお、図９では、ゼロ点交差率ＺＣＲの縦軸およびハースト指数Ｈの横軸は、線形軸としたが、破線で示した境界線が指数関数やべき関数等で表される場合、最小二乗法等の回帰分析を実行するために対数軸にするのが好ましい。

図１０は、図８に示した設定部２０ｂにより算出された健康な人の音声、軽症患者の音声および重症患者の音声それぞれの傾きγの分布の一例を示す。図１０では、縦軸は傾きγを示し、横軸は重症度を示す。なお、図１０に示した傾きγの分布は、５１人から取得した６８個の音声データを用いて生成されている。そして、５１人のうち、１４人は、うつ病等の病を患っている人であり、３７人は、健康な人である。また、６８個の音声データのうち、２５個は、うつ病等の病を患っている人の音声データであり、４３個は、健康な人の音声データである。すなわち、音声データには、同じ人から異なる日時に取得した音声データが含まれる。

“軽症音声”および“重症音声”は、各音声データの取得時にうつ病等の病を患っている人に対して実施したハミルトンうつ病評価尺度（Hamilton Depression Rating Scale：HDRS）（以下、“ＨＡＭＤ”とも称される）のテストに基づいて分類される。例えば、音声取得時にＨＡＭＤの点数が１３点以下であった人の音声データは、“軽症音声”に分類される。また、音声取得時にＨＡＭＤの点数が１４点以上であった人の音声データは、“重症音声”に分類される。なお、健康な人の音声データは、“健康音声”に分類する。

設定部２０ｂは、例えば、図１０に示した分布を用いて、ＲＯＣ（Receiver Operating Characteristic）曲線におけるＡＵＣ（Area Under the Curve）を算出し、感度と特異度との和が１．６以上を示す範囲内で、“健康音声”、“軽症音声”および“重症音声”の各々を分類する傾きγの閾値を適宜決定する。例えば、設定部２０ｂは、“健康音声”と“軽症音声”とを分類する傾きγの閾値を−０．２９に決定し、“軽症音声”と“重症音声”とを分類する傾きγの閾値を−０．３７に決定する。すなわち、設定部２０ｂは、傾きγの値が−０．２９以上を示す範囲を健康領域と決定する。なお、“健康音声”と“軽症音声”との傾きγの閾値（−０．２９）、および“軽症音声”と“重症音声”との傾きγの閾値（−０．３７）は、ｔ検定により０．００１５および０．０００５の値が得られ、互いに有意な差を有する。

なお、傾きγと切片εとは、ＺＣＲ＝γＨ＋εで関係付けられることから、設定部２０ｂは、“健康音声”と“軽症音声”との閾値、および“軽症音声”と“重症音声”との閾値を、切片εを用いて決定してもよい。

また、推定部３０ａは、重症音声について、ＨＡＭＤの点数が１４点から１８点の人の音声を“中等症音声”、１９点から２２点の人の音声を“重症音声”、および２３点以上の人の音声を“最重症音声”と分類してもよい。

そして、設定部２０ｂは、傾きγの閾値として−０．２９と−０．３７とを推定部３０ａに設定する。推定部３０ａは、算出部１０ａにより各ウィンドウＷＤで算出された被験者ＰＡのゼロ点交差率およびハースト指数の分布に対して、設定部２０ｂと同様に、ＺＣＲ＝γＨ＋εの一次関数による最小二乗法を実行し、被験者ＰＡの音声に対する傾きγおよび切片εを算出する。推定部３０ａは、求めた被験者ＰＡの音声に対する傾きγと、設定部２０ｂにより設定された閾値（−０．２９および−０．３７）とを比較して、被験者ＰＡの健康状態として“健康音声”、“軽症音声”および“重症音声”のいずれかを推定する。

図１１は、図８に示した推定装置１００Ｂにおける推定処理の一例を示す。なお、図１１に示したステップの処理のうち、図１に示したステップと同一または同様の処理を示すものについては、同一のステップ番号を付す。

図１１に示した処理は、推定装置１００Ｂの演算処理装置が推定装置１００Ｂの記憶装置に記憶された推定プログラムを実行することにより実現される。すなわち、図１１に示した処理は、推定方法および推定プログラムの別の実施形態を示す。

ステップＳ１００では、推定装置１００Ｂは、設定部２０ｂにより推定部３０ａに健康領域が設定されているか否かを判定する。推定部３０ａに健康領域が設定されている場合、推定装置１００Ｂの処理は、ステップＳ１４０に移る。一方、推定部３０ａに健康領域が設定されていない場合、推定装置１００Ｂの処理は、ステップＳ１１５に移る。

ステップＳ１１５では、算出部１０ａは、うつ病を患っているか否かの健康状態が既知である複数の人の音声データを推定装置１００の記憶装置から読み出す。算出部１０ａは、読み出した音声データを用いて、複数の人の各々のゼロ点交差率ＺＣＲおよびハースト指数ＨをウィンドウＷＤ毎に算出する。

次に、ステップＳ１２７では、設定部２０ｂは、ステップＳ１１５で算出された各ウィンドウＷＤのゼロ点交差率ＺＣＲおよびハースト指数Ｈの分布に対する一次関数ＺＣＲ＝γＨ＋εによる最小二乗法を、複数の人の音声各々について実行する。設定部２０ｂは、複数の人の音声各々における傾きγおよび切片εを算出する。設定部２０ｂは、例えば、“健康音声”と“軽症音声”とを分類する傾きγの閾値を−０．２９に決定し、“軽症音声”と“重症音声”とを分類する傾きγの閾値を−０．３７に決定する。

次に、ステップＳ１３０では、設定部２０ｂは、ステップＳ１２７で決定した傾きγの閾値を含む健康領域の情報を推定部３０ａに出力し、推定部３０ａに健康領域を設定する。

次に、ステップＳ１４０では、算出部１０ａは、被験者ＰＡが発話した音声データを携帯通信端末２００から取得する。

次に、ステップＳ１５５では、算出部１０ａは、ステップＳ１４０で取得した音声データを用いて、被験者ＰＡのゼロ点交差率ＺＣＲおよびハースト指数ＨをウィンドウＷＤ毎に算出する。算出部１０ａは、各ウィンドウＷＤで算出した被験者ＰＡのゼロ点交差率およびハースト指数を推定部３０ａに出力する。

次に、ステップＳ１５７では、推定部３０ａは、ステップＳ１５５で各ウィンドウＷＤにおいて算出された被験者ＰＡのゼロ点交差率およびハースト指数の分布に対して、一次関数ＺＣＲ＝γＨ＋εによる最小二乗法を実行する。推定部３０ａは、被験者ＰＡの傾きγおよび切片εを算出する。

次に、ステップＳ１６０では、推定部３０ａは、ステップＳ１５７で算出された被験者ＰＡの傾きγが、ステップＳ１３０で設定された健康領域、すなわち−０．２９以上の健康音声の範囲に含まれるか否かを判定する。被験者ＰＡの傾きγが健康領域に含まれる場合、推定装置１００Ｂの処理は、ステップＳ１７５に移る。一方、被験者ＰＡの傾きγが健康領域に含まれない場合、推定装置１００Ｂの処理は、ステップＳ１６５に移る。

ステップＳ１６５では、推定部３０ａは、ステップＳ１５７で算出された被験者ＰＡの傾きγが、ステップＳ１３０で設定された軽症音声の領域、すなわち−０．２９より大きく、かつ−０．３７以下の範囲内か否かを判定する。被験者ＰＡの音声に対する傾きγが軽症音声の範囲内の場合、推定装置１００Ｂの処理は、ステップＳ１８５に移る。一方、被験者ＰＡの音声に対する傾きγが軽症音声の範囲に含まれない場合、推定装置１００Ｂの処理は、ステップＳ１９０に移る。

ステップＳ１７５では、推定部３０ａは、ステップＳ１５７で算出された被験者ＰＡの音声に対する傾きγが健康領域に含まれることから、被験者ＰＡは健康な人であると推定する。推定部３０ａは、推定した被験者ＰＡの健康状態を示す情報を、携帯通信端末２００に出力する。

ステップＳ１８５では、推定部３０ａは、ステップＳ１５７で算出された被験者ＰＡの音声に対する傾きγが軽症音声の範囲に含まれることから、被験者ＰＡはうつ病の軽症患者であると推定する。推定部３０は、推定した被験者ＰＡの健康状態を示す情報を、携帯通信端末２００に出力する。

ステップＳ１９０では、推定部３０ａは、ステップＳ１５７で算出された被験者ＰＡの音声に対する傾きγが健康音声および軽症音声の範囲にないことから、被験者ＰＡはうつ病の重症患者であると推定する。推定部３０は、推定した被験者ＰＡの健康状態を示す情報を、携帯通信端末２００に出力する。

そして、推定装置１００Ｂは、推定処理を終了する。推定装置１００Ｂは、携帯通信端末２００から被験者ＰＡの音声データを受信する度に、ステップＳ１００からステップＳ１９０の処理を繰り返し実行する。

なお、図１１に示した処理において、健康領域の情報が、予め推定装置１００Ｂまたは外部のコンピュータ装置により決定され、推定装置１００Ｂの記憶装置に記憶されている場合、ステップＳ１００、ステップＳ１１５、ステップＳ１２７およびステップＳ１３０の処理は、省略されてもよい。

以上、図８から図１１に示した実施形態では、算出部１０ａは、携帯通信端末２００を介して取得した被験者ＰＡの音声データを用いて、被験者ＰＡのゼロ点交差率ＺＣＲおよびハースト指数ＨをウィンドウＷＤ毎に算出する。推定部３０ａは、算出部１０ａにより算出された被験者ＰＡの各ウィンドウＷＤにおけるゼロ点交差率およびハースト指数の分布に対して、一次関数ＺＣＲ＝γＨ＋εによる最小二乗法等の回帰分析を実行し、被験者ＰＡの音声に対する傾きγを算出する。推定部３０ａは、算出した被験者ＰＡの音声に対する傾きγと、設定部２０ｂにより設定された健康領域との比較に基づいて被験者ＰＡの健康状態を推定する。

そして、図４に示すように、ゼロ点交差率ＺＣＲおよびハースト指数Ｈは、ダウンサンプリング等による音質の劣化の影響を受けるが、互いに独立に変化するのではなく、関係性を有して変化する。このため、ダウンサンプリング等による音質の劣化は、被験者ＰＡの音声に対する傾きγが健康領域に含まれるか否かを判定する推定部３０ａの動作に影響を与えない。すなわち、推定装置１００Ｂは、音声データの取得環境に拘わらず、従来と比べて精度良く被験者ＰＡの健康状態を推定できる。

また、被験者ＰＡの音声に対するゼロ点交差率およびハースト指数の分布に対する回帰分析から求まる傾きγは、うつ病における重症の度合いと関係付けられる。これにより、推定装置１００Ｂは、被験者ＰＡの音声データから被験者ＰＡにおけるうつ病の重症の度合いを、従来と比べて精度良く推定できる。

なお、推定装置１００（１００、１００Ａ、１００Ｂ）は、例えば、ロボット、人工知能や自動車、あるいはコールセンター、エンターテイメント、インターネット、スマートフォンやタブレット型端末等の携帯端末装置アプリケーションやサービス、検索システムへ応用されてもよい。また、推定装置１００は、診断装置、自動問診装置、災害トリアージ等に応用されてもよい。また、推定装置１００は、金融与信管理システムや行動予測、企業、学校、行政機関、警察や軍事、情報収集活動等での情報分析、虚偽発見に繋がる心理分析、組織グループ管理へ応用されてもよい。また、推定装置１００は、組織の構成員、研究者や従業員、管理者等の心の健康や行動予測を管理するシステム、住居やオフィス、飛行機や宇宙船といった環境を制御するシステム、あるいは家族や友人の心の状態や行動予測を知るための手段に適用されてもよい。また、推定装置１００は、音楽や映画配信、一般的な情報検索、情報分析管理や情報処理、あるいは顧客感性嗜好マーケット分析等やこれらをネットワークやスタンドアローンで管理するシステム等へ適用されてもよい。

以上の詳細な説明により、実施形態の特徴点および利点は明らかになるであろう。これは、特許請求の範囲がその精神および権利範囲を逸脱しない範囲で前述のような実施形態の特徴点および利点にまで及ぶことを意図するものである。また、当該技術分野において通常の知識を有する者であれば、あらゆる改良および変更に容易に想到できるはずである。したがって、発明性を有する実施形態の範囲を前述したものに限定する意図はなく、実施形態に開示された範囲に含まれる適当な改良物および均等物に拠ることも可能である。

１０，１０ａ…算出部；２０，２０ａ，２０ｂ…設定部；３０，３０ａ…推定部；１００，１００Ａ，１００Ｂ…推定装置；２００…携帯通信端末；ＰＡ…被験者

Claims

コンピュータによって、
被験者が発話した音声における波形の変化の激しさの度合いを示す第１特徴量と、前記波形の変化の相関性を示す第２特徴量とを算出し、
前記第１特徴量と前記第２特徴量との２次元空間に設定された健康な状態を示す健康領域と、前記被験者の前記第１特徴量と前記第２特徴量との位置とに基づいて前記被験者の健康状態を推定する
ことを特徴とする推定方法。
請求項１に記載の推定方法において、
予め取得した複数の人の各々の音声から前記第１特徴量および前記第２特徴量を算出し、算出した前記複数の人の前記第１特徴量および前記第２特徴量の分布に対して線形分類の処理を実行することにより、前記健康領域を決定することを特徴とする推定方法。
請求項１に記載の推定方法において、
音声の波形を再現するモデルを用いて、前記モデルに含まれるノイズの割合に応じた前記第１特徴量および前記第２特徴量をそれぞれ算出し、算出した前記各割合における前記第１特徴量および前記第２特徴量の分布に対して回帰分析を実行することにより、前記健康領域を決定することを特徴とする推定方法。
請求項１に記載の推定方法において、
予め取得した複数の人の各々の音声から所定のサンプリング数毎に前記第１特徴量および前記第２特徴量を算出し、前記所定のサンプリング数毎に算出した前記第１特徴量および前記第２特徴量の分布に対する回帰分析を、前記複数の人の各々について実行することにより、前記健康領域を決定することを特徴とする推定方法。
被験者が発話した音声における波形の変化の激しさの度合いを示す第１特徴量と、前記波形の変化の相関性を示す第２特徴量とを算出し、
前記第１特徴量と前記第２特徴量との２次元空間に設定された健康な状態を示す健康領域と、前記被験者の前記第１特徴量と前記第２特徴量との位置とに基づいて前記被験者の健康状態を推定する
処理をコンピュータに実行させる推定プログラム。
被験者が発話した音声における波形の変化の激しさの度合いを示す第１特徴量と、前記波形の変化の相関性を示す第２特徴量とを算出する算出部と、
前記第１特徴量と前記第２特徴量との２次元空間に設定された健康な状態を示す健康領域と、前記被験者の前記第１特徴量と前記第２特徴量との位置とに基づいて前記被験者の健康状態を推定する推定部と
を備えることを特徴とする推定装置。