JP2010191250A

JP2010191250A - 老若判定装置、老若判定方法

Info

Publication number: JP2010191250A
Application number: JP2009036321A
Authority: JP
Inventors: Kazuhide Okada; 一秀岡田
Original assignee: Toyota Motor Corp
Current assignee: Toyota Motor Corp
Priority date: 2009-02-19
Filing date: 2009-02-19
Publication date: 2010-09-02

Abstract

【課題】より安定性が高く同定率が高い老若判定を実行することができる老若判定装置及び老若判定方法を提供すること。
【解決手段】本発明による老若判定装置１は、フレーム毎の音声信号を平滑化する平滑化手段４ａと、平滑化された音声信号の自己相関関数を算出する自己相関関数算出手段４ｂと、自己相関関数に基づいて前記フレーム毎の音声信号が母音であるか否かを判定する母音判定手段４ｃと、母音判定手段４ｃがフレーム毎の音声信号が母音であると判定する場合に、音声信号を線形予測分析してスペクトル包絡を求める線形予測分析手段４ｄと、スペクトル包絡の線上の、第一周波数における第一点と、第一周波数よりも大きい第二周波数における第二点と、を結んで得られる直線のスペクトル傾きを演算するスペクトル傾き演算手段４ｅと、スペクトル傾きに基づいて音声信号の基となる音声の発話者の老若判定を行う老若判定手段４ｆと、を含むことを特徴とする。
【選択図】図１０

Description

本発明は、乗用車、トラック、バス等の車両において実装されるカーナビゲーションシステム等の車載機器、その他家庭用機器、携帯電話固定電話等の通信機器、警備用機器、産業用機器等の音声認識機能を備える機器に適用されて好適な、老若判定装置及び老若判定方法に関する。

近年の車両においては、車両の現在位置を検出して、ユーザが目的地を入力すると、現在位置から目的地までの経路を探索用の地図情報により探索して、画面上に表示用の地図情報と探索した経路を表示する、カーナビゲーションシステムが装備されることがある。このようなカーナビゲーションシステムにおいては、ユーザに対して必要な案内を実行することに伴って、又は、自発的に、ユーザが必要な情報を音声により入力することを主に実現する音声認識機能や、路側のセンタの担当者又は特定の他の車両のユーザ等を相手とした通話機能が備えられることがある。

このような音声認識機能や通話機能を有する機器においては、ユーザが高齢者であるか否かを判定することにより、よりユーザにとって利便性を高めることができるケースが存在する。例えば、ユーザが高齢者であれば、案内をより丁寧なものとし、ユーザの聴力、注意力や集中力の衰えを考慮して案内を繰り返し行い、ユーザが高齢者でなければ、案内をある程度迅速なものとし、警報を行う場合にはある程度強めの警報を行う、というようなユーザの老若に応じた対応を実現するとともに、提供するサービスの選択肢を個々のユーザに適応させたユーザフレンドリーなものとすることができる。このように、ユーザが高齢者であるか否かを判定する老若判定の具体的手法及び構成としては、例えば特許文献１に記載されているようなものが提案されている。

特許文献１に提案されている装置においては、音声の母音の周波数スペクトルから優勢な周波数成分であるフォルマントを抽出して、ユーザの年齢を推定することが行われている。

特開２００７−３０４６１９号公報

しかしながら、このような従来の装置においては、定常状態を持続させることが困難なパラメータであるフォルマントを利用して、ユーザの年齢の推定つまり老若判定を行っているため、老若判定の安定性や正確性が低く、同定率が低いという問題があった。このことは、単なる周波数のスペクトルのパワーや、ユーザの話す速度である話速、ピッチ等のパラメータを用いて老若判定する場合においても同様であって、やはり、老若判定の安定性や正確性が低く、同定率が低いという問題があった。

本発明は、上記問題に鑑み、より安定性が高く同定率が高い老若判定を実行することができる老若判定装置及び老若判定方法を提供することを目的とする。

上記の問題を解決するため、本発明による老若判定装置は、
フレーム毎の音声信号を平滑化する平滑化手段と、
前記平滑化された音声信号の自己相関関数を算出する自己相関関数算出手段と、
前記自己相関関数に基づいて前記フレーム毎の音声信号が母音であるか否かを判定する母音判定手段と、
前記母音判定手段が前記フレーム毎の音声信号が母音であると判定する場合に、当該音声信号を線形予測分析してスペクトル包絡を求める線形予測分析手段と、
前記スペクトル包絡の線上の、第一周波数における第一点と、前記第一周波数よりも大きい第二周波数における第二点と、を結んで得られる直線のスペクトル傾きを演算するスペクトル傾き演算手段と、
前記スペクトル傾きに基づいて前記音声信号の基となる音声の発話者の老若判定を行う老若判定手段と、を含むことを特徴とする。

なお、ユーザすなわち発話者の発声した音声をマイクにより集音して信号化して生成されたアナログの音声信号は、高速フーリエ変換ＦＦＴ（Fast Fourier Transform）によりデジタルの音声信号に変換されて、前記平滑化手段に音声信号が入力される。

ここで、前記平滑化手段は、単位遅延素子、乗算器、加算器、相関器等のデジタルフィルタを格子状に組み合わせたものを、予測誤差を除去するにあたり必要な次数だけ組み合わせて、それぞれの次数段の相関器においてＰＡＲＣＯＲ（Partial Autocorrelation Coefficients）係数を演算して、ひずみを平滑化するとともに音声信号を平滑化して符号化するものである。

また、前記線形予測分析手段とは、線形予測分析つまりＬＰＣ（Linear Predictive Coding）分析を行うものを指し、圧縮されて符号化された音声信号すなわちＰＡＲＣＯＲ係数を用いた線形予測分析に基づく音声信号のパワースペクトラムの対数の逆フーリエ変換であるＬＰＣスペクトルつまりケプストラムを次数段毎に求めてフレーム毎の音声特徴ベクトルを算出し、各整数段の人の声門の発生する周波数の高次の高調波や、声道の共振周波数のうち高次の周波数、特にはフォルマント周波数共振を除去したスペクトル包絡を求めるものである。

なお、前記第一周波数は老若に係わらず人間の可聴周波数帯域においてＬＰＣスペクトルの強さが支配的である領域の始端の周波数に基づいて決定され、前記第二周波数とは前記領域の終端の周波数に基づいて決定される。典型的には、終端側の周波数に対して前記第二周波数を適宜マージンを有して設定し、前記第一周波数は０ｋＨｚとし、前記第二周波数を５ｋＨｚとすることができる。

また、前記スペクトル傾きとは、例えば、前記第一点のＬＰＣスペクトルの値と前記第二点のＬＰＣスペクトルの値の差と定義することができる。

前記第一周波数と前記第二周波数により定義される前記領域において、前記音声の発話者が高齢者つまり老人であって加齢が進むほど、高域側のパワースペクトルの強さが低域側に較べて強くなる傾向があり、若年者である場合に較べて前記スペクトル傾きは小さくなる性質を有する。

なお、本発明の老若判定方法は、
フレーム毎の音声信号を平滑化する平滑化ステップと、
前記平滑化された音声信号の自己相関関数を算出する自己相関関数算出ステップと、
前記自己相関関数に基づいて前記フレーム毎の音声信号が母音であるか否かを判定する母音判定ステップと、
前記母音判定ステップにおいて前記フレーム毎の音声信号が母音であると判定された場合に、当該音声信号を線形予測分析してスペクトル包絡を求める線形予測分析ステップと、
前記スペクトル包絡の線上の、第一周波数における第一点と、第一周波数よりも大きい第二周波数における第二点と、を結んで得られる直線のスペクトル傾きを演算するスペクトル傾き演算ステップと、前記スペクトル傾きに基づいて前記音声信号の基となる音声の発話者の老若判定を行う老若判定ステップと、
を含むことを特徴とする。

本発明の前記老若判定装置又は前記老若判定方法によれば、前記発話者が老人であれば、前述したような平滑化された後の前記音声信号に基づく前記線形予測分析により求められる前記スペクトル傾きが加齢に伴い小さくなるという性質を利用して、安定性の低いフォルマント周波数や、話速、ピッチ等のパラメータを用いることなく、前記スペクトル傾きの大きさに基づいて、より安定性や正確性の高い老若判定を実行することができ、老若判定の同定率を、高めることができる。

本発明によれば、より安定性が高く同定率が高い老若判定を実行することができる老若判定装置及び老若判定方法を提供することができる。

本発明に係る老若判定装置の一実施形態を示すブロック図である。本発明に係る老若判定装置の一実施形態の処理内容を示す模式図である。本発明に係る老若判定装置の一実施形態の処理内容を示す模式図である。本発明に係る老若判定装置の一実施形態の処理内容を示す模式図である。本発明に係る老若判定装置の一実施形態の処理内容を示す模式図である。本発明に係る老若判定装置の一実施形態の処理内容を示す模式図である。本発明に係る老若判定装置の一実施形態の処理内容を示す模式図である。本発明に係る老若判定装置の一実施形態の処理内容を示す模式図である。本発明に係る老若判定装置の一実施形態の処理内容を示す模式図である。本発明に係る老若判定装置の一実施形態の制御内容を示すフローチャートである。本発明に係る老若判定装置の一実施形態の処理内容を示す模式図である。

以下、本発明を実施するための形態について、添付図面を参照しながら説明する。

図１は、本発明に係る老若判定装置の一実施形態を示すブロック図である。図２は、本発明に係わる老若判定装置の一実施形態に用いられる声道のＭＲＩ画像を説明するための模式図である。図３は、本発明に係わる老若判定装置の一実施形態に用いられる声道の円筒管モデルを示す模式図である。図４は、本発明に係わる老若判定装置の一実施形態に用いられる声道の円筒菅モデルにおける物理現象を示す模式図である。図５は、本発明に係わる老若判定装置の一実施形態に用いられる格子型フィルタを示す模式図である。図６は、本発明に係わる老若判定装置に用いられる平滑化手段を構成する格子型フィルタの整数次の多段構成を示す模式図である。

また、図７は、本発明に係わる老若判定装置の一実施形態における母音判定ステップに用いられる自己相関関数（変形相関関数）の一例を示す模式図である。図８は、本発明に係わる老若判定装置の一実施形態におけるスペクトル傾き演算ステップに用いられるスペクトル包絡の一例を示す模式図である。図９は、本発明に係わる老若判定装置の一実施形態における老若判定に用いられる加齢によるスペクトル傾きの変化を示す模式図である。

図１に示すように、老若判定装置１は、車両に実装されるカーナビゲーションシステムの一部として構成され、マイク２と、スピーカ３と、カーナビゲーションＥＣＵ４（Car Navigation Electronic Control Unit）とを備えて構成される。カーナビゲーションＥＣＵ４は、ＣＡＮ（Controller Area Network）等の通信規格に接続されている。

マイク２は、車室内のユーザの前方に備えられる集音マイクであって、ユーザすなわち発話者の発声した音声を集音して音声信号に変換して、変換された後の音声信号をカーナビゲーションＥＣＵ４に対して出力するものである。

スピーカ３は、これも車室内のユーザの前方に備えられるものであって、カーナビゲーションＥＣＵ４の指令に基づいて、案内音声、警報音等を出力するものである。

カーナビゲーションＥＣＵ４は、例えばＣＰＵ、ＲＯＭ、ＲＡＭおよびそれらを相互に接続するデータバスと入出力インターフェースを含むことにより構成され、ＲＯＭに格納されたプログラムを実行することに基づいて、以下に述べるそれぞれの制御を行う平滑化手段４ａと、自己相関関数算出手段４ｂと、母音判定手段４ｃと、線形予測分析手段４ｄと、スペクトル傾き演算手段４ｅと、老若判定手段４ｆとして機能するものである。

なお、カーナビゲーションＥＣＵ４は、一般的なカーナビゲーションの探索機能と音声認識機能を実現するプログラムをも有しており、図示しないＧＰＳアンテナの受信した電波をもとに、例えば三角測量の原理で車両の位置つまりは経度と緯度を測定する。また、カーナビゲーションＥＣＵ４は、ＣＡＮ上から取得した車両の車速、ヨーレート、操舵角をもとにして、車両の移動距離と方向を計算して車両の位置を自律航法により測定して、ＧＰＳアンテナが衛星から電波を受信できない場合においては、車両の位置データを補完する。

カーナビゲーションＥＣＵ４は、このようにして測定した車両の現在の位置と、図示しないタッチパネルによるタッチ操作によりユーザが入力した目的地、又はスピーカ３の案内音声に基づいてユーザが音声としてマイク２に発声した目的地、とを結ぶルート情報を、図示しないデータベース内の探索用の地図情報を用いてダイクストラ法等の手法により探索する。

そして、カーナビゲーションＥＣＵ４は、データベース内の表示用の地図情報と、上述した方法により測定した車両の位置と、タッチパネルのタッチ操作により又はマイク２の音声入力により入力された目的地と、探索された車両の位置から目的地に到るルート情報とを併せて図示しないディスプレイに表示し、車両の現在の位置がルート情報における左折又は右折箇所、目的地に接近するとスピーカ３によりその左折又は右折箇所、目的地をユーザに対して音声で案内する案内音声を出力する。

本実施例のカーナビゲーションＥＣＵ４の平滑化手段４ａは、図２に示すようなＭＲＩ画像の形態である人の声道をカーナビゲーションＥＣＵ４が所定のプログラムを実行することにより構成される電気回路で実現可能な物理的モデルに変換すると、図３に示すような、断面積の異なる整数個の円柱、バーベルを繋いだ音響管モデルとなることを利用して構成される。

図４に示すように、前方に障壁ｂがある場合には、音圧は１００％反射され、障壁ｂが無い場合には、損失がない形で前進するものとみなして、各次数のＰＡＲＣＯＲ係数を、円柱の接続点における音響反射係数と解釈するものとすると、図４に示す音響管モデルは、図５に示すような格子型回路に置換される。図４及び図５中において、ｆは前方を、ｒは後方を、ｂは障壁を、ｍは各整数次数を、Ｚ^−１は遅延素子を、三角は乗算器を、黒丸は加算器を、ｒｍは各次数のＰＡＲＣＯＲ係数を、Δは各次数の音響管つまり円柱の長さを、Ａは円柱の断面積を示す。

図５に示す格子型回路は、要求されるひずみの平滑化度合に基づいて、図６に示すように多整数段に接続され、図６の最右の口唇で捉えられた音声信号の音声波形を、図６に示す格子型回路に入れ、左側に平滑化すると、円柱管の個数分の最左には、声門レベルでの音声波形が得られ、声門レベルでの音声波形の振幅を求めることができ、この音声信号の自己相関関数をカーナビゲーションＥＣＵ４の自己相関関数算出手段４ｂ（図６では自己相関器）が算出すると、図７に示すような変形相関関数が得られる。図７において、横軸は時間、縦軸はＬＰＣスペクトルを示す。

図７に示した変形相関関数において、カーナビゲーションＥＣＵ４の母音判定手段４ｃは、時間０におけるピーク値ａと３０ｍｓ未満の時間Ｔにおけるピーク値ｂにより定まる雑音比Ｐｎ＝ｂ／ａを算出して、Ｐｎ＜０．２２であれば、現在のフレームは母音部であると判定し、０．２２≦Ｐｎ＜０．２８であれば、現在のフレームは有声子音部であると判定し、Ｐｎ≧０．２８であれば、現在のフレームは無声子音部であると判定する。

カーナビゲーションＥＣＵ４の線形予測分析手段４ｄは、母音判定手段４ｃが、現在のフレームが母音部であると判定する場合においてのみ、線形予測分析つまりＬＰＣ分析を行い、図８に示すような、スペクトル包絡を求めて、さらに、カーナビゲーションＥＣＵ４のスペクトル傾き演算手段４ｅは、０ｋＨｚにおけるＬＰＣスペクトルのパワーと、５ｋＨｚにおけるＬＰＣスペクトルのパワーの差を演算して、スペクトル傾きをフレーム毎に求める。演算手段４ｅは、スペクトル傾きを求めるこの演算をフレーム毎に、フレームが母音部でないと判定される、つまり、有声子音部又は無声子音部であると判定されるまでの間実行して、母音部であると判定された複数のフレーム間の平均値を演算する。

前述したように、スペクトル傾きは、ユーザすなわち発話者が老人であって加齢が進むほど小さくなる性質を有している。図９はこの性質を示す模式図である。図９は、例えば男女それぞれ数人をサンプルとして、同一人において加齢するに従い、各母音（ａ、ｉ、ｕ、ｅ、ｏ：図９中上から下に順番に示す）に対応する傾きがどのように変化するかを示し、横軸は年度を、縦軸は傾きを示す。横軸において右方に移動して年度が進むほど調査対象となった人が加齢することを示す。なお母音ａが二つ存在するのは、同一の単語内において前後して位置する母音ａの双方を示している。

図９に示すように、同一人が、同一語彙の同一音素を発生した場合において、加齢が進行すると、若年者においてはスペクトルの低域側を優位とするスペクトル傾きが、高域側の雑音のパワーが増加することに起因して小さくなることとなる。傾きの初期値が正の値であれば絶対値が小さくなり、傾きの初期値が０に近い正の値であれば、符号が負に換わり、傾きの初期値が負の値であれば絶対値が増加する。

高域側の雑音が加齢により増加する傾向を示す理由としては、同一人において加齢が進むと、声帯の振動がまず不確定となり、声帯が自由に伸縮することが困難となり、発声にあたっての振動を安定させることが困難となること等が挙げられる。また、声道の共振においても、声道を狭窄する速度が筋力及び運動神経の衰えにより低下して、規則正しく動かすことが困難となることも高域側の雑音が増加する傾向を呈する一因となる。

人が若年である場合には、このような高域側の雑音はほとんど観測されず、従って、スペクトルの強さが支配的な低域側が高域側に較べて相対的に大きくなり、スペクトル傾きは大きくなるが、人が老年になるにつれて、上述した理由によりスペクトル傾きは小さくなる。

本実施例のカーナビゲーションＥＣＵ４の老若判定手段４ｆは、図９の母音毎の曲線から求められる母音毎のスペクトル傾きの閾値（年度を固定した場合の図９の各母音の曲線状の値（ｄＢ）、例えば１９９３年における値）に対して、スペクトル傾き演算手段４ｅにより演算されたスペクトル傾きが下回った場合には、ユーザが老人であると判定し、下回らない場合には老人でないと判定する。

以下に以上述べたカーナビゲーションＥＣＵ４の制御内容を、フローチャートと図を用いて説明する。図１０は、本発明に係わる老若判定装置の一実施形態の自己相関関数算出ステップ以降の制御内容を示すフローチャートである。図１１は、本発明に係わる老若判定装置の一実施形態における老若判定ステップの判定結果に基づく提供サービスの一例を示す模式図である。

図１０のステップＳ１に示すように、図６に示した格子型回路の（Ａ）において、平滑化手段４ａは、ＰＡＲＣＯＲ分析により、声門レベルでの振幅を求め、ステップＳ２に示すように、自己相関関数算出手段４ｂは、図６に示した格子型回路の（Ｂ）において（Ａ）で求めた自己相関関数（変形相関関数）を求める。

ステップＳ３において、母音判定手段４ｃは、３０ｍｓ以内に存在する極大値ｂの初期値ａに対する比、つまり、図７に示したＰｎを演算して、図６に示した格子型回路（Ｃ）において、Ｐｎ＜０．２２であれば、現在のフレームが母音部と判定し、０．２２≦Ｐｎ＜０．２８であれば、現在のフレームが有声子音部であると判定し、０．２８≦Ｐｎであれば、現在のフレームが無声子音部であると判定する。

ステップＳ４において、母音判定手段４ｃは、ステップＳ３における自身の判定結果に基づいて、現在のフレームが母音であるか否かを判定し、肯定である場合にはステップＳ５にすすみ、否定である場合には、ステップＳ９にすすむ。なお、母音である場合にのみにステップＳ５以下の処理を実行する理由は、母音以外の有声子音、無声子音においては雑音が多いためである。

ステップＳ５において、線形予測分析手段４ｄは、ＬＰＣ分析を行ってＬＰＣパワースペクトルを求めて、ステップＳ６において、スペクトル傾き演算手段４ｅは、図８に示した、スペクトル包絡線上における周波数が０ｋＨｚの第一点と５ｋＨｚにおける第二点を結んで、図８（Ｄ）に示すパワーの下降値をスペクトル傾きとして求め保存する。

ステップＳ７において、母音判定手段４ｃは、次フレームが子音であるかを判定し、肯定である場合にはステップＳ８にすすみ、否定である場合には、ステップＳ９にすすむ。
ステップＳ８において、スペクトル傾き演算手段４ｅは、母音と判定された複数のフレームにおけるスペクトル傾きを平均した値を求め、フレームが一の場合にはステップＳ６で求めたペクトル傾きの値をそのまま用いる。ステップＳ９において、スコープするフレーム番号のアップデートを行う。

ステップＳ１〜Ｓ９の処理は、適宜の間隔により繰り返し実行されて、本発明の老若判定方法の各ステップ、平滑化ステップ、自己相関関数算出ステップ、母音判定ステップ、線形予測分析ステップ、スペクトル傾き演算ステップ、老若判定ステップが、繰り返して実行される。

図１０に示した各ステップが実行された後、ユーザの老若判定結果を用いて、ユーザが老年である場合には、より親切な繰り返し案内を丁寧な口調の音声合成で行い、ユーザが若者である場合には、若年者特有の乱暴な運転や振る舞いを抑制する意図で、警報音又は興奮を沈静化するような効果音、図１１に示すような、若者だけが可聴できる高域の周波数の図１１に示すようなモスキート音を、カーナビゲーションＥＣＵ４の制御に基づいてスピーカ３により発生する。

また、若年者と老年者とでは、図１１に示すように可聴周波数領域が異なり、老年者では可聴周波数領域が老年者よりも高域側及び低域側共に小さい範囲となるので、スピーカ３により発生する案内音声、警報音ともに、ユーザが老年者である場合には、老年者に対応した可聴周波数領域に収まる音を発生し、ユーザが若年者である場合には、若年者に対応した可聴周波数領域全般を利用した音を発生することとする。

以上述べた制御内容により実現される本実施例の老若判定装置１及び実行される老若判定方法によれば、以下のような作用効果を得ることができる。すなわち、ユーザつまり発話者が老人であれば、図６の（Ａ）において平滑化された後の音声信号に基づくＬＰＣ分析により求められるスペクトル傾きが加齢に伴い小さくなるという性質を利用して、図９に示した予め調査により求められるマップにより、スペクトル傾きの大きさを閾値判定することにより、より安定性や正確性の高い老若判定を実行することができ、老若判定の同定率を、高めることができる。また、安定性の低いフォルマント周波数や、話速、ピッチ等のパラメータを用いることを廃することができるので、これらのパラメータを用いた判定よりも、老若判定の同定率を高めることができる。

特にフォルマント周波数は声道の長さにより定まる傾向が大きく、人の声道は一旦成人となった後はあまり変化しないことから、加齢を示すパラメータとしては必ずしも適切ではなく、正確な老若判定が困難である。さらに、フォルマント周波数の一次、二次を求めるにあたっては、演算のプログラミングのステップ数の大きくなり、カーナビゲーションＥＣＵ４の処理負荷が増大し、演算速度が低下するという問題も内包していた。これに対して、本実施例の老若判定装置１及び老若判定方法によれば、より適切なパラメータとしてスペクトル傾きを用いることにより、より正確な老若判定を可能として、処理負荷を軽減し、演算速度の低下を防止することができる。

また、老若判定に用いるパラメータをスペクトル傾きとすることにより、音素音節単体ではなく、繋がりを持って連なった音声信号に基づいて老若判定を行うことができ、老若判定の安定性、確実性を高めて、同定率を高めることができる。さらに、人は加齢すると若年である場合に較べて様々な変化が生じ、一般的には声が小さくなり、声帯萎縮を発生するという傾向は有するものの、声の大小や声帯萎縮の加齢に伴う変化の傾向には個人差があり一概に定まった傾向を呈するものではない。さらに、母音判定に用いる雑音比Ｐｎについても、格子型フィルタを通した後の音声信号に基づくものであり、量子化の分解能が高くないことから、母音判定には適切ではあるが、高域のパワーが増大することを示すパラメータとしては必ずしも適切ではない。

ところが、本実施例のスペクトル傾きは、加齢した場合に、人の声道のＭＲＩによる断面形状の凹凸が大きくなりごつごつした形状を呈すること、発生に必要な共振周波数を得るために声道を狭窄する動作が素早くできなくなること、声道の長さ方向の狭窄点を制御することが困難となること、声道、声帯双方の柔軟性が低下すること、運動神経の電位伝達性が低下することの全てを含むパラメータであるため、個人差に係わらず、人の老若判定をより確実に実行することができる。

また、本実施例の老若判定装置１及び老若判定方法において用いられる、平滑化ステップ、自己相関関数算出ステップ、母音判定ステップ、線形予測分析ステップ、スペクトル傾き演算ステップ、老若判定ステップのうち、スペクトル傾き演算ステップと老若判定ステップ以外のステップは従来のカーナビゲーションＥＣＵ４の処理ステップをそのまま用いることができるため、別途のプログラムの追加を最小限度のものとして、より簡略な処理の追加により、正確な老若判定を実行することができる。

さらに、本実施例の老若判定装置１及び老若判定方法においては、ＬＰＣ分析を行った後の、圧縮されて符号化された音声信号すなわちＰＡＲＣＯＲ係数や、ＰＡＲＣＯＲ係数を用いた線形予測分析に基づく音声信号のパワースペクトラムの対数の逆フーリエ変換であるＬＰＣスペクトルつまりケプストラムを次数段毎に求めてフレーム毎の音声特徴ベクトルを算出し、各整数段の人の声門の発生する周波数の高次の高調波や、声道の共振周波数のうち高次の周波数、特にはフォルマント周波数共振を除去したスペクトル包絡に基づいて、スペクトル傾きを求めているため、例えば、ＦＦＴを実施した直後のスペクトラム包絡、又は、アナログの音声信号から求めたスペクトラム包絡をそのまま用いることに較べて、スペクトラム包絡を求めるにあたっての安定性を高めることができる。これにより、求められたスペクトル傾きを閾値判定するにあたっての判定の安定性、正確性を高めて、老若判定の同定率を高めることができる。

以上本発明の好ましい実施例について詳細に説明したが、本発明は上述した実施例に制限されることなく、本発明の範囲を逸脱することなく、上述した実施例に種々の変形および置換を加えることができる。

例えば上述した実施例においては、老若判定に用いる閾値を、図９に示した横軸の１９９３年度の値としたが、これはあくまで例示的なものであり、任意の年度における曲線の値を閾値とすることができる。

また、老若判定結果に基づく制御内容の変更についてもあくまで例示的なものであり、ユーザが老年者である場合には、老年者向けのラジオ番組や施設に関する情報を提供すること、ユーザが若年者である場合には、事故防止上の注意点を案内すること等、ユーザの老若判定結果に基づいて種々のサービスを提供することが可能である。

本発明は、ユーザすなわち発話者が高齢者であるか否かを判定する老若判定を行う老若判定装置及び老若判定方法に関するものであり、より適切なパラメータを選択して使用することに基づいて、より安定性及び正確性の高い老若判定を実現して、老若判定の同定率を高めることができる。さらに、本発明によれば、同定率の高い老若判定に基づいて、ユーザの老若判定結果に対応させたきめの細かいサービスの提供を実現することができるので、乗用車、トラック、バス等の様々な車両に搭載される車載機器、家庭用機器、携帯電話等の通信機器、警備用機器等の様々な分野の機器に適用して有益なものである。

１老若判定装置
２マイク
３スピーカ
４カーナビゲーションＥＣＵ
４ａ平滑化手段
４ｂ自己相関関数算出手段
４ｃ母音判定手段
４ｄ線形予測分析手段
４ｅスペクトル傾き演算手段
４ｆ老若判定手段

Claims

フレーム毎の音声信号を平滑化する平滑化手段と、前記平滑化された音声信号の自己相関関数を算出する自己相関関数算出手段と、前記自己相関関数に基づいて前記フレーム毎の音声信号が母音であるか否かを判定する母音判定手段と、前記母音判定手段が前記フレーム毎の音声信号が母音であると判定する場合に、当該音声信号を線形予測分析してスペクトル包絡を求める線形予測分析手段と、前記スペクトル包絡の線上の、第一周波数における第一点と、前記第一周波数よりも大きい第二周波数における第二点と、を結んで得られる直線のスペクトル傾きを演算するスペクトル傾き演算手段と、前記スペクトル傾きに基づいて前記音声信号の基となる音声の発話者の老若判定を行う老若判定手段と、を含むことを特徴とする老若判定装置。
フレーム毎の音声信号を平滑化する平滑化ステップと、前記平滑化された音声信号の自己相関関数を算出する自己相関関数算出ステップと、前記自己相関関数に基づいて前記フレーム毎の音声信号が母音であるか否かを判定する母音判定ステップと、前記母音判定ステップにおいて前記フレーム毎の音声信号が母音であると判定された場合に、当該音声信号を線形予測分析してスペクトル包絡を求める線形予測分析ステップと、前記スペクトル包絡の線上の、第一周波数における第一点と、前記第一周波数よりも大きい第二周波数における第二点と、を結んで得られる直線のスペクトル傾きを演算するスペクトル傾き演算ステップと、前記スペクトル傾きに基づいて前記音声信号の基となる音声の発話者の老若判定を行う老若判定ステップと、を含むことを特徴とする老若判定方法。