JP2010191250A - 老若判定装置、老若判定方法 - Google Patents
老若判定装置、老若判定方法 Download PDFInfo
- Publication number
- JP2010191250A JP2010191250A JP2009036321A JP2009036321A JP2010191250A JP 2010191250 A JP2010191250 A JP 2010191250A JP 2009036321 A JP2009036321 A JP 2009036321A JP 2009036321 A JP2009036321 A JP 2009036321A JP 2010191250 A JP2010191250 A JP 2010191250A
- Authority
- JP
- Japan
- Prior art keywords
- vowel
- age
- frequency
- age determination
- spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
【課題】 より安定性が高く同定率が高い老若判定を実行することができる老若判定装置及び老若判定方法を提供すること。
【解決手段】 本発明による老若判定装置1は、フレーム毎の音声信号を平滑化する平滑化手段4aと、平滑化された音声信号の自己相関関数を算出する自己相関関数算出手段4bと、自己相関関数に基づいて前記フレーム毎の音声信号が母音であるか否かを判定する母音判定手段4cと、母音判定手段4cがフレーム毎の音声信号が母音であると判定する場合に、音声信号を線形予測分析してスペクトル包絡を求める線形予測分析手段4dと、スペクトル包絡の線上の、第一周波数における第一点と、第一周波数よりも大きい第二周波数における第二点と、を結んで得られる直線のスペクトル傾きを演算するスペクトル傾き演算手段4eと、スペクトル傾きに基づいて音声信号の基となる音声の発話者の老若判定を行う老若判定手段4fと、を含むことを特徴とする。
【選択図】 図10
【解決手段】 本発明による老若判定装置1は、フレーム毎の音声信号を平滑化する平滑化手段4aと、平滑化された音声信号の自己相関関数を算出する自己相関関数算出手段4bと、自己相関関数に基づいて前記フレーム毎の音声信号が母音であるか否かを判定する母音判定手段4cと、母音判定手段4cがフレーム毎の音声信号が母音であると判定する場合に、音声信号を線形予測分析してスペクトル包絡を求める線形予測分析手段4dと、スペクトル包絡の線上の、第一周波数における第一点と、第一周波数よりも大きい第二周波数における第二点と、を結んで得られる直線のスペクトル傾きを演算するスペクトル傾き演算手段4eと、スペクトル傾きに基づいて音声信号の基となる音声の発話者の老若判定を行う老若判定手段4fと、を含むことを特徴とする。
【選択図】 図10
Description
本発明は、乗用車、トラック、バス等の車両において実装されるカーナビゲーションシステム等の車載機器、その他家庭用機器、携帯電話固定電話等の通信機器、警備用機器、産業用機器等の音声認識機能を備える機器に適用されて好適な、老若判定装置及び老若判定方法に関する。
近年の車両においては、車両の現在位置を検出して、ユーザが目的地を入力すると、現在位置から目的地までの経路を探索用の地図情報により探索して、画面上に表示用の地図情報と探索した経路を表示する、カーナビゲーションシステムが装備されることがある。このようなカーナビゲーションシステムにおいては、ユーザに対して必要な案内を実行することに伴って、又は、自発的に、ユーザが必要な情報を音声により入力することを主に実現する音声認識機能や、路側のセンタの担当者又は特定の他の車両のユーザ等を相手とした通話機能が備えられることがある。
このような音声認識機能や通話機能を有する機器においては、ユーザが高齢者であるか否かを判定することにより、よりユーザにとって利便性を高めることができるケースが存在する。例えば、ユーザが高齢者であれば、案内をより丁寧なものとし、ユーザの聴力、注意力や集中力の衰えを考慮して案内を繰り返し行い、ユーザが高齢者でなければ、案内をある程度迅速なものとし、警報を行う場合にはある程度強めの警報を行う、というようなユーザの老若に応じた対応を実現するとともに、提供するサービスの選択肢を個々のユーザに適応させたユーザフレンドリーなものとすることができる。このように、ユーザが高齢者であるか否かを判定する老若判定の具体的手法及び構成としては、例えば特許文献1に記載されているようなものが提案されている。
特許文献1に提案されている装置においては、音声の母音の周波数スペクトルから優勢な周波数成分であるフォルマントを抽出して、ユーザの年齢を推定することが行われている。
しかしながら、このような従来の装置においては、定常状態を持続させることが困難なパラメータであるフォルマントを利用して、ユーザの年齢の推定つまり老若判定を行っているため、老若判定の安定性や正確性が低く、同定率が低いという問題があった。このことは、単なる周波数のスペクトルのパワーや、ユーザの話す速度である話速、ピッチ等のパラメータを用いて老若判定する場合においても同様であって、やはり、老若判定の安定性や正確性が低く、同定率が低いという問題があった。
本発明は、上記問題に鑑み、より安定性が高く同定率が高い老若判定を実行することができる老若判定装置及び老若判定方法を提供することを目的とする。
上記の問題を解決するため、本発明による老若判定装置は、
フレーム毎の音声信号を平滑化する平滑化手段と、
前記平滑化された音声信号の自己相関関数を算出する自己相関関数算出手段と、
前記自己相関関数に基づいて前記フレーム毎の音声信号が母音であるか否かを判定する母音判定手段と、
前記母音判定手段が前記フレーム毎の音声信号が母音であると判定する場合に、当該音声信号を線形予測分析してスペクトル包絡を求める線形予測分析手段と、
前記スペクトル包絡の線上の、第一周波数における第一点と、前記第一周波数よりも大きい第二周波数における第二点と、を結んで得られる直線のスペクトル傾きを演算するスペクトル傾き演算手段と、
前記スペクトル傾きに基づいて前記音声信号の基となる音声の発話者の老若判定を行う老若判定手段と、を含むことを特徴とする。
フレーム毎の音声信号を平滑化する平滑化手段と、
前記平滑化された音声信号の自己相関関数を算出する自己相関関数算出手段と、
前記自己相関関数に基づいて前記フレーム毎の音声信号が母音であるか否かを判定する母音判定手段と、
前記母音判定手段が前記フレーム毎の音声信号が母音であると判定する場合に、当該音声信号を線形予測分析してスペクトル包絡を求める線形予測分析手段と、
前記スペクトル包絡の線上の、第一周波数における第一点と、前記第一周波数よりも大きい第二周波数における第二点と、を結んで得られる直線のスペクトル傾きを演算するスペクトル傾き演算手段と、
前記スペクトル傾きに基づいて前記音声信号の基となる音声の発話者の老若判定を行う老若判定手段と、を含むことを特徴とする。
なお、ユーザすなわち発話者の発声した音声をマイクにより集音して信号化して生成されたアナログの音声信号は、高速フーリエ変換FFT(Fast Fourier Transform)によりデジタルの音声信号に変換されて、前記平滑化手段に音声信号が入力される。
ここで、前記平滑化手段は、単位遅延素子、乗算器、加算器、相関器等のデジタルフィルタを格子状に組み合わせたものを、予測誤差を除去するにあたり必要な次数だけ組み合わせて、それぞれの次数段の相関器においてPARCOR(Partial Autocorrelation Coefficients)係数を演算して、ひずみを平滑化するとともに音声信号を平滑化して符号化するものである。
また、前記線形予測分析手段とは、線形予測分析つまりLPC(Linear Predictive Coding)分析を行うものを指し、圧縮されて符号化された音声信号すなわちPARCOR係数を用いた線形予測分析に基づく音声信号のパワースペクトラムの対数の逆フーリエ変換であるLPCスペクトルつまりケプストラムを次数段毎に求めてフレーム毎の音声特徴ベクトルを算出し、各整数段の人の声門の発生する周波数の高次の高調波や、声道の共振周波数のうち高次の周波数、特にはフォルマント周波数共振を除去したスペクトル包絡を求めるものである。
なお、前記第一周波数は老若に係わらず人間の可聴周波数帯域においてLPCスペクトルの強さが支配的である領域の始端の周波数に基づいて決定され、前記第二周波数とは前記領域の終端の周波数に基づいて決定される。典型的には、終端側の周波数に対して前記第二周波数を適宜マージンを有して設定し、前記第一周波数は0kHzとし、前記第二周波数を5kHzとすることができる。
また、前記スペクトル傾きとは、例えば、前記第一点のLPCスペクトルの値と前記第二点のLPCスペクトルの値の差と定義することができる。
前記第一周波数と前記第二周波数により定義される前記領域において、前記音声の発話者が高齢者つまり老人であって加齢が進むほど、高域側のパワースペクトルの強さが低域側に較べて強くなる傾向があり、若年者である場合に較べて前記スペクトル傾きは小さくなる性質を有する。
なお、本発明の老若判定方法は、
フレーム毎の音声信号を平滑化する平滑化ステップと、
前記平滑化された音声信号の自己相関関数を算出する自己相関関数算出ステップと、
前記自己相関関数に基づいて前記フレーム毎の音声信号が母音であるか否かを判定する母音判定ステップと、
前記母音判定ステップにおいて前記フレーム毎の音声信号が母音であると判定された場合に、当該音声信号を線形予測分析してスペクトル包絡を求める線形予測分析ステップと、
前記スペクトル包絡の線上の、第一周波数における第一点と、第一周波数よりも大きい第二周波数における第二点と、を結んで得られる直線のスペクトル傾きを演算するスペクトル傾き演算ステップと、前記スペクトル傾きに基づいて前記音声信号の基となる音声の発話者の老若判定を行う老若判定ステップと、
を含むことを特徴とする。
フレーム毎の音声信号を平滑化する平滑化ステップと、
前記平滑化された音声信号の自己相関関数を算出する自己相関関数算出ステップと、
前記自己相関関数に基づいて前記フレーム毎の音声信号が母音であるか否かを判定する母音判定ステップと、
前記母音判定ステップにおいて前記フレーム毎の音声信号が母音であると判定された場合に、当該音声信号を線形予測分析してスペクトル包絡を求める線形予測分析ステップと、
前記スペクトル包絡の線上の、第一周波数における第一点と、第一周波数よりも大きい第二周波数における第二点と、を結んで得られる直線のスペクトル傾きを演算するスペクトル傾き演算ステップと、前記スペクトル傾きに基づいて前記音声信号の基となる音声の発話者の老若判定を行う老若判定ステップと、
を含むことを特徴とする。
本発明の前記老若判定装置又は前記老若判定方法によれば、前記発話者が老人であれば、前述したような平滑化された後の前記音声信号に基づく前記線形予測分析により求められる前記スペクトル傾きが加齢に伴い小さくなるという性質を利用して、安定性の低いフォルマント周波数や、話速、ピッチ等のパラメータを用いることなく、前記スペクトル傾きの大きさに基づいて、より安定性や正確性の高い老若判定を実行することができ、老若判定の同定率を、高めることができる。
本発明によれば、より安定性が高く同定率が高い老若判定を実行することができる老若判定装置及び老若判定方法を提供することができる。
以下、本発明を実施するための形態について、添付図面を参照しながら説明する。
図1は、本発明に係る老若判定装置の一実施形態を示すブロック図である。図2は、本発明に係わる老若判定装置の一実施形態に用いられる声道のMRI画像を説明するための模式図である。図3は、本発明に係わる老若判定装置の一実施形態に用いられる声道の円筒管モデルを示す模式図である。図4は、本発明に係わる老若判定装置の一実施形態に用いられる声道の円筒菅モデルにおける物理現象を示す模式図である。図5は、本発明に係わる老若判定装置の一実施形態に用いられる格子型フィルタを示す模式図である。図6は、本発明に係わる老若判定装置に用いられる平滑化手段を構成する格子型フィルタの整数次の多段構成を示す模式図である。
また、図7は、本発明に係わる老若判定装置の一実施形態における母音判定ステップに用いられる自己相関関数(変形相関関数)の一例を示す模式図である。図8は、本発明に係わる老若判定装置の一実施形態におけるスペクトル傾き演算ステップに用いられるスペクトル包絡の一例を示す模式図である。図9は、本発明に係わる老若判定装置の一実施形態における老若判定に用いられる加齢によるスペクトル傾きの変化を示す模式図である。
図1に示すように、老若判定装置1は、車両に実装されるカーナビゲーションシステムの一部として構成され、マイク2と、スピーカ3と、カーナビゲーションECU4(Car Navigation Electronic Control Unit)とを備えて構成される。カーナビゲーションECU4は、CAN(Controller Area Network)等の通信規格に接続されている。
マイク2は、車室内のユーザの前方に備えられる集音マイクであって、ユーザすなわち発話者の発声した音声を集音して音声信号に変換して、変換された後の音声信号をカーナビゲーションECU4に対して出力するものである。
スピーカ3は、これも車室内のユーザの前方に備えられるものであって、カーナビゲーションECU4の指令に基づいて、案内音声、警報音等を出力するものである。
カーナビゲーションECU4は、例えばCPU、ROM、RAMおよびそれらを相互に接続するデータバスと入出力インターフェースを含むことにより構成され、ROMに格納されたプログラムを実行することに基づいて、以下に述べるそれぞれの制御を行う平滑化手段4aと、自己相関関数算出手段4bと、母音判定手段4cと、線形予測分析手段4dと、スペクトル傾き演算手段4eと、老若判定手段4fとして機能するものである。
なお、カーナビゲーションECU4は、一般的なカーナビゲーションの探索機能と音声認識機能を実現するプログラムをも有しており、図示しないGPSアンテナの受信した電波をもとに、例えば三角測量の原理で車両の位置つまりは経度と緯度を測定する。また、カーナビゲーションECU4は、CAN上から取得した車両の車速、ヨーレート、操舵角をもとにして、車両の移動距離と方向を計算して車両の位置を自律航法により測定して、GPSアンテナが衛星から電波を受信できない場合においては、車両の位置データを補完する。
カーナビゲーションECU4は、このようにして測定した車両の現在の位置と、図示しないタッチパネルによるタッチ操作によりユーザが入力した目的地、又はスピーカ3の案内音声に基づいてユーザが音声としてマイク2に発声した目的地、とを結ぶルート情報を、図示しないデータベース内の探索用の地図情報を用いてダイクストラ法等の手法により探索する。
そして、カーナビゲーションECU4は、データベース内の表示用の地図情報と、上述した方法により測定した車両の位置と、タッチパネルのタッチ操作により又はマイク2の音声入力により入力された目的地と、探索された車両の位置から目的地に到るルート情報とを併せて図示しないディスプレイに表示し、車両の現在の位置がルート情報における左折又は右折箇所、目的地に接近するとスピーカ3によりその左折又は右折箇所、目的地をユーザに対して音声で案内する案内音声を出力する。
本実施例のカーナビゲーションECU4の平滑化手段4aは、図2に示すようなMRI画像の形態である人の声道をカーナビゲーションECU4が所定のプログラムを実行することにより構成される電気回路で実現可能な物理的モデルに変換すると、図3に示すような、断面積の異なる整数個の円柱、バーベルを繋いだ音響管モデルとなることを利用して構成される。
図4に示すように、前方に障壁bがある場合には、音圧は100%反射され、障壁bが無い場合には、損失がない形で前進するものとみなして、各次数のPARCOR係数を、円柱の接続点における音響反射係数と解釈するものとすると、図4に示す音響管モデルは、図5に示すような格子型回路に置換される。図4及び図5中において、fは前方を、rは後方を、bは障壁を、mは各整数次数を、Z−1は遅延素子を、三角は乗算器を、黒丸は加算器を、rmは各次数のPARCOR係数を、Δは各次数の音響管つまり円柱の長さを、Aは円柱の断面積を示す。
図5に示す格子型回路は、要求されるひずみの平滑化度合に基づいて、図6に示すように多整数段に接続され、図6の最右の口唇で捉えられた音声信号の音声波形を、図6に示す格子型回路に入れ、左側に平滑化すると、円柱管の個数分の最左には、声門レベルでの音声波形が得られ、声門レベルでの音声波形の振幅を求めることができ、この音声信号の自己相関関数をカーナビゲーションECU4の自己相関関数算出手段4b(図6では自己相関器)が算出すると、図7に示すような変形相関関数が得られる。図7において、横軸は時間、縦軸はLPCスペクトルを示す。
図7に示した変形相関関数において、カーナビゲーションECU4の母音判定手段4cは、時間0におけるピーク値aと30ms未満の時間Tにおけるピーク値bにより定まる雑音比Pn=b/aを算出して、Pn<0.22であれば、現在のフレームは母音部であると判定し、0.22≦Pn<0.28であれば、現在のフレームは有声子音部であると判定し、Pn≧0.28であれば、現在のフレームは無声子音部であると判定する。
カーナビゲーションECU4の線形予測分析手段4dは、母音判定手段4cが、現在のフレームが母音部であると判定する場合においてのみ、線形予測分析つまりLPC分析を行い、図8に示すような、スペクトル包絡を求めて、さらに、カーナビゲーションECU4のスペクトル傾き演算手段4eは、0kHzにおけるLPCスペクトルのパワーと、5kHzにおけるLPCスペクトルのパワーの差を演算して、スペクトル傾きをフレーム毎に求める。演算手段4eは、スペクトル傾きを求めるこの演算をフレーム毎に、フレームが母音部でないと判定される、つまり、有声子音部又は無声子音部であると判定されるまでの間実行して、母音部であると判定された複数のフレーム間の平均値を演算する。
前述したように、スペクトル傾きは、ユーザすなわち発話者が老人であって加齢が進むほど小さくなる性質を有している。図9はこの性質を示す模式図である。図9は、例えば男女それぞれ数人をサンプルとして、同一人において加齢するに従い、各母音(a、i、u、e、o:図9中上から下に順番に示す)に対応する傾きがどのように変化するかを示し、横軸は年度を、縦軸は傾きを示す。横軸において右方に移動して年度が進むほど調査対象となった人が加齢することを示す。なお母音aが二つ存在するのは、同一の単語内において前後して位置する母音aの双方を示している。
図9に示すように、同一人が、同一語彙の同一音素を発生した場合において、加齢が進行すると、若年者においてはスペクトルの低域側を優位とするスペクトル傾きが、高域側の雑音のパワーが増加することに起因して小さくなることとなる。傾きの初期値が正の値であれば絶対値が小さくなり、傾きの初期値が0に近い正の値であれば、符号が負に換わり、傾きの初期値が負の値であれば絶対値が増加する。
高域側の雑音が加齢により増加する傾向を示す理由としては、同一人において加齢が進むと、声帯の振動がまず不確定となり、声帯が自由に伸縮することが困難となり、発声にあたっての振動を安定させることが困難となること等が挙げられる。また、声道の共振においても、声道を狭窄する速度が筋力及び運動神経の衰えにより低下して、規則正しく動かすことが困難となることも高域側の雑音が増加する傾向を呈する一因となる。
人が若年である場合には、このような高域側の雑音はほとんど観測されず、従って、スペクトルの強さが支配的な低域側が高域側に較べて相対的に大きくなり、スペクトル傾きは大きくなるが、人が老年になるにつれて、上述した理由によりスペクトル傾きは小さくなる。
本実施例のカーナビゲーションECU4の老若判定手段4fは、図9の母音毎の曲線から求められる母音毎のスペクトル傾きの閾値(年度を固定した場合の図9の各母音の曲線状の値(dB)、例えば1993年における値)に対して、スペクトル傾き演算手段4eにより演算されたスペクトル傾きが下回った場合には、ユーザが老人であると判定し、下回らない場合には老人でないと判定する。
以下に以上述べたカーナビゲーションECU4の制御内容を、フローチャートと図を用いて説明する。図10は、本発明に係わる老若判定装置の一実施形態の自己相関関数算出ステップ以降の制御内容を示すフローチャートである。図11は、本発明に係わる老若判定装置の一実施形態における老若判定ステップの判定結果に基づく提供サービスの一例を示す模式図である。
図10のステップS1に示すように、図6に示した格子型回路の(A)において、平滑化手段4aは、PARCOR分析により、声門レベルでの振幅を求め、ステップS2に示すように、自己相関関数算出手段4bは、図6に示した格子型回路の(B)において(A)で求めた自己相関関数(変形相関関数)を求める。
ステップS3において、母音判定手段4cは、30ms以内に存在する極大値bの初期値aに対する比、つまり、図7に示したPnを演算して、図6に示した格子型回路(C)において、Pn<0.22であれば、現在のフレームが母音部と判定し、0.22≦Pn<0.28であれば、現在のフレームが有声子音部であると判定し、0.28≦Pnであれば、現在のフレームが無声子音部であると判定する。
ステップS4において、母音判定手段4cは、ステップS3における自身の判定結果に基づいて、現在のフレームが母音であるか否かを判定し、肯定である場合にはステップS5にすすみ、否定である場合には、ステップS9にすすむ。なお、母音である場合にのみにステップS5以下の処理を実行する理由は、母音以外の有声子音、無声子音においては雑音が多いためである。
ステップS5において、線形予測分析手段4dは、LPC分析を行ってLPCパワースペクトルを求めて、ステップS6において、スペクトル傾き演算手段4eは、図8に示した、スペクトル包絡線上における周波数が0kHzの第一点と5kHzにおける第二点を結んで、図8(D)に示すパワーの下降値をスペクトル傾きとして求め保存する。
ステップS7において、母音判定手段4cは、次フレームが子音であるかを判定し、肯定である場合にはステップS8にすすみ、否定である場合には、ステップS9にすすむ。
ステップS8において、スペクトル傾き演算手段4eは、母音と判定された複数のフレームにおけるスペクトル傾きを平均した値を求め、フレームが一の場合にはステップS6で求めたペクトル傾きの値をそのまま用いる。ステップS9において、スコープするフレーム番号のアップデートを行う。
ステップS8において、スペクトル傾き演算手段4eは、母音と判定された複数のフレームにおけるスペクトル傾きを平均した値を求め、フレームが一の場合にはステップS6で求めたペクトル傾きの値をそのまま用いる。ステップS9において、スコープするフレーム番号のアップデートを行う。
ステップS1〜S9の処理は、適宜の間隔により繰り返し実行されて、本発明の老若判定方法の各ステップ、平滑化ステップ、自己相関関数算出ステップ、母音判定ステップ、線形予測分析ステップ、スペクトル傾き演算ステップ、老若判定ステップが、繰り返して実行される。
図10に示した各ステップが実行された後、ユーザの老若判定結果を用いて、ユーザが老年である場合には、より親切な繰り返し案内を丁寧な口調の音声合成で行い、ユーザが若者である場合には、若年者特有の乱暴な運転や振る舞いを抑制する意図で、警報音又は興奮を沈静化するような効果音、図11に示すような、若者だけが可聴できる高域の周波数の図11に示すようなモスキート音を、カーナビゲーションECU4の制御に基づいてスピーカ3により発生する。
また、若年者と老年者とでは、図11に示すように可聴周波数領域が異なり、老年者では可聴周波数領域が老年者よりも高域側及び低域側共に小さい範囲となるので、スピーカ3により発生する案内音声、警報音ともに、ユーザが老年者である場合には、老年者に対応した可聴周波数領域に収まる音を発生し、ユーザが若年者である場合には、若年者に対応した可聴周波数領域全般を利用した音を発生することとする。
以上述べた制御内容により実現される本実施例の老若判定装置1及び実行される老若判定方法によれば、以下のような作用効果を得ることができる。すなわち、ユーザつまり発話者が老人であれば、図6の(A)において平滑化された後の音声信号に基づくLPC分析により求められるスペクトル傾きが加齢に伴い小さくなるという性質を利用して、図9に示した予め調査により求められるマップにより、スペクトル傾きの大きさを閾値判定することにより、より安定性や正確性の高い老若判定を実行することができ、老若判定の同定率を、高めることができる。また、安定性の低いフォルマント周波数や、話速、ピッチ等のパラメータを用いることを廃することができるので、これらのパラメータを用いた判定よりも、老若判定の同定率を高めることができる。
特にフォルマント周波数は声道の長さにより定まる傾向が大きく、人の声道は一旦成人となった後はあまり変化しないことから、加齢を示すパラメータとしては必ずしも適切ではなく、正確な老若判定が困難である。さらに、フォルマント周波数の一次、二次を求めるにあたっては、演算のプログラミングのステップ数の大きくなり、カーナビゲーションECU4の処理負荷が増大し、演算速度が低下するという問題も内包していた。これに対して、本実施例の老若判定装置1及び老若判定方法によれば、より適切なパラメータとしてスペクトル傾きを用いることにより、より正確な老若判定を可能として、処理負荷を軽減し、演算速度の低下を防止することができる。
また、老若判定に用いるパラメータをスペクトル傾きとすることにより、音素音節単体ではなく、繋がりを持って連なった音声信号に基づいて老若判定を行うことができ、老若判定の安定性、確実性を高めて、同定率を高めることができる。さらに、人は加齢すると若年である場合に較べて様々な変化が生じ、一般的には声が小さくなり、声帯萎縮を発生するという傾向は有するものの、声の大小や声帯萎縮の加齢に伴う変化の傾向には個人差があり一概に定まった傾向を呈するものではない。さらに、母音判定に用いる雑音比Pnについても、格子型フィルタを通した後の音声信号に基づくものであり、量子化の分解能が高くないことから、母音判定には適切ではあるが、高域のパワーが増大することを示すパラメータとしては必ずしも適切ではない。
ところが、本実施例のスペクトル傾きは、加齢した場合に、人の声道のMRIによる断面形状の凹凸が大きくなりごつごつした形状を呈すること、発生に必要な共振周波数を得るために声道を狭窄する動作が素早くできなくなること、声道の長さ方向の狭窄点を制御することが困難となること、声道、声帯双方の柔軟性が低下すること、運動神経の電位伝達性が低下することの全てを含むパラメータであるため、個人差に係わらず、人の老若判定をより確実に実行することができる。
また、本実施例の老若判定装置1及び老若判定方法において用いられる、平滑化ステップ、自己相関関数算出ステップ、母音判定ステップ、線形予測分析ステップ、スペクトル傾き演算ステップ、老若判定ステップのうち、スペクトル傾き演算ステップと老若判定ステップ以外のステップは従来のカーナビゲーションECU4の処理ステップをそのまま用いることができるため、別途のプログラムの追加を最小限度のものとして、より簡略な処理の追加により、正確な老若判定を実行することができる。
さらに、本実施例の老若判定装置1及び老若判定方法においては、LPC分析を行った後の、圧縮されて符号化された音声信号すなわちPARCOR係数や、PARCOR係数を用いた線形予測分析に基づく音声信号のパワースペクトラムの対数の逆フーリエ変換であるLPCスペクトルつまりケプストラムを次数段毎に求めてフレーム毎の音声特徴ベクトルを算出し、各整数段の人の声門の発生する周波数の高次の高調波や、声道の共振周波数のうち高次の周波数、特にはフォルマント周波数共振を除去したスペクトル包絡に基づいて、スペクトル傾きを求めているため、例えば、FFTを実施した直後のスペクトラム包絡、又は、アナログの音声信号から求めたスペクトラム包絡をそのまま用いることに較べて、スペクトラム包絡を求めるにあたっての安定性を高めることができる。これにより、求められたスペクトル傾きを閾値判定するにあたっての判定の安定性、正確性を高めて、老若判定の同定率を高めることができる。
以上本発明の好ましい実施例について詳細に説明したが、本発明は上述した実施例に制限されることなく、本発明の範囲を逸脱することなく、上述した実施例に種々の変形および置換を加えることができる。
例えば上述した実施例においては、老若判定に用いる閾値を、図9に示した横軸の1993年度の値としたが、これはあくまで例示的なものであり、任意の年度における曲線の値を閾値とすることができる。
また、老若判定結果に基づく制御内容の変更についてもあくまで例示的なものであり、ユーザが老年者である場合には、老年者向けのラジオ番組や施設に関する情報を提供すること、ユーザが若年者である場合には、事故防止上の注意点を案内すること等、ユーザの老若判定結果に基づいて種々のサービスを提供することが可能である。
本発明は、ユーザすなわち発話者が高齢者であるか否かを判定する老若判定を行う老若判定装置及び老若判定方法に関するものであり、より適切なパラメータを選択して使用することに基づいて、より安定性及び正確性の高い老若判定を実現して、老若判定の同定率を高めることができる。さらに、本発明によれば、同定率の高い老若判定に基づいて、ユーザの老若判定結果に対応させたきめの細かいサービスの提供を実現することができるので、乗用車、トラック、バス等の様々な車両に搭載される車載機器、家庭用機器、携帯電話等の通信機器、警備用機器等の様々な分野の機器に適用して有益なものである。
1 老若判定装置
2 マイク
3 スピーカ
4 カーナビゲーションECU
4a 平滑化手段
4b 自己相関関数算出手段
4c 母音判定手段
4d 線形予測分析手段
4e スペクトル傾き演算手段
4f 老若判定手段
2 マイク
3 スピーカ
4 カーナビゲーションECU
4a 平滑化手段
4b 自己相関関数算出手段
4c 母音判定手段
4d 線形予測分析手段
4e スペクトル傾き演算手段
4f 老若判定手段
Claims (2)
- フレーム毎の音声信号を平滑化する平滑化手段と、前記平滑化された音声信号の自己相関関数を算出する自己相関関数算出手段と、前記自己相関関数に基づいて前記フレーム毎の音声信号が母音であるか否かを判定する母音判定手段と、前記母音判定手段が前記フレーム毎の音声信号が母音であると判定する場合に、当該音声信号を線形予測分析してスペクトル包絡を求める線形予測分析手段と、前記スペクトル包絡の線上の、第一周波数における第一点と、前記第一周波数よりも大きい第二周波数における第二点と、を結んで得られる直線のスペクトル傾きを演算するスペクトル傾き演算手段と、前記スペクトル傾きに基づいて前記音声信号の基となる音声の発話者の老若判定を行う老若判定手段と、を含むことを特徴とする老若判定装置。
- フレーム毎の音声信号を平滑化する平滑化ステップと、前記平滑化された音声信号の自己相関関数を算出する自己相関関数算出ステップと、前記自己相関関数に基づいて前記フレーム毎の音声信号が母音であるか否かを判定する母音判定ステップと、前記母音判定ステップにおいて前記フレーム毎の音声信号が母音であると判定された場合に、当該音声信号を線形予測分析してスペクトル包絡を求める線形予測分析ステップと、前記スペクトル包絡の線上の、第一周波数における第一点と、前記第一周波数よりも大きい第二周波数における第二点と、を結んで得られる直線のスペクトル傾きを演算するスペクトル傾き演算ステップと、前記スペクトル傾きに基づいて前記音声信号の基となる音声の発話者の老若判定を行う老若判定ステップと、を含むことを特徴とする老若判定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009036321A JP2010191250A (ja) | 2009-02-19 | 2009-02-19 | 老若判定装置、老若判定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009036321A JP2010191250A (ja) | 2009-02-19 | 2009-02-19 | 老若判定装置、老若判定方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010191250A true JP2010191250A (ja) | 2010-09-02 |
Family
ID=42817341
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009036321A Pending JP2010191250A (ja) | 2009-02-19 | 2009-02-19 | 老若判定装置、老若判定方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010191250A (ja) |
-
2009
- 2009-02-19 JP JP2009036321A patent/JP2010191250A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100870889B1 (ko) | 음신호 처리 방법, 음신호 처리 장치 및 기록 매체 | |
US8798991B2 (en) | Non-speech section detecting method and non-speech section detecting device | |
US6704711B2 (en) | System and method for modifying speech signals | |
KR100547533B1 (ko) | 음성 인식 장치 및 음성 인식 방법 | |
US8666736B2 (en) | Noise-reduction processing of speech signals | |
US8812312B2 (en) | System, method and program for speech processing | |
US20060095260A1 (en) | Method and apparatus for vocal-cord signal recognition | |
JP2014016622A (ja) | 修正離散コサイン変換音声符号化器用の帯域幅拡大方法及び装置 | |
JP2008076881A (ja) | 音声認識方法、音声認識装置及びコンピュータプログラム | |
JP4940887B2 (ja) | 音声入力支援プログラム、音声入力支援装置、音声入力支援方法 | |
JP5803125B2 (ja) | 音声による抑圧状態検出装置およびプログラム | |
US9269352B2 (en) | Speech recognition with a plurality of microphones | |
JP2000322098A (ja) | 音声認識装置 | |
JP4483450B2 (ja) | 音声案内装置、音声案内方法およびナビゲーション装置 | |
US9899039B2 (en) | Method for determining alcohol consumption, and recording medium and terminal for carrying out same | |
JP2010191250A (ja) | 老若判定装置、老若判定方法 | |
JP2010191252A (ja) | 音声認識装置、音声認識方法 | |
US20080147389A1 (en) | Method and Apparatus for Robust Speech Activity Detection | |
KR20150144636A (ko) | 이상음원 위치 추적 시스템 및 방법 | |
US9916845B2 (en) | Method for determining alcohol use by comparison of high-frequency signals in difference signal, and recording medium and device for implementing same | |
JP2011158515A (ja) | 音声認識装置および音声認識方法 | |
JP5047900B2 (ja) | 発話区間検出装置 | |
JP2010191251A (ja) | 音声認識装置、音声認識方法 | |
JP2003255971A (ja) | 音声抽出方法及びその方法を用いた音声抽出装置 | |
JP4230550B2 (ja) | 音声符号化方法及び装置、並びに音声復号化方法及び装置 |