JPH1055194A

JPH1055194A - 音声制御装置と音声制御方法

Info

Publication number: JPH1055194A
Application number: JP8210196A
Authority: JP
Inventors: Shoji Takeda; 昭二武田; Hideto Yamamoto; 英人山本
Original assignee: Sanyo Electric Co Ltd
Current assignee: Sanyo Electric Co Ltd
Priority date: 1996-08-08
Filing date: 1996-08-08
Publication date: 1998-02-24

Abstract

(57)【要約】【課題】音声制御を行う場合に、話者の意図にあった
細かな制御ができない。話者は、人と会話する感覚で機
械に命令できない。【解決手段】話者からの音声情報に付随する状態情報
を抽出する状態情報抽出手段３を具備する。そして、人
間の状態（感情，体調等）による音声指示の変化を適格
に判断する。単なる音声命令だけでなく、その状態を加
味して出力装置をを制御する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、声により出力装置
を制御する音声制御装置に関する。本発明は、音声を入
力して、その音声の指示によって、出力装置を制御する
音声制御装置及びその音声制御方法に関する。つまり、
制御入力を声で行うマン・マシーンインターフェスとし
て使用される音声制御方法に関する。

【０００２】

【従来の技術】音声制御装置は、音声を入力し、この声
を音声認識し、この声の内容に応じて出力装置を制御し
ている。

【０００３】

【発明が解決しようとする課題】しかし、処理が画一的
であり、指令を出す人間側に感情や体調の変化がある場
合には、かならずしも人間にとって満足する結果が得ら
れないことがある。ところで、人間の感情や体調等を、
発汗量・脈拍数・体温・血圧・音声から検出し、この検
出した感情や体調に応じて、機器を制御することは、知
られている。本発明は、人間の状態（感情，体調等）も
加味した音声制御を提供するものである。

【０００４】又、本発明は、人間の状態（感情，体調
等）も加味した音声制御を簡単に実現するものである。
又、本発明は、人間の状態（感情，体調等）も加味した
音声指示を的確に行うことが出来る音声制御を提供する
ものである。

【０００５】

【課題を解決するための手段】本発明は、音声制御を行
う場合に、人間の状態（感情，体調等）も加味して音声
制御を行うことを特徴とする。本発明は、音声情報を入
力し、その音声情報に対応するコード情報を認識するコ
ード認識手段(2)と、前記音声情報に付随する話者の状
態情報を抽出する状態情報抽出手段(3,3’)と、前記コ
ード認識手段(2)の出力と前記状態情報抽出手段(3,3’)
の出力とに基づいて出力装置(5)を制御する出力制御手
段(4)とを備えたことを特徴とする。

【０００６】また、本発明は、音声情報を入力し、その
音声情報に対応するコード情報を認識するコード認識手
段(2)と、前記音声情報に付随する話者の状態情報を抽
出する状態情報抽出手段(3,3’)と、前記コード認識手
段(2)の出力と前記状態情報抽出手段(3,3’)の出力とに
基づいて、出力装置(5)で出力されるメッセージ出力の
内容を変更する出力制御手段(4)とを備えたことを特徴
とする。

【０００７】また、本発明は、入力した音声情報に対応
するコード情報を認識し、このコード情報に対応して出
力装置(5)を制御する音声制御装置の音声制御方法にお
いて、前記音声情報から話者の状態を検出し、この検出
した話者の状態と、前記コード情報とに基づいて前記出
力装置(5)を制御することを特徴とする。また、本発明
は、入力した音声情報に対応するコード情報を認識する
と共に、前記音声情報から話者の状態を検出し、この検
出した話者の状態と前記コード情報とに対応して出力装
置(5)を制御する音声制御装置の音声制御方法におい
て、話者の状態を検出出来なかった時は、直前に検出し
た状態として制御することを特徴とする。

【０００８】また、本発明は、入力した音声情報に対応
するコード情報を認識すると共に、前記音声情報から話
者の状態を検出し、この検出した話者の状態と前記コー
ド情報とに対応して出力装置(5)を制御する音声制御装
置の音声制御方法において、話者の状態を検出出来なか
った時は、平常状態として制御することを特徴とする。

【０００９】また、本発明は、入力した音声情報に対応
するコード情報を認識すると共に、前記音声情報から話
者の状態を検出し、この検出した話者の状態と前記コー
ド情報とに対応して出力装置(5)を制御する音声制御装
置の音声制御方法において、話者の状態を検出出来なか
った時は、非常状態として制御することを特徴とする。

【００１０】また、本発明は、入力した音声情報に対応
するコード情報を認識すると共に、前記音声情報から話
者の状態を検出し、この検出した話者の状態と前記コー
ド情報とに対応して出力装置(5)を制御する音声制御装
置の音声制御方法において、前記出力装置(5)で前記コ
ード情報と話者の状態とに応じて、この話者を気遣うメ
ッセージを出力することを特徴とする。

【００１１】また、本発明は、入力した音声情報に対応
するコード情報を認識すると共に、前記音声情報から話
者の状態を検出し、この検出した話者の状態と前記コー
ド情報とに対応して、出力装置(5)で話者に対してメッ
セージを出力する音声制御装置の音声制御方法におい
て、このメッセージに対する話者の反応を検出して、こ
の検出結果に応じて出力装置(5)を制御することを特徴
とする。

【００１２】

【発明の実施の形態】以下、本発明の第１実施例につい
て説明する。図１は、本発明の第１実施例の音声制御装
置を示すブロック図である。図２は、この第１実施例の
音声制御装置の処理動作を説明するための説明図であ
る。

【００１３】この図２は、通常の喋り方と怒った喋り方
での音声情報の特徴量の違いを示し、図２(ａ)は音声波
形、図２(ｂ)は音量特性、図２(ｃ)は音声ピッチ周波数
特性を示している。図１において、マイクロホン１は、
音声を電気信号に変換する。音声情報（声）をこのマイ
クロホン１から入力し、その音声情報に対応する音声コ
ード情報を、音声コード認識手段２が音声認識する。

【００１４】この認識された音声コードは、状態情報抽
出手段３及び出力制御手段４に出力される。ところで、
状態情報抽出手段３は、例えば、音声認識分野で知られ
ているＨＭＭ（HiddenMarkovModel）法と称する音声の
状態遷移の統計処理を応用して感情の種類とその値（程
度）を導き出す。この手法については、書籍「HiddenMa
rkovModelsforSpeachforRecognition」(出版：Edinburg
n University Press，著者：X.D.HUNG他，1990年)で
開示されている。

【００１５】例えば、通常の喋り方の「ｕｒｕｓａｉ」
と怒った喋り方の「ｕｒｕｓａｉ」の音声情報の特徴量
の違いを示すと、図２に示すようになる。図２の左側が
通常の喋り方での「うるさい」の音声で、その右側が怒
った喋り方での「うるさい」の音声である。ここで、右
側の波形の方が、音量が大きく、発生時間が短くなって
おり、発生速度が速く、かつ、音声ピッチ周波数が高い
ことがわかる。

【００１６】この状態情報抽出手段３の発生速度検出部
３１は、マイクロホン１から入力した音声情報の発生速
度を検出する。この状態情報抽出手段３の音声ピッチ
（音の高低）周波数検出部３２は、マイクロホン１から
入力した音声情報の音声ピッチ周波数を検出する。この
状態情報抽出手段３の音量検出部３３は、マイクロホン
１から入力した音声情報の音量を検出する。

【００１７】基準音声特徴量格納部３５は、音声分析す
る場合の基準となる音声特徴量（発生速度、音声ピッチ
周波数、音量）が記憶されている。この場合、基準音声
特徴量として、話者の音声特徴量を基準として格納する
ケ−スと、多くの人の音声特徴量の平均(標準値)を基準
として格納するケ−スとが、考えられる。この実施例の
基準音声特徴量格納部３５では、２つのメモリエリアを
持ち、本実施例では、両方に対応できるものとした。

【００１８】つまり、メモリエリアの一方に予め使用者
(話者)が普通に喋ったときの音声特徴量（発生速度、音
声ピッチ周波数、音量）を基準値として記憶できるもの
とする。そして、他方のメモリエリアには、予め多くの
人の音声特徴量の平均(標準値)を記憶しておく。そし
て、使用されるメモリエリアは、この音声制御装置と組
み合わされる出力装置又は話者（使用者）の好みに応じ
て、選択出来るようにした。

【００１９】ここで、一般的な音声特徴量（発生速度、
音声ピッチ周波数）の一般的な値について述べる。ま
ず、発生速度については、単位時間あたりに発生された
モーラ数より検出する。このモーラとは、「拍」と訳さ
れ、基本的には、かな文字と同じである。

【００２０】このモーラでは、拗音(「きゃ」「じょ」
等)、促音(「っ」)、撥音(「ん」)も１モーラと数え
る。また、このモーラでは、長音(「そうじ」の「そ
う」、「テープ」の「テー」)などは２モーラとなる。
なお、モーラ数の計測は、音声認識で一般的に使用され
ている。発生速度を「ゆっくり」、「普通」、「早口」
との３段階に大別すると、ゆっくり：７モーラ以下／秒普通：８〜１１モーラ／秒早口：１２モーラ以上／秒が一般的に感じるものである。

【００２１】また、音声ピッチは、音声信号を線形予測
分析した後の残差信号の相関から求める。この方法は、
書籍「図解、音声デバイス活用の実際」P2〜5、(中田和
男、三瓶徹共編、オーム社，1982年発行)等で公知であ
る。例えば、日本人の男性成人、女性成人、子供の平均
の音声ピッチ周波数は、日本人の男性成人の平均：１００〜１２５Ｈz 日本人の女性成人の平均：２５０〜３００Ｈz 日本人の子供の平均：１２５〜２５０Ｈz である。

【００２２】使用者が男性で、予め基準音声特徴量格納
部３５に、この使用者の音声特徴量（発生速度、音声ピ
ッチ周波数、音量）を格納する場合、この男性が標準的
であれば、音声ピッチ周波数は「１００〜１２５Ｈz」
の範囲内となり、発生速度は、「８〜１１モ−ラ／秒」
の範囲内となる。音声特徴レベル判定基準格納部３４に
は、音声特徴レベル判定基準が格納される。

【００２３】この音声特徴レベル判定基準格納部３４
は、各音声特徴レベル（発生速度レベル、音声ピッチ周
波数レベル、音量特徴レベル）を求めるためものであ
り、［発生速度レベル］と［音声ピッチ周波数レベ
ル］、［音量特徴レベル］を以下のように３段階とす
る。発生速度レベル：早口／普通／ゆっくり音声ピッチ周波数レベル：高い／普通／低い音量特徴レベル：大きい／普通／小さいつまり、音声特徴レベル判定基準格納部３４には、この
レベルに分類するための［発生速度レベル基準］と［音
声ピッチ周波数レベル基準］、［音量特徴レベル基準］
が格納されている。

【００２４】発生速度を「早口／普通／ゆっくり」の３
レベルに分類するための［発生速度レベル基準］につい
て説明する。この［発生速度レベル基準］は、入力され
た音声の発生速度と、基準音声特徴量格納部３５に格納
された標準の発生速度とを比べ、この比較から「早口／
普通／ゆっくり」の３レベルを求めるための基準であ
る。例えば、ここでは、以下のものである。

【００２５】３０％以上速ければ：早口３０％以上遅ければ：ゆっくりそれ以外であれば：普通また、音声ピッチを「高い声／普通の声／低い声」の３
レベルに分類するための［音声ピッチ周波数レベル基
準］が格納される。

【００２６】この［音声ピッチ周波数レベル基準］は、
入力された音声の音声ピッチと、基準音声特徴量格納部
３５に格納された標準の音声ピッチとを比べ、この比較
から「高い声／普通の声／低い声」の３レベルを求める
ための基準である。例えば、ここでは、以下のものであ
る。５０％以上高ければ：高い声５０％以上低ければ：低い声それ以外であれば：普通の高さの声又、音量を「大きな声／普通の声／小さい声」の３レベ
ルに分類するための［音量特徴レベル基準］が格納され
る。

【００２７】この［音量特徴レベル基準］は、入力され
た音声の音量と、基準音声特徴量格納部３５に格納され
た標準の音量とを比べ、この比較から「大きな声／普通
の声／小さい声」の３レベルを求めるための基準であ
る。例えば、ここでは、以下のものである。３ｄｂ以上高ければ：大きい声３ｄｂ以上低ければ：小さい声それ以外であれば：普通の大きさの声尚、音量の比較は、母音部分について比較している。

【００２８】このように、音声特徴レベル判定基準格納
部３４及び基準音声特徴量格納部３５に格納されている
情報と、各検出部３１，３２，３３からの出力とを基に
音声特徴レベル分析部３６で音声情報が分析される。状
態情報抽出手段３では、まず、発生速度検出部３１で音
声情報の発生速度を検出し、音声ピッチ周波数検出部３
２で音声ピッチ周波数を検出し、音量検出部３３で音量
を検出する。

【００２９】そして、音声特徴レベル分析部３６では、
発生速度検出部３１からの発生速度レベルを分析する。
具体的には、まず、検出した発生速度と基準音声特徴量
格納部３５の標準発生速度との比を求める。次に、この
発生速度比と、音声特徴レベル判定基準格納部３４の発
生速度レベル判定基準に基づいて、発生速度レベルを分
析する。

【００３０】また、音声特徴レベル分析部３６では、音
声ピッチ周波数検出部３２からの音声ピッチ周波数レベ
ルを分析する。具体的には、まず、検出した音声ピッチ
周波数と基準音声特徴量格納部３５の基準音声ピッチ周
波数との比を求める。次に、音声ピッチ周波数比と音声
特徴レベル判定基準格納部３４の音声ピッチ周波数レベ
ル判定基準に基づいて音声ピッチ周波数レベルを分析す
る。

【００３１】また、音声特徴レベル分析部３６では、音
量検出部３３からの音量特徴レベルを分析する。具体的
には、まず、検出した音量と基準音声特徴量格納部３５
の標準音量との比を求める。次に、音量比と音声特徴レ
ベル判定基準格納部３４の音量特徴レベル判定基準に基
づいて、音量特徴レベルを分析する。

【００３２】そして、感性レベル分析用知識ベース格納
部３７は、各音声特徴レベルと音声コードとによって、
感性レベルを判定するための条件（ルール）を設定して
おく。ここで、感性レベルとは、感性の種類と程度を意
味する。感性レベル分析部３８では、音声特徴レベル分
析部３６からの出力及び音声コード認識手段２からの出
力を入力し、音声コードと、発生速度レベル、音声ピッ
チ周波数レベル、音量特徴レベルから、感性レベル分析
用知識ベース格納部３７に格納されている感性レベル分
析用知識ベースに基づいて、感性レベルを分析する。

【００３３】出力制御手段４は、感性レベル分析部３８
からの出力及び音声コード認識手段２からの出力を入力
し、各種の出力装置５を制御する。出力制御手段４は、
主制御部４１及び出力制御用知識ベース格納部４２を有
している。出力制御用知識ベース格納部４２は、感性レ
ベル分析部３８からの出力及び音声コード認識手段２か
らの出力によって如何なる出力を行えばよいかを判断す
る基準を格納する条件マップを格納したものである。

【００３４】主制御部４１は、感性レベル分析部３８か
らの出力及び音声コード認識手段２からの出力を出力制
御用知識ベース格納部４２で照合した後、その条件によ
って出力装置５の制御情報を決定し、その制御情報を出
力する。出力装置５は、音声制御装置により制御される
機器であり、制御しようとする制御対象の機器（産業用
機器、民生用機器等）のオン・オフ制御または所定の特
性を変化させる制御により、出力が変化する。

【００３５】また、出力装置５は、メッセージ出力機能
を有し、そのメッセージを変更するものであってもよ
い。図３は、この第１実施例の音声制御装置の状態情報
抽出手段３が行う制御処理を示すフローチャートであ
る。まず、ステップＳ１で発生速度検出部３１で音声情
報の発生速度を検出する。

【００３６】ステップＳ２で音声ピッチ周波数検出部３
２によって音声ピッチ周波数を検出する。ステップＳ３
で音量検出部３３によって音量を検出する。ステップＳ
４で発生速度検出部３１から入力した発生速度レベルを
分析する。ここでは、検出した発生速度と基準音声特徴
量格納部３５の標準発生速度との比を求め、発生速度比
と音声特徴レベル判定基準格納部３４の発生速度レベル
判定基準に基づいて、発生速度レベルを分析する。

【００３７】また、ステップＳ５で音声ピッチ周波数検
出部３２から入力した音声ピッチ周波数レベルを分析
し、検出した音声ピッチ周波数と基準音声特徴量格納部
３５の基準音声ピッチ周波数との比を求め、音声ピッチ
周波数比と音声特徴レベル判定基準格納部３４の音声ピ
ッチ周波数レベル判定基準に基づいて音声ピッチ周波数
レベルを分析する。

【００３８】そして、ステップＳ６で音量検出部３３か
ら入力した音量特徴レベルを分析し、検出した音量と基
準音声特徴量格納部３５の標準音量との比を求め、音量
比と音声特徴レベル判定基準格納部３４の音量特徴レベ
ル判定基準に基づいて、音量特徴レベルを分析する。更
に、ステップＳ７で感性レベル分析部３８で、音声コー
ドと、発生速度レベル、音声ピッチ周波数レベル、音量
特徴レベルから、感性レベル分析用知識ベースに基づい
て、感性レベル（感性の種類と程度）を分析する。

【００３９】このように、感性レベル分析部３８では、
入力された音声コード認識手段２からの音声コードと、
音声特徴レベル分析部３６で処理された感性レベルとを
組合わせ、感性レベル分析用知識ベース格納部３７に格
納された感性レベル分析用知識ベース（条件マップ）に
基づいて、感性レベルを検出する。感性レベル分析用知
識ベース格納部３７に格納された感性分析用知識ベース
としては、予め、普通の喋り方や怒ったときの喋り方
等、感性レベルを変えて入力したときの各音声特徴レベ
ルを、この感性レベルごとにデータベースとして記憶し
ておく。

【００４０】そして、音声特徴レベル分析部３６で処理
された後、入力された音声の各音声特徴レベルが、デー
タベース内の感性レベルごとの各音声特徴レベルとを照
合し、最も一致度の高い感性レベルを検出結果とする。
次に、この音声処理装置での処理の事例について説明す
る。［事例１］

【００４１】

【表１】

【００４２】この表１の事例は、ＴＶの音量調整に使用
する最も単純な例である。ここでは、単純に、１種類の
音声特徴レベルから、感性レベルを検出している。つま
り、状態情報抽出手段３は、大声の「うるさい」が入力
されると、「不満度が大」の感性レベル情報を出力す
る。

【００４３】そして、出力制御手段４は、「不満度が
大」の「うるさい」が入力されると、出力装置の消音を
行う。また、状態情報抽出手段３は、小声の「うるさ
い」が入力されると、「不満度が小」の感性レベル情報
を出力する。そして、出力制御手段４は、「不満度が
小」の「うるさい」が入力されると、出力装置の出力音
量を下げる。

【００４４】［事例２］

【００４５】

【表２】

【００４６】この表２の事例は、ＴＶの画面の明るさ又
は照明の明るさ等の調整に使用する最も単純な例であ
る。ここでも、単純に、１種類の音声特徴レベルから、
感性レベルを検出している。つまり、状態情報抽出手段
３は、音声ピッチ周波数の高い「もっと、明るく」が入
力されると、「要望の程度大」の感性レベル情報を出力
する。

【００４７】そして、出力制御手段４は、「要望の程度
大」と「もっと、明るく」が入力されると、出力装置５
の明るさのレベルを２段上げる。また、状態情報抽出手
段３は、音声ピッチ周波数の低い「もっと、明るく」が
入力されると、「要望の程度小」の感性レベル情報を出
力する。そして、出力制御手段４は、「要望の程度小」
と「もっと、明るく」が入力されると、出力装置５の明
るさのレベルを１段上げる。

【００４８】［事例３］

【００４９】

【表３】

【００５０】この表３の事例は、リモコンカ−の速度制
御を行う単純な例である。ここでも、単純に、１種類の
音声特徴レベルから、感性レベルを検出している。つま
り、状態情報抽出手段３は、音声速度の遅い「止まれ」
が入力されると、「危機感小」の感性レベル情報を出力
する。

【００５１】そして、出力制御手段４は、「危機感小」
と「止まれ」が入力されると、出力装置５を徐々に停止
させる。また、状態情報抽出手段３は、音声速度が速い
「止まれ」が入力されると、「危機感大」の感性レベル
情報を出力する。そして、出力制御手段４は、「危機感
大」と「止まれ」が入力されると、出力装置５を緊急停
止させる。

【００５２】［事例４］

【００５３】

【表４】

【００５４】この表４の事例は、コンピュータ等の文書
処理における「ＵＮＤＯ機能（取り消し機能，元に戻す
機能）」に関する。つまり、状態情報抽出手段３は、音
声ピッチ周波数が高く、且つ、発生速度が速く、且つ、
大声の「ちがう」が入力されると、「不満度が高い」の
感性レベル情報を出力する。

【００５５】そして、出力制御手段４は、「不満度が高
い」と「ちがう」が入力されると、出力装置５におい
て、今まで処理していた動作を止め、元の状態に戻すＵ
ＮＤＯ機能を実行するとともに、「大変申し訳ありませ
ん」の録音メッセ−ジデータを音声出力する。また、状
態情報抽出手段３は、上記以外の場合の「ちがう」が入
力されると、「不満度が低い」の感性レベル情報を出力
する。

【００５６】そして、出力制御手段４は、「不満度が低
い」と「ちがう」が入力されると、出力装置５におい
て、今まで処理していた動作を止め、ＵＮＤＯ機能を実
行するとともに、画面に「申し訳ありません」の表示を
行う。このように、本実施例の音声制御装置は、音声情
報を入力し、その音声情報に対応する音声コード情報を
認識する音声コード認識手段２と、音声情報に付随する
感性情報を抽出する状態情報抽出手段３と、音声コード
認識手段２の出力と状態情報抽出手段３との出力に基づ
いて出力装置５の出力を制御する出力制御手段４とを具
備している。

【００５７】出力制御手段４は、状態情報抽出手段３か
らの出力と音声コード認識手段２の出力とに応じて如何
なる出力を行えばよいかを、出力制御知識ベース部４２
で照合した後、その照合結果である制御情報を出力装置
５に出力する。尚、上記実施例では、感性の種類として
は、不満度、要望度、危機感を述べたが、緊張度、興奮
度、冷静度等の様々なものが考えられる。

【００５８】また、抽出する感性の種類は、平常と非常
の２種類でも良い。抽出する感性の種類は、音声制御装
置と組み合わされる出力装置５の操作性・安全性・耐久
性・用途・設置場所等を考慮して、適宜設定されるもの
である。また、音声特徴のレベルを３段階としたが、本
願はこれに限定されるものではない。

【００５９】また、本実施例の出力装置５としては、テ
レビジョン、照明装置、情報処理装置の事例で説明した
が、本発明を実施する場合には、オン・オフ制御または
可変制御する機器または応答を制御する機器であればよ
く、その用途が特定されるものではない。また、音声制
御装置と出力装置とは、通常一体化されて販売される。

【００６０】また、感性レベル分析部３６での感性レベ
ルの分析及び出力制御手段４での制御情報の決定には、
ファジィ理論を用いるようにしてもよい。また、上記実
施例では、音声特徴レベル分析部３６には、発生速度検
出部３１、音声ピッチ周波数検出部３２、音量検出部３
３の出力を入力しているが、本発明を実施する場合に
は、更に、周波数成分を計測した音声スペクトル情報
（音韻「音色」）の検出を行い、その出力も使用しても
よい。

【００６１】図４を参照しつつ、本発明の第２実施例を
説明する。なお、図中、図１と同一部分には、同一符号
を付して重複説明を省略する。上記第１実施例では、音
声制御装置の特に感情による制御について説明したが、
この第２実施例は、話者の感情だけでなく、話者の状態
を検出している。ここでいう状態とは、「喉頭癌や風邪
などの体調状態」や「鼻をつまんで喋っている」や「マ
イクに口をつけて喋っている」などである。

【００６２】つまり、上記の話者の状態を検出するよう
に、感性レベル分析用知識ベース格納部に感情を検出す
るためだけなく、体調等を検出するためのデータを予め
追加格納して状態レベル分析用知識ベース格納部３７’
とする。同様に、出力制御用知識ベース格納部４２’に
は、感情に対応するだけなく、体調等にも対応するデー
タを予め追加格納する。

【００６３】図４において、音声スペクトル検出部３９
は、ある時間内の音声データをＤＦＴ（デジタルフーリ
エ変換）分析して、音声スペクトルを得ている。普通、
穏やかな話し方では、音声波形は正弦波に近く、あまり
高調波成分はない。しかし、怒鳴ったり強く言うときに
は、三角波に近くなり、高調波成分が多く含まれる。

【００６４】基準音声特徴量格納部３５’には、音声分
析する場合の基準となる音声特徴量（発生速度、音声ピ
ッチ周波数、音量、音声スペクトル）が記憶されてい
る。音声特徴レベル判定基準格納部３４’には、レベル
分類の［発生速度レベル基準］と［音声ピッチ周波数レ
ベル基準］、［音量特徴レベル基準］、［音声スペクト
ルレベル基準］が格納されている。

【００６５】音声特徴レベル分析部３６’は、検出部３
１，３２，３３，３９で得られた種々の音声特徴量と基
準音声特徴量とを比較し、この比較結果を音声特徴レベ
ル判定基準格納部３４’に格納されているレベル基準と
比較する。比較した結果を状態レベル分析３８’に送出
する。状態レベル分析３８’ではその結果を基に状態レ
ベル分析用知識ベース格納部３７’に格納されている知
識ベースに基づいて話者の状態レベル（状態と程度）を
決定する。

【００６６】出力制御手段４は、状態レベルと音声コ−
ドを基に、状態レベル分析用知識ベース格納部３７’に
格納されている知識ベース（条件マップ）に基づいて、
出力装置５への制御情報を決定する。例えば、対話型の
システムでは、話者の体調が異常であれば、状態レベル
分析部３８’でその状態を判断し、その結果を基に出力
制御手段４で応答内容や応答メッセージを変えることも
考えられる。

【００６７】例としては、話者の声「始動」が、風邪気
味の声であると状態情報抽出手段３’で検出すると、出
力制御手段４は、出力装置５を始動させる制御情報を出
力すると共に、「病気ですか？」のメッセージを画面出
力する。そして、次に、話者の声「違う」又は、他の命
令等（話者がこのメッセージを無視）が入力されると、
出力制御手段４は、通常通りに動作する。

【００６８】このときに、話者の声「ハイ」「そうだ」
「うるさい」等が、入力されると、出力制御手段４は、
出力制御用知識データベース格納部４２’で使用する条
件マップを体調不調話者用の条件マップに変更する。こ
の体調不調話者用の条件マップに変更した後に、話者の
声「業務ファイルを開け」が入力されると、出力制御手
段４は、業務ファイルを開く制御情報を出力すると共
に、、「大丈夫ですか？」のメッセージを画面出力す
る。

【００６９】また、この体調不調話者用の条件マップに
変更した後に、話者の声「ゲ−ムフィイルを開け」が入
力されると、出力制御手段４は、ゲ−ムファイルを開く
制御情報を出力せずに、「具合が悪いのだから遊んだり
しちゃダメ！」のメッセージを画面出力させる。尚、上
記実施例では、状態情報抽出手段３と音声コード認識手
段２は、別ブロックで表したが、これは、当然、一体化
してもよい。

【００７０】又、上記実施例では、状態情報抽出手段
３’は、音声が入力される度に、常に状態レベル情報を
出力するが、これは、状態レベルが変化した時だけ出力
するようにしても良い。又、抽出精度が低い時には、出
力しないようにしてもよい。また、状態レベル情報の精
度が悪い時には、前回検出した状態レベル情報を出力し
てもよい。また、状態レベル情報の精度が悪い時には、
平常の状態レベル情報を出力してもよい。また、状態レ
ベル情報の精度が悪い時には、非常の状態レベル情報を
出力してもよい。また、状態情報抽出手段３’は、常
に、音声コードと音声特徴レベルの両方により、状態レ
ベル情報を決定したが、全ての場合に、両者が必要とい
うわけでもない。同様に、出力制御手段４’，３’は、
常に、音声コードと状態レベルの両方により、制御情報
を決定したが、全ての場合において、音声コードと状態
レベルの両情報が常に必須というわけでもない。この両
情報の必要性は、音声制御装置と組み合わされる出力装
置５の操作性・安全性・耐久性・用途・設置場所等を考
慮して、適宜設定されるものである。

【００７１】

【発明の効果】本発明によれば、音声制御装置は、話者
からの音声命令に対して、額面通りの命令内容でなく、
その音声命令に含まれるニュアンスにも対応した制御が
可能となる。更に、本発明によれば、音声制御装置は、
話者からの音声命令の入力時に状態を抽出出来なくても
適切な制御を行うことが出来る。

【図面の簡単な説明】

【図１】本発明の第１実施例の音声制御装置を示すブロ
ック図である。

【図２】この第１実施例の音声制御装置の処理動作を説
明する説明図である。

【図３】第１実施例の音声制御装置の状態情報抽出手段
が行う制御処理を示すフローチャートである。

【図４】本発明の第２実施例の音声制御装置を示すブロ
ック図である。

【符号の説明】

１・・・マイクロホン、２・・・音声コード認識手段（コード認識手段）、３・・・状態情報抽出手段、３’・・状態情報抽出手段、４・・・出力制御手段、３６・・・音声特徴レベル分析部、３６’・・音声特徴レベル分析部、３７・・・感性レベル分析用知識ベース格納部、３７’・・状態レベル分析用知識ベース格納部、３８・・・感性レベル分析部、３８’・・状態レベル分析部、４１・・・主制御部、４２・・・出力制御用知識ベース格納部。４２’・・出力制御用知識ベース格納部。

Claims

【特許請求の範囲】

【請求項１】音声情報を入力し、その音声情報に対応
するコード情報を認識するコード認識手段(2)と、前記音声情報に付随する話者の状態情報を抽出する状態
情報抽出手段(3,3’)と、前記コード認識手段(2)の出力と前記状態情報抽出手段
(3,3’)の出力とに基づいて出力装置(5)を制御する出力
制御手段(4)とを備えたことを特徴とする音声制御装
置。
【請求項２】前記状態とは、話者の体調状態であるこ
とを特徴とする請求項１記載の音声制御装置。
【請求項３】前記状態とは、話者の感情状態であるこ
とを特徴とする請求項１記載の音声制御装置。
【請求項４】音声情報を入力し、その音声情報に対応
するコード情報を認識するコード認識手段(2)と、前記音声情報に付随する話者の状態情報を抽出する状態
情報抽出手段(3,3’)と、前記コード認識手段(2)の出力と前記状態情報抽出手段
(3,3’)の出力とに基づいて、出力装置(5)で出力される
メッセージ出力の内容を変更する出力制御手段(4)とを
備えたことを特徴とする音声制御装置。
【請求項５】前記出力装置は、音声メッセージ出力機
能を備えたことを特徴とする請求項４記載の音声制御装
置。
【請求項６】前記出力装置は、映像メッセージ出力機
能を備えたことを特徴とする請求項４記載の音声制御装
置。
【請求項７】入力した音声情報に対応するコード情報
を認識し、このコード情報に対応して出力装置(5)を制
御する音声制御装置の音声制御方法において、前記音声情報から話者の状態を検出し、この検出した話
者の状態と、前記コード情報とに基づいて前記出力装置
(5)を制御することを特徴とする音声制御方法。
【請求項８】入力した音声情報に対応するコード情報
を認識すると共に、前記音声情報から話者の状態を検出
し、この検出した話者の状態と前記コード情報とに対応
して出力装置(5)を制御する音声制御装置の音声制御方
法において、話者の状態を検出出来なかった時は、直前に検出した状
態として制御することを特徴とする音声制御方法。
【請求項９】入力した音声情報に対応するコード情報
を認識すると共に、前記音声情報から話者の状態を検出
し、この検出した話者の状態と前記コード情報とに対応
して出力装置(5)を制御する音声制御装置の音声制御方
法において、話者の状態を検出出来なかった時は、平常状態として制
御することを特徴とする音声制御方法。
【請求項１０】入力した音声情報に対応するコード情
報を認識すると共に、前記音声情報から話者の状態を検
出し、この検出した話者の状態と前記コード情報とに対
応して出力装置(5)を制御する音声制御装置の音声制御
方法において、話者の状態を検出出来なかった時は、非常状態として制
御することを特徴とする音声制御方法。
【請求項１１】入力した音声情報に対応するコード情
報を認識すると共に、前記音声情報から話者の状態を検
出し、この検出した話者の状態と前記コード情報とに対
応して出力装置(5)を制御する音声制御装置の音声制御
方法において、前記出力装置(5)で前記コード情報と話者の状態とに応
じて、この話者を気遣うメッセージを出力することを特
徴とする音声制御方法。
【請求項１２】入力した音声情報に対応するコード情
報を認識すると共に、前記音声情報から話者の状態を検
出し、この検出した話者の状態と前記コード情報とに対
応して、出力装置(5)で話者に対してメッセージを出力
する音声制御装置の音声制御方法において、このメッセージに対する話者の反応を検出して、この検
出結果に応じて出力装置(5)を制御することを特徴とす
る音声制御方法。