JP2001154690A - 動作制御方法およびその装置 - Google Patents

動作制御方法およびその装置

Info

Publication number
JP2001154690A
JP2001154690A JP33635799A JP33635799A JP2001154690A JP 2001154690 A JP2001154690 A JP 2001154690A JP 33635799 A JP33635799 A JP 33635799A JP 33635799 A JP33635799 A JP 33635799A JP 2001154690 A JP2001154690 A JP 2001154690A
Authority
JP
Japan
Prior art keywords
amount
unit
state
command
speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP33635799A
Other languages
English (en)
Other versions
JP3471686B2 (ja
Inventor
Nobuyuki Kunieda
伸行 國枝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP33635799A priority Critical patent/JP3471686B2/ja
Publication of JP2001154690A publication Critical patent/JP2001154690A/ja
Application granted granted Critical
Publication of JP3471686B2 publication Critical patent/JP3471686B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 入力された音声を認識し、認識結果に基づい
て動作あるいは状態が変化する動作部に対して、発話者
の希望に近い動作をするように制御する。 【解決手段】 過去の動作命令の履歴を記憶する動作履
歴記憶手段5と、動作部4の動作量あるいは状態の変化
量を決定する上で基準となる値を保存した動作量記憶手
段6を備え、動作命令決定手段3において音声認識手段
2から得た音声認識結果と動作履歴記憶手段5に記憶さ
れた動作履歴を比較し、音声認識結果が過去の動作命令
と同じ意味、あるいは反対の意味を持つ場合には、動作
量あるいは状態の変化量を通常時に比べて増減させるこ
とにより、動作部4に対して発話者の希望に近い動作命
令を出せるようする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力された音声を
認識し、認識結果をもとに動作部の動作または状態の変
化させる上で、過去の動作履歴を記憶し、発話者の希望
に近い形で動作するように制御するための動作制御方法
およびその装置に関する。
【0002】
【従来の技術】従来から、マイクロホンから入力される
音声を認識し、その認識結果に従って動作あるいは状態
が変化する装置が開発されている。 まず、入力された
音声を認識して動作する機器の例としてロボットがあ
る。人間が「前」「後ろ」「右」「左」のいずれかを発
声した場合に、ロボットがその音声を認識し、認識した
方向へ動作する。例えば、このロボットに対して「前」
と発声した場合、ロボットは前進を開始し、「止まれ」
などの言葉を認識するまで前進を続けるか、一定距離だ
け進んだ後に停止することが多い。しかし、このような
場合にはロボットを自分の思った通りの場所へ移動させ
るためには、通常多くの発声と時間を要する。
【0003】入力された音声を認識して動作する装置の
例は、コンピュータのソフトウェアにも該当するものが
多い。例えば、コンピュータのディスプレイ上に表示さ
れた図形を移動させるような場合にも、上記のロボット
と同様の性質と問題点を持つ。また、音声を認識して動
作する例としては、図形を移動させるという目的ばかり
ではなく、図形の大きさや色を変えることも可能であ
り、画像の焦点を調節したり、明るさを変えることもで
きる。このような、いわゆる音声認識によって動作ある
いは状態を変化させることができる装置の代表的な例の
一つとしてカーナビゲーション装置がある。最近、カー
ナビゲーションに音声認識機能が付加されるようにな
り、マイクに向かって音声を入力するだけで、地図の表
示範囲を変更したり、ガイド音声のボリュームを調節し
たりすることが可能となっている。
【0004】
【発明が解決しようとする課題】しかしながら、入力さ
れた音声を認識して動作あるいは状態を変化させる従来
の装置には、発声者の思い通りに制御できないという問
題点を有していた。特に、微妙な動作あるいは状態の変
化を実現するためには、多くの発声と時間を必要として
いた。 この問題点についてカーナビゲーションを例に
とって説明する。今、カーナビゲーションの表示ディス
プレイの画面上に地図が表示されており、その地図の表
示範囲を自分の望む範囲に変更したいとする。このよう
な場合、「右」、「左」、「上」、「下」と発声するこ
とによって、カーナビゲーション装置は入力された音声
を認識し、画面上の地図を上下左右にスクロールして地
図の表示範囲を変更することが可能である。しかし、一
回の発声で地図が上下左右にスクロールする量(表示さ
れた地図では距離に相当する)は一定であることが多
い。そのために、自分が希望する範囲の地図を表示する
ためには、例えば「右」「右」「右」というように同じ
内容の発声を繰り返し行わなければならず、労力を必要
とする。 一方、「右」「50メートル」というように、
方向と地図の動作量を入力することも考えられるが、こ
の場合にはどのくらいの距離を移動させればよいのかと
いう情報を必要とすると同時に、方向と動作単位の入力
を繰り返す必要があり、発声者の希望する範囲の地図を
表示するためにはやはり労力を必要とする。
【0005】本発明は、このような従来の問題を解決す
るものであり、入力された音声を認識して、動作あるい
は状態が変化する動作部を制御する際に、動作部が発話
者の希望に近い動作をするように制御することのできる
動作制御方法およびその装置を提供するものである。
【0006】
【課題を解決するための手段】上記問題を解決するため
に、本発明の動作制御方法は、入力された音声を認識し
て、動作あるいは状態が変化する動作部を制御する際
に、過去の動作命令を動作履歴として記憶し、前記入力
音声の音声認識結果が過去の動作履歴と比較して同じあ
るいは反対の意味を持つ場合に、前記動作部の動作量あ
るいは状態の変化量を変えることを特徴とするものであ
り、過去の動作履歴をもとに動作量あるいは状態の変化
量を変えることによって、音声による動作部の効率的な
制御を実現し、発話者の希望に近い動作を実現すること
ができることとなる。
【0007】また、本発明の動作制御方法は、前記入力
音声を分析して発話者の発話速度、声の大きさ、ピッ
チ、緊張状態の少なくとも一つを測定して発話状態とし
て記憶し、前記発話状態に応じて動作部の動作量あるい
は状態の変化量を変えることを特徴とするものであり、
発話者の発話速度、緊張状態、などの特徴を考慮して動
作部の効率的な制御を実現することによって、発話者の
希望に近い動作を実現することができることとなる。
【0008】また、本発明の動作制御方法は、あらかじ
め発話者ごとに、発話者が発声した動作命令を表す言葉
と動作命令として指示するための動作量あるいは状態の
変化量とを対応づけた結果を話者情報として記憶するよ
うにし、前記話者情報に従って動作部の動作量あるいは
状態の変化量を話者の特徴に合うように修正できるよう
にしたことを特徴とするものであり、発話者の発話方
法、動作の命令パターン、癖などの話者の特徴を考慮し
て、音声による動作部の効率的な制御を実現し、発話者
の希望に近い動作を実現することができることとなる。
【0009】また、本発明の動作制御方法は、前記動作
部における動作量または状態の変化量が発話者にも分か
るように出力するようにしたことを特徴とするものであ
り、発話者の特徴および発話状態を考慮して、音声によ
る動作部の効率的な制御を実現し、発話者の希望に近い
動作を実現することができることとなる。
【0010】また、本発明の動作制御方法は、入力され
た音声を認識して、動作あるいは状態が変化する複数の
動作部を制御する際に、前記複数の動作部はそれぞれの
過去の動作命令を動作履歴として記憶し、また、前記入
力音声の音声認識結果から複数の動作部のいずれを動作
させるべきなのかを判定し、前記音声認識結果が前記過
去の動作履歴と比較して同じあるいは反対の意味を持つ
場合に、動作部の動作量あるいは状態の変化量を変える
ことを特徴とするものであり、発話者の特徴および発話
状態を考慮して、音声による複数の動作部の効率的な制
御を実現し、発話者の希望に近い動作を実現することが
できることとなる。
【0011】また、本発明の動作制御装置は、音声の入
力手段と、前記入力音声を認識して結果を出力する音声
認識手段と、前記音声認識の結果から前記動作部に対し
て動作命令を出力する動作命令決定手段と、前記動作命
令決定手段から動作命令を受けて動作あるいは状態が変
化する前記動作部と、前記動作命令決定手段が出力する
過去の動作命令を動作履歴として記憶する動作履歴記憶
手段と、前記動作命令決定手段で前記動作部の動作量あ
るいは状態の変化量を決める際に基準となる動作量ある
いは状態の変化量を保存した動作量記憶手段とを、前記
動作命令決定手段では前記音声認識結果と前記動作履歴
記憶手段に記憶された内容を比較し、前記音声認識結果
が前記動作履歴に記憶された過去の動作命令と同じある
いは反対の意味を持つ場合には、前記動作量記憶手段に
記憶された内容をもとに動作量あるいは状態の変化量を
変えることを特徴とするものであり、音声による動作部
の効率的な制御を実現し、発話者の希望に近い動作を実
現することができることとなる。
【0012】また、本発明の動作制御装置は、前記入力
音声を分析して発話者の発話速度、声の大きさ、ピッ
チ、緊張状態の少なくとも一つを測定して発話者の発話
状態を判定する発話状態判定手段を更に備え、前記動作
命令決定手段では前記音声認識手段の出力および前記動
作履歴記憶手段に記憶された内容および前記動作量記憶
手段に記憶された内容および前記発話状態判定手段の出
力から動作内容を決定し、前記動作命令決定手段から出
された動作命令に従って動作あるいは状態を変化させる
ことを特徴とするものであり、発話者の発話速度、緊張
状態などの特徴を考慮して、音声による動作部の効率的
な制御を実現し、発話者の希望に近い動作を実現するこ
とができることとなる。
【0013】また、本発明の動作制御装置は、あらかじ
め発話者ごとに、発話者が発声した動作命令を表す言葉
と動作命令として指示するための動作量あるいは状態の
変化量とを対応づけた結果を記憶する話者情報記憶手段
を更に備え、前記話者情報記憶手段に記憶された結果を
もとに前記動作命令記憶手段に記憶された動作量あるい
は状態の変化量を話者の特徴に合うように修正できるよ
うにしたことを特徴とするものであり、発話者の発話方
法、動作の命令パターン、癖などの話者の特徴を考慮し
て、音声による動作部の効率的な制御を実現し、発話者
の希望に近い動作を実現することができることとなる。
【0014】また、本発明の動作制御装置は、前記動作
命令決定手段が前記動作部に対して出力した動作命令に
おける動作量または状態の変化量が発話者にも分かるよ
うに出力する動作内容出力手段を更に備えたことを特徴
とするものであり、発話者の特徴および発話状態を考慮
して、音声による動作部の効率的な制御を実現し、発話
者の希望に近い動作を実現することができることとな
る。
【0015】また、本発明の動作制御装置は、前記動作
命令決定手段と、前記動作部と、前記動作履歴記憶手段
と、前記動作量記憶手段からなる複数の動作内容決定部
を備え、更に前記音声認識手段で得られた結果を前記複
数の動作内容決定部のいずれに渡して処理すべきなのか
を、前記音声認識の結果から判定する動作対象決定手段
を備えたことを特徴とするものであり、発話者の特徴お
よび発話状態を考慮して、音声による複数の動作部の効
率的な制御を実現し、発話者の希望に近い動作を実現す
ることができることとなる。
【0016】また、本発明の動作制御装置は、前記動作
部における動作内容が、ディスプレイ画面上に表示され
た図形または画面を移動あるいは変化させることを特徴
とするものであり、音声によってディスプレイ上に表示
された図形や画面状態や設定の効率的な制御を実現し、
発話者の希望に近い動作を実現することができることと
なる。
【0017】また、本発明の動作制御装置は、前記動作
部における動作内容が、機器の可動部分のうち少なくと
も一つを動作させることを特徴とするものであり、発話
者の希望に近い動作を実現することができることとな
る。
【0018】また、本発明の動作制御装置は、前記動作
部における動作内容が、動作対象の大きさ、形状、重
量、音量、音色、色彩、光度、焦点、温度、速度、向
き、位置、角度、圧力、感情、数値のうち少なくとも一
つを制御することを特徴とするものであり、音声による
動作部の効率的な制御を実現し、発話者の希望に近い動
作を実現することができることとなる。
【0019】また、本発明の動作制御装置は、前記動作
命令決定手段において、前記音声認識手段の出力が示す
動作命令と前記動作履歴記憶手段に記憶された直前の動
作命令が同じ動作内容を示す場合に、前記動作量記憶手
段における動作量あるいは状態の変化量を大きくするよ
うに制御して動作命令を決定することを特徴とするもの
であり、音声による動作部の効率的な制御を実現し、発
話者の希望に近い動作を実現することができることとな
る。
【0020】また、本発明の動作制御装置は、前記動作
命令決定手段において、前記音声認識手段の出力が示す
動作命令と前記動作履歴記憶手段に記憶された直前の動
作命令が反対の動作内容を示す場合に、前記動作量記憶
手段における動作量あるいは状態の変化量を小さくする
ように制御して動作命令を決定することを特徴とするも
のであり、音声による動作部の効率的な制御を実現し、
発話者の希望に近い動作を実現することができることと
なる。
【0021】また、本発明の動作制御装置は、前記動作
部がナビゲーション装置における地図情報を表示するも
のであり、前記動作命令決定手段が前記動作部に表示さ
れた地図の表示範囲をスクロールさせる動作命令を出し
て制御する際に、前記動作命令が前記動作履歴記憶手段
に記憶された直前の動作内容と同じ内容を示す場合には
地図のスクロール量を大きくし、前記動作命令が前記動
作履歴記憶手段に記憶された直前の動作内容と反対の内
容を示す場合には地図のスクロール量を小さくするよう
に制御することを特徴とするものであり、音声による動
作部の効率的な制御を実現し、発話者の希望に近い動作
を実現することができることとなる。
【0022】また、本発明の動作制御装置は、前記動作
部が音を出力するものであり、前記動作命令決定手段が
前記動作部から出力される音の音量を制御する動作命令
を出して制御する際に、前記動作命令が前記動作履歴記
憶手段に記憶された直前の動作内容と同じ内容を示す場
合には音量を大きくし、前記動作命令が前記動作履歴記
憶手段に記憶された直前の動作内容と反対の内容を示す
場合には音量を小さくするように制御することを特徴と
するものであり、音声による動作部の効率的な制御を実
現し、発話者の希望に近い動作を実現することができる
こととなる。
【0023】また、本発明は、上記した動作制御方法ま
たは動作制御装置をソフトウェアで実現したプログラム
を記録した媒体であり、媒体を通じて音声による動作部
の効率的な制御を実現し、発話者の希望に近い動作を実
現することができることとなる。
【0024】
【発明の実施の形態】以下、本発明の実施の形態につい
て、図1から図9を用いて説明する。 (実施の形態1)本発明の実施の形態1は、請求項1に
記載の動作制御方法および請求項6に記載の動作制御装
置に対応する。図1は本実施の形態1における動作制御
装置の構成を示したものであり、音声入力手段1と、入
力された音声を認識する音声認識手段2と、音声認識手
段2の結果から動作部4に対して動作命令を出す動作命
令決定手段3と、動作命令決定手段3から動作命令を受
けて動作あるいは状態が変化する動作部4と、動作命令
決定手段3が出した過去の動作命令を動作履歴として記
憶する動作履歴記憶手段5と、動作命令決定手段3で動
作部4の動作量あるいは状態の変化量を決める際に基準
となる動作量あるいは状態の変化量を保存した動作量記
憶手段6とを備えている。
【0025】次に本実施の形態の動作について説明す
る。音声信号は、音声入力手段1を通して入力され音声
認識手段2に渡される。音声認識手段2では、入力され
た声を認識し、発声された言葉が何を意味するのか判定
し、結果を動作命令決定手段3に渡す。動作命令決定手
段3では、音声認識手段2から渡された音声認識結果と
動作履歴記憶手段5に記憶された過去の動作内容の履歴
とを比較し、音声認識結果が過去の動作命令と同じある
いは反対の意味を持つ場合には、動作量記憶手段6に記
憶された内容をもとに動作量あるいは状態の変化量を変
える決定を行い、動作部4に指示を出す。動作部4で
は、動作命令決定手段3からの指示に従って機器の動作
または状態の変更を行う。動作結果は、動作履歴記憶手
段5に記憶される。
【0026】このように本実施の形態1によれば、過去
の動作内容によって、状況に応じた動作量の変更を実現
し、その結果として、動作対象の動作または状態の変化
を音声で効率的に制御することが可能となる。
【0027】(実施の形態2)本発明の実施の形態2
は、請求項2に記載の動作制御方法および請求項7に記
載の動作制御装置に対応する。図2は本実施の形態2に
おける動作制御装置の構成を示したものであり、音声入
力手段1と、入力された音声を認識する音声認識手段2
と、音声認識手段2の結果から動作部4に対して動作命
令を出す動作命令決定手段3と、動作命令決定手段3か
ら動作命令を受けて動作あるいは状態が変化する動作部
4と、動作命令決定手段3が出した過去の動作命令を動
作履歴として記憶する動作履歴記憶手段5と、動作命令
決定手段3で動作部4の動作量あるいは状態の変化量を
決める際に基準となる動作量あるいは状態の変化量を保
存した動作量記憶手段6と、発話された音声の状態を判
定する発話状態判定手段7とを備えている。
【0028】次に本実施の形態の動作について説明す
る。基本動作は実施の形態1と同様である。音声信号
は、音声入力手段1を通して入力され、音声認識手段2
と発話状態判定手段7に渡される。音声認識手段2で
は、入力された音声を認識し、発声された言葉が何を意
味するのか判定し、結果を動作命令決定手段3に渡す。
発話状態判定手段7では、入力された音声の基本周波数
と発話速度を計算し、その結果を動作命令決定手段3に
渡す。動作命令決定手段3では、音声認識手段2から渡
された音声認識結果と発話状態判定手段7と動作記憶手
段5に記憶された過去の動作記録をもとに動作決定を行
い、動作部4に指示を出し、動作部4はそれを受けて動
作する。このとき、発話状態判定手段から得られた結果
によって、動作部4の動作速度や動作単位を変化させる
ように制御することが特徴である。
【0029】このように本実施の形態2によれば、過去
の動作内容と発話者の発話状態によって動作量を変更す
ることが可能となり、その結果として動作対象の動作ま
たは状態を音声で効率的に制御することが可能となる。
【0030】(実施の形態3)本発明の実施の形態3
は、請求項3に記載の動作制御方法および請求項8に記
載の動作制御装置に対応する。図3は本実施の形態3に
おける動作制御装置の構成を示したものであり、音声入
力手段1と、入力された音声を認識する音声認識手段2
と、音声認識手段2の結果から動作部4に対して動作命
令を出す動作命令決定手段3と、動作命令決定手段3か
ら動作命令を受けて動作あるいは状態が変化する動作部
4と、動作命令決定手段3が出した過去の動作命令を動
作履歴として記憶する動作履歴記憶手段5と、動作命令
決定手段3で動作部4の動作量あるいは状態の変化量を
決める際に基準となる動作量あるいは状態の変化量を保
存した動作量記憶手段6と、あらかじめ発話者ごとに発
話者が発声した動作命令を表す言葉と動作命令として指
示するための動作量あるいは状態の変化量とを対応づけ
た結果を記憶する話者情報記憶手段8とを備えている。
【0031】次に本実施の形態の動作について説明す
る。基本動作は実施の形態1と同様である。音声信号
は、音声入力手段1を通して入力され音声認識手段2に
渡される。音声認識手段2では、入力された音声を認識
し、発声された言葉が何を意味するのか判定し、結果を
動作命令決定手段3に渡す。また、話者情報記憶手段8
には、発話者が発声した動作命令を表す言葉と動作命令
として指示するための動作量あるいは状態の変化量とを
対応づけた結果が記憶されており、その結果を動作量記
憶手段6に渡す。動作量記憶手段6では、話者情報記憶
手段8に記憶された結果をもとに、動作量あるいは状態
の変化量を話者の特徴に合うように修正する。さらに、
動作履歴記憶手段5に保存された過去の動作内容決定結
果を動作命令決定手段3に渡す。ここで、動作決定手段
3では、音声認識手段2から渡された音声認識結果と動
作履歴記憶手段5に記憶された過去の動作記録と動作量
記憶手段6に保存された動作量をもとに動作決定を行
い、動作部4に指示を出す。動作部4では、動作命令決
定手段3からの指示に従って動作を行う。動作結果は、
動作履歴記憶手段5に記憶される。
【0032】このように本実施の形態3によれば、過去
の動作内容と発話者の特徴によって動作量を変更するこ
とが可能となり、その結果として動作対象の動作または
状態を音声で効率的に制御することが可能となる。
【0033】(実施の形態4)本発明の実施の形態4
は、請求項4に記載の動作制御方法および請求項9に記
載の動作制御装置に対応する。図4は本実施の形態4に
おける動作制御装置の構成を示したものであり、音声入
力手段1と、入力された音声を認識する音声認識手段2
と、音声認識手段2の結果から動作部4に対して動作命
令を出す動作命令決定手段3と、動作命令決定手段3か
ら動作命令を受けて動作あるいは状態が変化する動作部
4と、動作命令決定手段3が出した過去の動作命令を動
作履歴として記憶する動作履歴記憶手段5と、動作命令
決定手段3で動作部4の動作量あるいは状態の変化量を
決める際に基準となる動作量あるいは状態の変化量を保
存した動作量記憶手段6と、発話された音声の状態を判
定する発話状態判定手段7と、あらかじめ発話者ごとに
発話者が発声した動作命令を表す言葉と動作命令として
指示するための動作量あるいは状態の変化量とを対応づ
けた結果を記憶する話者情報記憶手段8と、動作命令決
定手段3が動作部4に対して出力した動作命令における
動作量または状態の変化量が発話者にも分かるるように
出力する動作内容出力手段9とを備えている。
【0034】次に本実施の形態の動作について説明す
る。基本動作は実施の形態1と同様である。音声信号
は、音声入力手段1を通して入力され音声認識手段2と
発話状態判定手段7に渡される。音声認識手段2では、
入力された音声を認識し、発声された言葉が何を意味す
るのか判定し、結果を動作命令決定手段3に渡す。発話
状態判定手段7では、入力された音声の基本周波数と発
話速度を計算し、その結果を動作命令決定手段3に渡
す。また、発話者の特徴を記憶しておく話者情報記憶手
段8には、発話者の希望する動作量などが保存されてお
り、それを動作命令決定手段3に渡す。さらに、動作履
歴記憶手段5に保存された過去の動作命令を動作命令決
定手段3に渡す。動作命令決定手段3では、音声認識手
段2から渡された音声認識結果と動作履歴記憶手段5の
出力と動作量記憶手段6の出力と発話状態判定手段7の
出力と発話者情報記憶手段8の出力をもとに動作決定を
行い、動作部4および動作内容出力手段9に出力する。
動作部4では、動作命令決定手段3からの指示に従って
動作を行い、動作内容出力手段9では、動作命令決定手
段3が動作部4に対して出力した動作命令における動作
量または状態の変化量が発話者にも分かるるように出力
する。動作結果は、動作履歴記憶手段5に記憶される。
【0035】本実施の形態4は、このような構成にする
ことによって、過去の動作内容と発話者の特徴と発話状
態によって動作量を変更することが可能となり、また発
話者に対して動作内容を示すことができる。その結果と
して動作対象の動作または状態を音声で効率的に制御す
ることが可能となる。
【0036】(実施の形態5)本発明の実施の形態5
は、請求項5に記載の動作制御方法および請求項10に
記載の動作制御装置に対応する。図5は本実施の形態5
における動作制御装置の構成を示したものであり、音声
入力手段1と、入力された音声を認識する音声認識手段
2と、どの動作対象に対する音声入力かを判定する動作
対象決定手段10とを備え、さらに、音声認識手段2の
結果から動作部4aに対して動作命令を出す動作命令決
定手段3a、動作命令決定手段3aから動作命令を受け
て動作あるいは状態が変化する動作部4aと、動作命令
決定手段3aが出した過去の動作命令を動作履歴として
記憶する動作履歴記憶手段5aと、動作命令決定手段3
aで動作部4aの動作量あるいは状態の変化量を決める
際に基準となる動作量あるいは状態の変化量を保存した
動作量記憶手段6aとからなる動作内容決定部をn個2
0aから20nまで備えている。
【0037】次に本実施の形態の動作について説明す
る。基本動作は実施の形態1と同様である。音声信号
は、音声入力手段1を通して入力され音声認識手段2に
渡される。音声認識手段2では、入力された声を認識
し、発声された言葉が何を意味するのか判定し、結果を
動作対象決定手段10に渡す。動作対象決定手段10で
は、認識結果から複数の動作内容決定部20a、...、
20nのうちのどの動作部4a、...、4nに対するも
のであるかを判定し、認識結果を該当する動作内容決定
部20a、...、20nを選択し、認識結果を渡す。動
作対象決定手段10で選択された動作内容決定部20
a、...、20nのいずれかにおいては、動作対象決定
手段10から渡された音声認識結果と動作履歴記憶手段
5(5a、...、5n)に記憶された過去の動作履歴内
容と動作量記憶手段6(6a、...、6n)に記憶され
た動作量あるいは状態の変化量をもとに動作内容を決定
し、動作部4(4a、...、4n)に指示を出す。動作
部4(4a、...、4n)では、動作命令決定手段3
(3a、...、3n)からの指示に従って機器の動作ま
たは状態の変更を行う。動作結果は、動作履歴記憶手段
5(5a、...、5n)に記憶される。
【0038】このように本実施の形態5によれば、複数
の動作対象それぞれについて過去の動作内容によって動
作単位を変更することが可能となり、その結果として複
数の動作対象の動作または状態を音声で効率的に制御す
ることが可能となる。
【0039】(実施の形態6)本発明の実施の形態6
は、請求項11から16に対応するものである。本実施
の形態における動作制御装置の構成は、図1に示した実
施の形態1と同様であるため、ここでの説明は省略す
る。
【0040】次に本実施の形態の動作について、通常の
ナビゲーション装置のディスプレイ部分を動作部とする
場合を例にして説明する。基本動作は実施の形態1と同
様である。図6は従来におけるカーナビゲーションの動
作部である地図を表示するディスプレイを図示したもの
である。この地図の表示範囲をマイクロホンから入力さ
れた音声を認識して左右上下に動作させる動作制御方法
を考える。今、初期画面の地図には表示されていない
が、この地図の右方向に駅があり、その駅を画面中央に
表示させることを考える。従来法では駅が表示されるま
で「右」、「右」、「右」と発声することによって、そ
の度に画面が右方向へスクロールされるが、そのスクロ
ールの幅は均一(この例では50メートルとしている)で
あり、距離が離れている場合には何回も「右」と発声し
なければならない。
【0041】一方、本実施の形態においては、前記音声
認識手段2の出力が示す動作命令と前記動作履歴記憶手
段5に記憶された直前の動作命令が同じ動作内容を示す
場合には、前記動作命令決定手段3が、前記動作量記憶
手段6における動作量あるいは状態の変化量を大きくす
るように制御し、反対の動作内容を示す場合には、変化
量を小さくするように制御して、前記動作部4に対する
動作命令を決定する。従って、図7に示すように、はじ
めに「右」と発声した場合には、あらかじめ設定された
距離(この例では50メートル)だけ右へスクロールされ
るが、次にまた「右」と発声された場合、直前に発声さ
れた「右」と同じ動作をするように判定されるが、図8
に示すように、直前と同一内容の動作を指示する発声だ
った場合には動作単位を2倍とし、スクロールされる地
図の幅は50メートルの2倍の100メートルとして動作内
容を決定する。さらに、「右」と発声された場合には、
スクロールされる地図の幅がさらに2倍の200メートル
となり、地図の移動範囲が大きくなるように構成されて
いる。
【0042】図9は本実施の形態における別の動作例を
示したものである。上記動作例と同様に、初期画面の地
図には表示されていないが、この地図の右方向に駅があ
り、その駅を画面中央に表示させることを考えた場合の
例を示したものである。はじめに「右」と入力された場
合、あらかじめ設定された距離50メートルだけ右へスク
ロールする。次も「右」と発声された場合、直前に発声
された「右」と同じ内容の動作をするように判定され、
スクロールされる地図の幅は50メートルの2倍の100メ
ートルだけ右へスクロールされる。さらに「右」と発声
された場合、直前に発声された「右」と同じ内容の動作
をするように判定され、スクロールされる地図の幅は10
0メートルの2倍の200メートルだけ右へスクロールされ
る。次に「左」と発声されると、直前に発声された
「右」と反対内容の動作をするように判定され、スクロ
ールされる地図の幅は、直前のスクロール量200メート
ルの半分の100メートルだけスクロールされる。
【0043】本実施の形態6は、このように、発声した
内容とその前に発声された内容が同じである場合には、
発声者の思った位置から大きく離れていると判断し、移
動距離を大きくなるように動作させる。また、発声した
内容とその前に発声された内容が反対である場合には、
発声者の思った位置から少し離れていると判断し、移動
距離を小さくなるように動作させる。その結果として、
動作対象の動作または状態の変化を音声で効率的に制御
し、発話者の希望に近い動作を実現することを可能にす
る。なお、本実施の形態では、直前に発声された内容と
同じ内容の発声の場合には動作量を2倍、反対の意味の
場合には0.5倍にするというように設定した例を示して
いるが、これらの数値は一例にすぎない。
【0044】(実施の形態7)本発明の実施の形態7
は、請求項17に対応するものである。本実施の形態に
おける動作制御装置の構成は、図5に示した実施の形態
5と同様であるため、ここでの説明は省略する。
【0045】次に本実施の形態の動作について、通常の
ナビゲーション装置のディスプレイ部分とラジオ部分を
動作部とする場合を例にして説明する。基本動作は実施
の形態5と同様である。図10は本実施の形態における
カーナビゲーションの動作部である地図を表示するディ
スプレイを図示したものである。ディスプレイ上の地図
の表示範囲とラジオの操作をマイクロホンから入力され
た音声を認識して動作させる動作制御方法を考える。初
めに「右」と入力された場合、ナビゲーション装置は、
これが「画面上の地図のスクロール」を指示する言葉で
あると判断し、ディスプレイ上の地図の表示範囲をあら
かじめ設定された距離50メートルだけ右へスクロールす
る。次に「ラジオオン」と発声された場合、ナビゲーシ
ョン装置は、これが「ラジオをオンにする」ことを指示
する言葉であると判断し、ラジオをオンにする。そして
「ボリューム大きく」と発声された場合、ナビゲーショ
ン装置は、これが「ラジオの音量調整」を指示する言葉
であると判断し、ラジオの音量をあらかじめ設定された
1.2倍にする。さらに直前に発声された内容と同じ「ボ
リューム大きく」と発声された場合、ナビゲーション装
置は、これが「ラジオの音量調整」を指示する言葉であ
ると判断すると同時に、直前に発声された内容と同じで
あると判断し、ラジオの音量の変化量を通常よりも大き
い1.7倍にする。
【0046】このように本実施の形態7によれば、複数
の動作部を持つ装置についても、過去の動作内容によっ
て、状況に応じた動作量の変更を実現することができ
る。その結果として、動作対象の動作または状態の変化
を音声で効率的に制御し、発話者の希望に近い動作を実
現することが可能となる。なお、本実施の形態で示した
地図のスクロール量50メートル、ボリュームの変化量1.
2倍、1.7倍という数値は一例にすぎない。
【0047】
【発明の効果】以上のように本発明は、入力された音声
を認識して、動作あるいは状態が変化する動作部を制御
するための動作制御方法およびその装置であって、過去
の動作命令を動作履歴として記憶するとともに、動作命
令を決定する際に基準となる動作量あるいは状態の変化
量を保存することにより、過去の動作履歴によって動作
量を変化させることができ、発話者の希望に近い動作を
実現することができるという効果を有する。
【図面の簡単な説明】
【図1】本発明の実施の形態1における動作制御装置の
構成を示すブロック図
【図2】本発明の実施の形態2における動作制御装置の
構成を示すブロック図
【図3】本発明の実施の形態3における動作制御装置の
構成を示すブロック図
【図4】本発明の実施の形態4における動作制御装置の
構成を示すブロック図
【図5】本発明の実施の形態5における動作制御装置の
構成を示すブロック図
【図6】本発明の実施の形態6における音声認識によっ
て画面スクロールを行うときの従来例の様子を示す模式
【図7】本発明の実施の形態6における音声認識によっ
て画面スクロールを行うときの様子を示す模式図
【図8】本発明の実施の形態6における動作量記憶手段
に記憶された内容の一覧図
【図9】本発明の実施の形態6における音声認識によっ
て画面スクロールを行うときの別の様子を示す模式図
【図10】本発明の実施の形態7における音声認識によ
って画面スクロールおよびラジオのボリューム調整を行
うときの様子を示す模式図
【符号の説明】 1 音声入力手段 2 音声認識手段 3 動作命令決定手段 4 動作部 5 動作履歴記憶手段 6 動作量記憶手段 7 発話状態判定手段 8 話者情報記憶手段 9 動作内容出力手段 10 動作対象決定手段 20 動作内容決定部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) // G10L 101:065 G10L 3/00 551Q

Claims (18)

    【特許請求の範囲】
  1. 【請求項1】 入力された音声を認識して、動作あるい
    は状態が変化する動作部を制御する際に、過去の動作命
    令を動作履歴として記憶し、前記入力音声の音声認識結
    果が過去の動作履歴と比較して同じあるいは反対の意味
    を持つ場合に、前記動作部の動作量あるいは状態の変化
    量を変えることを特徴とする動作制御方法。
  2. 【請求項2】 前記入力音声を分析して発話者の発話速
    度、声の大きさ、ピッチ、緊張状態の少なくとも一つを
    測定して発話状態として記憶し、前記発話状態に応じて
    動作部の動作量あるいは状態の変化量を変えることを特
    徴とする請求項1記載の動作制御方法。
  3. 【請求項3】 あらかじめ発話者ごとに、発話者が発声
    した動作命令を表す言葉と動作命令として指示するため
    の動作量あるいは状態の変化量とを対応づけた結果を話
    者情報として記憶するようにし、前記話者情報に従って
    動作部の動作量あるいは状態の変化量を話者の特徴に合
    うように修正できるようにしたことを特徴とする請求項
    1記載の動作制御方法。
  4. 【請求項4】 前記動作部における動作量または状態の
    変化量が発話者にも分かるように出力するようにしたこ
    とを特徴とする請求項1から3のいずれかに記載の動作
    制御方法。
  5. 【請求項5】 入力された音声を認識して、動作あるい
    は状態が変化する複数の動作部を制御する際に、前記複
    数の動作部はそれぞれの過去の動作命令を動作履歴とし
    て記憶し、また、前記入力音声の音声認識結果から複数
    の動作部のいずれを動作させるべきなのかを判定し、前
    記音声認識結果が前記過去の動作履歴と比較して同じあ
    るいは反対の意味を持つ場合に、動作部の動作量あるい
    は状態の変化量を変えることを特徴とする請求項1から
    4のいずれかに記載の動作制御方法。
  6. 【請求項6】 音声の入力手段と、前記入力音声を認識
    して結果を出力する音声認識手段と、前記音声認識の結
    果から前記動作部に対して動作命令を出力する動作命令
    決定手段と、前記動作命令決定手段から動作命令を受け
    て動作あるいは状態が変化する前記動作部と、前記動作
    命令決定手段が出力する過去の動作命令を動作履歴とし
    て記憶する動作履歴記憶手段と、前記動作命令決定手段
    で前記動作部の動作量あるいは状態の変化量を決める際
    に基準となる動作量あるいは状態の変化量を保存した動
    作量記憶手段とを備え、前記動作命令決定手段では前記
    音声認識結果と前記動作履歴記憶手段に記憶された内容
    を比較し、前記音声認識結果が前記動作履歴に記憶され
    た過去の動作命令と同じあるいは反対の意味を持つ場合
    には、前記動作量記憶手段に記憶された内容をもとに動
    作量あるいは状態の変化量を変えることを特徴とする動
    作制御装置。
  7. 【請求項7】 前記入力音声を分析して発話者の発話速
    度、声の大きさ、ピッチ、緊張状態の少なくとも一つを
    測定して発話者の発話状態を判定する発話状態判定手段
    を更に備え、前記動作命令決定手段では前記音声認識手
    段の出力および前記動作履歴記憶手段に記憶された内容
    および前記動作量記憶手段に記憶された内容および前記
    発話状態判定手段の出力から動作内容を決定し、前記動
    作命令決定手段から出された動作命令に従って動作ある
    いは状態を変化させることを特徴とする請求項6記載の
    動作制御装置。
  8. 【請求項8】 あらかじめ発話者ごとに、発話者が発声
    した動作命令を表す言葉と動作命令として指示するため
    の動作量あるいは状態の変化量とを対応づけた結果を記
    憶する話者情報記憶手段を更に備え、前記話者情報記憶
    手段に記憶された結果をもとに前記動作命令記憶手段に
    記憶された動作量あるいは状態の変化量を話者の特徴に
    合うように修正できるようにしたことを特徴とする請求
    項6または7記載の動作制御装置。
  9. 【請求項9】 前記動作命令決定手段が前記動作部に対
    して出力した動作命令における動作量または状態の変化
    量が発話者にも分かるように出力する動作内容出力手段
    を更に備えたことを特徴とする請求項6から8のいずれ
    かに記載の動作制御装置。
  10. 【請求項10】 前記動作命令決定手段と、前記動作部
    と、前記動作履歴記憶手段と、前記動作量記憶手段から
    なる複数の動作内容決定部を備え、更に前記音声認識手
    段で得られた結果を前記複数の動作内容決定部のいずれ
    に渡して処理すべきなのかを、前記音声認識の結果から
    判定する動作対象決定手段を備えたことを特徴とする請
    求項6から9のいずれかに記載の動作制御装置。
  11. 【請求項11】 前記動作部における動作内容が、ディ
    スプレイ画面上に表示された図形または画面を移動ある
    いは変化させることを特徴とする請求項6から10のい
    ずれかに記載の動作制御装置。
  12. 【請求項12】 前記動作部における動作内容が、機器
    の可動部分のうち少なくとも一つを動作させることを特
    徴とする請求項6から11のいずれかに記載の動作制御
    装置。
  13. 【請求項13】 前記動作部における動作内容が、動作
    対象の大きさ、形状、重量、音量、音色、色彩、光度、
    焦点、温度、速度、向き、位置、角度、圧力、感情、数
    値のうち少なくとも一つを制御することを特徴とする請
    求項6から12のいずれかに記載の動作制御装置。
  14. 【請求項14】 前記動作命令決定手段において、前記
    音声認識手段の出力が示す動作命令と前記動作履歴記憶
    手段に記憶された直前の動作命令が同じ動作内容を示す
    場合に、前記動作量記憶手段における動作量あるいは状
    態の変化量を大きくするように制御して動作命令を決定
    することを特徴とする請求項6から13のいずれかに記
    載の動作制御装置。
  15. 【請求項15】 前記動作命令決定手段において、前記
    音声認識手段の出力が示す動作命令と前記動作履歴記憶
    手段に記憶された直前の動作命令が反対の動作内容を示
    す場合に、前記動作量記憶手段における動作量あるいは
    状態の変化量を小さくするように制御して動作命令を決
    定することを特徴とする請求項6から14のいずれかに
    記載の動作制御装置。
  16. 【請求項16】 前記動作部がナビゲーション装置にお
    ける地図情報を表示するものであり、前記動作命令決定
    手段が前記動作部に表示された地図の表示範囲をスクロ
    ールさせる動作命令を出して制御する際に、前記動作命
    令が前記動作履歴記憶手段に記憶された直前の動作内容
    と同じ内容を示す場合には地図のスクロール量を大きく
    し、前記動作命令が前記動作履歴記憶手段に記憶された
    直前の動作内容と反対の内容を示す場合には地図のスク
    ロール量を小さくするように制御することを特徴とする
    請求項6から15のいずれかに記載の動作制御装置。
  17. 【請求項17】 前記動作部が音を出力するものであ
    り、前記動作命令決定手段が前記動作部から出力される
    音の音量を制御する動作命令を出して制御する際に、前
    記動作命令が前記動作履歴記憶手段に記憶された直前の
    動作内容と同じ内容を示す場合には音量を大きくし、前
    記動作命令が前記動作履歴記憶手段に記憶された直前の
    動作内容と反対の内容を示す場合には音量を小さくする
    ように制御することを特徴とする請求項6から16のい
    ずれかに記載の動作制御装置。
  18. 【請求項18】 請求項1から17のいずれかに記載の
    動作制御方法または動作制御装置をソフトウェアで実現
    したプログラムを記録した媒体。
JP33635799A 1999-11-26 1999-11-26 動作制御方法およびその装置 Expired - Fee Related JP3471686B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP33635799A JP3471686B2 (ja) 1999-11-26 1999-11-26 動作制御方法およびその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP33635799A JP3471686B2 (ja) 1999-11-26 1999-11-26 動作制御方法およびその装置

Publications (2)

Publication Number Publication Date
JP2001154690A true JP2001154690A (ja) 2001-06-08
JP3471686B2 JP3471686B2 (ja) 2003-12-02

Family

ID=18298303

Family Applications (1)

Application Number Title Priority Date Filing Date
JP33635799A Expired - Fee Related JP3471686B2 (ja) 1999-11-26 1999-11-26 動作制御方法およびその装置

Country Status (1)

Country Link
JP (1) JP3471686B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140094330A (ko) * 2013-01-22 2014-07-30 삼성전자주식회사 전자장치 및 그 음성 처리 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140094330A (ko) * 2013-01-22 2014-07-30 삼성전자주식회사 전자장치 및 그 음성 처리 방법
KR102112742B1 (ko) * 2013-01-22 2020-05-19 삼성전자주식회사 전자장치 및 그 음성 처리 방법

Also Published As

Publication number Publication date
JP3471686B2 (ja) 2003-12-02

Similar Documents

Publication Publication Date Title
US8975500B2 (en) Music data display control apparatus and method
JP3943492B2 (ja) ディクテーションとコマンドの区別を向上させる方法
JP4304952B2 (ja) 車載制御装置、並びにその操作説明方法をコンピュータに実行させるプログラム
CN111868824A (zh) 智能设备的情境感知控制
TWI471855B (zh) 語音合成資訊編輯裝置、儲存媒體及方法
EP1768103A1 (en) Device in which selection is activated by voice and method in which selection is activated by voice
JP6507579B2 (ja) 音声合成方法
US20180018957A1 (en) Sound control device, sound control method, and sound control program
JP3842497B2 (ja) 音声処理装置
US7457752B2 (en) Method and apparatus for controlling the operation of an emotion synthesizing device
JP2001154690A (ja) 動作制御方法およびその装置
JPH10326176A (ja) 音声対話制御方法
JP2001296891A (ja) 音声認識方法および装置
US11437016B2 (en) Information processing method, information processing device, and program
JP2016157097A (ja) 音読評価装置、音読評価方法、及びプログラム
JP3744161B2 (ja) 音声指示装置および音声指示情報記憶媒体
JPH07319383A (ja) 地図表示装置
JP2009104025A (ja) 音声認識制御装置
JPH07168691A (ja) 表示図形領域選択方式
JP2002287785A (ja) 音声セグメンテーション装置及びその方法並びにその制御プログラム
JP2000250587A (ja) 音声認識装置及び音声認識翻訳装置
JP2021018551A (ja) 情報装置、自動設定方法及び自動設定プログラム
WO2021085193A1 (ja) 情報処理装置、及びコマンド処理方法
JPH05158618A (ja) カーソル制御装置
JP5552797B2 (ja) 音声合成装置および音声合成方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080912

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080912

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090912

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090912

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100912

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110912

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120912

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130912

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees