JPH10312196A - 応答音声の音量適正化方法およびその装置 - Google Patents

応答音声の音量適正化方法およびその装置

Info

Publication number
JPH10312196A
JPH10312196A JP9280669A JP28066997A JPH10312196A JP H10312196 A JPH10312196 A JP H10312196A JP 9280669 A JP9280669 A JP 9280669A JP 28066997 A JP28066997 A JP 28066997A JP H10312196 A JPH10312196 A JP H10312196A
Authority
JP
Japan
Prior art keywords
information
parameter
parameter calculation
volume
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP9280669A
Other languages
English (en)
Inventor
Mitsuhiro Inazumi
満広 稲積
Sunao Aizawa
直 相澤
Yasunaga Miyazawa
康永 宮沢
Hiroshi Hasegawa
浩 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP9280669A priority Critical patent/JPH10312196A/ja
Publication of JPH10312196A publication Critical patent/JPH10312196A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Control Of Amplification And Gain Control (AREA)

Abstract

(57)【要約】 【課題】 使用環境下における様々な条件を考慮した適
切な音量で応答音声を出力する。 【解決手段】 複数の環境対応のパラメータ算定情報を
入力するパラメータ算定情報入力手段311.312.
・・・と、これらパラメータ算定情報の変化に対応した
出力強度を表すパラメータを算定するパラメータ算定手
段321,322,・・・と、これらパラメータ算定手
段で算定されたパラメータに基づいて音声の音量を決定
する信号を算定する音声レベル決定信号算定手段33と
を有し、それぞれのパラメータ算定情報ごとに、そのパ
ラメータ算定情報の変化に対するパラメータの関係を関
数として表し、その関数によりその時点におけるそれぞ
れのパラメータを出力強度値として求め、求められたそ
れぞれの出力強度値を積算して得られる値に基づいて応
答音声の音量を決定する信号を出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力音声を音声認
識してその認識結果に応じた応答を行う音声対話装置に
おける応答音声を使用環境に合った適切な音量とする応
答音声の音量適正化方法およびその装置に関する。
【0002】
【従来の技術】入力された音声を認識してその認識結果
に基づいて装置側から応答を発するような音声認識対話
装置においては、時刻などの使用環境に応じて、入力音
声の音量あるいは装置側からの応答音声の音量を変化さ
せることが必要となる場合がある。たとえば、時間を問
い合わせると現在の時刻を応答するような機能を有した
時計を例に取ると、深夜のきわめて静かな状況下ではで
きるだけ小さな音量で音声入力を行い、それに対して小
さな音量で応答を行うことが望ましく、また、騒音の多
い環境下では、入力音声および応答音声にある程度の音
量が必要となる。このように、環境や状況に応じて、入
力音声とそれに対する装置側からの応答の音量を変化さ
せることが必要となる。これを実現する従来の技術例と
しては、たとえば、特公昭61−46791がある。こ
の従来技術は、話者の発話する音声のレベルを検出し
て、そのレベルに応じて装置側からの応答音声の音量を
変化させるというものである。これによれば、確かに、
話者が大きな音量で音声入力を行うと、装置側から大き
な音量で応答し、逆に、話者が小さな音量で音声入力を
行うと、装置側から小さな音量で応答することが可能と
なる。
【0003】
【発明が解決しようとする課題】しかしながら、前述し
たような単純に入力音声レベルに比例した音声レベルで
の応答をなすものでは、以下に示すような様々な不合理
が生じてくる。
【0004】たとえば、話者の音声のレベルの絶対値が
同じである場合、話者と装置との距離が離れると、装置
に入力される音量は小さいものとなり、その結果、装置
側からの応答も小さな音量となるという不都合が生じ
る。つまり、話者と装置が離れた位置にある場合、話者
が大きな声で発話しても、入力音声レベルは相対的に小
さくなり、装置側からの応答は小さな音量となる。この
ように、話者と装置が離れた位置にある場合は、装置側
からはある程度大きな音量での応答が必要であるにも係
わらず、小さな音量での応答しかなされないという不都
合が生じことになる。
【0005】逆に、前述した現在の時刻を応答するよう
な時計を考えると、深夜、枕元の時計に時刻を問い合わ
せるような場合、話者と装置は至近距離にあるため、相
対的に入力音声は大きくなり、深夜にも係わらず、結果
として大きな音声で応答が返ってくることになる不都合
が生じる。
【0006】また、通常の音声認識対話装置にあって
は、入力音声の音量に比例した応答を行わなければなら
ない場面はそれほど多くはないと考えられる。すなわ
ち、入力音声の音量に比例した応答を行うようにする
と、たとえば、話者が大きな音量で音声入力すると、大
きな音量での応答が返ってくることになり、大きな音量
での会話のやりとりとなって、まるで喧嘩腰のような会
話となってしまう。
【0007】さらに、音声認識技術の実質的な問題とし
て、あまり大きな入力音声は音声特徴が大きく変化して
しまい、認識率の低下をまねく問題がある。したがっ
て、認識性能の点から考えると、必要以上に大きな声で
の入力は避けるべきである。逆に、小さな音声でのやり
とりでは、環境雑音の影響を受けやすくやすくなり、認
識性能を劣化させることになる。
【0008】以上のように、この種の音声認識対話装置
にあっては、話者の入力音声の音量に合わせた音量で応
答を行う手法では様々な問題点がある。
【0009】そこで、本発明は、装置が話者の入力音声
の音量に合わせた応答を行うのではなく、装置側で使用
環境に合わせた適切な音量での応答音声出力を行うこと
で、様々な環境に合った適切な音量での応答を可能と
し、また、話者に対して、装置側からの応答音声で示さ
れる適切な音量で発話するように誘導することをも可能
となり、使用環境に合った適切な音量での会話が可能と
なる応答音声の音量適正化方法およびその装置を実現す
ることを目的としている。
【0010】
【課題を解決するための手段】本発明の応答音声の音量
適正化方法における請求項1の発明は、入力音声を認識
してその認識結果に応じた応答音声を出力する際、応答
音声の音量を適正化する応答音声の音量適正化方法にお
いて、少なくとも1種類の環境対応のパラメータ算定情
報を入力し、その環境対応のパラメータ算定情報の変化
に対応した出力強度を表すパラメータを求めて、そのパ
ラメータにより応答音声の音量を決定する信号を算定し
て出力するようにしたことを特徴としている。
【0011】また、請求項2の発明は、請求項1の発明
において、前記環境対応のパラメータ定情報を複数種類
としたとき、それぞれの環境対応のパラメータ算定情報
ごとに、そのパラメータ算定情報の変化に対するパラメ
ータの関係を関数として表し、その関数によりその時点
におけるそれぞれのパラメータを出力強度を表す値とし
て求め、求められたそれぞれのパラメータを積算して得
られる値に基づいて応答音声の音量を決定する信号を出
力するようにしている。
【0012】そして、請求項3の発明は、請求項3の発
明において、前記複数の環境対応のパラメータ算定情報
は、時刻情報、明るさを表す情報、騒音情報、ユーザが
設定可能な音声レベル設定スイッチ情報、入力音声レベ
ル情報などであり、これらの情報の少なくとも2種類の
情報を用いるようにしている。
【0013】また、本発明の応答音声の音量適正化装置
における請求項4の発明は、入力音声を認識してその認
識結果に応じた応答音声を出力する際、応答音声の音量
を適正化する応答音声の音量適正化装置において、少な
くとも1種類の環境対応のパラメータ算定情報を入力す
るパラメータ算定情報入力手段と、このパラメータ算定
情報の変化に対応した出力強度を表すパラメータを算定
するパラメータ算定手段と、このパラメータ算定手段で
算定されたパラメータに基づいて音声の音量を決定する
信号を算定する音声レベル決定信号算定手段とを備えた
ことを特徴としている。
【0014】また、請求項5の発明は、請求項4の発明
において、前記環境対応のパラメータ算定情報を複数種
類としたとき、それぞれの環境対応のパラメータ算定情
報を入力するそれぞれのパラメータ算定情報入力手段
と、これら各パラメータ算定情報入力手段に対応して設
けられ、出力強度を表すパラメータを算定するパラメー
タ出力値算定手段と、これら各パラメータ算定手段で算
定されたパラメータに基づいて、音声の音量を決定する
信号を算定する音声レベル決定信号算定手段とを有し、
それぞれのパラメータ算定情報ごとに、そのパラメータ
算定情報の変化に対するパラメータの関係を関数として
表し、その関数によりその時点におけるそれぞれのパラ
メータを出力強度を表す値として求め、求められたそれ
ぞれのパラメータを積算して得られる値に基づいて応答
音声の音量を決定する信号を出力するようにしている。
【0015】そして、請求項6の発明は、請求項5の発
明において、前記複数のパラメータ算定情報入力手段に
入力される環境対応のパラメータ算定情報は、時刻情
報、明るさを表す情報、騒音情報、ユーザが設定可能な
音量設定スイッチ情報、入力音声レベル情報などであ
り、これらの情報の少なくとも2種類の情報を用いるよ
うにしている。
【0016】このように本発明は、少なくとも1種類の
環境対応のパラメータ算定情報を入力し、その環境対応
のパラメータ算定情報の変化に対応した出力強度を表す
パラメータを求めて、そのパラメータに基づいて応答音
声レベルを決定する信号を出力することにより、装置か
らの応答音声の音量を装置の使用環境に合った適切な音
量とすることができる。このように、本発明は、話者の
入力音声の音量に対応した音量で応答するというもので
はなく、使用環境に応じて応答音声の音量を装置側で判
断して自動的に適切な音量を決定して応答を行うように
している。
【0017】これにより、様々な環境に合った適切な音
量での応答が可能となる。また、装置側でその時点の状
況に適合した音量で応答することにより、その応答を聞
いて話者が発話する場合、装置側からの応答音声の音量
は、話者に対して適正な音量を暗に示唆することにもな
る。つまり、話者に対して入力音声の音量を適切な音量
とするように誘導することにもなり、音声認識性能の向
上も図れる。
【0018】また、前記環境対応のパラメータ算定情報
を複数種類とし、それぞれの環境対応のパラメータ算定
情報ごとに、そのパラメータ算定情報の変化に対するパ
ラメータ(出力強度を表す値)の関係を関数として表
し、その関数によりその時点におけるそれぞれの出力強
度値を求め、求められたそれぞれの出力強度値を積算し
て得られる値に基づいて応答音声の音量を決定する信号
を出力することにより、様々な状況が考慮された適切な
音量とすることができ、状況に応じた適正音量での応答
が行える。
【0019】そして、前記複数の環境対応のパラメータ
算定情報を、時刻情報、明るさを表す情報、騒音情報、
ユーザが設定可能な音声レベル設定スイッチ情報、入力
音声レベル情報などとし、れらの情報の少なくとも2種
類の情報を用いることにより、たとえば、昼間でも暗け
れば、昼寝をしている人がいる可能性を考慮して、音量
を小さくしたり、逆に、深夜でも明るければ音量をそれ
に適した音量とするというように、一義的には決められ
ない様々な条件を考慮した音量での応答が可能となる。
【0020】
【発明の実施の形態】以下、本発明の実施の形態を図面
を参照して説明する。
【0021】図1は本発明の実施の形態を説明する図で
あり、本発明における応答音声の音量適正化装置を組み
込んだ音声認識対話装置の概略的な構成図であり、大き
く分けると、音声認識部1、認識結果に基づいた応答内
容を出力する応答音声出力部2、応答音声の音量適正化
装置3から構成されている。
【0022】音声認識部1は、音声入力手段11と音声
認識処理手段12を有し、入力された音声の認識を行う
部分であるが、この音声認識部1における音声認識方法
はどのような認識手法を用いたものでもよく、その認識
方法などについては限定されものではない。
【0023】応答音声出力部2は、応答音声生成手段2
1、音声出力駆動手段22、音声出力手段23を有し、
応答音声生成手段21により、音声認識部1により認識
された結果に対応した応答内容を生成し、音声出力駆動
手段22によりその応答音声レベルを決定したのち、ス
ピーカなどの音声出力手段23から出力する。
【0024】応答音声の音量適正化装置3は、前述の音
声出力駆動手段22に対して、使用環境に応じた応答音
声の音量を決定するための信号を出力するものであり、
複数のパラメータ算定情報入力手段311,312,3
13,・・・と、これら各パラメータ算定情報入力手段
311、312、313、・・・に対応して設けられ、
音量決定信号を算定するためのパラメータとして出力強
度を表す値を算定するパラメータ算定手段321,32
2,323,・・・と、各パラメータ算定手段321,
322,323,・・・で得られたパラメータを基に応
答音声の音量を決定するための信号を算定する音声レベ
ル決定信号算定手段33から構成されている。
【0025】なお、この実施の形態では、パラメータ算
定情報として、時刻、明るさ、ユーザによる手動スイッ
チの設定の3つの情報を用い、これらのパラメータ算定
情報の変化に対応した出力強度をパラメータとして算定
し、これらのパラメータに基づいた音声レベル決定信号
を出力するものとする。したがって、前述のパラメータ
算定情報入力手段311,312,313,・・・のう
ち、パラメータ算定情報入力手段311は、一日の時刻
情報をパラメータ算定情報として入力する手段であり、
パラメータ算定情報入力手段312は、装置の設置され
ている場所の明るさを検出する光検出素子からの明るさ
を示す情報をパラメータ算定情報として入力する手段で
あり、パラメータ算定情報入力手段313は、応答音量
をたとえば、「L(低)、M(中)、H(高)」という
ように3段階の設定が可能な音量設定スイッチが装置に
設けられている場合、ユーザにより設定された「L
(低)、M(中)、H(高)」のいずれかの設定情報を
パラメータ算定情報として入力する手段である。
【0026】パラメータ算定手段321,322,32
3,・・・は、パラメータ算定情報入力手段311,3
12,313,・・・に入力されるそれぞれのパラメー
タ算定情報に基づいて、パラメータとしての出力強度値
を算定するものである。
【0027】パラメータ算定手段321は、パラメータ
算定情報入力手段311からの時刻情報に対する出力強
度値を算定する。たとえば、時刻情報を0時から24時
としたとき、それぞれの時刻に対して図2(a)に示す
ように、VL〜VHの出力強度値を得るようにする。す
なわち、図2(a)からもわかるように、日中(7時頃
から19時頃まで)は出力値は大きく、深夜には出力値
をきわめて小さくするような設定とする。
【0028】また、パラメータ算定手段322は、パラ
メータ算定情報入力手段312からの明るさを示す情報
に対する出力強度値を算定する。たとえば、周囲の明る
さを示す情報(L0〜Lmax)に対して図2(b)に示す
ようなVL〜VHの出力強度値を得るようにする。すな
わち、周囲の明るさが明るいほど出力強度値を大きくす
るような設定としている。
【0029】また、パラメータ算定手段323は、パラ
メータ算定情報入力手段313からのスイッチ設定情報
に対する出力強度値を算定する。すなわち、図2(c)
に示すように、スイッチが「L」のときは出力強度値を
きわめて小さく(VL)し、スイッチが「H」のときは
出力値を大きくし(VH)、スイッチが「M」のときは
その中間の出力値(VM)となるような設定とする。
【0030】このように、この実施の形態では、時刻、
明るさ、スイッチ設定状態の3つの要素をパラメータ算
定情報として用い、それぞれのパラメータ算定情報の状
態に応じたパラメータ(出力強度値)を得るように設定
されている。
【0031】そして、これらの出力強度値は、音声レベ
ル決定信号算定手段33に与えられ、これら3つのパラ
メータを基に音声レベル決定信号を求める。以下、この
音声レベル決定信号を求める処理について説明する。
【0032】今、n種類の出力値算定情報情報Xiがあ
り、それぞれの情報を基に計算される相対的な音声出力
強度パラメータをf(Xi)とするとき、
【0033】
【数1】
【0034】により、音声レベル決定信号Pを求める。
【0035】この(1)式は、f(X1)×f(X2)
×・・・×f(Xn)で求められるもので、ここでは、
3種類のパラメータ算定情報を用いているので、f(X
1)×f(X2)×f(X3)で求められる。つまり、
f(X1)は時刻変化に対する出力強度値、f(X2)
は明るさの変化に対する出力強度値、f(X3)はスイ
ッチの設定状態に対する出力強度値を表す関数であり、
前述したパラメータ算定手段321,322,323に
より求められる値である。そして、これらを掛け算して
得られた値を音声レベル決定信号Pとして音声出力駆動
手段21に与える。音声出力駆動手段22では、送られ
てきた音声レベル決定信号Pにより出力力音声レベルを
決定する。
【0036】たとえば、時刻情報が昼間の13時であ
り、明るさの情報が最高値Lmaxで、さらに、スイッチ
の設定が「H」となっているとすれば、これらにより得
られるパラメータ算定手段321,322,323から
のそれぞれの出力強度値はVhとなる。
【0037】そして、これらの出力強度値により、前述
の(1)式によって音声レベル決定信号Pが算定され、
この音声レベル決定信号Pにより音声出力駆動手段22
が駆動される。これにより、装置側から出力される応答
音声は音声レベル決定信号Pの値に基づく音量で出力さ
れる。
【0038】つまり、この場合、時刻情報(13時)、
明るさ情報(Lmax)、スイッチ設定状態を示す情報
(H)の3種類の情報により得られる出力強度値により
算定される音声レベル決定信号Pによって、音声出力駆
動手段22が駆動されることになり、相対的に大きな音
量での応答がなされる。
【0039】一方、時刻情報が昼間の13時であり、明
るさの情報が最高値に近いほど明るい場合でも、スイッ
チの設定が「L」となっているとすれば、パラメータ算
定手段321,322はからの出力強度値は大きな値で
あるが、パラメータ算定手段323からの出力強度値
は、きわめて小さな値となり、これにより、音声レベル
決定信号Pはパラメータ算定手段323からの出力強度
値により抑えられて小さな値となる。つまり、この場
合、時刻情報(13時)、明るさ情報(Lmax)、スイ
ッチ設定状態を示す情報(L)の3種類の情報により得
られる出力強度値により算定される比較的小さな音声レ
ベル決定信号Pによって、音声出力駆動手段22が駆動
されることになる。したがって、この場合、音声出力駆
動手段22は、応答音声を比較的小さな音量とする。
【0040】また、時刻情報が深夜の1時であり、か
つ、明るさの情報がL0と暗く、さらに、スイッチの設
定が「L」となっているとすれば、これらにより得られ
るパラメータ算定手段321,322,323からの出
力強度値は、それぞれ相対的に小さな値となり、これに
より、音声レベル決定信号Pは相対的に小さな値とな
る。つまり、この場合、時刻情報(深夜1時)、明るさ
情報(L0)、スイッチ設定状態を示す情報(L)の3
種類の情報により得られる出力強度値により算定される
相対的に小さな音声レベル決定信号Pによって、音声出
力駆動手段22が駆動されることになる。したがって、
この場合、音声出力駆動手段22は、応答音声をきわめ
て小さな音量とする。
【0041】また、時刻情報が深夜の1時であっても、
明るさの情報が明るく、さらに、スイッチの設定が
「H」となっているとすれば、パラメータ算定手段32
1からの出力強度値は小さくても、パラメータ算定手段
322,323からの出力強度値は、それぞれ相対的に
大きな値となり、これにより、音声レベル決定信号Pは
比較的大きな値となるため、装置から出力される応答音
声は比較的大きな音量となる。
【0042】以上説明したように、装置側からの応答音
声は、そのときの様々な状況が考慮された音量となる。
たとえば、前述したような、ユーザからの音声による時
刻の問い合わせに対して現在時刻を応答するような時計
を考えたとき、深夜で、且つ、室内が暗く、スイッチを
「L」としてある場合には、ユーザの問い合わせに対し
ての応答は、相対的にきわめて小さい音量での応答とす
ることができ、周囲に迷惑がかかったたりすることがな
い。一方、深夜であっても明るさの情報が大きければ、
起きている可能性があるものとして、相対的に大きな音
量での応答を行うようにする。このように、応答音声を
そのときの状況に合った適切な音量とすることができ
る。
【0043】また、この種の装置において、ユーザと装
置とで会話をやりとりするような場合、装置側からの応
答は、そのときの状況に応じた音量となるので、ユーザ
に対して入力音声の音量を適正な音量に誘導することも
可能となる。
【0044】つまり、ユーザからの問い合わせに対する
装置からの応答が、小さい音量であれば、ユーザもそれ
に合わせて小さき音声で発話し、装置側からの音声が比
較的大きければ(ただし、適正な範囲内)、ユーザもそ
れに合わせて適正な範囲内で大きな音声で発話するとい
うようなことが可能となる。これにより、使用環境下に
応じた適正な音量での会話が可能となり、しかも、適正
な音量での発話がなされることにより音声認識性能も向
上する。
【0045】なお、以上説明した実施の形態では、時
刻、明るさ、スイッチの設定状態の3つの要素をパラメ
ータ算定情報として用いたが、これに限られることな
く、周囲の騒音レベルや、話者の入力音声レベルなどを
パラメータ算定情報として加えてもよい。
【0046】この周囲の騒音レベルをパラメータ算定情
報とした場合は、騒音レベルが大きければパラメータ算
定手段からの出力強度値が大きく、騒音レベルが小さけ
ればパラメータ算定手段からの出力強度値が小さくなる
というように、騒音レベルの大きさに比例するような出
力強度値を得るようにする。また、話者の入力音声レベ
ルをパラメータ算定情報とした場合は、話者の入力音声
レベルが大きければ、パラメータ算定手段からの出力強
度値が大きく、話者の入力音声レベルが小さければパラ
メータ算定手段からの出力強度値が小さくなるというよ
うに、話者の入力音声レベルの大きさに比例するような
出力強度値を得るようにする。
【0047】また、これら各要素をすべて用いずに、必
要な要素だけを選択的に用いるようにしてもよい。
【0048】なお、以上説明した実施の形態は、本発明
の好適な実施の形態の例であるが、これに限定されるも
のではなく、本発明の要旨を逸脱しない範囲で、種々変
形実施可能である。
【0049】なお、本発明の処理を行う処理プログラム
は、フロッピィディスク、光ディスク、ハードディスク
などの記憶媒体に記憶させておくことができ、本発明
は、それらの記憶媒体をも含むものであり、また、ネッ
トワークからデータを得る形式でもよい。
【0050】
【発明の効果】以上説明したように、本発明によれば、
少なくとも1種類の環境対応のパラメータ算定情報を入
力し、その環境対応のパラメータ算定情報の変化に基づ
いたパラメータを求めて、そのパラメータにより応答音
声の音量を決定する信号を出力することにより、装置か
らの応答音声の音量を装置の使用環境に応じた適切な音
量とすることができる。このように、装置側でその時点
の状況に適合した音量で応答することにより、その応答
を聞いて話者が発話する場合、話者に対して適正な音量
を暗に示唆することにもなる。つまり、話者に対して入
力音声の音量を適切な音量とするように誘導することに
もなり、話者が適正な音量で発話することによって、話
者の発話する音声に対する認識率を大幅に向上させるこ
とも可能となる。
【0051】また、前記環境対応のパラメータ算定情報
を複数種類とし、それぞれの環境対応のパラメータ算定
情報ごとに、そのパラメータ算定情報の変化に対するパ
ラメータの関係を関数として表し、その関数によりその
時点におけるそれぞれのパラメータを求め、求められた
それぞれのパラメータを積算して得られる値に基づいて
応答音声レベルを決定する信号を出力することにより、
様々な状況が考慮された適切な音量とすることができ、
状況に応じた適正音量での応答が行える。
【0052】そして、前記複数の環境対応のパラメータ
算定情報を、時刻情報、明るさを表す情報、騒音情報、
ユーザが設定可能な音声レベル設定スイッチ情報、入力
音声レベル情報などとし、これらの情報の少なくとも2
種類の情報を用いることにより、たとえば、昼間でも暗
ければ、昼寝をしている人がいる可能性を考慮して、音
量を小さくしたり、逆に、深夜でも明るければ、それに
適した音量とするというように、その時点における状況
に応じて様々な条件が考慮された適切な音量での応答が
可能となる。
【図面の簡単な説明】
【図1】本発明の実施の形態を説明する図であり、本発
明の応答音声の音量適正化装置が適用された音声認識対
話装置の構成を説明するブロック図。
【図2】本発明の実施の形態を説明する図であり、パラ
メータ算定情報の変化に対する出力強度値の例を示す
図。
【符号の説明】
1 音声認識部 2 応答音声出力部 3 応答音声の音量適正化装置 11 音声入力手段 12 音声認識手段 21 応答音声生成手段 22 音声出力駆動手段 23 音声出力手段 311,312,・・・ パラメータ算定情報入力手段 321,322,・・・ パラメータ算定手段 33 音声レベル決定信号出力手段
───────────────────────────────────────────────────── フロントページの続き (72)発明者 長谷川 浩 長野県諏訪市大和3丁目3番5号 セイコ ーエプソン株式会社内

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 入力音声を認識してその認識結果に応じ
    た応答音声を出力する際、応答音声の音量を適正化する
    応答音声の音量適正化方法において、 少なくとも1種類の環境対応のパラメータ算定情報を入
    力し、その環境対応のパラメータ算定情報の変化に対応
    した出力強度を表すパラメータを求めて、そのパラメー
    タにより応答音声の音量を決定する信号を算定して出力
    するようにしたことを特徴とする応答音声の音量適正化
    方法。
  2. 【請求項2】 前記環境対応のパラメータ定情報を複数
    種類としたとき、それぞれの環境対応のパラメータ算定
    情報ごとに、そのパラメータ算定情報の変化に対するパ
    ラメータの関係を関数として表し、その関数によりその
    時点におけるそれぞれのパラメータを出力強度を表す値
    として求め、求められたそれぞれのパラメータを積算し
    て得られる値に基づいて応答音声の音量を決定する信号
    を出力するようにしたことを特徴とする請求項1記載の
    応答音声の音量適正化方法。
  3. 【請求項3】 前記複数の環境対応のパラメータ算定情
    報は、時刻情報、明るさを表す情報、騒音情報、ユーザ
    が設定可能な音声レベル設定スイッチ情報、入力音声レ
    ベル情報などであり、これらの情報の少なくとも2種類
    の情報を用いることを特徴とする請求項2記載の応答音
    声の音量適正化方法。
  4. 【請求項4】 入力音声を認識してその認識結果に応じ
    た応答音声を出力する際、応答音声の音量を適正化する
    応答音声の音量適正化装置において、 少なくとも1種類の環境対応のパラメータ算定情報を入
    力するパラメータ算定情報入力手段と、 このパラメータ算定情報の変化に対応した出力強度を表
    すパラメータを算定するパラメータ算定手段と、 このパラメータ算定手段で算定されたパラメータに基づ
    いて音声の音量を決定する信号を算定する音声レベル決
    定信号算定手段と、 を備えたことを特徴とする応答音声の音量適正化装置。
  5. 【請求項5】 前記環境対応のパラメータ算定情報を複
    数種類としたとき、それぞれの環境対応のパラメータ算
    定情報を入力するそれぞれのパラメータ算定情報入力手
    段と、これら各パラメータ算定情報入力手段に対応して
    設けられ、出力強度を表すパラメータを算定するパラメ
    ータ出力値算定手段と、これら各パラメータ算定手段で
    算定されたパラメータに基づいて、音声の音量を決定す
    る信号を算定する音声レベル決定信号算定手段とを有
    し、 それぞれのパラメータ算定情報ごとに、そのパラメータ
    算定情報の変化に対するパラメータの関係を関数として
    表し、その関数によりその時点におけるそれぞれのパラ
    メータを出力強度を表す値として求め、求められたそれ
    ぞれのパラメータを積算して得られる値に基づいて応答
    音声の音量を決定する信号を出力するようにしたことを
    特徴とする請求項4記載の応答音声の音量適正化装置。
  6. 【請求項6】 前記複数のパラメータ算定情報入力手段
    に入力される環境対応のパラメータ算定情報は、時刻情
    報、明るさを表す情報、騒音情報、ユーザが設定可能な
    音量設定スイッチ情報、入力音声レベル情報などであ
    り、これらの情報の少なくとも2種類の情報を用いるこ
    とを特徴とする請求項5記載の応答音声の音量適正化装
    置。
JP9280669A 1997-03-12 1997-10-14 応答音声の音量適正化方法およびその装置 Withdrawn JPH10312196A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9280669A JPH10312196A (ja) 1997-03-12 1997-10-14 応答音声の音量適正化方法およびその装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP5785597 1997-03-12
JP9-57855 1997-03-12
JP9280669A JPH10312196A (ja) 1997-03-12 1997-10-14 応答音声の音量適正化方法およびその装置

Publications (1)

Publication Number Publication Date
JPH10312196A true JPH10312196A (ja) 1998-11-24

Family

ID=26398944

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9280669A Withdrawn JPH10312196A (ja) 1997-03-12 1997-10-14 応答音声の音量適正化方法およびその装置

Country Status (1)

Country Link
JP (1) JPH10312196A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002169582A (ja) * 2000-11-29 2002-06-14 Canon Inc 音声合成装置及びその制御方法、コンピュータ可読メモリ
JP2007005853A (ja) * 2005-06-21 2007-01-11 Matsushita Electric Ind Co Ltd 音声復号装置
JP2016524190A (ja) * 2013-06-21 2016-08-12 マイクロソフト テクノロジー ライセンシング,エルエルシー 環境を認識した対話ポリシーおよび応答生成
CN111240634A (zh) * 2020-01-08 2020-06-05 百度在线网络技术(北京)有限公司 音箱工作模式调整方法和装置
JP2021006921A (ja) * 2020-09-30 2021-01-21 パイオニア株式会社 入出力装置
WO2021153101A1 (ja) * 2020-01-27 2021-08-05 ソニーグループ株式会社 情報処理装置、情報処理方法および情報処理プログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002169582A (ja) * 2000-11-29 2002-06-14 Canon Inc 音声合成装置及びその制御方法、コンピュータ可読メモリ
JP2007005853A (ja) * 2005-06-21 2007-01-11 Matsushita Electric Ind Co Ltd 音声復号装置
JP2016524190A (ja) * 2013-06-21 2016-08-12 マイクロソフト テクノロジー ライセンシング,エルエルシー 環境を認識した対話ポリシーおよび応答生成
CN111240634A (zh) * 2020-01-08 2020-06-05 百度在线网络技术(北京)有限公司 音箱工作模式调整方法和装置
WO2021153101A1 (ja) * 2020-01-27 2021-08-05 ソニーグループ株式会社 情報処理装置、情報処理方法および情報処理プログラム
JP2021006921A (ja) * 2020-09-30 2021-01-21 パイオニア株式会社 入出力装置

Similar Documents

Publication Publication Date Title
CN109166575A (zh) 智能设备的交互方法、装置、智能设备和存储介质
WO2017154282A1 (ja) 音声処理装置および音声処理方法
KR20010020875A (ko) 음성 제어 디바이스를 제어하는 방법 및 장치
JP3000999B1 (ja) 音声認識方法および音声認識装置ならびに音声認識処理プログラムを記録した記録媒体
JP2007501420A (ja) ダイアログシステムの駆動方法
JP7204804B2 (ja) スマートバックミラーのインタラクション方法、装置、電子機器及び記憶媒体
KR20010020876A (ko) 음성 제어 디바이스의 활성화를 강화시키는 방법 및 장치
CN112581960A (zh) 语音唤醒方法、装置、电子设备及可读存储介质
JPH10312196A (ja) 応答音声の音量適正化方法およびその装置
KR20050015585A (ko) 향상된 음성인식 장치 및 방법
JP2006251061A (ja) 音声対話装置および音声対話方法
WO2019058673A1 (ja) 情報処理装置、情報処理端末、情報処理方法、および、プログラム
JP2006058641A (ja) 音声認識装置
JP2000089780A (ja) 音声認識方法および音声認識装置
JP4765394B2 (ja) 音声対話装置
JP2004184803A (ja) 車両用音声認識装置
JP6759370B2 (ja) 呼出音認識装置および呼出音認識方法
JP2006251059A (ja) 音声対話装置および音声対話方法
JP3846500B2 (ja) 音声認識対話装置および音声認識対話処理方法
JP2003323196A (ja) 音声認識システム、音声認識方法および音声認識用プログラム
JP2005024869A (ja) 音声応答装置
CN116320144B (zh) 一种音频播放方法及电子设备、可读存储介质
JP3050232B2 (ja) 音声認識方法および音声認識装置ならびに音声認識処理プログラムを記録した記録媒体
JP2000069126A (ja) 迷惑電話防止機能付携帯型電話機
JP3593183B2 (ja) 音声復号装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050104