JP2004020733A - 音量調整装置、プログラムおよび記録媒体 - Google Patents
音量調整装置、プログラムおよび記録媒体 Download PDFInfo
- Publication number
- JP2004020733A JP2004020733A JP2002173064A JP2002173064A JP2004020733A JP 2004020733 A JP2004020733 A JP 2004020733A JP 2002173064 A JP2002173064 A JP 2002173064A JP 2002173064 A JP2002173064 A JP 2002173064A JP 2004020733 A JP2004020733 A JP 2004020733A
- Authority
- JP
- Japan
- Prior art keywords
- volume
- voice
- average power
- output
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【解決手段】マイクロフォン1から入力された音声(コマンド)は、平均パワー測定器2において、入力された音声の平均パワー(音量)が測定される。一方、音声メッセージ生成器4で生成された音声メッセージに対しては、そのパワーが平均パワー測定器2で測定された入力音声の平均パワーに応じて、予め定められた規則に従って自動音量調整器5で振幅変換が施され、調節された音量で音声メッセージが音声再生器7から出力される。
【選択図】 図1
Description
【発明の属する技術分野】
本発明は、音声による指示や音声ガイダンスを用いて操作するオフィス機器等に好適な、音声メッセージの再生音量を自動調節する音量調整装置、プログラムおよび記録媒体に関する。
【0002】
【従来の技術】
近年、機器の小型化や多機能化にともない、主たるマンマシンインタフェース(MMI)として、あるいは従来のMMIの補助として、音声入出力インタフェースを利用した機器が増えている。例えばオフィスにおいて音声インタフェースを使用して機器の操作をする場合、ある程度騒がしい環境であれば、機器への指示はある程度大きな声で発声しないと暗騒音の影響でうまく認識されないことがあり、音声出力もある程度の音量でないと聞き取り難くなってしまう。逆に、静かなオフィスであれば、あまり大きな音声は回りの人に迷惑を掛けてしまう。
また、利用者にとって適切な再生音量は、使用環境や外部雑音のような外的要因のみでなく、聴覚機能にも依存するものであり、年配者や難聴のような、何らかの聴覚障害を持つ利用者にとっては、たとえ静かな環境であってもある程度の再生音量が要求される場合もあり得る。音声によるメッセージは、その場の状況(使用環境や暗騒音のレベルなど)に応じた適正な音量レベルで再生されることが望ましい。このような目的を達成するため、例えば実開平7−39114号公報や特開2001−60095公報に記載されているような、外部雑音の程度に応じて再生音量を自動的に調節する技術がある。
【0003】
【発明が解決しようとする課題】
しかし、ある環境において適切な再生音量は、このような物理的な要因のみでなく、例えば「その場の雰囲気」のような社会的・慣例的な要因にも関係する場合が多い。そのような「雰囲気」を適切に判断できるのは利用者のみである。したがって、外部ノイズのような利用者が直接制御することができない要因によるものではなく、しかもボリュームつまみの調節というような明示的な操作を行うことなしに適切な音量での再生を実現するための手段が望まれる。
本発明は、上述した実情を考慮してなされたものであって、音声の入力がその場の状況と利用者の意思によって決められる適切な音量で行われることを前提に、利用者が入力した音声の音量に応じて、再生音もそれと同程度の音量となるように自動的に音量を調節することで、音量調整ダイアルなどによって明示的に再生音量の調節を行うことなしに、利用者にとって適切な音量で音声を出力するようにした音量調整装置、プログラムおよび記録媒体を提供することを目的とする。
【0004】
【課題を解決するための手段】
上記の課題を解決するために、本発明の請求項1の音量調整装置は、音声入力手段と、音声出力手段と、入力音声の平均パワーを測定する平均パワー測定手段と、出力音声の再生音量を調節する再生音量調節手段と、を備え、前記再生音量調節手段は前記音声出力手段から出力される音声の出力パワーを前記音声入力手段からの入力音声の平均パワーに応じて変化させることを特徴とする。
また、本発明の請求項2は、請求項1記載の音量調整装置において、前記再生音量調節手段は、前記入力音声の平均パワーと出力音声の平均パワーの比が、予め定められた一定の比率となるように音声の出力パワーを制御することを特徴とする。
また、本発明の請求項3は、請求項1記載の音量調整装置において、前記再生音量調節手段は、前記入力音声の平均パワーと出力音声の平均パワーの比が、予め定められた非線型関数に則する値となるように音声の出力パワーを制御することを特徴とする
また、本発明の請求項4は、コンピュータに音声入力手段からの入力音声の平均パワーを測定する機能と、前記測定した平均パワーに応じて音声メッセージの出力音声の音量を調整する機能とを実現させるためのプログラムである。
また、本発明の請求項5は、請求項4記載のプログラムにおいて、前記出力音声の音量を調整する機能は、前記入力音声の平均パワーに対応させた振幅変換テーブルを用いて実現することを特徴とする。
また、本発明の請求項6は、請求項4または5に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体である。
すなわち、音声で指示された画像形成装置等の装置は、本発明の音量調整装置によって、音声指示の平均パワーが測定され、この測定された平均パワーに応じて、装置から発せられる音声応答等の出力メッセージを好ましい音量に調整することができる。
【0005】
【発明の実施の形態】
以下、図面を参照して、本発明の実施の形態を説明する。
図1は、本発明の音量調整装置の構成を示すブロック図である。図1において、マイクロフォン1から入力された音声コマンド(指示)は、音声認識処理器3で処理され、コマンドの意味が認識される一方で、検出された音声区間(実際に音声が発話されている時間)情報と実際の入力音声データに基づき、平均パワー測定器2において、入力された音声の平均パワー(音量)が測定される。
この平均パワーPは、例えば以下の計算によって求めることができる。
【数1】
ここで、xnは検出された音声区間内の各データを、Nはその総データ個数を表している。
そして、音声指示の結果に従って何らかの動作が実行され、その動作状況や動作結果などを報告するための音声メッセージが音声メッセージ生成器4で生成される。この音声メッセージ生成器4は、任意の文音声を生成できる規則音声合成器であっても良いし、予め決められた数種類の定型文を録音しておき、その中から適切なものを選択的に再生する録音・再生器であっても良い。この際に、音声メッセージ生成器4で音声生成されるメッセージはすべてある一定のパワーP0になるように調整しておく。
音声メッセージ生成器4で生成された音声メッセージに対して、そのパワーが平均パワー測定器2で測定された入力音声の平均パワーPに応じて、予め定められた規則に従って自動音量調整器5で振幅変換を行う。自動音量調整器5は音声メッセージ生成器4がアナログ信号を生成している場合は電子ボリュウムの様な可変抵抗器を用いれば良く、デジタル信号を生成している場合は、後述する様に振幅を示す数値に係数を乗ずることで容易に振幅(音量)を変えることができる。
手動音量調整器6は、音声再生器7(増幅器+スピーカ)の再生特性を考慮して、実際に入力音声と再生音声が人間の聴感上同程度のレベルとみなすことができるように音量を調節する為のもので、従来の可変抵抗器(いわゆるつまみを付けたボリューム)で構成される。通常、この手動音量調整器6のレベル調整は、製品出荷時や機器設置時などに行えば良く、利用者が日常の操作時に調節する必要はない。こうしてパワーが調節された音声メッセージ信号が最終的に音声再生器7から出力される。
なお、本発明の音量調整装置では、自動音量調整器5における振幅変換規則として、入力パワーと出力パワーの比が、予め定められた一定の比率となるように調節する「線形変換規則」と、その比が予め定められた非線型関数に則する値となるように調節する「非線形変換規則」の2通りがある。
【0006】
図2は自動音量調整器5における振幅変換規則を示す図である。
「線形変換規則」は、図2の左のグラフに示すような振幅変換特性を持たせたものであり、入力音声のパワーがそのまま音声出力の音量に反映される。
この振幅変換は、デジタル信号の場合、例えば以下の変換式で行うことができる。
【数2】
ここで、ynは振幅変換前の音声メッセージデータ、znは振幅変換後の音声メッセージデータである。
一方、「非線形変換規則」は、例えば図2の右のグラフに示すような振幅変換特性を持たせたものである。この例のような特性を持たせた場合には、入力音声が非常に小さい場合でも出力音声の音量がある一定レベル以下にはならず、逆に入力音声が非常に大きい場合でも出力音声の音量がある一定レベル以上にはならないような制限を与えることができる。また、この特性曲線を調整することで、低レベル時にのみ制限を与えたり、逆に高レベル時にのみ制限を与えることも可能となる。
任意の特性を有する非線形変換(線形変換も含む)は、例えば以下のような変換表を利用することで簡単に実現することができる(この方法では、P/P0の平方根の値のカテゴリ分割数mを大きくする程、きめ細かな出力パワーの調整が可能になる)。
【表1】
すなわち、測定された入力音声の平均パワーPと、出力音声の平均パワーP0の比rの平方根の値により、振幅倍率kを求め、次式の様に変換を行う。なお、出力音声の平均パワーP0は一定という(P0=定数とすれば)条件から、振幅倍率kは入力音声の平均パワーPのみにより決定することができる。
【数3】
【0007】
図3は本発明のハードウエア構成を示す図である。本発明の音量調整装置は、画像形成装置やファクシミリ装置等(以降ホスト装置と呼ぶ)に組み込まれ、音声による操作を可能にするためのもので、CPU31、メモリ32を含む電子回路で構成される。ROM33には、電子回路を本発明の音量調整装置として機能させるプログラムや前述の変換表等が格納されており、必要に応じてメモリ32にロードされてCPU31により実行されたり参照されたりする。メッセージデータ34にはホスト装置が発する様々なメッセージが格納されている。媒体としては、ハードディスクでもフラッシュROMのような半導体メモリでも良い。本実施例では、メッセージは音声データがデジタルで格納されている場合を想定するが、音声合成前のテキストデータでも良い。この場合は音声合成を行い、テキストデータ(読みや発音記号データ)を音声の波形に対応した数値列にする必要がある。本発明では入力音声の平均パワーによって出力音声の音量を決定できるので、最終的に音声メッセージに対応するデジタルでの数値が得られれば良い。35は音声の入出力を行うための公知のサウンドボードで、マイクロフォン1、スピーカ37が接続されている。本実施例では、このサウンドボード35に種々の指令を出すことにより、音声データをデジタル処理して音として入出力することが可能となっている。また、本発明はホスト装置の付属装置として働くため、ホスト装置に実行させるコマンド信号や、ホスト装置からの状態信号をやり取りするI/F(インタフェース)36が設けられており、CPU31やメモリ32などと同様に共通のバス38に接続されている。
【0008】
図4は本発明による平均パワーを測定するためのフローチャートである。同図を参照して処理の流れを詳細に説明する。まず、データの個数Nと2乗和の変数Sを0に初期設定する(S40)。次に音声区間での入力音声データを1個Xに読み込む(S41)。このデータは、マイクロフォン1から入った音声がサウンドボード35の図示しないFIFOメモリにAD変換されて取り込まれたデータ列であり、FIFOメモリから直接読んでも、あるいはメモリ32にコピーしたデータでも良い。データが終わっていなければ(S42)、Sに今読んだXを2乗して加え、更にデータ個数Nを1インクリメントし(S43)、S41に戻って処理を繰り返す。データが終わっていれば、Sをデータ個数のNで除して結果をPに代入して処理を終わる。
図5は本発明の自動音量調整器5における振幅変換のフローチャートである。まず、振幅倍率kを設定する(S50)。振幅倍率kは、前述した様に入力平均パワーPから変換表を参照して決定する。次に、音声メッセージのデータを1個Yへ読み込む(S51)。音声メッセージのデータは、図3で説明したメッセージデータ34から読み込む。データが終りでなかったら(S52)、今読んだYに振幅倍率kを乗じてZに代入し(S53)、Zを書き出す(S54)。このZの値を次々にメモリのある連続した領域に書き込んで行き、データが終わった時点で(S52)、一括してサウンドボード35の出力FIFOへ書き出すと(S55)、元の音声データに振幅倍率kが掛かった音量でスピーカ37から音として出力されることになる。
【0009】
【発明の効果】
以上説明したように本発明によれば、請求項1の音声調整装置においては、入力音声の音量に応じて出力メッセージの音量が自動的に調節されるため、利用者が使用環境に合わせてその都度手動で音量の調節を行う必要がなく、適切な再生音量を得ることができる。また、この作用は、利用者には自分が入力した音声の音量が適切か否かのフィードバックにもなる。すなわち、フィードバックの音声が適切でない場合には、音声入力の音量が適切でなかったということを利用者が認識できるため、例えば「もう少し大きな声で入力してください」といった旨のメッセージを明示的に示さなくても、利用者への暗示的な警告が行われることになる。この結果、音声認識率を向上させる効果も期待することができる。
また、請求項2の音量調整装置においては、出力音声の音量を入力音声の音量に比例して変化させることができるため、利用者の意図通りの再生音量を得ることができる。
更に、請求項3の音量調整装置においては、入力音声の音量が極端に小さい場合や極端に大きい場合であっても、適切な再生音量を得ることができる。
また、本発明をROM化したり、インストール可能な状態のプログラムにすれば、ホスト装置への組み込みが容易となり、更に変換表の形式で出力特性を設定できるので所望とする出力特性を容易に実現でき、変更も容易に行える。
【図面の簡単な説明】
【図1】本発明の音量調整装置の構成を示すブロック図である。
【図2】自動音量調整器における振幅変換規則を示す図である。
【図3】本発明のハードウエア構成を示す図である。
【図4】本発明の平均パワーを測定するためのフローチャートである。
【図5】本発明の自動音量調整器における振幅変換のフローチャートである。
【符号の説明】
1 マイクロフォン
2 平均パワー測定器
3 音声認識処理機
4 音声メッセ−ジ生成器
5 自動音量調整器
6 手動音量調整器
7 音声再生器
Claims (6)
- 音声入力手段と、音声出力手段と、入力音声の平均パワーを測定する平均パワー測定手段と、出力音声の再生音量を調節する再生音量調節手段と、を備え、前記再生音量調節手段は前記音声出力手段から出力される音声の出力パワーを前記音声入力手段からの入力音声の平均パワーに応じて変化させることを特徴とする音量調整装置。
- 前記再生音量調節手段は、前記入力音声の平均パワーと出力音声の平均パワーの比が、予め定められた一定の比率となるように音声の出力パワーを制御することを特徴とする請求項1記載の音量調整装置。
- 前記再生音量調節手段は、前記入力音声の平均パワーと出力音声の平均パワーの比が、予め定められた非線型関数に則する値となるように音声の出力パワーを制御することを特徴とする請求項1記載の音量調整装置。
- 音声入力手段からの入力音声の平均パワーを測定する機能と、前記測定した平均パワーに応じて音声メッセージの出力音声の音量を調整する機能とをコンピュータに実現させるためのプログラム。
- 前記出力音声の音量を調整する機能は、前記入力音声の平均パワーに対応させた振幅変換テーブルを用いて実現することを特徴とする請求項4記載のプログラム。
- 請求項4または5に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002173064A JP2004020733A (ja) | 2002-06-13 | 2002-06-13 | 音量調整装置、プログラムおよび記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002173064A JP2004020733A (ja) | 2002-06-13 | 2002-06-13 | 音量調整装置、プログラムおよび記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004020733A true JP2004020733A (ja) | 2004-01-22 |
Family
ID=31172461
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002173064A Pending JP2004020733A (ja) | 2002-06-13 | 2002-06-13 | 音量調整装置、プログラムおよび記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004020733A (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006251061A (ja) * | 2005-03-08 | 2006-09-21 | Nissan Motor Co Ltd | 音声対話装置および音声対話方法 |
JP2008015361A (ja) * | 2006-07-07 | 2008-01-24 | Sharp Corp | 音声合成装置、音声合成方法および音声合成方法を実現するためのプログラム |
US7774201B2 (en) | 2004-05-31 | 2010-08-10 | Panasonic Corporation | Acoustic device with first and second gain setting units |
JP2012168499A (ja) * | 2011-01-28 | 2012-09-06 | Fujitsu Ltd | 音声補正装置、音声補正方法及び音声補正プログラム |
CN104079420A (zh) * | 2014-06-27 | 2014-10-01 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
CN104535225A (zh) * | 2014-12-29 | 2015-04-22 | 合肥瑞纳表计有限公司 | 带语音播报系统的声控式超声波热表 |
EP3748635A1 (en) | 2019-06-07 | 2020-12-09 | Yamaha Corporation | Acoustic device and acoustic processing method |
-
2002
- 2002-06-13 JP JP2002173064A patent/JP2004020733A/ja active Pending
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7774201B2 (en) | 2004-05-31 | 2010-08-10 | Panasonic Corporation | Acoustic device with first and second gain setting units |
JP2006251061A (ja) * | 2005-03-08 | 2006-09-21 | Nissan Motor Co Ltd | 音声対話装置および音声対話方法 |
JP2008015361A (ja) * | 2006-07-07 | 2008-01-24 | Sharp Corp | 音声合成装置、音声合成方法および音声合成方法を実現するためのプログラム |
JP2012168499A (ja) * | 2011-01-28 | 2012-09-06 | Fujitsu Ltd | 音声補正装置、音声補正方法及び音声補正プログラム |
CN104079420A (zh) * | 2014-06-27 | 2014-10-01 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
CN104079420B (zh) * | 2014-06-27 | 2017-12-29 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
CN104535225A (zh) * | 2014-12-29 | 2015-04-22 | 合肥瑞纳表计有限公司 | 带语音播报系统的声控式超声波热表 |
EP3748635A1 (en) | 2019-06-07 | 2020-12-09 | Yamaha Corporation | Acoustic device and acoustic processing method |
US11373669B2 (en) | 2019-06-07 | 2022-06-28 | Yamaha Corporation | Acoustic processing method and acoustic device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11296668B2 (en) | Methods and apparatus for adjusting a level of an audio signal | |
TWI335726B (en) | Speech output control device and recording medium recorded with speech output control programs | |
TWI471856B (zh) | 控制音頻信號之特殊響度特徵的方法、及用以執行其之裝置與電腦程式 | |
US20090097676A1 (en) | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal | |
JP2007133035A (ja) | デジタル録音装置,デジタル録音方法,そのプログラムおよび記憶媒体 | |
JP2008099163A (ja) | ノイズキャンセルヘッドフォンおよびヘッドフォンにおけるノイズキャンセル方法 | |
TWI397901B (zh) | 控制音訊信號比響度特性之方法及其相關裝置與電腦程式 | |
JP2004020733A (ja) | 音量調整装置、プログラムおよび記録媒体 | |
US10978031B2 (en) | Sound signal generation device, sound signal generation method and non-transitory computer readable medium storing sound signal generation program | |
JP2010068292A (ja) | 音声出力装置、プロジェクタ、プログラムおよび情報記憶媒体 | |
JP7194559B2 (ja) | プログラム、情報処理方法、及び情報処理装置 | |
JP6020461B2 (ja) | 音声入出力装置、ハウリング防止方法およびハウリング防止用プログラム | |
JP4527715B2 (ja) | Midiファイルの再生の最適化 | |
JP2010032599A (ja) | 音声処理装置およびプログラム | |
JPH0916200A (ja) | 音声記録再生装置 | |
JP2007003845A (ja) | 再生情報生成装置及び音声再生装置 | |
JP4517395B2 (ja) | 電子楽器 | |
US20230306944A1 (en) | Sound processing device and method of outputting parameter of sound processing device | |
JPH02170708A (ja) | 音量制御回路 | |
JP3322555B2 (ja) | 電子ボリューム回路 | |
JP5288219B2 (ja) | 重ね録音装置、重ね録音方法およびプログラム | |
JP2007228505A (ja) | 音声信号増幅装置 | |
JP2020118913A (ja) | 電子機器 | |
JPH05183364A (ja) | デジタル信号処理装置 | |
JPH04328351A (ja) | 情報再生速度の自動調整装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050223 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20050411 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070423 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070515 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070702 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070830 |