JP2007219122A - 音響機器及びプログラム - Google Patents

音響機器及びプログラム Download PDF

Info

Publication number
JP2007219122A
JP2007219122A JP2006039168A JP2006039168A JP2007219122A JP 2007219122 A JP2007219122 A JP 2007219122A JP 2006039168 A JP2006039168 A JP 2006039168A JP 2006039168 A JP2006039168 A JP 2006039168A JP 2007219122 A JP2007219122 A JP 2007219122A
Authority
JP
Japan
Prior art keywords
volume
voice
recognition
input
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006039168A
Other languages
English (en)
Other versions
JP4736837B2 (ja
Inventor
Satoshi Kimura
聡 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kenwood KK
Original Assignee
Kenwood KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kenwood KK filed Critical Kenwood KK
Priority to JP2006039168A priority Critical patent/JP4736837B2/ja
Publication of JP2007219122A publication Critical patent/JP2007219122A/ja
Application granted granted Critical
Publication of JP4736837B2 publication Critical patent/JP4736837B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Control Of Amplification And Gain Control (AREA)

Abstract


【課題】 ユーザの実際の聞き取り状態に合わせた音量調整を行うことのできる音響機器を実現すること。
【解決手段】 第1マイクM1は、第1〜第3スピーカSP1〜SP3の近傍に配設され、第2マイクM2は、リスニングポジションの近傍に配設される。音声認識部70は、第1マイクM1から入力された音声と、第2マイクM2から入力された音声とにそれぞれ音声認識処理を施し、各音声に対応する認識結果を第1認識データ及び第2認識データとして制御部10に出力する。制御部10は、音声認識部70から出力された第1認識データと第2認識データとが一致しないと判別した場合、ボリューム調整部30にボリュームレベルを一定量増加させるよう指示する。ボリューム調整部30は、制御部10の指示に従ってアンプ40の増幅率を決定して、各スピーカから出力する音声のボリュームを調整する。
【選択図】図2

Description

本発明は、音声出力手段の音量調整を行う音響機器及びプログラムに関する。
テレビやAV機器、カーナビゲーション装置等の音量調整機能を持つ音響機器では、使用する環境に合わせて、ユーザがリモコンや本体のボリュームキーを操作して音量を調整する。しかし、音声を聞く環境というものは、時間帯や周囲の状況に応じて変化するものである。例えば、固定的な同じ場所に設置された音響機器であれば、電話や家電等の生活音、屋外の工事や道路の騒音等によって環境は変化する。また、車載用の音響機器であれば、車の走行に伴って車外の環境が大きく変化して影響を受ける。
このため、ユーザは、一旦、自分の好みの音量に調整したとしても、音声を聞く環境が変化する度に、自分の聞きやすい音量に調整にしなければならい。このような煩わしさを解消するために、自動的に音量調整する技術が提案されている。その一例としては、指向性を有するマイクロホンアレイによって着座位置以外の方向から取得した音声の音量増大に応じて、音響機器の音量を上昇させる技術が知られている(特許文献1参照)。
特開2002−171587号公報
ところが、音響機器が出力してユーザに聞こえる音声の音量調整の要否は、その音声の種類によって異なり、特に、人の声(会話やボーカル)を含む音声において、その音声が周辺の生活音や騒音等にマスクされた場合に、音量調整が必要になることが多い。特許文献1の技術では音量の自動調整が行われるが、この音量調整は周辺音量を基準としているため、必要以上に高い音量になったり、調整後の音量が足りなかったりする等、適切に音量調整が行われないことが考えられる。
また、音量の自動調整を行ったとしても、聴感には個人差があるため、自動調整後も更にユーザによる操作を加えて音量調整を行う必要があった。このように、音声を聞く環境の変化や聴感の個人差により、音量の自動調整を行ったとしても、自分でリモコン等を操作して実際に聞き取り易い音量に調整しなければならなく、使い勝手が悪かった。
本発明は、上述したような課題に鑑みて為されたものであり、その目的とするところは、ユーザの実際の聞き取り状態に合わせた音量調整を行うことのできる音響機器を実現することである。
以上の課題を解決するために、請求項1に記載の音響機器は、
音声出力手段と、
前記音声出力手段の近傍に少なくとも一つ配設された第1の音声入力手段と、
リスニングポジションの近傍に少なくとも一つ配設された第2の音声入力手段と、
前記第1の音声入力手段から入力された音声と、前記第2の音声入力手段から入力された音声とのそれぞれの音声認識を行う音声認識手段と、
前記第1及び第2の音声入力手段から入力されたそれぞれの音声を前記音声認識手段が音声認識した各認識結果の差異を判別し、その差異に基づいて前記音声出力手段の音量を調整する音量調整手段と、
を備えることを特徴としている。
請求項2に記載の発明は、請求項1に記載の発明において、
前記音量調整手段は、
所定の時間間隔で前記認識結果の差異の判別を行い、その差異に基づいた前記音声出力手段の音量調整を当該時間間隔毎に行うことを特徴としている。
請求項3に記載の発明は、請求項1又は2に記載の発明において、
前記音量調整手段は、
前記認識結果の差異が最大レベル以上又は最小レベル以下であると判別した場合、前記音声出力手段の音声調整を停止することを特徴としている。
請求項4に記載の発明は、請求項1〜3の何れか一項に記載の発明において、
前記第2の音声入力手段の入力感度を設定する感度設定手段を更に備えることを特徴としている。
請求項5に記載のプログラムは、コンピュータを、
音源の近傍に少なくとも一つ配設された第1の音声入力部から入力された音声と、リスニングポジションの近傍に少なくとも一つ配設された第2の音声入力部から入力された音声とのそれぞれの音声認識を行う音声認識手段、
前記第1及び第2の音声入力手段から入力されたそれぞれの音声を前記音声認識手段が音声認識した各認識結果の差異を判別し、その差異に基づいて前記音声出力手段の音量を調整する音量調整手段、
として機能させることを特徴としている。
本発明によれば、音声出力部の近傍で入力された音声と、リスニングポジションの近傍で入力された音声との音声認識の結果の差異に基づいて音声出力部の音量調整を行うため、リスニングポジションに位置するユーザの実際の聞き取り状態に合わせた音量調整を行うことができる。
〔第1実施形態〕
以下、本発明の音響機器を適用した音量調整装置1の第1実施形態について図1〜図4を参照して説明する。先ず、図1を用いて音量調整装置1の概要について説明する。図1は、音量調整装置1が有する複数のスピーカと、マイクロホン(以下、「マイク」という。)との平面配置図の一例である。
図1に示すように、音量調整装置1は、第1〜第3スピーカSP1〜SP3と、第1及び第2マイクM1,M2とを備えて構成される。第1〜第3スピーカSP1〜SP3は、ステレオスピーカ、センタースピーカとしての音声出力を行う。第1マイクM1は、第1〜第3スピーカSP1〜SP3の近傍に配設され、第2マイクM2は、ユーザが音声の聞き取りを行う位置LPに配設される。このユーザが音声の聞き取りを行う位置を以下「リスニングポジション」という。
第1マイクM1は、スピーカから出力される音声の入力を、そのスピーカの近傍で行うが、第2マイクM2は、リスニングポジションLPの近傍において行う。このため、第2マイクM2には、リスニングポジションLPのユーザが実際に聞き取りを行う状態に近い音声が入力される。音量調整装置1は、この第2マイクM2から入力された音声と、第1マイクM1から入力された音声との音声認識を行い、それぞれの認識結果の差異に基づいて第1〜第3スピーカSP1〜SP3の音量調整を行う。
次に、図2のブロック図を用いて音量調整装置1の機能構成について説明する。図2によれば、音量調整装置1は、第1及び第2マイクM1,M2と、制御部10と、入力セレクタ20と、AUX(Auxiliary)端子25と、ボリューム調整部30と、アンプ40と、第1及び第2入力感度調整部50,60と、音声認識部70と、第1〜第3スピーカSP1〜SP3とを備えて構成される。尚、図2において、各機能部間を結ぶ実線は音声信号の入出ラインを示し、破線はコントロールラインを示している。
制御部10は、MPU(Micro Processor Unit)やROM(Read Only Memory)、RAM(Random Access Memory)等により構成され、各機能部への指示や各機能部間のデータの入出力を行うことで、音量調整装置1の種々の機能を司っている。より具体的には、操作部(図示略)から入力された操作信号に基づいてROMに記憶されたプログラムを読み出し、その読み出したプログラムに従った処理を行う。そして、その処理結果に基づいて各機能部の制御を行う。
入力セレクタ20は、制御部10の指示に従ってチューナ3、DVD再生機5及びAUX端子25の何れかを選択して、入力された音声信号をボリューム調整部30に出力する機能部である。チューナ3は、テレビ放送やラジオ放送等のチューニングを行って受信した放送の音声信号を音量調整装置1に出力する。DVD再生機5は、DVDの再生を行って音声信号を音量調整装置1に出力する。AUX端子25は、外部機器を接続する入力端子であり、その接続された外部機器からの音声を入力する。
ボリューム調整部30は、入力セレクタ20から出力された音声信号のボリュームレベルを制御部10の指示やユーザの操作に従って調節する機能部である。ボリューム調整部30は、制御部10からボリュームレベルを一定量増加させる指示が入力されると、当該指示に基づいてアンプ40の増幅率を決定すると共に音声信号をアンプ40に出力する。
また、ボリューム調整部30は、ボリュームキーや赤外線受光部を備えて構成され、ユーザのボリュームキーの操作やリモコンから受信した赤外線に基づいてアンプ40の増幅率を決定する。アンプ40は、ボリューム調整部30の指示に従った増幅率で、入力された音声信号を増幅して、当該音声信号に基づいた音声を第1〜第3スピーカSP1〜SP3から出力させる。
第1及び第2入力感度調整部50,60それぞれは、感度調節キーを備えて構成され、ユーザの感度調節キーの操作に従って第1マイクM1及び第2マイクM2それぞれの音声の入力感度を調整する機能部である。入力感度のレベル(以下、「入力感度レベル」という。)としては、例えば、レベルA、B及びCの3段階が設けられ、初期状態ではレベルAに設定される。レベルBはレベルAよりも低く、レベルCはレベルBよりも低いレベルとなる。
ユーザは、自分の聴感に合わせて第1及び第2マイクM1,M2の入力感度レベルを感度調節キーの操作により設定する。例えば、自動調整の結果、音量が大きすぎると感じるユーザであれば第2入力感度調整部60の入力感度レベルをレベルBに設定する。このとき、第2入力感度調整部60は、第2マイクM2からの音声信号のレベルを一定レベル低めて音声認識部70に出力し、出力感度レベルの設定が解除されるまでその設定を保持する。これにより、ユーザの聴感に近い状態を擬似的に再現して、その音声信号に音声認識処理を施すこととなる。尚、出力感度レベルの設定は、特定ユーザの継続使用であればその解除を不要としたり、機器の電源OFF時に解除したり等、ユーザの利用形態に応じた各種設定が可能である。
音声認識部70は、第1及び第2マイクM1,M2から入力された音声に音声認識処理を施す機能部であり、CPU、ROM、RAM及びA/D変換器等を備えて構成される。音声認識部70は、第1入力感度調整部50を介して第1マイクM1から入力された音声信号(アナログ)をA/D変換して音声データ(デジタル)を生成し、その音声データに音声認識処理を施す。また、同様に、第2入力感度調整部60を介して第2マイクM2から入力された音声信号をA/D変換して生成した音声データに音声認識処理を施す。
音声認識処理としては、HHM(Hidden Markov model;隠れマルコフモデル)等の公知技術を適宜採用可能であり、簡単に説明すると次のようになる。即ち、入力された音声データにMFCC(Mel Frequency Cepstral Coefficients )等による音声の特徴分析を行って音声区間を検出し、その検出結果に基づいて音声データの区間毎に分割する。そして、その区間毎の音声データと認識辞書とを比較してパターン認識を行って、その認識結果を認識データとして制御部10に出力する。
音声認識部70は、第1マイクM1からの音声信号に対応する認識結果を第1認識データとして、第2マイクM2からの音声信号に対応する認識結果を第2認識データとして制御部10に出力する。制御部10は、この第1認識データと第2認識データとが一致するか否かを判定する。
各スピーカから出力された音声に歌詞や台詞等の文字情報が含まれていた場合、第1認識データ及び第2認識データとしてその文字情報が出力されることとなる。ところが、リスニングポジションLPにおいて、音声の聞き取りが困難な状態が生じている場合には、第2認識データに含まれる文字情報が第1認識データに含まれる文字情報と同一になるとは限らない。
そこで、制御部10は、これらの認識データに含まれる文字情報が一致しなかった場合は、第1〜第3スピーカSP1〜SP3から出力せれて音声が、リスニングポジションLPでは聞き取り難い状態になっていると判断して、ボリュームレベルを高めるようボリューム調整部30に指示する。このようにして、第1〜第3スピーカSP1〜SP3の音声出力のボリュームを、リスニングポジションLPにおいて聞き取り易い状態となるまで自動調整する。
次に、音量調整装置1の具体的な動作を図3及び図4のフローチャートを用いて説明する。先ず、制御部10は、音声認識による音量調整機能が設定スイッチ(図示略)等の操作によりONに設定されていると判定した場合に(ステップS1;Yes)、図4に示す音声認識制御処理を所定の時間間隔(例えば、10秒間隔)で行う(ステップS3)。
そして、この音声認識制御処理の処理結果に基づいて第2認識データから後述する登録音声を検知したと判別した場合には(ステップS5;Yes)、その登録音声に基づいたボリュームレベルの調整を行うようにボリューム調整部30に指示した後(ステップS7)、ステップS1に処理を移行する。
制御部10は、第2認識データから登録音声を検知せず(ステップS5;No)、更に、第2認識データと第1認識データとが一致した判別した場合には(ステップS9;No)、ステップS1に処理を移行する。また、第1認識データと第2認識データとが不一致であると判別した場合には(ステップS9;Yes)、ボリュームレベルを一定量増加するようにボリューム調整部30に指示する(ステップS11)。
そして、その増加後のボリュームレベルが予め定められた上限レベルを超えたか否かを判定し(ステップS13)、当該上限レベル以下であると判定した場合には(ステップS13;No)、ステップS1に処理を移行して、第1認識データと第2認識データとが一致しなかった場合は一定量のボリュームレベルの増加を繰り返す。このため、第1認識データと第2認識データとの差異の度合いが高い程、ボリュームレベルの増加を繰り返す回数が増し、音量が高くなっていく。
また、ボリュームレベルが上限レベルを超えたと判定した場合には(ステップS13;Yes)、図3に示すフローチャートの処理を終了して音量の自動調整を停止する。第1認識データと第2認識データとが不一致である場合には、ステップS3〜S11の処理を繰り返すことにより、ボリュームレベルを逐次一定量増加していくが、この増加を繰り返すと、ボリュームが高くなりすぎる可能性がある。
そこで、ボリュームレベルが上限レベルを超えた場合には、ボリュームレベルの増加を停止することで、ボリュームが高くなりすぎることを防止する。尚、ボリュームレベルの増加量及び上限レベルは、予め定められたレベルを設定することとしてもよいし、ユーザが設定可能にしてもよい。
制御部10は、ステップS3において図4のフローチャートに処理を移行すると、先ず、誤認識カウンタmの格納領域をRAMに確保して、当該誤認識カウンタmをクリアする(ステップS21)。そして、第2認識データが音声認識部70から出力されるまで待機し、当該第2認識データが出力された場合には(ステップS23;Yes)、第2認識データに登録音声が含まれるか否かを判別する(ステップS25)。
制御部10は、第2認識データに予め登録された音声データと比較して一致した場合に登録音声が含まれていると判別し(ステップS25;Yes)、音声認識結果として“登録音声検知”を図3の処理フローに返す(ステップS27)。この登録音声としては、例えば、電話の着信音や、電話のフックをかける音(フック音)等の音声があり、電話の着信音と第2認識データとが一致した場合には、ボリュームを一定量下げ、フック音の音声データと一致した場合には、ボリュームを一定量上げる音量調整を行う。
また、ステップS25において登録音声が含まれていないと判別した場合(ステップS25;No)、音声認識部70から第1認識データが出力されたか否かを判定する(ステップS29)。制御部10は、第1認識データが出力されたと判定した場合(ステップS29;Yes)、第1認識データと第2認識データとが一致するか否かを判別し(ステップS31)、一致すると判別した場合には(ステップS31;Yes)、音声認識結果として“一致”を図3の処理フローに返す(ステップS39)。
また、第1認識データと第2認識データとが一致しなかったと判別した場合には(ステップS31;No)、誤認識カウンタmに1加算し(ステップS33)、その誤認識カウンタmが誤認識判定回数(例えば、5回)を超えたか否かを判定する(ステップS35)。制御部10は、誤認識カウンタmが誤認識判定回数以下であると判定した場合(ステップS35;No)、ステップS23に処理を移行して、第2認識データに基づいた音声調整を繰り返す。
また、誤認識カウンタmが誤認識判定回数を超えたと判定した場合には(ステップS35;Yes)、スピーカから出力された音声に含まれる文字情報を、リスニングポジションLPの第2マイクM2において誤って音声認識していると判別し、音声認識結果として“不一致”を図3の処理フローに返す(ステップS37)。
例えば、スピーカから「今日はいい天気です」という音声出力が為され、音声認識部70は、「キョウハイイテンキデス」という文字情報を含む第1認識データと、「キョハテキデ」という文字情報を含む第2認識データとを取得したとする。このとき、制御部10は、この第1認識データと第2認識データは一致しないと判別し、この判別を5回行った場合に、ボリュームレベルを一定量高めることで、リスニングポジションLPでより聞き取り易い状態にする。
そして、制御部10は、音声認識制御処理を再度行って、「キョウハイイテンキデス」という第1認識データと、「キョウハテンキデ」という第2認識データとを取得した場合、更に、第1認識データと第2認識データは一致しないと判別して、ボリュームレベルを一定量高める。
次いで、制御部10は、音声認識制御処理を再度行って、「キョウハイイテンキデス」という第1認識データと第2認識データとを取得した場合、第1認識データと第2認識データが一致すると判別して、ボリュームレベルの調節を停止する。このようにして、リスニングポジションLPにおいて入力した音声中に含まれる文字情報と、スピーカ近傍で入力した音声に含まれる文字情報とが一致するまで当該スピーカの音量を高めていく。
以上、第1実施形態によれば、スピーカ近傍に配設された第1マイクM1から入力された音声と、リスニングポジションLPに配設された第2マイクM2から入力された音声とのそれぞれに施した音声認識処理の認識結果が一致しなかった場合には、スピーカの音量を一定量ずつ高めていく。このため、リスニングポジションLPのユーザが、実際に聞き取る音声に合わせて音量調整を行うことができる。
このため、例えば、ユーザが音楽や映画の視聴中に、生活音や屋外の騒音等が発生して音声が聞き取り難い環境に一時的に変化した場合、第1認識データと第2認識データとの差異が小さくなるまで音量を高めるため、ユーザが音声を聞き取り難くなることを防止することができる。また、環境の変化の都度、リモコン等を操作して音量調整を行う必要がなくなるため、ユーザの音量調整の操作が軽減される。
また、第1認識データ及び第2認識データに含まれる文字情報を比較して、音声調整を行うことで、スピーカから出力された音声に含まれる歌詞や台詞といった文字情報がリスニングポジションLPで聞き取り易くなるように音量を調整することができる。
また、10秒間隔といった所定の時間間隔で音声認識制御処理を行って、認識データの一致・不一致の判別を行いながら音量の調整を行っているため、スピーカから出力している音声の聞き取り難さにリアルタイムで対応できるようになる。
尚、ボリュームレベルが所定の上限レベルを超えた場合に、音量の自動調整を停止することとして説明したが、例えば、次のようにしてもよい。即ち、10秒間隔で10秒分の音声データに音声認識制御処理を行って、認識データの差異が最大レベル以上又は最小レベル以下であると判別した場合に自動調整を停止する。
より具体的には、第1及び第2認識データを比較し、音声に含まれる10文字分の文字情報のうち、一致する文字情報が9文字以上であり、一致しない文字情報が最小レベルの1文字以下であれば、多少の差異においては音量調整が不要であると判別して自動調整を停止する。また、一致する文字情報が5文字以下であり、一致しない文字情報が最大レベルの5文字以上であれば、認識データの一致を阻害している環境音が大きすぎると判別して、音声調整を行わない。
例えば、騒音が一時的に発生し、認識データの一致する文字情報が例えば5文字以下であった場合、自動調整を行っても聞き取り易くなるとは限らず、自動調整を行わないため、音量が必要以上に高くなってしまうことを防止できる。また、一般に、音声認識処理の精度によってはある程度の誤差が生ずる可能性があるため、認識データの一致しない文字情報が1文字以下であった場合は自動調整を停止して、必要以上に精細な音量調整を行って音量が不安定になってしまうことを防止できる。
〔第2実施形態〕
次に、音響機器を適用した音量調整装置1aの第2実施形態について図5及び図6を参照して説明する。尚、上述した第1実施形態における音量調整装置1と同一の機能構成には、同一の符号を付してその詳細な説明を省略する。また、音量調整装置1aの具体的な処理内容について、音量調整装置1と同一の処理内容についてはその説明を割愛し、異なる処理内容を中心に説明する。
図5は、音量調整装置1aが有する第1マイクM1と、第2−1〜第2−3マイクM2−1〜M2−3との平面配置図の一例である。図5に示すように、音量調整装置1aの、第2−1〜第2−3マイクM2−1〜M2−3それぞれは、複数のリスニングポジションLP1〜LP3に配設される。
図6は、音量調整装置1aの機能構成の一例を示すブロック図である。図6によれば、音量調整装置1aは、第1マイクM1と、第2−1〜第2−3マイクM2−1〜M2−3と、制御部10aと、入力セレクタ20と、AUX端子25と、ボリューム調整部30と、アンプ40と、第1入力感度調整部50と、第2−1〜第2−3入力感度調整部61〜63と、音声認識部70と、第1〜第3スピーカSP1〜SP3とを備えて構成される。尚、図6において、制御部10aから各入力感度調整部に対するコントロールラインの図示は省略している。
第2−1〜第2−3入力感度調整部61〜63それぞれは、感度調節キーを備えて構成され、ユーザの感度調節キーの操作に従って第2−1〜第2−3マイクM2−1〜M2−3それぞれの音声の入力感度レベルを調整する機能部である。音声認識部70aは、第1マイクM1と、第2−1〜第2−3マイクM2−1〜M2−3とから入力された音声に音声認識処理を施す機能部である。
第2実施形態における音量調整装置1aの具体的な処理内容は、図3及び4のフローチャートに従った処理と同様であるが、異なる処理内容は次のようになる。即ち、図4のステップS23移行の処理では、第2認識データに基づいた処理を、第2−1〜第2−3マイクM2−1〜M2−3に対応する認識データに基づいて行う。
具体的には、音声認識部70aから出力される認識データを比較して、第1認識データと、第2−1〜第2−3マイクM2−1〜M2−3それぞれに対応する認識データそれぞれとが一致するか否かを判別する。そして、上述した第1実施形態と同様に、認識データが一致すると判別した場合は、音声認識結果として“一致”を返し、一致しないと判別した場合は、“不一致”を返す。
以上、第2実施形態によれば、第1マイクM1から入力された音声と、複数のリスニングポジションLP1〜LP3に配設された第2−1〜第2−3マイクM2−1〜M2−3から入力された音声とのそれぞれに施した音声認識処理の認識結果が一致しなかった場合には、スピーカの音量を一定量ずつ高めていく。このため、リスニングポジションLP1〜LP3それぞれに位置するユーザの、実際の聞き取り状態に合わせて音量調整を行うことができる。
〔第3実施形態〕
次に、音響機器を適用した音量調整装置1bの第3実施形態について図7を参照して説明する。尚、音量調整装置1bが有するマイク及びスピーカの平面配置図は、上述した第2実施形態の平面配置図(図5参照)と同様である。また、音量調整装置1aと同一の機能構成には、同一の符号を付してその詳細な説明を省略し、音量調整装置1aと同一の処理内容についてはその説明を割愛し、異なる処理内容を中心に説明する。
図7は、音量調整装置1bの機能構成の一例を示すブロック図である。図7によれば、音量調整装置1bは、第1マイクM1と、第2−1〜第2−3マイクM2−1〜M2−3と、制御部10aと、入力セレクタ20と、AUX端子25と、ボリューム調整部30bと、第1〜第3アンプ41〜43と、第1入力感度調整部50と、第2−1〜第2−3入力感度調整部61〜63と、音声認識部70aと、第1〜第3スピーカSP1〜SP3とを備えて構成される。
ボリューム調整部30bは、制御部10bにより指定されたスピーカのボリュームレベルを調整する機能部であり、当該制御部10bの指示に基づいて各スピーカに対応する第1〜第3アンプ41〜43の増幅率を決定すると共に音声信号を第1〜第3アンプ41〜43に出力する。
第1〜第3アンプ41〜43それぞれは、ボリューム調整部30の指示に従った増幅率で、入力された音声信号を増幅して、当該音声信号に基づいた音声を第1〜第3スピーカSP1〜SP3から出力させる。制御部10bは、音声認識部70aから出力される認識データを比較して、第1認識データと、第2−1〜第2−3マイクM2−1〜M2−3それぞれに対応する認識データとが一致するか否かを判別する。
そして、第2−1〜第2−3マイクM2−1〜M2−3それぞれに対応する認識データの何れかが第1認識データと一致しないと判別した場合は、その一致しないと判別した第2−1〜第2−3マイクM2−1〜M2−3それぞれに対応するスピーカのボリュームレベルを一定量増加させるように、ボリューム調整部30bに指示する。
具体的には、図5においては、第2−1マイクM2−1と第1スピーカSP1、第2−2マイクM2−2と第2スピーカSP2、第2−3マイクM2−3と第3スピーカSP3といったマイクとスピーカとの配列順に予め対応付けられており、第2−1マイクM2−1から入力された音声の認識データと、第1認識データとが一致しなかった場合は、第1スピーカSP1のボリュームレベルを増加させる。
また、第2−2マイクM2−2に対応する認識データと第1認識データとが一致しなかった場合は、第2スピーカSP2のボリュームレベルを増加させ、第2−3マイクM2−3に対応する認識データと第1認識データとが一致しなかった場合は、第3スピーカSP3のボリュームレベルを増加させる。
以上、第3実施形態によれば、第1認識データと、複数のリスニングポジションLP1〜LP3に配設された各マイクから入力された音声とのそれぞれに施した音声認識処理の認識結果とが一致しなかった場合には、その一致しなかったマイクに対応付けられたスピーカの音量を一定量ずつ高めていく。従って、リスニングポジションLP1〜LP3に位置するユーザ毎の実際の聞き取り状態に合わせて、スピーカ毎に音量調整を行うことができる。
〔第4実施形態〕
次に、音響機器を適用した音量調整装置1cの第4実施形態について図8及び図9を参照して説明する。尚、上述した第1実施形態における音量調整装置1と同一の機能構成には、同一の符号を付してその詳細な説明を省略する。また、音量調整装置1cの具体的な処理内容について、音量調整装置1と同一の処理内容についてはその説明を割愛し、異なる処理内容を中心に説明する。
図8は、音量調整装置1bが有する第1−1〜第1−3マイクM1−1〜M1−3と、第2マイクM2との平面配置図の一例である。図8に示すように、音量調整装置1bの、第1−1〜第1−3マイクM1−1〜M1−3それぞれは、第1〜第3スピーカSP1〜SP3の近傍に配設される。また、第2スピーカSP2はセンターチャンネルの音声出力を行い、第1及び第2スピーカSP1,SP2は、左右のステレオチャンネルの音声出力を行う。
図9は、音量調整装置1cの機能構成の一例を示すブロック図である。図9によれば、音量調整装置1cは、第1−1〜第1−3マイクM1−1〜M1−3と、第2マイクM2と、制御部10cと、入力セレクタ20と、AUX端子25と、ボリューム調整部30cと、第1〜第3アンプ41〜43と、第1−1〜第1−3入力感度調整部51〜53と、第2入力感度調整部60と、音声認識部70cと、第1〜第3スピーカSP1〜SP3とを備えて構成される。尚、図9において、制御部10cから各入力感度調整部に対するコントロールラインの図示は省略している。
第1−1〜第1−3入力感度調整部51〜53それぞれは、感度調節キーを備えて構成され、ユーザの感度調節キーの操作に従って第1−1〜第1−3マイクM1−1〜M1−3それぞれの音声の入力感度を調整する機能部である。音声認識部70cは、第1−1〜第1−3マイクM1−1〜M1−3と、第2マイクM2とから入力された音声に音声認識処理を施す機能部である。
制御部10cは、音声認識部70cから出力される認識データを比較して、第1−1〜第1−3マイクM1−1〜M1−3それぞれに対応する認識データと、第2認識データとが一致するか否かを判別する。
そして、第1−1〜第1−3マイクM1−1〜M1−3それぞれに対応する認識データの何れかが第2認識データと一致しないと判別した場合は、その一致しないと判別した第1−1〜第1−3マイクM1−1〜M1−3それぞれの近傍に位置するスピーカのボリュームレベルを一定量増加させるように、ボリューム調整部30cに指示する。
このため、例えば、第1−1マイクM1−1に入力された左成分の音声と、リスニングポジションLPにおける音声との認識データが一致しなかた場合には、第1スピーカSP1の音量を高める。また、第1−2マイクM1−2に入力されたセンター成分の音声と、リスニングポジションLPにおける音声との認識データが一致しなかた場合には、第2スピーカSP2の音量を高める。
以上、第4実施形態によれば、各スピーカに配設された第1−1〜第1−3マイクM1−1〜M1−3から入力された音声それぞれに施した音声認識処理の認識結果と、第2認識データとが一致しなかった場合には、その一致しなかったマイクの近傍に位置するスピーカの音量を一定量ずつ高めていく。従って、リスニングポジションLPに位置するユーザの実際の聞き取り状態に合わせて、音声出力の左成分、右成分、センター成分といった音声毎に音量調整を行うことができる。
〔変形例〕
尚、上述した実施形態は、本発明を適用した一例であり、その適用可能な範囲は上述したものに限られない。
例えば、上述した実施形態では、スピーカから出力する音声全体や左成分や右成分の音声の音量調整を行うこととして説明したが、音声認識処理により認識した音声中のボーカルの周波数成分を抽出して音量調整することとしてもよいし、また、低音域の周波数成分を抽出して音量調整することとしてもよい。この場合、ボリューム調整部は、入力された音声信号に所定の音声信号処理を施して、ボーカルや低音域の周波数成分を抽出して、その音量調整を個々に行ってアンプに出力することとなる。これにより、音声中に含まれるボーカルや会話等の文言を聞き取り易くすることができる。
また、上述した実施形態では、各マイクから入力された音声に音声認識処理を施した認識結果が一致しなかった場合に、一定量ボリュームレベルの増加を繰り返すこととして説明したが、認識結果に含まれる文字情報を比較し、異なる文字情報の字数に応じてボリュームレベルを増加させることとしてもよい。
また、ボリュームレベルの調整を行う際に、一旦ユーザにその旨を通知して、ユーザの確認を得てから当該調整を行うこととしてもよい。この場合、例えば、制御部10は、音声調整をユーザの代理で行うエージェント機能を有することとする。そして、ステップS11においてボリュームレベルを一定量増加させる前に、音声出力中の音声を一時停止して、スピーカから「音量を高くしますがよろしいですか」という音声を出力する。制御部10は、例えば「ハイ」という音声が第2マイクM2から入力されたことを第2認識データに基づいて判定した場合に、ステップS11のボリュームレベルの増加を行う。
次いで、ボリュームレベルの調整後、「今の音量でよろしいですか」という音声をスピーカから音声出力し、「ハイ」という音声が入力された場合には、そのボリュームを保持し、「イイエ」という音声が入力された場合には、更にボリュームレベルを高める。このようなエージェント機能を設けることで、ユーザは、音量調整装置1と対話形式で自分の聞き取りやすい音量に調節することができるようになる。
また、本実施形態の音量調整後、ユーザによりボリュームキーやリモコンを操作(音量調整操作)して、更に音量調整が為された場合には、その調整されたボリュームレベルに基づいて入力感度レベルを設定することとしてもよい。例えば、ステップS11の音量調整後、リモコンの操作によりボリュームレベルがユーザにより高められた場合は、第2入力感度調整部60の入力感度レベルを一定レベル低め、ボリュームレベルが低められた場合は、入力感度レベルを一定レベル高める。
これにより、第2マイクM2に入力された音声は、ユーザの音量調整操作に基づいた入力感度レベルに調整されて音声認識部70に出力される。このため、音量調整操作に基づいてユーザの聴感を推測して、その聴感に近い状態の音声を再現して施すことができる。
また、チューナ3やDVD再生機5等の外部機器から出力された音声の音量を調整してスピーカから出力する音量調整装置に本発明を適用することとして説明したが、例えば、CDやMD、VHS、DVD等のメディア再生を行うオーディオ機器、テレビ、カーナビゲーション装置等の様々な音響機器に適用可能である。
第1実施形態におけるスピーカ及びマイクの平面配置図の一例。 第1実施形態における音量調整装置の機能構成の一例を示すブロック図。 音量調整装置の具体的な動作を説明するための第1のフローチャート。 音量調整装置の具体的な動作を説明するための第2のフローチャート。 第2及び第3実施形態におけるスピーカ及びマイクの平面配置図の一例。 第2実施形態における音量調整装置の機能構成の一例を示すブロック図。 第3実施形態における音量調整装置の機能構成の一例を示すブロック図。 第4実施形態におけるスピーカ及びマイクの平面配置図の一例。 第4実施形態における音量調整装置の機能構成の一例を示すブロック図。
符号の説明
LP リスニングポジション
M1 第1マイク
M2 第2マイク
SP1 第1スピーカ
SP2 第2スピーカ
SP3 第3スピーカ
1 音量調整装置
3 チューナ
5 DVD再生機
10 制御部
20 入力セレクタ
30 ボリューム調整部
40 アンプ
50 第1入力感度調整部
60 第2入力感度調整部
70 音声認識部

Claims (5)

  1. 音声出力手段と、
    前記音声出力手段の近傍に少なくとも一つ配設された第1の音声入力手段と、
    リスニングポジションの近傍に少なくとも一つ配設された第2の音声入力手段と、
    前記第1の音声入力手段から入力された音声と、前記第2の音声入力手段から入力された音声とのそれぞれの音声認識を行う音声認識手段と、
    前記第1及び第2の音声入力手段から入力されたそれぞれの音声を前記音声認識手段が音声認識した各認識結果の差異を判別し、その差異に基づいて前記音声出力手段の音量を調整する音量調整手段と、
    を備えることを特徴とする音響機器。
  2. 前記音量調整手段は、
    所定の時間間隔で前記認識結果の差異の判別を行い、その差異に基づいた前記音声出力手段の音量調整を当該時間間隔毎に行うことを特徴とする請求項1に記載の音響機器。
  3. 前記音量調整手段は、
    前記認識結果の差異が最大レベル以上又は最小レベル以下であると判別した場合、前記音声出力手段の音声調整を停止することを特徴とする請求項1又は2に記載の音響機器。
  4. 前記第2の音声入力手段の入力感度を設定する感度設定手段を更に備えることを特徴とする請求項1〜3の何れか一項に記載の音響機器。
  5. コンピュータを、
    音源の近傍に少なくとも一つ配設された第1の音声入力部から入力された音声と、リスニングポジションの近傍に少なくとも一つ配設された第2の音声入力部から入力された音声とのそれぞれの音声認識を行う音声認識手段、
    前記第1及び第2の音声入力手段から入力されたそれぞれの音声を前記音声認識手段が音声認識した各認識結果の差異を判別し、その差異に基づいて前記音声出力手段の音量を調整する音量調整手段、
    として機能させるためのプログラム。
JP2006039168A 2006-02-16 2006-02-16 音響機器及びプログラム Expired - Fee Related JP4736837B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006039168A JP4736837B2 (ja) 2006-02-16 2006-02-16 音響機器及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006039168A JP4736837B2 (ja) 2006-02-16 2006-02-16 音響機器及びプログラム

Publications (2)

Publication Number Publication Date
JP2007219122A true JP2007219122A (ja) 2007-08-30
JP4736837B2 JP4736837B2 (ja) 2011-07-27

Family

ID=38496508

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006039168A Expired - Fee Related JP4736837B2 (ja) 2006-02-16 2006-02-16 音響機器及びプログラム

Country Status (1)

Country Link
JP (1) JP4736837B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012049634A (ja) * 2010-08-24 2012-03-08 Fujitsu Ltd 音量調節システムおよび発音システム
WO2013122310A1 (en) * 2012-02-17 2013-08-22 Lg Electronics Inc. Method and apparatus for smart voice recognition
CN112673647A (zh) * 2018-09-20 2021-04-16 昕诺飞控股有限公司 用于配置分布式麦克风系统的方法和控制器

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09186540A (ja) * 1995-12-28 1997-07-15 Fujitsu Ten Ltd 騒音感応自動音量調整装置
JPH11126093A (ja) * 1997-10-24 1999-05-11 Hitachi Eng & Service Co Ltd 音声入力調整方法および音声入力システム
JP2002369281A (ja) * 2001-06-07 2002-12-20 Matsushita Electric Ind Co Ltd 音質音量制御装置
JP2005037615A (ja) * 2003-07-18 2005-02-10 Omron Corp クライアント装置、音声認識サーバ、分散型音声認識システム、音声認識プログラム、およびコンピュータ読み取り可能な記録媒体

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09186540A (ja) * 1995-12-28 1997-07-15 Fujitsu Ten Ltd 騒音感応自動音量調整装置
JPH11126093A (ja) * 1997-10-24 1999-05-11 Hitachi Eng & Service Co Ltd 音声入力調整方法および音声入力システム
JP2002369281A (ja) * 2001-06-07 2002-12-20 Matsushita Electric Ind Co Ltd 音質音量制御装置
JP2005037615A (ja) * 2003-07-18 2005-02-10 Omron Corp クライアント装置、音声認識サーバ、分散型音声認識システム、音声認識プログラム、およびコンピュータ読み取り可能な記録媒体

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012049634A (ja) * 2010-08-24 2012-03-08 Fujitsu Ltd 音量調節システムおよび発音システム
WO2013122310A1 (en) * 2012-02-17 2013-08-22 Lg Electronics Inc. Method and apparatus for smart voice recognition
US8793138B2 (en) 2012-02-17 2014-07-29 Lg Electronics Inc. Method and apparatus for smart voice recognition
US8793136B2 (en) 2012-02-17 2014-07-29 Lg Electronics Inc. Method and apparatus for smart voice recognition
CN104169837A (zh) * 2012-02-17 2014-11-26 Lg电子株式会社 用于智能语音识别的方法和设备
US9229681B2 (en) 2012-02-17 2016-01-05 Lg Electronics Inc. Method and apparatus for smart voice recognition
CN112673647A (zh) * 2018-09-20 2021-04-16 昕诺飞控股有限公司 用于配置分布式麦克风系统的方法和控制器
CN112673647B (zh) * 2018-09-20 2023-03-28 昕诺飞控股有限公司 用于配置分布式麦克风系统的方法和控制器

Also Published As

Publication number Publication date
JP4736837B2 (ja) 2011-07-27

Similar Documents

Publication Publication Date Title
US9508335B2 (en) Active noise control and customized audio system
KR101279276B1 (ko) 자동 이득 제어
CN114902688B (zh) 内容流处理方法和装置、计算机系统和介质
KR20240025720A (ko) 개인화된 실시간 오디오 프로세싱
US20060074686A1 (en) Controlling an apparatus based on speech
US20120071997A1 (en) method and apparatus for providing information about the source of a sound via an audio device
JP6931819B2 (ja) 音声処理装置、音声処理方法及び音声処理プログラム
US20100040242A1 (en) In-vehicle sound control system
KR20150018727A (ko) 청각 기기의 저전력 운용 방법 및 장치
CN114640938B (zh) 一种基于蓝牙耳机芯片的助听功能实现方法及蓝牙耳机
WO2019228329A1 (zh) 个人听力装置、外部声音处理装置及相关计算机程序产品
JP7197992B2 (ja) 音声認識装置、音声認識方法
US20150049879A1 (en) Method of audio processing and audio-playing device
JP4736837B2 (ja) 音響機器及びプログラム
JP2007334968A (ja) 音声切換装置
JP2006251061A (ja) 音声対話装置および音声対話方法
WO2015030642A1 (en) Volume reduction for an electronic device
US20120057714A1 (en) Automatic Tunable Earphone And Method For Tuning The Same
JP2004013084A (ja) 音量制御装置
JP2010230972A (ja) 音信号処理装置、その方法、そのプログラム、および、再生装置
JP3554649B2 (ja) 音声処理装置とその音量レベル調整方法
US6134526A (en) Apparatus and method for reproducing recorded signals by using recording medium
TWI824424B (zh) 語意評估之助聽調整裝置及其方法
JP7105320B2 (ja) 音声認識装置、音声認識装置の制御方法、コンテンツ再生装置、及びコンテンツ送受信システム
JPH1146394A (ja) 情報処理装置および方法、記録媒体、並びに伝送媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090121

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110208

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110405

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110418

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140513

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140513

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140513

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees