以下、本発明を具現化した音調整装置1について、図面を参照して説明する。ユーザは音調整装置1を使用して、携帯音楽端末から出力される音楽やパーソナルコンピュータ(以下、PCという。)を介して音調整装置1に送信される音楽を聞くことができる。また、ユーザは、音調整装置1を使用して、他の拠点にいるユーザと音声会議や電話等の会話をすることができる。図1に示すように、音調整装置1は、長方体状の筐体11を有する。音調整装置1は、スピーカ112及びマイク113を備えている。スピーカ112は、筐体11の1つの面の中央に設けられている。マイク113は、左マイク1131と右マイク1132とを含む。左マイク1131は、スピーカ112の左側(図1の左側)に設けられている。右マイク1132は、スピーカ112の右側(図1の右側)に設けられている。
音調整装置1は、筐体11の向きを変更して使用することができる。例えば、ユーザが音調整装置1を一人で使用する場合、図1に示すように、スピーカ112及びマイク113が設けられている面をユーザに向ける。スピーカ112及びマイク113がユーザに向いているため、音調整装置1は、ユーザにスピーカ112からの音を届けやすく、ユーザの声をマイク113で集音し易い。
また、例えば、複数のユーザが音調整装置1を使用する場合、図2に示すように、スピーカ112及びマイク113が設けられている面を上方向に向ける。スピーカ112が上方向に向いているため、スピーカ112から出力された音が周囲に広がり易くなる。このため、音調整装置1の周囲の複数人のユーザは、スピーカ112から出力される音を聞き易くなる。また、マイク113が上方向に向いているため、音調整装置1の周囲の複数人のユーザの声がマイク113に届き易くなり、複数人のユーザの声が集音され易くなる。以下の説明では、スピーカ112及びマイク113が設けられている面が水平方向に向いている場合(図1参照)、音調整装置1が水平方向を向いているといい、当該面が上方向に向いている場合(図2参照)、音調整装置1が上方向に向いているという。なお、音調整装置1には、PC2、携帯電話、携帯音楽端末、及び他の音調整装置等を接続することができる。また、音調整装置1はアナログ電話機能を有しており、PSTN(公衆電話交換回線網)に接続することができる。図1及び図2では、音調整装置1にPC2を接続した例を示している。
図3及び図4を参照して、音調整装置1が有する音の出力及び集音についての機能について説明する。音調整装置1は、音楽再生用のモード(以下、「音楽モード」という。)と、会話用のモード(以下、「会話モード」という。)に設定可能である。すなわち、ユーザは音調整装置1を使用して、音楽を聞いたり、会話をしたりすることができる。また、モード(音楽モード、会話モード)に応じて、スピーカ112から出力される音の周波数特性、ダイナミックレンジと、マイク113から入力された音の周波数特性とを調整できる。以下の説明では、スピーカ112から出力される音の周波数特性を「スピーカ特性」という。また、マイク113から入力された音の周波数特性を「マイク特性」という。
音調整装置1は、マイクミュート、DRC(Dinamic Range Compression)、高音質再生、及びビームフォーミング等の機能を有する。マイクミュートとは、マイク113の集音を停止する機能である。高音質再生とは、音楽を再生する場合に、音楽を高音質で再生するための機能である。例えば、高音質再生の設定が解除されている場合のスピーカ特性が、図3に示す周波数特性601であるとする。高音質再生が設定されると、図3に示す周波数特性602のようにスピーカ特性が調整される。周波数特性601は、会話モード用の周波数特性である。周波数特性601は、フィルタを通して会話に必要のない周波数をカットするなどして、残留エコー(後述)が残りにくく、ユーザが快適な会話を行うことができるように設定されている。高音質再生における周波数特性602は、周波数特性601に比べ、低音域及び高音域が延び、全体の周波数特性もフラットになる。
DRCとは、スピーカから出力される音の信号のダイナミックレンジを圧縮する機能である。音調整装置1は、会話モードに設定され、高音質再生の設定が解除される場合、DRCを設定する。図4に示すように、ダイナミックレンジ606,607は、音調整装置1が再現可能な最大の音圧レベル604と最小の音圧レベル(雑音のレベル)605との差を表す。DRCが設定されると、最大の音圧レベル604のレベルが下がり、最小の音圧レベル605が上がる。最大の音圧レベル604が下がるので、大きな音信号は減衰される。このため、大音量がスピーカ112から出力されることを防止できる。また、最小の音圧レベル605が上がるので、小さい音信号は増幅される。このため、小さい音がより大きな音量でスピーカ112から出力される。このため、ユーザが小さい音(例えば、ユーザの小さな声)をより聴きやすくなる。このように、DRCが設定されると、大音量が出力されるのを防止でき、小さい音が大きく出力されるので、ユーザは人の声を聴きやすくなる。
また、音調整装置1は、音楽モードに設定され、高音質再生に設定される場合、DRCの設定を解除する。DRCが解除されると、広いダイナミックレンジ606で音楽を再生することができる。よって、音楽信号本来のダイナミックレンジを保った再生を行うことができる。故に、ユーザは高音質な音楽を聴くことができる。
ビームフォーミングとは、集音範囲を任意に変更する機能であり、いわゆる指向性を持った集音を行う機能である。左右に並べて配置された個々のマイク1131,1132に到達する音は、マイク1131,1132の並び方向に対してどの方向から到達したかによって、その到達時間に差を生ずる。例えば、マイク1131,1132の並び方向と直交する方向(便宜上、「正面方向」とする。)から音が到達する場合、音は各マイク1131,1132に同時に到達する。このため、個々のマイク1131,1132から音信号が入力され、音入力処理部127(図5参照)において電気的に足し合わされることによって、マイク1131,1132の数に相当する分の倍率(すなわち、2倍)に増幅された音の出力が得られることとなる。
一方、マイク1131,1132の並び方向に対し斜めの方向(便宜上、「斜め方向」とする。なお、側方も含む。)から音が到達する場合、音の発生源に近いマイクほど早く音が到達するため、個々のマイク1131,1132が取得する音に時間差(位相ずれ)を生ずる。このため、マイク1131,1132からの音信号を音入力処理部22において電気的に足し合わせた場合の音のゲインは、各マイク1131,1132への音の到達角度とマイク1131,1132の配置間隔(あるいは配置位置)に応じたものとなり、正面方向から到達した場合よりも小さくなる。個々のマイク1131,1132の配置間隔はあらかじめ判っているので、指向性制御部122(図5参照)において各マイクの取得する音の時間差を取得してCPU101で解析すれば、音の発生源の方向を求めることができる。
また、指向性制御部122では、個々のマイク1131,1132で集音した音をそれぞれ遅延させた上で音入力処理部127に出力することができる。このことは、CPU101が個々のマイク1131,1132への入力に対する遅延時間を制御することにより、所定の斜め方向から到達する音を足し合わせた場合のゲインを最大とすることができることを意味する。言い換えると、個々のマイク1131,1132からの入力を指向性制御部26において電気的に制御して遅延させることにより、所望する方向に対し、マイク113が指向性を得ることができる。
本実施形態では一例として、ビームフォーミングの設定が解除されている時は、マイク1131,1132が集音できる全範囲の音が集音されるとする。そして、ビームフォーミングが設定されている時は、CPU101は、指向性制御部122を制御し、集音範囲を任意に変更し、例えば、マイク1131,1132との間の中心から右に15°、左に15°の範囲に集音範囲を変更するとする。この場合、音調整装置1は、変更された集音範囲にいるユーザの声をより明瞭に集音し、周囲の雑音は低減できる。このように、ビームフォーミングが設定されている場合、解除されている場合では、集音範囲が異なる。集音範囲が異なると、集音される音の周波数特性も異なってくる。すなわち、ビームフォーミングが設定・解除されると、マイク特性が調整されていることとなる。
図5を参照して、音調整装置1の電気的構成について説明する。音調整装置1は、CPU101、ROM102、RAM103、及びフラッシュメモリ104を備えている。ROM102、RAM103、及びフラッシュメモリ104は、CPU101に接続されている。ROM102には、種々のプログラムデータ等が記憶される。RAM103には、一時的なデータが記憶される。フラッシュメモリ104には、CPU101の制御プログラム(例えば、後述するメイン処理等のプログラム)や各種データ等が記憶される。
音調整装置1は、高音質再生ボタン106、ビームフォーミングボタン107、ボリュームボタン108、及びマイクミュートボタン109を備えている。高音質再生ボタン106、ビームフォーミングボタン107、ボリュームボタン108、及びマイクミュートボタン109は、CPU101に電気的に接続されている。ユーザは、高音質再生ボタン106、ビームフォーミングボタン107、ボリュームボタン108、及びマイクミュートボタン109を操作(押下)することで、高音質再生の設定・解除、ビームフォーミングの設定・解除、ボリュームの上げ下げ、マイクミュートの設定・解除を行うことができる。
音調整装置1は、加速度センサ110、駆動回路111、スピーカ112、マイク113、駆動回路114、駆動回路115、及びエコーキャンセラ116を備えている。駆動回路111は、CPU101及び加速度センサ110に電気的に接続されている。加速度センサ110は、音調整装置1の傾きに応じた電圧を出力する。駆動回路111は、加速度センサ110から出力された電圧を増幅してCPU101に入力する。CPU101は、入力された電圧に基づいて音調整装置1の傾きを検出する。CPU101は、音調整装置1が上方向に向いているか、水平方向に向いているかを判断できる。
駆動回路114は、スピーカ112及びエコーキャンセラ116に接続されている。駆動回路115は、マイク113及びエコーキャンセラ116に接続されている。CPU101から出力された音データは、駆動回路114で、周波数特性の調整、ダイナミックレンジの調整(DRCの設定・解除)、D/A変換等が行われる。そして、スピーカ112から音が出力される。
マイク113は周囲の音を集音する。マイク113は、左マイク1131及び右マイク1132(図1参照)を含む。駆動回路115は、指向性制御部122及び音入力処理部127等を有する。CPU101は、駆動回路115の指向性制御部122を制御して、マイク1131,1132からの入力を電気的に制御して遅延させることにより、所望する方向に対し、マイク113が指向性を得るように設定することができる。CPU101は、駆動回路115の音入力処理部127を制御して、指向性制御部122から出力されたマイク1131,1132からの音信号を電気的に足し合わせることができる。また、駆動回路115は、音の周波数特性の調整、A/D変換等を行って、CPU101に出力することができる。
ここで、スピーカ112から出力された音の一部がマイク113によって集音され(図5の矢印60参照)、エコーやハウリングの原因となる場合がある。エコーキャンセラ116は、エコーやハウリングの発生を抑制する。なお、エコーキャンセラ116は、実際には、CPU101がプログラムによって実行する処理であるが、図5では、説明を分かり易くするために、回路ブロックとして示している。なお、エコーキャンセラ116は回路によって実現してもよいし、CPU101とは別途設けられたDSPチップ内で動作する複数のプログラムのうちの1つであってもよい。
音調整装置1は、モジュラージャック118、ライン入出力端子119、ディジーチェーン端子120、及びUSB(Universal Serial Bus)端子121を備えている。モジュラージャック118、ライン入出力端子119、ディジーチェーン端子120、及びUSB端子121は、CPU101に接続されている。モジュラージャック118には、電話線123を接続可能である。前述したように、音調整装置1は、アナログ電話機能を有している。ユーザは、電話線123が接続されたPSTN網を介して、他のユーザと会話をすることができる。
ライン入出力端子119には、図示外の携帯端末(携帯音楽端末及び携帯電話等)に接続されたケーブルの一端に設けられた3極プラグ124、又は4極プラグ125を接続可能である。3極プラグ124は、グランド端子(以下、GND端子という。)、Lch端子、Rch端子の3極の端子を有する。Lch端子は、Lch(Left channel)の音を入力するための端子である。Rch端子は、Rch(Right channel)の音を入力するための端子である。4極プラグ125は、GND端子、Lch端子、Rch端子、及びマイク端子を有する。例えば、音調整装置1が、無線通信網を介して通信可能な携帯電話に接続されたとする。この場合、CPU101は、マイク113によって集音された音信号を、4極プラグ125のマイク端子、携帯端末、及び無線通信網を介して、他のユーザが使用する携帯電話に送信することができる。また、CPU101は、他のユーザが使用する携帯電話から送信された音信号を、Lch端子、Rch端子を介して取得し、スピーカ112から出力することができる。
ディジーチェーン端子120は、通信ケーブルによって他の音調整装置5をディジーチェーン接続するための端子である。ディジーチェーン接続とは、装置を数珠つなぎに連結する接続方法である。故に、音調整装置1,5以外の音調整装置をさらにディジーチェーン接続して、音調整装置の台数を増やすことができる。USB端子121には、通信ケーブルを介してPC2が接続される。PC2は、通信網(例えば、インターネット網)6に接続される。CPU101は、PC2のCPU201、及び通信網6を介して、他の装置と通信を行うことができる。CPU101はマイク・スピーカストリーム通信、又は、スピーカストリーム通信を行うことができる。なお、マイク・スピーカストリーム通信及びスピーカストリーム通信は、ユーザがPC2を操作して各通信を実行する指示をPC2に入力することで開始される。
マイク・スピーカストリーム通信とは、PC2からCPU101にスピーカ112から出力するための音データが送信されており、且つ、マイク113から入力された音データが、CPU101からPC2へ送信されている状態である。ユーザは、マイク・スピーカストリーム通信によって、スピーカ112から出力するための音データと、マイク113から入力された音データとを送受信しながら、他の装置を使用するユーザと会話を行うことができる。スピーカストリーム通信とは、PC2からCPU101にスピーカ112から出力するための音データが送信されている状態である。ユーザは、スピーカストリーム通信によって音データを受信し、スピーカ112から出力することができる。これによって、ユーザは音楽などを聴くことができる。
図6を参照して、優先対応データテーブル95について説明する。優先対応データテーブル95はフラッシュメモリ104に記憶されている。以下の説明では、各機能(高音質再生、マイクミュート、ビームフォーミング)が解除されている状態から、ユーザが各機能を設定するために、ボタン106,107,109を操作することを、ボタン106,107,109をオンするという。また、各機能が設定されている状態から、ユーザが各機能の設定を解除するために、ボタン106,107,108を操作することを、ボタン106,107,109をオフするという。図6に示すように、優先対応データテーブル95には、部品、状態、想定モード、及び優先値が対応付けられて記憶されている。
想定モードとは、部品欄の部品に、状態欄の設定を行った場合に想定されるモード(音楽モード又は会話モード)である。例えば、高音質再生が解除されている状態で、高音質再生ボタン106がオンされた場合、ユーザは、高音質再生を設定して音楽を聴くために、高音質再生ボタン106をオンした可能性が高い。このため、部品「高音質再生ボタン」と状態「オン」とは、想定モード「音楽モード」に対応付けられている。なお、想定モード「−」は、音楽モード、会話モードのいずれにも対応付けられていないことを示している。
優先値は、音楽モード又は会話モードを優先する度合い(優先度)を示す値である。優先値は、0〜3の4段階で表される。優先値が大きいほど、優先度が高い。優先度が高いほど、ユーザが想定モードに設定しようとしている確率が高いことを示している。例えば、高音質再生は、音楽再生用の設定であるので、高音質再生ボタン106がオンされた場合には、ユーザが音楽を聞こうとしている確率が非常に高い。このため、部品「高音質再生ボタン106」、想定状態「オン」、想定モード「音楽モード」には、優先度が最も高い優先値「3」が対応付けられている。
また、4極プラグ125には、マイク端子が設けられている。例えば、ライン入出力端子119に4極プラグ125が接続された場合、ユーザは、Lch端子、Rch端子、及びマイク端子を使った会話を行うこともできるし、Lch端子及びRch端子のみを使用した音楽再生を行うこともできる。しかし、ユーザがマイク端子のない3極プラグ124ではなく、マイク端子のある4極プラグ125をライン入出力端子119に端子に接続したということは、ユーザが会話を行おうとしている確率が、音楽再生を行おうとしている確率よりもやや高いと考えられる。このため、部品「ライン入出力端子」、状態「4極プラグ125」は、想定モード「会話モード」に対応付けられ、その優先値は確率の低い「1」に設定されている。
また、前述したように、ユーザは、マイク・スピーカストリーム通信によって会話を行うことができる。このため、部品「USB端子121」、状態「マイク・スピーカストリーム通信」は、想定モード「会話モード」に対応付けられ、その優先値は確率の高い「3」に設定されている。また、ユーザは、スピーカストリーム通信によって音楽再生を行うことができる。このため、部品「USB端子121」、状態「スピーカストリーム通信」は、想定モード「音楽モード」に対応付けられ、その優先値は「2」に設定されている。以下の説明では、想定モード「音楽モード」に対応付けられた優先値を「音楽優先値」といい、想定モード「会話モード」に対応付けられた優先値を「会話優先値」という。
図7を参照して、音調整装置のCPU101によるメイン処理について説明する。メイン処理は、音楽モード又は会話モードに適した周波数特性の調整等を行う処理である。CPU101は、ユーザによって電源がオンされると、フラッシュメモリ104に記憶されている音調整プログラムを読み出し、メイン処理を実行する。以下の説明では、スピーカ112又はマイク113に関する各種機能の設定に関する状態を「設定状態」という。他の機器との接続に関する状態を「接続状態」という。他の装置との通信に関する状態を「通信状態」という。本実施形態では一例として、設定状態は、高音質再生ボタン106、ビームフォーミングボタン107、マイクミュートボタン109のオンオフ操作の状態、及び高音質再生ボタン106、ビームフォーミングボタン107、マイクミュートボタン109がユーザによって操作されていない状態であるとする。また、接続状態は、ディジーチェーン端子120、モジュラージャック118、及びライン入出力端子119への接続の有無や、ライン入出力端子119に接続されたプラグの種類(3極プラグ124又は4極プラグ125)であるとする。また、通信状態は、USB端子121での通信種別(マイク・スピーカストリーム通信、又はスピーカストリーム通信)であるとする。
図7に示すように、メイン処理では、まず、設定状態、接続状態、及び通信状態が状態情報として取得される(S11)。取得された状態情報は、RAM103に記憶される。次いで、S11で取得された状態情報が、前回取得された状態情報から変化したか否かが判断される(S12)。なお、最初の1回目のS12の処理では、前回取得された状態情報はないが、会話モードが音楽モードかを決定するために状態情報が変化したと判断される。
状態情報が変化した場合(S12:YES)、変化した状態情報は、設定状態であるか否かが判断される(S13)。接続状態又は通信状態の変化である場合、設定状態が変化していないと判断され(S13:NO)、後述するS15の処理が実行される。設定状態の変化である場合(S13:YES)、ユーザが新たに操作した状態に設定される(S14)。例えば、ユーザよってビームフォーミングボタン107がオンされた場合、ビームフォーミングが設定される。なお、高音質再生ボタン106がオンされた場合、高音質再生の設定と、DRCの設定の解除とが行われる。また、高音質再生ボタン106がオフされた場合、高音質再生の設定の解除と、DRCの設定とが行われる。
次いで、フラッシュメモリ104に記憶された優先対応データテーブル95から、S11で取得された状態情報に対応する音楽優先値と会話優先値とが取得される(S15)。なお、接続状態及び通信状態についての優先値(音楽優先値、会話優先値)については、S15が行われる度に取得されるが、設定状態についての優先値については、高音質再生ボタン106、ビームフォーミングボタン107、又はマイクミュートボタン109が操作されたときのみ取得される。すなわち、高音質再生、ビームフォーミング、マイクミュートの各機能の設定、解除をユーザが切り替えるときのみ、設定状態の優先値が取得される。次いで、S15で取得された音楽優先値と会話優先値とから、音楽優先値の合計値と会話優先値の合計値とが算出(取得)される(S16)。
次いで、S16で算出された音楽優先値の合計値と会話優先値の合計値が比較され、音楽モードと会話モードのうち、優先度が高いモード(優先値の合計値が大きいモード)が、設定するモードとして決定される(S17)。なお、音楽優先値の合計値と、会話優先値の合計値とが同じ値である場合には、会話モードが、設定するモードとして決定される。
次いで、S17で決定されたモードが会話モードであるか否かが判断される(S18)。S17で決定されたモードが会話モードである場合(S18:YES)、会話設定処理が実行される(S19)。
図8を参照して、会話設定処理について説明する。会話設定処理は、種々の設定(周波数特性の調整やダイナミックレンジの調整等)を行って、会話モードに設定する処理である。まず、加速度センサ110の出力値から音調整装置1の向きが検出される(S31)。次いで、音調整装置1の向きが水平方向を向いているか否かが判断される(S32)。なお、音調整装置1の向きが水平方向の場合には、ユーザが一人で音調整装置1を使用している可能性が高い(図1参照)。一方、音調整装置1の向きが水平方向でない場合(すなわち、上方向である場合)、複数のユーザが音調整装置1を使用している可能性が高い(図2参照)。
音調整装置1の向きが水平方向である場合(S32:YES)、すなわち、ユーザが一人で使用している可能性が高い場合、S33〜S35の処理によって、音調整装置1は、ビームフォーミングが設定されている状態になる。これによって、ユーザが一人で使用している場合には、周囲の雑音等を低減し、音調整装置1の前にいる一人のユーザの声をより明瞭に集音できすることができる。なお、現在ビームフォーミングが設定されていない場合には、周囲の音の音圧が、所定音圧より大きい場合にのみビームフォーミングの設定がされる(後述するS34:YES,S35)。
S33では、S11で取得された状態情報が参照され、ビームフォーミングが設定されているか否かが判断される(S33)。ビームフォーミングが設定されている状態とは、ユーザがビームフォーミングボタン107をオンしてS14でビームフォーミングが設定されている状態と、後述するS35において自動でビームフォーミングが設定されている状態とを含む。
ビームフォーミングが設定されている場合(S33:YES)、後述するS38の処理が実行される。すなわち、既にビームフォーミングが設定されているため、S35でビームフォーミングを新たに設定する必要がなく、S35の処理は行われない。
ビームフォーミングが設定されていない場合(S33:NO)、マイク113によって集音される周囲の音の音圧が、所定音圧より大きいか否かが判断される(S34)。S34における周囲の音とは、ユーザの声以外の騒音である。例えば、CPU101は、ある一定音圧(例えば、50dB)以上の音をユーザの声であると認識し、一定音圧より小さい音圧を騒音として認識するとする。S34では、例えば、CPU101は、一定音圧以下の騒音レベルを所定時間測定して平均し、平均した音圧が所定音圧(例えば、45dB)より大きいか否かを判断する。周囲の音の音圧が所定音圧より大きくない場合(S34:NO)、後述するS38の処理が行われる。S34における周囲の音の音圧が所定音圧より大きくない場合とは、ユーザの声以外の音調整装置1の周囲の騒音が小さい場合である。この場合、ビームフォーミングを設定しなくても、ユーザの声を明瞭に集音することが可能である。このため、S35でビームフォーミングを新たに設定する必要がなく、S35の処理は行われない。
周囲の音の音圧が所定音圧より大きい場合(S34:YES)、ビームフォーミングが設定される(S35)。すなわち、マイク特性が調整される。ビームフォーミングが設定されることによって、周囲の騒音を低減しつつ、音調整装置1の前にいるユーザの声を明瞭に集音することができる。
次いで、高音質再生が設定されているか否かが判断される(S38)。高音質再生が設定されている場合(S38:YES)、高音質再生の設定が解除される(S39)。これによって、スピーカ特性が、図3の周波数特性602に示す状態から周波数特性601に示す状態に調整される。これによって、ユーザが快適な会話を行うことができるように、周波数特性が設定される。次いで、DRCが設定される(S40)。これによって、大音量が出力されるのを防止でき、小さい音が大きく出力されるので、ユーザは人の声を聴き易くなる。よって、ユーザはさらに快適に会話を行うことができる。S40でDRCが設定された後、又は、S38で高音質再生の設定がされていないと判断された場合(S38:NO)、会話設定処理が終了される。
S32において、音調整装置1の向きが水平方向を向いていないと判断された場合(S32:NO)、すなわち、音調整装置1の向きが上方向を向いている場合、S33と同様に、ビームフォーミングが設定されているか否かが判断される(S36)。ビームフォーミングが設定されている場合(S36:YES)、ビームフォーミングの設定が解除される(S37)。ビームフォーミングの設定が解除された後(S37)、又は、ビームフォーミングが設定されてないと判断された場合(S36:NO)、処理はS38に進む。S36及びS37が行われると、ビームフォーミングが設定されていない状態になる。前述したように、音調整装置1が上方向を向いている場合、複数のユーザが音調整装置1を使用している可能性が高い(図2参照)。このため、集音範囲を広くする必要がある。よって、集音範囲を狭くするビームフォーミングの設定を解除して、より広い範囲のユーザの声を集音できるようにするのである。
会話設定処理が終了されると、処理はメイン処理(図7参照)のS11に戻る。図7に示すように、S18において、会話モードでないと判断された場合(S18:NO)、音楽設定処理が実行され、音楽モードに設定される(S20)。
図9を参照して、音楽設定処理について説明する。音楽設定処理は、種々の設定(周波数特性の調整やダイナミックレンジの調整等)を行って、音楽モードに設定する処理である。まず、周囲の音の音圧が、所定音圧より大きいか否かが判断される(S51)。S51における周囲の音とは、ユーザの声である。例えば、CPU101は、ある一定音圧(例えば、50dB)以上の音をユーザの声であると認識し、一定音圧より小さい音圧を騒音として認識するとする。S51では、例えば、CPU101は、所定時間の周囲の音の音圧を計測して平均し、平均した音圧が所定音圧(例えば、50dB)より大きいか否かを判断する。なお、S51における所定音圧は、S34の場合より大きいが、これに限定されず、例えば、S34の場合と同じ値であってもよい。周囲の音の音圧が所定音圧より大きい場合(S51:YES)、ボリュームが所定値より大きいか否かが判断される(S52)。ボリュームが所定値より大きくない場合(S52:NO)、後述するS54の処理が行われる。ボリュームが所定値より大きい場合(S52:YES)、ボリュームを下げるようにスピーカ特性が調整される(S53)。S53では、S52で判断された所定値以下にボリュームが下がるように、スピーカ特性の周波数全域に亘って利得が下げられる。すなわち、スピーカ特性が調整される。例えば、周囲の音が大きい場合、ユーザの会議の声によって、音圧が大きくなっている可能性が高い。このため、ユーザは、会議を行っている場所でBGMとして音楽を使用している可能性が高い。このため、BGMに適した音量に下げるのである。
周囲の音の音圧が所定音圧より大きくない場合(S51:NO)、後述するS54の処理が行われる。すなわち、S53の処理は実行されない。周囲の音が所定音圧より小さい場合とは、人が発言していない可能性が高く、会議は行われていない可能性が高い。このため、ユーザは、純粋に音楽を聞く目的で音調整装置1を使用している可能性が高い。音楽再生の音量の好みは人それぞれなので、CPU101は、ボリュームを調整する処理(S53)を実行しないのである。
次いで、高音質再生が設定されているか否かが判断される(S54)。高音質再生が設定されていない場合(S54:NO)、高音質再生が設定される(S55)。S54及びS55の処理によって、高音質再生が設定された状態になる。これによって、ユーザは、高音質な音楽を聴くことができる。次いで、DRCの設定が解除される(S56)。これによって、ダイナミックレンジを保った音楽再生が行われ、ユーザはさらに高音質な音楽を聴くことができる。S56でDRCの設定が解除された後、又は、高音質再生が設定されていると判断された場合(S54:YES)、音楽設定処理が終了される。処理はメイン処理のS11に戻る。
優先対応データテーブル95(図6参照)を使用したモードの決定の第一の例を図10に示す。図10の例では、ユーザが音調整装置1の電源をオンした後、携帯音楽端末に接続されたケーブルの一端に設けられた3極プラグ124をライン入出力端子119に接続して、携帯音楽端末からの音楽を音調整装置1で再生(矢印961)した後に、USB端子121を介してマイク・スピーカストリーム通信を開始し(矢印963)、他の拠点のユーザと会話を行ったとする。
図10に示す例では、初期状態は、ライン入出力端子119「接続なし」、USB端子121「接続なし」、ディジーチェーン接続「接続なし」、モジュラージャック「接続なし」であるとする。また、高音質再生、マイクミュート、ビームフォーミングの各機能は、解除されているとする。高音質再生が解除されているので、DRCは設定されているとする。初期状態については、後述する図11及び図12に示す例も同様である。。
上記の初期状態の場合、状態情報が取得され(S11)、電源オン直後の最初の一回目のS12の処理であるので、状態情報が変化したと判断される(S12:YES)。次いで、設定状態が変化していないので(S13:NO)、優先値が取得される(S15)。このとき、設定状態が変化していないので、設定状態についての優先値は取得されず、接続状態及び通信状態についての優先値が取得される。そして、会話優先値の合計値「0」、音楽優先値の合計値「0」が算出される(S15)。会話優先値の合計値と、音楽優先値の合計値とが同じ値なので、会話モードに決定され(S17)、会話設定処理(S19)が行われ、会話モードに設定される。
会話設定処理では、条件に応じてビームフォーミングの設定(S35)又は解除(S37)が行われる。また、初期状態では高音質再生は解除されているので、高音質再生が設定されていないと判断され(S38:NO)、会話設定処理が終了される。
電源がオンされた後、ユーザによって何ら操作がされないと、状態情報が変化していないと判断され(S12:NO)、会話モードであるので、音楽モードに設定中ではないと判断される(S21:YES、後述)。そして、後述するS25〜S27によって残留エコー(後述)が所定値以下に抑えられる。
初期状態から、ユーザが携帯音楽端末の音楽を聴くために、3極プラグ124をライン入出力端子119に接続したとする(図10の矢印961参照)。この場合、S11で取得される状態情報が示す接続状態が変化するので、状態情報が変化したと判断され(S12:NO)、設定状態が変化していないと判断される(S13:NO)。そして、優先値が取得され(S15)、会話優先値の合計値「0」、音楽優先値の合計値「3」が取得される(S16)。3極プラグ124がライン入出力端子119に接続されたので、音楽優先値の合計値が「0」から「3」に変化している。音楽優先値の合計値「3」が、会話優先値の合計値「0」より大きいので、音楽モードの優先度が高い。このため、音楽モードに決定され(S17)、音楽設定処理(S20)が行われ、音楽モードに設定される(図10の矢印962参照)。
音楽設定処理では、ユーザが新たな操作をすることなく、高音質再生が設定され(S55)、DRCが解除される(S56)。すなわち、ユーザが音楽を聴くために、3極プラグ124を挿しただけで、自動で音楽モードに設定され、高音質再生が設定され、DRCが解除される。このように、自動で高音質再生が設定されるので、ユーザが高音質再生ボタン106の操作をしなくても、又は、操作をすることを忘れても、高音質な音で音楽を聴くことができる。また、自動でDRCが設定されるので、ユーザが高音質再生ボタン106の操作をしなくても、又は、操作をすることを忘れても、音楽信号本来のダイナミックレンジを保った再生を行うことができ、ユーザがさらに高音質な音楽を聴くことができる。なお、仮に、ユーザが音声会議をしていて、周囲の音が所定音圧より大きく(S51:YES)、ボリュームが所定値より大きい場合(S52:YES)、ユーザが操作することなく自動でボリュームが下げられる。(S53)。
音楽設定処理が行われた後しばらくして、ユーザが他の拠点のユーザと会話をするために、PC2を操作して、USB端子121、通信網6を介するマイク・スピーカストリーム通信を開始したとする(図10の矢印963)。この場合、状態情報が変化し(S12:YES)、設定状態が変化していないので(S13:NO)、優先値が取得される(S15)。USB端子121の状態が「接続なし」から「マイク・スピーカストリーム通信」に変化しているので、優先値が「0」の状態から会話優先値「3」の状態に変化する。このため、会話優先値の合計値「3」、音楽優先値の合計値「3」に変化する(S16)。
会話優先値の合計値「3」と音楽優先値の合計値「3」とが同じなので、会話モードに決定され(S17)、会話設定処理(S19)が行われ、会話モードに設定される(図10の矢印964参照)。会話設定処理では、ユーザが新たな操作をすることなく、高音質再生の設定が解除され(S39)、DRCが設定される(S40)。すなわち、ユーザが会話をするために、マイク・スピーカストリーム通信を開始しただけで、自動で会話モードに設定され、高音質再生の設定が解除され、DRCが設定される。このため、ユーザが高音質再生ボタン106を操作する必要がない。よって、ユーザが高音質再生ボタン106の操作をしなくても、又は、操作をすることを忘れても、高音質再生の設定を解除できる。また、ユーザが高音質再生ボタン106の操作をしなくても、又は、操作をすることを忘れても、DRCを設定できる。なお、条件に応じて、ビームフォーミングが自動で設定されたり(S35)、自動で解除されたりする(S37)。これによって、一人のユーザが音調整装置1を使用する場合、又は、複数のユーザが音調整装置1を使用する場合の両方で、ユーザの声を明瞭に集音することができる。
優先対応データテーブル95(図6参照)を使用したモードの決定の第二の例を図11に示す。図11の例では、ユーザは音調整装置1の電源をオンした後、USB端子121を介してスピーカストリーム通信をし(矢印971)、他の装置から通信網6を介して送信された音楽を音調整装置1で再生するとする。その後、ユーザは携帯電話に接続されたケーブルの一端に設けられた4極プラグ125をライン入出力端子119に接続し(矢印973)、スピーカストリーム通信を停止した後(矢印974)、携帯電話を介して他のユーザと会話をするとする。
図11に示すように、電源がオンされた後、図10の例の場合と同様に、会話モードに設定される。初期状態から、ユーザが音調整装置1で音楽を聴くために、USB端子121を介するスピーカストリーム通信を開始する(図11の矢印971参照)。会話優先値の合計値「0」、音楽優先値の合計値「2」が算出される(S16)。そして、音楽モードに決定され(S17)、音楽設定処理(S20)で音楽モードに設定される(矢印972参照)。このように、ユーザが音楽を聴くためにスピーカストリーム通信を開始しただけで、高音質再生が自動で設定され(S55)、DRCの設定が自動で解除される(S56)。ユーザは高音質な音楽を聴くことができる。また、条件に応じてボリュームが自動で下げられる(S53)。
その後、ユーザは、携帯電話を介して他のユーザと会話をするために、4極プラグ125をライン入出力端子119に接続し(矢印973参照)、スピーカストリーム通信を停止する(矢印974参照)。まず、ユーザが4極プラグ125をライン入出力端子119に接続すると(矢印973参照)、会話優先値の合計値「1」、音楽優先値の合計値「2」が算出される(S16)。そして、音楽優先値の合計値が会話優先値の合計値より大きいので、音楽モードに決定され(S17)、音楽設定処理が行われる(S20)。すなわち、音楽モードが維持される。次いで、ユーザがPC2を操作して、スピーカストリーム通信を停止すると(矢印974参照)、会話優先値の合計値「1」、音楽優先値の合計値「0」が算出される(S16)。そして、会話優先値の合計値が音楽優先値の合計値より大きいので、会話モードに決定され(S17)、会話設定処理(S19)で会話モードに設定される(矢印975参照)。このように、ユーザが4極プラグ125をライン入出力端子119に接続し、スピーカストリーム通信を停止するだけで、高音質再生の設定が自動で解除され(S39)、DRCが自動で設定される(S40)。また、条件に応じて、ビームフォーミングが自動で設定されたり(S35)、自動で解除されたりする(S37)。ユーザは、会話に適した音質で他のユーザと会話を行うことができる。
優先対応データテーブル95(図6参照)を使用したモードの決定の第三の例を図12に示す。図12の例では、ユーザは音調整装置1の電源をオンした後、マイク・スピーカストリーム通信によって他のユーザと音声会議で会話をするとする(矢印981)。そして、音声会議のBGMとして音楽を再生する目的で、携帯音楽端末に接続されたケーブルの一端に設けられた3極プラグ124をライン入出力端子119に接続し(矢印982)、高音質再生ボタン106を操作するとする(矢印983)。
図12に示すように、電源がオンされた後、図10の例の場合と同様に、会話モードに設定される。ユーザが他の拠点のユーザと会話を行うために、PC2を操作してマイク・スピーカストリーム通信を行うと(矢印981参照)、会話優先値の合計値「3」と音楽優先値の合計値「0」とが算出される(S16)。会話優先値の合計値が音楽優先値の合計値より大きいので、会話モードに決定され(S17)、会話設定処理が行われる(S19)。すなわち、会話モードが維持される。ユーザは、他の拠点のユーザと音声会議で会話を行う。
その後、ユーザは、音声会議のBGMとして音楽を再生する目的で、3極プラグ124をライン入出力端子119に接続し(矢印982参照)、高音質再生ボタン106を操作する(矢印983参照)。まず、ユーザが、3極プラグ124をライン入出力端子119に接続すると(矢印982参照)、会話優先値の合計値「3」と音楽優先値の合計値「3」とが算出される(S16)。会話優先値の合計値と音楽優先値の合計値とが同じなので、会話モードが決定され(S17)、会話設定処理が行われる(S19)。すなわち、会話モードが維持される。次いで、ユーザが高音質再生ボタン106をオンすると(矢印983参照)、高音質再生ボタン106が操作されたので設定状態が変化したと判断され(S13:YES)、高音質再生が設定される(S14)。また、DRCの設定が解除される(S14)。
そして、会話優先値の合計値「3」と音楽優先値の合計値「6」とが算出される(S16)。音楽優先値の合計値が会話優先値の合計値より大きいので、音楽モードが決定され(S17)、音楽設定処理が行われる(S20)。音楽再生処理(図9参照)では、音声会議を行っているために、ユーザの声によって、音調整装置1の周囲の音が所定音圧より大きくなる(S51:YES)。そして、ボリュームが所定値より大きい場合(S52:YES)、スピーカ特性が調整され、ボリュームが自動的に下げられる(S53)。このように、ユーザが音声会議のBGMとして音楽を再生する目的で、3極プラグ124をライン入出力端子119に接続し、高音質再生ボタン106を操作するだけで、BGMに適したボリュームに自動で調整される。なお、S14で高音質再生が設定されているので、高音質再生は設定済みと判断される(S54:YES)。
メイン処理の説明に戻る。図7に示すS12において、S11で取得された状態情報が、前回取得された状態情報から変化していない場合(S12:NO)、S21〜S27の処理が実行され、モードに応じて、残留エコーが所定値以下に抑えられる。残留エコーとは、エコーキャンセラ116でエコーを低減させた後に残ったエコーである。
例えば、図13に示す周波数特性611がエコーであり、周波数特性612が残留エコーであるとする。周波数特性611は、マイク113によって集音され、駆動回路115増幅された後の音の周波数特性である。すなわち、周波数特性611は、ポイント75(図5参照)における音の周波数特性であり、エコーキャンセルは行われていない。周波数特性612は、周波数特性611の音がエコーキャンセラ116を通過し、エコーキャンセルされた後の音の周波数特性である。すなわち、周波数特性612は、ポイント76(図5参照)における音の周波数特性である。
エコーキャンセルされても、完全にエコーを消すことはできず、図13に示すように、ある程度、残留エコーが残る場合がある。このため、残留エコーのレベルが高いと、会話の相手に不快なエコーを聞かせてしまう。そこで、本実施形態では、音楽モードであれば、マイク特性を調整して残留エコーを低減し(S24)、会話モードであれば、スピーカ特性を調整して残留エコーを低減する(S27)。以下、S21〜S27の処理について説明する。
S21では、音楽モードに設定中であるか否かが判断される(S21)。音楽モードに決定され(S17)、音楽モードに設定中である場合(S21;YES)、残留エコーのレベル(周波数特性612の音のレベル)が検出される(S22)。次いで、S22で検出された残留エコーのレベルが、所定値(例えば、−70dB)以下であるか否かが判断される(S23)。
残留エコーのレベルが所定値以下でない場合(S23:NO)、マイク特性が調整される(S24)。S24では、例えば、駆動回路115による増幅率が下げられることで、マイク特性における周波数領域全体(可聴領域である20Hz〜20kHz全体)の利得が下げられる。下げられる利得のレベルは、残留エコーを所定値以下にすることができるレベルである。マイク特性の利得が下げられると、図13に示す周波数特性611、612のレベルが共に下がり、図14に示す周波数特性611,612のように変化する。図14の周波数特性612に示すように、残留エコーが所定値以下に下がっている。このように、残留エコーが低減される。次いで、処理はS11に戻る。S23において、残留エコーのレベルが所定値以下である場合(S23:YES)、処理はS11に戻る。
会話モードに決定され(S17)、会話モードに設定されている場合、音楽モードに設定中でないと判断され(S21:NO)、S22と同様に残留エコーのレベルが検出される(S25)。次いで、S23と同様に、残留エコーのレベルが所定値以下であるか否かが判断される(S26)。残留エコーのレベルが所定値以下でない場合(S26:NO)、スピーカ特性が調整される(S27)。S27では、スピーカ特性における周波数領域全体(可聴領域である20Hz〜20kHz全体)の利得が下げられる。下げられる利得のレベルは、残留エコーを所定値以下にすることができるレベルである。スピーカ特性の利得が下げられると、スピーカ112から出力される音のレベルが下がり、マイク113に集音されるエコーのレベルが下がる。このため、図13に示す周波数特性611,612のレベルが共に下がり、図14に示す周波数特性611,612のように変化する。図14の周波数特性612に示すように、残留エコーが所定値以下に下がっている。このように、残留エコーが低減される。次いで、処理はS11に戻る。S26において、残留エコーのレベルが所定値以下である場合(S26:YES)、処理はS11に戻る。
なお、S22〜S24の処理、又は、S25〜S27の処理は、状態情報が変化しない間(S12:NO)、繰り返し実行される。すなわち、CPU101は、リアルタイムに残留エコーを監視し(S22、S23、S25、S26)、残留エコーが所定値以下になるように調整する。
以上のように、本実施形態における処理が行われる。ユーザは、音楽を聴きたい場合や、会話をしたい場合に、音調整装置1に対して種々の操作を行う。これによって、設定状態、接続状態、通信状態が変化する。音調整装置1は、ユーザによって設定された状態の状態情報を取得し(S11)、音楽モード又は会話モードのいずれに設定するかを決定する(S17)。そして、音調整装置1は、決定したモードに応じて、スピーカ特性やマイク特性を調整する(図7のS24、S27、図8のS35、S37、S39、図9のS53、S55)。また、音調整装置1は、決定したモードに応じて、ダイナミックレンジを調整する(図8のS40及び図9のS56)。すなわち、音調整装置1(CPU101)は、ユーザの意図する目的(会話をすること、及び音楽を聴くこと)に応じて、スピーカ112から出力する音や、マイク113から入力した音の特性を自動で調整できる。よって、ユーザの意図する目的に合致した音質、音量で、スピーカ112からの音の出力と、マイク113による音の集音とをすることができる。
また、優先度が高いほど、ユーザが想定モード(図6参照)に設定しようとしている確率が高い。そして、本実施形態では、優先度が高い(優先値の合計値が大きい)モードに設定することができる(S15、S17、S19、及びS20)。このため、優先度を反映しない場合に比べてより確実に、ユーザが意図する合致したモードに設定できる。
また、状態情報が変化したタイミングで(S12:YES)、モードが新たに決定され(S17)、モードに応じてスピーカ特性、マイク特性が調整される(図7のS24、S27、図8のS35、S37、S39、図9のS53、S55)。また、決定されたモードに応じてダイナミックレンジが調整される(図8のS40及び図9のS56)。このため、ユーザが新たな操作を行ったタイミングですぐにスピーカから出力する音やマイクから入力した音の特性を調整することができる。よって、ユーザは、新たな操作を行った直後から、ユーザの意図する目的に応じて調整された特性で、音楽を聴いたり、会話をしたりすることができる。
また、音楽モードに設定されているときには(S21:YES)、マイク特性が調整されて、残留エコーが低減される(S24)。音楽モードに設定されているときには、ユーザはスピーカから出力される音楽を聴くことを主目的にしている場合が多い。このため、ユーザが聴いている音楽に影響を与えるスピーカ特性を調整するのではなく、マイク特性を調整するのである。これによって、ユーザが、聴いている音楽に影響を与えることを防止できる。
また、会話モードに設定されているときには(S21:NO)、スピーカ特性が調整されて、残留エコーが低減される(S27)。会話モードに設定しているときは、会話の相手が、音調整装置1のユーザの発言を注意深く聴いている場合が多い。このため、会話の相手先に送信されるマイク113からの音に影響を与えるマイク特性を調整するのではなく、スピーカ特性を調整するのである。これによって、会話の相手先が聴く声に影響を与えることを防止することができる。
また、ユーザの意図する目的に応じてモードを決定して(S17)、周波数特性やダイナミックレンジを調整する共に(S19及びS20)、ユーザの意図する目的に応じて残留エコーを低減するための調整対象(マイク特性又はスピーカ特性)を決め、残留エコーを低減することができる(S24及びS27)。このため、ユーザの意図する目的にあった音質、音量でユーザが音調整装置1を使用できると共に、残留エコーが残って会話の相手に不快なエコーを聴かせることを防止できる。
また、残留エコーが所定条件(残留エコーのレベルが所定値以下であるという条件)を満たすように自動で調整される(S24及びS27)。故に、ユーザが音調整装置1を操作するなどして、残留エコーのレベルが所定値以下となるようにする必要がない。よって、ユーザの利便性が向上する。
また、マイク特性やスピーカ特性が調整されると、残留エコーのレベルが変化する可能性があるが、本実施形態では、S24及びS27で残留エコーが所定値以下になるように抑えられるので、残留エコーが増大することを防止できる。
上記実施形態において、S11の処理を行うCPU101が本発明の「状態取得手段」に相当し、S17の処理を行うCPU101が本発明の「モード決定手段」に相当する。S24、S27、S35、S37、S39、S40、S53、S55、及びS56の処理を行うCPU101が本発明の「特性調整手段」に相当する。音楽優先値が本発明の「音楽優先情報」に相当し、会話優先値が本発明の「会話優先情報」に相当する。優先対応データテーブル95が本発明の「優先対応データ」に相当し、フラッシュメモリ104が本発明の「記憶手段」に相当する。S12の処理を行うCPU101が本発明の「第一判断手段」に相当し、S23及びS26の処理を行うCPU101が本発明の「第二判断手段」に相当する。S11の処理が本発明の「状態取得ステップ」に相当し、S17の処理が本発明の「モード決定手ステップ」に相当する。S24、S27、S35、S37、S39、S40、S53、S55、S56の処理が本発明の「特性調整ステップ」に相当する。
なお、本発明は上記の実施形態に限定されるものではなく、種々の変更が可能である。例えば、音調整装置1の形状が長方体状であったが、これに限定されない。例えば、音調整装置1の形状は、円盤形状など、他の形状であってもよい。また、マイク113は、2つのマイク(左マイク1131及び右マイク1132)で構成されていたが、これに限定されない。例えば、マイク113は1つのマイクで構成されてもよいし、3以上のマイクで構成されてもよい。また、音調整装置1のサイズは限定されず、例えば、名刺サイズ程度のサイズであってもよいし、PC2より大きいサイズであってもよい。
音調整装置1が向く方向は、上方向と水平方向に限定されない。例えば、斜め上方向に向いてもよい。また、CPU101は、音調整装置1が斜め上方向に向いていることを検出し、例えば、S32において、水平方向であるか否かを判断するのではなく、斜め上方向に向いているか否かを判断するなど、検出結果を処理に使用してもよい。
また、優先値はユーザが想定モードに設定しようとしている確率に対応していたが、これに限定されない。例えば、優先値は、ユーザの使用態様など、他の要素に基づいて設定されてもよい。例えば、優先対応データテーブル95(図6参照)において、状態「マイク・スピーカストリーム通信」には、想定モード「会話モード」、優先値「3」が対応付けられている。また、状態「スピーカストリーム通信」には、想定モード「音楽モード」、優先値「2」が対応付けられている。つまり、「マイク・スピーカストリーム通信」の会話優先値「3」が「スピーカストリーム通信」の音楽優先値「2」より大きい値(優先度が高い値)に設定されている。この優先値は例えば、以下のような根拠で設定されてもよい。
すなわち、ユーザは、PC2上で動作するアプリケーションを選択し、種々のアプリケーションを実行することができる。この場合、例えば、ユーザが音楽を聴くためのアプリケーションを実行して音楽を聴いている状態で、さらに会話を行うアプリケーションを実行し、音楽を再生したまま会話をするなど、スピーカストリーム通信と、マイク・スピーカストリーム通信との間で切り替えられる場合がある。音調整装置1のCPU101は、スピーカストリーム通信とマイク・スピーカストリーム通信とが切り替えられたことを検出できるが、PC2で実行されるアプリケーションが追加、変更されたことを検出することができない。このため、CPU101は、ユーザが会話のみをおこなっているのか、音楽を聴きながら会話を行っているのかを判断することができない。
ここで、音楽モードでは高音質再生が設定されるので、高音質再生の設定が解除される会話モードの場合に比べて再生帯域が広く、エコーが発生し易くなる場合がある。よって、仮にエコーキャンセラ116によるエコーの低減が行われない場合、エコーを他の拠点に送信してしまう可能性が高くなる。このため、ユーザが音楽を聴きながら会話を行うという使用態様の存在に基づいて、「マイク・スピーカストリーム通信」の会話優先値「3」を、「スピーカストリーム通信」の音楽優先値「2」より大きい値(優先度が高い値)に設定してある。これによって、スピーカストリーム通信と、マイク・スピーカストリーム通信との間で切り替えられた場合に、エコーを他の拠点に送信してしまう可能性が高くなる音楽モードよりも、音楽の音質が下がっても、エコーを他の拠点に送信してしまう可能性が低い会話モードに設定されやすいようにすることができる。以上の例示のように、優先値が使用態様に基づいて設定されてもよい。
また、会話設定処理(図8参照)では、マイク特性の調整(S35及びS37)と、スピーカ特性の調整(S39)と、ダイナミックレンジの調整(S40)とが行われていたが、これに限定されない。例えば、会話設定処理では、スピーカ特性とマイク特性とダイナミックレンジとの少なくとも1つの特性が調整されてもよい。
また、音楽設定処理(図9参照)では、スピーカ特性の調整(S53及びS55)と、ダイナミックレンジの調整(S56)とが行われていたが、これに限定されない。例えば、音楽設定処理では、スピーカ特性とマイク特性とダイナミックレンジとの少なくとも1つの特性が調整されてもよい。
また、DRCの設定、解除(S14、S40及びS56)は、高音質再生の設定、解除(S14、S39及びS55)と一緒に行われていたが、DRCの設定、解除は、高音質再生の設定、解除と一緒に行われなくてもよい。
また、音楽設定処理では、DRCが解除されていたが(S56)、解除するのではなく、会話設定処理の場合(S40)の場合よりDRCによるダイナミックレンジの圧縮を小さくしてもよい。すなわち、DRCを設定しつつも、会話設定処理の場合よりダイナミックレンジを広くしてもよい。この場合でも、会話設定処理におけるダイナミックレンジより広いダイナミックレンジで音楽を再生できるので、ユーザが高音質な音楽を聴くことができる。
また、音調整装置1は、DRCを設定、解除するためのボタン(以下「DRCボタン」という。)を備えていなかったが(図5参照)、これに限定されない。例えば、音調整装置1は、DRCボタンを備えていてもよい。また、優先対応データテーブル95にDRCボタンについての対応関係が登録されていてもよい。例えば、優先対応データテーブル95(図5参照)において、部品「DRCボタン」、状態「オン(設定)」に、想定モード「会話モード」、優先値「2」が対応付けられ、部品「DRCボタン」、状態「オフ(解除)」に、想定モード「音楽モード」、優先値「3」が対応付けられていてもよい。
また、会話設定処理(図8参照)及び音楽設定処理(図9参照)におけるスピーカ特性及びマイク特性の調整を行う処理は、ビームフォーミングの設定・解除(S35及びS36)、高音質再生の設定・解除(S55及びS39)、ボリュームの低減(S53)等であったが、これに限定されない。例えば、種々の音質調整機能(例えば、低音をブーストする機能など)の設定・解除、マイクで集音した音から人の声の周波数領域のみの音を取り出すフィルタ機能の設定・解除等であってもよい。
また、S24では、マイク特性のみが調整され、残留エコーが低減されていたが、これに限定されない。少なくともマイク特性が調整されればよく、例えば、マイク特性とスピーカ特性とが調整されてもよい。
また、S27では、スピーカ特性のみが調整され、残留エコーが低減されていたが、これに限定されない。少なくともスピーカ特性が調整されればよく、例えば、スピーカ特性とマイク特性とが調整されてもよい。
また、マイク特性における周波数領域全体(可聴領域である20Hz〜20kHz全体)の利得が下げられることで、残留エコーが低減されていた(S24)。また、スピーカ特性における周波数領域全体の利得が下げられることで、残留エコーが低減されていた(S27)。しかし、これに限定されない。例えば、一部の周波数帯域の残留エコーのみが、所定値より大きい場合、該一部の周波数帯域のみの利得を下げることで、残留エコーを低減してもよい。
また、S11で取得される設定状態、接続状態、通信状態の各状態情報は、優先対応データテーブル95の部品欄に記載の7つの状態の情報であったが、状態情報として取得する状態の数は限定されない。例えば、S11では、1以上の設定状態と、1以上の接続状態と1以上の通信状態とのうち、少なくとも2つの状態を状態情報として取得してもよい。例えば、2つの接続状態(ディジーチェーン端子120とモジュラージャック118との接続状態)についての状態情報のみ取得し(S11)、モードを決定してもよい(S17)。
また、優先値が大きいほど、優先度が高かったが、これに限定されない。例えば、優先値が小さいほど、優先度が高くてもよい。すなわち、ユーザが想定モードに設定しようとしている確率が高いほど、優先値を小さくしてもよい。この場合、S17でモードが決定される際には、優先値の合計値が小さいモードが設定するモードとして決定される。また、優先値の値は0〜3で設定されているが、これに限定されず、優先値の値は任意の値であってもよい。
また、優先値の合計値が高いモードが、設定するモードとして決定されていたが(S15〜S17)、これに限定されない。例えば、メイン処理(図7参照)のS15〜S17の処理を以下のように変形することで、モードを決定してもよい。すなわち、S11で取得された状態情報のうち、優先対応データテーブル95において、想定モード「音楽モード」に対応付けられている状態情報の数と、想定モード「会話モード」に対応付けられている状態情報の数とを取得し(S15)、両者の数を比較する(S16)。そして、音楽モードと会話モードとのうち、状態情報の数が大きい方に対応するモードを設定するモードとして決定してもよい(S17)。なお、この場合、優先対応データテーブル95において優先値は対応付けられていなくてもよい。
例えば、高音質再生が解除されている状態で、ユーザが高音質再生ボタン106をオンし、状態情報として、高音質再生ボタン106「オン」、マイクミュートボタン109「操作されていない」、ビームフォーミングボタン107「操作されていない」、ライン入出力端子119「4極プラグ125」、USB端子121「スピーカストリーム通信」、ディジーチェーン接続「接続なし」、モジュラージャック「接続なし」が取得されたとする(S11)。この場合、想定モード「音楽モード」に対応付けられている状態情報は、高音質再生ボタン106「オン」とUSB端子121「スピーカストリーム通信」との2つである。また、想定モード「会話モード」に対応付けられている状態情報は、ライン入出力端子119「4極プラグ125」の1つである。このため、想定モード「音楽モード」に対応付けられている状態情報の数が、想定モード「会話モード」に対応付けられている状態の数より多い(S15、S16)。よって、音楽モードが設定するモードとして決定される(S17)。
本変形例では、多数決によってモードを決定することができる。このため、数を反映しない場合に比べてより確実に、ユーザが意図する目的に合致したモードに設定できる。本変形例において、優先対応データテーブル95の想定モード「音楽モード」が本発明の「音楽優先情報」に相当し、想定モード「会話モード」が本発明の「会話優先情報」に相当する。S16およびS17の処理が本発明の「モード決定手段」に相当する。
また、S22〜S27において、リアルタイムに調整される対象は、残留エコーに限定されない。例えば、音に関連する情報が所定条件を満たすように、マイク特性と、スピーカ特性と、ダイナミックレンジのうち、少なくとも1つをさらに調整するようにしてもよい。例示として、以下の第一〜第三の変形例について説明する。
第一の変形例について説明する。一般的に、スピーカ112に入力された音をスピーカ112が出力(再生)する場合には、高調波歪が発生する。例えば、300Hzの音を再生した場合、基本周波数(300Hz)の倍数(600Hz、900Hzなど)に高調波歪による音が発生する。このため、エコーキャンセラ116で処理して基本周波数のエコーを低減しても、高調波歪の音は十分に低減できない場合がある。この結果、エコーが残る場合がある。故に、第一の変形例では、CPU101は、高調波歪による音圧レベルが所定値より大きくになった場合に、高調波歪による音圧レベルを所定値以下に低減する処理を行う。
第一の変形例の場合、図7のS22〜S27が以下のように変形される。エコーキャンセラ116で処理された後の高調波歪の音圧レベルが検出される(S22及びS25)。検出された高調波歪の音圧レベルが基本周波数成分に対して所定値(例えば、30dB)以下であるか否かが判断される(S23及びS26)。高調波歪の音圧レベルが所定値より大きい場合、高調波歪の音圧レベルが所定値以下ではないと判断され(S23:NO、及び、S26:NO)、高調波歪の音を低減するように処理が行われる(S24及びS27)。S24及びS27では、例えば、スピーカ112から出力する音の音量を下げることで、高調波歪の音圧レベルが所定値以下に下げられる。すなわち、スピーカ特性が調整される。また、他の処理の例としては、高調波歪の音を除去するフィルタによってマイク113から入力された音が処理され、高調波歪の音圧レベルが低減されてもよい。すなわち、マイク特性が調整されてもよい。また、例えば、S24では、マイク特性を調整して高調波の音圧レベルを下げ、S27ではスピーカ特性を調整して高調波の音圧レベルを下げてもよい。
このように、第一の変形例では、高調波歪によるエコーを防止することができる。また、高調波歪の音圧レベルが所定条件(高調波歪の音圧レベルが所定値以下であるという条件)を満たすように自動で調整される。故に、ユーザが音調整装置1を操作するなどして、高調波歪の音圧レベルが所定値以下になるようにする必要がない。よって、ユーザの利便性が向上する。
第一の変形例において、高調波歪の音圧レベルが本発明の「音関連情報」に相当し、高調波歪の音圧レベルが所定値以下であるという条件が本発明の「所定条件」に相当する。S23及びS26の処理を行うCPU101が本発明の「第二判断手段」に相当し、S24及びS27の処理を行うCPU101が本発明の「特性調整手段」に相当する。
第二の変形例について説明する。マイク113から入力される信号に含まれる雑音レベルは、周囲の騒音や周囲の電気的特性によって変動する。例えば、音調整装置1のマイク113を電気機器の電源に近づけた場合にハムノイズが生じる虞がある。このため、第二の変形例では、CPU101は、マイク113から入力される信号に含まれる雑音レベルが所定値より大きくなった場合にマイク特性を調整し、雑音レベルを所定値以下にする。
第二の変形例の場合、図7のS22〜S27が以下のように変形される。マイク113から入力される信号に含まれる雑音レベルが検出される(S22及びS25)。検出された雑音レベルが所定値(例えば、−60dB)以下であるか否が判断される(S23及びS26)。雑音レベルが所定値以下でなければ(S23:NO、及びS26:NO)、駆動回路115が制御され、雑音レベルが所定値以下となるようにマイク特性が調整される(S24及びS27)。S24及びS27では、例えば、雑音が発生した周波数の信号を低減できるノッチフィルタやハイパスフィルタ等によって、雑音が低減される。
このように、第二の変形例では、周囲の騒音や周囲の電気的特性によって発生する雑音を低減することができる。また、雑音レベルが所定条件(雑音レベルが所定値以下であるという条件)を満たすように自動で調整される。故に、ユーザが音調整装置1を操作するなどして、雑音レベルが所定値以下となるようにする必要がない。よって、ユーザの利便性が向上する。
第二の変形例において、雑音レベルが本発明の「音関連情報」に相当し、マイク113から入力される信号に含まれる雑音レベルが所定値以下であるという条件が、本発明の「所定条件」に相当する。S23及びS26の処理を行うCPU101が本発明の「第二判断手段」に相当し、S24及びS27の処理を行うCPU101が本発明の「特性調整手段」に相当する。
第三の変形例について説明する。CPU101は、他の拠点から送信された音声をスピーカ112から出力する場合にエコーキャンセラ116の機能を動作(設定)させ、他の拠点から音声が送信されていない場合にエコーキャンセラ116の機能を停止(解除)することができるとする。この場合、音声会議中にエコーキャンセラ116の動作と停止とが繰り返される場合がある。この結果、エコーキャンセラ116が動作している場合の音声と解除されている場合の音声とが他の拠点に送信される。エコーキャンセラ116の機能が動作している状態から停止されている状態に切り替えられると、エコーキャンセラ116の効果によって他の拠点で再生される雑音が急に静かになる場合がある。この場合、他の拠点のユーザは、通信が途切れたのではないかと不安になる虞がある。そこで、第三の変形例では、エコーキャンセラ116によって処理された後の雑音が、所定値(例えば、−80dB)より小さい雑音レベルである場合に、所定値以上のレベルの雑音を他の拠点に送信する処理を行う。
第三の変形例の場合、図7のS22〜S27が以下のように変形される。エコーキャンセラ116で処理された後の雑音レベルが検出される(S22及びS25)。検出された雑音レベルが所定値(例えば、−80dB)以上であるか否かが判断される(S23及びS26)。雑音レベルが所定値より小さい場合、雑音レベルが所定値以上でないと判断され(S23;NO、及び、S26:NO)、駆動回路115が制御され、エコーキャンセラ116を動作させつつ、雑音レベルを所定値以上残すように処理が行われる(S24及びS27)。すなわち、マイク特性が調整される。これによって、所定値以上のレベルの雑音を含んだ音声が他の拠点に送信される。故に、他の拠点のユーザが、通信が途切れたのではないかと不安になることを防止できる。また、雑音レベルが所定条件(雑音レベルが所定値以上であるという条件)を満たすように自動で調整される。故に、ユーザが音調整装置1を操作するなどして、雑音レベルが所定値以上となるようにする必要がない。よって、ユーザの利便性が向上する。
第三の変形例において、エコーキャンセラ116で処理された後の雑音レベルが本発明の「音関連情報」に相当し、雑音レベルが所定値以上であるという条件が、本発明の「所定条件」に相当する。S23及びS26の処理を行うCPU101が本発明の「第二判断手段」に相当し、S24及びS27の処理を行うCPU101が本発明の「特性調整手段」に相当する。
また、他の変形例としては、常にDRCを設定、又は解除しておくのではなく、通常状態ではDRCを解除した状態にしておき、残留エコーが所定値以下ではない場合にのみ(S23:NO、S26:NO)、DRCを設定して残留エコーを低減するようにしてもよい(S24及びS27)。