JP2010021627A - 音量調整装置、音量調整方法および音量調整プログラム - Google Patents

音量調整装置、音量調整方法および音量調整プログラム Download PDF

Info

Publication number
JP2010021627A
JP2010021627A JP2008177933A JP2008177933A JP2010021627A JP 2010021627 A JP2010021627 A JP 2010021627A JP 2008177933 A JP2008177933 A JP 2008177933A JP 2008177933 A JP2008177933 A JP 2008177933A JP 2010021627 A JP2010021627 A JP 2010021627A
Authority
JP
Japan
Prior art keywords
music
noise
data
information
volume
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008177933A
Other languages
English (en)
Inventor
Kazutomo Kenmochi
千智 劔持
Shiro Suzuki
志朗 鈴木
Hidesuke Takahashi
秀介 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2008177933A priority Critical patent/JP2010021627A/ja
Publication of JP2010021627A publication Critical patent/JP2010021627A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Headphones And Earphones (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】再生音量を周囲の環境騒音に適した音量となるように調整し、音漏れを防止する。
【解決手段】ユーザが再生装置1に対して再生音量の自動調整を指示すると、再生装置1は、マイク3によって収音された環境騒音の騒音データに対して周波数解析を行い、特徴量としてエンベロープ情報NPeおよびパワー情報NPpを算出する。そして、算出された特徴量に基づき環境騒音を分類する。また、再生装置1は、再生中の楽曲の楽曲データに対して周波数解析を行い、特徴量としてエンベロープ情報MPe’およびパワー情報MPp’を算出する。そして、算出された特徴量に基づき楽曲を分類する。再生装置1は、環境騒音および楽曲の分類結果に基づき、音漏れ認知情報データベース43を参照して音漏れ認知情報を生成し、音漏れ認知情報に基づき楽曲の再生音量を音漏れが認識されない程度の音量に設定する。
【選択図】図6

Description

この発明は、音漏れを防止する音量調整装置、音量調整方法および音量調整プログラムに関する。
近年、外出先や屋外等において楽曲の再生が可能な携帯型再生装置が広く普及している。図19に示すように、従来の再生装置101は、ヘッドフォン102が接続され、ユーザがヘッドフォン102を介して再生装置101に記録された楽曲を聴取するようにされている。再生装置101には、楽曲の再生/停止や、音量の調整といった操作を行うための操作部が設けられている。ユーザが操作部を操作することにより、再生される楽曲の音量を調整することができる。
例えば、このような再生装置を用いて、電車の車内で楽曲を再生している場合において、電車が「走行中」の場合には、周囲の環境騒音が大きいため、ユーザによって操作部が操作され、楽曲を適切に聴取することができるように音量が大きく設定される。また、電車が「停車中」の場合には、周囲の環境騒音が「走行中」と比較して小さくなるため、ユーザにより音量が小さく設定される。
従来の再生装置101における再生方法について、図20に示すフローチャートを参照して説明する。ステップS101において、再生装置101の電源がONとされ、ステップS102において再生装置101に記録された楽曲が再生される。
ステップS103では、音量を調整するか否かが判断される。例えば、周囲の環境騒音によって楽曲の聴取が困難であり、音量を調整する必要があると判断された場合には、処理がステップS104に移行し、ユーザによる操作部に対する操作によって音量が設定される。一方、音量を調整する必要がないと判断された場合には、処理がステップS105に移行する。
ステップS105では、楽曲を聴き続けるか否かが判断される。楽曲を聴き続けると判断された場合には、処理がステップS102に戻り、楽曲が再生される。一方、楽曲を聴き続けないと判断された場合には、処理がステップS106に移行し、再生装置101の電源がOFFとされて一連の処理が終了する。
このように、従来の再生装置では、ユーザが周囲の環境騒音を認識し、その認識に基づいて楽曲を適切に聴取することができるように、音量を手動で調整するようにしていた。
しかしながら、このように音量を手動で設定するような場合、設定された音量によっては、ヘッドフォンからの音漏れによって周囲に迷惑をかけてしまう場合がある。これは、ユーザが、周囲の騒音が気にならなくなる程度の音量に設定するためであったり、ユーザ自身が周囲への音漏れを認識することができないためであるからと考えられる。
特に、電車やバスの車内等、周囲の環境騒音が大きく変化する場所では、音漏れの問題が顕著である。例えば、電車やバスが「走行中」である場合は、周囲の環境騒音が大きいため、この騒音に合わせて音量を大きく設定する。この時点では、音漏れが周囲の人に認識されることはほとんどないが、音量を大きく設定した状態で電車やバスが「停車中」となった場合には、走行中と比較して環境騒音が小さくなるため、音漏れが認識されやすくなってしまう。
一方、電車やバスが「停車中」である場合は、周囲の環境騒音が「走行中」と比較して小さいため、周囲の環境騒音に合わせて音量を小さく設定するので、周囲への音漏れはほとんど認識されない。しかしながら、電車やバスが「走行中」となった場合には、環境騒音が大きくなるため、楽曲の聴取が困難となってしまう。
また、雑踏のような騒々しく、音漏れが発生しても周囲でほとんど認識することができない場所から、喫茶店のような静かな場所に移動した場合にも同様に、音漏れが周囲の人に認識されやすくなってしまう。
さらに、環境騒音が変化しない場合であっても、聴取している楽曲が変わって録音レベルや曲調が変化した場合に、音漏れの問題が発生することがある。例えば、電車やバスが「走行中」に、聴取している楽曲が「クラシック」に分類されるような静かな曲調の楽曲から「ロック」に分類されるような楽曲に変わる場合について考える。このような場合には、「クラシック」を聴取している際に、環境騒音に合わせて大きい音量で聴取していたが、楽曲が「ロック」に変わった際に録音レベルや曲調が大きく変化したため、耳が痛くなったり、周囲の人に音漏れが認識されやすくなると考えられる。
このように、環境騒音が変化する場合や、再生中の楽曲の音量や曲調が変化する場合には、ユーザが環境騒音や楽曲の変化に応じて音量をその都度調整し、音漏れを防止する必要がある。
そこで、最近では、周囲への音漏れを防止するため、AVLS(Automatic Volume Limiter System)など、再生中のオーディオ信号の状態を常に監視し、予め設定された信号レベルの上限を超えないように音量を調整する技術が実用化されている。例えば、下記の特許文献1には、オーディオ信号の中高音の信号レベルを検出し、検出結果に基づいて信号レベルを抑圧して音漏れが発生しないように音量を調整する技術が記載されている。
特開平5−49091号公報
しかしながら、特許文献1に記載された方法では、周囲の環境騒音が略一定であるような環境においては音漏れを防止することができるが、環境騒音が略一定でなく変化する場合や、移動などによって環境そのものが変化した場合には、その変化に追従することが困難であるという問題点があった。
例えば、環境騒音が変化した場合、環境騒音の状態によっては、信号レベルが上限値を超えてしまうような音量に設定しても音漏れが検知されないこともあれば、信号レベルが上限値以下となるような音量に設定しても音漏れが検知されてしまうこともある。
また、ノイズキャンセリングヘッドフォンを用いた再生装置のように、環境騒音などの外部の音を収音し、再生音に外部の音を打ち消す成分を付加することにより、環境騒音を低減させる方法も実用化されている。環境騒音を低減させることにより、楽曲を聴取する際の音量が小さくても適切に聴取することができる。
しかしながら、この場合には、ユーザの耳に聞こえる環境騒音を低減させることによって、再生音を聴き取るのが困難となるのをある程度防ぐことができるが、環境騒音の種類によっては、環境騒音の低減効果を十分に発揮できない場合がある。
また、再生音量を手動で調整する場合には、例えば再生装置に設けられた操作部を操作する必要がある。そのため、環境騒音が変化するたびに、操作部をいちいち操作しなければならない。さらに、再生装置の小型化に伴い、再生装置に設けられた操作部も小型化している。そのため、再生音量を調整する操作が非常に煩わしいという問題点があった。
したがって、この発明の目的は、再生音量を周囲の環境騒音に適した音量となるように自動的に調整し、音漏れを防止することができる音量調整装置、音量調整方法および音量調整プログラムを提供することにある。
上述した課題を解決するために、第1の発明は、周囲の環境の騒音データを収音する収音部と、
収音部により収音された騒音データの特徴を示す特徴量を抽出する騒音解析部と、
騒音データの特徴量に基づき騒音データを分類し、騒音データの分類結果を示す騒音分類情報を生成する騒音分類部と、
入力された楽曲データの特徴を示す特徴量を抽出する楽曲解析部と、
楽曲データの特徴量に基づき楽曲データを分類し、楽曲データの分類結果を示す楽曲分類情報を生成する楽曲分類部と、
騒音分類情報および楽曲分類情報と、楽曲データの再生音量の調整幅を決定する音漏れ認知情報とが関連付けられて記録された音漏れ認知情報データベースと、
騒音分類情報および楽曲分類情報に基づき、音漏れ認知情報データベースを参照することにより音漏れ認知情報を生成する音漏れ認知情報生成部と、
音漏れ認知情報に基づき、楽曲データの再生音量を調整するための音量調整情報を生成し、音量調整情報に基づき楽曲データの再生音量を調整するように制御する制御部とを備える音量調整装置である。
また、第2の発明は、周囲の環境の騒音データを収音する収音ステップと、
収音ステップにより収音された騒音データの特徴を示す特徴量を抽出する騒音解析ステップと、
騒音データの特徴量に基づき騒音データを分類し、騒音データの分類結果を示す騒音分類情報を生成する騒音分類ステップと、
入力された楽曲データの特徴を示す特徴量を抽出する楽曲解析ステップと、
楽曲データの特徴量に基づき楽曲データを分類し、楽曲データの分類結果を示す楽曲分類情報を生成する楽曲分類ステップと、
騒音分類情報および楽曲分類情報に基づき、騒音分類情報および楽曲分類情報と、楽曲データの再生音量の調整幅を決定する音漏れ認知情報とが関連付けられて記録された音漏れ認知情報データベースを参照することにより音漏れ認知情報を生成する音漏れ認知情報生成ステップと、
音漏れ認知情報に基づき、楽曲データの再生音量を調整するための音量調整情報を生成し、音量調整情報に基づき楽曲データの再生音量を調整するように制御する制御ステップとを備える音量調整方法である。
また、第3の発明は、周囲の環境の騒音データを収音する収音ステップと、
収音ステップにより収音された騒音データの特徴を示す特徴量を抽出する騒音解析ステップと、
騒音データの特徴量に基づき騒音データを分類し、騒音データの分類結果を示す騒音分類情報を生成する騒音分類ステップと、
入力された楽曲データの特徴を示す特徴量を抽出する楽曲解析ステップと、
楽曲データの特徴量に基づき楽曲データを分類し、楽曲データの分類結果を示す楽曲分類情報を生成する楽曲分類ステップと、
騒音分類情報および楽曲分類情報に基づき、騒音分類情報および楽曲分類情報と、楽曲データの再生音量の調整幅を決定する音漏れ認知情報とが関連付けられて記録された音漏れ認知情報データベースを参照することにより音漏れ認知情報を生成する音漏れ認知情報生成ステップと、
音漏れ認知情報に基づき、楽曲データの再生音量を調整するための音量調整情報を生成し、音量調整情報に基づき楽曲データの再生音量を調整するように制御する制御ステップとを備える音量調整方法をコンピュータ装置に実行させる音量調整プログラムである。
上述したように、第1、第2および第3の発明では、周囲の環境の騒音データを収音し、収音ステップにより収音された騒音データの特徴を示す特徴量を抽出し、騒音データの特徴量に基づき騒音データを分類し、騒音データの分類結果を示す騒音分類情報を生成し、入力された楽曲データの特徴を示す特徴量を抽出し、楽曲データの特徴量に基づき楽曲データを分類し、楽曲データの分類結果を示す楽曲分類情報を生成し、騒音分類情報および楽曲分類情報に基づき、騒音分類情報および楽曲分類情報と、楽曲データの再生音量の調整幅を決定する音漏れ認知情報とが関連付けられて記録された音漏れ認知情報データベースを参照することにより音漏れ認知情報を生成し、音漏れ認知情報に基づき、楽曲データの再生音量を調整するための音量調整情報を生成し、音量調整情報に基づき楽曲データの再生音量を調整するようにしているため、楽曲の再生音量が周囲の騒音に対して適切な音量に調整される。
この発明は、収音部によって収音された周囲の環境の騒音データから特徴量を抽出し、抽出された騒音データの特徴量に基づき騒音データを分類する。また、記録媒体に記録された楽曲データから特徴量を抽出し、抽出された楽曲データの特徴量に基づき楽曲データを分類する。そして、騒音データおよび楽曲データの分類結果に基づき、楽曲データの再生音量を調整するようにしている。そのため、ユーザが音量を調整することなく適切に楽曲を聴取することができるとともに、周囲に対する音漏れを防ぐことができるという効果がある。
以下、この発明の実施の第1の形態について、図面を参照しながら説明する。図1は、この発明の実施の第1の形態に適用可能な再生装置1の一例の使用形態を示す。図1に示す例では、携帯型音楽再生装置などの再生装置1に対してヘッドフォン2およびマイクロフォン3(以下、マイク3と適宜称する)が接続され、ユーザがヘッドフォン2を介して、再生装置1に記録された楽曲を聴取している状態を示す。マイク3は、ヘッドフォン2の外部に設けられ、ユーザがヘッドフォン2を装着した状態での耳の位置で聞こえる環境騒音を収音する。なお、マイク3は、ヘッドフォン2の内部や再生装置1に設けるようにしてもよい。
ユーザが再生装置1に対して再生音量の自動調整を指示すると、再生装置1は、マイク3によって収音された環境騒音の騒音データを解析し、特徴量を抽出する。そして、抽出された特徴量に基づき、例えば環境騒音を「電車走行中」や「電車停車中」など、現在の環境に分類する。また、再生装置1は、再生中の楽曲の楽曲データを解析し、特徴量を抽出する。そして、抽出された特徴量に基づき、例えば楽曲を「ロック」や「クラシック」などのカテゴリに分類する。再生装置1は、このようにして分類された環境騒音および楽曲の分類結果に基づき、楽曲の再生音量を音漏れが認識されない程度の音量に設定する。
先ず、この発明の実施の第1の形態に対する理解を容易とするため、音漏れの発生について概略的に説明する。音漏れは、ヘッドフォン2から出力された楽曲の音声信号がヘッドフォン2自身を通過して外部に漏れ出すことによって発生する。このとき、ヘッドフォン2から出力された楽曲の音声信号は、ヘッドフォン2によって減衰された状態で外部に漏れ出す。
図2は、環境騒音およびヘッドフォン2を介して外部に漏れた楽曲の一例の周波数特性を示す。図2において、横軸が周波数を示し、縦軸が各周波数におけるパワーを示す。環境騒音のエンベロープで囲まれた領域はマスク領域Xであり、このマスク領域X内の楽曲のデータは、環境騒音によってマスクされてしまうため、周囲に音漏れとして認識されることはない。
一般に、楽曲の所定周波数成分におけるパワーが環境騒音のパワーよりも大きい場合に、音漏れが認識される。例えば、図2Aに示す例では、楽曲のエンベロープで囲まれた領域のうち、マスク領域Xから外れた領域Y(以下、音漏れ領域Yと適宜称する)が存在する。この場合、この音漏れ領域Yの成分は、環境騒音によってマスクされていない。すなわち、楽曲のデータのうち、この音漏れ領域Yの成分が周囲に音漏れとして認識されることになる。
したがって、図2Bに示すように、ヘッドフォン2の外部に漏れ出す楽曲の各周波数成分が環境騒音のマスク領域X内となるように楽曲の音量を調整することにより、音漏れを防止することができる。
また、例えば、環境騒音が図2Cに示す状態から図2Dに示す状態に変化した場合、図2Cに示す例では、楽曲の各周波数成分が環境騒音のマスク領域X内にあるが、図2Dに示す例では、楽曲の各周波数成分の一部がマスク領域Xから外れてしまう。このような場合には、環境騒音の変化に追従して楽曲の再生音量を下げることにより、音漏れを防止することができる。なお、環境騒音が低下するような状況は、環境騒音が静かになった場合に生じることが多いため、再生音量を下げてもユーザが楽曲を聴取しづらくなることはない。
次に、環境騒音および楽曲から抽出される特徴量について説明する。周囲の環境騒音は、電車・バスの車内や喫茶店など、その環境によってそれぞれ異なる。これらの環境騒音は、例えば、可聴周波数帯における低域の音量が大きい場合や、高域の音量が大きい場合など、環境によって異なる特徴を有している。
図3A、図3Bおよび図3Cは、それぞれ「喫茶店」、「電車」および「バス」において収音された環境騒音の周波数特性の一例を示す。この例は、収音された環境騒音の0.5秒程度の時間データに対してFFT(Fast Fourier Transform)により周波数解析を行った際の周波数特性である。これらの図において、横軸が周波数[Hz]を示し、縦軸がパワー[dB]を示す。図3A〜図3Cによれば、様々な環境において、各周波数におけるパワーの値が大きく異なることが判断できる。したがって、このような特徴を抽出することにより、ユーザがどのような環境にいるのかを判断することができる。
ところで、FFTによる周波数解析では、解析される時間データのサンプル数をx個とすると、パワーとして得られる周波数データは、x/2本となる。このとき、環境騒音の解析の精度を高めるためには、周波数分解能を高くする必要がある。そのためには、サンプル数をある程度の大きさに設定する必要がある。例えば、時間データのサンプル数を32768個とした場合、得られる周波数データは、16384本となる。
このようにして得られる環境騒音の周波数特性に基づき、例えば、各周波数におけるデータを特徴量として用いることができると考えられるが、この16384本の周波数データを環境騒音の特徴量として用いた場合、データが膨大となってしまうため、処理に時間を要してしまう。また、周波数データの時間的な変動も大きくなってしまうため、実用的ではない。
そこで、例えば、図4A、図4Bおよび図4Cに示すように、それぞれの環境における周波数データのエンベロープの傾き(図4において、点線で示す部分)およびパワーの最大値(図4において、黒丸の部分)に注目する。例えば、電車やバスの車内では、喫茶店と比較して、低域のパワーが大きい。そのため、電車やバスの車内における騒音の周波数特性は、喫茶店における騒音の周波数特性と比較して、エンベロープの傾きが大きく、パワーの最大値が高くなることが判断できる。
したがって、この発明の実施の第1の形態では、この環境騒音の周波数領域におけるエンベロープの傾きおよびパワーの最大値を特徴量として抽出する。
なお、環境騒音および楽曲から抽出される特徴量としては、上述の例に限られず、種々の解析によって得られる情報を特徴量として用いることもできる。例えば、平均音量や周波数スペクトラム、自己相関係数、零軸公差率、パワー、過渡特性、シャープネス、ラウドネス、スペクトルの重心、MFCC(Mel Frequency Cepstrum Coefficient)、音の大きさ(Sone)、ケプストラムなどを特徴量として用いることも可能である。
さらに、時間軸データをある一定のサンプル毎、例えばフレームと呼ばれるようなNサンプル毎に区切り、各フレーム単位で特徴量を抽出し、前後フレーム間における特徴量の比率や差分をとった値を特徴量として用いることも考えられる。また、数フレーム分の特徴量を用いて得られる平均や分散を特徴量として用いることも考えられる。
再生音量の調整方法について説明する。この発明の実施の第1の形態において楽曲の再生音量を調整する場合、ヘッドフォン2の外部における環境騒音と、楽曲がヘッドフォン2の外部に漏れ出す成分とに注目し、これらの特徴量に基づいて環境騒音および楽曲を分類するようにしている。
図5に示すように、ヘッドフォン2から出力された楽曲の信号成分MSは、ヘッドフォン2を通過することによって減衰し、音漏れの信号成分MS’として外部に漏れ出す。また、外部の環境騒音の信号成分NSは、ヘッドフォン2を通過することによって減衰し、信号成分NS’としてユーザの耳の内部に伝わることになる。
このときの各信号成分MSおよびNSが減衰された信号成分MS’およびNS’は、ヘッドフォン2の通過特性に基づく伝達関数Hを用いることによって推定することができる。すなわち、外部における楽曲の音漏れの信号成分MS’は、楽曲の信号成分MSに対して伝達関数Hを畳み込むことによって算出することができる。また、ユーザの耳の内部における信号成分NS’は、環境騒音の信号成分NSに対して伝達関数Hを畳み込むことによって算出することができる。言い換えると、環境騒音の信号成分NSは、ユーザの耳の内部における信号成分NS’に対して逆伝達関数H−1を畳み込むことによって算出することができる。
ところで、マイク3によって環境騒音を収音する場合、マイク3の設置位置によって収音される環境騒音が異なる。例えば、マイク3がヘッドフォン2の外部に設けられている場合、収音される環境騒音の信号成分は、外部の環境騒音の信号成分NSそのものである。一方、マイク3がヘッドフォン2の内部に設けられている場合、収音される環境騒音の信号成分は、外部の環境騒音がヘッドフォン2を通過することによって減衰した信号成分NS’である。
そのため、マイク3がヘッドフォン2の外部に設けられている場合には、収音された環境騒音の信号成分NSをそのまま扱うことにより、ヘッドフォン2の外部における環境騒音の特徴量を正確に抽出することができる。しかしながら、マイク3がヘッドフォン2の内部に設けられている場合に、収音された環境騒音の信号成分NS’をそのまま扱うと、ヘッドフォン2の外部における環境騒音の特徴量を正確に抽出することができない。
そこで、この発明の実施の第1の形態では、マイク3がヘッドフォン2の内部に設けられている場合には、収音した環境騒音の信号成分NS’から環境騒音の信号成分NSを推定し、推定された環境騒音の信号成分NSに基づき特徴量を抽出するようにしている。
先ず、図6を参照して、マイク3がヘッドフォン2の外部に設けられた場合の再生音量調整方法について説明する。この例では、この発明の実施の第1の形態についての理解を容易とするため、環境騒音が「電車走行中」および「電車停車中」のいずれかに分類され、楽曲が「ロック」および「クラシック」のいずれかに分類される場合を例にとって説明する。
マイク3によって収音された環境騒音の騒音データNTが周波数分析部21に供給される。周波数分析部21は、供給された騒音データNTの所定時間、例えば0.5秒間程度の短い時間長を有する騒音データを用いて、騒音データNTに対してFFT分析やOctave分析などの周波数分析を施し、周波数情報NSを取得する。周波数情報NSは、エンベロープ解析部22およびパワー解析部23に供給される。
エンベロープ解析部22は、入力された周波数情報NSに基づき騒音データNTのエンベロープの解析を行い、エンベロープを所定に数値化したエンベロープ情報NPeを算出する。この例では、エンベロープ情報NPeとして、例えばエンベロープの傾きの値が用いられる。算出されたエンベロープ情報NPeは、騒音分類部24に供給される。
パワー解析部23は、入力された周波数情報NSに基づき騒音データNTのパワーの解析を行い、パワーを所定に数値化したパワー情報NPpを算出する。この例では、パワー情報NPpとして、例えばパワーの最大値が用いられる。算出されたパワー情報NPpは、騒音分類部24に供給される。
騒音分類部24は、エンベロープ解析部22から供給されたエンベロープ情報NPeと、パワー解析部23から供給されたパワー情報NPpとに基づき、後述する騒音分類データベース41を参照することによって環境騒音を「電車走行中」や「電車停車中」などに分類する。そして、環境騒音の分類結果を示す騒音分類情報を生成し、音漏れ認知情報取得部30に供給する。
一方、再生装置1に記録され再生が指示された楽曲の楽曲データMTが周波数分析部25に供給される。周波数分析部25は、供給された楽曲データMTの所定時間、例えば0.5秒間程度の短い時間長を有する楽曲データを用いて、楽曲データMTに対してFFT分析やOctave分析などの周波数分析を施し、周波数情報MSを取得する。周波数情報MSは、伝達関数演算部26に供給される。
伝達関数演算部26は、周波数分析部25から供給された周波数情報MSに対して所定の伝達関数Hを畳み込み演算し、ヘッドフォン2の外部に漏れ出す楽曲データMT’に対応する周波数情報MS’を出力する。周波数情報MS’は、エンベロープ解析部27およびパワー解析部28に供給される。
エンベロープ解析部27は、入力された周波数情報MS’に基づき楽曲データMT’のエンベロープの解析を行い、エンベロープを所定に数値化したエンベロープ情報MPe’を算出する。この例では、エンベロープ情報MPe’として、例えばエンベロープの傾きの値が用いられる。算出されたエンベロープ情報MPe’は、楽曲分類部29に供給される。
パワー解析部28は、入力された周波数情報MS’に基づき楽曲データMT’のパワーの解析を行い、パワーを所定に数値化したパワー情報MPp’を算出する。この例では、パワー情報MPp’として、例えばパワーの最大値が用いられる。算出されたパワー情報MPp’は、楽曲分類部29に供給される。
楽曲分類部29は、エンベロープ解析部27から供給されたエンベロープ情報MPe’と、パワー解析部28から供給されたパワー情報MPp’とに基づき、後述する楽曲分類データベース42を参照することによって楽曲を「ロック」や「クラシック」などのカテゴリ毎に分類する。そして、楽曲の分類結果を示す楽曲分類情報を生成し、音漏れ認知情報取得部30に供給する。
音漏れ認知情報取得部30は、騒音分類部24から供給された騒音分類情報と、楽曲分類部29から供給された楽曲分類情報とに基づき、後述する音漏れ認知情報データベース43を参照することにより音漏れ認知情報を生成する。音漏れ認知情報は、例えば、楽曲の再生音量を調整する際に重点を置く周波数帯域の情報や、音量の調整幅、周囲における音漏れの認識度合い等の情報である。生成された音漏れ認知情報は、音量調整部31に供給される。
音量調整部31は、音漏れ認知情報取得部30から供給された音漏れ認知情報に基づき再生音量の判定を行い、楽曲データの再生音量を調整するための音量調整情報を生成する。生成された音量調整情報は、音量選択部32に供給される。
音量選択部32は、音量調整部31から供給された音量調整情報に基づき、楽曲データの音量を調整する。例えば、音量調整情報が楽曲の再生音量を調整することを示す情報である場合には、楽曲の音量を調整する。また、再生音量を調整しないことを示す情報である場合には、楽曲の音量を調整しない。
騒音分類データベース41について説明する。騒音分類データベース41は、様々な環境において実際に収音された騒音データから抽出された特徴量と環境騒音の分類結果とが関連付けられて記録されており、収音された騒音データを環境毎に分類する際に参照されるデータベースである。この例では、環境騒音の特徴量として、エンベロープ情報NPeおよびパワー情報NPpが用いられ、これらの特徴量に基づき、比較対象となる環境騒音が分類される。例えば、環境騒音の特徴量に基づいて騒音分類データベース41を参照することにより、環境騒音が「電車走行中」および「電車停車中」のうちいずれかに分類される。
ここで、騒音分類データベース41の作成方法について説明する。騒音分類データベース41を作成する場合には、図7Aに示すように、先ず、様々な環境において、実際に収音された環境騒音の騒音データを用意する。この例では、例えば、収音された騒音データNTとして、「電車走行中」に収音された騒音データと、「電車停車中」に収音された騒音データとを用意する。そして、これらの騒音データNTを周波数分析部33に供給する。
周波数分析部33は、供給されたそれぞれの騒音データNTに対して周波数分析を施し、周波数情報NSを取得する。取得した周波数情報NSは、エンベロープ解析部34およびパワー解析部35に供給される。エンベロープ解析部34は、周波数情報NSに基づき、それぞれの騒音データNTにおけるエンベロープ情報NPeを算出する。また、パワー解析部35は、周波数情報NSに基づき、それぞれの騒音データNTにおけるパワー情報NPpを算出する。
次に、図7Bに示すように、算出されたエンベロープ情報NPeおよびパワー情報NPpに基づき、それぞれの騒音データNTをエンベロープ情報NPeおよびパワー情報NPpを軸とした2次元平面上にマッピングする。「電車走行中」や「電車停車中」などの環境毎に分類された騒音データNTをマッピングすることにより、2次元平面上には、騒音データNTの分類毎に境界が形成されるので、この分類毎の境界を示す境界線を設定する。
このようにして設定された境界線の情報と、特徴量に基づく2次元平面のデータとを騒音分類データベース41として設定する。したがって、楽曲を再生する際に収音された騒音データNTの特徴量に基づき、この騒音分類データベース41を参照することにより、収音された環境騒音を分類することができる。例えば、収音された騒音データNTのエンベロープ情報NPeおよびパワー情報NPpに基づき騒音分類データベース41とを参照する。そして、収音された騒音データNTが境界線の上側にあれば、環境騒音が「電車走行中」に分類され、境界線の下側にあれば、環境騒音が「電車停車中」に分類される。
なお、分類毎の境界が明確である場合には、人の判断によって境界線を設定してもよい。しかしながら、分類毎の境界が明確でない場合や、特徴量が3次元以上である場合には、人の判断による境界の設定が困難となるため、例えば数学的な手法を用いて、分類毎の境界線を設定すると好ましい。
楽曲分類データベース42について説明する。楽曲分類データベース42は、様々な楽曲データから抽出された特徴量と楽曲の分類結果とが関連付けられて記録されており、再生された楽曲を、例えばカテゴリ毎などに分類する際に参照されるデータベースである。この例では、楽曲の特徴量として、エンベロープ情報MPeおよびパワー情報MPpが用いられ、これらの特徴量に基づき、比較対象となる楽曲が分類される。例えば、楽曲の特徴量に基づいて楽曲分類データベース42を参照することにより、楽曲が「ロック」および「クラシック」のうちいずれかに分類される。
楽曲分類データベース42は、騒音分類データベース41の作成方法と同様の方法により作成することができる。ここでは、楽曲を「ロック」や「クラシック」などのカテゴリ毎に分類する場合を例にとって説明する。例えば、予め「ロック」に分類された楽曲データと、「クラシック」に分類された楽曲データとを用意し、これらの楽曲データMTに対して周波数分析を行い、周波数情報MSを取得する。取得した周波数情報MSに基づき、特徴量であるエンベロープ情報MPeおよびパワー情報MPpを算出する。
次に、算出されたエンベロープ情報MPeおよびパワー情報MPpに基づき、それぞれの楽曲データMTをエンベロープ情報MPeおよびパワー情報MPpを軸とした2次元平面上にマッピングする。「ロック」や「クラシック」などに分類された楽曲データMTをマッピングすることにより、2次元平面上には、楽曲データMTの分類毎に境界が形成されるので、この分類毎の境界線を設定する。
このようにして設定された境界線の情報と、特徴量に基づく2次元平面のデータとを楽曲分類データベース42として設定する。したがって、再生された楽曲データMTの特徴量に基づき、この楽曲分類データベース42を参照することにより、再生された楽曲を分類することができる。例えば、楽曲データMTのエンベロープ情報MPeおよびパワー情報MPpに基づき楽曲分類データベース42とを参照する。そして、楽曲データMTが境界線の上側にあれば、再生された楽曲が「ロック」に分類され、境界線の下側にあれば、楽曲が「クラシック」に分類される。
音漏れ認知情報データベース43について説明する。音漏れ認知情報データベース43は、収音された環境騒音の分類結果と再生中の楽曲の分類結果とに基づき、楽曲の再生音量の調整幅等を決定する際に参照されるデータベースである。音漏れ認知情報データベース43には、図8に示すように、騒音分類情報および楽曲分類情報が関連付けられ、これらの騒音分類情報および楽曲分類情報に対応する音漏れ認知情報が記録されている。
例えば、収音された環境騒音の分類結果を示す騒音分類情報が「電車走行中」であり、再生中の楽曲の分類結果を示す楽曲分類情報が「ロック」である場合には、音漏れ認知情報としての再生音量の調整幅が「大幅」とされる。また、例えば、騒音分類情報が「電車停車中」であり、楽曲分類情報が「クラシック」である場合には、音漏れ認知情報が「小幅」とされる。
ここで、環境および楽曲が変化した場合における騒音分類情報および楽曲分類情報に基づく音漏れ認知情報の決定方法について説明する。ここでは、一例として、ユーザが電車に乗車している間に再生する楽曲が切り替わった場合について考える。
例えば、図9に示すように、期間T0において、電車走行中にクラシックを聴取している場合には、収音された環境騒音の特徴量に基づく騒音分類情報が「電車走行中」となるとともに、再生中の楽曲の特徴量に基づく楽曲分類情報が「クラシック」となる。この場合、「クラシック」に分類される楽曲は、周囲への音漏れが比較的認識されにくいが、「電車走行中」という環境は、周囲の環境騒音が大きく変化することが考えられるので、再生音量を調整する必要がある。したがって、騒音分類情報および楽曲分類情報に基づき図8に示す音漏れ認知情報データベース43を参照することにより、音漏れ認知情報が「中幅」に決定される。
次に、期間T1において周囲の状況が変化し、電車が停車中である場合には、収音された環境騒音の特徴量に基づく騒音分類情報が「電車停車中」となる。この場合、「電車停車中」という環境は、電車走行時の騒音が収まり比較的静かになり、周囲の環境騒音が大きく変化する環境ではないと考えられる。したがって、音漏れ認知情報が「小幅」に決定される。
期間T2において再生中の楽曲が変化し、クラシックからロックに変化した場合には、再生中の楽曲の特徴量に基づく楽曲分類情報が「ロック」となる。この場合、「ロック」に分類される楽曲は、周囲への音漏れが認識されやすいと考えられる。また、周囲の環境の分類が「電車停車中」であり環境騒音が小さい。したがって、音漏れ認知情報が「中幅」に決定される。
期間T3において周囲の状況が変化し、電車が走行中である場合には、収音された環境騒音の特徴量に基づく騒音分類情報が「電車走行中」となる。この場合、「電車走行中」という環境は、周囲の環境騒音が大きく変化することが考えられる。また、楽曲の分類が「ロック」であり、周囲への音漏れが認識されやすい。したがって、音漏れ認知情報が「大幅」に決定される。
このように、騒音分類情報および楽曲分類情報に基づき音漏れ認知情報データベース43を参照することにより、再生中の楽曲に対する音量の調整幅を決定することができる。
次に、図10を参照して、マイク3がヘッドフォン2の内部に設けられた場合の再生音量調整方法について説明する。なお、図6に示すマイク3がヘッドフォン2の外部に設けられた場合と共通する部分については、同一の符号を付し、詳細な説明を省略する。
マイク3によって収音された環境騒音の騒音データNT’が周波数分析部21に供給される。周波数分析部21は、供給された騒音データNTに対して周波数分析を施し、周波数情報NS’を取得する。周波数情報NS’は、逆伝達関数演算部40に供給される。
逆伝達関数演算部40は、周波数分析部21から供給された周波数情報NS’に対して所定の逆伝達関数H−1を畳み込み演算し、ヘッドフォン2の外部における騒音データNTに対応する周波数情報NSを出力する。周波数情報NSは、エンベロープ解析部22およびパワー解析部23に供給される。
エンベロープ解析部22は、逆伝達関数演算部40から供給された周波数情報NSに基づき騒音データNTのエンベロープの解析を行い、エンベロープ情報NPeを算出する。算出されたエンベロープ情報NPeは、騒音分類部24に供給される。パワー解析部23は、逆伝達関数演算部40から供給された周波数情報NSに基づき騒音データNTのパワーの解析を行い、パワー情報NPpを算出する。算出されたパワー情報NPpは、騒音分類部24に供給される。
騒音分類部24は、エンベロープ情報NPeおよびパワー情報NPpとに基づき、騒音分類データベース41を参照して環境騒音を分類し、騒音分類情報を生成する。生成された騒音分類情報は、音漏れ認知情報取得部30に供給する。
一方、再生装置1に記録され再生が指示された楽曲の楽曲データMTが周波数分析部25に供給される。周波数分析部25は、供給された楽曲データMTに対して周波数分析を施し、周波数情報MSを取得する。周波数情報MSは、伝達関数演算部26に供給される。
伝達関数演算部26は、周波数分析部25から供給された周波数情報MSに対して所定の伝達関数Hを畳み込み演算し、ヘッドフォン2の外部に漏れ出す楽曲データMT’に対応する周波数情報MS’を出力する。周波数情報MS’は、エンベロープ解析部27およびパワー解析部28に供給される。
エンベロープ解析部27は、入力された周波数情報MS’に基づき楽曲データMT’のエンベロープの解析を行い、エンベロープ情報MPe’を算出する。算出されたエンベロープ情報MPe’は、楽曲分類部29に供給される。パワー解析部28は、入力された周波数情報MS’に基づき楽曲データMT’のパワーの解析を行い、パワー情報MPp’を算出する。算出されたパワー情報MPp’は、楽曲分類部29に供給される。
楽曲分類部29は、エンベロープ情報MPe’およびパワー情報MPp’とに基づき、楽曲分類データベース42を参照して楽曲を分類し、楽曲分類情報を生成する。生成された楽曲分類情報は、音漏れ認知情報取得部30に供給される。
音漏れ認知情報取得部30は、騒音分類部24から供給された騒音分類情報と、楽曲分類部29から供給された楽曲分類情報とに基づき、後述する音漏れ認知情報データベース43を参照して音漏れ認知情報を生成する。生成された音漏れ認知情報は、音量調整部31に供給される。
音量調整部31は、音漏れ認知情報取得部30から供給された音漏れ認知情報に基づき再生音量の判定を行い、音量調整情報を生成する。生成された音量調整情報は、音量選択部32に供給される。音量選択部32は、音量調整部31から供給された音量調整情報に基づき、楽曲データの音量を調整する。
この発明の実施の第1の形態に適用可能な再生装置1の一例の構成について、図11を参照して説明する。なお、図11では、この発明の実施の第1の形態と関係の深い部分についてのみを図示し、それ以外の部分については説明を省略する。音楽再生装置1は、CPU(Central Processing Unit)11、ROM(Read Only Memory)12、RAM(Random Access Memory)13、音声信号処理部14、記録再生制御部15、入力処理部16および操作部17がバス10を介して接続されている。
CPU11は、RAM13をワークメモリとして用い、ROM12に予め記憶されたプログラムに従いこの音楽再生装置1の全体の動作を制御する。例えば、CPU11は、バス10を介して各部とコマンドやデータのやりとりを行い、各部を制御する。また、CPU11は、後述する操作部17に対する操作に応じて、記録媒体18に記録された楽曲データの再生を制御する。
CPU11は、図6および図10を用いて説明した再生音量調整処理を行う。CPU11は、マイク3で収音された環境騒音の騒音データを入力処理部16を介して受け取り、騒音データの解析を行って環境騒音を分類する。また、後述する音声信号処理部14からディジタル音声信号の楽曲データを受け取り、楽曲データの解析を行って楽曲を分類する。そして、環境騒音および楽曲の分類結果に応じて楽曲の再生音量を制御する。
音声信号処理部14には、音声出力部19が接続される。音声信号処理部14は、再生対象である楽曲データを、後述する記録媒体18から記録再生制御部15を介して受け取り、楽曲データに対してD/A(Digital/Analog)変換等の各種処理を施し、アナログ音声信号に変換する。また、楽曲データが圧縮されている場合には、所定の圧縮方式を用いて伸長処理を施す。そして、音声信号処理部14は、ディジタル音声信号の楽曲データをCPU11に供給する。また、音声信号処理部14は、アナログ音声信号に変換された楽曲データを、音声出力部19を介して出力する。音声出力部19としては、例えばヘッドフォン2やスピーカを用いることができる。
記録再生制御部15には、記録媒体18が接続される。記録再生制御部15は、記録媒体18に対するデータの記録制御や、記録媒体18に記録されたデータの再生制御を行う。記録媒体18には、楽曲データが記録されている。記録媒体18としては、例えば着脱可能な不揮発性メモリや、着脱可能または音楽再生装置1に内蔵されるハードディスクを用いることができる。
入力処理部16には、マイク3が接続される。マイク3は、環境騒音を収音し、環境騒音の騒音データをアナログ音声信号に変換して入力処理部16に供給する。入力処理部16は、マイク3から供給されたアナログ音声信号に対してA/D(Analog/Digital)変換等の各種処理を施し、ディジタルの騒音データに変換する。変換された騒音データは、CPU11に供給される。
操作部17は、この音楽再生装置1を操作するために用いられる各種の操作子が設けられ、各操作子に対する操作に応じた制御信号を出力する。例えば、楽曲データを再生/停止するための再生/停止キーや、再生音量を調整するための音量調整キー、再生音量の自動調整を指示するための操作子などが設けられている。
この発明の実施の第1の形態における再生音量調整処理の流れについて、図12に示すフローチャートを参照して説明する。なお、特別な記載がない限り、以下の処理は、CPU11の制御の下で行われるものとする。また、以下の処理は、所定時間毎に巡回的に繰り返されるものとする。ここでは、マイク3がヘッドフォン2の外部に設けられた場合を例にとって説明する。
ステップS1において、再生装置1の電源がONとされ、ステップS2において、ユーザにより、操作部17に設けられた再生音量の自動調整を指示するための操作子が操作される。ステップS3では、ユーザによって所定の楽曲が選択され、選択された楽曲の楽曲データが記録媒体18から読み出されて再生される。
ステップS4では、マイク3を介して環境騒音が収音され、ステップS5において、収音された環境騒音の騒音データNTに対して周波数分析が施され、環境騒音の特徴量であるエンベロープ情報NPeおよびパワー情報NPpが算出される。ステップS6では、ステップS5において算出されたエンベロープ情報NPeおよびパワー情報NPpに基づき、騒音分類データベース41を参照することにより環境騒音が分類され、騒音分類情報が生成される。
ステップS7では、再生された楽曲データのヘッドフォン2の外部に漏れ出す成分に対して周波数分析が施され、ヘッドフォン2の外部における楽曲の特徴量であるエンベロープ情報MPe’およびパワー情報MPp’が算出される。ステップS8では、ステップS7において算出されたエンベロープ情報MPe’およびパワー情報MPp’に基づき、楽曲分類データベース42を参照することにより楽曲が分類され、楽曲分類情報が生成される。
ステップS9では、騒音分類情報および楽曲分類情報に基づき、音漏れ認知情報データベース43を参照することにより音漏れ認知情報が生成される。ステップS10では、音漏れ認知情報に基づき音量調整情報が生成され、音量調整情報に応じて楽曲の再生音量が調整される。
ステップS11では、音楽を聴取し続けるか否かが判断される。音楽を聴取し続けると判断された場合には、処理がステップS3に戻り、楽曲の再生が継続される。
一方、音楽を聴取し続けないと判断された場合には、処理がステップS12に移行し、ユーザによって音楽再生装置1の電源がOFFとされて一連の処理が終了する。
このように、この発明の実施の第1の形態では、所定時間毎に収音された環境騒音から特徴量を抽出し、抽出された特徴量に基づいて環境騒音の分類を行う。また、再生された楽曲から特徴量を抽出し、抽出された特徴量に基づいて楽曲の分類を行う。そして、環境騒音および楽曲の分類結果に基づいて楽曲の再生音量を調整するようにしているため、環境騒音の変化に追従して楽曲の再生音量を適した音量に調整することができ、外部への音漏れを防ぐことができる。
次に、この発明の実施の第1の形態の第1の変形例について説明する。上述した実施の第1の形態に適用可能な再生音量の調整方法では、環境騒音の特徴量であるエンベロープ情報NPeおよびパワー情報NPpを算出する際に、例えば0.5秒程度の短い時間長を有する騒音データを用いて、楽曲の再生音量の調整を行っている。そのため、再生音量の調整量は、この騒音データを取得した短い時間に支配されてしまう。
例えば、ユーザが電車の車内にいる場合であっても、周囲で人が会話をしている場合と会話をしていない場合とでは、環境騒音の特徴量が大きく変化する。このような場合に、環境騒音が変化に応じて音量調整が細かく行われると、ユーザが不快となってしまうおそれがある。
そこで、この発明の実施の第1の形態の第1の変形例では、所定時間毎に収音した環境騒音および楽曲の特徴量に基づき音量調整の判定を行い、判定結果を所定回数分だけメモリに記憶させておく。そして、この所定回数分の判定結果に基づき、過去のデータになるほど重みが減少する重み係数を用いて再生音量を調整するようにしている。
図13は、この発明の実施の第1の形態の第1の変形例による再生音量の調整方法の一例について説明するためのブロック図である。第1の判定部51は、環境騒音の騒音データNTに対して周波数分析を行うことによって得られるエンベロープ情報NPeおよびパワー情報NPpと、楽曲の楽曲データMTの外部に漏れ出す成分に対して周波数分析を行うことによって得られるエンベロープ情報MPe’およびパワー情報MPp’とが供給される。そして、供給された環境騒音のエンベロープ情報NPeおよびパワー情報NPpと、楽曲のエンベロープ情報MPe’およびパワー情報MPp’とに基づき再生音量の判定を行い、楽曲データの再生音量の判定結果を示す音量判定情報を生成する。生成された音量判定情報は、変換部52に供給される。
変換部52は、供給された音量判定情報に基づき、判定結果を所定の数値に変換する。例えば、再生音量を下げる場合には、「−1」に変換し、再生音量を変更しない場合には、「0」に変換する。また、再生音量を上げる場合には、「1」に変換する。判定結果に応じて数値に変換されたデータは、メモリ53に供給される。
メモリ53は、所定回数分、例えばn個分のデータを格納することができる領域を有している。メモリ53は、新しいデータが供給されると、格納されたデータを1つずつシフトし、時間的に最も古いデータを捨てるとともに、供給された新しいデータを格納する。
具体的には、例えば、メモリ53に新たなデータが供給された場合、メモリ53に格納されたデータの中で最も古いデータdが捨てられるとともに、データdn−1が1つだけシフトされ、データdとしてメモリ53に格納される。同様にして、データd,dおよびdがそれぞれ1つだけシフトされ、データd,dおよびdとしてメモリ53に格納される。そして、新たに供給されたデータがdとしてメモリ53に格納される。
メモリ53に格納されたデータd,d,・・・,dは、乗算器54,54,・・・にそれぞれ供給される。
乗算器54,54,・・・は、メモリ53から供給されたデータd,d,・・・,dに対して、重み係数w,w,・・・,wを畳み込み演算する。重み係数w,w,・・・,wは、メモリ53に格納されたデータの重みを決定する係数であり、数式(1)で示されるように、過去のデータになるほど重みが減少するように設定されている。
1≧w≧w≧・・・≧wn−1≧w≧0 ・・・(1)
それぞれのデータd,d,・・・,dに対して重み係数w,w,・・・,wを畳み込み演算した結果のデータは、加算器55に供給される。加算器55は、乗算器54,54,・・・から供給された畳み込み演算の結果のデータをそれぞれ加算し、第2の判定部56に供給する。
第2の判定部56は、加算器55から供給されたデータの平均値を算出し、算出結果に応じて環境騒音の判定を行う。この例では、再生音量を下げる場合に「−1」、再生音量を変更しない場合に「0」、再生音量を上げる場合に「1」としているので、「0」を基準として、データの平均値が「0」より大きい場合には、再生音量を上げると判定する。また、データの平均値が「0」より小さい場合には、再生音量を下げると判定する。データの平均値が「0」である場合には、再生音量の調整を行わないと判定する。判定結果を示すデータは、音量調整幅調整部57に供給される。
音量調整幅調整部57は、供給された判定結果を示すデータと、音漏れ認知情報取得部30から供給された音漏れ認知情報とに基づき楽曲データの再生音量を調整するための音量調整情報を生成し、音量選択部32に供給する。
このように、この発明の実施の第1の形態の第1の変形例では、所定時間毎に収音した環境騒音および楽曲の特徴量に基づき音量調整の判定を行い、判定結果および音漏れ認知情報に基づき再生音量を調整するようにしている。また、過去の判定結果であるほど重みが減少するように演算するようにしている。そのため、上述の実施の第1の形態による再生音量の調整方法と比較して、音量調整のための判定結果を平均化して安定させることができる。
この発明の実施の第1の形態の第2の変形例について説明する。この発明の実施の第1の形態の第2の変形例では、ノイズキャンセリング機能を有する再生装置に対して音量調整処理を適用する。ノイズキャンセリング機能は、背景技術の項で説明したように、収音した環境騒音に基づき、環境騒音を打ち消す成分を再生音に付加することによりユーザに聞こえる環境騒音を低減させるものである。
しかしながら、この場合において収音される実際の環境騒音は、その音量が低減されているわけではない。そのため、収音された実際の環境騒音の特徴量に基づいて楽曲の再生音量を調整すると、再生された楽曲の音量は、ユーザに聞こえる低減された環境騒音の音量に対して大きい音量となってしまう。
そこで、この実施の第1の形態の第2の変形例では、ノイズキャンセリング機能による環境騒音の低減効果と同等の効果を有する等価フィルタを、収音された環境騒音の入力側に設ける。そして、等価フィルタを介して低減された環境騒音の特徴量に基づいて、楽曲の再生音量を調整するようにしている。
図14は、この発明の実施の第1の形態の第2の変形例による再生音量の調整方法の一例について説明するためのブロック図である。ここでは、マイク3がヘッドフォン2の外部に設けられている場合を例にとって説明する。なお、図6に示す実施の第1の形態と共通する部分については、同一の符号を付し、詳細な説明を省略する。
マイク3によって収音された環境騒音の騒音データNTが周波数分析部21に供給される。周波数分析部21は、供給された騒音データNTに対して周波数分析を施し、周波数情報NSを取得する。周波数情報NSは、スイッチ61に供給される。
スイッチ61は、入力端子61a、出力端子61bおよび61cを備える。スイッチ61は、ユーザによる操作部17に対する操作に基づくノイズキャンセリング機能のON/OFFに応じて、入力端子61aに入力された周波数情報NSを出力端子61bおよび61cのいずれか一方の出力端子から選択的に出力する。
ノイズキャンセリング機能がONとされている場合には、出力端子61bが選択され、入力端子61aに供給された周波数情報NSを出力端子61bから出力し、等価フィルタ62に供給する。一方、ノイズキャンセリング機能がOFFとされている場合には、出力端子61cが選択され、周波数情報NSを出力端子61cから出力し、エンベロープ解析部22およびパワー解析部23に供給する。
等価フィルタ62は、収音された環境騒音の騒音データNTにおける周波数情報NSに対して、ノイズキャンセル機能を用いた際に得られる低減効果と同等の効果が得られる処理を施し、騒音が低減された低減騒音データの周波数情報TNSを生成する。生成された周波数情報TNSは、エンベロープ解析部22およびパワー解析部23に供給される。
エンベロープ解析部22は、スイッチ61を介して周波数分析部21から供給された周波数情報NSまたは、等価フィルタ62から供給された周波数情報TNSに基づきエンベロープの解析を行い、エンベロープ情報NPeまたはTNPeを算出する。算出されたエンベロープ情報NPeまたはTNPeは、騒音分類部24に供給される。
パワー解析部23は、スイッチ61を介して周波数分析部21から供給された周波数情報NSまたは、等価フィルタ62から供給された周波数情報TNSに基づきパワーの解析を行い、パワー情報NPpまたはTNPpを算出する。算出されたパワー情報NPpまたはTNPpは、騒音分類部24に供給される。
騒音分類部24は、エンベロープ情報NPe/TNPeおよびパワー情報NPp/TNPpに基づき、騒音分類データベース41を参照して環境騒音を分類し、騒音分類情報を生成する。生成された騒音分類情報は、音漏れ認知情報取得部30に供給する。
一方、再生装置1に記録され再生が指示された楽曲の楽曲データMTが周波数分析部25に供給される。周波数分析部25は、供給された楽曲データMTに対して周波数分析を施し、周波数情報MSを取得する。周波数情報MSは、伝達関数演算部26に供給される。
伝達関数演算部26は、周波数分析部25から供給された周波数情報MSに対して所定の伝達関数Hを畳み込み演算し、ヘッドフォン2の外部に漏れ出す楽曲データMT’に対応する周波数情報MS’を出力する。周波数情報MS’は、エンベロープ解析部27およびパワー解析部28に供給される。
エンベロープ解析部27は、入力された周波数情報MS’に基づき楽曲データMT’のエンベロープの解析を行い、エンベロープ情報MPe’を算出する。算出されたエンベロープ情報MPe’は、楽曲分類部29に供給される。パワー解析部28は、入力された周波数情報MS’に基づき楽曲データMT’のパワーの解析を行い、パワー情報MPp’を算出する。算出されたパワー情報MPp’は、楽曲分類部29に供給される。
楽曲分類部29は、エンベロープ情報MPe’およびパワー情報MPp’とに基づき、楽曲分類データベース42を参照して楽曲を分類し、楽曲分類情報を生成する。生成された楽曲分類情報は、音漏れ認知情報取得部30に供給される。
音漏れ認知情報取得部30は、騒音分類部24から供給された騒音分類情報と、楽曲分類部29から供給された楽曲分類情報とに基づき、音漏れ認知情報データベース43を参照して音漏れ認知情報を生成する。生成された音漏れ認知情報は、音量調整部31に供給される。
音量調整部31は、音漏れ認知情報取得部30から供給された音漏れ認知情報に基づき再生音量の判定を行い、音量調整情報を生成する。生成された音量調整情報は、音量選択部32に供給される。音量選択部32は、音量調整部31から供給された音量調整情報に基づき、楽曲データの音量を調整する。
このように、この発明の実施の第1の形態の第2の変形例では、ノイズキャンセリング機能による低減効果と同等の低減効果を有する等価フィルタを用いて、ユーザに聞こえる低減された環境騒音に応じて楽曲の再生音量を調整するようにしているため、ユーザの聴覚に優しい音量で楽曲を再生することができる。
また、ユーザに聞こえる環境騒音は、ノイズキャンセリング機能によって実際の環境騒音よりも小さい音量である。そのため、低減された環境騒音の特徴量に基づいて設定された楽曲の再生音量は、実際の環境騒音にマスクされてしまうような音量であるが、ユーザに聞こえる低減された環境騒音にマスクされてしまうことがないので、楽曲を適切に聴取することができる。
なお、この例では、マイク3がヘッドフォン2の外部に設けられている場合について説明したが、これはこの例に限られず、例えばマイク3がヘッドフォン2の内部に設けられている場合についても同様に適用可能である。
この発明の実施の第2の形態について説明する。上述の実施の第1の形態では、マイク3により外部の環境騒音を収音するようにしているが、楽曲を再生中に収音される環境騒音には、ヘッドフォン2を通過して外部に漏れ出す楽曲の信号成分が含まれてしまっている。そのため、周囲の環境騒音の特徴量を正確に抽出して環境騒音を分類することができない。
そこで、この発明の実施の第2の形態では、楽曲の音量が小さい場合など、ヘッドフォン2からの音漏れが少ない場合やヘッドフォン2からの音漏れがない状態で収音された環境騒音および楽曲の特徴量に基づき環境騒音および楽曲を分類し、楽曲の再生音量を調整するようにした。
図15は、この発明の実施の第2の形態による再生音量の調整方法の一例について説明するためのブロック図である。この例では、マイク3がヘッドフォン2の外部に設けられている場合について説明する。なお、図6に示す実施の第1の形態と共通する部分については、同一の符号を付し、詳細な説明を省略する。
測定制御部73は、再生装置1に記録された楽曲の楽曲データMTが供給され、楽曲データMTの音量を測定する。そして、測定結果に基づきスイッチ71のON/OFFを制御する。測定制御部73には、楽曲データMTの音量に対する閾値が予め設定されている。測定制御部73は、楽曲データMTの音量が閾値以下である場合には、スイッチ71をONとするように制御する。また、楽曲データMTの音量が閾値を超える場合には、スイッチ71をOFFとするように制御する。なお、スイッチ72は、後述する測定制御部73のタイマによる制御が行われる場合を除き、常時ONとなっている。
マイク3によって収音された環境騒音の騒音データNTは、スイッチ71に供給され、測定制御部73の制御に基づきONとされた場合に周波数分析部21に供給される。周波数分析部21は、供給された騒音データNTに対して周波数分析を施し、周波数情報NSを取得する。周波数分析によって得られた周波数情報NSは、エンベロープ解析部22およびパワー解析部23に供給される。
エンベロープ解析部22は、周波数分析部21から供給された周波数情報NSに基づきエンベロープの解析を行い、エンベロープ情報NPeを算出する。算出されたエンベロープ情報NPeは、騒音分類部24に供給される。パワー解析部23は、周波数分析部21から供給された周波数情報NSに基づきパワーの解析を行い、パワー情報NPpを算出する。算出されたパワー情報NPpは、騒音分類部24に供給される。
騒音分類部24は、エンベロープ情報NPeおよびパワー情報NPpに基づき、騒音分類データベース41を参照して環境騒音を分類し、騒音分類情報を生成する。生成された騒音分類情報は、音漏れ認知情報取得部30に供給する。
一方、再生装置1に記録された楽曲の楽曲データMTは、スイッチ72を介して周波数分析部25に供給される。周波数分析部25は、供給された楽曲データMTに対して周波数分析を施し、周波数情報MSを取得する。周波数情報MSは、伝達関数演算部26に供給される。
伝達関数演算部26は、周波数分析部25から供給された周波数情報MSに対して所定の伝達関数Hを畳み込み演算し、ヘッドフォン2の外部に漏れ出す楽曲データMT’に対応する周波数情報MS’を出力する。周波数情報MS’は、エンベロープ解析部27およびパワー解析部28に供給される。
エンベロープ解析部27は、入力された周波数情報MS’に基づき楽曲データMT’のエンベロープの解析を行い、エンベロープ情報MPe’を算出する。算出されたエンベロープ情報MPe’は、楽曲分類部29に供給される。パワー解析部28は、入力された周波数情報MS’に基づき楽曲データMT’のパワーの解析を行い、パワー情報MPp’を算出する。算出されたパワー情報MPp’は、楽曲分類部29に供給される。
楽曲分類部29は、エンベロープ情報MPe’およびパワー情報MPp’とに基づき、楽曲分類データベース42を参照して楽曲を分類し、楽曲分類情報を生成する。生成された楽曲分類情報は、音漏れ認知情報取得部30に供給される。
音漏れ認知情報取得部30は、騒音分類部24から供給された騒音分類情報と、楽曲分類部29から供給された楽曲分類情報とに基づき、音漏れ認知情報データベース43を参照して音漏れ認知情報を生成する。生成された音漏れ認知情報は、音量調整部31に供給される。
音量調整部31は、音漏れ認知情報取得部30から供給された音漏れ認知情報に基づき再生音量の判定を行い、音量調整情報を生成する。生成された音量調整情報は、音量選択部32に供給される。音量選択部32は、音量調整部31から供給された音量調整情報に基づき、楽曲データの音量を調整する。
なお、測定制御部73によって楽曲データMTの音量を測定した際に、楽曲によっては、その音量が閾値以下とならない場合が考えられる。このような場合には、例えば、測定制御部73にタイマを設け、タイマに設定された所定期間中に楽曲データMTの音量が閾値以下とならない場合に、スイッチ71を強制的にONとして、環境騒音を収音するようにしてもよい。このとき、測定制御部73は、スイッチ72を強制的にOFFとしてもよい。例えば、所定期間、楽曲データMTの音量が閾値以下とならない場合には、環境騒音が収音されていないことをユーザに提示する。そして、ユーザにより環境騒音の収音が指示された場合に、再生中の楽曲の音漏れ成分が影響しないようにスイッチ72を強制的にOFFとするようにしてもよい。
この発明の実施の第2の形態における再生音量調整処理の流れについて、図16に示すフローチャートを参照して説明する。なお、特別な記載がない限り、以下の処理は、CPU11の制御の下で行われるものとする。また、以下の処理は、所定時間毎に巡回的に繰り返されるものとする。
ステップS21において、再生装置1の電源がONとされ、ステップS22において、ユーザにより、操作部17に設けられた再生音量の自動調整を指示するための操作子が操作される。ステップS23では、ユーザによって所定の楽曲が選択され、選択された楽曲の楽曲データが記録媒体18から読み出されて再生される。
ステップS24では、再生された楽曲データMTの音量と、測定制御部73に予め設定された楽曲データMTの音量に対する閾値とが比較され、楽曲データMTの音量が十分小さいかどうかが判断される。楽曲データMTの音量が閾値以下である場合には、楽曲データMTの音量が十分小さいと判断され、処理がステップS25に移行する。一方、楽曲データMTの音量が閾値を超えている場合には、楽曲データMTの音量が大きいと判断され、処理がステップS27に移行する。
ステップS25では、マイク3を介して環境騒音が収音される。ステップS26では、収音された環境騒音の騒音データNTに対する周波数分析により、エンベロープ情報NPeおよびパワー情報NPpが算出される。そして、算出されたエンベロープ情報NPeおよびパワー情報NPpに基づき、騒音分類データベース41を参照することにより環境騒音が分類され、騒音分類情報が生成される。
ステップS27では、再生された楽曲データのヘッドフォン2の外部に漏れ出す成分に対する周波数分析により、エンベロープ情報MPe’およびパワー情報MPp’が算出される。そして、算出されたエンベロープ情報MPe’およびパワー情報MPp’に基づき、楽曲分類データベース42を参照することにより楽曲が分類され、楽曲分類情報が生成される。
ステップS28では、騒音分類情報および楽曲分類情報に基づき、音漏れ認知情報データベース43を参照することにより音漏れ認知情報が生成される。ステップS29では、音漏れ認知情報に基づき生成された音量調整情報に応じて楽曲の再生音量が調整される。
ステップS30では、音楽を聴取し続けるか否かが判断される。音楽を聴取し続けると判断された場合には、処理がステップS23に戻り、楽曲の再生が継続される。一方、音楽を聴取し続けないと判断された場合には、処理がステップS31に移行し、ユーザによって音楽再生装置1の電源がOFFとされて一連の処理が終了する。
このように、この発明の実施の第2の形態では、楽曲データMTの音量が十分小さい場合に環境騒音を収音し、収音された環境騒音と楽曲の分類に応じて楽曲の再生音量を調整するようにしている。そのため、再生された楽曲の音漏れ成分による影響を受けることなく周囲の環境騒音を収音することができ、環境騒音の特徴量を正確に抽出して環境騒音を分類することができる。
なお、この例では、マイク3がヘッドフォン2の外部に設けられている場合について説明したが、これはこの例に限られず、例えばマイク3がヘッドフォン2の内部に設けられている場合についても同様に適用可能である。
この発明の実施の第3の形態について説明する。この発明の実施の第3の形態では、収音された環境騒音から楽曲の音漏れ成分を除去し、音漏れ成分が除去された環境騒音および楽曲を分類し、楽曲の再生音量を調整するようにした。
図17は、この発明の実施の第3の形態による再生音量の調整方法の一例について説明するためのブロック図である。この例では、マイク3がヘッドフォン2の外部に設けられている場合について説明する。なお、図6に示す実施の第1の形態と共通する部分については、同一の符号を付し、詳細な説明を省略する。
マイク3によって収音された環境騒音の騒音データNTは、周波数分析部21に供給され、所定の周波数分析が行われる。周波数分析によって得られた周波数情報NSは、加算器81の一方の入力端に供給される。
一方、再生装置1に記録された楽曲の楽曲データMTは、周波数分析部25に供給され、所定の周波数分析が行われる。周波数分析によって得られた周波数情報MSは、伝達関数演算部26に供給される。
伝達関数演算部26は、供給された周波数情報MSに対して所定の伝達関数Hを畳み込み演算し、ヘッドフォン2の外部に漏れ出す楽曲データMT’に対応する周波数情報MS’を出力する。伝達関数演算部26から出力された周波数情報MS’は、加算器81の他方の入力端に供給される。
加算器81は、一方の入力端に入力された騒音データNTに対する周波数情報NSから、他方の入力端に入力された楽曲データMTに対する周波数情報MS’を減算し、エンベロープ解析部22およびパワー解析部23に供給する。
エンベロープ解析部22は、周波数分析部21から供給された周波数情報NSに基づきエンベロープの解析を行い、エンベロープ情報NPeを算出する。算出されたエンベロープ情報NPeは、騒音分類部24に供給される。パワー解析部23は、周波数分析部21から供給された周波数情報NSに基づきパワーの解析を行い、パワー情報NPpを算出する。算出されたパワー情報NPpは、騒音分類部24に供給される。
騒音分類部24は、エンベロープ情報NPeおよびパワー情報NPpに基づき、騒音分類データベース41を参照して環境騒音を分類し、騒音分類情報を生成する。生成された騒音分類情報は、音漏れ認知情報取得部30に供給する。
また、伝達関数演算部26から出力された周波数情報MS’は、エンベロープ解析部27およびパワー解析部28にも供給される。エンベロープ解析部27は、入力された周波数情報MS’に基づき楽曲データMT’のエンベロープの解析を行い、エンベロープ情報MPe’を算出する。算出されたエンベロープ情報MPe’は、楽曲分類部29に供給される。パワー解析部28は、入力された周波数情報MS’に基づき楽曲データMT’のパワーの解析を行い、パワー情報MPp’を算出する。算出されたパワー情報MPp’は、楽曲分類部29に供給される。
楽曲分類部29は、エンベロープ情報MPe’およびパワー情報MPp’とに基づき、楽曲分類データベース42を参照して楽曲を分類し、楽曲分類情報を生成する。生成された楽曲分類情報は、音漏れ認知情報取得部30に供給される。
音漏れ認知情報取得部30は、騒音分類部24から供給された騒音分類情報と、楽曲分類部29から供給された楽曲分類情報とに基づき、音漏れ認知情報データベース43を参照して音漏れ認知情報を生成する。生成された音漏れ認知情報は、音量調整部31に供給される。
音量調整部31は、音漏れ認知情報取得部30から供給された音漏れ認知情報に基づき再生音量の判定を行い、音量調整情報を生成する。生成された音量調整情報は、音量選択部32に供給される。音量選択部32は、音量調整部31から供給された音量調整情報に基づき、楽曲データの音量を調整する。
この発明の実施の第3の形態における再生音量調整処理の流れについて、図18に示すフローチャートを参照して説明する。なお、特別な記載がない限り、以下の処理は、CPU11の制御の下で行われるものとする。また、以下の処理は、所定時間毎に巡回的に繰り返されるものとする。
ステップS41において、再生装置1の電源がONとされ、ステップS42において、ユーザにより、操作部17に設けられた再生音量の自動調整を指示するための操作子が操作される。ステップS43では、ユーザによって所定の楽曲が選択され、選択された楽曲の楽曲データが記録媒体18から読み出されて再生される。
ステップS44では、マイク3を介して環境騒音が収音される。ステップS45では、収音された環境騒音の騒音データNTに対して周波数分析が施されるとともに、収音された環境騒音の周波数情報NSから楽曲の音漏れ成分の周波数情報MS’が減算され、環境騒音から楽曲の音漏れ成分が除去される。
ステップS46では、楽曲の音漏れ成分が除去された環境騒音に基づき、エンベロープ情報NPeおよびパワー情報NPpが算出される。そして、算出されたエンベロープ情報NPeおよびパワー情報NPpに基づき、騒音分類データベース41を参照することにより環境騒音が分類され、騒音分類情報が生成される。
ステップS47では、再生された楽曲データのヘッドフォン2の外部に漏れ出す成分に対する周波数分析により、エンベロープ情報MPe’およびパワー情報MPp’が算出される。そして、算出されたエンベロープ情報MPe’およびパワー情報MPp’に基づき、楽曲分類データベース42を参照することにより楽曲が分類され、楽曲分類情報が生成される。
ステップS48では、騒音分類情報および楽曲分類情報に基づき、音漏れ認知情報データベース43を参照することにより音漏れ認知情報が生成される。ステップS49では、音漏れ認知情報に基づき生成された音量調整情報に応じて楽曲の再生音量が調整される。
ステップS50では、音楽を聴取し続けるか否かが判断される。音楽を聴取し続けると判断された場合には、処理がステップS43に戻り、楽曲の再生が継続される。一方、音楽を聴取し続けないと判断された場合には、処理がステップS51に移行し、ユーザによって音楽再生装置1の電源がOFFとされて一連の処理が終了する。
このように、この発明の実施の第3の形態では、収音された環境騒音の周波数情報NSから楽曲の音漏れ成分の周波数情報MS’を減算するようにしている。そのため、再生された楽曲の音漏れ成分による影響を受けることなく周囲の環境騒音を収音することができ、環境騒音の特徴量を正確に抽出して環境騒音を分類することができる。
なお、この例では、マイク3がヘッドフォン2の外部に設けられている場合について説明したが、これはこの例に限られず、例えばマイク3がヘッドフォン2の内部に設けられている場合についても同様に適用可能である。
以上、この発明の実施の第1の形態、第1の形態の第1および第2の変形例、第2の形態および第3の形態について説明したが、この発明は、上述したこの発明の実施の第1の形態、第1の形態の第1および第2の変形例、第2の形態および第3の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。例えば、この発明の実施の形態による音量調整方法は、再生装置に限られず、再生音量の調整が可能なヘッドフォン等にも適用可能である。
また、上述した例では、環境騒音および楽曲に対して周波数解析を用いて特徴量を抽出するようにしたが、これに限られず、例えば、時間波形の解析を行い、過渡特性(トランジェント)を解析して特徴量を抽出するようにしてもよい。例えば、トランジェント(過渡応答)に関する特徴量を算出する例としては、時間軸データをある一定のサンプル毎、例えばフレームと呼ばれるようなNサンプル毎に区切り、各フレーム単位でパワーを算出する。そして、前後のフレーム間におけるパワーの比率や差分をとり、これをトランジェントに関する特徴量として用いる方法が考えられる。パワーの算出方法としては、例えば、各サンプルの二乗和を積算する方法が考えられるが、これに限られず、適宜適当と考えられる方法を用いても構わない。
また、例えば、周波数解析および時間波形の解析を共に行うことによって特徴量を抽出するようにしてもよい。
さらに、この例では、音漏れ認知情報が再生音量の調整幅を決定する情報である場合について説明したが、これはこの例に限られない。例えば、音漏れ認知情報が、楽曲に対して所定の周波数帯域を調整するための情報であってもよいし、周囲における音漏れの認識度合いを示す情報であってもよい。
さらにまた、環境騒音および楽曲の分類方法は、この例に限られず、従来の分類方法を用いてもよい。
この発明の実施の第1の形態に適用可能な再生装置の一例の使用形態を示す略線図である。 環境騒音およびヘッドフォンを介して外部に漏れた楽曲の一例の周波数特性を示す略線図である。 環境騒音の周波数特性の一例を示す略線図である。 環境騒音の特徴量について説明するための略線図である。 環境騒音および楽曲の信号について説明するための略線図である。 マイクがヘッドフォンの外部に設けられた場合における楽曲の再生音量の調整方法の一例について説明するためのブロック図である。 騒音分類データベースの作成方法について説明するための略線図である。 音漏れ認知情報データベースの一例を示す略線図である。 環境および楽曲が変化した場合の音漏れ認知情報について説明するための略線図である。 マイクがヘッドフォンの内部に設けられた場合における楽曲の再生音量の調整方法の一例について説明するためのブロック図である。 この発明の実施の第1の形態に適用可能な再生装置の一例の構成を示すブロック図である。 この発明の実施の第1の形態における再生音量調整処理の流れについて説明するためのフローチャートである。 この発明の実施の第1の形態の第1の変形例による再生音量の調整方法の一例について説明するためのブロック図である。 この発明の実施の第1の形態の第2の変形例による再生音量の調整方法の一例について説明するためのブロック図である。 この発明の実施の第2の形態による再生音量の調整方法の一例について説明するためのブロック図である。 この発明の実施の第2の形態における再生音量調整処理の流れについて説明するためのフローチャートである。 この発明の実施の第3の形態による再生音量の調整方法の一例について説明するためのブロック図である。 この発明の実施の第3の形態における再生音量調整処理の流れについて説明するためのフローチャートである。 従来の再生装置の一例の使用形態を示す略線図である。 従来の再生装置における再生方法について説明するためのフローチャートである。
符号の説明
1 再生装置
2 ヘッドフォン
3 マイクロフォン
11 CPU
17 操作部
18 記録媒体
21,25 周波数分析部
22,27 エンベロープ解析部
23,28 パワー解析部
24 騒音分類部
26 伝達関数演算部
29 楽曲分類部
30 音漏れ認知情報取得部
31 音量調整部
32 音量選択部
40 逆伝達特性演算部
41 騒音分類データベース
42 楽曲分類データベース
43 音漏れ認知情報データベース
51 第1の判定部
52 変換部
53 メモリ
54 乗算器
55 加算器
56 第2の判定部
57 音量調整幅調整部
61 スイッチ
62 等価フィルタ
71,72 スイッチ
73 測定制御部
81 加算器

Claims (17)

  1. 周囲の環境の騒音データを収音する収音部と、
    上記収音部により収音された騒音データの特徴を示す特徴量を抽出する騒音解析部と、
    上記騒音データの特徴量に基づき上記騒音データを分類し、上記騒音データの分類結果を示す騒音分類情報を生成する騒音分類部と、
    入力された楽曲データの特徴を示す特徴量を抽出する楽曲解析部と、
    上記楽曲データの特徴量に基づき上記楽曲データを分類し、上記楽曲データの分類結果を示す楽曲分類情報を生成する楽曲分類部と、
    騒音分類情報および楽曲分類情報と、楽曲データの再生音量の調整幅を決定する音漏れ認知情報とが関連付けられて記録された音漏れ認知情報データベースと、
    上記騒音分類情報および上記楽曲分類情報に基づき、上記音漏れ認知情報データベースを参照することにより音漏れ認知情報を生成する音漏れ認知情報生成部と、
    上記音漏れ認知情報に基づき、上記楽曲データの再生音量を調整するための音量調整情報を生成し、該音量調整情報に基づき上記楽曲データの再生音量を調整するように制御する制御部とを備える音量調整装置。
  2. 上記騒音解析部は、
    上記騒音データに対して周波数解析を行い、上記周波数解析の結果に基づき該騒音データの特徴量を抽出し、
    上記楽曲解析部は、
    上記楽曲データに対して周波数解析を行い、上記周波数解析の結果に基づき該楽曲データの特徴量を抽出する請求項1に記載の音量調整装置。
  3. 上記騒音解析部は、上記騒音データのエンベロープの傾きを上記特徴量として抽出し、
    上記楽曲解析部は、上記楽曲データのエンベロープの傾きを上記特徴量として抽出する請求項2に記載の音量調整装置。
  4. 上記騒音解析部は、上記騒音データのパワーの最大値を上記特徴量として抽出し、
    上記楽曲解析部は、上記楽曲データのパワーの最大値を上記特徴量として抽出する請求項2に記載の音量調整装置。
  5. 上記騒音解析部は、
    上記騒音データに対して時間波形解析を行い、上記時間波形解析の結果に基づき該騒音データの特徴量を抽出し、
    上記楽曲解析部は、
    上記楽曲データに対して時間波形解析を行い、上記時間波形解析の結果に基づき該楽曲データの特徴量を抽出する請求項1に記載の音量調整装置。
  6. 上記騒音解析部は、
    上記騒音データに対して周波数解析および時間波形解析を行い、上記周波数解析および該時間波形解析の結果に基づき該騒音データの特徴量を抽出し、
    上記楽曲解析部は、
    上記楽曲データに対して周波数解析および時間波形解析を行い、上記周波数解析および該時間波形解析の結果に基づき該楽曲データの特徴量を抽出する請求項1に記載の音量調整装置。
  7. 上記再生部により再生された楽曲データを出力する音声出力部をさらに備え、
    上記収音部は、上記音声出力部の外部に設けられ、
    上記楽曲解析部は、
    上記音声出力部から出力され該音声出力部の周囲に漏れ出す上記楽曲データの音漏れ成分を上記音声出力部の伝達特性に基づき推定し、上記推定された上記楽曲データの音漏れ成分の特徴量を抽出し、
    上記楽曲分類部は、
    上記推定された上記楽曲データの音漏れ成分の特徴量に基づき上記楽曲データを分類する請求項1に記載の音量調整装置。
  8. 上記再生部により再生された楽曲データを出力する音声出力部をさらに備え、
    上記収音部は、上記音声出力部の内部に設けられ、
    上記騒音解析部は、
    上記収音部で収音された騒音データから上記周囲の環境の騒音データを上記音声出力部の伝達特性に基づき推定し、上記推定された上記周囲の環境の騒音データの特徴量を抽出し、
    上記騒音分類部は、
    上記推定された上記周囲の環境の騒音データの特徴量に基づき上記騒音データを分類し、
    上記楽曲解析部は、
    上記音声出力部から出力され該音声出力部の周囲に漏れ出す上記楽曲データの音漏れ成分を上記音声出力部の伝達特性に基づき推定し、上記推定された上記楽曲データの音漏れ成分の特徴量を抽出し、
    上記楽曲分類部は、
    上記推定された上記楽曲データの音漏れ成分の特徴量に基づき上記楽曲データを分類する請求項1に記載の音量調整装置。
  9. 騒音データの特徴量および環境が関連付けられて記録された騒音分類データベースをさらに備え、
    上記騒音分類部は、
    上記騒音データの特徴量に基づき、上記騒音分類データベースを参照することにより上記騒音データを分類する請求項1に記載の音量調整装置。
  10. 楽曲データの特徴量およびカテゴリが関連付けられて記録された楽曲分類データベースをさらに備え、
    上記楽曲分類部は、
    上記楽曲データの特徴量に基づき、上記楽曲分類データベースを参照することにより上記楽曲データを分類する請求項1に記載の音量調整装置。
  11. 上記制御部は、
    上記楽曲データに対する再生音量調整の判定結果を示す音量判定情報を所定回数分記憶するメモリを有し、
    上記騒音データおよび上記楽曲データの特徴量に基づき上記楽曲データの再生音量調整の判定を所定時間毎に行い上記音量判定情報を生成し、
    上記メモリに記憶された上記所定回数分の音量判定情報の平均と上記音漏れ認知情報とに基づき上記楽曲データの再生音量を調整するように制御する請求項1に記載の音量調整装置。
  12. 上記制御部は、
    上記メモリに記憶された上記所定回数分の音量判定情報に対して、過去の音量判定情報ほど重みが減少する重み係数をそれぞれ畳み込み演算し、上記重み係数が畳み込み演算された上記所定回数分の音量判定情報の平均と上記音漏れ認知情報とに基づき上記楽曲データの再生音量を調整するように制御する請求項11に記載の音量調整装置。
  13. 上記収音部により収音された騒音データに対して騒音レベルを低減させる騒音低減部と、
    上記騒音低減部による低減効果と同等の効果を有する等価フィルタと
    をさらに備え、
    上記騒音解析部は、
    上記収音部により収音された騒音データに対して上記等価フィルタを用いて騒音レベルが低減された騒音データの特徴量を抽出し、
    上記騒音分類部は、
    上記騒音レベルが低減された騒音データの特徴量に基づき上記騒音データを分類する請求項1に記載の音量調整装置。
  14. 上記入力された楽曲データの音量を測定し、該楽曲データの音量と予め設定された該楽曲データの音量に対する閾値とに基づき、該楽曲データの音量を判断する測定制御部をさらに備え、
    上記測定制御部は、
    上記楽曲データの音量が上記閾値以下である場合に、上記騒音解析部による上記騒音データの特徴量の抽出および上記楽曲解析部による上記楽曲データの特徴量の抽出を行うように制御する
    請求項1に記載の音量調整装置。
  15. 上記収音部により収音された騒音データから上記入力された楽曲データを減算する合成部をさらに備え、
    上記騒音解析部は、
    上記合成部からの出力に基づき上記騒音データの特徴量を抽出する請求項1に記載に音量調整装置。
  16. 周囲の環境の騒音データを収音する収音ステップと、
    上記収音ステップにより収音された騒音データの特徴を示す特徴量を抽出する騒音解析ステップと、
    上記騒音データの特徴量に基づき上記騒音データを分類し、上記騒音データの分類結果を示す騒音分類情報を生成する騒音分類ステップと、
    入力された楽曲データの特徴を示す特徴量を抽出する楽曲解析ステップと、
    上記楽曲データの特徴量に基づき上記楽曲データを分類し、上記楽曲データの分類結果を示す楽曲分類情報を生成する楽曲分類ステップと、
    上記騒音分類情報および上記楽曲分類情報に基づき、騒音分類情報および楽曲分類情報と、楽曲データの再生音量の調整幅を決定する音漏れ認知情報とが関連付けられて記録された音漏れ認知情報データベースを参照することにより音漏れ認知情報を生成する音漏れ認知情報生成ステップと、
    上記音漏れ認知情報に基づき、上記楽曲データの再生音量を調整するための音量調整情報を生成し、該音量調整情報に基づき上記楽曲データの再生音量を調整するように制御する制御ステップとを備える音量調整方法。
  17. 周囲の環境の騒音データを収音する収音ステップと、
    上記収音ステップにより収音された騒音データの特徴を示す特徴量を抽出する騒音解析ステップと、
    上記騒音データの特徴量に基づき上記騒音データを分類し、上記騒音データの分類結果を示す騒音分類情報を生成する騒音分類ステップと、
    入力された楽曲データの特徴を示す特徴量を抽出する楽曲解析ステップと、
    上記楽曲データの特徴量に基づき上記楽曲データを分類し、上記楽曲データの分類結果を示す楽曲分類情報を生成する楽曲分類ステップと、
    上記騒音分類情報および上記楽曲分類情報に基づき、騒音分類情報および楽曲分類情報と、楽曲データの再生音量の調整幅を決定する音漏れ認知情報とが関連付けられて記録された音漏れ認知情報データベースを参照することにより音漏れ認知情報を生成する音漏れ認知情報生成ステップと、
    上記音漏れ認知情報に基づき、上記楽曲データの再生音量を調整するための音量調整情報を生成し、該音量調整情報に基づき上記楽曲データの再生音量を調整するように制御する制御ステップとを備える音量調整方法をコンピュータ装置に実行させる音量調整プログラム。
JP2008177933A 2008-07-08 2008-07-08 音量調整装置、音量調整方法および音量調整プログラム Pending JP2010021627A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008177933A JP2010021627A (ja) 2008-07-08 2008-07-08 音量調整装置、音量調整方法および音量調整プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008177933A JP2010021627A (ja) 2008-07-08 2008-07-08 音量調整装置、音量調整方法および音量調整プログラム

Publications (1)

Publication Number Publication Date
JP2010021627A true JP2010021627A (ja) 2010-01-28

Family

ID=41706127

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008177933A Pending JP2010021627A (ja) 2008-07-08 2008-07-08 音量調整装置、音量調整方法および音量調整プログラム

Country Status (1)

Country Link
JP (1) JP2010021627A (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012244522A (ja) * 2011-05-23 2012-12-10 Yamaha Corp 音響再生制御装置
JP2013519285A (ja) * 2010-02-02 2013-05-23 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ヘッドホン装置用コントローラ
JP2013532308A (ja) * 2010-06-01 2013-08-15 クゥアルコム・インコーポレイテッド オーディオ等化のためのシステム、方法、デバイス、装置、およびコンピュータプログラム製品
JP2015063156A (ja) * 2013-09-24 2015-04-09 株式会社デンソー 車両用騒音抑制装置
JP2015121990A (ja) * 2013-12-24 2015-07-02 株式会社日本コンラックス 電子マネー決済端末装置
US9202456B2 (en) 2009-04-23 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation
CN105185383A (zh) * 2014-06-09 2015-12-23 哈曼国际工业有限公司 用于存在可理解语音时部分保留音乐的方法
CN106644162A (zh) * 2016-10-12 2017-05-10 云南大学 基于邻域保持嵌入回归算法的环网柜线芯温度软测量方法
WO2018092420A1 (ja) * 2016-11-16 2018-05-24 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9202456B2 (en) 2009-04-23 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation
US9014382B2 (en) 2010-02-02 2015-04-21 Koninklijke Philips N.V. Controller for a headphone arrangement
JP2013519285A (ja) * 2010-02-02 2013-05-23 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ヘッドホン装置用コントローラ
US9053697B2 (en) 2010-06-01 2015-06-09 Qualcomm Incorporated Systems, methods, devices, apparatus, and computer program products for audio equalization
KR101463324B1 (ko) 2010-06-01 2014-11-18 퀄컴 인코포레이티드 오디오 등화를 위한 시스템들, 방법들, 디바이스들, 장치, 및 컴퓨터 프로그램 제품들
JP2013532308A (ja) * 2010-06-01 2013-08-15 クゥアルコム・インコーポレイテッド オーディオ等化のためのシステム、方法、デバイス、装置、およびコンピュータプログラム製品
JP2012244522A (ja) * 2011-05-23 2012-12-10 Yamaha Corp 音響再生制御装置
JP2015063156A (ja) * 2013-09-24 2015-04-09 株式会社デンソー 車両用騒音抑制装置
JP2015121990A (ja) * 2013-12-24 2015-07-02 株式会社日本コンラックス 電子マネー決済端末装置
CN105185383A (zh) * 2014-06-09 2015-12-23 哈曼国际工业有限公司 用于存在可理解语音时部分保留音乐的方法
CN106644162A (zh) * 2016-10-12 2017-05-10 云南大学 基于邻域保持嵌入回归算法的环网柜线芯温度软测量方法
CN106644162B (zh) * 2016-10-12 2020-04-21 云南大学 基于邻域保持嵌入回归算法的环网柜线芯温度软测量方法
WO2018092420A1 (ja) * 2016-11-16 2018-05-24 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム
EP3543889A4 (en) * 2016-11-16 2019-11-27 Sony Corporation INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING PROCESS AND PROGRAM
US11114116B2 (en) 2016-11-16 2021-09-07 Sony Corporation Information processing apparatus and information processing method

Similar Documents

Publication Publication Date Title
JP4640461B2 (ja) 音量調整装置およびプログラム
US10523168B2 (en) Method and apparatus for processing an audio signal based on an estimated loudness
JP2010021627A (ja) 音量調整装置、音量調整方法および音量調整プログラム
JP6104629B2 (ja) ダイナミックサウンド提供システム及び方法
TWI463817B (zh) 可適性智慧雜訊抑制系統及方法
KR101356206B1 (ko) 자동 오디오 볼륨 기능을 갖는 오디오 재생 방법 및 장치
TWI397058B (zh) 音頻訊號之處理裝置及其方法,及電腦可讀取之紀錄媒體
JP4649546B2 (ja) 補聴器
US20150162021A1 (en) Spectral Comb Voice Activity Detection
JP4623124B2 (ja) 楽曲再生装置、楽曲再生方法および楽曲再生プログラム
US10128809B2 (en) Intelligent method and apparatus for spectral expansion of an input signal
RU2411595C2 (ru) Улучшение разборчивости речи в мобильном коммуникационном устройстве путем управления работой вибратора в зависимости от фонового шума
JP2010112995A (ja) 通話音声処理装置、通話音声処理方法およびプログラム
JP5903921B2 (ja) ノイズ低減装置、音声入力装置、無線通信装置、ノイズ低減方法、およびノイズ低減プログラム
KR20150103252A (ko) 스테레오 신호를 결정하는 방법
WO2012098856A1 (ja) 補聴器、及び、補聴器の制御方法
JP2009296297A (ja) 音声信号処理装置および方法
US20230320903A1 (en) Ear-worn device and reproduction method
JP2000276200A (ja) 声質変換システム
KR100883896B1 (ko) 음성명료도 향상장치 및 방법
JP2002366178A (ja) オーディオ信号の帯域拡張方法及び帯域拡張装置
JP3420831B2 (ja) 骨伝導音声のノイズ除去装置
JP2905112B2 (ja) 環境音分析装置
JP5126281B2 (ja) 楽曲再生装置
JPH0956000A (ja) 補聴器