JP2015149690A - 信号処理装置および方法 - Google Patents
信号処理装置および方法 Download PDFInfo
- Publication number
- JP2015149690A JP2015149690A JP2014023039A JP2014023039A JP2015149690A JP 2015149690 A JP2015149690 A JP 2015149690A JP 2014023039 A JP2014023039 A JP 2014023039A JP 2014023039 A JP2014023039 A JP 2014023039A JP 2015149690 A JP2015149690 A JP 2015149690A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- high frequency
- unit
- audio signal
- ultra high
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/02—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
- H03G9/025—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers frequency-dependent volume compression or expansion, e.g. multiple-band systems
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/005—Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Abstract
【課題】超高域を含む音声データの再生を、音質の低減を抑制しながらより安全に行うことができるようにする。【解決手段】オーディオ信号を直交変換する変換部と、前記変換部により直交変換された前記オーディオ信号を解析し、超高域の定常的な信号成分を推定する解析部と、前記オーディオ信号に対して、前記解析部の解析により推定された前記超高域の前記定常的な信号成分を低減させる信号処理を行う信号処理部とを備える。本開示は、例えば、音声データの再生装置に適用することができる。【選択図】図2
Description
本開示は信号処理装置および方法に関し、特に、超高域を含む音声データの再生を、音質の低減を抑制しながらより安全に行うことができるようにした信号処理装置および方法に関する。
近年、一般的に可聴帯域と称される周波数帯よりも高域の周波数帯(例えば20kHz以上)である超高域の信号成分を含む音声データ(所謂、ハイレゾリューション(High-Resolution)のデータ)(以下、ハイレゾデータと称する)が普及しつつある。
この、超高域には、例えばノイズシェイパ等により形成される雑音成分が多く含まれる場合がある。このような超高域の雑音はユーザに聴こえ難いため、ユーザは、可聴帯域の再生音量に基づいて音量調整を行う可能性が高い。そのため、超高域の雑音の再生音量が過度に増大し、アンプやスピーカ等の再生デバイスに過度な負荷を与え、故障等の原因となるおそれがあった。
そこで、より安全に再生を行うために、再生時の信号増幅(ゲイン)を抑制することが考えられる。例えば、自己相関を利用して入力信号が雑音であるかオーディオデータであるかを判定し、雑音と判定した場合はゲインを下げる方法があった(例えば、特許文献1参照)。
しかしながら、特許文献1に記載の方法の場合、オーディオデータと雑音の両方が含まれるような入力信号を雑音と判定すると、オーディオデータのゲインまで下げられてしまい、再生時の音質が低減するおそれがあった。また、全帯域のゲインが下げられるため、再生時の音質が低減するおそれがあった。
本開示は、このような状況に鑑みてなされたものであり、超高域を含む音声データの再生を、音質の低減を抑制しながらより安全に行うことができるようにするものである。
本技術の一側面の信号処理装置は、オーディオ信号を直交変換する変換部と、前記変換部により直交変換された前記オーディオ信号を解析し、超高域の定常的な信号成分を推定する解析部と、前記オーディオ信号に対して、前記解析部の解析により推定された前記超高域の前記定常的な信号成分を低減させる信号処理を行う信号処理部とを備える信号処理装置である。
前記超高域は、可聴帯域よりも高域である。
前記定常的な信号成分は、高域に向かってレベル増加する成分である。
前記定常的な信号成分は、可聴帯域の信号成分の倍音成分を含まない成分である。
前記信号処理部は、スペクトルサブトラクションにより前記超高域の前記定常的な信号成分を低減させることができる。
前記信号処理部は、ウィナーフィルタにより前記超高域の前記定常的な信号成分を低減させることができる。
前記変換部は、前記オーディオ信号に対して高速フーリエ変換を行うことができる。
前記オーディオ信号を前記超高域の信号成分と前記超高域以外の信号成分とに帯域分割する帯域分割部と、前記信号処理部により前記超高域の前記定常的な信号成分が低減された前記オーディオ信号を、前記帯域分割部により前記オーディオ信号が帯域分割されて得られた前記オーディオ信号の前記超高域以外の信号成分と合成する合成部とをさらに備え、前記変換部は、前記帯域分割部により前記オーディオ信号が帯域分割されて得られた前記オーディオ信号の前記超高域の信号成分を直交変換し、前記解析部は、前記変換部により直交変換された前記オーディオ信号の前記超高域の信号成分を解析し、前記超高域の前記定常的な信号成分を推定し、前記信号処理部は、前記帯域分割部により前記オーディオ信号が帯域分割されて得られた前記オーディオ信号の前記超高域の信号成分に対して、前記解析部の解析により推定された前記超高域の前記定常的な信号成分を低減させる信号処理を行い、前記合成部は、前記信号処理部により前記超高域の前記定常的な信号成分が低減された前記オーディオ信号の前記超高域の信号成分を、前記帯域分割部により前記オーディオ信号が帯域分割されて得られた前記オーディオ信号の前記超高域以外の信号成分と合成することができる。
前記帯域分割部は、前記オーディオ信号から前記超高域の信号成分を抽出するハイパスフィルタと、前記オーディオ信号から前記超高域以外の信号成分を抽出するローパスフィルタとを有することができる。
前記信号処理部により前記超高域の前記定常的な信号成分が低減された前記オーディオ信号から前記超高域以外の信号成分を除去するハイパスフィルタをさらに備え、前記合成部は、前記ハイパスフィルタにより前記超高域以外の信号成分が除去された前記オーディオ信号を、前記帯域分割部により前記オーディオ信号が帯域分割されて得られた前記オーディオ信号の前記超高域以外の信号成分と合成することができる。
前記信号処理部は、前記オーディオ信号の増幅量に応じて、前記超高域の前記定常的な信号成分を低減させることができる。
前記信号処理部は、前記オーディオ信号の増幅量に応じたカットオフ周波数を有するローパスフィルタにより前記超高域の前記定常的な信号成分を低減させることができる。
前記信号処理部は、カット周波数以上の帯域において前記オーディオ信号の増幅量に応じた傾きの周波数特性を有するローパスフィルタにより前記超高域の前記定常的な信号成分を低減させることができる。
前記信号処理部は、前記オーディオ信号の増幅量に応じたゲインを有するTSF(Treble Shelving Filter)により前記超高域の前記定常的な信号成分を低減させることができる。
前記信号処理部は、前記超高域に対して前記オーディオ信号の増幅量に応じたスレッショルドを有するリミッタにより前記超高域の前記定常的な信号成分を低減させることができる。
前記解析部は、前記オーディオ信号の、前記オーディオ信号の再生時間の内、所定の一部の時間に相当する部分データを解析し、前記超高域の前記定常的な信号成分を推定することができる。
前記解析部は、前記オーディオ信号の、前記オーディオ信号の再生時間の先頭の前記一部の時間に相当する部分データを解析し、前記超高域の前記定常的な信号成分を推定することができる。
前記解析部は、前記オーディオ信号の、前記オーディオ信号の再生時間の途中の前記一部の時間に相当する部分データを解析し、前記超高域の前記定常的な信号成分を推定し、前記信号処理部は、必要な場合のみ、低減させる前記定常的な信号成分を、前記解析部の最新の解析結果に応じて更新することができる。
前記信号処理部により前記超高域の前記定常的な信号成分が低減された前記オーディオ信号を符号化する符号化部をさらに備えることができる。
本技術の一側面の信号処理方法は、オーディオ信号を直交変換し、直交変換された前記オーディオ信号を解析し、超高域の定常的な信号成分を推定し、前記オーディオ信号に対して、推定された前記超高域の前記定常的な信号成分を低減させる信号処理を行う信号処理方法である。
本技術の一側面においては、オーディオ信号が直交変換され、直交変換されたオーディオ信号が解析され、超高域の定常的な信号成分が推定され、オーディオ信号に対して、推定された超高域の定常的な信号成分を低減させる信号処理が行われる。
本開示によれば、信号を処理することができる。特に、超高域を含む音声データの再生を、音質の低減を抑制しながらより安全に行うことができる。
以下、本開示を実施するための形態(以下実施の形態とする)について説明する。なお、説明は以下の順序で行う。
1.第1の実施の形態(再生装置)
2.第2の実施の形態(再生装置)
3.第3の実施の形態(送信装置)
4.第4の実施の形態(再生装置)
5.第5の実施の形態(コンピュータ)
1.第1の実施の形態(再生装置)
2.第2の実施の形態(再生装置)
3.第3の実施の形態(送信装置)
4.第4の実施の形態(再生装置)
5.第5の実施の形態(コンピュータ)
<1.第1の実施の形態>
<ハイレゾデータの再生>
近年、一般的に可聴帯域と称される周波数帯よりも高域の周波数帯(例えば20kHz以上)である超高域の信号成分を含む音声データ(所謂、ハイレゾリューション(High-Resolution)のデータ)(以下、ハイレゾデータと称する)が普及しつつある。
<ハイレゾデータの再生>
近年、一般的に可聴帯域と称される周波数帯よりも高域の周波数帯(例えば20kHz以上)である超高域の信号成分を含む音声データ(所謂、ハイレゾリューション(High-Resolution)のデータ)(以下、ハイレゾデータと称する)が普及しつつある。
例えば、音楽データも、インターネット等の通信環境の拡充により、従来のオーディオCD(Compact Disc)のフォーマットよりもサンプリング周波数・量子化ビット数を上回るハイレゾデータとしてダウンロード・購入し、PC(Personal Computer)やUSB-DAC(Universal Serial Bus - Digital Analog Converter)等の専用機器を使って、ユーザがより高音質な音楽再生を楽しめる機会が増えてきた。
このようなハイレゾデータに含まれる超高域には、本来の楽曲等の音声以外にも、例えば、音源を録音する際の録音機器のADC(Analog Digital Converter)由来の雑音等が含まれている。特に、所謂1bitADC(ΔΣ型)が使用された場合、ノイズシェイパによって可聴帯域の雑音成分を超高域に移し、可聴帯域のSN比を改善させることが必須となっている。そのため、このような方法で生成されたハイレゾデータには、超高域にノイズシェイパによる雑音が多く含まれる場合がある。
図1に、ハイレゾデータ(Fs192kHz)の周波数解析結果の例を示す。図1A乃至Cは、それぞれ、互いに異なる音楽データの解析結果であるが、いずれのデータにも、20kHz以上の超高域に、ほとんど時間的な変化のない、定常的な雑音が含まれている(楕円で囲んだ部分)。それ以外の部分(特に20kHz以下の可聴帯域)は、主に本来の音声信号により構成されており、時々刻々とそのスペクトルが変化する。
これらのハイレゾデータは、録音の際に1bitADCが用いられており、上述した定常的な雑音(楕円で囲んだ部分)は、主にその1bitADCに搭載されたノイズシェイパによって形成されたものである。従って、この雑音の量や周波数特性の傾きは、そのADCに依存する。
図1A乃至図1Cに示されるように、この雑音は、周波数が高くなるほど大きくなっており、実際の自然界における雑音成分が周波数とともに減っていくのに対して明らかに不自然である。また、この雑音によって、実際の可聴帯域内の音楽・楽器信号に対する倍音が埋もれてしまうこともある。
つまり、ハイレゾデータの超高域には、ノイズシェイパ等による不要な定常的な雑音と、目的とする音源からの可聴帯域以上の音が混在する場合がある。
このような超高域の雑音の問題点は、再生時にユーザに聴こえ難いことである。そのため、ユーザは、この雑音の再生音量を気にすることなく、可聴帯域の再生音量に基づいて音量調整(ゲイン調整)を行う可能性が高い。そのため、超高域の雑音の再生音量が過度に増大し、アンプやスピーカ等の再生デバイスに過度な負荷を与え、故障等の原因となるおそれがあった。
特に、図1Bの例の場合、超高域の雑音の信号レベルが、可聴帯域の信号レベルよりも大きい。したがって、可聴帯域の信号レベルに合わせて音量調整(ゲイン調整)が行われると、超高域の雑音の音量はさらに大きなものとなり、再生機器への負荷が非常に増大するものとなるおそれがあった。
そこで、より安全に再生を行うために、再生時の信号増幅(ゲイン)を抑制することが考えられる。しかしながら、例えば、単純に、超高域をカット若しくは抑制すると、ハイレゾコンテンツの再生に対する本来の意味を失うことになる。
また、例えば特許文献1には、自己相関を利用して入力信号が雑音であるかオーディオデータであるかを判定し、雑音と判定した場合はゲインを下げる方法が記載されている。
しかしながら、特許文献1に記載の方法の場合、オーディオデータと雑音の両方が含まれるような入力信号を雑音と判定すると、オーディオデータのゲインまで下げられてしまい、再生時の音質が低減するおそれがあった。また、全帯域のゲインが下げられるため、再生時の音質が低減するおそれがあった。
<超高域の定常定期な信号成分の推定と低減>
そこで、超高域を含む音声データの再生を、音質の低減を抑制しながらより安全に行うことができるようにするために、直交変換されたオーディオ信号を解析し、超高域の定常的な信号成分を推定し、オーディオ信号に対して、推定された超高域の定常的な信号成分を低減させる信号処理を行うようにする。
そこで、超高域を含む音声データの再生を、音質の低減を抑制しながらより安全に行うことができるようにするために、直交変換されたオーディオ信号を解析し、超高域の定常的な信号成分を推定し、オーディオ信号に対して、推定された超高域の定常的な信号成分を低減させる信号処理を行うようにする。
<再生装置>
図2は、本技術を適用して信号処理装置の一実施の形態である再生装置の主な構成例を示すブロック図である。図2に示される再生装置100は、ハイレゾデータ(音声データ)を再生し、出力する装置である。
図2は、本技術を適用して信号処理装置の一実施の形態である再生装置の主な構成例を示すブロック図である。図2に示される再生装置100は、ハイレゾデータ(音声データ)を再生し、出力する装置である。
図2に示されるように、再生装置100は、記憶部101、周波数軸変換部102、超高域定常的雑音解析部103、ディレイバッファ104、超高域定常的雑音低減部105、DAC106、増幅部107、およびスピーカ108を有する。
記憶部101は、例えば、ハードディスク、フラッシュメモリ、または光ディスク等の任意の記録媒体を有し、デジタルデータのハイレゾデータ(以下、デジタルハイレゾデータとも称する)を記憶する。再生されるデジタルハイレゾデータは、この記憶部101から読み出され、周波数軸変換部102およびディレイバッファ104に供給される。
周波数軸変換部102は、例えばCPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等よりなり、供給されるデジタルハイレゾデータをフーリエ変換(例えば、高速フーリエ変換(FFT(Fast Fourier Transform)))し、周波数スペクトルを生成する。周波数軸変換部102は、その周波数スペクトルを超高域定常的雑音解析部103に供給する。また、ここではCPUと表記しているが、演算自体はMPU(Micro Processing Unit)やDSP(Digital Signal Processor)でも良い。
超高域定常的雑音解析部103は、例えばCPU、ROM、RAM等よりなり、その周波数スペクトルを解析し、超高域の定常的な雑音を推定する。超高域定常的雑音解析部103は、その解析結果を超高域定常的雑音低減部105に供給する。
以上の解析を信号処理前に終了させるために、ディレイバッファ104は、供給されたデジタルハイレゾデータを一時的に保持し、再生タイミングを遅延させる。ディレイバッファ104は、デジタルハイレゾデータを所定時間保持した後、超高域定常的雑音低減部105に供給する。
超高域定常的雑音低減部105は、例えばCPU、ROM、RAM等よりなり、超高域定常的雑音解析部103から供給される解析結果に従って、ディレイバッファ104から供給されるデジタルハイレゾデータに対して、そのデジタルハイレゾデータに含まれる超高域の定常的な雑音を低減させる信号処理を行う。
例えば、超高域定常的雑音低減部105は、スペクトルサブトラクションをベースとする手法や、ウィナー(Wiener)フィルタ等を用いて、超高域の定常的な雑音を低減させる。スペクトルサブトラクションは、雑音が定常であることを利用して推定した雑音を音声信号から除去する手法である。このスペクトルサブトラクションを用いる場合、超高域定常的雑音低減部105は、まず周波数軸上にデジタルハイレゾデータをFFT等で展開し、周波数軸上で参照されるノイズ特性分布を減算処理した後、フーリエ逆変換(例えば、高速フーリエ逆変換(IFFT(Inverse Fast Fourier Transform)))等で時間軸に戻す。つまり音楽信号が処理される最初の時点において、参照(減算)されるべき「ノイズ特性」が確定されている必要がある。このため、超高域定常的雑音解析部103が、超高域定常的雑音低減部105に対してデジタルハイレゾデータをある程度の先読みすることができるように、超高域定常的雑音低減部105の前にディレイバッファ104が設けられている。
超高域定常的雑音低減部105は、信号処理後のデジタルハイレゾデータをDAC106に供給する。
DAC106は、供給されるデジタルハイレゾデータをD/A変換し、アナログ信号の音声信号(以下において、オーディオ信号とも称する)として増幅部107に供給する。増幅部107は、供給されるオーディオ信号を増幅し、スピーカ108に供給する。スピーカ108は、供給されるオーディオ信号を物理振動に変換し、音声や音楽等の音として出力する。
<再生処理の流れ>
以上のような構成の再生装置100が実行する処理について説明する。最初に、再生装置100が実行する再生処理の流れの例を、図3のフローチャートを参照して説明する。
以上のような構成の再生装置100が実行する処理について説明する。最初に、再生装置100が実行する再生処理の流れの例を、図3のフローチャートを参照して説明する。
再生処理が開始されると、周波数軸変換部102および超高域定常的雑音解析部103は、ステップS101において、再生するデジタルハイレゾデータに含まれる超高域の定常的な雑音の解析を行う。
ステップS102において、ディレイバッファ104は、記憶部101からその再生するデジタルハイレゾデータを読み出す。ディレイバッファ104は、読み出したデジタルハイレゾデータを一時的に保持し、ステップS101の処理が終了するまで遅延させる。
ステップS101の処理が終了した後に、ステップS103において、超高域定常的雑音低減部105は、ステップS101の解析結果に基づいて、例えばスペクトルサブトラクション等の信号処理により、デジタルハイレゾデータに含まれる超高域の定常的な雑音を低減させる。
ステップS104において、DAC106は、ステップS103において超高域の定常的な雑音が低減されたデジタルハイレゾデータをD/A変換し、アナログのオーディオ信号を生成する。
ステップS105において、増幅部107は、そのオーディオ信号を所定のゲインで増幅する。
ステップS106において、スピーカ108は、オーディオ信号を音声として出力する。
ステップS106の処理が終了すると、再生処理が終了する。
<解析処理の流れ>
次に、図4のフローチャートを参照して、図3のステップS101において実行される解析処理の流れの例を説明する。必要に応じて、図5を参照して説明する。
次に、図4のフローチャートを参照して、図3のステップS101において実行される解析処理の流れの例を説明する。必要に応じて、図5を参照して説明する。
解析処理が開始されると、ステップS111において、周波数軸変換部102は、再生するデジタルハイレゾデータを記憶部101から読み出す。ステップS112において、周波数軸変換部102は、その読み出したデジタルハイレゾデータをフーリエ変換する。
ステップS113において、超高域定常的雑音解析部103は、周波数軸上でスムージングを行う。
ステップS114において、超高域定常的雑音解析部103は、以上のようにして得られた複数時刻の周波数軸データ(周波数スペクトル)の超高域成分を用いて、超高域の定常的雑音を推定する。
例えば、図5Aおよび図5Bのような複数時刻の周波数スペクトル間で、各周波数のスペクトルを平均化し、図5Cに示されるような超高域の定常的な成分(図5Cの斜線部分)を雑音として推定する。
ステップS114の処理が終了すると、解析処理が終了し、処理は図3に戻る。
超高域定常的雑音低減部105がこの解析結果を用いて、再生するハイレゾデータに対して信号処理を行うことにより、図5Dに示されるように、デジタルハイレゾデータに含まれるこの定常的な雑音が低減される。
したがって再生装置100は、超高域の定常的な雑音が低減されたオーディオ信号を増幅して出力することができるので、超高域の雑音の過大音圧によるスピーカやアンプへの過大な負荷を抑制することができる。つまり、超高域を含む音声データの再生をより安全に行うことができる。また、超高域においても、本来存在していたエネルギー成分は残し、本来不要な雑音を推定して低減させるので、再生装置100は、音質の低減を抑制しながら再生することができる。
つまり、本技術を適用した信号処理装置は、例えば上述した周波数軸変換部102のようにオーディオ信号を直交変換する変換部と、例えば上述した超高域定常的雑音解析部103のようにその変換部により直交変換されたオーディオ信号を解析し、超高域の定常的な信号成分を推定する解析部と、例えば上述した超高域定常的雑音低減部105のようにオーディオ信号に対して、解析部の解析により推定された超高域の定常的な信号成分を低減させる信号処理を行う信号処理部とを備えるので、再生装置100と同様に、超高域を含む音声データの再生を、音質の低減を抑制しながらより安全に行うことができる。
また、本技術を適用した信号処理方法は、例えば上述した周波数軸変換部102のようにオーディオ信号を直交変換し、例えば上述した超高域定常的雑音解析部103のように直交変換されたオーディオ信号を解析し、超高域の定常的な信号成分を推定し、例えば上述した超高域定常的雑音低減部105のようにオーディオ信号に対して、推定された超高域の定常的な信号成分を低減させる信号処理を行うので、再生装置100と同様に、超高域を含む音声データの再生を、音質の低減を抑制しながらより安全に行うことができる。
なお、上述したように、この超高域は、例えば、可聴帯域よりも高域であるようにしてもよい。また、定常的な信号成分は、例えば、高域に向かってレベル増加する成分であるようにしてもよい。さらに、上述したように、信号処理部は、スペクトルサブトラクションにより超高域の定常的な信号成分を低減させるようにしてもよいし、ウィナーフィルタにより超高域の定常的な信号成分を低減させるようにしてもよい。また、上述したように、変換部は、オーディオ信号に対して高速フーリエ変換を行うようにしてもよい。
<解析処理の流れ>
また、定常的な信号成分は、可聴帯域の信号成分の倍音成分を含まない成分であるようにしてもよい。つまり、低減させる雑音から可聴帯域の信号成分の倍音成分を除去するようにしてもよい。
また、定常的な信号成分は、可聴帯域の信号成分の倍音成分を含まない成分であるようにしてもよい。つまり、低減させる雑音から可聴帯域の信号成分の倍音成分を除去するようにしてもよい。
その場合の、解析処理の流れの例を図6のフローチャートを参照して説明する。図6のフローチャートに示されるように、この場合も、ステップS121乃至ステップS124の各処理は、図4の場合のステップS111乃至ステップS114の各処理と同様に実行される。つまり、図4の場合と同様に、超高域の定常的な雑音が推定される。
超高域の定常的な雑音が推定されると、ステップS125において、超高域定常的雑音解析部103は、ステップS124において推定した超高域の定常的な雑音から可聴帯域の信号成分の倍音成分を除去する。
超高域定常的雑音解析部103は、このように可聴帯域の信号成分の倍音成分を除去した超高域の定常的な雑音を、解析結果として、超高域定常的雑音低減部105に供給する。
ステップS124の処理が終了すると解析処理が終了し、処理は図3に戻る。
超高域定常的雑音低減部105が、以上のような解析の結果を用いて、信号処理を行うことにより、可聴帯域の信号成分の倍音成分を含まない、超高域の定常的な雑音を低減させることができる。このようにすることにより、再生装置100(本技術を適用した信号処理装置)は、ハイレゾデータの再生における音質の低減をさらに抑制することができる。
<解析のタイミング>
なお、以上のような超高域の定常的な雑音の解析(超高域の定常的な雑音の推定)は、デジタルハイレゾデータの再生・出力のタイミングよりも前であれば、どのようなタイミングで行われても良い。例えば、所定のタイミングで実行されるようにしてもよいし、外部からの指示を受け付けた場合や、所定のパラメータの変化時や、所定のイベント発生時等に実行されるようにしてもよい。
なお、以上のような超高域の定常的な雑音の解析(超高域の定常的な雑音の推定)は、デジタルハイレゾデータの再生・出力のタイミングよりも前であれば、どのようなタイミングで行われても良い。例えば、所定のタイミングで実行されるようにしてもよいし、外部からの指示を受け付けた場合や、所定のパラメータの変化時や、所定のイベント発生時等に実行されるようにしてもよい。
また、定常的な雑音の推定をすればよいため、解析は、ハイレゾデータの全てを用いる必要は無く、ハイレゾデータの一部(再生時間の内、所定の一部に相当する部分データ(例えば、先頭から若しくは途中から所定の時間に相当する部分データ))のみを用いて行うようにしてもよい。
例えば、図7のように、ハイレゾデータ(楽曲)の再生を開始するタイミング(時刻T1)より前(時刻T0)において、ハイレゾデータの一部(時刻T0乃至時刻T1に相当する部分)を解析し、その解析結果(超高域定常的雑音特性)を用いて、時刻T1からハイレゾデータの再生(再生における雑音を低減する信号処理)を行うようにしてもよい。
また、例えば、ハイレゾデータ(楽曲)の再生中(時刻T1以降)も、定期的にまたは不定期に解析を繰り返し行い(図7の例の場合、時刻T2、T3、T4、T6、T7)、必要に応じて(例えば、解析結果(超高域定常的雑音特性)に大きな変化が生じた場合)、ハイレゾデータの再生(再生における雑音を低減する信号処理)に利用する解析結果(超高域定常的雑音特性)の値を更新するようにしてもよい。図7の例の場合、時刻T4と時刻T7において行われた解析の結果において大きな変化が生じている。
つまり、時刻T1乃至時刻T5のハイレゾデータの再生(再生における雑音を低減する信号処理)には、時刻T1において行われた解析の結果が用いられる。そして、時刻T4において行われる解析結果において大きな変化が生じるため、利用される解析結果が更新され、時刻T5乃至時刻T8のハイレゾデータの再生(再生における雑音を低減する信号処理)には、時刻T4において行われる解析の結果が用いられる。さらに、時刻T7において行われる解析結果において大きな変化が生じるため、利用される解析結果がさらに更新され、時刻T8以降のハイレゾデータの再生(再生における雑音を低減する信号処理)には、時刻T7において行われる解析の結果が用いられる。
もちろん、ハイレゾデータの再生タイミングよりも前のタイミングであれば、ハイレゾデータの再生とは関係なく、解析が行われるようにしてもよい。例えば、記憶部101がハイレゾデータを記憶する時等に解析が行われるようにしてもよい。その場合、例えば、超高域定常的雑音解析部103や超高域定常的雑音低減部105等がその解析結果を、ハイレゾデータの再生時(再生における雑音を低減する信号処理時)まで保持することができるようにしてもよい。また、新たに、解析結果を記憶する記憶部を設けるようにしてもよい。なお、その場合、再生タイミングを解析タイミングに合わせるように遅延させる必要が無いので、ディレイバッファ104を省略することもできる。
以上のように解析を行うことにより、解析に伴う処理の負荷や消費電力の増大を抑制することができる。
<2.第2の実施の形態>
<帯域分割>
なお、上述した定常的な雑音を低減させる信号処理は、一部の帯域についてのみ行うようにしてもよい。例えば、再生するハイレゾデータを可聴帯域以下と超高域とに帯域分割し、超高域についてのみ、上述した定常的な雑音を低減させる信号処理を施すようにしてもよい。
<帯域分割>
なお、上述した定常的な雑音を低減させる信号処理は、一部の帯域についてのみ行うようにしてもよい。例えば、再生するハイレゾデータを可聴帯域以下と超高域とに帯域分割し、超高域についてのみ、上述した定常的な雑音を低減させる信号処理を施すようにしてもよい。
一般的に、ノイズリダクション処理は非線形な信号処理手法であり、雑音の低減度が高いほど、本来求めたい信号の音質も影響を受けて劣化する。特に、ハイレゾデータは高精度の処理を行うか、ほとんど何も処理しない場合(ダイレクト再生) でないと、音質への影響が避けられない。図2の再生装置100の場合、超高域定常的雑音低減部105が可聴帯域全体も含めてFFT/IFFTすることになる。そのため演算精度やFFTフレームの取り方による音質に影響を及ぼす可能性が高い(すなわち、その分、音質が低減する可能性が高い)。
そこで、上述したように帯域を分割し、可聴帯域以下については、ディレイ処理以外 極力信号処理を施さないようにすることにより、音質の低減をさらに抑制することができる。なお、一般的に、高域にいくほど聴覚は時間・位相性より、そのエネルギー性が大事になるとされているので、超高域については、スペクトルサブトラクションにより多少位相が変化しても人間が聞き分けられる程の音質変化にはなり難い。
<再生装置>
図8は、その場合の再生装置の主な構成例を示すブロック図である。図8に示される再生装置200は、再生装置100と同様、本技術を適用した信号処理を行って、デジタルハイレゾデータの超高域の定常的な雑音を抑制して再生する装置である。ただし、再生装置200は、デジタルハイレゾデータに対して帯域分割を行い、その超高域の成分に対してのみ、本技術を適用した信号処理を行う。
図8は、その場合の再生装置の主な構成例を示すブロック図である。図8に示される再生装置200は、再生装置100と同様、本技術を適用した信号処理を行って、デジタルハイレゾデータの超高域の定常的な雑音を抑制して再生する装置である。ただし、再生装置200は、デジタルハイレゾデータに対して帯域分割を行い、その超高域の成分に対してのみ、本技術を適用した信号処理を行う。
図8に示されるように、信号処理装置の一実施の形態である再生装置200は、記憶部201、HPF(High Pass Filter)202、周波数軸変換部203、超高域定常的雑音解析部204、ディレイバッファ205、超高域定常的雑音低減部206、HPF207、LPF(Low Pass Filter)208、ディレイバッファ209、演算部210、DAC211、増幅部212、およびスピーカ213を有する。
記憶部201は、記憶部101と同様の処理部であり、デジタルハイレゾデータを記憶する。再生されるデジタルハイレゾデータは、この記憶部201から読み出され、HPF202およびLPF208に供給される。
HPF202は、供給されるデジタルハイレゾデータの超高域(例えば、20kHz以上)を通過させ、可聴帯域以下(例えば、20kHz以下)を遮断する。すなわち、HPF202は、供給されるデジタルハイレゾデータからその超高域成分を抽出する。HPF202は、抽出した超高域成分を周波数軸変換部203およびディレイバッファ205に供給する。
周波数軸変換部203は、周波数軸変換部102と同様の処理部であり、HPF202から供給されるデジタルハイレゾデータの超高域成分をフーリエ変換(例えば、高速フーリエ変換(FFT(Fast Fourier Transform)))し、生成した周波数スペクトルを超高域定常的雑音解析部204に供給する。
超高域定常的雑音解析部204は、超高域定常的雑音解析部103と同様の処理部であり、デジタルハイレゾデータの超高域成分の周波数スペクトルを解析し、超高域の定常的な雑音を推定する。つまり、超高域定常的雑音解析部204は、デジタルハイレゾデータの超高域成分を対象に、超高域定常的雑音解析部103と同様の解析を行う。超高域定常的雑音解析部204は、その解析結果を超高域定常的雑音低減部206に供給する。
ディレイバッファ205は、ディレイバッファ104と同様の処理部であり、供給されたデジタルハイレゾデータの超高域成分を、解析が先に終了するように、一時的に保持し、再生タイミングを遅延させる。ディレイバッファ205は、デジタルハイレゾデータの超高域成分を所定時間保持した後、超高域定常的雑音低減部206に供給する。
超高域定常的雑音低減部206は、超高域定常的雑音低減部105と同様の処理部である。超高域定常的雑音低減部206は、超高域定常的雑音解析部204から供給される解析結果に従って、ディレイバッファ205から供給されるデジタルハイレゾデータの超高域成分に対して、スペクトルサブトラクションをベースとする手法や、ウィナー(Wiener)フィルタ等を用いて、そのデジタルハイレゾデータに含まれる超高域の定常的な雑音を低減させる信号処理を行う。超高域定常的雑音低減部206は、信号処理後のデジタルハイレゾデータの超高域成分をHPF207に供給する。
信号処理後のデジタルハイレゾデータの超高域成分には、可聴帯域以下(例えば、20kHz以下)の成分も含まれる可能性がある。このような成分が、再生出力されるハイレゾデータの可聴帯域以下の成分に影響を及ぼさないように、HPF207は、供給された信号処理後のデジタルハイレゾデータの超高域成分の超高域(例えば、20kHz以上)を通過させ、可聴帯域以下(例えば、20kHz以下)を遮断する。HPF207は、可聴帯域以下の成分を逓減させた信号処理後のデジタルハイレゾデータの超高域成分を演算部210に供給する。
つまり、HPF202乃至HPF207により、デジタルハイレゾデータの超高域成分に対してのみ、本技術を適用した、超高域の定常的な雑音の解析と、その超高域の定常的な雑音を低減させる信号処理が行われる。
LPF208は、供給されるデジタルハイレゾデータの可聴帯域以下(例えば、20kHz以下)を通過させ、超高域(例えば、20kHz以上)を遮断する。すなわち、LPF208は、供給されるデジタルハイレゾデータからその可聴帯域以下の成分を抽出する。LPF208は、抽出した可聴帯域以下の成分をディレイバッファ209に供給する。
ディレイバッファ209は、ディレイバッファ205と同様の処理部であり、供給されたデジタルハイレゾデータの可聴帯域以下の成分を、ディレイバッファ209と略同時間、一時的に保持し、再生タイミングを遅延させる。ディレイバッファ209は、デジタルハイレゾデータの可聴帯域以下の成分を所定時間保持した後、演算部210に供給する。
演算部210は、ディレイバッファ209から供給されたデジタルハイレゾデータの可聴帯域以下の成分と、HPF207から供給された、可聴帯域以下の成分を逓減させた信号処理後のデジタルハイレゾデータの超高域成分とを加算し、その加算結果、すなわち、信号処理されたデジタルハイレゾデータをDAC211に供給する。
DAC211は、DAC106と同様の処理部であり、供給されるデジタルハイレゾデータをD/A変換し、アナログ信号の音声信号(以下において、オーディオ信号とも称する)として増幅部212に供給する。増幅部212は、増幅部107と同様の処理部であり、供給されるオーディオ信号を増幅し、スピーカ213に供給する。スピーカ213は、スピーカ108と同様の処理部であり、供給されるオーディオ信号を物理振動に変換し、音声や音楽等の音として出力する。
このような構成を有することにより、再生装置200は、本技術を適用した信号処理の、可聴帯域以下の成分への影響を抑制することができるので、音質の低減をさらに抑制することができる。
すなわち、本技術を適用した信号処理装置は、例えば上述したHPF202およびLPF208のようにオーディオ信号を超高域の信号成分と超高域以外の信号成分とに帯域分割する帯域分割部と、例えば上述した演算部210のように信号処理部により超高域の定常的な信号成分が低減されたオーディオ信号を、帯域分割部によりオーディオ信号が帯域分割されて得られたオーディオ信号の超高域以外の信号成分と合成する合成部とをさらに備え、変換部は、帯域分割部によりオーディオ信号が帯域分割されて得られたオーディオ信号の超高域の信号成分を直交変換し、解析部は、変換部により直交変換されたオーディオ信号の超高域の信号成分を解析し、超高域の定常的な信号成分を推定し、信号処理部は、帯域分割部によりオーディオ信号が帯域分割されて得られたオーディオ信号の超高域の信号成分に対して、解析部の解析により推定された超高域の定常的な信号成分を低減させる信号処理を行い、合成部は、信号処理部により超高域の定常的な信号成分が低減されたオーディオ信号の超高域の信号成分を、帯域分割部によりオーディオ信号が帯域分割されて得られたオーディオ信号の超高域以外の信号成分と合成するようにしてもよい。このようにすることにより、再生装置200の場合と同様に、音質の低減をさらに抑制することができる。
同様に、本技術を適用した信号処理方法は、例えば上述したHPF202およびLPF208のようにオーディオ信号を超高域の信号成分と超高域以外の信号成分とに帯域分割し、オーディオ信号が帯域分割されて得られたオーディオ信号の超高域の信号成分を直交変換し、直交変換されたオーディオ信号の超高域の信号成分を解析し、超高域の定常的な信号成分を推定し、オーディオ信号が帯域分割されて得られたオーディオ信号の超高域の信号成分に対して、解析により推定された超高域の定常的な信号成分を低減させる信号処理を行い、超高域の定常的な信号成分が低減されたオーディオ信号の超高域の信号成分を、オーディオ信号が帯域分割されて得られたオーディオ信号の超高域以外の信号成分と合成するようにしてもよい。このようにすることにより、再生装置200の場合と同様に、音質の低減をさらに抑制することができる。
<その他の構成>
例えば再生装置100において、記憶部101は、省略するようにしてもよい。その場合、ハイレゾデータは、再生装置100の外部(例えば他の装置)から入力されるようにすればよい。また、DAC106乃至スピーカ108も、それぞれ、省略するようにしてもよい。その場合、省略した各処理部の処理は、必要に応じて、再生装置100の外部(例えば他の装置)等において実行されるようにすればよい。また、その場合、必要に応じて、外部とのデータを授受する機能を設けるようにしてもよい。
例えば再生装置100において、記憶部101は、省略するようにしてもよい。その場合、ハイレゾデータは、再生装置100の外部(例えば他の装置)から入力されるようにすればよい。また、DAC106乃至スピーカ108も、それぞれ、省略するようにしてもよい。その場合、省略した各処理部の処理は、必要に応じて、再生装置100の外部(例えば他の装置)等において実行されるようにすればよい。また、その場合、必要に応じて、外部とのデータを授受する機能を設けるようにしてもよい。
同様に、再生装置200においても、記憶部201、HPF202、ディレイバッファ205、HPF207乃至スピーカ213は、それぞれ、省略するようにしてもよい。その場合、省略した各処理部の処理は、必要に応じて、再生装置200の外部(例えば他の装置)等において実行されるようにすればよい。また、その場合、必要に応じて、外部とのデータを授受する機能を設けるようにしてもよい。
<3.第3の実施の形態>
<送信装置>
例えば、上述したように本技術を適用した信号処理を施し、超高域の定常的な雑音を低減させたハイレゾデータを、他の装置に供給し、他の装置において再生・出力させるようにしてもよい。すなわち、本技術は、再生装置以外の信号処理装置にも適用することができる。
<送信装置>
例えば、上述したように本技術を適用した信号処理を施し、超高域の定常的な雑音を低減させたハイレゾデータを、他の装置に供給し、他の装置において再生・出力させるようにしてもよい。すなわち、本技術は、再生装置以外の信号処理装置にも適用することができる。
図9は、本技術を適用した信号処理装置の一実施の形態である送信装置の主な構成例を示すブロック図である。図9に示される送信装置300は、ハイレゾデータ(音声データ)を符号化し、後述する受信装置に送信し、その受信装置において再生・出力させる装置である。
図9に示されるように、送信装置300は、記憶部301、HPF302、周波数軸変換部303、超高域定常的雑音解析部304、ディレイバッファ305、超高域定常的雑音低減部306、HPF307、LPF308、ディレイバッファ309、演算部310、符号化部311、および送信部312を有する。
記憶部301乃至演算部310の各処理部は、再生装置200の記憶部201乃至演算部210の各処理部と同様の処理部であり、同様の処理を行う。すなわち、送信装置300は、再生装置200と基本的に同様の構成を有し、DAC211、増幅部212、およびスピーカ213の代わりに、符号化部311および送信部312を有する。
符号化部311は、例えば、CPU、ROM、RAM等よりなり、演算部310から供給される信号処理されたデジタルハイレゾデータ、すなわち、デジタルハイレゾデータの可聴帯域以下の成分と、可聴帯域以下の成分を逓減させた信号処理後のデジタルハイレゾデータの超高域成分との加算結果を、所定の符号化方式で符号化する。符号化部311は、その符号化により得られた符号化データを、送信部312に供給する。
送信部312は、例えば、CPU、ROM、RAM等よりなり、所定の通信方式で、符号化部311から供給される符号化データを送信する。この通信方式は有線通信であってもよいし無線通信であってもよい。例えば、有線通信の場合、送信部312は、所定の通信ケーブル等により、通信相手の受信装置に接続される。また、例えば、Bluetooth(登録商標)やWiFi(登録商標)等の無線通信の場合、送信部312は、所定のアンテナを有し、そのアンテナを介して符号化データを無線信号として送信する。
図10は、この送信装置300に対応する受信装置の主な構成例を示すブロック図である。図10に示される受信装置350は、送信装置300より送信される符号化データを受信して復号し、得られたハイレゾデータを再生・出力する装置である。
図10に示されるように、受信装置350は、受信部351、復号部352、DAC353、増幅部354、およびスピーカ355を有する。
受信部351は、送信装置300の送信部312に対応し、送信部312と同様の通信方式により、送信装置300から送信された符号化データを受信して復調する。この通信方式は有線通信であってもよいし無線通信であってもよい。例えば、有線通信の場合、受信部351は、所定の通信ケーブル等により、通信相手の送信装置300に接続される。また、無線通信の場合、受信部351は、所定のアンテナを有し、そのアンテナを介して無線信号として送信される符号化データを受信する。受信部351は、受信した符号化データを復号部352に供給する。
復号部352は、供給された符号化データを、送信装置300の符号化部311の符号化方式に対応する復号方式により復号し、デジタルハイレゾデータを得る。このデジタルハイレゾデータは、送信装置300において、超高域の定常的な雑音を低減させるように信号処理されたデータである。復号部352は、得られたデジタルハイレゾデータをDAC353に供給する。
DAC353、増幅部354、およびスピーカ355は、それぞれ、DAC211、増幅部212、およびスピーカ213と同様の処理部であり、同様の処理を行う。
以上のように、デジタルハイレゾデータは、送信装置300において、本技術を適用した信号処理が施され、符号化されて受信装置350に伝送され、受信装置350において、復号されて再生・出力される。
このようにすることにより、送信装置300および受信装置350は、超高域を含む音声データの再生を、音質の低減を抑制しながらより安全に行うことができる。
また、送信装置300のように、符号化の際に、本技術を適用した信号処理を行うことにより、超高域の不要なエネルギー成分(雑音)を抑制して符号化することができるので、符号化効率を向上させることができる。
なお、換言するに、以上に説明した本技術を適用した信号処理は、任意のタイミングで実行することができ、ハイレゾデータの再生・出力時以外であっても行うことができる。すなわち、本技術は、再生装置以外の信号処理装置にも適用することができる。
例えば、図9においては、符号化後、符号化されたハイレゾデータを受信装置350に送信し、再生・出力させるように説明したが、これに限らず、符号化データを所定の記憶部等に記憶させたり、他の音声信号処理を施したり、編集したりするようにしてもよい。また、符号化せずに、信号処理のみを施して、信号処理後のハイレゾデータを所定の記憶部等に記憶させたり、他の音声信号処理を施したり、編集したりするようにしてもよい。また、符号化データや信号処理後のハイレゾデータを他の装置に伝送し、その他の装置において、それらの処理を実行させるようにしてもよい。
<4.第4の実施の形態>
<再生時の音量制御>
ところで、ハイレゾデータの再生において、アンプやスピーカを保護するための方法としては、図11に示されるようなマルチバンドコンプ(帯域別コンプレッサ)を使って、超高域に対してのみレベル解析を行いゲイン制御処理をすることで、超高域のみゲインを抑える方法も考えられる。
<再生時の音量制御>
ところで、ハイレゾデータの再生において、アンプやスピーカを保護するための方法としては、図11に示されるようなマルチバンドコンプ(帯域別コンプレッサ)を使って、超高域に対してのみレベル解析を行いゲイン制御処理をすることで、超高域のみゲインを抑える方法も考えられる。
しかしながら、この方法の場合、ノイズシェイパによる雑音のカーブの形状など、雑音特性に関わらずコンプ動作は一定となってしまう。また、デジタル領域における信号レベルで処理を決めており、 機器のボリュームは考慮されない。つまり小音量再生の場合でもデジタルのフルスケールレベルに対して相対的に大きなレベルのノイズシェイパ雑音が入っていればコンプレッサが抑えてしまう。さらに、常時レベル解析が必要なので、CPU、MPU、またはDSP等の計算リソースが掛かり消費電力が大きくなる。
そこで、オーディオ信号を直交変換する変換部と、変換部により直交変換されたオーディオ信号を解析し、超高域の定常的な信号成分を推定する解析部と、オーディオ信号に対して、解析部の解析により推定された超高域の定常的な信号成分を低減させる信号処理を行う信号処理部とを備え、信号処理部が、オーディオ信号の増幅量に応じて、超高域の定常的な信号成分を低減させるようにしてもよい。
<再生装置>
図12は、本技術を適用して信号処理装置の一実施の形態である再生装置の主な構成例を示すブロック図である。図12に示される再生装置500は、ハイレゾデータ(音声データ)を再生し、出力する装置である。
図12は、本技術を適用して信号処理装置の一実施の形態である再生装置の主な構成例を示すブロック図である。図12に示される再生装置500は、ハイレゾデータ(音声データ)を再生し、出力する装置である。
図12に示されるように、再生装置500は、記憶部501、周波数軸変換部502、入力部503、超高域定常的雑音解析部504、ボリューム制御データベース505、ディレイバッファ506、超高域定常的雑音低減部507、DAC508、増幅部509、およびスピーカ510を有する。
記憶部501は、再生装置100の記憶部101と同様の処理部であり、デジタルハイレゾデータを記憶する。再生されるデジタルハイレゾデータは、この記憶部501から読み出され、周波数軸変換部502およびディレイバッファ506に供給される。
周波数軸変換部502は、再生装置100の周波数軸変換部102と同様の処理部であり、供給されるデジタルハイレゾデータをフーリエ変換し、周波数スペクトルを超高域定常的雑音解析部504に供給する。
入力部503は、ユーザによる入力操作が示す情報やユーザ等が操作するリモートコントローラ等の他の装置から供給される情報を受け付ける。例えば、入力部503は、それらから入力される音量設定を受け付ける。入力部503は、入力された音量設定を超高域定常的雑音解析部504および増幅部509に供給する。
超高域定常的雑音解析部504は、例えばCPU、ROM、RAM等よりなり、再生装置100の超高域定常的雑音解析部103と同様に、周波数軸変換部502から供給される周波数スペクトルを解析し、超高域の定常的な雑音を推定する。また、超高域定常的雑音解析部504は、増幅部509やスピーカ510等のハードウエアの仕様に関する情報(以下、ハードウエア情報とも称する)を有しており、そのハードウエア情報に基づいて、音量設定毎に、超高域定常的雑音低減部507による超高域成分を抑制するためのフィルタ処理の制御パラメータの値を設定する。超高域定常的雑音解析部504は、その値をボリューム制御データベース505に供給する。
ボリューム制御データベース505は、例えば、ハードディスク、フラッシュメモリ、または光ディスク等の任意の記録媒体を有し、各音量設定とそれに対応する制御パラメータの値とを、その関係を維持したまま、ボリューム制御データベースとして記憶する。
デジタルハイレゾデータを再生・出力する際、超高域定常的雑音解析部504は、入力部503から供給される音量設定をボリューム制御データベース505に供給する。ボリューム制御データベース505は、その超高域定常的雑音解析部504の要求に応じて、その音量設定に対応する制御パラメータの値を超高域定常的雑音解析部504に供給する。超高域定常的雑音解析部504は、その、入力部503から供給される音量設定に対応する制御パラメータの値を超高域定常的雑音低減部507に供給する。
以上の解析を信号処理前に終了させるために、ディレイバッファ506は、供給されたデジタルハイレゾデータを一時的に保持し、再生タイミングを遅延させる。ディレイバッファ506は、デジタルハイレゾデータを所定時間保持した後、超高域定常的雑音低減部507に供給する。
超高域定常的雑音低減部507は、例えばCPU、ROM、RAM等よりなり、超高域定常的雑音解析部103から供給される制御パラメータの値を用いて、ディレイバッファ506から供給されるデジタルハイレゾデータに対して、その超高域に対するフィルタ処理を行い、そのデジタルハイレゾデータに含まれる超高域の定常的な雑音を低減させる。そのフィルタ処理の所定の制御パラメータは可変である。上述したように、超高域定常的雑音解析部504は、入力部503において受け付けられた音量設定に応じて、その制御パラメータの値を設定する。したがって、超高域定常的雑音低減部507は、その制御パラメータについて、入力部503において受け付けられた音量設定に応じた値を適用することができる。すなわち、超高域定常的雑音低減部507は、入力部503において受け付けられた音量設定に応じたフィルタ処理を行うことができる。超高域定常的雑音低減部507は、フィルタ処理後のデジタルハイレゾデータをDAC508に供給する。
DAC508は、供給されるデジタルハイレゾデータをD/A変換し、アナログ信号の音声信号(以下において、オーディオ信号とも称する)として増幅部509に供給する。増幅部509は、入力部503から供給される音量設定に応じたゲインで、DAC508から供給されるオーディオ信号を増幅し、スピーカ510に供給する。スピーカ510は、供給されるオーディオ信号を物理振動に変換し、音声や音楽等の音として出力する。
<再生処理の流れ>
以上のような構成の再生装置500が実行する処理について説明する。最初に、再生装置500が実行する再生処理の流れの例を、図13のフローチャートを参照して説明する。
以上のような構成の再生装置500が実行する処理について説明する。最初に、再生装置500が実行する再生処理の流れの例を、図13のフローチャートを参照して説明する。
再生処理が開始されると、周波数軸変換部502、超高域定常的雑音解析部504、およびボリューム制御データベース505は、ステップS501において、再生するデジタルハイレゾデータに含まれる超高域の定常的な雑音の解析を行う。詳細については、後述するが、この処理により、音量設定と、超高域定常的雑音低減部507によるフィルタ処理の制御パラメータの値との対応表が、ボリューム制御データベースとして生成される。
ステップS502において、ディレイバッファ506は、再生するデジタルハイレゾデータを記憶部501から読み出す。ディレイバッファ506は、読み出したデジタルハイレゾデータを一時的に保持し、ステップS501の処理が終了するまで遅延させる。
ステップS501の処理が終了した後に、ステップS503において、入力部503は、音量設定を受け付ける。ステップS504において、超高域定常的雑音解析部504は、ボリューム制御データベース505を参照し、ステップS503において受け付けられた音量設定に応じた制御パラメータを設定する。
ステップS505において、超高域定常的雑音低減部507は、ステップS504において設定された制御パラメータを用いて、デジタルハイレゾデータの超高域に対するフィルタ処理を行う。すなわち、超高域定常的雑音低減部507は、超高域の定常的な雑音成分を低減させるように、主に超高域を低減させるフィルタ処理を行う。
このフィルタ処理およびその制御パラメータは任意である。例えば、超高域を低減させるローパスフィルタ(LPF)を用いたフィルタ処理であってもよい。その場合、音量設定に応じて値を変化させる制御パラメータは、例えば、カットオフ周波数(fc)であってもよい。例えば、図14Aのように、音量設定(ボリューム)が大きくなる程、カットオフ周波数(fc)が小さくなり(可聴帯域上限(例えば20kHz)に近づく)、音量設定(ボリューム)が小さくなる程、カットオフ周波数(fc)が大きくなる(可聴帯域上限(例えば20kHz)から遠ざかる)ようにしてもよい。
また、音量設定に応じて値を変化させる制御パラメータは、例えば、傾き(カットのきつさ・ゲイン)であってもよい。例えば、図14Bのように、音量設定(ボリューム)が大きくなる程、カットオフ周波数(fc)以上の帯域における傾きが大きくなり(ゲインが小さくなり)、音量設定(ボリューム)が小さくなる程、カットオフ周波数(fc)以上の帯域における傾きが小さくなる(ゲインが大きくなる)ようにしてもよい。
また、フィルタ処理が、超高域を低減させるTSF(Treble Shelving Filter)であってもよい。その場合、音量設定に応じて値を変化させる制御パラメータは、例えば、ゲイン(傾き(カットのきつさ))であってもよい。例えば、図14Cのように、音量設定(ボリューム)が大きくなる程、カットオフ周波数(fc)以上の帯域における傾きの角度(カットのきつさ)が大きくなり(ゲインが小さくなり)、音量設定(ボリューム)が小さくなる程、カットオフ周波数(fc)以上の帯域における傾きの角度(カットのきつさ)が小さくなる(ゲインが大きくなる)ようにしてもよい。
また、図15Aに示されるように、リミッタを用いて超高域を低減させるフィルタ処理であってもよい。図15Aの例の場合、超高域定常的雑音低減部507は、HPF551、リミッタ552、LPF553、および演算部554を有する。
HPF551は、供給されたハイレゾデータから超高域(例えば20kHz以上)の成分を抽出し、リミッタ552に供給する。リミッタ552は、図15Bに示される例のような所定の入出力特性を有し、入力の信号レベルが所定のスレッショルド(閾値)以上の場合、所定の信号レベルに抑制して出力する。リミッタ552は、供給されたハイレゾデータの超高域の成分に対して、そのような信号レベル制限を行い、演算部554に供給する。
LPF553は、供給されたハイレゾデータから可聴帯域以下(例えば20kHz以下)の成分を抽出し、演算部554に供給する。演算部554は、LPF553から供給されるハイレゾデータと、リミッタ552から供給されるハイレゾデータとを加算(合成)し、その加算結果(合成結果)、すなわち、全帯域のハイレゾデータを出力する。このハイレゾデータは、リミッタ552により、適宜、超高域が抑制されている。
この場合の、音量設定に応じて値を変化させる制御パラメータは、例えば、リミッタ552の入出力特性のスレッショルドであってもよい。例えば、音量設定(ボリューム)が大きくなる程、このスレッショルドの値が小さくなり、音量設定(ボリューム)が小さくなる程、スレッショルドの値が大きくなるようにしてもよい。
もちろん、超高域を抑制するフィルタ処理や音量設定に応じて値を変化させる制御パラメータは、上述した以外であってもよい。
図13に戻り、ステップS506において、DAC508は、ステップS505においてフィルタ処理されたデジタルハイレゾデータをD/A変換し、アナログのオーディオ信号を生成する。
ステップS507において、増幅部509は、そのオーディオ信号を、ステップS503において受け付けられた音量設定に応じたゲインで増幅する。
ステップS508において、スピーカ510は、オーディオ信号を音声として出力する。
ステップS510の処理が終了すると、再生処理が終了する。
<解析処理の流れ>
次に、図16のフローチャートを参照して、図13のステップS501において実行される解析処理の流れの例を説明する。必要に応じて、図17を参照して説明する。
次に、図16のフローチャートを参照して、図13のステップS501において実行される解析処理の流れの例を説明する。必要に応じて、図17を参照して説明する。
解析処理が開始されると、ステップS511において、周波数軸変換部502は、再生するデジタルハイレゾデータを記憶部501から読み出す。ステップS512において、周波数軸変換部502は、その読み出したデジタルハイレゾデータをフーリエ変換する。
ステップS513において、超高域定常的雑音解析部103は、周波数軸上でスムージングを行う。
ステップS514において、超高域定常的雑音解析部504は、以上のようにして得られた複数時刻の周波数軸データ(周波数スペクトル)の超高域成分を用いて、超高域の定常的な雑音を推定する。
ステップS515において、超高域定常的雑音解析部504は、さらに、増幅部509やスピーカ510等の再生装置500のハードウエア情報に基づいて、推定した超高域の定常的な雑音に対する超高域のレベルマージンを算出する。
ステップS516において、超高域定常的雑音解析部504は、ステップS515において算出したレベルマージンに基づいて、例えば、図17に示されるような、各音量設定に対応する、超高域定常的雑音低減部507によるフィルタ処理の制御パラメータの値を設定する。
図17の例の場合、Volume0; Volume1; Volume2; …; Volume28; Volume29; Volumr30の各音量設定に対して、paramA0,paramB0,…; paramA1,paramB1,…; paramA2,paramB2,…; …; paramA28,paramB28,…; paramA29,paramB29,…; paramA30,paramB30,…;のように、音量設定に応じて可変の制御パラメータの値がそれぞれ設定されている。このような音量設定と制御パラメータとの対応表が生成されると、処理はステップS517に進む。
ステップS517において、ボリューム制御データベース505は、ステップS516において生成された、音量設定毎の制御パラメータの値を、ボリューム制御データベースとして記憶する。
ステップS517の処理が終了すると、処理は、図13に戻る。
以上のように生成されたボリューム制御データベースを用いて、超高域定常的雑音解析部504が、図13のフローチャートを参照して説明したように、入力部503において受け付けられた音量設定に応じた制御パラメータの値を特定し、その制御パラメータを超高域定常的雑音低減部507に供給し、超高域定常的雑音低減部507がその制御パラメータを用いてフィルタ処理を行うことにより、再生されるデジタルハイレゾデータの超高域の成分が、音量設定に応じて適切に低減される。
したがって再生装置500は、必要な場合(スピーカやアンプへの負荷が許容できないほど課題である場合)にのみ超高域が低減されたオーディオ信号を増幅して出力することができるので、超高域の雑音の過大音圧によるスピーカやアンプへの過大な負荷を抑制することができる。つまり、超高域を含む音声データの再生をより安全に行うことができる。また、超高域においても不要な低減を抑制することができるので、再生装置500は、音質の低減を抑制しながら再生することができる。
つまり、この場合も、本技術を適用した信号処理装置は、再生装置500と同様に、超高域を含む音声データの再生を、音質の低減を抑制しながらより安全に行うことができる。
なお、この場合も、超高域定常的雑音低減部507が、第1の実施の形態の再生装置100と同様のフィルタ処理(スペクトルサブトラクションやウィナーフィルタ)を行い、本来不要な超高域の定常的な雑音を主に抑制するようにしてもよい。つまり、第1の実施の形態の再生装置100と同様のフィルタ処理(スペクトルサブトラクションやウィナーフィルタ)の制御パラメータの値を、音量設定に応じて制御することができるようにしてもよい。
<解析処理の流れ>
また、この場合も、定常的な信号成分は、可聴帯域の信号成分の倍音成分を含まない成分であるようにしてもよい。つまり、推定する雑音から可聴帯域の信号成分の倍音成分を除去するようにしてもよい。
また、この場合も、定常的な信号成分は、可聴帯域の信号成分の倍音成分を含まない成分であるようにしてもよい。つまり、推定する雑音から可聴帯域の信号成分の倍音成分を除去するようにしてもよい。
その場合の、解析処理の流れの例を図18のフローチャートを参照して説明する。図18のフローチャートに示されるように、この場合も、ステップS521乃至ステップS524の各処理は、図16の場合のステップS511乃至ステップS514の各処理と同様に実行される。つまり、図16の場合と同様に、超高域の定常的な雑音が推定される。
超高域の定常的な雑音が推定されると、ステップS525において、超高域定常的雑音解析部504は、ステップS524において推定した超高域の定常的な雑音から可聴帯域の信号成分の倍音成分を除去する。
ステップS526において、超高域定常的雑音解析部504は、増幅部509やスピーカ510等の再生装置500のハードウエア情報に基づいて、このように可聴帯域の信号成分の倍音成分を除去した超高域の定常的な雑音に対する超高域のレベルマージンを算出する。
ステップS527およびステップS528の各処理は、図16のステップS516およびステップS517の各処理と同様時実行される。
ステップS528の処理が終了すると解析処理が終了し、処理は図13に戻る。
超高域定常的雑音低減部507が、以上のような解析の結果を用いて、信号処理を行うことにより、可聴帯域の信号成分の倍音成分を含まない、超高域の定常的な雑音の音量設定に基づいて、超高域を低減させることができる。可聴帯域の信号成分の倍音成分は、基本的に時間変動し、定常的でないため、再生装置に与える負荷も、定常的な雑音よりは小さい。したがって、このようにすることにより、再生装置500(本技術を適用した信号処理装置)は、超高域の不要な低減をさらに抑制し、ハイレゾデータの再生における音質の低減をさらに抑制することができる。
<解析のタイミング>
なお、本実施の形態の場合も、超高域の定常的な雑音の解析(超高域の定常的な雑音の推定)は、第1の実施の形態の場合(図7の例)と同様に、デジタルハイレゾデータの再生・出力のタイミングよりも前であれば、どのようなタイミングで行われても良い。また、定常的な雑音の推定をすればよいため、第1の実施の形態の場合(図7の例)と同様に、解析は、ハイレゾデータの全てを用いる必要は無く、ハイレゾデータの一部(再生時間の内、所定の一部に相当する部分データ(例えば、先頭から若しくは途中から所定の時間に相当する部分データ))のみを用いて行うようにしてもよい。
なお、本実施の形態の場合も、超高域の定常的な雑音の解析(超高域の定常的な雑音の推定)は、第1の実施の形態の場合(図7の例)と同様に、デジタルハイレゾデータの再生・出力のタイミングよりも前であれば、どのようなタイミングで行われても良い。また、定常的な雑音の推定をすればよいため、第1の実施の形態の場合(図7の例)と同様に、解析は、ハイレゾデータの全てを用いる必要は無く、ハイレゾデータの一部(再生時間の内、所定の一部に相当する部分データ(例えば、先頭から若しくは途中から所定の時間に相当する部分データ))のみを用いて行うようにしてもよい。
もちろん、ハイレゾデータの再生タイミングよりも前のタイミングであれば、ハイレゾデータの再生とは関係なく、解析が行われるようにしてもよい。例えば、記憶部501がハイレゾデータを記憶する時等に解析が行われるようにしてもよい。その場合、再生タイミングを解析タイミングに合わせるように遅延させる必要が無いので、ディレイバッファ506を省略することもできる。
以上のように解析を行うことにより、解析に伴う処理の負荷や消費電力の増大を抑制することができる。
<5.第5の実施の形態>
<コンピュータ>
上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここでコンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等が含まれる。
<コンピュータ>
上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここでコンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等が含まれる。
図19は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。
図19に示されるコンピュータ900において、CPU(Central Processing Unit)901、ROM(Read Only Memory)902、RAM(Random Access Memory)903は、バス904を介して相互に接続されている。
バス904にはまた、入出力インタフェース910も接続されている。入出力インタフェース910には、入力部911、出力部912、記憶部913、通信部914、およびドライブ915が接続されている。
入力部911は、例えば、キーボード、マウス、マイクロホン、タッチパネル、入力端子などよりなる。出力部912は、例えば、ディスプレイ、スピーカ、出力端子などよりなる。記憶部913は、例えば、ハードディスク、RAMディスク、不揮発性のメモリなどよりなる。通信部914は、例えば、ネットワークインタフェースよりなる。ドライブ915は、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブルメディア921を駆動する。
以上のように構成されるコンピュータでは、CPU901が、例えば、記憶部913に記憶されているプログラムを、入出力インタフェース910およびバス904を介して、RAM903にロードして実行することにより、上述した一連の処理が行われる。RAM903にはまた、CPU901が各種の処理を実行する上において必要なデータなども適宜記憶される。
コンピュータ(CPU901)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア921に記録して適用することができる。その場合、プログラムは、リムーバブルメディア921をドライブ915に装着することにより、入出力インタフェース910を介して、記憶部913にインストールすることができる。
また、このプログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することもできる。その場合、プログラムは、通信部914で受信し、記憶部913にインストールすることができる。
その他、このプログラムは、ROM902や記憶部913に、予めインストールしておくこともできる。
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
また、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
また、本明細書において、システムとは、複数の構成要素(装置、モジュール(部品)等)の集合を意味し、全ての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、1つの筐体の中に複数のモジュールが収納されている1つの装置は、いずれも、システムである。
また、以上において、1つの装置(または処理部)として説明した構成を分割し、複数の装置(または処理部)として構成するようにしてもよい。逆に、以上において複数の装置(または処理部)として説明した構成をまとめて1つの装置(または処理部)として構成されるようにしてもよい。また、各装置(または各処理部)の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置(または処理部)の構成の一部を他の装置(または他の処理部)の構成に含めるようにしてもよい。
以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
例えば、本技術は、1つの機能を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。
さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
なお、本技術は以下のような構成も取ることができる。
(1) オーディオ信号を直交変換する変換部と、
前記変換部により直交変換された前記オーディオ信号を解析し、超高域の定常的な信号成分を推定する解析部と、
前記オーディオ信号に対して、前記解析部の解析により推定された前記超高域の前記定常的な信号成分を低減させる信号処理を行う信号処理部と
を備える信号処理装置。
(2) 前記超高域は、可聴帯域よりも高域である
(1)、(3)乃至(19)のいずれかに記載の信号処理装置。
(3) 前記定常的な信号成分は、高域に向かってレベル増加する成分である
(1)、(2)、(4)乃至(19)のいずれかに記載の信号処理装置。
(4) 前記定常的な信号成分は、可聴帯域の信号成分の倍音成分を含まない成分である
(1)乃至(3)、(5)乃至(19)のいずれかに記載の信号処理装置。
(5) 前記信号処理部は、スペクトルサブトラクションにより前記超高域の前記定常的な信号成分を低減させる
(1)乃至(4)、(6)乃至(19)のいずれかに記載の信号処理装置。
(6) 前記信号処理部は、ウィナーフィルタにより前記超高域の前記定常的な信号成分を低減させる
(1)乃至(5)、(7)乃至(19)のいずれかに記載の信号処理装置。
(7) 前記変換部は、前記オーディオ信号に対して高速フーリエ変換を行う
(1)乃至(6)、(8)乃至(19)のいずれかに記載の信号処理装置。
(8) 前記オーディオ信号を前記超高域の信号成分と前記超高域以外の信号成分とに帯域分割する帯域分割部と、
前記信号処理部により前記超高域の前記定常的な信号成分が低減された前記オーディオ信号を、前記帯域分割部により前記オーディオ信号が帯域分割されて得られた前記オーディオ信号の前記超高域以外の信号成分と合成する合成部と
をさらに備え、
前記変換部は、前記帯域分割部により前記オーディオ信号が帯域分割されて得られた前記オーディオ信号の前記超高域の信号成分を直交変換し、
前記解析部は、前記変換部により直交変換された前記オーディオ信号の前記超高域の信号成分を解析し、前記超高域の前記定常的な信号成分を推定し、
前記信号処理部は、前記帯域分割部により前記オーディオ信号が帯域分割されて得られた前記オーディオ信号の前記超高域の信号成分に対して、前記解析部の解析により推定された前記超高域の前記定常的な信号成分を低減させる信号処理を行い、
前記合成部は、前記信号処理部により前記超高域の前記定常的な信号成分が低減された前記オーディオ信号の前記超高域の信号成分を、前記帯域分割部により前記オーディオ信号が帯域分割されて得られた前記オーディオ信号の前記超高域以外の信号成分と合成する
(1)乃至(7)、(9)乃至(19)のいずれかに記載の信号処理装置。
(9) 前記帯域分割部は、前記オーディオ信号から前記超高域の信号成分を抽出するハイパスフィルタと、前記オーディオ信号から前記超高域以外の信号成分を抽出するローパスフィルタとを有する
(1)乃至(8)、(10)乃至(19)のいずれかに記載の信号処理装置。
(10) 前記信号処理部により前記超高域の前記定常的な信号成分が低減された前記オーディオ信号から前記超高域以外の信号成分を除去するハイパスフィルタをさらに備え、
前記合成部は、前記ハイパスフィルタにより前記超高域以外の信号成分が除去された前記オーディオ信号を、前記帯域分割部により前記オーディオ信号が帯域分割されて得られた前記オーディオ信号の前記超高域以外の信号成分と合成する
(1)乃至(9)、(11)乃至(19)のいずれかに記載の信号処理装置。
(11) 前記信号処理部は、前記オーディオ信号の増幅量に応じて、前記超高域の前記定常的な信号成分を低減させる
(1)乃至(10)、(12)乃至(19)のいずれかに記載の信号処理装置。
(12) 前記信号処理部は、前記オーディオ信号の増幅量に応じたカットオフ周波数を有するローパスフィルタにより前記超高域の前記定常的な信号成分を低減させる
(1)乃至(11)、(13)乃至(19)のいずれかに記載の信号処理装置。
(13) 前記信号処理部は、カット周波数以上の帯域において前記オーディオ信号の増幅量に応じた傾きの周波数特性を有するローパスフィルタにより前記超高域の前記定常的な信号成分を低減させる
(1)乃至(12)、(14)乃至(19)のいずれかに記載の信号処理装置。
(14) 前記信号処理部は、前記オーディオ信号の増幅量に応じたゲインを有するTSF(Treble Shelving Filter)により前記超高域の前記定常的な信号成分を低減させる
(1)乃至(13)、(15)乃至(19)のいずれかに記載の信号処理装置。
(15) 前記信号処理部は、前記超高域に対して前記オーディオ信号の増幅量に応じたスレッショルドを有するリミッタにより前記超高域の前記定常的な信号成分を低減させる
(1)乃至(14)、(16)乃至(19)のいずれかに記載の信号処理装置。
(16) 前記解析部は、前記オーディオ信号の、前記オーディオ信号の再生時間の内、所定の一部の時間に相当する部分データを解析し、前記超高域の前記定常的な信号成分を推定する
(1)乃至(15)、(17)乃至(19)のいずれかに記載の信号処理装置。
(17) 前記解析部は、前記オーディオ信号の、前記オーディオ信号の再生時間の先頭の前記一部の時間に相当する部分データを解析し、前記超高域の前記定常的な信号成分を推定する
(1)乃至(16)、(18)、(19)のいずれかに記載の信号処理装置。
(18) 前記解析部は、前記オーディオ信号の、前記オーディオ信号の再生時間の途中の前記一部の時間に相当する部分データを解析し、前記超高域の前記定常的な信号成分を推定し、
前記信号処理部は、必要な場合のみ、低減させる前記定常的な信号成分を、前記解析部の最新の解析結果に応じて更新する
(1)乃至(17)、(19)のいずれかに記載の信号処理装置。
(19) 前記信号処理部により前記超高域の前記定常的な信号成分が低減された前記オーディオ信号を符号化する符号化部をさらに備える
(1)乃至(18)のいずれかに記載の信号処理装置。
(20) オーディオ信号を直交変換し、
直交変換された前記オーディオ信号を解析し、超高域の定常的な信号成分を推定し、
前記オーディオ信号に対して、推定された前記超高域の前記定常的な信号成分を低減させる信号処理を行う
信号処理方法。
(1) オーディオ信号を直交変換する変換部と、
前記変換部により直交変換された前記オーディオ信号を解析し、超高域の定常的な信号成分を推定する解析部と、
前記オーディオ信号に対して、前記解析部の解析により推定された前記超高域の前記定常的な信号成分を低減させる信号処理を行う信号処理部と
を備える信号処理装置。
(2) 前記超高域は、可聴帯域よりも高域である
(1)、(3)乃至(19)のいずれかに記載の信号処理装置。
(3) 前記定常的な信号成分は、高域に向かってレベル増加する成分である
(1)、(2)、(4)乃至(19)のいずれかに記載の信号処理装置。
(4) 前記定常的な信号成分は、可聴帯域の信号成分の倍音成分を含まない成分である
(1)乃至(3)、(5)乃至(19)のいずれかに記載の信号処理装置。
(5) 前記信号処理部は、スペクトルサブトラクションにより前記超高域の前記定常的な信号成分を低減させる
(1)乃至(4)、(6)乃至(19)のいずれかに記載の信号処理装置。
(6) 前記信号処理部は、ウィナーフィルタにより前記超高域の前記定常的な信号成分を低減させる
(1)乃至(5)、(7)乃至(19)のいずれかに記載の信号処理装置。
(7) 前記変換部は、前記オーディオ信号に対して高速フーリエ変換を行う
(1)乃至(6)、(8)乃至(19)のいずれかに記載の信号処理装置。
(8) 前記オーディオ信号を前記超高域の信号成分と前記超高域以外の信号成分とに帯域分割する帯域分割部と、
前記信号処理部により前記超高域の前記定常的な信号成分が低減された前記オーディオ信号を、前記帯域分割部により前記オーディオ信号が帯域分割されて得られた前記オーディオ信号の前記超高域以外の信号成分と合成する合成部と
をさらに備え、
前記変換部は、前記帯域分割部により前記オーディオ信号が帯域分割されて得られた前記オーディオ信号の前記超高域の信号成分を直交変換し、
前記解析部は、前記変換部により直交変換された前記オーディオ信号の前記超高域の信号成分を解析し、前記超高域の前記定常的な信号成分を推定し、
前記信号処理部は、前記帯域分割部により前記オーディオ信号が帯域分割されて得られた前記オーディオ信号の前記超高域の信号成分に対して、前記解析部の解析により推定された前記超高域の前記定常的な信号成分を低減させる信号処理を行い、
前記合成部は、前記信号処理部により前記超高域の前記定常的な信号成分が低減された前記オーディオ信号の前記超高域の信号成分を、前記帯域分割部により前記オーディオ信号が帯域分割されて得られた前記オーディオ信号の前記超高域以外の信号成分と合成する
(1)乃至(7)、(9)乃至(19)のいずれかに記載の信号処理装置。
(9) 前記帯域分割部は、前記オーディオ信号から前記超高域の信号成分を抽出するハイパスフィルタと、前記オーディオ信号から前記超高域以外の信号成分を抽出するローパスフィルタとを有する
(1)乃至(8)、(10)乃至(19)のいずれかに記載の信号処理装置。
(10) 前記信号処理部により前記超高域の前記定常的な信号成分が低減された前記オーディオ信号から前記超高域以外の信号成分を除去するハイパスフィルタをさらに備え、
前記合成部は、前記ハイパスフィルタにより前記超高域以外の信号成分が除去された前記オーディオ信号を、前記帯域分割部により前記オーディオ信号が帯域分割されて得られた前記オーディオ信号の前記超高域以外の信号成分と合成する
(1)乃至(9)、(11)乃至(19)のいずれかに記載の信号処理装置。
(11) 前記信号処理部は、前記オーディオ信号の増幅量に応じて、前記超高域の前記定常的な信号成分を低減させる
(1)乃至(10)、(12)乃至(19)のいずれかに記載の信号処理装置。
(12) 前記信号処理部は、前記オーディオ信号の増幅量に応じたカットオフ周波数を有するローパスフィルタにより前記超高域の前記定常的な信号成分を低減させる
(1)乃至(11)、(13)乃至(19)のいずれかに記載の信号処理装置。
(13) 前記信号処理部は、カット周波数以上の帯域において前記オーディオ信号の増幅量に応じた傾きの周波数特性を有するローパスフィルタにより前記超高域の前記定常的な信号成分を低減させる
(1)乃至(12)、(14)乃至(19)のいずれかに記載の信号処理装置。
(14) 前記信号処理部は、前記オーディオ信号の増幅量に応じたゲインを有するTSF(Treble Shelving Filter)により前記超高域の前記定常的な信号成分を低減させる
(1)乃至(13)、(15)乃至(19)のいずれかに記載の信号処理装置。
(15) 前記信号処理部は、前記超高域に対して前記オーディオ信号の増幅量に応じたスレッショルドを有するリミッタにより前記超高域の前記定常的な信号成分を低減させる
(1)乃至(14)、(16)乃至(19)のいずれかに記載の信号処理装置。
(16) 前記解析部は、前記オーディオ信号の、前記オーディオ信号の再生時間の内、所定の一部の時間に相当する部分データを解析し、前記超高域の前記定常的な信号成分を推定する
(1)乃至(15)、(17)乃至(19)のいずれかに記載の信号処理装置。
(17) 前記解析部は、前記オーディオ信号の、前記オーディオ信号の再生時間の先頭の前記一部の時間に相当する部分データを解析し、前記超高域の前記定常的な信号成分を推定する
(1)乃至(16)、(18)、(19)のいずれかに記載の信号処理装置。
(18) 前記解析部は、前記オーディオ信号の、前記オーディオ信号の再生時間の途中の前記一部の時間に相当する部分データを解析し、前記超高域の前記定常的な信号成分を推定し、
前記信号処理部は、必要な場合のみ、低減させる前記定常的な信号成分を、前記解析部の最新の解析結果に応じて更新する
(1)乃至(17)、(19)のいずれかに記載の信号処理装置。
(19) 前記信号処理部により前記超高域の前記定常的な信号成分が低減された前記オーディオ信号を符号化する符号化部をさらに備える
(1)乃至(18)のいずれかに記載の信号処理装置。
(20) オーディオ信号を直交変換し、
直交変換された前記オーディオ信号を解析し、超高域の定常的な信号成分を推定し、
前記オーディオ信号に対して、推定された前記超高域の前記定常的な信号成分を低減させる信号処理を行う
信号処理方法。
100 再生装置, 101 記憶部, 102 周波数軸変換部, 103 超高域定常的雑音解析部, 104 ディレイバッファ, 105 超高域定常的雑音低減部, 106 DAC, 107 増幅部, 108 スピーカ, 200 再生装置, 201 記憶部, 202 HPF, 203 周波数軸変換部, 204 超高域定常的雑音解析部, 205 ディレイバッファ, 206 超高域定常的雑音低減部, 207 HPF, 208 LPF, 209 ディレイバッファ, 210 演算部, 211 DAC, 212 増幅部, 213 スピーカ, 300 送信装置, 301 記憶部, 302 HPF, 303 周波数軸変換部, 304 超高域定常的雑音解析部, 305 ディレイバッファ, 306 超高域定常的雑音低減部, 307 HPF, 308 LPF, 309 ディレイバッファ, 310 演算部, 311 符号化部, 312 送信部, 350 受信装置, 351 受信部, 352 復号部, 353 DAC, 354 増幅部, 355 スピーカ, 500 再生装置, 501 記憶部, 502 周波数軸変換部, 503 入力部, 504 超高域定常的雑音解析部, 505 ボリューム制御データベース, 506 ディレイバッファ, 507 超高域定常的雑音低減部, 508 DAC, 509 増幅部, 510 スピーカ, 900 コンピュータ
Claims (20)
- オーディオ信号を直交変換する変換部と、
前記変換部により直交変換された前記オーディオ信号を解析し、超高域の定常的な信号成分を推定する解析部と、
前記オーディオ信号に対して、前記解析部の解析により推定された前記超高域の前記定常的な信号成分を低減させる信号処理を行う信号処理部と
を備える信号処理装置。 - 前記超高域は、可聴帯域よりも高域である
請求項1に記載の信号処理装置。 - 前記定常的な信号成分は、高域に向かってレベル増加する成分である
請求項1に記載の信号処理装置。 - 前記定常的な信号成分は、可聴帯域の信号成分の倍音成分を含まない成分である
請求項1に記載の信号処理装置。 - 前記信号処理部は、スペクトルサブトラクションにより前記超高域の前記定常的な信号成分を低減させる
請求項1に記載の信号処理装置。 - 前記信号処理部は、ウィナーフィルタにより前記超高域の前記定常的な信号成分を低減させる
請求項1に記載の信号処理装置。 - 前記変換部は、前記オーディオ信号に対して高速フーリエ変換を行う
請求項1に記載の信号処理装置。 - 前記オーディオ信号を前記超高域の信号成分と前記超高域以外の信号成分とに帯域分割する帯域分割部と、
前記信号処理部により前記超高域の前記定常的な信号成分が低減された前記オーディオ信号を、前記帯域分割部により前記オーディオ信号が帯域分割されて得られた前記オーディオ信号の前記超高域以外の信号成分と合成する合成部と
をさらに備え、
前記変換部は、前記帯域分割部により前記オーディオ信号が帯域分割されて得られた前記オーディオ信号の前記超高域の信号成分を直交変換し、
前記解析部は、前記変換部により直交変換された前記オーディオ信号の前記超高域の信号成分を解析し、前記超高域の前記定常的な信号成分を推定し、
前記信号処理部は、前記帯域分割部により前記オーディオ信号が帯域分割されて得られた前記オーディオ信号の前記超高域の信号成分に対して、前記解析部の解析により推定された前記超高域の前記定常的な信号成分を低減させる信号処理を行い、
前記合成部は、前記信号処理部により前記超高域の前記定常的な信号成分が低減された前記オーディオ信号の前記超高域の信号成分を、前記帯域分割部により前記オーディオ信号が帯域分割されて得られた前記オーディオ信号の前記超高域以外の信号成分と合成する
請求項1に記載の信号処理装置。 - 前記帯域分割部は、前記オーディオ信号から前記超高域の信号成分を抽出するハイパスフィルタと、前記オーディオ信号から前記超高域以外の信号成分を抽出するローパスフィルタとを有する
請求項8に記載の信号処理装置。 - 前記信号処理部により前記超高域の前記定常的な信号成分が低減された前記オーディオ信号から前記超高域以外の信号成分を除去するハイパスフィルタをさらに備え、
前記合成部は、前記ハイパスフィルタにより前記超高域以外の信号成分が除去された前記オーディオ信号を、前記帯域分割部により前記オーディオ信号が帯域分割されて得られた前記オーディオ信号の前記超高域以外の信号成分と合成する
請求項8に記載の信号処理装置。 - 前記信号処理部は、前記オーディオ信号の増幅量に応じて、前記超高域の前記定常的な信号成分を低減させる
請求項1に記載の信号処理装置。 - 前記信号処理部は、前記オーディオ信号の増幅量に応じたカットオフ周波数を有するローパスフィルタにより前記超高域の前記定常的な信号成分を低減させる
請求項11に記載の信号処理装置。 - 前記信号処理部は、カット周波数以上の帯域において前記オーディオ信号の増幅量に応じた傾きの周波数特性を有するローパスフィルタにより前記超高域の前記定常的な信号成分を低減させる
請求項11に記載の信号処理装置。 - 前記信号処理部は、前記オーディオ信号の増幅量に応じたゲインを有するTSF(Treble Shelving Filter)により前記超高域の前記定常的な信号成分を低減させる
請求項11に記載の信号処理装置。 - 前記信号処理部は、前記超高域に対して前記オーディオ信号の増幅量に応じたスレッショルドを有するリミッタにより前記超高域の前記定常的な信号成分を低減させる
請求項11に記載の信号処理装置。 - 前記解析部は、前記オーディオ信号の、前記オーディオ信号の再生時間の内、所定の一部の時間に相当する部分データを解析し、前記超高域の前記定常的な信号成分を推定する
請求項1に記載の信号処理装置。 - 前記解析部は、前記オーディオ信号の、前記オーディオ信号の再生時間の先頭の前記一部の時間に相当する部分データを解析し、前記超高域の前記定常的な信号成分を推定する
請求項16に記載の信号処理装置。 - 前記解析部は、前記オーディオ信号の、前記オーディオ信号の再生時間の途中の前記一部の時間に相当する部分データを解析し、前記超高域の前記定常的な信号成分を推定し、
前記信号処理部は、必要な場合のみ、低減させる前記定常的な信号成分を、前記解析部の最新の解析結果に応じて更新する
請求項16に記載の信号処理装置。 - 前記信号処理部により前記超高域の前記定常的な信号成分が低減された前記オーディオ信号を符号化する符号化部をさらに備える
請求項1に記載の信号処理装置。 - オーディオ信号を直交変換し、
直交変換された前記オーディオ信号を解析し、超高域の定常的な信号成分を推定し、
前記オーディオ信号に対して、推定された前記超高域の前記定常的な信号成分を低減させる信号処理を行う
信号処理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014023039A JP2015149690A (ja) | 2014-02-10 | 2014-02-10 | 信号処理装置および方法 |
US14/609,822 US9871497B2 (en) | 2014-02-10 | 2015-01-30 | Processing audio signal to produce enhanced audio signal |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014023039A JP2015149690A (ja) | 2014-02-10 | 2014-02-10 | 信号処理装置および方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2015149690A true JP2015149690A (ja) | 2015-08-20 |
Family
ID=53775843
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014023039A Pending JP2015149690A (ja) | 2014-02-10 | 2014-02-10 | 信号処理装置および方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9871497B2 (ja) |
JP (1) | JP2015149690A (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102371920B1 (ko) * | 2016-01-08 | 2022-03-08 | 삼성전자 주식회사 | 오디오 신호 출력 방법 및 이를 지원하는 전자 장치 |
GB201803994D0 (en) * | 2018-03-13 | 2018-04-25 | Univ Oxford Innovation Ltd | Method and apparatus for monitoring a human or animal subject |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3678416A (en) * | 1971-07-26 | 1972-07-18 | Richard S Burwen | Dynamic noise filter having means for varying cutoff point |
JP3404837B2 (ja) * | 1993-12-07 | 2003-05-12 | ソニー株式会社 | 多層符号化装置 |
CN100414606C (zh) * | 2002-01-25 | 2008-08-27 | Nxp股份有限公司 | 用于从pcm信号中减去量化噪声的方法和单元 |
EP1729410A1 (en) | 2005-06-02 | 2006-12-06 | Sony Ericsson Mobile Communications AB | Device and method for audio signal gain control |
CN101540608A (zh) * | 2008-03-20 | 2009-09-23 | 扬智科技股份有限公司 | 降低静音时量化噪声的装置与方法 |
JP5287546B2 (ja) * | 2009-06-29 | 2013-09-11 | 富士通株式会社 | 情報処理装置およびプログラム |
-
2014
- 2014-02-10 JP JP2014023039A patent/JP2015149690A/ja active Pending
-
2015
- 2015-01-30 US US14/609,822 patent/US9871497B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20150229286A1 (en) | 2015-08-13 |
US9871497B2 (en) | 2018-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5680789B2 (ja) | 改善されたオーディオのための統合されたサイコアコースティック・バス・エンハンスメント(pbe) | |
JP5448771B2 (ja) | 音響処理装置及び方法 | |
JP2015050685A (ja) | オーディオ信号処理装置および方法、並びにプログラム | |
JP2010079275A (ja) | 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム | |
JP2013519918A (ja) | 携帯機器内でオーディオ信号のラウドネスを非破壊的に正規化するシステムおよび方法 | |
CN109217834B (zh) | 增益调整方法、音频设备及可读存储介质 | |
WO2017164156A1 (ja) | 信号処理装置、音響信号の転送方法、及び、信号処理システム | |
JP5201375B2 (ja) | チャネル間及び一時的冗長度抑圧を用いた音声信号符号化 | |
JP2015149690A (ja) | 信号処理装置および方法 | |
WO2016059878A1 (ja) | 信号処理装置、信号処理方法及びコンピュータプログラム | |
US20130085762A1 (en) | Audio encoding device | |
JP2014032364A (ja) | 音処理装置、音処理方法及びプログラム | |
JP6730580B2 (ja) | 帯域拡張装置および帯域拡張方法 | |
JP6126390B2 (ja) | ノイズ低減装置、放送受信装置及びノイズ低減方法 | |
JP5715910B2 (ja) | ダイナミックレンジ拡張装置 | |
JP6371376B2 (ja) | 音響装置及び信号処理方法 | |
JP4715385B2 (ja) | 補間装置、オーディオ再生装置、補間方法および補間プログラム | |
JP4815986B2 (ja) | 補間装置、オーディオ再生装置、補間方法および補間プログラム | |
JP4371246B2 (ja) | 高音質化装置及び方法、並びにコンピュータプログラム | |
JP6314803B2 (ja) | 信号処理装置、信号処理方法及びプログラム | |
US9184719B2 (en) | Identifying a change to adjust audio data | |
WO2014017315A1 (ja) | 周波数帯域拡大装置および方法、並びにプログラム | |
JP2012118462A (ja) | 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム | |
JP2017173408A (ja) | 音響信号の転送方法及び再生装置 | |
JP2015050476A (ja) | 信号処理装置、信号処理方法及びプログラム |