JP5821431B2 - 音声信号加工装置、音声信号加工方法及びプログラム - Google Patents

音声信号加工装置、音声信号加工方法及びプログラム Download PDF

Info

Publication number
JP5821431B2
JP5821431B2 JP2011192061A JP2011192061A JP5821431B2 JP 5821431 B2 JP5821431 B2 JP 5821431B2 JP 2011192061 A JP2011192061 A JP 2011192061A JP 2011192061 A JP2011192061 A JP 2011192061A JP 5821431 B2 JP5821431 B2 JP 5821431B2
Authority
JP
Japan
Prior art keywords
clip
unit
polarity
audio signal
clip portion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011192061A
Other languages
English (en)
Other versions
JP2013055498A (ja
Inventor
中村 真巳
真巳 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JVCKenwood Corp
Original Assignee
JVCKenwood Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JVCKenwood Corp filed Critical JVCKenwood Corp
Priority to JP2011192061A priority Critical patent/JP5821431B2/ja
Publication of JP2013055498A publication Critical patent/JP2013055498A/ja
Application granted granted Critical
Publication of JP5821431B2 publication Critical patent/JP5821431B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、音声信号加工装置、音声信号加工方法及びプログラムに関する。
音声信号をスピーカで出力するにあたって、聴者にとって心地よい音声を出力するために音声信号を加工する音声信号加工装置が知られている。このような音声信号加工装置の中には、音声信号のクリップ部分を検出して選択的に加工するものがある。
特許文献1は、音声信号のクリップ部分を加工するにあたって、クリップが起こった長さ等の情報に基づいて加工方法を選択し、選択した加工方法で音声信号のクリップ部分を加工する技術を開示している。
特開2001−110143号公報
スピーカは、入力された音声信号に応答してコーン紙を振動させることにより、音声信号を放音する。通常、入力された音声信号がプラス(正)極性である場合には、コーン紙は標準位置(0入力時)よりも前方に動き、入力信号がマイナス(負)極性であれば後方に動く。
スピーカの構造上、コーン紙が前方に動くときと後方に動くときとでは、動作特性が異なる。このため、入力信号の絶対値が同一であっても、信号の極性が異なると、入力信号に起因するコーン紙の動作は異なる。このため、同じ絶対値の音声信号を入力した場合でも、信号が正極性か負極性かで、スピーカから放音される音波の波形(振動波形)は異なり、原音とは異なる音が再生されてしまう。
特許文献1に記載の技術では、コーン紙が前方に動く場合でも、後方に動く場合でも、クリップ部分を同様に加工する。そのため、特許文献1に記載の音声信号加工装置を用いてクリップ部分を加工すると、実際に放音される波形が、入力信号の正極性側と負極性側とで異なってしまい、音声波形が歪んでしまう。このため、聴者に違和感を与えるおそれがある。
本発明は上記のような事情に鑑みてなされたもので、聴者に違和感を与えないようにクリップ部分を加工することが出来る音声信号加工装置、音声信号加工方法、及びプログラムを提供することを目的とする。
また、本発明は、歪みの小さい再生音を提供することを目的とする。
上記目的を達成するため、本発明の第1の観点に係る音声信号加工装置は、
音声信号中のクリップ部分を検出する検出部と、
前記検出部が検出したクリップ部分の極性を判別する正負判別部と、
前記検出部が検出したクリップ部分の開始点とクリップ部分の終了点の少なくともいずれか一方を判別する開始終了判別部と、
前記開始終了判別部が判別したクリップ部分の開始点とクリップ部分の終了点の少なくともいずれか一方の前後の予め定められた範囲を、前記正負判別部が判別した極性および前記予め定められた範囲に対応するパラメータに基づいて、加工する加工部と、
を備えることを特徴とする。
上記目的を達成するため、本発明の第2の観点に係る音声信号加工装置は、
音声信号中のクリップ部分を検出する検出部と、
前記検出部が検出したクリップ部分の極性を判別する正負判別部と、
前記検出部が検出したクリップ部分を、前記正負判別部が判別した極性に対応するパラメータに基づいて、加工する加工部と、
を備え、
前記検出部が検出したクリップ部分が、加工対象であるか否かを、前記正負判別部が判別した極性とクリップ部分の時間長さに対応する判別基準に基づいて判別する加工判別部をさらに備え、
前記加工部は、前記加工判別部が前記クリップ部分を加工対象であると判別した場合に、前記クリップ部分を加工する、
ことを特徴とする
例えば、上記音声信号加工装置は、
前記検出部が検出したクリップ部分がクリップしている時間長さをカウントするカウント部をさらに備え、
前記加工判別部は、前記カウント部がカウントしたクリップ部分の時間長さに基づいて当該クリップ部分が加工対象であるか否か判別する、
としてもよい。
例えば、
前記加工部は、クリップ部分の開始点を含む第1の所定範囲とクリップ部分の終了点を含む第2の所定範囲の少なくとも一方の所定範囲内のデータの値を信号を圧縮するように補正する、
としてもよい。
例えば、
実質的に形状が同一で極性が異なる波形が、出力先のスピーカに入力された際に、第1の極性の波形が入力された時の方が、第2の極性の波形が入力された時よりもスピーカの可動部の動きが大きい場合には、
前記加工部の、第1の極性に対応するパラメータの方が、第2の極性に対応するパラメータよりも、信号を圧縮する程度が大きい、
としてもよい。
例えば、
第1の極性に対応するパラメータの方が、第2の極性に対応するパラメータよりも、信号を圧縮する程度が大きく、及び/又は、補正の期間が長い、
としてもよい。
例えば、上記音声信号加工装置は、
音声信号を複数の帯域の信号成分に分割する分割部をさらに備え、
前記検出部は、前記分割部が分割した各信号成分について、クリップ部分を検出し、
前記正負判別部は、前記分割部が分割した信号成分毎に極性を判別し、
前記加工部は、前記分割部が分割した信号成分毎に信号を加工する、
としてよい。
上記目的を達成するため、本発明の第の観点に係る音声信号加工方法は、
供給された音声信号中のクリップ部分を検出し、
前記検出したクリップ部分の極性を判別し、
前記検出したクリップ部分の開始点とクリップ部分の終了点の少なくともいずれか一方を判別し、
前記判別したクリップ部分の開始点とクリップ部分の終了点の少なくともいずれか一方の前後の予め定められた範囲を、前記判別した極性および前記予め定められた範囲に対応するパラメータに基づいて、加工する、
ことを特徴とする。
上記目的を達成するため、本発明の第の観点に係るプログラムは、
コンピュータに、
供給された音声信号中のクリップ部分を検出する段階と、
前記検出したクリップ部分の極性を判別する段階と、
前記検出したクリップ部分の開始点とクリップ部分の終了点の少なくともいずれか一方を判別する段階と、
前記判別したクリップ部分の開始点とクリップ部分の終了点の少なくともいずれか一方の前後の予め定められた範囲を、前記判別した極性および前記予め定められた範囲に対応するパラメータに基づいて、加工する段階と、
を実行させる。
本発明によれば、聴者に違和感を与えないようにクリップ部分を加工することが出来る音声信号加工装置、音声信号加工方法、及びプログラムを提供することが出来る。また、本発明によれば、歪みの小さい再生音を提供することが出来る。
本発明の実施形態に係るオーディオシステムの構成を示す図である。 スピーカの構成を示す図であり、(a)はスピーカ全体の断面図、(b)は、スピーカユニットの拡大断面図である。 スピーカのコーン紙の動作特性を示す図である。 図1に示す音声信号加工装置の構成を示す図であり、(a)は、物理構成を示す図、(b)は、機能的構成を示す図である。 図4(b)に示す記憶部に格納される補正乗数の例を示す図である。 クリップが発生している入力信号の波形、原音の波形、補正された出力信号の波形を重ねて示す波形図である。 音声信号加工装置が実行する音声信号加工処理のフローチャートである。 図7に示す加工対象領域特定処理の詳細を示すフローチャートである。 音声信号加工装置の他の構成例を示す図である。 音声信号加工装置のさらに他の構成例を示す図である。 入力信号の波形と補正信号の波形とを重ねて示すその他の波形図である。 補正乗数の変形例を示す図である。 スピーカの他の構成例を示す図である。
以下、本発明の実施形態に係る音声再生装置を、図を参照しながら説明する。
(実施形態1)
本発明の実施形態1に係る音声再生装置1は、図1に示すように、音源装置10と、デコーダ20と、音声信号加工装置30と、D/A変換器40と、スピーカ50と、から構成される。
音源装置10は、CD(Compact Disc)プレーヤ、MP3(Moving Picture Experts Group Audio Layer 3)プレーヤ、等から構成され、符号化されて記録されている音声信号(デジタル音声信号)を記録媒体から読み出し、デコーダ20に供給する装置である。
デコーダ20は、音源装置10から供給された符号化された音声信号をデコードして、離散時系列の振幅を示す音声データx(t)に変換して音声信号加工装置30に出力する。
音声信号加工装置30は、DSP(Digital Signal Processor)等から構成され、デコーダ20からの入力データ(音声データ)x(t)を一旦記憶し、記憶した音声データx(t)がクリップしている場合には、クリップによる音の歪みを低減するように加工して、加工済音声データX(t)をD/A変換器40に出力する。音声信号加工装置30が行う音声信号加工処理については後述する。
D/A変換器40は、音声信号加工装置30から供給された加工済音声データX(t)をD/A(Digital to Analog)変換して、アナログ音声信号をスピーカ50に出力する。
スピーカ50は、D/A変換器40から供給されるアナログ音声信号を音に変換して出力する。
スピーカ50は図2(a)に示すように、スピーカユニット51とスピーカエンクロージャ52と入力端子53とを備える。
スピーカユニット51は、図2(b)に示すように、コイル511と、マグネット512と、フレーム513と、センタキャップ514と、ダンパ515と、コーン紙516と、エッジ517と、を備える。
コイル(ボイスコイル)511は、コーン紙516の中心部に固定され、D/A変換器40から、入力端子53を介して供給される、アナログ音声信号が流れるように接続され、マグネット512からの磁界とアナログ音声信号(電流)とによって生じる電磁力によって前後に移動し、コーン紙516を振動させる。
マグネット512は、コイル511に磁界を加える。
フレーム513は、スピーカエンクロージャ52に固定され、マグネット512とダンパ515とエッジ517とを支持・固定する。
センタキャップ514は、コイル511の前面中央部に取り付けられ、コーン紙516の中央部及びコイル511を保護する。
ダンパ515は、コイル511とコーン紙516とからなるスピーカユニット51の動的ユニットを支持し、所定の位置に保持する。
コーン紙516は、コーン状に成形された振動板であり、中心部にコイル511が固定され、コイル511と共に振動することによって空気を振動させ、放音する。コーン紙516は、エッジ517によってフレーム513に固定されている。
上記構成により、負極性の音声信号が入力されると、コーン紙516は後方に、つまりスピーカエンクロージャ52に含まれる空気を圧縮する方向に移動し、正極性の音声信号が入力されると、コーン紙516は前方に、即ちスピーカエンクロージャ52に含まれる空気を膨張させる方向に移動する。このため、絶対値が等しい正極性の音声信号入力と負極性の音声信号ではコーン紙516の動作性が異なる。また、コーン紙516の形状やエッジ517の物性等が前後方向に対称では無いため、コーン紙516に同じ絶対値の力を加えた場合でも、前方に移動する場合と後方に移動する場合とで、コーン紙516の反応は前後で異なる。このため、図3に示すように、絶対値が同一の入力信号を供給しても、入力信号が正極性の時と負極性のときとでは、コーン紙の516の動きは異なり、負極性の信号を供給したときの動きの方が正極性の信号を印加したときの動きよりも小さい。
また、スピーカ50は、スピーカエンクロージャ52が小さいほど、また、スピーカエンクロージャ52の内部空間の気密度が高いほど、コーン紙516の移動による圧力変化の影響が大きいという特性を有する。また、密閉型のスピーカ50はコーン紙516が動きにくいという特性を有する。
次に、図1に示す音声信号加工装置30の構成を、図4を参照して説明する。
音声信号加工装置30は、図4(a)に示すように、情報処理部301と、データ記憶部302と、プログラム記憶部303と、データ入力部304と、データ出力部305とを備える。
情報処理部301は、CPU(Central Processing Unit)、音声処理用DSP、等から構成され、プログラム記憶部303に記憶されている制御プログラム308に従って、クリップ波形の加工(圧縮;レベル低減)を含む音声信号加工処理を含む各種の処理を実行する。
データ記憶部302は、RAM(Random−Access Memory)等から構成され、デコーダ20からの入力データ(音声データ)x(t)を順次記憶する。また、データ記憶部302は、情報処理部301の作業領域として用いられる。
プログラム記憶部303は、フラッシュメモリ、ハードディスク、等の不揮発性メモリから構成され、情報処理部301の動作を制御する制御プログラム308を記憶する。なお、情報処理部301と、データ記憶部302と、プログラム記憶部303と、データ入力部304と、データ出力部305とは、内部パス307によってそれぞれ接続され、情報の送信が可能である。
データ入力部304は、デコーダ20から供給される入力データ(音声データ)x(t)を、順次取り込み、情報処理部301に供給する。なお、デコーダ20から供給される音声信号の、時刻tにおける音声データ(信号素片)をx(t)と表記する。入力信号x(t)は、システムの設計上の最大値(MAX)と最小値(MIN)との間の値を取る。本実施形態では、最大値は+1,最小値は−1とする。
データ出力部305は、処理済の音声データX(t)を、D/A変換器40に順次出力する。
音声信号加工装置30は、上記物理構成により、図4(b)に示すように、入力部310、遅延バッファ320、クリップ検出部330、正負判別部340、クリップカウンタ350、加工部360、記憶部370、出力部380、として機能する。入力部310は、図4(a)のデータ入力部304に対応する。遅延バッファ320、クリップ検出部330、正負判別部340、クリップカウンタ350、加工部360、の機能は図4(a)の情報処理部310がデータ記憶部302をバッファとして用いることにより実現する。記憶部370、図4(a)のデータ記憶部302及びプログラム記憶部303に対応する。出力部380は、図4(a)のデータ出力部305に対応する。
入力部310は、デコーダ20から供給される入力データ(信号素片)x(t)を、遅延バッファ320とクリップ検出部330とに伝達する。
遅延バッファ320は、入力信号x(t)をnサンプリング期間だけ遅延して加工部360に供給する。遅延バッファ320の遅延時間を定めるサンプリング数nは、実験的に求められた値であり、例えば、音声信号に含まれる最低周波数成分の1周期分のサンプリング数である。
クリップ検出部330は、入力信号x(t)がクリップしているか否か判別する。ここで、信号がクリップしているとは、入力信号x(t)がMAX又はMINの値であることをいう。ここでは、入力データx(t)の値が+1又は−1であるときに、入力データx(t)がクリップしていると判別する。クリップ検出部330は、入力データx(t)が+1又は−1であると判別すると、カウントアップ信号UPをクリップカウンタ350に出力し、+1でも−1でも無いと判別するとリセット信号RESETをクリップカウンタ350に出力する。
正負判別部340は、入力データx(t)の符号が正であるか負であるかを判別し、判別した符号を示す符号データを加工部360に供給する。また、正負判別部340は、信号の正負が反転すると、リセット信号RESETをクリップカウンタ350に出力する。
クリップカウンタ350は、クリップ検出部330からのカウントアップ信号UPに応答して、カウント値をアップする。また、リセット信号RESETに応答して、カウント値を0にリセットする。クリップカウンタ350の値は、値が+1又は−1である入力データx(t)が連続した数を示す。
加工部360は、クリップカウンタ350のカウント値と正負判別部340から供給された符号データとに基づいて、入力データx(t)を加工対象とするか否かを判別し、判別結果を内部メモリに記憶する。加工部360は、内部メモリに記憶された判別結果のデータに基づいて、遅延バッファ320から供給される遅延データx(t−n)に乗算すべき補正乗数(係数)を求め、入力データx(t−n)と補正乗数との積を求めることにより各入力データの絶対値を小さくし(信号を圧縮し)、出力部380を介してD/A変換器40に出力する。
この補正乗数は、クリップによる音の歪みを減少すると共に、上述した入力信号の極性の差によるスピーカ50のコーン紙516の動きの差に起因する音の歪みを低減する。すなわち、同一波形で極性が異なる音声信号が入力したときにコーン紙516の動きにより生成される振動波形の極性間の差を小さくするような値の集合に設定されている。
具体的には、本実施形態においては、補正乗数として、図5に示すように、入力データx(t)が正の値のときのクリップ開始位置近傍の入力データx(t)を補正加工するための乗数群α1と、クリップ終了位置近傍の入力データx(t)を補正するための乗数群α2と、入力データx(t)が負の値のときのクリップ開始位置近傍の入力データx(t)を補正加工するための乗数群β1とクリップ終了位置近傍の入力データx(t)を補正するための乗数群β2と、が用意される。補正乗数の詳細及びその求め方、使用方法の詳細については後述する。
記憶部370は、加工部360が入力信号のクリップ部分を加工(圧縮)するための補正乗数の集合を図5に示すように記憶している。
また、記憶部370は、入力音声信号のクリップ部分を補正(加工)するか否かを判別するための基準値(閾値)th(+)とth(−)を記憶している。基準値th(+)は、正極性の音声信号に関し、クリップがこの基準値th(+)以上連続した際に入力信号を加工すると判別する基準値であり、基準値th(−)は、負極性の音声信号に関し、クリップがこの基準値th(−)以上連続した際に入力信号を加工すると判別する基準値である。
次に、加工部360が実行する音声信号加工処理について説明する。
クリップしている原音、入力信号、出力信号の波形の一例を図6に示す。実線で示される入力信号の波形は、一点鎖線で示す原音のように正弦波となるべきものが、録音時に音量が最大値(+1)と最小値(−1)を超えたために、最大値より大きい部分及び最小値より小さい部分が制限され、台形状に変形している。この場合に、一点鎖線で示す原音の波形を復元できれば理想であるが、実際には、データの値が+1から−1の間に制限されているため困難である。
そこで、本実施形態では、クリップしている入力信号の波形のクリップ開始点P1、P3近傍、及び、クリップ終了点P2、P4近傍の波形を加工(補正)して、波形の角を取る(なめらかにする)ことにより、出力信号を得て、高調波成分の発生を抑え、音質を改善する。
波形の加工は、クリップ開始点P1、P3近傍、及び、クリップ終了点P2、P4近傍の波高値(信号値)に予め設定されている1以下の正の値である補正乗数を乗算して、補正された波高値とすることにより行う。
また、スピーカ50のコーン紙516は、前述したように、同一の波形の入力信号を供給しても、負極性の信号を供給したときの方が正極性の信号を供給したときよりも動きが小さい。このため、波形の加工に関しては、負極性の信号に関しては、正極性の信号よりも、波形の実効値が大きくなる(補正量が小さくなる)ように補正乗数を設定する。また、スピーカ50は、上述したように、スピーカエンクロージャ52が小さいほど、また、スピーカエンクロージャ52の内部空間の気密度が高いほど、コーン紙516の移動による圧力変化の影響が大きい。また、密閉型のスピーカ50はコーン紙516が動きにくい。
さらに、エッジ517の硬さや形状によってもコーン紙516の前後の動作性が変わってくる。そのため、スピーカ毎に設計値、実験等に基づいて、最適な補正乗数を設定する必要がある。
本実施形態では、図5に示すように正極性の波形加工用の補正乗数群α1及びα2と、負極性用の波形加工用の補正乗数群β1及びβ2と、を設定する。補正乗数群α1とα2は、クリップした正極性の波形の角をとるように滑らかに補正するための係数であり、補正乗数群β1とβ2は、クリップした負極性の波形の角をとるように滑らかに補正するための係数であるが、α1とα2と比べて補正の程度が小さい係数群である。また、補正乗数群α1とβ1とは、クリップ開始位置近傍の入力データx(t)を補正するための補正乗数であり、補正乗数群α2とβ2とは、クリップ終了位置近傍の入力データx(t)を補正するための補正乗数である。
補正乗数α1(i)、β1(i)におけるiは、入力データx(t)のクリップ開始位置(最初に+1又は−1となったデータの位置)を0としたときの時間軸上の相対位置を示し、例えば、−1は、時間軸上で1サンプリング期間前を、+2は2サンプリング期間後のタイミングを示す。また、補正乗数α2(i)、β2(i)におけるiは、入力データx(t)のクリップ終了位置(最後に+1又は−1となったデータの位置)を0としたときの時間軸上の相対位置を示し、例えば、−2は、時間軸上で2サンプリング期間前を、+3は3サンプリング期間後のタイミングを示す。
従って、例えば、α1(0)は、入力データx(t)が、正極性の半波長中で最初にクリップした(+1となった)入力データx(i)と乗算され、α1(−2)は、正極性の半波長中で最初にクリップした(+1となった)入力データx(i)より2つ前の入力データx(i−2)に乗算される。同様に、β1(0)は、入力データx(t)が、負極性の半波長中で最初にクリップした(−1となった)入力データx(i)と乗算され、α1(−1)は、負極性の半波長中で最初にクリップした(−1となった)入力データx(i)より1つ前の入力データx(i−1)に乗算される。また、α2(0)は、正極性の半波長中でクリップ状態にある(値が+1である)最後の入力データx(i)と乗算され、α2(+1)は、正極性の半波長中でクリップ状態にある(値が+1である)最後の入力データx(i)より1つ後の入力データx(i+1)に乗算される。また、β2(0)は、負極性の半波長中でクリップ状態にある(値が−1である)最後の入力データx(i)と乗算され、β2(+2)は、負極性の半波長中でクリップ状態にある(値が−1である)最後の入力データx(i)より2つ後の入力データx(i+2)に乗算される。
次に、上記構成を有する音声再生装置1の動作を図7,図8のフローチャートを参照して説明する。
まず、音源装置10は、再生の指示に応答して、記録媒体から符号化された音声信号を順次読み出し、デコーダ20に順次出力する。デコーダ20は、供給された符号化音声信号をデコードし、音声データx(t)を順次出力する。
一方、音声信号加工装置30は、電源投入後、図7に示す音声信号加工処理を開始し、まず、所定の初期化処理を実行する(ステップS11)。
続いて、音声信号加工装置30は、デコーダ20から順次供給される入力データ(音声データ)x(t)を取得する(ステップS12)。音声信号加工装置30は、取得した入力データx(t)を用いて、加工対象領域抽出処理を実行する(ステップS13)。
加工対象領域抽出処理(ステップS13)は、入力された音声信号がクリップした波形であるか否かを判別し、さらに、クリップした波形であると判別した場合には、加工(補正)の対象するか否かを判別し、加工の対象とすると判別した場合には、加工する領域(クリップの開始点近傍とクリップの終了点近傍の所定範囲)を特定する処理である。
加工対象領域抽出処理(ステップS12)の詳細を、図8を参照して説明する。
まず、音声データx(t)が供給されると、クリップ検出部330は、今回入力したデータx(t)がクリップしているか否かを判別する(ステップS101)。即ち、x(t)の値が1又は−1であるか否かを判別する。
クリップ検出部330は、入力データx(t)がクリップしていないと判別した場合(ステップS101;No)、リセット信号RESETをクリップカウンタ350に出力する。リセット信号RESETに応答して、クリップカウンタ350は、カウント値を0にリセットする(ステップS103)。
次に、クリップ検出部330は、入力データx(t)がクリップ状態(値が+1又は−1である状態)からクリップが解除した状態(値が+1又は−1では無い状態)に変化したか否かを判別する(ステップS104)。クリップの解除に該当すると判別すると(ステップS104;Yes)、後述するステップS105に進み、クリップの解除に該当しないと判別すると(ステップS104;No)、今回の加工対象領域特定処理を終了する。ここでは、クリップの解除ではないと仮定する(ステップS104;No)。この場合、今回の加工対象領域抽出処理を終了する。
例えば、図6に示した入力信号の場合、入力データx(t)の値は、0近傍から徐々に大きくなっていく。このため、当初は入力データx(t)は、その値が+1とはならず(ステップS101;No)、クリップカウンタ350がリセットされ(ステップS103)、クリップの解除には該当しないと判断され(ステップS104;No)、今回の加工対象領域抽出処理を終了する。
一方、ステップS101で、クリップ検出部330が、入力データx(t)の値が+1又は−1であると判別すると(ステップS101;Yes)、次に、x(t)がx(t−1)と同符号であるか、正負判別部340が判別する(ステップS102)。例えば、x(t)が+1でx(t−1)が−1で有った場合等、x(t−1)とx(t)の符号が異なる場合(ステップS102;NO)、クリップは解除されたものとされ、ステップS103に移行する。なお、入力データx(t)のtは入力データの絶対時刻を表す変数であり、加工対象となるクリップの開始位置を0とした場合の時間軸上の相対位置を示す変数iとは区別される。
一方、x(t)とx(t−1)とが同符号であった場合(ステップS102;Yes)、クリップ検出部330は、カウントアップ信号UPをクリップカウンタ350に出力する。カウントアップ信号UPに応答して、クリップカウンタ350は、カウント値をインクリメントする(ステップS106)。次に、正負判別部340は、入力データx(t)が正の値であるか、負の値であるかが判別し、判別結果を加工部360に通知する(ステップS107)。加工部360は、通知に応答し、記憶部370から、通知された極性に対応する閾値th(+)又はth(−)を読み出し、THと置く(ステップS108,S109)。この閾値th(+)とth(−)は、それぞれ、正極性の半波及び負極性の半波において発生したクリップが、波形の補正が必要な程に大きな(長い)ものであるか否かを判別するための基準値である。th(−)≧th(+)である。
次に、クリップカウンタ350のカウント値が閾値THに一致したか否かを判別する(ステップS110)。即ち、クリップ状態がTHサンプリング期間継続したか否か、換言すると、入力データx(t)がTH回連続して+1又は−1であったか否かを判別する。
加工部360は、クリップカウンタ350のカウント値が閾値THと等しくないと判別した場合(ステップS110;No)、特段の処理を行わず、今回の加工対象領域抽出処理を終了する。なお、クリップカウンタ350のカウント値が閾値TH等しくないと判別する場合には、2つの場面がある。まず、クリップカウンタ350のカウント値が閾値TH未満の場合は、クリップ状態の連続量が少なく、未だ、補正が必要な程度に達していないため、特段なにも行わない。一方、クリップカウンタ350のカウント値が閾値THより大きい場合は、補正の対象領域を特定済みのため、今回は特段なにも行わない。
一方、加工部360は、クリップカウンタ350の値が閾値THと等しいと判別した場合(ステップS110;Yes)、即ち、入力データx(t)の補正が必要である程度にクリップ状態が連続していると判別した場合、波形の補正が必要であることを示すクリップフラグをセットする(ステップS112)。
次に、入力データx(t)の符号(正負)を判別する(ステップS113)。
符号が正であった場合(ステップS113;正)、(t−クリップカウント値)、即ち、入力データx(t)が、初めて+1となった時点を基準(x(i))として、x(t−m1)〜x(t+n1)を処理対象範囲(加工対象範囲)に特定し、さらに、補正乗数をα1とする(ステップS114)。即ち、クリップ開始時点近傍の補正範囲及び補正内容を特定する。なお、図5の例では、m1=4、n1=4である。
一方、入力データx(t)の符号が負であった場合(ステップS113;負)、(t−クリップカウント値)、即ち、入力データx(t)が、初めて−1となった時点を基準として、x(t−m2)〜x(t+n2)を処理対象範囲に特定し、さらに、補正乗数をβ1とする(ステップS115)。即ち、クリップ開始時点近傍の補正範囲及び補正内容を特定する。なお、図5の例では、m2=4、n2=4である。
ステップS114又はS115の設定処理終了後、今回の処理を終了する。
続いて、例えば、入力データx(t)のクリップ状態が終了し、入力データx(t)の値が+1又は−1ではなくなった場合、ステップS101でNoと判別され、クリップカウンタ350がリセットされる(ステップS103)。x(t)の値が+1から−1(あるいはその逆)に変化した場合(ステップS102;No)も同様である。さらに、ステップS104では、クリップの解除(入力データx(t)が+1又は−1から他の値に変化した)と判別される(ステップS104;Yes)。
次に、加工部360は、クリップフラグがオンか否かを判別する(ステップS105)。なお、クリップフラグがオンであるのは、クリップ状態が閾値TH以上の期間継続し、ステップS114,S115で波形の補正が必要と判別された場面である。
クリップフラグがオンであると判別された場合(ステップS105;Yes)、クリップフラグをリセット(オフ)する(ステップS116)。
次に、1つ前の入力データx(t−1)を特定し、その符号を判別する(ステップS117)。
入力データx(t−1)は、クリップ状態にある最後の入力データに相当する。
入力データx(t−1)の符号が正の場合(ステップS117;正)、(t−1)、即ち、クリップ状態にある最後のデータの入力時点を基準として、x(t−1−m3)〜x(t−1+n3)を加工対象範囲に特定し、さらに、補正乗数をα2とする(ステップS118)。即ち、クリップ終了時点近傍の補正範囲及び補正内容を特定する。図5の例では、m3=4、n3=4である。
一方、入力データx(t−1)の符号が負であった場合(ステップS117;負)、(t−1)、即ち、クリップ状態にある最後のデータの入力時点を基準として、x(t−1−m4)〜x(t−1+n4)を処理対象範囲に特定し、さらに、補正乗数をβ2とする(ステップS119)。即ち、クリップ終了時点近傍の補正範囲及び補正内容を特定する。図5の例では、m4=4、n4=4である。
以上で、本実施形態の加工対象領域抽出処理を終了し、図7に示すメインフローに戻る。
次に、タイミングtでは、遅延バッファ320からnクロック前の入力データx(t−n)が出力されている。
加工部360は、この遅延データx(t−n)がステップS13で実施した加工対象領域抽出処理で特定した処理対象データ(処理対象範囲に含まれるデータ、加工対象のデータ)として、内部メモリに登録されているか否かを、内部メモリの記録内容から判別する(ステップS14)。
処理対象として登録されていない場合(ステップS14;No)、遅延データx(t−n)をそのまま出力データX(t)としてデコーダ40に出力する(ステップ16)。
その後、処理はステップS12に戻り、次の入力データに同様の処理が実行される。
一方、ステップS14で、遅延データx(t−n)が加工対象のデータであると判別された場合(ステップS14;Yes)、内部メモリに記憶されているデータに基づいて、使用する乗算計数を特定する、さらに、基準時点iに対する相対位置を特定する。次に、特定した乗算係数群α1,α2,β1、β2のうちから相対位置が一致するものを特定し、遅延データx(t−n)に乗算し、積を求める(ステップS15)。
続いて、求めた積を出力データX(t)として出力する(ステップS16)。
例えば、今、遅延バッファ320から出力されたデータx(t−n)が処理対象データとして特定されており、補正乗数としてα1が設定さているとする。加工部360は、t−nと基準位置iとの差を求める。
例えば、(t−n)−i=−3、即ち、遅延データx(t−n)が基準位置iより3サンプリング前のデータの場合、加工部360は、乗算係数α1(−3)=0.9を図5のテーブルから読み出し、これを遅延データx(t−n)に乗算してx(t−n)・α1(−3)=0.9・x(t−n)を補正後の音声データとして出力する。
同様に、例えば、遅延バッファ320から出力されたデータx(t−n)が処理対象データとして特定されており、乗算係数としてβ2が設定さているとする。加工部360は、t−nが基準位置iとの差を求める。例えば、(t−n)−i=+2、即ち、遅延データx(t−n)が基準位置iより2サンプリング後のデータの場合、加工部360は、乗算係数β2(+2)=0.85を図5のテーブルから読み出し、これを遅延データx(t−n)に乗算してx(t−n)・α1(−3)=0.88・x(t−n)を求めて補正後の音声データとして出力する。
このような動作を繰り返すことにより、音声信号加工装置30は、クリップによる歪みの影響を小さくするようにデコーダ20から供給される音声信号の音声信号を補正すると共に入力音声信号の極性に対するコーン紙516の動特性の異方性に起因する音の歪みを抑えることができる。
この発明は上記実施形態に限定されず、種々の変形及び応用が可能である。
例えば、上記実施形態においては、入力信号の全周波数帯域に一様の加工処理を施したが、例えば、入力信号の周波数帯域別に加工(補正)処理を行っても良い。図9に入力信号を高周波数帯と低周波数帯の2つに分離し、それぞれ加工処理を行った後、加算する構成の例を示す。この構成は、入力信号をハイパスフィルタ(HPF)390とローパスフィルタ(LPF)391により2つの周波数帯域の成分に分離し、それぞれ、図4(b)に示した回路と同様の回路とそれぞれの周波数帯のスピーカ50の特性に最適化した補正パラメータにより補正処理を行った後、加算器392により両帯域の補正済信号を加算して出力する構成である。また、入力信号を3つ以上フィルタ(ハイパスフィルタ、バンドパスフィルタ、ローパスフィルタ)を用いて3つ以上の周波数帯に分離し、分離したそれぞれの周波数帯の入力信号に対してそれぞれ上記加工処理を行っても良い。
また、図10に示すように、高周波数処理部の出力を、図示せぬ高周波数用D/Aコンバータを介して、高周波数用スピーカ51Hに供給し、低周波数処理部の出力を、図示せぬ低周波数用D/Aコンバータを介して、低周波数用スピーカ51Lに供給するように構成してもよい。
上述した補正乗数α1、α2、β1、β2は、一例であり、クリップ波形による再生音の歪み、及び、入力信号の極性に対するスピーカの動特性の差による再生音の歪みを共に抑制できるならば、任意の補正乗数を採用可能である。
例えば、上記実施の形態では、入力音声信号の各波形のクリップ部分の両端部分を主に加工(補正)したが、図11に示すように、より広範囲に加工(補正)を行うようにしてもよい。
上記実施形態においては、クリップの開始点を含む所定範囲とクリップの終了点を含む所定範囲とをそれぞれ加工(圧縮)の範囲としたが、クリップの開始点を含む所定範囲とクリップの終了点を含む所定範囲との一方のみを加工(圧縮)の対象としてもよい。また、クリップ部分(クリップの開始点と終了点との間の部分)のみを加工の対象としてもよい。
入力データx(t)の加工対象とするか否かを判別するために、クリップの連続数がTH(th(+)、th(−))に基づいて判別したが、他の手法を使用することも可能である。
また、例えば、図5の例では、正極性の入力信号用の補正乗数α1,α2は、補正の範囲(加工の対象とする入力データ数)も個々の入力データに対する補正の程度も、負極性の入力データ用の補正乗数β1,β2よりも大きくなるように設計した。本発明はこれに限定されず、例えば、入力信号の極性に応じて、補正の範囲のみ異ならせたり、補正の範囲は同一として、補正の程度のみを入力信号の極性に応じて異ならせるように設計してもよい。
また、上記実施の形態においては、補正乗数を数値の形態で予め用意しておいたが、補正乗数を関数fの形態で用意してもよい。例えば、補正乗数を図12に例示するような関数の形式で記憶し、入力信号の極性P等に基づいて、関数f(CN,P)の形状、例えば、補正する範囲に相当するT、補正の程度に相当する深さD、曲線の傾きC、等を変化させるようにしてもよい。なお、CNは入力信号の各波形におけるクリップの長さ(クリップカウンタ350のカウント値)をあらわす数値である。、各パラメータ(T,D、C)は、少なくとも入力信号の極性Pに基づいて変化する必要があるが、その他にも入力信号の各波形におけるクリップの長さCN、等に基づいて変化してもよい。図12のグラフでは、f=1と関数fとの交点が、それぞれ加工を開始する部分と加工を終了する部分とに対応する。関数fの極小値を入力信号のクリップ開始部(クリップ終了部)と対応させることが好ましい。図12では、関数fの極小値と上記二つの交点との距離は等しいが、当該極小値と上記二つの交点との距離は異なっていても良い。
上記実施の形態では、正極性の音声信号が入力された時のコーン紙(可動部)516の動きの方が、負極性の音声信号が入力された時のコーン紙(可動部)516の動きよりも大きいスピーカ50を使用する例を示した。負極性の音声信号が入力された時のコーン紙516の動きの方が、正極性の音声信号が入力された時のコーン紙516の動きよりも大きいスピーカ50を使用する場合には、負極性の入力信号に対する補正を正極性の入力信号の補正よりも大きくすればよい。
スピーカ50の構成は任意であり、例えば、図13に示すような、開口を有する構成等も採用可能である。この場合、スピーカの動作特性や周波数特性に合わせて、補正乗数を適宜設計する。
音源装置10の出力信号は、アナログでも良い。このときは、デコーダ20に代えてA/Dコンバータを配置すればよい。
また、入力部、通信などを介して、上述の各種パラメータ、例えば、th(+)、th(−)、α1〜β2等を適宜設定変更できるようにしてもよい。また、他の加工・圧縮、補正用のパラメータをあわせて使用することも可能である。
また、音源装置10の出力信号が複数チャネル存在する場合には、チャネル毎に、音声信号加工装置30を配置すればよい。
なお、この発明は専用の装置に限定されず、例えば、汎用のコンピュータに上述の信号加工処理を実行させるプログラムをインストールし、実行させることにより、音声信号加工装置として機能するようにしてもよい。
1 音声再生装置
10 音源装置
20 デコーダ
30 音声信号加工装置
40 D/A変換器
50 スピーカ
51 スピーカユニット
51H 高周波数用スピーカ
51L 低周波数用スピーカ
52 スピーカエンクロージャ
53 入力端子
301 情報処理部
302 データ記憶部
303 プログラム記憶部
304 データ入力部
305 データ出力部
307 内部パス
308 制御プログラム
310 入力部
320 遅延バッファ
330 クリップ検出部
340 正負判別部
350 クリップカウンタ
360 加工部
370 記憶部
380 出力部
390 ハイパスフィルタ(HPF)
319 ローパスフィルタ(LPF)
392 加算器
511 コイル
512 マグネット
513 フレーム
514 センタキャップ
515 ダンパ
516 コーン紙
517 エッジ

Claims (9)

  1. 音声信号中のクリップ部分を検出する検出部と、
    前記検出部が検出したクリップ部分の極性を判別する正負判別部と、
    前記検出部が検出したクリップ部分の開始点とクリップ部分の終了点の少なくともいずれか一方を判別する開始終了判別部と、
    前記開始終了判別部が判別したクリップ部分の開始点とクリップ部分の終了点の少なくともいずれか一方の前後の予め定められた範囲を、前記正負判別部が判別した極性および前記予め定められた範囲に対応するパラメータに基づいて、加工する加工部と、
    を備えることを特徴とする音声信号加工装置。
  2. 音声信号中のクリップ部分を検出する検出部と、
    前記検出部が検出したクリップ部分の極性を判別する正負判別部と、
    前記検出部が検出したクリップ部分を、前記正負判別部が判別した極性に対応するパラメータに基づいて、加工する加工部と、
    を備え、
    前記検出部が検出したクリップ部分が、加工対象であるか否かを、前記正負判別部が判別した極性とクリップ部分の時間長さに対応する判別基準に基づいて判別する加工判別部をさらに備え、
    前記加工部は、前記加工判別部が前記クリップ部分を加工対象であると判別した場合に、前記クリップ部分を加工する、
    ことを特徴とする声信号加工装置。
  3. 前記検出部が検出したクリップ部分がクリップしている時間長さをカウントするカウント部をさらに備え、
    前記加工判別部は、前記カウント部がカウントしたクリップ部分の時間長さに基づいて当該クリップ部分が加工対象であるか否か判別する、
    ことを特徴とする請求項2に記載の音声信号加工装置。
  4. 前記加工部は、クリップ部分の開始点を含む第1の所定範囲とクリップ部分の終了点を含む第2の所定範囲の少なくとも一方の所定範囲内のデータの値を信号を圧縮するように補正する、
    ことを特徴とする請求項1乃至3の何れか1項に記載の音声信号加工装置。
  5. 実質的に形状が同一で極性が異なる波形が、出力先のスピーカに入力された際に、第1の極性の波形が入力された時の方が、第2の極性の波形が入力された時よりもスピーカの可動部の動きが大きい場合には、
    前記加工部の、第1の極性に対応するパラメータの方が、第2の極性に対応するパラメータよりも、信号を圧縮する程度が大きい、
    ことを特徴とする請求項1乃至4の何れか1項に記載の音声信号加工装置。
  6. 第1の極性に対応するパラメータの方が、第2の極性に対応するパラメータよりも、信号を圧縮する程度が大きく、及び/又は、補正の期間が長い、
    ことを特徴とする請求項5に記載の音声信号加工装置。
  7. 音声信号を複数の帯域の信号成分に分割する分割部をさらに備え、
    前記検出部は、前記分割部が分割した各信号成分について、クリップ部分を検出し、
    前記正負判別部は、前記分割部が分割した信号成分毎に極性を判別し、
    前記加工部は、前記分割部が分割した信号成分毎に信号を加工する、
    ことを特徴とする請求項1乃至6の何れか1項に記載の音声信号加工装置。
  8. 供給された音声信号中のクリップ部分を検出し、
    前記検出したクリップ部分の極性を判別し、
    前記検出したクリップ部分の開始点とクリップ部分の終了点の少なくともいずれか一方を判別し、
    前記判別したクリップ部分の開始点とクリップ部分の終了点の少なくともいずれか一方の前後の予め定められた範囲を、前記判別した極性および前記予め定められた範囲に対応するパラメータに基づいて、加工する、
    ことを特徴とする音声信号加工方法。
  9. コンピュータに、
    供給された音声信号中のクリップ部分を検出する段階と、
    前記検出したクリップ部分の極性を判別する段階と、
    前記検出したクリップ部分の開始点とクリップ部分の終了点の少なくともいずれか一方を判別する段階と、
    前記判別したクリップ部分の開始点とクリップ部分の終了点の少なくともいずれか一方の前後の予め定められた範囲を、前記判別した極性および前記予め定められた範囲に対応するパラメータに基づいて、加工する段階と、
    を実行させるプログラム。
JP2011192061A 2011-09-02 2011-09-02 音声信号加工装置、音声信号加工方法及びプログラム Active JP5821431B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011192061A JP5821431B2 (ja) 2011-09-02 2011-09-02 音声信号加工装置、音声信号加工方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011192061A JP5821431B2 (ja) 2011-09-02 2011-09-02 音声信号加工装置、音声信号加工方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2013055498A JP2013055498A (ja) 2013-03-21
JP5821431B2 true JP5821431B2 (ja) 2015-11-24

Family

ID=48132120

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011192061A Active JP5821431B2 (ja) 2011-09-02 2011-09-02 音声信号加工装置、音声信号加工方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5821431B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111580772B (zh) * 2013-10-22 2023-09-26 弗劳恩霍夫应用研究促进协会 用于音频设备的组合动态范围压缩和引导截断防止的构思

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0632531B2 (ja) * 1984-03-28 1994-04-27 松下電器産業株式会社 低歪スピ−カ装置
JPS61113305A (ja) * 1984-11-07 1986-05-31 Rohm Co Ltd 増幅器
JP2009010824A (ja) * 2007-06-29 2009-01-15 Kenwood Corp 音響装置およびスピーカの駆動方法
WO2011061830A1 (ja) * 2009-11-19 2011-05-26 パイオニア株式会社 デジタル信号処理装置及びデジタル信号処理方法

Also Published As

Publication number Publication date
JP2013055498A (ja) 2013-03-21

Similar Documents

Publication Publication Date Title
US8204239B2 (en) Audio processing method and audio processing apparatus
US8315399B2 (en) Device for and a method of processing audio data
US20120230514A1 (en) Signal processing device and signal processing method
JP2007178675A (ja) オーディオ再生の効果付加方法およびその装置
US8280062B2 (en) Sound corrector, sound measurement device, sound reproducer, sound correction method, and sound measurement method
JPWO2010005034A1 (ja) 音響処理装置
JP4983694B2 (ja) 音声再生装置
JP5459556B2 (ja) 音響特性調整装置、音響特性調整方法およびコンピュータプログラム
JP5340121B2 (ja) オーディオ信号再生装置
JP2007104046A (ja) 音響調整装置
JP5821431B2 (ja) 音声信号加工装置、音声信号加工方法及びプログラム
US10708690B2 (en) Method of an audio signal correction
JP2008209490A (ja) 音響処理装置及び音響処理方法
JP6155132B2 (ja) 低域補完装置および低域補完方法
JP5715910B2 (ja) ダイナミックレンジ拡張装置
JP5268581B2 (ja) 低域補完装置
JP5375861B2 (ja) オーディオ再生の効果付加方法およびその装置
JP2012145716A (ja) 音声信号補正装置、音声信号補正方法及びプログラム
JP2009200777A (ja) オーディオ信号の利得制御装置および利得制御方法
JP2012216924A (ja) 信号処理装置及び信号処理方法
JP4986893B2 (ja) 高調波生成装置
JP5885328B2 (ja) 音量制御装置
JP2008209491A (ja) 音響処理装置及び音響処理方法
JP2022171456A (ja) 音響処理装置及びプログラム
JP2011180540A (ja) 音響装置及び音響信号補正方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140228

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141224

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150908

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150921

R150 Certificate of patent or registration of utility model

Ref document number: 5821431

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150