JP5572391B2 - 音声データを処理する装置及び方法 - Google Patents

音声データを処理する装置及び方法 Download PDF

Info

Publication number
JP5572391B2
JP5572391B2 JP2009542306A JP2009542306A JP5572391B2 JP 5572391 B2 JP5572391 B2 JP 5572391B2 JP 2009542306 A JP2009542306 A JP 2009542306A JP 2009542306 A JP2009542306 A JP 2009542306A JP 5572391 B2 JP5572391 B2 JP 5572391B2
Authority
JP
Japan
Prior art keywords
signal
frequency
audio data
envelope
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009542306A
Other languages
English (en)
Other versions
JP2010513972A (ja
Inventor
ポールテル,ヘリット ドゥ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2010513972A publication Critical patent/JP2010513972A/ja
Application granted granted Critical
Publication of JP5572391B2 publication Critical patent/JP5572391B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、音声データを処理する装置に関する。
これを超えて、本発明は、音声データを処理する方法に関する。
更に、本発明は、プログラム要素に関する。
更に、本発明は、コンピュータ読取可能な媒体に関する。
音声再生装置は、ますます重要になっている。特に、ますます多くのユーザが、ホームシネマエンターテイメント設備及び他の音声サラウンドシステムを購入している。
ホームシネマ映画では、極めて低い周波数は例外的でない。例えば、30ヘルツ(Hz)以下の周波数は、地震、走る恐竜、爆発等のような効果の常である。従って、低周波範囲での音声データは、大いに映画体験に寄与しうる。
他方で、低周波再生のために設計されたスピーカシステム、例えば、通気式サブウーファーは、このような低い周波数を十分な精度を有して再生する能力を有さないことがある。
ラウドスピーカが実際に再生することができるよりも低い周波数を感知する“感覚”を作り出すために、“ミッシング・ファンダメンタル(missing fundamental=失われた基底音)”の効果のようなサイコアコースティック効果が利用されてよい。しかし、ミッシング・ファンダメンタルの原理を用いるアルゴリズムは、未だそれらの方途をホームシネマ応用に見出していない。
バリバス(BaryBass)は、オーディオ・コンセプトであり、サテライト及びサブウーファーを備えるシステムを想定する。バリバスの特徴は、サテライトが再生することができない帯域(又はその一部)を1つの単一周波数に投影することによって、低音の印象を作り出すことである。この周波数は、十分に高品質のラウドスピーカを含むクローズド・ラウドスピーカ・ボックスで増幅及び再生をされる。このようにして、高効率サブウーファーを得ることが可能である。一例を挙げれば、120Hzでカットオフ周波数を有するサテライトを用いると、最終的に、20Hzから120Hzの間の周波数帯域は1つの周波数に投影される。例えば50Hzと、その周波数が低すぎる場合は、サテライトと信号トーンとの間のギャップは顕在化する。例えば70Hzと、周波数が過度に高く選択される場合は、トーンは、残りの音楽と著しく調和がとれなくなる。
他のシステムは、サテライトが存在せずとも、フルレンジ・ラウドスピーカで適切に働くことができる。例えば、通気式システムは、サブウーファーがそのように再生することができない周波数の帯域を再生する目的を有して設けられてよい。目的は、より小さく、より効率的なサブウーファーを作ることではなく、サブウーファーが物理的に再生することができない可聴な更なる周波数を作ることである。それは、可能なサテライトとサブウーファーとの間の余分のギャップを導入しない。ホームシネマ応用で、サブウーファー・ボックスは、不調和がほとんど問題とならない多少低い周波数(例えば50Hz)に合わせられ得る。
バリバスの件に戻ると、この技術は、周波数範囲を1つの単一一定周波数に投影することができる。また、周波数範囲をわずかに変化する周波数に投影することも可能である。
国際公開第2005/027569(A1)号パンフレット(特許文献1)は、例えばラウドスピーカのようなトランスデューサのための駆動信号を生成する装置を開示する。駆動信号は、トランスデューサの共振周波数に略等しい周波数と、外部信号によって制御される振幅とを有する。装置は、制御パスにより駆動信号の周波数をトランスデューサの共振周波数へと自動で調整するよう配置されている。装置は、音声信号の周波数範囲をトランスデューサに適合させる周波数適応装置の部分であってよい。
国際公開第2005/027569(A1)号パンフレット
しかし、従来のオーディオシステムは、特に低音周波数範囲で十分でない音響品質を欠点とする。
本発明は、十分な音声再生品質を有するオーディオシステムを提供することを目的とする。
上記の目的を達成するために、独立請求項に従う音声データを処理する装置、音声データを処理する方法、プログラム要素及びコンピュータ読取可能な媒体が提供される。従属請求項は、有利な実施形態を定義する。
本発明の実施例に従って、音声データを処理する装置であって、前記音声データのエンベロープを検出するよう構成されるエンベロープ検出器と、所定の周波数で発振する発振信号を生成するよう構成される周波数発生器とを有し、前記周波数発生器は、前記エンベロープ検出器に前記発振信号を供給するよう前記エンベロープ検出器へ結合され、前記エンベロープ検出器は、前記発振信号に基づいて前記音声データをサンプリングすることによって前記音声データのエンベロープを検出するよう構成される、装置が提供される。
本発明の他の実施例に従って、音声データを処理する方法であって、所定の周波数で発振する発振信号を生成する段階と、前記発振信号に基づいて前記音声データをサンプリングすることによって前記音声データのエンベロープを検出する段階とを有する方法が提供される。
本発明の更なる他の実施例に従って、プロセッサによって実行される場合に、上記の特徴を有するデータ処理方法を実行又制御するよう構成されるプログラム要素(例えば、ソースコード又は実行可能コードにおけるソフトウェアルーチン)が提供される。
本発明の更なる他の実施例に従って、音声データを処理するコンピュータプログラムが記憶されるコンピュータ読取可能な媒体(例えば、CD、DVD、USBスティック、フロッピーディスク(登録商標)又はハードディスク)であって、前記コンピュータプログラムは、プロセッサによって実行される場合に、上記の特徴を有するデータ処理方法を実行又は制御するよう構成される、コンピュータ読取可能な媒体が提供される。
本発明の実施例に従って実行され得る音声操作又は周波数マッピングを目的とするデータ処理は、コンピュータプログラムによって、すなわち、ソフトウェアによって、又は1若しくはそれ以上の特別の電子最適回路によって、あるいはハードウェアで、あるいはハイブリッド形態で、すなわち、ソフトウェア要素及びハードウェア要素によって、実現されてよい。
かかる応用との関連で、用語“エンベロープ検出器”は、特に、交番(例えばAC)信号を復調するために用いられるエンティティ又は装置を表しうる。近似音声コンテンツメッセージは、変調されている信号のエンベロープから復号化され得る。言い換えると、エンベロープ検出器は、信号の全体的な形状を示す信号のエンベロープを検出することができる。
用語“周波数発生器”は、例えば50Hzの単一周波数で発振を発生させるエンティティ又は装置を表しうる。完璧な信号周波数の発生は現実的でないが、個々の正弦波の実際の周波数値は、所定の周波数値に極めて近くなければならない。
用語“零交差”は、振幅が基本的に零である発振信号の位相値に割り当てられている時間の点を表しうる。このようにして、2つの連続する零交差は、基本的に発振の半周期に等しい。
用語“バス周波数”は、特に、低音周波数、すなわち、中音域及び高音域を下回る周波数を表しうる。バス周波数は、基本的に、120Hzを下回る範囲、より具体的には、80Hzを下回る範囲をカバーする。
用語“ソース信号”は、ハードディスク若しくはCDのような音源によって供給され、又は放送ネットワークを介して送信される音声コンテンツ信号を表しうる。
本発明の実施例に従って、音声処理装置は、サンプル間隔を定めるために使用される発振信号の2つの連続する零交差の間で音声データ信号のエンベロープを検出する、効率的に動作するエンベロープ検出器を有して提供されてよい。更に、このエンベロープ検出器によって生成される出力信号は、サンプリングに使用される同じ発振信号を乗じられてよい。これは、発振信号の適切な使用とともに、適切なエンベロープ検出を可能にする。
音声コンテンツ信号の以前の低域通過フィルタリング及び/又はアップストリームとともに、低音域を分離するために、限定的にのみ多数のラウドスピーカによって再生可能である周波数のかかる低音域を変換して、発振信号の周波数で音声データ信号を形成することが可能である。この単一周波数信号は、全ての極めて低い周波数の低音寄与を表すことができる。言い換えると、極端な低音信号帯域は、搬送波として用いられる発振信号上に変調され得る。これは、特にバス周波数を1つの単一周波数上にマッピングして、音声再生装置の感知される低音再生品質を改善する極めて有効な方法である。
ラウドスピーカシステムは、特徴的な高域通過動作を有する。システムのカットオフ周波数を下回る音楽要素は、減衰されるか、又は全く再生されないことがある。特に映画では、低音周波数は、認知経験の創造において重要な役割を担う。この認識を考慮して、本発明の実施例は、かかる低音周波数の感覚を作り出す。ミッシング・ファンダメンタルのサイコアコースティック原理に基づく特徴が使用されるアプローチとは対照的に、本発明の実施例は、限られたサイコアコースティック効果により及び/又はこのような従来のシステムの可聴アーティファクトにより、ホームシネマシステムにとって、より適切である。
本発明の実施例に従って、再生されない又は満足に再生されない低周波領域のエネルギ含量は、時間とともに変化する又は不変である単一周波数で投影されてよい。通気式システムの場合に、この周波数は、おおよそボックスチューニング周波数であってよい。この周波数で、ラウドスピーカ偏位(excursion)は小さいか又は最小であってよく、低音エンハンスメントのための余分の機械的マージンを可能にする。低音周波数を区別するヒトの能力は、周波数が下がるにつれて低下する。一般に、チューニング周波数は、むしろ低くてよい(例えば、50Hz)。従って、超過トーンは、残りの音響コンテンツから分離されるように認識されず、それによって、極めて低い周波数範囲のエネルギ含量を表す余分のトーンを加えることによって、認知される音質を改善する。
本発明の実施例に従って、音声データ処理装置は、音声入力信号を受信する入力部を有して提供されてよい。更に、エンベロープ検出器は、その音声入力信号のエンベロープを検出するよう提供及び構成をされてよい。周波数発生器は、周波数信号を生成するよう構成されてよい。第1の検出手段は、周波数信号の零交差を検出するよう提供及び構成をされてよい。第2の検出手段は、音声入力信号の振幅値を検出するよう構成されてよい。エンベロープ検出器は、周波数信号の2つの検出された零交差の間の時点の音声入力信号の検出された振幅値に依存して単一周波数信号の振幅を適応させるよう設計されてよい。
このような手段を取ることによって、生成される低音信号は実際の低音信号の時間コンツア(time contour)に従うので、ブーミング低音を回避又は抑制することが可能である。励振(excitation)が先だって現れないので、室内反響も先だって現れない。更に、信号タイプ(例えば、ポップミュージック、映画等)に対する認知音質の依存性はほとんど得られない。
従来のアタック及びディケイタイム検出器とは対照的に、本発明の実施例は、このようなアタック及びディケイタイム検出器のアーティファクトを解消する特定の検出器を提供する。このような従来の検出器はディケイタイム(decay time)を導入する。これにより、検出器の出力信号は、信号が零に落ちる場合に、即座に零にならない。結果として、このような従来のシステムの低音ビートは、極めて厄介な可聴テイル(tail)をもたらしうる。
これに関連して、本発明の実施例に従って、かかる検出器は、トリガ信号の2つの零交差の間で絶対最大値を見ることがある。その最大値は、検出器の出力部へ送られてよい。得られる利点は、信号が突然落ちる場合に検出器の出力が即座に零となり、可聴テールが抑制又は除去をされ得ることである。
本発明の実施例の応用例は、テレビ受像機、ホームシネマシステム、カーステレオシステム、又はマルチメディアプレーヤである。
本発明の実施例は、計算されるべきエネルギの周波数帯域でのエネルギ含量の従来の検出において起こりうる問題に取り組む。すなわち、標準的なレベル検出器は、信号の出現及び消失に反応を示す時間を必要とする。信号の減衰は、検出によって正確に追随されるべきである。さもなければ、音楽が消えた場合に、不自然なランブル(rumble)が発生しうる。実施例に従うエンベロープ検出アーキテクチャは、この問題の解決法を提供することができる。
以下で、本発明者の幾つかの認識が説明される。これら及び他の認識に基づいて、本発明の実施例は展開されている。
− 民生のホームシネマシステム用のサブウーファーは、通常、通気式ボックスシステムである。通気式ボックスのチューニング周波数で、ラウドスピーカの偏位は最小であってよく、余分の電気的な低音エンハンスメントのために余分の機械的マージンを提供する。従って、簡単な低音ブーストは、ボックスのチューニング周波数でその中心周波数を有するよう調整されてよい。より高い周波数帯域へのより低い周波数帯域の投影が可能である。例えば、全体の周波数帯域(例えば、25Hzから50Hz)は、ラウドスピーカが更なる機械的マージンを有する場合に、高調波の適切に制御された生成を介して、より高い周波数帯域(例えば、50Hzから100Hz)へ投影されてよい。通常、歪みを防ぐよう、高調波の振幅は制限されるべきである。また、より高い高調波は、より低いピッチのサイコアコースティック認知のみを作り出すわけではない。同時に、それらは、歪みとして認知され得る。事実上それらは歪みである。
− 単一周波数への投影が使用される場合に、室内モードは、極めて存在感があるものとなりうる。しかし、本発明の実施例は、室内モードの悪影響を抑制又は除去することができる。
− 低周波コンテンツの検出は、通常、標準的なアタック−ディケイレベル検出器により行われてよい。このような検出器は、エネルギの減衰が信号のエネルギ減衰を十分正確に追随しないという基本的な問題を有しうる。これは、音楽が既に止まっている場合に依然として検出器が信号を生成することを意味する。これは、元の音楽とは無関係な信号の生成を生じさせる。しかし、エンベロープによって変調された情報の基本波として及びエンベロープ検出器制御信号として単一周波数発振信号を用いる本発明の実施例の周波数マッピングスキームは、この問題を解決することができる。
次に、当該装置の更なる実施例について説明する。なお、これらの実施例は、また、方法、プログラム要素及びコンピュータ読取可能な媒体に適用される。
前記エンベロープ検出器は、前記音声データの一部のエンベロープを、前記発振信号の2つの連続する零交差の間で前記音声データの前記一部の最大振幅を決定することによって検出するよう構成されてよい。
このような発振信号の半波は、振幅の最大値を検出する測定間隔を定義しうる。このために、発振信号の適切な周波数値(例えば、約50Hz)は、発振信号の2つの連続する零交差の間の対応する時間距離が、正確にエンベロープを分解(resolve)するに足りるほど短く、且つ、十分に高速な信号処理を実行するに足りるほど粗いので、同様に適切でありうる。
当該装置は、検出されたエンベロープ信号に前記発振信号を乗じるよう構成される乗算器を有してよい。前記発振信号は、既に、エンベロープ検出のためのサンプリングスキームを定義するために使用されている。従って、この乗算器の出力は、通常ヒトの耳には完全には聞こえず及び/又は多数の音声再生装置によって適切に再生されない音声信号の重低音寄与の振幅を示す振幅を有する単一周波数信号であってよい。
前記周波数発生器は、所定のバス周波数で発振する発振信号を生成するよう構成されてよい。用語“バス周波数”は、最も低い可聴音声範囲を表し、特に、基本的に20Hzから120Hzの間の周波数範囲、より具体的には40Hzから80Hzの間の周波数範囲をカバーしうる。全てのこれらの周波数寄与は、発振信号の単一周波数にマッピングされ、中音域及び高音域の存在下で低音レジーム(regime)の良好な反射として聴取者によって認知される単一トーンを生成する。前記発振信号の適切な値は、50Hzから70Hzの間、例えば60Hzであってよい。
当該装置は、ソース信号の低域通過フィルタリングを実行することによって前記音声データを生成するよう構成される低域通過フィルタを有してよい。このソース信号は、例えばハードディスク又はCD若しくはDVDのような音声データ又は音声コンテンツの発生源、あるいはテレビ局による音声信号放送から直接に取り出される信号であってよい。前記低域通過フィルタは、バス周波数、すなわち、20Hzから120Hzの間の周波数範囲、より具体的には40Hzから80Hzの間の周波数範囲でカットオフ周波数を有してよい。低域通過フィルタのカットオフ周波数は、そのフィルタリングが、ラウドスピーカ等の音声再生ユニットによって適切に再生される周波数と、音声再生ユニットによって再生されない又は満足には再生されない重低音周波数とを分離するように選択され得る。
当該装置は、(全ての周波数寄与を有する)前記ソース信号を、(極めて低周波の信号の概算を表す1つの周波数信号を有する)前記乗算器によって出力される信号に加えるよう構成される加算器を更に有してよい。これは、乗算器の出力で得られた単一周波数低音信号を最初の音声信号に加え、それによって、元の信号によってはラウドスピーカが再生することができない低音部分の近似も聴取者が聞けるようにする信号を生成することを可能にする。
当該装置は、前記加算器によって供給される信号出力を再生するよう構成される音声データ再生ユニットを有してよい。かかる音声データ再生ユニットは、ラウドスピーカであってよく、また、イヤホーン又はヘッドセットであってもよい。かかる音声再生ユニットは、前記加算器の出力部で供給される信号に基づいて、ヒトが聞くことができる音波を生成することができる。このように、当該装置は、とりわけ、周波数マッピングをされている音声データを周囲へ向け再生する音声再生ユニットを有してよい。かかる音声再生ユニットは、1又はそれ以上のラウドスピーカや、サブウーファー等であってよい。従って、周波数マッピングは、完全な音声データ再生システムで実施されてよい。
前記周波数発生器は、時間にわたって一定な又は変化する所定の周波数で発振する前記発振信号を生成するよう構成されてよい。一定周波数を有する発振は、安価で且つ簡単な解決法でありうる。周波数をフレーム条件、特に、聴取者の聴力に又は処理される音声データの種類に適合させる可能性は、システムをより柔軟にして、音質を更に高めることができる。
前記エンベロープ検出器は、前記発振信号の零交差の形でクロック信号を受信するクロック入力を有し且つ処理される前記音声データのフィンガープリントである信号を受信するデータ入力を有するフリップフロップを有してよい。例えば、振幅レベル検出器は、発振の2つの零交差の間で、(低域通過フィルタをかけられた)音楽信号の最大値(又は平均)を測定してよい。次の零交差が発生する場合に、この値は、フリップフロップで記録され得、発振器の次の半周期の間利用可能でありうる。
前記音声データを処理する装置は、オーディオサラウンドシステム、携帯電話、ヘッドセット、ラウドスピーカ、補聴器、テレビ受像機、ビデオレコーダ、モニタ、ゲーム機、ラップトップ、オーディオプレーヤ、DVDプレーヤ、CDプレーヤ、ハードディスクを用いたメディアプレーヤ、インターネットラジオ装置、パブリックエンターテイメント装置、MP3プレーヤ、ハイファイシステム、乗り物エンターテイメント装置、車両エンターテイメント装置、医療通信システム、装着式装置、音声通信装置、ホームシネマシステム、ホームシアターシステム、フラットテレビ、臨場感発生装置、サブウーファー、及び音楽ホールシステム、又は音響を再生可能な他の何らかの電子装置を含むグループの中の少なくとも1つとして実現されてよい。同様に、他の応用が可能である。
なお、本発明の実施例に従うシステムは、主として、音響又は音声データの品質を改善することを目的とするが、音声データ及び画像データの組合せのためのシステムを適用することも可能である。例えば、本発明の実施例は、1又はそれ以上のスピーカが使用されるビデオプレーヤ又はホームシネマシステムのようなオーディオビデオ(AV)アプリケーションで実施されてよい。
本発明の前述の様相及び更なる様相は、以下で記載される実施例から明らかであり、これらの実施例を参照して説明される。
本発明の実施例に従う音声データ処理装置を表す。 本発明の実施例に従う音声データ処理装置の動作原理を表す図である。 本発明の実施例に従うエンベロープ検出器の挙動を表す幾つかの図を示す。 本発明の実施例に従う音声データ処理システムを表す。 低域通過フィルタのフィルタ特性を表す。 本発明の実施例に従う同期レベル検出器を表す。
本発明は、実施例を参照して、以下でより詳細に記載される。しかし、本発明は、これらの実施例に限定されない。
図面中の説明は概略である。各図において、同一の又は対応する要素には、同じ参照符号が付されている。
以下、図1を参照して、本発明の実施例に従う音声データ処理装置100について説明する。
装置100は、エンベロープ検出器101の第1入力部で供給される音声データ入力信号102のエンベロープを検出するよう構成されるエンベロープ検出器101を有する。
更に、周波数発生器103が設けられており、これは、所定の周波数で発振する発振信号104を生成するよう構成される。周波数発生器103は、エンベロープ検出器101の第2入力部へ結合されており、エンベロープ検出器101に発振信号104を供給する。
エンベロープ検出器101は、発振信号104に基づいて音声データ入力信号102をサンプリングすることによって音声データ入力信号102のエンベロープを検出し、それによって出力信号105を生成するよう構成される。
以下でより詳細に説明されるように、エンベロープ検出器101は、音声データ102の一部のエンベロープを、発振信号104の2つの連続する零交差の間で音声データ102のその部分の最大振幅を決定することによって検出するよう構成される。
周波数発生器103は、50Hzの正弦波発振として発振信号104を生成する。
図2は、本発明の実施例の動作原理を表すダイアグラム200を示す。
ダイアグラム200の横座標201に沿って、周波数がプロットされる。ダイアグラム200の縦座標202に沿って、ラウドスピーカボックスの特性がプロットされる。
第1の曲線203は、周波数スペクトルを再生するラウドスピーカボックスの高域通過能力を表す。与えられている例で、スピーカボックスは、50Hzで−3dBを有する。言い換えると、第1の曲線203は、サブウーファーによる再生スペクトルを示す。
ダイアグラム200の第2の曲線204は、ボックスが音声コンテンツを再生することができないスペクトルを表す。言い換えると、第2の曲線204は、サブウーファーの再生不能スペクトルを示す。
第2の曲線204を下回るエネルギ(すなわち、領域)は、矢印によって表される単一周波数205で投影される。言い換えると、第3の曲線205は、サブウーファーによって再生される投影スペクトルである。
記載される手段を取ると、変調された単一トーンが、周波数205で聴取者によって聞かれる。この単一トーンは分離されず且つそれはむしろ周波数が低いので、基本的に場面の部分として聴取者によって認知される。
任意に、室内モードの悪影響を減らすための対策が取られてよい。
1つの重要なブロックは、エンベロープ検出器101である。
標準的なエンベロープ検出器は、下記の数学的形式により記載され得る:
u[n]:エンベロープ検出器の現在の入力サンプル
y[n]:エンベロープ検出器の現在の出力値
y[n−1]:エンベロープ検出器の前の出力値
Ta:アタックタイム
Tr:リリースタイム
Fs:サンプリング周波数
Ka=exp(−1/(Ta・Fs))
Kr=exp(−1/(Tr・Fs))
Kp=(Kr+Ka)/2
Km=(Kr−Ka)/2
|u[n]|>y[n−1]の場合、
Y[n]=y[n−1]・(1−Ka)+|u[n]|・Ka
その他の場合、
Y[n]=y[n−1]・(1−Kr)。
図3のダイアグラム300、310及び320に示されるオシロスコープ画像は、このようなエンベロープ検出器の典型的な挙動を示す。
横座標301に沿って、時間が任意の単位でプロットされる。縦座標302に沿って、振幅が任意の単位でプロットされる。ダイアグラム300は、エンベロープ検出器の入力信号102を示す。入力信号102は、本例で、フェードイン及びフェードアウト特徴を有する40Hzの正弦波である。
第2のダイアグラム310は、一定の50Hz正弦波による置換を示す。
第3のダイアグラム320は、Ta=1ミリ秒(ms)、Tr=200msを有するエンベロープ検出器の出力である。
図3から明らかなように、エンベロープ検出器のディケイタイム(ダイアグラム320)は、元の信号(ダイアグラム300)のテールよりも長い。これは、代替信号(ダイアグラム310)でより長いテールを生じさせる。
従来のエンベロープ検出器のこのような特性は、不自然な低音経験をもたらしうる。低音は大きくなり過ぎる。また、単一トーン信号に反応する室内共鳴がより長く続き、その不自然な経験に寄与する。これは、Trをより小さく選択することによって改善され得るが、その場合に、エンベロープ検出器の出力は、入力信号の振幅が一定である場合に、より一定でなくなる。その最悪の形で、これは、例えばオートバイの音響のような人為的音響として経験される。
元の信号は周期Tで一定正弦波によって置換されるべきであるから、半周期T/2ごとにその正弦波の振幅を決定すれば十分である。
本発明の実施例に従って、代替信号の2つの零交差時の間の時間フレーム(T/2)で、整流された入力信号の最大値が決定される。このようにして、同期エンベロープ検出器の出力は、非常によく入力信号の振幅に追随することができる。
このように、図1の構成は、ブーミング低音と、室内モードのより小さい励振と、信号タイプ(すなわち、音声コンテンツのジャンル)に対する品質の依存性の低減とをもたらす。
声の励振はほとんど明らかでない。時々、発話信号はエンベロープ検出器を刺激することがある。より長いテールを有すると、これは極めて不自然となりうる。同期エンベロープ検出器100は、有意にこのことを改善することができる。
続いて、図を参照して、本発明の実施例に従う音声データ処理装置500について説明する。
は、例えばハードディスク又はCDプレーヤ等の音源501を示す。ソース信号502は、音源501によって発せられ、低域通過フィルタ機能を実行する低域通過/帯域通過フィルタ503へ供給される。低域通過/帯域通過フィルタ503の出力信号102は、入力信号102としてエンベロープ検出器101へ供給される。
更に、(時間変化する)発振器103は、発振信号104を同期エンベロープ検出器101へ供給する。同期エンベロープ検出器101の出力部では、出力信号105が供給され、この信号は乗算器504へ供給される。更に、乗算器504は、周波数発振信号104を供給される。これを超えて、乗算器504の出力部では、乗算信号505が供給され、この信号は、乗算器504の出力505及びソース信号502を加算する加算器ユニット506へ供給される。次いで、全体の出力信号、すなわち、音響出力信号507は、再生のために、すなわち、音波の発生のために、ラウドスピーカ508へ送られる。ラウドスピーカ508は、高域通過システムとして動作し、減衰された又は可聴でないカットオフ周波数fcを下回る周波数を再生する。本発明の実施例は、聴取者に再生不能の低周波帯域を聞かせることができる。
低域通過フィルタ503は、fcを下回る周波数をエンベロープ検出器101へ送る。同期レベル検出器101は、低周波のエネルギエンベロープ105を出力する。時間変化する周波数の正弦波104は、乗算器504でこのエンベロープ105によって変調される(乗じられる)。その結果は、加算器ユニット506によって元の信号502に加えられる。
は、周波数がプロットされる横座標601を有するダイアグラム600を示す。縦座標602に沿って、単位dBの振幅がプロットされる。
は、低域通過フィルタ機能を示す曲線603を示す。正弦波の中心周波数は、サブウーファー(通気式ボックスとする。)のチューニング(ヘルムホルツ)周波数に等しい。ヘルムホルツ周波数で、ラウドスピーカは機械的マージンを有する。
は、同期レベル検出器101の詳細を示す。発振器103によって発せられた発振信号104は、零交差検出器700へ供給される。零交差検出器700の出力は、連続最大値計算器702へ、より詳細には、そのリセット入力へ供給される。更に、零交差検出器700の出力は、Dフリップフロップ704のクロック入力703へ供給される。更に、零交差検出器700によって決定される開始及び終了時間の範囲内で最大値を計算する連続最大値計算器702の出力は、Dフリップフロップ704のデータ入力705へ供給される。エンベロープ出力信号は、参照符号105により表される。
のボックス101は、同期レベル検出器101の実施例を示す。正弦波104の零交差の間で、(低域通過フィルタをかけられた)音楽信号の最大値が測定される。零交差が起こるときに、この値はDフリップフロップ704で記録され、発振器103の次の半周期の間の信号に利用可能である。
たとえこれが小さな遅延を生じさせうるとしても、アタック−ディケイ検出器に係る改善は非常に大きい。また音楽信号を遅延させることによってこの遅延を補償することが可能である。
本発明は、図面及び上記記載で説明及び記載されてきたが、かかる説明及び記載は、例示又は実例であって、限定であるとして考えられるべきでない。本発明は、開示されている実施例に限定されない。
開示されている実施例に対する他の変形は、図面、本開示、及び添付の特許請求の範囲の検討から、請求される発明を実施することにおいて、当業者によって理解されて達成され得る。特許請求の範囲で、語“有する(comprising)”は他の要素又は段階を除かず、不定冠詞“1つの(a、an)”は複数個を除かない。信号プロセッサ又は他のユニットが、特許請求の範囲に挙げられている幾つかの事項の機能を満たしてよい。特定の手段が相互に異なる従属請求項で挙げられているという単なる事実は、これらの手段の組合せが有利に使用され得ないことを示しているわけではない。コンピュータプログラムは、他のハードウェアの部分とともに又はその部分として供給されるソリッドステート媒体又は光記憶媒体等の適切な媒体に記憶/配置されてよいが、また、例えばインターネット又は他の有線若しくは無線電気通信システムを介して、他の形態で分配されてもよい。特許請求の範囲での如何なる参照符号も、適用範囲を限定するよう解釈されるべきではない。また、留意すべきは、特許請求の範囲での参照符号は、特許請求の範囲の技術的範囲を限定するよう解釈されるべきでない点である。

Claims (13)

  1. 音声データを処理する装置であって:
    前記音声データのエンベロープを検出するよう構成されるエンベロープ検出器と;
    20Hzと120Hzの間の周波数範囲の所定の周波数で発振する発振信号を生成するよう構成される周波数発生器と;
    前記検出されたエンベロープに前記発振信号をかけることによりオーディオ信号を発生するように構成された乗算器と;
    を有し、
    前記周波数発生器は、前記エンベロープ検出器に前記発振信号を供給するよう前記エンベロープ検出器に結合され、
    前記エンベロープ検出器は、前記発振信号によって定まるサンプリング間隔で前記音声データの振幅値を検出することによって前記音声データのエンベロープを検出するよう構成される、装置。
  2. 前記エンベロープ検出器は、前記発振信号の2つの連続する零交差の間の前記音声データの部分について、前記音声データの前記部分での最大振幅を決定することによって、エンベロープを検出するよう構成される、請求項1記載の装置。
  3. 前記周波数発生器は、40Hzから80Hzの間の周波数範囲にある所定のバス周波数で発振する前記発振信号を生成するよう構成される、請求項1記載の装置。
  4. ソース信号の低域通過フィルタリングを実行することによって前記音声データを生成するよう構成される低域通過フィルタを有する請求項1記載の装置。
  5. 前記低域通過フィルタは、20Hzから120Hzの間の周波数範囲、特に、40Hzから80Hzの間の周波数範囲にあるバス周波数でカットオフ周波数を有する、請求項4記載の装置。
  6. 前記ソース信号及び前記乗算器によって出力される信号を加算するよう構成される加算器を有する、請求項4記載の装置。
  7. 前記加算器によって出力される信号に基づいて音波を生成するよう構成される音声データ再生ユニットを有する請求項6記載の装置。
  8. 前記周波数発生器は、時間にわたって一定な又は変化する所定の周波数で発振する前記発振信号を生成するよう構成される、請求項1記載の装置。
  9. 前記エンベロープ検出器は、前記発振信号の零交差を示す信号を受信するクロック入力を有し且つ前記音声データの特徴である信号を受信するデータ入力を有するフリップフロップを有する、請求項1記載の装置。
  10. オーディオサラウンドシステム、携帯電話、ヘッドセット、ラウドスピーカ、補聴器、テレビ受像機、ビデオレコーダ、モニタ、ゲーム機、ラップトップ、オーディオプレーヤ、DVDプレーヤ、CDプレーヤ、ハードディスクを用いたメディアプレーヤ、インターネットラジオ装置、パブリックエンターテイメント装置、MP3プレーヤ、ハイファイシステム、乗り物エンターテイメント装置、車両エンターテイメント装置、医療通信システム、装着式装置、音声通信装置、ホームシネマシステム、ホームシアターシステム、テレビジョン装置、臨場感発生装置、サブウーファー、及び音楽ホールシステムを含むグループの中の少なくとも1つとして実現される請求項1記載の装置。
  11. 音声データを処理する方法であって:
    20Hzと120Hzの間の周波数範囲の所定の周波数で発振する発振信号を生成する段階と;
    前記発振信号によって定まるサンプリング間隔で前記音声データの振幅値を検出することによって前記音声データのエンベロープを検出する段階と;
    前記検出されたエンベロープに前記発振信号をかけることにより音声信号を発生する段階と
    を有する方法。
  12. 音声データを処理するコンピュータプログラムが記憶されるコンピュータ読取可能な媒体であって、前記コンピュータプログラムは、プロセッサによって実行される場合に、請求項11記載の方法を実行又は制御するよう構成される、コンピュータ読取可能な媒体。
  13. 音声データを処理するプログラム要素であって、プロセッサによって実行される場合に、請求項11記載の方法を実行又制御するよう構成されるプログラム要素。
JP2009542306A 2006-12-21 2007-12-13 音声データを処理する装置及び方法 Expired - Fee Related JP5572391B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP06126741.5 2006-12-21
EP06126741 2006-12-21
PCT/IB2007/055078 WO2008078227A1 (en) 2006-12-21 2007-12-13 A device for and a method of processing audio data

Publications (2)

Publication Number Publication Date
JP2010513972A JP2010513972A (ja) 2010-04-30
JP5572391B2 true JP5572391B2 (ja) 2014-08-13

Family

ID=39430642

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009542306A Expired - Fee Related JP5572391B2 (ja) 2006-12-21 2007-12-13 音声データを処理する装置及び方法

Country Status (5)

Country Link
US (1) US8315399B2 (ja)
EP (1) EP2123108A1 (ja)
JP (1) JP5572391B2 (ja)
CN (1) CN101563938B (ja)
WO (1) WO2008078227A1 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090216352A1 (en) * 2008-02-22 2009-08-27 Sony Ericsson Mobile Communications Ab Method for providing an improved music experience
CN105355214A (zh) 2011-08-19 2016-02-24 杜比实验室特许公司 测量相似度的方法和设备
EP2923428B1 (en) 2012-11-12 2023-08-30 Auckland UniServices Limited Vehicle or moving object detection
CN109742094B (zh) * 2013-07-04 2024-05-31 株式会社尼康 摄像元件以及电子设备
JP6338425B2 (ja) * 2014-04-04 2018-06-06 クラリオン株式会社 振動音響装置、振動音響出力方法および振動音響プログラム
US10856068B2 (en) * 2015-09-16 2020-12-01 Apple Inc. Earbuds
US10726855B2 (en) 2017-03-15 2020-07-28 Guardian Glass, Llc. Speech privacy system and/or associated method
US20180268840A1 (en) * 2017-03-15 2018-09-20 Guardian Glass, LLC Speech privacy system and/or associated method
EP3442129B1 (en) * 2017-08-11 2020-06-03 Samsung Electronics Co., Ltd. Receiver and reception method based on pulse
KR102370285B1 (ko) * 2017-08-11 2022-03-07 삼성전자주식회사 펄스를 이용한 수신기 및 수신 방법
CN109639396B (zh) * 2018-12-19 2021-03-16 惠科股份有限公司 数据的传输方法、装置及计算机可读存储介质
US11363376B2 (en) * 2019-09-19 2022-06-14 Maxim Integrated Products, Inc. Acoustic approximation for determining excursion limits in speakers
CN111988700B (zh) * 2020-06-30 2022-03-25 联想(北京)有限公司 一种电子设备和固定音频输出设备的方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4028627A (en) * 1975-12-29 1977-06-07 Motorola, Inc. Sample and hold valley detector
JPS5443012A (en) * 1977-09-12 1979-04-05 Nippon Gakki Seizo Kk Amplitude envelope detector of signal waves
US4398061A (en) * 1981-09-22 1983-08-09 Thomson-Csf Broadcast, Inc. Audio processing apparatus and method
JPS61193505A (ja) * 1985-02-22 1986-08-28 Keio Giken Kogyo Kk エンベロ−プ抽出回路
JP2719331B2 (ja) 1986-11-06 1998-02-25 カシオ計算機株式会社 エンベロープ抽出装置
JPH0937296A (ja) * 1995-07-14 1997-02-07 Victor Co Of Japan Ltd 記録再生装置、記録装置及び再生装置
US5672999A (en) * 1996-01-16 1997-09-30 Motorola, Inc. Audio amplifier clipping avoidance method and apparatus
TW343417B (en) 1996-05-08 1998-10-21 Philips Eloctronics N V Circuit, audio system and method for processing signals, and a harmonics generator
US20050120870A1 (en) * 1998-05-15 2005-06-09 Ludwig Lester F. Envelope-controlled dynamic layering of audio signal processing and synthesis for music applications
US5978488A (en) * 1998-09-03 1999-11-02 Margolin; Jed Simulated AM radio
JP4538704B2 (ja) 2000-08-02 2010-09-08 ソニー株式会社 ディジタル信号処理方法及びディジタル信号処理装置並びにプログラム格納媒体
US20060104451A1 (en) * 2003-08-07 2006-05-18 Tymphany Corporation Audio reproduction system
EP1665875A1 (en) * 2003-09-16 2006-06-07 Koninklijke Philips Electronics N.V. High efficiency audio reproduction
KR20060121121A (ko) 2003-12-01 2006-11-28 코닌클리케 필립스 일렉트로닉스 엔.브이. 선택적 오디오 신호 강화
US7640139B2 (en) 2004-10-18 2009-12-29 Nsk Ltd. Abnormality diagnosing system for mechanical equipment
JP4382626B2 (ja) * 2004-10-20 2009-12-16 Necエンジニアリング株式会社 音声信号レベル制御装置及びその方法
CN1609630A (zh) * 2004-10-21 2005-04-27 上海交通大学 提取混沌干扰下的谐波信号的方法
US20080226088A1 (en) * 2005-09-20 2008-09-18 Koninklijke Philips Electronics, N.V. Audio Transducer System

Also Published As

Publication number Publication date
WO2008078227A1 (en) 2008-07-03
US20090316912A1 (en) 2009-12-24
CN101563938B (zh) 2014-05-07
CN101563938A (zh) 2009-10-21
JP2010513972A (ja) 2010-04-30
EP2123108A1 (en) 2009-11-25
US8315399B2 (en) 2012-11-20

Similar Documents

Publication Publication Date Title
JP5572391B2 (ja) 音声データを処理する装置及び方法
JP4869352B2 (ja) 音声データストリームを処理する装置および方法
JP5627852B2 (ja) 振動源駆動信号の発生装置及び発生方法
JP3964459B2 (ja) ステレオ増強システム
JP4732807B2 (ja) オーディオ信号処理
KR100619066B1 (ko) 오디오 신호의 저음역 강화 방법 및 장치
EP1947903B1 (en) Bass enhancing apparatus and method
JP5917518B2 (ja) 知覚スペクトルアンバランス改善のための音声信号動的補正
US8386242B2 (en) Method, medium and apparatus enhancing a bass signal using an auditory property
JP2008103879A (ja) オーディオ再生装置
US20080267426A1 (en) Device for and a Method of Audio Data Processing
JP2007104046A (ja) 音響調整装置
JP5058844B2 (ja) 音声信号変換装置、音声信号変換方法、制御プログラム、および、コンピュータ読み取り可能な記録媒体
JP5202021B2 (ja) 音声信号変換装置、音声信号変換方法、制御プログラム、および、コンピュータ読み取り可能な記録媒体
JP6699280B2 (ja) 音響再生装置
JP2022535299A (ja) 個人用のヒアリングデバイスにおける適応サウンドイコライゼーションのためのシステムおよび方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101208

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120719

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120731

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121031

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130528

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130823

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130830

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140114

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140411

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140603

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140630

R150 Certificate of patent or registration of utility model

Ref document number: 5572391

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees