JP2008532353A - 第1の音声データを第2の音声データと混合するためのシステム及び方法、プログラム要素並びにコンピュータ読取可能な媒体 - Google Patents
第1の音声データを第2の音声データと混合するためのシステム及び方法、プログラム要素並びにコンピュータ読取可能な媒体 Download PDFInfo
- Publication number
- JP2008532353A JP2008532353A JP2007554707A JP2007554707A JP2008532353A JP 2008532353 A JP2008532353 A JP 2008532353A JP 2007554707 A JP2007554707 A JP 2007554707A JP 2007554707 A JP2007554707 A JP 2007554707A JP 2008532353 A JP2008532353 A JP 2008532353A
- Authority
- JP
- Japan
- Prior art keywords
- audio data
- transition
- component
- frequency range
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 23
- 230000007704 transition Effects 0.000 claims abstract description 182
- 238000004458 analytical method Methods 0.000 claims description 6
- 230000001965 increasing effect Effects 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 3
- 230000005012 migration Effects 0.000 claims description 3
- 238000013508 migration Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 19
- 230000001066 destructive effect Effects 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 230000000295 complement effect Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- CNQCVBJFEGMYDW-UHFFFAOYSA-N lawrencium atom Chemical compound [Lr] CNQCVBJFEGMYDW-UHFFFAOYSA-N 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000003111 delayed effect Effects 0.000 description 3
- 230000002708 enhancing effect Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 210000005069 ears Anatomy 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/102—Programmed access in sequence to addressed parts of tracks of operating record carriers
- G11B27/105—Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
- G11B27/038—Cross-faders therefor
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Stereophonic System (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
- Control Of Amplification And Gain Control (AREA)
Abstract
第1の音声データ201を第2の音声データ202と混合するシステム200であって、第1の音声データ201及び第2の音声データ202にフィルタをかけて、第1の周波数範囲にある第1の音声データの成分206と、第2の周波数範囲にある第1の音声のデータの成分207と、第1の周波数範囲にある第2の音声データの成分208と、第2の周波数範囲にある第2の音声データの成分209とを発生させるよう構成されるフィルタユニット203、並びに、第1の周波数範囲にある第1の音声データ及び第2の音声データの成分206,208の間の移行に関する移行特性が、第2の周波数範囲にある第1の音声データ及び第2の音声データの成分207,209の間の移行に関する移行特性とは別に決定されるように、第1の音声データ201と第2の音声データ202との間の移行プロファイルを決定するよう構成される決定ユニットを有する。
Description
本発明は、第1の音声データを第2の音声データと混合するためのシステムに関する。
本発明は、第1の音声データを第2の音声データと混合するための方法に関する。
更に、本発明は、プログラム要素に関する。
更に、本発明は、コンピュータ読取可能な媒体に関する。
電子エンターテイメント機器の分野で、多数の新しい用途が、現在市場において開発及び導入されている。オーディオプレーヤーが次々に異なる音声アイテムを再生する場合に、2つの連続するトラックの間には明らかに途切れのない移行を有することが望ましい。これは「混合(mixing)」と称される。「クロスフェード(cross−fade)」の間、1つのトラックから他のトラックへの移行の間に夫々のトラックを増幅することができる。自動システムでは、トラック間の途切れのない移行を提供するために、減退する(outgoing)トラックの振幅は、通常、増進する(incoming)トラックの振幅が増大するのと同じ割合で低減しうる。
ダイアグラム100は、図1を参照して記載され、第1の音声データを第2の音声データと混合するための従来のシステムに従うレベル相補移行方式を表す。
ダイアグラム100は、音声要素の再生時間がプロットされる横軸101を有する。異なる音声要素のゲインは、ダイアグラム100の縦軸102において0から1の間の任意の値で示される。図1は、第1の音声要素103から第2の音声要素104の間のレベル相補的な移行を示す。第1の部分105で、第1の音声要素103は高いゲインを有し、第2の音声要素104は低いゲインを有する。その後の移行部分106で、第1の音声要素103はフェードアウトされる。即ち、対応するゲインが減少する。一方、第2の音声要素104のゲインは移行部分106で増大する(フェードインされる)。第2の部分107で、移行は完了し、第2の音声要素104のみが再生され、一方、第1の音声要素103はもはや再生されない。
混合の間、減退する音声要素、即ち、歌曲103と、増進する音声要素、即ち、歌曲104が同時に再生される瞬間、即ち、移行部分106が存在する。図1で示される従来実施の状態で、ダイアグラム100に従うクロスフェーディング・プロファイルは導入される。クロスフェーディングは、如何なる瞬間でも、音声レベル全体がおおよそ一定なままであるように実行される(所謂「レベル相補移行(level−complementary transition)」)。しかし、このアプローチは、低周波信号の位相に僅かな不均衡が存在する場合に、ベースラインが相殺され得るという欠点を有する。特に、これは、移行間隔106が比較的長い場合に問題となりうる。
米国特許US6,534,700(B2)は、2つの音楽トラックの混合の間に、結合出力ボリュームの変化が、夫々のトラックに備わる固有振幅又は出力振幅のいずれか一方を解析することによって、あるいは、混合相の間に固有振幅又は増幅のいずれか一方を変更することによって低減されるところの自動音楽編集システムを開示する。混合の間の音楽衝突は、衝突の可能性を検出するよう同じ周波数の2つのトラックの固有振幅を解析することによって、更に、衝突が検出される場合に、関連する周波数のトラックの一方の出力振幅を低減することによって回避される。特に、音声信号は、各自の周波数通過帯域フィルタを夫々有する複数の並列信号処理チャネルを通されても良い。処理装置は、どの周波数範囲が一対のトラックに関してそれらの相互の移行期間に亘って支配的であるかに関して決定し得る。次いで、支配的な範囲は、2つのトラックの間の移行位相に亘って送電端出力(net output)ボリュームを均一にするために必要なデータを提供するために使用される。しかし、可聴アーティファクトが2つのトラックを結ぶ移行間隔で生じうることが、米国特許US6,534,700(B2)の欠点である。
米国特許US6,534,700(B2)
本発明は、次々に再生されるべき2つの音楽トラックの間の歪みのない滑らかな移行を達成することを目的とする。
上記目的を達成するために、第1の音声データを第2の音声データと混合するためのシステム及び方法、プログラム要素並びにコンピュータ読取可能な媒体は、独立請求項で定義されるような特徴を有する。
本発明の一実施例で、第1の音声データを第2の音声データと混合するためのシステムであって、前記第1の音声データ及び前記第2の音声データにフィルタをかけて、第1の周波数範囲にある前記第1の音声データの成分と、第2の周波数範囲にある前記第1の音声のデータの成分と、前記第1の周波数範囲にある前記第2の音声データの成分と、前記第2の周波数範囲にある前記第2の音声データの成分とを発生させるよう構成されるフィルタユニット、並びに、前記第1の周波数範囲にある前記第1の音声データの成分から前記第2の音声データの成分の間の移行に関する移行特性が、前記第2の周波数範囲にある前記第1の音声データの成分から前記第2の音声データの成分の間の移行に関する移行特性とは別に決定されるように、前記第1の音声データから前記第2の音声データの間の移行プロファイルを決定するよう構成される決定ユニットを有するシステムが提供される。
本発明の他の実施例で、第1の音声データを第2の音声データと混合するための方法であって、第1の周波数範囲にある前記第1の音声データの成分と、第2の周波数範囲にある前記第1の音声のデータの成分と、前記第1の周波数範囲にある前記第2の音声データの成分と、前記第2の周波数範囲にある前記第2の音声データの成分とを発生させるよう、前記第1の音声データ及び前記第2の音声データにフィルタをかけるステップ、並びに、前記第1の周波数範囲にある前記第1の音声データの成分から前記第2の音声データの成分の間の移行に関する移行特性が、前記第2の周波数範囲にある前記第1の音声データの成分から前記第2の音声データの成分の間の移行に関する移行特性とは別に決定されるように、前記第1の音声データから前記第2の音声データの間の移行プロファイルを決定するステップを有する方法が提供される。
更に、本発明の更なる他の実施例で、処理装置によって実行される場合に、上述された方法ステップに従って第1の音声データを第2の音声データと混合する方法を実行するよう構成されるプログラム要素が提供される。
本発明の更なる実施例で、処理装置によって実行される場合に、上述された方法ステップに従って第1の音声データを第2の音声データと混合する方法を実行するよう構成されるところのコンピュータプログラムが保存されるコンピュータ読取可能な媒体が提供される。
本発明に従う第1の音声データと第2の音声データとの混合は、コンピュータプログラムによって、即ち、ソフトウェアによって、あるいは、1又はそれ以上の特別の電子最適化回路によって、即ち、ハードウェアで、あるいは、ハイブリッド形式で、即ち、ソフトウェアコンポーネント及びハードウェアコンポーネントによって実現され得る。
特に、本発明に従う特徴的事項は、第1の音声要素から第2の音声要素への移行の特性又はパラメータを定める移行プロファイルが、異なる周波数サブバンドに関して別々に決定され得るという利点を有する。この方策を取ることによって、2つの連続する音声要素の間の滑らかな移行のために周波数固有のフレーム状態を考慮することが可能である。このとき、移行特性は異なる周波数値に関して異なっても良い。例えば、音声コンテンツの低周波成分(「低音(bass)成分」)は、高周波音声部(「高音域(treble)成分」)よりも移行の間の可聴アーティファクトを有する傾向がある。結果として、移行範囲の形状や長さなどを定める特性は、高音域成分に関してよりも低音成分に関して異なるよう選択されることが、音声コンテンツ再生の適切な品質のために有利となりうる。例えば、高音域成分に関してよりも低音成分に関して異なる方法でこの移行範囲における振幅及び/又は位相を調整することが有利となりうる。更に、音声成分の好ましくない相殺的干渉を回避するよう低音成分に関して比較的狭い移行範囲を選択することが有利となりうる。このとき、移行期間は、高音域成分に関してはより広くても良い(即ち、移行期間は、より長い継続時間を有しても良い。)。このことは、2つの音声抜粋の間のより滑らかな移行をもたらす。
本発明に従って、周波数均一制御音声混合が実行されても良い。音声処理において、用語「均一(化)(equalization)」は、音声コンテンツの周波数エンベロープを修正する処理に関する。2つの連続するトラックの間の音声移行の間の歪みのない滑らかな移行は、本発明に従って、特に、歌曲のような2つの連続した音声要素の間の周波数帯域依存の移行継続期間を調整することによって達成され得る。更に、異なる周波数帯域に関して同時ではあるが、同一ではない混合プロファイルを提供することが有利となりうる。両方のチャネルにおける低音成分の位相比較及び遅延調整は、好ましくない位相相殺を低減するために実施されても良い。位相相殺の回避は、移行範囲における改善された音声品質をもたらす。
本発明の実施例に従って、円滑な方法でサブバンド信号の位相及び振幅の両方を調整するための方法が提供される。振幅重複は、調整可能な又は所定の移行プロファイルに従って実行される。例えば、短い移行重複は低音成分に関して選択され、より長い重複は高音域成分に関して選択され得る。本発明に従うシステムは、特に、2つの歌曲の間で起こり得る位相不一致の補償の問題に対処することによって、可聴アーティファクトを低下させることができる。従って、混合プロファイルは、サブバンド領域で制御され得る。
自動ディスクジョッキー(オートDJ)の実施に際して、ビートの正確な配置は、歌曲間の滑らかな移行にとって重要である。歌曲の低周波成分の位相における僅かな不均衡は、深刻な邪魔な干渉をもたらしうる。本発明の実施例に従って、周波数均一化技術を用いて、系統だっており且つ制御された方法で別々に高周波成分及び低周波成分を混合することによって、このような好ましくない干渉の影響を最小限又は抑制する方法及びシステムが開示される。
本発明の態様に従って、高音域成分及び低音成分に関する同時ではあるが、同一ではない混合プロファイルが実行され得る。予想される位相関係に依存して、周波数依存の移行間隔が導入されても良い。長い移行が不可避又は好ましい場合に、位相相殺的付加の危険性を最小限とするように低音成分を適切に混合する方法が実行され得る。
本発明の態様に従って、減退する歌曲及び増進する歌曲の低周波信号の位相において僅かな不均衡が存在する場合に、移行間隔におけるベースラインの相殺的干渉を解消するメカニズムを実施するオートDJが提供される。
本発明に従って、オートDJ用途における移行動作のより良い制御が達成され得る。可聴アーティファクトが効果的に抑制されるように、位相相殺の最小限の可能性しか残されない。更に、必要ならば、移行間隔において好ましい音響効果を導入することが可能である。本発明の一態様に従って、2つの歌曲の間の滑らかな移行を生成する自動DJ機能が提供される。この機能において、歌曲の高音域成分及び低音成分は、複数の周波数帯域において同時に且つ/あるいは不均一に混合される。従って、複数の移行プロファイル混合か使用可能である。従って、本発明は、滑らかなクロスフェーディング・プロファイルを提供することができる。このクロスフェーディングは、如何なる瞬間でも、音声レベル全体が原則的に一定でありうるように実行され得る、あるいは実行され得ない(「レベル相補移行」)。しかし、移行プロファイルの調整は、異なる周波数成分に関して別々に実行され得る。このことは、低周波信号の位相における僅かな不均衡に起因するベースラインの相殺的付加が効果的に防がれるという利点を有する。これは、音声寄与の移行間隔及び/又は位相特性が、アーティファクトが抑制されるように調整され得るためである。
本発明の適用分野の例は、DVD/HDプレーヤー、携帯型/装用型製品、インターネットラジオ用途、公衆エンターテイメントセンターなどである。
特に、低音成分が好ましくない方法で相殺されることを効果的に回避するよう、低周波成分に関しては比較的短い重複を提供し、高周波成分に関して比較的長い重複を提供することは、本発明の適用範囲内で有利となりうる。このような相殺的干渉を防ぐことによって、重複領域における悪質な音響は回避される。
例えば、遅延又は前進は、混合されるべき音声寄与部の位相を調整することができる。本発明の際立った利点は、低音成分が高音域成分に比べて好ましくない相殺の傾向をより有しうることが認識されている点であり、従って、低音成分の最適化された調整は、結果として得られる音響の品質に強い影響を有する。
本発明の更に好ましい実施例は、以下、従属請求項を参照して記載される。
第1の音声データを第2の音声データと混合するためのシステムの好ましい実施例について記載する。これらの実施例は、また、第1の音声データと第2の音声データとを混合する方法、プログラム要素及びコンピュータ読取可能な媒体へ適用される。
このようなシステムの構造において、前記フィルタユニットは、前記第1の音声データ及び前記第2の音声データにフィルタをかけて、少なくとも1つの更なる周波数範囲にある前記第1の音声データの成分を発生させ、かつ、前記少なくとも1つの更なる周波数範囲にある前記第2の音声データの成分を発生させるよう構成され得る。前記決定ユニットは、前記第1の周波数範囲並びに前記第2の周波数範囲にある前記第1の音声データの成分から前記第2の音声データの成分の間の移行プロファイルに関する移行特性とは別に、前記少なくとも1つの更なる周波数範囲にある前記第1の音声データの成分から前記第2の音声データの成分の間の移行プロファイルに関する移行特性を決定するよう構成され得る。言い換えると、本発明は、2つの異なる周波数帯域(特に、高周波高音域範囲及び低周波低音範囲。)の区別に限定されず、3又はそれ以上の異なる周波数帯域、例えば、高周波帯域、中間周波数帯域及び低周波帯域を有して同様に実施され得る。これらの個々の成分のフィルタリングは、夫々の周波数範囲に関する各自の帯域通過フィルタを用いることによって実現され得る。移行プロファイルに関する移行特性に関して別々に区別されて扱われる周波数帯域の数が大きければ大きいほど、達成され得る混合方式及び音声品質はますますより良く改良される。
更に、最大で2つの周波数範囲を手動で制御することができる2つの手及び2つの耳を有するよう制限される人間ディスクジョッキーとは対照的に、3又はそれ以上の周波数範囲への拡張は自動的な方法でのみ実施され得る。従って、重複領域における3又はそれ以上の周波数成分の自動混合は、システムの柔軟性及び機能性を著しく改善する。
前記決定ユニットは、前記移行の前に、混合されたデータが前記第1の音声データを有し、前記移行の間に、混合されたデータが減少する前記第1の音声データの寄与部分及び増大する前記第2の音声データの寄与部分を有し、前記移行の後に、混同されたデータが前記第2の音声データを有するように、前記移行プロファイルを決定するよう構成され得る。言い換えると、本発明に従うシステムは、「クロスフェーディング」方式で実施されても良い。このとき、第1の音声抜粋の終わりに、夫々の振幅は引き続いて減少し、一方、同時に、後に続く第2の音声抜粋の振幅は引き続いて増大する。
前記決定ユニットは、前記移行の継続期間を定める時間間隔が前記第1の周波数範囲に関して前記第2の周波数範囲の場合よりも長くなるように、前記移行プロファイルを決定するよう構成され得る。混合されるべき第1の歌曲と第2の歌曲との間の重複の長さは、各周波数範囲に関して選択されても良い。特に、第1の周波数範囲が第2の周波数範囲よりも高い周波数を含む場合に、低周波成分に関して比較的短い移行間隔を有することが有利となりうる。この低周波成分は、高周波成分よりも相殺的干渉の危険性を有する傾向がある。その場合に、比較的短い低音移行継続期間は、比較的長い高音域移行継続期間と結合され得る。従って、同時に、滑らかな移行及びアーティファクトのない移行が達成され得る。
前記決定ユニットは、前記第1の周波数範囲に関する前記移行の継続時間を定める時間間隔の中心が原則的に前記第2の周波数範囲に関する前記移行の継続時間を定める時間間隔の中心と等しくなるように、前記移行プロファイルを決定するよう構成され得る。異なるサブバンドの移行窓の幅は異なるが、これらの移行範囲が共通の音声中心の周りに対称に配置されることは有利となりうる。このことは、混合された第1及び第2の音声データを聴いている聴取者によって経験される主観的な品質を改善する助けとなりうる。
前記決定ユニットは、更に、原則的に前記移行の間一定であるように前記混合された音声データの全体的な振幅を決定するよう構成され得る。言い換えると、重ね合わされる第1及び第2の音声抜粋の振幅が原則的に混合動作の間一定のままである場合に、このことは、混合された音声コンテンツを聴いている聴取者によって経験される主観的な品質を改善しうる。
前記決定ユニットは、前記第1の周波数範囲において及び前記第2の周波数範囲において同時に前記移行特性を決定するよう構成され得る。言い換えると、前記決定ユニットは、時間的な並列な方法で、混合されるべき音声データを処理することができる。
更に、当該システムは、前記第1の周波数範囲にある前記第1の音声データの成分及び前記第2の音声データの成分の位相関係、及び/又は、前記第2の周波数範囲にある前記第1の音声データの成分及び前記第2の音声データの成分の位相関係を解析するよう構成される位相解析ユニットを有しても良い。前記決定ユニットは、前記解析された位相関係を考慮しながら前記移行特性を決定するよう構成され得る。混合されるべき音声抜粋の異なる寄与部分の周波数固有の位相特性を考慮することによって、異なる成分は、可聴アーティファクトが抑制されるように前進又は遅延され得る。可聴アーティファクトは、このような成分の好ましくない相互作用、例えば、低音成分の相殺的干渉に起因する。移行範囲における振幅を制御するだけではなく、更に又は代替的に位相特性を制御することによって、混合音声抜粋の品質は改善される。
特に、決定音響は有意に増大しうる。前記決定ユニットは、前記第1の周波数範囲にある前記第1の音声データの成分及び前記第2の音声データの成分の位相相殺的干渉、及び/又は、前記第2の周波数範囲にある前記第1の音声データの成分及び前記第2の音声データの成分の位相相殺的干渉が、前記第1の周波数範囲及び/又は前記第2の周波数範囲にある前記第1の音声データ及び/又は前記第2の音声データを選択的に遅延又は前進させることによって前記移行の間は回避されるように、前記移行特性を決定するよう構成され得る。各周波数範囲で別個に混合されるべき寄与部分の位相関係を選択的に及び可調的に制御するよう夫々の遅延(又は前進)要素を含むことによって、好ましくない重複に起因するアーティファクトの危険は低減される。
当該システムは、前記決定される移行特性に基づいて前記第1の音声データを前記第2の音声データと混合するよう構成される混合ユニットを更に有しても良い。前記混合ユニットは、ラウドスピーカーやヘッドホンなどを介して出力され得る出力信号を生成するよう別々の周波数固有の寄与部分を足し合わせることができる。
前記決定ユニットは、更に、前記第2の周波数範囲にある前記第1の音声データの成分から前記第2の音声データの成分の間の移行に関する移行特性と比較して等しくない方法で、前記第1の周波数範囲にある前記第1の音声データの成分から前記第2の音声データの成分の間の移行に関する移行特性を決定するよう構成され得る。この実施例に従って、移行特性は、異なる周波数帯域に関して異なる。各周波数間隔における移行を決定する別個のパラメータ及び/又はパラメータ値が決定されても良い。従って、最適化のための自由度の数は増大し、このことは、移行特性の高感度の調整を可能にする。
前記第1の音声データの成分から前記第2の音声データの成分の間の移行に関する移行特性を決定するステップは、前記第1の周波数範囲及び/又は前記第2の周波数範囲にある前記第1の音声データ及び/又は前記第2の音声データの振幅特性及び/又は位相特性を決定するステップを含みうる。組み合わされたこれら2つのパラメータは、個々の用途のフレーム状態に適合可能な移行特性を正確に決定するのに適する。
本発明に従うシステムは、集積回路として、特に半導体集積回路として実現され得る。具体的に、当該システムは、シリコン技術で製造され得るモノリシックICとして実現され得る。
本発明に従うシステムは、自動ディスクジョッキー装置として、即ち、人間ユーザインターフェースを必要とせずに異なる音声抜粋を混合するディスクジョッキー装置として実現され得る。
本発明に従うシステムは、DVDプレーヤー、ハードディスクを用いるオーディオプレーヤー、携帯型オーディオプレーヤー、装用型オーディオプレーヤー、インターネットラジオ装置、公衆エンターテイメント装置及びMP3プレーヤーを含むグループのうちの少なくとも1つとして実現され得る。これらの用途分野は単に一例として与えられており、本発明に従うシステムは、他の用途に関しても実施され得る。
更に本発明は、純粋な音声データに関して記載されている。しかし、本発明に従って処理される音声データは、また、ビデオデータのような、音声データ及び視覚データの結合データを含んでも良い。例えば、視聴覚データを含む異なった連続する音楽ビデオは、本発明に従って、具体的に、移行部分における音響が第1のビデオアイテムから第2のビデオアイテムへと滑らかに変化するように、混合され得る。
本発明のこれら及び他の態様は、以下で記載される実施例を参照して説明され、明らかとなる。
以下、実施形態に関する限定されない例を参照して、本発明について更に詳細に記載する。
図面中の説明図は概要である。異なる図面で、同様の又は類似する要素は同じ参照番号によって表される。
本発明の実施例に従って第1の音声要素201を第2の音声要素202と混合するシステム200は、ここで図2を参照して記載される。
システム200は、第1のフィルタサブユニット204及び第2のフィルタサブユニット205を含むフィルタユニット203を有する。第1のフィルタサブユニット204は、第1の音声要素201にフィルタをかけて、閾値を下回る周波数を有する音声部分を含む第1の音声要素201の低周波成分206と、第1の音声要素201の少なくとも閾値にある周波数を有する音声部分を含む高周波成分207を発生させるよう構成される。第2のフィルタサブユニット205は、第2の音声要素202にフィルタをかけて、閾値を下回る周波数を有する音声部分を含む第2の音声要素202の低周波成分208と、第2の音声要素202の少なくとも閾値にある周波数を有する音声部分を含む高周波成分209を発生させるよう構成される。
更に、決定ユニット210が設けられる。決定ユニット210は、第1の決定サブユニット211及び第2の決定サブユニット212を含む。決定ユニット210は、第1の音声要素201から第2の音声要素202の間の移行プロファイル、即ち、第1の音声要素201の終わり及び第2の音声要素202の始まりにある移行の特性を決定するよう構成される。特に、第1の決定サブユニット211は、低周波範囲において第1の音声要素201の低周波要素206から第2の音声要素202の低周波要素208の間の移行に関する移行特性を決定する。この決定とは別に、第2の決定サブユニット212は、高周波範囲において第1の音声要素201の高周波成分207から第2の音声要素202の高周波要素209の間の移行に関する移行特性を決定する。言い換えると、第1の決定サブユニット211は、入力音声要素201,202の低音成分の移行を定めるパラメータを決定し、第2の決定サブユニット212は、音声要素201,202の高音域成分の滑らかな移行のためのパラメータを決定する。従って、第1の決定サブユニット211の出力は、ある低周波移行プロファイルに従って入力音声要素201の低周波成分206及び入力音声要素202の低周波成分208を混合することによって得られる低周波混合音声要素213であり、第2の決定サブユニット212の出力は、ある高周波移行プロファイルに従って入力音声要素201の高周波成分207及び入力音声要素202の高周波成分209を混合することによって得られる高周波混合音声要素214である。
低周波混合音声要素213及び高周波混合音声要素214は、混合ユニット215における入力である。混合ユニット215は異なる音声部分を結合するので、混合音声データ216が、ラウドスピーカーやヘッドホンなどによって出力される状態で混合ユニット215の出力部で供給される。混合ユニット215は、2つの異なる周波数範囲に関する決定された移行特性を基に、第1の音声要素201を第2の音声要素202と混合する。
ここで図3を参照して記載される第1のダイアグラム300及び第2のダイアグラム310は、音声データ混合のためのシステム200によって実行される混合を表す。
第1のダイアグラム300で、第2の音声要素202の高周波成分209と混合される第1の音声要素201の高周波要素207の再生に関する経時変化は、横座標301にプロットされる。高周波成分207は、周波数fH前後の範囲にある第1の音声要素201の周波数の寄与部分を含む。高周波成分209は、周波数fH前後の範囲にある第2の音声要素202の周波数の寄与部分を含む。ゲイン(即ち、音声部分207,209の振幅)は、第1のダイアグラム300の縦軸302において0から1の間で任意の単位によりプロットされる。高周波部分207は、また、減退する(outgoing)音声要素、即ち歌曲201に関する高音域プロファイルとして表され得る。語「減退(outgoing)」は、ある期間既に再生されており、フェードアウトされるようその振幅が滑らかに低減される音声要素を表す。語「増進(incoming)」は、次に再生される予定であって、フェードインされるようその振幅が滑らかに増大する音声要素を表す。高周波部分209は、また、増進する歌曲202に関する高音域プロファイルとして表され得る。
第1のダイアグラム300から明らかなように、原則的には第1の音声要素201しか再生されないところの第1の高音域部303が存在する。次の高音域移行部304で、減退する第1の音声要素201と増進する第2の音声要素202との重複が、高周波部分207,209に関して示される。この高音域部304で、第1の音声要素201の高周波成分207は、その強さが低減し、一方、同時に、第2の音声要素202の高周波成分209は、その強さが増大する。次の第2の高音域部305では、原則的には第2の音声要素202の高音域成分209しか再生されない。
第1のダイアグラム300と同様の方法で、第2のダイアグラム310は、第1及び第2の音声要素201,202の低周波成分206,208に関する複数の移行プロファイルを表す。低周波成分206は、周波数fL前後の範囲にある第1の音声要素201の周波数の寄与部分を含む。低周波成分208は、周波数fL前後の範囲にある第2の音声要素202の周波数の寄与部分を含む。横軸301は、3つの部分、即ち、第1の低音部311、低音移行部312及び第2の低音部313に分けられる。第1の低音部311では、第1の音声要素201の低周波成分206しか再生されない。即ち、第1の低音部311は、減退する歌曲201に関する低音プロファイルを表す。低音移行部312には、低音重複が存在する。即ち、第1の音声要素201の低周波成分206は、減少する振幅を有して再生され、一方、増進する歌曲202の低周波成分208の振幅は低音移行部312において増大する。第2の低音部313には、原則的に第2の音声要素202の低周波成分208から生ずる寄与部分しか存在しない。
図3から推測されるように、高周波成分207,209に関する移行特性(第1のダイアグラム300参照。)は、独立して、低周波成分206,208の移行特性(第2のダイアグラム310参照。)とは別に調整される。
図3の説明図は、何らかの3次元形式で、即ち、周波数軸330で、ダイアグラム300,310をプロットする。別々の移行範囲がfL及びfH前後の2つの周波数範囲に関してのみ図3ではプロットされるが、当然、移行プロファイルが別々に調整されるところの如何なる所望の数の周波数範囲までもこれを広げることは可能である。
移行期間304,312に実行される混合動作の間には、減退する歌曲201及び増進する歌曲202が同時に再生される瞬間が存在する。2つの続いて起こる混合トラック201,202の間にあるこのような移行期間304,312に関する時間間隔の通常の継続期間は、例えば、10から30秒程度である。本発明に従って、滑らかなクロスフェード・プロファイルが実現される。図3で明らかなように、歌曲201,202の高音域成分207,209及び低音成分206,208は、夫々が異なった時点に混合される。異なる時点に高音域成分207,209及び低音成分206,208を混合する人間ユーザ(例えば、人間ディスクジョッキー)は、同時に多くても2つの音及び2つの制御(限界「2つの耳、2つの手」。)に集中することができる。従って、人間ディスクジョッキーは、一度に多くても2つの信号を適切に混合することができる。これとは対照的に、図2及び図3で表されるシステム200に基づく自動ディスクジョッキーは、このような限界を欠点としない。図2及び図3で表されるような高周波と低周波との間(低音と高音域との間)の区別に加えて、高音域成分及び低音成分に関して、更に必要ならば、少なくとも1つの更なる周波数成分に関して、同時に且つ不均一にプロファイルを混合することがシステム200により可能である。従って、如何なる所望の数の周波数サブバンドも、混合特性が考えられる場合に、別々に扱われ得る。予想される位相関係に依存して、周波数依存の移行間隔304,312が導入されても良い。長い移行間隔304,312が不可避であるか、又は好ましい場合に、位相相殺的(phase−destructive)付加の危険性を低減又は最小限にするように低音成分を混合することが可能である。
本発明に従って、図3で示されるように、複数の周波数帯域における移行のプロファイルを別々に、しかし望ましくは同時に制御することが可能である。図3の簡単な例で、このことは、2つの周波数帯域の場合に関して、即ち、高音周波数帯域及び低音周波数帯域に関して表される。ベースラインの重複時間は低音成分に関して小さいので(低音移行部312の比較的狭い時間間隔を参照。)、位相相殺的混合の危険性は最小限である。しかし、高音域周波数はこのような相殺的混合を生ずる傾向がそれほどないので、高音域移行部304はより広くても良い。これは、一方の歌曲201から他方の歌曲202への滑らかな移行を可能にする。本発明に従って、概して、幾つかの周波数帯域依存の移行プロファイルを選択することが可能である。
本発明の第2の実施例に従う音声データ混合のためのシステム400は、ここで図4を参照して記載される。
音声データ混合のためのシステム400を参照すると、第1の音声要素201は第1のフィルタバンク401へ加えられ、第2の音声要素202は第2のフィルタバンク402へ加えられる。夫々のフィルタバンク401,402は、供給される音声要素201,202にフィルタをかけて、少なくとも低周波成分及び高周波成分を分ける。従って、第1の音声要素201に関するデータx[n]は、低周波成分xL[n]206及び高周波成分xH[n]207を生成するよう第1のフィルタバンク401によってフィルタ処理される。同様に、第2のフィルタバンク402は、第2の音声要素202に関するデータy[n]にフィルタをかけて、低周波成分yL[n]208及び高周波成分yH[n]209を発生させる。低周波成分206,208は、低周波混合器403の入力部で供給される。高周波成分207,209は、高周波混合器404の入力部で供給される。混合器403,404は、聴取者によって認知される主観的な音声品質が良好であるように第1の音声要素201から第2の音声要素202の間の移行が実行されるよう増進信号がどのように混合されるべきかに関して決定するマイクロプロセッサ405からコマンドを受け取る。低周波移行プロファイル213に対応する低周波信号zL[n]は、低周波混合器403の出力部で供給される。高周波移行プロファイル214に対応するデータzH[n]は、第2の混合器404の出力部で供給される。これらの信号zL[n]及びzH[n]は、異なる成分を合成する合成フィルタ406の入力部へ加えられて、合成フィルタ406の出力部で混合音声データ216を表す信号z[n]を発生させる。
やはり図4に示される実施例を参照すると、移行期間の間に、2つの同一の解析フィルタバンク401,402は、夫々、2つの入力信号x[n]及びy[n]を2つの相補的成分xL[n]及びxH[n]並びにyL[n]及びyH[n]に分解する。これらは、低周波(低音)成分及び高周波(高音域)成分であっても良い。その後、混合器403,404(MX1及びMX2とも表される。)は、2つの信号の対応する周波数成分を混合するために使用される。xL[n]及びyL[n]は低周波成分であり、xH[n]及びyH[n]は高周波成分であるとすると、MX1及びMX2の移行プロファイルは、図3で示されたものと同じようであり得る。従って、図4は、本発明の実施例に従う音声データ混合のためのシステムのフィルタバンクを用いた実施を示す。
次に、混合器403,404の出力zL[n]及びzH[n]は、出力混合信号z[n]を発生させるよう合成フィルタバンク406へ入力される。望ましくは、合成フィルタ406は、フィルタバンク401,402とともに完璧な再構成対を形成するように設計される。マイクロプロセッサ405からの入力は、2つの混合器403,404を制御し、望ましくは、混合の時及び重複の量に関する情報を伝達する。
本発明の第3の実施例に従う混合音声データのシステム500は、ここで図5を参照して記載される。
システム500は、第1の低域通過フィルタ501及び第1の高域通過フィルタ502が第1のフィルタバンク401に取って代わり、第2の低域通過フィルタ503及び第2の高域通過フィルタ504が第2のフィルタバンク402に取って代わる点で、システム400とは異なる。第1の低域通過フィルタ501は、第1の音声歌曲x[n]201の低周波成分xL[n]206を抽出する。第1の高域通過フィルタ502は、第1の音声要素x[n]201から高周波成分xH[n]207を抽出する。第2の低域通過フィルタ503は、第2の音声要素y[n]202から低周波成分yL[n]208を抽出する。第2の高域通過フィルタ504は、第2の音声要素y[n]202から高周波成分yH[n]209を抽出する。
更に、図5で示される実施例で、図4の合成フィルタ406は、混合器403,404の出力部で供給される成分zL[n]及びzH[n]を合算するための加算ユニット505によって置換される。図5で示される実施例は、一対の相補フィルタを有する。
図6は、横軸601に周波数がプロットされるところのダイアグラム600を示す。更に、強さは、縦軸602において任意の単位でプロットされる。図6は、低域通過フィルタ501,503の周波数応答を表す低域通過フィルタ周波数動作603を示す。図6は、また、高域通過フィルタ502,504の周波数応答を反映する高域通過フィルタ周波数動作604を示す。
低域通過フィルタ501,503及び高域通過フィルタ502,504は、和LPF+HPFが全帯域通過フィルタを形成するような動作を有するべきである。LPF及びHPFの周波数応答の例は図6に示される。
本発明に従って、夫々が各自の移行プロファイルを有する複数の周波数帯域は、必要ならばいくつでも選択可能である。更に、各周波数帯域における移行プロファイルは、ゼロ重複から極めて大きな重複まで独立に変化することができる。
本発明の第4の実施例に従う音声データ混合のためのシステムの一部700は、ここで図7を参照して記載される。
図7で示される音声データ混合のためのシステムの一部700は、相殺的干渉の危険性を低減又は最小限にするように、混合されるべき信号の低音成分の位相の制御に関する問題に対処する。この場合に関して、図4及び図5で示される混合器403は図7で示されるように実現され得る。
低周波成分xL[n]及びyL[n]の位相は、最初に位相解析ユニット701で比較される。比較器701の出力は、加算の間に如何なる位相不一致も最小限とするように、第1の遅延ユニット702及び第2の遅延ユニット703を制御する制御信号Cの基となる。従って、信号xL[n]は、第1の遅延ユニット702によって定められる特定の遅延(又は前進)だけ遅延し、次いで第1のゲインユニット704へ加えられる。信号yL[n]は、第2の遅延ユニット703を用いて遅延又は前進し、次いで第2のゲインユニット705によって増幅される。ゲインユニット704,705の出力は、信号zL[n]を発生させるよう加算ユニット706で足される。
従って、図7で示される回路は、位相差を補償し、位相補償された混合のための混合ユニット403(即ち、MX1。)の詳細を示す。
可聴アーティファクトを防ぐよう、遅延ユニット702,703の遅延Dx及びDyは、滑らかな方法で変更又は調整をされ得る。ゲインユニット704,705のゲインGx及びGyは、図3の第2のダイアグラム310で示されるものと同じようなクロスフェーディング・プロファイルを導入する。
本発明の実施例に従う自動ディスクジョッキー装置800は、ここで図8を参照して記載される。
自動ディスクジョッキー装置800は、本発明の一実施例に従う音声信号混合のためのシステムを有する。自動ディスクジョッキー装置800により、ある相似基準に基づいてコンテンツを分類し、滑らかでリズム的に一致した方法でそれらを再生することが可能である。後者の手順は、自動ディスクジョッキー又はオートDJと呼ばれる。本発明に従うシステムを使用するオートDJの機能は図8で示される。
最初に、歌曲データベースユニット801(例えば、ハードディスク又はDC若しくはDVD。)に保存されている歌曲は、代表パラメータを抽出するよう解析される。この解析は、自動ディスクジョッキー解析ユニット802で実行される。これらの代表パラメータは、とりわけ、イントロの終わり、アウトロの開始、フレーズ又は小節の境界、テンポ及びビートの配置(開始)、調和(Harmonic)符号などを含んでも良い。これらのパラメータは、オートDJパラメータとしても表され得るパラメータであって、オフラインで計算され、リンクしたデータベース、即ち、主要データベースユニット803(例えば、ハードディスクなど。)に保存され得る。
並列な経路で、ユーザ選択による再生リストが発生する。このとき、再生リスト発生器805がこの再生リストを発生させる。このような再生リストを考えると、所謂移行解析器及び再生リスト順序づけユニット804は、再生リスト内の歌曲に対応するオートDJパラメータを比較し、最適な再生順序を決定し、再生ユニット806(CDプレーヤーやDVDプレーヤーなど。)によって実行されるべきコマンドの組を発生させる。
最後に、プレーヤーは、どのように歌曲が混合されて再生されるべきかを指示するコマンドの列を実行しながら、データベースから出力演奏装置(例えば、ラウドスピーカー807。)に歌曲を配信する。再生ユニット806及びラウドスピーカー807によって再生されるべき2つの続いて起こる音声要素の間の移行は、本発明に従う周波数均一制御音声混合方式に従って、移行解析器及び再生順序づけユニット804で決定される。
[変形例]
留意すべきは、語「有する」及びその活用形の使用は、特許請求の範囲に挙げられた以外の要素又はステップの存在を除外するわけではなく、要素又はステップの前に置かれる語「1つの」の使用は、このような要素又はステップの複数個の存在を除外するわけではない。更に、異なる実施例で記載される要素は組み合わされても良い。
留意すべきは、語「有する」及びその活用形の使用は、特許請求の範囲に挙げられた以外の要素又はステップの存在を除外するわけではなく、要素又はステップの前に置かれる語「1つの」の使用は、このような要素又はステップの複数個の存在を除外するわけではない。更に、異なる実施例で記載される要素は組み合わされても良い。
また、留意すべきは、特許請求の範囲における参照符号は、特許請求の範囲の適用範囲を限定するよう解釈されるべきではない。
Claims (20)
- 第1の音声データを第2の音声データと混合するシステムであって,
前記第1の音声データ及び前記第2の音声データにフィルタをかけて、第1の周波数範囲にある前記第1の音声データの成分と、第2の周波数範囲にある前記第1の音声のデータの成分と、前記第1の周波数範囲にある前記第2の音声データの成分と、前記第2の周波数範囲にある前記第2の音声データの成分とを発生させるよう構成されるフィルタユニット;及び
前記第1の周波数範囲にある前記第1の音声データの成分から前記第2の音声データの成分の間の移行に関する移行特性が、前記第2の周波数範囲にある前記第1の音声データの成分から前記第2の音声データの成分の間の移行に関する移行特性とは別に決定されるように、前記第1の音声データから前記第2の音声データの間の移行プロファイルを決定するよう構成される決定ユニット;
を有するシステム。 - 前記フィルタユニットは、前記第1の音声データ及び前記第2の音声データにフィルタをかけて、少なくとも1つの更なる周波数範囲にある前記第1の音声データの成分を発生させ、かつ、前記少なくとも1つの更なる周波数範囲にある前記第2の音声データの成分を発生させるよう構成され、
前記決定ユニットは、前記第1の周波数範囲並びに前記第2の周波数範囲にある前記第1の音声データの成分から前記第2の音声データの成分の間の移行プロファイルに関する移行特性とは別に、前記少なくとも1つの更なる周波数範囲にある前記第1の音声データの成分から前記第2の音声データの成分の間の移行プロファイルに関する移行特性を決定するよう構成される、請求項1記載のシステム。 - 前記決定ユニットは、
前記移行の前に、混合されたデータが前記第1の音声データを有し、
前記移行の間に、混合されたデータが減少する前記第1の音声データの寄与部分及び増大する前記第2の音声データの寄与部分を有し、
前記移行の後に、混同されたデータが前記第2の音声データを有するように、
前記移行プロファイルを決定するよう構成される、請求項1記載のシステム。 - 前記決定ユニットは、前記移行の継続期間を定める時間間隔が前記第1の周波数範囲に関して前記第2の周波数範囲の場合よりも長くなるように、前記移行プロファイルを決定するよう構成される、請求項1記載のシステム。
- 前記第1の周波数範囲は、前記第2の周波数範囲よりも高い周波数を有する、請求項4記載のシステム。
- 前記決定ユニットは、前記第1の周波数範囲に関する前記移行の継続時間を定める時間間隔の中心が原則的に前記第2の周波数範囲に関する前記移行の継続時間を定める時間間隔の中心と等しくなるように、前記移行プロファイルを決定するよう構成される、請求項1記載のシステム。
- 前記決定ユニットは、原則的に前記移行の間一定であるように前記混合された音声データの全体的な振幅を決定するよう構成される、請求項1記載のシステム。
- 前記決定ユニットは、前記第1の周波数範囲において及び前記第2の周波数範囲において同時に前記移行特性を決定するよう構成される、請求項1記載のシステム。
- 前記第1の周波数範囲にある前記第1の音声データの成分及び前記第2の音声データの成分の位相関係、及び/又は、前記第2の周波数範囲にある前記第1の音声データの成分及び前記第2の音声データの成分の位相関係を解析するよう構成される位相解析ユニットを有し、
前記決定ユニットは、前記解析された位相関係を考慮しながら前記移行特性を決定するよう構成される、請求項1記載のシステム。 - 前記決定ユニットは、前記第1の周波数範囲にある前記第1の音声データの成分及び前記第2の音声データの成分の位相相殺的干渉、及び/又は、前記第2の周波数範囲にある前記第1の音声データの成分及び前記第2の音声データの成分の位相相殺的干渉が、前記移行の間は実質的に回避されるように、前記移行特性を決定するよう構成される、請求項9記載のシステム。
- 前記決定ユニットは、前記第1の周波数範囲にある前記第1の音声データの成分及び前記第2の音声データの成分の位相相殺的干渉、及び/又は、前記第2の周波数範囲にある前記第1の音声データの成分及び前記第2の音声データの成分の位相相殺的干渉が、前記第1の周波数範囲及び/又は前記第2の周波数範囲にある前記第1の音声データ及び/又は前記第2の音声データを選択的に遅延又は前進させることによって前記移行の間は回避されるように、前記移行特性を決定するよう構成される、請求項9記載のシステム。
- 前記決定される移行特性に基づいて前記第1の音声データを前記第2の音声データと混合するよう構成される混合ユニットを更に有する、請求項1記載のシステム。
- 前記決定ユニットは、前記第2の周波数範囲にある前記第1の音声データの成分から前記第2の音声データの成分の間の移行に関する移行特性と比較して等しくない方法で、前記第1の周波数範囲にある前記第1の音声データの成分から前記第2の音声データの成分の間の移行に関する移行特性を決定するよう構成される、請求項1記載のシステム。
- 前記第1の音声データの成分から前記第2の音声データの成分の間の移行に関する移行特性を決定するステップは、前記第1の周波数範囲及び/又は前記第2の周波数範囲にある前記第1の音声データ及び/又は前記第2の音声データの振幅特性及び/又は位相特性を決定する、請求項1記載のシステム。
- 集積回路として実現される、請求項1記載のシステム。
- 自動ディスクジョッキー装置として実現される、請求項1記載のシステム。
- DVDプレーヤー、ハードディスクを用いるオーディオプレーヤー、携帯型オーディオプレーヤー、装用型オーディオプレーヤー、インターネットラジオ装置、公衆エンターテイメント装置及びMP3プレーヤーを含むグループのうちの少なくとも1つとして実現される、請求項1記載のシステム。
- 第1の音声データを第2の音声データと混合する方法であって,
第1の周波数範囲にある前記第1の音声データの成分と、第2の周波数範囲にある前記第1の音声のデータの成分と、前記第1の周波数範囲にある前記第2の音声データの成分と、前記第2の周波数範囲にある前記第2の音声データの成分とを発生させるよう、前記第1の音声データ及び前記第2の音声データにフィルタをかけるステップ;及び
前記第1の周波数範囲にある前記第1の音声データの成分から前記第2の音声データの成分の間の移行に関する移行特性が、前記第2の周波数範囲にある前記第1の音声データの成分から前記第2の音声データの成分の間の移行に関する移行特性とは別に決定されるように、前記第1の音声データから前記第2の音声データの間の移行プロファイルを決定するステップ;
を有する方法。 - 処理装置によって実行される場合に、第1の音声データを第2の音声データと混合する方法を実行するよう構成されるプログラム要素であって、
前記方法は,
第1の周波数範囲にある前記第1の音声データの成分と、第2の周波数範囲にある前記第1の音声のデータの成分と、前記第1の周波数範囲にある前記第2の音声データの成分と、前記第2の周波数範囲にある前記第2の音声データの成分とを発生させるよう、前記第1の音声データ及び前記第2の音声データにフィルタをかけるステップ;及び
前記第1の周波数範囲にある前記第1の音声データの成分から前記第2の音声データの成分の間の移行に関する移行特性が、前記第2の周波数範囲にある前記第1の音声データの成分から前記第2の音声データの成分の間の移行に関する移行特性とは別に決定されるように、前記第1の音声データから前記第2の音声データの間の移行プロファイルを決定するステップ;
を有するプログラム要素。 - 処理装置によって実行される場合に、第1の音声データを第2の音声データと混合する方法を実行するよう構成されるところのコンピュータプログラムが保存されるコンピュータ読取可能な媒体であって、
前記方法は,
第1の周波数範囲にある前記第1の音声データの成分と、第2の周波数範囲にある前記第1の音声のデータの成分と、前記第1の周波数範囲にある前記第2の音声データの成分と、前記第2の周波数範囲にある前記第2の音声データの成分とを発生させるよう、前記第1の音声データ及び前記第2の音声データにフィルタをかけるステップ;及び
前記第1の周波数範囲にある前記第1の音声データの成分から前記第2の音声データの成分の間の移行に関する移行特性が、前記第2の周波数範囲にある前記第1の音声データの成分から前記第2の音声データの成分の間の移行に関する移行特性とは別に決定されるように、前記第1の音声データから前記第2の音声データの間の移行プロファイルを決定するステップ;
を有するコンピュータ読取可能な媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP05101092 | 2005-02-14 | ||
PCT/IB2006/050392 WO2006085265A2 (en) | 2005-02-14 | 2006-02-07 | A system for and a method of mixing first audio data with second audio data, a program element and a computer-readable medium |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008532353A true JP2008532353A (ja) | 2008-08-14 |
Family
ID=36688142
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007554707A Pending JP2008532353A (ja) | 2005-02-14 | 2006-02-07 | 第1の音声データを第2の音声データと混合するためのシステム及び方法、プログラム要素並びにコンピュータ読取可能な媒体 |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP2008532353A (ja) |
CN (1) | CN101120412A (ja) |
WO (1) | WO2006085265A2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009521008A (ja) * | 2005-12-22 | 2009-05-28 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | コンテンツアイテムを混合するときに音の衝突を回避する電子装置及び方法 |
JP2013051589A (ja) * | 2011-08-31 | 2013-03-14 | Univ Of Electro-Communications | ミキシング装置、ミキシング信号処理装置、ミキシングプログラム及びミキシング方法 |
JP2016134706A (ja) * | 2015-01-19 | 2016-07-25 | 国立大学法人電気通信大学 | ミキシング装置、信号ミキシング方法、及びミキシングプログラム |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9596538B2 (en) * | 2014-12-12 | 2017-03-14 | Intel Corporation | Wearable audio mixing |
CN106157944B (zh) * | 2015-05-14 | 2019-11-05 | 仁宝电脑工业股份有限公司 | 节拍标记方法 |
DK179034B1 (en) * | 2016-06-12 | 2017-09-04 | Apple Inc | Devices, methods, and graphical user interfaces for dynamically adjusting presentation of audio outputs |
EP3783912B1 (en) * | 2018-04-17 | 2023-08-23 | The University of Electro-Communications | Mixing device, mixing method, and mixing program |
EP3783913A4 (en) | 2018-04-19 | 2021-06-16 | The University of Electro-Communications | MIXING DEVICE, MIXING PROCESS AND MIXING PROGRAM |
WO2019203127A1 (ja) | 2018-04-19 | 2019-10-24 | 国立大学法人電気通信大学 | 情報処理装置、これを用いたミキシング装置、及びレイテンシ減少方法 |
CN115795085A (zh) * | 2021-09-10 | 2023-03-14 | 安徽华米健康科技有限公司 | 基于可穿戴设备的音乐推荐方法、装置、设备及存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0158055A1 (de) * | 1984-03-06 | 1985-10-16 | WILLI STUDER AG Fabrik für elektronische Apparate | Verfahren zur Ueberblendung digitaler Audiosignale, sowie Vorrichtung zur Durchfahrung des Verfahrens |
GB9918502D0 (en) * | 1999-08-06 | 1999-10-06 | Carey Daniel | Apparatus |
GB2378626B (en) * | 2001-04-28 | 2003-11-19 | Hewlett Packard Co | Automated compilation of music |
-
2006
- 2006-02-07 JP JP2007554707A patent/JP2008532353A/ja active Pending
- 2006-02-07 CN CNA2006800048818A patent/CN101120412A/zh active Pending
- 2006-02-07 WO PCT/IB2006/050392 patent/WO2006085265A2/en active Application Filing
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009521008A (ja) * | 2005-12-22 | 2009-05-28 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | コンテンツアイテムを混合するときに音の衝突を回避する電子装置及び方法 |
JP2013051589A (ja) * | 2011-08-31 | 2013-03-14 | Univ Of Electro-Communications | ミキシング装置、ミキシング信号処理装置、ミキシングプログラム及びミキシング方法 |
JP2016134706A (ja) * | 2015-01-19 | 2016-07-25 | 国立大学法人電気通信大学 | ミキシング装置、信号ミキシング方法、及びミキシングプログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2006085265A3 (en) | 2006-10-26 |
CN101120412A (zh) | 2008-02-06 |
WO2006085265A2 (en) | 2006-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2008532353A (ja) | 第1の音声データを第2の音声データと混合するためのシステム及び方法、プログラム要素並びにコンピュータ読取可能な媒体 | |
JP4869352B2 (ja) | 音声データストリームを処理する装置および方法 | |
NL1032500C2 (nl) | Apparaat en werkwijze voor het opheffen van een vocale component in een audiosignaal. | |
US5420929A (en) | Signal processor for sound image enhancement | |
JP2522529B2 (ja) | 音響効果装置 | |
US8750538B2 (en) | Method for enhancing audio signals | |
RU2407142C2 (ru) | Система и способ обработки аудиосигнала для представления в среде с высоким уровнем шума | |
JP4327886B1 (ja) | 音質補正装置、音質補正方法及び音質補正用プログラム | |
EP2194733B1 (en) | Sound volume correcting device, sound volume correcting method, sound volume correcting program, and electronic apparatus. | |
JP2003511881A (ja) | 音響補正装置 | |
ATE439013T1 (de) | Verfahren und einrichtung zur effizienten binauralen raumklangerzeugung im transformierten bereich | |
JP2004056527A (ja) | 周波数特性調整装置および周波数特性調整方法 | |
JP4480335B2 (ja) | 複数チャンネル音声信号の処理回路、処理プログラム及び再生装置 | |
US20100189283A1 (en) | Tone emphasizing device, tone emphasizing method, tone emphasizing program, and recording medium | |
US20040002781A1 (en) | Methods and apparatuses for adjusting sonic balace in audio reproduction systems | |
JP5472258B2 (ja) | 音声信号処理装置 | |
JP2013007944A (ja) | 信号処理装置、信号処理方法、及び、プログラム | |
US9877134B2 (en) | Techniques for optimizing the fidelity of a remote recording | |
JP7028613B2 (ja) | オーディオプロセッサおよびオーディオ再生装置 | |
JP3786036B2 (ja) | 残響付与装置、残響付与方法、プログラムおよび記録媒体 | |
US7495166B2 (en) | Sound processing apparatus, sound processing method, sound processing program and recording medium which records sound processing program | |
JP2009194877A (ja) | 音声信号変換装置、音声信号変換方法、制御プログラム、および、コンピュータ読み取り可能な記録媒体 | |
JP5202021B2 (ja) | 音声信号変換装置、音声信号変換方法、制御プログラム、および、コンピュータ読み取り可能な記録媒体 | |
US20040131208A1 (en) | Sound enhancement system | |
JP4435452B2 (ja) | 信号処理装置、信号処理方法、プログラムおよび記録媒体 |