JP2008532353A

JP2008532353A - 第１の音声データを第２の音声データと混合するためのシステム及び方法、プログラム要素並びにコンピュータ読取可能な媒体

Info

Publication number: JP2008532353A
Application number: JP2007554707A
Authority: JP
Inventors: レマ，アウェケ; デケルクホフ，レオンファン
Original assignee: Koninklijke Philips NV; Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 2005-02-14
Filing date: 2006-02-07
Publication date: 2008-08-14
Also published as: WO2006085265A3; WO2006085265A2; CN101120412A

Abstract

第１の音声データ２０１を第２の音声データ２０２と混合するシステム２００であって、第１の音声データ２０１及び第２の音声データ２０２にフィルタをかけて、第１の周波数範囲にある第１の音声データの成分２０６と、第２の周波数範囲にある第１の音声のデータの成分２０７と、第１の周波数範囲にある第２の音声データの成分２０８と、第２の周波数範囲にある第２の音声データの成分２０９とを発生させるよう構成されるフィルタユニット２０３、並びに、第１の周波数範囲にある第１の音声データ及び第２の音声データの成分２０６，２０８の間の移行に関する移行特性が、第２の周波数範囲にある第１の音声データ及び第２の音声データの成分２０７，２０９の間の移行に関する移行特性とは別に決定されるように、第１の音声データ２０１と第２の音声データ２０２との間の移行プロファイルを決定するよう構成される決定ユニットを有する。

Description

本発明は、第１の音声データを第２の音声データと混合するためのシステムに関する。

本発明は、第１の音声データを第２の音声データと混合するための方法に関する。

更に、本発明は、プログラム要素に関する。

更に、本発明は、コンピュータ読取可能な媒体に関する。

電子エンターテイメント機器の分野で、多数の新しい用途が、現在市場において開発及び導入されている。オーディオプレーヤーが次々に異なる音声アイテムを再生する場合に、２つの連続するトラックの間には明らかに途切れのない移行を有することが望ましい。これは「混合（ｍｉｘｉｎｇ）」と称される。「クロスフェード（ｃｒｏｓｓ−ｆａｄｅ）」の間、１つのトラックから他のトラックへの移行の間に夫々のトラックを増幅することができる。自動システムでは、トラック間の途切れのない移行を提供するために、減退する（ｏｕｔｇｏｉｎｇ）トラックの振幅は、通常、増進する（ｉｎｃｏｍｉｎｇ）トラックの振幅が増大するのと同じ割合で低減しうる。

ダイアグラム１００は、図１を参照して記載され、第１の音声データを第２の音声データと混合するための従来のシステムに従うレベル相補移行方式を表す。

ダイアグラム１００は、音声要素の再生時間がプロットされる横軸１０１を有する。異なる音声要素のゲインは、ダイアグラム１００の縦軸１０２において０から１の間の任意の値で示される。図１は、第１の音声要素１０３から第２の音声要素１０４の間のレベル相補的な移行を示す。第１の部分１０５で、第１の音声要素１０３は高いゲインを有し、第２の音声要素１０４は低いゲインを有する。その後の移行部分１０６で、第１の音声要素１０３はフェードアウトされる。即ち、対応するゲインが減少する。一方、第２の音声要素１０４のゲインは移行部分１０６で増大する（フェードインされる）。第２の部分１０７で、移行は完了し、第２の音声要素１０４のみが再生され、一方、第１の音声要素１０３はもはや再生されない。

混合の間、減退する音声要素、即ち、歌曲１０３と、増進する音声要素、即ち、歌曲１０４が同時に再生される瞬間、即ち、移行部分１０６が存在する。図１で示される従来実施の状態で、ダイアグラム１００に従うクロスフェーディング・プロファイルは導入される。クロスフェーディングは、如何なる瞬間でも、音声レベル全体がおおよそ一定なままであるように実行される（所謂「レベル相補移行（ｌｅｖｅｌ−ｃｏｍｐｌｅｍｅｎｔａｒｙｔｒａｎｓｉｔｉｏｎ）」）。しかし、このアプローチは、低周波信号の位相に僅かな不均衡が存在する場合に、ベースラインが相殺され得るという欠点を有する。特に、これは、移行間隔１０６が比較的長い場合に問題となりうる。

米国特許ＵＳ６，５３４，７００（Ｂ２）は、２つの音楽トラックの混合の間に、結合出力ボリュームの変化が、夫々のトラックに備わる固有振幅又は出力振幅のいずれか一方を解析することによって、あるいは、混合相の間に固有振幅又は増幅のいずれか一方を変更することによって低減されるところの自動音楽編集システムを開示する。混合の間の音楽衝突は、衝突の可能性を検出するよう同じ周波数の２つのトラックの固有振幅を解析することによって、更に、衝突が検出される場合に、関連する周波数のトラックの一方の出力振幅を低減することによって回避される。特に、音声信号は、各自の周波数通過帯域フィルタを夫々有する複数の並列信号処理チャネルを通されても良い。処理装置は、どの周波数範囲が一対のトラックに関してそれらの相互の移行期間に亘って支配的であるかに関して決定し得る。次いで、支配的な範囲は、２つのトラックの間の移行位相に亘って送電端出力（ｎｅｔｏｕｔｐｕｔ）ボリュームを均一にするために必要なデータを提供するために使用される。しかし、可聴アーティファクトが２つのトラックを結ぶ移行間隔で生じうることが、米国特許ＵＳ６，５３４，７００（Ｂ２）の欠点である。
米国特許ＵＳ６，５３４，７００（Ｂ２）

本発明は、次々に再生されるべき２つの音楽トラックの間の歪みのない滑らかな移行を達成することを目的とする。

上記目的を達成するために、第１の音声データを第２の音声データと混合するためのシステム及び方法、プログラム要素並びにコンピュータ読取可能な媒体は、独立請求項で定義されるような特徴を有する。

本発明の一実施例で、第１の音声データを第２の音声データと混合するためのシステムであって、前記第１の音声データ及び前記第２の音声データにフィルタをかけて、第１の周波数範囲にある前記第１の音声データの成分と、第２の周波数範囲にある前記第１の音声のデータの成分と、前記第１の周波数範囲にある前記第２の音声データの成分と、前記第２の周波数範囲にある前記第２の音声データの成分とを発生させるよう構成されるフィルタユニット、並びに、前記第１の周波数範囲にある前記第１の音声データの成分から前記第２の音声データの成分の間の移行に関する移行特性が、前記第２の周波数範囲にある前記第１の音声データの成分から前記第２の音声データの成分の間の移行に関する移行特性とは別に決定されるように、前記第１の音声データから前記第２の音声データの間の移行プロファイルを決定するよう構成される決定ユニットを有するシステムが提供される。

本発明の他の実施例で、第１の音声データを第２の音声データと混合するための方法であって、第１の周波数範囲にある前記第１の音声データの成分と、第２の周波数範囲にある前記第１の音声のデータの成分と、前記第１の周波数範囲にある前記第２の音声データの成分と、前記第２の周波数範囲にある前記第２の音声データの成分とを発生させるよう、前記第１の音声データ及び前記第２の音声データにフィルタをかけるステップ、並びに、前記第１の周波数範囲にある前記第１の音声データの成分から前記第２の音声データの成分の間の移行に関する移行特性が、前記第２の周波数範囲にある前記第１の音声データの成分から前記第２の音声データの成分の間の移行に関する移行特性とは別に決定されるように、前記第１の音声データから前記第２の音声データの間の移行プロファイルを決定するステップを有する方法が提供される。

更に、本発明の更なる他の実施例で、処理装置によって実行される場合に、上述された方法ステップに従って第１の音声データを第２の音声データと混合する方法を実行するよう構成されるプログラム要素が提供される。

本発明の更なる実施例で、処理装置によって実行される場合に、上述された方法ステップに従って第１の音声データを第２の音声データと混合する方法を実行するよう構成されるところのコンピュータプログラムが保存されるコンピュータ読取可能な媒体が提供される。

本発明に従う第１の音声データと第２の音声データとの混合は、コンピュータプログラムによって、即ち、ソフトウェアによって、あるいは、１又はそれ以上の特別の電子最適化回路によって、即ち、ハードウェアで、あるいは、ハイブリッド形式で、即ち、ソフトウェアコンポーネント及びハードウェアコンポーネントによって実現され得る。

特に、本発明に従う特徴的事項は、第１の音声要素から第２の音声要素への移行の特性又はパラメータを定める移行プロファイルが、異なる周波数サブバンドに関して別々に決定され得るという利点を有する。この方策を取ることによって、２つの連続する音声要素の間の滑らかな移行のために周波数固有のフレーム状態を考慮することが可能である。このとき、移行特性は異なる周波数値に関して異なっても良い。例えば、音声コンテンツの低周波成分（「低音（ｂａｓｓ）成分」）は、高周波音声部（「高音域（ｔｒｅｂｌｅ）成分」）よりも移行の間の可聴アーティファクトを有する傾向がある。結果として、移行範囲の形状や長さなどを定める特性は、高音域成分に関してよりも低音成分に関して異なるよう選択されることが、音声コンテンツ再生の適切な品質のために有利となりうる。例えば、高音域成分に関してよりも低音成分に関して異なる方法でこの移行範囲における振幅及び／又は位相を調整することが有利となりうる。更に、音声成分の好ましくない相殺的干渉を回避するよう低音成分に関して比較的狭い移行範囲を選択することが有利となりうる。このとき、移行期間は、高音域成分に関してはより広くても良い（即ち、移行期間は、より長い継続時間を有しても良い。）。このことは、２つの音声抜粋の間のより滑らかな移行をもたらす。

本発明に従って、周波数均一制御音声混合が実行されても良い。音声処理において、用語「均一（化）（ｅｑｕａｌｉｚａｔｉｏｎ）」は、音声コンテンツの周波数エンベロープを修正する処理に関する。２つの連続するトラックの間の音声移行の間の歪みのない滑らかな移行は、本発明に従って、特に、歌曲のような２つの連続した音声要素の間の周波数帯域依存の移行継続期間を調整することによって達成され得る。更に、異なる周波数帯域に関して同時ではあるが、同一ではない混合プロファイルを提供することが有利となりうる。両方のチャネルにおける低音成分の位相比較及び遅延調整は、好ましくない位相相殺を低減するために実施されても良い。位相相殺の回避は、移行範囲における改善された音声品質をもたらす。

本発明の実施例に従って、円滑な方法でサブバンド信号の位相及び振幅の両方を調整するための方法が提供される。振幅重複は、調整可能な又は所定の移行プロファイルに従って実行される。例えば、短い移行重複は低音成分に関して選択され、より長い重複は高音域成分に関して選択され得る。本発明に従うシステムは、特に、２つの歌曲の間で起こり得る位相不一致の補償の問題に対処することによって、可聴アーティファクトを低下させることができる。従って、混合プロファイルは、サブバンド領域で制御され得る。

自動ディスクジョッキー（オートＤＪ）の実施に際して、ビートの正確な配置は、歌曲間の滑らかな移行にとって重要である。歌曲の低周波成分の位相における僅かな不均衡は、深刻な邪魔な干渉をもたらしうる。本発明の実施例に従って、周波数均一化技術を用いて、系統だっており且つ制御された方法で別々に高周波成分及び低周波成分を混合することによって、このような好ましくない干渉の影響を最小限又は抑制する方法及びシステムが開示される。

本発明の態様に従って、高音域成分及び低音成分に関する同時ではあるが、同一ではない混合プロファイルが実行され得る。予想される位相関係に依存して、周波数依存の移行間隔が導入されても良い。長い移行が不可避又は好ましい場合に、位相相殺的付加の危険性を最小限とするように低音成分を適切に混合する方法が実行され得る。

本発明の態様に従って、減退する歌曲及び増進する歌曲の低周波信号の位相において僅かな不均衡が存在する場合に、移行間隔におけるベースラインの相殺的干渉を解消するメカニズムを実施するオートＤＪが提供される。

本発明に従って、オートＤＪ用途における移行動作のより良い制御が達成され得る。可聴アーティファクトが効果的に抑制されるように、位相相殺の最小限の可能性しか残されない。更に、必要ならば、移行間隔において好ましい音響効果を導入することが可能である。本発明の一態様に従って、２つの歌曲の間の滑らかな移行を生成する自動ＤＪ機能が提供される。この機能において、歌曲の高音域成分及び低音成分は、複数の周波数帯域において同時に且つ／あるいは不均一に混合される。従って、複数の移行プロファイル混合か使用可能である。従って、本発明は、滑らかなクロスフェーディング・プロファイルを提供することができる。このクロスフェーディングは、如何なる瞬間でも、音声レベル全体が原則的に一定でありうるように実行され得る、あるいは実行され得ない（「レベル相補移行」）。しかし、移行プロファイルの調整は、異なる周波数成分に関して別々に実行され得る。このことは、低周波信号の位相における僅かな不均衡に起因するベースラインの相殺的付加が効果的に防がれるという利点を有する。これは、音声寄与の移行間隔及び／又は位相特性が、アーティファクトが抑制されるように調整され得るためである。

本発明の適用分野の例は、ＤＶＤ／ＨＤプレーヤー、携帯型／装用型製品、インターネットラジオ用途、公衆エンターテイメントセンターなどである。

特に、低音成分が好ましくない方法で相殺されることを効果的に回避するよう、低周波成分に関しては比較的短い重複を提供し、高周波成分に関して比較的長い重複を提供することは、本発明の適用範囲内で有利となりうる。このような相殺的干渉を防ぐことによって、重複領域における悪質な音響は回避される。

例えば、遅延又は前進は、混合されるべき音声寄与部の位相を調整することができる。本発明の際立った利点は、低音成分が高音域成分に比べて好ましくない相殺の傾向をより有しうることが認識されている点であり、従って、低音成分の最適化された調整は、結果として得られる音響の品質に強い影響を有する。

本発明の更に好ましい実施例は、以下、従属請求項を参照して記載される。

第１の音声データを第２の音声データと混合するためのシステムの好ましい実施例について記載する。これらの実施例は、また、第１の音声データと第２の音声データとを混合する方法、プログラム要素及びコンピュータ読取可能な媒体へ適用される。

このようなシステムの構造において、前記フィルタユニットは、前記第１の音声データ及び前記第２の音声データにフィルタをかけて、少なくとも１つの更なる周波数範囲にある前記第１の音声データの成分を発生させ、かつ、前記少なくとも１つの更なる周波数範囲にある前記第２の音声データの成分を発生させるよう構成され得る。前記決定ユニットは、前記第１の周波数範囲並びに前記第２の周波数範囲にある前記第１の音声データの成分から前記第２の音声データの成分の間の移行プロファイルに関する移行特性とは別に、前記少なくとも１つの更なる周波数範囲にある前記第１の音声データの成分から前記第２の音声データの成分の間の移行プロファイルに関する移行特性を決定するよう構成され得る。言い換えると、本発明は、２つの異なる周波数帯域（特に、高周波高音域範囲及び低周波低音範囲。）の区別に限定されず、３又はそれ以上の異なる周波数帯域、例えば、高周波帯域、中間周波数帯域及び低周波帯域を有して同様に実施され得る。これらの個々の成分のフィルタリングは、夫々の周波数範囲に関する各自の帯域通過フィルタを用いることによって実現され得る。移行プロファイルに関する移行特性に関して別々に区別されて扱われる周波数帯域の数が大きければ大きいほど、達成され得る混合方式及び音声品質はますますより良く改良される。

更に、最大で２つの周波数範囲を手動で制御することができる２つの手及び２つの耳を有するよう制限される人間ディスクジョッキーとは対照的に、３又はそれ以上の周波数範囲への拡張は自動的な方法でのみ実施され得る。従って、重複領域における３又はそれ以上の周波数成分の自動混合は、システムの柔軟性及び機能性を著しく改善する。

前記決定ユニットは、前記移行の前に、混合されたデータが前記第１の音声データを有し、前記移行の間に、混合されたデータが減少する前記第１の音声データの寄与部分及び増大する前記第２の音声データの寄与部分を有し、前記移行の後に、混同されたデータが前記第２の音声データを有するように、前記移行プロファイルを決定するよう構成され得る。言い換えると、本発明に従うシステムは、「クロスフェーディング」方式で実施されても良い。このとき、第１の音声抜粋の終わりに、夫々の振幅は引き続いて減少し、一方、同時に、後に続く第２の音声抜粋の振幅は引き続いて増大する。

前記決定ユニットは、前記移行の継続期間を定める時間間隔が前記第１の周波数範囲に関して前記第２の周波数範囲の場合よりも長くなるように、前記移行プロファイルを決定するよう構成され得る。混合されるべき第１の歌曲と第２の歌曲との間の重複の長さは、各周波数範囲に関して選択されても良い。特に、第１の周波数範囲が第２の周波数範囲よりも高い周波数を含む場合に、低周波成分に関して比較的短い移行間隔を有することが有利となりうる。この低周波成分は、高周波成分よりも相殺的干渉の危険性を有する傾向がある。その場合に、比較的短い低音移行継続期間は、比較的長い高音域移行継続期間と結合され得る。従って、同時に、滑らかな移行及びアーティファクトのない移行が達成され得る。

前記決定ユニットは、前記第１の周波数範囲に関する前記移行の継続時間を定める時間間隔の中心が原則的に前記第２の周波数範囲に関する前記移行の継続時間を定める時間間隔の中心と等しくなるように、前記移行プロファイルを決定するよう構成され得る。異なるサブバンドの移行窓の幅は異なるが、これらの移行範囲が共通の音声中心の周りに対称に配置されることは有利となりうる。このことは、混合された第１及び第２の音声データを聴いている聴取者によって経験される主観的な品質を改善する助けとなりうる。

前記決定ユニットは、更に、原則的に前記移行の間一定であるように前記混合された音声データの全体的な振幅を決定するよう構成され得る。言い換えると、重ね合わされる第１及び第２の音声抜粋の振幅が原則的に混合動作の間一定のままである場合に、このことは、混合された音声コンテンツを聴いている聴取者によって経験される主観的な品質を改善しうる。

前記決定ユニットは、前記第１の周波数範囲において及び前記第２の周波数範囲において同時に前記移行特性を決定するよう構成され得る。言い換えると、前記決定ユニットは、時間的な並列な方法で、混合されるべき音声データを処理することができる。

更に、当該システムは、前記第１の周波数範囲にある前記第１の音声データの成分及び前記第２の音声データの成分の位相関係、及び／又は、前記第２の周波数範囲にある前記第１の音声データの成分及び前記第２の音声データの成分の位相関係を解析するよう構成される位相解析ユニットを有しても良い。前記決定ユニットは、前記解析された位相関係を考慮しながら前記移行特性を決定するよう構成され得る。混合されるべき音声抜粋の異なる寄与部分の周波数固有の位相特性を考慮することによって、異なる成分は、可聴アーティファクトが抑制されるように前進又は遅延され得る。可聴アーティファクトは、このような成分の好ましくない相互作用、例えば、低音成分の相殺的干渉に起因する。移行範囲における振幅を制御するだけではなく、更に又は代替的に位相特性を制御することによって、混合音声抜粋の品質は改善される。

特に、決定音響は有意に増大しうる。前記決定ユニットは、前記第１の周波数範囲にある前記第１の音声データの成分及び前記第２の音声データの成分の位相相殺的干渉、及び／又は、前記第２の周波数範囲にある前記第１の音声データの成分及び前記第２の音声データの成分の位相相殺的干渉が、前記第１の周波数範囲及び／又は前記第２の周波数範囲にある前記第１の音声データ及び／又は前記第２の音声データを選択的に遅延又は前進させることによって前記移行の間は回避されるように、前記移行特性を決定するよう構成され得る。各周波数範囲で別個に混合されるべき寄与部分の位相関係を選択的に及び可調的に制御するよう夫々の遅延（又は前進）要素を含むことによって、好ましくない重複に起因するアーティファクトの危険は低減される。

当該システムは、前記決定される移行特性に基づいて前記第１の音声データを前記第２の音声データと混合するよう構成される混合ユニットを更に有しても良い。前記混合ユニットは、ラウドスピーカーやヘッドホンなどを介して出力され得る出力信号を生成するよう別々の周波数固有の寄与部分を足し合わせることができる。

前記決定ユニットは、更に、前記第２の周波数範囲にある前記第１の音声データの成分から前記第２の音声データの成分の間の移行に関する移行特性と比較して等しくない方法で、前記第１の周波数範囲にある前記第１の音声データの成分から前記第２の音声データの成分の間の移行に関する移行特性を決定するよう構成され得る。この実施例に従って、移行特性は、異なる周波数帯域に関して異なる。各周波数間隔における移行を決定する別個のパラメータ及び／又はパラメータ値が決定されても良い。従って、最適化のための自由度の数は増大し、このことは、移行特性の高感度の調整を可能にする。

前記第１の音声データの成分から前記第２の音声データの成分の間の移行に関する移行特性を決定するステップは、前記第１の周波数範囲及び／又は前記第２の周波数範囲にある前記第１の音声データ及び／又は前記第２の音声データの振幅特性及び／又は位相特性を決定するステップを含みうる。組み合わされたこれら２つのパラメータは、個々の用途のフレーム状態に適合可能な移行特性を正確に決定するのに適する。

本発明に従うシステムは、集積回路として、特に半導体集積回路として実現され得る。具体的に、当該システムは、シリコン技術で製造され得るモノリシックＩＣとして実現され得る。

本発明に従うシステムは、自動ディスクジョッキー装置として、即ち、人間ユーザインターフェースを必要とせずに異なる音声抜粋を混合するディスクジョッキー装置として実現され得る。

本発明に従うシステムは、ＤＶＤプレーヤー、ハードディスクを用いるオーディオプレーヤー、携帯型オーディオプレーヤー、装用型オーディオプレーヤー、インターネットラジオ装置、公衆エンターテイメント装置及びＭＰ３プレーヤーを含むグループのうちの少なくとも１つとして実現され得る。これらの用途分野は単に一例として与えられており、本発明に従うシステムは、他の用途に関しても実施され得る。

更に本発明は、純粋な音声データに関して記載されている。しかし、本発明に従って処理される音声データは、また、ビデオデータのような、音声データ及び視覚データの結合データを含んでも良い。例えば、視聴覚データを含む異なった連続する音楽ビデオは、本発明に従って、具体的に、移行部分における音響が第１のビデオアイテムから第２のビデオアイテムへと滑らかに変化するように、混合され得る。

本発明のこれら及び他の態様は、以下で記載される実施例を参照して説明され、明らかとなる。

以下、実施形態に関する限定されない例を参照して、本発明について更に詳細に記載する。

図面中の説明図は概要である。異なる図面で、同様の又は類似する要素は同じ参照番号によって表される。

本発明の実施例に従って第１の音声要素２０１を第２の音声要素２０２と混合するシステム２００は、ここで図２を参照して記載される。

システム２００は、第１のフィルタサブユニット２０４及び第２のフィルタサブユニット２０５を含むフィルタユニット２０３を有する。第１のフィルタサブユニット２０４は、第１の音声要素２０１にフィルタをかけて、閾値を下回る周波数を有する音声部分を含む第１の音声要素２０１の低周波成分２０６と、第１の音声要素２０１の少なくとも閾値にある周波数を有する音声部分を含む高周波成分２０７を発生させるよう構成される。第２のフィルタサブユニット２０５は、第２の音声要素２０２にフィルタをかけて、閾値を下回る周波数を有する音声部分を含む第２の音声要素２０２の低周波成分２０８と、第２の音声要素２０２の少なくとも閾値にある周波数を有する音声部分を含む高周波成分２０９を発生させるよう構成される。

更に、決定ユニット２１０が設けられる。決定ユニット２１０は、第１の決定サブユニット２１１及び第２の決定サブユニット２１２を含む。決定ユニット２１０は、第１の音声要素２０１から第２の音声要素２０２の間の移行プロファイル、即ち、第１の音声要素２０１の終わり及び第２の音声要素２０２の始まりにある移行の特性を決定するよう構成される。特に、第１の決定サブユニット２１１は、低周波範囲において第１の音声要素２０１の低周波要素２０６から第２の音声要素２０２の低周波要素２０８の間の移行に関する移行特性を決定する。この決定とは別に、第２の決定サブユニット２１２は、高周波範囲において第１の音声要素２０１の高周波成分２０７から第２の音声要素２０２の高周波要素２０９の間の移行に関する移行特性を決定する。言い換えると、第１の決定サブユニット２１１は、入力音声要素２０１，２０２の低音成分の移行を定めるパラメータを決定し、第２の決定サブユニット２１２は、音声要素２０１，２０２の高音域成分の滑らかな移行のためのパラメータを決定する。従って、第１の決定サブユニット２１１の出力は、ある低周波移行プロファイルに従って入力音声要素２０１の低周波成分２０６及び入力音声要素２０２の低周波成分２０８を混合することによって得られる低周波混合音声要素２１３であり、第２の決定サブユニット２１２の出力は、ある高周波移行プロファイルに従って入力音声要素２０１の高周波成分２０７及び入力音声要素２０２の高周波成分２０９を混合することによって得られる高周波混合音声要素２１４である。

低周波混合音声要素２１３及び高周波混合音声要素２１４は、混合ユニット２１５における入力である。混合ユニット２１５は異なる音声部分を結合するので、混合音声データ２１６が、ラウドスピーカーやヘッドホンなどによって出力される状態で混合ユニット２１５の出力部で供給される。混合ユニット２１５は、２つの異なる周波数範囲に関する決定された移行特性を基に、第１の音声要素２０１を第２の音声要素２０２と混合する。

ここで図３を参照して記載される第１のダイアグラム３００及び第２のダイアグラム３１０は、音声データ混合のためのシステム２００によって実行される混合を表す。

第１のダイアグラム３００で、第２の音声要素２０２の高周波成分２０９と混合される第１の音声要素２０１の高周波要素２０７の再生に関する経時変化は、横座標３０１にプロットされる。高周波成分２０７は、周波数ｆ_H前後の範囲にある第１の音声要素２０１の周波数の寄与部分を含む。高周波成分２０９は、周波数ｆ_H前後の範囲にある第２の音声要素２０２の周波数の寄与部分を含む。ゲイン（即ち、音声部分２０７，２０９の振幅）は、第１のダイアグラム３００の縦軸３０２において０から１の間で任意の単位によりプロットされる。高周波部分２０７は、また、減退する（ｏｕｔｇｏｉｎｇ）音声要素、即ち歌曲２０１に関する高音域プロファイルとして表され得る。語「減退（ｏｕｔｇｏｉｎｇ）」は、ある期間既に再生されており、フェードアウトされるようその振幅が滑らかに低減される音声要素を表す。語「増進（ｉｎｃｏｍｉｎｇ）」は、次に再生される予定であって、フェードインされるようその振幅が滑らかに増大する音声要素を表す。高周波部分２０９は、また、増進する歌曲２０２に関する高音域プロファイルとして表され得る。

第１のダイアグラム３００から明らかなように、原則的には第１の音声要素２０１しか再生されないところの第１の高音域部３０３が存在する。次の高音域移行部３０４で、減退する第１の音声要素２０１と増進する第２の音声要素２０２との重複が、高周波部分２０７，２０９に関して示される。この高音域部３０４で、第１の音声要素２０１の高周波成分２０７は、その強さが低減し、一方、同時に、第２の音声要素２０２の高周波成分２０９は、その強さが増大する。次の第２の高音域部３０５では、原則的には第２の音声要素２０２の高音域成分２０９しか再生されない。

第１のダイアグラム３００と同様の方法で、第２のダイアグラム３１０は、第１及び第２の音声要素２０１，２０２の低周波成分２０６，２０８に関する複数の移行プロファイルを表す。低周波成分２０６は、周波数ｆ_Ｌ前後の範囲にある第１の音声要素２０１の周波数の寄与部分を含む。低周波成分２０８は、周波数ｆ_Ｌ前後の範囲にある第２の音声要素２０２の周波数の寄与部分を含む。横軸３０１は、３つの部分、即ち、第１の低音部３１１、低音移行部３１２及び第２の低音部３１３に分けられる。第１の低音部３１１では、第１の音声要素２０１の低周波成分２０６しか再生されない。即ち、第１の低音部３１１は、減退する歌曲２０１に関する低音プロファイルを表す。低音移行部３１２には、低音重複が存在する。即ち、第１の音声要素２０１の低周波成分２０６は、減少する振幅を有して再生され、一方、増進する歌曲２０２の低周波成分２０８の振幅は低音移行部３１２において増大する。第２の低音部３１３には、原則的に第２の音声要素２０２の低周波成分２０８から生ずる寄与部分しか存在しない。

図３から推測されるように、高周波成分２０７，２０９に関する移行特性（第１のダイアグラム３００参照。）は、独立して、低周波成分２０６，２０８の移行特性（第２のダイアグラム３１０参照。）とは別に調整される。

図３の説明図は、何らかの３次元形式で、即ち、周波数軸３３０で、ダイアグラム３００，３１０をプロットする。別々の移行範囲がｆ_Ｌ及びｆ_H前後の２つの周波数範囲に関してのみ図３ではプロットされるが、当然、移行プロファイルが別々に調整されるところの如何なる所望の数の周波数範囲までもこれを広げることは可能である。

移行期間３０４，３１２に実行される混合動作の間には、減退する歌曲２０１及び増進する歌曲２０２が同時に再生される瞬間が存在する。２つの続いて起こる混合トラック２０１，２０２の間にあるこのような移行期間３０４，３１２に関する時間間隔の通常の継続期間は、例えば、１０から３０秒程度である。本発明に従って、滑らかなクロスフェード・プロファイルが実現される。図３で明らかなように、歌曲２０１，２０２の高音域成分２０７，２０９及び低音成分２０６，２０８は、夫々が異なった時点に混合される。異なる時点に高音域成分２０７，２０９及び低音成分２０６，２０８を混合する人間ユーザ（例えば、人間ディスクジョッキー）は、同時に多くても２つの音及び２つの制御（限界「２つの耳、２つの手」。）に集中することができる。従って、人間ディスクジョッキーは、一度に多くても２つの信号を適切に混合することができる。これとは対照的に、図２及び図３で表されるシステム２００に基づく自動ディスクジョッキーは、このような限界を欠点としない。図２及び図３で表されるような高周波と低周波との間（低音と高音域との間）の区別に加えて、高音域成分及び低音成分に関して、更に必要ならば、少なくとも１つの更なる周波数成分に関して、同時に且つ不均一にプロファイルを混合することがシステム２００により可能である。従って、如何なる所望の数の周波数サブバンドも、混合特性が考えられる場合に、別々に扱われ得る。予想される位相関係に依存して、周波数依存の移行間隔３０４，３１２が導入されても良い。長い移行間隔３０４，３１２が不可避であるか、又は好ましい場合に、位相相殺的（ｐｈａｓｅ−ｄｅｓｔｒｕｃｔｉｖｅ）付加の危険性を低減又は最小限にするように低音成分を混合することが可能である。

本発明に従って、図３で示されるように、複数の周波数帯域における移行のプロファイルを別々に、しかし望ましくは同時に制御することが可能である。図３の簡単な例で、このことは、２つの周波数帯域の場合に関して、即ち、高音周波数帯域及び低音周波数帯域に関して表される。ベースラインの重複時間は低音成分に関して小さいので（低音移行部３１２の比較的狭い時間間隔を参照。）、位相相殺的混合の危険性は最小限である。しかし、高音域周波数はこのような相殺的混合を生ずる傾向がそれほどないので、高音域移行部３０４はより広くても良い。これは、一方の歌曲２０１から他方の歌曲２０２への滑らかな移行を可能にする。本発明に従って、概して、幾つかの周波数帯域依存の移行プロファイルを選択することが可能である。

本発明の第２の実施例に従う音声データ混合のためのシステム４００は、ここで図４を参照して記載される。

音声データ混合のためのシステム４００を参照すると、第１の音声要素２０１は第１のフィルタバンク４０１へ加えられ、第２の音声要素２０２は第２のフィルタバンク４０２へ加えられる。夫々のフィルタバンク４０１，４０２は、供給される音声要素２０１，２０２にフィルタをかけて、少なくとも低周波成分及び高周波成分を分ける。従って、第１の音声要素２０１に関するデータｘ［ｎ］は、低周波成分ｘ_Ｌ［ｎ］２０６及び高周波成分ｘ_Ｈ［ｎ］２０７を生成するよう第１のフィルタバンク４０１によってフィルタ処理される。同様に、第２のフィルタバンク４０２は、第２の音声要素２０２に関するデータｙ［ｎ］にフィルタをかけて、低周波成分ｙ_Ｌ［ｎ］２０８及び高周波成分ｙ_Ｈ［ｎ］２０９を発生させる。低周波成分２０６，２０８は、低周波混合器４０３の入力部で供給される。高周波成分２０７，２０９は、高周波混合器４０４の入力部で供給される。混合器４０３，４０４は、聴取者によって認知される主観的な音声品質が良好であるように第１の音声要素２０１から第２の音声要素２０２の間の移行が実行されるよう増進信号がどのように混合されるべきかに関して決定するマイクロプロセッサ４０５からコマンドを受け取る。低周波移行プロファイル２１３に対応する低周波信号ｚ_Ｌ［ｎ］は、低周波混合器４０３の出力部で供給される。高周波移行プロファイル２１４に対応するデータｚ_Ｈ［ｎ］は、第２の混合器４０４の出力部で供給される。これらの信号ｚ_Ｌ［ｎ］及びｚ_Ｈ［ｎ］は、異なる成分を合成する合成フィルタ４０６の入力部へ加えられて、合成フィルタ４０６の出力部で混合音声データ２１６を表す信号ｚ［ｎ］を発生させる。

やはり図４に示される実施例を参照すると、移行期間の間に、２つの同一の解析フィルタバンク４０１，４０２は、夫々、２つの入力信号ｘ［ｎ］及びｙ［ｎ］を２つの相補的成分ｘ_Ｌ［ｎ］及びｘ_Ｈ［ｎ］並びにｙ_Ｌ［ｎ］及びｙ_Ｈ［ｎ］に分解する。これらは、低周波（低音）成分及び高周波（高音域）成分であっても良い。その後、混合器４０３，４０４（ＭＸ１及びＭＸ２とも表される。）は、２つの信号の対応する周波数成分を混合するために使用される。ｘ_Ｌ［ｎ］及びｙ_Ｌ［ｎ］は低周波成分であり、ｘ_Ｈ［ｎ］及びｙ_Ｈ［ｎ］は高周波成分であるとすると、ＭＸ１及びＭＸ２の移行プロファイルは、図３で示されたものと同じようであり得る。従って、図４は、本発明の実施例に従う音声データ混合のためのシステムのフィルタバンクを用いた実施を示す。

次に、混合器４０３，４０４の出力ｚ_Ｌ［ｎ］及びｚ_Ｈ［ｎ］は、出力混合信号ｚ［ｎ］を発生させるよう合成フィルタバンク４０６へ入力される。望ましくは、合成フィルタ４０６は、フィルタバンク４０１，４０２とともに完璧な再構成対を形成するように設計される。マイクロプロセッサ４０５からの入力は、２つの混合器４０３，４０４を制御し、望ましくは、混合の時及び重複の量に関する情報を伝達する。

本発明の第３の実施例に従う混合音声データのシステム５００は、ここで図５を参照して記載される。

システム５００は、第１の低域通過フィルタ５０１及び第１の高域通過フィルタ５０２が第１のフィルタバンク４０１に取って代わり、第２の低域通過フィルタ５０３及び第２の高域通過フィルタ５０４が第２のフィルタバンク４０２に取って代わる点で、システム４００とは異なる。第１の低域通過フィルタ５０１は、第１の音声歌曲ｘ［ｎ］２０１の低周波成分ｘ_Ｌ［ｎ］２０６を抽出する。第１の高域通過フィルタ５０２は、第１の音声要素ｘ［ｎ］２０１から高周波成分ｘ_Ｈ［ｎ］２０７を抽出する。第２の低域通過フィルタ５０３は、第２の音声要素ｙ［ｎ］２０２から低周波成分ｙ_Ｌ［ｎ］２０８を抽出する。第２の高域通過フィルタ５０４は、第２の音声要素ｙ［ｎ］２０２から高周波成分ｙ_Ｈ［ｎ］２０９を抽出する。

更に、図５で示される実施例で、図４の合成フィルタ４０６は、混合器４０３，４０４の出力部で供給される成分ｚ_Ｌ［ｎ］及びｚ_Ｈ［ｎ］を合算するための加算ユニット５０５によって置換される。図５で示される実施例は、一対の相補フィルタを有する。

図６は、横軸６０１に周波数がプロットされるところのダイアグラム６００を示す。更に、強さは、縦軸６０２において任意の単位でプロットされる。図６は、低域通過フィルタ５０１，５０３の周波数応答を表す低域通過フィルタ周波数動作６０３を示す。図６は、また、高域通過フィルタ５０２，５０４の周波数応答を反映する高域通過フィルタ周波数動作６０４を示す。

低域通過フィルタ５０１，５０３及び高域通過フィルタ５０２，５０４は、和ＬＰＦ＋ＨＰＦが全帯域通過フィルタを形成するような動作を有するべきである。ＬＰＦ及びＨＰＦの周波数応答の例は図６に示される。

本発明に従って、夫々が各自の移行プロファイルを有する複数の周波数帯域は、必要ならばいくつでも選択可能である。更に、各周波数帯域における移行プロファイルは、ゼロ重複から極めて大きな重複まで独立に変化することができる。

本発明の第４の実施例に従う音声データ混合のためのシステムの一部７００は、ここで図７を参照して記載される。

図７で示される音声データ混合のためのシステムの一部７００は、相殺的干渉の危険性を低減又は最小限にするように、混合されるべき信号の低音成分の位相の制御に関する問題に対処する。この場合に関して、図４及び図５で示される混合器４０３は図７で示されるように実現され得る。

低周波成分ｘ_Ｌ［ｎ］及びｙ_Ｌ［ｎ］の位相は、最初に位相解析ユニット７０１で比較される。比較器７０１の出力は、加算の間に如何なる位相不一致も最小限とするように、第１の遅延ユニット７０２及び第２の遅延ユニット７０３を制御する制御信号Ｃの基となる。従って、信号ｘ_Ｌ［ｎ］は、第１の遅延ユニット７０２によって定められる特定の遅延（又は前進）だけ遅延し、次いで第１のゲインユニット７０４へ加えられる。信号ｙ_Ｌ［ｎ］は、第２の遅延ユニット７０３を用いて遅延又は前進し、次いで第２のゲインユニット７０５によって増幅される。ゲインユニット７０４，７０５の出力は、信号ｚ_Ｌ［ｎ］を発生させるよう加算ユニット７０６で足される。

従って、図７で示される回路は、位相差を補償し、位相補償された混合のための混合ユニット４０３（即ち、ＭＸ１。）の詳細を示す。

可聴アーティファクトを防ぐよう、遅延ユニット７０２，７０３の遅延Ｄｘ及びＤｙは、滑らかな方法で変更又は調整をされ得る。ゲインユニット７０４，７０５のゲインＧｘ及びＧｙは、図３の第２のダイアグラム３１０で示されるものと同じようなクロスフェーディング・プロファイルを導入する。

本発明の実施例に従う自動ディスクジョッキー装置８００は、ここで図８を参照して記載される。

自動ディスクジョッキー装置８００は、本発明の一実施例に従う音声信号混合のためのシステムを有する。自動ディスクジョッキー装置８００により、ある相似基準に基づいてコンテンツを分類し、滑らかでリズム的に一致した方法でそれらを再生することが可能である。後者の手順は、自動ディスクジョッキー又はオートＤＪと呼ばれる。本発明に従うシステムを使用するオートＤＪの機能は図８で示される。

最初に、歌曲データベースユニット８０１（例えば、ハードディスク又はＤＣ若しくはＤＶＤ。）に保存されている歌曲は、代表パラメータを抽出するよう解析される。この解析は、自動ディスクジョッキー解析ユニット８０２で実行される。これらの代表パラメータは、とりわけ、イントロの終わり、アウトロの開始、フレーズ又は小節の境界、テンポ及びビートの配置（開始）、調和（Ｈａｒｍｏｎｉｃ）符号などを含んでも良い。これらのパラメータは、オートＤＪパラメータとしても表され得るパラメータであって、オフラインで計算され、リンクしたデータベース、即ち、主要データベースユニット８０３（例えば、ハードディスクなど。）に保存され得る。

並列な経路で、ユーザ選択による再生リストが発生する。このとき、再生リスト発生器８０５がこの再生リストを発生させる。このような再生リストを考えると、所謂移行解析器及び再生リスト順序づけユニット８０４は、再生リスト内の歌曲に対応するオートＤＪパラメータを比較し、最適な再生順序を決定し、再生ユニット８０６（ＣＤプレーヤーやＤＶＤプレーヤーなど。）によって実行されるべきコマンドの組を発生させる。

最後に、プレーヤーは、どのように歌曲が混合されて再生されるべきかを指示するコマンドの列を実行しながら、データベースから出力演奏装置（例えば、ラウドスピーカー８０７。）に歌曲を配信する。再生ユニット８０６及びラウドスピーカー８０７によって再生されるべき２つの続いて起こる音声要素の間の移行は、本発明に従う周波数均一制御音声混合方式に従って、移行解析器及び再生順序づけユニット８０４で決定される。

［変形例］
留意すべきは、語「有する」及びその活用形の使用は、特許請求の範囲に挙げられた以外の要素又はステップの存在を除外するわけではなく、要素又はステップの前に置かれる語「１つの」の使用は、このような要素又はステップの複数個の存在を除外するわけではない。更に、異なる実施例で記載される要素は組み合わされても良い。

また、留意すべきは、特許請求の範囲における参照符号は、特許請求の範囲の適用範囲を限定するよう解釈されるべきではない。

従来技術に従って第１の音声データを第２の音声データと混合するシステムに従うレベル補間移行を表す図を示す。本発明の第１の実施例に従って第１の音声データを第２の音声データと混合するシステムを表す。本発明の実施例に従う複数の移行プロファイル混合を表す図を示す。本発明の第２の実施例に従って第１の音声データを第２の音声データと混合するシステムを表す。本発明の第３の実施例に従って第１の音声データを第２の音声データと混合するシステムを表す。本発明に従って第１の音声データを第２の音声データと混合するシステムで実施される低域通過フィルタ及び高域通過フィルタの周波数動作を示す図を表す。本発明の第４の実施例に従って第１の音声データを第２の音声データと混合するシステムの一部を表す。本発明の実施例に従う自動ディスクジョッキー装置を表す。

Claims

第１の音声データを第２の音声データと混合するシステムであって，
前記第１の音声データ及び前記第２の音声データにフィルタをかけて、第１の周波数範囲にある前記第１の音声データの成分と、第２の周波数範囲にある前記第１の音声のデータの成分と、前記第１の周波数範囲にある前記第２の音声データの成分と、前記第２の周波数範囲にある前記第２の音声データの成分とを発生させるよう構成されるフィルタユニット；及び
前記第１の周波数範囲にある前記第１の音声データの成分から前記第２の音声データの成分の間の移行に関する移行特性が、前記第２の周波数範囲にある前記第１の音声データの成分から前記第２の音声データの成分の間の移行に関する移行特性とは別に決定されるように、前記第１の音声データから前記第２の音声データの間の移行プロファイルを決定するよう構成される決定ユニット；
を有するシステム。
前記フィルタユニットは、前記第１の音声データ及び前記第２の音声データにフィルタをかけて、少なくとも１つの更なる周波数範囲にある前記第１の音声データの成分を発生させ、かつ、前記少なくとも１つの更なる周波数範囲にある前記第２の音声データの成分を発生させるよう構成され、
前記決定ユニットは、前記第１の周波数範囲並びに前記第２の周波数範囲にある前記第１の音声データの成分から前記第２の音声データの成分の間の移行プロファイルに関する移行特性とは別に、前記少なくとも１つの更なる周波数範囲にある前記第１の音声データの成分から前記第２の音声データの成分の間の移行プロファイルに関する移行特性を決定するよう構成される、請求項１記載のシステム。
前記決定ユニットは、
前記移行の前に、混合されたデータが前記第１の音声データを有し、
前記移行の間に、混合されたデータが減少する前記第１の音声データの寄与部分及び増大する前記第２の音声データの寄与部分を有し、
前記移行の後に、混同されたデータが前記第２の音声データを有するように、
前記移行プロファイルを決定するよう構成される、請求項１記載のシステム。
前記決定ユニットは、前記移行の継続期間を定める時間間隔が前記第１の周波数範囲に関して前記第２の周波数範囲の場合よりも長くなるように、前記移行プロファイルを決定するよう構成される、請求項１記載のシステム。
前記第１の周波数範囲は、前記第２の周波数範囲よりも高い周波数を有する、請求項４記載のシステム。
前記決定ユニットは、前記第１の周波数範囲に関する前記移行の継続時間を定める時間間隔の中心が原則的に前記第２の周波数範囲に関する前記移行の継続時間を定める時間間隔の中心と等しくなるように、前記移行プロファイルを決定するよう構成される、請求項１記載のシステム。
前記決定ユニットは、原則的に前記移行の間一定であるように前記混合された音声データの全体的な振幅を決定するよう構成される、請求項１記載のシステム。
前記決定ユニットは、前記第１の周波数範囲において及び前記第２の周波数範囲において同時に前記移行特性を決定するよう構成される、請求項１記載のシステム。
前記第１の周波数範囲にある前記第１の音声データの成分及び前記第２の音声データの成分の位相関係、及び／又は、前記第２の周波数範囲にある前記第１の音声データの成分及び前記第２の音声データの成分の位相関係を解析するよう構成される位相解析ユニットを有し、
前記決定ユニットは、前記解析された位相関係を考慮しながら前記移行特性を決定するよう構成される、請求項１記載のシステム。
前記決定ユニットは、前記第１の周波数範囲にある前記第１の音声データの成分及び前記第２の音声データの成分の位相相殺的干渉、及び／又は、前記第２の周波数範囲にある前記第１の音声データの成分及び前記第２の音声データの成分の位相相殺的干渉が、前記移行の間は実質的に回避されるように、前記移行特性を決定するよう構成される、請求項９記載のシステム。
前記決定ユニットは、前記第１の周波数範囲にある前記第１の音声データの成分及び前記第２の音声データの成分の位相相殺的干渉、及び／又は、前記第２の周波数範囲にある前記第１の音声データの成分及び前記第２の音声データの成分の位相相殺的干渉が、前記第１の周波数範囲及び／又は前記第２の周波数範囲にある前記第１の音声データ及び／又は前記第２の音声データを選択的に遅延又は前進させることによって前記移行の間は回避されるように、前記移行特性を決定するよう構成される、請求項９記載のシステム。
前記決定される移行特性に基づいて前記第１の音声データを前記第２の音声データと混合するよう構成される混合ユニットを更に有する、請求項１記載のシステム。
前記決定ユニットは、前記第２の周波数範囲にある前記第１の音声データの成分から前記第２の音声データの成分の間の移行に関する移行特性と比較して等しくない方法で、前記第１の周波数範囲にある前記第１の音声データの成分から前記第２の音声データの成分の間の移行に関する移行特性を決定するよう構成される、請求項１記載のシステム。
前記第１の音声データの成分から前記第２の音声データの成分の間の移行に関する移行特性を決定するステップは、前記第１の周波数範囲及び／又は前記第２の周波数範囲にある前記第１の音声データ及び／又は前記第２の音声データの振幅特性及び／又は位相特性を決定する、請求項１記載のシステム。
集積回路として実現される、請求項１記載のシステム。
自動ディスクジョッキー装置として実現される、請求項１記載のシステム。
ＤＶＤプレーヤー、ハードディスクを用いるオーディオプレーヤー、携帯型オーディオプレーヤー、装用型オーディオプレーヤー、インターネットラジオ装置、公衆エンターテイメント装置及びＭＰ３プレーヤーを含むグループのうちの少なくとも１つとして実現される、請求項１記載のシステム。
第１の音声データを第２の音声データと混合する方法であって，
第１の周波数範囲にある前記第１の音声データの成分と、第２の周波数範囲にある前記第１の音声のデータの成分と、前記第１の周波数範囲にある前記第２の音声データの成分と、前記第２の周波数範囲にある前記第２の音声データの成分とを発生させるよう、前記第１の音声データ及び前記第２の音声データにフィルタをかけるステップ；及び
前記第１の周波数範囲にある前記第１の音声データの成分から前記第２の音声データの成分の間の移行に関する移行特性が、前記第２の周波数範囲にある前記第１の音声データの成分から前記第２の音声データの成分の間の移行に関する移行特性とは別に決定されるように、前記第１の音声データから前記第２の音声データの間の移行プロファイルを決定するステップ；
を有する方法。
処理装置によって実行される場合に、第１の音声データを第２の音声データと混合する方法を実行するよう構成されるプログラム要素であって、
前記方法は，
第１の周波数範囲にある前記第１の音声データの成分と、第２の周波数範囲にある前記第１の音声のデータの成分と、前記第１の周波数範囲にある前記第２の音声データの成分と、前記第２の周波数範囲にある前記第２の音声データの成分とを発生させるよう、前記第１の音声データ及び前記第２の音声データにフィルタをかけるステップ；及び
前記第１の周波数範囲にある前記第１の音声データの成分から前記第２の音声データの成分の間の移行に関する移行特性が、前記第２の周波数範囲にある前記第１の音声データの成分から前記第２の音声データの成分の間の移行に関する移行特性とは別に決定されるように、前記第１の音声データから前記第２の音声データの間の移行プロファイルを決定するステップ；
を有するプログラム要素。
処理装置によって実行される場合に、第１の音声データを第２の音声データと混合する方法を実行するよう構成されるところのコンピュータプログラムが保存されるコンピュータ読取可能な媒体であって、
前記方法は，
第１の周波数範囲にある前記第１の音声データの成分と、第２の周波数範囲にある前記第１の音声のデータの成分と、前記第１の周波数範囲にある前記第２の音声データの成分と、前記第２の周波数範囲にある前記第２の音声データの成分とを発生させるよう、前記第１の音声データ及び前記第２の音声データにフィルタをかけるステップ；及び
前記第１の周波数範囲にある前記第１の音声データの成分から前記第２の音声データの成分の間の移行に関する移行特性が、前記第２の周波数範囲にある前記第１の音声データの成分から前記第２の音声データの成分の間の移行に関する移行特性とは別に決定されるように、前記第１の音声データから前記第２の音声データの間の移行プロファイルを決定するステップ；
を有するコンピュータ読取可能な媒体。