JP4471086B2 - オーディオ再生装置、オーディオデータ配信サーバ、オーディオデータ配信システム、その方法及びプログラム - Google Patents

オーディオ再生装置、オーディオデータ配信サーバ、オーディオデータ配信システム、その方法及びプログラム Download PDF

Info

Publication number
JP4471086B2
JP4471086B2 JP2004006946A JP2004006946A JP4471086B2 JP 4471086 B2 JP4471086 B2 JP 4471086B2 JP 2004006946 A JP2004006946 A JP 2004006946A JP 2004006946 A JP2004006946 A JP 2004006946A JP 4471086 B2 JP4471086 B2 JP 4471086B2
Authority
JP
Japan
Prior art keywords
audio
signal
audio data
data
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004006946A
Other languages
English (en)
Other versions
JP2005202052A (ja
Inventor
伊藤  博紀
芹沢  昌宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2004006946A priority Critical patent/JP4471086B2/ja
Publication of JP2005202052A publication Critical patent/JP2005202052A/ja
Application granted granted Critical
Publication of JP4471086B2 publication Critical patent/JP4471086B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Stereophonic System (AREA)

Description

本発明は、無線又は有線を介してオーディオ信号を配信するオーディオ配信システム、オーディオ配信装置、オーディオ受信装置に関し、特に複数チャネルのオーディオ信号を伝送路の状態に応じてチャネル数を切り替えて配信を行なうオーディオ配信システム、オーディオ配信装置、オーディオ受信装置に関する。
オーディオを配信する方法として、ラジオのような無線やインターネットのような有線による方法が知られている。ここで、ラジオでは、電波が弱い場合、モノラル成分のみを受信して再生することにより、音質劣化を抑える技術が知られている。また、インターネット配信では、ステレオデータとモノラルデータ、又は、5.1チャネルデータと2チャンネルデータを伝送路の状態に応じて切り替えることにより、伝送路の輻輳を回避したり、パケット損失による音質劣化を抑える技術が知られている。
上記のようなステレオデータとモノラルデータを伝送路の状態に応じて切り替えて配信する場合、切替により主観音声品質が劣化する場合がある。この理由は、ステレオからモノラルに突然切り替わることにより、左右に広がっていた音像が突然真ん中に移動することによって、聞き手に違和感を生じさせるからである。同様に、5.1チャネルデータと2チャネルデータを突然切り替えることも聞き手に違和感を生じさせる。
聞き手に違和感や主観音声品質の劣化を感じさせること無く、オーディオデータのチャネル数を変更することが可能な技術が求められている。チャネル数の異なるオーディオデータを音像の移動が滑らかになるように切り替えて再生することができる技術が望まれている。
関連する技術として昭61−84933号公報にAMステレオ復調装置が開示されている。このAMステレオ復調装置は、基準信号発生手段と、リミッタ手段と、同期検波手段と、切り替え手段とを含む。基準信号発生手段は、AMステレオ信号中の互いに位相が直行する1対のキャリア成分に夫々位相同期した1対の基準信号を発生する。リミッタ手段は、AMステレオ信号の振幅変動成分を除去した信号を発生する。同期検波手段は、AMステレオ信号と1対の基準信号とを夫々乗算してステレオ復調信号を得る。切り替え手段は、1対の基準信号の非発生時に、同期検出手段の乗算入力の1つを1対の基準信号の代わりにリミッタ手段の出力に切り替える。更に、受信電界強度が低下して1対の基準信号が非発生となる以前に、電界強度に応じて1対の基準信号の位相を制御する位相制御手段を有する。
他の関連する技術として、特開平8−191498号公報に音場拡大装置が開示されている。この音場拡大装置は、モノラル音場拡大手段と、ステレオ音場拡大手段と、合成手段と、切替手段とを有する。モノラル音場拡大手段は、モノラルオーディオ信号の音場拡大を行う。ステレオ音場拡大手段は、ステレオオーディオ信号の音場拡大を行う。合成手段は、上記モノラル音場拡大手段とステレオ音場拡大手段の出力を合成して出力する。切替手段は、上記モノラル音場拡大手段の出力と上記ステレオ音場拡大手段の出力と上記合成手段の出力のうちいずれか一つを選択的に切り替える。上記切替手段は、入力された信号がモノラルからステレオに切り替わるときには、上記モノラル音場拡大手段の出力から上記合成手段の出力に切り替えた後上記ステレオ音場拡大手段へと順次切り替える。入力された信号がステレオからモノラルに切り替わるときには、上記ステレオ音場拡大手段の出力から上記合成手段の出力に切り替えた後上記モノラル音場拡大手段の出力へと順次切り替える。
更に他の関連する技術として特開2000−152396号公報に音声チャネル数変換方法及び装置が開示されている。この音声チャネル数変換方法は、少なくとも視聴者の前方に左右2チャンネルと後方に1チャンネルを有する多チャンネルステレオの音声信号(以下、原音声信号という)を、2チャンネルステレオ信号(以下、変換音声信号)に変換する音声チャンネル数変換方法である。原音声信号の左チャンネルの音声信号Lに、当該音声信号Lの位相と逆相の原音声信号の後方チャンネルの音声信号Sを加算して、変換音声信号の左チャンネルの音声信号Lsmとするステップと、原音声信号の右チャンネルの音声信号Rに、当該音声信号Rの位相と逆相の原音声信号の後方チャンネルの音声信号Sを加算して、変換音声信号の右チャンネルの音声信号Rsmとするステップとを備える。
昭61−84933号公報 特開平8−191498号公報 特開2000−152396号公報
従って、本発明の目的は、聞き手に違和感や主観音声品質の劣化を感じさせること無く、オーディオデータのチャネル数を変更することが可能なチャンネル数可変オーディオ配信システム、オーディオ配信装置、オーディオ受信装置を提供することにある。
また、本発明の他の目的は、チャネル数の異なるオーディオデータを音像の移動が滑らかになるように切り替えて再生することができるチャンネル数可変オーディオ配信システム、オーディオ配信装置、オーディオ受信装置を提供することにある。
以下に、発明を実施するための最良の形態で使用される番号・符号を用いて、課題を解決するための手段を説明する。これらの番号・符号は、特許請求の範囲の記載と発明を実施するための最良の形態との対応関係を明らかにするために括弧付きで付加されたものである。ただし、それらの番号・符号を、特許請求の範囲に記載されている発明の技術的範囲の解釈に用いてはならない。
従って、上記課題を解決するために、本発明のオーディオ再生装置(10/10a/10b/10c)は、データ復号部(24、25/84、85)と、混合部(27/87)とを具備する。データ復号部(24、25/84、85)は、オーディオデータを復号し、オーディオ信号を出力する。ただし、オーディオデータは、第1チャネル数を有する第1オーディオデータ及び第1チャネル数よりも小さい第2チャネル数を有する第2オーディオデータのいずれか一方を含む。オーディオ信号は、第1オーディオデータを復号した第1オーディオ信号及び第2オーディオデータを復号した第2オーディオ信号のうちのオーディオデータに対応したものを含む。混合部(27/87)は、オーディオ信号が第1オーディオ信号及び第2オーディオ信号のいずれか一方の信号から他方の信号へ切り替わるとき、一方の信号もしくは他方の信号における各チャネルの信号について比率を連続的に変化させながら混合した混合信号をオーディオ信号として出力する。
本発明により、チャネル数の異なるオーディオデータを音像の移動が滑らかになるように切り替えて再生することができ、聞き手に違和感や主観音声品質の劣化を感じさせること無く、オーディオデータのチャネル数を変更することが可能となる。ここで、例えば、第1オーディオデータは、2チャネル(ステレオ)や5.1チャネルのデータであり、対応する第2オーディオデータは、モノラルや2チャネル(ステレオ)のデータである。一方の信号と他方の信号との比率を連続的に変化させる場合、一定の割合で変化させなくても良く、例えば、最初と最後を緩やかに変化させ、途中を比較的急に変化させるようにすることも可能である。
上記のオーディオ再生装置において、混合部(27/87)は、オーディオ信号が第1オーディオ信号及び第2オーディオ信号のいずれか一方の信号から他方の信号へ切り替わるとき、第1オーディオ信号から第2チャネル数の擬似第2オーディオ信号を生成する。そして、第1オーディオ信号と擬似第2オーディオ信号との比率を連続的に変化させた混合信号として出力する。
上記のオーディオ再生装置において、混合部(27/87)は、遅延部(26/86)と、平滑部(27/87)とを備える。遅延部(26/86)は、第1オーディオ信号及び第2オーディオ信号を所定の時間だけ遅延させて、遅延第1オーディオ信号及び遅延第2オーディオ信号を出力する。平滑部(27/87)は、オーディオ信号が第1オーディオ信号及び第2オーディオ信号のいずれか一方の信号から他方の信号へ切り替わるとき、所定の時間の間、擬似第2オーディオ信号を生成し、第1オーディオ信号と擬似第2オーディオ信号との比率を連続的に変化させた混合信号として出力する。
上記のオーディオ再生装置において、オーディオデータにおける第1オーディオデータ及び第2オーディオデータのいずれか一方から他方への切替を検出する検出部(21)を更に具備する。検出部(21)は、混合部(27/87)へ切替のタイミングを通知する。混合部(27/87)は、切替のタイミングに会わせて、混合信号を出力する。
上記のオーディオ再生装置において、混合部(27/87)は、第1オーディオ信号及び第2オーディオ信号のいずれか一方の信号から他方の信号へ切り替わるとき、一方の信号と他方の信号との比率を連続的に変化させる時間の長さをオーディオ信号の性質に応じて変化させる。
上記のオーディオ再生装置において、オーディオ信号の性質は、オーディオ信号の各チャネルの信号同士の相関である。
従って、上記課題を解決するために、本発明のオーディオデータ配信サーバ(20/20a/20b/20c/20d)は、データ送信部(13/13a/13b/13c/13d/53)と、情報受信部(11)と、制御部(12)とを具備する。データ送信部(13/13a/13b/13c/13d/53)は、ネットワーク(3)を介してオーディオデータを配信先(20/20a/20b/20c)へ送信する。ただし、オーディオデータは、第1チャネル数を有する第1オーディオデータ及び第1チャネル数よりも小さい第2チャネル数を有する第2オーディオデータのいずれか一方を含む。情報受信部(11)は、ネットワーク(3)を介した配信先(20/20a/20b/20c)への送信の状態に関するデータを含む返信データを配信先(20/20a/20b/20c)から受信する。制御部(12)は、返信データに基づいて、第1オーディオデータ及び第2オーディオデータのいずれか一方をオーディオデータとして選択し、選択されたオーディオデータをデータ送信部(13/13a/13b/13c/13d/53)に送信させる。
上記のオーディオデータ配信サーバにおいて、第1オーディオデータを格納する第1オーディオデータベース(14/54)と、第2オーディオデータを格納する第2オーディオデータベース(15/55)とを更に具備する。
上記のオーディオデータ配信サーバにおいて、オーディオデータを受信するデータ受信部(16)を更に具備する。データ送信部(13d)は、オーディオデータを復号してオーディオ信号を取得する切替部(17)を備える。ここで、オーディオ信号は、第1オーディオデータを復号した第1オーディオ信号及び第2オーディオデータを復号した第2オーディオ信号のうちのオーディオデータに対応したものを含む。切替部(17)は、オーディオ信号が第1オーディオ信号及び第2オーディオ信号のいずれか一方の信号から他方の信号へ切り替わるとき、一方の信号もしくは他方の信号における各チャネルの信号について比率を連続的に変化させながら混合した混合信号をオーディオ信号とし、オーディオ信号を符号化して出力する。
従って、上記課題を解決するために、本発明のオーディオデータ配信システムは、サーバ(10/10a/10b/10c)と、オーディオ再生装置(20/20a/20b/20c)とを具備する。サーバ(10/10a/10b/10c)は、ネットワーク(3)を介してオーディオデータを配信する。ここで、オーディオデータは、第1チャネル数を有する第1オーディオデータ及び第1チャネル数よりも小さい第2チャネル数を有する第2オーディオデータのいずれか一方を含む。オーディオ再生装置(20/20a/20b/20c)は、ネットワーク(3)を介してオーディオデータを受信する上記のいずれか一項に記載されている。
上記のオーディオデータ配信システムにおいて、オーディオ再生装置(20/20a/20b/20c)は、オーディオデータの受信に基づいて、ネットワーク(3)の通信状態を示す返信データをサーバ(10/10a/10b/10c)へ送信する。サーバ(10/10a/10b/10c)は、上記のいずれか一項に記載のオーディオデータ配信サーバ(10/10a/10b/10c)である。
従って、上記課題を解決するために、本発明のオーディオ再生方法は、オーディオデータを復号して、オーディオ信号を出力するステップ(S25)と、オーディオ信号が第1オーディオ信号及び第2オーディオ信号のいずれか一方の信号から他方の信号へ切り替わるとき、一方の信号もしくは他方の信号における各チャネルの信号について比率を連続的に変化させながら混合した混合信号をオーディオ信号として出力するステップ(S27)と、オーディオ信号を再生するステップ(S28)とを具備する。ここで、オーディオデータは、第1チャネル数を有する第1オーディオデータ及び第1チャネル数よりも小さい第2チャネル数を有する第2オーディオデータのいずれか一方を含む。オーディオ信号は、第1オーディオデータを復号した第1オーディオ信号及び第2オーディオデータを復号した第2オーディオ信号のうちのオーディオデータに対応したものを含む。
上記のオーディオ再生方法において、混合信号を出力するステップは、第1オーディオ信号から第2チャネル数の擬似第2オーディオ信号を生成するステップと、第1オーディオ信号と擬似第2オーディオ信号との比率を連続的に変化させた混合信号として出力するステップとを備える。
上記のオーディオ再生方法において、擬似第2オーディオ信号を生成するステップは、第1オーディオ信号及び第2オーディオ信号を所定の時間だけ遅延させて、遅延第1オーディオ信号及び遅延第2オーディオ信号を出力するステップと、所定の時間の間、擬似第2オーディオ信号を生成するステップとを備える。
上記のオーディオ再生方法において、オーディオデータにおける第1オーディオデータ及び第2オーディオデータのいずれか一方から他方への切替を検出するステップを更に具備する。混合信号を出力するステップは、切替のタイミングに会わせて混合信号を出力する。
従って、上記課題を解決するために、本発明のオーディオデータ配信方法は、ネットワークを介してオーディオデータを配信先へ送信するステップ(S1〜2/S34〜35)と、ネットワークを介した配信先への送信の状態に関するデータを含む返信データを配信先から受信する(S6〜7/S39〜40)ステップと、返信データに基づいて、第1オーディオデータ及び第2オーディオデータのいずれか一方をオーディオデータとして選択するステップ(S8〜9/S41〜42)とを具備する。ここで、オーディオデータは、第1チャネル数を有する第1オーディオデータ及び第1チャネル数よりも小さい第2チャネル数を有する第2オーディオデータのいずれか一方を含む。オーディオデータを配信先へ送信するステップは、選択されたオーディオデータを送信する。
上記のオーディオデータ配信方法において、第1オーディオデータを第1オーディオデータベースから取得するステップと、第2オーディオデータを格納する第2オーディオデータベースから取得するステップとを更に具備する。
上記のオーディオデータ配信方法において、オーディオデータを外部からネットワークを介して受信するステップ(S31〜32)を更に具備する。オーディオデータを配信先へ送信するステップ(S34〜35)は、オーディオデータを復号してオーディオ信号を取得するステップ(S52)と、オーディオ信号が第1オーディオ信号及び第2オーディオ信号のいずれか一方の信号から他方の信号へ切り替わるとき、一方の信号もしくは他方の信号における各チャネルの信号について比率を連続的に変化させながら混合した混合信号をオーディオ信号として出力するステップ(S53)と、オーディオ信号及び混合信号を符号化するステップ(S54)とを備える。ここで、オーディオ信号は、第1オーディオデータを復号した第1オーディオ信号及び第2オーディオデータを復号した第2オーディオ信号のうちのオーディオデータに対応したものを含む。
従って、上記課題を解決するために、本発明のオーディオデータ送受信方法は、ネットワークを介してオーディオデータを配信先へ送信するステップと、ネットワークを介してオーディオデータを受信して、請求項1乃至6のいずれか一項に記載のオーディオ再生方法を実行するステップとを具備する。ここで、オーディオデータは、第1チャネル数を有する第1オーディオデータ及び第1チャネル数よりも小さい第2チャネル数を有する第2オーディオデータのいずれか一方を含む。
上記のオーディオデータ送受信方法において、オーディオデータの受信に基づいて、ネットワークの通信状態を示す返信データを、配信先から送信するステップと、返信データに基づいて、第1オーディオデータ及び第2オーディオデータのいずれか一方をオーディオデータとしてオーディオ再生装置へ配信するステップとを更に具備する。
従って、上記課題を解決するために、本発明のオーディオ再生方法をコンピュータに実行させるためのプログラムは、オーディオデータを復号して、オーディオ信号を出力するステップ(S25)と、オーディオ信号が第1オーディオ信号及び第2オーディオ信号のいずれか一方の信号から他方の信号へ切り替わるとき、一方の信号もしくは他方の信号における各チャネルの信号について比率を連続的に変化させながら混合した混合信号をオーディオ信号として出力するステップ(S27)と、オーディオ信号を再生するステップ(S28)とを具備する。ここで、オーディオデータは、第1チャネル数を有する第1オーディオデータ及び第1チャネル数よりも小さい第2チャネル数を有する第2オーディオデータのいずれか一方を含む。オーディオ信号は、第1オーディオデータを復号した第1オーディオ信号及び第2オーディオデータを復号した第2オーディオ信号のうちのオーディオデータに対応したものを含む。
上記のプログラムにおいて、混合信号を出力するステップは、第1オーディオ信号から第2チャネル数の擬似第2オーディオ信号を生成するステップと、第1オーディオ信号と擬似第2オーディオ信号との比率を連続的に変化させた混合信号として出力するステップとを備える。
上記のプログラムにおいて、擬似第2オーディオ信号を生成するステップは、第1オーディオ信号及び第2オーディオ信号を所定の時間だけ遅延させて、遅延第1オーディオ信号及び遅延第2オーディオ信号を出力するステップと、所定の時間の間、擬似第2オーディオ信号を生成するステップとを備える。
上記のプログラムにおいて、オーディオデータにおける第1オーディオデータ及び第2オーディオデータのいずれか一方から他方への切替を検出するステップを更に具備する。混合信号を出力するステップは、切替のタイミングに会わせて混合信号を出力する。
従って、上記課題を解決するために、本発明のオーディオデータ配信方法をコンピュータに実行させるためのプログラムは、ネットワークを介してオーディオデータを配信先へ送信するステップ(S1〜2/S34〜35)と、ネットワークを介した配信先への送信の状態に関するデータを含む返信データを配信先から受信する(S6〜7/S39〜40)ステップと、返信データに基づいて、第1オーディオデータ及び第2オーディオデータのいずれか一方をオーディオデータとして選択するステップ(S8〜9/S41〜42)とを具備する。ここで、オーディオデータは、第1チャネル数を有する第1オーディオデータ及び第1チャネル数よりも小さい第2チャネル数を有する第2オーディオデータのいずれか一方を含む。オーディオデータを配信先へ送信するステップは、選択されたオーディオデータを送信する。
上記のプログラムにおいて、第1オーディオデータを第1オーディオデータベースから取得するステップと、第2オーディオデータを格納する第2オーディオデータベースから取得するステップとを更に具備する。
上記のプログラムにおいて、オーディオデータを外部からネットワークを介して受信するステップ(S31〜32)を更に具備する。オーディオデータを配信先へ送信するステップ(S34〜35)は、オーディオデータを復号してオーディオ信号を取得するステップ(S52)と、オーディオ信号が第1オーディオ信号及び第2オーディオ信号のいずれか一方の信号から他方の信号へ切り替わるとき、一方の信号もしくは他方の信号における各チャネルの信号について比率を連続的に変化させながら混合した混合信号をオーディオ信号として出力するステップ(S53)と、オーディオ信号及び混合信号を符号化するステップ(S54)とを備える。ここで、オーディオ信号は、第1オーディオデータを復号した第1オーディオ信号及び第2オーディオデータを復号した第2オーディオ信号のうちのオーディオデータに対応したものを含む。
本発明により、チャネル数の異なるオーディオデータを音像の移動が滑らかになるように切り替えて再生することができる。そして、聞き手に違和感や主観音声品質の劣化を感じさせること無く、オーディオデータのチャネル数を変更することが可能となる。
以下、本発明のチャンネル数可変オーディオ配信システム、オーディオ配信装置、オーディオ受信装置の実施の形態に関して、添付図面を参照して説明する。
ここでは、インターネット網でオーディオデータを配信する方法であるIETF(Internet Engineering Task Force) RFC1889で規定されたリアルタイム通信プロトコルRTP(Real−time Tranport Protocol)を用いた例を説明する。その際、RFC1889で規定されているRTCP(RTP Control Protocol)パケットを用いてパケット損失率やラウンドトリップ時間(RTT)等の伝送路に関する情報を得ることもできる。ただし、本発明はその通信プロトコルに限定されるものではなく、データ配信に用いられる他の通信プロトコルを用いることも可能である。
(第1の実施の形態)
図1は、本発明のオーディオ配信システムの第1の実施の形態を示す構成図である。オーディオ配信システム1は、伝送路3を介して双方向通信可能に接続されたサーバ10とクライアント端末20とを具備する。
オーディオ配信装置としてのサーバ10は、ワークステーションに例示される情報処理装置である。伝送路3の状態に応じてオーディオデータをステレオ又はモノラルに切り替え、クライアント端末20へ配信する。伝送路3の状態は、データの配信時に使用可能な回線容量や回線の輻輳の状態に例示される。
オーディオ受信装置としてのクライアント端末20は、パーソナルコンピュータやPDA(Personal Digital Assistant)や携帯電話のような情報端末、ラジオのような受信機能付きのオーディオ機器に例示される。サーバ10から配信されたオーディオデータを受信して、オーディオデータに対応して、それをステレオ又はモノラルで再生する。
伝送路3は、無線や有線による通信において使用される回線(伝送路)であり、インターネットのような公衆回線に例示される。
サーバ10は、情報受信部11、送信制御部12、データ送信部13を備える。
データ送信部13は、IETF RFC1889で規定されたリアルタイム通信プロトコルRTPを用いて、オーディオデータの配信を行う。すなわち、オーディオデータ及び送信時刻等を格納したRTCP Sender Report(SR)パケットをクライアント端末20に送信する。ここで、オーディオデータには、RTPヘッダとしてパケットの送信順番を示す連続した番号であるシーケンス番号やオーディオを再生する時刻を示すタイムスタンプ等が付与されている。オーディオデータとしてステレオデータ及びモノラルデータのどちらを送信すべきかについては、送信制御部12により制御される。
データ送信部13は、ステレオデータを格納するステレオデータベース14とモノラルデータを格納するモノラルデータベース15とを含む。
情報受信部11は、クライアント端末20から送信されてくるRRパケット(後述)を受信する。そして、RRパケット受信時刻、及びRRパケットに格納されているパケット損失率、ジッタ、SRパケット送信時刻、DLSR(以上、後述)を送信制御部12に出力する。
送信制御部12は、RRパケット受信時刻、SRパケット送信時刻、及びDLSRを用いてRTTを計算する。さらに、パケット損失率、RTT、及びジッタのすべて、あるいは一部を用いて伝送路の輻輳を推定する。そして、ステレオデータ及びモノラルデータのどちらを送信すべきか判定し、判定結果に基づいてデータ送信部13を制御する。
クライアント端末20は、データ受信部21、情報取得部22、情報送信部23、ステレオ復号部25、モノラル復号部24、遅延部26、平滑切替部27、再生部28を備える
データ受信部21は、サーバ10からデータパケット又はSRパケットを受信する。そして、データパケット受信時刻、SRパケット受信時刻、RTPヘッダに付与されたシーケンス番号とタイムスタンプ、SRパケットに格納されているSRパケット送信時刻を情報取得部22に出力する。オーディオデータについては、ステレオデータを受信した場合、そのデータをステレオ復号部25に出力する。モノラルデータを受信した場合、そのデータをモノラル復号部24に入力する。
ステレオ復号部25は、ステレオデータを復号してステレオ信号(L信号及びR信号)を遅延部26に出力する。モノラル復号部24は、モノラルデータを復号してモノラル信号を遅延部26に出力する。
遅延部26は、入力された信号(入力信号)をT秒間分バッファリング(一時的に蓄積)した後、所定の出力信号を出力する。ここで、その出力信号がステレオ信号(L信号及びR信号)の場合、ステレオ信号に加えて、入力信号のステレオとモノラルとが切り替わってからの経過時間tを平滑切替部27に出力する。出力信号がモノラル信号の場合は、モノラル信号を再生部28に出力する。
平滑切替部27は、遅延部26からのステレオ信号(L信号及びR信号)と経過時間tとに基づいて、ステレオとモノラルがスムーズに切り替わるように変換(平滑化)されたステレオ信号(Lsm信号及びRsm信号)を出力する。
再生部28は、オーディオ信号を再生する音声の再生装置であり、スピーカに例示される。ステレオがモノラルに切り替わった場合、スムーズな切り替えが行われた平滑切替部27からのステレオ信号(Lsm信号及びRsm信号)を再生し、その後、連続的に遅延部26からのモノラル信号を再生する。モノラルがステレオに切り替わった場合、モノラル信号からスムーズな切り替えが行われた平滑切替部27からのステレオ信号(Lms信号及びRms信号)に切り替えて再生する。
情報取得部22は、シーケンス番号の欠損を調べることによりパケット損失率を計算する。データパケット受信時刻とタイムスタンプを用いてパケット到着遅延の揺らぎ(ジッタ)を計算する。そして、パケット損失率、ジッタ、SRパケット送信時刻、及びSRパケットを受信してからRRパケットを送信するまでの時間(DLSR)を情報伝送部23に出力する。
情報送信部23は、パケット損失率、ジッタ、SRパケット送信時刻、及びDLSRをRTCP Receiver Report(RR)パケットに格納し、RRパケットをサーバ10に送信する。
次に、平滑切替部27を詳細に説明する。図2は、平滑切替部27の構成を示すブロック図である。平滑切替部27は、ゲイン計算部31、加算部32、36、37、乗算部33、34、35を備える。
オーディオ信号がステレオからモノラルへ切り替わる場合について説明する。
ステレオからモノラルに切り替わってからt秒後のステレオ信号の左チャネルの信号(L信号)と右チャネルの信号(R信号)をそれぞれL(t)、R(t)とする。加算部32は、ステレオ信号であるL信号とR信号とに基づいて、それらのモノラル信号M(t)を次式で計算し、乗算部35へ出力する。
M(t)={L(t)+R(t)}/2 (1)
t≦Tの場合、各構成は以下のように動作する。
ゲイン計算部31は、経過時間tに基づいて、乗算部33、34の係数A={(T−t)/T}、及び、乗算部35の係数B=(t/T)を計算し、乗算部33、34、及び、乗算部35へ出力する。
乗算部33は、ステレオ信号であるL信号と係数Aとに基づいて、その乗算の結果{(T−t)/T}×L(t)を加算部36に出力する。
乗算部34は、ステレオ信号であるR信号と係数Aとに基づいて、その乗算の結果{(T−t)/T}×R(t)を加算部37に出力する。
乗算部35は、モノラル信号M(t)と係数Bとに基づいて、その乗算の結果(t/T)×M(t)を加算部36及び加算部37に出力する。
加算部36は、乗算部33の出力と乗算部35の出力とに基づいて、以下の式で平滑化後のL信号であるLsm(t)を計算し、再生部28へ出力する。
Lsm(t)={(T−t)/T}×L(t)+(t/T)×M(t) (2)
加算部37は、乗算部34の出力と乗算部35の出力とに基づいて、以下の式で平滑化後のR信号であるRsm(t)を計算し、再生部28へ出力する。
Rsm(t)={(T−t)/T}×R(t)+(t/T)×M(t) (3)
そして、再生部28は、t=Tで、平滑切替部27の出力であるステレオ信号(Lsm信号及びRsm信号)から遅延部26の出力であるモノラル信号に連続的に切り換えて、オーディオ信号を再生する。
t>Tの場合、ゲイン計算部31は、経過時間tに基づいて、乗算部33、34、35に与える係数をそれぞれ1、1、0とする。それにより、L信号とR信号をそのまま再生部28に出力する。
上述のような式(2)〜(3)による変換により、ステレオ信号からモノラル信号へ移行する際、経過時間tに応じてL(t)及びR(t)とM(t)とが平滑化されたLsm(t)及びRsm(t)を得ることができる。すなわち、チャネル数の異なるオーディオデータを音像の移動が滑らかになるように切り替えて再生することが可能となる。
オーディオ信号がモノラルからステレオへ切り替わる場合について説明する。
ここで、モノラルからステレオに切り替わってからt秒後のステレオ信号の左チャネルの信号(L信号)と右チャネルの信号(R信号)をそれぞれL(t)、R(t)とする。加算部32は、ステレオ信号であるL信号とR信号とに基づいて、それらのモノラル信号M(t)を次式で計算し、乗算部35へ出力する。
M(t)={L(t)+R(t)}/2 (1)
ゲイン計算部31は、経過時間tに基づいて、乗算部33、34の係数A=(t/T)、及び、乗算部35の係数B={(T−t)/T}を計算し、乗算部33、34、及び、乗算部35へ出力する。
乗算部33は、ステレオ信号であるL信号と係数Aとに基づいて、その乗算の結果(t/T)×L(t)を加算部36に出力する。
乗算部34は、ステレオ信号であるR信号と係数Aとに基づいて、その乗算の結果(t/T)×R(t)を加算部37に出力する。
乗算部35は、モノラル信号M(t)と係数Bとに基づいて、その乗算の結果{(T−t)/T}×M(t)を加算部36及び加算部37に出力する。
加算部36は、乗算部33の出力と乗算部35の出力とに基づいて、以下の式で平滑化後のL信号であるLms(t)を計算し、再生部28へ出力する。
Lms(t)=(t/T)×L(t)+{(T−t)/T}×M(t) (4)
加算部37は、乗算部34の出力と乗算部35の出力とに基づいて、以下の式で平滑化後のR信号であるRms(t)を計算し、再生部28へ出力する。
Rms(t)=(t/T)×R(t)+{(T−t)/T}×M(t) (5)
再生部28は、t=0で、遅延部26の出力であるモノラル信号から平滑切替部27の出力であるステレオ信号(Lms信号及びRms信号)に連続的に切り換えて、オーディオ信号を再生する。t=T以降は、通常のステレオ信号を再生する。
上述のような式(4)〜(5)による変換により、モノラル信号からステレオ信号へ移行する際、経過時間tに応じてL(t)及びR(t)とM(t)とが平滑化されたLms(t)及びRms(t)を得ることができる。すなわち、チャネル数の異なるオーディオデータを音像の移動が滑らかになるように切り替えて再生することが可能となる。
なお、Tはチャネル数が完全に切り替わるまでの時間になるが、オーディオ信号の性質等に応じて適応的に変化させることも可能である。例えば、次式で示すL(t)とR(t)の相互相関値S(t)において、S(t)が最大となるt=Tsを求める。Tsの絶対値が小さい場合は、音像の位置が真ん中に近いことを意味するため、平滑化時間Tを小さくする。
S(t)=ΣL(t)×R(t+τ)
ただし、Σは、τ=−T/2〜T/2の範囲で加算。
平滑切替部27については、(2)〜(5)式に(1)式を代入して計算した(2’)〜(5’)を算出可能な構成によっても実現可能である。
Lsm(t)={(2T−t)/2T}×L(t)+(t/2T)×R(t) (2’)
Rsm(t)=(t/2T)×L(t)+{(2T−t)/2T}×R(t) (3’)
Lms(t)=(T+t/2T)×L(t)+{(T−t)/2T}×R(t) (4’)
Rms(t)=(T−t/2T)×L(t)+{(T+t)/2T}×R(t) (5’)
次に、本発明のチャンネル数可変オーディオ配信システムの実施の形態の動作について説明する。図3は、本発明のチャンネル数可変オーディオ配信システムの実施の形態の動作を示すフロー図である。ここでは、伝送路3としてのインターネット網でする方法として、リアルタイム通信プロトコルRTPを用いてオーディオデータを配信する例を用いて説明する。
まず、伝送路の状態に応じてステレオとモノラルを切り替えて送信する動作について説明する。
サーバ10側におけるデータ送信部13は、データベース(14又は15)から取得したオーディオデータ及び送信時刻等を格納し、RTPヘッダを付与されたRTCP SRパケット(送信データ)を生成する(ステップS1)。RTPヘッダは、パケットの送信順番を示す連続した番号であるシーケンス番号やオーディオを再生する時刻を示すタイムスタンプ等を含む。オーディオデータとしては、送信制御部12の指令に基づいて、ステレオデータ及びモノラルデータのいずれかを選択する。そして、そのSRパケット(送信データ)をクライアント端末20に伝送路3を介して送信する(ステップS2)。
クライアント20側におけるデータ受信部21は、データパケット又はSRパケットを受信する。そして、データパケット受信時刻、SRパケット受信時刻、RTPヘッダに付与されたシーケンス番号とタイムスタンプ、SRパケットに格納されているSRパケット送信時刻を情報取得部22に出力する(ステップS3)。オーディオデータについては、データ再生用の処理が施される。ステップS4,S5と並行して行われる(ステップS11)が、詳細は後述する。情報取得部22は、シーケンス番号の欠損を調べることによりパケット損失率を計算し、データパケット受信時刻とタイムスタンプを用いてパケット到着遅延の揺らぎ(ジッタ)を計算する(ステップS4)。そして、パケット損失率、ジッタ、SRパケット送信時刻、及びSRパケットを受信してからRRパケットを送信するまでの時間(DLSR)を情報伝送部23に出力する(ステップS5)。情報伝送部23は、パケット損失率、ジッタ、SRパケット送信時刻、及びDLSRを格納したRTCP Receiver Report(RR)パケット(返信データ)を生成する(ステップS5)。そして、RRパケット(返信データ)をサーバ10に送信する(ステップS6)。
サーバ10側における情報受信部11は、RRパケットを受信する。そして、RRパケット受信時刻、及びRRパケットに格納されているパケット損失率、ジッタ、SRパケット送信時刻、DLSRを送信制御部12に出力する(ステップS7)。送信制御部12は、RRパケット受信時、SRパケット送信時刻、及びDLSRを用いてRTTを計算する(ステップS8)。さらに、パケット損失率、RTT、及びジッタのすべて、あるいは一部を用いて伝送路の輻輳を推定し、ステレオデータかモノラルデータどちらを送信すべきか判定する。そして、判定結果をデータ送信部13に出力する(ステップS9)。オーディオデータの送信が完了していない場合(ステップS10:No)、ステップS1へ戻る。完了している場合(ステップS10:Yes)プロセスを終了する。
パケット損失率、RTT、及びジッタの計算方法の詳細は、RFC1889を参照できる。また、これらの値を用いて伝送路の輻輳状態を推定する方法には様々なものがあり、それらを利用することも可能であるが、ここでは発明の中心でないため、詳細については省略する。
次に、クライアント端末20におけるオーディオデータの再生の処理(ステップS11)について説明する。図4は、本発明のチャンネル数可変オーディオ配信システムの実施の形態の動作におけるオーディオデータの再生の処理を示すフロー図である。
データ受信部21は、サーバ10からデータパケット又はSRパケットを受信する。そして、それらのデータからオーディオデータを抽出する(ステップS21)。続いて、抽出されたオーディオデータが、ステレオデータかモノラルデータかを判断する(ステップS22)。モノラルデータを受信した場合、そのデータをモノラル復号部24に入力する。ステレオデータを受信した場合、そのデータをステレオ復号部25に出力する。
モノラル復号部24は、入力されたモノラルデータを復号してモノラル信号を遅延部26に出力する(ステップS23)。遅延部26は、入力されたモノラル信号をT秒間分バッファリングした後、再生部28に出力する(ステップS24)。
ステレオ復号部25は、入力されたステレオデータを復号してステレオ信号(L信号及びR信号)を遅延部26に出力する(ステップS25)。遅延部26は、入力されたステレオ信号をT秒間分バッファリングする。その後、ステレオ信号、及び、遅延部26への入力がステレオとモノラルが切り替わってからの経過時間tを平滑切替部27に出力する(ステップS26)。平滑切替部27は、遅延部26からのステレオ信号(L信号及びR信号)と経過時間tとに基づいて、ステレオとモノラルがスムーズに切り替わるように変換されたステレオ信号(Lsm信号及びRsm信号、上述)を出力する(ステップS27)。
再生部28は、ステレオ信号からモノラル信号に変更される場合、平滑切替部27からのスムーズにステレオとモノラルの切替が行なわれたステレオ信号(Lsm信号及びRsm信号)を再生し、その後連続的に遅延部26からのモノラル信号を再生する。一方、モノラル信号からステレオ信号に変更される場合、遅延部26からのモノラル信号を再生後、連続的に平滑切替部27からのスムーズにステレオとモノラルの切替が行なわれたステレオ信号(Lsm信号及びRsm信号)を再生する(ステップS28)。
本発明により、クライアント端末20のユーザ(聞き手)に違和感や主観音声品質の劣化を感じさせること無く、オーディオデータのチャネル数を変更することが可能となる。そして、チャネル数の異なるオーディオデータを音像の移動が滑らかになるように切り替えて再生することができる。
(第2の実施の形態)
図5は、本発明のオーディオ配信システムの第2の実施の形態を示す構成図である。オーディオ配信システム1bは、伝送路3を介して双方向通信可能に接続されたサーバ10bとクライアント端末20bとを具備する。
オーディオ配信装置としてのサーバ10は、配信するオーディオデータがステレオデータから5.1チャンネルデータ、モノラルデータから2チャンネルデータになっている点で、第1の実施の形態と異なる。それに伴い、データ送信部53において、配信するオーディオデータとして2チャンネルデータベース54に格納された2チャンネルデータ、及び、5.1チャンネルデータベース55に格納された5.1チャンネルデータを備えている。他の構成については、第1の実施の形態と同じであるのでその説明を省略する。
オーディオ受信装置としてのクライアント端末20は、受信及び再生するオーディオデータがステレオデータから5.1チャンネルデータ、モノラルデータから2チャンネルデータになっている点で、第1の実施の形態と異なる。それに伴い、5.1チャンネル対応の5.1チャネル復号部85及び平滑切替部87、2チャネル対応の2チャネル復号部84、両チャネル対応の遅延部86及び再生部88を備えている。他の構成については、第1の実施の形態と同じであるのでその説明を省略する。
伝送路3については、第1の実施の形態と同じであるのでその説明を省略する。
次に、平滑切替部87を詳細に説明する。図6は、平滑切替部87の構成を示すブロック図である。平滑切替部87は、ゲイン計算部61、加算部62〜69、乗算部72〜79を備える。
オーディオ信号が5.1チャネルから2チャネルへ切り替わる場合について説明する。
5.1チャネルから2チャネルに切り替わってからt秒後の5.1チャネルにおける正面、左前、左後、右前、及び右後に対する信号をそれぞれC(t)、Lf(t)、Lr(t)、Rf(t)、Rr(t)とする。
加算部67は、Rf(t)、Rr(t)とに基づいて、2チャネル信号R(t)を次式で計算し、乗算部77及び加算部69へ出力する。
R(t)={Rf(t)+Rr(t)}/2 (7)
加算部68は、Lf(t)、Lr(t)とに基づいて、2チャネル信号L(t)を次式で計算し、乗算部78及び加算部69へ出力する。
L(t)={Lf(t)+Lr(t)}/2 (8)
加算部69は、R(t)、L(t)とに基づいて、平滑化に用いる信号LR(t)を次式で計算し、乗算部79へ出力する。
LR(t)={L(t)+R(t)}/2
={Lf(t)+Lr(t)+Rf(t)+Rr(t)}/4 (9)
t≦Tの場合、各構成は以下のよう動作する。
ゲイン計算部61は、経過時間tに基づいて、乗算部72〜76の係数A={(T−t)/T}、及び、乗算部77〜79の係数B=(t/T)を計算し、乗算部72〜76、及び、乗算部77〜79へ出力する。
乗算部72〜76は、C(t)、Lf(t)、Lr(t)、Rf(t)、Rr(t)と係数Aとに基づいて、その乗算の結果{(T−t)/T}×各信号、をそれぞれ加算部62〜66に出力する。
乗算部77〜79は、L1(t)、R1(t)、LR(t)と係数Bとに基づいて、その乗算の結果(t/T)×各信号、をそれぞれ加算部63、64、加算部65、66、加算部62に出力する。
加算部62は、乗算部72の出力と乗算部79の出力とに基づいて、以下の式で平滑化後のC(t)であるC52(t)を計算し、再生部28へ出力する。
52(t)={(T−t)/T}×C(t)+(t/T)×LR(t) (10)
加算部63は、乗算部73の出力と乗算部78の出力とに基づいて、以下の式で平滑化後のLf(t)であるLf52(t)を計算し、再生部28へ出力する。
Lf52(t)={(T−t)/T}×Lf(t)+(t/T)×L(t) (11)
加算部64は、乗算部74の出力と乗算部78の出力とに基づいて、以下の式で平滑化後のLr(t)であるLr52(t)を計算し、再生部28へ出力する。
Lr52(t)={(T−t)/T}×Lr(t)+(t/T)×L(t) (12)
加算部65は、乗算部75の出力と乗算部77の出力とに基づいて、以下の式で平滑化後のRf(t)であるRf52(t)を計算し、再生部28へ出力する。
Rf52(t)={(T−t)/T}×Rf(t)+(t/T)×R(t) (13)
加算部66は、乗算部76の出力と乗算部77の出力とに基づいて、以下の式で平滑化後のRr(t)であるRr52(t)を計算し、再生部28へ出力する。
Rr52(t)={(T−t)/T}×Rr(t)+(t/T)×R(t) (14)
そして、再生部28は、t=Tで、平滑切替部27の出力である5.1チャネル信号(C52信号、Lf52信号、Lr52信号、Rf52信号、Rr52信号)から遅延部26の出力である2チャネル信号(L信号、R信号)に連続的に切り換えて、オーディオ信号を再生する。
2チャネルデータ(L(t)信号、R(t)信号)を受信した場合、再生部88としての正面、左前、左後、右前、及び右後に対する各スピーカは、それぞれ{L(t)+R(t)}/2、L(t)、L(t)、R(t)、R(t)を再生する。低域信号である0.1チャネルの信号は、指向性がなく、チャネル数の切替による影響ないことから、平滑化を行なわない。
上述のような式(10)〜(14)による変換により、5.1チャネル信号から2チャネル信号へ移行する際、経過時間tに応じてC(t)とLR(t)、Lf(t)及びLr(t)とL(t)、Rf(t)及びRr(t)とR(t)、がそれぞれ平滑化されたC52(t)、Lf52(t)、Lr52(t)、Rf52(t)及びRr52(t)を得ることができる。すなわち、チャネル数の異なるオーディオデータを音像の移動が滑らかになるように切り替えて再生することが可能となる。
t>Tの場合、ゲイン計算部61は、経過時間tに基づいて、乗算部72〜76、77〜79に与える係数をそれぞれ1、0とする。それにより、C(t)、Lf(t)、Lr(t)、Rf(t)、Rr(t)をそのまま再生部28に出力する。
オーディオ信号が2チャネルから5.1チャネルへ切り替わる場合について説明する。
2チャネルから5.1チャネルに切り替わってからt秒後の5.1チャネルにおける正面、左前、左後、右前、及び右後に対する信号をそれぞれC(t)、Lf(t)、Lr(t)、Rf(t)、Rr(t)とする。
加算部67は、Rf(t)、Rr(t)とに基づいて、2チャネル信号R(t)を次式で計算し、乗算部77及び加算部69へ出力する。
R(t)={Rf(t)+Rr(t)}/2 (7)
加算部68は、Lf(t)、Lr(t)とに基づいて、2チャネル信号L(t)を次式で計算し、乗算部78及び加算部69へ出力する。
L(t)={Lf(t)+Lr(t)}/2 (8)
加算部69は、R(t)、L(t)とに基づいて、平滑化に用いる信号LR(t)を次式で計算し、乗算部79へ出力する。
LR(t)={L(t)+R(t)}/2
={Lf(t)+Lr(t)+Rf(t)+Rr(t)}/4 (9)
ゲイン計算部61は、経過時間tに基づいて、乗算部72〜76の係数A=(t/T)、及び、乗算部77〜79の係数B={(T−t)/T}を計算し、乗算部72〜76、及び、乗算部77〜79へ出力する。
乗算部72〜76は、C(t)、Lf(t)、Lr(t)、Rf(t)、Rr(t)と係数Aとに基づいて、その乗算の結果(t/T)×各信号、を加算部62〜66に出力する。
乗算部77〜79は、L1(t)、R1(t)、LR(t)と係数Bとに基づいて、その乗算の結果{(T−t)/T}×各信号、を加算部63、64、加算部65、66、加算部62に出力する。
加算部62は、乗算部72の出力と乗算部79の出力とに基づいて、以下の式で平滑化後のC(t)であるC25(t)を計算し、再生部28へ出力する。
25(t)=(t/T)×C(t)+{(T−t)/T}×LR(t) (15)
加算部63は、乗算部73の出力と乗算部78の出力とに基づいて、以下の式で平滑化後のLf(t)であるLf25(t)を計算し、再生部28へ出力する。
Lf25(t)=(t/T)×Lf(t)+{(T−t)/T}×L(t) (16)
加算部64は、乗算部74の出力と乗算部78の出力とに基づいて、以下の式で平滑化後のLr(t)であるLr25(t)を計算し、再生部28へ出力する。
Lr25(t)=(t/T)×Lr(t)+{(T−t)/T}×L(t) (17)
加算部65は、乗算部75の出力と乗算部77の出力とに基づいて、以下の式で平滑化後のRf(t)であるLf25(t)を計算し、再生部28へ出力する。
Rf25(t)=(t/T)×Rf(t)+{(T−t)/T}×R(t) (18)
加算部66は、乗算部76の出力と乗算部77の出力とに基づいて、以下の式で平滑化後のRr(t)であるLr25(t)を計算し、再生部28へ出力する。
Rr25(t)=(t/T)×Rr(t)+{(T−t)/T}×R(t) (19)
再生部28は、t=0で、遅延部26の出力である2チャネル信号(L信号、R信号)から平滑切替部27の出力である5.1チャネル信号(C52信号、Lf52信号、Lr52信号、Rf52信号、Rr52信号)に連続的に切り換えて、オーディオ信号を再生する。t=T以降、本来の5.1チャネル信号(C(t)、Lf(t)、Lr(t)、Rf(t)、Rr(t))を再生する。
上述のような式(15)〜(19)による変換により、2チャネル信号から5.1チャネル信号へ移行する際、経過時間tに応じてC(t)とLR(t)、Lf(t)及びLr(t)とL(t)、Rf(t)及びRr(t)とR(t)、がそれぞれ平滑化されたC25(t)、Lf25(t)、Lr25(t)、Rf25(t)及びRr25(t)を得ることができる。すなわち、チャネル数の異なるオーディオデータを音像の移動が滑らかになるように切り替えて再生することが可能となる。
次に、本発明のチャンネル数可変オーディオ配信システムの実施の形態の動作については、上述の各式(7)〜(19)を用いているほかは、第1の実施の形態と同様であるので、その説明を省略する。
本発明により、クライアント端末20のユーザ(聞き手)に違和感や主観音声品質の劣化を感じさせること無く、オーディオデータのチャネル数を変更することが可能となる。そして、チャネル数の異なるオーディオデータを音像の移動が滑らかになるように切り替えて再生することができる。
(第3の実施の形態)
図7は、本発明のオーディオ配信システムの第3の実施の形態を示す構成図である。オーディオ配信システム1は、伝送路3を介して双方向通信可能に接続されたサーバ10aとクライアント端末20aとを具備する。
図7に示す本実施の形態におけるオーディオ配信システムは、図1における遅延部26を用いない点で第1の実施の形態と異なる。ステレオ信号からモノラル信号を生成するのに第1の実施の形態では、ステレオからモノラルに切り替える場合に、遅延部26によりステレオ信号をT秒間バッファリングしている。しかし、ステレオからモノラルに切り替わるT秒前に送信側から切替の通知があれば、バッファリングする必要がない。図7において、データ送信部13aは、T秒後にステレオからモノラルに切り替える場合、その切替の発生を示す切替データをクライアントに通知する。この方法として、例えば、データ送信部13aは、切替のT秒前のオーディオデータに切替データを加えてクライアント端末20aに送信する、又は、切替のT秒前までに別パケットで切替時刻をクライアント端末20aに送信する。データ受信部21aは、受信した切替データを平滑切替部27に入力する。平滑切替部27は、切替データに含まれる時刻tとステレオ復号部25からのL信号及びR信号とに基づいて、第1の実施の形態と同様に、平滑化されたステレオ信号を生成する。
オーディオ配信システムの他の機能及び構成は、第1の実施の形態と同じであるのでその説明を省略する。
次に、本発明のチャンネル数可変オーディオ配信システムの実施の形態の動作において、伝送路の状態に応じてステレオとモノラルを切り替えて送信する動作については、送信データにステレオからモノラルへの切替の発生を示す切替データを含んでいるほかは、第1の実施の形態(図3)と同様であるのでその説明を省略する。
次に、クライアント端末20におけるオーディオデータの再生の処理(ステップS11)については、遅延処理S24及びS26を行わず、平滑化処理S27で切替データを時刻tとして用いる他は第1の実施の形態(図4)と同様であるのでその説明を省略する。
本実施の形態においても、第1の実施の形態と同様の効果を得ることができる。加えて、遅延部26を省略できるので、クライアント端末の構成を簡略化することが可能となる。
更に、本実施の形態は、5.1チャネルと2チャネルとの切替においても同様に用いることができる。その場合、切替データで示される時刻tは、5.1チャネルと2チャネルとの切替の時刻である。
(第4の実施の形態)
図8は、本発明のオーディオ配信システムの第4の実施の形態を示す構成図である。オーディオ配信システム1は、伝送路3を介して双方向通信可能に接続されたサーバ10aとクライアント端末20cとを具備する。
図8に示す本実施の形態におけるオーディオ配信システムは、データ送信部13cを用いる点で他の実施の形態と異なる。図9は、データ送信部13cの構成を示すブロック図である。上記各実施の形態のデータ送信部13、53、13aでは、予め用意しておいたデータを送信している。しかし、本実施の形態では、図9に示すように、データ送信部13cは、マイク40(L信号用マイク41及びR信号用マイク42)からリアルタイムにオーディオデータ(ここでは、ステレオデータ)を取得して送信する。図8のデータ送信部13cにおいて、マイク41、42から得たそれぞれL信号とR信号は、ステレオ符号化部45に入力され、送信可能なステレオデータとなる。それとともに、これらの信号は、加算器43で加算され、乗算器44で1/2が乗算されて得られて、モノラル信号となる。そのモノラル信号は、モノラル符号化部46に入力され、送信可能なモノラルデータとなる。そして、第1の実施の形態と同様に、送信制御部12の決定に基いて、データ送信部13cは、ステレオとモノラルのデータを切り替えて送信する。
なお、マイク40からのオーディオデータは、第1の実施の形態のようなデータベースに保管した後、出力するようにしても良い。その場合、オーディオデータの再利用が可能となる。
オーディオ配信システムの他の機能及び構成は、第1の実施の形態と同じであるのでその説明を省略する。
次に、本発明のチャンネル数可変オーディオ配信システムの実施の形態の動作において、伝送路の状態に応じてステレオとモノラルを切り替えて送信する動作については、送信されるデータがリアルタイムなオーディオデータであるほかは、第1の実施の形態(図3)と同様であるのでその説明を省略する。
次に、クライアント端末20におけるオーディオデータの再生の処理(ステップS11)については、第1の実施の形態(図4)と同様であるのでその説明を省略する。
本実施の形態においても、第1の実施の形態と同様の効果を得ることができる。加えて、本実施の形態は、マイク40として5.1チャネル用のものを用いることで、第2の実施の形態にそのまま利用でき、第2の実施の形態と同様の効果を得ることも可能である。更に、本実施の形態は、切替データを送信データに含ませることで、第3の実施の形態にそのまま利用でき、第3の実施の形態と同様の効果を得ることも可能である。
(第5の実施の形態)
図10は、本発明のオーディオ配信システムの第5の実施の形態を示す構成図である。オーディオ配信システム1dは、伝送路3を介して双方向通信可能に接続されたサーバ10dとクライアント端末20dとを具備する。
図10に示す本実施の形態におけるオーディオ配信システムは、サーバ10dがゲートウェイとして動作する。本発明において、データ送信部13、53、13aでは、予め用意しておいたデータを送信している。しかし、図10に示すように、本実施の形態では、別のサーバ90から受信したオーディオデータをクライアント端末20dに送信する点で他の実施の形態と異なる。
サーバ90は、ワークステーションに例示される情報処理装置である。伝送路3dを介してオーディオデータ(例示:ステレオデータ、モノラルデータ)をサーバ10dへ送信する。
サーバ10dは、ワークステーションに例示される情報処理装置である。サーバ90が送信したオーディオデータについて、クライアント端末20dがスムーズにオーディオデータを受信できるように、必要に応じて通信プロトコルを変換する。そして、そのオーディオデータをクライアント端末20dへ配信する。その際、伝送路3の状態に応じてオーディオデータをステレオ又はモノラルに切り替える。伝送路3の状態は、配信時に使用可能な回線容量に例示される。
クライアント端末20は、パーソナルコンピュータやPDAや携帯電話のような情報端末、ラジオのような受信機能付きのオーディオ機器に例示される。サーバ10から配信されたオーディオデータを受信して、オーディオデータに対応して、それをステレオ又はモノラルで再生する。
伝送路3及び伝送路3dは、無線や有線による通信において使用される回線(伝送路)であり、インターネットのような公衆回線に例示される。
サーバ90は、データ送信部93を備える。
データ送信部93は、スステレオデータベース94とモノラルデータベース95とを含み、所定の通信プロトコルに基づいて、各データベースの内から選択されたオーディオデータをサーバ10dへ配信する。ステレオデータベース94はステレオデータを格納し、モノラルデータベース95はモノラルデータを格納する。
サーバ10dは、データ受信部16、情報受信部11、送信制御部12、データ送信部13dを備える。
データ受信部16は、サーバ90からオーディデータを受信する。そして、そのオーディオデータをデータ送信部13dへ出力する。
データ送信部13dは、データ受信部16からのオーディオデータがステレオデータの場合、一時的にステレオデータベース14に格納する。モノラルデータの場合、一時的にモノラルデータベース15に格納する。そして、そのオーディオデータの通信プロトコルをリアルタイム通信プロトコルRTPに変換して、オーディオデータの配信を行う。すなわち、オーディオデータ及び送信時刻等を格納したRTCP SRパケットをクライアント端末20dに送信する。ここで、オーディオデータには、RTPヘッダとしてパケットの送信順番を示す連続した番号であるシーケンス番号やオーディオを再生する時刻を示すタイムスタンプ等が付与されている。オーディオデータとしてステレオデータ及びモノラルデータのどちらを送信すべきかについては、送信制御部12により制御される。
送信されるオーディオデータとしてステレオデータとモノラルデータとを切り替える際、データ送信部13dは、平滑切替部17において第1の実施の形態で示される違和感の発生しない方法でオーディオデータを切り替える。すなわち、サーバ90から送信されるオーディオデータがステレオデータ及びモノラルデータの両方の場合、平滑切替部17は、両データを復号して得られるステレオ信号(L(t)、R(t))及びモノラル信号(M(t))に基づいて、式(2)〜(5)を計算する。サーバ90から送信されるオーディオデータがステレオデータのみの場合、平滑切替部17は、ステレオデータを復号して得られるステレオ信号(L(t)、R(t))に基づいて、式(1)〜(5)を計算する。そして、得られた信号を符号化して出力する。
情報受信部11及び送信制御部12については、第1の実施の形態と同様であるので、その説明を省略する。
クライアント端末20は、遅延部26及び平滑切替部27を用いないほかは、第1の実施の形態と同様であるので、その説明を省略する。
次に、本発明のチャンネル数可変オーディオ配信システムの実施の形態の動作について説明する。図11は、本発明のチャンネル数可変オーディオ配信システムの実施の形態の動作を示すフロー図である。
まず、伝送路の状態に応じてステレオとモノラルを切り替えて送信する動作について説明する。
サーバ90におけるデータ送信部93は、データベース(94、95)から取得したオーディオデータ(例示:ステレオデータ、モノラルデータ)を用いて、所定の通信プロトコルに対応する送信データを生成する(ステップS31)。そして、その送信データをサーバ10dへ伝送路3dを介して送信する(ステップS32)。
サーバ10dにおけるデータ受信部16は、サーバ90からの送信データを受信する。そして、そのデータがステレオデータを含む場合、データ送信部13dのステレオデータベース14へ出力する。そのデータがモノラルデータを含む場合、データ送信部13dのモノラルデータベース15へ出力する(ステップS33)。データ送信部13dは、送信制御部12の指令に基づいて、ステレオデータ及びモノラルデータのいずれかを選択し、対応するデータベース(14、15)からオーディオデータを取得する。そして、そのオーディオデータ及び送信時刻等を含み、RTPヘッダを付与されたRTCP SRパケット(送信データ)を生成する(ステップS34)。その際、ステレオデータとモノラルデータとを切り替える場合には、平滑切替部17において、各データを平滑化する。RTPヘッダは、パケットの送信順番を示す連続した番号であるシーケンス番号やオーディオを再生する時刻を示すタイムスタンプ等を含む。オーディオデータとしては、そして、そのSRパケット(送信データ)をクライアント端末20に伝送路3を介して送信する(ステップS35)。
クライアント20dにおけるデータ受信部21aは、データパケット又はSRパケットを受信する。そして、データパケット受信時刻、SRパケット受信時刻、RTPヘッダに付与されたシーケンス番号とタイムスタンプ、SRパケットに格納されているSRパケット送信時刻を情報取得部22に出力する(ステップS36)。オーディオデータについては、ステップS37,S38と並行して、データ再生用の処理が施される(ステップS44)。情報取得部22は、シーケンス番号の欠損を調べることによりパケット損失率を計算し、データパケット受信時刻とタイムスタンプを用いてパケット到着遅延の揺らぎ(ジッタ)を計算する(ステップS37)。そして、パケット損失率、ジッタ、SRパケット送信時刻、及びSRパケットを受信してからRRパケットを送信するまでの時間(DLSR)を情報伝送部23に出力する。情報伝送部23は、パケット損失率、ジッタ、SRパケット送信時刻、及びDLSRを格納したRTCP RRパケット(返信データ)を生成する(ステップS38)。そして、RRパケット(返信データ)をサーバ10に送信する(ステップS39)。
サーバ10側における情報受信部11は、RRパケットを受信する。そして、RRパケット受信時刻、及びRRパケットに格納されているパケット損失率、ジッタ、SRパケット送信時刻、DLSRを送信制御部12に出力する(ステップS40)。送信制御部12は、RRパケット受信時、SRパケット送信時刻、及びDLSRを用いてRTTを計算する(ステップS41)。さらに、パケット損失率、RTT、及びジッタのすべて、あるいは一部を用いて伝送路の輻輳を推定し、ステレオデータかモノラルデータどちらを送信すべきか判定する。そして、判定結果をデータ送信部13に出力する(ステップS42)。オーディオデータの送信が完了していない場合(ステップS43:No)、ステップS34へ戻る。完了している場合(ステップS43:Yes)プロセスを終了する。
パケット損失率、RTT、及びジッタの計算方法の詳細は、RFC1889を参照できる。また、これらの値を用いて伝送路の輻輳状態を推定する方法には様々なものがあり、それらを利用することも可能である。
次に、サーバ10dにおけるオーディオデータの平滑化の処理(ステップS34)について説明する。図12は、本発明のチャンネル数可変オーディオ配信システムの実施の形態の動作におけるオーディオデータの平滑化の処理を示すフロー図である。
送信制御部12における、ステレオデータかモノラルデータどちらを送信すべきか判定結果(ステップS42)に基づいて、オーディオデータの種類を変更する必要があるか否かを判定する(ステップS51)。オーディオデータの種類を変更する必要がない場合、ステップS55へ進む。オーディオデータの種類を変更する必要がある場合、平滑切替部17において、オーディオデータを復号する処理を行う(ステップS52)。復号したオーディオ信号について、第1の実施の形態に記載の方法で、平滑化を行う(すてぷS53)。すなわち、オーディオデータとしてステレオデータとモノラルデータとを有している場合、それらを復号したステレオ信号(L(t)、R(t))及びモノラル信号(M(t))に基づいて、式(2)〜(5)を計算する。ステレオデータのみを有している場合、それを復号して得られるステレオ信号(L(t)、R(t))に基づいて、式(1)〜(5)を計算する。その後、得られた平滑化された信号を符号化して、送信用のオーディオデータを生成する(ステップS54)。そして、そのオーディオデータ及び送信時刻等を含み、RTPヘッダを付与されたRTCP SRパケット(送信データ)を生成する(ステップS55)
本発明により、クライアント端末20dのユーザ(聞き手)に違和感や主観音声品質の劣化を感じさせること無く、オーディオデータのチャネル数を変更することが可能となる。そして、チャネル数の異なるオーディオデータを音像の移動が滑らかになるように切り替えて再生することができる。
加えて、サーバがデータを切り替える際の平滑化を一括して行っているので、クライアント端末に遅延部や平滑切替部を有している必要が無くなる。
図1は、本発明のオーディオ配信システムの第1の実施の形態を示す構成図である。 図2は、平滑切替部27の構成を示すブロック図である。 図3は、本発明のチャンネル数可変オーディオ配信システムの実施の形態の動作を示すフロー図である。 図4は、本発明のチャンネル数可変オーディオ配信システムの実施の形態の動作におけるオーディオデータの再生の処理を示すフロー図である。 図5は、本発明のオーディオ配信システムの第2の実施の形態を示す構成図である。 図6は、平滑切替部87の構成を示すブロック図である。 図7は、本発明のオーディオ配信システムの第3の実施の形態を示す構成図である。 図8は、本発明のオーディオ配信システムの第4の実施の形態を示す構成図である。 図9は、データ送信部13cの構成を示すブロック図である。 図10は、本発明のオーディオ配信システムの第5の実施の形態を示す構成図である。 図11は、本発明のチャンネル数可変オーディオ配信システムの実施の形態の動作を示すフロー図である。 図12は、本発明のチャンネル数可変オーディオ配信システムの実施の形態の動作におけるオーディオデータの平滑化の処理を示すフロー図である。
符号の説明
1a、1b、1c、1d オーディオ配信システム
3、3d 伝送路
10a、10b、10c、10d、90 サーバ
11 情報受信部
12 送信制御部
13、13a、13c、53、93 データ送信部
14、54、94 ステレオデータベース
15、55、95 モノラルデータベース
16 データ受信部
17 平滑切替部
20a、20b、20c、20d クライアント端末
21、21a データ受信部
22 情報取得部
23 情報送信部
24、84 モノラル復号部
25、85 ステレオ復号部
26、86 遅延部
27、87 平滑切替部
28、88 再生部
31、61 ゲイン計算部
32、36、37、43、62〜69 加算部
33、34、35、44、72〜79 乗算部
40 マイク
41 Lマイク
42 Rマイク
45 ステレオ符号化部
46 モノラル符号化部

Claims (22)

  1. オーディオデータを復号し、オーディオ信号を出力するデータ復号部と、
    前記オーディオデータは、第1チャネル数を有する第1オーディオデータ及び第2チャネル数を有する第2オーディオデータのいずれか一方を含み、
    前記オーディオ信号は、前記第1オーディオデータを復号した第1オーディオ信号及び前記第2オーディオデータを復号した第2オーディオ信号のうちの前記オーディオデータに対応したものを含み、
    前記オーディオ信号が前記第1オーディオ信号及び前記第2オーディオ信号のいずれか一方の信号から他方の信号へ切り替わるとき、前記一方の信号もしくは前記他方の信号における各チャネルの信号について比率を連続的に変化させながら混合した混合信号を前記オーディオ信号として出力する混合部と
    を具備し、
    前記混合部は、前記第1オーディオ信号及び前記第2オーディオ信号のいずれか一方の信号から他方の信号へ切り替わるとき、前記一方の信号と前記他方の信号との比率を連続的に変化させる時間の長さを前記オーディオ信号の性質に応じて変化させ、
    前記オーディオ信号の性質は、前記オーディオ信号の各チャネルの信号同士の相関である
    オーディオ再生装置。
  2. 請求項1に記載のオーディオ再生装置において、
    前記混合部は、前記オーディオ信号が前記第1オーディオ信号及び前記第2オーディオ信号のいずれか一方の信号から他方の信号へ切り替わるとき、前記第1オーディオ信号から前記第2チャネル数の擬似第2オーディオ信号を生成し、前記第1オーディオ信号と前記擬似第2オーディオ信号との比率を連続的に変化させた前記混合信号として出力する
    オーディオ再生装置。
  3. 請求項2に記載のオーディオ再生装置において、
    前記混合部は、前記第1オーディオ信号及び前記第2オーディオ信号を所定の時間だけ遅延させて、遅延第1オーディオ信号及び遅延第2オーディオ信号を出力する遅延部と、
    前記オーディオ信号が前記第1オーディオ信号及び前記第2オーディオ信号のいずれか一方の信号から他方の信号へ切り替わるとき、前記所定の時間の間、前記擬似第2オーディオ信号を生成し、前記第1オーディオ信号と前記擬似第2オーディオ信号との比率を連続的に変化させた前記混合信号として出力する平滑部と
    を備える
    オーディオ再生装置。
  4. 請求項1又は2に記載のオーディオ再生装置において、
    前記オーディオデータにおける前記第1オーディオデータ及び前記第2オーディオデータのいずれか一方から他方への切替を検出する検出部を更に具備し、
    前記検出部は、前記混合部へ前記切替のタイミングを通知し、
    前記混合部は、前記切替のタイミングに会わせて、前記混合信号を出力する
    オーディオ再生装置。
  5. ネットワークを介してオーディオデータを配信先へ送信するデータ送信部と、
    前記オーディオデータは、第1チャネル数を有する第1オーディオデータ及び第2チャネル数を有する第2オーディオデータのいずれか一方を含み、
    前記ネットワークを介した前記配信先への送信の状態に関するデータを含む返信データを前記配信先から前記オーディオデータの送信途中に受信する情報受信部と、
    前記返信データに基づいて、前記オーディオデータの送信途中で、前記第1オーディオデータ及び前記第2オーディオデータのいずれか一方を前記オーディオデータとして選択し、選択された前記オーディオデータを前記データ送信部に送信させる制御部と
    前記オーディオデータを受信するデータ受信部と
    を具備し、
    前記データ送信部は、前記オーディオデータを復号してオーディオ信号を取得する切替部を備え、
    前記オーディオ信号は、前記第1オーディオデータを復号した第1オーディオ信号及び前記第2オーディオデータを復号した第2オーディオ信号のうちの前記オーディオデータに対応したものを含み、
    前記切替部は、前記オーディオ信号が前記第1オーディオ信号及び前記第2オーディオ信号のいずれか一方の信号から他方の信号へ切り替わるとき、前記一方の信号もしくは前記他方の信号における各チャネルの信号について比率を連続的に変化させながら混合した混合信号を前記オーディオ信号とし、前記オーディオ信号を符号化して出力する混合部を含み、
    前記混合部は、前記第1オーディオ信号及び前記第2オーディオ信号のいずれか一方の信号から他方の信号へ切り替わるとき、前記一方の信号と前記他方の信号との比率を連続的に変化させる時間の長さを前記オーディオ信号の性質に応じて変化させ、
    前記オーディオ信号の性質は、前記オーディオ信号の各チャネルの信号同士の相関である
    オーディオデータ配信サーバ。
  6. 請求項5に記載のオーディオデータ配信サーバにおいて、
    前記第1オーディオデータを格納する第1オーディオデータベースと、
    前記第2オーディオデータを格納する第2オーディオデータベースと
    を更に具備する
    オーディオデータ配信サーバ。
  7. ネットワークを介してオーディオデータを配信するサーバと、
    前記オーディオデータは、第1チャネル数を有する第1オーディオデータ及び第2チャネル数を有する第2オーディオデータのいずれか一方を含み、
    前記ネットワークを介して前記オーディオデータを受信する請求項1乃至4のいずれか一項に記載のオーディオ再生装置と
    を具備する
    オーディオデータ配信システム。
  8. 請求項に記載のオーディオデータ配信システムにおいて、
    オーディオ再生装置は、前記オーディオデータの受信に基づいて、前記ネットワークの通信状態を示す返信データを前記サーバへ送信し、
    前記サーバは、請求項5又は6に記載のオーディオデータ配信サーバである
    オーディオデータ配信システム。
  9. オーディオ再生装置が、オーディオデータを復号して、オーディオ信号を出力するステップと、
    ここで、前記オーディオデータは、第1チャネル数を有する第1オーディオデータ及び第2チャネル数を有する第2オーディオデータのいずれか一方を含み、
    前記オーディオ信号は、前記第1オーディオデータを復号した第1オーディオ信号及び前記第2オーディオデータを復号した第2オーディオ信号のうちの前記オーディオデータに対応したものを含み、
    前記オーディオ再生装置が、前記オーディオ信号が前記第1オーディオ信号及び前記第2オーディオ信号のいずれか一方の信号から他方の信号へ切り替わるとき、前記一方の信号もしくは前記他方の信号における各チャネルの信号について比率を連続的に変化させながら混合した混合信号を前記オーディオ信号として出力するステップと、
    前記オーディオ再生装置が、前記オーディオ信号を再生するステップと
    を具備し、
    前記混合信号を前記オーディオ信号として出力するステップは、
    前記オーディオ再生装置が、前記第1オーディオ信号及び前記第2オーディオ信号のいずれか一方の信号から他方の信号へ切り替わるとき、前記一方の信号と前記他方の信号との比率を連続的に変化させる時間の長さを前記オーディオ信号の性質に応じて変化させるステップを備え、
    前記オーディオ信号の性質は、前記オーディオ信号の各チャネルの信号同士の相関である
    オーディオ再生方法。
  10. 請求項に記載のオーディオ再生方法において、
    前記混合信号を出力するステップは、
    前記オーディオ再生装置が、前記第1オーディオ信号から前記第2チャネル数の擬似第2オーディオ信号を生成するステップと、
    前記オーディオ再生装置が、前記第1オーディオ信号と前記擬似第2オーディオ信号との比率を連続的に変化させた前記混合信号として出力するステップと
    を備える
    オーディオ再生方法。
  11. 請求項10に記載のオーディオ再生方法において、
    前記擬似第2オーディオ信号を生成するステップは、
    前記オーディオ再生装置が、前記第1オーディオ信号及び前記第2オーディオ信号を所定の時間だけ遅延させて、遅延第1オーディオ信号及び遅延第2オーディオ信号を出力するステップと、
    前記オーディオ再生装置が、前記所定の時間の間、前記擬似第2オーディオ信号を生成するステップと
    を備える
    オーディオ再生方法。
  12. 請求項又は10に記載のオーディオ再生方法において、
    前記オーディオ再生装置が、前記オーディオデータにおける前記第1オーディオデータ及び前記第2オーディオデータのいずれか一方から他方への切替を検出するステップを更に具備し、
    前記混合信号を出力するステップは、
    前記オーディオ再生装置が、前記切替のタイミングに会わせて前記混合信号を出力する
    オーディオ再生方法。
  13. オーディオデータ配信サーバが、ネットワークを介してオーディオデータを配信先へ送信するステップと、
    前記オーディオデータは、第1チャネル数を有する第1オーディオデータ及び第2チャネル数を有する第2オーディオデータのいずれか一方を含み、
    前記オーディオデータ配信サーバが、前記ネットワークを介した前記配信先への送信の状態に関するデータを含む返信データを前記配信先から前記オーディオデータの送信途中に受信するステップと、
    前記オーディオデータ配信サーバが、前記返信データに基づいて、前記オーディオデータの送信途中で、前記第1オーディオデータ及び前記第2オーディオデータのいずれか一方を前記オーディオデータとして選択するステップと
    前記オーディオデータ配信サーバが、前記オーディオデータをネットワークを介して受信するステップと
    を具備し、
    前記オーディオデータを配信先へ送信するステップは、前記オーディオデータ配信サーバが、選択された前記オーディオデータを送信し
    前記オーディオデータを前記配信先へ送信するステップは、
    前記オーディオデータ配信サーバが、前記オーディオデータを復号してオーディオ信号を取得するステップと、
    前記オーディオ信号は、前記第1オーディオデータを復号した第1オーディオ信号及び前記第2オーディオデータを復号した第2オーディオ信号のうちの前記オーディオデータに対応したものを含み、
    前記オーディオデータ配信サーバが、前記オーディオ信号が前記第1オーディオ信号及び前記第2オーディオ信号のいずれか一方の信号から他方の信号へ切り替わるとき、前記一方の信号もしくは前記他方の信号における各チャネルの信号について比率を連続的に変化させながら混合した混合信号を前記オーディオ信号として出力するステップと、
    前記オーディオデータ配信サーバが、前記オーディオ信号を符号化するステップと
    を備え、
    前記オーディオデータ配信サーバが、前記混合信号を前記オーディオ信号として出力するステップは、前記第1オーディオ信号及び前記第2オーディオ信号のいずれか一方の信号から他方の信号へ切り替わるとき、前記一方の信号と前記他方の信号との比率を連続的に変化させる時間の長さを前記オーディオ信号の性質に応じて変化させるステップを備え、
    前記オーディオ信号の性質は、前記オーディオ信号の各チャネルの信号同士の相関である
    オーディオデータ配信方法。
  14. 請求項13に記載のオーディオデータ配信方法において、
    前記オーディオデータ配信サーバが、前記第1オーディオデータを第1オーディオデータベースから取得するステップと、
    前記オーディオデータ配信サーバが、前記第2オーディオデータを格納する第2オーディオデータベースから取得するステップと
    を更に具備する
    オーディオデータ配信方法。
  15. オーディオデータ配信サーバが、ネットワークを介してオーディオデータを配信先へ送信するステップと、
    前記オーディオデータは、第1チャネル数を有する第1オーディオデータ及び第2チャネル数を有する第2オーディオデータのいずれか一方を含み、
    オーディオ再生装置が、前記ネットワークを介して前記オーディオデータを受信して、請求項9至12のいずれか一項に記載のオーディオ再生方法を実行するステップと
    を具備する
    オーディオデータ送受信方法。
  16. 請求項15に記載のオーディオデータ送受信方法において、
    前記オーディオ再生装置が、前記オーディオデータの受信に基づいて、前記ネットワークの通信状態を示す返信データを、前記配信先から送信するステップと、
    前記オーディオデータ配信サーバが、前記返信データに基づいて、前記第1オーディオデータ及び前記第2オーディオデータのいずれか一方を前記オーディオデータとして前記オーディオ再生装置へ配信するステップと
    を更に具備する
    オーディオデータ送受信方法。
  17. オーディオデータを復号して、オーディオ信号を出力するステップと、
    ここで、前記オーディオデータは、第1チャネル数を有する第1オーディオデータ及び前記第1チャネル数よりも小さい第2チャネル数を有する第2オーディオデータのいずれか一方を含み、
    前記オーディオ信号は、前記第1オーディオデータを復号した第1オーディオ信号及び前記第2オーディオデータを復号した第2オーディオ信号のうちの前記オーディオデータに対応したものを含み、
    前記オーディオ信号が前記第1オーディオ信号及び前記第2オーディオ信号のいずれか一方の信号から他方の信号へ切り替わるとき、前記一方の信号もしくは前記他方の信号における各チャネルの信号について比率を連続的に変化させながら混合した混合信号を前記オーディオ信号として出力するステップと、
    前記オーディオ信号を再生するステップと
    を具備し、
    前記混合信号を前記オーディオ信号として出力するステップは、前記第1オーディオ信号及び前記第2オーディオ信号のいずれか一方の信号から他方の信号へ切り替わるとき、前記一方の信号と前記他方の信号との比率を連続的に変化させる時間の長さを前記オーディオ信号の性質に応じて変化させるステップを備え、
    前記オーディオ信号の性質は、前記オーディオ信号の各チャネルの信号同士の相関である
    オーディオ再生方法をコンピュータに実行させるためのプログラム。
  18. 請求項17に記載のプログラムにおいて、
    前記混合信号を出力するステップは、前記第1オーディオ信号から前記第2チャネル数の擬似第2オーディオ信号を生成するステップと、
    前記第1オーディオ信号と前記擬似第2オーディオ信号との比率を連続的に変化させた前記混合信号として出力するステップと
    を備えるプログラム。
  19. 請求項18に記載のプログラムにおいて、
    前記擬似第2オーディオ信号を生成するステップは、
    前記第1オーディオ信号及び前記第2オーディオ信号を所定の時間だけ遅延させて、遅延第1オーディオ信号及び遅延第2オーディオ信号を出力するステップと、
    前記所定の時間の間、前記擬似第2オーディオ信号を生成するステップと
    を備える
    プログラム。
  20. 請求項17又は18に記載のプログラムにおいて、
    前記オーディオデータにおける前記第1オーディオデータ及び前記第2オーディオデータのいずれか一方から他方への切替を検出するステップを更に具備し、
    前記混合信号を出力するステップは、前記切替のタイミングに会わせて前記混合信号を出力する
    プログラム。
  21. ネットワークを介してオーディオデータを配信先へ送信するステップと、
    前記オーディオデータは、第1チャネル数を有する第1オーディオデータ及び前記第2チャネル数を有する第2オーディオデータのいずれか一方を含み、
    前記ネットワークを介した前記配信先への送信の状態に関するデータを含む返信データを前記配信先から前記オーディオデータの送信途中に受信するステップと、
    前記返信データに基づいて、前記オーディオデータの送信途中で、前記第1オーディオデータ及び前記第2オーディオデータのいずれか一方を前記オーディオデータとして選択するステップと
    前記オーディオデータをネットワークを介して受信するステップと
    を具備し、
    前記オーディオデータを配信先へ送信するステップは、選択された前記オーディオデータを送信し、
    前記オーディオデータを前記配信先へ送信するステップは、
    前記オーディオデータを復号してオーディオ信号を取得するステップと、
    前記オーディオ信号は、前記第1オーディオデータを復号した第1オーディオ信号及び前記第2オーディオデータを復号した第2オーディオ信号のうちの前記オーディオデータに対応したものを含み、
    前記オーディオ信号が前記第1オーディオ信号及び前記第2オーディオ信号のいずれか一方の信号から他方の信号へ切り替わるとき、前記一方の信号もしくは前記他方の信号における各チャネルの信号について比率を連続的に変化させながら混合した混合信号を前記オーディオ信号として出力するステップと
    を備え、
    前記混合信号を前記オーディオ信号として出力するステップは、前記第1オーディオ信号及び前記第2オーディオ信号のいずれか一方の信号から他方の信号へ切り替わるとき、前記一方の信号と前記他方の信号との比率を連続的に変化させる時間の長さを前記オーディオ信号の性質に応じて変化させるステップを備え、
    前記オーディオ信号の性質は、前記オーディオ信号の各チャネルの信号同士の相関である
    オーディオデータ配信方法をコンピュータに実行させるためのプログラム。
  22. 請求項21に記載のプログラムにおいて、
    前記第1オーディオデータを第1オーディオデータベースから取得するステップと、
    前記第2オーディオデータを格納する第2オーディオデータベースから取得するステップと
    を更に具備する
    プログラム。
JP2004006946A 2004-01-14 2004-01-14 オーディオ再生装置、オーディオデータ配信サーバ、オーディオデータ配信システム、その方法及びプログラム Expired - Fee Related JP4471086B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004006946A JP4471086B2 (ja) 2004-01-14 2004-01-14 オーディオ再生装置、オーディオデータ配信サーバ、オーディオデータ配信システム、その方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004006946A JP4471086B2 (ja) 2004-01-14 2004-01-14 オーディオ再生装置、オーディオデータ配信サーバ、オーディオデータ配信システム、その方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2005202052A JP2005202052A (ja) 2005-07-28
JP4471086B2 true JP4471086B2 (ja) 2010-06-02

Family

ID=34820770

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004006946A Expired - Fee Related JP4471086B2 (ja) 2004-01-14 2004-01-14 オーディオ再生装置、オーディオデータ配信サーバ、オーディオデータ配信システム、その方法及びプログラム

Country Status (1)

Country Link
JP (1) JP4471086B2 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4983485B2 (ja) * 2007-08-31 2012-07-25 ソニー株式会社 オーディオ信号受信装置、オーディオ信号送信装置、オーディオ信号伝送システム、オーディオ信号伝送方法およびプログラム
US8644526B2 (en) 2008-06-27 2014-02-04 Panasonic Corporation Audio signal decoding device and balance adjustment method for audio signal decoding device
JP5518638B2 (ja) 2010-08-30 2014-06-11 ヤマハ株式会社 情報処理装置、音響処理装置、音響処理システム、プログラムおよびゲームプログラム
JP5521908B2 (ja) 2010-08-30 2014-06-18 ヤマハ株式会社 情報処理装置、音響処理装置、音響処理システムおよびプログラム
JP6004031B2 (ja) * 2015-04-06 2016-10-05 ヤマハ株式会社 音響処理装置および情報処理装置
CN107480181B (zh) 2017-07-05 2020-11-24 百度在线网络技术(北京)有限公司 音频播放方法、装置、设备及服务器
WO2022097236A1 (ja) * 2020-11-05 2022-05-12 日本電信電話株式会社 音信号精製方法、音信号復号方法、これらの装置、プログラム及び記録媒体
US20230377585A1 (en) * 2020-11-05 2023-11-23 Nippon Telegraph And Telephone Corporation Sound signal refinement method, sound signal decode method, apparatus thereof, program, and storage medium
US20230386482A1 (en) * 2020-11-05 2023-11-30 Nippon Telegraph And Telephone Corporation Sound signal refinement method, sound signal decode method, apparatus thereof, program, and storage medium
US20230386480A1 (en) * 2020-11-05 2023-11-30 Nippon Telegraph And Telephone Corporation Sound signal refinement method, sound signal decode method, apparatus thereof, program, and storage medium
JPWO2022097233A1 (ja) * 2020-11-05 2022-05-12
WO2022097239A1 (ja) * 2020-11-05 2022-05-12 日本電信電話株式会社 音信号精製方法、音信号復号方法、これらの装置、プログラム及び記録媒体
US20230402044A1 (en) * 2020-11-05 2023-12-14 Nippon Telegraph And Telephone Corporation Sound signal refining method, sound signal decoding method, apparatus thereof, program, and storage medium
CN114040130A (zh) * 2021-11-05 2022-02-11 深圳市瑞云科技有限公司 动态切换单双声道的方法、系统及计算机可读存储介质

Also Published As

Publication number Publication date
JP2005202052A (ja) 2005-07-28

Similar Documents

Publication Publication Date Title
US7647229B2 (en) Time scaling of multi-channel audio signals
JP4471086B2 (ja) オーディオ再生装置、オーディオデータ配信サーバ、オーディオデータ配信システム、その方法及びプログラム
US6973184B1 (en) System and method for stereo conferencing over low-bandwidth links
US8457328B2 (en) Method, apparatus and computer program product for utilizing spatial information for audio signal enhancement in a distributed network environment
EP2979399B1 (en) Method and device for latency adjustment
JP2010538571A (ja) オーディオ信号のデコーディング方法及び装置
US20090292544A1 (en) Binaural spatialization of compression-encoded sound data
US20220345845A1 (en) Method, Systems and Apparatus for Hybrid Near/Far Virtualization for Enhanced Consumer Surround Sound
JPH0870344A (ja) 通信装置
US7389093B2 (en) Call method, call apparatus and call system
JP5931182B2 (ja) 付加的な出力チャンネルを提供するためのステレオ出力信号を生成する装置、方法およびコンピュータプログラム
JP2005044310A (ja) 通話装置及び著作権保護方法、並びに通話システム
JP4218456B2 (ja) 通話装置、通話方法及び通話システム
JP2010166425A (ja) 多地点会議システム、サーバ装置、音声ミキシング装置、及び多地点会議サービス提供方法
KR101495879B1 (ko) 입체 음향 실시간 생성 장치 및 이를 구비하는 입체 음향 실시간 재생 시스템
JP3977784B2 (ja) リアルタイムパケット処理装置及びその方法
JP4892090B1 (ja) 情報送信装置、情報送信方法及び情報送信用プログラム
JP4207701B2 (ja) 通話装置及び通話方法、並びに通話システム
JP2004077961A (ja) 音声復号装置
JP2007065497A (ja) 信号処理装置
JP5210788B2 (ja) 音声信号通信システム、音声合成装置、音声合成処理方法、音声合成処理プログラム、並びに該プログラムを格納した記録媒体
JP2010166424A (ja) 多地点会議システム、サーバ装置、音声ミキシング装置、及び多地点会議サービス提供方法
WO2008137364A1 (en) Selectively privatizing data transmissions in a video conference
JPS6276938A (ja) ステレオ信号伝送方法、符号化装置および復号化装置
JP2005340973A (ja) 音声中継放送システムおよび音声中継放送方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061211

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090909

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090911

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091104

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091126

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100118

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100210

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130312

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4471086

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100223

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130312

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140312

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees