JP4543586B2 - Audio reproduction apparatus and audio reproduction method - Google Patents
Audio reproduction apparatus and audio reproduction method Download PDFInfo
- Publication number
- JP4543586B2 JP4543586B2 JP2001191774A JP2001191774A JP4543586B2 JP 4543586 B2 JP4543586 B2 JP 4543586B2 JP 2001191774 A JP2001191774 A JP 2001191774A JP 2001191774 A JP2001191774 A JP 2001191774A JP 4543586 B2 JP4543586 B2 JP 4543586B2
- Authority
- JP
- Japan
- Prior art keywords
- audio
- signal
- site
- audio output
- reproduction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
【0001】
【発明の属する技術分野】
本発明は、マルチチャンネルの音声信号を同期再生する音声再生装置及び音声再生方法に関する。
【0002】
【従来の技術】
近年、オーディオ機器から再生される音声信号を臨場感を高めて聴取可能とするために、マルチチャンネルの音声信号を再生する音声再生システムの構築が考えられている。このような音声再生システムとしては、例えば、主に家庭室内や車両内等の空間における聴取を目的として、DVD(Digital Versatile Disc)等の記録媒体に記録されたマルチチャンネルの音声信号を再生するものがあり、聴取者の右前方、正面前方、左前方、右後方及び左後方に設置された5つのスピーカのそれぞれから出力されるべき5チャンネルと、音声信号の低域成分のみが記録されたサブチャンネルとを有する方式、すなわち、いわゆるドルビーAC−3(商標)5.1チャンネル方式と呼ばれるものが実用化されている。この5.1チャンネル方式による音声再生システムにおいては、実際に聴取者の右前方、正面前方、左前方、右後方及び左後方に設置された5つのスピーカと低域再生用のスピーカとを用いて再生することにより、臨場感のある音響再生を行うことができる。
【0003】
【発明が解決しようとする課題】
ところで、本件出願人は、マルチスピーカによる非常に精密な指向性、音場及び音像等の制御を実現するために、上述したような5.1チャンネル方式といったように、少数のスピーカから音声を再生可能とする音声再生システムではなく、より大規模の音声再生システムの構築を進めている。
【0004】
このような大規模な音声再生システムの構築を考えた場合、全く新規のハードウェアを設計することは勿論可能であるが、既存の汎用ハードウェアを用いて構築するのが望ましい。これは、パーソナルコンピュータに搭載可能であるいわゆるサウンドカード等の汎用ハードウェアに必要とされる機能を有する既存の安価な半導体が多く存在しており、音声再生システムを構築する上で全く新規の音声処理機構を開発するのに比べ、設計工数の効率化を計ることができ、安価に部品を調達でき、容易に設計可能であること等によるものである。
【0005】
ここで、このようなパーソナルコンピュータ等を含むハードウェアは、物理制約上又はシステム制約上、チャンネル数に制限がある場合が多い。そのため、音声再生システムとしては、1又は複数チャンネルの音声信号を出力可能なパーソナルコンピュータ等を含むハードウェアをネットワーク等を介して複数接続し、所定の局所的制御のもとに、これら複数のハードウェアから音声信号を分散して再生させることが考えられる。この際、音声再生システムにおいては、個々のハードウェアから出力される音声信号を例えばサンプル単位で完全に同期させて再生することが必要となる。
【0006】
したがって、音声再生システムにおいては、同期再生を実現するために、いわゆるリアルタイムOS(Operating System)を必要としたり、外部信号との時間同期を正確に行いつつ通信を行うことができる特殊なハードウェアを必要とし、システム全体や通信手段の複雑化を招く要因となっていた。
【0007】
また、音声再生システムにおいては、同期再生を実現するために、従来から映像等の同期手法として行われているものであり、各ハードウェアを接続する汎用ネットワークによるパケット通信によってハードウェア間のクロックを合わせることも可能である。
【0008】
しかしながら、音声再生システムにおいては、ネットワーク上のトラフィックの影響に起因して、コマンドが各ハードウェアへと到達する時間にばらつきが生じる。また、音声再生システムにおいては、様々なハードウェアを相互に接続することから、これら各ハードウェアの相違によって処理時間も多様となり、この処理時間を予測することも困難である。さらに、音声再生システムにおいては、サウンドカード自体のクロックの相違もある。このため、音声再生システムにおいては、通信セッション毎の各ハードウェア間での遅延時間を特定することは困難であり、統計的手法に頼らざるを得ず、非常に不安定なものであった。したがって、このような手法は、音声のように、例えば1/44100秒単位でサンプルレベルの同期が必要なものには不適であった。
【0009】
本発明は、このような実情に鑑みてなされたものであり、汎用の複数のハードウェアを用いて、マルチチャンネルの音声信号を精確に同期再生することができる音声再生装置及び音声再生方法を提供することを目的とするものである。
【0010】
【課題を解決するための手段】
上述した目的を達成する本発明にかかる音声再生装置は、複数チャンネルの音声信号を同期再生する音声再生装置であって、所定の基準信号を生成する基準信号生成手段と、基準信号に同期して複数チャンネルの音声信号を出力処理可能な音声出力処理器を介して、音声信号を再生して出力する互いに同期が確保されていない複数の音声出力手段と、基準信号に同期して少なくとも音声出力手段の数以上の音声信号を入力処理可能な音声入力処理器を介して、音声出力手段のそれぞれから少なくとも1チャンネル分だけ供給される信号であって音声出力手段のそれぞれにおける音声信号の再生タイミングを与えるための予行信号の入来を監視する予行信号監視手段とを備え、予行信号監視手段は、音声出力手段のそれぞれから供給された複数の予行信号の入力時間についての相対的なずれ時間を求め、ずれ時間を示す時間情報を、音声出力手段のそれぞれに対して通知し、音声出力手段は、それぞれ、時間情報に基づいて、音声信号の再生を開始すべきタイミングを決定することを特徴としている。
【0011】
このような本発明にかかる音声再生装置は、音声出力手段のそれぞれに対応する複数の予行信号の入力時間についての相対的なずれ時間を示す時間情報に基づいて、音声信号の再生を開始すべきタイミングを決定する。
【0012】
また、上述した目的を達成する本発明にかかる音声再生方法は、複数チャンネルの音声信号を同期再生する音声再生方法であって、所定の基準信号に同期して複数チャンネルの音声信号を出力処理可能な音声出力処理器を介して、音声信号を再生して出力する互いに同期が確保されていない複数の音声出力手段のそれぞれから少なくとも1チャンネル分だけ供給される信号であって、音声出力手段のそれぞれにおける音声信号の再生タイミングを与えるための予行信号を、基準信号に同期して少なくとも音声出力手段の数以上の音声信号を入力処理可能な音声入力処理器を介して予行信号監視手段に対して入力し、音声出力手段のそれぞれから供給された複数の予行信号の入力時間についての相対的なずれ時間を求めるずれ時間算出工程と、ずれ時間を示す時間情報に基づいて、音声信号の再生を開始すべきタイミングを決定する再生開始タイミング決定工程とを備えることを特徴としている。
【0013】
このような本発明にかかる音声再生方法は、音声出力手段のそれぞれに対応する複数の予行信号の入力時間についての相対的なずれ時間を示す時間情報に基づいて、音声信号の再生を開始すべきタイミングが決定される。
【0014】
【発明の実施の形態】
以下、本発明を適用した具体的な実施の形態について図面を参照しながら詳細に説明する。
【0015】
この実施の形態は、パーソナルコンピュータ等を含む複数のハードウェアを用いて、少なくとも2チャンネル以上のマルチチャンネルの音声信号を同期して再生することが可能な音声再生装置である。この音声再生装置は、マルチタスク可能であり、且つ、必ずしもリアルタイム性処理に特化していない一般的なハードウェア又はOS(Operating System)若しくはOSに相当するシステムを用いるとともに、既存のサウンドカードやインターフェース、これに準じるハードウェア等の汎用的な音声処理手段及び通信手段を用いて、複数のハードウェアにまたがって存在する音声信号のマルチチャンネルの同期再生を可能とするものである。
【0016】
なお、以下では、ハードウェアとは、各種プログラムを記憶するメモリ及び各種プログラムを実行するCPU(Central Processing Unit)又はDSP(Digital Signal Processor)等によって構成されたものとして説明する。また、以下では、ハードウェアに存在する音声信号とは、特に断りがない限り、例えばハードディスク等の記憶手段上に音声ファイルとして存在しているもの、及び、各ハードウェア上で信号処理されるか否かを問わず逐次的にメモリ上に存在する音声ストリームのいずれをも指し示すものとして説明する。さらに、以下では、各機能単位を示すモジュールを“サイト”と称するものとする。このサイトは、必ずしもハードウェア等の単位と一致するものではない。すなわち、音声再生装置は、複数のサイトが1つのハードウェアに実装されてもよく、複数のハードウェアに分散されて実装されてもよく、その構成は任意性があるものとする。
【0017】
まず、本発明の第1の実施の形態について説明する。この第1の実施の形態として図1に示す音声再生装置10は、各ハードウェア上に音声信号が音声ファイルとして分散して存在しており、これらの音声ファイルを用いて56チャンネルの音声信号の同期再生を行うものである。
【0018】
音声再生装置10は、同図に示すように、各部を制御する制御手段であるコントロールサイト11と、後述する予行信号であるトリガ信号TG1,TG2,・・・,TG8を監視する予行信号監視手段であるトリガ監視サイト12と、音声信号を再生して出力する音声出力手段である8つの音声出力サイト201,202,・・・,208(以下、音声出力サイト20n(n=1,2,・・・,8;サイト番号)と総称する。)と、所定の基準信号としてワード単位でクロックを生成する基準信号生成手段であるワードクロック生成器14と、音声出力サイト20nから出力された音声信号に対してD/A(Digital/Analog)変換を施すD/Aコンバータ及びアナログ化された音声信号を増幅するアンプ等からなる56個の出力器1511,1512,1513,1514,1515,1516,1517,1521,1522,・・・,1584,1585,1586,1587(以下、出力器15nm(n=1,2,・・・,8、m=1,2,・・・,7;チャンネル番号)と総称する。)と、これらの出力器15nmのそれぞれから出力された音声信号を外部へと放音する56個のスピーカ1611,1612,1613,1614,1615,1616,1617,1621,1622,・・・,1684,1685,1686,1687(以下、スピーカ16nm(n=1,2,・・・,8、m=1,2,・・・,7)と総称する。)とを備える。
【0019】
コントロールサイト11は、音声再生装置10の統括制御を行う機能を有するとともに、音声再生装置10とユーザとの間のインターフェースに関する機能を有するものである。コントロールサイト11は、例えばTCP/IP(Transmission Control Protocol/Internet Protocol)やUDP(User Datagram Protocol)等の所定のプロトコルにしたがって外部との通信を行うことが可能であり、ネットワークNTを介してトリガ監視サイト12及び音声出力サイト20nとの間で信号の送受信を行うことが可能とされる。音声再生装置10は、このような一般的に周知であり多く使用されるネットワークリソースや汎用の通信プロトコルを用いることにより、特別なハードウェアを用意したり、新たに構築する必要がない。コントロールサイト11は、コントロールプログラムCtを実行することが可能な環境とされており、所定の操作部や表示部等からなるユーザインターフェースUIを介してユーザによって再生コマンドが指示されると、コントロールプログラムCtの実行制御のもとに、音声ファイルの再生指示を示す制御情報をネットワークNTを介して音声出力サイト20nに対して通知する。
【0020】
トリガ監視サイト12は、少なくとも音声出力サイト20nの数以上、すなわち、8チャンネル以上の後述するトリガ信号としての音声信号を入力処理可能なサウンドカード等のサウンド処理部13を有するパーソナルコンピュータ等を含むハードウェアの機能を有するものである。トリガ監視サイト12は、コントロールサイト11と同様に、TCP/IPやUDP等の所定のプロトコルにしたがってネットワークNTを介してコントロールサイト11及び音声出力サイト20nとの間で信号の送受信を行うことが可能とされる。また、トリガ監視サイト12は、サウンド処理部13を介して音声出力サイト20nから出力される1チャンネル分の音声信号であって音声ファイルの再生タイミングを与えるための信号であるトリガ信号TG1,TG2,・・・,TG8(以下、トリガ信号TGn(n=1,2,・・・,8)と総称する。)を受信することが可能とされる。このとき、トリガ監視サイト12は、サウンド処理部13における第1チャンネルが音声出力サイト201と接続され、第2チャンネルが音声出力サイト202と接続されるといったように、各チャンネルが音声出力サイト20nのそれぞれと対応させて接続される。トリガ監視サイト12は、監視プログラムSvを実行することが可能な環境とされており、ワードクロック生成器14から供給されるワードクロックWCLK又はワード単位で各サンプルを同期せしめるのに十分なトリガ外部信号に同期して、サウンド処理部13における処理を行う。
【0021】
トリガ監視サイト12は、コントロールサイト11から全ての音声出力サイト20nに対して音声ファイルの再生指示を示す制御情報が出力されると、監視プログラムSvの実行制御のもとに、音声出力サイト20nのそれぞれから出力されるトリガ信号TGnの入来を監視する。トリガ監視サイト12は、トリガ信号TGnを受け取ると、これらのトリガ信号TGnに基づいて、音声出力サイト20nのそれぞれに対応する後述する遅れサンプル数を求め、これらの遅れサンプル数を示す遅れサンプル数情報をネットワークNTを介して音声出力サイト20nに対してそれぞれ出力する。ここで、遅れサンプル数とは、トリガ監視サイト12に対するトリガ信号TGnの入力時間についての相対的なずれ時間をワードクロックWCLK単位で求めたものである。
【0022】
なお、トリガ監視サイト12が取り扱う音声信号の種別としては、ディジタルデータが望ましいが、サウンド処理部13において、ワードクロックWCLKやトリガ信号TGnを正確に感知でき且つ送受信可能であるならば、アナログデータでもよい。また、トリガ監視サイト12においては、ディジタルデータを取り扱う場合であっても、例えばサンプリングレートや圧縮又は非圧縮の別といったデータフォーマットはいかなるものであってもよい。
【0023】
音声出力サイト20nは、それぞれ、例えば8チャンネルの音声信号を出力処理可能なサウンドカード等のサウンド処理部211,212,・・・,218(以下、サウンド処理部21n(n=1,2,・・・,8)と総称する。)を有するパーソナルコンピュータ等を含むハードウェアの機能を有するものである。音声出力サイト20nは、それぞれ、コントロールサイト11及びトリガ監視サイト12と同様に、TCP/IPやUDP等の所定のプロトコルにしたがってネットワークNTを介してコントロールサイト11及びトリガ監視サイト12との間で信号の送受信を行うことが可能とされる。また、音声出力サイト20nは、それぞれ、サウンド処理部21nにおける例えば第8チャンネルのみをトリガ監視サイト12と接続しており、このチャンネルを用いてトリガ監視サイト12に対して1チャンネル分の音声信号であるトリガ信号TGnを出力することが可能とされる。音声出力サイト20nは、それぞれ、再生処理プログラムA1,A2,・・・,A8(以下、再生処理プログラムAn(n=1,2,・・・,8)と総称する。)を実行することが可能な環境とされており、ワードクロック生成器14から供給されるワードクロックWCLK又はワード単位で各サンプルを同期せしめるのに十分なトリガ外部信号に同期して、サウンド処理部21nにおける処理を行う。このとき、音声出力サイト20nにおいては、それぞれ、サウンド処理部21nにおける第1チャンネル乃至第8チャンネルの間の同期は確保されているものとする。すなわち、音声出力サイト20nにおいては、それぞれ、後述するように、コントロールサイト11から再生指示を受け取った場合には、サウンド処理部21nにおける第1チャンネル乃至第8チャンネルから同時に音声信号を出力する。また、音声出力サイト20nは、それぞれ、図示しない記憶手段に、音声ファイルAF1,AF2,・・・,AF8(以下、音声ファイルAFn(n=1,2,・・・,8)と総称する。)を記憶している。
【0024】
音声出力サイト20nは、それぞれ、コントロールサイト11からネットワークNTを介して供給される音声ファイルAFnの再生指示を示す制御情報を受け取ると、再生処理プログラムAnの実行制御のもとに、サウンド処理部21nを介してトリガ信号TGnをトリガ監視サイト12に対して出力する。なお、このトリガ信号TGnは、トリガ監視サイト12によってトリガとして認識できる所定の波形を有する音声信号であり、例えばインパルス信号等が望ましい。また、音声出力サイト20nは、それぞれ、トリガ監視サイト12からネットワークNTを介して遅れサンプル数情報を受け取ると、この遅れサンプル数と後述する再生マージンサンプル数とに基づいて、音声ファイルAFnの再生を開始すべきタイミングを決定し、このタイミングで音声ファイルAFnの再生を開始し、出力器15nm及びスピーカ16nmを介して外部へと放音させる。なお、音声出力サイト20nは、それぞれ、サウンド処理部211における第1チャンネル乃至第7チャンネルがそれぞれ出力器151mと接続されるといったように、各チャンネルから出力される音声信号を、対応する出力器15nmに対して出力する。
【0025】
なお、各音声出力サイト20nが取り扱う音声信号の種別としては、トリガ監視サイト12と同様に、ディジタルデータが望ましいが、サウンド処理部21nにおいて、ワードクロックWCLKやトリガ信号TGnを正確に感知でき且つ送受信可能であるならば、アナログデータでもよい。また、音声出力サイト20nにおいては、それぞれ、ディジタルデータを取り扱う場合であっても、例えばサンプリングレートや圧縮又は非圧縮の別といったデータフォーマットはいかなるものであってもよい。
【0026】
ワードクロック生成器14は、ワード単位で正確なクロックを生成する。ワードクロック生成器14は、生成したワードクロックWCLKを、トリガ監視サイト12におけるサウンド処理部13及び音声出力サイト20nにおけるサウンド処理部21nに供給する。なお、ワードクロック生成器14は、ワード単位で各サンプルを同期せしめるのに十分なトリガ外部信号を生成するようにしてもよい。
【0027】
出力器15nmは、それぞれ、音声出力サイト20nから出力された音声信号に対してD/A変換を施した後増幅する。出力器15nmは、それぞれ、増幅した音声信号をスピーカ16nmに対して出力する。
【0028】
スピーカ16nmは、それぞれ、出力器15nmのそれぞれから出力された電気的な音声信号を音響エネルギへと変換し、外部へと放音する。
【0029】
このような各部を備える音声再生装置10においては、音声出力サイト20nのそれぞれに記憶されている音声ファイルAFnの再生指示を示す制御情報がコントロールサイト11によって与えられると、音声出力サイト20nのそれぞれから、トリガ監視サイト12に対してトリガ信号TGnが出力される。音声再生装置10においては、トリガ監視サイト12により、トリガ信号TGnに基づいて、音声出力サイト20nのそれぞれに対応する遅れサンプル数を求める。そして、音声再生装置10においては、各音声出力サイト20nにより、この遅れサンプル数と再生マージンサンプル数とに基づいて、自己が再生を開始すべきタイミングを求め、このタイミングに到達した時間に音声ファイルAFnの再生を開始することができる。音声再生装置10においては、このようにして、全ての音声出力サイト20nによる音声ファイルAFnの再生開始のタイミングを一致させることができる。そして、音声再生装置10においては、それ以後、ワードクロック生成器14から供給されるワードクロックWCLKに基づいて音声出力サイト20nによって再生を進行することにより、マルチチャンネルの同期再生を行うことができる。
【0030】
なお、音声再生装置10においては、例えば、音声出力サイト201がコントロールサイト11及び/又はトリガ監視サイト12の機能を兼ね備えていたり、他の音声出力サイト202の機能を兼ね備るといったように、複数のサイトが1つのハードウェアに実装されたり、複数のハードウェアに分散されて実装されることが可能であることは、上述したとおりである。
【0031】
このような音声再生装置10においては、音声出力サイト20nは、それぞれ、再生処理プログラムAnを実行し、図2に示す一連の工程を経ることによって音声ファイルAFnの再生を開始する。
【0032】
まず、音声出力サイト20nには、それぞれ、同図に示すように、ステップS1において、再生マージンサンプル数Smが設定される。この再生マージンサンプル数Smは、音声出力サイト20nの間において共通の値である。具体的には、再生マージンサンプル数Smは、後述する基準サンプルから音声ファイルAFnの再生開始時のサンプルまでの時間を表す値である。再生マージンサンプル数Smは、例えば後述する各種処理が終了するのに十分な時間を見込んで算出される値であり、ユーザによって設定されてもよく、自動的に設定されてもよい。音声出力サイト20nは、それぞれ、設定された再生マージンサンプル数Smを図示しないメモリ等に記憶する。
【0033】
続いて、音声出力サイト20nは、それぞれ、ステップS2において、コントロールサイト11からネットワークNTを介して音声ファイルAFnの再生指示を示す制御情報が到達したか否かを判別する。なお、音声出力サイト20nには、コントロールサイト11からの再生指示がネットワークNTを介して与えられることから、制御情報が到達する絶対的な時刻は、ネットワークトラフィックの影響等に起因して音声出力サイト20nの間でばらつきが生じる。音声出力サイト20nは、それぞれ、コントロールサイト11からの制御情報が到達するまで待機し、制御情報を受け取った時点で、ステップS3へと処理を移行する。
【0034】
音声出力サイト20nは、それぞれ、ステップS3において、サウンド処理部21nにおける例えば第8チャンネル(m=8)、すなわち、トリガ監視サイト12と接続しているトリガチャンネルに、例えばインパルス信号等の音声信号であるトリガ信号TGnを再生する。なお、音声出力サイト20nのそれぞれからトリガ信号TGnが再生される絶対的な時刻は、音声出力サイト20nが、それぞれ、異なる種類のサウンド処理部21nを搭載している場合があること、同一種類のサウンド処理部21nを搭載していても処理能力には若干のばらつきがあること、マルチタスクで動作している他のタスクの動作状況等に起因して予測不可能である。
【0035】
これと同時に、音声出力サイト20nは、それぞれ、ステップS4において、トリガ信号TGnを再生してトリガ監視サイト12に対して出力した時点のサンプルSnを基準として、再生サンプル数のカウントを開始する。音声出力サイト20nにおいては、それぞれ、このサンプルSnを基準として、音声ファイルAFnの再生開始のタイミングが決定されることになる。
【0036】
さらにこれと同時に、音声出力サイト20nは、それぞれ、ステップS5において、トリガチャンネル以外のチャンネル、すなわち、第1チャンネル乃至第7チャンネル(m=1〜7)に“0”を出力する。すなわち、音声出力サイト20nは、それぞれ、ステップS3において、第8チャンネルにトリガ信号TGnを再生するのに対応して、第1チャンネル乃至第7チャンネルをミュートする。
【0037】
そして、音声出力サイト20nは、それぞれ、ステップS6において、再生サンプル数のカウントを継続し、ステップS7において、トリガ監視サイト12から対応する遅れサンプル数Sdn(n=1,2,・・・,8)を示す遅れサンプル数情報がネットワークNTを介して到達したか否かを判別する。なお、音声出力サイト20nには、トリガ監視サイト12からの遅れサンプル数情報がネットワークNTを介して与えられることから、遅れサンプル数情報が到達する絶対的な時刻は、ネットワークトラフィックの影響等に起因して音声出力サイト20nの間でばらつきが生じる。
【0038】
ここで、遅れサンプル数情報が到達していない場合には、音声出力サイト20nは、それぞれ、ステップS5乃至ステップS6の処理を繰り返す。
【0039】
一方、遅れサンプル数情報が到達した場合には、音声出力サイト20nは、それぞれ、ステップS8において、“(再生マージンサンプル数Sm)−(遅れサンプル数Sdn)”の値を算出し、トリガ監視サイト12に対してトリガ信号TGnを出力した時点のサンプルからカウントして、この算出した値が経過したサンプルに到達した時点から、音声ファイルAFnの再生を開始し、一連の処理を終了する。
【0040】
このようにして、音声再生装置10においては、音声出力サイト20nのそれぞれによって再生処理プログラムAnを実行し、音声ファイルAFnの再生を同時に開始することができる。なお、音声再生装置10においては、それ以後、音声出力サイト20nが、それぞれ、ワードクロック生成器14から供給されるワードクロックWCLKに基づいて音声ファイルAFnの再生を進行することにより、マルチチャンネルの同期再生が可能となる。
【0041】
一方、音声再生装置10においては、トリガ監視サイト12は、監視プログラムSvを実行し、図3に示す一連の工程を経ることによって音声出力サイト20nのそれぞれに対応する遅れサンプル数Sd1,Sd2,・・・,Sd8(以下、遅れサンプル数Sdn(n=1,2,・・・,8)と総称する。)を求める。
【0042】
まず、トリガ監視サイト12は、同図に示すように、ステップS11において、音声出力サイト20nのそれぞれからサウンド処理部13における各チャンネルに出力されるトリガ信号TGnの入来を監視する。
【0043】
続いて、トリガ監視サイト12は、ステップS12において、サウンド処理部13における8つのチャンネルのうちのいずれかのチャンネルに、トリガ信号TGnのいずれかが供給されたか否かを判別する。
【0044】
ここで、トリガ信号TGnのいずれかが供給されていない場合には、トリガ監視サイト12は、ステップS11へと処理を移行し、トリガ信号TGnのいずれかが供給されるまで監視し続ける。
【0045】
一方、トリガ信号TGnのいずれかが供給された場合には、トリガ監視サイト12は、ステップS13において、供給されたトリガ信号TGnが最初に供給されたものであるか否か、すなわち、初めてトリガ信号TGnが供給されたのか否かを判別する。
【0046】
ここで、トリガ信号TGnが最初に供給されたものでない場合には、トリガ監視サイト12は、ステップS15へと処理を移行する。一方、トリガ信号TGnが最初に供給されたものであった場合には、トリガ監視サイト12は、ステップS14において、この最初に検出したトリガ信号TGnが入力された時点のサンプルを基準サンプルとして、入力サンプル数のカウントを開始し、ステップS15へと処理を移行する。トリガ監視サイト12においては、この基準サンプルに基づいて、入力サンプル数をカウントすることによって他のトリガ信号TGnの入力時刻を計測することになる。
【0047】
そして、トリガ監視サイト12は、ステップS15において、ステップS14にて基準サンプルを基点としてカウントを開始しているカウント値を遅れサンプル数Sdnとし、トリガ信号TGnを出力した対応する音声出力サイト20nに対して、この遅れサンプル数Sdnを示す遅れサンプル数情報をネットワークNTを介して出力する。なお、トリガ監視サイト12は、最初にトリガ信号TGnを出力した音声出力サイト20nに対しては、遅れサンプル数Sdn=0を通知することはいうまでもない。
【0048】
続いて、トリガ監視サイト12は、ステップS16において、入力サンプル数のカウントを継続し、ステップS17において、全ての音声出力サイト20nからトリガ信号TGnを受信したか否かを判別する。
【0049】
ここで、全ての音声出力サイト20nからトリガ信号TGnを受信していない場合には、トリガ監視サイト12は、ステップS11乃至ステップS16の処理を繰り返す。
【0050】
一方、全ての音声出力サイト20nからトリガ信号TGnを受信した場合には、トリガ監視サイト12は、そのまま一連の処理を終了する。
【0051】
なお、音声出力サイト20nのいずれかが故障等によってトリガ信号TGnをトリガ監視サイト12に与えない場合があり得るが、この場合には、トリガ監視サイト12は、ステップS17からステップS11へと移行するループ処理を適宜抜けるようにしてもよい。
【0052】
このようにして、音声再生装置10においては、トリガ監視サイト12によって監視プログラムSvを実行し、音声出力サイト20nのそれぞれに対応する遅れサンプル数Sdnを求めることができ、音声出力サイト20nによる同期再生を実現させることが可能となる。
【0053】
このようなプログラムを実行するトリガ監視サイト12及び音声出力サイト20nを備える音声再生装置10においては、例えば図4に示すタイミングにしたがって各動作が協調して行われる。
【0054】
すなわち、音声再生装置10においては、ワードクロック生成器14によって生成されるワードクロックWCLKに基づいて、トリガ監視サイト12及び音声出力サイト20nが動作する。音声再生装置10においては、同図上段に示すように、ユーザインターフェースUIを介して再生コマンドが指示されると、この再生指示を示す制御情報がコントロールサイト11から音声出力サイト20nのそれぞれにネットワークNTを介して通知される。この制御情報が到達する絶対的な時刻は、上述したように、ネットワークトラフィックの影響等に起因して、音声出力サイト20nの間でばらつきが生じる。ここでは、同図中段に示すように、音声出力サイト201が最も早く制御情報を受信し、音声出力サイト208,音声出力サイト202の順序で制御情報を受信したものとする。
【0055】
すると、音声再生装置10においては、上述したように、音声出力サイト20nからトリガ監視サイト12に対してトリガ信号TGnが与えられる。この音声出力サイト20nのそれぞれからトリガ信号TGnが再生される絶対的な時刻は、上述したように、音声出力サイト20nにおけるサウンド処理部21nの相違や図示しないCPU等の処理能力等に起因して、音声出力サイト20nの間でばらつきが生じる。ここでは、同図中段に示すように、音声出力サイト201が最も早いサンプルS1の時点でトリガ信号TG1を再生し、以後、サンプルS8,S2の時点で音声出力サイト208,音声出力サイト202の順序でトリガ信号TG8,TG2を再生したものとする。音声出力サイト20nは、それぞれ、これらのトリガ信号TGnが出力された時点のサンプルSnを基準として、再生サンプル数のカウントを開始する。また、ここでは、最も早くトリガ信号TG1が再生されたサンプルS1を基準サンプルとしている。
【0056】
これに対応して、音声再生装置10においては、上述したように、トリガ監視サイト12によって基準サンプルであるサンプルS1から入力サンプル数のカウントを開始し、同図下段に示すように、遅れサンプル数Sdnを算出する。音声再生装置10においては、これらの遅れサンプル数Sdnが対応する音声出力サイト20nに対して通知される。この遅れサンプル数Sdnが到達する絶対的な時刻は、上述したように、ネットワークトラフィックの影響等に起因して、音声出力サイト20nの間でばらつきが生じる。ここでは、同図中段に示すように、音声出力サイト201が最も早く遅れサンプル数情報を受信し、音声出力サイト202,音声出力サイト208の順序で遅れサンプル数情報を受信したものとする。
【0057】
そして、音声再生装置10においては、音声出力サイト20nのそれぞれにより、トリガ監視サイト12に対してトリガ信号TGnを出力した時点のサンプルSnからカウントして、(再生マージンサンプル数Sm−遅れサンプル数Sdn)サンプル目から、音声ファイルAFnの再生が一斉に開始される。なお、再生マージンサンプル数Smは、少なくとも以下の工程、すなわち、再生指示を示す制御情報を受信した音声出力サイト20nがトリガ信号TGnを出力する工程、トリガ監視サイト12が全ての音声出力サイト20nからトリガ信号TGnを受信する工程、トリガ監視サイト12が音声出力サイト20nのそれぞれに対して遅れサンプル数Sdnを通知する工程、及び、全ての音声出力サイト20nが遅れサンプル数Sdnを受信し、音声ファイルAFnの再生動作を開始する工程を行うのに十分な時間を見込んで算出される値である。
【0058】
音声再生装置10においては、音声出力サイト20n間における音声ファイルAFnの再生開始位置を一定にし、それ以後は、ワードクロック生成器14によって生成されるワードクロックWCLKに基づいて同期を保ちながら音声ファイルAFnの再生を進行する。
【0059】
以上のように、本発明の第1の実施の形態として示す音声再生装置10は、各音声出力サイト20n上に分散して存在している音声ファイルAFnを用いて、マルチチャンネルの同期再生を行うことができる。特に、音声再生装置10は、互いに同期が確保されておらず、動作環境が多種多様にわたる音声出力サイト20nを用いた場合であっても、確実に同期再生を実現することができる。音声再生装置10は、例えば、Mチャンネルの同時再生が可能なサウンド処理部を用いて、トリガ監視サイト12及びn個の音声出力サイト20nを構成することにより、(M−1)×nチャンネルの同期再生を実現することが可能となる。
【0060】
なお、音声再生装置10においては、上述したコントロールサイト11の役割としては、ユーザがユーザインターフェースUIを操作したタイミングで再生を行うための再生指示を示す制御情報を発信することである。しかしながら、ユーザがユーザインターフェースUIを操作して再生指示が出されたタイミングから再生開始までの時間は、最初のトリガ信号TGnが再生されるまでの時間と、設定した再生マージンサンプル数Smとの和によって規定される。そして、これらの時間は、ネットワークトラフィックやハードウェアの処理負荷等の要因によって毎回ばらつきが生じるものである。したがって、音声再生装置10においては、再生開始の絶対時刻を問題とするのではなく、あくまでも再生開始のタイミングを一致させることを目的とし、絶対時刻に関しては問題とならない場合を対象としていることに注意されたい。
【0061】
また、上述した実施の形態では、コントロールサイト11によって再生指示のみを与えるものとして説明したが、音声再生装置10においては、例えば、「停止」、「一時停止」、必要に応じて「巻き戻し」及び「早送り」等に相当するコマンドに対応した指示を与えることもできる。例えば、音声再生装置10においては、再生開始後も再生サンプルのカウントを継続し、各音声ファイルAFnにおけるどの時点で停止するか、又は、復帰再生するか、といった情報をコントロールサイト11を介して音声出力サイト20nに与えたり、音声ファイルAFnの再生位置の指定を行うことにより、音声出力サイト20nによる再生処理プログラムAnの実行制御のもとに統一のとれた動作を実現することができる。
【0062】
さらに、音声再生装置10においては、コントロールサイト11は必ずしも備える必要はない。音声再生装置10は、コントロールサイト11を備える代わりに、音声出力サイト20nのそれぞれが有するタイマ等を利用して、予め設定された時刻に同期再生を開始する、といったことも実現可能である。ただし、この場合、音声再生装置10においては、音声出力サイト20nのそれぞれが有するタイマのずれ時間を想定して再生マージンサンプル数Smの値を設定するか、再生マージンサンプル数Smの値以内に収まるように、各タイマをネットワークNTを介して調整する必要がある。
【0063】
さらにまた、音声再生装置10においては、各サイトとしてパーソナルコンピュータを用いたり、サウンド処理部としてサウンドカードを用いなくとも、当該機能を実現可能なハードウェアであればよい。
【0064】
また、音声再生装置10においては、TCP/IPやUDP等の所定のプロトコルにしたがってネットワークNTを介した通信を行うものとして説明したが、トリガ監視サイト12から音声出力サイト20nに対して遅れサンプル数Sdnを通知可能であるならば、いかなるネットワーク階層のフォーマットであってもよいことはいうまでもない。
【0065】
さらに、上述した実施の形態では、再生マージンサンプル数Smとして固定値を用いるものとして説明したが、例えば、音声再生装置10においては、トリガ監視サイト12による監視プログラムSvの実行制御のもとに、各音声出力サイト20nの遅れサンプル数Sdnを算出した後、通信及び音声信号出力に際する遅れを十分に見込んだ値を再生マージンサンプル数Smとして算出し、ネットワークNTを通じて各音声出力サイト20nに通知して設定するようにしてもよい。このとき、音声再生装置10は、ネットワークNTを介した通信を行う際に生じる遅れを統計的に測定し、この統計情報を用いて再生マージンサンプル数Smを設定することもできる。
【0066】
さらにまた、上述した実施の形態では、サウンド処理部をワードクロックWCLKに同期させるものとして説明したが、音声再生装置10においては、ワードクロックに限らず、サウンド処理部において同期を確保するような機構であれば、例えば、256倍クロックや1/2ワード単位のクロック、又は、SMPTE(Society of Motion Picture and Television Engineers)のような一般的なコードに対応するものであってもよい。
【0067】
また、上述した実施の形態では、トリガ監視サイト12において入力サンプル数のカウントが開始される基準サンプルとして、最も早くトリガ信号TGnが再生された時点のサンプルSnを採用するものとして説明したが、音声再生装置10においては、トリガ監視サイト12によって任意時刻での特定サンプルを規定することができ、相対的に遅れサンプル数Sd1,Sd2,・・・,Sd8の時間関係が保たれた情報が各音声出力サイト20nに通知可能であるならば、基準サンプルはいかなる時間のものであってもよい。
【0068】
さらに、上述した実施の形態では、音声信号が音声ファイルAFnとして存在するものとして説明したが、音声再生装置10においては、逐次的にメモリ上に音声ストリームとして存在するものであってもよい。
【0069】
つぎに、本発明の第2の実施の形態について説明する。この第2の実施の形態として図5に示す音声再生装置30は、56チャンネルの音声ファイルがまとまって存在しており、8チャンネルの音声信号を出力処理可能な8つの音声出力サイトを用いて、56チャンネルの音声信号の同期再生を行うものである。したがって、上述した第1の実施の形態として示した音声再生装置10と同様の機能を有する各部については同一符号を付し、詳細な説明を省略するものとする。
【0070】
音声再生装置30は、同図に示すように、上述したトリガ監視サイト12と、ワードクロック生成器14と、56個の出力器15nmと、56個のスピーカ16nmとの他、記憶している56チャンネルの音声ファイルAFを配信する配信サイト31と、音声信号を再生して出力する8つの音声出力サイト401,402,・・・,408(以下、音声出力サイト40n(n=1,2,・・・,8;サイト番号)と総称する。)とを備える。
【0071】
配信サイト31は、上述したコントロールサイト11と同様に、音声再生装置30の統括制御を行う機能を有するとともに、音声再生装置30とユーザとの間のユーザインターフェースUIを有するのに加え、さらに、56チャンネルの音声ファイルAFを図示しない記憶手段に記憶するものである。この配信サイト31に記憶されている音声ファイルAFは、所定のフォーマットで圧縮されていてもよく、非圧縮であってもよい。配信サイト31は、例えばTCP/IPやUDP等の所定のプロトコルにしたがって外部との通信を行うことが可能であり、56チャンネルの音声ファイルAFを伝送するのに十分な容量を有するネットワークNTを介してトリガ監視サイト12及び音声出力サイト40nとの間で信号の送受信を行うことが可能とされる。配信サイト31は、配信プログラムDsを実行することが可能な環境とされており、所定の操作部や表示部等からなるユーザインターフェースUIを介してユーザによって再生コマンドが指示されると、配信プログラムDsの実行制御のもとに、音声ファイルAFの再生指示を示す制御情報をネットワークNTを介して音声出力サイト40nに対して通知するとともに、56チャンネルの音声ファイルAFをストリームデータとして、7チャンネル分ずつ音声出力サイト40nに対して配信する。なお、ネットワークNTを介して伝送される音声ストリームは、所定のフォーマットで圧縮されていてもよく、非圧縮であってもよい。
【0072】
音声出力サイト40nは、それぞれ、上述した音声出力サイト20nと同様に、例えば8チャンネルの音声信号を出力処理可能なサウンドカード等のサウンド処理部411,412,・・・,418(以下、サウンド処理部41n(n=1,2,・・・,8)と総称する。)を有するパーソナルコンピュータ等を含むハードウェアの機能を有するものである。音声出力サイト40nは、それぞれ、配信サイト31及びトリガ監視サイト12と同様に、TCP/IPやUDP等の所定のプロトコルにしたがってネットワークNTを介して配信サイト31及びトリガ監視サイト12との間で信号の送受信を行うことが可能とされる。また、音声出力サイト40nは、それぞれ、サウンド処理部41nにおける例えば第8チャンネルのみをトリガ監視サイト12と接続しており、このチャンネルを用いてトリガ監視サイト12に対してトリガ信号TGnを出力することが可能とされる。
音声出力サイト40nは、それぞれ、再生処理プログラムB1,B2,・・・,B8(以下、再生処理プログラムBn(n=1,2,・・・,8)と総称する。
)を実行することが可能な環境とされており、ワードクロック生成器14から供給されるワードクロックWCLK又はワード単位で各サンプルを同期せしめるのに十分なトリガ外部信号に同期して、サウンド処理部41nにおける処理を行う。このとき、音声出力サイト40nにおいては、それぞれ、サウンド処理部41nにおける第1チャンネル乃至第8チャンネルの間の同期は確保されているものとする。すなわち、音声出力サイト40nにおいては、それぞれ、配信サイト31から再生指示を受け取った場合には、サウンド処理部41nにおける第1チャンネル乃至第8チャンネルから同時に音声信号を出力する。また、音声出力サイト40nは、それぞれ、配信サイト31から配信される音声ストリームを一時的に記憶する図示しないバッファを有しており、配信サイト31から配信される音声ストリームをこのバッファに逐次的に記憶する。音声出力サイト40nにおいては、音声ストリームが所定のフォーマットで圧縮されている場合には、これらの音声ストリームがバッファに記憶されると、このバッファを介して所定のデコード処理が行われる。そして、音声出力サイト40nにおいては、バッファからは、音声ストリームが所定容量以上記憶されると読み出され、外部へと出力される。なお、以下では、各音声出力サイト40nに配信される音声ストリームを、それぞれ、AS1,AS2,・・・,AS8(以下、音声ストリームASn(n=1,2,・・・,8)と総称する。)と称するものとする。
【0073】
音声出力サイト40nは、それぞれ、配信サイト31からネットワークNTを介して供給される再生指示を示す制御情報を受け取ると、再生処理プログラムBnの実行制御のもとに、サウンド処理部41nを介してトリガ信号TGnをトリガ監視サイト12に対して出力する。この間、音声出力サイト40nには、それぞれ、音声ストリームASnが配信されており、音声出力サイト40nは、それぞれ、配信された音声ストリームASnを図示しないバッファにストリーム順に記憶する。また、音声出力サイト40nは、それぞれ、トリガ監視サイト12からネットワークNTを介して遅れサンプル数情報を受け取ると、この遅れサンプル数Sdnと再生マージンサンプル数Smとに基づいて、バッファの先頭地点からデコードした音声ストリームASnの再生を開始し、出力器15nm及びスピーカ16nmを介して外部へと放音させる。
【0074】
このような各部を備える音声再生装置30においては、配信サイト31に一括して記憶されている56チャンネルの音声ファイルAFの再生指示を示す制御情報が与えられると、音声ファイルAFが7チャンネルの音声ストリームASnとして、音声出力サイト40nのそれぞれに配信されるとともに、音声出力サイト40nのそれぞれから、トリガ監視サイト12に対してトリガ信号TGnが出力される。音声再生装置30においては、トリガ監視サイト12により、トリガ信号TGnに基づいて、音声出力サイト40nのそれぞれに対応する遅れサンプル数Sdnを求める。そして、音声再生装置30においては、各音声出力サイト40nにより、この遅れサンプル数Sdnと再生マージンサンプル数Smとに基づいて、自己が再生を開始すべきタイミングを求め、このタイミングに到達した時間に音声ストリームASnの再生を開始することができる。音声再生装置30においては、このようにして、全ての音声出力サイト40nによる音声ストリームASnの再生開始のタイミングを一致させることができる。そして、音声再生装置30においては、それ以後、ワードクロック生成器14から供給されるワードクロックWCLKに基づいて音声出力サイト40nによって再生を進行することにより、マルチチャンネルの同期再生を行うことができる。
【0075】
具体的には、音声再生装置30においては、音声出力サイト40nは、それぞれ、再生処理プログラムBnを実行し、図6に示す一連の工程を経ることによって音声ストリームASnの再生を開始する。
【0076】
まず、音声出力サイト40nには、それぞれ、同図に示すように、ステップS21において、再生マージンサンプル数Smが設定される。この再生マージンサンプル数Smは、上述した音声再生装置10の場合と同様に、再生指示を示す制御情報を受信した音声出力サイト40nがトリガ信号TGnを出力する工程、トリガ監視サイト12が全ての音声出力サイト40nからトリガ信号TGnを受信する工程、トリガ監視サイト12が音声出力サイト40nのそれぞれに対して遅れサンプル数Sdnを通知する工程、全ての音声出力サイト40nが遅れサンプル数Sdnを受信し、音声ストリームASnの再生動作を開始する工程を行うのに十分な時間に加え、バッファに音声ストリームASnが所定容量以上記憶されるのに十分な時間を見込んで算出される値である。
【0077】
続いて、音声出力サイト40nは、それぞれ、ステップS22において、配信サイト31からネットワークNTを介して音声ファイルAFの再生指示を示す制御情報が到達したか否かを判別する。音声出力サイト40nは、それぞれ、配信サイト31からの制御情報が到達するまで待機し、制御情報を受け取った時点で、ステップS23へと処理を移行する。
【0078】
音声出力サイト40nは、それぞれ、ステップS23において、サウンド処理部41nにおけるトリガチャンネルに、トリガ信号TGnを再生する。
【0079】
これと同時に、音声出力サイト40nは、それぞれ、ステップS24において、トリガ信号TGnを再生してトリガ監視サイト12に対して出力した時点のサンプルSnを基準として、再生サンプル数のカウントを開始する。音声出力サイト40nにおいては、それぞれ、このサンプルSnを基準として、音声ストリームASnの再生開始のタイミングが決定されることになる。
【0080】
さらにこれと同時に、音声出力サイト40nは、それぞれ、ステップS25において、トリガチャンネル以外のチャンネルに“0”を出力する。
【0081】
そして、音声出力サイト40nは、それぞれ、ステップS26において、再生サンプル数のカウントを継続し、ステップS27において、トリガ監視サイト12から対応する遅れサンプル数Sdnを示す遅れサンプル数情報がネットワークNTを介して到達したか否かを判別する。
【0082】
ここで、遅れサンプル数情報が到達していない場合には、音声出力サイト40nは、それぞれ、ステップS25乃至ステップS26の処理を繰り返す。一方、遅れサンプル数情報が到達した場合には、音声出力サイト40nは、それぞれ、ステップS28において、“(再生マージンサンプル数Sm)−(遅れサンプル数Sdn)”の値を算出し、トリガ監視サイト12に対してトリガ信号TGnを出力した時点のサンプルからカウントして、この算出した値が経過したサンプルに到達した時点から、バッファに記憶されている音声ストリームASnの再生を開始し、一連の処理を終了する。
【0083】
一方、音声再生装置30においては、トリガ監視サイト12は、監視プログラムSvを実行し、先に図3に示した一連の工程を経ることによって音声出力サイト40nのそれぞれに対応する遅れサンプル数Sdnを求めることができる。
【0084】
このようにして、音声再生装置30においては、トリガ監視サイト12によって監視プログラムSvを実行するとともに、音声出力サイト40nのそれぞれによって再生処理プログラムBnを実行し、音声ファイルAFを構成する音声ストリームASnの再生を同時に開始することができる。なお、音声再生装置30においては、それ以後、音声出力サイト40nが、それぞれ、ワードクロック生成器14から供給されるワードクロックWCLKに基づいて音声ストリームASnの再生を進行することにより、マルチチャンネルの同期再生が可能となる。
【0085】
以上のように、本発明の第2の実施の形態として示す音声再生装置30は、配信サイト31上に存在している音声ファイルAFを、各音声出力サイト40nが出力処理可能なチャンネル数分に分割して各音声出力サイト40nに配信し、配信された音声ストリームASnを用いて、マルチチャンネルの同期再生を行うことができる。特に、音声再生装置30は、互いに同期が確保されておらず、動作環境が多種多様にわたる音声出力サイト40nを用いた場合であっても、確実に同期再生を実現することができる。
【0086】
つぎに、本発明の第3の実施の形態について説明する。この第3の実施の形態として図7に示す音声再生装置50は、1つのソース信号に対して各音声出力サイトによって所定の信号処理を施し、56チャンネルの音声信号の同期再生を行うものである。より換言すれば、音声再生装置50は、1チャンネルの音声ファイルを各音声出力サイトに対してマルチキャスト配信し、配信された音声ファイルに対して各音声出力サイトによってチャンネル単位で個別の信号処理を施して同期再生することにより、例えばマルチスピーカを用いた制御、すなわち、従来ではハードウェアの能力やスピーカのチャンネル数の制限等によって小規模のシステムしか構成できず効果が低かった指向性、音場及び音像制御を、効果的に実現可能とするものである。なお、ここでも、上述した第1の実施の形態として示した音声再生装置10又は第2の実施の形態として示した音声再生装置30と同様の機能を有する各部については同一符号を付し、詳細な説明を省略するものとする。
【0087】
音声再生装置50は、同図に示すように、上述したトリガ監視サイト12と、ワードクロック生成器14と、56個の出力器15nmと、56個のスピーカ16nmとの他、記憶している1チャンネルのソースファイルである音声ファイルAFを出力するソース出力サイト51と、音声信号を再生して出力する8つの音声出力サイト601,602,・・・,608(以下、音声出力サイト60n(n=1,2,・・・,8;サイト番号)と総称する。)とを備える。
【0088】
ソース出力サイト51は、上述したコントロールサイト11又は配信サイト31と同様に、音声再生装置50の統括制御を行う機能を有するとともに、音声再生装置50とユーザとの間のユーザインターフェースUIを有するのに加え、さらに、音声ファイルAFを図示しない記憶手段に記憶するものである。なお、このソース出力サイト51に記憶されている音声ファイルAFは、1チャンネルであるものとして説明するが、複数チャンネルからなるものであってもよい。また、音声ファイルAFは、所定のフォーマットで圧縮されていてもよく、非圧縮であってもよい。ソース出力サイト51は、例えばTCP/IPやUDP等の所定のプロトコルにしたがって外部との通信を行うことが可能であり、ネットワークNTを介してトリガ監視サイト12及び音声出力サイト60nとの間で信号の送受信を行うことが可能とされる。ソース出力サイト51は、ソース出力プログラムSoを実行することが可能な環境とされており、所定の操作部や表示部等からなるユーザインターフェースUIを介してユーザによって再生コマンドが指示されると、ソース出力プログラムSoの実行制御のもとに、音声ファイルAFの再生指示を示す制御情報をネットワークNTを介して音声出力サイト60nに対して通知するとともに、1チャンネルの音声ファイルAFをそのまま又はストリームデータとして、全ての音声出力サイト60nに対してマルチキャスト配信する。なお、ネットワークNTを介して伝送される音声信号は、所定のフォーマットで圧縮されていてもよく、非圧縮であってもよい。ここでは、音声出力サイト60nに対して音声ファイルAFがそのままマルチキャスト配信されるものとする。
【0089】
音声出力サイト60nは、それぞれ、上述した音声出力サイト20n又は音声出力サイト40nと同様に、例えば8チャンネルの音声信号を出力処理可能なサウンドカード等のサウンド処理部611,612,・・・,618(以下、サウンド処理部61n(n=1,2,・・・,8)と総称する。)を有するパーソナルコンピュータ等を含むハードウェアの機能を有するものである。音声出力サイト60nは、それぞれ、ソース出力サイト51及びトリガ監視サイト12と同様に、TCP/IPやUDP等の所定のプロトコルにしたがってネットワークNTを介してソース出力サイト51及びトリガ監視サイト12との間で信号の送受信を行うことが可能とされる。また、音声出力サイト60nは、それぞれ、サウンド処理部61nにおける例えば第8チャンネルのみをトリガ監視サイト12と接続しており、このチャンネルを用いてトリガ監視サイト12に対してトリガ信号TGnを出力することが可能とされる。音声出力サイト60nは、それぞれ、再生処理プログラムC1,C2,・・・,C8(以下、再生処理プログラムCn(n=1,2,・・・,8)と総称する。)を実行することが可能な環境とされており、ワードクロック生成器14から供給されるワードクロックWCLK又はワード単位で各サンプルを同期せしめるのに十分なトリガ外部信号に同期して、サウンド処理部61nにおける処理を行う。このとき、音声出力サイト60nにおいては、それぞれ、サウンド処理部61nにおける第1チャンネル乃至第8チャンネルの間の同期は確保されているものとする。すなわち、音声出力サイト60nにおいては、それぞれ、ソース出力サイト51から再生指示を受け取った場合には、サウンド処理部61nにおける第1チャンネル乃至第8チャンネルから同時に音声信号を出力する。また、音声出力サイト60nにおいては、音声ファイルAFが所定のフォーマットで圧縮されている場合には、この音声ファイルAFが図示しないバッファに一時的に記憶され、このバッファを介して所定のデコード処理が行われる。そして、音声出力サイト60nにおいては、バッファからは、音声ファイルAFが所定容量以上記憶されると読み出される。
【0090】
また、音声出力サイト60nは、それぞれ、バッファから読み出された音声ファイルAFに対して所定の信号処理を施す。音声出力サイト60nは、それぞれ、図8に示すように、7チャンネル分の信号処理部62nm(n=1,2,・・・,8、m=1,2,・・・,7;チャンネル番号)を有する。これらの信号処理部62nmは、ハードウェアとして構成することもでき、同図に示すように、再生処理プログラムCn等のソフトウェアによって構成することもできる。音声出力サイト60nは、それぞれ、各チャンネル毎に音声信号を信号処理部62nmに入力する。信号処理としては、例えば、いわゆるFIR(Finite Impulse Responce)フィルタやIIR(Infinite Impulse Responce)フィルタ等のディジタルフィルタを施すことが考えられ、全体としていわゆるクロスフェード処理を施すものが考えられる。ただし、これらの信号処理部62nmにおける遅延量は既知であり、簡単のため、各チャンネル間で一定であるものとする。
【0091】
さらに、例えばディジタルフィルタにおけるフィルタ係数といった信号処理部62nmにおける信号処理のパラメータは、外部から供給される信号処理方法を変更するための制御情報CNTに応じて、変更することが可能である。例えば、音声再生装置50においては、ユーザによるユーザインターフェースUIの操作に応じてパラメータを変更することができ、ソース出力サイト51から音声出力サイト60nに対してパラメータを変更する旨及びパラメータ値を示す制御情報CNTが通知される。より具体的には、例えば画像に連動して音像を移動させるようなアプリケーションを想定した場合、ユーザがユーザインターフェースUIたるジョイスティック等を操作することによって自己の位置を移動させるのにともない、制御情報CNTを音声出力サイト60nに対して通知し、信号処理のパラメータを変更させることにより、再現される音像の位置を移動させることができる。その他、音声出力サイト60nは、それぞれ、指向性の方向変更又は音場の残響パラメータの変更といったように、アプリケーションに応じて信号処理のパラメータを変更することができる。音声出力サイト60nにおいては、信号処理が施された音声信号が図示しないバッファに一時的に記憶され、所定容量以上記憶されると読み出される。
【0092】
音声出力サイト60nは、それぞれ、ソース出力サイト51からネットワークNTを介して供給される再生指示を示す制御情報を受け取ると、再生処理プログラムCnの実行制御のもとに、サウンド処理部61nを介してトリガ信号TGnをトリガ監視サイト12に対して出力する。この間、音声出力サイト60nには、それぞれ、音声ファイルAFが配信されており、音声出力サイト60nは、それぞれ、配信された音声ファイルAFに対して信号処理部62nmによって信号処理を施す。また、音声出力サイト60nは、それぞれ、トリガ監視サイト12からネットワークNTを介して遅れサンプル数情報を受け取ると、この遅れサンプル数Sdnと再生マージンサンプル数Smとに基づいて、信号処理後の音声信号の再生を開始し、出力器15nm及びスピーカ16nmを介して外部へと放音させる。
【0093】
このような各部を備える音声再生装置50においては、音声出力サイト60nは、それぞれ、再生処理プログラムCnを実行し、先に図2に示した一連の工程を経ることによって音声ファイルAFの再生を開始することができる。一方、音声再生装置50においては、トリガ監視サイト12は、監視プログラムSvを実行し、先に図3に示した一連の工程を経ることによって音声出力サイト60nのそれぞれに対応する遅れサンプル数Sdnを求めることができる。
【0094】
音声再生装置50においては、ソース出力サイト51に記憶されている1チャンネルの音声ファイルAFの再生指示を示す制御情報が与えられると、音声ファイルAFが音声出力サイト60nのそれぞれにマルチキャスト配信されるとともに、音声出力サイト60nのそれぞれから、トリガ監視サイト12に対してトリガ信号TGnが出力される。音声再生装置50においては、トリガ監視サイト12により、トリガ信号TGnに基づいて、音声出力サイト60nのそれぞれに対応する遅れサンプル数Sdnを求める。そして、音声再生装置50においては、各音声出力サイト60nにより、この遅れサンプル数Sdnと再生マージンサンプル数Smとに基づいて、自己が再生を開始すべきタイミングを求め、このタイミングに到達した時間に音声信号の再生を開始することができる。音声再生装置50においては、このようにして、全ての音声出力サイト60nによる音声ファイルAFの再生開始のタイミングを一致させることができる。そして、音声再生装置50においては、それ以後、ワードクロック生成器14から供給されるワードクロックWCLKに基づいて音声出力サイト60nによって再生を進行することにより、マルチチャンネルの同期再生を行うことができる。
【0095】
また、音声再生装置50においては、途中で信号処理のパラメータを変更する場合には、ソース出力サイト51から信号処理の内容を示す上述した制御情報CNTが音声出力サイト60nに与えられ、信号処理のパラメータが変更される。
このとき、音声再生装置50においては、再生指示と同様に、制御情報CNTに関する遅れサンプル数を算出することにより、信号処理のパラメータを変更する時間の同期をとることができる。
【0096】
このようにして、音声再生装置50においては、トリガ監視サイト12によって監視プログラムSvを実行するとともに、音声出力サイト60nのそれぞれによって再生処理プログラムCnを実行し、音声ファイルAFの再生を同時に開始することができる。
【0097】
以上のように、本発明の第3の実施の形態として示す音声再生装置50は、ソース出力サイト51上に存在している音声ファイルAFを、各音声出力サイト60nにマルチキャスト配信し、配信された音声ファイルAFに対して信号処理を施した音声信号を用いて、マルチチャンネルの同期再生を行うことができる。特に、音声再生装置50は、互いに同期が確保されておらず、動作環境が多種多様にわたる音声出力サイト60nを用いた場合であっても、確実に同期再生を実現することができ、例えばマルチスピーカを用いた指向性、音場及び音像制御を優れた効果のもとに実現することができる。
【0098】
つぎに、本発明の第4の実施の形態について説明する。この第4の実施の形態として図9に示す音声再生装置70は、上述した第3の実施の形態として示した音声再生装置50と同様に、1つのソースファイルに対して各音声出力サイトによって所定の信号処理を施し、56チャンネルの音声信号の同期再生を行うものであるが、ネットワークトラフィックの影響を回避するために、例えばTCP/IPやUDP等の所定のプロトコルにしたがって情報伝送を行うネットワークNTを設けず、サウンド処理部のみを用いて情報の送受信を行うものである。したがって、上述した第3の実施の形態として示した音声再生装置50と同様の機能を有する各部については同一符号を付し、詳細な説明を省略するものとする。
【0099】
音声再生装置70は、同図に示すように、上述したワードクロック生成器14と、56個の出力器15nmと、56個のスピーカ16nmとの他、記憶している1チャンネルのソースファイルである音声ファイルAFを出力するソース出力サイト71と、トリガ信号TGnを監視するトリガ監視サイト73と、音声信号を再生して出力する8つの音声出力サイト801,802,・・・,808(以下、音声出力サイト80n(n=1,2,・・・,8;サイト番号)と総称する。)とを備える。
【0100】
ソース出力サイト71は、上述したソース出力サイト51と同様に、音声再生装置70の統括制御を行う機能を有するとともに、音声再生装置70とユーザとの間のユーザインターフェースUIを有し、さらに、音声ファイルAFを図示しない記憶手段に記憶するものである。なお、このソース出力サイト71に記憶されている音声ファイルAFは、1チャンネルであるものとして説明するが、複数チャンネルからなるものであってもよい。また、音声ファイルAFは、所定のフォーマットで圧縮されていてもよく、非圧縮であってもよい。ソース出力サイト71は、少なくとも2チャンネル以上の音声信号を出力処理可能なサウンドカード等のサウンド処理部72を有し、このサウンド処理部72を介して、ユーザインターフェースUIを介したユーザによる再生指示や信号処理のパラメータ変更等を示す制御情報を音声出力サイト80nに対して通知するとともに、音声ファイルAFをそのまま又はストリームデータとして、全ての音声出力サイト80nに対してマルチキャスト配信することが可能とされる。このとき、ソース出力サイト71は、サウンド処理部72における第1チャンネルが音声ファイルAFの配信用に用いられ、第2チャンネルが制御情報の通知用に用いられる。
【0101】
また、ソース出力サイト71は、サウンド処理部72を介して制御情報を送受信する。この制御情報は、数値やパラメータ等の送受信を行うことが可能であればよく、その生成及び認識機構を送受信するサイト間で取り決めて使用すればいかなるものであってもよい。特に、ソース出力サイト71及び音声出力サイト80nがディジタルデータを取り扱うものである場合には、各サイトは、制御情報を単なる信号列として扱うことができ、生成及び認識用のプログラムを単純化することができる。ソース出力サイト71は、ソース出力プログラムSoを実行することが可能な環境とされており、ワードクロック生成器14から供給されるワードクロックWCLK又はワード単位で各サンプルを同期せしめるのに十分なトリガ外部信号に同期して、サウンド処理部72における処理を行う。
【0102】
トリガ監視サイト73は、少なくとも音声出力サイト80nの数以上、すなわち、8チャンネル以上の音声信号を入力処理及び出力処理可能なサウンドカード等のサウンド処理部74を有し、このサウンド処理部74を介して音声出力サイト80nから出力されるトリガ信号TGnを受信することが可能とされる。また、トリガ監視サイト73は、サウンド処理部74を介して、遅れサンプル数Sdnを音声出力サイト80nに対して通知することが可能とされる。このとき、トリガ監視サイト73は、サウンド処理部74における入力側の第1チャンネルが音声出力サイト801と接続され、第2チャンネルが音声出力サイト802と接続されるとともに、出力側の第1チャンネルが音声出力サイト801と接続され、第2チャンネルが音声出力サイト802と接続されるといったように、各チャンネルが音声出力サイト80nのそれぞれと対応させて接続される。トリガ監視サイト73は、監視プログラムSvを実行することが可能な環境とされており、ワードクロック生成器14から供給されるワードクロックWCLK又はワード単位で各サンプルを同期せしめるのに十分なトリガ外部信号に同期して、サウンド処理部74における処理を行う。
【0103】
トリガ監視サイト73は、監視プログラムSvの実行制御のもとに、音声出力サイト80nのそれぞれから出力されるトリガ信号TGnの入来を監視する。トリガ監視サイト73は、トリガ信号TGnを受け取ると、これらのトリガ信号TGnに基づいて、音声出力サイト80nのそれぞれに対応する遅れサンプル数Sdnを求め、これらの遅れサンプル数Sdnを示す遅れサンプル数情報をサウンド処理部74を介して音声出力サイト80nに対してそれぞれ出力する。
【0104】
音声出力サイト80nは、それぞれ、例えば8チャンネルの音声信号を出力処理可能であり且つ少なくとも3チャンネルの音声信号を入力処理可能なサウンドカード等のサウンド処理部811,812,・・・,818(以下、サウンド処理部81n(n=1,2,・・・,8)と総称する。)を有する。音声出力サイト80nは、これらのサウンド処理部81nを介してソース出力サイト71から出力される音声ファイルAF及び制御情報を受信することが可能とされ、さらに、トリガ監視サイト73から出力される遅れサンプル数情報を受信することが可能とされる。例えば、音声出力サイト80nにおいては、それぞれ、サウンド処理部81nにおける入力側の第1チャンネルがソース出力サイト71からの音声ファイルAFの受信部とされ、第2チャンネルがソース出力サイト71からの制御情報の受信部とされ、第3チャンネルがトリガ監視サイト73からの遅れサンプル数情報の受信部とされる。また、音声出力サイト80nは、それぞれ、サウンド処理部81nにおける出力側の例えば第8チャンネルのみをトリガ監視サイト73と接続しており、このチャンネルを用いてトリガ監視サイト73に対してトリガ信号TGnを出力することが可能とされる。音声出力サイト80nは、それぞれ、再生処理プログラムD1,D2,・・・,D8(以下、再生処理プログラムDn(n=1,2,・・・,8)と総称する。)を実行することが可能な環境とされており、ワードクロック生成器14から供給されるワードクロックWCLK又はワード単位で各サンプルを同期せしめるのに十分なトリガ外部信号に同期して、サウンド処理部81nにおける処理を行う。音声出力サイト80nにおいては、音声ファイルAFが所定のフォーマットで圧縮されている場合には、この音声ファイルAFが図示しないバッファに一時的に記憶され、このバッファを介して所定のデコード処理が行われる。そして、音声出力サイト80nにおいては、バッファからは、音声ファイルAFが所定容量以上記憶されると読み出される。
【0105】
また、音声出力サイト80nは、それぞれ、音声出力サイト60nと同様に、バッファから読み出された音声ファイルAFに対して所定の信号処理を施す。音声出力サイト80nにおいては、信号処理が施された音声信号が図示しないバッファに一時的に記憶され、所定容量以上記憶されると読み出される。
【0106】
音声出力サイト80nは、それぞれ、ソース出力サイト71から供給される再生指示を示す制御情報をサウンド処理部81nを介して受け取ると、再生処理プログラムDnの実行制御のもとに、サウンド処理部81nを介してトリガ信号TGnをトリガ監視サイト73に対して出力する。この間、音声出力サイト80nには、それぞれ、音声ファイルAFが配信されており、音声出力サイト80nは、それぞれ、配信された音声ファイルAFに対してここでは図示しない信号処理部によって信号処理を施す。また、音声出力サイト80nは、それぞれ、トリガ監視サイト73から遅れサンプル数情報をサウンド処理部81nを介して受け取ると、この遅れサンプル数Sdnと再生マージンサンプル数Smとに基づいて、信号処理後の音声信号の再生を開始し、出力器15nm及びスピーカ16nmを介して外部へと放音させる。
【0107】
このような各部を備える音声再生装置70においては、音声出力サイト80nは、それぞれ、再生処理プログラムDnを実行し、先に図2に示した一連の工程を経ることによって音声ファイルAFの再生を開始することができる。一方、音声再生装置70においては、トリガ監視サイト73は、監視プログラムSvを実行し、先に図3に示した一連の工程を経ることによって音声出力サイト80nのそれぞれに対応する遅れサンプル数Sdnを求めることができる。
【0108】
音声再生装置70においては、音声再生装置50と同様に、ソース出力サイト71に記憶されている1チャンネルの音声ファイルAFの再生指示を示す制御情報が与えられると、音声ファイルAFが音声出力サイト80nのそれぞれにマルチキャスト配信されるとともに、音声出力サイト80nのそれぞれから、トリガ監視サイト73に対してトリガ信号TGnが出力される。音声再生装置70においては、トリガ監視サイト73により、トリガ信号TGnに基づいて、音声出力サイト80nのそれぞれに対応する遅れサンプル数Sdnを求める。そして、音声再生装置70においては、各音声出力サイト80nにより、この遅れサンプル数Sdnと再生マージンサンプル数Smとに基づいて、自己が再生を開始すべきタイミングを求め、このタイミングに到達した時間に音声信号の再生を開始することができる。音声再生装置70においては、このようにして、全ての音声出力サイト80nによる音声ファイルAFの再生開始のタイミングを一致させることができる。そして、音声再生装置70においては、それ以後、ワードクロック生成器14から供給されるワードクロックWCLKに基づいて音声出力サイト80nによって再生を進行することにより、マルチチャンネルの同期再生を行うことができる。
【0109】
また、音声再生装置70においては、音声再生装置50と同様に、途中で信号処理のパラメータを変更する場合には、ソース出力サイト71から信号処理の内容を示す制御情報が音声出力サイト80nに与えられ、信号処理のパラメータが変更される。このとき、音声再生装置70においては、再生指示と同様に、制御情報に関する遅れサンプル数を算出することにより、信号処理のパラメータを変更する時間の同期をとることができる。
【0110】
このようにして、音声再生装置70においては、トリガ監視サイト73によって監視プログラムSvを実行するとともに、音声出力サイト80nのそれぞれによって再生処理プログラムDnを実行し、音声ファイルAFの再生を同時に開始することができる。
【0111】
以上のように、本発明の第4の実施の形態として示す音声再生装置70は、ソース出力サイト71上に存在している音声ファイルAFを、各音声出力サイト80nにマルチキャスト配信し、配信された音声ファイルAFに対して信号処理を施した音声信号を用いて、マルチチャンネルの同期再生を行うことができる。特に、音声再生装置70は、例えばTCP/IPやUDP等の所定のプロトコルにしたがって情報伝送を行うネットワークを介して情報伝送を行うことがないため、ネットワークトラフィックの影響を回避することができ、確実に同期再生を実現することができる。
【0112】
最後に、本発明の第5の実施の形態について説明する。この第5の実施の形態として図10に示す音声再生装置90は、音声出力サイトにおけるサウンド処理部のうち、上述したトリガ信号を出力するトリガチャンネルを専用に設けるのではなく、音声信号を出力するチャンネルと共用するものである。すなわち、上述した実施の形態では、トリガチャンネルを使用するのは、音声信号の再生開始前に1度だけトリガ信号を再生する場合のみであり、このために専用のチャンネルを確保するのは用途によっては効率が悪い場合がある。そこで、音声再生装置90は、n個の音声出力サイトにおけるMチャンネルの同時再生が可能なサウンド処理部のうち、全てのチャンネルを音声信号の出力に用いることにより、上述した(M−1)×nチャンネルの音声信号の同期再生ではなく、M×nチャンネルの音声信号の同期再生を実現可能とするものである。ここでは、音声再生装置90は、8チャンネルの音声信号を出力処理可能な4つの音声出力サイトを用いて、32チャンネルの音声信号の同期再生を行うものとして説明する。なお、ここでも、上述した第1の実施の形態として示した音声再生装置10等と同様の機能を有する各部については同一符号を付し、詳細な説明を省略するものとする。
【0113】
音声再生装置90は、同図に示すように、上述したワードクロック生成器14と、32個の出力器1511,1512,1513,1514,1515,1516,1517,1518,1521,1522,・・・,1545,1546,1547,1548(以下、出力器15nm(n=1,2,3,4;サイト番号、m=1,2,・・・,8;チャンネル番号)と総称する。)と、32個のスピーカ1611,1612,1613,1614,1615,1616,1617,1618,1621,1622,・・・,1645,1646,1647,1648(以下、スピーカ16nm(n=1,2,3,4、m=1,2,・・・,8)と総称する。)との他、トリガ信号TGnを監視するトリガ監視サイト91と、音声信号を再生して出力する4つの音声出力サイト1001,1002,・・・,1004(以下、音声出力サイト100n(n=1,2,3,4)と総称する。)とを備える。この音声再生装置90は、例えば映画館のようなエンターテイメントシアタETHに適用した場合を想定しており、出力器15nm及びスピーカ16nmが当該エンターテイメントシアタETHの4壁面に埋め込まれ、32チャンネルの独立音声によって臨場感のある音場を構築可能としている。
なお、音声再生装置90においては、4つの音声出力サイト100nのそれぞれに対応する8つずつの出力器15nm及びスピーカ16nmを、1つのブロックBKn(n=1,2,3,4)とし、1つの壁面を構成するものとする。
【0114】
トリガ監視サイト91は、上述したトリガ監視サイト12と同様の機能を有するとともに、上述したコントロールサイト11と同様の機能を兼ね備え、さらに、所定の映像からなる映画ファイルMFを図示しない記憶手段に記憶して、この映画ファイルMFを配信するシネマ配信サイトとしても機能するものである。トリガ監視サイト91は、例えばTCP/IPやUDP等の所定のプロトコルにしたがって外部との通信を行うことが可能であり、ネットワークNTを介して音声出力サイト100nとの間で信号の送受信を行うことが可能とされる。トリガ監視サイト91は、監視プログラムSvを実行することが可能な環境とされており、所定の操作部や表示部等からなるユーザインターフェースUIを介してユーザによって再生コマンドが指示されると、監視プログラムSvの実行制御のもとに、音声ファイルAFnの再生指示を示す制御情報をネットワークNTを介して音声出力サイト100nに対して通知するとともに、映画ファイルMFに対して画像処理部93によって所定の画像処理を施し、音声ファイルAFと同期させながら、映像データIMとしてプロジェクタPJへと供給してエンターテイメントシアタETHにおけるスクリーンに投影させる。なお、このトリガ監視サイト91に記憶されている映画ファイルMFは、所定のフォーマットで圧縮されていてもよく、非圧縮であってもよく、画像処理部93によってデコード処理が行われる。
【0115】
また、トリガ監視サイト91は、少なくとも音声出力サイト20nの数以上、すなわち、4チャンネル以上の音声信号を入力処理可能なサウンドカード等のサウンド処理部92を有し、このサウンド処理部92を介して音声出力サイト100nから出力されるトリガ信号TGnを受信することが可能とされる。トリガ監視サイト91は、ワードクロック生成器14から供給されるワードクロックWCLK又はワード単位で各サンプルを同期せしめるのに十分なトリガ外部信号に同期して、サウンド処理部92における処理を行う。
【0116】
トリガ監視サイト91は、監視プログラムSvの実行制御のもとに、音声出力サイト100nのそれぞれから出力される音声信号の波形解析を行い、後述するように、この音声信号に埋め込まれたトリガ信号TGnを監視する。トリガ監視サイト91は、トリガ信号TGnを検出すると、これらのトリガ信号TGnに基づいて、音声出力サイト100nのそれぞれに対応する遅れサンプル数Sdnを求め、これらの遅れサンプル数Sdnを示す遅れサンプル数情報をネットワークNTを介して音声出力サイト100nに対してそれぞれ出力する。
【0117】
音声出力サイト100nは、それぞれ、上述した音声出力サイト20nと同様に、例えば8チャンネルの音声信号を出力処理可能なサウンドカード等のサウンド処理部1011,1012,・・・,1018(以下、サウンド処理部101n(n=1,2,・・・,8)と総称する。)を有する。音声出力サイト100nは、それぞれ、TCP/IPやUDP等の所定のプロトコルにしたがってネットワークNTを介してトリガ監視サイト91との間で信号の送受信を行うことが可能とされる。また、音声出力サイト100nは、それぞれ、サウンド処理部101nにおける例えば第8チャンネルのみを出力器15nmとともにトリガ監視サイト91とも接続しており、このチャンネルを用いてトリガ監視サイト91に対してトリガ信号TGnを出力することが可能とされる。なお、このトリガ信号TGnは、後述するように、音声信号として音声ファイルAFnに埋め込まれているものである。音声出力サイト100nは、それぞれ、再生処理プログラムE1,E2,・・・,E8(以下、再生処理プログラムEn(n=1,2,・・・,8)と総称する。)を実行することが可能な環境とされており、ワードクロック生成器14から供給されるワードクロックWCLK又はワード単位で各サンプルを同期せしめるのに十分なトリガ外部信号に同期して、サウンド処理部101nにおける処理を行う。このとき、音声出力サイト100nにおいては、それぞれ、サウンド処理部101nにおける第1チャンネル乃至第8チャンネルの間の同期は確保されているものとする。すなわち、音声出力サイト100nにおいては、それぞれ、トリガ監視サイト91から再生指示を受け取った場合には、サウンド処理部101nにおける第1チャンネル乃至第8チャンネルから同時に音声信号を出力する。また、音声出力サイト100nは、それぞれ、図示しない記憶手段に、8チャンネルの音声ファイルAFnを記憶している。
【0118】
ここで、音声ファイルAFnは、例えば図11に示すように、8チャンネルの音声信号からなる。音声ファイルAFnには、所定時刻tc以降に、各チャンネル毎に映画コンテンツ用の音声信号C1,C2,・・・,C8が記録されている。さらに、音声ファイルAFnには、第8チャンネルの音声信号における時刻tcよりも以前の時刻に、トリガ用の音声信号Tnが記録されている。このトリガ用の音声信号Tnは、後述するように、各音声出力サイト100nにおける音声ファイルAFnの再生によって出力器15nmに出力されるものであり、各音声出力サイト100nによる映画コンテンツ用の音声信号C1,C2,・・・,C8の再生前に、ユーザに聴取されることになる。また、トリガ用の音声信号Tnは、トリガ監視サイト91からネットワークNTを介して供給される再生指示を示す制御情報の到達時刻のばらつきに起因して、各音声出力サイト100nの間でばらばらに再生されるものである。そのため、トリガ用の音声信号Tnは、例えば、映画のタイトル音、チャイム音又は小鳥の囀り声といったように、時間的にずれて再生されても聴取者にとって不快とならない有意的な音声信号とするのが望ましい。特に、トリガ用の音声信号Tnは、例えば音声再生装置90が本発明を適用したシステムであることを示すサウンドロゴとして、積極的に活用することも考えられる。
【0119】
トリガ用の音声信号Tnには、例えば電子透かしによってトリガ信号TGnが埋め込まれており、トリガ検出サイト91及び音声出力サイト100nによって特定サンプル値にて検出可能とされる。また、音声ファイルAFnにおいては、トリガ信号TGnが検出可能な時刻ttから時刻tcまでの時間は、再生マージンサンプル数Sm0として定義される。この再生マージンサンプル数Sm0は、音声ファイルAFnを作成する際に、例えば後述する各種処理が終了するのに十分な時間を見込んで算出される値である。なお、トリガ信号TGnとしては、必ずしも電子透かしによって音声信号Tnに埋め込むものである必要はなく、トリガ監視サイト91及び音声出力サイト100nが、それぞれ、音声信号Tnの波形を観測してトリガ信号であることを判定でき、且つ、そのトリガ信号の発生サンプルが特定可能であるならば、音声信号Tnの波形そのものをトリガ信号TGnとして扱うようにしてもよい。
【0120】
音声出力サイト100nは、それぞれ、トリガ監視サイト91からネットワークNTを介して供給される再生指示を示す制御情報を受け取ると、再生処理プログラムEnの実行制御のもとに、音声ファイルAFnの再生を開始し、サウンド処理部101nを介して出力器15nm及びスピーカ16nmへと供給して外部へと放音させるとともに、サウンド処理部101nにおける第8チャンネルから出力される音声信号をトリガ監視サイト91に供給する。音声出力サイト100nは、それぞれ、音声ファイルAFnの波形解析を行い、トリガ信号TGnを検出し、そのトリガ信号TGnが埋め込まれていたサンプルを特定する。なお、この時点で、出力器15nm及びスピーカ16nmを介して放音される音声は、第8チャンネルから出力される音声信号Tnのみであり、それ以外は無音である。
また、音声出力サイト100nは、それぞれ、トリガ監視サイト91からネットワークNTを介して遅れサンプル数情報を受け取ると、この遅れサンプル数に基づいて、音声ファイルAFnの再生をスキップし、再び再生を開始して出力器15nm及びスピーカ16nmを介して外部へと放音させる。
【0121】
このような各部を備える音声再生装置90においては、音声ファイルAFnの再生指示を示す制御情報が与えられると、音声出力サイト100nのそれぞれから音声ファイルAFnが再生される。音声再生装置90においては、トリガ監視サイト91及び音声出力サイト100nによって音声ファイルAFnに埋め込まれたトリガ信号TGnを検出し、トリガ監視サイト91から音声出力サイト100nに対して、トリガ信号TGnに基づいて求められた音声出力サイト100nのそれぞれに対応する遅れサンプル数Sdnが通知される。そして、音声再生装置90においては、各音声出力サイト100nにより、この遅れサンプル数Sdnに基づいて、音声ファイルAFnの再生をスキップし、スキップ先の時点から再生を再開する。音声再生装置90においては、このようにして、全ての音声出力サイト100nによる音声ファイルAFnの再生開始のタイミングを一致させることができる。そして、音声再生装置90においては、それ以後、ワードクロック生成器14から供給されるワードクロックWCLKに基づいて音声出力サイト100nによって再生を進行することにより、マルチチャンネルの同期再生を行うことができる。
【0122】
具体的には、音声再生装置90においては、音声出力サイト100nは、それぞれ、再生処理プログラムEnを実行し、図12に示す一連の工程を経ることによって音声ファイルAFnを再生する。
【0123】
まず、音声出力サイト100nは、それぞれ、同図に示すように、ステップS31において、トリガ監視サイト91からネットワークNTを介して音声ファイルAFnの再生指示を示す制御情報が到達したか否かを判別する。音声出力サイト100nは、それぞれ、トリガ監視サイト91からの制御情報が到達するまで待機し、制御情報を受け取った時点で、ステップS32へと処理を移行する。
【0124】
音声出力サイト100nは、それぞれ、ステップS32において、サウンド処理部101nを介して音声ファイルAFnを再生する。
【0125】
これと同時に、音声出力サイト100nは、それぞれ、ステップS33において、音声ファイルAFnに埋め込まれているトリガ信号TGnを検出する。
【0126】
さらに、音声出力サイト100nは、それぞれ、ステップS34において、トリガ信号TGnが埋め込まれていたサンプルとして特定したサンプルを基準として、再生サンプル数のカウントを開始する。音声出力サイト100nにおいては、それぞれ、このカウント開始のサンプルを基準として、音声ファイルAFnの再生開始のタイミングが決定されることになる。
【0127】
そして、音声出力サイト100nは、それぞれ、ステップS35において、再生サンプル数のカウントを継続し、ステップS36において、トリガ監視サイト91から対応する遅れサンプル数Sdnを示す遅れサンプル数情報がネットワークNTを介して到達したか否かを判別する。
【0128】
ここで、遅れサンプル数情報が到達していない場合には、音声出力サイト100nは、それぞれ、ステップS35の処理を繰り返す。
【0129】
一方、遅れサンプル数情報が到達した場合には、音声出力サイト100nは、それぞれ、ステップS37において、遅れサンプル数Sdnだけ音声ファイルAFnの再生をスキップし、スキップ先の時点から再生を再開し、一連の処理を終了する。
【0130】
このようにして、音声再生装置90においては、音声出力サイト100nのそれぞれによって再生処理プログラムEnを実行し、音声ファイルAFnにおける映画コンテンツ用の音声信号の再生を同時に開始することができる。なお、音声再生装置90においては、それ以後、音声出力サイト100nが、それぞれ、ワードクロック生成器14から供給されるワードクロックWCLKに基づいて音声ファイルAFnの再生を進行することにより、マルチチャンネルの同期再生が可能となる。
【0131】
一方、音声再生装置90においては、トリガ監視サイト91は、監視プログラムSvを実行し、図13に示す一連の工程を経ることによって音声出力サイト100nのそれぞれに対応する遅れサンプル数Sdnを求めることができる。
【0132】
まず、トリガ監視サイト91は、同図に示すように、ステップS41において、再生指示を示す制御情報を音声出力サイト100nのそれぞれに対して通知する。
【0133】
続いて、トリガ監視サイト91は、ステップS42において、音声出力サイト100nのそれぞれからサウンド処理部92における各チャンネルに出力される音声ファイルAFnの入来を監視する。
【0134】
続いて、トリガ監視サイト91は、ステップS43において、サウンド処理部92における4つのチャンネルのうちのいずれかのチャンネルに、音声ファイルAFnのいずれかが供給されたか否かを判別する。
【0135】
ここで、音声ファイルAFnのいずれかが供給されていない場合には、トリガ監視サイト91は、ステップS42へと処理を移行し、音声ファイルAFnのいずれかが供給されるまで監視し続ける。
【0136】
一方、音声ファイルAFnのいずれかが供給された場合には、トリガ監視サイト91は、ステップS44において、音声ファイルAFnに埋め込まれているトリガ信号TGnを検出する。
【0137】
続いて、トリガ監視サイト91は、ステップS45において、検出されたトリガ信号TGnが最初に供給された音声ファイルAFnに埋め込まれていたものであるか否か、すなわち、初めてトリガ信号TGnが検出されたのか否かを判別する。
【0138】
ここで、トリガ信号TGnが最初に検出されたものでない場合には、トリガ監視サイト91は、ステップS47へと処理を移行する。一方、トリガ信号TGnが最初に検出されたものであった場合には、トリガ監視サイト91は、ステップS46において、この最初に検出したトリガ信号TGnが入力された時点のサンプルを基準サンプルとして、入力サンプル数のカウントを開始し、ステップS47へと処理を移行する。トリガ監視サイト91においては、この基準サンプルに基づいて、入力サンプル数をカウントすることによって他のトリガ信号TGnの入力時刻を計測することになる。
【0139】
そして、トリガ監視サイト91は、ステップS47において、ステップS46にて基準サンプルを基点としてカウントを開始しているカウント値を遅れサンプル数Sdnとし、トリガ信号TGnを出力した対応する音声出力サイト100nに対して、この遅れサンプル数Sdnを示す遅れサンプル数情報をネットワークNTを介して出力する。なお、トリガ監視サイト91は、最初に音声ファイルAFnを出力した音声出力サイト100nに対しては、遅れサンプル数Sdn=0を通知することはいうまでもない。
【0140】
続いて、トリガ監視サイト91は、ステップS48において、入力サンプル数のカウントを継続し、ステップS49において、全ての音声出力サイト100nからトリガ信号TGnを受信したか否かを判別する。
【0141】
ここで、全ての音声出力サイト100nからトリガ信号TGnを受信していない場合には、トリガ監視サイト91は、ステップS42乃至ステップS48の処理を繰り返す。
【0142】
一方、全ての音声出力サイト100nからトリガ信号TGnを受信した場合には、トリガ監視サイト91は、そのまま一連の処理を終了する。
【0143】
なお、音声出力サイト100nのいずれかが故障等によってトリガ信号TGnをトリガ監視サイト91に与えない場合があり得るが、この場合には、トリガ監視サイト91は、ステップS49からステップS42へと移行するループ処理を適宜抜けるようにしてもよい。
【0144】
このようにして、音声再生装置90においては、トリガ監視サイト91によって監視プログラムSvを実行し、音声出力サイト100nのそれぞれに対応する遅れサンプル数Sdnを求めることができ、音声出力サイト100nによる同期再生を実現させることが可能となる。なお、トリガ監視サイト91は、この一連の処理の間、画像処理部93によって映画ファイルMFに対する画像処理を施し、音声出力サイト100nによる音声ファイルAFnにおける映画コンテンツ用の音声信号の再生開始と同期させて、映像データIMをプロジェクタPJを介してエンターテイメントシアタETHにおけるスクリーンに投影させる。
【0145】
このようなプログラムを実行するトリガ監視サイト91及び音声出力サイト100nを備える音声再生装置90においては、例えば図14に示すタイミングにしたがって各動作が協調して行われる。
【0146】
すなわち、音声再生装置90においては、ワードクロック生成器14によって生成されるワードクロックWCLKに基づいて、トリガ監視サイト91及び音声出力サイト100nが動作する。音声再生装置90においては、同図上段に示すように、ユーザインターフェースUIを介して再生コマンドが指示されると、この再生指示を示す制御情報がトリガ監視サイト91から音声出力サイト100nのそれぞれにネットワークNTを介して通知される。この制御情報が到達する絶対的な時刻は、上述したように、ネットワークトラフィックの影響等に起因して、音声出力サイト100nの間でばらつきが生じる。ここでは、同図中段に示すように、音声出力サイト1001が最も早く制御情報を受信し、音声出力サイト1004,音声出力サイト1002の順序で制御情報を受信したものとする。
【0147】
すると、音声再生装置90においては、上述したように、音声出力サイト100nから音声ファイルAFnが再生される。この音声出力サイト100nのそれぞれから音声ファイルAFnが再生される絶対的な時刻は、上述したように、音声出力サイト100nにおけるサウンド処理部101nの相違や図示しないCPU等の処理能力等に起因して、音声出力サイト100nの間でばらつきが生じる。ここでは、同図中段に示すように、音声出力サイト1001が最も早い時点で音声ファイルAF1の再生を開始し、以後、音声出力サイト1004,音声出力サイト1002の順序で音声ファイルAF4,AF2の再生を開始したものとする。
【0148】
そして、音声再生装置90においては、上述したように、音声出力サイト100nのそれぞれによって音声ファイルAFnに埋め込まれたトリガ信号TGnが検出されるとともに、トリガ監視サイト91によってもトリガ信号TGnが検出される。ここでは、同図下段に示すように、トリガ監視サイト91によって最も早いサンプルS1の時点でトリガ信号TG1を検出し、以後、トリガ信号TG4,TG2の順序で検出したものとする。音声出力サイト100nは、それぞれ、これらのトリガ信号TGnが特定された時点のサンプルSnを基準として、再生サンプル数のカウントを開始する。また、ここでは、最も早くトリガ信号TG1が検出されたサンプルS1を基準サンプルとしている。また、トリガ監視サイト91は、基準サンプルであるサンプルS1から入力サンプル数のカウントを開始し、同図下段に示すように、遅れサンプル数Sdnを算出する。音声再生装置90においては、これらの遅れサンプル数Sdnが対応する音声出力サイト100nに対して通知される。この遅れサンプル数Sdnが到達する絶対的な時刻は、上述したように、ネットワークトラフィックの影響等に起因して、音声出力サイト100nの間でばらつきが生じる。ここでは、同図中段に示すように、音声出力サイト1001が最も早く遅れサンプル数情報を受信し、音声出力サイト1002,音声出力サイト1004の順序で遅れサンプル数情報を受信したものとする。
【0149】
そして、音声再生装置90においては、音声出力サイト100nのそれぞれにより、遅れサンプル数Sdnだけ音声ファイルAFnの再生がスキップされ、スキップ先の時点から再生が再開される。このとき、上述した再生マージンサンプル数Sm0が、少なくとも以下の工程、すなわち、再生指示を示す制御情報を受信した音声出力サイト100nが音声ファイルAFnを再生する工程、トリガ監視サイト91が全ての音声出力サイト100nからトリガ信号TGnを受信する工程、トリガ監視サイト91が音声出力サイト100nのそれぞれに対して遅れサンプル数Sdnを通知する工程、及び、全ての音声出力サイト100nが遅れサンプル数Sdnを受信し、再生しているサンプルを補正する工程を行うのに十分な時間を見込んで算出されている場合には、スキップされたサンプルは、映画コンテンツに無関係の音声信号、すなわち、先に図11に示した時刻ttから時刻tcまでに含まれる音声信号である。音声再生装置90においては、トリガ監視サイト91によって最初にトリガ信号TGnが検出された時点のサンプルSnからカウントして、再生マージンサンプル数Sm0だけ経過したサンプルから、音声ファイルAFnにおける映画コンテンツ用の音声信号C1,C2,・・・,C8の再生が一斉に開始される。
【0150】
音声再生装置90においては、音声出力サイト100n間における映画コンテンツ用の音声信号C1,C2,・・・,C8の再生開始位置を一定にし、それ以後は、ワードクロック生成器14によって生成されるワードクロックWCLKに基づいて同期を保ちながら音声ファイルAFnの再生を進行する。
【0151】
以上のように、本発明の第5の実施の形態として示す音声再生装置90は、音声出力サイト100nにおけるサウンド処理部101nのうち、トリガ信号TGnを出力するトリガチャンネルを専用に設けずに、音声信号を出力するチャンネルと共用し、効率よく音声信号の同期再生を行うことができる。
【0152】
以上説明したように、本発明の第1の実施の形態乃至第5の実施の形態として示す音声再生装置は、汎用の複数のハードウェアを用いて安価に構成することができ、処理能力やチャンネル数等の制限等によって従来では実現不可能であったマルチチャンネルの音声信号の同期再生を精確に行うことができる。したがって、音声再生装置は、例えば映画館やゲーム等のエンターテイメントシステムに適用することにより、簡易な構成のもとに非常に臨場感の高い音響再生を実現することができる。
【0153】
なお、本発明は、上述した実施の形態に限定されるものではなく、例えば、上述した第1の実施の形態及び第2の実施の形態の末尾に記載したように、各種変更が可能であり、これは、他の実施の形態についても必要に応じて適用可能である。
【0154】
また、本発明は、上述した第1の実施の形態乃至第5の実施の形態のうち、任意のものを可能な範囲で適宜組み合わせてもよい。
【0155】
このように、本発明は、その趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
【0156】
【発明の効果】
以上詳細に説明したように、本発明にかかる音声再生装置は、複数チャンネルの音声信号を同期再生する音声再生装置であって、所定の基準信号を生成する基準信号生成手段と、基準信号に同期して複数チャンネルの音声信号を出力処理可能な音声出力処理器を介して、音声信号を再生して出力する互いに同期が確保されていない複数の音声出力手段と、基準信号に同期して少なくとも音声出力手段の数以上の音声信号を入力処理可能な音声入力処理器を介して、音声出力手段のそれぞれから少なくとも1チャンネル分だけ供給される信号であって音声出力手段のそれぞれにおける音声信号の再生タイミングを与えるための予行信号の入来を監視する予行信号監視手段とを備え、予行信号監視手段は、音声出力手段のそれぞれから供給された複数の予行信号の入力時間についての相対的なずれ時間を求め、ずれ時間を示す時間情報を、音声出力手段のそれぞれに対して通知し、音声出力手段は、それぞれ、時間情報に基づいて、音声信号の再生を開始すべきタイミングを決定する。
【0157】
したがって、本発明にかかる音声再生装置は、音声出力手段のそれぞれに対応する複数の予行信号の入力時間についての相対的なずれ時間を示す時間情報に基づいて、音声信号の再生を開始すべきタイミングを決定することにより、汎用の複数のハードウェアを用いた場合であっても、マルチチャンネルの音声信号の同期再生を精確に行うことができる。
【0158】
また、本発明にかかる音声再生方法は、複数チャンネルの音声信号を同期再生する音声再生方法であって、所定の基準信号に同期して複数チャンネルの音声信号を出力処理可能な音声出力処理器を介して、音声信号を再生して出力する互いに同期が確保されていない複数の音声出力手段のそれぞれから少なくとも1チャンネル分だけ供給される信号であって、音声出力手段のそれぞれにおける音声信号の再生タイミングを与えるための予行信号を、基準信号に同期して少なくとも音声出力手段の数以上の音声信号を入力処理可能な音声入力処理器を介して予行信号監視手段に対して入力し、音声出力手段のそれぞれから供給された複数の予行信号の入力時間についての相対的なずれ時間を求めるずれ時間算出工程と、ずれ時間を示す時間情報に基づいて、音声信号の再生を開始すべきタイミングを決定する再生開始タイミング決定工程とを備える。
【0159】
したがって、本発明にかかる音声再生方法は、音声出力手段のそれぞれに対応する複数の予行信号の入力時間についての相対的なずれ時間を示す時間情報に基づいて、音声信号の再生を開始すべきタイミングが決定されることにより、汎用の複数のハードウェアを用いた場合であっても、マルチチャンネルの音声信号の同期再生を精確に行うことが可能となる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態として示す音声再生装置の構成を説明するブロック図である。
【図2】同音声再生装置が備える音声出力サイトにおいて音声ファイルの再生を開始するまでの一連の工程を説明するフローチャートである。
【図3】同音声再生装置が備えるトリガ監視サイトにおいて音声出力サイトのそれぞれに対応する遅れサンプル数を求める際の一連の工程を説明するフローチャートである。
【図4】同音声再生装置における各部の動作タイミングを説明するための図である。
【図5】本発明の第2の実施の形態として示す音声再生装置の構成を説明するブロック図である。
【図6】同音声再生装置が備える音声出力サイトにおいて音声ストリームの再生を開始するまでの一連の工程を説明するフローチャートである。
【図7】本発明の第3の実施の形態として示す音声再生装置の構成を説明するブロック図である。
【図8】同音声再生装置の構成を説明するブロック図であって、特に、音声出力サイトが有する信号処理部の構成を説明するブロック図である。
【図9】本発明の第4の実施の形態として示す音声再生装置の構成を説明するブロック図である。
【図10】本発明の第5の実施の形態として示す音声再生装置の構成を説明するブロック図である。
【図11】音声ファイルの構造を説明する図である。
【図12】同音声再生装置が備える音声出力サイトにおいて音声ファイルを再生する際の一連の工程を説明するフローチャートである。
【図13】同音声再生装置が備えるトリガ監視サイトにおいて音声出力サイトのそれぞれに対応する遅れサンプル数を求める際の一連の工程を説明するフローチャートである。
【図14】同音声再生装置における各部の動作タイミングを説明するための図である。
【符号の説明】
10,30,50,70,90 音声再生装置、 11 コントロールサイト、 12,73,91 トリガ監視サイト、 13,21n,41n,61n,72,74,81n,92,101n サウンド処理部、 14 ワードクロック生成器、 15nm 出力器、 16nm スピーカ、 20n,40n,60n,80n,100n 音声出力サイト、 31 配信サイト、 51,71ソース出力サイト、 62nm 信号処理部、 93 画像処理部[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an audio reproducing apparatus and audio reproducing method for synchronously reproducing multi-channel audio signals.
[0002]
[Prior art]
In recent years, in order to make it possible to listen to an audio signal reproduced from an audio device with an enhanced sense of reality, it is considered to construct an audio reproduction system that reproduces a multi-channel audio signal. As such an audio reproduction system, for example, an apparatus that reproduces a multi-channel audio signal recorded on a recording medium such as a DVD (Digital Versatile Disc) mainly for the purpose of listening in a space such as a home room or a vehicle. There are five channels to be output from each of the five speakers installed at the front right, front front, left front, right rear and left rear of the listener, and a sub in which only the low frequency component of the audio signal is recorded. A system having a channel, that is, a so-called Dolby AC-3 (trademark) 5.1 channel system has been put into practical use. In this 5.1-channel audio reproduction system, five speakers and low-frequency reproduction speakers installed in front of the listener's right front, front front, left front, right rear and left rear are used. By reproducing, realistic sound reproduction can be performed.
[0003]
[Problems to be solved by the invention]
By the way, the present applicant reproduces sound from a small number of speakers, such as the 5.1 channel method as described above, in order to realize control of very precise directivity, sound field, sound image, etc. by multi-speakers. We are proceeding with the construction of a larger-scale audio reproduction system rather than a possible audio reproduction system.
[0004]
When considering the construction of such a large-scale audio reproduction system, it is of course possible to design completely new hardware, but it is desirable to construct it using existing general-purpose hardware. This is because there are many existing inexpensive semiconductors that have the functions required for general-purpose hardware such as so-called sound cards that can be installed in personal computers. Compared to developing a processing mechanism, the efficiency of design man-hours can be improved, parts can be procured at low cost, and design can be easily performed.
[0005]
Here, hardware including such a personal computer often has a limited number of channels due to physical restrictions or system restrictions. Therefore, as a sound reproduction system, a plurality of hardware including a personal computer capable of outputting one or a plurality of channels of sound signals are connected via a network or the like, and the plurality of hardware are controlled under a predetermined local control. It is conceivable to distribute and reproduce audio signals from the wear. At this time, in the audio reproduction system, it is necessary to reproduce audio signals output from individual hardware in a completely synchronized manner, for example, in units of samples.
[0006]
Therefore, in the audio reproduction system, in order to realize synchronous reproduction, a so-called real-time OS (Operating System) is required, or special hardware capable of performing communication while accurately performing time synchronization with an external signal. Necessary and complicating the entire system and communication means.
[0007]
Also, in the audio reproduction system, in order to realize synchronized reproduction, it has been conventionally performed as a synchronization method of video, etc., and the clock between hardware is set by packet communication by a general-purpose network connecting each hardware. It is also possible to match.
[0008]
However, in the audio reproduction system, the time for the command to reach each hardware varies due to the influence of traffic on the network. Also, in the audio reproduction system, since various hardware are connected to each other, the processing time varies depending on the difference of each hardware, and it is difficult to predict the processing time. Further, in the sound reproduction system, there is a difference in the clock of the sound card itself. For this reason, in the audio reproduction system, it is difficult to specify the delay time between each hardware for each communication session, and it is necessary to rely on a statistical method, which is very unstable. Therefore, such a method is unsuitable for a sample that requires sample level synchronization in units of 1/444100 seconds, such as voice.
[0009]
The present invention has been made in view of such a situation, and provides an audio reproducing apparatus and an audio reproducing method capable of accurately synchronizing and reproducing a multi-channel audio signal using a plurality of general-purpose hardware. It is intended to do.
[0010]
[Means for Solving the Problems]
An audio reproducing apparatus according to the present invention that achieves the above-described object is an audio reproducing apparatus that reproduces an audio signal of a plurality of channels in synchronization with reference signal generating means for generating a predetermined reference signal, and in synchronization with the reference signal. A plurality of audio output means for reproducing and outputting audio signals via an audio output processor capable of output processing of audio signals of a plurality of channels, and at least audio output means synchronized with a reference signal The signal is supplied for at least one channel from each of the sound output means via a sound input processor capable of processing the sound signal of more than the number, and the reproduction timing of the sound signal in each of the sound output means is given. And a replay signal monitoring means for monitoring the arrival of a replay signal for the sound, and the replay signal monitoring means includes a plurality of sound output means supplied from each of the sound output means. A relative shift time with respect to the input time of the recurring signal is obtained, and time information indicating the shift time is notified to each of the sound output means, and the sound output means each of the sound signal based on the time information. It is characterized in that the timing for starting playback is determined.
[0011]
Such an audio reproduction device according to the present invention should start reproduction of an audio signal based on time information indicating a relative shift time with respect to input times of a plurality of replay signals corresponding to each of the audio output means. Determine timing.
[0012]
The audio reproduction method according to the present invention that achieves the above-described object is an audio reproduction method for synchronously reproducing an audio signal of a plurality of channels, and can output an audio signal of a plurality of channels in synchronization with a predetermined reference signal A signal that is supplied for at least one channel from each of a plurality of audio output means that are not synchronized with each other and that reproduces and outputs an audio signal via a sound output processor, and each of the audio output means The replay signal for giving the reproduction timing of the sound signal is input to the replay signal monitoring means via a sound input processor capable of inputting and processing at least the sound signals of the sound output means in synchronization with the reference signal. A deviation time calculating step for obtaining a relative deviation time for the input times of the plurality of recurrent signals supplied from each of the audio output means; Based on the time information indicating a time that is characterized by comprising a playback start timing determination step of determining when to start playing the audio signal.
[0013]
In such an audio reproduction method according to the present invention, reproduction of an audio signal should be started based on time information indicating a relative shift time with respect to input times of a plurality of replay signals corresponding to each of the audio output means. Timing is determined.
[0014]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, specific embodiments to which the present invention is applied will be described in detail with reference to the drawings.
[0015]
This embodiment is an audio reproducing apparatus capable of reproducing at least two channels of multi-channel audio signals in synchronization using a plurality of hardware including a personal computer. This sound reproducing apparatus uses multi-tasking and general hardware that is not necessarily specialized for real-time processing, or an OS (Operating System) or a system corresponding to the OS, and an existing sound card or interface. By using general-purpose audio processing means such as hardware conforming to this and communication means, multi-channel synchronized reproduction of audio signals existing over a plurality of hardware is enabled.
[0016]
In the following description, the hardware is assumed to be configured by a memory that stores various programs, a CPU (Central Processing Unit) that executes the various programs, a DSP (Digital Signal Processor), and the like. In the following description, unless otherwise specified, audio signals existing in hardware are those existing as audio files on storage means such as a hard disk, and whether or not signal processing is performed on each hardware. The description will be made on the assumption that any of the audio streams existing on the memory is sequentially indicated regardless of whether or not. Further, hereinafter, a module indicating each functional unit is referred to as a “site”. This site does not necessarily match the unit of hardware. That is, the audio reproducing apparatus may be implemented by a plurality of sites mounted on a single hardware, or may be distributed and mounted on a plurality of hardware, and the configuration thereof is arbitrary.
[0017]
First, a first embodiment of the present invention will be described. In the
[0018]
As shown in the figure, the
[0019]
The
[0020]
The
[0021]
The
[0022]
Note that the type of audio signal handled by the
[0023]
Audio output site 20 n Are each a sound processing unit 21 such as a sound card capable of outputting an 8-channel audio signal, for example. 1 , 21 2 , ..., 21 8 (Hereinafter, the sound processing unit 21 n (N = 1, 2,..., 8) ) Having hardware functions including a personal computer or the like. Audio output site 20 n Performs transmission / reception of signals between the
[0024]
Audio output site 20 n Are audio files AF supplied from the
[0025]
Each audio output site 20 n As for the type of the audio signal handled by, as with the
[0026]
The
[0027]
Output device 15 nm Are the audio output sites 20 respectively. n The audio signal output from is subjected to D / A conversion and then amplified. Output device 15 nm Respectively, the amplified audio signal is output from the speaker 16. nm Output for.
[0028]
Speaker 16 nm Are output devices 15 respectively. nm The electrical sound signal output from each of these is converted into acoustic energy and emitted to the outside.
[0029]
In the
[0030]
In the
[0031]
In such an
[0032]
First, the audio output site 20 n As shown in the figure, the reproduction margin sample number Sm is set in step S1. This reproduction margin sample number Sm is determined by the audio output site 20. n Is a common value between Specifically, the reproduction margin sample number Sm is determined from the reference sample described later from the audio file AF. n This is a value representing the time until the sample at the start of playback. The reproduction margin sample number Sm is a value that is calculated in consideration of a time sufficient for completing various processes to be described later, for example, and may be set by the user or automatically set. Audio output site 20 n Each stores the set reproduction margin sample number Sm in a memory (not shown) or the like.
[0033]
Next, the audio output site 20 n Respectively, in step S2, the audio file AF from the
[0034]
Audio output site 20 n Respectively, in step S3, the sound processing unit 21 n In the eighth channel (m = 8), that is, in the trigger channel connected to the
[0035]
At the same time, the audio output site 20 n Respectively, in step S4, the trigger signal TG n Sample S at the time of playback and output to the
[0036]
At the same time, the audio output site 20 n In step S5, “0” is output to channels other than the trigger channel, that is, the first to seventh channels (m = 1 to 7). That is, the audio output site 20 n Respectively, in step S3, the trigger signal TG is transmitted to the eighth channel. n The first channel to the seventh channel are muted.
[0037]
And the audio output site 20 n Respectively continues to count the number of reproduced samples in step S6, and in step S7, the corresponding delayed sample number Sd from the
[0038]
Here, if the delayed sample number information has not arrived, the audio output site 20 n Respectively repeat the processing of step S5 to step S6.
[0039]
On the other hand, when the delayed sample number information arrives, the audio output site 20 n In step S8, “(reproduction margin sample number Sm) − (delay sample number Sd n ) "And calculates the trigger signal TG to the
[0040]
In this way, in the
[0041]
On the other hand, in the
[0042]
First, the
[0043]
Subsequently, in step S12, the
[0044]
Here, the trigger signal TG n If any of the above is not supplied, the
[0045]
On the other hand, trigger signal TG n When any of the trigger signals is supplied, the
[0046]
Here, the trigger signal TG n Is not the first supplied, the
[0047]
Then, in step S15, the
[0048]
Subsequently, the
[0049]
Here, all audio output sites 20 n To trigger signal TG n Is not received, the
[0050]
On the other hand, all audio output sites 20 n To trigger signal TG n Is received, the
[0051]
Audio output site 20 n Either of the trigger signal TG due to failure etc. n May not be given to the
[0052]
In this way, in the
[0053]
[0054]
That is, in the
[0055]
Then, in the
[0056]
In response to this, in the
[0057]
In the
[0058]
In the
[0059]
As described above, the
[0060]
In the
[0061]
Further, in the above-described embodiment, it has been described that only the reproduction instruction is given by the
[0062]
Furthermore, in the
[0063]
Furthermore, the
[0064]
Further, although the
[0065]
Further, in the above-described embodiment, the fixed value is used as the reproduction margin sample number Sm. However, for example, in the
[0066]
Furthermore, in the above-described embodiment, the sound processing unit has been described as being synchronized with the word clock WCLK. However, in the
[0067]
In the above-described embodiment, the trigger signal TG is earliest as a reference sample from which the count of the input samples is started at the
[0068]
Furthermore, in the above-described embodiment, the audio signal is the audio file AF. n However, in the
[0069]
Next, a second embodiment of the present invention will be described. As the second embodiment, the
[0070]
As shown in the figure, the
[0071]
Similar to the
[0072]
Audio output site 40 n Are the audio output sites 20 described above, respectively. n Similarly to the
Audio output site 40 n Respectively, reproduction processing program B 1 , B 2 , ..., B 8 (Hereafter, playback processing program B n (N = 1, 2,..., 8)
The sound processing unit is synchronized with a word clock WCLK supplied from the
[0073]
Audio output site 40 n When receiving control information indicating a reproduction instruction supplied from the
[0074]
In the audio reproducing
[0075]
Specifically, in the
[0076]
First, the audio output site 40 n As shown in the figure, the reproduction margin sample number Sm is set in step S21. This reproduction margin sample number Sm is the same as in the case of the
[0077]
Subsequently, the audio output site 40 n In step S22, it is determined whether or not control information indicating an instruction to reproduce the audio file AF has arrived from the
[0078]
Audio output site 40 n Respectively, in step S23, the
[0079]
At the same time, the audio output site 40 n Respectively, in step S24, the trigger signal TG n Sample S at the time of playback and output to the
[0080]
At the same time, the audio output site 40 n In step S25, “0” is output to channels other than the trigger channel.
[0081]
And the audio output site 40 n Respectively continues to count the number of reproduced samples in step S26, and in step S27, the corresponding delayed sample number Sd from the
[0082]
Here, when the delayed sample number information has not arrived, the audio output site 40 n Respectively repeat the processing of step S25 to step S26. On the other hand, when the delayed sample number information arrives, the audio output site 40 n In step S28, “(reproduction margin sample number Sm) − (delay sample number Sd n ) "And calculates the trigger signal TG to the
[0083]
On the other hand, in the
[0084]
In this way, in the
[0085]
As described above, the
[0086]
Next, a third embodiment of the present invention will be described. As the third embodiment, the audio reproducing
[0087]
As shown in the figure, the
[0088]
The source output site 51 has a function of performing overall control of the
[0089]
Audio output site 60 n Are the audio output sites 20 described above, respectively. n Or audio output site 40 n Similarly to the sound processing unit 61 such as a sound card that can output and process an 8-channel audio signal, for example. 1 , 61 2 , ..., 61 8 (Hereinafter, the sound processing unit 61 n (N = 1, 2,..., 8) ) Having hardware functions including a personal computer or the like. Audio output site 60 n Transmits and receives signals to and from the source output site 51 and the
[0090]
Also, the audio output site 60 n Respectively perform predetermined signal processing on the audio file AF read from the buffer. Audio output site 60 n , Respectively, as shown in FIG. nm (N = 1, 2,..., 8, m = 1, 2,..., 7; channel number). These signal processing units 62 nm Can also be configured as hardware, and as shown in FIG. n It can also be configured by software such as. Audio output site 60 n Respectively, the signal processing unit 62 converts the audio signal for each channel. nm To enter. As the signal processing, for example, a digital filter such as a so-called FIR (Finite Impulse Response) filter or an IIR (Infinite Impulse Response) filter may be applied. However, these signal processing units 62 nm The delay amount in is known and is assumed to be constant between channels for simplicity.
[0091]
Further, for example, a signal processing unit 62 such as a filter coefficient in a digital filter. nm The signal processing parameters in can be changed according to control information CNT for changing the signal processing method supplied from the outside. For example, in the
[0092]
Audio output site 60 n When receiving the control information indicating the reproduction instruction supplied from the source output site 51 via the network NT, the reproduction processing program C n Under the execution control of the sound processing unit 61 n Trigger signal TG via n Is output to the
[0093]
In the
[0094]
In the
[0095]
Further, in the audio reproducing
At this time, the audio reproducing
[0096]
In this way, in the
[0097]
As described above, the
[0098]
Next, a fourth embodiment of the present invention will be described. The
[0099]
As shown in the figure, the audio reproducing
[0100]
Similar to the source output site 51 described above, the
[0101]
The
[0102]
The
[0103]
The
[0104]
[0105]
Also, the
[0106]
[0107]
In the
[0108]
In the
[0109]
Further, in the
[0110]
In this way, in the
[0111]
As described above, the
[0112]
Finally, a fifth embodiment of the present invention will be described. The audio reproducing device 90 shown in FIG. 10 as the fifth embodiment outputs an audio signal instead of providing a dedicated trigger channel for outputting the trigger signal described above, among the sound processing units at the audio output site. Shared with the channel. That is, in the above-described embodiment, the trigger channel is used only when the trigger signal is reproduced once before the reproduction of the audio signal is started. May be inefficient. Therefore, the audio playback device 90 uses all the channels among the sound processing units capable of simultaneous playback of M channels at the n audio output sites for the output of the audio signal, so that (M−1) × described above. Rather than synchronized playback of n-channel audio signals, synchronized playback of M × n-channel audio signals can be realized. Here, it is assumed that the audio reproduction device 90 performs synchronous reproduction of a 32-channel audio signal using four audio output sites that can output an 8-channel audio signal. In this case as well, each part having the same function as that of the
[0113]
As shown in the figure, the sound reproducing device 90 includes the above-described
In the audio playback device 90, four audio output sites 100 are provided. n 8 output devices 15 corresponding to each of nm And speaker 16 nm A block BK n (N = 1, 2, 3, 4) and one wall surface is formed.
[0114]
The
[0115]
The
[0116]
The
[0117]
Audio output site 100 n Are the audio output sites 20 described above, respectively. n Similarly to the sound processing unit 101 such as a sound card that can output and process an 8-channel audio signal, for example. 1 , 101 2 , ..., 101 8 (Hereinafter, the sound processing unit 101 n (N = 1, 2,..., 8) ). Audio output site 100 n Can transmit / receive signals to / from the
[0118]
Here, audio file AF n For example, as shown in FIG. 11, it consists of 8-channel audio signals. Audio file AF n Includes a sound signal C for movie content for each channel after a predetermined time tc. 1 , C 2 , ..., C 8 Is recorded. Furthermore, audio file AF n Includes the trigger audio signal T at a time before the time tc in the audio signal of the eighth channel. n Is recorded. This trigger audio signal T n As will be described later, each audio output site 100 n Audio file AF n By regenerating the output device 15 nm Output to each voice output site 100 n Audio signal C for movie content 1 , C 2 , ..., C 8 Before playback, the user listens. Also, the trigger audio signal T n Each of the audio output sites 100 due to variations in arrival time of control information indicating a reproduction instruction supplied from the
[0119]
Audio signal T for trigger n For example, the trigger signal TG is indicated by a digital watermark. n Embedded in the
[0120]
Audio output site 100 n When receiving control information indicating a reproduction instruction supplied from the
Also, the audio output site 100 n When the delay sample number information is received from the
[0121]
In the audio reproducing device 90 including such units, the audio file AF n If the control information indicating the reproduction instruction is given, the audio output site 100 n Audio file AF from each of n Is played. In the audio reproduction device 90, the
[0122]
Specifically, in the audio playback device 90, the audio output site 100 n Respectively, reproduction processing program E n And the audio file AF is performed through a series of steps shown in FIG. n Play.
[0123]
First, the audio output site 100 n As shown in the figure, in step S31, the voice file AF is sent from the
[0124]
Audio output site 100 n Respectively, in step S32, the sound processing unit 101 n Audio file AF via n Play.
[0125]
At the same time, the audio output site 100 n Respectively, in step S33, the audio file AF n Trigger signal TG embedded in n Is detected.
[0126]
Furthermore, the audio output site 100 n Respectively, in step S34, the trigger signal TG n The count of the number of reproduction samples is started with reference to the sample specified as the sample in which is embedded. Audio output site 100 n In this case, the audio file AF is used with reference to the count start sample. n The playback start timing is determined.
[0127]
And the audio output site 100 n Respectively continues to count the number of reproduced samples in step S35, and in step S36, the corresponding delayed sample number Sd from the
[0128]
Here, if the delayed sample number information has not arrived, the audio output site 100 n Each repeats the process of step S35.
[0129]
On the other hand, when the delayed sample number information arrives, the audio output site 100 n Respectively, in step S37, the number of delayed samples Sd n Only audio file AF n The playback is skipped, the playback is restarted from the skip destination time, and the series of processes is terminated.
[0130]
In this way, in the audio reproduction device 90, the audio output site 100 is displayed. n Each of the reproduction processing program E n And execute the audio file AF n The reproduction of the audio signal for the movie content in can be started simultaneously. In the audio playback device 90, the audio output site 100 is thereafter used. n Are respectively based on the word clock WCLK supplied from the
[0131]
On the other hand, in the audio reproduction device 90, the
[0132]
First, as shown in the figure, the
[0133]
Subsequently, the
[0134]
Subsequently, in step S43, the
[0135]
Here, audio file AF n If any of the above is not supplied, the
[0136]
On the other hand, audio file AF n If any of the above is supplied, the
[0137]
Subsequently, in step S45, the
[0138]
Here, the trigger signal TG n If is not the first detected, the
[0139]
Then, in step S47, the
[0140]
Subsequently, the
[0141]
Here, all audio output sites 100 n To trigger signal TG n Is not received, the
[0142]
On the other hand, all audio output sites 100 n To trigger signal TG n Is received, the
[0143]
Audio output site 100 n Either of the trigger signal TG due to failure etc. n May not be given to the
[0144]
In this way, in the audio reproduction device 90, the
[0145]
[0146]
That is, in the audio reproduction device 90, the
[0147]
Then, in the audio reproduction device 90, as described above, the audio output site 100 n Voice file AF n Is played. This audio output site 100 n Audio file AF from each of n As described above, the absolute time at which is played is the audio output site 100. n Sound processing unit 101 n Voice output site 100 due to the difference in the processing capacity of the CPU or the like (not shown). n Variation occurs between the two. Here, as shown in the middle of FIG. 1 Is the earliest voice file AF 1 Playback starts, and after that, the audio output site 100 4 , Voice output site 100 2 Audio file AF in the order 4 , AF 2 It is assumed that the playback of has started.
[0148]
Then, in the audio reproduction device 90, as described above, the audio output site 100 n Audio file AF by each of n Trigger signal TG embedded in n Is detected, and the trigger signal TG is also detected by the
[0149]
In the audio reproduction device 90, the audio output site 100 is displayed. n The number of delayed samples Sd n Only audio file AF n Playback is skipped, and playback is resumed from the point of the skip destination. At this time, the above-described reproduction margin sample number Sm0 is at least the following step, that is, the audio output site 100 that has received the control information indicating the reproduction instruction. n Is audio file AF n , The
[0150]
In the audio playback device 90, the audio output site 100 n Audio signal C for movie content in between 1 , C 2 , ..., C 8 After that, the audio file AF is maintained while maintaining the synchronization based on the word clock WCLK generated by the
[0151]
As described above, the audio reproduction device 90 shown as the fifth exemplary embodiment of the present invention is the audio output site 100. n Sound processing unit 101 n Among them, the trigger signal TG n Without providing a dedicated trigger channel for outputting the audio signal, it can be shared with the channel for outputting the audio signal, and the synchronized reproduction of the audio signal can be performed efficiently.
[0152]
As described above, the audio reproduction apparatuses shown as the first to fifth embodiments of the present invention can be configured at low cost using a plurality of general-purpose hardware, and have a processing capability and a channel. Synchronous reproduction of multi-channel audio signals that could not be realized in the past due to the limitation of the number or the like can be performed accurately. Therefore, by applying the audio reproducing apparatus to an entertainment system such as a movie theater or a game, for example, it is possible to realize a highly realistic sound reproduction with a simple configuration.
[0153]
In addition, this invention is not limited to embodiment mentioned above, For example, various changes are possible as described in the end of 1st Embodiment mentioned above and 2nd Embodiment. This is applicable to other embodiments as needed.
[0154]
In the present invention, any of the first to fifth embodiments described above may be appropriately combined within a possible range.
[0155]
Thus, it goes without saying that the present invention can be modified as appropriate without departing from the spirit of the present invention.
[0156]
【The invention's effect】
As described above in detail, the audio reproduction device according to the present invention is an audio reproduction device that synchronously reproduces audio signals of a plurality of channels, and is synchronized with the reference signal generating means for generating a predetermined reference signal. A plurality of audio output means for reproducing and outputting the audio signal via an audio output processor capable of processing the output of the multi-channel audio signal, and at least the audio in synchronism with the reference signal Reproduction timing of the audio signal in each of the audio output means, which is a signal supplied for at least one channel from each of the audio output means via an audio input processor capable of inputting and processing audio signals equal to or more than the number of output means. And a replay signal monitoring means for monitoring the arrival of the replay signal for providing the sound, and the replay signal monitoring means is supplied from each of the sound output means. The relative deviation times for the input times of the number of replay signals are obtained, and time information indicating the deviation times is notified to each of the audio output means, and each of the audio output means performs audio based on the time information. Determine when to start playing the signal.
[0157]
Therefore, the audio reproduction device according to the present invention is a timing at which reproduction of an audio signal should be started based on time information indicating a relative shift time with respect to input times of a plurality of replay signals corresponding to each of the audio output means. Therefore, even when a plurality of general-purpose hardware is used, it is possible to accurately perform synchronized reproduction of multi-channel audio signals.
[0158]
The audio reproduction method according to the present invention is an audio reproduction method for synchronously reproducing audio signals of a plurality of channels, and an audio output processor capable of performing output processing of the audio signals of a plurality of channels in synchronization with a predetermined reference signal. Through which the audio signal is reproduced and output from each of a plurality of audio output means that are not synchronized with each other and supplied for at least one channel, and the reproduction timing of the audio signal in each of the audio output means The sounding signal for providing the sounding signal is input to the sounding signal monitoring means via the sound input processor capable of inputting and processing at least the number of sound signals equal to the number of the sound output means in synchronization with the reference signal. A deviation time calculation step for obtaining a relative deviation time with respect to input times of a plurality of replay signals supplied from each, and time information indicating the deviation time Based on, and a playback start timing determination step of determining when to start playing the audio signal.
[0159]
Therefore, in the audio reproduction method according to the present invention, the timing at which the reproduction of the audio signal should be started based on the time information indicating the relative shift time with respect to the input times of the plurality of replay signals corresponding to the respective audio output means. Therefore, even when a plurality of general-purpose hardware is used, it is possible to accurately perform synchronized reproduction of multi-channel audio signals.
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating a configuration of an audio reproducing device shown as a first embodiment of the present invention.
FIG. 2 is a flowchart for explaining a series of steps until playback of an audio file is started at an audio output site provided in the audio playback apparatus.
FIG. 3 is a flowchart for explaining a series of steps when obtaining the number of delayed samples corresponding to each of the audio output sites at the trigger monitoring site provided in the audio reproduction apparatus.
FIG. 4 is a diagram for explaining an operation timing of each unit in the audio reproduction device.
FIG. 5 is a block diagram illustrating a configuration of an audio reproduction device shown as a second embodiment of the present invention.
FIG. 6 is a flowchart for explaining a series of steps until playback of an audio stream is started at an audio output site provided in the audio playback apparatus.
FIG. 7 is a block diagram illustrating a configuration of an audio reproducing device shown as a third embodiment of the present invention.
FIG. 8 is a block diagram illustrating the configuration of the audio reproduction device, and in particular, a block diagram illustrating a configuration of a signal processing unit included in the audio output site.
FIG. 9 is a block diagram illustrating a configuration of an audio reproducing device shown as a fourth embodiment of the present invention.
FIG. 10 is a block diagram illustrating a configuration of an audio reproducing device shown as a fifth embodiment of the present invention.
FIG. 11 is a diagram illustrating the structure of an audio file.
FIG. 12 is a flowchart for explaining a series of steps for reproducing an audio file at an audio output site provided in the audio reproducing apparatus.
FIG. 13 is a flowchart for describing a series of steps when obtaining the number of delayed samples corresponding to each of the audio output sites at the trigger monitoring site provided in the audio reproduction apparatus.
FIG. 14 is a diagram for explaining the operation timing of each unit in the audio reproduction device.
[Explanation of symbols]
10, 30, 50, 70, 90 Audio playback device, 11 Control site, 12, 73, 91 Trigger monitoring site, 13, 21 n , 41 n , 61 n , 72, 74, 81 n , 92, 101 n Sound processor, 14 word clock generator, 15 nm Output device, 16 nm Speaker, 20 n , 40 n , 60 n , 80 n , 100 n Audio output site, 31 distribution site, 51, 71 source output site, 62 nm Signal processing unit, 93 image processing unit
Claims (19)
所定の基準信号を生成する基準信号生成手段と、
上記基準信号に同期して複数チャンネルの音声信号を出力処理可能な音声出力処理器を介して、上記音声信号を再生して出力する互いに同期が確保されていない複数の音声出力手段と、
上記基準信号に同期して少なくとも上記音声出力手段の数以上の音声信号を入力処理可能な音声入力処理器を介して、上記音声出力手段のそれぞれから少なくとも1チャンネル分だけ供給される信号であって上記音声出力手段のそれぞれにおける上記音声信号の再生タイミングを与えるための予行信号の入来を監視する予行信号監視手段とを備え、
上記予行信号監視手段は、上記音声出力手段のそれぞれから供給された複数の予行信号の入力時間についての相対的なずれ時間を求め、上記ずれ時間を示す時間情報を、上記音声出力手段のそれぞれに対して通知し、
上記音声出力手段は、それぞれ、上記時間情報に基づいて、上記音声信号の再生を開始すべきタイミングを決定すること
を特徴とする音声再生装置。An audio reproduction device for synchronously reproducing audio signals of a plurality of channels,
A reference signal generating means for generating a predetermined reference signal;
A plurality of audio output means for reproducing and outputting the audio signal via an audio output processor capable of outputting and processing audio signals of a plurality of channels in synchronization with the reference signal;
A signal that is supplied for at least one channel from each of the audio output means via an audio input processor that can input and process at least audio signals equal to or greater than the number of the audio output means in synchronization with the reference signal. Replay signal monitoring means for monitoring the arrival of a replay signal for giving the reproduction timing of the sound signal in each of the sound output means,
The recurring signal monitoring means obtains a relative shift time for the input times of a plurality of replay signals supplied from each of the sound output means, and sets time information indicating the shift time to each of the sound output means. Notification to
Each of the audio output means determines a timing at which reproduction of the audio signal should be started based on the time information.
を特徴とする請求項1記載の音声再生装置。2. The sound reproducing apparatus according to claim 1, wherein the replay signal monitoring means notifies the time information to each of the sound output means via a general-purpose network according to a predetermined protocol.
上記音声出力手段は、それぞれ、上記基準信号に同期して音声信号を入力処理可能な音声入力処理器を介して、上記時間情報を入力すること
を特徴とする請求項1記載の音声再生装置。The recurring signal monitoring means outputs the time information to each of the audio output means via an audio output processor capable of outputting at least audio signals equal to or greater than the number of the audio output means in synchronization with the reference signal. Notify
2. The audio reproduction apparatus according to claim 1, wherein each of the audio output means inputs the time information via an audio input processor capable of performing an input process on the audio signal in synchronization with the reference signal.
を特徴とする請求項1記載の音声再生装置。2. The audio reproducing apparatus according to claim 1, wherein each of the audio output means is provided with a channel for outputting the replay signal among channels that can be output by the audio output processor. .
を特徴とする請求項1記載の音声再生装置。2. The audio reproduction apparatus according to claim 1, wherein the audio output means outputs the advance signal to the advance signal monitoring means when control information indicating an instruction to reproduce the audio signal is input.
を特徴とする請求項5記載の音声再生装置。6. The sound reproducing apparatus according to claim 5, further comprising a control means for notifying each of the sound output means of the control information via a general-purpose network according to a predetermined protocol.
上記音声出力手段は、それぞれ、上記音声出力処理器が出力処理可能なチャンネル数から上記予行信号を出力するためのチャンネル数を差し引いたチャンネル数分の音声信号を記憶する記憶手段を有すること
を特徴とする請求項1記載の音声再生装置。Each of the audio output means is provided with a dedicated channel for outputting the replay signal among the channels that can be output by the audio output processor,
Each of the audio output means has storage means for storing audio signals for the number of channels obtained by subtracting the number of channels for outputting the replay signal from the number of channels that can be processed by the audio output processor. The sound reproducing apparatus according to claim 1.
上記音声出力手段は、それぞれ、上記音声出力処理器が出力処理可能なチャンネルのうち、上記予行信号を出力するためのチャンネルを専用に設けており、
上記音声出力手段には、それぞれ、上記音声出力処理器が出力処理可能なチャンネル数から上記予行信号を出力するためのチャンネル数を差し引いたチャンネル数分の音声信号が、上記配信手段から配信されること
を特徴とする請求項1記載の音声再生装置。A delivery means for delivering the audio signal;
Each of the audio output means is provided with a dedicated channel for outputting the replay signal among the channels that can be output by the audio output processor,
The audio output means distributes audio signals for the number of channels obtained by subtracting the number of channels for outputting the replay signal from the number of channels that can be output by the audio output processor. The sound reproducing apparatus according to claim 1.
を特徴とする請求項8記載の音声再生装置。9. The audio reproducing apparatus according to claim 8, wherein the distribution unit distributes the audio signal to each of the audio output units via a general-purpose network according to a predetermined protocol.
上記音声出力手段は、それぞれ、上記ソース出力手段から配信された上記音声信号に対してチャンネル単位で所定の信号処理を施す複数の信号処理手段を有すること
を特徴とする請求項1記載の音声再生装置。Source output means for delivering an audio signal to be a source signal of a predetermined channel to each of the audio output means,
2. The audio reproduction device according to claim 1, wherein each of the audio output means includes a plurality of signal processing means for performing predetermined signal processing on a channel basis for the audio signal distributed from the source output means. apparatus.
を特徴とする請求項10記載の音声再生装置。11. The audio reproduction apparatus according to claim 10, wherein the source output unit distributes the audio signal to each of the audio output units via a general-purpose network according to a predetermined protocol.
上記音声出力手段は、それぞれ、上記基準信号に同期して音声信号を入力処理可能な音声入力処理器を介して、上記ソース出力手段から配信された上記音声信号を入力すること
を特徴とする請求項10記載の音声再生装置。The source output means distributes the audio signal to each of the audio output means via an audio output processor capable of outputting the audio signal in synchronization with the reference signal,
The audio output means inputs the audio signal distributed from the source output means via an audio input processor capable of performing input processing on the audio signal in synchronization with the reference signal. Item 13. The audio playback device according to Item 10.
上記信号処理手段は、それぞれ、上記制御情報に応じて、信号処理のパラメータを変更すること
を特徴とする請求項10記載の音声再生装置。The source output means notifies the audio output means of control information indicating the contents of signal processing in each of the signal processing means,
11. The audio reproduction device according to claim 10, wherein each of the signal processing means changes a signal processing parameter in accordance with the control information.
を特徴とする請求項13記載の音声再生装置。14. The audio reproduction apparatus according to claim 13, wherein the source output means notifies the control information to each of the audio output means via a general-purpose network according to a predetermined protocol.
上記音声出力手段は、それぞれ、上記基準信号に同期して音声信号を入力処理可能な音声入力処理器を介して、上記制御情報を入力すること
を特徴とする請求項13記載の音声再生装置。The source output means notifies the control information to each of the audio output means via an audio output processor capable of outputting an audio signal in synchronization with the reference signal,
14. The audio reproduction apparatus according to claim 13, wherein the audio output means inputs the control information via an audio input processor that can input and process an audio signal in synchronization with the reference signal.
上記予行信号監視手段は、上記音声入力処理器を介して、上記音声出力手段のそれぞれから再生された上記音声信号を入力し、上記音声信号に埋め込まれている上記予行信号を検出し、上記ずれ時間を求めること
を特徴とする請求項1記載の音声再生装置。The replay signal is embedded in the audio signal,
The replay signal monitoring means inputs the sound signal reproduced from each of the sound output means via the sound input processor, detects the replay signal embedded in the sound signal, and detects the deviation. 2. The audio reproducing apparatus according to claim 1, wherein time is obtained.
を特徴とする請求項16記載の音声再生装置。17. The audio reproduction device according to claim 16, wherein the replay signal is embedded in the audio signal by digital watermark.
を特徴とする請求項1記載の音声再生装置。2. The audio output means shares a channel for outputting the replay signal and a channel for outputting the audio signal in the audio output processor, respectively. Audio playback device.
所定の基準信号に同期して複数チャンネルの音声信号を出力処理可能な音声出力処理器を介して、上記音声信号を再生して出力する互いに同期が確保されていない複数の音声出力手段のそれぞれから少なくとも1チャンネル分だけ供給される信号であって、上記音声出力手段のそれぞれにおける上記音声信号の再生タイミングを与えるための予行信号を、上記基準信号に同期して少なくとも上記音声出力手段の数以上の音声信号を入力処理可能な音声入力処理器を介して予行信号監視手段に対して入力し、上記音声出力手段のそれぞれから供給された複数の予行信号の入力時間についての相対的なずれ時間を求めるずれ時間算出工程と、
上記ずれ時間を示す時間情報に基づいて、上記音声信号の再生を開始すべきタイミングを決定する再生開始タイミング決定工程とを備えること
を特徴とする音声再生方法。An audio reproduction method for synchronously reproducing audio signals of multiple channels,
From each of a plurality of audio output means that are not synchronized with each other and that reproduce and output the audio signal via an audio output processor that can output and process audio signals of a plurality of channels in synchronization with a predetermined reference signal A signal supplied for at least one channel, and a replay signal for giving the reproduction timing of the audio signal in each of the audio output means is at least equal to the number of the audio output means in synchronization with the reference signal An audio signal is input to the advance signal monitoring unit via an input processor capable of input processing, and a relative shift time with respect to input times of a plurality of advance signals supplied from each of the audio output units is obtained. Deviation time calculation step;
And a reproduction start timing determining step for determining a timing at which reproduction of the audio signal should be started based on time information indicating the deviation time.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001191774A JP4543586B2 (en) | 2001-06-25 | 2001-06-25 | Audio reproduction apparatus and audio reproduction method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001191774A JP4543586B2 (en) | 2001-06-25 | 2001-06-25 | Audio reproduction apparatus and audio reproduction method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003009298A JP2003009298A (en) | 2003-01-10 |
JP4543586B2 true JP4543586B2 (en) | 2010-09-15 |
Family
ID=19030341
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001191774A Expired - Fee Related JP4543586B2 (en) | 2001-06-25 | 2001-06-25 | Audio reproduction apparatus and audio reproduction method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4543586B2 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007124380A (en) * | 2005-10-28 | 2007-05-17 | Nec Corp | Stereophonic output system, stereophonic output method, and program for stereophonic output |
JP4757704B2 (en) * | 2006-05-01 | 2011-08-24 | 任天堂株式会社 | Music playback program, music playback device, music playback method, and music playback system |
US8903526B2 (en) | 2012-06-06 | 2014-12-02 | Sonos, Inc. | Device playback failure recovery and redistribution |
JP6229576B2 (en) * | 2014-04-03 | 2017-11-15 | ヤマハ株式会社 | Sampling frequency estimation device |
-
2001
- 2001-06-25 JP JP2001191774A patent/JP4543586B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2003009298A (en) | 2003-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6945590B2 (en) | Systems and methods for synchronizing operations between multiple independently clocked digital data processing devices | |
JP5149012B2 (en) | Synchronizing multi-channel speakers on the network | |
US7434154B2 (en) | Systems and methods for synchronizing media rendering | |
JP4333655B2 (en) | Content receiving apparatus and content receiving method | |
CA2438194C (en) | Live navigation web-conferencing system and method | |
US8677002B2 (en) | Streaming media system and method | |
US20150254340A1 (en) | Capability Scoring Server And Related Methods For Interactive Music Systems | |
JP2004104796A (en) | Synchronous reproduction of media data packet | |
JP2009535988A (en) | System and method for processing data signals | |
JP2012129800A (en) | Information processing apparatus and method, program, and information processing system | |
JP4543586B2 (en) | Audio reproduction apparatus and audio reproduction method | |
JP7024794B2 (en) | Audio systems, audio equipment, and how to control audio equipment | |
JP2008060675A (en) | Sound reproduction device and method | |
CN102394860A (en) | Signal transmission system, method, computer program product and computer readable storage media | |
CN108282720B (en) | Audio data stream transmission method and device | |
JP4967945B2 (en) | Terminal device and data distribution system | |
US20210125594A1 (en) | Wireless midi headset | |
JP5397495B2 (en) | Data distribution system and relay device | |
JP5489900B2 (en) | Acoustic data communication device | |
JP2010218013A (en) | Data distribution system | |
JP2004094683A (en) | Server, communication method, and spectator terminal | |
JP2008097096A (en) | Server device and communication session establishment method | |
JP4422656B2 (en) | Remote multi-point concert system using network | |
WO2017221407A1 (en) | Synchronization setting device, distribution system, synchronization setting method, and program | |
JP4071140B2 (en) | Data communication apparatus, method and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080220 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100608 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100621 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130709 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130709 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |