JP4543586B2 - Audio reproduction apparatus and audio reproduction method - Google Patents

Audio reproduction apparatus and audio reproduction method Download PDF

Info

Publication number
JP4543586B2
JP4543586B2 JP2001191774A JP2001191774A JP4543586B2 JP 4543586 B2 JP4543586 B2 JP 4543586B2 JP 2001191774 A JP2001191774 A JP 2001191774A JP 2001191774 A JP2001191774 A JP 2001191774A JP 4543586 B2 JP4543586 B2 JP 4543586B2
Authority
JP
Japan
Prior art keywords
audio
signal
site
audio output
reproduction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001191774A
Other languages
Japanese (ja)
Other versions
JP2003009298A (en
Inventor
宏平 浅田
和史 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2001191774A priority Critical patent/JP4543586B2/en
Publication of JP2003009298A publication Critical patent/JP2003009298A/en
Application granted granted Critical
Publication of JP4543586B2 publication Critical patent/JP4543586B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、マルチチャンネルの音声信号を同期再生する音声再生装置及び音声再生方法に関する。
【0002】
【従来の技術】
近年、オーディオ機器から再生される音声信号を臨場感を高めて聴取可能とするために、マルチチャンネルの音声信号を再生する音声再生システムの構築が考えられている。このような音声再生システムとしては、例えば、主に家庭室内や車両内等の空間における聴取を目的として、DVD(Digital Versatile Disc)等の記録媒体に記録されたマルチチャンネルの音声信号を再生するものがあり、聴取者の右前方、正面前方、左前方、右後方及び左後方に設置された5つのスピーカのそれぞれから出力されるべき5チャンネルと、音声信号の低域成分のみが記録されたサブチャンネルとを有する方式、すなわち、いわゆるドルビーAC−3(商標)5.1チャンネル方式と呼ばれるものが実用化されている。この5.1チャンネル方式による音声再生システムにおいては、実際に聴取者の右前方、正面前方、左前方、右後方及び左後方に設置された5つのスピーカと低域再生用のスピーカとを用いて再生することにより、臨場感のある音響再生を行うことができる。
【0003】
【発明が解決しようとする課題】
ところで、本件出願人は、マルチスピーカによる非常に精密な指向性、音場及び音像等の制御を実現するために、上述したような5.1チャンネル方式といったように、少数のスピーカから音声を再生可能とする音声再生システムではなく、より大規模の音声再生システムの構築を進めている。
【0004】
このような大規模な音声再生システムの構築を考えた場合、全く新規のハードウェアを設計することは勿論可能であるが、既存の汎用ハードウェアを用いて構築するのが望ましい。これは、パーソナルコンピュータに搭載可能であるいわゆるサウンドカード等の汎用ハードウェアに必要とされる機能を有する既存の安価な半導体が多く存在しており、音声再生システムを構築する上で全く新規の音声処理機構を開発するのに比べ、設計工数の効率化を計ることができ、安価に部品を調達でき、容易に設計可能であること等によるものである。
【0005】
ここで、このようなパーソナルコンピュータ等を含むハードウェアは、物理制約上又はシステム制約上、チャンネル数に制限がある場合が多い。そのため、音声再生システムとしては、1又は複数チャンネルの音声信号を出力可能なパーソナルコンピュータ等を含むハードウェアをネットワーク等を介して複数接続し、所定の局所的制御のもとに、これら複数のハードウェアから音声信号を分散して再生させることが考えられる。この際、音声再生システムにおいては、個々のハードウェアから出力される音声信号を例えばサンプル単位で完全に同期させて再生することが必要となる。
【0006】
したがって、音声再生システムにおいては、同期再生を実現するために、いわゆるリアルタイムOS(Operating System)を必要としたり、外部信号との時間同期を正確に行いつつ通信を行うことができる特殊なハードウェアを必要とし、システム全体や通信手段の複雑化を招く要因となっていた。
【0007】
また、音声再生システムにおいては、同期再生を実現するために、従来から映像等の同期手法として行われているものであり、各ハードウェアを接続する汎用ネットワークによるパケット通信によってハードウェア間のクロックを合わせることも可能である。
【0008】
しかしながら、音声再生システムにおいては、ネットワーク上のトラフィックの影響に起因して、コマンドが各ハードウェアへと到達する時間にばらつきが生じる。また、音声再生システムにおいては、様々なハードウェアを相互に接続することから、これら各ハードウェアの相違によって処理時間も多様となり、この処理時間を予測することも困難である。さらに、音声再生システムにおいては、サウンドカード自体のクロックの相違もある。このため、音声再生システムにおいては、通信セッション毎の各ハードウェア間での遅延時間を特定することは困難であり、統計的手法に頼らざるを得ず、非常に不安定なものであった。したがって、このような手法は、音声のように、例えば1/44100秒単位でサンプルレベルの同期が必要なものには不適であった。
【0009】
本発明は、このような実情に鑑みてなされたものであり、汎用の複数のハードウェアを用いて、マルチチャンネルの音声信号を精確に同期再生することができる音声再生装置及び音声再生方法を提供することを目的とするものである。
【0010】
【課題を解決するための手段】
上述した目的を達成する本発明にかかる音声再生装置は、複数チャンネルの音声信号を同期再生する音声再生装置であって、所定の基準信号を生成する基準信号生成手段と、基準信号に同期して複数チャンネルの音声信号を出力処理可能な音声出力処理器を介して、音声信号を再生して出力する互いに同期が確保されていない複数の音声出力手段と、基準信号に同期して少なくとも音声出力手段の数以上の音声信号を入力処理可能な音声入力処理器を介して、音声出力手段のそれぞれから少なくとも1チャンネル分だけ供給される信号であって音声出力手段のそれぞれにおける音声信号の再生タイミングを与えるための予行信号の入来を監視する予行信号監視手段とを備え、予行信号監視手段は、音声出力手段のそれぞれから供給された複数の予行信号の入力時間についての相対的なずれ時間を求め、ずれ時間を示す時間情報を、音声出力手段のそれぞれに対して通知し、音声出力手段は、それぞれ、時間情報に基づいて、音声信号の再生を開始すべきタイミングを決定することを特徴としている。
【0011】
このような本発明にかかる音声再生装置は、音声出力手段のそれぞれに対応する複数の予行信号の入力時間についての相対的なずれ時間を示す時間情報に基づいて、音声信号の再生を開始すべきタイミングを決定する。
【0012】
また、上述した目的を達成する本発明にかかる音声再生方法は、複数チャンネルの音声信号を同期再生する音声再生方法であって、所定の基準信号に同期して複数チャンネルの音声信号を出力処理可能な音声出力処理器を介して、音声信号を再生して出力する互いに同期が確保されていない複数の音声出力手段のそれぞれから少なくとも1チャンネル分だけ供給される信号であって、音声出力手段のそれぞれにおける音声信号の再生タイミングを与えるための予行信号を、基準信号に同期して少なくとも音声出力手段の数以上の音声信号を入力処理可能な音声入力処理器を介して予行信号監視手段に対して入力し、音声出力手段のそれぞれから供給された複数の予行信号の入力時間についての相対的なずれ時間を求めるずれ時間算出工程と、ずれ時間を示す時間情報に基づいて、音声信号の再生を開始すべきタイミングを決定する再生開始タイミング決定工程とを備えることを特徴としている。
【0013】
このような本発明にかかる音声再生方法は、音声出力手段のそれぞれに対応する複数の予行信号の入力時間についての相対的なずれ時間を示す時間情報に基づいて、音声信号の再生を開始すべきタイミングが決定される。
【0014】
【発明の実施の形態】
以下、本発明を適用した具体的な実施の形態について図面を参照しながら詳細に説明する。
【0015】
この実施の形態は、パーソナルコンピュータ等を含む複数のハードウェアを用いて、少なくとも2チャンネル以上のマルチチャンネルの音声信号を同期して再生することが可能な音声再生装置である。この音声再生装置は、マルチタスク可能であり、且つ、必ずしもリアルタイム性処理に特化していない一般的なハードウェア又はOS(Operating System)若しくはOSに相当するシステムを用いるとともに、既存のサウンドカードやインターフェース、これに準じるハードウェア等の汎用的な音声処理手段及び通信手段を用いて、複数のハードウェアにまたがって存在する音声信号のマルチチャンネルの同期再生を可能とするものである。
【0016】
なお、以下では、ハードウェアとは、各種プログラムを記憶するメモリ及び各種プログラムを実行するCPU(Central Processing Unit)又はDSP(Digital Signal Processor)等によって構成されたものとして説明する。また、以下では、ハードウェアに存在する音声信号とは、特に断りがない限り、例えばハードディスク等の記憶手段上に音声ファイルとして存在しているもの、及び、各ハードウェア上で信号処理されるか否かを問わず逐次的にメモリ上に存在する音声ストリームのいずれをも指し示すものとして説明する。さらに、以下では、各機能単位を示すモジュールを“サイト”と称するものとする。このサイトは、必ずしもハードウェア等の単位と一致するものではない。すなわち、音声再生装置は、複数のサイトが1つのハードウェアに実装されてもよく、複数のハードウェアに分散されて実装されてもよく、その構成は任意性があるものとする。
【0017】
まず、本発明の第1の実施の形態について説明する。この第1の実施の形態として図1に示す音声再生装置10は、各ハードウェア上に音声信号が音声ファイルとして分散して存在しており、これらの音声ファイルを用いて56チャンネルの音声信号の同期再生を行うものである。
【0018】
音声再生装置10は、同図に示すように、各部を制御する制御手段であるコントロールサイト11と、後述する予行信号であるトリガ信号TG,TG,・・・,TGを監視する予行信号監視手段であるトリガ監視サイト12と、音声信号を再生して出力する音声出力手段である8つの音声出力サイト20,20,・・・,20(以下、音声出力サイト20(n=1,2,・・・,8;サイト番号)と総称する。)と、所定の基準信号としてワード単位でクロックを生成する基準信号生成手段であるワードクロック生成器14と、音声出力サイト20から出力された音声信号に対してD/A(Digital/Analog)変換を施すD/Aコンバータ及びアナログ化された音声信号を増幅するアンプ等からなる56個の出力器1511,1512,1513,1514,1515,1516,1517,1521,1522,・・・,1584,1585,1586,1587(以下、出力器15nm(n=1,2,・・・,8、m=1,2,・・・,7;チャンネル番号)と総称する。)と、これらの出力器15nmのそれぞれから出力された音声信号を外部へと放音する56個のスピーカ1611,1612,1613,1614,1615,1616,1617,1621,1622,・・・,1684,1685,1686,1687(以下、スピーカ16nm(n=1,2,・・・,8、m=1,2,・・・,7)と総称する。)とを備える。
【0019】
コントロールサイト11は、音声再生装置10の統括制御を行う機能を有するとともに、音声再生装置10とユーザとの間のインターフェースに関する機能を有するものである。コントロールサイト11は、例えばTCP/IP(Transmission Control Protocol/Internet Protocol)やUDP(User Datagram Protocol)等の所定のプロトコルにしたがって外部との通信を行うことが可能であり、ネットワークNTを介してトリガ監視サイト12及び音声出力サイト20との間で信号の送受信を行うことが可能とされる。音声再生装置10は、このような一般的に周知であり多く使用されるネットワークリソースや汎用の通信プロトコルを用いることにより、特別なハードウェアを用意したり、新たに構築する必要がない。コントロールサイト11は、コントロールプログラムCtを実行することが可能な環境とされており、所定の操作部や表示部等からなるユーザインターフェースUIを介してユーザによって再生コマンドが指示されると、コントロールプログラムCtの実行制御のもとに、音声ファイルの再生指示を示す制御情報をネットワークNTを介して音声出力サイト20に対して通知する。
【0020】
トリガ監視サイト12は、少なくとも音声出力サイト20の数以上、すなわち、8チャンネル以上の後述するトリガ信号としての音声信号を入力処理可能なサウンドカード等のサウンド処理部13を有するパーソナルコンピュータ等を含むハードウェアの機能を有するものである。トリガ監視サイト12は、コントロールサイト11と同様に、TCP/IPやUDP等の所定のプロトコルにしたがってネットワークNTを介してコントロールサイト11及び音声出力サイト20との間で信号の送受信を行うことが可能とされる。また、トリガ監視サイト12は、サウンド処理部13を介して音声出力サイト20から出力される1チャンネル分の音声信号であって音声ファイルの再生タイミングを与えるための信号であるトリガ信号TG,TG,・・・,TG(以下、トリガ信号TG(n=1,2,・・・,8)と総称する。)を受信することが可能とされる。このとき、トリガ監視サイト12は、サウンド処理部13における第1チャンネルが音声出力サイト20と接続され、第2チャンネルが音声出力サイト20と接続されるといったように、各チャンネルが音声出力サイト20のそれぞれと対応させて接続される。トリガ監視サイト12は、監視プログラムSvを実行することが可能な環境とされており、ワードクロック生成器14から供給されるワードクロックWCLK又はワード単位で各サンプルを同期せしめるのに十分なトリガ外部信号に同期して、サウンド処理部13における処理を行う。
【0021】
トリガ監視サイト12は、コントロールサイト11から全ての音声出力サイト20に対して音声ファイルの再生指示を示す制御情報が出力されると、監視プログラムSvの実行制御のもとに、音声出力サイト20のそれぞれから出力されるトリガ信号TGの入来を監視する。トリガ監視サイト12は、トリガ信号TGを受け取ると、これらのトリガ信号TGに基づいて、音声出力サイト20のそれぞれに対応する後述する遅れサンプル数を求め、これらの遅れサンプル数を示す遅れサンプル数情報をネットワークNTを介して音声出力サイト20に対してそれぞれ出力する。ここで、遅れサンプル数とは、トリガ監視サイト12に対するトリガ信号TGの入力時間についての相対的なずれ時間をワードクロックWCLK単位で求めたものである。
【0022】
なお、トリガ監視サイト12が取り扱う音声信号の種別としては、ディジタルデータが望ましいが、サウンド処理部13において、ワードクロックWCLKやトリガ信号TGを正確に感知でき且つ送受信可能であるならば、アナログデータでもよい。また、トリガ監視サイト12においては、ディジタルデータを取り扱う場合であっても、例えばサンプリングレートや圧縮又は非圧縮の別といったデータフォーマットはいかなるものであってもよい。
【0023】
音声出力サイト20は、それぞれ、例えば8チャンネルの音声信号を出力処理可能なサウンドカード等のサウンド処理部21,21,・・・,21(以下、サウンド処理部21(n=1,2,・・・,8)と総称する。)を有するパーソナルコンピュータ等を含むハードウェアの機能を有するものである。音声出力サイト20は、それぞれ、コントロールサイト11及びトリガ監視サイト12と同様に、TCP/IPやUDP等の所定のプロトコルにしたがってネットワークNTを介してコントロールサイト11及びトリガ監視サイト12との間で信号の送受信を行うことが可能とされる。また、音声出力サイト20は、それぞれ、サウンド処理部21における例えば第8チャンネルのみをトリガ監視サイト12と接続しており、このチャンネルを用いてトリガ監視サイト12に対して1チャンネル分の音声信号であるトリガ信号TGを出力することが可能とされる。音声出力サイト20は、それぞれ、再生処理プログラムA,A,・・・,A(以下、再生処理プログラムA(n=1,2,・・・,8)と総称する。)を実行することが可能な環境とされており、ワードクロック生成器14から供給されるワードクロックWCLK又はワード単位で各サンプルを同期せしめるのに十分なトリガ外部信号に同期して、サウンド処理部21における処理を行う。このとき、音声出力サイト20においては、それぞれ、サウンド処理部21における第1チャンネル乃至第8チャンネルの間の同期は確保されているものとする。すなわち、音声出力サイト20においては、それぞれ、後述するように、コントロールサイト11から再生指示を受け取った場合には、サウンド処理部21における第1チャンネル乃至第8チャンネルから同時に音声信号を出力する。また、音声出力サイト20は、それぞれ、図示しない記憶手段に、音声ファイルAF,AF,・・・,AF(以下、音声ファイルAF(n=1,2,・・・,8)と総称する。)を記憶している。
【0024】
音声出力サイト20は、それぞれ、コントロールサイト11からネットワークNTを介して供給される音声ファイルAFの再生指示を示す制御情報を受け取ると、再生処理プログラムAの実行制御のもとに、サウンド処理部21を介してトリガ信号TGをトリガ監視サイト12に対して出力する。なお、このトリガ信号TGは、トリガ監視サイト12によってトリガとして認識できる所定の波形を有する音声信号であり、例えばインパルス信号等が望ましい。また、音声出力サイト20は、それぞれ、トリガ監視サイト12からネットワークNTを介して遅れサンプル数情報を受け取ると、この遅れサンプル数と後述する再生マージンサンプル数とに基づいて、音声ファイルAFの再生を開始すべきタイミングを決定し、このタイミングで音声ファイルAFの再生を開始し、出力器15nm及びスピーカ16nmを介して外部へと放音させる。なお、音声出力サイト20は、それぞれ、サウンド処理部21における第1チャンネル乃至第7チャンネルがそれぞれ出力器151mと接続されるといったように、各チャンネルから出力される音声信号を、対応する出力器15nmに対して出力する。
【0025】
なお、各音声出力サイト20が取り扱う音声信号の種別としては、トリガ監視サイト12と同様に、ディジタルデータが望ましいが、サウンド処理部21において、ワードクロックWCLKやトリガ信号TGを正確に感知でき且つ送受信可能であるならば、アナログデータでもよい。また、音声出力サイト20においては、それぞれ、ディジタルデータを取り扱う場合であっても、例えばサンプリングレートや圧縮又は非圧縮の別といったデータフォーマットはいかなるものであってもよい。
【0026】
ワードクロック生成器14は、ワード単位で正確なクロックを生成する。ワードクロック生成器14は、生成したワードクロックWCLKを、トリガ監視サイト12におけるサウンド処理部13及び音声出力サイト20におけるサウンド処理部21に供給する。なお、ワードクロック生成器14は、ワード単位で各サンプルを同期せしめるのに十分なトリガ外部信号を生成するようにしてもよい。
【0027】
出力器15nmは、それぞれ、音声出力サイト20から出力された音声信号に対してD/A変換を施した後増幅する。出力器15nmは、それぞれ、増幅した音声信号をスピーカ16nmに対して出力する。
【0028】
スピーカ16nmは、それぞれ、出力器15nmのそれぞれから出力された電気的な音声信号を音響エネルギへと変換し、外部へと放音する。
【0029】
このような各部を備える音声再生装置10においては、音声出力サイト20のそれぞれに記憶されている音声ファイルAFの再生指示を示す制御情報がコントロールサイト11によって与えられると、音声出力サイト20のそれぞれから、トリガ監視サイト12に対してトリガ信号TGが出力される。音声再生装置10においては、トリガ監視サイト12により、トリガ信号TGに基づいて、音声出力サイト20のそれぞれに対応する遅れサンプル数を求める。そして、音声再生装置10においては、各音声出力サイト20により、この遅れサンプル数と再生マージンサンプル数とに基づいて、自己が再生を開始すべきタイミングを求め、このタイミングに到達した時間に音声ファイルAFの再生を開始することができる。音声再生装置10においては、このようにして、全ての音声出力サイト20による音声ファイルAFの再生開始のタイミングを一致させることができる。そして、音声再生装置10においては、それ以後、ワードクロック生成器14から供給されるワードクロックWCLKに基づいて音声出力サイト20によって再生を進行することにより、マルチチャンネルの同期再生を行うことができる。
【0030】
なお、音声再生装置10においては、例えば、音声出力サイト20がコントロールサイト11及び/又はトリガ監視サイト12の機能を兼ね備えていたり、他の音声出力サイト20の機能を兼ね備るといったように、複数のサイトが1つのハードウェアに実装されたり、複数のハードウェアに分散されて実装されることが可能であることは、上述したとおりである。
【0031】
このような音声再生装置10においては、音声出力サイト20は、それぞれ、再生処理プログラムAを実行し、図2に示す一連の工程を経ることによって音声ファイルAFの再生を開始する。
【0032】
まず、音声出力サイト20には、それぞれ、同図に示すように、ステップS1において、再生マージンサンプル数Smが設定される。この再生マージンサンプル数Smは、音声出力サイト20の間において共通の値である。具体的には、再生マージンサンプル数Smは、後述する基準サンプルから音声ファイルAFの再生開始時のサンプルまでの時間を表す値である。再生マージンサンプル数Smは、例えば後述する各種処理が終了するのに十分な時間を見込んで算出される値であり、ユーザによって設定されてもよく、自動的に設定されてもよい。音声出力サイト20は、それぞれ、設定された再生マージンサンプル数Smを図示しないメモリ等に記憶する。
【0033】
続いて、音声出力サイト20は、それぞれ、ステップS2において、コントロールサイト11からネットワークNTを介して音声ファイルAFの再生指示を示す制御情報が到達したか否かを判別する。なお、音声出力サイト20には、コントロールサイト11からの再生指示がネットワークNTを介して与えられることから、制御情報が到達する絶対的な時刻は、ネットワークトラフィックの影響等に起因して音声出力サイト20の間でばらつきが生じる。音声出力サイト20は、それぞれ、コントロールサイト11からの制御情報が到達するまで待機し、制御情報を受け取った時点で、ステップS3へと処理を移行する。
【0034】
音声出力サイト20は、それぞれ、ステップS3において、サウンド処理部21における例えば第8チャンネル(m=8)、すなわち、トリガ監視サイト12と接続しているトリガチャンネルに、例えばインパルス信号等の音声信号であるトリガ信号TGを再生する。なお、音声出力サイト20のそれぞれからトリガ信号TGが再生される絶対的な時刻は、音声出力サイト20が、それぞれ、異なる種類のサウンド処理部21を搭載している場合があること、同一種類のサウンド処理部21を搭載していても処理能力には若干のばらつきがあること、マルチタスクで動作している他のタスクの動作状況等に起因して予測不可能である。
【0035】
これと同時に、音声出力サイト20は、それぞれ、ステップS4において、トリガ信号TGを再生してトリガ監視サイト12に対して出力した時点のサンプルSを基準として、再生サンプル数のカウントを開始する。音声出力サイト20においては、それぞれ、このサンプルSを基準として、音声ファイルAFの再生開始のタイミングが決定されることになる。
【0036】
さらにこれと同時に、音声出力サイト20は、それぞれ、ステップS5において、トリガチャンネル以外のチャンネル、すなわち、第1チャンネル乃至第7チャンネル(m=1〜7)に“0”を出力する。すなわち、音声出力サイト20は、それぞれ、ステップS3において、第8チャンネルにトリガ信号TGを再生するのに対応して、第1チャンネル乃至第7チャンネルをミュートする。
【0037】
そして、音声出力サイト20は、それぞれ、ステップS6において、再生サンプル数のカウントを継続し、ステップS7において、トリガ監視サイト12から対応する遅れサンプル数Sd(n=1,2,・・・,8)を示す遅れサンプル数情報がネットワークNTを介して到達したか否かを判別する。なお、音声出力サイト20には、トリガ監視サイト12からの遅れサンプル数情報がネットワークNTを介して与えられることから、遅れサンプル数情報が到達する絶対的な時刻は、ネットワークトラフィックの影響等に起因して音声出力サイト20の間でばらつきが生じる。
【0038】
ここで、遅れサンプル数情報が到達していない場合には、音声出力サイト20は、それぞれ、ステップS5乃至ステップS6の処理を繰り返す。
【0039】
一方、遅れサンプル数情報が到達した場合には、音声出力サイト20は、それぞれ、ステップS8において、“(再生マージンサンプル数Sm)−(遅れサンプル数Sd)”の値を算出し、トリガ監視サイト12に対してトリガ信号TGを出力した時点のサンプルからカウントして、この算出した値が経過したサンプルに到達した時点から、音声ファイルAFの再生を開始し、一連の処理を終了する。
【0040】
このようにして、音声再生装置10においては、音声出力サイト20のそれぞれによって再生処理プログラムAを実行し、音声ファイルAFの再生を同時に開始することができる。なお、音声再生装置10においては、それ以後、音声出力サイト20が、それぞれ、ワードクロック生成器14から供給されるワードクロックWCLKに基づいて音声ファイルAFの再生を進行することにより、マルチチャンネルの同期再生が可能となる。
【0041】
一方、音声再生装置10においては、トリガ監視サイト12は、監視プログラムSvを実行し、図3に示す一連の工程を経ることによって音声出力サイト20のそれぞれに対応する遅れサンプル数Sd,Sd,・・・,Sd(以下、遅れサンプル数Sd(n=1,2,・・・,8)と総称する。)を求める。
【0042】
まず、トリガ監視サイト12は、同図に示すように、ステップS11において、音声出力サイト20のそれぞれからサウンド処理部13における各チャンネルに出力されるトリガ信号TGの入来を監視する。
【0043】
続いて、トリガ監視サイト12は、ステップS12において、サウンド処理部13における8つのチャンネルのうちのいずれかのチャンネルに、トリガ信号TGのいずれかが供給されたか否かを判別する。
【0044】
ここで、トリガ信号TGのいずれかが供給されていない場合には、トリガ監視サイト12は、ステップS11へと処理を移行し、トリガ信号TGのいずれかが供給されるまで監視し続ける。
【0045】
一方、トリガ信号TGのいずれかが供給された場合には、トリガ監視サイト12は、ステップS13において、供給されたトリガ信号TGが最初に供給されたものであるか否か、すなわち、初めてトリガ信号TGが供給されたのか否かを判別する。
【0046】
ここで、トリガ信号TGが最初に供給されたものでない場合には、トリガ監視サイト12は、ステップS15へと処理を移行する。一方、トリガ信号TGが最初に供給されたものであった場合には、トリガ監視サイト12は、ステップS14において、この最初に検出したトリガ信号TGが入力された時点のサンプルを基準サンプルとして、入力サンプル数のカウントを開始し、ステップS15へと処理を移行する。トリガ監視サイト12においては、この基準サンプルに基づいて、入力サンプル数をカウントすることによって他のトリガ信号TGの入力時刻を計測することになる。
【0047】
そして、トリガ監視サイト12は、ステップS15において、ステップS14にて基準サンプルを基点としてカウントを開始しているカウント値を遅れサンプル数Sdとし、トリガ信号TGを出力した対応する音声出力サイト20に対して、この遅れサンプル数Sdを示す遅れサンプル数情報をネットワークNTを介して出力する。なお、トリガ監視サイト12は、最初にトリガ信号TGを出力した音声出力サイト20に対しては、遅れサンプル数Sd=0を通知することはいうまでもない。
【0048】
続いて、トリガ監視サイト12は、ステップS16において、入力サンプル数のカウントを継続し、ステップS17において、全ての音声出力サイト20からトリガ信号TGを受信したか否かを判別する。
【0049】
ここで、全ての音声出力サイト20からトリガ信号TGを受信していない場合には、トリガ監視サイト12は、ステップS11乃至ステップS16の処理を繰り返す。
【0050】
一方、全ての音声出力サイト20からトリガ信号TGを受信した場合には、トリガ監視サイト12は、そのまま一連の処理を終了する。
【0051】
なお、音声出力サイト20のいずれかが故障等によってトリガ信号TGをトリガ監視サイト12に与えない場合があり得るが、この場合には、トリガ監視サイト12は、ステップS17からステップS11へと移行するループ処理を適宜抜けるようにしてもよい。
【0052】
このようにして、音声再生装置10においては、トリガ監視サイト12によって監視プログラムSvを実行し、音声出力サイト20のそれぞれに対応する遅れサンプル数Sdを求めることができ、音声出力サイト20による同期再生を実現させることが可能となる。
【0053】
このようなプログラムを実行するトリガ監視サイト12及び音声出力サイト20を備える音声再生装置10においては、例えば図4に示すタイミングにしたがって各動作が協調して行われる。
【0054】
すなわち、音声再生装置10においては、ワードクロック生成器14によって生成されるワードクロックWCLKに基づいて、トリガ監視サイト12及び音声出力サイト20が動作する。音声再生装置10においては、同図上段に示すように、ユーザインターフェースUIを介して再生コマンドが指示されると、この再生指示を示す制御情報がコントロールサイト11から音声出力サイト20のそれぞれにネットワークNTを介して通知される。この制御情報が到達する絶対的な時刻は、上述したように、ネットワークトラフィックの影響等に起因して、音声出力サイト20の間でばらつきが生じる。ここでは、同図中段に示すように、音声出力サイト20が最も早く制御情報を受信し、音声出力サイト20,音声出力サイト20の順序で制御情報を受信したものとする。
【0055】
すると、音声再生装置10においては、上述したように、音声出力サイト20からトリガ監視サイト12に対してトリガ信号TGが与えられる。この音声出力サイト20のそれぞれからトリガ信号TGが再生される絶対的な時刻は、上述したように、音声出力サイト20におけるサウンド処理部21の相違や図示しないCPU等の処理能力等に起因して、音声出力サイト20の間でばらつきが生じる。ここでは、同図中段に示すように、音声出力サイト20が最も早いサンプルSの時点でトリガ信号TGを再生し、以後、サンプルS,Sの時点で音声出力サイト20,音声出力サイト20の順序でトリガ信号TG,TGを再生したものとする。音声出力サイト20は、それぞれ、これらのトリガ信号TGが出力された時点のサンプルSを基準として、再生サンプル数のカウントを開始する。また、ここでは、最も早くトリガ信号TGが再生されたサンプルSを基準サンプルとしている。
【0056】
これに対応して、音声再生装置10においては、上述したように、トリガ監視サイト12によって基準サンプルであるサンプルSから入力サンプル数のカウントを開始し、同図下段に示すように、遅れサンプル数Sdを算出する。音声再生装置10においては、これらの遅れサンプル数Sdが対応する音声出力サイト20に対して通知される。この遅れサンプル数Sdが到達する絶対的な時刻は、上述したように、ネットワークトラフィックの影響等に起因して、音声出力サイト20の間でばらつきが生じる。ここでは、同図中段に示すように、音声出力サイト20が最も早く遅れサンプル数情報を受信し、音声出力サイト20,音声出力サイト20の順序で遅れサンプル数情報を受信したものとする。
【0057】
そして、音声再生装置10においては、音声出力サイト20のそれぞれにより、トリガ監視サイト12に対してトリガ信号TGを出力した時点のサンプルSからカウントして、(再生マージンサンプル数Sm−遅れサンプル数Sd)サンプル目から、音声ファイルAFの再生が一斉に開始される。なお、再生マージンサンプル数Smは、少なくとも以下の工程、すなわち、再生指示を示す制御情報を受信した音声出力サイト20がトリガ信号TGを出力する工程、トリガ監視サイト12が全ての音声出力サイト20からトリガ信号TGを受信する工程、トリガ監視サイト12が音声出力サイト20のそれぞれに対して遅れサンプル数Sdを通知する工程、及び、全ての音声出力サイト20が遅れサンプル数Sdを受信し、音声ファイルAFの再生動作を開始する工程を行うのに十分な時間を見込んで算出される値である。
【0058】
音声再生装置10においては、音声出力サイト20間における音声ファイルAFの再生開始位置を一定にし、それ以後は、ワードクロック生成器14によって生成されるワードクロックWCLKに基づいて同期を保ちながら音声ファイルAFの再生を進行する。
【0059】
以上のように、本発明の第1の実施の形態として示す音声再生装置10は、各音声出力サイト20上に分散して存在している音声ファイルAFを用いて、マルチチャンネルの同期再生を行うことができる。特に、音声再生装置10は、互いに同期が確保されておらず、動作環境が多種多様にわたる音声出力サイト20を用いた場合であっても、確実に同期再生を実現することができる。音声再生装置10は、例えば、Mチャンネルの同時再生が可能なサウンド処理部を用いて、トリガ監視サイト12及びn個の音声出力サイト20を構成することにより、(M−1)×nチャンネルの同期再生を実現することが可能となる。
【0060】
なお、音声再生装置10においては、上述したコントロールサイト11の役割としては、ユーザがユーザインターフェースUIを操作したタイミングで再生を行うための再生指示を示す制御情報を発信することである。しかしながら、ユーザがユーザインターフェースUIを操作して再生指示が出されたタイミングから再生開始までの時間は、最初のトリガ信号TGが再生されるまでの時間と、設定した再生マージンサンプル数Smとの和によって規定される。そして、これらの時間は、ネットワークトラフィックやハードウェアの処理負荷等の要因によって毎回ばらつきが生じるものである。したがって、音声再生装置10においては、再生開始の絶対時刻を問題とするのではなく、あくまでも再生開始のタイミングを一致させることを目的とし、絶対時刻に関しては問題とならない場合を対象としていることに注意されたい。
【0061】
また、上述した実施の形態では、コントロールサイト11によって再生指示のみを与えるものとして説明したが、音声再生装置10においては、例えば、「停止」、「一時停止」、必要に応じて「巻き戻し」及び「早送り」等に相当するコマンドに対応した指示を与えることもできる。例えば、音声再生装置10においては、再生開始後も再生サンプルのカウントを継続し、各音声ファイルAFにおけるどの時点で停止するか、又は、復帰再生するか、といった情報をコントロールサイト11を介して音声出力サイト20に与えたり、音声ファイルAFの再生位置の指定を行うことにより、音声出力サイト20による再生処理プログラムAの実行制御のもとに統一のとれた動作を実現することができる。
【0062】
さらに、音声再生装置10においては、コントロールサイト11は必ずしも備える必要はない。音声再生装置10は、コントロールサイト11を備える代わりに、音声出力サイト20のそれぞれが有するタイマ等を利用して、予め設定された時刻に同期再生を開始する、といったことも実現可能である。ただし、この場合、音声再生装置10においては、音声出力サイト20のそれぞれが有するタイマのずれ時間を想定して再生マージンサンプル数Smの値を設定するか、再生マージンサンプル数Smの値以内に収まるように、各タイマをネットワークNTを介して調整する必要がある。
【0063】
さらにまた、音声再生装置10においては、各サイトとしてパーソナルコンピュータを用いたり、サウンド処理部としてサウンドカードを用いなくとも、当該機能を実現可能なハードウェアであればよい。
【0064】
また、音声再生装置10においては、TCP/IPやUDP等の所定のプロトコルにしたがってネットワークNTを介した通信を行うものとして説明したが、トリガ監視サイト12から音声出力サイト20に対して遅れサンプル数Sdを通知可能であるならば、いかなるネットワーク階層のフォーマットであってもよいことはいうまでもない。
【0065】
さらに、上述した実施の形態では、再生マージンサンプル数Smとして固定値を用いるものとして説明したが、例えば、音声再生装置10においては、トリガ監視サイト12による監視プログラムSvの実行制御のもとに、各音声出力サイト20の遅れサンプル数Sdを算出した後、通信及び音声信号出力に際する遅れを十分に見込んだ値を再生マージンサンプル数Smとして算出し、ネットワークNTを通じて各音声出力サイト20に通知して設定するようにしてもよい。このとき、音声再生装置10は、ネットワークNTを介した通信を行う際に生じる遅れを統計的に測定し、この統計情報を用いて再生マージンサンプル数Smを設定することもできる。
【0066】
さらにまた、上述した実施の形態では、サウンド処理部をワードクロックWCLKに同期させるものとして説明したが、音声再生装置10においては、ワードクロックに限らず、サウンド処理部において同期を確保するような機構であれば、例えば、256倍クロックや1/2ワード単位のクロック、又は、SMPTE(Society of Motion Picture and Television Engineers)のような一般的なコードに対応するものであってもよい。
【0067】
また、上述した実施の形態では、トリガ監視サイト12において入力サンプル数のカウントが開始される基準サンプルとして、最も早くトリガ信号TGが再生された時点のサンプルSを採用するものとして説明したが、音声再生装置10においては、トリガ監視サイト12によって任意時刻での特定サンプルを規定することができ、相対的に遅れサンプル数Sd,Sd,・・・,Sdの時間関係が保たれた情報が各音声出力サイト20に通知可能であるならば、基準サンプルはいかなる時間のものであってもよい。
【0068】
さらに、上述した実施の形態では、音声信号が音声ファイルAFとして存在するものとして説明したが、音声再生装置10においては、逐次的にメモリ上に音声ストリームとして存在するものであってもよい。
【0069】
つぎに、本発明の第2の実施の形態について説明する。この第2の実施の形態として図5に示す音声再生装置30は、56チャンネルの音声ファイルがまとまって存在しており、8チャンネルの音声信号を出力処理可能な8つの音声出力サイトを用いて、56チャンネルの音声信号の同期再生を行うものである。したがって、上述した第1の実施の形態として示した音声再生装置10と同様の機能を有する各部については同一符号を付し、詳細な説明を省略するものとする。
【0070】
音声再生装置30は、同図に示すように、上述したトリガ監視サイト12と、ワードクロック生成器14と、56個の出力器15nmと、56個のスピーカ16nmとの他、記憶している56チャンネルの音声ファイルAFを配信する配信サイト31と、音声信号を再生して出力する8つの音声出力サイト40,40,・・・,40(以下、音声出力サイト40(n=1,2,・・・,8;サイト番号)と総称する。)とを備える。
【0071】
配信サイト31は、上述したコントロールサイト11と同様に、音声再生装置30の統括制御を行う機能を有するとともに、音声再生装置30とユーザとの間のユーザインターフェースUIを有するのに加え、さらに、56チャンネルの音声ファイルAFを図示しない記憶手段に記憶するものである。この配信サイト31に記憶されている音声ファイルAFは、所定のフォーマットで圧縮されていてもよく、非圧縮であってもよい。配信サイト31は、例えばTCP/IPやUDP等の所定のプロトコルにしたがって外部との通信を行うことが可能であり、56チャンネルの音声ファイルAFを伝送するのに十分な容量を有するネットワークNTを介してトリガ監視サイト12及び音声出力サイト40との間で信号の送受信を行うことが可能とされる。配信サイト31は、配信プログラムDsを実行することが可能な環境とされており、所定の操作部や表示部等からなるユーザインターフェースUIを介してユーザによって再生コマンドが指示されると、配信プログラムDsの実行制御のもとに、音声ファイルAFの再生指示を示す制御情報をネットワークNTを介して音声出力サイト40に対して通知するとともに、56チャンネルの音声ファイルAFをストリームデータとして、7チャンネル分ずつ音声出力サイト40に対して配信する。なお、ネットワークNTを介して伝送される音声ストリームは、所定のフォーマットで圧縮されていてもよく、非圧縮であってもよい。
【0072】
音声出力サイト40は、それぞれ、上述した音声出力サイト20と同様に、例えば8チャンネルの音声信号を出力処理可能なサウンドカード等のサウンド処理部41,41,・・・,41(以下、サウンド処理部41(n=1,2,・・・,8)と総称する。)を有するパーソナルコンピュータ等を含むハードウェアの機能を有するものである。音声出力サイト40は、それぞれ、配信サイト31及びトリガ監視サイト12と同様に、TCP/IPやUDP等の所定のプロトコルにしたがってネットワークNTを介して配信サイト31及びトリガ監視サイト12との間で信号の送受信を行うことが可能とされる。また、音声出力サイト40は、それぞれ、サウンド処理部41における例えば第8チャンネルのみをトリガ監視サイト12と接続しており、このチャンネルを用いてトリガ監視サイト12に対してトリガ信号TGを出力することが可能とされる。
音声出力サイト40は、それぞれ、再生処理プログラムB,B,・・・,B(以下、再生処理プログラムB(n=1,2,・・・,8)と総称する。
)を実行することが可能な環境とされており、ワードクロック生成器14から供給されるワードクロックWCLK又はワード単位で各サンプルを同期せしめるのに十分なトリガ外部信号に同期して、サウンド処理部41における処理を行う。このとき、音声出力サイト40においては、それぞれ、サウンド処理部41における第1チャンネル乃至第8チャンネルの間の同期は確保されているものとする。すなわち、音声出力サイト40においては、それぞれ、配信サイト31から再生指示を受け取った場合には、サウンド処理部41における第1チャンネル乃至第8チャンネルから同時に音声信号を出力する。また、音声出力サイト40は、それぞれ、配信サイト31から配信される音声ストリームを一時的に記憶する図示しないバッファを有しており、配信サイト31から配信される音声ストリームをこのバッファに逐次的に記憶する。音声出力サイト40においては、音声ストリームが所定のフォーマットで圧縮されている場合には、これらの音声ストリームがバッファに記憶されると、このバッファを介して所定のデコード処理が行われる。そして、音声出力サイト40においては、バッファからは、音声ストリームが所定容量以上記憶されると読み出され、外部へと出力される。なお、以下では、各音声出力サイト40に配信される音声ストリームを、それぞれ、AS,AS,・・・,AS(以下、音声ストリームAS(n=1,2,・・・,8)と総称する。)と称するものとする。
【0073】
音声出力サイト40は、それぞれ、配信サイト31からネットワークNTを介して供給される再生指示を示す制御情報を受け取ると、再生処理プログラムBの実行制御のもとに、サウンド処理部41を介してトリガ信号TGをトリガ監視サイト12に対して出力する。この間、音声出力サイト40には、それぞれ、音声ストリームASが配信されており、音声出力サイト40は、それぞれ、配信された音声ストリームASを図示しないバッファにストリーム順に記憶する。また、音声出力サイト40は、それぞれ、トリガ監視サイト12からネットワークNTを介して遅れサンプル数情報を受け取ると、この遅れサンプル数Sdと再生マージンサンプル数Smとに基づいて、バッファの先頭地点からデコードした音声ストリームASの再生を開始し、出力器15nm及びスピーカ16nmを介して外部へと放音させる。
【0074】
このような各部を備える音声再生装置30においては、配信サイト31に一括して記憶されている56チャンネルの音声ファイルAFの再生指示を示す制御情報が与えられると、音声ファイルAFが7チャンネルの音声ストリームASとして、音声出力サイト40のそれぞれに配信されるとともに、音声出力サイト40のそれぞれから、トリガ監視サイト12に対してトリガ信号TGが出力される。音声再生装置30においては、トリガ監視サイト12により、トリガ信号TGに基づいて、音声出力サイト40のそれぞれに対応する遅れサンプル数Sdを求める。そして、音声再生装置30においては、各音声出力サイト40により、この遅れサンプル数Sdと再生マージンサンプル数Smとに基づいて、自己が再生を開始すべきタイミングを求め、このタイミングに到達した時間に音声ストリームASの再生を開始することができる。音声再生装置30においては、このようにして、全ての音声出力サイト40による音声ストリームASの再生開始のタイミングを一致させることができる。そして、音声再生装置30においては、それ以後、ワードクロック生成器14から供給されるワードクロックWCLKに基づいて音声出力サイト40によって再生を進行することにより、マルチチャンネルの同期再生を行うことができる。
【0075】
具体的には、音声再生装置30においては、音声出力サイト40は、それぞれ、再生処理プログラムBを実行し、図6に示す一連の工程を経ることによって音声ストリームASの再生を開始する。
【0076】
まず、音声出力サイト40には、それぞれ、同図に示すように、ステップS21において、再生マージンサンプル数Smが設定される。この再生マージンサンプル数Smは、上述した音声再生装置10の場合と同様に、再生指示を示す制御情報を受信した音声出力サイト40がトリガ信号TGを出力する工程、トリガ監視サイト12が全ての音声出力サイト40からトリガ信号TGを受信する工程、トリガ監視サイト12が音声出力サイト40のそれぞれに対して遅れサンプル数Sdを通知する工程、全ての音声出力サイト40が遅れサンプル数Sdを受信し、音声ストリームASの再生動作を開始する工程を行うのに十分な時間に加え、バッファに音声ストリームASが所定容量以上記憶されるのに十分な時間を見込んで算出される値である。
【0077】
続いて、音声出力サイト40は、それぞれ、ステップS22において、配信サイト31からネットワークNTを介して音声ファイルAFの再生指示を示す制御情報が到達したか否かを判別する。音声出力サイト40は、それぞれ、配信サイト31からの制御情報が到達するまで待機し、制御情報を受け取った時点で、ステップS23へと処理を移行する。
【0078】
音声出力サイト40は、それぞれ、ステップS23において、サウンド処理部41におけるトリガチャンネルに、トリガ信号TGを再生する。
【0079】
これと同時に、音声出力サイト40は、それぞれ、ステップS24において、トリガ信号TGを再生してトリガ監視サイト12に対して出力した時点のサンプルSを基準として、再生サンプル数のカウントを開始する。音声出力サイト40においては、それぞれ、このサンプルSを基準として、音声ストリームASの再生開始のタイミングが決定されることになる。
【0080】
さらにこれと同時に、音声出力サイト40は、それぞれ、ステップS25において、トリガチャンネル以外のチャンネルに“0”を出力する。
【0081】
そして、音声出力サイト40は、それぞれ、ステップS26において、再生サンプル数のカウントを継続し、ステップS27において、トリガ監視サイト12から対応する遅れサンプル数Sdを示す遅れサンプル数情報がネットワークNTを介して到達したか否かを判別する。
【0082】
ここで、遅れサンプル数情報が到達していない場合には、音声出力サイト40は、それぞれ、ステップS25乃至ステップS26の処理を繰り返す。一方、遅れサンプル数情報が到達した場合には、音声出力サイト40は、それぞれ、ステップS28において、“(再生マージンサンプル数Sm)−(遅れサンプル数Sd)”の値を算出し、トリガ監視サイト12に対してトリガ信号TGを出力した時点のサンプルからカウントして、この算出した値が経過したサンプルに到達した時点から、バッファに記憶されている音声ストリームASの再生を開始し、一連の処理を終了する。
【0083】
一方、音声再生装置30においては、トリガ監視サイト12は、監視プログラムSvを実行し、先に図3に示した一連の工程を経ることによって音声出力サイト40のそれぞれに対応する遅れサンプル数Sdを求めることができる。
【0084】
このようにして、音声再生装置30においては、トリガ監視サイト12によって監視プログラムSvを実行するとともに、音声出力サイト40のそれぞれによって再生処理プログラムBを実行し、音声ファイルAFを構成する音声ストリームASの再生を同時に開始することができる。なお、音声再生装置30においては、それ以後、音声出力サイト40が、それぞれ、ワードクロック生成器14から供給されるワードクロックWCLKに基づいて音声ストリームASの再生を進行することにより、マルチチャンネルの同期再生が可能となる。
【0085】
以上のように、本発明の第2の実施の形態として示す音声再生装置30は、配信サイト31上に存在している音声ファイルAFを、各音声出力サイト40が出力処理可能なチャンネル数分に分割して各音声出力サイト40に配信し、配信された音声ストリームASを用いて、マルチチャンネルの同期再生を行うことができる。特に、音声再生装置30は、互いに同期が確保されておらず、動作環境が多種多様にわたる音声出力サイト40を用いた場合であっても、確実に同期再生を実現することができる。
【0086】
つぎに、本発明の第3の実施の形態について説明する。この第3の実施の形態として図7に示す音声再生装置50は、1つのソース信号に対して各音声出力サイトによって所定の信号処理を施し、56チャンネルの音声信号の同期再生を行うものである。より換言すれば、音声再生装置50は、1チャンネルの音声ファイルを各音声出力サイトに対してマルチキャスト配信し、配信された音声ファイルに対して各音声出力サイトによってチャンネル単位で個別の信号処理を施して同期再生することにより、例えばマルチスピーカを用いた制御、すなわち、従来ではハードウェアの能力やスピーカのチャンネル数の制限等によって小規模のシステムしか構成できず効果が低かった指向性、音場及び音像制御を、効果的に実現可能とするものである。なお、ここでも、上述した第1の実施の形態として示した音声再生装置10又は第2の実施の形態として示した音声再生装置30と同様の機能を有する各部については同一符号を付し、詳細な説明を省略するものとする。
【0087】
音声再生装置50は、同図に示すように、上述したトリガ監視サイト12と、ワードクロック生成器14と、56個の出力器15nmと、56個のスピーカ16nmとの他、記憶している1チャンネルのソースファイルである音声ファイルAFを出力するソース出力サイト51と、音声信号を再生して出力する8つの音声出力サイト60,60,・・・,60(以下、音声出力サイト60(n=1,2,・・・,8;サイト番号)と総称する。)とを備える。
【0088】
ソース出力サイト51は、上述したコントロールサイト11又は配信サイト31と同様に、音声再生装置50の統括制御を行う機能を有するとともに、音声再生装置50とユーザとの間のユーザインターフェースUIを有するのに加え、さらに、音声ファイルAFを図示しない記憶手段に記憶するものである。なお、このソース出力サイト51に記憶されている音声ファイルAFは、1チャンネルであるものとして説明するが、複数チャンネルからなるものであってもよい。また、音声ファイルAFは、所定のフォーマットで圧縮されていてもよく、非圧縮であってもよい。ソース出力サイト51は、例えばTCP/IPやUDP等の所定のプロトコルにしたがって外部との通信を行うことが可能であり、ネットワークNTを介してトリガ監視サイト12及び音声出力サイト60との間で信号の送受信を行うことが可能とされる。ソース出力サイト51は、ソース出力プログラムSoを実行することが可能な環境とされており、所定の操作部や表示部等からなるユーザインターフェースUIを介してユーザによって再生コマンドが指示されると、ソース出力プログラムSoの実行制御のもとに、音声ファイルAFの再生指示を示す制御情報をネットワークNTを介して音声出力サイト60に対して通知するとともに、1チャンネルの音声ファイルAFをそのまま又はストリームデータとして、全ての音声出力サイト60に対してマルチキャスト配信する。なお、ネットワークNTを介して伝送される音声信号は、所定のフォーマットで圧縮されていてもよく、非圧縮であってもよい。ここでは、音声出力サイト60に対して音声ファイルAFがそのままマルチキャスト配信されるものとする。
【0089】
音声出力サイト60は、それぞれ、上述した音声出力サイト20又は音声出力サイト40と同様に、例えば8チャンネルの音声信号を出力処理可能なサウンドカード等のサウンド処理部61,61,・・・,61(以下、サウンド処理部61(n=1,2,・・・,8)と総称する。)を有するパーソナルコンピュータ等を含むハードウェアの機能を有するものである。音声出力サイト60は、それぞれ、ソース出力サイト51及びトリガ監視サイト12と同様に、TCP/IPやUDP等の所定のプロトコルにしたがってネットワークNTを介してソース出力サイト51及びトリガ監視サイト12との間で信号の送受信を行うことが可能とされる。また、音声出力サイト60は、それぞれ、サウンド処理部61における例えば第8チャンネルのみをトリガ監視サイト12と接続しており、このチャンネルを用いてトリガ監視サイト12に対してトリガ信号TGを出力することが可能とされる。音声出力サイト60は、それぞれ、再生処理プログラムC,C,・・・,C(以下、再生処理プログラムC(n=1,2,・・・,8)と総称する。)を実行することが可能な環境とされており、ワードクロック生成器14から供給されるワードクロックWCLK又はワード単位で各サンプルを同期せしめるのに十分なトリガ外部信号に同期して、サウンド処理部61における処理を行う。このとき、音声出力サイト60においては、それぞれ、サウンド処理部61における第1チャンネル乃至第8チャンネルの間の同期は確保されているものとする。すなわち、音声出力サイト60においては、それぞれ、ソース出力サイト51から再生指示を受け取った場合には、サウンド処理部61における第1チャンネル乃至第8チャンネルから同時に音声信号を出力する。また、音声出力サイト60においては、音声ファイルAFが所定のフォーマットで圧縮されている場合には、この音声ファイルAFが図示しないバッファに一時的に記憶され、このバッファを介して所定のデコード処理が行われる。そして、音声出力サイト60においては、バッファからは、音声ファイルAFが所定容量以上記憶されると読み出される。
【0090】
また、音声出力サイト60は、それぞれ、バッファから読み出された音声ファイルAFに対して所定の信号処理を施す。音声出力サイト60は、それぞれ、図8に示すように、7チャンネル分の信号処理部62nm(n=1,2,・・・,8、m=1,2,・・・,7;チャンネル番号)を有する。これらの信号処理部62nmは、ハードウェアとして構成することもでき、同図に示すように、再生処理プログラムC等のソフトウェアによって構成することもできる。音声出力サイト60は、それぞれ、各チャンネル毎に音声信号を信号処理部62nmに入力する。信号処理としては、例えば、いわゆるFIR(Finite Impulse Responce)フィルタやIIR(Infinite Impulse Responce)フィルタ等のディジタルフィルタを施すことが考えられ、全体としていわゆるクロスフェード処理を施すものが考えられる。ただし、これらの信号処理部62nmにおける遅延量は既知であり、簡単のため、各チャンネル間で一定であるものとする。
【0091】
さらに、例えばディジタルフィルタにおけるフィルタ係数といった信号処理部62nmにおける信号処理のパラメータは、外部から供給される信号処理方法を変更するための制御情報CNTに応じて、変更することが可能である。例えば、音声再生装置50においては、ユーザによるユーザインターフェースUIの操作に応じてパラメータを変更することができ、ソース出力サイト51から音声出力サイト60に対してパラメータを変更する旨及びパラメータ値を示す制御情報CNTが通知される。より具体的には、例えば画像に連動して音像を移動させるようなアプリケーションを想定した場合、ユーザがユーザインターフェースUIたるジョイスティック等を操作することによって自己の位置を移動させるのにともない、制御情報CNTを音声出力サイト60に対して通知し、信号処理のパラメータを変更させることにより、再現される音像の位置を移動させることができる。その他、音声出力サイト60は、それぞれ、指向性の方向変更又は音場の残響パラメータの変更といったように、アプリケーションに応じて信号処理のパラメータを変更することができる。音声出力サイト60においては、信号処理が施された音声信号が図示しないバッファに一時的に記憶され、所定容量以上記憶されると読み出される。
【0092】
音声出力サイト60は、それぞれ、ソース出力サイト51からネットワークNTを介して供給される再生指示を示す制御情報を受け取ると、再生処理プログラムCの実行制御のもとに、サウンド処理部61を介してトリガ信号TGをトリガ監視サイト12に対して出力する。この間、音声出力サイト60には、それぞれ、音声ファイルAFが配信されており、音声出力サイト60は、それぞれ、配信された音声ファイルAFに対して信号処理部62nmによって信号処理を施す。また、音声出力サイト60は、それぞれ、トリガ監視サイト12からネットワークNTを介して遅れサンプル数情報を受け取ると、この遅れサンプル数Sdと再生マージンサンプル数Smとに基づいて、信号処理後の音声信号の再生を開始し、出力器15nm及びスピーカ16nmを介して外部へと放音させる。
【0093】
このような各部を備える音声再生装置50においては、音声出力サイト60は、それぞれ、再生処理プログラムCを実行し、先に図2に示した一連の工程を経ることによって音声ファイルAFの再生を開始することができる。一方、音声再生装置50においては、トリガ監視サイト12は、監視プログラムSvを実行し、先に図3に示した一連の工程を経ることによって音声出力サイト60のそれぞれに対応する遅れサンプル数Sdを求めることができる。
【0094】
音声再生装置50においては、ソース出力サイト51に記憶されている1チャンネルの音声ファイルAFの再生指示を示す制御情報が与えられると、音声ファイルAFが音声出力サイト60のそれぞれにマルチキャスト配信されるとともに、音声出力サイト60のそれぞれから、トリガ監視サイト12に対してトリガ信号TGが出力される。音声再生装置50においては、トリガ監視サイト12により、トリガ信号TGに基づいて、音声出力サイト60のそれぞれに対応する遅れサンプル数Sdを求める。そして、音声再生装置50においては、各音声出力サイト60により、この遅れサンプル数Sdと再生マージンサンプル数Smとに基づいて、自己が再生を開始すべきタイミングを求め、このタイミングに到達した時間に音声信号の再生を開始することができる。音声再生装置50においては、このようにして、全ての音声出力サイト60による音声ファイルAFの再生開始のタイミングを一致させることができる。そして、音声再生装置50においては、それ以後、ワードクロック生成器14から供給されるワードクロックWCLKに基づいて音声出力サイト60によって再生を進行することにより、マルチチャンネルの同期再生を行うことができる。
【0095】
また、音声再生装置50においては、途中で信号処理のパラメータを変更する場合には、ソース出力サイト51から信号処理の内容を示す上述した制御情報CNTが音声出力サイト60に与えられ、信号処理のパラメータが変更される。
このとき、音声再生装置50においては、再生指示と同様に、制御情報CNTに関する遅れサンプル数を算出することにより、信号処理のパラメータを変更する時間の同期をとることができる。
【0096】
このようにして、音声再生装置50においては、トリガ監視サイト12によって監視プログラムSvを実行するとともに、音声出力サイト60のそれぞれによって再生処理プログラムCを実行し、音声ファイルAFの再生を同時に開始することができる。
【0097】
以上のように、本発明の第3の実施の形態として示す音声再生装置50は、ソース出力サイト51上に存在している音声ファイルAFを、各音声出力サイト60にマルチキャスト配信し、配信された音声ファイルAFに対して信号処理を施した音声信号を用いて、マルチチャンネルの同期再生を行うことができる。特に、音声再生装置50は、互いに同期が確保されておらず、動作環境が多種多様にわたる音声出力サイト60を用いた場合であっても、確実に同期再生を実現することができ、例えばマルチスピーカを用いた指向性、音場及び音像制御を優れた効果のもとに実現することができる。
【0098】
つぎに、本発明の第4の実施の形態について説明する。この第4の実施の形態として図9に示す音声再生装置70は、上述した第3の実施の形態として示した音声再生装置50と同様に、1つのソースファイルに対して各音声出力サイトによって所定の信号処理を施し、56チャンネルの音声信号の同期再生を行うものであるが、ネットワークトラフィックの影響を回避するために、例えばTCP/IPやUDP等の所定のプロトコルにしたがって情報伝送を行うネットワークNTを設けず、サウンド処理部のみを用いて情報の送受信を行うものである。したがって、上述した第3の実施の形態として示した音声再生装置50と同様の機能を有する各部については同一符号を付し、詳細な説明を省略するものとする。
【0099】
音声再生装置70は、同図に示すように、上述したワードクロック生成器14と、56個の出力器15nmと、56個のスピーカ16nmとの他、記憶している1チャンネルのソースファイルである音声ファイルAFを出力するソース出力サイト71と、トリガ信号TGを監視するトリガ監視サイト73と、音声信号を再生して出力する8つの音声出力サイト80,80,・・・,80(以下、音声出力サイト80(n=1,2,・・・,8;サイト番号)と総称する。)とを備える。
【0100】
ソース出力サイト71は、上述したソース出力サイト51と同様に、音声再生装置70の統括制御を行う機能を有するとともに、音声再生装置70とユーザとの間のユーザインターフェースUIを有し、さらに、音声ファイルAFを図示しない記憶手段に記憶するものである。なお、このソース出力サイト71に記憶されている音声ファイルAFは、1チャンネルであるものとして説明するが、複数チャンネルからなるものであってもよい。また、音声ファイルAFは、所定のフォーマットで圧縮されていてもよく、非圧縮であってもよい。ソース出力サイト71は、少なくとも2チャンネル以上の音声信号を出力処理可能なサウンドカード等のサウンド処理部72を有し、このサウンド処理部72を介して、ユーザインターフェースUIを介したユーザによる再生指示や信号処理のパラメータ変更等を示す制御情報を音声出力サイト80に対して通知するとともに、音声ファイルAFをそのまま又はストリームデータとして、全ての音声出力サイト80に対してマルチキャスト配信することが可能とされる。このとき、ソース出力サイト71は、サウンド処理部72における第1チャンネルが音声ファイルAFの配信用に用いられ、第2チャンネルが制御情報の通知用に用いられる。
【0101】
また、ソース出力サイト71は、サウンド処理部72を介して制御情報を送受信する。この制御情報は、数値やパラメータ等の送受信を行うことが可能であればよく、その生成及び認識機構を送受信するサイト間で取り決めて使用すればいかなるものであってもよい。特に、ソース出力サイト71及び音声出力サイト80がディジタルデータを取り扱うものである場合には、各サイトは、制御情報を単なる信号列として扱うことができ、生成及び認識用のプログラムを単純化することができる。ソース出力サイト71は、ソース出力プログラムSoを実行することが可能な環境とされており、ワードクロック生成器14から供給されるワードクロックWCLK又はワード単位で各サンプルを同期せしめるのに十分なトリガ外部信号に同期して、サウンド処理部72における処理を行う。
【0102】
トリガ監視サイト73は、少なくとも音声出力サイト80の数以上、すなわち、8チャンネル以上の音声信号を入力処理及び出力処理可能なサウンドカード等のサウンド処理部74を有し、このサウンド処理部74を介して音声出力サイト80から出力されるトリガ信号TGを受信することが可能とされる。また、トリガ監視サイト73は、サウンド処理部74を介して、遅れサンプル数Sdを音声出力サイト80に対して通知することが可能とされる。このとき、トリガ監視サイト73は、サウンド処理部74における入力側の第1チャンネルが音声出力サイト80と接続され、第2チャンネルが音声出力サイト80と接続されるとともに、出力側の第1チャンネルが音声出力サイト80と接続され、第2チャンネルが音声出力サイト80と接続されるといったように、各チャンネルが音声出力サイト80のそれぞれと対応させて接続される。トリガ監視サイト73は、監視プログラムSvを実行することが可能な環境とされており、ワードクロック生成器14から供給されるワードクロックWCLK又はワード単位で各サンプルを同期せしめるのに十分なトリガ外部信号に同期して、サウンド処理部74における処理を行う。
【0103】
トリガ監視サイト73は、監視プログラムSvの実行制御のもとに、音声出力サイト80のそれぞれから出力されるトリガ信号TGの入来を監視する。トリガ監視サイト73は、トリガ信号TGを受け取ると、これらのトリガ信号TGに基づいて、音声出力サイト80のそれぞれに対応する遅れサンプル数Sdを求め、これらの遅れサンプル数Sdを示す遅れサンプル数情報をサウンド処理部74を介して音声出力サイト80に対してそれぞれ出力する。
【0104】
音声出力サイト80は、それぞれ、例えば8チャンネルの音声信号を出力処理可能であり且つ少なくとも3チャンネルの音声信号を入力処理可能なサウンドカード等のサウンド処理部81,81,・・・,81(以下、サウンド処理部81(n=1,2,・・・,8)と総称する。)を有する。音声出力サイト80は、これらのサウンド処理部81を介してソース出力サイト71から出力される音声ファイルAF及び制御情報を受信することが可能とされ、さらに、トリガ監視サイト73から出力される遅れサンプル数情報を受信することが可能とされる。例えば、音声出力サイト80においては、それぞれ、サウンド処理部81における入力側の第1チャンネルがソース出力サイト71からの音声ファイルAFの受信部とされ、第2チャンネルがソース出力サイト71からの制御情報の受信部とされ、第3チャンネルがトリガ監視サイト73からの遅れサンプル数情報の受信部とされる。また、音声出力サイト80は、それぞれ、サウンド処理部81における出力側の例えば第8チャンネルのみをトリガ監視サイト73と接続しており、このチャンネルを用いてトリガ監視サイト73に対してトリガ信号TGを出力することが可能とされる。音声出力サイト80は、それぞれ、再生処理プログラムD,D,・・・,D(以下、再生処理プログラムD(n=1,2,・・・,8)と総称する。)を実行することが可能な環境とされており、ワードクロック生成器14から供給されるワードクロックWCLK又はワード単位で各サンプルを同期せしめるのに十分なトリガ外部信号に同期して、サウンド処理部81における処理を行う。音声出力サイト80においては、音声ファイルAFが所定のフォーマットで圧縮されている場合には、この音声ファイルAFが図示しないバッファに一時的に記憶され、このバッファを介して所定のデコード処理が行われる。そして、音声出力サイト80においては、バッファからは、音声ファイルAFが所定容量以上記憶されると読み出される。
【0105】
また、音声出力サイト80は、それぞれ、音声出力サイト60と同様に、バッファから読み出された音声ファイルAFに対して所定の信号処理を施す。音声出力サイト80においては、信号処理が施された音声信号が図示しないバッファに一時的に記憶され、所定容量以上記憶されると読み出される。
【0106】
音声出力サイト80は、それぞれ、ソース出力サイト71から供給される再生指示を示す制御情報をサウンド処理部81を介して受け取ると、再生処理プログラムDの実行制御のもとに、サウンド処理部81を介してトリガ信号TGをトリガ監視サイト73に対して出力する。この間、音声出力サイト80には、それぞれ、音声ファイルAFが配信されており、音声出力サイト80は、それぞれ、配信された音声ファイルAFに対してここでは図示しない信号処理部によって信号処理を施す。また、音声出力サイト80は、それぞれ、トリガ監視サイト73から遅れサンプル数情報をサウンド処理部81を介して受け取ると、この遅れサンプル数Sdと再生マージンサンプル数Smとに基づいて、信号処理後の音声信号の再生を開始し、出力器15nm及びスピーカ16nmを介して外部へと放音させる。
【0107】
このような各部を備える音声再生装置70においては、音声出力サイト80は、それぞれ、再生処理プログラムDを実行し、先に図2に示した一連の工程を経ることによって音声ファイルAFの再生を開始することができる。一方、音声再生装置70においては、トリガ監視サイト73は、監視プログラムSvを実行し、先に図3に示した一連の工程を経ることによって音声出力サイト80のそれぞれに対応する遅れサンプル数Sdを求めることができる。
【0108】
音声再生装置70においては、音声再生装置50と同様に、ソース出力サイト71に記憶されている1チャンネルの音声ファイルAFの再生指示を示す制御情報が与えられると、音声ファイルAFが音声出力サイト80のそれぞれにマルチキャスト配信されるとともに、音声出力サイト80のそれぞれから、トリガ監視サイト73に対してトリガ信号TGが出力される。音声再生装置70においては、トリガ監視サイト73により、トリガ信号TGに基づいて、音声出力サイト80のそれぞれに対応する遅れサンプル数Sdを求める。そして、音声再生装置70においては、各音声出力サイト80により、この遅れサンプル数Sdと再生マージンサンプル数Smとに基づいて、自己が再生を開始すべきタイミングを求め、このタイミングに到達した時間に音声信号の再生を開始することができる。音声再生装置70においては、このようにして、全ての音声出力サイト80による音声ファイルAFの再生開始のタイミングを一致させることができる。そして、音声再生装置70においては、それ以後、ワードクロック生成器14から供給されるワードクロックWCLKに基づいて音声出力サイト80によって再生を進行することにより、マルチチャンネルの同期再生を行うことができる。
【0109】
また、音声再生装置70においては、音声再生装置50と同様に、途中で信号処理のパラメータを変更する場合には、ソース出力サイト71から信号処理の内容を示す制御情報が音声出力サイト80に与えられ、信号処理のパラメータが変更される。このとき、音声再生装置70においては、再生指示と同様に、制御情報に関する遅れサンプル数を算出することにより、信号処理のパラメータを変更する時間の同期をとることができる。
【0110】
このようにして、音声再生装置70においては、トリガ監視サイト73によって監視プログラムSvを実行するとともに、音声出力サイト80のそれぞれによって再生処理プログラムDを実行し、音声ファイルAFの再生を同時に開始することができる。
【0111】
以上のように、本発明の第4の実施の形態として示す音声再生装置70は、ソース出力サイト71上に存在している音声ファイルAFを、各音声出力サイト80にマルチキャスト配信し、配信された音声ファイルAFに対して信号処理を施した音声信号を用いて、マルチチャンネルの同期再生を行うことができる。特に、音声再生装置70は、例えばTCP/IPやUDP等の所定のプロトコルにしたがって情報伝送を行うネットワークを介して情報伝送を行うことがないため、ネットワークトラフィックの影響を回避することができ、確実に同期再生を実現することができる。
【0112】
最後に、本発明の第5の実施の形態について説明する。この第5の実施の形態として図10に示す音声再生装置90は、音声出力サイトにおけるサウンド処理部のうち、上述したトリガ信号を出力するトリガチャンネルを専用に設けるのではなく、音声信号を出力するチャンネルと共用するものである。すなわち、上述した実施の形態では、トリガチャンネルを使用するのは、音声信号の再生開始前に1度だけトリガ信号を再生する場合のみであり、このために専用のチャンネルを確保するのは用途によっては効率が悪い場合がある。そこで、音声再生装置90は、n個の音声出力サイトにおけるMチャンネルの同時再生が可能なサウンド処理部のうち、全てのチャンネルを音声信号の出力に用いることにより、上述した(M−1)×nチャンネルの音声信号の同期再生ではなく、M×nチャンネルの音声信号の同期再生を実現可能とするものである。ここでは、音声再生装置90は、8チャンネルの音声信号を出力処理可能な4つの音声出力サイトを用いて、32チャンネルの音声信号の同期再生を行うものとして説明する。なお、ここでも、上述した第1の実施の形態として示した音声再生装置10等と同様の機能を有する各部については同一符号を付し、詳細な説明を省略するものとする。
【0113】
音声再生装置90は、同図に示すように、上述したワードクロック生成器14と、32個の出力器1511,1512,1513,1514,1515,1516,1517,1518,1521,1522,・・・,1545,1546,1547,1548(以下、出力器15nm(n=1,2,3,4;サイト番号、m=1,2,・・・,8;チャンネル番号)と総称する。)と、32個のスピーカ1611,1612,1613,1614,1615,1616,1617,1618,1621,1622,・・・,1645,1646,1647,1648(以下、スピーカ16nm(n=1,2,3,4、m=1,2,・・・,8)と総称する。)との他、トリガ信号TGを監視するトリガ監視サイト91と、音声信号を再生して出力する4つの音声出力サイト100,100,・・・,100(以下、音声出力サイト100(n=1,2,3,4)と総称する。)とを備える。この音声再生装置90は、例えば映画館のようなエンターテイメントシアタETHに適用した場合を想定しており、出力器15nm及びスピーカ16nmが当該エンターテイメントシアタETHの4壁面に埋め込まれ、32チャンネルの独立音声によって臨場感のある音場を構築可能としている。
なお、音声再生装置90においては、4つの音声出力サイト100のそれぞれに対応する8つずつの出力器15nm及びスピーカ16nmを、1つのブロックBK(n=1,2,3,4)とし、1つの壁面を構成するものとする。
【0114】
トリガ監視サイト91は、上述したトリガ監視サイト12と同様の機能を有するとともに、上述したコントロールサイト11と同様の機能を兼ね備え、さらに、所定の映像からなる映画ファイルMFを図示しない記憶手段に記憶して、この映画ファイルMFを配信するシネマ配信サイトとしても機能するものである。トリガ監視サイト91は、例えばTCP/IPやUDP等の所定のプロトコルにしたがって外部との通信を行うことが可能であり、ネットワークNTを介して音声出力サイト100との間で信号の送受信を行うことが可能とされる。トリガ監視サイト91は、監視プログラムSvを実行することが可能な環境とされており、所定の操作部や表示部等からなるユーザインターフェースUIを介してユーザによって再生コマンドが指示されると、監視プログラムSvの実行制御のもとに、音声ファイルAFの再生指示を示す制御情報をネットワークNTを介して音声出力サイト100に対して通知するとともに、映画ファイルMFに対して画像処理部93によって所定の画像処理を施し、音声ファイルAFと同期させながら、映像データIMとしてプロジェクタPJへと供給してエンターテイメントシアタETHにおけるスクリーンに投影させる。なお、このトリガ監視サイト91に記憶されている映画ファイルMFは、所定のフォーマットで圧縮されていてもよく、非圧縮であってもよく、画像処理部93によってデコード処理が行われる。
【0115】
また、トリガ監視サイト91は、少なくとも音声出力サイト20の数以上、すなわち、4チャンネル以上の音声信号を入力処理可能なサウンドカード等のサウンド処理部92を有し、このサウンド処理部92を介して音声出力サイト100から出力されるトリガ信号TGを受信することが可能とされる。トリガ監視サイト91は、ワードクロック生成器14から供給されるワードクロックWCLK又はワード単位で各サンプルを同期せしめるのに十分なトリガ外部信号に同期して、サウンド処理部92における処理を行う。
【0116】
トリガ監視サイト91は、監視プログラムSvの実行制御のもとに、音声出力サイト100のそれぞれから出力される音声信号の波形解析を行い、後述するように、この音声信号に埋め込まれたトリガ信号TGを監視する。トリガ監視サイト91は、トリガ信号TGを検出すると、これらのトリガ信号TGに基づいて、音声出力サイト100のそれぞれに対応する遅れサンプル数Sdを求め、これらの遅れサンプル数Sdを示す遅れサンプル数情報をネットワークNTを介して音声出力サイト100に対してそれぞれ出力する。
【0117】
音声出力サイト100は、それぞれ、上述した音声出力サイト20と同様に、例えば8チャンネルの音声信号を出力処理可能なサウンドカード等のサウンド処理部101,101,・・・,101(以下、サウンド処理部101(n=1,2,・・・,8)と総称する。)を有する。音声出力サイト100は、それぞれ、TCP/IPやUDP等の所定のプロトコルにしたがってネットワークNTを介してトリガ監視サイト91との間で信号の送受信を行うことが可能とされる。また、音声出力サイト100は、それぞれ、サウンド処理部101における例えば第8チャンネルのみを出力器15nmとともにトリガ監視サイト91とも接続しており、このチャンネルを用いてトリガ監視サイト91に対してトリガ信号TGを出力することが可能とされる。なお、このトリガ信号TGは、後述するように、音声信号として音声ファイルAFに埋め込まれているものである。音声出力サイト100は、それぞれ、再生処理プログラムE,E,・・・,E(以下、再生処理プログラムE(n=1,2,・・・,8)と総称する。)を実行することが可能な環境とされており、ワードクロック生成器14から供給されるワードクロックWCLK又はワード単位で各サンプルを同期せしめるのに十分なトリガ外部信号に同期して、サウンド処理部101における処理を行う。このとき、音声出力サイト100においては、それぞれ、サウンド処理部101における第1チャンネル乃至第8チャンネルの間の同期は確保されているものとする。すなわち、音声出力サイト100においては、それぞれ、トリガ監視サイト91から再生指示を受け取った場合には、サウンド処理部101における第1チャンネル乃至第8チャンネルから同時に音声信号を出力する。また、音声出力サイト100は、それぞれ、図示しない記憶手段に、8チャンネルの音声ファイルAFを記憶している。
【0118】
ここで、音声ファイルAFは、例えば図11に示すように、8チャンネルの音声信号からなる。音声ファイルAFには、所定時刻tc以降に、各チャンネル毎に映画コンテンツ用の音声信号C,C,・・・,Cが記録されている。さらに、音声ファイルAFには、第8チャンネルの音声信号における時刻tcよりも以前の時刻に、トリガ用の音声信号Tが記録されている。このトリガ用の音声信号Tは、後述するように、各音声出力サイト100における音声ファイルAFの再生によって出力器15nmに出力されるものであり、各音声出力サイト100による映画コンテンツ用の音声信号C,C,・・・,Cの再生前に、ユーザに聴取されることになる。また、トリガ用の音声信号Tは、トリガ監視サイト91からネットワークNTを介して供給される再生指示を示す制御情報の到達時刻のばらつきに起因して、各音声出力サイト100の間でばらばらに再生されるものである。そのため、トリガ用の音声信号Tは、例えば、映画のタイトル音、チャイム音又は小鳥の囀り声といったように、時間的にずれて再生されても聴取者にとって不快とならない有意的な音声信号とするのが望ましい。特に、トリガ用の音声信号Tは、例えば音声再生装置90が本発明を適用したシステムであることを示すサウンドロゴとして、積極的に活用することも考えられる。
【0119】
トリガ用の音声信号Tには、例えば電子透かしによってトリガ信号TGが埋め込まれており、トリガ検出サイト91及び音声出力サイト100によって特定サンプル値にて検出可能とされる。また、音声ファイルAFにおいては、トリガ信号TGが検出可能な時刻ttから時刻tcまでの時間は、再生マージンサンプル数Sm0として定義される。この再生マージンサンプル数Sm0は、音声ファイルAFを作成する際に、例えば後述する各種処理が終了するのに十分な時間を見込んで算出される値である。なお、トリガ信号TGとしては、必ずしも電子透かしによって音声信号Tに埋め込むものである必要はなく、トリガ監視サイト91及び音声出力サイト100が、それぞれ、音声信号Tの波形を観測してトリガ信号であることを判定でき、且つ、そのトリガ信号の発生サンプルが特定可能であるならば、音声信号Tの波形そのものをトリガ信号TGとして扱うようにしてもよい。
【0120】
音声出力サイト100は、それぞれ、トリガ監視サイト91からネットワークNTを介して供給される再生指示を示す制御情報を受け取ると、再生処理プログラムEの実行制御のもとに、音声ファイルAFの再生を開始し、サウンド処理部101を介して出力器15nm及びスピーカ16nmへと供給して外部へと放音させるとともに、サウンド処理部101における第8チャンネルから出力される音声信号をトリガ監視サイト91に供給する。音声出力サイト100は、それぞれ、音声ファイルAFの波形解析を行い、トリガ信号TGを検出し、そのトリガ信号TGが埋め込まれていたサンプルを特定する。なお、この時点で、出力器15nm及びスピーカ16nmを介して放音される音声は、第8チャンネルから出力される音声信号Tのみであり、それ以外は無音である。
また、音声出力サイト100は、それぞれ、トリガ監視サイト91からネットワークNTを介して遅れサンプル数情報を受け取ると、この遅れサンプル数に基づいて、音声ファイルAFの再生をスキップし、再び再生を開始して出力器15nm及びスピーカ16nmを介して外部へと放音させる。
【0121】
このような各部を備える音声再生装置90においては、音声ファイルAFの再生指示を示す制御情報が与えられると、音声出力サイト100のそれぞれから音声ファイルAFが再生される。音声再生装置90においては、トリガ監視サイト91及び音声出力サイト100によって音声ファイルAFに埋め込まれたトリガ信号TGを検出し、トリガ監視サイト91から音声出力サイト100に対して、トリガ信号TGに基づいて求められた音声出力サイト100のそれぞれに対応する遅れサンプル数Sdが通知される。そして、音声再生装置90においては、各音声出力サイト100により、この遅れサンプル数Sdに基づいて、音声ファイルAFの再生をスキップし、スキップ先の時点から再生を再開する。音声再生装置90においては、このようにして、全ての音声出力サイト100による音声ファイルAFの再生開始のタイミングを一致させることができる。そして、音声再生装置90においては、それ以後、ワードクロック生成器14から供給されるワードクロックWCLKに基づいて音声出力サイト100によって再生を進行することにより、マルチチャンネルの同期再生を行うことができる。
【0122】
具体的には、音声再生装置90においては、音声出力サイト100は、それぞれ、再生処理プログラムEを実行し、図12に示す一連の工程を経ることによって音声ファイルAFを再生する。
【0123】
まず、音声出力サイト100は、それぞれ、同図に示すように、ステップS31において、トリガ監視サイト91からネットワークNTを介して音声ファイルAFの再生指示を示す制御情報が到達したか否かを判別する。音声出力サイト100は、それぞれ、トリガ監視サイト91からの制御情報が到達するまで待機し、制御情報を受け取った時点で、ステップS32へと処理を移行する。
【0124】
音声出力サイト100は、それぞれ、ステップS32において、サウンド処理部101を介して音声ファイルAFを再生する。
【0125】
これと同時に、音声出力サイト100は、それぞれ、ステップS33において、音声ファイルAFに埋め込まれているトリガ信号TGを検出する。
【0126】
さらに、音声出力サイト100は、それぞれ、ステップS34において、トリガ信号TGが埋め込まれていたサンプルとして特定したサンプルを基準として、再生サンプル数のカウントを開始する。音声出力サイト100においては、それぞれ、このカウント開始のサンプルを基準として、音声ファイルAFの再生開始のタイミングが決定されることになる。
【0127】
そして、音声出力サイト100は、それぞれ、ステップS35において、再生サンプル数のカウントを継続し、ステップS36において、トリガ監視サイト91から対応する遅れサンプル数Sdを示す遅れサンプル数情報がネットワークNTを介して到達したか否かを判別する。
【0128】
ここで、遅れサンプル数情報が到達していない場合には、音声出力サイト100は、それぞれ、ステップS35の処理を繰り返す。
【0129】
一方、遅れサンプル数情報が到達した場合には、音声出力サイト100は、それぞれ、ステップS37において、遅れサンプル数Sdだけ音声ファイルAFの再生をスキップし、スキップ先の時点から再生を再開し、一連の処理を終了する。
【0130】
このようにして、音声再生装置90においては、音声出力サイト100のそれぞれによって再生処理プログラムEを実行し、音声ファイルAFにおける映画コンテンツ用の音声信号の再生を同時に開始することができる。なお、音声再生装置90においては、それ以後、音声出力サイト100が、それぞれ、ワードクロック生成器14から供給されるワードクロックWCLKに基づいて音声ファイルAFの再生を進行することにより、マルチチャンネルの同期再生が可能となる。
【0131】
一方、音声再生装置90においては、トリガ監視サイト91は、監視プログラムSvを実行し、図13に示す一連の工程を経ることによって音声出力サイト100のそれぞれに対応する遅れサンプル数Sdを求めることができる。
【0132】
まず、トリガ監視サイト91は、同図に示すように、ステップS41において、再生指示を示す制御情報を音声出力サイト100のそれぞれに対して通知する。
【0133】
続いて、トリガ監視サイト91は、ステップS42において、音声出力サイト100のそれぞれからサウンド処理部92における各チャンネルに出力される音声ファイルAFの入来を監視する。
【0134】
続いて、トリガ監視サイト91は、ステップS43において、サウンド処理部92における4つのチャンネルのうちのいずれかのチャンネルに、音声ファイルAFのいずれかが供給されたか否かを判別する。
【0135】
ここで、音声ファイルAFのいずれかが供給されていない場合には、トリガ監視サイト91は、ステップS42へと処理を移行し、音声ファイルAFのいずれかが供給されるまで監視し続ける。
【0136】
一方、音声ファイルAFのいずれかが供給された場合には、トリガ監視サイト91は、ステップS44において、音声ファイルAFに埋め込まれているトリガ信号TGを検出する。
【0137】
続いて、トリガ監視サイト91は、ステップS45において、検出されたトリガ信号TGが最初に供給された音声ファイルAFに埋め込まれていたものであるか否か、すなわち、初めてトリガ信号TGが検出されたのか否かを判別する。
【0138】
ここで、トリガ信号TGが最初に検出されたものでない場合には、トリガ監視サイト91は、ステップS47へと処理を移行する。一方、トリガ信号TGが最初に検出されたものであった場合には、トリガ監視サイト91は、ステップS46において、この最初に検出したトリガ信号TGが入力された時点のサンプルを基準サンプルとして、入力サンプル数のカウントを開始し、ステップS47へと処理を移行する。トリガ監視サイト91においては、この基準サンプルに基づいて、入力サンプル数をカウントすることによって他のトリガ信号TGの入力時刻を計測することになる。
【0139】
そして、トリガ監視サイト91は、ステップS47において、ステップS46にて基準サンプルを基点としてカウントを開始しているカウント値を遅れサンプル数Sdとし、トリガ信号TGを出力した対応する音声出力サイト100に対して、この遅れサンプル数Sdを示す遅れサンプル数情報をネットワークNTを介して出力する。なお、トリガ監視サイト91は、最初に音声ファイルAFを出力した音声出力サイト100に対しては、遅れサンプル数Sd=0を通知することはいうまでもない。
【0140】
続いて、トリガ監視サイト91は、ステップS48において、入力サンプル数のカウントを継続し、ステップS49において、全ての音声出力サイト100からトリガ信号TGを受信したか否かを判別する。
【0141】
ここで、全ての音声出力サイト100からトリガ信号TGを受信していない場合には、トリガ監視サイト91は、ステップS42乃至ステップS48の処理を繰り返す。
【0142】
一方、全ての音声出力サイト100からトリガ信号TGを受信した場合には、トリガ監視サイト91は、そのまま一連の処理を終了する。
【0143】
なお、音声出力サイト100のいずれかが故障等によってトリガ信号TGをトリガ監視サイト91に与えない場合があり得るが、この場合には、トリガ監視サイト91は、ステップS49からステップS42へと移行するループ処理を適宜抜けるようにしてもよい。
【0144】
このようにして、音声再生装置90においては、トリガ監視サイト91によって監視プログラムSvを実行し、音声出力サイト100のそれぞれに対応する遅れサンプル数Sdを求めることができ、音声出力サイト100による同期再生を実現させることが可能となる。なお、トリガ監視サイト91は、この一連の処理の間、画像処理部93によって映画ファイルMFに対する画像処理を施し、音声出力サイト100による音声ファイルAFにおける映画コンテンツ用の音声信号の再生開始と同期させて、映像データIMをプロジェクタPJを介してエンターテイメントシアタETHにおけるスクリーンに投影させる。
【0145】
このようなプログラムを実行するトリガ監視サイト91及び音声出力サイト100を備える音声再生装置90においては、例えば図14に示すタイミングにしたがって各動作が協調して行われる。
【0146】
すなわち、音声再生装置90においては、ワードクロック生成器14によって生成されるワードクロックWCLKに基づいて、トリガ監視サイト91及び音声出力サイト100が動作する。音声再生装置90においては、同図上段に示すように、ユーザインターフェースUIを介して再生コマンドが指示されると、この再生指示を示す制御情報がトリガ監視サイト91から音声出力サイト100のそれぞれにネットワークNTを介して通知される。この制御情報が到達する絶対的な時刻は、上述したように、ネットワークトラフィックの影響等に起因して、音声出力サイト100の間でばらつきが生じる。ここでは、同図中段に示すように、音声出力サイト100が最も早く制御情報を受信し、音声出力サイト100,音声出力サイト100の順序で制御情報を受信したものとする。
【0147】
すると、音声再生装置90においては、上述したように、音声出力サイト100から音声ファイルAFが再生される。この音声出力サイト100のそれぞれから音声ファイルAFが再生される絶対的な時刻は、上述したように、音声出力サイト100におけるサウンド処理部101の相違や図示しないCPU等の処理能力等に起因して、音声出力サイト100の間でばらつきが生じる。ここでは、同図中段に示すように、音声出力サイト100が最も早い時点で音声ファイルAFの再生を開始し、以後、音声出力サイト100,音声出力サイト100の順序で音声ファイルAF,AFの再生を開始したものとする。
【0148】
そして、音声再生装置90においては、上述したように、音声出力サイト100のそれぞれによって音声ファイルAFに埋め込まれたトリガ信号TGが検出されるとともに、トリガ監視サイト91によってもトリガ信号TGが検出される。ここでは、同図下段に示すように、トリガ監視サイト91によって最も早いサンプルSの時点でトリガ信号TGを検出し、以後、トリガ信号TG,TGの順序で検出したものとする。音声出力サイト100は、それぞれ、これらのトリガ信号TGが特定された時点のサンプルSを基準として、再生サンプル数のカウントを開始する。また、ここでは、最も早くトリガ信号TGが検出されたサンプルSを基準サンプルとしている。また、トリガ監視サイト91は、基準サンプルであるサンプルSから入力サンプル数のカウントを開始し、同図下段に示すように、遅れサンプル数Sdを算出する。音声再生装置90においては、これらの遅れサンプル数Sdが対応する音声出力サイト100に対して通知される。この遅れサンプル数Sdが到達する絶対的な時刻は、上述したように、ネットワークトラフィックの影響等に起因して、音声出力サイト100の間でばらつきが生じる。ここでは、同図中段に示すように、音声出力サイト100が最も早く遅れサンプル数情報を受信し、音声出力サイト100,音声出力サイト100の順序で遅れサンプル数情報を受信したものとする。
【0149】
そして、音声再生装置90においては、音声出力サイト100のそれぞれにより、遅れサンプル数Sdだけ音声ファイルAFの再生がスキップされ、スキップ先の時点から再生が再開される。このとき、上述した再生マージンサンプル数Sm0が、少なくとも以下の工程、すなわち、再生指示を示す制御情報を受信した音声出力サイト100が音声ファイルAFを再生する工程、トリガ監視サイト91が全ての音声出力サイト100からトリガ信号TGを受信する工程、トリガ監視サイト91が音声出力サイト100のそれぞれに対して遅れサンプル数Sdを通知する工程、及び、全ての音声出力サイト100が遅れサンプル数Sdを受信し、再生しているサンプルを補正する工程を行うのに十分な時間を見込んで算出されている場合には、スキップされたサンプルは、映画コンテンツに無関係の音声信号、すなわち、先に図11に示した時刻ttから時刻tcまでに含まれる音声信号である。音声再生装置90においては、トリガ監視サイト91によって最初にトリガ信号TGが検出された時点のサンプルSからカウントして、再生マージンサンプル数Sm0だけ経過したサンプルから、音声ファイルAFにおける映画コンテンツ用の音声信号C,C,・・・,Cの再生が一斉に開始される。
【0150】
音声再生装置90においては、音声出力サイト100間における映画コンテンツ用の音声信号C,C,・・・,Cの再生開始位置を一定にし、それ以後は、ワードクロック生成器14によって生成されるワードクロックWCLKに基づいて同期を保ちながら音声ファイルAFの再生を進行する。
【0151】
以上のように、本発明の第5の実施の形態として示す音声再生装置90は、音声出力サイト100におけるサウンド処理部101のうち、トリガ信号TGを出力するトリガチャンネルを専用に設けずに、音声信号を出力するチャンネルと共用し、効率よく音声信号の同期再生を行うことができる。
【0152】
以上説明したように、本発明の第1の実施の形態乃至第5の実施の形態として示す音声再生装置は、汎用の複数のハードウェアを用いて安価に構成することができ、処理能力やチャンネル数等の制限等によって従来では実現不可能であったマルチチャンネルの音声信号の同期再生を精確に行うことができる。したがって、音声再生装置は、例えば映画館やゲーム等のエンターテイメントシステムに適用することにより、簡易な構成のもとに非常に臨場感の高い音響再生を実現することができる。
【0153】
なお、本発明は、上述した実施の形態に限定されるものではなく、例えば、上述した第1の実施の形態及び第2の実施の形態の末尾に記載したように、各種変更が可能であり、これは、他の実施の形態についても必要に応じて適用可能である。
【0154】
また、本発明は、上述した第1の実施の形態乃至第5の実施の形態のうち、任意のものを可能な範囲で適宜組み合わせてもよい。
【0155】
このように、本発明は、その趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
【0156】
【発明の効果】
以上詳細に説明したように、本発明にかかる音声再生装置は、複数チャンネルの音声信号を同期再生する音声再生装置であって、所定の基準信号を生成する基準信号生成手段と、基準信号に同期して複数チャンネルの音声信号を出力処理可能な音声出力処理器を介して、音声信号を再生して出力する互いに同期が確保されていない複数の音声出力手段と、基準信号に同期して少なくとも音声出力手段の数以上の音声信号を入力処理可能な音声入力処理器を介して、音声出力手段のそれぞれから少なくとも1チャンネル分だけ供給される信号であって音声出力手段のそれぞれにおける音声信号の再生タイミングを与えるための予行信号の入来を監視する予行信号監視手段とを備え、予行信号監視手段は、音声出力手段のそれぞれから供給された複数の予行信号の入力時間についての相対的なずれ時間を求め、ずれ時間を示す時間情報を、音声出力手段のそれぞれに対して通知し、音声出力手段は、それぞれ、時間情報に基づいて、音声信号の再生を開始すべきタイミングを決定する。
【0157】
したがって、本発明にかかる音声再生装置は、音声出力手段のそれぞれに対応する複数の予行信号の入力時間についての相対的なずれ時間を示す時間情報に基づいて、音声信号の再生を開始すべきタイミングを決定することにより、汎用の複数のハードウェアを用いた場合であっても、マルチチャンネルの音声信号の同期再生を精確に行うことができる。
【0158】
また、本発明にかかる音声再生方法は、複数チャンネルの音声信号を同期再生する音声再生方法であって、所定の基準信号に同期して複数チャンネルの音声信号を出力処理可能な音声出力処理器を介して、音声信号を再生して出力する互いに同期が確保されていない複数の音声出力手段のそれぞれから少なくとも1チャンネル分だけ供給される信号であって、音声出力手段のそれぞれにおける音声信号の再生タイミングを与えるための予行信号を、基準信号に同期して少なくとも音声出力手段の数以上の音声信号を入力処理可能な音声入力処理器を介して予行信号監視手段に対して入力し、音声出力手段のそれぞれから供給された複数の予行信号の入力時間についての相対的なずれ時間を求めるずれ時間算出工程と、ずれ時間を示す時間情報に基づいて、音声信号の再生を開始すべきタイミングを決定する再生開始タイミング決定工程とを備える。
【0159】
したがって、本発明にかかる音声再生方法は、音声出力手段のそれぞれに対応する複数の予行信号の入力時間についての相対的なずれ時間を示す時間情報に基づいて、音声信号の再生を開始すべきタイミングが決定されることにより、汎用の複数のハードウェアを用いた場合であっても、マルチチャンネルの音声信号の同期再生を精確に行うことが可能となる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態として示す音声再生装置の構成を説明するブロック図である。
【図2】同音声再生装置が備える音声出力サイトにおいて音声ファイルの再生を開始するまでの一連の工程を説明するフローチャートである。
【図3】同音声再生装置が備えるトリガ監視サイトにおいて音声出力サイトのそれぞれに対応する遅れサンプル数を求める際の一連の工程を説明するフローチャートである。
【図4】同音声再生装置における各部の動作タイミングを説明するための図である。
【図5】本発明の第2の実施の形態として示す音声再生装置の構成を説明するブロック図である。
【図6】同音声再生装置が備える音声出力サイトにおいて音声ストリームの再生を開始するまでの一連の工程を説明するフローチャートである。
【図7】本発明の第3の実施の形態として示す音声再生装置の構成を説明するブロック図である。
【図8】同音声再生装置の構成を説明するブロック図であって、特に、音声出力サイトが有する信号処理部の構成を説明するブロック図である。
【図9】本発明の第4の実施の形態として示す音声再生装置の構成を説明するブロック図である。
【図10】本発明の第5の実施の形態として示す音声再生装置の構成を説明するブロック図である。
【図11】音声ファイルの構造を説明する図である。
【図12】同音声再生装置が備える音声出力サイトにおいて音声ファイルを再生する際の一連の工程を説明するフローチャートである。
【図13】同音声再生装置が備えるトリガ監視サイトにおいて音声出力サイトのそれぞれに対応する遅れサンプル数を求める際の一連の工程を説明するフローチャートである。
【図14】同音声再生装置における各部の動作タイミングを説明するための図である。
【符号の説明】
10,30,50,70,90 音声再生装置、 11 コントロールサイト、 12,73,91 トリガ監視サイト、 13,21,41,61,72,74,81,92,101 サウンド処理部、 14 ワードクロック生成器、 15nm 出力器、 16nm スピーカ、 20,40,60,80,100 音声出力サイト、 31 配信サイト、 51,71ソース出力サイト、 62nm 信号処理部、 93 画像処理部
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an audio reproducing apparatus and audio reproducing method for synchronously reproducing multi-channel audio signals.
[0002]
[Prior art]
In recent years, in order to make it possible to listen to an audio signal reproduced from an audio device with an enhanced sense of reality, it is considered to construct an audio reproduction system that reproduces a multi-channel audio signal. As such an audio reproduction system, for example, an apparatus that reproduces a multi-channel audio signal recorded on a recording medium such as a DVD (Digital Versatile Disc) mainly for the purpose of listening in a space such as a home room or a vehicle. There are five channels to be output from each of the five speakers installed at the front right, front front, left front, right rear and left rear of the listener, and a sub in which only the low frequency component of the audio signal is recorded. A system having a channel, that is, a so-called Dolby AC-3 (trademark) 5.1 channel system has been put into practical use. In this 5.1-channel audio reproduction system, five speakers and low-frequency reproduction speakers installed in front of the listener's right front, front front, left front, right rear and left rear are used. By reproducing, realistic sound reproduction can be performed.
[0003]
[Problems to be solved by the invention]
By the way, the present applicant reproduces sound from a small number of speakers, such as the 5.1 channel method as described above, in order to realize control of very precise directivity, sound field, sound image, etc. by multi-speakers. We are proceeding with the construction of a larger-scale audio reproduction system rather than a possible audio reproduction system.
[0004]
When considering the construction of such a large-scale audio reproduction system, it is of course possible to design completely new hardware, but it is desirable to construct it using existing general-purpose hardware. This is because there are many existing inexpensive semiconductors that have the functions required for general-purpose hardware such as so-called sound cards that can be installed in personal computers. Compared to developing a processing mechanism, the efficiency of design man-hours can be improved, parts can be procured at low cost, and design can be easily performed.
[0005]
Here, hardware including such a personal computer often has a limited number of channels due to physical restrictions or system restrictions. Therefore, as a sound reproduction system, a plurality of hardware including a personal computer capable of outputting one or a plurality of channels of sound signals are connected via a network or the like, and the plurality of hardware are controlled under a predetermined local control. It is conceivable to distribute and reproduce audio signals from the wear. At this time, in the audio reproduction system, it is necessary to reproduce audio signals output from individual hardware in a completely synchronized manner, for example, in units of samples.
[0006]
Therefore, in the audio reproduction system, in order to realize synchronous reproduction, a so-called real-time OS (Operating System) is required, or special hardware capable of performing communication while accurately performing time synchronization with an external signal. Necessary and complicating the entire system and communication means.
[0007]
Also, in the audio reproduction system, in order to realize synchronized reproduction, it has been conventionally performed as a synchronization method of video, etc., and the clock between hardware is set by packet communication by a general-purpose network connecting each hardware. It is also possible to match.
[0008]
However, in the audio reproduction system, the time for the command to reach each hardware varies due to the influence of traffic on the network. Also, in the audio reproduction system, since various hardware are connected to each other, the processing time varies depending on the difference of each hardware, and it is difficult to predict the processing time. Further, in the sound reproduction system, there is a difference in the clock of the sound card itself. For this reason, in the audio reproduction system, it is difficult to specify the delay time between each hardware for each communication session, and it is necessary to rely on a statistical method, which is very unstable. Therefore, such a method is unsuitable for a sample that requires sample level synchronization in units of 1/444100 seconds, such as voice.
[0009]
The present invention has been made in view of such a situation, and provides an audio reproducing apparatus and an audio reproducing method capable of accurately synchronizing and reproducing a multi-channel audio signal using a plurality of general-purpose hardware. It is intended to do.
[0010]
[Means for Solving the Problems]
An audio reproducing apparatus according to the present invention that achieves the above-described object is an audio reproducing apparatus that reproduces an audio signal of a plurality of channels in synchronization with reference signal generating means for generating a predetermined reference signal, and in synchronization with the reference signal. A plurality of audio output means for reproducing and outputting audio signals via an audio output processor capable of output processing of audio signals of a plurality of channels, and at least audio output means synchronized with a reference signal The signal is supplied for at least one channel from each of the sound output means via a sound input processor capable of processing the sound signal of more than the number, and the reproduction timing of the sound signal in each of the sound output means is given. And a replay signal monitoring means for monitoring the arrival of a replay signal for the sound, and the replay signal monitoring means includes a plurality of sound output means supplied from each of the sound output means. A relative shift time with respect to the input time of the recurring signal is obtained, and time information indicating the shift time is notified to each of the sound output means, and the sound output means each of the sound signal based on the time information. It is characterized in that the timing for starting playback is determined.
[0011]
Such an audio reproduction device according to the present invention should start reproduction of an audio signal based on time information indicating a relative shift time with respect to input times of a plurality of replay signals corresponding to each of the audio output means. Determine timing.
[0012]
The audio reproduction method according to the present invention that achieves the above-described object is an audio reproduction method for synchronously reproducing an audio signal of a plurality of channels, and can output an audio signal of a plurality of channels in synchronization with a predetermined reference signal A signal that is supplied for at least one channel from each of a plurality of audio output means that are not synchronized with each other and that reproduces and outputs an audio signal via a sound output processor, and each of the audio output means The replay signal for giving the reproduction timing of the sound signal is input to the replay signal monitoring means via a sound input processor capable of inputting and processing at least the sound signals of the sound output means in synchronization with the reference signal. A deviation time calculating step for obtaining a relative deviation time for the input times of the plurality of recurrent signals supplied from each of the audio output means; Based on the time information indicating a time that is characterized by comprising a playback start timing determination step of determining when to start playing the audio signal.
[0013]
In such an audio reproduction method according to the present invention, reproduction of an audio signal should be started based on time information indicating a relative shift time with respect to input times of a plurality of replay signals corresponding to each of the audio output means. Timing is determined.
[0014]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, specific embodiments to which the present invention is applied will be described in detail with reference to the drawings.
[0015]
This embodiment is an audio reproducing apparatus capable of reproducing at least two channels of multi-channel audio signals in synchronization using a plurality of hardware including a personal computer. This sound reproducing apparatus uses multi-tasking and general hardware that is not necessarily specialized for real-time processing, or an OS (Operating System) or a system corresponding to the OS, and an existing sound card or interface. By using general-purpose audio processing means such as hardware conforming to this and communication means, multi-channel synchronized reproduction of audio signals existing over a plurality of hardware is enabled.
[0016]
In the following description, the hardware is assumed to be configured by a memory that stores various programs, a CPU (Central Processing Unit) that executes the various programs, a DSP (Digital Signal Processor), and the like. In the following description, unless otherwise specified, audio signals existing in hardware are those existing as audio files on storage means such as a hard disk, and whether or not signal processing is performed on each hardware. The description will be made on the assumption that any of the audio streams existing on the memory is sequentially indicated regardless of whether or not. Further, hereinafter, a module indicating each functional unit is referred to as a “site”. This site does not necessarily match the unit of hardware. That is, the audio reproducing apparatus may be implemented by a plurality of sites mounted on a single hardware, or may be distributed and mounted on a plurality of hardware, and the configuration thereof is arbitrary.
[0017]
First, a first embodiment of the present invention will be described. In the audio reproduction apparatus 10 shown in FIG. 1 as the first embodiment, audio signals are distributed as audio files on each hardware, and 56-channel audio signals are generated using these audio files. Synchronous playback is performed.
[0018]
As shown in the figure, the audio reproduction device 10 includes a control site 11 which is a control means for controlling each part, and a trigger signal TG which is a recurring signal to be described later. 1 , TG 2 , ..., TG 8 Trigger monitoring site 12 which is a recurrent signal monitoring means for monitoring the sound and eight audio output sites 20 which are audio output means for reproducing and outputting the audio signal 1 , 20 2 , ..., 20 8 (Hereafter, audio output site 20 n (N = 1, 2,..., 8; site number). ), A word clock generator 14 which is a reference signal generating means for generating a clock in units of words as a predetermined reference signal, and an audio output site 20 n 56 output units 15 comprising a D / A converter that performs D / A (Digital / Analog) conversion on the audio signal output from the A / D converter, an amplifier that amplifies the analog audio signal, and the like. 11 , 15 12 , 15 13 , 15 14 , 15 15 , 15 16 , 15 17 , 15 21 , 15 22 , ..., 15 84 , 15 85 , 15 86 , 15 87 (Hereafter, output device 15 nm (N = 1, 2,..., 8, m = 1, 2,..., 7; channel number). ) And these output devices 15 nm 56 loudspeakers 16 for emitting sound signals output from the sound sources to the outside 11 , 16 12 , 16 13 , 16 14 , 16 15 , 16 16 , 16 17 , 16 21 , 16 22 , ..., 16 84 , 16 85 , 16 86 , 16 87 (Hereafter, speaker 16 nm (N = 1, 2,..., 8, m = 1, 2,..., 7). ).
[0019]
The control site 11 has a function of performing overall control of the sound reproduction device 10 and a function related to an interface between the sound reproduction device 10 and the user. The control site 11 can communicate with the outside in accordance with a predetermined protocol such as TCP / IP (Transmission Control Protocol / Internet Protocol) or UDP (User Datagram Protocol), and trigger monitoring is performed via the network NT. Site 12 and audio output site 20 n It is possible to send and receive signals to and from. The audio reproducing apparatus 10 does not need to prepare special hardware or construct a new one by using such generally known and frequently used network resources and general-purpose communication protocols. The control site 11 has an environment in which the control program Ct can be executed. When a playback command is instructed by the user via a user interface UI including a predetermined operation unit and display unit, the control site Ct Control information indicating an audio file playback instruction is transmitted to the audio output site 20 via the network NT. n Notify against.
[0020]
The trigger monitoring site 12 is at least an audio output site 20 n Or more, that is, a hardware function including a personal computer having a sound processing unit 13 such as a sound card capable of inputting and processing an audio signal as a trigger signal to be described later of 8 channels or more. Similar to the control site 11, the trigger monitoring site 12 is connected to the control site 11 and the audio output site 20 via the network NT according to a predetermined protocol such as TCP / IP or UDP. n It is possible to send and receive signals to and from. The trigger monitoring site 12 is connected to the audio output site 20 via the sound processing unit 13. n Trigger signal TG, which is an audio signal for one channel output from, and is a signal for giving the reproduction timing of the audio file 1 , TG 2 , ..., TG 8 (Hereafter, trigger signal TG n (N = 1, 2,..., 8) ) Can be received. At this time, the trigger monitoring site 12 is configured such that the first channel in the sound processing unit 13 is the audio output site 20. 1 And the second channel is connected to the audio output site 20. 2 Each channel is connected to the audio output site 20 such as n Are connected in correspondence with each of the above. The trigger monitoring site 12 is an environment capable of executing the monitoring program Sv, and is a trigger external signal sufficient to synchronize each sample with the word clock WCLK or the word unit supplied from the word clock generator 14. In synchronism with this, the sound processing unit 13 performs processing.
[0021]
The trigger monitoring site 12 is connected to all audio output sites 20 from the control site 11. n Is output to the audio output site 20 under the execution control of the monitoring program Sv. n Trigger signal TG output from each of n Monitor incoming traffic. The trigger monitoring site 12 generates a trigger signal TG n , These trigger signals TG n Based on the audio output site 20 n The number of delay samples to be described later corresponding to each of these is obtained, and the delay sample number information indicating these delay sample numbers is obtained via the network NT. n Respectively. Here, the number of delayed samples is the trigger signal TG for the trigger monitoring site 12. n The relative shift time with respect to the input time is obtained in units of the word clock WCLK.
[0022]
Note that the type of audio signal handled by the trigger monitoring site 12 is preferably digital data, but in the sound processing unit 13, the word clock WCLK and the trigger signal TG are used. n As long as it can be accurately detected and transmitted / received, analog data may be used. In the trigger monitoring site 12, even if digital data is handled, any data format such as sampling rate or compression or non-compression may be used.
[0023]
Audio output site 20 n Are each a sound processing unit 21 such as a sound card capable of outputting an 8-channel audio signal, for example. 1 , 21 2 , ..., 21 8 (Hereinafter, the sound processing unit 21 n (N = 1, 2,..., 8) ) Having hardware functions including a personal computer or the like. Audio output site 20 n Performs transmission / reception of signals between the control site 11 and the trigger monitoring site 12 via the network NT in accordance with a predetermined protocol such as TCP / IP and UDP, respectively, similarly to the control site 11 and the trigger monitoring site 12. It is possible. Also, the audio output site 20 n Respectively, the sound processing unit 21 n For example, only the eighth channel is connected to the trigger monitoring site 12, and the trigger signal TG, which is an audio signal for one channel, is connected to the trigger monitoring site 12 using this channel. n Can be output. Audio output site 20 n Respectively, reproduction processing program A 1 , A 2 , ..., A 8 (Hereinafter, reproduction processing program A n (N = 1, 2,..., 8) The sound processing unit is synchronized with a word clock WCLK supplied from the word clock generator 14 or a trigger external signal sufficient to synchronize each sample in units of words. 21 n The process in is performed. At this time, the audio output site 20 n Respectively, the sound processing unit 21 n It is assumed that synchronization between the first channel to the eighth channel is secured. That is, the audio output site 20 n , In the case where a reproduction instruction is received from the control site 11 as will be described later, the sound processing unit 21 n Audio signals are simultaneously output from the first channel to the eighth channel. Also, the audio output site 20 n Are respectively stored in a storage means (not shown) in an audio file AF. 1 , AF 2 , ..., AF 8 (Hereafter, audio file AF n (N = 1, 2,..., 8) ) Is remembered.
[0024]
Audio output site 20 n Are audio files AF supplied from the control site 11 via the network NT, respectively. n When the control information indicating the reproduction instruction is received, the reproduction processing program A n Under the execution control of the sound processing unit 21 n Trigger signal TG via n Is output to the trigger monitoring site 12. This trigger signal TG n Is an audio signal having a predetermined waveform that can be recognized as a trigger by the trigger monitoring site 12, and is preferably an impulse signal, for example. Also, the audio output site 20 n When the delay sample number information is received from the trigger monitoring site 12 via the network NT, the audio file AF is based on the delay sample number and the reproduction margin sample number described later. n Decides the timing to start playback of the audio file AF at this timing n Reproduction of the output device 15 nm And speaker 16 nm Sound is emitted to the outside via Audio output site 20 n Respectively, the sound processing unit 21 1 The first through seventh channels are respectively output devices 15. 1m The audio signal output from each channel is connected to the corresponding output device 15 as shown in FIG. nm Output for.
[0025]
Each audio output site 20 n As for the type of the audio signal handled by, as with the trigger monitoring site 12, digital data is desirable, but the sound processing unit 21 n , Word clock WCLK and trigger signal TG n As long as it can be accurately detected and transmitted / received, analog data may be used. Also, the audio output site 20 n In the above, even if digital data is handled, any data format such as sampling rate or compression or non-compression may be used.
[0026]
The word clock generator 14 generates an accurate clock in units of words. The word clock generator 14 sends the generated word clock WCLK to the sound processing unit 13 and the audio output site 20 at the trigger monitoring site 12. n Sound processing unit 21 n To supply. The word clock generator 14 may generate a trigger external signal sufficient to synchronize each sample in units of words.
[0027]
Output device 15 nm Are the audio output sites 20 respectively. n The audio signal output from is subjected to D / A conversion and then amplified. Output device 15 nm Respectively, the amplified audio signal is output from the speaker 16. nm Output for.
[0028]
Speaker 16 nm Are output devices 15 respectively. nm The electrical sound signal output from each of these is converted into acoustic energy and emitted to the outside.
[0029]
In the audio reproduction device 10 including such units, the audio output site 20 n Audio file AF stored in each n If the control information indicating the reproduction instruction is given by the control site 11, the audio output site 20 n From each of the trigger signals TG to the trigger monitoring site 12 n Is output. In the audio reproduction device 10, the trigger signal TG is transmitted by the trigger monitoring site 12. n Based on the audio output site 20 n Find the number of delayed samples corresponding to each of. In the audio reproduction device 10, each audio output site 20 n Based on the number of delayed samples and the number of playback margin samples, the timing at which the player should start playback is obtained, and the audio file AF is reached when the timing is reached. n Can start playing. In the audio reproduction device 10, all the audio output sites 20 are thus obtained. n Audio file AF by n The playback start timing can be matched. Then, in the audio reproduction device 10, the audio output site 20 is thereafter based on the word clock WCLK supplied from the word clock generator 14. n Multi-channel synchronized playback can be performed by proceeding with playback.
[0030]
In the audio playback device 10, for example, the audio output site 20 1 Have the functions of the control site 11 and / or the trigger monitoring site 12, or other audio output sites 20 2 As described above, a plurality of sites can be mounted on a single piece of hardware or can be distributed and mounted on a plurality of pieces of hardware.
[0031]
In such an audio playback device 10, the audio output site 20 n Respectively, reproduction processing program A n And the audio file AF is performed through a series of steps shown in FIG. n Start playing.
[0032]
First, the audio output site 20 n As shown in the figure, the reproduction margin sample number Sm is set in step S1. This reproduction margin sample number Sm is determined by the audio output site 20. n Is a common value between Specifically, the reproduction margin sample number Sm is determined from the reference sample described later from the audio file AF. n This is a value representing the time until the sample at the start of playback. The reproduction margin sample number Sm is a value that is calculated in consideration of a time sufficient for completing various processes to be described later, for example, and may be set by the user or automatically set. Audio output site 20 n Each stores the set reproduction margin sample number Sm in a memory (not shown) or the like.
[0033]
Next, the audio output site 20 n Respectively, in step S2, the audio file AF from the control site 11 via the network NT. n It is determined whether or not the control information indicating the reproduction instruction is reached. Audio output site 20 n Since the reproduction instruction from the control site 11 is given via the network NT, the absolute time at which the control information arrives depends on the influence of network traffic and the like. n Variation occurs between the two. Audio output site 20 n Each waits until the control information from the control site 11 arrives, and when the control information is received, the process proceeds to step S3.
[0034]
Audio output site 20 n Respectively, in step S3, the sound processing unit 21 n In the eighth channel (m = 8), that is, in the trigger channel connected to the trigger monitoring site 12, the trigger signal TG which is an audio signal such as an impulse signal is provided. n Play. Audio output site 20 n Trigger signal TG from each of n Is the absolute time at which the audio output site 20 n Are different types of sound processing units 21. n The same type of sound processing unit 21 n Even if it is installed, the processing capability varies slightly, and it is unpredictable due to the operating status of other tasks operating in multitasking.
[0035]
At the same time, the audio output site 20 n Respectively, in step S4, the trigger signal TG n Sample S at the time of playback and output to the trigger monitoring site 12 n Is used as a reference to start counting the number of playback samples. Audio output site 20 n Respectively, this sample S n Audio file AF based on n The playback start timing is determined.
[0036]
At the same time, the audio output site 20 n In step S5, “0” is output to channels other than the trigger channel, that is, the first to seventh channels (m = 1 to 7). That is, the audio output site 20 n Respectively, in step S3, the trigger signal TG is transmitted to the eighth channel. n The first channel to the seventh channel are muted.
[0037]
And the audio output site 20 n Respectively continues to count the number of reproduced samples in step S6, and in step S7, the corresponding delayed sample number Sd from the trigger monitoring site 12 n It is determined whether or not the delayed sample number information indicating (n = 1, 2,..., 8) has reached through the network NT. Audio output site 20 n Since the delay sample number information from the trigger monitoring site 12 is given via the network NT, the absolute time at which the delay sample number information arrives depends on the influence of the network traffic and the like. n Variation occurs between the two.
[0038]
Here, if the delayed sample number information has not arrived, the audio output site 20 n Respectively repeat the processing of step S5 to step S6.
[0039]
On the other hand, when the delayed sample number information arrives, the audio output site 20 n In step S8, “(reproduction margin sample number Sm) − (delay sample number Sd n ) "And calculates the trigger signal TG to the trigger monitoring site 12. n Is counted from the sample at the time of output, and the audio file AF is counted from the time when the calculated value is reached. n Is started, and a series of processing ends.
[0040]
In this way, in the audio reproduction device 10, the audio output site 20 n Each of the reproduction processing program A n And execute the audio file AF n Can be started simultaneously. In the audio playback device 10, the audio output site 20 is thereafter processed. n Are respectively based on the word clock WCLK supplied from the word clock generator 14. n By proceeding with the playback, multi-channel synchronized playback becomes possible.
[0041]
On the other hand, in the audio reproduction device 10, the trigger monitoring site 12 executes the monitoring program Sv and goes through a series of steps shown in FIG. n The number of delayed samples Sd corresponding to each 1 , Sd 2 , ..., Sd 8 (Hereinafter, the number of delayed samples Sd n (N = 1, 2,..., 8) )
[0042]
First, the trigger monitoring site 12, as shown in FIG. n Trigger signal TG output to each channel in the sound processing unit 13 n Monitor incoming traffic.
[0043]
Subsequently, in step S12, the trigger monitoring site 12 sends a trigger signal TG to any one of the eight channels in the sound processing unit 13. n It is determined whether any of the above has been supplied.
[0044]
Here, the trigger signal TG n If any of the above is not supplied, the trigger monitoring site 12 proceeds to step S11, and trigger signal TG n Continue to monitor until either of them is supplied.
[0045]
On the other hand, trigger signal TG n When any of the trigger signals is supplied, the trigger monitoring site 12 sends the supplied trigger signal TG in step S13. n Is first supplied, ie for the first time the trigger signal TG n It is determined whether or not is supplied.
[0046]
Here, the trigger signal TG n Is not the first supplied, the trigger monitoring site 12 moves the process to step S15. On the other hand, trigger signal TG n , The trigger monitoring site 12 determines that the trigger signal TG detected first in step S14. n Counting the number of input samples is started using the sample at the time when is input as a reference sample, and the process proceeds to step S15. At the trigger monitoring site 12, another trigger signal TG is counted by counting the number of input samples based on this reference sample. n Will be measured.
[0047]
Then, in step S15, the trigger monitoring site 12 changes the count value that has started counting from the reference sample in step S14 as the number of delayed samples Sd. n Trigger signal TG n Corresponding audio output site 20 n For this delay sample number Sd n Is output via the network NT. The trigger monitoring site 12 first sets the trigger signal TG n Audio output site 20 n Is the number of delayed samples Sd n Needless to say, 0 is notified.
[0048]
Subsequently, the trigger monitoring site 12 continues to count the number of input samples in step S16, and in step S17, all the voice output sites 20 n To trigger signal TG n Is received.
[0049]
Here, all audio output sites 20 n To trigger signal TG n Is not received, the trigger monitoring site 12 repeats the processes of steps S11 to S16.
[0050]
On the other hand, all audio output sites 20 n To trigger signal TG n Is received, the trigger monitoring site 12 ends the series of processes as it is.
[0051]
Audio output site 20 n Either of the trigger signal TG due to failure etc. n May not be given to the trigger monitoring site 12, but in this case, the trigger monitoring site 12 may appropriately exit the loop processing that shifts from step S17 to step S11.
[0052]
In this way, in the audio reproduction device 10, the monitoring program Sv is executed by the trigger monitoring site 12, and the audio output site 20 n The number of delayed samples Sd corresponding to each n Voice output site 20 n It is possible to realize synchronized playback by means of.
[0053]
Trigger monitoring site 12 and audio output site 20 for executing such a program n In the audio playback device 10 having the above, for example, each operation is performed in accordance with the timing shown in FIG.
[0054]
That is, in the audio reproduction device 10, the trigger monitoring site 12 and the audio output site 20 are based on the word clock WCLK generated by the word clock generator 14. n Works. In the audio reproduction device 10, as shown in the upper part of the figure, when a reproduction command is instructed via the user interface UI, control information indicating the reproduction instruction is transmitted from the control site 11 to the audio output site 20. n Are notified via the network NT. As described above, the absolute time at which this control information arrives is caused by the influence of network traffic, etc. n Variation occurs between the two. Here, as shown in the middle of FIG. 1 Receives the control information earliest and the voice output site 20 8 , Audio output site 20 2 It is assumed that the control information is received in the following order.
[0055]
Then, in the audio reproduction device 10, as described above, the audio output site 20 n Trigger signal TG to trigger monitoring site 12 from n Is given. This audio output site 20 n Trigger signal TG from each of n As described above, the absolute time at which is reproduced is the audio output site 20 n Sound processing unit 21 n Audio output site 20 due to the difference in the processing capacity of the CPU or the like (not shown). n Variation occurs between the two. Here, as shown in the middle of FIG. 1 Is the earliest sample S 1 Trigger signal TG at 1 , And then sample S 8 , S 2 Audio output site 20 at the time of 8 , Audio output site 20 2 Trigger signal TG in the order 8 , TG 2 Shall be reproduced. Audio output site 20 n Respectively, these trigger signals TG n Sample S at the time when is output n Is used as a reference to start counting the number of playback samples. Also, here, the trigger signal TG is the earliest 1 Sample S from which was played 1 Is the reference sample.
[0056]
In response to this, in the audio reproduction device 10, as described above, the trigger monitoring site 12 performs the sample S that is the reference sample. 1 Starts counting the number of input samples, and as shown in the lower part of FIG. n Is calculated. In the audio reproduction device 10, the number of delayed samples Sd n Voice output site 20 that corresponds to n Will be notified. This delayed sample number Sd n As described above, the absolute time at which the voice output site 20 arrives is due to the influence of the network traffic, etc. n Variation occurs between the two. Here, as shown in the middle of FIG. 1 Is the earliest delay sample number information received, voice output site 20 2 , Audio output site 20 8 It is assumed that the delayed sample number information is received in the following order.
[0057]
In the audio reproduction device 10, the audio output site 20 n , Trigger signal TG to trigger monitoring site 12 n Sample S at the time of output n (Reproduction margin sample number Sm−delay sample number Sd n ) Audio file AF from sample n Playback starts simultaneously. Note that the reproduction margin sample number Sm is at least the following process, that is, the audio output site 20 that has received the control information indicating the reproduction instruction. n Is the trigger signal TG n , The trigger monitoring site 12 is connected to all the audio output sites 20 n To trigger signal TG n The trigger monitoring site 12 receives the voice output site 20. n The number of delayed samples Sd for each n And all audio output sites 20 n Is late sample number Sd n Received, audio file AF n This value is calculated in consideration of sufficient time for performing the step of starting the reproduction operation.
[0058]
In the audio playback device 10, the audio output site 20 n Audio file AF n After that, the audio file AF is maintained while maintaining the synchronization based on the word clock WCLK generated by the word clock generator 14. n Proceed with playback.
[0059]
As described above, the audio reproduction device 10 shown as the first exemplary embodiment of the present invention has the audio output sites 20. n Audio file AF distributed on top n Can be used to perform multi-channel synchronized playback. In particular, the audio playback apparatuses 10 are not synchronized with each other, and the audio output site 20 has a wide variety of operating environments. n Even in the case of using, synchronous reproduction can be surely realized. The audio reproduction device 10 uses, for example, a sound processing unit capable of simultaneous reproduction of M channels, and uses a trigger monitoring site 12 and n audio output sites 20. n By configuring this, it is possible to realize synchronized reproduction of (M−1) × n channels.
[0060]
In the audio playback device 10, the role of the control site 11 described above is to transmit control information indicating a playback instruction for playback at the timing when the user operates the user interface UI. However, the time from the timing when the user operates the user interface UI to issue the playback instruction to the start of playback is the first trigger signal TG. n Is defined by the sum of the time until the reproduction is performed and the set reproduction margin sample number Sm. These times vary depending on factors such as network traffic and hardware processing load. Therefore, the audio playback device 10 does not consider the absolute time of the playback start, but aims to match the timing of the playback start to the last, and is intended for the case where there is no problem with the absolute time. I want to be.
[0061]
Further, in the above-described embodiment, it has been described that only the reproduction instruction is given by the control site 11. However, in the audio reproduction device 10, for example, “stop”, “pause”, and “rewind” as necessary. It is also possible to give an instruction corresponding to a command corresponding to “fast forward” or the like. For example, in the audio reproduction device 10, the reproduction sample count is continued even after the reproduction is started, and each audio file AF n Information about whether to stop or return to playback via the control site 11 n Or audio file AF n By specifying the playback position of the voice output site 20 n Playback processing program A n It is possible to realize a unified operation under the execution control.
[0062]
Furthermore, in the audio reproduction device 10, the control site 11 is not necessarily provided. The audio reproduction device 10 includes an audio output site 20 instead of including the control site 11. n It is also possible to start synchronous reproduction at a preset time using a timer or the like included in each of the above. However, in this case, in the audio reproduction device 10, the audio output site 20 n It is necessary to set the value of the reproduction margin sample number Sm on the assumption of the deviation time of the timer included in each of them, or to adjust each timer via the network NT so as to be within the value of the reproduction margin sample number Sm. .
[0063]
Furthermore, the audio playback device 10 may be hardware capable of realizing the function without using a personal computer as each site or using a sound card as a sound processing unit.
[0064]
Further, although the audio playback device 10 has been described as performing communication via the network NT in accordance with a predetermined protocol such as TCP / IP or UDP, the trigger monitoring site 12 to the audio output site 20 are described. n The number of samples Sd delayed from n Needless to say, any network layer format may be used.
[0065]
Further, in the above-described embodiment, the fixed value is used as the reproduction margin sample number Sm. However, for example, in the audio reproduction device 10, under the execution control of the monitoring program Sv by the trigger monitoring site 12, Each audio output site 20 n Delay sample number Sd n Is calculated as a reproduction margin sample number Sm with a sufficient expectation of delay in communication and audio signal output, and each audio output site 20 is transmitted through the network NT. n You may make it notify and set. At this time, the audio reproduction device 10 can also statistically measure a delay that occurs when performing communication via the network NT, and can set the reproduction margin sample number Sm using this statistical information.
[0066]
Furthermore, in the above-described embodiment, the sound processing unit has been described as being synchronized with the word clock WCLK. However, in the audio reproduction device 10, a mechanism that ensures synchronization in the sound processing unit is not limited to the word clock. If so, for example, it may correspond to a 256-times clock, a clock of 1/2 word unit, or a general code such as SMPTE (Society of Motion Picture and Television Engineers).
[0067]
In the above-described embodiment, the trigger signal TG is earliest as a reference sample from which the count of the input samples is started at the trigger monitoring site 12. n Sample S at the time when was played n However, in the audio reproduction apparatus 10, a specific sample at an arbitrary time can be defined by the trigger monitoring site 12, and the number of delayed samples Sd is relatively large. 1 , Sd 2 , ..., Sd 8 The information in which the time relationship is maintained is the audio output site 20 n The reference sample can be of any time as long as it can be notified.
[0068]
Furthermore, in the above-described embodiment, the audio signal is the audio file AF. n However, in the audio reproduction device 10, it may exist as an audio stream sequentially on the memory.
[0069]
Next, a second embodiment of the present invention will be described. As the second embodiment, the audio reproduction device 30 shown in FIG. 5 includes 56 audio files, and uses 8 audio output sites capable of outputting an 8-channel audio signal. The 56-channel audio signal is synchronously reproduced. Accordingly, parts having the same functions as those of the audio reproduction device 10 shown as the first embodiment are denoted by the same reference numerals, and detailed description thereof is omitted.
[0070]
As shown in the figure, the sound reproducing device 30 includes the trigger monitoring site 12, the word clock generator 14, and 56 output devices 15 described above. nm And 56 speakers 16 nm , A distribution site 31 that distributes the stored 56-channel audio file AF, and eight audio output sites 40 that reproduce and output audio signals. 1 , 40 2 , ..., 40 8 (Hereinafter, voice output site 40 n (N = 1, 2,..., 8; site number). ).
[0071]
Similar to the control site 11 described above, the distribution site 31 has a function of performing overall control of the audio reproduction device 30 and has a user interface UI between the audio reproduction device 30 and the user. The channel audio file AF is stored in a storage means (not shown). The audio file AF stored in the distribution site 31 may be compressed in a predetermined format or may be uncompressed. The distribution site 31 can communicate with the outside in accordance with a predetermined protocol such as TCP / IP or UDP, for example, via the network NT having a capacity sufficient to transmit the 56-channel audio file AF. Trigger monitoring site 12 and audio output site 40 n It is possible to send and receive signals to and from. The distribution site 31 is configured to be capable of executing the distribution program Ds. When a reproduction command is instructed by the user via a user interface UI including a predetermined operation unit and display unit, the distribution program Ds. Under the execution control of the voice output site 40, the control information indicating the playback instruction of the voice file AF is transmitted via the network NT. n And the audio output site 40 for each of the seven channels using the 56-channel audio file AF as stream data. n Deliver against. Note that the audio stream transmitted via the network NT may be compressed in a predetermined format or may be uncompressed.
[0072]
Audio output site 40 n Are the audio output sites 20 described above, respectively. n Similarly to the sound processing unit 41 such as a sound card that can output and process an 8-channel audio signal, for example. 1 , 41 2 , ..., 41 8 (Hereinafter, the sound processing unit 41 n (N = 1, 2,..., 8) ) Having hardware functions including a personal computer or the like. Audio output site 40 n Performs transmission / reception of signals between the distribution site 31 and the trigger monitoring site 12 via the network NT according to a predetermined protocol such as TCP / IP or UDP, respectively, in the same manner as the distribution site 31 and the trigger monitoring site 12. It is possible. Also, the audio output site 40 n Respectively, the sound processing unit 41 n For example, only the eighth channel is connected to the trigger monitoring site 12, and the trigger signal TG is transmitted to the trigger monitoring site 12 using this channel. n Can be output.
Audio output site 40 n Respectively, reproduction processing program B 1 , B 2 , ..., B 8 (Hereafter, playback processing program B n (N = 1, 2,..., 8)
The sound processing unit is synchronized with a word clock WCLK supplied from the word clock generator 14 or a trigger external signal sufficient to synchronize each sample in units of words. 41 n The process in is performed. At this time, the audio output site 40 n Respectively, the sound processing unit 41 n It is assumed that synchronization between the first channel to the eighth channel is secured. That is, the voice output site 40 n , When receiving a reproduction instruction from the distribution site 31, respectively, the sound processing unit 41 n Audio signals are simultaneously output from the first channel to the eighth channel. Also, the audio output site 40 n Each has a buffer (not shown) that temporarily stores an audio stream distributed from the distribution site 31, and sequentially stores the audio stream distributed from the distribution site 31 in this buffer. Audio output site 40 n In the case where the audio streams are compressed in a predetermined format, when these audio streams are stored in a buffer, a predetermined decoding process is performed via the buffer. And the audio output site 40 n In, when a predetermined volume or more of the audio stream is stored from the buffer, it is read out and output to the outside. In the following, each audio output site 40 n Audio streams delivered to the AS respectively 1 , AS 2 , ..., AS 8 (Hereafter, audio stream AS n (N = 1, 2,..., 8) ).
[0073]
Audio output site 40 n When receiving control information indicating a reproduction instruction supplied from the distribution site 31 via the network NT, the reproduction processing program B n Under the execution control of the sound processing unit 41 n Trigger signal TG via n Is output to the trigger monitoring site 12. During this time, the audio output site 40 n Respectively, the audio stream AS n Is delivered and the audio output site 40 n Are respectively delivered audio streams AS. n Are stored in a buffer not shown in the order of streams. Also, the audio output site 40 n When the delay sample number information is received from the trigger monitoring site 12 via the network NT, the delay sample number Sd n And the audio stream AS decoded from the beginning of the buffer based on the reproduction margin sample number Sm. n Reproduction of the output device 15 nm And speaker 16 nm Sound is emitted to the outside via
[0074]
In the audio reproducing device 30 having such units, when control information indicating a reproduction instruction for the 56-channel audio file AF stored in the distribution site 31 is given, the audio file AF is 7-channel audio. Stream AS n As an audio output site 40 n And the audio output site 40 n From each of the trigger signals TG to the trigger monitoring site 12 n Is output. In the sound reproducing device 30, the trigger monitoring site 12 causes the trigger signal TG. n Based on the voice output site 40 n The number of delayed samples Sd corresponding to each n Ask for. In the audio reproduction device 30, each audio output site 40 n By this delay sample number Sd n And the playback margin sample number Sm, the timing at which the player should start playback is obtained, and at the time when this timing is reached, the audio stream AS n Can start playing. In the audio reproducing device 30, all the audio output sites 40 are thus obtained. n Audio stream AS n The playback start timing can be matched. Thereafter, in the audio reproducing device 30, the audio output site 40 is based on the word clock WCLK supplied from the word clock generator 14. n Multi-channel synchronized playback can be performed by proceeding with playback.
[0075]
Specifically, in the audio playback device 30, the audio output site 40 n Respectively, reproduction processing program B n And the audio stream AS is obtained through a series of steps shown in FIG. n Start playing.
[0076]
First, the audio output site 40 n As shown in the figure, the reproduction margin sample number Sm is set in step S21. This reproduction margin sample number Sm is the same as in the case of the audio reproduction device 10 described above, and the audio output site 40 that has received the control information indicating the reproduction instruction. n Is the trigger signal TG n , The trigger monitoring site 12 is connected to all the audio output sites 40. n To trigger signal TG n The trigger monitoring site 12 receives the voice output site 40. n The number of delayed samples Sd for each n Notification process, all audio output sites 40 n Is late sample number Sd n The audio stream AS n In addition to sufficient time to perform the process of starting the playback operation of the audio stream AS n Is a value calculated in anticipation of a sufficient time for storing a predetermined capacity or more.
[0077]
Subsequently, the audio output site 40 n In step S22, it is determined whether or not control information indicating an instruction to reproduce the audio file AF has arrived from the distribution site 31 via the network NT. Audio output site 40 n Each waits until the control information from the distribution site 31 arrives, and when the control information is received, the process proceeds to step S23.
[0078]
Audio output site 40 n Respectively, in step S23, the sound processing unit 41 n Trigger signal TG to the trigger channel at n Play.
[0079]
At the same time, the audio output site 40 n Respectively, in step S24, the trigger signal TG n Sample S at the time of playback and output to the trigger monitoring site 12 n Is used as a reference to start counting the number of playback samples. Audio output site 40 n Respectively, this sample S n Audio stream AS n The playback start timing is determined.
[0080]
At the same time, the audio output site 40 n In step S25, “0” is output to channels other than the trigger channel.
[0081]
And the audio output site 40 n Respectively continues to count the number of reproduced samples in step S26, and in step S27, the corresponding delayed sample number Sd from the trigger monitoring site 12 n It is determined whether or not the delayed sample number information indicating is reached via the network NT.
[0082]
Here, when the delayed sample number information has not arrived, the audio output site 40 n Respectively repeat the processing of step S25 to step S26. On the other hand, when the delayed sample number information arrives, the audio output site 40 n In step S28, “(reproduction margin sample number Sm) − (delay sample number Sd n ) "And calculates the trigger signal TG to the trigger monitoring site 12. n The audio stream AS stored in the buffer is counted from the time point when the calculated value is reached and the sample is reached. n Is started, and a series of processing ends.
[0083]
On the other hand, in the audio playback device 30, the trigger monitoring site 12 executes the monitoring program Sv and goes through the series of steps shown in FIG. n The number of delayed samples Sd corresponding to each n Can be requested.
[0084]
In this way, in the audio reproduction device 30, the trigger monitoring site 12 executes the monitoring program Sv and the audio output site 40. n Reproduction processing program B by each of n And the audio stream AS constituting the audio file AF is executed. n Can be started simultaneously. In the audio playback device 30, the audio output site 40 is thereafter used. n Are respectively based on the word clock WCLK supplied from the word clock generator 14. n By proceeding with the playback, multi-channel synchronized playback becomes possible.
[0085]
As described above, the audio reproduction device 30 shown as the second exemplary embodiment of the present invention converts the audio file AF existing on the distribution site 31 into each audio output site 40. n Is divided into the number of channels that can be output, and each audio output site 40 n Audio stream AS delivered to n Can be used to perform multi-channel synchronized playback. In particular, the audio playback devices 30 are not synchronized with each other, and the audio output site 40 has a wide variety of operating environments. n Even in the case of using, synchronous reproduction can be surely realized.
[0086]
Next, a third embodiment of the present invention will be described. As the third embodiment, the audio reproducing device 50 shown in FIG. 7 performs predetermined signal processing on each source signal for each source signal, and performs synchronous reproduction of 56-channel audio signals. . In other words, the audio reproduction device 50 multicasts a single channel audio file to each audio output site, and performs individual signal processing on a channel basis by each audio output site for the distributed audio file. For example, control using multiple speakers, i.e., the directivity, sound field and Sound image control can be effectively realized. In this case as well, components having the same functions as those of the audio reproduction device 10 shown as the first embodiment or the audio reproduction device 30 shown as the second embodiment are given the same reference numerals, and details Such explanation will be omitted.
[0087]
As shown in the figure, the sound reproducing device 50 includes the trigger monitoring site 12, the word clock generator 14, and 56 output devices 15 described above. nm And 56 speakers 16 nm In addition to the above, a source output site 51 that outputs a stored audio file AF that is a one-channel source file, and eight audio output sites 60 that reproduce and output audio signals 1 , 60 2 , ..., 60 8 (Hereafter, audio output site 60 n (N = 1, 2,..., 8; site number). ).
[0088]
The source output site 51 has a function of performing overall control of the audio playback device 50 and a user interface UI between the audio playback device 50 and the user, like the control site 11 or the distribution site 31 described above. In addition, the audio file AF is stored in a storage means (not shown). The audio file AF stored in the source output site 51 is described as having one channel, but may be composed of a plurality of channels. The audio file AF may be compressed in a predetermined format or may be uncompressed. The source output site 51 can communicate with the outside according to a predetermined protocol such as TCP / IP or UDP, for example, and the trigger monitoring site 12 and the audio output site 60 via the network NT. n It is possible to send and receive signals to and from. The source output site 51 is an environment in which the source output program So can be executed. When a reproduction command is instructed by a user via a user interface UI including a predetermined operation unit and display unit, the source output site 51 Under the execution control of the output program So, control information indicating an instruction to reproduce the audio file AF is sent to the audio output site 60 via the network NT. n 1 channel audio file AF as it is or as stream data, all audio output sites 60 n Multicast distribution to Note that the audio signal transmitted via the network NT may be compressed in a predetermined format or uncompressed. Here, the audio output site 60 n Suppose that the audio file AF is multicast-delivered as it is.
[0089]
Audio output site 60 n Are the audio output sites 20 described above, respectively. n Or audio output site 40 n Similarly to the sound processing unit 61 such as a sound card that can output and process an 8-channel audio signal, for example. 1 , 61 2 , ..., 61 8 (Hereinafter, the sound processing unit 61 n (N = 1, 2,..., 8) ) Having hardware functions including a personal computer or the like. Audio output site 60 n Transmits and receives signals to and from the source output site 51 and the trigger monitoring site 12 via the network NT according to a predetermined protocol such as TCP / IP and UDP, respectively, similarly to the source output site 51 and the trigger monitoring site 12. It is possible to perform. Also, the audio output site 60 n Respectively, the sound processing unit 61 n For example, only the eighth channel is connected to the trigger monitoring site 12, and the trigger signal TG is transmitted to the trigger monitoring site 12 using this channel. n Can be output. Audio output site 60 n Respectively, reproduction processing program C 1 , C 2 , ..., C 8 (Hereinafter, reproduction processing program C n (N = 1, 2,..., 8) The sound processing unit is synchronized with a word clock WCLK supplied from the word clock generator 14 or a trigger external signal sufficient to synchronize each sample in units of words. 61 n The process in is performed. At this time, the audio output site 60 n Respectively, the sound processing unit 61 n It is assumed that synchronization between the first channel to the eighth channel is secured. That is, the audio output site 60 n , When receiving a reproduction instruction from the source output site 51, the sound processing unit 61. n Audio signals are simultaneously output from the first channel to the eighth channel. Also, the audio output site 60 n When the audio file AF is compressed in a predetermined format, the audio file AF is temporarily stored in a buffer (not shown), and a predetermined decoding process is performed via this buffer. And the audio output site 60 n Is read out from the buffer when the audio file AF is stored in a predetermined capacity or more.
[0090]
Also, the audio output site 60 n Respectively perform predetermined signal processing on the audio file AF read from the buffer. Audio output site 60 n , Respectively, as shown in FIG. nm (N = 1, 2,..., 8, m = 1, 2,..., 7; channel number). These signal processing units 62 nm Can also be configured as hardware, and as shown in FIG. n It can also be configured by software such as. Audio output site 60 n Respectively, the signal processing unit 62 converts the audio signal for each channel. nm To enter. As the signal processing, for example, a digital filter such as a so-called FIR (Finite Impulse Response) filter or an IIR (Infinite Impulse Response) filter may be applied. However, these signal processing units 62 nm The delay amount in is known and is assumed to be constant between channels for simplicity.
[0091]
Further, for example, a signal processing unit 62 such as a filter coefficient in a digital filter. nm The signal processing parameters in can be changed according to control information CNT for changing the signal processing method supplied from the outside. For example, in the audio reproduction device 50, the parameters can be changed according to the operation of the user interface UI by the user, and the source output site 51 to the audio output site 60 can be changed. n The control information CNT indicating the parameter change and the parameter value is notified. More specifically, for example, when an application that moves a sound image in conjunction with an image is assumed, the control information CNT is generated as the user moves his / her position by operating a joystick or the like as a user interface UI. Voice output site 60 n The position of the reproduced sound image can be moved by changing the signal processing parameters. In addition, audio output site 60 n Can change the parameters of the signal processing depending on the application, such as changing the direction of directivity or changing the reverberation parameter of the sound field. Audio output site 60 n In, an audio signal that has been subjected to signal processing is temporarily stored in a buffer (not shown), and is read out when a predetermined capacity or more is stored.
[0092]
Audio output site 60 n When receiving the control information indicating the reproduction instruction supplied from the source output site 51 via the network NT, the reproduction processing program C n Under the execution control of the sound processing unit 61 n Trigger signal TG via n Is output to the trigger monitoring site 12. During this time, the audio output site 60 n , Audio file AF is distributed, respectively, and the audio output site 60 n Respectively, the signal processing unit 62 for the distributed audio file AF. nm To perform signal processing. Also, the audio output site 60 n When the delay sample number information is received from the trigger monitoring site 12 via the network NT, the delay sample number Sd n And the reproduction margin sample number Sm, the reproduction of the audio signal after the signal processing is started, and the output unit 15 nm And speaker 16 nm Sound is emitted to the outside via
[0093]
In the audio reproduction device 50 including such units, the audio output site 60 n Respectively, reproduction processing program C n And the reproduction of the audio file AF can be started through the series of steps shown in FIG. On the other hand, in the audio reproduction device 50, the trigger monitoring site 12 executes the monitoring program Sv and goes through the series of steps shown in FIG. n The number of delayed samples Sd corresponding to each n Can be requested.
[0094]
In the audio playback device 50, when control information indicating a playback instruction for the 1-channel audio file AF stored in the source output site 51 is given, the audio file AF is stored in the audio output site 60. n And the audio output site 60 n From each of the trigger signals TG to the trigger monitoring site 12 n Is output. In the audio reproduction device 50, the trigger monitoring site 12 causes the trigger signal TG. n Based on the audio output site 60 n The number of delayed samples Sd corresponding to each n Ask for. In the audio reproduction device 50, each audio output site 60 is displayed. n By this delay sample number Sd n And the playback margin sample number Sm, the timing at which the player should start playback can be obtained, and playback of the audio signal can be started at the time when this timing is reached. In the audio reproducing device 50, all the audio output sites 60 are thus obtained. n It is possible to match the reproduction start timing of the audio file AF. Thereafter, in the audio reproducing device 50, the audio output site 60 is based on the word clock WCLK supplied from the word clock generator 14. n Multi-channel synchronized playback can be performed by proceeding with playback.
[0095]
Further, in the audio reproducing device 50, when the signal processing parameter is changed in the middle, the control information CNT indicating the content of the signal processing is transmitted from the source output site 51 to the audio output site 60. n The signal processing parameters are changed.
At this time, the audio reproducing device 50 can synchronize the time for changing the parameters of the signal processing by calculating the number of delayed samples related to the control information CNT, similarly to the reproduction instruction.
[0096]
In this way, in the audio reproduction device 50, the monitoring program Sv is executed by the trigger monitoring site 12, and the audio output site 60 is also executed. n Each of the reproduction processing program C n And the reproduction of the audio file AF can be started at the same time.
[0097]
As described above, the audio reproduction device 50 shown as the third embodiment of the present invention uses the audio file AF existing on the source output site 51 as the audio output site 60. n Multi-channel synchronized playback can be performed by using an audio signal that has been distributed to the audio file and subjected to signal processing on the distributed audio file AF. In particular, the audio playback devices 50 are not synchronized with each other, and the audio output site 60 has various operating environments. n Even in the case of using, it is possible to reliably realize synchronous reproduction, for example, directivity, sound field and sound image control using a multi-speaker can be realized with excellent effects.
[0098]
Next, a fourth embodiment of the present invention will be described. The audio playback device 70 shown in FIG. 9 as the fourth embodiment is predetermined by each audio output site for one source file, like the audio playback device 50 shown as the third embodiment described above. In order to avoid the influence of network traffic, for example, a network NT that performs information transmission according to a predetermined protocol such as TCP / IP or UDP is performed. And transmitting / receiving information using only the sound processing unit. Accordingly, components having the same functions as those of the audio reproduction device 50 shown as the above-described third embodiment are denoted by the same reference numerals, and detailed description thereof is omitted.
[0099]
As shown in the figure, the audio reproducing device 70 includes the above-described word clock generator 14 and 56 output devices 15. nm And 56 speakers 16 nm , A source output site 71 that outputs a stored audio file AF that is a one-channel source file, and a trigger signal TG n Trigger monitoring site 73 for monitoring the sound and eight sound output sites 80 for reproducing and outputting sound signals 1 , 80 2 , ..., 80 8 (Hereafter, audio output site 80 n (N = 1, 2,..., 8; site number). ).
[0100]
Similar to the source output site 51 described above, the source output site 71 has a function of performing overall control of the audio playback device 70, and has a user interface UI between the audio playback device 70 and the user, The file AF is stored in a storage means (not shown). The audio file AF stored in the source output site 71 is described as having one channel, but it may be composed of a plurality of channels. The audio file AF may be compressed in a predetermined format or may be uncompressed. The source output site 71 has a sound processing unit 72 such as a sound card that can output and process audio signals of at least two channels, and through this sound processing unit 72, a reproduction instruction by a user via the user interface UI or Control information indicating signal processing parameter changes, etc. n And the audio file AF as it is or as stream data is sent to all the audio output sites 80. n Can be distributed by multicast. At this time, in the source output site 71, the first channel in the sound processing unit 72 is used for distributing the audio file AF, and the second channel is used for notifying control information.
[0101]
The source output site 71 transmits and receives control information via the sound processing unit 72. This control information only needs to be able to transmit and receive numerical values, parameters, and the like, and any information can be used as long as the generation and recognition mechanism is agreed and used between the sites that transmit and receive. In particular, the source output site 71 and the audio output site 80 n Can handle the control information as a simple signal sequence, and can simplify the program for generation and recognition. The source output site 71 is an environment in which the source output program So can be executed. The trigger output is sufficient to synchronize each sample with the word clock WCLK supplied from the word clock generator 14 or in units of words. The sound processing unit 72 performs processing in synchronization with the signal.
[0102]
The trigger monitoring site 73 is at least an audio output site 80. n Or more, that is, a sound processing unit 74 such as a sound card capable of performing input processing and output processing on audio signals of 8 channels or more, and through this sound processing unit 74, an audio output site 80 n Trigger signal TG output from n Can be received. In addition, the trigger monitoring site 73 sends the number of delayed samples Sd via the sound processing unit 74. n Voice output site 80 n Can be notified. At this time, in the trigger monitoring site 73, the first channel on the input side in the sound processing unit 74 is the audio output site 80. 1 And the second channel is connected to the audio output site 80. 2 And the first channel on the output side is connected to the audio output site 80. 1 And the second channel is connected to the audio output site 80. 2 Each channel is connected to the audio output site 80 such as n Are connected in correspondence with each of the above. The trigger monitoring site 73 is an environment in which the monitoring program Sv can be executed, and a trigger external signal sufficient to synchronize each sample with the word clock WCLK supplied from the word clock generator 14 or in units of words. In synchronism with this, the sound processing unit 74 performs processing.
[0103]
The trigger monitoring site 73 controls the voice output site 80 under the execution control of the monitoring program Sv. n Trigger signal TG output from each of n Monitor incoming traffic. The trigger monitoring site 73 generates a trigger signal TG n , These trigger signals TG n Based on the voice output site 80 n The number of delayed samples Sd corresponding to each n And the number of delayed samples Sd n The information about the number of delayed samples is sent to the audio output site 80 via the sound processing unit 74. n Respectively.
[0104]
Audio output site 80 n The sound processing unit 81 such as a sound card that can output, for example, an 8-channel audio signal and can process an audio signal of at least 3 channels. 1 , 81 2 , ..., 81 8 (Hereinafter, the sound processing unit 81 n (N = 1, 2,..., 8) ). Audio output site 80 n These sound processing units 81 n It is possible to receive the audio file AF and control information output from the source output site 71 via the, and further to receive the delayed sample number information output from the trigger monitoring site 73. For example, an audio output site 80 n Respectively, the sound processing unit 81 n The first channel on the input side in FIG. 5 is a reception unit for the audio file AF from the source output site 71, the second channel is a reception unit for control information from the source output site 71, and the third channel is from the trigger monitoring site 73. The delay sample number information receiving unit. Also, the audio output site 80 n Respectively, the sound processing unit 81 n For example, only the eighth channel on the output side is connected to the trigger monitoring site 73, and the trigger signal TG is transmitted to the trigger monitoring site 73 using this channel. n Can be output. Audio output site 80 n Respectively, reproduction processing program D 1 , D 2 , ..., D 8 (Hereafter, reproduction processing program D n (N = 1, 2,..., 8) The sound processing unit is synchronized with a word clock WCLK supplied from the word clock generator 14 or a trigger external signal sufficient to synchronize each sample in units of words. 81 n The process in is performed. Audio output site 80 n When the audio file AF is compressed in a predetermined format, the audio file AF is temporarily stored in a buffer (not shown), and a predetermined decoding process is performed via this buffer. And voice output site 80 n Is read out from the buffer when the audio file AF is stored in a predetermined capacity or more.
[0105]
Also, the audio output site 80 n Are the audio output sites 60, respectively. n Similarly to the above, predetermined signal processing is performed on the audio file AF read from the buffer. Audio output site 80 n In, an audio signal that has been subjected to signal processing is temporarily stored in a buffer (not shown), and is read out when a predetermined capacity or more is stored.
[0106]
Audio output site 80 n Respectively, control information indicating a reproduction instruction supplied from the source output site 71 is transmitted to the sound processing unit 81. n Is received via the playback processing program D n Under the execution control of the sound processing unit 81 n Trigger signal TG via n Is output to the trigger monitoring site 73. During this time, the audio output site 80 n , Audio file AF is distributed, and the audio output site 80 n Respectively, performs signal processing on the distributed audio file AF by a signal processing unit (not shown). Also, the audio output site 80 n Respectively, the delay sample number information from the trigger monitoring site 73 is sent to the sound processing unit 81. n This delay sample number Sd n And the reproduction margin sample number Sm, the reproduction of the audio signal after the signal processing is started, and the output unit 15 nm And speaker 16 nm Sound is emitted to the outside via
[0107]
In the audio reproduction device 70 including such units, the audio output site 80 n Respectively, reproduction processing program D n And the reproduction of the audio file AF can be started through the series of steps shown in FIG. On the other hand, in the audio reproduction device 70, the trigger monitoring site 73 executes the monitoring program Sv and goes through the series of steps shown in FIG. n The number of delayed samples Sd corresponding to each n Can be requested.
[0108]
In the audio reproduction device 70, as in the audio reproduction device 50, when control information indicating a reproduction instruction for the one-channel audio file AF stored in the source output site 71 is given, the audio file AF is converted into the audio output site 80. n And the audio output site 80 n From each of the trigger signals TG to the trigger monitoring site 73 n Is output. In the audio reproduction device 70, the trigger signal TG is transmitted by the trigger monitoring site 73. n Based on the voice output site 80 n The number of delayed samples Sd corresponding to each n Ask for. In the audio reproduction device 70, each audio output site 80 is displayed. n By this delay sample number Sd n And the playback margin sample number Sm, the timing at which the player should start playback can be obtained, and playback of the audio signal can be started at the time when this timing is reached. In the audio reproduction device 70, all the audio output sites 80 are thus obtained. n It is possible to match the reproduction start timing of the audio file AF. Thereafter, in the audio reproduction device 70, the audio output site 80 is based on the word clock WCLK supplied from the word clock generator 14 thereafter. n Multi-channel synchronized playback can be performed by proceeding with playback.
[0109]
Further, in the audio reproduction device 70, similarly to the audio reproduction device 50, when changing the signal processing parameters on the way, control information indicating the content of the signal processing is transmitted from the source output site 71 to the audio output site 80. n The signal processing parameters are changed. At this time, in the audio reproduction device 70, as in the case of the reproduction instruction, it is possible to synchronize the time for changing the signal processing parameters by calculating the number of delayed samples related to the control information.
[0110]
In this way, in the audio reproduction device 70, the monitoring program Sv is executed by the trigger monitoring site 73, and the audio output site 80 is also executed. n Each of the reproduction processing program D n And the reproduction of the audio file AF can be started at the same time.
[0111]
As described above, the audio reproduction device 70 shown as the fourth exemplary embodiment of the present invention uses the audio file AF existing on the source output site 71 as the audio output site 80. n Multi-channel synchronized playback can be performed by using an audio signal that has been distributed to the audio file and subjected to signal processing on the distributed audio file AF. In particular, since the audio playback device 70 does not perform information transmission via a network that performs information transmission according to a predetermined protocol such as TCP / IP or UDP, for example, the influence of network traffic can be avoided and ensured. Synchronous playback can be realized.
[0112]
Finally, a fifth embodiment of the present invention will be described. The audio reproducing device 90 shown in FIG. 10 as the fifth embodiment outputs an audio signal instead of providing a dedicated trigger channel for outputting the trigger signal described above, among the sound processing units at the audio output site. Shared with the channel. That is, in the above-described embodiment, the trigger channel is used only when the trigger signal is reproduced once before the reproduction of the audio signal is started. May be inefficient. Therefore, the audio playback device 90 uses all the channels among the sound processing units capable of simultaneous playback of M channels at the n audio output sites for the output of the audio signal, so that (M−1) × described above. Rather than synchronized playback of n-channel audio signals, synchronized playback of M × n-channel audio signals can be realized. Here, it is assumed that the audio reproduction device 90 performs synchronous reproduction of a 32-channel audio signal using four audio output sites that can output an 8-channel audio signal. In this case as well, each part having the same function as that of the audio reproduction device 10 or the like shown as the first embodiment is given the same reference numeral, and detailed description thereof is omitted.
[0113]
As shown in the figure, the sound reproducing device 90 includes the above-described word clock generator 14 and 32 output devices 15. 11 , 15 12 , 15 13 , 15 14 , 15 15 , 15 16 , 15 17 , 15 18 , 15 21 , 15 22 , ..., 15 45 , 15 46 , 15 47 , 15 48 (Hereafter, output device 15 nm (N = 1, 2, 3, 4; site number, m = 1, 2,..., 8; channel number). ) And 32 speakers 16 11 , 16 12 , 16 13 , 16 14 , 16 15 , 16 16 , 16 17 , 16 18 , 16 21 , 16 22 , ..., 16 45 , 16 46 , 16 47 , 16 48 (Hereafter, speaker 16 nm (N = 1, 2, 3, 4, m = 1, 2,..., 8) ) And trigger signal TG n Trigger monitoring site 91 for monitoring and four audio output sites 100 for reproducing and outputting audio signals 1 , 100 2 , ..., 100 4 (Hereinafter, the audio output site 100 n (N = 1, 2, 3, 4) ). This audio reproduction device 90 is assumed to be applied to an entertainment theater ETH such as a movie theater, for example. nm And speaker 16 nm Embedded in the four walls of the entertainment theater ETH, it is possible to construct a realistic sound field with 32 channels of independent audio.
In the audio playback device 90, four audio output sites 100 are provided. n 8 output devices 15 corresponding to each of nm And speaker 16 nm A block BK n (N = 1, 2, 3, 4) and one wall surface is formed.
[0114]
The trigger monitoring site 91 has the same function as the trigger monitoring site 12 described above, and also has the same function as the control site 11 described above, and further stores a movie file MF consisting of a predetermined video in a storage means (not shown). Thus, it also functions as a cinema distribution site for distributing the movie file MF. The trigger monitoring site 91 can communicate with the outside according to a predetermined protocol such as TCP / IP or UDP, and the audio output site 100 via the network NT. n It is possible to send and receive signals to and from. The trigger monitoring site 91 is an environment in which the monitoring program Sv can be executed. When a playback command is instructed by the user via a user interface UI including a predetermined operation unit, display unit, and the like, the monitoring program 91 Audio file AF under the control of Sv execution n Control information indicating the reproduction instruction of the voice output site 100 via the network NT n The image processing unit 93 performs predetermined image processing on the movie file MF, supplies it to the projector PJ as video data IM while synchronizing with the audio file AF, and displays it on the screen in the entertainment theater ETH. Project. The movie file MF stored in the trigger monitoring site 91 may be compressed in a predetermined format or may be uncompressed, and is decoded by the image processing unit 93.
[0115]
The trigger monitoring site 91 is at least the audio output site 20. n Or more, that is, a sound processing unit 92 such as a sound card capable of inputting and processing audio signals of four or more channels, and through this sound processing unit 92, the audio output site 100 n Trigger signal TG output from n Can be received. The trigger monitoring site 91 performs processing in the sound processing unit 92 in synchronization with a word clock WCLK supplied from the word clock generator 14 or a trigger external signal sufficient to synchronize each sample in units of words.
[0116]
The trigger monitoring site 91 controls the audio output site 100 under the execution control of the monitoring program Sv. n As described later, the trigger signal TG embedded in the audio signal is analyzed. n To monitor. The trigger monitoring site 91 generates a trigger signal TG n Is detected, these trigger signals TG n Based on the voice output site 100 n The number of delayed samples Sd corresponding to each n And the number of delayed samples Sd n The information about the number of delayed samples indicating that the voice output site 100 via the network NT n Respectively.
[0117]
Audio output site 100 n Are the audio output sites 20 described above, respectively. n Similarly to the sound processing unit 101 such as a sound card that can output and process an 8-channel audio signal, for example. 1 , 101 2 , ..., 101 8 (Hereinafter, the sound processing unit 101 n (N = 1, 2,..., 8) ). Audio output site 100 n Can transmit / receive signals to / from the trigger monitoring site 91 via the network NT according to a predetermined protocol such as TCP / IP or UDP. Also, the audio output site 100 n Respectively, the sound processing unit 101 n For example, only the eighth channel in the output unit 15 nm The trigger monitoring site 91 is also connected to the trigger monitoring site 91, and the trigger signal TG is transmitted to the trigger monitoring site 91 using this channel. n Can be output. This trigger signal TG n As will be described later, the audio file AF is used as an audio signal. n Is embedded in. Audio output site 100 n Respectively, reproduction processing program E 1 , E 2 , ..., E 8 (Hereinafter, the reproduction processing program E n (N = 1, 2,..., 8) The sound processing unit is synchronized with a word clock WCLK supplied from the word clock generator 14 or a trigger external signal sufficient to synchronize each sample in units of words. 101 n The process in is performed. At this time, the audio output site 100 n , Each of the sound processing units 101 n It is assumed that synchronization between the first channel to the eighth channel is secured. That is, the voice output site 100 n , In the case where a reproduction instruction is received from the trigger monitoring site 91, the sound processing unit 101 n Audio signals are simultaneously output from the first channel to the eighth channel. Also, the audio output site 100 n Are stored in a storage means (not shown) in an 8-channel audio file AF. n Is remembered.
[0118]
Here, audio file AF n For example, as shown in FIG. 11, it consists of 8-channel audio signals. Audio file AF n Includes a sound signal C for movie content for each channel after a predetermined time tc. 1 , C 2 , ..., C 8 Is recorded. Furthermore, audio file AF n Includes the trigger audio signal T at a time before the time tc in the audio signal of the eighth channel. n Is recorded. This trigger audio signal T n As will be described later, each audio output site 100 n Audio file AF n By regenerating the output device 15 nm Output to each voice output site 100 n Audio signal C for movie content 1 , C 2 , ..., C 8 Before playback, the user listens. Also, the trigger audio signal T n Each of the audio output sites 100 due to variations in arrival time of control information indicating a reproduction instruction supplied from the trigger monitoring site 91 via the network NT. n It will be played back in pieces. Therefore, the trigger audio signal T n Is preferably a significant audio signal that does not become uncomfortable for the listener, even if it is reproduced with a time lag, such as a movie title sound, chime sound, or a snarling voice of a bird. In particular, the trigger audio signal T n For example, it may be actively used as a sound logo indicating that the audio playback device 90 is a system to which the present invention is applied.
[0119]
Audio signal T for trigger n For example, the trigger signal TG is indicated by a digital watermark. n Embedded in the trigger detection site 91 and the audio output site 100 n Can be detected at a specific sample value. Audio file AF n In the trigger signal TG n Is defined as the reproduction margin sample number Sm0. This reproduction margin sample number Sm0 is determined by the audio file AF. n For example, the value is calculated in consideration of a time sufficient for completing various processes to be described later. The trigger signal TG n As for the audio signal T n The trigger monitoring site 91 and the audio output site 100 need not be embedded in n Are respectively audio signals T n If it is determined that the trigger signal is a trigger signal, and the generation sample of the trigger signal can be specified, the audio signal T n The waveform itself is the trigger signal TG n You may make it treat as.
[0120]
Audio output site 100 n When receiving control information indicating a reproduction instruction supplied from the trigger monitoring site 91 via the network NT, the reproduction processing program E n Under the execution control of the audio file AF n Playback of the sound processing unit 101 n Via the output device 15 nm And speaker 16 nm And sound is emitted to the outside, and the sound processing unit 101 n An audio signal output from the eighth channel is supplied to the trigger monitoring site 91. Audio output site 100 n Respectively, audio file AF n Analysis of the trigger signal TG n And the trigger signal TG n Identify the sample in which the was embedded. At this point, the output device 15 nm And speaker 16 nm The sound emitted via the sound signal is an audio signal T output from the eighth channel. n Only, otherwise it is silent.
Also, the audio output site 100 n When the delay sample number information is received from the trigger monitoring site 91 via the network NT, the audio file AF is received based on the delay sample number. n Is skipped, playback is started again, and the output device 15 nm And speaker 16 nm Sound is emitted to the outside via
[0121]
In the audio reproducing device 90 including such units, the audio file AF n If the control information indicating the reproduction instruction is given, the audio output site 100 n Audio file AF from each of n Is played. In the audio reproduction device 90, the trigger monitoring site 91 and the audio output site 100 are displayed. n Voice file AF by n Trigger signal TG embedded in n From the trigger monitoring site 91 to the voice output site 100 n Trigger signal TG n Voice output site 100 determined based on n The number of delayed samples Sd corresponding to each n Will be notified. In the audio reproduction device 90, each audio output site 100 n By this delay sample number Sd n Based on audio file AF n Will be skipped and playback will resume from the skip destination. In the audio reproduction device 90, all the audio output sites 100 are thus obtained. n Audio file AF by n The playback start timing can be matched. Thereafter, in the audio reproduction device 90, the audio output site 100 is based on the word clock WCLK supplied from the word clock generator 14. n Multi-channel synchronized playback can be performed by proceeding with playback.
[0122]
Specifically, in the audio playback device 90, the audio output site 100 n Respectively, reproduction processing program E n And the audio file AF is performed through a series of steps shown in FIG. n Play.
[0123]
First, the audio output site 100 n As shown in the figure, in step S31, the voice file AF is sent from the trigger monitoring site 91 via the network NT in step S31. n It is determined whether or not the control information indicating the reproduction instruction is reached. Audio output site 100 n Respectively wait until the control information from the trigger monitoring site 91 arrives, and when the control information is received, the process proceeds to step S32.
[0124]
Audio output site 100 n Respectively, in step S32, the sound processing unit 101 n Audio file AF via n Play.
[0125]
At the same time, the audio output site 100 n Respectively, in step S33, the audio file AF n Trigger signal TG embedded in n Is detected.
[0126]
Furthermore, the audio output site 100 n Respectively, in step S34, the trigger signal TG n The count of the number of reproduction samples is started with reference to the sample specified as the sample in which is embedded. Audio output site 100 n In this case, the audio file AF is used with reference to the count start sample. n The playback start timing is determined.
[0127]
And the audio output site 100 n Respectively continues to count the number of reproduced samples in step S35, and in step S36, the corresponding delayed sample number Sd from the trigger monitoring site 91. n It is determined whether or not the delayed sample number information indicating is reached via the network NT.
[0128]
Here, if the delayed sample number information has not arrived, the audio output site 100 n Each repeats the process of step S35.
[0129]
On the other hand, when the delayed sample number information arrives, the audio output site 100 n Respectively, in step S37, the number of delayed samples Sd n Only audio file AF n The playback is skipped, the playback is restarted from the skip destination time, and the series of processes is terminated.
[0130]
In this way, in the audio reproduction device 90, the audio output site 100 is displayed. n Each of the reproduction processing program E n And execute the audio file AF n The reproduction of the audio signal for the movie content in can be started simultaneously. In the audio playback device 90, the audio output site 100 is thereafter used. n Are respectively based on the word clock WCLK supplied from the word clock generator 14. n By proceeding with the playback, multi-channel synchronized playback becomes possible.
[0131]
On the other hand, in the audio reproduction device 90, the trigger monitoring site 91 executes the monitoring program Sv and goes through a series of steps shown in FIG. n The number of delayed samples Sd corresponding to each n Can be requested.
[0132]
First, as shown in the figure, the trigger monitoring site 91 sends control information indicating a reproduction instruction to the audio output site 100 in step S41. n Notify each of them.
[0133]
Subsequently, the trigger monitoring site 91 determines that the voice output site 100 in step S42. n Audio file AF output to each channel in the sound processing unit 92 from n Monitor incoming traffic.
[0134]
Subsequently, in step S43, the trigger monitoring site 91 assigns the audio file AF to any one of the four channels in the sound processing unit 92. n It is determined whether any of the above has been supplied.
[0135]
Here, audio file AF n If any of the above is not supplied, the trigger monitoring site 91 shifts the processing to step S42, and the audio file AF n Continue to monitor until either of them is supplied.
[0136]
On the other hand, audio file AF n If any of the above is supplied, the trigger monitoring site 91 determines in step S44 the audio file AF. n Trigger signal TG embedded in n Is detected.
[0137]
Subsequently, in step S45, the trigger monitoring site 91 detects the detected trigger signal TG. n Is the first audio file AF supplied n The trigger signal TG for the first time. n Whether or not has been detected is determined.
[0138]
Here, the trigger signal TG n If is not the first detected, the trigger monitoring site 91 proceeds to step S47. On the other hand, trigger signal TG n Is detected first, the trigger monitoring site 91 determines that the trigger signal TG detected first in step S46. n Counting the number of input samples is started using the sample at the time when is input as a reference sample, and the process proceeds to step S47. At the trigger monitoring site 91, another trigger signal TG is counted by counting the number of input samples based on this reference sample. n Will be measured.
[0139]
Then, in step S47, the trigger monitoring site 91 determines the count value that has started counting from the reference sample as the base point in step S46 as the number of delayed samples Sd. n Trigger signal TG n Corresponding audio output site 100 n For this delay sample number Sd n Is output via the network NT. It should be noted that the trigger monitoring site 91 starts with the audio file AF n Output site 100 that outputs n Is the number of delayed samples Sd n Needless to say, 0 is notified.
[0140]
Subsequently, the trigger monitoring site 91 continues to count the number of input samples in step S48, and in step S49, all the audio output sites 100 are monitored. n To trigger signal TG n Is received.
[0141]
Here, all audio output sites 100 n To trigger signal TG n Is not received, the trigger monitoring site 91 repeats the processing from step S42 to step S48.
[0142]
On the other hand, all audio output sites 100 n To trigger signal TG n Is received, the trigger monitoring site 91 ends the series of processes as it is.
[0143]
Audio output site 100 n Either of the trigger signal TG due to failure etc. n May not be given to the trigger monitoring site 91. In this case, the trigger monitoring site 91 may appropriately exit the loop process that moves from step S49 to step S42.
[0144]
In this way, in the audio reproduction device 90, the trigger monitoring site 91 executes the monitoring program Sv, and the audio output site 100 n The number of delayed samples Sd corresponding to each n Voice output site 100 n It is possible to realize synchronized playback by means of. The trigger monitoring site 91 performs image processing on the movie file MF by the image processing unit 93 during this series of processing, and the audio output site 100. n Audio file AF by n The video data IM is projected onto the screen in the entertainment theater ETH via the projector PJ in synchronization with the start of reproduction of the audio signal for the movie content at.
[0145]
Trigger monitoring site 91 and audio output site 100 for executing such a program n In the audio reproducing device 90 having the above, each operation is performed in cooperation according to the timing shown in FIG. 14, for example.
[0146]
That is, in the audio reproduction device 90, the trigger monitoring site 91 and the audio output site 100 are based on the word clock WCLK generated by the word clock generator 14. n Works. In the audio reproduction device 90, as shown in the upper part of the figure, when a reproduction command is instructed via the user interface UI, control information indicating the reproduction instruction is transmitted from the trigger monitoring site 91 to the audio output site 100. n Are notified via the network NT. As described above, the absolute time at which this control information arrives is due to the influence of network traffic, etc. n Variation occurs between the two. Here, as shown in the middle of FIG. 1 Receives the control information earliest and the voice output site 100 4 , Voice output site 100 2 It is assumed that the control information is received in the following order.
[0147]
Then, in the audio reproduction device 90, as described above, the audio output site 100 n Voice file AF n Is played. This audio output site 100 n Audio file AF from each of n As described above, the absolute time at which is played is the audio output site 100. n Sound processing unit 101 n Voice output site 100 due to the difference in the processing capacity of the CPU or the like (not shown). n Variation occurs between the two. Here, as shown in the middle of FIG. 1 Is the earliest voice file AF 1 Playback starts, and after that, the audio output site 100 4 , Voice output site 100 2 Audio file AF in the order 4 , AF 2 It is assumed that the playback of has started.
[0148]
Then, in the audio reproduction device 90, as described above, the audio output site 100 n Audio file AF by each of n Trigger signal TG embedded in n Is detected, and the trigger signal TG is also detected by the trigger monitoring site 91. n Is detected. Here, as shown in the lower part of FIG. 1 Trigger signal TG at 1 , And then trigger signal TG 4 , TG 2 Detected in the following order. Audio output site 100 n Respectively, these trigger signals TG n Sample S when is identified n Is used as a reference to start counting the number of playback samples. Also, here, the trigger signal TG is the earliest 1 Sample S with detected 1 Is the reference sample. The trigger monitoring site 91 also includes a sample S that is a reference sample. 1 Starts counting the number of input samples, and as shown in the lower part of FIG. n Is calculated. In the audio reproduction device 90, the number of delayed samples Sd n Voice output site 100 that corresponds to n Will be notified. This delayed sample number Sd n As described above, the absolute time at which the message reaches the voice output site 100 is due to the influence of network traffic or the like. n Variation occurs between the two. Here, as shown in the middle of FIG. 1 Is the earliest to receive late sample number information, voice output site 100 2 , Voice output site 100 4 It is assumed that the delayed sample number information is received in the following order.
[0149]
In the audio reproduction device 90, the audio output site 100 is displayed. n The number of delayed samples Sd n Only audio file AF n Playback is skipped, and playback is resumed from the point of the skip destination. At this time, the above-described reproduction margin sample number Sm0 is at least the following step, that is, the audio output site 100 that has received the control information indicating the reproduction instruction. n Is audio file AF n , The trigger monitoring site 91 is connected to all the audio output sites 100. n To trigger signal TG n The trigger monitoring site 91 receives the voice output site 100. n The number of delayed samples Sd for each n And all audio output sites 100 n Is late sample number Sd n And the skipped sample is an audio signal unrelated to the movie content, i.e. 11 is an audio signal included from time tt to time tc shown in FIG. In the sound reproducing device 90, the trigger monitoring site 91 firstly executes the trigger signal TG. n Sample S at the time when is detected n Audio file AF from the sample that has elapsed from the number of playback margin samples Sm0 n Audio signal C for movie content 1 , C 2 , ..., C 8 Playback starts simultaneously.
[0150]
In the audio playback device 90, the audio output site 100 n Audio signal C for movie content in between 1 , C 2 , ..., C 8 After that, the audio file AF is maintained while maintaining the synchronization based on the word clock WCLK generated by the word clock generator 14. n Proceed with playback.
[0151]
As described above, the audio reproduction device 90 shown as the fifth exemplary embodiment of the present invention is the audio output site 100. n Sound processing unit 101 n Among them, the trigger signal TG n Without providing a dedicated trigger channel for outputting the audio signal, it can be shared with the channel for outputting the audio signal, and the synchronized reproduction of the audio signal can be performed efficiently.
[0152]
As described above, the audio reproduction apparatuses shown as the first to fifth embodiments of the present invention can be configured at low cost using a plurality of general-purpose hardware, and have a processing capability and a channel. Synchronous reproduction of multi-channel audio signals that could not be realized in the past due to the limitation of the number or the like can be performed accurately. Therefore, by applying the audio reproducing apparatus to an entertainment system such as a movie theater or a game, for example, it is possible to realize a highly realistic sound reproduction with a simple configuration.
[0153]
In addition, this invention is not limited to embodiment mentioned above, For example, various changes are possible as described in the end of 1st Embodiment mentioned above and 2nd Embodiment. This is applicable to other embodiments as needed.
[0154]
In the present invention, any of the first to fifth embodiments described above may be appropriately combined within a possible range.
[0155]
Thus, it goes without saying that the present invention can be modified as appropriate without departing from the spirit of the present invention.
[0156]
【The invention's effect】
As described above in detail, the audio reproduction device according to the present invention is an audio reproduction device that synchronously reproduces audio signals of a plurality of channels, and is synchronized with the reference signal generating means for generating a predetermined reference signal. A plurality of audio output means for reproducing and outputting the audio signal via an audio output processor capable of processing the output of the multi-channel audio signal, and at least the audio in synchronism with the reference signal Reproduction timing of the audio signal in each of the audio output means, which is a signal supplied for at least one channel from each of the audio output means via an audio input processor capable of inputting and processing audio signals equal to or more than the number of output means. And a replay signal monitoring means for monitoring the arrival of the replay signal for providing the sound, and the replay signal monitoring means is supplied from each of the sound output means. The relative deviation times for the input times of the number of replay signals are obtained, and time information indicating the deviation times is notified to each of the audio output means, and each of the audio output means performs audio based on the time information. Determine when to start playing the signal.
[0157]
Therefore, the audio reproduction device according to the present invention is a timing at which reproduction of an audio signal should be started based on time information indicating a relative shift time with respect to input times of a plurality of replay signals corresponding to each of the audio output means. Therefore, even when a plurality of general-purpose hardware is used, it is possible to accurately perform synchronized reproduction of multi-channel audio signals.
[0158]
The audio reproduction method according to the present invention is an audio reproduction method for synchronously reproducing audio signals of a plurality of channels, and an audio output processor capable of performing output processing of the audio signals of a plurality of channels in synchronization with a predetermined reference signal. Through which the audio signal is reproduced and output from each of a plurality of audio output means that are not synchronized with each other and supplied for at least one channel, and the reproduction timing of the audio signal in each of the audio output means The sounding signal for providing the sounding signal is input to the sounding signal monitoring means via the sound input processor capable of inputting and processing at least the number of sound signals equal to the number of the sound output means in synchronization with the reference signal. A deviation time calculation step for obtaining a relative deviation time with respect to input times of a plurality of replay signals supplied from each, and time information indicating the deviation time Based on, and a playback start timing determination step of determining when to start playing the audio signal.
[0159]
Therefore, in the audio reproduction method according to the present invention, the timing at which the reproduction of the audio signal should be started based on the time information indicating the relative shift time with respect to the input times of the plurality of replay signals corresponding to the respective audio output means. Therefore, even when a plurality of general-purpose hardware is used, it is possible to accurately perform synchronized reproduction of multi-channel audio signals.
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating a configuration of an audio reproducing device shown as a first embodiment of the present invention.
FIG. 2 is a flowchart for explaining a series of steps until playback of an audio file is started at an audio output site provided in the audio playback apparatus.
FIG. 3 is a flowchart for explaining a series of steps when obtaining the number of delayed samples corresponding to each of the audio output sites at the trigger monitoring site provided in the audio reproduction apparatus.
FIG. 4 is a diagram for explaining an operation timing of each unit in the audio reproduction device.
FIG. 5 is a block diagram illustrating a configuration of an audio reproduction device shown as a second embodiment of the present invention.
FIG. 6 is a flowchart for explaining a series of steps until playback of an audio stream is started at an audio output site provided in the audio playback apparatus.
FIG. 7 is a block diagram illustrating a configuration of an audio reproducing device shown as a third embodiment of the present invention.
FIG. 8 is a block diagram illustrating the configuration of the audio reproduction device, and in particular, a block diagram illustrating a configuration of a signal processing unit included in the audio output site.
FIG. 9 is a block diagram illustrating a configuration of an audio reproducing device shown as a fourth embodiment of the present invention.
FIG. 10 is a block diagram illustrating a configuration of an audio reproducing device shown as a fifth embodiment of the present invention.
FIG. 11 is a diagram illustrating the structure of an audio file.
FIG. 12 is a flowchart for explaining a series of steps for reproducing an audio file at an audio output site provided in the audio reproducing apparatus.
FIG. 13 is a flowchart for describing a series of steps when obtaining the number of delayed samples corresponding to each of the audio output sites at the trigger monitoring site provided in the audio reproduction apparatus.
FIG. 14 is a diagram for explaining the operation timing of each unit in the audio reproduction device.
[Explanation of symbols]
10, 30, 50, 70, 90 Audio playback device, 11 Control site, 12, 73, 91 Trigger monitoring site, 13, 21 n , 41 n , 61 n , 72, 74, 81 n , 92, 101 n Sound processor, 14 word clock generator, 15 nm Output device, 16 nm Speaker, 20 n , 40 n , 60 n , 80 n , 100 n Audio output site, 31 distribution site, 51, 71 source output site, 62 nm Signal processing unit, 93 image processing unit

Claims (19)

複数チャンネルの音声信号を同期再生する音声再生装置であって、
所定の基準信号を生成する基準信号生成手段と、
上記基準信号に同期して複数チャンネルの音声信号を出力処理可能な音声出力処理器を介して、上記音声信号を再生して出力する互いに同期が確保されていない複数の音声出力手段と、
上記基準信号に同期して少なくとも上記音声出力手段の数以上の音声信号を入力処理可能な音声入力処理器を介して、上記音声出力手段のそれぞれから少なくとも1チャンネル分だけ供給される信号であって上記音声出力手段のそれぞれにおける上記音声信号の再生タイミングを与えるための予行信号の入来を監視する予行信号監視手段とを備え、
上記予行信号監視手段は、上記音声出力手段のそれぞれから供給された複数の予行信号の入力時間についての相対的なずれ時間を求め、上記ずれ時間を示す時間情報を、上記音声出力手段のそれぞれに対して通知し、
上記音声出力手段は、それぞれ、上記時間情報に基づいて、上記音声信号の再生を開始すべきタイミングを決定すること
を特徴とする音声再生装置。
An audio reproduction device for synchronously reproducing audio signals of a plurality of channels,
A reference signal generating means for generating a predetermined reference signal;
A plurality of audio output means for reproducing and outputting the audio signal via an audio output processor capable of outputting and processing audio signals of a plurality of channels in synchronization with the reference signal;
A signal that is supplied for at least one channel from each of the audio output means via an audio input processor that can input and process at least audio signals equal to or greater than the number of the audio output means in synchronization with the reference signal. Replay signal monitoring means for monitoring the arrival of a replay signal for giving the reproduction timing of the sound signal in each of the sound output means,
The recurring signal monitoring means obtains a relative shift time for the input times of a plurality of replay signals supplied from each of the sound output means, and sets time information indicating the shift time to each of the sound output means. Notification to
Each of the audio output means determines a timing at which reproduction of the audio signal should be started based on the time information.
上記予行信号監視手段は、所定のプロトコルにしたがった汎用ネットワークを介して、上記時間情報を上記音声出力手段のそれぞれに対して通知すること
を特徴とする請求項1記載の音声再生装置。
2. The sound reproducing apparatus according to claim 1, wherein the replay signal monitoring means notifies the time information to each of the sound output means via a general-purpose network according to a predetermined protocol.
上記予行信号監視手段は、上記基準信号に同期して少なくとも上記音声出力手段の数以上の音声信号を出力処理可能な音声出力処理器を介して、上記時間情報を上記音声出力手段のそれぞれに対して通知し、
上記音声出力手段は、それぞれ、上記基準信号に同期して音声信号を入力処理可能な音声入力処理器を介して、上記時間情報を入力すること
を特徴とする請求項1記載の音声再生装置。
The recurring signal monitoring means outputs the time information to each of the audio output means via an audio output processor capable of outputting at least audio signals equal to or greater than the number of the audio output means in synchronization with the reference signal. Notify
2. The audio reproduction apparatus according to claim 1, wherein each of the audio output means inputs the time information via an audio input processor capable of performing an input process on the audio signal in synchronization with the reference signal.
上記音声出力手段は、それぞれ、上記音声出力処理器が出力処理可能なチャンネルのうち、上記予行信号を出力するためのチャンネルを専用に設けていること
を特徴とする請求項1記載の音声再生装置。
2. The audio reproducing apparatus according to claim 1, wherein each of the audio output means is provided with a channel for outputting the replay signal among channels that can be output by the audio output processor. .
上記音声出力手段は、それぞれ、上記音声信号の再生指示を示す制御情報が入力されると、上記予行信号を上記予行信号監視手段に出力すること
を特徴とする請求項1記載の音声再生装置。
2. The audio reproduction apparatus according to claim 1, wherein the audio output means outputs the advance signal to the advance signal monitoring means when control information indicating an instruction to reproduce the audio signal is input.
所定のプロトコルにしたがった汎用ネットワークを介して、上記制御情報を上記音声出力手段のそれぞれに通知する制御手段を備えること
を特徴とする請求項5記載の音声再生装置。
6. The sound reproducing apparatus according to claim 5, further comprising a control means for notifying each of the sound output means of the control information via a general-purpose network according to a predetermined protocol.
上記音声出力手段は、それぞれ、上記音声出力処理器が出力処理可能なチャンネルのうち、上記予行信号を出力するためのチャンネルを専用に設けており、
上記音声出力手段は、それぞれ、上記音声出力処理器が出力処理可能なチャンネル数から上記予行信号を出力するためのチャンネル数を差し引いたチャンネル数分の音声信号を記憶する記憶手段を有すること
を特徴とする請求項1記載の音声再生装置。
Each of the audio output means is provided with a dedicated channel for outputting the replay signal among the channels that can be output by the audio output processor,
Each of the audio output means has storage means for storing audio signals for the number of channels obtained by subtracting the number of channels for outputting the replay signal from the number of channels that can be processed by the audio output processor. The sound reproducing apparatus according to claim 1.
上記音声信号を配信する配信手段を備え、
上記音声出力手段は、それぞれ、上記音声出力処理器が出力処理可能なチャンネルのうち、上記予行信号を出力するためのチャンネルを専用に設けており、
上記音声出力手段には、それぞれ、上記音声出力処理器が出力処理可能なチャンネル数から上記予行信号を出力するためのチャンネル数を差し引いたチャンネル数分の音声信号が、上記配信手段から配信されること
を特徴とする請求項1記載の音声再生装置。
A delivery means for delivering the audio signal;
Each of the audio output means is provided with a dedicated channel for outputting the replay signal among the channels that can be output by the audio output processor,
The audio output means distributes audio signals for the number of channels obtained by subtracting the number of channels for outputting the replay signal from the number of channels that can be output by the audio output processor. The sound reproducing apparatus according to claim 1.
上記配信手段は、所定のプロトコルにしたがった汎用ネットワークを介して、上記音声信号を上記音声出力手段のそれぞれに対して配信すること
を特徴とする請求項8記載の音声再生装置。
9. The audio reproducing apparatus according to claim 8, wherein the distribution unit distributes the audio signal to each of the audio output units via a general-purpose network according to a predetermined protocol.
所定チャンネルのソース信号とされる音声信号を、上記音声出力手段のそれぞれに対して配信するソース出力手段を備え、
上記音声出力手段は、それぞれ、上記ソース出力手段から配信された上記音声信号に対してチャンネル単位で所定の信号処理を施す複数の信号処理手段を有すること
を特徴とする請求項1記載の音声再生装置。
Source output means for delivering an audio signal to be a source signal of a predetermined channel to each of the audio output means,
2. The audio reproduction device according to claim 1, wherein each of the audio output means includes a plurality of signal processing means for performing predetermined signal processing on a channel basis for the audio signal distributed from the source output means. apparatus.
上記ソース出力手段は、所定のプロトコルにしたがった汎用ネットワークを介して、上記音声信号を上記音声出力手段のそれぞれに対して配信すること
を特徴とする請求項10記載の音声再生装置。
11. The audio reproduction apparatus according to claim 10, wherein the source output unit distributes the audio signal to each of the audio output units via a general-purpose network according to a predetermined protocol.
上記ソース出力手段は、上記基準信号に同期して音声信号を出力処理可能な音声出力処理器を介して、上記音声信号を上記音声出力手段のそれぞれに対して配信し、
上記音声出力手段は、それぞれ、上記基準信号に同期して音声信号を入力処理可能な音声入力処理器を介して、上記ソース出力手段から配信された上記音声信号を入力すること
を特徴とする請求項10記載の音声再生装置。
The source output means distributes the audio signal to each of the audio output means via an audio output processor capable of outputting the audio signal in synchronization with the reference signal,
The audio output means inputs the audio signal distributed from the source output means via an audio input processor capable of performing input processing on the audio signal in synchronization with the reference signal. Item 13. The audio playback device according to Item 10.
上記ソース出力手段は、上記信号処理手段のそれぞれにおける信号処理の内容を示す制御情報を上記音声出力手段のそれぞれに対して通知し、
上記信号処理手段は、それぞれ、上記制御情報に応じて、信号処理のパラメータを変更すること
を特徴とする請求項10記載の音声再生装置。
The source output means notifies the audio output means of control information indicating the contents of signal processing in each of the signal processing means,
11. The audio reproduction device according to claim 10, wherein each of the signal processing means changes a signal processing parameter in accordance with the control information.
上記ソース出力手段は、所定のプロトコルにしたがった汎用ネットワークを介して、上記制御情報を上記音声出力手段のそれぞれに対して通知すること
を特徴とする請求項13記載の音声再生装置。
14. The audio reproduction apparatus according to claim 13, wherein the source output means notifies the control information to each of the audio output means via a general-purpose network according to a predetermined protocol.
上記ソース出力手段は、上記基準信号に同期して音声信号を出力処理可能な音声出力処理器を介して、上記制御情報を上記音声出力手段のそれぞれに対して通知し、
上記音声出力手段は、それぞれ、上記基準信号に同期して音声信号を入力処理可能な音声入力処理器を介して、上記制御情報を入力すること
を特徴とする請求項13記載の音声再生装置。
The source output means notifies the control information to each of the audio output means via an audio output processor capable of outputting an audio signal in synchronization with the reference signal,
14. The audio reproduction apparatus according to claim 13, wherein the audio output means inputs the control information via an audio input processor that can input and process an audio signal in synchronization with the reference signal.
上記予行信号は、上記音声信号に埋め込まれており、
上記予行信号監視手段は、上記音声入力処理器を介して、上記音声出力手段のそれぞれから再生された上記音声信号を入力し、上記音声信号に埋め込まれている上記予行信号を検出し、上記ずれ時間を求めること
を特徴とする請求項1記載の音声再生装置。
The replay signal is embedded in the audio signal,
The replay signal monitoring means inputs the sound signal reproduced from each of the sound output means via the sound input processor, detects the replay signal embedded in the sound signal, and detects the deviation. 2. The audio reproducing apparatus according to claim 1, wherein time is obtained.
上記予行信号は、電子透かしによって上記音声信号に埋め込まれていること
を特徴とする請求項16記載の音声再生装置。
17. The audio reproduction device according to claim 16, wherein the replay signal is embedded in the audio signal by digital watermark.
上記音声出力手段は、それぞれ、上記音声出力処理器における上記予行信号を出力するためのチャンネルと、上記音声信号を出力するためのチャンネルとを共用していること
を特徴とする請求項1記載の音声再生装置。
2. The audio output means shares a channel for outputting the replay signal and a channel for outputting the audio signal in the audio output processor, respectively. Audio playback device.
複数チャンネルの音声信号を同期再生する音声再生方法であって、
所定の基準信号に同期して複数チャンネルの音声信号を出力処理可能な音声出力処理器を介して、上記音声信号を再生して出力する互いに同期が確保されていない複数の音声出力手段のそれぞれから少なくとも1チャンネル分だけ供給される信号であって、上記音声出力手段のそれぞれにおける上記音声信号の再生タイミングを与えるための予行信号を、上記基準信号に同期して少なくとも上記音声出力手段の数以上の音声信号を入力処理可能な音声入力処理器を介して予行信号監視手段に対して入力し、上記音声出力手段のそれぞれから供給された複数の予行信号の入力時間についての相対的なずれ時間を求めるずれ時間算出工程と、
上記ずれ時間を示す時間情報に基づいて、上記音声信号の再生を開始すべきタイミングを決定する再生開始タイミング決定工程とを備えること
を特徴とする音声再生方法。
An audio reproduction method for synchronously reproducing audio signals of multiple channels,
From each of a plurality of audio output means that are not synchronized with each other and that reproduce and output the audio signal via an audio output processor that can output and process audio signals of a plurality of channels in synchronization with a predetermined reference signal A signal supplied for at least one channel, and a replay signal for giving the reproduction timing of the audio signal in each of the audio output means is at least equal to the number of the audio output means in synchronization with the reference signal An audio signal is input to the advance signal monitoring unit via an input processor capable of input processing, and a relative shift time with respect to input times of a plurality of advance signals supplied from each of the audio output units is obtained. Deviation time calculation step;
And a reproduction start timing determining step for determining a timing at which reproduction of the audio signal should be started based on time information indicating the deviation time.
JP2001191774A 2001-06-25 2001-06-25 Audio reproduction apparatus and audio reproduction method Expired - Fee Related JP4543586B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001191774A JP4543586B2 (en) 2001-06-25 2001-06-25 Audio reproduction apparatus and audio reproduction method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001191774A JP4543586B2 (en) 2001-06-25 2001-06-25 Audio reproduction apparatus and audio reproduction method

Publications (2)

Publication Number Publication Date
JP2003009298A JP2003009298A (en) 2003-01-10
JP4543586B2 true JP4543586B2 (en) 2010-09-15

Family

ID=19030341

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001191774A Expired - Fee Related JP4543586B2 (en) 2001-06-25 2001-06-25 Audio reproduction apparatus and audio reproduction method

Country Status (1)

Country Link
JP (1) JP4543586B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007124380A (en) * 2005-10-28 2007-05-17 Nec Corp Stereophonic output system, stereophonic output method, and program for stereophonic output
JP4757704B2 (en) * 2006-05-01 2011-08-24 任天堂株式会社 Music playback program, music playback device, music playback method, and music playback system
US8903526B2 (en) 2012-06-06 2014-12-02 Sonos, Inc. Device playback failure recovery and redistribution
JP6229576B2 (en) * 2014-04-03 2017-11-15 ヤマハ株式会社 Sampling frequency estimation device

Also Published As

Publication number Publication date
JP2003009298A (en) 2003-01-10

Similar Documents

Publication Publication Date Title
JP6945590B2 (en) Systems and methods for synchronizing operations between multiple independently clocked digital data processing devices
JP5149012B2 (en) Synchronizing multi-channel speakers on the network
US7434154B2 (en) Systems and methods for synchronizing media rendering
JP4333655B2 (en) Content receiving apparatus and content receiving method
CA2438194C (en) Live navigation web-conferencing system and method
US8677002B2 (en) Streaming media system and method
US20150254340A1 (en) Capability Scoring Server And Related Methods For Interactive Music Systems
JP2004104796A (en) Synchronous reproduction of media data packet
JP2009535988A (en) System and method for processing data signals
JP2012129800A (en) Information processing apparatus and method, program, and information processing system
JP4543586B2 (en) Audio reproduction apparatus and audio reproduction method
JP7024794B2 (en) Audio systems, audio equipment, and how to control audio equipment
JP2008060675A (en) Sound reproduction device and method
CN102394860A (en) Signal transmission system, method, computer program product and computer readable storage media
CN108282720B (en) Audio data stream transmission method and device
JP4967945B2 (en) Terminal device and data distribution system
US20210125594A1 (en) Wireless midi headset
JP5397495B2 (en) Data distribution system and relay device
JP5489900B2 (en) Acoustic data communication device
JP2010218013A (en) Data distribution system
JP2004094683A (en) Server, communication method, and spectator terminal
JP2008097096A (en) Server device and communication session establishment method
JP4422656B2 (en) Remote multi-point concert system using network
WO2017221407A1 (en) Synchronization setting device, distribution system, synchronization setting method, and program
JP4071140B2 (en) Data communication apparatus, method and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100608

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100621

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130709

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130709

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees