JP2023179125A - Digital audio signal synchronization device and program - Google Patents
Digital audio signal synchronization device and program Download PDFInfo
- Publication number
- JP2023179125A JP2023179125A JP2022092224A JP2022092224A JP2023179125A JP 2023179125 A JP2023179125 A JP 2023179125A JP 2022092224 A JP2022092224 A JP 2022092224A JP 2022092224 A JP2022092224 A JP 2022092224A JP 2023179125 A JP2023179125 A JP 2023179125A
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- digital audio
- data
- pcm data
- synchronization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 125
- 238000012545 processing Methods 0.000 claims abstract description 33
- 238000005070 sampling Methods 0.000 claims description 25
- 238000000034 method Methods 0.000 claims description 20
- 230000008569 process Effects 0.000 claims description 15
- 238000006243 chemical reaction Methods 0.000 claims description 10
- 238000003780 insertion Methods 0.000 abstract description 5
- 230000037431 insertion Effects 0.000 abstract description 5
- 230000000717 retained effect Effects 0.000 abstract description 5
- 230000001360 synchronised effect Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 9
- 238000009825 accumulation Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003139 buffering effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 229910052701 rubidium Inorganic materials 0.000 description 1
- IGLNJRXAVVLDKE-UHFFFAOYSA-N rubidium atom Chemical compound [Rb] IGLNJRXAVVLDKE-UHFFFAOYSA-N 0.000 description 1
Images
Landscapes
- Synchronisation In Digital Transmission Systems (AREA)
Abstract
Description
本発明は、異なる同期系で動作している複数のシステムの組み合わせにより構成されている大規模な設備において、一のシステムが異なる同期系のデジタル音声信号を受信した場合であっても、ビット単位で前記デジタル音声信号のデータが保持されている状態で、受信したシステムの同期に引き込むことのできるデジタル音声信号同期装置及びプログラムに関する。 In a large-scale facility configured by a combination of a plurality of systems operating in different synchronization systems, the present invention enables bit-by-bit processing even when one system receives digital audio signals of different synchronization systems. The present invention relates to a digital audio signal synchronization device and a program that can synchronize a system that receives the digital audio signal while the data of the digital audio signal is held.
始めに、本明細書において用いる略語を解説する。
「ADM」は、Audio Definition Modelの略であり、オーディオの技術的特性を記述するための標準化されたメタデータモデルである。「S-ADM」は、Serial Audio Definition Modelの略である。
「AES」は、Audio Engineering Society(オーディオ技術者協会)の略であり、同協会が定めた規格には「AES」が冠される。
「IEC」は、International Electrotechnical Commission(国際電気標準会議)の略であり、同会議が定めた規格にも「IEC」が冠される。
「MADI」は、Multichannel Audio Digital Interfaceの略であり、サンプル単位の精度でマルチチャンネルの長距離オーディオ伝送を可能とするインターフェイス技術の規格(AES10)である。2001年に拡張された「MADI-X(MADI-Extended)」では、チャンネル数は64チャンネル、サンプリングレートは48kHz±1%のバリピッチがサポートされた。
「PCM」は、Pulse Code Modulation(パルス符号変調)の略である。
「SDI」は、Serial Digital Interfaceの略である。
「SMPTE」は、the Society of Motion Picture and Television Engineers(映画テレビ技術者協会)の略であるとともに、同協会が定めた規格に冠される記号でもある。
「ST」は、Standard(標準、規格)の略である。
First, abbreviations used in this specification will be explained.
“ADM” stands for Audio Definition Model, and is a standardized metadata model for describing the technical characteristics of audio. "S-ADM" is an abbreviation for Serial Audio Definition Model.
"AES" is an abbreviation for Audio Engineering Society, and standards established by the association are prefixed with "AES."
"IEC" is an abbreviation for International Electrotechnical Commission, and the standards established by the same commission are also prefixed with "IEC."
"MADI" is an abbreviation for Multichannel Audio Digital Interface, and is an interface technology standard (AES10) that enables multi-channel long-distance audio transmission with sample-level accuracy. MADI-X (MADI-Extended), which was expanded in 2001, supported variable pitch with a sampling rate of 48kHz±1% and 64 channels.
"PCM" is an abbreviation for Pulse Code Modulation.
"SDI" is an abbreviation for Serial Digital Interface.
"SMPTE" is an abbreviation for the Society of Motion Picture and Television Engineers, and is also the symbol given to the standards established by the society.
"ST" is an abbreviation for Standard.
オブジェクトベース音響を放送やストリーミングサービスで用いる場合、音声信号と音響メタデータを合わせて伝送する必要がある。その伝送方式の一つとして、シリアル表現された国際標準の音響メタデータ(S-ADM)を、業務用のデジタル音声信号として広く用いられているAES3に格納して伝送する方法が国際標準化されており(非特許文献1)、音声信号と音響メタデータをサンプル単位で同期して伝送することが可能である。 When using object-based audio in broadcasting or streaming services, it is necessary to transmit the audio signal and audio metadata together. As one of the transmission methods, the method of storing and transmitting serially expressed international standard audio metadata (S-ADM) in AES3, which is widely used as a professional digital audio signal, has been standardized internationally. (Non-Patent Document 1), it is possible to synchronize and transmit audio signals and audio metadata on a sample-by-sample basis.
この伝送方式は、AES3の音声信号を格納する領域に、PCMではなく符号化された音声信号などの非PCMのデータを格納して伝送する標準規格(非特許文献2)を元としている。格納されたデータは音声信号と同様に扱って記録・再生・伝送が可能であり、非PCMデータのために特殊な記録再生機やケーブルを用意する必要がないのが利点である。ただし、格納された非PCMのデータを正しく復号するためには、当該データが伝送前後においてビット単位で保持されている(欠落がない)必要がある。 This transmission method is based on a standard (Non-Patent Document 2) that stores and transmits non-PCM data such as encoded audio signals instead of PCM in an area for storing AES3 audio signals. The stored data can be handled and recorded, reproduced, and transmitted in the same way as audio signals, and the advantage is that there is no need to prepare a special recording/reproducing device or cable for non-PCM data. However, in order to correctly decode the stored non-PCM data, the data needs to be held in bits (no omissions) before and after transmission.
一方、放送局などの大規模な設備は、中継先から局内のスタジオ、副調整室から主調整室など、多数のシステムの組み合わせにより構成されている。異なる同期系で動作している複数のシステム間でPCMのデジタル音声信号を受け渡しする際には、当該音声信号を受信側のシステムの同期に引き込むためにサンプリングレートコンバータを挿入することが一般的である。ここで、放送局で用いる音声信号のサンプリングレートは基本的に一定値(48kHzなど)に統一されているためサンプリングレート自体は変換する必要がなく、音声信号を受信側システムの同期に引き込むことだけが目的であることが多い。 On the other hand, large-scale facilities such as broadcasting stations are made up of a combination of many systems, from relay destinations to in-house studios, sub-control rooms to main control rooms, and so on. When transferring PCM digital audio signals between multiple systems operating in different synchronization systems, it is common to insert a sampling rate converter to bring the audio signals into synchronization with the receiving system. be. Here, since the sampling rate of audio signals used by broadcasting stations is basically unified to a constant value (48 kHz, etc.), there is no need to convert the sampling rate itself; all that is required is to bring the audio signal into synchronization with the receiving system. is often the purpose.
オブジェクトベース音響の音響メタデータであるS-ADMをはじめ、符号化された音声信号などの非PCMデータを放送局などの大規模な設備内で伝送する場合、スタジオ間などで音声信号を受け渡しする際には、PCMと同様に当該音声信号を受信側の同期に引き込む必要がある。しかし従来のサンプリングレートコンバータは、受信したデジタル音声信号を一度アナログ音声信号(ないしはアナログ音声信号と同等とみなせるほどのハイサンプリングレートのデジタル音声信号)の波形に戻し(オーバーサンプリングし)、当該アナログ音声信号を受信側システムの同期信号を元に適切なサンプリングレートでリサンプリングすることで新しい同期に引き込むため、例えスタジオ間などの送受信(入出力)前後でサンプリングレートが同じ場合であってもデジタル音声信号のビット列は保持されず、S-ADMなどの非PCMのデータが伝送されていた場合にはデータに欠落が生じていた。 When transmitting non-PCM data such as S-ADM, which is acoustic metadata for object-based audio, and encoded audio signals within large-scale facilities such as broadcasting stations, audio signals are exchanged between studios, etc. In some cases, it is necessary to bring the audio signal into synchronization on the receiving side, similar to PCM. However, conventional sampling rate converters convert the received digital audio signal back into the waveform of an analog audio signal (or a digital audio signal with a high sampling rate that can be considered equivalent to an analog audio signal) (oversampling), The signal is resampled at an appropriate sampling rate based on the synchronization signal of the receiving system to bring it into new synchronization, so even if the sampling rate is the same before and after transmission and reception (input and output) between studios, digital audio The bit string of the signal is not retained, and if non-PCM data such as S-ADM was being transmitted, data would be missing.
デジタル音声信号のビット列を保持して異なる同期に引き込むために、最も単純な手段としては、元のデジタル音声信号に遅延を加えて引き込む先の同期信号にタイミングを揃えることが考えられる。しかし一般に、デジタル音声信号の生成に用いる同期信号源は、同じクロック周波数に設定されていたとしても信号源ごとにわずかな誤差が存在し、遅延を加えても正確には同期が取れずノイズを生じる原因となっていた。 In order to retain the bit string of a digital audio signal and pull it into a different synchronization, the simplest method would be to add a delay to the original digital audio signal to align the timing with the synchronization signal to which it is pulled. However, in general, synchronized signal sources used to generate digital audio signals have slight errors in each signal source even if they are set to the same clock frequency, and even if a delay is added, accurate synchronization cannot be achieved, resulting in noise. It was the cause of this.
また、元の非PCMデータを一時的に復号し、再度符号化してAES3に格納しなおすことで、ビット列自体は保持されずとも同内容のデータを受信側システムの同期系に引き込むことは可能だが、設備内の全ての同期装置に復号及び符号化の処理能力が必要となることによる装置のコスト増加の観点や、符号化・復号の繰り返しによる品質劣化の観点からも現実的ではなかった。 Also, by temporarily decoding the original non-PCM data, re-encoding it, and storing it in AES3 again, it is possible to pull the same data into the synchronization system of the receiving system even though the bit string itself is not retained. However, this was not practical from the perspective of increased equipment costs due to the need for decoding and encoding processing capabilities in all synchronization devices within the facility, and from the standpoint of quality deterioration due to repeated encoding and decoding.
係る事情を鑑みてなされた本発明の目的は、異なる同期系で動作している複数のシステムの組み合わせにより構成されている大規模な設備において、一のシステムが非PCMのデータを含む異なる同期系のデジタル音声信号を受信した場合であっても、ビット単位で前記デジタル音声信号のデータが保持されている状態で、受信したシステムの同期に引き込むことができるデジタル音声信号同期装置及びプログラムを提供することにある。 The object of the present invention, which was made in view of the above circumstances, is that in a large-scale facility configured by a combination of a plurality of systems operating in different synchronous systems, one system operates in different synchronous systems including non-PCM data. To provide a digital audio signal synchronizing device and a program capable of synchronizing a receiving system even when a digital audio signal is received, while data of the digital audio signal is held bit by bit. There is a particular thing.
本発明に係るデジタル音声信号同期装置は、入力されたデジタル音声信号を一時的に格納し、必要に応じてクリア処理を行うバッファ部と、前記入力されたデジタル音声信号と同期信号のクロック速度の違いに対応するために前記デジタル音声信号の間引き又は挿入を行うサンプル数調整部と、前記バッファ部から読み出した前記デジタル音声信号を前記同期信号に同期して再生する音声信号再生部と、を備える。 The digital audio signal synchronization device according to the present invention includes a buffer unit that temporarily stores an input digital audio signal and performs clearing processing as necessary, and a clock speed adjustment device for the input digital audio signal and the synchronization signal. A sample number adjustment section that thins out or inserts the digital audio signal in order to accommodate the difference, and an audio signal playback section that plays back the digital audio signal read from the buffer section in synchronization with the synchronization signal. .
前記バッファ部が、前記デジタル音声信号に格納された非PCMデータを一時的に格納するようにしてもよい。 The buffer unit may temporarily store non-PCM data stored in the digital audio signal.
前記バッファ部が、前記デジタル音声信号に格納された非PCMデータのデータバーストを前記デジタル音声信号のデータに基づいて検出し、前記非PCMデータが入力されていない期間で、前記バッファ部のクリア処理又は読み書きインターバルのリセットを行うようにしてもよい。 The buffer section detects a data burst of non-PCM data stored in the digital audio signal based on the data of the digital audio signal, and clears the buffer section during a period in which the non-PCM data is not input. Alternatively, the read/write interval may be reset.
前記サンプル数調整部が、入力信号と同期信号のクロック速度の違いによって生じる前記バッファ部のオーバーフロー又はアンダーフローを検出し、非PCMデータのデータバーストの間の0データ区間で、前記オーバーフローを検出した場合は0データを間引き、前記アンダーフローを検出した場合は0データを挿入することにより、前記デジタル音声信号のサンプル数を調整するようにしてもよい。 The sample number adjustment unit detects overflow or underflow of the buffer unit caused by a difference in clock speed between the input signal and the synchronization signal, and detects the overflow in a 0 data interval between data bursts of non-PCM data. The number of samples of the digital audio signal may be adjusted by thinning out 0 data when the underflow is detected, and inserting 0 data when the underflow is detected.
前記デジタル音声信号同期装置が、前記デジタル音声信号に格納された非PCMデータとPCMデータを区別しその後の処理を分けるために非PCMデータを判定する非PCMデータ判定部と、非PCMデータから区別されたPCMデータにサンプリングレートコンバート処理を加えることで前記同期信号に同期させるサンプリングレートコンバート部と、サンプリングレートコンバート処理されたPCMデータに、非PCMデータの前記バッファ部への一時的な格納によって生じる遅延と同等の遅延を加えることにより、前記PCMデータと非PCMデータのタイミングを揃える遅延部と、をさらに備えるようにしてもよい。 The digital audio signal synchronizer includes a non-PCM data determination unit that determines non-PCM data in order to distinguish between non-PCM data and PCM data stored in the digital audio signal and separate subsequent processing; A sampling rate converter synchronizes the PCM data with the synchronization signal by performing sampling rate conversion processing on the converted PCM data, and a sampling rate converter that performs sampling rate conversion processing on the PCM data, and temporarily stores non-PCM data in the buffer section. The apparatus may further include a delay unit that aligns the timings of the PCM data and non-PCM data by adding a delay equivalent to the delay.
また、本発明は、コンピュータを制御するためのプログラムであって、前記コンピュータを、前記デジタル音声信号同期装置として機能させるためのデジタル音声信号同期プログラムであってもよい。 Further, the present invention may be a program for controlling a computer, and a digital audio signal synchronization program for causing the computer to function as the digital audio signal synchronization device.
本発明によれば、異なる同期系で動作している複数のシステムの組み合わせにより構成されている大規模な設備において、一のシステムが非PCMのデータを含む異なる同期系のデジタル音声信号を受信した場合であっても、データの欠落を防ぎながら、受信したシステムの同期に引き込むことが可能となる。 According to the present invention, in a large-scale facility configured by a combination of a plurality of systems operating in different synchronous systems, one system receives digital audio signals of different synchronous systems including non-PCM data. Even in cases where data is not lost, it is possible to synchronize the receiving system while preventing data loss.
以下、図面を参照しながら本発明の実施形態について詳細に説明する。
図1は、本発明の一実施形態に係る音声信号同期装置1の構成例を示すブロック図である。図1に示す音声信号同期装置1は、バッファ部2と、サンプル数調整部3と、音声信号再生部4とを備える。
Embodiments of the present invention will be described in detail below with reference to the drawings.
FIG. 1 is a block diagram showing a configuration example of an audio signal synchronization device 1 according to an embodiment of the present invention. The audio signal synchronization device 1 shown in FIG. 1 includes a
音声信号同期装置1は、入力された非PCMデータを含むデジタル音声信号をバッファ部2に一時的に格納し、サンプル数調整部3によって入出力のクロック周波数のわずかな誤差に起因するサンプル数のずれを適切に調節したうえで、音声信号再生部4で同期信号に同期させて当該デジタル音声信号を再生する。
The audio signal synchronizer 1 temporarily stores the input digital audio signal including non-PCM data in the
音声信号同期装置1は、典型的には、同期系のデジタル音声信号を受信する側のシステムにおいて、当該システムの入力部として実装されるものである。この場合、デジタル音声信号の受信側システムにおける受信は当該システムへの入力であることから、受信側システムにおける「受信」は「入力」と同義と考えてよい。同様に、送信側システムにおける「送信」は「出力」と同義と考えてよい。ただし、ここでいう「システム」は、単一の機器である場合もあれば、複数の機器の組み合わせである場合もあることに留意する必要がある。 The audio signal synchronizer 1 is typically installed as an input section of a system that receives a synchronous digital audio signal. In this case, since reception of a digital audio signal in the receiving system is input to the system, "reception" in the receiving system may be considered to be synonymous with "input." Similarly, "transmission" in the sending system may be considered to be synonymous with "output". However, it should be noted that the "system" here may be a single device or a combination of multiple devices.
図2は、音声信号同期装置1の一の実装例を示す図であり、図3は、音声信号同期装置1の他の実装例を示す図である。図2は、異なる同期系で動作しているスタジオAとスタジオBの組み合わせにより構成されている設備を示しており、図3は、当該設備のスタジオB側のみを示している。音声信号同期装置1は、図2の実装例ではデジタル音声信号を受信する側のシステムであるスタジオBの入力部として実装されており、図3の実装例ではスタジオBにおける音声卓の入力部として実装されている。ここで、スタジオAの同期信号発生器Aが発生する同期信号とスタジオBの同期信号発生器Bが発生する同期信号は同じクロック周波数に設定されているが、わずかな誤差が存在し得るものである。 FIG. 2 is a diagram showing one implementation example of the audio signal synchronization device 1, and FIG. 3 is a diagram showing another implementation example of the audio signal synchronization device 1. FIG. 2 shows equipment configured by a combination of studio A and studio B operating in different synchronous systems, and FIG. 3 shows only the studio B side of the equipment. In the implementation example shown in FIG. 2, the audio signal synchronizer 1 is implemented as an input section of studio B, which is a system that receives digital audio signals, and in the implementation example shown in FIG. 3, it is implemented as an input section of an audio console in studio B. Implemented. Here, the sync signal generated by sync signal generator A in studio A and the sync signal generated by sync signal generator B in studio B are set to the same clock frequency, but there may be a slight error. be.
図4は、本発明の一実施形態に係る音声信号同期装置1の処理手順を示すフローチャートの例である。以下、図4のフローを参照しつつ、一つひとつの処理を説明する。 FIG. 4 is an example of a flowchart showing a processing procedure of the audio signal synchronization device 1 according to an embodiment of the present invention. Each process will be explained below with reference to the flow shown in FIG.
本発明の音声信号同期装置1はまず、入力された異なる同期系のデジタル音声信号をバッファ部2に格納する(図4のステップ101)。バッファ上でデータの書き込み・読み出しを行うために、処理全体に一定の遅延が生じるが、そのバッファ量は以降の処理に必要な最短のサイズに装置が自動で調節してもよいし、処理の余裕を確保するためにユーザが手動でサイズを決定してもよいし、入力された音声信号が映像に合わせることを前提としている場合には、映像信号の1フレームと同じ時間長になるよう決定してもよい。 The audio signal synchronizer 1 of the present invention first stores input digital audio signals of different synchronization systems in the buffer section 2 (step 101 in FIG. 4). Writing and reading data on the buffer causes a certain delay in the entire process, but the device can automatically adjust the buffer size to the shortest size required for subsequent processing, or The user may manually determine the size to ensure a margin, or if the input audio signal is assumed to match the video, the size may be determined to be the same time length as one frame of the video signal. You may.
次に、バッファ部2に格納された非PCMデータを確認し、一定時間連続した無音区間があるかどうかを判定する(ステップ102)。一定の無音区間(例えば数秒間という、非PCMデータの送信周期に対し比較的長期の区間)を検出できない場合(ステップ102で「No」)は、後述するサンプル数調整部3の処理に進む。一定以上の無音区間を検出した場合(ステップ102で「Yes」)は、非PCMデータの伝送が途切れていると判断し、バッファに蓄積されたデータをクリアして(ステップ103)、改めて入力されたデータの格納を始める。バッファ部2に蓄積されたデータを随時クリアすることで、入力される音声信号と引き込む先の同期信号のクロック周波数のわずかな誤差が蓄積されることによって生じうるバッファのオーバーフローやアンダーフローを未然に防ぐことができる。非PCMデータが途切れていなくとも、ユーザが現在バッファに格納されているデータが不要であると判断可能な場合、ユーザの意図的な操作により、強制的にバッファのクリアを行ってもよい。
Next, the non-PCM data stored in the
ここで、バッファ部2に蓄積されたデータを全てクリアせず、バッファ上のデータ書き込み位置と読み出し位置を調節することでバッファのクリアの代用としてもよい。例えば、書き込みの速度が読み出しの速度より早い場合に無音区間内で書き込みポインタを巻き戻したり、逆に読み出しの速度が書き込みの速度より早い場合に無音区間内でバッファとは別のNullデータを一時的に読み込ませたりすることでも、書き込みポインタと読み出しポインタの差分を処理開始時と同様に戻し、バッファのオーバーフローやアンダーフローを未然に防ぐことが可能である。この場合のバッファは、先頭と末尾が連結されたリングバッファなど、連続的に読み書きを行ってもバッファを使い果たすことがないものが好ましい。
Here, instead of clearing all the data accumulated in the
非特許文献2で伝送される非PCMデータは、その中身が符号化された音声信号やメタデータであるために、対応するPCMデータに比較し一般にデータ量が小さい。そこで非PCMデータは、ある程度の連続したデジタル音声信号に格納されて伝送される、いわゆるバースト伝送が行われ、次のデータバーストを送信するまでの期間は0データが埋め込まれる。非特許文献2の標準規格では、あるデータバーストから次のデータバーストまでの期間を最大4096サンプルに制限しているため、音声信号同期装置の無音区間の判定にそのまま4096サンプルを用いてもよいし、非PCMデータのデータバーストが一定の周期で入力されることが事前にわかっている場合などでは、その周期に合わせた長さを用いてもよいし、非特許文献2の標準規格で規定されるデータバーストの第4音声サンプルに記載されるデータバーストのバイト数のデータ(Pdと呼ばれる)を確認して無音区間を特定してもよい。
Since the content of the non-PCM data transmitted in
ステップ102で一定期間連続で無音を検出できない場合は、次に、サンプル数調整部3で入力信号と同期信号(出力信号)のクロック速度を比較する(ステップ104)。クロック速度を直接的に比較してもよいし、バッファの書き込みポインタ及び読み出しポインタの位置関係の変化により速度差を判断してもよい。本発明の音声信号同期装置では、入力信号と同期信号のサンプリングレートは同じに設定されていることを前提としているが、そのクロック速度のわずかな誤差、及び誤差の蓄積によるバッファのオーバーフロー又はアンダーフローを検出する(ステップ105で「オーバーフロー」又は「アンダーフロー」)。バッファ部2で逐次、バッファのクリアが行われていた場合はオーバーフロー又はアンダーフローは未然に防がれていると判断できるが、長時間非PCMデータが途切れず伝送され続けた場合など、バッファのクリアが行えなかった場合には、オーバーフロー又はアンダーフローへの対処として、サンプル数の調整(ステップ106ないし108)に進む。
If silence cannot be detected continuously for a certain period of time in
具体的には、データバーストの開始点となるデジタル音声信号のデータ(サンプル)を検出し、その直前の埋め込み区間で0データを間引くか、又は0データを挿入する。非特許文献2では、データバーストの開始点を示すため、データバーストの第1サンプルと第2サンプルに、Pa、Pbと呼ばれる特殊なデータを格納する。Pa、Pbは、例えばビット深度が16bitの時のPaは0xF872、24bitの時は0x96F872などと、デジタル音声信号のビット深度に応じたサイズのデータが規定されている。加えて、Pa、Pbの直前に4サンプル以上埋め込みの0データを連続させることも合わせて規定されている。Pa、Pbだけの2サンプルだけではPCMの音声信号や符号化されたデータが偶然Pa、Pbと同じビット列となり、データバーストが誤検出される可能性もあったが、直前の4サンプルとあわせた6サンプル(0,0,0,0,Pa,Pb)をもってデータバーストを検出することで、誤検出の可能性を実用上問題ないレベルまで下げることが可能となっている。
Specifically, data (sample) of a digital audio signal that is the starting point of a data burst is detected, and 0 data is thinned out or 0 data is inserted in the embedding section immediately before that data. In
バッファ部2で逐次、バッファのクリアが行われていた場合、あるいは入力信号と同期信号のクロック速度が極めて高い精度で一致していた時など、オーバーフロー及びアンダーフローが生じないと判断される場合(ステップ105で「それ以外」)にはサンプル数の調整を行わない。
When it is determined that overflow and underflow will not occur, such as when the buffer is being cleared sequentially in the
ここで、誤差がある程度蓄積しても、オーバーフロー又はアンダーフローが生じないうちはその誤差を許容して0データの間引き又は挿入を行わずに、バッファをクリアできるタイミングを待ってもよいし(バッファクリア優先モード)、誤差の蓄積が音声信号1サンプル分を超えた時点で逐次0データの間引き又は挿入を行ってもよい(サンプル数調整優先モード)。 Here, even if errors accumulate to a certain extent, you can accept the errors and wait for the timing when the buffer can be cleared without thinning out or inserting 0 data as long as overflow or underflow does not occur (buffer clear priority mode), zero data may be successively thinned out or inserted when the accumulation of errors exceeds one sample of the audio signal (sample number adjustment priority mode).
なお、サンプル数調整優先モードにおいて、誤差の蓄積が音声信号1サンプル分を超えた時点で逐次0データの間引き又は挿入を行う場合には、間引き/挿入する0データのサンプル数は当然に1サンプルとなる。 In addition, in the sample number adjustment priority mode, when thinning out or inserting 0 data sequentially when the accumulation of errors exceeds one sample of the audio signal, the number of samples of 0 data to be thinned out/inserted is naturally 1 sample. becomes.
これに対して、バッファクリア優先モードでは、オーバーフロー又はアンダーフローが生じないうちは誤差を許容するので基本的には間引き/挿入を行わないが、番組長が極端に長い場合など、バッファがクリアできるタイミングが長時間訪れずにバッファのオーバーフロー又はアンダーフローが生じてしまいそうな範囲まで誤差が蓄積した場合には間引き/挿入、ないし強制的なバッファのクリアを行わざるを得なくなる。間引き/挿入を行う場合、サンプル数調整優先モードと同様に1サンプルを間引き/挿入してもよいし、調整のタイミングを減らすためにまとめて複数サンプルを間引き/挿入してもよい。ただし、定期的に調整可能な0データはPa、Pb前の4サンプル分しか保証されないので、複数サンプルといっても4サンプルが限度であり、バッファクリア優先モードにおいて0データの間引き/挿入を行う場合のサンプル数は1~4サンプルとなる。 On the other hand, in buffer clear priority mode, errors are allowed until overflow or underflow occurs, so basically no thinning/insertion is performed, but the buffer can be cleared if the program length is extremely long. If the timing does not arrive for a long time and errors accumulate to the extent that overflow or underflow of the buffer is likely to occur, thinning/insertion or forced clearing of the buffer must be performed. When performing thinning/insertion, one sample may be thinned out/inserted as in the sample number adjustment priority mode, or a plurality of samples may be thinned out/inserted at once in order to reduce the adjustment timing. However, the 0 data that can be adjusted periodically is guaranteed only for 4 samples before Pa and Pb, so even if multiple samples are used, the limit is 4 samples, and 0 data is thinned out/inserted in buffer clear priority mode. In this case, the number of samples is 1 to 4 samples.
バッファクリア優先モードでは、バッファがクリアされるタイミングまでは、あるいは誤差の蓄積が進み0データの間引き又は挿入が必要となるタイミングまでは、装置に入力されたデジタル音声信号が完全に保持されるため、本装置を介して音声信号を接続するシステムの動作に関して、より高い安定性が期待できる。一方、サンプル数調整優先モードでは、後述するようにPCMデータと非PCMデータを別々に扱うときなどに、データバースト単位でPCMデータと非PCMデータの絶対時刻が合わせられることになり、より高い時間的精度が期待できる。 In buffer clear priority mode, the digital audio signal input to the device is completely retained until the buffer is cleared, or until errors accumulate and it becomes necessary to thin out or insert 0 data. , higher stability can be expected with respect to the operation of a system that connects audio signals via this device. On the other hand, in sample number adjustment priority mode, when handling PCM data and non-PCM data separately as described later, the absolute times of PCM data and non-PCM data are matched in data burst units, resulting in a higher time You can expect accurate results.
最後に、音声信号再生部4で、サンプル数を調整済みの、又は調整が必要ないと判断された非PCMデータを、同期信号に同期して再生する(ステップ110)。以降一連の処理を、音声信号同期装置1が停止されるまで繰り返す。
Finally, the audio
なお、AES3やAES3の拡張であるMADI(AES10)では、一つの音声ストリームに複数のチャンネルのデータを合わせて伝送可能であり、PCMデータと非PCMデータが混在して入力されることが考えられる。その場合、上記の一連の処理をPCMデータにも適応してもよいし、一連の処理を加える前にPCMデータのチャンネルと非PCMデータのチャンネルを分離し、別々の処理を加えてもよい。後者の場合、例えば非PCMデータには上記の一連の処理を行い、PCMデータには従来のサンプリングレートコンバート処理を行い、非PCMデータの処理によって生じる遅延を加えた上で、それぞれの処理が完了したPCMデータと非PCMデータをまた一つの音声ストリームとして出力する。 In addition, with AES3 and MADI (AES10), which is an extension of AES3, it is possible to transmit data from multiple channels in one audio stream, and it is possible that a mixture of PCM data and non-PCM data may be input. . In that case, the series of processes described above may also be applied to PCM data, or the channels of PCM data and channels of non-PCM data may be separated and separate processes may be applied before applying the series of processes. In the latter case, for example, the above series of processing is performed on non-PCM data, conventional sampling rate conversion processing is performed on PCM data, and each processing is completed after adding the delay caused by processing of non-PCM data. The PCM data and non-PCM data are output as one audio stream.
PCMデータの場合、無理にサンプルを挿入又は間引くと、その処理が例え1サンプルだけであったとしても可聴レベルのノイズを生じる可能性がある。バッファ部2でバッファのクリアが行えずに、サンプルの挿入又は間引きが必要な場合には、PCMデータは従来のサンプリングレートコンバート処理により同期に引き込むことで、ビット列は保持されておらずとも聴感上の問題が生じる可能性を従来のサンプリングレートコンバータと同程度に抑えることが可能である。
In the case of PCM data, if samples are forcibly inserted or thinned out, even if only one sample is processed, audible noise may occur. If the buffer cannot be cleared in the
以下、本発明の実施例について説明する。
(実施例1)
本発明の実施例1として、MADIでオブジェクトベース音響コンテンツのストリームが入力された場合を例にとって説明する。MADIの64チャンネルのうち、1~60チャンネルにPCMデータ、61~64チャンネルにS-ADM(非PCMデータ)が格納されており、データバーストは規格上最大の4096サンプルごとに送信されているものとする。バッファ部2での遅延量を、インターレース方式の映像のフレームレート(60Hz)に合わせ、1÷30≒33ms(ミリ秒)とする。
Examples of the present invention will be described below.
(Example 1)
As a first embodiment of the present invention, a case will be described taking as an example a case where a stream of object-based audio content is input using MADI. Of the 64 channels of MADI, channels 1 to 60 store PCM data, channels 61 to 64 store S-ADM (non-PCM data), and data bursts are transmitted every 4096 samples, which is the maximum according to the standard. shall be. The amount of delay in the
業務用の音声同期信号発生器(マスタークロックジェネレータ)の多くは発振器にルビジウムを用いられ、高い精度の同期信号を出力する。例えばデジタル音声信号用の同期信号の一種でありIEC 60958-4の中で規定されているAES11のGrade 1では、周波数精度の許容範囲を±1ppm(parts per million)以内とすることが定められている。実施例1では規格の範囲内で最大のずれを想定し、入出力信号のクロック周波数を48kHz+1ppm及び48kHz-1ppmとする。 Most professional audio synchronization signal generators (master clock generators) use rubidium for their oscillators and output highly accurate synchronization signals. For example, Grade 1 of AES11, which is a type of synchronization signal for digital audio signals and is specified in IEC 60958-4, stipulates that the allowable range of frequency accuracy is within ±1 ppm (parts per million). There is. In the first embodiment, assuming the maximum deviation within the standard range, the clock frequencies of the input/output signals are set to 48 kHz+1 ppm and 48 kHz-1 ppm.
図5は実施例1の構成例を示すブロック図、図6は実施例1の処理フローの例である。図5に示すとおり、実施例1に係る音声信号同期装置1は、バッファ部2、サンプル数調整部3及び音声信号再生部4に加えて、非PCMデータ判定部5と、遅延部6と、サンプリングレートコンバータ部7とをさらに備える。
FIG. 5 is a block diagram showing a configuration example of the first embodiment, and FIG. 6 is an example of a processing flow of the first embodiment. As shown in FIG. 5, the audio signal synchronization device 1 according to the first embodiment includes, in addition to the
入力されたMADI信号はまず、非PCMデータ判定部5によりPCMチャネルか非PCMチャネルかの判定が行われ(図6のステップ201)、非PCMデータが格納されている61~64チャンネルのデータはバッファ部2に、PCMが格納されている1~60チャンネルのデータは遅延部6にそれぞれ送られる。
First, the input MADI signal is determined by the non-PCM
ここで、非PCMデータが格納されているチャンネルの判定に、データバーストの開始を示すPa、Pbとその直前の4サンプルとあわせた6サンプル(0,0,0,0,Pa,Pb)が存在しているかによって装置が自動で処理を切り替えてもよいし、オブジェクトベース音響コンテンツのストリームなどのPCMデータと非PCMデータが混在して伝送される場合には、S-ADM(非PCMデータ)を伝送しているチャンネルは事前に決められていることも十分考えられるため、あらかじめユーザが61~64チャンネルのみを非PCMデータと扱うように指定してもよい。 Here, 6 samples (0, 0, 0, 0, Pa, Pb), including Pa and Pb indicating the start of the data burst, and the 4 samples immediately before them, are used to determine the channel in which non-PCM data is stored. The device may automatically switch the processing depending on whether the data exists, or if a mixture of PCM data and non-PCM data such as a stream of object-based audio content is transmitted, S-ADM (non-PCM data) may be used. Since it is quite conceivable that the channels transmitting the data are determined in advance, the user may specify in advance that only channels 61 to 64 are to be treated as non-PCM data.
61~64チャンネルの非PCMデータについては、バッファ部2でバッファに書き込まれ、読み出しを待つ状態になる(ステップ202)。
入出力信号のクロック周波数が48kHz+1ppm及び48kHz-1ppmであり、そのずれは48kHzの2ppmとなるため、1時間で最大3600(秒)×48000(サンプル/秒)×2×10-6≒346サンプル(7.2ms)となる。誤差の蓄積が事前に設定された遅延量33msを超えるのに約4.6時間かかる。一般的な放送番組の時間長を考慮すると、誤差が蓄積する前に番組が終了し、S-ADM(非PCMデータ)を含めオブジェクトベース音響のストリームが一度途切れ、クリアが可能であると考えられる。
The non-PCM data of the 61st to 64th channels are written into the buffer in the
The clock frequencies of the input and output signals are 48kHz + 1ppm and 48kHz - 1ppm, and the deviation is 2ppm of 48kHz, so the maximum time in one hour is 3600 (seconds) x 48000 (samples/second) x 2 x 10 -6 ≒ 346 samples ( 7.2ms). It takes about 4.6 hours for the error accumulation to exceed the preset delay amount of 33 ms. Considering the length of a typical broadcast program, it is thought that the program will end before errors accumulate, and the stream of object-based audio, including S-ADM (non-PCM data), will be interrupted and cleared. .
このように、一般的な番組長を考えると、オブジェクトベース音響ではバッファのクリアが適切に行われ、アンダーフロー又はオーバーフローの対策のために0データの間引き/挿入が必要となるケースは少ないことが想定される。そのため、元のデータを完全に保持することを優先してバッファクリア優先モードを用いてもよいし、サンプルのずれが最小になるよう逐次補正することを優先してサンプル数調整優先モードを用いてもよい。 In this way, considering the typical length of a program, the buffer is cleared appropriately in object-based audio, and there are few cases where it is necessary to thin out/insert 0 data to prevent underflow or overflow. is assumed. Therefore, the buffer clear priority mode may be used to prioritize completely retaining the original data, or the sample number adjustment priority mode may be used to prioritize sequential correction to minimize sample deviation. Good too.
なお、バッファクリア優先モードを用いた場合には、誤差の蓄積に応じてPCMデータとS-ADM(非PCMデータ)の時刻にずれが生じる可能性がある。S-ADMでは、時刻によってPCMデータにかけあわせるゲインを動的に変えるといった記述が可能であり、時刻ずれによってPCMデータにかけ合わせるゲインに誤差が生じ得るが、その時刻ずれは上記のとおり1時間で約7msと十分小さい。市販されている業務用のデジタル音声卓には、音声エンジニアが操作したフェーダのゲインを読み取る周期が20msと、7msより数倍大きい製品も存在し、実用上問題にならないと考えられる。 Note that when the buffer clear priority mode is used, there is a possibility that a time difference will occur between the PCM data and the S-ADM (non-PCM data) depending on the accumulation of errors. In S-ADM, it is possible to dynamically change the gain multiplied by PCM data depending on the time, and an error may occur in the gain multiplied by PCM data due to time lag, but as mentioned above, the time lag is about 1 hour. It is sufficiently small at 7ms. Among commercially available digital audio consoles for professional use, there are some products in which the cycle for reading the gain of the fader operated by an audio engineer is 20 ms, which is several times longer than 7 ms, and this is not considered to be a problem in practice.
バッファクリア優先モードを用いた場合には、0データの間引き/挿入処理は行われず、バッファから読み出されたサンプル(非PCMデータ)をそのまま入力された同期信号に同期して再生する。サンプル数調整優先モードを用いた場合には、1÷(48000×2×10-6)≒10.42秒ごとに生じる1サンプル分のずれを補正するため、10.42÷(4096÷48000)≒122回のデータバーストのうち1回の直前で1サンプル分の0データの間引き又は挿入が行われる。 When the buffer clear priority mode is used, 0 data thinning/insertion processing is not performed, and the samples (non-PCM data) read from the buffer are reproduced as they are in synchronization with the input synchronization signal. When using sample number adjustment priority mode, 1÷(48000×2×10 −6 )≒10.42÷(4096÷48000) to correct the deviation of 1 sample that occurs every 10.42 seconds. One sample of 0 data is thinned out or inserted immediately before one out of approximately 122 data bursts.
1~60チャンネルのPCMデータについては、非PCMデータからは分離されて処理される。
まず、非PCMデータのバッファによって生じる遅延に合わせるため、PCMデータについても遅延(ディレイ)処理を加える(ステップ203)。そのディレイ値は、非PCMデータのバッファ部2で自動又は手動で設定された遅延量に合わせて決定する。
その後、従来のサンプリングレートコンバート処理を加える(ステップ204)。ここで、1~60チャンネルのPCMデータについて、実施例1の装置の入出力前後を比較すると、ビット単位の正確性は損なわれるが、聴感上の違いを小さく抑えながら、入力された同期信号に引き込むことが可能である。加えて、MADIなどによる多チャンネル入力が想定される場合、実施例1のようにバッファ部2に格納するのを非PCMデータだけとすることで、バッファ部2に必要なメモリの量を抑えることができるというメリットもある。
PCM data of channels 1 to 60 are processed separately from non-PCM data.
First, in order to match the delay caused by the buffer of non-PCM data, delay processing is also applied to the PCM data (step 203). The delay value is determined according to the amount of delay automatically or manually set in the
Thereafter, conventional sampling rate conversion processing is applied (step 204). Here, when comparing the PCM data of channels 1 to 60 before and after the input/output of the device of Example 1, although bit-by-bit accuracy is lost, the input synchronization signal is It is possible to pull in. In addition, when multi-channel input via MADI or the like is assumed, the amount of memory required for the
以上の処理により、非PCMデータ及びPCMデータの両方が入力された同期信号に同期している状態になったため、最後にこれらの信号を統合し(ステップ205)、再度1~64チャンネルのMADIとして出力する。 Through the above processing, both non-PCM data and PCM data are synchronized with the input synchronization signal, so these signals are finally integrated (step 205) and re-assigned as MADI for channels 1 to 64. Output.
(実施例2)
本発明の実施例2として、SDI信号で映像を伴うオブジェクトベース音響コンテンツのストリームを伝送している場合を例にとって説明する。SDI信号を異なる同期系に引き込む際に用いられるフレームシンクロナイザは、入力された映像信号にエンベデッドされている音声信号を分離(デマルチプレックス)し、映像と音声は別々に同期引き込み処理をしたのちに再度統合(マルチプレックス)して出力する。この際、音声信号の同期引き込み処理は、従来のサンプリングレートコンバート処理を行っていることが一般的である。実施例2では、このサンプリングレートコンバート処理を本発明の装置の処理に置き換えることを想定して説明する。
(Example 2)
As a second embodiment of the present invention, a case where a stream of object-based audio content accompanied by video is transmitted using an SDI signal will be described as an example. The frame synchronizer used to pull SDI signals into different synchronization systems separates (demultiplexes) the audio signal embedded in the input video signal, and synchronizes the video and audio separately. Re-integrate (multiplex) and output. At this time, the audio signal synchronization pull-in process is generally performed using conventional sampling rate conversion processing.
映像に合わせることが前提の音声信号であるため、SDIの1~15チャンネルにPCMデータ、16チャンネルにS-ADM(非PCMデータ)が格納されており、データバーストは映像のフレームレート(60Hz)に合わせて、48000÷60=800サンプルごとに送信されているものとする。バッファ部2での遅延量、入力信号と同期信号のクロック速度は実施例1と同じとし、バッファ部2にはリングバッファを用いる。なお、バッファ部2でのデータクリアは、ポインタの調整によって代用する。
Since the audio signal is intended to match the video, PCM data is stored in SDI channels 1 to 15, S-ADM (non-PCM data) is stored in channel 16, and the data burst is at the video frame rate (60Hz). It is assumed that data is transmitted every 48,000÷60=800 samples. The amount of delay in the
ブロック図及びフロー図は実施例1と同じである。入力された16チャンネルの音声信号はまず、非PCMデータ判定部5により、非PCMデータが格納されている16チャンネルのデータはバッファ部2に、PCMが格納されている1~15チャンネルのデータは遅延部6にそれぞれ送られる。
The block diagram and flow diagram are the same as in the first embodiment. The input 16-channel audio signal is first processed by a non-PCM
16チャンネルの非PCMデータについては、バッファ部2でバッファに書き込まれ、読み出しを待つ状態になる。入力信号と同期信号のクロック周波数のずれは実施例1と同じであるため、バッファ部2でのデータクリアが可能であると考えられる。
The 16 channels of non-PCM data are written into a buffer in the
ここで、バッファ部2を実際にはクリアをせずとも、リングバッファの書込ポインタと読出ポインタを調整することで代用することができる。図7はポインタの調整の例である。バッファ部2での遅延が1÷60≒16.7msと設定されており、動作開始当初には読出ポインタから書込ポインタに対し800サンプル分遅らせられている。入力音声信号と同期信号のクロック速度が完全に同一である場合は、動作開始後も読出ポインタと書込ポインタの差分(インターバル)が800サンプルに保たれるが、クロック速度に差がある場合にはこの差分が徐々に拡大又は縮小する。差分が拡大しているときには、リングバッファをクリア可能となったタイミングで、書込ポインタを読出ポインタ+800(インターバル分)に変更する(巻き戻す)ことで、リングバッファをクリアせずとも動作開始当初のインターバルにリセットできる。逆に、差分が縮小しているときには、インターバル分の0(Null)データが格納された補助バッファを別途用意しておき、リングバッファをクリア可能となったタイミングで読出ポインタを補助バッファに移し、補助バッファの読み出しが終わった時点で、読出ポインタをリングバッファがクリア可能となったタイミングでの書込ポインタと同じ値とすることで、リングバッファをクリアせずとも動作開始当初のインターバルにリセットできる。ここで、わかりやすさのために、リングバッファをクリア可能となったタイミングで、書込ポインタをリングバッファの第1インデックスに変更してもよい。
Here, without actually clearing the
実施例1と同様にバッファクリア優先モードとサンプル数調整優先モードの選択によって0データの間引き/挿入処理を行ったうえで、バッファから読み出されたサンプル(非PCMデータ)を別途入力された同期信号に同期して再生する。 As in Example 1, after thinning/inserting 0 data by selecting buffer clear priority mode and sample number adjustment priority mode, samples (non-PCM data) read from the buffer are input separately and synchronized. Play in sync with the signal.
1~15チャンネルのPCMデータについては、実施例1と同様に非PCMデータからは分離し、遅延処理とサンプリングレートコンバート処理を加える。 PCM data of channels 1 to 15 are separated from non-PCM data as in the first embodiment, and delay processing and sampling rate conversion processing are added.
以上の処理により、非PCMデータ及びPCMデータの両方が入力された同期信号に同期している状態になったため、最後にこれらの信号を統合し1~16チャンネルの音声信号とすることで、SDI信号にマルチプレックスして出力することが可能となる。 Through the above processing, both the non-PCM data and PCM data are synchronized with the input synchronization signal, so finally, by integrating these signals into audio signals of channels 1 to 16, SDI It becomes possible to multiplex the signal and output it.
本実施形態によれば、異なる同期系で動作している複数のシステムの組み合わせにより構成されている大規模な設備において、一のシステムが非PCMのデータを含む異なる同期系のデジタル音声信号を受信した場合であっても、非PCMデータを格納したチャンネルを含むデジタル音声信号を一定量バッファリングし、別途入力された同期信号に同期してバッファリングしたデータを出力することで受信したシステムの同期に引き込むので、データの欠落を防ぎながら、受信したシステムの同期に引き込むことが可能となる。 According to this embodiment, in a large-scale facility configured by a combination of a plurality of systems operating in different synchronous systems, one system receives digital audio signals of different synchronous systems including non-PCM data. Even in such cases, the received system can be synchronized by buffering a certain amount of digital audio signals, including channels containing non-PCM data, and outputting the buffered data in synchronization with a separately input synchronization signal. Since data is pulled into the system, it is possible to synchronize the receiving system while preventing data loss.
また、非PCMデータを復号せず、非PCMデータが格納されたデジタル音声信号のデータに基づいて、バッファのクリアタイミングやサンプル数を調整可能なタイミングを検出することで、復号及び符号化の処理能力を必要とせず、かつ低遅延での処理を実現することが可能となる。 In addition, without decoding non-PCM data, the decoding and encoding process is performed by detecting the timing at which the buffer clear timing and the number of samples can be adjusted based on the data of the digital audio signal in which non-PCM data is stored. It becomes possible to realize processing with low delay without requiring any additional capacity.
上述の実施形態は代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変形及び変更ができることは当業者に明らかである。したがって、本発明は、上述の実施形態に限るものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。例えば、図4に記載した処理を、図2に示したスタジオや図3に示したデジタル音声卓の入力部や、コンピュータのデジタル音声信号入力ボード(図示せず)の一機能として実装することが可能である。 Although the embodiments described above have been described as representative examples, it will be apparent to those skilled in the art that many modifications and changes can be made within the spirit and scope of the invention. Therefore, the present invention should not be construed as being limited to the embodiments described above, and various modifications and changes can be made without departing from the scope of the claims. For example, the processing shown in FIG. 4 can be implemented as a function of the studio shown in FIG. 2, the input section of the digital audio console shown in FIG. 3, or a digital audio signal input board (not shown) of a computer. It is possible.
また、上述の本実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本実施形態に記載されたものに限定されるものではない。 Further, the effects described in the present embodiment described above are only a list of the most preferable effects resulting from the present invention, and the effects according to the present invention are not limited to those described in this embodiment. .
さらに、上述した音声信号同期装置1として機能させるためにコンピュータを好適に用いることができ、音声信号同期装置1の各機能を実現する処理内容を記述したプログラムをコンピュータの記憶部に格納しておき、該コンピュータのCPUによってこのプログラムを読み出して実行させることで音声信号同期装置1を実現することができる。 Furthermore, a computer can be suitably used to function as the audio signal synchronization device 1 described above, and a program that describes the processing contents for realizing each function of the audio signal synchronization device 1 can be stored in the storage section of the computer. The audio signal synchronization device 1 can be realized by reading and executing this program by the CPU of the computer.
また、このようなプログラムは、コンピュータ読み取りが可能な媒体に記録されていてもよい。コンピュータ読取可能媒体を用いれば、プログラムをコンピュータにインストールすることが可能である。ここで、プログラムが記録されたコンピュータ読取可能媒体は、非一時的な記録媒体であってもよい。非一時的な記録媒体は、特に限定されるものではないが、例えば、CD-ROMやDVD-ROMなどの記録媒体であってもよい。 Moreover, such a program may be recorded on a computer-readable medium. Computer-readable media allow programs to be installed on a computer. Here, the computer-readable medium on which the program is recorded may be a non-temporary recording medium. The non-temporary recording medium is not particularly limited, and may be, for example, a recording medium such as a CD-ROM or a DVD-ROM.
1 音声信号同期装置
2 バッファ部
3 サンプル数調整部
4 音声信号再生部
5 非PCMデータ判定部
6 遅延部
7 サンプリングレートコンバータ部
1
Claims (6)
入力されたデジタル音声信号を一時的に格納し、必要に応じてクリア処理を行うバッファ部と、
前記入力されたデジタル音声信号と同期信号のクロック速度の違いに対応するために前記デジタル音声信号の間引き又は挿入を行うサンプル数調整部と、
前記バッファ部から読み出した前記デジタル音声信号を前記同期信号に同期して再生する音声信号再生部と、
を備えるデジタル音声信号同期装置。 A digital audio signal synchronization device,
A buffer section that temporarily stores the input digital audio signal and performs clearing processing as necessary;
a sample number adjustment unit that thins out or inserts the digital audio signal in order to accommodate the difference in clock speed between the input digital audio signal and the synchronization signal;
an audio signal reproducing unit that reproduces the digital audio signal read from the buffer unit in synchronization with the synchronization signal;
A digital audio signal synchronization device comprising:
入力信号と同期信号のクロック速度の違いによって生じる前記バッファ部のオーバーフロー又はアンダーフローを検出し、非PCMデータのデータバーストの間の0データ区間で、前記オーバーフローを検出した場合は0データを間引き、前記アンダーフローを検出した場合は0データを挿入することにより、前記デジタル音声信号のサンプル数を調整する請求項2に記載のデジタル音声信号同期装置。 The sample number adjustment section is
detecting an overflow or underflow of the buffer section caused by a difference in clock speed between an input signal and a synchronization signal, and thinning out 0 data if the overflow is detected in a 0 data interval between data bursts of non-PCM data; 3. The digital audio signal synchronization device according to claim 2, wherein the number of samples of the digital audio signal is adjusted by inserting 0 data when the underflow is detected.
非PCMデータから区別されたPCMデータにサンプリングレートコンバート処理を加えることで前記同期信号に同期させるサンプリングレートコンバート部と、
サンプリングレートコンバート処理されたPCMデータに、非PCMデータの前記バッファ部への一時的な格納によって生じる遅延と同等の遅延を加えることにより、前記PCMデータと非PCMデータのタイミングを揃える遅延部と、
をさらに備える請求項2に記載のデジタル音声信号同期装置。 a non-PCM data determination unit that determines non-PCM data in order to distinguish between non-PCM data and PCM data stored in the digital audio signal and separate subsequent processing;
a sampling rate converter that synchronizes the PCM data separated from non-PCM data with the synchronization signal by performing a sampling rate conversion process;
a delay unit that aligns the timings of the PCM data and the non-PCM data by adding a delay equivalent to a delay caused by temporary storage of the non-PCM data in the buffer unit to the PCM data subjected to the sampling rate conversion process;
The digital audio signal synchronization device according to claim 2, further comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022092224A JP2023179125A (en) | 2022-06-07 | 2022-06-07 | Digital audio signal synchronization device and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022092224A JP2023179125A (en) | 2022-06-07 | 2022-06-07 | Digital audio signal synchronization device and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023179125A true JP2023179125A (en) | 2023-12-19 |
Family
ID=89199400
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022092224A Pending JP2023179125A (en) | 2022-06-07 | 2022-06-07 | Digital audio signal synchronization device and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2023179125A (en) |
-
2022
- 2022-06-07 JP JP2022092224A patent/JP2023179125A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3629253B2 (en) | Audio reproduction device and audio reproduction control method used in the same | |
KR100296528B1 (en) | Multiplexed Data Separation Apparatus and Method | |
JP4649210B2 (en) | System for correcting the time axis of video signals | |
JP4354455B2 (en) | Playback apparatus and playback method | |
KR20170113087A (en) | Systems and method for audio playback | |
US20050276282A1 (en) | Method of audio-video synchronization | |
JP3666625B2 (en) | Data recording method and data recording apparatus | |
CN113300797B (en) | Multi-device self-adaptive audio synchronous playing method and processing terminal | |
CN102640511A (en) | Method and system for playing video information, and video information content | |
KR20060125678A (en) | Buffer management system, digital audio receiver, headphones, loudspeaker, method of buffer management | |
JP2006340102A (en) | Synchronous reproducer and synchronous reproduction method | |
JP2006301442A (en) | Multiplexing device and method, program, and recording medium | |
US20220013131A1 (en) | Method, a system, and a program for playing back audio/video signals with automatic adjustment of latency | |
JP4737683B2 (en) | Serial transmission system, transmission apparatus, and serial transmission method | |
US6243032B1 (en) | Decode apparatus that can accommodate dynamic change in sample data attribute during decoding process | |
JP2023179125A (en) | Digital audio signal synchronization device and program | |
WO2015038186A1 (en) | Auxiliary content synchronization system and method | |
JP4380930B2 (en) | Audio / video decoding / playback apparatus and synchronized playback method thereof | |
JP4997720B2 (en) | Multiplexing device, multiplexing method, program, and recording medium | |
JP2006319552A (en) | Multimedia reproducing device | |
JP2006330541A (en) | Audio-receiving and reproducing device | |
EP1340227B1 (en) | Method for providing program specific information recorded on high density disc medium | |
JP2001339688A (en) | Playback equipment of transport stream | |
KR100629507B1 (en) | Multi-format sound delay apparatus capable of selectable delay and a method thereof | |
KR19980036074A (en) | Video / Audio Synchronizer in Decoder System |