JP2007306110A - Video audio synchronization detector, and video audio reproduction system having verification function - Google Patents
Video audio synchronization detector, and video audio reproduction system having verification function Download PDFInfo
- Publication number
- JP2007306110A JP2007306110A JP2006130139A JP2006130139A JP2007306110A JP 2007306110 A JP2007306110 A JP 2007306110A JP 2006130139 A JP2006130139 A JP 2006130139A JP 2006130139 A JP2006130139 A JP 2006130139A JP 2007306110 A JP2007306110 A JP 2007306110A
- Authority
- JP
- Japan
- Prior art keywords
- video
- audio
- data
- video data
- decoded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、符号化された映像データと音声データを復号し、復号した映像データと音声データを再生時刻情報を用いて同期させて出力する装置の同期動作を、出力される映像データと音声データの同期を測定することによって検証する技術に関するものである。 The present invention decodes encoded video data and audio data, and synchronizes the output of the decoded video data and audio data using reproduction time information, and outputs the synchronized video data and audio data. The present invention relates to a technique for verifying by measuring the synchronization.
従来、MPEG(Moving Picture Experts Group)規格等を適用し、別々に圧縮し、多重化して映像データおよび音声データを伝送したり記憶媒体に記録する技術が知られている。このような技術を用いて伝送または記録された多重化圧縮データは、再生装置に入力され、多重分離される。そして、分離された映像データと音声データがそれぞれ伸長されて再生される。このようないわゆるコーデックシステムにおいては、多重化する際に、映像データと音声データに、それぞれ各所定単位のデータの再生時刻を示すタイムスタンプと呼ばれる再生時刻情報が埋め込まれる。そして、再生装置がそのタイムスタンプに基づくタイミングで映像データと音声データとを再生する。 2. Description of the Related Art Conventionally, there has been known a technique for applying video (Experiment Picture Group) (MPEG) standards, etc., separately compressing and multiplexing to transmit video data and audio data or record them on a storage medium. Multiplexed compressed data transmitted or recorded using such a technique is input to a playback device and demultiplexed. Then, the separated video data and audio data are decompressed and reproduced. In such a so-called codec system, when multiplexing, reproduction time information called a time stamp indicating the reproduction time of each predetermined unit of data is embedded in video data and audio data. Then, the playback device plays back video data and audio data at a timing based on the time stamp.
ここで、再生装置が正常にタイムスタンプに基づくタイミングで映像データと音声データを再生しているかを検証する方法として、再生される映像と音声が同期しているか、例えば、人間が話す時の唇の動きと声が同期しているかを人間が観察することによって検証する方法がある。 Here, as a method for verifying whether or not the playback device is normally playing back video data and audio data at a timing based on the time stamp, the video and audio to be played back are synchronized, for example, the lip when a human speaks There is a method of verifying by observing whether the movement and voice are synchronized.
ところが、このように人間が観察して検証する方法には、定量的な評価ができないという問題がある。そこで、再生装置が映像データと音声データをタイムスタンプにどの程度忠実なタイミングで再生しているかを定量的に評価できるようにするAV同期検出装置が特許文献1に提案されている。 However, there is a problem that such a method of human observation and verification cannot be quantitatively evaluated. Therefore, Patent Document 1 proposes an AV synchronization detection device that can quantitatively evaluate how faithfully the playback device is playing back video data and audio data with respect to a time stamp.
同文献の図1に示されるAV同期検出装置において、映像信号発生手段1は、フレーム番号に対応した時刻が画面右下にスーパーインポーズされた映像の映像データを発生する。一方、タイムコード発生手段3は、LTC(Longitudinal Time Code)信号を使用してタイムコードを発生する。そして、表示装置10に表示される映像の画面右下にスーパーインポーズされた時刻と、タイムコード読取手段12に表示されるタイムコードとが比較される。この比較により、タイムスタンプで示される再生タイミングと実際に再生されるタイミングの時間差を算出することができる。つまり、再生装置が映像データと音声データをタイムスタンプにどの程度忠実なタイミングで再生しているかを定量的に評価できる。
しかしながら、上記従来のAV同期検出装置による検証方法では、時刻情報が付された状態で再生される映像データと音声データを用いてしか評価できない。したがって、映像信号発生手段1やタイムコード発生手段3等の、時刻情報が付された状態で再生される映像データと音声データを生成するための特別な装置が必要となっていた。また、タイムコード読取手段12等の、再生される音声データから時刻情報を読み取るための装置も必要となっていた。 However, the verification method using the conventional AV sync detection apparatus can be evaluated only by using video data and audio data reproduced with time information attached. Therefore, a special device for generating video data and audio data to be reproduced with time information attached thereto, such as the video signal generating means 1 and the time code generating means 3, has been required. In addition, a device for reading time information from reproduced audio data, such as the time code reading means 12, has been required.
本発明は、上記の点に鑑み、映像音声同期検出装置により、再生時に時刻情報が付かない映像データと音声データを用いて再生装置を評価できるようにする。 In view of the above points, the present invention enables a video / audio synchronization detection device to evaluate a playback device using video data and audio data without time information during playback.
上記の課題を解決するため、請求項1の発明は、
符号化映像データおよび符号化音声データを復号し、復号映像データと復号音声データとを同期させて出力する映像音声再生装置の同期動作を検証するための映像音声同期検出装置であって、
上記映像音声再生装置が所定の1画像の復号映像データを出力する映像データ出力タイミング、および上記映像音声再生装置が所定単位時間連続する所定の連続復号音声データを出力する音声データ出力タイミングを検出する出力タイミング検出部と、
上記符号化映像データまたは符号化音声データに含まれる再生時刻情報に基づいて、上記所定の1画像の復号映像データが出力されるべき映像再生基準時刻と上記所定の連続音声データが出力されるべき音声再生基準時刻とを取得する再生基準時刻取得部と、
上記映像データ出力タイミングと上記音声データ出力タイミングとの間隔である映像音声出力間隔と、上記映像再生基準時刻と上記音声再生基準時刻との基準間隔との差を同期ずれ時間として算出する算出部と、
を備えたことを特徴とする。
In order to solve the above problems, the invention of claim 1
A video / audio synchronization detection device for verifying a synchronization operation of a video / audio reproduction device that decodes encoded video data and encoded audio data and outputs the decoded video data and decoded audio data in synchronization with each other,
Video data output timing at which the video / audio reproduction device outputs decoded video data of one predetermined image, and audio data output timing at which the video / audio reproduction device outputs predetermined continuous decoded audio data continuous for a predetermined unit time are detected. An output timing detector;
Based on the playback time information included in the encoded video data or the encoded audio data, the video playback reference time at which the decoded video data of the predetermined one image should be output and the predetermined continuous audio data should be output A reproduction reference time acquisition unit for acquiring the audio reproduction reference time;
A calculation unit that calculates a difference between a video / audio output interval, which is an interval between the video data output timing and the audio data output timing, and a reference interval between the video reproduction reference time and the audio reproduction reference time as a synchronization shift time; ,
It is provided with.
これにより、映像データ出力タイミングと音声データ出力タイミングとの差である映像音声出力間隔と映像再生基準時刻と音声再生基準時刻との差である基準間隔との差を同期ずれ時間として算出することにより、映像データと音声データとの同期を定量的に評価できる。 As a result, the difference between the video / audio output interval, which is the difference between the video data output timing and the audio data output timing, and the reference interval, which is the difference between the video playback reference time and the audio playback reference time, is calculated as the synchronization deviation time. The synchronization between video data and audio data can be quantitatively evaluated.
請求項2の発明は、
請求項1の映像音声同期検出装置であって、
上記出力タイミング検出部は、
上記所定の1画像の復号映像データに対応する照合対象映像データを、上記映像音声再生装置が順次出力する各復号映像データと照合し、上記照合対象映像データと一致する復号映像データを検出する映像データ照合部と、
上記所定単位時間連続する所定の連続復号音声データに対応する照合対象音声データを、上記映像音声再生装置が順次出力する各復号音声データと照合し、上記照合対象音声データと一致する復号音声データを検出する音声データ照合部と、
を備え、
上記照合対象映像データに一致する復号映像データが出力されたタイミングを上記映像データ出力タイミングとして検出し、
上記照合対象音声データに一致する復号音声データが出力されたタイミングを上記音声データ出力タイミングとして検出するようになっていることを特徴とする。
The invention of claim 2
The video / audio synchronization detection apparatus according to claim 1,
The output timing detector is
Video for collating target video data corresponding to decoded video data of one predetermined image with each decoded video data sequentially output by the video / audio reproduction device, and detecting decoded video data matching the target video data A data verification unit;
The collation target audio data corresponding to the predetermined continuous decoded audio data continuous for the predetermined unit time is collated with each decoded audio data sequentially output by the video / audio reproduction device, and the decoded audio data matching the collation target audio data is obtained. A voice data matching unit to be detected;
With
The timing at which the decoded video data that matches the verification target video data is output is detected as the video data output timing,
The timing at which decoded audio data that matches the verification target audio data is output is detected as the audio data output timing.
これにより、同期ずれを評価する対象の復号映像データと復号音声データを、照合によって特定し、検出できる。 As a result, the decoded video data and the decoded audio data to be evaluated for synchronization deviation can be identified and detected by collation.
請求項3の発明は、
請求項2の映像音声同期検出装置であって、
上記映像データ照合部は、複数画像の照合対象映像データについて、順次、それぞれと一致する復号映像データを検出し、上記算出部は、上記一致が検出された各復号映像データについての上記同期ずれ時間を算出することを特徴とする。
The invention of claim 3
The video / audio synchronization detection device according to claim 2,
The video data collating unit sequentially detects decoded video data that matches each of video data to be collated of a plurality of images, and the calculating unit detects the synchronization deviation time for each decoded video data in which the match is detected. Is calculated.
これにより、複数画像の映像データについて音声データとの同期ずれが評価されるので、複数画像の映像データを再生している途中に生じる同期ずれも評価でき、同期ずれが生じた画像を特定することもできる。 As a result, the synchronization deviation with the audio data is evaluated for the video data of the plurality of images, so that the synchronization deviation occurring during the reproduction of the video data of the plurality of images can be evaluated, and the image in which the synchronization deviation has occurred is identified. You can also.
請求項4の発明は、
請求項3の映像音声同期検出装置であって、
上記映像データ照合部は、
各照合対象映像データについて一致する復号映像データが検出された後、次の照合対象映像データについて一致する復号映像データが検出されるまでの照合回数をカウントする画像数カウンタを備え、
上記算出部は、
各照合対象映像データに一致する復号映像データが出力されるごとに、前回一致した復号映像データが出力された際の上記映像音声出力間隔に、上記画像数カウンタの値と1画像の出力時間との積を加算した値を、上記各照合対象映像データに一致する復号映像データについての映像音声出力間隔として求めることを特徴とする。
The invention of claim 4
The video / audio synchronization detection apparatus according to claim 3,
The video data verification unit
An image number counter that counts the number of matching times until the matching decoded video data is detected for the next matching target video data after the matching decoded video data is detected for each matching target video data;
The calculation unit is
Each time the decoded video data that matches each verification target video data is output, the value of the image number counter, the output time of one image, and the output time of the video / audio output when the decoded video data that matches the previous time is output. Is obtained as a video / audio output interval for decoded video data that matches each of the verification target video data.
これにより、各照合対象映像データに一致する復号映像データと所定の復号音声データとの差が順次、映像音声出力間隔として求められる。 As a result, the difference between the decoded video data matching the respective verification target video data and the predetermined decoded audio data is sequentially obtained as the video / audio output interval.
請求項5の発明は、
請求項2の映像音声同期検出装置であって、
上記音声データ照合部は、複数組の照合対象復号音声データについて、順次、それぞれと一致する復号音声データを検出し、上記算出部は、上記一致が検出された各復号音声データについての上記同期ずれ時間を算出するようになっていることを特徴とする。
The invention of
The video / audio synchronization detection device according to claim 2,
The voice data collating unit sequentially detects decoded voice data that matches each of a plurality of sets of decoding target decoded voice data, and the calculation unit includes the synchronization deviation for each decoded voice data in which the match is detected. It is characterized in that time is calculated.
これにより、複数組の所定単位時間連続する音声データについて映像データとの同期ずれが評価されるので、複数組の所定単位時間連続する音声データを再生している途中に生じる同期ずれも評価でき、同期ずれが生じた音声データを特定することもできる。 Thereby, since the synchronization deviation with the video data is evaluated for a plurality of sets of audio data continuous for a predetermined unit time, it is also possible to evaluate the synchronization deviation generated during the reproduction of a plurality of sets of audio data continuous for a predetermined unit time, It is also possible to specify audio data in which synchronization loss has occurred.
請求項6の発明は、
上記音声データ照合部は、
各照合対象復号音声データについて一致する復号音声データが検出された後、次の照合対象復号音声データについて一致する復号音声データが検出されるまでの照合回数をカウントする組数カウンタを備え、
上記算出部は、
各照合対象音声データに一致する復号音声データが出力されるごとに、前回一致した復号音声データが出力された際の上記映像音声出力間隔に、上記組数カウンタの値と1組の所定単位時間連続する連続復号音声データの出力時間との積を加算した値を、上記各照合対象音声データに一致する復号音声データについての映像音声出力間隔として求めることを特徴とする。
The invention of claim 6
The voice data verification unit
A set number counter that counts the number of collations until the matching decoded voice data is detected for the next matching target decoded voice data after the matching decoded voice data is detected for each matching target decoded voice data;
The calculation unit is
Each time decoded audio data that matches each verification target audio data is output, the value of the set counter and one set of predetermined unit time are set at the video and audio output interval when the decoded audio data that matched previously is output. A value obtained by adding a product of output times of continuous continuous decoded audio data is obtained as a video / audio output interval for decoded audio data that matches each of the verification target audio data.
これにより、各照合対象音声データに一致する復号音声データと所定の復号映像データとの差が順次、映像音声出力間隔として求められる。 As a result, the difference between the decoded audio data that matches each audio data to be verified and the predetermined decoded video data is sequentially obtained as the video / audio output interval.
請求項7の発明は、
請求項1の映像音声同期検出装置であって、
上記算出部は、
上記映像データ出力タイミングと上記音声データ出力タイミングのうち早い方のタイミングで時間経過に応じた値のカウントを開始し、もう一方のタイミングでのカウント値を上記映像音声出力間隔として出力するカウンタを備えたことを特徴とする。
The invention of claim 7
The video / audio synchronization detection apparatus according to claim 1,
The calculation unit is
A counter that starts counting the value according to the passage of time at the earlier timing of the video data output timing and the audio data output timing and outputs the count value at the other timing as the video / audio output interval; It is characterized by that.
請求項8の発明は、
請求項1の映像音声同期検出装置であって、
上記算出部は、
所定のタイミングで時間経過に応じた値のカウントを開始し、上記映像データ出力タイミングでカウント値を出力する映像データ出力タイミングカウンタと、
上記所定のタイミングで時間経過に応じた値のカウントを開始し、上記音声データ出力タイミングでカウント値を出力する音声データ出力タイミングカウンタと、
上記映像データ出力タイミングカウンタによって出力されるカウント値と上記音声データ出力タイミングカウンタによって出力されるカウント値との差を上記映像音声出力間隔として出力する映像音声出力間隔算出部と、
を備えたことを特徴とする。
The invention of claim 8
The video / audio synchronization detection apparatus according to claim 1,
The calculation unit is
A video data output timing counter that starts counting a value according to the passage of time at a predetermined timing and outputs a count value at the video data output timing;
An audio data output timing counter that starts counting a value according to the passage of time at the predetermined timing and outputs a count value at the audio data output timing;
A video / audio output interval calculation unit that outputs a difference between a count value output by the video data output timing counter and a count value output by the audio data output timing counter as the video / audio output interval;
It is provided with.
これらにより、カウンタを用いることにより、映像音声出力間隔を容易に算出できる。 Accordingly, the video / audio output interval can be easily calculated by using the counter.
請求項9の発明は、
請求項1の映像音声同期検出装置であって、
さらに、上記同期ずれ時間を所定の閾値と比較する判定部を備えたことを特徴とする。
The invention of claim 9
The video / audio synchronization detection apparatus according to claim 1,
In addition, a determination unit that compares the synchronization deviation time with a predetermined threshold value is provided.
これにより、算出された同期ずれ時間を、あらかじめ自由に設定された閾値と比較することによって映像データと音声データとの同期を評価できる。 Thereby, the synchronization between the video data and the audio data can be evaluated by comparing the calculated synchronization deviation time with a threshold value set freely in advance.
請求項10の発明は、
請求項1の映像音声同期検出装置と、
映像音声再生装置と、
を有する検証機能付き映像音声再生システムであって、
上記映像音声再生装置は、
符号化多重データを符号化映像データと符号化音声データとに分離する多重分離部と、
上記符号化映像データを復号する映像データ復号部と、
上記符号化音声データを復号する音声データ復号部と、
を備え、
復号された復号映像データと復号音声データとを同期させて出力する一方、
上記映像音声同期検出装置は、
上記復号映像データと上記復号音声データとの同期ずれ時間を検出することを特徴とする。
The invention of claim 10
A video / audio synchronization detection apparatus according to claim 1;
A video / audio playback device;
A video / audio reproduction system with a verification function having
The video / audio reproduction device is
A demultiplexing unit that separates the encoded multiplexed data into encoded video data and encoded audio data;
A video data decoding unit for decoding the encoded video data;
An audio data decoding unit for decoding the encoded audio data;
With
While outputting decoded video data and decoded audio data in synchronization,
The video / audio synchronization detecting device is:
A synchronization shift time between the decoded video data and the decoded audio data is detected.
これにより、映像音声再生装置の同期動作が、映像音声同期検出装置により検証される。 Thus, the synchronization operation of the video / audio reproduction device is verified by the video / audio synchronization detection device.
請求項11の発明は、
請求項10の検証機能付き映像音声再生システムであって、
上記同期ずれ時間を所定の閾値と比較する判定部を備え、
上記映像データ復号部は、処理時間が互いに異なる複数種類の復号処理を行う機能を有し、上記映像データ出力タイミングが遅いことにより上記同期ずれ時間が所定の閾値より大きい場合の方が、小さい場合よりも処理時間の短い復号処理を行うように構成されていることを特徴とする。
The invention of claim 11
The video / audio reproduction system with verification function according to claim 10,
A determination unit that compares the synchronization deviation time with a predetermined threshold;
The video data decoding unit has a function of performing a plurality of types of decoding processing with different processing times, and the case where the synchronization shift time is larger than a predetermined threshold due to the video data output timing being late is smaller It is configured to perform a decoding process with a shorter processing time.
請求項12の発明は、
請求項11の検証機能付き映像音声再生システムであって、
上記映像データ復号部は、1画像あたりの画素数を増減させることによって、上記処理時間が互いに異なる複数種類の復号処理を行うことを特徴とする。
The invention of claim 12
The video / audio reproduction system with a verification function according to claim 11,
The video data decoding unit performs a plurality of types of decoding processes with different processing times by increasing / decreasing the number of pixels per image.
請求項13の発明は、
請求項11の検証機能付き映像音声再生システムであって、
上記映像データ復号部は、復号映像データのビットレートを増減させることによって、上記処理時間が互いに異なる複数種類の復号処理を行うことを特徴とする。
The invention of claim 13
The video / audio reproduction system with a verification function according to claim 11,
The video data decoding unit performs a plurality of types of decoding processing with different processing times by increasing / decreasing the bit rate of the decoded video data.
請求項14の発明は、
請求項10の検証機能付き映像音声再生システムであって、
上記同期ずれ時間を所定の閾値と比較する判定部を備え、
上記映像データ復号部は、上記映像データ出力タイミングが早いことにより上記同期ずれ時間が所定の閾値より大きい場合、上記復号映像データを遅らせて出力させ、上記音声データ出力タイミングが早いことにより上記同期ずれ時間が所定の閾値より大きい場合、上記復号音声データを遅らせて出力させるように構成されていることを特徴とする。
The invention of claim 14
The video / audio reproduction system with verification function according to claim 10,
A determination unit that compares the synchronization deviation time with a predetermined threshold;
The video data decoding unit delays and outputs the decoded video data when the synchronization shift time is greater than a predetermined threshold due to the video data output timing being early, and the audio data output timing is early. When the time is larger than a predetermined threshold, the decoded audio data is output after being delayed.
これらにより、映像音声再生装置が出力する復号映像データと復号音声データとの同期ずれ時間が、映像音声同期検出装置によって評価され、同期ずれ時間が所定の閾値を超えている場合は、同期ずれが低減されるように映像音声同期検出装置が映像音声再生装置が制御される。 As a result, the synchronization deviation time between the decoded video data and the decoded audio data output by the video / audio reproduction device is evaluated by the video / audio synchronization detection device, and if the synchronization deviation time exceeds a predetermined threshold, the synchronization deviation is detected. The video / audio reproduction device is controlled by the video / audio synchronization detection device so that the video / audio synchronization device is reduced.
映像音声同期検出装置により、再生時に時刻情報が付かない映像データと音声データを用いて再生装置を評価できる。したがって、時刻情報が付された状態で再生される評価用の映像データと音声データを生成する特別な装置を備えることなく、再生装置が映像データと音声データをタイムスタンプにどの程度忠実なタイミングで再生しているかを評価できる。 With the video / audio synchronization detection device, the playback device can be evaluated using video data and audio data without time information at the time of playback. Therefore, without providing a special device for generating video data and audio data for evaluation that is reproduced with time information attached, the reproduction device can reproduce the video data and audio data at a timing faithful to the time stamp. You can evaluate whether you are playing.
以下、本発明の実施形態について、図面を参照して説明する。なお、以下の各実施形態において、他の実施形態と同様の機能を有する構成要素については同一の符号を付して説明を省略する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. In each of the following embodiments, components having functions similar to those of the other embodiments are denoted by the same reference numerals and description thereof is omitted.
《発明の実施形態1》
図1は、本発明の実施形態1に係るコーデックシステムの構成を示すブロック図である。
Embodiment 1 of the Invention
FIG. 1 is a block diagram showing a configuration of a codec system according to Embodiment 1 of the present invention.
実施形態1に係るコーデックシステムでは、映像音声符号化多重装置100が出力する符号化多重データが、記憶媒体130に記憶され、検証機能付き映像音声再生装置110で再生されるようになっている。検証機能付き映像音声再生装置110(検証機能付き映像音声再生システム)は、再生される復号映像データと復号音声データの同期を検出する映像音声同期検出装置120を備えている。
In the codec system according to the first embodiment, the encoded multiplexed data output from the video / audio encoding /
映像音声符号化多重装置100は、映像データ発生部101、映像データ符号化部102、音声データ発生部103、音声データ符号化部104、および多重化部105を備えている。
The video / audio encoding and
映像データ発生部101は、映像データを生成するようになっている。映像データ発生部101としては、例えば、ビデオカメラが用いられる。
The video
映像データ符号化部102は、映像データ発生部101によって生成された映像データを符号化するようになっている。ここで行われる符号化は、映像データを圧縮する符号化等である。
The
音声データ発生部103は、音声データを生成するようになっている。音声データ発生部103としては、例えば、マイクが用いられる。
The audio
音声データ符号化部104は、音声データ発生部103によって生成された音声データを符号化するようになっている。ここで行われる符号化は、音声データを圧縮する符号化等である。
The audio
多重化部105は、映像データ符号化部102によって符号化された符号化映像データにタイムスタンプ等の映像再生時刻情報を付加し、音声データ符号化部104によって符号化された符号化音声データにタイムスタンプ等の音声再生時刻情報を付加するようになっている。そして、再生時刻情報が付加された符号化映像データと符号化音声データとを、1つの通信回線または伝送チャネルで送信できるデータに多重化(合成)するようになっている。
The
検証機能付き映像音声再生装置110は、多重分離部111、映像データ復号部112、音声データ復号部113、および映像音声同期検出装置120を備えている。
The video /
多重分離部111は、多重化部105によって多重化された符号化多重データを符号化映像データと符号化音声データとに分離して出力するようになっている。
The demultiplexer 111 separates the encoded multiplexed data multiplexed by the
映像データ復号部112は、多重分離部111によって出力された符号化映像データを復号し、符号化映像データに付された映像再生時刻情報に基づくタイミングで出力するようになっている。ここで行われる復号は、圧縮された符号化映像データを伸長する復号等である。映像データ復号部112には、後述する判定部127から判定信号が入力されるようになっており、判定信号の値が“1”の時、判定信号の値が“0”の時よりも1画像あたりの画素数を少なくしたりビットレートを減らす等して、処理時間の短い復号処理を行うようになっている。
The video
音声データ復号部113は、多重分離部111によって出力された符号化音声データを復号し、符号化音声データに付された音声再生時刻情報に基づくタイミングで出力するようになっている。ここで行われる復号は、圧縮された符号化音声データを伸長する復号等である。
The audio
映像音声同期検出装置120は、記録部121、出力タイミング検出部122、再生基準時刻取得部125、算出部126、および判定部127を備えている。
The video / audio
記録部121は、映像データ復号部112および音声データ復号部113からそれぞれ出力される復号映像データと復号音声データとを記録するようになっている。そして、記録した復号映像データと復号音声データとを、映像データ復号部112および音声データ復号部113からそれぞれが出力されるのと同じ速度と順序で出力するようになっている。記録部121は、例えば、AV(Audio Visual)データ用のハードディスク、メモリ、またはビデオテープで構成される。
The
出力タイミング検出部122は、図2に示すように、映像データ照合部122aと音声データ照合部122bとを備えている。映像データ照合部122aは、照合対象映像データ123を、記録部121から順次出力される復号映像データと1画像毎に比較照合し、照合対象映像データ123と一致する復号映像データを検出するようになっている。そして、照合対象映像データ123と一致する復号映像データを検出したタイミングを映像データ出力タイミングとして出力するようになっている。
As shown in FIG. 2, the output
音声データ照合部122bは、照合対象音声データ124を、記録部121から順次出力される復号音声データと所定単位時間連続する復号音声データ毎に比較照合し、照合対象音声データ124と一致する復号音声データを検出するようになっている。そして、照合対象音声データ124と一致する復号音声データを検出したタイミングを音声データ出力タイミングとして出力するようになっている。
The audio
照合対象映像データ123は複数画像分記憶されており、一致する復号映像データが検出されると、比較照合される照合対象映像データ123が、次の新たな照合対象映像データ123に切り換えられるようになっている。同様に、照合対象音声データ124は複数組の所定単位時間連続する復号音声データ分記憶されており、一致する復号音声データが検出されると、比較照合される照合対象音声データ124が、次の新たな照合対象音声データ124に切り換えられるようになっている。
The verification
再生基準時刻取得部125は、1画像の符号化映像データ毎に、各符号化映像データに含まれる映像再生時刻情報を読み取り、後述する算出部126のカウンタ126aで時間経過に応じてカウントされる値と単位を揃えるように換算した映像再生基準時刻を求めて記憶するようになっている。さらに、所定単位の連続する符号化音声データ毎に、各符号化音声データに含まれる音声再生時刻情報を読み取り、各符号化音声データが音声データ復号部113から復号音声データとして出力されるべき音声再生基準時刻を取得し、記憶するようになっている。例えば、27MHzのクロックでカウントされた値が再生時刻情報として用いられるMPEG2システムの場合であって、後述する算出部126のカウンタ126aにおいて、映像データ出力タイミングと音声データ出力タイミングとの間隔が9MHzのクロックでカウントされる場合、映像再生基準時刻と音声再生基準時刻は、映像再生時刻情報と音声再生時刻情報をそれぞれ1/3倍して求められる。
The reproduction reference
算出部126は、所定の1画像の映像データの映像データ出力タイミングと所定単位時間連続する所定の音声データ出力タイミングとの間隔である映像音声出力間隔と、上記所定の1画像の映像データの映像再生基準時刻と上記所定の音声データの音声再生基準時刻との基準間隔との差を同期ずれ時間として算出するようになっている。具体的な構成としては、例えば、図3に示すように、カウンタ126a、映像音声再生基準間隔算出部126b、および同期ずれ時間算出部126cを備えている。
The
カウンタ126aは、映像データ出力タイミングと音声データ出力タイミングのうち早い方のタイミングでカウント値をリセットすると同時に、時間経過に応じた値のカウントを開始し、もう一方のタイミングでのカウント値を映像音声出力間隔として出力するようになっている。
The
映像音声再生基準間隔算出部126bは、映像再生基準時刻と音声再生基準時刻との差を算出し、映像再生基準時刻と音声再生基準時刻との基準間隔として出力するようになっている。
The video / audio reproduction reference
同期ずれ時間算出部126cは、映像音声出力間隔と基準間隔との差を同期ずれ時間として算出するようになっている。
The synchronization shift
判定部127は、算出部126によって出力される同期ずれ時間を所定の閾値と比較し、同期ずれ時間が所定の閾値より小さい場合は判定信号として“0”を出力し、同期ずれ時間が所定の閾値より大きい場合は判定信号として“1”を出力するようになっている。
The
記憶媒体130は、映像音声符号化多重装置100の多重化部105によって出力された符号化多重データを記憶するようになっている。
The
−動作−
次に、上記のように構成されたコーデックシステムにおける各部の動作について説明する。
-Operation-
Next, the operation of each unit in the codec system configured as described above will be described.
まず、映像データ発生部101が映像データを生成すると、生成された映像データは映像データ符号化部102によって符号化される。一方、音声データ発生部103が音声データを生成すると、生成された音声データは音声データ符号化部104によって符号化される。そして、符号化された符号化映像データと符号化音声データは、多重化部105によって、それぞれに再生時刻情報が付加されて多重化され、符号化多重データとして記憶媒体130に記憶される。
First, when the video
記憶媒体130に記憶された符号化多重データは、多重分離部111で符号化映像データと符号化音声データとに分離される。分離された符号化映像データは映像データ復号部112で復号され、分離された符号化音声データは音声データ復号部113で復号される。復号された復号映像データは、復号される前の符号化映像データに付されていた映像再生時刻情報に基づくタイミングで記録部121に出力される。同様に、復号された復号音声データは、復号される前の符号化音声データに付されていた音声再生時刻情報に基づくタイミングで記録部121に出力される。
The encoded multiplexed data stored in the
記録部121は、映像データ復号部112から出力される復号映像データ、および音声データ復号部113から出力される復号音声データを記録し、映像データ復号部112および音声データ復号部113からそれぞれが出力されたのと同じ速度と順序で、出力タイミング検出部122へ出力する。
The
一方、再生基準時刻取得部125は、1画像の符号化映像データ毎に、符号化映像データに含まれる映像再生時刻情報を読み取り、各符号化映像データが復号された後に映像データ復号部112から復号映像データとして出力されるべき映像再生基準時刻を取得し、記憶する。さらに、所定単位時間連続する符号化音声データ毎に、各符号化音声データに含まれる音声再生時刻情報を読み取り、各符号化音声データが復号された後に音声データ復号部113から復号音声データとして出力されるべき音声再生基準時刻を取得し、記憶する。
On the other hand, the reproduction reference
以下、出力タイミング検出部122、および算出部126の動作については、まず、先頭の復号映像データと先頭の復号音声データについて出力タイミングが検出され、再生基準時刻と比較される場合について説明する。
Hereinafter, regarding the operations of the output
記録部121から出力される復号映像データは出力タイミング検出部122に入力される。出力タイミング検出部122に入力された復号映像データは、1画像毎に、映像データ照合部122aで、先頭の1画像の復号映像データを示す照合対象映像データ123と比較照合される。映像データ照合部122aは、その照合対象映像データ123と一致する復号映像データを検出する。そして、照合対象映像データ123と一致する復号映像データを検出したタイミングを映像データ出力タイミングとして検出する。そして、照合対象映像データ123と一致する復号映像データが検出された後、比較照合される照合対象映像データ123は、2画像目の復号映像データを示す照合対象映像データ123になる。
The decoded video data output from the
同様に、記録部121から出力される復号音声データは出力タイミング検出部122に入力される。出力タイミング検出部122に入力された復号音声データは、所定単位時間連続する復号音声データ毎に、音声データ照合部122bで、先頭の所定単位時間連続する連続復号音声データを示す照合対象音声データ124と比較照合される。音声データ照合部122bは、その照合対象音声データ124と一致する復号音声データを検出する。そして、照合対象音声データ124と一致する復号音声データを検出したタイミングを音声データ出力タイミングとして検出する。そして、照合対象音声データ124と一致する復号音声データが検出された後、比較照合される照合対象音声データ124は、2組目の所定単位時間連続する連続復号音声データを示す照合対象音声データ124になる。
Similarly, the decoded audio data output from the
映像データ照合部122aで検出された先頭の1画像の復号映像データの映像データ出力タイミング、および音声データ照合部122bで検出された先頭の所定単位時間連続する復号音声データの音声データ出力タイミングで、検出信号が算出部126のカウンタ126aに入力される。そして、カウンタ126aは、上記映像データ出力タイミングと上記音声データ出力タイミングのうち早い方のタイミングで、リセットされるとともに時間経過に応じた値のカウントを開始し、もう一方のタイミングでのカウント値を先頭の映像および音声の映像音声出力間隔として出力する。
At the video data output timing of the decoded video data of the first one image detected by the video
一方、再生基準時刻取得部125に記憶された映像再生基準時刻、および音声再生基準時刻のうち、先頭の1画像の符号化映像データに含まれていた映像再生基準時刻と先頭の所定単位時間連続する符号化音声データに含まれていた音声再生基準時刻とが算出部126の映像音声再生基準間隔算出部126bに入力される。そして、映像音声再生基準間隔算出部126bは、上記映像再生基準時刻と上記音声再生基準時刻との差を算出し、先頭の映像再生基準時刻と先頭の音声再生基準時刻との基準間隔として出力する。
On the other hand, among the video playback reference time and the audio playback reference time stored in the playback reference
先頭の映像および音声の映像音声出力間隔と基準間隔とは、同期ずれ時間算出部126cに入力される。そして、同期ずれ時間算出部126cによって、上記映像音声出力間隔と上記基準間隔との差が同期ずれ時間として算出される。このように、再生装置が正常に映像データと音声データとを同期させているかどうかが定量的に評価される。
The video / audio output interval and the reference interval of the first video and audio are input to the synchronization shift
出力タイミング検出部122、および算出部126の上記のような動作が、比較照合される照合対象映像データ123と照合対象音声データ124とがそれぞれ切り替わることによって、次には2画像目の復号映像データと2組目の所定単位時間連続する連続復号音声データについて行われ、その次には3画像目の復号映像データと3組目の所定単位時間連続する連続復号音声データについて行われ、それ以降も繰り返される。このように、映像データと音声データとが同期しているかどうかが、複数画像の復号映像データおよび複数組の所定単位時間連続する連続復号音声データのそれぞれについて評価される。
The operations described above of the output
判定部127は、算出部126によって出力される同期ずれ時間を所定の閾値と比較し、同期ずれ時間が所定の閾値より小さい場合は判定信号として“0”を出力し、同期ずれ時間が所定の閾値より大きい場合は判定信号として“1”を出力する。
The
映像データ復号部112は、判定信号の値が“1”の時、判定信号の値が“0”の時よりも1画像あたりの画素数を少なくしたりビットレートを減らす等して、処理時間の短い復号処理を行う。このように、映像音声同期検出装置120により、検証機能付き映像音声再生装置110に生じる映像データと音声データとの同期ずれが、解消または低減される。
When the value of the determination signal is “1”, the video
本実施形態において、記録部121は、映像データ復号部112が出力するのと同じ速度で復号映像データを出力するので、照合対象映像データ123と一致する復号映像データが検出されたタイミングが、照合対象映像データ123と一致する復号映像データが映像データ復号部112から出力されたタイミングとして扱われている。音声データについても同様である。しかし、必ずしも記録部121は、データを記録する速度とデータを読み出す速度が等しくなるように構成されなくてもよい。算出部126のカウンタ126aにおいて、記録部121における記録速度と読み出し速度の比に応じたクロックで、再生基準時刻取得部125で算出される基準間隔と同じ時間単位の映像音声出力間隔が得られればよい。
In this embodiment, the
また、復号映像データが映像データ復号部112から出力されたタイミングや復号音声データが音声データ復号部113から出力されたタイミング、すなわち映像データ出力タイミングや音声データ出力タイミングは、必ずしも、記録部121から復号映像データや復号音声データが出力されたタイミングを検出することにより検出されなくてもよい。例えば、記録部121が、復号映像データや復号音声データに、それぞれの映像データ出力タイミングや音声データ出力タイミングをタイムスタンプとして付して記録するようになっていた場合、それらのタイムスタンプを読み出すことによって検出してもよい。
Further, the timing at which the decoded video data is output from the video
また、本実施形態では、再生基準時刻取得部125において、各映像再生基準時刻と各音声再生基準時刻が取得される際に、再生基準時刻の時間単位を、算出部126において求められる映像音声出力間隔と合わせるようにしていたが、時間単位が合わせられるのは必ずしも再生基準時刻取得部125でなくてもよい。算出部126で、再生基準時刻の基準間隔と映像音声出力間隔との差を算出する際に、基準間隔と映像音声出力間隔の時間単位が同じになっていればよい。したがって、例えば、再生基準時刻取得部125では、映像再生時刻情報と音声再生時刻情報がそのまま記憶され、算出部126の映像音声再生基準間隔算出部126bにおいてそれらの差が算出され、その算出された差が映像音声出力間隔と同じ時間単位となるように換算されるようになっていてもよい。
Further, in the present embodiment, when the reproduction reference
《発明の実施形態1の変形例》
実施形態1の映像音声同期検出装置120は、算出部126に代えて、図4に示す算出部226を備えてもよい。
<< Modification of Embodiment 1 of the Invention >>
The video / audio
算出部226は、算出部126のカウンタ126aに代えて、映像データ出力タイミングカウンタ226a、音声データ出力タイミングカウンタ226b、および映像音声出力間隔算出部226cを備えている。
The
映像データ出力タイミングカウンタ226aは、所定のタイミングでカウント値をリセットするとともに時間経過に応じた値のカウントを開始し、映像データ出力タイミングでカウント値を出力するようになっている。
The video data
音声データ出力タイミングカウンタ226bは、映像データ出力タイミングカウンタ226aがカウントを開始するのと同じ所定のタイミングでカウント値をリセットするとともに時間経過に応じた値のカウントを開始し、音声データ出力タイミングでカウント値を出力するようになっている。
The audio data
映像音声出力間隔算出部226cは、映像データ出力タイミングカウンタ226aによって出力されるカウント値と音声データ出力タイミングカウンタ226bによって出力されるカウント値との差を映像音声出力間隔として出力するようになっている。
The video / audio output
−動作−
映像データ照合部122aと音声データ照合部122bとが同時に照合動作を開始し、その照合動作の開始と同時に映像データ出力タイミングカウンタ226aと音声データ出力タイミングカウンタ226bがカウントを開始する場合の算出部226の動作を例として説明する。
-Operation-
The video
映像データ照合部122aと音声データ照合部122bとが照合動作を開始すると、同時に映像データ出力タイミングカウンタ226aと音声データ出力タイミングカウンタ226bがリセットされるとともに、時間経過に応じた値のカウントを開始する。映像データ出力タイミングカウンタ226aは、映像データ出力タイミングでカウント値を出力する。音声データ出力タイミングカウンタ226bは、音声データ出力タイミングでカウント値を出力する。そして、映像音声出力間隔算出部226cは、映像データ出力タイミングカウンタ226aによって出力されたカウント値と音声データ出力タイミングカウンタ226bによって出力されたカウント値との差を映像音声出力間隔として同期ずれ時間算出部126cに出力する。
When the video
《発明の実施形態2》
実施形態2のコーデックシステムは、実施形態1のコーデックシステムの出力タイミング検出部122と算出部126に代えて、図5に示すような出力タイミング検出部122と算出部326を備えている。
<< Embodiment 2 of the Invention >>
The codec system according to the second embodiment includes an output
本実施形態の映像データ照合部122aは、実施形態1の映像データ照合部122aの機能に加え、算出部326の不一致画像数カウンタ326aに対し、照合対象映像データ123と記録部121から順次出力される各画像の復号映像データとが一致したことを示す信号、および不一致であったことを示す信号を不一致画像数カウンタ326aに出力する機能を有している。
In addition to the function of the video
本実施形態において、音声データ照合部122bは、先頭の所定単位時間連続する連続復号音声データを示す照合対象音声データ124についての比較照合しか行わず、先頭の所定単位時間連続する復号音声データの音声データ出力タイミングを検出したあとは、他の検出を行わないようになっている。
In the present embodiment, the audio
算出部326は、カウンタ126a、不一致画像数カウンタ326a、出力時刻情報算出部326b、映像音声再生基準間隔算出部326c、および同期ずれ時間算出部326dを備えている。
The
不一致画像数カウンタ326aは、映像データ照合部122aから不一致を示す信号が入力されると、保持する値に1を加算するようになっている。また、不一致画像数カウンタ326aの値は、映像データ照合部122aから一致を示す信号が入力されると、出力時刻情報算出部326bに出力され、0にリセットされる。不一致は、例えば、伝送経路上の問題から映像データ復号部112に対する符号化映像データの供給が遅れ、所定の1画像の復号映像データが再生時刻情報に示されるタイミングで出力されるのに間に合わず、上記再生時刻情報に示されるタイミングで前の画像の復号映像データがそのまま出力されることによって生じる。
The mismatched
出力時刻情報算出部326bは、まず、カウンタ126aから出力される先頭の1画像の復号映像データの映像データ出力タイミングと先頭の所定単位時間連続する復号音声データの音声データ出力タイミング(以下、先頭音声データ出力タイミング)との映像音声出力間隔を記憶するようになっている。そして2画像目以降の照合対象映像データ123と一致する復号映像データが検出される毎に、記憶されている映像音声出力間隔に、リセットされる前の不一致画像数カウンタ326aの値に1を加算した値と1画像あたりの出力時間との積を加算し、新たな映像音声出力間隔として記憶するようになっている。
First, the output time
すなわち、n番目の画像の復号映像データの映像データ出力タイミングと先頭音声データ出力タイミングとの映像音声出力間隔は以下の式によって算出される。 That is, the video / audio output interval between the video data output timing of the decoded video data of the nth image and the head audio data output timing is calculated by the following equation.
{(n番目の画像の復号映像データの映像データ出力タイミング)−(先頭音声データ出力タイミング)}
={(n−1番目の画像の復号映像データの映像データ出力タイミング)−(先頭音声データ出力タイミング)}
+1画像あたりの出力時間×{(不一致画像数カウンタ326aの値)+1}
映像音声再生基準間隔算出部326cは、再生基準時刻取得部125から出力される先頭の1画像の符号化映像データに含まれていた映像再生基準時刻と先頭の所定単位時間連続する符号化音声データに含まれていた音声再生基準時刻(以下、先頭音声再生基準時刻)の基準間隔を算出するようになっている。そして、2番目以降の各画像の符号化映像データについても、それぞれに含まれる映像再生基準時刻と先頭の音声の音声再生基準時刻との基準間隔を算出するようになっている。
{(Video data output timing of decoded video data of nth image) − (Start audio data output timing)}
= {(Video data output timing of decoded video data of (n-1) th image)-(Start audio data output timing)}
+1 output time per image × {(value of mismatched
The video / audio reproduction reference
同期ずれ時間算出部326dは、記憶された映像音声出力間隔とそれに対応する基準間隔との差を同期ずれ時間として算出し、出力するようになっている。同期ずれ時間として算出される値を以下の式に示す。
The synchronization deviation
同期ずれ時間={(n番目の画像の復号映像データの映像データ出力タイミング)−(先頭音声データ出力タイミング)}−{(n番目の画像の映像再生基準時刻)−(先頭音声再生基準時刻)} Synchronous shift time = {(video data output timing of decoded video data of nth image) − (start audio data output timing)} − {(video playback reference time of nth image) − (start audio playback reference time) }
−動作−
次に、上記のように構成された本実施形態の出力タイミング検出部122と算出部326の動作について説明する。
-Operation-
Next, operations of the output
まず、映像データ照合部122aが先頭の1画像の復号映像データの映像データ出力タイミングを検出し、音声データ照合部122bが先頭の所定単位時間連続する復号音声データの音声データ出力タイミングを検出し、同期ずれ時間を算出する動作は、実施形態1と同様である。
First, the video
映像データ照合部122aが先頭の画像の照合対象映像データ123と一致する復号映像データを検出してからの各部の動作について説明する。
The operation of each unit after the video
映像データ照合部122aが先頭の画像の照合対象映像データ123と一致する復号映像データを検出すると、不一致画像数カウンタ326aの値は0にリセットされる。また、照合される照合対象映像データ123が2画像目の復号映像データを示す照合対象映像データ123になる。そして、映像データ照合部122aは、2画像目の復号映像データを示す照合対象映像データ123を、入力される復号映像データと1画像毎に比較照合する。不一致の場合は、不一致画像数カウンタ326aの保持する値に1加算される。一致すると、不一致画像数カウンタ326aの保持する値が出力時刻情報算出部326bに出力され、0にリセットされる。
When the video
2画像目の復号映像データを示す照合対象映像データ123と復号映像データとの一致が検出されると、出力時刻情報算出部326bは、その時記憶されている先頭の映像および音声の映像音声出力間隔に、リセットされる前の不一致画像数カウンタ326aの値に1を加算した値と1画像あたりの出力時間との積を加算した値を、新たな映像音声出力間隔として記憶する。
When the matching between the collation
一方、映像音声再生基準間隔算出部326cは、2画像目の映像再生基準時刻と先頭の音声の音声再生基準時刻との差を基準間隔として算出する。
On the other hand, the video / audio reproduction reference
そして、同期ずれ時間算出部326dは、出力時刻情報算出部326bに記憶されている2画像目の復号映像データの映像データ出力タイミングと先頭音声データ出力タイミングとの差である映像音声出力間隔と2画像目の映像再生基準時刻と先頭の音声の音声再生基準時刻との差である基準間隔との差を同期ずれ時間として算出する。
Then, the synchronization deviation
上記のような動作が、3画像目の復号映像データ以降についても繰り返される。 The above operation is repeated for the decoded image data after the third image.
なお、本実施形態の不一致画像数カウンタ326aに代えて、各照合対象映像データ123について一致する復号映像データが検出された後、次の照合対象映像データ123について一致する復号映像データが検出されるまでの照合回数、すなわち各照合対象映像データ123についての照合回数をカウントするカウンタを備え、出力時刻情報算出部326bは、記憶されている映像音声出力間隔に、カウンタの値と1画像あたりの出力時間との積を加算した値を、新たな映像音声出力間隔として記憶するようにしてもよい。
In addition, instead of the mismatched
《その他の実施形態》
本発明は、データの符号化および復号が、上記各実施形態のように記憶媒体130にデータを記憶させるために行われる場合に限らず、データを所定の伝送経路で伝送するために行われる場合等にも適用できる。
<< Other Embodiments >>
The present invention is not limited to the case where the encoding and decoding of data is performed for storing data in the
上記実施形態において、照合対象映像データ123は複数画像分記憶され、照合対象音声データ124は複数組の所定単位時間連続する復号音声データ分記憶される構成であったが、必ずしも一連の映像データや音声データについての同期検出動作の開始時に、一連のすべての照合対象映像データ123や照合対象音声データ124が記憶されている必要はない。例えば、映像データ復号部112や音声データ復号部113から順次入力されるようにしてもよい。
In the above embodiment, the verification
また、実施形態2では、先頭の復号音声データの音声データ出力タイミングと各復号映像データの映像データ出力タイミングとの映像音声出力間隔とそれに対応する基準間隔との差が同期ずれ時間として順次算出されるようになっていたが、逆に、先頭の復号映像データの映像データ出力タイミングと各復号音声データの音声データ出力タイミングとの映像音声出力間隔とそれに対応する基準間隔との差が同期ずれ時間として順次算出されるように構成してもよい。 In the second embodiment, the difference between the audio / video output interval between the audio data output timing of the first decoded audio data and the video data output timing of each decoded video data and the corresponding reference interval is sequentially calculated as the synchronization shift time. Conversely, the difference between the video / audio output interval between the video data output timing of the first decoded video data and the audio data output timing of each decoded audio data and the corresponding reference interval is the synchronization shift time. May be calculated sequentially.
また、上記実施形態では、判定信号の値が“1”の時、判定信号の値が“0”の時よりも1画像あたりの画素数を少なくしたりビットレートを減らす等して、処理時間の短い復号処理を行うことにより、映像データと音声データとの同期ずれを解消または低減するようになっていたが、同期ずれを低減する方法はこれに限らない。例えば、映像データ出力タイミングが早いことにより同期ずれ時間が大きくなっている場合は、復号映像データを映像データ復号部112が遅らせて出力し、音声データ出力タイミングが早いことにより同期ずれ時間が大きくなっている場合は、復号音声データを音声データ復号部113が遅らせて出力するようにしてもよい。
In the above embodiment, when the value of the determination signal is “1”, the processing time is reduced by reducing the number of pixels per image or reducing the bit rate compared to when the value of the determination signal is “0”. However, the method of reducing the synchronization shift is not limited to this, but the synchronization shift between the video data and the audio data is eliminated or reduced. For example, when the video data output timing is early and the synchronization deviation time is long, the video
また、上記実施形態において、映像再生時刻情報と音声再生時刻情報が、多重分離部111から出力される符号化映像データと符号化音声データとから読み取られるようになっていたが、再生基準時刻取得部125が映像再生時刻情報と音声再生時刻情報を得る方法はこれに限らない。例えば、多重化部105が、付加する映像再生時刻情報と音声再生時刻情報とを再生基準時刻取得部125に出力し、記録させるようにしてもよい。
In the above embodiment, the video playback time information and the audio playback time information are read from the encoded video data and the encoded audio data output from the demultiplexing unit 111. The method by which the
また、上記実施形態において、算出部は、|映像データ出力タイミング−音声データ出力タイミング|−|映像再生基準時刻−音声再生基準時刻|という順序の演算が行われて同期ずれ時間が算出されるように構成されていたが、|映像データ出力タイミング−映像再生基準時刻|−|音声データ出力タイミング−音声再生基準時刻|という順序の演算が行われて同期ずれ時間が算出されるように構成されてもよい。 In the above-described embodiment, the calculation unit performs the calculation of the order of | video data output timing−audio data output timing |-| video playback reference time−audio playback reference time | However, the synchronization deviation time is calculated by performing the following calculation: | video data output timing-video playback reference time |-| audio data output timing-audio playback reference time | Also good.
本発明に係る映像音声同期検出装置、および検証機能付き映像音声再生システムは、再生時に時刻情報が付かない映像データと音声データを用いて再生装置を評価できるという効果を有し、例えば、符号化された映像データと音声データを復号し、復号した映像データと音声データを再生時刻情報を用いて同期させて出力する装置の同期動作を、出力される映像データと音声データの同期を測定することによって検証する技術等として有用である。 The video / audio synchronization detection apparatus and the video / audio reproduction system with a verification function according to the present invention have an effect that the reproduction apparatus can be evaluated using video data and audio data without time information during reproduction. Decoding the video data and audio data, and synchronizing the output of the decoded video data and audio data using the reproduction time information and measuring the synchronization of the output video data and audio data This is useful as a technology to verify by
100 映像音声符号化多重装置
101 映像データ発生部
102 映像データ符号化部
103 音声データ発生部
104 音声データ符号化部
105 多重化部
110 検証機能付き映像音声再生装置
111 多重分離部
112 映像データ復号部
113 音声データ復号部
120 映像音声同期検出装置
121 記録部
122 出力タイミング検出部
122a 映像データ照合部
122b 音声データ照合部
123 照合対象映像データ
124 照合対象音声データ
125 再生基準時刻取得部
126 算出部
126a カウンタ
126b 映像音声再生基準間隔算出部
126c 同期ずれ時間算出部
127 判定部
130 記憶媒体
226 算出部
226a 映像データ出力タイミングカウンタ
226b 音声データ出力タイミングカウンタ
226c 映像音声出力間隔算出部
326 算出部
326a 不一致画像数カウンタ
326b 出力時刻情報算出部
326c 映像音声再生基準間隔算出部
326d 同期ずれ時間算出部
DESCRIPTION OF
Claims (14)
上記映像音声再生装置が所定の1画像の復号映像データを出力する映像データ出力タイミング、および上記映像音声再生装置が所定単位時間連続する所定の連続復号音声データを出力する音声データ出力タイミングを検出する出力タイミング検出部と、
上記符号化映像データまたは符号化音声データに含まれる再生時刻情報に基づいて、上記所定の1画像の復号映像データが出力されるべき映像再生基準時刻と上記所定の連続音声データが出力されるべき音声再生基準時刻とを取得する再生基準時刻取得部と、
上記映像データ出力タイミングと上記音声データ出力タイミングとの間隔である映像音声出力間隔と、上記映像再生基準時刻と上記音声再生基準時刻との基準間隔との差を同期ずれ時間として算出する算出部と、
を備えたことを特徴とする映像音声同期検出装置。 A video / audio synchronization detection device for verifying a synchronization operation of a video / audio reproduction device that decodes encoded video data and encoded audio data and outputs the decoded video data and decoded audio data in synchronization with each other,
Video data output timing at which the video / audio reproduction device outputs decoded video data of one predetermined image, and audio data output timing at which the video / audio reproduction device outputs predetermined continuous decoded audio data continuous for a predetermined unit time are detected. An output timing detector;
Based on the playback time information included in the encoded video data or the encoded audio data, the video playback reference time at which the decoded video data of the predetermined one image should be output and the predetermined continuous audio data should be output A reproduction reference time acquisition unit for acquiring the audio reproduction reference time;
A calculation unit that calculates a difference between a video / audio output interval, which is an interval between the video data output timing and the audio data output timing, and a reference interval between the video reproduction reference time and the audio reproduction reference time as a synchronization shift time; ,
An audio / video synchronization detection apparatus comprising:
上記出力タイミング検出部は、
上記所定の1画像の復号映像データに対応する照合対象映像データを、上記映像音声再生装置が順次出力する各復号映像データと照合し、上記照合対象映像データと一致する復号映像データを検出する映像データ照合部と、
上記所定単位時間連続する所定の連続復号音声データに対応する照合対象音声データを、上記映像音声再生装置が順次出力する各復号音声データと照合し、上記照合対象音声データと一致する復号音声データを検出する音声データ照合部と、
を備え、
上記照合対象映像データに一致する復号映像データが出力されたタイミングを上記映像データ出力タイミングとして検出し、
上記照合対象音声データに一致する復号音声データが出力されたタイミングを上記音声データ出力タイミングとして検出するようになっていることを特徴とする映像音声同期検出装置。 The video / audio synchronization detection apparatus according to claim 1,
The output timing detector is
Video for collating target video data corresponding to decoded video data of one predetermined image with each decoded video data sequentially output by the video / audio reproduction device, and detecting decoded video data matching the target video data A data verification unit;
The collation target audio data corresponding to the predetermined continuous decoded audio data continuous for the predetermined unit time is collated with each decoded audio data sequentially output by the video / audio reproduction device, and the decoded audio data matching the collation target audio data is obtained. A voice data matching unit to be detected;
With
The timing at which the decoded video data that matches the verification target video data is output is detected as the video data output timing,
A video / audio synchronization detecting apparatus, wherein a timing at which decoded audio data matching the verification target audio data is output is detected as the audio data output timing.
上記映像データ照合部は、複数画像の照合対象映像データについて、順次、それぞれと一致する復号映像データを検出し、上記算出部は、上記一致が検出された各復号映像データについての上記同期ずれ時間を算出することを特徴とする映像音声同期検出装置。 The video / audio synchronization detection device according to claim 2,
The video data collating unit sequentially detects decoded video data that matches each of video data to be collated of a plurality of images, and the calculating unit detects the synchronization deviation time for each decoded video data in which the match is detected. An audio / video synchronization detection apparatus characterized by calculating
上記映像データ照合部は、
各照合対象映像データについて一致する復号映像データが検出された後、次の照合対象映像データについて一致する復号映像データが検出されるまでの照合回数をカウントする画像数カウンタを備え、
上記算出部は、
各照合対象映像データに一致する復号映像データが出力されるごとに、前回一致した復号映像データが出力された際の上記映像音声出力間隔に、上記画像数カウンタの値と1画像の出力時間との積を加算した値を、上記各照合対象映像データに一致する復号映像データについての映像音声出力間隔として求めることを特徴とする映像音声同期検出装置。 The video / audio synchronization detection apparatus according to claim 3,
The video data verification unit
An image number counter that counts the number of matchings until the matching decoded video data is detected for the next matching target video data after the matching decoded video data is detected for each matching target video data;
The calculation unit is
Each time the decoded video data that matches each verification target video data is output, the value of the image number counter, the output time of one image, and the output time of the video / audio output when the decoded video data that matches the previous time is output. A video / audio synchronization detecting apparatus that obtains a value obtained by adding the products of the two as a video / audio output interval for decoded video data that matches each of the verification target video data.
上記音声データ照合部は、複数組の照合対象復号音声データについて、順次、それぞれと一致する復号音声データを検出し、上記算出部は、上記一致が検出された各復号音声データについての上記同期ずれ時間を算出するようになっていることを特徴とする映像音声同期検出装置。 The video / audio synchronization detection device according to claim 2,
The voice data collating unit sequentially detects decoded voice data that matches each of a plurality of sets of decoding target decoded voice data, and the calculation unit includes the synchronization deviation for each decoded voice data in which the match is detected. A video / audio synchronization detecting apparatus characterized in that time is calculated.
上記音声データ照合部は、
各照合対象復号音声データについて一致する復号音声データが検出された後、次の照合対象復号音声データについて一致する復号音声データが検出されるまでの照合回数をカウントする組数カウンタを備え、
上記算出部は、
各照合対象音声データに一致する復号音声データが出力されるごとに、前回一致した復号音声データが出力された際の上記映像音声出力間隔に、上記組数カウンタの値と1組の所定単位時間連続する連続復号音声データの出力時間との積を加算した値を、上記各照合対象音声データに一致する復号音声データについての映像音声出力間隔として求めることを特徴とする映像音声同期検出装置。 The video / audio synchronization detection apparatus according to claim 5,
The voice data verification unit
A set number counter that counts the number of collations until the matching decoded voice data is detected for the next matching target decoded voice data after the matching decoded voice data is detected for each matching target decoded voice data;
The calculation unit is
Each time decoded audio data that matches each verification target audio data is output, the value of the set counter and one set of predetermined unit time are set at the video and audio output interval when the decoded audio data that matched previously is output. A video / audio synchronization detecting apparatus, wherein a value obtained by adding a product of output times of continuous continuous decoded audio data is obtained as a video / audio output interval for decoded audio data that matches each of the verification target audio data.
上記算出部は、
上記映像データ出力タイミングと上記音声データ出力タイミングのうち早い方のタイミングで時間経過に応じた値のカウントを開始し、もう一方のタイミングでのカウント値を上記映像音声出力間隔として出力するカウンタを備えたことを特徴とする映像音声同期検出装置。 The video / audio synchronization detection apparatus according to claim 1,
The calculation unit is
A counter that starts counting the value according to the passage of time at the earlier timing of the video data output timing and the audio data output timing and outputs the count value at the other timing as the video / audio output interval; A video / audio synchronization detecting apparatus characterized by the above.
上記算出部は、
所定のタイミングで時間経過に応じた値のカウントを開始し、上記映像データ出力タイミングでカウント値を出力する映像データ出力タイミングカウンタと、
上記所定のタイミングで時間経過に応じた値のカウントを開始し、上記音声データ出力タイミングでカウント値を出力する音声データ出力タイミングカウンタと、
上記映像データ出力タイミングカウンタによって出力されるカウント値と上記音声データ出力タイミングカウンタによって出力されるカウント値との差を上記映像音声出力間隔として出力する映像音声出力間隔算出部と、
を備えたことを特徴とする映像音声同期検出装置。 The video / audio synchronization detection apparatus according to claim 1,
The calculation unit is
A video data output timing counter that starts counting a value according to the passage of time at a predetermined timing and outputs a count value at the video data output timing;
An audio data output timing counter that starts counting a value according to the passage of time at the predetermined timing and outputs a count value at the audio data output timing;
A video / audio output interval calculation unit that outputs a difference between a count value output by the video data output timing counter and a count value output by the audio data output timing counter as the video / audio output interval;
An audio / video synchronization detection apparatus comprising:
さらに、上記同期ずれ時間を所定の閾値と比較する判定部を備えたことを特徴とする映像音声同期検出装置。 The video / audio synchronization detection apparatus according to claim 1,
The video / audio synchronization detecting apparatus further comprising a determination unit that compares the synchronization deviation time with a predetermined threshold value.
映像音声再生装置と、
を有する検証機能付き映像音声再生システムであって、
上記映像音声再生装置は、
符号化多重データを符号化映像データと符号化音声データとに分離する多重分離部と、
上記符号化映像データを復号する映像データ復号部と、
上記符号化音声データを復号する音声データ復号部と、
を備え、
復号された復号映像データと復号音声データとを同期させて出力する一方、
上記映像音声同期検出装置は、
上記復号映像データと上記復号音声データとの同期ずれ時間を検出することを特徴とする検証機能付き映像音声再生システム。 A video / audio synchronization detection apparatus according to claim 1;
A video / audio playback device;
A video / audio reproduction system with a verification function having
The video / audio reproduction device is
A demultiplexing unit that separates the encoded multiplexed data into encoded video data and encoded audio data;
A video data decoding unit for decoding the encoded video data;
An audio data decoding unit for decoding the encoded audio data;
With
While outputting decoded video data and decoded audio data in synchronization,
The video / audio synchronization detecting device is:
A video / audio reproduction system with a verification function, wherein a synchronization shift time between the decoded video data and the decoded audio data is detected.
上記同期ずれ時間を所定の閾値と比較する判定部を備え、
上記映像データ復号部は、処理時間が互いに異なる複数種類の復号処理を行う機能を有し、上記映像データ出力タイミングが遅いことにより上記同期ずれ時間が所定の閾値より大きい場合の方が、小さい場合よりも処理時間の短い復号処理を行うように構成されていることを特徴とする検証機能付き映像音声再生システム。 The video / audio reproduction system with verification function according to claim 10,
A determination unit that compares the synchronization deviation time with a predetermined threshold;
The video data decoding unit has a function of performing a plurality of types of decoding processes with different processing times, and the case where the synchronization deviation time is larger than a predetermined threshold due to the late video data output timing is smaller A video / audio reproduction system with a verification function, which is configured to perform a decoding process with a shorter processing time.
上記映像データ復号部は、1画像あたりの画素数を増減させることによって、上記処理時間が互いに異なる複数種類の復号処理を行うことを特徴とする検証機能付き映像音声再生システム。 The video / audio reproduction system with a verification function according to claim 11,
The video / audio reproduction system with a verification function, wherein the video data decoding unit performs a plurality of types of decoding processing with different processing times by increasing / decreasing the number of pixels per image.
上記映像データ復号部は、復号映像データのビットレートを増減させることによって、上記処理時間が互いに異なる複数種類の復号処理を行うことを特徴とする検証機能付き映像音声再生システム。 The video / audio reproduction system with a verification function according to claim 11,
The video / audio reproduction system with a verification function, wherein the video data decoding unit performs a plurality of types of decoding processing with different processing times by increasing / decreasing a bit rate of the decoded video data.
上記同期ずれ時間を所定の閾値と比較する判定部を備え、
上記映像データ復号部は、上記映像データ出力タイミングが早いことにより上記同期ずれ時間が所定の閾値より大きい場合、上記復号映像データを遅らせて出力させ、上記音声データ出力タイミングが早いことにより上記同期ずれ時間が所定の閾値より大きい場合、上記復号音声データを遅らせて出力させるように構成されていることを特徴とする検証機能付き映像音声再生システム。 The video / audio reproduction system with verification function according to claim 10,
A determination unit that compares the synchronization deviation time with a predetermined threshold;
The video data decoding unit delays and outputs the decoded video data when the synchronization shift time is greater than a predetermined threshold due to the video data output timing being early, and the audio data output timing is early. A video / audio reproduction system with a verification function, characterized in that when the time is larger than a predetermined threshold, the decoded audio data is delayed and output.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006130139A JP2007306110A (en) | 2006-05-09 | 2006-05-09 | Video audio synchronization detector, and video audio reproduction system having verification function |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006130139A JP2007306110A (en) | 2006-05-09 | 2006-05-09 | Video audio synchronization detector, and video audio reproduction system having verification function |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007306110A true JP2007306110A (en) | 2007-11-22 |
Family
ID=38839706
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006130139A Pending JP2007306110A (en) | 2006-05-09 | 2006-05-09 | Video audio synchronization detector, and video audio reproduction system having verification function |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007306110A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115695918A (en) * | 2023-01-05 | 2023-02-03 | 南昌宾果信息技术有限公司 | Multi-camera broadcast guide control method and device, readable storage medium and terminal equipment |
-
2006
- 2006-05-09 JP JP2006130139A patent/JP2007306110A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115695918A (en) * | 2023-01-05 | 2023-02-03 | 南昌宾果信息技术有限公司 | Multi-camera broadcast guide control method and device, readable storage medium and terminal equipment |
CN115695918B (en) * | 2023-01-05 | 2023-04-18 | 南昌宾果信息技术有限公司 | Multi-camera broadcast guide control method and device, readable storage medium and terminal equipment |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6163646A (en) | Apparatus for a synchronized playback of audio-video signals | |
US6078725A (en) | Apparatus for a synchronized playback of audio-video signals | |
JP3197766B2 (en) | MPEG audio decoder, MPEG video decoder and MPEG system decoder | |
US7359006B1 (en) | Audio module supporting audio signature | |
JP4991129B2 (en) | Video / audio playback apparatus and video / audio playback method | |
US7760770B2 (en) | Stream data processing apparatus and stream data processing method | |
US8045836B2 (en) | System and method for recording high frame rate video, replaying slow-motion and replaying normal speed with audio-video synchronization | |
EP2227029A2 (en) | Image processing apparatus, image processing method, and program | |
US20060274827A1 (en) | Apparatus and method for synchronized playback | |
US7961792B2 (en) | Robust system for maintaining audio/video synchronization during playback of multimedia streams with no embedded time stamps | |
JP3133630B2 (en) | MPEG system decoder | |
JP2006340066A (en) | Moving image encoder, moving image encoding method and recording and reproducing method | |
JP3856792B2 (en) | Signal processing device | |
JP2007306110A (en) | Video audio synchronization detector, and video audio reproduction system having verification function | |
US20150104158A1 (en) | Digital signal reproduction device | |
US8428422B2 (en) | Moving picture multiplexing apparatus, audio and video recording apparatus and moving picture multiplexing method | |
KR20100030574A (en) | Video recording and playback apparatus | |
US20110022400A1 (en) | Audio resume playback device and audio resume playback method | |
US8331757B2 (en) | Time code processing apparatus, time code processing method, program, and video signal playback apparatus | |
KR20080089721A (en) | Lip-synchronize method | |
JP3944845B2 (en) | Information processing apparatus and method, recording medium, and program | |
JPWO2006075457A1 (en) | Recording device | |
CN111131868B (en) | Video recording method and device based on player | |
JP4007575B2 (en) | Image / audio bitstream splitting device | |
JP2006310916A (en) | Audio video information decoding method, audio video information decoding device, and audio video information decoding program, and medium recorded with audio video information decoding program |