JP2007306110A - Video audio synchronization detector, and video audio reproduction system having verification function - Google Patents

Video audio synchronization detector, and video audio reproduction system having verification function Download PDF

Info

Publication number
JP2007306110A
JP2007306110A JP2006130139A JP2006130139A JP2007306110A JP 2007306110 A JP2007306110 A JP 2007306110A JP 2006130139 A JP2006130139 A JP 2006130139A JP 2006130139 A JP2006130139 A JP 2006130139A JP 2007306110 A JP2007306110 A JP 2007306110A
Authority
JP
Japan
Prior art keywords
video
audio
data
video data
decoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006130139A
Other languages
Japanese (ja)
Inventor
Hideaki Ishiba
秀昭 石羽
Takeshi Makino
剛 牧野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2006130139A priority Critical patent/JP2007306110A/en
Publication of JP2007306110A publication Critical patent/JP2007306110A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To evaluate a reproduction apparatus by a video audio synchronization detector using video data and audio data having no time information at the time of reproduction. <P>SOLUTION: An output timing section 122 detects a video data output timing at which a video data decoder 112 outputs predetermined decoded video data, and an audio data output timing at which an audio data decoder 113 outputs predetermined decoded audio data. A reproduction time acquiring section 125 acquires a video reproduction reference time when the decoded video data of predetermined one image should be outputted, and an audio reproduction reference time when the predetermined continuous audio data should be outputted, on the basis of the reproduction time information included in the encoded video data or the encoded audio data. A calculator 126 calculates, as a synchronization shift time, a difference between a video audio output interval as an interval between the video data output timing and the audio data output timing, and a reference interval between the video reproduction reference time and the audio reproduction reference time. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は、符号化された映像データと音声データを復号し、復号した映像データと音声データを再生時刻情報を用いて同期させて出力する装置の同期動作を、出力される映像データと音声データの同期を測定することによって検証する技術に関するものである。   The present invention decodes encoded video data and audio data, and synchronizes the output of the decoded video data and audio data using reproduction time information, and outputs the synchronized video data and audio data. The present invention relates to a technique for verifying by measuring the synchronization.

従来、MPEG(Moving Picture Experts Group)規格等を適用し、別々に圧縮し、多重化して映像データおよび音声データを伝送したり記憶媒体に記録する技術が知られている。このような技術を用いて伝送または記録された多重化圧縮データは、再生装置に入力され、多重分離される。そして、分離された映像データと音声データがそれぞれ伸長されて再生される。このようないわゆるコーデックシステムにおいては、多重化する際に、映像データと音声データに、それぞれ各所定単位のデータの再生時刻を示すタイムスタンプと呼ばれる再生時刻情報が埋め込まれる。そして、再生装置がそのタイムスタンプに基づくタイミングで映像データと音声データとを再生する。   2. Description of the Related Art Conventionally, there has been known a technique for applying video (Experiment Picture Group) (MPEG) standards, etc., separately compressing and multiplexing to transmit video data and audio data or record them on a storage medium. Multiplexed compressed data transmitted or recorded using such a technique is input to a playback device and demultiplexed. Then, the separated video data and audio data are decompressed and reproduced. In such a so-called codec system, when multiplexing, reproduction time information called a time stamp indicating the reproduction time of each predetermined unit of data is embedded in video data and audio data. Then, the playback device plays back video data and audio data at a timing based on the time stamp.

ここで、再生装置が正常にタイムスタンプに基づくタイミングで映像データと音声データを再生しているかを検証する方法として、再生される映像と音声が同期しているか、例えば、人間が話す時の唇の動きと声が同期しているかを人間が観察することによって検証する方法がある。   Here, as a method for verifying whether or not the playback device is normally playing back video data and audio data at a timing based on the time stamp, the video and audio to be played back are synchronized, for example, the lip when a human speaks There is a method of verifying by observing whether the movement and voice are synchronized.

ところが、このように人間が観察して検証する方法には、定量的な評価ができないという問題がある。そこで、再生装置が映像データと音声データをタイムスタンプにどの程度忠実なタイミングで再生しているかを定量的に評価できるようにするAV同期検出装置が特許文献1に提案されている。   However, there is a problem that such a method of human observation and verification cannot be quantitatively evaluated. Therefore, Patent Document 1 proposes an AV synchronization detection device that can quantitatively evaluate how faithfully the playback device is playing back video data and audio data with respect to a time stamp.

同文献の図1に示されるAV同期検出装置において、映像信号発生手段1は、フレーム番号に対応した時刻が画面右下にスーパーインポーズされた映像の映像データを発生する。一方、タイムコード発生手段3は、LTC(Longitudinal Time Code)信号を使用してタイムコードを発生する。そして、表示装置10に表示される映像の画面右下にスーパーインポーズされた時刻と、タイムコード読取手段12に表示されるタイムコードとが比較される。この比較により、タイムスタンプで示される再生タイミングと実際に再生されるタイミングの時間差を算出することができる。つまり、再生装置が映像データと音声データをタイムスタンプにどの程度忠実なタイミングで再生しているかを定量的に評価できる。
特開平8−172597号公報
In the AV synchronization detection apparatus shown in FIG. 1 of the same document, the video signal generating means 1 generates video data of video in which the time corresponding to the frame number is superimposed on the lower right of the screen. On the other hand, the time code generating means 3 generates a time code using an LTC (Longitudinal Time Code) signal. Then, the time superimposed on the lower right of the screen of the video displayed on the display device 10 is compared with the time code displayed on the time code reading means 12. By this comparison, the time difference between the reproduction timing indicated by the time stamp and the actual reproduction timing can be calculated. That is, it is possible to quantitatively evaluate how faithfully the playback device plays back video data and audio data with respect to the time stamp.
JP-A-8-172597

しかしながら、上記従来のAV同期検出装置による検証方法では、時刻情報が付された状態で再生される映像データと音声データを用いてしか評価できない。したがって、映像信号発生手段1やタイムコード発生手段3等の、時刻情報が付された状態で再生される映像データと音声データを生成するための特別な装置が必要となっていた。また、タイムコード読取手段12等の、再生される音声データから時刻情報を読み取るための装置も必要となっていた。   However, the verification method using the conventional AV sync detection apparatus can be evaluated only by using video data and audio data reproduced with time information attached. Therefore, a special device for generating video data and audio data to be reproduced with time information attached thereto, such as the video signal generating means 1 and the time code generating means 3, has been required. In addition, a device for reading time information from reproduced audio data, such as the time code reading means 12, has been required.

本発明は、上記の点に鑑み、映像音声同期検出装置により、再生時に時刻情報が付かない映像データと音声データを用いて再生装置を評価できるようにする。   In view of the above points, the present invention enables a video / audio synchronization detection device to evaluate a playback device using video data and audio data without time information during playback.

上記の課題を解決するため、請求項1の発明は、
符号化映像データおよび符号化音声データを復号し、復号映像データと復号音声データとを同期させて出力する映像音声再生装置の同期動作を検証するための映像音声同期検出装置であって、
上記映像音声再生装置が所定の1画像の復号映像データを出力する映像データ出力タイミング、および上記映像音声再生装置が所定単位時間連続する所定の連続復号音声データを出力する音声データ出力タイミングを検出する出力タイミング検出部と、
上記符号化映像データまたは符号化音声データに含まれる再生時刻情報に基づいて、上記所定の1画像の復号映像データが出力されるべき映像再生基準時刻と上記所定の連続音声データが出力されるべき音声再生基準時刻とを取得する再生基準時刻取得部と、
上記映像データ出力タイミングと上記音声データ出力タイミングとの間隔である映像音声出力間隔と、上記映像再生基準時刻と上記音声再生基準時刻との基準間隔との差を同期ずれ時間として算出する算出部と、
を備えたことを特徴とする。
In order to solve the above problems, the invention of claim 1
A video / audio synchronization detection device for verifying a synchronization operation of a video / audio reproduction device that decodes encoded video data and encoded audio data and outputs the decoded video data and decoded audio data in synchronization with each other,
Video data output timing at which the video / audio reproduction device outputs decoded video data of one predetermined image, and audio data output timing at which the video / audio reproduction device outputs predetermined continuous decoded audio data continuous for a predetermined unit time are detected. An output timing detector;
Based on the playback time information included in the encoded video data or the encoded audio data, the video playback reference time at which the decoded video data of the predetermined one image should be output and the predetermined continuous audio data should be output A reproduction reference time acquisition unit for acquiring the audio reproduction reference time;
A calculation unit that calculates a difference between a video / audio output interval, which is an interval between the video data output timing and the audio data output timing, and a reference interval between the video reproduction reference time and the audio reproduction reference time as a synchronization shift time; ,
It is provided with.

これにより、映像データ出力タイミングと音声データ出力タイミングとの差である映像音声出力間隔と映像再生基準時刻と音声再生基準時刻との差である基準間隔との差を同期ずれ時間として算出することにより、映像データと音声データとの同期を定量的に評価できる。   As a result, the difference between the video / audio output interval, which is the difference between the video data output timing and the audio data output timing, and the reference interval, which is the difference between the video playback reference time and the audio playback reference time, is calculated as the synchronization deviation time. The synchronization between video data and audio data can be quantitatively evaluated.

請求項2の発明は、
請求項1の映像音声同期検出装置であって、
上記出力タイミング検出部は、
上記所定の1画像の復号映像データに対応する照合対象映像データを、上記映像音声再生装置が順次出力する各復号映像データと照合し、上記照合対象映像データと一致する復号映像データを検出する映像データ照合部と、
上記所定単位時間連続する所定の連続復号音声データに対応する照合対象音声データを、上記映像音声再生装置が順次出力する各復号音声データと照合し、上記照合対象音声データと一致する復号音声データを検出する音声データ照合部と、
を備え、
上記照合対象映像データに一致する復号映像データが出力されたタイミングを上記映像データ出力タイミングとして検出し、
上記照合対象音声データに一致する復号音声データが出力されたタイミングを上記音声データ出力タイミングとして検出するようになっていることを特徴とする。
The invention of claim 2
The video / audio synchronization detection apparatus according to claim 1,
The output timing detector is
Video for collating target video data corresponding to decoded video data of one predetermined image with each decoded video data sequentially output by the video / audio reproduction device, and detecting decoded video data matching the target video data A data verification unit;
The collation target audio data corresponding to the predetermined continuous decoded audio data continuous for the predetermined unit time is collated with each decoded audio data sequentially output by the video / audio reproduction device, and the decoded audio data matching the collation target audio data is obtained. A voice data matching unit to be detected;
With
The timing at which the decoded video data that matches the verification target video data is output is detected as the video data output timing,
The timing at which decoded audio data that matches the verification target audio data is output is detected as the audio data output timing.

これにより、同期ずれを評価する対象の復号映像データと復号音声データを、照合によって特定し、検出できる。   As a result, the decoded video data and the decoded audio data to be evaluated for synchronization deviation can be identified and detected by collation.

請求項3の発明は、
請求項2の映像音声同期検出装置であって、
上記映像データ照合部は、複数画像の照合対象映像データについて、順次、それぞれと一致する復号映像データを検出し、上記算出部は、上記一致が検出された各復号映像データについての上記同期ずれ時間を算出することを特徴とする。
The invention of claim 3
The video / audio synchronization detection device according to claim 2,
The video data collating unit sequentially detects decoded video data that matches each of video data to be collated of a plurality of images, and the calculating unit detects the synchronization deviation time for each decoded video data in which the match is detected. Is calculated.

これにより、複数画像の映像データについて音声データとの同期ずれが評価されるので、複数画像の映像データを再生している途中に生じる同期ずれも評価でき、同期ずれが生じた画像を特定することもできる。   As a result, the synchronization deviation with the audio data is evaluated for the video data of the plurality of images, so that the synchronization deviation occurring during the reproduction of the video data of the plurality of images can be evaluated, and the image in which the synchronization deviation has occurred is identified. You can also.

請求項4の発明は、
請求項3の映像音声同期検出装置であって、
上記映像データ照合部は、
各照合対象映像データについて一致する復号映像データが検出された後、次の照合対象映像データについて一致する復号映像データが検出されるまでの照合回数をカウントする画像数カウンタを備え、
上記算出部は、
各照合対象映像データに一致する復号映像データが出力されるごとに、前回一致した復号映像データが出力された際の上記映像音声出力間隔に、上記画像数カウンタの値と1画像の出力時間との積を加算した値を、上記各照合対象映像データに一致する復号映像データについての映像音声出力間隔として求めることを特徴とする。
The invention of claim 4
The video / audio synchronization detection apparatus according to claim 3,
The video data verification unit
An image number counter that counts the number of matching times until the matching decoded video data is detected for the next matching target video data after the matching decoded video data is detected for each matching target video data;
The calculation unit is
Each time the decoded video data that matches each verification target video data is output, the value of the image number counter, the output time of one image, and the output time of the video / audio output when the decoded video data that matches the previous time is output. Is obtained as a video / audio output interval for decoded video data that matches each of the verification target video data.

これにより、各照合対象映像データに一致する復号映像データと所定の復号音声データとの差が順次、映像音声出力間隔として求められる。   As a result, the difference between the decoded video data matching the respective verification target video data and the predetermined decoded audio data is sequentially obtained as the video / audio output interval.

請求項5の発明は、
請求項2の映像音声同期検出装置であって、
上記音声データ照合部は、複数組の照合対象復号音声データについて、順次、それぞれと一致する復号音声データを検出し、上記算出部は、上記一致が検出された各復号音声データについての上記同期ずれ時間を算出するようになっていることを特徴とする。
The invention of claim 5
The video / audio synchronization detection device according to claim 2,
The voice data collating unit sequentially detects decoded voice data that matches each of a plurality of sets of decoding target decoded voice data, and the calculation unit includes the synchronization deviation for each decoded voice data in which the match is detected. It is characterized in that time is calculated.

これにより、複数組の所定単位時間連続する音声データについて映像データとの同期ずれが評価されるので、複数組の所定単位時間連続する音声データを再生している途中に生じる同期ずれも評価でき、同期ずれが生じた音声データを特定することもできる。   Thereby, since the synchronization deviation with the video data is evaluated for a plurality of sets of audio data continuous for a predetermined unit time, it is also possible to evaluate the synchronization deviation generated during the reproduction of a plurality of sets of audio data continuous for a predetermined unit time, It is also possible to specify audio data in which synchronization loss has occurred.

請求項6の発明は、
上記音声データ照合部は、
各照合対象復号音声データについて一致する復号音声データが検出された後、次の照合対象復号音声データについて一致する復号音声データが検出されるまでの照合回数をカウントする組数カウンタを備え、
上記算出部は、
各照合対象音声データに一致する復号音声データが出力されるごとに、前回一致した復号音声データが出力された際の上記映像音声出力間隔に、上記組数カウンタの値と1組の所定単位時間連続する連続復号音声データの出力時間との積を加算した値を、上記各照合対象音声データに一致する復号音声データについての映像音声出力間隔として求めることを特徴とする。
The invention of claim 6
The voice data verification unit
A set number counter that counts the number of collations until the matching decoded voice data is detected for the next matching target decoded voice data after the matching decoded voice data is detected for each matching target decoded voice data;
The calculation unit is
Each time decoded audio data that matches each verification target audio data is output, the value of the set counter and one set of predetermined unit time are set at the video and audio output interval when the decoded audio data that matched previously is output. A value obtained by adding a product of output times of continuous continuous decoded audio data is obtained as a video / audio output interval for decoded audio data that matches each of the verification target audio data.

これにより、各照合対象音声データに一致する復号音声データと所定の復号映像データとの差が順次、映像音声出力間隔として求められる。   As a result, the difference between the decoded audio data that matches each audio data to be verified and the predetermined decoded video data is sequentially obtained as the video / audio output interval.

請求項7の発明は、
請求項1の映像音声同期検出装置であって、
上記算出部は、
上記映像データ出力タイミングと上記音声データ出力タイミングのうち早い方のタイミングで時間経過に応じた値のカウントを開始し、もう一方のタイミングでのカウント値を上記映像音声出力間隔として出力するカウンタを備えたことを特徴とする。
The invention of claim 7
The video / audio synchronization detection apparatus according to claim 1,
The calculation unit is
A counter that starts counting the value according to the passage of time at the earlier timing of the video data output timing and the audio data output timing and outputs the count value at the other timing as the video / audio output interval; It is characterized by that.

請求項8の発明は、
請求項1の映像音声同期検出装置であって、
上記算出部は、
所定のタイミングで時間経過に応じた値のカウントを開始し、上記映像データ出力タイミングでカウント値を出力する映像データ出力タイミングカウンタと、
上記所定のタイミングで時間経過に応じた値のカウントを開始し、上記音声データ出力タイミングでカウント値を出力する音声データ出力タイミングカウンタと、
上記映像データ出力タイミングカウンタによって出力されるカウント値と上記音声データ出力タイミングカウンタによって出力されるカウント値との差を上記映像音声出力間隔として出力する映像音声出力間隔算出部と、
を備えたことを特徴とする。
The invention of claim 8
The video / audio synchronization detection apparatus according to claim 1,
The calculation unit is
A video data output timing counter that starts counting a value according to the passage of time at a predetermined timing and outputs a count value at the video data output timing;
An audio data output timing counter that starts counting a value according to the passage of time at the predetermined timing and outputs a count value at the audio data output timing;
A video / audio output interval calculation unit that outputs a difference between a count value output by the video data output timing counter and a count value output by the audio data output timing counter as the video / audio output interval;
It is provided with.

これらにより、カウンタを用いることにより、映像音声出力間隔を容易に算出できる。   Accordingly, the video / audio output interval can be easily calculated by using the counter.

請求項9の発明は、
請求項1の映像音声同期検出装置であって、
さらに、上記同期ずれ時間を所定の閾値と比較する判定部を備えたことを特徴とする。
The invention of claim 9
The video / audio synchronization detection apparatus according to claim 1,
In addition, a determination unit that compares the synchronization deviation time with a predetermined threshold value is provided.

これにより、算出された同期ずれ時間を、あらかじめ自由に設定された閾値と比較することによって映像データと音声データとの同期を評価できる。   Thereby, the synchronization between the video data and the audio data can be evaluated by comparing the calculated synchronization deviation time with a threshold value set freely in advance.

請求項10の発明は、
請求項1の映像音声同期検出装置と、
映像音声再生装置と、
を有する検証機能付き映像音声再生システムであって、
上記映像音声再生装置は、
符号化多重データを符号化映像データと符号化音声データとに分離する多重分離部と、
上記符号化映像データを復号する映像データ復号部と、
上記符号化音声データを復号する音声データ復号部と、
を備え、
復号された復号映像データと復号音声データとを同期させて出力する一方、
上記映像音声同期検出装置は、
上記復号映像データと上記復号音声データとの同期ずれ時間を検出することを特徴とする。
The invention of claim 10
A video / audio synchronization detection apparatus according to claim 1;
A video / audio playback device;
A video / audio reproduction system with a verification function having
The video / audio reproduction device is
A demultiplexing unit that separates the encoded multiplexed data into encoded video data and encoded audio data;
A video data decoding unit for decoding the encoded video data;
An audio data decoding unit for decoding the encoded audio data;
With
While outputting decoded video data and decoded audio data in synchronization,
The video / audio synchronization detecting device is:
A synchronization shift time between the decoded video data and the decoded audio data is detected.

これにより、映像音声再生装置の同期動作が、映像音声同期検出装置により検証される。   Thus, the synchronization operation of the video / audio reproduction device is verified by the video / audio synchronization detection device.

請求項11の発明は、
請求項10の検証機能付き映像音声再生システムであって、
上記同期ずれ時間を所定の閾値と比較する判定部を備え、
上記映像データ復号部は、処理時間が互いに異なる複数種類の復号処理を行う機能を有し、上記映像データ出力タイミングが遅いことにより上記同期ずれ時間が所定の閾値より大きい場合の方が、小さい場合よりも処理時間の短い復号処理を行うように構成されていることを特徴とする。
The invention of claim 11
The video / audio reproduction system with verification function according to claim 10,
A determination unit that compares the synchronization deviation time with a predetermined threshold;
The video data decoding unit has a function of performing a plurality of types of decoding processing with different processing times, and the case where the synchronization shift time is larger than a predetermined threshold due to the video data output timing being late is smaller It is configured to perform a decoding process with a shorter processing time.

請求項12の発明は、
請求項11の検証機能付き映像音声再生システムであって、
上記映像データ復号部は、1画像あたりの画素数を増減させることによって、上記処理時間が互いに異なる複数種類の復号処理を行うことを特徴とする。
The invention of claim 12
The video / audio reproduction system with a verification function according to claim 11,
The video data decoding unit performs a plurality of types of decoding processes with different processing times by increasing / decreasing the number of pixels per image.

請求項13の発明は、
請求項11の検証機能付き映像音声再生システムであって、
上記映像データ復号部は、復号映像データのビットレートを増減させることによって、上記処理時間が互いに異なる複数種類の復号処理を行うことを特徴とする。
The invention of claim 13
The video / audio reproduction system with a verification function according to claim 11,
The video data decoding unit performs a plurality of types of decoding processing with different processing times by increasing / decreasing the bit rate of the decoded video data.

請求項14の発明は、
請求項10の検証機能付き映像音声再生システムであって、
上記同期ずれ時間を所定の閾値と比較する判定部を備え、
上記映像データ復号部は、上記映像データ出力タイミングが早いことにより上記同期ずれ時間が所定の閾値より大きい場合、上記復号映像データを遅らせて出力させ、上記音声データ出力タイミングが早いことにより上記同期ずれ時間が所定の閾値より大きい場合、上記復号音声データを遅らせて出力させるように構成されていることを特徴とする。
The invention of claim 14
The video / audio reproduction system with verification function according to claim 10,
A determination unit that compares the synchronization deviation time with a predetermined threshold;
The video data decoding unit delays and outputs the decoded video data when the synchronization shift time is greater than a predetermined threshold due to the video data output timing being early, and the audio data output timing is early. When the time is larger than a predetermined threshold, the decoded audio data is output after being delayed.

これらにより、映像音声再生装置が出力する復号映像データと復号音声データとの同期ずれ時間が、映像音声同期検出装置によって評価され、同期ずれ時間が所定の閾値を超えている場合は、同期ずれが低減されるように映像音声同期検出装置が映像音声再生装置が制御される。   As a result, the synchronization deviation time between the decoded video data and the decoded audio data output by the video / audio reproduction device is evaluated by the video / audio synchronization detection device, and if the synchronization deviation time exceeds a predetermined threshold, the synchronization deviation is detected. The video / audio reproduction device is controlled by the video / audio synchronization detection device so that the video / audio synchronization device is reduced.

映像音声同期検出装置により、再生時に時刻情報が付かない映像データと音声データを用いて再生装置を評価できる。したがって、時刻情報が付された状態で再生される評価用の映像データと音声データを生成する特別な装置を備えることなく、再生装置が映像データと音声データをタイムスタンプにどの程度忠実なタイミングで再生しているかを評価できる。   With the video / audio synchronization detection device, the playback device can be evaluated using video data and audio data without time information at the time of playback. Therefore, without providing a special device for generating video data and audio data for evaluation that is reproduced with time information attached, the reproduction device can reproduce the video data and audio data at a timing faithful to the time stamp. You can evaluate whether you are playing.

以下、本発明の実施形態について、図面を参照して説明する。なお、以下の各実施形態において、他の実施形態と同様の機能を有する構成要素については同一の符号を付して説明を省略する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings. In each of the following embodiments, components having functions similar to those of the other embodiments are denoted by the same reference numerals and description thereof is omitted.

《発明の実施形態1》
図1は、本発明の実施形態1に係るコーデックシステムの構成を示すブロック図である。
Embodiment 1 of the Invention
FIG. 1 is a block diagram showing a configuration of a codec system according to Embodiment 1 of the present invention.

実施形態1に係るコーデックシステムでは、映像音声符号化多重装置100が出力する符号化多重データが、記憶媒体130に記憶され、検証機能付き映像音声再生装置110で再生されるようになっている。検証機能付き映像音声再生装置110(検証機能付き映像音声再生システム)は、再生される復号映像データと復号音声データの同期を検出する映像音声同期検出装置120を備えている。   In the codec system according to the first embodiment, the encoded multiplexed data output from the video / audio encoding / multiplexing device 100 is stored in the storage medium 130 and reproduced by the video / audio reproducing device 110 with a verification function. The video / audio reproduction device with verification function 110 (video / audio reproduction system with verification function) includes a video / audio synchronization detection device 120 that detects the synchronization between the decoded video data to be reproduced and the decoded audio data.

映像音声符号化多重装置100は、映像データ発生部101、映像データ符号化部102、音声データ発生部103、音声データ符号化部104、および多重化部105を備えている。   The video / audio encoding and multiplexing apparatus 100 includes a video data generation unit 101, a video data encoding unit 102, an audio data generation unit 103, an audio data encoding unit 104, and a multiplexing unit 105.

映像データ発生部101は、映像データを生成するようになっている。映像データ発生部101としては、例えば、ビデオカメラが用いられる。   The video data generating unit 101 generates video data. As the video data generator 101, for example, a video camera is used.

映像データ符号化部102は、映像データ発生部101によって生成された映像データを符号化するようになっている。ここで行われる符号化は、映像データを圧縮する符号化等である。   The video data encoder 102 encodes the video data generated by the video data generator 101. The encoding performed here is encoding that compresses video data.

音声データ発生部103は、音声データを生成するようになっている。音声データ発生部103としては、例えば、マイクが用いられる。   The audio data generation unit 103 is configured to generate audio data. As the audio data generation unit 103, for example, a microphone is used.

音声データ符号化部104は、音声データ発生部103によって生成された音声データを符号化するようになっている。ここで行われる符号化は、音声データを圧縮する符号化等である。   The audio data encoding unit 104 encodes the audio data generated by the audio data generation unit 103. The encoding performed here is encoding that compresses audio data.

多重化部105は、映像データ符号化部102によって符号化された符号化映像データにタイムスタンプ等の映像再生時刻情報を付加し、音声データ符号化部104によって符号化された符号化音声データにタイムスタンプ等の音声再生時刻情報を付加するようになっている。そして、再生時刻情報が付加された符号化映像データと符号化音声データとを、1つの通信回線または伝送チャネルで送信できるデータに多重化(合成)するようになっている。   The multiplexing unit 105 adds video reproduction time information such as a time stamp to the encoded video data encoded by the video data encoding unit 102, and adds the encoded video data encoded by the audio data encoding unit 104 to the encoded audio data. Audio reproduction time information such as a time stamp is added. Then, the encoded video data and the encoded audio data to which the reproduction time information is added are multiplexed (synthesized) into data that can be transmitted through one communication line or transmission channel.

検証機能付き映像音声再生装置110は、多重分離部111、映像データ復号部112、音声データ復号部113、および映像音声同期検出装置120を備えている。   The video / audio reproduction device 110 with a verification function includes a demultiplexing unit 111, a video data decoding unit 112, an audio data decoding unit 113, and a video / audio synchronization detection device 120.

多重分離部111は、多重化部105によって多重化された符号化多重データを符号化映像データと符号化音声データとに分離して出力するようになっている。   The demultiplexer 111 separates the encoded multiplexed data multiplexed by the multiplexer 105 into encoded video data and encoded audio data, and outputs the separated data.

映像データ復号部112は、多重分離部111によって出力された符号化映像データを復号し、符号化映像データに付された映像再生時刻情報に基づくタイミングで出力するようになっている。ここで行われる復号は、圧縮された符号化映像データを伸長する復号等である。映像データ復号部112には、後述する判定部127から判定信号が入力されるようになっており、判定信号の値が“1”の時、判定信号の値が“0”の時よりも1画像あたりの画素数を少なくしたりビットレートを減らす等して、処理時間の短い復号処理を行うようになっている。   The video data decoding unit 112 decodes the encoded video data output by the demultiplexing unit 111 and outputs the decoded video data at a timing based on video reproduction time information attached to the encoded video data. Decoding performed here is decoding that decompresses compressed encoded video data. A determination signal is input to the video data decoding unit 112 from a determination unit 127 described later. When the determination signal value is “1”, the determination signal value is “1” than when the determination signal value is “0”. Decoding processing with a short processing time is performed by reducing the number of pixels per image or reducing the bit rate.

音声データ復号部113は、多重分離部111によって出力された符号化音声データを復号し、符号化音声データに付された音声再生時刻情報に基づくタイミングで出力するようになっている。ここで行われる復号は、圧縮された符号化音声データを伸長する復号等である。   The audio data decoding unit 113 decodes the encoded audio data output by the demultiplexing unit 111 and outputs the decoded audio data at a timing based on the audio reproduction time information attached to the encoded audio data. Decoding performed here is decoding that decompresses compressed encoded audio data.

映像音声同期検出装置120は、記録部121、出力タイミング検出部122、再生基準時刻取得部125、算出部126、および判定部127を備えている。   The video / audio synchronization detection device 120 includes a recording unit 121, an output timing detection unit 122, a reproduction reference time acquisition unit 125, a calculation unit 126, and a determination unit 127.

記録部121は、映像データ復号部112および音声データ復号部113からそれぞれ出力される復号映像データと復号音声データとを記録するようになっている。そして、記録した復号映像データと復号音声データとを、映像データ復号部112および音声データ復号部113からそれぞれが出力されるのと同じ速度と順序で出力するようになっている。記録部121は、例えば、AV(Audio Visual)データ用のハードディスク、メモリ、またはビデオテープで構成される。   The recording unit 121 records the decoded video data and the decoded audio data output from the video data decoding unit 112 and the audio data decoding unit 113, respectively. Then, the recorded decoded video data and decoded audio data are output at the same speed and order as output from the video data decoding unit 112 and the audio data decoding unit 113, respectively. The recording unit 121 is composed of, for example, a hard disk, memory, or video tape for AV (Audio Visual) data.

出力タイミング検出部122は、図2に示すように、映像データ照合部122aと音声データ照合部122bとを備えている。映像データ照合部122aは、照合対象映像データ123を、記録部121から順次出力される復号映像データと1画像毎に比較照合し、照合対象映像データ123と一致する復号映像データを検出するようになっている。そして、照合対象映像データ123と一致する復号映像データを検出したタイミングを映像データ出力タイミングとして出力するようになっている。   As shown in FIG. 2, the output timing detection unit 122 includes a video data verification unit 122a and an audio data verification unit 122b. The video data matching unit 122 a compares the matching target video data 123 with the decoded video data sequentially output from the recording unit 121 for each image, and detects the decoded video data that matches the matching target video data 123. It has become. The timing at which the decoded video data that matches the verification target video data 123 is detected is output as the video data output timing.

音声データ照合部122bは、照合対象音声データ124を、記録部121から順次出力される復号音声データと所定単位時間連続する復号音声データ毎に比較照合し、照合対象音声データ124と一致する復号音声データを検出するようになっている。そして、照合対象音声データ124と一致する復号音声データを検出したタイミングを音声データ出力タイミングとして出力するようになっている。   The audio data collating unit 122b compares the collation target audio data 124 with the decoded audio data sequentially output from the recording unit 121 for each decoded audio data that continues for a predetermined unit time. It is designed to detect data. And the timing which detected the decoding audio | voice data which correspond with collation object audio | voice data 124 is output as audio | voice data output timing.

照合対象映像データ123は複数画像分記憶されており、一致する復号映像データが検出されると、比較照合される照合対象映像データ123が、次の新たな照合対象映像データ123に切り換えられるようになっている。同様に、照合対象音声データ124は複数組の所定単位時間連続する復号音声データ分記憶されており、一致する復号音声データが検出されると、比較照合される照合対象音声データ124が、次の新たな照合対象音声データ124に切り換えられるようになっている。   The verification target video data 123 is stored for a plurality of images, and when matching decoded video data is detected, the verification target video data 123 to be compared and verified is switched to the next new verification target video data 123. It has become. Similarly, the collation target audio data 124 is stored for a plurality of sets of decoded audio data continuous for a predetermined unit time, and when matching decoded audio data is detected, the collation target audio data 124 to be compared and collated is It is possible to switch to new collation target audio data 124.

再生基準時刻取得部125は、1画像の符号化映像データ毎に、各符号化映像データに含まれる映像再生時刻情報を読み取り、後述する算出部126のカウンタ126aで時間経過に応じてカウントされる値と単位を揃えるように換算した映像再生基準時刻を求めて記憶するようになっている。さらに、所定単位の連続する符号化音声データ毎に、各符号化音声データに含まれる音声再生時刻情報を読み取り、各符号化音声データが音声データ復号部113から復号音声データとして出力されるべき音声再生基準時刻を取得し、記憶するようになっている。例えば、27MHzのクロックでカウントされた値が再生時刻情報として用いられるMPEG2システムの場合であって、後述する算出部126のカウンタ126aにおいて、映像データ出力タイミングと音声データ出力タイミングとの間隔が9MHzのクロックでカウントされる場合、映像再生基準時刻と音声再生基準時刻は、映像再生時刻情報と音声再生時刻情報をそれぞれ1/3倍して求められる。   The reproduction reference time acquisition unit 125 reads the video reproduction time information included in each encoded video data for each encoded video data of one image, and counts with the passage of time by a counter 126a of the calculation unit 126 described later. The video reproduction reference time converted so as to align the value and the unit is obtained and stored. Further, for each piece of encoded audio data in a predetermined unit, audio reproduction time information included in each encoded audio data is read, and each encoded audio data is output from the audio data decoding unit 113 as decoded audio data. The reproduction reference time is acquired and stored. For example, in the case of an MPEG2 system in which a value counted by a 27 MHz clock is used as reproduction time information, an interval between the video data output timing and the audio data output timing is 9 MHz in a counter 126a of the calculation unit 126 described later. When counted by the clock, the video playback reference time and the audio playback reference time are obtained by multiplying the video playback time information and the audio playback time information by 1/3.

算出部126は、所定の1画像の映像データの映像データ出力タイミングと所定単位時間連続する所定の音声データ出力タイミングとの間隔である映像音声出力間隔と、上記所定の1画像の映像データの映像再生基準時刻と上記所定の音声データの音声再生基準時刻との基準間隔との差を同期ずれ時間として算出するようになっている。具体的な構成としては、例えば、図3に示すように、カウンタ126a、映像音声再生基準間隔算出部126b、および同期ずれ時間算出部126cを備えている。   The calculation unit 126 includes a video / audio output interval that is an interval between video data output timing of video data of a predetermined one image and predetermined audio data output timing that continues for a predetermined unit time, and video of the video data of the predetermined one image. The difference between the reproduction reference time and the reference interval between the predetermined audio data and the audio reproduction reference time is calculated as the synchronization shift time. As a specific configuration, for example, as shown in FIG. 3, a counter 126a, a video / audio reproduction reference interval calculation unit 126b, and a synchronization shift time calculation unit 126c are provided.

カウンタ126aは、映像データ出力タイミングと音声データ出力タイミングのうち早い方のタイミングでカウント値をリセットすると同時に、時間経過に応じた値のカウントを開始し、もう一方のタイミングでのカウント値を映像音声出力間隔として出力するようになっている。   The counter 126a resets the count value at the earlier timing of the video data output timing and the audio data output timing, and at the same time starts counting the value according to the passage of time, and calculates the count value at the other timing as the video / audio. Output as an output interval.

映像音声再生基準間隔算出部126bは、映像再生基準時刻と音声再生基準時刻との差を算出し、映像再生基準時刻と音声再生基準時刻との基準間隔として出力するようになっている。   The video / audio reproduction reference interval calculation unit 126b calculates a difference between the video reproduction reference time and the audio reproduction reference time, and outputs the difference as a reference interval between the video reproduction reference time and the audio reproduction reference time.

同期ずれ時間算出部126cは、映像音声出力間隔と基準間隔との差を同期ずれ時間として算出するようになっている。   The synchronization shift time calculation unit 126c calculates the difference between the video / audio output interval and the reference interval as the synchronization shift time.

判定部127は、算出部126によって出力される同期ずれ時間を所定の閾値と比較し、同期ずれ時間が所定の閾値より小さい場合は判定信号として“0”を出力し、同期ずれ時間が所定の閾値より大きい場合は判定信号として“1”を出力するようになっている。   The determination unit 127 compares the synchronization deviation time output by the calculation unit 126 with a predetermined threshold value, and outputs “0” as a determination signal when the synchronization deviation time is smaller than the predetermined threshold value. When the value is larger than the threshold, “1” is output as the determination signal.

記憶媒体130は、映像音声符号化多重装置100の多重化部105によって出力された符号化多重データを記憶するようになっている。   The storage medium 130 stores the encoded multiplexed data output by the multiplexing unit 105 of the video / audio encoding / multiplexing apparatus 100.

−動作−
次に、上記のように構成されたコーデックシステムにおける各部の動作について説明する。
-Operation-
Next, the operation of each unit in the codec system configured as described above will be described.

まず、映像データ発生部101が映像データを生成すると、生成された映像データは映像データ符号化部102によって符号化される。一方、音声データ発生部103が音声データを生成すると、生成された音声データは音声データ符号化部104によって符号化される。そして、符号化された符号化映像データと符号化音声データは、多重化部105によって、それぞれに再生時刻情報が付加されて多重化され、符号化多重データとして記憶媒体130に記憶される。   First, when the video data generation unit 101 generates video data, the generated video data is encoded by the video data encoding unit 102. On the other hand, when the audio data generation unit 103 generates audio data, the generated audio data is encoded by the audio data encoding unit 104. The encoded encoded video data and encoded audio data are multiplexed with the reproduction time information added thereto by the multiplexing unit 105 and stored in the storage medium 130 as encoded multiplexed data.

記憶媒体130に記憶された符号化多重データは、多重分離部111で符号化映像データと符号化音声データとに分離される。分離された符号化映像データは映像データ復号部112で復号され、分離された符号化音声データは音声データ復号部113で復号される。復号された復号映像データは、復号される前の符号化映像データに付されていた映像再生時刻情報に基づくタイミングで記録部121に出力される。同様に、復号された復号音声データは、復号される前の符号化音声データに付されていた音声再生時刻情報に基づくタイミングで記録部121に出力される。   The encoded multiplexed data stored in the storage medium 130 is separated into encoded video data and encoded audio data by the demultiplexing unit 111. The separated encoded video data is decoded by the video data decoding unit 112, and the separated encoded audio data is decoded by the audio data decoding unit 113. The decoded decoded video data is output to the recording unit 121 at a timing based on the video reproduction time information attached to the encoded video data before decoding. Similarly, the decoded decoded audio data is output to the recording unit 121 at a timing based on the audio reproduction time information attached to the encoded audio data before decoding.

記録部121は、映像データ復号部112から出力される復号映像データ、および音声データ復号部113から出力される復号音声データを記録し、映像データ復号部112および音声データ復号部113からそれぞれが出力されたのと同じ速度と順序で、出力タイミング検出部122へ出力する。   The recording unit 121 records the decoded video data output from the video data decoding unit 112 and the decoded audio data output from the audio data decoding unit 113, and each output from the video data decoding unit 112 and the audio data decoding unit 113. Then, the data is output to the output timing detection unit 122 at the same speed and order.

一方、再生基準時刻取得部125は、1画像の符号化映像データ毎に、符号化映像データに含まれる映像再生時刻情報を読み取り、各符号化映像データが復号された後に映像データ復号部112から復号映像データとして出力されるべき映像再生基準時刻を取得し、記憶する。さらに、所定単位時間連続する符号化音声データ毎に、各符号化音声データに含まれる音声再生時刻情報を読み取り、各符号化音声データが復号された後に音声データ復号部113から復号音声データとして出力されるべき音声再生基準時刻を取得し、記憶する。   On the other hand, the reproduction reference time acquisition unit 125 reads the video reproduction time information included in the encoded video data for each encoded video data of one image, and from the video data decoding unit 112 after each encoded video data is decoded. A video playback reference time to be output as decoded video data is acquired and stored. Further, for each encoded audio data that continues for a predetermined unit time, the audio reproduction time information included in each encoded audio data is read, and after each encoded audio data is decoded, output as decoded audio data from the audio data decoding unit 113 Obtain and store the audio playback reference time to be played.

以下、出力タイミング検出部122、および算出部126の動作については、まず、先頭の復号映像データと先頭の復号音声データについて出力タイミングが検出され、再生基準時刻と比較される場合について説明する。   Hereinafter, regarding the operations of the output timing detection unit 122 and the calculation unit 126, first, a case will be described in which the output timing is detected for the first decoded video data and the first decoded audio data and compared with the reproduction reference time.

記録部121から出力される復号映像データは出力タイミング検出部122に入力される。出力タイミング検出部122に入力された復号映像データは、1画像毎に、映像データ照合部122aで、先頭の1画像の復号映像データを示す照合対象映像データ123と比較照合される。映像データ照合部122aは、その照合対象映像データ123と一致する復号映像データを検出する。そして、照合対象映像データ123と一致する復号映像データを検出したタイミングを映像データ出力タイミングとして検出する。そして、照合対象映像データ123と一致する復号映像データが検出された後、比較照合される照合対象映像データ123は、2画像目の復号映像データを示す照合対象映像データ123になる。   The decoded video data output from the recording unit 121 is input to the output timing detection unit 122. The decoded video data input to the output timing detection unit 122 is compared and verified for each image with the verification target video data 123 indicating the decoded video data of the first image by the video data verification unit 122a. The video data collating unit 122a detects the decoded video data that matches the collation target video data 123. The timing at which the decoded video data that matches the verification target video data 123 is detected is detected as the video data output timing. Then, after the decoded video data matching the verification target video data 123 is detected, the verification target video data 123 to be compared and verified becomes the verification target video data 123 indicating the decoded video data of the second image.

同様に、記録部121から出力される復号音声データは出力タイミング検出部122に入力される。出力タイミング検出部122に入力された復号音声データは、所定単位時間連続する復号音声データ毎に、音声データ照合部122bで、先頭の所定単位時間連続する連続復号音声データを示す照合対象音声データ124と比較照合される。音声データ照合部122bは、その照合対象音声データ124と一致する復号音声データを検出する。そして、照合対象音声データ124と一致する復号音声データを検出したタイミングを音声データ出力タイミングとして検出する。そして、照合対象音声データ124と一致する復号音声データが検出された後、比較照合される照合対象音声データ124は、2組目の所定単位時間連続する連続復号音声データを示す照合対象音声データ124になる。   Similarly, the decoded audio data output from the recording unit 121 is input to the output timing detection unit 122. The decoded speech data input to the output timing detection unit 122 is, for each decoded speech data that is continuous for a predetermined unit time, the speech data collating unit 122b, and the verification target speech data 124 that indicates the continuous decoded speech data that is continuous for the first predetermined unit time. And compared. The voice data collating unit 122b detects decoded voice data that matches the collation target voice data 124. And the timing which detected the decoding audio | voice data which correspond with collation object audio | voice data 124 is detected as audio | voice data output timing. After the decoded speech data that matches the verification target speech data 124 is detected, the verification target speech data 124 that is compared and verified is the verification target speech data 124 that indicates the second set of continuous decoded speech data that continues for a predetermined unit time. become.

映像データ照合部122aで検出された先頭の1画像の復号映像データの映像データ出力タイミング、および音声データ照合部122bで検出された先頭の所定単位時間連続する復号音声データの音声データ出力タイミングで、検出信号が算出部126のカウンタ126aに入力される。そして、カウンタ126aは、上記映像データ出力タイミングと上記音声データ出力タイミングのうち早い方のタイミングで、リセットされるとともに時間経過に応じた値のカウントを開始し、もう一方のタイミングでのカウント値を先頭の映像および音声の映像音声出力間隔として出力する。   At the video data output timing of the decoded video data of the first one image detected by the video data collating unit 122a and the audio data output timing of the decoded audio data continuously detected by the audio data collating unit 122b for a predetermined unit time, The detection signal is input to the counter 126a of the calculation unit 126. The counter 126a is reset at the earlier of the video data output timing and the audio data output timing and starts counting a value according to the passage of time, and the count value at the other timing is obtained. Output as the video / audio output interval of the first video and audio.

一方、再生基準時刻取得部125に記憶された映像再生基準時刻、および音声再生基準時刻のうち、先頭の1画像の符号化映像データに含まれていた映像再生基準時刻と先頭の所定単位時間連続する符号化音声データに含まれていた音声再生基準時刻とが算出部126の映像音声再生基準間隔算出部126bに入力される。そして、映像音声再生基準間隔算出部126bは、上記映像再生基準時刻と上記音声再生基準時刻との差を算出し、先頭の映像再生基準時刻と先頭の音声再生基準時刻との基準間隔として出力する。   On the other hand, among the video playback reference time and the audio playback reference time stored in the playback reference time acquisition unit 125, the video playback reference time included in the encoded video data of the first image and the head for a predetermined unit time are continuous. The audio reproduction reference time included in the encoded audio data to be input is input to the video / audio reproduction reference interval calculation unit 126b of the calculation unit 126. Then, the video / audio reproduction reference interval calculation unit 126b calculates the difference between the video reproduction reference time and the audio reproduction reference time, and outputs the difference as the reference interval between the first video reproduction reference time and the first audio reproduction reference time. .

先頭の映像および音声の映像音声出力間隔と基準間隔とは、同期ずれ時間算出部126cに入力される。そして、同期ずれ時間算出部126cによって、上記映像音声出力間隔と上記基準間隔との差が同期ずれ時間として算出される。このように、再生装置が正常に映像データと音声データとを同期させているかどうかが定量的に評価される。   The video / audio output interval and the reference interval of the first video and audio are input to the synchronization shift time calculation unit 126c. Then, the difference between the video / audio output interval and the reference interval is calculated as the synchronization deviation time by the synchronization deviation time calculation unit 126c. In this way, it is quantitatively evaluated whether or not the playback apparatus normally synchronizes the video data and the audio data.

出力タイミング検出部122、および算出部126の上記のような動作が、比較照合される照合対象映像データ123と照合対象音声データ124とがそれぞれ切り替わることによって、次には2画像目の復号映像データと2組目の所定単位時間連続する連続復号音声データについて行われ、その次には3画像目の復号映像データと3組目の所定単位時間連続する連続復号音声データについて行われ、それ以降も繰り返される。このように、映像データと音声データとが同期しているかどうかが、複数画像の復号映像データおよび複数組の所定単位時間連続する連続復号音声データのそれぞれについて評価される。   The operations described above of the output timing detection unit 122 and the calculation unit 126 are switched between the comparison target video data 123 and the verification target audio data 124 to be compared, and then the decoded video data of the second image is next. And the second set of continuous decoded audio data that continues for a predetermined unit time, and then the third set of decoded video data and the third set of continuous decoded audio data that continue for a predetermined unit time. Repeated. In this way, whether or not the video data and the audio data are synchronized is evaluated for each of the decoded video data of a plurality of images and a plurality of sets of continuous decoded audio data continuous for a predetermined unit time.

判定部127は、算出部126によって出力される同期ずれ時間を所定の閾値と比較し、同期ずれ時間が所定の閾値より小さい場合は判定信号として“0”を出力し、同期ずれ時間が所定の閾値より大きい場合は判定信号として“1”を出力する。   The determination unit 127 compares the synchronization deviation time output by the calculation unit 126 with a predetermined threshold value, and outputs “0” as a determination signal when the synchronization deviation time is smaller than the predetermined threshold value. If it is larger than the threshold value, “1” is output as the determination signal.

映像データ復号部112は、判定信号の値が“1”の時、判定信号の値が“0”の時よりも1画像あたりの画素数を少なくしたりビットレートを減らす等して、処理時間の短い復号処理を行う。このように、映像音声同期検出装置120により、検証機能付き映像音声再生装置110に生じる映像データと音声データとの同期ずれが、解消または低減される。   When the value of the determination signal is “1”, the video data decoding unit 112 reduces the processing time by reducing the number of pixels per image or reducing the bit rate compared to when the value of the determination signal is “0”. A short decoding process is performed. In this manner, the video / audio synchronization detection device 120 eliminates or reduces the synchronization shift between the video data and the audio data that occurs in the video / audio reproduction device 110 with a verification function.

本実施形態において、記録部121は、映像データ復号部112が出力するのと同じ速度で復号映像データを出力するので、照合対象映像データ123と一致する復号映像データが検出されたタイミングが、照合対象映像データ123と一致する復号映像データが映像データ復号部112から出力されたタイミングとして扱われている。音声データについても同様である。しかし、必ずしも記録部121は、データを記録する速度とデータを読み出す速度が等しくなるように構成されなくてもよい。算出部126のカウンタ126aにおいて、記録部121における記録速度と読み出し速度の比に応じたクロックで、再生基準時刻取得部125で算出される基準間隔と同じ時間単位の映像音声出力間隔が得られればよい。   In this embodiment, the recording unit 121 outputs the decoded video data at the same speed as that output by the video data decoding unit 112. Therefore, the timing at which the decoded video data matching the verification target video data 123 is detected The decoded video data that matches the target video data 123 is handled as the timing when it is output from the video data decoding unit 112. The same applies to audio data. However, the recording unit 121 does not necessarily have to be configured so that the data recording speed is equal to the data reading speed. If the counter 126a of the calculation unit 126 can obtain a video / audio output interval in the same time unit as the reference interval calculated by the reproduction reference time acquisition unit 125 with a clock according to the ratio of the recording speed to the reading speed in the recording unit 121. Good.

また、復号映像データが映像データ復号部112から出力されたタイミングや復号音声データが音声データ復号部113から出力されたタイミング、すなわち映像データ出力タイミングや音声データ出力タイミングは、必ずしも、記録部121から復号映像データや復号音声データが出力されたタイミングを検出することにより検出されなくてもよい。例えば、記録部121が、復号映像データや復号音声データに、それぞれの映像データ出力タイミングや音声データ出力タイミングをタイムスタンプとして付して記録するようになっていた場合、それらのタイムスタンプを読み出すことによって検出してもよい。   Further, the timing at which the decoded video data is output from the video data decoding unit 112 and the timing at which the decoded audio data is output from the audio data decoding unit 113, that is, the video data output timing and the audio data output timing are not necessarily from the recording unit 121. It may not be detected by detecting the timing at which the decoded video data or decoded audio data is output. For example, in the case where the recording unit 121 is configured to record each video data output timing or audio data output timing as a time stamp on the decoded video data or decoded audio data, the time stamp is read out. You may detect by.

また、本実施形態では、再生基準時刻取得部125において、各映像再生基準時刻と各音声再生基準時刻が取得される際に、再生基準時刻の時間単位を、算出部126において求められる映像音声出力間隔と合わせるようにしていたが、時間単位が合わせられるのは必ずしも再生基準時刻取得部125でなくてもよい。算出部126で、再生基準時刻の基準間隔と映像音声出力間隔との差を算出する際に、基準間隔と映像音声出力間隔の時間単位が同じになっていればよい。したがって、例えば、再生基準時刻取得部125では、映像再生時刻情報と音声再生時刻情報がそのまま記憶され、算出部126の映像音声再生基準間隔算出部126bにおいてそれらの差が算出され、その算出された差が映像音声出力間隔と同じ時間単位となるように換算されるようになっていてもよい。   Further, in the present embodiment, when the reproduction reference time acquisition unit 125 acquires each video reproduction reference time and each audio reproduction reference time, the video / audio output obtained by the calculation unit 126 as the time unit of the reproduction reference time is obtained. Although the interval is adjusted, the unit of time may not necessarily be the reproduction reference time acquisition unit 125. When the calculation unit 126 calculates the difference between the reference interval of the reproduction reference time and the video / audio output interval, the time unit of the reference interval and the video / audio output interval may be the same. Therefore, for example, the playback reference time acquisition unit 125 stores the video playback time information and the audio playback time information as they are, and the video / audio playback reference interval calculation unit 126b of the calculation unit 126 calculates and calculates the difference between them. The difference may be converted so as to be the same time unit as the video / audio output interval.

《発明の実施形態1の変形例》
実施形態1の映像音声同期検出装置120は、算出部126に代えて、図4に示す算出部226を備えてもよい。
<< Modification of Embodiment 1 of the Invention >>
The video / audio synchronization detection apparatus 120 according to the first embodiment may include a calculation unit 226 illustrated in FIG. 4 instead of the calculation unit 126.

算出部226は、算出部126のカウンタ126aに代えて、映像データ出力タイミングカウンタ226a、音声データ出力タイミングカウンタ226b、および映像音声出力間隔算出部226cを備えている。   The calculation unit 226 includes a video data output timing counter 226a, an audio data output timing counter 226b, and a video / audio output interval calculation unit 226c instead of the counter 126a of the calculation unit 126.

映像データ出力タイミングカウンタ226aは、所定のタイミングでカウント値をリセットするとともに時間経過に応じた値のカウントを開始し、映像データ出力タイミングでカウント値を出力するようになっている。   The video data output timing counter 226a resets the count value at a predetermined timing, starts counting the value according to the passage of time, and outputs the count value at the video data output timing.

音声データ出力タイミングカウンタ226bは、映像データ出力タイミングカウンタ226aがカウントを開始するのと同じ所定のタイミングでカウント値をリセットするとともに時間経過に応じた値のカウントを開始し、音声データ出力タイミングでカウント値を出力するようになっている。   The audio data output timing counter 226b resets the count value at the same predetermined timing as the video data output timing counter 226a starts counting, starts counting a value corresponding to the passage of time, and counts at the audio data output timing. A value is output.

映像音声出力間隔算出部226cは、映像データ出力タイミングカウンタ226aによって出力されるカウント値と音声データ出力タイミングカウンタ226bによって出力されるカウント値との差を映像音声出力間隔として出力するようになっている。   The video / audio output interval calculation unit 226c outputs the difference between the count value output by the video data output timing counter 226a and the count value output by the audio data output timing counter 226b as the video / audio output interval. .

−動作−
映像データ照合部122aと音声データ照合部122bとが同時に照合動作を開始し、その照合動作の開始と同時に映像データ出力タイミングカウンタ226aと音声データ出力タイミングカウンタ226bがカウントを開始する場合の算出部226の動作を例として説明する。
-Operation-
The video data collating unit 122a and the audio data collating unit 122b start collating operations at the same time, and the calculating unit 226 when the video data output timing counter 226a and the audio data output timing counter 226b start counting simultaneously with the start of the collating operation. The operation will be described as an example.

映像データ照合部122aと音声データ照合部122bとが照合動作を開始すると、同時に映像データ出力タイミングカウンタ226aと音声データ出力タイミングカウンタ226bがリセットされるとともに、時間経過に応じた値のカウントを開始する。映像データ出力タイミングカウンタ226aは、映像データ出力タイミングでカウント値を出力する。音声データ出力タイミングカウンタ226bは、音声データ出力タイミングでカウント値を出力する。そして、映像音声出力間隔算出部226cは、映像データ出力タイミングカウンタ226aによって出力されたカウント値と音声データ出力タイミングカウンタ226bによって出力されたカウント値との差を映像音声出力間隔として同期ずれ時間算出部126cに出力する。   When the video data collating unit 122a and the audio data collating unit 122b start the collating operation, the video data output timing counter 226a and the audio data output timing counter 226b are reset at the same time, and counting of values corresponding to the passage of time is started. . The video data output timing counter 226a outputs a count value at the video data output timing. The audio data output timing counter 226b outputs a count value at the audio data output timing. Then, the video / audio output interval calculation unit 226c uses the difference between the count value output by the video data output timing counter 226a and the count value output by the audio data output timing counter 226b as the video / audio output interval, and the synchronization deviation time calculation unit. To 126c.

《発明の実施形態2》
実施形態2のコーデックシステムは、実施形態1のコーデックシステムの出力タイミング検出部122と算出部126に代えて、図5に示すような出力タイミング検出部122と算出部326を備えている。
<< Embodiment 2 of the Invention >>
The codec system according to the second embodiment includes an output timing detection unit 122 and a calculation unit 326 as illustrated in FIG. 5 instead of the output timing detection unit 122 and the calculation unit 126 of the codec system according to the first embodiment.

本実施形態の映像データ照合部122aは、実施形態1の映像データ照合部122aの機能に加え、算出部326の不一致画像数カウンタ326aに対し、照合対象映像データ123と記録部121から順次出力される各画像の復号映像データとが一致したことを示す信号、および不一致であったことを示す信号を不一致画像数カウンタ326aに出力する機能を有している。   In addition to the function of the video data matching unit 122a of the first embodiment, the video data matching unit 122a of this embodiment is sequentially output from the matching target video data 123 and the recording unit 121 to the mismatched image number counter 326a of the calculation unit 326. A signal indicating that the decoded video data of each image matches, and a signal indicating that there is a mismatch, are output to the mismatched image number counter 326a.

本実施形態において、音声データ照合部122bは、先頭の所定単位時間連続する連続復号音声データを示す照合対象音声データ124についての比較照合しか行わず、先頭の所定単位時間連続する復号音声データの音声データ出力タイミングを検出したあとは、他の検出を行わないようになっている。   In the present embodiment, the audio data collating unit 122b only performs comparison and collation on the collation target audio data 124 indicating the continuous decoded audio data continuous for the first predetermined unit time, and the audio of the decoded audio data continuous for the first predetermined unit time. After detecting the data output timing, no other detection is performed.

算出部326は、カウンタ126a、不一致画像数カウンタ326a、出力時刻情報算出部326b、映像音声再生基準間隔算出部326c、および同期ずれ時間算出部326dを備えている。   The calculation unit 326 includes a counter 126a, a mismatched image number counter 326a, an output time information calculation unit 326b, a video / audio reproduction reference interval calculation unit 326c, and a synchronization shift time calculation unit 326d.

不一致画像数カウンタ326aは、映像データ照合部122aから不一致を示す信号が入力されると、保持する値に1を加算するようになっている。また、不一致画像数カウンタ326aの値は、映像データ照合部122aから一致を示す信号が入力されると、出力時刻情報算出部326bに出力され、0にリセットされる。不一致は、例えば、伝送経路上の問題から映像データ復号部112に対する符号化映像データの供給が遅れ、所定の1画像の復号映像データが再生時刻情報に示されるタイミングで出力されるのに間に合わず、上記再生時刻情報に示されるタイミングで前の画像の復号映像データがそのまま出力されることによって生じる。   The mismatched image number counter 326a is configured to add 1 to the held value when a signal indicating mismatch is input from the video data matching unit 122a. The value of the mismatched image number counter 326a is output to the output time information calculation unit 326b and reset to 0 when a signal indicating a match is input from the video data matching unit 122a. For example, the mismatch does not occur in time when the supply of encoded video data to the video data decoding unit 112 is delayed due to a problem on the transmission path, and the decoded video data of a predetermined image is output at the timing indicated by the reproduction time information. This occurs when the decoded video data of the previous image is output as it is at the timing indicated by the reproduction time information.

出力時刻情報算出部326bは、まず、カウンタ126aから出力される先頭の1画像の復号映像データの映像データ出力タイミングと先頭の所定単位時間連続する復号音声データの音声データ出力タイミング(以下、先頭音声データ出力タイミング)との映像音声出力間隔を記憶するようになっている。そして2画像目以降の照合対象映像データ123と一致する復号映像データが検出される毎に、記憶されている映像音声出力間隔に、リセットされる前の不一致画像数カウンタ326aの値に1を加算した値と1画像あたりの出力時間との積を加算し、新たな映像音声出力間隔として記憶するようになっている。   First, the output time information calculation unit 326b first outputs the video data output timing of the decoded video data of the first image output from the counter 126a and the audio data output timing of the decoded audio data that continues for the first predetermined unit time (hereinafter referred to as the head audio). (Data output timing) and the audio / video output interval are stored. Each time the decoded video data that matches the verification target video data 123 for the second and subsequent images is detected, 1 is added to the value of the mismatched image number counter 326a before the reset to the stored video / audio output interval. The product of the calculated value and the output time per image is added and stored as a new video / audio output interval.

すなわち、n番目の画像の復号映像データの映像データ出力タイミングと先頭音声データ出力タイミングとの映像音声出力間隔は以下の式によって算出される。   That is, the video / audio output interval between the video data output timing of the decoded video data of the nth image and the head audio data output timing is calculated by the following equation.

{(n番目の画像の復号映像データの映像データ出力タイミング)−(先頭音声データ出力タイミング)}
={(n−1番目の画像の復号映像データの映像データ出力タイミング)−(先頭音声データ出力タイミング)}
+1画像あたりの出力時間×{(不一致画像数カウンタ326aの値)+1}
映像音声再生基準間隔算出部326cは、再生基準時刻取得部125から出力される先頭の1画像の符号化映像データに含まれていた映像再生基準時刻と先頭の所定単位時間連続する符号化音声データに含まれていた音声再生基準時刻(以下、先頭音声再生基準時刻)の基準間隔を算出するようになっている。そして、2番目以降の各画像の符号化映像データについても、それぞれに含まれる映像再生基準時刻と先頭の音声の音声再生基準時刻との基準間隔を算出するようになっている。
{(Video data output timing of decoded video data of nth image) − (Start audio data output timing)}
= {(Video data output timing of decoded video data of (n-1) th image)-(Start audio data output timing)}
+1 output time per image × {(value of mismatched image number counter 326a) +1}
The video / audio reproduction reference interval calculation unit 326c includes encoded audio data that is continuous with the video reproduction reference time included in the encoded video data of the first image output from the reproduction reference time acquisition unit 125 and the first predetermined unit time. The reference interval of the audio reproduction reference time (hereinafter referred to as “first audio reproduction reference time”) included in the is calculated. For the encoded video data of each of the second and subsequent images, the reference interval between the video playback reference time included in each image and the audio playback reference time of the head audio is calculated.

同期ずれ時間算出部326dは、記憶された映像音声出力間隔とそれに対応する基準間隔との差を同期ずれ時間として算出し、出力するようになっている。同期ずれ時間として算出される値を以下の式に示す。   The synchronization deviation time calculation unit 326d calculates and outputs the difference between the stored video / audio output interval and the corresponding reference interval as the synchronization deviation time. The value calculated as the synchronization shift time is shown in the following equation.

同期ずれ時間={(n番目の画像の復号映像データの映像データ出力タイミング)−(先頭音声データ出力タイミング)}−{(n番目の画像の映像再生基準時刻)−(先頭音声再生基準時刻)}   Synchronous shift time = {(video data output timing of decoded video data of nth image) − (start audio data output timing)} − {(video playback reference time of nth image) − (start audio playback reference time) }

−動作−
次に、上記のように構成された本実施形態の出力タイミング検出部122と算出部326の動作について説明する。
-Operation-
Next, operations of the output timing detection unit 122 and the calculation unit 326 of the present embodiment configured as described above will be described.

まず、映像データ照合部122aが先頭の1画像の復号映像データの映像データ出力タイミングを検出し、音声データ照合部122bが先頭の所定単位時間連続する復号音声データの音声データ出力タイミングを検出し、同期ずれ時間を算出する動作は、実施形態1と同様である。   First, the video data collating unit 122a detects the video data output timing of the decoded video data of the first one image, and the audio data collating unit 122b detects the audio data output timing of the decoded audio data continuing for the predetermined unit time at the head, The operation for calculating the synchronization shift time is the same as that in the first embodiment.

映像データ照合部122aが先頭の画像の照合対象映像データ123と一致する復号映像データを検出してからの各部の動作について説明する。   The operation of each unit after the video data matching unit 122a detects the decoded video data that matches the matching target video data 123 of the first image will be described.

映像データ照合部122aが先頭の画像の照合対象映像データ123と一致する復号映像データを検出すると、不一致画像数カウンタ326aの値は0にリセットされる。また、照合される照合対象映像データ123が2画像目の復号映像データを示す照合対象映像データ123になる。そして、映像データ照合部122aは、2画像目の復号映像データを示す照合対象映像データ123を、入力される復号映像データと1画像毎に比較照合する。不一致の場合は、不一致画像数カウンタ326aの保持する値に1加算される。一致すると、不一致画像数カウンタ326aの保持する値が出力時刻情報算出部326bに出力され、0にリセットされる。   When the video data matching unit 122a detects decoded video data that matches the matching target video data 123 of the first image, the value of the mismatched image number counter 326a is reset to zero. The collation target video data 123 to be collated becomes the collation target video data 123 indicating the decoded video data of the second image. Then, the video data collating unit 122a compares the collation target video data 123 indicating the decoded video data of the second image with the input decoded video data for each image. In the case of mismatch, 1 is added to the value held by the mismatched image number counter 326a. If they match, the value held by the mismatched image number counter 326a is output to the output time information calculation unit 326b and reset to zero.

2画像目の復号映像データを示す照合対象映像データ123と復号映像データとの一致が検出されると、出力時刻情報算出部326bは、その時記憶されている先頭の映像および音声の映像音声出力間隔に、リセットされる前の不一致画像数カウンタ326aの値に1を加算した値と1画像あたりの出力時間との積を加算した値を、新たな映像音声出力間隔として記憶する。   When the matching between the collation target video data 123 indicating the decoded video data of the second image and the decoded video data is detected, the output time information calculation unit 326b displays the video / audio output interval of the first video and audio stored at that time. Further, a value obtained by adding the product of the value obtained by adding 1 to the value of the mismatched image number counter 326a before resetting and the output time per image is stored as a new video / audio output interval.

一方、映像音声再生基準間隔算出部326cは、2画像目の映像再生基準時刻と先頭の音声の音声再生基準時刻との差を基準間隔として算出する。   On the other hand, the video / audio reproduction reference interval calculation unit 326c calculates the difference between the video reproduction reference time of the second image and the audio reproduction reference time of the head audio as a reference interval.

そして、同期ずれ時間算出部326dは、出力時刻情報算出部326bに記憶されている2画像目の復号映像データの映像データ出力タイミングと先頭音声データ出力タイミングとの差である映像音声出力間隔と2画像目の映像再生基準時刻と先頭の音声の音声再生基準時刻との差である基準間隔との差を同期ずれ時間として算出する。   Then, the synchronization deviation time calculation unit 326d has a video / audio output interval that is the difference between the video data output timing of the decoded video data of the second image stored in the output time information calculation unit 326b and the head audio data output timing, and 2 The difference between the reference interval, which is the difference between the video playback reference time of the image and the audio playback reference time of the head audio, is calculated as the synchronization shift time.

上記のような動作が、3画像目の復号映像データ以降についても繰り返される。   The above operation is repeated for the decoded image data after the third image.

なお、本実施形態の不一致画像数カウンタ326aに代えて、各照合対象映像データ123について一致する復号映像データが検出された後、次の照合対象映像データ123について一致する復号映像データが検出されるまでの照合回数、すなわち各照合対象映像データ123についての照合回数をカウントするカウンタを備え、出力時刻情報算出部326bは、記憶されている映像音声出力間隔に、カウンタの値と1画像あたりの出力時間との積を加算した値を、新たな映像音声出力間隔として記憶するようにしてもよい。   In addition, instead of the mismatched image number counter 326a of the present embodiment, after matching decoded video data is detected for each matching target video data 123, the matching decoded video data is detected for the next matching target video data 123. Counter, which counts the number of collations for each collation target video data 123, and the output time information calculation unit 326b outputs the counter value and the output per image at the stored video / audio output interval. A value obtained by adding the product with time may be stored as a new video / audio output interval.

《その他の実施形態》
本発明は、データの符号化および復号が、上記各実施形態のように記憶媒体130にデータを記憶させるために行われる場合に限らず、データを所定の伝送経路で伝送するために行われる場合等にも適用できる。
<< Other Embodiments >>
The present invention is not limited to the case where the encoding and decoding of data is performed for storing data in the storage medium 130 as in the above embodiments, but the case where the data is transmitted for transmitting on a predetermined transmission path. Etc.

上記実施形態において、照合対象映像データ123は複数画像分記憶され、照合対象音声データ124は複数組の所定単位時間連続する復号音声データ分記憶される構成であったが、必ずしも一連の映像データや音声データについての同期検出動作の開始時に、一連のすべての照合対象映像データ123や照合対象音声データ124が記憶されている必要はない。例えば、映像データ復号部112や音声データ復号部113から順次入力されるようにしてもよい。   In the above embodiment, the verification target video data 123 is stored for a plurality of images, and the verification target audio data 124 is stored for a plurality of sets of decoded audio data continuous for a predetermined unit time. At the start of the synchronization detection operation for audio data, it is not necessary to store all of the series of verification target video data 123 and verification target audio data 124. For example, the video data decoding unit 112 and the audio data decoding unit 113 may be sequentially input.

また、実施形態2では、先頭の復号音声データの音声データ出力タイミングと各復号映像データの映像データ出力タイミングとの映像音声出力間隔とそれに対応する基準間隔との差が同期ずれ時間として順次算出されるようになっていたが、逆に、先頭の復号映像データの映像データ出力タイミングと各復号音声データの音声データ出力タイミングとの映像音声出力間隔とそれに対応する基準間隔との差が同期ずれ時間として順次算出されるように構成してもよい。   In the second embodiment, the difference between the audio / video output interval between the audio data output timing of the first decoded audio data and the video data output timing of each decoded video data and the corresponding reference interval is sequentially calculated as the synchronization shift time. Conversely, the difference between the video / audio output interval between the video data output timing of the first decoded video data and the audio data output timing of each decoded audio data and the corresponding reference interval is the synchronization shift time. May be calculated sequentially.

また、上記実施形態では、判定信号の値が“1”の時、判定信号の値が“0”の時よりも1画像あたりの画素数を少なくしたりビットレートを減らす等して、処理時間の短い復号処理を行うことにより、映像データと音声データとの同期ずれを解消または低減するようになっていたが、同期ずれを低減する方法はこれに限らない。例えば、映像データ出力タイミングが早いことにより同期ずれ時間が大きくなっている場合は、復号映像データを映像データ復号部112が遅らせて出力し、音声データ出力タイミングが早いことにより同期ずれ時間が大きくなっている場合は、復号音声データを音声データ復号部113が遅らせて出力するようにしてもよい。   In the above embodiment, when the value of the determination signal is “1”, the processing time is reduced by reducing the number of pixels per image or reducing the bit rate compared to when the value of the determination signal is “0”. However, the method of reducing the synchronization shift is not limited to this, but the synchronization shift between the video data and the audio data is eliminated or reduced. For example, when the video data output timing is early and the synchronization deviation time is long, the video data decoding unit 112 outputs the decoded video data with a delay, and the audio data output timing is early and the synchronization deviation time is large. If so, the audio data decoding unit 113 may output the decoded audio data with a delay.

また、上記実施形態において、映像再生時刻情報と音声再生時刻情報が、多重分離部111から出力される符号化映像データと符号化音声データとから読み取られるようになっていたが、再生基準時刻取得部125が映像再生時刻情報と音声再生時刻情報を得る方法はこれに限らない。例えば、多重化部105が、付加する映像再生時刻情報と音声再生時刻情報とを再生基準時刻取得部125に出力し、記録させるようにしてもよい。   In the above embodiment, the video playback time information and the audio playback time information are read from the encoded video data and the encoded audio data output from the demultiplexing unit 111. The method by which the unit 125 obtains the video playback time information and the audio playback time information is not limited to this. For example, the multiplexing unit 105 may output the video reproduction time information and the audio reproduction time information to be added to the reproduction reference time acquisition unit 125 for recording.

また、上記実施形態において、算出部は、|映像データ出力タイミング−音声データ出力タイミング|−|映像再生基準時刻−音声再生基準時刻|という順序の演算が行われて同期ずれ時間が算出されるように構成されていたが、|映像データ出力タイミング−映像再生基準時刻|−|音声データ出力タイミング−音声再生基準時刻|という順序の演算が行われて同期ずれ時間が算出されるように構成されてもよい。   In the above-described embodiment, the calculation unit performs the calculation of the order of | video data output timing−audio data output timing |-| video playback reference time−audio playback reference time | However, the synchronization deviation time is calculated by performing the following calculation: | video data output timing-video playback reference time |-| audio data output timing-audio playback reference time | Also good.

本発明に係る映像音声同期検出装置、および検証機能付き映像音声再生システムは、再生時に時刻情報が付かない映像データと音声データを用いて再生装置を評価できるという効果を有し、例えば、符号化された映像データと音声データを復号し、復号した映像データと音声データを再生時刻情報を用いて同期させて出力する装置の同期動作を、出力される映像データと音声データの同期を測定することによって検証する技術等として有用である。   The video / audio synchronization detection apparatus and the video / audio reproduction system with a verification function according to the present invention have an effect that the reproduction apparatus can be evaluated using video data and audio data without time information during reproduction. Decoding the video data and audio data, and synchronizing the output of the decoded video data and audio data using the reproduction time information and measuring the synchronization of the output video data and audio data This is useful as a technology to verify by

本発明の実施形態1に係るコーデックシステムの構成を示すブロック図である。It is a block diagram which shows the structure of the codec system which concerns on Embodiment 1 of this invention. 本発明の実施形態1に係る出力タイミング検出部122の構成を示すブロック図である。It is a block diagram which shows the structure of the output timing detection part 122 which concerns on Embodiment 1 of this invention. 本発明の実施形態1に係る算出部126の構成を示すブロック図である。It is a block diagram which shows the structure of the calculation part 126 which concerns on Embodiment 1 of this invention. 本発明の実施形態1の変形例に係る算出部126の構成を示すブロック図である。It is a block diagram which shows the structure of the calculation part 126 which concerns on the modification of Embodiment 1 of this invention. 本発明の実施形態2に係る出力タイミング検出部122と算出部326との構成を示すブロック図である。It is a block diagram which shows the structure of the output timing detection part 122 and the calculation part 326 which concern on Embodiment 2 of this invention.

符号の説明Explanation of symbols

100 映像音声符号化多重装置
101 映像データ発生部
102 映像データ符号化部
103 音声データ発生部
104 音声データ符号化部
105 多重化部
110 検証機能付き映像音声再生装置
111 多重分離部
112 映像データ復号部
113 音声データ復号部
120 映像音声同期検出装置
121 記録部
122 出力タイミング検出部
122a 映像データ照合部
122b 音声データ照合部
123 照合対象映像データ
124 照合対象音声データ
125 再生基準時刻取得部
126 算出部
126a カウンタ
126b 映像音声再生基準間隔算出部
126c 同期ずれ時間算出部
127 判定部
130 記憶媒体
226 算出部
226a 映像データ出力タイミングカウンタ
226b 音声データ出力タイミングカウンタ
226c 映像音声出力間隔算出部
326 算出部
326a 不一致画像数カウンタ
326b 出力時刻情報算出部
326c 映像音声再生基準間隔算出部
326d 同期ずれ時間算出部
DESCRIPTION OF SYMBOLS 100 Video / audio encoding / multiplexing device 101 Video data generating unit 102 Video data encoding unit 103 Audio data generating unit 104 Audio data encoding unit 105 Multiplexing unit 110 Video / audio reproduction device with verification function 111 Demultiplexing unit 112 Video data decoding unit 113 audio data decoding unit 120 video / audio synchronization detection device 121 recording unit 122 output timing detection unit 122a video data collation unit 122b audio data collation unit 123 collation target video data 124 collation target audio data 125 reproduction reference time acquisition unit 126 calculation unit 126a counter 126b Video / audio reproduction reference interval calculation unit 126c Synchronization deviation time calculation unit 127 Determination unit 130 Storage medium 226 Calculation unit 226a Video data output timing counter 226b Audio data output timing counter 226c Video / audio output interval calculation unit 326 calculation unit 326a mismatched image number counter 326b output time information calculation unit 326c video / audio reproduction reference interval calculation unit 326d synchronization deviation time calculation unit

Claims (14)

符号化映像データおよび符号化音声データを復号し、復号映像データと復号音声データとを同期させて出力する映像音声再生装置の同期動作を検証するための映像音声同期検出装置であって、
上記映像音声再生装置が所定の1画像の復号映像データを出力する映像データ出力タイミング、および上記映像音声再生装置が所定単位時間連続する所定の連続復号音声データを出力する音声データ出力タイミングを検出する出力タイミング検出部と、
上記符号化映像データまたは符号化音声データに含まれる再生時刻情報に基づいて、上記所定の1画像の復号映像データが出力されるべき映像再生基準時刻と上記所定の連続音声データが出力されるべき音声再生基準時刻とを取得する再生基準時刻取得部と、
上記映像データ出力タイミングと上記音声データ出力タイミングとの間隔である映像音声出力間隔と、上記映像再生基準時刻と上記音声再生基準時刻との基準間隔との差を同期ずれ時間として算出する算出部と、
を備えたことを特徴とする映像音声同期検出装置。
A video / audio synchronization detection device for verifying a synchronization operation of a video / audio reproduction device that decodes encoded video data and encoded audio data and outputs the decoded video data and decoded audio data in synchronization with each other,
Video data output timing at which the video / audio reproduction device outputs decoded video data of one predetermined image, and audio data output timing at which the video / audio reproduction device outputs predetermined continuous decoded audio data continuous for a predetermined unit time are detected. An output timing detector;
Based on the playback time information included in the encoded video data or the encoded audio data, the video playback reference time at which the decoded video data of the predetermined one image should be output and the predetermined continuous audio data should be output A reproduction reference time acquisition unit for acquiring the audio reproduction reference time;
A calculation unit that calculates a difference between a video / audio output interval, which is an interval between the video data output timing and the audio data output timing, and a reference interval between the video reproduction reference time and the audio reproduction reference time as a synchronization shift time; ,
An audio / video synchronization detection apparatus comprising:
請求項1の映像音声同期検出装置であって、
上記出力タイミング検出部は、
上記所定の1画像の復号映像データに対応する照合対象映像データを、上記映像音声再生装置が順次出力する各復号映像データと照合し、上記照合対象映像データと一致する復号映像データを検出する映像データ照合部と、
上記所定単位時間連続する所定の連続復号音声データに対応する照合対象音声データを、上記映像音声再生装置が順次出力する各復号音声データと照合し、上記照合対象音声データと一致する復号音声データを検出する音声データ照合部と、
を備え、
上記照合対象映像データに一致する復号映像データが出力されたタイミングを上記映像データ出力タイミングとして検出し、
上記照合対象音声データに一致する復号音声データが出力されたタイミングを上記音声データ出力タイミングとして検出するようになっていることを特徴とする映像音声同期検出装置。
The video / audio synchronization detection apparatus according to claim 1,
The output timing detector is
Video for collating target video data corresponding to decoded video data of one predetermined image with each decoded video data sequentially output by the video / audio reproduction device, and detecting decoded video data matching the target video data A data verification unit;
The collation target audio data corresponding to the predetermined continuous decoded audio data continuous for the predetermined unit time is collated with each decoded audio data sequentially output by the video / audio reproduction device, and the decoded audio data matching the collation target audio data is obtained. A voice data matching unit to be detected;
With
The timing at which the decoded video data that matches the verification target video data is output is detected as the video data output timing,
A video / audio synchronization detecting apparatus, wherein a timing at which decoded audio data matching the verification target audio data is output is detected as the audio data output timing.
請求項2の映像音声同期検出装置であって、
上記映像データ照合部は、複数画像の照合対象映像データについて、順次、それぞれと一致する復号映像データを検出し、上記算出部は、上記一致が検出された各復号映像データについての上記同期ずれ時間を算出することを特徴とする映像音声同期検出装置。
The video / audio synchronization detection device according to claim 2,
The video data collating unit sequentially detects decoded video data that matches each of video data to be collated of a plurality of images, and the calculating unit detects the synchronization deviation time for each decoded video data in which the match is detected. An audio / video synchronization detection apparatus characterized by calculating
請求項3の映像音声同期検出装置であって、
上記映像データ照合部は、
各照合対象映像データについて一致する復号映像データが検出された後、次の照合対象映像データについて一致する復号映像データが検出されるまでの照合回数をカウントする画像数カウンタを備え、
上記算出部は、
各照合対象映像データに一致する復号映像データが出力されるごとに、前回一致した復号映像データが出力された際の上記映像音声出力間隔に、上記画像数カウンタの値と1画像の出力時間との積を加算した値を、上記各照合対象映像データに一致する復号映像データについての映像音声出力間隔として求めることを特徴とする映像音声同期検出装置。
The video / audio synchronization detection apparatus according to claim 3,
The video data verification unit
An image number counter that counts the number of matchings until the matching decoded video data is detected for the next matching target video data after the matching decoded video data is detected for each matching target video data;
The calculation unit is
Each time the decoded video data that matches each verification target video data is output, the value of the image number counter, the output time of one image, and the output time of the video / audio output when the decoded video data that matches the previous time is output. A video / audio synchronization detecting apparatus that obtains a value obtained by adding the products of the two as a video / audio output interval for decoded video data that matches each of the verification target video data.
請求項2の映像音声同期検出装置であって、
上記音声データ照合部は、複数組の照合対象復号音声データについて、順次、それぞれと一致する復号音声データを検出し、上記算出部は、上記一致が検出された各復号音声データについての上記同期ずれ時間を算出するようになっていることを特徴とする映像音声同期検出装置。
The video / audio synchronization detection device according to claim 2,
The voice data collating unit sequentially detects decoded voice data that matches each of a plurality of sets of decoding target decoded voice data, and the calculation unit includes the synchronization deviation for each decoded voice data in which the match is detected. A video / audio synchronization detecting apparatus characterized in that time is calculated.
請求項5の映像音声同期検出装置であって、
上記音声データ照合部は、
各照合対象復号音声データについて一致する復号音声データが検出された後、次の照合対象復号音声データについて一致する復号音声データが検出されるまでの照合回数をカウントする組数カウンタを備え、
上記算出部は、
各照合対象音声データに一致する復号音声データが出力されるごとに、前回一致した復号音声データが出力された際の上記映像音声出力間隔に、上記組数カウンタの値と1組の所定単位時間連続する連続復号音声データの出力時間との積を加算した値を、上記各照合対象音声データに一致する復号音声データについての映像音声出力間隔として求めることを特徴とする映像音声同期検出装置。
The video / audio synchronization detection apparatus according to claim 5,
The voice data verification unit
A set number counter that counts the number of collations until the matching decoded voice data is detected for the next matching target decoded voice data after the matching decoded voice data is detected for each matching target decoded voice data;
The calculation unit is
Each time decoded audio data that matches each verification target audio data is output, the value of the set counter and one set of predetermined unit time are set at the video and audio output interval when the decoded audio data that matched previously is output. A video / audio synchronization detecting apparatus, wherein a value obtained by adding a product of output times of continuous continuous decoded audio data is obtained as a video / audio output interval for decoded audio data that matches each of the verification target audio data.
請求項1の映像音声同期検出装置であって、
上記算出部は、
上記映像データ出力タイミングと上記音声データ出力タイミングのうち早い方のタイミングで時間経過に応じた値のカウントを開始し、もう一方のタイミングでのカウント値を上記映像音声出力間隔として出力するカウンタを備えたことを特徴とする映像音声同期検出装置。
The video / audio synchronization detection apparatus according to claim 1,
The calculation unit is
A counter that starts counting the value according to the passage of time at the earlier timing of the video data output timing and the audio data output timing and outputs the count value at the other timing as the video / audio output interval; A video / audio synchronization detecting apparatus characterized by the above.
請求項1の映像音声同期検出装置であって、
上記算出部は、
所定のタイミングで時間経過に応じた値のカウントを開始し、上記映像データ出力タイミングでカウント値を出力する映像データ出力タイミングカウンタと、
上記所定のタイミングで時間経過に応じた値のカウントを開始し、上記音声データ出力タイミングでカウント値を出力する音声データ出力タイミングカウンタと、
上記映像データ出力タイミングカウンタによって出力されるカウント値と上記音声データ出力タイミングカウンタによって出力されるカウント値との差を上記映像音声出力間隔として出力する映像音声出力間隔算出部と、
を備えたことを特徴とする映像音声同期検出装置。
The video / audio synchronization detection apparatus according to claim 1,
The calculation unit is
A video data output timing counter that starts counting a value according to the passage of time at a predetermined timing and outputs a count value at the video data output timing;
An audio data output timing counter that starts counting a value according to the passage of time at the predetermined timing and outputs a count value at the audio data output timing;
A video / audio output interval calculation unit that outputs a difference between a count value output by the video data output timing counter and a count value output by the audio data output timing counter as the video / audio output interval;
An audio / video synchronization detection apparatus comprising:
請求項1の映像音声同期検出装置であって、
さらに、上記同期ずれ時間を所定の閾値と比較する判定部を備えたことを特徴とする映像音声同期検出装置。
The video / audio synchronization detection apparatus according to claim 1,
The video / audio synchronization detecting apparatus further comprising a determination unit that compares the synchronization deviation time with a predetermined threshold value.
請求項1の映像音声同期検出装置と、
映像音声再生装置と、
を有する検証機能付き映像音声再生システムであって、
上記映像音声再生装置は、
符号化多重データを符号化映像データと符号化音声データとに分離する多重分離部と、
上記符号化映像データを復号する映像データ復号部と、
上記符号化音声データを復号する音声データ復号部と、
を備え、
復号された復号映像データと復号音声データとを同期させて出力する一方、
上記映像音声同期検出装置は、
上記復号映像データと上記復号音声データとの同期ずれ時間を検出することを特徴とする検証機能付き映像音声再生システム。
A video / audio synchronization detection apparatus according to claim 1;
A video / audio playback device;
A video / audio reproduction system with a verification function having
The video / audio reproduction device is
A demultiplexing unit that separates the encoded multiplexed data into encoded video data and encoded audio data;
A video data decoding unit for decoding the encoded video data;
An audio data decoding unit for decoding the encoded audio data;
With
While outputting decoded video data and decoded audio data in synchronization,
The video / audio synchronization detecting device is:
A video / audio reproduction system with a verification function, wherein a synchronization shift time between the decoded video data and the decoded audio data is detected.
請求項10の検証機能付き映像音声再生システムであって、
上記同期ずれ時間を所定の閾値と比較する判定部を備え、
上記映像データ復号部は、処理時間が互いに異なる複数種類の復号処理を行う機能を有し、上記映像データ出力タイミングが遅いことにより上記同期ずれ時間が所定の閾値より大きい場合の方が、小さい場合よりも処理時間の短い復号処理を行うように構成されていることを特徴とする検証機能付き映像音声再生システム。
The video / audio reproduction system with verification function according to claim 10,
A determination unit that compares the synchronization deviation time with a predetermined threshold;
The video data decoding unit has a function of performing a plurality of types of decoding processes with different processing times, and the case where the synchronization deviation time is larger than a predetermined threshold due to the late video data output timing is smaller A video / audio reproduction system with a verification function, which is configured to perform a decoding process with a shorter processing time.
請求項11の検証機能付き映像音声再生システムであって、
上記映像データ復号部は、1画像あたりの画素数を増減させることによって、上記処理時間が互いに異なる複数種類の復号処理を行うことを特徴とする検証機能付き映像音声再生システム。
The video / audio reproduction system with a verification function according to claim 11,
The video / audio reproduction system with a verification function, wherein the video data decoding unit performs a plurality of types of decoding processing with different processing times by increasing / decreasing the number of pixels per image.
請求項11の検証機能付き映像音声再生システムであって、
上記映像データ復号部は、復号映像データのビットレートを増減させることによって、上記処理時間が互いに異なる複数種類の復号処理を行うことを特徴とする検証機能付き映像音声再生システム。
The video / audio reproduction system with a verification function according to claim 11,
The video / audio reproduction system with a verification function, wherein the video data decoding unit performs a plurality of types of decoding processing with different processing times by increasing / decreasing a bit rate of the decoded video data.
請求項10の検証機能付き映像音声再生システムであって、
上記同期ずれ時間を所定の閾値と比較する判定部を備え、
上記映像データ復号部は、上記映像データ出力タイミングが早いことにより上記同期ずれ時間が所定の閾値より大きい場合、上記復号映像データを遅らせて出力させ、上記音声データ出力タイミングが早いことにより上記同期ずれ時間が所定の閾値より大きい場合、上記復号音声データを遅らせて出力させるように構成されていることを特徴とする検証機能付き映像音声再生システム。
The video / audio reproduction system with verification function according to claim 10,
A determination unit that compares the synchronization deviation time with a predetermined threshold;
The video data decoding unit delays and outputs the decoded video data when the synchronization shift time is greater than a predetermined threshold due to the video data output timing being early, and the audio data output timing is early. A video / audio reproduction system with a verification function, characterized in that when the time is larger than a predetermined threshold, the decoded audio data is delayed and output.
JP2006130139A 2006-05-09 2006-05-09 Video audio synchronization detector, and video audio reproduction system having verification function Pending JP2007306110A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006130139A JP2007306110A (en) 2006-05-09 2006-05-09 Video audio synchronization detector, and video audio reproduction system having verification function

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006130139A JP2007306110A (en) 2006-05-09 2006-05-09 Video audio synchronization detector, and video audio reproduction system having verification function

Publications (1)

Publication Number Publication Date
JP2007306110A true JP2007306110A (en) 2007-11-22

Family

ID=38839706

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006130139A Pending JP2007306110A (en) 2006-05-09 2006-05-09 Video audio synchronization detector, and video audio reproduction system having verification function

Country Status (1)

Country Link
JP (1) JP2007306110A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115695918A (en) * 2023-01-05 2023-02-03 南昌宾果信息技术有限公司 Multi-camera broadcast guide control method and device, readable storage medium and terminal equipment

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115695918A (en) * 2023-01-05 2023-02-03 南昌宾果信息技术有限公司 Multi-camera broadcast guide control method and device, readable storage medium and terminal equipment
CN115695918B (en) * 2023-01-05 2023-04-18 南昌宾果信息技术有限公司 Multi-camera broadcast guide control method and device, readable storage medium and terminal equipment

Similar Documents

Publication Publication Date Title
US6163646A (en) Apparatus for a synchronized playback of audio-video signals
US6078725A (en) Apparatus for a synchronized playback of audio-video signals
JP3197766B2 (en) MPEG audio decoder, MPEG video decoder and MPEG system decoder
US7359006B1 (en) Audio module supporting audio signature
JP4991129B2 (en) Video / audio playback apparatus and video / audio playback method
US7760770B2 (en) Stream data processing apparatus and stream data processing method
US8045836B2 (en) System and method for recording high frame rate video, replaying slow-motion and replaying normal speed with audio-video synchronization
EP2227029A2 (en) Image processing apparatus, image processing method, and program
US20060274827A1 (en) Apparatus and method for synchronized playback
US7961792B2 (en) Robust system for maintaining audio/video synchronization during playback of multimedia streams with no embedded time stamps
JP3133630B2 (en) MPEG system decoder
JP2006340066A (en) Moving image encoder, moving image encoding method and recording and reproducing method
JP3856792B2 (en) Signal processing device
JP2007306110A (en) Video audio synchronization detector, and video audio reproduction system having verification function
US20150104158A1 (en) Digital signal reproduction device
US8428422B2 (en) Moving picture multiplexing apparatus, audio and video recording apparatus and moving picture multiplexing method
KR20100030574A (en) Video recording and playback apparatus
US20110022400A1 (en) Audio resume playback device and audio resume playback method
US8331757B2 (en) Time code processing apparatus, time code processing method, program, and video signal playback apparatus
KR20080089721A (en) Lip-synchronize method
JP3944845B2 (en) Information processing apparatus and method, recording medium, and program
JPWO2006075457A1 (en) Recording device
CN111131868B (en) Video recording method and device based on player
JP4007575B2 (en) Image / audio bitstream splitting device
JP2006310916A (en) Audio video information decoding method, audio video information decoding device, and audio video information decoding program, and medium recorded with audio video information decoding program