JP2500579B2 - Video and audio synchronization system - Google Patents

Video and audio synchronization system

Info

Publication number
JP2500579B2
JP2500579B2 JP1603593A JP1603593A JP2500579B2 JP 2500579 B2 JP2500579 B2 JP 2500579B2 JP 1603593 A JP1603593 A JP 1603593A JP 1603593 A JP1603593 A JP 1603593A JP 2500579 B2 JP2500579 B2 JP 2500579B2
Authority
JP
Japan
Prior art keywords
video
decoding
audio
reproducing
coded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1603593A
Other languages
Japanese (ja)
Other versions
JPH06233269A (en
Inventor
英博 松本
祐史 丹羽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP1603593A priority Critical patent/JP2500579B2/en
Priority to CA002107727A priority patent/CA2107727C/en
Priority to AU48830/93A priority patent/AU668762B2/en
Priority to EP93116167A priority patent/EP0591944B1/en
Priority to DE69327563T priority patent/DE69327563T2/en
Priority to US08/133,219 priority patent/US5508816A/en
Publication of JPH06233269A publication Critical patent/JPH06233269A/en
Priority to AU48106/96A priority patent/AU679872B2/en
Application granted granted Critical
Publication of JP2500579B2 publication Critical patent/JP2500579B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】近年自然画像や音声の符号化技術
の進歩や、記録媒体の大容量化、データ通信回線の高速
化に伴い、高い圧縮率でデジタル符号化された自然画像
データを高速で復号し、連続的に再生表示を行いそれら
を動画像として扱うことが可能となってきた。これが単
なる映像の連続表示にとどまらず、音声をともない「映
像による電話」あるいは「映像を伴う電子メール」とし
て利用したり、データベースの表示技術としても今後お
おいに利用されることが予想される。
[Industrial field of application] With recent advances in natural image and voice coding technology, large capacity recording media, and high-speed data communication lines, high-speed conversion of natural image data digitally encoded at high compression rates has been achieved. It has become possible to decode them, to continuously reproduce and display them, and to handle them as moving images. This is not limited to simple continuous display of images, but it is expected that it will be used as "telephone with images" or "e-mail with images" accompanied by sound, and will also be widely used in database display technology in the future.

【0002】本発明は、映像音声同期システムに関し、
特にデジタル符号化した映像および音声のデータを扱っ
た動画像の再生時に映像−音声間の同期すなわち同時性
を動作速度によらず実現する映像音声同期システムに関
する。
The present invention relates to a video / audio synchronization system,
In particular, the present invention relates to a video / audio synchronization system that realizes video-audio synchronization, that is, simultaneity at the time of reproducing a moving image that handles digitally encoded video and audio data, regardless of the operating speed.

【0003】[0003]

【従来の技術】従来の映像音声同期システムは、映像の
符号化と音声の符号化とをそれぞれ独立した機器で行
い、何らかのフォーマット(書式)に従って映像と音声
とを関連づけ、伝送あるいは蓄積し、再び分離した後、
映像および音声の個々の復号化器で再生していた。この
ため、デジタル符号化した、映像および音声のデータ間
での同時性を実現する方法としては、個々の再生システ
ム内に映像−音声間の遅延量をあらかじめ予測して作成
した再生用のフォーマットを用意し、再生時に同時にな
るように映像および音声データの結合を行う方法、ある
いは、再生システム側に「出力遅延回路」を設け、対象
となる動画ごとに遅延量を調整する方法を用いていた。
例えば、特開平3−150552号公報に記載の「映像
音声編集システム」では、映像音声編集システムの一例
として、主に映画などの映像フィルムに対する磁気テー
プ上の音声をデジタル化して編集をする同期方法につい
て示しているが、これは、磁気フィルムの持つアドレス
情報に従って、音声データに切り張り作業を施した後、
映像用フィルムとパーフォレーション同期走行可能な編
集用磁気フィルムとを用いて再生するようになってい
た。即ち、システムの同期性をハードウェアを用いて実
現し、事前に十分な調整を行うことで機能を発揮するも
のであった。さらに前述の公報に記載の編集手段に
は、’せりふ’のアフターレコーディング時に発生する
「画面より早く’せりふ’が終了する場合」に対応し
て、「音声のトーンを変更せずに長さだけを変更できる
機能を有しており」という記述に示されるような手段を
設け、出力された映像音声を人の目と耳で確認し、一つ
以上の何らかの操作を加えて修正する方法も用意してい
た。
2. Description of the Related Art In a conventional video / audio synchronization system, video encoding and audio encoding are performed by independent devices, and the video and audio are associated with each other according to a certain format, transmitted or stored, and then reproduced again. After separating
It was played back with individual video and audio decoders. For this reason, as a method for realizing simultaneity between digitally encoded video and audio data, a reproduction format created by predicting a delay amount between video and audio in each reproduction system in advance is used. A method of preparing and combining video and audio data so that they are simultaneously reproduced, or a method of providing an “output delay circuit” on the reproduction system side and adjusting the delay amount for each moving image of interest has been used.
For example, in the "video / audio editing system" described in Japanese Patent Laid-Open No. 3-150552, as an example of the video / audio editing system, a synchronization method is mainly used for digitizing and editing audio on a magnetic tape for a video film such as a movie. However, after cutting the audio data according to the address information of the magnetic film,
It was designed to be reproduced by using an image film and an editing magnetic film capable of running in synchronization with perforation. That is, the system synchronism is realized by using hardware, and the function is exhibited by performing sufficient adjustment in advance. In addition, the editing means described in the above publication corresponds to "when the dialogue is finished earlier than the screen" that occurs during after recording of the dialogue, "only the length without changing the tone of the voice" There is also a method to check the output video and audio with human eyes and ears and make corrections by adding one or more operations. Was.

【0004】[0004]

【発明が解決しようとする課題】上述した従来の映像音
声同期システムは、対象となる映像の性質、即ち、画面
の複雑さや動きの多さなどにより発生するデータ量が一
定せず、符号化する単位ごとに変動するため、映像の復
号再生に必要になる時間が一意には決定できないことか
ら、最初から同期させることを諦め、平均的な値として
の遅延量を予測してすべてのデータを同一の基準で処理
したり、映画の編集作業のように、実際に再生した映像
と音声との再生時のずれ量を調べた後、再び映像−音声
間の遅延量を予測しなおし、結合を行うという方法で同
時性を得ていたので、映像−音声間の遅延量をリアルタ
イムに状況に応じた方法で修正し、再生時に映像と音声
との同期を厳密に保つことができず、連続した音声再生
の途切れやトーンの変化など音声再生への障害が生ずる
という問題点があった。
In the conventional video / audio synchronization system described above, the amount of data generated due to the nature of the target video, that is, the complexity of the screen, the large amount of movement, etc., is not constant and is encoded. Since it varies from unit to unit, the time required for video decoding and playback cannot be uniquely determined, so give up synchronizing from the beginning and predict the delay amount as an average value to make all data the same. After checking the amount of deviation between the video and audio that was actually played, such as when editing a movie or editing a movie, re-estimate the delay amount between the video and audio again, and combine them. Since the simultaneity was obtained by such a method, the amount of delay between video and audio was corrected in real time by a method according to the situation, and it was not possible to strictly maintain synchronization between video and audio during playback, and continuous audio Play breaks and tones Failure to sound reproduction there is a problem that arise, such as changes.

【0005】本発明の目的は、デジタル符号化された映
像と音声のデータの復号再生中に発生するずれ量を、リ
アルタイムに状況に応じた方法で修正することのできる
映像音声同期システムを提供することにある。
An object of the present invention is to provide a video / audio synchronization system capable of correcting the amount of deviation occurring during decoding and reproduction of digitally encoded video and audio data in real time by a method according to the situation. Especially.

【0006】[0006]

【課題を解決するための手段】本発明の映像音声同期シ
ステムは、デジタル符号化した映像および音声を含む動
画の符号化データを同期させて復号再生する映像音声同
期再生システムであって、予め前記デジタル符号化した
映像および音声の符号化データを格納する符号化データ
記憶装置と、前記映像の符号化データを任意に定めるデ
ータ量ごとに復号し再生する符号化映像復号再生装置
と、前記音声の符号化データの中から任意に与えられる
データ量分を復号し再生する符号化音声復号再生装置
と、前記符号化データ記憶装置から映像および音声の符
号化データを読出し前記符号化映像復号再生装置および
符号化音声復号再生装置に転送する転送制御手段と、時
間を計測する時間計測装置を参照し前記転送制御手段と
前記符号化映像復号再生装置と前記符号化音声復号再生
装置との起動を制御する復号再生装置起動制御手段とを
備え、前記復号再生装置起動制御手段が、映像および音
声の復号再生処理のいずれか一方の処理の終了を契機と
して計測を開始する前記時間計測装置が計測する双方の
復号再生処理の終了までの時間を監視し、映像の復号再
生処理と音声の復号再生処理とのそれぞれのスピードの
差を検出し、前記データ転送手段に前記映像の符号化デ
ータのデータ転送タイミングの変更を通知すると共に前
記符号化映像復号再生装置の起動タイミングを変更し、
復号再生処理後の映像の表示時間を変更する構成であ
る。
A video / audio synchronizing system of the present invention is a video / audio synchronous reproducing system for synchronously decoding and reproducing coded data of a moving image including digitally coded video and audio. A coded data storage device for storing coded data of digitally coded video and audio, a coded video decoding / playback device for decoding and playing back the coded data of the video for each arbitrarily defined data amount, and the audio data A coded audio decoding / reproducing apparatus for decoding and reproducing a data amount arbitrarily given from the coded data; a coded video decoding / reproducing apparatus for reading coded data of video and audio from the coded data storage device; The transfer control means for transferring to the encoded audio decoding / reproducing device and the time measuring device for measuring time are referred to, and the transfer control means and the encoded video decoding / reproducing device are referred to. An apparatus and a decoding / reproducing apparatus activation control means for controlling activation of the encoding / decoding / decoding / reproducing apparatus, wherein the decoding / reproducing apparatus activation control means terminates one of the video and audio decoding / reproducing processings. By monitoring the time until the end of both decoding and reproduction processing measured by the time measuring device which starts measurement as an opportunity, and detects the difference in speed between the decoding and reproduction processing of video and the decoding and reproduction processing of audio, Notifying the data transfer means of a change in the data transfer timing of the encoded data of the video, and changing the start timing of the encoded video decoding / reproducing device,
The configuration is such that the display time of the video after the decoding / reproduction processing is changed.

【0007】本発明の映像音声同期システムは、時間計
測装置が、映像および音声の復号再生処理のいずれか一
方の処理の終了を契機として計測を開始し双方の復号再
生処理の終了を検出すると復号再生装置起動手段に割り
込みを掛ける機能を有し、前記復号再生装置起動手段
が、前記時間計測装置の割り込みを受けて符号化映像復
号再生装置の起動タイミングを変更し、復号再生処理後
の映像の表示時間を変更する機能を有してもよい。
In the video / audio synchronization system of the present invention, the time measuring device starts measurement upon the end of one of the video and audio decoding / reproducing processes, and when the end of both decoding / reproducing processes is detected, decoding is performed. The decoding / reproducing apparatus starting means has a function of interrupting the reproducing apparatus starting means, and the decoding / reproducing apparatus starting means changes the start timing of the coded video decoding / reproducing apparatus in response to the interruption of the time measuring apparatus, and It may have a function of changing the display time.

【0008】本発明の映像音声同期システムは、符号化
映像復号再生装置および符号化音声復号再生装置をソフ
トウェアとして実現してもよい。
In the video / audio synchronization system of the present invention, the coded video decoding / reproducing apparatus and the coded audio decoding / reproducing apparatus may be realized as software.

【0009】[0009]

【作用】音声データの再生時間軸を、システム全体の概
念的な動作時間と仮定し、単位データ量分の音声再生処
理時刻に表示されている実画像フレームと、計算により
この時刻での表示が予測される理想フレームとの、表示
時刻のずれを計測し、その結果から実フレームの表示タ
イミングを修正する事により、連続映像と音声の同期を
とる。(画像フレームとは動画像を扱う上での一コマを
さすもので、この場合画像データを数値データに置き換
える符号化処理をほどこしてあることを前提として符号
化画像フレームと呼ぶ。また、単にこの単位をフレーム
と呼んでいる。実フレームとは、映像復号再生装置の持
つ動作速度と、画像の性質に依存したまま再生表示され
ていた動画像の任意の指定時刻での実際の表示フレーム
を指す。理想フレームとは、音声データの再生処理速度
が、一定で単位時間内に速度の変化が無く映像複合再生
に必要な時間が十分に小さいとき、任意の指定時刻で表
示されるべき画像フレームを指す。)
[Operation] Assuming that the reproduction time axis of the audio data is the conceptual operation time of the entire system, the actual image frame displayed at the audio reproduction processing time for the unit data amount and the display at this time by calculation The continuous video and audio are synchronized by measuring the display time difference from the predicted ideal frame and correcting the display timing of the actual frame from the result. (The image frame refers to one frame in handling a moving image, and in this case, it is called an encoded image frame on the premise that encoding processing for replacing image data with numerical data has been performed. The unit is called a frame, and the actual frame refers to an actual display frame at an arbitrary specified time of the moving image that is reproduced and displayed while depending on the operation speed of the video decoding / reproducing apparatus and the property of the image. An ideal frame is an image frame that should be displayed at any specified time when the playback processing speed of audio data is constant and the speed does not change within a unit time and the time required for video composite playback is sufficiently small. Point)

【実施例】次に、本発明の実施例について図面を参照し
て説明する。
Embodiments of the present invention will now be described with reference to the drawings.

【0010】図1は本発明の第1の実施例のブロック図
である。
FIG. 1 is a block diagram of a first embodiment of the present invention.

【0011】本発明の第1の実施例の映像音声同期シス
テムは、予めデジタル符号化した映像および音声の符号
化データを格納する符号化データ記憶装置1と、符号化
データ記憶装置1から映像および音声の符号化データを
受け、時間を計測する時間計測装置2を参照し映像と音
声との相互の出力タイミングを制御し、映像の符号化デ
ータは1フレーム分のデータ量とし、音声の符号化デー
タは映像の符号化データは1フレーム分に対応するデー
タ量として出力する同期制御装置3と、同期制御装置3
の出力する映像の符号化データを1フレーム分ごとに復
号し再生する符号化映像復号再生装置4と、同期制御装
置3から任意に与えられるデータ量の音声の符号化デー
タを復号し再生する符号化音声復号再生装置5と、符号
化映像復号再生装置4および符号化音声復号再生装置5
の再生出力を受け映像と音声に変換し視覚化する出力装
置6とを備えている。
The video / audio synchronization system according to the first embodiment of the present invention is a coded data storage device 1 for storing coded data of video and audio that have been digitally coded in advance, and a video and audio data from the coded data storage device 1. Receiving the encoded data of the audio and referring to the time measuring device 2 for measuring the time, the mutual output timing of the image and the audio is controlled, and the encoded data of the image is set to the data amount of one frame, and the encoding of the audio is performed. The synchronization control device 3 outputs the encoded data of video as a data amount corresponding to one frame, and the synchronization control device 3.
A coded video decoding / reproducing device 4 which decodes and reproduces the encoded data of the video output for each frame, and a code which decodes and reproduces the encoded data of the audio of a data amount arbitrarily given from the synchronization control device 3. Encoded audio decoding / reproducing apparatus 5, encoded video decoding / reproducing apparatus 4 and encoded audio decoding / reproducing apparatus 5
The output device 6 which receives the reproduction output of the above and converts it into a video and audio and visualizes it.

【0012】さらに、同期制御装置3は、符号化データ
記憶装置1から映像および音声の符号化データを読出し
符号化映像復号再生装置4および符号化音声復号再生装
置5に転送する転送制御手段7と、時間計測装置2を参
照し符号化映像復号再生装置4と符号化音声復号再生装
置5と転送制御手段7とを制御する復号再生装置起動制
御手段8と、時間計測装置2の割り込みの時間間隔iを
設定する設定手段9とを含むソフトウェアで構成し、同
様に時間計測装置2は、同期制御装置3に割り込みを掛
ける割り込み手段10と任意の時間を測定するタイマ1
1とを含むソフトウェアで構成している。
Further, the synchronization control device 3 includes transfer control means 7 for reading out the encoded data of video and audio from the encoded data storage device 1 and transferring them to the encoded video decoding / reproducing device 4 and the encoded audio decoding / reproducing device 5. , A decoding / reproducing device activation control means 8 for controlling the coded video decoding / reproducing device 4, the encoded audio decoding / reproducing device 5, and the transfer control means 7 with reference to the time measuring device 2, and an interrupt time interval of the time measuring device 2. The time measuring device 2 includes an interrupting device 10 for interrupting the synchronous control device 3 and a timer 1 for measuring an arbitrary time.
1 and software including.

【0013】ここで本発明では、符号化映像復号再生装
置4と符号化音声復号再生装置5とが扱う、映像および
音声信号のデジタル符号化方式には制限を設けず、また
その機能を満たすために十分なバッファメモリを設けて
おき(例えばハードディスクで対応する)、このバッフ
ァメモリ内に復号再生を行う符号化されたデータが格納
された状態で動作開始指令を受け取ると、装置内部の制
御によりデータの復号再生を行う。この処理は映像に関
しては1フレーム、音声に関しては任意に与えられたデ
ータ量分の再生を一度に行うものとする。
In the present invention, there is no limitation on the digital encoding system of video and audio signals handled by the encoded video decoding / reproducing apparatus 4 and the encoded audio decoding / reproducing apparatus 5, and the function is satisfied. If a sufficient buffer memory is provided (for example, a hard disk is supported), and the operation start command is received with the encoded data for decoding and playback stored in this buffer memory, the data is controlled by the internal control of the device. Decrypt and play back. In this processing, one frame for video and one audio data for audio are reproduced at one time.

【0014】前項と同様に、符号化データ記憶装置1の
中での、映像および音声データの記録フォーマットおよ
び結合方法も特定せず、それぞれのデータは十分早い読
みだしが可能で、例えばタイムコードや、1フレームの
映像データの前後に対応する音声データを配置したフォ
ーマットなどで、これらの同時性が判別可能であればよ
いものとする。
As in the previous section, the recording format and the combining method of the video and audio data in the encoded data storage device 1 are not specified, and the respective data can be read out sufficiently quickly, for example, time code and It is sufficient that the simultaneity can be determined by a format in which audio data corresponding to before and after one frame of video data is arranged.

【0015】次に、第1の実施例の動作に付いて説明す
る。
Next, the operation of the first embodiment will be described.

【0016】図2は第1の実施例の動作を説明する流れ
図である。動作の説明に使用する各部の名称および符号
は図1のものを使用する。
FIG. 2 is a flow chart for explaining the operation of the first embodiment. The names and reference numerals of the respective parts used in the description of the operation are the same as those in FIG.

【0017】動作を開始すると、同期再生装置3内の復
号再生装置起動制御手段8は、転送制御手段7を介して
符号化音声復号再生装置5内のデータバッファに、ステ
ップ(以下Sと記す)1で符号化データ記憶装置1から
読出した符号化音声データを任意の単位時間t秒分入力
する。このとき映像の再生は、t秒内にnフレーム再生
されるようにあらかじめ対応づけてある。次にS2で復
号再生装置起動制御手段8が、単位時間であるt秒分の
音声発生開始と連続映像表示開始とを指示し、S3で転
送制御手段7を介して1フレーム分の符号化映像データ
を符号化映像復号再生装置4に入力し、復号再生機能を
起動する。入力した符号化データは、それぞれ各復号再
生装置が内部制御で復号化し、アナログ信号に変換され
た映像と音声は、出力装置6に送出され視覚化される。
ここまでの動作で、1フレーム目の映像の表示と、音声
の発声とが開始される。
When the operation is started, the decoding / reproduction device activation control means 8 in the synchronous reproduction device 3 makes a step (hereinafter referred to as S) in the data buffer in the encoded / voice decoding / reproduction device 5 via the transfer control means 7. The encoded voice data read from the encoded data storage device 1 in 1 is input for an arbitrary unit time t seconds. At this time, the reproduction of the video is associated in advance so that n frames are reproduced within t seconds. Next, in S2, the decoding / reproduction device activation control means 8 instructs the start of sound generation for a unit time of t seconds and the start of continuous video display, and in S3, through the transfer control means 7, the encoded video for one frame. The data is input to the coded video decoding / reproducing device 4 to activate the decoding / reproducing function. The input coded data is decoded by each decoding / reproducing device under internal control, and the video and audio converted into analog signals are sent to the output device 6 for visualization.
By the operation up to this point, the display of the video of the first frame and the utterance of voice are started.

【0018】次に、復号再生装置起動制御手段8は、転
送制御手段7を介して2フレーム目の符号化映像データ
を符号化映像復号再生装置4に入力し、復号再生機能を
起動する。するとただちに符号化映像復号再生装置4は
再生処理を開始し、出力装置6は自己の持つ動作クロッ
クに合わせて2フレーム目を表示する。この動作をn回
繰り返せば、nフレームの動画像を再生表示し、n+1
回以上繰り返せば、nフレームより多くの動画を再生す
ることになる。ところで現在、再生しようとしていた映
像データはnフレーム分であり、もし仮に映像および音
声の再生機能の処理速度にムラなく、規則正しく行われ
るとした場合は、図3の映像フレームと音声との関係を
説明する説明図(その1)に示すように、再生開始から
正確にt秒後にはnフレーム目の映像の表示は終わり、
n+1フレーム目の映像が表示される瞬間であるといえ
る。また映像のn+1フレームを「計測対象映像フレー
ム」と名付けておく。しかしながら、すべての映像と音
声とが全く誤差なしで同時に終了することは、滅多にあ
ることではなく、通常は、いずれかが早く終了し、一方
が遅れて終了することになる。従ってこの映像と音声と
の終了時刻の差である、音声再生終了時刻と映像のn+
1フレーム目の表示時刻との時間差を計測するため、ま
ず、S4で単位時間t秒が経過し音声データの再生が終
了したか否かを判別し、まだ終了していなければ、フレ
ームごとの復号再生動作の度に、S5でこの映像が計測
対象の映像フレームであるか否かを判別し、計測対象で
なければS3に戻る。
Next, the decoding / reproducing device activation control means 8 inputs the encoded video data of the second frame into the encoded video decoding / reproducing device 4 via the transfer control means 7, and activates the decoding / reproducing function. Immediately thereafter, the coded video decoding / reproducing device 4 starts the reproducing process, and the output device 6 displays the second frame in accordance with its own operation clock. If this operation is repeated n times, moving images of n frames are reproduced and displayed, and n + 1
If it is repeated more than once, more moving images than n frames will be reproduced. By the way, at present, the video data to be reproduced is for n frames, and if the processing speed of the video and audio reproduction functions is uniform and is performed regularly, the relationship between the video frames and audio in FIG. As shown in the explanatory diagram (No. 1) to be described, the display of the video of the nth frame ends exactly t seconds after the reproduction starts,
It can be said that it is the moment when the image of the (n + 1) th frame is displayed. In addition, the n + 1 frame of the image is named “measurement target image frame”. However, it is rare that all video and audio ends at the same time without any error. Normally, one of them ends earlier and the other ends later. Therefore, this is the difference between the end time of the video and the audio, that is, the audio reproduction end time and n + of the video.
In order to measure the time difference from the display time of the first frame, first, in S4, it is determined whether or not the unit time t seconds has elapsed and the reproduction of the audio data has ended, and if it has not ended, the decoding for each frame is performed. Each time the reproduction operation is performed, it is determined in S5 whether or not this video is a video frame to be measured, and if it is not the measurement target, the process returns to S3.

【0019】S4で単位時間t秒が経過し音声データの
再生が終了したと判別するとS6で設定手段9からタイ
マ11を設定し、時間計測を開始する。続いてS7で符
号化映像データを符号化映像復号再生装置4に入力し、
復号再生機能を起動し、S8でフレームごとの復号再生
動作の度にこの映像が計測対象の映像フレームであるか
否かを判別し、計測対象であることを検出するまで繰返
す。計測対象の映像フレームであることを検出すると、
S9で時間計測を終了する。
When it is determined in S4 that the unit time t seconds has elapsed and the reproduction of the audio data is completed, the timer 11 is set from the setting means 9 in S6 and the time measurement is started. Subsequently, in S7, the encoded video data is input to the encoded video decoding / reproducing device 4,
The decoding / reproducing function is activated, and in S8, it is discriminated whether or not this video is a video frame to be measured every time the decoding / reproducing operation is performed for each frame, and the process is repeated until it is detected that the video is a measurement target. When it is detected that it is a video frame to be measured,
The time measurement ends in S9.

【0020】又、S5で音声データの再生が終了しない
状態であるにもかかわらず、映像が計測対象の映像フレ
ームであると判別した場合には、S10で設定手段9か
らタイマ11を設定し、時間計測を開始する。続いてS
11で単位時間t秒が経過し音声データの再生が終了し
たと判別するとS8と同様に、S9で時間計測を終了す
る。
If it is determined in S5 that the video is the video frame to be measured, even though the reproduction of the audio data is not completed, the timer 11 is set by the setting means 9 in S10. Start time measurement. Then S
When it is determined in 11 that the unit time t seconds has elapsed and the reproduction of the audio data has ended, the time measurement is ended in S9, similarly to S8.

【0021】なお、時間計測装置2での経過時間の計測
は、タイマ11とつながった割り込み手段10を使用す
る。同期制御装置3で設定した割り込み時間間隔iごと
に、同期制御装置3へ割り込みをかけ、同期制御装置3
はこの割り込み回数をカウントし、経過時間の計測を実
現する。但し、時間の計測方法はこの方法だけとは限ら
ない。
For measuring the elapsed time in the time measuring device 2, the interrupt means 10 connected to the timer 11 is used. An interrupt is issued to the synchronous control device 3 at every interrupt time interval i set by the synchronous control device 3,
Counts the number of interrupts to measure elapsed time. However, the time measuring method is not limited to this method.

【0022】S9で時間計測を終了すると、次にS12
でこのときの経過時間を映像と音声の遅延量dとし、こ
の遅延量dの大きさに従って以下の処理を選択する。
When the time measurement is completed in S9, next S12
Then, the elapsed time at this time is set as the delay amount d of the video and audio, and the following process is selected according to the magnitude of the delay amount d.

【0023】前述のように理想的にt秒後のフレーム表
示が、n+1番目のフレームであるか、遅延量dが1フ
レーム分の表示にかかる時間以内(出力装置10の持つ
垂直帰線期間以内、即ち d≒0)の遅れであれば、映
像と音声の同時性は保たれていると考えて、S13で同
期処理を終了する。又、遅延量dが1フレーム表示期間
内(d≦t/n秒)であれば、S14でn+1番目のフ
レームの表示時間を延長するか短縮して同期修正操作を
行い、S13で同期処理を終了する。詳細に説明すれ
ば、音声が遅れている場合には、n+2番目のフレーム
表示タイミングを遅らせることにより、n+1番目のフ
レーム表示時間を延長し終端を揃える。又、映像が遅れ
ている場合には、n+2番目のフレーム表示タイミング
を早めることにより、n+1番目のフレーム表示時間を
短縮し終端を揃えるようにする。
As described above, ideally, the frame display after t seconds is the (n + 1) th frame, or the delay amount d is within the time required to display one frame (within the vertical blanking period of the output device 10). That is, if the delay is d≈0), it is considered that the simultaneity between the video and the audio is maintained, and the synchronization processing is ended in S13. If the delay amount d is within one frame display period (d ≦ t / n seconds), the synchronization correction operation is performed by extending or shortening the display time of the (n + 1) th frame in S14, and the synchronization processing is performed in S13. finish. More specifically, if the audio is delayed, the display timing of the (n + 2) th frame is delayed to extend the display time of the (n + 1) th frame and align the ends. Further, when the video is delayed, the display timing of the (n + 2) th frame is advanced to shorten the display time of the (n + 1) th frame so that the ends are aligned.

【0024】S12で遅延量dが1フレーム表示期間よ
り大(d>t/n秒)と判別すれば、S15でフレーム
表示を取りやめるフレーム間引きを行うか同一フレーム
を保持して同期修正操作を行い、S13で同期処理を終
了する。詳細に説明すれば、音声が遅れている場合に
は、(t/n秒)以上の間、n+2フレームの表示を同
期のとれるタイミングになるまで待つことによりn+1
番目のフレーム表示時間を延長し、映像が遅れている場
合には、n+2番目のフレーム表示をとりやめて1フレ
ーム表示期間(t/n秒)を越える調整を行う。即ち、
この場合の表示順序は、〔‥n-1, n, n+1, n+3‥〕とな
る。又、これでも不足する場合は、必要に応じてn+
3,4,5・・のフレーム表示を取りやめる。
If it is determined in S12 that the delay amount d is larger than the one-frame display period (d> t / n seconds), in S15, frame thinning for canceling frame display is performed, or the same frame is held and synchronization correction operation is performed. , S13, the synchronization process ends. More specifically, if the voice is delayed, by waiting for (t / n seconds) or more until the timing at which the display of n + 2 frames can be synchronized becomes n + 1.
If the image display is delayed by extending the frame display time of the nth frame, the display of the (n + 2) th frame is stopped, and the adjustment for exceeding the one frame display period (t / n seconds) is performed. That is,
In this case, the display order is [... n-1, n, n + 1, n + 3 ...]. Also, if this is still insufficient, n + as needed
Cancel the frame display of 3, 4, 5 ...

【0025】次に、具体的に数値を示して説明する。Next, a description will be given by showing concrete numerical values.

【0026】ここでは、本発明による映像音声同期シス
テムを汎用パーソナルコンピュータ(以下PCと記す)
上で実現するために、図1の符号化映像復号再生装置4
と、符号化音声復号再生装置5とをPCに対応した拡張
ボードで実現し、さらに出力装置6(1フレーム分の表
示に要する時間は約33ミリ秒のもの)を用意する。
又、符号化データ記憶装置1用と同期制御装置3をプロ
グラムとして実現するために、RAM(ランダムアクセ
スメモリ)を十分に持つことにする。但し、前述したよ
うに、各復号再生装置4,5に必要なバッファメモリ
は、各復号再生装置内に持っているものとする。又、デ
ータ転送に要する時間は十分に速いものとする。
Here, the video / audio synchronization system according to the present invention is a general-purpose personal computer (hereinafter referred to as PC).
In order to realize the above, the encoded video decoding / reproducing apparatus 4 of FIG.
And the encoded audio decoding / reproducing device 5 are realized by an expansion board compatible with a PC, and an output device 6 (the time required for displaying one frame is about 33 milliseconds) is prepared.
Further, in order to implement the coded data storage device 1 and the synchronization control device 3 as programs, a RAM (random access memory) is sufficiently provided. However, as described above, the buffer memories required for the respective decoding / reproducing devices 4 and 5 are assumed to be included in the respective decoding / reproducing devices. The time required for data transfer is sufficiently fast.

【0027】前提条件として、2秒間以上の動画[映像
+音声]の再生を行うものとする。又、説明の都合上、
符号化音声データを[4ビット長ステレオ8.27kH
zのADPCM(適応差分型パルスコード変調方式)デ
ータ]とし、この音声データ1秒分(8270バイト)
を一単位として送る。又、1秒分の音声データの再生を
終了した場合は、引き続き2秒目の音声データを送り再
生を続けるものとし、2秒以上の動画再生でも音声の再
生が途切れないよう配慮する。
As a precondition, it is assumed that a moving image [video + audio] of 2 seconds or more is reproduced. Also, for convenience of explanation,
The encoded voice data is converted into [4-bit stereo 8.27 kHz.
z ADPCM (adaptive differential pulse code modulation) data], and this audio data for 1 second (8270 bytes)
Is sent as a unit. When the reproduction of the audio data for one second is completed, the audio data for the second second is continuously sent and the reproduction is continued so that the reproduction of the audio is not interrupted even when the moving image is reproduced for two seconds or more.

【0028】動作としては、まず音声の復号再生を開始
すると同時に、1フレーム目の映像のデータ転送、およ
び復号再生動作を開始させ、映像の復号再生動作を繰り
返し、復号再生フレームをカウントする。フレーム数が
計測対象フレーム数になるか(映像再生速度が速く、音
声再生速度が遅い場合をAパターンとする)、音声の再
生が終了したら(音声再生速度が速く、映像再生速度が
遅い場合をBパターンとする)、タイマ11の動作(タ
イマ11の割り込み間隔は10ミリ秒程度で計算が容易
な値を使用すると良いので、ここでは10ミリ秒を使
用)を開始する。Aパターンの場合、1秒分の音声再生
終了になるか、Bパターンの場合、計測対象フレームの
再生順になったなら、タイマ11を止め、それまでのタ
イマ割り込み回数を計算し遅延量を決定する。今、1秒
間に表示する予定の映像フレーム数が15(以後t/n
≒66ミリ秒であるので66ミリ秒とする)であるとし
て、遅延量dの値で分類して説明する。先程の遅延量d
が... (1)映像が音声より10ミリ秒遅い(図4の映像フレ
ームと音声との関係を説明する説明図(その2)に示
す) (2)映像が音声より50ミリ秒遅い(図5の映像フレ
ームと音声との関係を説明する説明図(その3)に示
す) (3)映像が音声より70ミリ秒遅い(図6の映像フレ
ームと音声との関係を説明する説明図(その4)に示
す) (4)音声が映像より10ミリ秒遅い(図7の映像フレ
ームと音声との関係を説明する説明図(その5)に示
す) (5)音声が映像より50ミリ秒遅い(図8の映像フレ
ームと音声との関係を説明する説明図(その6)に示
す) (6)音声が映像より70ミリ秒遅い(図9の映像フレ
ームと音声との関係を説明する説明図(その7)に示
す) 以上の場合に分けて同期修正操作を説明する。但し、図
5,6,8,9については、状態を明確にする目的で分
図形式とし、分図(a)は映像と音声との遅れ状態を表
示する図とし、分図(b)は同期修正方法を表示する図
とする。 (1)映像が音声より10ミリ秒遅い場合、(図4) これは、図2のS12で┃d┃≒0と判別した場合にあ
たるもので、同期修正作は行わない。 (2)映像が音声より50ミリ秒遅い場合、(図5) これは、図2のS12で0<┃d┃≦t/nと判別し映
像が遅れている場合にあたるもので、16フレーム目
(n+1)の表示時間を短縮する。この場合、遅延量d
は出力装置の1フレーム分の表示を行う時間(33ミリ
秒)より大きく、1フレーム表示期間(66ミリ秒)よ
り小さい。このため33ミリ秒だけn+1フレームの表
示時間を短縮する。即ちn+2フレーム目の表示タイミ
ングを33ミリ秒早めることで、同期修正操作を行う。 (3)映像が音声より70ミリ秒遅い場合、(図6) これは、図2のS12でt/n<┃d┃と判別し映像が
遅れている場合にあたるもので、17フレーム目(n+
2)の表示を取りやめる。このときの遅延量dは1フレ
ーム表示期間(66ミリ秒)より大きいため、17フレ
ーム目(n+2)をとばして、18フレーム目(n+
3)のデータを映像復号再生装置4に転送する。この動
作により、実際の再生フレームは[1,‥, 15, 16, 18,
‥]となり、同期修正操作が行われる。 (4)音声が映像より10ミリ秒遅い場合、(図7) これは、図2のS12で┃d┃≒0と判別した場合にあ
たるもので、同期修正は行わない。 (5)音声が映像より50ミリ秒遅い場合、(図8) これは、図2のS12で0<┃d┃≦t/nと判別し音
声が遅れている場合にあたるもので、16フレーム目
(n+1)の表示を行う時間(33ミリ秒)を延長し
て、17フレーム目(n+2)の復号再生処理のタイミ
ングを遅らせ、同期修正操作を行う。(2)との違い
は、先例は音声に対して映像の復号再生が遅れているの
に対し、逆に音声が映像に対し遅れていることである。 (6)音声が映像より70ミリ秒遅い場合、(図9) これは、図2のS12でt/n<┃d┃と判別し音声が
遅れている場合にあたるもので、211にあたり、16
フレーム目の表示を(5)と同様に表示期間を延長する
ことになる。実際の処理は(5)と同様であるが、より
長い時間にわたり表示を保持する。今1フレームの表示
期間は66ミリ秒なので、70ミリ秒の修正は約1フレ
ーム分の修正となる。
As the operation, first, the decoding / reproducing of the audio is started, and at the same time, the data transfer of the first frame and the decoding / reproducing operation are started, the decoding / reproducing operation of the video is repeated, and the decoding / reproducing frames are counted. If the number of frames becomes the number of frames to be measured (pattern A when the video playback speed is fast and the audio playback speed is slow), or when the audio playback is completed (when the audio playback speed is fast and the video playback speed is slow, Pattern B), and the operation of the timer 11 (the interrupt interval of the timer 11 is about 10 milliseconds, and a value that is easy to calculate is used, so 10 milliseconds is used here). In the case of pattern A, when the voice reproduction for one second is completed, or in the case of pattern B, when the reproduction order of the measurement target frame is reached, the timer 11 is stopped and the number of timer interrupts up to that point is calculated to determine the delay amount. . Now, the number of video frames scheduled to be displayed per second is 15 (hereinafter t / n
≈66 msec, so 66 msec). Therefore, description will be made by classifying by the value of the delay amount d. Delay amount d
But. . . (1) The video is 10 ms slower than the audio (shown in the explanatory diagram (part 2) explaining the relationship between the video frame and the audio in FIG. 4) (2) The video is 50 ms slower than the audio (the video in FIG. 5 An explanatory diagram (part 3) for explaining the relationship between frames and audio is shown. (3) An image is 70 milliseconds slower than the audio (see the explanatory diagram (part 4) for explaining the relationship between video frames and audio in FIG. 6). (4) The audio is slower than the video by 10 milliseconds (shown in FIG. 7 which is an explanatory view (No. 5) explaining the relationship between the video frame and the audio). (5) The audio is slower than the video by 50 milliseconds (FIG. 8). (6) An explanatory diagram (part 6) for explaining the relationship between the video frame and the sound) (6) An audio delay of 70 milliseconds from the image (an explanatory view (part 7) for explaining the relationship between the video frame and the sound in FIG. 9) )) The synchronization correction operation will be described separately for the above cases. However, for the purpose of clarifying the state of FIGS. 5, 6, 8 and 9, the chart format is used, the chart (a) is a diagram showing the delay state between video and audio, and the chart (b) is The figure shows the synchronization correction method. (1) When the image is slower than the audio by 10 milliseconds (FIG. 4) This corresponds to the case where ┃d┃≈0 is determined in S12 of FIG. 2, and the synchronization correction work is not performed. (2) When the video is slower than the audio by 50 milliseconds (FIG. 5) This is the case where the video is delayed when it is determined that 0 <┃d┃ ≦ t / n in S12 of FIG. The display time of (n + 1) is shortened. In this case, the delay amount d
Is longer than the time (33 milliseconds) for displaying one frame of the output device and shorter than the one-frame display period (66 milliseconds). Therefore, the display time of n + 1 frames is reduced by 33 milliseconds. That is, the synchronization correction operation is performed by advancing the display timing of the (n + 2) th frame by 33 milliseconds. (3) When the image is slower than the audio by 70 milliseconds (FIG. 6) This is the case where the image is delayed when it is determined that t / n <┃d┃ in S12 of FIG. 2, and the 17th frame (n +
2) Cancel the display. Since the delay amount d at this time is longer than the one frame display period (66 milliseconds), the 17th frame (n + 2) is skipped and the 18th frame (n +
The data of 3) is transferred to the video decoding / reproducing device 4. By this operation, the actual playback frame is [1, ..., 15, 16, 18,
..], and the synchronization correction operation is performed. (4) When the audio is slower than the video by 10 milliseconds (FIG. 7) This corresponds to the case where ┃d┃≈0 is determined in S12 of FIG. 2, and the synchronization correction is not performed. (5) When the audio is slower than the video by 50 milliseconds (FIG. 8) This is the case where the audio is delayed when it is determined that 0 <┃d┃ ≦ t / n in S12 of FIG. 2, and the 16th frame The time (33 milliseconds) for displaying (n + 1) is extended, the timing of the decoding / reproducing process of the 17th frame (n + 2) is delayed, and the synchronization correction operation is performed. The difference from (2) is that the decoding and reproduction of the video is delayed with respect to the audio in the previous example, while the audio is delayed with respect to the video. (6) When the sound is slower than the video by 70 milliseconds (FIG. 9) This corresponds to the case where the sound is delayed by determining t / n <┃d┃ in S12 of FIG.
The display period of the display of the frame is extended as in (5). The actual process is similar to (5), but holds the display for a longer time. Since the display period of one frame is 66 milliseconds, the correction of 70 milliseconds is about one frame.

【0029】以上のように、計測された遅延量により、
6つの状態に分類して同期修正操作を行う。ここでは2
秒間以上の動画[映像+音声]の再生を行っていたの
で、引き続き映像の再生フレーム数をカウントし、任意
の単位時間t(ここでは1秒)ごとに上記のような同期
修正操作を繰返し行う。
As described above, according to the measured delay amount,
The synchronization correction operation is performed by classifying into 6 states. 2 here
Since the video [video + audio] was played back for more than a second, the number of video playback frames is continuously counted, and the synchronization correction operation as described above is repeated every arbitrary unit time t (here, 1 second). .

【0030】図10は本発明の第2の実施例のブロック
図である。
FIG. 10 is a block diagram of the second embodiment of the present invention.

【0031】本発明の第2の実施例の映像音声同期シス
テムは、構成としては第1の実施例の映像音声同期シス
テムと同様に、予めデジタル符号化した映像および音声
の符号化データを格納する符号化データ記憶装置1と、
符号化データ記憶装置1から映像および音声の符号化デ
ータを受け、時間を計測する時間計測装置2を参照し映
像と音声との相互の出力タイミングを制御し、映像の符
号化データは1フレーム分のデータ量とし、音声の符号
化データは映像の符号化データは1フレーム分に対応す
るデータ量として出力する同期制御装置3と、同期制御
装置3の出力する映像の符号化データを1フレーム分ご
とに復号し再生し、同時に同期制御装置3から任意に与
えられるデータ量の音声の符号化データを復号し再生す
る映像音声復号再生装置12と、映像音声復号再生装置
12の再生出力を受け映像と音声に変換し視覚化する出
力装置6とを備えている。
The video / audio synchronization system of the second embodiment of the present invention has the same configuration as the video / audio synchronization system of the first embodiment, and stores video and audio encoded data that has been digitally encoded in advance. An encoded data storage device 1;
The encoded data of the video and audio is received from the encoded data storage device 1, the mutual output timing of the video and the audio is controlled by referring to the time measuring device 2 for measuring the time, and the encoded data of the video corresponds to one frame. And the encoded data of audio is output as encoded data of video as a data amount corresponding to one frame, and the encoded data of video output by the synchronization control device 3 for one frame. A video / audio decoding / reproducing device 12 which decodes and reproduces each of them and simultaneously decodes and reproduces encoded data of audio of a data amount arbitrarily given from the synchronization control device 3, and a reproduction output of the video / audio decoding / reproducing device 12. And an output device 6 for converting into voice and visualizing it.

【0032】さらに、映像音声復号再生装置12は、同
期制御装置3の出力する映像の符号化データを1フレー
ム分ごとに復号し再生する符号化映像復号再生手段13
と、同期制御装置3から任意に与えられるデータ量の音
声の符号化データを復号し再生する符号化音声復号再生
手段14とを含むソフトウェアで構成し、同期制御装置
3は、第1の実施例と同様に符号化データ記憶装置1か
ら映像および音声の符号化データを読出し符号化映像復
号再生装置4および符号化音声復号再生装置5に転送す
る転送制御手段7と、時間計測装置2を参照し符号化映
像復号再生装置4と符号化音声復号再生装置5と転送制
御手段7とを制御する復号再生装置起動制御手段8と、
時間計測装置2の割り込みの時間間隔iを設定する設定
手段9とを含むソフトウェアで構成し、時間計測装置2
も又、第1の実施例と同様に同期制御装置3に割り込み
を掛ける割り込み手段10と任意の時間を測定するタイ
マ11とを含むソフトウェアで構成している。なお、第
1の実施例と同一の機能および構成を持つ装置および手
段については、同一の符号を付してある。
Further, the video / audio decoding / reproducing device 12 decodes the coded data of the video output from the synchronization control device 3 for each frame and reproduces it.
And a coded voice decoding / reproducing means 14 for decoding and reproducing coded data of voice having a data amount arbitrarily given from the synchronization control device 3, and the synchronization control device 3 is the first embodiment. In the same manner as the above, refer to the time measuring device 2 and the transfer control means 7 for reading the encoded data of the video and audio from the encoded data storage device 1 and transferring them to the encoded video decoding / reproducing device 4 and the encoded audio decoding / reproducing device 5. A decoding / reproducing device activation control means 8 for controlling the encoded video decoding / reproducing device 4, the encoded audio decoding / reproducing device 5, and the transfer control means 7;
The time measuring device 2 is constituted by software including a setting means 9 for setting an interrupt time interval i of the time measuring device 2.
Also, like the first embodiment, it is composed of software including interrupt means 10 for interrupting the synchronization control device 3 and a timer 11 for measuring an arbitrary time. It should be noted that devices and means having the same functions and configurations as those in the first embodiment are designated by the same reference numerals.

【0033】ここで、符号化映像復号再生手段13およ
び符号化音声復号再生手段14で扱う映像および音声信
号の符号化の方法および方式等は、ソフトウェアで処理
可能な方法および方式であればどのようなものであって
もよい。又、これらの機能を満たすために十分なバッフ
ァメモリを持っており、例えばハードディスクで実現す
るバッファメモリ内に、復号再生を行う符号化されたデ
ータを格納しているとき、動作開始指令を受け取ると、
プログラムによる手順に従い映像および音声の復号再生
を行う。この処理は、映像に関しては1フレーム、音声
に関しては任意に与えられたデータ量分の再生を一度に
行うものとする。
Here, the encoding method and system of the video and audio signals handled by the encoded video decoding / reproducing means 13 and the encoded audio decoding / reproducing means 14 may be any method and system that can be processed by software. It may be anything. In addition, it has a sufficient buffer memory to satisfy these functions. For example, when the operation start command is received when the encoded data for decoding and reproduction is stored in the buffer memory realized by the hard disk. ,
Decode and play video and audio according to the procedure of the program. In this process, one frame is reproduced for video, and a given amount of data is reproduced for audio at once.

【0034】又、符号化データ記憶装置1内に記憶する
映像と音声データに関し、これらの記録フォーマットと
結合方法については、限定しないがそれぞれのデータは
十分早い読みだしが可能で、例えばタイムコードや、1
フレームの映像データの前後に対応する音声データを配
置したフォーマットなどで、これらの同時性が判別可能
であることを前提とする。
Regarding the video and audio data stored in the encoded data storage device 1, the recording format and combining method thereof are not limited, but the respective data can be read out sufficiently quickly, for example, time code or 1
It is assumed that the simultaneity can be determined by a format in which audio data corresponding to before and after the video data of the frame is arranged.

【0035】前述のように条件設定を行うことにより、
第1の実施例と第2の実施例との違いは、動作の面では
映像および音声を復号再生する装置が、ハードウェアで
あるかソフトウェアであるの違いだけで、その他の点で
は同等であるので動作に関する説明を省略する。
By setting the conditions as described above,
The difference between the first embodiment and the second embodiment is that in terms of operation, the device for decoding and reproducing video and audio is either hardware or software, and is otherwise equivalent. Therefore, the description of the operation is omitted.

【0036】[0036]

【発明の効果】以上説明したように、本発明は、デジタ
ル符号化した映像および音声の符号化データを格納する
符号化データ記憶装置と、映像の符号化データを任意に
定めるデータ量ごとに復号し再生する符号化映像復号再
生装置と、音声の符号化データの中から任意に与えられ
るデータ量分を復号し再生する符号化音声復号再生装置
と、符号化データ記憶装置から映像および音声の符号化
データを読出し符号化映像復号再生装置および符号化音
声復号再生装置に転送する転送制御手段と、時間を計測
する時間計測装置を参照し転送制御手段と符号化映像復
号再生装置と符号化音声復号再生装置との起動を制御す
る復号再生装置起動制御手段とを備え、復号再生装置起
動制御手段が、映像および音声の復号再生処理のいずれ
か一方の処理の終了を契機として計測を開始する時間計
測装置が計測する双方の復号再生処理の終了までの時間
を監視し、映像の復号再生処理と音声の復号再生処理と
のそれぞれのスピードの差を検出し、データ転送手段に
映像および音声の符号化データのデータ転送タイミング
の変更を通知すると共に、音声の復号再生動作速度を基
準として、映像の復号再生表示タイミングを調節して同
期修正を実現することにより、デジタル符号化された映
像と音声のデータの復号再生中に発生するずれ量を、リ
アルタイムに状況に応じた方法で修正し、再生時に映像
と音声との同期を厳密に保つことができ、連続した音声
再生の途切れやトーンの変化など音声再生への障害を生
じさせないという効果が有る。
As described above, according to the present invention, a coded data storage device for storing coded data of digitally coded video and audio, and decoding of coded data of video for each arbitrarily defined data amount. A coded video decoding / playback device for playing back and playing, a coded audio decoding / playback device for decoding and playing back an arbitrary amount of data out of coded audio data, and a video and audio code from the coded data storage device. The transfer control means for reading the encoded data and transferring it to the encoded video decoding / reproducing apparatus and the encoded audio decoding / reproducing apparatus, and the time measuring apparatus for measuring the time, the transfer control means, the encoded video decoding / reproducing apparatus and the encoded audio decoding. A decoding / reproducing device activation control means for controlling activation with a reproducing device is provided, and the decoding / reproducing device activation control means terminates either one of the video / audio decoding / reproducing processing. The time until the end of both decoding / playback processing measured by the time measuring device that starts measurement is monitored by detecting the difference in speed between the video decoding / playback processing and the audio decoding / playback processing, and By notifying the transfer means of the change in the data transfer timing of the video and audio encoded data, and adjusting the video decoding and reproduction display timing based on the audio decoding and reproduction operation speed to realize the synchronization correction. Decoding of coded video and audio data The amount of deviation that occurs during playback can be corrected in real time by a method according to the situation, and the synchronization of video and audio can be strictly maintained during playback, and continuous audio This has the effect of preventing interruptions in audio reproduction such as interruptions in reproduction and changes in tone.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の第1の実施例のブロック図である。FIG. 1 is a block diagram of a first embodiment of the present invention.

【図2】第1の実施例の動作を説明する流れ図である。FIG. 2 is a flowchart illustrating the operation of the first embodiment.

【図3】映像フレームと音声との関係を説明する説明図
(その1)である。
FIG. 3 is an explanatory diagram (part 1) explaining the relationship between a video frame and audio.

【図4】映像フレームと音声との関係を説明する説明図
(その2)である。
FIG. 4 is an explanatory diagram (part 2) explaining the relationship between video frames and audio.

【図5】映像フレームと音声との関係を説明する説明図
(その3)である。
FIG. 5 is an explanatory diagram (part 3) explaining the relationship between video frames and audio.

【図6】映像フレームと音声との関係を説明する説明図
(その4)である。
FIG. 6 is an explanatory view (No. 4) for explaining the relationship between video frames and audio.

【図7】映像フレームと音声との関係を説明する説明図
(その5)である。
FIG. 7 is an explanatory diagram (Part 5) for explaining the relationship between video frames and audio.

【図8】映像フレームと音声との関係を説明する説明図
(その6)である。
FIG. 8 is an explanatory view (No. 6) for explaining the relationship between video frames and audio.

【図9】映像フレームと音声との関係を説明する説明図
(その7)である。
FIG. 9 is an explanatory diagram (No. 7) for explaining the relationship between video frames and audio.

【図10】本発明の第2の実施例のブロック図である。FIG. 10 is a block diagram of a second embodiment of the present invention.

【符号の説明】[Explanation of symbols]

1 符号化データ記憶装置 2 時間計測装置 3 同期制御装置 4 符号化映像復号再生装置 5 符号化音声復号再生装置 6 出力装置 7 転送制御手段 8 復号再生装置起動制御手段 9 設定手段 10 割り込み手段 11 タイマ 12 映像音声復号再生装置 13 符号化映像復号再生手段 14 符号化音声復号再生手段 DESCRIPTION OF SYMBOLS 1 coded data storage device 2 time measuring device 3 synchronization control device 4 coded video decoding / playback device 5 coded audio decoding / playback device 6 output device 7 transfer control means 8 decoding / playback device activation control means 9 setting means 10 interrupt means 11 timer 12 video / audio decoding / reproducing apparatus 13 coded video decoding / reproducing means 14 coded audio decoding / reproducing means

Claims (3)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 デジタル符号化した映像および音声を含
む動画の符号化データを同期させて復号再生する映像音
声同期再生システムであって、予め前記デジタル符号化
した映像および音声の符号化データを格納する符号化デ
ータ記憶装置と、前記映像の符号化データを任意に定め
るデータ量ごとに復号し再生する符号化映像復号再生装
置と、前記音声の符号化データの中から任意に与えられ
るデータ量分を復号し再生する符号化音声復号再生装置
と、前記符号化データ記憶装置から映像および音声の符
号化データを読出し前記符号化映像復号再生装置および
符号化音声復号再生装置に転送する転送制御手段と、時
間を計測する時間計測装置を参照し前記転送制御手段と
前記符号化映像復号再生装置と前記符号化音声復号再生
装置との起動を制御する復号再生装置起動制御手段とを
備え、前記復号再生装置起動制御手段が、映像および音
声の復号再生処理のいずれか一方の処理の終了を契機と
して計測を開始する前記時間計測装置が計測する双方の
復号再生処理の終了までの時間を監視し、映像の復号再
生処理と音声の復号再生処理とのそれぞれのスピードの
差を検出し、前記データ転送手段に前記映像の符号化デ
ータのデータ転送タイミングの変更を通知すると共に前
記符号化映像復号再生装置の起動タイミングを変更し、
復号再生処理後の映像の表示時間を変更することを特徴
とする映像音声同期システム。
1. A video / audio synchronous reproduction system for synchronously decoding and reproducing coded data of a moving image including digitally coded video and audio, wherein the digitally coded coded data of video and audio are stored in advance. A coded data storage device, a coded video decoding / playback device that decodes and plays back the coded data of the video for each data amount that is arbitrarily determined, and a data amount that is arbitrarily given from the coded data of the audio. A coded audio decoding / reproducing apparatus for decoding and reproducing data, and a transfer control means for reading coded data of video and audio from the coded data storage apparatus and transferring to the coded video decoding / reproducing apparatus and the coded audio decoding / reproducing apparatus. Controlling the activation of the transfer control means, the coded video decoding / reproducing apparatus and the coded audio decoding / reproducing apparatus with reference to a time measuring apparatus for measuring time Decoding / reproducing apparatus activation control means for performing both of the measurement by the time measuring apparatus, the decoding / reproducing apparatus activation control means starting measurement upon termination of either one of the video / audio decoding / reproducing processing. The time until the end of the decoding / reproducing process is monitored, the difference in speed between the decoding / reproducing process of the video and the decoding / reproducing process of the audio is detected, and the data transfer timing of the encoded data of the video is transmitted to the data transfer means. Change the start timing of the coded video decoding and playback device,
A video / audio synchronization system characterized in that a display time of a video after decoding and reproducing processing is changed.
【請求項2】 時間計測装置が、映像および音声の復号
再生処理のいずれか一方の処理の終了を契機として計測
を開始し双方の復号再生処理の終了を検出すると復号再
生装置起動手段に割り込みを掛ける機能を有し、前記復
号再生装置起動手段が、前記時間計測装置の割り込みを
受けて符号化映像復号再生装置の起動タイミングを変更
し、復号再生処理後の映像の表示時間を変更する機能を
有することを特徴とする請求項1記載の映像音声同期シ
ステム。
2. The time measuring device starts measurement upon the end of one of the video and audio decoding / reproducing processes, and when the end of both decoding / reproducing processes is detected, interrupts the decoding / reproducing device activation means. The decoding / reproducing apparatus starting means has a function of changing the start timing of the coded video decoding / reproducing apparatus in response to the interruption of the time measuring apparatus, and changing the display time of the video after the decoding / reproducing process. The video / audio synchronization system according to claim 1, further comprising:
【請求項3】 符号化映像復号再生装置および符号化音
声復号再生装置をソフトウェアとして実現することを特
徴とする請求項1記載の映像音声同期システム。
3. The video / audio synchronization system according to claim 1, wherein the coded video decoding / reproducing apparatus and the coded audio decoding / reproducing apparatus are realized as software.
JP1603593A 1992-10-07 1993-02-03 Video and audio synchronization system Expired - Lifetime JP2500579B2 (en)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP1603593A JP2500579B2 (en) 1993-02-03 1993-02-03 Video and audio synchronization system
AU48830/93A AU668762B2 (en) 1992-10-07 1993-10-05 Synchronous compression and reconstruction system
CA002107727A CA2107727C (en) 1992-10-07 1993-10-05 Synchronous compression and reconstruction system
DE69327563T DE69327563T2 (en) 1992-10-07 1993-10-06 Synchronous compression system for video and audio data
EP93116167A EP0591944B1 (en) 1992-10-07 1993-10-06 Synchronous compression system for video and audio data
US08/133,219 US5508816A (en) 1992-10-07 1993-10-07 Synchronous compression and reconstruction system
AU48106/96A AU679872B2 (en) 1992-10-07 1996-03-15 Snychronous compression and reconstruction system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1603593A JP2500579B2 (en) 1993-02-03 1993-02-03 Video and audio synchronization system

Publications (2)

Publication Number Publication Date
JPH06233269A JPH06233269A (en) 1994-08-19
JP2500579B2 true JP2500579B2 (en) 1996-05-29

Family

ID=11905331

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1603593A Expired - Lifetime JP2500579B2 (en) 1992-10-07 1993-02-03 Video and audio synchronization system

Country Status (1)

Country Link
JP (1) JP2500579B2 (en)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3106987B2 (en) * 1997-01-09 2000-11-06 日本電気株式会社 Audio / video synchronous playback device
KR20010023607A (en) * 1997-09-05 2001-03-26 마츠시타 덴끼 산교 가부시키가이샤 Decoding method and recording medium carrying recorded decoding program
JP3620787B2 (en) * 2000-02-28 2005-02-16 カナース・データー株式会社 Audio data encoding method
US8290353B2 (en) 2003-02-27 2012-10-16 Panasonic Corporation Data processing device and method
KR100659883B1 (en) * 2005-01-10 2006-12-20 엘지전자 주식회사 Method of audio reproducing with motion video sequence
JP5212473B2 (en) 2008-06-26 2013-06-19 富士通セミコンダクター株式会社 VIDEO / AUDIO DATA OUTPUT DEVICE AND VIDEO / AUDIO DATA OUTPUT METHOD
JP5778478B2 (en) 2011-05-23 2015-09-16 ルネサスエレクトロニクス株式会社 Data processing system

Also Published As

Publication number Publication date
JPH06233269A (en) 1994-08-19

Similar Documents

Publication Publication Date Title
CA2107727C (en) Synchronous compression and reconstruction system
JP3053541B2 (en) Synchronous variable speed playback of digitally recorded audio and video
CN2927556Y (en) Video and audio re-player, outputting-time converter
JP3106987B2 (en) Audio / video synchronous playback device
JP3215087B2 (en) Audio and video synchronization method and digital video processor
US6339760B1 (en) Method and system for synchronization of decoded audio and video by adding dummy data to compressed audio data
JP2500579B2 (en) Video and audio synchronization system
US7240013B2 (en) Method and apparatus for controlling buffering of audio stream
JP4511952B2 (en) Media playback device
JP3100308B2 (en) Image and audio information playback system
JPH09182026A (en) Disk format for fast reproduction and fast reproduction device and method for image data using the disk format
JP2000078531A (en) Method and system for editing audio data
JP4006553B2 (en) Recording / reproducing apparatus and method
JP2002152699A (en) Method and system for synchronously reproducing moving picture
JP3134588B2 (en) Synchronous playback method of compressed image data and compressed sound data
JPH08242425A (en) Method and apparatus for reproducing selected frame in videocompact disk reproducing system
JP3075034B2 (en) Video / audio decoding device
JP2000004423A (en) Information reproduction device and method therefor
JPH09167445A (en) Method for and device reproducing digital disk
JP3301695B2 (en) Encoded signal decoding device
JP2002010190A (en) Video editor
JPH08137500A (en) Recording and reproducing method for sound or picture signal and device therefor
JPH09284726A (en) Signal delay device and signal processing device
JPH08265695A (en) Digital compressed data reproducing device
JPS59214389A (en) Recording and reproduction system for video format signal

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19960123

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080313

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090313

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090313

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100313

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100313

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110313

Year of fee payment: 15

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110313

Year of fee payment: 15

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120313

Year of fee payment: 16

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120313

Year of fee payment: 16

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120313

Year of fee payment: 16

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120313

Year of fee payment: 16

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120313

Year of fee payment: 16

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120313

Year of fee payment: 16

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130313

Year of fee payment: 17

EXPY Cancellation because of completion of term