JP2648095B2 - Image encoding and decoding device - Google Patents

Image encoding and decoding device

Info

Publication number
JP2648095B2
JP2648095B2 JP16196294A JP16196294A JP2648095B2 JP 2648095 B2 JP2648095 B2 JP 2648095B2 JP 16196294 A JP16196294 A JP 16196294A JP 16196294 A JP16196294 A JP 16196294A JP 2648095 B2 JP2648095 B2 JP 2648095B2
Authority
JP
Japan
Prior art keywords
circuit
image
signal
delay
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP16196294A
Other languages
Japanese (ja)
Other versions
JPH0832544A (en
Inventor
幸男 遠藤
貞晴 平塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NIPPON DENKI ENJINIARINGU KK
NEC Corp
Original Assignee
NIPPON DENKI ENJINIARINGU KK
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NIPPON DENKI ENJINIARINGU KK, Nippon Electric Co Ltd filed Critical NIPPON DENKI ENJINIARINGU KK
Priority to JP16196294A priority Critical patent/JP2648095B2/en
Publication of JPH0832544A publication Critical patent/JPH0832544A/en
Application granted granted Critical
Publication of JP2648095B2 publication Critical patent/JP2648095B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Time-Division Multiplex Systems (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は画像符号化および復号化
装置に関し、特にテレビ会議等に用いられる画像符号化
および復号化装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an image encoding and decoding apparatus, and more particularly to an image encoding and decoding apparatus used for a video conference or the like.

【0002】[0002]

【従来の技術】この種の従来の画像符号化および復号化
装置について図面を参照して説明する。
2. Description of the Related Art A conventional image coding and decoding apparatus of this kind will be described with reference to the drawings.

【0003】図5は従来の画像符号化装置の一例を示す
ブロック図、図6は従来の画像復号化装置の一例を示す
ブロック図である。
FIG. 5 is a block diagram showing an example of a conventional image encoding device, and FIG. 6 is a block diagram showing an example of a conventional image decoding device.

【0004】図5において、この従来の画像符号化装置
は、特開平4−257184号公報:「符号化装置」の
記載内容を示したもので、ディジタル画像データを受
け、該ディジタル画像データを符号化フレーム毎に高能
率符号化して符号化画像データとして出力する予測符号
化回路34と、該符号化画像データを書き込みクロック
に基づいて一旦記憶し、所定の読み出し速度でバッファ
画像データとして読み出すバッファメモリ35と、ディ
ジタル音声データを受け、該ディジタル音声データを遅
延させて、遅延音声データとして出力する遅延回路38
と、前記バッファ画像データと前記遅延音声データとを
多重化して多重化信号として送出する多重化回路39と
を有する符号化装置において、前記遅延回路38は遅延
量可変遅延回路であり、前記書き込みクロックに基づい
て予め定められたN(Nは2以上の整数)符号化フレー
ム毎に前記バッファ画像データの遅延量を平均遅延量と
して求める遅延量算出回路37と、該平均遅延量に基づ
きディジタル音声データの入力レベルに応じて前記遅延
回路38の遅延量を変化させる遅延制御回路37とを有
して構成している。ここでは、上記の遅延量制御回路3
7は、前記入力レベルに基づいて前記ディジタル音声デ
ータの有無を判定し、判定信号を送出する判定手段と、
該判定信号が音声無しを示している際、前記平均遅延量
に基づいて音声遅延量を示す遅延制御信号を生成する第
1の生成手段と、前記判定信号が音声有りを示している
際、遅延量保持を示す遅延保持信号を生成する第2の生
成手段とを有ており、前記遅延回路38は前記遅延保持
信号を受けた際、その遅延量を保持する。
[0004] In FIG. 5, this conventional image coding apparatus is disclosed in Japanese Patent Laid-Open No. 4-257184: "encoding apparatus", receives digital image data, and codes the digital image data. Encoding circuit 34 for highly efficient encoding for each encoded frame and outputting it as encoded image data, and a buffer memory for temporarily storing the encoded image data based on a write clock and reading it out as buffered image data at a predetermined reading speed 35, a delay circuit 38 for receiving the digital audio data, delaying the digital audio data, and outputting it as delayed audio data
And a multiplexing circuit 39 for multiplexing the buffer image data and the delayed audio data and transmitting the multiplexed signal as a multiplexed signal, wherein the delay circuit 38 is a delay amount variable delay circuit, A delay amount calculating circuit 37 for calculating the delay amount of the buffer image data as an average delay amount for each of N (N is an integer equal to or more than 2) encoded frames predetermined based on the digital audio data based on the average delay amount. And a delay control circuit 37 for changing the delay amount of the delay circuit 38 according to the input level of the delay circuit 38. Here, the delay amount control circuit 3
7: determining means for determining the presence or absence of the digital audio data based on the input level, and transmitting a determination signal;
First generating means for generating a delay control signal indicating a voice delay amount based on the average delay amount when the determination signal indicates no voice; Second generation means for generating a delay hold signal indicating the amount hold, and when receiving the delay hold signal, the delay circuit 38 holds the delay amount.

【0005】図6において、この従来の画像復号化装置
は、特開平4−82433号公報:「画像符号化装置」
の記載内容を示し、受信信号aを入力してディジタル符
号化画像データbとディジタル音声データeとに分離す
る分離回路42と、ディジタル符号化画像データbを一
定速度で書き込んで一時記憶するバッファメモリ43
と、ディジタル音声データeを入力して遅延させる遅延
回路44と、バッファメモリ43から出力されるバッフ
ァメモリ出力データcを高能率復号化してディジタル画
像データdを出力する予測復号化回路45と、バッファ
メモリ43から復号化フレームに発生するバッファメモ
リ読み出しクロックgを入力し前記ディジタル符号化画
像データの遅延量を算出して出力する遅延量算出回路4
6と、遅延量算出回路46から前記ディジタル符号化画
像データの遅延量iを入力し、復号化フレームN(N≧
1の整数)回ごとの平均遅延量を求めこの平均遅延量か
ら遅延回路44の遅延量を遅延制御信号jで制御する遅
延制御回路47とを有して構成している。
In FIG. 6, this conventional image decoding apparatus is disclosed in Japanese Patent Application Laid-Open No. Hei 4-82433: "Image Encoding Apparatus".
A separating circuit 42 for inputting the received signal a and separating it into digitally encoded image data b and digital audio data e, and a buffer memory for writing the digitally encoded image data b at a constant speed and temporarily storing the same. 43
A delay circuit 44 for inputting and delaying digital audio data e; a predictive decoding circuit 45 for efficiently decoding buffer memory output data c output from the buffer memory 43 and outputting digital image data d; A delay amount calculation circuit 4 for inputting a buffer memory read clock g generated in a decoded frame from the memory 43, calculating a delay amount of the digitally encoded image data, and outputting the calculated delay amount.
6 and the delay amount i of the digitally encoded image data from the delay amount calculation circuit 46, and the decoded frame N (N ≧ N)
A delay control circuit 47 for obtaining an average delay amount every (integer of 1) times and controlling the delay amount of the delay circuit 44 with the delay control signal j from the average delay amount.

【0006】[0006]

【発明が解決しようとする課題】この従来の画像符号化
および復号化装置では、符号化装置と復号化装置の両方
で画像及び音声の遅延補正を行う構成となっているの
で、それぞれの装置に音声遅延回路,遅延算出回路及び
遅延制御回路が必要であるという問題点がある。
In the conventional image coding and decoding apparatus, since the image and audio delays are corrected by both the coding apparatus and the decoding apparatus, the respective apparatuses are provided with the same configuration. There is a problem that an audio delay circuit, a delay calculation circuit and a delay control circuit are required.

【0007】また、この従来例では、画像信号を送信ま
たは受信するバッファの蓄積量と伝送速度の関係から可
変遅延時間を計算し、さらに固定的に存在する固定遅延
を加算した結果を元に遅延量を算出するもので、算出方
式が複雑でありハードウェアで実現する場合、回路規模
が大きくなるという問題点がある。
In this conventional example, a variable delay time is calculated from the relationship between the amount of data stored in a buffer for transmitting or receiving an image signal and the transmission speed, and the delay is calculated based on the result of adding a fixed delay that is fixed. When calculating the quantity, if the calculation method is complicated and realized by hardware, there is a problem that the circuit scale becomes large.

【0008】[0008]

【問題を解決するための手段】本発明の画像符号化装置
は、入力された動画像信号に高能率符号化を施して得ら
れた画像信号を平滑化するバッファを具備した符号化回
路と、入力された音声信号を符号化する音声符号化回路
と、伝送路フレームを組み立て前記画像信号と前記音声
信号とを多重して伝送路に送出する多重化回路とを備
え、符号化開始時点に前記多重化回路のフレーム位置を
サンプリングしてフレームの先頭である場合に前記動画
像信号にフレーム先頭識別フラグを挿入し、前記符号化
回路および前記多重化回路で遅延された前記フレーム先
頭識別フラグを前記伝送路に送出するフラグ送出手段を
有する
According to the present invention, there is provided an image coding apparatus comprising: a coding circuit having a buffer for smoothing an image signal obtained by performing high-efficiency coding on an input moving image signal; An audio encoding circuit that encodes the input audio signal, and a multiplexing circuit that assembles a transmission line frame and multiplexes the image signal and the audio signal and sends the multiplexed image signal and the audio signal to a transmission line. A frame position of a multiplexing circuit is sampled and a frame head identification flag is inserted into the moving image signal when the frame head is at the head of the frame, and the frame head identification flag delayed by the encoding circuit and the multiplexing circuit is set to the frame position. Flag sending means to send to the transmission line
Have .

【0009】本発明の画像復号化装置は、伝送路を介し
て伝送されてくるデータから伝送フレーム同期を確立し
多重された画像信号と音声信号とを分離する多重分離回
路と、遅延回路により遅延された前記音声信号を復号化
する音声復号化回路と、前記画像信号に復号化を施して
再生動画像信号を得るとともに請求項1記載の画像符号
化装置で挿入したフレーム先頭識別フラグを検出する画
像復号化回路とを備え、前記画像復号化回路が前記フレ
ーム先頭識別フラグを検出した時点で、前記多重分離回
路のフレーム位置情報より計算される時間から動画像信
号の復号化遅延量を求める遅延量算出手段を有し、前記
遅延量算出手段は、前記音声復号化回路で復号された音
声信号のレベルを検出し、予め定めたしきい値より低い
場合に無音と判定された時点で前記遅延回路を制御し、
前記動画像信号と前記音声信号との遅延補正を行う。
An image decoding apparatus according to the present invention comprises a demultiplexing circuit for establishing transmission frame synchronization from data transmitted via a transmission path and separating a multiplexed image signal and an audio signal, and a delay circuit for delaying the data. 2. An audio decoding circuit for decoding the decoded audio signal, decoding the image signal to obtain a reproduced moving image signal, and detecting a frame head identification flag inserted by the image encoding device according to claim 1. and an image decoding circuit, when the image decoding circuit detects the frame head identification flag, Ru determined decoding delay amount of the moving image signal from the time calculated from the frame position information of the demultiplexer Having delay amount calculating means,
The delay amount calculating means detects the level of the audio signal decoded by the audio decoding circuit, and controls the delay circuit when it is determined that there is no sound when the audio signal is lower than a predetermined threshold value.
The delay correction between the moving image signal and the audio signal is performed.

【0010】本発明の画像符号化装置は、入力画像信号
を符号化し、画像符号化の開始を示すヘッダ部にフラグ
信号を付加して画像データを出力する画像符号化回路
と、この画像符号化回路からの符号化情報の量を平滑化
するバッファ回路と、入力音声信号の音声符号化を行い
音声データを出力する音声符号化回路と、前記画像デー
タと前記音声データとで伝送フレームを組み立て多重化
して伝送する多重化回路と、前記多重化回路からの伝送
フレーム番号を入力して伝送フレームの先頭を検出した
場合にフレーム先頭識別のフラグ信号を前記画像符号化
回路へ通知するフレーム先頭検出回路とを有している。
An image encoding apparatus according to the present invention encodes an input image signal, adds a flag signal to a header indicating the start of image encoding, and outputs image data. A buffer circuit for smoothing the amount of coding information from the circuit, a voice coding circuit for voice coding an input voice signal and outputting voice data, and assembling and multiplexing a transmission frame with the image data and the voice data. A multiplexing circuit for converting and transmitting, and a frame head detection circuit for notifying the image coding circuit of a flag signal for frame head identification when the transmission frame number is input from the multiplexing circuit and the head of the transmission frame is detected. And

【0011】本発明の画像復号化装置は、伝送路を介し
て伝送されてくるデータから多重された画像データと音
声データとを分離する多重分離回路と、分離された画像
データを蓄え画像符号化の開始を示すヘッダが検出され
る毎に前記画像データを出力するバッファ回路と、前記
画像データを復号して再生画像を出力するとともにフレ
ーム先頭識別フラグを検出してフラグ検出通知を出力す
る画像復号化回路と、前記フラグ検出通知を受信したと
きに前記多重分離回路からのフレーム位置情報をサンプ
リングして遅延量を算出するとともに無音判定情報から
無音の場合の遅延量を算出する遅延量設定回路と、分離
された音声データを前記遅延量に従って遅延させる遅延
回路と、遅延後の音声データを復号化して再生音声を出
力すると共に予め定めたしきい値より低い再生音声を無
音と判定して前記無音判定情報を出力する音声復号化回
路とを有している。
An image decoding apparatus according to the present invention includes a demultiplexing circuit for separating multiplexed image data and audio data from data transmitted via a transmission line, and a demultiplexer for storing the demultiplexed image data. A buffer circuit that outputs the image data each time a header indicating the start of the frame is detected, and an image decoding that decodes the image data to output a reproduced image and detects a frame head identification flag to output a flag detection notification And a delay amount setting circuit that calculates a delay amount by sampling frame position information from the demultiplexing circuit when receiving the flag detection notification and calculates a delay amount in the case of silence from silence determination information. A delay circuit for delaying the separated audio data in accordance with the delay amount, decoding the delayed audio data to output a reproduced audio, and The lower the reproduced sound than the meta threshold was determined to silence and a speech decoding circuit for outputting the sound determination information.

【0012】[0012]

【作用】一般に、画像符号化及び復号化で生じる遅延量
は、入力画像の動き、被写体の大きさやきめ細かさ等の
性質、伝送速度によりダイナミックに変化して一意に定
まらない。従って、固定で画像信号と音声信号の遅延補
正方式や、定期的に画像と音声の通信を中断して遅延を
測定する方式では、正確に補正できない欠点がある。
In general, the amount of delay generated in image encoding and decoding is not uniquely determined because it dynamically changes depending on the movement of an input image, the size and fineness of a subject, and the transmission speed. Therefore, there is a drawback in that a fixed delay correction method between an image signal and an audio signal or a method in which communication between an image and an audio signal is periodically interrupted to measure a delay cannot be accurately corrected.

【0013】本発明は、画像や音声を多重化して伝送す
るために不可欠であり、また送信および受信側で共通な
時間観測ができる多重化フレーム構造を利用して常時画
像と音声の遅延量を測定し、受信音声の遅延回路を制御
することにより、ダイナミックな遅延補正ができる。
The present invention is indispensable for multiplexing and transmitting images and voices, and always uses a multiplexed frame structure that allows a common time observation on the transmitting and receiving sides to reduce the amount of delay between images and voices at all times. By measuring and controlling the delay circuit of the received voice, dynamic delay correction can be performed.

【0014】また、受信音声の無音検出を行い、無音時
に受信音声の遅延回路を制御することにより遅延補正時
の音声異常を避けることが可能である。
In addition, it is possible to avoid a sound abnormality at the time of delay correction by detecting the silence of the received sound and controlling the delay circuit of the received sound when there is no sound.

【0015】[0015]

【実施例】次に、本発明について図面を参照して説明す
る。
Next, the present invention will be described with reference to the drawings.

【0016】図1は本発明の一実施例を示すブロック図
である。
FIG. 1 is a block diagram showing one embodiment of the present invention.

【0017】図1において、本実施例は画像符号化装置
1と画像復号化装置2とから成り、画像符号化装置1は
入力画像信号100を符号化し、画像符号化の開始を示
すヘッダ部にフラグ信号103を付加して画像データ1
02を出力する画像符号化回路10と、この画像符号化
回路10からの符号化情報の量を平滑化するバッファ回
路11と、入力音声信号105を音声符号化を行い音声
データ106を出力する音声符号化回路14と、画像デ
ータ102と音声データ106とで伝送フレームを組み
立て多重化して伝送する多重化回路12と、多重化回路
12からの伝送フレーム番号104を入力して伝送フレ
ームの先頭を検出した場合にフレーム先頭識別のフラグ
信号103を画像符号化回路10へ通知するフレーム先
頭検出回路13とを有し、画像符号化装置2は伝送路3
00を介して伝送されてくるデータから多重された画像
データ200と音声データ207とを分離する多重分離
回路20と、分離された画像データ200を蓄え画像符
号化の開始を示すヘッダが検出される毎に画像データ2
01を出力するバッファ回路21と、画像データ201
を復号して再生画像203を出力するとともにフレーム
先頭識別フラグを検出してフラグ検出通知202を出力
する画像復号化回路22と、フラグ検出通知202を受
信したときに多重分離回路20からのフレーム位置情報
204をサンプリングして遅延量を算出するとともに無
音判定情報206から無音の場合の遅延量205を算出
する遅延量設定回路23と、分離された音声データ20
7を遅延量205に従って遅延させる遅延回路24と、
遅延後の音声データ208を復号化して再生音声209
を出力すると共に予め定めたしきい値より低い再生音声
209を無音と判定して無音判定情報206を出力する
音声復号化回路25とを有している。
In FIG. 1, this embodiment comprises an image encoding device 1 and an image decoding device 2, and the image encoding device 1 encodes an input image signal 100, and includes a header portion indicating the start of image encoding. Image data 1 by adding flag signal 103
02, a buffer circuit 11 for smoothing the amount of encoded information from the image encoding circuit 10, and an audio signal for encoding the input audio signal 105 and outputting audio data 106. An encoding circuit 14, a multiplexing circuit 12 for assembling and multiplexing a transmission frame with the image data 102 and the audio data 106, and transmitting the transmission frame number 104 from the multiplexing circuit 12 to detect the head of the transmission frame And a frame head detection circuit 13 for notifying the image coding circuit 10 of a flag signal 103 for frame head identification in the event that the frame coding has been performed.
A demultiplexing circuit 20 for separating the multiplexed image data 200 and the audio data 207 from the data transmitted via the P.00, and a header indicating the start of the image encoding that stores the separated image data 200 is detected. Image data 2 for each
01 for outputting the image data 201
And an image decoding circuit 22 that outputs a reproduced image 203 and outputs a flag detection notification 202 by detecting a frame head identification flag, and a frame position from the demultiplexing circuit 20 when the flag detection notification 202 is received. A delay amount setting circuit 23 for calculating a delay amount by sampling the information 204 and calculating a delay amount 205 in the case of silence from the silence determination information 206;
7 according to the delay amount 205,
The audio data 208 after the delay is decoded to reproduce the audio 209.
And a speech decoding circuit 25 that outputs reproduced sound 209 lower than a predetermined threshold value as silence and outputs silence judgment information 206.

【0018】次に、本実施例の動作について説明する。Next, the operation of this embodiment will be described.

【0019】画像符号化回路10は、入力画像信号10
0を入力し、画像符号化の開始を示すヘッダ部に後述す
るフレーム先頭検出回路13からのフラグ信号103を
付加し、高能率符号化を施すものである。高能率符号化
は、例えばITU−T勧告H.261で採用されている
動き補償フレーム間符号化、DCT変換符号化、量子
化、可変長符号化を施し情報圧縮を行うものである。画
像符号化回路10で得られた画像データ101は、発生
情報量を平滑化するためのバッファ回路11に入力さ
れ、平滑後のデータ102を後述詳細に説明する多重化
回路12に入力する。
The image encoding circuit 10 receives the input image signal 10
0 is input, and a flag signal 103 from a frame head detection circuit 13 to be described later is added to a header portion indicating the start of image encoding to perform high-efficiency encoding. High-efficiency coding is described in, for example, ITU-T Recommendation H.264. The information compression is performed by performing motion compensation interframe coding, DCT transform coding, quantization, and variable length coding adopted in H.261. The image data 101 obtained by the image encoding circuit 10 is input to a buffer circuit 11 for smoothing the amount of generated information, and the smoothed data 102 is input to a multiplexing circuit 12 described in detail later.

【0020】音声信号105を入力する音声符号化回路
14は、音声符号化を行い音声データ106を多重化回
路12に出力する。
A voice encoding circuit 14 to which a voice signal 105 is input performs voice coding and outputs voice data 106 to a multiplexing circuit 12.

【0021】多重化回路12は、伝送フレームを組み立
て画像データ102と音声データ106を多重化して伝
送する。フレーム先頭検出回路13は、多重化回路12
からの伝送フレーム番号104を入力し、伝送フレーム
の先頭を検出した場合、フレーム先頭識別フラグ103
を前述した画像符号化回路10に通知する。画像符号化
回路10は、フレーム先頭識別フラグ通知を受けた場合
のみ、前述したヘッダ部に挿入する。フレーム先頭識別
フラグは、画像符号化回路10やバッファ回路11およ
び多重化回路12で遅延され、画像信号と共に伝送され
る。
The multiplexing circuit 12 assembles a transmission frame and multiplexes the image data 102 and the audio data 106 for transmission. The frame start detection circuit 13 is
When the transmission frame number 104 is input and the head of the transmission frame is detected, the frame head identification flag 103
To the image coding circuit 10 described above. The image encoding circuit 10 inserts the information into the above-described header portion only when receiving the notification of the frame head identification flag. The frame head identification flag is delayed by the image encoding circuit 10, the buffer circuit 11, and the multiplexing circuit 12, and transmitted together with the image signal.

【0022】一方、多重分離回路20は、伝送路300
から伝送されてくるデータから伝送フレーム同期を確立
し、多重された画像データ200と音声データ207と
を分離する。バッファ回路21は、分離された画像デー
タ200を蓄え、画像符号化の開始を示すヘッダが検出
される毎に画像復号化回路22に画像データ201を出
力する。画像復号化回路22は、画像を復号して再生画
像203を出力するとともにヘッダに挿入されているフ
レーム先頭識別フラグを検出し、検出された場合に遅延
量設定回路23にフラグ検出通知202を出力する。
On the other hand, the demultiplexing circuit 20
The transmission frame synchronization is established from the data transmitted from, and the multiplexed image data 200 and audio data 207 are separated. The buffer circuit 21 stores the separated image data 200 and outputs the image data 201 to the image decoding circuit 22 every time a header indicating the start of image encoding is detected. The image decoding circuit 22 decodes the image, outputs a reproduced image 203, detects the frame head identification flag inserted in the header, and outputs a flag detection notification 202 to the delay amount setting circuit 23 when the flag is detected. I do.

【0023】遅延量設定回路23は、フラグ検出通知2
02を受信した時に多重分離回路20から通知されるフ
レーム位置情報204をサンプリングして遅延量を計算
するとともに音声復号化回路25からの無音判定情報2
06を入力し、無音の場合に計算した遅延量205を遅
延回路24に出力する。遅延回路24は、多重分離回路
20で分離された音声データ207を遅延量205に従
って遅延させる回路であり、遅延後の音声データ208
を音声復号化回路25に出力する。音声復号化回路25
は、復号化を施して再生音声209を出力すると共に再
生音声209のレベルを観測して、予め定めたしきい値
より低い場合に無音と判定して無音判定情報206を出
力する。
The delay amount setting circuit 23 outputs a flag detection notification 2
02, the frame position information 204 notified from the demultiplexing circuit 20 is sampled to calculate the delay amount, and the silence determination information 2 from the speech decoding circuit 25 is sampled.
06, and outputs the delay amount 205 calculated in the case of silence to the delay circuit 24. The delay circuit 24 is a circuit for delaying the audio data 207 separated by the demultiplexing circuit 20 in accordance with the delay amount 205, and the delayed audio data 208
Is output to the audio decoding circuit 25. Voice decoding circuit 25
Performs decoding, outputs the reproduced voice 209, and observes the level of the reproduced voice 209. When the level is lower than a predetermined threshold value, it determines that there is no sound and outputs the silence determination information 206.

【0024】図2は本実施例におけるフレームビット位
置を示す図、図3は本実施例における同期ワードとフレ
ーム/マルチフレームとを示す図、図4は本実施例にお
けるマルチフレーム番号の対応を示す図である。
FIG. 2 is a diagram showing a frame bit position in this embodiment, FIG. 3 is a diagram showing a synchronization word and a frame / multiframe in this embodiment, and FIG. 4 is a diagram showing correspondence between multiframe numbers in this embodiment. FIG.

【0025】次に、多重化回路12および多重分離回路
20に動作について図1,図2,図3及び図4を参照し
て詳細に説明する。
Next, the operation of the multiplexing circuit 12 and the demultiplexing circuit 20 will be described in detail with reference to FIGS. 1, 2, 3 and 4.

【0026】多重化回路12は、例えば以下に詳細を述
べるITU−T勧告H.221に採用されている80オ
クテットを1フレームとし、16フレームを1マルチフ
レームとする伝送フレームを組み立て、予め定められた
ビット位置に画像データと音声データ等を多重化して伝
送するものである。一方、多重分離回路20は、前述し
たITU−T勧告H.221フレーム同期を確立し、多
重された画像データと音声データ等を分離するものであ
る。
The multiplexing circuit 12 is provided, for example, in accordance with ITU-T Recommendation H. The transmission frame is constructed such that 80 octets adopted in H.221 and 1 frame constitute 80 frames, and 16 frames constitute 1 multiframe, and image data and audio data are multiplexed and transmitted at predetermined bit positions. On the other hand, the demultiplexing circuit 20 is based on the ITU-T Recommendation H. 221 frame synchronization is established, and multiplexed image data and audio data are separated.

【0027】以下にITU−T勧告H.221多重化方
式の詳細説明と本方式を用いた場合の画像と音声の自動
遅延補正動作の一例について説明する。
In the following, ITU-T Recommendation H. A detailed description of the H.221 multiplexing method and an example of an automatic image and sound delay correction operation using this method will be described.

【0028】図2は、H.221のフレームビット位置
を示す図であり、第8ビット目の第1から8オクテット
にフレームビット(FAS)が挿入され、80オクテッ
トで1フレームを構成している。従って、1フレームの
時間は、125μsec×80=10msecとなる。
FIG. FIG. 221 is a diagram illustrating a frame bit position of frame 221. A frame bit (FAS) is inserted from the first to eighth octets of an eighth bit, and one octet constitutes one frame. Therefore, the time of one frame is 125 μsec × 80 = 10 msec.

【0029】図3は、H.221のフレームとマルチフ
レーム構成を示したものであり、16フレーム(0F〜
15F)で1マルチフレームを構成している。従って、
1マルチフレームの時間は、10msec×16=16
0msecとなる。また、N1からN4はマルチフレー
ム番号を表し、16マルチフレーム(0MF〜15M
F)の識別が可能である。マルチフレーム番号の対応を
図4に示す。
FIG. 221 frame and a multi-frame configuration, and 16 frames (0F to 0F)
15F) forms one multi-frame. Therefore,
The time of one multiframe is 10 msec × 16 = 16
It is 0 msec. N1 to N4 represent multiframe numbers, and 16 multiframes (0MF to 15M
F) can be identified. FIG. 4 shows the correspondence between the multi-frame numbers.

【0030】以上のフレーム構成により、10msec
ステップで最大2560msecの時間観測が可能とな
る。
With the above frame configuration, 10 msec
Time observation of up to 2560 msec is possible in steps.

【0031】本実施例の画像符号化装置1の多重化回路
12は、0から15のマルチフレーム番号(MF)と0
から15フレーム番号(F)をフレーム先頭検出回路1
3に出力し、0MFかつ0Fで時刻0とするフラグ10
3が画像符号化回路10に入力され、各処理後に画像復
号化装置2に伝送される。
The multiplexing circuit 12 of the image encoding apparatus 1 according to the present embodiment has a multi-frame number (MF) of 0 to 15 and 0
From the frame number (F) to the frame head detection circuit 1
3 is output to flag 0 and time is set to 0 at 0MF and 0F.
3 is input to the image encoding circuit 10 and transmitted to the image decoding device 2 after each processing.

【0032】一方、本実施例の画像復号化装置2の遅延
量設定回路23に画像符号化装置1で挿入した時刻0フ
ラグが通知された時点で多重分離回路20のマルチフレ
ーム番号(MF)とフレーム番号(F)を読み取ること
により、式(1)で画像の遅延時間D(MF,F)を計
算することができる。
On the other hand, when the time 0 flag inserted by the image encoding device 1 is notified to the delay amount setting circuit 23 of the image decoding device 2 of the present embodiment, the multi-frame number (MF) of the demultiplexing circuit 20 and By reading the frame number (F), the delay time D (MF, F) of the image can be calculated by equation (1).

【0033】 D(MF,F)=160msecxMF+10msecxF (1) 例えば、MF=3、F=12の場合、遅延時間D(3,
12)は D(3,12)=160msecx3+10msecx
12=600msec となる。
D (MF, F) = 160 msec × MF + 10 msec × F (1) For example, when MF = 3 and F = 12, the delay time D (3,
12) is D (3,12) = 160 msecx3 + 10 msecx
12 = 600 msec.

【0034】遅延量設定回路23は、遅延時間D(M
F,M)が得られた時に無音であることを確認して、遅
延回路24に遅延時間を設定する。無音状態が確認でき
るまでは、遅延時間設定を遅らせ、設定前に次の遅延時
間が得られた場合には新しい遅延量を設定する動作であ
る。
The delay amount setting circuit 23 has a delay time D (M
(F, M), it is confirmed that there is no sound, and a delay time is set in the delay circuit 24. This is an operation of delaying the delay time setting until a silent state can be confirmed, and setting a new delay amount if the next delay time is obtained before the setting.

【0035】[0035]

【発明の効果】以上説明したように本発明は、画像符号
化装置が入力された動画像信号に高能率符号化を施して
得られた画像信号を平滑化するバッファを具備した符号
化回路と、入力された音声信号を符号化する音声符号化
回路と、伝送路フレームを組み立て画像信号と音声信号
とを多重して伝送路に送出する多重化回路とを備え、符
号化回路および多重化回路で遅延されたフレーム先頭識
別フラグを伝送器に送出し、画像復号化装置が伝送路を
介して伝送されてくるデータから伝送フレーム同期を確
立し多重された画像信号および音声信号を分離する多重
分離回路と、遅延回路により遅延された音声信号を復号
化する音声復号化回路と、画像信号に復号化を施して再
生動画像信号を得るとともに画像符号化装置で挿入した
フレーム先頭識別フラグを検出する画像復号化回路とを
備え、画像復号化回路がフレーム先頭識別フラグを検出
した時点で、多重分離回路のフレーム位置情報より計算
される時間から動画像信号の符号化および復号化遅延量
を求めることにより、入力画像の動き、被写体の大きさ
やきめ細かさ等の性質、伝送速度によりダイナミックに
変化する画像符号化及び復号化で生じる遅延量を画像お
よび音声を中断せずに求め、画像と音声の遅延を自動的
に補正することが可能となり、常にリップシンクの取れ
た画像通信が得られる効果がある。
As described above, the present invention provides an encoding circuit having a buffer for smoothing an image signal obtained by performing a high-efficiency encoding on a moving image signal inputted to an image encoding apparatus. , An audio encoding circuit for encoding an input audio signal, and a multiplexing circuit for assembling a transmission line frame, multiplexing an image signal and an audio signal, and sending the multiplexed image signal and the audio signal to the transmission line, and an encoding circuit and a multiplexing circuit. Demultiplexing for transmitting the frame head identification flag delayed by the above to the transmitter, and establishing a transmission frame synchronization from the data transmitted through the transmission path by the image decoding device and separating the multiplexed image signal and audio signal. Circuit, an audio decoding circuit for decoding the audio signal delayed by the delay circuit, and a decoding of the image signal to obtain a reproduced moving image signal, and a frame head identification inserted by the image encoding device. An image decoding circuit for detecting a lag, at the time when the image decoding circuit detects the frame head identification flag, the encoding and decoding delay of the moving image signal from the time calculated from the frame position information of the demultiplexing circuit. By calculating the amount, the amount of delay caused by image encoding and decoding that dynamically changes depending on the movement of the input image, the size and fineness of the subject, and the transmission speed, without interrupting the image and audio, And the delay of the audio can be automatically corrected, so that there is an effect that image communication with lip sync can be always obtained.

【0036】また、受信音声の無音検出を行い、無音時
に受信音声遅延回路を制御することにより遅延補正時の
音声異常を避けることができる効果がある。
Further, by detecting the silence of the received voice and controlling the received voice delay circuit when there is no voice, it is possible to avoid voice abnormalities at the time of delay correction.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施例を示すブロック図である。FIG. 1 is a block diagram showing one embodiment of the present invention.

【図2】本実施例におけるフレームビット位置を示す図
である。
FIG. 2 is a diagram showing a frame bit position in the embodiment.

【図3】本実施例における同期ワードとフレーム/マル
チフレームとを示す図である。
FIG. 3 is a diagram showing a synchronization word and a frame / multiframe in the embodiment.

【図4】本実施例におけるマルチフレーム番号の対応を
示す図である。
FIG. 4 is a diagram showing correspondence of multi-frame numbers in the embodiment.

【図5】従来の画像符号化装置の一例を示すブロック図
である。
FIG. 5 is a block diagram illustrating an example of a conventional image encoding device.

【図6】従来の画像復号化装置の一例を示すブロック図
である。
FIG. 6 is a block diagram illustrating an example of a conventional image decoding device.

【符号の説明】[Explanation of symbols]

1 画像符号化装置 2 画像復号化装置 10 画像符号化回路 11 バッファ回路 12 多重化回路 13 フレーム先頭検出回路 14 音声符号化回路 20 多重分離回路 21 バッファ回路 22 画像復号化回路 23 遅延量設定回路 24 遅延回路 25 音声復号化回路 REFERENCE SIGNS LIST 1 image encoding device 2 image decoding device 10 image encoding circuit 11 buffer circuit 12 multiplexing circuit 13 frame start detection circuit 14 audio encoding circuit 20 demultiplexing circuit 21 buffer circuit 22 image decoding circuit 23 delay amount setting circuit 24 Delay circuit 25 Voice decoding circuit

───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平2−305278(JP,A) 特開 平6−343165(JP,A) 特開 平4−100430(JP,A) ────────────────────────────────────────────────── ─── Continuation of the front page (56) References JP-A-2-305278 (JP, A) JP-A-6-343165 (JP, A) JP-A-4-100430 (JP, A)

Claims (5)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】入力された動画像信号に高能率符号化を施
して得られた画像信号を平滑化するバッファを具備した
符号化回路と、入力された音声信号を符号化する音声符
号化回路と、伝送路フレームを組み立て前記画像信号と
前記音声信号とを多重して伝送路に送出する多重化回路
とを備え、符号化開始時点に前記多重化回路のフレーム
位置をサンプリングしてフレームの先頭である場合に前
記動画像信号にフレーム先頭識別フラグを挿入し、前記
符号化回路および前記多重化回路で遅延された前記フレ
ーム先頭識別フラグを前記伝送路に送出するフラグ送出
手段を有することを特徴とする画像符号化装置。
An encoding circuit having a buffer for smoothing an image signal obtained by performing high-efficiency encoding on an input moving image signal, and an audio encoding circuit for encoding an input audio signal. And a multiplexing circuit for assembling a transmission line frame, multiplexing the image signal and the audio signal, and transmitting the multiplexed image signal and the audio signal to a transmission line. the insert the frame start identification flag to the video signal when it is, a flag sent to sending the frame head identification flag which is delayed by the encoding circuit and the multiplexing circuit on the transmission line
Image encoding device characterized by having a means.
【請求項2】伝送路を介して伝送されてくるデータから
伝送フレーム同期を確立し多重された画像信号と音声信
号とを分離する多重分離回路と、遅延回路により遅延さ
れた前記音声信号を復号化する音声復号化回路と、前記
画像信号に復号化を施して再生動画像信号を得るととも
に請求項1記載の画像符号化装置で挿入したフレーム先
頭識別フラグを検出する画像復号化回路とを備え、前記
画像復号化回路が前記フレーム先頭識別フラグを検出し
た時点で、前記多重分離回路のフレーム位置情報より計
算される時間から動画像信号の復号化遅延量を求める
延量算出手段を有することを特徴とする画像信号装置。
2. A demultiplexing circuit for establishing transmission frame synchronization from data transmitted via a transmission line and separating a multiplexed image signal and an audio signal, and decoding the audio signal delayed by a delay circuit. And an image decoding circuit for decoding the image signal to obtain a reproduced moving image signal and for detecting a frame head identification flag inserted by the image encoding device according to claim 1. the when the picture decoding circuit detects the frame head identification flag, slow seek decrypt delay amount of the moving image signal from the time calculated from the frame position information of the demultiplexer
An image signal device comprising a delay amount calculating means .
【請求項3】前記遅延量算出手段は、前記音声復号化回
路で復号された音声信号のレベルを検出し、予め定めた
しきい値より低い場合に無音と判定された時点で前記遅
延回路を制御し、前記動画像信号と前記音声信号との遅
延補正を行うことを特徴とする請求項2記載の画像復号
化装置。
3. The delay amount calculating means detects a level of an audio signal decoded by the audio decoding circuit, and when the audio signal is lower than a predetermined threshold value, the delay circuit is activated when it is determined that there is no sound. 3. The image decoding apparatus according to claim 2, wherein the control is performed to correct a delay between the moving image signal and the audio signal.
【請求項4】 入力画像信号を符号化し、画像符号化の
開始を示すヘッダ部にフラグ信号を付加して画像データ
を出力する画像符号化回路と、この画像符号化回路から
の符号化情報の量を平滑化するバッファ回路と、入力音
声信号の音声符号化を行い音声データを出力する音声符
号化回路と、前記画像データと前記音声データとで伝送
フレームを組み立て多重化して伝送する多重化回路と、
前記多重化回路からの伝送フレーム番号を入力して伝送
フレームの先頭を検出した場合にフレーム先頭識別のフ
ラグ信号を前記画像符号化回路へ通知するフレーム先頭
検出回路とを有することを特徴とする画像符号化装置。
4. An image encoding circuit which encodes an input image signal, adds a flag signal to a header indicating the start of image encoding, and outputs image data, and an image encoding circuit for encoding information from the image encoding circuit. A buffer circuit for smoothing the amount, a voice coding circuit for voice coding an input voice signal and outputting voice data, and a multiplexing circuit for assembling, multiplexing and transmitting a transmission frame with the image data and the voice data. When,
A frame head detection circuit for notifying the image encoding circuit of a flag signal for frame head identification when a transmission frame number is input from the multiplexing circuit and a head of the transmission frame is detected. Encoding device.
【請求項5】 伝送路を介して伝送されてくるデータか
ら多重化された画像データと音声データとを分離する多
重分離回路と、分離された画像データを蓄え画像符号化
の開始を示すヘッダが検出される毎に前記画像データを
出力するバッファ回路と、前記画像データを復号して再
生画像を出力するとともにフレーム先頭識別フラグを検
出してフラグ検出通知を出力する画像復号化回路と、前
記フラグ検出通知を受信したときに前記多重分離回路か
らのフレーム位置情報をサンプリングして遅延量を算出
するとともに無音判定情報から無音の場合の遅延量を算
出する遅延量設定回路と、分離された音声データを前記
遅延量に従って遅延させる遅延回路と、遅延後の音声デ
ータを復号化して再生音声を出力すると共に予め定めた
しきい値より低い再生音声を無音と判定して前記無音判
定情報を出力する音声復号化回路とを有することを特徴
とする画像復号化装置。
5. A demultiplexing circuit for separating multiplexed image data and audio data from data transmitted via a transmission path, and a header for storing the separated image data and indicating the start of image encoding. A buffer circuit that outputs the image data each time the image data is detected, an image decoding circuit that decodes the image data to output a reproduced image, detects a frame head identification flag, and outputs a flag detection notification, A delay setting circuit that samples frame position information from the demultiplexing circuit when receiving the detection notification to calculate a delay and calculates a delay in the case of silence from silence determination information; A delay circuit that delays the audio data according to the delay amount, decodes the delayed audio data to output a reproduced audio, and outputs a reproduced audio lower than a predetermined threshold. An audio decoding circuit for judging raw speech as silence and outputting said silence judgment information.
JP16196294A 1994-07-14 1994-07-14 Image encoding and decoding device Expired - Fee Related JP2648095B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP16196294A JP2648095B2 (en) 1994-07-14 1994-07-14 Image encoding and decoding device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP16196294A JP2648095B2 (en) 1994-07-14 1994-07-14 Image encoding and decoding device

Publications (2)

Publication Number Publication Date
JPH0832544A JPH0832544A (en) 1996-02-02
JP2648095B2 true JP2648095B2 (en) 1997-08-27

Family

ID=15745386

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16196294A Expired - Fee Related JP2648095B2 (en) 1994-07-14 1994-07-14 Image encoding and decoding device

Country Status (1)

Country Link
JP (1) JP2648095B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101171838B (en) 2005-04-28 2011-06-01 松下电器产业株式会社 Lip-sync correcting device and lip-sync correcting method
JP4707514B2 (en) * 2005-09-20 2011-06-22 三菱電機株式会社 Video stream supply system, video stream supply device, and video stream reception device
JP4669366B2 (en) * 2005-09-30 2011-04-13 アイホン株式会社 Intercom device

Also Published As

Publication number Publication date
JPH0832544A (en) 1996-02-02

Similar Documents

Publication Publication Date Title
US7711244B2 (en) Video/audio synchronizing apparatus
JP3002348B2 (en) Image communication system
US5751694A (en) Methods and apparatus for synchronizing temporally related data streams
US7336652B2 (en) Data communication apparatus and data communication method
JPH09191296A (en) Method and equipment for synchronizing clock for digital decoder and digital coder
JP3500667B2 (en) Video conference system and synchronization method
JP2648095B2 (en) Image encoding and decoding device
JPH0993553A (en) Image communication equipment and image communication method
US8228999B2 (en) Method and apparatus for reproduction of image frame in image receiving system
JP2580955B2 (en) Data multiplexing device and separating device
JPH1169330A (en) Image communication equipment provided with automatic answering function
JP2002290973A (en) Multimedia communication equipment
JP3177825B2 (en) Media coding device
EP1463333A1 (en) Apparatus and method for image, video and audio processing
JPH04357735A (en) Voice packet communication equipment
JPH10271482A (en) Synchronous reproduction control method and system for coded video
JPH07222131A (en) System and method for combining screen for multi-spot conference
JPS6390953A (en) Multi-media communication equipment
JP2002252644A (en) Apparatus and method for communicating voice packet
JP2010028642A (en) Image transmission system
JPH02246432A (en) Video audio multiplex system
JPH10336602A (en) Image and sound encoded data multiplexing method and device therefor
JP2523995B2 (en) Video / audio multiplex transmission system
JPH09130263A (en) Data communication equipment, encoding device and decoding device
JPH0832621A (en) Video and audio encoded data transmission device

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19970401

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees