JPH09214965A - Method and device for encoding moving image - Google Patents

Method and device for encoding moving image

Info

Publication number
JPH09214965A
JPH09214965A JP2138296A JP2138296A JPH09214965A JP H09214965 A JPH09214965 A JP H09214965A JP 2138296 A JP2138296 A JP 2138296A JP 2138296 A JP2138296 A JP 2138296A JP H09214965 A JPH09214965 A JP H09214965A
Authority
JP
Japan
Prior art keywords
resolution
camera parameter
image
camera
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2138296A
Other languages
Japanese (ja)
Other versions
JP3317327B2 (en
Inventor
Atsushi Sagata
淳 嵯峨田
Hirotaka Jiyosawa
裕尚 如沢
Kazuto Kamikura
一人 上倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2138296A priority Critical patent/JP3317327B2/en
Publication of JPH09214965A publication Critical patent/JPH09214965A/en
Application granted granted Critical
Publication of JP3317327B2 publication Critical patent/JP3317327B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

PROBLEM TO BE SOLVED: To encode with high quality a section of an image signal where motion caused by panning, tilting or zooming of a camera is violent. SOLUTION: An encoding object image is inputted to a motion detection part 3 together with a polygonal pattern 2, and a motion vector 18 is found. The motion vector 18 is inputted to a camera parameter detection part 23, and a camera parameter 24 is detected. The camera parameter 24 is inputted to a resolution converting section deciding part 25, it is decided acceding to the kind and degree of that parameter which section in the encoding object image 1 is to increase the resolution and which section is to decrease the resolution, and the result is outputted as a resolution converting section identifier 26. At a spatial redundancy compressing part 10, encoding is performed with a fine quantizing characteristic value at a macro block corresponding to the section shown 'important' by the resolution converting section identifier 26 but encoding is performed with a coarse quantizing characteristic value at a macro block corresponding to the section shown 'important'.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、画像通信、画像記
録等に利用される画像信号のディジタル圧縮符号化方法
に関し、詳しくは画像信号を端末間で送受信する場合や
ファイルに蓄積する場合などに用いられる画像符号化方
法および装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a digital compression encoding method for image signals used for image communication, image recording, etc., and more specifically, for transmitting and receiving image signals between terminals and storing them in files. The present invention relates to an image coding method and apparatus used.

【0002】[0002]

【従来の技術】ITU−T(前CCITT)勧告H.2
61は、「p×64kb/sオーディオビジュアルサー
ビス用ビデオ符号化方式」と題され、64kb/s(p
=1)から2Mb/s(p=30)までのビットレート
を用いる通信用のビデオ符号化標準である。標準化の作
業開始は1984年12月、勧告成立は1990年12
月である。アプリケーションとしてはテレビ電話、テレ
ビ会議等が挙げられる。H.261は動画像信号の時間
的冗長度を動き補償予測により抑圧し、各フレームの空
間的冗長度を離散コサイン変換(DCT)符号化により
抑圧する。
ITU-T (formerly CCITT) Recommendation H.264. 2
61 is entitled “p × 64 kb / s video coding method for audiovisual service”, and is 64 kb / s (p
= 1) to 2 Mb / s (p = 30), which is a video coding standard for communication. The standardization work started in December 1984, and the recommendation was established in December 1990.
It is the moon. Examples of the application include a videophone and a video conference. H. 261 suppresses the temporal redundancy of the moving image signal by motion compensation prediction, and suppresses the spatial redundancy of each frame by discrete cosine transform (DCT) coding.

【0003】以下、図3を用いてH.261を用いた画
像通信装置の概要を、図4を用いてH.261の符号化
アルゴリズムを簡単に説明する。
Hereinafter, with reference to FIG. The outline of the image communication apparatus using the H.261 is described in FIG. The encoding algorithm of H.261 will be briefly described.

【0004】図3に示す画像通信装置はカメラ30とA
/D変換部31とフォーマット変換部32と映像符号化
部33と多重化部34よりなる。映像信号35はカメラ
30から出力された映像信号であり、信号形式はNTS
C(National Television System Comitee)、PAL
(Phase Alternate Line)、SECAM(Sequential C
ouleur a Memore )等のアナログ信号である。ディジタ
ル信号36はフォーマット変換部32への入力信号であ
り、NTSC、PAL、SECAM等の信号をA/D変
換部31で変換したディジタル映像信号である。信号3
7は共通中間フォーマット(Common Intermedeate Form
at: CIF 、またはQuarter CIF: QCIF )である。信号3
8は映像符号化部33で圧縮された映像信号であり、多
重化部34への入力信号である。
The image communication apparatus shown in FIG. 3 includes a camera 30 and an A
The D / D converter 31, the format converter 32, the video encoder 33, and the multiplexer 34 are included. The video signal 35 is a video signal output from the camera 30, and the signal format is NTS.
C (National Television System Comitee), PAL
(Phase Alternate Line), SECAM (Sequential C)
ouleur a Memore) and other analog signals. The digital signal 36 is an input signal to the format conversion section 32, and is a digital video signal obtained by converting the signals of NTSC, PAL, SECAM, etc. by the A / D conversion section 31. Signal 3
7 is Common Intermedeate Form
at: CIF, or Quarter CIF: QCIF). Signal 3
Reference numeral 8 denotes a video signal compressed by the video encoding unit 33, which is an input signal to the multiplexing unit 34.

【0005】カメラ30により人物や風景、書画等を撮
像し、その映像信号35はカメラ30からNTSC、P
AL、SECAM等のアナログ信号形式で出力され、A
/D変換部31でディジタル信号36となり、フォーマ
ット変換部32へ入力される。その際、ITU−T国際
標準化勧告に従った映像符号化部33を利用するため、
フォーマット変換部32において、入力されたディジタ
ル信号36はCIFまたはQCIFの信号37に変換さ
れ、ITU−T勧告H.261で規定される高機能符号
化方式に従う映像符号化部33で圧縮される。この圧縮
されたディジタル映像信号38は、さらに、ディジタル
化された音声信号やデータ信号とともに、多重化部34
において、ITU−T勧告H.221で規定されるフレ
ーム構成に多重化され、ISDN(Integrated Service
s Digital Network )等の回線交換網や、高速ディジタ
ル回線等の専用線を通して相手装置に送られる。
A camera 30, an image of a person, a landscape, a calligraphy or the like is picked up, and the video signal 35 is sent from the camera 30 to NTSC or P.
Output in analog signal format such as AL and SECAM, A
The / D conversion unit 31 produces a digital signal 36, which is input to the format conversion unit 32. At that time, since the video encoding unit 33 according to the ITU-T international standardization recommendation is used,
In the format conversion section 32, the input digital signal 36 is converted into a CIF or QCIF signal 37, and the ITU-T recommendation H.264 is provided. It is compressed by the video encoding unit 33 according to the high-performance encoding method defined by H.261. The compressed digital video signal 38 is further multiplexed with the digitized audio signal and data signal in the multiplexing unit 34.
In ITU-T Recommendation H. The ISDN (Integrated Service)
s Digital Network) and other dedicated lines such as high-speed digital lines.

【0006】図4は図3の映像符号化部33、すなわ
ち、ITU−T勧告H.261で規定される符号化方式
に従う映像符号化装置の構成例を示す図である。
FIG. 4 shows the video coding unit 33 of FIG. 3, that is, ITU-T Recommendation H.264. [Fig. 26] Fig. 26 is a diagram illustrating a configuration example of a video encoding device according to an encoding method defined by H.261.

【0007】まず、符号化対象画像1は正方形パターン
2’と共に動き検出部3に入力され、16画素×16ラ
インのマクロブロックと称される正方形ブロックに分割
される。動き検出部3では、符号化対象画像1の中の各
マクロブロックごとに、参照画像との間の動き量を検出
し、得られた動ベクトル18をブロック動き補償部4に
送る。ここで、各マクロブロックの動ベクトル18は、
参照画像において、着目マクロブロックとのマッチング
度が最も高いブロックの座標と、着目マクロブロックの
座標との変位として表される。動ベクトルの探索範囲
は、着目マクロブロックの座標とその周囲の±15画素
×±15ラインに制限される。
First, the image to be coded 1 is input to the motion detecting section 3 together with the square pattern 2'and divided into square blocks called macroblocks of 16 pixels × 16 lines. The motion detection unit 3 detects the amount of motion with respect to the reference image for each macroblock in the encoding target image 1, and sends the obtained motion vector 18 to the block motion compensation unit 4. Here, the motion vector 18 of each macroblock is
In the reference image, it is represented as a displacement between the coordinates of the block having the highest degree of matching with the macroblock of interest and the coordinates of the macroblock of interest. The motion vector search range is limited to the coordinates of the macroblock of interest and ± 15 pixels × ± 15 lines around it.

【0008】次に、ブロック動き補償部4では、各マク
ロブロックの動ベクトル18とフレームメモリ5に蓄積
された直前フレームの局部復号画像6とから動き補償予
測画像7を生成する。ここで得られた動き補償予測画像
7は符号化対象画像1と共に減算器8に入力される。両
者の差分すなわち動き補償予測誤差9は、DCT/量子
化部10’においてDCT変換され、さらに量子化され
て圧縮差分データ11となる。ここで、DCTのブロッ
クサイズは8×8である。
Next, the block motion compensation unit 4 generates a motion compensation predicted image 7 from the motion vector 18 of each macroblock and the locally decoded image 6 of the immediately preceding frame stored in the frame memory 5. The motion-compensated predicted image 7 obtained here is input to the subtracter 8 together with the encoding target image 1. The difference between the two, that is, the motion-compensated prediction error 9 is DCT-transformed by the DCT / quantization unit 10 ′ and further quantized to be compressed difference data 11. Here, the block size of the DCT is 8 × 8.

【0009】H.261では、符号化のビットレートは
約40kb/sから2Mb/sの範囲にあるが、入力画
像信号は、その画像の複雑さや動きの激しさによって情
報の発生量が変動する。この変動を吸収し、一定の伝送
速度で伝送するには符号発生量制御(レート制御)が行
なわれる。H.261やMPEG1,MPEG2など従
来の符号化方式では、この制御法は設計の自由である
が、一般的には、送信バッファを設けておき、このバッ
ファの占有率に応じてMQUANT(量子化特性)と呼
ばれる値を制御する方式がよく用いられる。すなわちバ
ッファの占有率以外は量子化の細かさを変える要因とし
て用いていない。
H. In H.261, the encoding bit rate is in the range of about 40 kb / s to 2 Mb / s, but the amount of information generated in the input image signal varies depending on the complexity of the image and the intensity of motion. In order to absorb this fluctuation and transmit at a constant transmission rate, code generation amount control (rate control) is performed. H. In conventional coding methods such as H.261, MPEG1, MPEG2, this control method is free to design, but generally, a transmission buffer is provided and MQUANT (quantization characteristic) is set according to the occupancy rate of this buffer. A method of controlling a value called is often used. That is, except for the buffer occupancy, it is not used as a factor for changing the fineness of quantization.

【0010】圧縮差分データ11(量子化インデック
ス)は差分データ符号化部12においてデータ圧縮さ
れ、差分画像符号化データ13となる。一方、動ベクト
ル18は動ベクトル符号化部19において符号化され、
得られた動ベクトル符号化データ20は差分画像符号化
データ13と共に多重化部21にて多重化され、多重化
データ22として伝送される。
The compressed difference data 11 (quantization index) is data-compressed in the difference data encoding unit 12 to become difference image encoded data 13. On the other hand, the motion vector 18 is coded by the motion vector coding unit 19,
The obtained motion vector coded data 20 is multiplexed with the differential image coded data 13 by the multiplexing unit 21 and transmitted as multiplexed data 22.

【0011】なお、復号装置と同じ復号画像を符号化装
置内でも得るため、圧縮差分データ11(量子化インデ
ックス)は逆量子化/逆DCT部14’で量子化代表値
に戻され、さらに逆DCT変換された後、伸張差分画像
15となる。伸張差分画像15と動き補償予測画像7は
加算器16で加算され、局部復号画像17となる。この
局部復号画像17はフレームメモリ5に蓄積され、次の
フレームの符号化時に参照画像として用いられる。
Since the same decoded image as that of the decoding device is obtained in the coding device, the compressed difference data 11 (quantization index) is returned to the quantized representative value by the inverse quantization / inverse DCT unit 14 ', and the inverse After the DCT conversion, the decompression difference image 15 is obtained. The decompression difference image 15 and the motion compensation prediction image 7 are added by the adder 16 to form a locally decoded image 17. The locally decoded image 17 is stored in the frame memory 5 and used as a reference image when the next frame is encoded.

【0012】[0012]

【発明が解決しようとする課題】上記従来技術では、入
力画像信号の複雑さとは無関係に、送信バッファの占有
率だけで量子化の細かさが決定されるため、カメラのパ
ニングやチルト、ズームなどによって引き起こされる符
号化される画像信号の動きが激しい部分では、視覚的に
十分な画質を維持することが不可能である。
In the above-mentioned prior art, since the fineness of the quantization is determined only by the occupation ratio of the transmission buffer, regardless of the complexity of the input image signal, the panning of the camera, tilting, zooming, etc. It is impossible to maintain a visually sufficient image quality in a portion where the motion of the coded image signal caused by the above is intense.

【0013】例えばズームの際など人間の目がズームの
中心点に注がれる場合などでは、画面の端など、実際に
人間の目にはあまり視覚的に影響しない部分にまで同じ
量子化の細かさで符号化するため、もっとも視覚的に歪
みが目につくズームの中心点が他の場所と同様に平均的
に歪んでしまうという問題がある。
For example, when the human eye is focused on the center point of the zoom, such as during zooming, the same quantization fineness is applied to a portion such as an edge of the screen that does not actually affect the human eye visually. Since the encoding is performed with the above, there is a problem that the center point of the zoom, which is most visually distorted, is distorted on average as in other places.

【0014】また、例えば定常的にカメラがパニング、
チルトするような動画像信号の場合は、明らかに次のフ
レームでは画面外に出ていってしまう部分に沢山の符号
量を割り当てるのは極めて非効率である。
Also, for example, the camera constantly pans,
In the case of a moving image signal that tilts, it is extremely inefficient to allocate a large amount of code to a portion that obviously goes out of the screen in the next frame.

【0015】すなわち、従来の画像符号化方法では、カ
メラの動き量に関わらず、画面全体に一定の量子化特性
で入力画像信号を符号化するため、カメラが激しくパニ
ングやチルト、ズームをするような動きの激しい画像で
は、画面全体が大きく歪んだり、もしくは例えばズーム
インの際に多くの人間が目が行くズームの中心点が他の
場所と同様にぼけてしまうなど、画質が著しく低下し、
逆に無理に画質を良くするために画面全体的に量子化特
性値を細かくすると、視覚的に十分なフレーム数を符号
化/伝送することができなくなってしまうという問題点
があった。
That is, in the conventional image coding method, the input image signal is coded with a constant quantization characteristic over the entire screen regardless of the amount of movement of the camera, so that the camera vigorously pans, tilts, and zooms. In an image with intense movement, the entire screen is greatly distorted, or the center point of the zoom that many people see when zooming in is blurred like other places, and the image quality is significantly degraded,
On the contrary, if the quantization characteristic value is made finer over the entire screen in order to forcibly improve the image quality, there is a problem that it is impossible to visually encode / transmit a sufficient number of frames.

【0016】本発明の目的は、上記問題点を解決し、カ
メラのパニングや、チルトや、ズーム等が入力信号に含
まれる際には、利用者がカメラの動きを意識することな
く、歪みが存在すると視覚的に歪みが目につく部位の解
像度を自動的に高くし、画像信号を品質良く符号化でき
る動画像符号化方法および装置を提供することにある。
An object of the present invention is to solve the above problems, and when the panning, tilting, zooming, etc. of the camera is included in the input signal, the distortion is generated without the user being aware of the movement of the camera. It is an object of the present invention to provide a moving picture coding method and apparatus capable of automatically increasing the resolution of a portion where distortion is visually noticeable when present, and coding an image signal with high quality.

【0017】[0017]

【課題を解決するための手段】本発明の動画像符号化方
法は、入力された画像信号のカメラパラメータが既知の
際には該カメラパラメータをそのまま用い、既知でない
場合にはカメラパラメータを検出し、該カメラパラメー
タに従って、入力された画像信号のある特定の部位の解
像度を高く、もしくは低くして符号化することを特徴と
する。
According to the moving picture coding method of the present invention, when a camera parameter of an input image signal is known, the camera parameter is used as it is, and when it is not known, the camera parameter is detected. The encoding is performed by increasing or decreasing the resolution of a specific portion of the input image signal according to the camera parameter.

【0018】本発明の実施態様によれば、画像信号のカ
メラパラメータを検出するに当たり、符号化対象画像を
複数の小領域に分割し、符号化対象画像と予測参照画像
との間の動き量を前記小領域毎に求め、求められた小領
域毎の動き量よりカメラパラメータを検出する。
According to the embodiment of the present invention, in detecting the camera parameter of the image signal, the image to be encoded is divided into a plurality of small areas, and the amount of motion between the image to be encoded and the prediction reference image is calculated. The camera parameter is obtained for each small area, and the camera parameter is detected from the obtained amount of movement for each small area.

【0019】本発明の実施態様によれば、カメラパラメ
ータに従って入力画像のある特定の部位の解像度を高く
もしくは低くする際、どの部位の解像度を変化させるか
を選択する評価値としてカメラパラメータのズームイ
ン、ズームアウトの量を用いる。
According to the embodiment of the present invention, when the resolution of a specific part of an input image is increased or decreased according to the camera parameter, zoom-in of the camera parameter is performed as an evaluation value for selecting which part of the resolution is changed, Use the amount of zoom out.

【0020】本発明の実施態様によれば、検出されたカ
メラパラメータにズームインやズームアウトが含まれて
いる際、カメラがズームしている中心点近傍を符号化す
る際に細かく量子化し解像度を高くして符号化する。こ
れにより、視覚的な画質を向上させることができる。
According to the embodiment of the present invention, when the detected camera parameter includes zoom-in and zoom-out, the quantization near the center point where the camera zooms is finely quantized to increase the resolution. And encode. As a result, the visual image quality can be improved.

【0021】本発明の実施態様によれば、カメラパラメ
ータに従って入力画像のある特定の部位の解像度を高く
もしくは低くする際、どの部位の解像度を変化させるか
を選択する評価値としてカメラパラメータのパニングや
チルトの量を用いる。
According to the embodiment of the present invention, when the resolution of a specific part of the input image is increased or decreased according to the camera parameter, panning of the camera parameter is performed as an evaluation value for selecting which part of the resolution is changed. Use the amount of tilt.

【0022】本発明の実施態様によれば、検出されたカ
メラパラメータにパニングやチルトが含まれている際、
カメラのパニングやチルトによって、画面外から新たに
現れる部分を符号化する際に、細かく量子化し解像度を
高くして符号化する。これにより、視覚的な画質を向上
させることができる。
According to the embodiment of the present invention, when the detected camera parameters include panning and tilt,
When encoding a part that newly appears from the outside of the screen by panning or tilting the camera, it is finely quantized and the resolution is increased. As a result, the visual image quality can be improved.

【0023】本発明の実施態様によれば、検出されたカ
メラパラメータにパニングやチルトが含まれている際、
カメラのパニングやチルトによって、画面外から新たに
現れる部分を符号化する際に、粗く量子化し解像度を低
くして符号化する。これにより、他の部分を符号化する
のに沢山の符号量を割り当てることができる。
According to the embodiment of the present invention, when the detected camera parameters include panning and tilt,
When a part newly appearing from the outside of the screen is encoded by panning or tilting of the camera, it is roughly quantized and the resolution is lowered to perform encoding. As a result, a large amount of code can be assigned to encode other parts.

【0024】本発明の実施態様によれば、検出されたカ
メラパラメータにパニングやチルトが含まれている際、
カメラのパニングやチルトによって、次のフレームでは
画面外に出ていってしまう部分を符号化する際に、粗く
量子化し解像度を低くして符号化する。これにより、他
の部分を符号化するのに沢山の符号量を割り当てること
ができる。
According to the embodiment of the present invention, when the detected camera parameters include panning and tilt,
When encoding the part that goes out of the screen in the next frame due to the panning and tilting of the camera, it is coarsely quantized and the resolution is reduced. As a result, a large amount of code can be assigned to encode other parts.

【0025】本発明の動画像符号化装置は、入力画像信
号のカメラパラメータを検出するカメラパラメータ検出
部と、前記カメラパラメータ検出部により検出されたパ
ラメータに従って、入力画像信号のどの部位の解像度を
どのように変化させるかを決定する解像度変換部位決定
部と、解像度変換部位決定部の決定にしたがって画像信
号を符号化する画像符号化部とを有する。
The moving picture coding apparatus of the present invention determines the resolution of which part of the input image signal according to the camera parameter detecting section for detecting the camera parameter of the input image signal and the parameter detected by the camera parameter detecting section. A resolution conversion region determining unit that determines whether the image is changed, and an image encoding unit that encodes an image signal according to the determination of the resolution conversion region determining unit.

【0026】検出されたカメラの動きに従って、符号化
する画像信号で視覚的に歪みが目につく部位の解像度を
高くし、一方逆に符号化する画像信号で視覚的には歪み
が目につかない部位の解像度を低くすることにより、カ
メラが激しく動いた際に、視覚的な画質を大きく向上さ
せることが可能となる。
According to the detected movement of the camera, the resolution of the portion where the distortion is visually noticeable in the image signal to be encoded is increased, while the distortion is not visually noticeable in the image signal to be encoded. By lowering the resolution of the part, it is possible to greatly improve the visual image quality when the camera moves violently.

【0027】[0027]

【発明の実施の形態】次に、本発明の実施形態を図面に
より説明する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS Next, embodiments of the present invention will be described with reference to the drawings.

【0028】図1は、本発明の一実施形態における動画
像符号化装置の構成を示す図である。図4中と同符号は
同じものを示す。
FIG. 1 is a diagram showing the structure of a moving picture coding apparatus according to an embodiment of the present invention. The same symbols as those in FIG. 4 indicate the same things.

【0029】本実施形態の動画像符号化装置は、動ベク
トル18(動き量)を入力し、パニング、チルト、ズー
ムイン、ズームアウトなどのカメラパラメータ24を検
出するカメラパラメータ検出部23と、カメラパラメー
タ24を入力し、ズーム、パニング、チルトの種類およ
び度合に従い、符号化対象画像1のどの部分の解像度を
高くし、どの部分を低くするかを示す解像度変換部位識
別子26を出力する解像度変換部位決定部25を備えた
ことを特徴とする。
The moving picture coding apparatus according to the present embodiment receives a motion vector 18 (motion amount) and detects a camera parameter 24 such as panning, tilting, zooming in, and zooming out, and a camera parameter detecting unit 23. 24 is input, and a resolution conversion site identifier is output that outputs a resolution conversion site identifier 26 that indicates which part of the encoding target image 1 has a higher resolution and which part has a lower resolution according to the type and degree of zoom, panning, and tilt. It is characterized in that it has a section 25.

【0030】次に、本実施形態の動作を説明する。Next, the operation of this embodiment will be described.

【0031】まず、符号化対象画像1が、多角形パター
ン2と共に動き検出部3に入力され、各パッチの動ベク
トル18が求められる。ここで、多角形パターン2とし
ては正方形がよく用いられる。また、動ベクトル18
は、誤差評価値として平均自乗誤差や誤差絶対値和など
を用いて参照画像において着目マクロブロックと同じ位
置の近傍をフルサーチをして求めることができ、着目マ
クロブロックとのマッチング度が最も高いブロックの座
標と、着目マクロブロックの座標との変位として表され
る。
First, the image to be coded 1 is input to the motion detecting section 3 together with the polygonal pattern 2, and the motion vector 18 of each patch is obtained. Here, a square is often used as the polygon pattern 2. Also, the motion vector 18
Can perform a full search in the vicinity of the same position as the macroblock of interest in the reference image using the mean square error or the sum of absolute error values as the error evaluation value, and has the highest degree of matching with the macroblock of interest. It is expressed as a displacement between the coordinates of the block and the coordinates of the macroblock of interest.

【0032】次に、動ベクトル18はカメラパラメータ
検出部23に入力され、パニング、チルト、ズームイ
ン、ズームアウトなどのカメラパラメータ24が検出さ
れる。
Next, the motion vector 18 is input to the camera parameter detection unit 23, and the camera parameters 24 such as panning, tilting, zooming in and zooming out are detected.

【0033】ここで、カメラパラメータ24の検出は次
のように行なわれる。
Here, the camera parameter 24 is detected as follows.

【0034】図2において、画面の中心を原点(0,
0)とした時、点(i,j)でのパニングやチルトによ
る動ベクトルは位置に無関係で、各々水平/垂直方向の
パニング、チルトの速さによって決まる定数である。こ
れを(H,V)とする。また、ズームによる動ベクトル
は中心から離れるほど大きくなり、Zをズームの倍率に
よって決まる定数とすると、(Z×i,Z×j)と表す
ことができる。したがって、両方の影響によるカメラの
動きによる動ベクトルは(Z×i+H,Z×j+V)と
表すことができる。この3つの定数Z,H,Vを求める
ことにより、動画像のカメラパラメータ24を求めるこ
とができる。
In FIG. 2, the center of the screen is the origin (0,
0), the motion vector due to panning or tilting at the point (i, j) is independent of the position and is a constant determined by the panning and tilting speeds in the horizontal / vertical directions, respectively. Let this be (H, V). Also, the motion vector due to zooming increases as it moves away from the center, and can be expressed as (Z × i, Z × j), where Z is a constant determined by the zoom magnification. Therefore, the motion vector due to the camera movement due to both influences can be expressed as (Z × i + H, Z × j + V). By obtaining these three constants Z, H, and V, the camera parameter 24 of the moving image can be obtained.

【0035】画面の中心に対して対象の位置にある2つ
のブロックの中心座標(i,j),(−i,−j)と、
その動ベクトル(V1x ,V1y ),(V2x ,V2
y )を用いて、3つの定数Z,H,Vを次式で求める。
The center coordinates (i, j) and (-i, -j) of the two blocks at the target position with respect to the center of the screen,
The motion vectors (V1 x , V1 y ), (V2 x , V2
y ) is used to determine the three constants Z, H, and V by the following equation.

【0036】[0036]

【数1】 また、同様に画面内のすべての対称位置にあるブロック
についてZ,H,Vを求め、Z,H,Vの各々に対し
て、最大頻度のものを最終的にZ,H,Vの値とする。
(Equation 1) Similarly, Z, H, and V are obtained for blocks at all symmetrical positions in the screen, and the one with the highest frequency is finally set as the value of Z, H, and V for each of Z, H, and V. To do.

【0037】求められたカメラパラメータ24は解像度
変換部位決定部25に入力され、ズーム、パニング、チ
ルトの種類および度合、すなわち(Z,H,V)の値に
従い、符号化対象画像1のどの部分の解像度を高くし、
どの部分を低くするかを決定する。
The obtained camera parameter 24 is input to the resolution conversion region determination unit 25, and which part of the image 1 to be coded is selected according to the type and degree of zoom, panning, and tilt, that is, the value of (Z, H, V). Increase the resolution of
Decide which part to lower.

【0038】例えば ・ズームが検出された時は、撮影者はそのズームの先に
ある物体に注視しており、当然映像を見る人にもその部
分に注視して欲しいはずである。また、このとき画面の
中心がズームの焦点となっているので、画面の中心近傍
を「重要」を示すフラグをたてる。
For example, when the zoom is detected, the photographer is gazing at the object at the end of the zoom, and naturally the viewer of the image should also gaze at that part. At this time, since the center of the screen is the focus of zooming, a flag indicating "important" is set near the center of the screen.

【0039】・カメラのパニング、チルトが検出された
時は、新たにフレーム内に入ってきた部位と、次のフレ
ームでは画面外に出てしまうであろう部位の量子化特性
値を変動させる。具体的には、カメラが左から右にパニ
ングしている時は、 −画面の左端は次のフレームでは消え去る部位なので、
画面の左端を「重要でない」を示すフラグをたてる。
When the panning and tilt of the camera are detected, the quantization characteristic values of the part newly entering the frame and the part which will be outside the screen in the next frame are changed. Specifically, when the camera is panning from left to right: -The left edge of the screen is the part that disappears in the next frame, so
Flag the left edge of the screen as "not important".

【0040】−画面の右端は新たに現れてくる部位であ
り、今後しばらくの間フレーム内に入り続けるであろう
物体であるので、送信バッファにゆとりがある時は「重
要」を示すフラグをたてる。逆に、送信バッファにゆと
りがない時は、あえて「重要でない」を示すフラグをた
て、他の部位での画質を向上させる。 のように「重要」や「重要でない」を示すフラグを各マ
クロブロック毎にたてる。選ばれた部位を示す情報であ
る解像度変換部位識別子26は空間冗長度圧縮部10に
入力される。
-The right edge of the screen is a newly appearing part, which is an object that will continue to enter the frame for some time in the future. Therefore, when there is room in the transmission buffer, a flag indicating "important" is set. It's On the contrary, when there is no space in the transmission buffer, the image quality of other parts is improved by intentionally setting a flag indicating "not important". A flag indicating "important" or "not important" is set for each macroblock as shown in. The resolution conversion site identifier 26, which is information indicating the selected site, is input to the spatial redundancy compression unit 10.

【0041】また、動ベクトル18はブロック動き補償
部4にも送られ、ブロック動き補償部4では、各マクロ
ブロックの動ベクトル18と直前フレームの局部復号画
像6とから動き補償予測画像7を生成する。ここで得ら
れた動き補償予測画像7は符号化対象画像1と共に減算
器8に入力される。両者の差分、すなわち動き補償予測
誤差9は、解像度変換部位識別子26とともに空間冗長
度圧縮部10に入力され、空間冗長度の抑圧が行なわれ
る。この際、解像度変換部位識別子26に「重要」と示
される部位に対応するマクロブロックでは量子化特性値
を細かくして符号化することで、視覚的に目につくとこ
ろの解像度をあげると同時に、「重要でない」と示され
る部位に対応するマクロブロックでは量子化特性値を荒
くして符号化することで、視覚的に目につくところに沢
山の符号量を割くことが可能となる。
The motion vector 18 is also sent to the block motion compensating unit 4, and the block motion compensating unit 4 generates a motion compensation prediction image 7 from the motion vector 18 of each macroblock and the locally decoded image 6 of the immediately preceding frame. To do. The motion-compensated predicted image 7 obtained here is input to the subtracter 8 together with the encoding target image 1. The difference between the two, that is, the motion compensation prediction error 9 is input to the spatial redundancy compression unit 10 together with the resolution conversion part identifier 26, and the spatial redundancy is suppressed. At this time, in the macro block corresponding to the part indicated as “important” in the resolution conversion part identifier 26, the quantization characteristic value is finely coded to increase the visually noticeable resolution. In a macroblock corresponding to a portion indicated as "unimportant", by encoding with a rough quantization characteristic value, it is possible to allocate a large amount of code in a visually noticeable place.

【0042】現在の符号化対象画像1の局部復号画像1
7を得るため、空間冗長度圧縮部10より出力される圧
縮差分データ11は差分データ伸長部14にて伸長差分
画像15に復号される。伸長差分画像15は空間冗長度
を抑圧された動き補償予測誤差信号である。伸長差分画
像15は加算器16にて動き補償予測画像7と加算さ
れ、現在の符号化対象画像の局部復号画像17となる。
局部復号画像17はフレームメモリ5に蓄積され、以降
のフレームの符号化にて参照される。
Local decoded image 1 of the current encoding target image 1
In order to obtain 7, the compressed differential data 11 output from the spatial redundancy compression unit 10 is decoded by the differential data expansion unit 14 into an expanded differential image 15. The decompression difference image 15 is a motion compensation prediction error signal whose spatial redundancy is suppressed. The decompressed difference image 15 is added to the motion compensation predicted image 7 by the adder 16 and becomes the locally decoded image 17 of the current image to be encoded.
The locally decoded image 17 is stored in the frame memory 5 and is referred to in the coding of subsequent frames.

【0043】一方、動き補償予測誤差9に対する圧縮差
分圧縮データ11は差分データ符号化部12にてデータ
圧縮符号化され、差分画像符号化データ13となる。動
ベクトル18は動ベクトル符号化部19にてデータ圧縮
符号化され、動ベクトル符号化データ20となる。差分
画像符号化データ13と動ベクトル符号化データ20は
多重化部21において多重化され、多重化データ22と
して伝送または蓄積される。
On the other hand, the compressed differential compressed data 11 for the motion compensation prediction error 9 is data compressed and coded by the differential data coding unit 12 to become differential image coded data 13. The motion vector 18 is data-compressed and coded by the motion vector coding unit 19 and becomes motion vector coded data 20. The differential image coded data 13 and the motion vector coded data 20 are multiplexed in the multiplexing unit 21 and transmitted or accumulated as multiplexed data 22.

【0044】また、この実施形態に示した装置は、入力
画像の解像度が既知ではない場合であり、画像の撮影と
同時に、カメラパラメータが記録される場合のように、
入力画像信号のカメラパラメータが既知の場合には、カ
メラパラメータ検出部23は不要であり、記録されたカ
メラパラメータ24を解像度変換部位決定部25に直接
入力することで本装置を実現することが可能となる。
Further, in the device shown in this embodiment, the resolution of the input image is not known, and as in the case where the camera parameters are recorded at the same time when the image is taken,
If the camera parameter of the input image signal is known, the camera parameter detection unit 23 is not necessary, and the present apparatus can be realized by directly inputting the recorded camera parameter 24 into the resolution conversion region determination unit 25. Becomes

【0045】[0045]

【発明の効果】以上説明したように、本発明によれば、
カメラの動きがある時、例えばズームが検出された時
は、画面中央部の解像度を自動的に高くしたり、パニン
グ、チルトが検出された時は画面の端の解像度を高くも
しくは低く変えることで、利用者が意識することなく、
画像信号を効率良く符号化できる効果がある。
As described above, according to the present invention,
When there is camera movement, for example when zoom is detected, the resolution in the center of the screen is automatically increased, and when panning or tilt is detected, the resolution at the edge of the screen is changed to high or low. , Without the user being aware
There is an effect that the image signal can be efficiently encoded.

【0046】これは、カメラの動きがある時には、それ
はカメラマンが意図して撮影したい物体があるはずであ
り、例えばズームの時はその中心近傍にカメラマンが写
したいものがあるはずであり、右にパニングした時は、
右に撮影したいものがあるはずである。本手法を用いて
カメラパラメータより撮影者および、映像を見ている人
が注視している部位の解像度を上げることで、視覚的な
画質が良好な復号画像を得ることが可能となる。
This is because when the camera moves, there should be an object that the cameraman wants to photograph, and when zooming, for example, there should be something the cameraman wants to photograph near the center of the object, and to the right. When I panned,
There should be something you want to shoot on the right. It is possible to obtain a decoded image with good visual quality by increasing the resolution of the part where the photographer and the person watching the image are gazing from the camera parameters using this method.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施形態の動画像符号化装置の構成
図である。
FIG. 1 is a configuration diagram of a moving image encoding device according to an embodiment of the present invention.

【図2】動画像からカメラパラメータを検出する動作の
説明図である。
FIG. 2 is an explanatory diagram of an operation of detecting a camera parameter from a moving image.

【図3】従来の画像通信装置の概要を示す図である。FIG. 3 is a diagram showing an outline of a conventional image communication device.

【図4】従来のブロック単位の動き補償予測符号化方法
による符号化装置の構成を示す図である。
[Fig. 4] Fig. 4 is a diagram illustrating a configuration of an encoding device according to a conventional block-based motion compensation predictive encoding method.

【符号の説明】[Explanation of symbols]

1 符号化対象画像 2 多角形パターン 3 動き検出部 4 ブロック動き補償部 5 フレームメモリ 6 局部復号画像 7 動き補償予測画像 8 減算器 9 動き補償予測誤差 10 空間冗長度圧縮部 11 圧縮差分データ 12 差分データ符号化部 13 差分画像符号化データ 14 差分データ伸張部 15 伸長差分画像 16 加算器 17 局部復号画像 18 動ベクトル 19 動ベクトル符号化部 20 動ベクトル符号化データ 21 多重化部 22 多重化データ 23 カメラパラメータ検出部 24 カメラパラメータ 25 解像度変換部位検出部 26 解像度変換部位識別子 1 image to be encoded 2 polygonal pattern 3 motion detection unit 4 block motion compensation unit 5 frame memory 6 locally decoded image 7 motion compensated prediction image 8 subtractor 9 motion compensation prediction error 10 spatial redundancy compression unit 11 compression difference data 12 difference Data coding unit 13 Difference image coded data 14 Difference data decompression unit 15 Decompression difference image 16 Adder 17 Locally decoded image 18 Motion vector 19 Motion vector coding unit 20 Motion vector coded data 21 Multiplexing unit 22 Multiplexed data 23 Camera parameter detection unit 24 Camera parameter 25 Resolution conversion region detection unit 26 Resolution conversion region identifier

Claims (9)

【特許請求の範囲】[Claims] 【請求項1】 動画像符号化方法において、入力された
画像信号のカメラパラメータが既知の際には該カメラパ
ラメータをそのまま用い、既知でない場合にはカメラパ
ラメータを検出し、該カメラパラメータに従って、入力
された画像信号のある特定の部位の解像度を高く、もし
くは低くして符号化することを特徴とする動画像符号化
方法。
1. In a moving image coding method, when a camera parameter of an input image signal is known, the camera parameter is used as it is, and when it is not known, the camera parameter is detected and input according to the camera parameter. A moving picture coding method, characterized in that the coding is performed by increasing or decreasing the resolution of a specific portion of the generated image signal.
【請求項2】 画像信号のカメラパラメータを検出する
に当たり、符号化対象画像を複数の小領域に分割し、該
符号化対象画像と予測参照画像との間の動き量を前記小
領域毎に求め、求められた小領域毎の動き量よりカメラ
パラメータを検出する請求項1に記載の動画像符号化方
法。
2. When detecting a camera parameter of an image signal, an encoding target image is divided into a plurality of small regions, and a motion amount between the encoding target image and a prediction reference image is obtained for each of the small regions. 2. The moving picture coding method according to claim 1, wherein the camera parameter is detected from the calculated amount of motion for each small area.
【請求項3】 カメラパラメータに従って入力画像のあ
る特定の部位の解像度を高くもしくは低くする際、どの
部位の解像度を変化させるかを選択する評価値としてカ
メラパラメータのズームイン、ズームアウトの量を用い
る請求項1記載の動画像符号化方法。
3. The amount of zoom-in and zoom-out of the camera parameter is used as an evaluation value for selecting which part of the resolution is changed when the resolution of a specific part of the input image is increased or decreased according to the camera parameter. Item 2. The moving image encoding method according to Item 1.
【請求項4】 検出されたカメラパラメータにズームイ
ンやズームアウトが含まれている際、カメラがズームし
ている中心点近傍を符号化する際に細かく量子化し解像
度を高くして符号化する請求項3記載の動画像符号化方
法。
4. When the detected camera parameters include zoom-in and zoom-out, fine quantization and high resolution encoding are performed when encoding the vicinity of the center point where the camera zooms. 3. The moving picture coding method described in 3.
【請求項5】 カメラパラメータに従って入力画像のあ
る特定の部位の解像度を高くもしくは低くする際、どの
部位の解像度を変化させるかを選択する評価値としてカ
メラパラメータのパニングやチルトの量を用いる請求項
1記載の動画像符号化方法。
5. The amount of panning or tilt of the camera parameter is used as an evaluation value for selecting which part of the resolution is changed when the resolution of a specific part of the input image is increased or decreased according to the camera parameter. 1. The moving picture coding method described in 1.
【請求項6】 検出されたカメラパラメータにパニング
やチルトが含まれている際、カメラのパニングやチルト
によって、画面外から新たに現れる部分を符号化する際
に、細かく量子化し解像度を高くして符号化する請求項
5記載の動画像符号化方法。
6. When the detected camera parameter includes panning or tilting, when the portion newly appearing from the outside of the screen is encoded by panning or tilting of the camera, fine quantization is performed to increase the resolution. The moving picture coding method according to claim 5, wherein the moving picture is coded.
【請求項7】 検出されたカメラパラメータにパニング
やチルトが含まれている際、カメラのパニングやチルト
によって、画面外から新たに現れる部分を符号化する際
に、粗く量子化し解像度を低くして符号化する請求項5
記載の動画像符号化方法。
7. When the detected camera parameter includes panning or tilting, coarse encoding is performed to reduce the resolution when encoding a part that newly appears from outside the screen due to panning or tilting of the camera. Encoding 5
The described moving picture coding method.
【請求項8】 検出されたカメラパラメータにパニング
やチルトが含まれている際、カメラのパニングやチルト
によって、次のフレームでは画面外に出ていってしまう
部分を符号化する際に、粗く量子化し解像度を低くして
符号化する請求項5記載の動画像符号化方法。
8. When a detected camera parameter includes panning or tilting, coarse panning or tilting of the camera causes a rough quantization when coding a part that goes out of the screen in the next frame. 6. The moving picture coding method according to claim 5, wherein the coding is performed by lowering the resolution.
【請求項9】 画像信号を入力し、符号化する動画像符
号化装置において、入力画像信号のカメラパラメータを
検出するカメラパラメータ検出部と、前記カメラパラメ
ータ検出部により検出されたパラメータに従って、入力
画像信号のどの部位の解像度をどのように変化させるか
を決定する解像度変換部位決定部と、該解像度変換部位
決定部の決定にしたがって画像信号を符号化する画像符
号化部とを有することを特徴とする動画像符号化装置。
9. A moving picture coding apparatus for inputting and coding an image signal, wherein a camera parameter detecting section for detecting a camera parameter of the input image signal, and an input image according to the parameter detected by the camera parameter detecting section. A resolution conversion part determination unit that determines which part of the signal changes the resolution and how; and an image encoding unit that encodes an image signal according to the determination of the resolution conversion part determination unit. Video encoding device.
JP2138296A 1996-02-07 1996-02-07 Moving picture coding method and apparatus Expired - Fee Related JP3317327B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2138296A JP3317327B2 (en) 1996-02-07 1996-02-07 Moving picture coding method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2138296A JP3317327B2 (en) 1996-02-07 1996-02-07 Moving picture coding method and apparatus

Publications (2)

Publication Number Publication Date
JPH09214965A true JPH09214965A (en) 1997-08-15
JP3317327B2 JP3317327B2 (en) 2002-08-26

Family

ID=12053548

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2138296A Expired - Fee Related JP3317327B2 (en) 1996-02-07 1996-02-07 Moving picture coding method and apparatus

Country Status (1)

Country Link
JP (1) JP3317327B2 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999040725A1 (en) * 1998-02-10 1999-08-12 Nihon Computer Co., Ltd. High-resolution high-value-added video transfer method by using pseudo natural image, high-resolution high-value-added video processor, high-resolution high-value-added video processing method, high-resolution high-value-added transfer system, and storage medium
CN102461169A (en) * 2009-06-12 2012-05-16 微软公司 Motion based dynamic resolution multiple bit rate video encoding
JP2015115903A (en) * 2013-12-13 2015-06-22 キヤノン株式会社 Imaging apparatus, control method of imaging apparatus, and computer program
JP2015231145A (en) * 2014-06-05 2015-12-21 日本放送協会 Transmitter, receiver and programs thereof
JP2017201777A (en) * 2016-03-15 2017-11-09 アクシス アーベー Method and system for encoding video stream

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9591318B2 (en) 2011-09-16 2017-03-07 Microsoft Technology Licensing, Llc Multi-layer encoding and decoding
US11089343B2 (en) 2012-01-11 2021-08-10 Microsoft Technology Licensing, Llc Capability advertisement, configuration and control for video coding and decoding

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999040725A1 (en) * 1998-02-10 1999-08-12 Nihon Computer Co., Ltd. High-resolution high-value-added video transfer method by using pseudo natural image, high-resolution high-value-added video processor, high-resolution high-value-added video processing method, high-resolution high-value-added transfer system, and storage medium
CN102461169A (en) * 2009-06-12 2012-05-16 微软公司 Motion based dynamic resolution multiple bit rate video encoding
JP2015115903A (en) * 2013-12-13 2015-06-22 キヤノン株式会社 Imaging apparatus, control method of imaging apparatus, and computer program
JP2015231145A (en) * 2014-06-05 2015-12-21 日本放送協会 Transmitter, receiver and programs thereof
JP2017201777A (en) * 2016-03-15 2017-11-09 アクシス アーベー Method and system for encoding video stream

Also Published As

Publication number Publication date
JP3317327B2 (en) 2002-08-26

Similar Documents

Publication Publication Date Title
US7532808B2 (en) Method for coding motion in a video sequence
US5357281A (en) Image processing apparatus and terminal apparatus
US9247250B2 (en) Method and system for motion compensated picture rate up-conversion of digital video using picture boundary processing
JP4378824B2 (en) Image processing apparatus and method
US20030123751A1 (en) Method and apparatus for region-based allocation of processing resources and control of input image formation
MXPA04010318A (en) Method and device for indicating quantizer parameters in a video coding system.
JPH07264580A (en) Method for transmitting video signal and video signal transmitter and receiver
JPH04196976A (en) Image encoding device
JPH11112973A (en) Device and method for converting video signal
JPH0795566A (en) Method and device for encoding image
JP3317327B2 (en) Moving picture coding method and apparatus
JP3086585B2 (en) Stereo image coding device
KR100366382B1 (en) Apparatus and method for coding moving picture
JPH10285542A (en) Image recorder and image recording method
JPH0630402A (en) Image coding device
JP3346448B2 (en) Video encoding device
JP4608801B2 (en) Image information conversion apparatus and method
JP3604266B2 (en) Dynamic control device of digital filter for video signal
JPH09261530A (en) Video recorder
JPH09275550A (en) Video conference system
JPH05130602A (en) Terminal equipment
JPH07222048A (en) Image pickup device
JPH05227513A (en) Video signal transmitter
JPH06233292A (en) Picture signal transmitting device
JPH0795590A (en) Method and device for processing video signal and image pickup device

Legal Events

Date Code Title Description
FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090614

Year of fee payment: 7

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090614

Year of fee payment: 7

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100614

Year of fee payment: 8

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100614

Year of fee payment: 8

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110614

Year of fee payment: 9

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120614

Year of fee payment: 10

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130614

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees