JP4735558B2 - Information processing apparatus and information processing method - Google Patents

Information processing apparatus and information processing method Download PDF

Info

Publication number
JP4735558B2
JP4735558B2 JP2007029460A JP2007029460A JP4735558B2 JP 4735558 B2 JP4735558 B2 JP 4735558B2 JP 2007029460 A JP2007029460 A JP 2007029460A JP 2007029460 A JP2007029460 A JP 2007029460A JP 4735558 B2 JP4735558 B2 JP 4735558B2
Authority
JP
Japan
Prior art keywords
picture
decoded
unit
output
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007029460A
Other languages
Japanese (ja)
Other versions
JP2008199109A (en
Inventor
幸広 荒戸
智副 古屋野
知子 相田
耕二 山宮
Original Assignee
サクサ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by サクサ株式会社 filed Critical サクサ株式会社
Priority to JP2007029460A priority Critical patent/JP4735558B2/en
Publication of JP2008199109A publication Critical patent/JP2008199109A/en
Application granted granted Critical
Publication of JP4735558B2 publication Critical patent/JP4735558B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、動画圧縮技術に関するものであり、より詳しくは符号化された動画像のデータを復号化する情報処理装置および情報処理方法に関するものである。   The present invention relates to a moving image compression technique, and more particularly to an information processing apparatus and an information processing method for decoding encoded moving image data.

近年、例えばTV会議システムなど複数の端末装置間でそれぞれが撮影した動画像を相互に視聴可能なシステムが提案されている。このようなシステムにおいて、各端末装置は、自装置で撮影した動画像を他の端末装置に送信するとともに、他の端末装置から送られてきた複数の動画像を同一画面に表示する。これにより、各端末装置のユーザは、他の端末装置のユーザの動画像を見ながら会話等を行うことが可能となる。   In recent years, for example, a system capable of mutually viewing moving images taken by a plurality of terminal devices such as a TV conference system has been proposed. In such a system, each terminal device transmits a moving image captured by the own device to other terminal devices, and displays a plurality of moving images sent from other terminal devices on the same screen. Accordingly, the user of each terminal device can perform a conversation or the like while watching the moving image of the user of another terminal device.

このようなシステムでは、通信負荷を軽減するために、送受信する動画像に対して符号化が行われる。例えば、H.264またはMPEG−4と呼ばれる動画圧縮技術(例えば、非特許文献1参照。)を用いると、動画像は、空間的に符号化されるIピクチャ、および、他のピクチャを参照して符号化されるPピクチャまたはBピクチャから構成される複数の連続したピクチャからなる画像データ(以下、符号化データという)に符号化される。この符号化データは、受信側の端末装置で復号化されることにより、動画像として再生することが可能となる。   In such a system, in order to reduce the communication load, encoding is performed on a moving image to be transmitted and received. For example, H.M. When a moving image compression technique called H.264 or MPEG-4 (for example, see Non-Patent Document 1) is used, a moving image is encoded with reference to a spatially encoded I picture and other pictures. Are encoded into image data (hereinafter referred to as encoded data) including a plurality of consecutive pictures including a P picture or a B picture. The encoded data can be reproduced as a moving image by being decoded by the terminal device on the receiving side.

上記システムにおいて、動画像の符号化および符号化データの復号化は、各端末装置に実装されたソフトウェアにより行われる。このため、例えば3,4台程度の少数の端末装置による符号化データの送受信であれば端末装置の動作上の問題はないが、例えば10台程度など多数の端末装置による符号化データの送受信を行うとなると、各端末装置では同時に送られてくる多数の符号化データを同時に復号化しなければならないので、CPUにかかる負荷が増大し、結果として動画像が正常に再生されない場合があった。   In the system described above, encoding of moving images and decoding of encoded data are performed by software installed in each terminal device. For this reason, there is no problem in the operation of the terminal device as long as it is transmission / reception of encoded data by a small number of terminal devices, for example, about 3 or 4 units. If this is the case, each terminal device must simultaneously decode a large number of encoded data, which increases the load on the CPU, and as a result, the moving image may not be reproduced normally.

このような事態を防ぐために、従来では、例えばIピクチャのみを復号化したり、フレームレートを変更するなど、端末装置における復号化処理にかかる負荷を低減させる方法が提案されている(例えば、特許文献1参照。)。   In order to prevent such a situation, conventionally, for example, a method for reducing the load on the decoding process in the terminal device such as decoding only the I picture or changing the frame rate has been proposed (for example, Patent Documents). 1).

特開平9−74548号公報Japanese Patent Laid-Open No. 9-74548 International Telecommunication Union、“ITU-T Recommendation H.264 Advanced video coding for generic audiovisual services”、[online]、[平成19年1月23日検索]、インターネット<http://www.itu.int/rec/T-REC-H.264/en>International Telecommunication Union, “ITU-T Recommendation H.264 Advanced video coding for generic audiovisual services”, [online], [searched January 23, 2007], Internet <http://www.itu.int/rec/ T-REC-H.264 / en>

しかしながら、Iピクチャのみを復号化する方法は、動画像再生時のフレームレートが極端に低くなってしまうので、高画質な動画像を提供するのが困難となる。これを解消するためにIピクチャの数を増やすと、低ビットレートな環境では復号した際の画質が低くなる。そこで画質を向上させようとすると、ビットレートを上げる必要があるが、PピクチャやBピクチャと比較してIピクチャはデータ量が大きいので、ネットワーク帯域の多くを占有してしまい他の通信に影響が出てしまう可能性がある。   However, the method of decoding only I pictures makes it difficult to provide high-quality moving images because the frame rate during moving image reproduction becomes extremely low. If the number of I pictures is increased in order to solve this problem, the image quality at the time of decoding decreases in a low bit rate environment. In order to improve the image quality, it is necessary to increase the bit rate. However, since the I picture has a larger amount of data than the P picture and B picture, it occupies much of the network bandwidth and affects other communications. May come out.

また、フレームレートを変更する方法は、フレームレートが高いときはよいものの、フレームレートが低いときには、高画質な動画像を再生することが困難となる。   The method for changing the frame rate is good when the frame rate is high, but when the frame rate is low, it is difficult to reproduce a high-quality moving image.

上述したように、従来は、端末装置の演算負荷を低減させるとともに、高画質の動画像を再生することが困難であった。
そこで、本願発明は、演算負荷を低減させるとともに動画像の画像を向上させることができる情報処理装置および情報処理方法を提供することを目的とする。
As described above, conventionally, it has been difficult to reduce the computational load on the terminal device and to reproduce high-quality moving images.
Accordingly, an object of the present invention is to provide an information processing apparatus and an information processing method capable of reducing a calculation load and improving a moving image.

上述したような課題を解決するために、本発明に係る情報処理装置は、符号化された連続する複数のピクチャを含む符号化データを入力とし、入力されたピクチャがIピクチャであるか否かを判別し、当該ピクチャがIピクチャである場合には当該ピクチャを出力する一方、当該ピクチャがIピクチャではない場合、当該ピクチャより先に入力された所定の他のピクチャが復号化されているか否かを判別し、前記他のピクチャが復号化されていれば当該ピクチャを出力しない選択手段と、この選択手段から出力されたピクチャを復号化する復号化手段とを備え、符号化データは、Iピクチャではないピクチャが、直前ではない、より時間的に遠いIピクチャまたは復号化されているIピクチャではないピクチャを参照する構造を有することを特徴とする。 In order to solve the above-described problems, an information processing apparatus according to the present invention receives encoded data including a plurality of consecutive encoded pictures, and determines whether or not the input picture is an I picture. When the picture is an I picture, the picture is output. On the other hand, when the picture is not an I picture, whether or not a predetermined other picture input before the picture has been decoded. If the other picture has been decoded, a selection unit that does not output the picture and a decoding unit that decodes the picture output from the selection unit are provided . not a picture picture is not the immediately preceding, to have a structure that reference picture is not an I-picture that is more temporally distant I picture or decoding And butterflies.

また、本発明に係る他の情報処理装置は、符号化された連続する複数のピクチャを含む符号化データを入力とし、入力されたピクチャがIピクチャであるか否かを判別し、当該ピクチャがIピクチャである場合には当該ピクチャを出力する一方、当該ピクチャがIピクチャではない場合、当該ピクチャより先に入力された所定の他のピクチャが復号化されているか否かを判別し、前記他のピクチャが復号化されていれば当該ピクチャを出力せず、前記他のピクチャが復号化されていなければ、当該ピクチャが参照すべき参照ピクチャが復号化されているか否かを判別し、前記参照ピクチャが復号化されていれば当該ピクチャを出力し、前記参照ピクチャが復号化されていなければ当該ピクチャを出力しない選択手段と、この選択手段から出力されたピクチャを復号化する復号化手段とを備え、符号化データは、Iピクチャではないピクチャが、直前ではない、より時間的に遠いIピクチャまたは復号化されているIピクチャではないピクチャを参照する構造を有することを特徴とする。 Further, another information processing apparatus according to the present invention receives encoded data including a plurality of consecutive encoded pictures, determines whether or not the input picture is an I picture, and the picture is If the picture is an I picture, the picture is output. On the other hand, if the picture is not an I picture, it is determined whether a predetermined other picture input prior to the picture has been decoded. If the picture is decoded, the picture is not output. If the other picture is not decoded, it is determined whether or not the reference picture to be referenced by the picture is decoded. If the picture has been decoded, the picture is output, and if the reference picture has not been decoded, the selection means that does not output the picture, and output from the selection means E Bei was a decoding means for decoding the picture, the encoded data is a picture not I pictures, not immediately before the picture that is not an I-picture that is more temporally distant I picture or decoding It has a structure to be referred to .

また、本発明に係る情報処理方法は、符号化された連続する複数のピクチャを含む符号化データを入力とし、入力されたピクチャがIピクチャであるか否かを判別し、当該ピクチャがIピクチャである場合には当該ピクチャを出力する一方、当該ピクチャがIピクチャではない場合、当該ピクチャより先に入力された所定の他のピクチャが復号化されているか否かを判別し、前記他のピクチャが復号化されていれば当該ピクチャを出力しない選択ステップと、この選択ステップにより出力されたピクチャを復号化する復号化ステップとを有し、符号化データは、Iピクチャではないピクチャが、直前ではない、より時間的に遠いIピクチャまたは復号化されているIピクチャではないピクチャを参照する構造を有することを特徴とする。 Also, the information processing method according to the present invention receives encoded data including a plurality of consecutive encoded pictures, determines whether or not the input picture is an I picture, and the picture is an I picture. If the picture is not an I picture, it is determined whether or not a predetermined other picture input before the picture has been decoded, and the other picture is output. a selection step does not output the picture if but decoded, possess a decoding step of decoding the outputted picture by the selection step, the encoded data, a picture not I-picture, the immediately preceding It is characterized by having a structure that refers to a picture that is not a far-in-time I picture or a picture that is not a decoded I picture .

また、本発明に係る他の情報処理方法は、符号化された連続する複数のピクチャを含む符号化データを入力とし、入力されたピクチャがIピクチャであるか否かを判別し、当該ピクチャがIピクチャである場合には当該ピクチャを出力する一方、当該ピクチャがIピクチャではない場合、当該ピクチャより先に入力された所定の他のピクチャが復号化されているか否かを判別し、前記他のピクチャが復号化されていれば当該ピクチャを出力せず、前記他のピクチャが復号化されていなければ、当該ピクチャが参照すべき参照ピクチャが復号化されているか否かを判別し、前記参照ピクチャが復号化されていれば当該ピクチャを出力し、前記参照ピクチャが復号化されていなければ当該ピクチャを出力しない選択ステップと、この選択ステップにより出力されたピクチャを復号化する復号化ステップとを有し、符号化データは、Iピクチャではないピクチャが、直前ではない、より時間的に遠いIピクチャまたは復号化されているIピクチャではないピクチャを参照する構造を有することを特徴とする。 Further, another information processing method according to the present invention receives encoded data including a plurality of consecutive encoded pictures, determines whether or not the input picture is an I picture, and the picture is If the picture is an I picture, the picture is output. On the other hand, if the picture is not an I picture, it is determined whether a predetermined other picture input prior to the picture has been decoded. If the picture is decoded, the picture is not output. If the other picture is not decoded, it is determined whether or not the reference picture to be referenced by the picture is decoded. A selection step of outputting the picture if the picture has been decoded, and not outputting the picture if the reference picture has not been decoded, and the selection step Possess a decoding step for decoding a more output picture, encoded data, the picture is not an I-picture is not a last minute, not the I picture that is more temporally distant I picture or decoding It has a structure that refers to a picture .

本発明によれば、入力されたピクチャがIピクチャでない場合に当該ピクチャより先に入力された所定の他のピクチャが復号化されていると、当該ピクチャが復号化されないので、復号化に伴う演算負荷を低減させることができる。また、Iピクチャ以外のピクチャを復号化することも可能となるので、動画像の画質を向上させることができる。   According to the present invention, when an input picture is not an I picture, if a predetermined other picture input before the picture is decoded, the picture is not decoded. The load can be reduced. In addition, since it is possible to decode pictures other than I pictures, it is possible to improve the quality of moving images.

以下、図面を参照して、本発明の実施の形態について詳細に説明する。なお、本実施の形態では、TV会議システムにおける端末装置に本発明を適用した場合を例に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. In this embodiment, a case where the present invention is applied to a terminal device in a TV conference system will be described as an example.

[TV会議システムの構成]
図1に示すように、本実施の形態に係るTV会議システムは、サーバ1と、複数の端末装置2a〜2nとから構成され、それぞれはLAN(Local Area Network)やインターネット等からなる通信回線3により接続されている。なお、端末装置2a〜2nは、それぞれ同等の構成を有するので、便宜上、以下端末装置2と言う。
[Configuration of TV conference system]
As shown in FIG. 1, the TV conference system according to the present embodiment includes a server 1 and a plurality of terminal devices 2a to 2n, each of which is a communication line 3 including a LAN (Local Area Network), the Internet, or the like. Connected by. Since the terminal devices 2a to 2n have the same configuration, they are hereinafter referred to as the terminal device 2 for convenience.

(サーバの構成)
サーバ1は、TV会議システムを構成する端末装置2a〜2nの呼制御を行い、端末装置2間の通信を確立する。
(Server configuration)
The server 1 performs call control of the terminal devices 2a to 2n constituting the TV conference system, and establishes communication between the terminal devices 2.

(端末装置の構成)
端末装置2は、TV会議システムを利用するユーザにより用いられる公知のコンピュータから構成される。この端末装置2は、図2に示すように、外部I/F部4と、操作入力部5と、画像処理部6と、音声処理部7と、記憶部8と、制御部9とから構成される。
(Configuration of terminal device)
The terminal device 2 is composed of a known computer used by a user who uses the TV conference system. As shown in FIG. 2, the terminal device 2 includes an external I / F unit 4, an operation input unit 5, an image processing unit 6, an audio processing unit 7, a storage unit 8, and a control unit 9. Is done.

外部I/F部4は、通信回路からなり、通信回線3等を介して、サーバ1および他の端末装置2とデータ通信を行い、接続された各装置と各種データをやりとりする。   The external I / F unit 4 includes a communication circuit, performs data communication with the server 1 and other terminal devices 2 through the communication line 3 and the like, and exchanges various data with each connected device.

操作入力部5は、キーボードやマウス等からなり、ユーザの操作を検出して制御部9へ出力する。   The operation input unit 5 includes a keyboard and a mouse, and detects a user operation and outputs it to the control unit 9.

画像処理部6は、画像処理回路からなり、カメラ6aにより取り込まれた動画像を制御部9に入力したり、制御部9から入力された動画像をモニタ6bから出力させたりするとともに、階調制御等を行う。   The image processing unit 6 includes an image processing circuit. The moving image captured by the camera 6a is input to the control unit 9, and the moving image input from the control unit 9 is output from the monitor 6b. Control and so on.

音声処理部7は、信号処理回路からなり、マイク7aから入力された音声を音声データに符号化して制御部9に出力したり、制御部9から入力された音声データを復号化してスピーカ7bから出力したりするとともに、音量制御やエコーキャンセラ等の機能を有する。   The audio processing unit 7 includes a signal processing circuit, encodes audio input from the microphone 7a into audio data and outputs the audio data to the control unit 9, or decodes audio data input from the control unit 9 and outputs from the speaker 7b. Output, and has functions such as volume control and echo canceller.

記憶部8は、メモリやハードディスクなどの記憶装置からなり、制御データ8aおよびプログラム8bを格納する。ここで、制御データ8aは、端末装置2の制御に用いる情報である。また、プログラム8bは、端末装置2の動作プログラムであり、予め記憶部8に格納される。なお、プログラム8bは、DVD(Digital Versatile Disk)やCD(Compact disk)等の記録媒体やネットワークを介して記憶部8に格納するようにしてもよい。   The storage unit 8 includes a storage device such as a memory or a hard disk, and stores control data 8a and a program 8b. Here, the control data 8 a is information used for controlling the terminal device 2. The program 8b is an operation program for the terminal device 2 and is stored in the storage unit 8 in advance. The program 8b may be stored in the storage unit 8 via a recording medium such as a DVD (Digital Versatile Disk) or a CD (Compact disk) or a network.

制御部9は、CPUなどのマイクロプロセッサとその周辺回路からなり、記憶部8からプログラム8bを読み込んで実行することにより、上記ハードウェアとプログラム8bを協働させ、符号化手段11、復号化手段12およびTV会議手段13を実現させる。   The control unit 9 includes a microprocessor such as a CPU and its peripheral circuits, and reads and executes the program 8b from the storage unit 8 to cause the hardware and the program 8b to cooperate with each other, thereby encoding means 11 and decoding means. 12 and the TV conference means 13 are realized.

符号化手段11は、H.264規格に基づいて、カメラ6aおよび画像処理部6により生成された連続する複数のフレーム(画像)を符号化して、連続する複数のピクチャ(符号化された画像)からなる符号化データを生成する。この符号化手段11は、図3に示すように、符号化手段11は、差分演算部111、DCT部112、量子化部113、逆量子化部114、IDCT部115、加算演算部116、デブロッキングフィルタ117、動き補償予測部118、フレームメモリ119、動き検出部120、イントラ予測部121、スイッチ122および符号化データ出力部123を備えている。このような構成を有する符号化手段11による画像符号化処理動作の詳細については後述する。   The encoding means 11 is an H.264 standard. Based on the H.264 standard, a plurality of continuous frames (images) generated by the camera 6a and the image processing unit 6 are encoded to generate encoded data composed of a plurality of continuous pictures (encoded images). . As shown in FIG. 3, the encoding unit 11 includes a difference calculation unit 111, a DCT unit 112, a quantization unit 113, an inverse quantization unit 114, an IDCT unit 115, an addition calculation unit 116, A blocking filter 117, a motion compensation prediction unit 118, a frame memory 119, a motion detection unit 120, an intra prediction unit 121, a switch 122, and an encoded data output unit 123 are provided. Details of the image encoding processing operation by the encoding means 11 having such a configuration will be described later.

復号化手段12は、外部I/F部4を介して他の端末装置2から受信した符号化データを復号化して画像データを生成する。この復号化手段12は、図4に示すように、選択部150、復号化部131、逆量子化部132、IDCT部133、加算演算部134、デブロッキングフィルタ135、フレームメモリ136、動き補償予測部137、イントラ予測部138およびスイッチ139を備えている。このような復号化手段12は、TV会議システムのように同時に複数の端末装置2と符号化データのやりとりを行う場合、相手先の端末装置2毎に設けられる。なお、復号化手段12による復号化処理動作の詳細については後述する。   The decoding unit 12 decodes encoded data received from another terminal device 2 via the external I / F unit 4 to generate image data. As shown in FIG. 4, the decoding unit 12 includes a selection unit 150, a decoding unit 131, an inverse quantization unit 132, an IDCT unit 133, an addition operation unit 134, a deblocking filter 135, a frame memory 136, a motion compensation prediction. Unit 137, intra prediction unit 138, and switch 139. Such a decoding means 12 is provided for each terminal device 2 of the other party when exchanging encoded data with a plurality of terminal devices 2 at the same time as in the TV conference system. Details of the decryption processing operation by the decryption means 12 will be described later.

TV会議手段13は、通信回線3および外部I/F部4を介して他の端末装置2と符号化データおよび音声データをやりとりすることにより、TV会議システムを実現するものである。具体的には、まず、サーバ1の呼制御の結果、TV会議に使用される端末装置2の数量に応じて、復号化手段12の数量を設定する。また、符号化手段11により生成された符号化データおよび音声処理部7により生成された音声データを、他の端末装置2それぞれに送信させる。また、他の端末装置2から受信した音声データを、音声処理部7によりスピーカ7bから出力させる。また、他の各端末装置2から受信した符号化データを、それぞれ対応する復号化手段12により復号化させ、生成された各フレームを画像処理部6によりモニタ6b上の所定の位置およびサイズで同時に表示させる。例えば、図5に示すように、発言しているユーザの端末装置2から動画像は、符号xで示すように画面の中央に大きく表示させ、他のユーザの端末装置2からの動画像は、符号yで示すように小さく表示させるようにしてもよい。このようにすることにより、他の端末装置2のユーザと、それぞれの動画像を見ながらそれぞれと会話を行うことができる。   The TV conference means 13 implements a TV conference system by exchanging encoded data and audio data with another terminal device 2 via the communication line 3 and the external I / F unit 4. Specifically, first, as a result of the call control of the server 1, the quantity of the decoding means 12 is set according to the quantity of the terminal devices 2 used for the TV conference. Further, the encoded data generated by the encoding unit 11 and the audio data generated by the audio processing unit 7 are transmitted to each of the other terminal devices 2. In addition, the audio data received from the other terminal device 2 is output from the speaker 7 b by the audio processing unit 7. Also, the encoded data received from each of the other terminal devices 2 is decoded by the corresponding decoding means 12, and each of the generated frames is simultaneously performed at a predetermined position and size on the monitor 6b by the image processing unit 6. Display. For example, as shown in FIG. 5, the moving image from the terminal device 2 of the speaking user is displayed largely at the center of the screen as indicated by the symbol x, and the moving image from the terminal device 2 of the other user is As indicated by the symbol y, it may be displayed in a small size. By doing in this way, it is possible to have a conversation with a user of another terminal device 2 while watching each moving image.

[符号化処理動作]
次に、図3を参照して符号化手段11による符号化処理動作について説明する。この符号化は、イントラ予測符号化および動き補償予測符号化の2種類がある。これらは、スイッチ122によって切り替えがなされる。ここではまず始めにイントラ予測符号化について説明する。
[Encoding processing operation]
Next, the encoding processing operation by the encoding means 11 will be described with reference to FIG. There are two types of encoding: intra prediction encoding and motion compensation prediction encoding. These are switched by the switch 122. Here, first, intra prediction encoding will be described.

(イントラ予測符号化)
イントラ予測符号化とは、基本的には1枚のフレーム内において圧縮符号化を行うものである。具体的には、画像処理部6から入力されたフレームは、DCT部112に入力されて周波数変換されたのち、量子化部113で量子化され、符号化データ出力部123で可変長符号化が施される。これにより、Iピクチャが出力される。
(Intra prediction coding)
Intra-predictive encoding is basically compression encoding within one frame. Specifically, the frame input from the image processing unit 6 is input to the DCT unit 112 and subjected to frequency conversion, then quantized by the quantization unit 113, and variable-length encoded by the encoded data output unit 123. Applied. As a result, an I picture is output.

なお、量子化部113から出力される残差データは、逆量子化部114およびIDCT部115により逆量子化および逆周波数変換が順次施され、デブロッキングフィルタ117により符号化を行う際に生じたブロック歪を緩和するための処理が行われたのち、再構成画像データとしてフレームメモリ119に格納される。   The residual data output from the quantization unit 113 is generated when the inverse quantization unit 114 and the IDCT unit 115 sequentially perform inverse quantization and inverse frequency conversion, and the deblocking filter 117 performs encoding. After processing for reducing block distortion is performed, it is stored in the frame memory 119 as reconstructed image data.

(動き補償予測符号化)
動き補償予測符号化とは、基本的には他のフレーム(参照フレーム)からの変化を符号化するものである。具体的には、画像処理部6からフレームが入力されると、動き検出部120は、入力されたフレームとフレームメモリ119に格納された再構成画像データとに基づいて、動きベクトルを検出する。動き補償予測部118は、動きベクトルとフレームメモリ119に格納された再構成画像データとに基づいて、予測画像データを生成する。差分演算部111は、入力されたフレームと予測画像データとの差分をとり、差分画像データを生成する。この差分画像データは、DCT部112に入力されて周波数変換されたのち、符号化データ出力部123で可変長符号化が施される。これにより、PピクチャやBピクチャが出力される。
(Motion compensated prediction coding)
The motion compensation predictive encoding basically encodes a change from another frame (reference frame). Specifically, when a frame is input from the image processing unit 6, the motion detection unit 120 detects a motion vector based on the input frame and the reconstructed image data stored in the frame memory 119. The motion compensation prediction unit 118 generates predicted image data based on the motion vector and the reconstructed image data stored in the frame memory 119. The difference calculation unit 111 calculates the difference between the input frame and the predicted image data, and generates difference image data. The difference image data is input to the DCT unit 112 and subjected to frequency conversion, and then the encoded data output unit 123 performs variable length encoding. Thereby, P picture and B picture are output.

なお、量子化部113から出力される残差データは、逆量子化部114およびIDCT部115により逆量子化および逆周波数変換が順次施され、加算演算部116により予測画像データが加算され、デブロッキングフィルタ117により符号化を行う際に生じたブロック歪を緩和するための処理が行われたのち、再構成画像データとしてフレームメモリ119に格納される。   Note that the residual data output from the quantization unit 113 is sequentially subjected to inverse quantization and inverse frequency conversion by the inverse quantization unit 114 and the IDCT unit 115, and the addition calculation unit 116 adds the predicted image data, After processing for reducing block distortion caused when encoding is performed by the blocking filter 117, it is stored in the frame memory 119 as reconstructed image data.

上述したようなH.264規格に基づいて生成された符号化データは、一般にNALユニットと呼ばれる構成を有する。このNALユニットは、図6に示すように、NALヘッダとRBSP(Raw Byte Sequence Payload)とから構成される。NALヘッダは、固定ビットと、参照ピクチャかであるか否かを示すフラグからなるnal_ref_idoと、NALユニットの種類を示す識別子からなるnal_unit_typeとから構成される。また、RBAPは、圧縮データからなるスライスデータと、このスライスデータに関するヘッダ情報からなるスライスヘッダとから構成される。このスライスヘッダは、参照ピクチャが何れのピクチャであるかを識別することができる。   H. as described above. The encoded data generated based on the H.264 standard generally has a configuration called a NAL unit. As shown in FIG. 6, the NAL unit includes a NAL header and an RBSP (Raw Byte Sequence Payload). The NAL header includes a fixed bit, nal_ref_ido including a flag indicating whether the picture is a reference picture, and nal_unit_type including an identifier indicating the type of the NAL unit. The RBAP is composed of slice data composed of compressed data and a slice header composed of header information related to the slice data. This slice header can identify which picture the reference picture is.

[復号化処理動作]
次に、図4を参照して復号化手段12による符号化データの復号化処理動作について説明する。
[Decryption processing operation]
Next, the operation of decoding encoded data by the decoding unit 12 will be described with reference to FIG.

まず、入力された符号化データは、選択部150の判別手段152により所定の条件により各ピクチャが判別され、この判別結果に基づいて出力手段151により復号化されるピクチャのみが選択的に出力される。このような選択部150によるピクチャの選択動作の詳細については後述する。   First, in the input encoded data, each picture is discriminated based on a predetermined condition by the discriminating means 152 of the selection unit 150, and only the picture decoded by the output means 151 is selectively outputted based on the discrimination result. The Details of the picture selection operation by the selection unit 150 will be described later.

選択されたピクチャに対する復号化は、イントラ予測復号化および動き補償予測復号化の2種類がある。これらは、スイッチ139によって切り替えがなされる。ここではまず始めにイントラ予測復号化について説明する。   There are two types of decoding for the selected picture: intra prediction decoding and motion compensated prediction decoding. These are switched by a switch 139. Here, first, intra prediction decoding will be described.

(イントラ予測復号化)
イントラ予測復号化は、Iピクチャのみから元のフレームを復元するものである。選択部150により選択されたピクチャは、復号化部131により可変長変換され、逆量子化部132およびIDCT部133により逆量子化と逆周波数変換が順次施されたのち、デブロッキングフィルタ135により復号化を行う際に生じたブロック歪みが緩和され、フレームとして出力される。このフレームは、フレームメモリ136にも格納される。このようにIピクチャは、他のピクチャを参照することなく復号化される。
(Intra prediction decoding)
Intra-prediction decoding restores the original frame from only the I picture. The picture selected by the selection unit 150 is subjected to variable length transformation by the decoding unit 131, subjected to inverse quantization and inverse frequency transformation in order by the inverse quantization unit 132 and the IDCT unit 133, and then decoded by the deblocking filter 135. The block distortion generated during the conversion is alleviated and output as a frame. This frame is also stored in the frame memory 136. Thus, an I picture is decoded without referring to other pictures.

(動き補償予測復号化)
次に、動き補償予測復号化について説明する。この動き補償予測復号化は、参照ピクチャと動きベクトルから元のフレームを復元するものである。選択部150からピクチャが入力されると、このピクチャは、復号化部131により可変長変換され、逆量子化部132およびIDCT部133により逆量子化と逆周波数変換が順次施され、残差復号化データとして出力される。このとき、動き補償予測部137では、フレームメモリ136に格納されたフレームに基づいて予測画像データが生成される。上述したように生成された残差符号化データと予測画像データとは、加算演算部134により加算され、デブロッキングフィルタ135により復号化を行う際に生じたブロック歪みが緩和されることにより、フレームとして出力される。このフレームは、フレームメモリ136にも格納される。
(Motion compensated prediction decoding)
Next, motion compensation predictive decoding will be described. This motion compensation predictive decoding restores the original frame from the reference picture and the motion vector. When a picture is input from the selection unit 150, the picture is subjected to variable length transformation by the decoding unit 131, and inverse quantization and inverse frequency transformation are sequentially performed by the inverse quantization unit 132 and the IDCT unit 133, and residual decoding is performed. Output as digitized data. At this time, the motion compensation prediction unit 137 generates predicted image data based on the frame stored in the frame memory 136. The residual encoded data and the predicted image data generated as described above are added by the addition operation unit 134, and the block distortion generated when decoding is performed by the deblocking filter 135 is alleviated. Is output as This frame is also stored in the frame memory 136.

[ピクチャ選択動作]
次に、図7〜図10を参照して、選択部150による復号化するピクチャの選択動作について説明する。
[Picture selection operation]
Next, the selection operation of the picture to be decoded by the selection unit 150 will be described with reference to FIGS.

まず、選択部150は、符号化データが入力されると(ステップS1)、判別手段152により各ピクチャについて復号化するか否かを以下の手順で順次判別する。   First, when the encoded data is input (step S1), the selection unit 150 sequentially determines whether or not each picture is to be decoded by the determination unit 152 according to the following procedure.

判別手段152は、Iピクチャ判別手段152aにより、入力されたピクチャ(以下、「入力ピクチャ」という)がIピクチャであるか否かを判別する(ステップS2)。この判別は、図6を参照して説明したNALユニットにおけるNALヘッダのnal_unit_typeを参照することにより行われる。   The discriminating means 152 discriminates whether or not the input picture (hereinafter referred to as “input picture”) is an I picture by the I picture discriminating means 152a (step S2). This determination is performed by referring to the nal_unit_type of the NAL header in the NAL unit described with reference to FIG.

入力ピクチャがIピクチャである場合(ステップS2:YES)、Iピクチャ判別手段152aは、その入力ピクチャを復号化するピクチャとして選択し、出力手段151から出力させる(ステップS6)。その結果、本実施の形態では、Iピクチャは全て復号化される。   When the input picture is an I picture (step S2: YES), the I picture determination unit 152a selects the input picture as a picture to be decoded and outputs it from the output unit 151 (step S6). As a result, in the present embodiment, all I pictures are decoded.

一例として、図8に示す符号a〜lの連続するピクチャから構成される符号化データに対して、選択部150により行われる選択動作ついて説明する。なお、図8において、矩形の中に示す文字は各ピクチャの種類を表し、矢印は各ピクチャが参照する参照ピクチャを示している。例えば、符号bのピクチャは、Pピクチャであって、符号aのIピクチャを参照していることを意味する。   As an example, a description will be given of a selection operation performed by the selection unit 150 with respect to encoded data composed of consecutive pictures of codes a to l illustrated in FIG. In FIG. 8, the characters shown in the rectangle indicate the type of each picture, and the arrows indicate the reference pictures to which each picture refers. For example, a picture with code b is a P picture, which means that an I picture with code a is referenced.

図8の符号化データの場合、符号aのピクチャと符号gのピクチャがIピクチャである。したがって、Iピクチャ判別手段152aは、符号aと符号gのピクチャを符号化するピクチャとして選択し、出力手段151から出力させる。これにより、図9に示すように、符号aと符号gのピクチャに基づくフレームが生成される。なお、図9において、上段の矩形は図8に対応する符号化データの各ピクチャを、これらのピクチャと矢印でそれぞれ結ばれた下段の矩形は復号化手段13から出力されるフレームを表しており、人の絵のフレームは復号すると選択されたピクチャに対応するフレーム、「×」が記されたフレームは破棄すると選択されたピクチャに対応するフレームを意味する。   In the case of the encoded data in FIG. 8, the picture with the code a and the picture with the code g are I pictures. Accordingly, the I picture determination unit 152a selects the pictures of the code a and the code g as the pictures to be encoded and outputs them from the output unit 151. Thereby, as shown in FIG. 9, the frame based on the picture of the code | symbol a and the code | symbol g is produced | generated. In FIG. 9, the upper rectangle represents each picture of the encoded data corresponding to FIG. 8, and the lower rectangle connected to these pictures by an arrow represents a frame output from the decoding means 13. When a person's picture frame is decoded, it means a frame corresponding to the selected picture, and a frame marked with “x” means a frame corresponding to the selected picture when discarded.

一方、入力ピクチャがIピクチャではない場合(ステップS2:NO)、判別手段152は、所定ピクチャ判別手段152bにより入力ピクチャより前の所定の位置に存在するピクチャが復号化されているか否かを判別する(ステップS3)。所定ピクチャ判別手段152bは、フレームメモリ136を参照して、入力ピクチャより先に入力されたピクチャ(本実施の形態では直前に存在したピクチャ)が復号化されたか否かを判別する。   On the other hand, when the input picture is not an I picture (step S2: NO), the determination unit 152 determines whether or not a picture existing at a predetermined position before the input picture is decoded by the predetermined picture determination unit 152b. (Step S3). The predetermined picture discriminating means 152b refers to the frame memory 136 and discriminates whether or not the picture inputted before the input picture (the picture existing immediately before in the present embodiment) has been decoded.

直前のピクチャが復号化されている場合(ステップS3:YES)、所定ピクチャ判別手段152bは、入力ピクチャを復号化するピクチャとして選択しない、すなわち破棄するピクチャとして選択し、出力手段151から出力させない(ステップS5)。このように直前のピクチャが復号化されているのであれば、当該ピクチャの直後のピクチャを破棄したとしても、人間の目には、その違いがほとんど感じられないものと考えられる。したがって、本実施の形態では、直前のピクチャが復号化されている場合、入力ピクチャを破棄することにより、画質の低下を抑えながら、復号化するピクチャの数量を減少させることができるので、端末装置2の演算負荷を低減させることができる。   When the immediately preceding picture has been decoded (step S3: YES), the predetermined picture discriminating means 152b does not select the input picture as a picture to be decoded, that is, selects it as a picture to be discarded and does not output it from the output means 151 ( Step S5). If the immediately preceding picture is decoded in this way, even if the immediately following picture is discarded, it is considered that the difference is hardly perceived by human eyes. Therefore, in the present embodiment, when the previous picture is decoded, it is possible to reduce the number of pictures to be decoded while suppressing the deterioration of the image quality by discarding the input picture. 2 calculation load can be reduced.

例えば、図8の符号bや符号hのピクチャは、直前のピクチャ、すなわち符号aまたは符号gのピクチャが復号化されている。したがって、所定ピクチャ判別手段152bは、符号bと符号hのピクチャを破棄するピクチャとして選択し、出力手段151から出力させない。これにより、図9に示すように、符号bと符号hのピクチャに基づくフレームが生成されない。   For example, the pictures b and h in FIG. 8 are obtained by decoding the previous picture, that is, the picture of the code a or g. Therefore, the predetermined picture discriminating unit 152b selects the pictures b and h as the pictures to be discarded and does not output them from the output unit 151. Thereby, as shown in FIG. 9, the frame based on the picture of the code | symbol b and the code h is not produced | generated.

直前のピクチャが復号化されていない場合(ステップS3:NO)、判別手段152は、参照ピクチャ判別手段152cにより入力ピクチャが参照しているピクチャ(以下、「参照ピクチャ」という)が復号化されているか否かを判別する(ステップS4)。上述したように、図6に示すNALユニットのRBSPのスライスヘッダには、入力ピクチャの参照ピクチャが何れのピクチャであるかを示す情報が含まれている。したがって、参照ピクチャ判別手段152cは、RBSPのスライスヘッダから入力ピクチャの参照ピクチャを特定し、フレームメモリ136から当該参照ピクチャを検索することにより、入力ピクチャの参照ピクチャが符号化されたか否かを判別する。   When the immediately preceding picture has not been decoded (step S3: NO), the determination unit 152 decodes a picture (hereinafter referred to as “reference picture”) referred to by the input picture by the reference picture determination unit 152c. It is determined whether or not there is (step S4). As described above, the RBSP slice header of the NAL unit shown in FIG. 6 includes information indicating which picture is the reference picture of the input picture. Therefore, the reference picture determination unit 152c specifies the reference picture of the input picture from the slice header of the RBSP and searches the frame memory 136 for the reference picture to determine whether or not the reference picture of the input picture has been encoded. To do.

参照ピクチャが復号化されている場合(ステップS4:YES)、参照ピクチャ判別手段152cは、その入力ピクチャを復号化するピクチャとして選択し、出力手段151から出力させる(ステップS6)。一方、参照ピクチャが復号化されていない場合(ステップS4:NO)、参照ピクチャ判別手段152cは、入力ピクチャを復号化するピクチャとして選択しない、すなわち破棄するピクチャとして選択し、出力手段151から出力させない(ステップS5)。参照するピクチャが破棄されていると、入力ピクチャを十分な品質で復号化することができない上に、演算負荷が大きくなる。このため、本実施の形態では、参照するピクチャが破棄されている場合には、入力ピクチャを破棄することにより、端末装置2の演算負荷を低減させることができる。   When the reference picture is decoded (step S4: YES), the reference picture determination unit 152c selects the input picture as a picture to be decoded and outputs it from the output unit 151 (step S6). On the other hand, when the reference picture is not decoded (step S4: NO), the reference picture determination unit 152c does not select the input picture as a picture to be decoded, that is, selects it as a picture to be discarded and does not output it from the output unit 151. (Step S5). If the picture to be referenced is discarded, the input picture cannot be decoded with sufficient quality, and the computation load increases. For this reason, in this Embodiment, when the picture to refer is discarded, the calculation load of the terminal device 2 can be reduced by discarding an input picture.

例えば、図8に示す符号dのピクチャは、直前のピクチャが復号化されていないが、参照する符号aのピクチャが復号化されている。したがって、参照ピクチャ判別手段152cは、符号dのピクチャを復号化するピクチャとして選択し、出力手段151から出力させる。一方、符号cのピクチャは、直前のピクチャが復号化されていないとともに、参照するピクチャである符号bのピクチャが復号化されていない。したがって、参照ピクチャ判別手段152cは、符号cのピクチャを破棄するピクチャとして選択し、出力手段151から出力させない。これにより、図9に示すように、符号dのピクチャに基づくフレームが生成される一方、符号cのピクチャに基づくフレームが生成されない。   For example, in the picture with the code d shown in FIG. 8, the previous picture is not decoded, but the picture with the code a to be referenced is decoded. Therefore, the reference picture determination unit 152c selects the picture with the code d as a picture to be decoded and outputs it from the output unit 151. On the other hand, as for the picture of code c, the picture immediately before is not decoded and the picture of code b which is a picture to be referenced is not decoded. Therefore, the reference picture determination unit 152 c selects the picture with the code c as a picture to be discarded and does not output it from the output unit 151. As a result, as shown in FIG. 9, a frame based on the picture with the code d is generated, whereas a frame based on the picture with the code c is not generated.

このような選択動作によって選択部150から出力されたピクチャは、復号化部131に入力されて復号化手段12の各構成要素によって復号化されることにより、最終的にフレームとして出力される。ここで、図8に示す復号化データに対する選択部150による選択結果をまとめると、図9および以下に示す通りとなる。   The picture output from the selection unit 150 by such a selection operation is input to the decoding unit 131 and is decoded by each component of the decoding unit 12 to be finally output as a frame. Here, the selection results by the selection unit 150 for the decoded data shown in FIG. 8 are summarized as shown in FIG. 9 and the following.

符号aのピクチャは、ステップS2によりIピクチャであると判別されるので、出力手段151から出力され、復号化される。
符号bのピクチャは、ステップS3により直前のピクチャが復号化されていると判別されるので、出力手段151から出力されない、すなわち破棄される。
符号cのピクチャは、ステップS4により参照しているピクチャが復号化されていないと判別されるので、出力手段151から出力されない、すなわち破棄される。
符号dのピクチャは、ステップS4により参照しているピクチャが復号化されていると判別されるので、出力手段151から出力され、復号化される。
符号eのピクチャは、ステップS3により直前のピクチャが復号化されていると判別されるので、出力手段151から出力されない、すなわち破棄される。
符号fのピクチャは、ステップS4により参照しているピクチャが復号化されていると判別されるので、出力手段151から出力され、復号化される。
符号gのピクチャは、ステップS2によりIピクチャであると判別されるので、復号化される。
符号hのピクチャは、ステップS3により直前のピクチャが復号化されていると判別されるので、出力手段151から出力されない、すなわち破棄される。
符号iのピクチャは、ステップS4により参照しているピクチャが復号化されていると判別されるので、出力手段151から出力され、復号化される。
符号jのピクチャは、ステップS3により直前のピクチャが復号化されていると判別されるので、出力手段151から出力されない、すなわち破棄される。
符号kのピクチャは、ステップS4により参照しているピクチャが復号化されていると判別されるので、出力手段151から出力され、復号化される。
符号lのピクチャは、ステップS3により直前のピクチャが復号化されていると判別されるので、出力手段151から出力されない、すなわち破棄される。
Since the picture with the code a is determined to be an I picture in step S2, it is output from the output means 151 and decoded.
Since it is determined in step S3 that the previous picture has been decoded, the picture with the code b is not output from the output means 151, that is, discarded.
The picture with the code c is not output from the output means 151 because it is determined that the picture referred to in step S4 has not been decoded, that is, discarded.
Since it is determined that the picture referred to in step S4 has been decoded, the picture with the code d is output from the output unit 151 and decoded.
Since it is determined in step S3 that the previous picture has been decoded, the picture with the code e is not output from the output means 151, that is, discarded.
Since it is determined in step S4 that the picture referred to by the code f is decoded, it is output from the output means 151 and decoded.
Since the picture with the code g is determined to be an I picture in step S2, it is decoded.
Since it is determined in step S3 that the previous picture has been decoded, the picture with the code h is not output from the output means 151, that is, discarded.
Since it is determined that the picture referred to in step S4 has been decoded, the picture with the code i is output from the output means 151 and decoded.
Since it is determined in step S3 that the immediately preceding picture has been decoded, the picture with the code j is not output from the output means 151, that is, discarded.
Since it is determined that the picture referred to in step S4 has been decoded, the picture with the code k is output from the output unit 151 and decoded.
Since it is determined in step S3 that the previous picture has been decoded, the picture with the code l is not output from the output means 151, that is, discarded.

このように、符号a〜lで示すピクチャから構成される符号化データに対して選択部150により選択動作が行われると、符号a,d,f,g,i,kのピクチャのみが復号化される。これにより、復号化されるピクチャの数量が減少するので、端末装置2の演算負荷を低減させることができる。また、Iピクチャのみならず、符号d,f,i,kのPピクチャも復号化されるため、Iピクチャのみを復号化する場合よりも画質を向上させることができる。さらに、参照するピクチャが存在しない符号cが復号化されないので、画質の低下を防ぐことができるとともに、演算負荷を低減させることができる。   As described above, when the selection unit 150 performs the selection operation on the encoded data including the pictures indicated by the codes a to l, only the pictures of the codes a, d, f, g, i, and k are decoded. Is done. As a result, the number of pictures to be decoded is reduced, so that the calculation load on the terminal device 2 can be reduced. Further, since not only the I picture but also the P pictures of the codes d, f, i, and k are decoded, the image quality can be improved as compared with the case of decoding only the I picture. Further, since the code c having no picture to be referred to is not decoded, it is possible to prevent the image quality from being deteriorated and to reduce the calculation load.

図9に示すような選択部150による選択結果が出力され、選択されたピクチャに対して復号化手段12により復号化が行われると、復号化手段12のフレームメモリ136には、図10(a)〜(f)に示すようにフレームが格納される。なお、図10において、符号gのフレームに対応するピクチャはIDR(Instantaneous Decoding Refresh)ピクチャであるものとする。   When the selection result by the selection unit 150 as shown in FIG. 9 is output and the selected picture is decoded by the decoding means 12, the frame memory 136 of the decoding means 12 stores the result shown in FIG. ) To (f), the frame is stored. In FIG. 10, it is assumed that a picture corresponding to a frame of code g is an IDR (Instantaneous Decoding Refresh) picture.

すなわち、図10(a)〜(c)に示すように、選択部150により符号a,d,fのピクチャが復号化するピクチャとして選択されると、復号化手段12の他の構成要素により各ピクチャが順次復号化され、対応するフレームがフレームメモリ136に格納される。   That is, as shown in FIGS. 10A to 10C, when the picture of codes a, d, and f is selected as a picture to be decoded by the selection unit 150, each of the other components of the decoding means 12 Pictures are sequentially decoded and corresponding frames are stored in the frame memory 136.

しかしながら、選択部150により符号gのピクチャが復号化するピクチャとして選択されると、その符号gのピクチャはIDR(Instantaneous Decoding Refresh)ピクチャであるため、フレームメモリ136から符号a,d,fのフレームがクリアされ、符号gのフレームのみが格納される。   However, when the picture with the code g is selected as a picture to be decoded by the selection unit 150, the picture with the code g is an IDR (Instantaneous Decoding Refresh) picture, and therefore, the frames with the codes a, d, and f from the frame memory 136. Is cleared, and only the frame of code g is stored.

次いで、選択部150により符号g,iのピクチャが復号化するピクチャとして選択されると、復号化手段12の他の構成要素により順次復号化され、対応するフレームが符号gのフレームとともにフレームメモリ136に格納される。   Next, when the picture of codes g and i is selected as a picture to be decoded by the selection unit 150, it is sequentially decoded by the other components of the decoding means 12, and the corresponding frame is framed together with the frame of the code g. Stored in

このように、選択部150により選択されたピクチャのみが復号化されるので、フレームメモリ136に格納するピクチャの数量を減らすことができる。これにより、復号化手段12、特にデブロッキングフィルタ135や動き補償予測部137の動作を低減させることが可能となり、結果として、端末装置2の演算負荷を低減させることができる。また、このようなフレームメモリ136を参照することにより、判別手段152の所定ピクチャ判別手段152bおよび参照ピクチャ判別手段152cの動作を実現することができる。   In this way, since only the picture selected by the selection unit 150 is decoded, the number of pictures stored in the frame memory 136 can be reduced. Thereby, it becomes possible to reduce the operation of the decoding means 12, particularly the deblocking filter 135 and the motion compensation prediction unit 137, and as a result, the calculation load of the terminal device 2 can be reduced. Further, by referring to such a frame memory 136, the operations of the predetermined picture determination unit 152b and the reference picture determination unit 152c of the determination unit 152 can be realized.

以上説明したように、本実施の形態によれば、入力されたピクチャがIピクチャであるか否かを判別し、当該ピクチャがIピクチャではない場合、当該ピクチャより先に入力された所定の他のピクチャが復号化されているか否かを判別し、当該他のピクチャが復号化されていれば当該ピクチャを出力しないことにより、復号化に伴う演算負荷を低減させることができる。また、Iピクチャ以外のピクチャを復号化することが可能となるので、結果として、画質を向上させることができる。   As described above, according to the present embodiment, it is determined whether or not an input picture is an I picture. If the picture is not an I picture, a predetermined other input before the picture is determined. It can be determined whether or not the current picture is decoded, and if the other picture is decoded, the picture is not output, thereby reducing the computation load associated with the decoding. In addition, since it is possible to decode pictures other than the I picture, the image quality can be improved as a result.

TV会議システムのように同時に複数の端末装置2と符号化データのやりとりを行う場合、復号化手段12は、通信相手となる端末装置2毎に設けられる。復号化手段12は、CPUがプログラム8bを読み込んで実行することにより実現されるものなので、相手先の端末装置2の数量が増えるのに伴って復号化手段12の数量も増えるため、CPUの演算負荷も増大することとなる。このため、本実施の形態では、受信した符号化データの中から選択部150により所定のピクチャのみを選択的に復号化させることにより、各復号化手段12の処理を減らすことが可能となり、結果として、端末装置2のCPUの演算負荷を低減させることができる。   When the encoded data is exchanged with a plurality of terminal devices 2 at the same time as in the TV conference system, the decoding means 12 is provided for each terminal device 2 that is a communication partner. Since the decryption means 12 is realized by the CPU reading and executing the program 8b, the amount of the decryption means 12 increases as the number of the counterpart terminal device 2 increases. The load will also increase. Therefore, in the present embodiment, it is possible to reduce the processing of each decoding unit 12 by selectively decoding only a predetermined picture from the received encoded data by the selection unit 150. As a result, the calculation load on the CPU of the terminal device 2 can be reduced.

なお、本実施の形態において、例えば図8,図9等に示したように符号化データがIピクチャとPピクチャとから構成されるものとして説明したが、符号化データがIピクチャ、PピクチャおよびBピクチャから構成されていてもよいことは言うまでもない。この場合、例えば、Bピクチャについても先に入力された所定のピクチャおよび参照ピクチャが復号化されているか否かに基づいて復号化するか否かを決定することにより、端末装置2の演算負荷を低減させるとともに、動画像の画質を向上させることができる。   In the present embodiment, for example, as illustrated in FIGS. 8 and 9, the encoded data is described as being composed of an I picture and a P picture, but the encoded data is an I picture, a P picture, and Needless to say, it may be composed of B pictures. In this case, for example, by determining whether or not to decode a B picture based on whether or not a predetermined picture and a reference picture previously input are decoded, the calculation load of the terminal device 2 is reduced. In addition to the reduction, the image quality of the moving image can be improved.

また、本実施の形態において、所定ピクチャ判別手段152bは、入力ピクチャの直前のピクチャが復号化されているか否かを識別するようにしたが、識別するピクチャはこれに限定されず、例えば、所定数前のピクチャや所定数前から直前までのピクチャなど適宜自由に設定することができる。   In the present embodiment, the predetermined picture discriminating unit 152b identifies whether or not the picture immediately before the input picture has been decoded. However, the picture to be identified is not limited to this. It is possible to set freely as appropriate, such as a few previous pictures and a predetermined number of pictures before and immediately before.

また、図5において、符号xで示す表示面積が大きな動画像を再生する端末装置2からの符号データについては、全てのピクチャを復号化するようにしてもよい。復号化したフレームを大きな表示面積で表示させる符号化データと、復号化したフレームを小さな表示面積で表示させる符号化データとを、同じ条件で復号化するピクチャを選択すると、表示面積が大きい方が表示面積が小さい方よりも画質が低いと感じることがある。このため、表示面積が大きい符号化データについては、全てのピクチャを復号化させる。これにより、ユーザ体感品質を向上させることができる。このとき、表示面積が小さい符号化データについては、上述したような方法により、復号化させるピクチャを選択させる。これにより、端末装置2の演算負荷を低減させることができる。   In FIG. 5, all the pictures may be decoded for the code data from the terminal device 2 that reproduces a moving image having a large display area indicated by the symbol x. When a picture that decodes encoded data that displays a decoded frame with a large display area and encoded data that displays a decoded frame with a small display area under the same conditions is selected, the larger display area You may feel that the image quality is lower than the smaller display area. For this reason, for encoded data having a large display area, all pictures are decoded. Thereby, user experience quality can be improved. At this time, for encoded data having a small display area, a picture to be decoded is selected by the method described above. Thereby, the calculation load of the terminal device 2 can be reduced.

また、復号化手段12から出力されるフレームに基づく動画像は、符号化データのピクチャ全てを復号化した画像データに基づく動画像のフレームレートと同じフレームレートで再生されるようにしてもよい。この場合、破棄されたピクチャに対応するフレームには、このフレームの前に正常に再生されたフレームを表示し続けるようにすればよい。これにより、動画像を円滑に再生することができる。   Further, the moving image based on the frame output from the decoding unit 12 may be reproduced at the same frame rate as the moving image based on the image data obtained by decoding all the pictures of the encoded data. In this case, a frame that has been normally reproduced before this frame may be continuously displayed in the frame corresponding to the discarded picture. Thereby, a moving image can be smoothly reproduced.

本発明は、符号化されたデータを復号化する各種装置に適用することができる。   The present invention can be applied to various apparatuses that decode encoded data.

本発明に係るTV会議システムの構成を示す模式的に示す図である。It is a figure showing typically the composition of the TV conference system concerning the present invention. 端末装置の構成を示すブロック図である。It is a block diagram which shows the structure of a terminal device. 符号化手段の構成を示すブロック図である。It is a block diagram which shows the structure of an encoding means. 復号化手段の構成を示すブロック図である。It is a block diagram which shows the structure of a decoding means. TV会議システムにおける端末装置のモニタの表示例を示す図である。It is a figure which shows the example of a display of the monitor of the terminal device in a video conference system. NALユニットの構成を模式的に示す図である。It is a figure which shows the structure of a NAL unit typically. 復号化するピクチャの選択動作を示すフローチャートである。It is a flowchart which shows selection operation | movement of the picture to decode. 復号化データの一例を模式的に示す図である。It is a figure which shows an example of decoding data typically. 図8の復号化データに対する復号化するピクチャの選択動作の結果を模式的に示す図である。It is a figure which shows typically the result of the selection operation | movement of the picture to decode with respect to the decoding data of FIG. (a)〜(f)は、図9の選択結果により復号化されたピクチャを格納したフレームメモリの状態を模式的に示す図である。(A)-(f) is a figure which shows typically the state of the frame memory which stored the picture decoded by the selection result of FIG.

符号の説明Explanation of symbols

1…サーバ、2,2a,2b,2n…端末装置、3…通信回線、4…外部I/F部、5…操作入力部、6…画像処理部、6a…カメラ、6b…モニタ、7…音声処理部、7a…マイク、7b…スピーカ、8…記憶部、8a…制御データ、8b…プログラム、9…制御部、11…符号化手段、12…復号化手段、13…TV会議手段、111…差分演算部、112…DCT部、113…量子化部、114…逆量子化部、115…IDCT部、116…加算演算部、117…デブロッキングフィルタ、118…動き補償予測部、119…フレームメモリ、120…動き検出部、121…イントラ予測部、122…スイッチ、123…符号化データ出力部、131…復号化部、132…逆量子化部、133…IDCT部、134…加算演算部、135…デブロッキングフィルタ、136…フレームメモリ、137…動き補償予測部、138…イントラ予測部、139…スイッチ、150…選択部、151…出力手段、152…判別手段、152a…Iピクチャ判別手段、152b…所定ピクチャ判別手段、152c…参照ピクチャ判別手段。   DESCRIPTION OF SYMBOLS 1 ... Server, 2, 2a, 2b, 2n ... Terminal device, 3 ... Communication line, 4 ... External I / F part, 5 ... Operation input part, 6 ... Image processing part, 6a ... Camera, 6b ... Monitor, 7 ... Audio processing unit, 7a ... microphone, 7b ... speaker, 8 ... storage unit, 8a ... control data, 8b ... program, 9 ... control unit, 11 ... encoding means, 12 ... decoding means, 13 ... TV conference means, 111 ... difference calculation unit, 112 ... DCT unit, 113 ... quantization unit, 114 ... dequantization unit, 115 ... IDCT unit, 116 ... addition calculation unit, 117 ... deblocking filter, 118 ... motion compensation prediction unit, 119 ... frame Memory 120, motion detector 121, intra prediction unit 122, switch 123, encoded data output unit 131, decoding unit 132, inverse quantization unit 133, IDCT unit 134, addition operation unit 13 Deblocking filter, 136 Frame memory, 137 Motion compensation prediction unit, 138 Intra prediction unit, 139 Switch, 150 Selection unit, 151 Output unit, 152 Discrimination unit, 152a I picture discrimination unit, 152b ... predetermined picture discrimination means, 152c ... reference picture discrimination means.

Claims (4)

符号化された連続する複数のピクチャを含む符号化データを入力とし、入力されたピクチャがIピクチャであるか否かを判別し、当該ピクチャがIピクチャである場合には当該ピクチャを出力する一方、当該ピクチャがIピクチャではない場合、当該ピクチャより先に入力された所定の他のピクチャが復号化されているか否かを判別し、前記他のピクチャが復号化されていれば当該ピクチャを出力しない選択手段と、
この選択手段から出力されたピクチャを復号化する復号化手段と
を備え、
前記符号化データは、Iピクチャではないピクチャが、直前ではない、より時間的に遠いIピクチャまたは復号化されているIピクチャではないピクチャを参照する構造を有する
ことを特徴とする情報処理装置。
Encoded data including a plurality of consecutive encoded pictures is input, it is determined whether or not the input picture is an I picture, and if the picture is an I picture, the picture is output , the picture may not be the I picture, it is determined whether or not certain other picture input earlier than the picture is being decoded, it outputs the picture if the other picture is decoded No selection means,
E Bei and decoding means for decoding the outputted picture from the selection means,
2. The information processing apparatus according to claim 1, wherein the encoded data has a structure in which a picture that is not an I picture refers to a picture that is not immediately before and that is farther in time or a picture that is not a decoded I picture .
符号化された連続する複数のピクチャを含む符号化データを入力とし、入力されたピクチャがIピクチャであるか否かを判別し、当該ピクチャがIピクチャである場合には当該ピクチャを出力する一方、当該ピクチャがIピクチャではない場合、当該ピクチャより先に入力された所定の他のピクチャが復号化されているか否かを判別し、前記他のピクチャが復号化されていれば当該ピクチャを出力せず、前記他のピクチャが復号化されていなければ、当該ピクチャが参照すべき参照ピクチャが復号化されているか否かを判別し、前記参照ピクチャが復号化されていれば当該ピクチャを出力し、前記参照ピクチャが復号化されていなければ当該ピクチャを出力しない選択手段と、
この選択手段から出力されたピクチャを復号化する復号化手段と
を備え
前記符号化データは、Iピクチャではないピクチャが、直前ではない、より時間的に遠いIピクチャまたは復号化されているIピクチャではないピクチャを参照する構造を有する
ことを特徴とする情報処理装置。
Encoded data including a plurality of consecutive encoded pictures is input, it is determined whether or not the input picture is an I picture, and if the picture is an I picture, the picture is output If the picture is not an I picture, it is determined whether or not a predetermined other picture input before the picture has been decoded. If the other picture has been decoded, the picture is output. If the other picture is not decoded, it is determined whether or not a reference picture to be referenced by the picture is decoded. If the reference picture is decoded, the picture is output. Selection means for not outputting the picture unless the reference picture is decoded;
Decoding means for decoding the picture output from the selection means ,
2. The information processing apparatus according to claim 1, wherein the encoded data has a structure in which a picture that is not an I picture refers to a picture that is not immediately before and that is farther in time or a picture that is not a decoded I picture .
符号化された連続する複数のピクチャを含む符号化データを入力とし、入力されたピクチャがIピクチャであるか否かを判別し、当該ピクチャがIピクチャである場合には当該ピクチャを出力する一方、当該ピクチャがIピクチャではない場合、当該ピクチャより先に入力された所定の他のピクチャが復号化されているか否かを判別し、前記他のピクチャが復号化されていれば当該ピクチャを出力しない選択ステップと、
この選択ステップにより出力されたピクチャを復号化する復号化ステップと
を有し、
前記符号化データは、Iピクチャではないピクチャが、直前ではない、より時間的に遠いIピクチャまたは復号化されているIピクチャではないピクチャを参照する構造を有する
ことを特徴とする情報処理方法。
Encoded data including a plurality of consecutive encoded pictures is input, it is determined whether or not the input picture is an I picture, and if the picture is an I picture, the picture is output , the picture may not be the I picture, it is determined whether or not certain other picture input earlier than the picture is being decoded, it outputs the picture if the other picture is decoded Not a selection step and
Possess a decoding step of decoding the outputted picture by the selection step,
The information processing method characterized in that the encoded data has a structure in which a picture that is not an I picture refers to an I picture that is not immediately before, is farther in time, or is not a decoded I picture .
符号化された連続する複数のピクチャを含む符号化データを入力とし、入力されたピクチャがIピクチャであるか否かを判別し、当該ピクチャがIピクチャである場合には当該ピクチャを出力する一方、当該ピクチャがIピクチャではない場合、当該ピクチャより先に入力された所定の他のピクチャが復号化されているか否かを判別し、前記他のピクチャが復号化されていれば当該ピクチャを出力せず、前記他のピクチャが復号化されていなければ、当該ピクチャが参照すべき参照ピクチャが復号化されているか否かを判別し、前記参照ピクチャが復号化されていれば当該ピクチャを出力し、前記参照ピクチャが復号化されていなければ当該ピクチャを出力しない選択ステップと、
この選択ステップにより出力されたピクチャを復号化する復号化ステップと
を有し、
前記符号化データは、Iピクチャではないピクチャが、直前ではない、より時間的に遠いIピクチャまたは復号化されているIピクチャではないピクチャを参照する構造を有する
ことを特徴とする情報処理方法。
Encoded data including a plurality of consecutive encoded pictures is input, it is determined whether or not the input picture is an I picture, and if the picture is an I picture, the picture is output If the picture is not an I picture, it is determined whether or not a predetermined other picture input before the picture has been decoded. If the other picture has been decoded, the picture is output. If the other picture is not decoded, it is determined whether or not a reference picture to be referenced by the picture is decoded. If the reference picture is decoded, the picture is output. A selection step of not outputting the picture unless the reference picture is decoded;
Possess a decoding step of decoding the outputted picture by the selection step,
The information processing method characterized in that the encoded data has a structure in which a picture that is not an I picture refers to an I picture that is not immediately before, is farther in time, or is not a decoded I picture .
JP2007029460A 2007-02-08 2007-02-08 Information processing apparatus and information processing method Active JP4735558B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007029460A JP4735558B2 (en) 2007-02-08 2007-02-08 Information processing apparatus and information processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007029460A JP4735558B2 (en) 2007-02-08 2007-02-08 Information processing apparatus and information processing method

Publications (2)

Publication Number Publication Date
JP2008199109A JP2008199109A (en) 2008-08-28
JP4735558B2 true JP4735558B2 (en) 2011-07-27

Family

ID=39757697

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007029460A Active JP4735558B2 (en) 2007-02-08 2007-02-08 Information processing apparatus and information processing method

Country Status (1)

Country Link
JP (1) JP4735558B2 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002218472A (en) * 2001-01-23 2002-08-02 Victor Co Of Japan Ltd Device and method for decoding variable image rate
JP2002262295A (en) * 2001-02-28 2002-09-13 Victor Co Of Japan Ltd Moving image decoder and moving image coder

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002218472A (en) * 2001-01-23 2002-08-02 Victor Co Of Japan Ltd Device and method for decoding variable image rate
JP2002262295A (en) * 2001-02-28 2002-09-13 Victor Co Of Japan Ltd Moving image decoder and moving image coder

Also Published As

Publication number Publication date
JP2008199109A (en) 2008-08-28

Similar Documents

Publication Publication Date Title
JP4755093B2 (en) Image encoding method and image encoding apparatus
JP4014263B2 (en) Video signal conversion apparatus and video signal conversion method
JP4494789B2 (en) Coding dynamic filters
JP4405587B1 (en) Decryption system
US9414086B2 (en) Partial frame utilization in video codecs
US20020122491A1 (en) Video decoder architecture and method for using same
JP5232114B2 (en) Image coding apparatus and image coding method
US12015763B2 (en) Video encoding method, video decoding method, and related apparatuses
KR20060027779A (en) Method and apparatus for encoding/decoding video signal using temporal and spatial correlations between macro blocks
JP5137687B2 (en) Decoding device, decoding method, and program
JP2006279917A (en) Dynamic image encoding device, dynamic image decoding device and dynamic image transmitting system
JP4284265B2 (en) Moving picture coding apparatus, moving picture coding method, moving picture decoding apparatus, and moving picture decoding method
JP4735558B2 (en) Information processing apparatus and information processing method
US8312499B2 (en) Tunneling information in compressed audio and/or video bit streams
JP4909592B2 (en) Moving picture reproduction method, apparatus, and program
JP2005341347A (en) Multipoint connection device and method
KR20060059773A (en) Method and apparatus for encoding/decoding video signal using vectors of pictures in a base layer
JP2008227937A (en) Information processor and information processing method
JP2008211294A (en) Encoding device and encoding method
Tan et al. A unified transcoding approach to fast forward and reverse playback of compressed video
JPH07336681A (en) Picture converting device
US20060072675A1 (en) Method for encoding and decoding video signals
JP2002118850A (en) Moving picture coding method, moving picture decoding method, moving picture coding apparatus and moving picture decoding apparatus

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091228

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110104

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110303

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110329

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110411

R150 Certificate of patent or registration of utility model

Ref document number: 4735558

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140513

Year of fee payment: 3