JP4508029B2 - Encoding device for moving picture information - Google Patents

Encoding device for moving picture information Download PDF

Info

Publication number
JP4508029B2
JP4508029B2 JP2005225428A JP2005225428A JP4508029B2 JP 4508029 B2 JP4508029 B2 JP 4508029B2 JP 2005225428 A JP2005225428 A JP 2005225428A JP 2005225428 A JP2005225428 A JP 2005225428A JP 4508029 B2 JP4508029 B2 JP 4508029B2
Authority
JP
Japan
Prior art keywords
encoding
change
image information
moving image
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005225428A
Other languages
Japanese (ja)
Other versions
JP2006020354A (en
Inventor
美樹男 笹木
健詞 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Corp
Original Assignee
Denso Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Corp filed Critical Denso Corp
Priority to JP2005225428A priority Critical patent/JP4508029B2/en
Publication of JP2006020354A publication Critical patent/JP2006020354A/en
Application granted granted Critical
Publication of JP4508029B2 publication Critical patent/JP4508029B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、動画像情報を所定の伝送容量の範囲内で伝送可能となるように圧縮符号化する場合において動画像の動きを損なうことなく有効な符号化を行なうことができるようにした動画像情報の符号化装置に関する。   The present invention provides a moving image in which effective encoding can be performed without impairing the motion of the moving image when the moving image information is compressed and encoded so as to be transmitted within a predetermined transmission capacity. The present invention relates to an information encoding apparatus.

近年、情報通信端末のマルチメディア化が急速に進んでおり、電話においてもディジタルデータ伝送に基づく様々な付加価値を生み出していくことが、今後のビジネス展開において必須な条件となってきている。特に、自動車電話やPHS(Personal Handy-phone System )においては既に従来の音声,文字情報のみならず、静止画像や動画像を伝送することが本格的に検討されつつあり、電話機のマルチメディア化は近い将来に当たり前のこととなることが予想される。   In recent years, the use of multimedia in information communication terminals has been rapidly progressing, and it has become an indispensable condition for future business development to produce various added values based on digital data transmission in telephones. In particular, in car phones and PHS (Personal Handy-phone System), transmission of still images and moving images as well as conventional voice and text information has already been studied in earnest. It is expected to be natural in the near future.

しかし、画像を伝送する場合に、何等処置を行わずそのまま伝送するのでは、約166Mbps(mega bit per second )に相当する膨大なTV映像のデータ量であるから、自動車電話(9.6kbps)やPHS(32kbps)や既存の電話回線の伝送レート(10〜30kbps程度)程度の伝送容量では1フレームの画像データを送信するのに多大な時間を要してしまい、動画像の伝送には不適切である。   However, when an image is transmitted, if it is transmitted as it is without taking any measures, the amount of TV video data corresponding to about 166 Mbps (mega bit per second) is obtained, so a car phone (9.6 kbps) or If the transmission capacity is about PHS (32 kbps) or the transmission rate of an existing telephone line (about 10 to 30 kbps), it takes a long time to transmit one frame of image data, which is inappropriate for transmission of moving images. It is.

このようなことに対応して、従来のTV会議やビデオCDに用いられている動画像圧縮技術が要求されるが、現行のTV会議用規格であるITU−T/H.261では、64kbps〜2Mbps程度、ISO/MPEG1では1.5Mbps程度のものを対象としており、ここで対象としている64kbps以下の超低レート伝送には適用することができないものである。   Corresponding to such a situation, a moving picture compression technique used for a conventional TV conference and a video CD is required, but ITU-T / H. H.261 targets about 64 kbps to 2 Mbps, and ISO / MPEG1 targets about 1.5 Mbps, and cannot be applied to the ultra-low rate transmission of 64 kbps or less.

一方、現在ITU−Tで審議されているH.263は、64Kbps以下の伝送レートを対象としているが、この場合には有線系の伝送を対象とするものであり、移動体通信の無線系で発生するデータ伝送誤りのレベル(10−2〜10−3程度)に対する対策がなされていないものである。また、これらの規格におけるエンコーダは動き補償技術を用いるため、演算量が増大することになり、低コスト化の実現は困難なものである。   On the other hand, H.B. H.263 targets a transmission rate of 64 Kbps or less, but in this case, it targets a wired transmission, and a level of data transmission error (10-2 to 10) occurring in a mobile communication radio system. -3) is not taken. In addition, since the encoders in these standards use motion compensation technology, the amount of calculation increases, and it is difficult to realize cost reduction.

さらには、上述のような伝送容量の範囲内であっても、画像情報のみならず、同時に音声情報についても送信する場合には、画像情報の伝送容量についてはさらに制約を受けることになる。また、このような音声情報は、発生量の変動が大きくなることが予想されるので、伝送容量を割り当てる場合においても弾力的に変動させて有効に利用する必要がある。そして、音声情報の伝送容量が変動することは画像情報の伝送容量についてもこれに追随して変動することになるが、そのような状況の下でいかに動画像情報を有効に符号化して伝送するかということが課題となってくる。   Furthermore, even within the range of the transmission capacity as described above, when transmitting not only image information but also audio information at the same time, the transmission capacity of the image information is further restricted. In addition, since such voice information is expected to have a large fluctuation in the amount of generation, it is necessary to use it effectively by changing it flexibly even when a transmission capacity is allocated. When the transmission capacity of audio information fluctuates, the transmission capacity of image information also changes accordingly. Under such circumstances, how to effectively encode and transmit moving picture information It becomes a problem.

本発明は、上記事情に鑑みてなされたもので、その目的は、伝送容量が制約されている範囲内で使用者にとって必要と思われる画像情報を効率的に選択符号化して良質な動画像情報を提供できるようにする画像情報の符号化装置を提供することにある。   The present invention has been made in view of the above circumstances, and an object of the present invention is to efficiently select and encode image information considered necessary for the user within a range in which the transmission capacity is limited, and to obtain high quality moving image information. It is an object of the present invention to provide an image information encoding apparatus that can provide the image data.

請求項1の発明では、変化ブロック検出手段により、そのフレーム内の複数のブロックについてそれらの画像データが前フレームの該当するブロックの画像データとの変化量が所定レベル以上となる変化ブロックを検出し、その検出された変化ブロックについてのみ符号化処理手段により符号化を行なうので、限られた伝送容量の範囲内で変化が生じている領域についての情報を有効に伝送することができる。   According to the first aspect of the present invention, the change block detection means detects a change block in which the change amount of the image data of the plurality of blocks in the frame with the image data of the corresponding block in the previous frame is equal to or higher than a predetermined level. Since only the detected change block is encoded by the encoding processing means, information about the region where the change occurs within the limited transmission capacity can be transmitted effectively.

さらに、符号化条件設定手段を設けているので、上述の変化ブロックについての符号化を行なう際に、変化ブロックの発生量や変化量等のデータに応じて符号化処理の条件を伝送容量の範囲内で変更して有用な情報を取捨選択してより良質な動画像を伝送することができるようになる。また、符号化条件設定手段は、変化ブロック判定しきい値、量子化スケールのしきい値、画面全体の変化判定ブロック数の推奨されるしきい値の組み合わせで段階的に示される符号化のレベルを、前記動き量、色変化量および情報発生量のレベル判定により総合判定レベルを算出し、算出された前記総合判定レベルと前記バッファ量の余裕度との組み合わせから求め、フレーム内の領域に応じているので、精度の高い動画像を伝送すべき対象となる特定の領域をあらかじめ設定しておくことにより、対象となる領域のみを効率的な符号化処理を行なうことができるようになる。そして、符号化条件設定手段は、前記符号化のレベルを異ならせる領域を設定可能に構成されているので、上述同様に効率的な符号化処理を行なうことができるようになる。 Furthermore, since the encoding condition setting means is provided, when encoding the above-described change block, the encoding process condition is determined according to the data such as the generation amount and change amount of the change block within the transmission capacity range. It is possible to transmit a higher quality moving image by selecting useful information by changing the information in the image. In addition, the encoding condition setting means includes a change block determination threshold value, a quantization scale threshold value, and an encoding level indicated in a stepwise manner by a combination of recommended threshold values for the number of change determination blocks for the entire screen. Is determined from a combination of the calculated overall determination level and the buffer amount margin based on the level determination of the motion amount, the color change amount, and the information generation amount, and is determined according to the region in the frame. Therefore, by setting in advance a specific region that is a target for transmitting a moving image with high accuracy, it becomes possible to perform efficient coding processing only on the target region. Since the encoding condition setting means is configured to be able to set areas for different levels of encoding, it is possible to perform efficient encoding processing as described above.

請求項の発明では、符号化条件設定手段は、領域を設定するためのデータをあらかじめ決められているフォーマットにより設定可能であるので、対応する領域を指定する場合にそのフォーマットでコードを付加して伝送することにより情報量を増大させることなく符号化処理を行なうことができるようになる。 In the invention of claim 2 , since the encoding condition setting means can set the data for setting the area in a predetermined format, a code is added in that format when the corresponding area is specified. Thus, the encoding process can be performed without increasing the amount of information.

請求項3の発明では、符号化条件設定手段により、領域を複数設定したときには、それぞれの領域に対して符号化処理をする際に情報量の割り当てについて重要度の高さに応じた優先順位を設定することができるので、情報量の発生の度合いに応じて符号化レベルを優先順位の高いものから順に優先的に行なうことができ、使用者の要求に応じた効率的な符号化処理を行なうことができるようになる。 In the invention of claim 3, the encoding condition setting unit, when setting a plurality of regions, a priority corresponding to the height of importance for allocation of the amount of information when the encoding processing for each region Since it can be set, the encoding level can be preferentially performed in descending order of priority according to the degree of occurrence of the information amount, and efficient encoding processing according to the user's request is performed. Will be able to.

請求項の発明では、符号化条件設定手段により、領域を複数設定したときにそれぞれの領域に対して異なる符号化条件を設定可能に設けられているので、画面の状態に応じて必要となる情報を効率的に符号化処理することができるようになる。 In the invention of claim 4, the encoding condition setting means, so is provided to be set different encoding conditions for each region when a plurality sets an area, required in accordance with the state of the screen Information can be efficiently encoded.

請求項の発明では、符号化条件設定手段により、フレーム全体の画像データの変化量が減少したときに、変化ブロック検出手段による変化ブロックの検出に際して用いる判定のしきい値を低くするように変更設定するので、変化ブロックの個数が多いときや情報量が多いときにしきい値を高くして変化ブロックの検出個数を低下させるように制御していた場合などにおいては、変化が少なくなってきた状態で余裕度が大きくなったことを条件として、その小さな変化に追随させて変化ブロックの検出を行なうことができるようになる。これにより、例えば、フレーム中で動くべき領域の一部分が張り付いたような状況が発生している場合でもこれを解消させて自然な画面を提供することができるようになる。 In the invention of claim 5 , when the change amount of the image data of the entire frame is reduced by the encoding condition setting means, the determination threshold value used when detecting the change block by the change block detection means is changed to be low. Because it is set, when the number of changed blocks is large or when the amount of information is large, the threshold is increased to control the number of detected changed blocks to be reduced. On the condition that the margin is increased, the change block can be detected following the small change. As a result, for example, even when a situation occurs in which a part of a region to be moved in the frame is stuck, this can be resolved and a natural screen can be provided.

請求項の発明では、符号化条件設定手段により、フレーム全体の画像データの変化量が減少したときに、前記変化ブロック検出手段による変化ブロックの符号化に際して用いる量子化スケールを低くするように変更設定するので、変化ブロックの個数が多いときや情報量が多いときにしきい値を高くして変化ブロックの検出個数を低下させるように制御していた場合などにおいては、変化が少なくなってきた状態で余裕度が大きくなったことを条件として、小さな動きに対してもこれに追随させるように量子化スケールを細かく設定することができるようになる。これにより、例えば、フレーム中で動くべき領域の一部分が張り付いたような状況が発生している場合でもこれを解消させて自然な画面を提供することができるようになる。 In the invention of claim 9 , when the change amount of the image data of the entire frame is reduced by the encoding condition setting means, the quantization scale used for encoding the change block by the change block detection means is changed to be low. Because it is set, when the number of changed blocks is large or when the amount of information is large, the threshold is increased to control the number of detected changed blocks to be reduced. On the condition that the margin is increased, the quantization scale can be set finely so as to follow even a small movement. As a result, for example, even when a situation occurs in which a part of a region to be moved in the frame is stuck, this can be resolved and a natural screen can be provided.

請求項10,11および12の発明では、符号化条件設定手段により、上述の場合にフレーム内の画像データの不変領域や画面全体あるいは特定領域に対して、符号化処理条件の変更設定、あるいは判定のしきい値を低くする変更設定、もしくは量子化スケールを低くする変更設定を行なうので、このような余裕度の高い状態の期間を利用して不変領域の更新や画面全体の動きの向上あるいは特定領域の動きを向上させることができるようになる。 In the inventions of claims 10, 11 and 12 , the encoding condition setting means changes or determines the encoding processing condition for the invariant area of the image data in the frame, the entire screen or the specific area in the above case. Change settings that lower the threshold value or change settings that lower the quantization scale, so use this period with a high margin to update the invariant area, improve or identify the movement of the entire screen. The movement of the area can be improved.

請求項13の発明では、符号化条件設定手段により、フレームにおける画像情報の発生量と送信可能な伝送容量との関係から必要に応じてフレームサイズを変更設定するので、情報の発生量に応じた適切なフレームサイズで符号化処理を行なうことができるようになる。 In the thirteenth aspect of the invention, the encoding condition setting means changes and sets the frame size as necessary from the relationship between the amount of image information generated in a frame and the transmission capacity that can be transmitted. Encoding processing can be performed with an appropriate frame size.

請求項14の発明では、符号化処理手段により、フレームサイズを縮小する側に変更設定するときには、変更前のフレームの画像データを変更後のフレームの画像データに対応するようにサンプリングすることにより適合させるので、フレームサイズの変更時点で新たなフレーム内符号化処理を行なう必要がなく、情報発生量を増大させることなく変更をすることができるようになる。 According to the fourteenth aspect of the present invention, when the frame size is reduced and set by the encoding processing means, the image data of the frame before the change is sampled so as to correspond to the image data of the frame after the change. Therefore, it is not necessary to perform a new intra-frame encoding process at the time of changing the frame size, and the change can be made without increasing the information generation amount.

請求項15の発明では、符号化処理手段により、フレームサイズを拡大する側に変更設定するときには、変更前のフレームの画像データを変更後のフレームの画像データに対応させたときに補間フィルタを利用して画像データのない画素について隣接する画素の画像データから補間して画像データを生成するので、フレームサイズの変更時点で新たなフレーム内符号化処理を行なう必要がなく、情報発生量を増大させることなく変更をすることができるようになる。 According to the fifteenth aspect of the present invention, when the encoding processing means changes the frame size to the enlargement side, the interpolation filter is used when the image data of the frame before the change corresponds to the image data of the frame after the change. Since the image data is generated by interpolating the image data of the adjacent pixels with respect to the pixel having no image data, it is not necessary to perform a new intra-frame encoding process at the time of changing the frame size, and the amount of information generation is increased. You will be able to make changes without

請求項16の発明では、符号化条件設定手段により、外部から符号化条件を変更設定する入力に対してこれを無効化させるプロテクト機能を設定できるので、使用者がプロテクト機能を設定することにより、使用者が望まない符号化処理のモードを拒否することができ、外部から必要以上の精度の符号化を行なわせることを阻止してプライバシーの保護を図ることができるようになる。 In the invention of claim 16 , since the encoding function setting means can set a protection function for invalidating the input for changing the encoding condition from the outside, the user can set the protection function by setting the protection function. It is possible to reject an encoding process mode that is not desired by the user, and to prevent encoding from being performed more than necessary from the outside, thereby protecting privacy.

請求項17の発明では、符号化条件設定手段には、フレームを形成している被写体あるいは用途等に応じてその付帯状況をあらかじめ決められたコードで設定するモード条件が記憶されており、符号化処理の際にモード条件を使用して符号化を行なったときにはその伝送信号にモード条件を指定するコードを付加するので、付帯状況を設定することを簡単に行なえると共に、モード条件設定のための符号化処理の情報量を削減することができるようになる。 In the invention of claim 17 , the encoding condition setting means stores a mode condition for setting the incidental situation with a predetermined code in accordance with the subject forming the frame or the application. When encoding is performed using the mode condition during processing, a code for specifying the mode condition is added to the transmission signal, so that it is possible to easily set the incidental status and to set the mode condition. The amount of information for the encoding process can be reduced.

請求項1819または0の発明では、音声情報処理手段により音声情報を符号化して画像情報と同時に送信し、このとき、画像情報については、符号化処理手段により、画像情報を符号化して伝送する際の画像伝送容量を、全体の伝送容量から音声情報の伝送に割り当てられる音声伝送容量を差し引いた分としてその範囲内で符号化処理を行なうので、音声情報の伝送を画像情報のレベルによって妨げられることなく、しかも残りの伝送容量を画像伝送容量に割り当てることにより、伝送容量を効率的に利用して画像情報を伝送することができるようになる。 In the invention of claim 18 , 19 or 20 , the audio information processing means encodes the audio information and transmits it simultaneously with the image information. At this time, the image information is encoded by the encoding processing means. Since the image transmission capacity at the time of transmission is calculated by subtracting the audio transmission capacity allocated to the transmission of audio information from the total transmission capacity, encoding processing is performed within that range, so that the transmission of audio information depends on the level of image information By assigning the remaining transmission capacity to the image transmission capacity without being hindered, the image information can be transmitted by efficiently using the transmission capacity.

請求項21の発明では、容量比設定手段により、全体の伝送容量に対して音声伝送容量の比率を設定することができ、これによって、符号化条件設定手段においては、容量比設定手段により設定された比率に基づいて音声伝送容量を設定するようになり、使用者の要求に応じた音声情報および画像情報の伝送制御を行なうことができるようになる。 According to the twenty-first aspect of the present invention, the ratio of the voice transmission capacity to the total transmission capacity can be set by the capacity ratio setting means, whereby the encoding condition setting means sets the ratio by the capacity ratio setting means. The voice transmission capacity is set based on the ratio, and the transmission control of voice information and image information according to the user's request can be performed.

請求項22の発明では、符号化条件設定手段により、伝送信号を授受する他の装置から全体の伝送容量に対する音声伝送容量の比率が指定されると、これに基づいて音声伝送容量を設定するので、外部から音声情報や画像情報をモニタする場合などにおいては使用者の要求に応じた情報を効率的に得ることができきるようになる。 In the invention of claim 22 , when the ratio of the voice transmission capacity to the whole transmission capacity is specified by the encoding condition setting means from another device that transmits and receives the transmission signal, the voice transmission capacity is set based on this. In the case of monitoring audio information or image information from the outside, it is possible to efficiently obtain information according to the user's request.

請求項23の発明では、音声情報処理手段により、音声通信に支障を来さない程度に設定される許容遅延時間の範囲内で、インパルスノイズを識別できる程度で且つ十分短く設定されるサンプリング時間を単位としてそのサンプリング時間内で入力される音声信号を積分してその積分値が音声増大判定のしきい値を超えたときに、あらかじめ設定されている伝送容量の限度の範囲内で音声伝送容量を大きく設定するので、音声情報の発生状態に敏感に対応して伝送することができると共に、音声情報の発生量が少ないときには画像情報の伝送容量を大きくして伝送することができる。 In the invention of claim 23, the sampling time set to be short enough to identify the impulse noise within the allowable delay time set so as not to hinder voice communication by the voice information processing means is set. When the audio signal input within the sampling time is integrated as a unit and the integrated value exceeds the threshold for audio increase judgment, the audio transmission capacity is set within the preset transmission capacity limit. Since it is set to be large, it can be transmitted in a sensitive manner to the state of generation of audio information, and when the amount of generated audio information is small, the transmission capacity of image information can be increased.

請求項24の発明では、符号化処理手段により、フレーム内の複数のブロックをひとつのグループとして設定される符号化処理ブロックグループの設定パターンをあらかじめ複数種類登録しているので、伝送信号に符号化処理を行ったときの設定パターンの情報を付加するだけで効率的に画像情報を伝送することができるようになる。また、このとき、符号化処理ブロックグループのパターンをフレーム内の中心部から順に設定したものや、特定領域に対応する部分から順次設定したものなどを選択することにより、伝送信号の最初の部分でフレームの要部のブロックデータを伝送することができるようになり、効率的な画像情報の伝送を行なうことができるようになる。

In the invention of claim 24 , since a plurality of types of setting patterns of encoding processing block groups in which a plurality of blocks in a frame are set as one group are registered in advance by the encoding processing means, the transmission signal is encoded. Image information can be efficiently transmitted simply by adding information on a setting pattern when processing is performed. Also, at this time, by selecting the coding processing block group pattern set in order from the center in the frame, or the one set sequentially from the part corresponding to the specific area, the first part of the transmission signal The block data of the main part of the frame can be transmitted, and the image information can be transmitted efficiently.

以下、本発明を音声情報および画像情報を同時に伝送するようにした無線系の通信装置に適用した場合の一実施例について図面を参照しながら説明する。
図1を参照して本実施例の構成について説明する。まず、送信機として機能する符号化器1において、撮像手段としてのカメラ2は使用者の上半身を撮影するもので、画像情報をRGBアナログ信号として出力する。A/D変換部3は、カメラ2から与えられるアナログ信号をデジタル信号に変換して出力する。RGB/CIF変換部4は、A/D変換部3から与えられるRGBデジタル信号をCIF(Common Intermediate Format;共通中間フォーマット)信号に変換して出力する。
An embodiment in which the present invention is applied to a wireless communication apparatus that transmits audio information and image information simultaneously will be described below with reference to the drawings.
The configuration of this embodiment will be described with reference to FIG. First, in the encoder 1 functioning as a transmitter, a camera 2 as an imaging unit captures the upper body of the user and outputs image information as RGB analog signals. The A / D converter 3 converts an analog signal given from the camera 2 into a digital signal and outputs it. The RGB / CIF conversion unit 4 converts the RGB digital signal given from the A / D conversion unit 3 into a CIF (Common Intermediate Format) signal and outputs it.

二次元高速DCT(離散コサイン変換)部5は、RGB/CIF変換部4からCIF信号が与えられると、変換処理すべきブロックに対して二次元直交変換の一つである二次元DCT(H.261規定の二次元直交変換に対応している)処理してDCT係数の信号を出力する。また、変化ブロック検出手段としての変化領域抽出部6は、RGB/CIF変換部4からCIF信号が与えられるようになっており、そのCIF信号に基づいて後述するようにして変化ブロックを検出し、その結果に応じて二次元高速DCT部5に対して二次元DCT処理を行なうべき変化ブロックを指定する。   A two-dimensional high-speed DCT (discrete cosine transform) unit 5 receives a CIF signal from the RGB / CIF conversion unit 4 and performs a two-dimensional DCT (H. (Two-dimensional orthogonal transformation specified in H.261) is processed and a signal of DCT coefficient is output. The change area extraction unit 6 serving as a change block detection unit is configured to receive a CIF signal from the RGB / CIF conversion unit 4, and detects a change block based on the CIF signal as described later. In accordance with the result, a change block to be subjected to the two-dimensional DCT process is designated for the two-dimensional high-speed DCT unit 5.

量子化部7は、符号化条件設定手段としての符号化制御部8により量子化スケールQSCが設定されており、二次元高速DCT部5から与えられるDCT係数の信号を設定されている量子化スケールQSCで直線量子化変換あるいはデッドゾーン付量子化変換処理をして例えば9ビットの精度で量子化して出力する。有意係数属性制御部9は、符号化制御部8から与えられる条件にしたがって量子化部7から与えられる量子化されたDCT係数の信号に対して属性制御を行なって可変長符号化部10に出力する。   The quantization unit 7 has a quantization scale QSC set by an encoding control unit 8 as an encoding condition setting unit, and a quantization scale in which a signal of a DCT coefficient given from the two-dimensional high-speed DCT unit 5 is set. The QSC performs linear quantization conversion or dead zone added quantization conversion processing, and, for example, quantizes with an accuracy of 9 bits and outputs the result. The significant coefficient attribute control unit 9 performs attribute control on the quantized DCT coefficient signal provided from the quantization unit 7 in accordance with the condition provided from the coding control unit 8 and outputs the signal to the variable length coding unit 10. To do.

可変長符号化部10は、DCT係数の信号に対して対応する可変長符号を割り当てて階層結合部11を介して変換することによりシンタックスに基づくビットストリームを生成してバッファ12に出力する。バッファ12では、信号送信部13に出力するデータの出力速度を制御すると共に、内部のデータ量を符号化制御部8に出力するようになっている。信号送信部13は、RS232c通信処理部14およびデジタル携帯電話機15から構成されており、バッファ12から出力されるビットストリーム信号をデジタル携帯電話機15を介して無線により伝送する。デジタル携帯電話機15は、例えば9600bps(bit per second)の伝送容量(伝送レート)に設定されており、音声信号と画像信号がこの伝送容量の範囲内で伝送されるようになっている。   The variable length encoding unit 10 assigns a corresponding variable length code to the DCT coefficient signal and converts the signal through the layer combining unit 11 to generate a bit stream based on the syntax, and outputs the bit stream to the buffer 12. The buffer 12 controls the output speed of data output to the signal transmission unit 13 and outputs the internal data amount to the encoding control unit 8. The signal transmission unit 13 includes an RS232c communication processing unit 14 and a digital cellular phone 15, and transmits the bit stream signal output from the buffer 12 via the digital cellular phone 15 by radio. The digital cellular phone 15 is set to a transmission capacity (transmission rate) of 9600 bps (bit per second), for example, and an audio signal and an image signal are transmitted within the range of the transmission capacity.

次に、受信機として機能する復号化器16の構成について説明する。信号受信部17は、デジタル携帯電話機18およびRS232c通信処理部19から構成され、デジタル携帯電話機18により受信したビットストリーム信号を入力バッファ20で受け取るようになっている。パーザ21は、バッファ20に蓄積されるデータを取り込んでシンタックス解析を行ない可変長復号化部22に出力する。可変長復号化部22は、入力された信号の可変長符号を復号化して有意係数属性再生部23を介して逆量子化部24に出力する。   Next, the configuration of the decoder 16 that functions as a receiver will be described. The signal receiving unit 17 includes a digital mobile phone 18 and an RS232c communication processing unit 19. The bit stream signal received by the digital mobile phone 18 is received by the input buffer 20. The parser 21 takes in data stored in the buffer 20, performs syntax analysis, and outputs it to the variable length decoding unit 22. The variable length decoding unit 22 decodes the variable length code of the input signal and outputs it to the inverse quantization unit 24 via the significant coefficient attribute reproduction unit 23.

逆量子化部24では再構成した量子化出力9ビットを12ビットの信号に逆変換して出力する。さらに、二次元高速逆DCT25では二次元逆DCT処理を行うことにより8ビットの画素データに戻す。復号化制御部26では有意係数属性再生部23にて復号化した符号化属性をもとにして逆量子化部24の制御を行うようになっている。
CIF/RGB変換部27では、8ビットの画素データをCIF形式からRGB信号に変換し、D/A変換部28を介してアナログ信号に変換して表示器29に出力するようになっている。
なお、この復号化器16の構成では、可変GOBパターンおよび画像データサイズの適応的変更の2つの機能を実行するように構成されているが、符号化器1側でこの機能を実施しない場合には、復号化器16の構成を既存規格のものと同等のものを採用することができる。
The inverse quantization unit 24 inversely converts the reconstructed 9-bit quantized output into a 12-bit signal and outputs it. Further, the two-dimensional high-speed inverse DCT 25 restores 8-bit pixel data by performing a two-dimensional inverse DCT process. The decoding control unit 26 controls the inverse quantization unit 24 based on the coding attribute decoded by the significant coefficient attribute reproduction unit 23.
The CIF / RGB conversion unit 27 converts 8-bit pixel data from the CIF format into an RGB signal, converts it into an analog signal via the D / A conversion unit 28, and outputs the analog signal to the display device 29.
The configuration of the decoder 16 is configured to execute two functions of a variable GOB pattern and an adaptive change of the image data size. However, when this function is not performed on the encoder 1 side. Can adopt the same configuration of the decoder 16 as that of the existing standard.

次に本実施例の作用について、まず、全体の流れを図2ないし図6を参照して説明し、さらに詳細について図7以下を参照して説明する。なお、説明の都合上、次のように項目別に分けて述べる。(1)符号化処理の原理の概略説明、(2)符号化処理の全体の流れ(図2ないし図6参照)、(3)各部処理内容の詳細説明。   Next, the operation of the present embodiment will be described first with reference to FIGS. 2 to 6, and further with reference to FIG. For convenience of explanation, the following items are described separately. (1) Outline description of principle of encoding process, (2) Overall flow of encoding process (see FIGS. 2 to 6), (3) Detailed description of processing contents of each part.

(1)符号化処理の原理の概略説明
通常、H.261やMPEG規格ではフレーム間符号化が用いられ、そこでは空間領域のブロック画素値のフレーム間差分に対して二次元DCT(二次元離散コサイン変換)が施される。したがって、復号時にはこの差分データを復号処理してフレーム間の累積を行うことにより、画像を再構成していくことになる。ところが、この方法ではデジタル無線通信路においてビット誤りが発生した場合に、H.261やH.263あるいはMPEG規格のような複雑なシンタックスのプロトコルでは、各符号語の持つ値が全くもとの値とずれてしまう上に、時間方向に誤りが伝播してしまうことになる。
(1) Outline explanation of principle of encoding process In the H.261 and MPEG standards, interframe coding is used, in which two-dimensional DCT (two-dimensional discrete cosine transform) is performed on the interframe difference of block pixel values in the spatial domain. Therefore, at the time of decoding, this difference data is decoded and accumulated between frames to reconstruct an image. However, in this method, when a bit error occurs in the digital wireless communication path, 261 and H.264. In a protocol with a complicated syntax such as H.263 or MPEG standard, the value of each codeword is completely different from the original value, and an error is propagated in the time direction.

そこで、本実施例では、データ圧縮度は有線系で用いる一般的なフレーム間差分の符号化をする場合ほどには期待できないが、誤りがフレーム内で完結してしまうフレーム内符号化(イントラ符号化)のみをブロックベースで適用する構成を採用することにより無線系に強いものとしているのである。つまり、最初の1フレームについては全てのブロックについてフレーム内符号化であるイントラDCT符号化を実施し、2フレーム目以降の符号化処理においては、後述する変化ブロックの検出によって『変化あり』と判定されたブロックつまり変化ブロックのみについてイントラDCT符号化を行うのである。   Therefore, in this embodiment, the data compression degree cannot be expected as much as the case of encoding a general inter-frame difference used in the wired system, but the intra-frame coding (intra code) in which the error is completed within the frame. By adopting a configuration that applies only a block) on a block basis, the wireless system is made strong. That is, for the first frame, intra DCT encoding, which is intra-frame encoding, is performed for all blocks, and in the encoding processing for the second and subsequent frames, “changed” is determined by detecting a changed block described later. Intra DCT encoding is performed only on the changed blocks, that is, changed blocks.

なお、この方式では、フレーム間差分を符号化しないので、H261規格での動き補償差分を求めるループ演算が不要となる。したがって、これによって、動きベクトル検出処理および逆量子化処理のための構成が不要となると共に、ループフィルタおよび1フレーム分の画素データを記憶するための予測メモリが構成から不要になる。この結果、主要な演算内容としては、(a)二次元DCT処理、(b)量子化処理、(c)可変長符号化処理、(d)バッファ制御および(e)変化ブロック検出処理だけとなり、この結果、パソコンのソフトウェアを用いた構成で、リアルタイムで動作可能な程度のレベルの機能ブロック構成とすることができるのである。   In this method, since the inter-frame difference is not encoded, a loop calculation for obtaining the motion compensation difference in the H261 standard becomes unnecessary. Therefore, this eliminates the need for a configuration for motion vector detection processing and inverse quantization processing, and eliminates the need for a loop filter and a prediction memory for storing pixel data for one frame. As a result, the main calculation contents are only (a) two-dimensional DCT processing, (b) quantization processing, (c) variable length coding processing, (d) buffer control, and (e) change block detection processing, As a result, it is possible to achieve a functional block configuration of a level that can operate in real time with a configuration using software of a personal computer.

(2)符号化処理の全体の流れの説明(図2ないし図6)
符号化器1は、図2ないし図6に示す概略的な流れを示すフローチャートにしたがって次のようにして画像情報を符号化する。まず、符号化器1は、フレーム数を示す変数PICをゼロにクリアし(ステップS1)、カメラ2によって撮影された画像情報を取り込んで(ステップS2)、A/D変換部3においてデジタル信号に変換し(ステップS3)、この後、RGB/CIF変換部4においてRGB/CIF変換を行う(ステップS4)。
(2) Description of overall flow of encoding process (FIGS. 2 to 6)
The encoder 1 encodes the image information as follows according to the flowcharts showing the schematic flow shown in FIGS. First, the encoder 1 clears the variable PIC indicating the number of frames to zero (step S1), takes in the image information captured by the camera 2 (step S2), and converts it into a digital signal in the A / D conversion unit 3. After that, the RGB / CIF conversion unit 4 performs RGB / CIF conversion (step S4).

続いて、符号化器1は、画像情報の状態観測のステップS5(図3参照),符号化状態と要求の判定のステップS6(図4参照),符号化パラメータ決定のステップS7(図5参照)および符号化演算処理のステップS8(図6参照)と順次実行し、フレーム番号LPICが所定の個数NPICに達するまで繰り返し実行する(ステップS9)。以下に、ステップS5ないしS9の内容について図3ないし図6を参照して説明する。   Subsequently, the encoder 1 performs step S5 (see FIG. 3) for observing the state of the image information, step S6 (see FIG. 4) for determining the encoding state and request, and step S7 (see FIG. 5) for determining the encoding parameter. ) And step S8 (see FIG. 6) of the encoding calculation process are sequentially executed, and are repeatedly executed until the frame number LPIC reaches a predetermined number NPIC (step S9). The contents of steps S5 to S9 will be described below with reference to FIGS.

(A)画像信号の状態観測(図3参照)
符号化器1は、画像情報の状態観測のステップS5に進むと、プログラム(図3参照)にしたがって、シーンの特徴に応じてGOBパターンの設定を行う(ステップA1)。次に、符号化器1は、2フレーム目以降の場合は現在フレームの符号化計算を行う前に、前フレームでの計算結果に基づき、変化ブロック数を計算するために(ステップA3)、まず、画像1フレーム全体の色変化量,動き量,情報発生量のレベル判定を各々について行う(ステップA4〜6)。
なお、このようなレベル判定については別途に詳述する。また、シーンが変わってから第1番目のフレームについては強制的に全ブロックについてイントラDCT符号化を行うので、ステップA4〜A6の処理については実施しないようになっている。
(A) Image signal state observation (see FIG. 3)
When the encoder 1 proceeds to step S5 for observing the state of the image information, the encoder 1 sets a GOB pattern according to the feature of the scene according to the program (see FIG. 3) (step A1). Next, in the case of the second frame and thereafter, the encoder 1 calculates the number of changed blocks based on the calculation result in the previous frame before performing the encoding calculation of the current frame (step A3). Then, the level determination of the color change amount, the motion amount, and the information generation amount of the entire image frame is performed (steps A4 to A6).
Such level determination will be described in detail separately. In addition, since the first frame after the scene changes is forcibly subjected to intra DCT coding for all blocks, the processing of steps A4 to A6 is not performed.

各フレームにおいてブロック間変化量の定義に基づいてMBK(マクロブロック)単位に輝度変化量,色変化量を計算し(ステップA11,A12)、デフォルト値あるいは前フレームの計算で設定された変化判定しきい値を基にして変化ブロックの判定を行う(ステップA13)。そして、変化ブロックでない場合には図6に示すステップS8の符号化演算処理のステップD8にジャンプし、変化ブロックと判定された場合には、変化ブロック数のカウンタをインクリメントしてこのプログラムを終了する。   Based on the definition of the inter-block change amount in each frame, the luminance change amount and the color change amount are calculated in units of MBK (macroblock) (steps A11 and A12), and the change set by the default value or the previous frame calculation is determined. The change block is determined based on the threshold value (step A13). If it is not a change block, the process jumps to step D8 of the encoding operation process of step S8 shown in FIG. 6. If it is determined that the block is a change block, the change block number counter is incremented and this program is terminated. .

(B)符号化状態と要求の判定(図4参照)
符号化器1のバッファ12に溜め込まれた符号化ビットストリームのビット数(バッファ量BF)をチェックする(ステップB1)。次に、符号化器1は、使用者からのプロテクト要求の設定状態(ON/OFF)を判定する(ステップB2)。また、AV比率に関する要求度Raを相手端末と自己端末の要求値に基づいて判定する(ステップB3)。次に、音声信号の状態を検出して(ステップB4)、無音状態や突発的音声などの検出された音声信号の状態に応じて音声符号化レートBRAを決定する(ステップB5)。次に、バッファ12のバッファ量BFと音声符号化レートBRAの値からデータレート余裕度ADRと目標画像符号化レートBRV0を決定する(ステップB6)。
(B) Determination of encoding state and request (see FIG. 4)
The number of bits (buffer amount BF) of the encoded bit stream stored in the buffer 12 of the encoder 1 is checked (step B1). Next, the encoder 1 determines the setting state (ON / OFF) of the protection request from the user (step B2). Further, the request degree Ra regarding the AV ratio is determined based on the request values of the partner terminal and the self terminal (step B3). Next, the state of the speech signal is detected (step B4), and the speech coding rate BRA is determined according to the state of the detected speech signal such as a silent state or sudden speech (step B5). Next, the data rate margin ADR and the target image coding rate BRV0 are determined from the values of the buffer amount BF of the buffer 12 and the audio coding rate BRA (step B6).

一方で、動き量SMのレベル判定値LM,色変化量DCのレベル判定値LC,情報発生量のレベル判定値LIの各々から画像のフレーム間変化量の総合的なレベル判定値Lを計算し(ステップB7)、データレート余裕度ADRのレベル判定値LADRと総合的なレベル判定値Lとからテーブル(後述する表1参照)を参照して符号化パラメータの推奨値を計算する(ステップB8)。   On the other hand, a total level judgment value L of the amount of change between frames of the image is calculated from each of the level judgment value LM of the motion amount SM, the level judgment value LC of the color change amount DC, and the level judgment value LI of the information generation amount. (Step B7), a recommended value of the encoding parameter is calculated with reference to a table (see Table 1 described later) from the level determination value LADR of the data rate margin ADR and the overall level determination value L (Step B8). .

(C)符号化パラメータ決定(図5参照)
次に、符号化パラメータの決定を行う。ここでは、音声符号化レートBRAと目標画像符号化レートBRV0との値に基づいて、全体の伝送容量である符号化レートBRから画像符号化レートBRVを演算する(ステップC1)。この場合、これらの値の間には、
BRA+BRV≦BR
という関係が満たされることが条件となっており、この条件のもとに画像符号化レートBRVの値が決定されるが、データレート余裕度ADRはバッファ量BFを監視した後に決定される。したがって、データレート余裕度ADRの値に応じて画像符号化レートBRVは若干修正を受けることになる。これは、例えば、バッファ量BFが平均充足量BFaよりも少なければ、その分だけデータレート余裕度ADRが大きくなるので、画像符号化レートBRVを大きく設定することができるのである。
フレームレートと画像サイズは総合判定レベルLとデータレート余裕度ADRおよび画像への要求度RVからテーブル(表3参照)を参照して決定される(ステップC2,C3)。また、量子化スケールQSCは前述のテーブルを参照して決定する(ステップC4)。
(C) Determination of coding parameters (see FIG. 5)
Next, the encoding parameter is determined. Here, based on the values of the audio coding rate BRA and the target image coding rate BRV0, the image coding rate BRV is calculated from the coding rate BR which is the overall transmission capacity (step C1). In this case, between these values,
BRA + BRV ≦ BR
The value of the image coding rate BRV is determined under this condition, and the data rate margin ADR is determined after monitoring the buffer amount BF. Therefore, the image coding rate BRV is slightly modified according to the value of the data rate margin ADR. This is because, for example, if the buffer amount BF is smaller than the average sufficient amount BFa, the data rate margin ADR increases accordingly, so that the image encoding rate BRV can be set large.
The frame rate and the image size are determined with reference to the table (see Table 3) from the overall determination level L, the data rate margin ADR, and the image requirement RV (steps C2 and C3). Further, the quantization scale QSC is determined with reference to the above table (step C4).

次に、画面全体の変化ブロック数の判定しきい値NCB_THはDCT有意係数の伝送個数を制御するが、これは前述の表1を参照して決定する(ステップC5)。変化ブロック判定しきい値DTHも同様に表1を参照して決定する(ステップC6)。また、ブロック間変化量計算のサンプリング密度はシステム全体のCPU負荷の現在値のレベル判定結果から決定する(ステップC7)。   Next, the determination threshold value NCB_TH for the number of changed blocks of the entire screen controls the number of transmissions of the DCT significant coefficient, which is determined with reference to Table 1 (step C5). Similarly, the changed block determination threshold value DTH is determined with reference to Table 1 (step C6). Further, the sampling density for calculating the change amount between blocks is determined from the level determination result of the current value of the CPU load of the entire system (step C7).

(D)符号化演算(図6参照)
符号化演算は、上記した(A)〜(C)で決定された符号化パラメータを基にしてH.261/263の方式で行う(ステップD1〜D14)。なお、この実施例においては、変化ブロックのMBK属性を強制的にイントラ(フレーム内符号化)とする以外には特別な処理は含まれていない。すなわち、二次元DCT処理,量子化処理,有意係数制御処理,可変長符号化処理を順次行い(ステップD3〜D6)、続いて、MBK属性制御処理,MBK属性符号化処理,GOB属性符号化処理,PIC属性符号化処理を順次行ない(ステップD8〜D13),この後、ビットストリームの階層結合を行なう(ステップD14)。
(D) Encoding operation (see FIG. 6)
The encoding operation is performed based on the encoding parameters determined in the above (A) to (C). This is performed by the method of 261/263 (steps D1 to D14). In this embodiment, no special processing is included except that the MBK attribute of the changed block is forcibly set to intra (intraframe coding). That is, two-dimensional DCT processing, quantization processing, significant coefficient control processing, and variable length encoding processing are sequentially performed (steps D3 to D6), followed by MBK attribute control processing, MBK attribute encoding processing, and GOB attribute encoding processing. , PIC attribute encoding processing is sequentially performed (steps D8 to D13), and then bitstream hierarchical combination is performed (step D14).

(3)各部処理内容の詳細説明
次に、上述した符号化処理の全体の流れの説明で取り上げた各部の処理内容について詳細に説明する。なお、説明の項目は次に示すとおりである。
(3) Detailed Description of Processing Contents of Each Part Next, the processing contents of each part taken up in the description of the overall flow of the encoding process described above will be described in detail. The description items are as follows.

[a]変化ブロックの検出
[a−1]ブロック間変化量の計算
[a−2]しきい値判定
[b]符号化と通信状態の判定
[b−1]データレートの余裕度
[b−2]動き量の判定
[b−3]色変化量の判定
[b−4]情報発生量の判定
[c]情報発生量削減のための制御
[c−1]画面全体の変化量の判定と伝送係数の制御
[c−2]符号化状態に基づく変化判定しきい値制御
[c−3]領域に応じた制御
[d]画像データサイズの適応的変更
[e]音声データと画像データとの比率に対する要求度の抽出
[e−1]連続制御
[e−2]プロテクト機能
[e−3]AV比率の制御に関する優先順序
[e−4]モード制御
[f]パラメータ制御
[f−1]要求度に基づく符号化レートの決定
[f−2]遠隔モニタリングモードの符号化パラメータの遠隔制御
[f−3]システム全体のパラメータ制御
[g]ブロック雑音の除去
[h]可変GOB構造と識別番号の伝送
[a]変化ブロックの検出
[A] Changed block detection [a-1] Calculation of change between blocks [a-2] Threshold determination [b] Coding and communication status determination [b-1] Data rate margin [b- 2] Determination of motion amount [b-3] Determination of color change amount [b-4] Determination of information generation amount [c] Control for reducing information generation amount [c-1] Determination of change amount of entire screen Control of transmission coefficient [c-2] Change determination threshold control based on coding state [c-3] Control according to region [d] Adaptive change of image data size [e] Between audio data and image data [E-1] Continuous control [e-2] Protection function [e-3] Priority order for AV ratio control [e-4] Mode control [f] Parameter control [f-1] Request Determination of coding rate based on degree [f-2] Code of remote monitoring mode Of remote control parameters [f-3] System-wide parameter control [g] removing block noise [h] Variable GOB transmission structure identification number [a] detection of a change block

あるアドレスのマクロブロックが前フレームに対してどれだけ変化したかを以下のようにして判定する。
[a−1]ブロック間変化量の計算
(ア)ブロック間変化量
原画像として入力されたマクロブロック(以下MBKと称する)について、1フレーム前のMBKとの間のフレーム間誤差分の絶対値和をMBK毎に演算する。ここで、MBKは6個のBLK(ブロック)からなるので、以下のように総変化量E(n,m),輝度変化量EL(n,m),色変化量EC(n,m)を定義することができる。
How much the macroblock at a certain address has changed with respect to the previous frame is determined as follows.
[A-1] Calculation of inter-block change amount (a) Inter-block change amount With respect to a macroblock (hereinafter referred to as MBK) input as an original image, an absolute value of an inter-frame error with MBK one frame before The sum is calculated for each MBK. Here, since MBK is composed of six BLKs (blocks), the total change amount E (n, m), luminance change amount EL (n, m), and color change amount EC (n, m) are expressed as follows. Can be defined.

Figure 0004508029
Figure 0004508029

ここで、
E(n,m);第nフレームの第m番目のMBKについて前フレームとの間の総変化量
を示す値
EL(n,m);第nフレームの第m番目のMBKについて前フレームとの間の輝度変
化量を示す値
EC(n,m);第nフレームの第m番目のMBKについて前フレームとの間の色変化
量を示す値
MB(n,m,k);第nフレームの第m番目のMBKの第k番目のBLK
d(BLKi,BLKj);BLKiとBLKjとの間の誤差関数。ここでは画素単位
の差分の絶対値和を計算する。
here,
E (n, m): the total change amount from the previous frame for the mth MBK of the nth frame
EL (n, m) indicating luminance change between the previous frame and the mth MBK of the nth frame
EC (n, m); color change between previous frame and mth MBK of the nth frame
Value indicating quantity MB (n, m, k); k-th BLK of m-th MBK in n-th frame
d (BLKi, BLKj); an error function between BLKi and BLKj. Here pixel unit
Calculate the sum of absolute differences.

BLKi ;i番目のブロック画素
α ;色情報の誤差の荷重係数
(イ)計算の簡略化
上述したd(BLKi,BLKj)の計算において、ブロック内画素のすべてについて差分を演算するのではなく、例えば、図7に示すように、サンプリングした画素についてのみ変化量計算の対象とすることができる。同図(a)はBLK内の全ての画素(8×8=64個)について計算を行なう場合を示し、同図(b)はBLK内の画素を1個置きにサンプリングする(4×8=32個、全画素の1/2)場合を示し、同図(c)はBLK内の画素を1列置き且つ1個置きにサンプリングする(4×4=16個、全画素の1/4)場合を示している。
BLKi; i-th block pixel α; weight coefficient of error of color information (a) Simplification of calculation In the above-described calculation of d (BLKi, BLKj), the difference is not calculated for all the pixels in the block. As shown in FIG. 7, only the sampled pixels can be subject to change amount calculation. FIG. 4A shows a case where calculation is performed for all pixels (8 × 8 = 64) in BLK, and FIG. 4B shows that every other pixel in BLK is sampled (4 × 8 = 4). 32 shows a case of 1/2 of all pixels), and FIG. 10C shows sampling every other pixel in the BLK every other row (4 × 4 = 16, 1/4 of all pixels). Shows the case.

(ウ)簡易動ベクトル検出
上述の(イ)と同様にして、ブロック内画素をサンプリングすることにより、ブロックマッチング法の演算量を削減できるので、動ベクトル検出の演算量も削減することができる。
(C) Simple motion vector detection Since the amount of calculation of the block matching method can be reduced by sampling the pixels in the block in the same manner as in (a) above, the amount of calculation of motion vector detection can also be reduced.

(エ)変化量域・注視領域に限定した動き検出の実行
符号化対象領域を信号変化条件やモデル条件、注視条件の適用などにより特定領域に限定することができる場合には、その限定された領域内でのみ動き検出を実行することにより、演算量を削減することができる。
(D) Execution of motion detection limited to the change amount area / gaze area If the encoding target area can be limited to a specific area by applying signal change conditions, model conditions, gaze conditions, etc. By performing motion detection only within a region, the amount of computation can be reduced.

[a−2]しきい値判定
ここでは、あるしきい値DTHによってE(n,m)を判定し、例えば、以下のようにして前フレームに対して変化があったか否かを判定する。
[A-2] Threshold Determination Here, E (n, m) is determined by a certain threshold DTH, and for example, it is determined whether or not there has been a change with respect to the previous frame as follows.

case1)E(n,m)≧DTHのとき
→変化があったと判定し、イントラ符号化を開始する。
case2)E(n,m)<DTHのとき
→変化はないと判定し、符号化を行わない。
case 1) When E (n, m) ≧ DTH → It is determined that there has been a change, and intra coding is started.
case2) When E (n, m) <DTH → It is determined that there is no change, and encoding is not performed.

上述の内容は、例えば、実験によると、データレートが9.6kbpsの場合に、CIF画像に対して、量子化スケールパラメータQSCALEを20(量子化ステップ=40)、変化検出しきい値DTHを2000程度に設定することで比較的良好な準動画像伝送を行うことができる。   As described above, for example, according to an experiment, when the data rate is 9.6 kbps, the quantization scale parameter QSCALE is set to 20 (quantization step = 40) and the change detection threshold value DTH is set to 2000 for the CIF image. By setting it to a degree, relatively good semi-moving image transmission can be performed.

[b]符号化と通信状態の判定
[b−1]データレートの余裕度ADR
(ア)定義
超低レート通信では、人物像など動く対象物を符号化する場合に通信データレート(伝送容量)に余裕が発生することはあまりないが、人物が不在の状態や遠隔モニタリングなどの場合には変化があまり発生しないことから、データレートに余裕ができることがある。このようなデータレート余裕度ADRを次式のように定義づけることにする。
[B] Coding and communication state determination [b-1] Data rate margin ADR
(A) Definition In ultra-low-rate communication, there is not much room in communication data rate (transmission capacity) when coding moving objects such as human images, but there are no people present or remote monitoring. In some cases, the change does not occur so much that the data rate can be afforded. Such a data rate margin ADR is defined as follows.

ADR=(画像通信レート)−(前フレームの符号化情報量)
これは符号化器出力バッファ12のバッファ量BFの増減に対応したバッファ余裕度を検出することで代用することもできるものである。
ADR = (image communication rate) − (encoded information amount of previous frame)
This can be substituted by detecting the buffer margin corresponding to the increase / decrease in the buffer amount BF of the encoder output buffer 12.

(イ)画像通信レートの動的適用制御
画像通信レート(画像伝送容量)は後述するAV比率の要求度と現在の音声通信データ量に応じて時々刻々と変化させることができる。したがって、音声通信データが少ないと判断したときは要求度で初期設定した通信レートを変更して画像通信レートを拡大させることができるモードを設定する。
(A) Dynamic application control of image communication rate The image communication rate (image transmission capacity) can be changed from moment to moment in accordance with the degree of AV ratio required and the current amount of voice communication data. Therefore, when it is determined that there is little audio communication data, a mode is set in which the communication rate initially set can be changed according to the request level to increase the image communication rate.

(ウ)音声データの急増に対する迅速な対応
上記のような方法で音声通信レート(音声伝送容量)を縮小した場合、突発的な音声データ増大に迅速に対応するには、画像符号化器1の出力停止、画像符号化器出力バッファ12の送出停止、AVレート設定の初期値(要求度から決定した値)への復帰を実行する。音声データ増大の検出には、音声通信に支障のない最大遅延時間TAdelayに対して十分小さい時間Tとしてインパルス雑音と十分識別が可能な程度の時間幅として設定し、その時間T内での音声信号の積分値IAを計算してあるしきい値以上になったときに音声データの増大であると判定するようにしたものである。
(C) Prompt response to sudden increase in audio data When the audio communication rate (audio transmission capacity) is reduced by the method as described above, the image encoder 1 can be used to respond quickly to sudden increase in audio data. The output is stopped, the transmission of the image encoder output buffer 12 is stopped, and the AV rate setting is returned to the initial value (the value determined from the request level). For detection of increase in voice data, a time width that is sufficiently distinguishable from impulse noise is set as a sufficiently small time T with respect to the maximum delay time TAdelay that does not interfere with voice communication, and a voice signal within the time T is set. The integrated value IA is calculated to be equal to or greater than a certain threshold value, and it is determined that the voice data is increased.

(エ)動作フローチャートの説明
上述した(イ)および(ウ)での音声データ発生量の増減に対する画像データレートの適応制御では、図8に示すプログラムのフローチャートにしたがって制御を行なう。
まず、突発的な音声データの増大があるか否かを検出する(ステップT1,T2)。ここでは、上述したごとく、サンプリングの時間T内での音声信号の積分値IAを計算して(ステップT1)、その積分値IAがあるしきい値以上になったときに有意の変化が生じたとしてこれをもって音声データの増大であると判定する(ステップT2)。
(D) Explanation of operation flowchart In the above-described adaptive control of the image data rate with respect to the increase / decrease in the amount of generated audio data in (a) and (c), the control is performed according to the flowchart of the program shown in FIG.
First, it is detected whether or not there is a sudden increase in audio data (steps T1 and T2). Here, as described above, the integration value IA of the audio signal within the sampling time T is calculated (step T1), and a significant change occurs when the integration value IA exceeds a certain threshold value. As a result, it is determined that the voice data is increased (step T2).

次に、判定結果から音声データの増大が検出されない場合、つまり無音状態の場合には、音声符号化レートを低減して(ステップT5)、代わりに画像符号化レートを増大させる(ステップT6)。一方、突発的な音声データの増大が検出された場合には、画像符号化の演算を停止する(ステップT7)と共に画像データの送出を停止し(ステップT8)、適応制御をしていた音声符号化レート,画像符号化レート(AVレート)を使用者の要求度に基づいて設定した初期値に戻す(ステップT9)。また、無音状態ではないが、突発的な音声データの増大でもない状態であるときには、音声符号化レートは変更せず従前の状態を保持するようになっている。   Next, when an increase in audio data is not detected from the determination result, that is, in a silent state, the audio encoding rate is reduced (step T5), and the image encoding rate is increased instead (step T6). On the other hand, when sudden increase in the audio data is detected, the calculation of the image encoding is stopped (step T7) and the transmission of the image data is stopped (step T8). The image conversion rate and image encoding rate (AV rate) are returned to the initial values set based on the user's request level (step T9). Further, when it is not a silent state but is not a sudden increase in speech data, the speech encoding rate is not changed and the previous state is maintained.

[b−2]動き量の判定
動き量の判定については、次の2つの場合について総動き量を演算する方法について説明する。なお、動き検出を行なわない場合(ア)および動き検出を行なう場合(イ)の違いは、動き検出を行なう方が正確な動き量を判定できる反面、動き検出を行なうことによる演算量の大幅な増大となる点で、これらは、制御部を構成するCPUの処理能力に応じて、リアルタイムで処理する場合の大きな負担とならない場合には動き検出を行なう方を採用することができる。
[B-2] Determination of Motion Amount Regarding the determination of the motion amount, a method for calculating the total motion amount in the following two cases will be described. Note that the difference between the case where motion detection is not performed (a) and the case where motion detection is performed (B) is that the motion amount can be determined more accurately, but the amount of calculation due to motion detection is large. In terms of increase, these can adopt a method of performing motion detection in accordance with the processing capability of the CPU constituting the control unit when it does not become a heavy burden when processing in real time.

(ア)動き検出を行わない場合
変化ブロックの重心計算を行い、1フレーム前に対するその動きベクトルの大きさを重心動ベクトルvgとする。この重心動ベクトルvgを変化ブロック数NCBだけ乗じた値を総動き量SMとする。これらは次式のように示される。
(A) When motion detection is not performed The center of gravity calculation of the changed block is performed, and the size of the motion vector for the previous frame is set as the center of gravity motion vector vg. A value obtained by multiplying the center-of-gravity motion vector vg by the number of change blocks NCB is defined as a total motion amount SM. These are expressed as follows:

Figure 0004508029
Figure 0004508029

ここで、
NMB;フレーム内のMBK数
IG(n);第nフレームにおける対象領域重心座標の水平成分
JG(n);第nフレームにおける対象領域重心座標の垂直成分
(イ)動き検出を行う場合
フレーム内の全てのマクロブロックの前フレームに対する動きベクトルの大きさを計算し、得られた動きベクトルの大きさの総和を求めてこれを総動き量SMとするもので、次式で示される。
here,
NMB: number of MBKs in the frame IG (n): horizontal component of the centroid coordinate of the target area in the nth frame JG (n): vertical component of the centroid coordinate of the target area in the nth frame (a) When performing motion detection The magnitudes of motion vectors for the previous frame of all macroblocks are calculated, and the total sum of the magnitudes of the obtained motion vectors is calculated and used as the total motion amount SM.

Figure 0004508029
上述のようにして得られる総動き量SMから、あらかじめ設定されている複数のしきい値を用いて複数段階のレベルに判定してレベル判定値LMを得る。この動き量のレベル判定値LMは後述する符号化制御において用いられるようになっている。
Figure 0004508029
From the total motion amount SM obtained as described above, a level determination value LM is obtained by determining a plurality of levels using a plurality of preset threshold values. This motion level judgment value LM is used in the encoding control described later.

[b−3]色変化量の判定
変化ブロック検出で演算した変化量のうちで、色ブロックのみについての変化量を画面全体で合計して、総色変化量DCを演算する。これは次式のように示される。
[B-3] Determination of Color Change Amount Of the change amounts calculated in the change block detection, the change amounts for only the color blocks are totaled over the entire screen to calculate the total color change amount DC. This is shown as:

Figure 0004508029
Figure 0004508029

ここで、
DC(n);第nフレームの総色変化量
NMBK ;1フレーム中のMBK個数(CIF形式の画像では22×18=396個
である)
EC(n,m);第nフレームの第m番目のMBKについて前フレームとの間の色変化

このDC(n)をいくつかの設定しきい値によりレベル判定し、これをレベル判定値LCとする。
here,
DC (n); total color change amount in the nth frame NMBK; number of MBKs in one frame (22 × 18 = 396 in the CIF format image)
Is)
EC (n, m); color change from previous frame for m-th MBK of n-th frame
Quantity This DC (n) is level-determined by some set threshold values, and this is set as a level judgment value LC.

[b−4]情報発生量の判定
1フレーム前の画面全体の情報発生量をいくつかの設定しきい値によりレベル判定する。この判定結果をレベル判定値LIとする。LIは以下の因果関係で定められる。
RA→[Rv,ADR]→LI
これは、音声要求度Raが設定されることによって、全体の符号化レートの容量に対して画像要求度Rvが決まり、この画像要求度Rvとデータレート余裕度ADRとの関係から許容される情報発生量のレベル判定値LIが定められる。
[B-4] Determination of information generation amount The level of the information generation amount of the entire screen one frame before is determined based on some set threshold values. This determination result is set as a level determination value LI. LI is defined by the following causal relationship.
RA → [Rv, ADR] → LI
This is because, by setting the audio request level Ra, the image request level Rv is determined with respect to the capacity of the entire coding rate, and the information allowed from the relationship between the image request level Rv and the data rate margin ADR. A generation level determination value LI is determined.

[c]情報発生量削減のための制御
[c−1]画面全体の変化量の判定と伝送係数の制御
上述したしきい値判定の結果として得られた変化ブロック個数に基づいて、画面全体の変化度を判定する。これを用いて、例えば、以下のようにDCT係数の伝送を制御する。
[C] Control for reducing the amount of information generated [c-1] Determination of change amount of entire screen and control of transmission coefficient Based on the number of changed blocks obtained as a result of the threshold determination described above, Determine the degree of change. Using this, for example, the transmission of DCT coefficients is controlled as follows.

case1)NCB≧NCB_TH1のとき
→変化ブロックのDCT有意係数のうち、DC成分のみを伝送する
case2)NCB_TH1>NCB≧NCB_TH2のとき
→注視領域以外の変化ブロックはDC成分のみ伝送する
case3)NCB_TH2>NCBのとき
→変化ブロックの有意係数をすべて伝送する
ただし、
NCB;1画面における変化ブロック個数
NCB_THi(i=1,2,…);判定しきい値(データレート余裕度や使用モードによって可変)
である。
case1) When NCB ≧ NCB_TH1 → Transmit only the DC component of the DCT significant coefficient of the changed block
case2) When NCB_TH1> NCB ≧ NCB_TH2 → Change blocks other than the gaze area transmit only the DC component
case3) When NCB_TH2> NCB → Transmit all significant coefficients of change block However,
NCB: Number of changed blocks in one screen NCB_THi (i = 1, 2,...); Judgment threshold (variable depending on data rate margin and usage mode)
It is.

[c−2]符号化状態に基づく変化判定しきい値制御
動き量判定レベルLM、色変化量判定レベルLC、情報発生量判定レベルLI、データレート余裕度の判定レベルLADRから変化領域判定しきい値DTHおよび量子化スケールQSCを動的に決定する。すなわち、
[LM,LC,LI,LADR]→[DTH,QSC,NCB_TH]
とする。この場合、各レベル判定値のうちLM,LC,LIについては、具体的には、例えば、次式を用いて、総合判定レベルLを演算してその結果に基づいて決定を行なう。
[C-2] Change Determination Threshold Control Based on Coding State The change region determination threshold is determined from the motion amount determination level LM, the color change amount determination level LC, the information generation amount determination level LI, and the data rate margin determination level LADR. The value DTH and the quantization scale QSC are determined dynamically. That is,
[LM, LC, LI, LADR] → [DTH, QSC, NCB_TH]
And In this case, for the LM, LC, and LI among the level determination values, specifically, for example, the overall determination level L is calculated using the following equation, and the determination is performed based on the result.

Figure 0004508029
Figure 0004508029

したがって、総合判定レベルLとデータレート余裕度LADRとの組み合わせから、変化領域判定しきい値DTH,量子化スケールQSC,画面全体の変化判定しきい値NCB_THを決定する。したがって、
[L,LADR]→[DTH,QSC,NCB_TH]
を考えると、LおよびLADRがそれぞれ0〜3の4段階の値をとる場合には、次の表1のような制御例を採用することができる。
Therefore, the change area determination threshold value DTH, the quantization scale QSC, and the entire screen change determination threshold value NCB_TH are determined from the combination of the overall determination level L and the data rate margin LADR. Therefore,
[L, LADR] → [DTH, QSC, NCB_TH]
When L and LADR take values in four stages of 0 to 3, respectively, a control example as shown in Table 1 below can be adopted.

Figure 0004508029
Figure 0004508029

[c−3]領域に応じた制御
(ア)領域の設定
<1>領域の自動設定
注視領域、動きや色のクラスタリング等の手法により複数個の領域を設定する。この手法についてはいくつかの方法が考えられるが、本実施例では採用していないので、その可能性を述べるのみにとどめてここでは言及しない。
[C-3] Control according to area (a) Area setting
<1> Automatic region setting Multiple regions are set by methods such as gaze region, motion and color clustering. Several methods are conceivable for this method, but they are not adopted in the present embodiment, so only the possibility is described and not mentioned here.

<2>マニュアル設定
たとえば、以下に示すような種々の設定方法があり、いずれか一方あるいは両方を採用して設定に用いることができる。
<2> Manual setting For example, there are various setting methods as shown below, and either or both of them can be used for setting.

i )送信側でユーザがモニタ画像を見ながら送信するシーンについて設定する方法。
ii)受信側でユーザが受信画像を見ながら送信側のシーンについて設定する方法。
i) A method for setting a scene to be transmitted while the user watches a monitor image on the transmission side.
ii) A method in which the user sets the scene on the transmission side while viewing the received image on the reception side.

(イ)複数個の領域の記述
上記で設定した複数個の領域をその重心と領域の幅により記述する。例えば、ライン方向に並行な矩形領域を記述する場合、以下の表2のようになる。ここではCIF形式のマクロブロックを単位として記述している。
(A) Description of a plurality of areas The plurality of areas set above are described by their centroids and area widths. For example, when a rectangular area parallel to the line direction is described, it is as shown in Table 2 below. Here, a CIF format macroblock is described as a unit.

Figure 0004508029
Figure 0004508029

上述の場合に、領域のカテゴリに関しては、前述したようなマニュアル設定では人間の介在により決定することができる。また、自動設定に関してもいくつかの方法が考えられるが、ここでは省略する。   In the above case, the area category can be determined by human intervention in the manual setting as described above. Also, some methods for automatic setting are conceivable, but are omitted here.

(ウ)領域のモニタリング
<1>固定領域のモニタリング
領域の重心と大きさが決まれば、二次元の固定された窓としてモニタリングができる。この場合、この窓内の画像領域は優先的に情報量を割り当てることにより、高画質や更新速度の高い動画として再生させることができる。
(C) Area monitoring
<1> Fixed area monitoring Once the center of gravity and size of the area are determined, it can be monitored as a two-dimensional fixed window. In this case, the image area in the window can be reproduced as a moving image with high image quality and high update speed by preferentially allocating the information amount.

<2>動領域のトラッキング
最初に設定した領域重心と大きさを固定化するのではなく、自動設定に用いた手法やフレーム相関(例えば動き検出など)により、領域内に映った対象物の動きに基づいてトラッキングしていくことができる。これは、対象物や対象人物の三次元形状をモデル化して登録すると共にその動きについて推定されるものを予測するモデルベース三次元運動推定に用いた移動体領域抽出手法などによって実現できる。
<2> Tracking of moving area Rather than fixing the initially set area centroid and size, the movement of the object reflected in the area by the method used for automatic setting and frame correlation (for example, motion detection) You can track based on. This can be realized by a moving object region extraction method used for model-based three-dimensional motion estimation for modeling and registering a three-dimensional shape of an object or a person and predicting what is estimated for the movement.

<3>領域情報の伝送
前述のように定義した領域情報(領域番号、重心、水平幅、垂直幅)とその領域内の画像情報のみを伝送することにより、必要な領域に絞った符号化処理を行なうことができ、効率的に情報発生量を削減することができる。
<3> Transmission of region information Encoding processing focused on the required region by transmitting only the region information defined above (region number, center of gravity, horizontal width, vertical width) and image information within that region. Thus, the amount of information generated can be reduced efficiently.

<4>領域のプライオリティ
複数の領域を指定する場合には、情報量を割り当てる場合にプライオリティ (優先順位)をつける。ここで、領域番号は画像伝送上、重要と思われる領域から順番につける。ただし、背景の領域番号は0とする。プライオリティの変更については変更を示すフラグと変更情報のみを送る。変更情報は例えば、複数の領域に対応して順番を番号により設定して送る。
<4> Area priority When multiple areas are specified, priorities are assigned when allocating information. Here, the area numbers are assigned in order from the areas considered to be important for image transmission. However, the background area number is 0. For priority change, only the flag indicating change and change information are sent. For example, the change information is sent by setting the order with numbers corresponding to a plurality of areas.

(3421)→この場合には、領域3を最優先、領域4を2番目、領域2を3番目、領域1を4番目に伝送することを示す。
(エ)領域別しきい値設定
プライオリティに応じて変化判定しきい値DTHを自動設定する。例えば、DTH0〜DTH3の順番に、
[1000,1500,2000,2500]
のように設定する。あるいは個別に領域毎の変化判定しきい値DTHを設定することもできる。
(3421) → In this case, it indicates that area 3 is transmitted with the highest priority, area 4 is transmitted second, area 2 is transmitted third, and area 1 is transmitted fourth.
(D) Area-specific threshold setting The change determination threshold value DTH is automatically set according to the priority. For example, in the order of DTH0 to DTH3,
[1000, 1500, 2000, 2500]
Set as follows. Alternatively, the change determination threshold value DTH for each region can be set individually.

(オ)設定しきい値の適応的変更
画像内容の急激な変化(シーンチェンジ、移動物の出現/消失など)が終息し、画面全体の変化量が少なくなると、データレート余裕度ADRも高くなる。このとき、画質を向上させるためには以下のような方法が考えられる。
<1>不変領域の変化判定しきい値DTHを下げる〈不変領域の更新〉
<2>画面全体の変化判定しきい値DTHを下げる〈画面全体の動き向上〉
<3>注視領域に対してのみ変化判定しきい値DTHを下げる〈注視部分の動き向上〉
(E) Adaptive change of setting threshold When a sudden change in image content (scene change, appearance / disappearance of moving objects, etc.) ends and the amount of change in the entire screen decreases, the data rate margin ADR also increases. . At this time, in order to improve the image quality, the following methods can be considered.
<1> Decreasing the change threshold DTH for the invariant region <Updating the invariant region>
<2> Decrease the change threshold DTH for the entire screen <Improve the movement of the entire screen>
<3> Lowering the change determination threshold DTH only for the gaze area <improving the movement of the gaze portion>

特に、<1>は事前に変化判定しきい値DTHを上げ過ぎた場合におこる画像劣化現象への対処である。例えば、カメラの前に手をかざした場合、一度は画面全体が肌色に切換わるが、その後、手をのけても変化判定しきい値DTHを超えないブロックが存在するときには、壁等の背景に手の一部が不変領域として張付いたように残るという状況が発生する。   Particularly, <1> is a countermeasure for an image deterioration phenomenon that occurs when the change determination threshold value DTH is excessively increased in advance. For example, when a hand is held in front of the camera, the entire screen is switched to flesh color once, but after that, when there is a block that does not exceed the change determination threshold DTH even if the hand is moved, the background such as a wall A situation occurs in which a part of the hand remains as an invariant region.

また、<2>については、あまり下げ過ぎると、ほんのわずかな輝度のむらや色相変化により変化ブロックが急増するため、逆にフレームレートが低くなってしまうという現象が起きてしまう。   For <2>, if the value is lowered too much, the number of changed blocks increases rapidly due to a slight luminance unevenness or hue change, which causes a phenomenon that the frame rate is lowered.

一方、量子化スケールQSCについては、次のような方法が考えられる。
<1>不変領域の量子化スケールQSCを下げる〈不変領域の画質向上〉
<2>画面全体の量子化スケールQSCを下げる〈画面全体の画質向上〉
<3>注視領域に対してのみ量子化スケールQSCを下げる〈注視部分の画質向上〉
図9は、以上の制御内容についての流れを示すフローチャートである。なお、ここで変化判定しきい値DTH0〜DTH3および量子化スケールQSC0〜QSC3の設定条件は次のようになっている。
On the other hand, for the quantization scale QSC, the following method can be considered.
<1> Lowering the quantization scale QSC of the invariant region <Improvement of image quality in the invariant region>
<2> Lower the quantization scale QSC of the entire screen <Improvement of image quality of the entire screen>
<3> Lowering the quantization scale QSC only for the gaze area <Improving the image quality of the gaze portion>
FIG. 9 is a flowchart showing the flow of the above control contents. Here, the setting conditions for the change determination threshold values DTH0 to DTH3 and the quantization scales QSC0 to QSC3 are as follows.

<1>データレート余裕度ADR上昇の場合
DTH0≧DTH3≧DTH2≧DTH1
QSC0≧QSC3≧QSC2≧QSC1
<2>データレート余裕度ADR上昇の場合
DTH3≧DTH2≧DTH1≧DTH0
QSC3≧QSC2≧QSC1≧QSC0
<1> Data rate margin ADR increases DTH0 ≧ DTH3 ≧ DTH2 ≧ DTH1
QSC0 ≧ QSC3 ≧ QSC2 ≧ QSC1
<2> Data rate margin ADR increases DTH3 ≧ DTH2 ≧ DTH1 ≧ DTH0
QSC3 ≧ QSC2 ≧ QSC1 ≧ QSC0

符号化器1は、変化判定しきい値DTHおよび量子化スケールQSCの初期値DTH0,QSC0が設定された状態で(ステップP1)、データレート余裕度ADRが変化したか否かを監視する(ステップP2)。そして、データレート余裕度ADRの値が変化した場合には、領域別適応化を行なわないときには(ステップP3)、前述したようにテーブル(表1)を参照して変化判定しきい値DTHおよび量子化スケールQSCを変更設定する(ステップP4)。
また、領域別適応化を行なう場合には、注視領域優先モードであるか否かを判定し(ステップP5)、「YES」の場合には注視領域の変化判定しきい値DTHをDTH1に変更設定し(ステップP6)、量子化スケールQSCをQSC1に変更設定する(ステップP7)。
The encoder 1 monitors whether or not the data rate margin ADR has changed in a state where the change determination threshold value DTH and the initial values DTH0 and QSC0 of the quantization scale QSC are set (step P1). P2). When the value of the data rate margin ADR changes, when the region-specific adaptation is not performed (step P3), the change determination threshold value DTH and the quantum are referred to by referring to the table (Table 1) as described above. The change scale QSC is changed and set (step P4).
Further, when performing area-specific adaptation, it is determined whether or not it is the gaze area priority mode (step P5). If “YES”, the gaze area change determination threshold value DTH is changed to DTH1. (Step P6), the quantization scale QSC is changed to QSC1 (Step P7).

そして、注視領域優先モードに設定されている場合には、注視領域の変化判定しきい値をDTH2に、不変表示領域の変化判定しきい値をDTH3に設定すると共に(ステップP8,P9)、注視領域の量子化スケールをQSC2に、不変表示領域の量子化スケールをQSC3に設定する(ステップP10,P11)。この後、変化判定しきい値の最低値DTHminを超える有意変化ブロックが有るか否かに応じて(ステップP12)、「YES」の場合には有意変化ブロックの変化判定しきい値をDTH2に設定し(ステップP13)、そうでないときには終了する。   When the gaze area priority mode is set, the gaze area change determination threshold is set to DTH2, the invariant display area change determination threshold is set to DTH3 (steps P8 and P9), and gaze is set. The quantization scale of the area is set to QSC2, and the quantization scale of the invariant display area is set to QSC3 (steps P10 and P11). Thereafter, depending on whether or not there is a significant change block exceeding the minimum value DTHmin of the change determination threshold value (step P12), in the case of “YES”, the change determination threshold value of the significant change block is set to DTH2. If not, the process ends.

[d]画像データサイズの適応的変更
上述と同様に、動き量判定レベルLM、色変化量判定レベルLC、変化ブロック数NCB、データレート余裕度ADRの判定レベルLADRの総合的判定に加えて、画像要求度RVのレベルLRV(後述する)も考慮して画像データサイズの適応的変更を行うことができる。
ここで、画像データサイズは、通常のCIFに加えて、QCIF、SQCIFについて設定可能な場合を想定している。そして、例えば、
[L,LADR,LRV]→[SQCIF/QCIF/CIF]
の参照テーブルを考える場合には、LおよびLADR,LRVが0〜3の4段階の値をとるとすると、次の表3のように制御内容を設定することができる。
[D] Adaptive change of image data size In the same manner as described above, in addition to the comprehensive determination of the determination level LADR of the motion amount determination level LM, the color change amount determination level LC, the number of changed blocks NCB, and the data rate margin ADR, The image data size can be adaptively changed in consideration of the level LRV (described later) of the image request level RV.
Here, it is assumed that the image data size can be set for QCIF and SQCIF in addition to the normal CIF. And for example,
[L, LADR, LRV] → [SQCIF / QCIF / CIF]
When L, LADR, and LRV take values in four stages from 0 to 3, the control contents can be set as shown in Table 3 below.

Figure 0004508029
Figure 0004508029

上述の画像データサイズの変更を行なう場合に、変更直後のフレームに対してイントラ符号化を行なったイントラフレームを介さずに、連続的にフレーム間のサイズ変更を行なうことができる。拡大変更と縮小変更の両者についてそれぞれ以下のように実現することができる。
(ア)CIF→QCIF
CIF/QCIFダウンサンプリングの駆動により、時刻t(n−1)のCIF符号化フレーム(フレームメモリに格納されている)をQCIFに変換する。このQCIFに対して時刻t(n)のQCIFベースのフレーム間符号化を行う。デコーダ側ではピクチャヘッダ中のQCIF指示フラグにより、ダウンサンプリングを駆動する。
When the image data size is changed as described above, it is possible to continuously change the size between frames without using an intra frame obtained by performing intra encoding on the frame immediately after the change. Both enlargement change and reduction change can be realized as follows.
(A) CIF → QCIF
By driving CIF / QCIF downsampling, the CIF encoded frame (stored in the frame memory) at time t (n−1) is converted into QCIF. QCIF-based interframe coding at time t (n) is performed on this QCIF. On the decoder side, downsampling is driven by the QCIF instruction flag in the picture header.

(イ)QCIF→CIF
QCIF/CIF双一次補間フィルタの駆動により、時刻t(n−1)のQCIF符号化フレーム(フレームメモリに格納されている)をCIFに変換する。このCIFに対して時刻t(n)のCIFベースのフレーム間符号化を行う。デコーダ側ではピクチャヘッダ中のCIF指示フラグにより、補間フィルタを駆動する。なお、この補間フィルタについてはサイズ間の切換えを行なう場合に対応して推奨されているものがある。
以上の方法により、イントラフレームを差し挟まなくともサイズ変更を実現することができるようになるので、符号化器1側で情報量を極端に増大させることなくフレームレートを維持することができるようになる。
(B) QCIF → CIF
By driving the QCIF / CIF bilinear interpolation filter, the QCIF encoded frame (stored in the frame memory) at time t (n−1) is converted into CIF. CIF-based interframe coding at time t (n) is performed on this CIF. On the decoder side, the interpolation filter is driven by the CIF instruction flag in the picture header. Some interpolation filters are recommended for switching between sizes.
With the above method, the size can be changed without interposing an intra frame, so that the frame rate can be maintained without extremely increasing the amount of information on the encoder 1 side. Become.

[e]音声データと画像データとの比率に対する要求度の抽出
ヒューマンインターフェイスを簡略化するために、通信品質への要求を表現する場合において、必要な最低限の制御入力手段を以下に示す一次元尺度で考慮する。すなわち、音声比率に対する要求度Raとして、
Raij ;端末iで設定する端末jの符号化器の音声比率への要求度
として示す。
[E] Extraction of degree of requirement for ratio of audio data and image data In order to simplify the human interface, when expressing the demand for communication quality, the minimum required control input means is one dimension shown below Consider in scale. That is, as the required degree Ra for the voice ratio,
Raij: Indicates the degree of request for the speech ratio of the encoder of the terminal j set by the terminal i.

[e−1]連続制御
図10に示すように、音声(A)と映像(V)との間の比率(AV比率)を指定するつまみ29を表示装置29の前面部に設ける。これは、使用者によってスライド操作することにより比率を設定可能に設けられるもので、今、つまみ29aの示す値Tが0から1まで変化するとき、
Raij=T ;データ全体に占める音声データの割合
Rvij=1−T ;データ全体に占める映像データの割合
となる。これにより、
<1>モード制御
<2>変化検出しきい値の変更(DTH)
<3>量子化スケールの変更(QSCALE)
を行う。
[E-1] Continuous Control As shown in FIG. 10, a knob 29 for designating a ratio (AV ratio) between audio (A) and video (V) is provided on the front surface of the display device 29. This is provided so that the ratio can be set by a slide operation by the user. Now, when the value T indicated by the knob 29a changes from 0 to 1,
Raij = T; ratio of audio data in the entire data Rvij = 1−T; ratio of video data in the entire data. This
<1> Mode control
<2> Change detection threshold (DTH)
<3> Change of quantization scale (QSCALE)
I do.

[e−2]プロテクト機能
通信におけるプライバシ保護のため、自分の端末(端末1)の伝送品質を相手端末(端末2)に操作させる際には必ず使用者の許可を必要とするようにプロテクト機能を設けている。具体的には、図11にも示すように、モード設定用スイッチによるプロテクトON/OFFで実現する。通常の対話モードにおいては、プロテクトOFFの場合は、種々の音声および画像パラメータについて手動で設定するマニュアルモードと次項に示すように自己端末(端末1)と相手端末(端末2)との両者の要求度に基づいて決定される自動設定モードがある。また、上述の趣旨から、プロテクトONの場合は相手端末(端末2)から設定される要求を一切受け付けないようになっている。
[E-2] Protect function In order to protect privacy in communication, a protect function that always requires the user's permission when operating the transmission quality of the terminal (terminal 1) on the other terminal (terminal 2). Is provided. More specifically, as shown in FIG. 11, the protection is realized by ON / OFF protection using a mode setting switch. In the normal dialogue mode, when the protection is OFF, the manual mode for manually setting various audio and image parameters and the request of both the own terminal (terminal 1) and the partner terminal (terminal 2) as shown in the next section There is an automatic setting mode that is determined based on the degree. Further, for the above-mentioned purpose, when the protection is ON, no request set from the partner terminal (terminal 2) is accepted.

[e−3]AV比率の制御に関する優先順序
上記プロテクト機能がOFFされた場合には、1対1の通信の場合においては、Raijの定義から端末1において以下の2つの要求度が発生して競合することになる。
Ra11;自分の端末(端末1)の音声符号化器に対する要求度
Ra21;相手の端末(端末2)から自分の端末1の音声符号化器に対して発生する要求度
上述の場合に、一般的には、背景情報についてユーザが持つ可制御性は音声情報よりも映像情報の方が低いと推察されるから、音声に比べて映像の方が自分の端末から送る際の可制御性を高める必要があると考えて次のような決定規則を設定する。
RA1=max[Ra11,Ra21]
RA1 ;端末iの音声符号化器に送る最終的な要求度
これは、コミュニケーションとしての電話機能を最低限満足するためには聞き手の音声品質に対する要求を満たすことが必須であることにも対応している。
[E-3] Priority Order for AV Ratio Control When the above protection function is turned off, in the case of one-to-one communication, the following two requests are generated in the terminal 1 from the definition of Raij. Will compete.
Ra11: Degree of request for speech encoder of own terminal (terminal 1) Ra21: Degree of request generated for speech encoder of own terminal 1 from partner terminal (terminal 2) Therefore, it is presumed that the controllability of the user for background information is lower for video information than for audio information, so it is necessary to improve the controllability when video is sent from your terminal compared to audio The following decision rule is set.
RA1 = max [Ra11, Ra21]
RA1: Final request to be sent to the speech coder of terminal i This also corresponds to the fact that it is essential to satisfy the requirements for the voice quality of the listener in order to satisfy the telephone function as a communication at a minimum. ing.

[e−4]モード制御
被写体、用途などに応じたモード制御は、例えば、画像の付帯状況として使用環境や被写体あるいは用途などに応じて、符号化器1と復号化器16との間であらかじめ取り決められた符号化条件を備えており、それら各モードに対応して付されるコードをビットストリームデータに付加することにより、発生する情報量を大幅に削減させることができる。
[E-4] Mode Control Mode control according to the subject, application, etc. is performed in advance between the encoder 1 and the decoder 16 according to the use environment, subject, application, etc. as an incidental state of the image, for example. The determined coding conditions are provided, and the amount of information to be generated can be greatly reduced by adding the codes attached to the respective modes to the bit stream data.

ここで、設定可能なモードとしては、次のようなものが考えられている。例えば、使用環境に対応するモードとしては、屋内,屋外,あるいは自動車の中、さらには、それらの環境の中で固定モードか可動モードか等がある。また、被写体のモードとしては、人物,風景,静止物体あるいは図面,文字などのモードがあり、さらには人物のモードにおいては、頭部,上半身,全身あるいは複数人物などの様々なモードが考えられる。
さらには、符号化制御に関するモードとしては、画像中心優先モード,対象領域優先モード,動き優先モード,準動画モード,静止画モード,モデルベース予測モードなどの様々なモードがあるが、ここではモードの例を概略的に述べるにとどめる。
Here, the following modes can be considered as settable modes. For example, the modes corresponding to the use environment include indoor, outdoor, or in a car, and in those environments, a fixed mode or a movable mode. The subject mode includes a person mode, a landscape mode, a stationary object mode, a drawing mode, and a text mode. Further, in the human mode, various modes such as the head, the upper body, the whole body, and a plurality of modes can be considered.
Furthermore, there are various modes related to encoding control, such as image center priority mode, target area priority mode, motion priority mode, quasi-video mode, still image mode, and model-based prediction mode. An example is only outlined.

[f]パラメータ制御
[f−1]要求度に基づく符号化レートの決定
要求度に基づく符号化レートの決定画像要求度とデータレート余裕度とから符号化レートを決定する。すなわち、
[RV,ADR]→[BRA,BRV]
BRA;音声符号化レート
BRV;画像符号化レート
この目標に基づき、量子化スケール(QSCALE)と変化検出しきい値(DTH)の2つを既に記載した方法で変化させることで画像データ量を調整し、AV比率を制御する。
[F] Parameter Control [f-1] Determination of Encoding Rate Based on Request Level Determination of Encoding Rate Based on Request Level The encoding rate is determined from the image request level and the data rate margin. That is,
[RV, ADR] → [BRA, BRV]
BRA: Audio coding rate BRV: Image coding rate Based on this target, the amount of image data is adjusted by changing the quantization scale (QSCALE) and the change detection threshold (DTH) using the methods already described. And the AV ratio is controlled.

[f−2]遠隔モニタリングモードの符号化パラメータの遠隔制御
前述した音声要求度を決定した場合と同様にして、符号化パラメータの各値を設定する際にも自己の端末に対する制御値を優先するようなプロテクト機能を設ける。
このような遠隔モニタリングモードにおいては、前述したようなプロテクト機能をONさせて実行することにより、次のような効果を得ることができる。すなわち、通常の遠隔モニタリングモードにおいては、プロテクト機能をOFFにしている場合には、自己の端末(端末1)側で、相手端末(端末2)から送信される細かい符号化制御パラメータのセット(領域情報,量子化スケール,各種しきい値など)を受け取ることができるようになっているのに対して、プロテクト機能をONに設定することによりこれらのパラメータセットの受付を却下することになり、パラメータの変更設定を禁止した状態つまり、同一条件で符号化を行なうように保持してモニタリングを継続することになる。
[F-2] Remote control of encoding parameter in remote monitoring mode Similar to the case of determining the voice request level described above, priority is given to the control value for its own terminal when setting each value of the encoding parameter. Such a protection function is provided.
In such a remote monitoring mode, the following effects can be obtained by turning on the protection function as described above. That is, in the normal remote monitoring mode, when the protect function is turned off, a set (area) of a fine encoding control parameter transmitted from the partner terminal (terminal 2) on its own terminal (terminal 1) side. Information, quantization scale, various thresholds, etc.), but setting the protect function to ON will reject acceptance of these parameter sets, That is, the change setting is prohibited, that is, the monitoring is continued while maintaining the encoding to be performed under the same conditions.

[f−3]システム全体のパラメータ制御
以上のパラメータ決定関係を総合すると図12に表すことができる。すなわち、符号化パラメータの決定の要因として、画像により発生する情報量があり、これには動き量SM,色変化量DC,変化ブロック数NBC,1フレーム前の情報発生量LI,バッファ量(データレート余裕度ADR)などの要素があり、これらのレベルを判定した結果から画像関係の情報発生レベルを考慮し、一方で、音声に関する要求度Ra,音声信号の発生状況などから画像情報の符号化レートBRVが決まり、これによってそのときのフレームの符号化パラメータを対応づけて決定する。
[F-3] Parameter Control of Entire System The above parameter determination relationships can be summarized as shown in FIG. That is, as a factor for determining the encoding parameter, there is an information amount generated by an image, which includes a motion amount SM, a color change amount DC, a change block number NBC, an information generation amount LI one frame before, a buffer amount (data There are factors such as rate margin (ADR), and the information generation level related to the image is taken into consideration from the result of determining these levels. The rate BRV is determined, and this is determined by associating the encoding parameters of the frame at that time.

決定する符号化パラメータの要素としては、前述したように、画像符号化レートBRV,量子化スケールQSC,変化ブロック判定しきい値DTH,画像データサイズCIF/QCIF/SQCIF,ブロック間変化量のサンプリング密度SD,画面全体の変化判定ブロック数のしきい値NCB_THなどがある。
そして、このようにして決定された符号化パラメータに基づいて符号化処理の演算が実行される。また、このような符号化の状態は常時観測されており、次回以降の符号化パラメータ決定に際して利用されるようになっている。
As described above, the coding parameter elements to be determined include the image coding rate BRV, the quantization scale QSC, the change block determination threshold value DTH, the image data size CIF / QCIF / SQCIF, and the sampling density of the change amount between blocks. SD, threshold value NCB_TH of the number of change determination blocks for the entire screen, and the like.
Then, calculation processing is performed based on the encoding parameters determined in this way. In addition, such a coding state is constantly observed, and is used when determining the coding parameter from the next time.

[g]ブロック雑音の除去
ブロック雑音の除去のために図13のようにしてポストフィルタを用いる。これは、復号化器16側において復号処理を行なって画像を再生する場合に、ブロック単位で再生を行なう際に、DCT係数の送信レベルを制御することにより、隣接するブロック間での輝度や色信号の変動が雑音として悪影響を与えるのを除去あるいはその影響力を緩和するためのものである。
[G] Removal of Block Noise A post filter is used as shown in FIG. 13 to remove block noise. This is because when decoding is performed on the decoder 16 side and an image is reproduced, the luminance and color between adjacent blocks are controlled by controlling the transmission level of the DCT coefficient when reproducing in block units. This is to remove or mitigate the influence of signal fluctuations as noise.

実際には、例えば、図13(a)のように再生されたMBK(マクロブロック)間のラインに沿ってポストフィルタを用いてBLK雑音除去処理を行なう。このBLK雑音除去処理では、同図(b)に示すように、BLK境界に沿って並ぶ画素のデータに対して、隣接する8個の画素のデータを利用して重み付けを行なって加算演算することにより変換して周囲の画素のデータとの中間的な画素データとなるように変換するものである。この場合においては、例えば、自己の画素データを4,隣接する画素データを2,斜めに隣接する画素データを1の割合で重み付けして加算することにより変換処理を施す。   Actually, for example, BLK noise removal processing is performed using a post filter along a line between MBKs (macroblocks) reproduced as shown in FIG. In this BLK noise removal processing, as shown in FIG. 5B, the pixel data arranged along the BLK boundary is weighted using the data of eight adjacent pixels and added. Is converted so that the pixel data becomes intermediate with the data of surrounding pixels. In this case, for example, conversion processing is performed by weighting and adding own pixel data, 4 adjacent pixel data, 2 diagonally adjacent pixel data at a ratio of 1.

[h]可変GOB構造と識別番号の伝送
符号化器1および復号化器16の両者に、あらかじめ定義した共通のGOBパターンとそのIDコードを記憶しておき、符号化器1で用いたGOBパターンのIDコードのみを画像圧縮データに付加して既存プロトコル(H.261やH.263あるいはMPEG等)におけるユーザデータエリアなどを利用して伝送する。
[H] Transmission of variable GOB structure and identification number Both a pre-defined common GOB pattern and its ID code are stored in both the encoder 1 and the decoder 16, and the GOB pattern used in the encoder 1 is stored. Are added to the compressed image data and transmitted using the user data area in the existing protocol (H.261, H.263, MPEG, etc.).

可変GOBパターンとしては、例えば、図14および図15に示すようなものが考えられる。すなわち、図14(a),(b)では一般的なH.261規格,H.263規格にしたがったGOBパターンを示し、同図(c),(d)および図15(a)では変形させたGOBパターンを採用している。   As the variable GOB pattern, for example, those shown in FIGS. 14 and 15 are conceivable. That is, in FIGS. H.261 standard, H.264. The GOB pattern according to the H.263 standard is shown, and the modified GOB pattern is adopted in FIGS. 15 (c), (d) and FIG. 15 (a).

変形GOB(その1)では、マクロブロックを4×4個まとめて1つのGOB単位を構成して画面に並べたパターンであり、変形GOB(その2)では、画面中央にマクロブロックを4×8個配置すると共に、その外周に隣接するマクロブロックを順次GOBの単位として配置したものである。また、変形GOB(その3)においては、所定のパターンに区切った変形GOBを配置している。図15(b)では、指定領域をGOBとして設定しており、同図(c),(d)では、QCIF,SQCIFを埋込んで配置したGOBパターンとしている。   The modified GOB (part 1) is a pattern in which 4 × 4 macroblocks are grouped to form one GOB unit and arranged on the screen. In the modified GOB (part 2), the macroblock is arranged in the center of the screen 4 × 8. In addition to the arrangement, macroblocks adjacent to the outer periphery thereof are sequentially arranged as a unit of GOB. In the modified GOB (part 3), the modified GOB divided into a predetermined pattern is arranged. In FIG. 15 (b), the designated area is set as GOB, and in FIGS. 15 (c) and (d), a GOB pattern in which QCIF and SQCIF are embedded is arranged.

さて、このようにGOBパターンを設定しておくことにより、復号化器16は送られてきた圧縮ビットストリームをGOB単位で通常の画像復号プロトコルによって解凍した後に、ユーザデータエリアなどに格納されたGOBパターンのIDコードをもとにGOBパターンデータベースから該当するGOBパターンを選択して、あらかじめ取り決められたGOB番号とGOB中のマクロブロック数に基づいて、復号したGOBデータを配置する。この方式によって、例えば、従来の画像のように左上部分から右下に向かう水平スキャンによる画一的なGOB構造に比べて、画像内容に則したGOB間のプライオリティを付けることができるようになる。   Now, by setting the GOB pattern in this way, the decoder 16 decompresses the transmitted compressed bit stream in units of GOB using a normal image decoding protocol, and then stores the GOB stored in the user data area or the like. The corresponding GOB pattern is selected from the GOB pattern database based on the pattern ID code, and the decoded GOB data is arranged based on the GOB number decided in advance and the number of macroblocks in the GOB. By this method, for example, compared with a uniform GOB structure by horizontal scanning from the upper left part to the lower right like a conventional image, priority between GOBs according to image contents can be given.

例えば、「変形GOBパターンその2」(図14(d)参照)では、画面中央の中心部分から先に伝送するので、伝送線路に誤りが混入して再送を繰り返すといった場合でも、重要な画像部分だけは統計的に少ない遅延時間で速く送ることができる。また、「変形GOBパターンその3」(図15(a)参照)では、略人物正面像に近い形状でGOBを区切ることができるようにしているので、GOB単位での効率的な符号割り当てを可能にしている。   For example, in the “modified GOB pattern No. 2” (see FIG. 14D), since the transmission is performed first from the center portion at the center of the screen, an important image portion can be obtained even when an error is mixed in the transmission line and retransmission is repeated. Only can be sent fast with statistically little delay time. In addition, in the “deformed GOB pattern 3” (see FIG. 15A), since the GOB can be divided into a shape that is almost similar to a front image of a person, efficient code allocation in units of GOB is possible. I have to.

また「QCIF埋込」(同図(c)参照)では、伝送レート内の画像に割り当てる符号レートが少なくなっても重要部分を良好な画質で且つ動きのある画像として見たいという場合に対応して、中央のQCIFのみの符号化への移行を簡単に行なうことができるようになる。なお、複数指定領域をGOBとする場合は、パターン識別番号のみでは不十分となるので、前述した[c−3]の領域に応じた制御の項で述べた領域の記述と伝送方法を用いることが必要になる。
ここで、指定領域外の背景画像部分をどのようにGOBとして区分けするかという問題が生ずるが、このような場合に対応した規則を符号化器1と復号化器16との両者の間で同じ内容として規定して記憶しておけば、特に新しい区分け情報を伝送する必要はなくなる。
“QCIF embedding” (see (c) in the same figure) corresponds to the case where an important part is to be viewed as a moving image with good image quality even if the code rate assigned to the image within the transmission rate is reduced. Thus, it becomes possible to easily shift to the encoding of only the central QCIF. Note that when a plurality of designated areas are GOB, the pattern identification number alone is not sufficient, so use the area description and transmission method described in the control section according to the area of [c-3] described above. Is required.
Here, there arises a problem of how to classify the background image portion outside the designated area as a GOB. The rule corresponding to such a case is the same between the encoder 1 and the decoder 16. If the contents are defined and stored, it is not necessary to transmit new segmentation information.

このような本実施例によれば、次のような効果を得ることができる。
すなわち、第1に、変化領域抽出部6により、そのフレーム内のマクロブロックのうちの変化ブロックを検出してその変化ブロックについてのみフレーム内符号化処理を行なうので、携帯電話機のような限られた伝送容量(例えば、9600bps)の範囲内で変化が生じている領域についての情報を有効に伝送することができると共に、伝送誤りに強い画像再生を行なえて、無線系にも強い動画像伝送を行なえる。
According to such a present Example, the following effects can be acquired.
That is, first, the change region extraction unit 6 detects a change block among the macroblocks in the frame and performs intra-frame coding processing only on the change block. It is possible to effectively transmit information about a region where a change occurs within the range of transmission capacity (for example, 9600 bps), to perform image reproduction that is resistant to transmission errors, and to perform strong moving image transmission even in a wireless system. The

さらに、フレーム内符号化を行なうので、一般的な動画像圧縮の場合と異なり、前フレームに対する差分を演算したり動き補償差分符号化の演算ループなどの構成が不要となり、その分だけ演算処理量を大幅に削減することができて、例えば、パソコンなどの処理によっても十分に対応でき、携帯用情報端末を用いた画像伝送を行うことができるようになる。
また、符号化条件設定手段としての符号化制御部8により、変化ブロックについての符号化を行なう際に、変化ブロックの発生量や変化量等のデータに応じて符号化処理の条件を伝送容量の範囲内で変更して必要な情報を取捨選択してより良質な動画像を伝送することができるようになる。
Furthermore, since intra-frame coding is performed, unlike the case of general video compression, it is not necessary to calculate a difference with respect to the previous frame or a calculation loop of motion compensation differential coding, and the amount of calculation processing is correspondingly increased. For example, it is possible to sufficiently cope with processing by a personal computer or the like, and image transmission using a portable information terminal can be performed.
In addition, when encoding the change block by the encoding control unit 8 as the encoding condition setting means, the encoding processing condition is set according to the data such as the generation amount and the change amount of the change block. It becomes possible to transmit a higher quality moving image by selecting necessary information by changing within the range.

第2に、符号化制御部8において、変化ブロックにより発生する情報発生量を、動き量,色変化量,変化ブロック個数,データレートの余裕度,音声符号化レートなどから符号化パラメータを決定するので、画像の変化に応じて弾力的に符号化条件の変更設定を行なうことができる。   Second, the encoding control unit 8 determines the amount of information generated by the changed block from the amount of motion, the amount of color change, the number of changed blocks, the margin of the data rate, the speech encoding rate, and the like. Therefore, it is possible to change and set the encoding condition flexibly according to the change of the image.

第3に、上述のように情報発生量およびデータレートの余裕度の変化に基づいて、符号化パラメータとして、画像符号化レート,量子化スケール,変化ブロック判定しきい値,画像データサイズ,ブロック間変化量計算のサンプリング密度あるいは画面全体の変化判定のブロック数のしきい値を変更設定するので、符号化処理に際して有効な符号化を行なうことができるようになる。   Third, based on the change in the amount of information generation and the margin of the data rate as described above, the encoding parameters are the image encoding rate, the quantization scale, the change block determination threshold, the image data size, and the inter-block Since the sampling density for the change amount calculation or the threshold value for the number of blocks for the change determination of the entire screen is changed, effective encoding can be performed during the encoding process.

第4に、音声情報を同時に伝送する場合に、その音声情報の発生状況に応じて画像情報の伝送容量を求めて、符号化条件を適応的に変更設定するので、限られた伝送容量の中で、画像情報を効率的に送信して使用者が必要とする領域を精度良く再生することができる。
第5に、音声情報の突発的増大を検出して画像情報の送信を弾力的に制限するので、音声情報の送信を優先しながら、音声情報が少ないときに画像情報を精度良く送信することができるようになる。
第6に、音声情報の符号化要求度を設定可能にしたので、画像情報に対して音声情報を優先しながら伝送容量の範囲で画像情報を有効に利用して送信することができるようになる。
第7に、プロテクト機能を設けたので、外部からの符号化要求度設定に対してプライバシーの保護を図ることもできる。
Fourth, when audio information is transmitted simultaneously, the transmission capacity of image information is obtained according to the state of occurrence of the audio information, and the encoding conditions are adaptively changed and set. Thus, it is possible to efficiently transmit the image information and accurately reproduce the area required by the user.
Fifth, since the sudden increase in audio information is detected and the transmission of image information is elastically limited, image information can be transmitted with high accuracy when there is little audio information while giving priority to the transmission of audio information. become able to.
Sixth, since it is possible to set the required degree of encoding of audio information, it is possible to transmit image information while effectively using the image information within the range of transmission capacity while giving priority to the audio information over the image information. .
Seventh, since a protect function is provided, it is possible to protect privacy against setting of the degree of encoding request from the outside.

本発明は、上記実施例にのみ限定されるものではなく、次のように変形また拡張できる。
映像ソースとしては、カメラ2に限らず、ビデオ映像の画像情報を利用するものでも良い。
信号送信部および信号受信部で信号の授受を行なう媒体としてはデジタル携帯電話機に限らず、他の通信手段を用いても良いし、さらには無線系だけではなく有線系の通信経路に適用することもできる。
The present invention is not limited to the above embodiment, and can be modified or expanded as follows.
The video source is not limited to the camera 2 but may be video source image information.
The medium for transmitting and receiving signals at the signal transmission unit and the signal reception unit is not limited to a digital cellular phone, and other communication means may be used. Furthermore, the present invention is applicable not only to a wireless system but also to a wired communication path. You can also.

音声情報と画像情報とを同時に送信する場合に限らず、画像情報のみの通信を行なう場合にも適用できる。
AV比率の設定用つまみはスライド式以外に、回転式のものでも良いし、デジタル的に設定するものでも良い。また、必要に応じて省いた構成とすることもできる。
プロテクト機能は必要に応じて設ければ良い。
符号化レートを決定するための参照テーブルは、表1〜3以外に適宜設定することができる。
可変GOBパターンの適応的変更や画像データサイズの適応的変更の制御については必要に応じて設けることができる。また、これらを使用しない場合には、復号化器の構成上において、既存の規格のものを適用することができる。
9600bpsの携帯電話機の場合を説明したが、H.263規格で対象とされている64kbps程度以下の伝送容量の場合にも同様に適用でき、動画像伝送に有効に利用することができる。
The present invention is not limited to the case where audio information and image information are transmitted simultaneously, but can also be applied to the case where only image information is communicated.
The AV ratio setting knob may be a rotary type or digitally set in addition to the slide type. Moreover, it can also be set as the structure omitted as needed.
A protection function may be provided as necessary.
The reference table for determining the encoding rate can be set as appropriate in addition to Tables 1 to 3.
Control of adaptive change of the variable GOB pattern and adaptive change of the image data size can be provided as necessary. Further, when these are not used, the existing standard can be applied in the configuration of the decoder.
The case of a 9600 bps mobile phone has been described. The present invention can be similarly applied to a transmission capacity of about 64 kbps or less, which is targeted by the H.263 standard, and can be effectively used for moving image transmission.

本発明の一実施例を示す全体のブロック構成図1 is an overall block diagram showing an embodiment of the present invention. 全体の概略的動作を示すフローチャートFlow chart showing the overall operation 画像情報の状態観測動作を示すフローチャートFlow chart showing image information state observation operation 符号化状態と要求の判定動作を示すフローチャートFlowchart showing encoding state and request determination operation 符号化パラメータ決定動作を示すフローチャートFlowchart showing encoding parameter determination operation 符号化演算処理動作を示すフローチャートFlowchart showing encoding operation processing operation 画素のサンプリングパターンを示す説明図Explanatory diagram showing pixel sampling pattern 音声データ量変動の検出動作を示すフローチャートFlow chart showing detection operation of variation in audio data amount 領域に応じたしきい値変更制御の動作を示すフローチャートFlow chart showing operation of threshold value change control according to region AV比率を設定するつまみの部分を示す表示装置の正面図Front view of display device showing knob portion for setting AV ratio プロテクト機能の動作を示す作用説明図Action explanatory diagram showing the operation of the protect function 符号化パラメータ決定の総合的な関係を示すブロック図Block diagram showing the overall relationship of coding parameter determination ポストフィルタの説明図Illustration of post filter 可変GOBパターン(その1)Variable GOB pattern (1) 可変GOBパターン(その2)Variable GOB pattern (2)

符号の説明Explanation of symbols

1は符号化器、2はカメラ(撮像手段)、3はA/D変換部、4はRGB/CIF変換部、5は二次元高速DCT部、6は変化領域抽出部(変化ブロック検出手段)、7は量子化部、8は符号化制御部(符号化条件設定手段)、9は有意係数属性制御部、10は可変長符号化部、11は階層結合部、12はバッファ、13は信号送信部、14はRS232c通信処理部、15はデジタル携帯電話機、16は復号化器、17は信号受信部、18はデジタル携帯電話機、19はRS232c通信処理部、20はバッファ、21はパーザ、22は可変長復号化部、23は有意係数属性再生部、24は逆量子化部、25は二次元高速逆DCT部、26は復号化制御部、27はCIF/RGB変換部、28はD/A変換部、29は表示器、29aはAV比率設定用のつまみである。   1 is an encoder, 2 is a camera (imaging means), 3 is an A / D conversion unit, 4 is an RGB / CIF conversion unit, 5 is a two-dimensional high-speed DCT unit, and 6 is a change area extraction unit (change block detection means). 7 is a quantization unit, 8 is an encoding control unit (encoding condition setting means), 9 is a significant coefficient attribute control unit, 10 is a variable length encoding unit, 11 is a layer combination unit, 12 is a buffer, and 13 is a signal. Transmitter, 14 is an RS232c communication processor, 15 is a digital mobile phone, 16 is a decoder, 17 is a signal receiver, 18 is a digital mobile phone, 19 is an RS232c communication processor, 20 is a buffer, 21 is a parser, 22 Is a variable length decoding unit, 23 is a significant coefficient attribute reproduction unit, 24 is an inverse quantization unit, 25 is a two-dimensional fast inverse DCT unit, 26 is a decoding control unit, 27 is a CIF / RGB conversion unit, and 28 is a D / D A conversion unit, 29 is a display, 29a is AV It is a knob for rate setting.

Claims (24)

複数のブロックから構成される1フレームの画像データをそのブロック単位で符号化しながら圧縮する処理をすることにより所定の伝送容量の範囲内の伝送信号を生成する動画像情報の符号化装置において、
前記フレーム中の複数のブロックのうちで前フレームの画像データとの変化量が判定しきい値以上であるときにこれを変化ブロックとして検出する変化ブロック検出手段と、
送信可能な伝送容量の範囲内で前記フレームの画像データを符号化する際に、前記変化ブロック検出手段により検出された前記変化ブロックの情報量として得られる動き量、色変化量、変化ブロック数、1フレーム前の情報発生量、バッファ量の値に応じて符号化処理条件である画像符号化レート、量子化スケール、変化ブロック判定しきい値、画像データサイズ、ブロック間変化量計算のサンプリング密度、画面全体の変化判定ブロック数のしきい値を変更設定する符号化条件設定手段と、
この符号化条件設定手段により設定される符号化処理条件で前記変化ブロックのみをフレーム内符号化の符号化処理をして伝送信号を生成する符号化処理手段とを具備し、
前記符号化条件設定手段は、変化ブロック判定しきい値、量子化スケールのしきい値、画面全体の変化判定ブロック数の推奨されるしきい値の組み合わせで段階的に示される符号化のレベルを、前記動き量、色変化量および情報発生量のレベル判定により総合判定レベルを算出し、算出された前記総合判定レベルと前記バッファ量の余裕度との組み合わせから求め、フレーム内の領域に応じて前記符号化のレベルを異なるように設定することが可能に構成され、且つ前記符号化のレベルを異ならせる領域を設定可能に構成されていることを特徴とする動画像情報の符号化装置。
In a video information encoding apparatus for generating a transmission signal within a predetermined transmission capacity by performing a process of compressing one frame of image data composed of a plurality of blocks while encoding each block,
Change block detection means for detecting when the amount of change from the image data of the previous frame among a plurality of blocks in the frame is equal to or greater than a determination threshold, as a change block;
When encoding the image data of the frame within the transmission capacity range that can be transmitted, the amount of motion obtained as the information amount of the change block detected by the change block detection means, the color change amount, the number of change blocks, The amount of information generated one frame before, the image coding rate, the quantization scale, the changed block determination threshold, the image data size, the sampling density for calculating the amount of change between blocks, depending on the value of the buffer amount, Encoding condition setting means for changing and setting the threshold value of the number of change determination blocks for the entire screen;
Coding processing means for generating a transmission signal by performing coding processing of intra-frame coding only on the changed block under the coding processing conditions set by the coding condition setting means,
The encoding condition setting means sets the encoding level indicated stepwise by a combination of a change block determination threshold, a quantization scale threshold, and a recommended threshold for the number of change determination blocks for the entire screen. A total determination level is calculated by determining the level of the motion amount, the color change amount, and the information generation amount, and is obtained from a combination of the calculated total determination level and the margin of the buffer amount, and according to the region in the frame An apparatus for encoding moving image information, characterized in that the encoding level can be set differently and an area where the encoding level is different can be set.
請求項1に記載の動画像情報の符号化装置において、
前記符号化条件設定手段は、前記領域を設定するためのデータをあらかじめ決められているフォーマットにより設定可能に設けられていることを特徴とする動画像情報の符号化装置。
The apparatus for encoding moving image information according to claim 1,
The apparatus for encoding moving image information, wherein the encoding condition setting means is provided so that data for setting the area can be set in a predetermined format.
請求項1または2に記載の動画像情報の符号化装置において、
前記符号化条件設定手段は、前記領域を複数設定したときにそれぞれの領域に対して符号化処理をする際に情報量の割り当てについて重要度の高さに応じた優先順位を設定可能に設けられていることを特徴とする動画像情報の符号化装置。
The apparatus for encoding moving image information according to claim 1 or 2,
The encoding condition setting means is provided such that when a plurality of the areas are set, priority can be set according to the degree of importance of information amount allocation when encoding is performed on each area. An apparatus for encoding moving image information, comprising:
請求項3記載の動画像情報の符号化装置において、
前記符号化条件設定手段は、前記領域を複数設定したときにそれぞれの領域に対して異なる符号化条件を設定可能に設けられていることを特徴とする動画像情報の符号化装置。
The apparatus for encoding moving image information according to claim 3,
The apparatus for encoding moving image information, wherein the encoding condition setting means is provided so that different encoding conditions can be set for each region when a plurality of the regions are set.
請求項1ないし4のいずれかに記載の動画像情報の符号化装置において、
前記符号化条件設定手段は、フレーム全体の画像データの変化量が減少したときに、前記変化ブロック検出手段による変化ブロックの検出に際して用いる判定のしきい値を低くするように変更設定することを特徴とする動画像情報の符号化装置。
The apparatus for encoding moving image information according to any one of claims 1 to 4,
The encoding condition setting unit is configured to change and set a determination threshold value used when detecting a change block by the change block detection unit when the change amount of the image data of the entire frame decreases. An apparatus for encoding moving image information.
請求項に記載の動画像情報の符号化装置において、
前記符号化条件設定手段は、フレーム内の画像データの不変領域に対して、前記符号化処理条件の変更設定、あるいは前記判定のしきい値を低くする前記変更設定を行なうことを特徴とする動画像情報の符号化装置。
The apparatus for encoding moving image information according to claim 5 ,
The moving picture characterized in that the encoding condition setting means performs the change setting of the encoding processing condition or the change setting for lowering the threshold value of the determination for an invariant region of image data in a frame. Image information encoding apparatus.
請求項に記載の動画像情報の符号化装置において、
前記符号化条件設定手段は、フレーム内の画像データの画面全体に対して、前記符号化処理条件の変更設定、あるいは前記判定のしきい値を低くする前記変更設定を行なうことを特徴とする動画像情報の符号化装置。
The apparatus for encoding moving image information according to claim 5 ,
The moving image characterized in that the encoding condition setting means performs the change setting of the encoding processing condition or the change setting for lowering the threshold value of the determination for the entire screen of image data in a frame. Image information encoding apparatus.
請求項に記載の動画像情報の符号化装置において、
前記符号化条件設定手段は、フレーム内の画像データの特定領域に対して、前記符号化処理条件の変更設定、あるいは前記判定のしきい値を低くする前記変更設定を行なうことを特徴とする動画像情報の符号化装置。
The apparatus for encoding moving image information according to claim 5 ,
The moving image characterized in that the encoding condition setting means performs the change setting of the encoding processing condition or the change setting for lowering the threshold value of the determination for a specific area of image data in a frame. Image information encoding apparatus.
請求項ないしのいずれかに記載の動画像情報の符号化装置において、
前記符号化条件設定手段は、フレーム全体の画像データの変化量が減少したときに、前記変化ブロック検出手段による変化ブロックの符号化に際して用いる量子化スケールを低くするように変更設定することを特徴とする動画像情報の符号化装置。
The apparatus for encoding moving image information according to any one of claims 1 to 5 ,
The encoding condition setting means is configured to change and set the quantization scale used when encoding the change block by the change block detection means when the change amount of the image data of the entire frame decreases. An apparatus for encoding moving image information.
請求項に記載の動画像情報の符号化装置において、
前記符号化条件設定手段は、フレーム内の画像データの不変領域に対して、前記符号化処理条件の変更設定、あるいは前記判定のしきい値を低くする前記変更設定、もしくは前記量子化スケールを低くする前記変更設定を行なうことを特徴とする動画像情報の符号化装置。
The apparatus for encoding moving image information according to claim 9 ,
The encoding condition setting unit is configured to change the encoding process condition, or to change the setting for lowering the determination threshold, or to lower the quantization scale for an invariant region of image data in a frame. An apparatus for encoding moving image information, wherein the change setting is performed .
請求項9または10に記載の動画像情報の符号化装置において、
前記符号化条件設定手段は、フレーム内の画像データの画面全体に対して、前記符号化処理条件の変更設定、あるいは前記判定のしきい値を低くする前記変更設定、もしくは前記量子化スケールを低くする前記変更設定を行なうことを特徴とする動画像情報の符号化装置。
The apparatus for encoding moving image information according to claim 9 or 10,
The encoding condition setting unit is configured to change the encoding processing condition, the change setting for lowering the determination threshold, or the quantization scale for the entire screen of image data in a frame. An apparatus for encoding moving image information, wherein the change setting is performed .
請求項9ないし11のいずれかに記載の動画像情報の符号化装置において、
前記符号化条件設定手段は、フレーム内の画像データの特定領域に対して、前記符号化処理条件の変更設定、あるいは前記判定のしきい値を低くする前記変更設定、もしくは前記量子化スケールを低くする前記変更設定を行なうことを特徴とする動画像情報の符号化装置。
The apparatus for encoding moving image information according to any one of claims 9 to 11 ,
The encoding condition setting means, for a particular area of the image data in the frame, the change setting of the encoding process conditions, or the change setting to lower the threshold of the determination, or lower the quantization scale An apparatus for encoding moving image information, wherein the change setting is performed .
請求項1ないし12のいずれかに記載の動画像情報の符号化装置において、
前記符号化条件設定手段は、前記フレームにおける画像情報の発生量と送信可能な伝送容量との関係から必要に応じてフレームサイズを変更設定するように構成されていることを特徴とする動画像情報の符号化装置。
The apparatus for encoding moving image information according to any one of claims 1 to 12,
The video information is characterized in that the encoding condition setting means is configured to change and set the frame size as necessary from the relationship between the amount of image information generated in the frame and the transmittable transmission capacity. Encoding device.
請求項13に記載の動画像情報の符号化装置において、
前記符号化処理手段は、前記フレームサイズを縮小する側に変更設定されたときには、変更前のフレームの画像データを変更後のフレームの画像データに対応するようにサンプリングすることにより適合させるように構成されていることを特徴とする動画像情報の符号化装置。
The apparatus for encoding moving image information according to claim 13 ,
It said encoding means, said when modified set to the side to reduce the frame size, configured to fit by sampling so as to correspond to the image data of the frame after changing the image data of the pre-change frame An apparatus for encoding moving image information, characterized in that:
請求項13または14に記載の動画像情報の符号化装置において、
前記符号化処理手段は、フレームサイズを拡大する側に変更設定されたときには、変更前のフレームの画像データを変更後のフレームの画像データに対応させたときに画像データのない画素について隣接する画素の画像データから補間して画像データを生成する補間フィルタを備えていることを特徴とする動画像情報の符号化装置。
The apparatus for encoding moving image information according to claim 13 or 14 ,
When the encoding processing means is set to change to enlarge the frame size, when the image data of the frame before the change is made to correspond to the image data of the frame after the change, the pixel adjacent to the pixel without the image data An apparatus for encoding moving image information, comprising: an interpolation filter for generating image data by interpolating from the image data .
請求項1ないし15のいずれかに記載の動画像情報の符号化装置において、
前記符号化条件設定手段は、外部から符号化条件を変更設定する入力に対してこれを無効化させるプロテクト機能を設定可能に構成されていることを特徴とする動画像情報の符号化装置。
The apparatus for encoding moving image information according to any one of claims 1 to 15 ,
The apparatus for encoding moving image information, wherein the encoding condition setting means is configured to be able to set a protection function for invalidating an input for changing and setting an encoding condition from the outside .
請求項1ないし16のいずれかに記載の動画像情報の符号化装置において、
前記符号化条件設定手段は、フレームを形成している被写体あるいは用途等に応じてその付帯状況をあらかじめ決められたコードで設定するモード条件が記憶されており、前記符号化処理の際にモード条件を使用して符号化を行なったときにはその伝送信号にモード条件を指定するコードを付加するように構成されていることを特徴とする動画像情報の符号化装置。
The apparatus for encoding moving image information according to any one of claims 1 to 16 ,
The encoding condition setting means stores a mode condition for setting the incidental situation with a predetermined code according to the subject forming the frame or the application, and the mode condition is set at the time of the encoding process. An apparatus for encoding moving picture information, characterized in that a code for specifying a mode condition is added to a transmission signal when encoding is performed using the.
請求項1ないし17のいずれかに記載の動画像情報の符号化装置において、
画像情報と同時に送信するための音声情報を符号化する音声情報処理手段を備え、
前記符号化処理手段は、画像情報を符号化して伝送する際の画像伝送容量を、前記伝送容量から前記音声情報の伝送に割り当てられる音声伝送容量を差し引いた分としてその範囲内で符号化処理を行なうように構成されていることを特徴とする動画像情報の符号化装置。
The apparatus for encoding moving image information according to any one of claims 1 to 17 ,
Audio information processing means for encoding audio information to be transmitted simultaneously with image information;
The encoding processing means performs encoding processing within the range by subtracting the audio transmission capacity allocated to the transmission of the audio information from the transmission capacity, as the image transmission capacity when encoding and transmitting the image information. An apparatus for encoding moving image information, characterized in that the apparatus is configured to perform .
請求項18記載の動画像情報の符号化装置において、
前記符号化条件設定手段は、前記伝送容量に対する画像伝送容量の判定を前記音声伝送容量に基づいて判定するように構成されていることを特徴とする動画像情報の符号化装置。
The apparatus for encoding moving image information according to claim 18 ,
The apparatus for encoding moving image information, wherein the encoding condition setting means is configured to determine the image transmission capacity relative to the transmission capacity based on the audio transmission capacity .
請求項18または19記載の動画像情報の符号化装置において、
前記符号化条件設定手段は、前記音声伝送容量をあらかじめ設定可能に設けられ、音声情報の発生に応じて前記設定された音声伝送容量の範囲で符号化条件を設定し、音声情報の発生量が音声伝送容量よりも低下しているときには前記画像伝送容量を増加させて符号化条件を設定するように構成されていることを特徴とする動画像情報の符号化装置。
In the coding apparatus of the video information according to claim 18 or 19, wherein,
The coding condition setting means is provided so that the voice transmission capacity can be set in advance, and sets the coding condition in the range of the set voice transmission capacity according to the generation of voice information. An apparatus for encoding moving picture information, wherein the encoding condition is set by increasing the image transmission capacity when the audio transmission capacity is lower than the audio transmission capacity .
請求項20に記載の動画像情報の符号化装置において、
前記伝送容量に対する前記音声伝送容量の比率を設定する容量比設定手段を設け、
前記符号化条件設定手段は、前記容量比設定手段により設定された比率に基づいて音声伝送容量を設定することを特徴とする動画像情報の符号化装置。
The apparatus for encoding moving image information according to claim 20 ,
Providing a capacity ratio setting means for setting a ratio of the voice transmission capacity to the transmission capacity;
The apparatus for encoding moving picture information, wherein the encoding condition setting means sets an audio transmission capacity based on the ratio set by the capacity ratio setting means .
請求項20または21記載の動画像情報の符号化装置において、The apparatus for encoding moving image information according to claim 20 or 21,
前記符号化条件設定手段は、前記伝送信号を授受する他の装置から指定される伝送容量に対する音声伝送容量の比率に基づいて音声伝送容量を設定することを特徴とする動画像情報の符号化装置。The encoding apparatus for moving picture information, wherein the encoding condition setting means sets an audio transmission capacity based on a ratio of an audio transmission capacity to a transmission capacity designated by another apparatus that transmits and receives the transmission signal .
請求項18ないし22のいずれかに記載の動画像情報の符号化装置において、The apparatus for encoding moving image information according to any one of claims 18 to 22,
前記音声情報処理手段は、音声通信に支障を来さない程度に設定される許容遅延時間の範囲内で、インパルスノイズを識別できる程度で且つ十分短く設定されるサンプリング時間を単位としてそのサンプリング時間内で入力される音声信号を積分してその積分値が音声増大判定のしきい値を超えたときに、前記あらかじめ設定されている伝送容量の限度の範囲内で前記音声伝送容量を大きく設定するように構成されていることを特徴とする動画像情報の符号化装置。The voice information processing means has a sampling time set in a unit of a sampling time set to be short enough to identify impulse noise within a range of an allowable delay time set to a level that does not hinder voice communication. The voice transmission capacity is set to be large within the range of the preset transmission capacity limit when the voice signal input at is integrated and the integrated value exceeds the threshold for voice increase judgment. An apparatus for encoding moving image information, comprising:
請求項1ないし23のいずれかに記載の動画像情報の符号化装置において、The apparatus for encoding moving image information according to any one of claims 1 to 23,
前記符号化処理手段は、フレーム内の複数のブロックをひとつのグループとして設定される符号化処理ブロックグループの設定パターンをあらかじめ複数種類登録されており、伝送信号に符号化処理を行ったときの設定パターンの情報を付加することを特徴とする動画像情報の符号化装置。The encoding processing means has registered in advance a plurality of types of setting patterns of encoding processing block groups in which a plurality of blocks in a frame are set as one group, and is set when encoding processing is performed on a transmission signal. An apparatus for encoding moving image information, characterized by adding pattern information.
JP2005225428A 2005-08-03 2005-08-03 Encoding device for moving picture information Expired - Fee Related JP4508029B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005225428A JP4508029B2 (en) 2005-08-03 2005-08-03 Encoding device for moving picture information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005225428A JP4508029B2 (en) 2005-08-03 2005-08-03 Encoding device for moving picture information

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP03047897A Division JP4341078B2 (en) 1997-02-14 1997-02-14 Encoding device for moving picture information

Publications (2)

Publication Number Publication Date
JP2006020354A JP2006020354A (en) 2006-01-19
JP4508029B2 true JP4508029B2 (en) 2010-07-21

Family

ID=35794090

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005225428A Expired - Fee Related JP4508029B2 (en) 2005-08-03 2005-08-03 Encoding device for moving picture information

Country Status (1)

Country Link
JP (1) JP4508029B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100763308B1 (en) * 2006-08-01 2007-10-04 삼성전자주식회사 Apparatus and method for taking moving picture in portable terminal
JP4936557B2 (en) * 2008-01-24 2012-05-23 キヤノン株式会社 Encoder

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07131794A (en) * 1993-11-05 1995-05-19 Fujitsu Ltd Method and device for coding picture data
JPH07131787A (en) * 1993-11-05 1995-05-19 Fujitsu Ltd Method and device for coding picture data

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07131794A (en) * 1993-11-05 1995-05-19 Fujitsu Ltd Method and device for coding picture data
JPH07131787A (en) * 1993-11-05 1995-05-19 Fujitsu Ltd Method and device for coding picture data

Also Published As

Publication number Publication date
JP2006020354A (en) 2006-01-19

Similar Documents

Publication Publication Date Title
JP5318424B2 (en) Content Adaptive Background Skip for Region of Interest Video Coding
KR100957472B1 (en) Region-of-interest coding with background skipping for video telephony
KR100926016B1 (en) Region-of-interest coding in video telephony using rho domain bit allocation
JP5410553B2 (en) Quality Metric Bias Region of Interest Coding for Videophones
US20160100166A1 (en) Adapting Quantization
US20040158719A1 (en) Video encoder capable of differentially encoding image of speaker during visual call and method for compressing video signal using the same
US8270476B2 (en) Face detection system for video encoders
JPH10257489A (en) Device and method for adjusting amount of bits to be generated for encoding image
JP2000078588A (en) Moving picture encoding device
JP2004289796A (en) System and method for adaptively encoding sequence of image
JP4341078B2 (en) Encoding device for moving picture information
JP4508029B2 (en) Encoding device for moving picture information
KR20040062732A (en) Bit rate control system based on object
WO2016054307A1 (en) Adapting quantization within regions-of-interest
KR100770873B1 (en) Method and apparatus of controling bit rate in image encoding
JP4517453B2 (en) Image information converting apparatus and method, and encoding apparatus and method
KR100543608B1 (en) Bit rate control system based on object
JPH0244881A (en) Moving picture encoding system
JP4517465B2 (en) Image information converting apparatus and method, and encoding apparatus and method
JPH06233292A (en) Picture signal transmitting device
JP2004532568A (en) Video communication

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090331

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090601

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090714

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090914

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091013

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100413

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100426

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130514

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130514

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140514

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees