JPH0281590A - 動画像符号化方式 - Google Patents

動画像符号化方式

Info

Publication number
JPH0281590A
JPH0281590A JP63232216A JP23221688A JPH0281590A JP H0281590 A JPH0281590 A JP H0281590A JP 63232216 A JP63232216 A JP 63232216A JP 23221688 A JP23221688 A JP 23221688A JP H0281590 A JPH0281590 A JP H0281590A
Authority
JP
Japan
Prior art keywords
face
detection result
result
area
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63232216A
Other languages
English (en)
Inventor
Hideyuki Ueno
秀幸 上野
Kenji Datake
健志 駄竹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP63232216A priority Critical patent/JPH0281590A/ja
Priority to EP89301739A priority patent/EP0330455A3/en
Priority to US07/313,941 priority patent/US4951140A/en
Publication of JPH0281590A publication Critical patent/JPH0281590A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明はテレビ会議、テレビ電話等における動画像の伝
送に用いられる動画像符号化方式に関する。
(従来の技術) 近年動画像?〕号化方式は標準化を目前にしてますます
活発に研究されてきている。また、さらに将来的な符号
化方式として、知的符号化なども提案され、研究の一方
向として画像に関する知識をfI+■らかの形で利用し
た符号化方式が検討されてきている。このような方式の
1つとして、人物画像よりその顔領域を検出し、顔領域
にビットを多く配分することによって顔領域の画質を向
上させようという考え方がある。(例えば、本発明者に
よる提案:特願昭62−236130号など)。
このような方式においては、顔領域の検出の仕方が重要
なポイントとなる。現在提案されている方式はすべて、
処理の前車さと実時間性より、フレ−ム間差分を利用し
た方式となっている。
すなわち顔領域にビットを多く配分する方式を実際のコ
ーデックに適用する場合、顔領域の検出は常に良好に行
われることが画質を良好に保つために重要となる。すな
オ〕ち、フレームによって顔領域が検出されたりされな
かったりするようなことになれば、顔領域は高画質と低
画質の女動がはげしくなり視覚上の大きな歪を引き起こ
し、動き?117償等符号化方式+]体の効率低下を招
くことにもなる。また、顔領域として検出される領域の
大きさか短時間に極端に変化することも同様の意味で好
ましくないといえる。
しかし現状として顔領域の検出方法としては、−に連し
たようにフレーム間差分に蟻づいた方式のみが実用可能
な方法として提案されてるに剥ぎない。フレーム間差分
を用いる場合、被写体が常に動きをもつ場合には、顔検
出も常に良好に行われるが、実際には、人物等が写って
いる場合でも、動きが小さくなったり、はとんど静止し
てしまったりするようなことも起こりうる。
(発明が解決しようとする課題) 上述したように被写体の動きが小さくなったりあるいは
ほとんど静止状態において、現状のフレーム間差分方式
では顔領域が検出されない場合が起りつる。そうすると
、顔領域が実際に検出される場合とされない場合で著し
く画質が変化し、視覚的にも大きな歪を引き起こしてし
まう。
そこで本発明はこのような問題を解決し、実際のシーン
においても常に良好な顔領域検出を行い得る視覚的にも
良好な画質を保ち得る動画像符号化方式を提供すること
にある。
[発明の構成〕 (問題を解決するための手段) この発明では、顔領域検出回路により検出された検出結
果をみて、その検出結果が妥当なしのであるか否かを判
定し、前回利用した検出結果を蓄えておく。検出結果の
妥当性とは、例えば検出された領域の大きさやその時間
的変化、位置の変化等に基づいた規則により判定する。
(作 用) 顔領域が検出された結果の妥当性を常に判定し、妥当で
ない場合には前回の結果を利用することによって、良好
な検出結果を利用する。これにより、画質を良好に保つ
ことができる。さらに、妥当でない場合には前回の検出
結果を徐々に広げて使う方法を用いることにより人物の
静止によって余った情報を使って背景もきれいに伝送す
ることができるようになる。
(実施例) 以下、本発明の実施例を図面を参照して説明する。
第1図は本発明に係る動画像初号化装置の一実施例を示
すブロック図である。
第1図において入力された画像は、まず駒おとし制御回
路100を通り、符号化フレームのみがフレームメモリ
101に蓄えられて処理される。
駒おとし制御回路100はバッファ103のバッフアロ
がある閾値を越えている場合に入力フレームを駒おとし
する回路である。入力されたフレームデータはフレーム
遅延回路104を経て遅延されたデータと遅延されない
データとに分けられて顔役出回路105に入力される。
顔役出回路105では入力された2つのフレームデータ
のフレーム間2分より入力画像の顔領域を検出してその
検出結果を出力する。出力結果は顔領域−1゜顔量外−
〇のような形で表わされるマツプでもよいし、顔領域を
長方形や円で囲んだ場合に各図形を表わす座標として出
力してもよい。顔役出回路105の検出結果は検出結果
判定回路106においてその妥当性の検証がなされる。
具体的には、検出結果判定回路106はまず検出結果よ
り顔領域の面積を計算しその値がある閾値よりも小さい
場合にその検出結果は妥当でないというrl+定を下す
。あるいは領域が長方形で表される場合にはその縦、横
の辺の長さを独立に各々ある閾値と比較して、いずれか
一方でも閾値より小さい場合にはその検出結果は妥当で
ないという判定を下す。さらに前の検出結果と新しい検
出結果とを比較して、その面積の変化や位置の変化が急
だった場合に検出結果が妥当でないと判定させるように
することも容易にできる。検出結果が妥当であるか否か
の’I’l+定結果は、切替回路109に送られる。切
替回路109はその判定結果により、妥当である場合に
は面検出回路105よりの検出結果を、妥当でない場合
には、検出結果保存回路107、検出結果拡大回路10
8よりの前回の検出結果(あるいはそれを修正したもの
)を新しい検出結果として?:)帰化回路102及び検
出結果保1j回路107に送出する。この検出結果は、
符号化回路102において顔と頭具外のピント配分を変
えるという形で使われると共に、次回の顔検出結果が妥
当でなかった時のために、このデータが検出結果保存回
路107に保存しておく。検出結果拡大回路108は検
出結果保存回路107に保存された検出結果をある決め
られた規則(例えば上下左右に10画素分ずつ拡大する
など)により拡大する回路である。この回路により、検
出結果が妥当でない状況か続いた場合、第2図に示すよ
うに徐々に頭領域か拡大されていくことになる。この回
路の効果により例えば人物が静止して顔検出がうまくい
かなくなっても頭領域の画質が低ドするどころか逆に発
生情報量が減って余ったビット数を使って背景もきれい
にすることができるようになる。
なお、バッファ103より符号化回路102、駒おとし
制御回路100にバッフアロを示す情報が送られ、これ
により符号化及び駒おとじの制御がかかる点は従来の符
号化装置と同様である。
次に面検出回路105において行われる顔検出方法の一
例について以下に説明する。第3図は第1図の面検出回
路105ば入力される2つのフレームのフレーム間差分
画像を示している。上記フレーム間差分画像についてま
ずあらかじめ設定した第一の閾値により2値化を行い、
縦方向及び横方向について第一の閾値以上の値をもつ画
素数のヒストグラムを作成する。顔検出はまず頭頂の検
出より行う。頭IJjは上記縦方向のヒストグラムを上
より探索し、あらかじめ設定された第二の閾値を初めて
越えた点(第3図のy )を選択することにより得られ
る。頭頂が得られた後には頭部の左端及び右端の検出を
行う。頭部の左端右端の検出も基本的には頭頂と同様に
横方向のヒストグラムを左及び右から探索し、初めて第
2の閾値を越えた点を選択することにより行う。但し、
このようにすると、肩の幅をもつ領域を検出してしまう
ので、横方向のヒストグラムは頭頂から第3図の幅Δの
部分についてのみ作成することにより頭部幅をもつヒス
トグラムを得る。この場合、幅Δは頭の幅か変化しない
領域を調へる等の1(雑な処理を行うことにより得る方
法もあるが、簡易的な方法として頭頂を検出した座標y
 により適応的に定める方法も考えられる。例えば画像
の大きさをXXYとした!1、rに、 Δり (Y−y)X  β β −1/ 4  (orl  / 5 )により決定
するなどの方法が6゛えられる。最後に頭領域下端を決
定する。頭領域下端はヒストグラムより得るのは比較的
困難なので、頭部幅にある一定の比率γをかけて頭部長
とする方法が考えられる。γの値としては1.3〜1.
6程度の値が適当であると考えられる。以下の1:ψ作
により第5図に示すように頭領域をそれを包囲する長方
形によって指定することができ、この長方形内部にその
外部よりも多いビット配分を行うことができることにな
る。
次に第4図により顔nfl域の別の検出方法の例を示ず
。第3図の例では各端点座標X、、X、。
ys”cは1画素単位の分解能で得られたが、実際にブ
ロック単位で7〕号化を行う方式に顔検出十ビット配分
差別ガ式を適用しようとする場合、ビット配分差別もお
のずから符号化ブロック単位とならざるを得ない。そこ
で、第4図に示すようにフレーム間差分画像をある大き
さのブロックに分割しくこのブロックの大きさは符号化
ブロックよりも小さくてもよいし、同じ大きさでもよい
)、上記ブロック内であらがしめ設定された第一の閾値
を越える画素数をカウントする。次に画面上左端より走
査式に上記ブロック内のカウント数を第二の閾値と比較
しつつ探索し、初めて第二の閾値を越えたブロックのy
座標y を頭頂、そのあとあるΔ(Δは例えば第3図の
例と同様にして定める)の範囲で探索し得られた、カウ
ント数が第二の閾値よりも大きいブロックのうち最左座
標をもつブロックの座標を頭領域の左端座標X 1最右
座標をもつブロックの座標を頭領域の右端X とする。
頭領域下端座標y は例えば第3図の例と同様の方法を
用いて決定する。
次に、第1図の符号化回路102の具体例として考えら
れるものを2.3あげて説明する。第1図の説明では述
べなかったが、ここで用いる符号化方式によっては、頭
領域の検出結果を受信側に送出する必要が出てくるため
、注意が必要である。
第6図、第7図は符号化回路の具体例を表わすブロック
図である。第6図は動き補償フレーム間予11+DCT
(ディスクリートコサイン変換)を用いた?コ号化方式
において、量子化ステップサイズを頭領域と顔以外の領
域とで変えることにより頭領域に多くビット配分を行う
符号化方式である。
量子化ステップサイズはステップサイズ決定回路611
により、顔以外の領域のステップサイズをα(α〉1)
倍することにより決定される。ステップサイズ決定回路
611のブロック図を第8図に示す。′:j56図の他
のブロックは従来の動き補償フレーム間予測+DCTを
用いた符号化装置と同じである。
本方式では、類6fj域と顔以外の領域において異なる
量子化ステップサイズを用いるため、顔検出の結果を何
らかの形で受信側に送ることが必要となる。しかし例え
ば頭領域が第5図に示されるように長方形で表現されて
いる場合、送る必要のある情報は第5図のXs +  
xe l  ”’  の3座標のみであり、各8 bi
tで表現するとしても高々24bitの付加情報のみで
すむ。
第7図は動き補償フレーム間予i’l#I + D C
Tを用いた符号化方式において、送るDCT係数の個数
を頭領域と顔以外の領域とで変えることにより頭領域に
多くビット配分を行う符号化方式である。
入力されたフレームデータが706〜709よりなる動
き補償及び613〜615よりなる顔検出に用いられる
点は第1図の実施例と全く同様である。差分回路701
により得られた動き補償フレーム間予ulご;疋信号が
D C”1−回路702によりDCTされる点も同様で
ある。本実施例の特徴は走査変換回路711において、
顔検出の結果を用いた適応的な変換係数の打切を行う点
にある。
以下第9図を用いてこの点を説明する。第9図はDCT
後の変換係数領域のブロックを示している(この例では
8×8ブロツク)。この変換係数は図に示すようにラス
クスキャン→ジグザグスキャンに走査方法の変換が行わ
れて送出される。このジグザグスキャンにより高域成分
はど後に走査されるようになる。ところで、前段の量子
化により値0に量子化されるデータは一般に高域はど発
生しやすくなっているため、データの送出は走査順に係
数を見て最後の非Oの係数の後にEOB(Iシnd o
f’ Block)をつけることによりその後のO係数
の系列をEOBで置きかえて送る方式がとられることが
ある。このような方式において顔検出回路615よりの
顔検出結果を用いてビット配分を変えるために、本実施
例では、頭領域においては通常の送出、すなわち最後の
非O係数後にE OB +!人としく第9図(a) )
 、顔以外の領域においては強制的に固定位置にEOB
を挿入して以後の係数の打切りを行う(第9図(b))
。このことにより顔以外の領域の係数の数を減少させて
ビット割当を少なくすることができる。本方式では、顔
検出の結果を受信して送る必要はない。
[発明の効果] この発明によれば、頭領域の検出を行って顔以外の領域
よりも多くのビット配分を行う方式においてフレーム間
差分を用いた顔領域検出結果を安定した良好なものとな
らしめることができ、視覚上も良好な画質を提供するこ
とができる。さらに人物が静止することにより余ったビ
ット数を使って背景もきれいにすることができ、レート
の有効利用にもつながる。
【図面の簡単な説明】
第1図は本発明に係る符号化装置の一実施例を示すブロ
ック図、第2図は顔領域検出結果が妥当でない場合に、
頭領域が徐々に広がっていくことを示す図、第3図、第
4図は頭領域検出の原理の−例を示す図、第5図は面領
域を長方形によって囲むことを示す図、第6図、第7図
は第1図の符号化回路の実施例を示す図、第8図は第6
図のステップサイズ決定回路の構成例と示すブロック図
、第9図は第7図の実施例におけるビット配分差別化の
原理を示す図である。

Claims (2)

    【特許請求の範囲】
  1. (1)入力動画像を符号化し、入力動画像のフレーム間
    差分より人物の顔領域を検出し、この顔領域の検出結果
    を利用して、顔領域に顔以外の領域よりも多くのビット
    割当てを行なう動画像符号化方式であって、前記フレー
    ム間差分よりの顔検出の結果が所定の値に達しない場合
    には、前回の検出結果を利用することを特徴とする動画
    像符号化方式。
  2. (2)入力動画像を符号化し、入力動画像のフレーム間
    差分より人物の顔領域を検出し、この顔領域の検出結果
    を利用して、顔領域に顔以外の領域よりも多くのビット
    割当てを行なう動画像符号化方式であって、フレーム間
    差分よりの顔検出結果が所定の閾値に達しない場合には
    、前回検出された領域を徐々に広げることを特徴とする
    動画像符号化方式。
JP63232216A 1988-02-22 1988-09-19 動画像符号化方式 Pending JPH0281590A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP63232216A JPH0281590A (ja) 1988-09-19 1988-09-19 動画像符号化方式
EP89301739A EP0330455A3 (en) 1988-02-22 1989-02-22 Image encoding apparatus
US07/313,941 US4951140A (en) 1988-02-22 1989-02-22 Image encoding apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63232216A JPH0281590A (ja) 1988-09-19 1988-09-19 動画像符号化方式

Publications (1)

Publication Number Publication Date
JPH0281590A true JPH0281590A (ja) 1990-03-22

Family

ID=16935802

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63232216A Pending JPH0281590A (ja) 1988-02-22 1988-09-19 動画像符号化方式

Country Status (1)

Country Link
JP (1) JPH0281590A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0432386A (ja) * 1990-05-29 1992-02-04 Nec Corp 画像符号化装置
US7756299B2 (en) 2004-12-14 2010-07-13 Honda Motor Co., Ltd. Face region estimating device, face region estimating method, and face region estimating program
JP2010278797A (ja) * 2009-05-29 2010-12-09 Canon Inc 画像符号化装置
WO2013088657A1 (ja) * 2011-12-16 2013-06-20 日本電気株式会社 投射型投影装置、光防眩方法、および光防眩用プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0432386A (ja) * 1990-05-29 1992-02-04 Nec Corp 画像符号化装置
US7756299B2 (en) 2004-12-14 2010-07-13 Honda Motor Co., Ltd. Face region estimating device, face region estimating method, and face region estimating program
JP2010278797A (ja) * 2009-05-29 2010-12-09 Canon Inc 画像符号化装置
WO2013088657A1 (ja) * 2011-12-16 2013-06-20 日本電気株式会社 投射型投影装置、光防眩方法、および光防眩用プログラム

Similar Documents

Publication Publication Date Title
JP3197420B2 (ja) 画像符号化装置
KR100298416B1 (ko) 구획 분류 및 적응 비트 할당을 위한 방법 및 장치
JP3258840B2 (ja) 動画像符号化装置および領域抽出装置
US5543846A (en) Motion picture encoding system
JP3068304B2 (ja) 動画像符号化方式および復号化方式
JP2920209B2 (ja) 動画像の符号化によるブロック化現象除去方法
US7162096B1 (en) System and method for dynamic perceptual coding of macroblocks in a video frame
TWI643494B (zh) 畫像解碼裝置、畫像解碼方法、畫像編碼裝置、畫像編碼方法以及編碼資料的資料構造
JPH06217292A (ja) モーション補償を備えたフレーム間ハイブリッド符号化システムにおいて量子化アーティファクトを低減する装置
US6178265B1 (en) Method and apparatus for motion vector compression
EP1821548B1 (en) Method for pre-suppressing image noise.
EP0680217B1 (en) Video signal decoding apparatus capable of reducing blocking effects
JPH08154251A (ja) 画像信号補間装置
JP3046379B2 (ja) 画像符号化装置
CN112887587B (zh) 一种可进行无线连接的自适应图像数据快速传输方法
US20080205527A1 (en) Video decoding device and method, and video coding device
JP2001045494A (ja) 画像符号化装置
JPH0281590A (ja) 動画像符号化方式
EP3926584A1 (en) Method, computer program and system for detecting changes and moving objects in a video view
CN113453007A (zh) 一种提高监控场景h264编码效率的方法
JPH07203436A (ja) 画像符号化装置
JPH06169452A (ja) 画面に重み付けを持たせた画像圧縮方式
JPH06233292A (ja) 画像信号伝送装置
JP3005147B2 (ja) 動画像符号化装置
JP2021013145A (ja) 動画像伝送装置、動画像伝送方法