JP2004179997A

JP2004179997A - 双方向コミュニケーションシステム，映像通信装置，および映像通信装置の映像データ配信方法

Info

Publication number: JP2004179997A
Application number: JP2002344164A
Authority: JP
Inventors: Ryohei Okada; 良平岡田
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2002-11-27
Filing date: 2002-11-27
Publication date: 2004-06-24
Anticipated expiration: 2022-11-27
Also published as: JP4100146B2

Abstract

【課題】特徴を有する領域を的確に判断し，各領域に応じて圧縮符号化を制御することが可能な双方向コミュニケーションシステム，映像通信装置，映像データ配信方法を提供する。
【解決手段】ネットワーク（１０５）に接続された映像配信ユニット（１０１）は，映像データを生成する撮像装置（１０２）と，映像データを伝送データに圧縮符号化するエンコーダ部（２０６）及び伝送データを映像データに伸長するデコーダ部（２０８）を少なくとも備える映像通信装置（１０４）と，映像データを表示する出力装置（１０３）とを備え，送り手側の一の映像配信ユニットは，映像データのうち，少なくとも特徴領域と特徴領域に属さない領域との領域ごとに圧縮符号化された伝送データを，受け手側の他の映像配信ユニットに対して配信する。
【選択図】図１

Description

【０００１】
【発明の属する技術分野】
本発明は，映像配信ユニット間において映像データを送受信可能なシステムにかかり，特に双方向コミュニケーションシステム，映像通信装置，映像データ配信方法に関する。
【０００２】
【従来の技術】
近年，コンピュータなどの情報処理装置の高機能・低価格化による広範な普及と，ディジタル回線を始めとするネットワークのブロードバンド化に伴い，例えばデータ，音声，または映像などをやり取りするマルチメディア通信環境が急速に整備され始めている。
【０００３】
マルチメディア通信環境は，代表的な例として，音声及び画像を双方向でやり取りすることによりコミュニケーションを図るテレビ電話／テレビ会議システム（双方向コミュニケーションシステム）などのサービスがある（例えば，特許文献１参照）。なお，本願発明に関連する技術文献情報には，次のものがある。
【０００４】
【特許文献１】
特開平７−６７１０７号公報
【０００５】
【発明が解決しようとする課題】
しかしながら，映像データを伝送する場合において，映像データを圧縮符号化する際，１フレーム全体を画一的に圧縮符号化する場合が多く，帯域に大幅な制限があるネットワークを介して，情報量の多い画像データを送信するには，画一的に全体の画質を下げなければならなかった。
【０００６】
また，例えば，フレーム内に人間の顔など，映像を把握するのに不可欠な要素となる注目される特徴を有する領域（特徴領域）に対する映像データを個別に検出しても，的確に検出されない場合が多く，したがって，上記特徴領域についても画質が下がる状態で圧縮符号化され，視認性の低い映像データがネットワークを介して，接続先の相手に表示されていた。
【０００７】
本発明は，上記のような従来の問題点に鑑みてなされたものであり，特徴を有する領域を的確に判断し，各領域に応じて圧縮符号化を制御することが可能な，新規かつ改良された双方向コミュニケーションシステムを提供することを目的としている。
【０００８】
【課題を解決するための手段】
上記課題を解決するため，本発明の第１の観点によれば，１又は２以上の映像配信ユニット間を接続するネットワークを備えた双方向コミュニケーションシステムが提供される。この双方向コミュニケーションシステムの映像配信ユニットは，映像データを生成する撮像装置と；映像データを伝送データに圧縮符号化するエンコーダ部及び伝送データを映像データに伸長するデコーダ部を少なくとも備える映像通信装置と；映像データを表示する出力装置とを備え，送り手側の一の映像配信ユニットは，映像データのうち，少なくとも特徴領域と特徴領域に属さない領域との領域ごとに圧縮符号化された伝送データを，受け手側の他の映像配信ユニットに対して，配信することを特徴としている。
【０００９】
本発明によれば，相互に映像データの送受信可能な映像配信ユニット間において，撮影された映像データのうち，視点が注目される特徴を有する領域（特徴領域）が検出されると，上記特徴領域と，特徴領域以外の領域とに区別し，領域に応じて圧縮符号化する。かかる発明によれば，例えば量子化パラメータが映像データ全体につき一律ではなく，特徴領域に対しては量子化パラメータを小さくし，特徴領域以外の領域に対しては量子化パラメータを大きくして圧縮符号化することにより，領域に応じた差別化を図れる。したがって，映像データのストリーム配信時に，画質が低くてもよい特徴領域以外の領域に対してデータ容量の軽減化，および特徴領域に対して視認性の高い画質の維持された映像データを表示させることができる。
【００１０】
映像通信装置は，特徴領域情報に基づき，圧縮符号化するために必要なパラメータである符号化パラメータを生成する符号化制御部を，さらに備えるように構成することができる。かかる構成により，映像データを圧縮符号化する際に，例えば映像データのフレーム単位であるフレーム画像のうち，検出された顔領域に対しては量子化パラメータを小さくし画質を向上させ，または顔領域以外の領域に対しては量子化パラメータを大きくし画質を落としデータ量を軽減するように，エンコーダ部に指示するための符号化パラメータを生成することができる。なお，映像データのフレーム単位であるフレーム画像に限定されず，例えば，映像データのフィールド単位であるフィールド画像または複数フレームから構成されるシーン単位であるシーン画像などの場合であってもよい。
【００１１】
エンコーダ部は，符号化パラメータに基づき映像データを伝送データに圧縮符号化するように構成することができる。かかる発明により，例えば，フレーム画像のうちオブジェクトとして特徴領域を切り出し，顔領域に限り圧縮符号化するように符号化パラメータによって制御されることができる。なお，フレーム画像に限定されず，例えば，フィールド画像またはシーン画像などの場合であってもよい。
【００１２】
特徴領域情報は，少なくとも顔領域の面積情報，顔領域の位置情報，または顔領域の信頼度情報が含まれる顔領域情報であるように構成することができる。かかる構成により，フレーム画像に構成されるマクロブロックのうち顔領域に属すマクロブロックを，信頼度に基づき的確に特定することが可能となる。なお面積情報は，例えば画素単位に示され，位置情報は，ＸＹ座標などにより示される。なお，特徴領域は，顔領域に限定されず，その他特徴を有するいかなる領域であってもよい。
【００１３】
符号化制御部は，映像データから特徴領域情報が生成された場合，当該映像データよりも少なくとも１フレーム又は１フィールド前に圧縮符号化された映像データの特徴領域情報に基づき，当該映像データの特徴領域情報を補正するように構成することができる。かかる構成により，フレーム画像内に複数の特徴領域が検出された場合に，検出されたフレーム画像よりも，例えば１フレーム，１フィールド，または１シーンなど前に検出された特徴領域情報に含まれる例えば信頼度などの情報に基づき，上記フレーム画像に関する適正な特徴領域情報に補正することができる。なお，フレーム画像に限定されず，例えば，フィールド画像またはシーン画像などの場合であってもよい。
【００１４】
映像通信装置は，ネットワークの混雑状況を検知する検査部を，さらに備えるように構成することができる。かかる構成により，ネットワークの混雑状況を把握することで，混雑状況に見合った伝送データ容量に基づきネットワークを介して配信することが可能となる。したがって，ネットワークトラフィックに対して負荷を最小限に留め，通信効率の向上を図れる。
【００１５】
符号化制御部は，ネットワークの混雑状況に応じて，特徴領域にかかる符号化パラメータと，特徴領域に属さない領域にかかる符号化パラメータとを変更するように構成することができる。かかる構成により，ネットワークトラフィックが混雑してくると，送信可能なデータ容量が限られてくるため，映像データであるフレーム画像のうち特徴領域のオブジェクトを切出して，上記オブジェクトに対しては高画質の状態で圧縮符号化し，伝送する。特徴領域以外の領域に対しては，圧縮符号化せず削除又は無視される。したがって，映像データの視認の上で不可欠な要素である特徴領域だけを切り出して送信するため，少ないデータ容量で，視認性の高い映像データを配信することができる。なお，混雑状況は，１又は２以上の閾値を段階的に設定しておくことで，混雑状況の段階に応じて，柔軟に画質及びデータ容量を変動させ，配信できる。また，フレーム画像に限定されず，例えば，フィールド画像またはシーン画像などの場合であってもよい。
【００１６】
符号化制御部は，特徴領域にかかる映像データの符号化パラメータと，特徴領域に属さない領域にかかる映像データの符号化パラメータとを，少なくともフレーム，フィールド，またはシーン単位に変更するように構成してもよい。
【００１７】
符号化制御部は，特徴領域にかかる映像データを，別オブジェクトとして切り出すように構成してもよい。かかる構成により，フレーム画像の特徴領域に属すマクロブロックに限定して圧縮符号化することができる。さらに，特徴領域に属さないマクロブロックに対して圧縮符号化するか否かを制御することができる。したがって，例えばネットワークのトラフィックなどに応じて柔軟に映像データを圧縮符号化できる。なお，フレーム画像に限定されず，例えば，フィールド画像またはシーン画像などの場合であってもよい。
【００１８】
エンコーダ部は，少なくともＨ．２６３又はＭＰＥＧ−４の圧縮符号化方式により，映像データを圧縮符号化するように構成することができる。なお，Ｈ．２６３又はＭＰＥＧ−４に限定されず，ＩＴＵ−Ｔ勧告Ｈ．２６１などの場合でもよい。
【００１９】
映像通信装置は，特徴領域にかかる映像データを少なくともモザイク変換する特殊処理部を，さらに備えるように構成することができる。かかる構成により，フレーム画像に検出された特徴領域について，モザイク変換または他の画像に置換などの特殊な処理をすることで，特徴領域を正確に認識できないようにすることができる。なお，フレーム画像に限定されず，例えば，フィールド画像またはシーン画像などの場合であってもよい。さらに，特徴領域以外の領域について，モザイク変換または他の画像に置換などの特殊な処理をする場合でもよい。
【００２０】
映像データは，少なくとも画像データもしくは音声データのうちいずれか一方又は双方であるように構成することができる。
【００２１】
さらに，本発明の別の観点によれば，ネットワークに接続された１又は２以上の映像配信ユニットに備わる映像通信装置が提供される。なお映像配信ユニットは，映像データを生成する撮像装置と，映像データを表示する出力装置とをさらに備えている。この映像通信装置は，撮像装置により生成された映像データから特徴領域を検出し，特徴領域情報を生成する特徴検出部と；特徴領域情報に基づき符号化パラメータを生成する符号化制御部と；符号化パラメータに基づき映像データを伝送データに圧縮符号化するエンコーダ部と；伝送データを映像データに伸長するデコーダ部とを備えていることを特徴としている。
【００２２】
本発明によれば，相互に映像データの送受信可能な映像配信ユニット間において，撮影された映像データのうち，視認する上で不可欠な要素である特徴を有する領域（特徴領域）が検出されると，ネットワークの混雑状況を勘案し，上記特徴領域と，特徴領域以外の領域とを区別し，各領域に応じて圧縮符号化する。かかる発明によれば，特徴領域に対しては量子化パラメータを小さくし画質を通常の圧縮符号化時よりも向上させ，特徴領域以外の領域に対しては量子化パラメータを大きくして圧縮符号化することにより，ネットワークに負荷のかからない程度データ容量を軽減しつつ，視認性の高い映像データを配信先の出力装置に表示することができる。なお，この映像通信装置は，上記双方向コミュニケーションシステムで採用される映像通信装置とほぼ同様の構成を有する。
【００２３】
特徴領域情報は，少なくとも顔領域の面積情報，顔領域の位置情報，または顔領域の信頼度情報が含まれる顔領域情報であるように構成することができる。かかる構成により，フレーム画像に構成されるマクロブロックのうち顔領域に属すマクロブロックを，信頼度に基づき的確に特定することが可能となる。なお面積情報は，例えば画素単位に示され，位置情報は，ＸＹ座標などにより示される。なお，特徴領域は，顔領域に限定されず，その他特徴を有するいかなる領域であってもよい。
【００２４】
符号化制御部は，映像データから特徴領域情報が生成された場合，当該映像データよりも少なくとも１フレーム前に圧縮符号化された映像データの特徴領域情報に基づき，当該映像データの特徴領域情報を補正するように構成してもよい。
【００２５】
映像通信装置は，ネットワークの混雑状況を検知する検査部を，さらに備えるように構成してもよく，符号化制御部は，ネットワークの混雑状況に応じて，特徴領域にかかる符号化パラメータと，特徴領域に属さない領域にかかる符号化パラメータとを変更するように構成してもよい。
【００２６】
符号化制御部は，特徴領域にかかる映像データの符号化パラメータと，特徴領域に属さない領域にかかる映像データの符号化パラメータとを，少なくとも映像データのフレーム，フィールド，またはシーン単位に変更するように構成してもよい。
【００２７】
符号化制御部は，特徴領域にかかる映像データを，別オブジェクトとして切り出すように構成してもよく，エンコーダ部は，少なくともＨ．２６３又はＭＰＥＧ−４の圧縮符号化方式により，映像データを圧縮符号化するように構成してもよい。
【００２８】
映像通信装置は，特徴領域にかかる映像データを少なくともモザイク変換する特殊処理部を，さらに備えるように構成してもよい。
【００２９】
さらに，本発明の別の観点によれば，ネットワークに接続され，少なくとも映像データを生成し，映像データを表示する１又は２以上の映像配信ユニットに備わる映像通信装置の映像データ配信方法が提供される。この映像通信装置の映像データ配信方法において，映像通信装置は，映像データから特徴領域情報を生成し；特徴領域情報に基づき符号化パラメータを生成し；符号化パラメータに基づき映像データを伝送データに圧縮符号化することを特徴としている。
【００３０】
特徴領域情報は，少なくとも顔領域の面積情報，顔領域の位置情報，または顔領域の信頼度情報が含まれる顔領域情報であるように構成してもよい。
【００３１】
映像通信装置は，映像データから特徴領域情報が生成された場合，当該映像データよりも少なくとも１フレーム前に圧縮符号化された映像データの特徴領域情報に基づき，当該映像データの特徴領域情報を補正するように構成してもよい。
【００３２】
映像通信装置は，ネットワークの混雑状況を検知する検査部を，さらに備えるように構成してもよく，映像通信装置は，ネットワークの混雑状況に応じて，特徴領域にかかる符号化パラメータと，特徴領域に属さない領域にかかる符号化パラメータとを変更するように構成してもよい。
【００３３】
映像通信装置は，特徴領域にかかる映像データの符号化パラメータと，特徴領域に属さない領域にかかる映像データの符号化パラメータとを，少なくとも映像データのフレーム，フィールド，またはシーン単位に変更するように構成してもよい。
【００３４】
映像通信装置は，特徴領域にかかる映像データを，別オブジェクトとして切り出すように構成してもよく，映像通信装置は，少なくともＨ．２６３又はＭＰＥＧ−４の圧縮符号化方式により，映像データを圧縮符号化するように構成してもよい。
【００３５】
映像通信装置は，さらに，特徴領域にかかる映像データを少なくともモザイク処理又は他の映像データに置換処理するように構成してもよい。
【００３６】
【発明の実施の形態】
以下，本発明の好適な実施の形態について，添付図面を参照しながら詳細に説明する。なお，以下の説明及び添付図面において，略同一の機能及び構成を有する構成要素については，同一符号を付することにより，重複説明を省略する。なお，本発明にかかる特徴検出部は，例えば，本実施の形態にかかる顔検出ブロック２０３などに該当する。
【００３７】
（１．システム構成）
まず，図１を参照しながら，本実施の形態にかかる双方向コミュニケーションシステムについて説明する。図１は，本実施の形態にかかる双方向コミュニケーションシステムの概略的な構成を示すブロック図である。
【００３８】
図１に示すように，双方向コミュニケーションシステムは，１又は２以上の映像配信ユニット１０１（ａ，ｂ，…，ｎ）がネットワーク１０５に接続されている。
【００３９】
上記映像配信ユニット１０１（ａ，ｂ，…，ｎ）により，使用者１０６（ａ，ｂ，…，ｎ）は，ネットワーク１０５を介して，お互いの画像又は音声をやりとりすることで例えばテレビ会議システムなどのサービスを受けることができる。
【００４０】
映像配信ユニット１０１（ａ，ｂ，…，ｎ）は，ビデオカメラなどの撮像装置１０２（ａ，ｂ，…，ｎ）と，上記撮像装置１０２の撮影により生成された，映像データを送受信する映像通信装置１０４（ａ，ｂ，…，ｎ）と，映像データを表示する出力装置１０３（ａ，ｂ，…，ｎ）とが備えられている。なお，本実施の形態にかかる映像データは，少なくとも音声データ又は画像データのうちいずれか一方又は双方からなる。
【００４１】
撮像装置１０２は，映像データを生成可能なビデオカメラであり，例えば，テレビ会議，監視・モニタリングなどに適用される低ビットレート通信用のビデオカメラであるが，かかる例に限定されず，本実施の形態にかかる撮像装置１０２は，放送用のニュース番組の取材や，スポーツなどの試合の模様などを撮影するカムコーダなどの場合であっても実施可能である。
【００４２】
出力装置１０３は，映像データを表示することが可能な例えば，ＴＶ装置又は液晶ディスプレイ装置などが例示され，さらにスピーカを備えることにより，音声および画像を出力することが可能な装置である。
【００４３】
映像通信装置１０４は，上記撮像装置１０２により生成された映像データに基づき，使用者１０６の顔である顔領域を検出し，上記顔領域から生成される顔領域情報に基づき，映像データを圧縮符号化し，上記圧縮符号化された伝送データを，ネットワーク１０５を介して送信する。また送信された伝送データを受信し，上記伝送データを伸長する。上記伸長された映像データは，出力装置１０３に送信される。さらに，ネットワーク１０５を介して伝送データを送信する際に，ネットワーク１０５のトラフィックの混雑状況に応じて伝送データを制御する。
【００４４】
なお，本実施の形態にかかる顔領域に基づく圧縮符号化は，少なくともＨ．２６３，またはＭＰＥＧ−４に基づき行われるが，後程詳述する。さらに，ネットワーク１０５のトラフィックの混雑状況の検知についても後程詳述する。
【００４５】
次に，本システムの典型的な動作例について説明する。
【００４６】
ある使用者１０６との間で，例えば，使用者１０６ａと使用者１０６ｂとの間で，テレビ会議をする場合，映像配信ユニット１０１ａに備わる撮像装置１０２ａにより，使用者１０６ａの映像データが生成され，ネットワーク１０５を介して映像配信ユニット１０１ｂに映像データが送信される。
【００４７】
したがって映像配信ユニット１０１ｂに備わる出力装置１０３ｂは，ネットワーク１０５を介して送信された映像データを表示する。また，撮像装置１０２ｂにより，使用者１０６ｂの映像データが生成されて，ネットワーク１０５を介して映像配信ユニット１０１ａに送信され，出力装置１０３ａに表示される。
【００４８】
映像配信ユニット１０１ａと映像配信ユニット１０１ｂとの間で，遠隔地であってもネットワーク１０５を介して映像データを送受信することで，お互いの使用者１０６ａと使用者１０６ｂとのコミュニケーションを図ることができる。
【００４９】
なお，本実施の形態にかかる映像配信ユニット１０１には，撮像装置１０２，出力装置１０３，および映像通信装置１０４とがそれぞれ備わっている場合を例にあげて説明したが，かかる例に限定されず，例えば，１の映像配信ユニット１０１には，映像通信装置１０４及び出力装置１０３を備え，他の映像配信ユニット１０１には，撮像装置１０２及び映像通信装置１０４を備える場合であっても実施可能である。この場合，例えば，駐車場などに駐車された乗用車又は自動二輪車などのナンバープレートを撮像装置１０２により監視する監視システムとしても適用可能である。
【００５０】
（２双方向コミュニケーションシステムの各コンポーネントの構成）
次に，本実施の形態にかかる双方向コミュニケーションシステムの各コンポーネントの構成について説明する。
【００５１】
（２．１ネットワーク１０５）
ネットワーク１０５は，映像配信ユニット１０１（ａ，ｂ，…，ｎ）に備わる映像通信装置１０４（ａ，ｂ，…，ｎ）を相互に双方向通信可能に接続するものであり，典型的にはインターネットなどの公衆回線網であるが，ＷＡＮ，ＬＡＮ，ＩＰ−ＶＰＮなどの閉鎖回線網も含む。また接続媒体は，ＦＤＤＩ（ＦｉｂｅｒＤｉｓｔｒｉｂｕｔｅｄＤａｔａＩｎｔｅｒｆａｃｅ）などによる光ファイバケーブル，Ｅｔｈｅｒｎｅｔ（登録商標）による同軸ケーブル又はツイストペアケーブル，もしくはＩＥＥＥ８０２．１１ｂなど，有線無線を問わず，衛星通信網なども含む。
【００５２】
（２．２映像配信ユニット１０１）
映像配信ユニット１０１（ａ，ｂ，…，ｎ）は，撮像装置１０２（ａ，ｂ，…，ｎ），上記撮像装置１０２の撮影により生成された映像データを送受信する映像通信装置１０４（ａ，ｂ，…，ｎ），もしくは映像データを表示する出力装置１０３（ａ，ｂ，…，ｎ）のうちいずれか一つ又は任意の組み合わせとが備えられている。
【００５３】
（２．２．１撮像装置１０２）
図１に示す撮像装置１０２は，少なくとも１又は２以上の撮像素子（撮像デバイス）が備わる撮像部（図示せず）と，音声が入力されるマイク部（図示せず）と，映像通信装置１０４に映像入力信号として映像データを出力する出力部（図示せず）とを備えている。
【００５４】
上記撮像素子は，受光面に２次元的に設けられた光電変換素子からなる複数の画素により，被写体から受光した光学像を光電変換して画像データとして出力することが可能である。例えば，撮像素子は，多種からなるＣＣＤなどの固体撮像デバイスが挙げられる。
【００５５】
出力部は，撮像部により生成された画像データおよびマイク部から生成された音声データに基づき，映像データを生成し，映像通信装置１０４に映像入力信号として出力する。
【００５６】
なお，本実施の形態にかかる撮像装置１０２に備わる出力部は，映像データを映像通信装置１０４にアナログデータとして出力するが，かかる例に限定されず，Ａ／Ｄ変換部（Ａ／Ｄコンバータ）を備えることにより，ディジタルデータとして出力する場合であっても実施可能である。
【００５７】
（２．２．２映像通信装置１０４）
次に，図２を参照しながら，本実施の形態にかかる映像通信装置１０４について説明する。図２は，本実施の形態にかかる映像通信装置の概略的な構成を示すブロック図である。
【００５８】
図２に示すように，映像通信装置１０４は，撮像装置１０２により送出された映像データをＡ／Ｄ変換する変換部２０１と，映像データを一時的に記憶保持するメモリ部２０２と，映像データに基づき顔領域を検出する顔検出ブロック２０３と，映像データのうち，上記顔領域について少なくともモザイク変換又は他の画像に置換する特殊処理部２０４と，少なくとも顔検出ブロック２０３の検出結果により生成される顔領域情報に基づき符号化パラメータを生成する符号化制御部２０５と，上記符号化パラメータに基づき映像データを圧縮符号化するエンコーダ部２０６と，圧縮符号化された伝送データを送受信する通信部２０７と，通信部２０７により受信された伝送データを伸長するデコーダ部２０８と，映像データをＤ／Ａ変換し，出力装置１０３に送出する変換部２０９とを備える。なお，上記顔検出ブロック２０３及び通信部２０７については，後程詳述する。以下，顔領域は，後程詳述するが，図７に示す顔領域７００または顔領域７０２である。
【００５９】
（２．２．３出力装置１０３）
出力装置１０３は，図２に示すように，変換部２０９によりＤ／Ａ変換された映像データを表示する。また，出力装置１０３は，上記説明の通り，例えば，ＴＶ装置又は液晶ディスプレイ装置などが例示され，音声又は画像を出力することが可能な装置である。
【００６０】
なお，本実施の形態にかかる出力装置１０３は，Ｄ／Ａ変換された映像データを表示する場合を例に挙げて説明したが，かかる例に限定されず，例えば，Ｄ／Ａ変換せずに，ディジタルデータのまま映像データを表示する場合でも実施可能である。
【００６１】
（２．２．４顔検出ブロック２０３）
次に，図２を参照しながら，メモリ部２０２に記憶された映像データに含まれる顔領域を検出する顔検出ブロック２０３及び顔領域検出処理について説明する。
【００６２】
顔検出ブロック２０３は，メモリ部２０２に記憶された映像データをフレーム単位に，映像データから人間の顔画像である顔領域を検出する。したがって，顔検出ブロック２０３には，複数の工程により上記顔領域を検出するために，各部がそれぞれ備わっている。
【００６３】
なお，本実施の形態にかかる顔検出ブロック２０３は，人間の顔領域を検出する場合を例に挙げて説明したが，映像データのうち特徴的な領域を有する場合であれば，かかる例に限定されず，例えば，乗用車のナンバープレート，時計，またはパソコンなどの画像領域を検出する場合であっても実施可能である。
【００６４】
顔検出ブロック２０３は，図２に示すように，リサイズ部２３０と，ウィンドウ切出部２３１と，テンプレートマッチング部２３２と，前処理部２３３と，ＳＶＭ（サポートベクタマシン；ＳｕｐｐｏｒｔＶｅｃｔｏｒＭａｃｈｉｎｅ）識別部２３４と，結果判定部２３５とが備わる。
【００６５】
リサイズ部２３０は，撮像装置１０２により生成された映像データを，メモリ部２０２からフレーム単位に読み出して，当該フレーム単位に読み出された映像データ（以下，フレーム画像）を縮小率が相異なる複数のスケール画像に変換する。
【００６６】
例えば，本実施の形態にかかるフレーム画像が，ＮＴＳＣ方式（ＮａｔｉｏｎａｌＴｅｌｅｖｉｓｉｏｎＳｙｓｔｅｍＣｏｍｍｉｔｔｅｅ方式）の７０４×４８０画素（横×縦）からなる場合，０．８倍ずつ順次縮小して５段階（１．０倍，０．８倍，０．６４倍，０．５１倍，０．４１倍）のスケール画像に変換する。なお以下，上記複数のスケール画像は，１．０倍のスケール画像を第１のスケール画像とし，順次縮小するごとに，第２〜第５のスケール画像とする。
【００６７】
ウィンドウ切出部２３１は，まず第１のスケール画像に対して，画像左上を起点として順にフレーム画像の右下まで，例えば２画素ずつなど，適当な画素ずつ右側又は下側にずらしながらスキャンするようにして，２０×２０画素の矩形領域（以下，ウィンドウ画像と呼ぶ）を順次切出す。なお，本実施の形態にかかるスケール画像の起点は，画像左上である場合に限らず，例えば画像右上などであっても実施可能である。
【００６８】
上記第１のスケール画像から切出された複数のウィンドウ画像は，順次，ウィンドウ切出部２３１により，後続のテンプレートマッチング部２３２に送出される。
【００６９】
テンプレートマッチング部２３２は，ウィンドウ切出部２３１により送出されたウィンドウ画像について，例えば正規化相関法，誤差二乗法などの演算処理を実行してピーク値をもつ関数曲線に変換した後，当該関数曲線に対して認識性能が落ちない程度に十分に低い閾値を設定し，当該閾値を基準として当該ウィンドウ画像の領域が顔領域であるか否かを判断する。
【００７０】
上記テンプレートマッチング部２３２には，予め，例えば１００人程度の人間の顔画像の平均から生成される平均的な人間の顔領域をテンプレートデータとして登録されている。
【００７１】
ウィンドウ画像の領域が顔領域であるか否かの判断は，上記テンプレートマッチング部２３２に顔領域のテンプレートデータとして登録することにより，かかる顔領域か否かの判断基準となる閾値が設定され，当該ウィンドウ画像について，テンプレートデータとなる平均的な顔領域との簡単なマッチングをすることにより判断される。
【００７２】
テンプレートマッチング部２３２は，ウィンドウ切出部２３１により送出されたウィンドウ画像について，テンプレートデータによるマッチング処理を行い，テンプレートデータとマッチングし，顔領域であると判断された場合には，当該ウィンドウ画像をスコア画像（顔領域と判断されたウィンドウ画像。）として後続の前処理部２３３に送出する。
【００７３】
また，上記ウィンドウ画像について，顔領域でないと判断された場合には，当該ウィンドウ画像そのまま結果判定部２３５に送出する。なお，上記スコア画像には，顔領域と判断された度合いがどの程度確からしいのかを示す信頼度情報が含まれる。例えば，信頼度情報は，スコア値が“００”〜“９９”の範囲内の数値を表し，数値が高いほど，より顔領域であることが確からしいことを表す。なお，信頼度情報は，例えば結果判定部２３５に備わるキャッシュ（図示せず。）などに格納される場合でもよい。
【００７４】
上記説明の正規化相関法，誤差二乗法などの演算処理は，後続の前処理部２３３およびＳＶＭ識別部２３４における演算処理と比較すると，演算処理量が１０分の１から１００分の１程度で済むとともに，テンプレートマッチング部２３２によるマッチング処理時点で，８０（％）以上の確率で顔領域であるウィンドウ画像を検出することが可能である。つまり，明らかに顔領域でないウィンドウ画像を，この時点で除去することが可能となる。
【００７５】
前処理部２３３は，テンプレートマッチング部２３２から得られたスコア画像について，矩形領域でなる当該スコア画像から人間の顔領域とは無関係な背景に相当する４隅の領域を抽出するべく，当該４隅の領域を切り取ったマスクを用いて，２０×２０画素あるスコア画像から３６０画素分を抽出する。なお本実施の形態にかかるスコア画像は４隅を切り取った３６０画素分を抽出する場合を例に挙げて説明したが，かかる例に限定されず，例えば，４隅を抽出しない場合であっても実施可能である。
【００７６】
さらに前処理部２３３は，撮像時の照明などにより濃淡で表される被写体の傾き条件を解消するために，例えば平均二乗誤差（ＲＳＭ：ＲｏｏｔＭｅａｎＳｑｕａｒｅ）などによる算出方法を用いて当該抽出された３６０画素のスコア画像の濃淡値に補正をかける。
【００７７】
続いて，前処理部２３３は，当該３６０画素のスコア画像のコントラストが強調された結果のスコア画像を，ヒストグラム平滑化処理を行うことにより，撮像装置１０２の撮像素子のゲイン又は照明の強弱に左右されないスコア画像を検出させることが可能となる。
【００７８】
またさらに，前処理部２３３は，例えばスコア画像をベクトル変換し，得られたベクトル群をさらに１本のパターンベクトルに変換するため，ガボア・フィルタリング（ＧａｂｏｒＦｉｌｔｅｒｉｎｇ）処理を行う。なお，ガボア・フィルタリングにおけるフィルタの種類は必要に応じて変更可能である。
【００７９】
ＳＶＭ識別部２３４は，前処理部２３３からパターンベクトルとして得られたスコア画像に対して顔領域の検出を行う。そして検出された場合，顔領域検出データとして出力する。検出されない場合は，顔領域未検出データとして追加され，さらに学習する。
【００８０】
ＳＶＭ識別部２３４は，前処理部２３３により送出されたスコア画像に基づいて生成されたパターンベクトルについて，当該スコア画像内に顔領域が存在するか否かを判断し，顔領域が検出された場合，当該スコア画像における顔領域の左上位置（座標位置），顔領域の面積（縦×横の画素数），顔領域であることの確からしさを表す信頼度情報，当該スコア画像の切出しの元となるスケール画像の縮小率（第１〜第５のスケール画像に該当する縮小率のうちのいずれか一つ。）とからなる顔領域情報を，例えば結果判定部２３５に備わるキャッシュ（図示せず。）に格納することにより，スコア画像ごとにリスト化する。なお，本実施の形態にかかる顔領域の位置（起点）は，画像左上である場合に限らず，例えば画像右上などであっても実施可能である。
【００８１】
ＳＶＭ識別部２３４により，例えば，第１のスケール画像のうち最初のウィンドウ画像の顔領域の検出が終了すると，ウィンドウ切出部２３１により第１のスケール画像の中の次にスキャンされたウィンドウ画像がテンプレートマッチング部２３２に送出される。
【００８２】
次にテンプレートマッチング部２３２は，当該ウィンドウ画像がテンプレートデータにマッチングした場合のみスコア画像として，前処理部２３３に送出する。前処理部２３３は，上記スコア画像をパターンベクトルに変換してＳＶＭ識別部２３４に送出する。ＳＶＭ識別部２３４は，パターンベクトルに基づき顔領域を検出した場合，上記スケール画像に関する顔領域情報を生成し，上記結果判定部２３５に備わるキャッシュに格納する。
【００８３】
上記記載のように，第１のスケール画像について，ウィンドウ切出部２３１により順次スキャンされたウィンドウ画像について，以降後続のテンプレートマッチング部２３２，前処理部２３３，及びＳＶＭ識別部２３４による各処理が実行され，当該第１のスケール画像から顔領域が含まれるスコア画像を複数検出することが可能となる。
【００８４】
さらに，ウィンドウ切出部２３１による第１のスケール画像のスキャンが全て終了し，後続のテンプレートマッチング部２３２，前処理部２３３，及びＳＶＭ識別部２３４による各処理についても終了すると，第２のスケール画像について，上記説明の第１のスケール画像とほぼ同様に顔領域の検出するための各処理が実行される。第３〜第５のスケール画像についても，第１のスケール画像とほぼ同様にして顔領域の検出処理が実行される。
【００８５】
ＳＶＭ識別部２３４は，メモリ部２０２から読み出した映像データであるフレーム画像を５段階の相異なる縮小率から構成される第１〜第５のスケール画像について，顔領域が検出されたスコア画像をそれぞれ複数検出し，その結果，生成される顔領域情報を，上記結果判定部２３５に備わるキャッシュ（図示せず。）に格納する。なお，本実施の形態にかかるキャッシュは，結果判定部２３５に備わる場合を例に挙げて説明したが，かかる例に限定されず，例えば，顔検出ブロック２０３内に単独で備わる場合などであっても実施可能である。さらに，顔領域が検出されずスコア画像が全く得られない場合もあるが，少なくとも１個など，所定の個数だけスコア画像が得られれば，顔検出処理は続行される。
【００８６】
上記第１〜第５のスケール画像において顔領域が検出されたスコア画像は，ウィンドウ切出部２３１におけるスキャンが所定画素（例えば，２画素など。）ずつ移動しながら実行されているため，前後のスコア画像の間では，近傍領域において高い相関性があり，相互に重なり合う領域を有する場合が多い。
【００８７】
結果判定部２３５は，上記重複する領域を除去するため，２つのスコア画像の位置，スコア画像の画素数，および所定の数式に基づき，重複しているか否かを判定する。
【００８８】
例えば，上記２つのスコア画像の位置として左上角の位置を，Ｘ．Ｙ座標により（Ｘ_Ａ，Ｙ_Ａ），（Ｘ_Ｂ，Ｙ_Ｂ）とそれぞれ表し，スコア画像の画素数（縦×横）を，それぞれＨ_Ａ×Ｌ_Ａ，Ｈ_Ｂ×Ｌ_Ｂ，ｄＸ（＝Ｘ_Ｂ−Ｘ_Ａ），ｄＸ（＝Ｘ_Ｂ−Ｘ_Ａ）とすると，以下に示す（１）式および（２）の関係が同時に成り立つ場合，２つのスコア画像は重なり合うと判定される。
【００８９】
（Ｌ_Ａ−ｄＸ）×（Ｌ_Ｂ＋ｄＸ）＞０・・・・・（１）
【００９０】
（Ｈ_Ａ−ｄＹ）×（Ｈ_Ｂ＋ｄＹ）＞０・・・・・（２）
【００９１】
結果判定部２３５は，当該判定結果に基づいて，複数のスコア画像のうち重なり合う領域を除くことにより，重なり合わない最終的な顔領域を取得し，最終的に確定となる顔領域情報を生成し，上記キャッシュに格納されていた顔領域情報を更新する。なお，本実施形態にかかる格納されていた顔領域情報は，確定された顔領域情報に更新される場合を例に挙げて説明したが，かかる場合に限らず，別途新規に確定された顔領域情報を格納する場合であっても実施可能である。
【００９２】
重なり合う領域が存在する場合，結果判定部２３５は，キャッシュ（図示せず。）に格納されたスコア画像に対応する信頼度情報に基づき，信頼度の高い，つまり顔領域である確からしさが高いスコア画像の方の顔領域情報を生成し，上記キャッシュに格納された当該顔領域情報を信頼度の高い顔領域情報に更新する。
【００９３】
結果判定部２３５は，上記顔領域が検出されない場合，キャッシュに格納処理を行わず，さらに重なり合う顔領域が存在しない場合は，顔領域情報の更新は行わない。
【００９４】
以上から，顔検出ブロック２０３は，撮像装置１０２により撮影された映像データから，信頼性の高い顔領域に対して顔領域情報を生成することが可能となる。したがって，複数の顔領域が検出されても，より確実に，例えば使用者１０６の顔領域を検出することが可能となる。
【００９５】
上記生成された顔領域情報は，図２に示す符号化制御部２０５に送信されて，顔領域情報に基づき，映像データを圧縮符号化するための符号化パラメータが生成される。
【００９６】
なお，本実施の形態にかかる結果判定部２３５による重複領域の判定処理は，（１）式に定められた場合を例に挙げて説明したが，かかる例に限定されず，他の数式を用いた場合であっても実施可能である。
【００９７】
また，本実施の形態にかかるスケール画像をはじめとする画像の位置は，左上隅を基準に表される場合を例に挙げて説明したが，かかる例に限定されず，他の位置を基準とした場合であっても実施可能である。
【００９８】
また，本実施の形態にかかる顔領域の検出される映像データは，フレーム単位に読み込まれて，顔領域が検出処理される場合を例に挙げて説明したが，かかる例に限定されず，例えば，フィールド単位又は複数フレームからなるシーンごとに顔領域の検出処理を行う場合などであっても実施可能である。
【００９９】
また，本実施の形態にかかるテンプレートマッチング２３２に登録されるテンプレートデータは，平均的な人間の顔を示す顔領域が登録される場合を例にあげて説明したが，かかる例に限定されず，例えばテンプレートデータとして，乗用車のナンバープレート，時計，またはペットなどの動物の顔の画像領域が登録される場合であっても実施可能である。
【０１００】
（２．２．５通信部２０７）
次に，本実施の形態にかかる通信部２０７について説明する。通信部２０７は，ネットワーク１０５と接続され，ネットワーク１０５を介して圧縮符号化された伝送データを送信，または伝送データを受信する。
【０１０１】
通信部２０７には，ネットワーク１０５のトラフィックの混雑状況を検知する検査部２１０を備える。検査部２１０は，ネットワーク１０５のトラフィックの混雑状況を検知するため，所定時間ごとに，例えば“ｐｉｎｇ”を利用したＩＣＭＰなどにより，接続先の映像通信装置１０４，または任意のホストに対し動作確認を要求（エコー検査）する。
【０１０２】
検査部２１０は，ｐｉｎｇコマンドにより，少なくとも接続相手先のアドレス情報を設定し，ＩＣＭＰパケットを送信する。接続相手先の例えばホストなどは，上記ＩＣＭＰパケットを受信すると，ｐｉｎｇコマンド発行元の検査部２１０に対し，正常に受信された旨の応答（Ｒｅｐｌｙ）パケットを送信する。なお，正常に接続相手先に受信されない場合（または，制限時間内にＩＣＭＰパケットが受信されなかった場合）は，エラーとなる。
【０１０３】
したがって，検査部２１０は，ＩＣＭＰパケット送信してから上記応答パケットを受信するまでの時間を取得し，トラフィックの混雑状況を検知する。例えば，ネットワーク１０５のトラフィックが平常時において，通信速度が１２８ＫＢｙｔｅ／ｓｅｃ及び上記応答パケットを受信するまでの時間（以下，応答時間）を４０ｍｓｅｃの場合，ある時点の検査部２１０の検査で，上記応答時間が８０ｍｓｅｃと検知されると，検査部２１０は，ネットワーク１０５のトラフィックは混雑していると判断する。
【０１０４】
検査部２１０は，ネットワーク１０５のトラフィックの混雑を検知すると，混雑情報を生成し，符号化制御部２０５に上記混雑情報を送信する。混雑情報はネットワーク１０５のトラフィックの混雑状況を示すデータであり，例えば，応答時間などの情報が含まれる。
【０１０５】
符号化制御部２０５は，上記混雑情報を受信すると，ネットワーク１０５のトラフィックの混雑状況に応じて，マクロブロック単位に映像データの圧縮符号化を制御させるため，符号化パラメータを設定する。例えば，所定時間内の複数フレームの映像データについては圧縮符号化せず，伝送データを送信しないように制御させる，または所定時間内の複数フレームの映像データについては，顔領域に属すマクロブロックだけを圧縮符号化し，伝送データを送信するよう制御させる符号化パラメータが例示される。なお，以下に記載されるマクロブロックは，図５に示すＭＢ５０３を示すこともある。マクロブロックについては，後程詳述する。
【０１０６】
なお，本実施の形態にかかる検査部２１０は，ＩＣＭＰ（ＩｎｔｅｒｎｅｔＣｏｎｔｒｏｌＭｅｓｓａｇｅＰｒｏｔｏｃｏｌ）によりトラフィックの混雑状況を検知する場合を例に挙げて説明したが，かかる例に限定されず，例えばＴＣＰ（ＴｒａｎｓｍｉｓｓｉｏｎＣｏｎｔｒｏｌＰｒｏｔｏｃｏｌ）セグメントなどデータの再送信処理の際に，接続先の相手側から確認応答が返ってくるまでの時間（ＲＴＴ：ＲｏｕｎｄＴｒｉｐＴｉｍｅ）を取得する，または接続先の例えばホストなどに，まとめてデータを送受信することが可能なウィンドウ・サイズ（受信可能なデータサイズ）の変動により混雑状況を検知する場合であっても実施可能である。
【０１０７】
（３．双方向コミュニケーションシステムの動作）
次に，図３を参照しながら，上記のように構成された双方向コミュニケーションシステムの動作の実施形態について説明する。図３は，本実施の形態にかかる双方向コミュニケーションシステムの動作の概略を示すフローチャートである。
【０１０８】
図３に示すように，本実施の形態にかかる双方向コミュニケーションシステムにおいて，例えばテレビ会議などにより複数の使用者１０６が打ち合わせをする場合，打ち合わせされる時間内は絶えず複数の映像配信ユニット１０１間で，相互に映像データをやりとりし，双方向コミュニケーションシステムの動作が継続される。
【０１０９】
したがって，打ち合わせ時間が終了（撮影処理が終了）するまで，映像配信ユニット１０１間で，映像データの配信処理（Ｓ３０１）が続行（配信ループ）される。
【０１１０】
（３．１映像配信ユニット１０１からの映像データ配信処理）
次に，図４を参照しながら，本実施の形態にかかる映像データ配信処理について説明する。図４は，本実施の形態にかかる映像データ配信処理の概略を示すフローチャートである。なお，以下の説明は，ＩＴＵ−Ｔ勧告Ｈ．２６３の場合である映像データ配信処理について説明するが，ＭＰＥＧ−４についても準拠する。
【０１１１】
映像データ配信処理（Ｓ３０１）は，撮像装置１０２の撮影処理により，映像データが生成されると，例えば，ＲＳ−２３２ＣまたはＲＳ−４２２などを介して，映像通信装置１０４の変換部２０１に送出される。
【０１１２】
変換部２０１は，上記映像データをＡ／Ｄ変換し，メモリ部２０２に送出する。映像データが，メモリ部２０２に送出されると，図４に示すように，顔検出ブロック２０３により顔検出処理（Ｓ４０１）が行われる。なお，本実施の形態にかかる顔検出処理は，上記説明したのとほぼ同様の構成であるため省略する。
【０１１３】
顔検出処理（Ｓ４０１）は，メモリ部２０２に送出される映像データのフレーム単位に行われるが，かかる例に限らず，フィールド単位の場合でもよい。また，フレーム単位の映像データであるフレーム画像（ピクチャ）内に顔領域が存在しない，検出されない（Ｓ４０２）場合は，再度顔検出処理（Ｓ４０１）が行われる。
【０１１４】
顔検出処理（Ｓ４０１）の結果，顔領域が検出された（Ｓ４０２）場合は，映像通信装置１０４に備わる結果判定部２３５のキャッシュに格納された顔領域情報が符号化制御部２０５に送信される（Ｓ４０３）。
【０１１５】
符号化制御部２０５は，上記顔領域情報を受信すると，符号化制御部２０５内に備わる記憶部（図示せず。）に格納された少なくとも１フレーム前のフレーム画像にかかる顔領域情報を取得する。なお，取得されるフレーム画像は，１フレーム前に限らず，例えば，複数フレーム前，または１フィールド前などであってもよい。
【０１１６】
上記１フレーム前のフレーム画像（前フレーム画像）にかかる顔領域情報が格納されている場合は，上記受信した現フレーム画像の顔領域情報と，前フレーム画像にかかる顔領域情報とを比較し，補正処理を行う（Ｓ４０５）。
【０１１７】
上記前のフレーム画像にかかる顔領域情報が記憶部に格納されて無い場合（Ｓ４０４），つまり前フレーム画像において顔領域が検出されない場合（Ｓ４０４）には，顔領域情報の補正処理（Ｓ４０５）は実行されない。
【０１１８】
上記補正処理（Ｓ４０５）は，前フレームおよび現フレーム画像にかかる顔領域情報の顔領域の面積情報，位置情報，または信頼度情報のうち少なくとも一つを比較することにより現フレーム画像にかかる顔領域情報を補正する。
【０１１９】
本実施の形態にかかる補正処理（Ｓ４０５）は，例えば，前フレーム画像において１の顔領域のみ存在し，現フレーム画像において２の顔領域が存在し，現フレーム画像においても前フレーム画像で検出された顔領域を選択する場合，現フレーム画像に含まれる前フレーム画像にかかる顔領域情報を，選択するため正確に顔領域情報を判別する必要がある。
【０１２０】
前フレーム画像および現フレーム画像間の時間差は極めて短く，人間の動作によりフレーム画像内を移動可能な範囲は極めて限られているため，符号化制御部２０５は，顔領域情報の面積情報と位置情報とに基づき，現フレーム画像にかかる顔領域のうち，前フレーム画像にかかる顔領域の近傍に存在する顔領域の顔領域情報を選択する。
【０１２１】
選択された顔領域情報のうち信頼度情報が，現フレーム画像の他の信頼度情報または前フレーム画像の信頼度情報に比べて低い場合，前フレーム画像の信頼度情報と同程度もしくは現フレーム画像にかかる他の信頼度情報以上の値に補正する（Ｓ４０５）。したがって，例えば，信頼度情報が最も高い顔領域情報を選択すれば，前フレーム画像の顔領域を現フレーム画像においても正確に選択することが可能となる。なお，本実施の形態にかかる補正処理は，かかる例に限定されない。
【０１２２】
符号化制御部２０５は，補正された現フレーム画像にかかる顔領域情報に基づき，信頼度情報の最も高い顔領域に対してオブジェクトの切出処理（Ｓ４０６）をする。なお，本実施の形態にかかるオブジェクトの切出処理は，信頼度情報の最も高い顔領域に限定されることなく，例えば，信頼度情報に依存しない全ての顔領域，または最も低い信頼度情報を除く他の顔領域全てについて，オブジェクトの切出処理（Ｓ４０６）をする場合であっても実施可能である。
【０１２３】
（３．１．１映像フォーマット）
ここで，オブジェクトの切出処理（Ｓ４０６）を説明する前に，図５を参照しながら，本実施の形態にかかる映像フォーマットについて説明する。図５は，本実施の形態にかかる映像フォーマットの概略的な構成を示す説明図である。
【０１２４】
撮像装置１０２により，ＮＴＳＣ方式又はＰＡＬ方式にて撮影された映像データは，フレーム画像単位に，例えばＩＴＵ−Ｔ勧告に定めるＨ．２６１，Ｈ．２６３，またはＩＳＯ／ＩＥＣ１４４９６に定めるＭＰＥＧ−４などの場合において，予め共通フォーマットとして定められたＣＩＦ画面，ＱＣＩＦ画面，またはＳＱＣＩＦ画面などのフレーム画像に変換され，さらに圧縮符号化され，伝送データとしてネットワーク１０５を介して送信される。
【０１２５】
図５に示すように，画面５０１は，上記ＣＩＦ画面，ＱＣＩＦ画面，またはＳＱＣＩＦ画面のいずれかに該当し，グループ・オブ・ブロックと呼ばれる複数のＧＯＢ（５０２Ａ，５０２Ｂ，５０２Ｃ，…）から構成されている。
【０１２６】
例えば，本実施の形態にかかるＧＯＢ５０２は，Ｈ．２６１の場合，ＣＩＦ画面では，１２個のＧＯＢ５０２から構成され，ＱＣＩＦ画面では３個のＧＯＢ５０２から構成される。
【０１２７】
また，ＧＯＢ５０２は，さらにマクロブロック（ＭＢ）と呼ばれる，複数のＭＢ（５０３Ａ，５０３Ｂ，５０３Ｃ，…）から構成され，各ＭＢ５０３は，１６×１６画素の輝度マクロブロックであるＭＢ５０３−１と，８×８画素のＣ_Ｂ色差マクロブロックであるＭＢ５０３−２と，８×８画素のＣ_Ｒ色差マクロブロック５０３−３とから構成されるが，ＧＯＢ５０２に構成されるＭＢ５０３の個数は，例えばＨ．２６１，Ｈ．２６３，またはＭＰＥＧ−４などに応じて変動し，Ｈ．２６１の場合，１のＧＯＢ５０２に，３３個のＭＢ５０３から構成されている。
【０１２８】
また，ＭＢ５０３は，さらに８×８画素からなる最小単位のブロック（５０４Ａ，５０４Ｂ，５０４Ｃ，５０４Ｄ）から構成されている。したがって，１のＭＢ５０３には，４個の輝度ブロック（５０４Ａ，５０４Ｂ，５０４Ｃ，５０４Ｄ）と，２個の（Ｃ_Ｂ，Ｃ_Ｒ）色差ブロック（５０４Ｅ，５０４Ｆ）とから構成されている。
【０１２９】
（３．１．２マクロブロックのデータ構造）
次に，図６を参照しながら，本実施の形態にかかるマクロブロックのデータ構造について説明する。図６は，本実施の形態にかかるマクロブロックのデータ構造の概略的な構成を示す説明図である。
【０１３０】
図６に示すように，マクロブロックのデータ構造は，マクロブロックヘッダと，ブロックデータとからなり，上記マクロブロックヘッダは，“ＣＯＤ”と，“ＭＣＢＰＣ”と，“ＭＯＤＢ”と，“ＣＢＰＢ”と，“ＣＢＰＹ”と，“ＤＱＵＡＮＴ”と，“ＭＶＤ”と，“ＭＶＤ_２”と，“ＭＶＤ_３”と，“ＭＶＤ_４”と，“ＭＶＤＢ”とから構成される。
【０１３１】
なお，本実施の形態にかかるマクロブロックのデータ構造は，Ｈ．２６３にかかるデータ構造である場合を例にあげて説明したが，かかる例に限定されず，例えば，Ｈ．２６１，またはＭＰＥＧ−４などの場合であっても，Ｈ．２６３に準拠する。
【０１３２】
上記“ＤＱＵＡＮＴ”は，２ビット又は可変長データであり，ＱＵＡＮＴの変化を定義する。ＱＵＡＮＴは，マクロブロックに対する量子化パラメータであり，１〜３１の範囲の値を取り得る。なおＱＵＡＮＴは，予め任意の値に設定されている。
【０１３３】
したがって，“ＤＱＵＡＮＴ”は，差分値を表すことから，例えば，“ＤＱＵＡＮＴ”が２進数表示で“００”の場合，差分値は“−１”であり，“０１”の場合，差分値は“−２”であり，“１０”の場合，差分値は“１”であり，“１１”の場合，差分値は“２”と表すことができる。
【０１３４】
“ＤＱＵＡＮＴ”の差分値が変化することにより，ＱＵＡＮＴの値が変化するが，量子化パラメータであるＱＵＡＮＴが大きくなると，該当するマクロブロックの画質は落ちて，ぼんやりと精細を欠いた画像になる，ＱＵＡＮＴが小さくなると画質は向上して，圧縮符号化しても，ほぼ元の原画に近い状態の画像になる。つまりマクロブロックごとに，“ＤＱＵＡＮＴ”の変化を制御することにより，映像データの任意領域の画質を制御することが可能となる。上記“ＤＱＵＡＮＴ”の変化は，符号化制御部２０５により生成される符号化パラメータに基づいて，制御される。
【０１３５】
図６に示すように，Ｈ．２６３にかかる“ＣＯＤ”は，符号化マクロブロックインジケータであり，１ビットからなるデータである。“ＣＯＤ”が“０”である場合，圧縮符号化される対象のマクロブロックであることを示し，“１”である場合，圧縮符号化されず削除または無視されるマクロブロックであることを示す。
【０１３６】
したがって，Ｈ．２６３の場合において，符号化制御部２０５は，マクロブロックを圧縮符号化するか否かを制御するため，上記マクロブロックの“ＣＯＤ”に値を指示するための符号化パラメータを生成する。
【０１３７】
ここで，図４に示すように，顔領域情報の補正処理（Ｓ４０５）が終了し，符号化制御部２０５は，上記顔領域情報を受信すると，上記顔領域情報に含まれる顔領域の面積情報または顔領域の位置情報に基づき，オブジェクトとしてフレーム画像の顔領域の切出処理（Ｓ４０６）を実行する。
【０１３８】
さらに，図７（Ａ）及び図７（Ｂ）を参照しながら，本実施の形態にかかるオブジェクトについて説明する。図７（Ａ）は，本実施の形態にかかる初期形成時の顔領域ブロックの概略的な構造を示す説明図であり，図７（Ｂ）は，本実施の形態にかかる最終決定時の顔領域ブロックの概略的な構造を示す説明図である。
【０１３９】
図７（Ａ）および図７（Ｂ）に示す映像データのフレーム画像７０１は，３６個（６×６）のマクロブロックから構成されている。
【０１４０】
まず図７（Ａ）に示すように，符号化制御部２０５は，受信する顔領域情報に含まれる面積情報または位置情報に基づき，顔領域７００の領域を初期形成する。図７（Ａ）に示す顔領域７００は，人間の顔が全て含まれる４つのマクロブロックの範囲内に収まっている。つまり顔領域７００上から３ブロック，左から３ブロックを左上隅とする３×３マクロブロックの範囲内に収まっている。
【０１４１】
しかし，圧縮符号化はマクロブロック単位に行われるため，図７（Ｂ）に示すように，符号化制御部２０５は，顔領域７００を，拡大又は縮小する割合が最小限であるマクロブロック単位領域の顔領域７０２に補正する。圧縮符号化する場合はマクロブロック単位に行われるため，顔領域７０２のように補正されて，顔領域として最終決定される。
【０１４２】
図７（Ｂ）に示す補正された顔領域７０２により，符号化制御部２０５は，顔領域７０２に属すマクロブロックと，顔領域７０２に属さないマクロブロックと，別の領域として，オブジェクト単位に切出す（Ｓ４０６）。したがって，顔領域７０２のオブジェクトに対して，量子化パラメータを小さくするなど，オブジェクトごとに圧縮符号化させるよう，符号化パラメータで指示することができる。
【０１４３】
さらに，例えば，符号化制御部２０５は，顔領域７０２に属すマクロブロックに対しては，“ＣＯＤ”に“０”が設定されるよう，符号化パラメータで指示し，顔領域７０２に属さないマクロブロックに対しては，“ＣＯＤ”に“１” が設定されるよう，符号化パラメータで指示することで，顔領域７０２だけが圧縮符号化されて，伝送データとしてネットワーク１０５を介して送信されることができる。
【０１４４】
（３．１．３顔領域変換処理）
図２に示す特殊処理部２０４は，メモリ部２０２に格納される映像データのフレーム単位に，検出された顔領域に対して，例えばモザイク処理，または動物の画像など他の画像に置換するなどの顔領域変換処理（Ｓ４０７）を実行する。
【０１４５】
上記顔領域変換処理（Ｓ４０７）は，例えば，映像通信装置１０４に備わるモザイク処理設定ボタン及び置換処理設定ボタン（図示せず。）などにより，モザイク処理または置換処理が設定された場合，実行される。なお，本実施の形態にかかる顔領域変換処理（Ｓ４０７）は，撮影処理前に予め設定する場合，または撮影処理中に設定する場合のどちらであっても実施可能である。
【０１４６】
ここで，図８を参照しながら，本実施の形態にかかる顔領域変換処理について説明する。図８は，本実施の形態にかかる顔領域変換処理の概略を示すフローチャートである。
【０１４７】
図８に示すように，モザイク処理または置換処理からなる顔領域変換処理が設定されていると（Ｓ８０１），特殊処理部２０４は，メモリ部２０２に格納された映像データをフレーム単位に読み出し，さらに置換処理が設定されている場合には，置換するための適当な置換画像データを読み出す。
【０１４８】
さらに特殊処理部２０４は，顔検出ブロック２０３から送信される顔領域情報に基づき，上記映像データにおけるフレーム画像の顔領域に対し，モザイク処理または置換処理（Ｓ８０２）して，エンコーダ部２０６にフレーム画像を送出する。
【０１４９】
モザイク処理または置換処理（Ｓ８０２）が終了することにより，図４に示す顔領域変換処理（Ｓ４０７）が終了する。なお，本実施の形態にかかる顔領域変換処理は，モザイク処理または置換処理から構成される場合を例にあげて説明したが，かかる例に限定されず，例えば，シャープネス処理，フレーム画像の明度を上げる明度処理などの場合であっても実施可能である。
【０１５０】
また本実施の形態にかかる顔領域変換処理は，顔領域に対してモザイク処理または置換処理が実行される場合を例にあげて説明したが，かかる例に限定されず，顔領域以外の領域に対してモザイク処理又は置換処理を実行する場合であっても実施可能である。
【０１５１】
次に，図４に示すように，特殊処理部２０４において顔領域変換処理（Ｓ４０７）が終了すると，符号化制御部２０５は，特殊処理部２０４から送出されるフレーム画像に対する符号化パラメータを生成する（Ｓ４０８）。
【０１５２】
符号化制御部２０５は，エンコーダ部２０６に，少なくとも顔領域７０２に属すマクロブロックに対する量子化パラメータの設定，顔領域７０２に属さないマクロブロックに対する量子化パラメータの設定，またはオブジェクト単位に圧縮符号化するか否かの設定などを指示するための符号化パラメータを生成する（Ｓ４０８）。
【０１５３】
さらに，上記説明したように検査部２１０により，ネットワーク１０５のトラフィックの混雑状況の検知処理（Ｓ４０９）を実行する。検知処理（Ｓ４０９）の結果，トラフィックの混雑状況が所定の閾値を超えて，検査部２１０により混雑していると判断されると（Ｓ４１０），混雑情報を生成し，符号化制御部２０５に送信する。
【０１５４】
符号化制御部２０５は，上記混雑情報を受信すると，例えば，顔領域７０２であるオブジェクトに限定して圧縮符号化させるようにエンコーダ部２０６に符号化パラメータを送信し，圧縮符号化を制御する。
【０１５５】
フレーム画像の顔領域７０２だけを圧縮符号化させるのは，上記説明の通り，顔領域７０２に属すマクロブロックの“ＣＯＤ”に“０”を設定し，顔領域７０２に属さないマクロブロックには，“ＣＯＤ”に“１”を設定することで，ネットワーク１０５には顔領域７０２にかかる伝送データが送信される。
【０１５６】
したがって，符号化制御部２０５は，エンコーダ部２０６に上記顔領域７０２のオブジェクトのみを圧縮符号化させるため，符号化パラメータ生成処理（Ｓ４０８）で生成された符号化パラメータを変更処理（Ｓ４１１）し，上記符号化パラメータをエンコーダ部２０６に送信する。
【０１５７】
上記符号化パラメータの変更処理（Ｓ４１１）により，エンコーダ部２０６の圧縮符号化するか否かを制御することが可能となり，ネットワーク１０５のトラフィックに負荷を最小限に留めることが可能となる。
【０１５８】
次に，エンコーダ部２０６は，符号化パラメータに基づき，特殊処理部２０４から送出される映像データであるフレーム画像を圧縮符号化（Ｓ４１２）し，通信部２０７に伝送データとして送出する。したがって，例えば，顔領域７０２に属すマクロブロックに対しては画質を落とさず圧縮符号化し，顔領域７０２に属さないマクロブロックに対しては画質を落として圧縮符号化させることが可能である。さらにまた，顔領域７０２に属すマクロブロックだけを圧縮符号化することも可能である。
【０１５９】
したがって，フレーム画像全体を圧縮符号化せずに，フレーム画像内の顔領域７０２に対するマクロブロックのみを切り出して圧縮符号化することが可能であり，ネットワーク１０５に送出するデータ容量を節約することが可能となり，さらに人間の顔画像の画質は落ちないため，視認性の高い映像データを表示することができる。
【０１６０】
ここで，ＭＰＥＧ−４の場合における本実施の形態にかかる圧縮符号化について説明すると，ＭＰＥＧ−４の圧縮符号化（Ｓ４１２）は，Ｈ．２６１及びＨ．２６３の圧縮符号化（Ｓ４１２）とは，エンコーダ部２０６に形状符号化部（図示せず。）およびテクスチャ符号化部（図示せず。）を備えることで実施される点で相違する。
【０１６１】
上記形状符号化部は，上記顔領域７０２であるオブジェクトの形状を符号化するために，まず符号化すべき領域を図７（Ａ）または（Ｂ）に示すフレーム画像７０１にバウンディングレクタングルを設定し，図７（Ｂ）に示すマクロブロックと同じ位置に１６×１６画素のブロック（２値形状ブロック：ＢＡＢ）を設定する。
【０１６２】
図９に示すように，形状符号化部は，符号化パラメータに基づき，２値形状ブロックを設定すると，顔領域７０２であるオブジェクトに属す２値形状ブロックは，“１”で表され，オブジェクトに属さない２値形状ブロックは，“０”で表される。図９は，本実施の形態にかかる２値形状ブロックの概略的な構成を示す説明図である。
【０１６３】
図９に示す２値形状ブロックのように，顔領域７０２であるオブジェクトの内部と外部とを区別するために，２値で表示されると，形状符号化部は，２値形状ブロックごとに当該フレーム画像７０１の形状符号化をする。
【０１６４】
また，形状符号化されるとともに，テクスチャ符号化部は，上記顔領域７０２であるオブジェクトに属すマクロブロックに対してパディング処理などを行い，テクスチャ（画素値）の圧縮符号化が行われる。形状符号化及びテクスチャ符号化されることにより，圧縮符号化処理（Ｓ４１２）が処理終了し，エンコーダ部２０６は，伝送データを通信部２０７に送出する。なお，本実施の形態にかかるテクスチャ符号化部は，オブジェクトに属さないマクロブロックに対して，圧縮符号化する場合であっても実施可能である。
【０１６５】
したがって，フレーム画像全体を圧縮符号化せずに，顔領域７０２に対するマクロブロックのみを切り出して圧縮符号化することが可能であり，ネットワーク１０５に送出するデータ容量の軽減化が図れ，人間の顔画像の画質は落ちないため，視認性の高い映像データを表示することができる。
【０１６６】
送出された伝送データは，通信部２０７により多重化され，ネットワーク１０５を介して，配信される（Ｓ４１３）。以上から構成される映像データ配信処理（Ｓ４０１〜Ｓ４１３）は，撮影処理が終了するまで継続される。
【０１６７】
なお，本実施の形態にかかる配信後の映像データの受信処理については，ネットワーク１０５を介して送信された伝送データが，通信部２０７により受信され，デコーダ部２０８により伸長されるとメモリ部２０２に順次，映像データが格納される。
【０１６８】
以後の処理については，図４に示す顔検出処理（Ｓ４０１）〜顔領域変換処理（Ｓ４０７）が行われ，映像データは，変換部２０９によりＤ／Ａ変換される。Ｄ／Ａ変換後，出力装置１０３は，映像データを表示する。なお本実施の形態にかかる映像データの受信処理の顔検出処理（Ｓ４０１）〜顔領域変換処理（Ｓ４０７）における処理は，映像データの配信処理の顔検出処理（Ｓ４０１）〜顔領域変換処理（Ｓ４０７）の処理とほぼ同様な構成であるため詳細な説明は省略する。
【０１６９】
以上，添付図面を参照しながら本発明の好適な実施形態について説明したが，本発明はかかる例に限定されない。当業者であれば，特許請求の範囲に記載された技術的思想の範疇内において各種の変更例または修正例を想定し得ることは明らかであり，それらについても当然に本発明の技術的範囲に属するものと了解される。
【０１７０】
上記実施形態においては，映像配信ユニットが複数台から構成される場合を例にあげて説明したが，本発明はかかる例に限定されない。例えば，映像配信ユニットが１台から構成される場合であっても実施することができる。この場合には，監視システムとして実施することが可能である。
【０１７１】
また，上記実施の形態においては，人間の顔領域である場合を例にあげて説明したが，本発明はかかる例に限定されない。例えば，乗用車のナンバープレートの画像などを特徴を有する領域として実施する場合であってもよい。
【０１７２】
また，上記実施の形態においては，映像データの配信処理および受信処理はフレーム単位に行われる場合を例に挙げて説明したが，本発明はかかる例に限定されない。例えば，映像データのフィールド単位，または，映像データの複数フレームから構成されるシーン単位で行われる場合でも実施可能である。
【０１７３】
また，上記実施の形態においては，映像配信ユニットは，テレビ会議に用いられる場合を例にあげて説明したが，本発明は，かかる例に限定されない。例えば，携帯電話，携帯端末，またはパソコン（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ）などに用いる場合であっても実施可能である。
【０１７４】
【発明の効果】
以上説明したように，本発明によれば，複数の特徴領域が存在する場合でも過去の特徴領域の情報により的確に特徴領域を判断し，特徴領域のみ画質を落とさず切出して圧縮符号化することにより，ネットワークのトラフィックに依存せず視認性の高い画像を表示することができる。
【図面の簡単な説明】
【図１】図１は，本実施の形態にかかる双方向コミュニケーションシステムの概略的な構成を示すブロック図である。
【図２】図２は，本実施の形態にかかる映像通信装置の概略的な構成を示すブロック図である。
【図３】図３は，本実施の形態にかかる双方向コミュニケーションシステムの動作の概略を示すフローチャートである。
【図４】図４は，本実施の形態にかかる映像データ配信処理の概略を示すフローチャートである。
【図５】図５は，本実施の形態にかかる映像フォーマットの概略的な構成を示す説明図である。
【図６】図６は，本実施の形態にかかるマクロブロックのデータ構造の概略的な構成を示す説明図である。
【図７】図７（Ａ）は，本実施の形態にかかる初期形成時の顔領域ブロックの概略的な構造を示す説明図であり，
図７（Ｂ）は，本実施の形態にかかる最終決定時の顔領域ブロックの概略的な構造を示す説明図である。
【図８】図８は，本実施の形態にかかる顔領域変換処理の概略を示すフローチャートである。
【図９】図９は，本実施の形態にかかる２値形状ブロックの概略的な構成を示す説明図である。
【符号の説明】
１０１：映像配信ユニット
１０２：撮像装置
１０３：出力装置
１０４：映像通信装置
１０５：ネットワーク
１０６：使用者

Claims

１又は２以上の映像配信ユニットを接続するネットワークを備えた双方向コミュニケーションシステムであって：
前記映像配信ユニットは，映像データを生成する撮像装置と；
前記映像データを伝送データに圧縮符号化するエンコーダ部及び前記伝送データを前記映像データに伸長するデコーダ部を少なくとも備える映像通信装置と；
前記映像データを表示する出力装置と；
を備え，
送り手側の前記一の映像配信ユニットは，前記映像データのうち，少なくとも特徴領域と前記特徴領域に属さない領域との各領域ごとに圧縮符号化された前記伝送データを，受け手側の前記他の映像配信ユニットに対して，配信することを特徴とする，双方向コミュニケーションシステム。
前記映像通信装置は，前記映像データから前記特徴領域を検出し，特徴領域情報を生成する特徴検出部を，さらに備えることを特徴とする，請求項１に記載の双方向コミュニケーションシステム。
前記映像通信装置は，前記特徴領域情報に基づき符号化パラメータを生成する符号化制御部を，さらに備えることを特徴とする，請求項１に記載の双方向コミュニケーションシステム。
前記エンコーダ部は，前記符号化パラメータに基づき前記映像データを伝送データに圧縮符号化することを特徴とする，請求項１に記載の双方向コミュニケーションシステム。
前記特徴領域情報は，少なくとも顔領域の面積情報，前記顔領域の位置情報，または前記顔領域の信頼度情報が含まれる顔領域情報であることを特徴とする，請求項１に記載の双方向コミュニケーションシステム。
前記符号化制御部は，前記映像データから前記特徴領域情報が生成された場合，当該映像データよりも少なくとも１フレーム前に圧縮符号化された前記映像データの前記特徴領域情報に基づき，当該映像データの前記特徴領域情報を補正することを特徴とする，請求項１に記載の双方向コミュニケーションシステム。
前記映像通信装置は，前記ネットワークの混雑状況を検知する検査部を，さらに備えることを特徴とする，請求項１に記載の双方向コミュニケーションシステム。
前記符号化制御部は，前記ネットワークの混雑状況に応じて，前記特徴領域にかかる前記符号化パラメータと，前記特徴領域に属さない領域にかかる前記符号化パラメータとを変更することを特徴とする，請求項１に記載の双方向コミュニケーションシステム。
前記符号化制御部は，前記特徴領域にかかる映像データを，別オブジェクトとして切り出すことを特徴とする，請求項１に記載の双方向コミュニケーションシステム。
前記エンコーダ部は，少なくともＨ．２６３又はＭＰＥＧ−４の圧縮符号化方式により，前記映像データを圧縮符号化することを特徴とする，請求項１に記載の双方向コミュニケーションシステム。
前記映像通信装置は，前記特徴領域にかかる映像データを少なくともモザイク変換する特殊処理部を，さらに備えることを特徴とする，請求項１に記載の双方向コミュニケーションシステム。
ネットワークに接続された１又は２以上の映像配信ユニットに備わる映像通信装置であって：
前記映像配信ユニットは，映像データを生成する撮像装置と，前記映像データを表示する出力装置とをさらに備え；
前記映像通信装置は，前記撮像装置により生成された映像データから特徴領域を検出し，特徴領域情報を生成する特徴検出部と；
前記特徴領域情報に基づき符号化パラメータを生成する符号化制御部と；
前記符号化パラメータに基づき前記映像データを伝送データに圧縮符号化するエンコーダ部と；
前記伝送データを前記映像データに伸長するデコーダ部と；
を備えることを特徴とする，映像通信装置。
前記特徴領域情報は，少なくとも顔領域の面積情報，前記顔領域の位置情報，または前記顔領域の信頼度情報が含まれる顔領域情報であることを特徴とする，請求項１２に記載の映像通信装置。
前記符号化制御部は，前記映像データから前記特徴領域情報が生成された場合，当該映像データよりも少なくとも１フレーム前に圧縮符号化された前記映像データの前記特徴領域情報に基づき，当該映像データの前記特徴領域情報を補正することを特徴とする，請求項１２に記載の映像通信装置。
前記映像通信装置は，前記ネットワークの混雑状況を検知する検査部を，さらに備えることを特徴とする，請求項１２に記載の映像通信装置。
前記符号化制御部は，前記ネットワークの混雑状況に応じて，前記特徴領域にかかる前記符号化パラメータと，前記特徴領域に属さない領域にかかる前記符号化パラメータとを変更することを特徴とする，請求項１２に記載の映像通信装置。
前記符号化制御部は，前記特徴領域にかかる映像データを，別オブジェクトとして切り出すことを特徴とする，請求項１２に記載の映像通信装置。
前記エンコーダ部は，少なくともＨ．２６３又はＭＰＥＧ−４の圧縮符号化方式により，前記映像データを圧縮符号化することを特徴とする，請求項１２に記載の映像通信装置。
前記映像通信装置は，前記特徴領域にかかる映像データを少なくともモザイク変換する特殊処理部を，さらに備えることを特徴とする，請求項１２に記載の映像通信装置。
ネットワークに接続され，少なくとも映像データを生成し，前記映像データを表示する１又は２以上の映像配信ユニットに備わる映像通信装置の映像データ配信方法であって：
前記映像通信装置は，
前記映像データから特徴領域情報を生成し；
前記特徴領域情報に基づき符号化パラメータを生成し；
前記符号化パラメータに基づき前記映像データを伝送データに圧縮符号化することを特徴とする，映像通信装置の映像データ配信方法。
前記特徴領域情報は，少なくとも顔領域の面積情報，前記顔領域の位置情報，または前記顔領域の信頼度情報が含まれる顔領域情報であることを特徴とする，請求項２０に記載の映像通信装置の映像データ配信方法。
前記映像通信装置は，前記映像データから前記特徴領域情報が生成された場合，当該映像データよりも少なくとも１フレーム前に圧縮符号化された前記映像データの前記特徴領域情報に基づき，当該映像データの前記特徴領域情報を補正することを特徴とする，請求項２０に記載の映像通信装置の映像データ配信方法。
前記映像通信装置は，前記ネットワークの混雑状況を検知する検査部を，さらに備えることを特徴とする，請求項２０に記載の映像通信装置の映像データ配信方法。
前記映像通信装置は，前記ネットワークの混雑状況に応じて，前記特徴領域にかかる前記符号化パラメータと，前記特徴領域に属さない領域にかかる前記符号化パラメータとを変更することを特徴とする，請求項２０に記載の映像通信装置の映像データ配信方法。
前記映像通信装置は，前記特徴領域にかかる映像データを，別オブジェクトとして切り出すことを特徴とする，請求項２０に記載の映像通信装置の映像データ配信方法。
前記映像通信装置は，少なくともＨ．２６３又はＭＰＥＧ−４の圧縮符号化方式により，前記映像データを圧縮符号化することを特徴とする，請求項２０に記載の映像通信装置の映像データ配信方法。
前記映像通信装置は，さらに，前記特徴領域にかかる映像データを少なくともモザイク処理又は他の映像データに置換処理することを特徴とする，請求項２０に記載の映像通信装置の映像データ配信方法。