JP4763312B2 - 動画像データの符号化方法、復号化方法、これらを実行する端末装置、及び双方向対話型システム - Google Patents

動画像データの符号化方法、復号化方法、これらを実行する端末装置、及び双方向対話型システム Download PDF

Info

Publication number
JP4763312B2
JP4763312B2 JP2005047869A JP2005047869A JP4763312B2 JP 4763312 B2 JP4763312 B2 JP 4763312B2 JP 2005047869 A JP2005047869 A JP 2005047869A JP 2005047869 A JP2005047869 A JP 2005047869A JP 4763312 B2 JP4763312 B2 JP 4763312B2
Authority
JP
Japan
Prior art keywords
region
image
image data
divided
moving image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005047869A
Other languages
English (en)
Other versions
JP2006101472A (ja
Inventor
俊昭 柿井
洋一 畑
久雄 牧
仁志 貴家
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sumitomo Electric Industries Ltd
Original Assignee
Sumitomo Electric Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sumitomo Electric Industries Ltd filed Critical Sumitomo Electric Industries Ltd
Priority to JP2005047869A priority Critical patent/JP4763312B2/ja
Publication of JP2006101472A publication Critical patent/JP2006101472A/ja
Application granted granted Critical
Publication of JP4763312B2 publication Critical patent/JP4763312B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/142Constructional details of the terminal equipment, e.g. arrangements of the camera and the display
    • H04N7/144Constructional details of the terminal equipment, e.g. arrangements of the camera and the display camera and display on the same optical axis, e.g. optically multiplexing the camera and display for eye to eye contact
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/147Communication arrangements, e.g. identifying the communication as a video-communication, intermediate storage of the signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Description

この発明は、ネットワークに接続された複数の端末装置により構成される双方向対話型システム特有の対話環境に好適な画像処理技術に関し、特に、該端末装置間で送受信される動画像データの符号化・復号化方法等に関するものである。
近年、遠隔地の対話者間で互いに相手側対話者の映像を互いに視線一致した状態でモニタに表示しながらテレビ会議やカウンセリング等の親密な対話を実現する双方向対話型システムが提案されている。この視線一致技術には種々の技術が提案されており、相手側対話者像が表示されるモニタの所定位置にCCDカメラのような撮像デバイスを配置することにより視線一致を実現している(特許文献1参照)。
特許第3074677号公報 昭和42年電気四学会連合大会(No.1998)
発明者らは、上述のような双方向対話型システムについて検討した結果、以下のような課題を発見した。すなわち、所定の伝送手段を介して対話者の動画像データを相互に伝送する場合、現在の通信環境では回線の伝送容量や画像修理能力に限界があり、データ圧縮が行われるのが一般的である。このような動画像の圧縮方式としては、MPEG方式が映画配信サービスなど広く利用されている。しかしながら、このMPEG方式は、時間軸方向にも圧縮が行われるため、リアルタイムでの双方向対話では表示遅延が避けられず、遠隔地間での円滑な双方向対話が実現できないという課題があった。
一方、発明者らは上記双方向対話型システムのような視線一致した状態での対話における心理的考察により、対話時における対話者の視線の多くは、相手対話者の表情を観察するために該相手対話者の顔やノンバーバル表現となる手の動きに集中していることを発見した。この場合、対話時における対話者像を含む全画面を逐次伝送する必要はなく、対話時の重要な観察領域、すなわち対話者の顔や手の動きなど該対話者にとっての興味領域(ROI: Region of Interest)のみに注目して動画像伝送すれば伝送量を削減でき、また、双方向対話の高速応答性の実現に非常に効果的であることを発見した。
このように、興味領域にのみ注目した画像処理としては、例えばJPEG2000 Part−I方式のROI符号化が知られている。このROI符号化は、興味領域の画質を非興味領域の画質よりも向上させる画像処理技術である。ここで、一般にJPEG2000方式は、静止画像の圧縮方式として知られており、画像データに対して離散ウェーブレット変換、スカラー量子化、エントロピー符号化及びレート制御に相当する処理(EBCOT: Embedded Block Coding with Optimized Truncation)を経て画像圧縮を行っている。ROI符号化は、この静止画像内に設定される興味領域におけるウェーブレット係数を非興味領域におけるウェーブレット係数よりも高く設定することにより非興味領域と比べて興味領域の画質を向上させる。
しかしながら、JPEG2000 Part−I方式のROI符号化は、興味領域と非興味領域とで圧縮レベルに差はあるものの、合計符号量は不変であるため、符号化処理自体を軽減することができず、また、得られる符号化データの伝送量を削減することもできない。加えて、ROI符号化は、ウェーブレット係数を調節することにより行われるが、このウェーブレット係数は、複数個の空間画素を用いて計算されるため、復号化された静止画像において興味領域と非興味領域との境界がぼけてしまい、興味領域のみを別の画像にはめ込むなどの画像処理ができないという課題があった。
この発明は、上述のような課題を解決するためになされたものであり、ネットワークに接続された複数の端末装置により構成された双方向対話型システムに好適な画像処理技術として、各端末装置における処理負荷を効果的に軽減するとともに該処理の高速化を実現するための構造を備えた動画像データの符号化方法、復号化方法、それらを実行するコンピュータプログラム、該コンピュータプログラムが記録された記録媒体、これらを実行する端末装置、及び該端末装置を含む双方向対話型システムを提供することを目的としている。
この発明に係る動画像データの符号化方法は、動画像データを構成する画像フレームそれぞれを時間軸に沿って順次圧縮していく画像処理技術であって、上述の双方向対話型システムのように、表示されるべき画面フレーム内の一部領域にのみに有意な情報が含まれる動作環境においてリソースの有効利用を可能にするとともに、リアルタイムのデータ送受信を可能にする画像処理技術である。なお、動画像データを構成する画像フレームそれぞれは静止画像と等価である。また、人物像などの映像では、背景を静止画像とみなすことができる。したがって、この発明は、PowerPoint(マイクロソフト社の登録商標)、表計算ソフト(例えば“Excel”など)、ワープロソフト(例えば“Word”など)、ブラウザなどのアプリケーションソフトにより生成される資料データ(テキスト、写真、映像等)の伝送にも有効である。すなわち、係るアプリケーションソフトにより生成される表示データは、時間経過とともに部分的な変化(例えば、カーソルの移動や文字の追加表示など)が頻繁に生じることから、一定時間ごとの表示データを一画像フレームとすることで全体として動画像データとして取り扱うことも可能である。このことから、この明細書において、動画像データには、撮像装置などにより取り込まれた映像データの他、上記アプリケーションソフトなどにより生成された表示データ、静止画像と映像の組み合わせなども含まれる。なお、上記アプリケーションソフトなどにより生成されたデータファイルは、一旦画像データに変換された後に圧縮等の処理が施される。
具体的に、この発明に係る動画像データの符号化方法は、画像圧縮に先立ち、動画像データを構成する画像フレームのうち符号化されるべき画像フレームを、複数の領域に分割し、該複数の分割領域それぞれを、画像フレーム内において設定される興味領域及び該興味領域とは異なる非興味領域のいずれかに対応付けることを特徴としている。そして、当該動画像データの符号化方法は、複数の分割領域のうち興味領域(以下、ROIという)に対応付けられた分割領域の符号量が非興味領域(以下、非ROIという)に対応付けられた分割領域の符号量よりも多くなるよう該複数の分割領域をそれぞれ圧縮することで、各画像フレームの符号化データを生成していく。なお、画像フレームの分割領域の形状は、正方形、長方形などの矩形形状には限定されず、例えば、三角形、ひし形、台形、平行四辺形などの種々の多角形形状であってもよい。さらに、これら分割領域は、複数種類の多角形の組み合わせや円形や楕円形状等の一部を構成する曲線を含むなどそれぞれが異なる形状で構成されてもよい。ただし、以下の説明では、簡単のため、これら分割領域を矩形領域として表記する。
上述のように、この発明に係る動画像データの符号化方法は、動画像データを構成する画像フレームを時間軸に沿って個別に圧縮していくため、時間軸方向の圧縮も同時に行うMPEG方式とは異なり、高速応答性に優れている。また、当該動画像データの符号化方法は、動画像データを構成する画像フレームを個別に圧縮していくため、例えば静止画像圧縮方式であるJPEG2000(以下、JP2という)を利用することができる。このJP2には、複数の方式が既に提案されており、この発明にはいずれの方式も適用可能ではあるが、一例として上述のPart−I方式などはライセンスフリーでもあり広く利用可能な技術である。例えば、一つの画像フレームを複数の矩形領域に分割する技術は、JP2におけるタイリング技術を利用することで容易に実現することができる。ここで、JP2のタイリングとは、処理単位を小さくすることにより大規模画像の符号化や並列処理を可能にする技術であって、一つの画像フレームをいくつかのタイル(上記矩形領域に相当)に分割し、分割されたこれらタイルを個別に取り扱うことができる。
したがって、分割される複数の矩形領域をそれぞれROI及び非ROIのいずれかに対応付け、これら対応関係に従って矩形領域ごとに圧縮レベルを調節すれば、既存のJP2技術を利用して従来のROI符号化と同等の効果を奏する当該動画像データの符号化方法が実現可能になる。また、当該動画像データの符号化方法では、分割された矩形領域ごとに圧縮レベルの異なる符号化が行われるため、従来のROI符号化のようにROIと非ROIとの境界がぼけることはない。
なお、上記ROIの設定は、利用者自身が予め設定するか又は通信途中に設定を変更してもよく、また、複数の分割領域のうち、領域内画像の動きが検知された分割領域をROIに自動的に対応付けるようにしてもよい。
この発明に係る動画像データの符号化方法において、上記ROIには複数の矩形領域が対応付けられてもよく、この場合、それぞれ符号量が異なるよう圧縮されるのが好ましい。これは、上述の発明者の知見によるもので、双方向対話型システムのような視線一致した状態での対話における心理的考察により発見された事実として、対話時における対話者の視線の多くは、相手対話者の表情を観察するために該相手対話者の顔やノンバーバル表現となる手の動きに集中していることに起因している。すなわち、相手対話者の表情、頭の動き、手の動き、上半身の動きなどが、高速表示(例えば、30フレーム/秒(fps)、遅延200msec以下)されていれば、背景や服の細かな模様などの情報伝送は不要である。ただし、相手対話者の表情では、目線、目元、眉間の微妙な変化など、最も細かくかつ高速表示が要求される一方、ノンバーバル表現となる手の動きは、手の動き、輪郭の高速応答移動表示が重要である。そのときの手そのものの画質は劣化しても対話の本質には軽度の影響で済む。したがって、上記双方向対話型システム特有の対話環境を考慮し、上記ROIは、対話時に高精細高速応答の顔、頭部を含む高精細かつ高速表示領域と、手、腕、胸などを含む中精細かつ高速表示領域とに分けられているのがより好ましく、この場合、背景などを含む低精細かつ低速表示領域として非ROIが割り当てられる。このように対話への影響度を考慮して、圧縮レベルが段階的に変えられた複数種類の領域に画像フレーム内を分類しておくことが、画像処理負荷を軽減した状態で円滑な双方向対話を実現する上でより有効である。
画像フレーム内における各領域の対話への影響度を考慮すれば、上記複数の矩形領域のうち非ROIに対応する矩形領域に対する符号化処理において、該矩形領域の符号量を一定期間中0としてもよい(非ROIを符号化しない)。すなわち、非ROIに相当する低精細かつ低速表示領域に含まれる背景などは、むしろ静止画を高精細に貼り付け表示することが有効だからである。例えば、自宅で遠隔対話をする場合、家の中を最小限の撮影で対応できる。将来的には、人物だけを抽出して、背景はすべてデータベースから選択された画像(矩形領域)を貼り付けることも考えられる。現実的には、背景などの非ROIは一定時間ごとにしか符号化せず、人物の顔などのROIのみを符号化しても、当該動画像データの符号化方法ではこれらROIと非ROIの境界が明確なので、非ROIを符号化しない期間はその対応矩形領域に既に復号化された前の画像を貼付けることが有効である。特にこの場合、画像フレーム全体の符号化処理が軽減できるので、符号化のソフトウェア実装も期待できる。
この発明に係る動画像データの符号化方法において、上記複数の矩形領域のうちROIに対応付けられた矩形領域に相当する符号化データは、さらに暗号化されてもよい。ただし、暗号化対象はROIのみには限定されず、使用者が任意に設定すればよい。これは、双方向対話型システムを利用している対話者のプライバシー保護のために特に重要である。上述のように対話者間で視線一致状態を実現する双方向対話型システムは、単にビジネスシーンで利用されるテレビ会議システムの他、災害・事故などによる後遺症を抱えた人のカウンセリングなど、治療システムへの適用が有望視されているからである。一方、双方向対話ではリアルタイムでの暗号化と復号化が必要なため、対話時に重要となる領域のみの暗号化により、より効率的な画像処理が可能になる。対話時に重要となる領域(ROI)は、主に相手対話者像の顔であり、この部分が判別できなければ、個人特定は非常に困難である。したがって、高精細(低圧縮率)かつ高速表示領域であるROIのみを重点的に暗号化しておけば、対話者のプライバシーが十分に保護され得る。また、個人特定には音声も重要であり、画像と独立な暗号化により、より強固なセキュリティーが構築可能となる。
この発明に係る動画像データの符号化方法において、該動画像データを構成する画像フレームは、ROIに1つの矩形領域が一致するよう分割されてもよい。この場合、矩形領域の分割数を少なくすることができる。一方、対話開始時に設定されるROIのサイズは、対話中に変動する場合がある。そのため、ROIのサイズ変動に対応して矩形領域の分割サイズを動的に変更することにより、画像処理のより効率的な負荷分散が可能になる。なお、矩形領域のサイズをROIのサイズ変動に対応して変更しない場合であっても、ROIのサイズ変動に対応して、該ROIに対応付けられた矩形領域を動的に変更ことも可能である。また、対話中におけるROIのサイズ変更も対話者自身がマウス等の入力手段を利用して任意に変更すればよい。この明細書において、「動的」とは、状況変化に応じて自動的に追随する場合のほか、利用者が状況に応じて任意に設定変更する場合を含む。
上述のような対話中における矩形領域のサイズや対応関係の変更は、目やロ、顔の動きと異なり、手の動きなどは、人によってもかなりの差異があることに起因して行われる。すなわち、静止している手に対して常に一定の圧縮をするのではなく、手の動きに変化の多い人、少ない人、更には、そのときの対話の状況に合わせて、固定圧縮率や固定分割でなく、圧縮率や分割サイズをアダプティブにすることにより、より最適な画像処理が可能になる。
上述のような動画像データの符号化方法に、JP2技術が適用される場合、タイリングにより分割された各矩形領域(タイル)ごとに圧縮レベルを変えることにより(圧縮レベルが高くなるほど符号量は少なくなる)、実質的にROI符号化と同等の効果が得られるとともに、JP2技術により容易に復号化できる。しかしながら、符号化対象である画像フレーム内における非ROIに対応付けられた矩形領域の符号量を0にする場合、画像フレームの符号化データをJP2技術によって復号化しても、非ROIの画像は得られない。このような場合の復号化(この発明に係る動画像データの復号化方法)は、まずROIに対応付けられた矩形領域として圧縮された符号化データを復号化するとともに、非ROIに対応付けられた矩形領域として、既に復号化後に格納されていた別画像フレームの対応する矩形領域を用意する。そして、復号化されたROIに対応する矩形領域と、用意された別画像フレームの対応矩形領域とが合成され、新たな画像フレームが生成される。ここで、各矩形領域に対する圧縮や表示品質の制御は、処理を行うCPU性能やネットワークのライン性能をモニタしながら動的に変更するのが好ましい。
さらに、この発明に係る動画像データの符号化方法では、符号化されるべき画像フレームの一部、例えば非ROIに相当する矩形領域に、送信対象である動画像データとは異なる情報源から得られた画像(圧縮レベルが低くても対話に支障を生じない静止画像の一部や動画像の画像フレームの一部)をはめ込むことにより、より臨場感のある対話が、回線容量や画像処理能力など現在の通信環境に制限されることなく可能になる。
具体的には、まず、符号化されるべき画像フレームとして複数の分割領域で構成された仮想画像フレームを設定し、これら複数の分割領域をJP2のタイリングにおける処理単位であるタイルとして取り扱う。そして、これら複数の分割領域それぞれに、動画像データ(相手側対話者の動画像)を構成する画像フレームのうち符号化されるべき画像フレームから分割された複数の分割画像のうち少なくともいずれかとともに、該動画像データとは異なる情報源から得られた切出し画像を割り当てる。ここで、割り当てられる切出し画像としては、例えばキーボードから入力されたモニタ画像(静止画像)から切り出された一部(以下、テキスト画像という)、ライトペンによるホワイトボード機能を利用した手書き文字のモニタ画像(静止画像から切り出された一部(以下、ホワイトボード画像という)、他の動画像データを構成する画像フレームの一部など、カメラ、スキャナ等のディジタル機器により取り込まれた静止画像や動画像がある。また、新たに設定される仮想画像フレームの全体サイズ及び分割領域の数は、本来の符号化対象である動画像データの画像フレームと同じである必要はない。ただし、該仮想画像フレームを構成する分割領域のサイズは、本来の符号化対象である動画像データの画像フレームの分割対象と同じである必要はないが、同じである方が画像分割処理が不要になるためより好ましい。
上記仮想画像フレームを構成する複数の分割領域に上述のように割り当てられた複数種類の画像それぞれは、JP2のタイリング技術を利用することにより、タイルに相当するこれら複数種類の画像はそれぞれ異なる圧縮レベルで個別に符号化が可能である。これにより、これら複数の分割領域ごとに設定される符号化レベルに応じて個別に圧縮することで、各仮想画像フレームの符号化データが生成される。
以上のように符号化対象である動画像データの画像フレームとして設定される仮想画像フレームを時間軸に沿って順次符号化することにより、フレームごとに静止画像と動画像の1画像フレーム分が混在した動画像再生用の符号化データが得られる。
なお、上記仮想画像フレームを構成する複数の分割領域それぞれは、該仮想画像フレーム内において設定されるROI及び該ROIとは異なる非ROIのいずれかに対応付けられてもよい。このとき、上述の構成と同様に、複数の分割領域それぞれは、ROIに対応付けられた分割領域の符号量が非ROIに対応付けられた分割領域の符号量よりも多くなるよう圧縮されるのが好ましい。
また、上記ROIの設定は、利用者自身が予め設定するか又は使用中に設定変更してもよく、また、複数の分割領域のうち、領域内画像の動きが検知された分割領域をROIに対応付けるようにしてもよい。
この発明に係る動画像データの符号化方法では、上記仮想画像フレームを構成する複数の分割領域のうち少なくともいずれかに割り当てられた画像の符号化データを、さらに暗号化してもよい。また、これら複数の分割領域のうち少なくともいずれかに対する符号化処理において、該分割領域の符号量を一定期間中0としてもよい。この場合、符号化処理を行う側で予め用意された画像をはめ込むことで、表示用画像フレーム(復号化された画像と符号量0の領域にはめ込まれた画像により構成)が得られる。以上のように設定される仮想画像フレームも、それぞれJPEG2技術により圧縮されるのが望ましい。
上述のような動画像データの符号化・復号化方法は、双方向対話型システムにおける各端末装置において実行される。この端末装置は、相手側対話者の像を表示する表示装置と、該表示装置の前方に位置する該対話者を撮像するための撮像部と、上述の動画像データの符号化・復号化方法を実行する制御部と、そして、制御部により圧縮された符号化データを前記伝送手段へ送出する入出力部とを少なくとも備える。
上述のような動画像データの符号化・復号化方法は、コンピュータ等で実行されるプログラムであってもよく、この場合、当該プログラムは、有線、無線を問わずネットワークを介して配信されてもよく、また、CD、DVD、フラッシュメモリ等の記録媒体に格納されていてもよい。
この発明によれば、リアルタイムの双方向対話を実現する双方向対話型システムのような表示画像の一部領域のみに情報が集中している動画像データを伝送する特殊な対話環境での利用を特に想定し、画像フレームから分割された複数の矩形領域をROIと非ROIのいずれかに対応付け、該ROIに対応付けられた矩形領域と非ROIに対応付けられた矩形領域とで圧縮レベルと変えて各画像フレームの符号化を行うことで、係る双方向対話型システムにおける動画像データの符号化処理の軽減及び高速化を可能にする。
以下、この発明に係る動画像データの符号化・復号化方法等の各実施形態を、図1〜図23を用いて詳細に説明する。なお、図面の説明において、同一部位、同一部材には同一符号を付して重複する説明を省略する。
この発明に係る動画像データの符号化・復号化方法は、所定の伝送手段を介して接続された端末装置において実行可能であり、このような端末装置間での対話を実現する、例えば上記特許文献1に記載された双方向対話型システムに適用可能である。
まず、ここでは、当該動画像データの符号化・復号化方法を実行する端末装置が適用可能な双方向対話型システムについて説明する。なお、この双方向対話型システムは、視線一致した状態での対話を実現するシステムであるが、当該撮像装置を含む端末装置は、対話者間で視線一致できない構成であって単に対話者像の動画像データの送受信が可能な双方向対話型システムにも適用可能である。
(双方向対話型システム及び端末装置)
図1は、異なる地点に居る対話者間の視線一致を可能にする双方向対話型システム全体を示す論理構成図である。このシステムは、A地点(第1地点)にいる対話者3A(第1対話者)とB地点(第2地点)にいる対話者3B(第2対話者)との間で双方向対話を実現するシステムである。このシステムは異なる地点にいる対話者間でも親密な信頼関係を確立し綿密なコミュニケーションを実現するシステムであり、例えばカウンセリング・システムや家庭学習を志向したサービス提供システムとして用いることができる。その場合、少なくとも一方の対話者として、教師、医師、心理学者などのサービス提供者を想定している。したがって、このシステムはこれらサービス提供者がサービスを提供するために必要な情報、及び理想的な対話環境を提供できるよう種々の機能及び構成を備える。
具体的には、A地点において、(a)対話者3A(例えばカウンセラ)が座る椅子4A(高さ調節機構40Aを有する)と、(b)対話者3Aが向かうテーブル2Aと、(c)伝送手段27を介して対話者間の視線を一致させるための機構を備えた端末装置20Aとが設置され、対話者3Aはパーティション22Aによって隔離されている。一方、B地点には、(a)対話者3B(例えばカウンセリングを受けるクライアント)が座る椅子4B(高さ調節機構40Bを有する)と、(b)対話者3Bが向かうテーブル2Bと、(c)伝送手段27を介して対話者間の視線を一致させるための機構を備えた端末装置20Bとが設置され、対話者3Bはパーティション22Bにより隔離されている。ここで、伝送手段27は、A地点の端末装置20AとB地点の端末装置20Bとの間で画像情報及び音声情報の送受信を可能にするため、光ファイバ伝送路31(主伝送路)及び衛星通信伝送路32(バックアップ用伝送路)等を含む。なお、この伝送手段27は有線、無線のいずれであってもよい。また、伝送手段は、既に敷設された電話回線網等のネットワークを含み、さらに種々のデータベースを備えた電子掲示板システム(BBS: Bulletin Board System)も含む。
A地点において、上述の椅子4Aは対話者3Aの位置を規定するために機能する。この椅子4Aは端末装置20Aの表示部(表示装置)21Aとの距離を一定に保つために固定されるのが好ましい。しかし、該椅子4Aが固定されていない場合であっても、テーブル2Aを対話者3Aと表示部21Aに設置することによりこの椅子4Aと表示部21Aとの距離を一定に保つことが可能になる(テーブル2Aの存在が対話者3Aの心理的な距離の基準となる事実が確認されている)。なお、相手側の対話者3B(例えば、カウンセリングを受ける者等)がいるB地点の端末装置20Bの構成も同様である。
A地点において、端末装置20Aは、(1)B地点の端末装置20Bから伝送手段27を
介して伝送されてきた画像情報に基づいて対話者3Bの映像などを表示する、テーブル2Aの上に配置された、モニタTV1Aを備えた表示部21Aと、(2)CCDカメラ(撮像部)5Aを所定位置に保持するための本体部6Aと、(3)B地点の端末装置20Bから伝送手段27を介して伝送されてきた音声情報に基づいて対話者3Bの音声を出力するための音声出力部23A(スピーカ)と、(4)対話者3Aの音声を音声情報として集音し、B地点の端末装置20Bへ向けて伝送するための音声入力部24A(マイク)を備える。さらに、このシステムはカウンセリング・システムとしてより綿密なコミュニケーションを実現するため、(5)対話者3Aが文字や図形を入力し、入力された文字や図形を表示部21Aに表示するとともに、文字図形情報としてB地点の端末装置20Bへ向けて伝送するための文字図形入力部25A(キーボード、ポインティング・デバイス、タッチパネルなどのインターフェース)と、(6)上記各構成要素と伝送手段27との間に設けられ、信号処理、伝送制御及び映像データの編集作業等を行う映像処理装置26A(制御部含む)とを備える。なお、B地点の端末装置20Bも、上述したA地点の端末装置20Aと同様に構成されており、具体的には、表示部21B、CCDカメラ5Bと本体部6Bからなる撮像装置600B、音声出力部23B、音声入力部24B、文字図形入力部25B、及び映像処理装置26Bを備える。
さらに、A地点及びB地点の端末装置20A、20Bにおいて、撮像装置600A、600Bの構成を説明する。なお、説明の都合上、A地点及びB地点の各端末装置20A、20Bに共通する構成要素について言及する場合には、例えば撮像装置600のように、各地点を区別する文字A、Bを省略して説明する。また、特に説明がされていない場合には、原則としてA地点の端末装置20Aについて説明しているものとして、共通する構成を有するB地点の端末装置20Bについては重複する説明は省略する。
この撮像装置600は、撮像部であるCCDカメラ5(5A)、該CCDカメラ5を支持した状態で所定位置に設置するための本体部6を備える。モニタTV1(1A)はテーブル2(2A)の上に載置されており、対話者3(3A)はこのモニタTV1から距離L(m)離れて置かれた高さ調整機構40(40A)を備えた椅子4(4A)に座っている。この距離L(LA)は0.5m以上5m以下に設定される。撮影される対話者3及びモニタTV1間には、外径φ20mm以下,長さ約100mmの円筒状のCCDカメラ5が設けられている。また、このCCDカメラ5はその撮像方向が撮影される対話者3に向けられるよう設置されている。そしてCCDカメラ5で撮像された対話者3の映像は、画像情報として他方の対話者側に伝送される(伝送手段27を介してB地点の端末装置20Bに伝送される)。なお、対話者によっては表示部21と該対話者間の間隔が僅かにずれる可能性もある。したがって、このような状況にも対処すべく、CCDカメラ5は焦点深度の深いものを選択するのが好ましい。
次に、CCDカメラ5の具体的な設置位置を図2を用いて説明する。
まず、撮像装置600の本体部6は伝送されてきた他方の対話者の映像を表示するための表示部21上に設置される。なお、スイッチ210はモニタTV1の電源をオン/オフする電源スイッチ、モニタ画面8に対して表示される画像を水平方向や垂直方向に移動させるための像位置調節スイッチ、色補正スイッチ等を含む。CCDカメラ5は、伝送されてきた他方の対話者3Bの像9が表示されるモニタ画面8の前方の所定位置に本体部6によって配置される。なお、このモニタ画面8は4インチ程度であれば十分に利用できる。
具体的には、CCDカメラ5はモニタ画面8から前方w(cm)の位置であって、該モニタ画面8に表示された対話者像9の頭部9a付近に配置される。円筒状CCDカメラ5の中心軸は、点線で示す対話者像9の目の位置の上方h(cm)の部位に位置している。
このようにCCDカメラ5は、モニタTV1の画面8に表示された対話者像9の目の位置より上の頭部付近に位置しているため、双方向対話に特別な支障は生じない。例えば、CCDカメラ5が画面8に表示された対話者像9の目の位置(図中、点線で示す位置)の上方h=約10(cm)に設けられ、モニタTV1および対話者3間の距離Lが約2.5(m)に設定されているシステム構成の場合、視差角は2.3°で十分検知限界の視差角3°を下回ることが可能である(モニタ画面8とCCDカメラ5の間隔wが10(cm)程度ある場合でも、視差角の変動には特に影響はない)。つまり、視線一致時に相手の目(モニタ画面8に表示された他方の対話者3Bの像の目)がはっきりと見えれば、その頭部辺りにカメラ5が設けてあっても、モニタTV1の画面8が大型であれば、双方向対話に支障はほとんどないことが確認されている。この画面8の大きさは、実験の結果、横35cm,縦26cm程度以上の大きさがあれば良好な双方向対話が実現できることも確認されている。なお、相互の対話者が知人同志であれば、画面の大きさは小さくとも心理的な障害も少ない傾向を示す結果も得られており、画面サイズに関しては用途に応じて使いわけるとよい。
なお、視線一致状態は、モニタ画面8に対してCCDカメラ5の位置を調節することにより実現可能である。また、CCDカメラ5に対してモニタ画面8上に表示される画像を移動させても実現可能である。例えば、手動で視線一致を実現する場合、対話者自身がCCDカメラ5を移動させたり、スイッチ210を調節することでモニタ像を移動させればよい。また自動で視線一致を実現する場合には、カメラを移動させるための駆動機構を新たに設置したり、画像認識技術を利用してモニタ像を移動させればよい。
さらに、視差角について、図3を用いて説明する。この明細書において、視差角とは、図3に示されたように、モニタ画面8に表示された対話者像9へ向けられた、撮影される対話者3の視線と、CCDカメラ5へ向けられた、該対話者3の視線とがなす角度θを言う。換言すれば、対話者3の視線に対するCCDカメラ5の設置位置のずれ角を意味している。また、ここでいう視線一致とは、非特許文献1で報告されているように、CCDカメラ5の設置位置による不自然さの許容限界以下を意味している。定量的には、視差角として、左右方向4.5°以下(対話者像9の目の中心Aに対し、該像9の両こめかみ側),真上方向12°(像中心Aに対し、像9の頭部9b側),真下方向8°(像中心Aに対し、像9の胴体側)以下を視線一致範囲内としている。もちろん、この視差角は小さい方が良く、左右上下方向3°以下が検知限界とされている。したがって、CCDカメラ5が設置可能な領域は、図4に示された円錐領域である。なお、この円錐領域は、対話者3の目30とモニタ画面8に表示された対話者像9の中心点A(この実施形態では、対話者像9の両目の中心を該対話者像9の中心点Aとして定義している)とを結ぶ該対話者3の視線31に対し、所定距離L(m)離れた時のモニタ画面8上の視線一致領域9b、及び、該対話者3の目30の位置とで規定される。
なお、モニタ画面8上に表示される対話者像9のサイズが小さい場合には、必ずしも該CCDカメラ5と対話者像9の頭部が重なっている必要はない。むしろ対話者9の頭部がCCDカメラ5に隠れてしまい見にくくなる。上述のように視線一致の条件は視差角3°の領域内にCCDカメラ5と対話者像9の目が存在することであり、具体的に画面から50cm離れた位置で約3cm程度(図2におけるh)である。したがって、この範囲内であればCCDカメラ5と対話者像9の頭部をずらしても視線一致状態は維持される。この対話者像9とCCDカメラ5をずらすには、例えばモニタ画面8上における画像表示位置を調節したり、CCDカメラ5の支持部を調節してCCDカメラ5自体の位置を変更することにより実現される。
発明者らは、上述のような構造を有する双方向対話型システムにおいて視線一致した状態での対話における心理的考察を行い、対話時における対話者の視線の多くは、相手対話者の表情を観察するために該相手対話者の顔やノンバーバル表現となる手の動きに集中していることを発見した。この場合、対話時における対話者像を含む全画面を逐次伝送する必要はなく、対話時の重要な観察領域、すなわち対話者の顔や手の動きなど該対話者にとっての興味領域(ROI: Region of Interest)のみに注目して動画像伝送すれば伝送量を削減でき、また、双方向対話の高速応答性の実現に非常に効果的であることを発見した。そこで、この発明に係る動画像データの符号化・復号化方法は、双方向対話型システムなどで送受信される動画像データの各画像フレーム内にROIを含む場合の画像処理において、処理負荷を効果的に軽減するとともに該処理の高速化を実現する。なお、当該動画像データの符号化・復号化方法は、端末装置において実行される。
(端末装置)
図5は、この発明に係る動画像データの符号化・復号化方法を実行するための端末装置の構成を示す図である。この端末装置は、モニタ等の表示装置21(図1に示された双方向対話型システムにおける表示部21A、21Bに相当)と、映像処理部26(図1に示された双方向対話型システムにおける映像処理装置26A、26Bに相当)と、外部記録装置700と、マウス等のポインティングデバイス900と、タッチペン920と、表示装置21の前方に位置する対話者を撮像するCCDカメラ5等の撮像部及び撮像ユニット6からなる撮像装置600、スピーカー910とを備える。上記映像処理部26は、撮像手段に含まれる撮像ユニット6からの画像情報や他の情報メディアの取り込みや伝送手段27を介して相手側対話者の動画像データ(符号化データ)の送受信を行うためのデータ入出力部261(図中、I/O)と、この発明に係る動画像データの符号化・復号化方法を実行する制御部263と、送受信される動画像データを格納しておくための画像データベース262(図中、画像D/B)と、表示装置21へ制御部263の指示に従って所定のパターンを表示させる描画部264と、マウス等のポインティングデバイス900からの位置情報の取り込みや外部記録装置700とのデータ授受を可能にするデータ入出力部265(図中、I/O)と、相手対話者の音声が出力されるスピーカー910を制御するための音源コントローラ930とを備える。
なお、外部記録装置700は、例えば磁気テープ、CD、光ディスク、ハードディスク、DVD、フラッシュメモリ等を含み、この発明に係る動画像データの符号化・復号化方法を実行するコンピュータプログラムや相手側対話者の動画像データなどが格納される。
(動画像データの符号化・復号化方法)
次に、上述のような構造を備えた端末装置の制御部263において実行される符号化・復号化(この発明に係る動画像データの符号化・符号化方法)を説明する。図6(a)は、各端末装置で行われる動画像データの送信動作を説明するためのフローチャートであり、図6(b)は、各端末装置で行われる動画像データの受信動作を説明するためのフローチャートである。また、図7は、図6(a)における動画像の送信動作におけるフレーム符号化(この発明に係る動画像データの符号化方法)を説明するためのフローチャートである。なお、以下で説明される動画像データを構成する画像フレームの符号化及び復号化は、JP2技術により行われるものとする。
まず、動画像データの送信動作では、図6(a)のフローチャートで示されたように、対話に先立って、画像フレーム内のROIを設定する前処理が行われる(ステップST10)。このステップST10において設定されたROI情報は、一旦メモリに格納され、制御部263が、この格納されたROI情報を用いて動画像データを構成する画像フレームをそれぞれ時間軸に沿って順次符号化していく(ステップST20)。なお、このフレーム符号化は、I/O265を介して外部記録装置700から読み込まれたコンピュータプログラムを制御部263が実行することにより行われる。
制御部263は、上述のフレーム符号化(ステップST20)により符号化された符号化データを逐次I/O261を介して伝送手段27へ送出する(ステップST30)。そして、これらフレーム符号化及び符号化データの送信動作は、30フレーム/秒の処理速度で対話が終了するまで実行される(ステップST40)。
一方、動画像データの受信動作では、図6(b)のフローチャートに示されたように、制御部263は、伝送手段27からI/O261を介して画像フレームの符号化データを順次受信し(ステップST50)、該画像フレームを構成する矩形領域(タイル)の復号化を行う(ステップST60)。そして、制御部263は、画像フレームごとに全タイルの復号化が終了した時点で復号化されたタイルの合成作業を行い、表示装置21に表示させるべき新たな画像フレームを生成する(ステップST70)。なお、受信した符号化データ中における非ROIに相当するタイルの符号量が0の場合には、画像D/B262から予め格納された画像を対応するタイル画像として合成することにより、表示させるべき画像フレームを生成する。また、上述の復号化処理は、対話終了まで逐次行われる(ステップST80)。
さらに、図6(a)のフローチャート中のフレーム符号化について、図7のフローチャートを用いて詳細に説明する。
制御部263では、JP2のタイリング技術を利用して画像フレームの分割を行い(ステップST201)、前処理(ステップST10)で設定されたROI情報に基づいて、分割された全タイルをROI含まれる矩形領域か、あるいは非ROIに含まれる矩形領域かに分類する。
なお、このステップST201におけるタイリングは、図8に示されたように、対話者像9が表示されたモニタ像80を含む画像フレーム800を、いくつかの同じサイズのタイル810(T17〜T77)に分割し、以後、これらタイルを1枚の独立な画像として扱うことができる。タイルのサイズは対話者自身が任意に選択可能であり、その最小単位は1×1画素、最大は232−1×232−1画素である。また、画像フレーム800のサイズをモニタ像80のサイズは一致していてもよい。ただし、モニタ像80のデータサイズは小さい方がタイリングを実行する制御部(例えば、CPU)の負荷低減には有効である。そこで、一旦広角レンズカメラで取り込んだ画像データのうち一部をモニタ像80としてタイリング処理し、モニタ画面8に表示する際に処理用のモニタ像80を拡大表示してもよい。
画像フレーム800内におけるROIの設定は、対話開始前に対話者自身が自己像をモニタ上で確認しながら設定するのが好ましい。具体的にROIの設定は、図3に示されたように、対話者3自身が表示部21のモニタ画面8に対面し、タッチペン920を用いて行う。この場合、図9に示されたように、モニタ画面8上でタッチペン920により指示された始点P1と終点P2とで規定される矩形領域をROI80aに設定すればよい。例えば、図8に示された画像フレーム800中で対話者像9の顔を含む矩形領域がROI80aに設定された場合、図10に示されたように、画像フレーム800を構成するタイルT11〜T77のうちタイルT23、T24、T25、T33、T34、T35がROI80aに対応付けられる。なお、このようなROIの設定は、後述するように1つの画像フレーム800内の複数箇所に分割してそれぞれ設定することも可能である。この場合、複数のROIそれぞれに対して圧縮レベルや暗号化レベルに変化を与えることにより、対話者自身が画像品質、セキュリティ、背景画像等に対する自己決定権を有することができる。
また、画像フレーム800は、図11に示されたように、ROI80aに1つのタイルT12が一致するよう分割されてもよい。この場合、画像フレーム800の分割数を少なくすることができる。さらに、対話開始時に設定されるROI80aのサイズは、対話中に変動する場合(対話者自身が動く場合)がある。そのため、ROI80aのサイズ変動に対応してタイル810の分割サイズを動的に変更することにより、画像処理のより効率的な負荷分散が可能になる。また、図8及び図10に示されたように、複数のタイル810によりROI80aが構成される場合にも、ROI80aのサイズ変動に対応して、該ROI80aに対応付けられたタイル810を動的に変更ことも可能である。なお、対話中の動的変更は、対話者自身が状況に応じて手動変更する場合と、制御部などで状況変化をモニタしながら自動変更される場合のいずれも含まれる。
上述のような対話中におけるタイルサイズや対応関係の動的変更は、目やロ、顔の動きと異なり、手の動きなどは、人によってもかなりの差異があることに起因して行われる。すなわち、静止している手に対して常に一定の圧縮をするのではなく、手の動きに変化の多い人、少ない人、更には、そのときの対話の状況に合わせて、固定圧縮率や固定分割でなく、圧縮率や分割サイズをアダプティブにすることにより、より最適な画像処理が可能になる。
次に、上述のようなタイリング(ステップST201)に続いて、分割されたタイル810ごとにJP2技術の符号化が行われる。なお、この実施形態では、ステップST201においてROI80aに対応付けられたタイルについてのみ符号化を行い、非ROIに対応付けられたタイルについては符号量を0にする(符号化を行わない)。なお、この実施形態では、符号化が行われない場合であっても、タイルの存在のみを示す数バイトの符号化列対応させることで、復号化の破綻を回避している。
制御部263で行われるフレーム符号化はタイルごとに、まず、処理対象であるタイルがROI80aに対応付けられているか、非ROIに対応付けられているかを判断し(ステップST202)、ROI80aに対応付けられたタイルのみ符号化を行う一方、非ROIに対応付けられたタイルについては符号化処理を行わない(符号量:0)。
ステップST202においてROI80aに対応付けられていると判断されると、符号化処理として、離散ウェーブレット変換(DWT:ステップST203)、スカラー量子化(ステップST204)、及びEBCOT(ステップST205)が順次実行される。
ここで、ステップST203の離散ウェーブレット変換(DWT)は、タイル画像を帯域分割する処理である。JP2技術では、2分割フィルタバンクのリフティング構成に基づくDWTが採用されている。リフティング構成に基づくDWTには、可逆変換である整数型DWTと非可逆変換である実数型DWTの2種類が存在する。ロッシー(非可逆)符号化には、実数型DWTが、ロスレス(可逆)符号化には整数型DWTがそれぞれ用いられる。
また、ステップST204におけるスカラー量子化は、DWT係数に対して、各帯域ごとにスカラー量子化を行う。但し、整数型DWTを用いた場合には、この処理は省略される。このスカラー量子化のための量子化ステップサイズは、次のように表現される。
Figure 0004763312

ここで、△はサブバンド6の量子化ステップ、Rはサブバンドbのダイナミックレンジである。Εとμはそれぞれ5ビットと11ビットで表され、逆量子化のために復号器に送られる。なお、上記量子化ステップサイズは、画質優先度が高い、すなわち高画質が望まれるタイルに対しては、小さなステップサイズが設定され、低画質でよい非ROIに対応付けられたタイルに対しては大きなステップサイズが設定される。また、この量子化ステップサイズを1に設定すれば実質的にこのスカラー量子化を行わないことと等価である。
次に、ステップST205におけるEBCOT(Embedded Block Coding with Optimized Truncation)は、エントロピー符号化及びレート制御に相当する処理を担うアルゴリズムであって、係数ビットモデリング、算術符号化、及びレイヤー分割・符号切取りにより3工程で構成される。このEBCOTには、コードブロックと呼ばれる符号化単位が存在する。コードブロックは、DWT領域における矩形領域で定義され、すべての帯域で同一のサイズを持つ。また、上記3工程のうち算術符号化を除く工程は、コードブロックサイズ単位で独立に行われる。
係数ビットモデリングでは、コードブロック内の係数をビットプレーン分解し、各ビットプレーンにおける係数ビットの文脈情報(コンテクスト)が判定される。コンテクスト判定の際には、予め用意された統計モデルに基づくContext Assignment Mapが用意されている。Contextassignment Mapは、帯域ごとに異なる。係数ビットの持つ文脈情報によって、一つのビットプレーンを三つの符号化パス(サブビットプレーン)に分解、整列が行われる。
次に、算術符号化は、各符号化パスを2値算術符号化器であるMQコーダを用いて符号化する。MQコーダには符号化のための文脈情報が必要になるが、これには係数ビットモデリングで得られた文脈情報が利用される。
レイヤー分割・符号切取りでは、コードブッロクごとに生成された符号化データ列が、再生画像フレームにおけるSNR向上の寄与度の高さに応じて、与えられた符号化レート内で複数のSNRレイヤーに分割される。最上位のレイヤーが最も画質への影響が大きく、また、最上位から最下位の各レイヤーを順に受信することによって、再生画像フレームの画質を段階的に向上させることが可能になる。レイヤーに分割可能な位置は各符号化パスの終端に限定され、この終端が切り捨て点と呼ばれる。なお、JP2におけるレート制御は、画質への寄与が高い順に並べ変えられたデータに対し、与えられた符号化レートを超えるデータを、切捨て点を単位として捨てることにより達成される。
以上のように、一つの画像フレームを構成する全タイルについて、符号化(ステップST203〜ST205)又は符号化のスキップが終了すると(ステップST206)、得られた各タイルの符号化データをまとめて一つの画像フレームの符号化データが生成される(ステップST207)。
なお、上述のステップST201では、前処理(ステップST10)において対話者自身が設定したROI情報を利用して、所定サイズに分割された各タイルごとに、ROIと非ROIを対応付けたが、このROIの設定は、分割されたタイルのうち、画像の動きが検知されたタイルをROIに自動的に対応付けるようにしてもよい。図12は、ROIの設定方法の他の例を示す図である。
まず、分割領域として、画像フレームが所定サイズのタイルに分割される(ステップST201a)。そして、分割されたタイルごとに画像の動き検知が行われ(ステップST201b)、実際に画像の動きが検知されたタイルをROIに設定する(ステップST201c)。以上の処理がすべてのタイルに行われたのち(ステップST201d)、以降のステップST202が実行される。
図13は、分割されたタイルごとの動き検知動作を説明するために図である。図13(a)には、前画像フレームA(タイルT11〜T23で構成)のうちタイルT22と、後画像フレームB(タイルT11〜T23で構成)の対応するタイルT22同士を比較する様子が示されている。具体的な比較では、前画像フレームAにおけるタイルT22内の予め指定された画素の輝度値a1、a2、a3と、後画像フレームBにおけるタイルT22内の対応する画素の輝度値b1、b2、b3を求め、これら対応する画素同士の差を合計することで動き量を算出する。すなわち、タイルT22の動き量は、以下の式で表される。
(a1−b1)+(a2−b2)+(a3−b3)
以上の式で算出された動き量が所定の閾値を超えている場合に、タイルT22がROIに設定される。なお、輝度値を比較するための画素数は、タイルごとに異なっていてもよい。
図13(b)は、上述の動き検知動作を含む符号化処理を概念的に示すブロック図である。この図13(b)に示されたように、処理対象である後画像フレームBにおける各タイルについて、比較対象である前画像フレームAにおける対応タイルを利用した動き検知が行われ、この検知結果に基づいて、ROIとして符号化されるか、非ROIとして符号化(非ROIの場合は符号量0でもよい)され、この後画像フレームBの符号化データが得られる。
次に、図14は、上述のような動画像データの符号化方法が適用された双方向対話型システム(この発明に係る双方向対話型システム)における動画像データの送受信動作を概念的に説明するための図である。なお、以下の説明では、CCDカメラ5から取り込まれた対話者像が表示されたモニタ画像80を6分割タイリングする例を示す。
送信側端末装置20Aでは、まず、CCDカメラ5から順次取り込まれた画像フレーム(対話者像が表示されたモニタ画像80)を6つのタイル(T11〜T23)にタイリングし、画像フレームごとに、ROI80aに対応付けられているタイルT12を符号化する。一方、非ROIに対応付けられたタイルT11、T13、T21〜T23は一定期間ごとに符号化される。このとき、送信側端末装置20Aは、例えば伝送速度10Mbpsの伝送回線に30フレーム/秒(fps)で送出される画像フレームの符号化データ(圧縮されたタイルT12の符号のみを含む)を送出しながら、一定期間ごとに全タイルT11〜T23の圧縮データを含む符号化データを送出する。このように、一つの画像フレームを構成するタイルを符号化対象と非符号化対象に予め分類することにより、当該送信側端末装置20Aにおける画像処理の負荷が軽減される。
一方、受信側端末装置20Bでは、30fpsで順次受信される符号化データを復号化するが、この際、一定期間の間、ROI80aに対応付けられているタイルT12は復号化データが得られるが、非ROIに対応付けられたタイルT11、T13、T21〜T23については復号化データが得られない(送信側端末装置20Aから送出される符号量は0)。この場合、受信側端末装置20Bでは、先に受信して復号化された別画像データのタイルT11、T13、T21〜T23に相当するタイル画像を復号化されたタイル画像と合成することにより、新たに表示されるべき画像フレーム90を生成する。
このように、リアルタイムの双方向対話を実現する双方向対話型システムのような表示画像の一部領域のみに情報が集中している動画像データを伝送する特殊な対話環境において、画像フレームから分割された複数のタイルをROIと非ROIのいずれかに対応付け、該ROIに対応付けられたタイルと非ROIに対応付けられたタイルとで圧縮レベルと変えて各画像フレームの符号化を行うことで、係る双方向対話型システムにおける動画像データの符号化処理の軽減及び高速化を可能にする。
なお、上述の受信動作では、復号化されたすべてのタイルを合成するか、又は、復号化されたタイルと以前の画像フレームのタイルとして格納されていたタイルを合成することにより表示用画像フレーム90を生成しているが、表示用画像フレームの生成はこれに限定されるものではない。図15は、この発明に係る双方向対話型システムにおける動画像データの送受信動作の他の例を概念的に説明するための図である。
送信動作では、図14に示された動作と同様に、送信側端末装置20Aにおいて、タイルT11〜T23それぞれについて、ROI符号化及び非ROI符号化のいずれかが実行され、得られた符号化データが受信側端末装置20Bに送信される。受信側端末装置20Bでは、ROIに対応付けられたタイルの符号化データが復号化される一方、非ROIに対応付けられたタイルの符号化データも復号化される。そして、必要なタイルT12のみを拡大処理することにより表示用画像フレーム90を生成する。
なお、この図15に示された例では、複数のタイルがROIに設定されているが、会議の進行状況に対応して表示対象人物が表示されている一つのタイルを動的に変更しながらROI設定してもよい。この場合、予め拡大表示されるタイルのみの符号量が伝送されるので、より処理負荷が低減される。
例えば、複数の人物が参加したテレビ会議において、送信側端末装置20Aで予め各会議参加者を表示するタイルを割り当てておき、会議参加者のうちいずれかが挙手した場合など、画像の動きが検知されたタイルをROIに設定し、各タイルについてROI符号化又は非ROI符号化を行う。一方、受信側端末装置20Bでは、復号化されたタイルのうちROIに対応付けられたタイルのみを表示用画像フレーム90として拡大処理してもよい。
また、上述の図14に示された例では画像フレームを6分割タイリングし、分割されたタイルT11〜T23をROIと非ROIのいずれかに対応付けたが、このROIはさらに要求される画質レベルの異なる複数の領域に分けられてもよい。図16は、図14に示された動画像データの送受信動作の第1応用例(特に送信動作)を概念的に説明するための図である。
相手対話者の表情では、目線、目元、眉間の微妙な変化など、最も細かくかつ高速表示が要求される一方、ノンバーバル表現となる手の動きは、手の動き、輪郭の高速応答移動表示が重要である。そのときの手そのものの画質は劣化しても対話の本質には軽度の影響で済む。したがって、上記双方向対話型システム特有の対話環境を考慮し、図16では、送信側端末装置20Aにおいて対話時に高精細高速応答の顔、頭部を含む高精細かつ高速表示領域(第1ROI)としてタイルT12を対応付け、手、腕、胸などを含む中精細かつ高速表示領域(第2ROI)としてタイルT22を対応付け、残りのタイルT11、T13、T21、T23を非ROIに対応付けている。このように対話への影響度を考慮して、圧縮レベルが段階的に変えられた複数種類の領域に画像フレーム内を分類しておくことが、画像処理負荷を軽減した状態で円滑な双方向対話を実現する上でより有効である。
なお、画像フレーム内における各領域の対話への影響度を考慮すれば、非ROIに対応するタイルT11、T13、T21、T23の符号量を一定期間中0としてもよい。具体的には、非ROIについては符号化せず、符号化されないタイルの存在のみを示す数バイトの符号化列を送信しておくことで、復号化の破綻を回避する。
さらに、ROIに対応付けられたタイルT12を暗号化することにより、双方向対話型システムを利用している対話者のプライバシー保護が可能になる。上述のように対話者間で視線一致状態を実現する双方向対話型システムは、単にビジネスシーンで利用されるテレビ会議システムの他、災害・事故などによる後遺症を抱えた人のカウンセリングなど、治療システムへの適用が有望視されているからである。一方、双方向対話ではリアルタイムでの暗号化と復号化が必要なため、対話時に重要となる領域のみの暗号化により、より効率的な画像処理が可能になる。対話時に重要となる領域(ROI)は、主に相手対話者像の顔であり、この部分が判別できなければ、個人特定は非常に困難である。したがって、高精細(低圧縮率)かつ高速表示領域であるROIのみを重点的に暗号化しておけば、対話者のプライバシーが十分に保護され得る。また、個人特定には音声も重要であり、画像と独立な暗号化により、より強固なセキュリティーが構築可能となる。
さらに、双方向対話は、相手側対話者の顔を見ながら(視線一致可能な状態を維持しながら)行われるが、相手側対話者像を介してのみの対話ではどうしても現実のface−to−face対話(動画像や資料画像を利用したビジュアル対話)における臨場感は得られない。臨場感ある対話環境としては、双方向対話においても、face−to−face対話と同様に、資料を用いた円滑な対話、顔だけではなく、上半身や部屋全体を映し出すような多様な画像が求められる。したがって、相手側対話者像の表示と並行してテキスト等の資料を自在に表示して臨場感ある対話を実現するのが理想的である。しかしながら、このように複数の情報源からの静止画像や動画像の追加送信には大容量の通信容量が必要となり、対話システム普及への障害となる。
このような臨場感ある双方向対話としては、音楽、演劇、各種趣味、資格全般などの遠隔実技指導も含まれ、特にこのような対話環境では、複数視点で観察された画像を合成するとともに、そのときの映像に対応したテキストを随時表示していくのが好ましい。更には、遠隔実技指導に限らず、現場指導においても複数視点での観察画像を合成するとともにテキストも表示録画と再生観察指導が好ましい。
図17は、上述の図16に示された第1応用例の具体的な例を概念的に説明するための図である。この図17には、動物園の監視用モニタに表示される画像フレームが示されている。この画像フレームも、タイルごとに画像の動きを検知して暗号化の有無を設定するか、タイルごとに予め暗号の有無や強度を設定しておく。なお、このような応用例では、ROI設定されたタイルのみが暗号化されるのでなく、任意のタイルについて暗号化設定される。
すなわち、檻の中の動物が表示されているタイルT11、T12、T13については暗号化せず、該動物に動きがあったときのみ符号化データを伝送する。一方、檻の手前にいる人物が表示されたタイルT21、T22、T23については、プライバシー保護の観点から低レベルの暗号化を行うようにしておく。
符号化されるべき動画像データには、PowerPoint、表計算ソフト、ワープロソフト、ブラウザなどのアプリケーションソフトにより生成される資料データも適用可能であり、以下では、この符号化動作を図18及び図19を用いて説明する。なお、図18及び図19は、いずれも図14に示された動画像データの送受信動作におけるフレーム符号化の第2応用例を概念的に説明するための図である。また、上記アプリケーションソフトにより生成されたデータファイルは、一旦画像データに変換された後に圧縮等の処理が施される。
上記アプリケーションソフトにより生成される表示データ等は、時間経過とともに部分的な変化(例えば、カーソルの移動や文字の追加表示など)が頻繁に生じることから、一定時間ごとの表示データを一画像フレームとすることで全体として動画像データとして取り扱うことも可能である。このことから、この明細書において、動画像データには、撮像装置などにより取り込まれた映像データの他、上記アプリケーションソフトなどにより生成された表示データ、静止画像と映像の組み合わせなども含まれる。
まず、図18に示された例では、テキストや写真(映像でもよい)などの画像フレームに対してタイリングが行われる。このとき、ポインタの移動を検知することにより、該ポインタが存在するタイルT22を符号化する。
一方、図19の例では、図19(a)に示されたように、送信側端末装置におけるモニタ画面8A内には、伝送用画像領域(この領域が伝送用画像フレーム80としてタイリングされている)が設定されるとともに、該領域外にPowerPoint、表計算ソフト、ワープロソフト、ブラウザなどのアプリケーションソフトにより生成される資料データが表示されている。
図19(b)に示されたように、上記資料データがモニタ画面8A上を矢印S1で示された方向にドラッグされ、その一部が伝送用画像領域に入ると、送信側端末装置では、タイルT21内において画像の動きが発生したことを検知できる。そおため、送信側端末装置では、係るタイルT21を符号化し、受信側端末装置へ伝送する。
受信側端末装置では、図19(c)に示されたように、モニタ画面8B上に、復号化されたタイルT21のみが新たに合成された画像フレーム90が表示される。
さらに、この発明に係る動画像データの符号化方法の第3応用例では、符号化されるべき画像フレームの一部、例えば非ROIに相当する矩形領域に、送信対象である動画像データとは異なる情報源から得られた画像(圧縮レベルが低くても対話に支障を生じない静止画像の一部や別の動画像を構成する画像フレームの一部)をはめ込むよう構成されている。この構成により、より臨場感のある双方向対話が、回線容量や画像処理能力など現在の通信環境に制限されることなく可能になる。以下、この発明に係る動画像データの符号化方法の第3応用例を、図20〜図23を用いて詳細に説明する。
図20は、この発明に係る動画像データの送受信動作におけるフレーム符号化の第3応用例(特に、送信動作)を概念的に説明するための図である。
この第3応用例では、符号化されるべき画像フレーム80として複数の分割領域VT11〜VT33で構成された仮想画像フレームを設定し、これら複数の分割領域VT11〜VT33をJP2のタイリングにおける処理単位であるタイルとして取り扱う。なお、画像フレーム80は3×3に分割されているが、仮想画像フレームは4×4に分割されている(分割サイズは画像フレーム80における矩形領域T11〜T23と同じ)。
そして、仮想画像フレームを構成する分割領域のうち画像フレーム80のROIに設定された矩形領域T12、T22が、該仮想画像フレームの分割領域VT12、VT22に割り当てられる。仮想画像フレームの分割領域V13には、対話者全体を撮像した動画像フレーム86の一部86aが割り当てられる。仮想画像フレームの分割領域VT31、VT32には、キーボードから入力された文字情報を示すテキスト画像88の一部88a、88bがそれぞれ割り当てられる。仮想画像フレームの分割領域VT11、VT21には、ライトペン920等により入力された手書き文字情報を示すホワイトボード画像87の一部87a、87bがそれぞれ割り当てられる。なお、仮想画像フレームの分割領域VT33には画像は割り当てられていないものとする。
分割領域VT11〜VT33に上述のように割り当てられた複数種類の画像それぞれには、図20の符号化レベルマトリックスに示されたように、予め符号化レベルが指定されている。なお、“H”は高圧縮率指示を意味し、“M”は中圧縮率指示を意味し、“L”は低圧縮率指示を意味している。また、符号化レベルマトリックス中の斜線領域は、仮想画像フレームの分割領域VT33の符号化レベルを示す領域であるが、分割領域VT33には画像が割り当てられていないため、符号化は行われない(符号量=0)。この符号化レベルマトリックスで指定された符号化レベルに従って各分割領域VT11〜VT33がJP2技術で個別に圧縮され、得られた分割領域VT11〜VT33の符号化データを合成することにより各仮想画像フレームの符号化データが生成される。
以上のように符号化対象である動画像データの画像フレームとして設定される仮想画像フレームを時間軸に沿って順次符号化することにより、静止画像と動画像の1画像フレーム分とが混在した動画像再生用の符号化データが順次得られる。
一方、図21は、図20に示された第3応用例に係るフレーム符号化により得られた符号化データの復号化動作を概念的に説明するための図である。
所定の伝送手段27を介して送信された符号化データは、図20中に示された仮想画像フレームの分割領域VT11〜VT33の符号化データで構成されているため、これら分割領域VT11〜VT33の符号化データをそれぞれ復号化することにより、分割領域VT11〜VT33に割り当てられた画像がフレーム要素として得られる。なお、仮想画像フレームの分割領域VT33の符号量は0であるため、この分割領域VT33に対応するフレーム要素として、対話者自身の自己像85が用意される。
以上のように復号化されたフレーム要素と別途用意された対話者自身の自己像とが合成されることにより、図21に示されたような表示用画像フレーム90が得られる。相手側端末装置から送信されてくる符号化データを時間軸に沿って順次復号化することにより、静止画像と動画像の1画像フレーム分とが混在した動画像再生用の画像フレームが順次得られる。
図22及び図23それぞれは、図20に示された第3応用例に係るフレーム符号化が適用されたときの表示用画像フレームの一例を示す図である。いずれの表示用画像フレームも図21に示されたように複合化により、又は複合化と別画像の合成により得られる。
図22に示された表示用画像フレーム90は、復号化された分割領域に割り当てられた画像で構成された領域90aと、対話者自身の自己像90bとが合成されている。この図22に示された表示用画像フレーム90の例では、斜線領域90cにテキスト画像などの静止画像が割り当てられ、残りの領域に相手側対話者像のROIが割り当てられている。このように、この発明に係る動画像データの符号化方法の第3応用例では、符号化処理時に仮想画像フレームの分割領域VT11〜VT33のいずれに相手側対話者像のROIを割り当ててもよく、また、相手側対話者像とテキスト画像などの静止画像の割合も任意に変更することができる。
また、図23に示された表示用画像フレーム90は、指導者とピアノ演奏者とがピアノレッスンを行う場合を想定し、該指導者側に表示される動画像を構成する1画像フレームである。この図23に示されたように、仮想画像フレームを構成する4分割領域のうち3分割領域にはピアノ演奏者を多角的に撮像した各画像が割り当てられるとともに、残りの領域には楽譜などの表示したテキスト画像が割り当てられている。また、このように多角的に撮影された画像を仮想画像フレームの分割領域に割り当てる場合には、異なる地点間でテレビ会議を行う一方に参加した参加者それぞれの画像を仮想画像フレームを構成するいくつかの分割領域に割り当てるとともに、残りの分割領域に会議資料を表示したテキスト画像を割り当てるようにしてもよい。
この発明は、リアルタイムの双方向対話を実現する双方向対話型システムのような表示画像の一部領域のみに情報が集中している動画像データを伝送する特殊環境での使用が可能である。
異なる地点間において伝送手段を介して視線一致を実現する双方向対話型システム(この発明に係る端末装置及び双方向対話型システム)の一構成を示す図である。 図1に示された撮像装置を示す図であって、視線一致のためのCCDカメラの設置方法を説明するための図である。 視差角を説明するための図である。 CCDカメラが設置されるべき領域を示す図である。 この発明に係る端末装置の構造を示すブロック図である。 各端末装置で行われる動画像データの送信動作及び受信動作をそれぞれ説明するためのフローチャートである。 図6(a)における動画像データの送信動作におけるフレーム符号化(この発明に係る動画像データの符号化方法)を説明するためのフローチャートである。 タイリングを説明するための図である。 ROI(興味領域)の設定方法の一例を説明するための図である。 タイルとROIとの対応関係を説明するための図である(その1)。 タイルとROIとの対応関係を説明するための図である(その2)。 ROI(興味領域)の設定方法の他の例を説明するための図である。 各タイルにおける画像の動き検知を説明するための図である。 この発明に係る双方向対話型システムにおける動画像データの送受信動作を概念的に説明するための図である。 この発明に係る双方向対話型システムにおける動画像データの送受信動作の他の例を概念的に説明するための図である。 図14及び図15に示された動画像データの送受信動作におけるフレーム符号化の第1応用例を概念的に説明するための図である。 図16に示された第1応用例の具体的な例を概念的に説明するための図である。 図14に示された動画像データの送受信動作におけるフレーム符号化の第2応用例を概念的に説明するための図である。 図14に示された動画像データの送受信動作におけるフレーム符号化の第2応用例を概念的に説明するための図である。 この発明に係る動画像データの送受信動作におけるフレーム符号化の第3応用例を概念的に説明するための図である。 図20に示された第3応用例に係るフレーム符号化により得られた符号化データの復号化動作を概念的に説明するための図である。 図20及び図21に示された第3応用例に係るフレーム符号化が適用されたときの表示用画像フレームの一例を示す図である。 図20及び図21に示された第3応用例に係るフレーム符号化が適用されたときの表示用画像フレームの一例を示す図である。
符号の説明
3(3A、3B)…対話者A、B
5(5A、5B)…撮像部(CCDカメラ)
6(6A、6B)…撮像ユニット
8(8A、8B)…モニタ画面
20A、20B…端末装置
21(21A、21B)…表示部(表示装置)
24(24A、24B)…マイク
26(26A、26B)…映像処理装置
80、90…モニタ画像
80a…興味領域
261、265…入出力部(I/O)
262…画像データベース(D/B)
263…制御部
264…描画部
600(600A、600B)…撮像装置
700…外部記録装置
800…画像データ
810…タイル

Claims (22)

  1. 動画像データを構成する画像フレームそれぞれをJPEG2000のタイリング技術を利用して時間軸に沿って順次圧縮していく動画像データの符号化方法であって、
    符号化されるべき画像フレームとして、前記JPEG2000の取り扱い単位であるタイルに相当する複数の分割領域で構成された仮想画像フレームを設定し、
    前記仮想画像フレームを構成する前記複数の分割領域それぞれに、前記動画像データを構成する画像フレームのうち符号化されるべき画像フレームから分割された複数の分割画像のうち少なくともいずれかとともに、前記動画像データとは異なる情報源から得られた切出し画像を割り当て、
    前記仮想画像フレームを構成する前記複数の分割領域に割り当てられた画像それぞれを、該複数の分割領域ごとに設定される符号化レベルに応じて個別に圧縮することで、複数種類の画像情報を含む各仮想画像フレームの符号化データを生成していく動画像データの符号化方法。
  2. 前記複数の分割領域それぞれは、前記仮想画像フレーム内において設定される興味領域及び該興味領域とは異なる非興味領域のいずれかに対応付けられ、
    前記複数の分割領域それぞれは、前記興味領域に対応付けられた分割領域の符号量が前記非興味領域に対応付けられた分割領域の符号量よりも多くなるよう圧縮されることを特徴とする請求項1記載の動画像データの符号化方法。
  3. 前記複数の分割領域のうち、領域内画像の動きが検知された分割領域を前記興味領域に対応付けることを特徴とする請求項2記載の動画像データの符号化方法。
  4. 前記興味領域には複数の分割領域が対応付けられ、これら興味領域に対応付けられた分割領域は、それぞれ符号量が異なるよう圧縮されることを特徴とする請求項2又は3記載の動画像データの符号化方法。
  5. 前記仮想画像フレームを構成する前記複数の分割領域のうち少なくともいずれかに割り当てられた画像の符号化データを、さらに暗号化することを特長とする請求項1〜4のいずれか一項記載の動画像データの符号化方法。
  6. 前記複数の分割領域のうち少なくともいずれかに対する符号化処理において、該分割領域の符号量を一定期間中0とすることを特長とする請求項1〜5のいずれか一項記載の動画像データの符号化方法。
  7. 前記仮想画像フレームは、前記興味領域が1つの分割領域を構成するよう分割されることを特長とする請求項2、3、5及び6のいずれか一項記載の動画像データの符号化方法。
  8. 前記興味領域のサイズ変動に対応して、前記分割領域の分割サイズを動的に変更することを特長とする請求項7記載の動画像データの符号化方法。
  9. 前記興味領域のサイズ変動に対応して、該興味領域に対応付けられた分割領域を動的に変更することを特長とする請求項2〜6のいずれか一項記載の動画像データの符号化方法。
  10. コンピュータにより請求項1〜9のいずれか一項記載の動画像データの符号化方法を実行するコンピュータプログラム。
  11. コンピュータにより請求項1〜9のいずれか一項記載の動画像データの符号化方法を実行するコンピュータプログラムが記録された記録媒体。
  12. 撮像された対話者像を所定の伝送手段を介して相手側対話者に互いに提示し合うことにより該対話者と該相手側対話者間での対話を実現する双方向対話型システムであって、前記伝送手段を介して送受信される動画像データを構成する画像フレームを、請求項1〜9のいずれか一項記載の動画像データの符号化方法により符号化する双方向対話型システム。
  13. 前記複数の分割領域それぞれが前記仮想画像フレーム内において設定される興味領域及び該興味領域とは異なる非興味領域のいずれかに対応付けられるとき、前記興味領域は、表示位置調節のために表示される前記対話者自身の自己像に対して設定されることを特長とする請求項12記載の双方向対話型システム。
  14. 前記複数の分割領域それぞれが前記仮想画像フレーム内において設定される興味領域及び該興味領域とは異なる非興味領域のいずれかに対応付けられるとき、前記興味領域の設定とともに、前記分割領域の圧縮レベル及び暗号化の有無が設定されることを特長とする請求項12又は13記載の双方向対話型システム。
  15. 請求項1〜6のいずれか一項記載の動画像データの符号化方法により圧縮された仮想画像フレームごとに、該仮想画像フレームを構成する各分割領域の符号化データを復号化し、該復号化された各分割領域の画像を合成して表示用画像フレームを生成する動画像データの復号化方法であって、
    前記興味領域に対応付けられた分割領域の画像として圧縮された符号化データを復号化するとともに、
    前記非興味領域に対応付けられた分割領域として、既に復号化後に格納されていた別仮想画像フレームの対応領域の画像を用意し、
    復号化された前記興味領域に対応付けられた分割領域の画像と、用意された別仮想画像フレームの対応領域の画像とを合成し、前記表示用画像フレームを生成する動画像データの復号化方法。
  16. コンピュータにより請求項15記載の動画像データの復号化方法を実行するコンピュータプログラム。
  17. コンピュータにより請求項15記載の動画像データの復号化方法を実行するコンピュータプログラムが記録された記録媒体。
  18. 撮像された対話者像を所定の伝送手段を介して相手側対話者に互いに提示し合うことにより該対話者と該相手側対話者間での対話を実現する双方向対話型システムであって、前記伝送手段を介して送受信される動画像データを構成する画像フレームの符号化データを、請求項15記載の動画像データの復号化方法により復号化する双方向対話型システム。
  19. 撮像された対話者像を所定の伝送手段を介して相手側対話者に互いに提示し合うことにより該対話者と該相手側対話者間での対話を実現する双方向対話型システムに適用可能であり、該相手側対話者の像を表示する表示装置と、該表示装置の前方に位置する該対話者を撮像するための撮像部とを少なくとも備えた端末装置であって、
    請求項1〜9のいずれか一項記載の動画像データの符号化方法を実現する制御部と、
    前記制御部により圧縮された符号化データを前記伝送手段へ送出する入出力部とを備えた双方向対話型システムの端末装置。
  20. 表示位置調節のために前記表示装置に表示される前記対話者自身の自己像に対して前記興味領域を設定するための入力手段をさらに備えたことを特長とする請求項19記載の双方向対話型システムの端末装置。
  21. 前記分割領域の圧縮レベル及び暗号化の有無に関する情報を取り込む入力手段をさらに備えたことを特長とする請求項19記載の双方向対話型システムの端末装置。
  22. 前記制御部は、請求項6記載の動画像データの符号化方法により圧縮された前記伝送手段に送出された画像データを前記入出力部を介して受信し、該画像データを構成する各分割領域の符号化データを複合化し、該復号化された各分割領域とともに符号量0の分割領域に換えて用意された画像を合成して表示用画像データを生成することを特徴とする請求項19〜21のいずれか一項記載の双方向対話型システムの端末装置。
JP2005047869A 2004-04-23 2005-02-23 動画像データの符号化方法、復号化方法、これらを実行する端末装置、及び双方向対話型システム Expired - Fee Related JP4763312B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005047869A JP4763312B2 (ja) 2004-04-23 2005-02-23 動画像データの符号化方法、復号化方法、これらを実行する端末装置、及び双方向対話型システム

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2004128890 2004-04-23
JP2004128890 2004-04-23
JP2004250854 2004-08-30
JP2004250854 2004-08-30
JP2005047869A JP4763312B2 (ja) 2004-04-23 2005-02-23 動画像データの符号化方法、復号化方法、これらを実行する端末装置、及び双方向対話型システム

Publications (2)

Publication Number Publication Date
JP2006101472A JP2006101472A (ja) 2006-04-13
JP4763312B2 true JP4763312B2 (ja) 2011-08-31

Family

ID=35135974

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005047869A Expired - Fee Related JP4763312B2 (ja) 2004-04-23 2005-02-23 動画像データの符号化方法、復号化方法、これらを実行する端末装置、及び双方向対話型システム

Country Status (10)

Country Link
US (2) US20050237380A1 (ja)
EP (1) EP1701546A4 (ja)
JP (1) JP4763312B2 (ja)
KR (1) KR101099884B1 (ja)
CN (2) CN101820537B (ja)
AU (1) AU2005236997B2 (ja)
CA (1) CA2553434C (ja)
NO (1) NO20065381L (ja)
TW (1) TWI372563B (ja)
WO (1) WO2005104552A1 (ja)

Families Citing this family (126)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002015162A2 (en) * 2000-08-17 2002-02-21 Innotive Corporation System and method for displaying large images with reduced capacity buffer, file format conversion, user interface with zooming and panning, and broadcast of different images
JP2006115470A (ja) * 2004-09-16 2006-04-27 Ntt Docomo Inc 映像評価装置、フレームレート決定装置、映像処理装置、映像評価方法、および映像評価プログラム
US8019175B2 (en) 2005-03-09 2011-09-13 Qualcomm Incorporated Region-of-interest processing for video telephony
US8977063B2 (en) * 2005-03-09 2015-03-10 Qualcomm Incorporated Region-of-interest extraction for video telephony
WO2006137798A1 (en) * 2005-06-23 2006-12-28 Anoto Ab Methods and devices relating to transfer of non-pen stroke data
US20070252836A1 (en) * 2006-04-28 2007-11-01 General Electric Company Region of interest selector
JP4251217B2 (ja) * 2006-06-21 2009-04-08 セイコーエプソン株式会社 印刷装置、画像データファイル処理装置、画像データファイルの選択方法、およびコンピュータプログラム
CN101098473B (zh) * 2006-06-30 2012-05-09 联想(北京)有限公司 一种图像编码方法及装置
JP2008193410A (ja) * 2007-02-05 2008-08-21 Matsushita Electric Ind Co Ltd 画像符号化装置、録画装置、動画像符号化方法、動画像符号化プログラム
US8041137B2 (en) * 2007-03-06 2011-10-18 Broadcom Corporation Tiled output mode for image sensors
US8060887B2 (en) 2007-03-30 2011-11-15 Uranus International Limited Method, apparatus, system, and medium for supporting multiple-party communications
US7765261B2 (en) 2007-03-30 2010-07-27 Uranus International Limited Method, apparatus, system, medium and signals for supporting a multiple-party communication on a plurality of computer servers
US8702505B2 (en) 2007-03-30 2014-04-22 Uranus International Limited Method, apparatus, system, medium, and signals for supporting game piece movement in a multiple-party communication
US7950046B2 (en) 2007-03-30 2011-05-24 Uranus International Limited Method, apparatus, system, medium, and signals for intercepting a multiple-party communication
US7765266B2 (en) 2007-03-30 2010-07-27 Uranus International Limited Method, apparatus, system, medium, and signals for publishing content created during a communication
US8627211B2 (en) 2007-03-30 2014-01-07 Uranus International Limited Method, apparatus, system, medium, and signals for supporting pointer display in a multiple-party communication
US20080292219A1 (en) * 2007-05-24 2008-11-27 Gary Keall Method And System For An Image Sensor Pipeline On A Mobile Imaging Device
US9058668B2 (en) * 2007-05-24 2015-06-16 Broadcom Corporation Method and system for inserting software processing in a hardware image sensor pipeline
KR101421231B1 (ko) * 2007-07-04 2014-07-24 세종대학교산학협력단 웨이블릿 변환을 이용한 영상 압축 장치
JP5326234B2 (ja) * 2007-07-13 2013-10-30 ソニー株式会社 画像送信装置、画像送信方法および画像送信システム
JP2009044328A (ja) 2007-08-07 2009-02-26 Seiko Epson Corp 会議システム、サーバ、画像表示方法、コンピュータプログラム及び記録媒体
CN101999232A (zh) * 2008-04-04 2011-03-30 富士胶片株式会社 图像处理系统、图像处理方法、以及计算机可读介质
US8948822B2 (en) * 2008-04-23 2015-02-03 Qualcomm Incorporated Coordinating power management functions in a multi-media device
US8908763B2 (en) * 2008-06-25 2014-12-09 Qualcomm Incorporated Fragmented reference in temporal compression for video coding
US8964828B2 (en) 2008-08-19 2015-02-24 Qualcomm Incorporated Power and computational load management techniques in video processing
US8948270B2 (en) 2008-08-19 2015-02-03 Qualcomm Incorporated Power and computational load management techniques in video processing
US8385404B2 (en) * 2008-09-11 2013-02-26 Google Inc. System and method for video encoding using constructed reference frame
JP5340091B2 (ja) * 2008-12-19 2013-11-13 キヤノン株式会社 画像符号化装置及びその制御方法
JP5433377B2 (ja) * 2009-10-29 2014-03-05 楽天株式会社 画像処理装置、画像処理方法、および、画像処理プログラム
KR101583088B1 (ko) * 2009-11-11 2016-01-07 엘지전자 주식회사 화상 회의 시스템에서 데이터를 공유하는 방법 및 장치
IT1397591B1 (it) * 2009-12-21 2013-01-16 Sisvel Technology Srl Metodo per la generazione, trasmissione e ricezione di immagini stereoscopiche e relativi dispositivi.
KR101536748B1 (ko) * 2010-02-08 2015-07-14 삼성전자 주식회사 클라이언트 단말, 서버, 클라우드 컴퓨팅 시스템 및 방법
CN102487443B (zh) * 2010-12-03 2016-05-18 奇扬网科股份有限公司 荧幕画面的编码方法及其应用的电子装置
US8665307B2 (en) 2011-02-11 2014-03-04 Tangome, Inc. Augmenting a video conference
US9544543B2 (en) 2011-02-11 2017-01-10 Tangome, Inc. Augmenting a video conference
US9465434B2 (en) 2011-05-23 2016-10-11 Haworth, Inc. Toolbar dynamics for digital whiteboard
US20140055400A1 (en) * 2011-05-23 2014-02-27 Haworth, Inc. Digital workspace ergonomics apparatuses, methods and systems
EP2715490B1 (en) 2011-05-23 2018-07-11 Haworth, Inc. Digital whiteboard collaboration apparatuses, methods and systems
US9471192B2 (en) 2011-05-23 2016-10-18 Haworth, Inc. Region dynamics for digital whiteboard
GB2491164B (en) * 2011-05-25 2013-09-11 Canon Kk Method and device for compression of video data
US20130009980A1 (en) * 2011-07-07 2013-01-10 Ati Technologies Ulc Viewing-focus oriented image processing
CN102238390B (zh) * 2011-08-05 2013-03-20 中国科学院深圳先进技术研究院 基于图像库的视频和图像的编码解码方法与系统
US20130039429A1 (en) * 2011-08-11 2013-02-14 Xue Rong Hong Computer display content coding method and system
GB2493755B (en) * 2011-08-17 2016-10-19 Canon Kk Method and device for encoding a sequence of images and method and device for decoding a sequence of images
US20130083997A1 (en) * 2011-10-04 2013-04-04 Alcatel-Lucent Usa Inc. Temporally structured light
TWI488487B (zh) * 2011-10-18 2015-06-11 Acer Inc 利用手勢調整視訊影像壓縮的方法
US8724912B2 (en) * 2011-11-14 2014-05-13 Fujifilm Corporation Method, apparatus, and program for compressing images, and method, apparatus, and program for decompressing images
JP5826612B2 (ja) 2011-11-18 2015-12-02 株式会社キーエンス 画像処理装置、画像処理方法及びコンピュータプログラム
CN102427533B (zh) * 2011-11-22 2013-11-06 苏州科雷芯电子科技有限公司 视频传输装置及方法
JP5722761B2 (ja) * 2011-12-27 2015-05-27 株式会社ソニー・コンピュータエンタテインメント 動画圧縮装置、画像処理装置、動画圧縮方法、画像処理方法、および動画圧縮ファイルのデータ構造
CN103248944B (zh) * 2012-02-03 2017-08-25 海尔集团公司 一种图像传输方法及系统
US20140362170A1 (en) * 2012-02-15 2014-12-11 Thomson Licensing Video conference system and method for maintaining participant eye contact
US9479548B2 (en) 2012-05-23 2016-10-25 Haworth, Inc. Collaboration system with whiteboard access to global collaboration data
US9479549B2 (en) 2012-05-23 2016-10-25 Haworth, Inc. Collaboration system with whiteboard with federated display
US9083844B2 (en) * 2012-06-01 2015-07-14 Nintendo Co., Ltd. Computer-readable medium, information processing apparatus, information processing system and information processing method
KR101350996B1 (ko) * 2012-06-11 2014-01-13 재단법인 실감교류인체감응솔루션연구단 아이콘텍이 가능한 3차원 원격회의 장치 및 이를 이용한 방법
CN103517072B (zh) * 2012-06-18 2017-11-03 联想(北京)有限公司 视频通信方法和设备
US10771801B2 (en) * 2012-09-14 2020-09-08 Texas Instruments Incorporated Region of interest (ROI) request and inquiry in a video chain
US11861561B2 (en) 2013-02-04 2024-01-02 Haworth, Inc. Collaboration system including a spatial event map
US10304037B2 (en) 2013-02-04 2019-05-28 Haworth, Inc. Collaboration system including a spatial event map
US9274606B2 (en) * 2013-03-14 2016-03-01 Microsoft Technology Licensing, Llc NUI video conference controls
KR20140113137A (ko) * 2013-03-15 2014-09-24 삼성전자주식회사 디스플레이장치 및 그 제어방법
CN105144768B (zh) * 2013-04-26 2019-05-21 英特尔Ip公司 频谱共享情境中的共享频谱重新分配
US20140320592A1 (en) * 2013-04-30 2014-10-30 Microsoft Corporation Virtual Video Camera
US20150049099A1 (en) 2013-08-13 2015-02-19 Mediatek Inc. Data processing apparatus for transmitting/receiving compressed pixel data groups of picture over display interface and related data processing method
JP2015095733A (ja) * 2013-11-11 2015-05-18 キヤノン株式会社 画像伝送装置、画像伝送方法、及びプログラム
US9386275B2 (en) * 2014-01-06 2016-07-05 Intel IP Corporation Interactive video conferencing
US9516220B2 (en) 2014-10-02 2016-12-06 Intel Corporation Interactive video conferencing
KR101602581B1 (ko) * 2014-11-27 2016-03-11 한동대학교 산학협력단 압축 영상의 암호화 방법 및 시스템
US10021346B2 (en) 2014-12-05 2018-07-10 Intel IP Corporation Interactive video conferencing
CN104486598A (zh) * 2014-12-31 2015-04-01 国家电网公司 一种视频监控方法及装置
WO2016179401A1 (en) 2015-05-06 2016-11-10 Haworth, Inc. Virtual workspace viewport follow mode and location markers in collaboration systems
US20170180758A1 (en) * 2015-12-22 2017-06-22 Vallabhajosyula S. Somayazulu Tiled Wireless Display
CN107180407A (zh) * 2016-03-09 2017-09-19 杭州海康威视数字技术股份有限公司 一种图片处理方法及装置
CN107368269B (zh) * 2016-05-11 2019-03-26 北京京东尚科信息技术有限公司 传输屏幕图像的方法、装置和系统
FR3054945B1 (fr) 2016-08-05 2019-09-06 Viaccess Procede de lecture et de generation d'un flux video contenant des images compressees et chiffrees
JP6729170B2 (ja) * 2016-08-23 2020-07-22 沖電気工業株式会社 画像処理システム及び画像復号装置
JP6606530B2 (ja) * 2017-06-20 2019-11-13 キヤノン株式会社 画像処理装置およびその制御方法、撮像装置、監視システム
US10686996B2 (en) 2017-06-26 2020-06-16 Facebook Technologies, Llc Digital pixel with extended dynamic range
US10598546B2 (en) 2017-08-17 2020-03-24 Facebook Technologies, Llc Detecting high intensity light in photo sensor
CN108476320A (zh) * 2017-08-31 2018-08-31 深圳市大疆创新科技有限公司 编码方法、解码方法以及编码装置和解码装置
US11934637B2 (en) 2017-10-23 2024-03-19 Haworth, Inc. Collaboration system including markers identifying multiple canvases in multiple shared virtual workspaces
US12019850B2 (en) 2017-10-23 2024-06-25 Haworth, Inc. Collaboration system including markers identifying multiple canvases in multiple shared virtual workspaces
US11126325B2 (en) 2017-10-23 2021-09-21 Haworth, Inc. Virtual workspace including shared viewport markers in a collaboration system
DE112018006630T5 (de) 2017-12-28 2020-09-24 Intel Corporation Visual fog
US10719744B2 (en) 2017-12-28 2020-07-21 Intel Corporation Automated semantic inference of visual features and scenes
JP6694905B2 (ja) * 2018-03-13 2020-05-20 株式会社日立国際電気 映像符号化装置及び映像符号化方法
US12034015B2 (en) 2018-05-25 2024-07-09 Meta Platforms Technologies, Llc Programmable pixel array
US11906353B2 (en) 2018-06-11 2024-02-20 Meta Platforms Technologies, Llc Digital pixel with extended dynamic range
US11463636B2 (en) 2018-06-27 2022-10-04 Facebook Technologies, Llc Pixel sensor having multiple photodiodes
US10897586B2 (en) 2018-06-28 2021-01-19 Facebook Technologies, Llc Global shutter image sensor
JP2020017798A (ja) * 2018-07-23 2020-01-30 Supership株式会社 画像配信システム、画像配信装置、表示装置及び表示プログラム
CN109005421A (zh) * 2018-08-17 2018-12-14 青岛海信电器股份有限公司 图像处理方法及装置、计算机可读存储介质
US10931884B2 (en) 2018-08-20 2021-02-23 Facebook Technologies, Llc Pixel sensor having adaptive exposure time
US11956413B2 (en) 2018-08-27 2024-04-09 Meta Platforms Technologies, Llc Pixel sensor having multiple photodiodes and shared comparator
US11595602B2 (en) 2018-11-05 2023-02-28 Meta Platforms Technologies, Llc Image sensor post processing
US20200195944A1 (en) * 2018-12-14 2020-06-18 Advanced Micro Devices, Inc. Slice size map control of foveated coding
US11962928B2 (en) 2018-12-17 2024-04-16 Meta Platforms Technologies, Llc Programmable pixel array
US11888002B2 (en) 2018-12-17 2024-01-30 Meta Platforms Technologies, Llc Dynamically programmable image sensor
JP7390788B2 (ja) * 2018-12-20 2023-12-04 キヤノン株式会社 画像符号化装置及びその制御方法及びプログラム
WO2020176517A1 (en) 2019-02-25 2020-09-03 Haworth, Inc. Gesture based workflows in a collaboration system
US11218660B1 (en) 2019-03-26 2022-01-04 Facebook Technologies, Llc Pixel sensor having shared readout structure
CN110197447B (zh) * 2019-04-17 2022-09-30 哈尔滨沥海佳源科技发展有限公司 基于通讯指数在线教育方法、装置、电子设备、存储介质
US11606574B2 (en) * 2019-05-31 2023-03-14 Apple Inc. Efficient coding of source video sequences partitioned into tiles
US11943561B2 (en) 2019-06-13 2024-03-26 Meta Platforms Technologies, Llc Non-linear quantization at pixel sensor
US12108141B2 (en) 2019-08-05 2024-10-01 Meta Platforms Technologies, Llc Dynamically programmable image sensor
CN110517336B (zh) * 2019-08-28 2021-02-05 北京理工大学 一种基于主发力关节点的人体运动数据压缩方法及设备
US11936998B1 (en) 2019-10-17 2024-03-19 Meta Platforms Technologies, Llc Digital pixel sensor having extended dynamic range
US11935291B2 (en) 2019-10-30 2024-03-19 Meta Platforms Technologies, Llc Distributed sensor system
US11948089B2 (en) 2019-11-07 2024-04-02 Meta Platforms Technologies, Llc Sparse image sensing and processing
CN111479113B (zh) * 2020-04-15 2021-04-09 腾讯科技(深圳)有限公司 码率控制方法和装置、存储介质和电子设备
US11902685B1 (en) 2020-04-28 2024-02-13 Meta Platforms Technologies, Llc Pixel sensor having hierarchical memory
US11750672B2 (en) 2020-05-07 2023-09-05 Haworth, Inc. Digital workspace sharing over one or more display clients in proximity of a main client
US11212127B2 (en) 2020-05-07 2021-12-28 Haworth, Inc. Digital workspace sharing over one or more display clients and authorization protocols for collaboration systems
US11825228B2 (en) 2020-05-20 2023-11-21 Meta Platforms Technologies, Llc Programmable pixel array having multiple power domains
US11910114B2 (en) 2020-07-17 2024-02-20 Meta Platforms Technologies, Llc Multi-mode image sensor
US12075175B1 (en) 2020-09-08 2024-08-27 Meta Platforms Technologies, Llc Programmable smart sensor with adaptive readout
US11956560B2 (en) 2020-10-09 2024-04-09 Meta Platforms Technologies, Llc Digital pixel sensor having reduced quantization operation
US11935575B1 (en) 2020-12-23 2024-03-19 Meta Platforms Technologies, Llc Heterogeneous memory system
US12022218B2 (en) 2020-12-29 2024-06-25 Meta Platforms Technologies, Llc Digital image sensor using a single-input comparator based quantizer
CN115134633B (zh) * 2021-03-26 2024-04-26 华为技术有限公司 一种远程视频方法及相关装置
CN113420535A (zh) * 2021-06-04 2021-09-21 山东师范大学 基于vba的矩阵图表生成方法及系统
US20220109838A1 (en) * 2021-12-17 2022-04-07 Intel Corporation Methods and apparatus to process video frame pixel data using artificial intelligence video frame segmentation
JPWO2023144964A1 (ja) * 2022-01-27 2023-08-03
JP7443597B2 (ja) * 2022-05-31 2024-03-05 Fairy Devices株式会社 動画像の送受信システム、送信端末、プログラム及び方法
WO2024077797A1 (en) * 2022-10-11 2024-04-18 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Method and system for retargeting image

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05304662A (ja) * 1992-04-24 1993-11-16 Seiko Epson Corp 画像符号化伝送装置
JPH06253158A (ja) * 1993-02-23 1994-09-09 Ricoh Co Ltd 通信会議装置
JPH07203434A (ja) * 1993-12-30 1995-08-04 Canon Inc 画像送信装置
JPH11122610A (ja) * 1997-10-17 1999-04-30 Toshiba Corp 画像符号化方法及び画像復号化方法並びにこれらの装置
JP2000083239A (ja) * 1998-07-08 2000-03-21 Victor Co Of Japan Ltd 監視装置

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61141889A (ja) 1984-12-17 1986-06-28 Meiji Seika Kaisha Ltd 新抗生物質sf−2197b物質及びその製造法
US6400996B1 (en) * 1999-02-01 2002-06-04 Steven M. Hoffberg Adaptive pattern recognition based control system and method
JP2915248B2 (ja) * 1993-05-07 1999-07-05 沖電気工業株式会社 画像通信システム
JPH07288806A (ja) * 1994-04-20 1995-10-31 Hitachi Ltd 動画像通信システム
US5815197A (en) * 1995-02-16 1998-09-29 Sumitomo Electric Industries, Ltd. Two-way interactive system, terminal equipment and image pickup apparatus having mechanism for matching lines of sight between interlocutors through transmission means
JP3086396B2 (ja) 1995-03-10 2000-09-11 シャープ株式会社 画像符号化装置及び画像復号装置
US5740278A (en) 1996-02-16 1998-04-14 Cornell Research Foundation, Inc. Facsimile-based video compression method and system
US6104417A (en) * 1996-09-13 2000-08-15 Silicon Graphics, Inc. Unified memory computer architecture with dynamic graphics memory allocation
US6614847B1 (en) * 1996-10-25 2003-09-02 Texas Instruments Incorporated Content-based video compression
FR2764511B1 (fr) * 1997-06-13 2000-09-08 Sanofi Sa Compositions pour le traitement et la prevention de la thrombose arterielle et utilisation d'un inhibiteur du facteur xa seul et/ou en combinaison avec un antiagregant plaquettaire
KR100316639B1 (ko) * 1998-05-22 2002-01-16 윤종용 다지점 영상회의 시스템 및 그에 따른 구현방법
JP3748717B2 (ja) * 1998-08-31 2006-02-22 シャープ株式会社 動画像符号化装置
JP2000092502A (ja) * 1998-09-11 2000-03-31 Nec Corp 動画像伝送システム
US6256423B1 (en) 1998-09-18 2001-07-03 Sarnoff Corporation Intra-frame quantizer selection for video compression
JP3901359B2 (ja) 1998-09-25 2007-04-04 松下電器産業株式会社 電子透かし方法、署名画像埋め込み装置、及び記録媒体
SE513356C2 (sv) * 1998-11-20 2000-08-28 Ericsson Telefon Ab L M Förfarande och anordning för kryptering av bilder
JP3115866B2 (ja) * 1998-12-18 2000-12-11 シャープ株式会社 画像符号化装置及び画像復号装置
JP2000358183A (ja) 1999-06-14 2000-12-26 Canon Inc 画像処理装置及びその方法
JP2001053947A (ja) * 1999-08-05 2001-02-23 Toshiba Corp 画像情報伝達装置および画像情報伝達システム
JP2001145101A (ja) * 1999-11-12 2001-05-25 Mega Chips Corp 人物画像圧縮装置
JP2002064709A (ja) * 2000-06-06 2002-02-28 Canon Inc 画像処理装置及びその方法とそのコンピュータプログラム及び記憶媒体
US7116843B1 (en) * 2000-07-24 2006-10-03 Quark, Inc. Method and system using non-uniform image blocks for rapid interactive viewing of digital images over a network
JP2002271790A (ja) * 2001-03-07 2002-09-20 Nikon Corp 画像圧縮装置、電子カメラおよび画像処理プログラム
JP2002369202A (ja) 2001-06-11 2002-12-20 Ricoh Co Ltd 画像圧縮装置、画像伸長装置、画像圧縮方法、画像伸長方法、プログラム、及び該プログラムを記録した記録媒体
JP2003189310A (ja) * 2001-12-19 2003-07-04 Nef:Kk 画像符号化装置
JP2003324418A (ja) * 2002-02-27 2003-11-14 Canon Inc 画像処理装置、データ処理装置及びデータ処理方法
US7224845B1 (en) * 2002-02-28 2007-05-29 Bae Systems Information And Electric Systems Integration Inc. Bijection mapping for compression/denoising of multi-frame images
EP1349393A1 (en) * 2002-03-15 2003-10-01 Ricoh Company Image compression device, image decompression device, image compression/decompression device, program for executing on a computer to perform functions of such devices, and recording medium storing such a program
JP2004015501A (ja) * 2002-06-07 2004-01-15 Nec Corp 動画像符号化装置および動画像符号化方法
JP4145086B2 (ja) 2002-07-17 2008-09-03 株式会社リコー 画像復号装置、画像処理装置、動画像表示システム、プログラム、記憶媒体及び画像復号方法
JP3966461B2 (ja) * 2002-08-09 2007-08-29 株式会社リコー 電子カメラ装置
JP4036363B2 (ja) * 2002-09-17 2008-01-23 株式会社リコー 画像処理装置及び画像処理方法
US7039247B2 (en) * 2003-01-31 2006-05-02 Sony Corporation Graphic codec for network transmission

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05304662A (ja) * 1992-04-24 1993-11-16 Seiko Epson Corp 画像符号化伝送装置
JPH06253158A (ja) * 1993-02-23 1994-09-09 Ricoh Co Ltd 通信会議装置
JPH07203434A (ja) * 1993-12-30 1995-08-04 Canon Inc 画像送信装置
JPH11122610A (ja) * 1997-10-17 1999-04-30 Toshiba Corp 画像符号化方法及び画像復号化方法並びにこれらの装置
JP2000083239A (ja) * 1998-07-08 2000-03-21 Victor Co Of Japan Ltd 監視装置

Also Published As

Publication number Publication date
CA2553434C (en) 2012-08-07
CN101820537B (zh) 2013-04-03
EP1701546A1 (en) 2006-09-13
AU2005236997A1 (en) 2005-11-03
NO20065381L (no) 2006-11-22
AU2005236997B2 (en) 2010-04-29
US7983497B2 (en) 2011-07-19
TW200601838A (en) 2006-01-01
TWI372563B (en) 2012-09-11
US20100118935A1 (en) 2010-05-13
KR101099884B1 (ko) 2011-12-28
EP1701546A4 (en) 2010-09-15
CA2553434A1 (en) 2005-11-03
CN101820537A (zh) 2010-09-01
JP2006101472A (ja) 2006-04-13
WO2005104552A1 (ja) 2005-11-03
US20050237380A1 (en) 2005-10-27
KR20070044397A (ko) 2007-04-27
CN1914915A (zh) 2007-02-14

Similar Documents

Publication Publication Date Title
JP4763312B2 (ja) 動画像データの符号化方法、復号化方法、これらを実行する端末装置、及び双方向対話型システム
US8773498B2 (en) Background compression and resolution enhancement technique for video telephony and video conferencing
US6970181B1 (en) Bandwidth conserving near-end picture-in-picture video applications
US9270941B1 (en) Smart video conferencing system
US8130257B2 (en) Speaker and person backlighting for improved AEC and AGC
US11076127B1 (en) System and method for automatically framing conversations in a meeting or a video conference
JP2009510877A (ja) 顔検出を利用したストリーミングビデオにおける顔アノテーション
CN1863301A (zh) 视频会议系统和方法
US10762663B2 (en) Apparatus, a method and a computer program for video coding and decoding
CN108683874B (zh) 一种视频会议注意力聚焦的方法及一种存储设备
CN101939989A (zh) 虚拟桌子
CN114531564A (zh) 处理方法及电子设备
JP2003111041A (ja) 画像処理装置、画像処理システム、画像処理方法、記憶媒体、及びプログラム
JP4649640B2 (ja) 画像処理方法、画像処理装置、及びコンテンツ作成システム
JP2017103641A (ja) 情報処理装置、会議システム、情報処理方法およびプログラム
US11877084B2 (en) Video conference user interface layout based on face detection
JPS62200883A (ja) 電子会議システムにおける図形表示装置
WO2022006693A1 (en) Videoconferencing systems with facial image rectification
JPH08317363A (ja) 画像伝送装置
JP2017092950A (ja) 情報処理装置、会議システム、情報処理方法およびプログラム
JP2000287188A (ja) 多地点間映像音声通信システム及びその装置
CN116095295A (zh) 一种全景多屏互动数字展示系统
JP2006093864A (ja) 画像表示方法、端末装置、及び双方向対話型システム
WO2019234855A1 (ja) 表示システム、画像処理回路、画像処理方法、及びプログラム
JPH0244885A (ja) 画像伝送方法及び装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070618

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100616

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100622

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100818

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110308

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110426

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110531

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110609

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140617

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees