JP6091850B2 - テレコミュニケーション装置及びテレコミュニケーション方法 - Google Patents
テレコミュニケーション装置及びテレコミュニケーション方法 Download PDFInfo
- Publication number
- JP6091850B2 JP6091850B2 JP2012247256A JP2012247256A JP6091850B2 JP 6091850 B2 JP6091850 B2 JP 6091850B2 JP 2012247256 A JP2012247256 A JP 2012247256A JP 2012247256 A JP2012247256 A JP 2012247256A JP 6091850 B2 JP6091850 B2 JP 6091850B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- projection
- video
- dimensional
- telecommunications
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
一方、表示装置が大型化し、あるいは複数のディスプレイを組み合わせることで比較的容易に表示領域を拡大できるようになると、そういった表示装置をオフィスの居室内に設置して、遠隔地のオフィスと常時接続して遠隔オフィスを実現することが期待されている。これは、出張費の削減や、日常業務において遠隔地間が映像と音声を通じで接続していることによる業務効率の向上といった効果が考えられるためである。その際に、従来の利用スタイルのように一つの会議が装置を占有してしまうと利用効率が下がるため、大画面の表示装置を分割して同時に複数で利用できることが望まれている。
(第1の実施の形態)
<テレコミュニケーション装置の外観>
図4は映像と音声を双方向通信できる本発明の第1の実施形態に係るテレコミュニケーション装置および入・出力装置の外観を模式的に示す図である。インターネットなどの広域のネットワーク406より先の遠隔地にも同じテレコミュニケーション装置が接続されており、双方で映像と音声を送信し合うことで、リアルタイムにコミュニケーションを行うことができる。
また、表示装置401の上部には、利用者の映像、音声および後述する本発明に関わる処理を実施するために必要な情報(計算機内に仮想的な3次元モデルを構築することができる情報で、例えば被写体までの奥行き情報である)を取得するマルチメディア情報取得装置402が置かれて、計算機404に接続されている。
計算機404には、さらにキーボードなどの操作装置405が接続されており、システム全体を制御するためのコマンドを入力することが可能である。
続いて、計算機404の内部で行う処理について、図5のブロック図を用いて説明する。図5において、広域のネットワーク406より左側が例えば上記外観図(図4)で示したテレコミュニケーション装置の側を示し、右側が遠隔地の側を示している。
映像信号及び奥行き信号は送信部501内の送信映像処理部502に、音声信号は送信音声処理部503に入力され、信号処理および遠隔地に送信するための符号化処理が施される。その後、図示していないパッキング部により映像と音声の符号化データがパッキング(packing;詰込)されて、広域のネットワーク406を経由して遠隔地に伝送される。
映像符号化データは受信部504内の受信映像処理部505に入力され、音声信号は受信音声処理装置506に入力される。そしてこれら映像信号及び音声信号は、映像や音声を再現できる形に信号処理され、ディスプレイ(表示装置)401やスピーカ(音声再生装置)403に出力される。
図示していないが、テレコミュニケーション装置500,510には、ITU−T(International Telecommunication Union- Telecommunication sector)にて策定されたテレビ会議向けのプロトコルである、H.320やH.323等に従って通信する機能を備えており、本テレコミュニケーション装置とは異なる一般的なテレビ会議システムと相互に接続して、コミュニケーションを行うことも可能である。
映像モデル処理部600は、計算機内に仮想的に設けた3次元空間に、前記入力された奥行き情報に基づいて映像データと共に3次元実写映像モデルとして再現する。投影処理部A601及び投影処理部B602は、映像モデル処理部600において再現された3次元実写映像モデルに対して、所定の距離範囲にある映像モデルをそれぞれ異なる投影方式による仮想的なカメラで写し撮って2次元の平面画像を生成する。
制御部604は、外部に接続された操作装置405を使って利用者が入力した動作指示に従って、図示していない各種パラメータ群を保持しておくメモリから適切なパラメータセットを抽出して各処理部に設定したり、あるいはネットワークを介して繋がる外部のテレコミュニケーション装置や一般的なテレビ会議システムとを相互に接続させるための通信処理を実現できる機能を有している。
音声符号化データは、図示していないが、前述の一般的なテレビ会議システムで行われているように再生可能な音声信号に復号した後、映像と同期して外部に接続したスピーカに信号を出力し、音声として再現される。
一方映像符号化データは、復号部610に入力され、前述の符号化部605で行われた符号化処理による符号化データを復号する処理を実施する。復号された映像信号は表示メモリ611に入力され、テレコミュニケーション装置500の外部に接続された表示装置(ディスプレイ)401に供給され映像として表示される。
以下、本発明の特徴である複数の異なる投影方式で取得した撮影画像を合成して1枚の画像を作りだし、それをテレコミュニケーション装置で扱う映像とすることで、図1に示すようなテレコミュニケーションのスタイルを実現できることについて説明する。
このモデルでは、被写体とカメラの原点を結ぶ直線と撮影装置の投影面900とが交わるところに、被写体像として結像され画像が生成される。そのため、被写体が撮影装置の中心を向いていないと、正面を向いたような画像として取得することができない。具体的には、位置907にある被写体を正面を向いたような画像として捉えるためには、方向908を向いている必要があるということである。これは、特に大画面の表示装置を用いて遠隔のコミュニケーションを行う場合に問題になり、利用者位置が中心から離れるほど、画面内の相手を見る向きと自分が正面を向いているように撮影される向きが一致しなくなる。
後述する映像モデル処理部600において生成する3次元実写映像モデルは、この図におけるマルチメディア情報取得装置402の座標系を用いて規定する3次元モデルである。以下、このマルチメディア情報取得装置402の座標系をマルチメディア情報取得装置座標系XYZ_multiと呼ぶこととする。図8においてその原点を801、座標軸のz軸の正の方向を804、y軸の正の方向を805として示し、図示していないがx軸の正の方向は原点801を起点として紙面の裏の方向に向かっているものとする。原点801は、マルチメディア情報取得装座標系の原点であるとともに、マルチメディア情報取得装置402の光学中心でもある。
v(u)=D(u)K−1[u1]T ・・・(1)
ここで、[ ]Tは行列の転置を表し、[u1]は画素位置uの次元を一つ増やした斉次行列を表している。
また3DCG技術による射影変換では、射影変換の対象となる範囲を規定することが可能で、ある所定の距離にあるオブジェクトに対して個別に射影変換を行うことができる。視点座標系1002を射影変換して得られる座標系は、クリップ座標系・正規化デバイス座標系1003と呼ばれる。
以上により、個々の座標系を持った3次元モデルを、共通の座標系であるワールド座標系に変換して、さらに計算機内の仮想的なカメラによる所定の視点の映像として取得することができる。最終的には、表示装置で表示できるような座標系を持つ画像に変換することができる。
まずは、映像モデル処理部600にて生成する3次元実写モデルが、上記説明におけるオブジェクトであり、その座標系であるマルチメディア取得装置座標系XYZ_multiがオブジェクト座標系1010に対応している。表示装置中心に設置した座標系XYZ_systemが、ワールド座標系1011であり、図8における表示装置401の中心800からマルチメディア情報取得装置402までのy方向の距離Hとシステム座標系XYZ_systemのz軸に平行な補助直線806との角度Θを用いて、以下の様にモデリング変換を行うことができる(式(2))。
glRotate(Θ、1.0、0.0、0.0)
glTranslate(0、H/2、0) ・・・(2)
例えば式(2)では、最初にglMatrixMode()が実行され、続いてglRotate()、GlTranslate()の順に実行される。
次に、式(2)で実行される命令について説明すると、glMatrixMode(GL_MODELVIEW)が、以降の処理がモデリング変換であることを宣言する命令で、glRotate(Θ、1.0、0.0、0.0)は、x軸を中心としてΘ角度分モデルを回転させる命令である。最後のglTranslate(0、H/2、0)は、y軸の方向にH/2併進させる命令である。以上により、ローカルなオブジェクト座標系からワールド座標系に変換することができ、映像モデル処理部600で生成した3次元実写モデルをワールド座標系に配置させることができる。
投影処理部A601が近領域を対象とした平行投影法を実施する処理部とし、投影処理部B602が遠領域を対象とした透視投影を実施する処理部とする。従って、図10(B)では、視野変換A,射影変換Aのパスが投影処理部A601にて実施され、視野変換B、射影変換Bのパスが投影処理部B602において実行されるものとする。
glLookAT(0、0、0.5、0、0、1、0、1、0) ・・・(4)
glOrtho(−W/2、+W/2、−H/2、+H/2、0.7、2.4)
・・・(5)
glMatrixMode(GL_PROJECTION)
glFrustum(−W/2、+W/2、−H/2、+H/2、1.8、20)
・・・(6)
以上により、投影処理部A601と投影処理部B602は異なる投影方式を適用することができる。
glViewport(0、0、width、height) ・・・(7)
つまり、被写体までの奥行き情報を何らかの方法で映像情報取得することができれば、その情報を用いて平行投影画像を作り出すことができる。1台の撮影装置によってそういった画像を作る際の問題として、実写映像の情報が足りなくなることがある。ここでは撮影装置の台数が多いほど、お互いに映像を補完することができ、より緻密に平行投影画像を生成することができるが、撮影装置の台数が少ないと、撮影装置から見えない場所(カメラが捉えていない場所=オクルージョン)が多く発生するため、そういった問題が起きやすくなる。その場合の対策の一例として、画像処理による穴埋め処理を行うことができる。穴埋め処理(オクルージョン処理)については公知の様々な方法が存在しているが、周辺の情報+奥行きの情報を用いて(例えば、距離の遠い周辺実写映像情報を用いて)、上記情報が不足した領域を目立たないように埋めることができ、平行投影画像を生成することができる。
上記第1の実施例では、予め設定した距離によって2種類の投影方式を切り替える方法について示した。単純に被写体までの距離によって投影方式を切り替えているため、計算量を削減できるメリットがある。これは、システムの利用シーンがある程度想定できる場合には、その切り替え位置を簡単に決められるという前提に基づくものである。
ところが、被写体が上記2種類の投影方式を跨ぐ位置にある場合には、その切り替えのため映像ギャップが発生し画質劣化となる課題が発生する。
本発明による複数の投影方式を切り替えることによるテレコミュニケーションでは、システムで扱う表示装置の大きさにその切り替え位置が依存する。つまり、極端な場合、表示装置の大きさが十分に小さい場合には通常の方式で撮影を行っても、これまで説明してきたような問題は生じにくい。従って、システムで扱う表示装置の大きさを、双方でやり取りできる仕組みを持つことは重要である。この際に扱う情報は、お互いの装置を接続する時に一度だけやり取りすればよい。お互いのシステムの表示装置の大きさ情報を起動時の接続プロセスにおける通信時にやり取りする。その方式は特に限定するものではない。
第1の実施の形態では、送信側で最終的な映像(2種類の投影方式による画像を合成した送信用の画像)を作り出して、それを圧縮符号化して伝送する構成になっている。この方式では、伝送する画像は既に加工が完了した所謂通常の画像になった後のデータであるため、符号化データは映像のみ(当然音声データは含まれるが、奥行き情報は含んでいないという意味)の情報で良く、これまでの通信プロトコルをそのまま適用することができるというメリットがある。一方で、受信側には自由度が無く、送られてきた符号化データを復号してそのまま表示するのみになる。つまり、受け手側で、本発明による映像表示方式をONにしたりOFFにしたりすることができない。
あるいは、MPEG−C PART3による動画像とデプスを含むデータの圧縮・符号化方式を適用することも可能である。以上により、送り手側より映像と奥行き情報を受け手側に送ってあげれば、受け手側で上述の第1の実施形態において送り手側が行ったような3次元映像モデルの再構築、異なる複数の投影方式による映像の取得および合成処理を行い、同様の結果を受信側で作り出すことが可能である。
上記の各実施例において、添付図面に図示されている構成等については、あくまで一例であり、これらに限定されるものではなく、本発明の効果を発揮する範囲内で適宜変更することが可能である。その他、本発明の目的の範囲を逸脱しない限りにおいて適宜変更して実施することが可能である。
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
2種類の投影方式を距離によって切り換えることにより、複数の目的のコミューケーションを違和感なく実現することができるようになる。例えば、近くの被写体は画面内の映像を向いていても正面を見ているように撮影することができ、ある程度離れた被写体に対しては遠近感を持たせた映像とすることができる。
Claims (5)
- 撮影装置で撮影された画像データと、該撮影装置で撮影された被写体の奥行きデータとに対応する3次元オブジェクトの、第1の投影方式による投影画像と、該3次元オブジェクトの、該第1の投影方式とは異なる第2の投影方式による投影画像とから2次元平面画像を生成する投影処理部と、
該投影処理部で生成された2次元平面画像を表すデータを送信する送信部と、を有することを特徴とするテレコミュニケーション装置。 - 前記奥行きデータから、前記撮影装置が撮影した撮影画像内の被写体までの距離を算出し、
前記第1の投影方式と前記第2の投影方式とを、前記撮影装置が撮影した撮影画像内の被写体までの距離に応じて切り替えることを特徴とする請求項1に記載のテレコミュニケーション装置。 - 前記撮影装置が撮影した撮影画像内の被写体までの距離の分布に応じて、前記第1の投影方式と前記第2の投影方式とを切り換える距離を可変にすることを特徴とする請求項2に記載のテレコミュニケーション装置。
- 撮影装置で撮影された画像データと、該撮影装置で撮影された被写体の奥行きデータとを受信する受信部と、
該画像データと該奥行きデータとに対応する3次元オブジェクトの、第1の投影方式による投影画像と、該3次元オブジェクトの、該第1の投影方式とは異なる第2の投影方式による投影画像とから2次元平面画像を生成する投影処理部と、
該投影処理部で生成された2次元平面画像を表示する表示部と、を有することを特徴とするテレコミュニケーション装置。 - 映像と音声に関するデータを送受信することで遠隔コミュニケーションを実現するテレコミュニケーション装置により実行するテレコミュニケーション方法であって、
前記テレコミュニケーション装置が、
撮影装置で撮影された画像データと、該撮影装置で撮影された被写体の奥行きデータとに対応する3次元オブジェクトの、第1の投影方式による投影画像と、該3次元オブジェクトの、該第1の投影方式とは異なる第2の投影方式による投影画像とから2次元平面画像を生成するステップと、
該生成した2次元平面画像を表すデータを送信するステップと、を有することを特徴とするテレコミュニケーション方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012247256A JP6091850B2 (ja) | 2012-11-09 | 2012-11-09 | テレコミュニケーション装置及びテレコミュニケーション方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012247256A JP6091850B2 (ja) | 2012-11-09 | 2012-11-09 | テレコミュニケーション装置及びテレコミュニケーション方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014096701A JP2014096701A (ja) | 2014-05-22 |
JP6091850B2 true JP6091850B2 (ja) | 2017-03-08 |
Family
ID=50939449
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012247256A Expired - Fee Related JP6091850B2 (ja) | 2012-11-09 | 2012-11-09 | テレコミュニケーション装置及びテレコミュニケーション方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6091850B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10389976B2 (en) | 2016-02-16 | 2019-08-20 | Sony Corporation | Information processing apparatus, information processing system, and information processing method |
JPWO2017141511A1 (ja) | 2016-02-17 | 2018-12-06 | ソニー株式会社 | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
CN111480342B (zh) * | 2017-12-01 | 2024-04-23 | 索尼公司 | 编码装置、编码方法、解码装置、解码方法和存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3572252B2 (ja) * | 2000-11-15 | 2004-09-29 | 日本電信電話株式会社 | 実写画像とレンジデータの位置合わせ方法及び装置、並びにこの方法の実行プログラムを記録した記録媒体 |
JP4145121B2 (ja) * | 2002-11-13 | 2008-09-03 | シャープ株式会社 | 画像処理装置 |
-
2012
- 2012-11-09 JP JP2012247256A patent/JP6091850B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2014096701A (ja) | 2014-05-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112205005B (zh) | 使声学渲染适应基于图像的对象 | |
US11010958B2 (en) | Method and system for generating an image of a subject in a scene | |
US10602121B2 (en) | Method, system and apparatus for capture-based immersive telepresence in virtual environment | |
JP6285941B2 (ja) | 制御された三次元通信エンドポイント | |
US11218683B2 (en) | Method and an apparatus and a computer program product for adaptive streaming | |
CN113099204A (zh) | 一种基于vr头戴显示设备的远程实景增强现实方法 | |
KR102499904B1 (ko) | 가상 현실 미디어 콘텐트 내에 포함시키기 위해 실세계 장면의 맞춤화된 뷰의 가상화된 투영을 생성하기 위한 방법들 및 시스템들 | |
US20180310025A1 (en) | Method and technical equipment for encoding media content | |
Cooperstock | Multimodal telepresence systems | |
US20210144283A1 (en) | An apparatus, method, and system for capturing 360/virtual reality video using a mobile phone add-on | |
JP6091850B2 (ja) | テレコミュニケーション装置及びテレコミュニケーション方法 | |
WO2009078909A1 (en) | Virtual object rendering system and method | |
EP3729805A1 (en) | Method for encoding and decoding volumetric video data | |
JP2018033107A (ja) | 動画の配信装置及び配信方法 | |
WO2019034804A2 (en) | THREE-DIMENSIONAL VIDEO PROCESSING | |
WO2018109265A1 (en) | A method and technical equipment for encoding media content | |
GB2565301A (en) | Three-dimensional video processing | |
CN111512640A (zh) | 多相机设备 | |
WO2022004234A1 (ja) | 情報処理装置、情報処理方法およびプログラム | |
EP3623908A1 (en) | A system for controlling audio-capable connected devices in mixed reality environments | |
JP5200141B2 (ja) | 映像提示システム、映像提示方法、プログラム及び記録媒体 | |
RU2805260C2 (ru) | Устройство и способ обработки аудиовизуальных данных | |
WO2022004233A1 (ja) | 情報処理装置、情報処理方法およびプログラム | |
CN117826982A (zh) | 一种基于用户位姿计算的实时音效交互系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20150909 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20150911 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20150915 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20151001 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160817 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160906 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161101 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170110 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170208 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6091850 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |