JPWO2017013986A1 - 情報処理装置、端末、遠隔通信システム、および、情報処理プログラム - Google Patents

情報処理装置、端末、遠隔通信システム、および、情報処理プログラム Download PDF

Info

Publication number
JPWO2017013986A1
JPWO2017013986A1 JP2017529513A JP2017529513A JPWO2017013986A1 JP WO2017013986 A1 JPWO2017013986 A1 JP WO2017013986A1 JP 2017529513 A JP2017529513 A JP 2017529513A JP 2017529513 A JP2017529513 A JP 2017529513A JP WO2017013986 A1 JPWO2017013986 A1 JP WO2017013986A1
Authority
JP
Japan
Prior art keywords
image
unit
marker
information
position information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017529513A
Other languages
English (en)
Inventor
拓人 市川
拓人 市川
大津 誠
誠 大津
太一 三宅
太一 三宅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of JPWO2017013986A1 publication Critical patent/JPWO2017013986A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T19/00Manipulating 3D models or images for computer graphics
    • G06T19/006Mixed reality
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • G06T7/74Determining position or orientation of objects or cameras using feature-based methods involving reference images or patches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30204Marker
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/97Determining parameters from multiple pictures
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/02Electrically-operated educational appliances with visual presentation of the material to be studied, e.g. using film strip

Abstract

同一空間ではあるが、異なる位置にいる複数の作業者に対して効率的な指示を行うことが可能な技術を提供する。第1の視点から撮影された第1の画像、および、第2の視点から撮影された第2の画像を取得する特徴点検出部(1501)と、第1の画像に重畳されたマーカーの位置情報である第1の位置情報を取得するマーカー情報保管部(1500)と、第1の画像、および、第2の画像を参照して、当該第1の画像を当該第2の画像に変換するための画像間変換パラメータを算出する画像間変換パラメータ算出部(1504)と、画像間変換パラメータを参照して、第1の位置情報を、第2の画像に重畳されるマーカーの位置情報である第2の位置情報に変換するマーカー情報変換部(1505)と、を備えた指示装置(1112)。

Description

本発明は、少なくとも2つの視点から撮影された画像に関する処理を行う情報処理装置、端末、および、遠隔通信システムに関する。
知識、経験、ノウハウが重要視される作業の現場において、その作業に習練していない人員に対して、有識者や熟練者が、作業手順、判断基準、問題の対処法等の指示を行うことは多い。その際に、指示を行う側(以下、指示者と称す)と、指示を受ける側(以下、作業者と称す)と、が同じ場所にいて、対面でコミュニケーションを取りながら指示を行うことができれば、作業者は、作業者から効率的な指示を受けることができる。しかし、指示者と、作業者とが同じ場所にいない場合、作業者は、指示者から効率的な指示を受けることはできない。
指示者と、作業者とが同じ場所にいない場合に、作業者が指示者から指示を受ける方法として、マニュアルによる指示がある。この方法では、マニュアルに記載されていない突発的な問題や、状況に応じて経験的に判断しなければならない事例等については、作業者は指示を受けることができない。
指示者と、作業者とが同じ場所にいない場合に、作業者が、指示者から指示を受ける別の方法として、テレビ電話(ビデオ電話)を用いて、遠隔地にいる指示者から指示を受ける方法がある。作業者は、作業箇所や作業の様子を撮影して、その映像を指示者に送信し、指示者は、受信した映像をもとに主に音声によって指示を伝達する。この方法では、マニュアルに記載されていない突発的な問題や、状況に応じて経験的に判断しなければならない事例等についても、作業者は指示者から指示を受けることができる。しかし、指示者は、実物を指さして、視覚的な指示をすることはできない。この課題を解決するために、指示者は、「ここに」「あれを」といった曖昧な表現を含めた指示ではなく、「右端から何番目の上から何番目」といった位置を特定できる表現を用いた指示を行う必要がある。しかし、作業者が絶えず動いている場合、指示者にとっては「三番目」の場所が、作業者にとっては「四番目」やそれ以外の場所となっており、正確に指示内容を伝えることができず、作業効率が低下するという課題が挙げられる。また、「右端から何番目の上から何番目」といった会話は、普段の会話で用いる表現とは異なっており、指示者にかかる負荷が大きいという課題もある。
テレビ電話(ビデオ電話)による指示の課題を解決する方法として、実写の映像上にコンピュータグラフィックス(CG:Computer Graphics)を重畳描画する拡張現実(AR:Augmented Reality)技術を用いる手段がある。AR技術は、CGで作成した絵柄、符号、文字などの目印を、あたかもその場所にあるかのように、映像上に描画することができる。特許文献1及び非特許文献1には、AR技術を用いたAR型作業支援方法について開示されている。
特許文献1及び非特許文献1には、作業者は、撮影した映像(以下、撮影映像と称す)を指示者に送信し、指示者は、作業者から受信した映像上で、目印を指示箇所に設置した映像(以下、合成映像と称す)を作業者に送信することで、作業者に対し視覚的に指示に関する位置を提示する方法が記載されている。特許文献1では、作業者が頭部装着式映像表示装置を表示装置として用いる手法について記載されている。非特許文献1では、作業者が携帯端末を表示装置として用いる手法について記載されている。特許文献1及び非特許文献1の手法は、指示者が指示する箇所が視覚的に明示されているため、テレビ電話(ビデオ電話)と比べて、効率的な指示を行える利点がある。
日本国公開特許公報「特開2008−124795号公報」
ARサポート機能、東日本電信電話株式会社http://www.ntt−east.co.jp/release/detail/20131024_01.html
しかし、特許文献1及び非特許文献1に記載の手法は、同一空間ではあるが、異なる位置に複数の作業者がいる場合に、指示の効率が低下する、という課題がある。同一空間ではあるが、異なる位置に複数の作業者がいる場合に、特許文献1及び非特許文献1に記載の方法を用いて、指示者が作業者に指示を行う方法として、定点カメラで撮影した映像に対して、指示者が目印を指示箇所に設置して指示を行う方法と、全作業者が撮影した映像のそれぞれに対して、指示者が目印を指示箇所に設置して指示を行う方法と、がある。
定点カメラで撮影した映像に対して、指示者が目印を指示箇所に設置して指示を行う方法では、作業者が作業対象物を規定の位置で撮影する定点カメラを用意し、この定点カメラで撮影した映像(以下、定点撮影映像と称す)を指示者に送信する。指示者は、受信した定点撮影映像に対して、目印を指示箇所に設置し、全作業者に送信する。この方法では、作業者が作業を行う位置と、定点カメラが撮影した位置と、が一致しないため、作業者は、指示箇所と、作業箇所と、を目視で判断する必要があり、作業効率が低下する、という課題がある。
全作業者が撮影した映像のそれぞれに対して、指示者が目印を指示箇所に設置して指示を行う方法では、指示者は、全作業者に共通する指示を行う場合、同じ指示を各作業者に行うことになり、効率的な指示を行うことができない。また、作業者ごとに指示を行うタイミングが異なるため、指示者は、即時性が求められる内容の指示を、同時に全作業者に行うことができない。また、指示者が指示箇所を判断するためには、指示者は、各作業者が撮影した位置を、受信した映像から判断する必要があり、指示効率が低下する、という課題がある。
本発明は、以上の課題を鑑みてなされたものであり、同一空間ではあるが、異なる位置にいる複数の作業者に対して効率的な指示を行うことが可能な技術を提供することを目的とする。
上記課題を解決するために、本発明の一態様に係る情報処理装置は、少なくとも2つの視点から撮影された画像に関する処理を行う情報処理装置であって、第1の視点から撮影された第1の画像、および、第2の視点から撮影された第2の画像を取得する画像取得部と、前記第1の画像に重畳されたマーカーの位置情報である第1の位置情報を取得する位置情報取得部と、前記第1の画像、および、前記第2の画像を参照して、当該第1の画像を当該第2の画像に変換するための画像間変換パラメータを算出する画像間変換パラメータ算出部と、前記画像間変換パラメータを参照して、前記第1の位置情報を、前記第2の画像に重畳されるマーカーの位置情報である第2の位置情報に変換するマーカー情報変換部と、を備えている。
本発明によれば、同一空間ではあるが、異なる位置にいる複数の作業者に対して効率的な指示を行うことができる。
本実施形態に係るテレコミュニケーション装置の利用シーンの一例を示す模式図である。 本実施形態に係る作業端末および指示装置の画面の表示内容を示す図であり、(a)は作業端末の画面の表示内容を示し、(b)は指示装置の画面の表示内容を示す。 本実施形態に係る遠隔通信システムの構成を示す構成図である。 本実施形態に係る指示装置の構成例を示すブロック図である。 本実施形態に係るマーカー情報管理部の構成を示すブロック図である。 本実施形態に係るマーカー情報の一例を示す図である。 本実施形態に係る映像およびマーカーの合成処理を説明するための図である。 本実施形態に係る指示装置の処理を示すフローチャートである。 本実施形態に係るマーカー情報管理部がマーカー情報を登録、削除する処理の一例を示すフローチャートである。 本実施形態に係る作業端末の構成を示すブロック図である。 本実施形態に係る対応画素の追跡による画像間変換パラメータの算出を説明するための図である。 本実施形態に係る表示装置において2つの表示画像の向きを揃えた例を示す図である。 本実施形態に係る表示装置の表示画面に1つの作業者画面のみを表示した例を示す図である。 本実施形態に係る作業者の映像によって表示内容が異なる例を示す図である。 本実施形態に係る指示操作に用いられている画像の撮影範囲と、撮影方向とを表示する例を示す図であり、(a)は作業端末の画面の表示内容を示し、(b)は指示装置の画面の表示内容を示す。
以下、図面を参照しながら本発明の実施の形態について詳細に説明する。図面において同じ機能を有する部分については同じ符号を付し、繰り返しの説明は省略する。
〔第1の実施の形態〕
本実施形態においては、本発明における基本的な構成について説明する。具体的には、撮影映像内にコンピュータグラフィックス(CG:Computer Graphics)で作成された作業指示を合成して表示された合成映像を見ながら作業できる拡張現実(AR:Augmented Reality)型作業支援において、同一空間ではあるが、異なる位置にいる複数の作業者に向けて、表示する合成映像の見え方を、適切に制御する方法について説明する。
特に、本実施形態では、基準となる映像から検出した特徴点を記述する特徴量と、基準とは異なる映像から検出した特徴点を記述する特徴量とを比較することによって、対応する特徴点を特定し、画像間変換パラメータを求める例について説明する。なお、画像間変換パラメータの詳細は、後述する。
〈装置の利用シーン〉
図1は、本実施形態に係るテレコミュニケーション装置Aの利用シーンの一例を示す模式図である。図1の左側が作業の現場1100であり、図1の右側が指示室1110を示しており、お互いに離れたところに位置している。このシーンは、作業現場1100にいる作業者1101と作業者1104とが、指示室1110にいる指示者1111から、作業対象1102に関する作業指示を、作業端末(端末)1103、あるいは、1105で受けながら、作業を行なっているシーンである。作業対象1102の修理を行っている作業者1101と作業者1104とが、当該作業者を監督する指示者1111から修理に関する指示をもらっている例である。
作業端末1103と作業端末1105の背面には、それぞれ、撮影用のカメラ1103aとカメラ1105aを具備しており、作業対象1102を撮影することができる。ここで、カメラ1103aで撮影した画像を、第1の視点で撮影した画像と称す。また、カメラ1105aで撮影した画像を、第2の視点で撮影した画像と称す。作業端末1103と作業端末1105は、それぞれ、撮影映像を遠隔地に送信することもできる。
指示室1110に設置された指示装置(情報処理装置)1112は、遠隔地の作業端末1103と、作業端末1105とから送られてきた撮影映像を受信し、それらの映像を表示装置1113に表示させることができる。そして、表示装置1113に表示された作業対象の映像を見ながら、指示者1111は、表示装置1113上で、作業者1101、あるいは、作業者1104に対して作業指示を行う。
図2を参照して、作業端末1103、1105、および、指示装置1112の表示装置1113に表示される表示内容と、AR重畳された指示内容の表示のされ方とについて詳しく説明する。図2は、本実施形態に係る作業端末1103、1105、および、指示装置1112の画面の表示内容を示す図である。図2(a)は、作業端末1103、および、1105の画面の表示内容を示す図である。図2(b)は、指示装置1112の画面の表示内容を示す図である。
指示者1111が見ている表示装置1113の画面には、作業者1101から受信した、第1の視点で撮影した画像1200と、作業者1104から受信した、第2の視点で撮影した画像1201とが、画面内に分割されて表示されている。指示者1111は、表示映像1200あるいは1201に、タッチパネル機能やマウス機能などを利用して入力した、指示位置を示すポインタやマーカー等を重畳させることができる。一方の映像内にマーカー等により示された指示位置は、同時に、他方の映像内の対応する指示位置に変換されて、他方の映像内の当該指示位置を示すようにマーカー等が表示される。以下、ポインタやマーカー等を表示画面上に表示させるための情報を総称して、マーカー情報と称し、詳細は後ほど説明する。マーカー情報には、テキストや絵柄などを表示画面上に表示させるための情報を含めることも可能である。また、マーカー情報には、マーカーの位置情報が含まれる。
マーカー情報は、指示装置1112から作業端末1103あるいは作業端末1105に送られ、そのマーカー情報を受け取った作業端末1103、1105は、作業対象を撮影した映像内にマーカーを重畳して表示する。
なお、指示装置1112が、マーカーが重畳された映像を作業端末1103あるいは作業端末1105に送信し、作業端末1103、1105は、マーカーが重畳された映像を受信して、当該映像をそのまま表示する構成としてもよい。
作業者は、作業端末の表示部においてその映像を見ることができ、これにより、遠隔地(指示室1110)からの作業指示を視覚的に把握することができるようになる。尚、作業者1101あるいは作業者1104の入力に基づいて、映像の上にマーカーを重畳させることも可能であり、作業者1101、1104と、指示者1111とがマーカー情報を共有することができる。図1の指示者の端末の形態はどのような形状でも良く、作業者が用いているようなタブレット状の装置を用いることも可能である。作業者の端末の形状もどの様な形状であってもよい。
なお、作業者が3名以上の場合であっても同様である。
〈遠隔通信〉
図3は、本実施形態に係る遠隔通信システムの構成を示す構成図である。作業端末1103、作業端末1105と、指示装置1112とは、図3に示すような公衆通信網(例えば、インターネット)NTによって、お互いに接続されており、TCP/IPやUDP等のプロトコルに従い、通信することができる。
本実施の形態によるテレコミュニケーション装置Aには、さらに、マーカー情報を一括して管理するための管理サーバー1300が設けられ、同じ公衆通信網NTに接続されている。尚、作業端末1103あるいは作業端末1105は、無線通信によって公衆通信網NTと接続することも可能である。この場合、無線通信は、例えばWi−Fi Alliance(米国業界団体)によって規定された国際標準規格(IEEE 802.11)のWi−Fi(ワイファイ、Wireless Fidelity:登録商標)接続によって実現することが可能である。通信網に関しては、インターネットなどの公衆通信網について示してきたが、例えば、企業などで使用されている、LAN(Local Area Network)を用いることも可能であり、また、それらが混在した構成であってもよい。
図3では、管理サーバー1300を用いた構成を示しているが、管理サーバーの機能を指示装置1112内に盛り込むことにより、直接、作業端末1103、作業端末1105と、指示装置1112とがやりとりする形態でも問題はない。そこで、以下の説明では、作業端末1103、作業端末1105と、指示装置1112とが直接やり取りする方法について記載する。また、通常のテレビ会議システムで用いられる、一般的な音声通信処理や付加画面情報以外の映像通信処理に関しては、支障のない範囲で説明を省略する。
〈構成例〉
続いて、本実施形態に係るテレコミュニケーション装置の構成例について説明する。前述したように、テレコミュニケーション装置Aには、指示者の指示装置1112と、作業者の作業端末1103、1105とがあり、それぞれについて順番に説明する。
〈指示装置の構成〉
図4は、本実施形態に係る指示装置1112の構成例を示すブロック図である。
指示装置1112は、外部から送られてくる映像やマーカー情報の受信と、内部で生成するマーカー情報を外部に送信するための通信部1400と、映像にマーカー情報の示すマーカーを合成する映像合成部1401と、合成映像を表示するための表示部1402と、ユーザからの入力を受け入れるための外部入出力部1403と、映像そのもの、または、映像処理の出力結果、マーカー情報、映像処理に利用する種々のデータを保存する保存部1404と、マーカー情報を管理するためのマーカー情報管理部1405と、指示装置1112全体の制御を行うための制御部1406と、各々のブロック間でのデータのやり取りを行うためのデータバス1407とを有している。
通信部1400は、FPGA(Field Programmable Gate Array)やASIC(Application Specific IntegratedCircuit)などによって構成され、外部とデータの送受信を行う処理ブロックである。具体的には、後述する作業端末から送られてくる映像符号およびマーカー情報の受信と、内部で作りだすマーカー情報の送信処理を行う。映像符号は、動画像の符号化に適した符号化処理が実行されたデータであり、例えばH.264によって符号化されたデータである。H.264符号化とは、動画データの圧縮符号化方式の標準の一つであり、ISO(国際標準化機構)によって規格化された方式である。
映像合成部1401は、FPGAやASIC、あるいは、GPU(GraphicsProcessing Unit)などによって構成され、入力した映像に、後述するマーカー情報管理部1405において管理されているマーカー情報を合成する処理を行う。マーカー情報とは、マーカーやポインタなどの視覚的に表現できる指示内容を生成する際に必要な情報である。
図6は、本実施形態に係るマーカー情報1600の一例を示す図である。図6に示すように、マーカー情報1600は、各種の属性(ID、タイムスタンプ、座標、登録時周辺局所画像、マーカー種類、色、大きさ、太さ)を含んでおり、位置や形状等の表示状態を制御するための情報群である。図6に記載の属性は一例であり、マーカー情報1600は図6に記載の属性の一部を有する構成としてもよいし、図6に記載の属性に加えて、追加の属性情報を有する構成としてもよい。
図7は、本実施形態に係る映像1700およびマーカー1701の合成処理を説明するための図である。図7に示すように、入力された映像1700に対して、マーカー情報1600に含まれる属性に従って生成したマーカー1701(位置と形状)を合成し、合成映像1702が生成される。
表示部1402は、LCD(Liquid Crystal Display)や有機ELディスプレイ(OELD:Organic ElectroLuminescence Display)などによって構成され、映像合成部1401から出力された合成映像、映像処理結果、保存部1404に保存された画像や、装置を制御するためのUI(User Interface)などを表示する。また、表示部1402は、その表示面を押すことで端末を操作することができるようなタッチパネルの機能を具備させることもでき、本機能を用いることで、前述のマーカーの設置する場所などを指定することができる。なお、表示部1402は、外部入出力部1403を介して、指示装置1112の外部に外付け設置される構成としてもよい。
外部入出力部1403は、USB(Universal Serial Bus)やHDMI(High Definition Multimedia Interface:登録商標)などの入出力ポートを有し、外部ストレージとのインターフェースとして動作する。
保存部1404は、例えば、RAM(Ramdom Access Memory)などの主記憶装置、および、ハードディスクなどの補助記憶装置からなる。主記憶装置は、画像データや画像処理結果を一時的に保持するために利用される。補助記憶装置は、撮像された画像データ、画像処理結果など、ストレージとして長期的に保存するためのデータが格納される。
マーカー情報管理部1405は、FPGAやASICなどによって構成され、マーカー情報の管理を行っており、具体的には、マーカー情報の挿入・削除、映像の動きに合わせて逐次その位置を更新させて、トラッキングする処理を行う。マーカー情報管理部1405における詳細な情報については後述する。
制御部1406は、CPU(Central Processing Unit)などによって構成され、各処理ブロックにおける処理の命令・制御やデータの入出力に関するコントロールを行う。
データバス1407は、各々のユニット間でのデータのやり取りを行うためのバスである。
〈マーカー情報管理部〉
続いて、本発明におけるマーカー情報管理部1405における詳細な構成例及び動作例について説明する。
本発明においては、指示者1111が、表示装置1113を用いて、複数の作業端末で撮影された映像の中の、少なくとも一つの映像内にマーカーを重畳させる。そのとき、指示装置1112は、当該マーカーの重畳位置に対応する、他の映像の位置にマーカー情報を変換し、当該マーカー情報を他の作業端末に送信する。当該他の作業端末は、当該マーカー情報を受信し、参照して、その端末で撮影された他の映像に当該マーカーを合成する。これにより、当該他の作業端末の映像内において、マーカーが、当初の映像内の重畳位置に対応する位置に表示される。
また、指示装置1112は、作業者自身の動き、あるいは、作業者または指示者によるズーム処理等による取得映像範囲を変える動作によって発生する、映像の動きに応じて、マーカーの重畳位置を変えるトラッキング機能も備えている。当該トラッキング機能によって、随時変化する映像にマーカーが追従するように表示することが可能となる。
以下、作業者1101から受信した、第1の視点で撮影した画像1200(以下、基準映像と称す。)を基準とし、指示者がマーカーを画像に重畳させる場合について説明する。図5は、本実施形態に係るマーカー情報管理部1405の構成を示すブロック図である。
図5に示すように、マーカー情報管理部1405は、複数の画像データを入力して、それぞれの画像内の特徴点を検出する特徴点検出部(画像取得部、フレーム取得部)1501と、基準となる撮影映像の現フレーム(t)および前フレーム(t−1)の画像間の画像変換に必要なフレーム間の変換パラメータを算出するフレーム間変換パラメータ算出部1502と、フレーム間の変換パラメータを用いて、既に重畳されているマーカーの重畳位置を更新するマーカー情報更新部1503と、管理中のマーカー情報を保管しておくマーカー情報保管部(マーカー情報取得部)1500と、異なる作業者の画像間を変換するための画像間変換パラメータを算出する画像間変換パラメータ算出部1504と、画像間変換パラメータを用いて、更新されたマーカー情報を変換して、基準とする画像とは異なる作業者端末の画像に向けたマーカー情報になるように変換するマーカー情報変換部1505とを有する。
〈特徴点検出〉
特徴点検出部1501は、データバス1407から基準映像における現フレームの画像(t)と一フレーム前の前フレーム画像(t−1)とを受け取り、特徴点を算出する。ここで、特徴点とは、例えば複数のエッジが結合するような画素であり、例えばSURF(Speeded Up Robust Features)を用いて、特徴点の情報を算出することができる。特徴点の情報とは、検出された特徴点の画像座標における位置情報、および、その特徴点を特定することができる記述情報(特徴量)である。なお、特徴点の検出手法はSURFに限定されず、PrewittフィルタやLaplacianフィルタ、Cannyフィルタ、SIFT(Scale−Invariant Feature Transform)と呼ばれる各種特徴点データのいずれか、もしくは、複数を使う構成にすることもできる。算出した特徴点および特徴点を記述する特徴量をフレーム間変換パラメータ算出部1502に出力する。特徴点検出部1501は、さらに、データバス1407から、別の作業者端末の画像(例えば、作業端末1105からの画像)を受け取り、同様に特徴点と特徴量を算出して、その結果を画像間変換パラメータ算出部1504に出力する。
〈マーカー情報のトラッキングの方法〉
フレーム間変換パラメータ算出部1502は、基準映像における現フレーム(t)と前フレーム(t−1)の特徴点の情報を特徴点検出部1501から受け取ると、以下の処理を行い、前フレームの画像上の任意の画像座標を、現フレームの対応する画像座標に変換するフレーム間変換パラメータを算出する。
検出された複数の特徴点をFPt−1(l)、l=1、…、nとする。ここで、添え字のt−1はフレーム番号を、カッコ内のlはそれぞれの特徴点のインデックスである。
算出したフレーム(t−1)の特徴点FPt−1から、フレーム(t)の対応する位置を求める必要があり、各フレームの時間間隔が十分短いとすると、撮影された物体の移動量は小さくなる。このことを利用し、元の特徴点の位置を基点に、比較的狭い範囲を探索することで、その対応点を求めることができる。例えば、コンピュータビジョンの汎用APIであるOpenCV(Open Source Computer Vision Librar、オープンソースのコンピュータビジョン向けのライブラリ)の関数を用いて実現することができ、cvCalcOpticalFlowLKという関数を用いて、次のフレームの対応する位置を算出することができる。この関数は、Lucas−Kanadeのアルゴリズムを用いており、次のフレームにおける対応する画素の位置を求める方法の一つである。これ以外の手法を用いることも可能である。
上記により、(t−1)番目のフレームにおいて抽出した特徴点の位置と、それに対応する(t)番目のフレームの点の位置を求めることができるので、この対応関係を用いて、映像合成部1401は、画像全体の変換を行う。つまり、フレーム間の画像の変化を、画像の変換と捉えて表現するものである。具体的には、以下の変換式を用いる。この変換式によって、(t−1)番目の映像フレームの画素(m、n)を(t)番目のフレームの(m’,n’)に変換することができるようになる。
Figure 2017013986
この変換(式1)におけるHは、3×3の行列で、ホモグラフィ行列と呼ばれている。ホモグラフィ行列とは、2枚の画像を射影変換することができる行列で、前述の仮定の下で、連続するフレーム間の変化を近似することができる。
Figure 2017013986
ここで、ホモグラフィ行列の各要素を(式2)のように定義すると、フレーム間変換パラメータ算出部1502は、連続するフレーム間の特徴点の対応関係の下で、(式1)による座標変換誤差を最小にするように3×3の各要素の値を求める。具体的には、次式(式3)を最小にするように各要素を計算する。
Figure 2017013986
ここで、argmin(・)は、括弧内を最小にするargminの下部にあるパラメータを算出する関数である。また、(mt−1(l)、nt―1(l))は、(t−1)番目のフレームの特徴点の座標(FPt―1(l))を、(m(l)、n(l))は、それに対応する(t−1)番目のフレームの特徴点の座標(FP(l))をそれぞれ示している。
上記により、フレーム間変換パラメータ算出部1502は、1フレーム前の映像内の座標を、現フレームの対応する座標に変換する行列とその変換式を求めることができる。この行列のことを変換パラメータと呼ぶ。
フレーム間変換パラメータ算出部1502は、(式3)で示した変換パラメータを算出し、マーカー情報更新部1503に送信する。マーカー情報更新部1503は、当該変換パラメータを受信し、(式1)の更新処理を行う。この際に、マーカー情報は、マーカー情報保管部1500に保管されている。マーカー情報更新部1503は、保管されているマーカー情報の画像の座標を変換する。更新後のマーカー情報は、マーカー情報保管部1500に再度送られて、次のフレームの更新のために保管される。また、更新後のマーカー情報は、データバス1407に出力されて、その後、映像合成部1401および通信部1400に送られる。
マーカー情報保管部1500は、マーカー情報の追加・削除、および、マーカー情報更新部1503によって更新されたマーカー情報の保管を行う。マーカー情報保管部1500は、マーカー情報の追加・削除・更新の際に、マーカー情報の属性の一つであるIDに従って、対象とするマーカー情報を確定することによって、当該マーカー情報の削除・追加・更新を行うことが可能になる。
〈別の作業端末に向けて、マーカー情報を変換する方法〉
画像間変換パラメータ算出部1504は、異なる作業者間の画像を変換するためのパラメータを算出する。その方法は、前述したフレーム間変換パラメータ算出部で説明した方法と同様でよい。画像間変換パラメータ算出部1504は、特徴点検出部1501において検出された、異なる作業端末からの2つの画像の特徴点を参照して、(式2)の画像間変換パラメータを算出し、当該画像間変換パラメータをマーカー情報変換部1505に出力する。上記にて、画像間変換パラメータ算出部1504が参照すべき特徴点は、2つの画像の間で対応する部分である。なお、当該対応する部分は、特徴点に限定されることはなく、特徴点以外の対応する部分を参照して画像間変換パラメータを算出してもよい。
マーカー情報変換部1505は、画像間変換パラメータ算出部1504から変換パラメータを受け取ると、前述の(式1)を用いて、更新後のマーカー情報を別の作業者に向けた画像に合わせて、その座標を変換する処理を行う。変換後のマーカー情報は、データバス1407に出力され、前述の更新後のマーカー情報と同様に、映像合成部1401および通信部1400に送られる。
〈指示装置の処理〉
次に、本実施形態の指示装置1112が行う処理の手順について、図8を用いて説明する。図8は、本実施形態に係る指示装置1112の処理を示すフローチャートである。
図8は、指示装置1112が、外部から送られてくる複数の作業端末からの映像を受け取り、マーカー情報管理部1405に登録されているマーカー情報を更新して、表示部1402に表示する処理と、更新後のマーカー情報を通信部1400から外部に出力する処理とを示している。
指示装置1112は、通信部1400の機能により、外部(例えば、後述する作業端末)から映像符号を受け取ると、復号処理を行い、元の映像信号を再現する(ステップS1100)。その後、指示装置1112は、映像信号を保存部1404に出力するとともに、復号された映像信号が前述の基準映像である場合に、さらに、映像信号をマーカー情報管理部1405に出力する。マーカー情報管理部1405は、基準映像の画像を受け取ると、さらに、保存部1804から、基準映像における1フレーム前の前フレーム画像を取得する。
マーカー情報管理部1405は、基準映像の現フレームの画像と、前フレームの画像とを用いて算出したフレーム間変換パラメータに基づいて、保管されているマーカー情報の画像の座標を更新する(ステップS1101)。更新後の結果に基づき、保管されているマーカー情報の更新を行い、さらに、更新後の結果を映像合成部1401に出力する。続いて、マーカー情報管理部1405は、保存部1404に保存されている基準映像ではない作業端末の画像の現フレームのデータを取得するとともに、前述の基準映像の現フレームの特徴点との対応関係から算出した画像間変換パラメータに基づいて、ステップS1101で更新されたマーカー情報を別途変換する(ステップS1102)。
変換後のマーカー情報は、基準映像とは異なる別の作業端末のためのマーカー情報となる。マーカー情報管理部1405は、変換後のマーカー情報を映像合成部1401に出力する。映像合成部1401は、マーカー情報管理部1405から受け取った更新後のマーカー情報と、変換後のマーカー情報とを用いて、それぞれの映像上にマーカーを重畳して合成する(ステップS1103)。その後、映像合成部1401は、合成映像を表示部1402に送信し、表示部1402は、合成映像を画面に表示する(ステップS1104)。マーカー情報管理部1405は、更新後のマーカー情報と、変換後のマーカー情報とを通信部1400に出力し、通信部1400は、それらのマーカー情報を、対応する各作業端末に送信する(ステップS1105)。制御部1406は、指示装置1112の処理を継続するか否かを判断する(ステップS1106)。処理を継続する場合(S1106のYES)には、ステップS1100に戻り、前述した処理を繰り返す。処理を終了させる場合(S1106のNO)には、全ての処理を終了させる。
〈マーカー情報管理部の処理〉
図9は、本実施形態に係るマーカー情報管理部1405がマーカー情報を登録、削除する処理の一例を示すフローチャートである。
図9に示すように、通信部1400は、指示装置1112の外部から送られてくるマーカー情報を受け取ると、マーカー情報管理部1405に出力する(ステップS1200)。一方、表示部1402は、指示者が表示画面を押すことによって入力された位置にマーカーを重畳させる場合に、そのマーカーに応じたマーカー情報をマーカー情報管理部1405に出力する(ステップS1201)。マーカー情報管理部1405は、外部から入力されたマーカー情報と、表示部1402で生成されたマーカー情報とを受け取ると、内部に保管されているマーカー情報に含まれるIDを参照して、同一IDを有するマーカー情報が存在するか否かを判定する(ステップS1202)。
同一のIDを持つマーカー情報が存在する場合(ステップS1202のYES)、マーカー情報管理部1405は、当該同一のIDを持つすべてのマーカー情報の削除を行う(ステップS1203)。同一のIDを持つマーカー情報が存在しない場合(ステップS1202のNO)、マーカー情報管理部1405は、新しいマーカー情報として、マーカー情報の追加を行う(ステップS1204)。
制御部1406は、指示装置1112の処理を継続するか否かを判断する(ステップS1205)。処理を継続する場合(ステップS1205のNO)には、ステップS1100に戻り、前述した処理を繰り返す。処理を終了させる場合(ステップS1205のYES)には、全ての処理を終了させる。
以上が、指示装置1112の構成及び処理の内容である。なお、指示装置1112に備わるマーカー情報管理部1405を外部に独立させた構成をとることも可能である。その場合、指示装置1112を、表示部1402を除いたすべての処理ブロックによる構成とし、前述のマーカー管理サーバー1300として、独立させることも可能である。
〈作業端末の構成〉
続いて、作業端末1103の構成について、図10を用いて説明する。図10は、本実施形態に係る作業端末1103の構成を示すブロック図である。
作業端末1103(作業端末1105も同様)と、指示装置1112との構成の違いは、映像取得部およびマーカー管理部に関連する。すなわち、作業端末1103には、映像を取得するための映像取得部1805が存在する一方、マーカー管理部が存在しない。その他の構成は、指示装置1112と同じである。つまり、通信部(送信部、位置情報取得部)1800は通信部1400と、映像合成部1801は映像合成部1401と、表示部1802は表示部1402と、外部入出力部1803は外部入出力部1403と、保存部1804は保存部1404と、制御部1806は制御部1406と、データバス1807はデータバス1407と、それぞれ同等の機能を有する。
映像取得部1805は、撮影空間を画像として、作業端末1103に取り込むための光学部品、および、CMOS(Complementary Metal Oxide Semiconductor)やCCD(Charge Coupled Device)などの撮像素子を具備するように構成され、光電変換によって得られた電気信号に基づいて生成された画像データをデータバス1807に出力する。映像取得部1805は、撮影された情報を元々のデータのままデータバス1807に出力してもよいし、図示していない映像処理部において処理しやすいように事前に画像処理(輝度画像化、ノイズ除去など)された映像データとしてデータバス1807に出力してもよく、また、その両方を出力するような構成としてもよい。さらに、撮影時の絞り値や焦点距離などのカメラパラメータを保存部1804に送るように構成することもできる。
映像合成部1801は、取得後の映像を、外部から送られてきたマーカー情報と合成し、表示部1802は、合成した映像を表示する。また、同時に、通信部1800は、合成した映像に対して、前述した動画像信号に適した符号化処理を施し、映像符号として外部(例えば、前述の指示装置1112)に出力する。
以上の構成によって、撮影映像内にCGで作成された作業指示を合成して表示された合成映像を見ながら作業できるAR型作業支援において、同一空間ではあるが、異なる位置にいる複数の作業者に向けて、表示する合成映像の見え方を適切に制御する方法を提供することができる。
〔第2の実施の形態〕
第2の実施の形態においては、複数の作業端末間の映像に対する画像間変換パラメータの算出において、所定の状態から開始して、画像間変換パラメータの算出に使う対応点を随時更新して求める処理を行う。これにより、第1の実施の形態に比べて、精度よく、画像間変換パラメータを算出することができる。対応点は、2つの画像の間で対応する部分である。なお、当該対応する部分は、対応点に限定されることはなく、対応点以外の部分を参照して画像間変換パラメータを算出してもよい。
以下、第1の実施の形態との相違を示しながら、画像間変換のパラメータを算出する方法について説明する。
第1の実施の形態では、基準となる映像から検出した特徴点を記述する特徴量と、基準とは異なる作業端末の映像から検出した特徴点を記述する特徴量とを比較することによって、対応する特徴点を特定し、前述した(式2)の画像間変換パラメータを求めている。ところが、作業端末の撮影の向きや、位置が大きく異なる場合、その対応付けにおいて誤りが増えることがある。そこで、本実施形態では、予め対応関係が正しく分かっている所定の状態から開始して、対応する点の座標を随時更新していき、変換パラメータを算出する方法を用いる。
ここで、予め対応関係が正しく分かる状態とは、具体的には以下のような例である。
第1の方法は、指示すべき点を実際に手や指で指定し、その状態を撮影することにより、指示すべき点を確定させる方法である。作業端末を用いて作業対象を撮影する際に、例えば、作業者の一人が作業対象の任意の場所を指さす。そうすると、撮影した映像の中で指さされた場所が写っていれば、その位置を各作業端末において確定させることが可能となる。4か所以上の位置を手動で確定させると、前述の(式2)の変換パラメータを算出することができ、より正確な変換パラメータを求めることができる。
第2の方法は、前述したような誤対応が発生しにくい状態、つまり、同じ位置に作業端末を置き、正しく対応関係が求められる状態にする方法である。この場合、撮影の向きや、作業端末の位置がほぼ一致するため、対応関係を容易に求めることができ、その精度も高めることが可能になる。
上記以外にも、複数の作業端末で取得した映像において、お互いに対応する点の関係を正しく求める方法であれば、いずれの方法であってもよい。
上記方法によって、求められた基準映像における点をPbase(j、i)、基準とは異なる作業端末の映像内の点をPtab(j、i)、(jは対応する点を示す番号であり、j=0、・・・、3とする。iはフレーム番号である。)とする。つまり、Pbase(0、i)とPtab(0、i)、・・・、Pbase(3、i)とPtab(3、i)はお互いに対応する点である。
図11は、本実施形態に係る対応画素の追跡による画像間変換パラメータの算出を説明するための図である。図11の2100に示すように、点Aと点A’、点Bと点B’、・・・、点Dと点D’がそれぞれ対応する。
次に、マーカー情報更新部1503は、各点について、フレーム間の移動を算出する。フレーム間の移動の算出には、前述したフレーム間変換パラメータによる更新の方法を用いればよく、以下のように算出することができる。
Figure 2017013986
sはどの作業端末からの映像であるかを示す記号であり、H (i)はフレーム(i)からフレーム(i+1)に変換する、フレーム間の変換パラメータを示している。この変換パラメータは、前述のフレーム間変換パラメータ算出部1502と同じ方法で算出される。
以上により、フレームiにおける対応関係を求めるための4点を、フレームtの映像内に逐次遷移させることが可能となる(図11の2101を参照)。
最後に、前述の方法によって求められた対応点を用いて、前記(式2)のパラメータを算出し、画像間の変換パラメータを求めることができる。
上記では、4点の画素を用いて処理する例を示したが、点の数は4点に限定するものではなく、それ以上の数であってもよい。
以上、対応する画素が明らかな状態から開始して、その対応の明らかな点を追跡することにより、画像間の変換パラメータを精度よく算出することが可能になる。
〔第3の実施の形態〕
第3の実施の形態においては、前述した画像間変換パラメータを用いて、指示装置1112の表示装置1113に映し出される各作業者端末の映像を同一の視点による映像に変換して表示する方法について説明する。第1の実施の形態では、画面を分割して、各作業者端末からの映像をそのまま表示している。そのため、作業者の位置関係によっては、同一の作業対象を撮影しているにもかかわらず、図2に示したように、異なる視点による映像となる。そのため、指示者は、映像に対する視点の位置を把握(変換)しながら、マーカーを重畳させる必要があるが、マーカーを異なる映像の同一個所に重畳させにくい場合がある。そこで、本実施形態では、画面に映し出される映像が同一の視点によるものになるように、基準映像の視点によるものとして表示する方法について説明する。
前述したように、(式2)の変換パラメータおよび(式1)の変換式を用いることで、基準映像内の任意の点を、基準とは異なる作業端末の映像の座標に変換することができる。ここでは、(式1)を以下のように変形する。
Figure 2017013986
ここで、H*−1は、前述した変換行列の逆行列である。(m’、n’)は、基準映像内の座標であり、(m、n)は基準とは異なる作業端末の映像の座標を示している。
(式5)に従えば、基準とは異なる作業端末の映像の任意の座標を基準映像の座標に変換することが可能となり、画像内の全ての画素を(式5)によって変換して生成された画像は、基準画像と同一の視点による画像となる。図12は、本実施形態に係る表示装置1113において2つの表示画像の視点を同じにした例を示す図である。図12の表示装置1113に示すように、作業者1104の映像が、映像1201から映像3100に変換されて、映像1200と同一の視点によるものとして表示される。
なお、生成する画像において、変換元の対応する画素が存在しない場合には、近傍の画素を用いて補間すればよい。補間の方法は、任意の手法を用いてよいが、例えばニアレストネイバー法(nearest neighbor)を用いて、間の画素を補間する。以上の処理を、映像合成部(画像変換部)1401において実施する。
以上、基準映像の視点に合致するように、各作業者の映像を変換して表示する方法について記載したが、同様な方法を用いて、基準画像ではない作業者の映像の一つに合わせるように変換して表示することも可能である。その場合、作業の途中で、指示者あるいは作業者が手動で切り替えられるようにしてもよい。
以上、複数の作業端末から送られてくる映像の視点を同じにして、指示者の見ている画面上に表示する方法を提供できる。
〔第4の実施の形態〕
第4の実施の形態においては、指示装置1112の表示装置1113に映し出される各作業者の映像から、1つを選択して指示を行う方法について説明する。
図2に示すように、表示装置1113には、各作業者の画面が、表示装置1113の画面を分割して表示されている。作業者数が増加すると、表示装置1113に表示される各作業者の映像の表示領域が小さくなり、指示者1111の指示効率が低下する、という場合がある。
上記に対応するために、指示者は、まず、図2のような表示の状態から、指示に用いたい画面として、作業者1101からの映像、および、作業者1104からの映像の中から1つを選択する。
図13は、本実施形態に係る表示装置1113の表示画面に1つの作業者画面のみを表示した例を示す図である。例えば、図13に示すように、表示装置(表示部、指示受付部)1113は、指示者によって選択された、作業者1101からの映像のみを表示する。指示装置1112は、映像4100にマーカーが重畳されると、(式1)を用いて、重畳されたマーカーに対応するマーカー情報を更新し、作業端末1103と、作業端末1105とにそれぞれのマーカー情報を送信する。この方法では、指示装置1112の表示装置1113には、1つの作業者の映像のみが表示されるため、表示領域が小さくならず、指示者の作業効率が低下しない。
〔第5の実施の形態〕
第5の実施の形態においては、前述した画像間変換パラメータを用いて、指示者1111が指示操作に用いている画像の撮影位置や向き(撮影方向)を、作業端末1103、または、作業端末1105に表示する方法について説明する。
指示者が複数の作業者に対し、既に設置されているマーカー情報、または、撮影対象の特徴や指示箇所といった場所の指示を口頭で説明する際、前記指示箇所に該当する場所の個数がそれぞれの作業者で異なる場合が考えられる。
この場合について、図14を用いて説明する。図14は、本実施形態に係る作業者の映像によって表示内容が異なる例を示す図である。指示者が作業者1104の画面を見ながら説明する際、例えば「丸いマーカー」という表現で指示位置5104の説明をしたとする。このとき、作業者1101の映像には「丸いマーカー」に該当するマーカー情報5102と、マーカー情報5103とが映っており、現在どちらの説明をしているのかが判断できないということが生じる。
また、指示者が複数の作業者に対し、既に重畳されているマーカー情報、または、撮影対象の特徴や指示箇所などの向きを口頭で説明する際、前記指示箇所に該当する場所の向きがそれぞれの作業者で異なる場合が考えられる。
この場合について、図2を用いて説明する。指示者が作業者1104の作業端末1105の画面を見て、右向きに行う作業の指示を行ったとする。この指示を受けた作業は、作業者1101にとっては、作業端末1103の画面において下向きの作業であり、口頭の指示内容と異なるため、正しく作業ができない、ということが生じる。
上記の対応方法として、図15は、本実施形態に係る指示操作に用いられている画像の撮影範囲と、撮影方向とを表示する例を示す図である。図15(a)は、作業端末1103、および、1105の画面の表示内容を示す図である。図15(b)は、指示装置1112の画面の表示内容を示す図である。
図15に示すように、映像合成部(情報合成部)1401が、指示者1111の指示に用いられている画像の撮影範囲を表現する枠5201と、撮影の向きを表現する印5202とを作業端末1103の映像に重畳し、表示部1402が、当該映像を表示する方法がある。この方法により、指示者が説明のために見ている映像の範囲と、向きとが、作業者の映像上で明らかになる。
以下、マーカー情報管理部(情報合成部)1405が、枠5201と、印5202とを算出する方法について説明する。前述したように、(式2)の変換パラメータと(式1)の変換式を用いることにより、基準映像内の任意の点を、基準とは異なる作業端末の映像の座標に変換することができる。そこで、(式1)に従って、基準映像の四隅の座標を変換することにより、基準とは異なる作業端末の映像における、基準映像の表示範囲が算出される。この算出された表示範囲を枠5201とする。また、基準映像における左下隅と、左上隅とを結ぶ直線を、(式1)に従って変換することにより、基準映像とは異なる作業端末の映像における、基準映像の撮影の向きを算出することができる。この算出された向きを、印5202とする。
ここで、算出された範囲と、向きとは、映像5200に枠5203と、印5204として重畳表示してもよい。
<第1から第5の実施形態について>
上記の各実施形態において、添付図面に図示されている構成等については、あくまで一例であり、これらに限定されるものではなく、本発明の効果を発揮する範囲内で適宜変更することが可能である。その他、本発明の目的の範囲を逸脱しない限りにおいて適宜変更して実施することが可能である。
上記の各実施形態の説明では、機能を実現するための各構成要素をそれぞれ異なる部位であるとして説明を行っているが、実際にこのように明確に分離して認識できる部位を有していなければならないわけではない。上記の各実施形態の機能を実現する遠隔作業支援の装置が、機能を実現するための各構成要素を、例えば実際にそれぞれ異なる部位を用いて構成していてもかまわないし、あるいは、全ての構成要素を一つのLSIに実装していてもかまわない。すなわち、どういう実装形態であれ、機能として各構成要素を有していればよい。また、本発明の各構成要素は任意に取捨選択することができ、取捨選択した構成を具備する発明も本発明に含まれる。
また、上記の各実施形態で説明した機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより各部の処理を行っても良い。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。
また、前記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。
〔ソフトウェアによる実現例〕
図5に示すマーカー情報管理部1405の各機能ブロックは、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。
後者の場合、マーカー情報管理部1405は、各機能を実現するソフトウェアであるプログラムの命令を実行するCPU、上記プログラム及び各種データがコンピュータ(又はCPU)で読み取り可能に記録されたROM(Read Only Memory)又は記憶装置(これらを「記録媒体」と称する)、上記プログラムを展開するRAM(Random Access Memory)等を備えている。そして、コンピュータ(又はCPU)が上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記記録媒体としては、「一時的でない有形の媒体」、例えば、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路等を用いることができる。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。なお、本発明は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
〔まとめ〕
本発明の態様1に係る情報処理装置(指示装置1112)は、少なくとも2つの視点から撮影された画像に関する処理を行う情報処理装置であって、第1の視点から撮影された第1の画像、および、第2の視点から撮影された第2の画像を取得する画像取得部(特徴点検出部1501)と、前記第1の画像に重畳されたマーカーの位置情報である第1の位置情報を取得する位置情報取得部(マーカー情報保管部1500)と、前記第1の画像、および、前記第2の画像を参照して、当該第1の画像を当該第2の画像に変換するための画像間変換パラメータを算出する画像間変換パラメータ算出部(1504)と、前記画像間変換パラメータを参照して、前記第1の位置情報を、前記第2の画像に重畳されるマーカーの位置情報である第2の位置情報に変換するマーカー情報変換部(1505)と、を備えている。
前記の構成によれば、第1の画像に重畳されたマーカーの位置情報である第1の位置情報を、第2の画像に重畳されるマーカーの位置情報である第2の位置情報に変換する。これにより、指示者が特定の画像に重畳したマーカーを、他の画像に重畳させることができる。したがって、作業者は、自分の視点で撮影された画像に重畳されたマーカーを参照することができるので、指示者は、複数の作業者に対する指示を効率的に行うことができる。
本発明の態様2に係る情報処理装置は、上記態様1において、前記画像間変換パラメータ算出部が、前記第1の画像と、前記第2の画像との間で対応する部分を参照して、前記画像間変換パラメータを算出することとしてもよい。
前記の構成によれば、2つの画像間で対応する部分から、画像間変換パラメータを算出するので、画像間変換パラメータを精度よく算出することができる。
本発明の態様3に係る情報処理装置は、上記態様2において、前記第1の画像、および、前記第2の画像から特徴点を検出する特徴点検出部(1501)をさらに備えており、前記画像間変換パラメータ算出部が、上記対応する部分として、前記特徴点検出部が検出した前記第1の画像の特徴点および前記第2の画像の特徴点を参照して、前記画像間変換パラメータを算出することとしてもよい。
前記の構成によれば、2つの画像から特徴点を検出し、当該特徴点から画像間変換パラメータを算出するので、事前に対応する部分が分からなくても、画像間変換パラメータを算出することができる。
本発明の態様4に係る情報処理装置は、上記態様1から3において、前記画像間変換パラメータを参照して、前記第1の画像を、前記第2の視点による画像に変換する画像変換部をさらに備えていることとしてもよい。
前記の構成によれば、第1の画像を、第2の視点による画像に変換するので、第1の画像と、第2の画像とを、同じ第2の視点による画像として表示することができる。これにより、ユーザは、異なる視点から撮影された同一物の画像を、同じ視点による画像として見ることができる。
なお、「第2の画像」と、「第2の視点による画像」とは互いに異なる。「第2の画像」は、第2の視点から撮影された画像である。一方、「第2の視点による画像」は、他の視点で撮影された画像を、第2の視点から見た画像に変換したものである。
本発明の態様5に係る情報処理装置は、上記態様1から4において、前記第2の画像における第1の画像の撮影範囲および撮影方向を特定し、当該撮影範囲と当該撮影方向とを示す情報を前記第2の画像に含ませる情報合成部(映像合成部1401、マーカー情報管理部1405)をさらに備えていることとしてもよい。
前記の構成によれば、第2の画像における第1の画像の撮影範囲および撮影方向を特定し、撮影範囲および撮影方向を示す情報を第2の画像に含ませる。これにより、ユーザは、異なる視点から撮影された同一物の画像間の位置関係、包含関係を把握することができる。
本発明の態様6に係る情報処理装置は、上記態様1から5において、前記第1の画像および前記第2の画像の少なくとも何れかを表示する表示部(表示装置1113)と、前記第1の画像および前記第2の画像のうち何れの画像を前記マーカーの重畳操作の対象となる画像として選択するのかを示す選択指示を受け付ける指示受付部(表示装置1113)と、をさらに備えており、前記表示部が、前記第1の画像および前記第2の画像のうち、前記マーカーの重畳操作の対象となる画像として選択された画像のみを表示することとしてもよい。
前記の構成によれば、画像を表示する際に、第1の画像および第2の画像のうち、マーカーを重畳させる対象の画像のみを表示する。これにより、ユーザは、異なる視点から撮影された同一物の画像のうち、1つの画像だけを大きくして見ることができるので、効率的にマーカーによる指示を行うことができる。
本発明の態様7に係る情報処理装置は、上記態様1から6において、第1の時点で所定の視点から撮影された画像である第1のフレーム、および、当該第1の時点より後の第2の時点で当該所定の視点から撮影された画像である第2のフレームを取得するフレーム取得部(特徴点検出部1501)をさらに備えており、前記位置情報取得部が、前記第1のフレームに重畳されたマーカーの位置情報である第3の位置情報を取得し、当該情報処理装置が、前記第1のフレーム、および、前記第2のフレームを参照して、当該第1のフレームを当該第2のフレームに変換するためのフレーム間変換パラメータを算出するフレーム間変換パラメータ算出部(1502)と、前記フレーム間変換パラメータを参照して、前記第3の位置情報を、前記第2のフレームに重畳されるマーカーの位置情報である第4の位置情報に更新するマーカー情報更新部(1503)と、をさらに備えていることとしてもよい。
前記の構成によれば、第1のフレームに重畳されたマーカーの位置情報である第3の位置情報を、第2のフレームに重畳されるマーカーの位置情報である第4の位置情報に更新する。これにより、指示者が第1のフレームに重畳したマーカーを、それより後に撮影された第2のフレームに重畳させることができる。したがって、時間の経過に伴って、撮影される画像が変化しても、マーカーを追従させて、画像に重畳させることができる。
本発明の態様8に係る端末(作業端末1103、1105)は、上記態様1から7に係る情報処理装置と通信を行う端末であって、前記第2の画像を前記情報処理装置に送信する送信部(通信部1800)と、前記情報処理装置から前記第2の位置情報を取得する位置情報取得部(通信部1800)と、前記第2の画像に重畳して、前記第2の位置情報の示す位置に、マーカーを表示する表示部(1802)と、を備えている。
前記の構成によれば、第2の画像に重畳して、第2の位置情報の示す位置に、マーカーを表示する。これにより、ユーザは、情報処理装置において第1の画像に重畳されたマーカーを、第2の画像において見ることができる。
本発明の態様9に係る遠隔通信システムは、情報処理装置と、第1の端末と、第2の端末と、を備えた遠隔通信システムであって、前記情報処理装置が、第1の視点から撮影された第1の画像、および、第2の視点から撮影された第2の画像を取得する画像取得部と、前記第1の画像に重畳されたマーカーの位置情報である第1の位置情報を取得する位置情報取得部と、前記第1の画像、および、前記第2の画像を参照して、当該第1の画像を当該第2の画像に変換するための画像間変換パラメータを算出する画像間変換パラメータ算出部と、前記画像間変換パラメータを参照して、前記第1の位置情報を、前記第2の画像に重畳されるマーカーの位置情報である第2の位置情報に変換するマーカー情報変換部と、を備えており、前記第1の端末が、前記第1の画像を前記情報処理装置に送信する送信部を備えており、前記第2の端末が、前記第2の画像を前記情報処理装置に送信する送信部と、前記情報処理装置から前記第2の位置情報を取得する位置情報取得部と、前記第2の画像に重畳して、前記第2の位置情報の示す位置に位置付けられたマーカー、並びに、前記第2の画像における前記第1の画像の撮影範囲および撮影方向を示す情報の少なくとも何れかを表示する表示部と、を備えている。
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。さらに、各実施形態にそれぞれ開示された技術的手段を組み合わせることにより、新しい技術的特徴を形成することができる。
本発明は、少なくとも2つの視点から撮影された画像に関する処理を行う情報処理装置、端末、および、遠隔通信システムに利用することができる。
1103、1105 作業端末(端末)
1112 指示装置(情報処理装置)
1113 表示装置(表示部、指示受付部)
1401 映像合成部(画像変換部、情報合成部)
1405 マーカー情報管理部(情報合成部)
1500 マーカー情報保管部(位置情報取得部)
1501 特徴点検出部(画像取得部、フレーム取得部)
1502 フレーム間変換パラメータ算出部
1503 マーカー情報更新部
1504 画像間変換パラメータ算出部
1505 マーカー情報変換部
1800 通信部(送信部、位置情報取得部)
1802 表示部

Claims (9)

  1. 少なくとも2つの視点から撮影された画像に関する処理を行う情報処理装置であって、
    第1の視点から撮影された第1の画像、および、第2の視点から撮影された第2の画像を取得する画像取得部と、
    前記第1の画像に重畳されたマーカーの位置情報である第1の位置情報を取得する位置情報取得部と、
    前記第1の画像、および、前記第2の画像を参照して、当該第1の画像を当該第2の画像に変換するための画像間変換パラメータを算出する画像間変換パラメータ算出部と、
    前記画像間変換パラメータを参照して、前記第1の位置情報を、前記第2の画像に重畳されるマーカーの位置情報である第2の位置情報に変換するマーカー情報変換部と、
    を備えている
    ことを特徴とする情報処理装置。
  2. 前記画像間変換パラメータ算出部は、
    前記第1の画像と、前記第2の画像との間で対応する部分を参照して、前記画像間変換パラメータを算出する
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 前記第1の画像、および、前記第2の画像から特徴点を検出する特徴点検出部をさらに備えており、
    前記画像間変換パラメータ算出部は、
    上記対応する部分として、前記特徴点検出部が検出した前記第1の画像の特徴点および前記第2の画像の特徴点を参照して、前記画像間変換パラメータを算出する
    ことを特徴とする請求項2に記載の情報処理装置。
  4. 前記画像間変換パラメータを参照して、前記第1の画像を、前記第2の視点による画像に変換する画像変換部をさらに備えている
    ことを特徴とする請求項1から3の何れか一項に記載の情報処理装置。
  5. 前記第2の画像における第1の画像の撮影範囲および撮影方向を特定し、当該撮影範囲と当該撮影方向とを示す情報を前記第2の画像に含ませる情報合成部をさらに備えていることを特徴とする請求項1から4の何れか一項に記載の情報処理装置。
  6. 前記第1の画像および前記第2の画像の少なくとも何れかを表示する表示部と、
    前記第1の画像および前記第2の画像のうち何れの画像を前記マーカーの重畳操作の対象となる画像として選択するのかを示す選択指示を受け付ける指示受付部と、
    をさらに備えており、
    前記表示部は、前記第1の画像および前記第2の画像のうち、前記マーカーの重畳操作の対象となる画像として選択された画像のみを表示する
    ことを特徴とする請求項1から5のいずれか一項に記載の情報処理装置。
  7. 当該情報処理装置は、
    第1の時点で所定の視点から撮影された画像である第1のフレーム、および、当該第1の時点より後の第2の時点で当該所定の視点から撮影された画像である第2のフレームを取得するフレーム取得部をさらに備えており、
    前記位置情報取得部は、
    前記第1のフレームに重畳されたマーカーの位置情報である第3の位置情報を取得し、
    当該情報処理装置は、
    前記第1のフレーム、および、前記第2のフレームを参照して、当該第1のフレームを当該第2のフレームに変換するためのフレーム間変換パラメータを算出するフレーム間変換パラメータ算出部と、
    前記フレーム間変換パラメータを参照して、前記第3の位置情報を、前記第2のフレームに重畳されるマーカーの位置情報である第4の位置情報に更新するマーカー情報更新部と、
    をさらに備えている
    ことを特徴とする請求項1から6のいずれか一項に記載の情報処理装置。
  8. 請求項1から7の何れか一項に記載の情報処理装置と通信を行う端末であって、
    前記第2の画像を前記情報処理装置に送信する送信部と、
    前記情報処理装置から前記第2の位置情報を取得する位置情報取得部と、
    前記第2の画像に重畳して、前記第2の位置情報の示す位置に、マーカーを表示する表示部と、
    を備えていることを特徴とする端末。
  9. 情報処理装置と、第1の端末と、第2の端末と、を備えた遠隔通信システムであって、
    前記情報処理装置は、
    第1の視点から撮影された第1の画像、および、第2の視点から撮影された第2の画像を取得する画像取得部と、
    前記第1の画像に重畳されたマーカーの位置情報である第1の位置情報を取得する位置情報取得部と、
    前記第1の画像、および、前記第2の画像を参照して、当該第1の画像を当該第2の画像に変換するための画像間変換パラメータを算出する画像間変換パラメータ算出部と、
    前記画像間変換パラメータを参照して、前記第1の位置情報を、前記第2の画像に重畳されるマーカーの位置情報である第2の位置情報に変換するマーカー情報変換部と、
    を備えており、
    前記第1の端末は、
    前記第1の画像を前記情報処理装置に送信する送信部
    を備えており、
    前記第2の端末は、
    前記第2の画像を前記情報処理装置に送信する送信部と、
    前記情報処理装置から前記第2の位置情報を取得する位置情報取得部と、
    前記第2の画像に重畳して、前記第2の位置情報の示す位置に位置付けられたマーカー、並びに、前記第2の画像における前記第1の画像の撮影範囲および撮影方向を示す情報の少なくとも何れかを表示する表示部と、
    を備えている
    ことを特徴とする遠隔通信システム。
JP2017529513A 2015-07-17 2016-06-21 情報処理装置、端末、遠隔通信システム、および、情報処理プログラム Pending JPWO2017013986A1 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2015143236 2015-07-17
JP2015143236 2015-07-17
PCT/JP2016/068390 WO2017013986A1 (ja) 2015-07-17 2016-06-21 情報処理装置、端末、および、遠隔通信システム

Publications (1)

Publication Number Publication Date
JPWO2017013986A1 true JPWO2017013986A1 (ja) 2018-06-14

Family

ID=57834036

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017529513A Pending JPWO2017013986A1 (ja) 2015-07-17 2016-06-21 情報処理装置、端末、遠隔通信システム、および、情報処理プログラム

Country Status (3)

Country Link
US (1) US20180211445A1 (ja)
JP (1) JPWO2017013986A1 (ja)
WO (1) WO2017013986A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3086425B1 (fr) 2018-09-20 2021-03-05 Blade Procede d'execution d'un programme d'application dans un systeme informatique
CN109685839B (zh) * 2018-12-20 2023-04-18 广州华多网络科技有限公司 图像对齐方法、移动终端以及计算机存储介质
CN111050112A (zh) * 2020-01-10 2020-04-21 北京首翼弘泰科技有限公司 通过在屏幕上显示标记进行远程操作指挥或指导的方法
JPWO2021235193A1 (ja) * 2020-05-21 2021-11-25
CN113542842A (zh) * 2021-07-14 2021-10-22 国网信息通信产业集团有限公司 一种适用于边缘计算的视频同步处理方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005049996A (ja) * 2003-07-30 2005-02-24 Canon Inc 画像表示方法及び装置
JP2006293604A (ja) * 2005-04-08 2006-10-26 Canon Inc 情報処理方法、情報処理装置および遠隔複合現実感共有装置
WO2014162825A1 (ja) * 2013-04-04 2014-10-09 ソニー株式会社 表示制御装置、表示制御方法およびプログラム
WO2015060393A1 (ja) * 2013-10-25 2015-04-30 独立行政法人産業技術総合研究所 遠隔行動誘導システム及びその処理方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7126558B1 (en) * 2001-10-19 2006-10-24 Accenture Global Services Gmbh Industrial augmented reality
DE102009040430B4 (de) * 2009-09-07 2013-03-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung, Verfahren und Computerprogramm zur Überlagerung eines intraoperativen Livebildes eines Operationsgebiets oder des Operationsgebiets mit einem präoperativen Bild des Operationsgebiets
JP6540108B2 (ja) * 2015-03-09 2019-07-10 富士通株式会社 画像生成方法、システム、装置、及び端末

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005049996A (ja) * 2003-07-30 2005-02-24 Canon Inc 画像表示方法及び装置
JP2006293604A (ja) * 2005-04-08 2006-10-26 Canon Inc 情報処理方法、情報処理装置および遠隔複合現実感共有装置
WO2014162825A1 (ja) * 2013-04-04 2014-10-09 ソニー株式会社 表示制御装置、表示制御方法およびプログラム
WO2015060393A1 (ja) * 2013-10-25 2015-04-30 独立行政法人産業技術総合研究所 遠隔行動誘導システム及びその処理方法

Also Published As

Publication number Publication date
WO2017013986A1 (ja) 2017-01-26
US20180211445A1 (en) 2018-07-26

Similar Documents

Publication Publication Date Title
KR101899877B1 (ko) 확대된 영상의 화질을 개선하기 위한 장치 및 방법
WO2017013986A1 (ja) 情報処理装置、端末、および、遠隔通信システム
US20160180593A1 (en) Wearable device-based augmented reality method and system
KR102303514B1 (ko) 정보 처리 장치, 정보 처리 방법 및 프로그램
JP6230113B2 (ja) 撮影動画像に指示画像を同期して重畳する映像指示同期方法、システム、端末、及びプログラム
CN101689292A (zh) Banana多媒体数字信号编解码器
JP6192107B2 (ja) 撮影動画像に指示画像を重畳することができる映像指示方法、システム、端末及びプログラム
JP2013162287A (ja) 画像処理装置、画像処理方法、およびプログラム
EP3293960A1 (en) Information processing device, information processing method, and program
JP6359333B2 (ja) テレコミュニケーションシステム
JP5864371B2 (ja) 静止画自動生成システム、静止画自動生成システムにおける作業者用情報処理端末及び指示者用情報処理端末、及び判定装置
JP6744237B2 (ja) 画像処理装置、画像処理システムおよびプログラム
US10990802B2 (en) Imaging apparatus providing out focusing and method for controlling the same
JP5509986B2 (ja) 画像処理装置、画像処理システム、及び画像処理プログラム
WO2016117480A1 (ja) テレコミュニケーションシステム
JP6306822B2 (ja) 画像処理装置、画像処理方法、および画像処理プログラム
JP5906745B2 (ja) 画像表示装置、画像表示方法及びプログラム
JPWO2017086355A1 (ja) 送信装置、送信方法、受信装置、受信方法および送受信システム
JP5742305B2 (ja) 描画画像処理装置
TWI784645B (zh) 擴增實境系統及其操作方法
JP2005275765A (ja) 画像処理装置、画像処理方法、画像処理プログラムおよびそのプログラムを記録した記録媒体
CN113325990A (zh) 智能终端图片的处理方法
US20210297649A1 (en) Image data output device, content creation device, content reproduction device, image data output method, content creation method, and content reproduction method
WO2018016655A1 (ja) 指示装置、指示装置の制御方法、遠隔作業支援システムおよび情報処理プログラム
JP6156930B2 (ja) 撮影動画像に指示画像を重畳することができる映像指示方法、システム、端末、及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180116

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190326

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20190524

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190627

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20191112