JP7776397B2

JP7776397B2 - 仮想三次元空間共有システム、仮想三次元空間共有方法、及び仮想三次元空間共有サーバ

Info

Publication number: JP7776397B2
Application number: JP2022156516A
Authority: JP
Inventors: 悠介中村; 直仁池田; 良太川俣; 佳一三谷; 佑哉大木; 崇志沼田
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2022-09-29
Filing date: 2022-09-29
Publication date: 2025-11-26
Anticipated expiration: 2042-09-29
Also published as: WO2024069997A1; JP2024049970A; US20250298571A1

Description

本発明は、仮想三次元空間共有システムに関する。

離れた場所にいる複数の者が情報を共有したい場面がある。例えば、現場の設備が故障した場合、当該現場がある地に熟練の保守員が出向いて、保守を指導することがある。現場がある遠隔地に熟練の保守員が出向くためには、日程の調整が必要で故障修理が遅延し、出張コストが発生する。一方、遠隔会議システムを用いて熟練の保守員の指導を受ける場合、口頭や画像共有では的確な指導が困難である問題がある。

一方で、仮想空間を用いて作業状況を把握するシステムとして、以下の先行技術がある。特許文献１（特開２０２１－４７６１０号公報）には、ＭＲ－ＨＭＤを装着した作業者が工事現場である空間内の施工物を様々な位置から様々な方向に観察すると、ＭＲ－ＨＭＤにより撮影された画像から端末装置により施工物の三次元形状が測定される。端末装置は、施工物の三次元形状を表す三次元形状データを受信し、三次元形状データと検査者に装着されたＶＲ－ＨＭＤの位置及び姿勢とに基づき定まる、空間と座標系が共通の仮想空間内の検査者から見える施工物の三次元形状に、施工物の工事に関する検査結果の入力欄を重畳した画像を生成し、その画像をＶＲ－ＨＭＤに表示させる。検査者はＶＲ－ＨＭＤに表示される施工物の三次元形状を見ながら行った検査の結果を入力欄に入力する状況把握支援システムが記載されている。

また、特許文献２（特開２００６－３４９５７８号公報）には、３次元レーザスキャナを用いて出来型表面をスキャニングし、コンピュータ内に構築された仮想空間に出来型表面の３次元点群データを合成する。次いで、当該仮想空間内に作業所内で定義される通り芯に関する情報を合成し、それに鉛直な仮想面を構築して移動し、仮想躯体面を設定する。そして、設定された仮想躯体面の表側又は裏側で出来型表面等の表示形態を変えて画面表示する出来型確認システムが記載されている。

特開２０２１－４７６１０公報特開２００６－３４９５７８公報

前述した特許文献１に記載された状況把握支援システムや、特許文献２に記載された出来型確認システムには、現場のリアルタイムの状況と離れた場所にいる複数者の動作をリアルタイムで共有する仕組みはなく、遠隔地から現場に対して適切な指導が困難である課題がある。

本発明は、現場のリアルタイムの状況と離れた場所にいる複数者の動作をリアルタイムで共有することを目的とする。

本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、仮想三次元空間共有システムであって、第１の場所において第１の利用者が視認可能な第１の表示装置と、前記第１の場所において形状及び位置の少なくとも一つが変化する動的物体であるオブジェクト及び前記第１の利用者を観測する第１のセンサと、前記第１の場所と異なる第２の場所において第２の利用者の動きを観測する第２のセンサと、前記第１のセンサ及び前記第２のセンサからデータを収集するサーバとを備え、前記サーバは、前記第１のセンサが観測した前記オブジェクト及び前記第１の利用者と、前記第２のセンサが観測した前記第２の利用者を仮想三次元空間にマッピングし、前記仮想三次元空間にマッピングされた前記動的物体であるオブジェクトに対する前記第２の利用者の動きと位置の情報をリアルタイムに前記第１の表示装置へ送信することを特徴とする。

本発明の一態様によれば、現場のリアルタイムの状況と離れた場所にいる複数者の動作をリアルタイムで共有できる。前述した以外の課題、構成及び効果は、以下の実施例の説明によって明らかにされる。

本発明の実施例の情報共有システムの構成を示す図である。本実施例の情報共有システムに設けられるコンピュータの物理的な構成を示すブロック図である。本実施例の情報共有システムの論理ブロック図である。本実施例の現場側センシング処理の詳細を示す図である。本実施例のデータベースの構成例を示す図である。本実施例のＭＲグラスに表示される映像の例を示す図である。本実施例の管理者端末に表示される俯瞰画像の例を示す図である。

図１は、本発明の実施例の情報共有システムの構成を示す図である。

本実施例の情報共有システムは、複数の三次元センサ１０、三次元センサ１０に接続されるエッジ処理装置２０、三次元センサ１０による観測結果を処理するＭＥＣサーバ４０、エッジ処理装置２０をＭＥＣサーバ４０に接続するネットワーク３０、ＭＲグラス５０、ＶＲグラス６０、ＶＲグラス６０の装着者を観測する三次元センサ６１、及び三次元センサ６１に接続されるエッジ処理装置６２を有する。情報共有システムは、管理者端末７０を有してもよい。

三次元センサ１０は、仮想三次元空間（メタバース空間）１００で共有すべき現場の状況を観測するセンサである。三次元センサ１０は、三次元の点群データを取得できるものであるとよく、例えばＲＧＢデータに画素ごとの距離Ｄが付された距離付き画像を出力するＴＯＦカメラを使用できる。三次元センサ１０は、作業者の作業範囲を含む現場の広い範囲をカバーするために複数設けられ、各三次元センサ１０の観測範囲が重複するように設置されるとよい。三次元センサ１０は、現場に設置された設備や部屋の構造物などの形状や位置が変化しない静的物体や、車両、建設機械、ロボット、作業者、工具、作業対象物などの形状や位置が変化する動的物体をオブジェクトとして観測する。三次元センサ１０は、作業者の状況（例えば、遠隔者の動きと位置）を観測する。

エッジ処理装置２０は、三次元センサ１０が取得した点群データから複数の三次元モデルデータや人の骨格モデルを含む三次元情報を生成するコンピュータである。エッジ処理装置２０が点群データから三次元情報を生成することによって、エッジ処理装置２０とＭＥＣサーバ４０との間の通信量を低減し、ネットワーク３０の逼迫を抑制できる。なお、ネットワーク３０の帯域に問題がない場合においては、点群データをそのままＭＥＣサーバ４０に伝送した後に三次元情報を生成してもよい。

ＭＥＣサーバ４０は、ネットワーク３０に設けられるエッジコンピューティングを実現するコンピュータであり、本実施例では１台又は複数台のエッジ処理装置２０から収集した三次元情報から仮想三次元空間１００を生成する。

ネットワーク３０は、エッジ処理装置２０とＭＥＣサーバ４０を接続する、データ通信に適した無線ネットワークであり、例えば、高速かつ低遅延の５Ｇネットワークを使用できる。なお、エッジ処理装置２０が固定的に設置される場合には、有線ネットワークを使用してもよい。

ＭＲグラス５０は、現場にいる作業者が視認可能な表示装置であり、仮想三次元空間１００を共有するために作業者の頭部に装着される形態であるとよい。ＭＲグラス５０は、プログラムを実行するプロセッサ、プログラムやデータを格納するメモリ、ＭＥＣサーバ４０と通信するネットワークインターフェース、及びＭＥＣサーバ４０から送信された画像（図６を参照して後述）を表示するディスプレイを有する。ディスプレイを透過型として、装着者がディスプレイを通して周辺の映像をＭＥＣサーバ４０から送信された映像と重畳して視認できるとよい。また、ＭＲグラス５０は、装着者の正面を撮影するカメラを有し、該カメラが撮影した映像をＭＥＣサーバ４０に送信してもよい。また、ＭＲグラス５０は、装着者の正面を撮影するカメラが撮影した映像をＭＥＣサーバ４０から送信された映像と重畳して表示してもよい。また、ＭＲグラス５０は、装着者の目を撮影するカメラを有し、該カメラが撮影した映像から装着者の視線方向を検知してもよい。また、ＭＲグラス５０は、装着者が聞いている音を検知するマイクロフォンを有してもよい。

また、現場の作業者はウェアラブルセンサ（例えば触覚グローブ）を装着してもよい。触覚グローブは、作業者の触覚を検知し、ＭＥＣサーバ４０に送信する。また、ウェアラブルセンサが作業者の手指の動きを検知し、ウェアラブルセンサが検知した手指の動きから、作業者の骨格モデルを生成し、作業者の行動を検知してもよい。

ＶＲグラス６０は、現場から離れた遠隔地にいる者（以下、遠隔者と称する、例えば熟練者）が視認可能な表示装置であり、仮想三次元空間１００を共有するために作業者の頭部に装着される形態であるとよい。ＶＲグラス６０は、プログラムを実行するプロセッサ、プログラムやデータを格納するメモリ、ＭＥＣサーバ４０と通信するネットワークインターフェース、及びＭＥＣサーバ４０から送信された画像（図６を参照して後述）を表示するディスプレイを有する。また、ＶＲグラス６０は、装着者の正面を撮影するカメラを有し、該カメラが撮影した映像をＭＥＣサーバ４０に送信してもよい。ＭＥＣサーバ４０が設けられるネットワーク外に、ＶＲグラス６０が設けられる場合、ＶＲグラス６０とＭＥＣサーバ４０はインターネット８０などの公衆ネットワークや他の専用ネットワークを介して接続されるとよい。ＶＲグラス６０は、骨格モデルによって表される現場の作業者の動き及び位置を含むモーションデータを、ＭＥＣサーバ４０から受信し、現場の作業者のアバターを含む仮想三次元空間１００を表示する。ＶＲグラス６０が、ＭＥＣサーバ４０から受信する仮想三次元空間１００の情報は、作業者のアバターの他、三次元センサ１０が観測したオブジェクトの情報を含む。

三次元センサ６１は、仮想三次元空間１００で共有すべきＶＲグラス６０を装着する、遠隔者の状況（例えば、遠隔者の動きと位置）を観測するセンサである。三次元センサ６１は、三次元センサ１０と同様に、三次元の点群データを取得できるものであるとよく、例えばＲＧＢデータに画素ごとの距離Ｄが付された距離付き画像を出力するＴＯＦカメラを使用できる。遠隔者が、手指の動きを検知するウェアラブルセンサを装着してもよい。ウェアラブルセンサは遠隔者の手指の動きを検知し、ＭＥＣサーバ４０に送信する。ＭＥＣサーバ４０は、ウェアラブルセンサが検知した手指の動きから、作業者の骨格モデルを生成し、作業者の行動を検知してもよい。

エッジ処理装置６２は、三次元センサ６１が取得した点群データから複数の三次元モデルデータや人の骨格モデルを含む三次元情報を生成するコンピュータである。エッジ処理装置６２が点群データから三次元情報を生成することによって、エッジ処理装置６２とＭＥＣサーバ４０との間の通信量を低減できる。なお、通信量に問題がない場合においては、点群データをそのままＭＥＣサーバ４０に伝送した後に三次元情報を生成してもよい。

管理者端末７０は、情報共有システムを利用する現場の管理者が使用する計算機であり、仮想三次元空間１００の情報（例えば俯瞰画像）を表示できる。

本実施例の情報共有システムは、複数のＭＥＣサーバ４０から収集した三次元情報を共有するための大規模仮想三次元空間を形成するクラウド９０を有してもよい。クラウド９０に形成された大規模仮想三次元空間は、複数のＭＥＣサーバ４０が形成した仮想三次元空間を統合したものとなり、広範囲で大規模な仮想三次元空間を形成できる。

ＭＲグラス５０、ＶＲグラス６０、及び管理者端末７０からのＭＥＣサーバ４０へのアクセスは、ＩＤとパスワードにより認証したり、これらの機器の固有のアドレス（例えば、ＭＡＣアドレス）で認証して、情報共有システムのセキュリティを確保するとよい。

図２は、本実施例の情報共有システムに設けられるコンピュータの物理的な構成を示すブロック図である。図２には、コンピュータの例としてＭＥＣサーバ４０を示すが、エッジ処理装置２０、６２、管理者端末７０も同じ構成でよい。

本実施例のＭＥＣサーバ４０は、プロセッサ（ＣＰＵ）１、メモリ２、補助記憶装置３及び通信インターフェース４を有する計算機によって構成される。ＭＥＣサーバ４０は、入力インターフェース５及び出力インターフェース８を有してもよい。

プロセッサ１は、メモリ２に格納されたプログラムを実行する演算装置である。プロセッサ１が各種プログラムを実行することによって、ＭＥＣサーバ４０の各機能部（例えば、メタバース解析機能４００など）が実現される。なお、プロセッサ１がプログラムを実行して行う処理の一部を、他の演算装置（例えば、ＧＰＵ、ＡＳＩＣ、ＦＰＧＡ等のハードウェア）で実行してもよい。

メモリ２は、不揮発性の記憶素子であるＲＯＭ及び揮発性の記憶素子であるＲＡＭを含む。ＲＯＭは、不変のプログラム（例えば、ＢＩＯＳ）などを格納する。ＲＡＭは、ＤＲＡＭ（Dynamic Random Access Memory）のような高速かつ揮発性の記憶素子であり、プロセッサ１が実行するプログラム及びプログラムの実行時に使用されるデータを一時的に格納する。

補助記憶装置３は、例えば、磁気記憶装置（ＨＤＤ）、フラッシュメモリ（ＳＳＤ）等の大容量かつ不揮発性の記憶装置である。また、補助記憶装置３は、プロセッサ１がプログラムの実行時に使用するデータ及びプロセッサ１が実行するプログラムを格納する。すなわち、プログラムは、補助記憶装置３から読み出されて、メモリ２にロードされて、プロセッサ１によって実行されることによって、ＭＥＣサーバ４０の各機能を実現する。

通信インターフェース４は、所定のプロトコルに従って、他の装置（例えば、エッジ処理装置２０、クラウド９０）との通信を制御するネットワークインターフェース装置である。

入力インターフェース５は、キーボード６やマウス７などの入力装置が接続され、オペレータからの入力を受けるインターフェースである。出力インターフェース８は、ディスプレイ装置９やプリンタ（図示省略）などの出力装置が接続され、プログラムの実行結果をユーザが視認可能な形式で出力するインターフェースである。なお、ＭＥＣサーバ４０にネットワークを介して接続されたユーザ端末が入力装置及び出力装置を提供してもよい。この場合、ＭＥＣサーバ４０がウェブサーバの機能を有し、ユーザ端末がＭＥＣサーバ４０に所定のプロトコル（例えばｈｔｔｐ）でアクセスしてもよい。

プロセッサ１が実行するプログラムは、リムーバブルメディア（ＣＤ－ＲＯＭ、フラッシュメモリなど）又はネットワークを介してＭＥＣサーバ４０に提供され、非一時的記憶媒体である不揮発性の補助記憶装置３に格納される。このため、ＭＥＣサーバ４０は、リムーバブルメディアからデータを読み込むインターフェースを有するとよい。

ＭＥＣサーバ４０は、物理的に一つの計算機上で、又は、論理的又は物理的に構成された複数の計算機上で構成される計算機システムであり、複数の物理的計算機資源上に構築された仮想計算機上で動作してもよい。例えば、各機能部は、各々別個の物理的又は論理的計算機上で動作するものでも、複数が組み合わされて一つの物理的又は論理的計算機上で動作するものでもよい。

図３は、本実施例の情報共有システムの論理ブロック図である。

本実施例の情報共有システムによる処理は、現場側センシング機能２００、遠隔側センシング機能３００、メタバース解析機能４００、及びフィードバック機能５００によって実行される。

現場側センシング機能２００では現場センシング・伝送処理２１０において、三次元センサ１０が現場の状況を観測し、観測された点群データをエッジ処理装置２０に伝送する。そして、三次元情報生成処理２２０において、エッジ処理装置２０は、三次元センサ１０が観測した点群データや三次元モデルデータを含む三次元情報を生成する。三次元センサ１０が、現場側に設置された動的物体の映像を撮影し、エッジ処理装置２０が、三次元センサ１０が撮影した動的物体の映像のフレームより前時間のフレームとの差分データをＭＥＣサーバ４０に送信してもよい。

現場側センシング機能２００の詳細は、図４に示すように、エッジ処理装置２０が、複数の三次元センサ１０の位置及び観測方向の関係に基づいて、複数の三次元センサ１０が観測した点群データを統合する（２２１）。点群データの統合の際、ＭＲグラス５０が撮影した装着者の正面の映像を統合してもよい。

その後、静的物体高速三次元モデル化処理を実行する（２２２）。例えば、隣接する点群の位置関係に基づいて面を生成するアルゴリズムを使用して、静的物体の外側面を構成できる。また、動的物体高速三次元モデル化処理を実行する（２２３）。例えば、点群データから形状や位置が変化する範囲を抽出し、骨格推定によって得られた骨格モデルを生成し、人をモデル化する。生成された骨格モデルは人（作業者）の位置を表し、骨格モデルの時系列変化は人の動きを表す。静的物体のモデル化と動的物体のモデル化は、順番に実行してもよく、その順番はいずれが先でもよい。

その後、構成された面の連続性や動的物体の範囲に従って、動的物体と静的物体の弁別や、物体として意味を成す範囲を決定することで三次元モデルをセグメント化する（２２４）。

また、エッジ処理装置２０は、装着者の視線方向及び装着者が聞いている音をＭＲグラス５０から収集し、ＭＥＣサーバ４０に送信する。ＭＥＣサーバ４０では、後述するメタバース解析機能４００が、静的物体及び動的物体を認識して、仮想三次元空間１００が生成される。

遠隔側センシング機能３００ではモーションセンシング処理３１０において、三次元センサ６１が、遠隔者の状況を観測し、観測された点群データをエッジ処理装置６２に送信する。そして、エッジ処理装置６２は、三次元センサ６１が観測した点群データに動的物体高速三次元モデル化処理を実行する（３１０）。例えば、点群データから形状や位置が変化する範囲を抽出し、骨格推定によって得られた骨格モデルを生成し、人をモデル化する。生成された骨格モデルは人（作業者）の位置を表し、骨格モデルの時系列変化は人の動きを表す。三次元センサ６１が、遠隔側で映像を撮影し、エッジ処理装置２０が、三次元センサ６１が撮影した映像のフレームより前時間のフレームとの差分データをＭＥＣサーバ４０に送信してもよい。

その後、エッジ処理装置６２は、生成された骨格モデルからアバターを生成する（３２０）。また、エッジ処理装置６２は、装着者の視線方向及び装着者が聞いている音をＶＲグラス６０から収集し、ＭＥＣサーバ４０に送信する。生成された骨格モデルは、ＭＥＣサーバ４０に送信され、遠隔者の行動Ｂとして取り扱われる。また、生成されたアバターは、ＶＲグラス６０の装着者が聞いている音データと共にＭＥＣサーバ４０に送信され、仮想三次元空間１００に組み込まれ、ＭＲグラス５０にフィードバックされる。生成されたアバターは、ＭＲグラス５０に直接フィードバックされてもよい。ＭＲグラス５０の装着者は、遠隔者の動きや位置で表される行動や感覚が組み込まれた仮想三次元空間１００を遠隔者と共有でき、遠隔者の動作が分かり、遠隔者と会話も可能となる。

メタバース解析機能４００では、ＭＥＣサーバ４０は、現場側センシング機能２００認識した動的物体の骨格モデルから現場作業者のアバターを生成し、遠隔側センシング機能３００が生成した遠隔者の骨格モデルから遠隔者のアバターを生成する。これらの生成されたアバター、及び現場側センシング機能２００が認識した静的物体の三次元モデルデータをマッピングした仮想三次元空間１００を生成する。

物体認識処理４１０において、ＭＥＣサーバ４０は、セグメント化された三次元モデルを認識し、物体を特定する。例えば、現場に設置された物体の画像を学習した機械学習モデルや、現場に設置された物体の三次元形状が記録されたモデルによって物体の種別を推定できる。

動作認識処理４２０において、ＭＥＣサーバ４０は、骨格モデルによって表される現場の作業者の動き及び位置を含むモーションデータから、作業者の行動Ａ（行動の種別）を認識する。例えば、過去の作業者の骨格モデルの変化によるモーションデータと作業者の行動によって学習した機械学習モデルによって作業者の行動を推定できる。

熟練感知処理４３０において、ＭＥＣサーバ４０は、作業者の視線方向や作業者に聞こえる音によって、作業者の熟練度を検知する。例えば、作業中の作業者の視線方向や聞こえる音と作業者の熟練度によって学習した機械学習モデルによって作業者の熟練度を推定できる。また、当該作業者の作業時間と標準作業時間を比較して、作業者の熟練度を推定してもよい。例えば、作業時間が標準作業時間より小さい場合は熟練度が高いと判定できる。

動作認識処理４４０において、ＭＥＣサーバ４０は、遠者の骨格モデルの変化から、遠隔者の行動Ｂ（行動の種別）を認識する。例えば、過去の遠隔者の骨格モデルの変化と遠隔者の行動によって学習した機械学習モデルによって遠隔者の行動を推定できる。動作認識処理４２０と動作認識処理４４０は、同じ推定モデルを使用してもよい。

作業認識処理４５０において、ＭＥＣサーバ４０は、物体認識処理４１０で特定された物体と、動作認識処理４２０で認識された作業者の行動Ａから作業者の作業Ａを認識する。例えば、物体と行動Ａによって学習した機械学習モデルや、物体と行動を関連付けたナレッジグラフによって作業者の作業Ａを推定できる。さらに、動作認識処理４４０で認識された遠隔者の行動Ｂを用いて、作業者の作業Ａを認識してもよい。

構造化・蓄積処理４６０において、ＭＥＣサーバ４０は、作業認識処理４５０で認識された作業Ａをデータベース４７０に記録する。データベース４７０には、作業Ａを認識するために使用された物体と、行動Ａと、行動Ａにおける骨格モデルの変化によるモーションデータと、行動Ｂと、行動Ｂにおける骨格モデルによって表される現場の作業者の動き及び位置を含むモーションデータが関連情報として登録される。データベース４７０の構成例の詳細は図５を参照して説明する。

フィードバック機能５００では、ＭＥＣサーバ４０は、認識された作業者の行動Ａをキーとしてデータベース４７０を検索し、データベース４７０から取得したフィードバック情報をＭＲグラス５０に送信する。ＭＲグラス５０にフィードバックされる情報は、以前に行われた同じ工程の同じ作業のモーションデータから生成されるアバターや、以前に行われた同じ作業の映像や、当該作業の次工程の作業指示である。特に、アバターや作業映像は、遠隔者が行った同じ作業のデータを提供するとよい。ＭＲグラス５０にフィードバックされる情報は、熟練感知処理４３０で推定される熟練度や作業者の属性に従って変えるとよい。例えば、低熟練者には詳細な情報を提供し、高熟練者には概要の情報を提供するとよい。フィードバック機能５００によって、ＭＲグラス５０を装着した作業者は、自らの行動Ａに関連する情報を自動的に取得できる。

フィードバック機能５００は、ＭＲグラス５０へのフィードバック以外に、設備（例えば、ロボット、建設機械、車両）へのフィードバックとして、指令をしてもよい。これによって、仮想三次元空間内での変化が現実世界に反映でき、様々な機械を制御できる。

図５は、本実施例のデータベース４７０の構成例を示す図である。図５にはデータベース４７０をテーブル形式で示すが、他のデータ構造で構成してもよい。

データベース４７０は、予め記録される作業関連情報４７１と、作業者の行動に伴って取得される作業取得情報４７２を含む。

作業関連情報４７１は、作業ＩＤ、作業基準時間、作業マニュアル、作業映像コンテンツ、及び作業文字コンテンツを関連付けて記憶する。作業ＩＤは、予め記録される作業の識別情報である。作業基準時間は、作業者が行う作業の標準的な時間である。作業マニュアルは、作業者が行う作業の指示書であり、指示書へアクセスするためのリンクの情報を記録してもよい。作業映像コンテンツは、作業者が行う作業を熟練者又は当該作業者が以前に行った作業の映像であり、当該映像へアクセスするためのリンクの情報を記録してもよい。作業文字コンテンツは、作業者が行う作業に関する文字情報であり、当該文字情報へアクセスするためのリンクの情報を記録してもよい。

作業取得情報４７２は、行動ＩＤ、実作業時間、環境オブジェクト、作業者モーション、作業者位置、作業者視点、作業者音場、作業者触覚、作業者バイタル、作業者熟練度、作業ＩＤ、及び作業ログを関連付けて記憶する。作業ＩＤは、作業者の一連の動作である行動の識別情報である。実作業時間、作業者の行動に要した時間である。環境オブジェクトは、作業者の行動に関係して撮影されたオブジェクト（例えば、部屋、床、装置、道具、ネジ）である。作業者モーションは、作業者の骨格モデルの特徴点（指、腕などの関節点、頭部）の座標の時間変化である。作業者位置は、作業者の特徴点（頭部、左右の手など）の位置や、環境オブジェクトとの位置関係（距離、方向）である。作業者視点は、作業者の視線や、視線方向に存在するオブジェクトの表面と視線の交点である。作業者音場は、作業者に聞こえている音であり、音データへアクセスするためのリンクの情報を記録してもよい。作業者触覚は、触覚グローブで取得した作業者の触覚である。作業者バイタルは作業者の声、表情、血流変化から推定される脈拍などであり、作業者の感情や属性を推定するために使用される。作業者熟練度は、熟練感知処理４３０で検知された作業者の熟練度である。作業ＩＤは、作業認識処理４５０で認識された作業者の作業である。作業ログは、作業の実施の結果であり、正常終了、再作業、異常終了などが記録される。

図６は、本実施例の情報共有システムで現場作業者にフィードバックされ、ＭＲグラス５０に表示される映像の例を示す図である。

作業者映像は、図６に示すように、遠隔者のＶＲグラス（頭の位置）６０１と手６０２が現実の風景に重畳するように表示される。図６では遠隔者のアバターをＶＲグラスと手で構成したが、遠隔者の全身を表すアバターを生成して表示してもよい。さらに、作業者映像には、作業者属性６１１と、作業マニュアル６１２と、作業指示６１３を表示してもよい。さらに、作業者映像には、現場に居る他者の骨格モデルから生成されたアバター（図示省略）を表示してもよい。

現場の作業者は、作業者映像によって、遠隔者の行動をアバターによって視認でき、遠隔地の熟練者から適切な作業の指導を受けられる。

図７は、本実施例の情報共有システムで管理者端末７０に表示される俯瞰画像の例を示す図である。

管理者端末７０に表示される俯瞰画像は、遠隔地の熟練者のＶＲグラス（頭の位置）７０１と手７０２と、現場作業員のアバター７１１と、環境オブジェクト（作業対象物）７２１が三次元空間の画像に重畳して表示される。

俯瞰画像によって、現場の管理者は、仮想三次元空間内の事象を監視して、作業者が熟練者から受ける指導を確認でき、作業者の作業を管理できる。

ＭＥＣサーバ４０は、フィードバック映像（図６）や俯瞰画像（図７）に必要範囲内の映像のみを含むように画像の範囲を調整するとよい。図７に示す俯瞰画像は、作業対象物と作業者のアバターと遠隔者のアバターと、それらの周囲の背景だけを表示し、他の背景を消した例である。例えば、セグメント化処理（２２４）で認識された静的物体及び動的物体のうち、当該作業に関係ない物体を含まない範囲でフィードバックする画像の範囲を調整したり、当該作業に関係ない物体を含まない範囲にモザイク処理を適用して、関係のない物体を秘匿化するとよい。工場などの現場で使う時、工場の空間、顧客情報の外部への流出を抑制できる。

以上に説明したように、本発明の実施例によれば、現場のリアルタイムの状況と離れた場所にいる複数者の動作をリアルタイムで共有し、遠隔地から現場に対して適切な指導を可能にできる。

なお、本発明は前述した実施例に限定されるものではなく、添付した特許請求の範囲の趣旨内における様々な変形例及び同等の構成が含まれる。例えば、前述した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに本発明は限定されない。また、ある実施例の構成の一部を他の実施例の構成に置き換えてもよい。また、ある実施例の構成に他の実施例の構成を加えてもよい。また、各実施例の構成の一部について、他の構成の追加・削除・置換をしてもよい。

また、前述した各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等により、ハードウェアで実現してもよく、プロセッサがそれぞれの機能を実現するプログラムを解釈し実行することにより、ソフトウェアで実現してもよい。

各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリ、ハードディスク、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）等の記憶装置、又は、ＩＣカード、ＳＤカード、ＤＶＤ等の記録媒体に格納することができる。

また、制御線や情報線は説明上必要と考えられるものを示しており、実装上必要な全ての制御線や情報線を示しているとは限らない。実際には、ほとんど全ての構成が相互に接続されていると考えてよい。

１プロセッサ
２メモリ
３補助記憶装置
４通信インターフェース
５入力インターフェース
６キーボード
７マウス
８出力インターフェース
９ディスプレイ装置
１０三次元センサ
２０エッジ処理装置
３０ネットワーク
４０ＭＥＣサーバ
５０ＭＲグラス
６０ＶＲグラス
６１三次元センサ
６２エッジ処理装置
７０管理者端末
８０インターネット
９０クラウド
１００仮想三次元空間
２００現場側センシング機能
２１０伝送処理
２２０三次元情報生成処理
３００遠隔側センシング機能
３１０モーションセンシング処理
４００メタバース解析機能
４１０物体認識処理
４２０動作認識処理
４３０熟練感知処理
４４０動作認識処理
４５０作業認識処理
４６０蓄積処理
４７０データベース
４７１作業関連情報
４７２作業取得情報
５００フィードバック機能

Claims

仮想三次元空間共有システムであって、
第１の場所において第１の利用者が視認可能な第１の表示装置と、
前記第１の場所において形状及び位置の少なくとも一つが変化する動的物体であるオブジェクト及び前記第１の利用者を観測する第１のセンサと、
前記第１の場所と異なる第２の場所において第２の利用者の動きを観測する第２のセンサと、
前記第１のセンサ及び前記第２のセンサからデータを収集するサーバとを備え、
前記サーバは、
前記第１のセンサが観測した前記オブジェクト及び前記第１の利用者と、前記第２のセンサが観測した前記第２の利用者を仮想三次元空間にマッピングし、
前記仮想三次元空間にマッピングされた前記動的物体であるオブジェクトに対する前記第２の利用者の動きと位置の情報をリアルタイムに前記第１の表示装置へ送信することを特徴とする仮想三次元空間共有システム。
請求項１に記載の仮想三次元空間共有システムであって、
前記第２の場所において前記第２の利用者が視認可能な第２の表示装置を備え、
前記サーバは、前記仮想三次元空間にマッピングされた前記オブジェクト及び前記第１の利用者の動きと位置の情報を前記第２の表示装置へ送信することを特徴とする仮想三次元空間共有システム。
請求項１に記載の仮想三次元空間共有システムであって、
前記第１の利用者が知覚する音、前記第１の利用者の視線、及び前記第１の利用者の触覚の少なくとも一つを検知する第３のセンサを備え、
前記第３のセンサは、検知した情報を前記サーバに送信し、
前記第１のセンサは、前記第１の利用者の動きを観測することを特徴とする仮想三次元空間共有システム。
請求項１に記載の仮想三次元空間共有システムであって、
前記第１のセンサが接続される第１のエッジ装置を有し、
前記第１のセンサは、前記第１の場所に設置された前記オブジェクトの映像を撮影し、
前記第１のエッジ装置は、前記第１のセンサが撮影した前記オブジェクトの映像のフレームより前時間のフレームとの差分データを前記サーバに送信することを特徴とする仮想三次元空間共有システム。
請求項１に記載の仮想三次元空間共有システムであって、
前記第１のセンサが接続される第１のエッジ装置を有し、
前記第１のセンサは、前記第１の利用者の動きと位置の情報を取得し、
前記第１のエッジ装置は、前記第１のセンサが取得した前記第１の利用者の動きと位置の情報から生成した骨格モデルを前記サーバに送信することを特徴とする仮想三次元空間共有システム。
請求項１に記載の仮想三次元空間共有システムであって、
前記第２の利用者が知覚する音、前記第２の利用者の視線、及び前記第２の利用者の触覚の少なくとも一つを検知する第４のセンサを備え、
前記第４のセンサは、検知した情報を前記サーバに送信することを特徴とする仮想三次元空間共有システム。
請求項１に記載の仮想三次元空間共有システムであって、
前記第２のセンサが接続される第２のエッジ装置を有し、
前記第２のセンサは、前記第２の場所の映像を撮影し、
前記第２のエッジ装置は、前記第２のセンサが撮影した映像のフレームより前時間のフレームとの差分データを前記サーバに送信することを特徴とする仮想三次元空間共有システム。
請求項１に記載の仮想三次元空間共有システムであって、
前記第２のセンサが接続される第２のエッジ装置を有し、
前記第２のセンサは、前記第２の利用者の動きと位置の情報を取得し、
前記第２のエッジ装置は、
前記第２のセンサが取得した前記第２の利用者の動きと位置の情報から生成した骨格モデルを前記サーバに送信することを特徴とする仮想三次元空間共有システム。
請求項１に記載の仮想三次元空間共有システムであって、
前記サーバは、前記第１の利用者及び前記第２の利用者の映像から生成された骨格モデルをデータベースに記録することを特徴とする仮想三次元空間共有システム。
請求項９に記載の仮想三次元空間共有システムであって、
前記サーバは、
前記第１のセンサが前記オブジェクトを観測した結果から、前記オブジェクトを認識し、
前記第１の利用者の映像から生成した骨格モデルと、前記認識されたオブジェクトとの関係に基づいて、前記第１の利用者の作業を特定し、
前記特定された作業を前記データベースに記録することを特徴とする仮想三次元空間共有システム。
請求項１に記載の仮想三次元空間共有システムであって、
前記第１の利用者の声、血流、及び表情の少なくとも一つを検知する第５のセンサを備え、
前記第５のセンサが検知した声、血流、及び表情の少なくとも一つから、前記第１の利用者の熟練度及び属性の少なくとも一つを推定することを特徴とする仮想三次元空間共有システム。
請求項１１に記載の仮想三次元空間共有システムであって、
前記サーバは、前記推定された熟練度及び属性の少なくとも一つに従って、前記第１の表示装置へ送信する情報を変えることを特徴とする仮想三次元空間共有システム。
請求項１０に記載の仮想三次元空間共有システムであって、
前記サーバは、前記特定された作業に関連する情報を前記データベースから取得し、
前記データベースから取得した情報を前記第１の表示装置へ送信することを特徴とする仮想三次元空間共有システム。
請求項１に記載の仮想三次元空間共有システムであって、
前記サーバに接続された端末を有し、
前記サーバは、前記オブジェクト、前記第１の利用者、及び前記第２の利用者がマッピングされた前記仮想三次元空間のデータを前記端末に送信することを特徴とする仮想三次元空間共有システム。
計算機が実行する仮想三次元空間共有方法であって、
前記計算機は、
所定の演算処理を実行する演算装置と、前記演算装置がアクセス可能な記憶装置とを有し、
第１の場所において第１の利用者が視認可能な第１の表示装置と、前記第１の場所に設置される第１のセンサと、前記第１の場所と異なる第２の場所に設置される第２のセンサとに接続され、
前記仮想三次元空間共有方法は、
前記演算装置が、前記第１のセンサが前記第１の場所において観測した形状及び位置の少なくとも一つが変化する動的物体であるオブジェクト及び前記第１の利用者のデータ、及び前記第２のセンサが前記第２の場所において観測した第２の利用者のデータを収集し、
前記演算装置が、前記第１のセンサが観測したオブジェクト及び第１の利用者と、前記第２のセンサが観測した第２の利用者を仮想三次元空間にマッピングし、
前記演算装置が、前記仮想三次元空間にマッピングされた前記動的物体であるオブジェクトに対する前記第２の利用者の動きと位置の情報をリアルタイムに前記第１の表示装置へ送信することを特徴とする仮想三次元空間共有方法。
仮想三次元空間共有サーバであって、
所定の演算処理を実行する演算装置と、前記演算装置がアクセス可能な記憶装置とを備え、
第１の場所において第１の利用者が視認可能な第１の表示装置と、前記第１の場所に設置される第１のセンサと、前記第１の場所と異なる第２の場所に設置される第２のセンサとに接続され、
前記第１のセンサが前記第１の場所において観測した形状及び位置の少なくとも一つが変化する動的物体であるオブジェクト及び前記第１の利用者のデータ、及び前記第２のセンサが前記第２の場所において観測した第２の利用者のデータを収集し、
前記第１のセンサが観測したオブジェクト及び第１の利用者と、前記第２のセンサが観測した第２の利用者を仮想三次元空間にマッピングし、
前記仮想三次元空間にマッピングされた前記動的物体であるオブジェクトに対する前記第２の利用者の動きと位置の情報をリアルタイムに前記第１の表示装置へ送信することを特徴とする仮想三次元空間共有サーバ。