JP2022111142A - コンピュータプログラム、サーバ装置及び方法 - Google Patents

コンピュータプログラム、サーバ装置及び方法 Download PDF

Info

Publication number
JP2022111142A
JP2022111142A JP2022084302A JP2022084302A JP2022111142A JP 2022111142 A JP2022111142 A JP 2022111142A JP 2022084302 A JP2022084302 A JP 2022084302A JP 2022084302 A JP2022084302 A JP 2022084302A JP 2022111142 A JP2022111142 A JP 2022111142A
Authority
JP
Japan
Prior art keywords
specific
performer
unit
expression
facial expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2022084302A
Other languages
English (en)
Other versions
JP7408068B2 (ja
Inventor
匡志 渡邊
Masashi Watanabe
寿 川村
Hisashi Kawamura
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GREE Inc
Original Assignee
GREE Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GREE Inc filed Critical GREE Inc
Priority to JP2022084302A priority Critical patent/JP7408068B2/ja
Publication of JP2022111142A publication Critical patent/JP2022111142A/ja
Priority to JP2023214338A priority patent/JP2024029036A/ja
Application granted granted Critical
Publication of JP7408068B2 publication Critical patent/JP7408068B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/174Facial expression recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T13/00Animation
    • G06T13/203D [Three Dimensional] animation
    • G06T13/403D [Three Dimensional] animation of characters, e.g. humans, animals or virtual beings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/254Analysis of motion involving subtraction of images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/166Detection; Localisation; Normalisation using acquisition arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • G06V40/171Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/174Facial expression recognition
    • G06V40/176Dynamic expression
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/18Eye characteristics, e.g. of the iris
    • G06V40/193Preprocessing; Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/23Recognition of whole body movements, e.g. for sport training
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • G06T2207/30201Face

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Geometry (AREA)
  • Computer Graphics (AREA)
  • Ophthalmology & Optometry (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Processing Or Creating Images (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

【課題】 演者等が容易且つ正確にアバターオブジェクトに所望の表情又は動作を表現させることができる、コンピュータプログラム、サーバ装置及び方法を提供すること。【解決手段】 コンピュータプログラムは、1又は複数のプロセッサに実行されることにより、センサにより取得される身体の動作に関するデータに基づいて、前記身体の複数の特定部分の各々の変化量を取得し、複数の前記特定部分の各々の変化量のうち、予め特定される少なくとも1箇所以上の前記特定部分の各々の変化量の全てが各閾値を上回る場合に、特定の表情又は所作が形成されたと判定し、判定された前記特定の表情又は所作に対応する特定表現を、演者に対応するアバターオブジェクトに対して反映させた画像又は動画を生成する、ように前記プロセッサを機能させるものである。【選択図】 図1

Description

本件出願に開示された技術は、動画配信に関連するコンピュータプログラム、サーバ装置及び方法に関する。
従来から、ネットワークを介して端末装置に動画を配信する動画配信サービスが知られている。この種の動画配信サービスにおいては、当該動画を配信する配信ユーザ(演者)に対応するアバターオブジェクトを表示させる環境が提供されている。
また、動画配信サービスに関連して、アバターオブジェクトの表情や動作を演者等の動作に基づいて制御する技術を利用したサービスとして、「カスタムキャスト」と称されるサービスが知られている(非特許文献1)。このサービスでは、演者は、スマートフォンの画面に対する複数のフリック方向の各々に対して、用意された多数の表情や動作のうちのいずれかの表情又は動作を予め割り当てておき、動画配信の際に、所望する表情又は動作に対応する方向に沿って演者がスマートフォンの画面をフリックすることにより、その動画に表示されるアバターオブジェクトにその表情又は動作を表現させることができる。
なお、上記非特許文献1は、引用によりその全体が本明細書に組み入れられる。
"カスタムキャスト"、[online]、Custom Cast Inc.、[2019年12月10日検索]、インターネット(URL: https://customcast.jp/)
しかしながら、非特許文献1に開示される技術においては、動画を配信するにあたり、演者が発話しながらスマートフォンの画面をフリックしなければならず、演者にとっては当該フリックの操作を行うことが困難であり、また当該フリックの誤操作も生じやすい。
したがって、本件出願において開示された幾つかの実施形態は、演者等が容易且つ正確にアバターオブジェクトに所望の表情又は動作を表現させることができる、コンピュータプログラム、サーバ装置及び方法を提供する。
一態様によるコンピュータプログラムは、1又は複数のプロセッサに実行されることにより、センサにより取得される身体の動作に関するデータに基づいて、前記身体の複数の特定部分の各々の変化量を取得し、複数の前記特定部分の各々の変化量のうち、予め特定される少なくとも1箇所以上の前記特定部分の各々の変化量の全てが各閾値を上回る場合に、特定の表情又は所作が形成されたと判定し、判定された前記特定の表情又は所作に対応する特定表現を、演者に対応するアバターオブジェクトに対して反映させた画像又は動画を生成する、ように前記プロセッサを機能させるものである。
一態様によるサーバ装置は、プロセッサを具備し、該プロセッサが、コンピュータにより読み取り可能な命令を実行することにより、センサにより取得される身体の動作に関するデータに基づいて、前記身体の複数の特定部分の各々の変化量を取得し、複数の前記特定部分の各々の変化量のうち、予め特定される少なくとも1箇所以上の前記特定部分の各々の変化量の全てが各閾値を上回る場合に、特定の表情又は所作が形成されたと判定し、判定された前記特定の表情又は所作に対応する特定表現を、演者に対応するアバターオブジェクトに対して反映させた画像又は動画を生成するものである。
一態様による方法は、コンピュータにより読み取り可能な命令を実行する一又は複数のプロセッサにより実行される方法であって、センサにより取得される身体の動作に関するデータに基づいて、前記身体の複数の特定部分の各々の変化量を取得する変化量取得工程と、複数の前記特定部分の各々の変化量のうち、予め特定される少なくとも1箇所以上の前記特定部分の各々の変化量の全てが各閾値を上回る場合に、特定の表情又は所作が形成されたと判定する判定工程と、前記判定工程によって判定された前記特定の表情又は所作に対応する特定表現を、演者に対応するアバターオブジェクトに対して反映させた画像又は動画を生成する生成工程と、を含むものである。
図1は、一実施形態に関する通信システムの構成の一例を示すブロック図である。 図2は、図1に示した端末装置(サーバ装置)のハードウェア構成の一例を模式的に示すブロック図である。 図3は、図1に示したスタジオユニットの機能の一例を模式的に示すブロック図である。 図4Aは、特定の表情「片目を閉じる(ウィンク)」に対応して特定される特定部分と、その閾値の関係を示す図である。 図4Bは、特定の表情「笑い顔」に対応して特定される特定部分と、その閾値の関係を示す図である。 図5は、特定の表情又は所作と特定表現(特定の動作又は表情)との関係を示す図である。 図6は、ユーザインタフェイス部の一例を模式的に示す図である。 図7は、ユーザインタフェイス部の一例を模式的に示す図である。 図8は、ユーザインタフェイス部の一例を模式的に示す図である。 図9は、図1に示した通信システムにおいて行われる動作の一部の一例を示すフロー図である。 図10は、図1に示した通信システムにおいて行われる動作の一部の一例を示すフロー図である。 図11は、第3のユーザインタフェイス部の変形例を示す図である。
以下、添付図面を参照して本発明の様々な実施形態を説明する。なお、図面において共通した構成要素には同一の参照符号が付されている。また、或る図面に表現された構成要素が、説明の便宜上、別の図面においては省略されていることがある点に留意されたい。さらにまた、添付した図面が必ずしも正確な縮尺で記載されている訳ではないということに注意されたい。さらにまた、アプリケーションという用語は、ソフトウェア又はプログラムと称呼されるものであってもよく、コンピュータに対する指令であって、ある種の結果を得ることができるように組み合わされたものであればよい。
1.通信システムの構成
図1は、一実施形態に関する通信システム1の構成の一例を示すブロック図である。図1に示すように、通信システム1は、通信網10に接続される1又はそれ以上の端末装置20と、通信網10に接続される1又はそれ以上のサーバ装置30と、を含むことができる。なお、図1には、端末装置20の例として、3つの端末装置20A~20Cが例示され、サーバ装置30の例として、3つのサーバ装置30A~30Cが例示されているが、端末装置20として、これら以外の1又はそれ以上の端末装置20が通信網10に接続されてもよく、サーバ装置30として、これら以外の1又はそれ以上のサーバ装置30が通信網10に接続されてもよい。
また、通信システム1は、通信網10に接続される1又はそれ以上のスタジオユニット40を含むことができる。なお、図1には、スタジオユニット40の例として、2つのスタジオユニット40A及び40Bが例示されているが、スタジオユニット40として、これら以外の1又はそれ以上のスタジオユニット40が通信網10に接続されてもよい。
「第1の態様」において、図1に示す通信システム1では、例えば、スタジオルーム等又は他の場所に設置されたスタジオユニット40が、上記スタジオルーム等又は他の場所に居る演者等の身体に関するデータを取得したうえで、さらにこのデータに基づいて演者等の身体の複数の部分(特定部分)の各々の変化量を取得し、当該特定部分の各々の変化量の全てが各閾値を上回る旨を判定したことを契機として、所定の特定表現を演者に対応するアバターオブジェクトに反映させた動画(又は画像)を生成する。そして、スタジオユニット40は、生成した動画をサーバ装置30に送信し、サーバ装置30がスタジオユニット40から取得(受信)した動画を、通信網10を介して1又はそれ以上の端末装置20であって、特定のアプリケーション(動画視聴用のアプリケーション)を実行して動画の配信を要求する旨の信号を送信した端末装置20に配信することができる。
ここで、「第1の態様」において、スタジオユニット40が、所定の特定表現を演者に対応するアバターオブジェクトに反映させた動画を生成してこれをサーバ装置30に送信する構成に代えて、スタジオユニット40が、演者等の身体に関するデータと、当該データに基づく演者等の身体の複数の特定部分の各々の変化量に関するデータ(前述の判定に関するデータ)とをサーバ装置30に送信し、サーバ装置30がスタジオユニット40から受信したデータにしたがって、所定の特定表現を演者に対応するアバターオブジェクトに反映させた動画を生成するレンダリング方式の構成を採用してもよい。或いはまた、スタジオユニット40が、演者等の身体に関するデータと、当該データに基づく演者等の身体の複数の特定部分の各々の変化量に関するデータ(前述の判定に関するデータ)とをサーバ装置30に送信し、サーバ装置30がスタジオユニット40から受信したデータを端末装置20に送信し、この端末装置20が、サーバ装置30から受信したデータにしたがって、所定の特定表現を演者に対応するアバターオブジェクトに反映させた動画を生成するレンダリング方式の構成を採用してもよい。
「第2の態様」において、図1に示す通信システム1では、例えば、演者等により操作され特定のアプリケーション(動画配信用のアプリケーション等)を実行する端末装置20(例えば、端末装置20A)が、端末装置20Aに対向する演者等の身体に関するデータを取得したうえで、さらにこのデータに基づいて演者等の身体の複数の特定部分の各々の変化量を取得して、当該特定部分の各々の変化量の全てが各閾値を上回る旨を判定したことを契機として、所定の特定表現を演者に対応するアバターオブジェクトに反映させた動画(又は画像)を生成する。そして、端末装置20Aは、生成した動画をサーバ装置30に送信し、サーバ装置30が端末装置20Aから取得(受信)した動画を、通信網10を介して他の1又はそれ以上の端末装置20であって特定のアプリケーション(動画視聴用のアプリケーション)を実行して動画の配信を要求する旨の信号を送信した端末装置20(例えば、端末装置20C)に配信することができる。
ここで、「第2の態様」において、端末装置20(端末装置20A)が、所定の特定表現を演者に対応するアバターオブジェクトに反映させた動画を生成してこれをサーバ装置30に送信する構成に代えて、端末装置20が、演者等の身体に関するデータと、当該データに基づく演者等の身体の複数の特定部分の各々の変化量に関するデータ(前述の判定に関するデータ)とをサーバ装置30に送信し、サーバ装置30が端末装置20から受信したデータにしたがって、所定の特定表現を演者に対応するアバターオブジェクトに反映させた動画を生成するレンダリング方式の構成を採用してもよい。或いはまた、端末装置20(端末装置20A)が、演者等の身体に関するデータと、当該データに基づく演者等の身体の複数の特定部分の各々の変化量に関するデータ(前述の判定に関するデータ)とをサーバ装置30に送信し、サーバ装置30が端末装置20Aから受信したデータを他の1又はそれ以上の端末装置20であって特定のアプリケーションを実行して動画の配信を要求する旨の信号を送信した端末装置20(例えば、端末装置20C)へ送信し、この端末装置20Cが、サーバ装置30から受信したデータにしたがって、所定の特定表現を演者に対応するアバターオブジェクトに反映させた動画を生成するレンダリング方式の構成を採用してもよい。
「第3の態様」において、図1に示す通信システム1では、例えば、スタジオルーム等又は他の場所に設置されたサーバ装置30(例えば、サーバ装置30B)が、上記スタジオルーム等又は他の場所に居る演者等の身体に関するデータを取得したうえで、さらにこのデータに基づいて演者等の身体の複数の部分(特定部分)の各々の変化量を取得して、当該特定部分の各々の変化量の全てが各閾値を上回る旨を判定したことを契機として、所定の特定表現を演者に対応するアバターオブジェクトに反映させた動画(又は画像)を生成する。そして、サーバ装置30Bは、生成した動画を、通信網10を介して1又はそれ以上の端末装置20であって、特定のアプリケーション(動画視聴用のアプリケーション)を実行して動画の配信を要求する旨の信号を送信した端末装置20に配信することができる。この「第3の態様」においても、前述と同様に、サーバ装置30(サーバ装置30B)が、所定の特定表現を演者に対応するアバターオブジェクトに反映させた動画を生成してこれを端末装置20に送信する構成に代えて、サーバ装置30が、演者等の身体に関するデータと、当該データに基づく演者等の身体の複数の特定部分の各々の変化量に関するデータ(前述の判定に関するデータ)とを端末装置20に送信し、端末装置20がサーバ装置30から受信したデータにしたがって、所定の特定表現を演者に対応するアバターオブジェクトに反映させた動画を生成するレンダリング方式の構成を採用してもよい。
通信網10は、携帯電話網、無線LAN、固定電話網、インターネット、イントラネット及び/又はイーサネット(登録商標)等をこれらに限定することなく含むことができるものである。
前述の演者等とは、演者のみならず、例えば、スタジオルーム等又は他の場所において演者とともに居るサポータや、スタジオユニットのオペレータ等を含むことができる。
端末装置20は、インストールされた特定のアプリケーションを実行することにより、演者等の身体に関するデータを取得したうえで、さらにこのデータに基づいて演者等の身体の複数の部分(特定部分)の各々の変化量を取得し、当該特定部分の各々の変化量の全てが各閾値を上回る旨を判定したことを契機として、所定の特定表現を演者に対応するアバターオブジェクトに反映させた動画(又は画像)を生成し、さらに生成した動画をサーバ装置30に送信する、という動作等を実行することができる。或いはまた、端末装置20は、インストールされたウェブブラウザを実行することにより、サーバ装置30からウェブページを受信及び表示して、同様の動作等を実行することができる。
端末装置20は、このような動作を実行することができる任意の端末装置であって、スマートフォン、タブレット、携帯電話(フィーチャーフォン)及び/又はパーソナルコンピュータ等を、これらに限定することなく含むことができる。
サーバ装置30は、「第1の態様」及び「第2の態様」では、インストールされた特定のアプリケーションを実行してアプリケーションサーバとして機能することにより、スタジオユニット40又は端末装置20から、所定の特定表現がアバターオブジェクトに反映された動画を、通信網10を介して受信し、受信した動画を(他の動画とともに)通信網10を介して各端末装置20に配信する、という動作等を実行することができる。或いはまた、サーバ装置30は、インストールされた特定のアプリケーションを実行してウェブサーバとして機能することにより、各端末装置20に送信するウェブページを介して、同様の動作等を実行することができる。
サーバ装置30は、「第3の態様」では、インストールされた特定のアプリケーションを実行してアプリケーションサーバとして機能することにより、このサーバ装置30が設置されたスタジオルーム等又は他の場所にいる演者等の身体に関するデータを取得したうえで、さらにこのデータに基づいて演者等の身体の複数の部分(特定部分)の各々の変化量を取得して、当該特定部分の各々の変化量の全てが各閾値を上回る旨を判定したことを契機として、所定の特定表現を演者に対応するアバターオブジェクトに反映させた動画(又は画像)を生成することができ、且つ生成した動画を(他の動画とともに)、通信網10を介して各端末装置20に配信する、という動作等を実行することができる。或いはまた、サーバ装置30は、インストールされた特定のアプリケーションを実行してウェブサーバとして機能することにより、各端末装置20に送信するウェブページを介して、同様の動作等を実行することができる。
スタジオユニット40は、インストールされた特定のアプリケーションを実行する情報処理装置として機能することにより、このスタジオユニット40が設置されたスタジオルーム等又は他の場所に居る演者等の身体に関するデータを取得したうえで、さらにこのデータに基づいて演者等の身体の複数の部分(特定部分)の各々の変化量を取得して、当該特定部分の各々の変化量の全てが各閾値を上回る旨を判定したことを契機として、所定の特定表現を演者に対応するアバターオブジェクトに反映させた動画(又は画像)を生成することができ、且つ生成した動画を(他の動画とともに)、通信網10を介してサーバ装置30に送信する、という動作等を実行することができる。
2.各装置のハードウェア構成
次に、端末装置20、サーバ装置30及びスタジオユニット40の各々が有するハードウェア構成の一例について説明する。
2-1.端末装置20のハードウェア構成
各端末装置20のハードウェア構成の一例について、図2を参照しつつ説明する。図2は、図1に示した端末装置20のハードウェア構成の一例を模式的に示すブロック図である(なお、図2において、括弧内の参照符号は、後述するように各サーバ装置30に関連して付されたものである)。
図2に示すように、各端末装置20は、主に、中央処理装置21と、主記憶装置22と、入出力インタフェイス23と、入力装置24と、補助記憶装置25と、出力装置26と、を含むことができる。これら装置同士は、データバス及び/又は制御バスにより接続されている。
中央処理装置21は、「CPU」と称されるものであり、主記憶装置22に記憶されている命令及びデータに対して演算を行い、その演算の結果を主記憶装置22に記憶させるものである。さらに、中央処理装置21は、入出力インタフェイス23を介して、入力装置24、補助記憶装置25及び出力装置26等を制御することができる。端末装置20は、1又はそれ以上のこのような中央処理装置21を含むことが可能である。
主記憶装置22は、「メモリ」と称されるものであり、入力装置24、補助記憶装置25及び通信網10等(サーバ装置30等)から、入出力インタフェイス23を介して受信した命令及びデータ、並びに、中央処理装置21の演算結果を記憶するものである。主記憶装置22は、RAM(ランダムアクセスメモリ)、ROM(リードオンリーメモリ)及び/又はフラッシュメモリ等をこれらに限定することなく含むことができる。
補助記憶装置25は、主記憶装置22よりも大きな容量を有する記憶装置である。前述した特定のアプリケーション(動画配信用アプリケーション、動画視聴用アプリケーション等)やウェブブラウザ等を構成する命令及びデータ(コンピュータプログラム)を記憶しておき、中央処理装置21により制御されることにより、これらの命令及びデータ(コンピュータプログラム)を、入出力インタフェイス23を介して主記憶装置22に送信することができる。補助記憶装置25は、磁気ディスク装置及び/又は光ディスク装置等をこれらに限定することなく含むことができる。
入力装置24は、外部からデータを取り込む装置であり、タッチパネル、ボタン、キーボード、マウス及び/又はセンサ等をこれらに限定することなく含むものである。センサは、後述するように、1又はそれ以上のカメラ等及び/又は1又はそれ以上のマイク等を含むセンサをこれらに限定することなく含むことができる。
出力装置26は、ディスプレイ装置、タッチパネル及び/又はプリンタ装置等をこれらに限定することなく含むことができる。
このようなハードウェア構成にあっては、中央処理装置21が、補助記憶装置25に記憶された特定のアプリケーションを構成する命令及びデータ(コンピュータプログラム)を順次主記憶装置22にロードし、ロードした命令及びデータを演算することにより、入出力インタフェイス23を介して出力装置26を制御し、或いはまた、入出力インタフェイス23及び通信網10を介して、他の装置(例えばサーバ装置30、スタジオユニット40及び他の端末装置20等)との間で様々な情報の送受信を行うことができる。
これにより、端末装置20は、インストールされた特定のアプリケーションを実行することにより、演者等の身体に関するデータを取得したうえで、さらにこのデータに基づいて演者等の身体の複数の部分(特定部分)の各々の変化量を取得し、当該特定部分の各々の変化量の全てが各閾値を上回ることを契機として、所定の特定表現を演者に対応するアバターオブジェクトに反映させた動画(又は画像)を生成し、さらに生成した動画をサーバ装置30に送信する、という動作等を実行することができる。或いはまた、端末装置20は、インストールされたウェブブラウザを実行することにより、サーバ装置30からウェブページを受信及び表示して、同様の動作等を実行することができる。
なお、端末装置20は、中央処理装置21に代えて又は中央処理装置21とともに、1又はそれ以上のマイクロプロセッサ、及び/又は、グラフィックスプロセッシングユニット(GPU)を含むものであってもよい。
2-2.サーバ装置30のハードウェア構成
各サーバ装置30のハードウェア構成の一例について、同じく図2を参照しつつ説明する。各サーバ装置30のハードウェア構成としては、例えば、前述の各端末装置20のハードウェア構成と同一のものを用いることが可能である。したがって、各サーバ装置30が有する構成要素に対する参照符号は、図2において括弧内に示されている。
図2に示すように、各サーバ装置30は、主に、中央処理装置31と、主記憶装置32と、入出力インタフェイス33と、入力装置34と、補助記憶装置35と、出力装置36と、を含むことができる。これら装置同士は、データバス及び/又は制御バスにより接続されている。
中央処理装置31、主記憶装置32、入出力インタフェイス33、入力装置34、補助記憶装置35及び出力装置36は、それぞれ、前述した各端末装置20に含まれる、中央処理装置21、主記憶装置22、入出力インタフェイス23、入力装置24、補助記憶装置25及び出力装置26と略同一なものとすることができる。
このようなハードウェア構成にあっては、中央処理装置31が、補助記憶装置35に記憶された特定のアプリケーションを構成する命令及びデータ(コンピュータプログラム)を順次主記憶装置32にロードし、ロードした命令及びデータを演算することにより、入出力インタフェイス33を介して出力装置36を制御し、或いはまた、入出力インタフェイス33及び通信回線10を介して、他の装置(例えば各端末装置20、及びスタジオユニット40等)との間で様々な情報の送受信を行うことができる。
これにより、サーバ装置30は、「第1の態様」及び「第2の態様」では、インストールされた特定のアプリケーションを実行してアプリケーションサーバとして機能することにより、スタジオユニット40又は端末装置20から、所定の特定表現がアバターオブジェクトに反映された動画を、通信網10を介して受信し、受信した動画を(他の動画とともに)通信網10を介して各端末装置20に配信する、という動作等を実行することができる。或いはまた、サーバ装置30は、インストールされた特定のアプリケーションを実行してウェブサーバとして機能することにより、各端末装置20に送信するウェブページを介して、同様の動作等を実行することができる。
また、サーバ装置30は、「第3の態様」では、インストールされた特定のアプリケーションを実行してアプリケーションサーバとして機能することにより、このサーバ装置30が設置されたスタジオルーム等又は他の場所にいる演者等の身体に関するデータを取得したうえで、さらにこのデータに基づいて演者等の身体の複数の部分(特定部分)の各々の変化量を取得して、当該特定部分の各々の変化量の全てが各閾値を上回ることを契機として、所定の特定表現を演者に対応するアバターオブジェクトに反映させた動画(又は画像)を生成することができ、且つ生成した動画を(他の動画とともに)、通信網10を介して各端末装置20に配信する、という動作等を実行することができる。或いはまた、サーバ装置30は、インストールされた特定のアプリケーションを実行してウェブサーバとして機能することにより、各端末装置20に送信するウェブページを介して、同様の動作等を実行することができる。
なお、サーバ装置30は、中央処理装置31に代えて又は中央処理装置31とともに、1又はそれ以上のマイクロプロセッサ、及び/又は、グラフィックスプロセッシングユニット(GPU)を含むものであってもよい。
2-3.スタジオユニット40のハードウェア構成
スタジオユニット40は、パーソナルコンピュータ等の情報処理装置により実装可能なものであって、図示はされていないが、前述した端末装置20及びサーバ装置30と同様に、主に、中央処理装置と、主記憶装置と、入出力インタフェイスと、入力装置と、補助記憶装置と、出力装置と、を含むことができる。これら装置同士は、データバス及び/又は制御バスにより接続されている。
スタジオユニット40は、インストールされた特定のアプリケーションを実行して情報処理装置として機能することにより、このスタジオユニット40が設置されたスタジオルーム等又は他の場所に居る演者等の身体に関するデータを取得したうえで、さらにこのデータに基づいて演者等の身体の複数の部分(特定部分)の各々の変化量を取得して、当該特定部分の各々の変化量の全てが各閾値を上回ることを契機として、所定の特定表現を演者に対応するアバターオブジェクトに反映させた動画(又は画像)を生成することができ、且つ生成した動画を(他の動画とともに)、通信網10を介してサーバ装置30に送信する、という動作等を実行することができる。
3.各装置の機能
次に、スタジオユニット40、端末装置20、及びサーバ装置30の各々が有する機能の一例について説明する。
3-1.スタジオユニット40の機能
スタジオユニット40の機能の一例(一実施形態)について、図3を参照しつつ説明する。図3は、図1に示したスタジオユニット40の機能の一例を模式的に示すブロック図である(なお、図3において、括弧内の参照符号は、後述するように端末装置20及びサーバ装置30に関連して付されたものである)。
図3に示すように、スタジオユニット40は、センサから演者等の身体に関するデータを取得するセンサ部100と、センサ部100から取得したデータに基づいて演者等の身体の複数の特定部分の各々の変化量を取得する変化量取得部110と、複数の特定部分の各々の変化量のうち予め特定される少なくとも1箇所以上の特定部分の各々の変化量の全てが各閾値を上回るか否かを判定したうえで、上回ると判定した場合に演者等によって特定の表情が形成されたと判定する判定部120と、判定部120によって判定された特定の表情に対応する特定表現を、演者に対応するアバターオブジェクトに対して反映させた動画(又は画像)を生成する生成部130と、を含むことができる。
さらに、スタジオユニット40は、前述の閾値の各々を演者等が適宜に設定することができるユーザインタフェイス部140をさらに含むことができる。
さらにまた、スタジオユニット40は、生成部130により生成された動画(又は画像)を表示する表示部150と、生成部130により生成された動画を記憶する記憶部160と、生成部130により生成された動画を、通信網10を介してサーバ装置30に送信等する通信部170と、を含むことができる。
(1)センサ部100
センサ部100は、例えばスタジオルーム(図示せず)に配される。スタジオルームにおいては、演者が種々のパフォーマンスを行い、センサ部100が当該演者の動作、表情、及び発話(歌唱を含む)等を検出する。
演者は、スタジオルームに含まれる種々のセンサ群によって動作、表情、及び発話(歌唱を含む)等がキャプチャされる対象となっている。この場合において、スタジオルーム内に存在する演者は、1人であってもよいし、2人以上であってもよい。
センサ部100は、演者の顔や手足等の身体に関するデータを取得する1又はそれ以上の第1のセンサ(図示せず)と、演者により発せられた発話及び/又は歌唱に関する音声データを取得する1又はそれ以上の第2のセンサ(図示せず)と、を含むことができる。
第1のセンサは、好ましい実施形態では、可視光線を撮像するRGBカメラと、近赤外線を撮像する近赤外線カメラと、を少なくとも含むことができる。また、第1のセンサは、後述するモーションセンサやトラッキングセンサ等を含むことができる。前述のRGBカメラや近赤外線カメラとしては、例えばiphone X(登録商標)のトゥルーデプス(True Depth)カメラに含まれたものを用いることが可能である。第2のセンサは、音声を記録するマイクロフォンを含むことができる。
第1のセンサに関して、センサ部100は、演者の顔や手足等に近接して配置された第1のセンサ(第1のセンサに含まれるカメラ)を用いて演者の顔や手足等を撮像する。これにより、センサ部100は、RGBカメラにより取得された画像をタイムコード(取得した時間を示すコード)に対応付けて単位時間区間にわたって記録したデータ(例えばMPEGファイル)を生成することができる。さらに、センサ部100は、近赤外線カメラにより取得された所定数(例えば51個)の深度を示す数値(例えば浮動小数点の数値)を上記タイムコードに対応付けて単位時間にわたって記録したデータ(例えばTSVファイル[データ間をタブで区切って複数のデータを記録する形式のファイル])を生成することができる。
近赤外線カメラに関して、具体的には、ドットプロジェクタがドット(点)パターンをなす赤外線レーザーを演者の顔や手足等に放射し、近赤外線カメラが、演者の顔や手足等に投影され反射した赤外線ドットを捉え、このように捉えた赤外線ドットの画像を生成する。センサ部100は、予め登録されているドットプロジェクタにより放射されたドットパターンの画像と、近赤外線カメラにより捉えられた画像とを比較して、両画像における各ポイント(各特徴点)(例えば51個のポイント・特徴点の各々)における位置のずれを用いて各ポイント(各特徴点)の深度(各ポイント・各特徴点と近赤外線カメラとの間の距離)を算出することができる。センサ部100は、このように算出された深度を示す数値を上記のようにタイムコードに対応付けて単位時間にわたって記録したデータを生成することができる。
また、スタジオルームにおけるセンサ部100は、演者の身体(例えば、手首、足甲、腰、頭頂等)に装着される種々のモーションセンサ(図示せず)や、演者の手に把持されるコントローラ(図示せず)等、を有することができる。さらにまた、スタジオルームには、前述の各構成要素に加えて、複数のベースステーション(図示せず)及びトラッキングセンサ(図示せず)等を有することもできる。
前述のモーションセンサは、前述のベースステーションと協働して、演者の位置及び向きを検出することができる。一実施形態において、複数のベースステーションは、多軸レーザーエミッタ―であり、同期用の点滅光を発した後に、1つのベースステーションは例えば鉛直軸の周りでレーザー光を走査し、他のベースステーションは、例えば水平軸の周りでレーザー光を走査するように構成される。モーションセンサは、ベースステーションからの点滅光及びレーザー光の入射を検知する光センサを複数備え、点滅光の入射タイミングとレーザー光の入射タイミングとの時間差、各光センサでの受光時間、各光センサが検知したレーザー光の入射角度、等を検出することができる。モーションセンサは、例えば、HTC CORPORATIONから提供されているVive Trackerであってもよいし、ZERO C SEVEN Inc.から提供されているXsens MVN Analyzeであってもよい。
センサ部100は、モーションセンサにおいて算出された各モーションセンサの位置及び向きを示す検出情報を取得することができる。モーションセンサは、演者の手首、足甲、腰、頭頂等の部位に装着されることにより、モーションセンサの位置及び向きを検出して、演者における体の各部位の動きを検出することができる。なお、モーションセンサの位置及び向きを示す検出情報は、動画内(動画に含まれる仮想空間内)における演者の体の各部位毎のXYZ座標系における位置座標値として算出される。X軸は例えば動画内における横方向、Y軸は例えば動画内における奥行方向、Z軸は例えば動画内における縦方向に対応するように設定される。したがって、演者における体の各部位の動きも、全てXYZ座標系における位置座標値として検出される。
一実施形態においては、複数のモーションセンサに多数の赤外LEDを搭載し、この赤外LEDからの光を、スタジオルームの床や壁に設けられた赤外線カメラで検知することで、当該モーションセンサの位置及び向きを検出してもよい。また、赤外LEDに代えて可視光LEDを使用し、この可視光LEDからの光を可視光カメラで検出することで、当該モーションセンサの位置及び向きを検出してもよい。
一実施形態においては、モーションセンサに代えて、複数の反射マーカーを用いることもできる。反射マーカーは、演者に粘着テープ等により貼付される。このように反射マーカーが貼付された演者を撮影して撮影データを生成し、この撮影データを画像処理することにより、反射マーカーの位置及び向き(前述と同様に、XYZ座標系における位置座標値)を検出するような構成としてもよい。
コントローラは、演者による指の折り曲げ等の操作に応じたコントロール信号を出力し、これを生成部130が取得する。
トラッキングセンサは、動画に含まれる仮想空間を構築するための仮想カメラの設定情報を定めるためのトラッキング情報を生成する。当該トラッキング情報は、三次元直交座標系での位置及び各軸回りの角度として算出され、生成部130は当該トラッキング情報を取得する。
次に、第2のセンサに関して、センサ部100は、演者に近接して配置された第2のセンサを用いて演者により発せられた発話及び/又は歌唱に関する音声を取得する。これにより、センサ部100は、タイムコードに対応付けて単位時間にわたって記録したデータ(例えばMPEGファイル)を生成することができる。一実施形態では、センサ部100は、第1のセンサを用いて演者の顔や手足に関するデータを取得することと同時に、第2のセンサを用いて演者により発せられた発話及び/又は歌唱に関する音声データを取得することができる。この場合には、センサ部100は、RGBカメラにより取得された画像と、第2のセンサを用いて演者により発せられた発話及び/又は歌唱に関する音声データとを、同一のタイムコードに対応付けて単位時間にわたって記録したデータ(例えばMPEGファイル)を生成することができる。
センサ部100は、前述のとおり生成した、演者の顔や手足等に関する動作データ(MPEGファイル及びTSVファイル等)、演者の体の各部位の位置や向きに関するデータ、及び、演者により発せられた発話及び/又は歌唱に関する音声データ(MPEGファイル等)を、後述する生成部130に出力することができる。
このように、センサ部100は、タイムコードに対応付けて、単位時間区間ごとに、MPEGファイル等の動画と、演者の顔や手足等に位置(座標等)とを、演者に関するデータとして取得することができる。
このような一実施形態によれば、センサ部100は、例えば、演者の顔や手足等における各部位について、単位時間区間ごとにキャプチャしたMPEGファイル等と、各部位の位置(座標)と、を含むデータを取得することができる。具体的には、センサ部100は、単位時間区間ごとに、例えば、右目に関し、右目の位置(座標)を示す情報を含み、例えば上唇に関し、上唇の位置(座標)を示す情報を含むことができる。
別の好ましい実施形態では、センサ部100は、Argumented Facesという技術を利用するものとすることができる。Argumented Facesとしては、https://developers.google.com/ar/develop/java/augmented-faces/において開示されたものを利用することができ、引用によりその全体が本明細書に組み入れられる。
ところで、センサ部100は、前述のとおり生成した、演者の顔や手足等の身体部位のうち複数の特定部分に関する動作データ(MPEGファイル及びTSVファイル等)を、後述する変化量取得部110にさらに出力することができる。ここで、複数の特定部分とは、身体のいずれかの部位、例えば、頭、顔の一部分、肩(肩を覆う衣服であってもよい)、及び手足等を含むことができる。さらに具体的には、顔の一部分であって、額、眉、瞼、頬、鼻、耳、唇、口、舌、及び顎等、これらに限定することなく含むことができる。
センサ部100は、スタジオルームに存在する演者の動作、表情、及び発話等を検出する旨を前述のとおり説明したが、これに加えて、スタジオルームにおいて演者とともに居るサポータや、スタジオユニット40のオペレータ等の動作や表情を検出するようにしてもよい。この場合において、センサ部100は、サポータ又はオペレータの顔や手足等の身体部位のうち複数の特定部分に関するデータ(MPEGファイル及びTSVファイル等)を後述する変化量取得部110に出力してもよい。
(2)変化量取得部110
変化量取得部110は、センサ部100により取得された演者(前述のとおり、サポータ又はオペレータであってもよい)の身体の動作に関するデータに基づいて、当該演者の身体の複数の特定部分の各々の変化量(変位量)を取得する。具体的には、変化量取得部110は、例えば、右頬という特定部分について、単位時間区間1において取得された位置(座標)と、単位時間区間2において取得された位置(座標)と、の差分をとることにより、単位時間区間1と単位時間区間2との間において、右頬という特定部分の変化量を取得することができる。変化量取得部110は、他の特定部分についても同様にその特定部分の変化量を取得することができる。
なお、変化量取得部110は、各特定部分の変化量を取得するために、任意の単位時間区間において取得された位置(座標)と、別の任意の単位時間区間において取得された位置(座標)との間における差分を用いることが可能である。また、単位時間区間は、固定、可変又はこれらの組み合わせであってもよい。
(3)判定部120
次に、判定部120について図4A及び図4Bを参照しつつ説明する。図4Aは、特定の表情「片目を閉じる(ウィンク)」に対応して特定される特定部分と、その閾値の関係を示す図である。図4Bは、特定の表情「笑い顔」に対応して特定される特定部分と、その閾値の関係を示す図である。
判定部120は、変化量取得部110によって取得された複数の特定部分の各々の変化量のうち、予め特定される少なくとも1箇所以上の特定部分の各々の変化量の全てが各閾値を上回るか否かを判定したうえで、上回ると判定した場合に演者等によって特定の表情が形成されたと判定する。具体的には、判定部120は、特定の表情として、例えば、「笑い顔」、「片目を閉じる(ウィンク)」、「驚き顔」、「悲しい顔」、「怒り顔」、「悪巧み顔」、「照れ顔」、「両目を閉じる」、「舌を出す」、「口をイーとする」、「頬を膨らます」、及び「両目を見開く」といった表情を、これらに限定することなく用いることができる。また、例えば、「肩を震わす」や「首をふる」といった所作を、特定の表情に加えて又は特定の表情に代えて用いてもよい。但し、これらの特定の表情及び特定の所作は、演者(前述のとおり、サポータ又はオペレータであってもよい)が意識的に実行した表情(又は所作)のみを判定部120が判定することが好ましい。したがって、演者が意識的に実行したものではない誤判定を防止するためには、演者等がスタジオルームにて実行する種々のパフォーマンスや発話中の表情と重複しないものを適宜選択することが好ましい。
判定部120は、前述の各特定の表情(又は特定の所作)に対応する少なくとも1箇所以上の特定部分の変化量を予め特定する。具体的には、図4Aに示すように、例えば、特定の表情が「片目を閉じる(ウィンク)」の場合、眉(右眉又は左眉)、瞼(右瞼又は左瞼)、目(右目又は左目)、頬(右頬又は左頬)、及び鼻(右鼻又は左鼻)を特定部分の一例とすることができ、これらの変化量を取得する。さらに具体的には、一例として、右眉、右瞼、右目、右頬、及び鼻を特定部分とすることができる。また、図4Bに示すように、例えば、特定の表情が「笑い顔」の場合、口(右側又は左側)、唇(下唇の右側又は左側)、及び眉の内側(又は額)を特定部分としてこれらの変化量を取得する。
さらに、図4A及び図4Bに示すように、前述の特定の表情に対応して予め特定された特定部分の変化量には各々に閾値が設定される。具体的には、例えば、特定の表情が「片目を閉じる(ウィンク)」の場合、眉の変化量(下降量)の閾値を0.7、瞼の変化量(下降量)の閾値を0.9、目の変化量(目が細くなった量)の閾値を0.6、頬の変化量(上昇量)の閾値を0.4、及び鼻の変化量(上昇量)の閾値を0.5、と設定される。同様に、特定の表情が「笑い顔」の場合、口の変化量(上昇量)の閾値を0.4、下唇の変化量(下降量)の閾値を0.4、及び眉の内側の変化量(上昇量)の閾値を0.1、と設定される。これらの各閾値の値は後述するとおりユーザインタフェイス部140を介して適宜に設定することができる。なお、目が細くなった量は、目の開口量が減少した量であり、例えば、上瞼と下瞼の距離が縮まった量である。
また、特定の表情に対応する特定部分も、適宜に変更することができる。具体的には、図4Aに示すように、特定の表情が「片目を閉じる(ウィンク)」の場合、眉、瞼、目、頬、及び鼻の5箇所を特定部分として予め特定してもよいし、当該5箇所のうち、眉、瞼、及び目の3箇所のみを特定部分として予め特定してもよい。但し、演者(前述のとおり、サポータ又はオペレータであってもよい)が意識的に実行した表情(又は所作)のみを判定部120が判定することが好ましい。したがって、演者が意識的に実行したものではない誤判定を防止するためには、特定の表情に対応する特定部分の箇所数は多い方が好ましい。
このように、判定部120は、例えば、「片目を閉じる(ウィンク)」に関していえば、変化量取得部110によって取得された特定部分としての眉、瞼、目、頬、及び鼻の変化量を監視して、これらの変化量の全てが前述の各閾値を上回ると、「片目を閉じる(ウィンク)」が演者(前述のとおり、サポータ又はオペレータであってもよい)によって形成されたと判定する。なお、この場合において、変化量の全てが前述の各閾値を実際に上回った時点で、「片目を閉じる(ウィンク)」が形成されたと判定部120が判断してもよいし、変化量の全てが前述の各閾値を実際に上回る状態が所定時間(例えば、1秒や2秒)継続することを追加の条件に加えたうえで、「片目を閉じる(ウィンク)」が形成されたと判定部120が判断してもよい。後者のような態様をとることで、判定部120による誤判定を効率的に回避することが可能となる。
なお、判定部120により前述の判定がなされた場合においては、判定部120は当該判定結果(例えば、「片目を閉じる(ウィンク)」が演者によって形成された旨の判定結果)に関する情報(信号)を生成部130へと出力する。この場合において、判定部120から生成部130へと出力される判定結果の情報としては、例えば、各特定部分の変化量を示す情報、各特定部分の変化量が各閾値を上回ったことにより形成された特定の表情又は所作に対応する特定表現をアバターオブジェクトに反映させる旨を決定したことを示すキュー、及び形成された特定の表情又は所作に対応する特定表現をアバターオブジェクトに反映させる旨を要求する情報としての特定表現のID(「特殊表情のID」ともいう)、の少なくとも1つが含まれる。
ここで、特定の表情又は所作と特定表現(特定の動作又は表情)との関係について、図5を参照しつつ説明する。図5は、特定の表情又は所作と特定表現(特定の動作又は表情)との関係を示す図である。
特定の表情又は所作と特定表現(特定の動作又は表情)との関係は、同一の関係、類似する関係、及び全く無関係のいずれかの関係の中から適宜に選択すればよい。具体的には、例えば、図5の特定表現1のように、特定の表情「片目を閉じる(ウィンク)」等に対応する特定表現として、これと同一の「片目を閉じる(ウィンク)」としてもよい。一方、図5の特定表現2のように、特定の表情「笑い顔」に対応して「両手を挙げる」、「片目を閉じる(ウィンク)」に対応して「右足を蹴り上げる」、「悲しい顔」に対応して「寝る」、「片目を閉じる」等、無関係なものとしてもよい。また、「笑い顔」に対応して「悲しい顔」等としてもよい。さらにまた、「笑い顔」に対応して「悪巧み顔」と類似するものとしてもよい。さらにまた、同一の関係、類似する関係、及び全く無関係の関係において、特定表現として、漫画絵のようなものを用いてもよい。つまり、特定の表情は、特定表現をアバターオブジェクトに反映させるための契機(トリガー)として用いることができる。
なお、特定の表情又は所作と特定表現(特定の動作又は表情)との関係は、後述するユーザインタフェイス部140を介して適宜に変更される。
(4)生成部130
生成部130は、センサ部100からの、演者の顔や手足等に関する動作データ(MPEGファイル及びTSVファイル等)、演者の体の各部位の位置や向きに関するデータ、及び演者により発せられた発話及び/又は歌唱に関する音声データ(MPEGファイル等)に基づいて、演者に対応するアバターオブジェクトのアニメーションを含む動画を生成することができる。アバターオブジェクトの動画自体については、生成部130は、図示しないキャラクターデータ記憶部に記憶された様々な情報(例えば、ジオメトリ情報、ボーン情報、テクスチャ情報、シェーダ情報及びブレンドシェイプ情報等)を用いて、図示しないレンダリング部にレンダリングを実行させることにより、アバターオブジェクトの動画を生成することもできる。
また、生成部130は、判定部120から前述の判定結果の情報を取得すると、当該判定結果の情報に対応する特定表現を、前述のとおり生成したアバターオブジェクトの動画上に反映させる。具体的には、例えば、一例として、判定部120が、「片目を閉じる(ウィンク)」との特定の表情又は所作が演者によって形成され、これに対応する「片目を閉じる(ウィンク)」との特定表現のID(前述のキューに関する情報でもよい)を生成部130が判定部120から受信すると、生成部130は、当該「片目を閉じる(ウィンク)」なる特定表現を、演者に対応するアバターオブジェクトに反映させた動画(又は画像)を生成する。
ところで、生成部130は、判定部120の判定結果の情報の取得の有無にかかわらず、前述のとおり、センサ部100からの演者の顔や手足等に関する動作データ(MPEGファイル及びTSVファイル等)、演者の体の各部位の位置や向きに関するデータ、及び演者により発せられた発話及び/又は歌唱に関する音声データ(MPEGファイル等)に基づいて、演者に対応するアバターオブジェクトのアニメーションを含む動画を生成する(この動画を便宜的に「第1動画」と称す)。一方、生成部130が、判定部120から前述の判定結果の情報を取得する場合、生成部130は、センサ部100からの演者の顔や手足等に関する動作データ(MPEGファイル及びTSVファイル等)、演者の体の各部位の位置や向きに関するデータ、演者により発せられた発話及び/又は歌唱に関する音声データ(MPEGファイル等)、及び判定部120から受信する判定結果の情報に基づいて、所定の特定表現をアバターオブジェクトに反映させた動画(又は画像)を生成する(この動画を便宜的に「第2動画」と称す)。
(5)ユーザインタフェイス部140
次に、ユーザインタフェイス部140について図6乃至図8を参照しつつ説明する。図6乃至図8は、ユーザインタフェイス部140の一例を模式的に示す図である。
スタジオユニット40におけるユーザインタフェイス部140は表示部150に表示されて、前述の動画(又は画像)のサーバ装置30への送信や、前述の閾値等に関する様々な情報を、演者等の操作を介して入力したり、演者等に対して様々な情報を視覚的に共有することができる。
例えば、ユーザインタフェイス部140は、図6に示すように、特定の表情又は所作とこれに対応する特定部分の各閾値の値を設定(変更)することができる。具体的には、ユーザインタフェイス部140は、特定部分毎(例えば、図6においては、口右側、口左側、下唇右側、下唇左側、及び額であって、図6においては、これらの特定部分の表示態様はフォントや色等で強調された態様で表現される)のスライダー141aを表示部150上におけるタッチ操作に基づいて適宜に調節して、閾値の値を0~1までの任意の値に変更することができる。なお、図6においては、特定の表情として「笑い顔」を設定する場合において、図4Bにて説明した特定部分である口右側(上昇)、口左側(上昇)、下唇右側(下降)、下唇左側(下降)、及び額(上昇)に関する各閾値が0.4又は0.1に設定されているが、これらの閾値の値を、スライダー141aを操作することにより変更することができる。このスライダー141aを便宜的に第1のユーザインタフェイス141と称す。また、図6において、口右側(下降)、及び口左側(下降)は閾値の設定対象になっていないため、これらの領域には前述のスライダー141aが表示されていない。つまり、閾値の設定にあたっては、設定する特定の表情又は所作に対応する特定部分を特定したうえで、その変化量に関する態様(上昇、下降、等)をさらに特定する必要がある。なお、図6に示すように、ユーザインタフェイス部140は、口右側(下降)及び口左側(下降)において、スライダー141aだけでなく、口右側(下降)及び口左側(下降)のタブ自体をユーザインタフェイス部140(表示部150)に表示させないように、別途専用のスライダー141xを設けてもよい。或いは、ユーザインタフェイス部140は、特定部分とその特定部分に対応する閾値やスライダー141aを、画面上に表示させないように選択することを可能とする専用のスライダー141yを別途設けてもよい。スライダー141x,141yは、表示態様を切り替える操作部の一例である。
なお、前述のとおり、特定の表情に対応する特定部分も、ユーザインタフェイス部140(第1のユーザインタフェイス部141)にて適宜に変更することができる。例えば、図6に示すように、特定の表情が「笑い顔」の場合における特定部分が口右側、口左側、下唇右側、下唇左側、及び額の5箇所から、額を削除した4箇所に変更する場合には、「額上昇」のタブをクリック操作する等することで、「笑い顔」に対応する特定部分を変更することができる。
また、ユーザインタフェイス部140は、特定の表情に対応する特定部分の閾値の各々を、スライダー141aの操作を行うことなく、予め定められる所定値に自動的に変更するような構成としてもよい。具体的には、例えば一例として、2つのモードを予め準備しておき、ユーザインタフェイス部140における選択操作に基づいて、当該2つのモードのいずれか一方が選択されると、選択されたモードに対応する各閾値(所定値)に自動的に変更する構成が採用されうる。この場合において、図6においては、「出やすい」及び「出にくい」の2つのモードが準備され、演者等はユーザインタフェイス部140において、タッチ操作を行うことで「出やすい」又は「出にくい」のいずれか一方のモードを選択することが可能となっている。なお、図6における「出やすい」及び「出にくい」に対応するタブを、便宜的に第2のユーザインタフェイス部142と称す。この第2のユーザインタフェイス部142は、各閾値の値を予め定めたセットメニューと捉えることができる。
ところで、前述の「出やすい」とのモードにおいては、各閾値は全体的に低い値(例えば、特定の表情「笑い顔」における特定部分である口右側、口左側、下唇右側、下唇左側の各閾値は0.4より小さい値になり且つ額の閾値は0.1より小さい値)に設定される。これにより、演者等によって「笑い顔」が形成された旨を判定部120が判定する頻度を上げる、又は判定部120による当該判定を容易にすることができる。他方、「出にくい」とのモードにおいては、各閾値は全体的に高い値(例えば、特定の表情「笑い顔」における特定部分である口右側、口左側、下唇右側、下唇左側、各閾値は0.4より大きい値になり且つ額の閾値は0.1より大きい値)に設定される。これにより、演者等によって「笑い顔」が形成された旨を判定部120が判定する頻度を下げる、又は判定部120による当該判定を限定的にすることができる。
なお、「出やすい」とのモードにおいて予め定められる各閾値(各所定値)は、特定部分毎に異なる値としてもよいし、少なくとも2つの特定部分において同じ値としてもよい。具体的には、例えば、特定の表情「笑い顔」における特定部分である口右側、口左側、下唇右側、下唇左側の各閾値を0.2とし、額の閾値を0.05としてもよいし、口右側の閾値を0.1、口左側の閾値を0.3、下唇右側の閾値を0.01、下唇左側の閾値を0.2、並びに額の閾値を0.05としてもよい。また、これらの閾値の値は、スタジオユニット40に特定のアプリケーションがインストールされた時点のデフォルト値よりも小さく設定される。
同様に、「出にくい」とのモードにおいて予め定められる各閾値(各所定値)も、特定部分毎に異なる値としてもよいし、少なくとも2つの特定部分において同じ値としてもよい。具体的には、例えば、特定の表情「笑い顔」における特定部分である口右側、口左側、下唇右側、下唇左側の各閾値を0.7とし、額の閾値を0.5としてもよいし、口右側の閾値を0.7、口左側の閾値を0.8、下唇右側の閾値を0.6、下唇左側の閾値を0.9、並びに額の閾値を0.3としてもよい。或いはまた、「出やすい」とのモードから「出にくい」とのモードに変更する場合(その逆の場合でもよい)、口右側、口左側、下唇右側、下唇左側、及び額の特定部分のうちの一部(例えば、下唇左側及び額)の特定部分の閾値については「出やすい」のモードの所定値(又は「出にくい」のモードの所定値)をそのまま用いるような構成とすることもできる。
なお、第2のユーザインタフェイス部142として、図6を参照しつつ、「出やすい」及び「出にくい」の2つのモード(タブ)を設ける旨を前述にて説明したが、これに限定されず、例えば、3つ(3種)以上のモード(タブ)を設けてよい。例えば、「通常」、「出やすい」、及び「とても出やすい」の3つのモードを設けてもよいし、「通常」、「出やすい」、「とても出やすい」、及び「極めて出やすい」の4つのモードを設けてもよい。これらの場合において、各閾値の値は、スタジオユニット40に特定のアプリケーションがインストールされた時点のデフォルト値よりも小さく設定されてもよいし、当該デフォルト値よりも大きく設定されてもよい。
また、第2のユーザインタフェイス部142として、当該第2のユーザインタフェイス部142による操作を無効化するタブを設けてもよい。図6には、「無効」とのタブが設けられている。このタブがタッチ操作されると、演者等は、第1のユーザインタフェイス部141のみを用いて、閾値を適宜に設定することとなる。
また、第1のユーザインタフェイス部141又は第2のユーザインタフェイス部142にて設定された各閾値を、全て前述のデフォルト値に戻す設定を行うタブを、ユーザインタフェイス部140に別途設けてもよい。
このように各閾値の値を適宜に設定(変更)する理由としては、特定の表情を形成する演者等は当然の如く個人差があり、ある人物は特定の表情を形成しやすい(又は特定の表情を形成したと判定部120によって判定されやすい)一方で、別の人物は当該特定の表情を形成しにくいという場合が生じうる。したがって、どのような人物を対象にしても、特定の表情が形成された旨を判定部120が正確に判定することができるように、適宜に(好ましくは、判定対象の人物が代わるごとに)各閾値を再設定することが好ましい。
さらに、判定対象としての演者等に関する人物が代わるごとに、閾値(変化量)を初期設定することが好ましい。図6に示すように、任意の特定部分における閾値は、当該特定部分の変化量が存在しない場合を基準0として、当該特定部分の最大変化量を1とした場合に、0~1の間で適宜に閾値が設定される。そうすると、ある人物Xの基準0~1と別の人物Yの基準0~1とはその範囲が異なることになる(例えば、人物Xの0~1に照らすと、人物Yの最大変化量は人物Xにおける0.5にしか相当しない場合が生じうる)。したがって、全ての人物における特定部分の変化量を0~1で表現するために、変化量の幅を初期設定(所定の倍率を乗算)することが好ましい。図6においては、「Calibrate」のタブをタッチ操作することで当該初期設定が実行される。
ユーザインタフェイス部140は、各閾値の値を、前述のとおり第1のユーザインタフェイス部141及び第2のユーザインタフェイス部142の両方において設定することができる。この構成とすることにより、例えば、細かい閾値設定に拘らない又は早く動画配信を試したいという演者等においては、第2のユーザインタフェイス部142を用いることができる。他方、細かい閾値設定に拘る演者等は、各閾値に対応する第1のユーザインタフェイス部141のスライダー141aを操作して、自分仕様の閾値をカスタマイズすることもできる。このようなユーザインタフェイス部140を用いることで、演者等の嗜好に合わせて各閾値を適宜に設定できるため、演者等にとっては使い勝手のよいものとなる。さらに、例えば、第2のユーザインタフェイス部142を用いて所定のモード(例えば、「出やすい」とのモード)を設定した後に、第1のユーザインタフェイス部141のスライダー141aを操作することも可能であるから、ユーザインタフェイス部140としての使用方法のバリエーションを向上させることもできる。
また、ユーザインタフェイス部140は、前述の閾値以外の様々な値や情報を適宜に設定又は変更することができる。例えば、ユーザインタフェイス部140は、前述の判定部120による判定動作に関し、特定の表情に対応する特定部分の変化量の全てが各閾値を実際に上回る状態が所定時間(例えば、1秒や2秒)継続することを条件とする場合には、当該所定時間の設定に関するユーザインタフェイス(図6においては図示されていないが、例えば、スライダー)を別途含むことができる。さらに、判定部120によって判定された特定の表情に対応する特定表現を、演者に対応するアバターオブジェクトの動画(又は画像)に反映させる一定時間(例えば、5秒)についても、ユーザインタフェイス部140(図6においては図示されていないが、例えば、スライダー141x及び141yとは異なる別のスライダー)を用いて、適宜の値に設定(変更)することができる。
さらに、ユーザインタフェイス部140は、図6に示すように、前述の特定の表情又は所作と特定表現(特定の動作又は表情)との関係を設定又は変更することが可能な第3のユーザインタフェイス部143を有することができる。第3のユーザインタフェイス部143は、特定の表情としての「笑い顔」に対して、アバターオブジェクトに反映させる特定表現を、当該特定の表情としての「笑い顔」と同一の「笑い顔」、全く無関係の「怒り顔」や「両手を挙げる」等の複数の候補から、タッチ操作(又はフリック操作)にて選択することが可能となっている(図6においては、便宜上、特定表現として「笑い顔」が選択されている態様が表現されている)。なお、後述する図7に示すように、候補となる特定表現を、当該候補の特定表現が反映されたアバターオブジェクトの画像を用いてもよい。
さらにまた、ユーザインタフェイス部140には、特定の表情又は所作、特定の表情又は所作に対応する特定部分、当該特定部分に対応する各閾値、特定の表情又は所作と特定表現との対応関係、所定時間、及び一定時間のいずれかの設定又は変更時において、当該特定の表情又は所作に関する画像情報144及び文字情報145が含まれる。具体的には、図7に示すように、ユーザインタフェイス部140には、特定の表情として、例えば「舌を出す」を設定する際に、その「舌を出す」旨の顔を設定対象者に容易に知らせるために(設定対象者に指示するために)、「舌を出す」のイラストとしての画像情報144と、「舌を出して下さい!!」との文字情報が含まれる。これにより、設定対象者たる演者等は、画像情報144及び文字情報145(いずれか一方だけ表示されてもよい)を見ながら、各情報の設定又は変更を行うことができる。なお、ユーザインタフェイス部140(表示部150)には、画像情報144(及び文字情報145)の表示又は非表示を選択可能な専用スライダー144xが別途設けられてもよい。
さらにまた、特定の表情又は所作、特定の表情又は所作に対応する特定部分、当該特定部分に対応する各閾値、特定の表情又は所作と特定表現との対応関係、所定時間、及び一定時間のいずれかの設定又は変更時において、特定の表情又は所作が形成されたと判定部120によって判定された場合、ユーザインタフェイス部140には、当該特定表情又は所作と同一の特定表現をアバターオブジェクトに反映させた第1テスト動画147(又は第1テスト画像147)が含まれる。具体的には、図7に示すように、一例として、演者等が、前述の画像情報144及び/又は文字情報145に基づいて、センサ部100の前にて特定の表情として「舌を出す」旨の表情をした結果、判定部120が当該「舌を出す」旨の特定の表情が形成されたと判定すると、「舌を出す」との特定表現を反映させたアバターオブジェクトである第1テスト動画147(第1テスト画像147)が表示される。これにより、演者等は、自分が形成した特定の表情又は所作に対して、どのようなアバターオブジェクトの画像又は動画が生成されるのかに関するイメージを認識しやすくなる。
さらにまた、特定の表情又は所作、特定の表情又は所作に対応する特定部分、当該特定部分に対応する各閾値、特定の表情又は所作と特定表現との対応関係、所定時間、及び一定時間のいずれかの設定又は変更時において、特定の表情又は所作が形成されたと判定部120によって判定された場合、ユーザインタフェイス部140には、前述の一定時間が経過後であっても、特定時間にわたって、前述の第1テスト動画147(第1テスト画像147)と同一の動画(又は画像)であって、第1テスト動画147(第1テスト画像147)よりも小さいサイズの第2テスト動画148(又は第2テスト画像148)が含まれる。具体的には、一例として、演者等が「舌を出す」旨の表情をした結果、判定部120が当該「舌を出す」旨の特定の表情が形成されたと判定して図7のような第1テスト動画147(第1テスト画像147)が表示された後、その判定が解除されて且つ一定時間が経過すると、図8に示すように、アバターオブジェクト1000には、何らの特定表現も反映されていない状態となる。しかし、図8に示すように、直前に形成された第1テスト動画147(第1テスト画像147)と同一内容の動画(又は画像)を第2テスト動画148(第2テスト画像148)としてユーザインタフェイス部140に含ませることで、演者等は、例えば、特定の表情又は所作と特定表現との対応関係等を、関連する画像を見ながら時間をかけてゆっくりと設定することができる。特定時間は一定時間と同一の時間であっても、一定時間と異なる時間であってもよい。
以上のとおり、ユーザインタフェイス部140は、演者等による様々な情報の設定を可能とし、また、様々な情報を視覚的に演者等に共有することができる。また、様々な情報、例えば、特定の表情又は所作、特定の表情又は所作に対応する特定部分、当該特定部分に対応する各閾値、特定の表情又は所作と特定表現との対応関係、所定時間、及び一定時間の設定又は変更は、動画配信前(又は後)に実行されてもよいし、動画(又は画像)配信中に実行されてもよい。また、図6乃至図8に関するユーザインタフェイス部140の一例は、表示部150において各々がリンクしながら別々のページとして表示されてもよいし、全て同じページ中に表示されて、表示部150において縦方向又は横方向にスクロールすることで演者等が視認できるような構成としてもよい。また、ユーザインタフェイス部140において、図6乃至図8に示される各種情報は、図6乃至図8のとおりの配置や組み合わせで表示される必要はなく、例えば、図6に示される一部の情報に代えて、図7又は図8に示される情報の一部が同一ページ内に表示されるようにしてもよい。
(6)表示部150
表示部150は、生成部130により生成された動画やユーザインタフェイス部140に関する画面を、スタジオユニット40のディスプレイ(タッチパネル)及び/又はスタジオユニット40に接続されたディスプレイ等に表示することができる。表示部150は、生成部130により生成された動画を順次表示することもできるし、記憶部160に記憶された動画を、演者等の指示にしたがってディスプレイ等に表示することもできる。
(7)記憶部160
記憶部160は、生成部130により生成された動画(又は画像)を記憶することができる。また、記憶部160は、前述の閾値を記憶することができる。具体的には、記憶部160は、特定のアプリケーションがインストールされた時点においては所定のデフォルト値を記憶することもできるし、ユーザインタフェイス部140によって設定された各閾値を記憶することもできる。
(8)通信部170
通信部170は、生成部130により生成された(さらに記憶部160に記憶された)動画(又は画像)を、通信網10を介してサーバ装置30に送信することができる。
前述した各部の動作は、スタジオユニット40にインストールされた特定のアプリケーション(例えば、動画配信用のアプリケーション)が、このスタジオユニット40により実行されることにより実行され得るものである。或いはまた、前述した各部の動作は、スタジオユニット40にインストールされたブラウザが、サーバ装置30により提供されるウェブサイトにアクセスすることにより、このスタジオユニット40により実行され得るものである。なお、前述の「第1の態様」において説明したとおり、スタジオユニット40に生成部130を設けておき、当該生成部130によって前述の動画(第1動画及び第2動画)を生成する代わりに、当該生成部130をサーバ装置30に配しておき、スタジオユニット40は、演者等の身体に関するデータと、当該データに基づく演者等の身体の複数の特定部分の各々の変化量に関するデータ(判定部120による判定結果の情報を含む)とを通信部170を介してサーバ装置30に送信し、サーバ装置30がスタジオユニット40から受信したデータにしたがって、所定の特定表現を演者に対応するアバターオブジェクトに反映させた動画(第1動画及び第2動画)を生成するレンダリング方式の構成を採用してもよい。或いはまた、スタジオユニット40は、演者等の身体に関するデータと、当該データに基づく演者等の身体の複数の特定部分の各々の変化量に関するデータ(判定部120による判定結果の情報を含む)とを通信部170を介してサーバ装置30に送信し、サーバ装置30は、スタジオユニット40から受信したデータを端末装置20に送信し、この端末装置20に設けられる生成部130が、サーバ装置30から受信したデータにしたがって、所定の特定表現を演者に対応するアバターオブジェクトに反映させた動画(第1動画及び第2動画)を生成するレンダリング方式の構成を採用してもよい。
3-2.端末装置20の機能
端末装置20の機能の具体例について、図3を参照しつつ説明する。端末装置20の機能としては、例えば、前述したスタジオユニット40の機能を用いることが可能である。したがって、端末装置20が有する構成要素に対する参照符号は、図3において括弧内に示されている。
前述した「第2の態様」では、端末装置20(例えば、図1における端末装置20A)は、センサ部200~通信部270として、それぞれ、スタジオユニット40に関連して説明したセンサ部100~通信部170と同一のものを有するものとすることができる。そして、前述した各部の動作は、端末装置20にインストールされた特定のアプリケーション(例えば、動画配信用のアプリケーション)が、この端末装置20により実行されることにより、この端末装置20により実行され得るものである。なお、前述の「第2の態様」において説明したとおり、端末装置20に生成部230を設けておき、当該生成部230によって前述の動画を生成する代わりに、当該生成部230をサーバ装置30に配しておき、端末装置20は、演者等の身体に関するデータと、当該データに基づく演者等の身体の複数の特定部分の各々の変化量に関するデータ(判定部220による判定結果の情報を含む)とを通信部270を介してサーバ装置30に送信し、サーバ装置30が端末装置20から受信したデータにしたがって、所定の特定表現を演者に対応するアバターオブジェクトに反映させた動画(第1動画及び第2動画)を生成する構成を採用してもよい。或いはまた、端末装置20は、演者等の身体に関するデータと、当該データに基づく演者等の身体の複数の特定部分の各々の変化量に関するデータ(判定部220による判定結果の情報を含む)とを通信部270を介してサーバ装置30に送信し、サーバ装置30は、端末装置20から受信したデータを他の端末装置20(例えば、図1における端末装置20C)に送信し、この他の端末装置20に設けられる生成部230が、サーバ装置30から受信したデータにしたがって、所定の特定表現を演者に対応するアバターオブジェクトに反映させた動画(第1動画及び第2動画)を生成する構成を採用してもよい。
一方、例えば「第1の態様」及び「第3の態様」では、端末装置20は、センサ部200~通信部270のうち、少なくとも通信部270のみを有することで、スタジオユニット40又はサーバ装置30に設けられる生成部130又は330により生成された動画(又は画像)を、通信網10を介して受信することができる。この場合における端末装置20は、インストールされた特定のアプリケーション(例えば、動画視聴用のアプリケーション)を実行して、サーバ装置30に対して所望の動画の配信を要求する信号(リクエスト信号)を送信することにより、この信号に応答したサーバ装置30から所望の動画を当該特定のアプリケーションを介して受信することができる。
3-3.サーバ装置30の機能
サーバ装置30の機能の具体例について、図3を参照しつつ説明する。サーバ装置30の機能としては、例えば、前述したスタジオユニット40の機能を用いることが可能である。したがって、サーバ装置30が有する構成要素に対する参照符号は、図3において括弧内に示されている。
前述した「第3の態様」では、サーバ装置30は、センサ部300~通信部370として、それぞれ、スタジオユニット40に関連して説明したセンサ部100~通信部170と同一のものを有するものとすることができる。そして、前述した各部の動作は、サーバ装置30にインストールされた特定のアプリケーション(例えば、動画配信用のアプリケーション)が、このサーバ装置30により実行されることにより実行され得るものである。なお、「第3の態様」において、サーバ装置30に生成部330を設けておき、当該生成部330によって前述の動画を生成する代わりに、当該生成部330を端末装置20に配しておき、サーバ装置30は、演者等の身体に関するデータと、当該データに基づく演者等の身体の複数の特定部分の各々の変化量に関するデータ(判定部320による判定結果の情報を含む)とを通信部370を介して端末装置20に送信し、端末装置20がサーバ装置30から受信したデータにしたがって、所定の特定表現を演者に対応するアバターオブジェクトに反映させた動画(第1動画及び第2動画)を生成する構成を採用してもよい。
4.通信システム1全体の動作
次に、上記構成を有する通信システム1においてなされる全体的な動作について、図9及び図10を参照して説明する。図9及び図10は、図1に示した通信システム1において行われる動作の一部の一例を示すフロー図である。なお、図10に示されるフロー図は、前述の「第1の態様」を一例として示すものである。
まず、ステップ(以下「ST」という。)500において、演者等(前述のとおり、サポータ又はオペレータを含む)が、スタジオユニット40のユーザインタフェイス部140を介して、前述のとおり説明したように、特定の表情又は所作を設定する。例えば、「笑い顔」、「片目を閉じる(ウィンク)」、「驚き顔」、「悲しい顔」、「怒り顔」、「悪巧み顔」、「照れ顔」、「両目を閉じる」、「舌を出す」、「口をイーとする」、「頬を膨らます」、及び「両目を見開く」等の表情や、「肩を震わす」、「首をふる」等の所作を、これらに限定することなく、特定の表情又は所作として設定することができる。
次に、ST501おいて、演者等が、スタジオユニット40のユーザインタフェイス部140(第1のユーザインタフェイス部141)を介して、図6を参照しつつ前述のとおり説明したように、各々の特定の表情(例えば、「片目を閉じる(ウィンク)」や「笑い顔」)に対応する演者等の身体の特定部分(例えば、眉、瞼、目、頬、鼻、口、唇、等)を設定する。
次に、ST502において、演者等が、スタジオユニット40のユーザインタフェイス部140を介して、図6を参照しつつ前述のとおり説明したように、ST501にて設定された特定部分の各々の変化量に対応する各閾値を設定する。この場合において、各閾値の設定は、前述のとおり、第1のユーザインタフェイス部141を用いて、特定部分毎に任意の値に設定してもよいし、第2のユーザインタフェイス部142を用いて所定のモード(例えば、「出やすい」とのモード)を選択することで各閾値が予め定められた所定値となるようにしてもよい。また、第2のユーザインタフェイス部142で所定のモードを選択した後、第1のユーザインタフェイス部141を用いて閾値のカスタマイズを行ってもよい。
次に、ST503において、演者等が、スタジオユニット40のユーザインタフェイス部140を介して、図5乃至図8を参照しつつ前述のとおり説明したように、ST500にて設定された特定の表情又は所作と特定表現との対応関係を設定する。この場合において、当該対応関係の設定は、前述のとおり、第3のユーザインタフェイス部143を用いて実行される。
次に、ST504において、演者等が、スタジオユニット40のユーザインタフェイス部140を介して、前述にて説明した所定時間や一定時間を適宜の値に設定することができる。
図9に示されるST500~ST504は、通信システム1の全体的な動作の中の設定動作と捉えることができる。また、ST500~ST504は、必ずしも図9の順に限定されるものではなく、例えば、ST502とST503の順序が逆になってもよいし、ST501とST503の順序が逆になってもよい。また、ST500~ST504における設定動作が実行された後(又は、図10に示される動画生成の動作が実行された後)に、いずれかの値のみを変更する場合においては、ST500~ST504のうちの一部のステップのみが実行されてもよい。具体的には、ST500~ST504における設定動作が実行された後に、閾値のみを変更したい場合においては、ST502のみを実行すればよい。
以上のとおり、図9に示される設定動作が完了すると、次に図10に示される動画生成の動作を実行することができる。
演者等によって、動画生成に関する要求(操作)がユーザインタフェイス部140を介して実行されると、まず、ST505において、スタジオユニット40のセンサ部100が、前述のとおり、演者等の身体の動作に関するデータを取得する。
次に、ST506において、スタジオユニット40の変化量取得部110が、センサ部100により取得された演者等の身体の動作に関するデータに基づいて、当該演者等の身体の複数の特定部分の各々の変化量(変位量)を取得する。
次に、ST507において、スタジオユニット40の生成部130は、センサ部100が取得した様々な情報に基づいて、前述の第1動画を生成する。
次に、ST508において、スタジオユニット40の判定部120が、ST501にて設定された特定部分の各々の変化量の全てが、ST502にて設定された各閾値を上回るか否かを監視する。そして、「上回る」場合には、判定部120が、演者等によってST500にて設定された特定の表情又は所作が形成されたと判定してST520へと移行する。他方、ST508において、「上回っていない」場合には、ST509へと移行する。
次に、ST508において「上回っていない」場合は、ST509において、スタジオユニット40の通信部170が、ST507にて生成部130が生成した第1動画をサーバ装置30へと送信することとなる。その後、ST509にて通信部170からサーバ装置30へと送信された第1動画は、ST510において、サーバ装置30によって端末装置20へと送信される。そして、サーバ装置30により送信された第1動画を受信した端末装置20は、ST530において、当該第1動画を表示部250に表示させる。このようにして、ST508において「上回っていない」場合の一連のステップは終了する。
一方、ST508において「上回る」場合は、ST520において、スタジオユニット40の生成部130は、特定の表情(又は所作)が形成された旨の判定結果の情報を判定部120から取得して、その特定の表情又は所作に対応する特定表現をアバターオブジェクトに反映させた第2動画を生成する。なお、この際、生成部130は、ST503における設定を参照することで、特定の表情又は所作に対応する特定表現をアバターオブジェクトに反映させることができる。
そして、ST521において、通信部170が、ST520にて生成された第2動画をサーバ装置30へと送信する。そして、サーバ装置30により送信された第2動画は、ST522において、サーバ装置30によって端末装置20へと送信される。そして、サーバ装置30により送信された第2動画を受信した端末装置20は、ST530において、当該第2動画を表示部250に表示させる。このようにして、ST508において「上回る」場合の一連のステップは終了する。
動画生成(動画配信)に関する要求(操作)がユーザインタフェイス部140を介して実行されると、図10に示される動画生成(動画配信)の一連のステップに関する処理が繰り返し実行される。つまり、例えば、演者等によって、ある1つの特定の表情又は所作が形成されたと判定されて図10に示される一連のステップ(本段落において、便宜上、最初の処理と称す)に関する処理が実行されている間に、演者等によって、別の特定の表情又は所作が形成されたと判定された場合、最初の処理に追従するように、図10に示される一連のステップに関する別の処理が実行されるので、アバターオブジェクトには、演者等によって形成された特定の表情又は所作に対応する特定表現がリアルタイムで誤動作することなく、演者等の意思に正確に反映される。
なお、図9及び図10においては、「第1の態様」を一例として以上のとおり説明したが、「第2の態様」及び「第3の態様」においても、基本的には図9及び図10と同様の一連のステップとなる。つまり、図9及び図10におけるセンサ部100~通信部170が、センサ部200~通信部270、又はセンサ部300~通信部370に置換される。
以上のとおり、様々な実施形態によれば、演者等が容易且つ正確にアバターオブジェクトに所望の表情又は動作を表現させることができる、コンピュータプログラム、サーバ装置及び方法を提供することができる。より詳細には、様々な実施形態によれば、演者等は発話しながらでも、特定の表情を形成するだけでアバターオブジェクトに特定表現(所望の表情や動作)を反映させた動画を、従来に比して誤操作や誤発動なく正確且つ容易に生成することができる。また、演者等は、端末装置20を手に把持しながら、特定の表情又は所作等を前述のとおり設定(変更)し、そのまま当該端末装置20から前述の各種の動画を配信することもできる。さらにまた、動画配信時において、演者等が把持する端末装置20は、随時、演者等の変化(顔や身体の変化)を捉えることができ、その変化に応じて、アバターオブジェクトに特定表現を反映させることもできる。
5.変形例
以上のとおり説明した実施形態においては、演者等が、ユーザインタフェイス部140を操作しつつ、自ら特定の表情又は所作を形成する態様を想定したが、これに限定されず、例えば、サポータやオペレータがユーザインタフェイス部140を操作しつつ、演者が特定の表情又は所作を形成する態様としてもよい。この場合においてサポータやオペレータは、図6乃至図8のようなユーザインタフェイス部140を確認しつつ閾値等を設定することができる。また、同時に、センサ部100が演者の動作、表情、及び発話(歌唱を含む)等を検出し、演者が特定の表情又は所作を形成した旨が判定されると、図7に示すように、ユーザインタフェイス部140に特定表現を反映したアバターオブジェクトの画像又は動画が表示される。
また、第3のユーザインタフェイス部143については、図6乃至図8を参照しつつ、前述のとおり説明したが、別の実施形態として、図11に示すようなものを用いてもよい。図11は、第3のユーザインタフェイス部143の変形例を示す図である。この場合、まず、演者等によって形成される特定の表情又は所作の各々に、図9のST500の際に、任意の管理番号を合わせて設定する。例えば、「両目を見開く」との特定の表情に対して管理番号「1」を、「両目をギュッと瞑る」との特定の表情に対して管理番号「2」を、「舌を出す」との特定の表情に対して管理番号「3」を、「口をイーとする」との特定の表情に対して管理番号「4」を、「頬を膨らます」との特定の表情に対して管理番号「5」を、「笑い顔」との特定の表情に対して管理番号「6」を、「片目を閉じる(ウィンク)」との特定の表情に対し管理番号「7」を、「驚き顔」との特定の表情に対し管理番号「8」を、「肩を震わす」との特定の所作に対し管理番号「9」を、「首をふる」との特定の所作に対し管理番号「10」を、それぞれ設定する。
次に、演者等は、第3のユーザインタフェイス部143を介して、特定表現に対応させる特定の表情又は所作を、前述の管理番号に基づいて選択することができる。例えば、図11に示すように、「両目を見開く」との特定表現に対して管理番号「1」が選択されると、特定の表情「両目を見開く」に対応して特定表現「両目を見開く」がアバターオブジェクトに反映される。また、例えば、「両目を見開く」との特定表現に対して管理番号「2」が選択されると、特定の表情「両目をギュッと瞑る」に対応して特定表現「両目を見開く」がアバターオブジェクトに反映される。さらにまた、例えば、図11に示すように、「口をイーとする」との特定表現に対して管理番号「8」が選択されると、特定の表情「驚き顔」に対応して特定表現「口をイーとする」がアバターオブジェクトに反映される。このように、各種の特定の表情又は所作を管理番号で管理することにより、演者等は、より簡便に特定の表情又は所作と特定表現との対応関係を設定又は変更することが可能となる。
なお、この場合において、特定の表情又は所作と、これに対応付けられる管理番号は、その対応関係と併せて記憶部160(記憶部260、記憶部360)に記憶される。また、図11に示される第3のユーザインタフェイス部143は、図6乃至図8とはリンクしながら別のページとして表示されてもよいし、図6乃至図8と同じページ中に表示されて、表示部150において縦方向又は横方向にスクロールすることで視認できるような構成としてもよい。
例えば、特定の表情と管理番号とが対応付けられて記憶部160に記憶される場合、判定部120は、演者等によって特定の表情又は所作が形成されたと判定すると、該当する特定の表情又は所作に対応する管理番号を出力する。生成部130は、出力された管理番号、及び予め定められた管理番号(特定の表情又は所作)と特定表現との対応関係に基づき、当該特定の表情又は所作に対応する特定表現をアバターオブジェクトに反映させた第2動画を生成してよい。
6.様々な態様について
第1の態様によるコンピュータプログラムは、「1又は複数のプロセッサに実行されることにより、センサにより取得される身体の動作に関するデータに基づいて、前記身体の複数の特定部分の各々の変化量を取得し、複数の前記特定部分の各々の変化量のうち、予め特定される少なくとも1箇所以上の前記特定部分の各々の変化量の全てが各閾値を上回る場合に、特定の表情又は所作が形成されたと判定し、判定された前記特定の表情又は所作に対応する特定表現を、演者に対応するアバターオブジェクトに対して反映させた画像又は動画を生成する、ように前記プロセッサを機能させる」ものである。
第2の態様によるコンピュータプログラムは、上記第1の態様において「前記特定表現は、特定の動作又は表情を含む」ものである。
第3の態様によるコンピュータプログラムは、上記第1の態様又は上記第2の態様において「前記身体は、前記演者の身体」である。
第4の態様によるコンピュータプログラムは、上記第1の態様から上記第3の態様のいずれかにおいて「前記プロセッサは、予め特定される少なくとも1箇所以上の前記特定部分の各々の変化量の全てが各閾値を所定時間上回る場合に、前記特定の表情又は所作が形成されたと判定する」ものである。
第5の態様によるコンピュータプログラムは、上記第1の態様から上記第4の態様のいずれかにおいて「前記プロセッサは、判定された前記特定の表情又は所作に対応する前記特定表現を、前記演者に対応するアバターオブジェクトに対して一定時間だけ反映させた画像又は動画を生成する」ものである。
第6の態様によるコンピュータプログラムは、上記第1の態様から上記第5の態様のいずれかにおいて「前記特定の表情又は所作、前記特定の表情又は所作に対応する前記特定部分、前記閾値の各々、前記特定の表情又は所作と前記特定表現との対応関係、前記所定時間、及び前記一定時間、の少なくともいずれかは、ユーザインタフェイスを介して設定又は変更される」ものである。
第7の態様によるコンピュータプログラムは、上記第6の態様において「前記閾値の各々は、前記ユーザインタフェイスを介して、前記特定部分毎に任意の値に設定又は変更される」ものである。
第8の態様によるコンピュータプログラムは、上記第6の態様において「前記閾値の各々は、前記ユーザインタフェイスを介して、前記特定部分毎に予め定められる複数の所定値のいずれかに設定又は変更される」ものである。
第9の態様によるコンピュータプログラムは、上記第6の態様において「前記ユーザインタフェイスは、前記閾値の各々を前記特定部分毎に任意の値に設定する第1のユーザインタフェイス、前記閾値の各々を前記特定部分毎に予め定められる複数の所定値のいずれかに設定する第2のユーザインタフェイス、及び前記特定の表情又は所作と前記特定表現との対応関係を設定する第3のユーザインタフェイス、の少なくともいずれか1つを含む」ものである。
第10の態様によるコンピュータプログラムは、上記第6の態様から上記第9の態様のいずれかにおいて「前記特定の表情又は所作、前記特定の表情又は所作に対応する前記特定部分、前記閾値の各々、前記特定の表情又は所作と前記特定表現との対応関係、前記所定時間、及び前記一定時間、の少なくともいずれかの設定又は変更時において、前記ユーザインタフェイスには、前記特定の表情又は所作に関する画像情報及び文字情報の少なくとも一方が含まれる」ものである。
第11の態様によるコンピュータプログラムは、上記第6の態様から上記第10の態様のいずれかにおいて「前記特定の表情又は所作、前記特定の表情又は所作に対応する前記特定部分、前記閾値の各々、前記特定の表情又は所作と前記特定表現との対応関係、前記所定時間、及び前記一定時間、の少なくともいずれかの設定又は変更時において前記特定の表情又は所作が形成されたと判定された場合、前記ユーザインタフェイスには、前記特定の表情又は所作と同一の前記特定表現を前記アバターオブジェクトに反映させた第1テスト画像又は第1テスト動画が含まれる」ものである。
第12の態様によるコンピュータプログラムは、上記第11の態様において「前記特定の表情又は所作、前記特定の表情又は所作に対応する前記特定部分、前記閾値の各々、前記特定の表情又は所作と前記特定表現との対応関係、前記所定時間、及び前記一定時間、の少なくともいずれかの設定又は変更時において前記特定の表情又は所作が形成されたと判定された場合、前記ユーザインタフェイスには、前記一定時間とは異なる特定時間にわたって、前記第1テスト画像又は前記第1テスト動画と同一の第2テスト画像又は第2テスト動画が含まれる」ものである。
第13の態様によるコンピュータプログラムは、上記第6の態様において「前記特定の表情又は所作と前記特定表現との対応関係は、前記特定の表情又は所作と前記特定表現が同一の関係、前記特定の表情又は所作と前記特定表現が類似する関係、及び前記特定の表情又は所作と前記特定表現が無関係、のいずれかである」ものである。
第14の態様によるコンピュータプログラムは、上記第6の態様から上記第13の態様のいずれかにおいて「前記特定の表情又は所作、前記特定の表情又は所作に対応する前記特定部分、前記閾値の各々、前記特定の表情又は所作と前記特定表現との対応関係、前記所定時間、及び前記一定時間、の少なくともいずれかは、前記画像又は動画の配信中に変更される」ものである。
第15の態様によるコンピュータプログラムは、上記第1の態様から上記第14の態様のいずれかにおいて「前記特定部分は、顔の一部分である」ものである。
第16の態様によるコンピュータプログラムは、上記第15の態様において「前記特定部分が、眉、目、瞼、頬、鼻、耳、唇、舌、及び顎を含む群から選択される」ものである。
第17の態様によるコンピュータプログラムは、上記第1の態様から上記第16の態様のいずれかにおいて「前記プロセッサが、中央処理装置(CPU)、マイクロプロセッサ又はグラフィックスプロセッシングユニット(GPU)である」ものである。
第18の態様によるコンピュータプログラムは、上記第1の態様から上記第17の態様のいずれかにおいて「前記プロセッサが、スマートフォン、タブレット、携帯電話若しくはパーソナルコンピュータ、又は、サーバ装置に搭載される」ものである。
第19の態様によるサーバ装置は、「プロセッサを具備し、該プロセッサが、コンピュータにより読み取り可能な命令を実行することにより、センサにより取得される身体の動作に関するデータに基づいて、前記身体の複数の特定部分の各々の変化量を取得し、複数の前記特定部分の各々の変化量のうち、予め特定される少なくとも1箇所以上の前記特定部分の各々の変化量の全てが各閾値を上回る場合に、特定の表情又は所作が形成されたと判定し、判定された前記特定の表情又は所作に対応する特定表現を、演者に対応するアバターオブジェクトに対して反映させた画像又は動画を生成する」ものである。
第20の態様によるサーバ装置は、上記第19の態様において「前記プロセッサが、中央処理装置(CPU)、マイクロプロセッサ又はグラフィックスプロセッシングユニット(GPU)である」ものである。
第21の態様によるサーバ装置は、上記第19の態様又は上記第20の態様において「スタジオに配置される」ものである。
第22の態様による方法は、「コンピュータにより読み取り可能な命令を実行する一又は複数のプロセッサにより実行される方法であって、センサにより取得される身体の動作に関するデータに基づいて、前記身体の複数の特定部分の各々の変化量を取得する変化量取得工程と、複数の前記特定部分の各々の変化量のうち、予め特定される少なくとも1箇所以上の前記特定部分の各々の変化量の全てが各閾値を上回る場合に、特定の表情又は所作が形成されたと判定する判定工程と、前記判定工程によって判定された前記特定の表情又は所作に対応する特定表現を、演者に対応するアバターオブジェクトに対して反映させた画像又は動画を生成する生成工程と、を含む」ものである。
第23の態様による方法は、上記第22の態様において「前記変化量取得工程、前記判定工程、及び前記生成工程は、スマートフォン、タブレット、携帯電話及びパーソナルコンピュータを含む群から選択される端末装置に搭載された前記プロセッサにより実行される」ものである。
第24の態様による方法は、上記第22の態様において「前記変化量取得工程、前記判定工程、及び前記生成工程は、サーバ装置に搭載された前記プロセッサにより実行される」ものである。
第25の態様による方法は、上記第22の態様から上記第24の態様のいずれかにおいて「前記プロセッサが、中央処理装置(CPU)、マイクロプロセッサ又はグラフィックスプロセッシングユニット(GPU)である」ものである。
第26の態様によるシステムは、「第1のプロセッサを含む第1の装置と、第2のプロセッサを含み該第1の装置に通信回線を介して接続可能な第2の装置と、を具備するシステムであって、センサにより取得される身体の動作関するデータに基づいて、前記身体の複数の特定部分の各々の変化量を取得する、変化量取得処理、複数の前記特定部分の各々の変化量のうち、予め特定される少なくとも1箇所以上の前記特定部分の各々の変化量の全てが各閾値を上回る場合に、特定の表情又は所作が形成されたと判定する、判定処理、前記判定処理によって判定された前記特定の表情又は所作に対応する特定表現を、演者に対応するアバターオブジェクト対して反映させた画像又は動画を生成する、生成処理、のうち、前記第1の装置に含まれた前記第1のプロセッサが、コンピュータにより読み取り可能な命令を実行することにより、前記変化量取得処理、前記判定処理、及び前記生成処理のうちの少なくとも1つの処理を実行し、前記第1のプロセッサにより実行されていない残りの処理が存在する場合には、前記第2の装置に含まれた前記第2のプロセッサが、コンピュータにより読み取り可能な命令を実行することにより、前記残りの処理を実行する」ものである。
第27の態様によるシステムは、上記第26の態様において「前記プロセッサが、中央処理装置(CPU)、マイクロプロセッサ又はグラフィックスプロセッシングユニット(GPU)である」ものである。
第28の態様によるシステムは、上記第26の態様又は上記第27の態様において「前記通信回線がインターネットを含む」ものである。
第29の態様による端末装置は、「センサにより取得される身体の動作に関するデータに基づいて、前記身体の複数の特定部分の各々の変化量を取得し、複数の前記特定部分の各々の変化量のうち、予め特定される少なくとも1箇所以上の前記特定部分の各々の変化量の全てが各閾値を上回る場合に、特定の表情又は所作が形成されたと判定し、判定された前記特定の表情又は所作に対応する特定表現を、演者に対応するアバターオブジェクトに対して反映させた画像又は動画を生成する」ものである。
第30の態様による端末装置は、上記第29の態様において、「前記プロセッサが、中央処理装置(CPU)、マイクロプロセッサ又はグラフィックスプロセッシングユニット(GPU)である」ものである。
7.本件出願に開示された技術が適用される分野
本件出願に開示された技術は、例えば、次のような分野において適用することが可能なものである。
(1)アバターオブジェクトが登場するライブ動画を配信するアプリケーション・サービス
(2)文字及びアバターオブジェクトを用いてコミュニケーションすることができるアプリケーション・サービス(チャットアプリケーション、メッセンジャー、メールアプリケーション等)
1 通信システム
10 通信網
20(20A~20C) 端末装置
30(30A~30C) サーバ装置
40(40A、40B) スタジオユニット
100(200、300) センサ部
110(210、310) 変化量取得部
120(220、320) 判定部
130(230、330) 生成部
140(240、340) ユーザインタフェイス部
141 第1のユーザインタフェイス部
142 第2のユーザインタフェイス部
143 第3のユーザインタフェイス部
144 画像情報
145 文字情報
147 第1テスト画像(第1テスト動画)
148 第2テスト画像(第2テスト動画)
150(250、350) 表示部
160(260、360) 記憶部
170(270、370) 通信部

Claims (1)

  1. 1又は複数のプロセッサに実行されることにより、
    センサにより取得される身体の動作に関するデータに基づいて、前記身体の複数の特定部分の各々の変化量を取得し、
    複数の前記特定部分の各々の変化量のうち、予め特定される少なくとも1箇所以上の前記特定部分の各々の変化量の全てが各閾値を上回る場合に、特定の表情又は所作が形成されたと判定し、
    判定された前記特定の表情又は所作に対応する特定表現を、演者に対応するアバターオブジェクトに対して反映させた画像又は動画を生成する、
    ように前記プロセッサを機能させる、コンピュータプログラム。
JP2022084302A 2019-12-27 2022-05-24 コンピュータプログラム、サーバ装置及び方法 Active JP7408068B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2022084302A JP7408068B2 (ja) 2019-12-27 2022-05-24 コンピュータプログラム、サーバ装置及び方法
JP2023214338A JP2024029036A (ja) 2019-12-27 2023-12-20 コンピュータプログラム、サーバ装置及び方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019239318A JP7080212B2 (ja) 2019-12-27 2019-12-27 コンピュータプログラム、サーバ装置及び方法
JP2022084302A JP7408068B2 (ja) 2019-12-27 2022-05-24 コンピュータプログラム、サーバ装置及び方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2019239318A Division JP7080212B2 (ja) 2019-12-27 2019-12-27 コンピュータプログラム、サーバ装置及び方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023214338A Division JP2024029036A (ja) 2019-12-27 2023-12-20 コンピュータプログラム、サーバ装置及び方法

Publications (2)

Publication Number Publication Date
JP2022111142A true JP2022111142A (ja) 2022-07-29
JP7408068B2 JP7408068B2 (ja) 2024-01-05

Family

ID=76546270

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2019239318A Active JP7080212B2 (ja) 2019-12-27 2019-12-27 コンピュータプログラム、サーバ装置及び方法
JP2022084302A Active JP7408068B2 (ja) 2019-12-27 2022-05-24 コンピュータプログラム、サーバ装置及び方法
JP2023214338A Pending JP2024029036A (ja) 2019-12-27 2023-12-20 コンピュータプログラム、サーバ装置及び方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2019239318A Active JP7080212B2 (ja) 2019-12-27 2019-12-27 コンピュータプログラム、サーバ装置及び方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2023214338A Pending JP2024029036A (ja) 2019-12-27 2023-12-20 コンピュータプログラム、サーバ装置及び方法

Country Status (2)

Country Link
US (1) US20210201002A1 (ja)
JP (3) JP7080212B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018203555A1 (ja) * 2017-05-02 2018-11-08 日本電信電話株式会社 信号検索装置、方法、及びプログラム
US10984575B2 (en) 2019-02-06 2021-04-20 Snap Inc. Body pose estimation
US11615592B2 (en) 2020-10-27 2023-03-28 Snap Inc. Side-by-side character animation from realtime 3D body motion capture
US11660022B2 (en) 2020-10-27 2023-05-30 Snap Inc. Adaptive skeletal joint smoothing
US11450051B2 (en) * 2020-11-18 2022-09-20 Snap Inc. Personalized avatar real-time motion capture
US11734894B2 (en) 2020-11-18 2023-08-22 Snap Inc. Real-time motion transfer for prosthetic limbs
US11748931B2 (en) 2020-11-18 2023-09-05 Snap Inc. Body animation sharing and remixing
WO2024085084A1 (ja) * 2022-10-21 2024-04-25 株式会社Nttドコモ アバター制御装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005323340A (ja) * 2004-04-07 2005-11-17 Matsushita Electric Ind Co Ltd 通信端末及び通信方法
JP2009207119A (ja) * 2007-12-28 2009-09-10 Casio Comput Co Ltd 撮像装置及びプログラム
JP2010117948A (ja) * 2008-11-13 2010-05-27 Canon Inc 表情判定装置、その制御方法、撮像装置及びプログラム
JP2012181704A (ja) * 2011-03-01 2012-09-20 Sony Computer Entertainment Inc 情報処理装置および情報処理方法
JP2013009073A (ja) * 2011-06-23 2013-01-10 Sony Corp 情報処理装置、情報処理方法、プログラム、及びサーバ

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002315966A (ja) * 2001-04-20 2002-10-29 Square Co Ltd ビデオゲーム装置およびその制御方法、ならびにビデオゲームのプログラムおよびそのプログラムを記録したコンピュータ読取り可能な記録媒体。
JP2006202188A (ja) * 2005-01-24 2006-08-03 Oki Electric Ind Co Ltd 画像合成装置およびそのパターン確認方法
JP2010081562A (ja) * 2008-09-29 2010-04-08 Fujifilm Corp 撮像装置、方法およびプログラム
JP2012100063A (ja) * 2010-11-02 2012-05-24 Canon Inc 撮像装置
JP2013020365A (ja) * 2011-07-08 2013-01-31 Namco Bandai Games Inc ゲームシステム、プログラム、及び情報記憶媒体
US9350951B1 (en) * 2011-11-22 2016-05-24 Scott Dallas Rowe Method for interactive training and analysis
US10789753B2 (en) * 2018-04-23 2020-09-29 Magic Leap, Inc. Avatar facial expression representation in multidimensional space

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005323340A (ja) * 2004-04-07 2005-11-17 Matsushita Electric Ind Co Ltd 通信端末及び通信方法
JP2009207119A (ja) * 2007-12-28 2009-09-10 Casio Comput Co Ltd 撮像装置及びプログラム
JP2010117948A (ja) * 2008-11-13 2010-05-27 Canon Inc 表情判定装置、その制御方法、撮像装置及びプログラム
JP2012181704A (ja) * 2011-03-01 2012-09-20 Sony Computer Entertainment Inc 情報処理装置および情報処理方法
JP2013009073A (ja) * 2011-06-23 2013-01-10 Sony Corp 情報処理装置、情報処理方法、プログラム、及びサーバ

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"生放送で大活躍させるためのアバター技術", ONLINE, JPN6023026962, ISSN: 0005099644 *

Also Published As

Publication number Publication date
US20210201002A1 (en) 2021-07-01
JP2024029036A (ja) 2024-03-05
JP2021108030A (ja) 2021-07-29
JP7408068B2 (ja) 2024-01-05
JP7080212B2 (ja) 2022-06-03

Similar Documents

Publication Publication Date Title
JP7408068B2 (ja) コンピュータプログラム、サーバ装置及び方法
JP5859456B2 (ja) プレゼンテーション用カメラ・ナビゲーション
US11816256B2 (en) Interpreting commands in extended reality environments based on distances from physical input devices
CN110456907A (zh) 虚拟画面的控制方法、装置、终端设备及存储介质
US11288854B2 (en) Information processing apparatus and information processing method
BR112012000391B1 (pt) método, meio legível por computador para executar o método e sistema para aplicar atributos inidcativos de um temperamento do usuário a uma representação visual
KR20120005587A (ko) 컴퓨터 시스템에서 얼굴 애니메이션 생성 방법 및 장치
CN115917474A (zh) 在三维环境中呈现化身
JP2023103335A (ja) コンピュータプログラム、サーバ装置、端末装置及び表示方法
JP2024040211A (ja) 動画処理方法、サーバ装置及びコンピュータプログラム
JP2024028853A (ja) 動画処理方法、サーバ装置及びコンピュータプログラム
JP6691631B1 (ja) 動画処理方法、サーバ装置及びコンピュータプログラム
JP7418709B2 (ja) コンピュータプログラム、方法及びサーバ装置
JP2021174283A (ja) コンピュータプログラム、サーバ装置、端末装置、及び方法
Yang et al. Bimanual natural user interaction for 3D modelling application using stereo computer vision
JP2021170168A (ja) コンピュータプログラム、サーバ装置、端末装置、及び方法
JP2021071942A (ja) 動画処理方法、サーバ装置及びコンピュータプログラム
US20240029329A1 (en) Mitigation of Animation Disruption in Artificial Reality
WO2020235346A1 (ja) コンピュータプログラム、サーバ装置、端末装置、システム及び方法
Malerczyk Dynamic Gestural Interaction with Immersive Environments

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220524

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220524

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230525

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230704

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230821

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231121

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231211

R150 Certificate of patent or registration of utility model

Ref document number: 7408068

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150