WO2021131772A1

WO2021131772A1 - 情報処理装置及び情報処理方法

Info

Publication number: WO2021131772A1
Application number: PCT/JP2020/046214
Authority: WO
Inventors: 祐平滝; 惇一清水
Original assignee: ソニーグループ株式会社
Priority date: 2019-12-24
Filing date: 2020-12-11
Publication date: 2021-07-01
Also published as: US20230012053A1

Abstract

本開示に係る情報処理装置は、身体動作を行うユーザの外形を示す外形情報を取得する取得部と、前記取得部により取得された前記外形情報に基づいて、身体部位のうち、前記身体動作に対応する主部位と、前記身体動作に対応する動き情報の補正処理の対象となる関連部位とを特定する特定部と、を備える。

Description

情報処理装置及び情報処理方法

　本開示は、情報処理装置及び情報処理方法に関する。

　近年、ユーザの身体動作（ジェスチャ）に関する情報を用いて各種の処理を行う技術が知られている。例えば、ユーザの身体動作を機器の機能実行の指示（機器の操作）として用いる技術が知られている（例えば特許文献１）。また、ユーザの身体動作に対応する動作を行う仮想キャラクタを含むコンテンツを生成する技術が知られている（例えば特許文献２）。

国際公開第２０１６／１６７３３１号特表２０１６－５１７５５７号公報

　従来技術によれば、ユーザの身体動作により、機器の機能が実行されたり、仮想キャラクタを含むコンテンツを生成されたりする。

　しかしながら、従来技術では、ユーザの身体動作に関する部位を適切に特定することができるとは限らない。例えば、従来技術では、ユーザの身体動作についてユーザが動作を意図した主部位であるか等、各部位を区別することなく、ユーザの身体部位の動き情報を用いている。これにより、従来技術の場合、ユーザが意図しない身体部位の位置変化をユーザの機器操作と認識してしまったり、仮想キャラクタの動きが不十分になったりしてしまう可能性がある。そのため、ユーザの身体動作に関する部位を適切に特定することが望まれている。

　そこで、本開示では、ユーザの身体動作に関する部位を適切に特定することができる情報処理装置及び情報処理方法を提案する。

　上記の課題を解決するために、本開示に係る一形態の情報処理装置は、身体動作を行うユーザの外形を示す外形情報を取得する取得部と、前記取得部により取得された前記外形情報に基づいて、身体部位のうち、前記身体動作に対応する主部位と、前記身体動作に対応する動き情報の補正処理の対象となる関連部位とを特定する特定部と、を備える。

本開示の第１の実施形態に係る情報処理の一例を示す図である。本開示の第１の実施形態に係る情報処理システムの構成例を示す図である。本開示の第１の実施形態に係る情報処理装置の構成例を示す図である。本開示の第１の実施形態に係る動作情報記憶部の一例を示す図である。本開示の第１の実施形態に係る部位情報記憶部の一例を示す図である。本開示の第１の実施形態に係る端末装置の構成例を示す図である。本開示の第１の実施形態に係る情報処理装置の処理手順を示すフローチャートである。本開示の第１の実施形態に係る情報処理システムの処理手順を示すシーケンス図である。発話を用いた部位特定の一例を示す図である。本開示の第２の実施形態に係る情報処理の一例を示す図である。本開示の第２の実施形態に係る情報処理装置の構成例を示す図である。発話を用いた部位特定の一例を示す図である。属性に応じた情報利用の一例を示す図である。動作編集の一例を示す図である。情報処理装置や情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。

　以下に、本開示の実施形態について図面に基づいて詳細に説明する。なお、この実施形態により本願にかかる情報処理装置及び情報処理方法が限定されるものではない。また、以下の各実施形態において、同一の部位には同一の符号を付することにより重複する説明を省略する。

　以下に示す項目順序に従って本開示を説明する。
　　１．第１の実施形態
　　　１－１．本開示の第１の実施形態に係る情報処理の概要
　　　　１－１－１．背景及び効果等
　　　　１－１－２．応用例
　　　１－２．第１の実施形態に係る情報処理システムの構成
　　　１－３．第１の実施形態に係る情報処理装置の構成
　　　１－４．第１の実施形態に係る端末装置の構成
　　　１－５．第１の実施形態に係る情報処理の手順
　　　　１－５－１．情報処理装置に係る処理の手順
　　　　１－５－２．情報処理システムに係る処理の手順
　　　１－６．発話を用いた部位特定例
　　２．第２の実施形態
　　　２－１．第２の実施形態に係る情報処理の概要
　　　　２－１－１．背景及び効果等
　　　２－２．第２の実施形態に係る情報処理装置の構成
　　　２－３．発話を用いた部位特定例
　　　２－４．属性に応じた情報利用例
　　　２－５．動作編集例
　　３．その他の実施形態
　　　３－１．その他の構成例
　　　３－２．その他
　　４．本開示に係る効果
　　５．ハードウェア構成

［１．第１の実施形態］
［１－１．本開示の第１の実施形態に係る情報処理の概要］
　図１は、本開示の第１の実施形態に係る情報処理の一例を示す図である。本開示の第１の実施形態に係る情報処理は、図１に示す情報処理装置１００や端末装置１０を含む情報処理システム１（図２参照）によって実現される。

　情報処理装置１００は、第１の実施形態に係る情報処理を実行する情報処理装置である。情報処理装置１００は、身体動作を行うユーザの外形を示す外形情報に基づいて、ユーザの身体動作に対応する部位を特定する。図１の例では、ユーザが利用する端末装置１０の画像センサ１７１（図６参照）により検知されたセンサ情報（画像情報）を外見情報として用いる場合を示す。なお、ユーザの外形を示す外形情報を検知するセンサは、画像センサ１７１に限らず、ユーザの外形情報を検知可能であれば、どのようなセンサであってもよい。例えば、ユーザの外形を示す外形情報を検知するセンサは、光学式の測距センサや超音波等を用いた音波センサ等であってもよい。例えば、ユーザの外形を示す外形情報を検知するセンサは、ＬｉＤＡＲ（Light　Detection　and　Ranging、Laser　Imaging　Detection　and　Ranging）やＴｏＦ（Time　of　Flight）センサ等であってもよい。また、ユーザの外形を示す外形情報を検知するセンサは、サーマルセンサ等の熱を検知するセンサであってもよい。このように、ユーザの外形を示す外形情報を検知可能であれば、情報処理システム１は、どのようなセンサを用いて外形情報を検知してもよい。

　以下、図１について具体的に説明する。以下では、端末装置１０を利用するユーザＵ１が身体動作を行うことにより、端末装置１０に入力を行っている場合を一例として説明する。まず、図１の例では、端末装置１０は、画像センサ１７１によりユーザＵ１を撮像した画像情報を検知する（ステップＳ１）。そして、端末装置１０は、検知した画像情報を外形情報として、情報処理装置１００に送信する（ステップＳ２）。例えば、端末装置１０は、連続して撮像した複数の画像情報を含む動画情報を外形情報として、情報処理装置１００に送信する。例えば、端末装置１０は、複数のフレームからなる動画情報を外形情報として、情報処理装置１００に送信する。

　これにより、情報処理装置１００は、複数のフレームからなる動画情報を外形情報として取得する。情報処理装置１００は、ユーザＵ１の身体動作を示す外形情報を取得する。図１の例では、情報処理装置１００は、状態ＳＴ１に対応する画像情報や状態ＳＴ２に対応する画像情報等の複数の画像情報を外形情報として取得する。なお、情報処理装置１００は、状態ＳＴ１から状態ＳＴ２の間におけるユーザの身体動作に対応する動き情報を生成してもよいし、外部の情報処理装置から状態ＳＴ１から状態ＳＴ２の間におけるユーザの身体動作に対応する動き情報を取得してもよい。

　外形情報を取得した情報処理装置１００は、外形情報を用いてユーザＵ１の身体動作に対応する部位を特定する処理を行う。まず、情報処理装置１００は、ユーザＵ１の身体動作に対応する部位（以下「主部位」ともいう）を特定する（ステップＳ３）。情報処理装置１００は、状態ＳＴ１から状態ＳＴ２の間におけるユーザＵ１の身体動作において、変化量の多い部位を主部位として特定する。図１の例では、情報処理装置１００は、ユーザＵ１の身体部位のうち、状態ＳＴ１から状態ＳＴ２の間で変化量の多い部位である頭部ＨＤを主部位Ｍ１に特定する。例えば、情報処理装置１００は、状態ＳＴ１に対応する第１フレーム（第１画像情報）と、状態ＳＴ２に対応する第２フレーム（第２画像情報）との差分を抽出し、変化量の多い部位である頭部ＨＤを主部位Ｍ１に特定する。

　また、情報処理装置１００は、状態ＳＴ１から状態ＳＴ２の間におけるユーザＵ１の動作種別を特定する（ステップＳ４）。情報処理装置１００は、状態ＳＴ１から状態ＳＴ２の間における主部位Ｍ１である頭部ＨＤの動作に基づいて、ユーザＵ１の動作種別を特定する。図１の例では、情報処理装置１００は、状態ＳＴ１から状態ＳＴ２の間でユーザＵ１が頭を傾ける（回転させる）動作を行っているため、動作種別を「ＲＯＴＡＴＥ」に特定する。

　そして、情報処理装置１００は、身体動作に対応する動き情報の補正処理の対象となる部位（以下「関連部位」ともいう）を特定する（ステップＳ５）。情報処理装置１００は、状態ＳＴ１から状態ＳＴ２の間における主部位Ｍ１である頭部ＨＤと、動作種別「ＲＯＴＡＴＥ」とに基づいて、関連部位を特定する。例えば、情報処理装置１００は、主部位と関連部位との対応付けを示す定義情報を用いて、関連部位を特定する。例えば、情報処理装置１００は、各身体部位と連動した動きが起こりうる部位のデータ定義情報（主部位・関連部位情報）を用いて、関連部位を特定する。例えば、情報処理装置１００は、部位情報記憶部１２３（図５参照）に記憶された定義情報を用いて、関連部位を特定する。このように、情報処理装置１００は、対応する関連部位データを取得し、取得した情報を用いて関連部位を特定する。

　図１の例では、情報処理装置１００は、定義情報のうち、主部位が頭部を示す「ＨＥＡＤ」であり、動作種別が「ＲＯＴＡＴＥ」である組合せと関連部位とが対応付けられた対応付情報ＩＮＦ１を用いて、関連部位を特定する。これにより、情報処理装置１００は、ユーザＵ１の右手ＲＷ及び左手ＬＷを、ユーザＵ１の頭部を回転させる動作に対応する関連部位として特定する。

　情報処理装置１００は、主部位Ｍ１である頭部ＨＤ以外のユーザＵ１の胴体ＢＤ、右手ＲＷ、左手ＬＷ、右足ＲＬ、及び左足ＬＬの５個の身体部位のうち、ユーザＵ１の右手ＲＷ及び左手ＬＷを関連部位に特定する。なお、図１の身体部位は説明を簡単にするために、６つの部位のみを示すが、ユーザの身体部位はより詳細に分割されてもよい。このように、図１の例では、情報処理装置１００は、右手ＲＷを関連部位Ｒ１として特定し、左手ＬＷを関連部位Ｒ２として特定する。

　そして、情報処理装置１００は、動作を補正する処理を行う（ステップＳ６）。情報処理装置１００は、関連部位の動作をキャンセルする補正を行う。図１の例では、情報処理装置１００は、関連部位Ｒ１である右手ＲＷの動作をキャンセルする補正を行う。すなわち、情報処理装置１００は、状態ＳＴ２の右手ＲＷの位置を状態ＳＴ１の右手ＲＷの位置に戻す補正を行う。これにより、情報処理装置１００は、補正前の状態ＳＴ２を補正後の状態ＳＴ３のように右手ＲＷの位置が状態ＳＴ１の位置に戻され、頭部ＨＤのみが傾いた状態に補正する。なお、関連部位Ｒ２である左手ＬＷについては、状態ＳＴ１から状態ＳＴ２の間で位置の変化が無かったため、左手ＬＷについては補正を行なわれないが、左手ＬＷに位置の変化がある場合、左手ＬＷの動作もキャンセルしてもよい。そして、情報処理装置１００は、状態ＳＴ３に対応する動き情報を用いて、ユーザの身体動作による入力の意図を推定する。例えば、情報処理装置１００は、状態ＳＴ３に対応する動き情報を検出器等に入力することで、ユーザの身体動作による入力の意図を特定する。

　このように、情報処理装置１００は、外形情報を基にユーザに身体動作に対応する主部位を特定し、特定した主部位や動作種別を基に関連部位を特定する。これにより、情報処理装置１００は、ユーザの入力意図に対応する部位である主部位や、主部位の動作に伴って動作が生じる関連部位を特定することができる。したがって、情報処理装置１００は、ユーザの身体動作に関する部位を適切に特定することができる。ここで、人間は頭を傾ける（首かしげ）時に、傾けた方向と反対側の手の移動が無意識に発生する。このような、手の動きに対しての機能が存在する場合誤発動につながる場合がある。そのため、情報処理装置１００は、ユーザが頭を傾ける場合に関連部位としてユーザの手を特定することにより、その手の動きを補正することで、手の動きに対しての機能が存在する場合の誤発動を抑制することができる。

　そして、情報処理装置１００は、事前定義データでの動作キャンセルすることで、ユーザの骨格等に依存して発生するユーザの身体動作の影響を抑制することができる。情報処理装置１００は、補正後の状態ＳＴ３のように主部位Ｍ１である頭部ＨＤ以外の部位の動作がキャンセルされた動き情報を用いることで、ユーザの身体動作による入力をより精度よく認識することが可能となる。なお、情報処理装置１００は、関連部位の動きをキャンセルする場合に限らず、関連部位の動きを軽減する補正を行ってもよい。また、情報処理装置１００は、関連部位の動きを強調する補正を行ってもよいが、この点についての詳細は後述する。

［１－１－１．背景及び効果等］
　従来、ユーザの身体動作を利用するインターフェイスはジェスチャコマンド等の限定的な利用であったが、近年は詳細な身体動作がセンシング可能になり、これらの動作情報を応用したインタラクションが拡大する。

　そして、上述のように、ユーザが意図して特定の身体部位を動かす場合であっても、身体特性などにより、意図して動作させている以外の部位が無意識的に動いてしまう場合がある。こういったユーザの「無意識の動き」はシステム側にとっては誤認識の原因になる。

　一方で、情報処理装置１００は、ユーザの動作から無意識的に動いている身体部位を特定し、その動きをキャンセルすることでユーザの実際の動作意図のみを残す。これにより、情報処理装置１００は、ユーザの身体動作に関する部位を適切に特定することができる。

［１－１－２．応用例］
　情報処理装置１００は、種々のサービスや処理等に応用されてもよい。この点について以下、例示を記載する。なお、以下に記載する応用は例示に過ぎす、適用可能であれば、どのようなサービスや処理に応用されてもよい。

　情報処理装置１００は、図１で説明した場合に限らず、身体動作を使った須臾の機器コントロールに応用されてもよい。例えば、情報処理装置１００は、ＴＶやスマートスピーカやスマートフォン等により提供されるサービスに適用されてもよい。例えば、情報処理装置１００は、カメラ付きのスマートスピーカを用いたサービスに応用されてもよい。

　また、情報処理装置１００は、コンピュータグラフィックスや（仮想）キャラクタ（アバター）を用いて動画投稿や動画配信を行うサービスに応用されてもよい。この場合、例えば動きデータをそのまま利用するのではなく、意図する身体部位だけの動きにしたり、アバターのキャラクタ（属性）により補正の方法を変えたりすることでキャラクタの特性を表現することができる。例えば、アバターの性別や年齢などのキャラクタ（属性）により補正の方法を変えたりすることでキャラクタの特性を表現することができる。なお、この点については図１０以降に詳述する。

　また、情報処理装置１００は、スポーツなどの練習やイメージ作りに応用されてもよい。この場合、スポーツ等のプロ（選手）やある技術の熟練者等のユーザ（「模範ユーザ」ともいう）の動きなどから得られた抑制情報を利用して、ユーザの理想的な動きの状態を可視化することで練習やイメージ作りの促進に適用されてもよい。情報処理装置１００は、模範ユーザの動き情報から生成した情報を抑制情報として用いてもよい。例えば、情報処理装置１００は、模範ユーザの動きに基づく主部位と関連部位とを対応付けた定義情報を抑制情報として用いてもよい。例えば、情報処理装置１００は、抑制情報に基づいて、模範ユーザ以外のユーザ（「通常ユーザ」ともいう）の動きを補正してもよい。これにより、情報処理装置１００は、模範ユーザの動きを基に、通常ユーザの動きを適切な動きに補正することができる。また、情報処理装置１００は、模範ユーザの動きを基に補正した通常ユーザの動きを示す情報（「補正動作情報」ともいう）を、通常ユーザに提供してもよい。情報処理装置１００は、補正動作情報を、通常ユーザが利用する端末装置１０に送信してもよい。端末装置１０は、補正動作情報を表示して、通常ユーザに適切な動きを認識させる。これにより、情報処理システム１は、通常ユーザに模範ユーザの動きを反映した動きを把握させることができるため、通常ユーザのスキルアップや技術向上等を促進することができる。

［１－２．第１の実施形態に係る情報処理システムの構成］
　図２に示す情報処理システム１について説明する。図２に示すように、情報処理システム１は、端末装置１０と、情報処理装置１００とが含まれる。端末装置１０と、情報処理装置１００とは所定の通信網（ネットワークＮ）を介して、有線または無線により通信可能に接続される。図２は、第１の実施形態に係る情報処理システムの構成例を示す図である。なお、図２に示した情報処理システム１には、複数台の端末装置１０や、複数台の情報処理装置１００が含まれてもよい。

　情報処理装置１００は、身体動作を行うユーザの外形を示す外形情報に基づいて、身体部位のうち、身体動作に対応する主部位と、身体動作に対応する動き情報の補正処理の対象となる関連部位とを特定するコンピュータである。また、情報処理装置１００は、各種情報を端末装置１０に送信するコンピュータである。情報処理装置１００は、各種機能に関するサービスを提供するために用いられるサーバ装置である。

　また、情報処理装置１００は、音声信号処理や音声認識や発話意味解析や対話制御等のソフトウェアモジュールを有してもよい。情報処理装置１００は、音声認識の機能を有してもよい。例えば、情報処理装置１００は、自然言語理解（ＮＬＵ：Ｎａｔｕｒａｌ　Ｌａｎｇｕａｇｅ　Ｕｎｄｅｒｓｔａｎｄｉｎｇ）や自動音声認識（ＡＳＲ：Ａｕｔｏｍａｔｉｃ　Ｓｐｅｅｃｈ　Ｒｅｃｏｇｎｉｔｉｏｎ）の機能を有してもよい。例えば、情報処理装置１００は、ユーザの発話による入力情報からユーザのインテント（意図）やエンティティ（対象）に関する情報を推定してもよい。

　また、情報処理装置１００は、音声認識サービスを提供する音声認識サーバから情報を取得可能であってもよい。この場合、情報処理システム１は、音声認識サーバが含まれてもよい。例えば、情報処理装置１００や音声認識サーバが、種々の従来技術を適宜用いてユーザの発話を認識したり、発話したユーザを特定したりする。

　端末装置１０は、センサにより身体動作を行うユーザの外形を示す外形情報を検知する端末装置である。例えば、端末装置１０は、画像センサ１７１により身体動作を行うユーザの外形を示す画像情報を検知する。端末装置１０は、ユーザの外形情報を情報処理装置１００等のサーバ装置へ送信する情報処理装置である。

　端末装置１０は、ユーザによって利用されるデバイス装置である。端末装置１０は、ユーザによる入力を受け付ける。端末装置１０は、ユーザの発話による音声入力や、ユーザの操作による入力を受け付ける。端末装置１０は、ユーザの入力に応じた情報を表示する。端末装置１０は、第１の実施形態における処理を実現可能であれば、どのような装置であってもよい。端末装置１０は、ユーザの外形情報を検知し、情報処理装置１００へ送信する機能を有する構成であれば、どのような装置であってもよい。例えば、端末装置１０は、テレビや、スマートフォンや、タブレット型端末や、ノート型ＰＣ（Personal　Computer）や、デスクトップＰＣや、携帯電話機や、ＰＤＡ（Personal　Digital　Assistant）等の装置であってもよい。

［１－３．第１の実施形態に係る情報処理装置の構成］
　次に、第１の実施形態に係る情報処理を実行する情報処理装置の一例である情報処理装置１００の構成について説明する。図３は、本開示の第１の実施形態に係る情報処理装置１００の構成例を示す図である。

　図３に示すように、情報処理装置１００は、通信部１１０と、記憶部１２０と、制御部１３０とを有する。なお、情報処理装置１００は、情報処理装置１００の管理者等から各種操作を受け付ける入力部（例えば、キーボードやマウス等）や、各種情報を表示するための表示部（例えば、液晶ディスプレイ等）を有してもよい。

　通信部１１０は、例えば、ＮＩＣ（Network　Interface　Card）等によって実現される。そして、通信部１１０は、ネットワークＮ（図２参照）と有線または無線で接続され、端末装置１０や音声認識サーバ等の他の情報処理装置との間で情報の送受信を行う。また、通信部１１０は、ユーザが利用するユーザ端末（図示省略）との間で情報の送受信を行ってもよい。

　記憶部１２０は、例えば、ＲＡＭ（Random　Access　Memory）、フラッシュメモリ（Flash　Memory）等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。第１の実施形態に係る記憶部１２０は、図３に示すように、動作情報記憶部１２１と、ユーザ情報記憶部１２２と、部位情報記憶部１２３と、機能情報記憶部１２４とを有する。

　第１の実施形態に係る動作情報記憶部１２１は、ユーザの身体動作に関する各種情報を記憶する。動作情報記憶部１２１は、ユーザの属性情報やユーザの身体動作に対応する動き情報等の各種情報を記憶する。データＤＴ１に示すデータは、動きデータ（動作情報）の構造を示す。図４の例では、データＤＴ１～ＤＴ３のみを図示するが、データＤＴ１～ＤＴ３に限らず、多数のデータが含まれる。なお、図４の例では、「属性情報」に示すように、ユーザが動作させる仮想キャラクタ（以下「アバター」ともいう）の属性情報が含まれる場合を一例として示すが、ユーザの身体動作を単に入力として用いる場合、仮想キャラクタの属性情報は含まれなくてもよい。なお、ユーザの身体動作を仮想キャラクタの動作に用いる場合、動作情報記憶部１２１には、仮想キャラクタの属性情報に含まれるが、この点については後述する。

　図４に示す「ユーザ属性情報」は、この動きデータが適応されるユーザの属性情報を示す。図４のデータＤＴ１中の「ユーザ属性情報」は、５０代男性の体型が「ＴＹＰＥ４」であるユーザの属性情報を示す。例えば、図４のデータＤＴ１中の「ユーザ属性情報」の情報は、図１に示すユーザＵ１の属性情報に対応する。データＤＴ１は、５０代男性の体型が「ＴＹＰＥ４」であるユーザの身体動作により生成されたデータ（動作情報）であることを示す。

　図４に示す「動き情報」は、主部位別の動き種類と補正を行う係数の配列を含む。「動き情報」中の発話時Ｉｎｔｅｎｔは発話から主部位などを特定する場合に利用される。各係数は定数としてユーザの各部位の動き量に作用させても良いし、主部位の動き量に比例して各係数を考慮した値などを使っても良い。

　また、例えば、係数は、「－１」～「１」の間で設定される。例えば、係数が「０」の場合、動きを補正しないことを示す。また、例えば、係数が「０」未満の場合、動きを軽減する補正を行うことを示す。例えば、係数が「－１」の場合、動きをキャンセルすることを示す。例えば、係数が「０」より大きい場合、動きを強調する補正を行うことを示す。

　図４のデータＤＴ１中の「動き情報」は、一群の動き情報を含む。例えば、図４のデータＤＴ１中の「動き情報」は、時系列で並べられた一群の動き情報を含む。例えば、図４のデータＤＴ１中の「動き情報」のうち、最初の動き情報は、ユーザの身体部位のうち、主部位である頭を回転させる動作が行われる場合、その関連部位は左手と右手であることを示す。また、関連部位別係数が、左手の回転が「－０．５」であり、右手の回転が「－０．２」であることを示す。この場合、ユーザの身体部位に対応する動き情報に対して、左手の回転が「－０．５」だけ補正され、右手の回転が「－０．２」だけ補正されたことを示す。

　また、発話意図が「ＣＨＥＥＲ＿ＵＰ」であり、対応する動作が元気を出すことを意図したものであることを示す。なお、動き情報に発話意図は含まれなくてもよい。また、図４の例では、一群の動き情報を配列の形式で記憶する場合を示すが、配列に限らず、例えば各動き情報の前後関係が特定できればどのような形式であってもよい。

　なお、動作情報記憶部１２１は、上記に限らず、目的に応じて種々の情報を記憶してもよい。

　第１の実施形態に係るユーザ情報記憶部１２２は、ユーザに関する各種情報を記憶する。例えば、ユーザ情報記憶部１２２は、各ユーザの属性情報等の種々の情報を記憶する。

　ユーザ情報記憶部１２２は、ユーザＩＤ、年齢、性別、居住地といったユーザに関する情報を記憶する。例えば、ユーザ情報記憶部１２２は、ユーザＵ１を識別するユーザＩＤ「Ｕ１」に対応付けて、ユーザＵ１の年齢、性別、居住地といったユーザＵ１に関する情報を記憶する。

　また、ユーザ情報記憶部１２２は、各ユーザが利用する装置（テレビやスマートフォン等）を識別する情報をユーザに対応付けて記憶する。ユーザ情報記憶部１２２は、各ユーザが利用する端末装置１０を識別する情報（端末ＩＤ等）をユーザに対応付けて記憶する。

　なお、ユーザ情報記憶部１２２は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、ユーザ情報記憶部１２２は、年齢や性別に限らず他のデモグラフィック属性情報やサイコグラフィック属性情報を記憶してもよい。例えば、ユーザ情報記憶部１２２は、氏名、自宅、勤務地、興味、家族構成、収入、ライフスタイル等の情報を記憶してもよい。

　第１の実施形態に係る部位情報記憶部１２３は、身体部位に関する各種情報を記憶する。例えば、部位情報記憶部１２３は、主部位と動作種別の組合せごとに対応する関連部位を対応付けた情報を定義情報として記憶する。図５は、本開示の第１の実施形態に係る部位情報記憶部の一例を示す図である。

　図５に示す部位情報記憶部１２３には、「主部位」、「動作種別」、「関連部位」といった項目が含まれる。また、図５の例では、「主部位」には、「＃１」、「＃２」といった項目が含まれ、「関連部位」には、「＃１」、「＃２」、「＃３」、「＃４」といった項目が含まれる場合を図示する。なお、「主部位」には、「＃１」、「＃２」に限らず、「＃３」、「＃４」等、主部位に対応する数の項目が含まれてもよい。また、「関連部位」には、「＃１」、「＃２」、「＃３」、「＃４」に限らず、「＃５」、「＃６」等、関連部位に対応する数の項目が含まれてもよい。

　「主部位」は、ユーザの身体動作に対応する主たる部位を示す。例えば、「主部位」は、対応する動作種別の動作で、主として動くユーザの身体動作を示す。「主部位」は、ユーザの身体動作による位置の変化量が大きい部位を示す。例えば、「主部位」は、ユーザの身体動作による位置の変化量が最大の部位を示す。なお、「主部位」は、各部位を識別するための識別情報（部位ＩＤ等）が格納されてもよい。

　「動作種別」は、動作種別を示す。「動作種別」は、動作種別の名称を示す。なお、「動作種別」は、各動作種別を識別するための識別情報（動作種別ＩＤ等）が格納されてもよい。

　「関連部位」は、対応する主部位及び動作種別の組合せに対応する部位を示す。「関連部位」は、対応する動作種別の動作時に、主部位の動作に連動して動作する部位を示す。「関連部位」は、身体動作に対応する動き情報の補正処理の対象となる部位を示す。なお、「関連部位」は、各部位を識別するための識別情報（部位ＩＤ等）が格納されてもよい。

　図５の例では、主部位「ＨＥＡＤ」と動作種別「ＲＯＴＡＴＥ」の組合せに対応する関連部位は、「Ｌ＿ＷＲＩＳＴ」及び「Ｒ＿ＷＲＩＳＴ」の２つの部位であることを示す。すなわち、ユーザの身体部位のうち、主部位である頭を回転させる動作が行われる場合、その関連部位は左手と右手であることを示す。

　また、主部位「ＨＥＡＤ」と動作種別「ＭＯＶＥ」の組合せに対応する関連部位は、「Ｌ＿ＷＲＩＳＴ」、「Ｒ＿ＷＲＩＳＴ」、「Ｌ＿ＬＥＧ」及び「Ｒ＿ＬＥＧ」の４つの部位であることを示す。すなわち、ユーザの身体部位のうち、主部位である頭を移動させる動作が行われる場合、その関連部位は左手、右手、左足、右足であることを示す。

　なお、部位情報記憶部１２３は、上記に限らず、目的に応じて種々の情報を記憶してもよい。部位情報記憶部１２３は、関連部位の動きを補正する場合の補正量を示す情報（補正量情報）を各関連部位に対応付けて記憶してもよい。例えば、部位情報記憶部１２３は、関連部位の動きを強調する場合にどの程度強調するかを示す補正量情報を各関連部位に対応付けて記憶してもよい。

　第１の実施形態に係る機能情報記憶部１２４は、機能に関する各種情報を記憶する。機能情報記憶部１２４は、ユーザの入力に応じて実行される各機能に関する情報を記憶する。機能情報記憶部１２４は、機能の実行に必要な入力に関する情報を記憶する。機能情報記憶部１２４は、各機能の実行に必要な入力項目を記憶する。なお、機能情報記憶部１２４は、上記に限らず、目的に応じて種々の情報を記憶してもよい。

　図３に戻り、説明を続ける。制御部１３０は、例えば、ＣＰＵ（Central　Processing　Unit）やＭＰＵ（Micro　Processing　Unit）等によって、情報処理装置１００内部に記憶されたプログラム（例えば、本開示に係る情報処理プログラム等）がＲＡＭ（Random　Access　Memory）等を作業領域として実行されることにより実現される。また、制御部１３０は、例えば、ＡＳＩＣ（Application　Specific　Integrated　Circuit）やＦＰＧＡ（Field　Programmable　Gate　Array）等の集積回路により実現される。

　図３に示すように、制御部１３０は、取得部１３１と、特定部１３２と、補正部１３３と、実行部１３４と、送信部１３５とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部１３０の内部構成は、図３に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部１３０が有する各処理部の接続関係は、図３に示した接続関係に限られず、他の接続関係であってもよい。

　取得部１３１は、各種情報を取得する。取得部１３１は、外部の情報処理装置から各種情報を取得する。取得部１３１は、端末装置１０から各種情報を取得する。取得部１３１は、端末装置１０のセンサ部１７が検知した情報を端末装置１０から各種情報を取得する。取得部１３１は、センサ部１７の画像センサ１７１が検知した情報を端末装置１０から各種情報を取得する。取得部１３１は、音声認識サーバ等の他の情報処理装置から各種情報を取得する。

　取得部１３１は、記憶部１２０から各種情報を取得する。取得部１３１は、動作情報記憶部１２１やユーザ情報記憶部１２２や部位情報記憶部１２３や機能情報記憶部１２４から各種情報を取得する。取得部１３１は、特定部１３２が特定した各種情報を取得する。取得部１３１は、補正部１３３が補正した各種情報を取得する。

　取得部１３１は、身体動作を行うユーザの外形を示す外形情報を取得する。取得部１３１は、センサにより検知された外形情報を取得する。取得部１３１は、画像センサにより検知された画像情報である外形情報を取得する。取得部１３１は、ユーザの発話情報を取得する。取得部１３１は、身体動作により入力を行うユーザの外形情報を取得する。取得部１３１は、主部位と関連部位との対応付けを示す定義情報を取得する。

　取得部１３１は、複数のフレームからなる動画情報を外形情報として取得する。取得部１３１は、ユーザＵ１の身体動作を示す外形情報を取得する。取得部１３１は、状態ＳＴ１に対応する画像情報や状態ＳＴ２に対応する画像情報等の複数の画像情報を外形情報として取得する。

　特定部１３２は、各種情報を特定する。特定部１３２は、各種情報を決定する。特定部１３２は、各種の判断を行う。特定部１３２は、各種情報を判定する。例えば、特定部１３２は、外部の情報処理装置からの情報や記憶部１２０に記憶された情報に基づいて、各種情報を特定する。特定部１３２は、端末装置１０や音声認識サーバ等の他の情報処理装置からの情報に基づいて、各種情報を特定する。特定部１３２は、動作情報記憶部１２１やユーザ情報記憶部１２２や部位情報記憶部１２３や機能情報記憶部１２４に記憶された情報に基づいて、各種情報を特定する。特定部１３２は、各種情報を抽出する。例えば、特定部１３２は、外部の情報処理装置からの情報や記憶部１２０に記憶された情報に基づいて、各種情報を抽出する。

　特定部１３２は、取得部１３１により取得された各種情報に基づいて、各種情報を特定する。特定部１３２は、補正部１３３により補正された各種情報に基づいて、各種情報を特定する。特定部１３２は、特定に基づいて、各種の判断を行う。取得部１３１により取得された情報に基づいて、各種の判断を行う。

　特定部１３２は、取得部１３１により取得された外形情報に基づいて、身体部位のうち、身体動作に対応する主部位と、身体動作に対応する動き情報の補正処理の対象となる関連部位とを特定する。特定部１３２は、身体動作の影響を取り消す対象となる関連部位を特定する。特定部１３２は、身体動作の影響を強調する対象となる関連部位を特定する。

　特定部１３２は、ユーザの各身体部位の位置の変換量に基づいて、主部位を特定する。特定部１３２は、身体部位のうち、位置の変換量が大きい部位を主部位に特定する。特定部１３２は、ユーザの発話情報に基づいて、主部位を特定する。特定部１３２は、ユーザの発話情報に基づいて、関連部位を特定する。特定部１３２は、ユーザの発話内容により推定されるユーザの発話意図に基づいて、主部位を特定する。特定部１３２は、ユーザの発話意図に対応する主部位以外の部位のうち、動作している部位を関連部位として特定する。

　特定部１３２は、定義情報に基づいて、関連部位を特定する。特定部１３２は、ユーザの入力に対応する主部位を特定する。特定部１３２は、主部位の動作に連動して動作する部位を関連部位として特定する。

　特定部１３２は、ユーザが実行を指示する機能を特定する。特定部１３２は、ユーザの動き情報に対応する機能を特定する。特定部１３２は、ユーザの動き情報を基に機能を特定する。特定部１３２は、補正部１３３により補正された動き情報を基に機能を特定する。

　例えば、特定部１３２は、自然言語理解の機能によりユーザの発話の意図を推定する。特定部１３２は、自然言語理解やエンティティ解析等の技術を用いて、ユーザの発話の意図を推定する。

　特定部１３２は、状態ＳＴ１から状態ＳＴ２の間におけるユーザＵ１の身体動作において、変化量の多い部位を主部位として特定する。特定部１３２は、ユーザＵ１の身体部位のうち、状態ＳＴ１から状態ＳＴ２の間で変化量の多い部位である頭部ＨＤを主部位Ｍ１に特定する。特定部１３２は、状態ＳＴ１から状態ＳＴ２の間における主部位Ｍ１である頭部ＨＤの動作に基づいて、ユーザＵ１の動作種別を特定する。特定部１３２は、状態ＳＴ１から状態ＳＴ２の間でユーザＵ１が頭を傾ける（回転させる）動作を行っているため、動作種別を「ＲＯＴＡＴＥ」に特定する。

　特定部１３２は、状態ＳＴ１から状態ＳＴ２の間における主部位Ｍ１である頭部ＨＤと、動作種別「ＲＯＴＡＴＥ」とに基づいて、関連部位を特定する。特定部１３２は、ユーザＵ１の右手ＲＷ及び左手ＬＷを、ユーザＵ１の頭部を回転させる動作に対応する関連部位として特定する。特定部１３２は、右手ＲＷを関連部位Ｒ１として特定し、左手ＬＷを関連部位Ｒ２として特定する。

　補正部１３３は、各種情報を補正する。補正部１３３は、外部の情報処理装置からの情報や記憶部１２０に記憶された情報に基づいて、各種情報を補正する。補正部１３３は、端末装置１０や音声認識サーバ等の他の情報処理装置からの情報に基づいて、各種情報を補正する。補正部１３３は、動作情報記憶部１２１やユーザ情報記憶部１２２や部位情報記憶部１２３や機能情報記憶部１２４に記憶された情報に基づいて、各種情報を補正する。

　補正部１３３は、取得部１３１により取得された各種情報に基づいて、各種情報を補正する。補正部１３３は、特定部１３２により特定された各種情報に基づいて、各種情報を補正する。補正部１３３は、実行部１３４により実行された処理に基づいて、各種情報を補正する。

　補正部１３３は、特定部１３２により特定された関連部位に対応する動き情報を補正する。補正部１３３は、特定部１３２により特定された主部位に対応する動き情報を補正する。

　補正部１３３は、関連部位Ｒ１である右手ＲＷの動作をキャンセルする補正を行う。補正部１３３は、状態ＳＴ２の右手ＲＷの位置を状態ＳＴ１の右手ＲＷの位置に戻す補正を行う。補正部１３３は、補正前の状態ＳＴ２を補正後の状態ＳＴ３のように右手ＲＷの位置が状態ＳＴ１の位置に戻され、頭部ＨＤのみが傾いた状態に補正する。

　実行部１３４は、各種処理を実行する。実行部１３４は、各種処理の実行を決定する。実行部１３４は、外部の情報処理装置からの情報に基づいて、各種処理を実行する。実行部１３４は、記憶部１２０に記憶された情報に基づいて、各種処理を実行する。実行部１３４は、動作情報記憶部１２１やユーザ情報記憶部１２２や部位情報記憶部１２３や機能情報記憶部１２４に記憶された情報に基づいて、各種処理を実行する。

　実行部１３４は、取得部１３１により取得された各種情報に基づいて、各種処理を実行する。実行部１３４は、特定部１３２により特定された各種情報に基づいて、各種処理を実行する。実行部１３４は、補正部１３３により補正された各種情報に基づいて、各種処理を実行する。

　実行部１３４は、各種情報を生成する。実行部１３４は、外部の情報処理装置からの情報や記憶部１２０に記憶された情報に基づいて、各種情報を生成する。実行部１３４は、端末装置１０や音声認識サーバ等の他の情報処理装置からの情報に基づいて、各種情報を生成する。実行部１３４は、動作情報記憶部１２１やユーザ情報記憶部１２２や部位情報記憶部１２３や機能情報記憶部１２４に記憶された情報に基づいて、各種情報を生成する。

　実行部１３４は、ユーザを撮像した画像情報から動き情報を生成する。実行部１３４は、ユーザを撮像した複数の画像情報から動き情報を生成する。実行部１３４は、ユーザを撮像した複数の画像情報の差分を基にユーザに対応する動き情報を生成する。実行部１３４は、状態ＳＴ１から状態ＳＴ２の間におけるユーザの身体動作に対応する動き情報を生成する。

　送信部１３５は、各種情報を送信する。送信部１３５は、外部の情報処理装置へ各種情報を送信する。送信部１３５は、外部の情報処理装置へ各種情報を提供する。例えば、送信部１３５は、端末装置１０や音声認識サーバ等の他の情報処理装置へ各種情報を送信する。送信部１３５は、記憶部１２０に記憶された情報を提供する。送信部１３５は、記憶部１２０に記憶された情報を送信する。

　送信部１３５は、端末装置１０や音声認識サーバ等の他の情報処理装置からの情報に基づいて、各種情報を提供する。送信部１３５は、記憶部１２０に記憶された情報に基づいて、各種情報を提供する。送信部１３５は、動作情報記憶部１２１やユーザ情報記憶部１２２や部位情報記憶部１２３や機能情報記憶部１２４に記憶された情報に基づいて、各種情報を提供する。

　送信部１３５は、端末装置１０に実行させる機能を示す情報を端末装置１０に送信する。送信部１３５は、実行部１３４による実行が決定された機能を示す情報を端末装置１０に送信する。

［１－４．第１の実施形態に係る端末装置の構成］
　次に、第１の実施形態に係る情報処理を実行する情報処理装置の一例である端末装置１０の構成について説明する。図６は、本開示の第１の実施形態に係る端末装置の構成例を示す図である。

　図６に示すように、端末装置１０は、通信部１１と、入力部１２と、出力部１３と、記憶部１４と、制御部１５と、表示部１６と、センサ部１７とを有する。

　通信部１１は、例えば、ＮＩＣや通信回路等によって実現される。通信部１１は、ネットワークＮ（インターネット等）と有線又は無線で接続され、ネットワークＮを介して、情報処理装置１００等の他の装置等との間で情報の送受信を行う。

　入力部１２は、各種入力を受け付ける。入力部１２は、センサ部１７による検知を入力として受け付ける。入力部１２は、身体動作を行うユーザの外形を示す外形情報の入力を受け付ける。入力部１２は、センサ部１７により検知された外形情報の入力を受け付ける。入力部１２は、画像センサ１７１により検知された画像情報である外形情報の入力を受け付ける。入力部１２は、ユーザの発話情報の入力を受け付ける。入力部１２は、身体動作により入力を行うユーザの外形情報の入力を受け付ける。入力部１２は、ユーザのジェスチャや視線を入力として受け付ける。

　入力部１２は、ユーザから各種操作が入力される。入力部１２は、音声を検知する機能を有するセンサ部１７により音を入力として受け付ける。入力部１２は、音声を検知するマイク（音センサ）により検知された音声情報を入力情報として受け付ける。入力部１２は、ユーザの発話による音声を入力情報として受け付ける。

　また、入力部１２は、ユーザが利用する端末装置１０への操作（ユーザ操作）をユーザによる操作入力として受け付けてもよい。入力部１２は、通信部１１を介して、リモコン（リモートコントローラー：remote　controller）を用いたユーザの操作に関する情報を受け付けてもよい。また、入力部１２は、端末装置１０に設けられたボタンや、端末装置１０に接続されたキーボードやマウスを有してもよい。

　例えば、入力部１２は、リモコンやキーボードやマウスと同等の機能を実現できるタッチパネルを有してもよい。この場合、入力部１２は、表示部１６を介して各種情報が入力される。入力部１２は、各種センサにより実現されるタッチパネルの機能により、表示画面を介してユーザから各種操作を受け付ける。すなわち、入力部１２は、端末装置１０の表示部１６を介してユーザから各種操作を受け付ける。例えば、入力部１２は、端末装置１０の表示部１６を介してユーザの指定操作等の操作を受け付ける。例えば、入力部１２は、タッチパネルの機能によりユーザの操作を受け付ける受付部として機能する。この場合、入力部１２と受付部１５３とは一体であってもよい。なお、入力部１２によるユーザの操作の検知方式には、タブレット端末では主に静電容量方式が採用されるが、他の検知方式である抵抗膜方式、表面弾性波方式、赤外線方式、電磁誘導方式など、ユーザの操作を検知できタッチパネルの機能が実現できればどのような方式を採用してもよい。

　例えば、入力部１２は、ユーザＵ１の発話を入力として受け付ける。入力部１２は、センサ部１７により検知されたユーザＵ１の発話を入力として受け付ける。入力部１２は、センサ部１７の音センサにより検知されたユーザＵ１の発話を入力として受け付ける。

　出力部１３は、各種情報を出力する。出力部１３は、音声を出力する機能を有する。例えば、出力部１３は、音声を出力するスピーカーを有する。出力部１３は、ユーザに対して音声による情報の出力を行う。出力部１３は、表示部１６に表示される情報を音声により出力する。

　記憶部１４は、例えば、ＲＡＭ、フラッシュメモリ等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部１４は、情報の表示に用いる各種情報を記憶する。

　図６に戻り、説明を続ける。制御部１５は、例えば、ＣＰＵやＭＰＵ等によって、端末装置１０内部に記憶されたプログラム（例えば、本開示に係る情報処理プログラム等の表示プログラム）がＲＡＭ等を作業領域として実行されることにより実現される。また、制御部１５は、例えば、ＡＳＩＣやＦＰＧＡ等の集積回路により実現されてもよい。

　図６に示すように、制御部１５は、受信部１５１と、実行部１５２と、受付部１５３と、送信部１５４とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部１５の内部構成は、図６に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。

　受信部１５１は、各種情報を受信する。受信部１５１は、外部の情報処理装置から各種情報を受信する。受信部１５１は、情報処理装置１００や音声認識サーバ等の他の情報処理装置から各種情報を受信する。

　受信部１５１は、情報処理装置１００から各種機能の実行指示を受信する。例えば、受信部１５１は、情報処理装置１００から機能を指定する情報を機能の実行指示として受信する。受信部１５１は、コンテンツを受信する。受信部１５１は、情報処理装置１００から表示するコンテンツを受信する。

　実行部１５２は、各種処理を実行する。実行部１５２は、各種処理の実行を決定する。実行部１５２は、外部の情報処理装置からの情報に基づいて、各種処理を実行する。実行部１５２は、情報処理装置１００からの情報に基づいて、各種処理を実行する。実行部１５２は、情報処理装置１００からの指示に応じて、各種処理を実行する。実行部１５２は、記憶部１４に記憶された情報に基づいて、各種処理を実行する。

　実行部１５２は、各種表示を制御する。実行部１５２は、表示部１６の表示を制御する。実行部１５２は、受信部１５１による受信に応じて、表示部１６の表示を制御する。実行部１５２は、受信部１５１により受信された情報に基づいて、表示部１６の表示を制御する。実行部１５２は、受付部１５３により受け付けられた情報に基づいて、表示部１６の表示を制御する。実行部１５２は、受付部１５３による受付けに応じて、表示部１６の表示を制御する。

　受付部１５３は、各種情報を受け付ける。受付部１５３は、入力部１２を介してユーザによる入力を受け付ける。受付部１５３は、ユーザによる発話を入力として受け付ける。受付部１５３は、ユーザによる操作を受け付ける。受付部１５３は、表示部１６により表示された情報に対するユーザの操作を受け付ける。受付部１５３は、ユーザによる文字入力を受け付ける。

　送信部１５４は、外部の情報処理装置へ各種情報を送信する。例えば、送信部１５４は、端末装置１０や音声認識サーバ等の他の情報処理装置へ各種情報を送信する。送信部１５４は、記憶部１４に記憶された情報を送信する。

　送信部１５４は、情報処理装置１００や音声認識サーバ等の他の情報処理装置からの情報に基づいて、各種情報を送信する。送信部１５４は、記憶部１４に記憶された情報に基づいて、各種情報を送信する。

　送信部１５４は、センサ部１７により検知されたセンサ情報を情報処理装置１００へ送信する。送信部１５４は、センサ部１７の画像センサ１７１により検知されたユーザＵ１の外形情報を情報処理装置１００へ送信する。

　送信部１５４は、ユーザにより入力された入力情報を情報処理装置１００へ送信する。送信部１５４は、ユーザにより音声入力された入力情報を情報処理装置１００へ送信する。送信部１５４は、ユーザの操作により入力された入力情報を情報処理装置１００へ送信する。

　送信部１５４は、身体動作を行うユーザの外形を示す外形情報を情報処理装置１００へ送信する。送信部１５４は、センサ部１７により検知された外形情報を情報処理装置１００へ送信する。送信部１５４は、画像センサ１７１により検知された画像情報である外形情報を情報処理装置１００へ送信する。送信部１５４は、ユーザの発話情報を情報処理装置１００へ送信する。送信部１５４は、身体動作により入力を行うユーザの外形情報を情報処理装置１００へ送信する。

　表示部１６は、端末装置１０に設けられ各種情報を表示する。表示部１６は、例えば液晶ディスプレイや有機ＥＬ（Electro-Luminescence）ディスプレイ等によって実現される。表示部１６は、情報処理装置１００から提供される情報を表示可能であれば、どのような手段により実現されてもよい。表示部１６は、実行部１５２による制御に応じて、各種情報を表示する。

　表示部１６は、コンテンツを表示する。表示部１６は、受信部１５１により受信されたコンテンツを表示する。

　センサ部１７は、所定の情報を検知する。センサ部１７は、身体動作を行うユーザの外形を示す外形情報を検知する。センサ部１７は、身体動作を行うユーザの外形を示す外形情報を検知する手段として画像センサ１７１を有する。センサ部１７は、画像センサ１７１により画像情報である外形情報を検知する。センサ部１７は、ユーザの発話を検知する。センサ部１７は、身体動作により入力を行うユーザの外形情報を検知する。

　また、センサ部１７は、画像センサ１７１に限らず、ユーザの外形情報を検知可能であれば、どのようなセンサを有してもよい。光学式の測距センサや超音波等を用いた音波センサ等をユーザの外形情報を検知するセンサとして有してもよい。例えば、センサ部１７は、ＬｉＤＡＲやＴｏＦセンサ等を有してもよい。また、センサ部１７は、サーマルセンサ等の熱を検知するセンサをユーザの外形情報を検知するセンサとして有してもよい。

　また、センサ部１７は、上記に限らず、各種センサを有してもよい。センサ部１７は、ＧＰＳ（Global　Positioning　System）センサ等の位置情報を検知するセンサ（位置センサ）を有してもよい。なお、センサ部１７は、上記に限らず、種々のセンサを有してもよい。

［１－５．第１の実施形態に係る情報処理の手順］
　次に、図７、図８を用いて、第１の実施形態に係る各種情報処理の手順について説明する。

［１－５－１．情報処理装置に係る処理の手順］
　まず、図７を用いて、本開示の第１の実施形態に係る情報処理装置に係る処理の流れについて説明する。図７は、本開示の第１の実施形態に係る情報処理装置の処理手順を示すフローチャートである。具体的には、図７は、情報処理装置１００による情報処理の手順を示すフローチャートである。

　図７に示すように、情報処理装置１００は、身体動作を行うユーザの外形を示す外形情報を取得する（ステップＳ１０１）。そして、情報処理装置１００は、外形情報に基づいて、身体部位のうち、身体動作に対応する主部位と、身体動作に対応する動き情報の補正処理の対象となる関連部位とを特定する（ステップＳ１０２）。

［１－５－２．情報処理システムに係る処理の手順］
　次に、図８を用いて、本開示の第１の実施形態に係る情報処理システムに係る処理の流れについて説明する。図８は、本開示の第１の実施形態に係る情報処理システムの処理手順を示すシーケンス図である。

　図８に示すように、端末装置１０は、身体動作を行うユーザの外形を示す外形情報を検知する（ステップＳ２０１）。例えば、端末装置１０は、画像センサ１７１により検知されたユーザの画像情報を取得する。そして、端末装置１０は、身体動作を行うユーザの外形を示す外形情報を情報処理装置１００へ送信する（ステップＳ２０２）。

　情報処理装置１００は、端末装置１０から取得した外形情報に基づいて、身体部位のうち、身体動作に対応する主部位と、身体動作に対応する動き情報の補正処理の対象となる関連部位とを特定する（ステップＳ２０３）。そして、情報処理装置１００は、特定した部位の動き情報を補正する（ステップＳ２０４）。そして、情報処理装置１００は、補正した動き情報を基に機能を特定する（ステップＳ２０５）。

　そして、情報処理装置１００は、特定した機能の実行を端末装置１０に指示する（ステップＳ２０６）。情報処理装置１００は、特定した機能を示す情報を端末装置１０に送信することにより、特定した機能の実行を端末装置１０に指示する。そして、端末装置１０は、情報処理装置１００からの指示に応じて機能を実行する（ステップＳ２０７）。

［１－６．発話を用いた部位特定例］
　情報処理装置１００は、外形情報に限らず、種々の情報を適宜用いて、主部位や関連部位を特定してもよい。この点について、以下説明する。なお、以下の説明では、図１と同様の点については適宜説明を省略する。

　まず、音声発話と身体動作でメッセージにユーザの意図を付加する場合について、図１を例に説明する。この場合、図１の例においてユーザが発話とともに頭を傾ける動作を行った場合を一例として説明する。情報処理システム１は、自然言語理解や自動音声認識（ＡＳＲ）の機能により、ユーザの発話による音声情報を認識し、発話の内容を推定することができるものとする。なお、自然言語理解や自動音声認識の機能は、情報処理システム１のいずれの装置が有してもよい。例えば、自然言語理解や自動音声認識の機能は、情報処理装置１００や端末装置１０が有してもよい。また、情報処理システム１には、自然言語理解や自動音声認識の機能を有する音声認識サーバが含まれてもよい。

　端末装置１０を利用するユーザＵ１が「７時に帰ってくる」と発話する。端末装置１０は、ユーザＵ１の「７時に帰ってくる」という発話を検知する。そして、端末装置１０は、自動音声認識の機能により生成した文字情報「７時に帰ってくる」を情報処理装置１００へ送信する。これにより、情報処理装置１００は、ユーザＵ１の発話に対応する文字情報「７時に帰ってくる」を取得する。

　また、ユーザＵ１は、頭を傾ける身体動作を行う。ユーザＵ１は、「７時に帰ってくる」という発話後に、頭を傾ける身体動作を行う。情報処理装置１００は、状態ＳＴ１から状態ＳＴ２に対応するユーザの動作を示す複数の画像情報を外形情報として取得する。情報処理装置１００は、ユーザＵ１の発話前の状態ＳＴ１に対応する画像情報やユーザＵ１の発話後の状態ＳＴ２に対応する画像情報を外形情報として取得する。これにより、情報処理装置１００は、状態ＳＴ１に対応する画像情報や状態ＳＴ２に対応する画像情報等の複数の画像情報を外形情報として取得する。

　情報処理装置１００は、自然言語理解の機能により文字情報「７時に帰ってくる」の意図を推定する。また、情報処理装置１００は、ユーザの頭を傾ける身体動作を基にユーザＵ１の意図を特定する。情報処理装置１００は、ユーザの頭を傾ける身体動作を基に文字情報「７時に帰ってくる」の内容を尋ねる意図であると特定する。これにより、情報処理装置１００は、文字情報「７時に帰ってくる」に「？」が付されたメッセージ「７時に帰ってくる？」を生成する。

　このように、情報処理装置１００は、ユーザの動作を基にユーザの意図をより精度よく推定することができる。また、情報処理装置１００は、ユーザの動作を基に推定したユーザの意図を用いることで、適切に文字情報などの情報を生成することができる。

　情報処理装置１００は、発話内容による主部位の切替えてもよい。この点について、図９を用いて説明する。図９は、発話を用いた部位特定の一例を示す図である。図９は、発話情報を用いた主部位の特定の一例を示す。情報処理装置１００は、音声発話の内容からユーザの意図（Ｉｎｔｅｎｔ）を推定（取得）し、そのユーザの意図（発話意図）に紐づいた主部位を特定し、不要な動作の特定し、その動作のキャンセルを行う。そのユースケースの一例として、図９では、「これくらいの大きさにして」とユーザが歩きながら発話し、両手でサイズ表現をする場合を示す。

　図９の例では、ユーザＵ１は、歩行により状態ＳＴ１１から状態ＳＴ１２に対応する移動を行う（ステップＳ１１）。そして、ユーザＵ１は、歩きながら右手ＲＷと左手ＬＷとを広げる動作を行い、「これくらいの大きさにして」という発話ＵＴ１を行う。

　そして、情報処理装置１００は、自然言語理解（ＮＬＵ）の機能によりユーザの発話の意図を推定し、推定した意図（Ｉｎｔｅｎｔ）に対応する身体部位情報を取得する（ステップＳ１２）。情報処理装置１００は、Ｉｎｔｅｎｔ別身体部位情報を記憶したデータベースＤＢ１１から推定した意図（Ｉｎｔｅｎｔ）に対応する身体部位情報を取得する。例えば、情報処理装置１００は、Ｉｎｔｅｎｔ別身体部位情報を記憶した記憶部１２０から推定した意図（Ｉｎｔｅｎｔ）に対応する身体部位情報を取得する。

　図９の例では、情報処理装置１００は、発話ＵＴ１に対するユーザの意図をオブジェクトのサイズを変更する意図であると推定する。そして、情報処理装置１００は、推定した意図（Ｉｎｔｅｎｔ）に対応するＩｎｔｅｎｔ「ＣＨＡＮＧＥ＿ＯＢＪＥＣＴ＿ＳＩＺＥ」であるＩｎｔｅｎｔ別身体部位情報をデータベースＤＢ１１から抽出する。情報処理装置１００は、Ｉｎｔｅｎｔ「ＣＨＡＮＧＥ＿ＯＢＪＥＣＴ＿ＳＩＺＥ」であり、その主部位が「ＬＥＦＴ＿ＷＲＩＳＴ」及び「ＲＩＧＨＴ＿ＷＲＩＳＴ」であるＩｎｔｅｎｔ別身体部位情報ＩＮＦ１１を抽出する。なお、「ＬＥＦＴ＿ＷＲＩＳＴ」は「Ｌ＿ＷＲＩＳＴ」と同義であり、「ＲＩＧＨＴ＿ＷＲＩＳＴ」は「Ｒ＿ＷＲＩＳＴ」と同義であってもよい。

　情報処理装置１００は、状態ＳＴ１１から状態ＳＴ１２の間において、位置の変化量が大きい右足ＲＬ及び左足ＬＬではなく、ユーザＵ１の発話の意図を基に、位置の変化量が右足ＲＬ及び左足ＬＬよりも小さい右手ＲＷ及び左手ＬＷを主部位に特定する。これにより、情報処理装置１００は、状態ＳＴ１３に示すように、右手ＲＷを主部位Ｍ１１として特定し、左手ＬＷを主部位Ｍ１２として特定する（ステップＳ１３）。

　そして、情報処理装置１００は、関連部位を特定する（ステップＳ１４）。情報処理装置１００は、ユーザＵ１の発話意図に対応する主部位Ｍ１１、Ｍ１２以外の部位のうち、動作している部位を関連部位として特定する。図９の例では、情報処理装置１００は、状態ＳＴ１４に示すように、右足ＲＬを関連部位Ｒ１１として特定し、左足ＬＬを関連部位Ｒ１２として特定する。

　そして、情報処理装置１００は、動作を補正する処理を行う（ステップＳ１５）。情報処理装置１００は、関連部位の動作をキャンセルする補正を行う。図１の例では、情報処理装置１００は、関連部位Ｒ１１である右足ＲＬの動作と関連部位Ｒ１２である左足ＬＬの動作をキャンセルする補正を行う。すなわち、情報処理装置１００は、状態ＳＴ１２の右足ＲＬ及び左足ＬＬの位置を状態ＳＴ１１の右足ＲＬ及び左足ＬＬの位置に戻す補正を行う。これにより、情報処理装置１００は、補正前の状態ＳＴ１２を補正後の状態ＳＴ１５のように右足ＲＬ及び左足ＬＬの位置が状態ＳＴ１の位置に戻され、右手ＲＷ及び左手ＬＷが広げられた状態に補正する。

　そして、情報処理装置１００は、状態ＳＴ１５に対応する動き情報を用いて、ユーザの身体動作による入力の意図を推定する。例えば、情報処理装置１００は、状態ＳＴ１５に対応する動き情報を検出器等に入力することで、ユーザの身体動作による入力の意図を特定する。

　このように、情報処理装置１００は、ユーザの発話の意図解析からＩｎｔｅｎｔを発話推定し、Ｉｎｔｅｎｔ別身体部位情報から主部位を特定する。そして、情報処理装置１００は、入力として使うべきでない身体部位の動きを抑制・キャンセルし処理を行う。

　例えば、単純に動き量の多い部分を主部位とする場合、例えば歩行中などに意図する主部位以外の動き量の方が大きくなる場合がある。このような場合、正しい入力ができない場合やユーザの意図が適切に推定できない場合がある。

　一方で、情報処理装置１００は、入力として使うべきでない身体部位の動きを抑制・キャンセルし処理を行うことで、正しい入力を受け付けることができ、ユーザの意図が適切に推定することができる。

［２．第２の実施形態］
　ここから、第２の実施形態について説明する。第２の実施形態は、動作を強調する場合を示す。また、第２の実施形態は、アバター等の仮想キャラクタを動作させるためにユーザに身体動作を利用させる場合を一例として説明する。なお、第１の実施形態と同様の点については、適宜説明を省略する。第２の実施形態においては、情報処理システム１は、情報処理装置１００に代えて、情報処理装置１００Ａを有する。

［２－１．第２の実施形態に係る情報処理の概要］
　図１０は、本開示の第２の実施形態に係る情報処理の一例を示す図である。本開示の第２の実施形態に係る情報処理は、図２に示す情報処理装置１００Ａや端末装置１０を含む情報処理システム１によって実現される。図１０は、事前定義データによる動作の強調の一例を示す。情報処理装置１００Ａは、事前定義されたデータに沿ってユーザの動きデータを強調する。そのユースケースの一例として、図１０では、アバターなどへの動き情報を転写する際に、不足している動き情報を強調する事で、アバターの動作特徴を再現する場合を示す。

　図１０の例では、ユーザＵ１の身体動作に応じて動作する２０代女性のアイドルキャラクタ（アバター）である仮想キャラクタＶＣ２１を含むコンテンツＣＴ２１を端末装置１０の表示部１６に表示される場合を示す。例えば、仮想キャラクタＶＣ２１のようなアイドルキャラクタ（アバター）をユーザの身体動作に応じて操作する場合、ユーザの身体動作をそのままアバターの動作として転写しただけでは、アバターの動作としては不十分な場合がある。例えば、図１０の例では、仮想キャラクタＶＣ２１の属性は２０代女性であり、ユーザＵ１の属性は５０代男性である。そのため、若い女性の仮想キャラクタＶＣ２１のようなアイドルキャラクタ（アバター）を、中年男性のユーザＵ１の身体動作に応じて操作する場合、ユーザＵ１の身体動作をそのままアバターの動作として転写しただけでは、アバターの動作としては不十分な場合がある。そこで、情報処理装置１００Ａは、以下のようにユーザの動作を強調するように補正することで、アバターに適した動作をアバターに行わせる。

　なお、図１０の例では、ユーザＵ１の左手を挙げる動作を示すため、端末装置１０の表示部１６に仮想キャラクタＶＣ２１の上半身のみが表示されている場合を示すが、仮想キャラクタＶＣ２１の全身が表示されてもよい。例えば、端末装置１０は、ユーザＵ１の指示等に応じて仮想キャラクタＶＣ２１の全身を表示してもよい。また、図１０の例では、ユーザＵ１の動作を検知する端末装置１０がコンテンツＣＴ２１を表示する場合を示すが、ユーザＵ１の動作を検知する端末装置１０とは別の端末装置１０がコンテンツＣＴ２１を表示してもよい。

　まず、図１０の例では、端末装置１０は、画像センサ１７１によりユーザＵ１を撮像した画像情報を検知する（ステップＳ２１）。そして、端末装置１０は、検知した画像情報を外形情報として、情報処理装置１００Ａに送信する（ステップＳ２２）。例えば、端末装置１０は、連続して撮像した複数の画像情報を含む動画情報を外形情報として、情報処理装置１００Ａに送信する。例えば、端末装置１０は、複数のフレームからなる動画情報を外形情報として、情報処理装置１００Ａに送信する。

　これにより、情報処理装置１００Ａは、複数のフレームからなる動画情報を外形情報として取得する。情報処理装置１００Ａは、ユーザＵ１の身体動作を示す外形情報を取得する。図１０の例では、情報処理装置１００Ａは、状態ＳＴ２１に対応する画像情報や状態ＳＴ２２に対応する画像情報等の複数の画像情報を外形情報として取得する。

　外形情報を取得した情報処理装置１００Ａは、外形情報を用いてユーザＵ１の身体動作に対応する部位を特定する処理を行う。まず、情報処理装置１００Ａは、ユーザＵ１の身体動作に対応する主部位を特定する（ステップＳ２３）。図１０の例では、情報処理装置１００Ａは、ユーザＵ１の身体部位のうち、状態ＳＴ２１から状態ＳＴ２２の間で変化量の多い部位である左手ＬＷを主部位Ｍ２１に特定する。

　また、情報処理装置１００Ａは、状態ＳＴ２１から状態ＳＴ２２の間におけるユーザＵ１の動作種別を特定する（ステップＳ２４）。情報処理装置１００Ａは、状態ＳＴ２１から状態ＳＴ２２の間における主部位Ｍ２１である左手ＬＷの動作に基づいて、ユーザＵ１の動作種別を特定する。図１０の例では、情報処理装置１００Ａは、状態ＳＴ２１から状態ＳＴ２２の間でユーザＵ１が左手を挙げる動作を行っているため、動作種別を「ＲＡＩＳＥ」に特定する。

　そして、情報処理装置１００Ａは、身体動作に対応する動き情報の補正処理の対象となる関連部位を特定する。情報処理装置１００Ａは、主部位Ｍ２１である左手ＬＷと、動作種別「ＲＡＩＳＥ」とに基づいて、関連部位を特定する。例えば、情報処理装置１００Ａは、主部位と関連部位との対応付けを示す定義情報を用いて、関連部位を特定する。例えば、情報処理装置１００Ａは、定義情報のうち、主部位が左手を示す「ＬＥＦＴ＿ＷＲＩＳＴ」であり、動作種別が「ＲＡＩＳＥ」である組合せと関連部位とが対応付けられた対応付情報を用いて、関連部位を特定する。これにより、情報処理装置１００Ａは、ユーザＵ１の右手ＲＷ、右足ＲＬ及び左足ＬＬを、ユーザＵ１の左手を挙げる動作に対応する関連部位として特定する。

　例えば、定義情報は、関連部位である右手ＲＷ、右足ＲＬ及び左足ＬＬの各々と、各部位をどの程度補正するかを示す補正量情報を対応付けた情報を含んでもよい。例えば、定義情報は、左手ＬＷを挙げる動作に応じて、関連部位である右手ＲＷをどの程度強調するかを示す補正量情報を関連部位「ＲＩＧＨＴ＿ＷＲＩＳＴ」に対応付けた情報を含んでもよい。例えば、定義情報は、左手ＬＷを挙げる動作に応じて、関連部位である右足ＲＬをどの程度強調するかを示す補正量情報を関連部位「ＲＩＧＨＴ＿ＬＥＧ」に対応付けた情報を含んでもよい。例えば、定義情報は、左手ＬＷを挙げる動作に応じて、関連部位である左足ＬＬをどの程度強調するかを示す補正量情報を関連部位「ＬＥＦＴ＿ＬＥＧ」に対応付けた情報を含んでもよい。

　そして、情報処理装置１００Ａは、動作を補正する処理を行う（ステップＳ２５）。情報処理装置１００Ａは、関連部位の動作を強調する補正を行う。図１０の例では、情報処理装置１００Ａは、関連部位Ｒ２１である右手ＲＷ、右足ＲＬ及び左足ＬＬの動作を強調する補正を行う。例えば、情報処理装置１００Ａは、定義情報に含まれる補正量情報を用いて、関連部位の動作を強調する補正を行う。

　例えば、情報処理装置１００Ａは、状態ＳＴ２２の右手ＲＷ、右足ＲＬ及び左足ＬＬの各々の位置を、状態ＳＴ２１の右手ＲＷ、右足ＲＬ及び左足ＬＬの各々の位置からさらに離れる方向に移動させる補正を行う。例えば、情報処理装置１００Ａは、状態ＳＴ２２の右手ＲＷの位置をさらに胴体ＢＤから広げる方向に移動させる補正を行う。例えば、情報処理装置１００Ａは、状態ＳＴ２２の右足ＲＬ及び左足ＬＬを、さらに内股にする方向に移動させる補正を行う。なお、上記の強調は一例であり、アバターの属性に応じて強調する態様は異なってもよい。

　これにより、情報処理装置１００Ａは、補正前の状態ＳＴ２２を補正後の状態ＳＴ２３のように、右手ＲＷ、右足ＲＬ及び左足ＬＬの位置が２０代女性のアイドルキャラクタ（アバター）である仮想キャラクタＶＣ２１の動きに適した位置に補正される。すなわち、情報処理装置１００Ａは、ユーザＵ１の動作に基づく動き情報を、２０代女性のアイドルキャラクタ（アバター）である仮想キャラクタＶＣ２１の動きに合うように強調することで、アバターに適した動きに補正することができる。これにより、情報処理装置１００Ａは、動き情報をアバターの属性に適した動き情報に補正することができ、より適切な動作を行うアバターを用いたサービスを提供することを可能にすることができる。

　なお、情報処理装置１００Ａは、主部位についても動きが不足している場合、強調してもよい。例えば、情報処理装置１００Ａは、ユーザＵ１が左手を斜めにあげる等、挙げ方が十分でない場合、左手ＬＷの位置を状態ＳＴ２３に示すように、左手ＬＷが上方向に挙がるように動き情報を強調してもよい。

［２－１－１．背景及び効果等］
　アバターなどキャラクタ性があるものにユーザの動きをそのまま転写すると、キャラクタ性が損なわれる場合がある。また、全身情報を利用する場合など、座ったまま操作出来ない等制限が発生する場合がある。

　一方で、情報処理装置１００Ａは、上述のように事前定義データを用いて、ユーザの動きデータを強調する。これにより、情報処理装置１００Ａは、アバターなどへの動き情報を転写する際に、不足している動き情報を強調する事で、アバターの動作特徴を再現することができ、アバターなどのキャラクタ性が損なわれることを抑制することができる。

［２－２．第２の実施形態に係る情報処理装置の構成］
　次に、第２の実施形態に係る情報処理を実行する情報処理装置の一例である情報処理装置１００Ａの構成について説明する。図１１は、本開示の第２の実施形態に係る情報処理装置の構成例を示す図である。

　図１１に示すように、情報処理装置１００Ａは、通信部１１０と、記憶部１２０Ａと、制御部１３０Ａとを有する。

　記憶部１２０Ａは、例えば、ＲＡＭ、フラッシュメモリ等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。第２の実施形態に係る記憶部１２０Ａは、図１１に示すように、動作情報記憶部１２１と、ユーザ情報記憶部１２２Ａと、部位情報記憶部１２３と、コンテンツ生成用情報記憶部１２５とを有する。

　第２の実施形態に係る動作情報記憶部１２１は、図４に示すような情報を記憶する。第２の実施形態に係る動作情報記憶部１２１は、図４に示す「属性情報」を含む動作情報を記憶する。図４に示す「属性情報」は、この動きデータが想定するキャラクタ（アバター）等の属性情報を示す。図４中のデータＤＴ１～ＤＴ３がキャラクタやアバター毎に用意される。また、適用するユーザ属性も複数用意されてもよい。また、利用ユーザの属性に近いものが選択される。

　上述したように、ユーザの身体動作を仮想キャラクタの動作に用いる場合、動作情報記憶部１２１には、図４に示すように仮想キャラクタの属性情報に含まれる。図４のデータＤＴ１中の「属性情報」は、２０代女性の体型が「ＴＹＰＥ２」である仮想キャラクタの属性情報を示す。すなわち、データＤＴ１は、２０代女性の体型が「ＴＹＰＥ２」である仮想キャラクタを動作させるための動作情報であることを示す。例えば、図４のデータＤＴ１中の「属性情報」の情報は、図１０に示す仮想キャラクタＶＣ２１の属性情報に対応する。

　ユーザ情報記憶部１２２Ａは、ユーザ情報記憶部１２２と同様の情報を記憶する。ユーザ情報記憶部１２２Ａは、各ユーザの動き情報を記憶する。ユーザ情報記憶部１２２Ａは、各ユーザと仮想キャラクタとの対応付けを示す情報を記憶してもよい。

　第２の実施形態に係るコンテンツ生成用情報記憶部１２５は、コンテンツの生成に用いる各種情報を記憶する。コンテンツ生成用情報記憶部１２５は、仮想キャラクタの生成に用いる各種情報を記憶する。コンテンツ生成用情報記憶部１２５は、仮想キャラクタを含むコンテンツの生成に用いる各種情報を記憶する。コンテンツ生成用情報記憶部１２５は、仮想キャラクタの動作に関する編集履歴を記憶する。

　例えば、コンテンツ生成用情報記憶部１２５は、端末装置１０等の表示装置に表示されるコンテンツの生成に用いる情報を記憶する。例えば、コンテンツ生成用情報記憶部１２５は、コンテンツの生成に用いる画像情報を記憶する。例えば、コンテンツ生成用情報記憶部１２５は、ＪＰＥＧ（Joint　Photographic　Experts　Group）やＧＩＦ（Graphics　Interchange　Format）やＰＮＧ（Portable　Network　Graphics）など様々な形式の画像を、コンテンツの生成に用いる画像情報として記憶してもよい。また、コンテンツ生成用情報記憶部１２５は、ＣＳＳ（Cascading　Style　Sheets）やＪａｖａＳｃｒｉｐｔ（登録商標）やＨＴＭＬ（HyperText　Markup　Language）の形式の情報を、コンテンツの生成に用いる画像情報として記憶してもよい。なお、コンテンツ生成用情報記憶部１２５は、上記に限らず、目的に応じて種々の情報を記憶してもよい。

　図１１に示すように、制御部１３０Ａは、取得部１３１Ａと、特定部１３２Ａと、補正部１３３Ａと、実行部１３４Ａと、送信部１３５とを有し、以下に説明する情報処理の機能や作用を実現または実行する。

　取得部１３１Ａは、取得部１３１と同様に各種情報を取得する。取得部１３１Ａは、各種情報を取得する。取得部１３１Ａは、身体動作により仮想キャラクタを動作させるユーザの外形情報を取得する。取得部１３１Ａは、仮想キャラクタに設定された属性に対応する対応ユーザの動き情報を、仮想キャラクタの動き情報の補正に用いる情報として取得する。取得部１３１Ａは、仮想キャラクタの動作に関する編集履歴を、仮想キャラクタの動き情報の補正に用いる情報として取得する。

　特定部１３２Ａは、特定部１３２と同様に各種情報を特定する。特定部１３２Ａは、仮想キャラクタの動作に対応する主部位と、補正処理の対象となる関連部位とを特定する。特定部１３２Ａは、仮想キャラクタに設定された属性に対応する対応ユーザの動き情報に基づいて、主部位と、関連部位とを特定する。特定部１３２Ａは、仮想キャラクタの動作に関する編集履歴に基づいて、主部位と、関連部位とを特定する。

　補正部１３３Ａは、補正部１３３と同様に各種情報を補正する。補正部１３３Ａは、主部位や関連部位の動きを強調する補正を行う。補正部１３３Ａは、仮想キャラクタの動作に関する編集履歴に基づいて、仮想キャラクタの動き情報を補正する。補正部１３３Ａは、編集履歴を用いて、仮想キャラクタの動き情報を補正する。補正部１３３Ａは、編集履歴に含まれる過去の補正の傾向を利用して仮想キャラクタの動き情報を補正する。例えば、補正部１３３Ａは、編集履歴のうち、補正対象の仮想キャラクタの動き情報と類似する動き情報（類似動き情報）の補正内容を、その補正対象の仮想キャラクタの動き情報に適用する。補正部１３３Ａは、補正対象の仮想キャラクタの動き情報を、類似動き情報の補正内容で補正する。

　実行部１３４Ａは、実行部１３４と同様に各種情報を実行する。実行部１３４Ａは、実行部１３４と同様に各種情報を生成する。

　実行部１３４Ａは、取得部１３１により取得された各種情報に基づいて、各種情報を生成する。実行部１３４Ａは、特定部１３２により決定された各種情報に基づいて、各種情報を生成する。実行部１３４Ａは、補正部１３３により補正された各種情報に基づいて、各種情報を生成する。実行部１３４Ａは、仮想キャラクタに設定された属性に対応する対応ユーザの動き情報に基づいて、仮想キャラクタの動き情報を生成する。実行部１３４Ａは、仮想キャラクタに設定された属性に類似する類似ユーザの動き情報を用いて、仮想キャラクタの動き情報を生成する。実行部１３４Ａは、類似ユーザの動きの傾向を利用して仮想キャラクタの動き情報を生成する。例えば、実行部１３４Ａは、類似ユーザの動き情報に類似するように、仮想キャラクタの動き情報を生成する。実行部１３４Ａは、生成対象の仮想キャラクタの動き情報を、類似ユーザの動き情報に近づくように生成する。

　実行部１３４Ａは、種々の技術を適宜用いて、外部の情報処理装置へ提供する画面（画像情報）等の種々の情報を生成する。実行部１３４Ａは、端末装置１０へ提供する画面（画像情報）等を生成する。例えば、実行部１３４Ａは、記憶部１２０に記憶された情報に基づいて、端末装置１０へ提供する画面（画像情報）等を生成する。実行部１３４Ａは、仮想キャラクタＶＣ２１を含むコンテンツＣＴ２１を生成する。実行部１３４Ａは、外部の情報処理装置へ提供するコンテンツ（画像情報）等が生成可能であれば、どのような処理によりコンテンツ（画像情報）等を生成してもよい。例えば、実行部１３４Ａは、画像生成や画像処理等に関する種々の技術を適宜用いて、端末装置１０へ提供するコンテンツ（画像情報）を生成する。例えば、実行部１３４Ａは、Ｊａｖａ（登録商標）等の種々の技術を適宜用いて、端末装置１０へ提供するコンテンツ（画像情報）を生成する。なお、実行部１３４Ａは、ＣＳＳやＪａｖａＳｃｒｉｐｔ（登録商標）やＨＴＭＬの形式に基づいて、端末装置１０へ提供するコンテンツ（画像情報）を生成してもよい。また、例えば、実行部１３４Ａは、ＪＰＥＧやＧＩＦやＰＮＧなど様々な形式でコンテンツ（画像情報）を生成してもよい。

　送信部１３５は、実行部１３４Ａにより生成されたコンテンツを端末装置１０に送信する。例えば、送信部１３５は、仮想キャラクタＶＣ２１を含むコンテンツＣＴ２１を端末装置１０に送信する。

［２－３．発話を用いた部位特定例］
　情報処理装置１００Ａは、外形情報に限らず、種々の情報を適宜用いて、主部位や関連部位を特定してもよい。この点について、以下説明する。なお、以下の説明では、図１０と同様の点については適宜説明を省略する。

　情報処理装置１００Ａは、発話内容を考慮した身体部位を強調してもよい。この点について、図１２を用いて説明する。図１２は、発話を用いた部位特定の一例を示す図である。図１２は、発話情報を用いた主部位の特定の一例を示す。情報処理装置１００Ａは、音声発話の内容からユーザの意図（Ｉｎｔｅｎｔ）を推定（取得）し、主部位の特定と強調に用いる動きデータの選択を行う。そのユースケースの一例として、図１２では、アイドルアバター（例えば図１０中の仮想キャラクタＶＣ２１等）の利用時に「やってみよう」と発話しながら手を挙げる動作をした場合に、強調すべき個所の動作情報を選択して利用する場合を示す。

　図１２の例では、ユーザＵ１は、状態ＳＴ３１から状態ＳＴ３２に対応するユーザＵ１の左手を挙げる動作を行う（ステップＳ３１）。そして、ユーザＵ１は、ユーザＵ１の左手を挙げる動作とともに「やってみよう」という発話ＵＴ３１を行う。

　そして、情報処理装置１００Ａは、自然言語理解（ＮＬＵ）の機能によりユーザの発話の意図を推定し、推定した意図（Ｉｎｔｅｎｔ）に対応する情報（以下「部位動作情報」ともいう）を取得する（ステップＳ３２）。情報処理装置１００Ａは、Ｉｎｔｅｎｔ別主部位・関連部位・動作情報を記憶したデータベースＤＢ３１から推定した意図（Ｉｎｔｅｎｔ）に対応する部位動作情報を取得する。例えば、情報処理装置１００Ａは、Ｉｎｔｅｎｔ別主部位・関連部位・動作情報を記憶した記憶部１２０から推定した意図（Ｉｎｔｅｎｔ）に対応する部位動作情報を取得する。

　図１２の例では、情報処理装置１００Ａは、発話ＵＴ３１に対するユーザの意図をオブジェクトのサイズを変更する意図であると推定する。そして、情報処理装置１００Ａは、推定した意図（Ｉｎｔｅｎｔ）に対応するＩｎｔｅｎｔ「ＬＥＴＳ＿ＧＥＴ＿ＳＴＡＲＴＥＤ」であるＩｎｔｅｎｔ別主部位・関連部位・動作情報をデータベースＤＢ３１から抽出する。情報処理装置１００Ａは、Ｉｎｔｅｎｔ「ＬＥＴＳ＿ＧＥＴ＿ＳＴＡＲＴＥＤ」であり、その主部位が「ＬＥＦＴ＿ＡＲＭ」であるＩｎｔｅｎｔ別主部位・関連部位・動作情報ＩＮＦ３１を抽出する。なお、「ＬＥＦＴ＿ＡＲＭ」は「ＬＥＦＴ＿ＷＲＩＳＴ」や「Ｌ＿ＷＲＩＳＴ」と同義であってもよい。Ｉｎｔｅｎｔ別主部位・関連部位・動作情報ＩＮＦ３１には、各関連部位をどの程度補正するかを示す補正量情報を、関連部位の各々に対応付けた情報（動作強調データ）を含んでもよい。

　情報処理装置１００Ａは、ユーザＵ１の発話の意図を基に、左手ＬＷを主部位に特定する。これにより、情報処理装置１００Ａは、状態ＳＴ３３に示すように、右手ＲＷを主部位Ｍ３１として特定する（ステップＳ３３）。

　そして、情報処理装置１００Ａは、関連部位を特定する（ステップＳ３４）。情報処理装置１００Ａは、ユーザＵ１の発話意図に対応する主部位Ｍ３１以外の部位のうち、動作している部位を関連部位として特定する。図１２の例では、情報処理装置１００Ａは、状態ＳＴ３３に示すように、右手ＲＷを関連部位Ｒ３１として特定し、右足ＲＬを関連部位Ｒ３２として特定し、左足ＬＬを関連部位Ｒ３３として特定する。例えば、情報処理装置１００Ａは、Ｉｎｔｅｎｔ別主部位・関連部位・動作情報ＩＮＦ３１に含まれる補正量情報を用いて、関連部位の動作を強調する補正を行う。

　そして、情報処理装置１００Ａは、動作を補正する処理を行う（ステップＳ３５）。情報処理装置１００Ａは、関連部位の動作を強調する補正を行う。図１の例では、情報処理装置１００Ａは、関連部位Ｒ３１である右手ＲＷの動作と関連部位Ｒ３２である右足ＲＬの動作と関連部位Ｒ３３である左足ＬＬの動作を強調する補正を行う。すなわち、情報処理装置１００Ａは、状態ＳＴ３４の右手ＲＷ、右足ＲＬ及び左足ＬＬの各々の位置を、状態ＳＴ３２の右手ＲＷ、右足ＲＬ及び左足ＬＬの各々の位置からさらに離れる方向に移動させる補正を行う。例えば、情報処理装置１００Ａは、状態ＳＴ３４の右手ＲＷの位置をさらに胴体ＢＤから広げる方向に移動させる補正を行う。例えば、情報処理装置１００Ａは、状態ＳＴ３４の右足ＲＬ及び左足ＬＬを、さらに内股にする方向に移動させる補正を行う。これにより、情報処理装置１００Ａは、状態ＳＴ３５に示すような手の動きが大きく、足が内股に強調された動きに補正する。

　また、情報処理装置１００Ａは、ユーザＵ１の手挙げ不足により、主部位Ｍ３１である左手ＬＷについても動きが不足しているため場合、左手ＬＷの動きについても強調する。図１２の例では、情報処理装置１００Ａは、ユーザＵ１が左手を斜めにあげ、挙げ方が十分でないため、左手ＬＷの位置を状態ＳＴ３５に示すように、左手ＬＷが上方向に挙がるように動き情報を強調する。例えば、情報処理装置１００Ａは、Ｉｎｔｅｎｔ別主部位・関連部位・動作情報ＩＮＦ３１に含まれる主部位に関する補正量情報を用いて、主部位の動作を強調する補正を行う。この場合、Ｉｎｔｅｎｔ別主部位・関連部位・動作情報ＩＮＦ３１には、各主部位をどの程度補正するかを示す補正量情報を、主部位の各々に対応付けた情報（動作強調データ）を含む。

　このように、情報処理装置１００Ａは、ユーザの発話の意図解析からＩｎｔｅｎｔを発話推定し、Ｉｎｔｅｎｔ別主部位・関連部位・動作情報から主部位を特定する。これにより、情報処理装置１００Ａは、ユーザの行う主部位の動きが小さいなどの理由により、身体部位の動き量だけでは主部位の特定ができない場合であっても、ユーザの発話情報を利用することで適切に主部位を特定することができる。そして、情報処理装置１００Ａは、Ｉｎｔｅｎｔに紐づく主部位情報と動作強調データを利用して強調を行う。これにより、情報処理装置１００Ａは、動きが不足している主部位の動きの強調や、動きが不足している関連部位の動きの強調を行うことができる。このように、情報処理装置１００Ａは、動き情報をアバターの属性に適した動き情報に補正することができ、より適切な動作を行うアバターを用いたサービスを提供することを可能にすることができる。

［２－４．属性に応じた情報利用例］
　なお、上記は一例であり、種々の情報を適宜用いて、部位の特定や動きの補正を行ってもよい。この点について、以下説明する。なお、以下の説明では、上述した説明と同様の点については適宜説明を省略する。以下では、情報処理装置１００Ａを一例として説明するが、以下の処理などは情報処理装置１００が行ってもよい。

　例えば、情報処理装置１００Ａは、属性に応じた情報利用を行ってもよい。この点について、図１３を用いて説明する。図１３は、属性に応じた情報利用の一例を示す図である。以下では、そのユースケースの一例として、事前定義されていない動きデータの取得する場合を示す。図１３では、例えば、身体部位の動きのキャンセル・抑制・強調を行うための情報源となる「主部位・関連部位情報」を自動的に取得する方法の一例を示す。

　図１３の例では、属性情報ＩＮＦ４１に示すように、仮想キャラクタＶＣ２１は、性別が女性であり、年齢が２０代であり、髪型がロングヘアであり、身長が１５５ｃｍであり、体重が５０キロであり、関東地方に居住する設定である場合を示す。

　情報処理装置１００Ａは、属性の近いユーザの動きからデータを生成する（ステップＳ４１）。情報処理装置１００Ａは、仮想キャラクタＶＣ２１の属性に近いユーザの動きから仮想キャラクタＶＣ２１のデータを生成する。情報処理装置１００Ａは、仮想キャラクタＶＣ２１の属性に類似する類似ユーザの動きから仮想キャラクタＶＣ２１のデータを生成する。例えば、情報処理装置１００Ａは、２０代女性のユーザを類似ユーザとして抽出し、その類似ユーザの動きから仮想キャラクタＶＣ２１のデータを生成する。

　例えば、情報処理装置１００Ａは、類似ユーザを対象として、一定時間間隔で動き量を測定する。そして、情報処理装置１００Ａは、測定した動き量を仮想キャラクタＶＣ２１に対応付けて記憶部１２０Ａに記憶する。情報処理装置１００Ａは、測定した動き量を含むデータＤＴ４１を仮想キャラクタＶＣ２１に対応付けて記憶する。情報処理装置１００Ａは、状態ＳＴ４１に示すような動き量を示す動き情報を仮想キャラクタＶＣ２１に対応付けて記憶する。

　例えば、情報処理装置１００Ａは、類似ユーザを対象として、発話時の時間近傍データを測定する。そして、情報処理装置１００Ａは、測定した動き量を仮想キャラクタＶＣ２１に対応付けて記憶部１２０Ａに記憶する。情報処理装置１００Ａは、測定した動き量を含むデータＤＴ４２を仮想キャラクタＶＣ２１に対応付けて記憶する。情報処理装置１００Ａは、状態ＳＴ４２に示すような動き量を示す動き情報を仮想キャラクタＶＣ２１に対応付けて記憶する。

　このように、情報処理装置１００Ａは、アバター設定と同じまたは類似する属性のユーザの動きをデータとして取得する。これにより、情報処理装置１００Ａは、主部位と関連部位との関係を示す情報や各部位の動き量を示す情報を自動的に取得することができる。

［２－５．動作編集例］
　また、例えば、情報処理装置１００Ａは、動作編集の履歴情報の利用を行ってもよい。この点について、図１４を用いて説明する。図１４は、動作編集の一例を示す図である。以下では、そのユースケースの一例として、事前定義されていない動きデータの取得する場合を示す。図１４では、例えば、身体部位の動きのキャンセル・抑制・強調を行うための情報源となる「主部位・関連部位情報」を自動的に取得する方法の一例を示す。

　情報処理装置１００Ａは、アバターの動き編集履歴から期待される動きデータを取得する。情報処理装置１００Ａは、ＳＮＳ（Social　Networking　Service）用コンテンツ等の編集ツールとしてアバターの動きを修正できる機能がある場合、その機能により修正（編集）された履歴情報を取得する。また、情報処理装置１００Ａは、撮影後の編集（ＰＣ等）操作によって生成られた完成データから情報を取得してもよい。例えば、情報処理装置１００Ａは、編集前のデータ（生データ）と、編集後のデータ（完成データ）との差分を編集情報として取得してもよい。

　図１４では、ユーザＵ１が端末装置１０のマウス等の入力部１２を操作することにより、生データを編集し完成データを生成する場合を一例として示す。図１４では、ユーザＵ１は、端末装置１０の表示部１６に表示された人を模した模型を所定の編集ツールＴＬ５１を用いて操作することにより、動き情報を編集する（ステップＳ５１）。なお、ユーザＵ１は、データＤＴ５１に示すような文字情報を直接編集してもよい。

　ユーザＵ１は、状態ＳＴ５１に対応するデータＤＴ５１を編集することにより、状態ＳＴ５２に対応するデータＤＴ５２を生成する。これにより、ユーザＵ１は、生データであるデータＤＴ５１を編集することにより、完成データであるデータＤＴ５２を生成する。例えば、情報処理装置１００Ａは、ユーザＵ１の編集に対応する編集情報ＥＤ５１をデータＤＴ５１に追加することにより、データＤＴ５２を生成する。情報処理装置１００Ａは、関連部位Ｒ５２、Ｒ５３である右足ＲＬ及び左足ＬＬの動きが編集されたデータＤＴ５２を生成する。例えば、情報処理装置１００Ａは、ユーザＵ１が右足ＲＬ及び左足ＬＬの動を調整したことに応じて、動き情報の関連部位に右足ＲＬ及び左足ＬＬを追加する。

　情報処理装置１００Ａは、上述のような編集履歴を取得し、取得した編集履歴を用いて、データを補正する。情報処理装置１００Ａは、編集履歴を用いて、仮想キャラクタの動き情報を補正する。情報処理装置１００Ａは、編集履歴に含まれる過去の補正の傾向を利用して仮想キャラクタの動き情報を補正する。例えば、情報処理装置１００Ａは、初期に自動生成された生データから、完成データを自動生成してもよい。

［３．その他の実施形態］
　上述した各実施形態に係る処理は、上記各実施形態や変形例以外にも種々の異なる形態（変形例）にて実施されてよい。

［３－１．その他の構成例］
　なお、上記の例では、情報処理装置１００や情報処理装置１００Ａと端末装置１０とが別体である場合を示したが、これらの装置は一体であってもよい。すなわち、コンテンツの生成を行う装置（情報処理装置１００等）と、コンテンツ等の情報を表示する装置（端末装置１０等）とは一体であってもよい。例えば、ユーザが利用する装置がコンテンツの生成を行う機能と情報の表示やユーザによる入力の受付けを行う機能を有する情報処理装置であってもよい。この場合、例えば、情報処理装置はテレビ等であってもよく、情報処理装置はユーザによる入力を受け付ける端末装置（スマートスピーカやスマートフォン等）からユーザの入力情報を取得し、取得した情報を用いてコンテンツを生成し表示してもよい。

［３－２．その他］
　また、上記各実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。

　また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。

　また、上述してきた各実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。

　また、本明細書に記載された効果はあくまで例示であって限定されるものでは無く、他の効果があってもよい。

［４．本開示に係る効果］
　上述のように、本開示に係る情報処理装置（実施形態では情報処理装置１００、１００Ａ）は、取得部（実施形態では取得部１３１、１３１Ａ）と、特定部（実施形態では特定部１３２、１３２Ａ）とを備える。取得部は、身体動作を行うユーザの外形を示す外形情報を取得する。特定部は、取得部により取得された外形情報に基づいて、身体部位のうち、身体動作に対応する主部位と、身体動作に対応する動き情報の補正処理の対象となる関連部位とを特定する。

　このように、本開示に係る情報処理装置は、身体動作を行うユーザの外形を示す外形情報に基づいて、身体部位のうち、身体動作に対応する主部位と、身体動作に対応する動き情報の補正処理の対象となる関連部位とを特定する。これにより、情報処理装置は、ユーザの主たる部位である主部位と、その他の部位であり補正処理の対象となる部位を特定することで、ユーザの身体動作に関する部位を適切に特定することができる。

　また、取得部は、センサにより検知された外形情報を取得する。これにより、情報処理装置は、センサにより検知された情報（センサ情報）を用いて、ユーザの身体動作に関する部位を適切に特定することができる。

　また、取得部は、画像センサにより検知された画像情報である外形情報を取得する。これにより、情報処理装置は、画像センサにより検知された情報（画像）を用いて、ユーザの身体動作に関する部位を適切に特定することができる。

　また、特定部は、身体動作の影響を取り消す対象となる関連部位を特定する。これにより、情報処理装置は、身体動作の影響を取り消す対象となる関連部位を特定することで、ユーザの身体動作に関する部位を適切に特定することができる。

　また、特定部は、身体動作の影響を強調する対象となる関連部位を特定する。これにより、情報処理装置は、身体動作の影響を強調する対象となる関連部位を特定することで、ユーザの身体動作に関する部位を適切に特定することができる。

　また、特定部は、ユーザの各身体部位の位置の変換量に基づいて、主部位を特定する。これにより、情報処理装置は、ユーザの各身体部位の位置の変換量に応じて主部位を特定することで、ユーザの身体動作に関する部位を適切に特定することができる。

　また、特定部は、身体部位のうち、位置の変換量が大きい部位を主部位に特定する。これにより、情報処理装置は、位置の変換量が大きい部位を主部位に特定することで、ユーザの身体動作に関する部位を適切に特定することができる。

　また、取得部は、ユーザの発話情報を取得する。特定部は、ユーザの発話情報に基づいて、主部位を特定する。これにより、情報処理装置は、外形情報と発話情報とを用いて主部位を特定することで、より精度よくユーザの身体動作に関する部位を適切に特定することができる。

　また、特定部は、ユーザの発話情報に基づいて、関連部位を特定する。これにより、情報処理装置は、外形情報と発話情報とを用いてユーザの発話情報に基づいて、関連部位を特定することで、より精度よくユーザの身体動作に関する部位を適切に特定することができる。

　また、特定部は、ユーザの発話内容により推定されるユーザの発話意図に基づいて、主部位を特定する。これにより、情報処理装置は、ユーザの発話内容により推定されるユーザの発話意図に応じて主部位を特定することで、より精度よくユーザの身体動作に関する部位を適切に特定することができる。

　また、特定部は、ユーザの発話意図に対応する主部位以外の部位のうち、動作している部位を関連部位として特定する。これにより、情報処理装置は、ユーザの発話意図に対応する部位以外で動作している部位を関連部位として特定することで、より精度よくユーザの身体動作に関する部位を適切に特定することができる。

　また、取得部は、主部位と関連部位との対応付けを示す定義情報を取得する。特定部は、定義情報に基づいて、関連部位を特定する。これにより、情報処理装置は、主部位と関連部位との対応付けを示す定義情報を用いて主部位を特定することで、より精度よくユーザの身体動作に関する部位を適切に特定することができる。

　また、取得部は、身体動作により入力を行うユーザの外形情報を取得する。特定部は、ユーザの入力に対応する主部位を特定する。これにより、情報処理装置は、身体動作により入力を行うユーザの身体動作に関する部位を適切に特定することができる。

　また、特定部は、主部位の動作に連動して動作する部位を関連部位として特定する。これにより、情報処理装置は、主部位の動作に連動して動作する部位を関連部位として特定することで、より精度よくユーザの身体動作に関する部位を適切に特定することができる。

　また、取得部は、身体動作により仮想キャラクタを動作させるユーザの外形情報を取得する。特定部は、仮想キャラクタの動作に対応する主部位と、補正処理の対象となる関連部位とを特定する。これにより、情報処理装置は、身体動作により仮想キャラクタを動作させるユーザの身体動作に関する部位を適切に特定することができる。

　また、取得部は、仮想キャラクタに設定された属性に対応する対応ユーザの動き情報を、仮想キャラクタの動き情報の生成に用いる情報として取得する。これにより、情報処理装置は、仮想キャラクタに設定された属性に対応するユーザの動き情報を用いることで、仮想キャラクタに類似するユーザの動き情報を利用して仮想キャラクタを動作させることができる。

　また、取得部は、仮想キャラクタの動作に関する編集履歴を、仮想キャラクタの動き情報の補正に用いる情報として取得する。これにより、情報処理装置は、仮想キャラクタの動作に関する編集履歴を用いて、仮想キャラクタの動き情報の補正することができ、過去の補正の傾向を利用して仮想キャラクタを動作させることができる。

　また、本開示に係る情報処理装置は、補正部（実施形態では補正部１３３、１３３Ａ）備える。補正部は、特定部により特定された関連部位に対応する動き情報を補正する。これにより、情報処理装置は、ユーザの身体動作の関連部位の動き情報を適切に補正することができる。

　また、補正部は、特定部により特定された主部位に対応する動き情報を補正する。これにより、情報処理装置は、ユーザの身体動作の主部位の動き情報を適切に補正することができる。

［５．ハードウェア構成］
　上述してきた各実施形態に係る情報処理装置１００、１００Ａや端末装置１０等の情報機器は、例えば図１５に示すような構成のコンピュータ１０００によって実現される。図１５は、情報処理装置１００、１００Ａや端末装置１０等の情報処理装置の機能を実現するコンピュータ１０００の一例を示すハードウェア構成図である。以下、第１の実施形態に係る情報処理装置１００を例に挙げて説明する。コンピュータ１０００は、ＣＰＵ１１００、ＲＡＭ１２００、ＲＯＭ（Read　Only　Memory）１３００、ＨＤＤ（Hard　Disk　Drive）１４００、通信インターフェイス１５００、及び入出力インターフェイス１６００を有する。コンピュータ１０００の各部は、バス１０５０によって接続される。

　ＣＰＵ１１００は、ＲＯＭ１３００又はＨＤＤ１４００に格納されたプログラムに基づいて動作し、各部の制御を行う。例えば、ＣＰＵ１１００は、ＲＯＭ１３００又はＨＤＤ１４００に格納されたプログラムをＲＡＭ１２００に展開し、各種プログラムに対応した処理を実行する。

　ＲＯＭ１３００は、コンピュータ１０００の起動時にＣＰＵ１１００によって実行されるＢＩＯＳ（Basic　Input　Output　System）等のブートプログラムや、コンピュータ１０００のハードウェアに依存するプログラム等を格納する。

　ＨＤＤ１４００は、ＣＰＵ１１００によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を非一時的に記録する、コンピュータが読み取り可能な記録媒体である。具体的には、ＨＤＤ１４００は、プログラムデータ１４５０の一例である本開示に係る情報処理プログラムを記録する記録媒体である。

　通信インターフェイス１５００は、コンピュータ１０００が外部ネットワーク１５５０（例えばインターネット）と接続するためのインターフェイスである。例えば、ＣＰＵ１１００は、通信インターフェイス１５００を介して、他の機器からデータを受信したり、ＣＰＵ１１００が生成したデータを他の機器へ送信したりする。

　入出力インターフェイス１６００は、入出力デバイス１６５０とコンピュータ１０００とを接続するためのインターフェイスである。例えば、ＣＰＵ１１００は、入出力インターフェイス１６００を介して、キーボードやマウス等の入力デバイスからデータを受信する。また、ＣＰＵ１１００は、入出力インターフェイス１６００を介して、ディスプレイやスピーカーやプリンタ等の出力デバイスにデータを送信する。また、入出力インターフェイス１６００は、所定の記録媒体（メディア）に記録されたプログラム等を読み取るメディアインターフェイスとして機能してもよい。メディアとは、例えばＤＶＤ（Digital　Versatile　Disc）、ＰＤ（Phase　change　rewritable　Disk）等の光学記録媒体、ＭＯ（Magneto-Optical　disk）等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。

　例えば、コンピュータ１０００が第１の実施形態に係る情報処理装置１００として機能する場合、コンピュータ１０００のＣＰＵ１１００は、ＲＡＭ１２００上にロードされた情報処理プログラムを実行することにより、制御部１３０等の機能を実現する。また、ＨＤＤ１４００には、本開示に係る情報処理プログラムや、記憶部１２０内のデータが格納される。なお、ＣＰＵ１１００は、プログラムデータ１４５０をＨＤＤ１４００から読み取って実行するが、他の例として、外部ネットワーク１５５０を介して、他の装置からこれらのプログラムを取得してもよい。

　なお、本技術は以下のような構成も取ることができる。
（１）
　身体動作を行うユーザの外形を示す外形情報を取得する取得部と、
　前記取得部により取得された前記外形情報に基づいて、身体部位のうち、前記身体動作に対応する主部位と、前記身体動作に対応する動き情報の補正処理の対象となる関連部位とを特定する特定部と、
　を備える情報処理装置。
（２）
　前記取得部は、
　センサにより検知された前記外形情報を取得する
　（１）に記載の情報処理装置。
（３）
　前記取得部は、
　画像センサにより検知された画像情報である前記外形情報を取得する
　（２）に記載の情報処理装置。
（４）
　前記特定部は、
　前記身体動作の影響を取り消す対象となる前記関連部位を特定する
　（１）～（３）のいずれか１項に記載の情報処理装置。
（５）
　前記特定部は、
　前記身体動作の影響を強調する対象となる前記関連部位を特定する
　（１）～（３）のいずれか１項に記載の情報処理装置。
（６）
　前記特定部は、
　前記ユーザの各身体部位の位置の変換量に基づいて、前記主部位を特定する
　（１）～（５）のいずれか１項に記載の情報処理装置。
（７）
　前記特定部は、
　前記身体部位のうち、位置の変換量が大きい部位を前記主部位に特定する
　（６）に記載の情報処理装置。
（８）
　前記取得部は、
　前記ユーザの発話情報を取得し、
　前記特定部は、
　前記ユーザの発話情報に基づいて、前記主部位を特定する
　（１）～（７）のいずれか１項に記載の情報処理装置。
（９）
　前記特定部は、
　前記ユーザの発話情報に基づいて、前記関連部位を特定する
　（８）に記載の情報処理装置。
（１０）
　前記特定部は、
　前記ユーザの発話内容により推定される前記ユーザの発話意図に基づいて、前記主部位を特定する
　（８）または（９）に記載の情報処理装置。
（１１）
　前記特定部は、
　前記ユーザの発話意図に対応する前記主部位以外の部位のうち、動作している部位を前記関連部位として特定する
　（１０）に記載の情報処理装置。
（１２）
　前記取得部は、
　前記主部位と前記関連部位との対応付けを示す定義情報を取得し、
　前記特定部は、
　前記定義情報に基づいて、前記関連部位を特定する
　（１）～（１１）のいずれか１項に記載の情報処理装置。
（１３）
　前記取得部は、
　前記身体動作により入力を行う前記ユーザの前記外形情報を取得し、
　前記特定部は、
　前記ユーザの前記入力に対応する前記主部位を特定する
　（１）～（１２）のいずれか１項に記載の情報処理装置。
（１４）
　前記特定部は、
　前記主部位の動作に連動して動作する部位を前記関連部位として特定する
　（１３）に記載の情報処理装置。
（１５）
　前記取得部は、
　前記身体動作により仮想キャラクタを動作させる前記ユーザの前記外形情報を取得し、
　前記特定部は、
　前記仮想キャラクタの動作に対応する前記主部位と、前記補正処理の対象となる前記関連部位とを特定する
　（１）～（１４）のいずれか１項に記載の情報処理装置。
（１６）
　前記取得部は、
　前記仮想キャラクタに設定された属性に対応する対応ユーザの動き情報を、前記仮想キャラクタの動き情報の生成に用いる情報として取得する
　（１５）に記載の情報処理装置。
（１７）
　前記取得部は、
　前記仮想キャラクタの動作に関する編集履歴を、前記仮想キャラクタの動き情報の補正に用いる情報として取得する
　（１５）または（１６）に記載の情報処理装置。
（１８）
　前記特定部により特定された前記関連部位に対応する前記動き情報を補正する補正部、
　をさらに備える（１）～（１７）のいずれか１項に記載の情報処理装置。
（１９）
　前記補正部は、
　前記特定部により特定された前記主部位に対応する前記動き情報を補正する
　（１８）に記載の情報処理装置。
（２０）
　身体動作を行うユーザの外形を示す外形情報を取得し、
　取得した前記外形情報に基づいて、身体部位のうち、前記身体動作に対応する主部位と、前記身体動作に対応する情報の補正処理の対象となる関連部位とを特定する、
　処理を実行する情報処理方法。

　１　情報処理システム
　１００、１００Ａ　情報処理装置
　１１０　通信部
　１２０、１２０Ａ　記憶部
　１２１　動作情報記憶部
　１２２　ユーザ情報記憶部
　１２３　部位情報記憶部
　１２４　機能情報記憶部
　１２５　コンテンツ生成用情報記憶部
　１３０、１３０Ａ　制御部
　１３１　取得部
　１３２　特定部
　１３３、１３３Ａ　補正部
　１３４、１３４Ａ　実行部
　１３５　送信部
　１０　端末装置
　１１　通信部
　１２　入力部
　１３　出力部
　１４　記憶部
　１５　制御部
　１５１　受信部
　１５２　実行部
　１５３　受付部
　１５４　送信部
　１６　表示部

Claims

　身体動作を行うユーザの外形を示す外形情報を取得する取得部と、
　前記取得部により取得された前記外形情報に基づいて、身体部位のうち、前記身体動作に対応する主部位と、前記身体動作に対応する動き情報の補正処理の対象となる関連部位とを特定する特定部と、
　を備える情報処理装置。
　前記取得部は、
　センサにより検知された前記外形情報を取得する
　請求項１に記載の情報処理装置。
　前記取得部は、
　画像センサにより検知された画像情報である前記外形情報を取得する
　請求項２に記載の情報処理装置。
　前記特定部は、
　前記身体動作の影響を取り消す対象となる前記関連部位を特定する
　請求項１に記載の情報処理装置。
　前記特定部は、
　前記身体動作の影響を強調する対象となる前記関連部位を特定する
　請求項１に記載の情報処理装置。
　前記特定部は、
　前記ユーザの各身体部位の位置の変換量に基づいて、前記主部位を特定する
　請求項１に記載の情報処理装置。
　前記特定部は、
　前記身体部位のうち、位置の変換量が大きい部位を前記主部位に特定する
　請求項６に記載の情報処理装置。
　前記取得部は、
　前記ユーザの発話情報を取得し、
　前記特定部は、
　前記ユーザの発話情報に基づいて、前記主部位を特定する
　請求項１に記載の情報処理装置。
　前記特定部は、
　前記ユーザの発話情報に基づいて、前記関連部位を特定する
　請求項８に記載の情報処理装置。
　前記特定部は、
　前記ユーザの発話内容により推定される前記ユーザの発話意図に基づいて、前記主部位を特定する
　請求項８に記載の情報処理装置。
　前記特定部は、
　前記ユーザの発話意図に対応する前記主部位以外の部位のうち、動作している部位を前記関連部位として特定する
　請求項１０に記載の情報処理装置。
　前記取得部は、
　前記主部位と前記関連部位との対応付けを示す定義情報を取得し、
　前記特定部は、
　前記定義情報に基づいて、前記関連部位を特定する
　請求項１に記載の情報処理装置。
　前記取得部は、
　前記身体動作により入力を行う前記ユーザの前記外形情報を取得し、
　前記特定部は、
　前記ユーザの前記入力に対応する前記主部位を特定する
　請求項１に記載の情報処理装置。
　前記特定部は、
　前記主部位の動作に連動して動作する部位を前記関連部位として特定する
　請求項１３に記載の情報処理装置。
　前記取得部は、
　前記身体動作により仮想キャラクタを動作させる前記ユーザの前記外形情報を取得し、
　前記特定部は、
　前記仮想キャラクタの動作に対応する前記主部位と、前記補正処理の対象となる前記関連部位とを特定する
　請求項１に記載の情報処理装置。
　前記取得部は、
　前記仮想キャラクタに設定された属性に対応する対応ユーザの動き情報を、前記仮想キャラクタの動き情報の生成に用いる情報として取得する
　請求項１５に記載の情報処理装置。
　前記取得部は、
　前記仮想キャラクタの動作に関する編集履歴を、前記仮想キャラクタの動き情報の補正に用いる情報として取得する
　請求項１５に記載の情報処理装置。
　前記特定部により特定された前記関連部位に対応する前記動き情報を補正する補正部、
　をさらに備える請求項１に記載の情報処理装置。
　前記補正部は、
　前記特定部により特定された前記主部位に対応する前記動き情報を補正する
　請求項１８に記載の情報処理装置。
　身体動作を行うユーザの外形を示す外形情報を取得し、
　取得した前記外形情報に基づいて、身体部位のうち、前記身体動作に対応する主部位と、前記身体動作に対応する情報の補正処理の対象となる関連部位とを特定する、
　処理を実行する情報処理方法。