WO2022176440A1

WO2022176440A1 - 受信装置、送信装置、情報処理方法、プログラム

Info

Publication number: WO2022176440A1
Application number: PCT/JP2022/000744
Authority: WO
Inventors: 修一郎錦織; 裕史竹田; 高弘渡邉
Original assignee: ソニーグループ株式会社
Priority date: 2021-02-18
Filing date: 2022-01-12
Publication date: 2022-08-25
Also published as: US20240307764A1; CN116848498A; DE112022001118T5

Abstract

受信装置は、触覚信号の再生可否情報と音響信号が含まれるデータを受信する受信処理部と、前記受信処理部が受信する前記音響信号に基づいて前記触覚信号の生成を行う触覚信号生成部と、を備え、前記触覚信号生成部は、前記再生可否情報が再生可を示す場合に前記触覚信号の生成を行い、前記再生可否情報が再生不可を示す場合に前記触覚信号の生成を行わないものとした。

Description

受信装置、送信装置、情報処理方法、プログラム

　本技術は、触覚提示に係るデータの送受信を行うための受信装置、送信装置、情報処理方法、プログラムの技術分野に関する。

　ユーザに対して視覚情報や聴覚情報の提示に合わせて触覚刺激を与えるための技術が開発されている。触覚提示とは、振動や圧力等により物に触れた触感や衝突したときの触覚をユーザに体感させることを意味する。
　ユーザに触覚刺激を提供するためには、触覚刺激についての触覚信号が必要となる。触覚信号は、例えば、ユーザに各種のセンサを取り付け、当該センサによって計測された測定値に基づいて生成される。
　ところが、このような触覚信号を生成するための環境を十分に整えるためには金銭的及び時間的なコストが必要となる。
　このような状況に鑑みて、例えば、下記特許文献１においては、音響信号（音声信号）を用いて触覚信号を生成する技術が開示されている。

特開２０１５－０５３０３７号公報

　音響信号から生成された触覚信号は、音響信号と共に無線伝送されて再生装置に提供されることが考えられるが、通信帯域が限られていることや触覚信号を通信するための通信方式を新たに確立する必要があるという問題がある。

　また、音響信号においては、爆発音などのように触覚刺激の提示に適した信号だけでなく背景音楽やセリフなどのように触覚刺激の提示に不適な信号も含まれている。
　このような不要な音響信号に対応して生成された触覚刺激は、ユーザにとって臨場感を向上させる効果がないだけでなく、不快感をもたらすことになり兼ねない。

　本技術はこのような問題に鑑みて為されたものであり、ユーザに対して適切な触覚刺激を提示する環境を提供することを目的とする。

　本技術に係る受信装置は、触覚信号の再生可否情報と音響信号が含まれるデータを受信する受信処理部と、前記受信処理部が受信する前記音響信号に基づいて前記触覚信号の生成を行う触覚信号生成部と、を備え、前記触覚信号生成部は、前記再生可否情報が再生可を示す場合に前記触覚信号の生成を行い、前記再生可否情報が再生不可を示す場合に前記触覚信号の生成を行わないものである。
　これにより、音響信号に合わせた触覚提示を行わない区間を作ることが可能となる。例えば、音響信号に合わせた触覚提示が適切でない区間については触覚信号の生成を行わないことを示す再生可否情報を設定することが可能となる。

　上記した受信装置においては、所定時間ごとに区切られた前記音響信号とされた音響フレームデータごとに前記再生可否情報が設けられ、前記触覚信号生成部は、再生可を示す前記再生可否情報に対応する前記音響フレームデータに基づく前記触覚信号の生成を行い、再生不可を示す前記再生可否情報に対応する前記音響フレームデータに基づく前記触覚信号の生成を行わなくてもよい。
　音響フレームデータごとに再生可否情報が設けられることで、触覚信号が生成される区間を細かく設定することができる。

　上記した受信装置において、前記再生可否情報は１ビットから成るフラグ情報とされていてもよい。
　これにより、受信処理部が受信するデータのデータ量が小さくされる。

　上記した受信装置において、前記受信データは、音響データの符号化方式で符号化された符号化データとされ、前記符号化データは、前記音響フレームデータが記憶されるペイロード領域と予約領域とを含む構造とされ、前記再生可否情報は前記予約領域に記憶されてもよい。
　再生可否情報が予約領域に記憶されることで、音響フレームデータを伝送する仕組みを利用して再生可否情報の受信が実現される。

　上記した受信装置において、前記再生可否情報は、前記音響フレームデータと同期して再生される部分動画像データに基づいて生成されてもよい。
　音響フレームデータから取得される音響信号から触覚刺激をユーザに提供すべきか否かを判定できない場合が存在する。本構成により、音響フレームデータに基づいて適切でない再生可否情報が生成されてしまうことが防止される。

　上記した受信装置における前記触覚信号生成部は、生成された前記触覚信号についてのフェードイン処理及びフェードアウト処理を行ってもよい。
　フェードイン処理やフェードアウト処理などのフェード処理は、時間の経過に伴って徐々に信号を大きくする処理や徐々に信号を小さくする処理であり、例えば所定のゲイン関数を掛ける処理である。触覚提示の開始時及び終了時において適切なフェード処理を行うことにより、触覚提示の開始と終了をスムーズに行うことができ、自然な触覚体験を与えることができる。

　上記した受信装置における前記触覚信号生成部は、対象の音響フレームデータに対応する前記再生可否情報が再生可を示し且つ前記対象の音響フレームデータの一つ前の音響フレームデータである直前音響フレームデータに対応する前記再生可否情報が再生不可を示す場合に前記対象の音響フレームデータから生成した前記触覚信号に対するフェードイン処理を行い、前記対象の音響フレームデータに対応する前記再生可否情報が再生不可を示し且つ前記直前音響フレームデータに対応する前記再生可否情報が再生可を示す場合に前記直前音響フレームデータから生成した前記触覚信号に対するフェードアウト処理を行ってもよい。
　即ち、再生可否情報が変化するタイミングでフェードイン処理及びフェードアウト処理の何れかの処理が実行される。

　本技術に係る送信装置は、少なくとも音響信号を含むコンテンツデータに対する解析処理を行い触覚信号の再生可否を示す再生可否情報を生成する解析処理部と、前記再生可否情報と前記音響信号を送信する送信処理部と、を備えたものである。
　コンテンツデータを解析することにより、触覚提示を行うべき区間と行わない方がよい区間とを判定することができる。そして、解析結果に応じて再生可否情報を生成することで、コンテンツデータに合わせた触覚提示を行うことが可能となる。

　上記した送信装置における前記解析処理部は、所定時間ごとに区切られた前記音響信号である音響フレームデータごとに前記触覚信号の再生可否を判定し、前記送信処理部は、前記音響フレームデータごとに前記再生可否情報を対応付けて前記送信を行ってもよい。
　音響フレームデータごとに再生可否情報が設定されることで、触覚信号が生成される区間を細かく設定することができる。

　上記した送信装置においては、前記音響フレームデータと該音響フレームデータに対応した前期再生可否情報とを含む符号化データを生成する符号化部を備え、前記送信処理部は、前記送信において前記符号化データを送信してもよい。
　これにより、所定のデータ構造とされた規格化された符号化データが送信される。

　上記した送信装置における解析処理部は、前記音響信号の解析結果に基づいて前記再生可否情報を生成してもよい。
　これにより、音響信号に合わせて触覚提示を行うことが適切か否かを判定することができる。

　上記した送信装置において、前記コンテンツデータは前記音響信号と同期して再生される動画像データを含み、前記解析処理部は、前記動画像データに対する解析処理を行い、前記動画像データの解析結果に基づいて前記再生可否情報を生成してもよい。
　コンテンツデータに映像が含まれる場合には、音に合わせた触覚刺激がユーザに提示されるだけでなく、映像に合わせた触覚刺激がユーザに提示される方が好ましい場合もある。本構成によれば、動画像データについての解析処理が行われることで、映像に合わせて触覚刺激を提示すべきシーンであるか否かの判定を行うことができる。

　上記した送信装置における前記解析処理部は、前記音響フレームデータにおけるスペクトル平坦度に基づいて前記再生可否情報を生成してもよい。
　これにより、音響フレームデータのスペクトル平坦度そのものやスペクトル平坦度の増加率などによって触覚提示を行うべきか否かを判定することが可能となり、適切な触覚提示が行われる可能性を高めることができる。

　上記した送信装置における前記解析処理部は、前記音響フレームデータにおける閾値以下の周波数成分のパワースペクトルの合計値に基づいて前記再生可否情報を生成してもよい。
　これにより、音響フレームデータにおける低周波成分のパワースペクトルの合計値や、その増加率などによって触覚提示を行うべきか否かを判定することができる。

　上記した送信装置における前記解析処理部は、前記動画像データにおける複数の画素の輝度値の合計値に基づいて前記再生可否情報を生成してもよい。
　これにより、例えば、爆発シーンなどのように輝度値が大きく変化する場面を検出することができる。

　上記した送信装置における前記解析処理部は、前記動画像データにおいて所定以上の大きさの人の顔を検出したか否かに基づいて前記再生可否情報を生成してもよい。
　例えば、人の顔が大写しにされたシーンは、人が話しているシーンであることが推定される。そのようなシーンは人が話している声に応じて触覚提示を行ってしまうと、ユーザに不快感を与えてしまう場合がある。これを避けるために、人の顔が大写しにされたシーンを検出した場合には、触覚提示を行わないことを決定する。

　本技術に係る情報処理方法は、触覚信号の再生可否情報と音響信号が含まれるデータを受信し、前記再生可否情報が再生可を示す場合に前記受信した音響信号に基づいて前記触覚信号を生成し、前記再生可否情報が再生不可を示す場合に前記触覚信号の生成を行わないことを決定する処理を、コンピュータ装置が実行するものである。

　本技術に係る情報処理方法は、少なくとも音響信号を含むコンテンツデータに対する解析処理を行い触覚信号の再生可否を示す再生可否情報を生成し、前記再生可否情報と前記音響信号を送信する処理を、コンピュータ装置が実行するものである。

　本技術に係るプログラムは、触覚信号の再生可否情報と音響信号が含まれるデータを受信し、前記再生可否情報が再生可を示す場合に前記受信した音響信号に基づいて前記触覚信号を生成し、前記再生可否情報が再生不可を示す場合に前記触覚信号の生成を行わないことを決定する機能を、演算処理装置に実行させるものである。

　本技術に係るプログラムは、少なくとも音響信号を含むコンテンツデータに対する解析処理を行い触覚信号の再生可否を示す再生可否情報を生成し、前記再生可否情報と前記音響信号を送信する機能を、演算処理装置に実行させるものである。
　このような情報処理方法やプログラムによって、本技術の送信装置や受信装置を容易に実現することができる。

触覚提示システムの構成例を示す概略図である。ＶＯＤ方式のコンテンツデータを用いて音響出力及び触覚提示を実現するための送信装置と受信装置の一態様を示す概略図である。ネックバンドスピーカの斜視図である。記録メディアに記憶されたコンテンツデータを用いて音響出力及び触覚提示を実現するための送信装置と受信装置の一態様を示す概略図である。ゲームコンテンツについての音響出力及び触覚提示を実現するための送信装置と受信装置の一態様を示す概略図である。符号化データのデータ構造の一例を示す図である。送信装置の構成例を示すためのブロック図である。解析処理部の機能構成例を示すための図である。受信装置の構成例を示すためのブロック図である。復号部の機能構成例を示すための図である。ローパスフィルタの処理を施す前の音響フレームデータのパワースペクトルを示すグラフである。ローパスフィルタの処理を施した後の音響フレームデータのパワースペクトルを示すグラフである。フェードイン処理及びフェードアウト処理を施す前の触覚信号の一例を示す図である。ゲイン関数及びをフェード処理後の触覚信号の一例を示す図である。送信装置の処理フローの一例を示すフローチャートである。受信装置の処理フローの一例を示すフローチャートである。シーン情報を説明するための図である。シーン種別ＩＤとシーン内容の対応を説明するための図である。

　以下、添付図面を参照し、本技術に係る実施の形態を次の順序で説明する。
＜１．システム構成＞
＜２．符号化データのデータ構造＞
＜３．送信装置の構成＞
＜４．受信装置の構成＞
＜５．処理フロー＞
＜５－１．送信装置の処理フロー＞
＜５－２．受信装置の処理フロー＞
＜６．変形例＞
＜７．まとめ＞
＜８．本技術＞

＜１．システム構成＞
　本技術に係る触覚提示システム１の構成の概要について図１を参照して説明する。
　触覚提示システム１は、ユーザに対して触覚提示するための各種処理を行う。ここで、触覚提示とは、触覚信号を再生することによりユーザに触覚刺激を提供することを意味する。
　触覚提示システム１は、送信装置２と受信装置３と音響再生装置４と触覚再生装置５とを備えている。

　送信装置２は、音響信号が含まれたコンテンツデータＣＤを取得し、コンテンツデータＣＤから音響信号を取得する処理を行う。また、送信装置２は、取得した音響信号を所定時間ごとに区切られた音響信号である音響フレームデータＳＦＤに分割する処理を行う。所定時間とは、例えば数十ｍｓｅｃなどのように比較的短い時間とされる。
　送信装置２は、音響フレームデータＳＦＤごとに符号化処理を行い、符号化データＥＤを生成する。送信装置２は、符号化データＥＤを受信装置３に送信する。

　また、後述するが、符号化データＥＤには、再生長が所定時間とされた音響フレームデータＳＦＤに同期させた触覚信号の再生を行うか否かを示す再生可否情報が含まれている。再生可否情報は、送信装置２による音響フレームデータＳＦＤごとの解析処理によって生成されてもよいし、それ以外のデータ区切りごとの解析処理によって生成されてもよい。

　再生可否情報は、再生可を示す１または再生不可を示す０の何れかとされた情報とされ、例えば、１ビットから成るフラグ情報であってもよい。以降の説明においては、再生可否情報の一態様として１ビットから成るフラグ情報を用いると共に、再生可否情報を「触覚再生フラグＰＦ」と記載する。

　なお、コンテンツデータＣＤに映像信号が含まれている場合には、音響フレームデータＳＦＤに同期させて再生される映像信号である部分動画像データに基づいて触覚再生フラグＰＦが生成されてもよい。
　即ち、コンテンツデータＣＤの音響信号または映像信号に基づいてユーザに対する触覚提示の有無が定められる。

　なお、送信装置２は、音響信号が含まれたコンテンツデータＣＤを他の情報処理装置から取得してもよいし、記憶メディアから読み出すことによって取得してもよいし、送信装置２の内部に設けられた記憶部から取得してもよい。

　受信装置３は、送信装置２から受信した符号化データＥＤの復号処理を行うことにより、音響信号と再生可否情報を取得する。
　受信装置３は、音響信号を音響再生装置４に送信することによりユーザに対する音響出力を実現する。
　また、受信装置３は、再生可否情報としての触覚再生フラグＰＦに基づいて触覚信号を生成し、触覚再生装置５に送信することによりユーザに対する触覚提示を実現する。

　音響再生装置４は、音響信号に基づく音響出力を行う装置であり、例えば、イヤフォンやヘッドフォンやスピーカ装置とされる。

　触覚再生装置５は、触覚信号に基づく触覚刺激をユーザに提供するための出力を行う装置であり、例えば、振動部を備えた装置や、水や空気などをユーザに対して吹きかける機能を備えた装置や、発熱部を備えた装置など、各種の形態が考えられる。以降の説明においては、主に振動子やアクチュエータを備えた振動部を有する装置を例に挙げる。

　なお、音響再生装置４や触覚再生装置５は、受信装置３とは異なる独立した装置として設けられていてもよいし、一方或いは双方が音響出力部や触覚再生部として受信装置３と一体に設けられていてもよい。

　ここで、送信装置２と受信装置３についてのより具体的な形態についていくつかの例を挙げて説明する。

　図２は、ＶＯＤ（Video On Demand）方式のコンテンツデータＣＤを用いて音響出力及び触覚提示を実現するための送信装置２Ａと受信装置３Ａの一態様である。送信装置２Ａは、スマートフォンやタブレット端末やテレビジョン受像機やＰＣ（Personal Computer）などとされる。送信装置２Ａは、コンテンツサーバ１００からコンテンツデータＣＤを受信し、生成した符号化データＥＤを受信装置３Ａとしてのネックバンドスピーカへ送信する。

　ネックバンドスピーカとしての受信装置３Ａの構成例を図３に示す。
　ネックバンドスピーカとしての受信装置３Ａは、首掛け式のスピーカ装置とされ、筐体６における左側の部分に配置された音響出力部７Ｌと右側の部分に配置された音響出力部７Ｒとを備えている。
　また、受信装置３Ａは、筐体６の左側の先端部に配置された触覚再生部８Ｌと、右側の先端部に配置された触覚再生部８Ｒとを備えている。
　さらに、受信装置３Ａは、電源ボタンなどの各種の操作子９を備えている。

　音響出力部７Ｌ，７Ｒは音響再生装置４の一態様である。また、触覚再生部８Ｌ，８Ｒは触覚再生装置５の一態様である。

　受信装置３Ａは、復号処理を行うことにより取得した音響フレームデータＳＦＤを音響出力部７Ｌ，７Ｒに出力する。また、受信装置３Ａは、取得した触覚再生フラグＰＦに基づいて音響フレームデータＳＦＤから触覚信号の生成を行い、該触覚信号を触覚再生部８Ｌ，８Ｒに出力する。
　即ち、図２に示す態様においては、ユーザは、送信装置２Ａが備える表示部（送信装置２Ａに接続されたモニタ装置も含む）に表示された画像を見ながら、受信装置３Ａが備える音響出力部７Ｌ，７Ｒから出力される音を聞き、触覚再生部８Ｌ，８Ｒにおいて再生される振動刺激を体感することにより、コンテンツを楽しむものである。

　図４は、ＣＤ－ＲＯＭ（Compact Disc Read Only Memory）やＤＶＤ（Digital Versatile Disc）やＢＤ（Blu-ray Disc（登録商標））などとされた記録メディアＲＭに記憶されたコンテンツデータＣＤを用いて音響出力及び触覚提示を実現するための送信装置２Ｂと受信装置３Ｂの一態様である。

　送信装置２Ｂは、記録メディアＲＭの読み取り機器や再生機器などとされ、記録メディアＲＭに記憶された映像信号をモニタ装置１０に送信することにより、モニタ装置１０において映像の表示が行われる。
　送信装置２Ｂは、記録メディアＲＭに記憶された音響信号に基づいて符号化データＥＤを生成し、受信装置３Ｂに送信する。

　受信装置３Ｂは、音響出力部７Ｌ，７Ｒを備えたヘッドフォンやイヤフォンなどの音響再生装置とされ、音響フレームデータの再生処理を行う。

　また、受信装置３Ｂは、触覚再生部を備えておらず、触覚再生フラグＰＦに基づいて触覚信号を生成し、該触覚信号をブレスレット型やベスト型などとされた触覚再生装置５Ｂへ送信する。
　触覚再生装置５Ｂは、受信した触覚信号の再生処理を行うことにより、触覚提示を行う。

　即ち、図４に示す態様においては、ユーザは、送信装置２Ｂに接続されたモニタ装置１０に表示された画像を見ながら、受信装置３Ｂが備える音響出力部７Ｌ，７Ｒから出力される音を聞き、触覚再生装置５Ｂにおいて再生される振動刺激を体感することにより、コンテンツを楽しむものである。

　図５は、ゲームを楽しむユーザに対する音響出力及び触覚提示を実現するための送信装置２Ｃと受信装置３Ｃの一態様である。

　送信装置２Ｃは、ゲーム機本体とされ、記録メディアＲＭや内部の記憶部に記憶されたゲームデータの再生を行う装置である。送信装置２Ｃは、ゲームデータに含まれる映像信号を送信装置２Ｃに接続されたモニタ装置１０（テレビジョン受像機でもよい）に送信することにより、モニタ装置１０において映像の表示が行われる。

　送信装置２Ｃは、ゲームデータに含まれる音響信号に基づいて符号化データＥＤを生成し、受信装置３Ｃに送信する。

　受信装置３Ｃは、触覚再生部８を備えたゲームコントローラなどとされ、符号化データＥＤに含まれる音響フレームデータから触覚再生フラグＰＦに基づいて生成された触覚信号の再生を行う。

　受信装置３Ｃは、符号化データＥＤに含まれる音響フレームデータを取得し、イヤフォンやヘッドフォンなどとされた音響再生装置４Ｃへ送信する。
　音響再生装置４Ｃは、受信した音響フレームデータの再生を行うことにより、音響出力を行う。

　即ち、図５に示す態様においては、ユーザは、送信装置２Ｃに接続されたモニタ装置１０に表示された画像を見ながら、受信装置３Ｃが備える触覚再生部において再生される触覚刺激を体感し、音響再生装置４Ｃから出力される音を聞くことにより、コンテンツを楽しむものである。
　また、図５に示す態様においては、ユーザの操作によって動くキャラクタの動きに応じた触覚刺激をユーザに体感させることができるため、ゲームへの没入間を高めることができる。

＜２．符号化データのデータ構造＞
　１フレーム分の符号化データＥＤのデータ構造について図６を参照して説明する。
　符号化データＥＤは、音響フレームデータＳＦＤを送信するためのデータ構造とされている。具体的には、ＳＢＣ（Sub Band Coding）やＭＰ３（MPEG1 Audio Layer-III）やＡＡＣ（Advanced Audio Coding）やＬＤＡＣなどのデータ構造を用いることができる。
　符号化データＥＤは、ヘッダ領域２０とペイロード領域２１を備えて構成されている。また、符号化データＥＤが更にチェック領域を備えて構成されていてもよい。

　ヘッダ領域２０は、シンクワード領域２２、ビットレート領域２３、サンプリングレート領域２４、チャンネルモード領域２５、予約領域２６から成る。

　シンクワード領域２２は、１フレーム分の符号化データＥＤの先頭を検出するために特定のビット列が格納される領域であり、例えば、０ｘＦＦＦＥなどのビット列がシンクワード領域２２に格納される。なお、「０ｘ」は１６進数を示すものであり、０ｘＦＦＦＥは、１６ビットのビット列のうち最後のビット（ＬＳＢ：Least Significant Bit）のみが「０」とされたものである。

　ビットレート領域２３は、ビットレートＩＤ（Identification）が格納される領域である。ビットレートＩＤは、例えば、２ビットから成るビット列によって音響フレームデータＳＦＤにおける１秒あたりのデータ量を表すビットレートを指定するためものである。
　具体的には、ビットレートＩＤは０～３の何れかの値を採り、「０」である場合には３２ｋｂｐｓを示し、「１」である場合には６４ｋｂｐｓを示し、「２」である場合には９６ｂｐｓを示し、「３」である場合には１２８ｋｂｐｓを示す。

　サンプリングレート領域２４は、サンプリングレートＩＤが格納される領域である。サンプリングレートＩＤは、例えば、２ビットから成るビット列によって音響フレームデータＳＦＤにおける１秒あたりのサンプル数を表すサンプリングレートを指定するためのものである。
　具体的には、サンプリングレートＩＤは０～３の何れかの値を採り、「０」である場合には１２ｋＨｚを示し、「１」である場合には２４ｋＨｚを示し、「２」である場合には４８ｋＨｚを示し、「３」である場合には９６ｋＨｚを示す。

　チャンネルモード領域２５は、チャンネルモードＩＤが格納される領域である。チャンネルモードＩＤは、例えば、２ビットから成るビット列によって音響フレームデータＳＦＤのチャンネルの組み合わせを指定するためのものである。
　具体的には、チャンネルモードＩＤは０～３の何れかの値を採り、「０」である場合には音響フレームデータＳＦＤがモノラルの信号であることを示し、「１」である場合には音響フレームデータＳＦＤがステレオの信号であることを示し、「２」である場合には音響フレームデータＳＦＤが５．１チャンネルサラウンドの信号であることを示し、「３」である場合には音響フレームデータＳＦＤが７．１チャンネルサラウンドの信号であることを示す。

　予約領域２６は、将来的な機能拡張のために用意されている領域であり、データ構造を変更することなく機能拡張を実現するために設けられているものである。
　予約領域２６は、１ビットや２ビットや４ビットなど、どのような大きさの領域とされていてもよい。
　本実施の形態においては、予約領域２６に上述した触覚再生フラグＰＦが記憶される。なお、本実施の形態を実現するためには、予約領域２６が１ビットの領域であってもよい。即ち、触覚再生フラグＰＦが１ビットから成るフラグ情報とされていれば、予約領域２６が１ビットの領域とされていても本実施の形態を実現可能である。また、この態様であれば、符号化データＥＤを最小限のデータ構造に留めることができるため、符号化データＥＤの送受信の際の通信帯域を抑えることができる。

＜３．送信装置の構成＞
　送信装置２の構成について図７を参照して説明する。
　送信装置２は、解析処理部３０と符号化部３１と記憶部３２と制御部３３と通信部３４とバス３５とを備えている。

　解析処理部３０は、通信部３４を解して入力されたコンテンツデータＣＤに対する解析処理を行う。なお、以降の説明においては，コンテンツデータＣＤが音響信号と動画像データを含んでいる場合を例に挙げる。

　解析処理部３０は、コンテンツデータＣＤが符号化されている場合には、復号処理を行う。復号処理では、コンテンツデータＣＤから動画像データと音響信号が取り出される。

　取り出された動画像データ及び音響信号は、所定の時間幅のデータとされた部分動画像データ及び音響フレームデータＳＦＤごとに解析処理に処される。
　部分動画像データ解析処理では、部分動画像データに含まれる各画像データに基づいて触覚提示に適したシーンであるか否かを判定する。具体的には後述する。

　音響フレームデータＳＦＤに対する解析処理では、音響フレームデータＳＦＤとしての音響信号のスペクトル値などに基づいて触覚提示に適したシーンであるか否かを判定する。具体的には後述する。

　解析処理部３０は、部分動画像データＭＤ及び音響フレームデータＳＦＤの少なくとも一方に基づいて解析処理を行い、その結果に応じて触覚再生フラグＰＦを生成する。具体的には、触覚提示に適したシーンであると判定した場合には、触覚再生フラグＰＦに再生可を示す「１」を設定する。一方、触覚提示に適していないシーンであると判定した場合には、触覚再生フラグＰＦに再生不可を示す「０」を設定する。

　符号化部３１は、解析処理部３０によって生成された音響フレームデータＳＦＤと触覚再生フラグＰＦを用いて符号化処理を行う。符号化処理では、音響フレームデータＳＦＤと触覚再生フラグＰＦの情報が含まれた符号化データＥＤを生成する。符号化に用いられる符号化方式は各種考えられるが、音響フレームデータＳＦＤを送信するための既存の符号化方式であって、且つ、触覚再生フラグＰＦを予約領域２６などの未使用領域に格納することが可能な方式であればいかなる方式であってもよい。
　これにより、触覚再生フラグＰＦを符号化するための新たな符号化方式を開発する手間などを省くことができる。
　なお、符号化データＥＤの実データとしては、音響フレームデータＳＦＤに対して圧縮などの符号化処理を施したものであってもよい。

　記憶部３２は、ＨＤＤ（Hard Disk Drive）やＳＳＤ（Solid State Drive）などを備えて構成されており、解析処理部３０が解析する前のコンテンツデータＣＤや解析後に得られる触覚再生フラグＰＦなどの各種情報が記憶される。

　制御部３３は、ＣＰＵ（Central Processing Unit）やＲＯＭ（Read Only Memory）やＲＡＭ（Random Access Memory）などを有するマイクロコンピュータを備えて構成され、ＲＯＭに記憶されたプログラムに従って各種の処理を実行することで送信装置２の統括的な制御を行う。

　通信部３４は、他の情報処理装置と有線或いは無線を用いたデータ通信を行う。通信部３４は、他の情報処理装置からコンテンツデータＣＤを受信する処理や、受信装置３に対して符号化データＥＤを送信する処理などを行う。

　なお、解析処理部３０、符号化部３１、記憶部３２、制御部３３、通信部３４は、バス３５を介して相互通信が可能なように接続されている。

　ここで、解析処理部３０の具体的な機能構成について図８に示す。
　解析処理部３０は、入力調整部４０と動画像データ解析部４１と音響解析部４２と触覚再生判定部４３と出力調整部４４とを備えている。

　入力調整部４０は、送信装置２に入力されたコンテンツデータＣＤを復号する処理や、コンテンツデータＣＤに含まれる動画像データと音響信号を取り出す処理を行う。
　更に、入力調整部４０は、取り出した動画像データを所定の時間幅のデータとされた部分動画像データＭＤに分割する処理や、取り出した音響信号を所定の時間幅のデータとされた音響フレームデータＳＦＤに分割する処理を行う。

　入力調整部４０は、分割した部分動画像データＭＤを動画像データ解析部４１に出力し、分割した音響フレームデータＳＦＤを音響解析部４２に出力する。

　動画像データ解析部４１は、部分動画像データＭＤについての画像解析を行い、部分動画像データＭＤごとの特徴量を算出する。
　算出する特徴量についていくつかの例を挙げる。

　動画像データ解析部４１は、瞬間的な光の明滅が発生しているシーンであるか否かを判定するための特徴量を算出する。
　例えば、部分動画像データＭＤに含まれる画像フレームごとに全画素の輝度値の合計値を算出し、特徴量Ａとする。特徴量Ａが高い画像フレームは、明るいシーンが写った画像であるため、爆発のシーンを捉えた画像である可能性が高い。

　特徴量Ａを算出するための［式１］を以下に示す。

　ここで、［式１］におけるｐ（ｍ）は画素列ｐのｍ番目の輝度値を表し、Ｍは画素数を表す。

　また、動画像データ解析部４１は、時間方向に隣接する画像フレーム間の輝度値の変化を特徴量Ｂとして算出する。
　例えば、直前の画像フレームに対して、全画素の輝度値の合計値の増加率が高いほど高くなるように特徴量Ｂを算出することで、爆発が始まった瞬間を写した画像フレームを特定することができる。

　特徴量Ｂを算出するための［式２］を以下に示す。

　ここで、［式２］におけるＡ’は直前の画像フレームについて算出された特徴量Ａであり、直前の画像フレームにおける全画素の輝度値の合計値を表す。

　そのほかの例として、動画像データ解析部４１は、触覚提示を行うのに相応しくないシーンを特定するための特徴量算出を行ってもよい。例えば、人物の顔が大写しにされたシーンでは、人物のセリフや表情に注目したいシーンであり、例え背後で爆発が起こっていたとしても触覚提示を行ってしまうと人物のセリフに合わせて体を揺さぶられているような感覚に陥りユーザに不快感を与えてしまう虞がある。

　そこで、動画像データ解析部４１は、画像フレームの画像領域に対して人物の顔が写された画像領域が占める割合が高いほど低くなるように特徴量Ｃを算出する。即ち、前述した特徴量Ａや特徴量Ｂが高く爆発シーンを捉えた部分動画像データである可能性が高い場合であっても、人物の顔が大写しにされたシーンであるために特徴量Ｃが低く算出された場合には、触覚提示を行わないことを決定することが可能となる。

　音響解析部４２は、音響フレームデータＳＦＤについての音響解析を行い、音響フレームデータＳＦＤごとの特徴量を算出する。
　算出する特徴量についていくつかの例を挙げる。

　音響解析部４２は、打撃音や衝突音や爆発音や斬撃音などが発生しているか否かを判定するための特徴量を算出する。
　例えば、音響フレームデータＳＦＤについてのスペクトル平坦度を算出し、特徴量Ｄとする。打撃音や衝突音などはスペクトル平坦度が高くなるという特徴を備えており、スペクトル平坦度が高いほど高くなるように特徴量Ｄを算出することで、打撃音や衝突音などが発生したシーンであることを特定することが可能となる。

　特徴量Ｄを算出するための［式３］を以下に示す。

　ここで、［式３］におけるｘ（ｎ）は信号列ｘのｎ番目の波高値を表し、Ｎは信号サンプル数を表す。

　また、音響解析部４２は、直前の音響フレームデータＳＦＤに対するスペクトル平坦度の増加率に基づいて特徴量を算出する。
　例えば、音響フレームデータＳＦＤについてのスペクトル平坦度の増加率が高いほど高くなるように特徴量Ｅを算出する。
　特徴量Ｄだけでなく特徴量Ｅを加味することで、打撃音や衝突音などが発生したシーンが特定される可能性を高めることができる。

　特徴量Ｅを算出するための［式４］を以下に示す。

　ここで、［式４］におけるＤ’は直前の音響フレームデータＳＦＤについて算出された特徴量Ｄであり、直前の音響フレームデータＳＦＤにおけるスペクトル平坦度を表す。

　音響解析部４２は、重低音に基づく特徴量を算出する。具体的には、音響フレームデータＳＦＤについて１００Ｈｚ以下のパワースペクトルの合計値が高いほど高くなるように特徴量Ｆを算出する。重低音は衝撃を伴うシーンで発生することが多く、重低音に基づく触覚提示は適切なものとなる可能性が高い。

　特徴量Ｆを算出するための［式５］を以下に示す。

　ここで、［式５］におけるはＸ（ｋ）は信号列Ｘのｋ番目のスペクトルを表し、Ｋは１００Ｈｚに該当するスペクトルビン（ＢＩＮ）を表す。

　また、音響解析部４２は、直前の音響フレームデータＳＦＤに対する１００Ｈｚ以下のパワースペクトルの合計値の増加率に基づいて特徴量を算出する。
　例えば、音響フレームデータＳＦＤについての１００Ｈｚ以下のパワースペクトルの合計値の増加率が高いほど高くなるように特徴量Ｇを算出する。
　特徴量Ｆだけでなく特徴量Ｇを加味することで、重低音が発生したシーン、特に重低音が発生し始めたシーンを特定することができ、重低音の発生と同時に触覚提示が行われはじめるような効果的な触覚提示を行うことが可能となる。

　特徴量Ｇを算出するための［式６］を以下に示す。

　ここで、［式６］におけるＦ’は直前の音響フレームデータＳＦＤについて算出された特徴量Ｆであり、直前の音響フレームデータＳＦＤにおける低域（例えば１００Ｈｚ以下）のパワースペクトルの合計値を表す。

　触覚再生判定部４３は、部分動画像データＭＤや音響フレームデータＳＦＤに合わせて触覚提示を行うべきか否かを判定し、判定結果に基づいて音響フレームデータＳＦＤごとに触覚再生フラグＰＦを設定する処理を行う。具体的には、触覚再生判定部４３は、動画像データ解析部４１が算出した特徴量Ａ，Ｂ，Ｃと音響解析部４２が算出した特徴量Ｄ，Ｅ，Ｆ，Ｇとに基づいて評価値ＥＶを算出する。

　評価値ＥＶは、例えば、下記に示す［式７］に基づいて算出される。

　評価値ＥＶ＝Ｗ１・特徴量Ａ＋Ｗ２・特徴量Ｂ＋Ｗ３・特徴量Ｃ＋Ｗ４・特徴量Ｄ＋Ｗ５・特徴量Ｅ＋Ｗ６・特徴量Ｆ＋Ｗ７・特徴量Ｇ・・・［式７］

　ここで、［式７］におけるＷ１～Ｗ７は、それぞれの特徴量Ａ～Ｇに対する重みを表す係数とされる。
　そして、触覚再生判定部４３は、評価値ＥＶに基づいて触覚再生フラグＰＦを設定する。具体的には、評価値ＥＶが閾値ＴＨ以上である場合には触覚再生フラグＰＦに「１」を設定し、評価値ＥＶが閾値ＴＨ未満である場合には触覚再生フラグＰＦに「０」を設定する。

　重みＷ１～Ｗ７の係数を適切に調整することで、触覚提示を行うべきシーンについての触覚再生フラグＰＦに「１」が設定されるようにすることができる。

　出力調整部４４は、入力調整部４０で得た一定の時間幅とされた音響フレームデータＳＦＤと触覚再生判定部４３によって設定された触覚再生フラグＰＦを出力する。

＜４．受信装置の構成＞
　受信装置３の構成について図９を参照して説明する。
　受信装置３は、復号部５０とＤＡＣ（Digital to Analog Converter）５１，５２と、増幅器５３，５４と記憶部５５と制御部５６と通信部５７とバス５８とを備えている。

　復号部５０は、受信装置３に入力された符号化データＥＤに対する復号処理を行い、音響フレームデータＳＦＤと触覚再生フラグＰＦを取得する。
　復号部５０は、取得した触覚再生フラグＰＦを確認し、触覚再生フラグＰＦが再生可を示す「１」であった場合に限り音響フレームデータＳＦＤから触覚信号を生成する。

　復号部５０は、符号化データＥＤから取得した音響フレームデータＳＦＤをＤＡＣ５１に出力し、生成した触覚信号をＤＡＣ５２に出力する。

　ＤＡＣ５１は、ディジタル信号とされた音響フレームデータＳＦＤをアナログ信号に変換し後段の増幅器５３に出力する。

　同様に、ＤＡＣ５２は、ディジタル信号とされた触覚信号をアナログ信号に変換し後段の増幅器５４に出力する。

　増幅器５３は、アナログ信号に変換された音響信号を音響再生装置４に出力する。
　また、増幅器５４は、アナログ信号に変換された触覚信号を触覚再生装置５に出力する。
　なお、ＤＡＣ５１，５２及び増幅器５３，５４は、共に音響再生装置４や触覚再生装置５の内部に設けられていてもよい。この場合には、ディジタル信号としての音響フレームデータＳＦＤや触覚信号がそれぞれ音響再生装置４や触覚再生装置５に送信される。

　記憶部５５は、ＨＤＤやＳＳＤなどを備えて構成されており、復号部５０が復号処理を施す前の符号化データＥＤなどが記憶されてもよいし、符号化データＥＤから取り出された音響フレームデータＳＦＤのデータや触覚再生フラグＰＦのデータや生成された触覚信号のデータが記憶されてもよい。

　制御部５６は、ＣＰＵやＲＯＭやＲＡＭなどを有するマイクロコンピュータを備えて構成され、ＲＯＭに記憶されたプログラムに従って各種の処理を実行することで受信装置３の統括的な制御を行う。

　通信部５７は、符号化データＥＤの受信処理や、増幅器５３で増幅されたアナログ信号としての音響信号の送信処理や、増幅器５４で増幅されたアナログ信号としての触覚信号の送信処理を行う。通信部５７は、有線による通信や無線による通信が可能とされている。

　なお、前述したように、受信装置３の内部に音響出力部７や触覚再生部８が設けられている場合には、アナログ信号に変換された音響信号が音響出力部７に出力され、アナログ信号に変換された触覚信号が触覚再生部８に出力されてもよい。

　なお、復号部５０、記憶部５５、制御部５６、通信部５７は、バス５８を介して相互通信が可能なように接続されている。

　ここで、復号部５０の具体的な機能構成について図１０に示す。
　復号部５０は、音響復号部６０と触覚信号生成部６１とを備えている。

　音響復号部６０は、入力された符号化データＥＤに対する複合処理を行い、音響フレームデータＳＦＤと触覚再生フラグＰＦを取得する。

　触覚信号生成部６１は、触覚再生フラグＰＦが再生可を示す「１」とされた音響フレームデータＳＦＤを用いて触覚信号の生成を行う。即ち、触覚再生フラグＰＦが再生不可を示す「０」とされた音響フレームデータＳＦＤについては触覚信号の生成を行わない。

　ここで、音響フレームデータＳＦＤから触覚信号を生成する手法について説明する。触覚信号の生成方法は各種考えられるが、図１１及び図１２を参照して一例を述べる。

　触覚信号生成部６１はローパスフィルタ等の信号処理を施すことにより音響信号の低周波成分のみを抽出して触覚信号として扱う。
　図１１は、音響フレームデータＳＦＤのパワースペクトルを示すグラフであり、ローパスフィルタの処理を施す前の信号を示している。
　図１２は、図１１と同様に音響フレームデータＳＦＤのパワースペクトルを示すグラフであるが、
カットオフ周波数が５００Ｈｚとされたローパスフィルタの処理を施した後の信号を示している。

　触覚信号生成部６１は、図１２に示す信号を触覚信号として扱う。このように、音響信号としての音響フレームデータＳＦＤに基づいて触覚信号を生成することにより、ユーザが聞く音と親和した触覚提示を行うことができる。

　なお、触覚信号生成部６１は、図１１に示すような触覚信号に対して、更にフェードイン処理及びフェードアウト処理を行う。触覚再生フラグＰＦが「０」とされた音響フレームデータＳＦＤと「１」とされた音響フレームデータＳＦＤが連続で再生される場合には、ユーザに提示される触覚刺激が急にＯＦＦからＯＮに遷移することになる。この場合には、触覚再生装置５や触覚再生部８の過渡応答により意図しない振動が発生してしまう虞がある。触覚再生フラグＰＦが「１」とされた音響フレームデータＳＦＤと「０」とされた音響フレームデータＳＦＤが連続で再生される場合についても同様である。

　不要な振動の発生を回避するために、音響フレームデータＳＦＤについての触覚再生フラグＰＦが変化する場合にフェードイン処理とフェードアウト処理を行う。

　先ず、フェードイン処理及びフェードアウト処理を施す前の触覚信号の一例を図１３に示す。図１３は、上から順に音響信号としての複数の音響フレームデータＳＦＤと、音響フレームデータＳＦＤに対応した触覚再生フラグＰＦと、フェード処理前の触覚信号を示す。

　再生順が早い左から順に区間Ｔ１，Ｔ２，Ｔ３，Ｔ４，Ｔ５とすると、図１３に示すように、区間Ｔ１から区間Ｔ２に遷移するタイミングで触覚刺激の提示が急に始まり、区間Ｔ３から区間Ｔ４に遷移するタイミングで触覚刺激の提示が急に終わる。

　そこで、触覚信号生成部６１は、図１４に示すようなゲイン関数をフェード処理前の触覚信号に乗じることでフェード処理後の触覚信号を生成する。

　図１４に示すように、ゲイン関数は、触覚再生フラグが「０」から「１」へ変化する場合に触覚信号が徐々に強くなるように、また、触覚再生フラグが「１」から「０」へ変化する場合に触覚信号が徐々に弱くなるようにされた設定されたものである。

　具体的には、ゲイン関数における区間Ｔ２に対応する部分は、区間Ｔ２の開始タイミングである時間ｔ０から所定の時間ｔ１に掛けて０から１へと徐々に変化した後区間Ｔ２の終了まで１が継続するようにされる。ゲイン関数における０から１への変化は線形に変化するものであってもよいし、そうでなくてもよい。また、時間ｔ１は、例えば、区間Ｔ２の半分の時間が経過したタイミングであってもよいし、それよりも前であってもよい。或いは、時間ｔ１が区間Ｔ２の終了の時間とされることにより区間Ｔ２の全ての時間を掛けて０から１へと変化してもよい。

　また、ゲイン関数における区間Ｔ３に対応する部分は、区間Ｔ３の開始から時間ｔ２に掛けて１とされ、時間ｔ２から区間Ｔ３の終了タイミングである時間ｔ３に掛けて１から０へと徐々に変化するようにされる。ゲイン関数における１から０への変化は線形に変化するものであってもよいし、そうでなくてもよい。また、時間ｔ２は、例えば、区間Ｔ３の半分の時間が経過したタイミングであってもよいし、それよりも後であってもよい。或いは、時間ｔ２が区間Ｔ３の開始の時間とされることにより区間Ｔ３の全ての時間を掛けて１から０へと変化してもよい。

　なお、触覚再生フラグが１とされ、且つ、直前の音響フレームデータＳＦＤと直後の音響フレームデータＳＦＤの双方の触覚再生フラグが１とされている区間については、ゲイン関数は常に１とされる。
　触覚信号生成部６１は、図１４に示すようなゲイン関数をフェード処理前の触覚信号に乗じることでフェードイン処理及びフェードアウト処理を行う。これにより、触覚提示が開始される時間ｔ０と触覚提示が終了する時間ｔ３において触覚信号が０とされる。

＜５．処理フロー＞
　触覚提示システム１が備える送信装置２や受信装置３が実行する処理の流れについて添付図を参照して説明する。
　なお、以下の説明においては、各処理がソフトウェアの処理として実現される例を挙げるが、各処理の少なくとも一部がハードウェアの処理として実現されてもよい。

＜５－１．送信装置の処理フロー＞
　送信装置２の解析処理部３０や符号化部３１が実行する処理の流れについて図１５を参照して説明する。

　送信装置２の解析処理部３０の入力調整部４０は、ステップＳ１０１において、コンテンツデータＣＤの復号処理を実行する。個の処理により、コンテンツデータＣＤから映像信号と音響信号が分離される。

　解析処理部３０の入力調整部４０は、ステップＳ１０２において、映像信号を所定の時間幅で分割した部分動画像データＭＤを生成し、音響信号を所定の時間幅で分割した音響フレームデータＳＦＤを生成する。

　解析処理部３０の動画像データ解析部４１は、ステップＳ１０３において、部分動画像データの解析を行う。この処理は、前述した特徴量Ａ～Ｃを算出する処理である。

　解析処理部３０の音響解析部４２は、ステップＳ１０４において、音響フレームデータＳＦＤの解析を行う。この処理は、前述した特徴量Ｄ～Ｇを算出する処理である。

　解析処理部３０の触覚再生判定部４３は、ステップＳ１０５において、評価値ＥＶを算出する処理を行う。

　解析処理部３０の触覚再生判定部４３は、ステップＳ１０６において、触覚提示可否判定を行い、ステップＳ１０７において、触覚再生フラグＰＦの生成を行う。

　符号化部３１はステップＳ１０８において、符号化処理を行い符号化データＥＤを生成する。

　送信装置２の通信部３４はステップＳ１０９において、符号化データＥＤを受信装置３に対して送信する。

＜５－２．受信装置の処理フロー＞
　受信装置３の復号部５０が実行する処理の流れについて図１６を参照して説明する。

　受信装置３の復号部５０の音響復号部６０は、ステップＳ２０１において、符号化データＥＤのヘッダ領域２０の解析を行い、図６に示す符号化データＥＤのデータ構造に則した情報を抽出する。

　復号部５０の音響復号部６０は、ステップＳ２０２において、ペイロード領域２１に記憶された実データについての復号処理を行い音響フレームデータＳＦＤを取得する。

　復号部５０の触覚信号生成部６１は、ステップＳ２０３において、当該音響フレームデータＳＦＤに対応する触覚再生フラグＰＦがＯＮであるか否かを確認する。触覚再生フラグＰＦがＯＮである状態とは、触覚再生フラグＰＦに「１」が設定されている状態を指す。

　触覚再生フラグＰＦがＯＮである場合には、復号部５０の触覚信号生成部６１は、ステップＳ２０４において、音響フレームデータＳＦＤに基づいて触覚信号を生成する。
　一方、触覚再生フラグＰＦがＯＦＦである場合には、ステップＳ２０４の処理はスキップされる。

　復号部５０の触覚信号生成部６１は、ステップＳ２０５において、触覚再生フラグＰＦに変化があるか否かを判定する。触覚再生フラグＰＦに変化がある場合とは、直前の音響フレームデータＳＦＤに対応する触覚再生フラグＰＦと今回の処理対象の音響フレームデータＳＦＤに対応する触覚再生フラグＰＦが異なる場合である。

　触覚再生フラグＰＦに変化がない場合、復号部５０は図１６に示す一連の処理を終了する。一方、触覚再生フラグＰＦに変化がある場合、復号部５０の触覚信号生成部６１は、ステップＳ２０６において、フラグの変化方向に応じた分岐処理を行う。
　具体的には、触覚再生フラグＰＦがＯＦＦからＯＮに変化した場合、復号部５０の触覚信号生成部６１はステップＳ２０７において、フェードイン処理を行う。

　一方、触覚再生フラグＰＦがＯＮからＯＦＦに変化した場合、復号部５０の触覚信号生成部６１はステップＳ２０８において、フェードアウト処理を行う。

＜６．変形例＞
　解析処理部３０の解析についての別の形態について添付図を参照して説明する。
　一つ目の変形例としての形態は、テレビ番組などの放送コンテンツや配信コンテンツについてのＥＰＧ（Electronic Programming Guide）などの番組情報を用いて解析を行う例である。

　具体的には、放送コンテンツや配信コンテンツにおけるシーンごとにシーン情報を取得可能な場合について考える。この場合には、各シーンがどのようなシーンであるかをシーン情報に基づいてある程度推定できるため、シーン情報のみに基づいて触覚提示を行うべきか否かの解析を行ってもよい。
　もちろん、上述した特徴量及び評価値に加えてシーン情報を用いた解析を行ってもよい。例えば、特定のシーンであれば、どんなに評価値が高くても触覚提示を行わないことを決定してもよい。

　図１７は、シーン情報を表で示したものである。シーン情報は、例えば、シーンごとの代表となるサムネイル画像と、シーンの通し番号であるシーンＮｏと、シーンの開始時刻と終了時刻と、シーン種別ＩＤが紐付けられている。

　シーン種別ＩＤは、シーン内容を大まかに特定するための情報であり、例えば、図１８のように、シーン内容と対応付けられたものとなる。具体的には、シーン種別ＩＤが「０００１」とされたシーンは銃撃や剣戟などのバトルアクションのシーンに対して付与されるものであり、シーン種別ＩＤが「０００２」とされたシーンは花火や爆弾などが爆発するシーンに対して付与されるものであり、シーン種別ＩＤが「００１１」とされたシーンは人物がトークしているシーンに対して付与されるものである。

　このようなシーン情報は、コンテンツデータＣＤの配信を行うコンテンツサーバ１００（図２参照）において管理されており、コンテンツデータＣＤの配信と共に送信装置２に配信されることが考えられる。
　また、シーン情報が記録メディアＲＭに記憶されており（図４参照）、コンテンツデータＣＤの再生に応じて記録メディアＲＭから取得してもよい。
　或いは、テレビ番組の番組表情報やデータ放送のデータの一部としてテレビジョン受像機から取得してもよい。

　解析処理部３０の解析についての二つ目の変形例について説明する。二つ目の変形例は、音響フレームデータＳＦＤが予め決められたものではなく、ユーザの操作等による状況変化によって音響フレームデータＳＦＤが変わる場合の例である。

　例えば、コンテンツデータＣＤがゲームコンテンツであった場合には、音響信号はＢＧＭに関するものやセリフに関するものや効果音に関するものなどがあり、その一部はシーンに紐付くものではなくユーザの操作に紐付くものとされている。

　即ち、シーン種別やユーザ操作に応じて各音響信号がミックスされて再生される。従って、音響フレームデータＳＦＤはユーザの操作に応じて都度異なるデータとされる。

　この場合には、ゲーム機本体としての送信装置２Ｃにおいてゲームコンテンツの状況を解析し、触覚提示に適したタイミングであるか否かを判定して触覚再生フラグＰＦを設定する。
　ここで、触覚提示に適したタイミングとは、例えば、ユーザが操作するゲーム内のキャラクタが敵キャラクタに向けて振り下ろした剣などの武器や拳が当該敵キャラクタに接触した際に再生される効果音が発生したタイミングであってもよいし、爆弾が爆発したときに再生される効果音が発生したタイミングであってもよい。換言すれば、ユーザの操作するキャラクタが何らかの刺激を体感する際の効果音発生のタイミングであってもよい。

＜７．まとめ＞
　上述した各例において説明したように、本技術における受信装置３（３Ａ，３Ｂ，３Ｃ）は、触覚信号の再生可否情報（触覚再生フラグＰＦ）と音響信号（音響フレームデータＳＦＤ）が含まれるデータ（符号化データＥＤ）を受信する受信処理部（通信部５７）と、受信処理部が受信する音響信号に基づいて触覚信号の生成を行う触覚信号生成部６１と、を備えている。
　また、触覚信号生成部６１は、再生可否情報が再生可を示す場合（例えば、触覚再生フラグＰＦに「１」が設定されている場合）に触覚信号の生成を行い、再生可否情報が再生不可を示す場合（例えば、触覚再生フラグＰＦに「０」が設定されている場合）に触覚信号の生成を行わないようにされる。
　これにより、触覚信号生成部６１による触覚信号の生成が行われない音響信号（音響フレームデータＳＦＤ）と、触覚信号の生成が行われる音響信号が存在する。即ち、全ての音響信号について触覚信号が生成されるわけではない。
　触覚信号が生成されない音響信号が存在することにより、触覚信号の生成に係る処理負担が軽減される。また、再生可否情報に応じて触覚信号の生成の可否を決定することで、必要な期間のみ触覚信号を生成することが可能となる。特に、音響信号から触覚信号を生成する場合には、音響信号が小さな信号であった場合に生成される触覚信号も小さな信号になってしまうことが考えられる。そして、小さな触覚信号はユーザが感知できない可能性がある。再生可否情報に応じて触覚信号の生成を行うことで、このような不要な触覚信号の生成を回避することができる。他にも、触覚提示に適していない音が含まれた音響信号なども存在する。そのような音響信号に基づいて触覚提示を行ってしまうと、ユーザに不快感を与えてしまう場合がある。当該再生区間において触覚提示を行わないことを示す再生可否情報が設定されることで、ユーザに対して不快感を与える触覚提示を回避することができる。
　また、受信処理部は、触覚信号のデータを受信する代わりに触覚信号の再生可否を示す再生可否情報を受信するものと考えられる。そして、再生可否情報は、触覚信号のデータよりも小さなデータと考えられる。従って、触覚信号のデータと音響信号のデータの双方を受信する場合と比較して、受信処理部が受信するデータのデータ量を小さく抑えることができる。これにより通信に使用される帯域を削減することができると共に、受信処理に要する処理負担を軽減することが可能となる。

　図６や図１０を参照して説明したように、所定時間（例えば区間Ｔ１の時間長）ごとに区切られた音響信号とされた音響フレームデータＳＦＤごとに再生可否情報（例えば触覚再生フラグＰＦ）が設けられ、触覚信号生成部６１は、再生可を示す再生可否情報に対応する音響フレームデータＳＦＤに基づく触覚信号の生成を行い、再生不可を示す再生可否情報に対応する音響フレームデータＳＦＤに基づく触覚信号の生成を行わなくてもよい。
　音響フレームデータＳＦＤごとに再生可否情報が設けられることで、触覚信号が生成される区間を細かく設定することができる。
　これにより、意図に沿った触覚信号の再生を行うことができ、ユーザに適切な触覚刺激を提供することができる。特に、音響フレームデータＳＦＤの再生時間長が百ｍｓｅｃ未満などの短い時間とされることにより、触覚信号の必要な区間と不要な区間をきめ細かく設定することができるため、多種多様な触覚信号の提示を行うことができる。

　図６等を参照して説明したように、再生可否情報は１ビットから成るフラグ情報（触覚再生フラグＰＦ）とされていてもよい。
　これにより、受信処理部（通信部５７）が受信するデータのデータ量が小さくされる。
　従って、受信処理に要する時間を短くすることができると共に、データの送受信に要する通信帯域の削減を図ることができる。

　図６等を参照して説明したように、受信装置３（３Ａ，３Ｂ，３Ｃ）が受信する受信データは、音響データの符号化方式（例えば、ＳＢＣやＭＰ３やＡＡＣやＬＤＡＣなど）で符号化された符号化データＥＤとされ、符号化データＥＤは、音響フレームデータＳＦＤが記憶されるペイロード領域２１と予約領域２６とを含む構造とされ、再生可否情報は予約領域２６に記憶されてもよい。
　再生可否情報が予約領域２６に記憶されることで、音響フレームデータＳＦＤを伝送する仕組みを利用して再生可否情報の受信が実現される。
　これにより、触覚信号や再生可否情報を受信するためのデータ構造や通信方式を確立する必要がないため、環境構築のためのコスト削減を図ることができる。また、触覚信号専用のデータ構造を生成する環境や利用する環境が普及していない場合に好適である。

　図８等を参照して説明したように、再生可否情報（例えば触覚再生フラグＰＦ）は、音響フレームデータＳＦＤと同期して再生される部分動画像データＭＤに基づいて生成されてもよい。
　音響フレームデータＳＦＤから取得される音響信号から触覚刺激をユーザに提供すべきか否かを判定できない場合が存在する。
　そして、ユーザが視聴する映像には各種のシーンが含まれており、画像解析をすることにより触覚提示に相応しいシーンであるか否かを判定可能な場合がある。このような場合において、部分動画像データＭＤに基づいて再生可否情報を生成することにより、適切な触覚提示が行われる可能性を高めることができる。

　図１１や図１２を参照して説明したように、受信装置３（３Ａ，３Ｂ，３Ｃ）における触覚信号生成部６１は、生成された触覚信号についてのフェードイン処理及びフェードアウト処理を行ってもよい。
　フェードイン処理やフェードアウト処理などのフェード処理は、時間の経過に伴って徐々に信号を大きくする処理や徐々に信号を小さくする処理であり、所定のゲイン関数を掛ける処理である。触覚提示の開始時及び終了時において適切なフェード処理を行うことにより、触覚提示の開始と終了をスムーズに行うことができ、自然な触覚体験を与えることができる。
　従って、ユーザの気が削がれてしまうことを防止することができ、コンテンツへの没入感を高めることができる。

　図１１や図１２を参照して説明したように、受信装置３（３Ａ，３Ｂ，３Ｃ）における触覚信号生成部６１は、対象の音響フレームデータＳＦＤ１に対応する再生可否情報（例えば触覚再生フラグＰＦ）と、その一つ前の音響フレームデータＳＦＤである直前音響フレームデータＳＦＤ２に対応する再生可否情報に基づいてフェードイン処理及びフェードアウト処理を行ってもよい。具体的には、対象の音響フレームデータＳＦＤ１に対応する再生可否情報が再生可を示し且つ直前音響フレームデータＳＦＤ２に対応する再生可否情報が再生不可を示す場合に対象の音響フレームデータＳＦＤ１から生成した触覚信号に対するフェードイン処理を行い、対象の音響フレームデータＳＦＤ１に対応する再生可否情報が再生不可を示し且つ直前音響フレームデータＳＦＤ２に対応する再生可否情報が再生可を示す場合に直前音響フレームデータＳＦＤ２から生成した前記触覚信号に対するフェードアウト処理を行ってもよい。
　即ち、再生可否情報が変化するタイミングでフェードイン処理及びフェードアウト処理の何れかの処理が実行される。
　これにより、ユーザに不快感を与えずに触覚提示を行うことができる触覚信号が生成されるため、コンテンツへの没入感を高めることができる。

　上述した各種の例を用いて説明したように、送信装置２（２Ａ，２Ｂ，２Ｃ）は、少なくとも音響信号を含むコンテンツデータＣＤに対する解析処理を行い触覚信号の再生可否を示す再生可否情報（例えば触覚再生フラグＰＦ）を生成する解析処理部３０と、再生可否情報とコンテンツデータＣＤを送信する送信処理部（通信部３４）と、を備えている。
　コンテンツデータＣＤを解析することにより、触覚提示を行うべき再生区間と行わない方がよい再生区間とを判定することができる。
　従って、触覚刺激の提示に値しない区間については触覚信号の再生を行わないように再生可否情報を設定することにより、ユーザに適切な触覚提示を行うことができる。
　また、触覚信号そのものを送信するのではなく、例えば１ビットのフラグ情報などとされた再生可否情報を受信装置に対して送信することで、通信帯域を削減することができると共に、送信処理に要する処理負担や処理時間を削減することが可能となる。

　図７や図８等を参照して説明したように、送信装置２（２Ａ，２Ｂ，２Ｃ）における解析処理部３０は、所定時間ごとに区切られた音響信号である音響フレームデータＳＦＤごとに触覚信号の再生可否を判定し、送信処理部（通信部３４）は、音響フレームデータＳＦＤごとに再生可否情報（例えば触覚再生フラグＰＦ）を対応付けて送信処理を行ってもよい。
　音響フレームデータＳＦＤごとに再生可否情報が設定されることで、触覚信号が生成される区間を細かく設定することができる。
　これにより、意図に沿った触覚信号の再生を行うことができ、ユーザに適切な触覚刺激を提供することができる。特に、音響フレームデータＳＦＤの再生時間長が百ｍｓｅｃ未満などの短い時間とされることにより、触覚信号の必要な区間と不要な区間をきめ細かく設定することができるため、多種多様な触覚信号の提示を行うことができる。

　図７等を参照して説明したように、音響フレームデータＳＦＤと該音響フレームデータＳＦＤに対応した再生可否情報（例えば触覚再生フラグＰＦ）とを含む符号化データＥＤを生成する符号化部３１を備え、送信処理部（通信部３４）は、送信処理において符号化データＥＤを送信してもよい。
　これにより、所定のデータ構造とされた規格化された符号化データＥＤが送信される。
　従って、データ間の不整合を防止することができると共に、データ構造のバージョンアップが容易となる。

　図７等を参照して説明したように、送信装置２（２Ａ，２Ｂ，２Ｃ）における解析処理部３０は、音響信号の解析結果（例えば、音響フレームデータＳＦＤの解析結果）に基づいて再生可否情報（例えば触覚再生フラグＰＦ）を生成してもよい。
　触覚刺激は、ユーザに提供する音響に合わせて提示されることが好ましい場合がある。本構成によれば、音響信号についての解析処理を行い、その解析結果に基づいて触覚提示を行うべきか否かの判定が行われる。これにより、音響に合わせた触覚提示が適切であるか否かを判定することができる。
　従って、ユーザに提供する音に合わせて触覚提示を行うことが可能となる。例えば、爆発音などが特定できた場合には、爆発音に合わせた触覚提示を行うことが可能となる。

　図８等を参照して説明したように、コンテンツデータＣＤは音響信号と同期して再生される動画像データを含み、解析処理部３０は、動画像データに対する解析処理を行い、音響信号及び動画像データの双方の解析結果に基づいて再生可否情報（例えば触覚再生フラグＰＦ）の生成を行ってもよい。
　コンテンツデータＣＤに映像が含まれる場合には、音に合わせた触覚刺激がユーザに提示されるよりも映像に合わせた触覚刺激がユーザに提示される方が好ましい場合もある。
　本構成によれば、動画像データについての解析処理が行われることで、映像に合わせて触覚刺激を提示すべきシーンであるか否かの判定を行うことができる。
　従って、動画像データに合わせてユーザに触覚提示を行うことが可能となる。特に、音響信号に背景音楽が含まれている場合などには、ユーザに触覚提示を行うべきか否かについての判定を適切に行うことができない可能性がある。このような場合に動画像データについての解析処理の結果を考慮して触覚提示を行うか否かを判定することで、ユーザに対して適切でない触覚提示が行われてしまうことを防止することができる。

　［式３］や［式４］などを用いて説明したように、送信装置２（２Ａ，２Ｂ，２Ｃ）における解析処理部３０は、音響フレームデータＳＦＤにおけるスペクトル平坦度に基づいて再生可否情報（例えば触覚再生フラグＰＦ）を生成してもよい。
　音響フレームデータＳＦＤのスペクトル平坦度やスペクトル平坦度の増加率などによって触覚提示を行うべきか否かを判定することで、適切な触覚提示が行われる可能性を高めることができる。
　従って、ユーザに対してコンテンツへの高い没入間を与えることができると共に、満足度を与えることが可能となる。

　［式５］や［式６］などを用いて説明したように、送信装置２（２Ａ，２Ｂ，２Ｃ）における解析処理部３０は、音響フレームデータＳＦＤにおける閾値（例えば１００Ｈｚ）以下の周波数成分のパワースペクトルの合計値に基づいて再生可否情報（例えば触覚再生フラグＰＦ）を生成してもよい。
　これにより、音響フレームデータＳＦＤにおける低周波成分のパワースペクトルの合計値や、その増加率に基づいて触覚提示を行うべきか否かを判定することができる。
　従って、重低音に基づく触覚刺激をユーザに提供することができるため、ユーザにとって違和感の無い触覚提示を行うことができる。

　［式１］や［式２］などを用いて説明したように、送信装置２（２Ａ，２Ｂ，２Ｃ）における解析処理部３０は、動画像データにおける複数の画素の輝度値の合計値に基づいて再生可否情報（例えば触覚再生フラグＰＦ）を生成してもよい。
　これにより、例えば、爆発シーンなどのように輝度値が大きく変化する場面を検出することができる。
　従って、ユーザにとって違和感の無い触覚提示を行うことができる。

　特徴量Ｃなどを用いて説明したように、送信装置２（２Ａ，２Ｂ，２Ｃ）における解析処理部３０は、動画像データにおいて所定以上の大きさの人の顔を検出したか否かに基づいて再生可否情報（例えば触覚再生フラグＰＦ）を生成してもよい。
　例えば、人の顔が大写しにされたシーンは、人が話しているシーンであることが推定される。そのようなシーンは人が話している声に応じて触覚提示を行ってしまうと、ユーザに不快感を与えてしまう場合がある。これを避けるために、人の顔が大写しにされたシーンを検出した場合には、触覚提示を行わないことを決定する。
　これにより、人の声に合わせて揺さぶられているような感覚をユーザに与えてしまうような触覚提示が行われてしまうことを回避することができる。

　受信装置３（３Ａ，３Ｂ，３Ｃ）が実行する情報処理方法は、触覚信号の再生可否情報（例えば触覚再生フラグＰＦ）と音響信号が含まれるデータ（符号化データＥＤ）を受信し、再生可否情報が再生可を示す場合に受信した音響信号に基づいて触覚信号を生成し、再生可否情報が再生不可を示す場合に触覚信号の生成を行わないことを決定する処理と、を含むものである。

　また、送信装置２（２Ａ，２Ｂ，２Ｃ）が実行する情報処理方法は、少なくとも音響信号を含むコンテンツデータＣＤに対する解析処理を行い触覚信号の再生可否を示す再生可否情報（例えば触覚再生フラグＰＦ）を生成し、再生可否情報と音響信号を送信する処理を含むものである。

　受信装置３（３Ａ，３Ｂ，３Ｃ）に実行させるプログラムは、触覚信号の再生可否情報（例えば触覚再生フラグＰＦ）と音響信号が含まれるデータ（符号化データＥＤ）を受信し、再生可否情報が再生可を示す場合に受信した音響信号に基づいて触覚信号の生成し、再生可否情報が再生不可を示す場合に触覚信号の生成を行わないことを決定する機能を、例えば受信装置３が備えるＣＰＵ等の演算処理装置に実行させるプログラムである。
　このようなプログラムにより、上述した復号部５０をマイクロコンピュータ等の演算処理装置により実現できる。

　送信装置２（２Ａ，２Ｂ，２Ｃ）に実行させるプログラムは、少なくとも音響信号を含むコンテンツデータＣＤに対する解析処理を行い触覚信号の再生可否を示す再生可否情報（例えば触覚再生フラグＰＦ）を生成し、再生可否情報と音響信号を送信する機能を、例えば送信装置２が備えるＣＰＵ等の演算処理装置に実行させるプログラムである。
　このようなプログラムにより、上述した解析処理部３０や符号化部３１をマイクロコンピュータ等の演算処理装置により実現できる。

　これらのプログラムはコンピュータ装置等の機器に内蔵されている記録媒体としてのＨＤＤや、ＣＰＵを有するマイクロコンピュータ内のＲＯＭ等に予め記録しておくことができる。あるいはまたプログラムは、フレキシブルディスク、ＣＤ－ＲＯＭ、ＭＯ(Magneto Optical)ディスク、ＤＶＤ、ブルーレイディスク、磁気ディスク、半導体メモリ、メモリカードなどのリムーバブル記録媒体に、一時的あるいは永続的に格納（記録）しておくことができる。このようなリムーバブル記録媒体は、いわゆるパッケージソフトウェアとして提供することができる。
　また、このようなプログラムは、リムーバブル記録媒体からパーソナルコンピュータ等にインストールする他、ダウンロードサイトから、ＬＡＮ(Local Area Network)、インターネットなどのネットワークを介してダウンロードすることもできる。

　なお、本明細書に記載された効果はあくまでも例示であって限定されるものではなく、また他の効果があってもよい。

　また、上述した各例はいかように組み合わせてもよく、各種の組み合わせを用いた場合であっても上述した種々の作用効果を得ることが可能である。

＜８．本技術＞
　本技術は以下のような構成を採ることもできる。
（１）
　触覚信号の再生可否情報と音響信号が含まれるデータを受信する受信処理部と、
　前記受信処理部が受信する前記音響信号に基づいて前記触覚信号の生成を行う触覚信号生成部と、を備え、
　前記触覚信号生成部は、
　前記再生可否情報が再生可を示す場合に前記触覚信号の生成を行い、
　前記再生可否情報が再生不可を示す場合に前記触覚信号の生成を行わない
　受信装置。
（２）
　所定時間ごとに区切られた前記音響信号とされた音響フレームデータごとに前記再生可否情報が設けられ、
　前記触覚信号生成部は、
　再生可を示す前記再生可否情報に対応する前記音響フレームデータに基づく前記触覚信号の生成を行い、
　再生不可を示す前記再生可否情報に対応する前記音響フレームデータに基づく前記触覚信号の生成を行わない
　上記（１）に記載の受信装置。
（３）
　前記再生可否情報は１ビットから成るフラグ情報とされた
　上記（１）から上記（２）の何れかに記載の受信装置。
（４）
　前記受信データは、音響データの符号化方式で符号化された符号化データとされ、
　前記符号化データは、前記音響フレームデータが記憶されるペイロード領域と予約領域とを含む構造とされ、
　前記再生可否情報は前記予約領域に記憶される
　上記（２）に記載の受信装置。
（５）
　前記再生可否情報は、前記音響フレームデータと同期して再生される部分動画像データに基づいて生成される
　上記（２）または上記（４）の何れかに記載の受信装置。
（６）
　前記触覚信号生成部は、生成された前記触覚信号についてのフェードイン処理及びフェードアウト処理を行う
　上記（１）から上記（５）の何れかに記載の受信装置。
（７）
　前記触覚信号生成部は、
　対象の音響フレームデータに対応する前記再生可否情報が再生可を示し且つ前記対象の音響フレームデータの一つ前の音響フレームデータである直前音響フレームデータに対応する前記再生可否情報が再生不可を示す場合に前記対象の音響フレームデータから生成した前記触覚信号に対するフェードイン処理を行い
　前記対象の音響フレームデータに対応する前記再生可否情報が再生不可を示し且つ前記直前音響フレームデータに対応する前記再生可否情報が再生可を示す場合に前記直前音響フレームデータから生成した前記触覚信号に対するフェードアウト処理を行う
　上記（６）に記載の受信装置。
（８）
　少なくとも音響信号を含むコンテンツデータに対する解析処理を行い触覚信号の再生可否を示す再生可否情報を生成する解析処理部と、
　前記再生可否情報と前記音響信号を送信する送信処理部と、を備えた
　送信装置。
（９）
　前記解析処理部は、所定時間ごとに区切られた前記音響信号である音響フレームデータごとに前記触覚信号の再生可否を判定し、
　前記送信処理部は、前記音響フレームデータごとに前記再生可否情報を対応付けて前記送信を行う
　上記（８）に記載の送信装置。
（１０）
　前記音響フレームデータと該音響フレームデータに対応した前期再生可否情報とを含む符号化データを生成する符号化部を備え、
　前記送信処理部は、前記送信において前記符号化データを送信する
　上記（９）に記載の送信装置。
（１１）
　前記解析処理部は、前記音響信号の解析結果に基づいて前記再生可否情報を生成する
　上記（８）から上記（１０）の何れかに記載の送信装置。
（１２）
　前記コンテンツデータは前記音響信号と同期して再生される動画像データを含み、
　前記解析処理部は、
　前記動画像データに対する解析処理を行い、
　前記動画像データの解析結果に基づいて前記再生可否情報を生成する
　上記（８）から上記（１１）の何れかに記載の送信装置。
（１３）
　前記解析処理部は、前記音響フレームデータにおけるスペクトル平坦度に基づいて前記再生可否情報を生成する
　上記（９）から上記（１０）の何れかに記載の送信装置。
（１４）
　前記解析処理部は、前記音響フレームデータにおける閾値以下の周波数成分のパワースペクトルの合計値に基づいて前記再生可否情報を生成する
　上記（９）から上記（１０）の何れかに記載の送信装置。
（１５）
　前記解析処理部は、前記動画像データにおける複数の画素の輝度値の合計値に基づいて前記再生可否情報を生成する
　上記（１２）に記載の送信装置。
（１６）
　前記解析処理部は、前記動画像データにおいて所定以上の大きさの人の顔を検出したか否かに基づいて前記再生可否情報を生成する
　上記（１２）に記載の送信装置。
（１７）
　触覚信号の再生可否情報と音響信号が含まれるデータを受信し、
　前記再生可否情報が再生可を示す場合に前記受信した音響信号に基づいて前記触覚信号を生成し、
　前記再生可否情報が再生不可を示す場合に前記触覚信号の生成を行わないことを決定する処理を、コンピュータ装置が実行する
　情報処理方法。
（１８）
　少なくとも音響信号を含むコンテンツデータに対する解析処理を行い触覚信号の再生可否を示す再生可否情報を生成し、
　前記再生可否情報と前記音響信号を送信する処理を、コンピュータ装置が実行する
　情報処理方法。
（１９）
　触覚信号の再生可否情報と音響信号が含まれるデータを受信し、
　前記再生可否情報が再生可を示す場合に前記受信した音響信号に基づいて前記触覚信号を生成し、
　前記再生可否情報が再生不可を示す場合に前記触覚信号の生成を行わないことを決定する機能を、演算処理装置に実行させる
　プログラム。
（２０）
　少なくとも音響信号を含むコンテンツデータに対する解析処理を行い触覚信号の再生可否を示す再生可否情報を生成し、
　前記再生可否情報と前記音響信号を送信する機能を、演算処理装置に実行させる
　プログラム。

２，２Ａ，２Ｂ，２Ｃ　送信装置
３，３Ａ，３Ｂ，３Ｃ　受信装置
２１　ペイロード領域
２６　予約領域
３０　解析処理部
３１　符号化部
３４　通信部（送信処理部）
５７　通信部（受信処理部）
６１　触覚信号生成部
ＣＤ　コンテンツデータ
ＥＤ　符号化データ
ＳＦＤ　音響フレームデータ
ＭＤ　部分動画像データ
ＰＦ　触覚再生フラグ

Claims

　触覚信号の再生可否情報と音響信号が含まれるデータを受信する受信処理部と、
　前記受信処理部が受信する前記音響信号に基づいて前記触覚信号の生成を行う触覚信号生成部と、を備え、
　前記触覚信号生成部は、
　前記再生可否情報が再生可を示す場合に前記触覚信号の生成を行い、
　前記再生可否情報が再生不可を示す場合に前記触覚信号の生成を行わない
　受信装置。
　所定時間ごとに区切られた前記音響信号とされた音響フレームデータごとに前記再生可否情報が設けられ、
　前記触覚信号生成部は、
　再生可を示す前記再生可否情報に対応する前記音響フレームデータに基づく前記触覚信号の生成を行い、
　再生不可を示す前記再生可否情報に対応する前記音響フレームデータに基づく前記触覚信号の生成を行わない
　請求項１に記載の受信装置。
　前記再生可否情報は１ビットから成るフラグ情報とされた
　請求項１に記載の受信装置。
　前記受信データは、音響データの符号化方式で符号化された符号化データとされ、
　前記符号化データは、前記音響フレームデータが記憶されるペイロード領域と予約領域とを含む構造とされ、
　前記再生可否情報は前記予約領域に記憶される
　請求項２に記載の受信装置。
　前記再生可否情報は、前記音響フレームデータと同期して再生される部分動画像データに基づいて生成される
　請求項２に記載の受信装置。
　前記触覚信号生成部は、生成された前記触覚信号についてのフェードイン処理及びフェードアウト処理を行う
　請求項１に記載の受信装置。
　前記触覚信号生成部は、
　対象の音響フレームデータに対応する前記再生可否情報が再生可を示し且つ前記対象の音響フレームデータの一つ前の音響フレームデータである直前音響フレームデータに対応する前記再生可否情報が再生不可を示す場合に前記対象の音響フレームデータから生成した前記触覚信号に対するフェードイン処理を行い、
　前記対象の音響フレームデータに対応する前記再生可否情報が再生不可を示し且つ前記直前音響フレームデータに対応する前記再生可否情報が再生可を示す場合に前記直前音響フレームデータから生成した前記触覚信号に対するフェードアウト処理を行う
　請求項６に記載の受信装置。
　少なくとも音響信号を含むコンテンツデータに対する解析処理を行い触覚信号の再生可否を示す再生可否情報を生成する解析処理部と、
　前記再生可否情報と前記音響信号を送信する送信処理部と、を備えた
　送信装置。
　前記解析処理部は、所定時間ごとに区切られた前記音響信号である音響フレームデータごとに前記触覚信号の再生可否を判定し、
　前記送信処理部は、前記音響フレームデータごとに前記再生可否情報を対応付けて前記送信を行う
　請求項８に記載の送信装置。
　前記音響フレームデータと該音響フレームデータに対応した前期再生可否情報とを含む符号化データを生成する符号化部を備え、
　前記送信処理部は、前記送信において前記符号化データを送信する
　請求項９に記載の送信装置。
　前記解析処理部は、前記音響信号の解析結果に基づいて前記再生可否情報を生成する
　請求項８に記載の送信装置。
　前記コンテンツデータは前記音響信号と同期して再生される動画像データを含み、
　前記解析処理部は、
　前記動画像データに対する解析処理を行い、
　前記動画像データの解析結果に基づいて前記再生可否情報を生成する
　請求項８に記載の送信装置。
　前記解析処理部は、前記音響フレームデータにおけるスペクトル平坦度に基づいて前記再生可否情報を生成する
　請求項９に記載の送信装置。
　前記解析処理部は、前記音響フレームデータにおける閾値以下の周波数成分のパワースペクトルの合計値に基づいて前記再生可否情報を生成する
　請求項９に記載の送信装置。
　前記解析処理部は、前記動画像データにおける複数の画素の輝度値の合計値に基づいて前記再生可否情報を生成する
　請求項１２に記載の送信装置。
　前記解析処理部は、前記動画像データにおいて所定以上の大きさの人の顔を検出したか否かに基づいて前記再生可否情報を生成する
　請求項１２に記載の送信装置。
　触覚信号の再生可否情報と音響信号が含まれるデータを受信し、
　前記再生可否情報が再生可を示す場合に前記受信した音響信号に基づいて前記触覚信号を生成し、
　前記再生可否情報が再生不可を示す場合に前記触覚信号の生成を行わないことを決定する処理を、コンピュータ装置が実行する
　情報処理方法。
　少なくとも音響信号を含むコンテンツデータに対する解析処理を行い触覚信号の再生可否を示す再生可否情報を生成し、
　前記再生可否情報と前記音響信号を送信する処理を、コンピュータ装置が実行する
　情報処理方法。
　触覚信号の再生可否情報と音響信号が含まれるデータを受信し、
　前記再生可否情報が再生可を示す場合に前記受信した音響信号に基づいて前記触覚信号を生成し、
　前記再生可否情報が再生不可を示す場合に前記触覚信号の生成を行わないことを決定する機能を、演算処理装置に実行させる
　プログラム。
　少なくとも音響信号を含むコンテンツデータに対する解析処理を行い触覚信号の再生可否を示す再生可否情報を生成し、
　前記再生可否情報と前記音響信号を送信する機能を、演算処理装置に実行させる
　プログラム。