WO2021149516A1

WO2021149516A1 - 自律移動体、情報処理方法、プログラム、及び、情報処理装置

Info

Publication number: WO2021149516A1
Application number: PCT/JP2021/000488
Authority: WO
Inventors: 高橋　慧; 吉秀藤本; 潤一永原
Original assignee: ソニーグループ株式会社
Priority date: 2020-01-24
Filing date: 2021-01-08
Publication date: 2021-07-29
Also published as: US20230042682A1; JPWO2021149516A1

Abstract

本技術は、自律移動体の出力音によるユーザ体験を向上させることができるようにする自律移動体、情報処理方法、プログラム、及び、情報処理装置に関する。自律移動体は、自装置と組み合わされている機器である組合せ機器の認識を行う認識部と、前記組合せ機器の認識結果に基づいて、前記自装置から出力する出力音の制御方法を変更し、変更した前記制御方法に基づいて、前記出力音の制御を行う音制御部とを備える。本技術は、例えば、ロボットに適用することができる。

Description

自律移動体、情報処理方法、プログラム、及び、情報処理装置

　本技術は、自律移動体、情報処理方法、プログラム、及び、情報処理装置に関し、特に、自律移動体の出力音によるユーザ体験を向上させるようにした自律移動体、情報処理方法、プログラム、及び、情報処理装置に関する。

　従来、ユーザの働きかけに応じてロボットの感情の状態を決定し、ロボットに装着されている外装ユニットに応じたパフォーマンス情報の中から、決定した感情に応じた行動内容及び音声内容を選択し、選択した行動内容及び音声内容でロボットを自律的に動作させることが提案されている（例えば、特許文献１参照）。

特開２００１－１９１２７５号公報

　しかしながら、特許文献１に記載の発明では、ロボットに装着された外装ユニットに応じて、予め登録されている固定音が切り替えられるのみであり、変化に乏しい。

　本技術は、このような状況に鑑みてなされたものであり、ロボット等の自律移動体の出力音によるユーザ体験を向上させるようにするものである。

　本技術の一側面の自律移動体は、自装置と組み合わされている機器である組合せ機器の認識を行う認識部と、前記組合せ機器の認識結果に基づいて、前記自装置から出力する出力音の制御方法を変更し、変更した前記制御方法に基づいて、前記出力音の制御を行う音制御部とを備える。

　本技術の一側面の情報処理方法は、自律移動体と組み合わされている機器である組合せ機器の認識を行い、前記組合せ機器の認識結果に基づいて、前記自律移動体から出力する出力音の制御方法を変更し、変更した前記制御方法に基づいて、前記出力音の制御を行う。

　本技術の一側面のプログラムは、自律移動体と組み合わされている機器である組合せ機器の認識を行い、前記組合せ機器の認識結果に基づいて、前記自律移動体から出力する出力音の制御方法を変更し、変更した前記制御方法に基づいて、前記出力音の制御を行う。

　本技術の一側面の情報処理装置は、自律移動体と組み合わされている機器である組合せ機器の認識を行う認識部と、前記組合せ機器の認識結果に基づいて、前記自律移動体から出力する出力音の制御方法を変更し、変更した前記制御方法に基づいて、前記出力音の制御を行う音制御部とを備える。

　本技術の一側面によれば、自律移動体と組み合わされている機器である組合せ機器の認識が行われ、前記組合せ機器の認識結果に基づいて、前記自律移動体から出力する出力音の制御方法が変更され、変更された前記制御方法に基づいて、前記出力音の制御が行われる。

本技術を適用した情報処理システムの一実施の形態を示すブロック図である。自律移動体の正面図である。自律移動体の背面図である。自律移動体の斜視図である。自律移動体の側面図である。自律移動体の上面図である。自律移動体の底面図である。自律移動体の内部構造について説明するための概略図である。自律移動体の内部構造について説明するための概略図である。自律移動体の機能構成例を示すブロック図である。自律移動体の制御部により実現される機能構成例を示すブロック図である。合成音に係るパラメータについて説明するための図である。ピッチとスピードの制御により表現され得る感情の一例を示す図である。情報処理サーバの機能構成例を示すブロック図である。自律移動体により実行される動作モード設定処理を説明するためのフローチャートである。自律移動体により実行される動作音出力制御処理の基本例を説明するためのフローチャートである。センサデータから動作音を生成する方法の具体例を示す図である。タッチセンサのセンサデータと接触音の波形の例を示す図である。通常モード時の並進音出力制御処理を説明するためのフローチャートである。通常モード時の並進音の波形の例を示す図である。ネコモード時の並進音出力制御処理を説明するためのフローチャートである。ネコモード時の並進音の波形の例を示す図である。持ち上げ音出力制御処理を説明するためのフローチャートである。コンピュータの構成例を示す図である。

　以下、本技術を実施するための形態について説明する。説明は以下の順序で行う。
　１．実施の形態
　２．変形例
　３．その他

　＜＜１．実施の形態＞＞
　図１乃至図２３を参照して、本技術の実施の形態について説明する。

　　＜情報処理システム１の構成例＞
　図１は、本技術を適用した情報処理システム１の一実施の形態を示している。

　情報処理システム１は、自律移動体１１、情報処理サーバ１２、及び、被操作装置１３を備える。自律移動体１１、情報処理サーバ１２、及び、被操作装置１３は、ネットワーク１４を介して接続されている。

　自律移動体１１は、情報処理サーバ１２の制御によらずに、又は、情報処理サーバ１２の制御により、自律動作を行う情報処理装置である。例えば、自律移動体１１は、走行型、歩行型、飛行型、遊泳型などの種々のロボットにより構成される。

　また、自律移動体１１は、ユーザとのコミュニケーションをより自然かつ効果的に実現することを可能とするエージェント装置である。自律移動体１１は、ユーザとのコミュニケーションを誘因する種々の動作（以下、誘因動作とも称する）を能動的に実行することを特徴の一つとする。

　例えば、自律移動体１１は、環境認識に基づいて、ユーザに対し能動的な情報提示を行うことが可能である。また、例えば、自律移動体１１は、ユーザに所定の行動を促す種々の誘因動作を能動的に実行する。

　また、自律移動体１１による誘因動作は、物理空間に対する能動的かつ積極的な干渉であるといえる。自律移動体１１は、物理空間において移動を行い、ユーザや生物、物品などに対して種々の物理的動作を実行することが可能である。自律移動体１１が有する上記の特徴によれば、ユーザは視覚、聴覚、及び、触覚を通じて自律移動体の動作を包括的に認知することができ、単に音声を用いてユーザとの対話を行う場合などと比べ、高度なコミュニケーションを実現することができる。

　さらに、自律移動体１１は、出力音を出力することにより、自身の状態を表現したり、ユーザや他の自律移動体とコミュニケーションをとったりすることが可能である。自律移動体１１の出力音は、自律移動体１１の状況に対応して出力される動作音、及び、ユーザや他の自律移動体等とコミュニケーションをとるための発話音を含む。

　動作音は、自律移動体１１の動きに対応して出力される音、及び、自律移動体１１への刺激に対応して出力される音を含む。自律移動体１１の動きに対応して出力される音は、自律移動体１１が能動的に動く場合に出力される音だけでなく、自律移動体１１が受動的に動かされた場合に出力される音も含む。自律移動体１１への刺激は、例えば、自律移動体１１の五感（視覚、聴覚、嗅覚、味覚、触覚）のいずれかに対する刺激である。なお、自律移動体１１は、必ずしも五感の全ての間隔を認識できるとは限らない。

　発話音は、必ずしも人間が理解できる言語を表す音声である必要はなく、例えば、動物の鳴き声等を模した非言語を表す音声であってもよい。

　情報処理サーバ１２は、自律移動体１１の動作を制御する情報処理装置である。例えば、情報処理サーバ１２は、自律移動体１１に、ユーザとのコミュニケーションを誘因する種々の誘因動作を実行させる機能を備える。

　被操作装置１３は、自律移動体１１及び情報処理サーバ１２により操作される種々の装置である。自律移動体１１は、情報処理サーバ１２の制御によらずに、又は、情報処理サーバ１２の制御により、種々の被操作装置１３を操作することが可能である。被操作装置１３は、例えば、照明装置、ゲーム機器、テレビジョン装置等の家電機器により構成される。

　ネットワーク１４は、情報処理システム１が備える各構成を接続する機能を備える。例えば、ネットワーク１４は、インターネット、電話回線網、衛星通信網等の公衆回線網や、Ethernet（登録商標）を含む各種のＬＡＮ（Local Area Network）、ＷＡＮ（Wide Area Network）等を含んでもよい。例えば、ネットワーク１４は、ＩＰ－ＶＰＮ（Internet Protocol-Virtual Private Network）等の専用回線網を含んでもよい。例えば、ネットワーク１４は、Ｗｉ－Ｆｉ（登録商標）、Bluetooth（登録商標）等の無線通信網を含んでもよい。

　　＜自律移動体１１の構成例＞
　次に、図２乃至図１３を参照して、自律移動体１１の構成例について説明する。自律移動体１１は、環境認識に基づく自律動作を行う種々の装置であり得る。以下においては、自律移動体１１が車輪による自律走行を行う長楕円体のエージェント型のロボット装置である場合を例に説明する。自律移動体１１は、例えば、ユーザ、周囲、及び、自身の状況に応じた自律動作を行うことで、情報提示を含む種々のコミュニケーションを実現する。自律移動体１１は、例えば、ユーザが片手で容易に持ち上げられる程度の大きさ及び重量を有する小型ロボットとされる。

　　　＜自律移動体１１の外装の例＞
　まず、図２乃至図７を参照して、自律移動体１１の外装の例について説明する。

　図２は、自律移動体１１の正面図であり、図３は、自律移動体１１の背面図である。図４のＡ及びＢは、自律移動体１１の斜視図である。図５は、自律移動体１１の側面図である。図６は、自律移動体１１の上面図である。図７は、自律移動体１１の底面図である。

　図２乃至図６に示されるように、自律移動体１１は、本体上部に左眼及び右眼に相当する眼部１０１Ｌ及び眼部１０１Ｒを備える。眼部１０１Ｌ及び眼部１０１Ｒは、例えば、ＬＥＤなどにより実現され、視線や瞬きなどを表現することができる。なお、眼部１０１Ｌ及び眼部１０１Ｒは、上記の例に限定されず、例えば、単一または独立した２つのＯＬＥＤ（Organic Light Emitting Diode）などにより実現されてもよい。

　また、自律移動体１１は、眼部１０１Ｌ及び眼部１０１Ｒの上方にカメラ１０２Ｌ及びカメラ１０２Ｒを備える。カメラ１０２Ｌ及びカメラ１０２Ｒは、ユーザや周囲環境を撮像する機能を有する。その際、自律移動体１１は、カメラ１０２Ｌ及びカメラ１０２Ｒにより撮像された画像に基づいて、ＳＬＡＭ（Simultaneous Localization and Mapping）を実現してもよい。

　なお、眼部１０１Ｌ、眼部１０１Ｒ、カメラ１０２Ｌ、及び、カメラ１０２Ｒは、外装表面の内部に配置される基板（不図示）上に配置される。また、自律移動体１１の外装表面は、基本的に不透明な素材を用いて形成されるが、眼部１０１Ｌ、眼部１０１Ｒ、カメラ１０２Ｌ、及び、カメラ１０２Ｒが配置される基板に対応する部分には、透明又は半透明素材を用いた頭部カバー１０４が設けられる。これにより、ユーザは、自律移動体１１の眼部１０１Ｌ及び眼部１０１Ｒを認識することができ、自律移動体１１は、外界を撮像することができる。

　また、図２、図４、及び、図７に示すように、自律移動体１１は、正面下部にＴｏＦ（Time of Flight）センサ１０３を備える。ＴｏＦセンサ１０３は、前方に存在する物体との距離を検出する機能を備える。自律移動体１１は、ＴｏＦセンサ１０３により、例えば、種々の物体との距離を精度高く検出したり、段差等を検出して、落下や転倒を防止したりすることができる。

　また、図３、図５などに示すように、自律移動体１１は、背面に外部装置の接続端子１０５及び電源スイッチ１０６を備える。自律移動体１１は、例えば、接続端子１０５を介して外部装置と接続し、情報通信を行うことができる。

　また、図７に示すように、自律移動体１１は、底面に車輪１０７Ｌ及び車輪１０７Ｒを備える。車輪１０７Ｌ及び車輪１０７Ｒは、それぞれ異なるモータ（不図示）により駆動される。これにより、自律移動体１１は、前進、後退、旋回、回転などの移動動作を実現することができる。

　また、車輪１０７Ｌ及び車輪１０７Ｒは、本体内部への格納、及び、外部への突出が可能である。例えば、自律移動体１１は、車輪１０７Ｌ及び車輪１０７Ｒを勢いよく外部へと突出させることでジャンプ動作を行うことが可能である。なお、図７には、車輪１０７Ｌ及び車輪１０７Ｒが本体内部へ格納された状態が示されている。

　なお、以下、眼部１０１Ｌ及び眼部１０１Ｒを個々に区別する必要がない場合、単に眼部１０１と称する。以下、カメラ１０２Ｌ及びカメラ１０２Ｒを個々に区別する必要がない場合、単にカメラ１０２と称する。以下、車輪１０７Ｌ及び車輪１０７Ｒを個々に区別する必要がない場合、単に車輪１０７と称する。

　　　＜自律移動体１１の内部構造の例＞
　図８及び図９は、自律移動体１１の内部構造を示す模式図である。

　図８に示されるように、自律移動体１１は、電子基板上に配置される慣性センサ１２１及び通信装置１２２を備える。慣性センサ１２１は、自律移動体１１の加速度や角速度を検出する。また、通信装置１２２は、外部との無線通信を実現するための構成であり、例えば、BluetoothやＷｉ－Ｆｉアンテナ等を含む。

　また、自律移動体１１は、例えば、本体側面の内部にスピーカ１２３を備える。自律移動体１１は、スピーカ１２３により、種々の音を出力することができる。

　また、図９に示されるように、自律移動体１１は、本体上部の内側にマイクロフォン１２４Ｌ、マイクロフォン１２４Ｍ、及び、マイクロフォン１２４Ｒを備える。マイクロフォン１２４Ｌ、マイクロフォン１２４Ｍ、及び、マイクロフォン１２４Ｒは、ユーザの発話や、周囲の環境音を収集する。また、自律移動体１１は、複数のマイクロフォン１２４Ｌ、マイクロフォン１２４Ｍ、及び、マイクロフォン１２４Ｒを備えることで、周囲で発生する音を感度高く収集するとともに、音源の位置を検出することができる。

　また、自律移動体１１は、図８及び図９に示されるように、モータ１２５Ａ乃至モータ１２５Ｅ（ただし、モータ１２５Ｅは不図示）を備える。モータ１２５Ａ及びモータ１２５Ｂは、例えば、眼部１０１及びカメラ１０２が配置される基板を垂直方向および水平方向に駆動する。モータ１２５Ｃは、自律移動体１１の前傾姿勢を実現する。モータ１２５Ｄは、車輪１０７Ｌを駆動する。モータ１２５Ｅは、車輪１０７Ｒを駆動する。自律移動体１１は、モータ１２５Ａ乃至モータ１２５Ｅにより、豊かな動作を表現することができる。

　なお、以下、マイクロフォン１２４Ｌ乃至マイクロフォン１２４Ｒを個々に区別する必要がない場合、単にマイクロフォン１２４と称する。以下、モータ１２５Ａ乃至モータ１２５Ｅを個々に区別する必要がない場合、単にモータ１２５と称する。

　　　＜自律移動体１１の機能の構成例＞
　図１０は、自律移動体１１の機能の構成例を示している。自律移動体１１は、制御部２０１、センサ部２０２、入力部２０３、光源２０４、音出力部２０５、駆動部２０６、及び、通信部２０７を備える。

　制御部２０１は、自律移動体１１が備える各構成を制御する機能を備える。制御部２０１は、例えば、各構成の起動や停止を制御する。また、制御部２０１は、情報処理サーバ１２から受信した制御信号等を、光源２０４、音出力部２０５、及び、駆動部２０６に供給する。

　センサ部２０２は、ユーザや周囲の状況に関する種々のデータを収集する機能を備える。例えば、センサ部２０２は、上述したカメラ１０２、ＴｏＦセンサ１０３、慣性センサ１２１、マイクロフォン１２４等を備える。また、センサ部２０２は、上記のセンサの他に、例えば、地磁気センサ、タッチセンサ、ＩＲ（赤外線）センサ等を含む種々の光センサ、温度センサ、湿度センサ等の様々なセンサを備えていてもよい。センサ部２０２は、各センサから出力されるセンサデータを制御部２０１に供給する。

　入力部２０３は、例えば、上述した電源スイッチ１０６等のボタンやスイッチ等を備え、ユーザによる物理的な入力操作を検出する。

　光源２０４は、例えば、上述した眼部１０１等を備え、自律移動体１１の眼球動作を表現する。

　音出力部２０５は、例えば、上述したスピーカ１２３及びアンプ等を備え、制御部２０１から供給される出力音データに基づいて、出力音を出力する。

　駆動部２０６は、例えば、上述した車輪１０７及びモータ１２５等を備え、自律移動体１１の身体動作の表現に用いられる。

　通信部２０７は、例えば、上述した接続端子１０５及び通信装置１２２等を備え、情報処理サーバ１２、被操作装置１３、及び、その他の外部装置との通信を行う。例えば、通信部２０７は、センサ部２０２から供給されるセンサデータを情報処理サーバ１２に送信し、自律移動体１１の動作を制御するための制御信号、及び、自律移動体１１から出力音を出力させるための出力音データを情報処理サーバ１２から受信する。

　　＜情報処理部２４１の構成例＞
　図１１は、自律移動体１１の制御部２０１が所定の制御プログラムを実行することにより実現される情報処理部２４１の構成例を示している。

　情報処理部２４１は、認識部２５１、行動計画部２５２、動作制御部２５３、及び、音制御部２５４を備える。

　認識部２５１は、センサ部２０２から供給されるセンサデータに基づいて、自律移動体１１の周囲のユーザや環境、及び、自律移動体１１に関する種々の情報の認識を行う機能を備える。

　例えば、認識部２５１は、ユーザ識別、ユーザの表情や視線の認識、物体認識、色認識、形認識、マーカ認識、障害物認識、段差認識、明るさ認識、自律移動体１１への刺激の認識等を行う。例えば、認識部２５１は、ユーザの声に係る感情認識、単語理解、音源の位置の認識等を行う。例えば、認識部２５１は、周囲の温度、動物体の存在、自律移動体１１の姿勢や動き等を認識する。例えば、認識部２５１は、自律移動体１１と組み合わされている機器（以下、組合せ機器と称する）を認識する。

　自律移動体１１が組合せ機器と組み合わされる例として、例えば、自律移動体１１と組合せ機器のうち一方が他方に取り付けられる場合、自律移動体１１と組合せ機器のうち一方が他方に乗る場合、自律移動体１１と組合せ機器が合体する場合等が想定される。また、組合せ機器の例として、例えば、自律移動体１１に着脱可能なパーツ（以下、オプションパーツと称する）、自律移動体１１が乗ることが可能な移動体（以下、搭乗用移動体と称する）、自律移動体１１を着脱可能な機器（以下、取付先機器と称する）等が想定される。

　オプションパーツとしては、例えば、動物の体の一部（例えば、目、耳、鼻、口、くちばし、角、尻尾、羽等）を模したパーツ、衣装、着ぐるみ、自律移動体１１の機能や能力等を拡張するパーツ（例えば、メダル、武器等）、車輪、キャタピラ等が想定される。搭乗用移動体としては、例えば、車、ドローン、ロボット型掃除機等が想定される。取付先機器としては、例えば、自律移動体１１を含む複数のパーツから構成される合体型のロボット等が想定される。

　なお、組合せ機器は、必ずしも自律移動体１１専用の機器である必要はなく、例えば、汎用的な機器であってもよい。

　また、認識部２５１は、認識した情報に基づいて、自律移動体１１が置かれた環境や状況を推定し、理解する機能を備える。この際、認識部２５１は、事前に記憶される環境知識を用いて総合的に状況推定を行ってもよい。

　認識部２５１は、認識結果を示すデータを行動計画部２５２、動作制御部２５３、及び、音制御部２５４に供給する。

　行動計画部２５２は、認識部２５１による認識結果、例えば、認識部２５１による組合せ機器の認識結果に基づいて、自律移動体１１の動作を規定する動作モードを設定する。また、行動計画部２５２は、例えば、認識部２５１による認識結果、動作モード、及び、学習知識に基づいて、自律移動体１１が行う行動を計画する機能を備える。さらに、行動計画部２５２は、例えば、ディープラーニング等の機械学習アルゴリズムを用いて行動計画を実行する。行動計画部２５２は、動作データおよび行動計画を示すデータを動作制御部２５３及び音制御部２５４に供給する。

　動作制御部２５３は、認識部２５１による認識結果、行動計画部２５２による行動計画、及び、動作モードに基づいて、光源２０４及び駆動部２０６を制御することにより、自律移動体１１の動作制御を行う。動作制御部２５３は、例えば、自律移動体１１を前傾姿勢のまま移動させたり、前後運動、旋回運動、回転運動等をさせたりする。また、動作制御部２５３は、ユーザと自律移動体１１とのコミュニケーションを誘因する誘因動作を自律移動体１１に能動的に実行させる。また、動作制御部２５３は、自律移動体１１が行っている動作に関する情報を音制御部２５４に供給する。

　音制御部２５４は、認識部２５１による認識結果、行動計画部２５２による行動計画、及び、動作モードに基づいて、音出力部２０５を制御することにより、出力音の制御を行う。例えば、音制御部２５４は、動作モード等に基づいて、出力音の制御方法を設定し、設定した制御方法に基づいて、出力音の制御（例えば、生成する出力音の内容及び出力音の出力タイミングの制御等）を行う。そして、音制御部２５４は、出力音を出力するための出力音データを生成し、音出力部２０５に供給する。また、音制御部２５４は、自律移動体１１が出力している出力音に関する情報を動作制御部２５３に供給する。

　　＜合成音の生成方法＞
　次に、音制御部２５４における合成音の生成方法について説明する。

　音制御部２５４は、例えば、ＦＭ音源を用いて、合成音からなる出力音を生成する。この際、音制御部２５４は、ＦＭ音源の合成に係る各種のパラメータを動的かつ連続的に変化させ、合成音の波形、すなわち、合成音のピッチ（音程、音の高さ）、音量、音色、スピード等を変化させることで、合成音の印象や感情的な意味合いを多様に表現することが可能である。

　図１２は、合成音に係るパラメータについて説明するための図である。図１２には、ＦＭ音源の合成を行うシンセサイザが備える構成と、各構成に係るパラメータの変化により合成音により表現される出力態様との関係が示されている。

　音制御部２５４は、例えば、オシレータに係るパラメータを変化させることで、音の基本的な質感を変化させることができる。一例としては、音制御部２５４は、音の波形をサイン波とすることで柔らかい印象を表現することができ、鋸歯形状とすることで鋭い印象を表現することができる。

　また、音制御部２５４は、例えば、ピッチコントローラのパラメータ、すなわちピッチを制御することで、性別の差、イントネーション、感情の上下などを表現することができる。

　図１３は、音のピッチとスピードの制御により表現され得る感情の一例を示す図である。なお、図１３におけるハッチング領域の大きさ（面積）は、音量を示している。音のピッチやスピードは、音が表す感情の想起に強く影響することが知られている。音制御部２５４は、例えば、ピッチとスピードを比較的高く設定することで、喜びや怒りの度合いなどを表現することが可能である。反対に、音制御部２５４は、ピッチとスピードを比較的低く設定することで、悲哀を表現することもできる。このように、音制御部２５４は、音のピッチやスピードを制御することで、種々の感情や、その度合いを表現することが可能である。

　図１２に戻り、音制御部２５４は、フィルタのパラメータを制御することで、音の明瞭さ（口の開け方）を表現することが可能である。音制御部２５４は、例えば、ハイカットフィルタの周波数を上下させることで、こもったような音や開いたような音を表現することができる。

　また、音制御部２５４は、アンプの時間的な変化により、声量のアクセントや、立ち上がり方また終わり方の印象を変化させることが可能である。

　また、音制御部２５４は、モジュレータのパラメータを制御することで、声の震えや滑らかさを表現することが可能である。

　このように、音制御部２５４は、オシレータ、モジュレータ、ピッチコントローラ、フィルタ、又は、アンプなどに係る各パラメータを変化させることで、印象や感情的な意味合いを多様に表現することが可能である。

　　＜情報処理サーバ１２の機能構成例＞
　図１４は、情報処理サーバ１２の機能構成例を示している。

　情報処理サーバ１２は、通信部３０１、認識部３０２、行動計画部３０３、動作制御部３０４、及び、音制御部３０５を備える。

　通信部３０１は、ネットワーク１４を介して、自律移動体１１及び被操作装置１３と通信を行う。例えば、通信部３０１は、自律移動体１１からセンサデータを受信し、自律移動体１１の動作を制御するための制御信号、及び、自律移動体１１から出力音を出力させるための出力音データを自律移動体１１に送信する。

　認識部３０２、行動計画部３０３、動作制御部３０４、及び、音制御部３０５は、自律移動体１１の認識部２５１、行動計画部２５２、動作制御部２５３、及び、音制御部２５４と同様の機能を備える。すなわち、認識部３０２、行動計画部３０３、動作制御部３０４、及び、音制御部３０５は、自律移動体１１の認識部２５１、行動計画部２５２、動作制御部２５３、及び、音制御部２５４の代わりに、各種の処理を行うことができる。

　これにより、情報処理サーバ１２は、自律移動体１１を遠隔制御することができ、自律移動体１１は、情報処理サーバ１２の制御の下に、各種の動作を行ったり、各種の出力音を出力したりすることが可能になる。

　　＜自律移動体１１の処理＞
　次に、図１５乃至図２３を参照して、自律移動体１１の処理について説明する。

　なお、以下、自律移動体１１が、情報処理サーバ１２の制御によらずに、独立して各種の動作を行ったり、各種の出力音を出力したりする場合の例について説明する。

　　　＜動作モード設定処理＞
　まず、図１５のフローチャートを参照して、自律移動体１１により実行される動作モード設定処理について説明する。

　この処理は、例えば、自律移動体１１の電源がオンされたとき開始され、オフされたとき終了する。

　ステップＳ１において、認識部２５１は、組合せ機器の組合せが変化したか否かを判定する。認識部２５１は、センサ部２０２から供給されるセンサデータ等に基づいて、自律移動体１１と組み合わされている組合せ機器の追加及び削除の検出を行う。認識部２５１は、組合せ機器の追加及び削除を検出しなかった場合、組合せ機器の組合せが変化していないと判定し、組合せ機器の組合せが変化したと判定するまで、この判定処理を所定のタイミングで繰り返し実行する。

　一方、認識部２５１は、組合せ機器の追加又は削除を検出した場合、組合せ機器の組合せが変化したと判定し、処理はステップＳ２に進む。

　なお、組合せ機器の認識方法は、特に限定されない。以下、組合せ機器の認識方法の例について説明する。

　まず、組合せ機器を直接認識する方法の例について説明する。

　例えば、組合せ機器を電気的に認識する方法が考えられる。例えば、自律移動体１１と組合せ機器との間に電気信号を流すことにより、組合せ機器が認識される。

　例えば、物理的なスイッチを用いて、組合せ機器を認識する方法が考えられる。例えば、組合せ機器を自律移動体１１に組み合わせた場合に、自律移動体１１に設けられている接触スイッチが組合せ機器により押下されることにより、組合せ機器が認識される。例えば、組合せ機器を自律移動体１１に組み合わせた場合に、自律移動体１１に設けられている光スイッチが組合せ機器により遮光されることにより、組合せ機器が認識される。

　例えば、色、バーコード等の視覚情報を用いて、組合せ機器を光学的に認識する方法が考えられる。例えば、カメラ１０２Ｌ及びカメラ１０２Ｒにより撮像された画像に基づいて、組合せ機器、及び、組合せ機器の特徴（例えば、色や形等）が認識される。

　例えば、組合せ機器を磁力により認識する方法が考えられる。例えば、組合せ機器に設けられている磁石の磁力に基づいて、組合せ機器が認識される。

　例えば、組合せ機器を電波により認識する方法が考えられる。例えば、認識部２５１は、自律移動体１１の通信装置１２２が組合せ機器に設けられているＲＦＩＤ（Radio Frequency Identifier）から情報を読み取ったり、組合せ機器とBluetoothやＷｉ－Ｆｉ等の近距離無線通信を行ったりした結果に基づいて、組合せ機器を認識する。

　次に、組合せ機器が組み合わされることによる自律移動体１１の動きの変化に基づいて、組合せ機器を間接的に認識する方法の例について説明する。

　例えば、センサ部２０２からのセンサデータに基づく検出値に対して、所定のルールを適用することにより組合せ機器が認識される。

　例えば、自律移動体１１が車輪に乗った場合と回し車に乗った場合とで、自律移動体１１の振動量と自律移動体１１の移動量（オドメトリ）との比率が変化する。例えば、自律移動体１１が車輪に乗った場合、自律移動体１１の振動量が減少する一方、自律移動体１１の移動量が増加する。一方、自律移動体１１が回し車に乗った場合、自律移動体１１の振動量が増加する一方、自律移動体１１の移動量が減少する。従って、例えば、自律移動体１１の振動量と移動量の比率に基づいて、車輪又は回し車が自律移動体１１と組み合わされたことが認識される。

　例えば、車輪１０７Ｌ及び車輪１０７Ｒより大きな車輪やキャタピラが自律移動体１１に装着された場合、転がり抵抗が大きくなる。従って、自律移動体１１の転がり抵抗の検出値に基づいて、車輪又はキャタピラが自律移動体１１と組み合わされたことが認識される。

　例えば、自律移動体１１が組合せ機器に取り付けられたり、組合せ機器と合体したりした場合、自律移動体１１の動きが制約されるときがある。例えば、認識部２５１は、センサ部２０２からのセンサデータに基づいて、自律移動体１１の動きの制約を検出することにより、組合せ機器を認識する。

　なお、上述した複数の方法を組み合わせて、組合せ機器の認識を行うようにしてもよい。

　例えば、慣性センサ１２１を用いて検出される自律移動体１１の振動パターンに基づいて、自律移動体１１が車輪に乗ったことを認識することが可能である。また、例えば、磁気センサにより車輪に設けられている磁石の磁力を検出することにより、自律移動体１１が車輪に乗ったことを認識することが可能である。

　ここで、慣性センサ１２１を用いた認識方法では、車輪の認識に要する時間が長くなる一方、車輪が正しく装着されていなくても車輪の認識が可能になる。一方、磁気センサを用いた認識方法では、車輪の認識に要する時間が短くなる一方、車輪が正しく装着されていなければ車輪の認識が困難になる。従って、２つの認識方法を組み合わせることにより、両者の欠点を補うことができ、車輪の認識精度及び認識速度が向上する。

　また、例えば、センサ部２０２からのセンサデータを用いて機械学習を行うことにより生成した判別機を用いて、組合せ機器を認識するようにすることも可能である。

　ステップＳ２において、自律移動体１１は、動作モードを変更する。

　具体的には、認識部２５１は、自律移動体１１と組み合わされている組合せ機器の有無、及び、種類を示すデータを行動計画部２５２に供給する。

　行動計画部２５２は、組合せ機器が自律移動体１１に組み合わされていない場合、動作モードを通常モードに設定する。

　一方、行動計画部２５２は、組合せ機器が自律移動体１１に組み合わされている場合、例えば、組み合わされている組合せ機器の種類に基づいて、動作モードを設定する。

　例えば、行動計画部２５２は、自律移動体１１の頭部にネコの耳型のオプションパーツ（以下、耳型パーツと称する）が装着された場合、動作モードをネコモードに設定する。例えば、行動計画部２５２は、自律移動体１１が車に乗っている場合、動作モードを車両モードに設定する。

　なお、複数の組合せ機器が自律移動体１１に組み合わされている場合、行動計画部２５２は、例えば、その組み合わせに基づいて、動作モードを設定する。或いは、行動計画部２５２は、組合せ機器の優先順位に基づいて、最も優先順位の高い組合せ機器の種類に基づいて、動作モードを設定する。

　また、例えば、行動計画部２５２は、組合せ機器の種類によらずに、組合せ機器が組み合わされているか否かのみに基づいて、動作モードを設定するようにしてもよい。

　行動計画部２５２は、設定した動作モードを示すデータを動作制御部２５３及び音制御部２５４に供給する。

　その後、処理はステップＳ１に戻り、ステップＳ１以降の処理が実行される。

　　＜動作音出力制御処理の基本例＞
　次に、図１６のフローチャートを参照して、自律移動体１１により実行される動作音出力制御処理の基本例について説明する。

　ステップＳ５１において、認識部２５１は、センサデータを中間パラメータに変換する。

　例えば、慣性センサ１２１に含まれる加速度センサのセンサデータには、重力加速度の成分が含まれる。従って、加速度センサのセンサデータをそのまま用いて動作音を出力した場合、自律移動体１１が動いていなくても動作音が常時出力されるようになる。

　また、加速度センサのセンサデータは、ｘ軸、ｙ軸、ｚ軸の３軸方向の加速度を含むため、自律移動体１１の移動に対応する成分以外に、振動やノイズに対応する成分も含まれる。従って、加速度センサのセンサデータをそのまま用いて動作音を出力した場合、自律移動体１１の移動以外に、振動やノイズに反応して動作音が出力されるようになる。

　これに対して、認識部２５１は、センサ部２０２に含まれる各センサのセンサデータを、動作音の出力対象となる自律移動体１１の状況に対応し、人間が理解できる中間パラメータに変換する。

　具体的には、認識部２５１は、センサ部２０２に含まれる各センサからセンサデータを取得し、各センサデータに対してフィルタ処理や閾値処理等の算術及び論理演算を行うことにより、各センサデータを所定の種類の中間パラメータに変換する。

　図１７は、センサデータから中間パラメータへの変換方法の具体例を示している。

　例えば、認識部２５１は、センサ部２０２に含まれる回転センサ４０１から、自律移動体１１のモータ１２５Ｄ又はモータ１２５Ｅの回転数を示すセンサデータを取得する。認識部２５１は、モータ１２５Ｄ又はモータ１２５Ｅの回転数に基づいて、オドメトリを計算することにより、自律移動体１１の移動量を計算する。また、認識部２５１は、自律移動体１１の移動量に基づいて、自律移動体１１の並進方向（前後左右方向）の速度（以下、並進速度と称する）を計算する。これにより、センサデータが、中間パラメータである速度（並進速度）に変換される。

　例えば、認識部２５１は、センサ部２０２に含まれ、自律移動体１１の底面に設けられているＩＲセンサ４０２（図２乃至図９で不図示）から、底面に物体（例えば、床面）が近接しているか否かを示すセンサデータを取得する。また、認識部２５１は、慣性センサ１２１に含まれる加速度センサ１２１Ａから自律移動体１１の加速度を示すセンサデータを取得する。認識部２５１は、自律移動体１１の底面に物体が近接しているか否か、及び、自律移動体１１の加速度に基づいて、自律移動体１１が持ち上げられているか否かを認識する。これにより、センサデータが、中間パラメータである持ち上げの有無に変換される。

　例えば、認識部２５１は、加速度センサ１２１Ａから自律移動体１１の加速度を示すセンサデータを取得する。また、認識部２５１は、慣性センサ１２１に含まれる角速度センサ１２１Ｂから自律移動体１１の角速度を示すセンサデータを取得する。認識部２５１は、自律移動体１１の加速度及び角速度に基づいて、自律移動体１１が持ち上げられた後の動き量を検出する。この動き量は、例えば、自律移動体１１が持ち上げられた後に揺り動かされた量を示す。これにより、センサデータが、中間パラメータである自律移動体１１が持ち上げられた後の動き量に変換される。

　例えば、認識部２５１は、角速度センサ１２１Ｂから自律移動体１１の角速度を示すセンサデータを取得する。認識部２５１は、自律移動体１１の角速度に基づいて、自律移動体の上下方向の軸を中心とするヨー方向の回転（横回転）を検出する。これにより、センサデータが、中間パラメータである自律移動体１１が横回転に変換される。

　例えば、認識部２５１は、センサ部２０２に含まれ、ユーザが触れる可能性が高い１カ所以上の部位に設けられているタッチセンサ４０３から、自律移動体１１への接触の有無を示すセンサデータを取得する。タッチセンサ４０３は、例えば、静電容量式や感圧式のタッチセンサにより構成される。認識部２５１は、自律移動体１１への接触の有無に基づいて、ユーザの触れる、撫でる、叩く、押すなどの接触行為を認識する。これにより、センサデータが、中間パラメータである自律移動体１１への接触行為の有無に変換される。

　ステップＳ５２において、音制御部２５４は、中間パラメータ及び動作モードに基づいて、動作音を生成する。

　例えば、音制御部２５４は、自律移動体１１の速度が所定の閾値以上の場合、自律移動体１１の並進に対応する動作音である並進音を生成する。このとき、音制御部２５４は、例えば、自律移動体１１の速度、及び、動作モード等に基づいて、並進音のピッチ（例えば、周波数）、音量、音色（例えば、周波数成分、変調度合い等）、スピード等のパラメータのうちのいくつかを変化させる。

　例えば、動作モードが通常モードに設定されている場合、自律移動体１１の速度に応じた連続音であって、車輪の回転音を模した音が並進音として生成される。

　例えば、動作モードが上述したネコモードに設定されている場合、ネコの足音を模した音が並進音として生成される。

　例えば、動作モードが上述した車両モードに設定されている場合、自律移動体１１の速度に応じてピッチが変化し、車の走行音を模した音が並進音として生成される。

　例えば、音制御部２５４は、自律移動体１１が持ち上げられている場合、自律移動体１１の持ち上げに対応する動作音である持ち上げ音を生成する。このとき、音制御部２５４は、例えば、自律移動体１１が持ち上げられた後の動き量の変化、及び、動作モード等に基づいて、持ち上げ音のピッチ、音量、音色、スピード等のパラメータのうちのいくつかを変化させる。

　例えば、動作モードが通常モードに設定されている場合、人が驚いたような音が持ち上げ音として生成される。

　例えば、動作モードがネコモードに設定されている場合、ネコを怒らせたような低い成分を含む音が持ち上げ音として生成される。

　なお、例えば、動作モードが車両モードに設定されている場合、持ち上げ音は生成されず、出力されない。

　例えば、音制御部２５４は、自律移動体１１の横回転の回転速度が所定の閾値以上の場合、自律移動体１１の横回転に対応する動作音である回転音を生成する。このとき、音制御部２５４は、例えば、自律移動体１１の横方向の回転速度の変化、及び、動作モード等に基づいて、回転音のピッチ、音量、音色、スピード等のパラメータのうちのいくつかを変化させる。

　例えば、動作モードが通常モードに設定されている場合、自律移動体１１の回転速度に応じてピッチが変化する回転音が生成される。

　例えば、動作モードがネコモードに設定されている場合、自律移動体１１の回転速度に応じてピッチが変化し、通常モードの場合と異なる音色の回転音が生成される。

　例えば、動作モードが車両モードに設定されている場合、自律移動体１１の回転速度に応じてピッチが変化し、通常モード及びネコモードの場合と異なる音色の回転音が生成される。例えば、モータの回転音を模した並進音が生成される。

　例えば、音制御部２５４は、自律移動体１１への接触行為が認識された場合、接触行為に対する自律移動体１１の反応を示す動作音である接触音を生成する。このとき、音制御部２５４は、例えば、自律移動体１１への接触行為の種類、継続時間及び強さ、並びに、動作モード等に基づいて、接触音の高さ、音量、音色、スピード等のパラメータのうちのいくつかを変化させる。

　例えば、動作モードがネコモードに設定されている場合、ネコの鳴き声を模した音が接触音として生成される。

　なお、例えば、動作モードが通常モード又は車両モードに設定されている場合、接触音は生成されず、出力されない。

　このようにして、組合せ機器の種類に対応する内容に動作音の内容が設定される。

　ステップＳ５３において、自律移動体１１は、動作音を出力する。具体的には、音制御部２５４は、生成した動作音を出力するための出力音データを生成し、音出力部２０５に供給する。音出力部２０５は、取得した出力音データに基づいて、動作音を出力する。

　なお、例えば、音制御部２５４は、出力音を出力するトリガとなる自律移動体１１の状況（例えば、自律移動体１１の動き又は自律移動体１１への刺激等）の認識が開始されたときの動作音の反応速度を、当該状況の認識が終了したときの動作音の反応速度より速くする。例えば、音制御部２５４は、当該状況の認識の開始時に動作音が迅速に立ち上がり、当該状況の認識の終了時に動作音が緩やかに停止するように、動作音の出力を制御する。

　例えば、図１８のＡは、タッチセンサ４０３のセンサデータの波形を示すグラフである。横軸は時刻を示し、縦軸はセンサデータの値を示している。図１８のＢは、接触音の波形を示すグラフである。横軸は時刻を示し、縦軸は接触音の音量を示している。

　例えば、時刻ｔ１において、ユーザが自律移動体１１への接触行為を開始したとき、タッチセンサ４０３はセンサデータの出力を開始する。これにより、認識部２５１による接触行為の認識が開始される。このとき、音制御部２５４は、接触音を急峻に立ち上げる。すなわち、音制御部２５４は、接触行為の認識の開始と略同時に接触音の出力を開始させるとともに、接触音の音量を急峻に増大させる。

　一方、時刻ｔ２において、ユーザが自律移動体１１への接触行為を終了したとき、タッチセンサ４０３はセンサデータの出力を停止する。これにより、認識部２５１による接触行為の認識が終了する。このとき、音制御部２５４は、接触音を緩やかに停止させる。すなわち、音制御部２５４は、接触行為の認識が終了した後、接触音の音量を緩やかに減少させ、接触音の出力をしばらく継続させる。

　これにより、より自然な接触音が出力されるようになる。例えば、ユーザが接触行為を開始すると略同時に接触音が出力されるため、ユーザの接触行為が短期間であっても、接触行為の終了後に不自然に接触音の出力が開始されることが防止される。また、ユーザの接触行為の終了後に接触音の余韻が残り、接触音が不自然に突然停止することが防止される。

　また、例えば、並進音も接触音と同様に制御するようにしてもよい。例えば、自律移動体１１の並進方向の移動の認識が開始されると略同時に、並進音が急峻に立ち上がり、自律移動体１１の並進方向の移動の認識が終了したとき、並進音が緩やかに停止されるようにしてもよい。

　　　＜並進音出力制御処理の具体例＞
　次に、図１９乃至図２２を参照して、並進音の出力を制御する処理の具体例について説明する。具体的には、オプションパーツの１つである耳型パーツが自律移動体１１に装着されていない場合と装着されている場合の並進音出力制御処理の具体例について説明する。

　　　　＜通常モード時の並進音出力制御処理＞
　まず、図１９のフローチャートを参照して、自律移動体１１に耳型パーツが装着されておらず、動作モードが通常モードに設定されている場合の並進音出力制御処理について説明する。

　ステップＳ１０１において、認識部２５１は、モータの回転数ｒを検出する。具体的には、認識部２５１は、センサ部２０２に含まれる回転センサ４０１から、自律移動体１１のモータ１２５Ｄ又はモータ１２５Ｅの回転数を示すセンサデータを取得する。認識部２５１は、取得したセンサデータに基づいて、モータ１２５Ｄ又はモータ１２５Ｅの回転数ｒを検出する。

　ステップＳ１０２において、認識部２５１は、回転数ｒ＞閾値Ｒｔｈであるか否かを判定する。回転数ｒ≦閾値Ｒｔｈであると判定された場合、並進音は出力されずに、処理はステップＳ１０１に戻る。回転数ｒは、自律移動体１１の並進速度に略比例するため、自律移動体１１の並進速度が所定の閾値以下である場合、並進音は出力されない。

　その後、ステップＳ１０２において、回転数ｒ＞閾値Ｒｔｈであると判定されるまで、ステップＳ１０１及びステップＳ１０２の処理が繰り返し実行される。

　一方、ステップＳ１０２において、回転数ｒ＞閾値Ｒｔｈであると判定された場合、すなわち、自律移動体１１の並進速度が所定の閾値を超えている場合、処理はステップＳ１０３に進む。

　ステップＳ１０３において、認識部２５１は、変数ｖに回転数ｒ－閾値Ｒｔｈを設定する。変数ｖは、回転数ｒに比例し、自律移動体１１の並進速度に略比例する。認識部２５１は、変数ｖを示すデータを音制御部２５４に供給する。

　ステップＳ１０４において、音制御部２５４は、並進音の音量を、ｍｉｎ（Ａ＊ｖ、ＶＯＬｍａｘ）に設定する。ここで、Ａは所定の係数である。また、音量ＶＯＬｍａｘは、並進音の最大音量である。これにより、並進音の音量が、最大音量ＶＯＬｍａｘ以下の範囲内において、自律移動体１１の並進速度に略比例した音量に設定される。

　ステップＳ１０５において、音制御部２５４は、並進音の周波数を、ｍｉｎ（ｆ０＊ｅｘｐ（Ｂ＊ｖ）、ＦＱｍａｘ）に設定する。ここで、Ｂは所定の係数である。また、周波数ＦＱｍａｘは、並進音の最大周波数である。

　人間にとって聞き心地の良い音の周波数は、約２００～２０００Ｈｚの範囲である。また、人間の音の分解能は、周波数が低くなるほど細かくなり、周波数が高くなるほど粗くなる。そこで、並進音の周波数（ピッチ）が、最大周波数ＦＱｍａｘ（例えば、２０００Ｈｚ）以下の範囲内において、自律移動体１１の並進速度に対して指数的に変化するように設定される。

　ステップＳ１０６において、自律移動体１１は、並進音を出力する。具体的には、音制御部２５４は、設定した音量及び周波数の並進音を出力するための出力音データを生成し、音出力部２０５に供給する。音出力部２０５は、取得した出力音データに基づいて、並進音を出力する。

　その後、処理はステップＳ１０１に戻り、ステップＳ１０１以降の処理が実行される。

　これにより、例えば、自律移動体１１の並進速度が所定の閾値以下の場合、図２０のＡに示されるように、並進音は出力されない。一方、自律移動体１１の並進速度が所定の閾値を超えた場合、図２０のＢ及びＣに示されるように、並進速度が速くなるほど、並進音の周波数（ピッチ）が高く、振幅（音量）が大きくなる。

　　　　＜ネコモード時の並進音出力制御処理＞
　次に、図２１のフローチャートを参照して、自律移動体１１に耳型パーツが装着され、動作モードがネコモードに設定されている場合の並進音出力制御処理について説明する。

　ステップＳ１５１において、図１９のステップＳ１０１の処理と同様に、モータの回転数ｒが検出される。

　ステップＳ１５２において、図１９のステップＳ１０２の処理と同様に、回転数ｒ＞閾値Ｒｔｈであるか否かが判定される。回転数ｒ＞閾値Ｒｔｈであると判定された場合、処理はステップＳ１５３に進む。

　ステップＳ１５３において、認識部２５１は、移動量Δｄに回転数ｒを加算する。移動量Δｄは、自律移動体１１が並進方向の移動を開始してからのモータの回転数、又は、前回並進音を出力してからのモータの回転数の積算値を表し、自律移動体１１の並進方向の移動量に略比例する。

　ステップＳ１５４において、認識部２５１は、移動量Δｄ＞閾値Ｄｔｈであるか否かを判定する。移動量Δｄ≦閾値Ｄｔｈであると判定された場合、並進音は出力されずに、処理はステップＳ１５１に戻る。すなわち、自律移動体１１が並進方向の移動を開始してからの並進方向の移動量、又は、前回並進音を出力してからの並進方向の移動量が所定の閾値以下である場合、並進音は出力されない。

　その後、ステップＳ１５２において、回転数ｒ≦閾値Ｒｔｈであると判定されるか、ステップＳ１５４において、移動量Δｄ＞閾値Ｄｔｈであると判定されるまで、ステップＳ１５１乃至ステップＳ１５４の処理が繰り返し実行される。

　一方、ステップＳ１５４において、移動量Δｄ＞閾値Ｄｔｈであると判定された場合、すなわち、自律移動体１１が並進方向の移動を開始してからの並進方向の移動量、又は、前回並進音を出力してからの並進方向の移動量が所定の閾値を超えた場合、処理はステップＳ１５５に進む。

　ステップＳ１５５において、図１９のステップＳ１０３の処理と同様に、変数ｖに回転数ｒ－閾値Ｒｔｈが設定される。

　ステップＳ１５６において、音制御部２５４は、並進音の音量を、ｍｉｎ（Ｃ＊ｖ、ＶＯＬｍａｘ）に設定する。ここで、Ｃは所定の係数である。これにより、並進音の音量が、最大音量ＶＯＬｍａｘ以下の範囲内において、自律移動体１１の並進速度に略比例した音量に設定される。

　なお、係数Ｃは、例えば、図１９のステップＳ１０４の処理で用いられた係数Ａより小さい値に設定される。従って、ネコモードの場合、通常モードの場合と比較して、自律移動体１１の並進速度に対する並進音の音量の変化量が小さくなる。

　ステップＳ１５７において、音制御部２５４は、変数ｖに応じて倍音成分を設定する。具体的には、音制御部２５４は、変数ｖが大きくなるほど、すなわち、自律移動体１１の並進速度が速くなるほど、倍音成分が増えるように、並進音の倍音成分を設定する。

　ステップＳ１５８において、自律移動体１１は、並進音を出力する。具体的には、音制御部２５４は、設定した倍音成分を含む並進音を、設定した音量で出力するための出力音データを生成し、音出力部２０５に供給する。音出力部２０５は、取得した出力音データに基づいて、並進音を出力する。

　その後、処理はステップＳ１５９に進む。

　一方、ステップＳ１５２において、回転数ｒ≦閾値Ｒｔｈであると判定された場合、すなわち、自律移動体１１の並進速度が所定の閾値以下である場合、ステップＳ１５３乃至ステップＳ１５８の処理はスキップされ、処理はステップＳ１５９に進む。

　ステップＳ１５９において、認識部２５１は、移動量Δｄを０に設定する。すなわち、並進音の出力後、又は、自律移動体１１の並進速度が所定の閾値以下になった場合、移動量Δｄが０にリセットされる。

　その後、処理はステップＳ１５１に戻り、ステップＳ１５１以降の処理が実行される。

　これにより、例えば、自律移動体１１の並進速度が所定の閾値以下の場合、図２２のＡに示されるように、並進音は出力されない。一方、自律移動体１１の並進速度が所定の閾値を超えた場合、図２２のＢ及びＣに示されるように、並進音が、無音の期間を挟みながら断続的に出力される。また、速度が大きくなるほど、並進音の倍音成分が増加し、並進音の出力タイミングが密になる。

　このように、自律移動体１１に耳型パーツの装着の有無により、並進音の制御方法が変更される。

　例えば、自律移動体１１に耳型パーツを装着した場合、ネコの動作音を模した音に動作音の内容が変更される。例えば、自律移動体１１が並進方向に移動した場合、並進音が連続的に出力されずに、ネコの足音のように断続的に出力される。また、実際のネコは、移動速度が速くなるほど地面を強く蹴るようになり、足音が硬い音になると想定される。従って、自律移動体１１の並進速度が速くなるほど、より硬い音になるように、並進音の倍音成分が増加する。

　以上により、ユーザは、自律移動体１１への耳型パーツの装着の有無により、自律移動体１１のキャラクタが変化することを強く実感することができ、ユーザの満足度が向上する。

　なお、並進音の音色を、例えば、変数ｖ、変数ｖの整数倍、又は、変数ｖに指数関数を適用した値を所定のフィルタに適用した音色に設定するようにしてもよい。

　また、例えば、所定の波形の音を作成又は録音しておき、変数ｖに基づいて、ピッチや音量を動的に変化させて並進音を生成するようにしてもよい。また、例えば、複数の波形の並進音を作成又は録音しておき、変数ｖに基づいて、使用する音を切り替えるようにしてもよい。例えば、予め柔らかく地面を蹴る音と、強く地面を蹴る音の二種類を作成しておき、変数ｖに基づいて、それらの音を合成する比率を変えることにより、並進音を生成するようにしてもよい。

　さらに、回転音も並進音と同様に制御するようにしてもよい。例えば、角速度センサ１２１Ｂにより検出された角速度の絶対値ａが、所定の閾値Ａｔｈを超えた場合に、回転音を出力するようにするとともに、変数ｖを角速度の絶対値ａ－閾値Ａｔｈに設定し、回転音の制御に用いるようにしてもよい。

　また、持ち上げ音も並進音及び回転音と同様に制御するようにしてもよい。この場合、例えば、加速度センサ１２１Ａにより検出される加速度のフレーム間の差分に基づいて、自律移動体１１の持ち上げの激しさを表すように持ち上げ音が変調される。

　　　＜持ち上げ音出力制御処理の具体例＞
　自律移動体１１の状況が、複数の種類のセンサを用いてそれぞれ認識される場合、各センサの特性により、認識速度や認識精度等の認識特性が異なるときがある。

　例えば、図１７を参照して上述したように、自律移動体１１の持ち上げは、ＩＲセンサ４０２及び加速度センサ１２１Ａを用いて認識される。そして、後述するように、ＩＲセンサ４０２を用いた場合と加速度センサ１２１Ａを用いた場合とで、自律移動体１１の持ち上げの認識特性に差が生じる。

　これに対して、各センサの特性に応じた制御方法により、出力音の制御を行うことにより、出力音の応答性能や表現の幅を向上させることが可能である。

　ここで、図２３を参照して、持ち上げ音の出力を制御する処理の具体例について説明する。

　ステップＳ２０１において、認識部２５１は、加速度センサ１２１Ａにより持ち上げを認識したか否かを判定する。認識部２５１は、加速度センサ１２１Ａからのセンサデータに基づいて、自律移動体１１の持ち上げを認識しなかった場合、加速度センサ１２１Ａにより持ち上げを認識していないと判定し、処理はステップＳ２０２に進む。

　ステップＳ２０２において、認識部２５１は、ＩＲセンサ４０２により持ち上げを認識したか否かを判定する。認識部２５１は、ＩＲセンサ４０２からのセンサデータに基づいて、自律移動体１１の持ち上げを認識しなかった場合、ＩＲセンサ４０２により持ち上げを認識していないと判定し、処理はステップＳ２０１に戻る。

　その後、ステップＳ２０１において、加速度センサ１２１Ａにより持ち上げを認識したと判定されるか、ステップＳ２０２において、ＩＲセンサ４０２により持ち上げを認識したと判定されるまで、ステップＳ２０１及びステップＳ２０２の処理が繰り返し実行される。

　一方、ステップＳ２０２において、認識部２５１は、ＩＲセンサ４０２からのセンサデータに基づいて、自律移動体１１の持ち上げを認識した場合、ＩＲセンサ４０２により持ち上げを認識したと判定し、処理はステップＳ２０３に進む。

　例えば、ＩＲセンサ４０２を用いた場合、自律移動体１１の持ち上げ方に関わらず、認識精度が高くなる。一方、加速度センサ１２１Ａを用いた場合、自律移動体１１が素早く持ち上げられたときの認識精度は高くなるが、自律移動体１１がゆっくり持ち上げられたときの認識精度は低くなる。また、加速度センサ１２１Ａを用いた場合、自律移動体１１の持ち上げと他の動きとの区別が困難である。

　さらに、ＩＲセンサ４０２は、一般的に加速度センサ１２１Ａよりサンプリングレートが低い。従って、ＩＲセンサ４０２を用いた場合、加速度センサ１２１Ａを用いた場合と比較して、自律移動体１１の持ち上げの認識速度（反応速度）が遅くなる可能性がある。

　従って、処理がステップＳ２０３に進むのは、加速度センサ１２１Ａより先にＩＲセンサ４０２により自律移動体１１の持ち上げが認識された場合であり、例えば、自律移動体１１がゆっくり持ち上げられた場合が想定される。

　ステップＳ２０３において、自律移動体１１は、所定の持ち上げ音を出力する。具体的には、認識部２５１は、自律移動体１１が持ち上げられたことを音制御部２５４に通知する。音制御部２５４は、所定のピッチ、音量、音色、及び、スピードの持ち上げ音を出力するための出力音データを生成し、音出力部２０５に供給する。音出力部２０５は、取得した出力音データに基づいて、持ち上げ音を出力する。

　ここで、図１７を参照して上述したように、自律移動体１１が持ち上げられた後の動き量は、加速度センサ１２１Ａ及び角速度センサ１２１Ｂを用いて検出される。一方、ＩＲセンサ４０２では、自律移動体１１が持ち上げられた後の動き量を検出することはできない。従って、加速度センサ１２１Ａより先にＩＲセンサ４０２により自律移動体１１の持ち上げが認識された場合、自律移動体１１が持ち上げられた後の動き量を検出することが困難である。

　そこで、加速度センサ１２１Ａより先にＩＲセンサ４０２により自律移動体１１の持ち上げが認識された場合、自律移動体１１の持ち上げ方に関わらず、とりあえず固定の持ち上げ音が出力される。

　その後、処理はステップＳ２０４に進む。

　一方、ステップＳ２０１において、認識部２５１は、加速度センサ１２１Ａからのセンサデータに基づいて、自律移動体１１の持ち上げを認識した場合、加速度センサ１２１Ａにより持ち上げを認識したと判定し、ステップＳ２０２及びステップＳ２０３の処理はスキップされ、処理はステップＳ２０４に進む。

　これは、ＩＲセンサ４０２より先又は略同時に、加速度センサ１２１Ａにより自律移動体１１の持ち上げが認識された場合であり、例えば、自律移動体１１が素早く持ち上げられた場合が想定される。

　ステップＳ２０４において、自律移動体１１は、持ち上げ方に応じた持ち上げ音を出力する。

　具体的には、認識部２５１は、加速度センサ１２１Ａ及び角速度センサ１２１Ｂからのセンサデータに基づいて、自律移動体１１が持ち上げられた後の動き量を検出する。認識部２５１は、検出した動き量を示すデータを音制御部２５４に供給する。

　音制御部２５４は、持ち上げ音を生成する。このとき、音制御部２５４は、例えば、自律移動体１１が持ち上げられた後の動き量の変化、及び、動作モード等に基づいて、持ち上げ音のピッチ、音量、音色、スピード等のパラメータのうちのいくつかを変化させる。

　なお、ステップＳ２０３の処理により、先に固定の持ち上げ音が出力されている場合、固定の持ち上げ音とのつながりが自然になるように、持ち上げ音のパラメータが設定される。

　音制御部２５４は、生成した持ち上げ音を出力するための出力音データを生成し、音出力部２０５に供給する。

　音出力部２０５は、取得した出力音データに基づいて、持ち上げ音を出力する。

　その後、処理はステップＳ２０１に戻り、ステップＳ２０１以降の処理が実行される。

　このように、自律移動体１１の持ち上げ方に関わらず、迅速に持ち上げ音が出力される。また、自律移動体１１の持ち上げ方に応じた持ち上げ音が出力される。

　以上のように、自律移動体１１の状況に応じて、特に、組合せ機器との組み合わせに応じて、適切な内容の動作音が適切なタイミングで出力される。また、自律移動体１１の動作音の応答性や表現の幅が広がる。その結果、自律移動体１１の動作音によるユーザ体験が向上する。

　＜＜２．変形例＞＞
　以下、上述した本技術の実施の形態の変形例について説明する。

　上述した動作音の種類、組合せ機器の種類、動作音の制御方法は、その一例であり、任意に変更することが可能である。例えば、自律移動体１１が、ロボット型掃除機の上に乗った場合、掃除をしているような動作音を出力するようにしてもよい。

　以上の説明では、組合せ機器との組み合わせに基づいて、出力音のうち動作音を制御する例を示したが、発話音も同様に制御するようにしてもよい。

　例えば、自律移動体１１が各組合せ機器と組み合わされた場合の出力音の制御方法をユーザが設定できるようにしてもよい。

　例えば、自律移動体１１が組合せ機器と他の条件とに基づいて、出力音の制御方法を設定するようにしてもよい。例えば、自律移動体１１が、組合せ機器と組み合わされた場合、さらに時間（例えば、時間帯、季節等）、場所等の条件により、出力音の制御方法を設定するようにしてもよい。

　自律移動体１１が他の組合せ機器と組み合わされることにより別の自律移動体（例えば、ロボット等）が構成される場合、例えば、自律移動体１１単独ではなく、新たに構成された自律移動体全体で、出力音の制御を行うようにしてもよい。

　例えば、自律移動体１１と組合せ機器が接触した場合だけでなく、非接触の状態でも、両者が組み合わされたと認識し、出力音の制御方法を変更するようにしてもよい。例えば、自律移動体１１とロボット等の他の組合せ機器とが接近した場合に、自律移動体１１と当該組合せ機器とが組み合わされたと認識し、出力音の制御方法を変更するようにしてもよい。

　この場合、例えば、カメラ１０２Ｌ及びカメラ１０２Ｒにより撮像された画像に基づいて、他の組合せ機器の接近が認識される。ただし、画像を用いた場合、組合せ機器が自律移動体１１の死角に存在するとき、自律移動体１１が、組合せ機器の接近を認識することができない。これに対して、上述したように、さらに近距離無線通信を用いて、組合せ機器の接近を認識するようにしてもよい。

　例えば、ユーザが組合せ機器を装着し、自律移動体１１と組合せ機器を装着したユーザとが接近した場合に、出力音の制御方法を変更するようにしてもよい。これにより、例えば、ユーザが帰宅した場合に、自律移動体１１がユーザを出迎え、喜ぶような出力音を出力することが可能になる。

　例えば、自律移動体１１が、カメラ１０２Ｌ及びカメラ１０２Ｒにより撮像された画像や人感センサ等を用いて、組合せ機器の有無に関わらず、ユーザ自身を認識し、ユーザとの組み合わせに基づいて、出力音の制御方法を設定するようにしてもよい。

　例えば、自律移動体１１の形状の変化に伴い、出力音の制御方法を変更するようにしてもよい。例えば、自律移動体１１の変形後の形状に近い生物やキャラクタに対応した出力音を出力するように出力音の制御方法を変更するようにしてもよい。

　例えば、自律移動体とは異なるスマートフォン等の電子機器が組合せ機器と組み合わされた場合に、電子機器の出力音の制御方法を変更するようにしてもよい。例えば、スマートフォンが回し車に装着され、回し車により移動する場合、スマートフォンが、回し車の車輪の回転に対応した動作音を出力するようにしてもよい。

　例えば、自律移動体１１が組合せ機器と組み合わされた場合、自律移動体１１の状況の認識に、組合せ機器のセンサを用いるようにしてもよい。

　例えば、上述したように、情報処理サーバ１２が、自律移動体１１からセンサデータを受信し、受信したセンサデータに基づいて、自律移動体１１の出力音を制御することが可能である。また、情報処理サーバ１２が自律移動体１１の出力音の制御を行う場合、情報処理サーバ１２が出力音を生成するようにしてもよいし、自律移動体１１が、情報処理サーバ１２の制御の下に、出力音を生成するようにしてもよい。

　＜＜３．その他＞＞
　　＜コンピュータの構成例＞
　上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。

　図２４は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

　コンピュータ１０００において、CPU（Central Processing Unit）１００１，ROM（Read Only Memory）１００２，RAM（Random Access Memory）１００３は、バス１００４により相互に接続されている。

　バス１００４には、さらに、入出力インタフェース１００５が接続されている。入出力インタフェース１００５には、入力部１００６、出力部１００７、記録部１００８、通信部１００９、及びドライブ１０１０が接続されている。

　入力部１００６は、入力スイッチ、ボタン、マイクロフォン、撮像素子などよりなる。出力部１００７は、ディスプレイ、スピーカなどよりなる。記録部１００８は、ハードディスクや不揮発性のメモリなどよりなる。通信部１００９は、ネットワークインタフェースなどよりなる。ドライブ１０１０は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア１０１１を駆動する。

　以上のように構成されるコンピュータ１０００では、CPU１００１が、例えば、記録部１００８に記録されているプログラムを、入出力インタフェース１００５及びバス１００４を介して、RAM１００３にロードして実行することにより、上述した一連の処理が行われる。

　コンピュータ１０００（CPU１００１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア１０１１に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。

　コンピュータ１０００では、プログラムは、リムーバブルメディア１０１１をドライブ１０１０に装着することにより、入出力インタフェース１００５を介して、記録部１００８にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部１００９で受信し、記録部１００８にインストールすることができる。その他、プログラムは、ROM１００２や記録部１００８に、あらかじめインストールしておくことができる。

　なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

　また、本明細書において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

　さらに、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

　例えば、本技術は、１つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

　また、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。

　さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

　　＜構成の組み合わせ例＞
　本技術は、以下のような構成をとることもできる。

（１）
　自装置と組み合わされている機器である組合せ機器の認識を行う認識部と、
　前記組合せ機器の認識結果に基づいて、前記自装置から出力する出力音の制御方法を変更し、変更した前記制御方法に基づいて、前記出力音の制御を行う音制御部と
　を備える自律移動体。
（２）
　前記認識部は、前記自装置の状況をさらに認識し、
　前記音制御部は、前記自装置の状況に基づいて、前記出力音の制御を行う
　前記（１）に記載の自律移動体。
（３）
　前記音制御部は、所定の状況の認識が開始されたときの前記出力音の反応速度を、前記所定の状況の認識が終了したときの前記出力音の反応速度より速くする
　前記（２）に記載の自律移動体。
（４）
　前記音制御部は、前記所定の状況の認識が開始されたとき前記出力音を迅速に立ち上げ、前記所定の状況の認識が終了したとき前記出力音を緩やかに停止させる
　前記（３）に記載の自律移動体。
（５）
　前記所定の状況は、前記自装置の動き又は前記自装置への刺激である
　前記（３）又は（４）に記載の自律移動体。
（６）
　前記認識部は、複数の種類のセンサをそれぞれ用いて前記自装置の状況を認識し、
　前記音制御部は、前記自装置の状況の認識に用いられた前記センサの種類に基づいて、前記出力音の制御方法を変更する
　前記（２）乃至（５）のいずれかに記載の自律移動体。
（７）
　前記音制御部は、前記自装置の状況の認識に用いられた前記センサの特性に応じた制御方法により、前記出力音の制御を行う
　前記（６）に記載の自律移動体。
（８）
　前記音制御部は、前記組合せ機器の認識結果に基づいて、生成する前記出力音の内容、及び、前記出力音の出力タイミングのうち少なくとも１つを変更する
　前記（１）乃至（７）のいずれかに記載の自律移動体。
（９）
　前記音制御部は、前記自装置に組み合わされている前記組合せ機器の種類に対応する内容に前記出力音の内容を変更する
　前記（８）に記載の自律移動体。
（１０）
　前記音制御部は、前記出力音のピッチ、音量、音色、及び、スピードのうち少なくとも１つを変更する
　前記（８）又は（９）に記載の自律移動体。
（１１）
　前記音制御部は、認識された前記組合せ機器の種類に基づいて、前記出力音の制御方法を変更する
　前記（１）乃至（１０）のいずれかに記載の自律移動体。
（１２）
　前記出力音は、前記自装置の動きに対応して出力される音、又は、前記自装置への刺激に対応して出力される音を含む
　前記（１）乃至（１１）のいずれかに記載の自律移動体。
（１３）
　前記認識部は、１種類以上のセンサからのセンサデータに基づいて、前記組合せ機器の認識を行う
　前記（１）乃至（１２）のいずれかに記載の自律移動体。
（１４）
　前記認識部は、前記センサデータに基づいて認識される前記自装置の動きの変化に基づいて、前記組合せ機器の認識を行う
　前記（１３）に記載の自律移動体。
（１５）
　前記組合せ機器は、前記自装置に着脱可能なパーツ、前記自装置を着脱可能な機器、及び、前記自装置が乗ることが可能な移動体のうち少なくとも１つを含む
　前記（１）乃至（１４）のいずれかに記載の自律移動体。
（１６）
　自律移動体と組み合わされている機器である組合せ機器の認識を行い、
　前記組合せ機器の認識結果に基づいて、前記自律移動体から出力する出力音の制御方法を変更し、
　変更した前記制御方法に基づいて、前記出力音の制御を行う
　情報処理方法。
（１７）
　自律移動体と組み合わされている機器である組合せ機器の認識を行い、
　前記組合せ機器の認識結果に基づいて、前記自律移動体から出力する出力音の制御方法を変更し、
　変更した前記制御方法に基づいて、前記出力音の制御を行う
　処理をコンピュータに実行させるためのプログラム。
（１８）
　自律移動体と組み合わされている機器である組合せ機器の認識を行う認識部と、
　前記組合せ機器の認識結果に基づいて、前記自律移動体から出力する出力音の制御方法を変更し、変更した前記制御方法に基づいて、前記出力音の制御を行う音制御部と
　を備える情報処理装置。

　なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。

　１　情報処理システム，　１１　自律移動体，　１２　情報処理サーバ，　２０１　制御部，　２０２　センサ部，　２０５　音出力部，　２４１　情報処理部，　２５１　認識部，　２５２　行動計画部，　２５３　動作制御部，　２５４　音制御部，　３０２　認識部，　３０３　行動計画部，　３０４　動作制御部，　３０５　音制御部

Claims

　自装置と組み合わされている機器である組合せ機器の認識を行う認識部と、
　前記組合せ機器の認識結果に基づいて、前記自装置から出力する出力音の制御方法を変更し、変更した前記制御方法に基づいて、前記出力音の制御を行う音制御部と
　を備える自律移動体。
　前記認識部は、前記自装置の状況をさらに認識し、
　前記音制御部は、前記自装置の状況に基づいて、前記出力音の制御を行う
　請求項１に記載の自律移動体。
　前記音制御部は、所定の状況の認識が開始されたときの前記出力音の反応速度を、前記所定の状況の認識が終了したときの前記出力音の反応速度より速くする
　請求項２に記載の自律移動体。
　前記音制御部は、前記所定の状況の認識が開始されたとき前記出力音を迅速に立ち上げ、前記所定の状況の認識が終了したとき前記出力音を緩やかに停止させる
　請求項３に記載の自律移動体。
　前記所定の状況は、前記自装置の動き又は前記自装置への刺激である
　請求項３に記載の自律移動体。
　前記認識部は、複数の種類のセンサをそれぞれ用いて前記自装置の状況を認識し、
　前記音制御部は、前記自装置の状況の認識に用いられた前記センサの種類に基づいて、前記出力音の制御方法を変更する
　請求項２に記載の自律移動体。
　前記音制御部は、前記自装置の状況の認識に用いられた前記センサの特性に応じた制御方法により、前記出力音の制御を行う
　請求項６に記載の自律移動体。
　前記音制御部は、前記組合せ機器の認識結果に基づいて、生成する前記出力音の内容、及び、前記出力音の出力タイミングのうち少なくとも１つを変更する
　請求項１に記載の自律移動体。
　前記音制御部は、前記自装置に組み合わされている前記組合せ機器の種類に対応する内容に前記出力音の内容を変更する
　請求項８に記載の自律移動体。
　前記音制御部は、前記出力音のピッチ、音量、音色、及び、スピードのうち少なくとも１つを変更する
　請求項８に記載の自律移動体。
　前記音制御部は、認識された前記組合せ機器の種類に基づいて、前記出力音の制御方法を変更する
　請求項１に記載の自律移動体。
　前記出力音は、前記自装置の動きに対応して出力される音、又は、前記自装置への刺激に対応して出力される音を含む
　請求項１に記載の自律移動体。
　前記認識部は、１種類以上のセンサからのセンサデータに基づいて、前記組合せ機器の認識を行う
　請求項１に記載の自律移動体。
　前記認識部は、前記センサデータに基づいて認識される前記自装置の動きの変化に基づいて、前記組合せ機器の認識を行う
　請求項１３に記載の自律移動体。
　前記組合せ機器は、前記自装置に着脱可能なパーツ、前記自装置を着脱可能な機器、及び、前記自装置が乗ることが可能な移動体のうち少なくとも１つを含む
　請求項１に記載の自律移動体。
　自律移動体と組み合わされている機器である組合せ機器の認識を行い、
　前記組合せ機器の認識結果に基づいて、前記自律移動体から出力する出力音の制御方法を変更し、
　変更した前記制御方法に基づいて、前記出力音の制御を行う
　情報処理方法。
　自律移動体と組み合わされている機器である組合せ機器の認識を行い、
　前記組合せ機器の認識結果に基づいて、前記自律移動体から出力する出力音の制御方法を変更し、
　変更した前記制御方法に基づいて、前記出力音の制御を行う
　処理をコンピュータに実行させるためのプログラム。
　自律移動体と組み合わされている機器である組合せ機器の認識を行う認識部と、
　前記組合せ機器の認識結果に基づいて、前記自律移動体から出力する出力音の制御方法を変更し、変更した前記制御方法に基づいて、前記出力音の制御を行う音制御部と
　を備える情報処理装置。