JP6544693B2

JP6544693B2 - ロボット

Info

Publication number: JP6544693B2
Application number: JP2016565988A
Authority: JP
Inventors: 辰美黒田; 博司前川; 勉足立; 寛隆福田; 健司水野; 健純近藤; 林　茂; 茂林; 丈誠横井; 謙史竹中
Original assignee: ADC Technology Inc
Current assignee: ADC Technology Inc
Priority date: 2014-12-25
Filing date: 2015-10-21
Publication date: 2019-07-17
Anticipated expiration: 2035-10-21
Also published as: JP7251833B2; WO2016103881A1; JP7122038B2; JP2021185410A; JPWO2016103881A1; JP6994781B2; JP6744529B2; JP2022043116A; JP2020173453A; JP2023065621A; JP2023072025A; JP2019095795A

Description

関連出願の参照

本国際出願は、２０１４年１２月２５日に日本国特許庁に出願された日本国特許出願第２０１４−２６２９０７号に基づく優先権を主張するものであり、日本国特許出願第２０１４−２６２９０７号の全内容を本国際出願に参照により援用する。

本開示はロボットに関する。

近年、人と会話できるロボットが注目されている。このロボットは、人が発音する音声をマイクで取得し、音声認識により音声の意味内容を推定する。そして、推定した意味内容に対し、予め関連付けられた回答を行う（特許文献１参照）。

特許第４０１５４２４号公報

ロボットの会話能力を、人工知能等を用いた学習により高めることが考えられる。しかしながら、ある特定のロボットの会話能力を学習により高めたとしても、例えば、異なる場所にある別のロボットを使用する場合、初歩から学習を行わなければならない。本開示は、ロボットの学習に関するユーザの負担を軽減できるロボットを提供することを一側面とする。

本開示のロボットは、音声認識を行う音声認識ユニットと、前記音声認識ユニットの認識結果について学習する学習ユニットと、前記音声認識ユニットの認識結果に対し、前記学習ユニットの学習結果を用いて、対応する処理を行う処理ユニットと、を備える。
本開示のロボットは、例えば、前記学習結果を外部の記憶装置に記憶する記憶ユニットと、前記学習結果を前記記憶装置から取得する学習結果取得ユニットと、を備える。

本開示のロボットは、音声認識ユニットの認識結果について学習することができる。また、本開示のロボットは、例えば、学習結果を外部の記憶装置に記憶するとともに、その記憶装置から、学習結果を取得することができる。

そのため、ユーザは、例えば、第１のロボットの使用により生じた学習結果を外部の記憶装置に記憶しておき、第２のロボットを使用するとき、記憶しておいた学習結果を第２のロボットに導入することができる。その結果、ユーザは、第１のロボットにおける学習結果を利用することができ、第２のロボットを必ずしも初歩から学習させなくてもよい。

一実施形態のロボットの電気的構成を表すブロック図である。ロボットの構成を表す正面図である。ロボットが実行するプログラム設定処理を表すフローチャートである。ロボットが実行する会話処理を表すフローチャートである。ロボットが実行する学習停止判断処理を表すフローチャートである。図６Ａは学習停止を指示する動作の一例を表す説明図であり、図６Ｂは、学習再開を指示する動作の一例を表す説明図である。コンピュータの電気的構成を表すブロック図である。コンピュータの外観を表す斜視図である。車載機の電気的構成を表すブロック図である。車載機が実行する車両制御処理を表すフローチャートである。別の実施形態のロボットの電気的構成を表すブロック図である。ロボットが実行するプログラムインストール処理を表すフローチャートである。ロボットが実行する会話処理を表すフローチャートである。ロボットが実行する第２の人工知能ユニット学習停止判断処理を表すフローチャートである。ロボットが実行するプログラムアップロード処理を表すフローチャートである。更に他の実施形態のロボットの電気的構成を表すブロック図である。ロボットが実行する会話処理を表すフローチャートである。通話処理を実行するための構成を表す説明図である。ホストコンピュータが実行する通話ペア設定処理を表すフローチャートである。アイコンを表示しているディスプレイを表す説明図である。

１、３０１…ロボット、３…制御ユニット、５…マイク、７…カメラ、９…タッチパネル、１１…センサ群、１３…ＧＰＳ、１５…スピーカ、１７…モータ群、１９…ディスプレイ、２１…入力ユニット、２３…標準プログラム記憶ユニット、２５…人工知能ユニット、２６…通信ユニット、２７…演算ユニット、２９…出力ユニット、３１…クラウドネットワーク、３３…端末、３５…頭部、３７…胴部、３９…右腕部、４１…左腕部、４３…右脚部、４５…左脚部、４７、４９…車輪、５１…移動用モータ、５３…首関節、５５…肩関節、５７…肘関節、５９…手首関節、６１…関節用モータ、６３…キーボード、６５…マウス、６７…筐体、６９…端子、７１…車両制御部、１０１…コンピュータ、２０１…車載機

本開示の実施形態を図面に基づき説明する。
＜第１の実施形態＞
１．ロボット１の構成
ロボット１の構成を図１、図２に基づき説明する。ロボット１は、図１に示すように、制御ユニット３、マイク５、カメラ７、タッチパネル９、センサ群１１、ＧＰＳ１３、スピーカ１５、モータ群１７、及びディスプレイ１９を備える。

制御ユニット３はマイクロコンピュータを備える。制御ユニットは、具体的には、入力ユニット２１、標準プログラム記憶ユニット２３、人工知能ユニット２５、通信ユニット２６、演算ユニット２７、及び出力ユニット２９を備える。

入力ユニット２１は、マイク５、カメラ７、タッチパネル９、センサ群１１、及びＧＰＳ１３から情報を取得し、その情報を演算ユニット２７及び人工知能ユニット２５に出力する。

標準プログラム記憶ユニット２３は、ロボット１の各種動作を実行するための標準プログラムを常時記憶している。標準プログラムは、後述するＡＩ用プログラムとは異なり、内容が変化しないプログラムである。

人工知能ユニット２５は、ロボット１の各種動作を実行するためのＡＩ（人工知能）用プログラムを記憶可能である。人工知能ユニット２５は、ＡＩ用プログラムを記憶しているとき、それを学習により変化、発展させる。また、人工知能ユニット２５は、ＡＩ用プログラムを新規にインストールすること、及びＡＩ用プログラムを消去することが可能である。

通信ユニット２６は、外部のクラウドネットワーク３１、端末３３等と通信を行う。通信は無線通信であってもよいし、有線通信であってもよい。
演算ユニット２７は、標準プログラム又はＡＩ用プログラムを用いて、ロボット１の各種動作を実現するたに必要な演算を実行する。

出力ユニット２９は演算ユニット２７の演算結果をスピーカ１５、モータ群１７、及びディスプレイ１９に出力する。なお、制御ユニット３に属する各ユニットの詳しい機能は後述する。

図２に示すように、ロボット１は、人型の外形を有しており、頭部３５、胴部３７、右腕部３９、左腕部４１、右脚部４３、及び左脚部４５を備える。
マイク５、カメラ７、及びスピーカ１５は頭部３５に設けられている。また、ディスプレイ１９、及びタッチパネル９は胴部３７の正面側に設けられている。

右脚部４３、及び左脚部４５は、それぞれ、移動用の車輪４７、４９を備えている。車輪４７、４９は、それぞれ、前後方向に２つ設けられている。よって、ロボット１は、合計４つの車輪により地面に接する。車輪４７、４９は、モータ群１７に属する移動用モータ５１により駆動される。移動用モータ５１の駆動力によって車輪４７、４９を回転させることにより、ロボット１は前後に移動することができる。また、車輪４７の回転数と、車輪４９の回転数とを異ならせることにより、ロボット１は右旋回又は左旋回をすることができる。

ロボット１は、首関節５３、肩関節５５、肘関節５７、及び手首関節５９を備える。各関節の自由度は、１〜３の中から適宜設定できる。各関節は、モータ群１７に属する関節用モータ６１の駆動力により、動作する。上記の関節のうち、適宜選択したものを関節用モータ６１で動かすことにより、ロボット１は所定の動作を行い、また、所定の姿勢を表現する。

センサ群１１に属する複数のセンサは、ロボット１における各部の位置、速度、加速度、傾き、関節の角度等を検出する。その検出結果は、入力ユニット２１を介して演算ユニット２７にフィードバックされ、ロボット１の動作制御に用いられる。

なお、標準プログラム記憶ユニット２３、人工知能ユニット２５、及び演算ユニット２７は、音声認識ユニット、処理ユニット、及び学習停止ユニットの一例である。人工知能ユニット２５は、学習ユニットの一例である。通信ユニット２６は、記憶ユニット及び学習結果取得ユニットの一例である。入力ユニット２１及び通信ユニット２６は識別情報取得ユニットの一例である。クラウドネットワーク３１は外部の記憶装置の一例である。

２．ロボット１が実行する処理
（２−１）プログラム設定処理
制御ユニット３は、標準プログラムと、ＡＩ用プログラムとのうち、使用するプログラムを決めるために、図３に示すプログラム設定処理を実行する。このプログラム設定処理は、ロボット１の電源がオンであるとき、所定時間ごとに繰り返し実行される。

ステップ１では、その時点でＡＩ用プログラムを使用しているか否かを判断する。ＡＩ用プログラムを使用していない場合（すなわち、標準プログラムを使用している場合）はステップ２に進み、ＡＩ用プログラムを使用している場合はステップ５に進む。

ステップ２では、ユーザの識別情報が入力されたか否かを判断する。識別情報は、例えば、以下の方法で入力することができる。
・端末３３から通信ユニット２６に識別情報を送信する。

・識別情報を表す電磁波（例えば、電波、赤外線等）を通信ユニット２６に送信する。識別情報を表す電磁波は、端末３３から送信してもよいし、固定式の装置（例えば、ビーコン、無線ＬＡＮのアクセスポイント等）から送信してもよい。識別情報を表す電磁波は、定期的に送信してもよいし、ユーザの指示に応じて送信してもよいし、端末３３や固定式の装置等がロボット１を検出することをきっかけとして送信してもよい。

・ユーザが識別情報の内容を声に出して言う。マイク５がその音声を取得し、音声認識により、識別情報を特定する。
・識別情報を表す一次元バーコードや二次元バーコードをカメラ７で撮影する。

・タッチパネル９を用いて識別情報を入力する。
識別情報は、数字や文字で構成されるものであってもよいし、１次元又は２次元の画像（例えば一次元バーコードや二次元バーコード）であってもよいし、ユーザの生体情報（例えば、指紋、身体のいずれかの部位における静脈のパターン、虹彩、顔等）であってもよいし、音声で構成されるものであってもよい。

識別情報が入力された場合はステップ３に進み、識別情報が入力されなかった場合は本処理を終了する。
ステップ３では、前記ステップ２で入力されたと判断された識別情報に対応するＡＩ用プログラム及びデータセットを、クラウドネットワーク３１からインストールする。インストールしたＡＩ用プログラム及びデータセットは、人工知能ユニット２５に記憶する。

なお、クラウドネットワーク３１には、識別情報と、ＡＩ用プログラム及びデータセットとが、対応付けられて記憶されている。データセットは、ＡＩ用プログラムの使用、学習等において用いるデータセットであり、音声認識及び音声合成において用いる辞書データを含む。

ステップ４では、ロボット１が使用するプログラムを、標準プログラムから、前記ステップ３でインストールしたＡＩ用プログラムに変更する。この時点以降、ロボット１はＡＩ用プログラムを使用する。

一方、前記ステップ１で肯定判断された場合はステップ５において、ロボット１の使用終了条件が充足されたか否かを判断する。使用終了条件は、例えば、以下のものとすることができる。

・所定時間以上、ユーザがロボット１を操作しないこと。
・カメラ７の画像やマイク５で取得した音声においてユーザを認識できない状態が所定時間以上続くこと。

・ユーザがロボット１に対し、使用終了に該当する入力を行うこと（例えば、ユーザが「使用終了」と声に出して言う、または、タッチパネル９に使用終了に該当する内容の入力を行う等）。

・ロボット１の電源がオフになる。
・予め設定された時刻になる。
使用終了条件が充足された場合はステップ６に進み、使用終了条件が充足されない場合は本処理を終了する。

ステップ６では、ＡＩ用プログラム及びデータセットを、クラウドネットワーク３１にアップロードする。このとき、ユーザの識別情報と対応付けてアップロードする。なお、後述する学習が行われた場合、アップロードするＡＩ用プログラム及びデータセットは、学習後のものである。

ステップ７では、人工知能ユニット２５からＡＩ用プログラム及びデータセットを消去する。
ステップ８では、使用するプログラムを、ＡＩ用プログラムから標準プログラムに変更する。この時点以降、ロボット１は標準プログラムを使用する。

（２−２）会話処理
制御ユニット３は、図４に示す会話処理を実行する。この処理は、マイク５が所定の閾値以上の音量を検出したときに実行される。

ステップ１１では、マイク５を用いて音声を取得する。
ステップ１２では、周知の音声認識技術により、前記ステップ１１で取得した音声の内容を認識する。このとき、標準プログラムを使用している場合は、ロボット１が予め備えている標準辞書データを用いて音声の内容を認識する。また、ＡＩ用プログラムを使用している場合は、ＡＩ用プログラムとともにクラウドネットワーク３１からインストールされ、過去の学習によって強化された辞書データを用いて音声の内容を認識する。

ステップ１３では、前記ステップ１２で認識した音声の内容に対し、回答する音声のデータ（以下では回答音声データとする）を作成する。このとき、標準プログラムを使用している場合は、ロボット１が予め備えている標準辞書データを用いて回答音声データを作成する。また、ＡＩ用プログラムを使用している場合は、ＡＩ用プログラムとともにクラウドネットワーク３１からインストールされ、過去の学習によって強化された辞書データを用いて回答音声データを作成する。

回答音声データの内容は、例えば、前記ステップ１２で認識した音声の内容からキーワードを検出し、そのキーワードに予め対象付けられた事項を辞書データから探し、作成することができる。また、回答音声データの内容は、前記ステップ１２で認識した音声の内容に対し、人工知能を用いて推論したものであってもよい。

ステップ１４では、前記ステップ１３で作成した回答音声データに基づき、スピーカ１５を用いて発音する。すなわち、前記ステップ１１で取得した音声に対する回答を発音する。

ステップ１５では、その時点でＡＩ用プログラムを使用中であるか否かを判断する。ＡＩ用プログラムを使用中である場合はステップ１６に進み、標準プログラムを使用中である場合は本処理を終了する。

ステップ１６では、その時点で学習停止中であるか否かを判断する。なお、学習停止は、後述する学習停止判断処理により設定される。学習停止中ではない場合はステップ１７に進み、学習停止中である場合は本処理を終了する。

ステップ１７では、その時点で設定されている学習制限内容を取得する。学習制限内容としては、例えば、ユーザ（前記ステップ２で入力されたと判断された識別情報に対応するユーザ）の家族、知人に関する情報（名前、住所、電話番号、メールアドレス、経歴、顔を含む画像）等である。

ステップ１８では、前記ステップ１２で認識した音声の内容について学習を行う。学習としては、例えば、機械学習が挙げられる。機械学習は、教師付き学習であってもよいし、教師無し学習であってもよい。また、学習は、人工無能による学習であってもよい。この場合、前記ステップ１２で認識した音声からキーワードを抽出し、そのキーワードをデータセット（例えば、音声認識に用いる辞書データ）に追加することができる。このキーワードは、例えば、回答音声データを作成する処理（前記ステップ１３）において利用できる。

ただし、前記ステップ１２で認識した音声の内容であっても、前記ステップ１７で取得した学習制限内容に該当する事項は、学習しないようにする。
ステップ１９では、前記ステップ１８での学習結果を反映するように、ＡＩ用プログラムとデータセットとを更新する。なお、学習結果を反映するように更新されたＡＩ用プログラム及びデータセットは、学習結果の一例である。

（２−３）学習停止判断処理
制御ユニット３は、図５に示す学習停止判断処理を所定時間ごとに繰り返し実行する。図５のステップ２１では、ＡＩ用プログラムを使用中であるか否かを判断する。ＡＩ用プログラムを使用中である場合はステップ２２に進み、標準プログラムを使用中である場合は本処理を終了する。

ステップ２２では、ＧＰＳ１３を用いてロボット１の位置情報を取得する。
ステップ２３では、カメラ７を用いて、ロボット１の周囲を撮像した画像を取得する。
ステップ２４では、マイク５を用いて、音声を取得する。

ステップ２５では、その時点で学習停止中であるか否かを判断する。なお、学習停止の状態は、後述するステップ２８において開始され、後述するステップ３０において学習を再開したときに終了する。学習停止中ではない場合はステップ２６に進み、学習停止中である場合はステップ２９に進む。

ステップ２６では、前記ステップ２３で取得した画像、又は前記ステップ２４で取得した音声に、学習停止のきっかけとなるものがあるか否かを判断する。学習停止のきっかけとしては、例えば、以下のものが挙げられる。

・前記ステップ２３で取得した画像において、学習停止を指示する動作として予め設定された動作が認識されること。その動作として、例えば、図６Ａに示すように、人差し指を立てて口の前に置く動作が挙げられる。また、他の動作として、ウインクが挙げられる。

・前記ステップ２４で取得した音声において、学習停止を指示するキーワードとして予め設定された音声が認識されること。そのキーワードとして、例えば、「秘密」、「オフレコ」、「プライベート」等が挙げられる。また、別のキーワードとして、例えば、ユーザの家族や知人の名前等が挙げられる。ユーザは、家族や知人の名前をキーワードとして予めロボット１に登録しておくことができる。また、ロボット１が、過去に認識した音声データに基づき、どの言葉がユーザの家族や知人の名前であるかを推論し、ユーザの家族や知人の名前であると推論した言葉をキーワードとして登録してもよい。

・前記ステップ２３で取得した画像において、予め登録された人の顔が認識されること。この人としては、例えば、ユーザの家族、知人等が挙げられる。なお、ユーザは、学習停止のきっかけとする人の顔画像を予め登録しておくことができる。

学習停止のきっかけがある場合はステップ２８に進み、学習停止のきっかけがない場合はステップ２７に進む。
ステップ２７では、前記ステップ２２で取得した位置情報が、学習を停止するべき位置として予め登録された位置に該当するか否かを判断する。学習を停止するべき位置としては、例えば、ユーザの自宅、会議室等が挙げられる。

ユーザは、学習を停止するべき位置を予め登録しておくことができる。また、ロボット１が、過去のデータに基づき、学習を停止するべき場所を推論し、推論した場所を登録することができる。例えば、ロボット１は、学習停止のきっかけが過去に認識された場所を、学習を停止するべき場所として推論することができる。

ステップ２８では、学習停止の状態を開始する。この時点以降、前記会話処理における前記ステップ１６では、肯定判断がなされ、前記ステップ１８での学習が行われない。
一方、前記ステップ２５で肯定判断された場合はステップ２９にて、前記ステップ２３で取得した画像、又は前記ステップ２４で取得した音声に、学習を再開するきっかけとなるものがあるか否かを判断する。学習再開のきっかけとしては、例えば、以下のものが挙げられる。

・前記ステップ２３で取得した画像において、学習再開を指示する動作として予め設定された動作が認識されること。その動作として、例えば、図６Ｂに示すように、親指と人差し指とで輪を作る（いわゆるＯＫを示す）動作が挙げられる。

・前記ステップ２４で取得した音声において、学習再開を指示するキーワードとして予め設定された音声が認識されること。そのキーワードとして、例えば、「ＯＫ」、「再開」、「学習」等が挙げられる。

学習再開のきっかけがある場合はステップ３０に進み、学習再開のきっかけがない場合は本処理を終了する。
ステップ３０では、学習を再開する。この時点以降、前記会話処理における前記ステップ１６では否定判断がなされ、前記ステップ１８の学習が行われる。

（２−４）スケジュール管理処理
ロボット１は、以下に示すスケジュール管理処理を実行することができる。ユーザは予め自らのスケジュール情報を、ロボット１に入力しておく。スケジュール情報の入力は、例えば、タッチパネル９を用いて行ってもよいし、音声入力により行ってもよい。また、端末３３からスケジュール情報を通信ユニット２６に送信してもよい。

スケジュール情報は、少なくとも、期日と、その期日までに実行すべき事項とを含む。ロボット１は、期日よりも所定時間（例えば、１日、３時間）前の時点で、マイク５により取得した音声、カメラ７により取得した画像、端末３３から取得した情報等に基づき、ユーザがスケジュール情報に含まれる事項を実行済みであるか否かを判断し、未だ実行していない場合は、スピーカ１５の音声、又はディスプレイ１９に表示する画像により、ユーザに警告する。

３．ロボット１が奏する効果
（１Ａ）ロボット１は、ＡＩ用プログラムを、学習により変化、発展させることができる。また、ロボット１は、データセット（例えば辞書データ）の内容を、学習により強化することができる。そして、ロボット１は、学習後のＡＩ用プログラム及びデータセットを、クラウドネットワーク３１にアップロードすることができる。また、ロボット１は、クラウドネットワーク３１にアップロードされたＡＩ用プログラム及びデータセットを、インストールすることができる。

学習後のＡＩ用プログラム及びデータセットをインストールするロボット１は、過去に学習を行ったロボット１と同じであっても、異なっていてもよい。また、学習後のＡＩ用プログラム及びデータセットをインストールするロボット１は、過去に学習を行った場所にあるものであってもよいし、異なる場所にあるものであってもよい。

よって、ユーザは、過去の自らの使用よって学習したＡＩ用プログラム及びデータセットを、ユーザがその時点でいる場所（例えば、職場、店舗、自宅等様々な場所）のロボット１に、クラウドネットワーク３１からインストールし、ロボット１を使用することができる。

（１Ｂ）ロボット１は、ユーザの識別情報が入力されることを条件として、その識別情報に対応するＡＩ用プログラム及びデータセットのインストールを許容する。そのため、あるユーザのＡＩ用プログラム及びデータセットを、他人が勝手に使用してしまうことを抑制できる。

（１Ｃ）ロボット１は、人の音声を認識し、それに対する回答の音声を発音することができる。すなわち、ロボット１は人と会話をすることができる。また、ロボット１は、ＡＩ用プログラムを使用している場合、音声の認識結果に基づき学習を行い、その学習結果を用いて回答の音声を作成するので、学習が進むほど、より高度な会話を行うことができる。

（１Ｄ）ロボット１は、その周囲にいる人の動作や、人の識別結果等に応じて、学習を停止する。そのため、ユーザにとって望ましくない事項をロボット１が学習し、後に他人に話してしまうことを抑制できる。

（１Ｅ）ロボット１は、それが存在する場所に応じて、学習を停止する。そのため、学習してほしくない場所で学習した事項を、ロボット１が後に他人に話してしまうことを抑制できる。

（１Ｆ）ロボット１は、その周囲にいる人の動作等に応じて、学習を再開する。そのため、ロボット１の学習を促進することができる。
（１Ｇ）ロボット１は、学習制限内容に該当する事項を学習しない。そのため、ユーザにとって望ましくない事項をロボット１が学習し、後に他人に話してしまうことを抑制できる。

（１Ｈ）ロボット１は、ユーザのスケジュール管理を行うことができる。
（１Ｉ）ロボット１は、ロボット１の使用終了条件が充足された場合、ＡＩ用プログラム及びデータセットを消去する。そのため、ユーザは、自分のＡＩ用プログラム及びデータセットを後で他人が使用することを抑制できる。
＜第２の実施形態＞
１．コンピュータ１０１の構成
コンピュータ１０１の構成を図７、図８に基づき説明する。コンピュータ１０１の電気的構成は、前記第１の実施形態におけるロボット１と基本的に同じである。ただし、コンピュータ１０１における入力ユニット２１は、外部のマイク５、カメラ７、キーボード６３、マウス６５、タッチパネル９と接続している。また、出力ユニット２９は、外部のスピーカ１５、及びディスプレイ１９と接続している。

コンピュータ１０１は、図８に示すように、箱型の筐体６７を備え、その内部に各構成を収容している。また、コンピュータ１０１は、外部の機器（例えば、マイク５、カメラ７、キーボード６３、マウス６５、タッチパネル９、スピーカ１５、ディスプレイ１９等）を接続可能な端子６９を複数備えている。なお、コンピュータ１０１は広義でのロボットである。

２．コンピュータ１０１が実行する処理
コンピュータ１０１は、前記第１の実施形態のロボット１と同様に、プログラム設定処理、会話処理、学習停止判断処理、及びスケジュール管理処理を実行する。また、コンピュータ１０１は、周知のコンピュータと同様の機能を有する。

３．コンピュータ１０１が奏する効果
コンピュータ１０１は、前記（１Ａ）〜（１Ｉ）の効果を奏する。
＜第３の実施形態＞
１．車載機２０１の構成
車載機２０１の構成を図９に基づき説明する。車載機２０１は車両に搭載される。車載機２０１の電気的構成は、前記第２の実施形態におけるコンピュータ１０１と基本的に同じである。ただし、車載機２０１における入力ユニット２１は、車両に設けられたマイク５、カメラ７、タッチパネル９、センサ群１１、及びＧＰＳ１３と接続している。

マイク５は車両の車室内に設けられ、車両の乗員（ドライバ、又は他の乗員）の声を検出する。カメラ７は乗員を撮影する。タッチパネル９は車両の車室内に設けられ、乗員により操作される。センサ群１１は、ドライバの運転操作（操舵角、アクセルの踏み込み量、ブレーキの踏み込み量、シフト位置等）と、車両の状態（速度、加速度、ヨーレート、パワーユニット（内燃機関、モータ等）の状態、燃料の残量、バッテリーの残量等）とを検出する。

また、出力ユニット２９は、スピーカ１５、ディスプレイ１９、及び車両制御部７１と接続している。スピーカ１５及びディスプレイ１９は車両の車室内に設けられている。車両制御部７１は、車両に関する様々な制御（例えば、操舵、加速、減速、シフトチェンジ等）を行う。なお、車載機２０１は広義でのロボットである。

２．車載機２０１が実行する処理
（２−１）ロボット１と同様の処理
車載機２０１は、前記第１の実施形態のロボット１と同様に、プログラム設定処理、会話処理、学習停止判断処理、及びスケジュール管理処理を実行する。

（２−２）車両制御処理
車載機２０１の制御ユニット３は、図１０に示す車両制御処理を所定時間ごとに繰り返し実行する。この処理は、マイク５が所定の閾値以上の音量を検出したときに実行される。

ステップ３１では、マイク５を用いて音声を取得する。ステップ３２では、周知の音声認識技術により、前記ステップ３１で取得した音声から、車両に対する指示（例えば、発進、停止、減速、加速、右左折、レーンチェンジ、シフトチェンジ等）を認識する。このとき、標準プログラムを使用している場合は、車載機２０１が予め備えている標準辞書データを用いて上記の指示を認識する。また、ＡＩ用プログラムを使用している場合は、ＡＩ用プログラムとともにクラウドネットワーク３１からインストールされ、過去の学習によって強化された辞書データを用いて上記の指示を認識する。

ステップ３３では、前記ステップ３２で認識した、車両対する指示に応じて、車両の制御内容を決定する。例えば、車両に対する指示が発進である場合、ブレーキを解除するタイミング、エンジン回転数の増加量及び増加速度等を決定する。このとき、標準プログラムを使用している場合は、標準プログラムを用いて車両の制御内容を決定する。また、ＡＩ用プログラムを使用している場合は、過去の学習によって進化したＡＩ用プログラムを用いて制御内容を決定する。

ステップ３４では、前記ステップ３３で決定した制御内容を車両制御部７１に出力する。なお、車両制御部７１は、その制御内容に従って車両を制御する。
ステップ３５では、その時点でＡＩ用プログラムを使用中であるか否かを判断する。ＡＩ用プログラムを使用中である場合はステップ３６に進み、標準プログラムを使用中である場合は本処理を終了する。

ステップ３６では、センサ群１１から、車両の状態に関する検出結果を取得する。
ステップ３７では、前記ステップ３４で出力した制御内容と、前記ステップ３６で取得したセンサ出力とに基づき学習を行う。その学習は、前記ステップ３６で取得したセンサ出力が予め設定された最適範囲となるように、制御内容を修正するものである。

例えば、前記ステップ３４で出力した制御内容が発進であった場合、発進の過程におけるセンサ出力（例えば、速度、加速度等のセンサ出力）が最適範囲であったか否かを確認し、最適範囲から外れていたならば、次回以降の発進時におけるセンサ出力が最適範囲に近づくように、発進の制御内容を修正する。

ステップ３８では、前記ステップ３７での学習結果を反映するように、ＡＩ用プログラムを更新する。
３．車載機２０１が奏する効果
車載機２０１は、前記（１Ａ）〜（１Ｉ）の効果を奏する。さらに、車載機２０１は次の効果も奏する。

（３Ａ）車載機２０１は、人の音声を認識し、それに対応する車両制御を行うことができる。また、車載機２０１は、ＡＩ用プログラムを使用している場合、車両制御部７１に出力した車両制御の内容と、車両の状態を表すセンサ出力とに基づき学習を行うので、学習が進むほど、より高度な車両制御を行うことができる。

（３Ｂ）車載機２０１は、車両制御処理に関し、ＡＩ用プログラムを、学習により変化、発展させることができる。また、車載機２０１は、クラウドネットワーク３１にアップロードされたＡＩ用プログラムを、インストールすることができる。

学習後のＡＩ用プログラムをインストールする車載機２０１は、過去に学習を行った車載機２０１と同じであっても、異なっていてもよい。
よって、ユーザは、過去の自らの使用よって学習したＡＩ用プログラムを、任意の車両の車載機２０１に、クラウドネットワーク３１からインストールし、使用することができる。
＜第４の実施形態＞
１．ロボット３０１の構成
本実施形態のロボット３０１の構成は、基本的には前記第１の実施形態のロボット１と同様である。以下では、第１の実施形態との相違点を中心に説明する。ロボット３０１は、図１１に示すように、第１の人工知能ユニット７３と、第２の人工知能ユニット７５とを備えている。

第１の人工知能ユニット７３は、ロボット３０１の各種動作を実行するためのＡＩ用プログラム及びデータセットを記憶している。以下では、このプログラムを第１のＡＩ用プログラムとし、このデータセットを第１のデータセットとする。

第１人工知能ユニット７３は、第１のＡＩ用プログラム及び第１のデータセットを学習により変化、発展させる。第１の人工知能ユニット７３が行う学習は、後述する学習停止、及び学習制限に影響されない。また、第１のＡＩ用プログラム及び第１のデータセットは、クラウドネットワーク３１にアップロードされることはない。

第２の人工知能ユニット７５は、ＡＩ用プログラム及びデータセットを記憶可能である。以下では、このプログラムを第２のＡＩ用プログラムとし、このデータセットを第２のデータセットとする。

第２のＡＩ用プログラムは、基本的には第１のＡＩ用プログラムと同様であるが、ロボット３０１の各種動作を実行するためには使用されない。第２人工知能ユニット７５は、第２のＡＩ用プログラム及び第２のデータセットを学習により変化、発展させる。第２のＡＩ用プログラム及び第２のデータセットは、学習結果を蓄積し、クラウドネットワーク３１にアップロードされる。そのことにより、学習結果をクラウドネットワーク３１に記憶することができる。

ただし、第２の人工知能ユニット７５が行う学習は、後述する学習停止、及び学習制限により制限される。そのため、第２のＡＩ用プログラム及び第２のデータセットのアップロードによってクラウドネットワーク３１に記憶される学習結果は制限される。

第２のＡＩ用プログラム及び第２のデータセットは、クラウドネットワーク３１から第２の人工知能ユニット７５にダウンロードすることが可能である。そして、ダウンロードされた第２のＡＩ用プログラム及び第２のデータセットに基づき、第１のＡＩ用プログラム及び第１のデータセットの学習を行うことができる。詳しくは後述する。

２．ロボット３０１が実行する処理
（２−１）プログラムインストール処理
制御ユニット３は、ロボット３０１の電源がオンになったとき、図１２に示すプログラムインストール処理を実行する。

ステップ４１では、ユーザの識別情報が入力されたか否かを判断する。識別情報は、前記第１の実施形態と同様のものとすることができる。識別情報が入力された場合はステップ４２に進み、識別情報が入力されなかった場合は本処理を終了する。

ステップ４２では、前記ステップ４１で入力されたと判断された識別情報に対応する第２のＡＩ用プログラム及び第２のデータセットを、クラウドネットワーク３１からインストールする。インストールした第２のＡＩ用プログラム及び第２のデータセットは、第２の人工知能ユニット７５に記憶する。第２の人工知能ユニット７５に既に第２のＡＩ用プログラム及び第２のデータセットが記憶されていた場合は上書きする。

ステップ４３では、前記ステップ４２でインストールした第２のＡＩ用プログラム及び第２のデータセットには含まれているが、第１のＡＩ用プログラム及び第１のデータセットには記憶されていない内容を学習する。

ステップ４４では、第１のＡＩ用プログラム及び第１のデータセットに、前記ステップ４３で学習した内容を加え、更新する。すなわち、ダウンロードされた第２のＡＩ用プログラム及び第２のデータセットに基づき、第１のＡＩ用プログラム及び第１のデータセットの学習を行う。

（２−２）会話処理
制御ユニット３は、図１３に示す会話処理を実行する。この処理は、マイク５が所定の閾値以上の音量を検出したときに実行される。会話処理は、第１の人工知能ユニット７３に記憶されている第１のＡＩ用プログラム及び第１のデータセットを用いて行われる。

ステップ５１〜５４の処理は、前記第１の実施形態におけるステップ１１〜１４の処理と同様である。
ステップ５５では、第１の人工知能ユニット７３が、前記ステップ５２で認識した音声の内容について学習を行う。学習の内容は、前記第１の実施形態と同様である。

ステップ５６では、前記ステップ５５での学習結果を反映するように、第１のＡＩ用プログラム及び第１のデータセットを更新する。
ステップ５７では、第２の人工知能ユニット７５がその時点で学習停止中であるか否かを判断する。なお、第２の人工知能ユニット７５の学習停止は、後述する、第２の人工知能ユニット学習停止判断処理により設定される。第２の人工知能ユニット７５が学習停止中ではない場合はステップ５８に進み、学習停止中である場合は本処理を終了する。

ステップ５８では、その時点で設定されている学習制限内容を取得する。学習制限内容としては、例えば、ユーザ（前記ステップ４１で入力されたと判断された識別情報に対応するユーザ）の家族、知人に関する情報（名前、住所、電話番号、メールアドレス、経歴、顔を含む画像）等である。

ステップ５９では、第２の人工知能ユニット７５が、前記ステップ５２で認識した音声の内容について学習を行う。学習の内容は、前記第１の実施形態と同様である。ただし、前記ステップ５２で認識した音声の内容であっても、前記ステップ５８で取得した学習制限内容に該当する事項は、学習しないようにする。

ステップ６０では、前記ステップ５９での学習結果を反映するように、第２のＡＩ用プログラム及び第２のデータセットを更新する。
（２−３）第２の人工知能ユニット学習停止判断処理
制御ユニット３は、図１４に示す第２の人工知能ユニット学習停止判断処理を所定時間ごとに繰り返し実行する。

ステップ７１では、ＧＰＳ１３を用いてロボット３０１の位置情報を取得する。
ステップ７２では、カメラ７を用いて、ロボット３０１の周囲を撮像した画像を取得する。

ステップ７３では、マイク５を用いて、音声を取得する。
ステップ７４では、第２の人工知能ユニット７５がその時点で学習停止中であるか否かを判断する。なお、学習停止の状態は、後述するステップ７７において開始され、後述するステップ７９において学習を再開したときに終了する。学習停止中ではない場合はステップ７５に進み、学習停止中である場合はステップ７８に進む。

ステップ７５では、前記ステップ７２で取得した画像、又は前記ステップ７３で取得した音声に、学習停止のきっかけとなるものがあるか否かを判断する。学習停止のきっかけは、前記第１の実施形態と同様である。学習停止のきっかけがある場合はステップ７７に進み、学習停止のきっかけがない場合はステップ７６に進む。

ステップ７６では、前記ステップ７１で取得した位置情報が、学習を停止するべき位置として予め登録された位置に該当するか否かを判断する。学習を停止するべき位置は、前記第１の実施形態と同様である。

ステップ７７では、第２の人工知能ユニット７５について学習停止の状態を開始する。この時点以降、前記会話処理における前記ステップ５７では、肯定判断がなされ、前記ステップ５９での学習が行われない。

一方、前記ステップ７４で肯定判断された場合はステップ７８にて、前記ステップ７２で取得した画像、又は前記ステップ７３で取得した音声に、学習を再開するきっかけとなるものがあるか否かを判断する。学習再開のきっかけは、前記第１の実施形態と同様である。学習再開のきっかけがある場合はステップ７９に進み、学習再開のきっかけがない場合は本処理を終了する。

ステップ７９では、第２の人工知能ユニット７５における学習を再開する。この時点以降、前記会話処理における前記ステップ５７では否定判断がなされ、前記ステップ５９の学習が行われる。

（２−４）プログラムアップロード処理
制御ユニット３は、図１５に示すプログラムアップロード処理を所定時間ごとに繰り返し実行する。

ステップ８１では、ロボット３０１の使用終了条件が充足されたか否かを判断する。使用終了条件は、前記第１の実施形態の前記ステップ５で判断するものと同様である。使用終了条件が充足された場合はステップ８２に進み、使用終了条件が充足されない場合は本処理を終了する。

ステップ８２では、第２のＡＩ用プログラム及び第２のデータセットを、クラウドネットワーク３１にアップロードする。このとき、ユーザの識別情報と対応付けてアップロードする。なお、前述した学習が行われた場合、アップロードする第２のＡＩ用プログラム及び第２のデータセットは、学習後のものである。

３．ロボット３０１が奏する効果
ロボット３０１は、前記（１Ｂ）、（１Ｃ）、（１Ｆ）、（１Ｈ）の効果を奏する。さらに、ロボット３０１は、次の効果も奏する。

（４Ａ）ロボット３０１は、第１のＡＩ用プログラム及び第１のデータセットを、学習により変化、発展させることができる。さらに、第１のＡＩ用プログラム及び第１のデータセットにおける学習は、学習停止の処理、及び学習制限の処理に影響されない。

また、第１のＡＩ用プログラム及び第１のデータセットはクラウドネットワーク３１にアップロードされないので、その内容が他人に知られることを抑制できる。
（４Ｂ）ロボット３０１は、学習後の第２のＡＩ用プログラム及び第２のデータセットを、クラウドネットワーク３１にアップロードすることができる。また、ロボット３０１は、第２のＡＩ用プログラム及び第２のデータセットをクラウドネットワーク３１からインストールすることができる。

学習後の第２のＡＩ用プログラム及び第２のデータセットをインストールするロボット３０１は、過去に学習を行ったロボット３０１と同じであっても、異なっていてもよい。また、学習後の第２のＡＩ用プログラム及び第２のデータセットをインストールするロボット３０１は、過去に学習を行った場所にあるものであってもよいし、異なる場所にあるものであってもよい。

よって、ユーザは、過去の自らの使用よって学習した第２のＡＩ用プログラム及び第２のデータセットを、ユーザがその時点でいる場所（例えば、職場、店舗、自宅等様々な場所）のロボット３０１に、クラウドネットワーク３１からインストールすることができる。そして、第２のＡＩ用プログラム及び第２データセットを用いて学習を行い、第１のＡＩ用プログラム及び第１のデータセットを変化、発展させることができる。

（４Ｃ）ロボット３０１は、クラウドネットワーク３１にアップロードされる第２のＡＩ用プログラム及び第２のデータセットついて、学習を制限する。すなわち、ロボット３０１は、その周囲にいる人の動作や、人の識別結果等に応じて、第２のＡＩ用プログラム及び第２のデータセットについての学習を停止する。また、ロボット３０１は、それが存在する場所に応じて、第２のＡＩ用プログラム及び第２のデータセットにおける学習を停止する。また、ロボット３０１は、学習制限内容に該当する事項を、第２のＡＩ用プログラム及び第２のデータセットに含ませない。

そのため、ユーザが他人に知られたくない事項を含む第２のＡＩ用プログラム及び第２のデータセットが、クラウドネットワーク３１にアップロードされることを抑制できる。
＜第５の実施形態＞
１．ロボット４０１の構成
本実施形態のロボット４０１の構成は、基本的には前記第１の実施形態のロボット１と同様である。以下では、第１の実施形態との相違点を中心に説明する。ロボット４０１は、図１６に示すように、通信ユニット２６を用いてインターネット７７と接続することができる。インターネット７７はネットワークの一例である。また、ロボット４０１は車両内に置くことができる。この場合、ロボット４０１は、後述する会話等処理により、車両の乗員と会話することができる。

２．ロボット４０１が実行する処理
（２−１）ロボット１と同様の処理
ロボット４０１は、前記第１の実施形態のロボット１と同様に、プログラム設定処理、学習停止判断処理、及びスケジュール管理処理を実行する。

（２−２）会話等処理
ロボット４０１の制御ユニット３は、図１７に示す会話等処理を所定時間ごとに繰り返し実行する。この処理は、マイク５が所定の閾値以上の音量を検出したときに実行される。

ステップ９１、９２の処理は、それぞれ、前記第１の実施形態におけるステップ１１、１２の処理と同様である。
ステップ９３では、前記ステップ９２で認識した音声の内容に関連する情報を、通信ユニット２６を用い、インターネット７７において検索し、取得する。例えば、前記ステップ９２で認識した音声の内容からキーワードを抽出し、そのキーワードに予め関連付けられた事項を含む情報を検索する。検索の対象としては、例えば、ＳＮＳ（ソーシャルネットワーキングサービス）、ブログ、電子掲示板等が挙げられる。また、前記ステップ９２で認識した音声の内容が質問である場合、その質問に対する回答を検索する。検索の方法としては、例えば、公知の検索エンジンを用いることができる。

ステップ９４では、前記ステップ９２で認識した音声の内容に対し、基本的には前記第１の実施形態におけるステップ１３と同様に、回答音声データを作成する。ただし、本ステップでは、前記ステップ９３で取得した情報も用いて、回答音声データを作成する。前記ステップ９３で取得した情報を用いるとは、例えば、その情報を音声化したものを、回答音声データに含めることである。

ステップ９５では、後述するステップ９６で発音するときの音声の種類を、前記ステップ９４で作成した回答の内容に応じて決定する。音声の種類としては、例えば、男性の声、女性の声、大人の声、子供の声等が挙げられる。

音声の種類は、具体的には、以下のようにして決定する。まず、制御ユニット３は、前記ステップ９４で作成した回答の内容から、特徴（例えば、男性に特有の特徴、女性に特有の特徴、大人に特有の特徴、子供に特有の特徴等）を抽出する。

制御ユニット３は、回答の内容における特徴と、音声の種類とを対応付けたマップを予め備えている。制御ユニット３は、上記のように抽出した特徴をそのマップに入力することで、抽出した特徴に対応した音声の種類を決定する。

例えば、前記ステップ９４で作成した回答の内容から、男性に特有の特徴と大人に特有の特徴とが抽出されれば、制御ユニット３は、大人の男性の音声を決定する。
ステップ９６では、前記ステップ９４で作成した回答音声データに基づき、スピーカ１５を用いて発音する。このとき、前記ステップ９５で設定した種類の音声を用いて発音する。

ステップ９７では、まず、前記ステップ９２で認識した音声の内容、又は、前記ステップ９４で作成した回答の内容に対応する感情（例えば、喜び、怒り、悲しみ、平静等）を取得する。この感情の取得は以下のように行う。

制御ユニット３は、音声の内容や回答の内容に現れる特徴と、感情とを対応付けたマップを予め備えている。音声の内容に現れる特徴としては、例えば、音量、音声の抑揚、音程の高低等が挙げられる。また、回答の内容に現れる特徴としては、例えば、回答の内容に含まれる、感情を反映した語句、感情を反映した言い回し等が挙げられる。

制御ユニット３は、前記ステップ９２で認識した音声の内容、又は、前記ステップ９４で作成した回答から抽出した特徴を前記マップに入力することにより、対応する感情を取得する。

次に、制御ユニット３は、取得した感情を表現する人又はキャラクタの顔画像を作成し、ディスプレイ１９に表示する。例えば、取得した感情が喜びである場合、笑顔の人又はキャラクタの顔画像をディスプレイ１９に表示する。また、取得した感情が悲しみである場合、泣き顔の人又はキャラクタの顔画像をディスプレイ１９に表示する。

ステップ９８〜１０２の処理は、それぞれ、前記第１の実施形態におけるステップ１５〜１９の処理と同様である。
３．ロボット４０１が奏する効果
ロボット４０１は、前記（１Ａ）〜（１Ｉ）の効果を奏する。さらに、ロボット４０１は次の効果も奏する。

（５Ａ）ロボット４０１は、音声の内容に関連する情報を、インターネット７７において検索し、取得することができる。そして、ロボット４０１は、そのように取得した情報も用いて、回答音声データを作成する。そのことにより、より適切な回答音声データを作成することができる。

（５Ｂ）ロボット４０１は、回答の内容に応じて音声の種類を決定することができる。そのため、ユーザは、回答の内容と、それを発音する音声の種類との不調和を感じにくい。

（５Ｃ）ロボット４０１は、認識した音声の内容、又は、回答の内容に対応する感情を取得し、取得した感情を表現する人又はキャラクタの顔画像をディスプレイ１９に表示する。そのことにより、ユーザは、ロボット４０１をあたかも人間のように感じることができる。
＜第６の実施形態＞
１．ロボット５０１の構成
本実施形態のロボット５０１の構成は、基本的には前記第１の実施形態のロボット１と同様である。

２．ロボット５０１が実行する処理
（２−１）ロボット１と同様の処理
ロボット５０１は、前記第１の実施形態のロボット１と同様に、プログラム設定処理、会話処理、学習停止判断処理、及びスケジュール管理処理を実行する。

（２−２）通話処理
図１８に示すように、複数のロボット５０１は、ユーザ７９とユーザ８１との間の通話を可能にする。例えば、ユーザ７９側のロボット５０１（以下ではロボット５０１Ａとする）は、ユーザ７９が発音した音声をマイク５で取得する。また、ロボット５０１Ａは、ユーザ７９による、通話相手のロボット５０１（以下ではロボット５０１Ｂとする）を指定する入力を、タッチパネル９を用いて受け付ける。

ロボット５０１Ａは、ユーザ７９が発音した音声を変換した信号（以下では音声変換信号とする）と、ロボット５０１Ａの識別信号と、ユーザ７９により指定された通話相手のロボット５０１Ｂの識別信号とを、通信ユニット２６を用いてホストコンピュータ８３に送信する。

ホストコンピュータ８３は、受信したロボット５０１Ａの識別信号と、通話相手のロボット５０１Ｂの識別信号とが、通話ペアとして設定されているか否かを判断する。通話ペアとして設定されていれば、音声変換信号を、通話相手のロボット５０１Ｂに転送する。なお、通話ペアの設定については後述する。

ロボット５０１Ｂは、通信ユニット２６を用いて、転送された音声変換信号を受信し、その音声変換信号に基づき、スピーカ１５を用いて発音する。以上の処理により、ユーザ７９が発音した音声が、ロボット５０１Ｂ側のユーザ８１に伝えられる。また、ロボット５０１Ｂは、音声を発音することに加えて、その音声を文字に変換し、その文字をディスプレイ１９に表示する。

また、ロボット５０１Ｂが上述したロボット５０１Ａの処理を行い、ロボット５０１Ａが上述したロボット５０１Ｂの処理を行うことで、ユーザ８１が発音した音声を、ユーザ７９に伝えることもできる。

一方、ホストコンピュータ８３は、受信したロボット５０１Ａの識別信号と、通話相手のロボット５０１Ｂの識別信号とが、通話ペアとして設定されてなければ、上記の音声変換信号の転送を行わない。

（２−３）通話ペア設定処理
次に、ホストコンピュータ８３が上記の通話ペアを設定する処理を、図１９に基づき説明する。

ステップ１１１では、通話ペアの設定要求を新たに受信したか否かを判断する。通話ペアの設定要求とは、ロボット５０１Ａがホストコンピュータ８３に送信する要求である。通話ペアの設定要求には、要求の送信元であるロボット５０１Ａの識別信号と、そのロボット５０１Ａ側のユーザ７９の特徴（例えば、趣味、衣食住の好み、関心を持つ事項等）と、ユーザ７９の顔写真の画像データとが含まれる。

通話ペアの設定要求は、ユーザの指示に応じてロボット５０１Ａが送信してもよいし、ロボット５０１Ａが自動的に送信してもよい。通話ペアの設定要求をホストコンピュータ８３が新たに受信した場合はステップ１１２に進み、受信しなかった場合は本処理を終了する。

ステップ１１２では、前記ステップ１１１で受信したと判断した通話ペアの設定要求（以下では、新たな設定要求とする）に含まれるユーザ７９の特徴を、設定待ちリストにおいて検索する。ここで、設定待ちリストとは、過去にいずれかのロボット５０１から受信した、通話ペアの設定要求（以下では、過去の設定要求とする）のリストである。

ステップ１１３では、前記ステップ１１２での検索の結果、新たな設定要求に含まれるユーザ７９の特徴と一致する特徴を有する、過去の設定要求が発見されたか否かを判断する。そのような過去の設定要求が発見された場合はステップ１１４に進み、発見されなかった場合はステップ１１６に進む。

ステップ１１４では、前記ステップ１１３で発見された、過去の設定要求の送信元であるロボット５０１Ｂと、新たな設定要求の送信元であるロボット５０１Ａとを、通話ペアとして設定する。

ステップ１１５では、通話ペアとして設定されたロボット５０１Ａ、５０１Ｂのそれぞれに、相手のロボット５０１に関する情報を通知する。すなわち、ロボット５０１Ａにはロボット５０１Ｂに関する情報を通知し、ロボット５０１Ｂにはロボット５０１Ａに関する情報を通知する。通知する情報には、相手のロボット５０１の識別信号、対応するユーザの顔写真の画像データ等が含まれる。

一方、前記ステップ１１３で否定判断された場合はステップ１１６にて、新たな設定要求を設定待ちリストに追加する。これ以降、新たな設定要求は、過去の設定要求のリストにおける一部となる。

なお、相手側のロボット５０１に関する情報を通知されたロボット５０１は、その情報を用いて、通話ペアの相手を表すアイコン８５を作成し、図２０に示すように、ディスプレイ１９に表示する。アイコン８５は、通話ペアの相手側のユーザの顔写真を含む。ロボット５０１は、複数のアイコン８５をディスプレイ１９に表示することができる。

ロボット５０１は、特定のアイコン８５がユーザによってタッチされたとき、そのアイコン８５に対応するユーザを通話相手として認識する。そして、ロボット５０１は、音声変換信号を上記のようにホストコンピュータ８３に送信するとき、タッチしたアイコン８５に対応するロボット５０１の識別信号を、ホストコンピュータ８３に送信する。

（２−４）その他の処理
ホストコンピュータ８３は、前記（２−２）の通話処理のとき、ロボット５０１Ａが送信した音声変換信号の内容を分析する。その分析結果が予め設定された禁止事項（例えば犯罪に関する事項等）に該当する場合、通話処理を開始しないようにしたり、通話処理を途中で終了したりする。そのため、ホストコンピュータ８３は、通話処理が犯罪等に利用されることを抑制できる。

また、前記（２−２）の通話処理のとき、ロボット５０１Ｂは、他のコンピュータ５０１Ａから送信された音声も用いて学習を行う。そのため、学習を一層効率的に行うことができる。

また、前記（２−２）の通話処理において、ユーザ７９の発音が所定時間以上途絶えたとき、又は、ユーザ７９が指示したとき、ロボット５０１Ａは、自らが作成した音声変換信号をホストコンピュータ８３に送信する。この場合、ロボット５０１Ａと、ユーザ８１とが通話することになる。コンピュータ５０１Ａは、過去の通話処理により得られた学習結果を用いて音声変換信号を作成することができる。また、ロボット５０１Ａは、過去の通話においてロボット５０１Ａ又はロボット５０１Ｂが発音した音声（例えば、相槌等）を記憶しておき、その音声に対応する音声変換信号を作成してもよい。

３．ロボット５０１が奏する効果
ロボット５０１は、前記（１Ａ）〜（１Ｉ）の効果を奏する。さらに、ロボット５０１は次の効果も奏する。

（６Ａ）ロボット５０１Ａ側のユーザ７９と、ロボット５０１Ｂ側のユーザ８１とは、通話を行うことができる。
（６Ｂ）ユーザ７９とユーザ８１との通話は、ロボット５０１Ａとロボット５０１Ｂとが通話ペアとして設定されていることが前提になる。通話ペアは、ユーザ７９とユーザ８１との特徴が一致する場合に設定される。よって、ロボット５０１は、特徴が一致するユーザ同士の通話を選択的に可能にする。

（６Ｃ）ロボット５０１は通話相手のユーザの顔写真を含むアイコン８５を作成し、ディスプレイ１９に表示する。ユーザは、アイコン８５をタッチすることで、容易に通話相手を選択することができる。また、アイコン８５は通話相手の顔写真を含んでいるので、ユーザは、どのアイコン８５がどの通話相手に対応しているのかを容易に理解することができる。
＜その他の実施形態＞
（１）前記第１〜第６の実施形態において、ロボット１、３０１、４０１、５０１、コンピュータ１０１、車載機２０１は、状況に応じて学習制限内容を増減してもよい。例えば、当初は学習制限内容に属していた事項が、複数の人物によって話されたと認識した場合、その事項を学習制限内容から除外してもよい。

（２）前記第１〜第６の実施形態において、ロボット１、３０１、４０１、５０１、コンピュータ１０１、車載機２０１は、マイク５により音声を取得したとき、その音声の声色を判断し、その判断結果に応じて、音声の内容を学習するか否かを決めてもよい。

（３）前記第１〜第６の実施形態において、音声の認識結果に応じて行う処理は、回答音声データの作成（前記ステップ１３）、車両の制御内容決定（前記ステップ３３）以外のものであってもよい。例えば、音声の認識結果に応じて、ロボット１、３０１、４０１、５０１を移動させたり、コンピュータ１０１に接続した外部装置を操作したりしてもよい。また、音声の認識結果に応じて、例えば、所定の動作（例えば、箱の開閉、窓の開閉、鍵の施錠又は開錠、家電製品の操作等）を行ってもよい。

（４）前記第１〜第６の実施形態において、ＡＩ用プログラム及びデータセットを記憶するものは、クラウドネットワーク３１以外のものであってもよい。例えば、周知のサーバ、記憶媒体等に記憶してもよい。

（５）前記第３の実施形態において、車載機２０１は、車両以外の移動体（例えば、鉄道車両、航空機、船舶等）に搭載され、それらを制御するものであってもよい。
（６）前記第１、第４〜６の実施形態において、ロボット１、３０１、４０１、５０１の形態は人型でなくてもよい。例えば、動物、魚、想像上キャラクタ等の形態であってもよい。

（７）前記第１〜第３、第５、第６の実施形態において、ロボット１、４０１、５０１、コンピュータ１０１、車載機２０１は、標準プログラムと、ＡＩ用プログラムとを同時に使用してもよい。この場合、標準プログラムにより基本的な処理を実行するとともに、ＡＩ用プログラムにより、学習の結果得られた付加的な処理を実行することができる。

（８）前記第１〜第６の実施形態において、ロボット１、３０１、４０１、５０１、コンピュータ１０１、車載機２０１の形態は、家電製品（例えば、テレビ、冷蔵庫、エアコン、掃除機、洗濯機等）、携帯端末（例えば、携帯電話（スマートフォンを含む）、メガネ型端末、腕時計型端末）等であってもよい。

（９）前記第１〜第６の実施形態において、ロボット１、３０１、４０１、５０１、コンピュータ１０１、車載機２０１は、カメラ７を用いて自動的に画像を取得し、取得した画像をネットワーク上に送信する機能を有していてもよい。送信先としては、サーバ、端末、車両、他のロボット等が挙げられる。送信する画像は、カメラ７を用いて取得した画像そのものであってもよいし、カメラ７を用いて取得した画像から抽出した一部（例えば、人の顔、人の全身、車両、車両のナンバープレート等）の画像であってもよい。

上記の機能を有するロボット１、３０１、４０１、５０１、コンピュータ１０１、車載機２０１は、防犯の用途、他のロボットの監視の用途等に使用することができる。上記の機能を有するロボット１、３０１、４０１、５０１、コンピュータ１０１、車載機２０１は、例えば、室内、路上、特定の施設（例えば、住居、マンション、オフィス、駐車場等）の入口、他のロボットの近傍等に設置することができる。

また、上記の機能を有するロボット１、３０１、４０１、５０１、コンピュータ１０１、車載機２０１は、空中を飛行する機能を持つか、飛行物に搭載することができる。その場合、上空の視点から撮影した地上の画像をネットワーク上で送信することができる。この場合、ロボット１、３０１、４０１、５０１、コンピュータ１０１、車載機２０１は、撮影した画像において道路の白線を認識し、その白線に沿って移動することができる。また、ロボット１、３０１、４０１、５０１、コンピュータ１０１、車載機２０１は、上空の視点から撮影した地上の画像において信号機を認識し、その表示内容（赤信号、青信号等）を、地上の車両に送信することができる。

（１０）前記第１〜第６の実施形態において、ロボット１、３０１、４０１、５０１、コンピュータ１０１、車載機２０１は、カメラ７を用いて人の行動を認識し、その認識結果に予め関連付けられた音声を出力してもよい。

例えば、ガスの火をつけたまま人が台所を離れるという行動を認識した場合、その人に対する警告の音声を出力することができる。また、人が所定の物を探す行動を認識した場合、その物の場所を探し、物のありかを音声で知らせることができる。また、人が住宅の入口から室内に入るという行動を認識したとき、「おかえりなさい」という音声を出力することができる。人の行動と、それに関連付けられた音声とは、学習により増加させることができる。

上記のように音声を発する場合、その音声の種類は、そのときの状況と、音声の内容とに関連付けられたものとすることができる。例えば、画像において父親を認識した場合、「おかえりなさい」という音声の種類は、その子供の声とすることができる。

（１１）前記第１〜第６の実施形態において、制御ユニットは、マイクロコンピュータを備えているが、個別の電子回路の組合せであってもよいし、ＡＩＳＩＣ（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｅｄＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）であってもよいし、ＦＰＧＡ（ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）などのプログラマブル・ロジック・デバイスあるいはこれらの組合せであってもよい。
（１２）前記第１〜第６の実施形態の構成の一部又は全部を適宜組み合わせてもよい。例えば、前記第４〜第６の実施形態の構成を、前記第２、第３の実施形態に適用してもよい。

Claims

音声認識を行う音声認識ユニット（２３、２５、２７）と、
前記音声認識ユニットの認識結果について学習する学習ユニット（２５）と、
前記音声認識ユニットの認識結果に対し、前記学習ユニットの学習結果を用いて、対応する処理を行う処理ユニット（２３、２５、２７）と、
前記学習結果を外部の記憶装置に記憶する記憶ユニット（２６）と、
前記学習結果を前記記憶装置から取得する学習結果取得ユニット（２６）と、
ユーザの手による特定の動作を認識する動作認識ユニットと、
前記学習ユニットが学習しているときに、前記特定の動作を前記動作認識ユニットが認識した場合、前記学習ユニットの学習を停止する学習停止ユニットと、
を備えるロボット（１、３０１）。
音声認識を行う音声認識ユニット（２３、２５、２７）と、
前記音声認識ユニットの認識結果について学習する学習ユニット（２５）と、
前記音声認識ユニットの認識結果に対し、前記学習ユニットの学習結果を用いて、対応する処理を行う処理ユニット（２３、２５、２７）と、
前記学習結果を外部の記憶装置に記憶する記憶ユニット（２６）と、
前記学習結果を前記記憶装置から取得する学習結果取得ユニット（２６）と、
ユーザの手による特定の動作を認識する動作認識ユニットと、
前記学習ユニットが学習を停止しているときに、前記特定の動作を前記動作認識ユニットが認識した場合、前記学習ユニットの学習を開始する学習開始ユニットと、
を備えるロボット（１、３０１）。