JP6544693B2 - ロボット - Google Patents

ロボット Download PDF

Info

Publication number
JP6544693B2
JP6544693B2 JP2016565988A JP2016565988A JP6544693B2 JP 6544693 B2 JP6544693 B2 JP 6544693B2 JP 2016565988 A JP2016565988 A JP 2016565988A JP 2016565988 A JP2016565988 A JP 2016565988A JP 6544693 B2 JP6544693 B2 JP 6544693B2
Authority
JP
Japan
Prior art keywords
learning
robot
unit
program
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016565988A
Other languages
English (en)
Other versions
JPWO2016103881A1 (ja
Inventor
辰美 黒田
辰美 黒田
博司 前川
博司 前川
勉 足立
勉 足立
寛隆 福田
寛隆 福田
健司 水野
健司 水野
健純 近藤
健純 近藤
林 茂
茂 林
丈誠 横井
丈誠 横井
謙史 竹中
謙史 竹中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ADC Technology Inc
Original Assignee
ADC Technology Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ADC Technology Inc filed Critical ADC Technology Inc
Publication of JPWO2016103881A1 publication Critical patent/JPWO2016103881A1/ja
Application granted granted Critical
Publication of JP6544693B2 publication Critical patent/JP6544693B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J13/00Controls for manipulators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N99/00Subject matter not provided for in other groups of this subclass
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Manipulator (AREA)
  • Toys (AREA)

Description

関連出願の参照
本国際出願は、2014年12月25日に日本国特許庁に出願された日本国特許出願第2014−262907号に基づく優先権を主張するものであり、日本国特許出願第2014−262907号の全内容を本国際出願に参照により援用する。
本開示はロボットに関する。
近年、人と会話できるロボットが注目されている。このロボットは、人が発音する音声をマイクで取得し、音声認識により音声の意味内容を推定する。そして、推定した意味内容に対し、予め関連付けられた回答を行う(特許文献1参照)。
特許第4015424号公報
ロボットの会話能力を、人工知能等を用いた学習により高めることが考えられる。しかしながら、ある特定のロボットの会話能力を学習により高めたとしても、例えば、異なる場所にある別のロボットを使用する場合、初歩から学習を行わなければならない。本開示は、ロボットの学習に関するユーザの負担を軽減できるロボットを提供することを一側面とする。
本開示のロボットは、音声認識を行う音声認識ユニットと、前記音声認識ユニットの認識結果について学習する学習ユニットと、前記音声認識ユニットの認識結果に対し、前記学習ユニットの学習結果を用いて、対応する処理を行う処理ユニットと、を備える。
本開示のロボットは、例えば、前記学習結果を外部の記憶装置に記憶する記憶ユニットと、前記学習結果を前記記憶装置から取得する学習結果取得ユニットと、を備える。
本開示のロボットは、音声認識ユニットの認識結果について学習することができる。また、本開示のロボットは、例えば、学習結果を外部の記憶装置に記憶するとともに、その記憶装置から、学習結果を取得することができる。
そのため、ユーザは、例えば、第1のロボットの使用により生じた学習結果を外部の記憶装置に記憶しておき、第2のロボットを使用するとき、記憶しておいた学習結果を第2のロボットに導入することができる。その結果、ユーザは、第1のロボットにおける学習結果を利用することができ、第2のロボットを必ずしも初歩から学習させなくてもよい。
一実施形態のロボットの電気的構成を表すブロック図である。 ロボットの構成を表す正面図である。 ロボットが実行するプログラム設定処理を表すフローチャートである。 ロボットが実行する会話処理を表すフローチャートである。 ロボットが実行する学習停止判断処理を表すフローチャートである。 図6Aは学習停止を指示する動作の一例を表す説明図であり、図6Bは、学習再開を指示する動作の一例を表す説明図である。 コンピュータの電気的構成を表すブロック図である。 コンピュータの外観を表す斜視図である。 車載機の電気的構成を表すブロック図である。 車載機が実行する車両制御処理を表すフローチャートである。 別の実施形態のロボットの電気的構成を表すブロック図である。 ロボットが実行するプログラムインストール処理を表すフローチャートである。 ロボットが実行する会話処理を表すフローチャートである。 ロボットが実行する第2の人工知能ユニット学習停止判断処理を表すフローチャートである。 ロボットが実行するプログラムアップロード処理を表すフローチャートである。 更に他の実施形態のロボットの電気的構成を表すブロック図である。 ロボットが実行する会話処理を表すフローチャートである。 通話処理を実行するための構成を表す説明図である。 ホストコンピュータが実行する通話ペア設定処理を表すフローチャートである。 アイコンを表示しているディスプレイを表す説明図である。
1、301…ロボット、3…制御ユニット、5…マイク、7…カメラ、9…タッチパネル、11…センサ群、13…GPS、15…スピーカ、17…モータ群、19…ディスプレイ、21…入力ユニット、23…標準プログラム記憶ユニット、25…人工知能ユニット、26…通信ユニット、27…演算ユニット、29…出力ユニット、31…クラウドネットワーク、33…端末、35…頭部、37…胴部、39…右腕部、41…左腕部、43…右脚部、45…左脚部、47、49…車輪、51…移動用モータ、53…首関節、55…肩関節、57…肘関節、59…手首関節、61…関節用モータ、63…キーボード、65…マウス、67…筐体、69…端子、71…車両制御部、101…コンピュータ、201…車載機
本開示の実施形態を図面に基づき説明する。
<第1の実施形態>
1.ロボット1の構成
ロボット1の構成を図1、図2に基づき説明する。ロボット1は、図1に示すように、制御ユニット3、マイク5、カメラ7、タッチパネル9、センサ群11、GPS13、スピーカ15、モータ群17、及びディスプレイ19を備える。
制御ユニット3はマイクロコンピュータを備える。制御ユニットは、具体的には、入力ユニット21、標準プログラム記憶ユニット23、人工知能ユニット25、通信ユニット26、演算ユニット27、及び出力ユニット29を備える。
入力ユニット21は、マイク5、カメラ7、タッチパネル9、センサ群11、及びGPS13から情報を取得し、その情報を演算ユニット27及び人工知能ユニット25に出力する。
標準プログラム記憶ユニット23は、ロボット1の各種動作を実行するための標準プログラムを常時記憶している。標準プログラムは、後述するAI用プログラムとは異なり、内容が変化しないプログラムである。
人工知能ユニット25は、ロボット1の各種動作を実行するためのAI(人工知能)用プログラムを記憶可能である。人工知能ユニット25は、AI用プログラムを記憶しているとき、それを学習により変化、発展させる。また、人工知能ユニット25は、AI用プログラムを新規にインストールすること、及びAI用プログラムを消去することが可能である。
通信ユニット26は、外部のクラウドネットワーク31、端末33等と通信を行う。通信は無線通信であってもよいし、有線通信であってもよい。
演算ユニット27は、標準プログラム又はAI用プログラムを用いて、ロボット1の各種動作を実現するたに必要な演算を実行する。
出力ユニット29は演算ユニット27の演算結果をスピーカ15、モータ群17、及びディスプレイ19に出力する。なお、制御ユニット3に属する各ユニットの詳しい機能は後述する。
図2に示すように、ロボット1は、人型の外形を有しており、頭部35、胴部37、右腕部39、左腕部41、右脚部43、及び左脚部45を備える。
マイク5、カメラ7、及びスピーカ15は頭部35に設けられている。また、ディスプレイ19、及びタッチパネル9は胴部37の正面側に設けられている。
右脚部43、及び左脚部45は、それぞれ、移動用の車輪47、49を備えている。車輪47、49は、それぞれ、前後方向に2つ設けられている。よって、ロボット1は、合計4つの車輪により地面に接する。車輪47、49は、モータ群17に属する移動用モータ51により駆動される。移動用モータ51の駆動力によって車輪47、49を回転させることにより、ロボット1は前後に移動することができる。また、車輪47の回転数と、車輪49の回転数とを異ならせることにより、ロボット1は右旋回又は左旋回をすることができる。
ロボット1は、首関節53、肩関節55、肘関節57、及び手首関節59を備える。各関節の自由度は、1〜3の中から適宜設定できる。各関節は、モータ群17に属する関節用モータ61の駆動力により、動作する。上記の関節のうち、適宜選択したものを関節用モータ61で動かすことにより、ロボット1は所定の動作を行い、また、所定の姿勢を表現する。
センサ群11に属する複数のセンサは、ロボット1における各部の位置、速度、加速度、傾き、関節の角度等を検出する。その検出結果は、入力ユニット21を介して演算ユニット27にフィードバックされ、ロボット1の動作制御に用いられる。
なお、標準プログラム記憶ユニット23、人工知能ユニット25、及び演算ユニット27は、音声認識ユニット、処理ユニット、及び学習停止ユニットの一例である。人工知能ユニット25は、学習ユニットの一例である。通信ユニット26は、記憶ユニット及び学習結果取得ユニットの一例である。入力ユニット21及び通信ユニット26は識別情報取得ユニットの一例である。クラウドネットワーク31は外部の記憶装置の一例である。
2.ロボット1が実行する処理
(2−1)プログラム設定処理
制御ユニット3は、標準プログラムと、AI用プログラムとのうち、使用するプログラムを決めるために、図3に示すプログラム設定処理を実行する。このプログラム設定処理は、ロボット1の電源がオンであるとき、所定時間ごとに繰り返し実行される。
ステップ1では、その時点でAI用プログラムを使用しているか否かを判断する。AI用プログラムを使用していない場合(すなわち、標準プログラムを使用している場合)はステップ2に進み、AI用プログラムを使用している場合はステップ5に進む。
ステップ2では、ユーザの識別情報が入力されたか否かを判断する。識別情報は、例えば、以下の方法で入力することができる。
・端末33から通信ユニット26に識別情報を送信する。
・識別情報を表す電磁波(例えば、電波、赤外線等)を通信ユニット26に送信する。識別情報を表す電磁波は、端末33から送信してもよいし、固定式の装置(例えば、ビーコン、無線LANのアクセスポイント等)から送信してもよい。識別情報を表す電磁波は、定期的に送信してもよいし、ユーザの指示に応じて送信してもよいし、端末33や固定式の装置等がロボット1を検出することをきっかけとして送信してもよい。
・ユーザが識別情報の内容を声に出して言う。マイク5がその音声を取得し、音声認識により、識別情報を特定する。
・識別情報を表す一次元バーコードや二次元バーコードをカメラ7で撮影する。
・タッチパネル9を用いて識別情報を入力する。
識別情報は、数字や文字で構成されるものであってもよいし、1次元又は2次元の画像(例えば一次元バーコードや二次元バーコード)であってもよいし、ユーザの生体情報(例えば、指紋、身体のいずれかの部位における静脈のパターン、虹彩、顔等)であってもよいし、音声で構成されるものであってもよい。
識別情報が入力された場合はステップ3に進み、識別情報が入力されなかった場合は本処理を終了する。
ステップ3では、前記ステップ2で入力されたと判断された識別情報に対応するAI用プログラム及びデータセットを、クラウドネットワーク31からインストールする。インストールしたAI用プログラム及びデータセットは、人工知能ユニット25に記憶する。
なお、クラウドネットワーク31には、識別情報と、AI用プログラム及びデータセットとが、対応付けられて記憶されている。データセットは、AI用プログラムの使用、学習等において用いるデータセットであり、音声認識及び音声合成において用いる辞書データを含む。
ステップ4では、ロボット1が使用するプログラムを、標準プログラムから、前記ステップ3でインストールしたAI用プログラムに変更する。この時点以降、ロボット1はAI用プログラムを使用する。
一方、前記ステップ1で肯定判断された場合はステップ5において、ロボット1の使用終了条件が充足されたか否かを判断する。使用終了条件は、例えば、以下のものとすることができる。
・所定時間以上、ユーザがロボット1を操作しないこと。
・カメラ7の画像やマイク5で取得した音声においてユーザを認識できない状態が所定時間以上続くこと。
・ユーザがロボット1に対し、使用終了に該当する入力を行うこと(例えば、ユーザが「使用終了」と声に出して言う、または、タッチパネル9に使用終了に該当する内容の入力を行う等)。
・ロボット1の電源がオフになる。
・予め設定された時刻になる。
使用終了条件が充足された場合はステップ6に進み、使用終了条件が充足されない場合は本処理を終了する。
ステップ6では、AI用プログラム及びデータセットを、クラウドネットワーク31にアップロードする。このとき、ユーザの識別情報と対応付けてアップロードする。なお、後述する学習が行われた場合、アップロードするAI用プログラム及びデータセットは、学習後のものである。
ステップ7では、人工知能ユニット25からAI用プログラム及びデータセットを消去する。
ステップ8では、使用するプログラムを、AI用プログラムから標準プログラムに変更する。この時点以降、ロボット1は標準プログラムを使用する。
(2−2)会話処理
制御ユニット3は、図4に示す会話処理を実行する。この処理は、マイク5が所定の閾値以上の音量を検出したときに実行される。
ステップ11では、マイク5を用いて音声を取得する。
ステップ12では、周知の音声認識技術により、前記ステップ11で取得した音声の内容を認識する。このとき、標準プログラムを使用している場合は、ロボット1が予め備えている標準辞書データを用いて音声の内容を認識する。また、AI用プログラムを使用している場合は、AI用プログラムとともにクラウドネットワーク31からインストールされ、過去の学習によって強化された辞書データを用いて音声の内容を認識する。
ステップ13では、前記ステップ12で認識した音声の内容に対し、回答する音声のデータ(以下では回答音声データとする)を作成する。このとき、標準プログラムを使用している場合は、ロボット1が予め備えている標準辞書データを用いて回答音声データを作成する。また、AI用プログラムを使用している場合は、AI用プログラムとともにクラウドネットワーク31からインストールされ、過去の学習によって強化された辞書データを用いて回答音声データを作成する。
回答音声データの内容は、例えば、前記ステップ12で認識した音声の内容からキーワードを検出し、そのキーワードに予め対象付けられた事項を辞書データから探し、作成することができる。また、回答音声データの内容は、前記ステップ12で認識した音声の内容に対し、人工知能を用いて推論したものであってもよい。
ステップ14では、前記ステップ13で作成した回答音声データに基づき、スピーカ15を用いて発音する。すなわち、前記ステップ11で取得した音声に対する回答を発音する。
ステップ15では、その時点でAI用プログラムを使用中であるか否かを判断する。AI用プログラムを使用中である場合はステップ16に進み、標準プログラムを使用中である場合は本処理を終了する。
ステップ16では、その時点で学習停止中であるか否かを判断する。なお、学習停止は、後述する学習停止判断処理により設定される。学習停止中ではない場合はステップ17に進み、学習停止中である場合は本処理を終了する。
ステップ17では、その時点で設定されている学習制限内容を取得する。学習制限内容としては、例えば、ユーザ(前記ステップ2で入力されたと判断された識別情報に対応するユーザ)の家族、知人に関する情報(名前、住所、電話番号、メールアドレス、経歴、顔を含む画像)等である。
ステップ18では、前記ステップ12で認識した音声の内容について学習を行う。学習としては、例えば、機械学習が挙げられる。機械学習は、教師付き学習であってもよいし、教師無し学習であってもよい。また、学習は、人工無能による学習であってもよい。この場合、前記ステップ12で認識した音声からキーワードを抽出し、そのキーワードをデータセット(例えば、音声認識に用いる辞書データ)に追加することができる。このキーワードは、例えば、回答音声データを作成する処理(前記ステップ13)において利用できる。
ただし、前記ステップ12で認識した音声の内容であっても、前記ステップ17で取得した学習制限内容に該当する事項は、学習しないようにする。
ステップ19では、前記ステップ18での学習結果を反映するように、AI用プログラムとデータセットとを更新する。なお、学習結果を反映するように更新されたAI用プログラム及びデータセットは、学習結果の一例である。
(2−3)学習停止判断処理
制御ユニット3は、図5に示す学習停止判断処理を所定時間ごとに繰り返し実行する。図5のステップ21では、AI用プログラムを使用中であるか否かを判断する。AI用プログラムを使用中である場合はステップ22に進み、標準プログラムを使用中である場合は本処理を終了する。
ステップ22では、GPS13を用いてロボット1の位置情報を取得する。
ステップ23では、カメラ7を用いて、ロボット1の周囲を撮像した画像を取得する。
ステップ24では、マイク5を用いて、音声を取得する。
ステップ25では、その時点で学習停止中であるか否かを判断する。なお、学習停止の状態は、後述するステップ28において開始され、後述するステップ30において学習を再開したときに終了する。学習停止中ではない場合はステップ26に進み、学習停止中である場合はステップ29に進む。
ステップ26では、前記ステップ23で取得した画像、又は前記ステップ24で取得した音声に、学習停止のきっかけとなるものがあるか否かを判断する。学習停止のきっかけとしては、例えば、以下のものが挙げられる。
・前記ステップ23で取得した画像において、学習停止を指示する動作として予め設定された動作が認識されること。その動作として、例えば、図6Aに示すように、人差し指を立てて口の前に置く動作が挙げられる。また、他の動作として、ウインクが挙げられる。
・前記ステップ24で取得した音声において、学習停止を指示するキーワードとして予め設定された音声が認識されること。そのキーワードとして、例えば、「秘密」、「オフレコ」、「プライベート」等が挙げられる。また、別のキーワードとして、例えば、ユーザの家族や知人の名前等が挙げられる。ユーザは、家族や知人の名前をキーワードとして予めロボット1に登録しておくことができる。また、ロボット1が、過去に認識した音声データに基づき、どの言葉がユーザの家族や知人の名前であるかを推論し、ユーザの家族や知人の名前であると推論した言葉をキーワードとして登録してもよい。
・前記ステップ23で取得した画像において、予め登録された人の顔が認識されること。この人としては、例えば、ユーザの家族、知人等が挙げられる。なお、ユーザは、学習停止のきっかけとする人の顔画像を予め登録しておくことができる。
学習停止のきっかけがある場合はステップ28に進み、学習停止のきっかけがない場合はステップ27に進む。
ステップ27では、前記ステップ22で取得した位置情報が、学習を停止するべき位置として予め登録された位置に該当するか否かを判断する。学習を停止するべき位置としては、例えば、ユーザの自宅、会議室等が挙げられる。
ユーザは、学習を停止するべき位置を予め登録しておくことができる。また、ロボット1が、過去のデータに基づき、学習を停止するべき場所を推論し、推論した場所を登録することができる。例えば、ロボット1は、学習停止のきっかけが過去に認識された場所を、学習を停止するべき場所として推論することができる。
ステップ28では、学習停止の状態を開始する。この時点以降、前記会話処理における前記ステップ16では、肯定判断がなされ、前記ステップ18での学習が行われない。
一方、前記ステップ25で肯定判断された場合はステップ29にて、前記ステップ23で取得した画像、又は前記ステップ24で取得した音声に、学習を再開するきっかけとなるものがあるか否かを判断する。学習再開のきっかけとしては、例えば、以下のものが挙げられる。
・前記ステップ23で取得した画像において、学習再開を指示する動作として予め設定された動作が認識されること。その動作として、例えば、図6Bに示すように、親指と人差し指とで輪を作る(いわゆるOKを示す)動作が挙げられる。
・前記ステップ24で取得した音声において、学習再開を指示するキーワードとして予め設定された音声が認識されること。そのキーワードとして、例えば、「OK」、「再開」、「学習」等が挙げられる。
学習再開のきっかけがある場合はステップ30に進み、学習再開のきっかけがない場合は本処理を終了する。
ステップ30では、学習を再開する。この時点以降、前記会話処理における前記ステップ16では否定判断がなされ、前記ステップ18の学習が行われる。
(2−4)スケジュール管理処理
ロボット1は、以下に示すスケジュール管理処理を実行することができる。ユーザは予め自らのスケジュール情報を、ロボット1に入力しておく。スケジュール情報の入力は、例えば、タッチパネル9を用いて行ってもよいし、音声入力により行ってもよい。また、端末33からスケジュール情報を通信ユニット26に送信してもよい。
スケジュール情報は、少なくとも、期日と、その期日までに実行すべき事項とを含む。ロボット1は、期日よりも所定時間(例えば、1日、3時間)前の時点で、マイク5により取得した音声、カメラ7により取得した画像、端末33から取得した情報等に基づき、ユーザがスケジュール情報に含まれる事項を実行済みであるか否かを判断し、未だ実行していない場合は、スピーカ15の音声、又はディスプレイ19に表示する画像により、ユーザに警告する。
3.ロボット1が奏する効果
(1A)ロボット1は、AI用プログラムを、学習により変化、発展させることができる。また、ロボット1は、データセット(例えば辞書データ)の内容を、学習により強化することができる。そして、ロボット1は、学習後のAI用プログラム及びデータセットを、クラウドネットワーク31にアップロードすることができる。また、ロボット1は、クラウドネットワーク31にアップロードされたAI用プログラム及びデータセットを、インストールすることができる。
学習後のAI用プログラム及びデータセットをインストールするロボット1は、過去に学習を行ったロボット1と同じであっても、異なっていてもよい。また、学習後のAI用プログラム及びデータセットをインストールするロボット1は、過去に学習を行った場所にあるものであってもよいし、異なる場所にあるものであってもよい。
よって、ユーザは、過去の自らの使用よって学習したAI用プログラム及びデータセットを、ユーザがその時点でいる場所(例えば、職場、店舗、自宅等様々な場所)のロボット1に、クラウドネットワーク31からインストールし、ロボット1を使用することができる。
(1B)ロボット1は、ユーザの識別情報が入力されることを条件として、その識別情報に対応するAI用プログラム及びデータセットのインストールを許容する。そのため、あるユーザのAI用プログラム及びデータセットを、他人が勝手に使用してしまうことを抑制できる。
(1C)ロボット1は、人の音声を認識し、それに対する回答の音声を発音することができる。すなわち、ロボット1は人と会話をすることができる。また、ロボット1は、AI用プログラムを使用している場合、音声の認識結果に基づき学習を行い、その学習結果を用いて回答の音声を作成するので、学習が進むほど、より高度な会話を行うことができる。
(1D)ロボット1は、その周囲にいる人の動作や、人の識別結果等に応じて、学習を停止する。そのため、ユーザにとって望ましくない事項をロボット1が学習し、後に他人に話してしまうことを抑制できる。
(1E)ロボット1は、それが存在する場所に応じて、学習を停止する。そのため、学習してほしくない場所で学習した事項を、ロボット1が後に他人に話してしまうことを抑制できる。
(1F)ロボット1は、その周囲にいる人の動作等に応じて、学習を再開する。そのため、ロボット1の学習を促進することができる。
(1G)ロボット1は、学習制限内容に該当する事項を学習しない。そのため、ユーザにとって望ましくない事項をロボット1が学習し、後に他人に話してしまうことを抑制できる。
(1H)ロボット1は、ユーザのスケジュール管理を行うことができる。
(1I)ロボット1は、ロボット1の使用終了条件が充足された場合、AI用プログラム及びデータセットを消去する。そのため、ユーザは、自分のAI用プログラム及びデータセットを後で他人が使用することを抑制できる。
<第2の実施形態>
1.コンピュータ101の構成
コンピュータ101の構成を図7、図8に基づき説明する。コンピュータ101の電気的構成は、前記第1の実施形態におけるロボット1と基本的に同じである。ただし、コンピュータ101における入力ユニット21は、外部のマイク5、カメラ7、キーボード63、マウス65、タッチパネル9と接続している。また、出力ユニット29は、外部のスピーカ15、及びディスプレイ19と接続している。
コンピュータ101は、図8に示すように、箱型の筐体67を備え、その内部に各構成を収容している。また、コンピュータ101は、外部の機器(例えば、マイク5、カメラ7、キーボード63、マウス65、タッチパネル9、スピーカ15、ディスプレイ19等)を接続可能な端子69を複数備えている。なお、コンピュータ101は広義でのロボットである。
2.コンピュータ101が実行する処理
コンピュータ101は、前記第1の実施形態のロボット1と同様に、プログラム設定処理、会話処理、学習停止判断処理、及びスケジュール管理処理を実行する。また、コンピュータ101は、周知のコンピュータと同様の機能を有する。
3.コンピュータ101が奏する効果
コンピュータ101は、前記(1A)〜(1I)の効果を奏する。
<第3の実施形態>
1.車載機201の構成
車載機201の構成を図9に基づき説明する。車載機201は車両に搭載される。車載機201の電気的構成は、前記第2の実施形態におけるコンピュータ101と基本的に同じである。ただし、車載機201における入力ユニット21は、車両に設けられたマイク5、カメラ7、タッチパネル9、センサ群11、及びGPS13と接続している。
マイク5は車両の車室内に設けられ、車両の乗員(ドライバ、又は他の乗員)の声を検出する。カメラ7は乗員を撮影する。タッチパネル9は車両の車室内に設けられ、乗員により操作される。センサ群11は、ドライバの運転操作(操舵角、アクセルの踏み込み量、ブレーキの踏み込み量、シフト位置等)と、車両の状態(速度、加速度、ヨーレート、パワーユニット(内燃機関、モータ等)の状態、燃料の残量、バッテリーの残量等)とを検出する。
また、出力ユニット29は、スピーカ15、ディスプレイ19、及び車両制御部71と接続している。スピーカ15及びディスプレイ19は車両の車室内に設けられている。車両制御部71は、車両に関する様々な制御(例えば、操舵、加速、減速、シフトチェンジ等)を行う。なお、車載機201は広義でのロボットである。
2.車載機201が実行する処理
(2−1)ロボット1と同様の処理
車載機201は、前記第1の実施形態のロボット1と同様に、プログラム設定処理、会話処理、学習停止判断処理、及びスケジュール管理処理を実行する。
(2−2)車両制御処理
車載機201の制御ユニット3は、図10に示す車両制御処理を所定時間ごとに繰り返し実行する。この処理は、マイク5が所定の閾値以上の音量を検出したときに実行される。
ステップ31では、マイク5を用いて音声を取得する。ステップ32では、周知の音声認識技術により、前記ステップ31で取得した音声から、車両に対する指示(例えば、発進、停止、減速、加速、右左折、レーンチェンジ、シフトチェンジ等)を認識する。このとき、標準プログラムを使用している場合は、車載機201が予め備えている標準辞書データを用いて上記の指示を認識する。また、AI用プログラムを使用している場合は、AI用プログラムとともにクラウドネットワーク31からインストールされ、過去の学習によって強化された辞書データを用いて上記の指示を認識する。
ステップ33では、前記ステップ32で認識した、車両対する指示に応じて、車両の制御内容を決定する。例えば、車両に対する指示が発進である場合、ブレーキを解除するタイミング、エンジン回転数の増加量及び増加速度等を決定する。このとき、標準プログラムを使用している場合は、標準プログラムを用いて車両の制御内容を決定する。また、AI用プログラムを使用している場合は、過去の学習によって進化したAI用プログラムを用いて制御内容を決定する。
ステップ34では、前記ステップ33で決定した制御内容を車両制御部71に出力する。なお、車両制御部71は、その制御内容に従って車両を制御する。
ステップ35では、その時点でAI用プログラムを使用中であるか否かを判断する。AI用プログラムを使用中である場合はステップ36に進み、標準プログラムを使用中である場合は本処理を終了する。
ステップ36では、センサ群11から、車両の状態に関する検出結果を取得する。
ステップ37では、前記ステップ34で出力した制御内容と、前記ステップ36で取得したセンサ出力とに基づき学習を行う。その学習は、前記ステップ36で取得したセンサ出力が予め設定された最適範囲となるように、制御内容を修正するものである。
例えば、前記ステップ34で出力した制御内容が発進であった場合、発進の過程におけるセンサ出力(例えば、速度、加速度等のセンサ出力)が最適範囲であったか否かを確認し、最適範囲から外れていたならば、次回以降の発進時におけるセンサ出力が最適範囲に近づくように、発進の制御内容を修正する。
ステップ38では、前記ステップ37での学習結果を反映するように、AI用プログラムを更新する。
3.車載機201が奏する効果
車載機201は、前記(1A)〜(1I)の効果を奏する。さらに、車載機201は次の効果も奏する。
(3A)車載機201は、人の音声を認識し、それに対応する車両制御を行うことができる。また、車載機201は、AI用プログラムを使用している場合、車両制御部71に出力した車両制御の内容と、車両の状態を表すセンサ出力とに基づき学習を行うので、学習が進むほど、より高度な車両制御を行うことができる。
(3B)車載機201は、車両制御処理に関し、AI用プログラムを、学習により変化、発展させることができる。また、車載機201は、クラウドネットワーク31にアップロードされたAI用プログラムを、インストールすることができる。
学習後のAI用プログラムをインストールする車載機201は、過去に学習を行った車載機201と同じであっても、異なっていてもよい。
よって、ユーザは、過去の自らの使用よって学習したAI用プログラムを、任意の車両の車載機201に、クラウドネットワーク31からインストールし、使用することができる。
<第4の実施形態>
1.ロボット301の構成
本実施形態のロボット301の構成は、基本的には前記第1の実施形態のロボット1と同様である。以下では、第1の実施形態との相違点を中心に説明する。ロボット301は、図11に示すように、第1の人工知能ユニット73と、第2の人工知能ユニット75とを備えている。
第1の人工知能ユニット73は、ロボット301の各種動作を実行するためのAI用プログラム及びデータセットを記憶している。以下では、このプログラムを第1のAI用プログラムとし、このデータセットを第1のデータセットとする。
第1人工知能ユニット73は、第1のAI用プログラム及び第1のデータセットを学習により変化、発展させる。第1の人工知能ユニット73が行う学習は、後述する学習停止、及び学習制限に影響されない。また、第1のAI用プログラム及び第1のデータセットは、クラウドネットワーク31にアップロードされることはない。
第2の人工知能ユニット75は、AI用プログラム及びデータセットを記憶可能である。以下では、このプログラムを第2のAI用プログラムとし、このデータセットを第2のデータセットとする。
第2のAI用プログラムは、基本的には第1のAI用プログラムと同様であるが、ロボット301の各種動作を実行するためには使用されない。第2人工知能ユニット75は、第2のAI用プログラム及び第2のデータセットを学習により変化、発展させる。第2のAI用プログラム及び第2のデータセットは、学習結果を蓄積し、クラウドネットワーク31にアップロードされる。そのことにより、学習結果をクラウドネットワーク31に記憶することができる。
ただし、第2の人工知能ユニット75が行う学習は、後述する学習停止、及び学習制限により制限される。そのため、第2のAI用プログラム及び第2のデータセットのアップロードによってクラウドネットワーク31に記憶される学習結果は制限される。
第2のAI用プログラム及び第2のデータセットは、クラウドネットワーク31から第2の人工知能ユニット75にダウンロードすることが可能である。そして、ダウンロードされた第2のAI用プログラム及び第2のデータセットに基づき、第1のAI用プログラム及び第1のデータセットの学習を行うことができる。詳しくは後述する。
2.ロボット301が実行する処理
(2−1)プログラムインストール処理
制御ユニット3は、ロボット301の電源がオンになったとき、図12に示すプログラムインストール処理を実行する。
ステップ41では、ユーザの識別情報が入力されたか否かを判断する。識別情報は、前記第1の実施形態と同様のものとすることができる。識別情報が入力された場合はステップ42に進み、識別情報が入力されなかった場合は本処理を終了する。
ステップ42では、前記ステップ41で入力されたと判断された識別情報に対応する第2のAI用プログラム及び第2のデータセットを、クラウドネットワーク31からインストールする。インストールした第2のAI用プログラム及び第2のデータセットは、第2の人工知能ユニット75に記憶する。第2の人工知能ユニット75に既に第2のAI用プログラム及び第2のデータセットが記憶されていた場合は上書きする。
ステップ43では、前記ステップ42でインストールした第2のAI用プログラム及び第2のデータセットには含まれているが、第1のAI用プログラム及び第1のデータセットには記憶されていない内容を学習する。
ステップ44では、第1のAI用プログラム及び第1のデータセットに、前記ステップ43で学習した内容を加え、更新する。すなわち、ダウンロードされた第2のAI用プログラム及び第2のデータセットに基づき、第1のAI用プログラム及び第1のデータセットの学習を行う。
(2−2)会話処理
制御ユニット3は、図13に示す会話処理を実行する。この処理は、マイク5が所定の閾値以上の音量を検出したときに実行される。会話処理は、第1の人工知能ユニット73に記憶されている第1のAI用プログラム及び第1のデータセットを用いて行われる。
ステップ51〜54の処理は、前記第1の実施形態におけるステップ11〜14の処理と同様である。
ステップ55では、第1の人工知能ユニット73が、前記ステップ52で認識した音声の内容について学習を行う。学習の内容は、前記第1の実施形態と同様である。
ステップ56では、前記ステップ55での学習結果を反映するように、第1のAI用プログラム及び第1のデータセットを更新する。
ステップ57では、第2の人工知能ユニット75がその時点で学習停止中であるか否かを判断する。なお、第2の人工知能ユニット75の学習停止は、後述する、第2の人工知能ユニット学習停止判断処理により設定される。第2の人工知能ユニット75が学習停止中ではない場合はステップ58に進み、学習停止中である場合は本処理を終了する。
ステップ58では、その時点で設定されている学習制限内容を取得する。学習制限内容としては、例えば、ユーザ(前記ステップ41で入力されたと判断された識別情報に対応するユーザ)の家族、知人に関する情報(名前、住所、電話番号、メールアドレス、経歴、顔を含む画像)等である。
ステップ59では、第2の人工知能ユニット75が、前記ステップ52で認識した音声の内容について学習を行う。学習の内容は、前記第1の実施形態と同様である。ただし、前記ステップ52で認識した音声の内容であっても、前記ステップ58で取得した学習制限内容に該当する事項は、学習しないようにする。
ステップ60では、前記ステップ59での学習結果を反映するように、第2のAI用プログラム及び第2のデータセットを更新する。
(2−3)第2の人工知能ユニット学習停止判断処理
制御ユニット3は、図14に示す第2の人工知能ユニット学習停止判断処理を所定時間ごとに繰り返し実行する。
ステップ71では、GPS13を用いてロボット301の位置情報を取得する。
ステップ72では、カメラ7を用いて、ロボット301の周囲を撮像した画像を取得する。
ステップ73では、マイク5を用いて、音声を取得する。
ステップ74では、第2の人工知能ユニット75がその時点で学習停止中であるか否かを判断する。なお、学習停止の状態は、後述するステップ77において開始され、後述するステップ79において学習を再開したときに終了する。学習停止中ではない場合はステップ75に進み、学習停止中である場合はステップ78に進む。
ステップ75では、前記ステップ72で取得した画像、又は前記ステップ73で取得した音声に、学習停止のきっかけとなるものがあるか否かを判断する。学習停止のきっかけは、前記第1の実施形態と同様である。学習停止のきっかけがある場合はステップ77に進み、学習停止のきっかけがない場合はステップ76に進む。
ステップ76では、前記ステップ71で取得した位置情報が、学習を停止するべき位置として予め登録された位置に該当するか否かを判断する。学習を停止するべき位置は、前記第1の実施形態と同様である。
ステップ77では、第2の人工知能ユニット75について学習停止の状態を開始する。この時点以降、前記会話処理における前記ステップ57では、肯定判断がなされ、前記ステップ59での学習が行われない。
一方、前記ステップ74で肯定判断された場合はステップ78にて、前記ステップ72で取得した画像、又は前記ステップ73で取得した音声に、学習を再開するきっかけとなるものがあるか否かを判断する。学習再開のきっかけは、前記第1の実施形態と同様である。学習再開のきっかけがある場合はステップ79に進み、学習再開のきっかけがない場合は本処理を終了する。
ステップ79では、第2の人工知能ユニット75における学習を再開する。この時点以降、前記会話処理における前記ステップ57では否定判断がなされ、前記ステップ59の学習が行われる。
(2−4)プログラムアップロード処理
制御ユニット3は、図15に示すプログラムアップロード処理を所定時間ごとに繰り返し実行する。
ステップ81では、ロボット301の使用終了条件が充足されたか否かを判断する。使用終了条件は、前記第1の実施形態の前記ステップ5で判断するものと同様である。使用終了条件が充足された場合はステップ82に進み、使用終了条件が充足されない場合は本処理を終了する。
ステップ82では、第2のAI用プログラム及び第2のデータセットを、クラウドネットワーク31にアップロードする。このとき、ユーザの識別情報と対応付けてアップロードする。なお、前述した学習が行われた場合、アップロードする第2のAI用プログラム及び第2のデータセットは、学習後のものである。
3.ロボット301が奏する効果
ロボット301は、前記(1B)、(1C)、(1F)、(1H)の効果を奏する。さらに、ロボット301は、次の効果も奏する。
(4A)ロボット301は、第1のAI用プログラム及び第1のデータセットを、学習により変化、発展させることができる。さらに、第1のAI用プログラム及び第1のデータセットにおける学習は、学習停止の処理、及び学習制限の処理に影響されない。
また、第1のAI用プログラム及び第1のデータセットはクラウドネットワーク31にアップロードされないので、その内容が他人に知られることを抑制できる。
(4B)ロボット301は、学習後の第2のAI用プログラム及び第2のデータセットを、クラウドネットワーク31にアップロードすることができる。また、ロボット301は、第2のAI用プログラム及び第2のデータセットをクラウドネットワーク31からインストールすることができる。
学習後の第2のAI用プログラム及び第2のデータセットをインストールするロボット301は、過去に学習を行ったロボット301と同じであっても、異なっていてもよい。また、学習後の第2のAI用プログラム及び第2のデータセットをインストールするロボット301は、過去に学習を行った場所にあるものであってもよいし、異なる場所にあるものであってもよい。
よって、ユーザは、過去の自らの使用よって学習した第2のAI用プログラム及び第2のデータセットを、ユーザがその時点でいる場所(例えば、職場、店舗、自宅等様々な場所)のロボット301に、クラウドネットワーク31からインストールすることができる。そして、第2のAI用プログラム及び第2データセットを用いて学習を行い、第1のAI用プログラム及び第1のデータセットを変化、発展させることができる。
(4C)ロボット301は、クラウドネットワーク31にアップロードされる第2のAI用プログラム及び第2のデータセットついて、学習を制限する。すなわち、ロボット301は、その周囲にいる人の動作や、人の識別結果等に応じて、第2のAI用プログラム及び第2のデータセットについての学習を停止する。また、ロボット301は、それが存在する場所に応じて、第2のAI用プログラム及び第2のデータセットにおける学習を停止する。また、ロボット301は、学習制限内容に該当する事項を、第2のAI用プログラム及び第2のデータセットに含ませない。
そのため、ユーザが他人に知られたくない事項を含む第2のAI用プログラム及び第2のデータセットが、クラウドネットワーク31にアップロードされることを抑制できる。
<第5の実施形態>
1.ロボット401の構成
本実施形態のロボット401の構成は、基本的には前記第1の実施形態のロボット1と同様である。以下では、第1の実施形態との相違点を中心に説明する。ロボット401は、図16に示すように、通信ユニット26を用いてインターネット77と接続することができる。インターネット77はネットワークの一例である。また、ロボット401は車両内に置くことができる。この場合、ロボット401は、後述する会話等処理により、車両の乗員と会話することができる。
2.ロボット401が実行する処理
(2−1)ロボット1と同様の処理
ロボット401は、前記第1の実施形態のロボット1と同様に、プログラム設定処理、学習停止判断処理、及びスケジュール管理処理を実行する。
(2−2)会話等処理
ロボット401の制御ユニット3は、図17に示す会話等処理を所定時間ごとに繰り返し実行する。この処理は、マイク5が所定の閾値以上の音量を検出したときに実行される。
ステップ91、92の処理は、それぞれ、前記第1の実施形態におけるステップ11、12の処理と同様である。
ステップ93では、前記ステップ92で認識した音声の内容に関連する情報を、通信ユニット26を用い、インターネット77において検索し、取得する。例えば、前記ステップ92で認識した音声の内容からキーワードを抽出し、そのキーワードに予め関連付けられた事項を含む情報を検索する。検索の対象としては、例えば、SNS(ソーシャルネットワーキングサービス)、ブログ、電子掲示板等が挙げられる。また、前記ステップ92で認識した音声の内容が質問である場合、その質問に対する回答を検索する。検索の方法としては、例えば、公知の検索エンジンを用いることができる。
ステップ94では、前記ステップ92で認識した音声の内容に対し、基本的には前記第1の実施形態におけるステップ13と同様に、回答音声データを作成する。ただし、本ステップでは、前記ステップ93で取得した情報も用いて、回答音声データを作成する。前記ステップ93で取得した情報を用いるとは、例えば、その情報を音声化したものを、回答音声データに含めることである。
ステップ95では、後述するステップ96で発音するときの音声の種類を、前記ステップ94で作成した回答の内容に応じて決定する。音声の種類としては、例えば、男性の声、女性の声、大人の声、子供の声等が挙げられる。
音声の種類は、具体的には、以下のようにして決定する。まず、制御ユニット3は、前記ステップ94で作成した回答の内容から、特徴(例えば、男性に特有の特徴、女性に特有の特徴、大人に特有の特徴、子供に特有の特徴等)を抽出する。
制御ユニット3は、回答の内容における特徴と、音声の種類とを対応付けたマップを予め備えている。制御ユニット3は、上記のように抽出した特徴をそのマップに入力することで、抽出した特徴に対応した音声の種類を決定する。
例えば、前記ステップ94で作成した回答の内容から、男性に特有の特徴と大人に特有の特徴とが抽出されれば、制御ユニット3は、大人の男性の音声を決定する。
ステップ96では、前記ステップ94で作成した回答音声データに基づき、スピーカ15を用いて発音する。このとき、前記ステップ95で設定した種類の音声を用いて発音する。
ステップ97では、まず、前記ステップ92で認識した音声の内容、又は、前記ステップ94で作成した回答の内容に対応する感情(例えば、喜び、怒り、悲しみ、平静等)を取得する。この感情の取得は以下のように行う。
制御ユニット3は、音声の内容や回答の内容に現れる特徴と、感情とを対応付けたマップを予め備えている。音声の内容に現れる特徴としては、例えば、音量、音声の抑揚、音程の高低等が挙げられる。また、回答の内容に現れる特徴としては、例えば、回答の内容に含まれる、感情を反映した語句、感情を反映した言い回し等が挙げられる。
制御ユニット3は、前記ステップ92で認識した音声の内容、又は、前記ステップ94で作成した回答から抽出した特徴を前記マップに入力することにより、対応する感情を取得する。
次に、制御ユニット3は、取得した感情を表現する人又はキャラクタの顔画像を作成し、ディスプレイ19に表示する。例えば、取得した感情が喜びである場合、笑顔の人又はキャラクタの顔画像をディスプレイ19に表示する。また、取得した感情が悲しみである場合、泣き顔の人又はキャラクタの顔画像をディスプレイ19に表示する。
ステップ98〜102の処理は、それぞれ、前記第1の実施形態におけるステップ15〜19の処理と同様である。
3.ロボット401が奏する効果
ロボット401は、前記(1A)〜(1I)の効果を奏する。さらに、ロボット401は次の効果も奏する。
(5A)ロボット401は、音声の内容に関連する情報を、インターネット77において検索し、取得することができる。そして、ロボット401は、そのように取得した情報も用いて、回答音声データを作成する。そのことにより、より適切な回答音声データを作成することができる。
(5B)ロボット401は、回答の内容に応じて音声の種類を決定することができる。そのため、ユーザは、回答の内容と、それを発音する音声の種類との不調和を感じにくい。
(5C)ロボット401は、認識した音声の内容、又は、回答の内容に対応する感情を取得し、取得した感情を表現する人又はキャラクタの顔画像をディスプレイ19に表示する。そのことにより、ユーザは、ロボット401をあたかも人間のように感じることができる。
<第6の実施形態>
1.ロボット501の構成
本実施形態のロボット501の構成は、基本的には前記第1の実施形態のロボット1と同様である。
2.ロボット501が実行する処理
(2−1)ロボット1と同様の処理
ロボット501は、前記第1の実施形態のロボット1と同様に、プログラム設定処理、会話処理、学習停止判断処理、及びスケジュール管理処理を実行する。
(2−2)通話処理
図18に示すように、複数のロボット501は、ユーザ79とユーザ81との間の通話を可能にする。例えば、ユーザ79側のロボット501(以下ではロボット501Aとする)は、ユーザ79が発音した音声をマイク5で取得する。また、ロボット501Aは、ユーザ79による、通話相手のロボット501(以下ではロボット501Bとする)を指定する入力を、タッチパネル9を用いて受け付ける。
ロボット501Aは、ユーザ79が発音した音声を変換した信号(以下では音声変換信号とする)と、ロボット501Aの識別信号と、ユーザ79により指定された通話相手のロボット501Bの識別信号とを、通信ユニット26を用いてホストコンピュータ83に送信する。
ホストコンピュータ83は、受信したロボット501Aの識別信号と、通話相手のロボット501Bの識別信号とが、通話ペアとして設定されているか否かを判断する。通話ペアとして設定されていれば、音声変換信号を、通話相手のロボット501Bに転送する。なお、通話ペアの設定については後述する。
ロボット501Bは、通信ユニット26を用いて、転送された音声変換信号を受信し、その音声変換信号に基づき、スピーカ15を用いて発音する。以上の処理により、ユーザ79が発音した音声が、ロボット501B側のユーザ81に伝えられる。また、ロボット501Bは、音声を発音することに加えて、その音声を文字に変換し、その文字をディスプレイ19に表示する。
また、ロボット501Bが上述したロボット501Aの処理を行い、ロボット501Aが上述したロボット501Bの処理を行うことで、ユーザ81が発音した音声を、ユーザ79に伝えることもできる。
一方、ホストコンピュータ83は、受信したロボット501Aの識別信号と、通話相手のロボット501Bの識別信号とが、通話ペアとして設定されてなければ、上記の音声変換信号の転送を行わない。
(2−3)通話ペア設定処理
次に、ホストコンピュータ83が上記の通話ペアを設定する処理を、図19に基づき説明する。
ステップ111では、通話ペアの設定要求を新たに受信したか否かを判断する。通話ペアの設定要求とは、ロボット501Aがホストコンピュータ83に送信する要求である。通話ペアの設定要求には、要求の送信元であるロボット501Aの識別信号と、そのロボット501A側のユーザ79の特徴(例えば、趣味、衣食住の好み、関心を持つ事項等)と、ユーザ79の顔写真の画像データとが含まれる。
通話ペアの設定要求は、ユーザの指示に応じてロボット501Aが送信してもよいし、ロボット501Aが自動的に送信してもよい。通話ペアの設定要求をホストコンピュータ83が新たに受信した場合はステップ112に進み、受信しなかった場合は本処理を終了する。
ステップ112では、前記ステップ111で受信したと判断した通話ペアの設定要求(以下では、新たな設定要求とする)に含まれるユーザ79の特徴を、設定待ちリストにおいて検索する。ここで、設定待ちリストとは、過去にいずれかのロボット501から受信した、通話ペアの設定要求(以下では、過去の設定要求とする)のリストである。
ステップ113では、前記ステップ112での検索の結果、新たな設定要求に含まれるユーザ79の特徴と一致する特徴を有する、過去の設定要求が発見されたか否かを判断する。そのような過去の設定要求が発見された場合はステップ114に進み、発見されなかった場合はステップ116に進む。
ステップ114では、前記ステップ113で発見された、過去の設定要求の送信元であるロボット501Bと、新たな設定要求の送信元であるロボット501Aとを、通話ペアとして設定する。
ステップ115では、通話ペアとして設定されたロボット501A、501Bのそれぞれに、相手のロボット501に関する情報を通知する。すなわち、ロボット501Aにはロボット501Bに関する情報を通知し、ロボット501Bにはロボット501Aに関する情報を通知する。通知する情報には、相手のロボット501の識別信号、対応するユーザの顔写真の画像データ等が含まれる。
一方、前記ステップ113で否定判断された場合はステップ116にて、新たな設定要求を設定待ちリストに追加する。これ以降、新たな設定要求は、過去の設定要求のリストにおける一部となる。
なお、相手側のロボット501に関する情報を通知されたロボット501は、その情報を用いて、通話ペアの相手を表すアイコン85を作成し、図20に示すように、ディスプレイ19に表示する。アイコン85は、通話ペアの相手側のユーザの顔写真を含む。ロボット501は、複数のアイコン85をディスプレイ19に表示することができる。
ロボット501は、特定のアイコン85がユーザによってタッチされたとき、そのアイコン85に対応するユーザを通話相手として認識する。そして、ロボット501は、音声変換信号を上記のようにホストコンピュータ83に送信するとき、タッチしたアイコン85に対応するロボット501の識別信号を、ホストコンピュータ83に送信する。
(2−4)その他の処理
ホストコンピュータ83は、前記(2−2)の通話処理のとき、ロボット501Aが送信した音声変換信号の内容を分析する。その分析結果が予め設定された禁止事項(例えば犯罪に関する事項等)に該当する場合、通話処理を開始しないようにしたり、通話処理を途中で終了したりする。そのため、ホストコンピュータ83は、通話処理が犯罪等に利用されることを抑制できる。
また、前記(2−2)の通話処理のとき、ロボット501Bは、他のコンピュータ501Aから送信された音声も用いて学習を行う。そのため、学習を一層効率的に行うことができる。
また、前記(2−2)の通話処理において、ユーザ79の発音が所定時間以上途絶えたとき、又は、ユーザ79が指示したとき、ロボット501Aは、自らが作成した音声変換信号をホストコンピュータ83に送信する。この場合、ロボット501Aと、ユーザ81とが通話することになる。コンピュータ501Aは、過去の通話処理により得られた学習結果を用いて音声変換信号を作成することができる。また、ロボット501Aは、過去の通話においてロボット501A又はロボット501Bが発音した音声(例えば、相槌等)を記憶しておき、その音声に対応する音声変換信号を作成してもよい。
3.ロボット501が奏する効果
ロボット501は、前記(1A)〜(1I)の効果を奏する。さらに、ロボット501は次の効果も奏する。
(6A)ロボット501A側のユーザ79と、ロボット501B側のユーザ81とは、通話を行うことができる。
(6B)ユーザ79とユーザ81との通話は、ロボット501Aとロボット501Bとが通話ペアとして設定されていることが前提になる。通話ペアは、ユーザ79とユーザ81との特徴が一致する場合に設定される。よって、ロボット501は、特徴が一致するユーザ同士の通話を選択的に可能にする。
(6C)ロボット501は通話相手のユーザの顔写真を含むアイコン85を作成し、ディスプレイ19に表示する。ユーザは、アイコン85をタッチすることで、容易に通話相手を選択することができる。また、アイコン85は通話相手の顔写真を含んでいるので、ユーザは、どのアイコン85がどの通話相手に対応しているのかを容易に理解することができる。
<その他の実施形態>
(1)前記第1〜第6の実施形態において、ロボット1、301、401、501、コンピュータ101、車載機201は、状況に応じて学習制限内容を増減してもよい。例えば、当初は学習制限内容に属していた事項が、複数の人物によって話されたと認識した場合、その事項を学習制限内容から除外してもよい。
(2)前記第1〜第6の実施形態において、ロボット1、301、401、501、コンピュータ101、車載機201は、マイク5により音声を取得したとき、その音声の声色を判断し、その判断結果に応じて、音声の内容を学習するか否かを決めてもよい。
(3)前記第1〜第6の実施形態において、音声の認識結果に応じて行う処理は、回答音声データの作成(前記ステップ13)、車両の制御内容決定(前記ステップ33)以外のものであってもよい。例えば、音声の認識結果に応じて、ロボット1、301、401、501を移動させたり、コンピュータ101に接続した外部装置を操作したりしてもよい。また、音声の認識結果に応じて、例えば、所定の動作(例えば、箱の開閉、窓の開閉、鍵の施錠又は開錠、家電製品の操作等)を行ってもよい。
(4)前記第1〜第6の実施形態において、AI用プログラム及びデータセットを記憶するものは、クラウドネットワーク31以外のものであってもよい。例えば、周知のサーバ、記憶媒体等に記憶してもよい。
(5)前記第3の実施形態において、車載機201は、車両以外の移動体(例えば、鉄道車両、航空機、船舶等)に搭載され、それらを制御するものであってもよい。
(6)前記第1、第4〜6の実施形態において、ロボット1、301、401、501の形態は人型でなくてもよい。例えば、動物、魚、想像上キャラクタ等の形態であってもよい。
(7)前記第1〜第3、第5、第6の実施形態において、ロボット1、401、501、コンピュータ101、車載機201は、標準プログラムと、AI用プログラムとを同時に使用してもよい。この場合、標準プログラムにより基本的な処理を実行するとともに、AI用プログラムにより、学習の結果得られた付加的な処理を実行することができる。
(8)前記第1〜第6の実施形態において、ロボット1、301、401、501、コンピュータ101、車載機201の形態は、家電製品(例えば、テレビ、冷蔵庫、エアコン、掃除機、洗濯機等)、携帯端末(例えば、携帯電話(スマートフォンを含む)、メガネ型端末、腕時計型端末)等であってもよい。
(9)前記第1〜第6の実施形態において、ロボット1、301、401、501、コンピュータ101、車載機201は、カメラ7を用いて自動的に画像を取得し、取得した画像をネットワーク上に送信する機能を有していてもよい。送信先としては、サーバ、端末、車両、他のロボット等が挙げられる。送信する画像は、カメラ7を用いて取得した画像そのものであってもよいし、カメラ7を用いて取得した画像から抽出した一部(例えば、人の顔、人の全身、車両、車両のナンバープレート等)の画像であってもよい。
上記の機能を有するロボット1、301、401、501、コンピュータ101、車載機201は、防犯の用途、他のロボットの監視の用途等に使用することができる。上記の機能を有するロボット1、301、401、501、コンピュータ101、車載機201は、例えば、室内、路上、特定の施設(例えば、住居、マンション、オフィス、駐車場等)の入口、他のロボットの近傍等に設置することができる。
また、上記の機能を有するロボット1、301、401、501、コンピュータ101、車載機201は、空中を飛行する機能を持つか、飛行物に搭載することができる。その場合、上空の視点から撮影した地上の画像をネットワーク上で送信することができる。この場合、ロボット1、301、401、501、コンピュータ101、車載機201は、撮影した画像において道路の白線を認識し、その白線に沿って移動することができる。また、ロボット1、301、401、501、コンピュータ101、車載機201は、上空の視点から撮影した地上の画像において信号機を認識し、その表示内容(赤信号、青信号等)を、地上の車両に送信することができる。
(10)前記第1〜第6の実施形態において、ロボット1、301、401、501、コンピュータ101、車載機201は、カメラ7を用いて人の行動を認識し、その認識結果に予め関連付けられた音声を出力してもよい。
例えば、ガスの火をつけたまま人が台所を離れるという行動を認識した場合、その人に対する警告の音声を出力することができる。また、人が所定の物を探す行動を認識した場合、その物の場所を探し、物のありかを音声で知らせることができる。また、人が住宅の入口から室内に入るという行動を認識したとき、「おかえりなさい」という音声を出力することができる。人の行動と、それに関連付けられた音声とは、学習により増加させることができる。
上記のように音声を発する場合、その音声の種類は、そのときの状況と、音声の内容とに関連付けられたものとすることができる。例えば、画像において父親を認識した場合、「おかえりなさい」という音声の種類は、その子供の声とすることができる。
(11)前記第1〜第6の実施形態において、制御ユニットは、マイクロコンピュータを備えているが、個別の電子回路の組合せであってもよいし、AISIC(Application Specified Integrated Circuit)であってもよいし、FPGA(Field Programmable Gate Array)などのプログラマブル・ロジック・デバイスあるいはこれらの組合せであってもよい。
(12)前記第1〜第6の実施形態の構成の一部又は全部を適宜組み合わせてもよい。例えば、前記第4〜第6の実施形態の構成を、前記第2、第3の実施形態に適用してもよい。

Claims (2)

  1. 音声認識を行う音声認識ユニット(23、25、27)と、
    前記音声認識ユニットの認識結果について学習する学習ユニット(25)と、
    前記音声認識ユニットの認識結果に対し、前記学習ユニットの学習結果を用いて、対応する処理を行う処理ユニット(23、25、27)と、
    前記学習結果を外部の記憶装置に記憶する記憶ユニット(26)と、
    前記学習結果を前記記憶装置から取得する学習結果取得ユニット(26)と、
    ユーザの手による特定の動作を認識する動作認識ユニットと、
    前記学習ユニットが学習しているときに、前記特定の動作を前記動作認識ユニットが認識した場合、前記学習ユニットの学習を停止する学習停止ユニットと、
    を備えるロボット(1、301)。
  2. 音声認識を行う音声認識ユニット(23、25、27)と、
    前記音声認識ユニットの認識結果について学習する学習ユニット(25)と、
    前記音声認識ユニットの認識結果に対し、前記学習ユニットの学習結果を用いて、対応する処理を行う処理ユニット(23、25、27)と、
    前記学習結果を外部の記憶装置に記憶する記憶ユニット(26)と、
    前記学習結果を前記記憶装置から取得する学習結果取得ユニット(26)と、
    ユーザの手による特定の動作を認識する動作認識ユニットと、
    前記学習ユニットが学習を停止しているときに、前記特定の動作を前記動作認識ユニットが認識した場合、前記学習ユニットの学習を開始する学習開始ユニットと、
    を備えるロボット(1、301)。
JP2016565988A 2014-12-25 2015-10-21 ロボット Active JP6544693B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2014262907 2014-12-25
JP2014262907 2014-12-25
PCT/JP2015/079730 WO2016103881A1 (ja) 2014-12-25 2015-10-21 ロボット

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2018236315A Division JP6744529B2 (ja) 2014-12-25 2018-12-18 車載機及び車両

Publications (2)

Publication Number Publication Date
JPWO2016103881A1 JPWO2016103881A1 (ja) 2017-10-05
JP6544693B2 true JP6544693B2 (ja) 2019-07-17

Family

ID=56149918

Family Applications (7)

Application Number Title Priority Date Filing Date
JP2016565988A Active JP6544693B2 (ja) 2014-12-25 2015-10-21 ロボット
JP2018236315A Active JP6744529B2 (ja) 2014-12-25 2018-12-18 車載機及び車両
JP2020105300A Active JP6994781B2 (ja) 2014-12-25 2020-06-18 車載機及び車両
JP2021115110A Active JP7122038B2 (ja) 2014-12-25 2021-07-12 車載機及び車両
JP2021197647A Active JP7251833B2 (ja) 2014-12-25 2021-12-06 ホストコンピュータ及びシステム
JP2023032952A Pending JP2023065621A (ja) 2014-12-25 2023-03-03 ロボット及び車両
JP2023038727A Pending JP2023072025A (ja) 2014-12-25 2023-03-13 ロボット

Family Applications After (6)

Application Number Title Priority Date Filing Date
JP2018236315A Active JP6744529B2 (ja) 2014-12-25 2018-12-18 車載機及び車両
JP2020105300A Active JP6994781B2 (ja) 2014-12-25 2020-06-18 車載機及び車両
JP2021115110A Active JP7122038B2 (ja) 2014-12-25 2021-07-12 車載機及び車両
JP2021197647A Active JP7251833B2 (ja) 2014-12-25 2021-12-06 ホストコンピュータ及びシステム
JP2023032952A Pending JP2023065621A (ja) 2014-12-25 2023-03-03 ロボット及び車両
JP2023038727A Pending JP2023072025A (ja) 2014-12-25 2023-03-13 ロボット

Country Status (2)

Country Link
JP (7) JP6544693B2 (ja)
WO (1) WO2016103881A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017191390A (ja) * 2016-04-12 2017-10-19 ロボットスタート株式会社 コミュニケーションシステム、会話ログ収集システム、サーバ及びコミュニケーション方法
JP6329331B1 (ja) * 2016-07-04 2018-05-23 株式会社Seltech 人工知能を有するシステム
CN106297782A (zh) * 2016-07-28 2017-01-04 北京智能管家科技有限公司 一种人机交互方法及系统
US10304463B2 (en) * 2016-10-03 2019-05-28 Google Llc Multi-user personalization at a voice interface device
CN107053191B (zh) * 2016-12-31 2020-05-08 华为技术有限公司 一种机器人,服务器及人机互动方法
WO2019064650A1 (ja) * 2017-09-28 2019-04-04 三菱自動車工業株式会社 車両用情報伝達支援システム
JP2021121877A (ja) * 2018-04-27 2021-08-26 ソニーグループ株式会社 情報処理装置および情報処理方法
CN109118860A (zh) * 2018-09-19 2019-01-01 江苏金惠甫山软件科技有限公司 基于人工智能的英语培训系统及方法
JP2020056907A (ja) * 2018-10-02 2020-04-09 株式会社Tarvo クラウド音声変換システム
JP7342419B2 (ja) * 2019-05-20 2023-09-12 カシオ計算機株式会社 ロボットの制御装置、ロボット、ロボットの制御方法及びプログラム
JP7151654B2 (ja) 2019-07-26 2022-10-12 トヨタ自動車株式会社 検索装置、学習装置、検索システム、検索プログラム、及び学習プログラム
JP2021144086A (ja) * 2020-03-10 2021-09-24 株式会社東海理化電機製作所 エージェントシステム、およびコンピュータプログラム

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL90277A0 (en) * 1989-05-12 1989-12-15 Shmuel Shapira System for locating compatible persons at a given locality
JP2522414B2 (ja) * 1989-10-19 1996-08-07 日本電気株式会社 サ―バ・クライアント間接続方式
JP4543444B2 (ja) 1999-02-24 2010-09-15 株式会社エクォス・リサーチ 車両制御装置
JP4000828B2 (ja) * 2001-11-06 2007-10-31 株式会社デンソー 情報システム、電子機器、プログラム
JP3945356B2 (ja) * 2002-09-17 2007-07-18 株式会社デンソー 音声対話装置及びプログラム
JP2004214895A (ja) 2002-12-27 2004-07-29 Toshiba Corp 通信補助装置
JP4343621B2 (ja) * 2003-08-22 2009-10-14 エヌ・ティ・ティ・コミュニケーションズ株式会社 ファイル管理システム、ファイル生成装置、ファイル取得装置、認証装置およびプログラム
US7308112B2 (en) * 2004-05-14 2007-12-11 Honda Motor Co., Ltd. Sign based human-machine interaction
JP2005345903A (ja) * 2004-06-04 2005-12-15 Honda Motor Co Ltd 音声による機器制御装置
JP2007034198A (ja) * 2005-07-29 2007-02-08 Denso Corp 音声認識システム及びそれに用いる携帯端末装置
JPWO2008007688A1 (ja) 2006-07-13 2009-12-10 日本電気株式会社 音声認識機能を有する通話端末、その音声認識辞書の更新支援装置及び更新方法
JP5170052B2 (ja) * 2009-09-30 2013-03-27 中部日本電気ソフトウェア株式会社 運転支援システム、サーバ装置、運転支援装置、および情報処理方法
JP2011085966A (ja) * 2009-10-13 2011-04-28 Sony Corp 情報処理装置、情報処理方法およびプログラム
JP5742184B2 (ja) 2010-11-16 2015-07-01 トヨタ自動車株式会社 運転支援装置
JP5667895B2 (ja) 2011-01-25 2015-02-12 メガトレンド株式会社 電話機用振込め詐欺防止装置
JP2013223161A (ja) 2012-04-18 2013-10-28 Fic Service Co Ltd 電話接続サービスシステム
JP5617942B2 (ja) * 2013-02-05 2014-11-05 株式会社デンソー 車載装置の制御システム

Also Published As

Publication number Publication date
JP7251833B2 (ja) 2023-04-04
WO2016103881A1 (ja) 2016-06-30
JP7122038B2 (ja) 2022-08-19
JP2021185410A (ja) 2021-12-09
JPWO2016103881A1 (ja) 2017-10-05
JP6994781B2 (ja) 2022-01-14
JP6744529B2 (ja) 2020-08-19
JP2022043116A (ja) 2022-03-15
JP2020173453A (ja) 2020-10-22
JP2023065621A (ja) 2023-05-12
JP2023072025A (ja) 2023-05-23
JP2019095795A (ja) 2019-06-20

Similar Documents

Publication Publication Date Title
JP6744529B2 (ja) 車載機及び車両
KR102389041B1 (ko) 이동단말기 및 머신 러닝을 이용한 이동 단말기의 제어방법
US11289074B2 (en) Artificial intelligence apparatus for performing speech recognition and method thereof
US11126833B2 (en) Artificial intelligence apparatus for recognizing user from image data and method for the same
AU2014236686B2 (en) Apparatus and methods for providing a persistent companion device
KR20190084789A (ko) 전자 장치 및 그 제어 방법
KR20190022109A (ko) 음성 인식 서비스를 활성화하는 방법 및 이를 구현한 전자 장치
KR20180129886A (ko) 지속적 컴패니언 디바이스 구성 및 전개 플랫폼
US11107471B2 (en) Dialog processing server, control method for dialog processing server, and terminal
US11568239B2 (en) Artificial intelligence server and method for providing information to user
US20180025283A1 (en) Information processing apparatus, information processing method, and program
US20190354178A1 (en) Artificial intelligence device capable of being controlled according to user action and method of operating the same
US10872438B2 (en) Artificial intelligence device capable of being controlled according to user's gaze and method of operating the same
US11501250B2 (en) Refrigerator for providing information on item using artificial intelligence and method of operating the same
JP7439826B2 (ja) 情報処理装置、情報処理方法、及びプログラム
US20210137311A1 (en) Artificial intelligence device and operating method thereof
US20190371149A1 (en) Apparatus and method for user monitoring
US20190377489A1 (en) Artificial intelligence device for providing voice recognition service and method of operating the same
US11170239B2 (en) Electronic apparatus and operation method thereof
KR102514128B1 (ko) 복수의 홈 디바이스간 연결을 제공하는 인공 지능 장치 및 그 방법
CN110363278B (zh) 一种亲子互动方法、机器人、服务器及亲子互动系统
US11464380B2 (en) Artificial intelligence cleaner and operating method thereof
WO2020213244A1 (ja) 情報処理装置、情報処理方法、及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171030

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171030

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190521

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190607

R150 Certificate of patent or registration of utility model

Ref document number: 6544693

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D02

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D04

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250