JP6700785B2

JP6700785B2 - 人工知能に基づく知能ロボットの制御システム、方法及び装置

Info

Publication number: JP6700785B2
Application number: JP2015257463A
Authority: JP
Inventors: ゲ・シンフェイ; ウ・フア; リ・ジャリン; シュー・チェン; ワン・ハイフェン; ジン・クン; スン・ウェンユ; ウー・ティエン; グアン・ダイソン
Original assignee: バイドゥオンラインネットワークテクノロジー（ベイジン）カンパニーリミテッド
Priority date: 2015-06-24
Filing date: 2015-12-28
Publication date: 2020-05-27
Anticipated expiration: 2035-12-28
Also published as: US20160379121A1; CN104965426A; EP3109856A1; KR20170000751A; US10223638B2; JP2017010518A

Description

本発明は、インテリジェント端末技術に関し、特に人工知能に基づく知能ロボットの制御システム、方法及び装置に関する。

人工知能（ＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅ、ＡＩと略称する）とは、人間の知能をシミュレート・延伸・拡張するための論理、方法、技術及び応用システムを研究・開発する新しい技術科学である。人工知能は計算機科学のブランチであり、知能の本質を捉えようとすると同時に、人間の知能と同様に反応する新しい知能ロボットを作り出すよう試みる。該分野の研究はロボット、音声認識、画像認識、自然言語処理とエキスパートシステム等を含む。知能ロボットは人工知能製品の一つとして、生活、仕事、科学探索等のさまざまな方面に幅広く応用されている。人々が知能ロボットのリアルタイム応答の能力及び大量データの処理、分析能力に対する要求がますます高くなっている。知能ロボットの動作、ナビゲーション等の機能が迅速に応答・処理できるだけでなく、同時に知能ロボットに双方向の対話、顔認識等の機能を備えるように人々は望んでいるため、知能ロボットの迅速に応答、意思決定能力及び大量データを記憶・処理する能力が要求される。しかし、現在の知能ロボットの制御システムはユーザの前記ニーズを満たせず、ユーザエクスペリエンスがよくない。

本発明は、先行技術に存在する技術問題点の少なくとも１つを解決することを目的とする。

そのため、本発明はタイムリーで迅速に、インテリジェントにユーザの命令に応答することができる人工知能に基づく知能ロボットの制御システムを提供することを第一目的とする。

本発明は人工知能に基づく知能ロボットの制御方法を提供することを第二目的とする。

本発明は人工知能に基づく知能ロボットの別の制御方法を提供することを第三目的とする。

本発明は人工知能に基づく知能ロボットの制御装置を提供することを第四目的とする。

本発明は人工知能に基づく知能ロボットの別の制御装置を提供することを第五目的とする。

前記目的を達成するため、本発明の実施形態１に係る人工知能に基づく知能ロボットの制御システムは、意思決定エンジンとクラウド側コントロールセンターを含み、前記意思決定エンジンは知能ロボットに設置され、前記知能ロボットが受信したマルチモード入力信号に基づいてクラウド側処理情報を生成し、ユーザニーズを取得できるように、前記クラウド側処理情報をクラウド側コントロールセンターに送信して分析させ、ならびに前記ユーザニーズ及び／又は前記マルチモード入力信号に基づいて前記知能ロボットを制御し、前記クラウド側コントロールセンターは、前記クラウド側処理情報を受信するとともに、該クラウド側処理情報を分析して前記ユーザニーズを取得し、該ユーザニーズを前記意思決定エンジンに返送する。

本発明の実施形態に係る人工知能に基づく知能ロボットの制御システムは、知能ロボットの意思決定エンジンは、知能ロボットが受信したマルチモード入力信号に基づいてクラウド側処理情報を生成し、ユーザニーズを取得できるように、クラウド側処理情報をクラウド側コントロールセンターに送信して分析させ、ならびにユーザニーズ及び／又はマルチモード入力信号に基づいて前記知能ロボットを制御することにより、クラウド側コントロールセンターを用いて複雑な自然言語命令、複雑な意思決定、画像認識等を効率的に処理すると同時に、ローカル意思決定エンジンを用いて入力信号に基づいて知能ロボットをタイムリーで迅速に制御することもできるため、オンラインの大量データを十分に利用して知能ロボットの記憶コンピューティング能力及び複雑な意思決定の処理能力を高めると同時に、タイムリーで迅速に、インテリジェントにユーザの命令に応答でき、ユーザエクスペリエンスを向上させる。

本発明の実施形態２に係る人工知能に基づく知能ロボットの制御方法は、知能ロボットの意思決定エンジンは前記知能ロボットが受信したマルチモード入力信号に基づいてクラウド側処理情報を生成するステップと、ユーザニーズを取得できるように、前記意思決定エンジンは前記クラウド側処理情報をクラウド側コントロールセンターに送信して分析させるステップと、前記意思決定エンジンは前記ユーザニーズ及び／又は前記マルチモード入力信号に基づいて前記知能ロボットを制御するステップとを含む。

本発明の実施形態に係る人工知能に基づく知能ロボットの制御方法は、知能ロボットが受信したマルチモード入力信号に基づいてクラウド側処理情報を生成し、ユーザニーズを取得できるように、クラウド側処理情報をクラウド側コントロールセンターに送信して分析させ、ユーザニーズ及び／又はマルチモード入力信号に基づいて知能ロボットを制御することにより、クラウド側コントロールセンターを用いて複雑な自然言語命令、複雑な意思決定、画像認識等を効率的に処理すると同時に、ローカル意思決定エンジンを用いて入力信号に基づいて知能ロボットをタイムリーで迅速に制御することもできるため、オンラインの大量データを十分に利用して知能ロボットの記憶コンピューティング能力及び複雑な意思決定の処理能力を高めると同時に、タイムリーで迅速に、インテリジェントにユーザの命令に応答でき、ユーザエクスペリエンスを向上させる。

本発明の実施形態３に係る人工知能に基づく知能ロボットの制御装置は、前記知能ロボットが受信したマルチモード入力信号に基づいてクラウド側処理情報を生成する生成モジュールと、ユーザニーズを取得できるように、前記クラウド側処理情報をクラウド側コントロールセンターに送信して分析させるモジュールと、前記ユーザニーズ及び／又は前記マルチモード入力信号に基づいて前記知能ロボットを制御する制御モジュールとを含む。

本発明の実施形態に係る人工知能に基づく知能ロボットの制御装置は、知能ロボットが受信したマルチモード入力信号に基づいてクラウド側処理情報を生成し、ユーザニーズを取得できるように、前記クラウド側処理情報をクラウド側コントロールセンターに送信して分析させ、前記ユーザニーズ及び／又は前記マルチモード入力信号に基づいて前記知能ロボットを制御することにより、処理能力と応答速度に応じローカルとクラウド側コントロールセンターとの分業で知能ロボットが受信したマルチモード入力信号を処理し、クラウド側コントロールセンターを用いて複雑な自然言語命令、複雑な意思決定、画像認識等を効率的に処理すると同時に、ローカル処理を用いて入力信号に基づいて知能ロボットをタイムリーで迅速に制御することもできるため、オンラインの大量データを十分に利用して知能ロボットの記憶コンピューティング能力及び複雑な意思決定の処理能力を高めると同時に、タイムリーで迅速に、インテリジェントにユーザの命令に応答でき、ユーザエクスペリエンスを向上させる。

本発明の実施形態４に係る人工知能に基づく知能ロボットの制御方法は、クラウド側コントロールセンターは知能ロボットから送信されたクラウド側処理情報を受信するステップと、前記クラウド側コントロールセンターは前記クラウド側処理情報を分析してユーザニーズを取得するステップと、前記クラウド側コントロールセンターは前記ユーザニーズを前記意思決定エンジンに返送するステップとを含む。

本発明の実施形態に係る人工知能に基づく知能ロボットの制御方法は、知能ロボットの意思決定エンジンから送信されたクラウド側処理情報を受信し、分析してユーザニーズを取得した後それを意思決定エンジンに返送し、意思決定エンジンによってユーザニーズ及び／又はマルチモード入力信号に基づいて知能ロボット制御することにより、該制御方法を用いて複雑な自然言語命令、複雑な意思決定、画像認識等を効率的に処理すると同時に、ローカル意思決定エンジンを用いて入力信号に基づいて知能ロボットをタイムリーで迅速に制御することもできるため、オンラインの大量データを十分に利用して知能ロボットの記憶コンピューティング能力及び複雑な意思決定の処理能力を高めると同時に、タイムリーで迅速に、インテリジェントにユーザの命令に応答でき、ユーザエクスペリエンスを向上させる。

本発明の実施形態５に係る人工知能に基づく知能ロボットの制御装置は、知能ロボットから送信されたクラウド側処理情報を受信する受信モジュールと、前記クラウド側処理情報を分析してユーザニーズを取得する分析モジュールと、前記ユーザニーズを前記意思決定エンジンに返送する復元モジュールとを含む。

本発明の実施形態に係る人工知能に基づく知能ロボットの制御装置は、知能ロボットの意思決定エンジンから送信されたクラウド側処理情報を受信し、分析してユーザニーズを取得した後それを意思決定エンジンに返送し、意思決定エンジンによってユーザニーズ及び／又はマルチモード入力信号に基づいて知能ロボットを制御することにより、該制御装置を用いて複雑な自然言語命令、複雑な意思決定、画像認識等を効率的に処理すると同時に、ローカル意思決定エンジンを用いて入力信号に基づいて知能ロボットをタイムリーで迅速に制御することもできるため、オンラインの大量データを十分に利用して知能ロボットの記憶コンピューティング能力及び複雑な意思決定の処理能力を高めると同時に、タイムリーで迅速に、インテリジェントにユーザの命令に応答でき、ユーザエクスペリエンスを向上させる。

本発明の付加的方面及びメリットは、以下の説明において部分的に述べられ、この説明から一部は明らかになるか、または、本発明の実施により理解され得る。

本発明の上述及び／或いは付加的方面とメリットは、下記の図面を結合した実施形態に対する説明において、明らかになり、理解されることが容易になる。その中で、
本発明の一実施形態による人工知能に基づく知能ロボットの制御システムを示すブロック図である。本発明の一実施形態による応用シーンを示す図である。本発明の別の実施形態による応用シーンを示す図である。本発明の別の実施形態による応用シーンを示す図である。本発明の一実施形態による人工知能に基づく知能ロボットの制御システムのインターアクションを示す図である。本発明の一実施形態による人工知能に基づく知能ロボットの制御方法を示すフローチャート図である。本発明の一実施形態による人工知能に基づく知能ロボットの制御装置を示すブロック図である。本発明の別の実施形態による人工知能に基づく知能ロボットの制御装置を示すブロック図である。本発明の一実施形態による人工知能に基づく知能ロボットの制御方法を示すフローチャート図である。本発明の別の実施形態による人工知能に基づく知能ロボットの制御装置を示すブロック図である。

以下、本発明の実施の形態を詳細に説明する。前記実施の形態の実例が図面において示されるが、同一の又は類似する符号が相同若しくは類似の部品又は相同若しくは類似の機能を有する部品を表す。以下、図面を参照しながら説明する実施形態が例示性のものであり、本発明を一般に理解するために用いられる。実施形態は、本発明を制限するように解釈されてはならない。

本発明の説明には、用語「複数」は二つ又は二つ以上を指す。用語「第一」、「第二」等は単に説明のためのみに用いられ、相対的な重要性に明示的にも暗示的にも関連づけられ使用されるものではない。

以下は図面を参照しながら本発明の実施形態に係る人工知能に基づく知能ロボットの制御システム、制御方法及び制御装置を説明する。

本発明の実施形態に係る人工知能に基づく知能ロボットの制御システムは、意思決定エンジンとクラウド側コントロールセンターを含み、意思決定エンジンは知能ロボットに設置され、知能ロボットが受信したマルチモード入力信号に基づいてクラウド側処理情報を生成し、ユーザニーズを取得できるように、クラウド側処理情報をクラウド側コントロールセンターに送信して分析させ、ならびにユーザニーズ及び／又はマルチモード入力信号に基づいて知能ロボットを制御し、クラウド側コントロールセンターは、クラウド側処理情報を受信するとともに、クラウド側処理情報を分析してユーザニーズを取得し、ユーザニーズを意思決定エンジンに返送する。

図１は本発明の一実施形態による知能ロボットの制御システムを示すブロック図である。

図１に示したように、該人工知能に基づく知能ロボットの制御システムは、意思決定エンジン１０とクラウド側コントロールセンター２０を含む。

具体的には、意思決定エンジン１０は知能ロボットに設置され、知能ロボットが受信したマルチモード入力信号に基づいてクラウド側処理情報を生成し、ユーザニーズを取得できるように、クラウド側処理情報をクラウド側コントロールセンターに送信して分析させ、ならびにユーザニーズ及び／又はマルチモード入力信号に基づいて知能ロボットを制御する。

クラウド側コントロールセンター２０は、クラウド側処理情報を受信するとともに、クラウド側処理情報を分析してユーザニーズを取得し、ユーザニーズの処理結果を意思決定エンジンに返送する。

本発明の一実施形態において、マルチモードの入力信号は、ユーザが入力した音声信号、画像信号及び／又は環境センサ信号を含む。具体的には、ユーザが入力した音声信号はユーザがマイクによって入力することができ、前記画像信号はカメラ又は赤外線センサによって入力されることができ、前記環境センサ信号は光センサ、赤外線センサ、温湿度センサ、有毒ガスセンサ、粒子状物質センサ、タッチモジュール、地理的位置定位モジュールと重力センサの中の一つ又は複数のセンサによって入力された信号を含む。

知能ロボットのローカル意思決定エンジン１０は迅速に応答できる利点があるが、記憶容量とデータ処理能力等が制限されているため、クラウド側コントロールセンター２０に比べて、意思決定エンジン１０は音声認識、画像認識等に対する認識精度が低い。それに対して、クラウド側コントロールセンター２０はインターネットリソースをフルに活用し、極めて優れた処理能力をもち、意味分析、機械翻訳、情感分析、顔認識、音声認識等ができるように、オンライン学習、情報検索、知識問答若しくは大量データを通して学習・トレーニングすることができる。そのため、高精度ではあるが、ネットワークの信号、速度等に影響され、ネットワーク遅延等の問題がある。

そのため、本発明の実施形態において、上述マルチモードの入力信号における一部の信号を処理するには強力なデータ処理能力が必要とされず、大量のオンライン知識データも頼らず、同時にこれらの信号を処理するには複数のセンサ信号を統合してリアルタイム処理をしなければならず、最良の信号を取得する又は障害物を回避することができるように、直ちに動作機構等を制御して調整・応答し、調整して取得された信号を新たにリアルタイム処理することであれば、この過程は信頼性の低くかつ遅延のあるクラウド側コントロールセンター２０が適用されないため、意思決定エンジン１０を用いてこれらの信号を処理することができる。例えば、意思決定エンジン１０はユーザが入力した音声信号に基づいて音源定位、声紋認識等を行ったり、画像信号と環境センサ情報に基づいて周辺環境を感知したり、周辺環境に基づいて知能ロボットを制御して障害物回避、追従等の動作をさせたりすることができる。

また、上述マルチモードの入力信号における音声信号、画像信号、赤外線信号等に基づいて音声認識、音声合成、画像認識、地図情報収集と前処理などをする場合、例えば顔認識、背丈認識、動作認識、ジェスチャー認識等をする場合、クラウド側コントロールセンター２０を用いて処理すれば、より精度の高い結果が得られる。

音声信号を例にすると、音声信号を処理するには音声認識、自然言語理解、意味分析、機械翻訳、情感分析をしなければならないため、大量の言語資料とデータを使用してトレーニングしなければならず、ユーザとインターアクションする過程においてもユーザの音声、動作の意味を分析した後、知識問答を通してフィードバック内容を決めなければならない。従って、この場合はクラウド側コントロールセンター２０に送信し、クラウド側コントロールセンター２０のスーパー記憶容量、データ処理能力を通して分析する。

当然ながら、本発明の実施形態において、オフラインとオンラインの組み合わせを利用して、即ちオンラインの場合はクラウド側コントロールセンター２０を優先利用して分析すれば、認識精度が高く、又は音声合成の効果が自然であり、オフラインの場合はローカル意思決定エンジン１０を使用して処理すれば、最高の効果を上げなくても一応動作できるため、ローカル意思決定エンジン１０とクラウド側コントロールセンター２０の長所をフルに活用でき、ロボットに正確に各種の信号を認識させ、タイムリーで迅速に応答させることができる。

更に、本発明の一実施形態において、意思決定エンジン１０を用いてマルチモードの入力信号を前処理し、前処理された結果をクラウド側処理情報としてクラウド側コントロールセンター２０に送信して更なる分析をすることもできる。

本発明の一実施形態において、意思決定エンジン１０は、ユーザが入力した音声信号を複数の音声クリップに分割し、複数の音声クリップをクラウド側処理情報としてクラウド側コントロールセンター２０に送信して処理することもできる。クラウド側コントロールセンター２０は複数の音声クリップに対して音声認識をし、音声認識の結果に対して自然言語理解、意味分析、情感分析の中の一つ又は複数をすることによって、ユーザニーズを取得した後、ユーザニーズを意思決定エンジン１０に返送する。意思決定エンジン１０はユーザニーズに基づいてマルチモードの入力信号を参照しながら知能ロボットを制御する。

具体的には、本発明の一実施形態において、ユーザニーズが動作制御である場合、意思決定エンジン１０はユーザの位置を取得し、画像信号及び／又は環境感知信号に基づいて周辺地図を生成するとともに、周辺環境を感知し、ユーザの位置、周辺地図及び／又は周辺環境に基づいてユーザニーズに従って動作するように知能ロボットを制御する。

図２は本発明の一実施形態に係る応用シーンを示す図である。図２に示したように、ユーザは予め設定した音声を通じて知能ロボットを音声で呼び起こすことができる。例えば、知能ロボットがユーザの入力した音声信号「度ロボットちゃん」を受信した場合、意思決定エンジン１０はユーザにフィードバックするとともに、音声命令リスニングモードに入るように知能ロボットを制御する。このモード下で、ユーザが「ついて来い」、「ついてきて」、「早く追いついて」等の自然言語で話した音声を入力した場合、分析させるため、意思決定エンジン１０は該音声に対応する音声クリップをクラウド側コントロールセンター２０に送信する。クラウド側コントロールセンター２０は分析し、表現方法の不均一な命令に対して意味分析と均一化処理をし、ユーザニーズが均一で規範化する「追従」であることがわかり、それを意思決定エンジン１０に返送する。意思決定エンジン１０は「追従」ニーズに基づいて命令ディスパッチをし、即ち動作制御プログラムを呼び出してユーザにお供して動作させるように知能ロボットを制御する。具体的に、意思決定エンジン１０はユーザの位置を取得できるようにユーザに方位追従することができる。例えば、ユーザの音声信号に基づいてユーザに音源定位をし、カメラなどをユーザに向け、ユーザの位置変化に応じ移動させるように知能ロボットを制御する。更に、移動過程において、意思決定エンジン１０は周辺地図と周囲環境に基づいて障害物回避及びルート検索をさせるように知能ロボットを制御する。

ユーザニーズがルート検索である場合、意思決定エンジン１０は画像信号及び／又は環境感知信号に基づいて周辺地図を生成し、知能ロボットの位置と目標位置を取得し、意思決定エンジンは周辺位置、知能ロボットの位置及び目標位置に基づいて知能ロボットが方向を示し、又は音声インターアクションを通して方向を示すように制御する。

図３は本発明の別の実施形態による応用シーンを示す図である。図３に示したように、ユーザは予め設定した音声を通じて知能ロボットを音声で呼び起こすことができる。例えば、知能ロボットがユーザの入力した音声信号「度ロボットちゃん」を受信した場合、意思決定エンジン１０はユーザにフィードバックするとともに、音声命令リスニングモードに入るように知能ロボットを制御する。このモード下で、ユーザが「中国国際航空はどこでチェックインするか」、「セキュリティ検査はどこで行うか」、「国際便の搭乗口はどこですか」等の音声を入力した場合、分析させるため、意思決定エンジン１０は該音声に対応する音声クリップをクラウド側コントロールセンター２０に送信する。クラウド側コントロールセンター２０は分析し、ユーザニーズが「指定実体の位置」であることがわかり、それを意思決定エンジン１０に返送する。意思決定エンジン１０は「指定実体の位置」ニーズに基づいて命令ディスパッチをし、即ち道案内プログラムを呼び出してユーザに道案内させるように知能ロボットを制御する。具体的に、自分の位置を判定するため、意思決定エンジン１０は位置と方向を検出し、周辺地図において定位した後、指定実体の相対位置に基づいてユーザに道案内をする。例えば、転身と上肢の動作制御によって方向を示したり、音声を出力することによって方向を示したりするとともに、音声インターアクションによってユーザに道案内をすることができる。

本発明の別の実施形態において、意思決定エンジン１０は画像信号及び／又は環境感知信号に基づいてユーザに対し動作検出をすることができる。その中で、意思決定エンジン１０は取得されたユーザの画像信号に基づいてユーザの身体の動き、ジェスチャー、背丈認識等を認識し、それらに基づいてユーザの寝返り、ジャンプなどの動作検出をすることができる。その後所定のルールに従って動作検出結果をクラウド側処理情報としてクラウド側コントロールセンター２０に送信して処理する。例えば、検出されたそれぞれの動作及び対応するタイムスタンプ（動作の発生時間）をクラウド側コントロールセンター２０に送信する。クラウド側コントロールセンター２０は一定の期間の動作検出結果を分析し、分析結果を対応する知識ベースと比較して対応するユーザニーズを取得した後、それを意思決定エンジン１０に返送する。意思決定エンジン１０はユーザニーズに基づいてマルチモードの入力信号を参照しながら知能ロボットを制御する。具体的には、意思決定エンジン１０はユーザニーズに基づいて予め設定したモバイル端末に提示情報を送信するように知能ロボットを制御する。

図４は本発明の別の実施形態による応用シーンを示す図である。図４に示したように、意思決定エンジン１０はユーザ（乳幼児）の赤外線画像を取得し、目標動作検出をすることができ、ユーザが寝返りしたと検出した場合、監護プログラムを呼び出して検出された寝返り動作と対応するタイムスタンプをクラウド側コントロールセンター２０に送信する。クラウド側コントロールセンター２０は受信した操作及び対応するタイムスタンプを記録し、一定の期間の記録結果に基づいて寝返りの頻度を計算し、それを母子知識ベースと比較し、該寝返りの頻度が小便等による不快であるせいだとわかれば、この結果を意思決定エンジン１０に返送する。意思決定エンジン１０はこの結果を受信した後監護プログラムを呼び出し予め設定したモバイル端末に「おむつを替える」という提示情報を送信する。また、ユーザ画像の視野を確保できるように、意思決定エンジン１０はユーザの動作に従って動作するように知能ロボットを制御することもでき、ユーザの動作、行為に基づいて知能ロボットを制御することもできる。これにより、親がタイムリーに乳幼児のおむつを替え、乳幼児の快適性を高めるだけでなく、親にとって乳幼児の状態を把握するのに便利で、親の監護の仕事量を減らす。

また、クラウド側コントロールセンター２０は乳幼児の一定期間の寝返りの記録若しくはその他の動作行為に基づいて健康プロフィールを作り、大量データを収集したうえに更にビッグデータ分析・発掘し、傾向情報を発見し、正確な情報、サービスプッシュ等の業務をする。

本発明の一実施形態において、意思決定エンジン１０は更に画像信号に基づいて顔検出をする。画像信号が顔画像の信号である場合、顔画像の信号をクラウド側コントロールセンター２０に送信して顔認識をさせ、認識結果に基づいてユーザのＩＤを判定する。

また、意思決定エンジン１０はユーザに対し声紋認識をすることにより、ユーザのＩＤを判定することもできる。

本発明の実施形態において、複数の認識方式を単独でもしくは併用して使用することにより、より精度の高く、若しくは適用範囲の広く、便利なユーザのＩＤ確認方法が提供される。光線が悪く画質がよくない時、声紋認識の重みを上げ、騒々しくてピックアップの品質が良くないとき、顔認識の重みを上げる。これにより、不正利用を防止し、同時にユーザのＩＤに基づいてユーザに個人データベースを構築し、ユーザに個性的なサービスを提供することができる。

上述シーンは本発明の実施形態を理解するための例示的な説明に過ぎず、実際の応用において、実際の制御過程において、意思決定エンジン１０の各種の制御機能と制御は実際の制御に応じ呼び出され、しかもクラウド側コントロールセンター２０のオンライン処理結果と結合して行うことを理解すべきである。図５に示したように、知能ロボットがオンラインの場合、意思決定エンジンは画像信号、音声信号等をクラウド側処理情報としてクラウド側コントロールセンターに送信し、意味分析、機械翻訳、情感分析、顔認識、音声認識等（例えばクラウドサーバを通じて動作認識、ジェスチャー認識、背丈認識、地図情報収集と前処理等をする）ができるように、クラウド側コントロールセンターによってオンラインリソース、知識などに基づいてマルチモードの入力信号についてオンライン学習、情報検索、知識問答若しくは大量データを学習・トレーニングすることができる。意思決定エンジンは音声信号に基づいてユーザに対して音源定位、センサ信号に基づいて周囲環境を感知し、並びに定位結果、環境感知結果及びクラウド側コントロールセンターから返送した分析結果（例えば、音声に対応する命令、画像認識結果、画像情報に基づいて生成した周辺地図等）に基づいて知能ロボットの動作機構を制御し、知能ロボットの障害物回避や追従制御等の動作制御を実現する。意思決定エンジンとクラウド側コントロールセンターはネットワークを通じて接続し、データ伝送をすることができる。

その中で、意思決定エンジンはマルチモードの入力信号のプロセスを前処理し、処理された結果をクラウド側処理情報としてクラウド側コントロールセンターに送信することができる。例えば、音声信号を音声クリップに分割するとともに、音声クリップを送信し、又は画像信号に対し顔認識をするとともに、認識された顔画像をクラウド側コントロールセンターに送信し顔認識をさせることにより、全部の画像信号を伝送することがなく、データ伝送量を減らす。

また、知能ロボットがオフラインの場合、クラウド側コントロールセンターと通信することができないため、意思決定エンジンによって内蔵プログラムを利用してマルチモードの入力信号を処理・認識・分析することができる。例えば、音声認識、音声合成、画像認識、周辺地図の生成、ユーザ動作の認識等である。知能ロボットがオンライン時もオフライン時も、正常に動作させるように制御することができる。

従って、意思決定エンジン１０とクラウド側コントロールセンター２０との間に伝送されたのはデータ量の少ない命令型音声クリップ及び「追従」のような抽象的で規範化した命令、又は一部の画像信号であり、データ量が少なく、伝送が早くかつ処理に容易である。また、カメラ、センサ等によって取得された大量の画像信号とセンサ信号等のリアルタイムデータは意思決定エンジン１０によって処理されることにより、データ量が多く伝送速度が遅いせいでもたらした応答遅延を避けられ、意思決定エンジン１０の速い応答とクラウド側コントロールセンター２０の強力な処理能力の長所をフルに活用することができる。

本発明の実施形態に係る人工知能に基づく知能ロボットの制御システムにおいて、知能ロボットの意思決定エンジンは、知能ロボットが受信したマルチモード入力信号に基づいてクラウド側処理情報を生成し、ユーザニーズを取得できるように、クラウド側処理情報をクラウド側コントロールセンターに送信して分析させ、ならびにユーザニーズ及び／又はマルチモード入力信号に基づいて知能ロボットを制御し、更に処理能力と応答速度に基づいて意思決定エンジンとクラウド側コントロールセンターとの分業で知能ロボットが受信したマルチモード信号を処理することにより、クラウド側コントロールセンターを用いて複雑な自然言語命令、複雑な意思決定、画像認識等を効率的に処理すると同時に、ローカル意思決定エンジンを用いて入力信号に基づいて知能ロボットをタイムリーで迅速に制御することもできるため、オンラインの大量データを十分に利用して知能ロボットの記憶コンピューティング能力及び複雑な意思決定の処理能力を高めると同時に、タイムリーで迅速に、インテリジェントにユーザの命令に応答でき、ユーザエクスペリエンスを向上させる。

上述実施形態を実現するため、本発明は人工知能に基づく知能ロボットの制御方法を更に提供する。

該制御方法は知能ロボットに設置されている意思決定エンジンに応用されることができる。

人工知能に基づく知能ロボットの制御方法であって、知能ロボットの意思決定エンジンは知能ロボットが受信したマルチモード入力信号に基づいてクラウド側処理情報を生成するステップと、ユーザニーズを取得できるように、意思決定エンジンはクラウド側処理情報をクラウド側コントロールセンターに送信して分析させるステップと、意思決定エンジンはユーザニーズ及び／又はマルチモード入力信号に基づいて知能ロボットを制御するステップとを含む。

図６は本発明の一実施形態による人工知能に基づく知能ロボットの制御方法を示すフローチャート図である。

図６に示したように、本発明の実施形態による人工知能に基づく知能ロボットの制御方法は以下のステップを含む。

知能ロボットの意思決定エンジンは知能ロボットが受信したマルチモード入力信号に基づいてクラウド側処理情報を生成するステップＳ６０１である。

ユーザニーズを取得できるように、意思決定エンジンはクラウド側処理情報をクラウド側コントロールセンターに送信して分析させるステップＳ６０２である。

意思決定エンジンはユーザニーズ及び／又はマルチモード入力信号に基づいて知能ロボットを制御するステップＳ６０３である。

知能ロボットのローカル意思決定エンジンは迅速に応答できる利点があるが、記憶容量とデータ処理能力等が制限されているため、クラウド側コントロールセンターに比べて、意思決定エンジンは音声認識、画像認識等に対する認識精度が低い。それに対して、クラウド側コントロールセンターはインターネットリソースをフルに活用し、極めて優れた処理能力をもち、意味分析、機械翻訳、情感分析、顔認識、音声認識等ができるように、オンライン学習、情報検索、知識問答若しくは大量データを通して学習・トレーニングすることができる。そのため、高精度ではあるが、ネットワークの信号、速度等に影響され、ネットワーク遅延等の問題がある。

そのため、本発明の実施形態において、上述マルチモードの入力信号における一部の信号を処理するには強力なデータ処理能力が必要とされず、大量のオンライン知識データも頼らず、同時にこれらの信号を処理するには複数のセンサ信号を統合してリアルタイム処理をしなければならず、最良の信号を取得する又は障害物を回避することができるように、直ちに動作機構等を制御して調整・応答し、調整して取得された信号を新たにリアルタイム処理することであれば、この過程は信頼性の低くかつ遅延のあるクラウド側コントロールセンターが適用されないため、意思決定エンジンを用いてこれらの信号を処理することができる。例えば、意思決定エンジンはユーザが入力した音声信号に基づいて音源定位、声紋認識等を行ったり、画像信号と環境センサ情報に基づいて周辺環境を感知したり、周辺環境に基づいて知能ロボットを制御して障害物回避、追従等の動作をさせたりすることができる。

また、上述マルチモードの入力信号における音声信号、画像信号、赤外線信号等に基づいて音声認識、音声合成、画像認識、地図情報収集と前処理などをする場合、例えば顔認識、背丈認識、動作認識、ジェスチャー認識等をする場合、クラウド側コントロールセンターを用いて処理すれば、より精度の高い結果が得られる。

音声信号を例にすると、音声信号を処理するには音声認識、自然言語理解、意味分析、機械翻訳、情感分析をしなければならないため、大量の言語資料とデータを使用してトレーニングしなければならず、ユーザとインターアクションする過程においてもユーザの音声、動作の意味を分析した後、知識問答を通してフィードバック内容を決めなければならない。従って、この場合はクラウド側コントロールセンターに送信し、クラウド側コントロールセンターのスーパー記憶容量、データ処理能力を通して分析する。

当然ながら、本発明の実施形態において、オフラインとオンラインの組み合わせを利用して、即ちオンラインの場合はクラウド側コントロールセンターを優先利用して分析すれば、認識精度が高く、又は音声合成の効果が自然であり、オフラインの場合はローカル意思決定エンジンを使用して処理すれば、最高の効果を上げなくても一応動作できるため、ローカル意思決定エンジンとクラウド側コントロールセンターの長所をフルに活用でき、ロボットに正確に各種の信号を認識させ、タイムリーで迅速に応答させることができる。

更に、本発明の一実施形態において、意思決定エンジンを用いてマルチモードの入力信号を前処理し、前処理された結果をクラウド側処理情報としてクラウド側コントロールセンターに送信して更なる分析をすることもできる。

本発明の一実施形態によれば、Ｓ６０１において、意思決定エンジンは、ユーザが入力した音声信号を複数の音声クリップに分割し、複数の音声クリップをクラウド側処理情報としてクラウド側コントロールセンターに送信して処理することもできる。クラウド側コントロールセンターは複数の音声クリップに対して音声認識をし、音声認識の結果に対して自然言語理解、意味分析、情感分析の中の一つ又は複数することによって、ユーザニーズを取得した後、ユーザニーズを意思決定エンジンに返送する。意思決定エンジンはユーザニーズに基づいてマルチモードの入力信号を参照しながら知能ロボットを制御する。

具体的には、本発明の一実施形態において、ユーザニーズが動作制御である場合、Ｓ６０３は、意思決定エンジンはユーザの位置を取得し、画像信号及び／又は環境感知信号に基づいて周辺地図を生成するとともに、周辺環境を感知し、ユーザの位置、周辺地図及び／又は周辺環境に基づいてユーザニーズに従って動作するように知能ロボットを制御するステップを含む。

図２は本発明の一実施形態に係る応用シーンを示す図である。図２に示したように、ユーザは予め設定した音声を通じて知能ロボットを音声で呼び起こすことができる。例えば、知能ロボットがユーザの入力した音声信号「度ロボットちゃん」を受信した場合、意思決定エンジンはユーザにフィードバックするとともに、音声命令リスニングモードに入るように知能ロボットを制御する。このモード下で、ユーザが「ついて来い」、「ついてきて」、「早く追いついて」等の自然言語で話した音声を入力した場合、分析させるため、意思決定エンジンは該音声に対応する音声クリップをクラウド側コントロールセンターに送信する。クラウド側コントロールセンターは分析し、表現方法の不均一な命令に対して意味分析と均一化処理をし、ユーザニーズが均一で規範化する「追従」であることがわかり、それを意思決定エンジンに返送する。意思決定エンジンは「追従」ニーズに基づいて命令ディスパッチをし、即ち動作制御プログラムを呼び出してユーザにお供して動作させるように知能ロボットを制御する。具体的に、意思決定エンジンはユーザの位置を取得できるようにユーザに方位追従することができる。例えば、ユーザの音声信号に基づいてユーザに音源定位をし、カメラなどをユーザに向け、ユーザの位置変化に応じ移動させるように知能ロボットを制御する。更に、移動過程において、意思決定エンジンは周辺地図と周囲環境に基づいて障害物回避及びルート検索をさせるように知能ロボットを制御する。

ユーザニーズがルート検索である場合、Ｓ６０３は、意思決定エンジンは画像信号及び／又は環境感知信号に基づいて周辺地図を生成し、知能ロボットの位置と目標位置を取得し、意思決定エンジンは周辺位置、知能ロボットの位置及び目標位置に基づいて知能ロボットが方向を示し、又は音声インターアクションを通して方向を示すように制御する。

図３は本発明の別の実施形態による応用シーンを示す図である。図３に示したように、ユーザは予め設定した音声を通じて知能ロボットを音声で呼び起こすことができる。例えば、知能ロボットがユーザの入力した音声信号「度ロボットちゃん」を受信した場合、意思決定エンジンはユーザにフィードバックするとともに、音声命令リスニングモードに入るように知能ロボットを制御する。このモード下で、ユーザが「中国国際航空はどこでチェックインするか」、「セキュリティ検査はどこで行うか」、「国際便の搭乗口はどこですか」等の音声を入力した場合、分析させるため、意思決定エンジンは該音声に対応する音声クリップをクラウド側コントロールセンターに送信する。クラウド側コントロールセンターは分析し、ユーザニーズが「指定実体の位置」であることがわかり、それを意思決定エンジンに返送する。意思決定エンジンは「指定実体の位置」ニーズに基づいて命令ディスパッチをし、即ち道案内プログラムを呼び出してユーザに道案内させるように知能ロボットを制御する。具体的に、自分の位置を判定するため、意思決定エンジンは位置と方向を検出し、周辺地図において定位した後、指定実体の相対位置に基づいてユーザに道案内をする。例えば、転身と上肢の動作制御によって方向を示したり、音声を出力することによって方向を示したりするとともに、音声インターアクションによってユーザに道案内をすることができる。

本発明の別の実施形態によれば、Ｓ６０１において、意思決定エンジンは画像信号及び／又は環境感知信号に基づいてユーザに対し動作検出をし、所定のルールに従って動作検出結果をクラウド側処理情報とする。その中で、意思決定エンジンは取得されたユーザの画像信号に基づいてユーザの身体の動き、ジェスチャー、背丈認識等を認識し、それらに基づいてユーザの寝返り、ジャンプなどの動作検出をすることができる。その後所定のルールに従って動作検出結果をクラウド側処理情報としてクラウド側コントロールセンターに送信して処理する。例えば、検出されたそれぞれの動作及び対応するタイムスタンプ（動作の発生時間）をクラウド側コントロールセンターに送信する。クラウド側コントロールセンターは一定の期間の動作検出結果を分析し、分析結果を対応する知識ベースと比較して対応するユーザニーズを取得した後、それを意思決定エンジンに返送する。意思決定エンジンはユーザニーズに基づいてマルチモードの入力信号を参照しながら知能ロボットを制御する。具体的には、意思決定エンジンはユーザニーズに基づいて予め設定したモバイル端末に提示情報を送信するように知能ロボットを制御する。

図４は本発明の別の実施形態による応用シーンを示す図である。図４に示したように、意思決定エンジンはユーザ（乳幼児）の赤外線画像を取得し、目標動作検出をすることができ、ユーザが寝返りしたと検出した場合、監護プログラムを呼び出して検出された寝返り動作と対応するタイムスタンプをクラウド側コントロールセンターに送信する。クラウド側コントロールセンターは受信した操作及び対応するタイムスタンプを記録し、一定の期間の記録結果に基づいて寝返りの頻度を計算し、それを母子知識ベースと比較し、該寝返りの頻度が小便等による不快であるせいだとわかれば、この結果を意思決定エンジンに返送する。意思決定エンジンはこの結果を受信した後監護プログラムを呼び出し予め設定したモバイル端末に「おむつを替える」という提示情報を送信する。また、ユーザ画像の視野を確保できるように、意思決定エンジンはユーザの動作に従って動作するように知能ロボットを制御することもでき、ユーザの動作、行為に基づいて知能ロボットを制御することもできる。これにより、親がタイムリーに乳幼児のおむつを替え、乳幼児の快適性を高めるだけでなく、親にとって乳幼児の状態を把握するのに便利で、親の監護の仕事量を減らす。

また、クラウド側コントロールセンターは乳幼児の一定期間の寝返りの記録若しくはその他の動作行為に基づいて健康プロフィールを作り、大量データを収集したうえに更にビッグデータ分析・発掘し、傾向情報を発見し、正確な情報、サービスプッシュ等の業務をする。

本発明の一実施形態において、該方法は、意思決定エンジンは画像信号に基づいて顔検出をし、画像信号が顔画像の信号である場合、顔画像の信号をクラウド側コントロールセンターに送信して顔認識をさせ、認識結果に基づいてユーザのＩＤを判定するステップを更に含む。

また、意思決定エンジンはユーザに対し声紋認識をすることにより、ユーザのＩＤを判定することもできる。

上述シーンは本発明の実施形態を理解するための例示的な説明に過ぎず、実際の応用において、実際の制御過程において、意思決定エンジンの各種の制御機能の制御は実際の制御に応じ呼び出され、しかもクラウド側コントロールセンターのオンライン処理結果と結合して行うことを理解すべきである。図５に示したように、知能ロボットがオンラインの場合、意思決定エンジンは画像信号、音声信号等をクラウド側処理情報としてクラウド側コントロールセンターに送信し、意味分析、機械翻訳、情感分析、顔認識、音声認識等（例えばクラウドサーバを通じて動作認識、ジェスチャー認識、背丈認識、地図情報収集と前処理等をする）ができるように、クラウド側コントロールセンターによってオンラインリソース、知識などに基づいてマルチモードの入力信号についてオンライン学習、情報検索、知識問答若しくは大量データを学習・トレーニングすることができる。意思決定エンジンは音声信号に基づいてユーザに対して音源定位、センサ信号に基づいて周囲環境を感知し、並びに定位結果、環境感知結果及びクラウド側コントロールセンターから返した分析結果（例えば、音声に対応する命令、画像認識結果、画像情報に基づいて生成した周辺地図等）に基づいて知能ロボットの動作機構を制御し、知能ロボットの障害物回避や追従制御等の動作制御を実現する。意思決定エンジンとクラウド側コントロールセンターはネットワークを通じて接続し、データ伝送をすることができる。

従って、意思決定エンジンとクラウド側コントロールセンターとの間に伝送されたのはデータ量の少ない命令型音声クリップ及び「追従」のような抽象的で規範化した命令、又は一部の画像信号であり、データ量が少なく、伝送が早くかつ処理に容易である。また、カメラ、センサ等によって取得された大量の画像信号とセンサ信号等のリアルタイムデータは意思決定エンジンによって処理されることにより、データ量が多く伝送速度が遅いせいでもたらした応答遅延を避けられ、意思決定エンジンの速い応答とクラウド側コントロールセンターの強力な処理能力の長所をフルに活用することができる。

本発明の実施形態に係る人工知能に基づく知能ロボットの制御方法は、知能ロボットの意思決定エンジンは、知能ロボットが受信したマルチモード入力信号に基づいてクラウド側処理情報を生成し、ユーザニーズを取得できるように、クラウド側処理情報をクラウド側コントロールセンターに送信して分析させ、ならびにユーザニーズ及び／又はマルチモード入力信号に基づいて知能ロボットを制御し、更に処理能力と応答速度に基づいて意思決定エンジンとクラウド側コントロールセンターとの分業で知能ロボットが受信したマルチモード信号を処理することにより、クラウド側コントロールセンターを用いて複雑な自然言語命令、複雑な意思決定、画像認識等を効率的に処理すると同時に、ローカル意思決定エンジンを用いて入力信号に基づいて知能ロボットをタイムリーで迅速に制御することもできるため、オンラインの大量データを十分に利用して知能ロボットの記憶コンピューティング能力及び複雑な意思決定の処理能力を高めると同時に、タイムリーで迅速に、インテリジェントにユーザの命令に応答でき、ユーザエクスペリエンスを向上させる。

上述実施形態を実現するため、本発明は人工知能に基づく知能ロボットの別の制御装置を更に提供する。

該制御装置は知能ロボットに設置されている意思決定エンジンに応用されることができる。

人工知能に基づく知能ロボットの制御装置であって、知能ロボットが受信したマルチモード入力信号に基づいてクラウド側処理情報を生成する生成モジュールと、ユーザニーズを取得できるように、クラウド側処理情報をクラウド側コントロールセンターに送信して分析させる送信モジュールと、ユーザニーズ及び／又はマルチモード入力信号に基づいて知能ロボットを制御する制御モジュールとを含む。

図７ａは本発明の一実施形態による人工知能に基づく知能ロボットの制御装置を示すブロック図である。

図７ａに示したように、該人工知能に基づく知能ロボットの制御装置は生成モジュール１１０、送信モジュール１２０と制御モジュール１３０とを含む。

具体的に、生成モジュール１１０は知能ロボットが受信したマルチモード入力信号に基づいてクラウド側処理情報を生成する。

送信モジュール１２０は、ユーザニーズを取得できるように、クラウド側処理情報をクラウド側コントロールセンターに送信して分析させる。

制御モジュール１３０は、ユーザニーズ及び／又はマルチモード入力信号に基づいて知能ロボットを制御する。

そのため、本発明の実施形態において、上述マルチモードの入力信号における一部の信号を処理するには強力なデータ処理能力が必要とされず、大量のオンライン知識データも頼らず、同時にこれらの信号を処理するには複数のセンサ信号を統合してリアルタイム処理しなければならず、最良の信号を取得する又は障害物を回避することができるように、直ちに動作機構等を制御して調整・応答し、調整して取得された信号を新たにリアルタイム処理することであれば、この過程は信頼性の低くかつ遅延のあるクラウド側コントロールセンターが適用されないため、意思決定エンジンを用いてこれらの信号を処理することができる。例えば、意思決定エンジンはユーザが入力した音声信号に基づいて音源定位、声紋認識等を行ったり、画像信号と環境センサ情報に基づいて周辺環境を感知したり、周辺環境に基づいて知能ロボットを制御して障害物回避、追従等の動作をさせたりすることができる。

また、上述マルチモードの入力信号における音声信号、画像信号、赤外線信号等に基づいて音声認識、音声合成、画像認識、地図情報収集と前処理などをする場合、例えば顔認識、背丈認識、動作認識、ジェスチャー認識等をする場合、送信モジュール１２０を用いてクラウド側コントロールセンターに送信して処理すれば、より精度の高い結果が得られる。

更に、本発明の一実施形態において、生成モジュール１１０を用いてマルチモードの入力信号を前処理し、前処理された結果をクラウド側処理情報として送信モジュール１２０によってクラウド側コントロールセンターに送信して更なる分析をすることもできる。

本発明の一実施形態によれば、生成モジュール１１０は、ユーザが入力した音声信号を複数の音声クリップに分割し、複数の音声クリップをクラウド側処理情報とする。その後送信モジュール１２０によってクラウド側コントロールセンターに送信して処理することもできる。クラウド側コントロールセンターは複数の音声クリップに対して音声認識をし、音声認識の結果に対して自然言語理解、意味分析、情感分析の中の一つ又は複数することによって、ユーザニーズを取得した後、ユーザニーズを意思決定エンジンに返送する。制御モジュール１３０はユーザニーズに基づいてマルチモードの入力信号を参照しながら知能ロボットを制御する。

具体的には、本発明の一実施形態において、ユーザニーズが動作制御である場合、制御モジュール１３０は、ユーザの位置を取得し、画像信号及び／又は環境感知信号に基づいて周辺地図を生成するとともに、周辺環境を感知し、ユーザの位置、周辺地図及び／又は周辺環境に基づいてユーザニーズに従って動作するように知能ロボットを制御するように用いられる。

図２は本発明の一実施形態に係る応用シーンを示す図である。図２に示したように、ユーザは予め設定した音声を通じて知能ロボットを音声で呼び起こすことができる。例えば、知能ロボットがユーザの入力した音声信号「度ロボットちゃん」を受信した場合、意思決定エンジンはユーザにフィードバックするとともに、音声命令リスニングモードに入るように知能ロボットを制御する。このモード下で、ユーザが「ついて来い」、「ついてきて」、「早く追いついて」等の自然言語で話した音声を入力した場合、分析させるため、送信モジュール１２０は該音声に対応する音声クリップをクラウド側コントロールセンターに送信する。クラウド側コントロールセンターは分析し、表現方法の不均一な命令に対して意味分析と均一化処理をし、ユーザニーズが均一で規範化する「追従」であることがわかり、それを知能ロボットに返送する。制御モジュール１３０は「追従」ニーズに基づいて命令ディスパッチをし、即ち動作制御プログラムを呼び出してユーザにお供して動作させるように知能ロボットを制御する。具体的に、制御モジュール１３０はユーザの位置を取得できるようにユーザに方位追従することができる。例えば、ユーザの音声信号に基づいてユーザに音源定位をし、カメラなどをユーザに向け、ユーザの位置変化に応じ移動させるように知能ロボットを制御する。更に、移動過程において、制御モジュール１３０は周辺地図と周囲環境に基づいて障害物回避及びルート検索をさせるように知能ロボットを制御する。

また、ユーザニーズがルート検索である場合、制御モジュール１３０は、画像信号及び／又は環境感知信号に基づいて周辺地図を生成し、知能ロボットの位置と目標位置を取得し、意思決定エンジンは周辺位置、知能ロボットの位置及び目標位置に基づいて知能ロボットが方向を示し、又は音声インターアクションを通して方向を示すように制御する。

図３は本発明の別の実施形態による応用シーンを示す図である。図３に示したように、ユーザは予め設定した音声を通じて知能ロボットを音声で呼び起こすことができる。例えば、知能ロボットがユーザの入力した音声信号「度ロボットちゃん」を受信した場合、知能ロボットはユーザにフィードバックするとともに、音声命令リスニングモードに入るように知能ロボットを制御する。このモード下で、ユーザが「中国国際航空はどこでチェックインするか」、「セキュリティ検査はどこで行うか」、「国際便の搭乗口はどこですか」等の音声を入力した場合、分析させるため、送信モジュール１２０は該音声に対応する音声クリップをクラウド側コントロールセンターに送信する。クラウド側コントロールセンターは分析し、ユーザニーズが「指定実体の位置」であることがわかり、それを知能ロボットに返送する。制御モジュール１３０は「指定実体の位置」ニーズに基づいて命令ディスパッチをし、即ち道案内プログラムを呼び出してユーザに道案内させるように知能ロボットを制御する。具体的に、自分の位置を判定するため、制御モジュール１３０は位置と方向を検出し、周辺地図において定位した後、指定実体の相対位置に基づいてユーザに道案内をする。例えば、転身と上肢の動作制御によって方向を示したり、音声を出力することによって方向を示したりするとともに、音声インターアクションによってユーザに道案内をすることができる。

本発明の別の実施形態において、生成モジュール１１０は画像信号及び／又は環境感知信号に基づいてユーザに対し動作検出をし、所定のルールに従って動作検出結果をクラウド側処理情報とする。その中で、生成モジュール１１０は取得されたユーザの画像信号に基づいてユーザの身体の動き、ジェスチャー、背丈認識等を認識し、それらに基づいてユーザの寝返り、ジャンプなどの動作検出をすることができる。その後所定のルールに従って動作検出結果をクラウド側処理情報としてクラウド側コントロールセンターに送信して処理する。例えば、検出されたそれぞれの動作及び対応するタイムスタンプ（動作の発生時間）をクラウド側コントロールセンターに送信する。クラウド側コントロールセンターは一定の期間の動作検出結果を分析し、分析結果を対応する知識ベースと比較して対応するユーザニーズを取得した後、それを知能ロボットに返送する。制御モジュール１３０はユーザニーズに基づいてマルチモードの入力信号を参照しながら知能ロボットを制御する。具体的には、制御モジュール１３０はユーザニーズに基づいて予め設定したモバイル端末に提示情報を送信するように知能ロボットを制御する。

図４は本発明の別の実施形態による応用シーンを示す図である。図４に示したように、生成モジュール１１０はユーザ（乳幼児）の赤外線画像を取得し、目標動作検出をすることができ、ユーザが寝返りしたと検出した場合、監護プログラムを呼び出して検出された寝返り動作と対応するタイムスタンプをクラウド側コントロールセンターに送信する。クラウド側コントロールセンターは受信した操作及び対応するタイムスタンプを記録し、一定の期間の記録結果に基づいて寝返りの頻度を計算し、それを母子知識ベースと比較し、該寝返りの頻度が小便等による不快であるせいだとわかれば、この結果を知能ロボットに返送する。制御モジュール１３０はこの結果を受信した後監護プログラムを呼び出し予め設定したモバイル端末に「おむつを替える」という提示情報を送信する。また、ユーザ画像の視野を確保できるように、制御モジュール１３０はユーザの動作に従って動作するように知能ロボットを制御することもでき、ユーザの動作、行為に基づいて知能ロボットを制御することもできる。これにより、親がタイムリーに乳幼児のおむつを替え、乳幼児の快適性を高めるだけでなく、親にとって乳幼児の状態を把握するのに便利で、親の監護の仕事量を減らす。

上述シーンは本発明の実施形態を理解するための例示的な説明に過ぎず、実際の応用において、実際の制御過程において、意思決定エンジンの各種の制御機能の制御は実際の制御に応じ呼び出され、しかもクラウド側コントロールセンターのオンライン処理結果と結合して行うことを理解すべきである。図５に示したように、知能ロボットがオンラインの場合、意思決定エンジンは画像信号、音声信号等をクラウド側処理情報としてクラウド側コントロールセンターに送信し、意味分析、機械翻訳、情感分析、顔認識、音声認識等（例えばクラウドサーバを通じて動作認識、ジェスチャー認識、背丈認識、地図情報収集と前処理等をする）ができるように、クラウド側コントロールセンターによってオンラインリソース、知識などに基づいてマルチモードの入力信号についてオンライン学習、情報検索、知識問答若しくは大量データを学習・トレーニングすることができる。意思決定エンジンは音声信号に基づいてユーザに対して音源定位、センサ信号に基づいて周囲環境を感知し、並びに定位結果、環境感知結果及びクラウド側コントロールセンターから返送した分析結果（例えば、音声に対応する命令、画像認識結果、画像情報に基づいて生成した周辺地図等）に基づいて知能ロボットの動作機構を制御し、知能ロボットの障害物回避や追従制御等の動作制御を実現する。意思決定エンジンとクラウド側コントロールセンターはネットワークを通じて接続し、データ伝送をすることができる。

従って、意思決定エンジンとクラウド側コントロールセンターとの間に伝送されたのはデータ量の少ない命令型音声クリップ及び「追従」のような抽象的で規範化した命令、又は一部の画像信号であり、データ量が少なく、伝送が早くかつ処理に容易である。また、カメラ、センサ等によって取得された大量の画像信号とセンサ信号等のリアルタイムデータは意思決定エンジンによって処理されることにより、データ量が多く伝送速度が遅いせいでもたらす応答遅延を避けられ、意思決定エンジンの速い応答とクラウド側コントロールセンターの強力な処理能力の長所をフルに活用することができる。

本発明の実施形態に係る人工知能に基づく知能ロボットの制御装置は、知能ロボットが受信したマルチモード入力信号に基づいてクラウド側処理情報を生成し、ユーザニーズを取得できるように、クラウド側処理情報をクラウド側コントロールセンターに送信して分析させ、ならびにユーザニーズ及び／又はマルチモード入力信号に基づいて知能ロボットを制御し、更に処理能力と応答速度に基づいて意思決定エンジンとクラウド側コントロールセンターとの分業で知能ロボットが受信したマルチモード信号を処理することにより、クラウド側コントロールセンターを用いて複雑な自然言語命令、複雑な意思決定、画像認識等を効率的に処理すると同時に、ローカル意思決定エンジンを用いて入力信号に基づいて知能ロボットをタイムリーで迅速に制御することもできるため、オンラインの大量データを十分に利用して知能ロボットの記憶コンピューティング能力及び複雑な意思決定の処理能力を高めると同時に、タイムリーで迅速に、インテリジェントにユーザの命令に応答でき、ユーザエクスペリエンスを向上させる。

図７ｂは本発明の別の実施形態による人工知能に基づく知能ロボットの制御装置を示すブロック図である。

図７ｂに示したように、該人工知能に基づく知能ロボットの制御装置は図７ａが示した上にＩＤ判定モジュール１４０を更に含む。

具体的に、ＩＤ判定モジュール１４０は画像信号に基づいて顔検出をし、画像信号が顔画像の信号である場合、顔画像の信号をクラウド側コントロールセンターに送信して顔認識をさせ、認識結果に基づいてユーザのＩＤを判定する。

本発明の実施形態において、複数の認識方式を単独でもしくは併用して使用することにより、より精度の高く、若しくは適用範囲の広く、便利なユーザのＩＤ確認方法が提供される。光線が悪く画質がよくない時、声紋認識の重みを上げ、騒々しくてピックアップの品質が良くないとき、顔認識の重みを上げる。

これにより、不正利用を防止し、同時にユーザのＩＤに基づいてユーザに個人データベースを構築し、ユーザに個性的なサービスを提供することができる。

上述実施形態を実現するため、本発明は人工知能に基づく知能ロボットの別の制御方法を提供する。

該方法はクラウド側コントロールセンターに応用されることができる。

人工知能に基づく知能ロボットの制御方法であって、クラウド側コントロールセンターは知能ロボットから送信されたクラウド側処理情報を受信するステップと、クラウド側コントロールセンターはクラウド側処理情報を分析してユーザニーズを取得するステップと、クラウド側コントロールセンターはユーザニーズを意思決定エンジンに返送するステップとを含む。

図８は本発明の別の実施形態による人工知能に基づく知能ロボットの制御方法を示すフローチャート図である。

図８に示したように、該人工知能に基づく知能ロボットの制御方法は以下のステップを含む。

クラウド側コントロールセンターは知能ロボットから送信されたクラウド側処理情報を受信するステップＳ８０１である。

本発明の実施形態において、クラウド側処理情報は、知能ロボットの意思決定エンジンがマルチモードの入力信号に基づいて生成することができる。クラウド側処理情報は意思決定エンジンがユーザの入力した音声信号を分割して得た複数の音声クリップ、検出された顔画像、動作検出結果（例えばジェスチャー、身体動作等）等の一つ又は複数であり、マルチモードの入力信号は、ユーザが入力した音声信号、画像信号及び／又は環境センサ信号を含む。具体的には、ユーザが入力した音声信号はユーザがマイクによって入力することができ、前記画像信号はカメラ又は赤外線センサによって入力されることができ、前記環境センサ信号は光センサ、赤外線センサ、温湿度センサ、有毒ガスセンサ、粒子状物質センサ、タッチモジュール、地理的位置定位モジュールと重力センサの中の一つ又は複数のセンサによって入力された信号を含む。

クラウド側コントロールセンターはクラウド側処理情報を分析してユーザニーズを取得するステップＳ８０２である。

クラウド側コントロールセンターはユーザニーズを意思決定エンジンに返送するステップＳ８０３である。

本発明の一実施形態において、クラウド情報が複数の音声クリップである場合、ステップＳ８０２は、前記複数の音声クリップに対し音声認識をするステップと、前記ユーザニーズを取得できるように、認識結果に対し、自然言語理解、意味分析、情感分析の中の一つ又は複数をするステップとを具体的に含む。

本発明の一実施形態において、前記クラウド側処理情報が動作検出結果である場合、ステップＳ８０２は、前記動作検出結果に対し統計分析をし、分析結果を対応する知識ベースと比較することによって前記ユーザニーズを取得するステップを含む。

本発明の一実施形態において、前記クラウド側処理情報が顔画像である場合、ステップＳ８０２は、前記顔画像に対し顔認識をし、顔認識結果を前記モバイル端末に返送するステップを具体的に含む。

本発明の実施形態において、意思決定エンジンはマルチモードの入力信号を加工・処理することができる。例えば、ユーザが入力した音声信号に基づいて音源定位、声紋認識等をしたり、画像信号と環境センサ情報に基づいて周辺地図と周囲環境を生成したり、画像信号に基づいてユーザの身体動作、ジェスチャー、背丈等を認識したりする。

上述信号を処理するには強力な処理能力を必要とせず、大量のオンライン知識データも頼らないため、意思決定エンジンによって処理することができる。しかし、ユーザニーズを分析するのに大量のデータ、言語資料、知識を必要とする処理もそのまま意思決定エンジンによって処理するとき、意思決定エンジンのデータ処理能力に制限され、失敗する、若しくは時間がかかりすぎる等の問題が生じる。例えば、音声信号を処理するには音声認識、自然言語理解、意味分析、機械翻訳、情感分析をしなければならないため、大量の言語資料とデータを使用してトレーニングしなければならないし、ユーザとのインターアクションをするには、ユーザの音声、動作の意味を分析した後、知識問答を通してフィードバックの内容を判定しなければならない。従って、こういう場合、クラウド側コントロールセンターに送信し、ユーザニーズを取得できるように、クラウド側コントロールセンターの記憶容量、強力なデータ処理能力を用いて分析した後、ユーザニーズに基づいてマルチモードの入力信号を参照しながら知能ロボットを制御する。

具体的には図２〜図４に示した応用シーンを参照する。

従って、意思決定エンジンとクラウド側コントロールセンターとの間に伝送されたのはデータ量の少ない命令型音声クリップ及び「追従」のような抽象的で規範化した命令、又は一部の画像信号であり、データ量が少なく、伝送が早くかつ処理が容易である。また、カメラ、センサ等によって取得された大量の画像信号とセンサ信号等のリアルタイムデータは意思決定エンジンによって処理されることにより、データ量が多く伝送速度が遅いせいでもたらした応答遅延を避けられ、意思決定エンジンの速い応答とクラウド側コントロールセンターの強力な処理能力の長所をフルに活用することができる。

本発明の実施形態による人工知能に基づく知能ロボットの制御方法は、知能ロボットの意思決定エンジンが送信したクラウド側処理情報を受信し、分析してユーザニーズを取得した後それを意思決定エンジンに返送し、意思決定エンジンによってユーザニーズ及び／又はマルチモードの入力信号に基づいて知能ロボットを制御することにより、該制御方法を用いて複雑な自然言語命令、複雑な意思決定、画像認識等を効率的に処理すると同時に、ローカル意思決定エンジンを用いて入力信号に基づいて知能ロボットをタイムリーで迅速に制御することもできるため、オンラインの大量データを十分に利用して知能ロボットの記憶コンピューティング能力及び複雑な意思決定の処理能力を高めると同時に、タイムリーで迅速に、インテリジェントにユーザの命令に応答でき、ユーザエクスペリエンスを向上させる。

該制御装置はクラウド側コントロールセンターに応用されることができる。

人工知能に基づく知能ロボットの制御装置であって、知能ロボットから送信されたクラウド側処理情報を受信する受信モジュールと、クラウド側処理情報を分析してユーザニーズを取得する分析モジュールと、ユーザニーズを意思決定エンジンに返送する復元モジュールとを含む。

図９は本発明の別の実施形態による人工知能に基づく知能ロボットの制御装置を示すブロック図である。

図９に示したように、本発明の実施形態に係る人工知能に基づく知能ロボットの制御装置は受信モジュール２１０、分析モジュール２２０と復元モジュール２３０を含む。

具体的に、受信モジュール２１０は知能ロボットから送信されたクラウド側処理情報を受信する。

本発明の実施形態において、クラウド側処理情報は、知能ロボットの意思決定エンジンがマルチモードの入力信号に基づいて生成することができる。クラウド側処理情報は意思決定エンジンがユーザの入力した音声信号を分割して得た複数の音声クリップ、検出された顔画像、動作検出結果（例えばジェスチャー、身体動作等）等の一つ又は複数であり、マルチモードの入力信号は、ユーザが入力した音声信号、画像信号及び／又は環境センサ信号を含む。具体的には、ユーザが入力した音声信号はユーザがマイクによって入力されることができ、前記画像信号はカメラ又は赤外線センサによって入力されることができ、前記環境センサ信号は光センサ、赤外線センサ、温湿度センサ、有毒ガスセンサ、粒子状物質センサ、タッチモジュール、地理的位置定位モジュールと重力センサの中の一つ又は複数のセンサによって入力された信号を含む。

分析モジュール２２０は、ユーザニーズを取得できるように、クラウド側処理情報を分析する。

復元モジュール２３０はユーザニーズを意思決定エンジンに返送する。

本発明の一実施形態において、クラウド情報が複数の音声クリップである場合、分析モジュール２２０は、前記複数の音声クリップに対し音声認識をし、前記ユーザニーズを取得できるように、認識結果に対し、自然言語理解、意味分析、情感分析の中の一つ又は複数をするように用いられる。

本発明の一実施形態において、前記クラウド側処理情報が動作検出結果である場合、分析モジュール２２０は、前記動作検出結果に対し統計・分析をし、分析結果を対応する知識ベースと比較することによって前記ユーザニーズを取得する。

本発明の一実施形態において、前記クラウド側処理情報が顔画像である場合、分析モジュール２２０は、前記顔画像に対し顔認識をし、顔認識結果を前記モバイル端末に返送するように用いられる。

具体的には図２〜図４に示した応用シーンを参照する。

本発明の実施形態に係る人工知能に基づく知能ロボットの制御装置は、知能ロボットの意思決定エンジンから送信されたクラウド側処理情報を受信し、分析してユーザニーズを取得した後それを意思決定エンジンに返送し、意思決定エンジンによってユーザニーズ及び／又はマルチモード入力信号に基づいて知能ロボット制御することにより、該制御装置を用いて複雑な自然言語命令、複雑な意思決定、画像認識等を効率的に処理すると同時に、ローカル意思決定エンジンを用いて入力信号に基づいて知能ロボットをタイムリーで迅速に制御することもできるため、オンラインの大量データを十分に利用して知能ロボットの記憶コンピューティング能力及び複雑な意思決定の処理能力を高めると同時に、タイムリーで迅速に、インテリジェントにユーザの命令に応答でき、ユーザエクスペリエンスを向上させる。

本発明の実施形態に係る知能ロボットはオープンシステムプラットフォームを有し、継続的にアップグレードすることができる。知能ロボットはオープンシステムプラットフォームを有するため、オープンインターフェースのプロトコルを通じて、各コンテンツのプロバイダは知能ロボットに様々なコンテンツとアプリケーションを開発してくれる。ソフトウェアにおいて、ＷｉＦｉ（登録商標）を通じて自動的にネットワークに接続することにより、知能ロボットは継続的にソフトをアップデート・アップグレードすることができるし、クラウド側コントロールセンターも継続的にインターネットから大量の新情報を取得することができるため、ユーザは煩瑣なソフトアップグレード操作をする必要もなく、すべてのアップデートとアップグレードは知能ロボットのバックステージにおいて静かに完成する。

本明細書の説明において、用語の“一つの実施形態”、“一部の実施形態”、“例示”、“具体的な例示”、又は“一部の例示”等の言葉とは、当該実施形態又は例示と合わせて説明された具体的な特徴、構成、材料又は特性が本発明の少なくとも一つの実施形態又は例示に含まれることを意味する。本明細書において、上記の用語の概略表現は必ずしも同じ実施形態又は例示を指さず、且つ、任意の一つ又は幾つの実施形態や例示において、説明された具体的な特徴、構成、材料又は特性を適当な方法で組み合わせることもできる。また、矛盾しない上で、同業者は本明細書に説明された異なる実施形態又は例示及び異なる実施形態又は例示の特徴を結合する及び組み合わせることができる。

また、本発明の説明には、用語「第一」、「第二」等は単に説明のためのみに用いられ、相対的な重要性に明示的にも暗示的にも関連づけられ、又は暗示的に指定した技術特徴の数量を指し示すように使用されるものではない。また、本発明の説明には、別途、明確に限定した場合を除き、用語「複数」は二つ又は二つ以上を指す。

フローチャートにおいてまたはここで他の方式で説明された論理またはステップは、一つ又は複数の論理機能又はステップを実現するための実行可能な命令の符号のモジュール、断片又は部分であり、並びに本発明の好ましい実施形態は他の形態も含み、例示された又は議論された順序（関与された機能とほぼ同じ方式又は逆の順序を含む）によらず実行できることは当業者であれば理解すべきである。

フローチャートにおいてまたはここで他の方式で説明された論理および/またはステップは、例えば、論理機能を実現するための実行可能な命令の順序リストであると考えられることができ、具体的に任意のコンピュータ読み取り可能な媒体においても実現することができ、命令実行システム、装置、またはデバイス（例えば、コンピュータに基づいたシステムであり、プロセッサのシステム又は他の命令実行システム、装置、またはデバイスから命令を取得して実行するシステムを含む）により使用されるためのものであり、又はこれらの命令実行システム、装置、またはデバイスと組合せて使用する、ためのものである。本明細書では、「コンピュータ読み取り可能な媒体」は、命令実行システム、装置、またはデバイスにより使用されるために、又はこれらの命令実行システム、装置、またはデバイスと組合せて使用するために、プログラムを含有、格納、通信、転送または伝送できるいずれかの装置であってもよい。コンピュータ可読媒体のより具体的な例示（非包括的リスト）は、一つ又は多くの配線の電気接続部（電子装置）、携帯型コンピュータディスクカートリッジ（磁気装置）、ランダム・アクセス・メモリ（RAM）、読み取り専用メモリ（ROM）、書き込み・消去可能な読み取り専用メモリ（EPROM又はフラッシュメモリ）、光ファイバ装置並びに携帯型ディスク読み取り専用メモリ（CDROM）を含む。また、コンピュータ可読媒体はそれにおいて前記プログラムを印刷する紙又はその他の媒体でもある。例えば紙又はその他の媒体に対して光学式走査して、編集、解釈又は必要なときその他の適切な方法で処理して電子的手段により前記プログラムを獲得し、それをコンピュータ記憶メモリに記憶するためである。

本発明の各部分は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの組み合わせで実現することができる。上記実施形態において、複数のステップ又は方法は、メモリに格納され且つ適切な命令実行システムにより実行されるソフトウェアまたはファームウェアで実現することができる。例えば、ハードウェアで実現する場合、他の実施形態と同様に、当該技術分野で公知の以下の技術におけるいずれか１つ又はそれらの組み合わせで実現することができる。データ信号に論理機能を実現するための論理ゲート回路を有するディスクリート論理回路、適切な組み合わせ論理ゲート回路を有する専用集積回路、プログラマブルゲートアレイ（PGA）、フィールドプログラマブルゲートアレイ（FPGA）などである。

上述の実施形態を実現する方法が係る全部又は部分のステップはプログラムによって関連するハードウェアに命令を実行して完成でき、前記プログラムはコンピュータの読み取り可能な記憶媒体に記憶され、プログラムを実行するとき、実施形態のステップの一つ又はその組合せを含むことを本技術分野の一般の技術者は理解すべきである。

また、本発明の実施形態に係る各機能ユニットは一つの処理モジュールに集成されてもよいし、各ユニット各自の物理的存在であってもよいし、ソフトウェアによるモジュールを利用してもよい。前記統合されたモジュールはハードウェアを利用してもできるし、ソフトウェアを利用してもよい。前記統合されたモジュールはソフトウェアを利用して独立するプロダクトとして販売又は利用されるとき、コンピュータの読み取り可能な記憶媒体に記憶されてもよい。

前記記憶媒体はＲＯＭ、ディスク又はＣＤ等である。以上本発明の実施形態を示して説明したが、当業者にとって理解できるのは、上記の実施形態は例示的なものに限らず、本発明を制限するように解釈される事が出来ない。本発明の原理と要旨から逸脱しない範囲で、これらの実施形態に対し様々な変更、修正、置換および変形をすることができる。
一側面において本発明は以下の発明を包含する。
（発明１）
意思決定エンジンとクラウド側コントロールセンターを含み、
前記意思決定エンジンは、知能ロボットに設置され、前記知能ロボットが受信したマルチモード入力信号に基づいてクラウド側処理情報を生成し、ユーザニーズを取得できるように、前記クラウド側処理情報をクラウド側コントロールセンターに送信して分析させ、ならびに前記ユーザニーズ及び／又は前記マルチモード入力信号に基づいて前記知能ロボットを制御し、
前記クラウド側コントロールセンターは、前記クラウド側処理情報を受信するとともに、該クラウド側処理情報を分析して前記ユーザニーズを取得し、該ユーザニーズを前記意思決定エンジンに返送する
ことを特徴とする人工知能に基づく知能ロボットの制御システム。
（発明２）
前記マルチモードの入力信号は、ユーザが入力した音声信号、画像信号及び／又は環境センサ信号を含む
ことを特徴とする発明１に記載のシステム。
（発明３）
前記意思決定エンジンは、前記ユーザが入力した音声信号を複数の音声クリップに分割し、前記複数の音声クリップを前記クラウド側処理情報とし、
前記クラウド側コントロールセンターは、前記複数の音声クリップに対して音声認識をし、音声認識の結果に対して自然言語理解、意味分析、情感分析の中の一つ又は複数をすることによって、前記ユーザニースを取得する、
ことを特徴とする発明２に記載のシステム。
（発明４）
前記ユーザニーズが動作制御である場合、前記意思決定エンジンは、
前記ユーザの位置を取得し、前記画像信号及び／又は環境感知信号に基づいて周辺地図を生成するとともに、周辺環境を感知し、前記ユーザの位置、周辺地図及び／又は周辺環境に基づいて前記ユーザニーズに従って動作するように前記知能ロボットを制御する
ことを特徴とする発明３に記載のシステム。
（発明５）
前記ユーザニーズがルート検索である場合、前記意思決定エンジンは、
前記画像信号及び／又は環境感知信号に基づいて周辺地図を生成し、前記知能ロボットの位置と目標位置を取得し、前記周辺位置、前記知能ロボットの位置及び目標位置に基づいて前記知能ロボットが方向を示し、又は音声インターアクションを通して方向を示すように制御する
ことを特徴とする発明３に記載のシステム。
（発明６）
前記意思決定エンジンは、前記画像信号及び／又は環境感知信号に基づいてユーザに対し動作検出をし、所定のルールに従って動作検出結果をクラウド側処理情報とし、
前記クラウド側コントロールセンターは、前記動作検出結果に対し統計分析をし、分析結果を対応する知識ベースと比較することによって前記ユーザニーズを取得する
ことを特徴とする発明２に記載のシステム。
（発明７）
前記意思決定エンジンは、前記ユーザニーズに基づいて予め設定したモバイル端末に提示情報を送信するように前記知能ロボットを制御する
ことを特徴とする発明６に記載のシステム。
（発明８）
前記意思決定エンジンは、
更に前記画像信号に基づいて顔検出をし、前記画像信号が顔画像の信号である場合、前記顔画像の信号を前記クラウド側コントロールセンターに送信して顔認識をさせ、認識結果に基づいてユーザのＩＤを判定する
ことを特徴とする発明２に記載のシステム。
（発明９）
知能ロボットの意思決定エンジンは前記知能ロボットが受信したマルチモード入力信号に基づいてクラウド側処理情報を生成するステップと、
ユーザニーズを取得できるように、前記意思決定エンジンは前記クラウド側処理情報をクラウド側コントロールセンターに送信して分析させるステップと、
前記意思決定エンジンは前記ユーザニーズ及び／又は前記マルチモード入力信号に基づいて前記知能ロボットを制御するステップとを含む
ことを特徴とする人工知能に基づく知能ロボットの制御方法。
（発明１０）
前記マルチモードの入力信号は、ユーザが入力した音声信号、画像信号及び／又は環境センサ信号を含む
ことを特徴とする発明９に記載の方法。
（発明１１）
前記意思決定エンジンは前記知能ロボットが受信したマルチモード入力信号に基づいてクラウド側処理情報を生成するステップは、
前記ユーザが入力した音声信号を複数の音声クリップに分割し、前記複数の音声クリップを前記クラウド側処理情報とするステップを具体的に含む
ことを特徴とする発明１０に記載の方法。
（発明１２）
前記ユーザニーズが動作制御である場合、前記意思決定エンジンは前記ユーザニーズ及び／又は前記マルチモード入力信号に基づいて前記知能ロボットを制御するステップは、
前記意思決定エンジンは前記ユーザの位置を取得し、前記画像信号及び／又は環境感知信号に基づいて周辺地図を生成するとともに、周辺環境を感知するステップと、
前記意思決定エンジンは前記ユーザの位置、周辺地図及び／又は周辺環境に基づいて前記ユーザニーズに従って動作するように前記知能ロボットを制御するステップとを含む
ことを特徴とする発明１１に記載の方法。
（発明１３）
前記ユーザニーズがルート検索である場合、前記意思決定エンジンは前記ユーザニーズ及び／又は前記マルチモード入力信号に基づいて前記知能ロボットを制御するステップは、
前記意思決定エンジンは、前記画像信号及び／又は環境感知信号に基づいて周辺地図を生成し、前記知能ロボットの位置と目標位置を取得するステップと、
前記意思決定エンジンは前記周辺位置、前記知能ロボットの位置及び目標位置に基づいて前記知能ロボットが方向を示し、又は音声インターアクションを通して方向を示すように制御するステップとを含む
ことを特徴とする発明１１に記載の方法。
（発明１４）
前記意思決定エンジンは前記知能ロボットが受信したマルチモード入力信号に基づいてクラウド側処理情報を生成するステップは、
前記画像信号及び／又は環境感知信号に基づいてユーザに対し動作検出をし、所定のルールに従って動作検出結果をクラウド側処理情報とするステップを具体的に含む
ことを特徴とする発明１０に記載の方法。
（発明１５）
前記意思決定エンジンは前記ユーザニーズ及び／又は前記マルチモード入力信号に基づいて前記知能ロボットを制御するステップは、
前記ユーザニーズに基づいて予め設定したモバイル端末に提示情報を送信するように前記知能ロボットを制御するステップを具体的に含む
ことを特徴とする発明１４に記載の方法。
（発明１６）
前記意思決定エンジンは前記画像信号に基づいて顔検出をし、前記画像信号が顔画像の信号である場合、前記顔画像の信号を前記クラウド側コントロールセンターに送信して顔認識をさせ、認識結果に基づいてユーザのＩＤを判定する
ことを特徴とする発明１０に記載の方法。
（発明１７）
知能ロボットが受信したマルチモード入力信号に基づいてクラウド側処理情報を生成する生成モジュールと、
ユーザニーズを取得できるように、前記クラウド側処理情報をクラウド側コントロールセンターに送信して分析させる送信モジュールと、
前記ユーザニーズ及び／又は前記マルチモード入力信号に基づいて前記知能ロボットを制御する制御モジュールとを含む
ことを特徴とする人工知能に基づく知能ロボットの制御装置。
（発明１８）
前記マルチモードの入力信号は、ユーザが入力した音声信号、画像信号及び／又は環境センサ信号を含む
ことを特徴とする発明１７に記載の装置。
（発明１９）
前記生成モジュールは、
前記ユーザが入力した音声信号を複数の音声クリップに分割し、前記複数の音声クリップを前記クラウド側処理情報とする
ことを特徴とする発明１８に記載の装置。
（発明２０）
前記ユーザニーズが動作制御である場合、前記制御モジュールは、
前記ユーザの位置を取得し、前記画像信号及び／又は環境感知信号に基づいて周辺地図を生成するとともに、周辺環境を感知し、
前記ユーザの位置、周辺地図及び／又は周辺環境に基づいて前記ユーザニーズに従って動作するように前記知能ロボットを制御する
ことを特徴とする発明１９に記載の装置。
（発明２１）
前記ユーザニーズがルート検索である場合、前記制御モジュールは、
前記画像信号及び／又は環境感知信号に基づいて周辺地図を生成し、前記知能ロボットの位置と目標位置を取得し、
前記周辺位置、前記知能ロボットの位置及び目標位置に基づいて前記知能ロボットが方向を示し、又は音声インターアクションを通して方向を示すように制御する
ことを特徴とする発明１９に記載の装置。
（発明２２）
前記生成モジュールは、
前記画像信号及び／又は環境感知信号に基づいてユーザに対し動作検出をし、所定のルールに従って動作検出結果をクラウド側処理情報とする
ことを特徴とする発明１８に記載の装置。
（発明２３）
前記制御モジュールは、
前記ユーザニーズに基づいて予め設定したモバイル端末に提示情報を送信するように前記知能ロボットを制御する
ことを特徴とする発明２２に記載の装置。
（発明２４）
前記画像信号に基づいて顔検出をし、前記画像信号が顔画像の信号である場合、前記顔画像の信号を前記クラウド側コントロールセンターに送信して顔認識をさせ、認識結果に基づいてユーザのＩＤを判定するＩＤ判定モジュールを更に含む
ことを特徴とする発明１８に記載の装置。
（発明２５）
クラウド側コントロールセンターは知能ロボットから送信されたクラウド側処理情報を受信するステップと、
前記クラウド側コントロールセンターは前記クラウド側処理情報を分析してユーザニーズを取得するステップと、
前記クラウド側コントロールセンターは前記ユーザニーズを前記意思決定エンジンに返送するステップとを含む
ことを特徴とする人工知能に基づく知能ロボットの制御方法。
（発明２６）
前記クラウド情報が複数の音声クリップである場合、前記クラウド側コントロールセンターは前記ユーザニーズを取得できるように前記クラウド側処理情報を分析するステップは、
前記複数の音声クリップに対し音声認識をするステップと、
前記ユーザニーズを取得できるように、認識結果に対し、自然言語理解、意味分析、情感分析の中の一つ又は複数をするステップとを具体的に含む
ことを特徴とする発明２５に記載の方法。
（発明２７）
前記クラウド側処理情報が動作検出結果である場合、前記クラウド側コントロールセンターは前記クラウド側処理情報を分析するステップは、
前記動作検出結果に対し統計分析をし、分析結果を対応する知識ベースと比較することによって前記ユーザニーズを取得するステップを具体的に含む
ことを特徴とする発明２５に記載の方法。
（発明２８）
前記クラウド側処理情報が顔画像である場合、前記クラウド側コントロールセンターは前記クラウド側処理情報を分析するステップは、
前記顔画像に対し顔認識をし、顔認識結果を前記モバイル端末に返送するステップを具体的に含む
ことを特徴とする発明２５に記載の方法。
（発明２９）
知能ロボットから送信されたクラウド側処理情報を受信する受信モジュールと、
前記クラウド側処理情報を分析してユーザニーズを取得する分析モジュールと、
前記ユーザニーズを前記意思決定エンジンに返送する復元モジュールとを含む
ことを特徴とする人工知能に基づく知能ロボットの制御装置。
（発明３０）
前記クラウド情報が複数の音声クリップである場合、前記クラウド側コントロールセンターは前記クラウド側処理情報を分析するステップは、
前記複数の音声クリップに対し音声認識をするステップと、
前記ユーザニーズを取得できるように、認識結果に対し、自然言語理解、意味分析、情感分析の中の一つ又は複数をするステップとを具体的に含む
ことを特徴とする発明２９に記載の装置。
（発明３１）
前記クラウド側処理情報が動作検出結果である場合、前記クラウド側コントロールセンターは前記クラウド側処理情報を分析するステップは、
前記動作検出結果に対し統計分析をし、分析結果を対応する知識ベースと比較することによって前記ユーザニーズを取得するステップを具体的に含む
ことを特徴とする発明２９に記載の装置。
（発明３２）
前記クラウド側処理情報が顔画像である場合、前記クラウド側コントロールセンターは前記クラウド側処理情報を分析するステップは、
前記顔画像に対し顔認識をし、顔認識結果を前記モバイル端末に返送するステップを具体的に含む
ことを特徴とする発明２９に記載の装置。

Claims

意思決定エンジンとクラウド側コントロールセンターを含み、
前記意思決定エンジンは、知能ロボットに設置され、前記知能ロボットが受信したマルチモード入力信号に基づいてクラウド側処理情報を生成し、オンラインの場合ではユーザニーズを取得できるように、前記クラウド側処理情報をクラウド側コントロールセンターに送信して分析させ、ならびに前記ユーザニーズに基づいて前記知能ロボットを制御し、オフラインの場合では前記マルチモード入力信号に基づいて前記知能ロボットを制御し、
前記クラウド側コントロールセンターは、前記クラウド側処理情報を受信するとともに、該クラウド側処理情報を分析して前記ユーザニーズを取得し、該ユーザニーズを前記意思決定エンジンに返送し、
前記マルチモードの入力信号は、ユーザが入力した音声信号及び環境センサ信号を含み、
前記意思決定エンジンは、前記環境センサ信号に基づいてユーザに対し動作検出をし、所定のルールに従って動作検出結果をクラウド側処理情報とし、
前記クラウド側コントロールセンターは、前記クラウド側処理情報が動作検出結果である場合、前記動作検出結果に対し統計分析をし、分析結果を対応する知識ベースと比較することによって前記ユーザニーズを取得し、
前記意思決定エンジンは、ユーザにより入力された音声信号を受信された場合、前記音声信号を複数の音声クリップに分割し、前記複数の音声クリップを前記クラウド側処理情報とし、
前記クラウド側コントロールセンターは、前記複数の音声クリップを音声認識し、音声認識の結果に対して自然言語理解、意味分析、情感分析の中の一つ又は複数をすることによって、前記ユーザニーズを取得する、
ことを特徴とする人工知能に基づく知能ロボットの制御システム。
前記意思決定エンジンは、前記ユーザニーズに基づいて予め設定したモバイル端末に提示情報を送信するように前記知能ロボットを制御する
ことを特徴とする請求項１に記載のシステム。
請求項１に記載の知能ロボットの制御システムを使用する知能ロボットの制御方法であって、
知能ロボットの意思決定エンジンは前記知能ロボットが受信したマルチモード入力信号に基づいてクラウド側処理情報を生成するステップと、
オンラインの場合ではユーザニーズを取得できるように、前記意思決定エンジンは前記クラウド側処理情報をクラウド側コントロールセンターに送信して分析させるステップと、
前記意思決定エンジンは、前記ユーザニーズ及び／又はオフラインの場合では前記マルチモード入力信号に基づいて、前記知能ロボットを制御するステップとを含み、
前記マルチモードの入力信号は、ユーザが入力した音声信号及び環境センサ信号を含み、
前記意思決定エンジンは前記知能ロボットが受信したマルチモード入力信号に基づいてクラウド側処理情報を生成するステップは、
前記環境センサ信号に基づいてユーザに対し動作検出をし、所定のルールに従って動作検出結果をクラウド側処理情報とするステップと、
前記ユーザが入力した音声信号を複数の音声クリップに分割し、前記複数の音声クリップを前記クラウド側処理情報とするステップと、を具体的に含む、
ことを特徴とする人工知能に基づく知能ロボットの制御方法。
前記意思決定エンジンは前記ユーザニーズ及び／又は前記マルチモード入力信号に基づいて前記知能ロボットを制御するステップは、
前記ユーザニーズに基づいて予め設定したモバイル端末に提示情報を送信するように前記知能ロボットを制御するステップを具体的に含む
ことを特徴とする請求項３に記載の方法。
知能ロボットが受信したマルチモード入力信号に基づいてクラウド側処理情報を生成する生成モジュールと、
オンラインの場合ではユーザニーズを取得できるように、前記クラウド側処理情報をクラウド側コントロールセンターに送信して分析させる送信モジュールと、
前記ユーザニーズ及び／又はオフラインの場合では前記マルチモード入力信号に基づいて前記知能ロボットを制御する制御モジュールとを含み、
前記マルチモードの入力信号は、ユーザが入力した音声信号又は環境センサ信号を含み、
前記生成モジュールは、
前記環境センサ信号に基づいてユーザに対し動作検出をし、所定のルールに従って動作検出結果をクラウド側処理情報とし、意思決定エンジンは、前記クラウド側コントロールセンターが前記動作検出結果に対し統計分析をし、分析結果を対応する知識ベースと比較することによって取得した前記ユーザニーズを受信し、
また前記生成モジュールは、前記ユーザが入力した音声信号を複数の音声クリップに分割し、前記複数の音声クリップを前記クラウド側処理情報とし、
前記意思決定エンジンは、前記クラウド側コントロールセンターが、前記複数の音声クリップを音声認識し、音声認識の結果に対して自然言語理解、意味分析、情感分析の中の一つ又は複数をすることによって取得した、前記ユーザニーズを受信する
ことを特徴とする人工知能に基づく知能ロボットの制御装置。
前記制御モジュールは、
前記ユーザニーズに基づいて予め設定したモバイル端末に提示情報を送信するように前記知能ロボットを制御する
ことを特徴とする請求項５に記載の装置。
請求項１に記載の知能ロボットの制御システムのクラウド側コントロールセンターを使用する処理方法であって、
オンラインの場合に、クラウド側コントロールセンターは知能ロボットから送信されたクラウド側処理情報を受信するステップと、
前記クラウド側コントロールセンターは前記クラウド側処理情報を分析してユーザニーズを取得するステップと、
前記クラウド側コントロールセンターは前記ユーザニーズを意思決定エンジンに返送するステップとを含み、
前記クラウド側処理情報が動作検出結果である場合、前記クラウド側コントロールセンターが前記クラウド側処理情報を分析するステップは、
前記動作検出結果に対し統計分析をし、分析結果を対応する知識ベースと比較することによって前記ユーザニーズを取得するステップを具体的に含む、ことを特徴とするクラウド側コントロールセンターの処理方法。
オンラインの場合に、知能ロボットから送信されたクラウド側処理情報を受信する受信モジュールと、
前記クラウド側処理情報を分析してユーザニーズを取得する分析モジュールと、
前記ユーザニーズを前記知能ロボットに設置された意思決定エンジンに返送する復元モジュールとを含み、
前記クラウド側処理情報が動作検出結果である場合、前記クラウド側コントロールセンターは、
前記動作検出結果に対し統計分析をし、分析結果を対応する知識ベースと比較することによってユーザニーズを取得するステップを具体的に含み、
前記クラウド側処理情報が複数の音声クリップである場合、前記クラウド側コントロールセンターは前記クラウド側処理情報を分析するステップは、
前記複数の音声クリップに対し音声認識をするステップと、
前記ユーザニーズを取得できるように、認識結果に対し、自然言語理解、意味分析、情感分析の中の一つ又は複数をするステップとを具体的に含む
ことを特徴とするクラウド側コントロールセンター。