JP2021105796A - Artificial intelligence system - Google Patents
Artificial intelligence system Download PDFInfo
- Publication number
- JP2021105796A JP2021105796A JP2019236232A JP2019236232A JP2021105796A JP 2021105796 A JP2021105796 A JP 2021105796A JP 2019236232 A JP2019236232 A JP 2019236232A JP 2019236232 A JP2019236232 A JP 2019236232A JP 2021105796 A JP2021105796 A JP 2021105796A
- Authority
- JP
- Japan
- Prior art keywords
- artificial intelligence
- unit
- user
- information
- intelligence unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Traffic Control Systems (AREA)
Abstract
Description
本開示は、人工知能システムに関する。 The present disclosure relates to an artificial intelligence system.
従来、学習、推論、判断といった人間の持つ機能を有する人工知能システムが知られている。言語の理解、推論、問題解決等の知的行動を人間に代わって人工知能システムが行う場合、当該人工知能システムは、インターネット等を介して外部のリソースから情報を取得する必要がある。しかしながら、外部との間で情報を授受することに起因して、外部から不正に人工知能システムにアクセスされるおそれがあるので、ユーザの個人情報保護の観点から、外部から人工知能システムにアクセスされることを防ぐ必要がある。 Conventionally, an artificial intelligence system having human functions such as learning, reasoning, and judgment has been known. When an artificial intelligence system performs intellectual actions such as language understanding, reasoning, and problem solving on behalf of humans, the artificial intelligence system needs to acquire information from an external resource via the Internet or the like. However, since there is a risk of unauthorized access to the artificial intelligence system from the outside due to the exchange of information with the outside, the artificial intelligence system is accessed from the outside from the viewpoint of protecting the personal information of the user. You need to prevent that.
例えば、特許文献1には、オープンな環境における情報交換をアシストする、または、自律的に行う第1の人工知能モジュールと、情報交換に伴う処理をクローズドな環境で行う第2の人工知能モジュールとを有するシステムが開示されている。
For example,
しかしながら、特許文献1に記載のシステムでは、第1の人工知能モジュールが外部からアクセス可能であるオープンな環境であるので、ユーザの個人情報が外部に漏洩する恐れがある。
However, in the system described in
本開示の目的は、ユーザの情報のセキュリティを向上させることが可能な人工知能システムを提供することである。 An object of the present disclosure is to provide an artificial intelligence system capable of improving the security of user information.
本開示に係る人工知能システムは、
ユーザの情報に基づいて機械学習を行う人工知能システムであって、
前記人工知能システムの外部からアクセス可能な非セキュア環境において、前記ユーザの情報を取得し、かつ、前記ユーザの情報に基づく学習結果を前記外部に出力する第1人工知能部と、
前記外部からアクセス不可能なセキュア環境において、前記ユーザの情報を前記第1人工知能部から取得して前記ユーザの情報に関するデータを蓄積する第2人工知能部と、
を備え、
前記第1人工知能部は、前記外部から取得した前記ユーザの情報を前記第2人工知能部に引き渡した場合、当該ユーザの情報を前記第1人工知能部にかかる前記非セキュア環境から削除する。
The artificial intelligence system according to this disclosure is
An artificial intelligence system that performs machine learning based on user information.
In a non-secure environment accessible from the outside of the artificial intelligence system, a first artificial intelligence unit that acquires the user's information and outputs a learning result based on the user's information to the outside.
In a secure environment inaccessible from the outside, a second artificial intelligence unit that acquires the user's information from the first artificial intelligence unit and accumulates data related to the user's information.
With
When the first artificial intelligence unit delivers the user's information acquired from the outside to the second artificial intelligence unit, the first artificial intelligence unit deletes the user's information from the non-secure environment related to the first artificial intelligence unit.
本開示によれば、ユーザの情報のセキュリティを向上させることができる。 According to the present disclosure, the security of user information can be improved.
以下、本開示の実施の形態を図面に基づいて詳細に説明する。図1は、本開示の実施の形態に係る人工知能システム1を示す図である。
Hereinafter, embodiments of the present disclosure will be described in detail with reference to the drawings. FIG. 1 is a diagram showing an
図1に示すように、人工知能システム1は、例えば車両に組み込まれるコンピュータシステムであり、SoC(System on Chip)に組み込まれるシステムである。人工知能システム1は、ユーザの情報に基づいて機械学習する機能を有し、ハードウェアプラットフォーム10と、第1OS(Operating System)20と、第2OS30と、データ授受部40と、第1人工知能部50と、第2人工知能部60とを備える。
As shown in FIG. 1, the
ハードウェアプラットフォーム10は、図示しないCPU(Central Processing Unit)等を有するプロセッサユニットを含んでおり、複数のコンピュータプログラムの実行環境を提供する。複数のコンピュータプログラムの実行環境には、セキュア環境と非セキュア環境とが含まれる。
The
セキュア環境は、外部からアクセス不可能な環境であり、例えば、メモリに保安領域が設定され、その保安領域へのアクセスを禁止するプロセッサユニットの支援機能により実現される環境である。 The secure environment is an environment inaccessible from the outside, for example, an environment realized by a support function of a processor unit in which a security area is set in a memory and access to the security area is prohibited.
非セキュア環境は、外部からアクセス可能な環境であり、セキュア環境よりも保安レベルが低い環境である。非セキュア環境では、例えば、プロセッサユニットの支援機能によりメモリの保安領域へのアクセスが禁止される。 A non-secure environment is an environment that can be accessed from the outside and has a lower security level than a secure environment. In a non-secure environment, for example, the support function of the processor unit prohibits access to the security area of the memory.
ハードウェアプラットフォーム10は、非セキュア記憶部11とセキュア記憶部12とを含む。非セキュア記憶部11は、非セキュア環境で使用されるメモリである。セキュア記憶部12は、セキュア環境で使用されるメモリである。
The
また、ハードウェアプラットフォーム10は、人工知能システム1の外部からユーザの情報等が入力され、かつ、人工知能システム1における学習結果を出力するための入出力部13を有する。
Further, the
第1OS20は、非セキュア環境で稼働するOSである。第2OS30は、セキュア環境で稼働するOSである。 The first OS 20 is an OS that operates in a non-secure environment. The second OS 30 is an OS that operates in a secure environment.
データ授受部40は、1つのハードウェアプラットフォーム10上において、第1OS20および第2OS30を切り替えて実行させる機能を有する。データ授受部40は、いわゆるハイパーバイザーであり得る。データ授受部40は、1つのハードウェアプラットフォーム10上において複数のOSを仮想化し得る。データ授受部40は、例えばプロセッサユニットがハードウェアとして持つ支援機構を用いて複数のOSを分離する。
The
データ授受部40は、第1OS20(第1人工知能部50)と第2OS30(第2人工知能部60)との間で、人工知能システム1の外部に漏洩することなく、ユーザの個人情報に関するデータを授受させる構成を有する。データ授受部40は、ハードウェアの仮想化技術を利用して第2OS30(第2人工知能部60)側への、外部からのアクセスを抑制する。
The
第1人工知能部50は、第1OS20上、つまり、非セキュア環境で動作するアプリケーション(例えば人工知能アプリケーション)であり、非セキュア学習部51と、動作判定部52とを有する。
The first
非セキュア学習部51は、入出力部13を介して人工知能システム1の外部からの情報を取得し、当該情報に基づいて初期学習を行う。非セキュア学習部51は、教師データを用いた初期学習を行うことにより、例えば基本的な意図推定、予測支援、タスクエージェント、自律学習等の機械学習処理を行うことができる。
The
基本的な意図推定の機能は、例えば、人工知能システム1に対するユーザの言動(発話など)を理解(認識)したり、その言動の意図を推定すること等である。予測支援の機能は、例えば、ユーザの行動(ユーザが車両によって行く頻度の高い場所(自宅、職場等)や車両によって通る頻度の高い経路)を先読み(事前の推定)し動作を支援すること等である。
The basic intention estimation function is, for example, to understand (recognize) the user's words and actions (utterances, etc.) with respect to the
タスクエージェントの機能は、例えば、ユーザへのサービスを最終決定すること等である。自律学習の機能は、例えば、ユーザの言動(発話など)後に行われる行動を学習すること等である。 The function of the task agent is, for example, to finalize the service to the user. The function of autonomous learning is, for example, learning an action performed after a user's words and actions (speaking, etc.).
非セキュア学習部51は、上記の機能を初期学習により取得したら、人工知能システム1の外部から入出力部13等を介してユーザの動的学習データを取得する。
After acquiring the above functions by the initial learning, the
ユーザの動的学習データについては、ユーザ自身の情報、ユーザの言動の情報(言動の履歴など)、ユーザの行動履歴の情報、ユーザによる車両の走行データに関する情報(走行データの履歴など)、ユーザの位置データに関する情報(位置の変化の履歴など)等が含まれる。ユーザ自身の情報については、ユーザの日常における自宅の不在時間、車両の移動経路、ユーザの運転特性、ユーザの嗜好性等の情報が含まれる。また、ユーザの動的学習データについては、ユーザによる機器の操作情報、ユーザの運転操作の情報、ユーザの車両内の振る舞いの情報、ユーザの車内環境(座席の位置やミラーの位置等)の情報等が含まれていても良い。 Regarding the user's dynamic learning data, the user's own information, the user's behavior information (word and behavior history, etc.), the user's behavior history information, the user's vehicle driving data information (driving data history, etc.), and the user. Information about the position data (history of position change, etc.) is included. The user's own information includes information such as the user's daily absence time at home, the vehicle's movement route, the user's driving characteristics, and the user's preference. Regarding the user's dynamic learning data, the user's device operation information, the user's driving operation information, the user's behavior information in the vehicle, and the user's vehicle environment (seat position, mirror position, etc.) information. Etc. may be included.
非セキュア学習部51は、ユーザの動的学習データを取得した後、データ授受部40を介して動的学習データを第2人工知能部60に引き渡す。非セキュア学習部51は、動的学習データを第2人工知能部60に引き渡した後、当該動的学習データを非セキュア環境から削除する。
After acquiring the user's dynamic learning data, the
なお、非セキュア環境で削除される動的学習データについては、非セキュア記憶部11に一時的に記憶される動的学習データも含まれる。
The dynamic learning data deleted in the non-secure environment includes the dynamic learning data temporarily stored in the
これにより、人工知能システム1の外部よりアクセスされる可能性のある非セキュア環境である第1人工知能部50に係る部分において、他のユーザに認識可能である動的学習データが削除されることとなる。すなわち、動的学習データは、発生する度に、セキュア環境に保存されるとともに、非セキュア環境から速やかに削除されるので、外部に漏洩することを防止できる。
As a result, the dynamic learning data that can be recognized by other users is deleted in the part related to the first
非セキュア学習部51は、データ授受部40を介して第2人工知能部60より後述する特徴量データを取得する。特徴量データは、後述するが動的学習データを特徴量化した情報であり、ユーザおよび他のユーザ(人間)によって認識不可能な情報である。
The
非セキュア学習部51は、データ授受部40を介して第2人工知能部60より取得した特徴量データに基づいて機械学習を行う。非セキュア学習部51による機械学習は、特徴量データに基づいて行われる。つまり、非セキュア学習部51による機械学習の学習結果等は、ユーザなどには認識不可能な情報である。
The
動作判定部52は、非セキュア学習部51の学習結果に基づいて人工知能システム1の動作判定を行う。動作判定部52の動作判定結果(動的学習データに基づく学習結果)は、図示しない出力処理部等を介して入出力部13より人工知能システム1の外部に出力される。
The
動作判定部52の動作判定結果としては、例えばユーザの言動または操作による指示等が動的学習データである場合、当該指示に対する動作内容に関するもの(ユーザへの応答、車両や車内機器の動作、車両外部の道路状況、地図情報の内容等)となる。
As the operation determination result of the
動作判定結果は、出力処理部等によって、音声処理(音声認識など)、画像処理(画像認識、物体認識など)等の所定処理が施されてユーザが認識できる状態となって入出力部13より出力される。
The operation determination result is subjected to predetermined processing such as voice processing (voice recognition, etc.) and image processing (image recognition, object recognition, etc.) by the output processing unit, etc., and is in a state where the user can recognize it from the input /
第2人工知能部60は、第2OS30上、つまり、セキュア環境で動作するアプリケーション(例えば人工知能アプリケーション)であり、人工知能システム1の外部からのアクセス不能である。第2人工知能部60は、取得部61と、特徴量化処理部62とを有する。
The second
取得部61は、データ授受部40を介して動的学習データを第1人工知能部50から取得して、その動的学習データのデータをセキュア記憶部12に蓄積する。
The
特徴量化処理部62は、セキュア記憶部12に蓄積した動的学習データを用いて生成した特徴量をユーザに認識不可能な特徴量データに変換する。そして、特徴量化処理部62は、その特徴量データを、データ授受部40を介して第1人工知能部50に引き渡す。もしくは、さらにセキュリティを強化するため、特徴量化処理部62は、動的学習データを特徴量データに変換し、その特徴量データを暗号化して第1人工知能部50に引き渡してもよい。
The feature
例えば、ユーザがカーナビゲーション等の車内機器を操作して目的地を勤務地に設定した指示を車内機器にしたとする。この場合、当該指示を動的学習データとして第1人工知能部50が受け取った場合、当該動的学習データが第2人工知能部60に引き渡される。その後、当該動的学習データが第1人工知能部50で削除される。
For example, suppose that a user operates an in-vehicle device such as a car navigation system and gives an instruction to set a destination as a work location in the in-vehicle device. In this case, when the first
これにより、外部から第1人工知能部50にアクセスされても、ユーザの動的学習データを漏洩されることがなくなる。
As a result, even if the first
第2人工知能部60で動的学習データを受け取ったら、第2人工知能部60は、セキュア環境において蓄積されたユーザの過去の行動履歴等の動的学習データを特徴量化し、第1人工知能部50に引き渡す。または、第2人工知能部60は、特徴量データを暗号化処理して、その暗号化した特徴量データを第1人工知能部50に引き渡す。
When the second
このように、動的学習データを第2人工知能部60で受け取っても、第2人工知能部60はセキュア環境であるので、外部に動的学習データが漏洩されない。また、蓄積された動的学習データを第1人工知能部50に引き渡す際、当該動的学習データを特徴量化するので、第1人工知能部50で特徴量データが外部に漏洩しても、他のユーザが認識することができない。
In this way, even if the second
第1人工知能部50で特徴量データを受け取ったら、第1人工知能部50は、特徴量データに基づいて機械学習を行い、ユーザが勤務地に向かう際、利用する頻度の高い移動経路を順に車内機器に表示するような学習結果を外部に出力する。
When the first
これに対して、ユーザが選択した移動経路を動的学習データとして第1人工知能部50が受け取ると、当該動的学習データを第2人工知能部60に引き渡す。その後、当該動的学習データは、第1人工知能部50で削除される。
On the other hand, when the first
第2人工知能部60で動的学習データを受け取ったら、第2人工知能部60は、この動的学習データに係る移動経路の情報を第2人工知能部60で蓄積していく。
When the second
上記のようなサイクルにより、本実施の形態では、外部に動的学習データが漏洩することなく、人工知能システム1における機械学習が行われる。
According to the cycle as described above, in the present embodiment, machine learning in the
すなわち、本実施の形態では、ユーザの動的学習データ(個人情報)の漏洩を抑制しつつ、当該動的学習データに基づいて学習することができ、ひいてはユーザの情報のセキュリティを向上させることができる。 That is, in the present embodiment, it is possible to learn based on the dynamic learning data while suppressing the leakage of the user's dynamic learning data (personal information), and eventually to improve the security of the user's information. can.
また、データ授受部40としてハイパーバイザーを用いるので、1つのSoCで人工知能システム1を構成することができる。その結果、人工知能システム1の小型化、人工知能システム1が搭載される車両の省スペース化、人工知能システム1全体におけるコストダウンを図ることができる。
Further, since the hypervisor is used as the
また、第1人工知能部50および第2人工知能部60は、学習、推論および判断が可能なコンピュータシステム(ソフトウェア)であれば良い。第1人工知能部50および第2人工知能部60は、例えば、決定木、帰納論理プログラミング、強化学習、ベイジアンネットワーク、サポートベクターマシン等を含むデータ・知識型AI(Artificial Intelligence)であっても良い。また、第1人工知能部50および第2人工知能部60は、例えば、ニュートラルネットワーク、ディープニュートラルネットワークを含む脳型AIであっても良いし、ファジィアルゴリズム、遺伝的アルゴリズム、進化的アルゴリズムを用いたものであっても良い。また、第1人工知能部50および第2人工知能部60は、例えば、これらをディープラーニングの技術を用いて進化させたものであっても良い。
Further, the first
なお、上記実施の形態では、第1人工知能部50が機械学習を行っていたが、本開示はこれに限定されず、例えば第2人工知能部60が機械学習を行っても良い。つまり、図2に示すように、第2人工知能部60がセキュア学習部63を有する構成であっても良い。
In the above embodiment, the first
セキュア学習部63は、蓄積した動的学習データから生成された特徴量に基づいて機械学習を行う。セキュア学習部63の学習結果を、データ授受部40を介して第1人工知能部50に引き渡す。または、特徴量化処理部62は、セキュア学習部63の学習結果を特徴量データに暗号化し、データ授受部40を介して第1人工知能部50に引き渡す。そして、第1人工知能部50の動作判定部52は、学習結果に基づいて動作判定を行う。
The
このような構成であっても、ユーザの動的学習データ(個人情報)の漏洩を抑制しつつ、当該動的学習データに基づいて学習することができ、ひいてはユーザの情報のセキュリティを向上させることができる。 Even with such a configuration, it is possible to learn based on the dynamic learning data while suppressing the leakage of the user's dynamic learning data (personal information), and eventually improve the security of the user's information. Can be done.
ところで、上記のような人工知能システム1が長期的に使用される場合や、ユーザが変更になる場合等、第1人工知能部50のアプリケーションをアップデートしたり、人工知能部において使用中のモデルから別のモデルに変更する必要が生じることがある。
By the way, when the
このような場合、第1人工知能部50が人工知能システム1における機能の変更指令を取得する。そして、この場合、第2人工知能部60は、第1人工知能部50における初期学習に係る情報を初期化する。また、第2人工知能部60は、ユーザの変更がない場合、セキュア環境において蓄積した動的学習データに関するデータを、変更後の機能に対応する特徴量データ、学習モデルに変換する。第2人工知能部60は、例えば、特徴量として動的学習データを平均値に変換するアルゴリズムを、分散値を変換するアルゴリズムに変更する。
In such a case, the first
こうすることにより、ユーザの動的学習データ(個人情報)の漏洩を抑制しつつ、人工知能システム1における機能の変更を行うことができる。
By doing so, it is possible to change the function in the
また、上記実施の形態では、データ授受部40がハイパーバイザーで構成されていたが、本開示はこれに限定されない。例えば、第1OSと第2OSとが異なるハードウェアプラットフォームに搭載される構成において、データ授受部が第1OSと第2OSとの間でデータを授受する構成であっても良い。
Further, in the above embodiment, the
また、上記実施の形態では、人工知能システム1として車両を例示したが、本開示はこれに限定されず、例えば、家、工場等、車両以外のシステムであっても良い。
Further, in the above embodiment, the vehicle is illustrated as the
その他、上記実施の形態は、何れも本開示を実施するにあたっての具体化の一例を示したものに過ぎず、これらによって本開示の技術的範囲が限定的に解釈されてはならないものである。すなわち、本開示はその要旨、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。 In addition, the above embodiments are merely examples of embodiment of the present disclosure, and the technical scope of the present disclosure should not be construed in a limited manner by these. That is, the present disclosure can be implemented in various forms without departing from its gist or its main features.
本開示の人工知能システムは、ユーザの情報のセキュリティを向上させることが可能な装置として有用である。 The artificial intelligence system of the present disclosure is useful as a device capable of improving the security of user information.
1 人工知能システム
10 ハードウェアプラットフォーム
11 非セキュア記憶部
12 セキュア記憶部
13 入出力部
20 第1OS
30 第2OS
40 データ授受部
50 第1人工知能部
51 非セキュア学習部
52 動作判定部
60 第2人工知能部
61 取得部
62 特徴量化処理部
1
30 Second OS
40
Claims (9)
前記人工知能システムの外部からアクセス可能な非セキュア環境において、前記ユーザの情報を取得し、かつ、前記ユーザの情報に基づく学習結果を前記外部に出力する第1人工知能部と、
前記外部からアクセス不可能なセキュア環境において、前記ユーザの情報を前記第1人工知能部から取得して前記ユーザの情報に関するデータを蓄積する第2人工知能部と、
を備え、
前記第1人工知能部は、前記外部から取得した前記ユーザの情報を前記第2人工知能部に引き渡した場合、当該ユーザの情報を前記第1人工知能部にかかる前記非セキュア環境から削除する、
人工知能システム。 An artificial intelligence system that performs machine learning based on user information.
In a non-secure environment accessible from the outside of the artificial intelligence system, a first artificial intelligence unit that acquires the user's information and outputs a learning result based on the user's information to the outside.
In a secure environment inaccessible from the outside, a second artificial intelligence unit that acquires the user's information from the first artificial intelligence unit and accumulates data related to the user's information.
With
When the first artificial intelligence unit delivers the user's information acquired from the outside to the second artificial intelligence unit, the first artificial intelligence unit deletes the user's information from the non-secure environment related to the first artificial intelligence unit.
Artificial intelligence system.
請求項1に記載の人工知能システム。 The second artificial intelligence unit converts the accumulated data related to the user's information into feature amount data that cannot be recognized by the user, and delivers the feature amount data to the first artificial intelligence unit.
The artificial intelligence system according to claim 1.
請求項2に記載の人工知能システム。 The first artificial intelligence unit performs machine learning based on the feature amount data received from the second artificial intelligence unit, and outputs the learning result to the outside.
The artificial intelligence system according to claim 2.
前記第1人工知能部は、前記第2人工知能部より受け取った特徴量データを用いて第1人工知能部で機械学習を行った学習結果、または、前記第2人工知能部より受け取った学習結果を前記外部に出力する。
請求項2に記載の人工知能システム。 The second artificial intelligence unit performs machine learning based on the user's information, and delivers the feature amount data or the learning result calculated using the feature amount data to the first artificial intelligence unit.
The first artificial intelligence unit is a learning result of machine learning performed by the first artificial intelligence unit using the feature amount data received from the second artificial intelligence unit, or a learning result received from the second artificial intelligence unit. Is output to the outside.
The artificial intelligence system according to claim 2.
請求項1〜4の何れか1項に記載の人工知能システム。 When the first artificial intelligence unit acquires a function change command in the artificial intelligence system, the second artificial intelligence unit initializes information related to initial learning in the first artificial intelligence unit.
The artificial intelligence system according to any one of claims 1 to 4.
請求項1〜5の何れか1項に記載の人工知能システム。 When the first artificial intelligence unit acquires a function change command in the artificial intelligence system, the second artificial intelligence unit converts the accumulated data related to the user's information into data corresponding to the changed function. ,
The artificial intelligence system according to any one of claims 1 to 5.
請求項1〜6の何れか1項に記載の人工知能システム。 A data transfer unit is provided between the first artificial intelligence unit and the second artificial intelligence unit to transfer data related to the user's information without leaking to the outside.
The artificial intelligence system according to any one of claims 1 to 6.
請求項7に記載の人工知能システム。 The data transfer unit virtualizes a computer on one hardware platform, and switches and executes a first OS including the first artificial intelligence unit and a second OS including the second artificial intelligence unit.
The artificial intelligence system according to claim 7.
請求項1〜8の何れか1項に記載の人工知能システム。 A computer system built into a vehicle,
The artificial intelligence system according to any one of claims 1 to 8.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019236232A JP2021105796A (en) | 2019-12-26 | 2019-12-26 | Artificial intelligence system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019236232A JP2021105796A (en) | 2019-12-26 | 2019-12-26 | Artificial intelligence system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021105796A true JP2021105796A (en) | 2021-07-26 |
Family
ID=76918898
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019236232A Pending JP2021105796A (en) | 2019-12-26 | 2019-12-26 | Artificial intelligence system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2021105796A (en) |
-
2019
- 2019-12-26 JP JP2019236232A patent/JP2021105796A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11113104B2 (en) | Task parallel processing method, apparatus and system, storage medium and computer device | |
Bohez et al. | Value constrained model-free continuous control | |
US10474934B1 (en) | Machine learning for computing enabled systems and/or devices | |
US20090018696A1 (en) | Method and Device for Controlling a Robot | |
KR20190056720A (en) | Method and device for learning neural network | |
EP3377432B1 (en) | A method and an apparatus for determining an allocation decision for at least one elevator | |
JP7003753B2 (en) | Search point determination program, search point determination method and search point determination device | |
KR20190056940A (en) | Method and device for learning multimodal data | |
Mahadevan | Enhancing transfer in reinforcement learning by building stochastic models of robot actions | |
JP4699598B2 (en) | Data processing apparatus and storage medium operating as problem solver | |
Kakas et al. | Layered strategies and protocols for argumentation-based agent interaction | |
WO2020092437A1 (en) | Determining control policies by minimizing the impact of delusion | |
Keller et al. | Task planning for an autonomous service robot | |
Moon et al. | Rethinking value function learning for generalization in reinforcement learning | |
US20210264307A1 (en) | Learning device, information processing system, learning method, and learning program | |
Antonelli et al. | Incorporating set-based control within the singularity-robust multiple task-priority inverse kinematics | |
JP2021105796A (en) | Artificial intelligence system | |
JPWO2019021401A1 (en) | Reinforcement learning device, reinforcement learning method, and reinforcement learning program recording medium | |
CN114529010A (en) | Robot autonomous learning method, device, equipment and storage medium | |
JP2021105798A (en) | Artificial intelligence system | |
CN110097180B (en) | Computer device, data processing method, and storage medium | |
Sawyer et al. | Visualizing the analysis of dynamically adaptive systems using i* and dsls | |
WO2020115903A1 (en) | Learning device, learning method, and learning program | |
CN117290479A (en) | Visual language navigation method and device based on inference link autonomous evolution strategy | |
Carwehl et al. | Formal Synthesis of Uncertainty Reduction Controllers |