WO2021084810A1

WO2021084810A1 - 情報処理装置及び情報処理方法、並びに人工知能モデル製造方法

Info

Publication number: WO2021084810A1
Application number: PCT/JP2020/027336
Authority: WO
Inventors: 千里沼岡; 藤田　雅博
Original assignee: ソニー株式会社
Priority date: 2019-10-30
Filing date: 2020-07-14
Publication date: 2021-05-06
Also published as: EP4053792A4; EP4053792A1; US20220366723A1

Abstract

人工知能を利用して人間の感情認識を行う情報処理装置を提供する。　情報処理装置は、所定の基準に基づいて感情認識に基づくサービスの提供の可否を判断する前処理部と、人工知能機能を利用してユーザの感情認識を行う感情推定処理部と、前記感情推定処理部による感情認識の結果に基づくサービスを提供するサービス提供処理部を具備し、前記前処理部がサービスの提供を許可すると判断したときに、前記感情推定処理部は感情認識を行い、又は前記サービス提供処理部はサービスを提供する。

Description

情報処理装置及び情報処理方法、並びに人工知能モデル製造方法

　本明細書で開示（以下、「本開示」とする）する技術は、人間の感情認識を行う情報処理装置及び情報処理方法、並びに人工知能モデル製造方法に関する。

　人間の感情を認識することは、人間との対話を実現し、さらには人間に対して適切なサービスを提供する上で極めて重要である。表情や声、ジェスチャーなどの人間の表現に関するデータや、文脈に関するデータを利用することによって、人間の感情をより正確に理解することができる。例えば、ニューラルネットワークを利用した人工知能（Ａｒｔｉｆｉｃｉａｌ　Ｉｎｔｅｌｌｉｇｅｎｃｅ）を用いて、対話に含まれる文脈情報から話者の感情を認識する技術について提案がなされている（特許文献１を参照のこと）。

　顔の表情を用いて人間の感情を理解しようとする場合、イメージセンサーにより撮影した画像内の顔画像から顔画像のパターン（いわゆる表情）を解析し、その顔画像のパターンがどの感情に対応するかを推定する方法が知られている。顔画像のパターンと人間の感情との相関関係を事前学習した人工知能を用いて、人間の感情を推定することができる。なお、顔画像のパターンは、眉毛、目、鼻、口、頬、顎といった顔パーツの組み合わせで構成することもできるが、顔パーツに分けず顔画像全体のイメージで構成することもできる。

　感情学習には、ニューラルネットワークで表される人工知能を適用することができる。例えば、「怒り」、「嫌悪」、「恐れ」、「幸福」、「悲しみ」、「驚き」といった感情に関する複数のラベルを定義する。そして、顔画像のパターンをニューラルネットワークの入力とし、ニューラルネットワークの出力を「怒り」、「嫌悪」、「恐れ」、…といった感情のラベルと対応付けておき、ニューラルネットワークに入力された顔画像のパターンの各々について適切と思われる出力のラベルとを比較することで、ニューラルネットワークの学習又は訓練が行われる。

　事前に感情学習したニューラルネットワークを用いて感情認識を行うことにより、人間の好みなどを理解し、人間に対して適切なサービスや商品などの推薦を実現することができる。また、ニューラルネットワークの感情学習を適切に行うことにより、人間の感情表現がうまくできていない症状を検出して、医療サービスとして適切な治療へと導くことができる。

特開２０１９－２０６８４号公報

　本開示に係る技術の目的は、人工知能を利用して人間の感情認識を行う情報処理装置及び情報処理方法、並びに人工知能モデル製造方法を提供することにある。

　本開示に係る技術の第１の側面は、
　所定の基準に基づいて感情認識に基づくサービスの提供の可否を判断する前処理部と、
　人工知能機能を利用してユーザの感情認識を行う感情推定処理部と、
　前記感情推定処理部による感情認識の結果に基づくサービスを提供するサービス提供処理部と、
を具備し、
　前記前処理部がサービスの提供を許可すると判断したときに、前記感情推定処理部は感情認識を行い、又は前記サービス提供処理部はサービスを提供する、情報処理装置である。前記人工知能機能は、ユーザの顔画像を解析して得た表情から人間の感情を認識するように学習されている。

　前記前処理部は、前記の基準に基づいてユーザの同意が必要と判断される場合に、ユーザに感情認識の結果を前記サービスに用いることの同意を求める処理を実施する。また、前記前処理部は、感情認識の結果を前記サービスに用いることができないと判断されるが、ユーザの同意があることを例外条件に、感情認識の結果を前記サービスに用いることを許可する。

　前記基準が複数の人工知能モデルが必要であることを示すデータを含む場合、前記前処理部は、前記基準が前記データを含む場合に、前記感情推定処理部が複数の人工知能モデルを備えているかどうかに基づいてサービスの提供の可否を判定する。また、前記感情推定処理部は、複数の人工知能モデルを用いて推論を行い、各人工知能モデルによる推論結果の集合を感情認識の結果として出力する。

　第１の側面に係る情報処理装置は、人間の感情を認識するように前記人工知能機能の学習を行う感情学習部をさらに備えている。そして、前記前処理部は、前記基準に基づいて前記人工知能機能の学習の可否を判断する。前記感情学習部は、前記前処理部が学習を許可すると判断したときに、前記人工知能機能に学習用データを入力して感情認識を行えるように訓練する。

　また、本開示に係る技術の第２の側面は、
　所定の基準に基づいて感情認識に基づくサービスの提供の可否を判断する前処理ステップと、
　前記前処理ステップでサービスの提供を許可すると判断したときに、人工知能機能を利用してユーザの感情認識を行う感情推定処理ステップと、
　前記感情推定処理ステップにおける感情認識の結果に基づくサービスを提供するサービス提供処理ステップと、
を有する情報処理方法である。

　また、本開示に係る技術の第３の側面は、
　人工知能機能を用いた感情認識の結果を利用したサービスを提供する人工知能装置において、所定の基準に基づいて感情認識に基づくサービスの提供の可否を判断し、サービスの提供を許可すると判断したときに、前記人工知能機能に学習用データを入力して感情学習を行えるように訓練することにより、感情認識を行うことができる人工知能モデルを製造する、
人工知能モデル製造方法である。

　本開示に係る技術によれば、所定のガイドラインに基づいて、必要なレベルで人間の感情認識を行う情報処理装置及び情報処理方法、並びに人工知能モデル製造方法を提供することができる。

　また、本開示に係る技術によれば、人間とのインタラクションを通じて感情認識のレベルを適切に制御する情報処理装置及び情報処理方法、並びに人工知能モデル製造方法を提供することができる。

　なお、本明細書に記載された効果は、あくまでも例示であり、本開示に係る技術によりもたらされる効果はこれに限定されるものではない。また、本開示に係る技術が、上記の効果以外に、さらに付加的な効果を奏する場合もある。

　本開示に係る技術のさらに他の目的、特徴や利点は、後述する実施形態や添付する図面に基づくより詳細な説明によって明らかになるであろう。

図１は、情報処理装置１００のハードウェア構成例を示した図である。図２は、人工知能システム２００の機能的構成例を示した図である。図３は、コンピュータデバイス２１０が感情学習を行う場合の機能的構成を示した図である。図４は、感情学習処理ロジック３０４の実装例を示した図である。図５は、コンピュータデバイス２１０が感情認識を行う場合の機能的構成を示した図である。図６は、学習用データ又は認識用データを前処理する手順を示したフローチャートである。図７は、人工知能の感情学習又は人工知能による感情推論を行う処理手順を示したフローチャートである。図８は、感情推論結果に基づいてサービスを提供する処理手順を示したフローチャートである。図９は、コンピュータデバイス２１０が感情認識を行う場合の機能的構成を示した図である。図１０は、人工知能による感情推論を行う処理手順を示したフローチャートである。図１１は、推論された感情に基づいてサービスを提供する処理手順を示したフローチャートである。図１２は、ガイドラインのデータ構造を示した図である。図１３は、ガイドラインに従った前処理の手順を示したフローチャートである。図１４は、感情認識活用サービスのユーザインターフェース画面の構成例を示した図である。

　以下、図面を参照しながら本開示に係る技術の実施形態について詳細に説明する。

　感情認識技術は、さまざまな産業分野に応用される有用な技術である。ところが、感情認識技術には、以下に示す問題がある。

（１）感情を誤認識することにより、人間に不適切なサービスを提供する、
（２）自分の感情が読み取られることを快く感じない人間が存在する。

　上記（１）の感情誤認識に関しては、ニューラルネットワークで感情学習を行なう際に、感情と表情との関係が、人種や生育した地域などによって異なる可能性があることを考慮しなければならない。学習に用いる教師データに人種的、地域的な隔たりがあった場合（又は、バイアスが掛けられていた場合）、教師データにカバーされていない人種や地域の人間に対して感情を誤認識して、不適切なサービスを提供してしまい、不愉快な体験をさせる結果に繋がるおそれがある。

　また、感情と犯罪の発生とを関連付けて判断するサービスを行う場合、感情誤認識のために、誤って犯罪者を推定する可能性があり、重大な問題となる。

　また、事前に感情学習を行った人工知能を用いて人間の感情を正確に認識できる場合であっても、感情の認識結果を商品の推薦などのサービスに利用する際には、適切に管理又は制御することが望ましい。感情学習の精度に課題があり、結果として感情認識の精度も十分高くない場合には、感情認識をサービスに利用しない工夫も必要である。

　また、たとえ感情認識が有用であり、教師データのバイアスを排除して、高精度の感情認識を実現できたとしても、上記（２）の、自分の感情が読み取られることを快く感じない人間が存在し、感情認識を利用したサービスが望ましくない状況がある。

　その一方で、感情認識技術を適用しないとサービスが成立しない応用分野も存在する。例えば、医療分野において、所定の疾患の診断目的に感情認識を応用する場合である。したがって、感情認識の対象となる人間に対して、サービスの提供に際して感情認識を行うことを事前に通知したり理解を求めたりするような仕組みが必要である。

　また、応用分野毎に感情認識に要求される精度がまちまちである。すなわち、高い精度の感情認識が不要な分野も存在すれば、できる限り高い精度の感情認識を行うことが求められる分野も存在する。

　以下では、本開示に係る技術として、誤認識しないように感情学習を行うとともに、必要とされるレベルの感情認識サービスを提供するように、人間とのインタラクションを通じて制御を行うことができる、人工知能を利用して人間の感情認識を行う情報処理装置について説明する。

Ａ．システム構成
　図１には、人工知能機能を利用して、本開示に係る技術を適用可能な情報処理装置１００のハードウェア構成例を概略的に示している。図示の情報処理装置１００は、一般的なパーソナルコンピュータに、必要に応じて周辺装置を適宜外部接続するという形態で実現することができる。あるいは、情報処理装置１００は、スマートフォンやタブレットなどの多機能情報端末を用いて構成したり、ロボット装置上で構成したりすることもできる。また、情報処理装置１００は、人工知能など機能の一部をクラウドインフラストラクチャで実現するように構成することもできる。

　情報処理装置１００は、全体の動作を統括的にコントロールするＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）１０１と、ＣＰＵ１０１がローカルメモリとして利用可能な記憶装置１０２を備えている。

　本実施形態では、ＣＰＵ１０１がニューラルネットワーク（ＮＮ）アクセラレータを搭載することを想定している。また、ＣＰＵ１０１とともに（あるいは、ＣＰＵ１０１の代わりに）、ＧＰＧＰＵ（Ｇｅｎｅｒａｌ　Ｐｕｒｐｏｓｅ　Ｇｒａｐｈｉｃ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）などの他の種類のプロセッサを用いてもよい。

　記憶装置１０２は、ＤＲＡＭ（Ｄｙｎａｍｉｃ　Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）を用いて構成されるメインメモリやキャッシュメモリを含む。また、記憶装置１０２は、オペレーティングシステム（ＯＳ）などにより提供される仮想記憶機能により、ハードディスクドライブ（ＨＤＤ）やソリッドステートドライブ（ＳＳＤ）などの大容量外部記憶装置を含んでいてもよい。

　また、情報処理装置１００内では、バス１０３を介して各種のセンサー及びアクチュエータが、ＣＰＵ１０１並びに記憶装置１０２に相互接続されている。各センサーが取得したセンサーデータは、バス１０３経由で記憶装置１０２に取り込まれ、ＣＰＵ１０１が実行するコンピュータプログラムによって適宜処理される。また、各アクチュエータは、ＣＰＵ１０１からの指令（又は、コンピュータプログラムの実行結果）に基づいて駆動する。

　情報処理装置１００は、センサーとして、カメラ１０４、並びにマイクロホン１０５を備えている。カメラ１０４は、例えばＣＭＯＳ（Ｃｏｍｐｌｅｍｅｎｔａｒｙ　Ｍｅｔａｌ　Ｏｘｙｄｅ　Ｓｅｍｉｃｏｎｄｕｃｔｏｒ）やＣＣＤ（Ｃｈａｒｇｅ　Ｃｏｕｐｌｅｄ　Ｄｅｖｉｃｅ）などのイメージセンサーを用いて構成される。カメラ１０４は、２個以上のイメージセンサーを用いた立体視カメラや多眼カメラであってもよい。また、マイクロホン１０５は、２個以上の収音素子を用いたマイクロホンアレイであってもよい。

　また、情報処理装置１００は、アクチュエータとして、ディスプレイ１０６、並びにスピーカ１０７を備えている。ディスプレイ１０６は、液晶ディスプレイ（ＬＣＤ）や有機ＥＬ（Ｅｌｅｃｔｒｏ－Ｌｕｍｉｎｅｓｃｅｎｃｅ）ディスプレイなどで構成される。ディスプレイ１０６は、画面にタッチパネルが重畳されたタッチパネル式ディスプレイであってもよい。但し、タッチパネルは、アクチュエータではなくセンサーに分類することができる。また、スピーカ１０７は、複数のスピーカを組み合わせたスピーカを組み合わせたスピーカアレイ（多チャンネルスピーカ又は超多チャンネルスピーカ）であってもよい。スピーカアレイは、振動を生成する１つ以上の加振器（アクチュエータ）によってディスプレイ１０６の画面を振動させてオーディオ出力を行う「アコースティックサーフェス」を含んでもよい。

　情報処理装置１００は、その他のセンサー群１０８及びアクチュエータ群１０９をさらに備えている。センサー群１０８は、キーボードやマウスなどの一般的な入力デバイスを含んでいてもよい。また、センサー群１０８は、人工知能機能を利用するユーザの生体情報をセンシングする各種の生体センサーや、人工知能機能が利用される環境をセンシングする各種の環境センサーを含んでいてもよい。

　本実施形態では、記憶装置１０２には、ＯＳ、人工知能機能検証製造用ソフトウェア、人工知能機能搭載アプリケーションソフトウェア、及びＧＵＩ（Ｇｒａｐｈｉｃａｌ　Ｕｓｅｒ　Ｉｎｔｅｒｆａｃｅ）を含む、複数のコンピュータプログラムがインストールされていることを想定している。ＣＰＵ１０１は、ＯＳが提供する実行環境下で、これらコンピュータプログラムを実行することができる。

　人工知能機能搭載アプリケーションソフトウェアは、ＣＰＵ１０１上で動作する際に、人工知能機能検証製造用ソフトウェアに備えられている一群のアプリケーションプログラミングインターフェース（ＡＰＩ）を介して、間接的にＯＳの機能にアクセスする。そして、人工知能機能搭載アプリケーションソフトウェアは、人工知能機能検証製造用ソフトウェアによる検証を受け、人工知能機能の訓練（ｔｒａｉｎｉｎｇ）、すなわち人工知能機能による新しいデータの学習を通じて製造されることになる。

　また、情報処理装置１００は、記憶装置１０２上でＧＵＩを動作させている。ユーザは、タッチパネル、キーボード、マウスを用いたＧＵＩ操作、又は音声入力を用いて、人工知能機能検証製造用ソフトウェアの動作や入出力を制御することができる。また、情報処理装置１００内では、人工知能機能搭載アプリケーションソフトウェアの実行中に、必要に応じてカメラ１０４やマイクロホン１０５、スピーカ１０６、あるいはその他のセンサー群１０８、アクチュエータ群１０９を使った入出力動作が行われる。

　また、情報処理装置１００は、通信部１１０をさらに備えている。通信部１１０は、イーサネット（登録商標）などの有線通信機能、又はＷｉ－Ｆｉ（登録商標）などの無線通信機能を備え、さらにルータ（図示しない）などを経由して外部ネットワーク上のクラウドインフラストラクチャ１２０に相互接続されている。クラウドインフラストラクチャ１２０は、サーバ装置とストレージなどで構成されている。後述するように、情報処理装置１００は、クラウドインフラストラクチャ１２０との間でデータ交換を行ったり、人工知能機能に関する処理の一部又は全部を依頼したりするＡＰＩを装備している。

　情報処理装置１００上では、人工知能機能検証製造用ソフトウェアが動作して、アプリケーションソフトウェアに搭載する人工知能機能の製造を行う。人工知能機能検証製造用ソフトウェアは、人工知能機能の製造の過程において、人工知能機能への入力データや学習用データの検証、人工知能機能の出力データの検証などを実施するが、この点の詳細については後述に譲る。人工知能機能検証製造用ソフトウェアによって製造された人工知能機能を搭載したアプリケーションソフトウェアが、人工知能機能搭載アプリケーションソフトウェアである。人工知能機能搭載アプリケーションソフトウェアは、その製造に使用された同じ情報処理装置１００上で動作してもよいし、他の装置にロードして使用されてもよい。

　なお、人工知能機能検証製造用ソフトウェアが動作し、人工知能機能の検証や訓練を行う装置のことを、本明細書では「人工知能機能を検証する装置」とも呼ぶ。また、人工知能機能を検証する装置による検証や訓練の対象となる（又は、検証や訓練が済んだ）人工知能機能が動作する装置のことを、本明細書では「人工知能機能を備えた装置」とも呼ぶ。人工知能機能搭載アプリケーションソフトウェアを実行するコンピュータ、スマートフォン、タブレット、ロボット装置などは、人工知能機能を備えた装置に該当する。

　人工知能は、一般に、人間の脳神経回路を模したニューラルネットワークで表される学習モデルを利用する。ニューラルネットワークは、シナプスを介した人工ニューロン（以下、単に「ニューロン」とも呼ぶ）間の結合により形成したネットワークである。人工知能は、学習用データを用いた学習又は訓練を重ねることによって、ニューロン間の結合重み係数を変化させながら、問題（入力）に対して最適な解決（出力）を推定する学習モデルを構築する仕組みを備えている。

　以下では、人工知能機能を人間の感情学習及び感情推論に適用した例を用いて、人工知能機能を用いたサービスの制御を行う装置及び方法について説明する。但し、人工知能機能を用いたサービスを行う装置及び方法は、感情学習及び感情推論以外に適用した人工知能機能についても、同様に適用できるものと理解されたい。

　図２には、本開示に係る人工知能機能として、感情学習及び感情推論のサービス制御機構を備えたソフトウェアを利用する人工知能システム２００の機能的構成例を模式的に示している。

　図示の人工知能システム２００は、感情認識及び感情推論サービス機構を備えたコンピュータデバイス２１０と、１つ以上のクライアントコンピュータ装置２２０と、１つ以上のサーバコンピュータ装置２３０と、１つ以上のデータベース２４０を相互接続して構成される。クライアントコンピュータ装置２２０、サーバコンピュータ装置２３０、及びデータベース２４０は、通信メディア２５０経由でコンピュータデバイス２１０と相互接続されていてもよいし、それぞれコンピュータデバイス２１０に直接接続されていてもよい。コンピュータデバイス２１０は、例えば図１に示した情報処理装置１００に相当する。データベース２４０は、外部ストレージ上に配置されている。また、通信メディア２５０は、クラウド、近接通信、インターネットなどで構成される。

　コンピュータデバイス２１０は、仮想記憶機能を備えた記憶装置（メモリ）２１１と、処理装置（ＣＰＵなど）２１２と、ユーザインターフェース２１３と、入出力ソース２１４を備えている。

　記憶装置２１１は、感情学習及び感情推論サービス制御機構を備えている。なお、感情学習及び感情推論サービス制御機構を、コンピュータデバイス２１０上ではなく、クラウド上のサーバコンピュータ装置２３０上に配置してもよい。また、感情学習及び感情推論サービス機構が備えるロジックは、すべてコンピュータデバイス２１０上に配置してもよいし、一部又は全部をクラウド上のサーバコンピュータ装置２３０又はクライアントコンピュータ装置２２０上に配置してもよい。例えば、学習に関連するロジックは、クラウド上の複数のサーバコンピュータ装置２３０に分散して配置し、これらが分散学習を行うようにしてもよい。

　ここで、「ロジック」とは、コンピュータプログラム、コンピュータプログラムが生成し又は利用するデータ、又はハードウェア回路（メモリ回路も含む）によってその一部又は全部が実現されるようになされたものである。記憶装置２１１上には、このようなロジックのうちコンピュータプログラムが格納されている。そして、処理装置２１２は記憶装置２１１に格納されたコンピュータプログラムを実行するようになっている。

　本実施形態に係る人工知能システム２００において、感情学習及び感情推論サービス制御機構が備えるロジックは、以下を含むものとする。

「データ読み出し処理ロジック（入力データ領域）」
「データ形式変換処理ロジック（変換用データ領域）」
「学習（訓練）用／推論用データ前処理ロジック」
「ガイドラインに従った前処理ロジック」
「文脈認証処理ロジック」
「人工知能ロジック」

　さらに、人工知能ロジックは以下のロジックを含む。

「感情学習（訓練）処理ロジック（学習対象モデルデータ記憶領域を含む）」
「感情推論処理ロジック（学習済みモデルデータ記憶領域を含む）」

　入出力ソース２１４は、入力コンポーネントと出力コンポーネントからなる。入力コンポーネントは、センサー、カメラ、マイクロホンなどである。また、出力コンポーネントは、ディスプレイデバイスやスピーカ、その他のアクチュエータなどである。

Ｂ．人工知能システムを用いた感情認識活用サービスの制御
Ｂ－１．学習フェーズ
　図３には、本開示に係る技術を適用したコンピュータデバイス２１０が、感情学習を行う場合の機能的構成を、処理の概略的な流れと併せて示している。図３に示す例では、コンピュータデバイス２１０は、人工知能機能による感情の学習と感情の認識のために、センサー群として位置センサー（ＧＰＳ（Ｇｒｏｂａｌ　Ｐｏｓｉｔｉｏｎｉｎｇ　Ｓｙｓｔｅｍ）などを含む）３１１、イメージセンサー３１２、音センサー（マイクなどを含む）３１３、匂いセンサー３１４、味覚センサー３１５、触覚センサー３１６、又はその他のセンサーを装備することができる。なお、各センサー３１１～３１６…は、情報処理装置１００に装備されるセンサー群１０８に相当する。

　人間の顔の表情から感情認識する人工知能機能の学習を行う場合、コンピュータデバイス２１０は、少なくともイメージセンサー３１２を装備し、イメージセンサー３１２で取得される画像データを人工知能に入力することにより、人工知能機能を訓練する必要がある。

　一般に、センサーからの出力データフォーマットはセンサーの種類によって異なる。図３に示す構成例では、学習用データ前処理ロジック３０１が、各センサー３１１～３１６…からの出力データのデータ形式を、感情学習処理を行う人工知能に入力できるデータ形式に変換する入力前変換処理を行う。

　人工知能機能の学習用データは、コンピュータデバイス２１０が装備する上記のセンサー３１１～３１６…から取得するだけでなく、通信モジュール３０２を介して外部（クラウドインフラストラクチャ１２０）から受信するようにしてもよいし、コンピュータデバイス２１０内のローカルデータベース３０３から読み出した学習用データを用いてもよい。通信モジュール３０２は、例えば図１中の通信部１１０に相当する。

　学習用データ前処理ロジック３０１は、入力前変換処理を行った学習用データを、感情学習処理ロジック３０４と、文脈認識処理ロジック３０５の各々に入力する。感情学習処理ロジック３０４は、人工知能機能を備えている。なお、感情学習処理ロジック３０４に対する入力は、認識される文脈と各センサー３１１～３１６…からのＲＡＷデータの関連性が学習されるように、文脈認識処理ロジック３０５からの出力と学習用データ前処理ロジック３０１の出力が同期して入力されることが望ましい。

　なお、感情学習処理ロジック３０４に対して提供されるデータが満足すべきガイドラインを設けておいてもよい。そして、学習用データ前処理ロジック３０１は、そのガイドラインに基づく判断基準データ３０７を用いて、感情学習処理ロジック３０４に入力する学習用データが倫理などの観点から適切なものであるかどうかをチェックするようにしてもよい。ガイドラインに基づく判断基準データ３０７は、コンピュータデバイス２１０内のローカルストレージ上、又はクラウドのストレージ上に格納されている（以下同様）。

　感情学習処理ロジック３０４は、例えばコンボリューショナルニューラルネットワーク（ＣＮＮ）、ディープニューラルネットワーク（ＤＮＮ）、リカレントニューラルネットワーク（ＲＮＮ）、強化学習（リインフォースメントラーニング）ニューラルネットワーク、オートエンコーダ、スパイキング（ｓｐｉｋｉｎｇ）ニューラルネットワーク（ＳＮＮ）、サポートベクターマシン（ＳＶＭ）などの学習モデルを利用した人工知能で構成される。本実施形態に係る感情学習処理ロジック３０４で使用する人工知能は、問題（入力）に対して最適な解決（出力）を推定するように、損失関数などで計算した結果をバックプロパゲーションなどに技術を通じて学習する仕組みを備えているものとする。

　感情学習処理ロジック３０４は、人工知能に新たな学習用データを入力することによる訓練（例えば、ディープラーニング）を通じて、感情認識用の人工知能の学習を行い、訓練前とは異なる新たな感情認識用学習モデルを製造する。人工知能がニューラルネットワークで構成される場合、学習用データを用いた学習を重ねることによって、ニューロン間の結合重み係数を変化させながら、入力に対して最適な出力を推定するように学習が進行し、ニューロン間の結合重み係数からなる構造化された感情認識用学習モデルを製造することになる。そして、製造された感情認識用学習モデルは、データベース３０６に格納される。データベース３０６は、コンピュータデバイス２１０内のローカルストレージであってもよいし、あるいは、クラウドインフラストラクチャ１２０（図１を参照のこと）上のストレージであってもよい。

　感情学習処理ロジック３０４は、上述したガイドラインに基づく判断基準データ３０７を用いて、製造（又は、ディープラーニングにより学習）した感情認識用学習モデルが倫理などの観点から適切なものであるかどうかをチェックしてから、データベース３０６に格納するようにしてもよい。

　なお、感情推論に複数のニューラルネットワークＮＮ₁、ＮＮ₂、…、ＮＮ_iのモデルを利用する場合には（後述並びに図９を参照のこと）、感情学習処理ロジック３０４は、各ニューラルネットワークＮＮ₁、ＮＮ₂、…、ＮＮ_iの製造を行い、且つデータベース３０６に格納するものとする。

　図４には、感情学習処理ロジック３０４を、ＣＮＮを含むＤＮＮを用いて教師ありデータによって実装する例を示している。図示の例では、多層からなるコンボリューション層４０２を構成するＣＮＮは、イメージセンサー３１２から出力されたＲＧＢコンポーネント４０１のデータを入力すると、ＲＧＢ画像の特徴を出力ノードから出力する。ニューラルネットワークの全結合層４０３は、以下のデータを入力する。

－ＣＮＮの出力ノードから出力される画像特徴データ
－他のセンサーからの入力データ、又はデータベースやクラウドインフラストラクチャに置かれたデータ
－文脈認識処理ロジックからの出力データ

　文脈認識処理ロジック３０５は、以下の入力を受け取り、文脈情報をニューラルネットワークの全結合層４０３の入力層に入力する。

－イメージセンサーが出力するＲＧＢデータ
－その他のセンサーからの入力

　上記のうち、その他のセンサーは、ＴｏＦ（Ｔｉｍｅ－ｏｆ－Ｆｌｉｇｈｔ）センサー（深度情報センサー）、ＤＶＳ（Ｄｙｎａｍｉｃ　Ｖｉｓｉｏｎ　Ｓｅｎｓｏｒ）、赤外線センサー、音センサー（マイクロホン）、匂いセンサー、味覚センサー、触覚センサー、温度センサー、高度センサー、ＧＰＳ、又は車輪駆動系に連動した回転センサー及びトルクセンサーなど、任意のセンサーの組み合わせとすることができる。なお、ＤＶＳは、ＳＮＮから構成される。また、その他のセンサーからの入力は、文脈認識処理ロジック３０５を経由せずに、直接、全結合層４０３に入力するようにしてもよい。

　全結合層４０３の出力層は、感情出力のノードである。教師付学習であれば、ノードは、各感情ラベル（一例としては、怒り、嫌悪、恐れ、幸福、悲しみ、驚きの６つの出力）とすることができる。感情ラベルは、イメージセンサー３１２からの入力画像に含まれる顔画像について、顔の表情を表現するものとして与えられるデータである。

　損失関数４０４は、感情出力及び感情ラベルを引数として定義される関数である。例えば、全結合層４０３の全ノードからの感情出力と感情ラベルの差分に基づいて損失関数４０４を定義することができる。そして、バックプロパゲーションなどの手法を用いて、全結合層４０３の出力層から入力層の方向に向かって、各ニューロン間の結合重み係数を修正することによって、損失関数４０４を最小化するようにニューラルネットワークの学習又は訓練を実施する。全結合層４０３のみ結合重み係数の学習を行うようにしてもよいし、又は、全結合層４０３及びコンボリューション層４０２のすべてについて結合重み係数の学習を行うようにしてもよい。本実施形態では、ニューラルネットワークの学習又は訓練は、ディープラーニングによって行われるものとする。

Ｂ－２．感情認識活用サービス（１）
　図５には、本開示に係る技術を適用したコンピュータデバイス２１０が、感情認識を行う場合の機能的構成を、処理の概略的な流れと併せて示している。但し、図３に示したものと同じコンポーネントについては同一の参照番号を付けている。

　学習済みの人工知能機能を用いて人間の顔の表情から感情認識を行う場合も同様に、コンピュータデバイス２１０は、イメージセンサーで取得される画像データを学習済みの人工知能に入力することにより、人工知能機能に人間の感情を認識させる。

　センサーからの出力データフォーマットはセンサーの種類によって異なる（同上）。図５に示す構成例では、認識用データ前処理ロジック５０１が、各センサーからの出力データのデータ形式を、感情認識処理を行う人工知能に入力できるデータ形式に変換する入力前変換処理を行う。認識用データ前処理ロジック５０１は、入力前変換処理を行った認識用データを、感情推論処理ロジック５０２と、文脈認識処理ロジック３０５の各々に入力する。

　人工知能機能の認識用データは、コンピュータデバイス２１０が装備する上記のセンサーから取得するだけでなく、通信モジュール３０２を介して外部から受信するようにしてもよいし、コンピュータデバイス２１０内のローカルデータベース３０３から読み出した学習用データを用いてもよい。

　感情推論処理ロジック５０２は、人工知能機能を備えている。なお、感情推論処理ロジック５０２に対する入力は、認識される文脈と各センサー３１１～３１６…からのＲＡＷデータの関連性が学習されるように、文脈認識処理ロジック３０５からの出力と認識用データ前処理ロジック５０１の出力が同期して入力されることが望ましい。

　なお、感情推論処理ロジック５０２に対して提供されるデータが満足すべきガイドラインを設けておいてもよい。そして、認識用データ前処理ロジック５０１は、そのガイドラインに基づく判断基準データ３０７を用いて、感情推論処理ロジック５０２に入力する認識用データが倫理などの観点から適切なものであるかどうかをチェックするようにしてもよい。

　感情推論処理ロジック５０２は、例えばＣＮＮ、ＤＮＮ、ＲＮＮ、強化学習ニューラルネットワーク、オートエンコーダ、ＳＮＮ、ＳＶＭなどの人工知能で構成される。感情推論処理ロジック５０２の人工知能機能は、データベース３０６から読み出された学習済み感情認識用モデルが適用され、認識用データ前処理ロジック５０１を介して入力される認識用データから人間の感情を推論する。データベース３０６は、コンピュータデバイス２１０内のローカルストレージであってもよいし、あるいは、クラウドインフラストラクチャ１２０（図１を参照のこと）上のストレージであってもよい。そして、感情推論処理ロジック５０２は、認識用データから推論した人間の感情を、感情認識活用サービス提供処理ロジック５０３に出力する。

　感情認識活用サービス提供処理ロジック５０３は、感情推論処理ロジック５０２が推定した人間の感情に基づいて、その人間に対して感情に適合したサービスを提供したり商品などの推薦を行ったりする。上述したガイドラインに基づく判断基準データ３０７を用いて、感情認識を利用したサービスや商品などの推薦が倫理などの観点から適切なものであるかどうかをチェックしてから、サービスの提供や商品などの推薦を実施するようにしてもよい。

　図６には、図３中の学習用データ前処理ロジック３０１並びに図５中の認識用データ前処理ロジック５０１が、訓練用又は感情認識用の人工知能に入力する学習用データ又は認識用データに対して実施する前処理の手順をフローチャートの形式で示している。

　まず、学習用データ前処理ロジック３０１又は認識用データ前処理ロジック５０１において、ガイドラインに従った前処理を行う（ステップＳ６０１）。この前処理は、必ずしも毎回実施するものではなく、初回のみ行うようにしてもよい。すなわち、２回目以降は、本処理をステップＳ６０３から開始してもよい。ガイドラインの詳細に関しては、後述に譲る。そして、学習用データ前処理ロジック３０１又は認識用データ前処理ロジック５０１は、ガイドラインに基づく判断基準データ３０７を用いて、人工知能の感情学習を行い、又は人工知能による感情認識を行ってもよいかどうかを判定する（ステップＳ６０２）。

　ガイドラインに基づく判断基準データ３０７により、人工知能の感情学習を行えない、又は人工知能による感情認識を行えないと判定された場合には（ステップＳ６０２のＮｏ）、後続の処理ステップをすべてスキップして、学習用データ前処理又は認識用データ前処理を終了する。

　また、ガイドラインに基づく判断基準データ３０７により、人工知能の感情学習を行ってもよい、又は人工知能による感情認識を行ってもよいと判定された場合には（ステップＳ６０２のＹｅｓ）、学習用データ前処理ロジック３０１又は認識用データ前処理ロジック５０１は、コンピュータデバイス２１０が装備する各種のセンサーやコンピュータデバイス２１０内のローカルデータベース３０３、あるいはクラウドインフラストラクチャ１２０から学習用データ又は認識用データを取得する（ステップＳ６０３）。

　学習用データ前処理ロジック３０１は、取得した学習用データを又は認識用データ前処理ロジック５０１は、各センサーからの出力データのデータ形式を、感情学習処理を行う人工知能又は感情認識処理を行う人工知能に入力できるデータ形式に変換する入力前変換処理を行う（ステップＳ６０４）。

　そして、学習用データ前処理ロジック３０１又は認識用データ前処理ロジック５０１は、形式変換したデータを、感情学習処理を行う人工知能又は感情認識処理を行う人工知能に入力して（ステップＳ６０５）、本処理を終了する。

　例えば、イメージセンサー３１２から取得したイメージデータのデータ形式は、ＲＧＢフォーマットの場合もあれば、ＹＵＶフォーマットの場合もあり得る。また、ローカルデータベース３０３やクラウドインフラストラクチャ１２０から取得したイメージデータ（あるいは、その他の各種のセンサーデータ）が異なる形式の場合もあり得る。学習用データ前処理ロジック３０１や認識用データ前処理ロジック５０１は、さまざまなデータフォーマットからなるセンサーデータを、人工知能が想定する既定のフォーマットに変換する前処理を施してから、人工知能に入力するようになっている。

　図７には、図３中の感情学習処理ロジック３０４において用いられる人工知能の感情学習処理、並びに図５中の感情推論処理ロジック５０２において用いられる人工知能による感情認識処理の手順をフローチャートの形式で示している。

　感情学習処理ロジック３０４又は感情推論処理ロジック５０２は、学習用データ前処理ロジック３０１又は認識用データ前処理ロジック５０１で前処理されたデータを、ニューラルネットワークで表される人工知能に入力する（ステップＳ７０１）。ここで、推論処理の場合には、図４を参照しながら説明したように、センサーからの直接のデータ入力、及び文脈認識処理ロジック３０５からのデータの入力も行う。

　そして、感情学習処理ロジック３０４は、先行ステップＳ７０１でデータを人工知能に入力することによる訓練（例えば、ディープラーニング）を通じて、感情認識用の人工知能の学習を行い、訓練前とは異なる新たな感情認識用学習モデルを製造する（すなわち学習用モデルを訓練する）（ステップＳ７０２）。人工知能の学習の際には、バックプロパゲーションなどの手法を用いてニューラルネットワークの訓練を行う。そして、製造された感情認識用学習モデルは、データベース３０６に格納される。

　また、感情推論処理ロジック５０２は、データベース３０６から読み出された学習済み感情認識用モデルが適用された人工知能を用いて、入力データから人間の感情を推論する感情推論処理を行う（ステップＳ７０２）。そして、推論された人間の感情は、感情認識活用サービス提供処理ロジック５０３に出力されて、結果として、サービスの提供や商品などの推薦が実施される。

　図８には、感情認識活用サービス提供処理ロジック５０３において実施される、推論された感情に基づいてサービスを提供する処理手順をフローチャートの形式で示している。

　まず、感情認識活用サービス提供処理ロジック５０３は、ガイドラインに従った前処理を行う（ステップＳ８０１）。この前処理は、必ずしも毎回実施するものではなく、初回のみ行うようにしてもよい。さらに、認識用データ前処理ロジック５０１が図６に示した前処理や、感情推論処理ロジック５０２が図７に示した感情認識処理において、既に行っているガイドラインに従った前処理を行った事実又は結果を記憶しておくことにより、既にステップＳ８０１の処理を実施しているものと代用することができる場合には、ステップＳ８０１の処理を省略して、直接、感情推論処理ロジック５０２の人工知能から出力された推論データを読み出す処理に進むようにしてもよい。

　ガイドラインに基づく判断基準データ３０７により、感情認識をサービスに活用できない場合には（ステップＳ８０２のＮｏ）、感情認識活用サービス提供処理ロジック５０３は、後続の処理ステップをすべてスキップして、感情認識に基づくサービスの提供処理を終了する。

　また、ガイドラインに基づく判断基準データ３０７により、感情認識をサービスに活用してもよい場合には（ステップＳ８０２のＹｅｓ）、感情認識活用サービス提供処理ロジック５０３は、感情推論処理ロジック５０２が認識用データから推論したデータを入力する（ステップＳ８０３）。

　次いで、感情認識活用サービス提供処理ロジック５０３は、感情推論処理ロジック５０２が推論したデータ、すなわち感情データに基づいてサービスの提供処理を継続してよいかどうかを判断する（ステップＳ８０４）。

　感情認識活用サービス提供処理ロジック５０３は、サービスの提供処理を継続できないと判断した場合には（ステップＳ８０４のＮｏ）、感情認識に基づくサービスの提供処理を終了する。例えば、感情推論処理ロジック５０２により「怒り」の感情が認識された場合には、それまでに行った感情認識処理による結果がユーザに何らかの不愉快な状況が生じた可能性がある。そのような場合には、感情認識活用サービス提供処理ロジック５０３は、サービスの提供処理を継続できないと判断して、感情認識に基づくサービスの提供処理を終了する。

　一方、感情認識活用サービス提供処理ロジック５０３は、サービスの提供処理を継続できると判断した場合には（ステップＳ８０４のＹｅｓ）、感情推論処理ロジック５０２により推定された感情に基づいたサービスをユーザに提供して（ステップＳ８０５）、本処理を終了する。例えば、感情推論処理ロジック５０２により「驚き」の感情が認識された場合には、感情認識活用サービス提供処理ロジック５０３は、ユーザに対して「何か問題があったかどうかを問い合わせる」といった行動や動作を、アクチュエータなどを使って行うようにすることができる。

　ユーザに対して推定した感情に適合したサービスを提供したり商品などの推薦を行ったりする処理を実施することで、感情認識サービスが人間に対してできるだけ有効なものにすることができる一方、ユーザに不愉快であったり不都合であったりする場合には、感情認識サービスを即座に中止することができる。したがって、コンピュータデバイス２１０を通じて、よりフレンドリーな感情認識活用サービスを提供することができる。

Ｂ－３．感情認識活用サービス（２）
　図９には、本開示に係る技術を適用したコンピュータデバイス２１０が、感情理解を行う人工知能機能を複数有し、感情に認識を行う場合の機能的構成を、処理の概略的な流れと併せて示している。但し、図３並びに図５に示したものと同じコンポーネントについては同一の参照番号を付けている。

　コンピュータデバイス２１０は、イメージセンサーで取得される画像データを学習済みの人工知能に入力することにより、人工知能機能に人間の感情を認識させる。センサーからの出力データフォーマットはセンサーの種類によって異なるので、認識用データ前処理ロジック５０１が、各センサーからの出力データのデータ形式を、感情認識処理を行う人工知能に入力できるデータ形式に変換する入力前変換処理を行う。認識用データ前処理ロジック５０１は、入力前変換処理を行った認識用データを、感情推論処理ロジック９０１と、文脈認識処理ロジック３０５の各々に入力する。人工知能機能の認識用データは、コンピュータデバイス２１０が装備する上記のセンサーから取得するだけでなく、通信モジュール３０２を介して外部から受信するようにしてもよいし、コンピュータデバイス２１０内のローカルデータベース３０３から読み出した学習用データを用いてもよい。

　感情推論処理ロジック９０１は、複数の人工知能機能を備えている。図示の例では、各人工知能機能はニューラルネットワーク（ＮＮ）のモデルからなり、感情推論処理ロジック９０１はｉ個のニューラルネットワークＮＮ₁、ＮＮ₂、…、ＮＮ_iを備えているものとする。各ニューラルネットワークＮＮ₁、ＮＮ₂、…、ＮＮ_iは、例えばＣＮＮ、ＤＮＮ、ＲＮＮ、強化学習ニューラルネットワーク、オートエンコーダ、ＳＮＮ、ＳＶＭなどの人工知能で構成される。感情推論処理ロジック５０２内の各ニューラルネットワークＮＮ₁、ＮＮ₂、…、ＮＮ_iは、データベース３０６から読み出された学習済み感情認識用モデルＭ₁、Ｍ₂、…、Ｍ_iがそれぞれ適用され、認識用データ前処理ロジック５０１を介して入力される認識用データから人間の感情を推論する。データベース３０６は、コンピュータデバイス２１０内のローカルストレージであってもよいし、あるいは、クラウドインフラストラクチャ１２０（図１を参照のこと）上のストレージであってもよい。そして、感情推論処理ロジック９０１は、認識用データから推論した人間の感情を、感情認識活用サービス提供処理ロジック９０２に出力する。

　ここで、各ニューラルネットワークＮＮ₁、ＮＮ₂、…、ＮＮ_iは、異なる学習用データ又は異なる損失関数などを用いて、異なる状況で訓練された学習済み感情認識用モデルＭ₁、Ｍ₂、…、Ｍ_iをそれぞれ用いることにより、同様に人間の感情を認識するニューラルネットワークであるが、利用時に入力されるさまざまな認識用データの組み合わせにより異なる認識結果を出力することが想定される。したがって、感情推論処理ロジック９０１は、複数のニューラルネットワークＮＮ₁、ＮＮ₂、…、ＮＮ_iからの推論結果を総合的に組み合わせることによって、人間の感情の認識精度を向上させることができる。

　感情認識活用サービス提供処理ロジック９０２は、感情推論処理ロジック９０１が推定した人間の感情に基づいて、その人間に対して感情に適合したサービスを提供したり商品などの推薦を行ったりする。上述したガイドラインに基づく判断基準データ３０７を用いて、感情認識を利用したサービスや商品などの推薦が倫理などの観点から適切なものであるかどうかをチェックしてから、サービスの提供や商品などの推薦を実施するようにしてもよい。感情推論処理ロジック９０１による感情の認識精度が向上すれば、その分だけ、感情に認識活用サービス提供処理ロジック９０２がユーザの満足度の高い感情認識活用サービスを提供することができる。

　図１０には、図９中の、複数の人工知能機能を備えた感情推論処理ロジック９０１による感情認識処理の手順をフローチャートの形式で示している。

　感情推論処理ロジック９０１は、認識用データ前処理ロジック５０１で前処理されたデータを、各ニューラルネットワークＮＮ₁、ＮＮ₂、…、ＮＮ_iに入力する（ステップＳ１００１）。また、図４を参照しながら説明したように、センサーからの直接のデータ入力、及び文脈認識処理ロジック３０５からのデータの入力も行う。

　各ニューラルネットワークＮＮ₁、ＮＮ₂、…、ＮＮ_iは、データベース３０６から読み出された学習済み感情認識用モデルＭ₁、Ｍ₂、…、Ｍ_iがそれぞれ適用され、認識用データ前処理ロジック５０１を介して入力される認識用データから人間の感情を推論する。そして、感情推論処理ロジック９０１は、複数のニューラルネットワークＮＮ₁、ＮＮ₂、…、ＮＮ_iからの推論結果の集合を、それぞれ個別に認識できるように（例えば、各ニューラルネットワークのＩＤを付けて）、推論データ集合として出力する（ステップＳ１００２）。そして、推論された人間の感情は、感情認識活用サービス提供処理ロジック９０２に出力されて、サービスの提供や商品などの推薦が実施される。

　図１１には、感情認識活用サービス提供処理ロジック９０２において実施される、推論された感情に基づいてサービスを提供する処理手順をフローチャートの形式で示している。

　まず、感情認識活用サービス提供処理ロジック９０２は、ガイドラインに従った前処理を行う（ステップＳ１１０１）。この前処理は、必ずしも毎回実施するものではなく、初回のみ行うようにしてもよい。さらに、認識用データ前処理ロジック５０１が図６に示した前処理や、感情推論処理ロジック９０１が図７に示した感情認識処理において、既に行っているガイドラインに従った前処理を行った事実又は結果を記憶しておくことにより、既にステップＳ１１０１の処理を実施しているものと代用することができる場合には、ステップＳ１１０１の処理を省略して、直接、感情推論処理ロジック９０１の人工知能から出力された推論データ集合を読み出す処理に進むようにしてもよい。

　ガイドラインに基づく判断基準データ３０７により、感情認識をサービスに活用できない場合には（ステップＳ１１０２のＮｏ）、感情認識活用サービス提供処理ロジック９０２は、後続の処理ステップをすべてスキップして、感情認識に基づくサービスの提供処理を終了する。

　また、ガイドラインに基づく判断基準データ３０７により、感情認識をサービスに活用してもよい場合には（ステップＳ１１０２のＹｅｓ）、感情認識活用サービス提供処理ロジック９０２は、感情推論処理ロジック９０１内の複数のニューラルネットワークＮＮ₁、ＮＮ₂、…、ＮＮ_iが認識用データから推論した推論データ集合を入力する（ステップＳ１１０３）。

　そして、感情認識活用サービス提供処理ロジック９０２は、各ニューラルネットワークＮＮ₁、ＮＮ₂、…、ＮＮ_iの推論データを比較検討処理する（ステップＳ１１０４）。

　比較検討処理の一例として、感情認識活用サービス提供処理ロジック９０２は、複数の推論データを統計的に処理して、最も蓋然性の高い推論データをユーザの感情の認識結果として採用する。別の例として、認識活用サービス提供処理ロジック９０２は、感情の推論データを時系列的に記憶しておき、事前に定義した感情間の遷移ネットワークにおいて、最も蓋然性の高い推論データをユーザの感情の認識結果として採用する。例えば、直前に推定されたユーザの感情が「怒り」であり、１つのニューラルネットワークから出力された推論データが「幸福」を示唆し、別のニューラルネットワークから出力された推論データが「悲しみであった場合には、遷移確率付きの遷移を「怒り」→（遷移確率Ｐ１）→「幸福」、「怒り」→（遷移確率Ｐ２）→「悲しみ」と定義し、且つ、Ｐ１＜Ｐ２と定義することで、「悲しみ」を最も蓋然性の高い推論データとすることができる。これらの感情間の遷移関係についても、あらかじめ学習済みの人工知能のモデルを用い、別の人工知能が判断を行うようにしてもよい。また、直前に推定されたユーザの感情からその後の感情を推定する処理に、量子力学を利用して並列処理を実現する量子コンピュータを用いてもよい。

　次いで、感情認識活用サービス提供処理ロジック９０２は、推論データ集合から認識された感情に基づいてサービスの提供処理を継続してよいかどうかを判断する（ステップＳ１１０５）。例えば、「怒り」の感情が認識された場合には、それまでに行った感情認識処理による結果がユーザに何らかの不愉快な状況が生じた可能性がある。そのような場合には、感情認識活用サービス提供処理ロジック９０２は、サービスの提供処理を継続できないと判断して、感情認識に基づくサービスの提供処理を終了する。

　一方、感情認識活用サービス提供処理ロジック９０２は、サービスの提供処理を継続できると判断した場合には（ステップＳ１１０５のＹｅｓ）、推論データ集合から推定された感情に基づいたサービスをユーザに提供して（ステップＳ１１０６）、本処理を終了する。例えば、「驚き」の感情が認識された場合には、感情認識活用サービス提供処理ロジック９０２は、ユーザに対して「何か問題があったかどうかを問い合わせる」といった行動や動作を、アクチュエータなどを使って行うようにすることができる。

Ｃ．ガイドラインによる制御
　図１２には、ガイドラインのデータ構造を図解している。図示のガイドラインは、学習用データ並びに認識用データの前処理、感情学習処理、及び感情認識決用サービス提供処理に適用することができる。上述したガイドラインに基づく判断基準データ３０７は、図１２に示すようなデータ構造からなり、コンピュータデバイス２１０内のローカルストレージ上、又はクラウドのストレージ上で管理されているものとする。また、感情認識活用サービス提供処理ロジック５０３又は９０２は、図１２に示すようなガイドラインを参照して、感情認識をサービスに活用することの適否を判断する。

　図１２では、原則を定義する基本ガイドラインをルート（ｒｏｏｔ）に配置し、応用に応じて階層的なクラス構造をとることができることを示している。各クラスのガイドラインにおいて、特に本実施形態に関係して共通に持つパラメータは、少なくとも以下の４つである。

（１）感情認識活用サービス
（２）例外
（３）ユーザの同意
（４）複数モデルの利用

　１番目の「感情認識活用サービス」は、感情認識をサービスに利用してよいかどうかを規定するパラメータである。「感情認識活用サービス」パラメータは、固定の定数であってもよいし、任意に変更できるような変数であってもよい（以下、他のパラメータについても同様）。

　２番目の「例外」は、「感情認識活用サービス」パラメータが「ＮＯ」である場合の例外を規定するために設けられたパラメータである。ガイドライン上は原則として「感情認識活用サービス」のパラメータが「ＮＯ」である場合には感情認識活用サービスを認めないが、この「例外」のパラメータによりサービスに感情認識を活用してよい例外条件を指定することができる。例えば、例外条件に「ユーザの同意」を指定した場合、「感情認識活用サービス」のパラメータが「ＮＯ」である場合であっても、ユーザに同意を求め、同意が得られれば、サービスに感情認識の活用を認めることを意味する。他の例外条件として、「特定病気診断」かどうかを条件とするもの、「振り込め詐欺防止対策監視用」かどうかを条件とするものなどを挙げることができる。必要に応じて「例外」パラメータを任意に定義することができる。

　３番目の「ユーザの同意」は、「感情認識活用サービス」パラメータの指定に反する制御を行なう際にユーザの同意が必要かどうかを指定するパラメータである。「ユーザの同意」パラメータが「ＹＥＳ」の場合にはユーザの同意が必要であることを示し、「ＮＯ」の場合にはユーザの同意が不要であることを示す。

　４番目の「複数モデルの利用」は、感情認識をサービスに活用してよい場合において、それぞれ独立した学習及び推論を行うことができる複数の人工知能（例えばニューラルネットワークのモデル）の出力を総合的に判断して感情を認識することを必要とするかどうかを示すパラメータである。複数の人工知能の出力を総合的に判断するシステムの構成及び動作については、図９～図１１を参照されたい。

　図１２に示す例では、ルートクラスである「基本ガイドライン」の各パラメータは、「感情認識活用サービス」＝「ＮＯ」、「例外」＝「ユーザの同意」、「複数モデルの利用」＝「ＹＥＳ」と指定されている。

　まず、「感情認識活用サービス」＝「ＮＯ」である。したがって、感情認識活用サービス提供処理ロジック５０３又は９０２は、感情認識をサービスに活用することを原則として禁止するような制御を指示する。一方、「例外」＝「ユーザの同意」と指定されている。したがって、感情認識活用サービス提供処理ロジック５０３又は９０２は、ユーザインターフェース２１３などを通じてユーザの同意を得る処理が行われた場合には、感情認識をサービスに活用に活用することを許可する。具体的には、コンピュータデバイス２１０は、スピーカ１０７からの音声ガイダンスやディスプレイ１０６上で文字や画像を用いた問い合わせを行い、ユーザの同意を得る処理を行う。

　ガイドライン上は「ユーザの同意」＝「ＹＥＳ」、すなわちユーザの同意を得ることを要求しているにもかかわらず、コンピュータデバイス２１０がユーザに問い合わせを行うためのユーザインターフェースを備えていない場合には、システムエラーとして、ユーザに対して処理ができないことを通知するようにしてもよいし、あるいは単に「例外」が認められないものとして処理を続行するようにしてもよい。このように「例外」というパラメータを設けることより、感情学習及び感情推論のサービス制御機構を備えた人工知能システム２００を利用する場合に、ユーザの同意を求めることができる。したがって、人工知能システム２００を使うサービス提供者は、事前に通知に基づくユーザの同意（ｉｎｆｏｒｍｅｄ　ｃｏｎｓｅｎｔ）を得ることができる。この結果、ユーザに不快感や不信感を与えることなく、ユーザにとって有用と考えられる感情認識活用サービスを提供することができる。

　感情認識活用サービスの適用分野などに応じて、「基本ガイドライン」のサブクラスを定義することができる。図１２に示すガイドラインのデータ構造では、「基本ガイドライン」のサブクラスとして、「監視システム用ガイドライン」、「教育システム用ガイドライン」、「医療システム用ガイドライン」、「ゲーム用ガイドライン」、…、「金融商品サービス用ガイドライン」のデータ構造を定義し、さらに「監視システム用ガイドライン」のサブクラスとして「入国審査システム用ガイドライン」、「ゲーム用ガイドライン」のサブクラスとして「ペットロボット用ガイドライン」のデータ構造を定義している。以下、各サブクラスのデータ構造について説明しておく。

　感情システム用ガイドラインでは、「感情認識活用サービス」＝「ＹＥＳ」、「ユーザの同意」＝「ＮＯ」、すなわち監視システムに感情認識活用サービスを利用してよいこと、及び、ユーザの同意を得る必要がないことを規定している。監視システムでは、対象となる人間を画像認識して表情から感情を認識してサービスに活用することを必要とするが、監視というサービスの公共性から、ユーザの同意がなくても感情認識をサービスに利用すべきと考えられるからである。また、監視というサービスの公共性から、誤った判断により人間の感情を認識することがないように、高度な「公平性（ｆａｉｒｎｅｓｓ）」が求められることから、「複数のモデル利用」＝「ＹＥＳ」、すなわち複数の人工知能の出力を総合的に判断して高い精度で人間の感情を認識することが要求される。さらに「監視システム用ガイドライン」のサブクラスである「入国審査システム用ガイドライン」も、応用は異なるが、上位クラスである「監視システム用ガイドライン」とサービスの性質が変わることがない（同じく公共性が要求される）ので、規定上も異なるパラメータの設定は規定されていない。

　教育システム用ガイドラインにおいて特徴的なのは、「感情認識活用サービス」＝「ＮＯ」、「例外」＝「ＮＯ」、すなわち、例外を設けずに感情認識活用サービスを禁止していることである。このようにすることで、感情認識機能を持つ人工知能システムが教育現場に導入された場合に、現場の判断により子供の表情から感情を認識することを許可したりしなかったりすることによって問題が生じることを未然に防ぐことができる。

　医療システム用ガイドラインにおいては、「感情認識活用サービス」＝「ＮＯ」、「例外」＝「特定病気診断」、すなわち、感情認識活用サービスを原則禁止とするが、特定病気診断であることを例外条件として、感情認識をサービスに利用することを認めることとしている。例えば「パーソナリティ障害」の診断において医は、感情認識が有用な場合もある。疾患の治療において有用であることが認められる場合には、このようなガイドラインに例外を設けることによる制御は効果を発揮する。

　金融商品サービス用ガイドラインにおいても、同様に「感情認識活用サービス」＝「ＮＯ」、すなわち、感情認識活用サービスを原則禁止としつつ、「例外」＝「振り込め詐欺防止対策監視用」を規定している。銀行などの金融機関においては、顧客が振り込め詐欺に遭わないように防止対策を講じることは有益である。人間が振り込み操作を行なう際に、表情から「恐れ」などの感情を認識した場合には、感情認識活用サービスを利用することにより、その人が振り込みにためらいがあることを予測して、担当者が顧客に声をかける、顧客に注意を喚起する音声を発したりメッセージを表示したりするといった、振込詐欺防止対策を講じることができる。

　ゲーム用ガイドラインにおいては、「感情認識活用サービス」＝「ＹＥＳ」、「ユーザの同意」＝「ＹＥＳ」、すなわちゲームにおいて感情認識をゲームに利用してもよいこととするが、ユーザの同意を得ることを求めるように規定している。ゲームでは、あらかじめユーザに同意を求めるようにすることが所定の場合には必要となる慣習に従ったガイドラインの内容である。一方、ゲームの娯楽性から、ゲーム中のキャラクターが思いがけない動作をすることもゲームの重要な要素であり、感情認識の精度はそれほど重視されない場合もある。このため、「複数モデルの利用」＝「Ｎ／Ａ」、すなわち複数の人工知能の出力を総合的に判断する必要はないことを規定している。

　例えば、耳穴開放型のヘッドホンとＨＲＴＦ（Ｈｅａｄ　Ｒｅｌａｔｅｄ　Ｔｒａｎｓｆｅｒ　Ｆｕｎｃｔｉｏｎ）の技法とを組み合わせて、外音と同時に人工的に生成したエージェントなどの音声をユーザの頭部周辺の３次元空間の任意の位置に音像定位する技術が開発されている。このようなヘッドホンを用いてゲームをするユーザに対して、上記のようなゲーム用ガイドラインに従って感情認識活用サービスを行うことができる。複数モデルを利用する場合に比べれば感情認識の精度が低くなる可能性もあるが、キャラクターのエージェントがユーザの頭部周辺でさまようような音像定位を実施すると、ユーザの気を引くために、認識したユーザの感情に対して適切でないキャラクターの動作をすることも考えられる。このような場合であっても、ユーザの感情を正確に認識する必要性は比較的に低いと考えられる。

　一方、ゲーム用ガイドラインのサブクラスであるペットロボット用ガイドラインでは、「ペットロボット」はユーザに対する帰属性が強いという観点から、ユーザの感情をより正確に認識する必要性が高いので、「複数のモデル利用」＝「ＹＥＳ」、すなわち複数の人工知能の出力を総合的に判断して高い精度で人間の感情を認識することを要求している。

　なお、図１２に示すガイドラインのクラス階層は一例であり、特定の設計を示唆する固定の階層構造ではない。例えば、ルートクラスの下に図示しないサブクラスをさらに含むことや、又は図示したサブクラスの一部又は全部を含まないこと、サブクラスのさらに下に２階層以上のサブクラスが定義されることも想定される。また、各クラスのガイドラインのパラメータも任意に変更することができる。

　図１３には、ガイドラインに従った前処理の手順をフローチャートの形式で示している。図示の処理手順は、図６中のステップＳ６０１、図８中のステップＳ８０１、並びに図１１中のステップＳ１１０１で、学習用データ前処理ロジック３０１、認識用データ前処理ロジック５０１などによって実行される。

　まず、感情認識活用サービスを提供しようとするコンピュータデバイス２１０の製品又はサービスのカテゴリーと、製品又はサービスとしての人工知能機能情報などを読み込む（ステップＳ１３０１）。

　次いで、製品又はサービスのカテゴリーを指定することで、対応するガイドライン情報をストレージから読み込む（ステップＳ１３０２）。ここでは、ガイドライン情報は、図１２に示したように階層的に構造化されていることを想定しているが、もちろんそれ以外の構造で管理されていてもよい。また、ガイドライン情報は、コンピュータデバイス２１０内のローカルストレージ上、又はクラウドのストレージ上で管理されており、前処理ロジック３０１又は５０１はストレージ上からガイドライン情報を読み込む。

　次いで、ステップＳ１３０２で読み込んだガイドライン情報のうち、ステップＳ１３０１で読み込んだ製品又はサービスのカテゴリーに対応するクラスで規定されている各パラメータを参照して、「感情認識活用サービス」のパラメータが「ＹＥＳ」であるかどうかをチェックする（ステップＳ１３０３）。

　「感情認識活用サービス」のパラメータが「ＹＥＳ」である場合には（ステップＳ１３０３のＹｅｓ）、続いて、「ユーザの同意」パラメータが「ＹＥＳ」であるかどうかをチェックする（ステップＳ１３０４）。

　「ユーザの同意」パラメータが「ＹＥＳ」、すなわち「感情認識活用サービス」パラメータの指定に反する制御を行なう際にユーザの同意が必要である場合には（ステップＳ１３０４のＹｅｓ）、ユーザインターフェース２１３などを通じてユーザの同意を得る処理を実施する（ステップＳ１３０９）。

　また、「感情認識活用サービス」のパラメータが「ＮＯ」である場合には（ステップＳ１３０３のＮｏ）、「例外」のパラメータで「ユーザの同意」が指定されているかどうかをチェックする（ステップＳ１３０８）。そして、「例外」のパラメータで「ユーザの同意」が指定されている場合には（ステップＳ１３０８Ｙｅｓ）、ユーザインターフェース２１３などを通じてユーザの同意を得る処理を実施する（ステップＳ１３０９）。

　ここで、「感情認識活用サービス」のパラメータが「ＮＯ」で且つ「例外」のパラメータで「ユーザの同意」が指定されていない場合（ステップＳ１３０８のＮｏ）、並びに感情認識活用サービスの利用に関してユーザの同意が得られなかった場合には（ステップＳ１３１０のＮｏ）、感情推論（学習、サービス）を行えない状態（又は、感情認識の結果を該当するカテゴリーにおけるサービスの提供に利用できない状態）に設定して（ステップＳ１３１１）、本処理を終了する。

　一方、「ユーザの同意」パラメータが「ＮＯ」、すなわち「感情認識活用サービス」パラメータの指定に反する制御を行なう際にユーザの同意が不要である場合（ステップＳ１３０４のＮｏ）、並びに感情認識活用サービスの利用に関してユーザの同意を得た場合には（ステップＳ１３１０のＹｅｓ）、続いて、「複数モデルの利用」のパラメータが「ＹＥＳ」、すなわち複数の人工知能を利用することが指定されているかどうかをチェックする（ステップＳ１３０５）。

　「複数モデルの利用」のパラメータが「ＹＥＳ」の場合には（ステップＳ１３０５のＹｅｓ）、ステップＳ１３０１で読み込んだ、コンピュータデバイス２１０の人工知能機能を参照して、複数モデルをサポートするかどうかをチェックする（ステップＳ１３０６）。ここで、複数モデルがサポートされない場合には（ステップＳ１３０６のＮｏ）、要求されている感情認識の精度が得られないことが懸念されるので、感情推論（学習、サービス）を行えない状態に設定して（ステップＳ１３１１）、本処理を終了する。

　また、「複数モデルの利用」のパラメータが「ＮＯ」の場合（ステップＳ１３０５のＮｏ）、並びに「複数モデルの利用」のパラメータが「ＹＥＳ」で且つ複数モデルがサポートされている場合には（ステップＳ１３０６のＹｅｓ）、感情推論（学習、サービス）を行える状態（又は、感情認識の結果を該当するカテゴリーにおけるサービスの提供に利用できる状態）に設定して（ステップＳ１３０７）、本処理を終了する。

Ｄ．感情認識サービスのユーザインターフェース
　図１４には、感情認識活用サービスのユーザインターフェース（ＵＩ）画面の構成例を示している。図示のＵＩ画面１４００は、画面の左半分に認識対象の人間の顔画像１４０１を表示するとともに、画面の右半分に感情認識結果１４０２を示している。顔画像１４０１は、画像認識により特定した各顔パーツ（眉毛、目、鼻、口、頬、顎）の位置をオーバーラップして表示している。また、感情認識結果１４０２は、感情推論処理ロジック９０１が顔画像１４０１の表情から認識した「怒り」、「嫌悪」、「恐れ」、「幸福」、「悲しみ」、「驚き」の６つの感情ラベルの各々レベルをレーダーチャート上に表示している。

　図１３に示したガイドラインに従った前処理手順では、「ユーザの同意」パラメータが「ＹＥＳ」の場合、並びに、「感情認識活用サービス」のパラメータが「ＮＯ」であるが「例外」のパラメータで「ユーザの同意」が指定されている場合には、ユーザの同意を得る処理が実施される（前述）。したがって、図１４に示すＵＩ画面１４００の右下には、ユーザの同意を確認するための「Ｑ．感情認識を行います。よろしいですか？」というメッセージ１４０３を表示する。また、メッセージ１４０３の表示と併せて、「感情認識を行います。よろしいですか？」という音声メッセージの発話を行うようにしてもよい。

　そして、ユーザが「よいです。」などの音声による同意や、タッチパネル、キーボード、マウスなどの操作を用いて同意する意思が示されると、ガイドラインに従った前処理が先に進む。他方、ユーザが「いいえ。」などの音声による同意しないという回答や、タッチパネル、キーボード、マウスなどの操作を用いて同意しない意思が示されると、感情推論（学習、サービス）を行えない状態に設定して、ガイドラインに従った前処理が終了する。

　また、ユーザは、感情認識活用サービスの利用に同意した場合であっても、感情認識の結論に至った理由を問い合わせたい場合がある。例えば、ユーザは、感情認識活用サービスを実際に受けた後に、サービスの内容に疑問があり、自身の感情がどのように認識されたのかを問い合わせたい場合がある。また、ユーザが感情認識活用サービスの利用に同意しなかった場合において、ＵＩ画面１４００の右半分に示された感情認識結果１４０２の理由を問い合わせたい場合もある。そこで、感情認識活用サービスを実施するコンピュータデバイス２１０（又は、人工知能システム２００）は、イメージセンサー３１６などからの入力画像や、表情認識に用いられた顔パーツの情報を、感情推論処理ロジック９０１による感情認識結果と併せて記憶するようにしておく。記憶するデータ量を削減するために、特に感情変化の大きかった前後区間の数フレームに限定して記憶するようにしてもよい。なお、記憶の方法にブロックチェーンの技法を用いてもよい。具体的には、データにハッシュデータを付加してネットワーク上に記憶し、ハッシュデータを用いて探索することで、理由の問い合わせに応じて適切なデータを取り出してＵＩ画面１４００に表示することができる。

　人間の顔の表情が突然変化する場合がある。これに備えて、スパイキングニューラルネットワーク（ＳＮＮ）を用いたＤＶＳのデータを組み合わせておくことで、微分的な変化を捉え易くなる。したがって、ＤＶＳの出力が大きく変化した時刻において、上記のデータ記録を行うようにしてもよい。

Ｅ．感情認識活用サービスの効果
　本開示に係る技術によれば、所定のガイドラインに基づいて、必要なレベルで人間の感情認識を行い、且つ、人間とのインタラクションを通じて感情認識のレベルを適切に制御する情報処理装置を提供することができる。

　以上、特定の実施形態を参照しながら、本開示に係る技術について詳細に説明してきた。しかしながら、本開示に係る技術の要旨を逸脱しない範囲で当業者が該実施形態の修正や代用を成し得ることは自明である。

　本明細書では、顔画像から表情を解析した結果に基づいて人間の感情認識を行うシステムに適用した実施形態を中心に説明してきたが、本開示に係る技術の適用範囲はこれに限定されるものではない。人間が発話した音声から感情認識を行うシステムや、脳波や脈拍など生体情報に基づいて感情認識を行うシステム、複数のセンサー情報の組み合わせから感情認識を行うシステムにも同様に、本開示に係る技術を適用することができる。

　本開示に係る技術は、カメラにおける画像認識、テレビにおける画像合成、ヘッドホンなどにおける音声認識、文書処理システムにおける自然言語理解や文書合成、エージェントやロボットにおける行動認識や行動生成を始め、さまざまな分野において感情認識を行う人工知能機能を備えた装置の制御や、装置で用いられるコンピュータプログラムの製造に適用することができる。

　要するに、例示という形態により本開示に係る技術について説明してきたのであり、本明細書の記載内容を限定的に解釈するべきではない。本開示に係る技術の要旨を判断するためには、特許請求の範囲を参酌すべきである。

　なお、本明細書の開示の技術は、以下のような構成をとることも可能である。

（１）所定の基準に基づいて感情認識に基づくサービスの提供の可否を判断する前処理部と、
　人工知能機能を利用してユーザの感情認識を行う感情推定処理部と、
　前記感情推定処理部による感情認識の結果に基づくサービスを提供するサービス提供処理部と、
を具備し、
　前記前処理部がサービスの提供を許可すると判断したときに、前記感情推定処理部は感情認識を行い、又は前記サービス提供処理部はサービスを提供する、
情報処理装置。

（１－１）前記人工知能機能は、センサー情報から人間の感情を認識する、
上記（１）に記載の情報処理装置。

（１－２）前記人工知能機能は、ユーザの顔画像を解析して得た表情から人間の感情を認識する、
上記（１）に記載の情報処理装置。

（２）前記前処理部は、前記の基準に基づいてユーザの同意が必要と判断される場合に、ユーザに感情認識の結果を前記サービスに用いることの同意を求める処理を実施する、
上記（１）に記載の情報処理装置。

（３）前記前処理部は、感情認識の結果を前記サービスに用いることができないと判断されるが、ユーザの同意があることを例外条件に、感情認識の結果を前記サービスに用いることを許可する、
上記（２）に記載の情報処理装置。

（４）前記基準は、複数の人工知能モデルが必要であることを示すデータを含み、
　前記前処理部は、前記基準が前記データを含む場合に、前記感情推定処理部が複数の人工知能モデルを備えているかどうかに基づいてサービスの提供の可否を判定する、
上記（１）乃至（３）のいずれかに記載の情報処理装置。

（５）前記感情推定処理部は、複数の人工知能モデルを用いて推論を行い、各人工知能モデルによる推論結果の集合を感情認識の結果として出力する、
上記（４）に記載の情報処理装置。

（６）前記基準は、サービスを適用する分野に応じて構造化されたデータからなる、
上記（１）乃至（５）のいずれかに記載の情報処理装置。

（７）適用分野毎の前記データは共通のパラメータを含む、
上記（６）に記載の情報処理装置。

（８）前記共通のパラメータは、サービスの提供に感情認識の結果を利用することの是非、サービスの提供に感情認識の結果を利用する例外条件、サービスの提供に感情認識の結果を利用することに対するユーザの同意の要否、複数の人工知能モデルの要否のうち少なくとも１つを含む、
上記（７）に記載の情報処理装置。

（９）前記前処理部は、感情認識の対象となる画像及びその画像に対する表情の解析結果と、前記画像に対する感情認識結果を提示する処理を実施する、
上記（１）乃至（８）のいずれかに記載の情報処理装置。

（９－１）前記前処理部は、複数の感情レベルの各認識結果をレーダーチャートで表示する、
上記（９）に記載の情報処理装置。

（１０）人間の感情を認識するように前記人工知能機能の学習を行う感情学習部をさらに備え、
　前記前処理部は、前記基準に基づいて前記人工知能機能の学習の可否を判断し、
　前記感情学習部は、前記前処理部が学習を許可すると判断したときに、前記人工知能機能に学習用データを入力して感情認識を行えるように訓練する、
上記（１）乃至（９）のいずれかに記載の情報処理装置。

（１０－１）前記感情学習部は、顔画像から人間の感情を認識するように前記人工知能機能の学習を行う、
上記（１０）に記載の情報処理装置。

（１１）前記感情学習部は、ニューラルネットワークで構成される前記人工知能機能の訓練をディープラーニングによって行う、
上記（１０）に記載の情報処理装置。

（１２）所定の基準に基づいて感情認識に基づくサービスの提供の可否を判断する前処理ステップと、
　前記前処理ステップでサービスの提供を許可すると判断したときに、人工知能機能を利用してユーザの感情認識を行う感情推定処理ステップと、
　前記感情推定処理ステップにおける感情認識の結果に基づくサービスを提供するサービス提供処理ステップと、
を有する情報処理方法。

（１３）人工知能機能を用いた感情認識の結果を利用したサービスを提供する人工知能装置において、所定の基準に基づいて感情認識に基づくサービスの提供の可否を判断し、サービスの提供を許可すると判断したときに、前記人工知能機能に学習用データを入力して感情学習を行えるように訓練することにより、感情認識を行うことができる人工知能モデルを製造する、
人工知能モデル製造方法。

（１３－１）ディープラーニングによって前記人工知能機能を訓練する、
上記（１３）に記載の人工知能モデル製造方法。

　１００…情報処理装置、１０１…ＣＰＵ、１０２…記憶装置
　１０３…バス、１０４…カメラ、１０５…マイクロホン
　１０６…ディスプレイ、１０７…スピーカ、１０８…センサー群
　１０９…アクチュエータ群、１１０…通信部
　１２０…クラウドインフラストラクチャ
　２００…人工知能システム、２１０…コンピュータデバイス
　２１１…記憶装置、２１２…処理装置
　２１３…ユーザインターフェース、２１４…入出力ソース
　２２０…クラウドコンピュータ装置、２３０…サーバコンピュータ装置
　２４０…データベース、２５０…通信メディア
　３０１…学習用データ前処理ロジック、３０２…通信モジュール
　３０３…ローカルデータベース、３０４…感情学習処理ロジック
　３０５…文脈認識処理ロジック、３０６…データベース

Claims

　所定の基準に基づいて感情認識に基づくサービスの提供の可否を判断する前処理部と、
　人工知能機能を利用してユーザの感情認識を行う感情推定処理部と、
　前記感情推定処理部による感情認識の結果に基づくサービスを提供するサービス提供処理部と、
を具備し、
　前記前処理部がサービスの提供を許可すると判断したときに、前記感情推定処理部は感情認識を行い、又は前記サービス提供処理部はサービスを提供する、
情報処理装置。
　前記前処理部は、前記の基準に基づいてユーザの同意が必要と判断される場合に、ユーザに感情認識の結果を前記サービスに用いることの同意を求める処理を実施する、
請求項１に記載の情報処理装置。
　前記前処理部は、感情認識の結果を前記サービスに用いることができないと判断されるが、ユーザの同意があることを例外条件に、感情認識の結果を前記サービスに用いることを許可する、
請求項２に記載の情報処理装置。
　前記基準は、複数の人工知能モデルが必要であることを示すデータを含み、
　前記前処理部は、前記基準が前記データを含む場合に、前記感情推定処理部が複数の人工知能モデルを備えているかどうかに基づいてサービスの提供の可否を判定する、
請求項１に記載の情報処理装置。
　前記感情推定処理部は、複数の人工知能モデルを用いて推論を行い、各人工知能モデルによる推論結果の集合を感情認識の結果として出力する、
請求項４に記載の情報処理装置。
　前記基準は、サービスを適用する分野に応じて構造化されたデータからなる、
請求項１に記載の情報処理装置。
　適用分野毎の前記データは共通のパラメータを含む、
請求項６に記載の情報処理装置。
　前記共通のパラメータは、サービスの提供に感情認識の結果を利用することの是非、サービスの提供に感情認識の結果を利用する例外条件、サービスの提供に感情認識の結果を利用することに対するユーザの同意の要否、複数の人工知能モデルの要否のうち少なくとも１つを含む、
請求項７に記載の情報処理装置。
　前記前処理部は、感情認識の対象となる画像及びその画像に対する表情の解析結果と、前記画像に対する感情認識結果を提示する処理を実施する、
請求項１に記載の情報処理装置。
　人間の感情を認識するように前記人工知能機能の学習を行う感情学習部をさらに備え、
　前記前処理部は、前記基準に基づいて前記人工知能機能の学習の可否を判断し、
　前記感情学習部は、前記前処理部が学習を許可すると判断したときに、前記人工知能機能に学習用データを入力して感情認識を行えるように訓練する、
請求項１に記載の情報処理装置。
　前記感情学習部は、ニューラルネットワークで構成される前記人工知能機能の訓練をディープラーニングによって行う、
請求項１０に記載の情報処理装置。
　所定の基準に基づいて感情認識に基づくサービスの提供の可否を判断する前処理ステップと、
　前記前処理ステップでサービスの提供を許可すると判断したときに、人工知能機能を利用してユーザの感情認識を行う感情推定処理ステップと、
　前記感情推定処理ステップにおける感情認識の結果に基づくサービスを提供するサービス提供処理ステップと、
を有する情報処理方法。
　人工知能機能を用いた感情認識の結果を利用したサービスを提供する人工知能装置において、所定の基準に基づいて感情認識に基づくサービスの提供の可否を判断し、サービスの提供を許可すると判断したときに、前記人工知能機能に学習用データを入力して感情学習を行えるように訓練することにより、感情認識を行うことができる人工知能モデルを製造する、
人工知能モデル製造方法。