JP7479558B1

JP7479558B1 - プログラム、及び、システム

Info

Publication number: JP7479558B1
Application number: JP2023187221A
Authority: JP
Inventors: 功淳馬場
Original assignee: Colopl Inc
Current assignee: Colopl Inc
Priority date: 2023-10-31
Filing date: 2023-10-31
Publication date: 2024-05-08
Anticipated expiration: 2043-10-31

Abstract

【課題】ユーザの行動が「人間らしい」行動であるかを客観的に評価する。【解決手段】プログラムは、ユーザが用いるユーザ端末と接続するコンピュータを、前記ユーザの行動を示す行動データを含む第１学習データを用いて学習した第１学習済みモデルに対し、未知の前記ユーザの行動を示す未知データを入力する第１未知データ入力手段と、前記未知データが入力されると、前記未知データに基づき、前記未知データが示す前記ユーザの行動の評価結果を示す第１出力データを生成する第１実行手段と、前記行動データを含む第２学習データを用いて学習した第２学習済みモデルに対し、前記未知データを入力する第２未知データ入力手段と、前記未知データが入力されると、前記未知データに基づき、前記ユーザによる行動の真偽を示す判定結果を示す第２出力データを生成する第２実行手段と、前記第１出力データ、及び、前記第２出力データに基づき、前記ユーザ端末に出力を行う出力手段として機能させる。【選択図】図１３

Description

本発明は、プログラム、及び、システムに関する。

従来、画像を用いて、ユーザの行動を認識する技術が知られている。そして、様々なセンサを用いて、画像データ、ビデオデータ、音響データ、触覚データ、運動感覚データ、温度データ、運動学的データ、及び、無線信号データ等のデータを取得して、スコアリングを行う。具体的には、スコアリングは、文脈的関連スコアリング技術（ｃｏｎｔｅｘｔｕａｌｌｙｒｅｌｅｖａｎｔｓｃｏｒｉｎｇｔｅｃｈｎｉｑｕｅ）で実現する技術が知られている（例えば、特許文献１等である）。

特表２０１７－５２５０７０号公報

ＡＩ（人工知能、ＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅ、以下「ＡＩ」という。）、及び、ＩｏＴ（モノのインターネット、ＩｎｔｅｒｎｅｔｏｆＴｈｉｎｇｓ、以下「ＩｏＴ」という。）等の技術進歩により、ユーザの行動が認識可能である。

ソフトウェア等でユーザに代わって様々な処理が自動化できるのに対し、ユーザが行う行動が、ソフトウェア等では代替が難しい行動、すなわち、「人間らしい」行動が人間に求められるようになりつつある。また、行動が「人間らしい」行動であるか客観的な評価をする必要がある。しかしながら、従来の技術は、「人間らしい」行動をしているか否かが客観的に評価できない。

本発明は、ユーザの行動が「人間らしい」行動であるかを客観的に評価することを目的とする。

本発明は、前記課題を解決するため、プログラムは、コンピュータを、ユーザの行動データを含む第１学習データを用いて学習した第１学習済みモデルに対し、前記ユーザの行動に係る未知データを入力する第１未知データ入力手段と、前記未知データが入力されると、前記未知データに基づき、前記未知データに係る前記ユーザの行動の評価結果に関する第１出力データを生成する第１生成手段と、前記行動データを含む第２学習データを用いて学習した第２学習済みモデルに対し、前記未知データを入力する第２未知データ入力手段と、前記未知データが入力されると、前記未知データに基づき、前記ユーザによる行動の真偽を示す判定結果に関する第２出力データを生成する第２生成手段と、前記第１出力データ、及び、前記第２出力データに基づき、出力を行う出力手段として機能させる。

本発明によれば、ユーザの行動が「人間らしい」行動であるかを客観的に評価できる。

本実施形態に係るシステム構成例を示す図である。事前処理例を示す図である。実行処理例を示す図である。ＡＩの学習、及び、実行の第１全体処理例を示す図である。ＡＩの学習、及び、実行の第２全体処理例を示す図である。情報処理装置のハードウェア構成例を示す図である。ＡＩの構成例を示すネットワーク図である。第１学習済みモデルに対する入力例を示す図である。第２学習済みモデルに対する入力例を示す図である。実行処理例を示す図である。ゲーム内報酬への変換例を示す図である。全体処理例を示す図である。機能構成例を示す図である。補助装置を用いる構成例を示す図である。

以下、実施形態を図面に基づいて説明する。

［システム構成例］
図１は、本実施形態に係るシステム構成例を示す図である。例えば、図１に示すように、システム１は、ユーザ端末２０Ａ、２０Ｂ、２０Ｃ（以下、これらを総称して、「ユーザ端末２０」と表記することがある。）と、サーバ１１とを主に備える。

以下、サーバ１１を管理する者を「管理者５」という。また、ユーザ端末２０Ａ、２０Ｂ、及び、２０Ｃを操作するそれぞれの者を「ユーザ４Ａ」、「ユーザ４Ｂ」、「ユーザ４Ｃ」（以下、これらを総称して、「ユーザ４」と表記することがある。）という。

管理者５は、システム１による情報処理サービスを運営する役割の者である。一方で、ユーザ４は、システム１による情報処理サービスを利用する者である。また、管理者５、及び、ユーザ４は、管理装置の例であるサーバ１１、又は、ユーザ端末２０のどちらの情報処理装置を操作するかが異なる。

なお、図１に示す例は、ユーザ端末２０が３つ、かつ、サーバ１１が１つの例であるが、サーバ１１の台数、ユーザ端末２０の台数、管理者５の人数、及び、ユーザ４の人数は問わない。

サーバ１１、及び、ユーザ端末２０は、通信ネットワーク２を介して相互通信可能に接続する。例えば、通信ネットワーク２は、インターネット、移動体通信システム（例えば、４Ｇ（４ｔｈＧｅｎｅｒａｔｉｏｎ、第４世代移動通信規格）、又は、５Ｇ（５ｔｈＧｅｎｅｒａｔｉｏｎ、第５世代移動通信規格）等による公衆回線である。）、Ｗｉ－Ｆｉ（登録商標）等の無線ネットワーク、又は、これらの組み合わせである。

ユーザ端末２０は、サーバ１１からプログラムをダウンロード、又は、サーバ１１にアクセスしてサービスを提供する。なお、処理を実行する上でサーバ１１と通信がなくともよい。すなわち、ユーザ端末２０は、プログラムをダウンロード、又は、メディアからインストールして実行環境を構築してもよい。なお、ゲームは、例えば、サーバ１１からダウンロードするプログラムをユーザ端末２０にインストール、又は、サーバ１１にアクセスして、ユーザ４にゲームサービスが提供される。

［ＡＩの学習、及び、実行の例］
以下、ＡＩは、「事前処理」によって学習する。学習段階、すなわち、「事前処理」におけるＡＩを「学習モデルＡ１」という。そして、学習モデルＡ１は、ある程度、学習が進むと、「学習済みモデルＡ２」となる。以下、学習済みモデルＡ２を用いて出力処理を実行する実行段階を「実行処理」とする。

なお、本実施形態は、２つのＡＩを用いる。２つのＡＩのうち、一方のＡＩの学習モデルＡ１、及び、学習済みモデルＡ２を「第１学習モデルＡ１１」、及び、学習済みモデルＡ２を「第１学習済みモデルＡ２１」という。同様に、２つのＡＩのうち、他方のＡＩの学習モデルＡ１、及び、学習済みモデルＡ２を「第２学習モデルＡ１２」、及び、学習済みモデルＡ２を「第２学習済みモデルＡ２２」という。

以下の説明では、第１学習モデルＡ１１、及び、第２学習モデルＡ１２を総じて、学習モデルＡ１という。一方で、第１学習済みモデルＡ２１、及び、第２学習済みモデルＡ２２を総じて、学習済みモデルＡ２という。なお、以下の説明では、ＡＩを２つに分けて説明するが、１つのＡＩが２つの機能を備えてもよいし、３つ以上のＡＩで分散して処理が実行されてもよい。

「事前処理」は、「実行処理」より前に行われる。ただし、「実行処理」をする上で引き続き「事前処理」、すなわち、学習済みモデルＡ２が学習を行ってもよい。

［事前処理例］
図２は、事前処理例を示す図である。例えば、事前処理は、サーバ１１で行われる。

学習モデルＡ１は、学習データＤ１を入力して学習を行う。すなわち、学習モデルＡ１は、所謂「教師あり」の学習を行う。以下、第１学習モデルＡ１１、及び、第１学習済みモデルＡ２１を例に説明する。

学習データＤ１は、既知の行動データ等を含み、この行動データに対する「正解」が対応付けされたデータである。具体的には、学習データＤ１は、第１１データＤ１１、第１２データＤ１２、第１３データＤ１３・・・のように、行動の結果、及び、行動の内容を示す行動データ（第１１データＤ１１、第１２データＤ１２、及び、第１３データＤ１３等の複数のデータをまとめたデータ群の場合を含む。以下単に「行動データ」という。）、及び、正解データＤ２０を含む。

学習モデルＡ１は、学習データＤ１の入力に基づき、行動データの入力に対し、正解データＤ２０の出力をする対応関係を学習する。

なお、行動データの詳細は、後述する。

更に、学習モデルＡ１は、ビッグデータＤ４で学習するのが望ましい。例えば、ビッグデータＤ４は、インターネット上のデータ等である。ただし、ビッグデータＤ４は、管理者５等が入力するデータでもよい。

［実行処理例］
図３は、実行処理例を示す図である。例えば、実行処理は、ユーザ端末２０、又は、ユーザ端末２０とサーバ１１が協働して行う。

学習済みモデルＡ２は、事前処理による学習によって学習モデルＡ１が学習した状態である。すなわち、図２に示す事前処理が実行されると、学習済みモデルＡ２が生成される。

学習済みモデルＡ２は、未知データＤ２が入力されると、未知データＤ２に対して、出力データＤ３を生成する。

未知データＤ２は、行動データに対する「正解」が入力の時点では不明なデータである。具体的には、未知データＤ２は、第２１データＤ２１、第２２データＤ２２、第２３データＤ２３、・・・のように、行動データ（第２１データＤ２１、第２２データＤ２２、及び、第２３データＤ２３等の複数のデータをまとめたデータ群の場合を含む。以下単に「行動データ」という。）を含む。例えば、未知データＤ２は、学習データＤ１と同じ種類（データ形式等であり、内容は異なる。）のデータで構成される。

出力データＤ３が生成されると、出力データＤ３は、例えば、ユーザ端末２０に送信される。その後、ユーザ端末２０は、出力データＤ３に基づき、ユーザ４に対して出力画面等を出力する。

出力データＤ３、及び、出力データＤ３に基づく出力の詳細は後述する。

図４、及び、図５は、ＡＩの学習、及び、実行の全体処理例を示す図である。

図４は、ＡＩの学習、及び、実行の第１全体処理例を示す図である。

図５は、ＡＩの学習、及び、実行の第２全体処理例を示す図である。

図２に示す事前処理、及び、図３に示す実行処理の関係は、第１学習モデルＡ１１、及び、第１学習済みモデルＡ２１の場合には、図４に示すような関係となる。一方で、図２に示す事前処理、及び、図３に示す実行処理の関係は、第２学習モデルＡ１２、及び、第２学習済みモデルＡ２２の場合には、図５に示すような関係となる。

なお、事前処理、及び、実行処理を図に例示するような連続する順序で実行しなくともよい。したがって、事前処理によって準備を行う期間と、その後、実行処理を行う期間を連続させることは必須ではない。ゆえに、実行処理は、学習済みモデルＡ２を一旦作成した後であれば、事前処理から時間が経過した後に実行処理を行うようにしてもよい。また、学習済みモデルＡ２が一度生成された後であれば、学習済みモデルＡ２を転用して実行処理が行われてもよい。

学習処理と実行処理では、学習データＤ１と未知データＤ２が異なる。また、ＡＩは、学習段階では、学習モデルＡ１であったのが、ある程度学習が進むと、学習済みモデルＡ２となる。このように、ビッグデータＤ４を学習データとして学習した学習済みモデルＡ２は、所謂「生成ＡＩ」である。

学習データＤ１に含まれる第１１データＤ１１と、未知データＤ２に含まれる第２１データＤ２１（以下、第１２データＤ１２と第２２データＤ２２等も同様の関係である。）は、同じデータ種類である。すなわち、第１１データＤ１１と第２１データＤ２１は、どちらも行動データである。なお、行動データは、２つのＡＩで兼用（例えば、コピーして各ＡＩに入力する。）でもよいし、異なる行動データ（一部異なる場合を含む。）が入力されてもよい。以下、２つのＡＩで行動データは、兼用である例で説明する。

学習データＤ１は、「正解」が既知であるのに対し、未知データＤ２は、「正解」が未知となる。具体的には、学習データＤ１は、正解データＤ２０を含むのに対し、未知データＤ２は、正解データＤ２０を含まない。したがって、学習データＤ１は、行動データと正解データＤ２０の関係が既知である。

一方で、未知データＤ２には、正解データＤ２０が含まれず、未知データＤ２に対する「正解」が未知である。そして、学習済みモデルＡ２は、事前処理で学習した学習データＤ１と正解データＤ２０の相関関係に基づき、未知データＤ２に対して出力データＤ３を生成する。

第１全体処理と第２全体処理を比較すると、学習における正解データＤ２０が異なる、すなわち、実行処理で出力する出力データＤ３の内容が異なる。以下、第１学習モデルＡ１１の学習に用いる正解データＤ２０を「第１正解データＤ５１」という。一方で、第２学習モデルＡ１２の学習に用いる正解データＤ２０を「第２正解データＤ５２」という。

第１正解データＤ５１、第２正解データＤ５２、及び、出力データＤ３の詳細は後述する。

実行処理は、一部をテーブル等を用いる処理でもよい。このように、テーブルを用いる構成、所謂ルールベースでは、事前処理は、テーブル（ルックアップテーブル（ＬｏｏｋＵｐＴａｂｌｅ、ＬＵＴ）等ともいう。）、又は、数式等を入力する準備を行う処理である。

［情報処理装置のハードウェア構成例］
図６は、情報処理装置のハードウェア構成図である。情報処理装置は、サーバ１１、及び、ユーザ端末２０等である。以下、情報処理装置は、サーバ１１と同じハードウェア構成であるとする。例えば、情報処理装置は、ワークステーション、又は、パーソナルコンピュータ等の汎用コンピュータである。ただし、それぞれの情報処理装置は、ハードウェア構成が異なってもよい。また、行動をセンシングするのは、ＩｏＴデバイス、又は、ウェアラブル端末等が望ましい。

サーバ１１は、プロセッサ１１１と、メモリ１１２と、ストレージ１１３と、入出力インタフェース１１４と、通信インタフェース１１５とを主に備える。また、サーバ１１の各構成要素は、通信バス１１６に接続する。

プロセッサ１１１は、メモリ１１２又はストレージ１１３に格納されているサーバプログラム１１Ｐに含まれる一連の命令を実行することによって、処理、及び、制御を実現する。

プロセッサ１１１は、例えば、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、ＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、ＭＰＵ（ＭｉｃｒｏＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、ＦＰＧＡ（Ｆｉｅｌｄ－ＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）、ＡＳＩＣ（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）、又は、これらの組み合わせ等の演算装置、及び、制御装置である。

メモリ１１２は、サーバプログラム１１Ｐ、及び、データ等を記憶する主記憶装置である。例えば、サーバプログラム１１Ｐは、ストレージ１１３からロードされる。また、データは、サーバ１１に入力されたデータと、プロセッサ１１１によって生成されたデータとを含む。例えば、メモリ１１２は、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、又は、その他の揮発メモリである。

ストレージ１１３は、サーバプログラム１１Ｐ、及び、データ等を記憶する補助記憶装置である。ストレージ１１３は、例えば、ＲＯＭ（Ｒｅａｄ－ＯｎｌｙＭｅｍｏｒｙ）、ハードディスク装置、フラッシュメモリ、又は、その他の不揮発記憶装置である。また、ストレージ１１３は、メモリカードのように着脱可能な記憶装置でもよい。更に、他の例として、ストレージ１１３は、外部記憶装置であってもよい。このような構成によれば、例えば、アミューズメント施設のように複数のユーザ端末２０が使用される場面において、サーバプログラム１１Ｐ、又は、データの更新等を一括して行うことが可能になる。

入出力インタフェース１１４は、モニタ、入力装置（例えば、キーボード、又は、ポインティングデバイス等である。）、外部記憶装置、スピーカ、カメラ、マイク、及び、センサ等の外部装置をサーバ１１に接続するインタフェースである。

また、プロセッサ１１１は、入出力インタフェース１１４を通じて外部装置と通信する。入出力インタフェース１１４は、例えば、ＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）、ＤＶＩ（ＤｉｇｉｔａｌＶｉｓｕａｌＩｎｔｅｒｆａｃｅ）、ＨＤＭＩ（登録商標）（Ｈｉｇｈ－ＤｅｆｉｎｉｔｉｏｎＭｕｌｔｉｍｅｄｉａＩｎｔｅｒｆａｃｅ）、無線、及び、その他の端子である。

通信インタフェース１１５は、通信ネットワーク２に接続する他の装置（例えば、ユーザ端末２０等である。）と通信する。例えば、通信インタフェース１１５は、ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）等の有線通信インタフェース、Ｗｉ－Ｆｉ（登録商標）（ＷｉｒｅｌｅｓｓＦｉｄｅｌｉｔｙ）、Ｂｌｕｅｔｏｏｔｈ（登録商標）、又は、ＮＦＣ（ＮｅａｒＦｉｅｌｄＣｏｍｍｕｎｉｃａｔｉｏｎ）等の無線通信インタフェースである。

ただし、情報処理装置は、上記のハードウェア構成に限られない。例えば、ユーザ端末２０は、カメラ等のセンサを更に備えてもよい。そして、ユーザ端末２０がセンサで取得する様々なデータがサーバ１１に送信されてもよい。

［学習モデル、及び、学習済みモデルの構成例］
図７は、ＡＩの構成例を示すネットワーク図である。学習モデルＡ１、及び、学習済みモデルＡ２は、例えば、以下のようなネットワークで示す構成のＡＩである。

以下、学習モデルＡ１、及び、学習済みモデルＡ２は、サーバ１１上、すなわち、クラウド上に実装される例で説明する。ただし、学習モデルＡ１、及び、学習済みモデルＡ２の一部、又は、全部は、ユーザ端末２０等に実装されてもよい。

ネットワーク３００は、例えば、入力層Ｌ１、中間層Ｌ２（「隠れ層」等ともいう。）、及び、出力層Ｌ３等を有する構成である。

入力層Ｌ１は、データを入力する層である。

中間層Ｌ２は、入力層Ｌ１で入力するデータを重み（例えば、乗算に用いる係数である。）、及び、バイアス（例えば、定数を加算する。）等に基づいて変換する。このように中間層Ｌ２で処理された結果が出力層Ｌ３へ伝えられる。

出力層Ｌ３は、出力内容等を出力する層である。

そして、学習により、重みの係数（例えば、入力する文字、又は、画像に対する係数を学習に基づき変化させる。）、及び、学習で変化させるパラメータ等が最適化される。なお、ネットワーク３００は、図示するネットワーク構造に限られない。つまり、ＡＩは、他の機械学習によって実現されてもよい。

例えば、ＡＩは、「教師なし」の機械学習等により、次元削減（例えば、３次元以上の関係を３次元以下程度の簡略な計算で求まる関係に変える処理である。）等の前処理を行う構成等でもよい。入力と出力の関係は、１次式等の単純な計算で処理されるのが望ましい。このような計算であると、計算コストを少なくできる。

また、ＡＩは、ドロップアウト等といった過学習（「過剰適合」又は「過適合」等ともいう。）（ｏｖｅｒｆｉｔｔｉｎｇ）を軽減化させる処理が行われてもよい。他にも、次元削減、及び、正規化等の前処理が行われてもよい。

ＡＩは、ＣＮＮ（畳み込みニューラルネットワーク、ＣｏｎｖｏｌｕｔｉｏｎＮｅｕｒａｌＮｅｔｗｏｒｋ）のネットワーク構造等があってもよい。他にも、例えば、ネットワーク構造は、ＬＬＭ（ＬａｒｇｅＬａｎｇｕａｇｅＭｏｄｅｌ大規模言語モデル）、ＲＮＮ（再帰型ニューラルネットワーク、ＲｅｃｕｒｒｅｎｔＮｅｕｒａｌＮｅｔｗｏｒｋ）又はＬＳＴＭ（ＬｏｎｇＳｈｏｒｔ－ＴｅｒｍＭｅｍｏｒｙ）等の構成を有してもよい。すなわち、ＡＩは、ディープラーニング以外のネットワーク構造等であってもよい。

また、ＡＩは、ハイパパラメータを有する構成であってもよい。すなわち、ＡＩは、一部の設定をユーザ等が行う構成でもよい。更に、ＡＩは、学習対象とする特徴量を特定してもよいし、ユーザが学習対象とする一部又は全部の特徴量を設定してもよい。

更に、学習モデルＡ１、及び、学習済みモデルＡ２は、他の機械学習を利用してもよい。例えば、学習モデルＡ１、及び、学習済みモデルＡ２は、教師なしのモデルにより、正規化等を前処理で行ってもよい。更に、学習は、強化学習（ＲｅｉｎｆｏｒｃｅｍｅｎｔＬｅａｒｎｉｎｇ、ＡＩに選択をさせ、選択に対する評価（報酬）を与えて、評価が大きくなるような学習方法をいう。）等であってもよい。

学習では、データの拡張等が行われてもよい。すなわち、学習モデルＡ１の学習に用いる学習データを増やすため、１つの実験データ等を拡張させて、複数の学習データにする前処理が行われてもよい。このようにして、学習データを増やせると、より学習モデルＡ１の学習を進めることができる。

また、学習モデルＡ１、及び、学習済みモデルＡ２は、転移学習（ＴｒａｎｓｆｅｒＬｅａｒｎｉｎｇ）、又は、ファインチューニング（Ｆｉｎｅｔｕｎｉｎｇ）等を行う構成でもよい。すなわち、ユーザ端末２０は、装置ごとに異なる実行環境となる場合が多いため、実行環境に合わせて装置ごとに設定が異なってもよい。例えば、ＡＩの基本構成は、別の情報処理装置で学習する。その後、各々の情報処理装置は、更に各々の実行環境に最適化するため、更に学習、又は、設定等がされてもよい。

［人間らしさの評価例］
人間らしさは、例えば、身体性（Ｅｍｂｏｄｉｍｅｎｔ）等に関して評価すると、ＡＩ、又は、ロボット等ではなく、人であると精度良く評価できる。例えば、所謂なりすまし等をしようとしてソフトウェア等で人間の存在を偽装する場合には、評価対象となる人物が物理的に存在しないため、身体を動かすような行動をとるのが難しい。

例えば、運動をすれば、人の体が動くため、振動、及び、音等が少なからず生じる。他にも、生活反応等もある。一方で、存在を偽装しているような場合には、実在する人体がないため、運動等を示すセンシング結果が得られない。

ゆえに、運動等が認められる身体性を伴う行動があるか否かを評価すると、人間らしい行動であるか否かが精度良く判定できる。なお、判定は、身体性に関する以外の項目で評価してもよい。

ただし、人間らしさは、身体性に限られず、ＡＩ、ロボット、又は、ソフトウェア等が対応しにくい事項であればよい。

なお、行動は、社会的、及び、一般的に望ましい行動であるか更に評価されるのが望ましい。例えば、運動等が適度に行われるのは健康的には望ましい行動である。他にも、イベントとして、ボランティア活動等のイベントに参加するのであれば、社会的に望ましい行動である場合が多い。また、ごみを拾う、又は、地球環境に優しい商品を購入する等の行動も望ましい行動である場合が多い。これらの行動がされたと評価できる場合には、評価結果が高評価である等としてもよい。例えば、学習モデルＡ１は、どういった行動がより望ましいかはビッグデータＤ４等で学習する。

［行動データの例］
図８は、第１学習済みモデルに対する入力例を示す図である。例えば、未知データＤ２として、行動データＤ２０１は以下のように入力される。

行動データＤ２０１は、ユーザ端末２０においてユーザが行動すると、行動に合わせて生成される。なお、未知データＤ２は、ユーザ４による操作（例えば、運動記録を入力等である。）に基づいて生成、ユーザ端末２０が行動に合わせてバックグランドで自動的に生成（例えば、加速度センサ、及び、位置センサでユーザ４が歩行している歩数、又は、歩行速度等である。）、又は、他のアプリ等から取得して入力する。

行動データＤ２０１は、例えば、センサ等（センサデータを分析した分析結果を含む。）で取得される。また、行動データは、例えば、ユーザ４がＧＵＩ（ＧｒａｐｈｉｃａｌＵｓｅｒＩｎｔｅｒｆａｃｅ）で入力する、所謂「自己申告」で入力されてもよい。他にも、行動データＤ２０１は、他のアプリから取得する、又は、ＳＮＳ（ＳｏｃｉａｌＮｅｔｗｏｒｋｉｎｇＳｅｒｖｉｃｅ）等のネットワークでの送信内容を分析してもよい。

具体的には、加速度センサ、ＧＮＳＳ（ＧｌｏｂａｌＮａｖｉｇａｔｉｏｎＳａｔｅｌｌｉｔｅＳｙｓｔｅｍ）等による位置センサ、カメラ、又は、マイク等のセンサデータを分析すると、例えば、ユーザ４が運動をしている、自動車等で移動している、他者とコミュニケーションを取っている等が特定できる。

ユーザ４が小売店で購入した際のレシートを撮影した画像データ等が取得できると、ユーザ４の購入履歴が入力できる。

申し込みサイトにおける申込履歴等を示す申込履歴データ、又は、チケット等を撮影した画像データ等が取得できると、ユーザ４の参加行動記録が入力できる。なお、イベントは、現実空間のイベントでもよいし、オンラインセミナー等のイベントでもよい。

電話での発言、又は、マイク等の音声センサで、ユーザ４が発する発言を取得できると、ユーザ４の発言記録が入力できる。また、複数の人の音声が認識されると、実際に会話しているコミュニケーション記録が入力できる。なお、コミュニケーション記録は、ウェブ上、又は、チャットアプリ等でのコミュニケーションでもよい。

チャットアプリ、ＳＮＳ、又は、インターネット、すなわち、ネットワークを介してユーザ４が発する送信データ等が取得できると、ユーザ４の送信記録が入力できる。

ユーザ４が自己の行動について入力する、所謂「自己申告」で行動が入力されてもよい。例えば、行動を入力する専用ＧＵＩ等で入力されてもよいし、ユーザ４が他のアプリ等で日誌等を入力する場合には、日誌データを分析して自己申告記録としてもよい。

ユーザ４がゲームをした場合には、ゲームの操作記録（例えば、各種ゲームのデータである。）等が取得できると、ユーザ４のゲームにおける操作記録が入力できる。

他にも、各種ログ等の履歴が行動データに用いられてもよい。例えば、検索エンジンの検索履歴、各種アプリの履歴、通話履歴、食事履歴、又は、ブラウザのアクセス履歴等が行動データに入力されてもよい。

また、事前処理、すなわち、学習により、ビッグデータＤ４によって、学習済みモデルＡ２は、インターネット上における情報に基づき、どのような行動が人間らしい行動であるか、イベント情報、及び、望ましい行動の具体例等を学習した状態である。学習は、動画を画像解析した結果を利用してもよい。したがって、学習済みモデルＡ２は、どのような行動が望ましい行動であるか評価できる状態である。

図９は、第２学習済みモデルに対する入力例を示す図である。例えば、第２学習済みモデルＡ２２には、第１学習済みモデルＡ２１と同じ未知データＤ２が入力される。ただし、第２学習済みモデルＡ２２には、ユーザ４による行動の真偽を判定するのに補助的なデータ（以下「補助データ」という。）が更に追加されてもよい。

補助データは、例えば、運動の行動が行われたか否かの真偽を判定するのに、未知データＤ２以外に、各データがコピーされて生成されていないか、又は、別の裏付けとなるデータ（例えば、未知データＤ２が自己申告記録であれば、運動を裏付ける、運動がされたと申告された時間帯のセンサデータ等である。）等である。

このような補助データがあると、第２学習済みモデルＡ２２は、より運動の行動が行われたか否かの真偽が精度良く判定できる。

［実行処理例］
図１０は、実行処理例を示す図である。以下、未知データＤ２として、「筋肉トレーニング」と「他者と会話」をユーザ４が自己申告（例えば、テキスト入力したとする。）した場合を例に説明する。

第１学習済みモデルＡ２１は、「人間らしい」行動の評価結果を示す第１出力データＤ３１を生成する。例えば、第１出力データＤ３１は、「人間らしい」行動の確率を示す定量的な評価結果を示す。ただし、第１出力データＤ３１は、確率がなく、「人間らしい」行動が高確率（例えば、５０％以上の確率の場合である。）で行われたとする場合には、単に「行動があった。」等という評価結果でもよい。

なお、第１出力データＤ３１は、定性的な評価を含んでもよい。例えば、第１出力データＤ３１は、運動の行動に対しては、どういった運動であるか（運動の種類）等の詳細を示す。なお、第１出力データＤ３１は、望ましい行動であるか等の評価結果を含んでもよい。

第２学習済みモデルＡ２２は、ユーザ４による行動の真偽を示す判定結果を示す第２出力データＤ３２を生成する。以下の例では、第２学習済みモデルＡ２２は、未知データＤ２が示す「筋肉トレーニング」と「他者と会話」という行動が実際に行われたか真偽を判定する。

第２出力データＤ３２は、例えば、「筋肉トレーニング」の行動がされたかの真偽を判定する。例えば、第２学習済みモデルＡ２２は、自己申告のあった日時等の時間帯の振動データ、心拍データ、及び、チェックインデータ等の補助データを取得して、補助データに基づいて真偽を判定する。

同様に、第２出力データＤ３２は、「他者と会話」という行動がされたかの真偽を判定する。例えば、第２学習済みモデルＡ２２は、自己申告のあった日時にマイクで取得する音声データの補助データを取得して、補助データに基づいて真偽を判定する。

なお、判定に用いた補助データは、証拠データとしてもよい。例えば、「他者と会話」という行動については、音声データ等を証拠データと残し、クラウド等に保存するとしてもよい。また、ＡＩが会話している人が識別できるのであれば、誰と誰の会話であるか、又は、会話内容の要約等を更に生成してもよい。

以上のように、行動に対し、第２学習済みモデルＡ２２は、どのような種類のデータを取得し、どのような判定基準を設定したらよいか等を学習済みである。したがって、判定方法、用いるデータ、及び、判定基準等は、行動の種類等に応じて異なる。

なお、これらの行動に対し、アドバイスが更に出力されてもよい。例えば、運動、又は、食事等の行動があれば、より健康上適切な運動、又は、食事内容があれば、推奨する運動、又は、食事内容を示すアドバイスがテキスト等で出力されてもよい。

［ゲーム内報酬への変換例］
図１１は、ゲーム内報酬への変換例を示す図である。行動の入力に対して、ゲームにおける報酬に変換されてもよい。

例えば、運動の行動がされると、第１出力データＤ３１が、ゲーム内で使用できるポイントに変換される。ポイントは、例えば、ゲーム内の通貨等になる。

なお、報酬は、ポイントに限られず、アイテム、スコア、又は、キャラクタのパラメータ強化等でもよい。

変換対象とする行動、種類、ポイント数、又は、報酬がもらえるタイミング等については適宜設定可能である。また、これらは、事前に設定されてもよいし、ユーザ４が任意に選択できてもよい。

［全体処理例］
図１２は、全体処理例を示す図である。以下の例では、全体処理は、事前処理と実行処理を連続して行う。具体的には、ステップＳ０１が学習処理である。また、ステップＳ０２乃至ステップＳ０５が実行処理である。ただし、全体処理には、これら以外の処理が含まれてもよい。

ステップＳ０１では、サーバ１１は、行動データ、及び、正解データを含む学習データＤ１を入力して、第１学習モデルＡ１１、及び、第２学習モデルＡ１２を学習させる。そして、ステップＳ０１が行われると、第１学習済みモデルＡ２１、及び、第２学習済みモデルＡ２２が生成される。このように、学習モデルＡ１が学習して学習済みモデルＡ２となると、学習済みモデルＡ２を用いて実行処理が実行される。

ステップＳ０２では、サーバ１１は、未知データＤ２を入力する。例えば、ステップＳ０２は、センサデータの取得、又は、ユーザ４の入力等で未知データＤ２が入力される。以下、未知データＤ２の入力時点を以降の処理（評価等）の実行開始トリガとするが、以降の処理の開始、すなわち、出力がされるタイミング等は、ユーザ４が指定したタイミングでもよい。

ステップＳ０３では、サーバ１１は、行動を評価する。そして、評価結果に基づき、第１出力データＤ３１が生成される。

ステップＳ０４では、サーバ１１は、ユーザによる行動の真偽を示す判定を行う。そして、判定結果に基づき、第２出力データＤ３２が生成される。

ステップＳ０５では、サーバ１１は、第１出力データＤ３１、及び、第２出力データＤ３２に基づいて出力を行う。例えば、出力させるタイミング、又は、出力させる画面、すなわち、ステップＳ０５を実行するタイミング、及び、対象等は、事前に設定される。

［機能構成例］
図１３は、機能構成例を示す図である。例えば、システム１は、学習装置３１、及び、実行装置３２を備えるパーソナルＡＩシステムである。

学習装置３１は、第１学習データ入力手段１Ｆ１、第１学習手段１Ｆ２、第２学習データ入力手段１Ｆ３、及び、第２学習手段１Ｆ４を備える。

第１学習データ入力手段１Ｆ１は、行動データ、及び、第１正解データＤ５１を含む学習データＤ１を入力する第１学習データ入力手順を行う。例えば、第１学習データ入力手段１Ｆ１は、通信インタフェース１１５等で実現する。

第１学習手段１Ｆ２は、行動データ、及び、第１正解データＤ５１を用いて第１学習モデルＡ１１を学習させて、第１学習済みモデルＡ２１を生成する第１学習手順を行う。例えば、第１学習手段１Ｆ２は、プロセッサ１１１等で実現する。

第２学習データ入力手段１Ｆ３は、行動データ、及び、第２正解データＤ５２を含む学習データＤ１を入力する第２学習データ入力手順を行う。例えば、第２学習データ入力手段１Ｆ３は、通信インタフェース１１５等で実現する。

第２学習手段１Ｆ４は、行動データ、及び、第２正解データＤ５２を用いて第２学習モデルＡ１２を学習させて、第２学習済みモデルＡ２２を生成する第２学習手順を行う。例えば、第２学習手段１Ｆ４は、プロセッサ１１１等で実現する。

実行装置３２は、第１未知データ入力手段１Ｆ５、第１生成手段１Ｆ６、第２未知データ入力手段１Ｆ７、第２生成手段１Ｆ８、及び、出力手段１Ｆ９を備える。また、実行装置３２は、変換手段１Ｆ１０を更に備えるのが望ましい。

第１未知データ入力手段１Ｆ５は、第１学習手段１Ｆ２が生成した第１学習済みモデルＡ２１に対して、未知の行動データを含む未知データＤ２を入力する第１未知データ入力手順を行う。例えば、第１未知データ入力手段１Ｆ５は、通信インタフェース１１５等で実現する。

第１生成手段１Ｆ６は、未知データＤ２が入力されると、未知データＤ２に基づき、第１出力データＤ３１を生成する第１生成手順を行う。例えば、第１生成手段１Ｆ６は、プロセッサ１１１等で実現する。

第２未知データ入力手段１Ｆ７は、第２学習手段１Ｆ４が生成した第２学習済みモデルＡ２２に対して、未知の行動データを含む未知データＤ２を入力する第２未知データ入力手順を行う。例えば、第２未知データ入力手段１Ｆ７は、通信インタフェース１１５等で実現する。

第２生成手段１Ｆ８は、未知データＤ２が入力されると、未知データＤ２に基づき、第２出力データＤ３２を生成する第２生成手順を行う。例えば、第２生成手段１Ｆ８は、プロセッサ１１１等で実現する。

出力手段１Ｆ９は、第１出力データＤ３１、及び、第２出力データＤ３２に基づき、ユーザ端末２０に出力を行う出力手順を行う。例えば、出力手段１Ｆ９は、通信インタフェース１１５等で実現する。

変換手段１Ｆ１０は、評価結果をゲームにおける報酬に変換する変換手順を行う。例えば、変換手段１Ｆ１０は、プロセッサ１１１等で実現する。

学習装置３１、及び、実行装置３２は、例えば、サーバ１１である。ただし、学習装置３１、及び、実行装置３２は、異なる情報処理装置でもよい。

以上のような構成であると、ユーザ４の行動が「人間らしい」行動であるかを客観的に評価できる。まず、ユーザ４が行動したとする場合に、未知データＤ２が入力される。次に、未知データＤ２に基づき、第１学習済みモデルＡ２１が、ユーザ４の行動を評価する。したがって、ユーザ４、すなわち、人間でないと難しい行動であるかＡＩによって評価される。

続いて、未知データＤ２に基づき、第２学習済みモデルＡ２２が、ユーザ４による行動の真偽を判定する。例えば、第２学習済みモデルＡ２２は、行動データが捏造されて生成、又は、実際は申告した行動とは異なる行動等の不正行為がないかを判定する。

判定は、例えば、複数の補助データがどれも不正行為がない場合には「真」とする。一方で、判定は、補助データが示す行動内容と申告された行動内容が相違する場合には「偽」とする。

不正行為は、ＡＩ、ソフトウェア、又は、ロボット等をユーザ４に代わって行動させる、又は、行動したと見せかけるデータを入力して、実際は行動がされていないのに行動をしたように見せかける等である。

そこで、ソフトウェア等では代替が難しい行動、すなわち、「人間らしい」行動がないかの評価、及び、評価対象とされた行動が不正行為なくされたものであるかをＡＩで判定する。このような評価、及び、判定がされると、「人間らしい」行動であるか客観的な評価ができる。

なお、ゲームの種類は、報酬となるポイント、及び、アイテム等がゲームにあれば、ゲームの種類は限定されない。例えば、ゲームの種類は、ＲＰＧ、スポーツ、アクション、パズル、又は、格闘を含むゲームである。

［その他の実施形態］
上記の例では、情報処理装置は、学習モデルに対する事前処理、及び、学習済みモデルを用いて実行処理の両方を行う。ただし、事前処理、及び、実行処理は、同じの情報処理装置が行わなくともよい。また、事前処理、及び、実行処理も、１つの情報処理装置で一貫して実行しなくともよい。すなわち、各処理、及び、データの記憶等は、複数の情報処理装置で構成する情報システム等で行ってもよい。

なお、学習処理は、実行処理の後、又は、実行処理の前に追加して更に行われてもよい。

上記のような処理は、サーバ１１、及び、ユーザ端末２０以外の情報処理装置が補助的に行ってもよい。

図１４は、補助装置を用いる構成例を示す図である。図１に示す例と比較すると、図１４に示す構成は、補助装置６０が加わる点が異なる。なお、補助装置６０は、一時的に用いる構成でもよい。

補助装置６０は、ユーザ端末２０（この例では、ユーザ端末２０Ａ付近に設置しているが、他の装置近くにあってもよい。）等の近くに設置される情報処理装置である。そして、補助装置６０は、特定の処理をユーザ端末２０、又は、サーバ１１に代わって一部又は全部を実行する。

例えば、補助装置６０は、グラフィック処理に特化したデバイスを備えて、グラフィック処理を高速で行う。このように、補助装置６０等を設置して、所謂エッジコンピューティング（ＥｄｇｅＣｏｍｐｕｔｉｎｇ）等が行われてもよい。このように、前述する処理は、様々な情報処理装置のハードウェアリソースを活用して実行されてもよい。したがって、前述する処理は、前述したのとは異なる情報処理装置が実行してもよい。

前述の処理、及び、本実施形態で実行される処理に用いるデータは、情報処理システムによって実行、及び、記憶されてもよい。例えば、情報処理システムは、処理又は記憶を冗長、分散、並列、又は、これらの組み合わせを実現するため、複数の情報処理装置で実行又は記憶してもよい。したがって、本発明は、前述に示すハードウェア構成以外の装置、及び、前述に示す装置以外のシステムで実現されてもよい。

また、本発明に係るプログラムは、単一のプログラムに限定されず、複数のプログラムの集合体でもよい。また、本発明に係るプログラムは、単一の装置で実行されるものに限定されず、複数の情報処理装置で分担して実行されてもよい。更に、各情報処理装置の役割分担は、前述の例に限定されない。すなわち、前述した処理の一部、又は、全部が前述した情報処理装置とは異なる情報処理装置が実行してもよい。

更に、プログラムによって実現される各手段の一部、又は、全部は、集積回路等のハードウェアで実現することもできる。更に、プログラムは、コンピュータによって読み出し可能な非一過性の記録媒体に記録されて提供されてもよい。記録媒体とは、例えば、ハードディスク、ＳＤカード（登録商標）、ＤＶＤ等の光学ディスク、又は、インターネット上のサーバ等を指す。したがって、プログラムは、インターネット等の電気通信回線を介して配信されでもよい。

また、情報処理システムを構成する情報処理装置等は、海外にあってもよい。すなわち、情報処理システムが実行する処理のうち、一部の処理を実行する情報処理装置が海外にあってもよい。

なお、本発明は、前述に例示する各実施形態に限定されない。したがって、本発明は、技術的な要旨を逸脱しない範囲で、構成要素の追加、又は、変形が可能である。ゆえに、特許請求の範囲に記載された技術思想に含まれる技術的事項のすべてが本発明の対象となる。なお、前述に例示する実施形態は、実施において好適な具体例である。そして、当業者であれば、開示した内容から様々な変形例を実現で可能であって、このような変形例は、特許請求の範囲に記載された技術的範囲に含まれる。

１：システム
１Ｆ１：第１学習データ入力手段
１Ｆ２：第１学習手段
１Ｆ３：第２学習データ入力手段
１Ｆ４：第２学習手段
１Ｆ５：第１未知データ入力手段
１Ｆ６：第１生成手段
１Ｆ７：第２未知データ入力手段
１Ｆ８：第２生成手段
１Ｆ９：出力手段
１Ｆ１０：変換手段
３：管理者
４：ユーザ
５：管理者
１１：サーバ
２０：ユーザ端末
３１：学習装置
３２：実行装置
６０：補助装置
Ｄ１：学習データ
Ｄ２：未知データ
Ｄ２０：正解データ
Ｄ４：ビッグデータ
Ａ１：学習モデル
Ａ２：学習済みモデル
Ａ１：学習モデル
Ａ１１：第１学習モデル
Ａ１２：第２学習モデル
Ａ２１：第１学習済みモデル
Ａ２２：第２学習済みモデル
Ｄ１：学習データ
Ｄ１１：第１１データ
Ｄ１２：第１２データ
Ｄ１３：第１３データ
Ｄ２：未知データ
Ｄ２０：正解データ
Ｄ２０１：行動データ
Ｄ２１：第２１データ
Ｄ２２：第２２データ
Ｄ２３：第２３データ
Ｄ３：出力データ
Ｄ３１：第１出力データ
Ｄ３２：第２出力データ
Ｄ４：ビッグデータ
Ｄ５１：第１正解データ
Ｄ５２：第２正解データ

Claims

コンピュータを、
ユーザの行動データを含む第１学習データを用いて学習した第１学習済みモデルに対し、前記ユーザの行動に係る未知データを入力する第１未知データ入力手段と、
前記未知データが入力されると、前記未知データに基づき、前記未知データに係る前記ユーザの行動の評価結果に関する第１出力データを生成する第１生成手段と、
前記行動データを含む第２学習データを用いて学習した第２学習済みモデルに対し、前記未知データを入力する第２未知データ入力手段と、
前記未知データが入力されると、前記未知データに基づき、前記ユーザによる行動の真偽を示す判定結果に関する第２出力データを生成する第２生成手段と、
前記第１出力データ、及び、前記第２出力データに基づき、出力を行う出力手段として機能させるプログラム。
前記第２生成手段は、
前記判定結果の証拠に関する証拠データを更に生成する
請求項１に記載のプログラム。
前記評価結果をゲームにおける報酬に変換する変換手段として更に機能させる
請求項１に記載のプログラム。
前記第１学習データは、
前記行動の人間らしさを評価した結果に関する第１正解データを含み、
前記第２学習データは、
前記ユーザによる行動の真偽に関する第２正解データを含む
請求項１に記載のプログラム。
ユーザの行動データを含む第１学習データを入力する第１学習データ入力手段と、
前記第１学習データを用いて、第１学習モデルを学習させて第１学習済みモデルを生成する第１学習手段と、
前記行動データを含む第２学習データを入力する第２学習データ入力手段と、
前記第２学習データを用いて、第２学習モデルを学習させて第２学習済みモデルを生成する第２学習手段と、
前記第１学習済みモデルに対し、前記ユーザの行動に係る未知データを入力する第１未知データ入力手段と、
前記未知データが入力されると、前記未知データに基づき、前記未知データに係る前記ユーザの行動の評価結果に関する第１出力データを生成する第１生成手段と、
前記第２学習済みモデルに対し、前記未知データを入力する第２未知データ入力手段と、
前記未知データが入力されると、前記未知データに基づき、前記ユーザによる行動の真偽を示す判定結果に関する第２出力データを生成する第２生成手段と、
前記第１出力データ、及び、前記第２出力データに基づき、出力を行う出力手段と
を備えるシステム。