JP7479558B1 - プログラム、及び、システム - Google Patents

プログラム、及び、システム Download PDF

Info

Publication number
JP7479558B1
JP7479558B1 JP2023187221A JP2023187221A JP7479558B1 JP 7479558 B1 JP7479558 B1 JP 7479558B1 JP 2023187221 A JP2023187221 A JP 2023187221A JP 2023187221 A JP2023187221 A JP 2023187221A JP 7479558 B1 JP7479558 B1 JP 7479558B1
Authority
JP
Japan
Prior art keywords
data
learning
unknown
user
behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2023187221A
Other languages
English (en)
Inventor
功淳 馬場
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Colopl Inc
Original Assignee
Colopl Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Colopl Inc filed Critical Colopl Inc
Priority to JP2023187221A priority Critical patent/JP7479558B1/ja
Application granted granted Critical
Publication of JP7479558B1 publication Critical patent/JP7479558B1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】ユーザの行動が「人間らしい」行動であるかを客観的に評価する。【解決手段】プログラムは、ユーザが用いるユーザ端末と接続するコンピュータを、前記ユーザの行動を示す行動データを含む第1学習データを用いて学習した第1学習済みモデルに対し、未知の前記ユーザの行動を示す未知データを入力する第1未知データ入力手段と、前記未知データが入力されると、前記未知データに基づき、前記未知データが示す前記ユーザの行動の評価結果を示す第1出力データを生成する第1実行手段と、前記行動データを含む第2学習データを用いて学習した第2学習済みモデルに対し、前記未知データを入力する第2未知データ入力手段と、前記未知データが入力されると、前記未知データに基づき、前記ユーザによる行動の真偽を示す判定結果を示す第2出力データを生成する第2実行手段と、前記第1出力データ、及び、前記第2出力データに基づき、前記ユーザ端末に出力を行う出力手段として機能させる。【選択図】図13

Description

本発明は、プログラム、及び、システムに関する。
従来、画像を用いて、ユーザの行動を認識する技術が知られている。そして、様々なセンサを用いて、画像データ、ビデオデータ、音響データ、触覚データ、運動感覚データ、温度データ、運動学的データ、及び、無線信号データ等のデータを取得して、スコアリングを行う。具体的には、スコアリングは、文脈的関連スコアリング技術(contextually relevant scoring technique)で実現する技術が知られている(例えば、特許文献1等である)。
特表2017-525070号公報
AI(人工知能、Artificial Intelligence、以下「AI」という。)、及び、IoT(モノのインターネット、Internet of Things、以下「IoT」という。)等の技術進歩により、ユーザの行動が認識可能である。
ソフトウェア等でユーザに代わって様々な処理が自動化できるのに対し、ユーザが行う行動が、ソフトウェア等では代替が難しい行動、すなわち、「人間らしい」行動が人間に求められるようになりつつある。また、行動が「人間らしい」行動であるか客観的な評価をする必要がある。しかしながら、従来の技術は、「人間らしい」行動をしているか否かが客観的に評価できない。
本発明は、ユーザの行動が「人間らしい」行動であるかを客観的に評価することを目的とする。
本発明は、前記課題を解決するため、プログラムは、コンピュータを、ユーザの行動データを含む第1学習データを用いて学習した第1学習済みモデルに対し、前記ユーザの行動に係る未知データを入力する第1未知データ入力手段と、前記未知データが入力されると、前記未知データに基づき、前記未知データに係る前記ユーザの行動の評価結果に関する第1出力データを生成する第1生成手段と、前記行動データを含む第2学習データを用いて学習した第2学習済みモデルに対し、前記未知データを入力する第2未知データ入力手段と、前記未知データが入力されると、前記未知データに基づき、前記ユーザによる行動の真偽を示す判定結果に関する第2出力データを生成する第2生成手段と、前記第1出力データ、及び、前記第2出力データに基づき、出力を行う出力手段として機能させる。
本発明によれば、ユーザの行動が「人間らしい」行動であるかを客観的に評価できる。
本実施形態に係るシステム構成例を示す図である。 事前処理例を示す図である。 実行処理例を示す図である。 AIの学習、及び、実行の第1全体処理例を示す図である。 AIの学習、及び、実行の第2全体処理例を示す図である。 情報処理装置のハードウェア構成例を示す図である。 AIの構成例を示すネットワーク図である。 第1学習済みモデルに対する入力例を示す図である。 第2学習済みモデルに対する入力例を示す図である。 実行処理例を示す図である。 ゲーム内報酬への変換例を示す図である。 全体処理例を示す図である。 機能構成例を示す図である。 補助装置を用いる構成例を示す図である。
以下、実施形態を図面に基づいて説明する。
[システム構成例]
図1は、本実施形態に係るシステム構成例を示す図である。例えば、図1に示すように、システム1は、ユーザ端末20A、20B、20C(以下、これらを総称して、「ユーザ端末20」と表記することがある。)と、サーバ11とを主に備える。
以下、サーバ11を管理する者を「管理者5」という。また、ユーザ端末20A、20B、及び、20Cを操作するそれぞれの者を「ユーザ4A」、「ユーザ4B」、「ユーザ4C」(以下、これらを総称して、「ユーザ4」と表記することがある。)という。
管理者5は、システム1による情報処理サービスを運営する役割の者である。一方で、ユーザ4は、システム1による情報処理サービスを利用する者である。また、管理者5、及び、ユーザ4は、管理装置の例であるサーバ11、又は、ユーザ端末20のどちらの情報処理装置を操作するかが異なる。
なお、図1に示す例は、ユーザ端末20が3つ、かつ、サーバ11が1つの例であるが、サーバ11の台数、ユーザ端末20の台数、管理者5の人数、及び、ユーザ4の人数は問わない。
サーバ11、及び、ユーザ端末20は、通信ネットワーク2を介して相互通信可能に接続する。例えば、通信ネットワーク2は、インターネット、移動体通信システム(例えば、4G(4th Generation、第4世代移動通信規格)、又は、5G(5th Generation、第5世代移動通信規格)等による公衆回線である。)、Wi-Fi(登録商標)等の無線ネットワーク、又は、これらの組み合わせである。
ユーザ端末20は、サーバ11からプログラムをダウンロード、又は、サーバ11にアクセスしてサービスを提供する。なお、処理を実行する上でサーバ11と通信がなくともよい。すなわち、ユーザ端末20は、プログラムをダウンロード、又は、メディアからインストールして実行環境を構築してもよい。なお、ゲームは、例えば、サーバ11からダウンロードするプログラムをユーザ端末20にインストール、又は、サーバ11にアクセスして、ユーザ4にゲームサービスが提供される。
[AIの学習、及び、実行の例]
以下、AIは、「事前処理」によって学習する。学習段階、すなわち、「事前処理」におけるAIを「学習モデルA1」という。そして、学習モデルA1は、ある程度、学習が進むと、「学習済みモデルA2」となる。以下、学習済みモデルA2を用いて出力処理を実行する実行段階を「実行処理」とする。
なお、本実施形態は、2つのAIを用いる。2つのAIのうち、一方のAIの学習モデルA1、及び、学習済みモデルA2を「第1学習モデルA11」、及び、学習済みモデルA2を「第1学習済みモデルA21」という。同様に、2つのAIのうち、他方のAIの学習モデルA1、及び、学習済みモデルA2を「第2学習モデルA12」、及び、学習済みモデルA2を「第2学習済みモデルA22」という。
以下の説明では、第1学習モデルA11、及び、第2学習モデルA12を総じて、学習モデルA1という。一方で、第1学習済みモデルA21、及び、第2学習済みモデルA22を総じて、学習済みモデルA2という。なお、以下の説明では、AIを2つに分けて説明するが、1つのAIが2つの機能を備えてもよいし、3つ以上のAIで分散して処理が実行されてもよい。
「事前処理」は、「実行処理」より前に行われる。ただし、「実行処理」をする上で引き続き「事前処理」、すなわち、学習済みモデルA2が学習を行ってもよい。
[事前処理例]
図2は、事前処理例を示す図である。例えば、事前処理は、サーバ11で行われる。
学習モデルA1は、学習データD1を入力して学習を行う。すなわち、学習モデルA1は、所謂「教師あり」の学習を行う。以下、第1学習モデルA11、及び、第1学習済みモデルA21を例に説明する。
学習データD1は、既知の行動データ等を含み、この行動データに対する「正解」が対応付けされたデータである。具体的には、学習データD1は、第11データD11、第12データD12、第13データD13・・・のように、行動の結果、及び、行動の内容を示す行動データ(第11データD11、第12データD12、及び、第13データD13等の複数のデータをまとめたデータ群の場合を含む。以下単に「行動データ」という。)、及び、正解データD20を含む。
学習モデルA1は、学習データD1の入力に基づき、行動データの入力に対し、正解データD20の出力をする対応関係を学習する。
なお、行動データの詳細は、後述する。
更に、学習モデルA1は、ビッグデータD4で学習するのが望ましい。例えば、ビッグデータD4は、インターネット上のデータ等である。ただし、ビッグデータD4は、管理者5等が入力するデータでもよい。
[実行処理例]
図3は、実行処理例を示す図である。例えば、実行処理は、ユーザ端末20、又は、ユーザ端末20とサーバ11が協働して行う。
学習済みモデルA2は、事前処理による学習によって学習モデルA1が学習した状態である。すなわち、図2に示す事前処理が実行されると、学習済みモデルA2が生成される。
学習済みモデルA2は、未知データD2が入力されると、未知データD2に対して、出力データD3を生成する。
未知データD2は、行動データに対する「正解」が入力の時点では不明なデータである。具体的には、未知データD2は、第21データD21、第22データD22、第23データD23、・・・のように、行動データ(第21データD21、第22データD22、及び、第23データD23等の複数のデータをまとめたデータ群の場合を含む。以下単に「行動データ」という。)を含む。例えば、未知データD2は、学習データD1と同じ種類(データ形式等であり、内容は異なる。)のデータで構成される。
出力データD3が生成されると、出力データD3は、例えば、ユーザ端末20に送信される。その後、ユーザ端末20は、出力データD3に基づき、ユーザ4に対して出力画面等を出力する。
出力データD3、及び、出力データD3に基づく出力の詳細は後述する。
図4、及び、図5は、AIの学習、及び、実行の全体処理例を示す図である。
図4は、AIの学習、及び、実行の第1全体処理例を示す図である。
図5は、AIの学習、及び、実行の第2全体処理例を示す図である。
図2に示す事前処理、及び、図3に示す実行処理の関係は、第1学習モデルA11、及び、第1学習済みモデルA21の場合には、図4に示すような関係となる。一方で、図2に示す事前処理、及び、図3に示す実行処理の関係は、第2学習モデルA12、及び、第2学習済みモデルA22の場合には、図5に示すような関係となる。
なお、事前処理、及び、実行処理を図に例示するような連続する順序で実行しなくともよい。したがって、事前処理によって準備を行う期間と、その後、実行処理を行う期間を連続させることは必須ではない。ゆえに、実行処理は、学習済みモデルA2を一旦作成した後であれば、事前処理から時間が経過した後に実行処理を行うようにしてもよい。また、学習済みモデルA2が一度生成された後であれば、学習済みモデルA2を転用して実行処理が行われてもよい。
学習処理と実行処理では、学習データD1と未知データD2が異なる。また、AIは、学習段階では、学習モデルA1であったのが、ある程度学習が進むと、学習済みモデルA2となる。このように、ビッグデータD4を学習データとして学習した学習済みモデルA2は、所謂「生成AI」である。
学習データD1に含まれる第11データD11と、未知データD2に含まれる第21データD21(以下、第12データD12と第22データD22等も同様の関係である。)は、同じデータ種類である。すなわち、第11データD11と第21データD21は、どちらも行動データである。なお、行動データは、2つのAIで兼用(例えば、コピーして各AIに入力する。)でもよいし、異なる行動データ(一部異なる場合を含む。)が入力されてもよい。以下、2つのAIで行動データは、兼用である例で説明する。
学習データD1は、「正解」が既知であるのに対し、未知データD2は、「正解」が未知となる。具体的には、学習データD1は、正解データD20を含むのに対し、未知データD2は、正解データD20を含まない。したがって、学習データD1は、行動データと正解データD20の関係が既知である。
一方で、未知データD2には、正解データD20が含まれず、未知データD2に対する「正解」が未知である。そして、学習済みモデルA2は、事前処理で学習した学習データD1と正解データD20の相関関係に基づき、未知データD2に対して出力データD3を生成する。
第1全体処理と第2全体処理を比較すると、学習における正解データD20が異なる、すなわち、実行処理で出力する出力データD3の内容が異なる。以下、第1学習モデルA11の学習に用いる正解データD20を「第1正解データD51」という。一方で、第2学習モデルA12の学習に用いる正解データD20を「第2正解データD52」という。
第1正解データD51、第2正解データD52、及び、出力データD3の詳細は後述する。
実行処理は、一部をテーブル等を用いる処理でもよい。このように、テーブルを用いる構成、所謂ルールベースでは、事前処理は、テーブル(ルックアップテーブル(Look Up Table、LUT)等ともいう。)、又は、数式等を入力する準備を行う処理である。
[情報処理装置のハードウェア構成例]
図6は、情報処理装置のハードウェア構成図である。情報処理装置は、サーバ11、及び、ユーザ端末20等である。以下、情報処理装置は、サーバ11と同じハードウェア構成であるとする。例えば、情報処理装置は、ワークステーション、又は、パーソナルコンピュータ等の汎用コンピュータである。ただし、それぞれの情報処理装置は、ハードウェア構成が異なってもよい。また、行動をセンシングするのは、IoTデバイス、又は、ウェアラブル端末等が望ましい。
サーバ11は、プロセッサ111と、メモリ112と、ストレージ113と、入出力インタフェース114と、通信インタフェース115とを主に備える。また、サーバ11の各構成要素は、通信バス116に接続する。
プロセッサ111は、メモリ112又はストレージ113に格納されているサーバプログラム11Pに含まれる一連の命令を実行することによって、処理、及び、制御を実現する。
プロセッサ111は、例えば、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、MPU(Micro Processing Unit)、FPGA(Field-Programmable Gate Array)、ASIC(Application Specific Integrated Circuit)、又は、これらの組み合わせ等の演算装置、及び、制御装置である。
メモリ112は、サーバプログラム11P、及び、データ等を記憶する主記憶装置である。例えば、サーバプログラム11Pは、ストレージ113からロードされる。また、データは、サーバ11に入力されたデータと、プロセッサ111によって生成されたデータとを含む。例えば、メモリ112は、RAM(Random Access Memory)、又は、その他の揮発メモリである。
ストレージ113は、サーバプログラム11P、及び、データ等を記憶する補助記憶装置である。ストレージ113は、例えば、ROM(Read-Only Memory)、ハードディスク装置、フラッシュメモリ、又は、その他の不揮発記憶装置である。また、ストレージ113は、メモリカードのように着脱可能な記憶装置でもよい。更に、他の例として、ストレージ113は、外部記憶装置であってもよい。このような構成によれば、例えば、アミューズメント施設のように複数のユーザ端末20が使用される場面において、サーバプログラム11P、又は、データの更新等を一括して行うことが可能になる。
入出力インタフェース114は、モニタ、入力装置(例えば、キーボード、又は、ポインティングデバイス等である。)、外部記憶装置、スピーカ、カメラ、マイク、及び、センサ等の外部装置をサーバ11に接続するインタフェースである。
また、プロセッサ111は、入出力インタフェース114を通じて外部装置と通信する。入出力インタフェース114は、例えば、USB(Universal Serial Bus)、DVI(Digital Visual Interface)、HDMI(登録商標)(High-Definition Multimedia Interface)、無線、及び、その他の端子である。
通信インタフェース115は、通信ネットワーク2に接続する他の装置(例えば、ユーザ端末20等である。)と通信する。例えば、通信インタフェース115は、LAN(Local Area Network)等の有線通信インタフェース、Wi-Fi(登録商標)(Wireless Fidelity)、Bluetooth(登録商標)、又は、NFC(Near Field Communication)等の無線通信インタフェースである。
ただし、情報処理装置は、上記のハードウェア構成に限られない。例えば、ユーザ端末20は、カメラ等のセンサを更に備えてもよい。そして、ユーザ端末20がセンサで取得する様々なデータがサーバ11に送信されてもよい。
[学習モデル、及び、学習済みモデルの構成例]
図7は、AIの構成例を示すネットワーク図である。学習モデルA1、及び、学習済みモデルA2は、例えば、以下のようなネットワークで示す構成のAIである。
以下、学習モデルA1、及び、学習済みモデルA2は、サーバ11上、すなわち、クラウド上に実装される例で説明する。ただし、学習モデルA1、及び、学習済みモデルA2の一部、又は、全部は、ユーザ端末20等に実装されてもよい。
ネットワーク300は、例えば、入力層L1、中間層L2(「隠れ層」等ともいう。)、及び、出力層L3等を有する構成である。
入力層L1は、データを入力する層である。
中間層L2は、入力層L1で入力するデータを重み(例えば、乗算に用いる係数である。)、及び、バイアス(例えば、定数を加算する。)等に基づいて変換する。このように中間層L2で処理された結果が出力層L3へ伝えられる。
出力層L3は、出力内容等を出力する層である。
そして、学習により、重みの係数(例えば、入力する文字、又は、画像に対する係数を学習に基づき変化させる。)、及び、学習で変化させるパラメータ等が最適化される。なお、ネットワーク300は、図示するネットワーク構造に限られない。つまり、AIは、他の機械学習によって実現されてもよい。
例えば、AIは、「教師なし」の機械学習等により、次元削減(例えば、3次元以上の関係を3次元以下程度の簡略な計算で求まる関係に変える処理である。)等の前処理を行う構成等でもよい。入力と出力の関係は、1次式等の単純な計算で処理されるのが望ましい。このような計算であると、計算コストを少なくできる。
また、AIは、ドロップアウト等といった過学習(「過剰適合」又は「過適合」等ともいう。)(overfitting)を軽減化させる処理が行われてもよい。他にも、次元削減、及び、正規化等の前処理が行われてもよい。
AIは、CNN(畳み込みニューラルネットワーク、Convolution Neural Network)のネットワーク構造等があってもよい。他にも、例えば、ネットワーク構造は、LLM(Large Language Model 大規模言語モデル)、RNN(再帰型ニューラルネットワーク、Recurrent Neural Network)又はLSTM(Long Short-Term Memory)等の構成を有してもよい。すなわち、AIは、ディープラーニング以外のネットワーク構造等であってもよい。
また、AIは、ハイパパラメータを有する構成であってもよい。すなわち、AIは、一部の設定をユーザ等が行う構成でもよい。更に、AIは、学習対象とする特徴量を特定してもよいし、ユーザが学習対象とする一部又は全部の特徴量を設定してもよい。
更に、学習モデルA1、及び、学習済みモデルA2は、他の機械学習を利用してもよい。例えば、学習モデルA1、及び、学習済みモデルA2は、教師なしのモデルにより、正規化等を前処理で行ってもよい。更に、学習は、強化学習(Reinforcement Learning、AIに選択をさせ、選択に対する評価(報酬)を与えて、評価が大きくなるような学習方法をいう。)等であってもよい。
学習では、データの拡張等が行われてもよい。すなわち、学習モデルA1の学習に用いる学習データを増やすため、1つの実験データ等を拡張させて、複数の学習データにする前処理が行われてもよい。このようにして、学習データを増やせると、より学習モデルA1の学習を進めることができる。
また、学習モデルA1、及び、学習済みモデルA2は、転移学習(Transfer Learning)、又は、ファインチューニング(Fine tuning)等を行う構成でもよい。すなわち、ユーザ端末20は、装置ごとに異なる実行環境となる場合が多いため、実行環境に合わせて装置ごとに設定が異なってもよい。例えば、AIの基本構成は、別の情報処理装置で学習する。その後、各々の情報処理装置は、更に各々の実行環境に最適化するため、更に学習、又は、設定等がされてもよい。
[人間らしさの評価例]
人間らしさは、例えば、身体性(Embodiment)等に関して評価すると、AI、又は、ロボット等ではなく、人であると精度良く評価できる。例えば、所謂なりすまし等をしようとしてソフトウェア等で人間の存在を偽装する場合には、評価対象となる人物が物理的に存在しないため、身体を動かすような行動をとるのが難しい。
例えば、運動をすれば、人の体が動くため、振動、及び、音等が少なからず生じる。他にも、生活反応等もある。一方で、存在を偽装しているような場合には、実在する人体がないため、運動等を示すセンシング結果が得られない。
ゆえに、運動等が認められる身体性を伴う行動があるか否かを評価すると、人間らしい行動であるか否かが精度良く判定できる。なお、判定は、身体性に関する以外の項目で評価してもよい。
ただし、人間らしさは、身体性に限られず、AI、ロボット、又は、ソフトウェア等が対応しにくい事項であればよい。
なお、行動は、社会的、及び、一般的に望ましい行動であるか更に評価されるのが望ましい。例えば、運動等が適度に行われるのは健康的には望ましい行動である。他にも、イベントとして、ボランティア活動等のイベントに参加するのであれば、社会的に望ましい行動である場合が多い。また、ごみを拾う、又は、地球環境に優しい商品を購入する等の行動も望ましい行動である場合が多い。これらの行動がされたと評価できる場合には、評価結果が高評価である等としてもよい。例えば、学習モデルA1は、どういった行動がより望ましいかはビッグデータD4等で学習する。
[行動データの例]
図8は、第1学習済みモデルに対する入力例を示す図である。例えば、未知データD2として、行動データD201は以下のように入力される。
行動データD201は、ユーザ端末20においてユーザが行動すると、行動に合わせて生成される。なお、未知データD2は、ユーザ4による操作(例えば、運動記録を入力等である。)に基づいて生成、ユーザ端末20が行動に合わせてバックグランドで自動的に生成(例えば、加速度センサ、及び、位置センサでユーザ4が歩行している歩数、又は、歩行速度等である。)、又は、他のアプリ等から取得して入力する。
行動データD201は、例えば、センサ等(センサデータを分析した分析結果を含む。)で取得される。また、行動データは、例えば、ユーザ4がGUI(Graphical User Interface)で入力する、所謂「自己申告」で入力されてもよい。他にも、行動データD201は、他のアプリから取得する、又は、SNS(Social Networking Service)等のネットワークでの送信内容を分析してもよい。
具体的には、加速度センサ、GNSS(Global Navigation Satellite System)等による位置センサ、カメラ、又は、マイク等のセンサデータを分析すると、例えば、ユーザ4が運動をしている、自動車等で移動している、他者とコミュニケーションを取っている等が特定できる。
ユーザ4が小売店で購入した際のレシートを撮影した画像データ等が取得できると、ユーザ4の購入履歴が入力できる。
申し込みサイトにおける申込履歴等を示す申込履歴データ、又は、チケット等を撮影した画像データ等が取得できると、ユーザ4の参加行動記録が入力できる。なお、イベントは、現実空間のイベントでもよいし、オンラインセミナー等のイベントでもよい。
電話での発言、又は、マイク等の音声センサで、ユーザ4が発する発言を取得できると、ユーザ4の発言記録が入力できる。また、複数の人の音声が認識されると、実際に会話しているコミュニケーション記録が入力できる。なお、コミュニケーション記録は、ウェブ上、又は、チャットアプリ等でのコミュニケーションでもよい。
チャットアプリ、SNS、又は、インターネット、すなわち、ネットワークを介してユーザ4が発する送信データ等が取得できると、ユーザ4の送信記録が入力できる。
ユーザ4が自己の行動について入力する、所謂「自己申告」で行動が入力されてもよい。例えば、行動を入力する専用GUI等で入力されてもよいし、ユーザ4が他のアプリ等で日誌等を入力する場合には、日誌データを分析して自己申告記録としてもよい。
ユーザ4がゲームをした場合には、ゲームの操作記録(例えば、各種ゲームのデータである。)等が取得できると、ユーザ4のゲームにおける操作記録が入力できる。
他にも、各種ログ等の履歴が行動データに用いられてもよい。例えば、検索エンジンの検索履歴、各種アプリの履歴、通話履歴、食事履歴、又は、ブラウザのアクセス履歴等が行動データに入力されてもよい。
また、事前処理、すなわち、学習により、ビッグデータD4によって、学習済みモデルA2は、インターネット上における情報に基づき、どのような行動が人間らしい行動であるか、イベント情報、及び、望ましい行動の具体例等を学習した状態である。学習は、動画を画像解析した結果を利用してもよい。したがって、学習済みモデルA2は、どのような行動が望ましい行動であるか評価できる状態である。
図9は、第2学習済みモデルに対する入力例を示す図である。例えば、第2学習済みモデルA22には、第1学習済みモデルA21と同じ未知データD2が入力される。ただし、第2学習済みモデルA22には、ユーザ4による行動の真偽を判定するのに補助的なデータ(以下「補助データ」という。)が更に追加されてもよい。
補助データは、例えば、運動の行動が行われたか否かの真偽を判定するのに、未知データD2以外に、各データがコピーされて生成されていないか、又は、別の裏付けとなるデータ(例えば、未知データD2が自己申告記録であれば、運動を裏付ける、運動がされたと申告された時間帯のセンサデータ等である。)等である。
このような補助データがあると、第2学習済みモデルA22は、より運動の行動が行われたか否かの真偽が精度良く判定できる。
[実行処理例]
図10は、実行処理例を示す図である。以下、未知データD2として、「筋肉トレーニング」と「他者と会話」をユーザ4が自己申告(例えば、テキスト入力したとする。)した場合を例に説明する。
第1学習済みモデルA21は、「人間らしい」行動の評価結果を示す第1出力データD31を生成する。例えば、第1出力データD31は、「人間らしい」行動の確率を示す定量的な評価結果を示す。ただし、第1出力データD31は、確率がなく、「人間らしい」行動が高確率(例えば、50%以上の確率の場合である。)で行われたとする場合には、単に「行動があった。」等という評価結果でもよい。
なお、第1出力データD31は、定性的な評価を含んでもよい。例えば、第1出力データD31は、運動の行動に対しては、どういった運動であるか(運動の種類)等の詳細を示す。なお、第1出力データD31は、望ましい行動であるか等の評価結果を含んでもよい。
第2学習済みモデルA22は、ユーザ4による行動の真偽を示す判定結果を示す第2出力データD32を生成する。以下の例では、第2学習済みモデルA22は、未知データD2が示す「筋肉トレーニング」と「他者と会話」という行動が実際に行われたか真偽を判定する。
第2出力データD32は、例えば、「筋肉トレーニング」の行動がされたかの真偽を判定する。例えば、第2学習済みモデルA22は、自己申告のあった日時等の時間帯の振動データ、心拍データ、及び、チェックインデータ等の補助データを取得して、補助データに基づいて真偽を判定する。
同様に、第2出力データD32は、「他者と会話」という行動がされたかの真偽を判定する。例えば、第2学習済みモデルA22は、自己申告のあった日時にマイクで取得する音声データの補助データを取得して、補助データに基づいて真偽を判定する。
なお、判定に用いた補助データは、証拠データとしてもよい。例えば、「他者と会話」という行動については、音声データ等を証拠データと残し、クラウド等に保存するとしてもよい。また、AIが会話している人が識別できるのであれば、誰と誰の会話であるか、又は、会話内容の要約等を更に生成してもよい。
以上のように、行動に対し、第2学習済みモデルA22は、どのような種類のデータを取得し、どのような判定基準を設定したらよいか等を学習済みである。したがって、判定方法、用いるデータ、及び、判定基準等は、行動の種類等に応じて異なる。
なお、これらの行動に対し、アドバイスが更に出力されてもよい。例えば、運動、又は、食事等の行動があれば、より健康上適切な運動、又は、食事内容があれば、推奨する運動、又は、食事内容を示すアドバイスがテキスト等で出力されてもよい。
[ゲーム内報酬への変換例]
図11は、ゲーム内報酬への変換例を示す図である。行動の入力に対して、ゲームにおける報酬に変換されてもよい。
例えば、運動の行動がされると、第1出力データD31が、ゲーム内で使用できるポイントに変換される。ポイントは、例えば、ゲーム内の通貨等になる。
なお、報酬は、ポイントに限られず、アイテム、スコア、又は、キャラクタのパラメータ強化等でもよい。
変換対象とする行動、種類、ポイント数、又は、報酬がもらえるタイミング等については適宜設定可能である。また、これらは、事前に設定されてもよいし、ユーザ4が任意に選択できてもよい。
[全体処理例]
図12は、全体処理例を示す図である。以下の例では、全体処理は、事前処理と実行処理を連続して行う。具体的には、ステップS01が学習処理である。また、ステップS02乃至ステップS05が実行処理である。ただし、全体処理には、これら以外の処理が含まれてもよい。
ステップS01では、サーバ11は、行動データ、及び、正解データを含む学習データD1を入力して、第1学習モデルA11、及び、第2学習モデルA12を学習させる。そして、ステップS01が行われると、第1学習済みモデルA21、及び、第2学習済みモデルA22が生成される。このように、学習モデルA1が学習して学習済みモデルA2となると、学習済みモデルA2を用いて実行処理が実行される。
ステップS02では、サーバ11は、未知データD2を入力する。例えば、ステップS02は、センサデータの取得、又は、ユーザ4の入力等で未知データD2が入力される。以下、未知データD2の入力時点を以降の処理(評価等)の実行開始トリガとするが、以降の処理の開始、すなわち、出力がされるタイミング等は、ユーザ4が指定したタイミングでもよい。
ステップS03では、サーバ11は、行動を評価する。そして、評価結果に基づき、第1出力データD31が生成される。
ステップS04では、サーバ11は、ユーザによる行動の真偽を示す判定を行う。そして、判定結果に基づき、第2出力データD32が生成される。
ステップS05では、サーバ11は、第1出力データD31、及び、第2出力データD32に基づいて出力を行う。例えば、出力させるタイミング、又は、出力させる画面、すなわち、ステップS05を実行するタイミング、及び、対象等は、事前に設定される。
[機能構成例]
図13は、機能構成例を示す図である。例えば、システム1は、学習装置31、及び、実行装置32を備えるパーソナルAIシステムである。
学習装置31は、第1学習データ入力手段1F1、第1学習手段1F2、第2学習データ入力手段1F3、及び、第2学習手段1F4を備える。
第1学習データ入力手段1F1は、行動データ、及び、第1正解データD51を含む学習データD1を入力する第1学習データ入力手順を行う。例えば、第1学習データ入力手段1F1は、通信インタフェース115等で実現する。
第1学習手段1F2は、行動データ、及び、第1正解データD51を用いて第1学習モデルA11を学習させて、第1学習済みモデルA21を生成する第1学習手順を行う。例えば、第1学習手段1F2は、プロセッサ111等で実現する。
第2学習データ入力手段1F3は、行動データ、及び、第2正解データD52を含む学習データD1を入力する第2学習データ入力手順を行う。例えば、第2学習データ入力手段1F3は、通信インタフェース115等で実現する。
第2学習手段1F4は、行動データ、及び、第2正解データD52を用いて第2学習モデルA12を学習させて、第2学習済みモデルA22を生成する第2学習手順を行う。例えば、第2学習手段1F4は、プロセッサ111等で実現する。
実行装置32は、第1未知データ入力手段1F5、第1生成手段1F6、第2未知データ入力手段1F7、第2生成手段1F8、及び、出力手段1F9を備える。また、実行装置32は、変換手段1F10を更に備えるのが望ましい。
第1未知データ入力手段1F5は、第1学習手段1F2が生成した第1学習済みモデルA21に対して、未知の行動データを含む未知データD2を入力する第1未知データ入力手順を行う。例えば、第1未知データ入力手段1F5は、通信インタフェース115等で実現する。
第1生成手段1F6は、未知データD2が入力されると、未知データD2に基づき、第1出力データD31を生成する第1生成手順を行う。例えば、第1生成手段1F6は、プロセッサ111等で実現する。
第2未知データ入力手段1F7は、第2学習手段1F4が生成した第2学習済みモデルA22に対して、未知の行動データを含む未知データD2を入力する第2未知データ入力手順を行う。例えば、第2未知データ入力手段1F7は、通信インタフェース115等で実現する。
第2生成手段1F8は、未知データD2が入力されると、未知データD2に基づき、第2出力データD32を生成する第2生成手順を行う。例えば、第2生成手段1F8は、プロセッサ111等で実現する。
出力手段1F9は、第1出力データD31、及び、第2出力データD32に基づき、ユーザ端末20に出力を行う出力手順を行う。例えば、出力手段1F9は、通信インタフェース115等で実現する。
変換手段1F10は、評価結果をゲームにおける報酬に変換する変換手順を行う。例えば、変換手段1F10は、プロセッサ111等で実現する。
学習装置31、及び、実行装置32は、例えば、サーバ11である。ただし、学習装置31、及び、実行装置32は、異なる情報処理装置でもよい。
以上のような構成であると、ユーザ4の行動が「人間らしい」行動であるかを客観的に評価できる。まず、ユーザ4が行動したとする場合に、未知データD2が入力される。次に、未知データD2に基づき、第1学習済みモデルA21が、ユーザ4の行動を評価する。したがって、ユーザ4、すなわち、人間でないと難しい行動であるかAIによって評価される。
続いて、未知データD2に基づき、第2学習済みモデルA22が、ユーザ4による行動の真偽を判定する。例えば、第2学習済みモデルA22は、行動データが捏造されて生成、又は、実際は申告した行動とは異なる行動等の不正行為がないかを判定する。
判定は、例えば、複数の補助データがどれも不正行為がない場合には「真」とする。一方で、判定は、補助データが示す行動内容と申告された行動内容が相違する場合には「偽」とする。
不正行為は、AI、ソフトウェア、又は、ロボット等をユーザ4に代わって行動させる、又は、行動したと見せかけるデータを入力して、実際は行動がされていないのに行動をしたように見せかける等である。
そこで、ソフトウェア等では代替が難しい行動、すなわち、「人間らしい」行動がないかの評価、及び、評価対象とされた行動が不正行為なくされたものであるかをAIで判定する。このような評価、及び、判定がされると、「人間らしい」行動であるか客観的な評価ができる。
なお、ゲームの種類は、報酬となるポイント、及び、アイテム等がゲームにあれば、ゲームの種類は限定されない。例えば、ゲームの種類は、RPG、スポーツ、アクション、パズル、又は、格闘を含むゲームである。
[その他の実施形態]
上記の例では、情報処理装置は、学習モデルに対する事前処理、及び、学習済みモデルを用いて実行処理の両方を行う。ただし、事前処理、及び、実行処理は、同じの情報処理装置が行わなくともよい。また、事前処理、及び、実行処理も、1つの情報処理装置で一貫して実行しなくともよい。すなわち、各処理、及び、データの記憶等は、複数の情報処理装置で構成する情報システム等で行ってもよい。
なお、学習処理は、実行処理の後、又は、実行処理の前に追加して更に行われてもよい。
上記のような処理は、サーバ11、及び、ユーザ端末20以外の情報処理装置が補助的に行ってもよい。
図14は、補助装置を用いる構成例を示す図である。図1に示す例と比較すると、図14に示す構成は、補助装置60が加わる点が異なる。なお、補助装置60は、一時的に用いる構成でもよい。
補助装置60は、ユーザ端末20(この例では、ユーザ端末20A付近に設置しているが、他の装置近くにあってもよい。)等の近くに設置される情報処理装置である。そして、補助装置60は、特定の処理をユーザ端末20、又は、サーバ11に代わって一部又は全部を実行する。
例えば、補助装置60は、グラフィック処理に特化したデバイスを備えて、グラフィック処理を高速で行う。このように、補助装置60等を設置して、所謂エッジコンピューティング(Edge Computing)等が行われてもよい。このように、前述する処理は、様々な情報処理装置のハードウェアリソースを活用して実行されてもよい。したがって、前述する処理は、前述したのとは異なる情報処理装置が実行してもよい。
前述の処理、及び、本実施形態で実行される処理に用いるデータは、情報処理システムによって実行、及び、記憶されてもよい。例えば、情報処理システムは、処理又は記憶を冗長、分散、並列、又は、これらの組み合わせを実現するため、複数の情報処理装置で実行又は記憶してもよい。したがって、本発明は、前述に示すハードウェア構成以外の装置、及び、前述に示す装置以外のシステムで実現されてもよい。
また、本発明に係るプログラムは、単一のプログラムに限定されず、複数のプログラムの集合体でもよい。また、本発明に係るプログラムは、単一の装置で実行されるものに限定されず、複数の情報処理装置で分担して実行されてもよい。更に、各情報処理装置の役割分担は、前述の例に限定されない。すなわち、前述した処理の一部、又は、全部が前述した情報処理装置とは異なる情報処理装置が実行してもよい。
更に、プログラムによって実現される各手段の一部、又は、全部は、集積回路等のハードウェアで実現することもできる。更に、プログラムは、コンピュータによって読み出し可能な非一過性の記録媒体に記録されて提供されてもよい。記録媒体とは、例えば、ハードディスク、SDカード(登録商標)、DVD等の光学ディスク、又は、インターネット上のサーバ等を指す。したがって、プログラムは、インターネット等の電気通信回線を介して配信されでもよい。
また、情報処理システムを構成する情報処理装置等は、海外にあってもよい。すなわち、情報処理システムが実行する処理のうち、一部の処理を実行する情報処理装置が海外にあってもよい。
なお、本発明は、前述に例示する各実施形態に限定されない。したがって、本発明は、技術的な要旨を逸脱しない範囲で、構成要素の追加、又は、変形が可能である。ゆえに、特許請求の範囲に記載された技術思想に含まれる技術的事項のすべてが本発明の対象となる。なお、前述に例示する実施形態は、実施において好適な具体例である。そして、当業者であれば、開示した内容から様々な変形例を実現で可能であって、このような変形例は、特許請求の範囲に記載された技術的範囲に含まれる。
1 :システム
1F1 :第1学習データ入力手段
1F2 :第1学習手段
1F3 :第2学習データ入力手段
1F4 :第2学習手段
1F5 :第1未知データ入力手段
1F6 :第1生成手段
1F7 :第2未知データ入力手段
1F8 :第2生成手段
1F9 :出力手段
1F10 :変換手段
3 :管理者
4 :ユーザ
5 :管理者
11 :サーバ
20 :ユーザ端末
31 :学習装置
32 :実行装置
60 :補助装置
D1 :学習データ
D2 :未知データ
D20 :正解データ
D4 :ビッグデータ
A1 :学習モデル
A2 :学習済みモデル
A1 :学習モデル
A11 :第1学習モデル
A12 :第2学習モデル
A21 :第1学習済みモデル
A22 :第2学習済みモデル
D1 :学習データ
D11 :第11データ
D12 :第12データ
D13 :第13データ
D2 :未知データ
D20 :正解データ
D201 :行動データ
D21 :第21データ
D22 :第22データ
D23 :第23データ
D3 :出力データ
D31 :第1出力データ
D32 :第2出力データ
D4 :ビッグデータ
D51 :第1正解データ
D52 :第2正解データ

Claims (5)

  1. コンピュータを、
    ユーザの行動データを含む第1学習データを用いて学習した第1学習済みモデルに対し、前記ユーザの行動に係る未知データを入力する第1未知データ入力手段と、
    前記未知データが入力されると、前記未知データに基づき、前記未知データに係る前記ユーザの行動の評価結果に関する第1出力データを生成する第1生成手段と、
    前記行動データを含む第2学習データを用いて学習した第2学習済みモデルに対し、前記未知データを入力する第2未知データ入力手段と、
    前記未知データが入力されると、前記未知データに基づき、前記ユーザによる行動の真偽を示す判定結果に関する第2出力データを生成する第2生成手段と、
    前記第1出力データ、及び、前記第2出力データに基づき、出力を行う出力手段として機能させるプログラム。
  2. 前記第2生成手段は、
    前記判定結果の証拠に関する証拠データを更に生成する
    請求項1に記載のプログラム。
  3. 前記評価結果をゲームにおける報酬に変換する変換手段として更に機能させる
    請求項1に記載のプログラム。
  4. 前記第1学習データは、
    前記行動の人間らしさを評価した結果に関する第1正解データを含み、
    前記第2学習データは、
    前記ユーザによる行動の真偽に関する第2正解データを含む
    請求項1に記載のプログラム。
  5. ユーザの行動データを含む第1学習データを入力する第1学習データ入力手段と、
    前記第1学習データを用いて、第1学習モデルを学習させて第1学習済みモデルを生成する第1学習手段と、
    前記行動データを含む第2学習データを入力する第2学習データ入力手段と、
    前記第2学習データを用いて、第2学習モデルを学習させて第2学習済みモデルを生成する第2学習手段と、
    前記第1学習済みモデルに対し、前記ユーザの行動に係る未知データを入力する第1未知データ入力手段と、
    前記未知データが入力されると、前記未知データに基づき、前記未知データに係る前記ユーザの行動の評価結果に関する第1出力データを生成する第1生成手段と、
    前記第2学習済みモデルに対し、前記未知データを入力する第2未知データ入力手段と、
    前記未知データが入力されると、前記未知データに基づき、前記ユーザによる行動の真偽を示す判定結果に関する第2出力データを生成する第2生成手段と、
    前記第1出力データ、及び、前記第2出力データに基づき、出力を行う出力手段と
    を備えるシステム。
JP2023187221A 2023-10-31 2023-10-31 プログラム、及び、システム Active JP7479558B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023187221A JP7479558B1 (ja) 2023-10-31 2023-10-31 プログラム、及び、システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2023187221A JP7479558B1 (ja) 2023-10-31 2023-10-31 プログラム、及び、システム

Publications (1)

Publication Number Publication Date
JP7479558B1 true JP7479558B1 (ja) 2024-05-08

Family

ID=90926147

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023187221A Active JP7479558B1 (ja) 2023-10-31 2023-10-31 プログラム、及び、システム

Country Status (1)

Country Link
JP (1) JP7479558B1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021140952A1 (ja) 2020-01-08 2021-07-15 ソニーグループ株式会社 情報処理装置、情報処理方法、並びにプログラム
JP2021517292A (ja) 2018-03-21 2021-07-15 バルブ コーポレーション オンラインゲーム環境内のチートソフトウェアの使用を自動的に減らすこと
CN113177585A (zh) 2021-04-23 2021-07-27 上海晓途网络科技有限公司 一种用户分类方法、装置、电子设备及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021517292A (ja) 2018-03-21 2021-07-15 バルブ コーポレーション オンラインゲーム環境内のチートソフトウェアの使用を自動的に減らすこと
WO2021140952A1 (ja) 2020-01-08 2021-07-15 ソニーグループ株式会社 情報処理装置、情報処理方法、並びにプログラム
CN113177585A (zh) 2021-04-23 2021-07-27 上海晓途网络科技有限公司 一种用户分类方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
US9965675B2 (en) Using virtual reality for behavioral analysis
US8206222B2 (en) Entertainment system for performing human intelligence tasks
US20200298131A1 (en) Toxicity-based chat personalization within video games
US20070106628A1 (en) Dialogue strategies
CN110998725A (zh) 在对话中生成响应
CN112402986B (zh) 一种对战游戏中强化学习模型的训练方法及装置
EP3726453A1 (en) Information processing device, information processing method, and program
US20230094558A1 (en) Information processing method, apparatus, and device
CN109154948B (zh) 用于提供内容的方法和装置
WO2020242596A1 (en) Providing responses in an event-related session
US10963043B2 (en) Utilizing machine learning to determine survey questions based on context of a person being surveyed, reactions to survey questions, and environmental conditions
CN113761156A (zh) 人机交互对话的数据处理方法、装置、介质及电子设备
US20220215957A1 (en) Digital Nurse for Symptom and Risk Assessment
WO2020059789A1 (ja) 情報処理方法、コンピュータプログラム、学習済みモデル及び情報処理装置
JP2022096661A (ja) 情報処理装置、システム、プログラム、及び方法
JP7479558B1 (ja) プログラム、及び、システム
US20230136939A1 (en) User experience modeling system
JP6947460B1 (ja) プログラム、情報処理装置、及び方法
CN111753855B (zh) 一种数据处理方法、装置、设备及介质
JP7493664B1 (ja) プログラム、及び、システム
US20240169321A1 (en) Evaluation adjustment factoring for bias
CN118051782B (zh) 一种模型训练的方法、业务处理的方法以及相关装置
US20220191159A1 (en) Device and method for generating an electronic card
CN111729292B (zh) 文字游戏中数据处理方法及装置
US20220040532A1 (en) Utilizing machine learning and cognitive state analysis to track user performance

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240306

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20240306

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240326

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240423

R150 Certificate of patent or registration of utility model

Ref document number: 7479558

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150