WO2021186692A1

WO2021186692A1 - Ａｉ制御装置、ａｉ制御装置に接続されるサーバー装置、及びａｉ制御方法

Info

Publication number: WO2021186692A1
Application number: PCT/JP2020/012393
Authority: WO
Inventors: 祐馬河合
Original assignee: Toa株式会社
Priority date: 2020-03-19
Filing date: 2020-03-19
Publication date: 2021-09-23
Also published as: EP4105845A4; US20230095124A1; CN115280333A; EP4105845A1; JPWO2021186692A1; JP7407271B2

Abstract

複数のユーザーから個々のユーザーを識別して入力データを受信し、ユーザー毎に入力データに基づいて学習済モデルを生成するサーバー装置（３０）に接続可能なＡＩ制御装置（１０）は、制御部（１１）と、サーバー装置（３０）に接続される通信部（１７）とを備える。制御部（１１）は、入力データを取得し、ＡＩ制御装置（１０）のユーザーを識別可能な識別情報と取得入力データとを対応付けて、サーバー装置（３０）に通信部（１７）を介して送信する。制御部（１１）は、送信された取得入力データを使用してサーバー装置（３０）により他のユーザーの学習済モデルとは別に生成された学習済モデルであって、取得入力データの特徴を学習して未知の入力データから同特徴を有する入力データを検知する学習済モデルを実行する。

Description

ＡＩ制御装置、ＡＩ制御装置に接続されるサーバー装置、及びＡＩ制御方法

　本開示は、ＡＩ制御装置、ＡＩ制御装置に接続されるサーバー装置、及びＡＩ制御方法に関する。

　従来、生産装置周辺の音情報を用いて異常検出を行うための学習済モデル構築装置及び異常検出装置が知られている（特許文献１を参照）。特許文献１においては、学習済モデル構築装置は、生産装置の近傍に位置した作業者の音声を含む音声データを取得するとともに、生産ラインに関する異常度をラベルとして取得し、音声データとラベルとの組みを学習データとして教師あり学習を行うことにより、異常度についての学習済モデルを構築する。異常検出装置は、構築された学習済モデルと判定データとを用いて、判定データの異常度を判定する。

　学習済モデルを構築するために十分な学習データを得ることはユーザーには負担が重く、また学習済モデルから得られる出力の精度を上げることが難しい。

　本開示の目的は、学習済モデルの生成においてユーザーの負担を軽減でき、且つ学習済モデルを使用して任意のイベント検知手段を実現できる、ＡＩ制御装置、ＡＩ制御装置に接続されるサーバー装置、及びＡＩ制御方法を提供する。

　本開示の一の観点によれば、ＡＩ制御装置は、複数のユーザーから個々のユーザーを識別して入力データを受信し、ユーザー毎に入力データに基づいて学習済モデルを生成するサーバー装置に接続可能なＡＩ制御装置であって、第１制御部と、サーバー装置に接続される第１通信部とを備える。第１制御部は、入力データを取得し、ＡＩ制御装置のユーザーを識別可能な識別情報と同取得入力データとを対応付けて、サーバー装置に第１通信部を介して送信する。第１制御部は、送信された取得入力データを使用してサーバー装置により他のユーザーの学習済モデルとは別に生成された学習済モデルであって、取得入力データの特徴を学習して未知の入力データから同特徴を有する入力データを検知する学習済モデルを実行する。

　本開示の他の観点によれば、サーバー装置は、複数のユーザーが使用する複数のＡＩ制御装置に接続可能なサーバー装置であって、第２制御部と、複数のＡＩ制御装置に接続される第２通信部と、第２記憶部とを備える。第２制御部は、複数のユーザーのＡＩ制御装置から、第２通信部を介して、各ユーザーの識別情報と対応付けた入力データを受信し、同受信入力データを第２記憶部に記憶し、受信入力データを使用して、ユーザー毎に、受信入力データの特徴を学習して、未知の入力データから同特徴を有する入力データを検知する学習済モデルを生成する。第２制御部は、生成された学習済モデルをユーザー毎に第２記憶部にさせる。

　本開示の更に他の観点によれば、ＡＩ制御方法は、複数のＡＩ制御装置に接続可能なサーバー装置を用いたＡＩ制御方法であって、複数のユーザーのＡＩ制御装置から、各ユーザーの識別情報と対応付けた入力データを受信すること、同受信入力データを記憶部に記憶すること、受信入力データを使用して、ユーザー毎に、受信入力データの特徴を学習すること、未知の入力データから同特徴を有する入力データを検知する学習済モデルを生成すること、生成された学習済モデルをユーザー毎に記憶部にさせること、を含む。

　本開示に係るＡＩ制御装置、ＡＩ制御装置に接続されるサーバー装置、及びＡＩ制御方法によれば、学習済モデルの生成においてユーザーの負担を軽減でき、且つ学習済モデルを使用して任意のイベント検知手段を実現できる。

図１は、実施形態１に係るシステムの全体構成を示す。図２は、実施形態１に係るＡＩ制御装置の構成を示す。図３は、実施形態１に係るサーバー装置の構成を示す。図４Ａは、サーバー装置において管理されるユーザー管理テーブルの一例を示す。図４Ｂは、サーバー装置において管理される課金テーブルの一例を示す。図５は、ＡＩ制御装置による機械学習のための動作を示すフローチャートである。図６は、サーバー装置による機械学習動作を示すフローチャートである。図７は、ユーザーがラベルを入力するための表示インターフェースの一例を示す。図８Ａは、関連情報を示す表示インターフェースの一例を示す。図８Ｂは、ラベル名の関連度を算出するための基準情報の例を示す。図９は、課金情報を示す表示インターフェースの一例を示す。図１０は、ＡＩ制御装置による異常検知の動作を示すフローチャートである。図１１Ａは、その他実施形態に係るＡＩ制御装置が参照するマイクの位置情報の例を示す。図１１Ｂは、その他実施形態に係るＡＩ制御装置が参照するスピーカーの位置情報の例を示す。図１１Ｃは、その他実施形態に係るＡＩ制御装置が参照する監視カメラの位置情報の例を示す。

　１．実施形態１
　図１に示すＡＩ制御装置１０及びサーバー装置３０を含むシステム１は、任意のイベント（異常音等）に反応するセンサーを、ユーザー毎に適するように生成することを可能にする。ユーザーが使用するＡＩ制御装置１０を介して、ユーザーが反応させたいイベント、例えば、悲鳴やドアの開閉等の異常音を表すキーワードをラベルとする入力データを収集し、サーバー装置３０に送信する。サーバー装置３０は、機械学習サーバーであり、ユーザー毎に受信する入力データに基づいて、ユーザー毎に学習済モデルを生成し、管理する。ＡＩ制御装置１０は、この学習済モデルに基づいて、イベントが発生したときの未知音を含む音に反応するセンサーとして機能する。この結果、各ユーザーが自身に適したセンサーを生成することが可能となる。

　図１に示すように、ＡＩ制御装置１０は各ユーザーUserA、UserB・・・が使用する装置である。ＡＩ制御装置１０は、オフィス、工場、商業施設、公共施設等の施設内に設置された放送装置２０、監視カメラ４０を含む設備機器に接続される。なお、一つのＡＩ制御装置１０が、複数の設備機器に接続されてもよいし、設備機器毎にＡＩ制御装置１０が接続されてもよい。また、ＡＩ制御装置１０は設備機器の中の制御装置として搭載されていてもよい。

　各設備機器は、後述するようにＡＩ制御装置１０から信号を受信する接点入力端子と、接点入力端子から受信した信号に応じて設備機器を作動させるリレー回路とを備える。

　放送装置２０は、少なくとも、接点入力端子と、放送音声を保持する保持部と、スピーカーとを含む。放送装置２０は、接点入力端子から受信した信号に応じて、保持部に保持された放送音声をスピーカーから出力し拡声を行う。

　監視カメラ４０は、少なくとも、接点入力端子と録画部とを含む。監視カメラ４０は、接点入力端子から受信した信号に応じて、撮像した映像を録画する。

　以下、本実施形態に係るＡＩ制御装置１０及びサーバー装置３０を含むシステム１の構成及びその動作について説明する。

　なお、以下の説明においては、入力データはユーザーが悲鳴をキーワードとしてラベル付けする音声データであり、異常検知としての悲鳴を検知するセンサーを生成する場合を例に挙げる。

　１－１．構成
　１－１－１．ＡＩ制御装置１０
　図２に示すように、ＡＩ制御装置１０（ＡＩ制御装置の一例）は、制御部１１、ＲＡＭ１２、ＲＯＭ１４、記憶部１３、表示部１５、操作部１６、通信部１７、マイク１８、及び接点出力部１９を備える。

　制御部１１（第１制御部の一例）は、例えばＡＩチップにより構成され、高速処理が可能なＣＰＵやＧＰＵ、ＦＰＧＡ等のプロセッサを含む。制御部１１は、ＲＯＭ１４や記憶部１３に記憶されるコンピュータープログラムをＲＡＭ１２に読み出して実行することにより、ＡＩ制御装置１０の各機能を実行する。制御部１１は、とりわけ、サーバー装置３０により生成される学習済モデルによるプログラムを実行して、入力データ取得部１１１、ラベリング部１１２、異常検知部１１３、及び設備機器作動指令部１１４の機能を実行する。

　マイク１８（入力部の一例）は、ＡＩ制御装置１０に内蔵された内蔵マイク、又はＸＬＲコネクター等の外部入力端子を介してＡＩ制御装置１０に接続された少なくとも１つの外部マイクである（図示省略）。マイク１８は、後述するサーバー２３による機械学習に用いる入力データ（音声データ）のための音声取得や、後述する異常検知動作のための音声取得に用いられる。マイク１８は、個々に異なる外部入力端子を介して接続された複数の外部マイクであってもよい。ＡＩ制御装置１０が複数の設備機器に接続される場合、複数の設備機器に対応付けて複数の外部マイク１８を備えるようにしてもよい。例えば、複数の設備機器がそれぞれ異なるエリアに設置される場合、設備機器と共にこれらのエリアにそれぞれ異なる外部マイク１８が配置されるように、各外部マイク１８が外部入力端子を介してＡＩ制御装置１０に接続されるとよい。

　入力データ取得部１１１は、ユーザーにより入力される音声データを取得する。音声データは、ユーザーが「悲鳴」と判断する複数のサンプル音を含む。音声データは、例えば、マイク１８を介して入力される。例えば、マイク１８を介して繰り返しサンプル音を入力し、後述するラベリング部１１２により、同一のラベルを付与することにより、ラベル付き音声データを取得する。なお、音声データは、予め取得され記憶部１３に記憶された音声ファイルから取得してもよい。また、マイク１８を介して収集されたサンプル音は、記憶部１３に一旦記憶され、ユーザーは記憶されたサンプル音に対して一括して同一のラベルを付与してもよい。

　ラベリング部１１２は、入力データ取得部１１１により取得された音声データに対して、ラベルを付与する。ラベルの付与は後述する表示インターフェースを用いたユーザーによる入力に応じて実行される。ラベルが付与された音声データ（以下、ラベル付き音声データ、又はラベル付き入力データと呼ぶ）は、通信部１７を介して、サーバー装置３０に送信される。

　異常検知部１１３は、マイク１８から収音された音声を取得し、サーバー装置３０により生成された学習済モデルに基づき異常を判定する。

　設備機器作動指令部１１４は、異常が判定された場合、ＡＩ制御装置１０が接続される設備機器（放送装置２０、監視カメラ４０等）を作動させるための信号を生成する。生成された信号は、接点出力部１９を介して設備機器に送信される。設備機器においては、信号を受信することにより設備機器のリレー回路の接点がＯＮとなり、設備機器が作動する。例えば、マイク１８からの取得した音が「悲鳴」と判定された場合、設備機器をＯＮにするとともに、放送装置２０であれば放送音声（警告音声）を出力し、監視カメラ４０であれば映像の録画を開始する。

　ＡＩ制御装置１０がエリアの異なる複数の設備機器に接続されている場合、設備機器作動指令部１１４は、異常と判定された音声を取得したマイク１８に近い設備機器（マイク１８に対応して同じエリアに設置された設備機器）に接続された出力端子から信号を送信し、設備機器を作動させる。

　記憶部１３は、半導体メモリやＨＤＤ等により構成される。記憶部１３は、ＡＩ制御装置１０の識別情報を記憶する識別情報記憶部１３１を有する。記憶部１３はまた、後述するように、機械学習により生成され更新されるプログラム及びパラメータを含む学習済モデルを記憶する学習済モデル記憶部１３２（記憶部の一例）有する。なお、学習済モデルはサーバー装置３０において記憶され、ＡＩ制御装置１０には一時的に記憶されるだけでもよい。この場合、学習済モデル記憶部１３２は制御部１１の一部に含まれていてもよい。また、記憶部１３の一部又は全ては、別の記憶装置として備えられていてもよい。

　表示部１５は、例えば、液晶ディスプレイ又は有機ＥＬディスプレイにより構成される。表示部１５はタッチパネルを含んでいてもよい。表示部１５は、ＡＩ制御装置１０に接続可能な別体のディスプレイであってもよい。

　操作部１６は、例えば、キーボード、マウス、タッチパネル等を備え、表示部１５にされた画面にしたがってユーザーにより入力操作される。

　通信部１７（第１通信部の一例）は、ネットワークに接続するためのインターフェースであり、例えば無線通信用のアンテナや有線で接続可能なネットワークカードである。通信部１７は、ＬＡＮやＷＡＮ等の内部ネットワーク及びインターネットを介してサーバー装置３０に接続される。

　接点出力部１９（外部インターフェースの一例）は、放送装置２０、監視カメラ４０等の設備機器に接続される出力端子を有し、設備機器作動指令部１１４が生成した信号を送信する。接点出力部１９は複数の出力端子を有し、ＡＩ制御装置１０は、出力端子毎に、エリアの異なる複数の放送装置２０、複数の監視カメラ４０のそれぞれに接続されていてもよい。

　１－１－２．サーバー装置３０
　サーバー装置３０は、インターネットを介して複数のユーザーが使用するＡＩ制御装置１０に接続される。サーバー装置３０は、設備機器を管理する事業者や機械学習を使用したサービスを提供する事業者によって管理される。

　図３に示すように、サーバー装置３０（サーバー装置の一例）は、制御部３１、ＲＡＭ３２、ＲＯＭ３４、記憶部３３、及び通信部３７を備える。

　制御部３１（第２制御部の一例）は、例えばＡＩチップにより構成され、高速処理が可能なＣＰＵやＧＰＵ等のプロセッサを含む。制御部３１は、ＲＯＭ３４や記憶部３３に記憶されるコンピュータープログラムをＲＡＭ３２に読み出して実行することにより、サーバー装置３０の各機能を実行する。制御部３１は、とりわけ、入力データ管理部３１１及び学習部３１２の機能を実行する。

　入力データ管理部３１１は、各ユーザーのＡＩ制御装置１０から取得する入力データである音声データを記憶部３３に記憶する。このとき、入力データ管理部３１１は、各ユーザーのＡＩ制御装置１０から送信されるユーザー識別情報、ラベル付き音声データ、及び使用可否情報に応じて、後述するユーザー管理テーブルを生成したり更新したりする。入力データ管理部３１１は更に、ＡＩ制御装置１０からの要求に応じて、後述するユーザー管理テーブルを参照して、課金情報をＡＩ制御装置１０に送信する。

　入力データ管理部３１１は、各ユーザーのＡＩ制御装置１０から取得するラベル付き音声データに基づき、ラベル名間の類似性を判定するための基準情報を生成し、更新する。基準情報は、ラベル名の概念を所定の基準に従って関連付けた情報である。所定の基準は、例えば、一方のラベル名の概念（下位概念）が他方のラベル名の概念（上位概念）を承継する関係であるか否かや、ラベル名の概念同士が同義語や類義語であるか等の基準である。入力データ管理部３１１は、例えば、図８Ｂに示すような階層構造により表現される基準情報を生成し、記憶部３３に記憶する。入力データ管理部３１１は、ユーザーのＡＩ制御装置１０からラベル付き音声データを取得したとき、例えば新たなラベル名が付されている場合は、当該基準情報を更新する。

　入力データ管理部３１１は、ユーザーのＡＩ制御装置１０からの要求に応じて関連度情報を生成する。関連度情報は、対象となるラベル付き音声データに対して、関連度の高いラベル付き音声データとその関連度とを含む。入力データ管理部３１１は、上述した基準情報を参照し、関連度を算出する。例えば、図８Ａ及び図８Ｂに示すように、「女性の悲鳴」というラベル名を付した音声データに対して、同義語の「女性の悲鳴」（或いは女性の叫び声等）というラベル名を付した音声データの関連度は１００％と算出される。また、例えば「女性の悲鳴」というラベル名を付した音声データに対して、「悲鳴」というラベル名を付した音声データの関連度は８０％と算出される。一方、例えば「ドア開閉」というラベル名を付した音声データに対して、「悲鳴」というラベル名を付した音声データの関連度は０％と算出される。入力データ管理部３１１は、このように算出された関連度が比較的高い（例えば、６０％以上）音声データを入力データ記憶部３３４より読み出し、関連度を含め、要求のあったＡＩ制御装置１０に送信するための関連度情報を生成する。

　学習部３１２は、ＡＩ制御装置１０からの要求に応じて、取得した音声データに基づいて機械学習を行い、当該ユーザー毎の学習済モデルを構築する。具体的には、取得した音声データの特徴を自律的に学習し、未知音の入力に対して同特徴を有する音声を検知する学習済みモデルを構築する。

　機械学習は、例えば、教師あり学習の分類を実行する回帰アルゴリズムを用いて行われたり、ディープラーニングのニューラルネットワークを用いて行われる。機械学習は、いわゆる教師あり学習を実行する。ラベル付き音声データは正解データとして機械学習に使用される。なお、機械学習には、予め準備された非正解データ（例えば、「悲鳴」のラベル付け音声データに関し、「悲鳴」でない音声データ）が使用されてもよい。

　サーバー装置３０は、既存のＡＩプラットフォーム、機械学習エンジン、その他機械学習サービスを使用して、既存の学習済モデルに対しラベル付き音声データを用いて訓練を行い、機械学習を実行してもよい。

　記憶部３３（第２記憶部又は記憶部の一例）は、半導体メモリやＨＤＤ等により構成される。記憶部３３は、ユーザー管理テーブル記憶部３３１、課金テーブル記憶部３３２、ユーザー毎に記憶された学習済モデル記憶部３３３、及びラベル別に音声データが記憶された入力データ記憶部３３４を含む。なお、記憶部３３の一部又は全ては、データベースを含む別の記憶装置として備えられていてもよい。

　ユーザー管理テーブル記憶部３３１は、図４Ａに示すようなユーザー管理テーブル３３１ａを記憶する。ユーザー管理テーブル３３１ａは、ユーザーの識別情報と、ラベルと、当該ラベルに対応する音声データの識別情報と、使用可否情報とを対応づけて記憶する。使用可否情報は、当該音声データを他のユーザーが使用することを許可するか否かを示す。なお、使用可否情報は、特定のユーザーのみ許可又は不許可としてもよい。例えば、競合会社を特定して不許可を設定できるようにしてもよい。

　課金テーブル記憶部３３２は、図４Ｂに示すような課金テーブル３３２ａを記憶する。課金テーブル３３２ａは、ＡＩ制御装置１０がサーバー装置３０により学習済モデルを生成する際の利用料金を計算し、ＡＩ制御装置１０のユーザーに対して課金するためのテーブルである。例えば、課金テーブル３３２ａは、学習済モデルを生成するための単価を示す情報である。例えば、課金テーブル３３２ａは、ラベルを１つ付してラベル付き音声データを使用した機械学習の基本利用料金（図４Ｂの例では１００円）と、機器学習の際に他のユーザーのラベル付き音声データを使用する場合の追加料金（図４Ｂの例では５０円）と、ラベル付き音声データの使用可否情報が「許可」（肯定的な使用可否情報）であるときの追加費用（図４Ｂの例では－５０円、すなわち５０円の割引）とを含む。

　学習済モデル記憶部３３３は、学習部３１２により生成された学習済モデルをユーザー毎に記憶する。

　入力データ記憶部３３４は、ラベル別に音声データを記憶する。各ユーザーから取得されたラベル付き音声データは、入力データ管理部３１１により、ラベル別に分類され、入力データ記憶部３３４に記憶される。なお、音声データのラベル別の分類は、上述した基準情報に応じて行われてもよい。例えば、ラベル名「悲鳴」の場合、図８Ｂに示すように、上位概念である「悲鳴」の音声データには、下位概念である「女性の悲鳴」、「屋外の悲鳴」、「屋内の悲鳴」のラベル名が付与された音声データも含まれるように分類される。

　通信部３７（第２通信部の一例）は、ネットワークに接続するためのインターフェースであり、例えば無線通信用のアンテナや有線で接続可能なネットワークカードである。通信部３７は、ＬＡＮやＷＡＮ等の内部ネットワーク及びインターネットを介して複数のユーザーのＡＩ制御装置１０に接続される。

　１－２．動作
　図５から図１０を参照しながら、ＡＩ制御装置１０（図２）及びサーバー装置３０の動作について説明する。

　１－２－１．ＡＩ制御装置１０による機械学習のための動作
　図５は、図２に示すＡＩ制御装置１０による機械学習を実行するための動作を示す。ＡＩ制御装置１０は、入力データである音声データに対するラベルの入力を受け付ける（Ｓ１０１）。このとき、表示部１５は、図７に示すような表示インターフェース１５ａを表示する。表示インターフェース１５ａ（ラベル入力インターフェースの一例）は、ラベルを入力するためのインターフェースと、データの使用可否情報を入力するためインターフェースとを含む。使用可否情報は、当該音声データを他のユーザーが使用することの許可／不許可を示す。ＡＩ制御装置１０のユーザーは、操作部１６を介して、対象の音声データに対するラベルを入力する。例えば、キーワード「女性の悲鳴」というラベルを入力する。なお、ラベルの入力はユーザーにより直接入力されてもよいし、予め設定されたラベルのリストを表示させることによりユーザーが選択できるようにしてもよい。

　入力データ取得部１１１により音声データが取得され（Ｓ１０２）、ラベリング部１１２により、ステップＳ１０１で受け付けられたラベルが音声データに付与される（Ｓ１０３）。

　制御部１１は、ユーザーの識別情報に対応づけたラベル付き音声データを、データの使用可否情報とともに、通信部１７を介してサーバー装置３０に送信する（Ｓ１０４）。

　サーバー装置３０から、上述した関連度情報を受信し、表示部１５に表示する（Ｓ１０５）。例えば、表示部１５は、図８Ａに示すような表示インターフェース１５ｂを表示する。表示インターフェース１５ｂは、当該音声データに対する、他のユーザーの各音声データの関連度（％）や、各音声データのラベル名やサンプル数を表示する。この表示インターフェース１５ｂを介して他のユーザーの音声データを選択入力することにより、当該ユーザーは、他のユーザーの音声データを使用する旨の要求をサーバー装置３０に送信する。

　なお、関連度情報として表示される他のユーザーの音声データは、当該他のユーザーが使用可否情報において許可しているデータに限られる。

　他のユーザーの音声データを使用するとの入力を受け付けると（Ｓ１０６のＹｅｓ）、制御部１１は、選択された他のユーザーのデータの使用要求を、通信部１７を介してサーバー装置３０に送信する（Ｓ１０７）。

　サーバー装置３０から課金情報を受信し、表示部１５に表示する（Ｓ１０８）。

　他のユーザーにより収集された音声データを使用する場合（Ｓ１０６のＹｅｓ）、表示部１５は、図９に示すような表示インターフェース１５ｃを表示する。表示インターフェース１５ｃは、サーバー装置３０による今回の機械学習を利用するための料金（機械学習利用料金）に加え、要求した他のユーザーの音声データの使用料金を表示する。

　他のユーザーの音声データを全く使用しない場合（Ｓ１０６のＮｏ）、つまり図８Ａの表示インターフェース１５ｂにおいて、「全て使用せず、機械学習を開始する」が選択された場合、表示部１５は、機械学習利用料金のみを、課金情報として表示部１５に表示する。

　当該ユーザーは、表示インターフェース１５ｃを介して、提示された課金情報に承諾するか否かを入力する。承諾することが入力されると、制御部１１は、サーバー装置３０に対し機械学習の開始を要求する（Ｓ１０９）。

　ステップＳ１０６において、他のユーザーの音声データを全く使用しない場合（Ｓ１０６のＮｏ）においては、表示部１５は、課金情報を表示しないようにしてもよい。

　ステップＳ１０１～Ｓ１０３の順序は、上記に限定されない。音声データを取得してから、ラベル入力を受け付け、ラベリングを実行してもよい。

　１－２－２．サーバー装置３０による機械学習の動作
　図６は、サーバー装置３０の動作を示す。制御部３１の入力データ管理部３１１は、ＡＩ制御装置１０から受信した音声データ及びデータの使用可否情報を取得する（Ｓ１１１）。入力データ管理部３１１は、受信したユーザーの識別情報を判定し（Ｓ１１２）、受信したラベル付けされた音声データをラベル毎に入力データ記憶部３３４に分類し記憶すると共に、図４Ａに示すユーザー管理テーブル３３１ａを更新する（Ｓ１１３）。

　入力データ管理部３１１は、上述した関連度情報を生成し、当該ユーザーの識別情報に対応するＡＩ制御装置１０に送信する（Ｓ１１４）。このとき、入力データ管理部３１１は、他のユーザーの音声データの使用可否情報も参照して、使用不可の他のユーザーの音声データの関連度情報は生成せず、除外する。

　関連度情報の生成は次のように実行される。入力データ管理部３１１は、ユーザーからラベル付き音声データのラベル（以下、対象ラベルと呼ぶ）と、入力データ記憶部３３４において分類され記憶されている複数の音声データのラベル（他のラベル）とを比較する。入力データ管理部３１１は、対象ラベルに対し、図８Ｂに示すような基準に基づき対象ラベルに対する他のラベルの関連度（％）を算出する。入力データ管理部３１１は、他のラベルのうち関連度が所定値以上（例えば、６０％以上）のラベルが付与された音声データを特定する。入力データ管理部３１１は、ラベルの関連度が所定値以上の音声データを、入力データ記憶部３３４より抽出して、当該音声データと算出した関連度とを含む関連度情報を生成し、ＡＩ制御装置１０に送信する。

　関連度情報を参照したＡＩ制御装置１０より他のユーザーの音声データの使用要求を受信した場合（Ｓ１１５のＹｅｓ）、当該他のユーザーの音声データを入力データ記憶部３３４より取得する（Ｓ１１６）。

　入力データ管理部３１１は、課金情報を生成し、ＡＩ制御装置１０に送信する（Ｓ１１７）。ステップＳ１１７では、入力データ管理部３１１は、ステップＳ１１１で取得した使用可否情報が「使用可」であるか「使用不可」に応じて、及びステップＳ１１５での使用要求の有無に応じて、課金テーブル３３２ａを参照して課金金額が算出し、当該金額を示す課金情報を生成する。図４Ｂに示す課金テーブル３２２ａを参照すると、１つのラベル（本実施形態の例では「悲鳴」）が付された音声データに基づく学習済モデルを生成する基本料金ある１００円をベースとして、ステップＳ１１１で取得した使用可否情報が「使用可」である場合には５０円が割り引かれ、ステップＳ１１５で使用要求を受信した（Ｓ１１５のＹｅｓ）場合には５０円が追加されて、課金金額が算出される。

　学習部３１２により機械学習を実行する（Ｓ１１８）。他のユーザーの音声データを使用しない場合（Ｓ１１５のＮｏ）、当該ユーザーから取得した音声データのみに基づき機械学習を実行する。これにより、当該ユーザーから取得した音声データの特徴を学習して、同特徴を有する未知音を検知する学習済モデルが構築される。他のユーザーの音声データを使用する場合（Ｓ１１５のＹｅｓ）、当該ユーザーから取得した音声データに加えて指定された他のユーザーの音声データに基づき、機械学習を実行する。これにより、当該ユーザーから取得した音声データ及び指定された他のユーザーの音声データの特徴を学習して、同特徴を有する未知音を検知する学習済モデルが構築される。

　機械学習を終了すると（Ｓ１１９のＹｅｓ）、生成された学習済モデルを、当該ユーザーの識別情報に対応させて学習済モデル記憶部３３３に記憶する（Ｓ１２０）。

　生成された学習済モデルは、対応するユーザーのＡＩ制御装置１０に送信され、記憶部１３の学習済モデル記憶部１３２に記憶される。サーバー装置３０からＡＩ制御装置１０への学習済モデルの送信は、機械学習の終了に応答して自動的に行われてもよいし、ＡＩ制御装置１０からの要求に応じて行われてもよい。

　１－２－３．ＡＩ制御装置１０による異常検知動作
　ＡＩ制御装置１０は、サーバー２３により生成された学習済モデルを用いて異常検知を行う。図１０は、ＡＩ制御装置１０による異常検知の動作を示す。ＡＩ制御装置１０は、マイク１８からの音声を受信する（Ｓ１２１）。

　ＡＩ制御装置１０の制御部１１の異常検知部１１３は、学習済モデル記憶部１３２に記憶された学習済モデルを読み出して実行し、受信した音声が、上述した学習済モデルに基づき異常か否かの判定を行う（Ｓ１２２）。すなわち、学習済モデルにより、学習された特徴を有する音声が検知されることで、異常が発生したこと（異常あり）を判定する。これは、もともとユーザーが図５のステップＳ１０１～Ｓ１０３にて付したラベル（本実施形態では「悲鳴」）に対応する音声を検知して異常を判定することを意味する。本実施形態では、悲鳴に対応する音声が検知された場合、異常有りと判定する（Ｓ１２３のＹｅｓ）。設備機器作動指令部１１４は、異常有りとの判定に応じて、接点出力部１９を介して信号を送信する（Ｓ１２４）。上述したように、複数のマイク１８が接続されている場合、設備機器作動指令部１１４は、異常と判定した音声を受信したマイク１８に対応する放送装置２０や監視カメラ４０に、接点出力部１９を介して信号を送信する（Ｓ１２４）。

　設備機器作動指令部１１４により、指定された設備機器を作動させる（Ｓ１２５）。例えば、当該設備機器をＯＮにするとともに、放送装置２０であれば警告音声を出力し、監視カメラ４０であれば映像の録画を開始する。

　ＡＩ制御装置１０は、機械学習のための動作（図５のステップＳ１０１～Ｓ１０９）を実行するモード（機械学習モード）と、異常検知動作（図１０のステップＳ１２１～Ｓ１２５）を実行するモード（異常検知モード）とを有し、これらのモードを切り替えてそれぞれの動作を実行するようにしてもよい。マイク１８は、機械学習モード時には、ラベル付き音声データを取得するために機能し、異常検知モード時には、異常判定のために未知音を取得するために機能する。ＡＩ制御装置１０は、学習済モデル記憶部１３２に学習済モデルが記憶されていないときは機械学習モードで動作し、学習済モデル記憶部１３２に学習済モデルが記憶されたことに応じて自動的に異常検知モードに切り替わるように構成されてもよい。

　１－３．特徴等
　上記実施形態１に係るＡＩ制御装置１０は、入力データ（例えば、音声データ）を取得し、入力データを、ＡＩ制御装置１０のユーザーを識別可能な識別情報と対応付けてサーバー装置３０に送信する。ＡＩ制御装置１０は、サーバー装置３０により、他のユーザーの学習済モデルとは別に生成された学習済モデルであって、入力データの特徴を学習して未知の入力データからその特徴を有する入力データを検知する学習済モデルを実行することにより、所定のイベント（例えば、悲鳴）の発生を検知する。このため、学習済モデルの生成においてユーザーの負担を軽減でき、且つ学習済モデルを使用して任意のイベント検知手段を実現できる。

　上記実施形態１に係るＡＩ制御装置１０は、ラベルの入力を受け付けるための表示インターフェース１５ａを表示部１５に表示させ、ラベルの入力に応じて入力データに対しラベルを付ける。このため、ユーザーは簡単に入力データに対してラベリングを実行することができる。

　上記実施形態１に係るＡＩ制御装置１０は、サーバー装置３０により算出された、ラベル付き入力データと他のユーザーのラベル付き入力データとの関連度を示す関連度情報を表示部１５に表示させる。このため、ユーザーは、他のユーザーの入力データであって且つ関連度の高い入力データを選択的に使用することが可能となり、ユーザーが自ら大量のサンプル音を収集してラベル付き音声データを作成する必要性がなくなる。よって、学習済モデルの生成においてユーザーの負担を更に軽減できると共に、学習済モデルの精度を向上させることができる。

　上記実施形態１に係るサーバー装置３０は、複数のユーザーのＡＩ制御装置１０から、各ユーザーの識別情報と対応付けた入力データを受信し、受信した入力データを記憶部３３に記憶し、同入力データを使用して、ユーザー毎に、入力データの特徴を学習して、未知の入力データから同特徴を有する入力データを検知する学習済モデルを生成し、生成された学習済モデルを、ラベル別に記憶部３３にさせる。このため、複数のユーザー間で入力データをシェアすることが可能となり、学習済モデルの生成においてユーザーの負担を更に軽減できると共に、学習済モデルの精度を向上させることができる。

　上記実施形態１に係るサーバー装置３０は、各ユーザーの入力データの使用可否情報を記憶部３３に記憶し、管理する。このため、ユーザーの入力データを他のユーザーが使用することは制限されるため、入力データは保護される。

　上記実施形態１に係るＡＩ制御装置１０及びサーバー装置３０は、サーバー装置３０により管理される上記使用可否情報と課金情報とに基づき、ユーザーが機械学習を使用する場合の料金がユーザーに提示される。課金は、ユーザーが自身の入力データの使用を許可しているか否かに応じて、或いは、他のユーザーの入力データの使用量に応じて、異なる。よって、ユーザーは、自身の入力データの使用を許可することや、他のユーザーの入力データを使用することに対しインセンティブが与えられ、各ユーザーの機械学習における入力データの使用を促進することができる。

　上記実施形態１に係るＡＩ制御装置１０は、学習済モデルを用いた異常検知に基づいて、接続された放送装置２０や監視カメラ４０を作動させる。このため、ＡＩ制御装置１０は汎用的な構成をとることができ、ユーザーとって利便性の高い装置を実現できる。

　１－４．変形例
　上記例においては、ＡＩ制御装置１０からの入力データの送信時に機械学習を実行していたが、機械学習を実行するか否かは、ユーザーからの入力を待ってから行うようにしてもよい。例えば、ユーザーが複数回にわたって入力データを入力し、ある程度のデータ量が得られたときに機械学習を実行するようにしてもよい。

　上記例においては、ＡＩ制御装置１０が異常を判定した場合、設備機器を作動させていたが、これに限定されない。例えば、ＡＩ制御装置１０は、施設の管理者や警備室に通報を行うようにしてもよい。

　ＡＩ制御装置１０は、自身の入力データがなくとも、他のユーザーのデータの使用のみができるようにしてもよい。例えば、図７に示す表示インターフェース１５ａに対してラベルの入力操作後（図５のＳ１０１）、ＡＩ制御装置１０はサーバー装置３０に対し、他のユーザーのデータの使用要求を送信する（同Ｓ１０７）。表示部１５には、当該ユーザーが入力したラベルと、他のユーザーのラベル付き入力データとの関連度情報及び課金情報を表示（同Ｓ１０５及びＳ１０８）する。ユーザーが関連度情報に基づき他のユーザーのラベル付き入力データを選択し、課金を承諾すると、サーバー装置３０に機械学習要求を送信する（同Ｓ１０９）。サーバー装置３０は、当該ユーザーについて、指定された他のユーザーの入力データに基づき機械学習を実行する。

　上記例において、データの使用可否情報は、ラベル付き入力データと共にサーバー装置３０に送信していたが、別途送信できるようにしてもよい。また、ユーザーは、入力操作を介して、いつでもデータの使用可否情報を変更できるようにしてもよい。

　２．その他実施形態
　以上のように、本出願において開示する技術の例示として、各実施形態を説明した。しかしながら、本開示における技術は、これに限定されず、適宜、変更、置き換え、付加、省略等を行った実施形態にも適用可能である。また、上記実施形態で説明した各構成要素を組み合わせて、新たな実施形態とすることも可能である。

　（１）実施形態１においては、ＡＩ制御装置１０は、接点出力部１９を介しての接点出力により設備機器を作動させたが、これに限定されない。ＡＩ制御装置１０は、通信部１７を介して、設備機器を作動させるようにしてもよい。

　この場合、各設備機器は、ＩＰアドレスを有するネットワーク接続部を有する。図１に示すＡＩ制御装置１０の制御部１１の設備機器作動指令部１１４は、異常が判定された場合、設備機器を作動させるための信号を生成し、通信部１７を介して設備機器のＩＰアドレス宛てに送信し、実施形態１と同様に設備機器を作動させる。更に、上述したように、異なるエリアにわたって複数の設備機器（放送装置２０、監視カメラ４０）と、これらに対応する複数のマイク１８を設置する場合、マイク１８もＩＰ化して通信部１７を介して接続されるようにしてもよい。このような構成の場合、各マイク１８の位置情報と設備機器の位置情報とを登録しておき、異常と判定された音声を取得したマイク１８の近傍の設備機器を作動させるように構成してもよい。ＡＩ制御装置１０（記憶部１３）又はＡＩ制御装置１０に接続される管理コンピューター（図示省略）は、各マイク１８の識別情報（ＩＰアドレス）と施設内における各マイク１８が設置された位置情報とを対応付けたマイク情報（図１１Ａ）と、各設備機器の識別情報（ＩＰアドレス）と、施設内における設備機器が設置された位置情報とを対応づけた設備機器情報（図１１Ｂ、図１１Ｃ）を保持する。異常が検知された場合、設備機器作動指令部１１４は、図１１Ａに示す情報を参照して、異常と判定された音声を取得したマイク１８の位置情報を特定する。設備機器作動指令部１１４は更に、図１１Ｂに示すスピーカーの位置情報や図１１Ｃに示す監視カメラの位置情報から、当該マイク１８に近い設備機器を特定し、当該設備機器に信号を送信して実施形態１と同様に作動させる。例えば、施設内に複数設置される放送装置２０がある場合、ＡＩ制御装置１０は、図１１Ｂに示す位置情報を参照し、「悲鳴」と判定された音を検知したマイク１８に近傍にある一つ又は複数の放送装置２０のＩＰアドレスを指定して、信号を送信し、当該放送装置２０をＯＮにし、警告音声を出力させる。

　（２）実施形態１において、入力データは音声データを例にしていたがこれに限定されない。例えば、入力データは画像データであってもよい。この場合、ＡＩ制御装置１０は、マイク１８の代わりに画像を取得するカメラを備えるとよい。また、監視カメラ４０から取得される画像データを用いてもよい。画像データにおいて、ユーザーが所望するラベル、例えば、「不審な動作」、「人同士が争っている動作」、「人が倒れた状態」等のキーワードをラベルとする画像データを入力データとして、機械学習を実行し、画像データの特徴を学習して未知の画像（映像）から当該特徴を有する画像を検知する学習済モデルを生成する。また、画像データから異常を検知した場合は、実施形態１と同様に、設備機器のＯＮやその他の作動（例えば、放送装置２０のＯＮや警告音声の出力、或いは監視カメラ４０による画像の録画開始等）を開始する。

　（３）実施形態１及び上記例において、サーバー装置３０の入力データ管理部３１１は、ユーザーの入力データのラベル名間の類似度に応じて関連度を算出していたが、これに限定されない。ラベル名間の類似度に加えて或いは代えて、入力データそのものの類似度を算出してもよい。例えば、入力データが音声データである場合、周波数の高さや振幅の大きさ等の音声データの特徴パラメータの数値の近さに応じて算出するようにしてもよい。入力データが画像データの場合、画像中の動作パターンや姿勢パターンの類似度を関連度として算出するようにしてもよい。

　更に、関連度は、ユーザー間の業態の類似度や、ＡＩ制御装置１０を使用する施設の種類の類似度等を加味して、算出してもよい。

　（４）実施形態１及び上記例において、サーバー装置３０は、記憶部３３にユーザー以外から取得したデータセット（例えば、ＡＩプラットフォームや機械学習サービスを提供する会社から提供されるデータセット）を予め記憶しておき、要求のあったユーザーに当該データセットの使用を許可してもよい。

　（５）実施形態１及び上記例において、ＡＩ制御装置１０は、ユーザーがラベルを入力することにより入力データにラベルを付与しているが、これに限定されない。サーバー装置３０は、ＡＩ制御装置１０からラベル付けされていない入力データを取得し、自動的に入力データを解析し、ラベルを付与するようにしてもよい。

　（６）実施形態１及び上記例において、ＡＩ制御装置１０は、機械学習のための機能と異常検知機能との双方を備えているが、これに限定されない。ユーザーは、ＡＩ制御装置１０ではなく、他のコンピュータ端末により入力データにラベル付けしてサーバー装置３０に送信し、機械学習を実行するようにしてもよい。ＡＩ制御装置１０は、学習済モデルをサーバー装置３０より取得し、異常検知動作を行うようにしてもよい。

　（７）本明細書において異常検知とは、危険を伴うような事象の検知に限定されず、ユーザーが検知を所望するあらゆる状態や動作、すなわち所定のイベントの検知を含み得る。

　（８）ＡＩ制御装置１０及びサーバー装置３０の制御部１１、３１は、所定の機能を実現するように設計された専用の電子回路で構成されるプロセッサを含んでもよい。また、制御部１１，３１は、ＤＳＰ、ＦＰＧＡ、ＡＳＩＣ等の種々のプロセッサで実現してもよい。プロセッサは、１つ又は複数のプロセッサで構成してもよい。

　（９）図５、図６、及び図１０に示すフローチャートの処理の実行順序は、必ずしも、上記実施形態の記載に制限されるものではなく、発明の要旨を逸脱しない範囲で、実行順序を入れ替えたり、並行して実行されたりすることができる。更に、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

　（１０）ＡＩ制御装置１０及び／又はサーバー装置３０により実行される機械学習方法及び異常検知方法、同方法を実行するコンピュータープログラム、及び同コンピュータープログラムを記録したコンピュータ読み取り可能な記録媒体は、本開示の範囲に含まれる。コンピュータープログラムは電気通信回線、無線又は有線通信回線、インターネットを代表とするネットワーク等を経由して取得されてもよい。

　（１１）本開示によるＡＩ制御装置１０及び／又はサーバー装置３０の一部又は全ては、１つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。本明細書において、装置とは、複数の構成要素（装置、モジュール（部品）等）の集合を意味する場合を含み、すべての構成要素が同一筐体中にあるか否かは問わない。また、全て又は一部の構成要素は、施設以外の場所に設置されていてもよい。

１…システム，１０…ＡＩ制御装置，１１…制御部，１２…ＲＡＭ，１３…記憶部，１４…ＲＯＭ，１５…表示部，１５ａ～１５ｃ…表示インターフェース，１６…操作部，１７…通信部，１８…マイク，２０…放送装置，３０…サーバー装置，３１…制御部，３２…ＲＡＭ，３３…記憶部，３４…ＲＯＭ，３７…通信部，４０…監視カメラ，１１１…入力データ取得部，１１２…ラベリング部，１１３…異常検知部，１１４…設備機器作動指令部，１３１…識別情報記憶部，１３２…学習済モデル記憶部，３１１…入力データ管理部，３１２…学習部，３３１…ユーザー管理テーブル記憶部，３３１ａ…ユーザー管理テーブル，３３２…課金テーブル記憶部，３３２ａ…課金テーブル，３３３…学習済モデル記憶部，３３４…入力データ記憶部

特許第６５２７１８７号明細書

Claims

　複数のユーザーから個々のユーザーを識別して入力データを受信し、ユーザー毎に入力データに基づいて学習済モデルを生成するサーバー装置に接続可能なＡＩ制御装置であって、
　第１制御部と、
　前記サーバー装置に接続される第１通信部と、
を備え、
　前記第１制御部は、
　入力データを取得し、
　前記ＡＩ制御装置のユーザーを識別可能な識別情報と前記取得入力データとを対応付けて、前記サーバー装置に前記第１通信部を介して送信し、
　送信された前記取得入力データを使用して前記サーバー装置により他のユーザーの学習済モデルとは別に生成された学習済モデルであって、前記取得入力データの特徴を学習して未知の入力データから前記特徴を有する入力データを検知する学習済モデルを実行する、
ＡＩ制御装置。
　更に、ユーザーからラベルの入力を受け付けるラベル入力インターフェースを備え、
　前記第１制御部は、前記取得入力データに対し、前記ラベル入力インターフェースを介して入力されたラベルを付して、ラベル付き入力データを生成し、当該ラベル付き入力データを前記サーバー装置に送信し、
　前記学習済モデルは、前記ラベル付き入力データを使用して前記サーバー装置により生成された学習済モデルである、
請求項１に記載のＡＩ制御装置。
　更に、ユーザーからラベルの入力を受け付けるラベル入力インターフェースを備え、
　前記第１制御部は、前記取得入力データに対し、前記ラベル入力インターフェースを介して入力されたラベルを付して、ラベル付き入力データを生成し、当該ラベル付き入力データを前記サーバー装置に送信し、
　前記学習済モデルは、前記サーバー装置により、受信した前記ラベル付き入力データとともに、当該ラベルとの関連度が所定値以上の類似ラベルが付された入力データであって前記サーバー装置に保持されている他のユーザーから受信した入力データを使用して生成された学習モデルである、
請求項１に記載のＡＩ制御装置。
　更に、入力データの入力を受け付ける入力部を備え、
　前記第１制御部は、
　前記サーバー装置により前記学習済モデルが生成される前は、前記入力部を介して入力される前記取得入力データを前記サーバー装置に送信し、
　前記サーバー装置により前記学習済モデルが生成された後は、前記入力部を介して入力される前記未知の入力データに対して前記学習済モデルを実行し、前記特徴を有する入力データの検知を行う、
請求項１に記載のＡＩ制御装置。
　前記ＡＩ制御装置は、選択的に第１モード又は第２モードで動作し、
　更に、入力データの入力を受け付ける入力部を備え、
　前記第１制御部は、前記第１モードでの動作時には、
前記入力部を介して入力される前記取得入力データを前記サーバー装置に送信し、
　前記第２モードでの動作時には、前記入力部を介して入力される前記未知の入力データに対して前記学習済モデルを実行し、前記特徴を有する入力データの検知を行う、
請求項１に記載のＡＩ制御装置。
　前記取得入力データは音声データであって、
　前記ラベルは、音声を表すキーワードであり、
　前記学習済モデルは、前記音声データの特徴を学習して未知の音声から前記特徴を有する音声を検知する学習済モデルである、
　請求項２又は３に記載のＡＩ制御装置。
　前記入力データ及び前記未知の入力データは音声データであって、
　前記入力部は前記音声データの入力を受け付けるマイクである、
　請求項４又は５に記載のＡＩ制御装置。
　前記第１制御部は、プロセッサと、学習済モデルを記憶する記憶部とを含み、
　前記取得入力データを前記サーバー装置に送信した後、前記第１通信部を介して前記サーバー装置から前記学習済モデルを受信して前記記憶部に記憶し、前記プロセッサが前記記憶部に記憶された学習済モデルを実行する、
請求項１に記載のＡＩ制御装置。
　更に、信号の受信に応じて作動する外部の設備機器に信号を送信するための外部インターフェースを備え、
　前記第１制御部は、
　前記学習済モデルを実行して前記特徴を有する入力データを検知した際に、前記外部インターフェースを介して前記信号を送信することにより前記外部の設備機器を作動させる、
請求項１に記載のＡＩ制御装置。
　複数のユーザーが使用する複数のＡＩ制御装置に接続可能なサーバー装置であって、
　第２制御部と、
　前記複数のＡＩ制御装置に接続される第２通信部と、
　第２記憶部と、
を備え、
　前記第２制御部は、
　前記複数のユーザーのＡＩ制御装置から、前記第２通信部を介して、各前記ユーザーの識別情報と対応付けた入力データを受信し、
　前記受信入力データを前記第２記憶部に記憶し、
　前記受信入力データを使用して、前記ユーザー毎に、前記受信入力データの特徴を学習して、未知の入力データから前記特徴を有する入力データを検知する学習済モデルを生成し、
　生成された学習済モデルを、前記ユーザー毎に前記第２記憶部にさせる、
サーバー装置。
　前記受信入力データは、当該受信入力データの送信者であるユーザーにより入力されたラベルが付されたラベル付き入力データであって、
　前記第２制御部は、
　第１のユーザーから前記ラベル付き入力データを受信することに応じて、受信した前記ラベル付き入力データを使用して、前記第１のユーザー用の学習済モデルを生成し、
　前記第１のユーザー用の学習済モデルを前記第２通信部を介して前記第１のユーザーのＡＩ制御装置に送信し、当該第１のユーザーのＡＩ制御装置に前記第１のユーザー用の学習済モデルを実行させる、
請求項１０に記載のサーバー装置。
　前記受信入力データは、当該受信入力データの送信者であるユーザーにより入力されたラベルが付されたラベル付き入力データであって、
　前記第２制御部は、
　前記ラベル付き入力データを、前記ラベルに応じて前記第２記憶部に記憶させ、
　第１のユーザーから前記ラベル付き入力データを受信することに応じて、受信した前記ラベル付き入力データとともに、前記第１のユーザーから受信した前記ラベル付き入力データのラベルとの関連度が所定値以上の類似ラベルが付された入力データであって、前記第２記憶部に記憶されている第１のユーザー以外の他のユーザーから以前に受信したラベル付き入力データを使用して、前記学習済モデルを生成する、
請求項１０に記載のサーバー装置。
　前記受信入力データは、当該受信入力データの送信者であるユーザーにより入力されたラベルが付されたラベル付き入力データであって、
　前記第２制御部は、
　前記ラベル付き入力データを、前記ラベルに応じて前記第２記憶部に記憶させ、
　第１のユーザーから前記ラベル付き入力データを受信することに応じて、前記第１のユーザーから受信した前記ラベル付き入力データのラベルとの関連度が所定値以上の類似ラベルが付された入力データであって、前記第２記憶部に記憶されている第１のユーザー以外の他のユーザーから以前に受信したラベル付き入力データを特定し、当該他のユーザーのラベル付き入力データを示す関連度情報を前記第２の通信部を介して前記第１のユーザーのＡＩ制御装置に提示し、
　前記関連度情報の提示を受けた前記第１のユーザーのＡＩ制御装置から前記第２の通信部を介して受信する要求に応じて、選択的に、
　前記第１のユーザーから受信した前記ラベル付き入力データのみを使用して学習済モデルを生成するか、又は、
　前記第１のユーザーから受信した前記ラベル付き入力データとともに、前記関連度情報が示す前記他のユーザーのラベル付き入力データを使用して学習済モデルを生成する、
請求項１０に記載のサーバー装置。
　前記ラベル付き入力データは、当該ラベル付き入力データの送信者であるユーザーにより入力された使用可否情報であって、他のユーザーによる当該ラベル付き入力データの使用の可否を示す使用可否情報を含み、
　前記第２制御部は、
　前記第２記憶部に記憶されている前記第１のユーザー以外の他のユーザーから以前に受信したラベル付き入力データのうち、肯定的な使用可否情報を含むラベル付き入力データを使用して、前記学習済モデルを生成する、
請求項１２に記載のサーバー装置。
　前記ラベル付き入力データは、当該ラベル付き入力データの送信者であるユーザーにより入力された使用可否情報であって、他のユーザーによる当該ラベル付き入力データの使用の可否を示す使用可否情報を含み、
　前記第２制御部は、
　前記関連度情報が示す前記第１のユーザー以外の他のユーザーのラベル付き入力データのうち、肯定的な使用可否情報を含むラベル付き入力データのみを使用して、前記学習済モデルを生成する、
請求項１３に記載のサーバー装置。
　前記第２記憶部は更に、前記第１のユーザーのラベル付き入力データを使用して学習済モデルを生成するための単価と、前記他のユーザーのラベル付き入力データを使用するのに必要な単価とを含む課金テーブルを保持し、
　前記第２制御部は、
　前記第１のユーザーから受信した前記ラベル付き入力データに応じた前記学習済モデルの生成に伴い、前記課金テーブルを参照して前記第１のユーザーに課金する金額を算出し、前記第２通信部を介して、前記第１のユーザーのＡＩ制御装置１０に送信する、
請求項１２又は１３に記載のサーバー装置。
　前記第２記憶部は更に、前記第１のユーザーのラベル付き入力データを使用して学習済モデルを生成するための単価と、前記他のユーザーのラベル付き入力データを使用するのに必要な単価と、前記使用可否情報が示す可否に応じて決まる単価と、を含む課金テーブルを保持し、
　前記第２制御部は、
　前記第１のユーザーから受信した前記ラベル付き入力データに応じた前記学習済モデルの生成に伴い、前記課金テーブルを参照して前記第１のユーザーに課金する金額を算出し、前記第２通信部を介して、前記第１のユーザーのＡＩ制御装置１０に送信する、
請求項１４又は１５に記載のサーバー装置。
　複数のユーザーが使用する複数のＡＩ制御装置に接続可能なサーバー装置を用いたＡＩ制御方法であって、
　前記複数のユーザーのＡＩ制御装置から、各前記ユーザーの識別情報と対応付けた入力データを受信し、
　前記受信入力データを記憶部に記憶し、
　前記受信入力データを使用して、前記ユーザー毎に、前記受信入力データの特徴を学習し、未知の入力データから前記特徴を有する入力データを検知する学習済モデルを生成し、
　生成された学習済モデルを、前記ユーザー毎に前記記憶部にさせる、
ＡＩ制御方法。