JPWO2019167556A1 - ラベル収集装置、ラベル収集方法及びラベル収集プログラム - Google Patents

ラベル収集装置、ラベル収集方法及びラベル収集プログラム Download PDF

Info

Publication number
JPWO2019167556A1
JPWO2019167556A1 JP2020502890A JP2020502890A JPWO2019167556A1 JP WO2019167556 A1 JPWO2019167556 A1 JP WO2019167556A1 JP 2020502890 A JP2020502890 A JP 2020502890A JP 2020502890 A JP2020502890 A JP 2020502890A JP WO2019167556 A1 JPWO2019167556 A1 JP WO2019167556A1
Authority
JP
Japan
Prior art keywords
label
teacher
accuracy
processing unit
teacher data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020502890A
Other languages
English (en)
Other versions
JP7320280B2 (ja
Inventor
井上 創造
創造 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyushu Institute of Technology NUC
Original Assignee
Kyushu Institute of Technology NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyushu Institute of Technology NUC filed Critical Kyushu Institute of Technology NUC
Publication of JPWO2019167556A1 publication Critical patent/JPWO2019167556A1/ja
Application granted granted Critical
Publication of JP7320280B2 publication Critical patent/JP7320280B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

ラベル収集装置は、機械学習に用いられる教師データの教師ラベルを取得する取得部と、取得された教師ラベルを含む教師データに基づいてモデルの機械学習を実行する学習処理部と、モデルの精度を検出する精度検出部と、精度を提示する提示処理部とを備え、取得部は、更新された教師データを取得する。

Description

本発明は、ラベル収集装置、ラベル収集方法及びラベル収集プログラムに関する。
本願は、2018年2月27日に、日本に出願された特願2018−033655号に基づき優先権を主張し、その内容をここに援用する。
機械学習の一分野である教師あり機械学習は、センサデータ等に基づいて人の行動を認識するために実行されることがある(非特許文献1参照)。教師あり機械学習のフェーズには、学習(訓練)フェーズと、判定(評価)フェーズとがある。
Nattaya Mairittha (Fah), Sozo Inoue, "Exploring the Challenges of Gamification in Mobile Activity Recognition", SOFT九州支部学術講演会, pp.47-50, 2017-12-02, Kagoshima.
学習フェーズでは、センサデータ等であるサンプルに教師ラベルが付与されること(Annotations)によって、教師データが作成される。教師データを作成する作業は、手間と時間が必要であるため、作成者への負担が大きい。このため、作成者は、ヒューマンエラー、集中力又はインセンティブ等の理由で、サンプルとは関連が低い教師ラベルをサンプルに付与してしまう場合がある。この場合、サンプルに基づいて人の行動を認識する機械学習の精度は、低下してしまう。
機械学習の精度を低下させないためには、機械学習の精度を向上させる教師データの教師ラベルを収集する必要がある。しかしながら、従来のラベル収集装置は、機械学習の精度を向上させる教師データの教師ラベルを収集することができない場合があった。
上記事情に鑑み、本発明は、機械学習の精度を向上させる教師データの教師ラベルを収集することを可能とするラベル収集装置、ラベル収集方法及びラベル収集プログラムを提供することを目的としている。
本発明の一態様は、機械学習に用いられる教師データの教師ラベルを取得する取得部と、取得された前記教師ラベルを含む前記教師データに基づいてモデルの機械学習を実行する学習処理部と、前記モデルの精度を検出する精度検出部と、前記精度を提示する提示処理部とを備え、前記取得部は、更新された前記教師データを取得する、ラベル収集装置である。
本発明の一態様は、機械学習に用いられる第1の教師データの第1の教師ラベルを取得する取得部と、取得された第1の教師ラベルとサンプルとを含む第1の教師データに基づいて第1のモデルの機械学習を実行する学習処理部と、前記第1のモデルの精度を検出する精度検出部と、前記精度を提示する提示処理部と、前記サンプルに対する行動ラベルとして正しい第2の教師ラベルを含む第2の教師データと第1の教師データとの類似度が所定の類似度閾値以下である場合に警告を出力する警告処理部とを備え、前記取得部は、更新された第1の教師データを取得する、ラベル収集装置である。
本発明の一態様は、上記のラベル収集装置であって、前記学習処理部は、前記サンプルに対する行動ラベルとして正しくない第3の教師ラベルを含む第3の教師データと、前記第2の教師ラベルを含む第2の教師データとに基づいて、第2のモデルの機械学習を実行し、前記警告処理部は、第1の教師データに対する前記第2のモデルの精度が所定の精度閾値以下である場合に警告を出力する。
本発明の一態様は、上記のラベル収集装置であって、前記サンプルは、センサデータであり、前記第1の教師ラベルは、人の行動を表すラベルである。
本発明の一態様は、機械学習に用いられる第1の教師データの第1の教師ラベルを取得するステップと、取得された第1の教師ラベルとサンプルとを含む第1の教師データに基づいて第1のモデルの機械学習を実行するステップと、前記第1のモデルの精度を検出するステップと、前記精度を提示するステップと、前記サンプルとの関連が低くない第2の教師ラベルを含む第2の教師データと第1の教師データとの類似度が所定の類似度閾値以下である場合に警告を出力するステップと更新された第1の教師データを取得するステップとを含むラベル収集方法である。
本発明の一態様は、コンピュータに、機械学習に用いられる第1の教師データの第1の教師ラベルを取得する手順と、取得された第1の教師ラベルとサンプルとを含む第1の教師データに基づいて第1のモデルの機械学習を実行する手順と、前記第1のモデルの精度を検出する手順と、前記精度を提示する手順と、前記サンプルとの関連が低くない第2の教師ラベルを含む第2の教師データと第1の教師データとの類似度が所定の類似度閾値以下である場合に警告を出力する手順と更新された第1の教師データを取得する手順とを実行させるためのラベル収集プログラムである。
本発明により、機械学習の精度を向上させる教師データの教師ラベルを収集することが可能である。
第1実施形態における、ラベル収集装置の構成の例を示す図である。 第1実施形態における、作成者による教師データの作成処理とラベル収集装置の動作との例を示すフローチャートである。 第2実施形態における、ラベル収集装置の構成の例を示す図である。 第2実施形態における、ラベル収集装置の動作の例を示すフローチャートである。 第3実施形態における、ラベル収集装置の構成の例を示す図である。 第3実施形態における、判定モデルの学習例を示すフローチャートである。 第3実施形態における、判定モデルの精度の判定例を示すフローチャートである。
本発明の実施形態について、図面を参照して詳細に説明する。
(第1実施形態)
図1は、ラベル収集装置1aの構成の例を示す図である。ラベル収集装置1aは、機械学習に用いられる教師データの教師ラベルを収集する情報処理装置であり、例えば、パーソナルコンピュータ、スマートフォン端末、タブレット端末等である。教師ラベルは、サンプルに対する行動ラベルであり、例えば人の行動を表すラベルである。
ラベル収集装置1aは、サンプルxの集合Xを入力データとして記憶している。以下では、集合のサンプルの数(要素数)は1以上である。サンプルxは、センサデータであり、例えば、画像データ、音声データ、加速度データ、温度データ、照度データである。画像データは、例えば、病室に取り付けられたカメラによって看護師が撮影されている動画像又は静止画像のデータである。画像のデータは、画像に含まれている文字の認識結果を含んでもよい。音声データは、例えば、勤務中の看護師が身につけているマイクによって収音された音声のデータである。加速度データは、例えば、勤務中の看護師が身につけている加速度センサによって検出された加速度のデータである。
1人以上の作成者は、サンプルの集合Xを構成するサンプルxに教師ラベル(分類クラス)を付与することによって、機械学習に用いられる教師データd(=(サンプルx,教師ラベルy))を作成する。dの添字iは、教師データに含まれているサンプルのインデックスを表す。
作成者は、ラベル収集装置1aから提示されたサンプルxを確認し、サンプルxに付与する教師ラベルyを決定する。例えば、作成者は、非系列データである静止画像データに、「犬」「猫」のような教師ラベルを付与することができる。例えば、作成者は、患者に投薬している看護師の姿が撮影されている静止画像データであるサンプルxに、教師ラベル「投薬」を付与することができる。作成者は、系列データである音声データに、[開始時刻,終了時刻,分類クラス]等の組形式の教師ラベルを付与することができる。作成者は、ラベル収集装置1aを操作することによって、サンプルxに付与される教師ラベルをラベル収集装置1aに記録する。
以下では、サンプルxは、一例として非系列データである。教師ラベルの集合Yは、一例として{y,…,y}の形式で表記される。
ラベル収集装置1aは、バス2と、入力装置3と、インタフェース4と、表示装置5と、記憶装置6と、メモリ7と、演算処理部8aとを備える。
バス2は、ラベル収集装置1aの各機能部の間におけるデータを転送する。
入力装置3は、キーボード、ポインティングデバイス(マウス、タブレット等)、ボタン、タッチパネル等の既存の入力装置を用いて構成される。入力装置3は、教師データの作成者によって操作される。
入力装置3は、無線通信装置でもよい。入力装置3は、例えば、センサによって生成された画像データ及び音声データ等のサンプルxを、無線通信によってインタフェース4に入力してもよい。
インタフェース4は、例えば、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)等のハードウェアを用いて実現される。インタフェース4は、入力装置3から入力されたサンプルxを、記憶装置6に記録する。インタフェース4は、サンプルxを演算処理部8aに出力してもよい。インタフェース4は、入力装置3から入力された教師ラベルyを、演算処理部8aに出力する。
表示装置5は、CRT(Cathode Ray Tube)ディスプレイ、液晶ディスプレイ、有機EL(Electro Luminescence)ディスプレイ等の画像表示装置である。表示装置5は、インタフェース4から取得された画像データを表示する。インタフェース4から取得される画像データは、例えば、サンプルxの画像データ、教師ラベルを表す文字列の画像データ、機械学習の推定モデルの精度を表す数値データである。
記憶装置6は、フラッシュメモリ、ハードディスクドライブ等の不揮発性の記録媒体(非一時的な記録媒体)である。記憶装置6は、プログラムを記憶する。プログラムは、例えば、クラウドサービスとしてラベル収集装置1aに提供される。プログラムは、サーバ装置から配信されるアプリケーションとして、ラベル収集装置1aに提供されてもよい。
記憶装置6は、入力装置3によってインタフェース4に入力された1以上のサンプルxを記憶する。記憶装置6は、入力装置3によってインタフェース4に入力された1以上の教師ラベルyを、サンプルxに対応付けて記憶する。記憶装置6は、サンプルxと教師ラベルyとが対応付けられたデータである1以上の教師データdを記憶する。
メモリ7は、RAM(Random Access Memory)等の揮発性の記録媒体である。メモリ7は、記憶装置6から展開されたプログラムを記憶する。メモリ7は、演算処理部8aによって生成された各種データを一時的に記憶する。
演算処理部8aは、CPU(Central Processing Unit)等のプロセッサを用いて構成される。演算処理部8aは、記憶装置6からメモリ7に展開されたプログラムを実行することによって、取得部80と、学習処理部81と、精度検出部82と、提示処理部83として機能する。
取得部80は、入力装置3によってインタフェース4に入力された教師ラベルyを取得する。取得部80は、表示装置5に表示されているサンプルxに教師ラベルyを対応付けることによって、教師データd(=(x,y))を生成する。取得部80は、生成された教師データdを記憶装置6に記録する。
取得部80は、教師データdの集合D(=(サンプルxの集合X,教師ラベルyの集合Y))を、教師データのデータセットとして記憶装置6から取得する。なお、取得部80は、他の作成者によって作成された教師データdの集合Dを、過去の教師データのデータセットとして更に取得してもよい。dの添字jは、教師データのサンプルのインデックスを表す。
学習処理部81は、取得部80によって取得された教師データdの集合Dに基づいて、推定モデルMの機械学習を実行する。学習処理部81は、過去の教師データに基づいて推定モデルMの機械学習を実行してもよい。
精度検出部82は、推定モデルMの精度を検出する。推定モデルMの精度は、確率で表現可能な値であり、例えば、推定モデルMの正解率、適合率又は再現率である。精度検出部82は、推定モデルMの精度を検出する代わりに、推定モデルMの出力変数の誤差を検出してもよい。
提示処理部83は、推定モデルMの精度を表す数値の画像を生成する。提示処理部83は、教師データに含まれている各サンプルを表す画像を生成してもよい。提示処理部83は、教師データに含まれている各教師ラベルを表す文字列等の画像を生成してもよい。提示処理部83は、生成された画像を表示装置5に出力する。
次に、動作例を説明する。
図2は、作成者による教師データの作成処理とラベル収集装置1aの動作との例を示すフローチャートである。
作成者は、サンプルxに教師ラベルyを付与することによって、教師データdの集合Dをラベル収集装置1aに入力する(ステップS101)。
取得部80は、教師データdの集合Dを取得する(ステップS201)。学習処理部81は、教師データdの集合Dに基づいて、推定モデルMの機械学習を実行する(ステップS202)。精度検出部82は、推定モデルMの精度を検出する(ステップS203)。提示処理部83は、推定モデルMの精度を表すを数値の画像等を、表示装置5に表示させる(ステップS204)。
提示処理部83は、ステップS204の処理を、例えばセンサが画像データ等を生成中にリアルタイムで実行する。提示処理部83は、ステップS204の処理を、センサが画像データ等を生成した日の後日における所定時刻に実行してもよい。
作成者は、追加の教師データの集合を作成する(ステップS102)。作成者は、推定モデルMの精度が第1の精度閾値を超えるように新規に取得された教師データDを学習処理部に入力するため、ステップS101の処理を再び行う。
以上のように、第1実施形態のラベル収集装置1aは、取得部80と、学習処理部81と、精度検出部82と、提示処理部83とを備える。取得部80は、機械学習に用いられる教師データdの教師ラベルyを取得する。学習処理部81は、取得された教師ラベルyとサンプルxとを含む教師データdに基づいて推定モデルMの機械学習を実行する。精度検出部82は、推定モデルMの精度を検出する。提示処理部83は、推定モデルMの精度を表示装置5に表示させることによって、推定モデルMの精度を作業者に提示する。取得部80は、更新された教師データdi+を取得する。
これによって、ラベル収集装置1aは、機械学習の精度を向上させる教師データの教師ラベルを収集することが可能である。更新された教師データの質は向上しているので、センサデータに基づいて行動を認識する教師あり機械学習の精度は向上する。ラベル収集装置1aは、推定モデルMの精度を表示装置5に表示させ,作成者が教師データの質を向上させる動機づけをするというゲーミフィケーション(Gamification)を実行することが可能である。
行動認識結果を業務履歴として記録する装置は、推定モデルMの出力変数をリアルタイムで記録することができる。行動認識結果を可視化する装置は、推定モデルMの出力変数をリアルタイムで可視化することができる。ユーザは、記録された行動認識結果に基づいて業務履歴を確認することができる。ユーザは、業務履歴に基づいて業務改善を行うことができる。
(第2実施形態)
第2実施形態では、サンプルに対する行動ラベルとして正しくない(サンプルとの関連が低い)教師ラベルを作成者がサンプルに付与するという不正行為(cheating)の有無をラベル収集装置が判定する点が、第1実施形態と相違する。第2実施形態では第1実施形態との相違点について説明する。
作成者は、教師データを作成する際に、サンプルとの関連が低い教師ラベルを作成者がサンプルに付与するという不正行為を行う可能性がある。例えば、作成者は、座って書類を作成している看護師の姿が撮影されている静止画像データであるサンプルに、教師ラベル「書類作成」ではなく、教師ラベル「投薬」を付与することができる。
第2実施形態のラベル収集装置は、第1の作成者によって作成された第1教師データと、不正行為を行っていない1人以上の第2の作成者によって作成された第2教師データとの類似度に基づいて、第1の作成者が第1教師データを作成した際の不正行為の有無を判定する。
図3は、ラベル収集装置1bの構成の例を示す図である。ラベル収集装置1bは、バス2と、入力装置3と、インタフェース4と、表示装置5と、記憶装置6と、メモリ7と、演算処理部8bとを備える。演算処理部8bは、記憶装置6からメモリ7に展開されたプログラムを実行することによって、取得部80と、学習処理部81と、精度検出部82と、提示処理部83と、特徴量処理部84と、集合データ生成部85と、警告処理部86として機能する。
取得部80は、第1サンプルxの集合Xを、記憶装置6から取得する。取得部80は、第1の作成者によって第1サンプルxに付与された第1教師ラベルyの集合Yを、記憶装置6から取得する。
取得部80は、第2サンプルの集合X’を、記憶装置6から取得する。取得部80は、不正行為を行っていない1人以上の第2の作成者によって第2サンプルx’に付与された第2教師ラベルy’の集合Y’を、記憶装置6から取得する。第2教師ラベルy’は、サンプルに対する行動ラベルとして正しい教師ラベル(以下「正当ラベル」という。)である。サンプルとの関連が低い教師ラベルであるか否かは、例えば、所定の基準に基づいて予め定められる。
特徴量処理部84は、第1サンプルxの集合Xの統計量に基づく特徴量(以下「第1特徴量」という。)を算出する。第1特徴量は、例えば、第1サンプルxが画像データである場合、第1サンプルxの画像特徴量である。
特徴量処理部84は、第2サンプルx’の集合X’の統計量に基づく特徴量(以下「第2特徴量」という。)を算出する。第2特徴量は、例えば、第2サンプルx’が画像データである場合、第2サンプルx’の画像特徴量である。
集合データ生成部85は、第1サンプルxの集合Xと第1教師ラベルyの集合Yとを結合することによって、第1教師データdの集合D(={(x,y),…})を生成する。集合データ生成部85は、第2サンプルxの集合X’と第2教師ラベルyの集合Y’とを結合することによって、第2教師データdの集合D’(={(x’,y’),…})を生成する。
警告処理部86は、第1教師データの集合Dと第2教師データの集合D’との類似度G(i=1,2,…)を、例えば第1特徴量V及び第2特徴量V’に基づいて、閾値法又は異常検出法によって算出する。なお、これらの方法は一例である。
(閾値法)
警告処理部86は、例えば第1教師データdから第2教師データd(j=1,2,…)までの各距離の平均値hを、類似度Gとして算出する。距離とは、第1特徴量V及び第1教師データを組にしたベクトルと、第2特徴量V’及び第2教師データを組にしたベクトルとの間の距離である。各距離の平均値hが閾値以上である場合、類似度Gは1である。各距離の平均値hが閾値未満である場合、類似度Gは0である。
(異常検出法)
警告処理部86は、第2教師データd(j=1,2,…)に対する第1教師データdの異常度の逆数(正常度)を、類似度Gとして算出してもよい。異常度は、第1教師データd及び第2教師データdの間の距離、すなわち、第1教師データから得られる第1特徴量Vと第2教師データから得られる第2特徴量V’との差分の絶対値でもよい。又は、異常度は、第1データから得られる第1特徴量Vと第2教師データから得られる第2特徴量V’とのユークリッド距離でもよい。異常度には、上限が設けられてもよい。
警告処理部86は、類似度G(i=1,2,…)の平均値Hを算出する。警告処理部86は、類似度Gの平均値Hが類似度閾値を超えているか否かを判定する。類似度閾値は、類似度Gが1又は0である場合、例えば0.5である。
提示処理部83は、類似度Gの平均値Hを表示装置5に出力する。提示処理部83は、類似度Gの平均値Hが類似度閾値以下であると判定された場合、第1教師データdの作成に関して不正行為が行われた可能性が高い旨の警告を、表示装置5に出力する。
次に、ラベル収集装置1bの動作の例を説明する。
図4は、ラベル収集装置1bの動作の例を示すフローチャートである。取得部80は、第1サンプルxの集合Xと、第1教師ラベルyの集合Yとを取得する(ステップS301)。取得部80は、第2サンプルの集合X’と、第2教師ラベルy’の集合Y’とを取得する(ステップS302)。
特徴量処理部84は、第1サンプルxの集合Xに基づいて、第1特徴量Vを算出する(ステップS303)。特徴量処理部84は、第2サンプルx’の集合X’に基づいて、第2特徴量V’を算出する(ステップS304)。
集合データ生成部85は、第1教師データdの集合Dを生成する(ステップS305)。集合データ生成部85は、第2教師データdの集合D’を生成する(ステップS306)。
警告処理部86は、第1特徴量及び第1教師データを組みにしたベクトルの集合と、第2特徴量及び第2教師データを組みにしたベクトルの集合との類似度Gの平均値Hを算出する(ステップS307)。提示処理部83は、類似度Gの平均値Hを表示装置5に出力する(ステップS308)。
警告処理部86は、類似度Gの平均値Hが類似度閾値を超えているか否かを判定する(ステップS309)。類似度Gの平均値Hが類似度閾値を超えていると判定された場合(ステップS309:YES)、ラベル収集装置1bは、図4に示されたフローチャートの処理を終了する。類似度Gの平均値Hが類似度閾値以下であると判定された場合(ステップS309:NO)、提示処理部83は、警告を表示装置5に出力する(ステップS310)。
以上のように、第2実施形態のラベル収集装置1bは、取得部80と、学習処理部81と、精度検出部82と、提示処理部83と、警告処理部86とを備える。取得部80は、機械学習に用いられる第1の教師データdの第1の教師ラベルyを取得する。学習処理部81は、取得された第1の教師ラベルyとサンプルxとを含む第1の教師データdに基づいて、推定モデルMの機械学習を実行する。精度検出部82は、推定モデルMの精度を検出する。提示処理部83は、推定モデルMの精度を表示装置5に表示させることによって、推定モデルMの精度を作業者に提示する。警告処理部86は、サンプルとの関連が低くない第2の教師ラベル(正当ラベル)を含む第2の教師データdと第1の教師データdとの類似度が所定の類似度閾値以下である場合に警告を出力する。さらに、取得部80は、更新された第1の教師データdを取得する。
これによって、第2実施形態のラベル収集装置1bは、作成者によって作成された教師データの集合と他の作成者によって作成された教師データの集合との類似度を、ユーザに提示することを可能とする。また、ラベル収集装置1bは、第2の教師データdと第1の教師データdとの類似度が所定の類似度閾値以下である場合に、警告を出力することが可能である。
(第3実施形態)
第3実施形態では、機械学習が実行された判定モデルを用いて不正行為の有無をラベル収集装置が判定する点が、第2実施形態と相違する。第3実施形態では第2実施形態との相違点について説明する。
図5は、ラベル収集装置1cの構成の例を示す図である。ラベル収集装置1cは、バス2と、入力装置3と、インタフェース4と、表示装置5と、記憶装置6と、メモリ7と、演算処理部8cとを備える。演算処理部8bは、記憶装置6からメモリ7に展開されたプログラムを実行することによって、取得部80と、学習処理部81と、精度検出部82と、提示処理部83と、特徴量処理部84と、集合データ生成部85と、警告処理部86と、ラベル処理部87と、学習データ生成部88と、不正判定学習処理部89として機能する。
取得部80は、第1サンプルxの集合Xと、第1の作成者によって第1サンプルxに付与された第1教師ラベルyの集合Yとを取得する。取得部80は、第2サンプルの集合X’と、不正行為を行っていない1人以上の第2の作成者によって第2サンプルx’に付与された第2教師ラベルy’の集合Y’とを取得する。取得部80は、第3サンプルの集合X’’と、意図的に不正行為を行った1人以上の第3の作成者によって第3サンプルx’’に付与された第3教師ラベルy’’の集合Y’’とを取得する。x’’の添字kは、第3サンプルのインデックスを表す。
集合データ生成部85は、第1サンプルxの集合Xと第1教師ラベルyの集合Yとを結合することによって、第1教師データdの集合D(={(x,y),…})を生成する。集合データ生成部85は、第2サンプルxの集合X’と第2教師ラベルyの集合Y’とを結合することによって、第2教師データdの集合D’(={(x’,y’),…})を生成する。集合データ生成部85は、第3サンプルxの集合X’’と第3教師ラベルyの集合Y’’とを結合することによって、第3教師データdの集合D’’(={(x’’,y’’),…})を生成する。
ラベル処理部87は、正当ラベルを第2教師データの集合D’に含める。例えば、ラベル処理部87は、第2教師データd’の構成(第2サンプルx’,第2教師ラベルy’)を、(第2サンプルx’,第2教師ラベルy’,正当ラベルr’)という構成に更新する。
ラベル処理部87は、サンプルに対する行動ラベルとして正しくない教師ラベル(以下「不正ラベル」という。)を、第3教師データの集合D’’に含める。例えば、ラベル処理部87は、第3教師データd’’の構成(第3サンプルx’’,第3教師ラベルy’’)を、(第3サンプルx’’,第3教師ラベルy’’,不正ラベルr’’)という構成に更新する。
学習データ生成部88は、第2教師データの集合D’と第3教師データの集合D’’とに基づいて、判定モデルFの機械学習に用いられるデータである学習データを生成する。判定モデルFは、機械学習のモデルであり、不正行為の有無を判定するために用いられるモデルである。
学習フェーズにおいて、不正判定学習処理部89は、生成された学習データを判定モデルFの入力変数及び出力変数とすることによって、判定モデルFの機械学習を実行する。不正判定学習処理部89は、機械学習が実行された判定モデルFを、記憶装置6に記録する。
学習フェーズよりも後の判定フェーズにおいて、不正判定学習処理部89は、第1教師データdを判定モデルFの入力変数として、判定モデルFの出力P(=F(d))を、第1教師データの集合Dについて検出する。正当ラベル及び不正ラベルが2値で表現されている場合、正当ラベルであることを表す出力Pは0であり、不当ラベルであることを表す出力変数Pは1である。なお、出力Pは、0から1までの確率で表現されてもよい。
判定フェーズにおいて、警告処理部86は、出力P(i=1,2,…)の平均値を、判定モデルFの精度の平均値H’として算出する。警告処理部86は、判定モデルFの精度の平均値H’が第2の精度閾値を超えているか否かを判定する。第2の精度閾値は、出力Pが1又は0である場合、例えば0.5である。判定モデルFの精度は、確率で表現可能な値であり、例えば、判定モデルFの正解率、適合率又は再現率である。
提示処理部83は、判定モデルFの精度の平均値H’を表示装置5に出力する。提示処理部83は、判定モデルFの精度の平均値H’が第2の精度閾値以下であると判定された場合、警告を表示装置5に出力する。
次に、ラベル収集装置1cの動作の例を説明する。
図6は、判定モデルFの学習例(学習フェーズ)を示すフローチャートである。取得部80は、第1サンプルxの集合Xと第1教師ラベルyの集合Yとを取得する(ステップS401)。取得部80は、第2サンプルの集合X’と第2教師ラベルy’の集合Y’とを取得する(ステップS402)。取得部80は、第3サンプルの集合X’’と第3教師ラベルy’’の集合Y’’とを取得する(ステップS403)。
集合データ生成部85は、第1教師データdの集合Dを生成する(ステップS404)。集合データ生成部85は、第2教師データdの集合D’を生成する(ステップS405)。集合データ生成部85は、第3教師データdの集合D’’を生成する(ステップS406)。
ラベル処理部87は、正当ラベルを第2教師データの集合D’に含める(ステップS407)。ラベル処理部87は、不正ラベルを第3教師データの集合D’’に含める(ステップS408)。
学習データ生成部88は、第2教師データの集合D’と第3教師データの集合D’’とに基づいて、学習データを生成する(ステップS409)。不正判定学習処理部89は、判定モデルFの機械学習を実行する(ステップS410)。不正判定学習処理部89は、機械学習が実行された判定モデルFを、記憶装置6に記録する(ステップS411)。
図7は、判定モデルFの精度の判定例(判定フェーズ)を示すフローチャートである。不正判定学習処理部89は、第1サンプルの集合Xを、入力変数として判定モデルFに入力する(ステップS501)。警告処理部86は、出力Pの平均値(判定モデルFの出力)を、判定モデルFの精度の平均値H’として算出する(ステップS502)。提示処理部83は、判定モデルFの精度の平均値H’を表示装置5に出力する(ステップS503)。
警告処理部86は、判定モデルFの精度の平均値H’が第2の精度閾値を超えているか否かを判定する(ステップS504)。判定モデルFの精度の平均値H’が第2の精度閾値を超えていると判定された場合(ステップS504:YES)、ラベル収集装置1cは、図7に示されたフローチャートの処理を終了する。判定モデルFの精度の平均値H’が第2の精度閾値以下であると判定された場合(ステップS504:NO)、提示処理部83は、警告を表示装置5に出力する(ステップS505)。
以上のように、第3実施形態のラベル収集装置1cは、学習処理部81と、警告処理部86とを備える。学習処理部81は、サンプルとの関連が低い第3の教師ラベル(不正ラベル)を含む第3の教師データdと第2の教師データdとに基づいて、判定モデルFの機械学習を実行する。警告処理部86は、第1の教師データdに対する判定モデルFの精度が所定の第2の精度閾値以下である場合に警告を出力する。
これによって、第3実施形態のラベル収集装置1cは、作成者が教師データを作成した際の不正行為の有無を、判定モデルFを用いて作成者ごとに判定することができる。ラベル収集装置1cは、1個の第1サンプルxと1個の教師ラベルyとから第1教師データdが構成されている場合、1個の第1サンプルxが不正行為によって作成されたサンプルであるか否かを判定することができる。
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
本発明は、教師データの教師ラベルを収集する情報処理装置に適用可能である。
1a,1b,1c…ラベル収集装置、2…バス、3…入力装置、4…インタフェース、5…表示装置、6…記憶装置、7…メモリ、8a,8b,8c…演算処理部、80…取得部、81…学習処理部、82…精度検出部、83…提示処理部、84…特徴量処理部、85…集合データ生成部、86…警告処理部、87…ラベル処理部、88…学習データ生成部、89…不正判定学習処理部

Claims (6)

  1. 機械学習に用いられる教師データの教師ラベルを取得する取得部と、
    取得された前記教師ラベルを含む前記教師データに基づいてモデルの機械学習を実行する学習処理部と、
    前記モデルの精度を検出する精度検出部と、
    前記精度を提示する提示処理部と
    を備え、
    前記取得部は、更新された前記教師データを取得する、
    ラベル収集装置。
  2. 機械学習に用いられる第1の教師データの第1の教師ラベルを取得する取得部と、
    取得された第1の教師ラベルとサンプルとを含む第1の教師データに基づいて第1のモデルの機械学習を実行する学習処理部と、
    前記第1のモデルの精度を検出する精度検出部と、
    前記精度を提示する提示処理部と、
    前記サンプルに対する行動ラベルとして正しい第2の教師ラベルを含む第2の教師データと第1の教師データとの類似度が所定の類似度閾値以下である場合に警告を出力する警告処理部と
    を備え、
    前記取得部は、更新された第1の教師データを取得する、
    ラベル収集装置。
  3. 前記学習処理部は、前記サンプルに対する行動ラベルとして正しくない第3の教師ラベルを含む第3の教師データと、前記第2の教師ラベルを含む第2の教師データとに基づいて、第2のモデルの機械学習を実行し、
    前記警告処理部は、第1の教師データに対する前記第2のモデルの精度が所定の精度閾値以下である場合に警告を出力する、
    請求項2に記載のラベル収集装置。
  4. 前記サンプルは、センサデータであり、
    前記第1の教師ラベルは、人の行動を表すラベルである、
    請求項2又は請求項3に記載のラベル収集装置。
  5. 機械学習に用いられる第1の教師データの第1の教師ラベルを取得するステップと、
    取得された第1の教師ラベルとサンプルとを含む第1の教師データに基づいて第1のモデルの機械学習を実行するステップと、
    前記第1のモデルの精度を検出するステップと、
    前記精度を提示するステップと、
    前記サンプルとの関連が低くない第2の教師ラベルを含む第2の教師データと第1の教師データとの類似度が所定の類似度閾値以下である場合に警告を出力するステップと
    更新された第1の教師データを取得するステップと
    を含むラベル収集方法。
  6. コンピュータに、
    機械学習に用いられる第1の教師データの第1の教師ラベルを取得する手順と、
    取得された第1の教師ラベルとサンプルとを含む第1の教師データに基づいて第1のモデルの機械学習を実行する手順と、
    前記第1のモデルの精度を検出する手順と、
    前記精度を提示する手順と、
    前記サンプルとの関連が低くない第2の教師ラベルを含む第2の教師データと第1の教師データとの類似度が所定の類似度閾値以下である場合に警告を出力する手順と
    更新された第1の教師データを取得する手順と
    を実行させるためのラベル収集プログラム。
JP2020502890A 2018-02-27 2019-02-04 ラベル収集装置、ラベル収集方法及びラベル収集プログラム Active JP7320280B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2018033655 2018-02-27
JP2018033655 2018-02-27
PCT/JP2019/003818 WO2019167556A1 (ja) 2018-02-27 2019-02-04 ラベル収集装置、ラベル収集方法及びラベル収集プログラム

Publications (2)

Publication Number Publication Date
JPWO2019167556A1 true JPWO2019167556A1 (ja) 2021-02-04
JP7320280B2 JP7320280B2 (ja) 2023-08-03

Family

ID=67806121

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020502890A Active JP7320280B2 (ja) 2018-02-27 2019-02-04 ラベル収集装置、ラベル収集方法及びラベル収集プログラム

Country Status (4)

Country Link
US (1) US20210279637A1 (ja)
JP (1) JP7320280B2 (ja)
CN (1) CN111712841A (ja)
WO (1) WO2019167556A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7381301B2 (ja) * 2019-11-14 2023-11-15 日本光電工業株式会社 学習済みモデルの生成方法、学習済みモデルの生成システム、推論装置、およびコンピュータプログラム
JPWO2022185360A1 (ja) * 2021-03-01 2022-09-09
CN113805931B (zh) * 2021-09-17 2023-07-28 杭州云深科技有限公司 一种确定app标签的方法、电子设备及可读存储介质
US11874798B2 (en) * 2021-09-27 2024-01-16 Sap Se Smart dataset collection system

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015230570A (ja) * 2014-06-04 2015-12-21 日本電信電話株式会社 学習モデル作成装置、判定システムおよび学習モデル作成方法
JP2018013857A (ja) * 2016-07-19 2018-01-25 富士通株式会社 センサデータ学習方法、センサデータ学習プログラム、及びセンサデータ学習装置
JP2018106662A (ja) * 2016-12-22 2018-07-05 キヤノン株式会社 情報処理装置、情報処理方法、プログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8010357B2 (en) * 2004-03-02 2011-08-30 At&T Intellectual Property Ii, L.P. Combining active and semi-supervised learning for spoken language understanding
US20110112995A1 (en) * 2009-10-28 2011-05-12 Industrial Technology Research Institute Systems and methods for organizing collective social intelligence information using an organic object data model
CN104408469A (zh) * 2014-11-28 2015-03-11 武汉大学 基于图像深度学习的烟火识别方法及系统
US10949770B2 (en) * 2016-01-28 2021-03-16 Shutterstock, Inc. Identification of synthetic examples for improving search rankings

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015230570A (ja) * 2014-06-04 2015-12-21 日本電信電話株式会社 学習モデル作成装置、判定システムおよび学習モデル作成方法
JP2018013857A (ja) * 2016-07-19 2018-01-25 富士通株式会社 センサデータ学習方法、センサデータ学習プログラム、及びセンサデータ学習装置
JP2018106662A (ja) * 2016-12-22 2018-07-05 キヤノン株式会社 情報処理装置、情報処理方法、プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
井上創造 ほか: "介護施設における介護スタッフの行動センシング実験", 情報処理学会 研究報告, vol. 2017-CDS-19,第13号, JPN6019014624, 18 May 2017 (2017-05-18), JP, pages 1 - 8, ISSN: 0004995374 *

Also Published As

Publication number Publication date
WO2019167556A1 (ja) 2019-09-06
US20210279637A1 (en) 2021-09-09
CN111712841A (zh) 2020-09-25
JP7320280B2 (ja) 2023-08-03

Similar Documents

Publication Publication Date Title
JPWO2019167556A1 (ja) ラベル収集装置、ラベル収集方法及びラベル収集プログラム
CN109791600B (zh) 将横屏视频转换为竖屏移动布局的方法
US11610148B2 (en) Information processing device and information processing method
TWI832966B (zh) 用於使用多模態成像和集成機器學習模型的自動靶標和組織分割的方法和設備
US20190313963A1 (en) Dental Image Feature Detection
JP5875285B2 (ja) 医療診断支援装置、情報処理方法及びプログラム
CN109754389B (zh) 一种图像处理方法、装置及设备
US10664567B2 (en) Extraction of information from an image and inclusion thereof in a clinical report
US11900266B2 (en) Database systems and interactive user interfaces for dynamic conversational interactions
US9361580B2 (en) Medical diagnosis support apparatus and method of controlling the same
US20230125321A1 (en) User-guided structured document modeling
US11594327B2 (en) Information processing apparatus, information processing method, and recording medium
JP6448588B2 (ja) 医療診断支援装置、医療診断支援システム、情報処理方法及びプログラム
CN109871866B (zh) 用于医院内感染预测的模型训练方法、装置、设备及介质
JP2021111299A (ja) 学習装置、学習方法、学習プログラム、識別装置、識別方法および識別プログラム
JP2007058625A (ja) 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
JP6316325B2 (ja) 情報処理装置、情報処理装置の作動方法及び情報処理システム
US11068716B2 (en) Information processing method and information processing system
EP4088645A1 (en) Endoscopy assistance device, endoscopy assistance method, and computer-readable recording medium
JP3985826B2 (ja) 画像検索方法及びその装置
US9679498B2 (en) Method and apparatus for providing a presentation model for an exercise
WO2023188160A1 (ja) 入力支援装置、入力支援方法、及び非一時的なコンピュータ可読媒体
EP4096209A1 (en) Information processing device, information processing method, and information processing program
JP6985132B2 (ja) 施設特定装置及びそのプログラム
CN112488284A (zh) 模型训练方法、人物图像补全方法、装置及电子设备

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20200709

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20200709

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230306

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230704

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230714

R150 Certificate of patent or registration of utility model

Ref document number: 7320280

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150