JP2018106662A - 情報処理装置、情報処理方法、プログラム - Google Patents

情報処理装置、情報処理方法、プログラム Download PDF

Info

Publication number
JP2018106662A
JP2018106662A JP2017134662A JP2017134662A JP2018106662A JP 2018106662 A JP2018106662 A JP 2018106662A JP 2017134662 A JP2017134662 A JP 2017134662A JP 2017134662 A JP2017134662 A JP 2017134662A JP 2018106662 A JP2018106662 A JP 2018106662A
Authority
JP
Japan
Prior art keywords
label
learning data
data
labeling
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017134662A
Other languages
English (en)
Other versions
JP6946081B2 (ja
Inventor
智昭 肥後
Tomoaki Higo
智昭 肥後
鈴木 雅博
Masahiro Suzuki
雅博 鈴木
山田 貴之
Takayuki Yamada
貴之 山田
正樹 稲葉
Masaki Inaba
正樹 稲葉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of JP2018106662A publication Critical patent/JP2018106662A/ja
Application granted granted Critical
Publication of JP6946081B2 publication Critical patent/JP6946081B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9017Indexing; Data structures therefor; Storage structures using directory or table look-up
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

【課題】学習データに誤ったラベルを付与されたとしても、ラベルを適切に決定する。
【解決手段】情報処理装置10000は、複数の学習データそれぞれに対して、学習データに対して付与されたラベルと前記ラベルに対応する属性情報とを対応付けて複数記憶する記憶手段101と、前記複数の学習データのうちの着目学習データについて、該着目学習データに対応する複数のラベルと該ラベルに対応する前記属性情報とに基づいて、前記着目学習データに対するラベルを決定するラベル決定手段112とを備える。
【選択図】図1

Description

データにラベルを付与するラベリング技術に関する
教師ありの機械学習によってデータ群から予測モデルを構築して、クエリデータに対する予測を求める技術は、物体認識等の様々な分野で用いられている。教師あり学習ではクエリデータと一緒に出力結果として期待されるラベルを付与するために、事前に学習データにラベル付けを行う作業が発生する。一般的に、正しいラベルが付与されたラベル付き学習データの数が多くなるほど予測モデルの精度は向上する。そのため、従来から多くの人手をかけて学習データにラベルを付ける方法や、ラベル付けを自動で行う方法が提案されている。
特許文献1には学習データ間の複数の特徴における距離のランキングを求めることで自動的にラベル付けを行う方法が開示されている。
特開2016−62544号公報
しかしながら、多くの人手による方法では人ごとにばらつきがあるため、誤ったラベルが付けられる可能性がある。また、特許文献1の手法では、自動で行われたラベル付けの結果を信用するしかなく、ラベル付けに誤りが生じてしまった場合への対応が考慮されていない。
本発明は上記問題に鑑みてなされたものであり、学習データに誤ったラベルを付与された場合にも、ラベルを適切に決定することを目的とする。
本発明の情報処理装置は、例えば複数の学習データそれぞれに対して、学習データに対して付与されたラベルと前記ラベルに対応する属性情報とを対応付けて複数記憶する記憶手段と、前記複数の学習データのうちの着目学習データについて、該着目学習データに対応する複数のラベルと該ラベルに対応する前記属性情報とに基づいて、前記着目学習データに対するラベルを決定するラベル決定手段とを備える。
学習データに誤ったラベルを付与されたとしても、ラベルを適切に決定することができる。
第1の実施形態に係るラベル付けシステムの構成例を示すブロック図。 管理されるデータ、ラベル、属性情報の対応関係の例。 単調増加関数f(x)の例。 領域指定タイプのラベル決定の例。 バウンディングボックスに対する処理の例。 ラベル付けを行う処理を示すフローチャート。 ラベルを決定する処理を示すフローチャート。 第2の実施形態に係るラベル付け確認システムの構成例を示すブロック図。 タッチパネル式ディスプレイにおける記号指定タイプのラベル編集の表示例。 タッチパネル式ディスプレイにおける領域指定タイプのラベル編集の表示例。 ラベル付け確認システムを用いてラベルの付与や確認を行う典型的な流れを示すフローチャート。 第3の実施形態にかかるクラウドソーシングによるラベル付けシステムの構成例を示すブロック図。 クラウドソーシングによるラベル付けの流れを示すフローチャート。 第4の実施形態にかかるクラウドソーシングによる学習認識システムの構成例を示すブロック図。 クラウドソーシングによる学習認識の流れを示すフローチャート。 第5の実施形態にかかるラベラー評価システムの構成例を示すブロック図。 ラベラー評価システムを用いたラベラー評価の流れを示すフローチャート。 本願発明のかかる情報処理装置のハードウェア構成例を示す図。 マスクオブジェクトによって位置を指定する例を示す図。
まず、本発明の各実施形態の詳細について説明する前に、各実施形態の情報装置のハードウェア構成について、図18を参照して説明する。同図において、CPU1810は、バス1800を介して接続する各デバイスを統括的に制御する。CPU1810は、読み出し専用メモリ(ROM)1820に記憶された処理ステップやプログラムを読み出して実行する。オペレーティングシステム(OS)をはじめ、本実施形態に係る各処理プログラム、デバイスドライバ等はROM1820に記憶されており、ランダムアクセスメモリ(RAM)1830に一時記憶され、CPU1810によって適宜実行される。また、入力I/F1840は、外部の装置(撮像装置など)から情報処理装置で処理可能な形式で入力信号として入力する。また、出力I/F1850は、外部装置に、該外部装置が処理可能な形式で、本願発明の情報処理装置による処理結果を出力信号として出力する。
(第1の実施形態)
第1の実施形態の情報処理装置10000は、各学習データに対して人またはアルゴリズムがラベル付けを行った結果と、属性情報としてラベラーの信頼度や各ラベラーによるラベル付けの自信度とを対応付けておく記憶しておく。そして、着目した学習画像に対して付けられたラベルとその信頼度とに基づいて、尤もらしいラベル決定する。なお、ラベル付けを行う人またはアルゴリズムを適宜ラベラーと称する。
図1は、第1の実施形態に係るラベル付け装置1の構成例を示すブロック図である。
学習データ記憶部100は学習データの集合を記憶する(複数記憶)。学習データは例えば画像であり、各画像にはラベル付けの対象となる被写体が写っている。被写体は、例えば、人間、犬、猫、車、建物等である。学習データは識別器を作成することに用いられる。例えば、学習データが被写体として人物や犬、猫等が映った画像であり、ラベルとしてその被写体を表す情報が正しく付けられれば、その学習データを用いて機械学習を行うことで、被写体が未知の画像データの被写体を識別する識別器を生成することができる。本実施形態では、学習データを画像を例として説明するので、学習画像と称する場合がある。
ラベル・属性情報記憶部101は、各学習データに対してラベラーによってラベル付けがされた結果とそれらに付随する属性情報の集合を記憶する。ラベル付けを行った結果とは、機械学習の教師信号として用いるものであり、例えば猫の画像に対してラベラーが付ける「猫」というラベルのことである。一方、属性情報には、付与されたラベルに対応するラベル属性情報と、ラベルを付与したラベラーに対応するラベラー属性情報と、学習データの属性としてデータ属性情報とが含まれる。ラベル属性情報は、ラベラーを示すIDやラベラーがラベル付けを行った日時、ラベラーが正しくラベル付けを行えた度合いを表す自信度である。ラベラーが人の場合、人が画像ファイル中の被写体が例えば猫であると確信した時には自信度として高い値を付け、被写体が猫か犬か迷った時には自信度として低い値を付ける。自信度の値は例えば、0〜1の間の実数とするが、これには限られない。ラベラーがアルゴリズム(識別器)の場合、例えば画像ファイルに対して猫識別器を用いて被写体が猫であるかどうかを判定する際に、猫らしさを表す尤度を自信度として用いれば良い。
ラベラー属性情報とは、ラベラーに対する信頼度である。信頼度とはラベラーが付与したラベルが正しいと考えられる期待値である。例えば、どの画像ファイルにもいつも正しいラベル付けを行っているラベラーの信頼度は高く、逆に、誤ったラベル付けの割合が多いラベラーの信頼度は低くなる。データ属性情報とは、学習データに固有の情報であり、例えば、画像データを撮影した日時や、撮影パラメータ、後に説明するラベル付け方法、決定ラベル、確定度等である。
ラベル属性情報管理部110は、学習データ100とラベル・属性情報101の対応関係を管理して記憶する。データはテーブルとして図示しないメモリに記憶される。図2に、管理されるデータ、ラベル、属性情報の対応関係の例を示す。学習データ群の各学習データに対して、各データに対応するデータ属性情報と、複数のラベルを対応付ける。データ属性情報の例としては、データを取得した日時や撮影したカメラのパラメータ情報、ラベル付け方法の種類などである。ラベルの例としては、学習データ1の画像ファイルに対して、ラベル1aとして「猫」、ラベル1bとして「犬」、ラベル1cとして「猫」といったラベルが複数対応づけられる。また各ラベルには上述したラベル属性情報が対応して付与される。ラベルを複数対応付けることによって、後述する方法で多数決のようにしてラベルを決定する。その結果、偶発的なラベル誤りや、悪意のあるラベラーによるラベル誤りの影響を減らすことができる。ラベル属性情報管理部110は、学習データに付与されるラベルとその属性情報を受け取る度に、このような形式で学習データ100とラベル・属性情報101を対応付けていく。
リクエスト受信部111は、外部から学習データに対応するラベルを参照したいという要求を受け付けると、ラベル属性情報管理部110に問い合わせを行う。そして、指定された学習データ(着目学習データ)に対応するラベルと属性情報をラベル決定部112に受け渡す。指定される学習データは1つずつであっても、複数まとめてであってもよい。
ラベル決定部112は、ラベル属性情報管理部110から受け取った学習データに対応するラベルと属性情報に基づいて、尤もらしいラベルを求める。以下ではラベルを決定する方法について詳しく説明する。
まず、リクエスト受信部111が受け付けた学習データに対応するラベルが一つも存在しない場合には、ラベルが不明である旨を返す。または、予め候補となるラベル候補が分かっていれば、ランダムにラベル候補の中から選んで返してもよい。指定された学習データに対応するラベルが複数存在する場合には、それらのラベル候補の中からスコアリングによって決定ラベルを選び出す。学習データに対してn個のラベルが存在し、i番目(i=1、…、n)のラベルをL(i)とする。また、L(i)の中で互いに異なるラベルはI_1、…、I_mのm種類であるとすると、m個のラベル候補の中からスコアが最大となるラベル候補を決定ラベルとして返せばよい。スコアリングの計算方法(評価)について説明する。ラベル付けに対する自信度をC(i)、対応するラベラーをA(i)とし、ラベラーの信頼度はR(A(i))で表すものとする。各ラベル候補のスコアS(j)(j=1、…、m)は次式で計算(導出)される。
Figure 2018106662

ここで、f(x)はxに対して単調増加となる関数であり、例として図3のように様々なf(x)を取りうる。fを調整することによって、ラベラーの信頼度が一定値以下のラベルにはスコアを与えないことや、ラベル付けに対する自信度が極めて高いラベルに大きく依存させる等の条件を変えることができる。例えばf_1(x)=f_2(x)=xである。そして、各ラベル候補I_jに対してスコアS(j)を求め、S(j)が最大値となる時のラベルI_jを決定ラベルとすればよい。このようにS(j)の最大値を選ぶことによって、より信頼度の高いラベラーやより高い自信度のラベルやより多くの同じラベルを得たものが決定ラベルに選ばれる。よって、自信度が低く誤ったラベルである可能性が高いラベルの影響を減らしたり、悪意のあるラベラーが誤ったラベルを付与したとしても悪意のあるラベラーの信頼度は低くなるため、ラベルの決定に及ぼす悪い影響を減らしたりすることができる。また式(1)では自信度C(i)と信頼度R(A(i))を属性情報から得られるものとして説明したが、自信度の付け方については、本実施形態で先に述べた方法を用いればよい。また、信頼度の評価(信頼度導出)については、例えば過去に決定されたラベルと同じラベルを付けていたかの割合をラベラーごとに算出しその値を信頼度としてもよい。また、予め正しいラベルがわかっている複数のデータに対してラベラーにラベルを付けさせその正解率を信頼度としてもよい。また、自信度と信頼度のどちらか一方または両方を一定値として計算してもよい。
ただし、L(i)の中に異なるラベルが存在しない(m=1)場合には、スコアリングを行う必要は無く、全てのiに対して共通のラベルL(i)=I_1を決定ラベルとすればよい。
ここでは、ラベルとして何らかの名称や良し悪しなどを指定する「記号指定タイプ」のラベル付けの場合について説明したが、本実施形態の適用範囲はこれに限るものではない。例えば、画像内に写っている被写体の中で、顔領域をバウンディングボックスで囲むラベル付けや、画像内に写っている道路領域を塗りつぶすラベル付けのような、「領域指定タイプ」のラベル付けの場合にも適用可能である。具体的には以下の方法でラベルを決定することができる。
領域指定タイプのラベル付けの場合は、ある学習データ画像について、ピクセルごとに独立した学習データ(ピクセル学習データ)としてTrueまたはFalse(ピクセルラベル)を指定する。例えば、画像内における人物領域の検出を行う場合には、人物が写っている領域のピクセルをTrue、それ以外の領域をFalseと指定するラベル付けが考えられる。領域を指定する方法としては、例えば、画像上で対象とする人物を囲うような長方形領域を指定するバウンディングボックスや、対象とする人物領域の画素を塗りつぶす方法がある。このような方法でラベル付けされた学習データ画像群から、ラベルを決定する際には、ピクセルごとに式(1)によってピクセルラベルを決定する。図4に領域指定タイプのラベル決定の例を示す。図4の10〜17はラベル付けをした結果であり、画像において特定の領域を塗りつぶしている。これら複数のラベルに対して各ピクセルでピクセルラベルを決定する。例えば左から3列目上から2段目のピクセルに注目すると、塗りつぶされているピクセル(黒)は図4の10、11、12、14、15、16、17の7つ、塗りつぶされていないピクセル(白)は図4の13の1つである。式1において、簡単のために自信度と信頼度はラベルによらず1.0、f_1=f_2=xとすると、S(黒)=7、S(白)=1であるから、このピクセルラベルは黒に決めることができる。これを各ピクセルについて行えば図4の18に示すような結果が得られ、これをこの画像における決定ラベルとして扱えばよい。
バウンディングボックスで囲むような領域指定の場合には、図5の20に示すように、バウンディングボックス内部を表す決定したピクセルラベルが長方形状にならない場合もある。その場合には、図5の21に示すように、長方形の枠で近似してバウンディングボックスを設定すればよい。
また、ラベルとして対象とする物体の画像あるいは三次元空間内における座標値や姿勢を表す行列やベクトルなどの数値配列を指定するような、「数値指定タイプ」のラベル付けも考えられる。数値指定タイプのラベルの場合、式(1)のS(j)を各ラベルにおける重みとして重み付き平均値としてラベルの数値を決定することができる。ただし、重み付き平均に限るものではなく、例えば、外れ値を考慮して公知技術であるM推定などのロバスト推定を行ったり、何かモデルを仮定して公知技術であるRANSACによって値を決定したりしてもよい。
次に本実施形態の情報処理装置10000による処理の手順について図6、7を参照しながら説明する。大きな処理の流れとしては、学習データにラベル付けを行う処理を行い、その後で学習データに対応するラベルを決定する処理が行われる。ただし、ラベルを決定した後にラベル付けを行う処理に戻ってもよい。
まず、学習データにラベル付けを行う処理について説明する。図6はラベル付けを行う処理を示すフローチャートである。ステップS1001において、ラベル属性情報管理部110が、学習データ100に対してラベラーがラベルと属性情報をつけた結果を取得すしラベル・属性情報記憶部101に記憶する。属性情報はラベラーが直接入力してもよいし、ラベル属性情報におけるラベル付けを行った日時やラベラーのIDなどはラベル付けを行う情報処理装置から自動的に抽出してもよい。
次にステップS1002において、ラベル属性情報管理部110が、上述した図2のような形式で、学習データ100にラベル・属性情報101を対応付けて管理する。ステップS1001およびS1002において一度にラベル付けを行う単位は、学習データの数やラベルの数に依存せず、一つのラベルごとにラベル属性情報管理部110が対応付けを行ってもよい。また、複数の学習データに渡って複数のラベルをまとめて対応付けてもよい。
次にステップS1003において、ラベル付けが完了したかどうかを確認し、完了していればラベルを決定する処理を行える状態となる。ラベル付けが完了していない場合には、ステップS1001に戻る。また、ラベル付けを完了したかどうかの判断基準は、ラベルを決定するのに十分なラベルが付与されているかどうかで決める。例えば、各学習データに対してラベル付けがx個以上(所定数以上)行われたら完了などとしてもよい。ただし、これに限るものではなく、後述の第3の実施形態で述べる確定度が閾値を越えたら完了としてもよい。
これらの各機能部は、CPU1810が、ROM1820に格納されたプログラムをRAM1830に展開し、後述する各フローチャートに従った処理を実行することで実現されている。また例えば、CPU1810を用いたソフトウェア処理の代替としてハードウェアを構成する場合には、ここで説明する各機能部の処理に対応させた演算部や回路を構成すればよい。
図7は本実施形態にかかる情報処理装置10000による処理フローを示すフローチャートである。ステップS1101において、リクエスト受信部111がユーザやシステムからリクエストを受信する。リクエストの内容の例としては、「ある学習データに対するラベルを返せ」等である。リクエストを受け取ると、リクエスト受信部111はラベル属性情報管理部110に対して指定された学習データのIDを送ってラベルを要求する。この時リクエストされる学習データは一つに限らず、複数であってもよく、その場合はラベル属性情報管理部110に送る学習データのIDも対応して複数となる。
次にステップS1102において、ラベル属性情報管理部110はリクエスト受信部111から受け取った学習データIDに対応するラベルと属性情報を決定して、ラベル決定部112に渡す。
次にステップS1103において、ラベル決定部112が式(1)に基づいてラベル候補のスコアリングを行ってラベルを決定する。
そしてステップS1104において、ラベル決定部112はリクエストを出したユーザやシステムに決定したラベルを返す。
本実施形態は、上記説明した図7の順序で処理を行うことに限られない。例えば、リクエストを受ける前に、予め学習データに対して、ラベル属性情報管理部110が対応するラベルと属性情報をラベル決定部112に渡してラベルを決定しておき、その決定したラベルをデータ属性情報に格納しておくこともできる。その場合は、ステップS1101でリクエスト受信部111がラベルを要求すると、ラベル属性情報管理部110はデータ属性情報に保持された決定ラベルをラベル決定部112に渡す。そして、そのままラベル決定部112では計算処理を行わずに、リクエストを出したユーザやシステムに決定ラベルを受け渡してもよい。
本位実施形態によれば、ラベル属性情報管理部が各学習データに対して複数のラベルと各種属性情報を管理して、ラベル決定部によってそれらの情報からラベルを適切に決めるようにしている。これによって、たとえ一部にラベルの誤りが含まれていたとしても、その影響を抑えて正しいラベルを決定することができる。
(第1の実施形態の変形例1)
ラベル付けの自信度とラベラーの信頼度を考慮して図4の18に示す結果を得る。より詳しい方法を以下に示す。
図4の10〜17において左から2列目上から5段目のピクセルを例として説明する。図4の10、11、・・・、17をi=1、2、・・・8番目に対応させると、L(2)=L(6)=黒、L(1)=L(3)=L(4)=L(5)=L(7)=L(8)=白である。ただし、ラベルは黒と白2種類あるものとして、I_1=黒、I_2=白とした。ここでラベラーが各画像に対して付けたピクセルラベルの自信度がC(1)=0.8、C(2)=0.4、C(3)=0.6、C(4)=0.8、C(5)=0.9、C(6)=0.8、C(7)=0.2、C(8)=0.5であるとする。さらに、各ラベラーの信頼度がR(A(1))=0.9、R(A(2))=0.5、R(A(3))=0.6、R(A(4))=0.7、R(A(5))=0.8、R(A(6))=0.2、R(A(7))=0.4、R(A(8))=0.4とする。また、f_1(x)=x、f_2(x)=0 (x<0.3のとき)、f_2(x)=2(x−0.3) (x>=0.3のとき)とする。このとき、式(1)に従って計算すると、黒ラベルのスコアS(1)=0.16、白ラベルのスコアS(2)=3.0となり、S(1)<S(2)であるため、決定ラベルはI_2=白に決めればよい。このピクセルに関しては、ラベラーA(1)、A(3)、A(4)、A(5)、A(7)、A(8)が正しくラベル付けを行えており、ラベラーA(2)、A(6)はラベル付けを誤ったと見なすことができる。このような結果を踏まえて、ラベラーの信頼度を計算し直す方法については後述する。
上記では式(1)を用いて、ラベル付けの自信度とラベラーの信頼度の両方に基づいてラベルを決定する方法について説明したが、これに限るものではない。例えば、ラベル付けの自信度だけに基づいてラベルを決定する場合には、式(1)においてf_2(x)=1として考えればよい。このとき、上記の図4における左から2列目上から5段目のピクセルにおける例を用いれば、S(1)=1.2、S(2)=3.8より決定ラベルは白となる。また、ラベラーの信頼度だけに基づいてラベルを決定する場合には、式(1)においてf_1(x)=1として考えればよい。このとき、上記の図4における左から2列目上から5段目のピクセルにおける例を用いれば、S(1)=0.4、S(2)=4.0より決定ラベルは白となる。また、ラベル付けの自信度やラベラーの信頼度に依らず、多数決によってラベルを決定する場合には、f_1(x)=1、f_2(x)=1として考えればよい。その場合は同様にしてS(1)=2、S(2)=6となり決定ラベルは白となる。このようにして、全てのピクセルに対してラベルを決定すれば、決定ラベルとして図4の18を得ることができる。
決定ラベルが得られたら、今度はこの結果に基づいて、ラベラーの信頼度を計算し直す。決定ラベル(図4の18)に対して、各ラベラーが付けたラベル付け結果(図4の10から17)との相関を取り、相関が高い場合はラベラーの信頼度を高く、相関が低い場合はラベラーの信頼度を低くする。信頼度の増減方法について特に限定はしないが、相関度合に基づいて、相関が高いほど信頼度の増加量を多くする。例えば、図4の10と12は全48ピクセルのうち47ピクセルが正しくラベル付けされているため、これらのラベルを付けたラベラーの信頼度を高くする。一方で、図4の17は全48ピクセルのうち43ピクセルしか正しくラベル付けされていない。そのため、このラベルを付けたラベラーの信頼度を低くする、または、信頼度を高くするが、信頼度の増加量は図4の10と12をラベル付けしたラベラーのよりも少なくする。ただし、全ピクセルのうちの正しくラベル付けされた割合に限るものではない。例えば、黒く領域を指定したうちの正しくラベル付けされた数(True positive)が多いほど正しいことを指標として信頼度を計算してもよい。また、黒く領域指定したうちの誤ってラベル付けされてしまった数(False positive)が少ないほど正しいことを指標として信頼度を計算してもよい。また、黒く領域指定されるべきなのに誤ってラベル付けし忘れている数(False negative)が少ないほど正しいことを指標として信頼度を計算してもよい。また、黒く領域指定していない領域のうち正しくラベル付けされた(白いまま)の数(True negative)が多いほど正しいことを指標として信頼度を計算してもよい。または、上記指標の例を組み合わせて演算したもので信頼度を計算してもよい。
(第1の実施形態の変形例2)
第1の実施形態ではラベルとしてデータの属性情報、あるいは画像の領域を用いる説明を行った。ただし、ラベルはこれらに限定されるものではなく、画像の中に存在する対象物体をロボットにより吸着・把持するための位置や位置姿勢情報であってもよい。このとき、対象物体は画像中に1つとは限らない。位置や位置姿勢情報は画像に対して1つの場合もあるし、複数の場合もある。
まず、位置をラベル付けする場合について説明する。位置のラベル付けでは、ラベルは二値であり、位置を表す場合をTrue、そうではない場合をFalseとして、各ピクセルに対してTrue、またはFalseがラベルとして割り振られる。ただし、位置として何も指定しない場合には自動的にFalseのラベルが振られるものとして、位置に対応するTrueだけを指定してもよい。位置を指定する方法としては、画像の座標を点や領域として指定する、または吸着や把持に対応させたオブジェクトを画像中で指定する方法がある。図19に吸着や把持に対応させたマスクオブジェクトによって位置を指定する例を示す。ここでは、マスクオブジェクトは画像中の領域をある形状で領域指定するために用いるものであるとする。図19の50は画像中で吸着できる領域を指定するためのマスクオブジェクトであり、吸着する時に用いる吸着パッドが対象物体と接触する時の接触領域をかたどった形状をしている。図19の51はロボットが平行グリッパを用いて対象物体を把持する時に平行グリッパの二つの指を挿入する時の領域をかたどった形状をしている。
点で指定する場合、点は画像の座標系においてピクセル、またはサブピクセル単位で位置を指定する。複数のラベラーによってラベル付けを点で指定されると、指定された点を中心として半径rの円の内部を指定された領域と定義する。円で領域指定されると、第1の実施形態において図4を用いて説明した領域指定タイプのラベル決定方法を用いて、ラベルを決定することができる。
マスクオブジェクトで指定する場合、図19の50、51で黒く塗りつぶした領域で領域指定したものとして考えることで、同様にして領域指定タイプのラベル決定方法でラベルを決定することができる。ただし、マスクオブジェクトで指定する時、図19の50,51で黒く塗りつぶした領域だけを領域指定したものとして見なす方法に限るものではない。例えば、マスクオブジェクトの黒く塗りつぶされた領域に対して、さらに厚みを持たせたより広範囲の領域を領域指定したものと見なしてもよい。図19の52に平行グリッパのマスクオブジェクト(図19の51)を用いて、画像中の円筒の形をした対象物体を把持するための位置を指定した例を示す。このようにして、複数のラベラーが画像中の領域をマスクオブジェクトで指定してラベル付けを行い、それらの結果から、領域指定タイプのラベル決定により、決定ラベルを領域として取得することができる。ただし、こうして得られた決定ラベルの領域は、必ずしもマスクオブジェクトと同じ形状をしていない。図19の53に決定ラベルの領域がマスクオブジェクトと異なる形状をしている場合の例を示す。決定ラベル領域がマスクマスクオブジェクトと異なる形状をしている場合には、決定ラベルの領域に対して、マスクオブジェクトを使ってフィッティングを行い、尤もらしいマスクオブジェクトの位置を求める。図19の54にマスクオブジェクトを使ってフィッティングを行った結果の例を示す。
次に、位置姿勢をラベル付けする場合について説明する。位置に加えて姿勢も含めたラベル付けを行う場合には、ラベラーは位置として画像中の座標を指定するだけでなく、さらに姿勢を表すベクトルを指定する必要がある。ベクトルは指定した位置の各ピクセルに対して1つずつ異なるベクトルを定義してもよいし、指定した位置の領域に対応する複数のピクセルに対して1つずつベクトルを定義してもよい。ベクトルの指定方法としては、画像中で矢印の向きを指定してもよいし、ベクトルを数値列として表してもよい。いずれの場合も、姿勢を表す数値データに変換する。位置姿勢のラベル付けでは、位置として指定した領域に対して、ラベルは姿勢を表す数値データの範囲ごとに複数の異なるラベルを割り振る。また、位置として指定されていない領域には数値データは存在しないが、そのような領域には何もないラベルとしてFalseを割り振ればよい。数値データの範囲の決め方としては、事前に定めておいてもよいし、ラベル付けが行われた後に、数値データの分布からクラス分けによって範囲を決めてもよい。こうして位置に対応する領域と、姿勢を表す数値データをさらにラベルに変換することで、式1を用いて領域指定タイプのラベル決定方法と同様にして、ラベルを決めることができる。決定ラベルは位置を表す領域と、姿勢を表すラベルとして得られるため、ラベルを再び姿勢を表す数値データに変換する。このラベルは、注目する位置において決定ラベルと同じラベルを設定した複数のラベラーそれぞれに対応する数値データが入っている。そのため、それらの数値データの平均値や中央値など、このラベルを代表する数値データを計算して姿勢を表す数値データとすればよい。
このようにして、位置や位置姿勢をラベル付けすることによって、例えば画像の中に存在する対象物体をロボットにより吸着・把持するための学習データのラベル付けにも、本実施形態を適用することができる。
(第2の実施形態)
本発明の第2の実施形態にかかる情報処理装置20000は、ラベラーがユーザである場合に、ユーザがラベル付けを行う際に、他のユーザによって付与されたラベルそのものや、現在自分が付与しようとしているラベルとの類似度を提示する。これにより、ラベル付けを行うユーザが効率良くラベル付けを行えるようにする。すなわち、第2の実施形態では、ある学習データにすでに他のユーザに付与されたラベルが存在している時、それをラベルや属性情報によって比較して見比べて、ラベル付けを行いやすくする。
図8は第2の実施形態に係るラベル付け装置2の構成を示す機能ブロック図である。第2の実施形態にかかるラベル付け装置2の構成は、図1に示した第1の実施形態における構成例と共通する部分があるため、差異があるリクエスト受信部211、ラベル比較部113と表示制御部114について説明する。また、第2の実施形態にかかる情報処理装置は、表示装置30に有線、または無線を介して接続されている。表示装置としては、表示形式はなんでもよいが、本実施形態としてはタッチパネル式ディスプレイを用いるものとして説明する。しかしながら、有機ELディスプレイ、CRTディスプレイなどでもよいし、また、壁などに投影することによって表示するプロジェクタを表示装置として用いてよい。また、表示装置への入力としてタッチパネル形式ではなく、キーボード、マウスを用いてもよい。
リクエスト受信部211は、第1の実施形態における機能に加えて、ユーザから参照したいラベルに関する要求を受け取り、ラベル属性情報管理部110に送る。ラベル属性情報管理部110はリクエスト受信部211の命令を受けてラベルや属性情報などの情報をラベル比較部113および表示部114に送出する。ラベル比較部113はラベル属性情報管理部110から関連する2組のラベルを受け取り、ラベル間の類似度を計算し、ラベル類似度を表示部114に渡す。表示部114はラベル属性情報管理部110からラベルや属性情報を、ラベル比較部113からラベル類似度を受け取り、それらを基にして例えば表示装置30に表示を行う。
リクエスト受信部211がユーザから受け取るユーザ要求として、例えば、「ある学習データに対して各ラベラーが付けたラベルを参照したい」という要求の場合、ラベル属性情報管理部110は指定された学習データ内でのラベルを抽出する。そして、抽出したラベルを表示制御部114に送る。表示制御部114において表示装置30に表示される際の表示の詳細な説明については後述する。
ラベル比較部113は、二つのラベル間(ラベルAとラベルB)の類似度を計算する。まず、記号指定タイプのラベル付けにおける類似度の計算について説明する。ラベルAが「猫」でラベルBも「猫」のとき、ラベルAとラベルBは同一なので類似度は1.0である。ラベルAが「猫」でラベルBが「犬」のとき、ラベルAとラベルBは異なるので類似度は0となる。また、例えば、画像中に写る物体を列挙するような複数個のラベルを付ける場合、類似度は(ラベルAとラベルBに共通のラベルの個数)/(ラベルAとラベルBのいずれかに含まれるラベルの個数)として求める。例えば、ラベルAが「犬、猫、猿」、ラベルBが「犬、猫、馬、牛」であれば、類似度は(犬、猫:2)/(犬、猫、猿、馬、牛:5)=0.4である。ただし、類似度の計算方法は上記で述べた式に限るものではなく、2つのラベル間で、ラベルが似ているほど高く、異なっているほど低い値になるものであればよい。例えば、ラベルAをユーザが編集中のラベル、ラベルBを他のラベラーが付けたラベルとして、ラベル比較部113で類似度や一致度を計算する。そして、後述するUIで参照することによって、ユーザは編集中のラベルが尤もらしいかどうかを検討しながらラベル付けを行うことができる。
また、ラベル比較部113は類似度だけでなく、ラベルの一致度を計算して求めることができる。一致度とは、自分が付けたラベルが、他のラベラーが付けた複数のラベルに対してどの程度一致しているかを示す指標である。具体的には、ある学習データに対して、(自分が付けたラベルと他のラベラーが付けた各ラベルとの類似度の総和)/(他のラベラーが付けたラベルの数)によって一致度を求めることができる。ある学習データに対するラベル群の選び方としては、例えば、そのデータに紐づけられた全てのラベルとする。ただし、これに限るものでは無く、信頼度の低いラベラーのラベルや、自信度の低いラベルを除いたラベル群を用いてもよいし、ユーザが任意に選んだラベル群でもよい。また、一致度は類似度と同様、表示部114で参照することができる。一致度を求めて参照することで、ミスや誤作動によるラベル付けの誤りを減らすことができる。
一方で、領域指定タイプのラベル付けにおける類似度の計算は、ピクセルごとにピクセルラベルが同一であるか異なるかに基づいて画素数に対する割合から求める。wはある画素がバウンディングボックス内部である、または塗りつぶされていることを示し、bはバウンディングボックス外または塗りつぶされていないことを示すとする。指定された学習データ画像において、ラベルAでw、ラベルBでbの画素数をNwbと表すものとし、同様にNww、Nbb、Nbwを定義する。この時、ラベルAとラベルBの類似度Reは以下の式で表される。
Figure 2018106662

ここで、画像内に占めるバウンディングボックス内部の領域が狭い場合、または、塗りつぶした領域が少ない場合には、Nwwが他の変数に比べて圧倒的に大きくなるため、類似度Reが1.0に近い値で微小な違いしか得られない。そのような場合には、式(2)においてNwwの値を小さな値で上書き(例えばNww=0)して類似度Reを計算することで、狭い領域であっても領域を指定したことに重みをつけて類似度を求めることができる。
また、数値指定タイプのラベル付けにおける類似度の計算は、ラベルAとラベルBの数値の差dを求め、dが0の時に1.0、dが大きくなると0.0に近付くような、図3のfとは逆の単調減少の関数gを考え、g(d)によって類似度を定義すればよい。ただし、ここではラベルAとラベルBの数値の差としてdを定義したが、これに限るものではなく、例えばラベルAとラベルBがベクトルや行列の場合には、dはL1ノルムやL2ノルムを用いてもよい。
領域指定タイプおよび数値指定タイプにおける一致度の計算方法については、それぞれ類似度を求めた後は、記号指定タイプで説明した方法と同様に一致度を求めることができるため省略する。
表示制御部114は、ラベル属性情報管理部110やラベル比較部113から必要な情報を受け取り、表示装置30であるタッチパネル式ディスプレイに表示を行う。図9を参照しながら表示装置30の外観およびその機能について説明する。図9は、記号指定タイプのラベル編集のための表示例である。
表示装置30はタッチパネル式ディスプレイ、31はタッチパネル液晶、32はラベル付け対象の画像データ、33は対象画像データのラベル入力部、34は対象画像データのラベルリスト、35はサムネイル画像データの表示領域である。また、36は表示条件設定部、37は類似度表示部、38はラベル付け種類切替ボタン、39は一時保存ボタン、40は画像切替ボタンである。また更に、41は戻る・進むボタン、42はラベル転写ボタン、43は確定ボタン、44はラベル決定ボタン、45はラベル比較ボタンである。
表示装置30は、表示制御部114によって指示があった内容を表示する機能やリクエスト受信部が受信するリクエストを受け付ける機能を備えている。ラベル属性情報管理部110、ラベル決定部112、ラベル比較部113の機能も合わせて備えていてもよいし、それらは外部の情報処理装置にその機能を備え、通信手段によって情報をやり取りしてもよい。
タッチパネル液晶31は画像やボタンなどの表示を行う。ここではタッチパネル液晶として説明するが、タッチパネルではないディスプレイでもよく、その場合はボタンの操作などは例えばマウスなどを使って行ってもよい。
ラベル付け対象の画像データ32は、現在ユーザがラベル付けを行う対象となっている画像を表示する。表示される画像はユーザの操作によって任意の領域を拡大縮小することができる。
対象画像データのラベル入力部33は、ラベル付け対象画像データ32に表示されている画像に関するラベルを編集する領域である。ラベルはキーボードなどを用いて直接文字入力を行ってもよいし、ラベルとして選ぶ候補が決まっている場合にはボタンやリストによって選択できるようにしてもよい。また、ユーザ自身が既にラベル付けを行ったことのある画像データに対してラベル付けを行う際には、自身が過去に付けたラベルをラベル入力部33に表示させることができる。
対象画像データのラベルリスト34は、既に自身あるいは他のラベラーによって対象画像に付けられたラベルのリストを表示する領域である。ユーザはラベルリスト34を参考にしながら、対象画像のラベルを考えることができる。また決定ラベルが求められている場合には、決定ラベルもこのリストの中に含まれる。
サムネイル画像データの表示領域35は、学習データ画像のサムネイルが表示される。図9では4枚のサムネイル画像が表示されている例を示しているが、これに限るものではなく、表示を変更することで大きな画像や小さな画像、ファイル名などに表示を切り替えることができる。また、サムネイル画像データの表示領域35はスクロール可能となっており、例えば表示領域をタッチして左右にスライドすることによって他の画像を閲覧することができる。また、サムネイルにはラベル付けされた数または決定ラベルがデータ属性情報に登録されているかどうかを表示することができ、ユーザはそれらの情報から次にラベル付けを行う画像を選択することができる。
表示条件設定部36はラベルリスト34に表示されるラベル、または、サムネイル画像データの表示領域35に表示される画像の条件を設定する。どの条件を設定するかは表示条件設定部36内で切替可能である。条件の例としては、前述した「ある学習データに対して各ラベラーが付けたラベルを参照したい」などが挙げられる。ラベルリスト34の条件を設定するモードでは、ラベル属性情報やラベラー属性情報を基にして、ラベルリスト34に反映される。例えば、ラベルの自信度0.8以上のラベルのみ表示させるという条件や、ラベラーの信頼度が降順になるようにラベルリストを並べるという条件などを設定することで、ラベルリスト34に反映される。一方で、サムネイル画像データの表示領域35の条件を設定するモードでは、データ属性情報やラベル属性情報を基にして、サムネイル画像データの表示領域35に対象となるサムネイル画像を表示できる。例えば、2016年以降に撮影した画像のみを表示させるという条件や、ラベル付けの結果が5に満たない画像のみを表示させるという条件を設定することで、サムネイル画像データの表示領域35に対象となるサムネイル画像を表示できる。このように、条件を設定して対応する画像データやラベル付け結果をフィルタリング・ソートしながら参照することによって、ユーザはラベル付けのルールをより具体的にイメージして、ラベル付けの精度を高めることができる。例えば、同じ画像データに対してラベラー信頼度が高い順にラベル付け結果を表示することで、尤もらしいラベルの傾向を確認し、ラベル付けの自信度を高めることができる。また、同じラベルが付けられている画像群をサムネイル表示することで、そのラベルが付けられる画像の傾向を知り、より正確なラベル付けを行うことができる。あるいは、これまでに自分が付けたラベルを参照することで、自分の中でのラベル付けルールに揺れが無いかを確認することができる。あるいは、ラベル付けルールが変更される日付以前にラベル付けされた画像群をフィルタリングして選び出すことによって、新ルールを適用できていない画像群にのみ効率良くラベルをつけ直すことができる。
類似度表示部37はラベル入力部33に設定したラベルとラベルリスト34の中から選択したラベルとの類似度を表示する。類似度は、前述したラベル比較部113によって計算される。また、図示しない一致度切替ボタンによって、類似度表示部37は類似度と一致度との表示を切り替えることができる。一致度は、前述したラベル比較部113によって計算される。
ラベル付け種類切替ボタン38は、記号指定タイプのラベル付けと領域指定タイプのラベル付け、数値指定タイプのラベル付けといった、ユーザが定義するラベル付けの種類を切り替えるためのボタンである。ラベル付けの種類が切り替わると、対象とするべき画像データ群も変わるため、ラベル付け対象の画像データ32やラベルリスト34、サムネイル画像データの表示領域35の内容などが更新される。ここではラベル付けの種類を切り替えるとして説明したが、これに限るものでは無く、画像データ群を切り替えることができ、画像データ群を指定すると、データ属性情報のラベル付け方法の種類に合わせてラベル付けの種類が更新されてもよい。
一時保存ボタン39はラベル入力部33の内容を一時的に保存するためのボタンである。保存を行うことで、他の画像データに切り替えて再び元の画像に戻ってきた場合でも、ラベルをもう一度保存状態から編集可能になる。ただし、一時保存ボタン39は必ずしもボタン状である必要はなく、ラベル入力部33が編集されると、常に自動で保存されてもよい。
画像切替ボタン40はラベル付け対象の画像データ32の内容を切り替える。切替はサムネイル画像データ表示領域35に表示されたサムネイル画像を指定して行ってもよいし、指定しないでランダムに画像を切り替えてもよい。
戻る・進むボタン41はユーザの行った操作の履歴から、戻るボタンによって前の履歴状態に戻ったり、次の履歴状態があれば進むボタンによって次の履歴状態に進んだりする。
ラベル転写ボタン42はラベルリスト34の中からラベルを選んで、そのラベルと同じラベルをラベル入力部33に転写する。
確定ボタン43はラベル入力部33に書かれたラベルを確定してラベル・属性情報101に登録する。確定ボタンを押すと、ユーザのラベル付けに対する自信度を設定する画面が表示され、自信度も同時に属性情報として記録される。また、確定ボタン43は、新たにユーザが付けたラベルと、決定ラベルとの類似度が低い場合には、ラベルに誤りが無いか確認を促すメッセージとラベル編集を行うかどうかの選択肢を表示する。もしくは、過去にユーザ自身がつけたラベルの傾向から新たに付けたラベルが大きく異なる場合には、ラベルに誤りが無いか確認を促すメッセージとラベル編集を行うかどうかの選択肢を表示する。これにより、ユーザは誤動作や勘違いでラベル誤りを登録してしまう可能性を減らすことができる。
ラベル決定ボタン44は指定した画像データに対応するラベル群を基にして、ラベル決定部112を用いてラベルを決定する。ラベルが決定すると、ラベルリスト34に決定ラベルが追加または更新される。
ラベル比較ボタン45はラベル比較部113を用いて、ラベル入力部33で編集中のラベル付け対象の画像データ32に関するラベルと、ラベルリスト34で指定したラベルとの比較を行い、類似度を計算する。求めた類似度は類似度表示部37に表示される。ここではラベル比較ボタン45として説明したが、これに限るものでは無く、ラベルリスト34でラベルを指定するたびに自動的にラベル比較が行われて類似度が計算され、類似度表示部37が更新されてもよい。
次に、図10にタッチパネル式ディスプレイにおける領域指定タイプのラベル編集の表示例を示す。図10の多くの機能は図9の同一であるため、異なる機能のみ説明を行う。
46は比較対象のラベル付け画像データである。ラベル付け対象の画像データ32と同じ画像において、既に付けられているラベルを選択して、画像データにラベルを重畳して表示させることができる。
ラベル付け対象の画像データ32は、記号指定タイプの場合と同様に、現在ユーザがラベル付けを行う対象となっている画像を表示するが、この画像上で領域の指定を行ってラベルを付ける機能が追加されている。これに伴い、図9においてラベル入力部33に対して行われていた処理はラベル付け対象の画像データ32の機能として統合される。
サムネイル画像データの表示領域35に表示されるサムネイル画像は、記号指定タイプの場合と同様に学習データ画像のサムネイル表示だけでない。ラベル付け対象画像データに対してラベル付けした結果を重畳した画像のサムネイルを表示させることができる。それに伴い、表示条件設定部36では、ラベル付けした結果を重畳した画像というカテゴリを指定してさらに条件を設定することができる。
類似度表示部37はラベル付け対象の画像データ32に設定したラベルと比較対象のラベル付け画像データ46のラベルとの類似度を表示する。
ラベル転写ボタン42は比較対象のラベル付け画像データ46に表示されているラベルをラベル付け対象の画像データ32で編集中のラベルとして転写する。これにより、ユーザは過去のラベル付けから効率良くラベルを選択、編集してラベル付けを行うことができる。
上記では、タッチパネル液晶31に各種ボタンが表示されているものとして説明したが、これに限るものではなく、ボタンの代わりにリストの中から処理内容を選んで実行してもよいし、キーボードによるショートカットキーに割り当ててあってもよい。
また、数値指定タイプの編集の表示例は、図9に示した記号指定タイプの例においてラベルとして文字入力など記号を選択する代わりに、数値を入力する点が異なるだけで、その他は記号指定タイプと同様であるため、説明を省略する。
次に、本実施形態の情報処理装置を用いてラベルの付与や確認を行う典型的な流れを図11に示す。記号指定タイプ、領域指定タイプ、数値指定タイプのラベル付けいずれにおいても処理の流れはほぼ同様であるため、図11を用いてまとめて説明する。ステップS2001において、ユーザがタッチパネルディスプレイ30を起動すると初期化処理が行われ、表示部114が図9または図10に示すようなラベル付け作業を行うUIを表示する。初期化処理では、学習データ100とラベル・属性情報101から必要なデータを読み込む処理等が含まれる。
次にステップS2002において、ラベル属性情報管理部110は、ユーザがラベル付けを行う画像データを選択する。選択の際には、表示条件設定部36とサムネイル画像データの表示領域35を利用して画像を指定し、画像切替ボタン40を押してラベル付け対象の画像データ32に表示させる。または、画像を指定せず、画像切替ボタン40を押すことで、ランダムに画像を表示させてもよい。
次にステップS2003において、ラベル属性情報管理部はユーザがラベル付けした結果を受け取る。ユーザはラベル付けの際には、一時保存ボタン39や戻る・進むボタン41、ラベル転写ボタン42などを用いてラベル付け作業を行う。
次にステップS2004において、ラベル比較部は113、ラベルの比較および確認を行う。比較・確認にはこれまでラベル付けされた結果としてラベルリスト34または比較対象のラベル付け画像データ46を用いる。類似度を計算した結果が類似度表示部37に表示されるので、それを見ながら比較対象のラベルとの違いを確認することができる。また、データのフィルタリングやソートについては、画像表示条件設定部36やサムネイル画像を用いればよい。
次にステップS2005において、ラベル属性情報管理部は、ラベル付けが完了したかどうかを確認する。まだラベル付けが完了していなければステップS2003に戻る。完了していればステップS2006に進む。ラベル付け完了の確認の際には、確定ボタン43を押して、ラベル誤りの可能性が無いことの確認も行う。
次にステップS2006において、ラベル属性情報管理部は、ユーザのラベル付けに対する自信度などの属性情報を追加して登録および管理する。登録の際には、ラベル属性情報管理部110が学習データとラベル・属性情報の対応付けを行う。
次にステップS2007において、他の画像でラベル付けを続けるかどうかを決める。続ける場合はステップS2002に戻る。続けない場合は終了とする。
本実施形態によれば、表示装置を用いたUIによって、ラベル比較部113によるラベルの類似度計算機能をはじめとするラベルの比較・参照・編集などの機能を用いて、ユーザは視覚的に他のラベルや画像データを確認しながらラベル付けを行うことができる。
(第3の実施形態)
第3の実施形態の情報処理装置30000は、クラウドソーシングによって多数のラベラーにラベル付けを行ってもらい、大量のラベルから高精度にラベルを決定する。さらに、学習データの中でラベルが確定していないデータを求めることで、ラベラーに処理してもらう学習データを適切に抽出して、大量の学習データに効率良くラベルを付ける。
図12は第3の実施形態にかかるクラウドソーシングによるラベル付け装置3の機能構成を示す機能ブロック図である。第3の実施形態における機能構成は、図8に示した第2の実施形態における構成と共通する部分があるため、差異があるクラウドソーシング102、確定度計算部115、データ抽出部116について詳細に説明する。
クラウドソーシング102は、ラベル付けを行う多数のラベラーから構成されており、ラベラーごとにデータ抽出部116で抽出した学習データ群に対してラベル付けを行う。そして、その結果をラベル・属性情報101に保存するようにラベル属性情報管理部110が管理する。ただし、102は必ずしもクラウドソーシングに限るものではなく、特定の人々を相手にしたアウトソーシングでもよいし、複数のPCにラベル付けを並列処理させてもよい。
確定度計算部115はラベル属性情報管理部110から各学習データについてラベル・属性情報101を受け取って、ラベル決定部112が決定するラベルが尤もらしい度合いとして確定度を計算する。計算した確定度は学習データごとにデータ属性情報として保存される。確定度が高いほどラベル決定部112が決定するラベルは尤もらしいため、ラベル付け作業をこれ以上行う必要が無いことを表す。確定度が低い場合には、ラベル決定部112が決定したラベルであっても正しくない可能性が高いことを示しており、ラベル付けをより多くのラベラーに行ってもらう必要がある。または、学習データ自体が一意にラベルを定めにくい難しいデータである可能性がある。
データ抽出部116は、学習データごとにデータ属性情報における確定度を基にして、クラウドソーシング102のラベラーにラベル付けを行ってもらう学習データを抽出する。確定度が高い学習データはラベル付けの必要性が低いため、データとして抽出されづらくし、逆に、確定度が低い学習データはラベル付けを行って確定度を上げていく必要があるため、データとして抽出されやすくする。抽出した学習データ群はクラウドソーシング102に受け渡して、ラベル付けを行ってもらう。
次に、確定度計算部115における確定度の計算方法(確定度導出)について詳細に説明する。確定度Fは式(1)で求めた各ラベル候補のスコアS(j)を用いて以下の式で計算される。
Figure 2018106662

ここでW(n)はラベルの数に応じてFの最大値を決める関数である。nが小さい場合はW(n)も小さく、nが大きければ大きな値を与えるものとする。ただし、W(n)の上限値は1.0である。このようなW(n)を設けることによってラベルの総数が少ない(nが小さい)時に、Fが容易に高い確定度を出力しないようにしている。ただし、確定度の計算はこの式に限るものではなく、決定ラベルの比率が高いことを利用したものであればよい。例えば、式(3)の代わりに以下の式でもよい。
Figure 2018106662

ここで、S[x]はS(j)(j=1、…、m)を降順に並べた時のx番目の値のことを指す。つまりS[1]=maxS(j)であり、S[m]=minS(j)である。このようにして各学習データにおいて確定度Fを求める。ただしj>mの時、S[j]=0である。
次に、データ抽出部116におけるデータの抽出方法について説明する。抽出するデータの基本方針は次の3つである。(i)確定度の低いデータを抽出する。(ii)ラベル数が増えても確定度が低いままのデータは例外とする。(iii)ラベラーの信頼度評価用に用いるテストデータを抽出する。それぞれの方針について説明する。
(i)確定度が低いほど学習データ100のデータ群の中から、次のラベラーにラベル付け処理を行ってもらい、より正しいラベルが選ばれやすくするためである。(ii)は学習データ自体に不備があることを示している。ある学習データに対してラベル数を増やしたとしても確定度が上がらないということは、式(3)や式(4)におけるS(j)の分布において、複数のjにおいてS(j)のピークが生じていたり、S(j)のピークが存在しなかったりする状態である。このような場合には、学習データ自体がラベル付け困難な画像である可能性が高く、例えば、画像内に対象物体が一部しか写っておらず、ラベルをつけようにも見分けがつかない場合が考えられる。そのような場合には、ラベル付けが困難であることを示す属性を定義して、データ属性情報に登録しておく。そうすることで、ラベル付け困難な学習データは、高精度にラベル付けを行える信頼度の高いラベラーにラベル付けを依頼するようにデータ抽出を行い、ラベル付けの誤りを減らすことができる。また、ラベル付け困難な学習データを学習データ対象から除外することで、学習データ群の品質を保ってもよい。(iii)はラベラーの信頼度をテストするための信頼度評価データセットである。予め真のラベルが既知のデータや、確定度が高いデータ群からなる信頼度を評価するためのデータセットを用意しておき、ラベラーがラベル付けを行うデータの中に、ラベラーに気付かれないようにこの信頼度評価データセットを一部混ぜておく。そして、ラベラーが信頼度評価データセットに対して付けたラベルを真のラベルと比較してどれだけ正しいかを評価することによって、そのラベラーの信頼度を求めることができる。クラウドソーシングを行う上で気を付けるべき点の一つに、悪意のあるユーザによる誤ったラベルの混入がある。信頼度評価データセットを用いることで、誤ったラベルを付けるラベラーの信頼度は下がるため、このような悪意のあるユーザが含まれていたとしても、その影響を低く抑えることができる。また、初期化時(ラベル付け開始時)には学習データ100に対するラベル・属性情報101が全く定義されていない状態で、全ての学習データにおいて確定度が設定されておらず0である。そのため、データ抽出部116は全ての学習データの中から適当に分割して抽出したデータをクラウドソーシング102に渡せばよい。ただし、初期化時の振る舞いはこれに限るものではなく、初期化時にはラベル付けの見本となるようなデータをいくつか事前に登録しておき、それらを最初のラベル・属性情報101および信頼度評価データセットとして用いてデータの抽出を行ってもよい。
次に本実施形態の情報処理装置30000の処理の手順について説明する。図13はクラウドソーシングによるラベル付けの流れを示すフローチャートである。ステップS3001において、リクエスト受信部211はクラウドソーシング102のラベラーからラベル付け作業を行いたいというリクエストを受信する。
次にステップS3002において、データ抽出部116はラベル付けすべきデータを抽出する。抽出するデータは一つずつでもよいし、複数のデータ群をまとめて抽出してもよい。
次に、ステップS3003において、抽出したデータをクラウドソーシング102のラベラーに渡してラベル付けを行う。ラベル付けの手順については、既に説明した図11のフローチャートに従って行えばよい。
次に、ステップS3004において、クラウドソーシング102からラベルと属性情報を得て、ラベル属性情報管理部110が学習データ100と対応付けて管理する。この流れの詳細については、図6において説明したフローチャートに従って行えばよい。
次に、ステップS3005において、各学習データにおいて確定度計算部115を用いて確定度を計算する。計算した確定度は学習データ100に対して、データ属性情報として更新される。
次に、ステップS3006において、ラベル決定部112を用いてラベルを決定する。ラベル決定の流れについては、既に説明した図7のフローチャートに従って行えばよい。
図13のフローチャートでは図に示した順序で処理を行うものとして説明を行った。しかし、これに限るものではなく、例えば、ステップS3006のラベルの決定は、ステップS3005の確定度と同様に式(1)のS(j)を用いて計算するため、確定度を計算する際に、同時にラベルの決定を行っていてもよい。また、ユースケースによっては、必ずしもラベルが確定していなくても、決定したラベルを必要とする場合もある。その場合には、確定度を用いた図13のフローチャートとは独立に図7のフローチャートが任意のタイミングで実行されるようにしてもよい。
本実施形態によれば、ラベルが定まったかどうかを示す確定度を計算し、確定していないデータから優先的にデータを抽出することによって、ラベル付けが必要な学習データを効率良く選んでクラウドに渡すことができる。また、抽出するデータに信頼度評価データセットを混ぜることによって、クラウドソーシングにおける悪意のあるユーザによるラベル誤りの混入などの悪影響を最小限に抑えることが出来る。
(第3の実施形態の変形例)
第3の実施形態ではデータ抽出部116は抽出したデータをクラウドソーシング102に渡すものとして説明したが、データ抽出部116が抽出した学習データは、クラウドソーシング102に対してラベル付けを行うように依頼する形で受け渡してもよい。ラベル付けを依頼する際には、クラウドソーシング102のラベラーに対して、ラベル付けの方法がわかるように、ラベル付けを行ったデータとラベルの例とラベル付けの方針を明文化した文書のどちらか、または両方を提示する。このようにして、学習データは図示しない依頼部によってクラウドソーシング102に依頼がなされる。
(第4の実施形態)
第4の実施形態の情報処理装置40000は、クラウドソーシングによって大量のラベルから誤りの少ないラベルを決定し、誤りの少ないラベルを用いて学習することで、高精度に認識を行う。
図14は第4の実施形態にかかる情報処理装置40000の機能構成を示す機能ブロック図である。第4の実施形態における機能構成は、図12に示した第3の実施形態における構成例と共通する部分があるため、差異がある学習部117、認識部118について詳細に説明する。
学習部117は、リクエスト受信部211にリクエストを出すことで、ラベル決定部112において決定されたラベルと学習データ100を受け取り、学習データ100に対して対応するラベルを教師として、教師あり学習を行う。学習の方法は特に限定されず、深層学習を用いてもよいし、ランダムフォレストを用いてもよい。学習に用いるデータは確定度が閾値以上の学習データのみを用いる。こうすることで、誤りの少ないラベルで学習できるため、高精度な予測モデルを生成することができる。ただし、これに限るものでは無く、学習データすべてを用いて学習してもよい。学習を行うタイミングは学習データに対応する決定ラベルが得られる状態であれば、任意のタイミングでよい。
認識部118は、学習部117から予測モデルを受け取って、リクエスト受信部211からクエリデータを受け取ると、予測モデルに基づいて予測結果(出力ラベル)を返す。出力ラベルは、ラベル比較部113で他のラベルとの比較に用いられたり、表示部114で他のラベルとともに表示されたり、確定度計算部115で確定度を決める際に参考にしたりする。例えば、表示制御部114では、ラベルを編集中に出力ラベルとの比較を表示するように表示装置30に表示させることによって、ユーザにラベルの修正を促すことができる。
次に、確定度計算部115における、出力ラベルが得られた場合における確定度の計算方法について説明する。確定度計算の方法については既に式(3)または式(4)のFによって求めた。これに対し、出力ラベルが分かっている時には、さらに追加の項としてB(I_d、I_o)が追加される。ただしI_dとI_oはそれぞれ決定ラベルと出力ラベルである。また関数BはI_dとI_oが同じであれば大きな値、異なる場合には小さな値になるような類似度を表す関数である。ここでは、式(3)または式(4)にB(I_d、I_o)を足したものを確定度の計算とすることを述べたが、これに限るものではなく、式(3)または式(4)に掛けたものを確定度としてもよい。また、確定度計算部115は図13において、確定度を計算した後で決定ラベルを求めるものとして説明した。この場合には、確定度を決める前にラベルを決定し、これを仮の決定ラベルとしておき、仮の決定ラベルと出力ラベルとが等しく確定度も高い場合には、最終的に仮の決定ラベルを決定ラベルとするようにしてもよい。
次に本実施形態の情報処理装置40000の処理の手順について説明する。クラウドソーシングによる学習認識の流れを図15に示す。ステップS4001において、ラベル決定部112は、第3の実施形態と同様に図13に示したフローでラベルを決定する。ここでは、学習データ100のうち学習を行うデータはラベルを決定できる段階までラベル付けを完了させておく。また、条件によっては決定ラベルが付与されているだけでなく、各学習データにおける確定度が一定値以上であることも確認しておく。
次にステップS4002において、学習部117は、学習データ100と対応する決定ラベルを用いて教師あり学習を行い、予測モデルを推定する。
次にステップS4003において、リクエスト受信部211は、クエリデータを受け取り、これを認識部118に送る。ここで、クエリデータとは、学習データ100と同様の形式のデータであり、例えば画像ファイルである。画像ファイルは図示しない画像取得部で取得する。ステップS4003は予測モデルが作成されると任意のタイミングで起こりうるイベントであり、一度S4002で予測モデルを作成した後は、必ずしもS4002の後に実行される必要はない。
次にステップS4004において、認識部118は、クエリデータに対して、先ほど求めた予測モデルに基づいて結果を予測(認識)する。予測した結果はラベルと同様の形式をしている。例えば、記号指定タイプの場合では、クエリデータに写っている動物が「猫」である、ということを予測(認識)したり、領域指定タイプの場合では、例えば被写体の顔領域だけを塗りつぶした結果を予測したりする。また、数値指定タイプの場合では、対象物体の姿勢を表す行列や四元数を予測する。予測(認識)した結果を返すことで、認識システムとして利用してもよいし、確定度計算部115の計算を改善してもよい。表示制御部114での比較対象に用いてもよい。
また、本実施形態では、第3の実施形態の情報処理装置に学習部117と認識部118を追加した形式で学習部117と認識部118について説明した。しかし、これに限るものでは無く、第1の実施形態や第2の実施形態に対して同様に学習部117と認識部118を持たせることもできる。
本実施形態によれば、ラベル決定部が決定した誤りの少ないラベルを用いて学習を行って予測モデルを生成し、予測モデルを用いて認識を行うことによって、高精度な認識を行うことができる。さらに、認識した結果を用いて確定度を高精度に求めることで、より信頼できる決定ラベルを得たり、データ抽出の精度が向上したりする。また、表示部114で認識結果を表示し、編集中のラベルと比較を行うことで、ラベラーがラベル付けを行う際に誤りを減らす手助けにもなる。
(第5の実施形態)
第5の実施形態にかかる情報処理装置50000は、ラベラーが付けたラベルと既存のラベルの比較を行い、ラベラーの信頼度を評価する機能を備える。ラベラーの評価を高精度に行うことによって、ラベル付け作業に対する報酬を適切に支払うことや、ラベラー自身のモチベーション向上や作業効率のアップにもつながる。また、誤ったラベルを付けようとする悪意のあるラベラーを特定することもできる。
図16は第5の実施形態にかかる情報処理装置50000の構成例を示すブロック図である。第5の実施形態における構成例は、図8に示した第2の実施形態における構成例と共通する部分が多いため、差異があるラベラー評価部119について説明する。なお、第5の実施形態にかかる情報処理装置は、図8に示した第2の実施形態にかかる情報処理装置と比して表示制御部114を備えていないが、ラベラー評価部119の評価結果を表示制御部114を介して表示装置30に表示させるようにしてもよい。
ラベラー評価部119は、ラベラーが新たに付けたラベルについて、決定ラベルまたは出力ラベルとの比較を行い、新たに付けたラベルを評価する。そして、ラベラーが付けたラベル群全体の評価に基づいてラベラーの評価を行う。ラベラーの評価が成されると、ラベラーの信頼度がより精度よく求まるために、決定ラベルの誤りも減らすことができる。また、クラウドソーシング102において、ラベラーへの報酬を決める要素としても用いることができる。
まずラベルの評価方法について説明する。ラベラーが付けた新たなラベルが、ラベル決定部112で求めた決定ラベル、または認識部118で予測モデルを用いて求めた出力ラベルに対して、ラベル比較部113を用いて類似度を求めることで評価する。類似度の計算方法については、第2の実施形態で説明した通りである。評価値=類似度などとして、類似性が高いほど高い評価となるように0〜1の範囲で評価値を定める。決定ラベルと出力ラベルは理想的には同じラベルになっていると考えられるため、どちらと類似度を求めてもよいし、両方との類似度を求めてそれらの平均値を評価値としてもよい。しかし、もし決定ラベルと出力ラベルが大きく異なっている場合には、ラベル決定部112における式(1)の計算において、属性情報に適切でない設定が成されている可能性や、学習部117における予測モデルの学習が失敗している可能性などが考えられる。そのような場合には、新たに付けたラベルに対して正確な評価ができないため、その学習データに対するラベルの評価は無効とする。
次にラベラーの評価方法について説明する。ここでは、ラベラーの報酬パラメータRwとラベラーの信頼度Rを求める。上述した方法によって、ラベラーが付けたラベルは、評価が無効なものを除けば、学習データごとに類似度に基づく上述の評価値v(k)(k=1、…、p)が得られる。そして以下の式によってラベラーの報酬パラメータRwを求める。
Rw=Σf(R)*v(k) (5)
ここで、fおよびRは式(1)でも用いた単調増加の関数とラベラーの信頼度である。例えばf(R)=1+Rである。また信頼度Rについては後述の式(6)で求められる。ラベラーの報酬パラメータRwに基づいて、クラウドソーシングにおけるラベラーの報酬が決定する。学習データ100に対してラベル付けが続けられている間は決定ラベルや予測モデル等は随時変化するため、その段階でRwを求めたとしても正確な値であるとは限らない。よって、学習データ100に対して、ラベル付けが完了したと見なされたデータに対するラベルから、報酬パラメータが定義できるようになる。ただし、ラベラーの信頼度Rはその時点でのRを用いるものとする。式(5)に示すようにRwはラベル付けが完了したデータごとに次々に加算していけばよい。次にラベラーの信頼度Rは以下の式で求める。
R=W(p)*Πv(k) (6)
ここで、W(p)は式(3)におけるW(n)と同様の関数であり、評価値の数pに応じてRの最大値を決める0〜1の関数である。求めたラベラーの信頼度Rはラベラーの属性情報として更新される。ラベラーの信頼度Rが閾値未満になると、そのラベラーは誤りラベルばかりを付与する悪意のあるラベラーとして認識され、そのラベラーが付けて来たラベル情報を軽視。または削除する。また、報酬パラメータの重み係数を極端に小さくしたりするなどの対策を講じてもよい。逆にラベラーの信頼度Rが閾値以上の場合には、式(1)で定めたS(j)の値が大きくなるため、ラベル決定部112や確定度計算部115で求める決定ラベルや確定度におけるそのラベラーの影響が大きくなる。
このようにして、ラベル付けされた結果からラベラーの信頼度Rを求めることで、ラベル誤りを付与する悪意のあるラベラーを容易に特定することができるようになる。さらに、ラベルを決定する際には、より信頼度の高いラベラーのラベルが優先されるため、ラベルの精度も向上する。また、悪意が無くとも時々に応じてラベル付けの精度が変わるラベラーに対して、信頼度Rが下がった時にアラートを出してもよい。こうすることで、ラベラーに対して正しいラベル付けの教育的効果や、不注意によるミスの防止などを知らせることができる。
次に、本実施形態の情報処理装置50000による処理の手順について図17を参照して説明する。まずステップS5001において、対象のラベラーはラベル付けを行う。
次にステップS5002において、対象としている学習データについてラベル付けが完了したか判定する。ラベル付けの完了判定基準としては、確定度が閾値以上であること、決定ラベルと出力ラベルの類似度が高いことのいずれかまたは両方とする。ラベル付けが完了していない場合にはステップS5011へ、ラベル付けが完了した場合にはステップS5003へ進む。
次にステップ5003において、ラベル比較部113が求めた類似度に基づいてラベラー評価部119がラベル評価値を求める。
次にステップS5004において、ラベラー評価部119を用いて式(6)に基づいてラベラーの信頼度を求め、ラベル属性情報管理部110がラベラー信頼度を更新する。
次にステップS5005において、ラベラー信頼度が閾値以上であるかを判定する。ラベラー信頼度が閾値未満の場合には、ステップS5012へ、閾値以上の場合には、ステップS5006へ進む。
次にステップS5006において、式(5)に基づいて報酬パラメータを計算する。
また、ステップS5011では、ラベル付けが完了するまで、データ抽出部116はデータを抽出してラベラーにラベル付けを依頼することを繰り返す。ただし、データ抽出部116が毎回1つずつデータを抽出する方法に限るものでは無く、データ抽出部116は最初にまとめてデータを抽出しておき、データがなくなるまでラベラーにラベル付けを依頼してもよい。
また、ステップS5012では、ラベラー信頼度が閾値未満の場合に、そのラベラーを悪意のあるラベラーとして認識し、そのラベラーが付けたラベルの情報を削除したり、重みを減らしたり、式(5)におけるf(R)を0または非常に小さな値に設定する。
本実施形態によれば、ラベル付け結果に基づいてラベラーの評価を行い、ラベラー信頼度を更新して、より信頼できる誤りの可能性の少ないラベルを求めることができる。また、ラベラー評価に基づいて、ラベラーへの報酬を定めることで、ラベラーのモチベーション向上や作業効率のアップを期待することができる。また、悪意のあるラベラーを特定することで、ラベルの決定や予測モデルの生成への悪影響を軽減することができる。
なお、上記説明した各実施形態にかかる情報処理装置の構成を適宜組み合わせて使用することができる。
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。

Claims (20)

  1. 複数の学習データそれぞれに対して、学習データに対して付与されたラベルと前記ラベルに対応する属性情報とを対応付けて複数記憶する記憶手段と、
    前記複数の学習データのうちの着目学習データについて、該着目学習データに対応する複数のラベルと該ラベルに対応する前記属性情報とに基づいて、前記着目学習データに対するラベルを決定するラベル決定手段とを備える情報処理装置。
  2. 更に、前記着目学習データに対して付与されている複数のラベルそれぞれに対する評価値を導出する評価手段を備え、
    前記決定手段は、前記評価値に基づいて前記着目学習データに対応するラベルを決定することを特徴とする請求項1に記載の情報処理装置。
  3. 前記評価手段は、前記属性情報に基づいて前記評価値を導出することを特徴とする請求項2に記載の情報処理装置。
  4. 前記属性情報は、該属性情報に対応するラベルを付与したユーザが該ラベルが正しいとする自信の度合いを表す自信度であることを特徴とする請求項1乃至3のいずれか1項に記載の情報処理装置。
  5. 前記属性情報は、学習データのラベルを識別する識別器が前記学習データに対して付与した結果の尤度であることを特徴とする請求項1乃至4のいずれか1項に記載の情報処理装置。
  6. 更に、前記記憶手段に記憶されているラベルを表示装置に表示させる表示制御手段を備えることを特徴とする請求項1乃至3の何れか1項に記載の情報処理装置。
  7. 更に、前記記憶手段に記憶されている第1のラベルと第2のラベルとを比較するラベル比較手段を備え、
    前記表示制御手段は、前記ラベル比較手段によって比較した結果を前記表示装置に表示させることを特徴とする請求項6に記載の情報処理装置。
  8. 前記ラベル比較手段は、複数のラベル間の類似度または一致度を算出し、
    前記表示制御手段は、前記導出された類似度または前記一致度を表示させることを特徴とする請求項7に記載の情報処理装置。
  9. 前記表示制御手段は、前記属性情報に基づいて、前記ラベルをフィルタリングまたはソートして表示する機能を備える請求項6に記載の情報処理装置。
  10. 前記表示制御手段は、ユーザがラベル付けを行っている時に、前記表示装置にラベル付けを行っているデータに関連するラベル付きデータを比較して表示させることを備える請求項6に記載の情報処理装置。
  11. 更に、前記決定されたラベルの尤もらしさを表す確定度を前記ラベルと前記属性情報に基づいて計算するための確定度導出手段を備える請求項1に記載の情報処理装置。
  12. 更に、前記決定されたラベルを基にして予測モデルを学習するための学習手段と、
    前記予測モデルを用いて認識を行う認識手段をさらに備えることを特徴とする請求項11に記載の情報処理装置。
  13. 前記確定度導出手段は、前記認識手段で認識した結果に基づいて確定度を導出することを特徴とする請求項12に記載の情報処理装置。
  14. 前記確定度に基づいて、学習データ群の中からラベル付けを依頼するデータ群を抽出するデータ抽出手段をさらに備える請求項11乃至13のいずれか1項に記載の情報処理装置。
  15. 前記データ抽出手段は、前記確定度が低いデータを優先して抽出することを特徴とする請求項14に記載の情報処理装置。
  16. 前記データ抽出手段は、すでにラベルが付与されている学習データを所定数以上は含むように前記データ群を抽出することを特徴とする請求項15に記載の情報処理装置。
  17. 更に、前記学習データに付与されているラベル付と前記ラベル決定手段によって決定されたラベルとの類似度を計算した結果に基づいて、前記学習データに付与されているラベル付けを評価するラベル評価手段を備えることを特徴とする請求項1乃至16の何れか1項に記載の情報処理装置。
  18. 更に、前記ラベル評価手段によって評価されたラベルに基づいて、ラベル付けを行った人またはアルゴリズムの信頼度を導出する信頼度導出手段を備えることを特徴とする請求項17に記載の情報処理装置。
  19. 複数の学習データそれぞれに対して、学習データに対して付与されたラベルと前記ラベルに対応する属性情報とを対応付けて複数記憶する記憶工程と、
    前記複数の学習データのうちの着目学習データについて、該着目学習データに対応する複数のラベルと該ラベルに対応する前記属性情報とに基づいて、前記着目学習データに対するラベルを決定するラベル決定工程とを備える情報処理方法。
  20. コンピュータを、請求項1乃至18のいずれか1項に記載の情報処理装置の各手段として機能させることを特徴とするプログラム。
JP2017134662A 2016-12-22 2017-07-10 情報処理装置、情報処理方法、プログラム Active JP6946081B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2016249170 2016-12-22
JP2016249170 2016-12-22

Publications (2)

Publication Number Publication Date
JP2018106662A true JP2018106662A (ja) 2018-07-05
JP6946081B2 JP6946081B2 (ja) 2021-10-06

Family

ID=62629869

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017134662A Active JP6946081B2 (ja) 2016-12-22 2017-07-10 情報処理装置、情報処理方法、プログラム

Country Status (2)

Country Link
US (1) US11551134B2 (ja)
JP (1) JP6946081B2 (ja)

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020035116A (ja) * 2018-08-29 2020-03-05 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 寄与度決定方法、寄与度決定装置及びプログラム
WO2020090076A1 (ja) * 2018-11-01 2020-05-07 日本電気株式会社 回答統合装置、回答統合方法および回答統合プログラム
JP2020098556A (ja) * 2018-12-17 2020-06-25 クラウドワークス インコーポレイテッドCrowdWorks, Inc. 検証用注釈処理作業を用いた実施用注釈処理作業の検証方法及び装置
JP2020126311A (ja) * 2019-02-01 2020-08-20 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America アノテーション装置、アノテーション方法、及び、プログラム
JP2020129322A (ja) * 2019-02-12 2020-08-27 日本電信電話株式会社 モデル学習装置、ラベル推定装置、それらの方法、およびプログラム
JPWO2020188701A1 (ja) * 2019-03-18 2020-09-24
JP2020187408A (ja) * 2019-05-10 2020-11-19 株式会社日立システムズ 学習データ作成支援システムおよび学習データ作成支援方法
WO2020250891A1 (ja) * 2019-06-10 2020-12-17 アミフィアブル株式会社 スポーツ動画管理システム
JP2021010970A (ja) * 2019-07-05 2021-02-04 京セラドキュメントソリューションズ株式会社 ロボットシステム及びロボット制御方法
JPWO2019167556A1 (ja) * 2018-02-27 2021-02-04 国立大学法人九州工業大学 ラベル収集装置、ラベル収集方法及びラベル収集プログラム
JP2021015402A (ja) * 2019-07-11 2021-02-12 富士通株式会社 判定処理プログラム、判定処理方法および情報処理装置
WO2021095693A1 (ja) * 2019-11-14 2021-05-20 キヤノン株式会社 情報処理装置、情報処理方法およびプログラム
WO2021140604A1 (ja) * 2020-01-09 2021-07-15 国立大学法人長崎大学 教師データの作成システム及び教師データの作成方法
WO2021193025A1 (ja) * 2020-03-25 2021-09-30 パナソニックIpマネジメント株式会社 データ生成方法、判定方法、プログラム、及び、データ生成システム
WO2021245924A1 (ja) * 2020-06-05 2021-12-09 日本電信電話株式会社 処理装置、処理方法および処理プログラム
JP2022002099A (ja) * 2021-03-25 2022-01-06 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド データをラベリングするための方法、装置、電子機器、記憶媒体およびコンピュータプログラム
JP2022078129A (ja) * 2021-06-30 2022-05-24 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド データラベリング方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム
WO2022123905A1 (ja) * 2020-12-07 2022-06-16 パナソニックIpマネジメント株式会社 処理システム、学習処理システム、処理方法、及びプログラム
WO2022185360A1 (ja) * 2021-03-01 2022-09-09 日本電信電話株式会社 支援装置、支援方法およびプログラム
WO2022224378A1 (ja) * 2021-04-21 2022-10-27 株式会社Apto データ収集システムおよびそのプログラム
WO2022234692A1 (ja) * 2021-05-06 2022-11-10 ソニーセミコンダクタソリューションズ株式会社 情報処理方法、情報処理装置およびプログラム
JP7467595B2 (ja) 2020-03-10 2024-04-15 オリンパス株式会社 画像処理システム、画像処理装置、内視鏡システム、画像処理方法及びプログラム
JP7482537B2 (ja) 2020-01-09 2024-05-14 国立大学法人 長崎大学 教師データの作成システム

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7308421B2 (ja) * 2018-07-02 2023-07-14 パナソニックIpマネジメント株式会社 学習装置、学習システム、及び学習方法
US11164036B2 (en) * 2018-08-30 2021-11-02 The Government Of The United States Of America, As Represented By The Secretary Of The Navy Human-assisted machine learning through geometric manipulation and refinement
CN110717785A (zh) * 2019-09-29 2020-01-21 支付宝(杭州)信息技术有限公司 基于标签分布学习的决策方法、系统及装置
US20220374930A1 (en) * 2021-05-18 2022-11-24 At&T Intellectual Property I, L.P. Machine learning models with accurate data labeling

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011203991A (ja) * 2010-03-25 2011-10-13 Sony Corp 情報処理装置、情報処理方法、およびプログラム
US20130132308A1 (en) * 2011-11-22 2013-05-23 Gregory Jensen Boss Enhanced DeepQA in a Medical Environment
JP2013120534A (ja) * 2011-12-08 2013-06-17 Mitsubishi Electric Corp 関連語分類装置及びコンピュータプログラム及び関連語分類方法
JP2015129988A (ja) * 2014-01-06 2015-07-16 日本電気株式会社 データ処理装置
JP2015166975A (ja) * 2014-03-04 2015-09-24 富士ゼロックス株式会社 注釈情報付与プログラム及び情報処理装置
JP2016115245A (ja) * 2014-12-17 2016-06-23 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080086432A1 (en) * 2006-07-12 2008-04-10 Schmidtler Mauritius A R Data classification methods using machine learning techniques
US8165974B2 (en) * 2009-06-08 2012-04-24 Xerox Corporation System and method for assisted document review
US9483751B2 (en) * 2011-02-18 2016-11-01 Google Inc. Label privileges
JP2012194691A (ja) 2011-03-15 2012-10-11 Olympus Corp 識別器の再学習方法、再学習のためのプログラム、及び画像認識装置
US9269053B2 (en) * 2011-04-28 2016-02-23 Kroll Ontrack, Inc. Electronic review of documents
US9087303B2 (en) * 2012-02-19 2015-07-21 International Business Machines Corporation Classification reliability prediction
US9002842B2 (en) * 2012-08-08 2015-04-07 Equivio Ltd. System and method for computerized batching of huge populations of electronic documents
US20140207786A1 (en) * 2013-01-22 2014-07-24 Equivio Ltd. System and methods for computerized information governance of electronic documents
US9122681B2 (en) * 2013-03-15 2015-09-01 Gordon Villy Cormack Systems and methods for classifying electronic information using advanced active learning techniques
JP5984153B2 (ja) 2014-09-22 2016-09-06 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 情報処理装置、プログラム、及び情報処理方法
US9641770B2 (en) * 2015-06-18 2017-05-02 Wasaka Llc Algorithm and devices for calibration and accuracy of overlaid image data
US10242001B2 (en) * 2015-06-19 2019-03-26 Gordon V. Cormack Systems and methods for conducting and terminating a technology-assisted review
US10504037B1 (en) * 2016-03-31 2019-12-10 Veritas Technologies Llc Systems and methods for automated document review and quality control
RU2637883C1 (ru) * 2016-06-20 2017-12-07 Общество С Ограниченной Ответственностью "Яндекс" Способ создания обучающего объекта для обучения алгоритма машинного обучения
US10902066B2 (en) * 2018-07-23 2021-01-26 Open Text Holdings, Inc. Electronic discovery using predictive filtering
US20210089963A1 (en) * 2019-09-23 2021-03-25 Dropbox, Inc. Cross-model score normalization
US20210158209A1 (en) * 2019-11-27 2021-05-27 Amazon Technologies, Inc. Systems, apparatuses, and methods of active learning for document querying machine learning models
US20220108082A1 (en) * 2020-10-07 2022-04-07 DropCite Inc. Enhancing machine learning models to evaluate electronic documents based on user interaction

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011203991A (ja) * 2010-03-25 2011-10-13 Sony Corp 情報処理装置、情報処理方法、およびプログラム
US20130132308A1 (en) * 2011-11-22 2013-05-23 Gregory Jensen Boss Enhanced DeepQA in a Medical Environment
JP2013120534A (ja) * 2011-12-08 2013-06-17 Mitsubishi Electric Corp 関連語分類装置及びコンピュータプログラム及び関連語分類方法
JP2015129988A (ja) * 2014-01-06 2015-07-16 日本電気株式会社 データ処理装置
JP2015166975A (ja) * 2014-03-04 2015-09-24 富士ゼロックス株式会社 注釈情報付与プログラム及び情報処理装置
JP2016115245A (ja) * 2014-12-17 2016-06-23 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
小山 聡 SATOSHI OYAMA: ""クラウドソーシングにおけるワーカーの確信度を用いた高精度なラベル統合 Accurate Integration of Crowd", 第27回全国大会論文集 [CD−ROM] 2013年度 人工知能学会全国大会(第27回)論文集 THE, JPN6021020603, 4 June 2013 (2013-06-04), ISSN: 0004517489 *

Cited By (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7320280B2 (ja) 2018-02-27 2023-08-03 国立大学法人九州工業大学 ラベル収集装置、ラベル収集方法及びラベル収集プログラム
JPWO2019167556A1 (ja) * 2018-02-27 2021-02-04 国立大学法人九州工業大学 ラベル収集装置、ラベル収集方法及びラベル収集プログラム
JP7375135B2 (ja) 2018-08-29 2023-11-07 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 判定方法
JP7211735B2 (ja) 2018-08-29 2023-01-24 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 寄与度決定方法、寄与度決定装置及びプログラム
JP2020035116A (ja) * 2018-08-29 2020-03-05 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 寄与度決定方法、寄与度決定装置及びプログラム
WO2020090076A1 (ja) * 2018-11-01 2020-05-07 日本電気株式会社 回答統合装置、回答統合方法および回答統合プログラム
JP7063397B2 (ja) 2018-11-01 2022-05-09 日本電気株式会社 回答統合装置、回答統合方法および回答統合プログラム
JPWO2020090076A1 (ja) * 2018-11-01 2021-09-16 日本電気株式会社 回答統合装置、回答統合方法および回答統合プログラム
JP2020098556A (ja) * 2018-12-17 2020-06-25 クラウドワークス インコーポレイテッドCrowdWorks, Inc. 検証用注釈処理作業を用いた実施用注釈処理作業の検証方法及び装置
JP2020126311A (ja) * 2019-02-01 2020-08-20 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America アノテーション装置、アノテーション方法、及び、プログラム
JP7229795B2 (ja) 2019-02-01 2023-02-28 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ アノテーション装置、アノテーション方法、及び、プログラム
JP2020129322A (ja) * 2019-02-12 2020-08-27 日本電信電話株式会社 モデル学習装置、ラベル推定装置、それらの方法、およびプログラム
JP7298174B2 (ja) 2019-02-12 2023-06-27 日本電信電話株式会社 モデル学習装置、ラベル推定装置、それらの方法、およびプログラム
JP7255671B2 (ja) 2019-03-18 2023-04-11 日本電気株式会社 機械学習システム、情報端末、情報処理方法、プログラム
WO2020188701A1 (ja) * 2019-03-18 2020-09-24 日本電気株式会社 機械学習システム、情報端末、情報処理装置、情報処理方法、プログラム、学習済モデル、及び、学習済モデルを生産する方法
JPWO2020188701A1 (ja) * 2019-03-18 2020-09-24
JP2020187408A (ja) * 2019-05-10 2020-11-19 株式会社日立システムズ 学習データ作成支援システムおよび学習データ作成支援方法
JP7213138B2 (ja) 2019-05-10 2023-01-26 株式会社日立システムズ 学習データ作成支援システムおよび学習データ作成支援方法
WO2020250891A1 (ja) * 2019-06-10 2020-12-17 アミフィアブル株式会社 スポーツ動画管理システム
JP2021010970A (ja) * 2019-07-05 2021-02-04 京セラドキュメントソリューションズ株式会社 ロボットシステム及びロボット制御方法
JP7404679B2 (ja) 2019-07-11 2023-12-26 富士通株式会社 判定処理プログラム、判定処理方法および情報処理装置
JP2021015402A (ja) * 2019-07-11 2021-02-12 富士通株式会社 判定処理プログラム、判定処理方法および情報処理装置
WO2021095693A1 (ja) * 2019-11-14 2021-05-20 キヤノン株式会社 情報処理装置、情報処理方法およびプログラム
WO2021140604A1 (ja) * 2020-01-09 2021-07-15 国立大学法人長崎大学 教師データの作成システム及び教師データの作成方法
JP7482537B2 (ja) 2020-01-09 2024-05-14 国立大学法人 長崎大学 教師データの作成システム
JP7467595B2 (ja) 2020-03-10 2024-04-15 オリンパス株式会社 画像処理システム、画像処理装置、内視鏡システム、画像処理方法及びプログラム
WO2021193025A1 (ja) * 2020-03-25 2021-09-30 パナソニックIpマネジメント株式会社 データ生成方法、判定方法、プログラム、及び、データ生成システム
WO2021245924A1 (ja) * 2020-06-05 2021-12-09 日本電信電話株式会社 処理装置、処理方法および処理プログラム
JP7389389B2 (ja) 2020-06-05 2023-11-30 日本電信電話株式会社 処理装置、処理方法および処理プログラム
WO2022123905A1 (ja) * 2020-12-07 2022-06-16 パナソニックIpマネジメント株式会社 処理システム、学習処理システム、処理方法、及びプログラム
WO2022185360A1 (ja) * 2021-03-01 2022-09-09 日本電信電話株式会社 支援装置、支援方法およびプログラム
US11604766B2 (en) 2021-03-25 2023-03-14 Beijing Baidu Netcom Science And Technology Co., Ltd. Method, apparatus, device, storage medium and computer program product for labeling data
JP7270691B2 (ja) 2021-03-25 2023-05-10 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド データをラベリングするための方法、装置、電子機器、記憶媒体およびコンピュータプログラム
JP2022002099A (ja) * 2021-03-25 2022-01-06 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド データをラベリングするための方法、装置、電子機器、記憶媒体およびコンピュータプログラム
WO2022224378A1 (ja) * 2021-04-21 2022-10-27 株式会社Apto データ収集システムおよびそのプログラム
WO2022234692A1 (ja) * 2021-05-06 2022-11-10 ソニーセミコンダクタソリューションズ株式会社 情報処理方法、情報処理装置およびプログラム
JP2022078129A (ja) * 2021-06-30 2022-05-24 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド データラベリング方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム

Also Published As

Publication number Publication date
US20180181885A1 (en) 2018-06-28
US11551134B2 (en) 2023-01-10
JP6946081B2 (ja) 2021-10-06

Similar Documents

Publication Publication Date Title
JP6946081B2 (ja) 情報処理装置、情報処理方法、プログラム
US20190251471A1 (en) Machine learning device
Hara et al. Tohme: detecting curb ramps in google street view using crowdsourcing, computer vision, and machine learning
US10460256B2 (en) Interactive performance visualization of multi-class classifier
AU2016201273B2 (en) Recommending form fragments
CN106980867A (zh) 将嵌入空间中的语义概念建模为分布
JP7353946B2 (ja) アノテーション装置および方法
CN102365645A (zh) 通过关联面部来组织数字图像
US11397764B2 (en) Machine learning for digital image selection across object variations
CN110858327A (zh) 验证训练数据的方法、训练系统以及计算机程序产品
US9600893B2 (en) Image processing device, method, and medium for discriminating a type of input image using non-common regions
JP2007026316A (ja) 画像管理装置、ならびに画像管理用コンピュータプログラムおよびそれを記録した記録媒体
TW202009681A (zh) 樣本標註方法及裝置、損傷類別的識別方法及裝置
KR102326740B1 (ko) 자동 기계학습을 통한 자동 진화형 플랫폼 구현 방법 및 장치
WO2023109631A1 (zh) 数据处理方法、装置、设备、存储介质及程序产品
US20230024586A1 (en) Learning device, learning method, and recording medium
JP6116650B1 (ja) 学習支援システム、学習支援方法、学習支援装置、および学習支援プログラム
WO2016125418A1 (ja) 画像表示制御装置,画像表示制御方法,および画像表示制御プログラムならびにそのプログラムを格納した記録媒体
JP2021096515A (ja) 文書管理装置及び文書管理プログラム
CN116453226A (zh) 基于人工智能的人体姿态识别方法、装置及相关设备
US11605232B2 (en) System and method for road sign ground truth construction with a knowledge graph and machine learning
US10095802B2 (en) Methods and systems for using field characteristics to index, search for, and retrieve forms
JP6617315B1 (ja) 情報処理装置及びプログラム
CN112819925A (zh) 病灶标注的处理方法、装置、电子设备和介质
JP2020126328A5 (ja)

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200702

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210519

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210601

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210715

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210817

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210915

R151 Written notification of patent or utility model registration

Ref document number: 6946081

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151