JP7063393B2 - 教師データ拡張装置、教師データ拡張方法およびプログラム - Google Patents

教師データ拡張装置、教師データ拡張方法およびプログラム Download PDF

Info

Publication number
JP7063393B2
JP7063393B2 JP2020551050A JP2020551050A JP7063393B2 JP 7063393 B2 JP7063393 B2 JP 7063393B2 JP 2020551050 A JP2020551050 A JP 2020551050A JP 2020551050 A JP2020551050 A JP 2020551050A JP 7063393 B2 JP7063393 B2 JP 7063393B2
Authority
JP
Japan
Prior art keywords
teacher data
unit
feature
features
expansion device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020551050A
Other languages
English (en)
Other versions
JPWO2020070876A1 (ja
Inventor
秀昭 佐藤
恭太 比嘉
浩太 岩元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2020070876A1 publication Critical patent/JPWO2020070876A1/ja
Application granted granted Critical
Publication of JP7063393B2 publication Critical patent/JP7063393B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、教師データ拡張装置、教師データ拡張方法およびプログラムに関する。
教師あり機械学習では、学習対象を撮影した画像または学習対象に関するセンサデータなど学習対象の特徴を示すデータと、正解(正しい学習結果)を示すラベルとが組み合わせられた教師データを用いて機械学習を行う。
例えば、特許文献1には、部品が使用開始されてから故障するまでの長さを予測するために、部品に対して与えられる振動の特徴を表す特徴量と、部品が使用開始されてから故障するまでの時間の長さを示すラベルとの組を教師データとして用いて機械学習を行うことが記載されている。
また、学習対象に関する撮影データまたはセンサデータをそのまま用いるだけでなく、加工したデータを機械学習に用いる場合がある。
例えば、特許文献2には、画像のクラス分けを行うために、画像情報から特徴量を抽出し、抽出された特徴量の組み合わせ(例えば、重み付け合計)による特徴を算出して機械学習を行うことが記載されている。
特開2018-72029号公報 特開2006-127446号公報
深層学習等の機械学習手法を用いて解析精度の良いモデル(例えば、識別器)を学習するためには、大量のデータが必要である。しかし、実環境で大量のデータを収集するために、一般的に時間を要し、また、長時間データを収集し続ける際の設備の管理等が、データ収集およびデータ処理を管理する担当者にとって負担となる。
機械学習のために実環境で収集する必要のあるデータ量を低減させることができれば、データ収集に要する時間を低減させることができ、その点で、データ収集およびデータ処理を管理する担当者の負担を低減させることができる。
本発明の目的の一例は、上述の課題を解決することのできる、教師データ拡張装置、教師データ拡張方法およびプログラムを提供することである。
本発明の第1の態様によれば、教師データ拡張装置は、複数の教師データの各々に含まれる複数の特徴の関係を求める関係取得部と、前記関係に基づいて前記複数の特徴のうち何れか1つ以上を選択する特徴選択部と、1つ以上の教師データについて、前記特徴選択部が選択した特徴の値を、同じクラスに分類される他の教師データにおけるその特徴の値に入れ替えた新たな教師データを生成する教師データ拡張部と、を備える。
本発明の第2の態様によれば、教師データ拡張方法は、複数の教師データの各々に含まれる複数の特徴の関係を求める工程と、前記関係に基づいて前記複数の特徴のうち何れか1つ以上を選択する工程と、1つ以上の教師データについて、選択された前記特徴の値を、同じクラスに分類される他の教師データにおけるその特徴の値に入れ替えた新たな教師データを生成する工程と、を含む。
本発明の第3の態様によれば、プログラムは、コンピュータに、複数の教師データの各々に含まれる複数の特徴の関係を求める工程と、前記関係に基づいて前記複数の特徴のうち何れか1つ以上を選択する工程と、1つ以上の教師データについて、選択された前記特徴の値を、同じクラスに分類される他の教師データにおけるその特徴の値に入れ替えた新たな教師データを生成する工程と、を実行させるためのプログラムである。
上記した教師データ拡張装置、教師データ拡張方法およびプログラムによれば、機械学習のために実環境で収集する必要のあるデータ量を低減させることができる。
第1実施形態に係る教師データ拡張装置の機能構成の例を示す概略ブロック図である。 第1実施形態に係る実教師データの例を示す図である。 第1実施形態に係る教師データ拡張部が生成する人工教師データの例を示す図である。 第1実施形態に係る教師データ拡張装置が行う処理の例を示すフローチャートである。 第2実施形態に係る教師データ拡張装置の機能構成の例を示す概略ブロック図である。 第2実施形態に係る表示部による人工教師データの表示画面の例を示す図である。 第2実施形態に係る教師データ拡張装置が行う処理の例を示すフローチャートである。 第3実施形態に係る教師データ拡張装置の機能構成の例を示す概略ブロック図である。 第3実施形態に係る機械学習部による学習結果の表示例を示す図である。 第3実施形態に係る教師データ拡張装置が行う処理の例を示すフローチャートである。 第4実施形態に係る教師データ拡張装置の構成の例を示す図である。 少なくとも1つの実施形態に係るコンピュータの構成例を示す概略ブロック図である。
以下、本発明の実施形態を説明するが、以下の実施形態は請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
<第1実施形態>
図1は、第1実施形態に係る教師データ拡張装置の機能構成の例を示す概略ブロック図である。図1に示す構成で、教師データ拡張装置100は、記憶部170と、処理部180とを備える。記憶部170は、ラベル情報記憶部171と、教師データ記憶部172とを備える。処理部180は、特徴抽出部181と、実教師データ生成部182と、関係取得部183と、特徴選択部184と、教師データ拡張部185とを備える。
教師データ拡張装置100は、教師データを取得し、取得した教師データにおける特徴の値を入れ替えることで新たな教師データを生成する。教師データ拡張装置100が、例えばパソコン(Personal Computer;PC)またはワークステーション(Workstation)等のコンピュータを用いて構成されていてもよい。あるいは、教師データ拡張装置100が、専用のハードウェアを用いて構成されていてもよい。
記憶部170は、各種データを記憶する。記憶部170は、教師データ拡張装置100が備える記憶デバイスを用いて構成される。
ラベル情報記憶部171は、ラベル情報を記憶する。ラベル情報は、入力データに示される分類対象が分類されるクラスを示す情報である。ラベル情報は、教師有り学習におけるラベル(正解)として用いられる。入力データが時系列画像のデータである場合、ラベル情報が入力データに対して時系列画像単位で付与されていてもよいし、画像単位で付与されていてもよい。
教師データ記憶部172は、実教師データ生成部182が生成する実教師データ、及び、教師データ拡張部185が生成する人工教師データを記憶する。
ここでいう実教師データは、1つの分類対象を撮影した画像、または、その分類対象をセンシングしたセンサデータ、あるいはこれらの組み合わせを用いて生成されるなど、実際の分類対象の特徴を示す教師データである。
ここでいう人工教師データは、実教師データを加工して得られた教師データ、あるいは、計算によって得られた教師データなど、実際の分類対象の特徴とは異なる特徴を示す教師データである。
処理部180は、教師データ拡張装置100の各部を制御して各種処理を実行する。処理部180が、教師データ拡張装置100が備えるCPU(Central Processing Unit、中央処理装置)が記憶部170からプログラムを読み出して実行することで構成されていてもよい。あるいは、教師データ拡張装置100が、専用のハードウェアを用いて構成されていてもよい。
特徴抽出部181は、入力データを取得し、取得した入力データから分類対象を分類するための複数の特徴を抽出する。特徴抽出部181は、抽出した特徴を教師データ拡張部185に出力する。
以下では、入力データが画像データである場合を例に説明する。特徴抽出部181が、例えば、ビデオカメラやアナログカメラ等を用いて撮像された画像のデータを入力データとして取得するにしてもよい。あるいは、特徴抽出部181が、別の記憶媒体等に保存された画像データを入力データとして取得するようにしてもよい。
また、特徴抽出部181が、例えば、時間的に連続した複数枚の画像のデータを入力データとして取得するようにしてもよい。従って、特徴抽出部181が、画像データ、および、時間的に連続する複数枚の画像のデータのうち少なくとも何れか一方を入力データとして取得するようにしてもよい。時間的に連続した複数枚の画像を時系列画像と称する。
また、特徴抽出部181が、例えば、画像から、HOG(Histograms of Oriented Gradients)特徴、SURF(Speeded-Up Robust Features)特徴、色のヒストグラム等の人が設計した特徴、及び、オートエンコーダ等のニューラルネットワークが生成する特徴のうち何れか1つ、あるいはこれらの組み合わせを機械学習のための特徴として用いるようにしてもよい。
また、特徴抽出部181が、例えば、時間的に連続した複数枚の画像を束ねた時系列画像から、DT(Dense Trajectories)特徴、STIP(Space Time Interest Points)特徴、識別対象物体の時間的な見かけの変化、物体の周期的な運動パターン、物体の移動軌跡等の人が設計した特徴、および、オートエンコーダ等のニューラルネットワークが生成する特徴のうち何れか1つ、あるいはこれらの組み合わせを機械学習のための特徴として抽出するようにしてもよい。
特徴抽出部181が、分類対象を識別するために設計された特徴を入力データから抽出するようにしてもよい。あるいは、特徴抽出部181が、ニューラルネットワークを用いて特徴を設計し入力データから抽出するようにしてもよい。
実教師データ生成部182は、特徴抽出部181が抽出した複数の特徴と、ラベル情報記憶部171が記憶するラベル情報とを紐づけることにより実教師データを生成する。
関係取得部183は、複数の教師データの各々に含まれる複数の特徴の関係を求める。例えば、関係取得部183は、複数の実教師データの各々に含まれる複数の特徴の関係を求める。関係取得部183が求める関係は、無相関性あるいは独立性といった関係であってもよい。
特徴選択部184は、関係取得部183が求めた関係に基づいて、複数の特徴のうち何れか1つ以上を選択する。例えば、特徴選択部184は、特徴同士の無相関性および独立性のうち少なくとも何れか一方に基づいて、特徴の選択を行う。教師データに含まれる特徴同士が無相関性を有する場合、一方の特徴の値を加工しても、あるいは、他の値に置き換えても、他の特徴に影響を及ぼさないと考えられる。この点で、教師データに含まれる特徴のうち他の特徴と無相関性を有する特徴の値を加工するか、あるいは別の教師データにおけるその特徴の値と入れ替えて、新たな特徴を生成可能である。
教師データ拡張部185は、1つ以上の教師データについて、特徴選択部184が選択した特徴の値を、同じクラスに分類される他の教師データにおけるその特徴の値に入れ替えた新たな教師データを生成する。教師データ拡張部185が、実教師データに含まれる特徴の値を上記のように入れ替えて、新たな教師データを生成するようにしてもよい。
教師データ拡張部185は、生成した人工教師データを教師データ記憶部172に記憶させる。
教師データ拡張部185が行う処理の具体例として、色味と輝度を特徴とし、様々な店舗のナシとリンゴとを区別する識別器を生成することを考える。
図2は、実教師データの例を示す図である。図2のグラフの横軸は輝度を示し、縦軸は色味を示す。縦軸の色味は、原点に近いほど赤色成分が小さく、原点から遠いほど赤色成分が大きい。横軸の輝度は、原点に近いほど輝度が小さく、原点から遠いほど、輝度が大きい。
丸(○)で示される教師データD11は、リンゴの実教師データを示す。三角(△)で示される教師データD12は、ナシの実教師データを示す。
領域R11、R12、R13は、それぞれ店舗A、B、Cで撮影した画像から得られた輝度の範囲を示している。
図3は、教師データ拡張部185が生成する人工教師データの例を示す図である。図3のグラフの横軸は輝度を示し、縦軸は色味を示す。
丸(○)で示される教師データD11は、図2の場合と同じくリンゴの実教師データを示す。三角(△)で示される教師データD21は、図2の場合と同じくナシの実教師データを示す。
一方、破線の丸で示される教師データD12は、リンゴの人工教師データを示す。破線の三角で示される教師データD22は、ナシの人工教師データを示す。
教師データ拡張部185は、領域R11、R12、R13の少なくともいずれかに含まれる輝度の範囲内すなわち、店舗での撮影時の輝度の範囲内で色味の特徴量と組み合わせて新たな教師データを生成している。
組み合わせる特徴の選択を、人(例えばユーザ)が行うようにしてもよい。
特徴選択部184は、ラベル情報が同じ実教師データの中で組み合わせ可能な特徴として、無相関または、独立であるものを二つ以上選択し、選択した特徴を教師データ拡張部185に出力する。特徴選択部184が特徴を選択する方法について、リンゴとナシの識別を例にして説明するが、以下に説明する内容に限定されない。
リンゴとナシを識別するための特徴として、例えば、R成分が125以上であること(X1)、および、円形度が0.8以上であること(X2)があるとする。この場合の識別器の学習に必要な実教師データをXcn=(x1、x2)と示す。XcnがX1の特徴に該当すれば、Xcnのx1は“1”の値を有し、該当しなければ“0”の値を有する。同様に、XcnがX2の特徴に該当すれば、Xcnのx2は“1”の値を有し、該当しなければ“0”の値を有する。cは実教師データが該当するクラスを示す。nはn番目の実教師データであることを示す。
特徴選択部184は、実教師データを元にx1とx2に関して、例えば、各クラスのクロス集計表を作成し、カイ二乗検定を用いて特徴の独立性を判断し、組み合わせ可能な特徴を選択する。但し、特徴の独立性と無相関性を判断する方法は、この方法に限定されない。例えば、特徴選択部184が、その他の独立成分分析等の統計的な手法、または、情報量基準などを用いた手法等を用いるようにしてもよい。
上記のように、記憶部170は、教師データ拡張装置100が備える記憶デバイスを用いて構成される。記憶部170が、磁気記憶ディスク装置を用いて構成されていてもよいし、電子ディスク装置を用いて構成されていてもよい。
記憶部170の一部であるラベル情報記憶部171および教師データ記憶部172についても同様である。
上記のように、処理部180が、コンピュータを用いて構成されていてもよいし、専用のハードウェアを用いて構成されていてもよい。処理部180の各部についても同様である。
次に、教師データ拡張装置100の動作について説明する。
図4は、教師データ拡張装置100が行う処理の例を示すフローチャートである。教師データ拡張装置100は、例えば、人工教師データの生成を指示するユーザ操作を受けると、図4の処理を開始する。
図4の処理で、特徴抽出部181は、カメラ等の装置や外部記憶媒体等から得た画像から分類対対象を分類するための複数の特徴を抽出する(ステップS111)。
実教師データ生成部182は、特徴抽出部181から得られた複数の特徴と、ラベル情報記憶部171から得られたラベル情報とを紐づけることにより実教師データを生成する(ステップS112)。
関係取得部183は、実教師データに含まれる複数の特徴の関係を取得する(ステップS113)。
また、特徴選択部184は、実教師データ生成部182が生成した実教師データに含まれる複数の特徴のうちの何れか1つ以上を、関係取得部183が取得した関係に基づいて選択する(ステップS114)。例えば、特徴選択部184は、他の特徴との関係が無相関性または独立性である特徴を選択する。
教師データ拡張部185は、特徴選択部184が選択した特徴の値を、ラベル情報が同じ他の実教師データにおける同じ特徴の値と置き換えることで、人工教師データを生成する(ステップS115)。すなわち、教師データ拡張部185は、特徴選択部184が選択した特徴の値を、同じクラスに分類される他の実教師データにおける同じ特徴の値と置き換える。上記のように、教師データ拡張部185は、生成した人工教師データを教師データ記憶部172に記憶させる。
ステップS115の後、教師データ拡張装置100は、図4の処理を終了する。
以上のように、関係取得部183は、複数の教師データの各々に含まれる複数の特徴の関係を求める。特徴選択部184は、関係取得部183が求めた関係に基づいて複数の特徴のうち何れか1つ以上を選択する。教師データ拡張部185は、1つ以上の教師データについて、特徴選択部184が選択した特徴の値を、同じクラスに分類される他の教師データにおけるその特徴の値に入れ替えた新たな教師データを生成する。
教師データ拡張装置100によれば、実教師データに基づいて人工教師データを生成することで、機械学習のために実環境で収集する必要のあるデータ量を低減させることができる。
また、教師データ拡張装置100では、人工教師データを生成する際に、特徴の変更範囲を人手で定める必要がない。教師データ拡張装置100ではこの点で、1つ以上の特徴の変更範囲を決定する試行コストを低減させることができる。
また、特徴抽出部181は、入力データから複数の特徴を抽出する。ラベル情報記憶部171は、入力データに示される分類対象が分類されるクラスを示すラベル情報を記憶する。実教師データ生成部182は、特徴抽出部181が抽出した複数の特徴とラベル情報記憶部171が記憶するラベル情報とを紐づけることにより実教師データを生成する。関係取得部183は、複数の実教師データの各々に含まれる複数の特徴の関係を求める。
これにより、教師データ拡張装置100では、自らが生成した実教師データを用いて人工教師データを生成する。従って、教師データ拡張装置100は、他の装置から実教師データを取得する必要がない。
また、入力データは、画像、および、時間的に連続する複数枚の画像のうち少なくとも何れか一方である。
教師データ拡張装置100は、画像を用いた機械学習により、分類対象を分類することができる。
また、特徴抽出部181は、入力データから分類対象を識別するために設計された特徴を抽出する。
教師データ拡張装置100は、この特徴を含む教師データを用いて機械学習を行って、分類対象の分類を行うことができる。
特徴抽出部181が、ニューラルネットワークを用いて特徴を設計し抽出するようにしてもよい。
これにより、特徴抽出部181が、ニューラルネットワークを用いた機械学習にていろいろな特徴に対応できることが期待される。
特徴選択部184は、特徴同士の無相関性および独立性のうち少なくとも何れか一方に基づいて、特徴の選択を行う。
特徴同士に無相関性または独立性があることで、何れかの特徴の値を変更しても、他の特徴に影響を及ぼさないと考えられる。この点で、教師データ拡張装置100が生成する人工教師データを用いて高精度に機械学習を行えることが期待される。
また、教師データ拡張装置100によれば、人工教師データを生成する際に、変更させる特徴をユーザが判断して選択する必要、および、ユーザが特徴の変更範囲を定める必要がない。教師データ拡張装置100によれば、この点で、変更させる特徴の選定と一つ以上の特徴の変更範囲を決定するユーザ負荷を低減させることができる。
<第2実施形態>
図5は、第2実施形態に係る教師データ拡張装置の機能構成の例を示す概略ブロック図である。図2に示す構成で、教師データ拡張装置200は、表示部110と、操作入力部120と、記憶部170と、処理部180とを備える。記憶部170は、ラベル情報記憶部171と、教師データ記憶部172とを備える。処理部180は、特徴抽出部181と、実教師データ生成部182と、関係取得部183と、特徴選択部184と、教師データ拡張部185と、拡張結果表示処理部286とを備える。
図5の各部のうち、図1の各部に対応して同様の機能を有する部分には同一の符号(170、171、172、180、181、182、183、184、185)を付して説明を省略する。
教師データ拡張装置200は、表示部110および操作入力部120を備える点、および、処理部180が拡張結果表示処理部286を備える点で、教師データ拡張装置100(図1)と異なる。それ以外の点では、教師データ拡張装置200は、教師データ拡張装置100と同様である。
表示部110は、例えば液晶パネルまたはLED(Light Emitting Diode、発光ダイオード)等の表示画面を備え、各種画像を表示する。特に、表示部110は、教師データ拡張部185が生成する人工教師データを表示する。
操作入力部120は、例えばキーボードおよびマウス等の入力デバイスを備え、ユーザ操作を受け付ける。特に、操作入力部120は、人工教師データの生成の際に他の特徴に置き換える特徴を指示するユーザ操作を受け付ける。
拡張結果表示処理部286は、表示部110を制御して人工教師データを表示させる。
図6は、表示部110による人工教師データの表示画面の例を示す図である。
図6の例で、表示部110は、グラフに表示する特徴の選択欄と、選択された特徴に基づくグラフと、選択を確定させるための選択ボタンとを表示している。
操作入力部120が、グラフの縦軸、横軸それぞれに表示する特徴を指示するユーザ操作を受けると、表示部110は、特徴の選択欄の表示にユーザ操作を反映させる。また、特徴選択部184は、ユーザが指示する特徴を選択する。教師データ拡張部185は、特徴選択部184が選択した特徴の値を、同じクラスに分類される他の教師データにおけるその特徴の値に入れ替えた人工教師データを生成する。図6の例では、ユーザが特徴の選択を確定させる操作(選択ボタンの押下操作)を行うまでは、教師データ拡張部185は、人工教師データを仮生成する。
図6の例では、教師データ拡張部185が特徴1と特徴3との組み合わせで特徴を入れ替えで人工教師データを仮に生成し、表示部110が拡張結果表示処理部286の制御に従って、この人工教師データをグラフに表示している。
ユーザは、画面に表示されている特徴がクラスを分類する特徴として不適であると判断した場合、または組み合わせる特徴を変更したい場合は、特徴の選択欄に対する操作を行う。ユーザは、特徴の選択欄へのユーザ操作にてプルダウンメニューを表示部110に表示させ、表示されたプルダウンメニューから任意の特徴の選択を指示する。
特徴選択部184は、ユーザの指示に従って特徴の選択を更新する。教師データ拡張部185は、特徴選択部184が選択した特徴の値を、同じクラスに分類される他の教師データにおけるその特徴の値に入れ替えた人工教師データを生成する。このように、教師データ拡張部185が人工教師データを生成し直すと、表示部110は、拡張結果表示処理部286の制御に従って、人工教師データのグラフ表示を更新する。
なお、特徴選択部184が組み合わせ可能と判定した特徴のみが、プルダウンメニューに表示される。これにより、ユーザは、例えば、二つ以上のクラスのうち、特定のクラスだけを区別することに適した特徴を選ぶことができる。また、教師データ拡張装置200は、生成された実教師データ及び人工教師データの分布が、識別対象の分類に適しているかについて、ユーザにわかりやすく提示できる。
図6の例では、操作入力部120は、特徴3から特徴2に変更するよう指示するユーザ操作を受けている。特徴選択部184は、この指示を受けて特徴1および特徴2を選択し直す。教師データ拡張部185は、特徴選択部184が選択した特徴1および特徴3の値を、同じクラスに分類される他の教師データにおけるその特徴の値に入れ替えた人工教師データを仮に生成する。表示部110が拡張結果表示処理部286の制御に従って、グラフの表示を教師データ拡張部185が生成した人工教師データの表示に更新する。
ユーザは、提示された結果に対して、画像に含まれる物体のクラスの分類に適している特徴だと判断した場合は、選択ボタンの押下操作を行う。ユーザが選択ボタンに対するユーザ操作にて特徴の選択を確定させるよう指示すると、特徴選択部184は、生成している人工教師データを教師データ記憶部172に記憶させる。
第1実施形態で説明したのと同様、第2実施形態でも、記憶部170は、教師データ拡張装置200が備える記憶デバイスを用いて構成される。記憶部170が、磁気記憶ディスク装置を用いて構成されていてもよいし、電子ディスク装置を用いて構成されていてもよい。
記憶部170の一部であるラベル情報記憶部171および教師データ記憶部172についても同様である。
第1実施形態で説明したのと同様、第2実施形態でも、処理部180が、コンピュータを用いて構成されていてもよいし、専用のハードウェアを用いて構成されていてもよい。処理部180の各部についても同様である。
特徴の選択をユーザに提示する方法は、上述した画面表示による方法に限定されない。例えば、教師データ拡張装置300が、画面表示に加えて、あるいは代えて、音声出力にて特徴の選択をユーザに提示するようにしてもよい。
次に、教師データ拡張装置200の動作について説明する。
図7は、教師データ拡張装置200が行う処理の例を示すフローチャートである。図7のステップS211からS214は、図4のステップS111からS114と同様である。
ステップS215では、図4のステップS115の場合と同様、教師データ拡張部185が人工教師データを生成する。但し、ここでの人工教師データの生成は、仮の生成である。従って、この段階では教師データ拡張部185は、人工教師データを教師データ記憶部172に記憶させない。
ステップS215の後、表示部110は、教師データ拡張部185が仮に生成した人工教師データを、拡張結果表示処理部286の制御に従って表示する(ステップS216)。例えば、表示部110は、図6の例のように人工教師データをグラフに表示する。
次に、操作入力部120がユーザ操作を受け付ける(ステップS217)。処理部180は、特徴の選択を確定させるユーザ操作が行われたか否かを判定する(ステップS218)。図6の例では、特徴の選択を確定させるユーザ操作は、選択ボタンの押下操作によって行われる。特徴の選択を確定させない場合、ユーザは、特徴の選択を変更する操作を行う。図6の例の場合、ユーザは、表示部110にプルダウンメニューを表示させ、表示されたプルダウンメニューに示される特徴の何れかを選択する。
特徴の選択を確定させるユーザ操作が行われていないと処理部180が判定した場合(ステップS218:NO)、特徴選択部184は、ユーザの指示に従って特徴を選択し直す(ステップS221)。具体的には、特徴選択部184は、特徴の選択を変更するユーザ操作にて指定された特徴を選択する。
ステップS221の後、処理がステップS215へ戻る。
一方、特徴の選択を確定させるユーザ操作が行われたと処理部180が判定した場合(ステップS218:NO)、教師データ拡張部185は、生成している人工教師データを教師データ記憶部172に記憶させる(ステップS231)。
ステップS231の後、教師データ拡張装置200は、図7の処理を終了する。
以上のように、表示部110は、教師データ拡張部185が生成する教師データを表示する。操作入力部120は、他の特徴に置き換える特徴を指示するユーザ操作を受け付ける。特徴選択部184は、ユーザ操作に従って複数の特徴のうち何れか1つ以上を選択する。
教師データ拡張装置200によれば、人工教師データの生成にユーザの判断を反映させることができる。
例えば、教師データ拡張装置200が、生成した人工教師データの分布をグラフ表示にてユーザに提示することで、入力データに含まれる物体のクラスの分類に適しているかについてユーザが直観的に判断できる。特徴選択部184は、ユーザ操作を受けて、分類精度が最も高くなるような特徴を選択することができる。
<第3実施形態>
図8は、第3実施形態に係る教師データ拡張装置の機能構成の例を示す概略ブロック図である。図8に示す構成で、教師データ拡張装置300は、表示部110と、操作入力部120と、記憶部170と、処理部180とを備える。記憶部170は、ラベル情報記憶部171と、教師データ記憶部172と、辞書記憶部373とを備える。処理部180は、特徴抽出部181と、実教師データ生成部182と、関係取得部183と、特徴選択部184と、教師データ拡張部185と、拡張結果表示処理部286と、機械学習部387と、識別結果表示処理部388とを備える。
図8の各部のうち、図1または4の各部に対応して同様の機能を有する部分には同一の符号(110、120、170、171、172、180、181、182、183、184、185、286)を付して説明を省略する。
教師データ拡張装置300は、記憶部170が辞書記憶部373を備える点、および、処理部180が機械学習部387および識別結果表示処理部388を備える点で、教師データ拡張装置200(図4)と異なる。それ以外の点では、教師データ拡張装置300は、教師データ拡張装置200と同様である。
機械学習部387は、少なくとも教師データ拡張部185が生成した人工教師データを用いて識別機の機械学習を行う。例えば、機械学習部387は、実教師データおよび人工教師データの両方を用いて識別器の機械学習を行う。
機械学習部387が、例えば、SVM(Support Vector Machine)または深層学習などの機械学習の手法を用いて識別器を学習するようにしてもよい。また、学習部70が、例えばLSTM(Long Short Term Memory)等のネットワークを用いるようにしてもよい。そのために、記憶部170が、画像や時系列画像から抽出された特徴、および、時系列の識別結果を記憶するようにしてもよい。
辞書記憶部373は、機械学習部387による機械学習で得られた識別器を記憶する。
識別結果表示処理部388は、機械学習部387による学習結果を表示部110に表示させる。具体的には、識別結果表示処理部388は、機械学習部387による機械学習で得られた識別器に識別対象である画像を入力した場合の識別結果を表示部110に表示させる。
図9は、機械学習部387による学習結果の表示例を示す図である。図9に示すグラフの横軸と縦軸は、学習結果の識別器が識別に使用した特徴を示している。また、丸(○)および三角(△)の記号は、それぞれ、識別器に入力された画像の識別結果であるクラスを示している。
表示部110が、図6の場合と同様に特徴選択用のプルダウンメニューを表示し、処理部180が、ユーザ操作で指定された特徴をグラフの軸に設定して、学習結果の識別器に識別を行わせるようにしてもよい。
また、図9では、表示部110が2次元のグラフを用いて識別結果を表示する場合の例を示しているが、これに限定されない。組み合わせる特徴が3つ以上である場合、表示部110が、組み合わせる特徴の個数に応じた表示形態で識別結果を表示するようにしてもよい。
第1実施形態および第2実施形態で説明したのと同様、第3実施形態でも、記憶部170は、教師データ拡張装置300が備える記憶デバイスを用いて構成される。記憶部170が、磁気記憶ディスク装置を用いて構成されていてもよいし、電子ディスク装置を用いて構成されていてもよい。
記憶部170の一部であるラベル情報記憶部171、教師データ記憶部172および辞書記憶部373についても同様である。
第1実施形態および第2実施形態で説明したのと同様、第3実施形態でも、処理部180が、コンピュータを用いて構成されていてもよいし、専用のハードウェアを用いて構成されていてもよい。処理部180の各部についても同様である。
学習結果をユーザに提示する方法は、上述した画面表示による方法に限定されない。例えば、教師データ拡張装置300が、画面表示に加えて、あるいは代えて、音声出力にて学習結果をユーザに提示するようにしてもよい。
次に、教師データ拡張装置300の動作について説明する。
図10は、教師データ拡張装置300が行う処理の例を示すフローチャートである。図10のステップS311からS331は、図7のステップS211からS231と同様である。
ステップS331の後、機械学習部387は、教師データ記憶部172から実教師データおよび人工教師データを読み出し、得られた実教師データおよび人工教師データを用いて識別器を機械学習する(ステップS332)。機械学習部387は、機械学習の結果得らえた識別器を辞書記憶部373に記憶させる。
また、処理部180は、得らえた識別器を用いて画像の識別を行い、表示部110は、識別結果表示処理部388の制御に従って、識別器による識別結果を機械学習の結果として表示する(ステップS333)。
ステップS333の後、教師データ拡張装置300は図10の処理を終了する。
以上のように、機械学習部387は、少なくとも教師データ拡張部185が生成した人工教師データを用いて識別機の機械学習を行う。
教師データ拡張装置300によれば、得られる実教師データの数が比較的少なくても、人工教師データを用いることで、より多くの教師データを用いて機械学習を行うことができる。教師データ拡張装置300によれば、この点で、実教師データを取得するための負荷が軽くて済み、かつ、より多くの教師データを用いて高精度に機械学習を行うことができる。
<第4実施形態>
第4実施形態では、教師データ拡張装置の構成の例について説明する。
図11は、第4実施形態に係る教師データ拡張装置の構成の例を示す図である。図11に示す構成で、教師データ拡張装置10は、関係取得部11と、特徴選択部12と、教師データ拡張部13とを備える。
かかる構成にて、関係取得部11は、複数の教師データの各々に含まれる複数の特徴の関係を求める。特徴選択部12は、関係取得部11が求めた関係に基づいて複数の特徴のうち何れか1つ以上を選択する。教師データ拡張部13は、1つ以上の教師データについて、特徴選択部12が選択した特徴の値を、同じクラスに分類される他の教師データにおけるその特徴の値に入れ替えた新たな教師データを生成する。
教師データ拡張装置10によれば、実教師データに基づいて人工教師データを生成することで、機械学習のために実環境で収集する必要のあるデータ量を低減させることができる。
また、教師データ拡張装置10では、人工教師データを生成する際に、特徴の変更範囲を人手で定める必要がない。教師データ拡張装置10ではこの点で、1つ以上の特徴の変更範囲を決定する試行コストを低減させることができる。
図12は、少なくとも1つの実施形態に係るコンピュータの構成例を示す概略ブロック図である。図12に示す構成で、コンピュータ500は、CPU510と、主記憶装置520と、補助記憶装置530と、インタフェース540とを備える。
上述の教師データ拡張装置10、100、200および300の何れか1つ以上がコンピュータに実装される場合、上述した各処理部の動作は、プログラムの形式で補助記憶装置530に記憶されている。CPU510は、プログラムを補助記憶装置530から読み出し、主記憶装置520に展開して実行することで、各処理部の処理を実行する。また、CPU510は、プログラムに従って、上述した各記憶部に対応する記憶領域を補助記憶装置530に確保する。表示部110および操作入力部120の機能は、CPU500がプログラムに従ってインタフェース540としての表示デバイスおよび入力デバイスを制御することで実行される。
なお、制御部180の全部または一部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより各部の処理を行ってもよい。ここでいう「コンピュータシステム」とは、OS(オペレーティングシステム)や周辺機器等のハードウェアを含む。
「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。
以上、本発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計変更等も含まれる。
本発明の実施形態は、教師データ拡張装置、教師データ拡張方法およびプログラムに適用してもよい。
10、100、200、300、 教師データ拡張装置
11、183 関係取得部
12、184 特徴選択部
13、185 教師データ拡張部
110 表示部
120 操作入力部
170 記憶部
171 ラベル情報記憶部
172 教師データ記憶部
180 処理部
181 特徴抽出部
182 実教師データ生成部
286 拡張結果表示処理部
373 辞書記憶部
387 機械学習部
388 識別結果表示処理部

Claims (10)

  1. 複数の教師データの各々に含まれる複数の特徴の関係を求める関係取得部と、
    前記関係に基づいて前記複数の特徴のうち何れか1つ以上を選択する特徴選択部と、
    1つ以上の教師データについて、前記特徴選択部が選択した特徴の値を、同じクラスに分類される他の教師データにおけるその特徴の値に入れ替えた新たな教師データを生成する教師データ拡張部と、
    を備える教師データ拡張装置。
  2. 入力データから複数の特徴を抽出する特徴抽出部と、
    前記入力データに示される分類対象が分類されるクラスを示すラベル情報を記憶するラベル情報記憶部と、
    前記特徴抽出部が抽出した前記複数の特徴と前記ラベル情報記憶部が記憶する前記ラベル情報とを紐づけることにより実教師データを生成する実教師データ生成部と、
    をさらに備え、
    前記関係取得部は、複数の前記実教師データの各々に含まれる複数の特徴の関係を求める、
    請求項1に記載の教師データ拡張装置。
  3. 前記入力データは、画像、および、時間的に連続する複数枚の画像のうち少なくとも何れか一方である、
    請求項2に記載の教師データ拡張装置。
  4. 前記特徴抽出部は、前記入力データから前記分類対象を識別するために設計された前記特徴を抽出する、
    請求項2または請求項3に記載の教師データ拡張装置。
  5. 前記特徴抽出部は、ニューラルネットワークを用いて特徴を設計し抽出する、
    請求項2または請求項3に記載の教師データ拡張装置。
  6. 前記特徴選択部は、前記特徴同士の無相関性および独立性のうち少なくとも何れか一方に基づいて、前記特徴の選択を行う、
    請求項1から5の何れか一項に記載の教師データ拡張装置。
  7. 前記教師データ拡張部が生成する教師データを表示する表示部と、
    他の特徴に置き換える特徴を指示するユーザ操作を受け付ける操作入力部と、
    をさらに備え、
    前記特徴選択部は、前記ユーザ操作に従って前記複数の特徴のうち何れか1つ以上を選択する、
    請求項1から6の何れか一項に記載の教師データ拡張装置。
  8. 少なくとも前記教師データ拡張部が生成した教師データを用いて識別機の機械学習を行う学習部をさらに備える、
    請求項1から7の何れか一項に記載の教師データ拡張装置。
  9. 複数の教師データの各々に含まれる複数の特徴の関係を求める工程と、
    前記関係に基づいて前記複数の特徴のうち何れか1つ以上を選択する工程と、
    1つ以上の教師データについて、選択された前記特徴の値を、同じクラスに分類される他の教師データにおけるその特徴の値に入れ替えた新たな教師データを生成する工程と、
    を含む教師データ拡張方法。
  10. コンピュータに、
    複数の教師データの各々に含まれる複数の特徴の関係を求める工程と、
    前記関係に基づいて前記複数の特徴のうち何れか1つ以上を選択する工程と、
    1つ以上の教師データについて、選択された前記特徴の値を、同じクラスに分類される他の教師データにおけるその特徴の値に入れ替えた新たな教師データを生成する工程と、
    を実行させるためのプログラム。
JP2020551050A 2018-10-05 2018-10-05 教師データ拡張装置、教師データ拡張方法およびプログラム Active JP7063393B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2018/037377 WO2020070876A1 (ja) 2018-10-05 2018-10-05 教師データ拡張装置、教師データ拡張方法およびプログラム

Publications (2)

Publication Number Publication Date
JPWO2020070876A1 JPWO2020070876A1 (ja) 2021-09-02
JP7063393B2 true JP7063393B2 (ja) 2022-05-09

Family

ID=70055315

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020551050A Active JP7063393B2 (ja) 2018-10-05 2018-10-05 教師データ拡張装置、教師データ拡張方法およびプログラム

Country Status (3)

Country Link
US (1) US20220044147A1 (ja)
JP (1) JP7063393B2 (ja)
WO (1) WO2020070876A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210152402A (ko) * 2020-06-05 2021-12-15 에이치티씨 코퍼레이션 데이터 증강을 포함하는 머신런닝 시스템 및 머신런닝 방법
WO2022195762A1 (ja) * 2021-03-17 2022-09-22 日本電気株式会社 学習装置、学習方法、及び、記録媒体
WO2023089888A1 (ja) * 2021-11-18 2023-05-25 コニカミノルタ株式会社 機械学習方法、機械学習プログラム、機械学習装置、および情報処理装置
WO2023139760A1 (ja) * 2022-01-21 2023-07-27 日本電気株式会社 データ拡張装置、データ拡張方法、及び非一時的なコンピュータ可読媒体

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006309485A (ja) 2005-04-28 2006-11-09 Nec Corp 能動学習方法および能動学習システム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006309485A (ja) 2005-04-28 2006-11-09 Nec Corp 能動学習方法および能動学習システム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHAWLA, Nitesh V. et al.,SMOTE: Synthetic Minority Over-sampling Technique,2002年,pp.321-357,https://arxiv.org/pdf/1106.1813.pdf
新庄智子 ほか,HMMを用いた手話認識のための学習データの自動合成,ヒューマンインタフェースシンポジウム2007 論文集,ヒューマンインターフェース学会,2007年,pp.475-480

Also Published As

Publication number Publication date
JPWO2020070876A1 (ja) 2021-09-02
US20220044147A1 (en) 2022-02-10
WO2020070876A1 (ja) 2020-04-09

Similar Documents

Publication Publication Date Title
JP7063393B2 (ja) 教師データ拡張装置、教師データ拡張方法およびプログラム
De Geest et al. Online action detection
CN110602526B (zh) 视频处理方法、装置、计算机设备及存储介质
JP6619732B2 (ja) 顕微鏡画像内の個々の細胞を分類および識別するための方法およびシステム
CN110335259B (zh) 一种医学影像识别方法、装置和存储介质
WO2020051704A1 (en) System and method for improving speed of similarity based searches
Engelke et al. Comparative study of fixation density maps
US9158996B2 (en) Learning image collection apparatus, learning apparatus, and target object detection apparatus
JP2008284166A (ja) 投球球種識別装置、識別器生成装置、投球球種識別プログラム及び識別器生成プログラム
JP6334767B1 (ja) 情報処理装置、プログラム、及び情報処理方法
US8335751B1 (en) System for intelligent goal-directed search in large volume imagery and video using a cognitive-neural subsystem
JP2008102594A (ja) コンテンツの検索方法及び検索装置
Doughty et al. Who’s better, who’s best: Skill determination in video using deep ranking
Panetta et al. Software architecture for automating cognitive science eye-tracking data analysis and object annotation
US20060036948A1 (en) Image selection device and image selecting method
Putro et al. An efficient face detector on a cpu using dual-camera sensors for intelligent surveillance systems
Mayo et al. How hard are computer vision datasets? Calibrating dataset difficulty to viewing time
CN111062284B (zh) 一种交互式视频摘要模型的可视理解与诊断方法
TWI478099B (zh) 具學習力之視覺注意預測系統及其方法
Guraya et al. Neural networks based visual attention model for surveillance videos
EP3719806A1 (en) A computer-implemented method, an apparatus and a computer program product for assessing performance of a subject in a cognitive function test
Borji et al. Bottom-up attention, models of
Chaabouni et al. Prediction of visual attention with Deep CNN for studies of neurodegenerative diseases
JP2010087971A (ja) 画像処理装置、画像処理方法、画像処理プログラム及び撮像装置
CN112396114A (zh) 一种测评系统、测评方法及相关产品

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210201

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220322

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220404

R151 Written notification of patent or utility model registration

Ref document number: 7063393

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151