JPWO2020110272A1 - 機械学習装置、機械学習方法、及びプログラム - Google Patents

機械学習装置、機械学習方法、及びプログラム Download PDF

Info

Publication number
JPWO2020110272A1
JPWO2020110272A1 JP2020557493A JP2020557493A JPWO2020110272A1 JP WO2020110272 A1 JPWO2020110272 A1 JP WO2020110272A1 JP 2020557493 A JP2020557493 A JP 2020557493A JP 2020557493 A JP2020557493 A JP 2020557493A JP WO2020110272 A1 JPWO2020110272 A1 JP WO2020110272A1
Authority
JP
Japan
Prior art keywords
data
task
pseudo data
machine learning
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020557493A
Other languages
English (en)
Other versions
JP7211430B2 (ja
Inventor
利憲 細井
利憲 細井
小西 勇介
勇介 小西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2020110272A1 publication Critical patent/JPWO2020110272A1/ja
Application granted granted Critical
Publication of JP7211430B2 publication Critical patent/JP7211430B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/192Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
    • G06V30/194References adjustable by an adaptive method, e.g. learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/23Recognition of whole body movements, e.g. for sport training

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Social Psychology (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Psychiatry (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

機械学習装置100は、転移学習によって、第1のタスクで用いる第1の識別用辞書から、第2のタスクで用いる第2の識別用辞書を構築するための装置である。機械学習装置100は、第1のタスクにおける実データ及び第2のタスクにおける実データのいずれか又は両方を加工して、疑似データを生成する、疑似データ生成部10と、第1の識別用辞書を用いて、疑似データを学習データとした第1の転移学習を行って、第3の識別用辞書を構築し、更に、第3の識別用辞書を用いて、第2のタスクにおける実データを学習データとした第2の転移学習を行って、第2の識別用辞書を構築する、学習部20と、を備えている。

Description

本発明は、転移学習を実施できる、機械学習装置及び機械学習方法に関し、更には、これらを実現するためのプログラムを記録したコンピュータ読み取り可能な記録媒体に関する。
一般的に、機械学習を成功させるためには、つまり、識別器によって学習した対象を識別できるようになるためには、バリエーションが豊富な学習用のデータを大量に用意する必要がある。とりわけ、機械学習のなかでも、精度の高さから利用されることが多い深層学習(ディープラーニング)では、特に大量の学習データが必要になる。
但し、バリエーションが豊富な学習用のデータを大量に用意することは、学習の対象によっては難しいことがある。例えば、人物の動作を識別する場合を検討すると、歩行動作等のありふれた動作であれば、学習データに使える動画データを大量に用意することは容易である。しかし、不審な行動時の動作等、あまり行われない動作の動画データを、バリエーション豊富に、且つ、大量に用意することは困難である。従って、識別器で識別できる動作は限定的となり、動作の認識精度は非常に低くなってしまう。
このため、従来から、転移学習と呼ばれる技術が利用されている(例えば、特許文献1参照)。転移学習は、Fine Tuningとも呼ばれ、バリエーションが豊富なデータを大量に準備できる特定のタスク(ドメイン)を学習した識別器を、別の最終目的のタスクについて再学習させる学習方式である。
具体的には、転移学習では、例えば、画像中の物体を1000種類に分類するタスク(転移元のタスク)を学習した識別器が存在する場合に、この識別器を、植物を詳細に分類するタスク(転移先の目標タスク)について再学習させることが行われる。このように、転移学習によれば、大量の学習データを用意できないタスクについても、識別器を構築することが可能となる。
特開2017−224156号公報
しかしながら、転移学習には、転移元のタスクと転移先のタスクとが大きく異なった場合に、転移元のタスクのデータで機械学習した結果が、転移先のタスクの機械学習に役立たず、識別器の再学習、即ち、転移に失敗しやすいという問題がある。
特に、人物の動作を識別する場合のように動画データを利用する例では、転移元のタスクと転移先のタスクとの異なり具合を予想することが、識別器にとって困難であるため、転移に失敗しやすいと考えられる。また、転移先のタスクでの学習データのバリエーション及び数が少な過ぎる場合も、同様に転移に失敗しやすくなる。
本発明の目的の一例は、上記問題を解消し、転移学習における成功率の向上を図り得る、機械学習装置、機械学習方法、及びコンピュータ読み取り可能な記録媒体を提供することにある。
上記目的を達成するため、本発明の一側面における機械学習装置は、転移学習によって、第1のタスクで用いる第1の識別用辞書から、第2のタスクで用いる第2の識別用辞書を構築するための装置であって、
前記第1のタスクにおける実データ及び前記第2のタスクにおける実データのいずれか又は両方を加工して、疑似データを生成する、疑似データ生成部と、
前記第1の識別用辞書を用いて、前記疑似データを学習データとした第1の転移学習を行って、第3の識別用辞書を構築し、更に、前記第3の識別用辞書を用いて、前記第2のタスクにおける実データを学習データとした第2の転移学習を行って、前記第2の識別用辞書を構築する、学習部と、
を備えている、
ことを特徴とする。
また、上記目的を達成するため、本発明の一側面における機械学習方法は、転移学習によって、第1のタスクで用いる第1の識別用辞書から、第2のタスクで用いる第2の識別用辞書を構築するための方法であって、
(a)前記第1のタスクにおける実データ及び前記第2のタスクにおける実データのいずれか又は両方を加工して、疑似データを生成する、ステップと、
(b)前記第1の識別用辞書を用いて、前記疑似データを学習データとした第1の転移学習を行って、第3の識別用辞書を構築し、更に、前記第3の識別用辞書を用いて、前記第2のタスクにおける実データを学習データとした第2の転移学習を行って、前記第2の識別用辞書を構築する、ステップと、
を有している、
ことを特徴とする。
更に、上記目的を達成するため、本発明の一側面におけるコンピュータ読み取り可能な記録媒体は、コンピュータを用いて転移学習によって、第1のタスクで用いる第1の識別用辞書から、第2のタスクで用いる第2の識別用辞書を構築するための、プログラムを記録した、コンピュータ読み取り可能な記録媒体であって、
前記コンピュータに、
(a)前記第1のタスクにおける実データ及び前記第2のタスクにおける実データのいずれか又は両方を加工して、疑似データを生成する、ステップと、
(b)前記第1の識別用辞書を用いて、前記疑似データを学習データとした第1の転移学習を行って、第3の識別用辞書を構築し、更に、前記第3の識別用辞書を用いて、前記第2のタスクにおける実データを学習データとした第2の転移学習を行って、前記第2の識別用辞書を構築する、ステップと、
を実行させる命令を含む、プログラムを記録している、
ことを特徴とする。
以上のように、本発明によれば、転移学習における成功率の向上を図ることができる。
図1は、本発明の実施の形態1における機械学習装置の概略構成を示すブロック図である。 図2は、本発明の実施の形態1における機械学習装置の構成を具体的に示すブロック図である。 図3は、本実施の形態1で行われる疑似データの生成処理を説明する図である。 図4は、本発明の実施の形態1における機械学習装置の動作を示すフロー図である。 図5は、本発明の実施の形態1の変形例1における機械学習装置の構成を示すブロック図である。 図6は、本発明の実施の形態1の変形例2における機械学習装置の構成を示すブロック図である。 図7は、本発明の実施の形態2における機械学習装置の構成を示すブロック図である。 図8は、本発明の実施の形態2における機械学習装置の動作を示すフロー図である。 図9は、本発明の実施の形態2の変形例における機械学習装置の構成を示すブロック図である。 図10は、本発明の実施の形態における機械学習装置を実現するコンピュータの一例を示すブロック図である。
(実施の形態1)
以下、本発明の実施の形態1における、機械学習装置、機械学習方法、及びプログラムについて、図1〜図6を参照しながら説明する。
[装置構成]
最初に、図1を用いて、本発明の実施の形態1における機械学習装置の概略構成について説明する。図1は、本発明の実施の形態1における機械学習装置の概略構成を示すブロック図である。
図1に示す、本実施の形態1における機械学習装置100は、転移学習によって、第1のタスクで用いる第1の識別用辞書から、第2のタスクで用いる第2の識別用辞書を構築するための装置である。図1に示すように、機械学習装置100は、疑似データ生成部10と、学習部20とを備えている。以降において、第1のタスクを「転移元タスク」、第1の識別用辞書を「転移元タスクの識別用辞書」と表記する。また、第2のタスクを「目的タスク」、第2の識別用辞書を「目的タスクの識別用辞書」と表記する。
疑似データ生成部10は、転移元タスクにおける実データ及び目的タスクにおける実データのいずれか又は両方を加工して、疑似データを生成する。学習部20は、転移元タスクの識別用辞書を用いて、疑似データを学習データとした第1の転移学習を行って、第3の識別用辞書(以下「疑似タスクの識別用辞書」と表記する)を構築する。更に、学習部20は、構築した疑似タスクの識別用辞書を用いて、目的タスクにおける実データを学習データとした第2の転移学習を行って、目的タスクの識別用辞書を構築する。
このように、本実施の形態1では、転移元のタスクから疑似データのタスクへと転移が行われた後に、更に、疑似データのタスクから目的タスクへと転移が行われる。つまり、本実施の形態1では、転移元タスクから目的タスクへの転移を中継するタスクが用意されている。このため、本実施の形態1によれば、転移元タスクの識別用辞書から目的タスクの識別用辞書を構築する転移学習において、成功率の向上を図ることができる。
続いて、図2及び図3を用いて、本実施の形態1における機械学習装置の構成をより具体的に説明する。図2は、本発明の実施の形態1における機械学習装置の構成を具体的に示すブロック図である。図3は、本実施の形態1で行われる疑似データの生成処理を説明する図である。
図2に示すように、本実施の形態1では、機械学習装置100は、上述した疑似データ生成部10及び学習部20に加えて、辞書格納部30と、実データ格納部40と、疑似データ格納部50とを更に備えている。辞書格納部30は、転移元タスクの識別用辞書31と、疑似タスクの識別用辞書32と、目的タスクの識別用辞書33とを格納している。
疑似データ生成部10は、本実施の形態1では、疑似データとして、目的タスクにおける実データに類似しているデータを生成し、生成した疑似データを疑似データ格納部50に格納する。また、本実施の形態1では、転移元タスクが、人物の動作を識別するタスクであり、目的タスクが、転移元タスクで識別される動作とは別の動作を識別するタスクである。このため、図2に示すように、疑似データ生成部10は、動作解析部11と、動作映像合成部12を備えている。
動作解析部11は、目的タスクにおける実データである人物の映像データから、人物の関節を特定する。動作映像合成部12は、目的タスクにおける実データである人物の映像データに対して、特定した関節を摂動させる画像処理を実行して、画像中の人物の姿勢を変化させ、これによって疑似データを生成する。
具体的には、動作解析部11は、図3に示すように、目的タスクにおける実データとして、人物の映像データを取得すると、映像データを構成するフレーム毎に、HOG(Histograms of Oriented Gradients)特徴量等を用いて、人体に相当する部分の画像を検出する。次に、動作解析部11は、検出された画像の特徴ベクトルと、予め用意されている人体モデルの特徴ベクトルとから、検出された画像の人体の各関節を特定する。
動作映像合成部12は、フレーム毎に、特定された関節の中から、ランダムに又はルールに沿って、1又は2以上の関節を選択し、選択した関節を、設定量だけ摂動させて、検出された画像の人体の姿勢を変化させる。この結果、疑似データが生成される。疑似データは、疑似データ格納部50に格納される。
図3の例では、動作映像合成部12は、右肘、右肩、及び左膝を選択し、選択した関節を摂動させて、人体の姿勢を変化させている。なお、摂動の設定量は、固定値であっても良いし、後述の変形例に示すように条件に応じて変動しても良い。
また、学習部20は、本実施の形態1では、例えば、ディープラーニングによる機械学習を実行し、各識別用辞書は、ニューラルネットワークのパラメータセットで構成されている。このため、学習部20は、第1のパラメータ更新部21と、第2のパラメータ更新部22とを備えている。
第1のパラメータ更新部21は、転送元タスクの識別用辞書31のパラメータセットと疑似データとを用いて、疑似データのタスク(疑似タスク)の学習(第1の転移学習)を行って、疑似タスクの識別用辞書32のパラメータセットを更新する。
また、第2のパラメータ更新部22は、疑似タスクの識別用辞書32のパラメータセットと目的タスクにおける実データとを用いて、目的タスクの学習(第2の転移学習)を行って、目的タスクの識別用辞書33のパラメータセットを更新する。
[装置動作]
次に、本発明の実施の形態1における機械学習装置100の動作について図4を用いて説明する。図4は、本発明の実施の形態1における機械学習装置の動作を示すフロー図である。以下の説明においては、適宜図1〜図3を参酌する。また、本実施の形態1では、機械学習装置100を動作させることによって、機械学習方法が実施される。よって、本実施の形態1における機械学習方法の説明は、以下の機械学習装置100の動作説明に代える。
図4に示すように、最初に、疑似データ生成部10において、動作解析部11が、実データ格納部40から、目的タスクにおける実データである、人物の映像データを、フレーム単位で取得する(ステップA1)。
次に、動作解析部11は、ステップA1で取得されたフレームから、フレーム毎に、HOG特徴量を用いて、人体に相当する部分の画像を検出する(ステップA2)。
次に、動作解析部11は、ステップA1で検出された画像の特徴ベクトルと、予め用意されている人体モデルの特徴ベクトルとから、検出された画像の人体の各関節を特定する(ステップA3)。
次に、動作映像合成部12は、ステップA2で特定された関節の中から、ランダムに又はルールに沿って、1又は2以上の関節を選択し、選択した関節を、設定量だけ摂動させて、検出された画像の人体の姿勢を変化させ、疑似データの(フレーム)を生成する(ステップA4)。ステップA4によって生成された疑似データは、疑似データ格納部50に格納される。
次に、学習部20において、第1のパラメータ更新部21は、疑似データ格納部50から、ステップA3で生成された疑似データを取得する。そして、第1のパラメータ更新部21は、転送元タスクの識別用辞書31のパラメータセットと疑似データとを用いて、疑似データのタスク(疑似タスク)を学習して、疑似タスクの識別用辞書32のパラメータセットを更新する(ステップA5)。
次に、第2のパラメータ更新部22は、ステップA5で更新された疑似タスクの識別用辞書32のパラメータセットと、目的タスクにおける実データとを用いて、目的タスクを学習して、目的タスクの識別用辞書33のパラメータセットを更新する(ステップA6)。
また、ステップA6の実行後は、実データ格納部40に格納されている映像データの別のフレームを対象にして、再度、ステップA1が実行される。つまり、ステップA1〜A6は、実データである映像データのフレーム単位で繰り返し実行される。なお、ステップA1〜A4は、複数のフレームに対して行われていても良い。この場合は、ステップA5及びA6が、フレーム毎に繰り返し実行される。
[実施の形態1における効果]
このように、本実施の形態1では、疑似データは、目的タスクの実データから生成されており、両者は類似している。また、転送元タスクの識別用辞書を用いて得られた、疑似データのタスクの学習結果を用いて、実データのタスクが学習され、目的タスクの識別用辞書が構築される。このため、本実施の形態1によれば、転移元タスクの識別用辞書から目的タスクの識別用辞書を構築する転移学習において、成功率の向上を図ることができる。
[プログラム]
本実施の形態1におけるプログラムは、コンピュータに、図4に示すステップA1〜A6を実行させるプログラムであれば良い。このプログラムをコンピュータにインストールし、実行することによって、本実施の形態1における機械学習装置100と機械学習方法とを実現することができる。この場合、コンピュータのプロセッサは、疑似データ生成部10及び学習部20として機能し、処理を行なう。
また、本実施の形態1では、辞書格納部30、実データ格納部40、及び疑似データ格納部50は、コンピュータに備えられたハードディスク等の記憶装置に、これらを構成するデータファイルを格納することによって実現されている。
更に、本実施の形態1におけるプログラムは、複数のコンピュータによって構築されたコンピュータシステムによって実行されても良い。この場合は、例えば、各コンピュータが、それぞれ、疑似データ生成部10及び学習部20のいずれかとして機能しても良い。また、辞書格納部30、実データ格納部40、及び疑似データ格納部50は、本実施の形態1におけるプログラムを実行するコンピュータとは別のコンピュータ上に構築されていても良い。
[変形例]
続いて、図5及び図6を用いて、本実施の形態1における機械学習装置100の変形例について以下に説明する。
変形例1:
図5は、本発明の実施の形態1の変形例1における機械学習装置の構成を示すブロック図である。図5に示すように、本変形例1では、疑似データ生成部10において、動作映像合成部12は、第2のパラメータ更新部22が第2の転移学習の際に算出している損失値を取得し、取得した損失値に基づいて、関節を摂動させる際の程度(設定量)を調整して、疑似データを生成する。
つまり、本変形例1では、第2のパラメータ更新部22は、あるフレームについて、第2の転移学習を行うと、その際に算出された損失値を、疑似データ生成部10に出力する。そして、動作映像合成部12は、次のフレームからの疑似データの生成において、出力されてきた損失値に基づいて、関節の摂動時の摂動量を設定する。
このような構成により、本変形例1では、疑似データ生成部10は、ステップA1〜A5の繰り返し処理の初期においては、学習において識別がし易くなるように、即ち、損失値が小さくなるように疑似データを作成することができる。また、疑似データ生成部10は、ステップA1〜A5の繰り返し処理が進んでいくと、識別が難しくなるように、即ち、損失値が高くなるように疑似データを作成することができる。この結果、本変形例1では、徐々に、転移元のタスクの実データにより近い疑似データが生成されるので、転移学習の成功率がよりいっそう向上することになる。
変形例2:
図6は、本発明の実施の形態1の変形例2における機械学習装置の構成を示すブロック図である。図6に示すように、本変形例2では、疑似データ生成部10において、動作映像合成部12は、第1のパラメータ更新部21が第1の転移学習の際に算出している損失値を取得し、取得した損失値に基づいて、関節を摂動させる際の程度(設定量)を調整して、疑似データを生成する。
つまり、本変形例2では、第1のパラメータ更新部21は、あるフレームについて、第1の転移学習を行うと、その際に算出された損失値を、疑似データ生成部10に出力する。そして、動作映像合成部12は、次のフレームからの疑似データの生成において、出力されてきた損失値に基づいて、関節の摂動時の摂動量を設定する。
このような構成により、本変形例2でも、疑似データ生成部10は、ステップA1〜A5の繰り返し処理の初期においては、学習において識別がし易くなるように、即ち、損失値が小さくなるように疑似データを作成することができる。また、疑似データ生成部10は、ステップA1〜A5の繰り返し処理が進んでいくと、識別が難しくなるように、即ち、損失値が高くなるように疑似データを作成することができる。この結果、本変形例2でも、変形例1と同様に、徐々に、転移元のタスクの実データにより近い疑似データが生成されるので、転移学習の成功率がよりいっそう向上することになる。
(実施の形態2)
続いて、本発明の実施の形態2における、機械学習装置、機械学習方法、及びプログラムについて、図7〜図9を参照しながら説明する。
[装置構成]
最初に、図7を用いて、本発明の実施の形態2における機械学習装置の構成について説明する。図7は、本発明の実施の形態2における機械学習装置の構成を示すブロック図である。
図7に示すように、本発明の実施の形態2における機械学習装置101は、図1及び図2に示した実施の形態1における機械学習装置100と同様に、疑似データ生成部10、学習部20、辞書格納部30、実データ格納部40、及び疑似データ格納部50を備えている。但し、本実施の形態2においては、機械学習装置101は、実施の形態1における機械学習装置100と異なり、疑似データ選択部60を備えている。以下、実施の形態1との相違点を中心に説明する。
まず、本実施の形態2では、疑似データ生成部10において、動作映像合成部12は、1つのフレームに対して、関節の摂動の程度が異なる複数の疑似データを作成し、作成した各疑似データを疑似データ格納部50に格納する。
疑似データ選択部60は、第2のパラメータ更新部22が第2の転移学習の際に算出している損失値を取得する。また、疑似データ選択部60は、取得した損失値に基づいて、生成された疑似データの中から特定の疑似データを選択し、選択した疑似データのみを学習部10に出力する。なお、損失値が未だ算出されていない場合は、疑似データ選択部60は、デフォルトの値を損失値として用いて、疑似データを選択する。
つまり、本実施の形態2では、第2のパラメータ更新部22は、あるフレームについて、第2の転移学習を行うと、その際に算出された損失値を、疑似データ選択部60に出力する。そして、疑似データ選択部60は、出力されてきた損失値に基づいて、疑似データ格納部50に格納されている疑似データの中から、次のフレームにおいて第1のパラメータ更新部21による学習で使用する疑似データを選択する。
[装置動作]
次に、本発明の実施の形態2における機械学習装置101の動作について図8を用いて説明する。図8は、本発明の実施の形態2における機械学習装置の動作を示すフロー図である。以下の説明においては、適宜図7を参酌する。また、本実施の形態2では、機械学習装置101を動作させることによって、機械学習方法が実施される。よって、本実施の形態2における機械学習方法の説明は、以下の機械学習装置101の動作説明に代える。
図8に示すように、最初に、疑似データ生成部10において、動作解析部11が、実データ格納部40から、目的タスクにおける実データである、人物の映像データを、フレーム単位で取得する(ステップB1)。ステップB1は、図4に示したステップA1と同様のステップである。
次に、動作解析部11は、ステップB1で取得されたフレームから、フレーム毎に、HOG特徴量を用いて、人体に相当する部分の画像を検出する(ステップB2)。ステップB2は、図4に示したステップA2と同様のステップである。
次に、動作解析部11は、ステップB1で検出された画像の特徴ベクトルと、予め用意されている人体モデルの特徴ベクトルとから、検出された画像の人体の各関節を特定する(ステップB3)。ステップ3は、図4に示したステップA3と同様のステップである。
次に、動作映像合成部12は、ステップB2で特定された関節の中から、ランダムに又はルールに沿って、1又は2以上の関節を選択する。そして、動作映像合成部12は、選択した関節を、摂動時の設定量が異なる複数のパターンで摂動させて、複数の疑似データの(フレーム)を生成する(ステップB4)。ステップB4によって生成された各疑似データは、疑似データ格納部50に格納される。
次に、疑似データ選択部60は、第2のパラメータ更新部22が前回の第2の転移学習の際に算出している損失値に基づいて、ステップB4で生成された疑似データの中から特定の疑似データを選択し、選択した疑似データのみを学習部10に出力する(ステップB5)。
次に、学習部20において、第1のパラメータ更新部21は、ステップB5で疑似データ選択部60によって選択された疑似データを取得する。そして、第1のパラメータ更新部21は、転送元タスクの識別用辞書31のパラメータセットと疑似データとを用いて、疑似データのタスク(疑似タスク)を学習して、疑似タスクの識別用辞書32のパラメータセットを更新する(ステップB6)。
次に、第2のパラメータ更新部22は、ステップB6で更新された疑似タスクの識別用辞書32のパラメータセットと、目的タスクにおける実データとを用いて、目的タスクを学習して、目的タスクの識別用辞書33のパラメータセットを更新する(ステップB7)。その後、第2のパラメータ更新部22は、学習の際に算出した損失値を、疑似データ選択部60に出力する(ステップB8)。
ステップB8の実行後は、実データ格納部40に格納されている映像データの別のフレームを対象にして、再度、ステップB1が実行される。つまり、ステップB1〜B8は、実データである映像データのフレーム単位で繰り返し実行される。
[実施の形態2における効果]
このような構成により、本実施の形態2では、疑似データ選択部60は、初期の学習処理においては、学習において識別がし易くなるように、即ち、損失値が小さくなるように、摂動の大きい疑似データを選択することができる。また、疑似データ選択部60は、学習が進んでいくと、識別が難しくなるように、即ち、損失値が高くなるように、摂動の小さい疑似データを選択することができる。この結果、本実施の形態2でも、上述の実施の形態1の変形例1及び2と同様に、徐々に、転移元のタスクの実データにより近い疑似データが生成されるので、転移学習の成功率がよりいっそう向上することになる。
[プログラム]
本実施の形態2におけるプログラムは、コンピュータに、図8に示すステップB1〜B8を実行させるプログラムであれば良い。このプログラムをコンピュータにインストールし、実行することによって、本実施の形態2における機械学習装置100と機械学習方法とを実現することができる。この場合、コンピュータのプロセッサは、疑似データ生成部10、学習部20、及び疑似データ選択部60として機能し、処理を行なう。
また、本実施の形態2では、辞書格納部30、実データ格納部40、及び疑似データ格納部50は、コンピュータに備えられたハードディスク等の記憶装置に、これらを構成するデータファイルを格納することによって実現されている。
更に、本実施の形態2におけるプログラムは、複数のコンピュータによって構築されたコンピュータシステムによって実行されても良い。この場合は、例えば、各コンピュータが、それぞれ、疑似データ生成部10、学習部20、及び疑似データ選択部60のいずれかとして機能しても良い。また、辞書格納部30、実データ格納部40、及び疑似データ格納部50は、本実施の形態1におけるプログラムを実行するコンピュータとは別のコンピュータ上に構築されていても良い。
[変形例]
続いて、図9を用いて、本実施の形態2における機械学習装置100の変形例について以下に説明する。図9は、本発明の実施の形態2の変形例における機械学習装置の構成を示すブロック図である。
本変形例では、疑似データ選択部60は、第1のパラメータ更新部21が第1の転移学習の際に算出している損失値を取得する。なお、本変形例でも、疑似データ選択部60は、取得した損失値に基づいて、生成された疑似データの中から特定の疑似データを選択し、選択した疑似データのみを学習部10に出力する。
このような構成により、本変形例でも、図7及び8に示した例と同様に、疑似データ選択部60は、初期の学習処理においては、学習において識別がし易くなるように、即ち、損失値が小さくなるように、摂動の大きい疑似データを選択することができる。また、疑似データ選択部60は、学習が進んでいくと、識別が難しくなるように、即ち、損失値が高くなるように、摂動の小さい疑似データを選択することができる。本変形例においても、徐々に、転移元のタスクの実データにより近い疑似データが生成されるので、転移学習の成功率がよりいっそう向上することになる。
(物理構成)
ここで、実施の形態1及び2におけるプログラムを実行することによって、機械学習装置を実現するコンピュータについて図10を用いて説明する。図10は、本発明の実施の形態における機械学習装置を実現するコンピュータの一例を示すブロック図である。
図10に示すように、コンピュータ110は、CPU(Central Processing Unit)111と、メインメモリ112と、記憶装置113と、入力インターフェイス114と、表示コントローラ115と、データリーダ/ライタ116と、通信インターフェイス117とを備える。これらの各部は、バス121を介して、互いにデータ通信可能に接続される。なお、コンピュータ110は、CPU111に加えて、又はCPU111に代えて、GPU(Graphics Processing Unit)、又はFPGA(Field-Programmable Gate Array)を備えていても良い。
CPU111は、記憶装置113に格納された、本実施の形態におけるプログラム(コード)をメインメモリ112に展開し、これらを所定順序で実行することにより、各種の演算を実施する。メインメモリ112は、典型的には、DRAM(Dynamic Random Access Memory)等の揮発性の記憶装置である。また、本実施の形態におけるプログラムは、コンピュータ読み取り可能な記録媒体120に格納された状態で提供される。なお、本実施の形態におけるプログラムは、通信インターフェイス117を介して接続されたインターネット上で流通するものであっても良い。
また、記憶装置113の具体例としては、ハードディスクドライブの他、フラッシュメモリ等の半導体記憶装置が挙げられる。入力インターフェイス114は、CPU111と、キーボード及びマウスといった入力機器118との間のデータ伝送を仲介する。表示コントローラ115は、ディスプレイ装置119と接続され、ディスプレイ装置119での表示を制御する。
データリーダ/ライタ116は、CPU111と記録媒体120との間のデータ伝送を仲介し、記録媒体120からのプログラムの読み出し、及びコンピュータ110における処理結果の記録媒体120への書き込みを実行する。通信インターフェイス117は、CPU111と、他のコンピュータとの間のデータ伝送を仲介する。
また、記録媒体120の具体例としては、CF(Compact Flash(登録商標))及びSD(Secure Digital)等の汎用的な半導体記憶デバイス、フレキシブルディスク(Flexible Disk)等の磁気記録媒体、又はCD−ROM(Compact Disk Read Only Memory)などの光学記録媒体が挙げられる。
なお、本実施の形態における機械学習装置は、プログラムがインストールされたコンピュータではなく、各部に対応したハードウェアを用いることによっても実現可能である。更に、機械学習装置は、一部がプログラムで実現され、残りの部分がハードウェアで実現されていてもよい。
上述した実施の形態の一部又は全部は、以下に記載する(付記1)〜(付記21)によって表現することができるが、以下の記載に限定されるものではない。
(付記1)
転移学習によって、第1のタスクで用いる第1の識別用辞書から、第2のタスクで用いる第2の識別用辞書を構築するための装置であって、
前記第1のタスクにおける実データ及び前記第2のタスクにおける実データのいずれか又は両方を加工して、疑似データを生成する、疑似データ生成部と、
前記第1の識別用辞書を用いて、前記疑似データを学習データとした第1の転移学習を行って、第3の識別用辞書を構築し、更に、前記第3の識別用辞書を用いて、前記第2のタスクにおける実データを学習データとした第2の転移学習を行って、前記第2の識別用辞書を構築する、学習部と、
を備えている、
ことを特徴とする機械学習装置。
(付記2)
付記1に記載の機械学習装置であって、
前記疑似データ生成部が、前記疑似データとして、前記第2のタスクにおける実データに類似しているデータを生成する、
ことを特徴とする機械学習装置。
(付記3)
付記2に記載の機械学習装置であって、
前記第1のタスクが、人物の動作を識別するタスクであり、前記第2のタスクが、前記第1のタスクで識別される動作とは別の動作を識別するタスクである場合において、
前記疑似データ生成部が、
前記第2のタスクにおける実データである人物の映像データから、前記人物の関節を特定し、前記映像データに対して、特定した前記関節を摂動させる画像処理を実行して、前記人物の姿勢を変化させることによって、前記疑似データを生成する、
ことを特徴とする機械学習装置。
(付記4)
付記3に記載の機械学習装置であって、
前記疑似データ生成部が、前記第2の転移学習の際に算出されている損失値を取得し、取得した前記損失値に基づいて、前記関節を摂動させる際の程度を調整して、前記疑似データを生成する、
ことを特徴とする機械学習装置。
(付記5)
付記3に記載の機械学習装置であって、
前記疑似データ生成部が、前記第1の転移学習の際に算出されている損失値を取得し、取得した前記損失値に基づいて、前記関節を摂動させる際の程度を調整して、前記疑似データを生成する、
ことを特徴とする機械学習装置。
(付記6)
付記3に記載の機械学習装置であって、
前記第2の転移学習の際に算出されている損失値を取得し、取得した前記損失値に基づいて、生成された前記疑似データの中から特定の疑似データを選択し、選択した疑似データのみを前記学習部に出力する、疑似データ選択部を、
更に備えている、
ことを特徴とする機械学習装置。
(付記7)
付記3に記載の機械学習装置であって、
前記第1の転移学習の際に算出されている損失値を取得し、取得した前記損失値に基づいて、生成された前記疑似データの中から特定の疑似データを選択し、選択した疑似データのみを前記学習部に出力する、疑似データ選択部を、
更に備えている、
ことを特徴とする機械学習装置。
(付記8)
転移学習によって、第1のタスクで用いる第1の識別用辞書から、第2のタスクで用いる第2の識別用辞書を構築するための方法であって、
(a)前記第1のタスクにおける実データ及び前記第2のタスクにおける実データのいずれか又は両方を加工して、疑似データを生成する、ステップと、
(b)前記第1の識別用辞書を用いて、前記疑似データを学習データとした第1の転移学習を行って、第3の識別用辞書を構築し、更に、前記第3の識別用辞書を用いて、前記第2のタスクにおける実データを学習データとした第2の転移学習を行って、前記第2の識別用辞書を構築する、ステップと、
を有している、
ことを特徴とする機械学習方法。
(付記9)
付記8に記載の機械学習方法であって、
前記(a)のステップにおいて、前記疑似データとして、前記第2のタスクにおける実データに類似しているデータを生成する、
ことを特徴とする機械学習方法。
(付記10)
付記9に記載の機械学習方法であって、
前記第1のタスクが、人物の動作を識別するタスクであり、前記第2のタスクが、前記第1のタスクで識別される動作とは別の動作を識別するタスクである場合において、
前記(a)のステップにおいて、
前記第2のタスクにおける実データである人物の映像データから、前記人物の関節を特定し、前記映像データに対して、特定した前記関節を摂動させる画像処理を実行して、前記人物の姿勢を変化させることによって、前記疑似データを生成する、
ことを特徴とする機械学習方法。
(付記11)
付記10に記載の機械学習方法であって、
前記(a)のステップにおいて、前記第2の転移学習の際に算出されている損失値を取得し、取得した前記損失値に基づいて、前記関節を摂動させる際の程度を調整して、前記疑似データを生成する、
ことを特徴とする機械学習方法。
(付記12)
付記10に記載の機械学習方法であって、
前記(a)のステップにおいて、前記第1の転移学習の際に算出されている損失値を取得し、取得した前記損失値に基づいて、前記関節を摂動させる際の程度を調整して、前記疑似データを生成する、
ことを特徴とする機械学習方法。
(付記13)
付記10に記載の機械学習方法であって、
(c)前記第2の転移学習の際に算出されている損失値を取得し、取得した前記損失値に基づいて、生成された前記疑似データの中から特定の疑似データを選択し、選択した疑似データのみを前記(b)のステップのために出力する、ステップを、
更に有する、
ことを特徴とする機械学習方法。
(付記14)
付記10に記載の機械学習方法であって、
(d)前記第1の転移学習の際に算出されている損失値を取得し、取得した前記損失値に基づいて、生成された前記疑似データの中から特定の疑似データを選択し、選択した疑似データのみを前記(b)のステップのために出力する、ステップを、
更に有する、
ことを特徴とする機械学習方法。
(付記15)
コンピュータを用いて転移学習によって、第1のタスクで用いる第1の識別用辞書から、第2のタスクで用いる第2の識別用辞書を構築するための、プログラムを記録した、コンピュータ読み取り可能な記録媒体であって、
前記コンピュータに、
(a)前記第1のタスクにおける実データ及び前記第2のタスクにおける実データのいずれか又は両方を加工して、疑似データを生成する、ステップと、
(b)前記第1の識別用辞書を用いて、前記疑似データを学習データとした第1の転移学習を行って、第3の識別用辞書を構築し、更に、前記第3の識別用辞書を用いて、前記第2のタスクにおける実データを学習データとした第2の転移学習を行って、前記第2の識別用辞書を構築する、ステップと、
を実行させる命令を含む、プログラムを記録している、
ことを特徴とするコンピュータ読み取り可能な記録媒体。
(付記16)
付記15に記載のコンピュータ読み取り可能な記録媒体であって、
前記(a)のステップにおいて、前記疑似データとして、前記第2のタスクにおける実データに類似しているデータを生成する、
ことを特徴とするコンピュータ読み取り可能な記録媒体。
(付記17)
付記16に記載のコンピュータ読み取り可能な記録媒体であって、
前記第1のタスクが、人物の動作を識別するタスクであり、前記第2のタスクが、前記第1のタスクで識別される動作とは別の動作を識別するタスクである場合において、
前記(a)のステップにおいて、
前記第2のタスクにおける実データである人物の映像データから、前記人物の関節を特定し、前記映像データに対して、特定した前記関節を摂動させる画像処理を実行して、前記人物の姿勢を変化させることによって、前記疑似データを生成する、
ことを特徴とするコンピュータ読み取り可能な記録媒体。
(付記18)
付記17に記載のコンピュータ読み取り可能な記録媒体であって、
前記(a)のステップにおいて、前記第2の転移学習の際に算出されている損失値を取得し、取得した前記損失値に基づいて、前記関節を摂動させる際の程度を調整して、前記疑似データを生成する、
ことを特徴とするコンピュータ読み取り可能な記録媒体。
(付記19)
付記17に記載のコンピュータ読み取り可能な記録媒体であって、
前記(a)のステップにおいて、前記第1の転移学習の際に算出されている損失値を取得し、取得した前記損失値に基づいて、前記関節を摂動させる際の程度を調整して、前記疑似データを生成する、
ことを特徴とするコンピュータ読み取り可能な記録媒体。
(付記20)
付記17に記載のコンピュータ読み取り可能な記録媒体であって、
前記プログラムが、前記コンピュータに、
(c)前記第2の転移学習の際に算出されている損失値を取得し、取得した前記損失値に基づいて、生成された前記疑似データの中から特定の疑似データを選択し、選択した疑似データのみを前記(b)のステップのために出力する、ステップを、
実行させる命令を更に含む、
ことを特徴とするコンピュータ読み取り可能な記録媒体。
(付記21)
付記17に記載のコンピュータ読み取り可能な記録媒体であって、
前記プログラムが、前記コンピュータに、
(d)前記第1の転移学習の際に算出されている損失値を取得し、取得した前記損失値に基づいて、生成された前記疑似データの中から特定の疑似データを選択し、選択した疑似データのみを前記(b)のステップのために出力する、ステップを、
実行させる命令を更に含む、
ことを特徴とするコンピュータ読み取り可能な記録媒体。
以上、実施の形態を参照して本願発明を説明したが、本願発明は上記実施の形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
以上のように、本発明によれば、転移学習における成功率の向上を図ることができる。本発明は、転移学習が行われる種々のシステム、例えば、カメラから映像から不審な人物を監視する監視装置等に有用である。
10 疑似データ生成部
11 動作解析部
12 動作映像合成部
20 学習部
21 第1のパラメータ更新部
22 第2のパラメータ更新部
30 辞書格納部
31 転移元タスクの識別用辞書
32 疑似タスクの識別用辞書
33 目的タスクの識別用辞書
40 実データ格納部
50 疑似データ格納部
100 機械学習装置(実施の形態1)
101 機械学習装置(実施の形態2)
110 コンピュータ
111 CPU
112 メインメモリ
113 記憶装置
114 入力インターフェイス
115 表示コントローラ
116 データリーダ/ライタ
117 通信インターフェイス
118 入力機器
119 ディスプレイ装置
120 記録媒体
121 バス
本発明は、転移学習を実施できる、機械学習装置及び機械学習方法に関し、更には、これらを実現するためのプログラムに関する。
本発明の目的の一例は、上記問題を解消し、転移学習における成功率の向上を図り得る、機械学習装置、機械学習方法、及びプログラムを提供することにある。
更に、上記目的を達成するため、本発明の一側面におけるプログラムは、コンピュータを用いて転移学習によって、第1のタスクで用いる第1の識別用辞書から、第2のタスクで用いる第2の識別用辞書を構築するための、プログラムであって、
前記コンピュータに、
(a)前記第1のタスクにおける実データ及び前記第2のタスクにおける実データのいずれか又は両方を加工して、疑似データを生成する、ステップと、
(b)前記第1の識別用辞書を用いて、前記疑似データを学習データとした第1の転移学習を行って、第3の識別用辞書を構築し、更に、前記第3の識別用辞書を用いて、前記第2のタスクにおける実データを学習データとした第2の転移学習を行って、前記第2の識別用辞書を構築する、ステップと、
を実行させる、
ことを特徴とする。
次に、動作解析部11は、ステップB1で検出された画像の特徴ベクトルと、予め用意されている人体モデルの特徴ベクトルとから、検出された画像の人体の各関節を特定する(ステップB3)。ステップ3は、図4に示したステップA3と同様のステップである。
[プログラム]
本実施の形態2におけるプログラムは、コンピュータに、図8に示すステップB1〜B8を実行させるプログラムであれば良い。このプログラムをコンピュータにインストールし、実行することによって、本実施の形態2における機械学習装置10と機械学習方法とを実現することができる。この場合、コンピュータのプロセッサは、疑似データ生成部10、学習部20、及び疑似データ選択部60として機能し、処理を行なう。
更に、本実施の形態2におけるプログラムは、複数のコンピュータによって構築されたコンピュータシステムによって実行されても良い。この場合は、例えば、各コンピュータが、それぞれ、疑似データ生成部10、学習部20、及び疑似データ選択部60のいずれかとして機能しても良い。また、辞書格納部30、実データ格納部40、及び疑似データ格納部50は、本実施の形態におけるプログラムを実行するコンピュータとは別のコンピュータ上に構築されていても良い。
[変形例]
続いて、図9を用いて、本実施の形態2における機械学習装置10の変形例について以下に説明する。図9は、本発明の実施の形態2の変形例における機械学習装置の構成を示すブロック図である。
(付記15)
コンピュータを用いて転移学習によって、第1のタスクで用いる第1の識別用辞書から、第2のタスクで用いる第2の識別用辞書を構築するための、プログラムであって、
前記コンピュータに、
(a)前記第1のタスクにおける実データ及び前記第2のタスクにおける実データのいずれか又は両方を加工して、疑似データを生成する、ステップと、
(b)前記第1の識別用辞書を用いて、前記疑似データを学習データとした第1の転移学習を行って、第3の識別用辞書を構築し、更に、前記第3の識別用辞書を用いて、前記第2のタスクにおける実データを学習データとした第2の転移学習を行って、前記第2の識別用辞書を構築する、ステップと、
を実行させる、プログラム。
(付記16)
付記15に記載のプログラムであって、
前記(a)のステップにおいて、前記疑似データとして、前記第2のタスクにおける実データに類似しているデータを生成する、
ことを特徴とするプログラム
(付記17)
付記16に記載のプログラムであって、
前記第1のタスクが、人物の動作を識別するタスクであり、前記第2のタスクが、前記第1のタスクで識別される動作とは別の動作を識別するタスクである場合において、
前記(a)のステップにおいて、
前記第2のタスクにおける実データである人物の映像データから、前記人物の関節を特定し、前記映像データに対して、特定した前記関節を摂動させる画像処理を実行して、前記人物の姿勢を変化させることによって、前記疑似データを生成する、
ことを特徴とするプログラム
(付記18)
付記17に記載のプログラムであって、
前記(a)のステップにおいて、前記第2の転移学習の際に算出されている損失値を取得し、取得した前記損失値に基づいて、前記関節を摂動させる際の程度を調整して、前記疑似データを生成する、
ことを特徴とするプログラム
(付記19)
付記17に記載のプログラムであって、
前記(a)のステップにおいて、前記第1の転移学習の際に算出されている損失値を取得し、取得した前記損失値に基づいて、前記関節を摂動させる際の程度を調整して、前記疑似データを生成する、
ことを特徴とするプログラム
(付記20)
付記17に記載のプログラムであって、
記コンピュータに、
(c)前記第2の転移学習の際に算出されている損失値を取得し、取得した前記損失値に基づいて、生成された前記疑似データの中から特定の疑似データを選択し、選択した疑似データのみを前記(b)のステップのために出力する、ステップを、
更に実行させる、
ことを特徴とするプログラム
(付記21)
付記17に記載のであって、
記コンピュータに、
(d)前記第1の転移学習の際に算出されている損失値を取得し、取得した前記損失値に基づいて、生成された前記疑似データの中から特定の疑似データを選択し、選択した疑似データのみを前記(b)のステップのために出力する、ステップを、
更に実行させる、
ことを特徴とするプログラム

Claims (21)

  1. 転移学習によって、第1のタスクで用いる第1の識別用辞書から、第2のタスクで用いる第2の識別用辞書を構築するための装置であって、
    前記第1のタスクにおける実データ及び前記第2のタスクにおける実データのいずれか又は両方を加工して、疑似データを生成する、疑似データ生成手段と、
    前記第1の識別用辞書を用いて、前記疑似データを学習データとした第1の転移学習を行って、第3の識別用辞書を構築し、更に、前記第3の識別用辞書を用いて、前記第2のタスクにおける実データを学習データとした第2の転移学習を行って、前記第2の識別用辞書を構築する、学習手段と、
    を備えている、
    ことを特徴とする機械学習装置。
  2. 請求項1に記載の機械学習装置であって、
    前記疑似データ生成手段が、前記疑似データとして、前記第2のタスクにおける実データに類似しているデータを生成する、
    ことを特徴とする機械学習装置。
  3. 請求項2に記載の機械学習装置であって、
    前記第1のタスクが、人物の動作を識別するタスクであり、前記第2のタスクが、前記第1のタスクで識別される動作とは別の動作を識別するタスクである場合において、
    前記疑似データ生成手段が、
    前記第2のタスクにおける実データである人物の映像データから、前記人物の関節を特定し、前記映像データに対して、特定した前記関節を摂動させる画像処理を実行して、前記人物の姿勢を変化させることによって、前記疑似データを生成する、
    ことを特徴とする機械学習装置。
  4. 請求項3に記載の機械学習装置であって、
    前記疑似データ生成手段が、前記第2の転移学習の際に算出されている損失値を取得し、取得した前記損失値に基づいて、前記関節を摂動させる際の程度を調整して、前記疑似データを生成する、
    ことを特徴とする機械学習装置。
  5. 請求項3に記載の機械学習装置であって、
    前記疑似データ生成手段が、前記第1の転移学習の際に算出されている損失値を取得し、取得した前記損失値に基づいて、前記関節を摂動させる際の程度を調整して、前記疑似データを生成する、
    ことを特徴とする機械学習装置。
  6. 請求項3に記載の機械学習装置であって、
    前記第2の転移学習の際に算出されている損失値を取得し、取得した前記損失値に基づいて、生成された前記疑似データの中から特定の疑似データを選択し、選択した疑似データのみを前記学習手段に出力する、疑似データ選択手段を、
    更に備えている、
    ことを特徴とする機械学習装置。
  7. 請求項3に記載の機械学習装置であって、
    前記第1の転移学習の際に算出されている損失値を取得し、取得した前記損失値に基づいて、生成された前記疑似データの中から特定の疑似データを選択し、選択した疑似データのみを前記学習手段に出力する、疑似データ選択手段を、
    更に備えている、
    ことを特徴とする機械学習装置。
  8. 転移学習によって、第1のタスクで用いる第1の識別用辞書から、第2のタスクで用いる第2の識別用辞書を構築するための方法であって、
    (a)前記第1のタスクにおける実データ及び前記第2のタスクにおける実データのいずれか又は両方を加工して、疑似データを生成する、ステップと、
    (b)前記第1の識別用辞書を用いて、前記疑似データを学習データとした第1の転移学習を行って、第3の識別用辞書を構築し、更に、前記第3の識別用辞書を用いて、前記第2のタスクにおける実データを学習データとした第2の転移学習を行って、前記第2の識別用辞書を構築する、ステップと、
    を有している、
    ことを特徴とする機械学習方法。
  9. 請求項8に記載の機械学習方法であって、
    前記(a)のステップにおいて、前記疑似データとして、前記第2のタスクにおける実データに類似しているデータを生成する、
    ことを特徴とする機械学習方法。
  10. 請求項9に記載の機械学習方法であって、
    前記第1のタスクが、人物の動作を識別するタスクであり、前記第2のタスクが、前記第1のタスクで識別される動作とは別の動作を識別するタスクである場合において、
    前記(a)のステップにおいて、
    前記第2のタスクにおける実データである人物の映像データから、前記人物の関節を特定し、前記映像データに対して、特定した前記関節を摂動させる画像処理を実行して、前記人物の姿勢を変化させることによって、前記疑似データを生成する、
    ことを特徴とする機械学習方法。
  11. 請求項10に記載の機械学習方法であって、
    前記(a)のステップにおいて、前記第2の転移学習の際に算出されている損失値を取得し、取得した前記損失値に基づいて、前記関節を摂動させる際の程度を調整して、前記疑似データを生成する、
    ことを特徴とする機械学習方法。
  12. 請求項10に記載の機械学習方法であって、
    前記(a)のステップにおいて、前記第1の転移学習の際に算出されている損失値を取得し、取得した前記損失値に基づいて、前記関節を摂動させる際の程度を調整して、前記疑似データを生成する、
    ことを特徴とする機械学習方法。
  13. 請求項10に記載の機械学習方法であって、
    (c)前記第2の転移学習の際に算出されている損失値を取得し、取得した前記損失値に基づいて、生成された前記疑似データの中から特定の疑似データを選択し、選択した疑似データのみを前記(b)のステップのために出力する、ステップを、
    更に有する、
    ことを特徴とする機械学習方法。
  14. 請求項10に記載の機械学習方法であって、
    (d)前記第1の転移学習の際に算出されている損失値を取得し、取得した前記損失値に基づいて、生成された前記疑似データの中から特定の疑似データを選択し、選択した疑似データのみを前記(b)のステップのために出力する、ステップを、
    更に有する、
    ことを特徴とする機械学習方法。
  15. コンピュータを用いて転移学習によって、第1のタスクで用いる第1の識別用辞書から、第2のタスクで用いる第2の識別用辞書を構築するための、プログラムを記録した、コンピュータ読み取り可能な記録媒体であって、
    前記コンピュータに、
    (a)前記第1のタスクにおける実データ及び前記第2のタスクにおける実データのいずれか又は両方を加工して、疑似データを生成する、ステップと、
    (b)前記第1の識別用辞書を用いて、前記疑似データを学習データとした第1の転移学習を行って、第3の識別用辞書を構築し、更に、前記第3の識別用辞書を用いて、前記第2のタスクにおける実データを学習データとした第2の転移学習を行って、前記第2の識別用辞書を構築する、ステップと、
    を実行させる命令を含む、プログラムを記録している、
    ことを特徴とするコンピュータ読み取り可能な記録媒体。
  16. 請求項15に記載のコンピュータ読み取り可能な記録媒体であって、
    前記(a)のステップにおいて、前記疑似データとして、前記第2のタスクにおける実データに類似しているデータを生成する、
    ことを特徴とするコンピュータ読み取り可能な記録媒体。
  17. 請求項16に記載のコンピュータ読み取り可能な記録媒体であって、
    前記第1のタスクが、人物の動作を識別するタスクであり、前記第2のタスクが、前記第1のタスクで識別される動作とは別の動作を識別するタスクである場合において、
    前記(a)のステップにおいて、
    前記第2のタスクにおける実データである人物の映像データから、前記人物の関節を特定し、前記映像データに対して、特定した前記関節を摂動させる画像処理を実行して、前記人物の姿勢を変化させることによって、前記疑似データを生成する、
    ことを特徴とするコンピュータ読み取り可能な記録媒体。
  18. 請求項17に記載のコンピュータ読み取り可能な記録媒体であって、
    前記(a)のステップにおいて、前記第2の転移学習の際に算出されている損失値を取得し、取得した前記損失値に基づいて、前記関節を摂動させる際の程度を調整して、前記疑似データを生成する、
    ことを特徴とするコンピュータ読み取り可能な記録媒体。
  19. 請求項17に記載のコンピュータ読み取り可能な記録媒体であって、
    前記(a)のステップにおいて、前記第1の転移学習の際に算出されている損失値を取得し、取得した前記損失値に基づいて、前記関節を摂動させる際の程度を調整して、前記疑似データを生成する、
    ことを特徴とするコンピュータ読み取り可能な記録媒体。
  20. 請求項17に記載のコンピュータ読み取り可能な記録媒体であって、
    前記プログラムが、前記コンピュータに、
    (c)前記第2の転移学習の際に算出されている損失値を取得し、取得した前記損失値に基づいて、生成された前記疑似データの中から特定の疑似データを選択し、選択した疑似データのみを前記(b)のステップのために出力する、ステップを、
    実行させる命令を更に含む、
    ことを特徴とするコンピュータ読み取り可能な記録媒体。
  21. 請求項17に記載のコンピュータ読み取り可能な記録媒体であって、
    前記プログラムが、前記コンピュータに、
    (d)前記第1の転移学習の際に算出されている損失値を取得し、取得した前記損失値に基づいて、生成された前記疑似データの中から特定の疑似データを選択し、選択した疑似データのみを前記(b)のステップのために出力する、ステップを、
    実行させる命令を更に含む、
    ことを特徴とするコンピュータ読み取り可能な記録媒体。
JP2020557493A 2018-11-29 2018-11-29 機械学習装置、機械学習方法、及びプログラム Active JP7211430B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2018/044072 WO2020110272A1 (ja) 2018-11-29 2018-11-29 機械学習装置、機械学習方法、及びコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JPWO2020110272A1 true JPWO2020110272A1 (ja) 2021-10-07
JP7211430B2 JP7211430B2 (ja) 2023-01-24

Family

ID=70854193

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020557493A Active JP7211430B2 (ja) 2018-11-29 2018-11-29 機械学習装置、機械学習方法、及びプログラム

Country Status (3)

Country Link
US (1) US20220012551A1 (ja)
JP (1) JP7211430B2 (ja)
WO (1) WO2020110272A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115526340A (zh) * 2022-11-25 2022-12-27 北京烽火万家科技有限公司 一种稳态视觉诱发电位范式迁移学习的方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"daisukelab, 小さなデータセットで良い分類器を学習させるとき", QIITA [オンライン], JPN6022024881, 7 October 2018 (2018-10-07), ISSN: 0004804412 *
庄野逸ほか: "2段階転移学習を用いたディープコンボリューションネットの医用画像認識", 日本神経回路学会誌, vol. 第24巻 第1号, JPN6022024880, March 2017 (2017-03-01), pages 3 - 12, ISSN: 0004804411 *

Also Published As

Publication number Publication date
US20220012551A1 (en) 2022-01-13
JP7211430B2 (ja) 2023-01-24
WO2020110272A1 (ja) 2020-06-04

Similar Documents

Publication Publication Date Title
US10963783B2 (en) Technologies for optimized machine learning training
US10977549B2 (en) Object animation using generative neural networks
JP2019508805A (ja) 大域的最適化に基づく意味的セグメント化
JP7276436B2 (ja) 学習装置、学習方法、コンピュータプログラム及び記録媒体
KR20190125029A (ko) 시계열 적대적인 신경망 기반의 텍스트-비디오 생성 방법 및 장치
WO2020218314A1 (ja) 特徴ベクトルを生成するシステム
JP7176590B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP7014230B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP7211430B2 (ja) 機械学習装置、機械学習方法、及びプログラム
KR102371487B1 (ko) 명목형 데이터를 포함하는 데이터를 기반으로 하는 학습 방법 및 장치
US11488007B2 (en) Building of custom convolution filter for a neural network using an automated evolutionary process
JP2019086979A (ja) 情報処理装置、情報処理方法及びプログラム
KR102105951B1 (ko) 추론을 위한 제한된 볼츠만 머신 구축 방법 및 추론을 위한 제한된 볼츠만 머신을 탑재한 컴퓨터 장치
JP2020052935A (ja) 学習済みモデルを生成する方法、データを分類する方法、コンピュータおよびプログラム
CN113656669B (zh) 标签更新方法及装置
US20210374543A1 (en) System, training device, training method, and predicting device
JP2023090592A (ja) OCT-GAN(Neural ODE-based Conditional Tabular Generative Adversarial Networks)装置及びOCT-GAN方法
WO2022038753A1 (ja) 学習装置、学習済みモデル生成方法、分類装置、分類方法、及びコンピュータ読み取り可能な記録媒体
KR102196874B1 (ko) 위성 이미지 생성 학습 장치, 위성 이미지 생성 학습 방법, 위성 이미지 생성 장치 및 위성 이미지 생성 방법
WO2022269708A1 (ja) 情報処理装置及び情報処理方法
WO2022195691A1 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
US20230316731A1 (en) Information processing apparatus, information processing method, and non-transitory computer-readable storage medium
WO2022181251A1 (ja) 関節点検出装置、関節点検出方法、及びコンピュータ読み取り可能な記録媒体
WO2021214861A1 (ja) 学習装置、学習済みモデル生成方法、分類装置、分類方法、及びコンピュータ読み取り可能な記録媒体
JP2022148878A (ja) プログラム、情報処理装置、及び方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210524

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210524

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220621

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221213

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221226

R151 Written notification of patent or utility model registration

Ref document number: 7211430

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151