JP7001150B2 - 識別システム、モデル再学習方法およびプログラム - Google Patents

識別システム、モデル再学習方法およびプログラム Download PDF

Info

Publication number
JP7001150B2
JP7001150B2 JP2020517632A JP2020517632A JP7001150B2 JP 7001150 B2 JP7001150 B2 JP 7001150B2 JP 2020517632 A JP2020517632 A JP 2020517632A JP 2020517632 A JP2020517632 A JP 2020517632A JP 7001150 B2 JP7001150 B2 JP 7001150B2
Authority
JP
Japan
Prior art keywords
identification
data
model
image
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020517632A
Other languages
English (en)
Other versions
JPWO2019215780A1 (ja
Inventor
哲夫 井下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2019215780A1 publication Critical patent/JPWO2019215780A1/ja
Application granted granted Critical
Publication of JP7001150B2 publication Critical patent/JP7001150B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/778Active pattern-learning, e.g. online learning of image or video features
    • G06V10/7784Active pattern-learning, e.g. online learning of image or video features based on feedback from supervisors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/08Detecting or categorising vehicles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Image Analysis (AREA)

Description

本発明は、データをモデルに適用することによって、そのデータが表わす物体を識別する識別システム、並びに、その識別システムに適用されるモデル再学習方法およびモデル再学習プログラムに関する。
一般的な識別システムの例を以下に説明する。一般的な識別システムは、その識別システムが備えているカメラが撮影によって得た画像と、その画像に写っている物体を表したラベルとの組を教師データとして、機械学習によってモデルを予め学習する。そして、その一般的な識別システムは、カメラが撮影によって新たに得た画像をそのモデルに適用することによって、その画像に写っている物体を識別する。
このような一般的な識別システムは、不審な車両や不審な人物を検出し、犯罪等を未然に防ぐ目的で用いられたり、白杖または車椅子の使用者を検出し、白杖または車椅子の使用者を誘導する等の支援の目的で用いられたりする。
ここでは、画像に写っている物体を識別する識別システムを例にして説明したが、一般的な識別システムとして、音声データが表わす物体を識別する識別システムも考えられる。以下、画像に写っている物体を識別する識別システムを例にして説明する。
なお、特許文献1には、撮像環境の違いによる追加学習の長期化を回避する画像認識方法が記載されている。特許文献1に記載の画像認識方法は、複数のカメラ装置を含むカメラシステムにおける画像認識方法である。そして、特許文献1に記載の画像認識方法では、第1カメラ装置から、第1画像および第1撮像環境情報を取得する。そして、各カメラ装置が過去に画像を撮像した際の各撮像環境を示す撮像環境情報と、その各撮像環境に対応する各検出器関数を示す各認識制御パラメータとを管理するパラメータテーブルを用いて、第1撮像環境情報に示される第1撮像環境と同一または類似の撮像環境に対応する第1検出器関数を示す第1認識制御パラメータを選択する。そして、第1認識制御パラメータで示された第1検出器関数を用いて、第1カメラ装置から取得した第1画像を認識する。
特開2016-15116号公報
前述の一般的な識別システムが複数台設けられ、各識別システムのカメラが各地に設置されることが考えられる。
ここで、1台のカメラが撮影によって得た画像における物体の写り方に、偏りが生じる場合がある。例えば、ある1台のカメラは、そのカメラから見て右側から左側への方向に進行する自動車を撮影する機会が多いが、その逆方向に進行する自動車を撮影する機会が少ないとする。この場合、右側から左側への方向に進行する自動車が写った画像は多く得られるが、その逆方向に進行する自動車が写った画像は少ししか得られない。すると、教師データには、右側から左側への方向に進行する自動車が写った画像が多く含まれ、その逆方向に進行する自動車が写った画像は少ししか含まれない。その結果、教師データを用いて機械学習によって得たモデルに、右側から左側への方向に進行する自動車が写った画像を適用した場合には、識別システムは高い精度で自動車を識別するが、逆方向に進行する自動車が写った画像をそのモデルに適用した場合の自動車の識別精度は低くなる。
そこで、本発明は、データが表わす物体を識別するためのモデルの識別精度を向上させるように、モデルを学習し直すことができる識別システム、並びに、その識別システムに適用されるモデル再学習方法およびモデル再学習プログラムを提供することを目的とする。
本発明による識別システムは、データを収集するデータ収集手段を備える識別システムであって、データが表わす物体を識別するためのモデルを、教師データを用いて学習する学習手段と、学習手段によって学習されたモデルを用いて、データが表わす物体を識別する第1の識別手段と、第1の識別手段が識別対象としたデータが表わす物体を、学習手段によって学習されたモデルとは異なるモデルを用いて識別する第2の識別手段と、他の複数の識別システムで学習された個々のモデルをそれぞれ記憶するモデル記憶手段とを備え、学習手段が、第2の識別手段が導出した識別結果に基づいて定まるデータに対するラベルと、そのデータとを含む教師データを用いて、モデルを再学習し、第2の識別手段が、他の複数の識別システムで学習された個々のモデル毎に、第1の識別手段が識別対象としたデータが表わす物体を識別し、当該識別システムが、第2の識別手段が個々のモデル毎に導出した識別結果を統合することによって、データに対するラベルを特定する統合手段を備え、学習手段が、統合手段によって特定されたラベルと、データとを含む教師データを用いて、モデルを再学習し、統合手段が、当該識別システムのデータ収集手段の属性と、他の複数の識別システムのデータ収集手段の属性との類似度を、他の識別システム毎に算出し、第2の識別手段が個々のモデル毎に導出した識別結果を、モデルに対応する類似度に応じた重みで重み付けして統合することを特徴とする。
また、本発明によるモデル再学習方法は、データを収集するデータ収集手段を備える識別システムが、データが表わす物体を識別するためのモデルを、教師データを用いて学習し、そのモデルを用いて、データが表わす物体を識別する第1の識別処理を実行し、第1の識別処理で識別対象としたデータが表わす物体を、そのモデルとは異なるモデルを用いて識別する第2の識別処理を実行し、第2の識別処理で導出した識別結果に基づいて定まるデータに対するラベルと、そのデータとを含む教師データを用いて、モデルを再学習し、その識別システムであって、他の複数の識別システムで学習された個々のモデルをそれぞれ記憶するモデル記憶手段を備える識別システムが、第2の識別処理で、他の複数の識別システムで学習された個々のモデル毎に、第1の識別処理で識別対象としたデータが表わす物体を識別し、第2の識別処理で個々のモデル毎に導出した識別結果を統合することによって、データに対するラベルを特定する統合処理を実行し、モデルを再学習するときに、統合処理で特定されたラベルと、データとを含む教師データを用いて、モデルを再学習し、統合処理で、当該識別システムのデータ収集手段の属性と、他の複数の識別システムのデータ収集手段の属性との類似度を、他の識別システム毎に算出し、第2の識別処理で個々のモデル毎に導出した識別結果を、モデルに対応する類似度に応じた重みで重み付けして統合することを特徴とする。
また、本発明によるモデル再学習プログラムは、データを収集するデータ収集手段と通信可能に接続されたコンピュータに、データが表わす物体を識別するためのモデルを、教師データを用いて学習する学習処理、学習処理で学習されたモデルを用いて、データが表わす物体を識別する第1の識別処理、第1の識別処理で識別対象としたデータが表わす物体を、学習処理で学習されたモデルとは異なるモデルを用いて識別する第2の識別処理、および、第2の識別処理で導出した識別結果に基づいて定まるデータに対するラベルと、そのデータとを含む教師データを用いて、モデルを再学習する再学習処理を実行させ、そのコンピュータであって、他の複数のコンピュータで学習された個々のモデルをそれぞれ記憶するモデル記憶手段を備えるコンピュータに、第2の識別処理で、他の複数のコンピュータで学習された個々のモデル毎に、第1の識別処理で識別対象としたデータが表わす物体を識別させ、第2の識別処理で個々のモデル毎に導出した識別結果を統合することによって、データに対するラベルを特定する統合処理を実行させ、再学習処理で、統合処理で特定されたラベルと、データとを含む教師データを用いて、モデルを再学習させ、統合処理で、当該コンピュータのデータ収集手段の属性と、他の複数のコンピュータのデータ収集手段の属性との類似度を、他のコンピュータ毎に算出させ、第2の識別処理で個々のモデル毎に導出した識別結果を、モデルに対応する類似度に応じた重みで重み付けして統合させることを特徴とする。
本発明によれば、データが表わす物体を識別するためのモデルの識別精度を向上させるように、モデルを学習し直すことができる。
本発明の識別システムが複数設けられている状況を示す模式図である。 本発明の第1の実施形態の識別システムの構成例を示すブロック図である。 内部生成モデルおよび外部生成モデルの例を示す模式図である。 第1の決定方法において決定部がディスプレイ装置上に表示する画面の例を示す模式図である。 第3の決定方法において決定部がディスプレイ装置上に表示する画面の例を示す模式図である。 領域修正GUI表示制御部がディスプレイ装置に表示する画面の一例を示す模式図である。 領域修正GUI表示制御部がディスプレイ装置に表示する画面の他の例を示す模式図である。 表示制御部が表示する画面の例を示す模式図である。 第1の演算方法の具体例を示す説明図である。 第2の演算方法の具体例を示す説明図である。 カメラが撮影を行ってから、第2の識別部が画像に対する識別処理を行うまでの処理経過の例を示すフローチャートである。 オペレータからの指示に基づいて内部生成モデルを再学習する場合の処理経過の例を示すフローチャートである。 本発明の第2の実施形態の識別システムの構成例を示すブロック図である。 本発明の各実施形態における識別システムが備えるコンピュータの構成例を示す概略ブロック図である。 本発明の識別システムの概要を示すブロック図である。
以下、本発明の実施形態を図面を参照して説明する。
実施形態1.
図1は、本発明の識別システムが複数設けられている状況を示す模式図である。図1では、6個の識別システム100が各所に設けられている場合を例示しているが、各所に設けられる識別システム100の数は、特に限定されない。各実施形態では、複数の識別システム100が同様の構成であるものとして説明する。
個々の識別システム100はそれぞれ、データ収集部(後述の図2に示すデータ収集部101)を備える。各識別システム100のデータ収集部(図1において図示略。後述の図2を参照。)は、データを収集する各地に設置される。データ収集部は、データ収集部の設置場所におけるデータを収集する。例えば、データ収集部は、設置場所において画像や音声データを収集する。データ収集部は、カメラやマイクロホンによって実現される。例えば、データ収集部は、監視場所を撮影することによって画像を収集してもよい。また、例えば、設置場所において録音することによって音声データを収集してもよい。
個々の識別システム100は、データ収集部とは別にコンピュータを備え、そのコンピュータは、データ(画像や音声データ等)が表わす物体を識別する。
図2は、本発明の第1の実施形態の識別システム100の構成例を示すブロック図である。識別システム100は、データ収集部101と、コンピュータ102とを備える。データ収集部101とコンピュータ102とは、有線または無線で通信可能に接続される。以下の説明では、データ収集部101がカメラである場合を例にして説明し、データ収集部101をカメラ101と記す。カメラ101は、そのカメラ101の設置場所から撮影を行う。なお、カメラ101の設置場所と、コンピュータ102の設置場所とが異なっていてもよい。
コンピュータ102は、学習部103と、第1のモデル記憶部104と、データ取得部105と、第1の識別部106と、決定部107と、領域修正GUI(Graphical User Interface)表示制御部108と、領域抽出部109と、第2のモデル記憶部110と、第2の識別部111と、表示制御部112と、属性データ記憶部113と、統合部114と、ディスプレイ装置115と、マウス116と、結果記憶部117とを備える。
学習部103は、カメラ101が撮影によって得た画像を教師データとして、機械学習によってモデルを学習する。以下、学習部103が、ディープラーニングによってモデルを学習する場合を例にして説明する。教師データは、例えば、カメラ101が撮影によって得た画像と、その画像に写っている物体を示すラベルとの組の集合である。ラベルは、識別システム100のオペレータが決定すればよい。学習は、そのような組の集合を教師データとして、モデルを学習(生成)する。
また、学習部103は、所定の画像と、その画像に対するラベルが特定された場合、その画像とラベルの組を教師データに追加して、ディープラーニングによって、モデルを再学習する。所定の画像とは、後述の決定部107が、第2の識別部111に識別処理を実行させると決定した画像である。なお、本実施形態では、そのように決定された画像において、物体が写っている領域が抽出され、抽出された領域の画像とラベルとの組が教師データに追加される場合を例にして説明する。
学習部103が学習によって生成したモデルを、以下、内部生成モデルと記す場合がある。また、後述するように、第2のモデル記憶部110は、他の識別システム100で同様に生成されたモデルを記憶する。以下、内部生成モデルと区別するために、他の識別システム100で生成されたモデルを、外部生成モデルと記す場合がある。
内部生成モデルおよび外部生成モデルは、与えられた新たな画像に写っている物体を識別するためのモデルである。以下、内部生成モデルおよび外部生成モデルがいずれも、画像に写っている物体が「自動車」、「オートバイ」、「バス」、「背景(すなわち、自動車、オートバイおよびバスは写っていない。)」の何れであるかを判定するためのモデルであるものとして説明する。このようなモデルを学習する場合、オペレータは、教師データで画像と対になるラベルとして「自動車」、「オートバイ」、「バス」、「背景」のいずれかを画像毎に定める。また、外部生成モデルが他の識別システム100で生成される場合にも、他の識別システム100のオペレータは、教師データで画像と対になるラベルとして「自動車」、「オートバイ」、「バス」、「背景」のいずれかを画像毎に定める。
本実施形態では、第1の識別部106が、モデルを用いて、画像に写っている物体が「自動車」、「オートバイ」、「バス」、「背景」の何れであるかを判定する場合を例にして説明するが、モデルを用いて判定される対象は、「自動車」、「オートバイ」、「バス」、「背景」に限られない。オペレータは、識別処理の目的に応じた教師データを用意して、その教師データを用いて学習部103にモデルを学習させればよい。なお、モデルを用いて判定される対象(本例では、「自動車」、「オートバイ」、「バス」および「背景」)は、各識別システム100で共通である。
学習部103は、ディープラーニングによって生成した内部生成モデルを第1のモデル記憶部104に記憶させる。第1のモデル記憶部104は、内部生成モデルを記憶する記憶装置である。
図3は、内部生成モデルおよび外部生成モデルの例を示す模式図である。モデルに適用される画像の画素数がnであるとすると、その画像は、n個の画素の各画素値を要素とするベクトル(X1,X2,・・・,Xn)と表すことができる。例えば、X1は、画像における1番目の画素の画素値を表す。X2~Xnに関しても同様である。また、ここで、Tは、転置を意味する。モデルは、複数の層を有し、層毎に複数の係数を含んでいる。図3に示す例では、1番目の層は、係数a1~amを含み、2番目の層は、係数b1~bjを含んでいる。画像を表すベクトルの個々の要素X1~Xnは、1番目の層の各係数a1~amと関連付けられる。図3では、この関連付けを線で表している。また、ある層の各係数は、その次の層の各係数と関連付けられる。図3では、この関連付けも線で表している。関連付けられた要素間には重みが定められる。例えば、関連付けられたa1とb1や、関連付けられたa1とb2等にそれぞれ重みが定められる。
学習部103は、教師データを用いてディープラーニングを行うことによって、層の数、各層に含まれる係数の数、各層における個々の係数の値、関連付けられた要素間の重みの値をそれぞれ決定する。これらの値が定めることが、内部生成モデルを生成することに該当する。
教師データが異なれば、層の数、各層に含まれる係数の数、各層における個々の係数の値、関連付けられた要素間の重みの値は、変化する。従って、内部生成モデルおよび外部生成モデルは図3に例示する形式のように表すことができるが、層の数、各層に含まれる係数の数、各層における個々の係数の値、関連付けられた要素間の重みの値等は、内部生成モデルと外部生成モデルとで異なる。また、後述するように、本実施形態では、第2のモデル記憶部110は、他の複数の識別システム100で学習された個々の外部生成モデルをそれぞれ記憶する。個々の外部生成モデルも、それぞれ異なる識別システム100において異なる教師データに基づいて生成されているので、層の数等は、外部生成モデル毎に異なる。
データ取得部105は、カメラ101が撮影によって得た新たな画像をカメラ101から取得する。データ取得部105は、カメラ101から画像を受信するためのインタフェースである。
第1の識別部106は、データ取得部105が新たな画像をカメラ101から取得したときに、第1のモデル記憶部104に記憶されている内部生成モデルにその画像を適用することによって、その画像が表わす物体を識別する。本例では、第1の識別部106は、内部生成モデルに画像を適用することによって、画像に写っている物体が「自動車」であるのか、「オートバイ」であるのか、「バス」であるのか、あるいは、「背景」しか写っていないのかを判定する。
画像が得られた場合、画像を表すベクトル(X1,X2,・・・,Xn)が定まる。第1の識別部106は、そのベクトル(X1,X2,・・・,Xn)と、内部生成モデルに含まれる各層の各係数およびモデルに含まれる各重みとを用いた演算により、「自動車」、「オートバイ」、「バス」、「背景」の信頼度を算出する。そして、第1の識別部106は、「自動車」、「オートバイ」、「バス」、「背景」のうち、最も高い信頼度が得られたラベルを、画像に写っている物体を示すラベルとして定める。例えば、第1の識別部106が、画像を表すベクトルをモデルに適用した結果、「自動車」、「オートバイ」、「バス」、「背景」それぞれの信頼度として、“0.6”、“0.2”、“0.1”、“0.1”が得られたとする。この場合、第1の識別部106は、画像に写っている物体は、最も高い信頼度“0.6”が得られた「自動車」であると識別する。また、定めたラベルが「背景」以外である場合、第1の識別部106は、画像に写っている物体(「自動車」、「オートバイ」または「バス」)を囲む矩形領域を、画像を表すベクトルと内部生成モデルとを用いた演算によって判定する。定めたラベルが「背景」であるということは、画像に物体が写っていないと判定したことを意味しているので、この場合には、第1の識別部106は、画像に写っている物体を囲む矩形領域を判定しない。
第1の識別部106は、識別処理の対象とした画像と、識別結果に該当するラベルと、そのラベルに対応する信頼度とを対応付けて、結果記憶部117に記憶させる。例えば、上記の例のように、第1の識別部106が、画像に写っている物体が、最も高い信頼度“0.6”が得られた「自動車」であると判定したとする。この場合、第1の識別部106は、その画像と、ラベル「自動車」と、信頼度“0.6”とを対応付けて、結果記憶部117に記憶させる。結果記憶部117は、識別結果等を記憶する記憶装置である。ただし、結果記憶部117は、後述するように、画像内における矩形領域を示す情報等も追加して記憶する。
第2のモデル記憶部110は、内部生成モデル(学習部103が生成したモデル)とは異なるモデルを記憶する記憶装置である。より具体的には、第2のモデル記憶部110は、他の識別システム100で生成されたモデル(外部生成モデル)を記憶する。本実施形態では、第2のモデル記憶部110は、他の複数の識別システム100で学習された個々の外部生成モデルをそれぞれ記憶している場合を例にして説明する。第2のモデル記憶部110に記憶される個々のモデルは、いずれも図3に模式的に示すモデルと同様の形式で表される。
第2のモデル記憶部110に他のどの識別システム100で生成されたモデルを記憶させるかは、識別システム100の管理者が決定すればよい。例えば、管理者は、複数の識別システム100を管理する。ただし、全ての識別システム100が同一の管理者に管理されている必要はない。例えば、図2に示す識別システム100を含む複数の識別システム100を管理する管理者は、その管理者自身が管理している複数の識別システム100からいくつかの識別システム100を選択し、選択した各識別システム100で生成されたそれぞれのモデルを図2に示す識別システム100の第2のモデル記憶部110に外部生成モデルとして記憶させればよい。
第2の識別部111は、第1の識別部106が識別対象とした各画像のうち、所定の画像を、第2のモデル記憶部110に記憶されている外部生成モデルに適用することによって、その所定の画像に写っている物体を識別する。第2の識別部111は、この処理を、個々の外部生成モデル毎に実行する。第2の識別部111は、所定の画像を外部生成モデルに適用することによって、「自動車」、「オートバイ」、「バス」、「背景」の信頼度をそれぞれ算出する。そして、第2の識別部111は、「自動車」、「オートバイ」、「バス」、「背景」のうち、最も高い信頼度が得られたラベルを、画像に写っている物体を示すラベルとして定める。
また、第1の識別部106が識別対象とした各画像のうちの所定の画像とは、第1の識別部106が識別対象とした各画像のうち、決定部107が、第2の識別部111に識別処理を実行させると決定した画像である。
決定部107は、第1の識別部106が識別対象とした各画像のうち、第2の識別部111に識別処理を実行させる画像を決定する。以下、決定部107が、第1の識別部106が識別対象とした各画像のうち、第2の識別部111に識別処理を実行させる画像を決定する方法として、3種類の決定方法を例示して説明する。決定部107は、以下に示す3種類の決定方法のうちの1つの決定方法のみを採用してもよい。あるいは、決定部107は、以下に示す3種類の決定方法のうちの複数の決定方法を採用してもよい。この場合、決定部107は、複数の決定方法のうちのいずれかの決定方法で、ある画像に対して第2の識別部111に識別処理を実行させると決定した場合には、その画像に対して第2の識別部111に識別処理を実行させることを確定する。
[第1の決定方法]
第1の決定方法は、画像に写っている物体を表わすラベルとして第1の識別部106によって定められたラベルが、誤りであった場合に、決定部107が、その画像に対して第2の識別部111に識別処理を実行させると決定する方法である。すなわち、決定部107が、第1の識別部106が誤識別した画像に対して、第2の識別部111に識別処理を実行させると決定する方法である。第1の識別部106によって定められたラベルが、誤りであるか否かは、例えば、識別システム100のオペレータによって判断されてもよい。以下、この場合を例にして説明する。第1の識別部106が画像に対するラベルを定めた場合、決定部107は、その画像と、その画像に対して定められたラベルと、そのラベルが正しいか否かをオペレータが入力するためのGUI(本例では、2つのボタンとする。)とを表わす画面を、ディスプレイ装置115上に表示する。図4は、第1の決定方法において決定部107がディスプレイ装置115上に表示する画面の例を示す模式図である。
決定部107は、第1の識別部106が画像に対するラベルを定めた場合、図4に例示するように、第1の識別部106が識別対象とした画像301と、第1の識別部106によって定められたラベル302(図4に示す例では「オートバイ」)と、第1ボタン304および第2ボタン305とを表わす画面を、ディスプレイ装置115上に表示する。第1ボタン304は、画像に対するラベルが正しいことを入力するためのボタンであり、第1ボタン304がクリックされたということは、画像に対するラベルが正しい旨の情報がオペレータから入力されたことを意味する。また、第2ボタン305は、画像に対するラベルが誤っていることを入力するためのボタンであり、第2ボタン305がクリックされたといういことは、画像に対するラベルが誤っている旨の情報がオペレータから入力されたことを意味する。図4に示す例では、画像301には自降車が写っているが、第1の識別部106によって定められたラベルとして「オートバイ」が表示されている。従って、オペレータは、マウス116を用いて第2ボタン305をクリックする。なお、図4に示す例では、第1の識別部106によって定められたラベルとして「自動車」が表示されているならば、オペレータは、第1ボタン304をクリックする。
決定部107は、図4に例示する画面において、第2ボタン305がクリックされると、第1の識別部106によって定められたラベルが誤っていると判定し、第1の識別部106が識別対象とした画像301に対して、第2の識別部111に識別処理を実行させると決定する。
なお、第1ボタン304がクリックされた場合には、決定部107は、第1の識別部106が識別対象とした画像301に対して、第2の識別部111に識別処理を実行させないと決定する。
[第2の決定方法]
第2の決定方法は、画像に対して定められたラベルに対応する信頼度が予め定められた閾値以下である場合に、決定部107が、その画像に対して第2の識別部111に識別処理を実行させると決定する方法である。
すなわち、第1の識別部106が画像に対して定めたラベルに対応する信頼度が閾値以下である場合、決定部107は、その画像に対して第2の識別部111に識別処理を実行させると決定する。また、第1の識別部106が画像に対して定めたラベルに対応する信頼度が閾値を超えている場合には、決定部107は、その画像に対して第2の識別部111に識別処理を実行させないと決定する。閾値は、例えば、“0.5”であるが、“0.5”以外の値であってもよい。
第2の決定方法は、決定部107は、第1の識別部106が導出した信頼度と閾値との比較によって、画像に対して第2の識別部111に識別処理を実行させるか否かを決定する。従って、第2の決定方法では、図4に例示する画面を表示する必要はない。
[第3の決定方法]
第3の決定方法は、第1の識別部106が画像に対して定めたラベルが「背景」であるにも関わらず、その画像に「自動車」、「オートバイ」または「バス」が写っている場合に、決定部107が、その画像に対して第2の識別部111に識別処理を実行させると決定する方法である。換言すれば、第3の決定方法は、第1の識別部106が画像に「自動車」、「オートバイ」および「バス」のいずれも写っていないと判定したにも関わらず、その画像に「自動車」、「オートバイ」または「バス」が写っている場合に、決定部107が、その画像に対して第2の識別部111に識別処理を実行させると決定する方法である。特定されたラベルが「背景」である場合に、画像に「自動車」等が写っているか否かの判断は、識別システム100のオペレータが行う。
第3の方法では、画像に対するラベルとして「背景」が定められた場合、決定部107は、その画像と、そのラベル「背景」と、前述の第1ボタン304および第2ボタン305とを表わす画面を、ディスプレイ装置115上に表示する。図5は、第3の決定方法において決定部107がディスプレイ装置115上に表示する画面の例を示す模式図である。
決定部107は、第1の識別部106が画像に対してラベルとして「背景」を定めた場合、図5に例示するように、第1の識別部106が識別対象とした画像301と、ラベル302と、第1ボタン304および第2ボタン305とを表わす画面を、ディスプレイ装置115上に表示する。第3の決定方法で表示される画面では、ラベル302として「背景」が表示される。第1ボタン304および第2ボタン305は、図4に示す第1ボタン304および第2ボタン305と同様であり、説明を省略する。
図5に示す例では、第1の識別部106が画像301に対して定めたラベルが「背景(自動車、オートバイおよびバスは写っていない。)」であるにも関わらず、画像301には、自動車が写っている。従って、オペレータは、マウス116を用いて第2ボタン305をクリックする。なお、画像301に、自動車、オートバイおよびバスのいずれもが写っていないならば、オペレータは、第1ボタン304をクリックする。
決定部107は、図5に例示する画面において、第2ボタン305がクリックされると、ラベル「背景」が特定されているが、画像には「自動車」、「オートバイ」および「バス」のいずれかが写っていると判定し、その画像に対して第2の識別部111に識別処理を実行させると決定する。
なお、図5に例示する画面において第1ボタン304がクリックされた場合には、決定部107は、画像には「自動車」、「オートバイ」および「バス」のいずれも写っておらず、ラベル「背景」は正しいと判断し、その画像に対して第2の識別部111に識別処理を実行させないと決定する。
次に、領域修正GUI表示制御部108について説明する。前述のように、第1の識別部106は、画像に対して定めたラベルが「背景」以外である場合、画像に写っている物体(「自動車」、「オートバイ」または「バス」)を囲む矩形領域を判定する。領域修正GUI表示制御部108は、決定部107によって第2の識別部111に識別処理を実行させると決定した画像を、その矩形領域とともにディスプレイ装置115上に表示し、さらに、その矩形領域を修正するためのGUIを示す画面をディスプレイ装置115上に表示する。ただし、前述の第3の方法で決定された画像に対しては、「背景」というラベルが定められているので、矩形領域は判定されていない。この場合、領域修正GUI表示制御部108は、矩形領域を表示しない。
図6は、領域修正GUI表示制御部108がディスプレイ装置115に表示する画面の一例を示す模式図である。図6に示す矩形領域309は、第1の識別部106が、画像301内で「自動車」を囲む領域として定めた矩形領域である。また、領域修正GUI表示制御部108は、画面内に確定ボタン307および修正ボタン308を含める。確定ボタン307は、表示された矩形領域を確定することをオペレータが指示するためのボタンである。修正ボタン308は、矩形領域309の修正を受け付けることをオペレータが指示するためのボタンである。
図6に示す例では、矩形領域309は、画像301内で「自動車」を囲む矩形領域として適切である。オペレータは、このように判断した場合、確定ボタン307をクリックする。確定ボタン307がクリックされると、領域抽出部109は、その時点で、画像301内における矩形領域309を確定する。
図7は、領域修正GUI表示制御部108がディスプレイ装置115に表示する画面の他の例を示す模式図である。図7に示す例では、矩形領域309は、画像301内で「自動車」を囲む矩形領域として適切でない。この場合、領域修正GUI表示制御部108は、オペレータの操作に応じて、「自動車」を囲む矩形領域として適切な矩形領域を受け付ける。図7に例示する適切でない矩形領域309が表示された場合には、オペレータは、修正ボタン308をクリックする。修正ボタン308がクリックされた後には、領域修正GUI表示制御部108は、オペレータによるマウス116を用いた操作に応じて、矩形領域309の頂点や辺の位置の修正を受け付ける。オペレータは、頂点や辺の位置を修正することによって、矩形領域309を、図6に例示するような適切な位置や大きさに修正することができる。領域修正GUI表示制御部108、そのような修正を受け付ける。オペレータは、矩形領域309を、画像301内に写っている物体(本例では「自動車」)を囲む適切な位置や大きさに矩形領域309が修正した後、確定ボタン307をクリックする。前述のように、確定ボタン307がクリックされると、領域抽出部109は、その時点で、画像301内における矩形領域309を確定する。本例では、領域抽出部109は、修正後の矩形領域309を確定する。
また、既に説明したように、前述の第3の方法で決定された画像に対しては、「背景」というラベルが定められているので、矩形領域は判定されていない。この場合、領域修正GUI表示制御部108は、図6に例示する画面において、矩形領域309を表示しない。この場合、オペレータが修正ボタン308をクリックすると、領域修正GUI表示制御部108は、画像301の任意の場所に任意の大きさで矩形領域309を表示し、オペレータによるマウス116を用いた操作に応じて、矩形領域309の頂点や辺の位置の修正を受け付ける。オペレータは、表示された矩形領域309を、画像301内に写っている物体を囲む適切な位置や大きさに修正した後、確定ボタン307をクリックすればよい。確定ボタン307がクリックされると、領域抽出部109は、その時点で、画像301内における矩形領域309を確定する。
上記のように、領域抽出部109は、確定ボタン307がクリックされると、その時点で、画像301内における矩形領域309を確定する。そして、領域抽出部109は、その画像から、確定した矩形領域を抽出する。この矩形領域は、画像に写っている物体を囲む領域である。領域抽出部109は、結果記憶部117に記憶されている画像、第1の識別部106による識別結果となるラベル、および、そのラベルに対応する信頼度に対応させて、確定した矩形領域を表わす情報も結果記憶部117に記憶させる。矩形領域を表わす情報は、例えば、矩形領域の各頂点の座標である。
第2の識別部111は、領域抽出部109によって抽出された矩形領域の画像を対象にして、その矩形領域の画像に写っている物体を識別する。第2の識別部111は、この処理を、第2のモデル記憶部110に記憶されている個々の外部生成モデル毎に実行する。
第2の識別部111は、抽出された矩形領域の画像を外部生成モデルに適用することによって、「自動車」、「オートバイ」、「バス」、「背景」の信頼度をそれぞれ算出する。そして、第2の識別部111は、「自動車」、「オートバイ」、「バス」、「背景」のうち、最も高い信頼度が得られたラベルを、画像に写っている物体を示すラベルとして定める。また、第2の識別部111は、ラベル毎に求めた信頼度、並びに、画像に写っている物体を示すラベルおよびそのラベルに対応する信頼度を、既に、結果記憶部117に記憶されているその画像に対応付けて、結果記憶部117に記憶させる。第2の識別部111は、この処理を外部生成モデル毎に実行する。以下、説明を簡単にするために、第2のモデル記憶部110に記憶されている外部生成モデルの数が2個であり、2個の外部生成モデルの一方を符号“A”で表し、他方を符号“B”で表す。
この場合、結果記憶部117には、画像と、第1の識別部106がその画像に対して識別処理を行って定めたラベルと、そのラベルに対応する信頼度と、確定された画像内の矩形領域を表わす情報とが記憶される。さらに、それらの情報に対応付けて、第2の識別部111が外部生成モデルAに矩形領域の画像を適用して得たラベル毎の信頼度、および、最も信頼度が高いラベルとそのラベルに対応する信頼度、並びに、第2の識別部111が外部生成モデルBに矩形領域の画像を適用して得たラベル毎の信頼度、および、最も信頼度が高いラベルとそのラベルに対応する信頼度も、結果記憶部117に記憶される。
結果記憶部117は、上記のような情報のセットが蓄積される
ただし、決定部107が第2の識別部111に識別処理を実行させると決定しなかった画像に関しては、画像と、第1の識別部106がその画像に対して識別処理を行って定めたラベルと、そのラベルに対応する信頼度が結果記憶部117に記憶され、画像内の矩形領域を表わす情報等は記憶されない。
表示制御部112は、結果記憶部117に記憶された情報から、1組の情報のセットを読み出し、画像と、第1の識別部106が導出したラベルおよびそのラベルに対応する信頼度と、第2の識別部111が外部生成モデル毎に導出したラベルおよびそのラベルに対応する信頼度とを含む画面を、ディスプレイ装置115上に表示する。
図8は、表示制御部112が表示する画面の例を示す模式図である。表示制御部112は、第1の識別部106が導出したラベルおよびそのラベルに対応する信頼度501と、第2の識別部111が外部生成モデルAを用いて導出したラベルおよびそのラベルに対応する信頼度502と、第2の識別部111が外部生成モデルBを用いて導出したラベルおよびそのラベルに対応する信頼度503とを、画像301に重畳した画面を、ディスプレイ装置115上に表示する。図8に示す例では、表示制御部112は、確定している矩形領域309も、画像301に重畳させて表示する。本例では、第2のモデル記憶部110に記憶されている外部生成モデルが2個である場合を例示しているが、外部生成モデルの数は3個以上であってもよい。
さらに、表示制御部112は、この画面内に、チェックボックス504と、再学習ボタン505と、画面切り替えボタン506,507を表示させる。
チェックボックス504は、画面内に表示されている画像301(より具体的には、画像301から抽出される矩形領域309の画像)を教師データに含めるか否かを指定するためのGUIである。チェックボックス504がチェックされている場合、画像301から抽出される矩形領域309の画像を教師データに含めることを意味する。チェックボックス504がチェックされていない場合、画像301を教師データに含めないことを意味する。なお、表示制御部112は、外部生成モデルを用いて導出された信頼度に応じて、予めチェックされた状態でチェックボックス504を表示してもよい。例えば、外部生成モデルを用いて導出されたラベルおよび信頼度の組において、信頼度が閾値(例えば、“0.5”)よりも大きい組が1組以上あれば、表示制御部112は、予めチェックされた状態でチェックボックス504を表示してもよい。オペレータは、チェックボックス504をマウス116でクリックすることによって、チェックボックス504にチェックを入れたり、チェックボックス504からチェックを外したりすることができる。オペレータは、画像301と、外部生成モデル毎に導出されたラベルおよび信頼度を参照することによって、画像301から抽出される矩形領域309の画像を教師データに含めるか否かを判断すればよい。そして、オペレータは、その判断に基づいて、チェックボックス504にチェックを入れるか否かを決定すればよい。
画面切り替えボタン506,507は、異なる画像を表示する画面に切り替えるためのボタンである。例えば、画面切り替えボタン506がクリックされた場合、表示制御部112は、時系列順で画像301よりも前の画像を含んでいる、図8に示す画面と同様の画面に切り替える。また、例えば、画面切り替えボタン507がクリックされた場合、表示制御部112は、時系列順で画像301よりも後の画像を含んでいる、図8に示す画像と同様の画面に切り替える。オペレータは、切り替えた各画面において、チェックボックス504にチェックを入れるか否かを決定すればよい。
再学習ボタン505は、オペレータが識別システム100に、内部生成モデルの再学習を指示するためのボタンである。再学習ボタン505がクリックされた場合、統合部114は、チェックボックス504がチェックされた画面の画像毎に、ラベルを特定する。以下の説明では、説明を簡単にするために、図8に例示する画面のみで、チェックボックス504がチェックされている場合を例にして説明する。この場合、統合部114は、図8に例示する画像301のラベルを特定する。
以下、統合部114が1つの画像のラベルを特定する処理について説明する前に、まず、属性データ記憶部113について説明する。属性データ記憶部113は、属性データ記憶部113を含むコンピュータ102に接続されているカメラ101の属性を示すデータ(属性データ)と、第2のモデル記憶部110に記憶されている各外部生成モデルを生成した各識別システム100のカメラ101の属性データとを記憶する記憶装置である。ある外部生成モデルを生成した各識別システム100のカメラ101の属性データを、その外部生成モデルに対応する属性データと記す。
カメラ101の属性として、カメラ101自体の属性や、カメラ101が設置されている環境に依存する属性等が挙げられる。各属性の値は通知で表される。また、各属性の値は、識別システム100の管理者がカメラ101の設定や設置環境に応じて予め決定すればよい。属性データは、このような属性の値(数値)を要素とするベクトルで表される。
カメラ101の属性データは、少なくとも、「カメラ101の画角」、「カメラ101が屋内に設置されているか屋外に設置されているか」、「カメラ101の撮影対象」、「カメラ101の撮影対象の移動方向」という各属性のうちの少なくとも一部の属性の値を含む。また、ベクトルで表される属性データが、どの属性の値を要素としているかは、全ての識別システム100で共通であり、どの属性の値がベクトルの何番目の要素なっているかに関しても、全ての識別システム100で共通である。ベクトルの各要素となる数値は、識別システム100毎に異なっていてよい。
「カメラ101の画角」は、数値で表されるので、管理者は、画角を表わす数値をベクトルの要素として定めればよい。
「カメラ101が屋内に設置されているか屋外に設置されているか」という属性に関しては、例えば、カメラ101が屋内に設置されている場合には、この属性の値を“0”に定め、カメラ101が屋外に設置されている場合には、この属性の値を“1”に定めればよい。
また、「カメラ101の撮影対象」という属性に関しては、例えば、カメラ101が車両を撮影するように設置されている場合(例えば、カメラ101が車道に向けて設置されている場合)、この属性の値を“0”に定める。また、カメラ101が歩行者を撮影するように設置されている場合(例えば、カメラ101が歩道に向けて設置されている場合)、この属性の値を“1”に定める。また、カメラ101が車両と歩行者の両方を撮影するように設置されている場合(例えば、カメラ101が車両と歩行者の両方が通る道に向けて設置されている場合)、この属性の値を“0.5”に定める。
「カメラ101の撮影対象の移動方向」という属性に関しては、カメラ101の主軸方向等に基づいた基準軸を定め、その基準軸と、撮影対象の主たる移動方向とのなす角度を、この属性の値として定めればよい。
また、上記以外の属性の値を属性データに含めてもよい。例えば、「カメラ101の設置場所の高さ」、「カメラ101の俯角」、「カメラ101の解像度」等の値を属性データに含めてもよい。「カメラ101の設置場所の高さ」、「カメラ101の俯角」、「カメラ101の解像度」はいずれも数値で表されるので、それらの数値をベクトルの要素として定めればよい。
属性データ記憶部113は、属性データ記憶部113を含むコンピュータ102に接続されているカメラ101の属性データ(ベクトル)を記憶する。この属性データを基準属性データと記す。さらに、属性データ記憶部113は、第2のモデル記憶部110に記憶されている各外部生成モデルを生成した各識別システム100のカメラ101の属性データを記憶する。本実施形態では、第2のモデル記憶部110は、外部生成モデルAおよび外部生成モデルBを記憶する。従って、属性データ記憶部113は、基準属性データの他に、外部生成モデルAに対応する属性データ(属性データAと記す。)、および、外部生成モデルBに対応する属性データ(属性データBと記す。)も記憶する。属性データAは、外部生成モデルAを生成した識別システム100のカメラ101の属性データである。同様に、属性データBは、外部生成モデルBを生成した識別システム100のカメラ101の属性データである。
前述のように、複数の識別システム100を管理する管理者は、その管理者自身が管理している複数の識別システム100からいくつかの識別システム100を選択し、選択した各識別システム100で生成されたそれぞれのモデルを図2に示す識別システム100の第2のモデル記憶部110に外部生成モデルとして記憶させればよい。このとき、その管理者は、選択した各識別システム100のカメラ101の属性データを図2に示す識別システム100の属性データ記憶部113に記憶させればよい。また、その管理者は、図2おけるカメラ101の属性データを基準属性データとして、属性データ記憶部113に記憶させればよい。
統合部114は、第2の識別部111が、画像に対して個々の外部生成モデル毎に導出した各ラベルの信頼度(本実施形態では、「自動車」、「オートバイ」、「バス」、「背景」それぞれの信頼度)を、ラベル毎に統合し、その統合結果に基づいてその画像のラベルを特定する。
このとき、統合部114は、基準属性データ(すなわち、統合部114を含む識別システム100のカメラ101の属性データ)と、外部生成モデルAや外部生成モデルBを生成した他の複数の識別システム100のカメラ101の属性データとの類似度を、他の識別システム100毎に算出する。本実施形態では、統合部114は、基準属性データと属性データAとの類似度と、基準属性データと属性データBとの類似度とを、それぞれ算出する。基準属性データと属性データAとの類似度を、外部生成モデルAに対応する類似度と記す。また、基準属性データと属性データBとの類似度を、外部生成モデルBに対応する類似度と記す。
属性データはベクトルで表される。統合部114は、2つの属性データ(ベクトル)の類似度を算出する場合、その2つのベクトルの距離の逆数を、類似度として算出すればよい。
統合部114は、個々の外部生成モデル毎に導出した各ラベルの信頼度を、ラベル毎に統合するときに、外部生成モデルに対応する類似度で重み付けして、統合する。統合部114は、信頼度の統合結果が最も高くなったラベルを、画像のラベルとして特定すればよい。
外部生成モデル毎に導出した各ラベルの信頼度を、ラベル毎に統合する演算について、具体的に説明する。統合部114が信頼度を統合する演算方法として2つの演算方法を説明する。ここでは、1つのラベルに関して、外部生成モデル毎に導出した信頼度を統合する場合を説明する。統合部114は、他のラベルに関しても、同様の演算を行って、外部生成モデル毎に導出した信頼度を統合すればよい。
[第1の演算方法]
まず、信頼度を統合する第1の演算方法について説明する。i番目の外部生成モデルを用いて得られた、着目しているラベルの信頼度をLiとする。また、i番目の外部生成モデルに関して算出された類似度(基準属性データと、i番目の外部生成モデルに対応する属性データとの類似度)をWiとする。また、第2のモデル記憶部110に記憶されている外部生成モデルの数をN個とする。この場合、統合部114は、着目しているラベルの信頼度を、以下に示す式(1)の計算によって統合すればよい。
Figure 0007001150000001
すなわち、統合部114は、外部生成モデル毎にLiとWiとの積を算出し、その積の平均値を、着目しているラベルの信頼度の統合結果とすればよい。統合部114は、他のラベルに関しても、同様の演算を行う。そして、統合部114は、統合結果が最も高くなったラベルを、画像のラベルとして特定する。
図9は、第1の演算方法の具体例を示す説明図である。2つの外部生成モデルA,Bがあるとする。外部生成モデルAを用いて導出された「自動車」、「オートバイ」、「バス」および「背景」の信頼度がそれぞれ、“0.1”,“0.7”,“0.1”,“0.1”であるとする。また、外部生成モデルAに関して算出された類似度が“0.9”であるとする。統合部114は、上記の信頼度毎に、類似度“0.9”を乗じた結果を算出する。この結果、「自動車」、「オートバイ」、「バス」および「背景」それぞれに関して、“0.09”,“0.63”,“0.09”,“0.09”という乗算結果(積)が得られる。
また、外部生成モデルBを用いて導出された「自動車」、「オートバイ」、「バス」および「背景」の信頼度がそれぞれ、“0.1”,“0.6”,“0.2”,“0.1”であるとする。また、外部生成モデルBに関して算出された類似度が“0.8”であるとする。統合部114は、上記の信頼度毎に、類似度“0.8”を乗じた結果を算出する。この結果、「自動車」、「オートバイ」、「バス」および「背景」それぞれに関して、“0.08”,“0.48”,“0.16”,“0.08”という乗算結果(積)が得られる。
統合部114は、「自動車」、「オートバイ」、「バス」および「背景」毎に得られた乗算結果(積)の平均値を計算する。「自動車」、「オートバイ」、「バス」および「背景」それぞれに関して算出された平均値は、”0.085”,”0.555”,”0.125”,”0.085”である。従って、統合部114は、平均値(統合結果)が最も高い「オートバイ」を、画像のラベルとして特定する。
[第2の演算方法]
次に、信頼度を統合する第2の演算方法について説明する。前述の場合と同様に、i番目の外部生成モデルを用いて得られた、着目しているラベルの信頼度をLiとする。また、i番目の外部生成モデルに関して算出された類似度(基準属性データと、i番目の外部生成モデルに対応する属性データとの類似度)をWiとする。また、個々の外部生成モデルに関して算出された個々の類似度の総和をWtとする。また、第2のモデル記憶部110に記憶されている外部生成モデルの数をN個とする。統合部114は、Wtを以下に示す式(2)の計算によって算出すればよい。
Figure 0007001150000002
この場合、統合部114は、着目しているラベルの信頼度を、以下に示す式(3)の計算によって統合すればよい。
Figure 0007001150000003
すなわち、統合部114は、外部生成モデル毎に、類似度の総和に対する外部生成モデルに対応する類似度の割合を算出し、その割合の算出結果を重みとして、着目しているラベルの信頼度の重み付け和を算出し、その算出結果を、着目しているラベルの信頼度の統合結果とすればよい。統合部114は、他のラベルに関しても、同様の演算を行う。そして、統合部114は、統合結果が最も高くなったラベルを、画像のラベルとして特定する。
図10は、第2の演算方法の具体例を示す説明図である。2つの外部生成モデルA,Bがあるとする。外部生成モデルAを用いて導出された「自動車」、「オートバイ」、「バス」および「背景」の信頼度がそれぞれ、“0.1”,“0.7”,“0.1”,“0.1”であるとする。外部生成モデルBを用いて導出された「自動車」、「オートバイ」、「バス」および「背景」の信頼度がそれぞれ、“0.1”,“0.6”,“0.2”,“0.1”であるとする。外部生成モデルAに関して算出された類似度が“0.9”であり、外部生成モデルBに関して算出された類似度が“0.8”であるとする。この場合、類似度の総和は、0.9+0.8=1.7である。よって、類似度の総和“1.7”に対する、外部生成モデルAに対応する類似度“0.9”の割合は、“0.9/1.7”である。また、類似度の総和“1.7”に対する、外部生成モデルBに対応する類似度“0.8”の割合は、“0.8/1.7”である。統合部114は、“0.9/1.7”および“0.8/1.7”を重みとして、ラベル毎に、信頼度の重み付け和を算出し、その算出結果を、ラベルの信頼度の統合結果とする。すると、「自動車」、「オートバイ」、「バス」および「背景」それぞれの統合結果は、“0.0999”,“0.6528”,“0.1470”,“0.0999”となる。従って、統合部114は、統合結果が最も高い「オートバイ」を、画像のラベルとして特定する。
第1の演算方法および第2の演算方法は、いずれも、個々の外部生成モデル毎に導出したラベルの信頼度を、外部生成モデルに対応する類似度で重み付けして統合する演算であると言える。
統合部114が、各ラベルの信頼度の統合結果に基づいて、画像のラベルを特定すると、学習部103は、その画像において確定している矩形領域を抽出し、その矩形領域の画像と、統合部114によって特定されたラベルとの組を、既存の教師データに含める。そして、学習部103は、その教師データを用いて、ディープラーニングによって、内部生成モデルを再学習する。さらに、学習部103は、第1のモデル記憶部104に記憶されている既存の内部生成モデルを、再学習によって生成した新たな内部生成モデルに更新する。
学習部103、第1の識別部106、決定部107、領域修正GUI表示制御部108、領域抽出部109、第2の識別部111、表示制御部112および統合部114は、例えば、モデル再学習プログラムに従って動作するコンピュータ102のCPU(Central Processing Unit )によって実現される。例えば、CPUが、コンピュータ102のプログラム記憶装置等のプログラム記録媒体からモデル再学習プログラムを読み込み、モデル再学習プログラムに従って、学習部103、第1の識別部106、決定部107、領域修正GUI表示制御部108、領域抽出部109、第2の識別部111、表示制御部112および統合部114として動作すればよい。また、第1のモデル記憶部104、第2のモデル記憶部110、属性データ記憶部113および結果記憶部117は、コンピュータ102が備える記憶装置によって実現される。
次に、第1の実施形態の処理経過について説明する。図11は、カメラ101が撮影を行ってから、第2の識別部111が画像に対する識別処理を行うまでの処理経過の例を示すフローチャートである。なお、既に説明した動作については、詳細な説明を省略する。
なお、予め、学習部103がディープラーニングによって内部生成モデルを学習し、その内部生成モデルを第1のモデル記憶部104に記憶させているものとする。
まず、カメラ101が、そのカメラ101の設置場所で撮影を行うことによって、画像を得る(ステップS1)。カメラ101は、その画像をコンピュータ102に送信する。
コンピュータ102の第1の識別部106は、データ取得部105を介して、その画像を受け取る。そして、第1の識別部106は、その画像を内部生成モデルに適用することによって、画像に写っている物体を識別する(ステップS2)。ステップS2において、第1の識別部106は、画像に写っている物体を表わすラベルと、そのラベルの信頼度を導出する。第1の識別部106は、画像と、導出したラベルおよび信頼度とを対応付けて結果記憶部117に記憶させる。また、第1の識別部106は、特定したラベルが「背景」でない場合には、画像に写っている物体を囲む矩形領域を判定する。
次に、決定部107は、ステップS2で第1の識別部106が識別対象とした画像に対して、第2の識別部111に識別処理を実行させるか否かを決定する(ステップS3)。第2の識別部111に識別処理を実行させないと決定した場合には(ステップS3のNo)、ステップS1以降の処理を繰り返す。
第2の識別部111に識別処理を実行させると決定した場合には(ステップS3のYes)、領域修正GUI表示制御部108が、画像をディスプレイ装置115上に表示する。例えば、領域修正GUI表示制御部108は、図6や図7に例示する画面をディスプレイ装置115上に表示する。そして、領域抽出部109は、その画面に対するオペレータの操作に応じて、画像に写っている物体を囲む矩形領域を確定し、画像からその矩形領域を抽出する(ステップS4)。
次に、第2の識別部111は、予め第2のモデル記憶部110に記憶されている個々の外部生成モデル毎に、ステップS4で抽出された矩形領域の画像に写っている物体を識別する(ステップS5)。第2の識別部111は、個々の外部生成モデル毎に、各ラベル(「自動車」、「オートバイ」、「バス」および「背景」)それぞれの信頼度を導出する。そして、外部生成モデル毎に導出した各ラベルの信頼度を結果記憶部117に記憶させる。また、第2の識別部111は、個々の外部生成モデル毎に、信頼度が最も高かったラベルと、そのラベルに対応する信頼度の組も、結果記憶部117に記憶させる。信頼度が最も高かったラベルは、画像に写っていると判定された物体を表わしている。
ステップS5の後、ステップS1以降の処理を繰り返す。
図12は、オペレータからの指示に基づいて内部生成モデルを再学習する場合の処理経過の例を示すフローチャートである。以下の説明においても、既に説明した動作については、詳細な説明を省略する。
表示制御部112は、第1の識別部106が導出したラベルおよびそのラベルに対応する信頼度と、第2の識別部111が外部生成モデル毎に導出した各ラベルおよびその各ラベルに対応する信頼度とを、画像に重畳した画面を、ディスプレイ装置115上に表示する(ステップS11)。このとき、表示制御部112は、この画面内に、チェックボックス504と、再学習ボタン505と、画面切り替えボタン506,507とを含める。表示制御部112は、ステップS11において、例えば、図8に例示する画面を表示する。
オペレータは、図8に例示する画面を確認し、表示されている画像301(より具体的には、画像301において確定している矩形領域309の画像)を教師データに含めるか否かを判断する。オペレータは、チェックボックス504にチェックを入れることで、表示されている画像301を教師データの含めることを指定する。すなわち、チェックボックス504にチェックが入れられた画面に表示された画像は、教師データに含める画像として指定された画像である。また、オペレータは、教師データの含める画像を指定した後、再学習ボタン505をクリックする。
オペレータによって再学習ボタン505がクリックされると、統合部114は、基準属性データと、個々の外部生成モデルに対応する個々の属性データとの類似度をそれぞれ算出する(ステップS12)。既に説明したように、属性データはベクトルで表される。統合部114は、2つの属性データ(ベクトル)の類似度を算出する場合、その2つのベクトルの距離の逆数を、類似度として算出すればよい。
次に、統合部114は、個々の外部生成モデル毎に導出したラベルの信頼度を、ステップS12で算出した各類似度を用いて、統合する。統合部114は、この処理をラベル毎に行い、信頼度の統合結果が最も高いラベルを、教師データに含める画像に対するラベルとして特定する(ステップS13)。
教師データの含める画像がオペレータによって複数指定されている場合には、統合部114は、その画像毎に、ステップS13の処理を実行する。
次に、学習部103は、教師データに含める画像において確定している矩形領域を抽出し、その矩形領域の画像と、統合部114によって特定されたラベルとの組を既存のデータに含める。そして、学習部103は、その教師データを用いて、ディープラーニングによって内部生成モデルを再学習し、再学習によって得た内部生成モデルを第1のモデル記憶部104に記憶させる(ステップS14)。学習部103は、第1のモデル記憶部104に記憶されている既存の内部生成モデルを、再学習によって生成した新たな内部生成モデルに更新する。
この後、第1の識別部106が、画像に写っている物体を識別する場合には、再学習によって生成された新たな内部生成モデルを用いる。
本実施形態によれば、決定部107は、前述の第1の決定方法、第2の決定方法および第3の決定方法のうちの少なくとも1つの方法で、第1の識別部106が識別処理の対象とした画像に対して、第2の識別部111に識別処理を実行させるか否かを決定する。従って、第2の識別部111によって識別処理が行われる画像は、第1の識別部106によって定められたラベルが誤りであった画像、画像に対して定められたラベルに対応する信頼度が閾値以下であった画像、または、第1の識別部106によって定められたラベルが「背景」であるにも関わらず、物体(「自動車」、「オートバイ」または「バス」)が写っている画像である。本実施形態では、このような画像を、内部生成モデルとは異なるモデル(より具体的には、他の識別システム100で生成されたモデル(外部生成モデル))に適用した結果に基づいて特定されるラベルと、その画像との組を、既存の教師データに追加して、学習部103が内部生成モデルを再学習する。従って、内部生成モデルの識別精度を向上させることができる。
次に、第1の実施形態の種々の変形例について説明する。
第1の実施形態では、図6や図7に例示する画面に対するオペレータの操作に応じて、領域抽出部109が、画像に写っている物体を囲む矩形領域を確定し、画像からその矩形領域を抽出する。そして、第2の識別部111が、外部生成モデル毎に、抽出された矩形領域の画像に写っている物体を識別する。第2の識別部111は、抽出された矩形領域の画像ではなく、第1の識別部106が処理対象とした1つの画像全体を対象にして、画像に写っている物体を識別する処理を行ってもよい。この場合、識別システム100(図2参照)は、領域修正GUI表示制御部108および領域抽出部109を備えていなくてもよい。そして、識別システム100は、ステップS4(図11参照)を実行しなくてもよい。第2の識別部111は、ステップ5において、第1の識別部106が処理対象とした1つの画像全体を対象にして、画像に写っている物体を識別すればよい。
また、学習部103は、1つの画像全体と、統合部114が特定したラベルとの組を、既存の教師データに含め、その教師データを用いて、内部生成モデルを再学習すればよい。
また、学習部103は、画像と統合部114によって特定されたラベルとの組、および、既存の内部生成モデルを教師データとして、ディープラーニングによって内部生成モデルを再学習してもよい。この点は、後述の第2の実施形態においても同様である。
また、第2のモデル記憶部110が、1つの外部生成モデルを記憶していてもよい。この場合、学習部103は、画像と、第2の識別部111で導出された、信頼度が最も高いラベルとの組を、既存の教師データに含め、その教師データを用いて、内部生成モデルを再学習すればよい。
実施形態2.
図13は、本発明の第2の実施形態の識別システム100の構成例を示すブロック図である。図2に示す要素と同様の要素については、図2と同一の符号を付し、説明を省略する。
第2の実施形態の識別システム100が備えるコンピュータ102は、第1の実施形態における第2のモデル記憶部110および第2の識別部111の代わりに、データ送受信部118を備える。
データ収集部101、学習部103、第1のモデル記憶部104、データ取得部105、第1の識別部106、決定部107、領域修正GUI表示制御部108、領域抽出部109、表示制御部112、属性データ記憶部113、統合部114、ディスプレイ装置115、マウス116および結果記憶部117は、第1の実施形態におけるそれらの要素と同様である。また、第2の実施形態でも、データ収集部101がカメラである場合を例にして説明し、データ収集部101をカメラ101と記す。
データ送受信部118は、領域抽出部109が抽出した矩形領域の画像と、その画像に対して識別処理を行い、ラベル毎の信頼度、および、信頼度が最も高いラベルとその信頼度の組を送り返すことを要求する要求信号とを、予め定められた他の識別システム100に送信する。画像よび要求信号の送信先となる他の識別システム100は、予め、管理者によって定められる。また、ここでは、管理者は、画像および要求信号の送信先となる他の識別システム100を複数定めておく場合を例にして説明する。
データ送受信部118は、画像および要求信号を、予め定められた他の複数の識別システム100にそれぞれ送信する。
画像および要求信号を受信した他の識別システム100は、それぞれ、予め記憶しているモデルにその画像を適用することによって、ラベル毎の信頼度(「自動車」、「オートバイ」、「バス」、「背景」毎の信頼度)を導出し、また、信頼度が最も高いラベルとその信頼度の組を特定する。そして、その識別システム100は、ラベル毎の信頼度、および、信頼度が最も高いラベルとその信頼度の組を、要求信号の送信元である識別システム100に送信する。
要求信号の送信元である識別システム100のデータ送受信部118は、要求信号の送信先とした各識別システム100からそれぞれ、ラベル毎の信頼度、および、信頼度が最も高いラベルとその信頼度の組を受信し、受信したデータを、結果記憶部117に記憶させる。
また、第2の実施形態では、管理者は、属性データ記憶部113に、その属性データ記憶部113を備える識別システム100のカメラ101の属性データ(基準属性データ)を記憶させるとともに、画像および要求信号の送信先として定めた他の各識別システム100のカメラ101の属性データも記憶させておけばよい。
前述の第1の実施形態では、第2の識別部111(図2参照)が、他の識別システム100で生成されたモデル(外部生成モデル)を用いて、画像に対する識別処理を行う。一方、第2の実施形態では、データ送受信部118(図13参照)が、画像および要求信号を他の識別システム100に送信し、他の識別システム100に識別処理を行わせ、他の識別システム100からその結果を受信する。第1の実施形態と第2の実施形態では、この点が異なるだけで、その他の点に関しては同様である。
従って、第2の実施形態でも、第1の実施形態と同様の効果が得られる。
データ送受信部118は、例えば、モデル再学習プログラムに従って動作するコンピュータ102のCPUおよびコンピュータ102の通信インタフェースによって実現される。例えば、CPUが、コンピュータ102のプログラム記憶装置等のプログラム記録媒体からモデル再学習プログラムを読み込み、モデル再学習プログラムに従って、通信インタフェースを用いて、データ送受信部118として動作してもよい。
なお、第2の実施形態では、決定部107は、第1の識別部106が識別対象とした画像に対する識別処理を、他の識別システム100に実行させるか否かを決定していると言うことができる。この決定方法は、第1の実施形態で説明した決定方法(第1の決定方法、第2の決定方法および第3の決定方法)と同様である。
第1の実施形態の変形例と同様に、識別システム100が領域修正GUI表示制御部108および領域抽出部109を備えない構成であってもよい。この場合、データ送受信部118は、第1の識別部106が処理対象とした1つの画像全体と、要求信号とを、他の複数の識別システム100に送信すればよい。要求信号を受信した他の識別システム100は、第1の識別部106が処理対象とした1つの画像全体を対象にして、画像に写っている物体を識別すればよい。
また、学習部103は、1つの画像全体と、統合部114が特定したラベルとの組を、既存の教師データに含め、その教師データを用いて、内部生成モデルを再学習すればよい。
また、画像および要求信号の送信先として、1つの識別システム100が定められていてもよい。この場合、学習部103は、画像と、その識別システム100で導出された、信頼度が最も高いラベルとの組を、既存の教師データに含め、その教師データを用いて、内部生成モデルを再学習すればよい。
また、第1の実施形態および第2の実施形態において、識別システム100は、オペレータの操作なしで一連の処理を行ってもよい。この場合、決定部107は、前述の第2の決定方法を採用する。すなわち、第1の識別部106が画像に対して定めたラベルに対応する信頼度が閾値以下である場合、決定部107は、その画像に対して第2の識別部111に識別処理を実行させると決定する。また、領域修正GUI表示制御部108は、図6や図7に例示する画面を表示しない。
さらに、領域抽出部109は、第1の識別部106が判定した矩形領域をそのまま画像から抽出し、第2の識別部111は、その矩形領域の画像に対して外部生成モデル毎に識別処理を行う。あるいは、領域抽出部109が矩形領域を抽出する処理を実行せずに、第2の識別部111が1つの画像全体を対象として外部生成モデル毎に識別処理を行ってもよい。また、表示制御部112は、図8に例示する画像を表示しない。そして、統合部114および学習部103は、第2の識別部111が画像に対して外部生成モデル毎に識別処理を行ったことをトリガとして、ステップS12(図12参照)以降の処理を実行すればよい。この結果、オペレータの操作なしで一連の処理が行われる。
上記の例を第2の実施形態に適用する場合、第1の識別部106が判定した矩形領域を領域抽出部109がそのまま抽出した後、データ送受信部118(図13参照)が、その矩形領域の画像および要求信号を他の複数の識別システム100に送信し、その複数の識別システム100からそれぞれ、その画像に対する識別処理の結果を受信すればよい。領域抽出部109が矩形領域を抽出する処理を実行せずに、データ送受信部118が、1つの画像全体および要求信号を他の複数の識別システム100に送信し、その複数の識別システム100からそれぞれ、識別処理の結果を受信してもよい。そして、統合部114および学習部103は、データ送受信部118が複数の識別システム100から識別処理の結果を受信したことをトリガとして、ステップS12以降の処理を実行すればよい。この場合にも、オペレータの操作なしで一連の処理が行われる。
図14は、本発明の各実施形態における識別システム100が備えるコンピュータ102の構成例を示す概略ブロック図である。図14では、コンピュータを符号“1000”で表す。コンピュータ1000は、CPU1001と、主記憶装置1002と、補助記憶装置1003と、インタフェース1004と、ディスプレイ装置1005と、入力デバイス1006と、通信インタフェース1007と、データ収集部101(例えば、カメラ)とのインタフェース1008とを備える。なお、第1の実施形態の識別システム100が備えるコンピュータは、通信インタフェース1007を備えていなくてもよい。
識別システム100が備えるコンピュータの動作は、モデル再学習プログラムの形式で補助記憶装置1003に記憶されている。CPU1001は、そのモデル再学習プログラムを補助記憶装置1003から読み出して主記憶装置1002に展開する。そして、CPU1001は、そのモデル再学習プログラムに従って、上記の各実施形態で示したコンピュータ102(図2、図13を参照)の処理を実行する。
補助記憶装置1003は、一時的でない有形の媒体の例である。一時的でない有形の媒体の他の例として、インタフェース1004を介して接続される磁気ディスク、光磁気ディスク、CD-ROM(Compact Disk Read Only Memory )、DVD-ROM(Digital Versatile Disk Read Only Memory )、半導体メモリ等が挙げられる。また、このプログラムが通信回線によってコンピュータ1000に配信される場合、配信を受けたコンピュータ1000がそのプログラムを主記憶装置1002に展開し、上記の処理を実行してもよい。
また、プログラムは、各実施形態で示したコンピュータ102の処理の一部を実現するためのものであってもよい。さらに、プログラムは、補助記憶装置1003に既に記憶されている他のプログラムとの組み合わせで前述の処理を実現する差分プログラムであってもよい。
また、各構成要素の一部または全部は、汎用または専用の回路(circuitry )、プロセッサ等やこれらの組み合わせによって実現されてもよい。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。各構成要素の一部または全部は、上述した回路等とプログラムとの組み合わせによって実現されてもよい。
各構成要素の一部または全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントアンドサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。
次に、本発明の概要について説明する。図15は、本発明の識別システムの概要を示すブロック図である。本発明の識別システムは、学習手段701と、第1の識別手段702と、第2の識別手段703とを備える。
学習手段701(例えば、学習部103)は、データ(例えば、画像)が表わす物体を識別するためのモデルを、教師データを用いて学習する。
第1の識別手段702(例えば、第1の識別部106)は、学習手段701によって学習されたモデルを用いて、データが表わす物体を識別する。
第2の識別手段703(例えば、第2の識別部111)は、第1の識別手段702が識別対象としたデータが表わす物体を、学習手段701によって学習されたモデルとは異なるモデルを用いて識別する。
学習手段701は、第2の識別手段703が導出した識別結果に基づいて定まるデータに対するラベルと、そのデータとを含む教師データを用いて、モデルを再学習する。
そのような構成によって、データが表わす物体を識別するためのモデルの識別精度を向上させるように、モデルを学習し直すことができる。
上記の本発明の実施形態は、以下の付記のようにも記載され得るが、以下に限定されるわけではない。
(付記1)
データが表わす物体を識別するためのモデルを、教師データを用いて学習する学習手段と、
前記学習手段によって学習された前記モデルを用いて、データが表わす物体を識別する第1の識別手段と、
前記第1の識別手段が識別対象とした前記データが表わす物体を、前記学習手段によって学習された前記モデルとは異なるモデルを用いて識別する第2の識別手段とを備え、
前記学習手段は、
前記第2の識別手段が導出した識別結果に基づいて定まる前記データに対するラベルと、前記データとを含む教師データを用いて、モデルを再学習する
ことを特徴とする識別システム。
(付記2)
第2の識別手段は、
所定の場合に、第1の識別手段が識別対象としたデータが表わす物体を識別する
付記1に記載の識別システム。
(付記3)
第2の識別手段は、
第1の識別手段が識別対象としたデータが表わす物体を、他の識別システムで学習されたモデルを用いて識別する
付記1または付記2に記載の識別システム。
(付記4)
他の複数の識別システムで学習された個々のモデルをそれぞれ記憶するモデル記憶手段を備え、
第2の識別手段は、
前記個々のモデル毎に、第1の識別手段が識別対象としたデータが表わす物体を識別し、
当該識別システムは、
前記第2の識別手段が前記個々のモデル毎に導出した識別結果を統合することによって、前記データに対するラベルを特定する統合手段を備え、
学習手段は、
前記統合手段によって特定されたラベルと、前記データとを含む教師データを用いて、モデルを再学習する
付記3に記載の識別システム。
(付記5)
データを収集するデータ収集手段を備え、
統合手段は、
当該識別システムのデータ収集手段の属性と、他の複数の識別システムのデータ収集手段の属性との類似度を、他の識別システム毎に算出し、
第2の識別手段が個々のモデル毎に導出した識別結果を、モデルに対応する類似度に応じた重みで重み付けして統合する
付記4に記載の識別システム。
(付記6)
データは、画像であり、
第1の識別手段は、
画像が表わす物体を識別する際に前記物体が写っている前記画像内の領域を判定し、
第2の識別手段は、
前記画像内の前記領域が表わす物体を識別する
付記1から付記5のうちのいずれかに記載の識別システム。
(付記7)
第1の識別手段は、
画像が表わす物体を示すラベルと、前記ラベルの信頼度とを導出し、
第2の識別手段は、
前記画像が表わす物体を示すラベルと、前記ラベルの信頼度とを導出し、
当該識別システムは、
前記画像と、前記第1の識別手段によって導出されたラベルおよび信頼度と、前記第2の識別手段によって導出されたラベルおよび信頼度とを含む画面を表示する表示制御手段を備える
付記6に記載の識別システム。
(付記8)
表示制御手段は、
第1の識別手段によって導出されたラベルおよび信頼度と、第2の識別手段によって導出されたラベルおよび信頼度と、所定のボタンとを含む画面を表示し、
学習手段は、
前記所定のボタンがクリックされた場合に、モデルを再学習する
付記7に記載の識別システム。
(付記9)
第1の識別手段によって判定された画像内の領域を修正するためのGUI(Graphical User Interface)を表示する領域修正GUI表示制御手段を備え、
第2の識別手段は、
修正後の領域が表わす物体を識別する
付記6から付記8のうちのいずれかに記載の識別システム。
(付記10)
データが表わす物体を識別するためのモデルを、教師データを用いて学習し、
前記モデルを用いて、データが表わす物体を識別する第1の識別処理を実行し、
前記第1の識別処理で識別対象とした前記データが表わす物体を、前記モデルとは異なるモデルを用いて識別する第2の識別処理を実行し、
前記第2の識別処理で導出した識別結果に基づいて定まる前記データに対するラベルと、前記データとを含む教師データを用いて、モデルを再学習する
ことを特徴とするモデル再学習方法。
(付記11)
コンピュータに、
データが表わす物体を識別するためのモデルを、教師データを用いて学習する学習処理、
前記学習処理で学習された前記モデルを用いて、データが表わす物体を識別する第1の識別処理、
前記第1の識別処理で識別対象とした前記データが表わす物体を、前記学習処理で学習された前記モデルとは異なるモデルを用いて識別する第2の識別処理、および、
前記第2の識別処理で導出した識別結果に基づいて定まる前記データに対するラベルと、前記データとを含む教師データを用いて、モデルを再学習する再学習処理
を実行させるためのモデル再学習プログラム。
以上、実施形態を参照して本願発明を説明したが、本願発明は上記の実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
産業上の利用の可能性
本発明は、データをモデルに適用することによって、そのデータが表わす物体を識別する識別システムに好適に適用される。
100 識別システム
101 データ収集部
102 コンピュータ
103 学習部
104 第1のモデル記憶部
105 データ取得部
106 第1の識別部
107 決定部
108 領域修正GUI表示制御部
109 領域抽出部
110 第2のモデル記憶部
111 第2の識別部
112 表示制御部
113 属性データ記憶部
114 統合部
115 ディスプレイ装置
116 マウス
117 結果記憶部
118 データ送受信部

Claims (8)

  1. データを収集するデータ収集手段を備える識別システムであって、
    データが表わす物体を識別するためのモデルを、教師データを用いて学習する学習手段と、
    前記学習手段によって学習された前記モデルを用いて、データが表わす物体を識別する第1の識別手段と、
    前記第1の識別手段が識別対象とした前記データが表わす物体を、前記学習手段によって学習された前記モデルとは異なるモデルを用いて識別する第2の識別手段と
    他の複数の識別システムで学習された個々のモデルをそれぞれ記憶するモデル記憶手段とを備え、
    前記学習手段は、
    前記第2の識別手段が導出した識別結果に基づいて定まる前記データに対するラベルと、前記データとを含む教師データを用いて、モデルを再学習し、
    前記第2の識別手段は、
    前記他の複数の識別システムで学習された前記個々のモデル毎に、前記第1の識別手段が識別対象とした前記データが表わす物体を識別し、
    当該識別システムは、
    前記第2の識別手段が前記個々のモデル毎に導出した識別結果を統合することによって、前記データに対するラベルを特定する統合手段を備え、
    前記学習手段は、
    前記統合手段によって特定されたラベルと、前記データとを含む教師データを用いて、モデルを再学習し、
    前記統合手段は、
    当該識別システムの前記データ収集手段の属性と、前記他の複数の識別システムのデータ収集手段の属性との類似度を、他の識別システム毎に算出し、
    前記第2の識別手段が前記個々のモデル毎に導出した識別結果を、モデルに対応する類似度に応じた重みで重み付けして統合する
    ことを特徴とする識別システム。
  2. 第2の識別手段は、
    所定の場合に、第1の識別手段が識別対象としたデータが表わす物体を識別する
    請求項1に記載の識別システム。
  3. データは、画像であり、
    第1の識別手段は、
    画像が表わす物体を識別する際に前記物体が写っている前記画像内の領域を判定し、
    第2の識別手段は、
    前記画像内の前記領域が表わす物体を識別する
    請求項1または請求項2に記載の識別システム。
  4. 第1の識別手段は、
    画像が表わす物体を示すラベルと、前記ラベルの信頼度とを導出し、
    第2の識別手段は、
    前記画像が表わす物体を示すラベルと、前記ラベルの信頼度とを導出し、
    当該識別システムは、
    前記画像と、前記第1の識別手段によって導出されたラベルおよび信頼度と、前記第2の識別手段によって導出されたラベルおよび信頼度とを含む画面を表示する表示制御手段を備える
    請求項に記載の識別システム。
  5. 表示制御手段は、
    第1の識別手段によって導出されたラベルおよび信頼度と、第2の識別手段によって導出されたラベルおよび信頼度と、所定のボタンとを含む画面を表示し、
    学習手段は、
    前記所定のボタンがクリックされた場合に、モデルを再学習する
    請求項に記載の識別システム。
  6. 第1の識別手段によって判定された画像内の領域を修正するためのGUI(Graphical User Interface)を表示する領域修正GUI表示制御手段を備え、
    第2の識別手段は、
    修正後の領域が表わす物体を識別する
    請求項から請求項のうちのいずれか1項に記載の識別システム。
  7. データを収集するデータ収集手段を備える識別システムが、
    データが表わす物体を識別するためのモデルを、教師データを用いて学習し、
    前記モデルを用いて、データが表わす物体を識別する第1の識別処理を実行し、
    前記第1の識別処理で識別対象とした前記データが表わす物体を、前記モデルとは異なるモデルを用いて識別する第2の識別処理を実行し、
    前記第2の識別処理で導出した識別結果に基づいて定まる前記データに対するラベルと、前記データとを含む教師データを用いて、モデルを再学習し、
    前記識別システムであって、他の複数の識別システムで学習された個々のモデルをそれぞれ記憶するモデル記憶手段を備える識別システムが、
    前記第2の識別処理で、
    前記他の複数の識別システムで学習された前記個々のモデル毎に、前記第1の識別処理で識別対象とした前記データが表わす物体を識別し、
    前記第2の識別処理で前記個々のモデル毎に導出した識別結果を統合することによって、前記データに対するラベルを特定する統合処理を実行し、
    前記モデルを再学習するときに、前記統合処理で特定されたラベルと、前記データとを含む教師データを用いて、モデルを再学習し、
    前記統合処理で、
    当該識別システムの前記データ収集手段の属性と、前記他の複数の識別システムのデータ収集手段の属性との類似度を、他の識別システム毎に算出し、
    前記第2の識別処理で前記個々のモデル毎に導出した識別結果を、モデルに対応する類似度に応じた重みで重み付けして統合する
    ことを特徴とするモデル再学習方法。
  8. データを収集するデータ収集手段と通信可能に接続されたコンピュータに、
    データが表わす物体を識別するためのモデルを、教師データを用いて学習する学習処理、
    前記学習処理で学習された前記モデルを用いて、データが表わす物体を識別する第1の識別処理、
    前記第1の識別処理で識別対象とした前記データが表わす物体を、前記学習処理で学習された前記モデルとは異なるモデルを用いて識別する第2の識別処理、および、
    前記第2の識別処理で導出した識別結果に基づいて定まる前記データに対するラベルと、前記データとを含む教師データを用いて、モデルを再学習する再学習処理を実行させ、
    前記コンピュータであって、他の複数のコンピュータで学習された個々のモデルをそれぞれ記憶するモデル記憶手段を備えるコンピュータに、
    前記第2の識別処理で、
    前記他の複数のコンピュータで学習された前記個々のモデル毎に、前記第1の識別処理で識別対象とした前記データが表わす物体を識別させ、
    前記第2の識別処理で前記個々のモデル毎に導出した識別結果を統合することによって、前記データに対するラベルを特定する統合処理を実行させ、
    前記再学習処理で、前記統合処理で特定されたラベルと、前記データとを含む教師データを用いて、モデルを再学習させ、
    前記統合処理で、
    当該コンピュータの前記データ収集手段の属性と、前記他の複数のコンピュータのデータ収集手段の属性との類似度を、他のコンピュータ毎に算出させ、
    前記第2の識別処理で前記個々のモデル毎に導出した識別結果を、モデルに対応する類似度に応じた重みで重み付けして統合させる
    めのモデル再学習プログラム。
JP2020517632A 2018-05-07 2018-05-07 識別システム、モデル再学習方法およびプログラム Active JP7001150B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2018/017611 WO2019215780A1 (ja) 2018-05-07 2018-05-07 識別システム、モデル再学習方法およびプログラム

Publications (2)

Publication Number Publication Date
JPWO2019215780A1 JPWO2019215780A1 (ja) 2021-05-20
JP7001150B2 true JP7001150B2 (ja) 2022-01-19

Family

ID=68467962

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020517632A Active JP7001150B2 (ja) 2018-05-07 2018-05-07 識別システム、モデル再学習方法およびプログラム

Country Status (3)

Country Link
US (1) US11423647B2 (ja)
JP (1) JP7001150B2 (ja)
WO (1) WO2019215780A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7001149B2 (ja) * 2018-05-07 2022-01-19 日本電気株式会社 データ提供システムおよびデータ収集システム
US10764246B2 (en) * 2018-08-14 2020-09-01 Didi Research America, Llc System and method for detecting generated domain

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012043225A (ja) 2010-08-19 2012-03-01 National Institute Of Information & Communication Technology 相互機械学習装置、相互機械学習方法、及びプログラム
JP2015176175A (ja) 2014-03-13 2015-10-05 日本電気株式会社 情報処理装置、情報処理方法、およびプログラム
JP2016522459A (ja) 2013-08-13 2016-07-28 三菱電機株式会社 パターン認識装置およびパターン認識方法
WO2016147653A1 (ja) 2015-03-19 2016-09-22 日本電気株式会社 オブジェクト検出装置、オブジェクト検出方法および記録媒体
JP2016180918A (ja) 2015-03-25 2016-10-13 日本電信電話株式会社 音声認識システム、音声認識方法、プログラム
JP2017117139A (ja) 2015-12-24 2017-06-29 キヤノンマーケティングジャパン株式会社 情報処理装置、制御方法、プログラム
JP2019512827A (ja) 2016-03-17 2019-05-16 アビギロン コーポレイションAvigilon Corporation 機械学習によってオブジェクト分類器を訓練するためのシステム及び方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6471934B2 (ja) 2014-06-12 2019-02-20 パナソニックIpマネジメント株式会社 画像認識方法、カメラシステム
US20180357539A1 (en) * 2017-06-09 2018-12-13 Korea Advanced Institute Of Science And Technology Electronic apparatus and method for re-learning trained model
US20200374286A1 (en) * 2017-09-15 2020-11-26 PAG Financial International LLC Real time selfie systems and methods for automating user identify verification
US10733813B2 (en) * 2017-11-01 2020-08-04 International Business Machines Corporation Managing anomaly detection models for fleets of industrial equipment
JP6989450B2 (ja) * 2018-06-21 2022-01-05 株式会社東芝 画像解析装置、画像解析方法及びプログラム
US11055585B2 (en) * 2019-09-26 2021-07-06 Vintra, Inc. Object detection based on object relation
JP6939963B1 (ja) * 2020-08-24 2021-09-22 トヨタ自動車株式会社 モデル学習システム及びサーバ
US11921717B2 (en) * 2020-09-14 2024-03-05 Oracle International Corporation Predicting future quiet periods for materialized views

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012043225A (ja) 2010-08-19 2012-03-01 National Institute Of Information & Communication Technology 相互機械学習装置、相互機械学習方法、及びプログラム
JP2016522459A (ja) 2013-08-13 2016-07-28 三菱電機株式会社 パターン認識装置およびパターン認識方法
JP2015176175A (ja) 2014-03-13 2015-10-05 日本電気株式会社 情報処理装置、情報処理方法、およびプログラム
WO2016147653A1 (ja) 2015-03-19 2016-09-22 日本電気株式会社 オブジェクト検出装置、オブジェクト検出方法および記録媒体
JP2016180918A (ja) 2015-03-25 2016-10-13 日本電信電話株式会社 音声認識システム、音声認識方法、プログラム
JP2017117139A (ja) 2015-12-24 2017-06-29 キヤノンマーケティングジャパン株式会社 情報処理装置、制御方法、プログラム
JP2019512827A (ja) 2016-03-17 2019-05-16 アビギロン コーポレイションAvigilon Corporation 機械学習によってオブジェクト分類器を訓練するためのシステム及び方法

Also Published As

Publication number Publication date
US20210224537A1 (en) 2021-07-22
US11423647B2 (en) 2022-08-23
WO2019215780A1 (ja) 2019-11-14
JPWO2019215780A1 (ja) 2021-05-20

Similar Documents

Publication Publication Date Title
US11222239B2 (en) Information processing apparatus, information processing method, and non-transitory computer-readable storage medium
CN108256404B (zh) 行人检测方法和装置
JP6397379B2 (ja) 変化領域検出装置、方法、及びプログラム
JP6992883B2 (ja) モデル提供システム、方法およびプログラム
JP5459674B2 (ja) 移動物体追跡システムおよび移動物体追跡方法
KR20200040665A (ko) 컨볼루션 신경망을 이용하여 poi 변화를 검출하기 위한 시스템 및 방법
WO2021095351A1 (ja) 監視装置、監視方法、及びプログラム
CN114926747A (zh) 一种基于多特征聚合与交互的遥感图像定向目标检测方法
JP2018120283A (ja) 情報処理装置、情報処理方法及びプログラム
WO2021084972A1 (ja) 物体追跡装置および物体追跡方法
JP7001150B2 (ja) 識別システム、モデル再学習方法およびプログラム
WO2023093086A1 (zh) 目标跟踪及相关模型的训练方法、装置、设备、介质、计算机程序产品
JP7001149B2 (ja) データ提供システムおよびデータ収集システム
KR20120020711A (ko) 물체 인식 시스템 및 그 물체 인식 방법
JP6981553B2 (ja) 識別システム、モデル提供方法およびモデル提供プログラム
CN113297963A (zh) 多人姿态的估计方法、装置、电子设备以及可读存储介质
JP6981554B2 (ja) 識別システム、パラメータ値更新方法およびプログラム
CN111753587A (zh) 一种倒地检测方法及装置
JP2019046278A (ja) 情報処理装置、制御方法、コンピュータプログラム、記憶媒体、及びモデル作成装置
KR101886856B1 (ko) 이종센서 탐색기의 비정형 객체추적에 대한 데이터 결합시스템 및 방법
JP7211496B2 (ja) 教師データ生成装置
US20220383631A1 (en) Object recognition system and object recognition method
JP7211495B2 (ja) 教師データ生成装置
CN116798109A (zh) 一种动作类型的识别方法及装置
JP2022106624A (ja) 位置特定プログラム、位置特定方法および情報処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201027

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211012

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211124

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211207

R150 Certificate of patent or registration of utility model

Ref document number: 7001150

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150