JP2019049793A - 情報処理方法及び情報処理プログラム - Google Patents

情報処理方法及び情報処理プログラム Download PDF

Info

Publication number
JP2019049793A
JP2019049793A JP2017172818A JP2017172818A JP2019049793A JP 2019049793 A JP2019049793 A JP 2019049793A JP 2017172818 A JP2017172818 A JP 2017172818A JP 2017172818 A JP2017172818 A JP 2017172818A JP 2019049793 A JP2019049793 A JP 2019049793A
Authority
JP
Japan
Prior art keywords
information
area
classification
image
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017172818A
Other languages
English (en)
Other versions
JP6998521B2 (ja
Inventor
征矢 芋本
Seiya Imomoto
征矢 芋本
谷川 徹
Toru Tanigawa
徹 谷川
幸恵 庄田
Yukie Shoda
幸恵 庄田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Management Co Ltd
Original Assignee
Panasonic Intellectual Property Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Management Co Ltd filed Critical Panasonic Intellectual Property Management Co Ltd
Priority to JP2017172818A priority Critical patent/JP6998521B2/ja
Publication of JP2019049793A publication Critical patent/JP2019049793A/ja
Application granted granted Critical
Publication of JP6998521B2 publication Critical patent/JP6998521B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】画像に映る物体を識別する識別器の識別性能をより効果的に向上させることができる情報処理方法及び情報処理プログラムを提供する。【解決手段】制御部13は、第1の画像に映る物体の領域を示す第1の領域情報と、第1の画像と時系列で隣接する第2の画像に映る物体の領域を示す第2の領域情報と、第1の領域情報に関連付けられた領域の分類を示す第1の分類情報と、第2の領域情報に関連付けられた領域の分類を示す第2の分類情報と、を取得し、第1の領域情報及び第2の領域情報に基づいて、第1の領域情報と第2の領域情報との類似性を判定し、類似性の判定結果に応じて、第1の分類情報と第2の分類情報とが一致するか否かを判定し、第1の分類情報と第2の分類情報とが一致しないと判定された場合、第1の分類情報及び第2の分類情報の少なくとも一方を変更するための所定の処理を行う。【選択図】図1

Description

本開示は、画像に映る物体を分類する情報処理方法及び情報処理プログラムに関するものである。
従来、識別器を用いて画像データ中の対象物を識別する識別装置が知られている。従来の識別装置では、識別器に対して機械学習を行うことにより、識別器の識別精度を高めている。画像データから、機械学習のための学習データを作成する場合には、画像データに対してアノテーション処理が行われる。アノテーション処理では、識別器が識別する対象物を示す領域と、当該領域の分類を示すラベルとがユーザによって入力され、入力された対象物及びラベルが学習用画像データに付与される。
例えば、特許文献1の分類モデル学習装置は、ラベル付けの信頼度が所定の基準を満たすエキスパートデータおよびラベル付けの信頼度が不明な非エキスパートデータの各々が対応する座標を取得して非エキスパートデータからエキスパートデータまでの距離を各々算出し、所定の規則に当てはめて近傍距離を定義する。次に、分類モデル学習装置は、選択した非エキスパートデータから近傍距離の範囲内にあるエキスパートデータを探索して同ラベル確率を算出し、付されたラベルが近傍距離の範囲内にあるエキスパートデータのラベルに一致する確率に基づく信頼度関数に当てはめて非エキスパートデータの信頼度を決定し、付加する。そして、分類モデル学習装置は、エキスパートデータおよび信頼度が付加された非エキスパートデータに基づいて所望のデータにラベル付けを行う分類モデルを学習する。
特開2009−282686号公報
しかしながら、従来の技術では、上記識別器の識別性能を効果的に向上させることが困難な場合がある。例えば、特許文献1の分類モデル学習装置は、非エキスパートデータの信頼度を決定し、信頼度が付加された非エキスパートデータに基づいて所望のデータにラベル付けを行う分類モデルを学習しているが、非エキスパートデータには誤りが含まれているので、分類モデルの精度を効果的に高めることができず、更なる改善が必要とされていた。
本開示は、上記の問題を解決するためになされたもので、画像に映る物体を識別する識別器の識別性能をより効果的に向上させることができる情報処理方法及び情報処理プログラムを提供することを目的とするものである。
本開示の一態様に係る情報処理方法は、プロセッサを用いて、第1の画像に映る物体の領域を示す第1の領域情報と、前記第1の画像と時系列で隣接する第2の画像に映る物体の領域を示す第2の領域情報と、前記第1の領域情報に関連付けられた前記領域の分類を示す第1の分類情報と、前記第2の領域情報に関連付けられた前記領域の分類を示す第2の分類情報と、を取得し、前記第1の領域情報及び前記第2の領域情報に基づいて、前記第1の領域情報と前記第2の領域情報との類似性を判定し、前記類似性の判定結果に応じて、前記第1の分類情報と前記第2の分類情報とが一致するか否かを判定し、前記第1の分類情報と前記第2の分類情報とが一致しないと判定された場合、前記第1の分類情報及び前記第2の分類情報の少なくとも一方を変更するための所定の処理を行う。
本開示によれば、画像に映る物体を識別する識別器の識別性能をより効果的に向上させることができる。
本実施の形態1における情報処理システムの全体構成を示すブロック図である。 本実施の形態1におけるサーバの動作について説明するための第1のフローチャートである。 本実施の形態1におけるサーバの動作について説明するための第2のフローチャートである。 本実施の形態1における領域情報入力画面の一例を示す図である。 本実施の形態1におけるラベル情報入力画面の一例を示す図である。 本実施の形態1において、少なくとも1つの領域情報にラベル情報が関連付けられていない場合に表示されるラベル付与警告情報の一例を示す図である。 本実施の形態1において、ラベル情報が保留ラベルを含む場合に表示される保留確認情報の一例を示す図である。 本実施の形態1における1つ前の画像に対するラベル情報入力画面の一例を示す図である。 本実施の形態1における現在の画像に対するラベル情報入力画面の一例を示す図である。 本実施の形態2における情報処理システムの全体構成を示すブロック図である。 本実施の形態2におけるサーバの動作について説明するための第1のフローチャートである。 本実施の形態2におけるサーバの動作について説明するための第2のフローチャートである。 本実施の形態2におけるサーバの動作について説明するための第3のフローチャートである。 本実施の形態2において、1つ前の画像と現在の画像とで互いに類似する領域情報のラベル情報が異なっている場合に表示されるラベル不一致確認情報及びラベル変更確認情報の一例を示す図である。
(本開示の基礎となった知見)
ディープラーニングなどの機械学習を用いた画像認識において、学習に必要なデータとしては、画像データ中の認識したい対象物を特定し、特定した対象物に対してラベルを付与するアノテーション処理を大量に施したデータが要求されている。また、正確な分類モデルの構築には正確なラベルの付与が必要になってくる。
しかしながら、アノテーション処理は人間により行われる作業であるため、人間の判断ミス又は知識の不正確さから、誤ったラベルが含まれる事により、精度の良い分類モデルが構築できないことが課題になっている。
例えば、上記の従来の技術では、非エキスパートデータの信頼度を決定し、信頼度が付加された非エキスパートデータに基づいて所望のデータにラベル付けを行う分類モデルを学習しているが、非エキスパートデータには誤りが含まれているので、分類モデルの精度を効果的に高めることができない。
以上の課題を解決するために、本開示の一態様に係る情報処理方法は、プロセッサを用いて、第1の画像に映る物体の領域を示す第1の領域情報と、前記第1の画像と時系列で隣接する第2の画像に映る物体の領域を示す第2の領域情報と、前記第1の領域情報に関連付けられた前記領域の分類を示す第1の分類情報と、前記第2の領域情報に関連付けられた前記領域の分類を示す第2の分類情報と、を取得し、前記第1の領域情報及び前記第2の領域情報に基づいて、前記第1の領域情報と前記第2の領域情報との類似性を判定し、前記類似性の判定結果に応じて、前記第1の分類情報と前記第2の分類情報とが一致するか否かを判定し、前記第1の分類情報と前記第2の分類情報とが一致しないと判定された場合、前記第1の分類情報及び前記第2の分類情報の少なくとも一方を変更するための所定の処理を行う。
この構成によれば、第1の画像に映る物体の領域を示す第1の領域情報と、第1の画像と時系列で隣接する第2の画像に映る物体の領域を示す第2の領域情報と、第1の領域情報に関連付けられた領域の分類を示す第1の分類情報と、第2の領域情報に関連付けられた領域の分類を示す第2の分類情報と、が取得される。第1の領域情報及び第2の領域情報に基づいて、第1の領域情報と第2の領域情報との類似性が判定される。類似性の判定結果に応じて、第1の分類情報と第2の分類情報とが一致するか否かが判定される。第1の分類情報と第2の分類情報とが一致しないと判定された場合、第1の分類情報及び第2の分類情報の少なくとも一方を変更するための所定の処理が行われる。
したがって、第1の画像に映る物体の領域を示す第1の領域情報に関連付けられた領域の分類を示す第1の分類情報と、第1の画像と時系列で隣接する第2の画像に映る物体の領域を示す第2の領域情報に関連付けられた領域の分類を示す第2の分類情報とが一致しない場合、第1の分類情報及び第2の分類情報の少なくとも一方を変更するための所定の処理が行われるので、画像に映る物体を識別する識別器の識別性能をより効果的に向上させることができる。
また、上記の情報処理方法において、前記所定の処理は、前記第1の分類情報と前記第2の分類情報とが一致しないことを警告するための警告情報を出力装置に出力させてもよい。
この構成によれば、所定の処理において、第1の分類情報と第2の分類情報とが一致しないことを警告するための警告情報を出力装置に出力させるので、第1の分類情報と第2の分類情報とが一致しないことをユーザに報知することができ、分類情報が正しいか否かをユーザに確認させることができる。
また、上記の情報処理方法において、前記類似性の判定は、前記第1の領域情報が示す前記領域の態様と、前記第2の領域情報が示す前記領域の態様とに基づいて、前記類似性を判定してもよい。
この構成によれば、類似性の判定において、第1の領域情報が示す領域の態様と、第2の領域情報が示す領域の態様とに基づいて、第1の領域情報と第2の領域情報とが同一の物体を表しているか否かを判定することができる。
また、上記の情報処理方法において、前記領域の態様は、前記領域のサイズ及び前記領域の画像上の位置のいずれかを含んでもよい。
この構成によれば、領域の態様は、領域のサイズ及び領域の画像上の位置のいずれかを含むので、領域のサイズ及び領域の画像上の位置のいずれかにより、第1の領域情報と第2の領域情報との類似性を判定することができる。これは、時系列に隣接する画像の各々に映る同一の物体のサイズ又は画像上の位置は、類似である可能性が高いためである。
また、上記の情報処理方法において、さらに、前記第1の画像を撮影した地点の位置を示す第1の位置情報と、前記第2の画像を撮影した地点の位置を示す第2の位置情報とを取得し、前記類似性の判定は、前記第1の位置情報と前記第2の位置情報とに基づいて、前記類似性を判定してもよい。
この構成によれば、第1の画像を撮影した地点の位置を示す第1の位置情報と、第2の画像を撮影した地点の位置を示す第2の位置情報とが取得される。類似性の判定において、第1の位置情報と第2の位置情報とに基づいて、第1の領域情報と第2の領域情報とが同一の物体を表しているか否かを判定することができる。これは、画像が取得された位置が互いに近い場合、各画像に映る物体が同一である可能性が高いためである。
また、上記の情報処理方法において、前記類似性の判定は、前記第1の領域情報が示す前記領域内の前記物体の画像認識結果と、前記第2の領域情報が示す前記領域内の前記物体の画像認識結果とに基づいて、前記類似性を判定してもよい。
この構成によれば、類似性の判定において、第1の領域情報が示す領域内の物体の画像認識結果と、第2の領域情報が示す領域内の物体の画像認識結果とに基づいて、第1の領域情報と第2の領域情報とが同一の物体を表しているか否かを判定することができる。これは、画像認識により得られる物体の識別情報を比較することができるためである。
また、上記の情報処理方法において、前記第2の画像は、前記第1の画像よりも時系列で1つ前の画像であり、前記所定の処理は、前記第2の分類情報を前記第1の分類情報に変更してもよい。
この構成によれば、第2の画像は、第1の画像よりも時系列で1つ前の画像である。所定の処理において、第2の分類情報が第1の分類情報に変更される。したがって、第2の分類情報よりも時系列で新しい第1の分類情報に第2の分類情報を変更することができる。それにより、時系列に連続する画像における分類情報を正確な分類情報に統一することができる。また、分類情報の変更の自動化が可能となる。
また、上記の情報処理方法において、前記第2の画像は、前記第1の画像よりも時系列で1つ前の画像であり、前記所定の処理は、前記第2の分類情報を前記第1の分類情報に変更するか否かをユーザに確認するための確認情報を出力装置に出力させ、さらに、前記確認情報に対する前記ユーザの入力装置による入力操作に応じて前記第2の分類情報を前記第1の分類情報に変更してもよい。
この構成によれば、第2の画像は、第1の画像よりも時系列で1つ前の画像である。所定の処理において、第2の分類情報を第1の分類情報に変更するか否かをユーザに確認するための確認情報を出力装置に出力させる。そして、確認情報に対するユーザの入力装置による入力操作に応じて第2の分類情報が第1の分類情報に変更される。
したがって、第2の分類情報を第1の分類情報に変更するか否かがユーザに確認され、ユーザの入力装置による入力操作に応じて第2の分類情報が第1の分類情報に変更されるので、ユーザの判断により、第2の分類情報を第1の分類情報に変更するか否かを決定することができる。それにより、正確な分類情報が誤った分類情報に変更されるおそれを抑制することができる。
また、上記の情報処理方法において、さらに、前記第1の分類情報が、前記領域の分類作業の状態を示す作業情報を含むか否かを判定すると共に、前記第2の分類情報が、前記領域の分類作業の状態を示す作業情報を含むか否かを判定し、前記所定の処理は、前記第1の分類情報及び前記第2の分類情報の少なくとも一方が前記作業情報を含むと判定された場合、前記分類作業の状態を前記ユーザに確認するための確認情報を出力装置に出力させてもよい。
この構成によれば、第1の分類情報が、領域の分類作業の状態を示す作業情報を含むか否かが判定されると共に、第2の分類情報が、領域の分類作業の状態を示す作業情報を含むか否かが判定される。所定の処理において、第1の分類情報及び第2の分類情報の少なくとも一方が作業情報を含むと判定された場合、分類作業の状態をユーザに確認するための確認情報を出力装置に出力させる。
したがって、第1の分類情報及び第2の分類情報の少なくとも一方が作業情報を含む場合、分類作業の状態をユーザに確認することができる。それにより、分類が確定した正確な分類情報を記録することができる。
また、上記の情報処理方法において、前記作業情報は、前記分類作業が保留されたことを示す保留情報を含み、前記所定の処理は、前記第1の分類情報が前記保留情報を含むと判定された場合、前記分類作業が保留されたことを前記ユーザに確認するための前記確認情報を前記出力装置に出力させ、前記確認情報に対する前記ユーザの入力装置による入力操作に応じて前記第1の分類情報を取得し、前記第2の分類情報が前記保留情報を含むと判定された場合、前記分類作業が保留されたことを前記ユーザに確認するための前記確認情報を前記出力装置に出力させ、前記確認情報に対する前記ユーザの前記入力装置による入力操作に応じて前記第2の分類情報を取得してもよい。
この構成によれば、作業情報は、分類作業が保留されたことを示す保留情報を含む。所定の処理において、第1の分類情報が保留情報を含むと判定された場合、分類作業が保留されたことをユーザに確認するための確認情報を出力装置に出力させる。そして、確認情報に対するユーザの入力装置による入力操作に応じて第1の分類情報が取得される。また、第2の分類情報が保留情報を含むと判定された場合、分類作業が保留されたことをユーザに確認するための確認情報を出力装置に出力させる。そして、確認情報に対するユーザの入力装置による入力操作に応じて第2の分類情報が取得される。
したがって、分類作業が保留された場合、分類作業が保留されたことがユーザに確認されるので、分類情報の入力漏れを防止することができる。
また、上記の情報処理方法において、前記分類作業の終了操作が前記入力装置により入力された場合、前記第1の分類情報が、前記領域の分類作業の状態を示す作業情報を含むか否かを判定すると共に、前記第2の分類情報が、前記領域の分類作業の状態を示す作業情報を含むか否かを判定してもよい。
この構成によれば、分類作業の終了操作が入力装置により入力された場合、第1の分類情報が、領域の分類作業の状態を示す作業情報を含むか否かが判定されると共に、第2の分類情報が、領域の分類作業の状態を示す作業情報を含むか否かが判定されるので、分類作業の終了操作をトリガにして判定を行うことができる。
また、上記の情報処理方法において、さらに、前記第1の領域情報及び前記第1の分類情報を取得する前に、前記第1の領域情報に前記第1の分類情報が関連付けられているか否かを判定し、前記第1の領域情報に前記第1の分類情報が関連付けられていないと判定された場合、前記第1の領域情報に前記第1の分類情報が関連付けられていないことを警告するための警告情報を出力装置に出力させてもよい。
この構成によれば、第1の領域情報及び第1の分類情報が取得される前に、第1の領域情報に第1の分類情報が関連付けられているか否かが判定される。第1の領域情報に第1の分類情報が関連付けられていないと判定された場合、第1の領域情報に前記第1の分類情報が関連付けられていないことを警告するための警告情報を出力装置に出力させる。
したがって、第1の領域情報に第1の分類情報が関連付けられていない場合、第1の領域情報に第1の分類情報が関連付けられていないことをユーザに報知することができ、第1の分類情報の入力漏れを防止することができる。
本開示の他の態様に係る情報処理プログラムは、プロセッサに、第1の画像に映る物体の領域を示す第1の領域情報と、前記第1の画像と時系列で隣接する第2の画像に映る物体の領域を示す第2の領域情報と、前記第1の領域情報に関連付けられた前記領域の分類を示す第1の分類情報と、前記第2の領域情報に関連付けられた前記領域の分類を示す第2の分類情報と、を取得し、前記第1の領域情報及び前記第2の領域情報に基づいて、前記第1の領域情報と前記第2の領域情報との類似性を判定し、前記類似性の判定結果に応じて、前記第1の分類情報と前記第2の分類情報とが一致するか否かを判定し、前記第1の分類情報と前記第2の分類情報とが一致しないと判定された場合、前記第1の分類情報及び前記第2の分類情報の少なくとも一方を変更するための所定の処理を行う、処理を実行させる。
この構成によれば、第1の画像に映る物体の領域を示す第1の領域情報と、第1の画像と時系列で隣接する第2の画像に映る物体の領域を示す第2の領域情報と、第1の領域情報に関連付けられた領域の分類を示す第1の分類情報と、第2の領域情報に関連付けられた領域の分類を示す第2の分類情報と、が取得される。第1の領域情報及び第2の領域情報に基づいて、第1の領域情報と第2の領域情報との類似性が判定される。類似性の判定結果に応じて、第1の分類情報と第2の分類情報とが一致するか否かが判定される。第1の分類情報と第2の分類情報とが一致しないと判定された場合、第1の分類情報及び第2の分類情報の少なくとも一方を変更するための所定の処理が行われる。
したがって、第1の画像に映る物体の領域を示す第1の領域情報に関連付けられた領域の分類を示す第1の分類情報と、第1の画像と時系列で隣接する第2の画像に映る物体の領域を示す第2の領域情報に関連付けられた領域の分類を示す第2の分類情報とが一致しない場合、第1の分類情報及び第2の分類情報の少なくとも一方を変更するための所定の処理が行われるので、画像に映る物体を識別する識別器の識別性能をより効果的に向上させることができる。
以下添付図面を参照しながら、本開示の実施の形態について説明する。なお、以下の実施の形態は、本開示を具体化した一例であって、本開示の技術的範囲を限定するものではない。
(実施の形態1)
図1は、本実施の形態1における情報処理システムの全体構成を示すブロック図である。図1に示す情報処理システムは、サーバ1と端末装置2とを備える。
サーバ1は、端末装置2と不図示の通信ネットワークを介して通信可能に接続されている。通信ネットワークは、例えば、インターネットである。
サーバ1は、通信部11、記憶部12及び制御部13を備える。
通信部11は、無線又は有線を用いて、インターネット等の通信ネットワークを介して、端末装置2などの外部装置と通信を行い、情報を送受信する。
記憶部12は、例えば、半導体メモリ等のメモリであり、画像データ記憶部121及びラベル付与画像データ記憶部122を備える。
制御部13は、例えばプロセッサであり、画像取得部131、アノテーション処理部132、ラベル付与判定部133、保留ラベル判定部134、ラベル情報比較部135、警告部136及び確認部137を備える。
画像データ記憶部121は、アノテーション処理に用いられる複数の画像データを記憶する。画像データ記憶部121は、時系列で隣接する複数の画像データを1つの画像データセットとし、日付単位又はカメラ単位に取得された複数の画像データセットを記憶する。なお、画像データは、通信部11を介して、外部の装置から受信される。外部の装置としては、例えば、車両に配置されたドライブレコーダ又はパーソナルコンピュータなどである。本実施の形態1における画像データは、例えば、車両に配置されたドライブレコーダにより撮影された車両の周囲の道路が映る画像データである。また、本明細書において、画像データは、単に画像と呼ぶこともある。
画像取得部131は、画像データ記憶部121からアノテーション処理に用いる画像データを取得する。
アノテーション処理部132は、画像取得部131によって取得された画像データに対してアノテーション処理を行う。アノテーション処理部132は、領域情報生成部1321、ラベル情報生成部1322及び情報統合部1323を備える。
領域情報生成部1321は、画像に映る物体の領域を示す領域情報を生成する。領域情報生成部1321は、画像内の識別する対象物を矩形状の枠で囲み、矩形状の枠内の領域を示す領域情報を生成する。領域情報は、画像内における座標で表される。領域情報生成部1321は、例えば、画像の左上端部を原点とし、水平方向をX軸方向とし、垂直方向をY軸とする座標系において、矩形状の枠の左上端部の座標及び右下端部の座標を領域情報として生成する。また、領域情報は、矩形状の枠の左上端部の座標とX軸方向の長さとY軸方向の長さとで表されてもよい。また、領域の形状は、矩形状に限定されない。
ラベル情報生成部1322は、領域情報に関連付けられた領域の分類を示すラベル情報を生成する。ラベル情報は、対象物を分類するものであり、対象物の種類を含む。ラベル情報は、対象物が、例えば、電車、車、バス、バイク、自転車、歩行者及びその他のうちのいずれであるかを識別する情報である。
情報統合部1323は、画像データと、領域情報と、ラベル情報とを統合してラベル付与画像データを生成し、ラベル付与画像データ記憶部122に記憶する。
ラベル付与画像データ記憶部122は、画像データと、領域情報と、ラベル情報とを対応付けたラベル付与画像データを記憶する。ラベル付与画像データは、1つの画像データに対して、1つの領域情報だけでなく、複数の領域情報が対応付けられてもよい。すなわち、1つの画像データの中に、車、自転車及び歩行者などの複数の対象物が含まれている場合、複数の対象物のそれぞれに対応する領域情報が生成される。また、各領域情報にラベル情報が付与される。
ラベル付与判定部133は、領域情報及びラベル情報を取得する前に、領域情報にラベル情報が関連付けられているか否かを判定する。すなわち、ラベル付与判定部133は、領域情報に対してラベル情報が付与されているか否かを判定する。ラベル付与判定部133は、領域情報に対してラベル情報が付与されていないと判定された場合、警告部136に対し警告情報を出力するように指示する。
保留ラベル判定部134は、ラベル情報が、領域の分類作業の状態を示す作業情報を含むか否かを判定する。作業情報は、分類作業が保留されたことを示す保留情報を含む。ユーザは、ラベル情報を選択する際に、どのラベル情報を選択すればよいかわからない場合、ラベル情報の選択を保留することができる。この場合、ユーザは、分類作業を保留することを示す保留ラベル(保留情報)を選択する。保留ラベル判定部134は、分類作業が保留されたことを示す保留情報をラベル情報が含むか否かを判定する。保留ラベル判定部134は、分類作業の終了操作が端末装置2により入力された場合、ラベル情報が、領域の分類作業の状態を示す作業情報を含むか否かを判定する。
ラベル情報比較部135は、第1の画像に映る物体の領域を示す第1の領域情報と、第1の画像と時系列で隣接する第2の画像に映る物体の領域を示す第2の領域情報と、第1の領域情報に関連付けられた領域の分類を示す第1のラベル情報と、第2の領域情報に関連付けられた領域の分類を示す第2のラベル情報と、を取得する。第2の画像は、第1の画像よりも時系列的に1つ前に取得された画像である。ラベル情報比較部135は、第1の領域情報及び第2の領域情報に基づいて、第1の領域情報と第2の領域情報との類似性を判定する。また、ラベル情報比較部135は、類似性の判定結果に応じて、第1のラベル情報と第2のラベル情報とが一致するか否かを判定する。
ラベル情報比較部135は、第1の領域情報が示す領域の態様と、第2の領域情報が示す領域の態様とに基づいて、類似性を判定する。領域の態様は、領域のサイズ及び領域の画像上の位置のいずれかである。例えば、ラベル情報比較部135は、第1の領域情報が示す領域のサイズと、第2の領域情報が示す領域のサイズとの差分が所定値以下である場合、第1の領域情報と第2の領域情報とは類似していると判定する。また、ラベル情報比較部135は、第1の領域情報が示す領域のサイズと、第2の領域情報が示す領域のサイズとの差分が所定値より大きい場合、第1の領域情報と第2の領域情報とは類似していないと判定する。さらに、例えば、ラベル情報比較部135は、第1の領域情報が示す領域の位置と、第2の領域情報が示す領域の位置との間の距離が所定値以下である場合、第1の領域情報と第2の領域情報とは類似していると判定する。また、ラベル情報比較部135は、第1の領域情報が示す領域の位置と、第2の領域情報が示す領域の位置との間の距離が所定値より大きい場合、第1の領域情報と第2の領域情報とは類似していないと判定する。
なお、ラベル情報比較部135は、第1の画像を撮影した地点の位置を示す第1の位置情報と、第2の画像を撮影した地点の位置を示す第2の位置情報とに基づいて、類似性を判定してもよい。なお、第1の位置情報及び第2の位置情報は、画像データに対応付けられている。ラベル情報比較部135は、第1の位置情報及び第2の位置情報を画像データ記憶部121から取得する。
また、ラベル情報比較部135は、第1の領域情報が示す領域内の物体の画像認識結果と、第2の領域情報が示す領域内の物体の画像認識結果とに基づいて、類似性を判定してもよい。すなわち、ラベル情報比較部135は、第1の領域情報が示す領域内の物体の画像認識結果と、第2の領域情報が示す領域内の物体の画像認識結果とが一致した場合、第1の領域情報と第2の領域情報とは類似していると判定する。一方、ラベル情報比較部135は、第1の領域情報が示す領域内の物体の画像認識結果と、第2の領域情報が示す領域内の物体の画像認識結果とが一致しない場合、第1の領域情報と第2の領域情報とは類似していないと判定する。
さらに、ラベル情報比較部135による第1の領域情報と第2の領域情報との類似性の判定方法は上記に限定されない。ラベル情報比較部135は、第2の領域情報が示す領域の位置が第1の領域情報が示す領域の位置に移動する軌跡に基づいて、第1の領域情報と第2の領域情報とが類似しているか否かを判定してもよい。また、ラベル情報比較部135は、第1の画像を撮影した際の撮影装置の速度と、第2の画像を撮影した際の撮影装置の速度とに基づいて、類似性を判定してもよい。また、ラベル情報比較部135は、第1の画像を撮影した際の撮影装置の加速度と、第2の画像を撮影した際の撮影装置の加速度とに基づいて、類似性を判定してもよい。
警告部136は、ラベル付与判定部133によって領域情報にラベル情報が関連付けられていないと判定された場合、領域情報にラベル情報が関連付けられていないことを警告するためのラベル付与警告情報を端末装置2に出力させる。このとき、通信部11は、警告部136によって生成されたラベル付与警告情報を端末装置2に送信する。
また、警告部136は、ラベル情報比較部135によって第1のラベル情報と第2のラベル情報とが一致しないと判定された場合、第1のラベル情報及び第2のラベル情報の少なくとも一方を変更するための所定の処理を行う。例えば、警告部136は、ラベル情報比較部135によって第1のラベル情報と第2のラベル情報とが一致しないと判定された場合、第1のラベル情報と第2のラベル情報とが一致しないことを警告するためのラベル不一致警告情報を端末装置2に出力させる。このとき、通信部11は、警告部136によって生成されたラベル不一致警告情報を端末装置2に送信する。
確認部137は、保留ラベル判定部134によってラベル情報が作業情報を含むと判定された場合、分類作業の状態をユーザに確認するための確認情報を端末装置2に出力させる。すなわち、確認部137は、分類作業が保留されたことを示す保留情報をラベル情報が含むと判定された場合、分類作業が保留されていることをユーザに確認するための保留確認情報を端末装置2に出力させる。このとき、通信部11は、確認部137によって生成された保留確認情報を端末装置2に送信する。また、ラベル情報生成部1322は、通信部11を介して、保留確認情報に対するユーザの端末装置2による入力操作に応じてラベル情報を取得する。
端末装置2は、例えば、パーソナルコンピュータである。端末装置2は、通信部21、入力部22、出力部23及び制御部24を備える。
通信部21は、無線又は有線を用いて、インターネット等の通信ネットワークを介して、サーバ1などの外部装置と通信を行い、情報を送受信する。
入力部22は、例えば、キーボード又はマウスであり、ユーザによる入力操作を受け付ける。入力部22は、領域情報のユーザによる入力操作及びラベル情報のユーザによる入力操作を受け付ける。
出力部23は、例えば、液晶表示装置であり、種々の情報を表示する。出力部23は、領域情報のユーザによる入力を受け付けるための領域情報入力画面及びラベル情報のユーザによる入力を受け付けるためのラベル情報入力画面を表示する。また、出力部23は、領域情報にラベル情報が関連付けられていないことを警告するためのラベル付与警告情報、分類作業が保留されたことをユーザに確認するための保留確認情報、及び第1の分類情報と第2の分類情報とが一致しないことを警告するためのラベル不一致警告情報を表示する。
なお、出力部23は、例えば、スピーカであってもよく、ラベル付与警告情報、保留確認情報及びラベル不一致警告情報を音声により出力してもよい。
制御部24は、例えば、プロセッサであり、端末装置2の各構成の動作を制御する。
続いて、本実施の形態1におけるサーバ1の動作について説明する。
図2は、本実施の形態1におけるサーバの動作について説明するための第1のフローチャートであり、図3は、本実施の形態1におけるサーバの動作について説明するための第2のフローチャートである。
まず、ステップS1において、画像取得部131は、画像データ記憶部121からアノテーション処理に用いる画像データを取得する。このとき、画像取得部131は、複数の画像データで構成される画像データセットを取得する。
次に、ステップS2において、領域情報生成部1321は、画像に映る物体の領域を示す領域情報を生成する。ここで、領域情報生成部1321は、領域情報のユーザによる入力を受け付けるための領域情報入力画面を生成し、通信部11を介して端末装置2へ送信する。端末装置2の通信部21は、領域情報入力画面を受信する。出力部23は、領域情報入力画面を表示する。入力部22は、領域情報入力画面において領域情報のユーザによる入力操作を受け付ける。
図4は、本実施の形態1における領域情報入力画面の一例を示す図である。出力部23は、図4に示す領域情報入力画面201を表示する。領域情報入力画面201には、画像202が表示される。領域情報入力画面201上には、カーソル203が表示され、ユーザは、入力部22であるマウスを移動させることにより、領域情報入力画面201上のカーソル203を移動させる。ユーザは、マウスのボタンを長押しした状態で移動させることにより、画像202上に矩形状の枠204を表示させ、マウスのボタンを離すことにより、矩形状の枠204の形状及びサイズを決定する。ユーザは、対象物を囲むように、矩形状の枠204を表示させることにより、対象物を示す領域を決定する。図4では、自転車に乗った人物が対象物として選択され、対象物を囲むように、矩形状の枠204が表示されている。対象物を囲む領域が選択されると、制御部24は、画像202上の領域の位置を示す領域情報を生成する。
通信部21は、制御部24によって生成された領域情報をサーバ1へ送信する。サーバ1の通信部11は、端末装置2によって送信された領域情報を受信し、領域情報生成部1321へ出力する。領域情報生成部1321は、通信部11によって受信された領域情報を取得する。以上により、領域情報生成部1321は、領域情報を生成する。
図2に戻って、次に、ステップS3において、ラベル情報生成部1322は、領域情報に関連付けられた領域の分類を示すラベル情報を生成する。ここで、ラベル情報生成部1322は、ラベル情報のユーザによる入力を受け付けるためのラベル情報入力画面を生成し、通信部11を介して端末装置2へ送信する。端末装置2の通信部21は、ラベル情報入力画面を受信する。出力部23は、ラベル情報入力画面を表示する。入力部22は、ラベル情報入力画面においてラベル情報のユーザによる入力操作を受け付ける。
図5は、本実施の形態1におけるラベル情報入力画面の一例を示す図である。出力部23は、図5に示すラベル情報入力画面301を表示する。ラベル情報入力画面301には、画像202、ラベル情報選択リスト205及び画像切替ボタン206が表示される。ラベル情報入力画面301上には、カーソル203が表示され、ユーザは、入力部22であるマウスを移動させることにより、ラベル情報入力画面301上のカーソル203を移動させる。ラベル情報選択リスト205には、対象物を分類するためのラベル名が選択可能に表示される。図5では、ラベル名として、電車、車、バス、バイク、自転車、歩行者及びその他が表示され、各ラベル名の左隣に選択ボタンが表示される。
まず、ユーザは、カーソル203を画像202上の所望の対象物の領域に移動させてマウスのボタンをクリックすることにより、ラベルを付与する対象物の領域を選択する。対象物の領域が選択されると、ラベル情報入力画面301上にラベル情報選択リスト205が表示される。
次に、ユーザは、カーソル203を所望のラベル名の左隣の選択ボタンに移動させてマウスのボタンをクリックすることにより、対象物の領域を分類するためのラベルを決定する。なお、対象物を分類することができず、対象物を後から分類する場合、ユーザは、ラベル情報選択リスト205に表示された「保留」に対応する選択ボタンを選択する。図5では、矩形状の枠204で示される領域に対するラベル名として、自転車に対応する選択ボタンが選択されている。ラベル名が選択されると、制御部24は、ラベル名を示すラベル情報を生成する。
なお、ラベル情報は、対象物が何であるかを示す情報だけでなく、対象物がどこに存在しているかを示す情報を含んでもよい。ラベル情報入力画面301では、例えば、対象物が存在している場所が、車道及び歩道のいずれであるかの選択を受け付けてもよい。
通信部21は、制御部24によって生成されたラベル情報をサーバ1へ送信する。サーバ1の通信部11は、端末装置2によって送信されたラベル情報を受信し、ラベル情報生成部1322へ出力する。ラベル情報生成部1322は、通信部11によって受信されたラベル情報を取得する。以上により、ラベル情報生成部1322は、ラベル情報を生成する。なお、ユーザは、領域情報生成部1321によって生成された画像上の全ての領域に対してラベル情報を関連付ける。
また、図5に示すように、1つの画像データセットのうちの全ての画像データに対して領域情報及びラベル情報が対応付けられていない場合、次の画像データに切り替えるための画像切替ボタン206が表示される。一方、1つの画像データセットのうちの全ての画像データに対して領域情報及びラベル情報が対応付けられた場合、画像データセットに対するアノテーション処理を終了するための不図示の終了ボタンが表示される。
図2に戻って、次に、ステップS4において、情報統合部1323は、画像データと、領域情報と、ラベル情報とを統合してラベル付与画像データを生成する。
次に、ステップS5において、画像取得部131は、次の画像に切り替える指示を受け付けたか否かを判断する。図5に示す画像切替ボタン206がクリックされた場合、端末装置2の通信部21は、次の画像に切り替えるための画像切替指示をサーバ1へ送信する。サーバ1の通信部11は、画像切替指示を受信する。画像切替指示が受信された場合、画像取得部131は、画像切替指示を受け付けたと判断する。
ここで、画像切替指示を受け付けたと判断された場合(ステップS5でYES)、ステップS6において、ラベル付与判定部133は、1の画像データに対して生成された全ての領域情報にラベル情報が関連付けられているか否かを判定する。少なくとも1つの領域情報にラベル情報が関連付けられていないと判定された場合(ステップS6でNO)、ステップS7において、警告部136は、少なくとも1つの領域情報にラベル情報が関連付けられていないことを警告するためのラベル付与警告情報を端末装置2に出力させる。すなわち、警告部136は、ラベル付与警告情報を通信部11へ出力し、通信部11は、ラベル付与警告情報を端末装置2へ送信する。端末装置2の通信部21は、サーバ1によって送信されたラベル付与警告情報を受信する。出力部23は、通信部21によって受信されたラベル付与警告情報を表示する。
図6は、本実施の形態1において、少なくとも1つの領域情報にラベル情報が関連付けられていない場合に表示されるラベル付与警告情報の一例を示す図である。
少なくとも1つの領域情報にラベル情報が関連付けられていない場合、ラベル付与警告情報207が表示される。例えば、ユーザは、領域情報に対してラベル情報を入力するのを忘れることがある。領域情報に対してラベル情報が入力されていない状態で、次の画像に切り替える画像切替ボタン206がクリックされた場合、少なくとも1つの領域情報にラベル情報が関連付けられていないことを警告するためのラベル付与警告情報207が表示される。これにより、ユーザは、ラベル情報を入力していない領域情報を認識することができ、ラベル情報の入力漏れを防止することができる。
図6に示すラベル情報入力画面301では、ラベル情報が関連付けられていない領域情報を示す矩形状の枠204が識別可能に表示される。例えば、ラベル情報が関連付けられていない領域情報を示す矩形状の枠204は、ラベル情報が関連付けられている領域情報を示す矩形状の枠204とは異なる色で表示される。ラベル付与警告情報207としては、例えば、「対象物にラベル情報がありません」との文章が表示される。
そして、ステップS7でラベル付与警告情報が出力された後、ステップS3に処理が戻り、再度、ラベル情報が生成される。
一方、ステップS5において画像切替指示を受け付けていないと判断された場合(ステップS5でNO)、画像取得部131は、画像データセットに対するアノテーション処理を終了するためのアノテーション終了指示を受け付けたか否かを判定する。すなわち、ラベル情報入力画面301において、終了ボタンがクリックされた場合、端末装置2の通信部21は、画像データセットに対するアノテーション処理を終了するためのアノテーション終了指示をサーバ1へ送信する。サーバ1の通信部11は、アノテーション終了指示を受信する。アノテーション終了指示が受信された場合、画像取得部131は、アノテーション終了指示を受け付けたと判断する。
ここで、アノテーション終了指示を受け付けていないと判定された場合(ステップS8でNO)、ステップS2へ処理が戻り、領域情報生成部1321は、画像に映る物体の領域を示す領域情報を生成する。
一方、アノテーション終了指示を受け付けたと判定された場合(ステップS8でYES)、ステップS9において、保留ラベル判定部134は、ラベル情報が保留ラベルを含むか否かを判定する。すなわち、保留ラベル判定部134は、ラベル情報が入力されずに、保留されているか否かを判定する。ここで、ラベル情報が保留ラベルを含むと判定された場合(ステップS9でYES)、ステップS10において、確認部137は、保留されたラベル情報が存在することをユーザに確認するための保留確認情報を端末装置2に出力させる。すなわち、確認部137は、保留確認情報を通信部11へ出力し、通信部11は、保留確認情報を端末装置2へ送信する。端末装置2の通信部21は、サーバ1によって送信された保留確認情報を受信する。出力部23は、通信部21によって受信された保留確認情報を表示する。
図7は、本実施の形態1において、ラベル情報が保留ラベルを含む場合に表示される保留確認情報の一例を示す図である。
図7に示すように、ラベル情報入力画面301Aは、第1の画像202Aの領域情報に対してラベル情報を入力するための画面であり、ラベル情報入力画面301Bは、第2の画像202Bの領域情報に対してラベル情報を入力するための画面であり、ラベル情報入力画面301Nは、第Nの画像202Nの領域情報に対してラベル情報を入力するための画面である。
図7では、第1の画像202Aの1つ領域情報に対して、保留ラベルが選択されている。画像データセットの最後の画像データである第Nの画像202Nに対してラベル情報を入力するラベル情報入力画面301Nは、画像データセットに対するアノテーション処理を終了するための終了ボタン209を含む。
保留ラベルを含むラベル情報が存在する場合、保留確認情報210が表示される。例えば、ユーザは、領域情報に対して後からラベル情報を入力するために、一旦保留ラベルを選択し、その後保留したラベル情報の入力を忘れることがある。ラベル情報が保留ラベルを含む状態で、アノテーション処理を終了するための終了ボタン209がクリックされた場合、保留されたラベル情報が存在することをユーザに確認するための保留確認情報210が表示される。これにより、ユーザは、入力が保留されたラベル情報を認識することができ、ラベル情報の入力漏れを防止することができる。
図7に示すように、ラベル情報入力画面301Nに表示された終了ボタン209がクリックされた場合、保留ラベルを含むラベル情報が存在するラベル情報入力画面301Aが表示されるとともに、ラベル情報入力画面301Aに保留確認情報210が表示される。
図7に示すラベル情報入力画面301Aでは、ラベル情報が関連付けられていない領域情報を示す矩形状の枠204が識別可能に表示される。例えば、ラベル情報が関連付けられていない領域情報を示す矩形状の枠204は、ラベル情報が関連付けられている領域情報を示す矩形状の枠204とは異なる色で表示される。保留確認情報210としては、例えば、「保留した対象物にラベル情報を付与してください」との文章が表示される。
そして、ステップS10で保留確認情報が出力された後、ステップS3に処理が戻り、再度、ラベル情報が生成される。
図2に戻って、ラベル情報が保留ラベルを含まないと判定された場合(ステップS9でNO)、ステップS11において、情報統合部1323は、画像データと、領域情報と、ラベル情報とを統合したラベル付与画像データをラベル付与画像データ記憶部122に記憶する。
一方、ステップS6において1の画像データに対して生成された全ての領域情報にラベル情報が関連付けられていると判定された場合(ステップS6でYES)、ステップS12において、ラベル情報比較部135は、現在の画像に対応付けられている領域情報及びラベル情報を取得する。なお、ラベル情報比較部135は、現在の画像に複数の領域情報及びラベル情報が対応付けられている場合、複数の領域情報及びラベル情報を取得する。
ステップS13において、ラベル情報比較部135は、1つ前の画像に対応付けられている領域情報及びラベル情報を取得する。なお、ラベル情報比較部135は、1つ前の画像に複数の領域情報及びラベル情報が対応付けられている場合、複数の領域情報及びラベル情報を取得する。
次に、ステップS14において、ラベル情報比較部135は、現在の画像に対応付けられている領域情報と、1つ前の画像に対応付けられている領域情報との類似性を判定する。すなわち、ラベル情報比較部135は、現在の画像に対応付けられている少なくとも1つの領域情報のそれぞれと、1つ前の画像に対応付けられている少なくとも1つの領域情報との類似性を判定する。ラベル情報比較部135は、1つ前の画像に対応付けられている少なくとも1つの領域情報の中から1の領域情報と類似している領域情報を特定する。そして、ラベル情報比較部135は、現在の画像に対応付けられている少なくとも1つの領域情報のうちの他の領域情報のそれぞれについても同様の処理を行い、他の領域情報のそれぞれに類似する領域情報を1つ前の画像に対応付けられている少なくとも1つの領域情報の中から特定する。
なお、ラベル情報比較部135は、現在の画像に対応付けられている領域情報で示される領域の位置と、1つ前の画像に対応付けられている領域情報で示される領域の位置との間の距離を算出し、算出した距離が所定値以下である場合、2つの領域情報は類似していると判定する。また、ラベル情報比較部135は、算出した距離が所定値より大きい場合、2つの領域情報は類似していないと判定する。
次に、ステップS14において、ラベル情報比較部135は、現在の画像に対応付けられている領域情報に類似する領域情報が1つ前の画像に対応付けられているか否かを判定する。ここで、現在の画像に対応付けられている領域情報に類似する領域情報が1つ前の画像に対応付けられていないと判定された場合(ステップS15でNO)、ステップS8へ処理が移行する。
一方、現在の画像に対応付けられている領域情報に類似する領域情報が1つ前の画像に対応付けられていると判定された場合(ステップS15でYES)、ステップS16において、ラベル情報比較部135は、互いに類似する領域情報のラベル情報が異なるか否かを判定する。ここで、互いに類似する領域情報のラベル情報が異ならない、すなわち、互いに類似する領域情報のラベル情報が同じであると判定された場合(ステップS16でNO)、ステップS8へ処理が移行する。
一方、互いに類似する領域情報のラベル情報が異なると判定された場合(ステップS16でYES)、ステップS17において、警告部136は、互いに類似する領域情報のラベル情報が異なることを警告するためのラベル不一致警告情報を端末装置2に出力させる。すなわち、警告部136は、ラベル不一致警告情報を通信部11へ出力し、通信部11は、ラベル不一致警告情報を端末装置2へ送信する。端末装置2の通信部21は、サーバ1によって送信されたラベル不一致警告情報を受信する。出力部23は、通信部21によって受信されたラベル不一致警告情報を表示する。
図8は、本実施の形態1における1つ前の画像に対するラベル情報入力画面の一例を示す図であり、図9は、本実施の形態1における現在の画像に対するラベル情報入力画面の一例を示す図である。
図8に示すように、ラベル情報入力画面3011には、1つ前の画像2021、ラベル情報選択リスト205及び画像切替ボタン206が表示されている。図8では、矩形状の枠204で示される領域に対するラベル名として、バイクに対応する選択ボタンが選択されている。
また、図9に示すように、ラベル情報入力画面3012には、現在の画像2022及びラベル情報選択リスト205及び画像切替ボタン206が表示されている。図9では、矩形状の枠204で示される領域に対するラベル名として、自転車に対応する選択ボタンが選択されている。
このように、1つ前の画像2021の形状の枠204で示される領域のラベル情報と、現在の画像2022の形状の枠204で示される領域のラベル情報とが異なる場合、ラベル不一致警告情報211が表示される。例えば、画像内の対象物の大きさによっては、ユーザは、現在の画像の対象物に対し、1つ前の画像の同一の対象物に対するラベル情報とは異なるラベル情報を入力することがある。現在の画像のラベル情報と1つ前の画像のラベル情報とが異なる状態で、次の画像に切り替える画像切替ボタン206がクリックされた場合、現在の画像と1つ前の画像とでラベル情報が異なることを警告するためのラベル不一致警告情報211が表示される。これにより、ユーザは、同一の対象物に対して同一のラベル情報を付与することができ、ラベル情報を統一することができる。
図9に示すラベル情報入力画面3012では、1つ前の画像とラベル情報が異なる領域情報を示す矩形状の枠204が識別可能に表示される。例えば、1つ前の画像とラベル情報が異なる領域情報を示す矩形状の枠204は、1つ前の画像とラベル情報が同じ領域情報を示す矩形状の枠204とは異なる色で表示される。ラベル不一致警告情報211としては、例えば、「1つ前の画像とラベル情報が異なります」との文章が表示される。
なお、警告部136は、現在の画像のラベル情報が保留ラベルであり、1つ前の画像のラベル情報が保留ラベルである場合、ラベル不一致警告情報211を出力しなくてもよい。また、警告部136は、現在の画像のラベル情報が保留ラベルであり、1つ前の画像のラベル情報が保留ラベル以外のラベル名である場合、ラベル不一致警告情報211を出力してもよい。また、警告部136は、現在の画像のラベル情報が保留ラベル以外のラベル名であり、1つ前の画像のラベル情報が保留ラベルである場合、ラベル不一致警告情報211を出力してもよい。
そして、ステップS17でラベル不一致警告情報が出力された後、ステップS3に処理が戻り、再度、ラベル情報が生成される。
なお、本実施の形態1では、1つ前の画像と現在の画像とで互いに類似する領域情報のラベル情報が異なると判定された場合、ステップS17において、警告部136は、互いに類似する領域情報のラベル情報が異なることを警告するためのラベル不一致警告情報を端末装置2に出力させているが、本開示は特にこれに限定されない。1つ前の画像と現在の画像とで互いに類似する領域情報のラベル情報が異なると判定された場合、ラベル情報生成部1322は、1つ前の画像のラベル情報を現在の画像のラベル情報に変更してもよい。
また、本実施の形態1では、ラベル情報の入力を保留する場合、保留ラベルが選択されるが、本開示は特にこれに限定されず、ラベル情報の1つとして保留ラベルがなくてもよい。
(実施の形態2)
実施の形態1では、1つ前の画像と現在の画像とで互いに類似する領域情報のラベル情報が異なることを警告するためのラベル不一致警告情報が表示され、現在の画像の領域情報に対応するラベル情報が再度生成される。これに対し、実施の形態2では、1つ前の画像と現在の画像とで互いに類似する領域情報のラベル情報が異なっていてもよいか否かを確認するためのラベル不一致確認情報が表示され、1つ前の画像以前のアノテーション処理済みの画像の領域情報のラベル情報を、現在の画像の領域情報のラベル情報に変更するか否かを確認するためのラベル変更確認情報が表示される。
図10は、本実施の形態2における情報処理システムの全体構成を示すブロック図である。図10に示す情報処理システムは、サーバ1Aと端末装置2とを備える。なお、本実施の形態2において、実施の形態1と同じ構成については同じ符号を付し、説明を省略する。
サーバ1Aは、通信部11、記憶部12及び制御部13Aを備える。制御部13Aは、例えばプロセッサであり、画像取得部131、アノテーション処理部132、ラベル付与判定部133、保留ラベル判定部134、ラベル情報比較部135、警告部136及び確認部137Aを備える。
確認部137Aは、ラベル情報比較部135によって第1のラベル情報と第2のラベル情報とが一致しないと判定された場合、上述した所定の処理として、第2のラベル情報と第1のラベル情報とが異なっていてもよいか否かを確認するためのラベル不一致確認情報を端末装置2に出力させる。
また、確認部137Aは、ラベル情報比較部135によって第1のラベル情報と第2のラベル情報とが一致しないと判定された場合、上述した所定の処理として、第2のラベル情報を第1のラベル情報に変更するか否かをユーザに確認するためのラベル変更確認情報を端末装置2に出力させる。特に、確認部137Aは、1つ前の画像の第2の領域情報に対応付けられている第2のラベル情報だけでなく、すでにアノテーション処理済みの1つ前以前の画像の第2の領域情報に対応付けられている第2のラベル情報を、現在の画像の第1の領域情報に対応付けられている第1のラベル情報に変更するか否かをユーザに確認するためのラベル変更確認情報を端末装置2に出力させてもよい。
ラベル情報生成部1322は、ラベル変更確認情報に対するユーザの入力操作に応じて第2のラベル情報を第1のラベル情報に変更する。特に、ラベル情報生成部1322は、1つ前の画像の第2の領域情報に対応付けられている第2のラベル情報だけでなく、すでにアノテーション処理済みの1つ前以前の画像の第2の領域情報に対応付けられている第2のラベル情報を、現在の画像の第1の領域情報に対応付けられている第1のラベル情報に変更してもよい。
続いて、本実施の形態2におけるサーバ1Aの動作について説明する。
図11は、本実施の形態2におけるサーバの動作について説明するための第1のフローチャートであり、図12は、本実施の形態2におけるサーバの動作について説明するための第2のフローチャートであり、図13は、本実施の形態2におけるサーバの動作について説明するための第3のフローチャートである。なお、本実施の形態2におけるステップS21〜ステップS36の処理は、図2及び図3に示すステップS1〜ステップS16の処理と同じであるので説明を省略する。
ステップS36で互いに類似する領域情報のラベル情報が異なると判定された場合(ステップS36でYES)、ステップS37において、確認部137Aは、1つ前の画像の領域情報に対応付けられているラベル情報と、現在の画像の領域情報に対応付けられているラベル情報とが異なっていてもよいか否かを確認するためのラベル不一致確認情報を端末装置2に出力させる。すなわち、確認部137Aは、ラベル不一致確認情報を通信部11へ出力し、通信部11は、ラベル不一致確認情報を端末装置2へ送信する。端末装置2の通信部21は、サーバ1によって送信されたラベル不一致確認情報を受信する。出力部23は、通信部21によって受信されたラベル不一致確認情報を表示する。
次に、ステップS38において、確認部137Aは、ラベル不一致確認情報に応じて、1つ前の画像の領域情報に対応付けられているラベル情報と、現在の画像の領域情報に対応付けられているラベル情報とが異なっていることを許容するラベル情報の許容操作の入力を受け付けたか否かを判定する。ここで、ラベル情報の許容操作の入力を受け付けたと判定された場合(ステップS38でYES)、ステップS23に処理が戻る。
一方、ラベル情報の許容操作の入力を受け付けていないと判定された場合(ステップS38でNO)、ステップS39において、確認部137Aは、すでにアノテーション処理済みの1つ前以前の画像の領域情報に対応付けられているラベル情報を、現在の画像の領域情報に対応付けられているラベル情報に変更するか否かをユーザに確認するためのラベル変更確認情報を端末装置2に出力させる。すなわち、確認部137Aは、ラベル変更確認情報を通信部11へ出力し、通信部11は、ラベル変更確認情報を端末装置2へ送信する。端末装置2の通信部21は、サーバ1によって送信されたラベル変更確認情報を受信する。出力部23は、通信部21によって受信されたラベル変更確認情報を表示する。
次に、ステップS40において、確認部137Aは、ラベル変更確認情報に応じて、すでにアノテーション処理済みの1つ前以前の画像の領域情報に対応付けられているラベル情報を、現在の画像の領域情報に対応付けられているラベル情報に変更するラベル情報の置換操作の入力を受け付けたか否かを判定する。ここで、ラベル情報の置換操作の入力を受け付けていないと判定された場合(ステップS40でNO)、ステップS23に処理が戻る。
一方、ラベル情報の置換操作の入力を受け付けたと判定された場合(ステップS40でYES)、ステップS41において、ラベル情報生成部1322は、すでにアノテーション処理済みの1つ前以前の画像の領域情報に対応付けられているラベル情報を、現在の画像の領域情報に対応付けられているラベル情報に変更する。
図14は、本実施の形態2において、1つ前の画像と現在の画像とで互いに類似する領域情報のラベル情報が異なっている場合に表示されるラベル不一致確認情報及びラベル変更確認情報の一例を示す図である。
図14に示すように、ラベル情報入力画面401Aは、第1の画像402Aの領域情報に対してラベル情報を入力するための画面であり、ラベル情報入力画面401Bは、第2の画像402Bの領域情報に対してラベル情報を入力するための画面であり、ラベル情報入力画面401Cは、第3の画像402Cの領域情報に対してラベル情報を入力するための画面であり、ラベル情報入力画面401Dは、第4の画像402Dの領域情報に対してラベル情報を入力するための画面である。なお、第4の画像402Dが現在アノテーション処理中の現在の画像であり、第3の画像402Cが、第4の画像402Dの1つ前の画像である。
まず、第1の画像402A、第2の画像402B及び第3の画像402Cでは、矩形状の枠204内の対象物の下部が、障害物403に隠れているため、ユーザは、対象物は歩行者であると推測している。そのため、ラベル情報入力画面401A,401B,401Cでは、矩形状の枠204で示される領域に対するラベル情報として、歩行者に対応する選択ボタンが選択されている。
一方、第4の画像402Dでは、矩形状の枠204内の対象物が、障害物403から現れており、ユーザは、対象物が実際には車いすに乗った人物であったことが分かった。そのため、ラベル情報入力画面401Dでは、矩形状の枠204で示される領域に対するラベル情報として、その他に対応する選択ボタンが選択されている。
この場合、第3の画像402Cの矩形状の枠204で示される領域に対する第2のラベル情報と、第4の画像402Dの矩形状の枠204で示される領域に対する第1のラベル情報とは異なっており、第2のラベル情報と第1のラベル情報とが異なっていてもよいか否かを確認するためのラベル不一致確認情報411が表示される。
ラベル不一致確認情報411としては、例えば、「1つ前の画像とラベル情報が異なりますがよろしいですか?」との文章が表示され、ラベル情報が互いに異なることを許容するためのYESボタンと、ラベル情報が互いに異なることを許容しないためのNOボタンとが表示される。YESボタンにカーソル203が合わされてクリックされると、第3の画像402Cの矩形状の枠204で示される領域に対する第2のラベル情報と、第4の画像402Dの矩形状の枠204で示される領域に対する第1のラベル情報とが異なることが許容される。
一方、NOボタンにカーソル203が合わされてクリックされると、すでにアノテーション処理済みの1つ前以前の画像402A,402B,402Cの領域情報に対応付けられている第2のラベル情報を、第4の画像402Dの領域情報に対応付けられている第1のラベル情報に変更するか否かをユーザに確認するためのラベル変更確認情報412が表示される。
ラベル変更確認情報412としては、例えば、「処理済み画像のラベル情報を変更しますか?」との文章が表示され、ラベル情報の変更を許容するためのYESボタンと、ラベル情報の変更を許容しないためのNOボタンとが表示される。YESボタンにカーソル203が合わされてクリックされると、1つ前以前の第1、第2及び第3の画像402A,402B,402Cの領域情報に対応付けられている第2のラベル情報が、現在の第4の画像402Dの領域情報に対応付けられている第1のラベル情報に変更される。例えば、図14では、歩行者に対応する第2のラベル情報が、その他に対応する第1のラベル情報に変更される。
一方、NOボタンにカーソル203が合わされてクリックされると、第3の画像402Cの矩形状の枠204で示される領域に対する第2のラベル情報と、第4の画像402Dの矩形状の枠204で示される領域に対する第1のラベル情報とが異なることが許容される。
このように、1つ前の第3の画像402Cの領域情報に対応付けられている第2のラベル情報が、現在の第4の画像402Dの領域情報に対応付けられている第1のラベル情報に変更されるので、誤ったラベル情報が付与されるのを防止することができる。また、1つ前以前の第1、第2及び第3の画像402A,402B,402Cの領域情報に対応付けられている第2のラベル情報が、現在の第4の画像402Dの領域情報に対応付けられている第1のラベル情報に変更されるので、誤った複数のラベル情報を一括して修正することができ、ユーザの手間を省くことができる。
以上、本開示のシステムについて、実施の形態に基づいて説明したが、本開示は、この実施の形態に限定されるものではない。本開示の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施したものや、異なる実施の形態における構成要素を組み合わせて構築される形態も、本開示の一つまたは複数の態様の範囲内に含まれてもよい。
なお、上記各実施の形態において、各構成要素は、専用のハードウェアで構成されるか、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、プロセッサなどのプログラム実行部が、ハードディスクまたは半導体メモリなどの記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。
本開示の実施の形態に係る装置の機能の一部又は全ては典型的には集積回路であるLSI(Large Scale Integration)として実現される。これらは個別に1チップ化されてもよいし、一部又は全てを含むように1チップ化されてもよい。また、集積回路化はLSIに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。LSI製造後にプログラムすることが可能なFPGA(Field Programmable Gate Array)、又はLSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。
また、本開示の実施の形態に係る装置の機能の一部又は全てを、CPU(中央演算処理装置)等のプロセッサがプログラムを実行することにより実現してもよい。
また、上記で用いた数字は、全て本開示を具体的に説明するために例示するものであり、本開示は例示された数字に制限されない。
また、上記フローチャートに示す各ステップが実行される順序は、本開示を具体的に説明するために例示するためのものであり、同様の効果が得られる範囲で上記以外の順序であってもよい。また、上記ステップの一部が、他のステップと同時(並列)に実行されてもよい。
さらに、本開示の主旨を逸脱しない限り、本開示の各実施の形態に対して当業者が思いつく範囲内の変更を施した各種変形例も本開示に含まれる。
本開示に係る情報処理方法及び情報処理プログラムは、画像に映る物体を識別する識別器の識別性能をより効果的に向上させることができ、画像に映る物体を分類する情報処理方法及び情報処理プログラムとして有用である。
1,1A サーバ
2 端末装置
11 通信部
12 記憶部
13,13A 制御部
21 通信部
22 入力部
23 出力部
24 制御部
121 画像データ記憶部
122 ラベル付与画像データ記憶部
131 画像取得部
132 アノテーション処理部
133 ラベル付与判定部
134 保留ラベル判定部
135 ラベル情報比較部
136 警告部
137,137A 確認部
1321 領域情報生成部
1322 ラベル情報生成部
1323 情報統合部

Claims (13)

  1. プロセッサを用いて、
    第1の画像に映る物体の領域を示す第1の領域情報と、前記第1の画像と時系列で隣接する第2の画像に映る物体の領域を示す第2の領域情報と、前記第1の領域情報に関連付けられた前記領域の分類を示す第1の分類情報と、前記第2の領域情報に関連付けられた前記領域の分類を示す第2の分類情報と、を取得し、
    前記第1の領域情報及び前記第2の領域情報に基づいて、前記第1の領域情報と前記第2の領域情報との類似性を判定し、
    前記類似性の判定結果に応じて、前記第1の分類情報と前記第2の分類情報とが一致するか否かを判定し、
    前記第1の分類情報と前記第2の分類情報とが一致しないと判定された場合、前記第1の分類情報及び前記第2の分類情報の少なくとも一方を変更するための所定の処理を行う、
    情報処理方法。
  2. 前記所定の処理は、前記第1の分類情報と前記第2の分類情報とが一致しないことを警告するための警告情報を出力装置に出力させる、
    請求項1記載の情報処理方法。
  3. 前記類似性の判定は、前記第1の領域情報が示す前記領域の態様と、前記第2の領域情報が示す前記領域の態様とに基づいて、前記類似性を判定する、
    請求項1又は2記載の情報処理方法。
  4. 前記領域の態様は、前記領域のサイズ及び前記領域の画像上の位置のいずれかを含む、
    請求項3記載の情報処理方法。
  5. さらに、前記第1の画像を撮影した地点の位置を示す第1の位置情報と、前記第2の画像を撮影した地点の位置を示す第2の位置情報とを取得し、
    前記類似性の判定は、前記第1の位置情報と前記第2の位置情報とに基づいて、前記類似性を判定する、
    請求項1又は2記載の情報処理方法。
  6. 前記類似性の判定は、前記第1の領域情報が示す前記領域内の前記物体の画像認識結果と、前記第2の領域情報が示す前記領域内の前記物体の画像認識結果とに基づいて、前記類似性を判定する、
    請求項1又は2記載の情報処理方法。
  7. 前記第2の画像は、前記第1の画像よりも時系列で1つ前の画像であり、
    前記所定の処理は、前記第2の分類情報を前記第1の分類情報に変更する、
    請求項1記載の情報処理方法。
  8. 前記第2の画像は、前記第1の画像よりも時系列で1つ前の画像であり、
    前記所定の処理は、前記第2の分類情報を前記第1の分類情報に変更するか否かをユーザに確認するための確認情報を出力装置に出力させ、
    さらに、前記確認情報に対する前記ユーザの入力装置による入力操作に応じて前記第2の分類情報を前記第1の分類情報に変更する、
    請求項1記載の情報処理方法。
  9. さらに、前記第1の分類情報が、前記領域の分類作業の状態を示す作業情報を含むか否かを判定すると共に、前記第2の分類情報が、前記領域の分類作業の状態を示す作業情報を含むか否かを判定し、
    前記所定の処理は、前記第1の分類情報及び前記第2の分類情報の少なくとも一方が前記作業情報を含むと判定された場合、前記分類作業の状態を前記ユーザに確認するための確認情報を出力装置に出力させる、
    請求項1記載の情報処理方法。
  10. 前記作業情報は、前記分類作業が保留されたことを示す保留情報を含み、
    前記所定の処理は、
    前記第1の分類情報が前記保留情報を含むと判定された場合、前記分類作業が保留されたことを前記ユーザに確認するための前記確認情報を前記出力装置に出力させ、
    前記確認情報に対する前記ユーザの入力装置による入力操作に応じて前記第1の分類情報を取得し、
    前記第2の分類情報が前記保留情報を含むと判定された場合、前記分類作業が保留されたことを前記ユーザに確認するための前記確認情報を前記出力装置に出力させ、
    前記確認情報に対する前記ユーザの前記入力装置による入力操作に応じて前記第2の分類情報を取得する、
    請求項9記載の情報処理方法。
  11. 前記分類作業の終了操作が前記入力装置により入力された場合、前記第1の分類情報が、前記領域の分類作業の状態を示す作業情報を含むか否かを判定すると共に、前記第2の分類情報が、前記領域の分類作業の状態を示す作業情報を含むか否かを判定する、
    請求項9又は10記載の情報処理方法。
  12. さらに、
    前記第1の領域情報及び前記第1の分類情報を取得する前に、前記第1の領域情報に前記第1の分類情報が関連付けられているか否かを判定し、
    前記第1の領域情報に前記第1の分類情報が関連付けられていないと判定された場合、前記第1の領域情報に前記第1の分類情報が関連付けられていないことを警告するための警告情報を出力装置に出力させる、
    請求項1記載の情報処理方法。
  13. プロセッサに、
    第1の画像に映る物体の領域を示す第1の領域情報と、前記第1の画像と時系列で隣接する第2の画像に映る物体の領域を示す第2の領域情報と、前記第1の領域情報に関連付けられた前記領域の分類を示す第1の分類情報と、前記第2の領域情報に関連付けられた前記領域の分類を示す第2の分類情報と、を取得し、
    前記第1の領域情報及び前記第2の領域情報に基づいて、前記第1の領域情報と前記第2の領域情報との類似性を判定し、
    前記類似性の判定結果に応じて、前記第1の分類情報と前記第2の分類情報とが一致するか否かを判定し、
    前記第1の分類情報と前記第2の分類情報とが一致しないと判定された場合、前記第1の分類情報及び前記第2の分類情報の少なくとも一方を変更するための所定の処理を行う、
    処理を実行させるための情報処理プログラム。
JP2017172818A 2017-09-08 2017-09-08 情報処理方法及び情報処理プログラム Active JP6998521B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017172818A JP6998521B2 (ja) 2017-09-08 2017-09-08 情報処理方法及び情報処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017172818A JP6998521B2 (ja) 2017-09-08 2017-09-08 情報処理方法及び情報処理プログラム

Publications (2)

Publication Number Publication Date
JP2019049793A true JP2019049793A (ja) 2019-03-28
JP6998521B2 JP6998521B2 (ja) 2022-01-18

Family

ID=65905015

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017172818A Active JP6998521B2 (ja) 2017-09-08 2017-09-08 情報処理方法及び情報処理プログラム

Country Status (1)

Country Link
JP (1) JP6998521B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021056841A (ja) * 2019-09-30 2021-04-08 スズキ株式会社 教師データ作成装置及び画像分類装置
CN115561140A (zh) * 2022-10-12 2023-01-03 宁波得立丰服饰有限公司 一种服装透气性检测方法、系统、存储介质及智能终端
WO2023175819A1 (ja) * 2022-03-17 2023-09-21 日本電気株式会社 情報処理装置、情報処理システム、情報処理方法、及び非一時的なコンピュータ可読媒体
WO2024060854A1 (zh) * 2022-09-23 2024-03-28 吉智(宁波)智能科技有限公司 一种衣物护理设备的控制方法及衣物护理设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007311866A (ja) * 2006-05-16 2007-11-29 Honda Motor Co Ltd 対象物検出装置、車両、対象物検出方法、並びに対象物検出用プログラム
JP2015032133A (ja) * 2013-08-02 2015-02-16 株式会社日立国際電気 物体検索システム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007311866A (ja) * 2006-05-16 2007-11-29 Honda Motor Co Ltd 対象物検出装置、車両、対象物検出方法、並びに対象物検出用プログラム
JP2015032133A (ja) * 2013-08-02 2015-02-16 株式会社日立国際電気 物体検索システム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021056841A (ja) * 2019-09-30 2021-04-08 スズキ株式会社 教師データ作成装置及び画像分類装置
WO2023175819A1 (ja) * 2022-03-17 2023-09-21 日本電気株式会社 情報処理装置、情報処理システム、情報処理方法、及び非一時的なコンピュータ可読媒体
WO2024060854A1 (zh) * 2022-09-23 2024-03-28 吉智(宁波)智能科技有限公司 一种衣物护理设备的控制方法及衣物护理设备
CN115561140A (zh) * 2022-10-12 2023-01-03 宁波得立丰服饰有限公司 一种服装透气性检测方法、系统、存储介质及智能终端
CN115561140B (zh) * 2022-10-12 2023-08-04 宁波得立丰服饰有限公司 一种服装透气性检测方法、系统、存储介质及智能终端

Also Published As

Publication number Publication date
JP6998521B2 (ja) 2022-01-18

Similar Documents

Publication Publication Date Title
TWI709919B (zh) 車險圖像處理方法、裝置、伺服器及系統
US11047698B2 (en) Autonomous driving apparatus and method thereof
JP2019049793A (ja) 情報処理方法及び情報処理プログラム
JP6446971B2 (ja) データ処理装置、データ処理方法、及び、コンピュータ・プログラム
CN109863500A (zh) 事件驱动的感兴趣区域管理
KR20200112681A (ko) 지능형 비디오 분석
CN111523390A (zh) 一种图像识别的方法及增强现实ar图标识别的系统
CN114419679B (zh) 基于可穿戴设备数据的数据分析方法、装置及系统
CN113030990A (zh) 车辆的融合测距方法、装置、测距设备及介质
CN113887608A (zh) 一种模型训练的方法、图像检测的方法及装置
US20220084234A1 (en) Method and electronic device for identifying size of measurement target object
US20220019616A1 (en) Content display device and content display method
US11978237B2 (en) Annotation assisting method, annotation assisting device, and recording medium having annotation assisting program recorded thereon
CN112654999B (zh) 标注信息的确定方法及装置
CN113486775A (zh) 一种目标追踪方法、系统、电子设备及存储介质
JP2010129814A (ja) 観察条件決定支援装置および観察条件決定支援方法
CN111488776A (zh) 对象检测方法、对象检测装置和电子设备
JP2020201434A (ja) 生成装置、生成システムおよび生成方法
CN114187355A (zh) 一种图像标定方法及装置
CN111143423B (zh) 动态场景标注数据挖掘方法、装置以及终端
CN112399335A (zh) 平衡车组队互动方法、设备、存储介质及装置
US10372297B2 (en) Image control method and device
US20200184216A1 (en) Machine continuous learning method of neural network object classifier and related monitoring camera apparatus
CN110807397A (zh) 一种预测目标物运动状态的方法及装置
WO2021140865A1 (ja) 分類システム、分類方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200403

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210622

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210706

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211116

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211201

R151 Written notification of patent or utility model registration

Ref document number: 6998521

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151