JP7095455B2 - 情報処理装置および情報処理方法 - Google Patents

情報処理装置および情報処理方法 Download PDF

Info

Publication number
JP7095455B2
JP7095455B2 JP2018138836A JP2018138836A JP7095455B2 JP 7095455 B2 JP7095455 B2 JP 7095455B2 JP 2018138836 A JP2018138836 A JP 2018138836A JP 2018138836 A JP2018138836 A JP 2018138836A JP 7095455 B2 JP7095455 B2 JP 7095455B2
Authority
JP
Japan
Prior art keywords
cluster
unit
image
object images
extraction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018138836A
Other languages
English (en)
Other versions
JP2020017027A (ja
Inventor
和也 西村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2018138836A priority Critical patent/JP7095455B2/ja
Priority to US16/412,540 priority patent/US10956754B2/en
Priority to CN201910406037.7A priority patent/CN110781334B/zh
Publication of JP2020017027A publication Critical patent/JP2020017027A/ja
Application granted granted Critical
Publication of JP7095455B2 publication Critical patent/JP7095455B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/55Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • G06V10/763Non-hierarchical techniques, e.g. based on statistics of modelling distributions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30248Vehicle exterior or interior
    • G06T2207/30252Vehicle exterior; Vicinity of vehicle

Description

本発明は、画像にラベルを付与する情報処理装置および情報処理方法に関する。
画像内の所定の対象物を画像認識する技術が知られている。この技術では、対象物を表すラベルが付与された複数の対象物の画像を学習用データとして機械学習を行うことにより、対象物の認識精度を高める。学習用データを作成するために、既知の複数の対象物画像にラベルを付与する必要がある。
画像に情報を付与する技術として、特許文献1は、タグを付すアイテムに識別デバイスを設け、アイテムを撮影した動画像の各フレームにおける識別デバイスの位置を検出して、フレームにおけるタグを付すアイテムの位置を特定する技術を開示している。
特表2011-527527号公報
一般的には、学習用データを作成するために、ユーザによって動画像から対象物画像が複数抽出され、抽出された複数の対象物画像に対してアノテーション処理が行われる。アノテーション処理では、対象物を表すラベルがユーザによって入力され、そのラベルが対象物画像に付与される。学習用データの対象物画像が多くなるほど認識精度が高まるが、大規模な学習用データを作成するには長時間を要する。
本発明はこうした状況に鑑みてなされたものであり、その目的は、学習用データの作成に要する時間を短縮できる情報処理装置および情報処理方法を提供することにある。
上記課題を解決するために、本発明のある態様の情報処理装置は、複数の撮影画像を撮影位置情報とともに取得する第1取得部と、前記第1取得部で取得された前記複数の撮影画像から、抽出対象として設定されている対象物の画像を抽出する抽出部と、前記抽出部で抽出された複数の対象物画像をクラスタリングするクラスタリング部と、前記抽出部で抽出された前記複数の対象物画像のそれぞれの撮影位置の周辺の施設の名称を、地図情報から取得する第2取得部と、各クラスタに関して、当該クラスタに属する複数の対象物画像について前記第2取得部で取得された施設名のうち、付与条件を満たした施設名のラベルを、当該クラスタに属する複数の対象物画像に付与する付与部と、を備える。前記付与部は、各クラスタに関して、前記付与条件を満たした施設名が前記第2取得部で取得されていない対象物画像には、前記ラベルを付与しない。
この態様によると、各クラスタに関して、当該クラスタに属する対象物画像について取得された施設名のうち、付与条件を満たした施設名のラベルを、当該クラスタに属する対象物画像に付与するので、ラベルの付与に要する時間を短縮できる。
本発明の別の態様も、情報処理装置である。この装置は、複数の撮影画像を撮影位置情報とともに取得する第1取得部と、前記第1取得部で取得された前記複数の撮影画像から、抽出対象として設定されている対象物の画像を抽出する抽出部と、前記抽出部で抽出された複数の対象物画像をクラスタリングするクラスタリング部と、前記抽出部で抽出された前記複数の対象物画像のそれぞれの撮影位置の周辺の施設の名称を、地図情報から取得する第2取得部と、各クラスタに関して、当該クラスタに属する複数の対象物画像について前記第2取得部で取得された施設名のうち、付与条件を満たした施設名のラベルを、当該クラスタに属する複数の対象物画像に付与する付与部と、を備える。前記クラスタに属する複数の対象物画像について取得された各施設名が前記付与条件を満たさない場合、前記クラスタリング部は、当該クラスタに属する複数の対象物画像を再度クラスタリングする。
前記第2取得部は、前記対象物画像の撮影位置から所定距離内の1以上の施設の名称を取得してもよい。
前記クラスタに属する複数の対象物画像について取得された各施設名が前記付与条件を満たさない場合、前記クラスタリング部は、当該クラスタに属する複数の対象物画像を再度クラスタリングしてもよい。
本発明の別の態様は、情報処理方法である。この方法は、コンピュータが実行する情報処理方法であって、複数の撮影画像を撮影位置情報とともに取得する第1取得ステップと、前記第1取得ステップで取得された前記複数の撮影画像から、抽出対象として設定されている対象物の画像を抽出する抽出ステップと、前記抽出ステップで抽出された複数の対象物画像をクラスタリングするクラスタリングステップと、前記抽出ステップで抽出された前記複数の対象物画像のそれぞれの撮影位置の周辺の施設の名称を、地図情報から取得する第2取得ステップと、各クラスタに関して、当該クラスタに属する複数の対象物画像について前記第2取得ステップで取得された施設名のうち、付与条件を満たした施設名のラベルを、当該クラスタに属する複数の対象物画像に付与する付与ステップと、を備える。前記付与ステップでは、各クラスタに関して、前記付与条件を満たした施設名が前記第2取得ステップで取得されていない対象物画像には、前記ラベルを付与しない。
本発明の別の態様も、情報処理方法である。この方法は、コンピュータが実行する情報処理方法であって、複数の撮影画像を撮影位置情報とともに取得する第1取得ステップと、前記第1取得ステップで取得された前記複数の撮影画像から、抽出対象として設定されている対象物の画像を抽出する抽出ステップと、前記抽出ステップで抽出された複数の対象物画像をクラスタリングするクラスタリングステップと、前記抽出ステップで抽出された前記複数の対象物画像のそれぞれの撮影位置の周辺の施設の名称を、地図情報から取得する第2取得ステップと、各クラスタに関して、当該クラスタに属する複数の対象物画像について前記第2取得ステップで取得された施設名のうち、付与条件を満たした施設名のラベルを、当該クラスタに属する複数の対象物画像に付与する付与ステップと、前記クラスタに属する複数の対象物画像について取得された各施設名が前記付与条件を満たさない場合、当該クラスタに属する複数の対象物画像を再度クラスタリングするステップと、を備える。
本発明によれば、学習用データの作成に要する時間を短縮できる。
第1の実施の形態に係る車両システムの構成を示すブロック図である。 図1の車載装置のブロック図である。 図1のサーバ装置のブロック図である。 図3のクラスタリング部でクラスタリングされた複数の画像の一例を示す図である。 図4の画像の一部にラベルが付与された状態の一例を示す図である。 図3のサーバ装置における画像抽出処理を示すフローチャートである。 図3のサーバ装置におけるラベリング処理を示すフローチャートである。 第2の実施の形態のサーバ装置におけるラベリング処理を示すフローチャートである。
(第1の実施の形態)
図1は、第1の実施の形態に係る車両システム1の構成を示すブロック図である。車両システム1は、複数の車載装置10と、サーバ装置12とを備える。図1では、複数の車載装置10のうち3台の車載装置10を図示している。
車載装置10は、自動車である車両14に搭載されている。車載装置10は、サーバ装置12と無線通信を行う。車載装置10は、図示しない基地局を介してサーバ装置12と無線通信を行ってもよい。
車載装置10は、車載カメラによって撮影された撮影画像をサーバ装置12に順次送信する。撮影画像は、車外の画像であり、例えば、自車両の前方の画像である。
サーバ装置12は、例えばデータセンターに設置され、各車両14の車載装置10から送信された複数の撮影画像を処理する情報処理装置として機能する。後述するように、サーバ装置12は、複数の撮影画像から、抽出対象として設定されている対象物の画像を抽出し、抽出された対象物画像のうちラベルを付与すべき画像にラベルを付与し、ラベルが付与された複数の対象物画像を含む学習用データを作成する。対象物は、施設に関連するものであり、施設の看板、施設の建物などを含む。施設は、地図情報に含まれているものであり、店舗などを含む。ラベルは、施設名を含む。以下では、対象物は店舗の看板であり、ラベルは店舗名を含むことを想定する。
サーバ装置12は、作成した学習用データを用いて機械学習を行うことにより、対象物を画像認識するための画像認識ロジックを、当該対象物の認識精度が高まるように最適化する。たとえば、同一の店舗名の看板に関して、複数の車両で撮影された様々な天候、様々な撮影位置、様々な撮影時刻の対象物画像を用いて学習することで、天候や時間帯に応じて対象物画像の明るさや色などが異なっても、認識精度を高めることができる。画像認識ロジックは、ニューラルネットワークなどの周知の技術を用いて構成できる。最適化された学習済みの画像認識ロジックは、無線通信、有線通信、記録媒体などを用いて車載装置10に供給される。
車載装置10は、供給された画像認識ロジックを用いて、カメラによって撮影された撮影画像から対象物を画像認識する。対象物を画像認識した結果は、様々な用途に用いることができる。たとえば、「牛丼AA」という店舗名の看板の存在を画像認識した場合、ナビゲーションシステムは、『「牛丼AA」の看板がある次の交差点を右に曲がります』などの経路案内を行ってもよい。この例では、より分かりやすい経路案内を行うことができる。
図2は、図1の車載装置10のブロック図である。車載装置10は、カメラ20と、位置情報取得部22と、処理部24と、通信部26とを備える。
カメラ20は、自車両に設置され、車外の画像を連続して撮影する。複数の撮影画像は、動画を構成する。つまり、撮影画像は、静止画であり、フレームと呼ぶこともできる。撮影画像には、撮影時刻が添付される。カメラ20は、撮影した撮影画像を処理部24に順次出力する。
位置情報取得部22は、自車両の位置情報を定期的に取得して、この位置情報を処理部24へ出力する。位置情報は、例えば、図示しないGPS受信部から取得する。位置情報には、取得された時刻が添付される。
処理部24は、カメラ20から出力された撮影画像と、位置情報取得部22から出力された位置情報とにもとづいて、それぞれの撮影画像の撮影位置を導出し、導出した撮影位置の情報を、対応する撮影画像に添付する。たとえば処理部24は、撮影画像の撮影時刻に最も近い時刻に取得された位置情報を、その撮影画像の撮影位置として導出する。
処理部24は、学習済みの画像認識ロジックが車載装置10において取得されている場合、撮影画像内の対象物を画像認識する。処理部24は、撮影画像内に対象物が存在することを画像認識した場合、その対象物の領域が既知対象物の領域であることを示す既知対象物情報を撮影画像に添付する。処理部24は、少なくとも撮影位置情報が添付された撮影画像を通信部26に出力する。
通信部26は、サーバ装置12と無線通信を行う。通信部26は、処理部24から出力された撮影画像を定期的にサーバ装置12に送信する。撮影画像を送信する頻度は、実験などにより適宜定めることができる。
図3は、図1のサーバ装置12のブロック図である。サーバ装置12は、通信部30と、処理部32と、第1記憶部34と、第2記憶部36と、地図情報記憶部38とを備える。処理部32は、第1取得部40と、抽出部42と、クラスタリング部44と、第2取得部46と、付与部48とを有する。
処理部32の構成は、ハードウエア的には、任意のコンピュータのCPU、メモリ、その他のLSIで実現でき、ソフトウエア的にはメモリにロードされたプログラムなどによって実現されるが、ここではそれらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックがハードウエアのみ、ソフトウエアのみ、またはそれらの組合せによっていろいろな形で実現できることは、当業者には理解されるところである。
通信部30は、各車両14の車載装置10から複数の撮影画像を受信する。通信部30は、複数の撮影画像を第1取得部40に出力する。第1取得部40は、通信部30から出力された複数の撮影画像を撮影位置情報とともに取得する。第1取得部40は、撮影画像に既知対象物情報が添付されている場合、既知対象物情報も取得する。
抽出部42は、第1取得部40で取得された複数の撮影画像から、抽出対象として設定されている対象物の画像を抽出し、抽出した対象物画像を第1記憶部34に記憶させる。対象物画像にも、もとの撮影画像の撮影時刻が添付される。
具体的には、抽出部42は、各撮影画像について、画素毎にラベリングを行い、分割対象として設定されている複数の領域に分割する。この処理は、各撮影画像のセグメンテーションを行うともいえる。撮影画像は、たとえば、対象物の領域、空の領域、道路の領域、車の領域、人間の領域などに分割される。対象物の領域は、たとえば看板の領域であることは特定されるが、何の看板を表すかまでは特定されず、様々な看板がまとめて看板の領域として特定される。抽出部42の機能は、SegNetなどの周知の技術を用いて実現することができる。
抽出部42は、各撮影画像について、対象物の領域が存在する場合、その対象物の領域が既知対象物の領域でなければ、その対象物の領域を対象物画像として抽出する。対象物の領域を抽出することで、データ量を削減できる。
抽出部42は、各撮影画像について、対象物の領域が存在しない場合、または、対象物の領域が既知対象物の領域である場合、対象物画像を抽出しない。たとえば看板の領域が存在しても、その看板が、ある店舗名の店舗の看板であることが既に画像認識可能である場合、看板画像は抽出されない。既に画像認識可能な対象物を除外できるので、処理負荷を低減できる。
抽出部42は、既知対象物情報が撮影画像に添付されている場合、既知対象物情報が示す対象物の領域は既知対象物の領域であると判定する。あるいは、抽出部42は、学習済みの画像認識ロジックを用いて撮影画像を画像認識して、対象物の領域が存在することを認識した場合、その対象物の領域は既知対象物の領域であると判定してもよい。
クラスタリング部44は、開始条件が満たされる毎に、第1記憶部34に記憶された複数の対象物画像を、それらの画像の特徴量にもとづいてクラスタリングする。開始条件は、前回のクラスタリングから所定期間が経過したことである。初回のクラスタリングが実施されていない場合、開始条件は、撮影画像の取得開始から所定期間が経過したことである。開始条件は、所定のデータ量の対象物画像が第1記憶部34に蓄積されたことであってもよい。
クラスタリングは、k-meansなどの周知の技術を用いて行うことができる。得られた複数のクラスタのそれぞれには、特徴量が類似する複数の対象物画像が属する。そのため、1つのクラスタ内の複数の対象物画像は類似している。
第2取得部46は、第1記憶部34に記憶された複数の対象物画像のそれぞれの撮影位置の周辺の施設の名称を、地図情報記憶部38に記憶された地図情報から取得する。第2取得部46は、対象物画像の撮影位置から所定距離内の1以上の施設の名称を取得する。そのため、看板の最も近くに看板とは無関係の施設が存在する場合にも、看板が表す店舗名も取得してその対象物画像にラベルを付与できる確率を高めることができる。所定距離は、実験などにより適宜定めることができる。
付与部48は、クラスタリングが行われる毎に、各クラスタに関して、当該クラスタに属する複数の対象物画像について第2取得部46で取得された施設名のうち、付与条件を満たした1つの施設名のラベルを、当該クラスタに属する複数の対象物画像に付与する。付与条件は、クラスタに属する対象物画像の総数に対する施設名の数の割合が基準値以上であることである。基準値は、実験などにより適宜定めることができる。基準値を50%より大きく定めることで、クラスタ内の最大数の施設名が対象物画像に付与される。
付与部48は、各クラスタに関して、付与条件を満たした施設名が第2取得部46で取得されていない対象物画像には、ラベルを付与しない。
付与部48は、ラベルを付与した対象物画像を、第2記憶部36に記憶させる。第2記憶部36に記憶された複数の対象物画像が、前述の学習用データである。付与部48は、ラベルを付与した対象物画像を第1記憶部34から削除する。ラベルが付与されていない対象物画像は第1記憶部34に残るので、次のクラスタリングによってラベルを付与できる可能性がある。
図4は、図3のクラスタリング部44でクラスタリングされた複数の画像の一例を示す図である。クラスタC1には、画像P5、画像P11、画像P100などの複数の対象物画像が属する。クラスタC10には、画像P10、画像P90、画像P1205などの複数の対象物画像が属する。他のクラスタは図示を省略する。
図5は、図4の画像の一部にラベルが付与された状態の一例を示す図である。たとえば、クラスタC1の画像P5,P1100について、撮影位置a1の周辺の施設の名称「牛丼AA」と「コンビニエンスXXX」が取得されたと想定する。画像P11について、撮影位置a50の周辺の施設の名称「焼き肉BB」が取得されたと想定する。施設名「牛丼AA」が付与条件を満たした場合、図5に示すように、施設名「牛丼AA」が取得された画像P5,P1100等には、施設名「牛丼AA」を含むラベルL1が付与される。施設名「牛丼AA」が取得されなかった画像P11等には、ラベルL1が付与されない。
また、たとえば、クラスタC10の画像P10について撮影位置a11の周辺の施設の名称「牛丼C」が取得され、画像P90について撮影位置a5の周辺の施設の名称「YYレストラン」と「ドラッグストアD」が取得され、画像P1205について撮影位置a108の周辺の施設の名称「カフェZ」が取得されたことを想定する。クラスタC10において各施設名が付与条件を満たさない場合、クラスタC10の全ての画像にラベルが付与されない。この場合、クラスタC10についてはクラスタリングが適切に行えていない可能性がある。
クラスタリング部44は、前回のクラスタリングの後で再び開始条件が満たされた場合、第1記憶部34に記憶された複数の対象物画像をクラスタリングする。この場合、第1記憶部34には、前回のクラスタリングではラベルが付与されなかった対象物画像、および、前回のクラスタリングの後で抽出部42で新たに抽出された対象物画像が記憶されている。つまり、あるクラスタに属する複数の対象物画像について取得された各施設名が付与条件を満たさない場合、クラスタリング部44は、当該クラスタに属する複数の対象物画像を再度クラスタリングする。これにより、あるクラスタの全ての対象物画像にラベルが付与されなかった場合に、それらの対象物画像に対して再クラスタリングを適切に行える可能性があり、ラベルが付与される対象物画像の数を増やせる可能性がある。
クラスタリング部44は、撮影時刻が現在時刻より一定時間以上前の対象物画像を除外して、複数の対象物画像をクラスタリングしてもよい。一定時間は、実験などにより適宜定めることができ、たとえば対象物画像に対して複数回のクラスタリングが行われるように定めてもよい。これにより、一定時間以上ラベルが付与されない対象物画像を除外して、処理負荷を低減できる。抽出部42は、撮影時刻が現在時刻より一定時間以上前の対象物画像を、第1記憶部34から削除してもよい。
次に、以上の構成によるサーバ装置12の全体的な動作を説明する。図6は、図3のサーバ装置12における画像抽出処理を示すフローチャートである。抽出部42は、第1取得部40から1枚の撮影画像を取得し(S10)、撮影画像を複数の領域に分割する(S12)。抽出部42は、対象物の領域があり(S14のY)、対象物が既知の対象物でなければ(S16のN)、対象物の領域を抽出し、第1記憶部34に記憶させ(S18)、ステップ10に戻る。対象物の領域がない場合(S14のN)、ステップ10に戻る。対象物が既知対象物である場合(S16のY)、ステップ10に戻る。
図7は、図3のサーバ装置12におけるラベリング処理(アノテーション処理)を示すフローチャートである。図7の処理は、図6の処理と並行して行われる。開始条件が満たされない場合(S30のN)、ステップ30に戻る。開始条件が満たされた場合(S30のY)、クラスタリング部44は、複数の対象物画像をクラスタリングし(S32)、第2取得部46は、複数の対象物画像のそれぞれの撮影位置の周辺の施設の名称を取得する(S34)。ステップ32とステップ34の処理順序は逆でもよい。
付与部48は、判定対象のクラスタを設定し(S36)、設定されたクラスタに関して付与条件を満たした施設名があれば(S38のY)、対象物画像にラベルを付与し(S40)、全クラスタの判定が終了していれば(S42のY)、ステップ30に戻る。ステップ42にて全クラスタの判定が終了していなければ(S42のN)、ステップ36に戻る。ステップ38にて付与条件を満たした施設名がなければ(S38のN)、ステップ42に移る。
本実施の形態によれば、複数の撮影画像から対象物画像を抽出し、複数の対象物画像をクラスタリングして、各クラスタに関して、対象物画像の撮影位置の周辺の施設の名称をもとに対象物画像にラベルを付与するので、ラベルの付与に要する時間を短縮できる。よって、学習用データの作成に要する時間を短縮できる。ユーザがラベルを付与する必要がないので、大規模な学習用データを作成しやすい。
各クラスタに関して、付与条件を満たした施設名が取得されていない対象物画像にはラベルを付与しないので、ラベルの付与精度を高めることができる。
(第2の実施の形態)
第2の実施の形態では、名称が既知である既知対象物の画像を用いて対象物画像にラベルを付与することが、第1の実施の形態と異なる。以下では、第1の実施の形態との相違点を中心に説明する。
車載装置10は、図2の位置情報取得部22を備えておらず、他の構成は図2と同一である。撮影画像の撮影位置情報を利用しないため、処理部24は、撮影画像の撮影位置を導出して撮影画像に添付する処理を行わないことが第1の実施の形態と異なる。
サーバ装置12は、図3の地図情報記憶部38を備えておらず、他の構成は図3と同一である。第2取得部46、クラスタリング部44、付与部48の機能が第1の実施の形態と異なる。
第2取得部46は、名称が既知である既知対象物の画像を、その名称とともに取得する。第2取得部46は、サーバ装置12の操作者の操作に応じて、インターネットを介してウェブ画像の中からラベルの付与を希望する既知対象物の画像を検索し、その画像を取得する。操作者は、ハッシュタグを用いて既知対象物の画像を検索してもよい。既知対象物の画像の数は、1以上であり、数が多いほどラベルの付与精度が向上する。たとえば、施設名「牛丼AA」のラベルを付与したい場合、検索サイトなどで「牛丼AA」の看板の1以上の画像を検索し、取得できる。
クラスタリング部44は、開始条件が満たされる毎に、第1記憶部34に記憶された複数の対象物画像と、第2取得部46で取得された既知対象物画像とを、それらの画像の特徴量にもとづいてクラスタリングする。たとえば、「牛丼AA」の看板画像と、未知の複数の看板画像とをクラスタリングすると、この看板画像と、この看板画像に類似する複数の看板画像とが同一のクラスタに属する。このクラスタの複数の看板画像は、「牛丼AA」の看板画像である確率が高い。
付与部48は、既知対象物画像と同じクラスタに属する複数の対象物画像に、既知対象物画像の名称のラベルを付与する。
図8は、第2の実施の形態のサーバ装置12におけるラベリング処理を示すフローチャートである。図7と同一の処理には同一の符号を付け、適宜説明は省略する。開始条件が満たされた場合(S30のY)、第2取得部46は、既知対象物の画像を取得し(S52)、クラスタリング部44は、既知対象物の画像と対象物画像をクラスタリングする(S54)。
付与部48は、判定対象のクラスタを設定し(S36)、設定されたクラスタに既知対象物画像があれば(S58のY)、そのクラスタの対象物画像にラベルを付与する(S40)。設定されたクラスタに関して、既知対象物画像がなければ(S58のN)、ステップ42に移る。
本実施の形態によれば、学習用データの作成に要する時間を短縮できる。撮影位置情報を用いないので、対象物画像のデータ量を第1の実施の形態よりも小さくできる。
以上、実施の形態をもとに本発明を説明した。実施の形態はあくまでも例示であり、各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
第1の実施の形態では、付与部48は、付与条件を満たした施設名が取得されていない対象物画像にはラベルを付与しない一例について説明したが、付与部48は、各クラスタに関して、付与条件を満たした施設名のラベルを、当該クラスタに属する全ての対象物画像に付与してもよい。この変形例では、処理を簡素化できる。
第1の実施の形態において、車載装置10のカメラ20は、画像を撮影するとともに被写体までの距離を測定してもよい。処理部24は、測定された距離と自車両の位置とにもとづいて被写体の位置を導出し、被写体の位置情報を撮影画像に添付してもよい。サーバ装置12の第2取得部46は、対象物の位置から所定距離内の1以上の施設の名称を取得してもよい。この変形例では、1つの撮影位置の撮影画像から、位置の異なる複数の対象物の画像が取得された場合、対象物画像毎に、より適切な施設名を取得できる可能性がある。
1…車両システム、10…車載装置、12…サーバ装置、20…カメラ、22…位置情報取得部、24…処理部、26,30…通信部、32…処理部、34…第1記憶部、36…第2記憶部、38…地図情報記憶部、40…第1取得部、42…抽出部、44…クラスタリング部、46…第2取得部、48…付与部。

Claims (6)

  1. 複数の撮影画像を撮影位置情報とともに取得する第1取得部と、
    前記第1取得部で取得された前記複数の撮影画像から、抽出対象として設定されている対象物の画像を抽出する抽出部と、
    前記抽出部で抽出された複数の対象物画像をクラスタリングするクラスタリング部と、
    前記抽出部で抽出された前記複数の対象物画像のそれぞれの撮影位置の周辺の施設の名称を、地図情報から取得する第2取得部と、
    各クラスタに関して、当該クラスタに属する複数の対象物画像について前記第2取得部で取得された施設名のうち、付与条件を満たした施設名のラベルを、当該クラスタに属する複数の対象物画像に付与する付与部と、
    を備え
    前記付与部は、各クラスタに関して、前記付与条件を満たした施設名が前記第2取得部で取得されていない対象物画像には、前記ラベルを付与しないことを特徴とする情報処理装置。
  2. 前記クラスタに属する複数の対象物画像について取得された各施設名が前記付与条件を満たさない場合、前記クラスタリング部は、当該クラスタに属する複数の対象物画像を再度クラスタリングすることを特徴とする請求項1に記載の情報処理装置。
  3. 複数の撮影画像を撮影位置情報とともに取得する第1取得部と、
    前記第1取得部で取得された前記複数の撮影画像から、抽出対象として設定されている対象物の画像を抽出する抽出部と、
    前記抽出部で抽出された複数の対象物画像をクラスタリングするクラスタリング部と、
    前記抽出部で抽出された前記複数の対象物画像のそれぞれの撮影位置の周辺の施設の名称を、地図情報から取得する第2取得部と、
    各クラスタに関して、当該クラスタに属する複数の対象物画像について前記第2取得部で取得された施設名のうち、付与条件を満たした施設名のラベルを、当該クラスタに属する複数の対象物画像に付与する付与部と、
    を備え、
    前記クラスタに属する複数の対象物画像について取得された各施設名が前記付与条件を満たさない場合、前記クラスタリング部は、当該クラスタに属する複数の対象物画像を再度クラスタリングすることを特徴とする情報処理装置。
  4. 前記第2取得部は、前記対象物画像の撮影位置から所定距離内の1以上の施設の名称を取得することを特徴とする請求項1から3のいずれかに記載の情報処理装置。
  5. コンピュータが実行する情報処理方法であって、
    複数の撮影画像を撮影位置情報とともに取得する第1取得ステップと、
    前記第1取得ステップで取得された前記複数の撮影画像から、抽出対象として設定されている対象物の画像を抽出する抽出ステップと、
    前記抽出ステップで抽出された複数の対象物画像をクラスタリングするクラスタリングステップと、
    前記抽出ステップで抽出された前記複数の対象物画像のそれぞれの撮影位置の周辺の施設の名称を、地図情報から取得する第2取得ステップと、
    各クラスタに関して、当該クラスタに属する複数の対象物画像について前記第2取得ステップで取得された施設名のうち、付与条件を満たした施設名のラベルを、当該クラスタに属する複数の対象物画像に付与する付与ステップと、
    を備え
    前記付与ステップでは、各クラスタに関して、前記付与条件を満たした施設名が前記第2取得ステップで取得されていない対象物画像には、前記ラベルを付与しないことを特徴とする情報処理方法。
  6. コンピュータが実行する情報処理方法であって、
    複数の撮影画像を撮影位置情報とともに取得する第1取得ステップと、
    前記第1取得ステップで取得された前記複数の撮影画像から、抽出対象として設定されている対象物の画像を抽出する抽出ステップと、
    前記抽出ステップで抽出された複数の対象物画像をクラスタリングするクラスタリングステップと、
    前記抽出ステップで抽出された前記複数の対象物画像のそれぞれの撮影位置の周辺の施設の名称を、地図情報から取得する第2取得ステップと、
    各クラスタに関して、当該クラスタに属する複数の対象物画像について前記第2取得ステップで取得された施設名のうち、付与条件を満たした施設名のラベルを、当該クラスタに属する複数の対象物画像に付与する付与ステップと、
    前記クラスタに属する複数の対象物画像について取得された各施設名が前記付与条件を満たさない場合、当該クラスタに属する複数の対象物画像を再度クラスタリングするステップと、
    を備えることを特徴とする情報処理方法。
JP2018138836A 2018-07-24 2018-07-24 情報処理装置および情報処理方法 Active JP7095455B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018138836A JP7095455B2 (ja) 2018-07-24 2018-07-24 情報処理装置および情報処理方法
US16/412,540 US10956754B2 (en) 2018-07-24 2019-05-15 Information processing apparatus and information processing method
CN201910406037.7A CN110781334B (zh) 2018-07-24 2019-05-16 信息处理设备和信息处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018138836A JP7095455B2 (ja) 2018-07-24 2018-07-24 情報処理装置および情報処理方法

Publications (2)

Publication Number Publication Date
JP2020017027A JP2020017027A (ja) 2020-01-30
JP7095455B2 true JP7095455B2 (ja) 2022-07-05

Family

ID=69178497

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018138836A Active JP7095455B2 (ja) 2018-07-24 2018-07-24 情報処理装置および情報処理方法

Country Status (3)

Country Link
US (1) US10956754B2 (ja)
JP (1) JP7095455B2 (ja)
CN (1) CN110781334B (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010272054A (ja) 2009-05-25 2010-12-02 Nippon Telegr & Teleph Corp <Ntt> 建築物関連情報提供装置、建築物関連情報提供方法および建築物関連情報提供プログラム
JP2012178108A (ja) 2011-02-28 2012-09-13 Seiko Epson Corp 文書情報記録装置、文書情報記録方法、文書情報記録プログラムおよび文書情報記録システム
US20140250126A1 (en) 2013-03-01 2014-09-04 Robert M. Baldwin Photo Clustering into Moments
JP2016048515A (ja) 2014-08-28 2016-04-07 Necソリューションイノベータ株式会社 画像管理装置及び画像管理方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080104011A1 (en) * 2005-06-30 2008-05-01 Takao Shibasaki Retrieval System and Retrieval Method
JP4830696B2 (ja) * 2006-07-31 2011-12-07 オムロン株式会社 物体認識装置、監視システム、物体認識方法、物体認識プログラム、および該プログラムを記録した記録媒体
US20080268876A1 (en) * 2007-04-24 2008-10-30 Natasha Gelfand Method, Device, Mobile Terminal, and Computer Program Product for a Point of Interest Based Scheme for Improving Mobile Visual Searching Functionalities
JP2009074995A (ja) * 2007-09-21 2009-04-09 Univ Of Electro-Communications 移動体情報処理装置、移動体情報処理方法、およびプログラム
US9386339B2 (en) 2008-06-18 2016-07-05 Viap Limited Tagging product information
US20110184953A1 (en) * 2010-01-26 2011-07-28 Dhiraj Joshi On-location recommendation for photo composition
JP2011174896A (ja) * 2010-02-25 2011-09-08 Mitsubishi Heavy Ind Ltd 撮像装置及び撮像方法
JP2012203668A (ja) * 2011-03-25 2012-10-22 Sony Corp 情報処理装置、物体認識方法、プログラム及び端末装置
US20130129142A1 (en) * 2011-11-17 2013-05-23 Microsoft Corporation Automatic tag generation based on image content
US9208171B1 (en) * 2013-09-05 2015-12-08 Google Inc. Geographically locating and posing images in a large-scale image repository and processing framework
US9495614B1 (en) * 2015-02-27 2016-11-15 Google Inc. Verifying labels for images using image recognition
US10817546B2 (en) * 2016-09-15 2020-10-27 Adobe Inc. Labelling of aggregated geolocation tags in a digital mapping system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010272054A (ja) 2009-05-25 2010-12-02 Nippon Telegr & Teleph Corp <Ntt> 建築物関連情報提供装置、建築物関連情報提供方法および建築物関連情報提供プログラム
JP2012178108A (ja) 2011-02-28 2012-09-13 Seiko Epson Corp 文書情報記録装置、文書情報記録方法、文書情報記録プログラムおよび文書情報記録システム
US20140250126A1 (en) 2013-03-01 2014-09-04 Robert M. Baldwin Photo Clustering into Moments
JP2016048515A (ja) 2014-08-28 2016-04-07 Necソリューションイノベータ株式会社 画像管理装置及び画像管理方法

Also Published As

Publication number Publication date
US20200034636A1 (en) 2020-01-30
JP2020017027A (ja) 2020-01-30
CN110781334B (zh) 2023-09-29
US10956754B2 (en) 2021-03-23
CN110781334A (zh) 2020-02-11

Similar Documents

Publication Publication Date Title
US7778447B2 (en) Method and device for mobile object information management, and computer product
BR112020002340A2 (pt) coleta assistida de realidade aumentada
CN111931664A (zh) 混贴票据图像的处理方法、装置、计算机设备及存储介质
CN111881713A (zh) 一种识别违停地点的方法、系统、装置及存储介质
US20080219596A1 (en) Method, apparatus, and program for searching for images
US20210097103A1 (en) Method and system for automatically collecting and updating information about point of interest in real space
CN112232293A (zh) 图像处理模型训练、图像处理方法及相关设备
JP7088136B2 (ja) 標示物認識システム及び標示物認識方法
CN110647603B (zh) 图像标注信息的处理方法、装置和系统
CN106550013A (zh) 一种停车场内数据推送的方法和装置
CN110569856A (zh) 样本标注方法及装置、损伤类别的识别方法及装置
CN111859002A (zh) 兴趣点名称生成方法及装置、电子设备和介质
KR20190124436A (ko) 영상 기반 건물 검색 방법 및 장치
WO2018105122A1 (ja) 教師データ候補抽出プログラム、教師データ候補抽出装置、及び教師データ候補抽出方法
JP7095455B2 (ja) 情報処理装置および情報処理方法
CN112486337B (zh) 笔迹图形分析方法、装置及电子设备
JP2018116553A (ja) 標識認識装置
US11187552B2 (en) Server apparatus and information processing method to process guidance route information acquired from a vehicle
CN112487876A (zh) 智能笔字符识别方法、装置及电子设备
CN112033396B (zh) 用于获得兴趣点周围的引导点的方法、装置、设备与介质
CN115205589A (zh) 对象识别方法、装置、电子设备及存储介质
Kluwak et al. ALPR-extension to traditional plate recognition methods
WO2020045345A1 (ja) 標示物認識システム及び標示物認識方法
JP2008292279A (ja) 文字認識によるデータベース更新を行うナビゲーション装置
CN112434601A (zh) 基于行车视频的车辆违法检测方法、装置、设备及介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211124

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220106

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220524

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220606

R151 Written notification of patent or utility model registration

Ref document number: 7095455

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151