JP2019192209A - ビデオ動画の人工知能のための学習対象イメージパッケージング装置及び方法 - Google Patents

ビデオ動画の人工知能のための学習対象イメージパッケージング装置及び方法 Download PDF

Info

Publication number
JP2019192209A
JP2019192209A JP2018240034A JP2018240034A JP2019192209A JP 2019192209 A JP2019192209 A JP 2019192209A JP 2018240034 A JP2018240034 A JP 2018240034A JP 2018240034 A JP2018240034 A JP 2018240034A JP 2019192209 A JP2019192209 A JP 2019192209A
Authority
JP
Japan
Prior art keywords
learning target
image
learning
original road
target object
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018240034A
Other languages
English (en)
Other versions
JP6700373B2 (ja
Inventor
ウ パク,ミン
Minwoo Park
ウ パク,ミン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Crowdworks Inc Korea
Original Assignee
Crowdworks Inc Korea
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Crowdworks Inc Korea filed Critical Crowdworks Inc Korea
Publication of JP2019192209A publication Critical patent/JP2019192209A/ja
Application granted granted Critical
Publication of JP6700373B2 publication Critical patent/JP6700373B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30248Vehicle exterior or interior
    • G06T2207/30252Vehicle exterior; Vicinity of vehicle
    • G06T2207/30256Lane; Road marking

Abstract

【課題】ビデオ動画の人工知能のための学習対象イメージパッケージング装置及び方法を提供する。【解決手段】前記方法は、オリジナル道路走行映像を受信するオリジナル動画受信段階、前記オリジナル道路走行映像と関連する地域の密集変数に基づいて抽出数を決定し、前記オリジナル道路走行映像から前記決定された数のフレームイメージを抽出する1次サンプリング段階、及び、前記決定された数のフレームイメージそれぞれが第1学習対象オブジェクトを含んでいるか否か、及び、前記第1学習対象オブジェクトの移動量に基づいて、前記決定された数のフレームイメージから1つ以上の学習対象フレームイメージを抽出する2次サンプリング段階を含み、前記オリジナル道路走行映像と関連する地域の密集変数は、前記オリジナル道路走行映像と関連する地域の人口統計データ又は車両統計データのうち1つ以上を含む。【選択図】図1

Description

本発明は、ビデオ動画の人工知能のための学習対象イメージパッケージング装置及び方法に関する。
近年、人工知能(Artificial Intelligence、AI)のトレンドは、音声及びテキスト認識からビデオ映像認識へ技術的に変わりつつある。ビデオ映像の認識は自律走行自動車の制御、ブラックボックス映像、CCTV映像の分析及び医療映像の判読などに使用され得ることから、多様な産業における波及効果が非常に大きい。その中でも4段階の自律走行自動車の研究開発において、全世界的に1、600億kmのビデオ映像データが必要であり、都市別に1億kmの映像が必要であると判断されている。また、ビデオ映像の認識は、収集されたビデオ映像データを映像の知能化に用いるために別途の加工作業を必要とするが、加工作業は人の認知能力に基づいて手作業で行われるため、多くの時間とコストが発生する。
韓国公開特許公報第10-2004-0026825号明細書
そこで、本発明は上記事情に鑑みてなされたものであって、その目的は、ビデオ動画の人工知能のための学習対象イメージパッケージング装置及び方法を提供することにある。
本発明が解決しようとする課題は、以上で言及された課題に限定されず、言及されていない他の課題は、以下の記載から通常の技術者が明確に理解できるはずである。
上述した課題を解決するための本発明の一側面に係るビデオ動画の人工知能のための学習対象イメージパッケージング方法は、オリジナル道路走行映像を受信するオリジナル動画受信段階、前記オリジナル道路走行映像と関連する地域の密集変数に基づいて抽出数を決定し、前記オリジナル道路走行映像から決定された数のフレームイメージを抽出する1次サンプリング段階、及び前記決定された数のフレームイメージのそれぞれが第1学習対象オブジェクトを含んでいるか否か、及び、前記第1学習対象オブジェクトの移動量に基づいて、前記決定された数のフレームイメージから1つ以上の学習対象フレームイメージを抽出する2次サンプリング段階を含み、前記オリジナル道路走行映像と関連する地域の密集変数は、前記オリジナル道路走行映像と関連する地域の人口統計データ又は車両統計データのうち1つ以上を含む。
一実施形態において、前記1次サンプリング段階は、前記オリジナル道路走行映像のメタデータを抽出するメタデータ抽出段階を更に含み、前記オリジナル道路走行映像の前記メタデータに更に基づいて前記抽出数を決定する。
一実施形態において、前記メタデータ抽出段階は、前記オリジナル道路走行映像と関連する前記車両のGPS情報、前記車両の移動速度情報及び前記オリジナル道路走行映像の撮影時間のうち1つ以上を用いて前記オリジナル道路走行映像のメタデータを抽出する。
一実施形態において、前記2次サンプリング段階は、オブジェクト検出アルゴリズムを用いて、それぞれの前記決定された数のフレームイメージ上で予め定められた1つ以上の類型の1つ以上の第1学習対象オブジェクトを検出する第1学習対象オブジェクト検出段階、及び第n(nは2以上の自然数)フレームイメージ上の検出された前記1つ以上の第1学習対象オブジェクトの位置と前記第nフレームイメージの直前の第n-1フレームイメージ上の検出された前記1つ以上の第1学習対象オブジェクトの位置とを比較し、前記第nフレームイメージ上の検出された前記1つ以上の第1学習対象オブジェクトそれぞれの移動量を測定する第1学習対象オブジェクト移動量測定段階を含む。
一実施形態において、前記2次サンプリング段階は、それぞれの前記決定された数のフレームイメージ上で前記第1学習対象オブジェクトを除いた背景を除去する背景除去段階を更に含む。
一実施形態において、前記1つ以上の学習対象フレームイメージを加工処理して学習用データセットを生成する学習用データセット生成段階を更に含む。
一実施形態において、前記学習用データセット生成段階は、前記学習対象フレームイメージ上で予め定められた1つ以上の類型の1つ以上の第2学習対象オブジェクトを検出する第2学習対象オブジェクト検出段階、及び前記学習対象フレームイメージ上の検出された前記1つ以上の第2学習対象オブジェクトに対して注釈化処理を行う学習対象オブジェクト注釈化段階を含む。
一実施形態において、前記学習用データセット生成段階は、前記学習用データセットの有効性を検証する有効性検証段階を更に含む。
上述した課題を解決するための本発明の他の側面に係るビデオ動画の人工知能のための学習対象イメージパッケージング装置は、オリジナル道路走行映像を受信するオリジナル道路走行映像受信部、前記オリジナル道路走行映像と関連する地域の密集変数に基づいて抽出数を決定し、前記オリジナル道路走行映像から前記決定された数のフレームイメージを抽出する第1サンプリング部、及び前記決定された数のフレームイメージそれぞれが第1学習対象オブジェクトを含んでいるか否か及び前記第1学習対象オブジェクトの移動量に基づいて、前記決定された数のフレームイメージから1つ以上の学習対象フレームイメージを抽出する第2サンプリング部を含み、前記オリジナル道路走行映像と関連する地域の密集変数は、前記オリジナル道路走行映像と関連する地域の人口統計データ又は車両統計データのうち1つ以上を含む。
本発明のその他の具体的な事項は、詳細な説明及び図面に含まれている。
本発明のビデオ動画の人工知能のための学習対象イメージパッケージング装置及び方法によれば、第1サンプリング部は、オリジナル道路走行映像と関連する地域の密集変数に基づいてオリジナル道路走行映像を1次サンプリングするため、その後に行われる2次サンプリング段階及び学習用データセット生成段階でデータを処理するのにかかるコストと時間を画期的に短縮することができ、自律走行のための学習対象イメージを抽出する効率を上げることができるという効果を奏する。
また、第2サンプリング部は、第1学習対象オブジェクトの移動量の基準を設定し、事前に決定された基準以上のものに該当するフレームイメージを学習対象フレームイメージとして選定することによって、不要なフレームイメージは低減し、必要なフレームイメージのみを選定することができる。
更に、1次サンプリング及び2次サンプリングを通じて核心的なフレームイメージのみを学習対象フレームイメージとして抽出することによって、学習対象フレームイメージの数が少ないにも拘らず、サンプリングのないフレームイメージに対して同等な水準の性能を有する自律走行のための学習対象イメージが抽出されるようにすることができる。
本発明の効果は、以上で言及された効果に制限されず、言及されていない他の効果は、以下の記載から通常の技術者が明確に理解できるはずである。
本発明の一実施形態に係るビデオ動画の人工知能のための学習対象イメージパッケージング方法の概略的なフローチャートである。 本発明の一実施形態に係る図1の1次サンプリング段階により抽出されたフレームイメージの例示図である。 図1の2次サンプリング段階の概略的なフローチャートである。 図1の2次サンプリング段階で第1学習対象オブジェクトの移動量を測定するための方法を説明する例示図である。 背景除去段階が追加された図1の2次サンプリング段階の概略的なフローチャートである。 背景除去段階が追加された図1の2次サンプリング段階で背景が除去されたフレームイメージを用いて第1学習対象オブジェクトの移動量を測定するための方法を説明する例示図である。 本発明の他の実施形態に係るメタデータ抽出段階が追加されたビデオ動画の人工知能のための学習対象イメージパッケージング方法の概略的なフローチャートである。 本発明の他の実施形態に係る学習用データセット生成段階が追加されたビデオ動画の人工知能のための学習対象イメージパッケージング方法の概略的なフローチャートである。 図8の学習用データセット生成段階の概略的なフローチャートである。 有効性検証段階が追加された図8の学習用データセット生成段階の概略的なフローチャートである。 図10の有効性検証段階の概略的なフローチャートである。 本発明の他の実施形態に係るビデオ動画の人工知能のための学習対象イメージパッケージング装置の概略的な構成図である。
本発明の利点及び特徴、そしてそれらを達成する方法は、添付の図面と共に詳細に後述されている実施形態を参照すれば明確になるはずである。しかし、本発明は、以下で開示される実施形態に限定されるものではなく、互いに異なる多様な形態で実現することができる。但し、本実施形態は、本発明の開示を完全なものにし、本発明が属する技術分野における通常の技術者に本発明の範疇を完全に理解させるために提供されるものであり、本発明は、特許請求の範囲の範疇により定義されるに過ぎない。
本明細書で用いられる用語は、実施形態を説明するためのものであり、本発明を制限しようとするものではない。本明細書において、単数形は特に言及しない限り複数形も含む。明細書で用いられる「含む(comprises)」及び/又は「含んでいる(comprising)」は、言及された構成要素以外に1つ以上の他の構成要素の存在又は追加を排除しない。明細書全体に亘って同一の図面符号は同一の構成要素を示し、「及び/又は」は言及された構成要素のぞれぞれ及び1つ以上のあらゆる組み合わせを含む。たとえ、「第1」、「第2」などが多様な構成要素を叙述するために用いられていても、これらの構成要素は、これらの用語により制限されないのはもちろんである。これらの用語は、単に1つの構成要素を他の構成要素と区別するために用いられるに過ぎない。従って、当然、以下で言及される第1構成要素は、本発明の技術的思想内で第2構成要素と表すこともできる。
他の定義がなければ、本明細書で用いられる全ての用語(技術及び科学的用語を含む)は、本発明が属する技術分野における通常の技術者が共通して理解できる意味として使用される。また、一般に用いられる辞典に定義されている用語は、明白に特に定義されていない限り、理想的に又は過度に解釈されない。
以下、添付の図面を参照して本発明の実施形態を詳細に説明する。
図1は、本発明の一実施形態に係るビデオ動画の人工知能のための学習対象イメージパッケージング方法の概略的なフローチャートである。
図1を参照すれば、ビデオ動画の人工知能のための学習対象イメージパッケージング方法は、オリジナル動画受信段階(S100)、1次サンプリング段階(S200)及び2次サンプリング段階(S300)を含む。
段階S100で、オリジナル道路走行映像受信部610は、オリジナル道路走行映像を受信する。オリジナル道路走行映像は、車両の内外部、車道などに設けられているカメラで収集される動画である。例えば、自動車の自律走行のための人工知能映像学習データを生成するためにオリジナル道路走行映像を受信する場合、オリジナル道路走行映像は、自律走行のための学習データの生成のためにカメラを取り付けた自動車から獲得した動画など、自律走行のための学習データの生成が可能な映像を全て含むことができ、これに制限されない。
段階S200で、第1サンプリング部620は、オリジナル道路走行映像と関連する密集変数に基づいて抽出数を決定し、オリジナル道路走行映像から決定された数のフレームイメージを抽出する。密集変数は、特定地域と関連して人口又は車両が密集している程度を示す。例えば、密集変数が相対的に高ければ、該当地域の自律走行のためには相対的に多くのデータの学習が必要であると解析できる。
オリジナル道路走行映像と関連する地域の密集変数は、オリジナル道路走行映像と関連する地域の人口統計データ又は車両統計データのうち1つ以上を含む。密集変数算出部(図示せず)は、特定地域に対する人口統計データ又は車両統計データのうち1つ以上を用いて特定地域の密集変数を算出する。人口統計データは、道路走行映像が撮影された位置及び時間に対応する人口密度、人口分布及び流動人口のうち少なくとも1つを含むことができるが、これに制限されない。また、車両統計データは、道路走行映像が撮影された位置及び時間に対応する車両登録台数、時間帯別交通量の統計及び公共交通機関の分布のうち少なくとも1つを含むことができるが、これに制限されない。
第1サンプリング部620は、密集変数が所定の基準以上である場合、フレームイメージを所定の基準以上の数だけ抽出する。例えば、密集変数が1ないし10の値を有することができると仮定する。この場合、第1サンプリング部620は、密集変数が10で相対的に高い地域では1秒当たり30のフレームイメージを抽出し、密集変数が5で相対的に低い地域では1秒当たり15のフレームイメージを抽出することができる。
第1サンプリング部620は、公共データサーバを介して、人口統計データ又は車両統計データに該当する密集変数の提供を受けることができるが、これに制限されない。
段階S300で、第2サンプリング部630は、決定された数のフレームイメージそれぞれが第1学習対象オブジェクトを含んでいるか否か、及び、第1学習対象オブジェクトの移動量に基づいて、決定された数のフレームイメージから1つ以上の学習対象フレームイメージを抽出する。2次サンプリング段階(S300)は、図5を用いてより具体的に説明する。
図2は、本発明の一実施形態に係る図1の1次サンプリング段階により抽出されたフレームイメージの例示図である。
図2を参照すれば、フレームイメージは1次サンプリング段階(S200)により、例えば、60fps(frame per second)、30fps又は1fpsにてフレームイメージを抽出できる。
段階S200で、第1サンプリング部620は、オリジナル道路走行映像と関連する密集変数に基づいて抽出数を決定し、オリジナル道路走行映像から決定された数のフレームイメージを抽出する。例えば、オリジナル道路走行映像のフレームレート(frame rate)が60fpsである場合、第1サンプリング部620は、オリジナル道路走行映像のメタデータによって1秒当たり60個、30個又は1個のフレームを抽出することができる。
段階S200で、第1サンプリング部620は、オリジナル道路走行映像と関連する密集変数に基づいて、オリジナル道路走行映像を1次サンプリングするため(即ち、不要なデータを除去して2次サンプリング段階に伝達されるデータの量を減少させるため)、その後に行われる2次サンプリング段階(S300)及び学習用データセット生成段階(S500)でデータを処理するのにかかるコストと時間を画期的に短縮することができる。
図3は、図1の2次サンプリング段階の概略的なフローチャートである。
図3を参照すれば、2次サンプリング段階(S300)は、第1学習対象オブジェクト検出段階(S310)及び第1学習対象オブジェクト移動量測定段階(S320)を含む。
段階S310で、第2サンプリング部630は、オブジェクト検出アルゴリズムを用いて、それぞれの決定された数のフレームイメージ上で予め定められた1つ以上の類型の1つ以上の第1学習対象オブジェクトを検出する。
第1学習対象オブジェクトは、フレームイメージに含まれているオブジェクトである。フレームイメージには1つ以上の第1学習対象オブジェクトが含まれ、1つ以上の類型の第1学習対象オブジェクトが含まれる。例えば、第1学習対象オブジェクトは、人、自動車、自転車、建物、電信柱、オートバイ、木、花、子犬、猫、道路、交通表示板、過速防止用段差、ロードコーン、車線などを含むことができるが、前記例に限定されず、オブジェクトとして区別が可能なものを全て含む。また、第1学習対象オブジェクトの類型は、オブジェクトの前面、後面、右側面、左側面などを含むが、各学習対象オブジェクトの類型は、前記例に限定されず、前記例よりも細分化させて区分することができ、前記例とは全く異なる類型として区分することができる。
第1学習対象オブジェクトの検出として1つ以上の類型の1つ以上のオブジェクトを検出することは、オブジェクト検出アルゴリズムを用いて検出することであり、オブジェクト検出アルゴリズムは、R-CNNモデルを含むことができるが、これに制限されない。
段階S320で、第2サンプリング部630は、第n(nは2以上の自然数)フレームイメージ上の検出された1つ以上の第1学習対象オブジェクトの位置と、第nフレームイメージの直前の第n-1フレームイメージ上の検出された1つ以上の第1学習対象オブジェクトの位置とを比較し、第nフレームイメージ上の検出された1つ以上の第1学習対象オブジェクトのそれぞれの移動量を測定する。
学習対象フレームイメージを抽出する方法は、検出された1つ以上の第1学習対象オブジェクトの移動量が事前に決定された基準以上であるかを判断し、検出された1つ以上の第1学習対象オブジェクトのうち、予め定められた数以上の第1学習対象オブジェクトの移動量が、事前に決定された基準以上である場合、該当フレームイメージを学習対象フレームイメージとして選定する。しかし、検出された1つ以上の第1学習対象オブジェクトのうち、予め定められた数以上の第1学習対象オブジェクトの移動量が、事前に決定された基準以上に該当しない場合、該当フレームイメージを学習対象フレームイメージとして選定しない。
第1学習対象オブジェクトの移動量の基準を設定し、事前に決定された基準以上のものに該当するフレームイメージを学習対象フレームイメージとして選定することによって、不要なフレームイメージを低減し、必要なフレームイメージのみを選定することができる。
従って、学習対象フレームイメージは、抽出されたフレームイメージの全てが学習対象フレームイメージとして選定されず、オブジェクトの移動量が少なく、学習において影響が大きくないフレームイメージを除いて残りのフレームイメージのみ学習対象フレームイメージとして選定することによって、以後の段階で学習データセットの量を低減することができる。従って、人工知能モジュールの学習において、量が減少した学習データセットを用いて学習にかかる時間を短縮できる。
他の実施形態において、第2サンプリング部630は、フレームイメージから交通統制オブジェクトの有無を判断し、該当交通統制オブジェクトが事前に決定された基準に符合する場合、交通統制オブジェクトに更に基づいて、フレームイメージから1つ以上の学習対象フレームイメージを抽出する。交通統制オブジェクトは、フレームイメージ上の信号機、交通安全標識、交通安全線及び道路附帯施設などであり得るが、これに制限されない。例えば、第2サンプリング部630は、フレームイメージから信号機が検出され、該当信号機が赤信号から青信号に変わった場合に、該当フレームイメージ全部を学習対象フレームとして抽出し、該当信号機が赤信号に維持される場合には、1秒当たりのフレームイメージの数を半分にして該当フレームイメージの中から一部のみを学習対象フレームとして抽出することができる。
他の実施形態において、第2サンプリング部630は、オリジナル道路走行映像から撮影する時、車両の内部音及び外部音のうち少なくとも1つを抽出し、車両の内部音及び外部音の周波数が所定の基準範囲内である場合、車両の内部音及び外部音のうち少なくとも1つに更に基づいて、フレームイメージから1つ以上の学習対象フレームイメージを抽出する。例えば、第2サンプリング部630は、ブラックボックスの道路走行映像からオーディオデータを抽出し、該当オーディオデータから叫び声が検出される場合、1秒当たり30の学習対象フレームを抽出し、何らの音も検出されない場合、1秒当たり15の学習対象フレームを抽出することができる。
第1学習対象オブジェクト移動量測定段階(S320)を、図4を用いて具体的に説明する。
図4は、図1の2次サンプリング段階で第1学習対象オブジェクトの移動量を測定するための方法を説明する例示図である。
図4を参照すれば、第1学習対象オブジェクト移動量測定段階(S320)での移動量の測定方法が示されている。図4(a)は第n-1フレームイメージ11、図4(b)は第nフレームイメージ12を示す。
第1学習対象オブジェクトの移動量測定は、第n-1フレームイメージ11上での第1学習対象オブジェクト21と、第nフレームイメージ12上での第1学習対象オブジェクト22の位置を比較するものである。
第n-1フレームイメージ11上での第1学習対象オブジェクト21と第nフレームイメージ12上での第1学習対象オブジェクト22は、同一形態のオブジェクトであって、第1学習対象オブジェクトの同一位置に該当する部分をまず選定する。
第1学習対象オブジェクトの同一位置に該当する部分の選定は、コンピュータが第n-1フレームイメージ11上の第1学習対象オブジェクト21で特定部分をAに選定したとするとき、第nフレームイメージ12上の第1学習対象オブジェクト22上でAと同一位置に該当する部分をA’に選定する。
コンピュータは、第1学習対象オブジェクトの同一位置に該当する部分を選定した後、第n-1フレームイメージ11と第nフレームイメージ12を同一平面上に置いた後、A及びA’に対する座標を抽出する。
コンピュータはA及びA’に対する座標を抽出した後、A座標及びA’座標の差を用いて移動量を測定する。
図5は、背景除去段階が追加された図1の2次サンプリング段階の概略的なフローチャートである。
図5を参照すれば、背景除去段階(S330)は、第1学習対象オブジェクト検出段階(S310)の後に行われる。
段階S330で、第2サンプリング部630は、それぞれの決定された数のフレームイメージ上で第1学習対象オブジェクトを除いた背景を除去する。
背景除去段階(S330)は、フレームイメージ上で検出された第1学習対象オブジェクトを除いたものなどを背景として処理し、背景部分を全て除去する。背景部分の除去は、背景に該当する領域のピクセルの値をnull状態にするか、所定の特殊な値に処理することを含むことができる。例えば、背景に該当する領域のピクセルのグレー(gray)を0グレー又は256グレーに処理することができるが、これに制限されない。
背景除去段階(S330)が追加された2次サンプリング段階(S300)を、図6を用いて具体的に説明する。
図6は、背景除去段階が追加された図1の2次サンプリング段階で背景が除去されたフレームイメージを用いて、第1学習対象オブジェクトの移動量を測定するための方法を説明する例示図である。
図6を参照すれば、図6(a)は1次サンプリング段階(S200)により抽出されたフレームイメージ10を示しており、フレームイメージ10は第1学習対象オブジェクト20及び背景30を含む。
図6を参照すれば、図6(b)は、図6(a)のフレームイメージ10において、背景除去段階(S330)により背景30が除去されたことを示す図であって、フレームイメージ10は第1学習対象オブジェクト20のみを含む。
図6を参照すれば、図6(c)は、第n(nは2以上の自然数)フレームイメージ上の検出された1つ以上の第1学習対象オブジェクト21の位置と、第nフレームイメージの直前の背景が除去された第n-1フレームイメージ上の検出された1つ以上の第1学習対象オブジェクト22の位置とを比較することを示す図である。
コンピュータは、それぞれの第1学習対象オブジェクト21、22間の比較を通じて、第1学習対象オブジェクトの移動量を測定することができる。
第1学習対象オブジェクト21、22の位置比較を通じて、移動量を測定した後、コンピュータは、検出された1つ以上の第1学習対象オブジェクト20のうち、予め定められた数以上の第1学習対象オブジェクトの移動量が、予め定められた基準以上である場合には、第nフレームイメージを学習対象フレームイメージとして選定し、そうでない場合には、第nフレームイメージを学習対象フレームイメージとして選定しない。
例えば、コンピュータは、第1フレームイメージ上で検出された第1学習対象オブジェクトと、第2フレームイメージ上で検出された第1学習対象オブジェクトの移動量とを比較して、移動量が予め定められた基準以上である場合には、第2フレームイメージを学習対象フレームイメージとして選定する。移動量が予め定められた基準以上に該当しない場合には、第2フレームイメージを学習対象フレームイメージとして選定しない。
また、コンピュータは、第2フレームイメージを学習対象フレームイメージとして選定又は選定しないことに止まらず、再び第2フレームイメージ上で検出された第1学習対象オブジェクトと、第3フレームイメージ上で検出された第1学習対象オブジェクトの移動量を比較し、移動量が予め定められた基準以上である場合には、第3フレームイメージを学習対象フレームイメージとして選定する。
フレームイメージ上の第1学習対象オブジェクトの移動量を測定し、学習対象フレームイメージとして選定又は選定しない段階は、第n(nは2以上の自然数)フレームイメージ上の検出された1つ以上の第1学習対象オブジェクトと、第n-1フレームイメージ上の検出された1つ以上の第1学習対象オブジェクトの位置とを比較するものであって、抽出された全てのフレームイメージ上の検出された1つ以上の第1学習対象オブジェクトに対して比較し、学習対象フレームとして選定又は選定しないことが完了するまで繰り返される。
第1学習対象オブジェクト20は1つ以上であって、コンピュータは、1つのフレームイメージ10上に複数の第1学習対象オブジェクト20がある場合には、それぞれの第1学習対象オブジェクト20を比較し、それぞれの第1学習対象オブジェクト20の移動量を測定する。
例えば、1つのフレームイメージ10上に複数の第1学習対象オブジェクト20を含む場合、コンピュータは、複数の第1学習対象オブジェクト20全部の移動量を測定し、予め定められた数の第1学習対象オブジェクト20の移動量が予め定められた基準以上である場合、該当フレームイメージ10を学習対象フレームイメージとして選定する。
一実施形態において、コンピュータは、複数の第1学習対象オブジェクト20全部の移動量を測定し、複数の第1学習対象オブジェクト20全部の移動量が予め定められた基準以上である場合、該当フレームイメージ10を学習対象フレームイメージとして選定する。
他の実施形態において、コンピュータは、複数の第1学習対象オブジェクト20のうち、予め定められた数の第1学習対象オブジェクト20の移動量のみを測定し、測定した第1学習対象オブジェクト20の移動量のうち、予め定められた数の第1学習対象オブジェクト20の移動量が予め定められた基準以上である場合、該当フレームイメージ10を学習対象フレームイメージとして選定する。
更に他の実施形態において、コンピュータは、複数の第1学習対象オブジェクト20のうち、予め定められた数の第1学習対象オブジェクト20の移動量のみを測定し、測定した第1学習対象オブジェクト20全部の移動量が予め定められた基準以上である場合、該当フレームイメージ10を学習対象フレームイメージとして選定する。
図6(c)の移動量の測定により選定された学習対象フレームイメージとして、図6(d)に示すように、抽出されたフレームイメージ11、12、13、14、15の中から、学習対象フレームイメージ12、14が選定される。
図7は、本発明の他の実施形態に係るメタデータ抽出段階が追加されたビデオ動画の人工知能のための学習対象イメージパッケージング方法の概略的なフローチャートである。
図7を参照すれば、メタデータ抽出段階(S400)は、オリジナル動画受信段階(S100)の後に行われる。
段階S400で、メタデータ抽出部640は、オリジナル道路走行映像と関連する車両のGPS情報、車両の移動速度情報、及び、オリジナル道路走行映像の撮影時間のうち1つ以上を用いて、オリジナル道路走行映像のメタデータを抽出する。
第1サンプリング部は、密集変数以外にも、オリジナル道路走行映像のメタデータに更に基づいて抽出数を決定し、オリジナル道路走行映像から決定された数のフレームイメージを抽出する。オリジナル道路走行映像のメタデータは、オリジナル道路走行映像と関連する車両のGPS情報、車両の移動速度情報、及び、オリジナル道路走行映像の撮影時間のうち1つ以上を含む。
一実施形態において、第1サンプリング部620は、オリジナル道路走行映像のメタデータの車両のGPS情報に更に基づいて、前記車両のGPS情報が事前に決定された地域に含まれる場合、該当地域に相応する数のフレームイメージを抽出する。例えば、第1サンプリング部620は、車両が賑やかなA地域にある場合、1秒当たり30のフレームを抽出し、車両が閑静なB地域にある場合、1秒当たり15のフレームを抽出することができる。
一実施形態において、第1サンプリング部620は、オリジナル道路走行映像のメタデータの車両移動速度情報に更に基づいて、車両の移動速度が事前に決定された速度範囲内にある場合、該当速度範囲に相応する数のフレームイメージを抽出する。例えば、第1サンプリング部620は、車両の移動速度が相対的に高速である100km/hの場合、1秒当たり30のフレームを抽出し、車両の移動速度が相対的に低速である50km/hの場合、1秒当たり15のフレームを抽出することができる。
一実施形態において、第1サンプリング部620は、オリジナル道路走行映像のメタデータの撮影時間に更に基づいて、車両の移動時間が事前に決定された時間範囲内にある場合、該当時間範囲に相応する数のフレームイメージを抽出する。例えば、第1サンプリング部620は、車両の移動が混雑する出退勤時間である7時から9時又は18時から20時までの場合、1秒当たり30のフレームを抽出し、車両の移動が閑散な明け方である1時から5時までの場合、1秒当たり15のフレームを抽出することができる。
他の実施形態において、第1サンプリング部620は、オリジナル道路走行映像のメタデータの撮影時間に相応する天気情報に更に基づいて、天気情報が事前に決定された天気に含まれる場合、該当天気に相応する数のフレームイメージを抽出する。例えば、第1サンプリング部620は、撮影時間に相応する天気情報が曇り、強風、暴雨、大雪などである場合、1秒当たり30のフレームを抽出し、天気情報が晴れである場合、1秒当たり15のフレームを抽出することができる。
図8は、本発明の他の実施形態に係る学習用データセット生成段階が追加されたビデオ動画の人工知能のための学習対象イメージパッケージング方法の概略的なフローチャートである。
図8を参照すれば、学習用データセット生成段階(S500)は、2次サンプリング段階(S300)の後に行われる。
段階S500で、学習用データセット生成部650は、1つ以上の学習対象フレームイメージを加工処理して学習用データセットを生成する。段階S500を、図9を用いて具体的に説明する。
図9は、図8の学習用データセット生成段階の概略的なフローチャートである。
図9を参照すれば、学習用データセット生成段階(S500)は、第2学習対象オブジェクト検出段階(S510)及び第2学習対象オブジェクト注釈化段階(S520)を含む。
段階S510で、学習用データセット生成部650は、学習対象フレームイメージ上で予め定められた1つ以上の類型の1つ以上の第2学習対象オブジェクトを検出する。
第2学習対象オブジェクトは、学習対象フレームイメージに含まれているオブジェクトである。学習対象フレームイメージには1つ以上の第2学習対象オブジェクトが含まれ、1つ以上の類型の第1学習対象オブジェクトが含まれる。例えば、第2学習対象オブジェクトは、人、自動車、自転車、建物、電信柱、オートバイ、木、花、子犬、猫、道路、交通表示板、過速防止用段差、ロードコーン、車線などを含むことができるが、前記例に限定されず、オブジェクトとして区別が可能なものを全て含む。また、第2学習対象オブジェクトの類型は、オブジェクトの前面、後面、右側面、左側面などを含むが、各学習対象オブジェクトの類型は、前記例に限定されず、前記例よりも細分化させて区分することができ、前記例とは全く異なる類型として区分することができる。
上述した段階S300で、第1学習対象オブジェクトの検出が人工知能の学習のためのイメージの選別、即ち学習対象フレームイメージの選別のためのものであったならば、段階S510で第2学習対象オブジェクトの検出は、注釈化処理のための対象の選別のためのものである。
第2学習対象オブジェクトの検出として、1つ以上の類型の1つ以上のオブジェクトを検出することは、オブジェクト検出アルゴリズムを用いて検出することであり、オブジェクト検出アルゴリズムは、R-CNNモデルを含むことができるが、これに制限されない。
段階S520で、学習用データセット生成部650は、学習対象フレームイメージ上の検出された1つ以上の第2学習対象オブジェクトに対して、注釈化処理を行う。
注釈化処理は、学習対象フレームイメージ上の検出された第2学習対象オブジェクトを説明するデータの生成作業を意味する。注釈化処理は、第2学習対象オブジェクトに対してラベリング(labeling)、カラーリング(coloring)又はレイヤリング(layering)を行うことを含む。また、第2学習対象オブジェクトが何かを表示することを全て、注釈化処理として含めることができる。例えば、学習対象フレームイメージ上の検出された1つ以上の第2学習対象オブジェクトを、ボックス(box)などの形態で領域を区分して表示することができる。注釈化処理は、自動処理される道具を活用することができる。
第2学習対象オブジェクトを区分して表示した領域に対して、各第2学習対象オブジェクトが何かについて説明を作成することができ、ラベリングは1つの単語で作成されてもよく、1つの単語ではなく、文章で詳細に作成されてもよい。
注釈化処理は、1つ以上の作業者がラベリング、カラーリング又はレイヤリングした情報をデータベース化し、コンピュータにより学習されたモジュールを生成し、学習されたモジュールにより、新たに入ってきた学習対象フレームイメージ上の第2学習対象オブジェクトが、データベース化された第2学習対象オブジェクトと類似しているかを判断することによって、該当第2学習対象オブジェクトにラベリング、カラーリング又はレイヤリングを行うことができる。
他の実施形態において、学習用データセット生成部650は、映像処理を用いて学習対象フレームイメージ上の検出された1つ以上の第2学習対象オブジェクトの重要度を判断し、重要度が所定の基準以上である場合、該当第2学習対象オブジェクトに対する注釈情報を生成できる。学習用データセット生成部650は、1つ以上の第2学習対象オブジェクトがある場合、重要度が高い第2学習対象オブジェクトに対してのみ注釈情報を生成できる。例えば、学習対象フレームイメージ上に、自動車、信号機がある場合、該当自動車、信号機を重要度が高いと判断し、該当学習した自動車、信号機に対してのみ注釈情報を生成できる。
図10は、有効性検証段階が追加された図8の学習用データセット生成段階の概略的なフローチャートである。
図10を参照すれば、有効性検証段階(S530)は、学習対象オブジェクト注釈化段階の後に行われる。
段階S530で、検査者は、学習用データセットの有効性を検証する。検査者端末は、ビデオ動画の人工知能のための学習対象イメージパッケージング装置600から学習用データセットを受信する。段階S530を、図11を用いて具体的に説明する。
図11は、図10の有効性検証段階の概略的なフローチャートである。
図11を参照すれば、有効性検証段階(S530)は、学習用データセットの検査を要請する段階(S531)及び学習用データセットを検査する段階(S532)を含む。
段階S531で、ビデオ動画の人工知能のための学習対象イメージパッケージング装置600は、検査者端末に検査を要請する。
段階S532で、検査者端末を介して、検査者は、学習用データセットを受信し、検査を行う。
一実施形態において、検査者端末は、学習用データセットの検査結果、学習用データセットの信頼度が所定の基準以上である場合、該当学習用データセットと該当信頼度をビデオ動画の人工知能のための学習対象イメージパッケージング装置600に送信する。従って、ビデオ動画の人工知能のための学習対象イメージパッケージング装置600は、該当学習用データセットが人工知能モジュールに用いるのに適したデータセットであることを確認することができる。
一実施形態において、学習用データセットの検査結果、学習用データセットの信頼度が所定の基準未満である場合、該当学習用データセットを返却する。その後、検査者端末は、ビデオ動画の人工知能のための学習対象イメージパッケージング装置600に該当学習用データセットの再作業を要請する。ビデオ動画の人工知能のための学習対象イメージパッケージング装置600により再作業された学習用データセットは、段階S531ないしS532の段階により再検査を受ける。
図12は、本発明の他の実施形態に係るビデオ動画の人工知能のための学習対象イメージパッケージング装置の概略的な構成図である。
図12を参照すれば、ビデオ動画の人工知能のための学習対象イメージパッケージング装置600は、オリジナル道路走行映像受信部610、第1サンプリング部620、第2サンプリング部630、メタデータ抽出部640及び学習用データセット生成部650を含む。
図12のビデオ動画の人工知能のための学習対象イメージパッケージング装置600の構成要素は、図1ないし図11を参照して説明した方法の構成要素に相応する。オリジナル道路走行映像受信部610は、オリジナル動画受信段階(S100)、第1サンプリング部620は、1次サンプリング段階(S200)、第2サンプリング部630は、2次サンプリング段階(S300)、メタデータ抽出部640は、メタデータ抽出段階(S400)、学習用データセット生成部650は、学習用データセット生成段階(S500)を行うことができる。以下、装置600の各構成要素の機能又は動作を説明するにおいて、重複する説明は省略する。
オリジナル道路走行映像受信部610は、オリジナル道路走行映像を受信する。
第1サンプリング部620は、オリジナル道路走行映像と関連する地域の密集変数に基づいて、抽出数を決定し、オリジナル道路走行映像から決定された数のフレームイメージを抽出する。
オリジナル道路走行映像と関連する地域の密集変数は、オリジナル道路走行映像と関連する地域の人口統計データ又は車両統計データのうち1つ以上を含む。
第2サンプリング部630は、決定された数のフレームイメージそれぞれが第1学習対象オブジェクトを含んでいるか否か、及び、第1学習対象オブジェクトの移動量に基づいて、決定された数のフレームイメージから1つ以上の学習対象フレームイメージを抽出する。
メタデータ抽出部640は、オリジナル道路走行映像のメタデータを抽出する。
学習用データセット生成部650は、1つ以上の学習対象フレームイメージを加工処理して学習用データセットを生成する。
本発明の実施形態と関連して説明された方法又はアルゴリズムの段階は、ハードウェアで直接実現するか、ハードウェアにより実行されるソフトウェアモジュールで実現するか、又はこれらの結合により実現することができる。ソフトウェアモジュールは、RAM(Random Access Memory)、ROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、フラッシュメモリ(Flash Memory)、ハードディスク、脱着型ディスク、CD-ROM又は本発明が属する技術分野において周知されている任意の形態のコンピュータ読み取り可能な記録媒体に存在することもできる。
以上、添付の図面を参照して本発明の実施形態を説明したが、本発明が属する技術分野における通常の技術者は、本発明がその技術的思想や必須の特徴を変更することなく、他の具体的な形態で実施され得ることが理解できるはずである。従って、以上で記述した実施形態はあらゆる面で例示的なものであり、制限的ではないものとして理解すべきである。
600 ビデオ動画の人工知能のための学習対象イメージパッケージング装置
610 オリジナル道路走行映像受信部
620 第1サンプリング部
630 第2サンプリング部
640 メタデータ抽出部
650 学習用データセット生成部

Claims (10)

  1. オリジナル道路走行映像を受信するオリジナル動画受信段階と、
    前記オリジナル道路走行映像と関連する地域の密集変数に基づいて抽出数を決定し、前記オリジナル道路走行映像から前記決定された数のフレームイメージを抽出する1次サンプリング段階と、
    前記決定された数のフレームイメージそれぞれが第1学習対象オブジェクトを含んでいるか否か、及び、前記第1学習対象オブジェクトの移動量に基づいて、前記決定された数のフレームイメージから1つ以上の学習対象フレームイメージを抽出する2次サンプリング段階と、を含み、
    前記オリジナル道路走行映像と関連する地域の密集変数は、前記オリジナル道路走行映像と関連する地域の人口統計データ又は車両統計データのうち1つ以上を含む、ビデオ動画の人工知能のための学習対象イメージパッケージング方法。
  2. 前記1次サンプリング段階は、
    前記オリジナル道路走行映像のメタデータを抽出するメタデータ抽出段階を更に含み、
    前記オリジナル道路走行映像の前記メタデータに更に基づいて、前記抽出数を決定することを特徴とする、請求項1に記載のビデオ動画の人工知能のための学習対象イメージパッケージング方法。
  3. 前記メタデータ抽出段階は、
    前記オリジナル道路走行映像と関連する車両のGPS情報、車両の移動速度情報、及び、前記オリジナル道路走行映像の撮影時間のうち1つ以上を用いて、前記オリジナル道路走行映像のメタデータを抽出することを特徴とする、請求項2に記載のビデオ動画の人工知能のための学習対象イメージパッケージング方法。
  4. 前記2次サンプリング段階は、
    オブジェクト検出アルゴリズムを用いて、それぞれの前記決定された数のフレームイメージ上で予め定められた1つ以上の類型の1つ以上の第1学習対象オブジェクトを検出する第1学習対象オブジェクト検出段階と、
    第n(nは2以上の自然数)フレームイメージ上の検出された前記1つ以上の第1学習対象オブジェクトの位置と、前記第nフレームイメージの直前の第n-1フレームイメージ上の検出された前記1つ以上の第1学習対象オブジェクトの位置とを比較し、前記第nフレームイメージ上の検出された前記1つ以上の第1学習対象オブジェクトそれぞれの移動量を測定する第1学習対象オブジェクト移動量測定段階と、
    を含むことを特徴とする、請求項1に記載のビデオ動画の人工知能のための学習対象イメージパッケージング方法。
  5. 前記2次サンプリング段階は、
    それぞれの前記決定された数のフレームイメージ上で、前記第1学習対象オブジェクトを除いた背景を除去する背景除去段階を更に含むことを特徴とする、請求項4に記載のビデオ動画の人工知能のための学習対象イメージパッケージング方法。
  6. 前記1つ以上の学習対象フレームイメージを加工処理して学習用データセットを生成する学習用データセット生成段階を更に含むことを特徴とする、請求項1に記載のビデオ動画の人工知能のための学習対象イメージパッケージング方法。
  7. 前記学習用データセット生成段階は、
    前記学習対象フレームイメージ上で予め定められた1つ以上の類型の1つ以上の第2学習対象オブジェクトを検出する第2学習対象オブジェクト検出段階と、
    前記学習対象フレームイメージ上の検出された前記1つ以上の第2学習対象オブジェクトに対して注釈化処理を行う学習対象オブジェクト注釈化段階と、
    を含むことを特徴とする、請求項6に記載のビデオ動画の人工知能のための学習対象イメージパッケージング方法。
  8. 前記学習用データセット生成段階は、
    前記学習用データセットの有効性を検証する有効性検証段階を更に含むことを特徴とする、請求項7に記載のビデオ動画の人工知能のための学習対象イメージパッケージング方法。
  9. オリジナル道路走行映像を受信するオリジナル道路走行映像受信部と、
    前記オリジナル道路走行映像と関連する地域の密集変数に基づいて抽出数を決定し、前記オリジナル道路走行映像から前記決定された数のフレームイメージを抽出する第1サンプリング部と、
    前記決定された数のフレームイメージそれぞれが第1学習対象オブジェクトを含んでいるか否か、及び、前記第1学習対象オブジェクトの移動量に基づいて、前記決定された数のフレームイメージから1つ以上の学習対象フレームイメージを抽出する第2サンプリング部と、を含み、
    前記オリジナル道路走行映像と関連する地域の密集変数は、前記オリジナル道路走行映像と関連する地域の人口統計データ又は車両統計データのうち1つ以上を含む、ビデオ動画の人工知能のための学習対象イメージパッケージング装置。
  10. コンピュータと結合し、請求項1〜8の何れか1項に記載のビデオ動画の人工知能のための学習対象イメージパッケージング方法を実行させる、コンピュータ読み取り可能な記録媒体に格納されたコンピュータプログラム。
JP2018240034A 2018-04-19 2018-12-21 ビデオ動画の人工知能のための学習対象イメージパッケージング装置及び方法 Active JP6700373B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR10-2018-0045507 2018-04-19
KR20180045507 2018-04-19
KR10-2018-0135241 2018-11-06
KR1020180135241A KR102015945B1 (ko) 2018-04-19 2018-11-06 자율주행을 위한 학습대상 이미지 패키징 장치 및 방법

Publications (2)

Publication Number Publication Date
JP2019192209A true JP2019192209A (ja) 2019-10-31
JP6700373B2 JP6700373B2 (ja) 2020-05-27

Family

ID=67775366

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018240034A Active JP6700373B2 (ja) 2018-04-19 2018-12-21 ビデオ動画の人工知能のための学習対象イメージパッケージング装置及び方法

Country Status (2)

Country Link
JP (1) JP6700373B2 (ja)
KR (1) KR102015945B1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021090191A (ja) * 2020-11-09 2021-06-10 ネットスマイル株式会社 ビデオ信号処理システムおよびビデオ信号処理方法
JP2021089684A (ja) * 2019-12-05 2021-06-10 ネットスマイル株式会社 ビデオ信号処理システムおよびビデオ信号処理方法
JP7446605B2 (ja) 2020-03-31 2024-03-11 株式会社ユピテル システム、プログラム、学習済みモデル、学習モデルの生成方法および生成装置等

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102493800B1 (ko) * 2020-12-08 2023-01-30 한국교통대학교 산학협력단 주행환경 정적객체인지 ai 데이터 처리 방법 및 이를 위한 장치
KR102582431B1 (ko) * 2021-07-13 2023-09-26 (주)블루컴 차량 식별 학습 데이터 생성 방법 및 이를 이용한 차량 식별 학습 데이터 생성 시스템

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009217400A (ja) * 2008-03-07 2009-09-24 Fujitsu Ltd 画像処理装置
US20120170805A1 (en) * 2011-01-05 2012-07-05 International Business Machines Corporation Object detection in crowded scenes
JP2014059729A (ja) * 2012-09-18 2014-04-03 Toshiba Corp 物体検出・識別装置及びその方法とその物体検出・識別に用いられる辞書データ生成方法
JP2016218873A (ja) * 2015-05-25 2016-12-22 マツダ株式会社 車両用歩行者画像取得装置
JP2017117139A (ja) * 2015-12-24 2017-06-29 キヤノンマーケティングジャパン株式会社 情報処理装置、制御方法、プログラム
JP2017225122A (ja) * 2013-06-28 2017-12-21 日本電気株式会社 映像監視システム、映像処理装置、映像処理方法および映像処理プログラム
JP2018036848A (ja) * 2016-08-31 2018-03-08 株式会社デンソーアイティーラボラトリ 物体状況推定システム、物体状況推定装置、物体状況推定方法、及び物体状況推定プログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040026825A (ko) 2002-09-26 2004-04-01 현대자동차주식회사 차량 보조석 승객 보호 장치 및 그 방법
KR20110047482A (ko) * 2009-10-30 2011-05-09 삼성전자주식회사 차량의 속도에 따라 차량의 외부 영상을 촬영하는 방법 및 차량용 블랙박스
KR101502757B1 (ko) * 2010-11-22 2015-03-18 한국전자통신연구원 공간컨텐츠 서비스 제공 장치 및 그 방법
KR20130099332A (ko) * 2012-02-29 2013-09-06 주식회사 파인디지털 지피에스 데이터와 맵 기본 데이터를 이용한 차량용 블랙박스 및 그 영상 저장 방법
KR102474837B1 (ko) * 2015-09-14 2022-12-07 주식회사 한화 전경 추출 방법 및 장치

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009217400A (ja) * 2008-03-07 2009-09-24 Fujitsu Ltd 画像処理装置
US20120170805A1 (en) * 2011-01-05 2012-07-05 International Business Machines Corporation Object detection in crowded scenes
JP2014059729A (ja) * 2012-09-18 2014-04-03 Toshiba Corp 物体検出・識別装置及びその方法とその物体検出・識別に用いられる辞書データ生成方法
JP2017225122A (ja) * 2013-06-28 2017-12-21 日本電気株式会社 映像監視システム、映像処理装置、映像処理方法および映像処理プログラム
JP2016218873A (ja) * 2015-05-25 2016-12-22 マツダ株式会社 車両用歩行者画像取得装置
JP2017117139A (ja) * 2015-12-24 2017-06-29 キヤノンマーケティングジャパン株式会社 情報処理装置、制御方法、プログラム
JP2018036848A (ja) * 2016-08-31 2018-03-08 株式会社デンソーアイティーラボラトリ 物体状況推定システム、物体状況推定装置、物体状況推定方法、及び物体状況推定プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
小川原也, 外4名: ""車載用歩行者抽出動画像処理のオンライン学習による獲得"", 第69回(平成19年)全国大会講演論文集(3) ネットワーク セキュリティ, JPN6020000952, 6 March 2007 (2007-03-06), pages 3 - 69, ISSN: 0004253377 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021089684A (ja) * 2019-12-05 2021-06-10 ネットスマイル株式会社 ビデオ信号処理システムおよびビデオ信号処理方法
JP7446605B2 (ja) 2020-03-31 2024-03-11 株式会社ユピテル システム、プログラム、学習済みモデル、学習モデルの生成方法および生成装置等
JP2021090191A (ja) * 2020-11-09 2021-06-10 ネットスマイル株式会社 ビデオ信号処理システムおよびビデオ信号処理方法

Also Published As

Publication number Publication date
JP6700373B2 (ja) 2020-05-27
KR102015945B1 (ko) 2019-08-28

Similar Documents

Publication Publication Date Title
KR102015947B1 (ko) 자율주행을 위한 학습대상 이미지 추출 장치 및 방법
JP6700373B2 (ja) ビデオ動画の人工知能のための学習対象イメージパッケージング装置及び方法
KR101926561B1 (ko) 블랙박스 영상을 이용한 딥러닝 기반의 패치 단위 도로 크랙 검출 장치 및 그 방법, 그리고 이 방법을 실행시키기 위해 컴퓨터가 판독 가능한 기록매체에 저장된 컴퓨터 프로그램
KR102094341B1 (ko) 인공지능 기반의 도로 노면 불량 객체 정보 분석 시스템 및 방법
US11455805B2 (en) Method and apparatus for detecting parking space usage condition, electronic device, and storage medium
US20200364467A1 (en) Method and device for detecting illegal parking, and electronic device
US20170032514A1 (en) Abandoned object detection apparatus and method and system
CN108550258B (zh) 车辆排队长度检测方法、装置、存储介质和电子设备
CN109190488B (zh) 基于深度学习YOLOv3算法的前车车门打开检测方法及装置
CN105608209B (zh) 一种视频标注方法和视频标注装置
CN108256554A (zh) 基于深度学习的车辆逆向停车判断方法、服务器及系统
CN102682304A (zh) 一种融合多特征的行人检测方法及装置
CN113343461A (zh) 自动驾驶车辆的仿真方法、装置、电子设备及存储介质
CN110889421A (zh) 目标物检测方法及装置
CN113808098A (zh) 道路病害识别方法、装置、电子设备及可读存储介质
CN114419552A (zh) 基于目标检测的违章车辆追踪方法及系统
JP6681965B2 (ja) 自律走行のための学習対象イメージ抽出装置及び方法
Piyush et al. Vehicle detection and classification using audio-visual cues
CN114926791A (zh) 一种路口车辆异常变道检测方法、装置、存储介质及电子设备
CN111127520A (zh) 一种基于视频分析的车辆跟踪方法和系统
CN111724607B (zh) 转向灯使用检测方法、装置、计算机设备和存储介质
CN111178181B (zh) 交通场景分割方法及相关装置
CN112528944A (zh) 一种图像识别方法、装置、电子设备及存储介质
CN112509321A (zh) 一种基于无人机的城市复杂交通情景的驾驶控制方法、系统及可读存储介质
CN112329886A (zh) 双车牌识别方法、模型训练方法、装置、设备及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181221

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200121

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200330

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200414

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200430

R150 Certificate of patent or registration of utility model

Ref document number: 6700373

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250