JP5863180B2 - 映像解析処理装置、映像解析処理方法、および映像解析処理用プログラム - Google Patents

映像解析処理装置、映像解析処理方法、および映像解析処理用プログラム Download PDF

Info

Publication number
JP5863180B2
JP5863180B2 JP2012112287A JP2012112287A JP5863180B2 JP 5863180 B2 JP5863180 B2 JP 5863180B2 JP 2012112287 A JP2012112287 A JP 2012112287A JP 2012112287 A JP2012112287 A JP 2012112287A JP 5863180 B2 JP5863180 B2 JP 5863180B2
Authority
JP
Japan
Prior art keywords
processing
video
analysis
section
total
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012112287A
Other languages
English (en)
Other versions
JP2013239949A (ja
Inventor
充裕 後藤
充裕 後藤
佐藤 隆
隆 佐藤
東野 豪
豪 東野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012112287A priority Critical patent/JP5863180B2/ja
Publication of JP2013239949A publication Critical patent/JP2013239949A/ja
Application granted granted Critical
Publication of JP5863180B2 publication Critical patent/JP5863180B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、映像を分割し、並列的に分散して解析することで、処理を高速化する映像解析処理装置、映像解析処理方法、および映像解析処理用プログラムに関する。
従来、映像の解析処理として、映像中のフレームから抽出した画像データや対応する音声データの物理的特徴を利用して、映像中のシーン切り替え点であるカット点や、カメラワークの切り替え点、音楽区間の開始点および終了点などを、イベントとして検出する技術がある。
これらのイベント検出処理の例として、特許文献1に記載されたように、フレームの輝度情報を基にカット点を検出するものや、特許文献2に記載されたように、音情報の周波数や強さを基にして音声・音楽区間を検出するものがある。
これらの技術では、時間的に前後関係のある2点以上の画像データや音データの物理的特徴を、映像の最初から最後まで逐次的に比較して差分などを演算処理し、特徴的な区間をイベント区間として検出している。そのため、イベント検出処理を行う際には映像が長くなるほどそれに比例して多くの時間がかかる。
そこで、処理時間を短縮しつつも正しくイベントを検出する方法として、特許文献3に記載の技術が提案されている。
特許文献3では、映像を複数の処理区間に時分割し、隣り合う処理区間との間に互いに重なり合う区間(以下,オーバラップする区間と呼ぶ)を持たせ、分割された区間の解析処理を並列に実行することにより、処理時間を短縮している。
このとき、オーバラップ区間を長くすることによりイベントの検出漏れを防ぐことができ、映像を分割せずに逐次的に検出処理を行った場合と同精度でイベント検出結果を得ることができる。
特許第2839132号公報 特開平11−266428号公報 特許第3785068号公報
しかし、上述した特許文献3の技術においてオーバラップ区間を長くすると、解析するフレーム数が増え、処理時間の増加を引き起こすことになる。加えて、イベント区間は必ずしも複数の処理区間に跨るとは限らないため、すべての処理区間に前後の処理区間とのオーバラップ区間を設けることは非効率的である。さらに、各処理区間に固定長のオーバラップ区間を設けておいてもこれが充分でない場合には、イベント区間が処理区間の境界を跨ることにより正確なイベント区間を検出できない可能性があり、さらなる処理精度の向上が望まれていた。
本発明は上記事情に鑑みてなされたものであり、映像の解析処理を効率良く高速化しつつ、精度の高い解析処理を行うことが可能な映像解析処理装置、映像解析処理方法、および映像解析処理用プログラムを提供することを目的とする。
上記の課題を解決するための、本発明の請求項1に記載の映像解析処理装置は、映像のイベント区間を検出するための解析処理を、それぞれ独立して並列に実行する複数の処理ワーカ部と、予め設定された単位時間あたりの処理可能な映像長と、処理対象の映像長とに基づいて算出される前記処理対象の映像の予測総処理時間が最短となるように、前記複数の処理ワーカ部で解析処理を実行させるための前記処理対象の映像の分割数を、自映像解析処理装置が有する処理ワーカ部数内で決定する分割数決定部と、前記分割数決定部で決定された分割数に基づいて前記処理対象の映像が分割された複数の処理区間の、前記処理対象の映像内の位置情報を特定する処理区間特定部と、前記処理区間特定部で特定された各処理区間を、前記各処理ワーカ部に解析処理を実行させるために割り当てる解析処理管理部と、前記複数の処理ワーカ部で実行された解析処理の結果を取得し、統合する検出結果統合部とを備え、前記処理ワーカ部はそれぞれ、前記解析処理管理部により割り当てられた処理区間の解析処理の終了時にイベント区間の検出中であるときには当該イベント区間が終了するまで解析処理を延長し、当該延長した区間の解析処理を他の処理ワーカ部とオーバラップして実行する映像解析処理装置において、過去に実行した解析処理時間の合計値である総映像処理時間、過去の解析処理に利用した映像の数、過去の解析処理に利用した映像の時間長の合計値である総映像長、過去の解析処理において発生したオーバラップ区間の時間長の合計値であるオーバラップ区間長、および、過去の解析処理により検出されたイベント区間の時間長の合計値である総イベント区間長を変数情報として記憶する解析変数記憶部と、前記複数の処理ワーカ部で実行された解析処理の解析結果に基づいて、前記解析変数記憶部に記憶された情報を更新する解析変数更新部とをさらに有し、前記分割数決定部において分割数の決定に用いられる前記処理対象の映像の予測総処理時間は、前記解析変数記憶部に記憶された総映像処理時間および総映像長に基づいて算出される単位時間あたりの処理可能な映像長と、総イベント区間長および総映像長に基づいて算出される総映像処理時間内の総イベント区間長の割合と、映像の数およびオーバラップ区間長に基づいて算出される映像ごとの平均オーバラップ区間長とに基づいて算出されることを特徴とする。
また本発明の請求項は請求項に記載の映像解析処理装置であり、前記解析変数記憶部では、映像のジャンルごと、映像フォーマットごと、または解像度ごとに前記変数情報が記憶され、前記分割数決定部では、指定されたジャンル、映像フォーマット、または解像度に関する変数情報を前記解析変数記憶部から取得して前記分割数の決定に用いることを特徴とする。
また本発明の請求項は請求項1または2に記載の映像解析処理装置であり、前記分割数決定部は、前記処理対象の映像を分割しない場合の予測処理時間を前記平均オーバラップ区間長を含めずに算出し、前記オーバラップ区間長を含めて算出した分割する場合の予測処理時間よりも、前記分割しない場合の予測処理時間のほうが短いときは、分割数を1として特定することを特徴とする。
また本発明の請求項に記載の映像解析処理方法は、映像のイベント区間を検出するための解析処理を、それぞれ独立して並列に実行する複数の処理ワーカ部と、予め設定された単位時間あたりの処理可能な映像長と、処理対象の映像長とに基づいて算出される前記処理対象の映像の予測総処理時間が最短となるように、前記複数の処理ワーカ部で解析処理を実行させるための前記処理対象の映像の分割数を、自映像解析処理装置が有する処理ワーカ部数内で決定する分割数決定部と、前記分割数決定部で決定された分割数に基づいて前記処理対象の映像が分割された複数の処理区間の、前記処理対象の映像内の位置情報を特定する処理区間特定部と、前記処理区間特定部で特定された各処理区間を、前記各処理ワーカ部に解析処理を実行させるために割り当てる解析処理管理部と、前記複数の処理ワーカ部で実行された解析処理の結果を取得し、統合する検出結果統合部とを備え、前記処理ワーカ部はそれぞれ、前記解析処理管理部により割り当てられた処理区間の解析処理の終了時にイベント区間の検出中であるときには当該イベント区間が終了するまで解析処理を延長し、当該延長した区間の解析処理を他の処理ワーカ部とオーバラップして実行する映像解析処理装置が、過去に実行した解析処理時間の合計値である総映像処理時間、過去の解析処理に利用した映像の数、過去の解析処理に利用した映像の時間長の合計値である総映像長、過去の解析処理において発生したオーバラップ区間の時間長の合計値であるオーバラップ区間長、および、過去の解析処理により検出されたイベント区間の時間長の合計値である総イベント区間長を変数情報として記憶する解析変数記憶ステップと、前記複数の処理ワーカ部で実行された解析処理の解析結果に基づいて、前記解析変数記憶ステップで記憶された情報を更新する解析変数更新ステップと、前記解析変数記憶ステップで記憶された総映像処理時間および総映像長に基づいて算出される単位時間あたりの処理可能な映像長と、総イベント区間長および総映像長に基づいて算出される総映像処理時間内の総イベント区間長の割合と、映像の数およびオーバラップ区間長に基づいて算出される映像ごとの平均オーバラップ区間長とに基づいて、前記分割数決定部において、分割数の決定に用いられる前記処理対象の映像の予測総処理時間を算出するステップとを有することを特徴とする。
また本発明の請求項に記載の映像解析処理用プログラムは、請求項1〜請求項いずれか1項に記載の映像解析処理装置をコンピュータで構成するためのものであることを特徴とする。
本発明の映像解析処理装置、映像解析処理方法、および映像解析処理用プログラムによれば、映像の解析処理を効率良く高速化しつつ、精度の高い解析処理を行うことができる。
本発明の一実施形態による映像解析処理装置の構成を示すブロック図である。 本発明の一実施形態による映像解析処理装置の解析変数記憶部に記憶される情報の一例である。 本発明の一実施形態による映像解析処理装置で実行される処理の動作を示すフローチャートである。 本発明の一実施形態による映像解析処理装置の分割数決定部で実行される処理の動作を示すフローチャートである。 本発明の一実施形態による映像解析処理装置の処理区間特定部で実行される処理の動作を示すフローチャートである。 本発明の一実施形態による映像解析処理装置の処理区間特定部に記憶される処理区間データの一例を示す表である。 本発明の一実施形態による映像解析処理装置の解析処理管理部で各処理区間が各処理ワーカ部に割り当てられた状態を示す説明図である。 本発明の一実施形態による映像解析処理装置の処理ワーカ部で実行される処理の動作を示すフローチャートである。 本発明の一実施形態による映像解析処理装置の、(a)処理ワーカ部において、割り当てられた区間の処理が実行されるときの状態を示す説明図、(b)処理区間特定部に記憶された処理データの一例を示す表である。 本発明の一実施形態による映像解析処理装置の、(a)処理ワーカ部において、割り当てられた区間が延長されて処理が実行されるときの状態を示す説明図、(b)処理区間特定部に記憶された処理データが延長により更新された状態を示す表である。 本発明の一実施形態による映像解析処理装置の解析変数更新部で実行される処理の動作を示すフローチャートである。 本発明の一実施形態による映像解析処理装置のワーカ処理部を、(a)マルチコアCPUで構成した場合、(b)サーバで構成した場合を示す説明図である。
本発明の一実施形態では、映像データを複数の処理区間に時分割し、隣り合う処理区間との間に互いにオーバラップする区間を持たせ、分割された区間の解析処理を並列に実行することで、効率良く且つ精度の高い解析処理を実行することが可能な映像解析処理装置について説明する。
〈一実施形態による映像解析処理装置を利用した映像解析処理システムの構成〉
本発明の一実施形態による映像解析処理装置を利用した映像解析処理システムの構成について、図1を参照して説明する。
本実施形態による映像解析処理システム1は、データ入力装置10と、映像解析処理装置20と、データ出力装置30とを備える。
データ入力装置10は、解析処理対象の映像を、HTTP(HyperText Transfer Protocol)やSMB(Server Message Block)等の各種の通信プロトコルにより映像解析処理装置20に入力する。
映像解析処理装置20は、映像記憶部21と、解析変数記憶部22と、映像解析部23と、分割数決定部24と、処理区間特定部25と、解析処理管理部26と、検出結果統合部27と、集計結果記憶部28と、解析変数更新部29とを有する。
映像記憶部21は、ハードディスク等の記憶装置で構成され、データ入力装置10により入力された解析処理対象の映像をファイルとして記憶する。
解析変数記憶部22は、解析処理時間の予測時に利用する、イベント区間の種別ごとの各種変数情報を予め記憶する。
映像解析部23は、映像取得部231と、n個の処理ワーカ部(第1処理ワーカ部232−1、第2処理ワーカ部232−2、第3処理ワーカ部232−3・・・第n処理ワーカ部232−n)と、利用可能ワーカ数検出部233とを有する。映像取得部231は、後述する解析処理管理部26で生成される処理区間データに基づいて、映像記憶部21から各処理区間の映像を取得し、該当する処理ワーカ部232−1〜232−nにそれぞれ送出する。複数(n個)の処理ワーカ部232−1〜232−nはそれぞれ、映像取得部231から送出された映像の解析処理を、独立して並列的に実行する。利用可能ワーカ数検出部233は、処理ワーカ部232−1〜232−nのうち、現在利用可能な処理ワーカ部数を検出し、分割数決定部24に送出する。
分割数決定部24は、解析変数記憶部22に記憶された変数情報、および映像解析部23から取得される利用可能な処理ワーカ部数に基づいて、映像の解析処理時間が最短となるように、当該映像の分割数を決定する。
処理区間特定部25は、分割数決定部24で決定された分割数に基づいて、当該映像を分割した処理区間を特定する。
解析処理管理部26は、処理区間特定部25で特定された各処理区間を、映像解析部23の各処理ワーカ部232−1〜232−nに割り当てる。
検出結果統合部27は、映像解析部23の各処理ワーカ部232−1〜232−nで実行された解析処理結果を取得し統合する。
集計結果記憶部28は、検出結果統合部27で統合された当該映像の解析処理結果を記憶する。
解析変数更新部29は、映像解析部23の各処理ワーカ部232−1〜232−nで実行された解析処理結果に基づいて、解析変数記憶部22に記憶された各種変数を更新する。
データ出力装置30はユーザにより操作されるものであり、映像解析処理装置20で解析された結果情報を読み出して出力する。
〈一実施形態による映像解析処理装置を利用した映像解析処理システムの動作〉
次に、本実施形態による映像解析処理システム1の動作について、図2〜11を参照して説明する。
本実施形態において、解析変数記憶部22には、解析処理時間の予測時に利用する、イベント種別ごとの各種変数情報を示す表が予め記憶されている。この各種変数情報は、一般的な映像を解析した解析結果を用いて実験的に求めることが可能である。解析変数記憶部22に記憶された変数情報の例を図2に示す。
図2は変数情報を示す表であり、映像中から検出されるイベント区間として、シーンの切り替え点であるカット点から次のカット点までの区間を示す「カット点」、カメラワークの切り替え点から次の切り替え点までの区間を示す「カメラワーク」、映像上にテロップの表示がある区間を示す「テロップ」、映像中に音楽が流れている区間を示す「音楽区間」に関しそれぞれ、過去に実行した解析処理時間の合計値である総映像処理時間T(T1〜T4)、過去の解析処理に利用した映像の数V(V1〜V4)、過去の解析処理に利用した映像の時間長の合計値である総映像長L(L1〜L4)、過去の解析処理において発生したオーバラップ区間の時間長の合計値である総オーバラップ区間長O(O1〜O4)、過去の解析処理により検出されたイベント区間の時間長の合計値である総イベント区間長E(E1〜E4)が格納されている。
この変数情報は、対象映像のジャンルや映像のフォーマット、解像度によってその値が変化することがある。例えば、映像ジャンルが異なるニュース映像とドラマ映像では、映像中に存在するテロップイベントの長さや発生数が変わってくる。また、映像フォーマットの違いは、映像信号から画像フレームに復号処理する時間に影響し、解像度の違いは、画像フレームからの特徴量を抽出する処理の時間に影響する。
そこで、ジャンルや映像フォーマット、解像度別に各イベント区間の変数情報を解析変数記憶部22に記憶しておき、分割数決定部24の処理に用いるようにしてもよい。このとき、解析処理対象の映像のジャンルや映像フォーマット、解像度は、データ入力時にデータ入力装置10においてユーザが指定して、または解析処理対象の映像を既存の技術を用いて解析することにより特定して、後述する分割数の決定に用いるようにしてもよい。また、新たな種別のイベント区間を分割数算出処理の要素として追加したい場合には、当該追加するイベント区間の解析変数を算出し、都度解析変数記憶部22内の変数情報に追加することで対応が可能である。
このように変数情報が解析変数記憶部22に記憶された状態で、映像解析処理装置20において実行される処理について、図3のフローチャートを参照して説明する。
本実施形態による映像解析処理装置20では、ユーザの操作によりデータ入力装置10から入力された解析処理対象の映像が受信され、映像記憶部21に記憶される(S1)。
次に分割数決定部24において、解析変数記憶部22に記憶された変数情報に基づいて、対象映像の解析処理時間が最短となるように、当該映像の分割数が決定される(S2)。
分割数決定部24において映像の分割数が決定される際の詳細な処理について、図4のフローチャートを参照して説明する。
まず、映像記憶部21に記憶された対象映像の映像長Mが取得される(S201)。また、解析変数記憶部22に記憶された各イベント区間の変数情報(総映像処理時間T、映像の数V、総映像長L、総オーバラップ区間長O、および総イベント区間長E)が取得される(S202)。また、分割数決定部24から映像解析部23内に、現在利用可能な処理ワーカ数が問い合わせられ、これに応じて映像解析部23の利用可能ワーカ数検出部233から通知された「利用可能な処理ワーカ部数N」が分割数決定部24で取得される(S203)。
次に、これらの値が用いられ、平均処理速度B、総イベント内包率C、および平均総オーバラップ区間長Aが算出される(S204)。
平均処理速度Bは下記式(1)に基づいて算出される値であり、単位時間あたりの処理可能な映像長を示す。
Figure 0005863180
また総イベント内包率Cは下記式(2)に基づいて算出される値であり、過去に解析処理が実行された総映像に含まれる、総イベント区間長Eの割合を示す。この総イベント内包率Cが高いほど、1つのイベント区間が、分割された複数の処理区間に跨る可能性が高くなる。
Figure 0005863180
また平均総オーバラップ区間長Aは下記式(3)に基づいて算出される値であり、映像ごとの、解析処理時に延長した総オーバラップ区間長の平均値を示す。解析処理時の総オーバラップ区間長の延長処理については後述する。
Figure 0005863180
次に、分割数nが「2」の場合、ステップS203で取得された利用可能な処理ワーカ部数Nの範囲内で、総映像処理時間Tが最短となる映像の分割数が特定される。
ここで、総映像処理時間Tは下記式(4)のように、1つの処理ワーカ部において割り当てられた処理区間の解析処理時間Tpと、1つの処理ワーカ部において、割り当てられた処理区間が保持するオーバラップ区間の解析処理時間Toとの合計値で示される。
Figure 0005863180
このとき、1つの処理区間の解析処理時間Tpは、下記式(5)に示すように、1つの処理区間の映像長(M/n)が平均処理速度Bで除算して求められる。
Figure 0005863180
また、オーバラップ区間の解析処理時間Toは、下記式(6)に示すように、総イベント内包率Cに映像の末尾を除く全ての処理区間の終了点の数(n-1)を乗じて延長の発生数(n-1)Cが算出され、さらにその発生数に平均総オーバラップ区間長Aを乗算し、予想されるオーバラップ区間の解析処理時間Toとして算出される。
Figure 0005863180
上記式(4)に上記式(5)および(6)を代入すると、総映像処理時間T(n)は下記式(4)’のように予測される。
Figure 0005863180
上記式(4)’ を微分して,総映像処理時間T(n)が最短となる分割数nを求める.
Figure 0005863180
上記式(7)より、総映像処理時間T’(n)が最短となる分割数nの非正規化値(自然数に限られない)n*が、下記式(8)により求められる(S205)。処理ワーカ数は常に自然数であるため分割数nは最終的には正規化して自然数で算出する必要があるが、ここでは分割数nを求めるための前段階として、自然数に限られない非正規化の状態の値n*が下記式(8)により求められる。
Figure 0005863180
ここで、解析対象とする映像長Mが短く、分割数nの非正規化値n*が「1」よりも小さい場合(ステップS206の「YES」)は、映像の分割数nは「1」として特定される(S207)。
また、分割数nが「1」の場合、つまり映像を分割しない場合の総映像処理時間T(1)は、総オーバラップ区間長Oが発生せず下記式(9)により示される。
Figure 0005863180
ステップS206において分割数nの非正規化値n*が「1」以上の場合(S206の「NO」)は、当該分割数nの非正規化値n*と、ステップS203で取得された利用可能な処理ワーカ部数Nとが比較される(S208)。
比較の結果、映像の分割数nの非正規化値n*が利用可能な処理ワーカ部数N以上の場合(ステップS208の「YES」)は、映像の分割数nは「N」として特定される(S209)。
またステップS208において、映像の分割数nの非正規化値n*が利用可能な処理ワーカ部数Nよりも小さい場合(ステップS208の「NO」)は、分割数nの非正規化値n*以下であり最大の自然数mと、分割数nの非正規化値n*以上であり最小の自然数(m+1)とが求められる(S210)。
そして、求められた自然数mおよび自然数(m+1)をそれぞれ上記式(4)’の「n」に代入した総映像処理時間T(m)および総映像処理時間T(m+1)が求められる。
求められた総映像処理時間T(m)と総映像処理時間T(m+1)とが比較され、総映像処理時間T(m+1)が総映像処理時間T(m)以上であるとき(S211の「YES」)は、映像の分割数nは自然数mとして特定される(S212)。
また、ステップS210において総映像処理時間T(m+1)が総映像処理時間T(m)よりも小さいとき(S211の「NO」)は、映像の分割数nは自然数m+1として特定される(S213)。つまり、映像の分割数nは、以下の式(10)により特定される。
Figure 0005863180
以上で映像の分割数nの算出処理についての説明を終了する。
図3のフローチャートに戻り、算出された映像の分割数nに基づいて、当該映像を分割した複数の処理区間が処理区間特定部25において特定される(S3)。
処理区間特定部25において当該映像の複数の処理区間が特定されるときの動作について、図5のフローチャートを参照して説明する。
まず、映像記憶部21から対象映像が読み込まれ、対象映像の映像長Mが取得される(S301)。また、分割数決定部24で決定された映像の分割数nが取得される(S302)。
そして、取得された映像長Mを映像の分割数nで分割して得られるn個の処理区間Piが特定される。処理区間Piは、n個の中のi番目の処理区間Pを識別するIDであり、iがi=0からi=n-1までインクリメントされることにより、n個の処理区間Piがそれぞれ求められる(S304、S307)。
処理区間Piは、映像内における開始位置を示す開始フレーム位置情報Si、および終了位置を示す終了フレーム位置情報eiにより特定され、これらの開始フレーム位置情報Siおよび終了フレーム位置情報eiは下記式(11)で算出される(S305)。この開始フレーム位置情報Si、および終了フレーム位置情報eiは、映像の先頭からの時間情報(ms)で示される。
Figure 0005863180
上記式(11)により算出された各処理区間Piの開始フレーム位置情報Siおよび終了フレーム位置情報eiが格納された処理区間データの一例を、図6に示す。
図6の処理区間データでは、処理区間P0 の開始フレーム位置情報S0が「0(ms)」、終了フレーム位置情報e0が「10000(ms)」であり、処理区間P1の開始フレーム位置情報S1が「10000(ms)」、終了フレーム位置情報e1が「20000(ms)」であり、処理区間P2の開始フレーム位置情報S2が「20000(ms)」、終了フレーム位置情報e2が「30000(ms)」であり、処理区間P3の開始フレーム位置情報S3が「30000(ms)」、終了フレーム位置情報e3が「40000(ms)」であり、処理区間P4の開始フレーム位置情報S4が「40000(ms)」、終了フレーム位置情報e4が「50000(ms)」であることが示されている。この処理区間データは、処理区間特定部25で記憶される(S306)。
以上で映像の処理区間の特定処理についての説明を終了する。
図3のフローチャートに戻り、ステップS3で特定された各処理区間Piが、解析処理管理部26により各処理ワーカ部232−1〜232−nに割り当てられる(S4)。
具体的には、図7に示すように、処理区間P0(フレーム位置情報「0(ms)」〜「10000(ms)」)が第1処理ワーカ部232−1に割り当てられ、処理区間P1(フレーム位置情報「10000(ms)」〜「20000(ms)」)が第2処理ワーカ部232−2に割り当てられ、処理区間P2(フレーム位置情報「20000(ms)」〜「30000(ms)」)が第3処理ワーカ部232−3に割り当てられ、処理区間P3(フレーム位置情報「30000(ms)」〜「40000(ms)」)が第4処理ワーカ部232−4に割り当てられ、処理区間P4(フレーム位置情報「40000(ms)」〜「50000(ms)」)が第5処理ワーカ部232−5に割り当てられる。
次に、各処理ワーカ部232−1〜232−nにおいて、映像記憶部21に記憶された映像中の割り当てられた処理区間の解析処理が、図7の矢印で示すように並列して実行される(S5)。
各処理ワーカ部232−1〜232−nにおいて、割り当てられた処理区間の映像が解析されるときの動作について、図8のフローチャートを参照して説明する。
まず、自処理ワーカ部の割り当てられた処理区間の開始フレーム位置から解析処理が開始され(S501)、終了フレーム位置に到達するまで解析処理が進められる(S502の「NO」)。そして、終了フレーム位置に到達したとき(S502の「YES」)に、解析処理においてイベント区間を検出中であると判断されると(S503の「YES」)、当該検出中のイベント区間が終了するまで終了フレーム位置が後ろにずらされて処理区間が延長され、処理が続行される(S504)。
例えば、図9(a)に示すように処理区間P0(フレーム位置情報「0(ms)」〜「10000(ms)」)が第1処理ワーカ部232−1に割り当てられ、処理区間P1(フレーム位置情報「10000(ms)」〜「20000(ms)」)が第2処理ワーカ部232−2に割り当てられ、図9(b)に示すように処理区間P0およびP1の開始フレーム位置情報S、終了フレーム位置情報e、を含む処理区間データが処理区間特定部25に記憶されている状態で、それぞれの処理ワーカ部で並列して解析処理が矢印に示すように実行され、第1処理ワーカ部232−1において終了フレーム位置(フレーム位置情報「10000(ms)」)に到達したときに、イベント区間の検出中であったとする。
この場合、第1処理ワーカ部232−1で終了フレーム位置情報eiが後ろにずらされて解析処理が続行され、図10(a)に示すようにイベント区間が終了したとき(ここではフレーム位置情報「13000(ms)」の時点)に解析処理が終了される。このように処理区間が延長されることにより、第1処理ワーカ部232−1で解析処理される区間P0が、ステップS3で算出された本来の処理区間P00に加え延長された処理区間P01が足し合わされた区間とされ、処理区間特定部25に記憶された処理区間データの処理区間P0の終了フレーム位置情報が「10000(ms)」から「13000(ms)」に更新される。
ステップS504において延長された処理区間の解析処理が終了したとき、または、ステップS502において終了フレーム位置まで解析処理が到達し且つステップS503においてイベント検出中ではないと判断されたとき(S503の「NO」)は、各処理ワーカ部232−1〜232−nから検出結果統合部27に、解析結果としてイベント検出結果が送出される(S505)。
以上で映像の解析処理についての説明を終了する。
図3のフローチャートに戻り、検出結果統合部27において、各処理ワーカ部232−1〜232−nから取得されたイベント検出結果が統合される。
このとき、解析処理において処理区間の延長が発生していると、複数のワーカ処理部でオーバラップした区間が処理されていることになる。そこで統合時には、オーバラップしている区間については、時間的に映像の先頭に近い処理区間で検出した結果が優先されて統合される。オーバラップした区間の処理を行った複数の処理区間のうち、どの処理区間が映像の先頭に近いかは、処理区間特定部25に記憶された処理区間データに基づいて判断される。
統合された最終的な結果は、集計結果記憶部28に記憶される(S6)。集計結果記憶部28に記憶される情報は、検出されたイベントの、「カット点」、「カメラワーク」、「テロップ」、「音楽区間」等のイベント区間の種別を表す「検出イベント名」と、イベント区間の開始フレーム位置情報および終了フレーム位置情報である。
このとき、必要に応じてイベントに関する補足情報を集計結果記憶部28に記憶するようにしてもよい。補足情報として例えば、カメラワークのイベント検出において、カメラのパン、チルト量を記憶したり、テロップのイベント検出において、テロップの画面上の表示位置を記憶したりすることが可能である。
このように統合されたイベント検出結果が集計結果記憶部28に記憶されることにより、ユーザの操作でデータ出力装置30を用いてイベント検出結果を出力させ、利用することができる。例えば、イベント検出結果をデータ出力装置30のディスプレイに表示させたり、他の装置で更に処理を加えて利用するためにテキストファイルで読み出す等の処理を行うことができる。
また、映像解析部23で実行された解析処理の結果に基づいて、解析変数更新部29により、解析変数記憶部22に記憶された変数情報が更新される。
解析変数更新部29により実行される変数情報の更新処理について、図11のフローチャートを参照して説明する。
各処理ワーカ部232−1〜232−nで実行され出力された解析処理の結果が取得されると(S701)、解析変数記憶部22に記憶された変数情報中の、解析処理に利用した映像の数「V」がインクリメントされ「V+1」に更新される(S702)。
また、解析変数記憶部22に記憶された変数情報中の、解析処理に利用した映像の総映像長Lに、今回解析処理を行った映像の映像長Mが加算される(S703)。
また、解析変数記憶部22に記憶された変数情報中の、実行した解析処理により該当するイベント区間として検出された総イベント区間長Eに、今回検出したイベント区間の区間長の合計値が加算される(S704)。
また、解析変数記憶部22に記憶された変数情報中の、実行した解析処理の総映像処理時間Tに、今回の解析に要した処理時間が加算される(S705)。
また、解析変数記憶部22に記憶された変数情報中の、実行した解析処理における総オーバラップ区間長Oに、今回延長したオーバラップ区間の区間長の合計値が加算される(S706)。
以上の処理により、変数情報の更新処理が実行される。このように解析処理後に変数情報が更新されることにより、実行された解析結果が解析変数に反映され、次回以降に精度の高い映像解析処理を実行することが可能になる。
上述した映像解析処理システム1を実装した具体例を、図12(a)および(b)に示す。
図12(a)は、マルチコアCPUの1つのコア(1)が解析処理管理部26として解析タスク管理を行い、これに接続された複数のコア(2)〜(4)が、並列して稼動するワーカ処理部232−1〜232−3として解析処理装置が構築された場合を示す図である。
また図12(b)は、1台のサーバが解析処理管理部26として解析タスク管理を行い、これに接続された複数の解析サーバ(1)〜(3)が並列して稼動するワーカ処理部232−1〜232−3として解析処理装置が構築された場合を示す図である。本実施形態においては各ワーク処理部で解析対象の映像を共有し、並列して処理を進めるため、図12(b)のように解析処理管理部26と各ワーカ処理部232−1〜232−3とをそれぞれサーバで構築した場合には、サーバ間のネットワーク状態を考慮して処理区間を管理することで、適切に映像の転送が実行されるようにする必要がある。
上記以外にも、マルチコアCPUを持つ複数のサーバにより、映像の解析処理を並列して実行するように構成してもよい。
このように、各ワーカ処理部が独立して動作可能な環境であれば、ワーカ処理部の構築形態は問わない。
以上の本実施形態によれば、過去の解析処理結果を利用して、入力された映像の総処理時間を予測し、予測した総処理時間に基づいて映像を複数のワーカ処理部で並列して解析するための最適な分割数を決定することにより、短い処理時間で効率的に映像を解析することが可能になる。
また各ワーカ処理部では、分割した処理区間の終了時点でイベント検出中である場合にのみ処理区間を延長させて他のワーカ処理部の解析処理とのオーバラップ区間を発生させるため、精度の高い解析処理が可能であるとともに必要以上のオーバラップ区間を多発させることなく、さらに効率的な映像の解析処理を行うことが可能になる。分割した処理区間の終了時点でイベント検出中である場合、つまりイベント区間が複数の処理区間に跨っている場合に処理区間を延長させて他のワーカ処理部の解析処理とのオーバラップ区間を発生させることにより、処理区間の境界において正確なイベント区間ができない事態の発生を防止することができ、精度の高い解析処理を実行することができる。
またこのとき、入力される映像のジャンルや検出対象のイベント区間の種別によって異なる処理区間延長の発生確率や延長区間長を考慮して映像の分割数が決定されるため、さらに効率的な映像の解析処理を行うことが可能になる。
また、映像長によっては分割しない場合が最短の解析処理時間になることを考慮して映像の分割数が決定されるため、さらに効率的な映像の解析処理を行うことが可能になる。
また、上述した映像解析処理装置の各機能部の機能を実行するプログラムをコンピュータに搭載することにより、当該コンピュータを映像解析処理装置として機能させる映像解析処理用プログラムを構築することも可能である。
1…映像解析処理システム
10…データ入力装置
20…映像解析処理装置
21…映像記憶部
22…解析変数記憶部
23…映像解析部
24…分割数決定部
25…処理区間特定部
26…解析処理管理部
27…検出結果統合部
28…集計結果記憶部
29…解析変数更新部
30…データ出力装置
231…映像取得部
232−1〜232−n…処理ワーカ部
233…利用可能ワーカ数検出部

Claims (5)

  1. 映像のイベント区間を検出するための解析処理を、それぞれ独立して並列に実行する複数の処理ワーカ部と、
    予め設定された単位時間あたりの処理可能な映像長と、処理対象の映像長とに基づいて算出される前記処理対象の映像の予測総処理時間が最短となるように、前記複数の処理ワーカ部で解析処理を実行させるための前記処理対象の映像の分割数を、自映像解析処理装置が有する処理ワーカ部数内で決定する分割数決定部と、
    前記分割数決定部で決定された分割数に基づいて前記処理対象の映像が分割された複数の処理区間の、前記処理対象の映像内の位置情報を特定する処理区間特定部と、
    前記処理区間特定部で特定された各処理区間を、前記各処理ワーカ部に解析処理を実行させるために割り当てる解析処理管理部と、
    前記複数の処理ワーカ部で実行された解析処理の結果を取得し、統合する検出結果統合部とを備え
    前記処理ワーカ部はそれぞれ、前記解析処理管理部により割り当てられた処理区間の解析処理の終了時にイベント区間の検出中であるときには当該イベント区間が終了するまで解析処理を延長し、当該延長した区間の解析処理を他の処理ワーカ部とオーバラップして実行する映像解析処理装置において、
    過去に実行した解析処理時間の合計値である総映像処理時間、過去の解析処理に利用した映像の数、過去の解析処理に利用した映像の時間長の合計値である総映像長、過去の解析処理において発生したオーバラップ区間の時間長の合計値であるオーバラップ区間長、および、過去の解析処理により検出されたイベント区間の時間長の合計値である総イベント区間長を変数情報として記憶する解析変数記憶部と、
    前記複数の処理ワーカ部で実行された解析処理の解析結果に基づいて、前記解析変数記憶部に記憶された情報を更新する解析変数更新部とをさらに有し、
    前記分割数決定部において分割数の決定に用いられる前記処理対象の映像の予測総処理時間は、前記解析変数記憶部に記憶された総映像処理時間および総映像長に基づいて算出される単位時間あたりの処理可能な映像長と、総イベント区間長および総映像長に基づいて算出される総映像処理時間内の総イベント区間長の割合と、映像の数およびオーバラップ区間長に基づいて算出される映像ごとの平均オーバラップ区間長とに基づいて算出される
    ことを特徴とする映像解析処理装置。
  2. 前記解析変数記憶部では、映像のジャンルごと、映像フォーマットごと、または解像度ごとに前記変数情報が記憶され、
    前記分割数決定部では、指定されたジャンル、映像フォーマット、または解像度に関する変数情報を前記解析変数記憶部から取得して前記分割数の決定に用いる
    ことを特徴とする請求項1に記載の映像解析処理装置。
  3. 前記分割数決定部は、前記処理対象の映像を分割しない場合の予測処理時間を前記平均オーバラップ区間長を含めずに算出し、前記オーバラップ区間長を含めて算出した分割する場合の予測処理時間よりも、前記分割しない場合の予測処理時間のほうが短いときは、分割数を1として特定する
    ことを特徴とする請求項1または2に記載の映像解析処理装置。
  4. 映像のイベント区間を検出するための解析処理を、それぞれ独立して並列に実行する複数の処理ワーカ部と、
    予め設定された単位時間あたりの処理可能な映像長と、処理対象の映像長とに基づいて算出される前記処理対象の映像の予測総処理時間が最短となるように、前記複数の処理ワーカ部で解析処理を実行させるための前記処理対象の映像の分割数を、自映像解析処理装置が有する処理ワーカ部数内で決定する分割数決定部と、
    前記分割数決定部で決定された分割数に基づいて前記処理対象の映像が分割された複数の処理区間の、前記処理対象の映像内の位置情報を特定する処理区間特定部と、
    前記処理区間特定部で特定された各処理区間を、前記各処理ワーカ部に解析処理を実行させるために割り当てる解析処理管理部と、
    前記複数の処理ワーカ部で実行された解析処理の結果を取得し、統合する検出結果統合部とを備え、
    前記処理ワーカ部はそれぞれ、前記解析処理管理部により割り当てられた処理区間の解析処理の終了時にイベント区間の検出中であるときには当該イベント区間が終了するまで解析処理を延長し、当該延長した区間の解析処理を他の処理ワーカ部とオーバラップして実行する映像解析処理装置が、
    過去に実行した解析処理時間の合計値である総映像処理時間、過去の解析処理に利用した映像の数、過去の解析処理に利用した映像の時間長の合計値である総映像長、過去の解析処理において発生したオーバラップ区間の時間長の合計値であるオーバラップ区間長、および、過去の解析処理により検出されたイベント区間の時間長の合計値である総イベント区間長を変数情報として記憶する解析変数記憶ステップと、
    前記複数の処理ワーカ部で実行された解析処理の解析結果に基づいて、前記解析変数記憶ステップで記憶された情報を更新する解析変数更新ステップと、
    前記解析変数記憶ステップで記憶された総映像処理時間および総映像長に基づいて算出される単位時間あたりの処理可能な映像長と、総イベント区間長および総映像長に基づいて算出される総映像処理時間内の総イベント区間長の割合と、映像の数およびオーバラップ区間長に基づいて算出される映像ごとの平均オーバラップ区間長とに基づいて、前記分割数決定部において、分割数の決定に用いられる前記処理対象の映像の予測総処理時間を算出するステップと
    を有することを特徴とする映像解析処理方法。
  5. 請求項1〜請求項3いずれか1項に記載の映像解析処理装置をコンピュータで構成するための映像解析処理用プログラム。
JP2012112287A 2012-05-16 2012-05-16 映像解析処理装置、映像解析処理方法、および映像解析処理用プログラム Expired - Fee Related JP5863180B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012112287A JP5863180B2 (ja) 2012-05-16 2012-05-16 映像解析処理装置、映像解析処理方法、および映像解析処理用プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012112287A JP5863180B2 (ja) 2012-05-16 2012-05-16 映像解析処理装置、映像解析処理方法、および映像解析処理用プログラム

Publications (2)

Publication Number Publication Date
JP2013239949A JP2013239949A (ja) 2013-11-28
JP5863180B2 true JP5863180B2 (ja) 2016-02-16

Family

ID=49764615

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012112287A Expired - Fee Related JP5863180B2 (ja) 2012-05-16 2012-05-16 映像解析処理装置、映像解析処理方法、および映像解析処理用プログラム

Country Status (1)

Country Link
JP (1) JP5863180B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109727276B (zh) * 2018-11-30 2022-11-29 复旦大学 超高清视频图像分析加速方法及系统
CN111414517B (zh) * 2020-03-26 2023-05-19 成都市喜爱科技有限公司 视频人脸解析方法、装置及服务器

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4177239B2 (ja) * 2003-12-01 2008-11-05 日本電信電話株式会社 映像解析装置,映像解析方法,映像解析プログラムおよびその記録媒体
JP4373961B2 (ja) * 2005-05-17 2009-11-25 株式会社東芝 映像録画再生装置及び映像録画再生方法

Also Published As

Publication number Publication date
JP2013239949A (ja) 2013-11-28

Similar Documents

Publication Publication Date Title
US11694094B2 (en) Inferring digital twins from captured data
US9792388B2 (en) Pattern extraction apparatus and control method therefor
WO2019114423A1 (zh) 对模型预测值进行融合的方法、装置和设备
US20150278706A1 (en) Method, Predictive Analytics System, and Computer Program Product for Performing Online and Offline Learning
JP6493400B2 (ja) サービスチェーン管理装置、サービスチェーン管理システム、サービスチェーン管理方法、及び、プログラム
JP2000194745A (ja) トレンド評価装置及びトレンド評価方法
JP5863180B2 (ja) 映像解析処理装置、映像解析処理方法、および映像解析処理用プログラム
JP4452234B2 (ja) データストリーム処理方法、データストリーム処理プログラム、記憶媒体、および、データストリーム処理装置
US8700542B2 (en) Rule set management
JP6627475B2 (ja) 処理リソース制御プログラム、処理リソース制御装置、および処理リソース制御方法
JP7119484B2 (ja) 情報集約装置、情報集約方法、及び、プログラム
KR102290184B1 (ko) 프로모션 시점 표시 방법, 장치 및 시스템
JP5702269B2 (ja) 並列映像解析装置、並列映像解析方法及び並列映像解析プログラム
JP2012221315A (ja) 情報推薦装置及び方法及びプログラム
JP5472885B2 (ja) プログラム、ストリームデータ処理方法及びストリームデータ処理計算機
JP2018032079A (ja) データ分配プログラム、データ分配方法、およびデータ分配装置
JP5833509B2 (ja) 映像解析装置、映像解析方法及び映像解析プログラム
CN108304370B (zh) 数据更新方法及装置
JP5957507B2 (ja) データパターン分析最適化処理装置、及びデータパターン分析最適化処理方法
JP6450672B2 (ja) ネットワーク品質予測装置、ネットワーク品質予測方法、及びプログラム
JP2015200980A (ja) 検証支援プログラム、検証支援方法および検証支援装置
CN110825697B (zh) 用于对存储设备进行格式化的方法和装置
CN111681170B (zh) 一种图像处理方法、装置及电子设备
JP2019508775A (ja) 関連履歴の長さを決定するためのデバイス及び方法
CN113436641A (zh) 一种音乐转场时间点检测方法、设备及介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141017

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150910

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150929

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151124

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151216

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151221

R150 Certificate of patent or registration of utility model

Ref document number: 5863180

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees