JP2015225664A - 情報取り込み装置及び情報取り込み方法 - Google Patents

情報取り込み装置及び情報取り込み方法 Download PDF

Info

Publication number
JP2015225664A
JP2015225664A JP2015103614A JP2015103614A JP2015225664A JP 2015225664 A JP2015225664 A JP 2015225664A JP 2015103614 A JP2015103614 A JP 2015103614A JP 2015103614 A JP2015103614 A JP 2015103614A JP 2015225664 A JP2015225664 A JP 2015225664A
Authority
JP
Japan
Prior art keywords
information
data
event description
video data
action
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015103614A
Other languages
English (en)
Inventor
振華 宋
Chen-Hwa Song
振華 宋
永成 彭
Yung-Cheng Peng
永成 彭
宗▲勲▼ 李
Tsung-Hsun Li
宗▲勲▼ 李
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Quanta Computer Inc
Original Assignee
Quanta Computer Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Quanta Computer Inc filed Critical Quanta Computer Inc
Publication of JP2015225664A publication Critical patent/JP2015225664A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7837Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/174Segmentation; Edge detection involving the use of two or more images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/254Analysis of motion involving subtraction of images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • G06F21/106Enforcing content protection by specific content processing
    • G06F21/1062Editing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20016Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20036Morphological image processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20224Image subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features

Abstract

【課題】大量のイメージに代わり、意味のあるテキストを捕捉する情報取り込み装置を提供する。
【解決手段】情報取り込み装置100はビデオ取り込み装置101、プレ処理モジュール102、イメージ処理モジュール103及びテキスト生成モジュール104を有する。ビデオ取り込み装置は、ビデオデータSを取り込む。プレ処理モジュールは、ビデオデータSを、背景データSと前景データSとに分割する。イメージ処理モジュールは、前景データにしたがって、物体特徴Sと物体移動情報Sとを生成すると共に、背景データにしたがって、ビデオデータの取り込み空間情報Sを生成する。テキスト生成モジュールは、物体特徴、物体移動情報及び取り込み空間情報にしたがって、事象記述情報Sを生成する。事象記述情報は、ビデオデータ中で発生する事象に関連し、機械可読テキストファイル形式の当該事象に関する情報を含む。
【選択図】図1

Description

本発明は、情報取り込み装置及び情報取り込み方法に関するものであって、特に、画像を必要な情報に転換する情報取り込み装置及び情報取り込み方法に関するものである。
社会全体の安全意識の高まりに伴って、各種撮像装置の使用も普及し、撮像される画像の品質も、ますます良くなっている。しかし、この品質の改善は、これらの画像を処理及び使用するのに必要なコンピューティング資源や格納スペースも、急速に増加することを意味する。どのように、効果的に、これらの取得画像を処理、使用するかが、現在、解決されなければならない問題である。
現在の画像処理ソフトウェアはよく発達し、画像中の人とモノを自動的に識別することができるが、大量のイメージファイルを処理するのに必要なコンピューティング資源は、時に、獲得するのが困難である。たとえば、大量の監視カメラを用いて、そのナンバープレートにより、特定の車両を追跡するとき、人により一つずつ画像をチェックするには多くの時間がかかる。よって、大量の画像を効果的に処理し、追跡作業を補完するシステムが必要である。
本発明は、大量のイメージに代わり、意味のあるテキストを捕捉する情報取り込み装置及び情報取り込み方法を提供することを目的とする。
本発明の一実施態様に係る情報取り込み装置は、ビデオ取り込み装置、プレ処理モジュール、イメージ処理モジュール、および、テキスト生成モジュールを含む。ビデオ取り込み装置は、ビデオデータを取り込むように構成される。プレ処理モジュールは、ビデオデータを、背景データと前景データとに分割するように構成される。イメージ処理モジュールは、前景データにしたがって、物体特徴と物体移動情報とを生成すると共に、背景データにしたがって、ビデオデータの取り込み空間情報を生成する。テキスト生成モジュールは、物体特徴、物体移動情報、および、取り込み空間情報にしたがって、事象記述情報を生成する。事象記述情報はビデオデータ中で発生する事象に関連し、事象記述情報は、機械可読テキストファイル形式の当該事象に関する情報である。
一実施態様において、情報取り込み装置は、さらに、前景イメージ処理モジュール、および、背景イメージ処理モジュールを有していてもよい。前景イメージ処理モジュールは、前景データにしたがって、物体特徴と物体移動情報とを生成する。背景イメージ処理モジュールは、背景データにしたがって、ビデオデータの取り込み空間情報を生成する。
一実施態様において、前景イメージ処理モジュールは、特徴捕捉モジュール、および、動作検出モジュールを含んでいてもよい。特徴捕捉モジュールは、前景データにしたがって、物体特徴を抽出すると共に、物体特徴と特徴データベースとを比較して、物体情報を生成する。動作検出モジュールは、オブジェクト移動アルゴリズムにしたがって、物体の動作行為を獲得すると共に、動作行為と行為データベースとを比較して、行動情報を生成する。テキスト生成モジュールは、物体情報と行動情報とにしたがって、事象記述情報を生成する。
一実施態様において、特徴捕捉モジュールは、前景データの少なくともひとつの臨界点を捉え、臨界点の中央を囲む複数の固有ベクトルを生成し、特徴データベース中、固有ベクトルとの差異が最小の一物体にしたがって、物体情報を生成してもよい。
一実施態様において、動作検出モジュールは、さらに、行動情報と取り込み空間情報とにしたがって、動作追跡を生成し、テキスト生成モジュールは、さらに、動作追跡にしたがって、事象記述情報を生成してもよい。
一実施態様において、情報取り込み装置は、さらに、イメージ暗号化モジュール、ストレージモジュール、および、マイクロプロセッサを含んでいてもよい。イメージ暗号化モジュールが、ビデオを暗号化して、暗号化イメージを生成する。ストレージモジュールは、暗号化イメージを保存する。マイクロプロセッサは、事象記述情報にしたがって、暗号化イメージにアクセスし、事象記述情報にしたがって、暗号化イメージの対応部分を検索する。
また、本発明の一実施態様に係る情報取り込み方法は、ビデオデータを取り込む工程と、ビデオデータを、背景データと前景データとに分ける工程と、前景データにしたがって、物体特徴と物体移動情報とを生成する工程と、背景データにしたがって、ビデオデータに関連する取り込み空間情報を生成する工程と、物体特徴、物体移動情報、および、取り込み空間情報にしたがって、事象記述情報を生成する工程と、を含む。事象記述情報は、ビデオデータ中で発生する事象に関連し、事象記述情報は、機械可読テキストファイル形式の当該事象に関する情報である。
一実施態様において、情報取り込み方法は、さらに、前景データにしたがって、物体特徴を抽出すると共に、物体特徴と特徴データベースとを比較して、物体情報を生成する工程と、オブジェクト移動アルゴリズムにしたがって、物体の動作行為を得て、動作行為と行為データベースとを比較し、行動情報を生成する工程と、物体情報および行動情報にしたがって、事象記述情報を生成する工程と、を含んでいてもよい。
一実施態様において、情報取り込み方法は、さらに、前景データの少なくともひとつの臨界点を取り込む工程と、臨界点の中央を囲む複数の固有ベクトルを生成する工程と、特徴データベース中、固有ベクトルとの差異が最小の一物体にしたがって、物体情報を生成する工程と、を含んでいてもよい。
一実施態様において、情報取り込み方法は、さらに、行動情報と取り込み空間情報にしたがって、動作追跡を生成する工程と、動作追跡にしたがって、事象記述情報を生成する工程と、を含んでいてもよい。
一実施態様において、情報取り込み方法は、さらに、ビデオデータを暗号化して、暗号化イメージを生成する工程と、ストレージモジュール中に、暗号化イメージを保存する工程と、事象記述情報にしたがって、暗号化イメージにアクセスすると共に、事象記述情報にしたがって、暗号化イメージの対応部分を検索する工程と、を含んでいてもよい。
本発明によれば、大量の画像を効果的に処理し、追跡作業を補完することができる。
本発明の一実施形態に係る情報取り込み装置のブロック図である。 同実施形態における物体特徴を得るプロセスのフローチャートである。 同実施形態における前景データの臨界点を探すフローチャートである。 図3の実施形態による尺度空間の臨界点の検出を示す図である。 同実施形態における臨界点の回転を示す図である。 同実施形態における固有値を計算するプロセスを示す図である。 同実施形態における動作検出のフローチャートである。 本発明の別の実施形態によるイメージアクセスシステムのブロック図である。 本発明の一実施態様に係る情報取り込み方法のフローチャートである。
本明細書で詳細に説明され、添付の図面に示される装置及び方法は、非限定的な例示的実施形態であること、並びに、本発明の各種の実施形態の範囲は、特許請求の範囲によってのみ定義されることは、当業者には理解されよう。
図1は、本発明の一実施形態に係る情報取り込み装置のブロック図である。図1に示されるように、情報取り込み装置100は、ビデオ取り込み装置101、プレ処理モジュール102、イメージ処理モジュール103、および、テキスト生成モジュール104を有する。ビデオ取り込み装置101は、ビデオデータSを取り込み、ビデオデータSを、プレ処理モジュール102に送信する。プレ処理モジュール102がビデオデータSを受信後、プレ処理モジュール102は、ビデオデータSを、背景データSと前景データSとに分割すると共に、背景データSと前景データSとを、イメージ処理モジュール103に送信する。
イメージ処理モジュール103は、背景イメージ処理モジュール110と前景イメージ処理モジュール120とを有する。背景イメージ処理モジュール110は、背景データSにしたがって、ビデオデータSの取り込み空間情報Sを生成すると共に、取り込み空間情報Sを、テキスト生成モジュール104に送信する。本発明の別の実施形態によると、ユーザーにより、取り込み空間情報Sが挿入され、ストレージデバイスに保存されてもよい。前景イメージ処理モジュール120は、前景データSにしたがって、物体特徴Sと物体移動情報Sとを生成すると共に、物体特徴Sと物体移動情報Sとを、テキスト生成モジュール104に送信する。本実施形態においては、テキスト生成モジュール104は、取り込み空間情報S、物体特徴S、および、物体移動情報S(図1に示されない)の内容にしたがって、ビデオデータS中で発生する事象に関連する事象記述情報Sを生成する。
本実施形態においては、プレ処理モジュール102は、ビデオデータSの前景データSを取得すると共に、重複画像を削除して、処理する画像のサイズを減少させる機能を果たす。取得したビデオ中には、通常、重複情報があるので、この動作は、後続装置の計算負担を軽減することができる。
本実施形態においては、事象記述情報Sは、機械可読テキストファイル形式で、事象記述情報Sは、ビデオデータSにしたがって、ビデオデータS中で発生する事象に関連するWHO、WHAT、WHEN、WHERE、および、HOWの情報を含む。本発明の別の実施形態によると、事象記述情報Sは、ビデオデータS中で発生する事象に関連するWHO、WHAT、WHEN、WHERE、および、HOWの任意の組み合わせの情報であってもよい。本実施形態においては、事象記述情報Sは、jsonフォーマットであるが、本発明の別の実施形態によると、事象記述情報Sは、XMLフォーマットであってもよい。
図1に示されるように、前景イメージ処理モジュール120は、特徴捕捉モジュール121、および、動作検出モジュール122を含む。特徴捕捉モジュール121は、前景データSにしたがって、物体特徴Sを抽出すると共に、物体特徴Sと、特徴データベース130の特徴データとを比較し、特徴捕捉モジュール121は、物体特徴Sとほぼ同じ物体を選択して、物体情報SIOを生成する。動作検出モジュール122は、アルゴリズムにしたがって、物体特徴Sの物体移動情報Sを得ると共に、物体移動情報Sと動作データベース140の動作行為を比較して、行動情報SIMを生成する。本発明の別の実施形態によると、テキスト生成モジュール104は、物件情報SIOと行動情報SIMとにしたがって、事象記述情報Sを生成してもよい。物体情報SIOを生成する特徴捕捉モジュール121、および、行動情報SIMを生成する動作検出モジュール122に関連するアルゴリズムは、以下で詳細に記述される。
図2は、本実施形態における物体特徴Sを得るフローチャートである。図2に示されるように、最初に、図1のビデオ取り込み装置101は、ビデオデータ201を取り込み、図1のプレ処理モジュール102は、画像変化の可能性にしたがって、背景情報202を更新する。本実施態様においては、背景情報は、図1の背景データSである。その後、プレ処理モジュール102は、バックグラウンド除去法203により、新しい画像から、背景情報が取り去られて、前景データSを得ると共に、膨張・収縮オペレータ204により、前景データSを増強する。最後に、プレ処理モジュール102は、8連結コンポーネント205を用いて、前景情報から、前景データSを取り出す。
図3は、本実施形態における前景データSの臨界点を見つけるフローチャートである。臨界点を探すスケール不変特徴量変換(SIFT)のアルゴリズムが、図3のフローチャートに示される。最初に、特徴捕捉モジュール121は、図2中で得られる前景データSを、尺度空間の表示方式に転換する(ステップ301)。その後、臨界点が尺度空間中で見つけられる(ステップ302)。探し出された臨界点にしたがって、臨界点の勾配方向が計算される(ステップ303)。最後に、臨界点の勾配方向にしたがって、臨界点の記述子が生成される(ステップ304)。臨界点の記述子を生成するプロセスは、以下で詳細に記述される。
まず、ステップ301において、特徴捕捉モジュール121は、前景データSを、尺度空間の表示方式に転換する。つまり、イメージは、異なる尺度で、ガウシアンフィルタにより畳み込まれると共に、その後、所定尺度にしたがって、ダウンサンプルされる。本実施形態においては、ガウシアンフィルタの累乗、および、ダウンサンプリングの頻度は、通常、2の累乗に選択される。つまり、各逐次代入において、イメージは、まず、0.5倍の比例で、異なる尺度のイメージに形成され、続いて、異なる尺度のイメージは、ガウシアンフィルタにより、2の累乗で畳み込まれ、前景情報の尺度空間を生成する。
ステップ302において、尺度空間の臨界点を見つけるために、臨界点は、その後、複数の尺度で発生するガウシアンの差(Difference of Gaussians、DoG)の最大限/最小限とみなされる。図4は、図3の実施態様による尺度空間の臨界点の検出を示す図である。図4に示されるように、中間臨界点401とその同尺度の8個の隣接点と上下尺度に対応する9×2個の点26点と比較する。一つの点が、もし、尺度空間本層、および、上下二層の26個の領域中で最大、または、最小である場合、この点は、尺度の次の臨界点であると判断される。
ステップ303において、主目的は、固有値の方向を統一することである。固有値の方向を統一するために、スケール不変特徴量変換のアルゴリズムは、各固有値が異なる方向でも、その値を維持できるように確保する。公式は以下のようになる。
Figure 2015225664
Figure 2015225664
式1は、臨界点の勾配の幅の計算に用いられ、式2は、臨界点の勾配方向の計算に用いられ、L(x,y)は、ディスプレイ画素のグレイスケール地である。図5は、本発明の実施態様による臨界点の回転を示す図である。臨界点の勾配方向を得た後、図5に示されるように、ブロック全体を臨界点の中央とし、臨界点を囲む8×8サブブロックは、勾配方向に回転して、次のステップの計算を便利にする。
臨界点の方向の統一後、ステップ304を実行し、固有値の記述子を計算する。図6A〜図6Dは、本実施形態における固有値を計算するフローチャートである。図6Aに示されるように、ブロック全体が臨界点601を中心点とする周囲の16×16サブブロックの範囲は、すでに、勾配方向に回転している。よって、方向の統一後、固有値の記述子の計算を開始する。図6Bに示されるように、臨界点601を中心とし、周囲の16×16サブブロック範囲内の画素は、勾配方向に基づいて、ヒストグラムに変換され、ヒストグラムは、8方向に正規化され、つまり、45度を単位とする。図6Bを例とすると、8×8をブロックとする2×2勾配方向のプロットである。
図6Cに示されるように、図6Bに示される4個のブロックが計算されて、4×4勾配方向のプロットを形成し、各勾配方向の幅は、図6Dに示されるような128次元勾配ヒストグラムに転換される。固有値に照射する影響を除去するため、図6Dに示される128次元勾配ヒストグラムが正規化され、各ヒストグラムのデータが収集されて、スケール不変特徴量変換の固有値を得る。その後、いくつかの臨界点が物体特徴Sで得られ、各臨界点は、128次元記述子を有する。特徴捕捉モジュール121は、128次元記述子にしたがって、特徴データベース130で比較すると共に、式3を用いて、相似度が高い物体を探し出す。
Figure 2015225664
言い換えれば、特徴データベース130中、128次元記述子とのベクトル差が最小の物体を探索するためにユークリッド距離が用いられ、この物体は、すなわち、相似度が最も高い物体である。図1の特徴捕捉モジュール121は、よって、特徴データベース130中、相似度が最も高い物体にしたがって、物体特徴Sの物体情報SIOを生成する。
上述の探し出された物体特徴Sに関して、我々は、連続して変動する物体特徴Sに対し、物体特徴Sを表示するディスプレイブロック内の各ディスプレイ画素の変化時間を連続的に記録する。その後、これらの変化時間の勾配方向を引き出し、画面中の前景ブロックの運動方向を得る。
図7は、本実施形態における動作を検出するフローチャートである。図7に示されるように、最初に、主張した2次元記憶空間は、それぞれ、イメージ全体に対応し、運動履歴イメージと称される(ステップ701)。運動履歴イメージは前景データの動作追跡を有し、動作追跡上で、現在発生する移動の時間を記録する。本実施形態では、移動の時間は、ナノセカンド単位で発生する。
その後、運動履歴イメージ全体で、それぞれ、記録された位置と移動時間とにしたがって、勾配方向のX方向とY方向とが計算され(ステップ702)、移動速度のX軸とY軸とが得られる。最後に、イメージの前景データSの移動方向が、三角関数により計算され(ステップ703)、一連の移動方向情報を収集することにより、動作追跡が得られる。その後、動作検出モジュール122は、物体移動情報S中に、移動方向と動作追跡とを記録し、物体移動情報Sの動作追跡と動作データベース140の動作行為とを比較し、取り込み空間情報Sの補助により、移動方向と実際の速度が得られる。動作検出モジュール122は、移動方向と速度などの関連情報を、行動情報SIMに記録する。
取り込み空間情報S、物体特徴S、および、物体移動情報Sの内容にしたがって、テキスト生成モジュール104は、ビデオデータSで発生する事象に関連する事象記述情報Sを生成する。本実施形態においては、事象記述情報Sは、jsonフォーマットであるが、本発明の別の実施形態によると、事象記述情報Sは、XMLフォーマットであってもよい。本実施形態においては、動作検出モジュール122は、別のユーザーにより定義される動作データベース140の動作行為を検出することができ、本発明の検出方法を説明するためだけに使用されるが、任意の形式で、動作行為を移動に限定するものではない。
図8は、本発明の別の実施態様によるイメージアクセスシステムのブロック図である。図8に示されるように、イメージアクセスシステム800は、情報取り込み装置100、イメージ暗号化モジュール801、ストレージモジュール812、および、マイクロプロセッサ803を含む。情報取り込み装置100のビデオ取り込み装置101がイメージデータSを取り込んだ後、イメージデータSが、イメージ暗号化モジュール801に送信されて、暗号化され、ストレージモジュール812に保存される。マイクロプロセッサ803は、データ取り込み装置100により生成される事象記述情報Sにしたがって、ストレージモジュール812に保存される暗号化イメージデータSに対応するイメージ部Sにアクセスする。
ストレージモジュール802に保存される暗号化ビデオデータSは非常に大きいので、発生したいくつかの事象にしたがって、特定部分を検索するとき、人の操作により検索する必要がある。データ取り込み装置100により生成される事象記述情報Sの事象を回収し、その後、事象記述情報S中に記録される時間記録にしたがって、対応部分にアクセスする場合、検索時間とコストは、大幅に減少する。
図9は、本発明の実施態様による情報取り込み方法のフローチャートである。図9に示されるように、最初に、ビデオデータが捕捉される(ステップS91)。その後、ビデオデータが、背景データと前景データに分けられる(ステップS92)。前景データにしたがって、物体特徴と物体移動情報が生成される(ステップS93)。背景データにしたがって、ビデオデータに関連する取り込み空間情報が生成される(ステップS94)。物体特徴、物体移動情報、および、取り込み空間情報にしたがって、事象記述情報が生成され(ステップS95)、事象記述情報は、ビデオデータ中で発生する事象に関連する。事象記述情報は、事象の関連情報を含み、事象記述情報は、機械可読テキストファイル形式である。
ステップS91に戻ると、ビデオデータの捕捉後、本方法は、ビデオデータを暗号化して、暗号化イメージを生成する工程(ステップS96)と、暗号化イメージを、ストレージモジュールに保存する工程(ステップS97)と、ステップS95で生成される事象記述情報にしたがって、暗号化イメージにアクセスすると共に、事象記述情報の関連情報にしたがって、暗号化イメージの対応部分を検索する工程(ステップS98)と、を含む。
本実施形態によると、本発明で開示される情報取り込み装置と情報取り込み方法は、大量の監視カメラ中に用いることができ、ナンバープレートにより、特定の車両を探す。コンピュータは、情報取り込み装置100にしたがって、事象記述情報Sを生成すると共に、非常に短時間で、特定のナンバープレートを有する車両が、どのカメラに出現するかを特定することや、または、コンピュータが、事象記述情報Sにしたがって、容易に、特定のナンバープレートを有する車がどこからどこに行くのか探すことができる。従来の監視画面を人によって逐一フィルタリングしたり、人力で車両を追跡したりするのと比較して、処理時間とコストを大幅に減少することができる。
本発明の別の実施形態によると、本発明は、たとえば、地下鉄の管理システム等の大量の監視カメラに用いることができる。管理者が利用者の急速に増加に気がつくと、急速に増加する利用者のために、運転車両を増やすなどの適切な反応を実施することができる。たとえば、情報取り込み装置100は、ビデオ取り込み装置101により捕捉されるビデオデータSにしたがって、ビデオデータS中の人数を有する事象記述情報Sを生成する。管理者は、事象記述情報Sの人数にしたがって、即時に、利用者数の変化に気づくことができ、最適な決定を下すことができる。
本発明では好ましい実施例を前述の通り開示したが、これらは決して本発明の範囲を限定するものではなく、当該技術を熟知する者なら誰でも、本発明の精神と領域を脱しない範囲内で各種の変動や潤色を加えることができる。本発明の保護範囲は、特許請求の範囲で指定した内容を基準とする。
100 情報取り込み装置
101 ビデオ取り込み装置
102 プレ処理モジュール
103 イメージ処理モジュール
104 テキスト生成モジュール
110 背景イメージ処理モジュール
120 前景イメージ処理モジュール
121 特徴捕捉モジュール
122 動作検出モジュール
201 ビデオデータ
202 背景情報
203 バックグラウンド除去法
204 膨張・収縮オペレータ
205 8連結コンポーネント
401、601 臨界点
800 イメージアクセスシステム
801 イメージ暗号化モジュール
802 ストレージモジュール
803 マイクロプロセッサ
ビデオデータ
前景データ
背景データ
取り込み空間情報
物体特徴
物体移動情報
事象記述情報
IO 物体情報
IM 行動情報
イメージ部

Claims (11)

  1. 情報取り込み装置であって、
    ビデオデータを取り込むビデオ取り込み装置と、
    前記ビデオデータを、背景データと前景データとに分割するプレ処理モジュールと、
    前記前景データにしたがって、物体特徴と物体移動情報とを生成し、前記背景データにしたがって、前記ビデオデータの取り込み空間情報を生成するイメージ処理モジュールと、
    前記物体特徴、前記物体移動情報、および、前記取り込み空間情報にしたがって、事象記述情報を生成するテキスト生成モジュールと、を有し、
    前記事象記述情報は、前記ビデオデータ中で発生する事象に関連し、前記事象記述情報は、機械可読テキストファイル形式の当該事象に関する情報を含むことを特徴とする情報取り込み装置。
  2. 前記イメージ処理モジュールは、さらに、
    前記前景データにしたがって、前記物体特徴と前記物体移動情報とを生成する前景イメージ処理モジュールと、
    前記背景データにしたがって、前記ビデオデータの前記取り込み空間情報を生成する背景イメージ処理モジュールと、を有することを特徴とする請求項1に記載の情報取り込み装置。
  3. 前記前景イメージ処理モジュールは、
    前記前景データにしたがって、前記物体特徴を抽出すると共に、前記物体特徴と特徴データベースとを比較して、物体情報を生成する特徴捕捉モジュールと、
    オブジェクト移動アルゴリズムにしたがって、前記物体の動作行為を得ると共に、前記動作行為と行為データベースとを比較して、行動情報を生成する動作検出モジュールと、を有し、
    前記テキスト生成モジュールは、前記物体情報と前記行動情報とにしたがって、前記事象記述情報を生成することを特徴とする請求項2に記載の情報取り込み装置。
  4. 前記特徴捕捉モジュールは、前記前景データの少なくともひとつの臨界点を捕捉し、前記臨界点の中央を囲む複数の固有ベクトルを生成すると共に、前記特徴データベース中、前記固有ベクトルとの差異が最小の一物体にしたがって、前記物体情報を生成することを特徴とする請求項3に記載の情報取り込み装置。
  5. 前記動作検出モジュールは、さらに、前記行動情報と前記取り込み空間情報とにしたがって、動作追跡を生成し、前記テキスト生成モジュールは、さらに、前記動作追跡にしたがって、前記事象記述情報を生成することを特徴とする請求項3に記載の情報取り込み装置。
  6. さらに、前記ビデオデータを暗号化して、暗号化イメージを生成するイメージ暗号化モジュールと、
    前記暗号化イメージを保存するストレージモジュールと、
    前記事象記述情報にしたがって、前記暗号化イメージにアクセスすると共に、前記事象記述情報にしたがって、前記暗号化イメージの対応部分を検索するマイクロプロセッサと、を有することを特徴とする請求項1に記載の情報取り込み装置。
  7. 情報取り込み方法であって、
    ビデオデータを取り込む工程と、
    前記ビデオデータを、背景データと前景データとに分割する工程と、
    前記前景データにしたがって、物体特徴と物体移動情報とを生成する工程と、
    前記背景データにしたがって、前記ビデオデータに関連する取り込み空間情報を生成する工程と、
    前記物体特徴、前記物体移動情報、および、前記取り込み空間情報にしたがって、事象記述情報を生成する工程と、を有し、
    前記事象記述情報は、前記ビデオデータ中で発生する事象に関連し、前記事象記述情報は、機械可読テキストファイル形式の当該事象に関する情報を含むことを特徴とする情報取り込み方法。
  8. さらに、前記前景データにしたがって、前記物体特徴を抽出し、前記物体特徴と特徴データベースとを比較して、物体情報を生成する工程と、
    オブジェクト移動アルゴリズムにしたがって、前記物体の動作行為を得て、前記動作行為と行為データベースとを比較して、行動情報を生成する工程と、
    前記物体情報および前記行動情報にしたがって、前記事象記述情報を生成する工程と、を有することを特徴とする請求項7に記載の情報取り込み方法。
  9. さらに、前記前景データの少なくともひとつの臨界点を取り込む工程と、
    前記臨界点の中心を囲む複数の固有ベクトルを生成する工程と、
    前記特徴データベース中、前記固有ベクトルとの差異が最小の一物体にしたがって、前記物体情報を生成する工程と、を有することを特徴とする請求項8に記載の情報取り込み方法。
  10. さらに、前記行動情報と前記取り込み空間情報にしたがって、動作追跡を生成する工程と、
    前記動作追跡にしたがって、前記事象記述情報を生成する工程と、を有することを特徴とする請求項8に記載の情報取り込み方法。
  11. さらに、前記ビデオデータを暗号化して、暗号化イメージを生成する工程と、
    前記暗号化イメージを、ストレージモジュール中に保存する工程と、
    前記事象記述情報にしたがって、前記暗号化イメージにアクセスすると共に、前記事象記述情報にしたがって、前記暗号化イメージの対応部分を検索する工程と、を有することを特徴とする請求項8に記載の情報取り込み方法。
JP2015103614A 2014-05-28 2015-05-21 情報取り込み装置及び情報取り込み方法 Pending JP2015225664A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
TW103118537A TWI518601B (zh) 2014-05-28 2014-05-28 資訊擷取裝置以及方法
TW103118537 2014-05-28

Publications (1)

Publication Number Publication Date
JP2015225664A true JP2015225664A (ja) 2015-12-14

Family

ID=54703278

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015103614A Pending JP2015225664A (ja) 2014-05-28 2015-05-21 情報取り込み装置及び情報取り込み方法

Country Status (4)

Country Link
US (1) US20150350539A1 (ja)
JP (1) JP2015225664A (ja)
CN (1) CN105184810A (ja)
TW (1) TWI518601B (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110276298B (zh) * 2019-06-21 2021-05-11 腾讯科技(深圳)有限公司 用户行为的判定方法、装置、存储介质和计算机设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006157411A (ja) * 2004-11-29 2006-06-15 Toshiba Corp 撮像装置、撮像システム及び撮像装置の処理方法
JP2007213350A (ja) * 2006-02-09 2007-08-23 Fuji Xerox Co Ltd 情報像処理装置及び情報像処理方法。
JP2009230565A (ja) * 2008-03-24 2009-10-08 Laurel Bank Mach Co Ltd 行動管理装置
JP2013182416A (ja) * 2012-03-01 2013-09-12 Pioneer Electronic Corp 特徴量抽出装置、特徴量抽出方法及び特徴量抽出プログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6005561A (en) * 1994-12-14 1999-12-21 The 3Do Company Interactive information delivery system
TWI420401B (zh) * 2008-06-11 2013-12-21 Vatics Inc 一種回授式物件偵測演算法
US8266148B2 (en) * 2008-10-07 2012-09-11 Aumni Data, Inc. Method and system for business intelligence analytics on unstructured data
CN101510257B (zh) * 2009-03-31 2011-08-10 华为技术有限公司 一种人脸相似度匹配方法及装置
US8781152B2 (en) * 2010-08-05 2014-07-15 Brian Momeyer Identifying visual media content captured by camera-enabled mobile device
US9064176B2 (en) * 2012-01-31 2015-06-23 Industry-University Cooperation Foundation Hanyang University Apparatus for measuring traffic using image analysis and method thereof

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006157411A (ja) * 2004-11-29 2006-06-15 Toshiba Corp 撮像装置、撮像システム及び撮像装置の処理方法
JP2007213350A (ja) * 2006-02-09 2007-08-23 Fuji Xerox Co Ltd 情報像処理装置及び情報像処理方法。
JP2009230565A (ja) * 2008-03-24 2009-10-08 Laurel Bank Mach Co Ltd 行動管理装置
JP2013182416A (ja) * 2012-03-01 2013-09-12 Pioneer Electronic Corp 特徴量抽出装置、特徴量抽出方法及び特徴量抽出プログラム

Also Published As

Publication number Publication date
US20150350539A1 (en) 2015-12-03
TW201545074A (zh) 2015-12-01
TWI518601B (zh) 2016-01-21
CN105184810A (zh) 2015-12-23

Similar Documents

Publication Publication Date Title
JP6814673B2 (ja) 移動経路予測装置、及び移動経路予測方法
Wang et al. An effective method for plate number recognition
Ravindran et al. A novel approach to automatic road-accident detection using machine vision techniques
JP5936561B2 (ja) 画像における外観及びコンテキストに基づく物体分類
KR20170056860A (ko) 이미지 생성 방법 및 장치
JP5656768B2 (ja) 画像特徴量抽出装置およびそのプログラム
Babu et al. Texture and steerability based image authentication
Mursi et al. An improved SIFT-PCA-based copy-move image forgery detection method
Kanter Color Crack: Identifying Cracks in Glass
Manjunatha et al. Deep learning-based technique for image tamper detection
Trung et al. Blind inpainting forgery detection
Deng et al. Attention-aware dual-stream network for multimodal face anti-spoofing
US9392146B2 (en) Apparatus and method for extracting object
Kalam et al. Gender classification using geometric facial features
JP2015225664A (ja) 情報取り込み装置及び情報取り込み方法
KR101733288B1 (ko) 방향정보를 이용한 객체 검출기 생성 방법, 이를 이용한 객체 검출 장치 및 방법
Tripathi et al. Automated image splicing detection using texture based feature criterion and fuzzy support vector machine based classifier
Alghamdi et al. Automated person identification framework based on fingernails and dorsal knuckle patterns
Zou et al. Real-time infrared pedestrian detection via sparse representation
JP6393495B2 (ja) 画像処理装置および物体認識方法
CN116091998A (zh) 图像处理方法、装置、计算机设备和存储介质
Maser et al. Identifying the origin of finger vein samples using texture descriptors
Lakshmi et al. Face recognition in surveillance video for criminal investigations: a review
Monika et al. Image forgery detection and localization using block based and key-point based feature matching forensic investigation
Deepa et al. Automatic image registration using 2d-discrete wavelet transform

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160421

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160426

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160719

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170315

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20170905