JPWO2008078736A1 - 同一性判定装置、同一性判定方法および同一性判定用プログラム - Google Patents

同一性判定装置、同一性判定方法および同一性判定用プログラム Download PDF

Info

Publication number
JPWO2008078736A1
JPWO2008078736A1 JP2008551112A JP2008551112A JPWO2008078736A1 JP WO2008078736 A1 JPWO2008078736 A1 JP WO2008078736A1 JP 2008551112 A JP2008551112 A JP 2008551112A JP 2008551112 A JP2008551112 A JP 2008551112A JP WO2008078736 A1 JPWO2008078736 A1 JP WO2008078736A1
Authority
JP
Japan
Prior art keywords
identity
frame
distance
inter
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008551112A
Other languages
English (en)
Other versions
JP5088507B2 (ja
Inventor
真澄 石川
真澄 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2008551112A priority Critical patent/JP5088507B2/ja
Publication of JPWO2008078736A1 publication Critical patent/JPWO2008078736A1/ja
Application granted granted Critical
Publication of JP5088507B2 publication Critical patent/JP5088507B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/30Determination of transform parameters for the alignment of images, i.e. image registration
    • G06T7/33Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/35Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
    • H04H60/37Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for identifying segments of broadcast information, e.g. scenes or extracting programme ID
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/35Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
    • H04H60/48Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for recognising items expressed in broadcast information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/56Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
    • H04H60/59Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54 of video
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/147Scene change detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20048Transform domain processing
    • G06T2207/20064Wavelet transform [DWT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20076Probabilistic image processing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2508Magnetic discs
    • G11B2220/2516Hard disks

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

入力映像中の様々な時間的位置に登場する対象物について、対象物が互いに同一であるか否かの判定を可能とする。入力映像から検出された複数の対象物間の同一性を、対象物が検出された各々のフレームの間の距離であるフレーム間距離をもとに決まる対象物同一性確率を利用して判定する。

Description

本発明は、同一性判定装置、同一性判定方法および同一性判定用プログラムに関し、特に映像から検出された対象物間の同一性を判定するための同一性判定装置、同一性判定方法および同一性判定用プログラムに関する。
従来の同一性判定システムの一例が、特許文献1に記載されている。
特許文献1の手法は、映像の各フレームから検出された対象物を、各対象物の類似性をもとにグループにまとめ、各グループを構成する対象物の登場回数に基づいて登場対象物一覧を生成する。たとえば、映像から抽出された人物の顔についてグループ化し、各グループから顔の登場回数に基づいて出演者一覧を生成する。
そのための構成として、図1に示すように、入力映像を複数枚の静止画として抽出する静止画像抽出手段700と、任意の枚数の静止画で構成されるショットに区分する画像区分手段701と、各ショットに所定の映像が撮影さているか否かを判定する所定映像判定手段702と、所定映像が入力映像中に既に撮影されているか否かを判定する所定映像既出判定手段703と、所定映像の類似性をもとにグループ化するとともに、所定映像の登場回数を計測する所定映像分類計測手段704と、登場回数に基づいて映像登場一覧を作成する映像登場一覧作成手段705とから構成されている。
また、別の同一性判定システムの一例が、特許文献2に記載されている。
特許文献2の手法は、映像や音声などの入力信号を構成するセグメントについて、セグメントから抽出される特徴量の間の類似性が高く、かつ時間的距離が所定閾値以下のセグメントの組み合わせを、信号の意味的構造が同一としてグループにまとめる。たとえば、2人の話し手の会話シーンについては、話し手に応じて交互に現れるセグメントを、話し手ごとにグループ化する。
そのための構造として、図2に示すようにある連続フレームから成るセグメントから映像特徴量を抽出する映像特徴量抽出部801と音声特徴量を抽出する音声特徴量抽出部802と、セグメント対の類似性を測定する特徴量類似性測定部805と、セグメント対のうち互いの時間的距離が所定の時間閾値以内でかつ非類似性が所定の非類似性以下であるセグメントを検出してまとめることでシーンを検出するシーン検出部806とから構成されている。
特開平10−234004号公報 特開2000−285242号公報 岩井儀雄、山口修、平山高嗣、他1名"画像処理による顔検出と顔認識"、情報処理学会研究報告(CVIM−149)、2005年 pp.343〜368 赤松茂、"コンピュータによる顔の認識―サーベイ―"、電子情報通信学会論文誌 Vol.J80−A No.8 pp.1215〜1230 1997.8
従来手法における第1の問題点は、対象物の同一性判定を高精度に行えない点である。その理由は、対象物の同一性が対象物間の類似度のみに基づいて決定されるため、対象物の特徴量の抽出や類似度の算出に失敗した場合や、対象物が互いに異なる照明条件や向きで撮影された場合に、同一性判定が不正確になるためである。
従来手法における第2の問題点は、フレーム間距離が所定の時間閾値以上離れているセグメント対について同一性を判定できない点である。例えばドラマ映像中で時間的に離れて存在し、かつ共通の人物を含むセグメント対について同一と判定しない。その理由は、従来手法では同一のセグメント対は、互いに時間的に近い位置に存在することを前提としており、セグメント対から抽出される特徴量が互いに類似していても時間的に離れて存在する場合には同一と判定しないためである。
本発明の目的は、映像中の様々な時間的位置に登場する対象物について、対象物が互いに同一であるか否かを判定することにある。
本発明によれば、入力映像から検出された複数の対象物間の同一性を、対象物が検出された各々のフレームの間の距離であるフレーム間距離をもとに決まる対象物同一性確率を利用して判定することを特徴とする同一性判定装置が提供される。
また、本発明によれば、入力映像から検出された複数の対象物間の同一性を、対象物が検出された各々のフレームの間の距離であるフレーム間距離をもとに決まる対象物同一性確率を利用して判定することを特徴とする同一性判定方法が提供される。
更に、本発明によれば、入力映像から検出された複数の対象物間の同一性を、対象物が検出された各々のフレームの間の距離であるフレーム間距離をもとに決まる対象物同一性確率を利用して判定することを特徴とする同一性判定装置としてコンピュータを機能させるための同一性判定用プログラムが提供される。
第1の効果は、対象物の同一性判定を高精度に行える点である。その理由は、対象物同一性確率の算出あるいは選択時に、フレーム間距離に対する同一対象物の出現確率を利用することによって、入力映像のシナリオに応じた同一性判定が実現できるためである。また、対象物間の特徴量の類似度に加えてフレーム間距離によって算出あるいは選択される対象物同一性確率を用いることにより、動物体の特徴量の抽出や類似度の算出に失敗した場合に同一性判定の精度劣化が抑えられるためである。
第2の効果は、所定の時間閾値以上フレーム間距離が離れているセグメント対について同一性を判定できる点である。例えばドラマ映像中で時間的に離れて存在し、かつ共通の人物を含むセグメント対について同一と判定できる。その理由は、セグメント対が時間的に離れて存在する場合であっても、セグメント対のフレーム間距離をもとに算出または選択される映像区間対の同一性確率に応じて同一と判定できるためである。
従来の映像生成システムの一例である特許文献1のブロック図である。 従来の映像生成システムの一例である特許文献2のブロック図である。 本発明を実施するための第1の最良の形態の構成を示すブロック図である。 本発明を実施するための第1の最良の形態の動作を示す流れ図である。 本発明を実施するための第1の最良の形態におけるフレーム間距離算出手段の動作を説明する図である。 同一対象物が所定の時間以内に再度出現する傾向があるという事前知識に基づく同一性確率算出関数の一例を示す図である。 同一対象物が一定時間連続して出現する傾向があるという事前知識に基づく同一性確率算出関数の一例を示す図である。 同一対象物が一定時間後に再度出現する傾向があるという事前知識に基づく同一性確率算出関数の一例を示す図である。 同一対象物は同一フレーム内に登場しないという事前知識に基づく同一性確率算出関数の一例を示す図である。 本発明を実施するための第2の最良の形態の構成を示すブロック図である。 本発明を実施するための第2の最良の形態の動作を示す流れ図である。 本発明を実施するための第3の最良の形態の構成を示すブロック図である。 本発明を実施するための第3の最良の形態の動作を示す流れ図である。 本発明を実施するための第4の最良の形態の構成を示すブロック図である。 本発明を実施するための第5の最良の形態の構成を示すブロック図である。 本発明を実施するための第6の最良の形態の構成を示すブロック図である。 実施例1の構成を示すブロック図である。 実施例2の構成を示すブロック図である。 実施例3の構成を示すブロック図である。 本発明を実施するための第7の最良の形態の構成を示すブロック図である。 本発明を実施するための第7の最良の形態の動作を示す流れ図である。 同一対象物が所定の時間以内に所定範囲の位置座標で再度出現する傾向があるという事前知識に基づく同一性確率算出関数の一例を示す図である。 同一対象物が一定時間、一定位置に連続して出現する傾向があるという事前知識に基づく同一性確率算出関数の一例を示す図である。 同一対象物が一定時間後に、ほぼ同一位置に再度出現する傾向があるという事前知識に基づく同一性確率算出関数の一例を示す図である。 実施例4の構成を示すブロック図である。 本発明を実施するための第1の最良の形態における判定結果出力手段の出力例を示した表である。 本発明を実施するための第2の最良の形態において、対象物同一性確率記憶部に記憶されるフレーム間距離と対象物同一性確率の対応表の一例を示した表である。 本発明を実施するための第3の最良の形態における判定結果出力手段の出力例を示した表である。
符号の説明
100,200,300,400,500,600,900 データ処理装置
101,201,301,901 対象物検出手段
102,202,303,902 フレーム間距離算出手段
905 座標間距離算出手段
302 特徴量抽出手段
103,305 対象物同一性確率算出手段
203,903 対象物同一性確率選択手段
104,204,306,904 同一性判定手段
304 類似度算出手段
110,210,310,410,510,610,910 映像入力手段
120,220,420,520,920 記憶装置
320,620 画像記憶装置
121,921 同一性確率算出関数記憶部
130,230,320,430,530,630,930 判定結果出力手段
440,540,640 同一性判定用プログラム
221 対象物同一性確率記憶部
331 画像記憶部
240,550 コマンド入力装置
700 静止画抽出手段
701 画像区分手段
702 所定映像判定手段
703 所定映像既出判定手段
704 所定映像分類計測手段
705 映像登場一覧作成手段
800 ビデオ分割部
801 映像特徴量抽出部
802 音声特徴量抽出部
803 ビデオセグメントメモリ
804 セグメント特徴量メモリ
805 特徴量類似性測定部
806 シーン検出部
以下、図面を参照して本発明を実施するための最良の形態について詳細に説明する。
(最良の形態1)
次に、本発明を実施するための第1の最良の形態について図面を参照して詳細に説明する。
図3を参照すると、本発明を実施するための第1の最良の形態は、プログラム制御により動作するデータ処理装置100と、映像を入力する映像入力手段110と、対象物同一性確率算出関数を記憶する記憶装置120と、対象物の同一性判定の結果を出力する判定結果出力手段130から構成されている。
データ処理装置100は、対象物検出手段101と、フレーム間距離算出手段102と、対象物同一性確率算出手段103と、同一性判定手段104を含む。
対象物検出手段101は、映像入力手段から受け取った映像を構成する各フレームから対象物を検出し、対象物が検出されたフレーム番号を抽出する。また、検出された対象物にそれぞれ固有の対象物IDを採番する。フレーム間距離算出102にフレーム番号と対象物IDを出力する。
対象物は、フレーム全体であっても、車やボールのように同一の動き成分を持つ動領域、あるいは空や地面のように同一の色成分を持つ静止領域、あるいは人物や動物のようにあるパターンを持った画像領域のようなフレームの一部分であっても構わない。
対象物IDは、対象物検出手段101によって検出された順に振られる番号であっても、アルファベットであっても、その他の文字あるいは記号であっても良い。
フレーム間距離算出手段102は、対象物検出手段101からフレーム番号と対象物IDを受け取り、受け取ったフレーム番号をもとに対象物が検出された各々のフレームの間の距離であるフレーム間距離を算出する。対象物同一性確率算出手段103に、フレーム間距離、前記フレーム間距離を算出するフレーム対、前記フレーム対から検出された対象物の対象物IDを出力する。
フレーム間距離は、フレーム番号の差分値をもとに算出されるメディア時間であっても、フレームが対応する台本における時刻の差分値をもとに算出されるシナリオ時間であっても、ショットの切り替わりやカメラワークの変化、シーンの切り替わり、BGMの変化、または背景の画像特徴量の変化のいずれか一つまたはそれらの組み合わせに基づいて重み付けられたメディア時間またはシナリオ時間であってもよい。
対象物同一性確率算出手段103は、同一性確率算出関数記憶部121から選択した対象物同一性確率算出関数を用いて、フレーム間距離算出手段102から受け取ったフレーム間距離を算出するフレーム対について各々のフレームに含まれる対象物の間の対象物同一性確率を算出する。同一性判定手段104に、対象物同一性確率、前記対象物同一性確率を算出する対象物の対象物IDおよび、前記対象物が検出されたフレーム番号を出力する。
同一性判定手段104は、対象物同一性確率算出手段103から受け取った各対象物の間の対象物同一性確率をもとに、入力映像から検出された対象物群の同一性を判定し、同一と判定された対象物に同一のグループIDを付与する。判定結果出力手段130に、同一性判定結果として、グループID、前記グループに属する対象物IDおよび前記対象物が検出されたフレーム番号を出力する。
グループIDは、グループに属する対象物の個数や、対象物が画像に占める大きさや、BGMの盛り上がり箇所で検出された対象物の個数などに基づいた順位によって決定される番号であっても、アルファベットであっても良い。
記憶装置120は、同一性確率算出関数記憶部121を含む。
同一性確率算出関数記憶部121は、フレーム間の距離をもとにフレーム対に含まれる対象物の同一性を算出する対象物同一性確率関数を記憶し、対象物同一性確率算出手段103によって選択された対象物同一性確率関数を対象物同一性確率算出手段103に出力する。
判定結果出力手段130は、同一性判定手段104から受け取った対象物の同一性判定結果を出力する。出力の形式は、検出された対象物ごとにグループID、フレーム番号、対象物IDを表形式で画面提示してもよいし、その他の形式であっても良い。
(最良の形態の動作1)
次に、図3及び図4のフローチャートを参照して本最良の形態の全体の動作について詳細に説明する。
まず、映像入力手段110は、対象物検出手段101に入力映像を構成する各フレームを入力する(図4のステップA01)。
対象物検出手段101は、入力フレームから対象物を検出する(ステップA02)。
対象物の検出方法としてパターン認識の手法を用いる。一例として、対象物検出手段101において、あらかじめテンプレートとして記憶した対象物の画像と入力フレームとの画素値の差分を算出し、差分が閾値以下のとき入力画像に対象物が存在すると判定する手法が挙げられる。テンプレートとして記憶する対象物の画像は、ユーザが映像入力手段を介して入力する画像であっても、ユーザが指定する対象物の特徴をもとに対象物検出手段が選択した画像であっても良い。対象物検出には、例示したテンプレートを利用した手法を用いても、別の方法を適用しても構わない。
対象物が検出された場合には、対象物の検出されたフレーム番号と、対象物IDをフレーム間距離算出手段102に出力する。
フレーム間距離算出手段102は、対象物検出手段101において入力フレームから対象物が検出された場合に、対象物が検出された既出のフレームとのフレーム間距離を算出する(ステップA03)。
フレーム間距離算出手段102の処理について図5を用いて説明する。今、映像入力手段110から入力されたフレーム(d)から、対象物検手段102によって対象物が検出され、対象物ID『D』が採番されたとする。既出のフレーム(a)および(c)からは、既に対象物検出手段102によって対象物が検出され、それぞれ対象物ID『A』および『C』が採番されており、既出のフレーム(b)からは対象物が検出されなかったものとする。このとき、フレーム間距離算出手段102は、入力フレーム(d)と、対象物が検出された既出のフレーム(a)および(c)との間で、それぞれフレーム間距離DadおよびDcdを算出する。また、対象物が検出されなかったフレーム(b)との間ではフレーム間距離を算出しない。フレーム間距離Dadは、フレーム(a)および(d)のフレーム番号faおよびfdをもとに算出される。フレーム間距離Dadは、フレーム番号faとfdの差分であっても、faとfdがそれぞれ対応する台本における時刻の差分であってもそれ以外でも良い。
対象物同一性確率算出手段103は、同一性確率算出関数記憶部121から対象物同一性確率算出関数を選択し(ステップA04)、
選択した対象物同一性確率算出関数を用いて、入力フレームと既出のフレームとの間で算出されるフレーム間距離をもとに、入力フレームと既出のフレームからそれぞれ検出された対象物の間の同一性を意味する対象物同一性確率を算出する(ステップA05)。
対象物同一性確率算出関数は、以下に示すように入力映像における対象物の出現傾向の事前知識に基づく関数を用いても良い。
(1)『同一の対象物が所定時間以内に再度出現する傾向がある』という事前知識に基づく関数(図6)
フレーム間距離がD1よりも短いフレーム対に含まれる対象物について、フレーム間距離が短いほど対象物同一性確率を線形に大とし、フレーム間距離がD1よりも長いフレーム対に含まれる対象物について対象物同一性確率を一定とする関数は、同一の対象物がフレーム間距離D1以内に再度登場する確率が高い映像に対して、検出された対象物の間の同一性判定に効果的である。
1例として、ドラマ映像の出演者の同一性判定について説明する。ドラマ映像においては、ストーリー上の同一場面を表す映像区間D1内では出演者が繰り返し登場する。そのため、フレーム間距離D1以内で同一の出演者が再度登場する確率が高い。このようなケースに対して本関数を用いた場合、出演者の同一性を良好に判定できるため有効である。
(2)『同一の対象物は一定時間連続して出現する傾向がある』という事前知識に基づく関数(図7)
フレーム間距離がD2よりも短いフレーム対に含まれる対象物について、対象物同一性確率を一定に大とし、フレーム間距離がD2よりも長いフレーム対に含まれる対象物について、フレーム間距離が長いほど対象物同一性確率を小とする関数が、同一の対象物がフレーム間距離D2以内に高確率で再度登場する映像に対して、検出された対象物の間の同一性判定に効果的である。
1例として、静止カメラで片車線を撮影した道路監視映像における車体の同一性判定について説明する。映像中では、車体が登場して走り去るまでの連続する映像区間D2において同一の車体が連続して登場する。そのため、フレーム間距離D2において同一の車体が登場する確率は高い。このようケースに対して本関数を用いた場合、車体の同一性を良好に判定できるため有効である。
(3)『同一の対象物はある一定時間後に再度出現する傾向がある』という事前知識に基づく関数(図8)
フレーム間距離がD3、D3’となるフレーム対に含まれる対象物の対象物同一性確率を大とし、フレーム間距離がD3、D3’から離れる従って同一性確率を小とする関数は、同一の対象物が一定時間D3、D3’後に再度登場する確率が高い映像に対して、検出された対象物間の同一性判定に効果的である。
1例として、自動車レースの映像中の車体の同一性判定について説明する。車体がコースを周回する自動車レースでは、ある位置に設置された撮影カメラは車体がカメラ設置位置を通る度に車体を撮影する。そのため、映像中で車体が登場してから、一定時間D3、D3’後に再度同じ車体が登場する確率が高い。このようなケースに対して本関数を用いた場合、車体の同一性を良好に判定できるため有効である。
(4)『同一の対象物は同一フレームには現れない』という事前知識に基づく関数(図9)
フレーム間距離が0となるフレーム対に含まれる対象物の対象物同一性確率を0とする関数は、同一フレームから複数の対象物が検出されたときに、検出された対象物が互いに異なる対象物となる映像に対して、検出された対象物間の同一性判定に効果的である。
1例として、ドラマ映像の出演者の同一性判定について説明する。ドラマ映像においては、同一人物が同じフレームに登場する確率は0である。このようなケースに対して本関数を用いた場合、異なる対象物を同一と誤判定するのを防ぐことが可能なため有効である。
対象物同一性確算出関数として、上記のいずれかまたは上記を組み合わせた関数を用いても、他の関数を用いても良い。
対象物同一性確率算出関数として、図8を用いた場合の対象物同一性確率算出手段103の動作を説明する。今、フレーム間距離算出手段102から、入力フレーム(d)と、既出フレーム(a)および(c)の間で算出されるフレーム間距離DadおよびDcdが入力されたとする。このとき、フレーム間距離DadおよびDcdと、図8に示した対象物同一性確率算出関数により、入力フレーム(d)と、フレーム(a)および(c)から検出された対象物の間の同一性確率RadおよびRcdが算出できる。
同一性判定手段104は、対象物同一性確率をもとに、入力フレームと既出フレームからそれぞれ検出された対象物間の同一性を判定し、同一と判定された対象物に対して同じグループIDを採番する(ステップA06)。同一性判定手段104の処理について、図5と図8を用いて説明する。今、対象物同一性確率算出手段103から、入力フレーム(d)と、フレーム(a)および(c)からそれぞれ検出された対象物の間の同一性確率RadおよびRcdが入力されたとする。同一性判定手段の閾値をTHとしたとき、THとRadの間に、Rad<THが成り立つとき、入力フレーム(d)と既出フレーム(a)にそれぞれ含まれる対象物ID『D』と対象物ID『A』の対象物は互いに異なると判定される。また、THとRcdの間に、Rcd>THが成り立つとき、入力フレーム(d)と既出フレーム(c)にそれぞれ含まれる対象物ID『D』と対象物ID『C』の対象物は同一と判定される。
一方、既出のフレームであるフレーム(c)が入力された際に、フレーム(a)と(c)からそれぞれ検出された対象物間の同一性確率Racと閾値THの間にRac>THが成り立つとして、対象物ID『A』と対象物ID『C』の対象物が同一と判定されているとする。このとき、前述のとおり新しくフレーム(d)が入力された際、対象物ID『D』と対象物ID『A』は異なり対象物ID『D』と対象物ID『C』の対象物は同一と判定された場合に、対象物ID『A』と対処物ID『C』の対象物を互いに異なるとして同一性判定結果を更新しても良い。既出のフレーム群による同一性判定結果は、新しい入力フレームによる判定結果を受けて無条件に更新しても良いし、既出のフレーム群に入力フレームを加えたフレ−ム群の間での判定結果の多数決によって更新しても良いし、既出のフレーム群に入力フレームを加えたフレーム群の間で算出された対象物同一性確率の最大値あるいは最小値をもとにした判定結果をもとに更新してもよい。
更新の結果、同一と判定された対象物には同一のグループIDを付与する。
閾値THを入力映像に応じて変化させることにより、入力映像に最適な対象物判定ができる。また、同一のグループとされる対象物の個数や、グループの個数を制御できる。
入力映像を構成する全フレームについてステップA02からステップA06の処理を繰り返す。
判定結果出力手段120は、同一性判定手段104から受け取った対象物間の同一性の判定結果を出力する(ステップA07)。
判定結果出力手段120の出力例は、図26に示すようにグループID、フレーム番号、対象物IDを表形式で出力しても、その他の形式であってもよい。出力するフレーム番号および対象物IDは、全て出力しても良いし、同一グループに属するフレーム番号について連続する番号をまとめ、先頭のフレーム番号とそのフレームから検出された対象物の対象物IDを出力しても良いし、同一グループに属するフレーム番号から代表を選んで出力してもよい。グループIDは、グループに属する対象物の個数の多い順に採番してもよいし、グループに属する対象物のフレーム番号が若い順に採番してもよい。出力形式は、図26に示した形式であっても他の形式であっても構わない。
次に、本最良の形態の効果について説明する。
従来法では、対象物の同一性を対象物から抽出された特徴量の類似性によって決定していた。これに対し、本最良の形態では、各対象物が検出されたフレームのフレーム間距離に応じて算出される対象物同一性確率に基づいて対象物対の同一性を判定する。この対象物同一性確率は、入力映像において同一対象物がどのくらいのフレーム間距離で登場するかという出現確率に基づいて算出できるため、入力映像のシナリオに応じた判定が行えるという効果がある。
また、従来手法では、同一の対象物は、互いに時間的に近い位置に存在することを前提としており、所定の閾値以上フレーム間距離が離れている場合には、同一の対象物として判定しなかった。これに対し、本最良の形態では、対象物対が時間的に離れて存在する場合であっても、対象物対のフレーム間距離をもとに算出または選択される対象物同一性確率が高い場合には、同一と判定できるという効果がある。
また、本最良の形態では、対象物同一性確率算出関数を記憶しておき、記憶された関数の中から映像に応じて適した関数を選択することができる。例えば、連続ドラマの1話分の映像について出演者の同一性を判定する場合、過去の回の映像をもとに出演者が出現してから再度出現するまでに要する時間とその頻度をもとに、対象物同一性確率記憶部に記憶された関数から適した関数を選択、あるいは記憶された関数を組み合わせて最適な関数を生成することができる。こうして選択あるいは生成された対象物同一性確率算出関数を用いて対象物同一性確率を算出することによって、出演者の同一性を高精度に判定できるという効果がある。
(最良の形態2)
次に、本発明を実施するための第2の最良の形態について図面を参照して詳細に説明する。
図10を参照すると、本発明を実施するための第2の最良の形態は、コマンド入力装置240を有する点、プログラム制御により動作するデータ処理装置200において、対象物同一性確率算出手段103に代わり対象物同一性確率選択手段203を有する点、および記憶装置220において対象物同一性確率記憶部221を有する点で第1の最良の形態と異なる。
映像入力手段210は、入力映像を構成する各フレームを対象物検出手段201に入力する。また、判定結果出力手段220から入力されるフレーム番号を開始フレームとする映像を、判定結果出力手段220に出力する。
記憶装置220は、対象物同一性確率記憶部231によって構成される。
対象物同一性確率記憶部221は、フレーム間距離と対象物同一性確率の対応表を記憶する。フレーム間距離と対象物同一性確率の対応表の一例を図27に示す。対象物同一性確率記憶部221は、対象物同一性確率選択手段203から入力されるフレーム間距離に対応する対象物同一性確率を、対象物同一性確率選択手段203に出力する。
コマンド入力装置240は、利用者によるコマンド入力を受けて、対象物同一性確率記憶部221にフレーム間距離と対象物同一性確率の対応表を入力する。また、対象物同一性確率記憶部221にあらかじめ記憶されたフレーム間距離と対象物同一性確率の対応表を変更する。また、判定結果出力手段230により出力された判定結果に対する利用者によるコマンド入力を、判定結果出力手段230に入力する。
対象物同一性確率選択手段203は、フレーム間距離算出手段202によって算出された入力フレームと既出のフレームの間のフレーム間距離をもとに、対象物同一性確率記憶部221に記憶されたフレーム間距離と対象物同一性確率の対応表から、対象物同一性確率を選択する。
判定結果出力手段230は、同一性判定手段204から受け取った対象物の同一性判定結果を出力する。判定結果の出力は図26に示した形式であってもよい。判定結果出力手段230は、コマンド入力手段240を介して利用者によって入力されたフレーム番号を映像入力手段210に入力し、映像入力手段210から受け取った映像を再生する。
(最良の形態2の動作)
次に、図10及び図11のフローチャートを参照して本最良の形態の全体の動作について詳細に説明する。
図11のステップB01―B03およびB05で示される本最良の形態における映像入力手段210、対象物検出手段201、フレーム間距離算出手段202、および同一性判定手段204の動作は、第1の最良の形態の各手段110、101、102、104、120の動作と同一のため、説明は省略する。
まず、利用者はコマンド入力装置240を介して、対象物同一性確率記憶部221にフレーム間距離と対象物同一性確率の対応表を入力する。あるいは、対象物同一性確率記憶部221にあらかじめ記憶されたフレーム間距離と対象物同一性確率の対応表を更新する(ステップB00)。
対象物同一性確率選択手段203は、入力フレームと既出のフレームの間で算出されるフレーム間距離をもとに、対象物同一性確率記憶部221に記憶されたフレーム間距離と対象物同一性確率の対応表から対象物同一性確率を選択する(ステップB04)。
フレーム間距離と対象物同一性確率の対応表が図26であったときの対象物同一性確率選択手段の動作を説明する。入力フレームと既出のフレームの間で算出されたフレーム間距離がD0の場合、図27に示す対応表から、入力フレームと既出のフレームにそれぞれ含まれる対象物の同一性確率としてR0を選択する。また、フレーム間距離がD1〜D2の範囲の場合、対象物同一性確率としてR1を選択する。
判定結果出力手段230は、同一性判定手段204から受け取った対象物間の同一性判定結果を出力する(ステップB06)。
判定結果出力手段230は、コマンド入力装置240から判定結果に対する利用者のコマンド入力を受け取ると、利用者の入力に応じたフレーム番号を映像入力装置210に入力する。映像入力装置210は、判定結果出力手段から受け取ったフレーム番号を開始フレームとした映像を判定結果出力手段220に入力する。判定結果出力手段230は、受け取った映像を再生し、利用者に提示する(ステップB07)。このときの判定結果出力手段230の動作の一例を、図26を用いて説明する。利用者によって図26のグループ1が選択されると、グループ1に属する対象物ID『C』および『D』の対象物が出現するフレーム番号fcとfdを映像入力手段210に入力し、映像入力手段210から出力される映像を再生する。あるいは、利用者によって対象物ID『A』の対象物が選択されると、『A』が出現するフレーム番号faを映像入力手段210に入力し、映像入力手段210から出力される映像を再生する。これにより、同一のグループに属する連続フレーム群を利用者が指定した場合には、利用者は同一の対象物の登場シーンのみを視聴できる。また、各グループからそれぞれ代表的な連続フレーム群を利用者が指定した場合には、各対象物の代表的なシーンを視聴できる。
次に、本最良の形態の効果について説明する。
従来法では、対象物の同一性を対象物から抽出された特徴量の類似性によって決定していた。これに対し、本最良の形態では、各対象物が検出されたフレームのフレーム間距離に応じて算出される対象物同一性確率に基づいて対象物対の同一性を判定する。この対象物同一性確率は、入力映像において同一対象物がどのくらいのフレーム間距離で登場するかという出現確率に基づいて算出できるため、入力映像のシナリオに応じた判定が行えるという効果がある。
また、従来手法では、同一の対象物は、互いに時間的に近い位置に存在することを前提としており、所定の閾値以上フレーム間距離が離れている場合には、同一の対象物として判定しなかった。これに対し、本最良の形態では、対象物対が時間的に離れて存在する場合であっても、対象物対のフレーム間距離をもとに選択される対象物同一性確率が高い場合には、同一と判定できるという効果がある。
また、本最良の形態では、フレーム間距離と対象物同一性確率の対応表を利用者が任意に更新できるため、入力映像に応じて適した対応表に変更できる。例えば、入力映像が連続ドラマであった場合に、過去の回の映像をもとに出演者が出現してから再度出現するまでに要する時間と、その頻度をもとに対応表を生成し、対象物同一性確率記憶部に記憶させることができる。これによって、同一性判定が高精度に行えるという効果がある。
(最良の形態3)
次に、本発明を実施するための第3の最良の形態について図面を参照して詳細に説明する。
図12を参照すると、本発明を実施するための第3の最良の形態は、データ処理装置300が、図3に示された第1の最良の形態におけるデータ処理装置100の構成に加え、特徴量抽出手段302および類似度算出手段304を有し、画像記憶装置330を有する点で第1の最良の形態と異なる。
特徴量抽出手段302は、対象物検出手段301によって入力フレームから検出された対象物の画像データと、画像データから取り出される特徴量と、フレーム番号を抽出する。対象物の画像データを画像記憶部332に記憶し、画像データから取り出される特徴量を類似度算出手段304に入力し、フレーム番号をフレーム間距離算出手段303に入力する。
類似度算出手段304は、特徴量抽出手段302から受け取った入力フレーム中の対象物の特徴量と既出のフレーム中の対象物の特徴量をもとに、対象物の間の類似度を算出して同一性判定手段306に入力する。類似度は、例えば入力フレーム中の対象物の特徴量と、既出のフレーム中の対象物の特徴量との差分によって求められる。類似度は、入力フレーム中の対象物と、既出のフレーム中の対象物群との全組み合わせについて算出しても、選択的な組み合わせについて算出しても良い。
同一性判定手段306は、対象物同一性確率算出手段305から受けとった入力フレーム中の対象物と既出のフレーム中の対象物との間で算出される対象物同一性確率と、類似度算出手段304から受け取った入力フレーム中の対象物と既出のフレーム中の対象物との間で算出される類似度をもとに、対象物の同一性を判定する。また、入力フレームから検出された対象物と既出フレーム群から検出された対象物群との間での判定結果をもとに、既出フレーム群から検出された対象物群の間で得られた同一性判定結果を更新する。
判定結果出力手段320は、同一性判定手段306から受け取った判定結果と、画像記憶部に記憶された対象物の画像データを利用して、判定結果を出力する。
(最良の形態3の動作)
次に、図12及び図13のフローチャートを参照して本最良の形態の全体の動作について詳細に説明する。
図13のステップC01、C02、C04で示される本最良の形態における映像入力手段310、対象物検出手段301およびフレーム間距離算出手段303の動作は、第1の最良の形態の各手段110、101、102および104の動作と同一のため、説明は省略する。
特徴量抽出手段302は、対象物検出手段301によって入力フレームから対象物が検出されると、対象物の画像データと、画像データから抽出される特徴量と、フレーム番号を抽出する(ステップC03)。
類似度算出手段304は、特徴量抽出手段302によって抽出された対象物の特徴量をもとに、入力フレームから検出された対象物と、既出のフレームから検出された対象物の間の類似度を算出する(ステップC05)。
対象物同一性確率算出手段305は、類似度算出手段304で算出された類似度と、フレーム間距離算出手段303で算出されたフレーム間距離をもとに、入力フレームおよび既出のフレームから検出された対象物の間の対象物同一性確率を算出する(ステップC06)。
同一性判定手段306は、対象物同一性確率と類似度をもとに、対象物の同一性を判定する。例えば、対象物同一性確率と類似度の乗算値が閾値以上のときに、入力フレーム中の対象物と既出フレーム中の対象物が同一と判定してもよいし、対象物同一性確率と類似度がともに閾値以上のときに同一と判定してもよいし、他の判定方法を用いても良い。また、入力フレームから検出された対象物と既出フレーム群から検出された対象物群との間での判定結果をもとに、既出フレーム群から検出された対象物群の間で得られた同一性判定結果を更新する(ステップC07)。
入力映像を構成する全フレームについて、C01−C07のステップを行う。
判定結果出力手段320は、対象物の間の同一性判定結果と、画像記憶部に記憶された対象物の画像データをもとに、判定結果を外部出力する(ステップC08)。
判定結果の出力例を図28に示す。同一の物体として判定された対象物を同一のグループにまとめ、グループごとにグループID、フレーム番号、対象物ID、画像データを表形式で出力する。グループIDは、対象物の画像データの面積の大きいものの多い順に採番してもよいし、対象物の画像データの出現位置が中央に近いものの多い順に採番してもよい。画像データは、各グループから代表となる画像データのみを出力してもよい。これにより、利用者は各対象物が映像中で実際にどんな見え方で登場するのかを一目で把握できる。出力形式は、図28に示した形式であっても他の形式であっても構わない。
次に、本最良の形態の効果について説明する。
従来法では、対象物の同一性を各対象物から抽出された特徴量の類似性にのみによって決定していた。これに対し、本最良の形態では、各対象物から抽出される特徴量の類似性のみではなく、対象物対の間で算出されるフレーム間距離を組み合わせることにより、対象物の特徴量の抽出や類似度の算出に失敗した場合に、同一性判定の精度劣化が抑えられるという効果がある。
(最良の形態4)
次に、本発明を実施するための第4の最良の形態について図面を参照して詳細に説明する。
図14を参照すると、本発明を実施するための第4の最良の形態は、本発明を実施するための第1の最良の形態と同様に、映像入力手段、データ処理装置、記憶装置、判定結果出力手段を備える。
同一性判定用プログラム440は、データ処理装置400に読み込まれ、データ処理装置400の動作を制御し、映像入力手段410から入力される映像と記憶装置420から入力される対象物同一性確率算出関数をもとにしてデータ処理装置400の手段によって得られた判定結果を、判定結果出力手段430に出力する。データ処理装置400は、同一性判定用プログラム440の制御により第1の最良の形態におけるデータ処理装置100による処理と同一の処理を実行する。
(最良の形態5)
次に、本発明を実施するための第5の最良の形態について図面を参照して詳細に説明する。
図15を参照すると、本発明を実施するための第5の最良の形態は、本発明を実施するための第2の最良の形態と同様に、映像入力手段、データ処理装置、記憶装置、コマンド入力装置、判定結果出力手段を備える。
同一性判定用プログラム540は、データ処理装置500に読み込まれデータ処理装置500の動作を制御し、記憶装置520のデータをもとにデータ処理装置500内の手段によって得られた判定結果を、判定結果出力手段530に出力する。データ処理装置500は、同一性判定用プログラム540の制御により第2の最良の形態におけるデータ処理装置200による処理と同一の処理を実行する。
(最良の形態6)
次に、本発明を実施するための第6の最良の形態について図面を参照して詳細に説明する。
図16を参照すると、本発明を実施するための第6の最良の形態は、本発明を実施するための第3の最良の形態と同様に、映像入力手段、データ処理装置、判定結果出力手段、画像記憶装置を備える。
同一性判定用プログラム640は、データ処理装置600に読み込まれデータ処理装置600の動作を制御し、データ処理装置600の手段によって得られた判定結果を、判定結果出力手段630に出力する。データ処理装置600は、同一性判定用プログラム640の制御により第3の最良の形態におけるデータ処理装置300による処理と同一の処理を実行する。
(最良の形態7)
次に、本発明を実施するための第7の最良の形態について図面を参照して詳細に説明する。
図20を参照すると、本発明を実施するための第7の最良の形態は、データ処理装置900が、図3に示された第1の最良の形態におけるデータ処理装置100の構成に加え、座標間距離算出手段905を有する点で第1の最良の形態と異なる。
座標間距離算出手段905は、対象物検出手段901から対象物が検出されたフレームについて対象物の位置座標と対象物IDを受け取り、各対象物の間で対象物間の座標距離を算出する。対象物同一性確率算出手段903に、対象物の座標間距離、前記座標距離を算出するフレーム対、前記フレーム対から検出された対象物の対象物IDを出力する。
対象物同一性確率算出手段903は、同一性確率算出手段921から選択した対象物同一性確率算出関数を用いて、フレーム間距離算出手段902から受け取ったフレーム間距離を算出するフレーム対について、フレーム間距離算出手段902から受け取ったフレーム間距離と座標間距離算出手段905から受け取った座標間距離をもとに、前記フレーム対に含まれる対象物の間の対象物同一性確率を算出する。同一性判定手段904に、対象物同一性確率、前記対象物同一性確率を算出する対象物IDおよび、前記対象物が検出されたフレーム番号を出力する。
(最良の形態7の動作)
次に、図20及び図21のフローチャートを参照して本最良の形態の全体の動作について詳細に説明する。
図21のステップD01、D02、D03、D07、D08で示される本最良の形態における映像入力手段710、対象物検出手段701およびフレーム間距離算出手段902、同一性判定手段904、判定結果出力手段930の動作は、第1の最良の形態の各手段110、101、102、104および130の動作と同一のため、説明は省略する。
座標間距離算出手段905は、対象物検出手段301によって入力フレームから対象物が検出された場合に、入力フレーム中の対象物の位置座標と、既出のフレーム中の対象物の位置座標との間で座標間距離を算出する(ステップD04)。
対象物同一性確率算出手段903は、同一性確率算出関数記憶部921から対象物同一性確率算出関数を選択し(ステップD05)、
フレーム間距離算出手段902で算出されたフレーム間距離と座標間距離算出手段905で算出された座標距離をもとに、入力フレームおよび既出のフレームから検出された対象物の間の対象物同一性確率を算出する(ステップD06)。
対象物同一性確率算出関数は、以下に示すように入力映像における対象物の出現傾向に基づく関数を用いてもよい。
(1)『同一の対象物が所定時間以内に所定範囲の位置座標で再度出現する傾向がある』という事前知識に基づく関数
フレーム間距離がD1よりも短いフレーム対に含まれ、かつ座標間距離がd1よりも短い対象物について、フレーム間距離が短くかつ座標間距離が短いほど対象物同一性確率を大とし、フレーム間距離がD1よりも長いフレーム対に含まれる対象物について対象物同一性確率を一定とする関数は、同一の対象物がフレーム間距離D1以内に座標間距離d1以内で再度登場する確率が高い映像に対して、検出された対象物の間の同一性判定に効果的である。
一例として、ビルの監視映像のように、複数の固定カメラを切り替えて撮影された映像中での静止物の同一性判定について説明する。映像区間D1において、各カメラ映像は交互に切り替えられ、各カメラ映像に映りこむ静止物は同一位置に出現する。そのため、フレーム間距離D1以内で、同一の静止物が同一の位置に再度登場する確率が高い。このようなケースに対して本関数を用いた場合、静止物の同一性を良好に判定できるため有効である。
また一例として、ドラマ映像における対話シーンでの出演者の同一性判定について説明する。ドラマ映像においては、対話シーンに相当する映像区間D1内では対話中の各出演者が交互に出現し、同一の出演者はほぼ同一の位置に出現する。そのため、フレーム間距離D1以内で同一の出演者がほぼ同一の位置に再度登場する確率が高い。このようなケースに対して本関数を用いた場合、出演者の同一性を良好に判定できるため有効である。
(2)『同一の対象物は一定時間、一定位置に連続して出現する傾向がある』という事前知識に基づく関数(図23)
フレーム間距離がD2よりも短いフレーム対に含まれる対象物について座標間距離がd2よりも短い場合に対象物同一性確率を一定に大とし、フレーム間距離がD2よりも長いフレーム対に含まれる対象物であるか、座標間距離がd2よりも長い場合について、フレーム間距離あるいは座標間距離が長いほど対象物同一性確率を小とする関数は、同一の対象物がフレーム間距離D2以内に座標間距離d2以内で再度登場する確率が高い映像に対して、検出された対象物の間の同一性判定に効果的である。
一例として、入場ゲートに設置した可動式監視カメラで、次々に入場する人物を順に追跡撮影した映像における人物の同一性判定について説明する。映像中では、ある人物が登場して歩き去るまでの連続する映像区間D2において同一の人物がほぼ同一位置に連続して登場する。そのため、フレーム間距離D2において同一の人物が同一位置に登場する確率は高い。
このようなケースに対して本関数を用いた場合、人物の同一性を良好に判定できるため有効である。
(3)『同一の対象物はある一定時間後に、ほぼ同一位置に再度出現する傾向がある』という事前知識に基づく関数(図24)
フレーム間距離がD3、D3’となるフレーム対に含まれる対象物対について、座標間距離がd3以内の対象物同一性確率を大とし、フレーム間距離がD3、D3’から離れる従って同一性確率を小とする関数は、同一の対象物が一定時間D3、D3’後に、ほぼ同一位置に再度登場する確率が高い映像に対して、検出された対象物間の同一性判定に効果的である。
一例として、街中を回転式の監視カメラで撮影した映像における停車中の車体についての同一性判定について説明する。監視カメラが一定速度で回転した場合に、あるカメラがある方向を撮影するたびに同じ車体が映像に映りこむ。そのため、例えばカメラが時間D3で1回転する場合に、映像中である車体が登場してから、D3、D3’後に再度同じ車体が同一位置に登場する確率が高い。このようなケースに対して本関数を用いた場合、車体の同一性を良好に判定できるため有効である。
入力映像を構成する全フレームについて、D02−D07のステップを行う。
次に、本最良の形態の効果について説明する。
従来法では、対象物の同一性を対象物から抽出された特徴量の類似性によって決定していた。これに対し、本最良の形態では、各対象物が検出されたフレームのフレーム間距離と座標距離に応じて算出される対象物同一性確率に基づいて対象物対の同一性を判定する。この対象物同一性確率は、入力映像において同一対象物がどのくらいのフレーム間距離でどの程度の位置ずれで登場するかという確率に基づいて算出できるため、入力映像のシナリオに応じた判定が行えるという効果がある。
また、従来手法では、同一の対象物は、互いに時間的に近い位置に存在することを前提としており、所定の閾値以上フレーム間距離が離れている場合には、同一の対象物として判定しなかった。これに対し、本最良の形態では、対象物対が時間的に離れて存在する場合であっても、対象物対のフレーム間距離と座標間距離をもとに算出される対象物同一性確率が高い場合には、同一と判定できるという効果がある。
また、本最良の形態では、対象物同一性確率算出関数を記憶しておき、記憶された関数の中から映像に応じて適した関数を選択することができる。例えば、連続ドラマの1話分の映像について出演者の同一性を判定する場合、過去の回の映像をもとに出演者が出現してから再度出現するまでに要する時間、再度出現したときの位置ずれ、再度出現する頻度をもとに、対象物同一性確率記憶部に記憶された関数から適した関数を選択、あるいは記憶された関数を組み合わせて最適な関数を生成することができる。こうして選択あるいは生成された対象物同一性確率算出関数を用いて対象物同一性確率を算出することによって、出演者の同一性を高精度に判定できるという効果がある。
次に、具体的な実施例を用いて本発明を実施するための最良の形態の動作を説明する。かかる最良の形態1は、本発明を実施するための第1の最良の形態に対応するものである。
実施例1では、本発明の同一性判定装置を入力映像に登場する車体群について、車体群の間の同一性判定に利用した例を示す。車体群が同一であるとは、映像から検出された車体群が全く同一の車体であることを意味しても良いし、車体群が同一の車種であることを意味してもよい。本実施例では、全く同一の車体であることを指すものとする。図17に示すように、本実施例では、映像入力手段として映像入力端子を、記憶装置としてハードディスクを、データ処理装置としてパーソナル・コンピュータを、映像出力装置としてディスプレイを備えている。
パーソナル・コンピュータは、車体検出手段とフレーム間距離算出手段と車体同一性確率算出手段と同一性判定手段として機能する中央演算装置を有している。
今、映像入力端子から映像を構成する各フレームが入力されたとする。中央演算装置の車体検出手段は、入力フレームから車体を検出し、車体の検出されたフレーム番号を取得する。車体検出手段として、例えば様々な車種の映っている画像群をテンプレートとして記憶し、テンプレートと入力フレームとの差分が所定の閾値以下なる場合に、入力フレーム中に車体が存在すると判定する手法が考えられる。また、様々な車種の映っている画像群から抽出した車体の形状や色、テクスチャなどの画像特徴量を記憶しておき、入力フレーム中に似た特徴が抽出されたときに、車体が存在すると判定する手法が考えられる。また、様々の車種の映っている映像から抽出した車体の動き特徴を記憶しておき、入力フレーム中の画像領域の動き特徴が記憶された動き特徴と類似する場合に、入力フレームに車体が存在すると判定する手法が考えられる。車体の検出手法として上記の例を用いても、他の手法を適用しても構わない。
フレーム間距離算出手段は、入力フレームから車体が検出されると、車体が検出された全ての既出のフレーム群との間でフレーム間距離を算出する。フレーム間距離として、例えば入力フレームのフレーム番号と、車体の検出された既出のフレームのフレーム番号との差分が考えられる。また、入力フレームが実際に撮影された時間と、車体の検出された既出のフレームが撮影された時間との差分が考えられる。フレーム間距離として上記の例を用いても他の距離を適用しても構わない。
車体同一性確率算出手段は、ハードディスク内の同一性確率算出関数記憶部から選択した対象物同一性確率算出関数を利用して、フレーム間距離算出手段から受け取ったフレーム間距離をもとに、入力フレームから検出された車体と、既出のフレーム群から検出された車体群との間の車体同一性確率を算出する。車体同一性確率算出関数として、図6から図9に示した関数を用いても他の関数を用いても良い。
同一性判定手段は、車体同一性確率から受け取った車体同一性確率をもとに、入力フレームから検出された車体と、既出のフレーム群から検出された車体群との同一性を判定し、同一の車体に対して同一のグループIDを採番する。入力フレームとの間のフレーム間距離により所定の閾値以上の車体同一性確率を算出した既出のフレーム中の車体について、入力フレームから検出された車体と同一と判定する。また、入力フレームから検出された車体と既出フレーム群から検出された車体群との間での判定結果をもとに、既出フレーム群から検出された車体群の間で得られた車体群の間の同一性判定結果を更新する。
ディスプレイは、同一性判定手段から受け取った車体間の同一性判定結果を出力する。同一性判定結果の出力形式は図26に示した表形式であっても他の形式であっても良い。
実施例2では、本発明の同一性判定装置を入力映像に登場する動物体について、動物体の間の同一性判定に利用した例を示す。本実施例における動物体とは、人物や車体や動物など自律的に移動可能なものとする。また、動物体が同一であるとは、動物体が互いに人物である場合など、互いに同種のものを指すものとする。かかる実施例は、本発明を実施するための第2の最良の形態に対応するものである。
図18に示すように、本実施例では、映像入力手段として映像入力端子を、コマンド入力装置としてディスプレイとキーボードを、データ処理装置としてパーソナル・コンピュータを、記憶装置としてハードディスクを、映像出力装置としてディスプレイを備えている。
パーソナル・コンピュータは、動物体検出手段とフレーム間距離算出手段と動物体同一性確率算出手段と同一性判定手段として機能する中央演算装置を有している。
利用者はまず、ディスプレイ・マウス・キーボードを利用して、フレーム間距離と動物体同一性確率の対応表を対象物同一性確率記憶部に記憶する。
映像入力端子は、動物体検出手段に入力映像を構成する各フレームを入力する。
動物体検出手段は、入力フレームから動物体を検出し、動物体が検出されたフレームのフレーム番号をフレーム間距離算出手段に入力する。
動物体検出手法として、例えば入力フレームとその前後フレームに共通する画像領域の移動量を統計処理することでカメラワークを推定し、カメラワークと異なる領域が検出された場合に、入力フレームには動物体が存在すると判定する。また、室内監視映像など背景が一定の入力映像については、あらかじめ背景領域の画像情報を記憶しておき、入力フレームから背景領域には含まれない画像領域が検出されたときに、動物体が検出されたと判定する。動物体検出手段として、上記の手法を用いても他の手法を用いても構わない。
フレーム間距離算出手段は、入力フレームから動物体が検出された際に、動物体が検出された既出のフレーム群との間のフレーム間距離を算出する。
動物体同一性確率選択手段は、フレーム間距離算出手段から受け取ったフレーム間距離をもとに、動物体同一性確率記憶部に記憶されたフレーム間距離と動物体同一性確率の対応表から動物体同一性確率を選択し、入力フレームから検出された動物体と、既出のフレームから検出された動物体群との間の動物体同一性確率を決定する。
同一性判定手段は、動物体同一性確率選択手段から受け取った動物体同一性確率が所定の閾値以上である場合に、動物体同一性確率が選択された既出のフレーム中の動物体と入力フレーム中の動物体が同一であると判定する。また、入力フレームから検出された動物体と、既出のフレームから検出された動物体群との同一性判定結果をもとに、既出のフレーム群から検出された動物体群の間の判定結果を更新する。
ディスプレイは、同一性判定手段から受け取った判定結果をもとに表示する。表示形式は図26で示したものであっても他の形式であっても構わない。
利用者はディスプレイに表示された判定結果をもとに、マウスまたはキーボードによって所望の動物体のグループを選択する。ディスプレイは、利用者によって選択されたグループに属する動物体の出現フレームを開始フレームとして映像入力端子から入力された映像を再生する。これにより、利用者は選択した種類の動物体の出現箇所を頭だしで視聴することができる。
実施例3では、本発明の同一性判定装置を入力映像に登場する人物について、人物間の同一性判定に利用した例を示す。本実施例において人物が同一であるとは、入力映像から検出された人物がともに同一人物であることを指すものとする。かかる実施例は、本発明を実施するための第3の最良の形態に対応するものである。
図19に示すように、本実施例では、映像入力手段として映像入力端子を、データ処理装置としてパーソナル・コンピュータを、画像記憶装置としてハードディスクを、映像出力装置としてディスプレイを備えている。
パーソナル・コンピュータは、人物検出手段と特徴量抽出手段とフレーム間距離算出手段と類似度算出手段と人物同一性確率算出手段と同一性判定手段として機能する中央演算装置を有している。
今、映像入力端子から映像が入力されたとする。中央演算装置の人物検出手段は、入力映像の各フレームから人物を検出し、人物が検出されたフレームを特徴量抽出手段に入力する。
人物の検出手段として、人物領域全体から得られる情報を利用する手法がある。例えば様々な人物の映っている画像をテンプレートとして記憶し、入力画像とテンプレートの差分がある閾値以下のとき人物が入力画像中に存在すると判定する手法が挙げられる。また、肌色などの色情報や、エッジの方向や密度を組み合わせたモデルをあらかじめ記憶しておき、入力フレームからモデルに類似した領域が検出された場合に人物が存在すると判定する手法が考えられる。
また、人物の顔情報を利用する手法がある。例えば、非特許文献1に示されるように、顔(頭部)の輪郭を楕円、目や口を細長の形状をしていることを利用して作成したテンプレートを用いて顔検出を行う手法や、頬や額の部分は輝度が高く、目や口の部分の輝度は低いという輝度分布の特性を利用して顔検出手法や、顔の対称性や肌色領域と位置を利用して顔検出を行う手法などの手法が挙げられる。また、大量の人物顔と非顔の学習サンプルから得られた特徴量分布を統計的に学習し、入力画像から得られる特徴量が顔と非顔のどちらの分布に属するかを判定する手法として、ニューラルネットやサポートベクターマシン、AdaBoost法などを利用した手法が挙げられる。上記の例あるいは他の手法を用いて入力フレームから人物の顔が検出されたときに、入力フレームに人物が存在すると判定する手法が考えられる。
人物の検出手法として、上記の例を利用しても他の手法を適用しても構わない。
特徴量抽出手段は、人物検出手段から入力されたフレームのフレーム番号、人物の画像領域、画像領域から抽出される人物特徴量を抽出する。フレーム番号をフレーム間距離算出手段に出力し、人物の画像領域をハードディスク内の画像記憶部に記憶し、人物特徴量画像情報をハードディスク内のフレーム記憶部に記憶する。
人物の特徴量は、例えば人物の着衣の色情報や、人物領域全体のエッジ方向や密度情報を用いても、人物の顔特徴量を用いても良い。
人物顔の特徴量として、非特許文献2に示されるように、顔の構造に関する知識を活用して目・鼻・口の形状や位置関係などを数値的に記述した特徴ベクトルや、顔の各画素の濃淡値の2次元配列として表現される特徴ベクトル、顔の各特徴点においてウェーブレット変換を施すことで得られるパターンの局所的な周期性とその方向性を表現可能なGabor jetと呼ばれる特徴ベクトルなどが挙げられる。人物間の類似度判定に用いる人物顔の特徴量として、上述の例を利用しても他の手法を適用しても構わない。
類似度算出手段は、特徴量抽出手段から受け取った入力フレーム中の人物の特徴量と、既出のフレーム中の人物の特徴量との類似度を算出する。類似度は、一例として入力フレームから検出された人物顔の特徴量ベクトルと、既出フレームから検出された人物顔群の特徴量ベクトルとの差分によって求められる。
フレーム間距離算出手段は、特徴量抽出手段から受け取った入力フレームと、人物が検出された既出の全フレーム群との間でフレーム間距離を算出する。フレーム間距離は、入力フレームと既出のフレームのフレーム番号の差分によって求められるメディア時間でも良いし、入力フレームと既出のフレームの各フレーム番号が対応する台本における時刻の差分によって求められるシナリオ時間でも良い。また、ショットの切り替わりや、カメラワークの変化、シーンの切り替わり、BGMの変化、背景の画像特徴量の変化のうち、いずれか一つまたその組み合わせに基づいて重み付けられたメディア時間またはシナリオ時間であっても良い。
人物同一性確率算出手段は、フレーム間距離算出手段から受け取ったフレーム間距離をもとに、入力フレーム中の人物と既出のフレーム中の人物との人物同一性確率を算出する。人物同一性確率は、例えばフレーム間距離をもとに図6から図9に示した同一性確率算出関数によって算出しても良いし、他の手法によって求めても良い。
同一性判定手段は、人物同一性確率算出手段から受けとった入力フレーム中の人物と既出フレーム中の人物との間で算出される人物同一性確率と、類似度算出手段から受け取った入力フレーム中の人物と既出フレーム中の人物との間で算出される類似度をもとに、人物の同一性を判定する。例えば人物同一性確率と類似度の乗算値が閾値以上のときに入力フレーム中の人物と既出のフレーム中の人物が同一と判定してもよいし、人物同一性確率と類似度がともに閾値以上のときに同一と判定してもよいし、他の判定方法を用いても良い。入力フレームから検出された人物と既出のフレーム群から検出された人物群との間での判定結果をもとに、既出のフレーム群から検出された人物群の間で得られた同一性判定結果を更新する。
ディスプレイは、同一性判定手段から受け取った判定結果と、画像記憶部に記憶された対象物の画像領域を組み合わせて表示する。判定結果は、図28に示したような表形式で提示してもよいし他の手法で提示してもよい。図28の形式では、同一人物が同一IDのグループにまとめられる。画像データには、映像から検出された様々な人物の様々な画像領域が一覧で提示される。
実施例4では、本発明の同一性判定装置を入力映像に登場する人物の顔について、人物間の同一性判定に利用した例を示す。本実施例において人物が同一であるとは、入力映像から検出された人物の顔がともに同一人物のものであることを指すものとする。かかる実施例は、本発明を実施するための第7の最良の形態に対応するものである。
図25に示すように、本実施例では、映像入力手段として映像入力端子を、記憶装置としてハードディスクを、データ処理装置としてパーソナル・コンピュータを、映像出力装置としてディスプレイを備えている。
パーソナル・コンピュータは、人物顔検出手段とフレーム間距離算出手段と顔座標間距離算出手段と人物顔同一性確率算出手段と同一性判定手段として機能する中央演算装置を有している。ハードディスクは、人物顔同一性確率算出関数記憶部を有している。
今、映像入力端子から映像を構成する各フレームが入力されたとする。中央演算装置の人物顔検出手段は、入力フレームから人物の顔を検出し、人物の顔が検出されたフレーム番号を取得する。また、検出された人物顔にそれぞれ固有のIDを裁判する。フレーム間距離算出手段に、フレーム番号と人物顔IDを出力する。
フレーム間距離算出手段は、入力フレームから人物の顔が検出されると、人物の顔が検出された全ての既出のフレーム群との間でフレーム間距離を算出し、人物顔同一性確率算出手段に出力する。フレーム間距離を算出した全フレーム対について、フレーム番号の組み合わせを顔座標間距離算出手段に出力する。
顔座標間距離算出手段は、入力フレームから人物の顔が検出されると、人物の顔が検出された全ての既出のフレーム群との間で、入力フレーム中の対象物の位置座標と既出のフレーム中の対象物の位置座標とを利用して顔座標間距離を算出し、人物顔同一性確率算出手段に入力する。顔座標は、入力フレームにおける顔領域の重心にあたる座標であっても、顔を構成する造作の中の1つまたは複数の特徴点(目尻・黒目の中心点・鼻腔・口角・眉尻など)特徴点の座標であってもよい。座標間距離は、対応する位置座標の間で算出される距離であっても、対応する複数の位置座標の間で各々算出される距離の線形演算によって算出される距離であっても良い。例えば、顔座標として両目の黒めの中心点を用いるとして、フレームiの顔画像の右目の黒目の中心点を(Rix, Riy)、左目の黒目の中心点を(Lix, Liy)としたとき、フレームiとフレームjに含まれる人物顔の顔座標間距離Dijは、以下のようにして求めてもよい。
Figure 2008078736
人物顔同一性確率算出手段は、フレーム間距離算出手段から受け取ったフレーム間距離を算出するフレーム対について、各々のフレームに含まれる人物顔の間の人物顔同一性確率を算出する。人物顔同一性確率は、フレーム間距離算出手段から得られるフレーム間距離と、顔座標間距離算出手段から得られる顔座標間距離をもとに、人物顔同一性確率算出手段から選択した人物顔同一性確率算出関数を用いて算出される。人物顔同一性確率算出関数として、図22から図24に示した関数を用いても他の関数を用いても良い。同一性判定手段に、人物顔同一性確率、前記人物顔同一性確率を算出する人物IDおよび、前記対象物が検出されたフレーム番号を出力する。
同一性判定手段は、人物顔同一性確率算出手段から受け取った人物顔同一性確率をもとに、入力フレームから検出された人物顔と、既出のフレーム群から検出された人物顔群との同一性を判定し、同一人物に対して同一のグループIDを採番する。入力フレームとの間のフレーム間距離および顔座標間距離により、所定の閾値以上の人物顔同一性確率を算出した既出のフレーム中の人物顔について、入力フレームから検出された人物顔と同一と判定する。また、入力フレームから検出された人物顔と既出フレーム群から検出された人物顔群との間での判定結果をもとに、既出フレーム群から検出された人物顔群の間で得られた人物顔群の間の同一性判定結果を更新する。
ディスプレイは、同一性判定手段から受け取った人物間の同一性判定結果を出力する。同一性判定結果の出力形式は図26に示した表形式であっても他の形式であっても良い。
本願は、日本の特願2006−351892(2006年12月27日に出願)及び特願2007−296718(2007年11月15日に出願)に基づいたものであり、又、特願2006−351892及び特願2007−296718に基づくパリ条約の優先権を主張するものである。特願2006−351892及び特願2007−296718の開示内容は、特願2006−351892及び特願2007−296718を参照することにより本明細書に援用される。
本発明の代表的な実施形態が詳細に述べられたが、様々な変更(changes)、置き換え(substitutions)及び選択(alternatives)が請求項で定義された発明の精神と範囲から逸脱することなくなされることが理解されるべきである。また、仮にクレームが出願手続きにおいて補正されたとしても、クレームされた発明の均等の範囲は維持されるものと発明者は意図する。
本発明によれば、映像に登場する対象物ごとに分類された対象物の一覧表を生成するため、対象物の出現箇所を頭出し再生するため、所望の対象物の出現箇所をつなぎ合わせた要約映像を生成するため、あるいは対象物に基づいて映像分類を行うために、対象物の同一性を判定する同一性判定成装置や、同一性判定装置をコンピュータに実現するためのプログラムといった用途に適用できる。また、ホームビデオにおいて人物に基づく映像の整理や分類、視聴用の映像生成を実現するための同一性判定装置としても利用である。また、監視カメラで長時間撮影された映像中からどんな人物がどのくらい出現しているかを短時間で把握するために、各人物の出現箇所をリスト表示させるための対象物の同一性判定装置としても利用できる。また、多数の映像を用いて映像編集を行うシステムにおいて、対象物に基づいた編集を目的とした映像選択のために、対象物の出現箇所をリスト表示するための対象物の同一性判定装置や、同一性判定装置をコンピュータに実現するためのプログラムといった用途に適用できる。

Claims (60)

  1. 入力映像から検出された複数の対象物間の同一性を、対象物が検出された各々のフレームの間の距離であるフレーム間距離をもとに決まる対象物同一性確率を利用して判定することを特徴とする同一性判定装置。
  2. a)入力映像から複数の対象物を検出する手段と、
    b)対象物が検出されたフレーム群の間でフレーム間距離を算出する手段と、
    c)前記フレーム間距離を利用して対象物同一性確率を算出する手段と、
    d)対象物同一性確率をもとに対象物の同一性判定する手段と、
    を含むことを特徴とする請求項1記載の同一性判定装置。
  3. 前記手段cにおいては、あらかじめ記憶されたフレーム間距離と対象物同一性確率の対応表から、前記算出されたフレーム間距離をもとに対象物同一性確率を選択することを特徴とする請求項2記載の同一性判定装置。
  4. 前記手段dにおいては、対象物同一性確率に加え、フレーム対に含まれる対象物の画像特徴、または音響特徴、またはその組み合わせに基づく類似度を利用して対象物間の同一性を判定することを特徴とする請求項2記載の同一性判定装置。
  5. 前記手段dにおいては、対象物同一性確率とフレーム対に含まれる対象物の画像特徴、または音響特徴、またはその組み合わせに基づく類似度との乗算値によって、対象物間の同一性を判定することを特徴とする請求項2記載の同一性判定装置。
  6. 前記フレーム間距離は、フレーム番号の差分値をもとに算出されるメディア時間であることを特徴とする請求項1から5の何れか1項記載の同一性判定装置。
  7. 前記フレーム間距離は、フレームが対応する台本における時刻の差分値をもとに算出されるシナリオ時間であることを特徴とする請求項1から5の何れか1項記載の同一性判定装置。
  8. 前記フレーム間距離は、ショットの切り替わり、またはカメラワークの変化、またはシーンの切り替わり、またはBGMの変化、または背景の画像特徴量の変化のいずれか一つまたはその組み合わせに基づいて重み付けられたメディア時間またはシナリオ時間であることを特徴とする請求項6または7記載の同一性判定装置。
  9. 前記対象物は、フレーム全体あるいは一部分であることを特徴とする請求項1から8の何れか1項記載の同一性判定装置。
  10. 前記対象物が人物であることを特徴とする請求項1から9の何れか1項記載の同一性判定装置。
  11. 同一フレームから検出された複数の人物間の対象物同一性確率が0となることを特徴とする請求項10記載の同一性判定装置。
  12. 入力映像から検出された複数の対象物間の同一性を、対象物が検出された各々のフレームの間の距離であるフレーム間距離に加え、各々のフレーム上での対象物の位置座標の間の距離である座標間距離をもとに決まる対象物同一性確率を利用して判定することを特徴とする請求項1記載の同一性判定装置。
  13. e)入力映像から複数の対象物を検出する手段と、
    f)対象物が検出されたフレーム群の間でフレーム間距離を算出する手段と、
    g)検出された対象物群の間で座標間距離を算出する手段と、
    h)前記フレーム間距離と前記座標間距離を利用して対象物同一性確率を算出する手段と、
    i)対象物同一性確率をもとに対象物の同一性判定する手段と、
    を含むことを特徴とする請求項12記載の同一性判定装置。
  14. 前記手段hにおいては、あらかじめ記憶されたフレーム間距離と座標間距離と対象物同一性確率の対応表から、前記算出されたフレーム間距離と前記算出された座標間距離をもとに対象物同一性確率を選択することを特徴とする請求項13記載の同一性判定装置。
  15. 前記手段iにおいては、対象物同一性確率に加え、フレーム対に含まれる対象物の画像特徴、または音響特徴、またはその組み合わせに基づく類似度を利用して対象物間の同一性を判定することを特徴とする請求項13記載の同一性判定装置。
  16. 前記手段iにおいては、対象物同一性確率とフレーム対に含まれる対象物の画像特徴、または音響特徴、またはその組み合わせに基づく類似度との乗算値によって、対象物間の同一性を判定することを特徴とする請求項13記載の同一性判定装置。
  17. 前記座標間距離は、各対象物の画像領域の重心にあたる座標の間で算出される距離であることを特徴とする請求項12から16の何れか1項記載の同一性判定装置。
  18. 前記座標間距離は、各対象物の画像領域中の1つまたは複数の特徴点について、対応する特徴点の座標の間の線形演算によって算出される距離であることを特徴とする請求項12から16の何れか1項記載の同一性判定装置。
  19. 前記対象物が人物の顔であることを特徴とする請求項12から18の何れか1項記載の同一性判定装置。
  20. 前記座標間距離は、フレーム対において一方のフレーム中の両目の位置座標と、もう一方のフレーム中の両目の位置座標との間の線形演算によって算出される距離であることを特徴とする請求項12から19の何れか1項記載の同一性判定装置。
  21. 入力映像から検出された複数の対象物間の同一性を、対象物が検出された各々のフレームの間の距離であるフレーム間距離をもとに決まる対象物同一性確率を利用して判定することを特徴とする同一性判定方法。
  22. a)入力映像から複数の対象物を検出するステップと、
    b)対象物が検出されたフレーム群の間でフレーム間距離を算出するステップと、
    c)前記フレーム間距離を利用して対象物同一性確率を算出するステップと、
    d)対象物同一性確率をもとに対象物の同一性判定するステップと、
    を含むことを特徴とする請求項21記載の同一性判定方法。
  23. 前記ステップcにおいては、あらかじめ記憶されたフレーム間距離と対象物同一性確率の対応表から、前記算出されたフレーム間距離をもとに対象物同一性確率を選択することを特徴とする請求項22記載の同一性判定方法。
  24. 前記ステップdにおいては、対象物同一性確率に加え、フレーム対に含まれる対象物の画像特徴、または音響特徴、またはその組み合わせに基づく類似度を利用して対象物間の同一性を判定することを特徴とする請求項22記載の同一性判定方法。
  25. 前記ステップdにおいては、対象物同一性確率とフレーム対に含まれる対象物の画像特徴、または音響特徴、またはその組み合わせに基づく類似度との乗算値によって、対象物間の同一性を判定することを特徴とする請求項22記載の同一性判定方法。
  26. 前記フレーム間距離は、フレーム番号の差分値をもとに算出されるメディア時間であることを特徴とする請求項21から25の何れか1項記載の同一性判定方法。
  27. 前記フレーム間距離は、フレームが対応する台本における時刻の差分値をもとに算出されるシナリオ時間であることを特徴とする請求項21から25の何れか1項記載の同一性判定方法。
  28. 前記フレーム間距離は、ショットの切り替わり、またはカメラワークの変化、またはシーンの切り替わり、またはBGMの変化、または背景の画像特徴量の変化のいずれか一つまたはその組み合わせに基づいて重み付けられたメディア時間またはシナリオ時間であることを特徴とする請求項26または27記載の同一性判定方法。
  29. 前記対象物は、フレーム全体あるいは一部分であることを特徴とする請求項21から28の何れか1項記載の同一性判定方法。
  30. 前記対象物が人物であることを特徴とする請求項21から29の何れか1項記載の同一性判定方法。
  31. 同一フレームから検出された複数の人物間の対象物同一性確率が0となることを特徴とする請求項30記載の同一性判定方法。
  32. 入力映像から検出された複数の対象物間の同一性を、対象物が検出された各々のフレームの間の距離であるフレーム間距離に加え、各々のフレーム上での対象物の位置座標の間の距離である座標間距離をもとに決まる対象物同一性確率を利用して判定することを特徴とする請求項21記載の同一性判定方法。
  33. e)入力映像から複数の対象物を検出するステップと、
    f)対象物が検出されたフレーム群の間でフレーム間距離を算出するステップと、
    g)検出された対象物群の間で座標間距離を算出するステップと、
    h)前記フレーム間距離と前記座標間距離を利用して対象物同一性確率を算出するステップと、
    i)対象物同一性確率をもとに対象物の同一性判定するステップと、
    を含むことを特徴とする請求項32記載の同一性判定方法。
  34. 前記ステップhにおいては、あらかじめ記憶されたフレーム間距離と座標間距離と対象物同一性確率の対応表から、前記算出されたフレーム間距離と前記算出された座標間距離をもとに対象物同一性確率を選択することを特徴とする請求項33記載の同一性判定方法。
  35. 前記ステップiにおいては、対象物同一性確率に加え、フレーム対に含まれる対象物の画像特徴、または音響特徴、またはその組み合わせに基づく類似度を利用して対象物間の同一性を判定することを特徴とする請求項33記載の同一性判定方法。
  36. 前記ステップiにおいては、対象物同一性確率とフレーム対に含まれる対象物の画像特徴、または音響特徴、またはその組み合わせに基づく類似度との乗算値によって、対象物間の同一性を判定することを特徴とする請求項33記載の同一性判定方法。
  37. 前記座標間距離は、各対象物の画像領域の重心にあたる座標の間で算出される距離であることを特徴とする請求項32から36の何れか1項記載の同一性判定方法。
  38. 前記座標間距離は、各対象物の画像領域中の1つまたは複数の特徴点について、対応する特徴点の座標の間の線形演算によって算出される距離であることを特徴とする請求項32から36の何れか1項記載の同一性判定方法。
  39. 前記対象物が人物の顔であることを特徴とする請求項32から38の何れか1項記載の同一性判定方法。
  40. 前記座標間距離は、フレーム対において一方のフレーム中の両目の位置座標と、もう一方のフレーム中の両目の位置座標との間の線形演算によって算出される距離であることを特徴とする請求項32から39の何れか1項記載の同一性判定方法。
  41. 入力映像から検出された複数の対象物間の同一性を、対象物が検出された各々のフレームの間の距離であるフレーム間距離をもとに決まる対象物同一性確率を利用して判定することを特徴とする同一性判定装置としてコンピュータを機能させるための同一性判定用プログラム。
  42. 前記同一性判定装置は、
    a)入力映像から複数の対象物を検出する手段と、
    b)対象物が検出されたフレーム群の間でフレーム間距離を算出する手段と、
    c)前記フレーム間距離を利用して対象物同一性確率を算出する手段と、
    d)対象物同一性確率をもとに対象物の同一性判定する手段と、
    を含むことを特徴とする請求項41記載の同一性判定用プログラム。
  43. 前記手段cにおいては、あらかじめ記憶されたフレーム間距離と対象物同一性確率の対応表から、前記算出されたフレーム間距離をもとに対象物同一性確率を選択することを特徴とする請求項42記載の同一性判定用プログラム。
  44. 前記手段dにおいては、対象物同一性確率に加え、フレーム対に含まれる対象物の画像特徴、または音響特徴、またはその組み合わせに基づく類似度を利用して対象物間の同一性を判定することを特徴とする請求項42記載の同一性判定用プログラム。
  45. 前記手段dにおいては、対象物同一性確率とフレーム対に含まれる対象物の画像特徴、または音響特徴、またはその組み合わせに基づく類似度との乗算値によって、対象物間の同一性を判定することを特徴とする請求項42記載の同一性判定用プログラム。
  46. 前記フレーム間距離は、フレーム番号の差分値をもとに算出されるメディア時間であることを特徴とする請求項41から45の何れか1項記載の同一性判定用プログラム。
  47. 前記フレーム間距離は、フレームが対応する台本における時刻の差分値をもとに算出されるシナリオ時間であることを特徴とする請求項41から45の何れか1項記載の同一性判定用プログラム。
  48. 前記フレーム間距離は、ショットの切り替わり、またはカメラワークの変化、またはシーンの切り替わり、またはBGMの変化、または背景の画像特徴量の変化のいずれか一つまたはその組み合わせに基づいて重み付けられたメディア時間またはシナリオ時間であることを特徴とする請求項46または47記載の同一性判定用プログラム。
  49. 前記対象物は、フレーム全体あるいは一部分であることを特徴とする請求項41から48の何れか1項記載の同一性判定用プログラム。
  50. 前記対象物が人物であることを特徴とする請求項41から49の何れか1項記載の同一性判定用プログラム。
  51. 同一フレームから検出された複数の人物間の対象物同一性確率が0となることを特徴とする請求項50記載の同一性判定用プログラム。
  52. 入力映像から検出された複数の対象物間の同一性を、対象物が検出された各々のフレームの間の距離であるフレーム間距離に加え、各々のフレーム上での対象物の位置座標の間の距離である座標間距離をもとに決まる対象物同一性確率を利用して判定することを特徴とする請求項41記載の同一性判定用プログラム。
  53. 前記同一性判定装置は、
    e)入力映像から複数の対象物を検出する手段と、
    f)対象物が検出されたフレーム群の間でフレーム間距離を算出する手段と、
    g)検出された対象物群の間で座標間距離を算出する手段と、
    h)前記フレーム間距離と前記座標間距離を利用して対象物同一性確率を算出する手段と、
    i)対象物同一性確率をもとに対象物の同一性判定する手段と、
    を含むことを特徴とする請求項52記載の同一性判定用プログラム。
  54. 前記手段hにおいては、あらかじめ記憶されたフレーム間距離と座標間距離と対象物同一性確率の対応表から、前記算出されたフレーム間距離と前記算出された座標間距離をもとに対象物同一性確率を選択することを特徴とする請求項53記載の同一性判定用プログラム。
  55. 前記手段iにおいては、対象物同一性確率に加え、フレーム対に含まれる対象物の画像特徴、または音響特徴、またはその組み合わせに基づく類似度を利用して対象物間の同一性を判定することを特徴とする請求項53記載の同一性判定用プログラム。
  56. 前記手段iにおいては、対象物同一性確率とフレーム対に含まれる対象物の画像特徴、または音響特徴、またはその組み合わせに基づく類似度との乗算値によって、対象物間の同一性を判定することを特徴とする請求項53記載の同一性判定用プログラム。
  57. 前記座標間距離は、各対象物の画像領域の重心にあたる座標の間で算出される距離であることを特徴とする請求項52から56の何れか1項記載の同一性判定用プログラム。
  58. 前記座標間距離は、各対象物の画像領域中の1つまたは複数の特徴点について、対応する特徴点の座標の間の線形演算によって算出される距離であることを特徴とする請求項52から56の何れか1項記載の同一性判定用プログラム。
  59. 前記対象物が人物の顔であることを特徴とする請求項52から58の何れか1項記載の同一性判定用プログラム。
  60. 前記座標間距離は、フレーム対において一方のフレーム中の両目の位置座標と、もう一方のフレーム中の両目の位置座標との間の線形演算によって算出される距離であることを特徴とする請求項52から59の何れか1項記載の同一性判定用プログラム。
JP2008551112A 2006-12-27 2007-12-25 同一性判定装置、同一性判定方法および同一性判定用プログラム Active JP5088507B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008551112A JP5088507B2 (ja) 2006-12-27 2007-12-25 同一性判定装置、同一性判定方法および同一性判定用プログラム

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
JP2006351892 2006-12-27
JP2006351892 2006-12-27
JP2007296718 2007-11-15
JP2007296718 2007-11-15
PCT/JP2007/074817 WO2008078736A1 (ja) 2006-12-27 2007-12-25 同一性判定装置、同一性判定方法および同一性判定用プログラム
JP2008551112A JP5088507B2 (ja) 2006-12-27 2007-12-25 同一性判定装置、同一性判定方法および同一性判定用プログラム

Publications (2)

Publication Number Publication Date
JPWO2008078736A1 true JPWO2008078736A1 (ja) 2010-04-30
JP5088507B2 JP5088507B2 (ja) 2012-12-05

Family

ID=39562525

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008551112A Active JP5088507B2 (ja) 2006-12-27 2007-12-25 同一性判定装置、同一性判定方法および同一性判定用プログラム

Country Status (3)

Country Link
US (1) US9105306B2 (ja)
JP (1) JP5088507B2 (ja)
WO (1) WO2008078736A1 (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010101671A1 (en) 2009-01-16 2010-09-10 New York University Automated real-time particle characterization and three-dimensional velocimetry with holographic video microscopy
WO2010140195A1 (ja) * 2009-06-05 2010-12-09 株式会社 東芝 映像編集装置
JP5517548B2 (ja) * 2009-10-05 2014-06-11 キヤノン株式会社 画像処理装置及び画像処理方法
JP5834232B2 (ja) * 2011-01-17 2015-12-16 パナソニックIpマネジメント株式会社 撮像画像認識装置、撮像画像認識システム及び撮像画像認識方法
CA2836387C (en) * 2011-05-20 2018-09-11 Bae Systems Plc Supervised data transfer
JP6005837B2 (ja) * 2013-02-27 2016-10-12 株式会社日立製作所 画像解析装置、画像解析システム、画像解析方法
WO2016002152A1 (ja) * 2014-06-30 2016-01-07 日本電気株式会社 個人情報に配慮した画像処理システム、画像処理方法及びプログラム記憶媒体
ES2913524T3 (es) 2014-11-12 2022-06-02 Univ New York Huellas coloidales para materiales blandos usando caracterización holográfica total
CN106303499B (zh) * 2015-05-30 2018-10-16 北京智谷睿拓技术服务有限公司 视频显示控制方法和装置、显示设备
CN106303315B (zh) 2015-05-30 2019-08-16 北京智谷睿拓技术服务有限公司 视频显示控制方法和装置、显示设备
CN106303498B (zh) * 2015-05-30 2018-10-16 北京智谷睿拓技术服务有限公司 视频显示控制方法和装置、显示设备
WO2017139279A2 (en) 2016-02-08 2017-08-17 New York University Holographic characterization of protein aggregates
US10482345B2 (en) * 2016-06-23 2019-11-19 Capital One Services, Llc Systems and methods for automated object recognition
US10102423B2 (en) * 2016-06-30 2018-10-16 Snap Inc. Object modeling and replacement in a video stream
US10832035B2 (en) * 2017-06-22 2020-11-10 Koninklijke Philips N.V. Subject identification systems and methods
JP6427650B1 (ja) 2017-11-21 2018-11-21 三菱電機インフォメーションシステムズ株式会社 追跡装置及び追跡プログラム
EP3724809A1 (en) 2017-12-13 2020-10-21 Telefonaktiebolaget LM Ericsson (publ) Indicating objects within frames of a video segment
US10957048B2 (en) * 2018-09-05 2021-03-23 Htc Corporation Image segmentation method, apparatus and non-transitory computer readable medium of the same
US11543338B2 (en) 2019-10-25 2023-01-03 New York University Holographic characterization of irregular particles
US11069036B1 (en) * 2020-01-03 2021-07-20 GE Precision Healthcare LLC Method and system for real-time and offline de-identification of facial regions from regular and occluded color video streams obtained during diagnostic medical procedures
US11948302B2 (en) 2020-03-09 2024-04-02 New York University Automated holographic video microscopy assay
CN113438500B (zh) * 2020-03-23 2023-03-24 阿里巴巴集团控股有限公司 视频处理方法、装置、电子设备及计算机存储介质
CN113674307B (zh) * 2021-10-20 2022-02-11 湖南大学 一种目标检测跟踪方法、装置及设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007303239A (ja) * 2006-05-15 2007-11-22 Konica Minolta Holdings Inc 認証装置、認証装置の制御方法、および認証装置の制御プログラム

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0686336B1 (en) 1993-02-23 1998-05-20 BRITISH TELECOMMUNICATIONS public limited company Event correlation
JP3329408B2 (ja) 1993-12-27 2002-09-30 日本電信電話株式会社 動画像処理方法および装置
JPH09130803A (ja) * 1995-10-27 1997-05-16 Fujitsu Ltd 背景画像復元方法および装置
US6985172B1 (en) * 1995-12-01 2006-01-10 Southwest Research Institute Model-based incident detection system with motion classification
JP3315888B2 (ja) 1997-02-18 2002-08-19 株式会社東芝 動画像表示装置および表示方法
KR100361497B1 (ko) * 1999-01-08 2002-11-18 엘지전자 주식회사 얼굴영역 추출방법
JP2000285242A (ja) 1999-01-29 2000-10-13 Sony Corp 信号処理方法及び映像音声処理装置
US6774917B1 (en) * 1999-03-11 2004-08-10 Fuji Xerox Co., Ltd. Methods and apparatuses for interactive similarity searching, retrieval, and browsing of video
US6760378B1 (en) * 1999-06-30 2004-07-06 Realnetworks, Inc. System and method for generating video frames and correcting motion
JP4697500B2 (ja) * 1999-08-09 2011-06-08 ソニー株式会社 送信装置および送信方法、受信装置および受信方法、並びに記録媒体
JP2001350494A (ja) * 2000-06-05 2001-12-21 Secom Co Ltd 照合装置及び照合方法
JP4552296B2 (ja) * 2000-09-08 2010-09-29 ソニー株式会社 情報処理装置および情報処理方法、並びに記録媒体
US6498863B1 (en) * 2000-09-20 2002-12-24 Media Cybernetics Inc. Method, system, and product for analyzing a digitized image of an array to create an image of a grid overlay
US20040151250A1 (en) * 2001-06-11 2004-08-05 Witterbrood Rimmert B. Feature point selection
US7688349B2 (en) * 2001-12-07 2010-03-30 International Business Machines Corporation Method of detecting and tracking groups of people
JP4034660B2 (ja) 2003-01-31 2008-01-16 株式会社東芝 プラント機器の保守管理計画支援方法および装置
US20040223652A1 (en) * 2003-05-07 2004-11-11 Cetin Ahmet Enis Characterization of motion of moving objects in video
US7532804B2 (en) * 2003-06-23 2009-05-12 Seiko Epson Corporation Method and apparatus for video copy detection
KR100585733B1 (ko) * 2003-10-16 2006-06-07 엘지전자 주식회사 영상 처리 시스템의 손실 블록 특성 자동 판단 방법 및 장치
JP4425669B2 (ja) 2004-03-09 2010-03-03 富士重工業株式会社 車両用運転支援装置
US7436980B2 (en) * 2004-05-27 2008-10-14 Siemens Corporate Research, Inc. Graphical object models for detection and tracking
JP4211706B2 (ja) 2004-07-28 2009-01-21 株式会社日立製作所 交通情報提供装置
JP2007172303A (ja) * 2005-12-22 2007-07-05 Seiko Epson Corp 情報入力システム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007303239A (ja) * 2006-05-15 2007-11-22 Konica Minolta Holdings Inc 認証装置、認証装置の制御方法、および認証装置の制御プログラム

Also Published As

Publication number Publication date
US20100150408A1 (en) 2010-06-17
US9105306B2 (en) 2015-08-11
WO2008078736A1 (ja) 2008-07-03
JP5088507B2 (ja) 2012-12-05

Similar Documents

Publication Publication Date Title
JP5088507B2 (ja) 同一性判定装置、同一性判定方法および同一性判定用プログラム
US20210365707A1 (en) Maintaining fixed sizes for target objects in frames
JP4381310B2 (ja) メディア処理システム
US7515739B2 (en) Face detection
US8384791B2 (en) Video camera for face detection
US8073203B2 (en) Generating effects in a webcam application
US7336830B2 (en) Face detection
CN111480156A (zh) 利用深度学习选择性存储视听内容的系统和方法
JP2006508461A (ja) 顔検出及び顔追跡
JP2006508601A5 (ja)
WO2011080900A1 (ja) 移動体検出装置および移動体検出方法
JP2011070576A (ja) 画像処理装置、及び画像処理方法
US20060198554A1 (en) Face detection
KR20170047167A (ko) 전자 장치가 동영상의 얼굴의 인상을 변형하는 방법 및 그 전자 장치
US20050129275A1 (en) Object detection
JP2008501172A (ja) 画像比較方法
WO2006025272A1 (ja) 映像分類装置、映像分類プログラム、映像検索装置、および映像検索プログラム
Yargıç et al. A lip reading application on MS Kinect camera
US20050129277A1 (en) Object detection
US10224073B2 (en) Auto-directing media construction
CN116824641B (zh) 姿态分类方法、装置、设备和计算机存储介质
Zhang et al. Robust multi-view multi-camera face detection inside smart rooms using spatio-temporal dynamic programming
KR101272631B1 (ko) 이동물체 감지장치 및 방법
WO2024062971A1 (ja) 情報処理装置、情報処理方法および情報処理プログラム
JPH09179880A (ja) 動画像の重要画像抽出装置および重要画像抽出方法

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20101022

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20101022

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120606

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120725

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120815

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120828

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150921

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5088507

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150