JP2007180970A - Video processor and monitoring camera system - Google Patents

Video processor and monitoring camera system Download PDF

Info

Publication number
JP2007180970A
JP2007180970A JP2005377929A JP2005377929A JP2007180970A JP 2007180970 A JP2007180970 A JP 2007180970A JP 2005377929 A JP2005377929 A JP 2005377929A JP 2005377929 A JP2005377929 A JP 2005377929A JP 2007180970 A JP2007180970 A JP 2007180970A
Authority
JP
Japan
Prior art keywords
video
motion vector
frame
encoding
recording
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005377929A
Other languages
Japanese (ja)
Inventor
Tadataka Ueda
恭敬 上田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2005377929A priority Critical patent/JP2007180970A/en
Publication of JP2007180970A publication Critical patent/JP2007180970A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Closed-Circuit Television Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a device capable of easily confirming a change after recording by stably detecting an abnormal state without requiring new processing and a device different from encoding processing in a monitoring camera system provided with a compression coding means including an inter-frame predictive encoding method. <P>SOLUTION: This video processor and monitoring camera system for filing encoded video data and recording the video data in a randomly accessible recording medium 120 is provided with a compression encoding means 104 including motion compensation processing using a motion vector detected by a motion vector detecting means 105 and quantization processing, determines a video change point (abnormal state) from either a maximum value of the size of a motion vector of a corresponding encoded frame or a variation in an average value and a variation in a quantization coefficient of the encoded frame, associates the encoded data with the filed video file, and records the encoded data as meta data. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、映像を圧縮符号化する際に検出される動きベクトル情報を用いて圧縮符号化すると同時に映像変化点を検出する、映像処理装置及び監視カメラシステムに関する。   The present invention relates to a video processing apparatus and a surveillance camera system that detect video change points simultaneously with compression encoding using motion vector information detected when video is compression-encoded.

近年、映像の符号化技術において、特に長時間記録、すなわち低ビットレートでの記録を必要とする分野では、フレーム間の相関情報を利用して高効率なフレーム間予測符号化を行う装置が一般的になっている。フレーム間予測符号化では、一般的に、フレーム間の相関から動きベクトルを検出して効率よく圧縮符号化を行うための動き補償処理が行われている。   In recent years, in the field of video encoding technology, particularly in fields that require long-time recording, that is, recording at a low bit rate, apparatuses that perform inter-frame predictive encoding using correlation information between frames are generally used. It has become. In inter-frame predictive coding, generally, motion compensation processing is performed for efficiently performing compression coding by detecting a motion vector from the correlation between frames.

一方、映像のデジタル信号処理や圧縮符号化技術、ネットワーク技術の進歩により、映像機器のデジタル化が進んでおり、監視カメラシステム分野においても、デジタル化された映像信号を圧縮符号化して記録するシステムが開発されている。   On the other hand, with the advance of digital video signal processing, compression encoding technology, and network technology, video equipment has been digitized, and in the surveillance camera system field, a system that records and compresses digital video signals Has been developed.

監視カメラシステムにおいては、たまに起こる事象(例えば、通常は人が立ち入ることのない場所に人が入り込んできた等)を効率よく発見してその事象のみを記録することや、再生時にその映像を容易に検索することができれば、利便性が飛躍的に向上する。すなわち、映像の変化を検知して、その位置を変化点として記録・再生に利用する変化点検知技術が重要となる。そこで、映像を圧縮符号化して記録する監視カメラシステムにおいて、フレーム間予測符号化で用いられる動きベクトル検出を利用して、変化点検知を行う技術が提案されている。   In surveillance camera systems, events that occur occasionally (for example, people have entered a place where people usually do not enter) can be efficiently discovered and recorded only, and the video can be easily viewed during playback. If it is possible to search, the convenience will be improved dramatically. That is, a change point detection technique that detects a change in video and uses the position as a change point for recording and reproduction is important. In view of this, there has been proposed a technique for detecting a change point using motion vector detection used in inter-frame predictive encoding in a surveillance camera system that records video after compression encoding.

例えば、入力映像のフレーム間での変化が小さい状態から大きい状態に移ったことを検知し、その時刻から、再び変化が大きい状態から小さい状態に移った時刻までを記録/伝送し、変化の小さい期間の映像については監視に関して無駄な映像として、記録/伝送しない映像処理装置が開示されている(例えば、特許文献1を参照。)。この従来の映像処理装置において、フレーム間の変化は、フレーム間の同一位置の画素値の差分及び動きベクトルの大きさの両方を用いて検知している。   For example, when a change from a small state to a large state is detected between frames of the input video, it is recorded / transmitted from that time to a time when the change again changes from a large state to a small state, and the change is small. A video processing apparatus that does not record / transmit video for a period is disclosed as useless video for monitoring (see, for example, Patent Document 1). In this conventional video processing apparatus, a change between frames is detected using both a difference in pixel values at the same position between frames and the magnitude of a motion vector.

また、通常はカメラから背景の映像のみが入力されているが、あるとき映像内に侵入者が映ったとすると、侵入者は背景映像に対する差分として認識されるため、これをシーンチェンジとして検出することができる。そこで、侵入者が映ったと認識したフレームに、付加情報としてシーンチェンジを表す情報を貯えておき、後でこの付加情報の検索を行って、シーンチェンジ部分の一覧表示を行う映像処理装置が開示されている(例えば、特許文献2を参照。)。この従来の映像処理装置におけるシーンチェンジ検出は、動きベクトルの大きさや分布から画面変化量を求め、一定値以上の変化があったところをシーンチェンジとしている。   Normally, only the background video is input from the camera, but if an intruder appears in the video at some time, the intruder is recognized as a difference to the background video, so this should be detected as a scene change. Can do. Therefore, a video processing apparatus is disclosed that stores information representing scene changes as additional information in a frame that is recognized as an intruder, and displays a list of scene change portions by searching for the additional information later. (For example, refer to Patent Document 2). In the scene change detection in this conventional video processing apparatus, the amount of screen change is obtained from the magnitude and distribution of the motion vector, and a scene change is determined where there has been a change beyond a certain value.

これら従来の映像処理装置は、圧縮符号化時に検出される動きベクトル及び、圧縮符号化とは別の技術を組み合わせて映像中の変化や異常を検知するものである。
特開2001−309354号公報 特開2000−287165号公報
These conventional video processing apparatuses detect a change or abnormality in a video by combining a motion vector detected at the time of compression encoding and a technique different from the compression encoding.
JP 2001-309354 A JP 2000-287165 A

しかしながら、映像のフレーム間予測符号化時に検出される動きベクトルは、映像データに対して効率的に符号化を行うために検出されるものであり、変化点検知のために検出されるものではない。このような理由から、従来の映像処理装置では、必ずしも映像の特徴と動きベクトル検出の結果とが一致しないため、動きベクトル検出結果のみに基づいた変化点検知では、変化点の誤検知が多いという課題があった。例えば、屋外の監視カメラシステムにおいて、背景に木々が映っており、風が吹いている状態であれば、画面全体の動きベクトルの大きさの平均値が高くなり、変化点と検知されることもある。この検知精度を向上させるためには、特許文献1で開示されているように圧縮符号化とは別に、変化点検知のための新たな処理や装置が必要であり、大規模なシステムになり、省電力化、低価格化が困難である。   However, the motion vector detected at the time of video inter-frame predictive encoding is detected in order to efficiently encode video data, and is not detected for detecting a change point. . For this reason, in conventional video processing devices, video features and motion vector detection results do not necessarily match, and therefore, change point detection based only on motion vector detection results often results in false detection of change points. There was a problem. For example, in an outdoor surveillance camera system, if trees are reflected in the background and the wind is blowing, the average value of the motion vector of the entire screen will be high, and it may be detected as a change point. is there. In order to improve this detection accuracy, as disclosed in Patent Document 1, apart from compression coding, a new process or device for detecting a change point is necessary, resulting in a large-scale system. It is difficult to save power and reduce prices.

本発明は上記課題に鑑み、システム規模の拡大を抑制しつつ、効率的な変化点検知を行うことが可能な映像処理装置を提供することを目的とする。   In view of the above problems, an object of the present invention is to provide a video processing apparatus capable of performing efficient change point detection while suppressing an increase in system scale.

上述した課題を解決するために、本発明の映像処理装置は、ランダムアクセス可能な記録媒体に符号化した映像データをファイル化して記録する映像処理装置であり、映像データから変化点検知(以下、適宜、異常検知と呼ぶ)を行うために、少なくとも、動きベクトル検出手段にて検出される動きベクトルを用いた動き補償処理と、量子化係数を適応的に変更して効率的な量子化を行う量子化処理とを含む映像符号化方式を備え、該当符号化フレームの動きベクトルの大きさの最大値、或いは、フレーム間の動きベクトルの大きさ平均値の変化量と、フレーム間の量子化係数の変化量とが、共に各々の閾値を超えた場合に「異常あり」と判断する。検知した前記異常検知情報は、メタデータとして、映像ファイルの先頭からのOffsetフレーム値と、映像を符号化したデータとを記録媒体に記録するファイルと関連付けて記録する。   In order to solve the above-described problems, a video processing apparatus according to the present invention is a video processing apparatus that records video data encoded in a randomly accessible recording medium as a file, and detects change points from the video data (hereinafter, referred to as “change point detection”). In order to perform an appropriate detection), at least a motion compensation process using a motion vector detected by the motion vector detection means, and an efficient quantization by adaptively changing the quantization coefficient Video coding system including quantization processing, the maximum value of the motion vector of the corresponding encoded frame, or the amount of change in the average value of the motion vector between frames, and the quantization coefficient between frames When both of the change amounts exceed the respective threshold values, it is determined that “abnormality exists”. The detected abnormality detection information is recorded as metadata in association with an offset frame value from the top of the video file and data obtained by encoding the video in association with a file to be recorded on the recording medium.

また、再生時には、メタデータとして記録された異常検知情報に基づいて、前記Offset値に該当するフレームから再生を開始する。   At the time of reproduction, reproduction is started from a frame corresponding to the Offset value based on the abnormality detection information recorded as metadata.

本発明の映像処理装置によれば、映像データを圧縮符号化し、ランダムアクセス可能な記録媒体に圧縮符号化データをファイル化して記録する映像処理装置及び監視カメラシステムにおいて、記録後の確認を効率的に行うための異常検知を、より安定して行うことができる。   According to the video processing apparatus of the present invention, in the video processing apparatus and the monitoring camera system for compressing and encoding video data and recording the compressed encoded data as a file on a randomly accessible recording medium, the confirmation after recording is efficiently performed. Therefore, it is possible to perform abnormality detection more stably.

また、異常を検知するために必要な処理は、動き補償予測処理で必要な動きベクトルや量子化処理の結果である量子化係数等、映像を記録するために圧縮符号化処理をする際に必要な情報のみであり、圧縮符号化処理とは別の新たな処理や装置を必要としない。したがって、低価格、低消費電力の映像処理装置を実現することができ、携帯型の映像処理装置にも容易に適応可能である。   Also, the processing necessary to detect anomalies is necessary when performing compression encoding processing to record video, such as motion vectors necessary for motion compensation prediction processing and quantization coefficients resulting from quantization processing. Therefore, no new process or device different from the compression encoding process is required. Therefore, a low-priced and low-power-consumption video processing device can be realized, and can be easily applied to a portable video processing device.

以下、図面を参照しながら本発明の実施の形態について説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

図1は、本発明の実施の形態の監視カメラシステムの構成を示す。本実施の形態では、被写体を撮像するカメラ部と、カメラ部により撮像された映像を圧縮符号化された圧縮映像データとして記録媒体に記録する記録手段を有した監視カメラシステムの一例を挙げて説明する。このような監視カメラシステムは、例えば、オフィスビルの夜間監視カメラシステムや、出入り口の監視カメラシステムとして利用される。   FIG. 1 shows a configuration of a surveillance camera system according to an embodiment of the present invention. In this embodiment, an example of a surveillance camera system having a camera unit that captures an image of a subject and a recording unit that records video captured by the camera unit as compressed video data that has been compression-encoded on a recording medium will be described. To do. Such a monitoring camera system is used as, for example, a nighttime monitoring camera system in an office building or a monitoring camera system at an entrance / exit.

図1に示すように、本監視カメラシステムは、記録媒体120に記録するための映像データを供給するカメラ部101と、カメラ部101からの映像データに対し、符号化前のフィルタ処理等を行う映像処理部102と、映像データを圧縮符号化して圧縮符号化データを生成する映像符号化部103と、記録媒体120に記録された圧縮符号化データを復号化する映像復号化部106と、復号化された映像データを出力する映像出力部107と、システム全体を制御するシステム制御部110と、システム制御部110が各部の制御を行うために相互接続するためのI/Oバス130と、確認操作等のユーザからの入力を受け付ける入力手段131と、ユーザ操作に必要なクリップ(後述)のリスト情報や静止画等を表示するための表示装置132とを備える。   As shown in FIG. 1, the surveillance camera system performs a pre-encoding filter process on the video data from the camera unit 101 that supplies video data to be recorded on the recording medium 120 and the video data. A video processing unit 102; a video encoding unit 103 that compresses and encodes video data to generate compressed encoded data; a video decoding unit 106 that decodes compressed encoded data recorded on the recording medium 120; A video output unit 107 for outputting the converted video data, a system control unit 110 for controlling the entire system, an I / O bus 130 for interconnecting the system control unit 110 to control each unit, and confirmation An input unit 131 that receives an input from the user such as an operation, and a display device for displaying list information of a clip (described later) necessary for the user operation, a still image, And a 32.

さらに、映像符号化部103は、映像データの圧縮符号化を行う映像符号化手段104と、フレーム間の動きベクトルを検出する動きベクトル検出手段105とを含み、システム制御部110は、映像を圧縮符号化したデータをファイルとして記録媒体に記録する映像ファイル記録手段111、画像に関する統計情報を取得、管理する画像情報管理手段112、異常を検知する映像変化解析手段113、異常が検知されたことを示す情報である異常検知情報を映像ファイルと関連付けて記録するメタデータ記録手段114、例えば、クリップのリスト情報や、サムネイル画を表示するための表示制御を行う表示制御手段115、記録媒体120に記録された圧縮符号化データの再生制御を行う映像ファイル再生手段116、及び記録されたメタデータを読み出して管理するメタデータ再生手段117を含む構成である。   Furthermore, the video encoding unit 103 includes a video encoding unit 104 that compresses and encodes video data, and a motion vector detection unit 105 that detects a motion vector between frames. The system control unit 110 compresses the video. Video file recording unit 111 that records the encoded data as a file on a recording medium, image information management unit 112 that acquires and manages statistical information about an image, video change analysis unit 113 that detects an abnormality, and that an abnormality has been detected Metadata recording means 114 that records abnormality detection information that is information associated with the video file, for example, display control means 115 that performs display control for displaying clip list information and thumbnail images, and recording on recording medium 120 Video file playback means 116 for controlling the playback of the compressed encoded data, and the recorded media It is configured to include a metadata playing section 117 to manage reading data.

また、本実施の形態では、システム制御部110が、例えば、図示しないマイコンとメモリとによって実現される一例を挙げており、システム制御部110に含まれる各処理手段は、マイコンがメモリに記憶した各種のプログラムを実行することによって実現される。   In the present embodiment, an example is given in which the system control unit 110 is realized by, for example, a microcomputer and a memory (not shown), and each processing unit included in the system control unit 110 is stored in the memory by the microcomputer. This is realized by executing various programs.

一方、映像符号化部103に供給される映像データは、例えば、映像圧縮方式として広く利用されているMPEG−2方式や、あるいは、MPEG−4 AVC/H.264規格に基づき圧縮符号化される。本発明はフレーム間予測符号化を適用する圧縮符号化方式に対してであれば同様の効果を発揮するが、本実施の形態では、MPEG−4 AVC/H.264方式(以下、H.264と略記する)にて圧縮符号化する例を説明する。   On the other hand, the video data supplied to the video encoding unit 103 is, for example, the MPEG-2 system widely used as a video compression system, or MPEG-4 AVC / H. It is compression-encoded based on the H.264 standard. The present invention exerts the same effect as long as it is applied to a compression coding system to which inter-frame predictive coding is applied, but in this embodiment, MPEG-4 AVC / H. An example of compressing and encoding in the H.264 system (hereinafter abbreviated as H.264) will be described.

以上のように構成された本監視カメラシステムにおいて、例えば、入力手段131によりユーザが監視開始を指示すると、カメラ部101は撮像処理を行い、デジタル化された映像データを出力する。次に、この信号が映像処理部102に供給され、供給された映像データは、例えば、フィルタでの帯域制限や、ノイズ除去が行われる。処理された映像データは、映像符号化部103に提供される。   In the surveillance camera system configured as described above, for example, when the user instructs to start monitoring by the input unit 131, the camera unit 101 performs an imaging process and outputs digitized video data. Next, this signal is supplied to the video processing unit 102, and the supplied video data is subjected to, for example, band limitation by a filter and noise removal. The processed video data is provided to the video encoding unit 103.

映像符号化部103には、映像符号化手段104と、動きベクトル検出手段105とが含まれており、詳細は後述するが、映像データがH.264方式に従って圧縮符号化される。映像符号化部103にて圧縮符号化された圧縮符号化データは、システム制御部110の映像ファイル記録手段111によりファイルとして記録媒体120に記録される。   The video encoding unit 103 includes a video encoding unit 104 and a motion vector detection unit 105. Although details will be described later, the video data is H.264. The data is compressed and encoded according to the H.264 system. The compressed encoded data compressed and encoded by the video encoding unit 103 is recorded on the recording medium 120 as a file by the video file recording unit 111 of the system control unit 110.

さらに、映像符号化部103での演算結果及び検出結果は、システム制御部110の画像情報管理手段112により取得される。例えば、動きベクトル検出手段105にて検出される圧縮符号化時の動きベクトルの平均値や最大値、映像符号化手段104で演算される量子化パラメータ、動き補償処理のブロックサイズの分布、参照フレームへの最小フレーム長等の各フレームの画像統計情報が、各フレームの圧縮符号化データと同期した状態で管理される。映像変化解析手段113では、画像情報管理手段112から前記画像統計情報を取得し、これらの情報に基づいて異常検知処理を行い、フレーム毎に「異常あり」、「異常なし」の2つの異常検知情報が決定される。「異常あり」と判断された場合には、そのことがメタデータ記録手段114に通知される。メタデータ記録手段114は、「異常あり」との異常検知情報を、映像が記録されるファイル及び「異常あり」と判断されたフレーム番号と関連づけてメタデータとして別ファイルに記録する。映像変化解析手段113での異常検知方法や、メタデータ記録手段114における異常検知情報をメタデータとして記録する方法の詳細は後述する。   Furthermore, the calculation result and detection result in the video encoding unit 103 are acquired by the image information management unit 112 of the system control unit 110. For example, an average value or maximum value of motion vectors detected by the motion vector detection unit 105 at the time of compression encoding, a quantization parameter calculated by the video encoding unit 104, a block size distribution of motion compensation processing, a reference frame Image statistical information of each frame such as the minimum frame length is managed in a state in which it is synchronized with the compression-encoded data of each frame. The video change analysis unit 113 acquires the image statistical information from the image information management unit 112, performs an abnormality detection process based on the information, and detects two abnormality detections “abnormal” and “abnormal” for each frame. Information is determined. If it is determined that there is “abnormal”, this is notified to the metadata recording means 114. The metadata recording unit 114 records the abnormality detection information “abnormal” in a separate file as metadata in association with the file in which the video is recorded and the frame number determined as “abnormal”. Details of the abnormality detection method in the video change analysis unit 113 and the method of recording the abnormality detection information in the metadata recording unit 114 as metadata will be described later.

入力手段131によりユーザが監視終了を指示すると、監視カメラシステムは記録動作を終了する。   When the user instructs the end of monitoring by using the input means 131, the monitoring camera system ends the recording operation.

以上のような1連続の記録でできたファイル群をクリップと呼ぶことにする。クリップには、少なくとも映像を圧縮符号化したデータファイルを含み、例えば、音声ファイルや、撮影場所や時間を示すメタデータを記録するファイルを含んでもよい。また、記録媒体の容量や、ファイルシステム上の管理制限等で、映像ファイルを分割する必要があるときは、監視開始から監視終了までの映像データを2つまたはそれ以上のクリップに分割して記録媒体に記録する。なお、本実施の形態では、監視用途のシステムであるため、記録されたクリップの順番は、例えば、記録時間等で容易に判断できる。したがって、本実施の形態では、特にクリップの連続性を規定する記述を記録媒体に記録しないが、前記記述を記録媒体に記録してもよい。   A file group formed by one continuous recording as described above is called a clip. The clip includes at least a data file obtained by compressing and encoding a video, and may include, for example, an audio file and a file that records metadata indicating a shooting location and time. Also, when it is necessary to divide the video file due to the capacity of the recording medium or management restrictions on the file system, the video data from the start of monitoring to the end of monitoring is divided into two or more clips and recorded. Record on media. In this embodiment, since it is a system for monitoring use, the order of recorded clips can be easily determined by, for example, recording time. Therefore, in the present embodiment, the description that defines the continuity of the clip is not recorded on the recording medium, but the description may be recorded on the recording medium.

記録媒体120にファイルとして記録された圧縮符号化データの再生時には、メタデータ再生手段117により、記録媒体120からメタデータのファイルが読み出され、さらにメタデータ中の異常検知情報が読み出される。そして入力手段131によるユーザからの再生指示により、映像ファイル再生手段116が、「異常あり」と判断されたフレームの圧縮符号化データを読み出し、映像復号化部106に提供する。映像復号化部106は、H.264規格に準拠した復号化処理を行い、復号化した映像データを映像出力部107に提供し、映像出力部107にて映像の表示が行われる。このメタデータ再生手段117の処理の詳細は後述する。   When reproducing the compressed and encoded data recorded as a file on the recording medium 120, the metadata reproducing means 117 reads the metadata file from the recording medium 120, and further reads the abnormality detection information in the metadata. Then, in response to a playback instruction from the user through the input unit 131, the video file playback unit 116 reads out the compressed encoded data of the frame determined to be “abnormal” and provides it to the video decoding unit 106. The video decoding unit 106 performs the H.264 decoding. The decoding processing conforming to the H.264 standard is performed, the decoded video data is provided to the video output unit 107, and the video output unit 107 displays the video. Details of the processing of the metadata reproducing means 117 will be described later.

次に、映像符号化部103の動作について詳細に説明する。映像符号化部103の詳細なブロック図を図2に示す。図2は、規格で定められた一般的なH.264方式で符号化する際の構成であり、図1の動きベクトル検出手段105は、動きベクトル検出部208に相当し、映像符号化手段104は、DCT/量子化部201〜フレーム間予測処理部207の各ブロックに相当する。   Next, the operation of the video encoding unit 103 will be described in detail. A detailed block diagram of the video encoding unit 103 is shown in FIG. FIG. 2 shows a general H.264 standard defined by the standard. The motion vector detection unit 105 in FIG. 1 corresponds to the motion vector detection unit 208, and the video encoding unit 104 includes a DCT / quantization unit 201 to an inter-frame prediction processing unit. 207 corresponds to each block.

まず、入力手段131の記録指示により符号化を開始すると、入力された映像データはDCT/量子化部201に提供され、離散コサイン変換(DCT)及び量子化処理が行われた後、エントロピー符号化部202にて可変長符号化や算術符号化が行われてビットストリームとして圧縮符号化データが出力される。同時に、逆量子化/IDCT部203は、DCT/量子化部201から提供された変換データに対して、逆量子化処理及び逆DCT(IDCT)処理を行い、フィルタ部204に逆変換された映像データを提供する。この映像データはフィルタ部204にて、デブロッキングフィルタ処理が行われた後でフレームメモリ205に格納され、フレーム内予測処理及びフレーム間予測処理にて利用される。フレーム内予測処理部206では、H.264の特徴の一つでもあるフレーム内での予測を行う。予測結果は、DCT/量子化部201にて、次フレームの入力画像のDCT/量子化の際に用いられる。   First, when encoding is started in accordance with a recording instruction from the input unit 131, input video data is provided to the DCT / quantization unit 201, subjected to discrete cosine transform (DCT) and quantization processing, and then entropy encoded. The unit 202 performs variable length coding and arithmetic coding, and outputs the compression coded data as a bit stream. At the same time, the inverse quantization / IDCT unit 203 performs an inverse quantization process and an inverse DCT (IDCT) process on the converted data provided from the DCT / quantization unit 201, and the image inversely converted to the filter unit 204. Provide data. This video data is subjected to deblocking filter processing in the filter unit 204 and then stored in the frame memory 205 and used in intra-frame prediction processing and inter-frame prediction processing. In the intra-frame prediction processing unit 206, Prediction is performed within a frame that is also one of the H.264 features. The prediction result is used by the DCT / quantization unit 201 when DCT / quantization of the input image of the next frame.

一方、入力された映像データは動きベクトル検出部208にも入力され、フレームメモリ205に格納されている参照フレームから水平方向と垂直方向の動きベクトルを検出し、フレーム間予測処理部207にて、可変MC(Motion Compensation)によるブロックの分割処理、動き補償処理及び動きベクトルの符号化が行われる。フレーム内予測処理部206及びフレーム間予測処理部207での予測結果は、フレーム内/フレーム間予測切替部210にて、フレーム毎にいずれかを選択した後、DCT/量子化部201に提供される。   On the other hand, the input video data is also input to the motion vector detection unit 208 to detect horizontal and vertical motion vectors from the reference frame stored in the frame memory 205, and the inter-frame prediction processing unit 207 Block division processing, motion compensation processing, and motion vector encoding are performed using variable MC (Motion Compensation). The prediction results in the intra-frame prediction processing unit 206 and the inter-frame prediction processing unit 207 are provided to the DCT / quantization unit 201 after selecting either one for each frame in the intra-frame / inter-frame prediction switching unit 210. The

さらに、動きベクトル検出部208では、まず、符号化を行う1フレームの映像データを所定の大きさの矩形領域(例えば、16×16画素、8×8画素など)にブロック分割し、フレームメモリ205内に格納されている参照フレームから各ブロックの予測値として適切なブロックを探索する。一般的には、参照フレーム内のあらかじめ設定された探索範囲内で、ブロックの位置を少しずつ動かして、当該位置のブロックが予測値として適切か否かを判定する。適切であることの判定基準には、ブロック内の各画素値の差分2乗和、差分絶対値和などが用いられる。このようにして、符号化を行う1フレームの映像データの各ブロックに対し、参照画面内で当該ブロックの予測値として探索されたブロックの位置のずれを動きベクトルとして検出する。したがって、検出された動きベクトルを用いて映像の動きの特徴の概略を把握することができる。   Further, the motion vector detection unit 208 first divides one frame of video data to be encoded into rectangular areas (for example, 16 × 16 pixels, 8 × 8 pixels, etc.) having a predetermined size, and the frame memory 205 An appropriate block is searched as a predicted value of each block from the reference frame stored therein. In general, the position of a block is moved little by little within a preset search range in a reference frame to determine whether or not the block at that position is appropriate as a predicted value. As a criterion for determining appropriateness, a sum of squares of differences of pixel values in a block, a sum of absolute differences, and the like are used. In this manner, for each block of one frame of video data to be encoded, a shift in the position of the block searched as a predicted value of the block in the reference screen is detected as a motion vector. Therefore, it is possible to grasp the outline of the motion feature of the video using the detected motion vector.

次に、映像変化解析手段113における異常検知方法について具体的に説明する。まず、画像情報管理手段112によって映像符号化部103の各フレームにおける圧縮符号化する際の統計情報が取得される。本発明で利用する統計情報としては、映像符号化部103で演算または検出された動きベクトル、各マクロブロック(MB)の量子化係数(Qstep)に相当するマトリックス、各MBの参照フレーム番号が挙げられる。以上の情報はH.264方式で符号化するために必要な情報であり、圧縮符号化データの中に埋め込まれる(さらなる詳細はH.264規格を参照。)。   Next, the abnormality detection method in the video change analysis unit 113 will be specifically described. First, the image information management unit 112 acquires statistical information when the video encoding unit 103 performs compression encoding in each frame. The statistical information used in the present invention includes a motion vector calculated or detected by the video encoding unit 103, a matrix corresponding to a quantization coefficient (Qstep) of each macroblock (MB), and a reference frame number of each MB. It is done. The above information can be found in H.C. This information is necessary for encoding in the H.264 format and is embedded in the compressed encoded data (see the H.264 standard for further details).

さらに、画像情報管理手段112は、例えば、IDRピクチャやIピクチャと呼ばれるフレーム内予測符号化のみを用いたフレームの周期(MPEG2符号化方式では、Group Of Picture:GOP周期)分の各フレームの前述した統計情報を管理する。   Furthermore, the image information management unit 112, for example, the above-described frames for each frame period (Group Of Picture: GOP period in the MPEG2 encoding method) using only intra-frame predictive encoding called IDR picture or I picture. Manage statistical information.

また、動きベクトルに関しては、各フレームの動きベクトルの平均値(AVE_ME)、最大値(MAX_ME)を保持する。量子化係数に関しては、各フレームにおける量子化係数(Qstep)毎の利用されたMB数の分布を保持する。参照フレーム番号に関しては、現在符号化しているフレーム番号からの差分、すなわち、参照フレームと現在符号化しているフレームとの時間的距離を表すフレーム数(以下、参照フレームと符号化フレームの距離と呼ぶ)が保持される構成とする。   In addition, regarding the motion vector, the average value (AVE_ME) and the maximum value (MAX_ME) of the motion vectors of each frame are held. Regarding the quantization coefficient, the distribution of the number of MBs used for each quantization coefficient (Qstep) in each frame is held. Regarding the reference frame number, the difference from the currently encoded frame number, that is, the number of frames representing the temporal distance between the reference frame and the currently encoded frame (hereinafter referred to as the distance between the reference frame and the encoded frame). ) Is held.

さらに映像変化解析手段113は、同時に、最新フレームの情報、すなわち、現在符号化されているフレームの記録開始からのOffset値を管理する。   Furthermore, the video change analysis means 113 simultaneously manages the latest frame information, that is, the Offset value from the start of recording of the currently encoded frame.

映像変化解析手段113では、画像情報管理手段112によって取得された情報を用いて異常検知処理を行う。図3に異常検知処理の処理フローの一例を示す。   The video change analysis unit 113 performs an abnormality detection process using the information acquired by the image information management unit 112. FIG. 3 shows an example of the processing flow of the abnormality detection processing.

図3は、動きベクトルの大きさの最大値と、参照フレームと符号化フレームの距離と、量子化係数の分布変化から異常を検知する方式である。S001において、画像情報管理手段112によって管理されている動きベクトルの大きさの最大値(MAX_ME)が、閾値TH_ME以上であるかどうかを判断する。次にS002において、参照フレームと符号化フレームの距離(LEN_RF)が、閾値TH_RF未満であるかどうかを判断する。これは、H.264方式のLong Term参照ピクチャに対して効果的である。Long Term参照ピクチャとは、例えば、TV会議システムにおいて、会議室内の背景をLong Term参照メモリに保存して、Long Term参照ピクチャとして参照することにより符号化効率を改善する方法である。したがって、動きの少ない固定監視カメラシステムにおいて、Long Term参照ピクチャを用いることは有用であり、Long Term参照ピクチャを用いて符号化した場合、Long Term参照ピクチャ以外を参照することは、その映像において、動きが発生した場合(すなわち、監視用途としては異常状態)と考えられる。例えば、動きがまったく無い場合、理想的には撮影開始フレームをLong Term参照ピクチャとして保持しておけば、それ以降すべてのフレームの符号化データがLong Term参照ピクチャを参照することになる。したがって、撮影開始から1000フレーム後の符号化データの参照フレームと符号化フレームの距離は1000フレームとなる。しかし、動きがある場合には、参照フレームと符号化フレームの距離が1、2フレーム等の直近のフレームを参照することになる。すなわち、例えばTH_RF=3等に設定しておけば、LEN_RF<TH_RFとなり、動き(異常)を検知することができる。   FIG. 3 shows a method for detecting an abnormality from the maximum value of the motion vector, the distance between the reference frame and the encoded frame, and the distribution change of the quantization coefficient. In S001, it is determined whether or not the maximum value (MAX_ME) of the magnitude of the motion vector managed by the image information management unit 112 is greater than or equal to the threshold value TH_ME. Next, in S002, it is determined whether the distance (LEN_RF) between the reference frame and the encoded frame is less than the threshold value TH_RF. This is the This is effective for H.264 Long Term reference pictures. The Long Term reference picture is a method for improving the coding efficiency by storing the background in the conference room in a Long Term reference memory and referring to it as a Long Term reference picture, for example, in a TV conference system. Therefore, it is useful to use a Long Term reference picture in a fixed surveillance camera system with little motion, and when encoding using a Long Term reference picture, referencing other than the Long Term reference picture It is considered that a movement has occurred (that is, an abnormal state for monitoring purposes). For example, if there is no motion, ideally, if the shooting start frame is held as a Long Term reference picture, the encoded data of all frames thereafter will refer to the Long Term reference picture. Accordingly, the distance between the reference frame of the encoded data 1000 frames after the start of imaging and the encoded frame is 1000 frames. However, when there is a motion, the nearest frame such as one or two frames in which the distance between the reference frame and the encoded frame is referred to. That is, for example, if TH_RF = 3 or the like is set, LEN_RF <TH_RF and motion (abnormality) can be detected.

前述した異常検知処理では、撮影開始フレームからの距離がTH_RF未満のフレームに対してS002での判定が常にYesとなるため、正確に異常を検知することはできない。しかしながら、TH_RFが数〜十数フレームであれば、撮影開始フレームからの距離がTH_RF未満のフレームで異常を検知しない(無視する)ようにすれば、誤検知を防止しつつ通常の異常検知は十分可能なため、問題はない。   In the above-described abnormality detection process, the determination in S002 is always Yes for a frame whose distance from the shooting start frame is less than TH_RF, and thus an abnormality cannot be accurately detected. However, if TH_RF is several to several tens of frames, normal detection of abnormality is sufficient while preventing erroneous detection if the abnormality is not detected (ignored) in a frame whose distance from the shooting start frame is less than TH_RF. There is no problem because it is possible.

なお、H.264方式では、参照フレームはマクロブロック(MB)単位で変更することが可能なため、LEN_RFとしては、現在符号化しているフレームと各MBの参照フレームとの距離の最小値とする。また、Long Term参照ピクチャを用いない場合は、S002のステップを省いてもよい。   H. In the H.264 system, since the reference frame can be changed in units of macroblocks (MB), LEN_RF is the minimum distance between the currently encoded frame and the reference frame of each MB. Further, when the Long Term reference picture is not used, the step of S002 may be omitted.

S003において、量子化係数の変化の判断を行う。H.264方式では、量子化係数(Qstep)は、MB毎に変更することが可能であり、各量子化係数におけるMBの数の分布表を作成し、各量子化係数を持つMB数の差分の絶対値の総和を量子化係数の変化量(MV_QS)とする。n個のQstep(Q1〜Qn)にて量子化され、現在符号化しているフレームの量子化係数をQnとするMBの数をMV_Qn_F1、映像符号化部103への入力順で前のフレームの量子化係数をQnとするMBの数をMV_Qn_F2とすると、量子化係数の変化量(MV_QS)は次式で表される。   In S003, the change of the quantization coefficient is determined. H. In the H.264 system, the quantization coefficient (Qstep) can be changed for each MB, a distribution table of the number of MBs in each quantization coefficient is created, and the absolute difference in the number of MBs having each quantization coefficient is created. The sum of the values is defined as the quantization coefficient change amount (MV_QS). The number of MBs quantized by n Qsteps (Q1 to Qn) and having the quantization coefficient of the currently encoded frame as Qn is MV_Qn_F1, and the quantum of the previous frame in the order of input to the video encoding unit 103 Assuming that the number of MBs with the quantization coefficient Qn is MV_Qn_F2, the amount of change in the quantization coefficient (MV_QS) is expressed by the following equation.

MV_QS=|MV_Q1_F2−MV_Q1_F1|
+|MV_Q2_F2−MV_Q2_F1|
+・・・
+|MV_Qn_F2−MV_Qn_F1|
このMV_QSが、閾値TH_QS以上であるかどうかを判断する。これは、量子化係数は、毎フレームの変化がなければ一定の値、或いは一定の分布をしているのが通常であり、前フレームに比べて、値や分布に変化があるということは、現在符号化処理中のフレームの画像に大きく変化が発生したことを意味する。
MV_QS = | MV_Q1_F2-MV_Q1_F1 |
+ | MV_Q2_F2-MV_Q2_F1 |
+ ...
+ | MV_Qn_F2-MV_Qn_F1 |
It is determined whether this MV_QS is greater than or equal to a threshold value TH_QS. This is because the quantization coefficient usually has a constant value or a constant distribution if there is no change in each frame, and there is a change in the value and distribution compared to the previous frame. This means that a large change has occurred in the image of the frame currently being encoded.

以上のS001、S002、S003のすべての判断に当てはまる場合に、「異常あり」と判断し、その他の場合は、「異常なし」と判断する。「異常あり」と検出された場合には、S004にて、画像情報管理手段112によって管理されているクリップの記録開始時から現在符号化しているフレームまでのOffsetを取得し、S005にて、前記Offsetと異常の種別とを含む異常検出情報をメタデータ記録手段114に通知する。   When all of the above determinations of S001, S002, and S003 are applicable, it is determined that “abnormality is present”, and in other cases, it is determined that “abnormality is not present”. If “abnormal” is detected, an offset from the recording start time of the clip managed by the image information management unit 112 to the currently encoded frame is acquired in S004, and in S005 Abnormality detection information including Offset and abnormality type is notified to the metadata recording unit 114.

なお、本実施の形態では、TH_ME=10、TH_RF=3、TH_QS=200とする。これは、毎秒30フレームで撮影し、映像サイズが720×480である一般的な映像に対して、遠影撮影かつ動きが少ない監視カメラ用途を想定して、映像の1フレーム間の空間移動距離が0.1%程度(TH_ME、TH_QSの設定値に影響)、動きの継続する時間が1/10秒(TH_RFの設定値に影響)以上であれば「異常あり」と判断されるように意図したパラメータの組み合わせを意味している。   In this embodiment, TH_ME = 10, TH_RF = 3, and TH_QS = 200. This is a spatial movement distance between one frame of a video, assuming that the video is shot at 30 frames per second and the video size is 720 x 480 and is used for surveillance cameras with a long distance shooting and little motion. Is intended to be judged as “abnormal” if the movement continues for about 1/10 second (influences the set value of TH_RF) or more than about 0.1% (influences the set values of TH_ME and TH_QS) Means a combination of parameters.

また、これらのパラメータは監視カメラの設置場所や、目的、1秒あたりの撮影フレーム数にしたがって最適な閾値を選択すればよい。例えば、入出監視用の室内の固定監視カメラシステムの場合、風等の外部要因による動きはないと考えられ、動きベクトルは、単純に人や物体の移動のみが検知される。したがって、TH_ME、TH_QSの値は小さくして感度を上げてもよい。また、1秒あたりの撮影フレーム数が少ない場合は、フレーム間の差分が大きくなるため、TH_ME、TH_QSの値を大きく設定すればよい。   For these parameters, optimum threshold values may be selected according to the installation location of the surveillance camera, the purpose, and the number of frames taken per second. For example, in the case of a fixed surveillance camera system for entrance / exit monitoring, it is considered that there is no movement due to external factors such as wind, and the motion vector is simply detected as the movement of a person or an object. Therefore, the values of TH_ME and TH_QS may be reduced to increase sensitivity. Further, when the number of frames taken per second is small, the difference between the frames becomes large, so the values of TH_ME and TH_QS may be set large.

また、入力手段131にて、TH_ME、TH_QSの値を選択可能な構成とすれば、様々な用途に適用できるシステムが実現できる。例えば、通常屋外で記録するモードでは、TH_ME=10、TH_QS=200とし、屋内で記録するモードでは、TH_ME=5、TH_QS=100とし、これらのモードをユーザが選択できる構成とする。   Further, if the input unit 131 has a configuration in which the values of TH_ME and TH_QS can be selected, a system applicable to various uses can be realized. For example, in a normal outdoor recording mode, TH_ME = 10 and TH_QS = 200, and in an indoor recording mode, TH_ME = 5 and TH_QS = 100, and these modes can be selected by the user.

異常検知処理の別の一例の処理フローを図4に示す。図4において、S101では、表示順番で直前のフレームの動きベクトルの大きさの平均値(AVE_ME1)と、現在符号化しているフレームの動きベクトルの大きさの平均値(AVE_ME2)との差分を用いて異常を検出する。すなわち、下記の式で表されるAVE_ME_DIFFが、閾値TH_ME2以上であるかどうかにより異常の判断を行う。   FIG. 4 shows a process flow of another example of the abnormality detection process. In FIG. 4, in S101, the difference between the average value of the motion vectors of the immediately preceding frame (AVE_ME1) in the display order and the average value of the motion vectors of the currently encoded frame (AVE_ME2) is used. To detect abnormalities. That is, abnormality determination is performed based on whether or not AVE_ME_DIFF represented by the following formula is equal to or greater than a threshold value TH_ME2.

AVE_ME_DIFF=|AVE_ME1−AVE_ME2|
S102では、図3のS003と同様に、量子化係数の変化量(MV_QS)が、閾値TH_QS2以上であるかどうかにより判断される。以上のS101、S102のすべての判断に当てはまる場合に、「異常あり」と判断し、その他の場合は、「異常なし」と判断する。「異常あり」と検知された場合には、S103にて、画像情報管理手段112によって管理されているクリップの記録開始時から現在符号化しているフレームまでのOffsetを取得し、S104にて、前記Offsetと異常の種別とを含む異常検知情報をメタデータ記録手段114に通知する。
AVE_ME_DIFF = | AVE_ME1-AVE_ME2 |
In S102, as in S003 of FIG. 3, determination is made based on whether or not the change amount (MV_QS) of the quantization coefficient is equal to or greater than the threshold TH_QS2. If all of the above determinations in S101 and S102 apply, it is determined that “abnormality exists”, and in other cases, it is determined that “no abnormality”. If “abnormal” is detected, an offset from the recording start time of the clip managed by the image information management unit 112 to the currently encoded frame is acquired in S103, and in S104, the above-described offset is acquired. Abnormality detection information including Offset and abnormality type is notified to the metadata recording unit 114.

以上、異常検知方法について2つの例を提示したが、異常検知の判断は、用途に合わせて組み合わせを変更してもよい。   As mentioned above, although two examples were shown about the abnormality detection method, the judgment of abnormality detection may change a combination according to a use.

次に、メタデータ記録手段114において、メタデータとして異常検知情報を記録する方法について説明する。図5にクリップに対して付与されるメタデータである、クリップメタデータの内容を示す。Clip IDは、クリップ毎に機器が自動的に付与する固有のIDであり、Video File Nameは、映像を圧縮符号化したデータを記録するファイルのファイル名であり、Frame Rateは、撮影した映像の1秒あたりのフレーム数であり、Durationは、記録したクリップの長さをフレーム数で表す。NumWarningは、クリップ内で映像変化解析手段113にて検知された異常検知結果の検知数であり、以下で説明するWarningInfoの数を表す。WarningInfoは、図5(b)で定義される異常検知情報であり、Offsetは、異常を検出した際のクリップの先頭からのフレーム数で、WarningTypeは、異常検出の種別(例えば、WARNING:「異常あり」、INFOMATION:参考情報等)の情報を表す。WarningInfoは、NumWarningの値の数だけ記録される。   Next, a method for recording abnormality detection information as metadata in the metadata recording unit 114 will be described. FIG. 5 shows the contents of clip metadata, which is metadata assigned to a clip. Clip ID is a unique ID automatically assigned by each device for each clip. Video File Name is a file name of a file that records data obtained by compressing and encoding video. Frame Rate is a name of a captured video. The number of frames per second, and Duration represents the length of the recorded clip in terms of the number of frames. NumWarning is the number of detected abnormal detection results detected by the video change analysis means 113 in the clip, and represents the number of WarningInfo described below. “WarningInfo” is abnormality detection information defined in FIG. 5B, “Offset” is the number of frames from the top of the clip when the abnormality is detected, and “WarningType” is the type of abnormality detection (for example, “WARNING:“ abnormal ”). Present ", INFOMATION: reference information, etc.). WarningInfo is recorded by the number of values of NumWarning.

本実施の形態では、検索時の利便性向上のため、クリップメタデータは、映像を圧縮符号化したデータとは別のファイルとして、テキストファイル形式で記録されることとする。   In the present embodiment, in order to improve convenience during search, clip metadata is recorded in a text file format as a separate file from data obtained by compression-encoding video.

図6に記録開始から終了までのクリップメタデータファイルの内容変化の一例を示す。図6(a)はクリップの記録開始直後のクリップメタデータファイルの内容例を示す。この例では、Clip IDがC0001、Video File NameがC0001.mxf、Frame Rateが毎秒30フレームである。Clip ID、Video File Nameは、クリップの記録開始前に決定される。例えば、Clip IDは、先頭に“C“を付与した4桁のインクリメントカウンタ値とし、Video File Nameは、Clip IDに拡張子を付与した形式とする。ここでは、映像ファイルをSMPTE−377Mに準拠したMXFファイル形式として拡張子をmxfとしているが、それ以外のファイル形式でも構わない。また、Durationは、記録開始直後では確定されないので0としておく。さらに、NumWarningも「異常あり」の検知がされるまでは0としておき、クリップの記録終了後にNumWarningが0である場合は、そのクリップ内に異常は検知されなかったことを表す。   FIG. 6 shows an example of changes in the contents of the clip metadata file from the start to the end of recording. FIG. 6A shows an example of the contents of a clip metadata file immediately after the start of clip recording. In this example, Clip ID is C0001, and Video File Name is C0001. mxf and Frame Rate are 30 frames per second. Clip ID and Video File Name are determined before the start of clip recording. For example, Clip ID is a 4-digit increment counter value with “C” added at the beginning, and Video File Name is in a format with an extension added to Clip ID. Here, the video file is an MXF file format conforming to SMPTE-377M and the extension is mxf, but other file formats may be used. Also, Duration is set to 0 because it is not fixed immediately after the start of recording. Further, NumWarning is also set to 0 until “abnormal” is detected, and when NumWarning is 0 after recording of the clip, it indicates that no abnormality is detected in the clip.

次に、図6(b)は、そのクリップを記録中に初めて異常を検知した後のクリップメタデータファイルの内容を示している。図6(a)に対して、NumWarningを1とし、対応するWarningInfo(Offset:1234、WarningType:WARNING)を追加する。また、Durationの項目を、その時点のクリップ長(1234)に変更する。図6(c)は、クリップ記録終了後のクリップメタデータファイルの内容を示す。この例では、3つの異常が検知されていることを表す。   Next, FIG. 6B shows the contents of the clip metadata file after detecting an abnormality for the first time during the recording of the clip. 6A, NumWarning is set to 1, and corresponding WarningInfo (Offset: 1234, Warning Type: WARNING) is added. Also, the Duration item is changed to the clip length (1234) at that time. FIG. 6C shows the contents of the clip metadata file after clip recording is completed. In this example, three abnormalities are detected.

次に、記録後に異常を確認するために再生するときのメタデータ再生手段117の処理の詳細を説明する。記録後に異常検知情報を確認する場合は、前述した異常検知情報を示すメタデータを用いて容易に異常検索が可能になる。各クリップのクリップメタデータファイルを検索することで、異常の有無や数が分かり、そのOffsetを容易に取得できる。したがって、メタデータ再生手段117にて、図7のように異常の種別(WarningType)、クリップID(Clip ID)、異常発生位置(Offset)を含んだ異常検知リストを作成し、表示制御手段115によって表示制御を行って、表示装置132にて異常検知リストの表示を行う。その表示された異常検知リストに対して、例えば、入力手段131によりユーザが所望の異常検知位置の番号(NO.)を選択すると、映像ファイル再生手段116が、対象となる映像ファイルの該当Offsetから記録媒体に記録された圧縮符号化データの読み出しを行う。この読み出された圧縮符号化データは、映像復号化部106に提供され、復号処理が施されて、映像データとして映像出力部107に供給される。供給された映像データは、映像出力部107にて表示される。このようにして、異常が検知されたときの映像を容易に検索して再生することができる。   Next, the details of the processing of the metadata reproduction means 117 when reproducing in order to confirm an abnormality after recording will be described. When the abnormality detection information is confirmed after recording, the abnormality search can be easily performed using the metadata indicating the abnormality detection information described above. By searching the clip metadata file of each clip, the presence or absence and number of abnormalities can be known, and the offset can be easily acquired. Therefore, the metadata reproduction means 117 creates an abnormality detection list including an abnormality type (Warning Type), a clip ID (Clip ID), and an abnormality occurrence position (Offset) as shown in FIG. Display control is performed, and the abnormality detection list is displayed on the display device 132. For example, when the user selects a desired abnormality detection position number (NO.) For the displayed abnormality detection list by the input means 131, the video file reproduction means 116 starts from the corresponding Offset of the target video file. The compressed encoded data recorded on the recording medium is read out. The read compressed encoded data is provided to the video decoding unit 106, subjected to decoding processing, and supplied to the video output unit 107 as video data. The supplied video data is displayed on the video output unit 107. In this way, it is possible to easily search for and reproduce a video when an abnormality is detected.

なお、表示する異常検知リスト(図7)は、Offsetにてフレーム位置の特定を提示した例を示しているが、例えば、異常検知時の時刻や、サムネイル画を表示してもよい。異常時の時刻は、クリップの記録開始時刻とOffsetとから計算可能であり、サムネイル画は、異常検知時に符号化前の映像データから作成する方法、或いは、記録後に直近のIピクチャと呼ばれるフレーム内予測符号化のみを用いて符号化したフレームのDC成分を取得して作成する方法等がある。   In addition, although the abnormality detection list to be displayed (FIG. 7) shows an example in which the specification of the frame position is presented in Offset, for example, a time at the time of abnormality detection or a thumbnail image may be displayed. The time at the time of abnormality can be calculated from the recording start time of the clip and the offset, and the thumbnail image is created from video data before encoding at the time of abnormality detection, or within the frame called the latest I picture after recording There is a method of acquiring and creating a DC component of a frame encoded using only predictive encoding.

さらに、記録時には異常検知を行わずに、記録された圧縮符号化データを探索して異常検知を行う方法を説明する。記録媒体に記録された圧縮符号化データ内には、復号化の際に必要なため、動きベクトル、量子化係数、及び、参照フレーム番号等の情報が符号化された状態で埋め込まれている。この情報を復号時に抽出して同様の処理を施せば、記録後に異常を検知することが可能である。また、動きベクトル及び量子化係数は、符号化時と同一の符号化方式(例えば、H.264方式)に対応した復号装置であれば、復号時に必ず抽出しなければならないため、特別な装置が必要なく、復号時に抽出される情報を用いれば、図1と同じ構成で実現できる。すなわち、映像ファイル再生手段116により映像復号化部106に圧縮符号化データを供給し、映像復号化部106で抽出される動きベクトル、量子化係数等の情報を画像情報管理手段112にて取得、管理を行えば、その他のブロックは前述した本実施の形態の方法で実現可能である。   Furthermore, a description will be given of a method for detecting an abnormality by searching recorded compressed encoded data without detecting an abnormality during recording. In the compressed and encoded data recorded on the recording medium, information such as motion vectors, quantization coefficients, and reference frame numbers are embedded in an encoded state because they are necessary for decoding. If this information is extracted at the time of decoding and subjected to the same processing, it is possible to detect an abnormality after recording. In addition, since a motion vector and a quantization coefficient must be extracted at the time of decoding if the decoding device is compatible with the same encoding method (for example, H.264 method) as at the time of encoding, a special device is used. If information extracted at the time of decoding is not necessary, it can be realized with the same configuration as in FIG. That is, compressed video data is supplied to the video decoding unit 106 by the video file reproduction unit 116, and information such as motion vectors and quantization coefficients extracted by the video decoding unit 106 is acquired by the image information management unit 112. If management is performed, the other blocks can be realized by the method of this embodiment described above.

以上のように、本実施の形態の監視カメラシステムによれば、圧縮符号化処理とは別の処理手段を追加することなく、圧縮符号化時に用いる情報のみで、より安定した異常検知を行うことが可能であり、例えば、携帯型監視カメラシステムのような、低価格、省電力の監視カメラシステムを実現することができる。   As described above, according to the surveillance camera system of the present embodiment, more stable abnormality detection can be performed using only information used at the time of compression encoding without adding a processing unit different from the compression encoding processing. For example, a low-priced and power-saving surveillance camera system such as a portable surveillance camera system can be realized.

なお、本実施の形態では、メタデータは別ファイルとして記録する方法を説明したが、映像記録ファイルのヘッダ部分に埋め込んで記録しても同様の効果を発揮する。また、メタデータを記録する際に、テキスト形式にて記録する方法を説明したが、例えば、XML(eXtensible Markup Language)形式等のマークアップ言語等で記述する場合や、異常検知情報(WarningInfo)をリスト構造としても同様の効果を発揮する。   In the present embodiment, the method of recording metadata as a separate file has been described. However, the same effect can be achieved by embedding the metadata in the header portion of the video recording file. In addition, the method of recording in the text format when recording the metadata has been described. For example, when describing in a markup language such as an XML (extensible Markup Language) format, or when abnormality detection information (WarningInfo) is described. The same effect is exhibited as a list structure.

本発明にかかる映像処理装置は、動きの少ない映像から異常を検知し、確認時の検索性を向上させるもので、夜間監視カメラシステム、出入り口の監視カメラシステム、又は、映像編集装置等にも広く適用可能である。   The video processing apparatus according to the present invention detects an abnormality from a video with little movement and improves searchability at the time of confirmation, and is widely applied to a night surveillance camera system, an entrance / exit surveillance camera system, or a video editing apparatus. Applicable.

監視カメラシステムの構成を示す図Diagram showing the configuration of the surveillance camera system 映像符号化部の構成を示す図The figure which shows the structure of a video encoding part. 異常検知方法の第1の処理フロー例を示す図The figure which shows the 1st processing flow example of an abnormality detection method 異常検知方法の第2の処理フロー例を示す図The figure which shows the 2nd processing flow example of the abnormality detection method クリップメタデータファイルの内容を示す図Figure showing the contents of a clip metadata file クリップメタデータファイルの各ステップにおける内容例を示す図The figure which shows the example of the content in each step of a clip metadata file 異常検知の表示例を示す図Diagram showing an example of anomaly detection display

符号の説明Explanation of symbols

101 カメラ部
102 映像処理部
103 映像符号化部
104 映像符号化手段
105 動きベクトル検出手段
106 映像復号化部
107 映像出力部
110 システム制御部
111 映像ファイル記録手段
112 画像情報管理手段
113 映像変化解析手段
114 メタデータ記録手段
115 表示制御手段
116 映像ファイル再生手段
117 メタデータ再生手段
120 記録媒体
130 I/Oバス
131 入力手段
132 表示装置
201 DCT/量子化部
202 エントロピー符号化部
203 逆量子化/IDCT部
204 フィルタ部
205 フレームメモリ
206 フレーム内予測処理部
207 フレーム間予測処理部
208 動きベクトル検出部
210 フレーム内/フレーム間予測切替部
DESCRIPTION OF SYMBOLS 101 Camera part 102 Image | video processing part 103 Image | video encoding part 104 Image | video encoding means 105 Motion vector detection means 106 Image | video decoding part 107 Image | video output part 110 System control part 111 Image | video file recording means 112 Image | video information management means 113 Image | video change analysis means 114 Metadata recording unit 115 Display control unit 116 Video file reproduction unit 117 Metadata reproduction unit 120 Recording medium 130 I / O bus 131 Input unit 132 Display device 201 DCT / quantization unit 202 Entropy encoding unit 203 Inverse quantization / IDCT Unit 204 filter unit 205 frame memory 206 intra-frame prediction processing unit 207 inter-frame prediction processing unit 208 motion vector detection unit 210 intra-frame / inter-frame prediction switching unit

Claims (8)

入力される映像に対してフレーム間の相関情報を利用して圧縮符号化を行うと共に前記映像の変化を映像変化点として検知する映像処理装置であって、
前記映像のフレーム間の動きベクトルを検出する動きベクトル検出手段と、
量子化処理を含み、前記動きベクトルに基づいて前記映像をフレーム間の相関情報を利用して圧縮符号化する映像符号化手段と、
前記映像符号化手段で圧縮符号化する際の、少なくとも前記量子化処理における量子化係数に関する情報を含むパラメータを管理する画像情報管理手段と、
前記動きベクトルと前記画像情報管理手段で管理される前記パラメータとに基づいて前記映像変化点を検知する映像変化解析手段とを備えた映像処理装置。
A video processing device that performs compression coding using correlation information between frames for an input video and detects a change in the video as a video change point,
Motion vector detecting means for detecting a motion vector between frames of the video;
Video encoding means that includes quantization processing and compresses and encodes the video using correlation information between frames based on the motion vector;
Image information management means for managing parameters including information relating to at least the quantization coefficient in the quantization processing when the video encoding means performs compression encoding;
A video processing apparatus comprising: a video change analysis unit that detects the video change point based on the motion vector and the parameter managed by the image information management unit.
前記映像変化解析手段は、符号化対象フレームにおける前記動きベクトルの大きさの最大値及び符号化対象フレームにおける動きベクトルの大きさの平均値の、符号化対象フレームの直前のフレームにおける動きベクトルの大きさの平均値に対する変化量のうちいずれか一方と、符号化対象フレームにおける前記量子化係数の符号化対象フレームの直前のフレームにおける前記量子化係数に対する変化量とを、各々の事前に設定された閾値と比較し、比較結果に基づいて映像変化点を検知する請求項1記載の映像処理装置。 The video change analysis means calculates the magnitude of the motion vector in the frame immediately before the encoding target frame, of the maximum value of the size of the motion vector in the encoding target frame and the average value of the size of the motion vector in the encoding target frame. Any one of the change amounts with respect to the average value of the lengths and the change amount of the quantization coefficient in the encoding target frame with respect to the quantization coefficient in the frame immediately before the encoding target frame are set in advance. The video processing apparatus according to claim 1, wherein the video change point is detected based on a comparison result by comparing with a threshold value. 前記映像変化解析手段はさらに、符号化対象フレームから、符号化対象フレームが符号化時に参照するフレームまでの時間的距離情報に基づいて映像変化点を検知する請求項2記載の映像処理装置。 The video processing apparatus according to claim 2, wherein the video change analysis unit further detects a video change point based on temporal distance information from an encoding target frame to a frame referenced by the encoding target frame during encoding. さらに、圧縮符号化されたデータをファイルとして記録媒体に記録する映像ファイル記録手段と、
前記映像に関する情報であるメタデータを前記ファイルに付加して前記記録媒体に記録するメタデータ記録手段とを備え、
前記メタデータ記録手段は、少なくとも前記映像変化点の時刻をメタデータとして記録媒体に記録する請求項1乃至3のいずれか1項に記載の映像処理装置。
Furthermore, video file recording means for recording the compression encoded data as a file on a recording medium;
Metadata recording means for adding metadata that is information about the video to the file and recording it on the recording medium;
The video processing apparatus according to claim 1, wherein the metadata recording unit records at least a time of the video change point as metadata on a recording medium.
前記メタデータ記録手段は、前記映像変化点におけるフレームのサムネイル画を作成し、メタデータとして記録する請求項4記載の映像記録装置。 5. The video recording apparatus according to claim 4, wherein the metadata recording means creates a thumbnail image of a frame at the video change point and records it as metadata. 映像がフレーム間の相関情報を利用して圧縮符号化された圧縮符号化データの復号化を行うと共に映像の変化を映像変化点として検知する映像処理装置であって、
前記圧縮符号化データの復号時に前記圧縮符号化データから動きベクトル及び量子化係数に関する情報を抽出する映像復号化手段と、
前記映像復号化手段が前記圧縮符号化データから抽出した前記動きベクトル及び前記量子化係数に基づいて前記映像変化点を検知する映像変化解析手段とを備えた映像処理装置。
A video processing device that decodes compression-encoded data obtained by compressing and encoding video using correlation information between frames and detects a change in the video as a video change point,
Video decoding means for extracting information on a motion vector and a quantization coefficient from the compressed encoded data at the time of decoding the compressed encoded data;
A video processing apparatus comprising: video change analysis means for detecting the video change point based on the motion vector and the quantization coefficient extracted from the compressed encoded data by the video decoding means.
前記映像復号化手段は、前記圧縮符号化データの復号時にさらに符号化対象フレームから符号化対象フレームが符号化時に参照するフレームまでの時間的距離情報を抽出し、
前記映像変化解析手段は、さらに前記時間的距離情報に基づいて前記映像変化点を検知する請求項6記載の映像処理装置。
The video decoding means further extracts temporal distance information from a frame to be encoded to a frame to which the frame to be encoded is referred when encoding the compressed encoded data,
The video processing apparatus according to claim 6, wherein the video change analysis unit further detects the video change point based on the temporal distance information.
カメラ部から入力される映像に対してフレーム間の相関情報を利用して圧縮符号化を行うと共に前記映像の変化を映像変化点として検知する監視カメラシステムであって、
前記映像のフレーム間の動きベクトルを検出する動きベクトル検出手段と、
前記動きベクトルに基づいて前記映像をフレーム間の相関情報を利用して圧縮符号化する映像符号化手段と、
前記映像符号化手段で圧縮符号化する際の、少なくとも量子化係数に関する情報を含むパラメータを管理する画像情報管理手段と、
前記動きベクトルと前記画像情報管理手段で管理される前記パラメータとに基づいて前記映像変化点を検知する映像変化解析手段とを備えた監視カメラシステム。
A surveillance camera system that performs compression encoding on a video input from a camera unit using correlation information between frames and detects a change in the video as a video change point,
Motion vector detecting means for detecting a motion vector between frames of the video;
Video encoding means for compressing and encoding the video using correlation information between frames based on the motion vector;
Image information management means for managing parameters including information on at least quantization coefficients when compression-encoded by the video encoding means;
A surveillance camera system comprising: a video change analysis unit that detects the video change point based on the motion vector and the parameter managed by the image information management unit.
JP2005377929A 2005-12-28 2005-12-28 Video processor and monitoring camera system Pending JP2007180970A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005377929A JP2007180970A (en) 2005-12-28 2005-12-28 Video processor and monitoring camera system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005377929A JP2007180970A (en) 2005-12-28 2005-12-28 Video processor and monitoring camera system

Publications (1)

Publication Number Publication Date
JP2007180970A true JP2007180970A (en) 2007-07-12

Family

ID=38305666

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005377929A Pending JP2007180970A (en) 2005-12-28 2005-12-28 Video processor and monitoring camera system

Country Status (1)

Country Link
JP (1) JP2007180970A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012244574A (en) * 2011-05-24 2012-12-10 Mitsubishi Electric Corp Video monitoring device
JP2016504829A (en) * 2012-12-17 2016-02-12 インテル・コーポレーション Utilize encoder hardware to pre-process video content
KR20160131882A (en) * 2015-05-06 2016-11-16 삼성전자주식회사 Electronic apparatus and operating method thereof
CN114245070A (en) * 2021-11-30 2022-03-25 慧之安信息技术股份有限公司 Method and system for centralized viewing of regional monitoring content

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012244574A (en) * 2011-05-24 2012-12-10 Mitsubishi Electric Corp Video monitoring device
JP2016504829A (en) * 2012-12-17 2016-02-12 インテル・コーポレーション Utilize encoder hardware to pre-process video content
KR20160131882A (en) * 2015-05-06 2016-11-16 삼성전자주식회사 Electronic apparatus and operating method thereof
KR102638468B1 (en) 2015-05-06 2024-02-21 삼성전자주식회사 Electronic apparatus and operating method thereof
CN114245070A (en) * 2021-11-30 2022-03-25 慧之安信息技术股份有限公司 Method and system for centralized viewing of regional monitoring content

Similar Documents

Publication Publication Date Title
US11070833B2 (en) Method and system for encoding video with overlay
US7082210B2 (en) Moving object detector and image monitoring system
US6928234B2 (en) Picture recording apparatus and method thereof
US8218949B2 (en) Video information recording device, video information recording method, and recording medium containing the video information recording program
US20090052537A1 (en) Method and device for processing coded video data
US6842540B1 (en) Surveillance system
JPH09261648A (en) Scene change detector
JPH11112973A (en) Device and method for converting video signal
WO2003052951A1 (en) Method and apparatus for motion detection from compressed video sequence
JPH06181569A (en) Method and device for encoding and decoding picture and picture recording medium
US8139877B2 (en) Image processing apparatus, image processing method, and computer-readable recording medium including shot generation
JP2003274410A (en) Encoder and decoder, and encoding method for monitored video image
US20090257736A1 (en) Information processing apparatus and information processing method
US20070258009A1 (en) Image Processing Device, Image Processing Method, and Image Processing Program
KR20070007330A (en) Monochrome frame detection method and corresponding device
JP2006311079A (en) Image bit stream conversion apparatus
JP2007180970A (en) Video processor and monitoring camera system
KR101606931B1 (en) Apparatus for recording/playing key frame still image and method for orerating the same
JPH10285542A (en) Image recorder and image recording method
JPH11308617A (en) Digital image coder and motion vector detector used therefor
WO2021149892A1 (en) Apparatus and method for recording video data
JP2002064823A (en) Apparatus and method for detecting scene change of compressed dynamic image as well as recording medium recording its program
JP2007142809A (en) Video recording apparatus
JP2001069510A (en) Video motor
JP2007518303A (en) Processing method and apparatus using scene change detection