JP2011234033A - Monitoring camera and monitor system - Google Patents
Monitoring camera and monitor system Download PDFInfo
- Publication number
- JP2011234033A JP2011234033A JP2010101219A JP2010101219A JP2011234033A JP 2011234033 A JP2011234033 A JP 2011234033A JP 2010101219 A JP2010101219 A JP 2010101219A JP 2010101219 A JP2010101219 A JP 2010101219A JP 2011234033 A JP2011234033 A JP 2011234033A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- video
- feature
- monitoring
- surveillance camera
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/98—Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
- G06V40/165—Detection; Localisation; Normalisation using facial parts and geometric relationships
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/107—Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/154—Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/164—Feedback from the receiver or from the transmission channel
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/167—Position within a video image, e.g. region of interest [ROI]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/61—Control of cameras or camera modules based on recognised objects
- H04N23/611—Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
-
- G—PHYSICS
- G08—SIGNALLING
- G08B—SIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
- G08B13/00—Burglar, theft or intruder alarms
- G08B13/18—Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength
- G08B13/189—Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems
- G08B13/194—Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems using image scanning and comparing systems
- G08B13/196—Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems using image scanning and comparing systems using television cameras
- G08B13/19665—Details related to the storage of video surveillance data
- G08B13/19667—Details realated to data compression, encryption or encoding, e.g. resolution modes for reducing data volume to lower transmission bandwidth or memory requirements
Abstract
Description
本発明は、監視カメラおよび監視カメラと端末をネットワーク等で結んだ監視システムに関するものであり、特に人物認識技術等を使って監視の自動化を行う監視システムに関する。 The present invention relates to a surveillance camera and a surveillance system in which a surveillance camera and a terminal are connected via a network or the like, and more particularly to a surveillance system that performs surveillance automation using a person recognition technology or the like.
近年、監視カメラの映像をIPネットワーク等で伝送し、それを監視端末で受信して広域を効率的に監視する監視システムが発展してきている。図6は従来の監視システムの構成を示している。監視システムは監視カメラ100と監視端末200から構成される。監視カメラ100は、レンズ101、イメージセンサ102、およびカメラ信号処理103からなる撮像部104と、映像符号化部105、映像送信部106から構成される。監視端末200は、映像受信部201、映像記録部202、映像復号化部203、および映像表示部612から構成される。
2. Description of the Related Art In recent years, surveillance systems have been developed that efficiently transmit video from surveillance cameras over an IP network or the like and receive them with a surveillance terminal to efficiently monitor a wide area. FIG. 6 shows the configuration of a conventional monitoring system. The monitoring system includes a
レンズ101は監視対象の光学像をイメージセンサ102に結像させる。イメージセンサ102は光学像を電気信号に変換する。カメラ信号処理部103はイメージセンサ102の信号を輝度と色のデジタルデータに変換する。映像符号化部105は映像を圧縮符号化する。ネットワークの帯域は限られており、圧縮率を高めるために非可逆圧縮が採用される。映像送信部106は監視端末200に符号化された映像を送信する。例えばIPネットワークで送信する場合には、映像送信部106はIPヘッダ処理や再送・輻輳制御等の送信制御を行う。
The
監視端末200では、映像受信部201が監視カメラ100からの符号化された映像を受信する。映像記録部202は受信された映像を記録する。映像復号化部203は符号化された映像を復号し映像データを再現する。ただし、監視カメラ100から送信される映像は非可逆圧縮されているので、監視端末200側では監視カメラ100で取得した映像と完全に同じ映像にはならず必ず劣化が発生する。映像表示部204は監視カメラ100の映像を表示する。
In the
映像監視において重要な要件は、民生用カメラで重要な美しさ等ではなく、重要な情報が欠落していないことである。例えば不審人物を特定するためには人物顔が非常に重要となる。またネットワークの帯域は通常限られており、また記録も常時記録となるため可能な限り高い圧縮率の映像圧縮が求められている。そこで、監視カメラ100に映像の中から人物画像の領域を関心領域として検出する関心領域検出部107を設け、映像符号化部105は関心領域の圧縮率を他の領域よりも相対的に下げることで、高画質化を図りつつ重要情報の欠落を防いでいる(例えば、特許文献1参照)。
An important requirement in video surveillance is that important information is not missing, not important beauty in consumer cameras. For example, a person's face is very important for identifying a suspicious person. In addition, the network bandwidth is usually limited, and since recording is always performed, video compression with the highest possible compression rate is required. Therefore, the
上記従来技術によると、関心領域の画質は、他の領域との相対的な関係において向上させることができるが、どの程度向上すべきかといった絶対的な尺度を以て制御することは困難である。そのため、ネットワーク帯域がより厳しくなり関心領域の画質さえある程度低下させざる得ない場合、どの程度まで低下させてもよいか判断できないおそれがある。また、それゆえ、十分な性能を確保した上でネットワーク帯域や映像記録部の容量を低減することによるコストパフォーマンスの向上を論理的かつ定量的に実施することが困難である。 According to the prior art, the image quality of the region of interest can be improved in a relative relationship with other regions, but it is difficult to control with an absolute measure of how much to improve. Therefore, when the network bandwidth becomes more severe and even the image quality of the region of interest has to be reduced to some extent, it may not be possible to determine how much it should be reduced. Therefore, it is difficult to logically and quantitatively improve cost performance by reducing the network bandwidth and the capacity of the video recording unit while ensuring sufficient performance.
かかる問題に鑑み、本発明は、監視システムにおいて監視対象の認識性能を十分に確保しつつ映像全体の圧縮率を高めることを課題とする。 In view of such a problem, an object of the present invention is to increase the compression ratio of the entire video while sufficiently ensuring the recognition performance of the monitoring target in the monitoring system.
上記課題を解決するために本発明によって次のような手段を講じた。すなわち、監視カメラは、監視対象を撮像する撮像部と、前記撮像部から出力された映像を非可逆圧縮によって符号化する映像符号化部と、前記映像符号化部によって符号化された映像を復号する映像復号化部と、前記撮像部から出力された第1の映像および前記映像復号化部から出力された第2の映像を受け、それぞれの映像における特徴量を抽出する特徴量抽出部と、前記第1の映像から抽出された特徴量と前記第2の映像から抽出された特徴量との変化分を検出する特徴変化検出部と、前記検出された特徴量の変化分に基づいて前記映像符号化部の制御パラメータを変更する符号化制御部とを備えているものとする。また、監視システムは、前記監視カメラと、前記監視カメラと通信回線を通じて接続される監視端末とを備えているものとする。 In order to solve the above problems, the present invention has taken the following measures. That is, the monitoring camera decodes the video encoded by the video encoding unit, the video encoding unit that encodes the video output from the imaging unit by irreversible compression, and the video encoding unit. A video decoding unit that receives the first video output from the imaging unit and the second video output from the video decoding unit, and extracts a feature amount in each video; A feature change detecting unit for detecting a change between the feature quantity extracted from the first video and the feature quantity extracted from the second video; and the video based on the detected change in the feature quantity. An encoding control unit that changes the control parameter of the encoding unit is provided. The surveillance system includes the surveillance camera and a surveillance terminal connected to the surveillance camera through a communication line.
これによると、映像監視の最終的な目的である映像の識別・認識に必要な特徴量の変化、すなわち劣化度合いに基づいて映像符号化に係る制御パラメータが変更される。したがって、映像全体を絶対的な尺度を以て適切に圧縮符号化することができる。 According to this, a control parameter related to video coding is changed based on a change in feature amount necessary for video identification / recognition, which is the final purpose of video monitoring, that is, a degree of deterioration. Therefore, the entire video can be appropriately compressed and encoded with an absolute scale.
好ましくは、前記監視端末は、前記監視カメラから受信した映像から前記監視対象を認識する監視対象認識部と、前記監視カメラから受信した映像の認識難度を評価する認識難度評価部とを有し、前記認識難度を前記監視カメラに送信するものであり、前記監視カメラにおける前記符号化制御部は、前記監視カメラから送信された認識難度を加味して前記映像符号化部の制御パラメータを変更する。これによると、監視端末からフィードバックされた監視対象の認識難度に基づいて映像符号化に係る制御パラメータが適応的に変更される。 Preferably, the monitoring terminal includes a monitoring target recognition unit that recognizes the monitoring target from a video received from the monitoring camera, and a recognition difficulty level evaluation unit that evaluates a recognition difficulty level of the video received from the monitoring camera, The recognition difficulty level is transmitted to the monitoring camera, and the encoding control unit in the monitoring camera changes the control parameter of the video encoding unit in consideration of the recognition difficulty level transmitted from the monitoring camera. According to this, the control parameter relating to video encoding is adaptively changed based on the recognition difficulty level of the monitoring target fed back from the monitoring terminal.
また、好ましくは、前記特徴量抽出部は、抽出した特徴量を特徴ベクトルとして出力するものであり、前記特徴変化検出部は、前記第1の映像に係る特徴ベクトルと前記第2の映像に係る特徴ベクトルとの差ベクトルを算出し、当該差ベクトルの各要素に重み付けをしたものを特徴差分ベクトルとして出力する。このように差ベクトルの各要素に重み付けをすることで認識性能を正確に反映する特徴量の変化を検出することができる。 Preferably, the feature quantity extraction unit outputs the extracted feature quantity as a feature vector, and the feature change detection unit relates to the feature vector related to the first video and the second video. A difference vector from the feature vector is calculated, and each element of the difference vector is weighted and output as a feature difference vector. Thus, by weighting each element of the difference vector, it is possible to detect a change in the feature amount that accurately reflects the recognition performance.
より好ましくは、前記監視端末は、前記監視カメラから受信した映像から前記監視対象を認識する監視対象認識部を有し、当該認識に係るアルゴリズムを前記監視カメラに送信するものであり、前記監視カメラにおける前記特徴変化検出部は、前記監視カメラから送信された認識アルゴリズムを加味して前記特徴差分ベクトルの各要素に重み付けをする。これによると、監視端末からフィードバックされた認識アルゴリズムに基づいて監視カメラにおける特徴量の重み付けが適応的に制御される。 More preferably, the monitoring terminal includes a monitoring target recognition unit that recognizes the monitoring target from video received from the monitoring camera, and transmits an algorithm related to the recognition to the monitoring camera. The feature change detecting unit weights each element of the feature difference vector in consideration of the recognition algorithm transmitted from the surveillance camera. According to this, the feature weighting in the monitoring camera is adaptively controlled based on the recognition algorithm fed back from the monitoring terminal.
本発明によると、監視システムにおいて監視対象の認識性能を十分に確保しつつ映像全体の圧縮率を高めることができる。これにより、ネットワーク帯域や映像記録部の効率的利用による監視システム全体のコストパフォーマンスを高めることが可能となる。 According to the present invention, it is possible to increase the compression rate of the entire video while sufficiently ensuring the recognition performance of the monitoring target in the monitoring system. This makes it possible to improve the cost performance of the entire monitoring system by efficiently using the network bandwidth and the video recording unit.
図1は本発明の一実施形態に係る監視システムの構成を示している。本実施形態に係る監視システムは監視カメラ1と監視端末2で構成される。監視カメラ1は、レンズ111、イメージセンサ112、カメラ信号処理部113からなる撮像部11と、映像符号化部12、映像復号化部13、特徴量抽出部14、特徴変化検出部15、符号化制御部16、映像送信部17、認識難度受信部18、および認識アルゴリズム受信部19を備えている。監視端末2は、映像受信部21、映像記録部22、映像復号化部23、映像表示部24、監視対象認識部25、認識難度評価部26、認識難度送信部27、および認識アルゴリズム送信部28を備えている。
FIG. 1 shows a configuration of a monitoring system according to an embodiment of the present invention. The monitoring system according to this embodiment includes a monitoring camera 1 and a
レンズ111は監視対象の光学像をイメージセンサ112に結像させる。イメージセンサ112は光学像を電気信号に変換する。カメラ信号処理部113はイメージセンサ112の信号を輝度と色のデジタルデータに変換する。映像符号化部12は映像を圧縮符号化する。映像復号化部13は符号化された映像を復号する。特徴量抽出部14は監視端末2で実施される認識処理に必要な監視対象の特徴を映像から抽出する。特徴変化検出部15は撮像部11から出力された映像の特徴量と映像復号化部13から出力された映像の特徴量との変化分を検出する。すなわち、特徴変化検出部15は符号化前後の特徴量の変化を検出する。符号化制御部16は、特徴変化検出部15の検出結果に基づき映像符号化部12の制御パラメータを変更する。映像送信部17は映像符号化部12で符号化された映像を監視端末2へ送信する。
The
なお、H.264やMPEG等の動画圧縮方式では既に復号された画像を参照してフレーム間予測符号化を行うため、実際には映像符号化部12と映像復号化部13は一体であるが、ここでは説明の便宜上、映像符号化部12と映像復号化部13を区別して表示している。したがって、映像符号化部12と映像復号化部13とが個別に存在しても特に追加コストとなるわけではない。
H. In the video compression system such as H.264 and MPEG, since the inter-frame prediction encoding is performed with reference to the already decoded image, the
映像受信部21は監視カメラ1からの符号化された映像を受信する。映像記録部22は受信された映像を記録する。映像復号化部23は受信された映像もしくは映像記録部22に記録された映像を復号する。映像表示部24は復号された映像を表示する。監視対象認識部25は映像から監視対象の認識、例えば人の個人認識を行う。認識難度評価部26は監視対象認識部25における認識処理の困難度合いを評価する。認識難度送信部27は認識難度評価部26から出力された認識難度を監視カメラ1に送信する。認識アルゴリズム送信部28は監視端末2で行う認識処理のアルゴリズムを監視カメラ1に送信する。
The
認識難度受信部18は認識難度を受信する。符号化制御部16は認識難度を受け、認識難度が高い場合には特徴変化検出部15で検出される特徴量変化がより少なくなるように映像符号化部12を制御する。認識アルゴリズム受信部19は認識アルゴリズムを受信する。特徴変化検出部15は認識アルゴリズムを受け、その認識アルゴリズムに合わせて特徴量変化の検出に係るパラメータを変更する。
The recognition difficulty
次に監視カメラ1の各部について詳細に説明する。図2は特徴量抽出部14の構成を示している。特徴量抽出部14は、セレクタ141、顔検出部142、顔特徴抽出部143から構成されている。顔検出部143は、複数の特定顔向き検出部144と結合器145で構成されている。特定顔向き検出部144は複数の弱識別器146で構成されている。顔特徴抽出部143は、顔部品位置検出部147と顔部品形状検出部148から構成されている。顔部品形状検出部148は複数のガボールフィルタ149から構成されている。
Next, each part of the surveillance camera 1 will be described in detail. FIG. 2 shows the configuration of the feature
セレクタ141は撮像部11および映像復号化部13からの映像のいずれか一方を選択する。顔検出部142は選択された映像の中から人物顔を検出する。顔検出部142において、映像の濃淡パタンに基づき顔らしさを識別する弱識別器146がカスケードに組み合わされた、いわゆるブースティング学習器が構成されている。また、顔検出部142において、特定の顔向きを区別するためと向き毎の最適化のために特定の顔向き毎に個別の学習を行った特定顔向き検出部144が構成されている。
The
各特定顔向き検出部144による顔らしさ判定は結合器145で結合され、最終的に人物顔かどうかの判定が行われる。顔検出部142で人物顔と判定された領域では顔特徴抽出部143により人物顔の特徴が抽出される。まず顔部品位置検出部147で人物顔を特徴付ける重要な顔部品である眼、鼻、口等の位置が検出される。ここでは顔検出部142と同様の濃淡パタンから識別を行う弱識別器146を顔部品に特化して学習させたものを使用して、各顔部品位置を探索する。顔部品位置検出部147で検出された顔部品は顔部品形状検出部148でその形状情報が抽出される。顔部品形状検出部148は顔部品の形状情報となる傾きを含めたエッジ情報を検出するための複数のガボールフィルタ149を備えている。顔部品位置情報および顔部品形状情報は後段の特徴変化検出部15に送られる。
The face-likeness determination by each specific face
図3は特徴変化検出部15の構成を示している。特徴量は複数あるため、これらを特徴ベクトル151として一括りにする。特徴変化検出部15は、特徴ベクトルメモリ152、特徴差分ベクトル演算部153、特徴差分ベクトル空間変換部154、特徴差分ベクトル空間決定部155から構成される。特徴ベクトルメモリ152は撮像部11から出力された映像に係る特徴ベクトルを記憶するメモリ152aと映像復号化部13から出力された映像に係る特徴ベクトルを記憶するメモリ152bを備えている。特徴差分ベクトル演算部153は撮像部11から出力された映像に係る特徴ベクトルと映像復号化部13から出力された映像に係る特徴ベクトルとの誤差である特徴差分ベクトルを算出する。特徴差分ベクトル空間変換部154は特徴差分ベクトルの空間、すなわち個々の特徴量の差分値を所定のルールで変換する。これは特徴量毎に異なる重み付けをしていることになる。監視端末2で実施する認識アルゴリズムにより、特徴量の重み付けが異なるためである。この処理を正確に行うため、特徴差分ベクトル空間決定部155は認識アルゴリズム受信部19から受けた認識アルゴリズムに基づき変換ルールを決定する。
FIG. 3 shows the configuration of the
図4は符号化制御部16の構成を示している。符号化制御部16は、特徴差分ベクトル大きさ評価値演算部161、特徴差分ベクトル閾値比較部162、特徴差分ベクトル閾値決定部163、量子化パラメータ制御部164、顔部品位置差評価値演算部165、予測モード制御部166から構成される。
FIG. 4 shows the configuration of the
特徴差分ベクトル大きさ評価値演算部161は特徴変化検出部15から出力された特徴差分ベクトルの大きさを示す総合的な指標を計算する。例えばベクトルの絶対値である。これにより特徴量の差異は一つの評価値に集約される。特徴差分ベクトル閾値比較部162は監視端末2における所望の認識性能を確保するためにあるべき特徴差分ベクトルの閾値と評価指標との比較を行う。特徴差分ベクトル閾値決定部163は特徴差分ベクトルの閾値の決定を行う。
The feature difference vector magnitude evaluation
所望の認識性能の確保をより正確に行うため、特徴差分ベクトルの閾値は認識難度受信部18から送られる認識難度に基づき更新される。例えば認識難度が高い場合は閾値を下げる処理を行う。量子化パラメータ制御部164は特徴差分ベクトル閾値比較部162の出力に基づき映像符号化部12の量子化パラメータを制御する。量子化を粗くすると量子化に起因するノイズが増え特徴差分ベクトルが増大する。閾値を超えた場合、所望の認識性能が確保できないため、量子化を細かくする方向に制御を行う。
In order to ensure the desired recognition performance more accurately, the threshold value of the feature difference vector is updated based on the recognition difficulty level sent from the recognition difficulty
量子化ノイズを低減しても特徴差分ベクトルが閾値内に収まらない場合もあり、それはフレーム間予測の誤差に起因する顔部品位置のズレが主要な原因となる。これに対処するため、顔部品位置差評価値演算部165は顔部品位置の誤差を評価し予測モード制御部166にその情報を送る。予測モード制御部166は顔部品位置差評価値演算部165からの顔部品位置誤差情報に基づき誤差が大きい場合はフレーム間予測を禁止するなどの処置を行う。なお、量子化を細かくすることやフレーム間予測の禁止は顔領域の符号量増大をもたらすが、顔以外の領域の符号量を低減することで補う。
Even if the quantization noise is reduced, the feature difference vector may not be within the threshold value, which is mainly caused by a shift of the face part position due to an error in inter-frame prediction. In order to cope with this, the facial part position difference evaluation
なお、映像符号化部16はH.264等のMPEG系動画符号化方式を採用しており、既存技術であるため簡単な解説にとどめる。MPEG系動画符号化方式は、フレーム間予測符号化とフレーム内符号化の組み合わせであり、フレーム内符号化では直交変換で周波数成分に変換した後、視覚特性上目立たない部分を量子化する。このため元の情報は再現できず非可逆圧縮となる。その後エントロピー符号化によりさらに圧縮を行うが、この部分は可逆圧縮である。フレーム間予測符号化のためには予測の元となる参照画像が必要なので、局所復号化によりそれを得る。エントロピー符号化は可逆圧縮なのでその前の量子化までされたデータを逆量子化、逆直交変換、フレーム間復号化と逆の手順で復号を実施し参照画像を得る。逆量子化、逆直交変換、フレーム間復号化はMPEG系動画符号化方式では映像符号化部12に含まれるが、説明の便宜上、映像復号化部13を敢えて個別に表示している。
Note that the
次に監視端末2の主要部の詳細説明を行う。図5は監視端末2の主要部の構成を示している。監視対象認識部25は、顔検出部251、顔特徴抽出部252、特徴空間変換部253、個人差情報抽出部254、個人特徴情報データベース255、および個人識別部256から構成される。認識難度評価部26は、外乱ノイズ抽出部261および個人差情報対外乱ノイズ比較評価部262から構成される。顔検出部251および顔特徴抽出部252はそれぞれ基本的には監視カメラ1の特徴抽出部14における顔検出部142および顔特徴抽出部143と同じものである(図2参照)。特徴空間変換部253は、次段の個人差情報抽出部254での個人差情報の抽出を容易にするために、外乱ノイズの影響を受けやすい特徴量の重みを下げ、個人差をより的確に反映する特徴量の重みを増大させるように特徴空間の変換を行う。この情報が認識アルゴリズム送信部28より監視カメラ1に送信され、特徴差分ベクトル空間の変換、すなわち特徴量差の重み付けに用いられる。
Next, detailed description of the main part of the
個人差情報抽出部254は個人差を的確に反映する評価量を特徴量から生成する。個人特徴情報データベース255は個人の顔の特徴量を記憶しているデータベースである。個人識別部256は個人特徴情報データベース255内の特定の個人の特徴量と個人差情報抽出部254より抽出された映像中の顔の特徴を比較し、映像中の顔が特定の個人の顔かどうかを識別する。
The individual difference
認識難度評価部26における外乱ノイズ抽出部261は特徴量の中から照明等の外乱の影響を受けやすい特徴量を抽出する。個人差情報対外乱ノイズ比較評価部262は個人差を的確に反映する評価量と外乱の影響を受けやすい特徴量との大きさを比較し、認識の難度を反映した評価量を生成する。認識の難度を反映した評価量は認識難度送信部27を通じて監視カメラ1に送信され、符号化制御部16での符号化制御をより適切に行うために使用される。
A disturbance
なお、本発明は本実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲で様々な実施形態を取り得る。例えば、本実施形態では人物顔の認識を目的にしているが、顔以外の認識技術に対しても同様の考え方の適用で認識性能とネットワーク帯域効率化との両立を実現することができる。 In addition, this invention is not limited to this embodiment, Various embodiment can be taken in the range which does not deviate from the summary of this invention. For example, although the present embodiment aims to recognize a human face, it is possible to realize both recognition performance and network bandwidth efficiency by applying the same concept to recognition techniques other than faces.
本発明に係る監視システムは、監視対象の認識性能を十分に確保しつつ映像全体の圧縮率を高めることができるため、ネットワーク帯域や映像記録部の効率的利用が要求される監視システムとして有用である。 The monitoring system according to the present invention is useful as a monitoring system that requires efficient use of the network bandwidth and the video recording unit because it can increase the compression rate of the entire video while sufficiently ensuring the recognition performance of the monitoring target. is there.
1 監視カメラ
11 撮像部
12 映像符号化部
13 映像復号化部
14 特徴量抽出部
142 顔検出部
143 顔特徴抽出部
15 特徴変化検出部
16 符号化制御部
2 監視端末
25 監視対象認識部
26 認識難度評価部
DESCRIPTION OF SYMBOLS 1
Claims (9)
前記撮像部から出力された映像を非可逆圧縮によって符号化する映像符号化部と、
前記映像符号化部によって符号化された映像を復号する映像復号化部と、
前記撮像部から出力された第1の映像および前記映像復号化部から出力された第2の映像を受け、それぞれの映像における特徴量を抽出する特徴量抽出部と、
前記第1の映像から抽出された特徴量と前記第2の映像から抽出された特徴量との変化分を検出する特徴変化検出部と、
前記検出された特徴量の変化分に基づいて前記映像符号化部の制御パラメータを変更する符号化制御部とを備えている
ことを特徴とする監視カメラ。 An imaging unit for imaging a monitoring target;
A video encoding unit that encodes the video output from the imaging unit by lossy compression;
A video decoding unit for decoding the video encoded by the video encoding unit;
A feature amount extraction unit that receives the first video output from the imaging unit and the second video output from the video decoding unit, and extracts a feature amount in each video;
A feature change detection unit that detects a change amount between the feature amount extracted from the first video and the feature amount extracted from the second video;
A surveillance camera comprising: an encoding control unit that changes a control parameter of the video encoding unit based on the detected change in the feature amount.
前記特徴量抽出部は、抽出した特徴量を特徴ベクトルとして出力するものであり、
前記特徴変化検出部は、前記第1の映像に係る特徴ベクトルと前記第2の映像に係る特徴ベクトルとの差ベクトルを算出し、当該差ベクトルの各要素に重み付けをしたものを特徴差分ベクトルとして出力する
ことを特徴とする監視カメラ。 The surveillance camera of claim 1,
The feature quantity extraction unit outputs the extracted feature quantity as a feature vector;
The feature change detecting unit calculates a difference vector between a feature vector related to the first video and a feature vector related to the second video, and weights each element of the difference vector as a feature difference vector A surveillance camera characterized by output.
前記符号化制御部は、前記特徴変化検出部から出力された特徴差分ベクトルを評価指標に変換し、当該評価指標が閾値内に収まるように前記映像符号化部の制御パラメータを変更する
ことを特徴とする監視カメラ。 The surveillance camera of claim 2,
The encoding control unit converts the feature difference vector output from the feature change detection unit into an evaluation index, and changes the control parameter of the video encoding unit so that the evaluation index falls within a threshold value. Surveillance camera.
前記符号化制御部は、前記映像符号化部のフレーム間予測の有無および量子化パラメータを制御する
ことを特徴とする監視カメラ。 The surveillance camera of claim 1,
The surveillance camera, wherein the coding control unit controls presence / absence of inter-frame prediction and a quantization parameter of the video coding unit.
前記特徴量抽出部は、
入力された映像における人物顔を検出する顔検出部と、
前記検出された人物顔における眼、鼻、口などの各部品の濃度勾配を抽出する顔特徴抽出部とを有する
ことを特徴とする監視カメラ。 The surveillance camera of claim 1,
The feature amount extraction unit includes:
A face detection unit for detecting a human face in the input video;
A surveillance camera, comprising: a facial feature extraction unit that extracts density gradients of components such as eyes, nose, and mouth in the detected human face.
前記映像符号化部、映像復号化部、特徴量抽出部、特徴変化検出部、および符号化制御部が一または複数の半導体チップで構成されている
ことを特徴とする監視カメラ。 The surveillance camera of claim 1,
A surveillance camera, wherein the video encoding unit, video decoding unit, feature quantity extraction unit, feature change detection unit, and encoding control unit are configured by one or a plurality of semiconductor chips.
前記監視カメラと通信回線を通じて接続される監視端末とを備えている
ことを特徴とする監視システム。 A surveillance camera according to claim 1;
A monitoring system comprising: a monitoring terminal connected to the monitoring camera through a communication line.
前記監視端末は、
前記監視カメラから受信した映像から前記監視対象を認識する監視対象認識部と、
前記監視カメラから受信した映像の認識難度を評価する認識難度評価部とを有し、
前記認識難度を前記監視カメラに送信するものであり、
前記監視カメラにおける前記符号化制御部は、前記監視カメラから送信された認識難度を加味して前記映像符号化部の制御パラメータを変更する
ことを特徴とする監視システム。 The monitoring system of claim 7,
The monitoring terminal is
A monitoring object recognition unit for recognizing the monitoring object from the video received from the monitoring camera;
A recognition difficulty level evaluation unit that evaluates the recognition difficulty level of the video received from the surveillance camera;
Transmitting the recognition difficulty level to the surveillance camera;
The monitoring system, wherein the encoding control unit in the monitoring camera changes a control parameter of the video encoding unit in consideration of a recognition difficulty level transmitted from the monitoring camera.
前記監視カメラと通信回線を通じて接続される監視端末とを備え、
前記監視端末は、前記監視カメラから受信した映像から前記監視対象を認識する監視対象認識部を有し、当該認識に係るアルゴリズムを前記監視カメラに送信するものであり、
前記監視カメラにおける前記特徴変化検出部は、前記監視カメラから送信された認識アルゴリズムを加味して前記特徴差分ベクトルの各要素に重み付けをする
ことを特徴とする監視システム。 A surveillance camera according to claim 2;
A monitoring terminal connected to the monitoring camera through a communication line;
The monitoring terminal includes a monitoring target recognition unit that recognizes the monitoring target from the video received from the monitoring camera, and transmits an algorithm related to the recognition to the monitoring camera.
The monitoring system, wherein the feature change detection unit in the monitoring camera weights each element of the feature difference vector in consideration of a recognition algorithm transmitted from the monitoring camera.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010101219A JP2011234033A (en) | 2010-04-26 | 2010-04-26 | Monitoring camera and monitor system |
PCT/JP2011/001912 WO2011135776A1 (en) | 2010-04-26 | 2011-03-30 | Monitoring camera and monitoring system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010101219A JP2011234033A (en) | 2010-04-26 | 2010-04-26 | Monitoring camera and monitor system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011234033A true JP2011234033A (en) | 2011-11-17 |
Family
ID=44861105
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010101219A Withdrawn JP2011234033A (en) | 2010-04-26 | 2010-04-26 | Monitoring camera and monitor system |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2011234033A (en) |
WO (1) | WO2011135776A1 (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016025494A (en) * | 2014-07-22 | 2016-02-08 | ルネサスエレクトロニクス株式会社 | Image receiving device, image transmission system and image receiving method |
JP2016046707A (en) * | 2014-08-25 | 2016-04-04 | ルネサスエレクトロニクス株式会社 | Image communication device, image transmission device, and image reception device |
JP2019022209A (en) * | 2017-07-19 | 2019-02-07 | 和碩聯合科技股▲ふん▼有限公司Pegatron Corporation | Video monitoring system and video monitoring method |
JP2020120188A (en) * | 2019-01-21 | 2020-08-06 | 日本電気株式会社 | Media coding method and device |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016129269A (en) * | 2013-04-22 | 2016-07-14 | パナソニック株式会社 | Video/audio processing device, integrated circuit and program |
CN103400499B (en) * | 2013-07-22 | 2015-04-22 | 青岛海信网络科技股份有限公司 | Ultra-high definition intelligent video electronic police system and vehicle violation judging method of ultra-high definition intelligent video electronic police system |
CN104967822A (en) * | 2015-06-23 | 2015-10-07 | 杭州锋耀科技有限公司 | Multi-type target video detection bayonet device |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05176171A (en) * | 1991-12-25 | 1993-07-13 | Ricoh Co Ltd | Method and device for compressing picture data |
JP3183301B2 (en) * | 1992-01-27 | 2001-07-09 | 日本電信電話株式会社 | Interframe difference signal change detection communication method |
JP3115866B2 (en) * | 1998-12-18 | 2000-12-11 | シャープ株式会社 | Image encoding device and image decoding device |
-
2010
- 2010-04-26 JP JP2010101219A patent/JP2011234033A/en not_active Withdrawn
-
2011
- 2011-03-30 WO PCT/JP2011/001912 patent/WO2011135776A1/en active Application Filing
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016025494A (en) * | 2014-07-22 | 2016-02-08 | ルネサスエレクトロニクス株式会社 | Image receiving device, image transmission system and image receiving method |
JP2016046707A (en) * | 2014-08-25 | 2016-04-04 | ルネサスエレクトロニクス株式会社 | Image communication device, image transmission device, and image reception device |
US10362306B2 (en) | 2014-08-25 | 2019-07-23 | Renesas Electronics Corporation | Image communication apparatus, image transmission apparatus, and image reception apparatus |
JP2019022209A (en) * | 2017-07-19 | 2019-02-07 | 和碩聯合科技股▲ふん▼有限公司Pegatron Corporation | Video monitoring system and video monitoring method |
JP2020120188A (en) * | 2019-01-21 | 2020-08-06 | 日本電気株式会社 | Media coding method and device |
JP7310148B2 (en) | 2019-01-21 | 2023-07-19 | 日本電気株式会社 | Media encoding method and apparatus |
Also Published As
Publication number | Publication date |
---|---|
WO2011135776A1 (en) | 2011-11-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2011135776A1 (en) | Monitoring camera and monitoring system | |
EP2661882B1 (en) | Video coding and decoding devices and methods preserving ppg relevant information | |
US9286944B2 (en) | Methods and systems for providing a combination of media data and metadata | |
KR101960006B1 (en) | Video encoding method and video encoder system | |
US8737486B2 (en) | Objective image quality assessment device of video quality and automatic monitoring device | |
KR101544765B1 (en) | Method and apparatus for detecting fire using fire detection sensor and camera | |
US6931064B2 (en) | Motion picture data converter, and computer product | |
US9635212B2 (en) | Dynamic compression ratio selection | |
KR100465244B1 (en) | Motion detection apparatus and method for image signal | |
US7620257B2 (en) | Image processor | |
KR100938211B1 (en) | System and method for video quality measurement | |
WO2011045875A1 (en) | Image processing method, image processing device, and image capturing system | |
KR20200119372A (en) | Artificial Neural Network Based Object Region Detection Method, Device and Computer Program Thereof | |
JP3522395B2 (en) | Monitoring device | |
US10134100B2 (en) | Watermark embedding apparatus and method through image structure conversion | |
JP6678525B2 (en) | Imaging device and imaging method | |
KR101653223B1 (en) | System and method for controlling quality of image | |
US20220417533A1 (en) | Image processing system | |
JP6720743B2 (en) | Media quality determination device, media quality determination method, and computer program for media quality determination | |
JP5906430B2 (en) | Video transmission terminal and video transmission system | |
JP2005012678A (en) | Image pickup device for monitor, and monitoring method | |
KR102247620B1 (en) | Motion detection apparatus and method based on video compression bitstream | |
Lee et al. | A novel high dynamic range image compression scheme of color filter array data for the digital camera pipeline | |
CN109510978B (en) | Data processing performance detection method and device | |
JP5244625B2 (en) | Image compression / decompression device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20130702 |