JP6784032B2 - 符号化装置、符号化方法、プログラム、及び画像処理システム - Google Patents
符号化装置、符号化方法、プログラム、及び画像処理システム Download PDFInfo
- Publication number
- JP6784032B2 JP6784032B2 JP2016031217A JP2016031217A JP6784032B2 JP 6784032 B2 JP6784032 B2 JP 6784032B2 JP 2016031217 A JP2016031217 A JP 2016031217A JP 2016031217 A JP2016031217 A JP 2016031217A JP 6784032 B2 JP6784032 B2 JP 6784032B2
- Authority
- JP
- Japan
- Prior art keywords
- region
- interest
- image
- face
- representative
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Studio Devices (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
近年の技術進歩により、高画質な画像を取得することが比較的容易になってきている。しかし、画質が高いほど画像のファイル容量が巨大化するため、通信帯域や画像の蓄積容量に制限がある場合、画質とファイル容量とは、いわゆるトレードオフの関係となる。
[2.1.本実施形態に係るシステム構成例]
まず、図1を参照して、本実施形態に係る画像処理システムのシステム構成例について説明する。図1を参照すると、本実施形態に係る画像処理システムは、監視カメラ10、及び監視端末30を備える。また、監視カメラ10及び監視端末30は、互いに通信が行えるようにネットワーク20を介して接続される。
次に、本実施形態に係る監視カメラ10について詳細に説明する。上述したとおり、本実施形態に係る監視カメラ10は、撮像した画像を符号化する機能を有する。この際、本実施形態に係る監視カメラ10は、領域IDごとの代表的な関心領域を同一の領域IDに関連付いた他の関心領域よりも高品質で符号化すること、を特徴の一つとする。
画像入力部110は、撮影した映像をデジタル信号に変換して出力する機能を有する。本実施形態に係る画像入力部110は、例えば、ビデオカメラであってよい。画像入力部110は、デジタル化した時系列の画像データを、後述する顔検出部120、視認性スコア算出部130、及び符号化部150に出力する。
顔検出部120は、画像に含まれる関心領域を検出し、当該関心領域と領域IDとを関連付ける機能を有する。すなわち、本実施形態に係る顔検出部120は、画像入力部110より取得した画像データに含まれる人間の顔領域を検出し、当該顔領域を識別するための顔IDを付与する。また、顔検出部120は、検出した顔領域の位置データ(以下、顔位置データ、とも呼ぶ)を算出する機能を有する。また、顔検出部120は、顔IDと関連付いた顔位置データを、後述する視認性スコア算出部130、及び符号化部150に出力する。なお、顔検出部120による顔位置データ算出の詳細については後述する。
視認性スコア算出部130は、顔IDと関連付いた顔領域の視認性スコアを算出する機能を有する。視認性スコア算出部130は、画像入力部110から取得した画像データと、顔検出部120から取得した顔IDと関連付いた顔位置データと、に基づいて、顔領域ごとの視認性スコアを算出することができる。また、視認性スコア算出部130は、算出した視認性スコアを後述する代表顔判定部140に出力する。なお、視認性スコア算出部130による視認性スコア算出の詳細については後述する。
代表顔判定部140は、視認性スコア算出部130から取得した視認性スコアに基づいて、顔IDごとの代表顔を判定する機能を有する。この際、代表顔判定部140は、顔IDごとに最も視認性スコアが高い顔領域を上記の代表顔として決定してもよい。また、代表顔判定部140は、代表顔を判定(更新)した場合、代表顔判定データを符号化部150に出力する。なお、代表顔判定部140による代表顔判定の詳細については後述する。
符号化部150は、顔IDごとの代表顔を同一の顔IDに関連付いた他の顔領域よりも高品質で符号化する機能を有する。すなわち、符号化部150は、顔検出部120から取得した顔IDに関連付いた顔位置データと、代表顔判定部140から代表顔判定データと、に基づいて、画像入力部110から取得した画像データの符号化を行う。また、符号化部150は、符号化した画像データ含むストリームデータを、ネットワーク20を介して、監視端末30に送信する。なお、符号化部150による符号化の詳細については後述する。
次に、本実施形態に係る監視端末30について詳細に説明する。上述したとおり、本実施形態に係る監視端末30は、監視カメラ10が符号化した画像を取得し、当該画像を複合する機能を有する。また、監視端末30は、複合した画像を表示してユーザに提示する機能を有する。
複合部310は、符号化されたストリームデータを複合し、後述する表示部330に出力する機能を有する。本実施形態に係る複合部310は、ネットワーク20を介して監視カメラ10から取得したストリームデータを複合してよい。また、複合部310は、後述する蓄積部320が蓄積するストリームデータを取得し、当該ストリームデータを複合してもよい。
蓄積部320は、ネットワーク20を介して監視カメラ10からストリームデータを取得し、当該ストリームデータを蓄積する機能を有する。また、本実施形態に係る蓄積部320は、複合部310に蓄積するストリームデータを出力する機能を有してよい。
表示部330は、複合部310により複合された画像データを表示する機能を有する。上記の機能は、例えば、CRT(Cathode Ray Tube)ディスプレイ装置、液晶ディスプレイ(LCD:Liquid Crystal Display)装置、OLED(Organic Light Emitting Diode)装置などにより実現されてもよい。
以上、本実施形態に係る監視カメラ10及び監視端末30の構成について説明した。続いて、本実施形態に係る顔検出部120による顔位置データの算出について、詳細に説明する。上記で述べたとおり、本実施形態に係る顔検出部120は、画像データに含まれる顔領域を検出し、当該顔領域の顔位置データを算出することができる。
次に、本実施形態に係る視認性スコアの算出について、詳細に説明する。上述したとおり、本実施形態に係る視認性スコア算出部130は、画像入力部110から取得した画像データと、顔検出部120から取得した顔IDと関連付いた顔位置データと、に基づいて、顔領域ごとの視認性スコアを算出することができる。この際、視認性スコア算出部130は、関心領域に係る顔の向き、大きさ、明るさ、及びまばたき等の特徴に基づいて、視認性スコアを算出してよい。
次に、本実施形態に係る代表顔の判定について詳細に説明する。本実施形態に係る代表顔判定部140は、視認性スコア算出部130から取得した視認性スコアに基づいて、顔IDごとの代表顔を判定する機能を有する。すなわち、本実施形態に係る代表顔判定部140は、顔IDごとに視認性スコアが最も高い顔領域を代表顔として判定し記録する。
次に、本実施形態に係る符号化特性の制御について詳細に説明する。本実施形態に係る符号化部150は、画像データ中の領域を3種に分類し、それぞれ異なる符号化特性により符号化する。符号化部150は、顔検出部120から取得した顔位置データと、代表顔判定部140から取得した代表顔判定データに基づいて、上記の分類を行うことができる。
次に、本実施形態に係るストリームデータの構成について詳細に説明する。上述したとおり、本実施形態に係る符号化部150は、符号化した画像データを含むストリームデータを、ネットワーク20を介して監視端末30に送信する。
以上、本実施形態に係る監視カメラ10の各構成の機能について詳細に説明した。続いて、監視カメラ10による画像データの符号化の流れについて説明する。図10は、本実施形態に係る符号化の流れを示すフローチャートである。
次に、本実施形態に係る監視端末30による実時間監視について説明する。本実施形態に係る監視端末30は、取得したストリームデータをリアルタイムに複合し、監視カメラ10により撮像された動画像をユーザに提示することができる。
次に、本実施形態に係る監視端末30による過去映像の監視について説明する。本実施形態に係る監視端末30は、ユーザに操作に基づいて、蓄積部320に蓄積されるストリームデータを複合し、監視カメラ10により撮像された過去の動画像をユーザに提示することができる。
次に、本発明に係る監視カメラ10及び監視端末30に共通するハードウェア構成例について説明する。図15は、本発明に係る監視カメラ10及び監視端末30のハードウェア構成例を示すブロック図である。図15を参照すると、監視カメラ10及び監視端末30は、例えば、CPU871と、ROM872と、RAM873と、ホストバス874と、ブリッジ875と、外部バス876と、インターフェース877と、入力部878と、出力部879と、記憶部880と、ドライブ881と、接続ポート882と、通信装置883と、を有する。なお、ここで示すハードウェア構成は一例であり、構成要素の一部が省略されてもよい。また、ここで示される構成要素以外の構成要素をさらに含んでもよい。
CPU871は、例えば、演算処理装置又は制御装置として機能し、ROM872、RAM873、記憶部880、又はリムーバブル記録媒体901に記録された各種プログラムに基づいて各構成要素の動作全般又はその一部を制御する。
ROM872は、CPU871に読み込まれるプログラムや演算に用いるデータ等を格納する手段である。RAM873には、例えば、CPU871に読み込まれるプログラムや、そのプログラムを実行する際に適宜変化する各種パラメータ等が一時的又は永続的に格納される。
CPU871、ROM872、RAM873は、例えば、高速なデータ伝送が可能なホストバス874を介して相互に接続される。一方、ホストバス874は、例えば、ブリッジ875を介して比較的データ伝送速度が低速な外部バス876に接続される。また、外部バス876は、インターフェース877を介して種々の構成要素と接続される。
入力部878には、例えば、マウス、キーボード、タッチパネル、ボタン、スイッチ、及びレバー等が用いられる。さらに、入力部878としては、赤外線やその他の電波を利用して制御信号を送信することが可能なリモートコントローラ(以下、リモコン)が用いられることもある。
出力部879には、例えば、CRT(Cathode Ray Tube)、LCD、又は有機EL等のディスプレイ装置、スピーカ、ヘッドホン等のオーディオ出力装置、プリンタ、携帯電話、又はファクシミリ等、取得した情報を利用者に対して視覚的又は聴覚的に通知することが可能な装置である。
記憶部880は、各種のデータを格納するための装置である。記憶部880としては、例えば、ハードディスクドライブ(HDD)等の磁気記憶デバイス、半導体記憶デバイス、光記憶デバイス、又は光磁気記憶デバイス等が用いられる。
ドライブ881は、例えば、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体901に記録された情報を読み出し、又はリムーバブル記録媒体901に情報を書き込む装置である。
リムーバブル記録媒体901は、例えば、DVDメディア、Blu−ray(登録商標)メディア、HD DVDメディア、各種の半導体記憶メディア等である。もちろん、リムーバブル記録媒体901は、例えば、非接触型ICチップを搭載したICカード、又は電子機器等であってもよい。
接続ポート882は、例えば、USB(Universal Serial Bus)ポート、IEEE1394ポート、SCSI(Small Computer System Interface)、RS−232Cポート、又は光オーディオ端子等のような外部接続機器902を接続するためのポートである。
外部接続機器902は、例えば、プリンタ、携帯音楽プレーヤ、デジタルカメラ、デジタルビデオカメラ、又はICレコーダ等である。
通信装置883は、ネットワーク903に接続するための通信デバイスであり、例えば、有線又は無線LAN、Bluetooth(登録商標)、又はWUSB(Wireless USB)用の通信カード、光通信用のルータ、ADSL(Asymmetric Digital Subscriber Line)用のルータ、又は各種通信用のモデム等である。
以上説明したように、本発明に係る監視カメラ10は、領域IDごとの代表的な関心領域を同一の領域IDに関連付いた他の関心領域よりも高品質で符号化すること、を特徴の一つとする。また、監視カメラ10は、撮像した画像に含まれる関心領域を検出し、領域IDを関連付ける機能を有する。また、監視カメラ10は、上記の領域IDに関連付いた関心領域の視認性スコアを算出する機能を有する。また、監視カメラ10は、上記の視認性スコアに基づいて領域IDごとの代表的な関心領域を判定する機能を有する。係る構成によれば、画像全体の符号量を抑えながら、より価値の高い画像情報をユーザに提供することが可能となる。
110 画像入力部
120 顔検出部
130 視認性スコア算出部
140 代表顔判定部
150 符号化部
20 ネットワーク
30 監視端末
310 複合部
320 蓄積部
330 表示部
Claims (10)
- 画像に含まれる関心領域を検出し前記関心領域と領域IDとを関連付ける検出部と、
前記領域IDと関連付いた前記関心領域の視認性スコアを算出する算出部と、
前記視認性スコアに基づいて前記領域IDごとの代表的な前記関心領域を判定する判定部と、
前記画像を符号化する符号化部と、
を備え、
前記検出部は、判定対象とする前記関心領域の位置データと、時系列に沿った直前時刻の前記画像に含まれる前記関心領域の位置データと、に基づいて、前記判定対象とする前記関心領域と、前記直前時刻の前記画像に含まれる前記関心領域と、が同一の被写体を含むと判定した場合、前記判定対象とする前記関心領域に対し、前記直前時刻の前記画像に含まれる前記関心領域と同一の前記領域IDを関連付け、
前記符号化部は、順次算出される前記視認性スコアに基づいて前記領域IDごとに決定される前記代表的な前記関心領域のみを、同一の前記領域IDに関連付いた他の前記関心領域よりも高品質で符号化し、当該他の前記関心領域を、予め定められた所定の品質で符号化する、
符号化装置。 - 前記判定部は、前記領域IDごとに前記視認性スコアが最も高い前記関心領域を前記代表的な前記関心領域として決定する、
請求項1に記載の符号化装置。 - 前記判定部は、前記代表的な前記関心領域を決定した後、所定の時間、前記視認性スコアに基づく前記代表的な前記関心領域の判定を行わない、
請求項1または2に記載の符号化装置。 - 前記算出部は、前記関心領域に係る対象物の向き、大きさ、明るさ、または形状特徴のうち少なくとも1つに基づいて前記視認性スコアを算出する、
請求項1〜3のいずれかに記載の符号化装置。 - 前記符号化部は、前記領域IDと関連付いた前記関心領域を含む前記画像を選択的に復号するための補助データを前記画像に付加する、
請求項1〜4のいずれかに記載の符号化装置。 - 前記関心領域は、顔領域または人物領域である、
請求項1〜5のいずれかに記載の符号化装置。 - 前記画像は、動画像のフレーム画像である、
請求項1〜6のいずれかに記載の符号化装置。 - 画像に含まれる関心領域を検出し前記関心領域と領域IDとを関連付けることと、
前記領域IDと関連付いた前記関心領域の視認性スコアを算出することと、
前記視認性スコアに基づいて前記領域IDごとの代表的な前記関心領域を判定することと、
順次算出される前記視認性スコアに基づいて前記領域IDごとに決定される前記代表的な前記関心領域のみを、同一の前記領域IDに関連付いた他の前記関心領域よりも高品質で符号化し、当該他の前記関心領域を、予め定められた所定の品質で符号化することと、
を含み、
前記関心領域と領域IDとを関連付けることは、判定対象とする前記関心領域の位置データと、時系列に沿った直前時刻の前記画像に含まれる前記関心領域の位置データと、に基づいて、前記判定対象とする前記関心領域と、前記直前時刻の前記画像に含まれる前記関心領域と、が同一の被写体を含むと判定した場合、前記判定対象とする前記関心領域に対し、前記直前時刻の前記画像に含まれる前記関心領域と同一の前記領域IDを関連付けること、をさらに含む、
符号化方法。 - コンピュータを、
画像に含まれる関心領域を検出し前記関心領域と領域IDとを関連付ける検出部と、
前記領域IDと関連付いた前記関心領域の視認性スコアを算出する算出部と、
前記視認性スコアに基づいて前記領域IDごとの代表的な前記関心領域を判定する判定部と、
前記画像を符号化する符号化部と、
を備え、
前記検出部は、判定対象とする前記関心領域の位置データと、時系列に沿った直前時刻の前記画像に含まれる前記関心領域の位置データと、に基づいて、前記判定対象とする前記関心領域と、前記直前時刻の前記画像に含まれる前記関心領域と、が同一の被写体を含むと判定した場合、前記判定対象とする前記関心領域に対し、前記直前時刻の前記画像に含まれる前記関心領域と同一の前記領域IDを関連付け、
前記符号化部は、順次算出される前記視認性スコアに基づいて前記領域IDごとに決定される前記代表的な前記関心領域のみを、同一の前記領域IDに関連付いた他の前記関心領域よりも高品質で符号化し、当該他の前記関心領域を、予め定められた所定の品質で符号化する、
符号化装置、
として機能させるためのプログラム。 - 画像に含まれる関心領域を検出し前記関心領域と領域IDとを関連付ける検出部、
前記領域IDと関連付いた前記関心領域の視認性スコアを算出する算出部、
前記視認性スコアに基づいて前記領域IDごとの代表的な前記関心領域を判定する判定部、及び
前記画像を符号化する符号化部、
を備え、
前記検出部は、判定対象とする前記関心領域の位置データと、時系列に沿った直前時刻の前記画像に含まれる前記関心領域の位置データと、に基づいて、前記判定対象とする前記関心領域と、前記直前時刻の前記画像に含まれる前記関心領域と、が同一の被写体を含むと判定した場合、前記判定対象とする前記関心領域に対し、前記直前時刻の前記画像に含まれる前記関心領域と同一の前記領域IDを関連付け、
前記符号化部は、順次算出される前記視認性スコアに基づいて前記領域IDごとに決定される前記代表的な前記関心領域のみを、同一の前記領域IDに関連付いた他の前記関心領域よりも高品質で符号化し、当該他の前記関心領域を、予め定められた所定の品質で符号化する、
符号化装置と、
符号化された前記画像を復号する復号部、
を備える、復号装置と、
を含む、画像処理システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016031217A JP6784032B2 (ja) | 2016-02-22 | 2016-02-22 | 符号化装置、符号化方法、プログラム、及び画像処理システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016031217A JP6784032B2 (ja) | 2016-02-22 | 2016-02-22 | 符号化装置、符号化方法、プログラム、及び画像処理システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017152790A JP2017152790A (ja) | 2017-08-31 |
JP6784032B2 true JP6784032B2 (ja) | 2020-11-11 |
Family
ID=59739754
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016031217A Active JP6784032B2 (ja) | 2016-02-22 | 2016-02-22 | 符号化装置、符号化方法、プログラム、及び画像処理システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6784032B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7051565B2 (ja) * | 2018-05-01 | 2022-04-11 | キヤノン株式会社 | 撮像装置及びその制御方法、撮像システム |
CN111953976B (zh) * | 2020-07-08 | 2024-10-18 | 西安万像电子科技有限公司 | 图像处理方法及装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010093323A (ja) * | 2008-10-03 | 2010-04-22 | Mitsubishi Electric Corp | 監視装置 |
JP2011233133A (ja) * | 2010-04-09 | 2011-11-17 | Miyake Inc | 万引き防止システム |
US10205953B2 (en) * | 2012-01-26 | 2019-02-12 | Apple Inc. | Object detection informed encoding |
-
2016
- 2016-02-22 JP JP2016031217A patent/JP6784032B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017152790A (ja) | 2017-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200227089A1 (en) | Method and device for processing multimedia information | |
TWI710964B (zh) | 圖像聚類方法及裝置、電子設備和儲存介質 | |
US10062412B2 (en) | Hierarchical segmentation and quality measurement for video editing | |
JP6961648B2 (ja) | リアル・タイム・ビデオ要約 | |
CN109154976B (zh) | 通过机器学习训练对象分类器的系统和方法 | |
CN110089104B (zh) | 事件存储装置、事件搜索装置和事件警报装置 | |
RU2693906C2 (ru) | Основанный на правилах анализ важности видео | |
EP3693966B1 (en) | System and method for continuous privacy-preserved audio collection | |
US10373461B2 (en) | System and method for video preview | |
US20100182501A1 (en) | Information processing apparatus, information processing method, and program | |
JPWO2018079020A1 (ja) | 情報処理装置および情報処理方法 | |
CN104796756B (zh) | 图像记录系统 | |
WO2013069605A1 (ja) | 類似画像検索システム | |
KR20150056381A (ko) | 영상 처리 장치 및 방법 | |
WO2000045600A1 (en) | Method of image feature encoding and method of image search | |
KR20180058019A (ko) | 영상 검색 장치, 데이터 저장 방법 및 데이터 저장 장치 | |
JP2007264860A (ja) | 顔領域抽出装置 | |
JP5345113B2 (ja) | コンテンツ出力システム、出力制御装置、出力制御方法、及びコンピュータプログラム | |
US20190052814A1 (en) | Information processing apparatus, information processing method, and storage medium | |
JP2010250556A (ja) | 画像処理装置、画像処理方法及びプログラム | |
CN112380396B (zh) | 视频处理方法及装置、计算机可读存储介质和电子设备 | |
CN115525188A (zh) | 拍摄方法和电子设备 | |
JP6784032B2 (ja) | 符号化装置、符号化方法、プログラム、及び画像処理システム | |
KR102426089B1 (ko) | 전자 장치 및 전자 장치의 요약 영상 생성 방법 | |
WO2021190412A1 (zh) | 一种生成视频缩略图的方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181115 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20190327 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190328 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190827 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191018 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200310 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200508 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200923 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201006 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6784032 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |