WO2014174763A1

WO2014174763A1 - 処理装置、集積回路、処理方法、およびプログラム

Info

Publication number: WO2014174763A1
Application number: PCT/JP2014/001811
Authority: WO
Inventors: 本坂　錦一
Original assignee: パナソニックＩｐマネジメント株式会社
Priority date: 2013-04-22
Filing date: 2014-03-28
Publication date: 2014-10-30
Also published as: US20140313327A1; JP2016129269A

Abstract

　第１の非圧縮情報を第１のパラメータセットに基づいて圧縮符号化し、第１の圧縮符号化情報を出力するエンコーダ（５０）と、第１の圧縮符号化情報を非圧縮符号化し、第２の非圧縮情報を出力するデコーダ（６０）と、第１の非圧縮情報に属性抽出処理を行い、抽出した属性情報である第１抽出属性データを出力し、第２の非圧縮情報に属性抽出処理を行い、抽出した属性情報である第２抽出属性データを出力する画像音声処理部（７０）と、第１抽出属性データと第２抽出属性データが等しければ、第１のパラメータセットを確定パラメータセットとして決定する制御部（１００）を含む処理装置。

Description

処理装置、集積回路、処理方法、およびプログラム

　本開示は情報の代理処理に関するものである。

　従来、携帯端末が演算能力提供装置に代理処理を依頼するシステムが知られている（特許文献１を参照）。

特開２００８－１２３３４４号公報

　しかしながら、上記従来の構成では、代理依頼元装置が圧縮符号化処理をしていない情報から抽出した属性情報（例えば、被写体の性別が男性）と、代理依頼元装置が圧縮符号化処理をした情報に基づいて代理依頼先装置が抽出した属性情報（例えば、被写体の性別が女性）の異同などについては言及されておらず、これらの抽出された属性情報が異なることがあると考えられる。本開示は、上記したような抽出された属性情報の不一致のないこと、すなわち、圧縮符号化処理で使用される適切なパラメータセットを決定する処理装置を提供する。

　本開示の処理装置は、第１の非圧縮情報を第１のパラメータセットに基づいて圧縮符号化し、第１の圧縮符号化情報を出力するエンコーダと、第１の圧縮符号化情報を非圧縮符号化し、第２の非圧縮情報を出力するデコーダと、第１の非圧縮情報に属性抽出処理を行い、抽出した属性情報である第１抽出属性データを出力し、第２の非圧縮情報に属性抽出処理を行い、抽出した属性情報である第２抽出属性データを出力する画像音声処理部と、第１抽出属性データと第２抽出属性データが等しければ、第１のパラメータセットを確定パラメータセットとして決定する制御部を含む。

　なお、これらの包括的または具体的な態様は、方法、集積回路、コンピュータプログラムまたはコンピュータ読み取り可能なＣＤ－ＲＯＭなどの記録媒体で実現されてもよく、方法、集積回路、コンピュータプログラムおよび記録媒体の任意な組み合わせで実現されてもよい。

　本開示の処理装置は、圧縮符号化処理で使用される適切なパラメータセットを決定できる。

図１は実施の形態における処理システム全体構成図図２は実施の形態における画像音声処理装置の構成図図３実施の形態におけるエンコードされた画像データが外部装置に送信される流れを示すフローチャート図４は実施の形態における抽出属性データが送信される流れを示すフローチャート図５は実施の形態における代理実行依頼と代理実行の流れを示すフローチャート図６Ａは実施の形態における画像音声処理装置での画像処理を示す図図６Ｂは実施の形態における画像音声処理代理実行サーバでの画像処理を示す図図７は実施の形態における代理実行有無の判断結果に応じた処理の流れを示すフローチャート図８は実施の形態における画像音声処理代理実行サーバへの代理処理依頼の流れを示すフローチャート図９は実施の形態におけるエンコードパラメータセット決定に関する流れを示すフローチャート図１０は対応テーブルの例を示す図図１１は画像音声処理代理実行する候補サーバのリストの例を示す図図１２は画像音声処理代理実行する候補サーバのリストの例を示す図

　（本発明の基礎となった知見）
　本発明者らは、「背景技術」の欄において記載したシステムに関して、以下の問題が生じることを見いだした。

　最近、監視カメラは、他の画像を処理する機器同様、デジタル処理化が進んでいる。デジタル化された監視カメラは、カメラで撮影した映像をエンコードすることで、データ量が削減されたエンコードデータを生成し、エンコードデータをＩＰネットワークにて送る。

　一方、監視カメラで撮影する映像の解像度について、ＶＧＡ（Ｖｉｄｅｏ　Ｇｒａｐｈｉｃｓ　Ａｒｒａｙ）からＨＤ（Ｈｉｇｈ　Ｄｅｆｉｎｉｔｉｏｎ）、フルＨＤ、ウルトラＨＤと急激に高解像度化しているため、エンコードによってデータ量を削減しても、ネットワーク帯域やサーバの記憶領域に対する負荷が大きくなっており、データ量のさらなる削減が求められている。

　このような理由から、監視カメラからサーバに、監視カメラが撮像した映像や録音した音声を送るのではなく、監視カメラが属性情報を抽出して抽出属性データを得るために画像処理や音声処理を行い、抽出された属性情報である抽出属性データのみを送るか、その抽出属性データが有意な情報である時に撮像した映像や録音した音声を送る機能を持つ監視カメラが徐々に製品化されている。これまでの一般的な監視カメラは、撮像した映像や録音した音声を送信する機能のみであったが、今後、監視カメラは、属性情報を抽出して抽出属性データを得るための画像処理機能や音声処理機能を持つのが一般的になってくると想像される。

　属性情報を抽出して抽出属性データを得るための画像処理、音声処理は、アプリケーションプログラムとして監視カメラで実行されることが考えられる。属性情報を抽出するための画像処理、音声処理は、複雑な処理であることが多いので、ＣＰＵ能力やメモリ量、専用回路など多量のハードウェア資源を必要とすることが多い。

　このため、監視カメラの限られたハードウェア資源を用いて、複数の属性情報を抽出するため複数のアプリケーションプログラムを同時に実行させようとする時、監視カメラのハードウェア資源の不足により、いくつかの属性情報を抽出するアプリケーションプログラムが実行できずに、属性情報を抽出するための画像処理、音声処理が実施できないことが考えられる。

　特許文献１は演算能力提供装置が携帯端末の代理処理を行うシステムを示しているが、演算能力提供装置が実行する画像処理はフレームデータをフレーム内符号化によって符号化することであり、圧縮された画像データの復号処理を行い、属性情報を抽出して抽出属性データを得るための画像処理、音声処理を行うことは想定されていない。画像データを圧縮符号化すると情報が欠落するため、圧縮符号化のパラメータセットの設定によっては、代理依頼元装置が圧縮符号化処理をした情報から代理依頼先装置が抽出した属性情報である抽出属性データ（例えば、被写体の性別が女性）と、代理依頼元装置が圧縮符号化処理をしていない情報から抽出した属性情報である抽出属性データ（例えば、被写体の性別が男性）とが異なることがある。

　このような問題を解決するために、本開示の処理装置は、第１の非圧縮情報を第１のパラメータセットに基づいて圧縮符号化し、第１の圧縮符号化情報を出力するエンコーダと、第１の圧縮符号化情報を非圧縮符号化し、第２の非圧縮情報を出力するデコーダと、第１の非圧縮情報に属性抽出処理を行い、抽出した属性情報である第１抽出属性データを出力し、第２の非圧縮情報に属性抽出処理を行い、抽出した属性情報である第２抽出属性データを出力する画像音声処理部と、第１抽出属性データと第２抽出属性データが等しければ、第１のパラメータセットを確定パラメータセットとして決定する制御部を含む。

　これにより、本開示の処理装置は、圧縮符号化で使用される適切なパラメータセットを決定できる。つまり、処理装置が圧縮符号化処理を経ていない非圧縮の映像音声情報から抽出する属性情報と、画像音声処理代理実行サーバが圧縮符号化処理を経た映像音声情報から抽出する属性情報が同一になる。

　また、確定パラメータセットの決定は、属性抽出処理を実施すると処理装置のハードウエア資源の使用量がハードウエア資源の最大使用許容量を超過すると制御部が推定した後に実施されるとしてもよい。

　これにより、適正な時期に符号化パラメータセットを決定することができる。つまり、処理装置が画像音声処理代理実行サーバに属性抽出のための画像処理の代理処理を依頼しないにもかかわらず、符号化パラメータセットを決定することを防止できる。

　また、画像音声処理部は複数の属性抽出処理の各々に対応するエンコードパラメータセットグループを示す対応テーブルを保持し、エンコードパラメータセットグループの各々は複数のエンコードパラメータセットを含み、複数のエンコードパラメータセットの各々は１以上のエンコードパラメータを含み、複数の属性抽出処理は属性抽出処理を含み、複数のエンコードパラメータセットは第１のパラメータセットを含んでもよい。

　これによりパラメータセットを効率よく決定できる。つまり、対応テーブルを保持すると、対応テーブルを保持しないときに比べて、処理装置は仮設定するパラメータセットを迅速に決定できる。

　また、第１抽出属性データと第２抽出属性データが等しくなければ、エンコーダは、第１のパラメータセットに代えて、属性抽出処理に対応するエンコードパラメータセットグループに含まれる複数のパラメータセットであり、第１のパラメータセット以外のパラメータセットである第２のパラメータセットに基づいて、第１の非圧縮情報を圧縮符号化し、第２の圧縮符号化情報を出力し、デコーダは第２の圧縮符号化情報を非圧縮符号化し、第３の非圧縮情報を出力し、画像音声処理部は第３の非圧縮情報から抽出した属性情報である第３抽出属性データを出力し、制御部は第１抽出属性データと第３抽出属性データが等しければ、第２のパラメータセットを確定パラメータセットとして決定するとしてもよい。

　これによりパラメータセットを効率よく決定できる。

　また、処理装置は代理実行サーバ決定部を含み、代理実行サーバ決定部はエンコーダが確定パラメータセットに基づいて第４の非圧縮情報を圧縮符号化した第３の圧縮符号化情報に対する属性抽出処理を処理装置に代わって行う画像音声処理代理サーバの候補サーバを含む候補リストを保持し、候補リストに含まれる候補サーバに属性抽出処理の実行が可能かの問い合わせを行い、処理装置は第１の非圧縮情報を取得した後に、第４の非圧縮情報を取得してもよい。

　これにより、処理装置の画像音声処理代理実行サーバを効率的に決定できる。つまり、保持する候補リストに含まれる候補サーバに問い合わせを行うだけで、画像音声処理代理実行サーバを決定できる。

　また、処理装置以外の装置である外部装置は、第４の非圧縮情報を確定パラメータセットに基づいて圧縮符号化された第３の圧縮符号化情報に対する属性抽出処理を処理装置に代わって行う画像音声処理代理サーバの候補サーバを含む候補リストを保持し、外部装置は候補リストに含まれる候補サーバに属性抽出処理の実行が可能かの問い合わせを行い、処理装置は第１の非圧縮情報を取得した後に、第４の非圧縮情報を取得するようにしてもよい。

　これにより、処理装置の構成を簡素化できる。つまり、候補リストを保持することは必要とせず、画像音声処理代理実行サーバを決定できる。

　また、候補リストは複数の属性抽出処理の各々に対応する候補サーバ情報を含み、候補サーバ情報で特定される候補サーバは対応する属性抽出処理を処理装置に代わって行う画像音声処理代理サーバの候補サーバであるとしてもよい。

　これにより、処理装置は画像音声処理代理サーバを効率的に決定できる。

　また、属性抽出処理は顔識別処理であり、属性情報は性別、年齢区分の少なくとも１つを含み、第１のパラメータセットは画像解像度を含んでもよい。

　なお、以下で説明する実施の形態は、いずれも包括的または具体的な例を示すものである。以下の実施の形態で示される数値、形状、構成要素、構成要素の配置位置、ステップ、ステップの順序などは、一例であり、本開示を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。

　以下、実施の形態について、図面を参照しながら説明する。

　（実施の形態）
　図１は、実施の形態における処理システム７の全体構成図を示したものである。処理システム７は、画像音声処理装置１、映像音声データ受信サーバ４、画像音声処理データ受信サーバ５、画像音声処理代理実行サーバ６を含む。

　画像音声処理装置１は、カメラやマイクなどの入力デバイスから画像データや音声データなどのデータを取得した後、このデータに対して何らかの加工を施して、外部装置に出力する。外部装置は映像音声データ受信サーバ４、画像音声処理データ受信サーバ５、画像音声処理代理実行サーバ６を含む。画像音声処理装置１と外部装置は、ＩＰネットワークを介して通信してもよい。画像音声処理装置１は、カメラやマイクなどから画像データや音声データなどのデータを取得して、このデータをエンコードし、エンコードされた映像音声データ１１０を映像音声データ受信サーバ４に出力する。画像音声処理装置１は画像データと音声データの少なくとも一方をエンコードしてもよい。エンコードされた映像音声データ１１０はエンコードされた映像データとエンコードされた音声データの少なくとも一方を含んでもよい。

　画像音声処理装置１は、カメラやマイクから画像データや音声データなどのデータを取得して、このデータから属性情報を抽出するため画像音声処理して、抽出された属性情報である抽出属性データ１２０を生成し、抽出属性データ１２０を画像音声処理データ受信サーバ５に出力する。なお、抽出属性データ１２０は画像データを基に生成した抽出属性データ、音声データを基に生成した抽出属性データの少なくとも一方を含んでもよい。また、画像データを基に生成した抽出属性データと音声データを基に生成した抽出属性データの両方を加味して１つの属性情報を決定し、この決定した情報を抽出属性データ１２０としてもよい。

　画像音声処理装置１は、カメラやマイクから画像データや音声データなどのデータを取得して、このデータをエンコードし、エンコードしたデータであるエンコードされた映像音声データ１３０を画像音声処理代理実行サーバ６に出力する。なお、エンコードされた映像音声データ１３０はエンコードされた映像データとエンコードされた音声データの少なくとも一方を含んでもよい。

　映像音声データ受信サーバ４は、画像音声処理装置１が送信したエンコードされた映像音声データ１１０を受信する。映像音声データ受信サーバ４は、受信したエンコードされた映像音声データ１１０を、デコードしてディスプレイ上に表示することができる。映像音声データ受信サーバ４はエンコードされた画像データとエンコードされた音声データの少なくとも一方をデコードしてもよい。また、映像音声データ受信サーバ４は、受信したエンコードされた映像音声データ１１０を、映像音声データ受信サーバ４が内蔵している記録デバイス、あるいは接続されている記録デバイスにそのまま書き込みを行うことができる。

　画像音声処理データ受信サーバ５は、画像音声処理装置１が送信した抽出属性データ１２０、画像音声処理代理実行サーバ６が送信した抽出属性データ１４０を受信する。画像音声処理データ受信サーバ５は、受信した抽出属性データ１２０、受信した抽出属性データ１４０を、ディスプレイ上に表示することができる。また、画像音声処理データ受信サーバ５は、受信した抽出属性データ１２０、受信した抽出属性データ１４０を、画像音声処理データ受信サーバ５が内蔵している記憶デバイスや、接続されている記録デバイスに書き込みを行うことができる。画像音声処理データ受信サーバ５は記録デバイスに蓄積しておいた複数の抽出属性データを解析して、その結果をディスプレイ上に表示することができる。

　画像音声処理代理実行サーバ６は、画像音声処理装置１が送信したエンコードされた映像音声データ１３０を受信して、画像音声処理装置１の代理で属性情報を抽出するため画像音声処理を行い、抽出された属性情報である抽出属性データ１４０を生成し、抽出属性データ１４０を画像音声処理データ受信サーバ５に出力する。画像音声処理代理実行サーバ６はエンコードされた映像データを基にした抽出属性データ生成とエンコードされた音声データを基にした抽出属性データ生成の少なくとも一方を行ってもよい。抽出属性データ１４０は画像データを基に生成した抽出属性データ、音声データを基に生成した抽出属性データの少なくとも一方を含んでもよい。また、画像データを基に生成した抽出属性データと音声データを基に生成した抽出属性データの両方を加味して１つの属性情報を決定し、この決定した情報を抽出属性データ１４０としてもよい。

　なお、図１では、映像音声データ受信サーバ４、画像音声処理データ受信サーバ５、画像音声処理代理実行サーバ６を、個別のサーバとして記述しているが、これらのサーバで実施している機能は、１つのサーバで行っても良いし、複数のサーバで分担して行っても良い。

　また、処理システム７が複数の画像音声処理装置を含む場合、画像音声処理装置１以外の画像音声処理装置が映像音声データ受信サーバ４、画像音声処理データ受信サーバ５、画像音声処理代理実行サーバ６の機能を保持し、実行してもよい。

　図２は、画像音声処理装置１の構成図である。画像音声処理装置１は、画像取得部１０と、音声取得部２０と、通信部３０と、代理実行サーバ決定部４０と、エンコーダ部５０と、デコーダ部６０と、画像音声処理部７０と、リソース使用量計算部８０と、主制御部１００を含む。

　画像取得部１０は、カメラを備え、カメラで撮影された画像データを取得する。画像取得部１０は、アナログビデオ端子、ＨＤＭＩ（登録商標）（Ｈｉｇｈ　Ｄｅｆｉｎｉｔｉｏｎ　Ｍｕｌｔｉｍｅｄｉａ　Ｉｎｔｅｒｆａｃｅ）端子などの映像入力端子を備えていて、別の装置から送出された映像を受信して、画像データを取得する。画像取得部１０は、イーサーネットなどのネットワーク端子を備えて、ネットワーク経由で送信された映像データを受信して、場合によっては映像データのデコードを行い、画像データを取得する。なお、取得した画像データは、ＲＧＢ形式（赤色、緑色、青色の強さを表わす形式）、ＹＣｂＣｒ形式（ＲＧＢ形式で表現された値を元に換算式で計算される値で色を示す形式、以下ＹＣｂＣｒをＹＣと記す）、ＲＡＷ（撮像素子から得られる信号そのもの）形式などの無圧縮の画像データとして出力する。

　音声取得部２０は、マイクを備えていて、マイクに入力された音声データを取得する。もしくは、アナログ音声端子、ＨＤＭＩ（登録商標）（Ｈｉｇｈ－Ｄｅｆｉｎｉｔｉｏｎ　Ｍｕｌｔｉｍｅｄｉａ　Ｉｎｔｅｒｆａｃｅ）端子などの音声入力端子を備えていて、別の装置から送出された音声を受信して、音声データを取得する。音声取得部２０は、イーサーネットなどのネットワーク端子を備えていて、別の装置から送出された音声データを受信して、場合によっては音声データのデコードを行い、音声データを取得する。なお、取得した音声データは、ビットストリーム形式などの、無圧縮の音声データとして出力する。

　通信部３０は、イーサーネットや、Ｂｌｕｅｔｏｏｔｈ（登録商標）、ＮＦＣ（Ｎｅａｒ　Ｆｉｅｌｄ　Ｃｏｍｍｕｎｉｃａｔｉｏｎ）などのネットワーク端子を通して、外部装置とデータの送受信を行う手段である。

　代理実行サーバ決定部４０は、属性情報を抽出して抽出属性データを得るための画像音声処理を、画像音声処理装置１に代わって実行する外部装置である画像音声処理代理実行サーバ６を決定する。代理実行サーバ決定部４０が画像音声処理代理実行サーバ６を決定するに際して、代理実行サーバ決定部４０は画像音声処理を代理実行する候補サーバを示す画像音声処理代理実行候補サーバリストを保持し、画像音声処理代理実行候補サーバリストに含まれる候補サーバから画像音声処理代理実行サーバ６を決定するとしてもよい。

　図１１は画像音声処理代理実行候補サーバリストの構成例を示す。画像音声処理代理実行候補サーバリスト１１００は画像音声処理を代理実行する候補サーバＵＲＬ群１１１０を含む。

　また、画像音声処理装置１の外部にある検索サーバに画像音声処理を代理実行するサーバの検索を依頼し、入手した検索結果（候補サーバのＵＲＬ情報）を用いて画像音声処理代理実行サーバ６を決定してもよい。すなわち、外部検索サーバは画像音声処理代理実行候補サーバリスト１１００と同様のリストを保持し、画像音声処理装置１から代理処理の内容、例えばどのような画像処理（属性抽出）の代理処理であるかの情報を取得して、リストにある候補サーバにこの処理が可能かを問い合わせて、代理処理が可能であるとの回答のあった候補サーバのＵＲＬ情報を画像音声処理装置１に送付してもよい。

　エンコーダ部５０は、ＲＡＷ形式やＲＧＢ形式やＹＣ形式などの無圧縮の画像データを、ＭＰＥＧ１／２／４、Ｈ．２６４、ＪＰＥＧ、ＪＰＥＧ２０００のような任意の画像圧縮方式により、符号化を行う。エンコーダ部５０は、ビットストリームなどの無圧縮の音声データを、ＭＰ３、ＡＣ３、ＡＡＣなどの任意の音声圧縮方式で符号化を行う。

　デコーダ部６０は、ＭＰＥＧ１、ＭＰＥＧ２、ＭＰＥＧ４、Ｈ．２６４、ＪＰＥＧ、ＪＰＥＧ２０００などの任意の画像圧縮方式で符号化された画像データを、ＲＡＷ形式やＲＧＢ形式やＹＣ形式などの無圧縮の画像データに復号化する。デコーダ部６０は、ＭＰ３、ＡＣ３、ＡＡＣなどの任意の音声圧縮方式で符号化された音声データを、ビットストリームなどの無圧縮の音声データに復号化する。

　画像音声処理部７０は、画像取得部１０で取得した画像データや、デコーダ部６０で復号化された画像データや、エンコーダ部５０により符号化された画像データに対して、属性情報を抽出して抽出属性データを得るために画像処理を行う。画像音声処理部７０は、音声取得部２０で取得した音声データや、デコーダ部６０で復号化された音声データや、エンコーダ部５０により符号化された音声データに対して、属性情報を抽出して抽出属性データを得るために音声解析を行う。

　本明細書、図面における「画像処理」という語は、属性情報を抽出して抽出属性データを得るための画像処理を意味し、「音声処理」という語は属性情報を抽出して抽出属性データを得るための音声処理を意味する。抽出属性データについは後述する。

　画像音声処理部７０は、例えば、図１０に示すような対応テーブル１０００を含む。対応テーブル１０００は複数の属性抽出処理の各々に対応するエンコードパラメータセットグループを含む。例えば、顔識別の属性抽出処理（画像処理）にはエンコードパラメータセットグループ１０１０、ナンバープレート認識の属性抽出処理（画像処理）にはエンコードパラメータセットグループ１０２０が対応する。複数のエンコードパラメータセットグループの各々は、複数のエンコードパラメータセットを含む。例えば、エンコードパラメータセットグループ１０１０はエンコードパラメータセット１０３０、エンコードパラメータセット１０４０を含む。

　複数のエンコードパラメータセットの各々は、１以上のエンコードパラメータを含む。例えば、エンコードパラメータセット１０３０はエンコードパラメータ１０５０、エンコードパラメータ１０６０を含む。エンコードパラメータ１０５０は画像解像度を特定する情報、エンコードパラメータ１０６０は転送レートを特定する情報である。エンコードパラメータセット１０３０は１つのエンコードパラメータのみ、例えば、画像解像度を特定する情報であるエンコードパラメータ１０５０のみを含んでもよい。

　リソース使用量計算部８０は、画像音声処理装置１のＣＰＵ、ＲＡＭ、記録媒体、ネットワークなど各種デバイス（ハードウエア資源）の使用量や、単位時間当りの使用量を計算する手段である。リソース使用量計算部８０は、それら各種デバイス（ハードウエア資源）の単位時間当りの使用率を計算してもよい。

　主制御部１００は、画像取得部１０、音声取得部２０、通信部３０、代理実行サーバ決定部４０、エンコーダ部５０、デコーダ部６０、画像音声処理部７０、リソース使用量計算部８０を制御して、一連の処理を実現する。例えば、主制御部１００は、画像取得部１０で取得した画像データや、音声取得部２０で取得した音声データを、エンコーダ部５０で符号化した後、通信部３０で映像音声データ受信サーバ４に送信する制御を行う。

　主制御部１００は、画像取得部１０で取得した画像データや、音声取得部２０で取得した音声データを、画像音声処理部７０で画像処理や音声処理を行う制御や、その解析結果である抽出属性データ１２０を通信部３０から画像音声処理データ受信サーバ５に送信する制御を行う。

　主制御部１００は、画像処理や音声処理を実行すると、ハードウエア資源の使用量の許容値を超える場合に、代理実行サーバ決定部４０で決定した画像音声処理代理実行サーバ６に対して代理実行を依頼する。

　さらにこの場合、主制御部１００は、画像音声処理代理実行サーバ６で画像処理や音声処理を実行した結果である抽出属性データと、画像音声処理装置１で画像処理や音声処理を実施した結果である抽出属性データが同じになるようにエンコードパラメータセットを決定して、画像取得部１０で取得した画像データや、音声取得部２０で取得した音声データを、決定したエンコードパラメータセットを用いてエンコーダ部５０で符号化した後、通信部３０から、エンコードされた映像音声データ１３０を画像音声処理代理実行サーバ６に送信する制御を行う。

　図３は、エンコードされた画像データが映像音声データ受信サーバ４や画像音声処理代理実行サーバ６などの外部装置に送信される流れを示すフローチャートである。

　まず、主制御部１００は、画像取得部１０に画像データＰの取得を指示する。指示を受けた画像取得部１０は、画像取得部１０が備えるカメラ、または、外部映像入力端子などの画像入力デバイスから、画像データＰを取得する（Ｓ３１０）。

　続いて、主制御部１００は、Ｓ３１０で取得した画像データＰを符号化することをエンコーダ部５０に指示する。指示を受けたエンコーダ部５０は、画像データＰを、Ｈ．２６４など任意の画像圧縮方式により符号化を行い、エンコード画像データＰ’を得る（Ｓ３２０）。

　最後に、主制御部１００は、Ｓ３２０で取得したエンコード画像データＰ’を映像音声データ受信サーバ４や画像音声処理代理実行サーバ６などの外部装置へ送信することを通信部３０に指示する。指示を受けた通信部３０は、エンコード画像データＰ’を、映像音声データ受信サーバ４や画像音声処理代理実行サーバ６などの外部装置が受信可能なプロトコル、例えば、ＨＴＴＰ（Ｈｙｐｅｒ　Ｔｅｘｔ　Ｔｒａｎｓｆｅｒ　Ｐｒｏｔｏｃｏｌ）や、ＲＴＰ（Ｒｅａｌｔｉｍｅ　Ｔｒａｎｓｆｅｒ　Ｐｒｏｔｏｃｏｌ）、を使って、映像音声データ受信サーバ４や画像音声処理代理実行サーバ６などの外部装置へ送信を行う（Ｓ３３０）。

　図４は、画像データが画像処理され、その処理結果のデータである抽出属性データが外部装置である画像音声処理データ受信サーバ５に送信される流れを示すフローチャートである。

　まず、画像音声処理装置１は通信部３０を介して、外部装置から、例えば、画像データを取得して、その画像データから特定の属性情報を抽出するように指示を受ける。画像音声処理装置１が特定の属性情報の抽出を行う機能を備えていなければ、その機能を備えたアプリケーションプログラムを外部から入手し、画像音声処理部７０が保持するようにしてもよい（図示せず）。

　次に、主制御部１００は、画像取得部１０に画像データＰの取得を指示する。指示を受けた画像取得部１０は、画像取得部１０が備えるカメラ、または、外部映像入力端子などの画像入力デバイスから、画像データＰを取得する（Ｓ４１０）。

　続いて、主制御部１００は、Ｓ４１０で取得した画像データＰから特定の属性情報を抽出する画像処理を画像音声処理部７０に指示する。指示を受けた画像音声処理部７０は、例えば、保持する複数のアプリケーションプログラムのうち、例えば、外部装置から指示されたアプリケーションプログラムを動作させ、画像データＰに対し、外部装置から指示された属性情報の抽出を行い、抽出属性データＡを得る（Ｓ４２０）。

　画像処理は、例えば、顔識別処理、ナンバープレート認識処理である。画像処理が顔識別処理である場合は、抽出属性データは、例えば、画像中で認識された人物の顔構成情報（目、鼻、口などの顔の構成要素の位置情報や顔全体の輪郭情報など）である。また、抽出属性データは、画像中で認識された人物の年齢区分（幼児、子供、大人）や性別区分（男性、女性）としてもよい。

　１つの画像処理（１つの画像処理アプリケーションプログラム）で、１つの属性情報を抽出し、１つの抽出属性データを生成してもよいし、複数の属性情報を抽出して、複数の抽出属性データを生成してもよい。例えば、１つの顔識別処理（１つの画像処理アプリケーションプログラム）で、最も顔領域の面積が大きい人物の年齢区分のみを抽出してもよいし、最も顔領域の面積が大きい人物の年齢区分と性別区分の両方を抽出してもよい。

　画像処理がナンバープレート認識処理の場合は、例えば、画像中で認識された車のナンバープレートに示された数字や文字（例えば、「５ＮＲ４３」）を抽出属性データとしてもよい。

　属性情報を抽出して抽出属性データを得るための音声処理は、例えば、単語認識処理であり、抽出属性データは１つの単語（例えば、「Ｈｅｌｌｏ」）であってもよい。

　最後に、主制御部１００は、Ｓ４２０で取得した画像処理結果である抽出属性データＡを外部装置である画像音声処理データ受信サーバ５へ送信することを通信部３０に指示する。指示を受けた通信部３０は、画像処理結果である抽出属性データＡを、外部装置である画像音声処理データ受信サーバ５が受信可能なプロトコル、例えば、ＨＴＴＰ（Ｈｙｐｅｒ　Ｔｅｘｔ　Ｔｒａｎｓｆｅｒ　Ｐｒｏｔｏｃｏｌ）や、ＦＴＰ（Ｆｉｌｅ　Ｔｒａｎｓｆｅｒ　Ｐｒｏｔｏｃｏｌ）や、ＳＭＴＰ（Ｓｉｍｐｌｅ　Ｍａｉｌ　Ｔｒａｎｓｆｅｒ　Ｐｒｏｔｏｃｏｌ）などを使って、外部装置である画像音声処理データ受信サーバ５へ送信を行う（Ｓ４３０）。

　図５は、実施の形態における代理実行依頼と代理実行の流れを示すフローチャートである。

　まず、画像音声処理装置１は、画像処理Ａと画像処理Ｂを動作させており、その２つのＣＰＵ使用量の総計はＣＰＵ最大使用量を下回っていて、遅延がない状態で画像処理Ａと画像処理Ｂを実施しているとする。なお、画像処理は、通常、ＹＣ形式やＲＧＢ形式などの無圧縮のデータ形式で行われることがほとんどであるため、ここでは、画像処理Ａと画像処理Ｂともに、ＹＣ形式で画像処理が行われるとする。

　次に、画像音声処理装置１は、画像処理Ｃを新たに動作させようとする。この時、画像音声処理装置１の主制御部１００は、現在のＣＰＵの単位時間当たりの使用量と画像処理ＣのＣＰＵの単位時間当たりの使用量予測値の合計が、ＣＰＵの単位時間当たりの最大使用量を超過していないかを確認する（Ｓ５１０）。超過していなければ、画像音声処理部７０は画像処理Ｃを開始する。一方、超過していれば、画像音声処理部７０が画像処理Ｃを開始しても期待通りに動作しない可能性が高いと判断し、画像音声処理装置１の主制御部１００は、外部装置で画像処理Ｃを代理実行すると判断する。

　続いて、画像音声処理装置１は、画像処理Ｃを代理実行できる外部装置を探索する。ここでは、外部装置として画像音声処理代理実行サーバ６が選択されたとする。そして、画像音声処理装置１は、画像音声処理代理実行サーバ６に対して、画像処理Ｃの実行を依頼する（Ｓ５２０）。画像音声処理装置１が画像処理Ｃを代理実行する外部装置を決定するに際して、画像音声処理装置１は例えば図１１に示すような画像音声処理代理実行候補サーバリスト１１００を保持し、画像音声処理装置１がそのリストの先頭の候補サーバから順番に、画像処理Ｃの代理実行が可能かを問い合わせていき、代理実行可能と回答した候補サーバを画像音声処理代理実行サーバ６として決定してもよい。例えば、画像音声処理代理実行候補サーバリスト１１００に含まれる候補サーバのＵＲＬのうち、まず、画像音声処理装置１はＵＲＬが（ｈｔｔｐ：／／３０３．３０３．１０１．１０１）の候補サーバに代理処理が可能かを問い合わせ、この候補サーバが代理実行不可能なら、次にＵＲＬが（ｈｔｔｐ：／／ｘｘｘ．ｃｏ．ｊｐ／ｃｇｉ－ｂｉｎ／ｐｒｏｃ．ｃｇｉ）の候補サーバに代理処理が可能かを問い合わせる。

　また、画像音声処理装置１が画像処理Ｃの代理実行が可能な外部装置を教えるサーバ（以下、外部処理通知サーバと呼ぶ）へ問い合わせを行い、外部処理通知サーバから通知された外部装置を画像音声処理代理実行サーバ６として決定してもよい。

　外部処理通知サーバは、あらかじめ代理処理実行可能な候補サーバのリストを保持しておき、画像音声処理装置１から画像処理Ｃを特定する情報を得て、そのリストの先頭の候補サーバから順番に、画像処理Ｃの代理実行が可能かを問い合わせていき、代理実行可能と回答した候補サーバのＵＲＬを画像音声処理装置１に通知してもよい。

　なお、画像処理Ｃの代理実行を依頼された画像音声処理代理実行サーバ６は、画像処理Ｃを実行するための準備を行う。

　続いて、画像音声処理装置１は、画像音声処理代理実行サーバ６で画像処理Ｃを実行するために必須であるデータを、画像音声処理代理実行サーバ６に送信する。通常、画像処理はＹＣデータ形式の画像データを用いて実施されるため、ＹＣデータ形式のデータを画像音声処理代理実行サーバ６に送信するのがよい。しかし、ＹＣデータ形式の画像データは容量が大きいため、ネットワークを用いた送信には向いていない。このため、画像音声処理装置１はＹＣデータ形式の画像データを画像音声処理代理実行サーバ６にそのまま送るのではなく、そのＹＣデータ形式の画像データを画像圧縮符号化して、画像圧縮符号化された画像データを画像音声処理代理実行サーバ６に送信する（Ｓ５３０）。

　画像音声処理代理実行サーバ６は、画像圧縮符号化された画像データを受信して、その画像圧縮符号化された画像データを復号化して、ＹＣデータ形式の復号化された画像データに戻し、画像処理Ｃを実行し、抽出属性データ得る（Ｓ５４０）。

　この時、画像圧縮符号化時に用いたパラメータセットによっては、画像音声処理装置１で画像処理Ｃを行った結果である抽出属性データと、画像音声処理代理実行サーバ６で画像処理Ｃ行った結果である抽出属性データが異なることがある。このことを説明する図が、図６Ａ、図６Ｂである。

　図６Ａは、画像音声処理装置１での画像処理Ｃを示す図である。画像音声処理装置１で画像処理Ｃを実施し、画像音声処理代理実行サーバ６では画像処理Ｃは行わない。

　画像音声処理装置１は、画像取得部１０から出力された非圧縮データであるＹＣデータＤ１に対し、画像処理Ｃを行って、画像処理結果データである抽出属性データＡ１を得る（Ｓ６１０）。

　図６Ｂは、画像音声処理代理実行サーバ６での画像処理Ｃを示す図である。画像音声処理装置１で画像処理Ｃを実施せず、画像音声処理代理実行サーバ６で画像処理Ｃを代理実行することを示したものである。画像音声処理装置１は、画像取得部１０から出力された非圧縮データであるＹＣデータＤ１に対し、画像圧縮符号化（エンコード）して、画像音声処理代理実行サーバ６に送る（Ｓ６２０）。

　画像音声処理代理実行サーバ６は、受け取った画像圧縮符号化（エンコード）されたデータを復号化（デコード）して非圧縮データであるＹＣデータＤ２を得る。この復号化された画像データであるＹＣデータＤ２に画像処理Ｃを行い、画像処理結果データである抽出属性データＡ２を得る（Ｓ６３０）。

　ここで、ＹＣデータＤ２は、ＹＣデータＤ１を画像圧縮符号化（エンコード）した後に、復号化（デコード）したデータであり、画像圧縮符号化によるデータ欠落があるため、ＹＣデータＤ１は、ＹＣデータＤ２と同一のものではない。このため、ＹＣデータＤ１に対し画像処理Ｃを実施した結果である画像処理結果データＡ１と、ＹＣデータＤ２に対し画像処理Ｃを実施した結果である画像処理結果データＡ２は、同じでないことがある。しかし、解像度、圧縮率、圧縮方法など画像圧縮符号化時に使用するパラメータセットを調整することで、Ａ１とＡ２を同一にすることは可能である。このため、画像音声処理装置１は、画像処理結果である抽出属性データＡ１と画像処理結果である抽出属性データＡ２が同じになるような画像圧縮パラメータセットを用いて、Ｓ６２０でのＹＣデータＤ１の画像圧縮符号化処理を行う必要がある。

　上述したように、画像音声処理代理実行サーバ６は、画像音声処理装置１が送信した画像圧縮符号化された画像データを受信する。そして、その画像圧縮符号化された画像データを復号化して、ＹＣデータ形式の復号化された画像データを得て、画像処理Ｃを行う（Ｓ５４０）。画像処理Ｃを行った結果である抽出属性データは、画像音声処理代理実行サーバ６自身で保持するか、もしくは、画像音声処理データ受信サーバ５へ送信する。

　図７は、代理実行有無の判断結果に応じた処理の流れを示すフローチャートである。

　まず、主制御部１００は、画像音声処理装置１が、画像処理を実行するか、外部装置が代理実行するかどうかの判断などを行う（Ｓ７１０）。ここでは外部装置は画像音声処理代理実行サーバ６とする。Ｓ７１０で図８に示すＳ８００の処理を実施してもよい。

　次に、主制御部１００は、Ｓ７１０で判断した結果をもとに、処理を分岐させる（Ｓ７２０）。

　もし、画像音声処理代理実行サーバ６が画像処理を代理実行すると判断した場合には、画像音声処理装置１はエンコード画像を生成して、画像音声処理代理実行サーバ６にエンコード画像を送信する処理を行う（Ｓ７３０）。なお、Ｓ７３０の詳細シーケンスは、図３に示すＳ３１０～Ｓ３３０のシーケンスとなる。

　もし、画像音声処理装置１が、画像処理を実行すると判断した場合は、画像音声処理装置１は画像処理を行い、画像処理結果である抽出属性データを画像音声処理データ受信サーバ５へ送信する（Ｓ７４０）。なお、Ｓ７４０の詳細シーケンスは、図４に示すＳ４１０～Ｓ４３０のシーケンスとなる。

　なお、画像データの取得を１０分毎に行い、その画像データの属性抽出を行う場合、Ｓ７１０とＳ７２０の処理は予め定められた時期（例えば、１日に１回で７時）にのみ行い、代理実行有無の判断結果を保持してもよい。そして、それ以外の時期（７時１０分から翌日の６時５０分まで）では、Ｓ７１０，Ｓ７２０の処理は実施せず、その保持された判断結果に従い、Ｓ７３０またはＳ７４０を実行するとしてもよい。

　図８は、画像音声処理代理実行サーバ６への代理処理依頼の流れを示すフローチャートである。

　まず、主制御部１００は、リソース使用量計算部８０からリソース（ハードウエア資源）使用量を取得して、取得したリソース（ハードウエア資源）使用量とこれから動作させる画像処理のリソース（ハードウエア資源）使用量の総計がリソース（ハードウエア資源）使用量の許容値を超えていないかを確認する（Ｓ８１０）。もし、超えていない場合は、代理処理依頼はないと判断し、このフローチャートを終了する。一方、超えている場合は、代理処理依頼があると判断し、次のステップに移行する。ここで、リソース（ハードウエア資源）使用量とは、ＣＰＵ使用量や、ＲＡＭ使用量、記録領域使用量などである。リソース使用量がＣＰＵ使用量とした場合は、Ｓ５１０で示した内容と同様な確認を行うとしてもよい。

　次に、主制御部１００は、送信する画像データをエンコードする際のエンコードパラメータセットＥを決定する。（Ｓ８２０）。エンコードパラメータセットは１以上のエンコードパラメータを含む。エンコードパラメータは、例えば、画像解像度、または、転送レート、または、圧縮率、または、圧縮方法であってもよい。エンコードパラメータはエンコードを実施する前に対応テーブル１０００を参照してエンコーダに設定する。対応テーブル１０００は顔識別やナンバープレート認識などの画像処理毎（顔識別アプリケーションプログラムやナンバープレート認識アプリケーション毎）にエンコードパラメータセットを複数保持する。図１０では１つのエンコードパラメータセットが複数のエンコードパラメータを含む例を示す。例えば、エンコードパラメータセット１０３０は複数のエンコードパラメータ１０５０、１０６０などを含む。なお、各エンコードパラメータセットは１つのエンコードパラメータであってもよい。

　ここで、エンコードパラメータセットＥは、画像音声処理装置１で画像処理を行った画像処理結果である抽出属性データと、画像音声処理代理実行サーバ６が画像音声処理装置１から受信したエンコードされた画像を用いて画像処理を行った結果である抽出属性データが同じとなるように決定される。なお、Ｓ８２０の詳細シーケンスは、図９にて説明する。

　Ｓ８２０で行う画像解析は例えばＳ５１０で示す画像処理Ｃに該当するが、Ｓ８２０でエンコードパラメータセットを決定する場合は、画像音声処理装置１で画像処理Ｃを実施する必要がある。そこで、画像処理Ｃを行うため、画像処理Ｂの処置を一時中断してもよい。また、画像処理Ｂが定期的に繰り返されるならば、今回の画像処理Ｂが終了し、次回の画像処理Ｂが開始されるまでの間に、画像処理Ｃを実行してもよい。

　次に、主制御部１００は、代理実行サーバ決定部４０に、画像処理の代理実行する画像音声処理代理実行サーバ６を決定するように指示する（Ｓ８３０）。画像音声処理装置１が画像処理Ｃを代理実行する外部装置を決定するに際して、画像音声処理装置１は画像処理Ｃの代理実行が可能な外部装置の候補リスト、例えば、画像音声処理代理実行候補サーバリスト１１００を保持し、画像音声処理装置１がその候補リストの先頭の外部装置から順番に、画像処理Ｃの代理実行が可能かを問い合わせていき、代理実行可能と回答した外部装置を画像音声処理代理実行サーバ６として決定してもよい。

　また、画像音声処理装置１の外部にある検索サーバに画像音声処理を代理実行するサーバの検索を依頼し、入手した検索結果（候補サーバのＵＲＬ情報）を用いて画像音声処理代理実行サーバ６を決定してもよい。すなわち、外部検索サーバは画像音声処理代理実行候補サーバリスト１１００と同様のリストを保持し、画像音声処理装置１から代理処理の内容、例えばどのような画像処理（属性抽出）であるかの情報を取得して、リストにある候補サーバにこの処理が可能かを問い合わせて、代理処理が可能であるとの回答のあった候補サーバのＵＲＬ情報を画像音声処理装置１に送付してもよい。

　また、画像音声処理装置１は、例えば、図１２に示すような画像処理毎（顔認識アプリケーションやナンバープレート識別アプリケーションなど毎）に代理実行可能な候補サーバＵＲＬのリストを含む画像音声処理代理実行候補サーバリスト１２００を保持してもよい。画像音声処理代理実行候補サーバリスト１１００と画像音声処理代理実行候補サーバリスト１２００の違いは、画像音声処理代理実行候補サーバリスト１２００は画像音声処理毎に画像音声処理を代理実行する候補サーバのＵＲＬを保持することである。

　画像音声処理装置１が画像音声処理代理実行候補サーバリスト１２００における現在対象とする画像処理に対応する候補サーバＵＲＬ群の先頭の候補サーバから順番に、代理実行が可能かを問い合わせていき、代理実行可能と回答した候補サーバを画像音声処理代理実行サーバ６として決定してもよい。例えば、画像処理が顔識別なら、候補サーバＵＲＬ群１２１０に含まれる候補サーバＵＲＬのうち、まず、画像音声処理装置１はＵＲＬが（ｈｔｔｐ：／／ａａａ．ｃｏ．ｊｐ／ｆａｃｅ．ｃｇｉ）の候補サーバに代理処理が可能かを問い合わせ、この候補サーバが代理実行不可能なら、次にＵＲＬが（ｈｔｔｐ：／／ｂｂｂ．ｃｏ．ｊｐ／ｆａｃｅ．ｃｇｉ）の候補サーバに代理処理が可能かを問い合わせる。ここでは選択した画像音声処理実行サーバは画像音声処理代理実行サーバ６とする。

　続いて、主制御部１００は、Ｓ８３０にて決定した画像音声処理代理実行サーバ６に対し、通信部３０から、画像処理の依頼通知を行う（Ｓ８４０）。この時、依頼通知だけでなく、画像処理に必要なパラメータを通知しても良い。

　最後に、主制御部１００は、Ｓ８２０で決定したエンコードパラメータセットＥを、エンコーダ部５０に設定する（Ｓ８５０）。決定したエンコードパラメータセットをエンコード部に設定することは、例えば、同じ画像処理を以降定期的に行う場合は、以降の処理でパラメータセット設定の手間が省ける。

　図９は、エンコードパラメータセット決定に関する流れを示すフローチャートである。

　例えば、画像音声処理装置１は通信部３０を介して、外部装置から、画像データを取得して、その画像データから特定の属性情報を抽出して抽出属性データを得るように指示を受ける（図示せず）。

　まず、主制御部１００は、画像取得部１０に対して画像データＰを取得するよう指示する（Ｓ９１０）。

　続いて、主制御部１００は、画像音声処理部７０に対し、Ｓ９１０で取得した画像データＰの画像処理を行う指示を出し、画像処理結果である抽出属性データＡを得る（Ｓ９２０）。

　主制御部１００は、画像処理に対応するエンコードパラメータセットを、対応テーブル１０００を参照して選択し、選択したエンコードパラメータセットＥＥをエンコーダに仮設定する（Ｓ９３０）。

　その仮設定したエンコードパラメータセットＥＥで画像データＰをエンコードして、エンコード画像データＰＥＥを得る（Ｓ９４０）。

　次に、エンコード画像データＰＥＥをデコードすることで画像データＰＤを得る（Ｓ９５０）。

　その画像データＰＤに対し、画像処理を行って画像処理結果である抽出属性データＡＤを得る（Ｓ９６０）。

　次に、主制御部１００は、Ｓ９２０で得た画像処理結果である抽出属性データＡと、ステップＳ９６０で得た画像処理結果である抽出属性データＡＤを比較する（Ｓ９７０）。比較した結果、同じ結果だと判断できた場合は、次のステップに進むが、同じ結果だと判断できなかった場合はＳ９３０に戻り、これまでに仮設定をしていないエンコードパラメータセットＥＥを仮設定した上で、Ｓ９３０～Ｓ９７０を再度実行する。例えば、画像処理の種類が顔識別である場合は、対応するエンコードパラメータセットグループ１０１０に含まれるエンコードパラメータセット１０３０、すなわち、（画像解像度、転送レート、・・・）＝（ＶＧＡ、１０００、・・・）を用いて画像処理を実施し、同じ結果だと判定できなかった場合は、別のエンコードパラメータセット１０４０、すなわち、（画像解像度、転送レート、・・・）＝（フルＨＤ、５０００、・・・）を用いて画像処理を実施する。

　エンコードパラメータセットを変更して画像処理を行う処理を、Ｓ９２０で得た画像処理結果である抽出属性データＡと、Ｓ９６０で得た画像処理結果である抽出属性データＡＤが同じ結果だと判断できるまで繰り返す。なお、すべてのエンコードパラメータセットで上記の比較をした結果、同じ抽出属性データが得ることができない場合はエラーを返してもよい。

　最後に、主制御部１００は、仮設定のエンコードパラメータセットＥＥを、本設定のエンコードパラメータセットＥＥとして、エンコーダ部５０に設定する（Ｓ９８０）。

　なお、図３～１２では、画像データを取得して、画像処理を行う例にて説明を行ったが、画像データを音声データに、画像処理を音声処理に置き換えれば、音声処理が可能である。

　（その他変形例）
　以上のように、本出願において開示する技術の例示として、実施の形態を説明した。しかしながら、本開示における技術は、これに限定されず、以下のような場合も本実施の形態に含まれる。

　（１）上記の各装置は、具体的には、マイクロプロセッサ、ＲＯＭ、ＲＡＭ、ハードディスクユニット、ディスプレイユニット、キーボード、マウスなどから構成されるコンピュータシステムであるとしてもよい。ＲＡＭまたはハードディスクユニットには、コンピュータプログラムが記憶されている。マイクロプロセッサが、コンピュータプログラムにしたがって動作することにより、各装置は、その機能を達成する。ここでコンピュータプログラムは、所定の機能を達成するために、コンピュータに対する指令を示す命令コードが複数個組み合わされて構成されたものである。

　（２）上記の各装置を構成する構成要素の一部または全部は、１個のシステムＬＳＩ（Ｌａｒｇｅ　Ｓｃａｌｅ　Ｉｎｔｅｇｒａｔｉｏｎ：大規模集積回路）から構成されているとしてもよい。システムＬＳＩは、複数の構成部を１個のチップ上に集積して製造された超多機能ＬＳＩであり、具体的には、マイクロプロセッサ、ＲＯＭ、ＲＡＭなどを含んで構成されるコンピュータシステムである。ＲＡＭには、コンピュータプログラムが記憶されている。マイクロプロセッサが、コンピュータプログラムにしたがって動作することにより、システムＬＳＩは、その機能を達成する。

　（３）上記の各装置を構成する構成要素の一部または全部は、各装置に脱着可能なＩＣカードまたは単体のモジュールから構成されているとしてもよい。ＩＣカードまたはモジュールは、マイクロプロセッサ、ＲＯＭ、ＲＡＭなどから構成されるコンピュータシステムである。ＩＣカードまたはモジュールは、上記の超多機能ＬＳＩを含むとしてもよい。マイクロプロセッサが、コンピュータプログラムにしたがって動作することにより、ＩＣカードまたはモジュールは、その機能を達成する。このＩＣカードまたはこのモジュールは、耐タンパ性を有するとしてもよい。

　（４）本実施の形態の処理装置は、上記に示す方法であるとしてもよい。また、これらの方法をコンピュータにより実現するコンピュータプログラムであるとしてもよいし、コンピュータプログラムからなるデジタル信号であるとしてもよい。

　また、本実施の形態の処理装置は、コンピュータプログラムまたはデジタル信号をコンピュータ読み取り可能な記録媒体、例えば、フレキシブルディスク、ハードディスク、ＣＤ－ＲＯＭ、ＭＯ、ＤＶＤ、ＤＶＤ－ＲＯＭ、ＤＶＤ－ＲＡＭ、ＢＤ（Ｂｌｕ－ｒａｙ（登録商標）　Ｄｉｓｃ）、半導体メモリなどに記録したものとしてもよい。また、これらの記録媒体に記録されているデジタル信号であるとしてもよい。

　また、本実施の形態の処理装置は、コンピュータプログラムまたはデジタル信号を、電気通信回線、無線または有線通信回線、インターネットを代表とするネットワーク、データ放送等を経由して伝送するものとしてもよい。

　また、本実施の形態の処理装置は、マイクロプロセッサとメモリを備えたコンピュータシステムであって、メモリは、上記コンピュータプログラムを記憶しており、マイクロプロセッサは、コンピュータプログラムにしたがって動作するとしてもよい。

　また、プログラムまたはデジタル信号を記録媒体に記録して移送することにより、またはプログラムまたはデジタル信号をネットワーク等を経由して移送することにより、独立した他のコンピュータシステムにより実施するとしてもよい。

　（５）上記実施の形態及び上記変形例をそれぞれ組み合わせるとしてもよい。

　本開示の処理装置は、圧縮符号化処理で使用される適切なパラメータセットを決定することができる装置等、例えば、監視装置として有用である。

　１　　画像音声処理装置
　４　　映像音声データ受信サーバ
　５　　画像音声処理データ受信サーバ
　６　　画像音声処理代理実行サーバ
　７　　処理システム
　１０　　画像取得部
　２０　　音声取得部
　３０　　通信部
　４０　　代理実行サーバ決定部
　５０　　エンコーダ部
　６０　　デコーダ部
　７０　　画像音声処理部
　８０　　リソース使用量計算部
　１００　　主制御部
　１１０　　エンコードされた映像音声データ
　１２０　　抽出属性データ
　１３０　　エンコードされた映像音声データ
　１４０　　抽出属性データ
　１０００　　対応テーブル
　１０１０　　エンコードパラメータセットグループ
　１０２０　　エンコードパラメータセットグループ
　１０３０　　エンコードパラメータセット
　１０４０　　エンコードパラメータセット
　１０５０　　エンコードパラメータ
　１０６０　　エンコードパラメータ
　１１００　　画像音声処理代理実行候補サーバリスト
　１１１０　　候補サーバＵＲＬ群
　１２００　　画像音声処理代理実行候補サーバリスト
　１２１０　　候補サーバＵＲＬ群

Claims

　第１の非圧縮情報を第１のパラメータセットに基づいて圧縮符号化し、第１の圧縮符号化情報を出力するエンコーダと、
　前記第１の圧縮符号化情報を非圧縮符号化し、第２の非圧縮情報を出力するデコーダと、
　前記第１の非圧縮情報に属性抽出処理を行い、抽出した属性情報である第１抽出属性データを出力し、前記第２の非圧縮情報に前記属性抽出処理を行い、抽出した属性情報である第２抽出属性データを出力する画像音声処理部と、
　前記第１抽出属性データと前記第２抽出属性データが等しければ、前記第１のパラメータセットを確定パラメータセットとして決定する制御部を含む
　処理装置。
　前記確定パラメータセットの決定は、前記属性抽出処理を実施すると前記処理装置のハードウエア資源の使用量がハードウエア資源の最大使用許容量を超過すると前記制御部が推定した後に実施される
　請求項１記載の処理装置。
　前記画像音声処理部は複数の属性抽出処理の各々に対応するエンコードパラメータセットグループを示す対応テーブルを保持し、
　前記エンコードパラメータセットグループの各々は複数のエンコードパラメータセットを含み、
　前記複数のエンコードパラメータセットの各々は１以上のエンコードパラメータを含み、
　前記複数の属性抽出処理は前記属性抽出処理を含み、
　前記複数のエンコードパラメータセットは前記第１のパラメータセットを含む
　請求項２記載の処理装置。
　前記第１抽出属性データと前記第２抽出属性データが等しくなければ、前記エンコーダは、前記第１のパラメータセットに代えて、前記属性抽出処理に対応するエンコードパラメータセットグループに含まれる複数のパラメータセットであり、前記第１のパラメータセット以外のパラメータセットである第２のパラメータセットに基づいて、前記第１の非圧縮情報を圧縮符号化し、第２の圧縮符号化情報を出力し、
　前記デコーダは前記第２の圧縮符号化情報を非圧縮符号化し、第３の非圧縮情報を出力し、
　前記画像音声処理部は前記第３の非圧縮情報から抽出した属性情報である第３抽出属性データを出力し、
　前記制御部は前記第１抽出属性データと前記第３抽出属性データが等しければ、前記第２のパラメータセットを確定パラメータセットとして決定する
　請求項３記載の処理装置。
　前記処理装置は代理実行サーバ決定部を含み、
　前記代理実行サーバ決定部は前記エンコーダが前記確定パラメータセットに基づいて第４の非圧縮情報を圧縮符号化した第３の圧縮符号化情報に対する前記属性抽出処理を前記処理装置に代わって行う画像音声処理代理サーバの候補サーバを含む候補リストを保持し、
　前記候補リストに含まれる前記候補サーバに前記属性抽出処理の実行が可能かの問い合わせを行い、
　前記処理装置は前記第１の非圧縮情報を取得した後に、前記第４の非圧縮情報を取得する
　請求項４記載の処理装置。
　前記処理装置以外の装置である外部装置は、第４の非圧縮情報を前記確定パラメータセットに基づいて圧縮符号化された第３の圧縮符号化情報に対する前記属性抽出処理を前記処理装置に代わって行う画像音声処理代理サーバの候補サーバを含む候補リストを保持し、前記外部装置は前記候補リストに含まれる前記候補サーバに前記属性抽出処理の実行が可能かの問い合わせを行い、
　前記処理装置は前記第１の非圧縮情報を取得した後に、前記第４の非圧縮情報を取得する
　請求項４記載の処理装置。
　前記候補リストは複数の属性抽出処理の各々に対応する候補サーバ情報を含み、
　前記候補サーバ情報で特定される候補サーバは対応する属性抽出処理を前記処理装置に代わって行う画像音声処理代理サーバの候補サーバである
　請求項５記載の処理装置。
　前記属性抽出処理は顔識別処理であり、
　前記属性情報は性別、年齢区分の少なくとも１つを含み、
　前記第１のパラメータセットは画像解像度を含む
　請求項７記載の処理装置。
　第１の非圧縮情報を第１のパラメータセットに基づいて圧縮符号化し、第１の圧縮符号化情報を出力するエンコーダと、
　前記第１の圧縮符号化情報を非圧縮符号化し、第２の非圧縮情報を出力するデコーダと、
　前記第１の非圧縮情報に属性抽出処理を行い、抽出した属性情報である第１抽出属性データを出力し、前記第２の非圧縮情報に前記属性抽出処理を行い、抽出した属性情報である第２抽出属性データを出力する画像音声処理部と、
　前記第１抽出属性データと前記第２抽出属性データが等しければ、前記第１のパラメータセットを確定パラメータセットとして決定する制御部を含む
　集積回路。
　第１の非圧縮情報を第１のパラメータセットに基づいて圧縮符号化し、第１の圧縮符号化情報を出力するステップと、
　前記第１の圧縮符号化情報を非圧縮符号化し、第２の非圧縮情報を出力するステップと、
　前記第１の非圧縮情報に属性抽出処理を行い、抽出した属性情報である第１抽出属性データを出力し、前記第２の非圧縮情報に前記属性抽出処理を行い、抽出した属性情報である第２抽出属性データを出力するステップと、
　前記第１抽出属性データと前記第２抽出属性データが等しければ、前記第１のパラメータセットを確定パラメータセットとして決定するステップを含む
　処理方法。
　請求項１０記載の処理方法をコンピュータに実行させるためのプログラム。