JP2016129269A - 画像・音声処理装置、集積回路、およびプログラム - Google Patents

画像・音声処理装置、集積回路、およびプログラム Download PDF

Info

Publication number
JP2016129269A
JP2016129269A JP2013089026A JP2013089026A JP2016129269A JP 2016129269 A JP2016129269 A JP 2016129269A JP 2013089026 A JP2013089026 A JP 2013089026A JP 2013089026 A JP2013089026 A JP 2013089026A JP 2016129269 A JP2016129269 A JP 2016129269A
Authority
JP
Japan
Prior art keywords
image
processing
sound
data
sound processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013089026A
Other languages
English (en)
Inventor
本坂 錦一
Kinichi Motosaka
錦一 本坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Original Assignee
Panasonic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp filed Critical Panasonic Corp
Priority to JP2013089026A priority Critical patent/JP2016129269A/ja
Priority to PCT/JP2014/001811 priority patent/WO2014174763A1/ja
Priority to US14/251,722 priority patent/US20140313327A1/en
Publication of JP2016129269A publication Critical patent/JP2016129269A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • H04N7/181Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a plurality of remote sources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast

Abstract

【課題】自装置での画像・音声処理の結果と同じになるように、外部装置で画像・音声処理ができること。【解決手段】画像・音声処理装置は、画像・音声取得部と、画像・音声処理部と、新規に画像・音声処理を実施する際に、画像・音声処理が実施可能かどうかを判定する画像・音声処理実施判定部と、画像・音声処理実施判定部が実施不可能と判定した場合、外部装置で画像・音声処理を行った結果と自機器で画像・音声処理を行った結果が同じになるように圧縮符号化のパラメータを計算するエンコードパラメータ計算部と、エンコーダ部と、画像・音声処理を代理実行する装置を決定する代理実行装置決定部と、代理実行装置決定部が決定した装置にエンコードデータを送る通信部と、を備える。【選択図】図2

Description

本発明は、画像処理、もしくは、音声処理を行う時のデータを送信する装置に関するものである。
監視カメラは、他の画像を処理する機器同様、デジタル処理化が進んでいる。デジタル化された監視カメラは、カメラで撮影した映像をエンコードすることで、データ量が削減されたエンコードデータを生成し、前記のエンコードデータをIPネットワークにて送る、という動作を行う。
一方、監視カメラで撮影する映像の解像度について、VGA(Video Graphics Array)からHD(High Definition)、フルHD、4K2Kと急激に高解像度化しているため、エンコードによってデータ量を削減しても、ネットワーク帯域やサーバの記憶領域に対する負荷が大きくなっており、データ量のさらなる削減が求められている。
前述のような理由から、映像や音声そのものを送るのではなく、監視カメラ自体で画像処理や音声処理を行い、その処理結果のみを送る、もしくは、その処理結果とその処理結果に有意な情報を見つけた時の映像・音声情報を送る、という機能を持つ監視カメラが徐々に製品化されている。これまでの一般的な監視カメラは、映像・音声を送信する機能のみであったが、今後、監視カメラは、画像・音声処理機能を持つのが一般的になってくると想像される。
画像処理、音声処理は、複雑な処理であることが多いので、CPU能力やメモリ量、専用回路など多量のハードウェア資源を必要とすることが多い。このため、監視カメラが持つ限られたハードウェア資源で、複数の画像処理、もしくは、音声処理を実行させようとする時、ハードウェア資源の不足により、画像処理、音声処理が実施できないことがある。このため、ハードウェアの一時的な能力不足や不備などにより、画像処理が出来ない場合は、外部機器に画像を送信して一旦保存した後に、ハードウェアの能力不足や不備が解消した時に画像処理を実施する医用画像システムが知られている(例えば、特許文献1参照)。
特開2008−228898号公報
しかしながら、上記特許文献1の技術を利用した場合、一時的なハードウェアの能力不足や不備などにより、画像処理が出来ない場合に、外部機器に送信する画像は医用画像とのみ書かれているが、その医用画像が非圧縮の画像データか、圧縮符号化されたデータかなのかが不明である。
もし、対象となる医用画像が非圧縮の画像データとした場合、その非圧縮のデータ量は非常に大きいため、監視カメラが用いるIPネットワークに送信するのは困難であり、圧縮符号化をした画像データを送信する必要がある。このため、上記特許文献1の技術では画像データの圧縮符号化する手段が存在しないため、監視カメラに、この技術を用いるのは困難である。
また、対象となる医用画像が圧縮符号化された画像データとした場合、一旦圧縮符号化された画像データは情報が欠落するため、圧縮符号化のパラメータの設定によっては、圧縮符号化しない画像を画像処理した結果と圧縮符号化した後の画像を画像処理した結果が異なる場合がある。このため、圧縮符号化する際のパラメータとして、それらの画像処理結果が異ならないようにする必要があり、この面でも、上記特許文献1の技術を用いることは困難である。
さらに、上記特許文献1の技術は、画像処理が出来なかった画像データに対しハードウェアの能力不足や不備が解消した時に行うものとしているが、監視カメラでは、他の画像処理が常時動作して、一時的なハードウェア能力不足が解消しない可能性がある。このことから、監視カメラでは、ハードウェア能力不足が解消しない場合の対策も必要である。
本発明は、前記従来の課題を解決するもので、一時的なハードウェア能力不足のため、画像処理や音声処理が出来なかった場合、そのハードウェア自身で画像処理、音声処理を実施した結果と、外部機器で画像処理、音声処理を実施した結果が同じとなるように、外部機器で画像処理、音声処理を代理で実行できることを目的とする。
前記従来の課題を解決するために、本発明の画像・音声処理装置は、画像処理や音声処理の実施を試みた際に、ハードウェア資源が不足した場合には、外部機器で画像処理や音声処理が可能なデータを送信する画像・音声処理装置であって、画像データ、もしくは、音声データの取得を行う画像・音声取得部と、前記画像・音声取得部で取得された画像データ、もしくは、音声データに対し、画像処理、もしくは、音声処理を行う画像・音声処理部と、新規に画像処理や音声処理を実施する際に、ハードウェア資源が不足しないかどうかを計算するリソース使用量計算部と、前記リソース使用量計算部においてハードウェア資源が不足すると計算された時に、外部機器で画像処理、もしくは、音声処理で行うための圧縮符号化のパラメータを計算するエンコードパラメータ計算部と、前記画像・音声取得部で取得された画像データ、もしくは、音声データに対し、前記エンコードパラメータ計算部で計算された圧縮符号化のパラメータにより圧縮符号化処理を行うエンコーダ部と、前記エンコーダ部で圧縮符号化を行われたデータを外部機器に送信する通信部とを備える。
本構成によって、一時的なハードウェア能力不足のため、画像処理や音声処理が出来なかった場合、そのハードウェア自身で画像処理、音声処理を実施した結果と、外部機器で画像処理、音声処理を実施した結果が同じとなるように、外部機器で画像処理、音声処理を代理で実行できる。
本発明の画像・音声処理装置によれば、一時的なハードウェア能力不足のため、画像処理や音声処理が出来なかった場合、そのハードウェア自身で画像処理、音声処理を実施した結果と、外部機器で画像処理、音声処理を実施した結果が同じとなるように、外部機器で画像処理、音声処理を代理で実行できる。
本発明の実施の形態1における画像・音声処理装置1が利用されるシステム全体構成図 本発明の実施の形態1における画像・音声処理装置1の構成図 本発明の実施の形態1における主制御部100がエンコードされた画像データを外部機器に送信する動作フローを示す図 本発明の実施の形態1における主制御部100が画像処理されたデータを外部機器に送信する動作フローを示す図 本発明の実施の形態1における画像・音声処理装置1がCPU使用量に応じて、送信するデータの種類を変更する方法についての概要を示した図 本発明の実施の形態1において、画像・音声処理装置1で画像処理Cを行った結果と、画像・音声処理代理実行サーバ6で画像処理Cを行った結果が異なることがあることを説明した図 本発明の実施の形態1における主制御部100が、自機器で画像処理の実行、もしくは、外部機器で画像処理の代理実行に関する動作フローを示す図 本発明の実施の形態1における主制御部100が、画像処理の外部機器に代理実行判断に関する動作フローを示す図 本発明の実施の形態1における主制御部100が、画像処理の外部機器での代理実行時の送信エンコード画像のエンコードパラメータを計算する動作フローを示す図
以下、本発明の実施の形態について、図面を参照しながら説明する。
(実施の形態1)
図1は、本発明の実施の形態1における画像・音声処理装置が利用されるシステムの全体構成図を示したものである。システムの全体構成は、画像・音声処理装置1と、映像・音声データ受信サーバ4と、画像・音声処理データ受信サーバ5と、画像・音声処理代理実行サーバ6とからなる。
画像・音声処理装置1は、カメラやマイクなどの入力デバイスから画像・音声データを取得した後、それらのデータに対して何らかの加工を施して、外部の機器に出力する装置である。詳細には、画像・音声処理装置1は、カメラやマイクから画像・音声データを取得して、それらのデータをエンコードし、それらのエンコードしたデータを映像・音声データ受信サーバ4に出力する装置である。あるいは、画像・音声処理装置1は、カメラやマイクから画像・音声データを取得して、それらのデータを画像・音声処理して、画像・音声処理データ受信サーバ5に出力する装置であり、あるいは、画像・音声処理装置1は、カメラやマイクから画像・音声データを取得して、それらのデータをエンコードし、それらのデータを画像・音声処理代理実行サーバ6に出力する装置である。
映像・音声データ受信サーバ4は、画像・音声処理装置1が送信したエンコードされた映像・音声データを受信する装置である。映像・音声データ受信サーバ4は、受信したエンコードされた映像・画像データを、デコードを行ってディスプレイ上に表示することができる。また、映像・音声データ受信サーバ4は、受信したエンコードされた映像・画像データを、映像・音声データ受信サーバ4に内蔵、あるいは接続されている記録デバイスにそのまま書き込みを行うことができる。
画像・音声処理データ受信サーバ5は、画像・音声処理装置1、もしくは、画像・音声処理代理実行サーバ6が送信した画像・音声処理データを受信する装置である。画像・音声処理データ受信サーバ5は、受信した画像・音声処理データを、ディスプレイ上に表示することができる。また、画像・音声処理データ受信サーバ5は、受信した画像・音声処理データを、画像・音声処理データ受信サーバ5内蔵、あるいは接続されている記録デバイスに書き込みを行うことができる。もしくは、記録デバイスに蓄積しておいた複数の画像・音声処理データを解析して、その結果をディスプレイ上に表示することができる。
画像・音声処理代理実行サーバ6は、画像・音声処理装置1が送信したエンコードされた映像・音声データを受信して、画像・音声処理装置1の代理で画像・音声処理を行う装置である。画像・音声処理を行った結果である画像・音声処理データは、画像・音声処理データ受信サーバ5に送信する。
なお、図1では、映像・音声データ受信サーバ4、画像・音声処理データ受信サーバ5、画像・音声処理代理実行サーバ6を、個別のサーバとして記述しているが、これらのサーバで実施している機能は、1つのサーバで行っても良いし、複数のサーバで分担して行っても良い。また、これらの機能は、他の画像・音声処理装置で持っても良い。
図2は、画像・音声処理装置1の構成図である。画像・音声処理装置1は、画像取得部10と、音声取得部20と、通信部30と、代理実行サーバ決定部40と、エンコーダ部50と、デコーダ部60と、画像・音声処理部70と、リソース使用量計算部80と、主制御部100とを備える。
画像取得部10は、カメラを備えていて、カメラ内で撮影された画像データを取得する。もしくは、アナログビデオ端子、HDMI(登録商標)(High Definition Multimedia Interface)端子などの映像入力端子を備えていて、別の装置から送出された映像を受信して、画像データを取得する。もしくは、イーサーネットなどのネットワーク端子を備えており、ネットワーク経由で送信された映像データを受信して、場合によっては映像データのデコードを行い、画像データを取得する。なお、取得した画像データは、YC形式、RGB形式、RAW形式などの無圧縮の画像データとして出力する。
音声取得部20は、マイクを備えていて、マイクに入力された音声データを取得する。もしくは、アナログ音声端子、HDMI(登録商標)端子などの音声入力端子を備えていて、別の装置から送出された音声を受信して、音声データを取得する。もしくは、イーサーネットなどのネットワーク端子を備えていて、別の装置から送出された音声データを受信して、場合によっては音声データのデコードを行い、音声データを取得する。なお、取得した音声データは、ビットストリーム形式などの、無圧縮の音声データとして出力する。
通信部30は、イーサーネットや、Bluetooth(登録商標)、NFC(Near Field Communication)などのネットワーク端子を通して、外部の機器とデータの送受信を行う手段である。
代理実行サーバ決定部40は、画像処理、もしくは、音声処理を画像・音声処理装置1に代わって実行する画像・音声処理代理実行サーバを決定する手段である。決定する方法としては、予め代理実行サーバ決定部40内に持つ画像・音声処理代理実行サーバのリストから選択する方法がある。その他に、画像・音声処理装置1の外部にある画像・音声処理代理実行サーバの検索サーバに検索を行う方法がある。
エンコーダ部50は、RAW形式やRGB形式やYCbCr形式などの無圧縮の画像データを、MPEG1/2/4、H.264、JPEG、JPEG2000のような任意の画像圧縮方式により、符号化を行う手段である。もしくは、ビットストリームなどの無圧縮の音声データを、MP3、AC3、AACなどの任意の音声圧縮方式で符号化を行う手段である。
デコーダ部60は、MPEG1/2/4、H.264、JPEG、JPEG2000などの任意の画像圧縮方式で符号化された画像データを、RAW形式やRGB形式やYCbCr形式などの無圧縮の画像データに復号化する手段である。もしくは、MP3、AC3、AACなどの任意の音声圧縮方式で符号化された音声データを、ビットストリームなどの無圧縮の音声データに復号化する手段である。
画像・音声処理部70は、画像取得部10で取得した画像データや、デコーダ部60で復号化された画像データや、エンコーダ部50により符号化された画像データに対して、画像処理を行う手段である。もしくは、音声取得部20で取得した音声データや、デコーダ部60で復号化された音声データや、エンコーダ部50により符号化された音声データに対し、音声解析を行う手段である。
リソース使用量計算部80は、画像・音声処理装置1のCPUや、RAM、記録媒体、ネットワークなど各種デバイスの単位時間当りの使用量を計算する手段である。もしくは、それら各種デバイスの単位時間当りの使用率を計算する手段である。
主制御部100は、画像取得部10、音声取得部20、通信部30、代理実行サーバ決定部40、エンコーダ部50、デコーダ部60、画像・音声処理部70、リソース使用量計算部80を制御して、一連の処理を実現する手段である。例えば、画像取得部10で取得した画像データや、音声取得部20で取得した音声データを、エンコーダ部50で符号化した後、通信部30で映像・音声データ受信サーバ4に送信する制御を行う。もしくは、画像取得部10で取得した画像データや、音声取得部20で取得した音声データを、画像・音声処理部70で画像処理、もしくは、音声処理を行い、その解析結果を通信部30で画像・音声処理データ受信サーバ5に送信する制御を行う。もしくは、画像処理、もしくは、音声処理出来ない場合に、代理実行サーバ決定部40で決定した画像・音声処理代理実行サーバ6に対して代理実行を依頼すると共に、画像・音声処理代理実行サーバ6で画像処理、音声処理を実行した結果と、画像・音声処理装置1で画像処理、音声処理を実施した結果が同じになるようにエンコードパラメータを計算して、画像取得部10で取得した画像データや、音声取得部20で取得した音声データを、前述のエンコードパラメータを用いてエンコーダ部50で符号化した後、通信部30で、画像・音声処理代理実行サーバ6に送信する制御を行う。
図3は、画像データをエンコードして、そのエンコードしたデータを外部に送信するという一連の動作を、主制御部100が制御する流れを示したフローチャートである。
まず、主制御部100は、画像取得部10に画像データPの取得を指示する。指示を受けた画像取得部10は、画像取得部10内に備えるカメラ、もしくは、外部映像入力端子などの画像入力デバイスから、画像データPを取得する(ステップS310)。
続いて、主制御部100は、ステップS310で取得した画像データPを符号化することをエンコーダ部50に指示する。指示を受けたエンコーダ部50は、画像データPを、H.264など任意の画像圧縮方式により符号化を行い、エンコード画像データP’を得る(ステップS320)。
最後に、主制御部100は、ステップS320で取得したエンコード画像データP’を任意の外部機器へ送信することを通信部30に指示する。指示を受けた通信部30は、エンコード画像データP’を、任意の外部機器が受信可能なプロトコル、例えば、HTTP(Hyper Text Transfer Protocol)や、RTP(Realtime Transfer Protocol)、を使って、外部機器へ送信を行う(ステップS330)。
図4は、画像データを画像処理して、その処理結果データを外部に送信するという一連の動作を、主制御部100が制御する流れを示したフローチャートである。
まず、主制御部100は、画像取得部10に画像データの取得を指示する。指示を受けた画像取得部10は、画像取得部10内に備えるカメラ、もしくは、外部映像入力端子などの画像入力デバイスから、画像データPを取得する(ステップS410)。
続いて、主制御部100は、ステップS410で取得した画像データPの画像処理を画像・音声処理部70に指示する。指示を受けた画像・音声処理部70は、画像データPに対し、顔識別処理、ナンバープレート認識処理など、任意の方式の画像処理を行い、画像処理結果Aを得る(ステップS420)。
最後に、主制御部100は、ステップS420で取得した画像処理結果Aを任意の外部機器へ送信することを通信部30に指示する。指示を受けた通信部30は、画像処理結果Aを、任意の外部機器が受信可能なプロトコル、例えば、HTTP(Hyper Text Transfer Protocol)や、FTP(File Transfer Protocol)や、SMTP(Simple Mail Transfer Protocol)などを使って、外部機器へ送信を行う(ステップS430)。
図5は、本発明の実施の形態1における画像・音声処理装置が、CPU使用量に応じて、送信するデータの種類を変更する方法についての概要を示した図である。
まず、画像・音声処理装置1は、画像処理Aと画像処理Bを動作させており、その2つのCPU使用量の総計はCPU最大使用量を下回っていて、遅延がない状態で2つの画像処理が実施している。なお、画像処理は、通常、YC形式やRGB形式などの無圧縮のデータ形式が行われることがほとんどであるため、ここでは、画像処理Aと画像処理Bともに、YC形式で画像処理が行われるとしている。
次に、画像・音声処理装置1は、画像処理Cを新たに動作させようとする(ステップS510)。この時、画像・音声処理装置1は、現在のCPU使用量と画像処理CのCPU使用量予測値の合計が、CPU最大使用量を超過していないかを確認する。超過していなければ、画像処理Cを開始する。超過していれば、画像処理Cを開始しても期待通りに動作しない可能性が高いと判断し、画像・音声処理装置1は、外部機器で画像処理Cを代理実行することを判断する。
続いて、画像・音声処理装置1は、画像処理Cを代理実行できる画像・音声処理代理実行サーバ6を探索する。そして、探索できた画像・音声処理代理実行サーバ6に対して、画像処理Cの実行を依頼する(ステップS520)。探索の方法としては、画像・音声処理装置1内に、予め画像処理Cの代理実行が可能な画像・音声処理代理実行サーバのリストを持っておき、そのリストの先頭から順番に画像処理Cの代理実行が可能かを問い合わせていき、代理実行可能と回答した画像・音声処理代理実行サーバの中から選択する方法でもよいし、画像処理Cの代理実行が可能な画像・音声処理代理実行サーバを教えるサーバへの問い合わせにより探索する方法などでもよい。なお、画像処理Cの代理実行を依頼された画像・音声処理代理実行サーバ6は、画像処理Cを実行するための準備を行う。
続いて、画像・音声処理装置1は、画像処理Cの代理実行処理を開始する。画像・音声処理装置1にとって、画像処理Cの代理実行処理とは、画像・音声処理代理実行サーバ6で画像処理Cを実行するために必須である画像データを、画像・音声処理代理実行サーバ6に送信することである。通常、画像処理CはYCデータ形式の画像データを用いて実施されるため、YCデータ形式のデータを画像・音声処理代理実行サーバ6に送信するのがよい。しかし、YCデータ形式の画像データは容量が大きいため、ネットワークを用いた送信には向いていない。このため、YCデータ形式の画像データをそのまま送るのではなく、その画像データを一旦、画像圧縮符号化して送信する(ステップS530)。画像・音声処理代理実行サーバ6は、画像圧縮符号化された画像データを受信して、その画像データを復号化してYCデータ形式の画像データに戻し、画像処理Cを実行する。
この時、画像圧縮符号化時のパラメータによっては、画像・音声処理装置1で画像処理Cを行った結果と、画像・音声処理代理実行サーバ6で画像処理C行った結果が異なることがある。このことを説明する図が、図6である。図6(a)は、画像・音声処理装置1で画像処理Cを行い、画像処理結果データA1を得ることを示したものである。画像・音声処理装置1は、画像取得部10で取得したYCデータD1に対し、画像処理Cを行って、画像処理結果データA1を得る。図6(b)は、画像・音声処理装置1で画像処理Cを実施せず、画像・音声処理代理実行サーバ6で画像処理Cを代理実行することを示したものである。画像・音声処理装置1は、画像取得部10にてYCデータD1の取得を行った後、そのデータを画像圧縮符号化(エンコード)して、画像・音声処理代理実行サーバ6に送る。画像・音声処理代理実行サーバ6は、受け取ったデータを復号化(デコード)してYCデータD2を取り出した後、画像処理Cを行い、画像処理結果データA2を得る。ここで、YCデータD1を画像圧縮符号化(エンコード)した後に、符号化(デコード)して取り出したデータであるYCデータD2は、画像圧縮符号化によるデータ欠落があるため、同一のものではない。このため、YCデータD1に対し画像処理Cを実施した結果である画像処理結果データA1と、YCデータD2に対し画像処理Cを実施した結果である画像処理結果データA2は、同じではないことがある。しかし、解像度、圧縮率、圧縮方法など画像圧縮符号化のパラメータを調整することで、画像処理結果データをほぼ同一にすることは可能である。このため、画像・音声処理装置1は、画像処理結果が同じになる画像圧縮パラメータで画像圧縮符号化処理を行う必要がある。
続いて、画像・音声処理代理実行サーバ6は、画像・音声処理装置1が送信した画像圧縮符号化された画像データを受信する。そして、その画像データを復号化して、YCデータ形式の画像データを取り出し、画像処理Cを行う(ステップS540)。画像処理Cを行った結果である画像処理結果データは、画像・音声処理代理実行サーバ6自身で保持するか、もしくは、画像・音声処理データ受信サーバ5へ送信する。
図7は、画像処理を画像・音声処理代理実行サーバ6で代理実行するかを判断した後、画像・音声処理代理実行サーバ6で代理実行する場合は画像データをエンコードして外部機器に送信し、代理実行しない場合は画像処理を行ってその処理結果を、画像・音声処理代理実行サーバ6に送信する一連の動作を、主制御部100が制御する流れを示したフローチャートである。
まず、主制御部100は、画像処理を、画像・音声処理代理実行サーバ6で代理実行するかどうかの判断を行う(ステップS710)。次に、主制御部100は、ステップS710で判断した結果を判断して処理を分岐させる(ステップS720)。もし、画像処理を画像・音声処理代理実行サーバ6で代理実行すると判断した場合には、エンコード画像を生成して、画像・音声処理代理実行サーバ6にエンコード画像を送信する処理を行う(ステップS730)。なお、ステップS730の詳細シーケンスは、図4に示すステップS400のシーケンスとなる。
もし、画像処理を画像・音声処理代理実行サーバ6で代理実行しないと判断した場合には、画像・音声処理装置1内で画像処理を行い、画像処理結果を画像・音声処理データ受信サーバ5へ送信する(ステップS740)。なお、ステップS740の詳細シーケンスは、図5に示すステップS500のシーケンスとなる。
図8は、画像・音声処理代理実行サーバ6での画像処理の代理実行の判断方法の一連の詳細動作を、主制御部100が制御する流れを示したフローチャートである。
まず、主制御部100は、リソース使用量計算部80からリソース使用量を取得して、取得したリソース使用量とこれから動作させる画像処理のリソース使用量の総計がリソース使用量の最大値が超えていないかを確認する(ステップS810)。もし、超えていない場合は、このフローチャートを終了し、超えている場合は次のステップに移行する。ここで、リソース量とは、CPU使用量や、RAM使用量、記録領域使用量などがある。
次に、主制御部100は、送信する画像データをエンコードする際のエンコードパラメータEを計算する(ステップS820)。ここで、エンコードパラメータEは、画像・音声処理装置1で画像処理を行った画像処理結果と、画像・音声処理代理実行サーバ6が画像・音声処理装置1から受信した画像を用いて画像処理を行った結果が同じとなるように計算される。なお、ステップS820の詳細シーケンスは、図9にて説明する。
次に、主制御部100は、代理実行サーバ決定部40に、画像処理の代理実行する画像・音声処理代理実行サーバ6を決定するように指示する(ステップS830)。ここで、代理処理するサーバを決定する方法としては、予め実行の代理実行が可能な画像・音声処理代理実行サーバのリストを持っておき、そのリストの先頭から順番に画像処理Cの代理実行が可能かを問い合わせていき、代理実行可能と回答した画像・音声処理代理実行サーバの中から決定する方法でもよいし、画像処理Cの代理実行が可能な画像・音声処理代理実行サーバを教えるサーバへの問い合わせにより決定する方法などでもよい。もしくは、予め、画像処理毎の画像・音声処理代理実行サーバ6のリストを持っておき、画像処理の種類によって画像・音声処理代理実行サーバ6を決定してもよい。
続いて、主制御部100は、ステップS830にて決定した画像・音声処理代理実行サーバ6に対し、通信部30から、画像処理の依頼通知を行う(ステップS840)。この時、依頼通知だけでなく、画像処理に必要なパラメータも渡しても良い。
最後に、主制御部100は、ステップS820で計算したエンコードパラメータEを、エンコーダ部50に設定する(ステップS850)。
図9は、主制御部100が画像・音声処理代理実行サーバ6での代理実行時にエンコードパラメータEを計算する一連の詳細動作を、主制御部100が制御する流れを示したフローチャートである。
まず、主制御部100は、画像取得部10に対して画像データPを取得するよう指示する(ステップS910)。
続いて、主制御部100は、画像・音声処理部70に対し、ステップS910で取得した画像データPの画像処理を行う指示を出し、画像処理結果Aを得る(ステップS920)。
同時に、主制御部100は、ステップS910で取得した画像データPを、エンコードパラメータEEを仮設定し(ステップS930)、その仮設定したエンコードパラメータEEでエンコードを実施して、エンコード画像データPEEを得る(ステップS940)。次に、エンコード画像データPEEをデコードすることで画像データPDを得て(ステップS950)、その画像データPDに対し、画像処理を行って画像処理結果ADを得る(ステップS960)。
次に、主制御部100は、ステップS920で得た画像処理結果Aと、ステップS960で得た画像処理結果ADを比較する(ステップS970)。比較した結果、同じ結果だと判断できた場合は、次のステップに進むが、同じ結果だと判断できなかった場合はステップS930に戻り。これまでに仮設定をしていないエンコードパラメータEEを仮設定した上で、ステップS930〜ステップS970を再度実行する。これを、ステップS920で得た画像処理結果Aと、ステップS960で得た画像処理結果ADが同じ結果だと判断できるまで繰り返す。
最後に、主制御部100は、仮設定のエンコードパラメータEEを、本設定のエンコードパラメータEEとして、エンコーダ部50に設定する(ステップS980)。
なお、図3〜8では、画像データを取得して、画像処理を行う例にて説明を行ったが、画像データを音声データに、画像処理を音声処理に置き換えれば、音声処理に関する説明となる。
(その他変形例)
なお、本発明を上記実施の形態に基づいて説明してきたが、本発明は、上記の実施の形態に限定されないのはもちろんである。以下のような場合も本発明に含まれる。
(1)上記の各装置は、具体的には、マイクロプロセッサ、ROM、RAM、ハードディスクユニット、ディスプレイユニット、キーボード、マウスなどから構成されるコンピュータシステムである。前記RAMまたはハードディスクユニットには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、各装置は、その機能を達成する。ここでコンピュータプログラムは、所定の機能を達成するために、コンピュータに対する指令を示す命令コードが複数個組み合わされて構成されたものである。
(2)上記の各装置を構成する構成要素の一部または全部は、1個のシステムLSI(Large Scale Integration:大規模集積回路)から構成されているとしてもよい。システムLSIは、複数の構成部を1個のチップ上に集積して製造された超多機能LSIであり、具体的には、マイクロプロセッサ、ROM、RAMなどを含んで構成されるコンピュータシステムである。前記RAMには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、システムLSIは、その機能を達成する。
(3)上記の各装置を構成する構成要素の一部または全部は、各装置に脱着可能なICカードまたは単体のモジュールから構成されているとしてもよい。前記ICカードまたは前記モジュールは、マイクロプロセッサ、ROM、RAMなどから構成されるコンピュータシステムである。前記ICカードまたは前記モジュールは、上記の超多機能LSIを含むとしてもよい。マイクロプロセッサが、コンピュータプログラムにしたがって動作することにより、前記ICカードまたは前記モジュールは、その機能を達成する。このICカードまたはこのモジュールは、耐タンパ性を有するとしてもよい。
(4)本発明は、上記に示す方法であるとしてもよい。また、これらの方法をコンピュータにより実現するコンピュータプログラムであるとしてもよいし、前記コンピュータプログラムからなるデジタル信号であるとしてもよい。
また、本発明は、前記コンピュータプログラムまたは前記デジタル信号をコンピュータ読み取り可能な記録媒体、例えば、フレキシブルディスク、ハードディスク、CD−ROM、MO、DVD、DVD−ROM、DVD−RAM、BD(Blu−ray(登録商標) Disc)、半導体メモリなどに記録したものとしてもよい。また、これらの記録媒体に記録されている前記デジタル信号であるとしてもよい。
また、本発明は、前記コンピュータプログラムまたは前記デジタル信号を、電気通信回線、無線または有線通信回線、インターネットを代表とするネットワーク、データ放送等を経由して伝送するものとしてもよい。
また、本発明は、マイクロプロセッサとメモリを備えたコンピュータシステムであって、前記メモリは、上記コンピュータプログラムを記憶しており、前記マイクロプロセッサは、前記コンピュータプログラムにしたがって動作するとしてもよい。
また、前記プログラムまたは前記デジタル信号を前記記録媒体に記録して移送することにより、または前記プログラムまたは前記デジタル信号を前記ネットワーク等を経由して移送することにより、独立した他のコンピュータシステムにより実施するとしてもよい。
(5)上記実施の形態及び上記変形例をそれぞれ組み合わせるとしてもよい。
本発明の画像・音声処理装置は、ハードウェア資源の不足などにより、自機器で画像処理や音声処理が実施できない時、外部機器で画像処理や音声処理が可能なデータを送信することで、自身で画像処理や音声処理を行った時と同じ結果になるように、外部機器で画像処理や音声処理が可能であるという効果を奏し、例えば、監視カメラに適用することが可能である。
1 画像・音声処理装置
4 映像・音声データ受信サーバ
5 画像・音声処理データ受信サーバ
6 画像・音声処理代理実行サーバ
10 画像取得部
20 音声取得部
30 通信部
40 代理実行サーバ決定部
50 エンコーダ部
60 デコーダ部
70 画像・音声処理部
80 リソース使用量計算部
100 主制御部

Claims (9)

  1. 自装置で画像処理や音声処理ができない場合、外部装置で画像処理や音声処理が可能なデータを送信する画像・音声処理装置であって、
    画像データ、もしくは、音声データの取得を行う画像・音声取得部と、
    前記画像・音声取得部で取得された画像データ、もしくは、音声データに対し、画像処理、もしくは、音声処理を行う画像・音声処理部と、
    新規に画像処理や音声処理を実施する際に、自装置にてその画像処理や音声処理が実施可能かを判定する画像・音声処理実施判定部と、
    前記画像・音声処理実施判定部において、自装置での画像・音声処理が実施不可能と判定された場合、外部装置で画像処理、もしくは、音声処理で行うための圧縮符号化のパラメータを計算するエンコードパラメータ計算部と、
    前記画像・音声取得部で取得された画像データ、もしくは、音声データに対し、前記エンコードパラメータ計算部で計算された圧縮符号化のパラメータにより圧縮符号化処理を行うエンコーダ部と、
    画像処理や音声処理を外部装置で行う際に、その外部装置を決定する代理実行装置決定部と、
    前記エンコーダ部で圧縮符号化を行われたデータを、前記代理実行装置決定部によって決められた外部装置に送信する通信部と、
    を備える画像・音声処理装置。
  2. 画像・音声処理装置が持つおのおののリソース使用量を計算するリソース使用量計算部をさらに備え、
    前記画像・音声処理実施判定部は、前記リソース使用量計算部から獲得したリソース量と、新規に画像処理や音声処理を実行した場合に発生するリソース量と、を合計した上でリソース量の最大値と比較し、最大値と等しい時、あるいは、小さい時は画像・音声処理が実施可能と判定し、最大値より大きい時は画像・音声処理が実施不可能とする、
    請求項1記載の画像・音声処理装置。
  3. 前記エンコードパラメータ計算部は、前記画像・音声処理部の処理方法毎に、予め保持されたエンコードパラメータを返す、
    請求項1または2記載の画像・音声処理装置。
  4. 圧縮符号化された画像データ、もしくは、音声データの復号化処理を行うデコーダ部をさらに備え、
    前記エンコードパラメータ計算部は、前記画像・音声取得部が取得した画像データ、もしくは、音声データを前記画像・音声処理部で画像処理、もしくは、音声処理をした結果と、前記画像・音声取得部が取得した画像データ、もしくは、音声データを、前記エンコーダ部で仮のエンコーダパラメータを使い圧縮符号化処理したのち、前記デコーダ部で復号化処理を行い、復号化処理されたデータを前記画像・音声処理部にて画像処理、もしくは、音声処理した結果とを比較し、同じ結果であれば、仮エンコードパラメータをエンコードパラメータとし、違う結果であれば、再度仮パラメータを設定し、前記エンコーダ部、前記デコーダ部、前記画像・音声処理部による一連の処理を同じ結果となるまで繰り返し行う、
    請求項1または2記載の画像・音声処理装置。
  5. 前記代理実行装置決定部は、予め実行の代理実行が可能な装置のリストを持っておき、そのリストの先頭から順番に画像・音声処理の代理実行が可能かを問い合わせていき、代理実行可能と回答した装置から、画像・音声処理の代理実行を行う装置を決定する、
    請求項1〜4のいずれか1項に記載の画像・音声処理装置。
  6. 前記代理実行装置決定部は、画像処理の代理実行が可能な装置を教えるサーバへの問い合わせを行うことによって、画像・音声処理の代理実行を行う装置を決定する、
    請求項1〜4のいずれか1項に記載の画像・音声処理装置。
  7. 前記代理実行装置決定部は、予め画像処理や音声処理の種類毎に、代理実行が可能な装置のリストを持っておき、画像処理や音声処理の種類によって、画像・音声処理の代理実行を行う装置を決定する、
    請求項1〜5のいずれか1項に記載の画像・音声処理装置。
  8. 自集積回路で画像処理や音声処理ができない場合、外部の装置に画像処理や音声処理が可能なデータを送信する集積回路であって、
    画像データ、もしくは、音声データの取得を行う画像・音声取得部と、
    前記画像・音声取得部で取得された画像データ、もしくは、音声データに対し、画像処理、もしくは、音声処理を行う画像・音声処理部と、
    新規に画像処理や音声処理を実施する際に、自集積回路でその画像処理や音声処理が実施可能かを判定する画像・音声処理実施判定部と、
    前記画像・音声処理実施判定部において、自集積回路での画像・音声処理が実施不可能と判定された場合、外部装置で画像処理、もしくは、音声処理で行うための圧縮符号化のパラメータを計算するエンコードパラメータ計算部と、
    前記画像・音声取得部で取得された画像データ、もしくは、音声データに対し、前記エンコードパラメータ計算部で計算された圧縮符号化のパラメータにより圧縮符号化処理を行うエンコーダ部と、
    画像処理や音声処理を外部装置で行う際に、その外部装置を決定する代理実行装置決定部と、
    前記エンコーダ部で圧縮符号化を行われたデータを、前記代理実行装置決定部によって決められた外部装置に送信する通信部と、
    を備える集積回路。
  9. 自プログラムで画像処理や音声処理ができない場合、外部装置で画像処理や音声処理が可能なデータを送信するプログラムであって、
    画像データ、もしくは、音声データの取得を行う画像・音声取得部と、
    前記画像・音声取得部で取得された画像データ、もしくは、音声データに対し、画像処理、もしくは、音声処理を行う画像・音声処理部と、
    新規に画像処理や音声処理を実施する際に、自プログラムにてその画像処理や音声処理が実施可能かを判定する画像・音声処理実施判定部と、
    前記画像・音声処理実施判定部において、自プログラムでの画像・音声処理が実施不可能と判定された場合、外部装置で画像処理、もしくは、音声処理で行うための圧縮符号化のパラメータを計算するエンコードパラメータ計算部と、
    前記画像・音声取得部で取得された画像データ、もしくは、音声データに対し、前記エンコードパラメータ計算部で計算された圧縮符号化のパラメータにより圧縮符号化処理を行うエンコーダ部と、
    画像処理や音声処理を外部装置で行う際に、その外部装置を決定する代理実行装置決定部と、
    前記エンコーダ部で圧縮符号化を行われたデータを、前記代理実行装置決定部によって決められた外部装置に送信する通信部と、
    を備えるプログラム。
JP2013089026A 2013-04-22 2013-04-22 画像・音声処理装置、集積回路、およびプログラム Pending JP2016129269A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2013089026A JP2016129269A (ja) 2013-04-22 2013-04-22 画像・音声処理装置、集積回路、およびプログラム
PCT/JP2014/001811 WO2014174763A1 (ja) 2013-04-22 2014-03-28 処理装置、集積回路、処理方法、およびプログラム
US14/251,722 US20140313327A1 (en) 2013-04-22 2014-04-14 Processing device, integrated circuit, processing method, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013089026A JP2016129269A (ja) 2013-04-22 2013-04-22 画像・音声処理装置、集積回路、およびプログラム

Publications (1)

Publication Number Publication Date
JP2016129269A true JP2016129269A (ja) 2016-07-14

Family

ID=51728699

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013089026A Pending JP2016129269A (ja) 2013-04-22 2013-04-22 画像・音声処理装置、集積回路、およびプログラム

Country Status (3)

Country Link
US (1) US20140313327A1 (ja)
JP (1) JP2016129269A (ja)
WO (1) WO2014174763A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020123896A (ja) * 2019-01-31 2020-08-13 Necプラットフォームズ株式会社 画像圧縮パラメータ決定装置、画像伝送システム、方法およびプログラム

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6493417B2 (ja) 2015-01-15 2019-04-03 日本電気株式会社 情報出力装置、カメラ、情報出力システム、情報出力方法及びプログラム
JP6658402B2 (ja) * 2016-08-26 2020-03-04 富士通株式会社 フレームレート判定装置、フレームレート判定方法及びフレームレート判定用コンピュータプログラム
WO2018212013A1 (ja) * 2017-05-18 2018-11-22 ソニー株式会社 情報処理装置、情報処理方法および情報処理プログラム
CN109325127B (zh) * 2018-11-28 2021-11-19 创新先进技术有限公司 一种风险识别方法和装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003241796A (ja) * 2002-02-22 2003-08-29 Canon Inc 音声認識システムおよびその制御方法
WO2008022156A2 (en) * 2006-08-14 2008-02-21 Neural Id, Llc Pattern recognition system
JP2011234033A (ja) * 2010-04-26 2011-11-17 Panasonic Corp 監視カメラおよび監視システム
US8532390B2 (en) * 2010-07-28 2013-09-10 International Business Machines Corporation Semantic parsing of objects in video
CN103548341A (zh) * 2011-06-08 2014-01-29 欧姆龙株式会社 分布图像处理系统
JP6024952B2 (ja) * 2012-07-19 2016-11-16 パナソニックIpマネジメント株式会社 画像送信装置、画像送信方法、画像送信プログラム及び画像認識認証システム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020123896A (ja) * 2019-01-31 2020-08-13 Necプラットフォームズ株式会社 画像圧縮パラメータ決定装置、画像伝送システム、方法およびプログラム

Also Published As

Publication number Publication date
US20140313327A1 (en) 2014-10-23
WO2014174763A1 (ja) 2014-10-30

Similar Documents

Publication Publication Date Title
US9906789B2 (en) Encoding or decoding method and apparatus
JP2016129269A (ja) 画像・音声処理装置、集積回路、およびプログラム
US10771788B2 (en) Information processing device and information processing method
JP6179179B2 (ja) 情報処理装置、情報処理方法およびプログラム
JP6566616B2 (ja) 通信装置、その制御方法、およびプログラム
US20230169691A1 (en) Method of providing image storage service, recording medium and computing device
US10015395B2 (en) Communication system, communication apparatus, communication method and program
US20180255262A1 (en) Imaging apparatus, imaging method, and program
WO2012163059A1 (zh) 设备重定向的数据传输的方法、装置及系统
WO2017036061A1 (zh) 一种图像编码方法、图像解码方法及装置
KR102464757B1 (ko) 비디오 데이터를 스트리밍하는 시스템 및 방법
JP5739079B1 (ja) 動画圧縮装置および動画圧縮伸長システム
KR101540217B1 (ko) 자동으로 최적의 트랜스코딩을 수행하는 장치, 시스템, 방법 및 컴퓨터 판독 가능한 기록 매체
JP2017092868A (ja) 映像符号化装置およびプログラム
US20120281066A1 (en) Information processing device and information processing method
TW201212655A (en) Image encoding integrated circuit and image encoding data transmission method thereof
KR101323886B1 (ko) 분산처리 기반의 물체 추적장치 및 추적방법
CN108965768B (zh) 多媒体数据的传输方法和系统
US10778994B2 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
JP2010119030A (ja) 通信装置、通信方法および通信プログラム
JP6649212B2 (ja) 符号化装置、復号装置、および画像処理システム
JP2017085483A (ja) 映像送信装置及び無線指示装置
CN113782015A (zh) 一种语音交互的方法和装置
TW201136320A (en) Buffer size reduction for wireless analog TV receivers
JP2014209693A (ja) 電子機器、電子機器の制御方法、電子機器の制御プログラム