JP7006302B2 - 画像処理装置、画像処理システム、及びビデオ会議システム - Google Patents

画像処理装置、画像処理システム、及びビデオ会議システム Download PDF

Info

Publication number
JP7006302B2
JP7006302B2 JP2018009066A JP2018009066A JP7006302B2 JP 7006302 B2 JP7006302 B2 JP 7006302B2 JP 2018009066 A JP2018009066 A JP 2018009066A JP 2018009066 A JP2018009066 A JP 2018009066A JP 7006302 B2 JP7006302 B2 JP 7006302B2
Authority
JP
Japan
Prior art keywords
image
region
image processing
contrast
processing unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018009066A
Other languages
English (en)
Other versions
JP2019129382A (ja
Inventor
将樹 能勢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2018009066A priority Critical patent/JP7006302B2/ja
Priority to US16/245,510 priority patent/US10979628B2/en
Priority to EP19151752.3A priority patent/EP3515061A1/en
Publication of JP2019129382A publication Critical patent/JP2019129382A/ja
Application granted granted Critical
Publication of JP7006302B2 publication Critical patent/JP7006302B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/147Communication arrangements, e.g. identifying the communication as a video-communication, intermediate storage of the signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/80Camera processing pipelines; Components thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/165Detection; Localisation; Normalisation using facial parts and geometric relationships
    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B5/00Optical elements other than lenses
    • G02B5/20Filters

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Geometry (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Optics & Photonics (AREA)

Description

本発明は、画像処理装置、画像処理システム、及びビデオ会議システムに関する。
プレゼンテーションや会議等において、UCS(ユニファイド・コミュニケーション・システム; Unified Communication system)等の通信機器が普及し、動画像を利用し、電話での通話より利便性の高いビデオ会議が可能となっている。
ビデオ会議では、ネットワーク帯域が狭い場合等に、動画像や音声の品質が低下することがあり、これに対し、ネットワークの混雑状況を検出し、送信する動画像の情報量を減らす方法が用いられている。
送信する動画像の情報量を減らす技術には、例えば動画像のエンコード、すなわち圧縮の前処理として、会議に参加している人物の顔を検出し、人物の顔以外の領域に低域通過フィルタをかけるものが開示されている(例えば、特許文献1参照)。特許文献1の技術では、動画像において、ビデオ会議で最も視線を集める人物の顔の領域では情報量を維持し、注目度が低い顔以外の領域では情報量を削減する。これにより、主観的な動画像品質は保ったまま、エンコードした動画像の情報量を減らしている。
近年は特に、インターネット回線を用いるビデオ会議がより多く利用されるため、拠点間のネットワーク回線が細い、或いは時間帯によって急激な混雑する等の理由で、動画像や音声の品質が低下する場合が増えている。従って、主観的な動画像品質を保持しつつ、さらに動画像の情報量を減らすニーズが高くなっている。
本発明は、上記の点に鑑みてなされたものであって、主観的な動画像品質を保持しつつ、動画像の情報量を減らすことを課題とする。
開示の技術の一態様に係る画像処理装置は、所定のフレームレートで入力される動画像信号を符号化する画像処理装置であって、前記動画像信号に含まれる人物の顔の領域を特定領域とし、前記動画像信号に対し、所定の処理を実行する処理手段と、前記処理手段の出力画像信号を符号化する符号化手段と、を有し、前記処理手段は、前記特定領域以外の領域の空間周波数を選択的にフィルタリングする低域通過フィルタ手段と、前記特定領域以外の領域のコントラストを選択的に低減するコントラスト低減手段と、前記特定領域以外の領域の前記フレームレートを選択的に低下させるフレームレート低下手段の少なくとも1つを有し、前記コントラスト低減手段は、所定のダイナミックレンジで前記コントラストを低減し、前記特定領域からの距離に応じて、前記ダイナミックレンジを変更することを特徴とする。
本発明の実施形態によれば、主観的な動画像品質を保持しつつ、動画像の情報量を減らすことができる。
第1の実施形態の画像処理装置の構成の一例を示す外観図である。 第1の実施形態の画像処理装置のハードウェア構成の一例を示すブロック図である。 第1の実施形態の画像処理装置の機能構成の一例を示すブロック図である。 第1の実施形態の画像処理装置による処理の概念を説明する図である。 第1の実施形態の画像処理装置における動画像の領域毎の更新タイミングを説明するタイミングチャートである。 第1の実施形態の画像処理装置の有する処理手段による動画像容量の削減効果を説明する図である。 第1の実施形態の画像処理装置による処理の一例を示すフローチャートである。 第2の実施形態の画像処理装置の機能構成の一例を示すブロック図である。 第2の実施形態の画像処理装置による処理の概念を説明する図である。 第2の実施形態の画像処理装置で用いる空間フィルタを説明する図である。 第3の実施形態の画像処理装置の機能構成の一例を示すブロック図である。 第3の実施形態の画像処理装置による処理の概念を説明する図である。 第4の実施形態のビデオ会議システムの構成の一例を示す概略図である。
以下、図面を参照して発明を実施するための形態について説明する。なお、各図面において、同一構成部分には同一符号を付し、重複した説明を省略する場合がある。
[第1の実施形態]
まず、第1の実施形態の画像処理装置の構成の一例を説明する。図1は、本実施形態の画像処理装置10の外観図である。図1に示されているように、画像処理装置10は、筐体1100と、アーム1200と、カメラハウジング1300とを有している。このうち、筐体1100の前側壁面1110には、複数の吸気孔によって形成された吸気面が設けられており、筐体1100の後側壁面1120には、複数の排気孔が形成された排気面1121が設けられている。これにより、筐体1100に内蔵された冷却ファンの駆動によって、吸気面を介して画像処理装置10の後方の外気を取り込み、排気面1121を介して画像処理装置10の後方へ排気することができる。筐体1100の右側壁面1130に収音用孔1131が形成されていることで、内蔵型のマイク114は、音声、物音、雑音等の音を収音可能となっている。
筐体1100の右側壁面1130側には、操作パネル1150が形成されている。この操作パネル1150には、複数の操作ボタン(108a~108e)、電源スイッチ109、及びアラームランプ119が設けられていると共に、内蔵型のスピーカ115からの出力音を通すための複数の音出力孔によって形成された音出面1151が形成されている。また、筐体1100の左側壁面1140側には、アーム1200及びカメラハウジング1300を収容するための凹部としての収容部1160が形成されている。筐体1100の右側壁面1130には、接続I/F118に対して電気的にケーブルを接続するための複数の接続口(1132a~1132c)が設けられている。一方、筐体1100の左側壁面1140には、接続I/F118に対して電気的にディスプレイ120用のケーブル120cを接続するための接続口が設けられている。
次に、アーム1200は、トルクヒンジ1210を介して筐体1100に取り付けられており、アーム1200が筐体1100に対して、135度のチルト角θ1の範囲で、上下方向に回転可能になっている。図1は、チルト角θ1が90度の状態を示している。カメラハウジング1300には、内蔵型のカメラ112が設けられており、ユーザ、書類、及び部屋等を撮像することができる。また、カメラハウジング1300には、トルクヒンジ1310が形成されている。カメラハウジング1300は、トルクヒンジ1310を介して、アーム1200に取り付けられている。カメラハウジング1300はアーム1200に対して、図1で示されている状態を0度として±180度のパン角θ2の範囲で、且つ、±45度のチルト角θ3の範囲で、上下左右方向に回転可能になっている。
なお、上記図1の外観図はあくまで一例であってこの外観に限定するものではない。他の例としては、画像処理装置10は、一般の汎用コンピュータあるいは携帯電話端末、プロジェクタ、電子ホワイトボード、電子看板(デジタルサイネージ)等であってもよい。画像処理装置10として用いるコンピュータに、マイクやカメラが備わっていない場合には、外付けのマイクおよびカメラをコンピュータに接続させることができる。また、画像処理装置10が汎用コンピュータや携帯電話端末等である場合には、無線LANや携帯電話網などによる無線通信により、画像処理装置10とインターネットとを接続しても良い。また、画像処理装置10として汎用コンピュータを用いる場合には、コンピュータに画像処理装置10の処理を実行するためのアプリケーションをインストールしておくことができる。
次に、本実施形態の画像処理装置10のハードウェア構成の一例を説明する。図2は、本実施形態の画像処理装置10のハードウェア構成の一例を示すブロック図である。図2に示すように、画像処理装置10は、CPU(Central Processing Unit)201と、ROM(Read Only Memory)202と、RAM(Random Access Memory)203と、フラッシュメモリ204とを有している。また画像処理装置10は、I/O205と、操作パネル1150と、接続I/F(Interface)118と、通信I/F207とを有している。これらは、システムバス208を介して相互に接続されている。
CPU201は、画像処理装置10の動作を統括的に制御する。CPU201は、RAM203をワークエリア(作業領域)としてROM202、又はフラッシュメモリ204等に格納されたプログラムを実行することで、画像処理装置10全体の動作を制御し、後述する各種機能を実現する。
操作パネル1150は、ユーザの操作に応じた各種の入力を受け付ける。なお、この例では複数の操作ボタン(108a~108e)が設けられた例を示すが、これに限られるものではない。例えば、タッチパネル機能が搭載された液晶表示装置(LCD)や有機EL表示装置で構成されてもよい。
I/O307は、USB(Universal Serial Bus)等の外部記憶装置に接続され、外部記憶装置とのデータの入出力が可能となっている。接続I/F118は、画像処理装置10にPC(Personal Computer)等の外部機器を接続するためのインタフェースである。通信I/F207は、ネットワーク209と接続するためのインタフェースである。
なお、CPU201で行う処理の一部、又は全部を、FPGA(Field-Programmable Gate Array)やASIC等の電子回路で実現してもよい。
次に、本実施形態の画像処理装置の機能構成の一例を説明する。図3は、本実施形態の画像処理装置の機能構成の一例を示すブロック図である。図3に示すように、画像処理装置10は、顔検出処理部301と、処理領域設定部302と、非顔画像領域処理部303と、符号化処理部304とを有している。
顔検出処理部301は、入力される動画像に含まれる人物の顔を検出する。つまり動画像として時系列で入力される各画像、すなわち1フレーム毎の画像において、人物の顔に該当する画像領域を検出する。なお、以下では、人物の顔に該当する画像領域を、顔画像領域と称する。顔画像領域は、「動画像信号に含まれる人物の顔の領域」の一例であり、「特定領域」の一例である。
また、顔検出処理部301は、入力される動画像のフレーム間での人物の顔の動き量を検出し、フレームレート低下処理部307に出力する。これについては、別途、図7の説明において詳述する。
処理領域設定部302は、処理の対象となる領域を設定する。本実施形態では、顔画像領域以外の画像領域を処理の対象とするため、このような画像領域を処理領域として設定する。なお、以下では、顔画像領域以外の画像領域を、非顔画像領域と称する。
処理領域が設定された1フレームの画像は、非顔画像領域処理部303に入力される。非顔画像領域処理部303は、低域通過フィルタ処理部305と、コントラスト低減処理部306と、フレームレート低下処理部307とを有している。
低域通過フィルタ処理部305は、入力画像の非顔画像領域に対し、選択的に低域通過フィルタリング処理を実行する。低域通過フィルタリング処理は、画像において、低い空間周波数帯域のみを通過させ、他の帯域を遮断する所謂ローパスフィルタリング処理である。低域通過フィルタ処理部305は、低域通過フィルタ手段の一例である。
ここで、入力画像の非顔画像領域に対し、低域通過フィルタ処理部305により処理を実行する概念を、図4を参照して説明する。図4は、会議室において、3人の人物が机41を囲んで会議を実施する様子が含まれる画像40を示している。図4の破線で示した3つの領域42は、それぞれ3人の人物の顔画像領域である。画像40における領域42以外の領域は、非顔画像領域である。低域通過フィルタ処理部305は、このような非顔画像領域に対し、選択的に低域通過フィルタリング処理を実行する。なお、以下で説明するコントラスト低減処理部306、及びフレームレート低下処理部307でも同様に、このような非顔画像領域に対して、選択的に処理を実行する。
図3に戻り、コントラスト低減処理部306は、入力画像の非顔画像領域に対し、選択的にコントラストを低減する処理を実行する。コントラストとは画像における明暗の差であり、コントラスト低減処理部306は、これを低減、すなわち明暗の差を小さくする処理を行う。コントラスト低減処理部306は、コントラスト低減手段の一例である。
フレームレート低下処理部307は、入力画像の非顔画像領域に対し、選択的にフレームレートを低下させる処理を実行する。フレームレートとは、動画像において、単位時間あたりに処理させるフレーム数、すなわち静止画像数、又はコマ数である。例えば、入力される動画像のフレームレートを30fps(frame per Second)とした場合に、フレームレート低下処理部307は、非顔画像領域に対し、選択的にフレームレートを15fpsに低下させる。フレームレート低下処理部307は、フレームレート低下手段の一例である。
ここで、フレームレート低下処理部307による処理の概念を、図5を参照して説明する。図5は、動画像における画像領域毎での更新タイミングの一例を示すタイミングチャートである。
図5において、信号FRは、動画像における1フレームの画像が画像処理装置10に入力するタイミングを示す信号である。図5では、4フレームの画像が、それぞれ信号FRで示すタイミングで画像処理装置10に入力している。
信号AR1は、動画像における1フレームの画像の顔画像領域が、更新されるタイミングを示す信号である。信号AR2は、同様に非顔画像領域が更新タイミングを示す信号である。図5の信号AR1は、1フレームの画像が1回入力される毎に、顔画像領域が1回更新されることを示している。これに対し、信号AR2は、1フレームの画像が2回入力される毎に、非顔画像領域が1回更新されることを示している。つまり、非顔画像領域では、更新が1回間引かれ、フレームレートが低下している。フレームレート低下処理部307は、このようにして、入力画像の非顔画像領域のフレームレートを選択的に低下させている。
図3に戻り、非顔画像領域に対し、低域通過フィルタ処理部305、コントラスト低減処理部306、及びフレームレート低下処理部307による処理がそれぞれ実行された画像は、符号化処理部304に入力される。言い換えると、非顔画像領域処理部303の出力画像信号は、符号化処理部304に入力される。符号化処理部304は、「符号化手段」の一例である。
なお、本実施形態では、低域通過フィルタ処理部305、コントラスト低減処理部306、及びフレームレート低下処理部307の各処理が全て実行される例を示すが、これに限定されることはない。これらのうちの1つ、又は2つの処理を実行することにしてもよい。
或いは、非顔画像領域処理部303は、コントラスト低減処理部306と、フレームレート低下処理部307とを有し、非顔画像領域処理部303は、これらのうちの少なくとも1つの処理を実行することにしてもよい。
符号化処理部304は、非顔画像領域処理部303による出力画像信号を符号化する。本実施形態では、符号化処理部304は、一例として動画圧縮規格の一つであるH.264に基づく符号化処理を実行する。符号化された画像は、動画像における1フレームの画像として、画像処理装置10から順次出力される。
なお、顔検出処理部301、処理領域設定部302、及び非顔画像領域処理部303は、「動画像信号に対し、所定の処理を実行する処理手段」の一例である。
ここで、上記の低域通過フィルタ処理部305、及びコントラスト低減処理部306それぞれによる動画像容量の削減効果を、図6を参照して説明する。
図6において、縦軸は動画像容量を示している。但し、縦軸は、非顔画像領域に対して何の処理も行わなかった場合の動画像容量を1として規格化したスケールで表示されている。横軸は各処理を表す分類を示している。図6では分類61~65が示されており、また分類毎でそれぞれ8つの棒グラフが示されている。分類毎の8つの棒グラフは、分類毎での8種類のテスト画像に対する処理結果を示している。
分類61は、非顔画像領域に対して何の処理も行わなかった場合である。分類62は、非顔画像領域に対して、低域通過フィルタ処理部305による処理を実行した場合である。分類63は、第1の比較例として、非顔画像領域に対して、色数の低減処理を実行した場合である。分類64は、非顔画像領域に対して、コントラスト低減処理部306による処理を実行した場合である。分類65は、第2の比較例として、非顔画像領域に対して、ノイズ除去処理を実行した場合である。
分類62における「1/2」、「1/4」、及び「1/8」は、低域通過フィルタ処理部305による画像の解像度の低減レベルを示している。つまり、低域通過フィルタリング処理により高い空間周波数帯域が遮断された分、画像の解像度が低減するレベルを示している。分類63における「1/2」、「1/4」、及び「1/8」は、色数の低減処理による画像の色数の低減レベルを示している。また分類64における「1/2」、「1/4」、及び「1/8」は、コントラスト低減処理部306による画像のコントラストの低減レベルを示している。
上述のように、分類61の処理を規格化の標準としているため、分類61では、8つの棒グラフとも動画像容量は全て1である。分類62では、解像度の低減に応じて動画像容量が大きく削減されている。分類63では、色数の低減に伴う動画像容量の削減効果はみられず、色数の低減に応じて、むしろ動画像容量が増大している。これは、色数の低減によりトーンジャンプが増え、圧縮効果が阻害されたためと考えられる。分類64では、解像度のコントラストの低減に応じて動画像容量が削減されている。分類65では、ノイズ除去により、動画像容量がやや削減されている。
以上、図6に示したように、低域通過フィルタ処理部305、及びコントラスト低減処理部306によって、より好適に動画像容量、すなわち動画像における情報量を削減することができる。
次に、本実施形態の画像処理装置10による処理の一例を、図7のフローチャートを参照して説明する。
まず、ステップS701において、画像処理装置10に動画像が入力される。
続いて、ステップS703において、顔検出処理部301は、動画像における1フレームの画像に対して顔検出処理を実行し、検出した顔画像領域の情報を処理領域設定部302に出力する。例えば、顔画像領域がXY座標で特定され、このような座標情報と1フレームの画像が、処理領域設定部302に出力される。
続いて、ステップS705において、処理領域設定部302は、入力画像における非顔画像領域を、処理領域として設定する。
続いて、ステップS707において、低域通過フィルタ処理部305は、入力画像の非顔画像領域に対し、選択的に低域通過フィルタ処理を実行する。
続いて、ステップS709において、コントラスト低減処理部306は、入力画像の非顔画像領域に対し、選択的にコントラスト低減処理を実行する。
続いて、ステップS711において、顔検出処理部301は、顔画像領域において顔の動き量を検出する。例えば顔検出処理部301は、RAM203に記憶された、前の1フレームの画像における顔画像領域の画素輝度の総和と、現在処理を実行している1フレームの画像における顔画像領域の画素輝度の総和を比較することで、顔の動き量を検出する。顔検出処理部301は、検出した顔の動き量をフレームレート低下処理部307に出力する。なお、顔検出処理部301が検出する顔の動き量は、「フレーム間での顔の動き量」の一例である。フレームレート低下処理部307は、顔の動き量が予め規定した閾値以下であるかを判断する。
ステップS711で検出された顔の動き量が、予め規定した閾値以下であると判断された場合は、ステップS713において、フレームレート低下処理部307は、入力画像の非顔画像領域に対し、選択的にフレームレート低下処理を実行する。一方、ステップS711で検出された動き量が、予め規定した閾値以下でないと判断された場合は、ステップS713をスキップして、ステップS715に移る。なお上記の閾値は予め求められ、RAM203等に記憶されている。上記の閾値は、「規定値」の一例である。
一方で、次の1フレームの画像における顔の動き量の検出に用いるために、顔検出処理部301は、現在の1フレームの画像をRAM203に記憶する。
ここで、顔の動き量の検出について補足する。動画像におけるフレ-ム間での変化が小さい場合は、入力画像の非顔画像領域に対し、選択的にフレームレート低下処理を実行しても、動画像が不自然になることはない。しかし、動画像におけるフレ-ム間での変化が大きい場合に、入力画像の非顔画像領域に対し、選択的にフレームレート低下処理を実行すると、変化がぎこちなく観察され、動画像が不自然になる場合がある。
そこで、本実施形態では、ステップS711において、フレーム間での顔の動き量を検出することで、動画像におけるフレ-ム間での変化の大きさを検出している。言い換えると、動画像におけるフレ-ム間での変化の大きさを表す特性値として、フレーム間での顔の動き量を検出している。そして、顔の動き量が閾値以下の場合にのみ、入力画像の非顔画像領域に対し、選択的にフレームレート低下処理を実行している。これにより、動きが大きい画像ではフレームレートを低下させず、動画像が不自然になることを防止している。
図7に戻り、ステップS715において、符号化処理部304は、入力される画像に対し、符号化処理を実行する。
符号化された画像は、動画像における1フレームの画像として、画像処理装置10から出力される。
以上の処理により、動画像において重要な情報となる人物の情報量を維持したまま、重要でない背景等の情報量を減らすことができる。
以上説明してきたように、本実施形態によれば、主観的な動画像品質を保持しつつ、動画像の情報量を減らすことができる。これにより動画像の圧縮率を高めることができる。
例えば、UCSのようにインターネット回線を利用して、動画像を伝送する場合に好適であり、UCSの利用の際に、動画像や音声の品質が低下することを防ぐことができる。
なお、UCSとは、映像や音声のリアルタイム双方向通信や多拠点通信を可能にするプラットフォームを、クラウド上に構築するための通信機器である。
また監視カメラのように大量の動画像をストレージする場合においても好適である。
一方で、動画像の圧縮率を高める手法として、動画像におけるノイズ信号を低減することも考えられる。しかし動画像におけるノイズ信号の低減は、暗い部屋でプロジェクタ等を用いてビデオ会議する場合には効果があるが、明るい部屋でビデオ会議する場合には、動画像のノイズ信号自体がそもそも小さくなるため、大きな効果は得られない。近年は、液晶ディスプレイ等のバックライト型の表示装置が用いられ、明るい部屋でビデオ会議が行われることが多いため、ノイズ信号の低減による動画像の圧縮率の向上は得にくい。本実施形態によれば、このようなノイズ信号を低減する手法に対し、より動画像の圧縮率を高めることできる。
また本実施形態では、入力画像の非顔画像領域に対し、コントラスト低減処理部306、及びフレームレート低下処理部307の少なくとも1つによる処理を選択的に実行する。これにより低域通過フィルタ処理のみを選択的に実行する場合に対し、動画像の情報量をさらに減らすことができる。
[第2の実施形態]
次に、第2の実施形態の画像処理装置について、図8~10を参照して説明する。なお、第1の実施の形態において、既に説明した実施の形態と同一構成部についての説明は省略する場合がある。
本実施形態では、顔画像領域からの距離に応じて非顔画像領域を複数の領域に分割し、分割した領域毎で、低域通過フィルタ処理部による処理で用いる空間フィルタのサイズを変更することにしている。
図8は、本実施形態の画像処理装置10aの機能構成の一例を示すブロック図である。画像処理装置10aは、非顔画像領域分割部308と、非顔画像領域処理部303aとを有している。また非顔画像領域処理部303aは、低域通過フィルタ処理部305aを有している。
非顔画像領域分割部308は、顔画像領域からの距離に応じて、非顔画像領域を複数の領域に分割する。図9は、非顔画像領域分割部308により非顔画像領域が複数の領域に分割された画像の一例を示している。なお、図9に白抜きの矢印で示した方向は、それぞれ画像のX座標、及びY座標に該当するX、及びY方向を示している。
図9において、領域42a、及び42bは、顔検出処理部301により検出された2人の人物の顔画像領域である。領域91は、領域42aの中心位置からX、及びY方向に、それぞれ距離D1以上でD2未満離れた領域である。この距離の単位は、例えば画素数である。同様に領域92は、領域42aの中心位置からX、及びY方向に、それぞれ距離D2以上でD3未満離れた領域である。領域93は、領域42aの中心位置からX、及びY方向に、それぞれ距離D3以上離れた領域である。
非顔画像領域分割部308による分割数、及び顔画像領域からの距離は、予め決定され、RAM203等に記憶されている。顔画像領域である領域42bに対する距離に応じた非顔画像領域の分割については、領域42aに対するものと同様であるため、ここでは省略する。
次に図10は、低域通過フィルタ処理部305aによる処理で用いられる空間フィルタを示している。(a)は、3×3のタップサイズの空間フィルタ101であり、(b)は5×5のタップサイズの空間フィルタ102である。空間フィルタ101、及び102における各升目は、画像における画素に該当する。
低域通過フィルタ処理部305aは、空間フィルタ101、及び102と、非顔画像領域の画素とをコンボリューション、すなわち畳み込み積分する。各升目に示された値が非顔画像領域の各画素に積算、及び加算されることで、処理領域の隣接画素間での輝度の差が低減される。これにより処理領域の画像の空間周波数の高周波帯域が遮断され、低域通過フィルタ(ローパスフィルタ)の作用が得られる。空間フィルタのタップサイズが大きいほど、処理領域の隣接画素間での輝度の差が低減されるため、低域通過フィルタの作用が大きくなる。すなわち高周波側で遮断される周波数帯域が広くなる。
例えば、動画像において、人物の顔画像領域に近い画像領域には、人物の手があったり、体の一部があったりする。人物の手や体の一部の画像には、ジェスチャ等で伝達される情報もあるため、顔ほどではないが、重要な情報が含まれる。これに対し、人物の顔画像領域から離れた画像領域には、最早、人物の体や手すらも含まれず、会議室の壁等の伝達する情報としては重要度の低いもののみになる。
本実施形態では、低域通過フィルタ処理部305aは、人物の顔画像領域に近い領域91では、タップサイズの小さい空間フィルタ101を用い、人物の顔画像領域から遠い領域92、及び領域93では、タップサイズの大きい空間フィルタ102を用いる。これにより重要度の低い領域において、遮断される周波数帯域を大きくし、情報量をより減らしている。そして主観的な動画像品質を保持しつつ、動画像の情報量をさらに減らすことができ、動画像の圧縮率をさらに高めることができる。
なお、空間フィルタの係数は、図10に示した値に限らない。
上記以外の効果は、第1の実施形態で説明したものと同様である。
[第3の実施形態]
次に、第3の実施形態の画像処理装置について、図11~12を参照して説明する。なお、第1、又は第2の実施の形態において、既に説明した実施の形態と同一構成部についての説明は省略する場合がある。
本実施形態では、顔画像領域からの距離に応じて非顔画像領域を複数の領域に分割し、分割した領域毎で、コントラスト低減処理部による処理におけるコントラストのダイナミックレンジを変更することにしている。
図11は、本実施形態の画像処理装置10bの機能構成の一例を示すブロック図である。画像処理装置10bは、非顔画像領域処理部303bと、LUT(ルックアップテーブル;Look Up Table)用メモリ309とを有している。また非顔画像領域処理部303bは、コントラスト低減処理部306bを有している。
LUT用メモリ309は、例えばRAM203等により実現される。LUTデータは、ネットワーク209を介してRAM203に入力されるか、或いは外部記憶装置からI/O208を介してRAM203に入力され、記憶される。
非顔画像領域分割部308により、顔画像領域からの距離に応じて、非顔画像領域を複数の領域に分割することは第2の実施形態で説明したものと同様である。また非顔画像領域分割部308により非顔画像領域が複数の領域に分割された画像は、図9で説明したものと同様である。
図12は、コントラスト低減処理部306bによる処理の概念を説明する図である。図12の横軸は、コントラストが低減処理される前の画素の輝度、すなわちコントラスト低減処理部306bに入力される画素輝度を示している。一方、縦軸は、コントラストが低減処理された後の画素の輝度、すなわちコントラスト低減処理部306bから出力される画素輝度を示している。つまり、コントラスト低減処理部306bによれば、入力される画素輝度が輝度変換されて出力される。なお、本実施形態では、8bitの画像を一例としており、画素輝度は0~256の範囲で示されている。
図12において、プロット121は、入力される画素輝度と出力される画素輝度が等しい場合を示している。この場合は、コントラストは変わらない。一方、プロット122は、コントラスト低減処理部306bにより、25%だけコントラストを低下させた場合を示している。図示したレンジR1は、プロット121のダイナミックレンジを示し、レンジR2は、プロット122のダイナミックレンジを示している。
LUT用メモリ309には、図12のような、入力される画素輝度と出力される画素輝度が対応付けられたデータが記憶されている。コントラスト低減処理部306bは、LUT用メモリ309を参照し、入力される画素輝度に対応して出力するための画素輝度を取得する。これにより画素輝度の変換処理を実行する。
図12において、太い黒矢印で示した方向は、ダイナミックレンジを狭くなる方向である。つまり、入力される画素輝度が大きい場合は画素輝度が小さくなるように、また入力される画素輝度が小さい場合は画素輝度が大きくなるように変換処理されると、ダイナミックレンジは狭くなる。ダイナミックレンジが狭いほど、画像領域に含まれる輝度情報は少なくなるため、情報量が削減される。
一方で、第2の実施形態で説明したように、動画像において、人物の顔画像領域に近い画像領域には、重要な情報が含まれ、人物の顔画像領域から離れた画像領域には、重要度が低いものしか含まれない。
そのため、本実施形態では、コントラスト低減処理部306bは、人物の顔画像領域に近い領域91では、ダイナミックレンジが比較的広い範囲で、コントラストの低減処理を実行する。そして人物の顔画像領域から遠い領域92、及び領域93では、ダイナミックレンジが比較的狭い範囲で、コントラストの低減処理を実行する。これにより重要度の低い領域においてダイナミックレンジを狭め、情報量をより減らしている。そして主観的な動画像品質を保持しつつ、動画像の情報量をさらに減らすことができ、動画像の圧縮率をさらに高めることができる。
なお、上記以外の効果は、第1の実施形態で説明したものと同様である。また第2の実施形態と、本実施形態を組み合わせて実施することもできる。
また、コントラスト低減処理部306bは、LUTを用いてコントラスト低減処理を実行することで、演算でコントラスト低減処理を実行する場合に比較して、処理負荷を軽減でき、また処理速度を向上させることができる。
[第4の実施形態]
次に、第4の実施形態のビデオ会議システムについて、図13を参照して説明する。なお、第1、又は第2の実施の形態において、既に説明した実施の形態と同一構成部についての説明は省略する場合がある。
ビデオ会議システム130は、UCS131~134を有している。UCS131~134はそれぞれ異なる拠点に設置されている。
なお、UCSとは、上述したように、映像や音声のリアルタイム双方向通信や多拠点通信を可能にするプラットフォームを、クラウド上に構築するための通信機器である。UCS131~134は、「画像処理システム」の一例である。
UCS131~134はそれぞれ、画像処理装置10と、無線LAN等の通信端末とを有しており、インターネットに接続している。UCS131~134は、インターネットを介して相互に通信可能である。ビデオ会議システム130は、UCS131~134を用いて動画像信号を送受することで、複数の拠点間での遠隔ビデオ会議を実施することができる。
ビデオ会議システム130は、画像処理装置10を有することで、主観的な動画像品質を保持しつつ、動画像の情報量を減らすことができ、各UCSにおいて、動画像や音声の品質が低下することを防止することができる。これにより円滑なビデオ会議を実現することができる。
なお、ビデオ会議システム130におけるUCS131~134は、画像処理装置10の他、それぞれ画像処理装置10a、又は10bを有することも可能である。
なお、上記以外の効果は、第1~3の実施形態で説明したものと同様である。
以上、実施形態に係る画像処理装置、画像処理システム、及びビデオ会議システムについて説明したが、本発明は上記実施形態に限定されるものではなく、本発明の範囲内で種々の変形及び改良が可能である。
10、10a、10b 画像処理装置(画像処理装置の一例)
120 ディスプレイ
130 ビデオ会議システム(ビデオ会議システムの一例)
131~134 UCS(画像処理システムの一例)
301 顔検出処理部
302 処理領域設定部
303、303a 非顔画像領域処理部
304 符号化処理部(符号化手段の一例)
305、305a 低域通過フィルタ処理部(低域通過フィルタ手段の一例)
306 コントラスト低減処理部(コントラスト低減手段の一例)
307 フレームレート低下処理部(フレームレート低下手段の一例)
308 非顔画像領域分割部
309 LUT用メモリ
40 画像
42、42a、42b、91、92、93 領域
101、102 空間フィルタ
特許第3046379号公報

Claims (7)

  1. 所定のフレームレートで入力される動画像信号を符号化する画像処理装置であって、
    前記動画像信号に含まれる人物の顔の領域を特定領域とし、
    前記動画像信号に対し、所定の処理を実行する処理手段と、
    前記処理手段の出力画像信号を符号化する符号化手段と、を有し、
    前記処理手段は、前記特定領域以外の領域の空間周波数を選択的にフィルタリングする低域通過フィルタ手段と、前記特定領域以外の領域のコントラストを選択的に低減するコントラスト低減手段と、前記特定領域以外の領域の前記フレームレートを選択的に低下させるフレームレート低下手段の少なくとも1つを有し、
    前記コントラスト低減手段は、所定のダイナミックレンジで前記コントラストを低減し、前記特定領域からの距離に応じて、前記ダイナミックレンジを変更する
    ことを特徴とする画像処理装置。
  2. 所定のフレームレートで入力される動画像信号を符号化する画像処理装置であって、
    前記動画像信号に含まれる人物の顔の領域を特定領域とし、
    前記動画像信号に対し、所定の処理を実行する処理手段と、
    前記処理手段の出力画像信号を符号化する符号化手段と、を有し、
    前記処理手段は、前記特定領域以外の領域のコントラストを選択的に低減するコントラスト低減手段と、前記特定領域以外の領域の前記フレームレートを選択的に低下させるフレームレート低下手段の少なくとも1つを有し、
    前記コントラスト低減手段は、所定のダイナミックレンジで前記コントラストを低減し、前記特定領域からの距離に応じて、前記ダイナミックレンジを変更する
    ことを特徴とする画像処理装置。
  3. 前記低域通過フィル手段は、所定のサイズの空間フィルタによフィルタリングを行い、前記特定領域からの距離に応じて、前記空間フィルタの前記サイズを変更する
    ことを特徴とする請求項に記載の画像処理装置。
  4. 前記フレームレート低下手段はフレーム間での前記顔の動き量が規定値以下の場合に、前記特定領域以外の領域の前記フレームレートを選択的に低下させる
    ことを特徴とする請求項1、又は2に記載の画像処理装置。
  5. 前記コントラスト低減手段は、ルックアップテーブルを用いて前記コントラストを低減する
    ことを特徴とする請求項1乃至の何れか1項に記載の画像処理装置。
  6. 請求項1乃至の何れか1項に記載の画像処理装置と、
    前記画像処理装置に接続され、外部機器と通信可能な通信端末と、を有する
    ことを特徴とする画像処理システム。
  7. 2以上の拠点に備えられた各通信端末が、相互に通信可能に接続されたビデオ会議システムであって、
    前記通信端末は、それぞれ請求項1乃至の何れか1項に記載の画像処理装置を有することを特徴とするビデオ会議システム。
JP2018009066A 2018-01-23 2018-01-23 画像処理装置、画像処理システム、及びビデオ会議システム Active JP7006302B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018009066A JP7006302B2 (ja) 2018-01-23 2018-01-23 画像処理装置、画像処理システム、及びビデオ会議システム
US16/245,510 US10979628B2 (en) 2018-01-23 2019-01-11 Image processing apparatus, image processing system, image processing method, and recording medium
EP19151752.3A EP3515061A1 (en) 2018-01-23 2019-01-15 Image processing apparatus, image processing system, image processing method, and carrier means

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018009066A JP7006302B2 (ja) 2018-01-23 2018-01-23 画像処理装置、画像処理システム、及びビデオ会議システム

Publications (2)

Publication Number Publication Date
JP2019129382A JP2019129382A (ja) 2019-08-01
JP7006302B2 true JP7006302B2 (ja) 2022-01-24

Family

ID=65030937

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018009066A Active JP7006302B2 (ja) 2018-01-23 2018-01-23 画像処理装置、画像処理システム、及びビデオ会議システム

Country Status (3)

Country Link
US (1) US10979628B2 (ja)
EP (1) EP3515061A1 (ja)
JP (1) JP7006302B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009027367A (ja) 2007-07-18 2009-02-05 Fujifilm Corp 画像処理装置、画像処理方法、及びプログラム
JP2009027457A (ja) 2007-07-19 2009-02-05 Fujifilm Corp 画像処理装置、画像処理方法、及びプログラム
JP2012080518A (ja) 2010-09-07 2012-04-19 Ricoh Co Ltd 映像送受信システム及び映像送信方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3046379B2 (ja) 1990-03-26 2000-05-29 株式会社東芝 画像符号化装置
JP2000013608A (ja) 1998-06-23 2000-01-14 Ricoh Co Ltd 画像処理方法
JP2002271793A (ja) 2001-03-12 2002-09-20 Canon Inc 画像圧縮符号化装置及び方法
US8144214B2 (en) * 2007-04-18 2012-03-27 Panasonic Corporation Imaging apparatus, imaging method, integrated circuit, and storage medium
EP2179589A4 (en) * 2007-07-20 2010-12-01 Fujifilm Corp IMAGE PROCESSING DEVICE, IMAGE PROCESSING AND PROGRAM
US8270476B2 (en) 2008-12-31 2012-09-18 Advanced Micro Devices, Inc. Face detection system for video encoders
JP5308391B2 (ja) * 2010-03-31 2013-10-09 富士フイルム株式会社 画像符号化装置および方法並びにプログラム
CN103548340B (zh) * 2011-05-24 2017-12-29 日产自动车株式会社 车辆用监视装置以及车辆的监视方法
US9161012B2 (en) * 2011-11-17 2015-10-13 Microsoft Technology Licensing, Llc Video compression using virtual skeleton
JP2016072863A (ja) * 2014-09-30 2016-05-09 株式会社ニコン 電子機器、再生装置、記録媒体、記録プログラム、再生プログラム、記録方法および再生方法
US9602758B2 (en) 2015-07-10 2017-03-21 Ricoh Company, Ltd. Communication apparatus, conference system, computer-readable recording medium, and display control method
JP6565777B2 (ja) 2015-07-10 2019-08-28 株式会社リコー 通信装置、会議システム、プログラムおよび表示制御方法
JP6816352B2 (ja) 2015-10-08 2021-01-20 株式会社リコー 投影装置、投影システム及びプログラム
JP2017219762A (ja) 2016-06-09 2017-12-14 株式会社リコー プロジェクタ、投影方法、及び、プログラム
US10129511B2 (en) 2016-08-01 2018-11-13 Ricoh Company, Ltd. Image processing apparatus, image projection apparatus, and image processing method
JP6729170B2 (ja) * 2016-08-23 2020-07-22 沖電気工業株式会社 画像処理システム及び画像復号装置
JP6946684B2 (ja) 2017-03-17 2021-10-06 株式会社リコー 電子情報ボードシステム、画像処理装置、及びプログラム
WO2018176494A1 (en) * 2017-04-01 2018-10-04 SZ DJI Technology Co., Ltd. Method and system for video transmission

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009027367A (ja) 2007-07-18 2009-02-05 Fujifilm Corp 画像処理装置、画像処理方法、及びプログラム
JP2009027457A (ja) 2007-07-19 2009-02-05 Fujifilm Corp 画像処理装置、画像処理方法、及びプログラム
JP2012080518A (ja) 2010-09-07 2012-04-19 Ricoh Co Ltd 映像送受信システム及び映像送信方法

Also Published As

Publication number Publication date
US10979628B2 (en) 2021-04-13
JP2019129382A (ja) 2019-08-01
US20190230279A1 (en) 2019-07-25
EP3515061A1 (en) 2019-07-24

Similar Documents

Publication Publication Date Title
CN107230182B (zh) 一种图像的处理方法、装置以及存储介质
US9762857B2 (en) Video and audio processing devices and video conference system
WO2020082902A1 (zh) 视频的音效处理方法及相关产品
TW201901527A (zh) 視訊會議裝置與視訊會議管理方法
US20100026781A1 (en) Video region of interest features
KR20210073570A (ko) 이미지 처리 방법 및 장치, 및 디바이스
CN104380727B (zh) 图像处理装置和图像处理方法
CN110069974B (zh) 高光图像处理方法、装置和电子设备
CN105957037B (zh) 图像增强方法及装置
JP2018517993A (ja) 実時間ビデオエンハンスメント方法、端末及び非一時的コンピュータ可読記憶媒体
CN110868544B (zh) 一种拍摄方法及电子设备
WO2022110687A1 (zh) 图像处理方法、装置、电子设备以及可读存储介质
EP4142295A1 (en) Audio processing method and electronic device
CN114531564B (zh) 处理方法及电子设备
JP7334470B2 (ja) 映像処理装置、ビデオ会議システム、映像処理方法、およびプログラム
CN116668656B (zh) 图像处理方法及电子设备
CN106020846A (zh) 桌面工具显示方法及装置
JP7006302B2 (ja) 画像処理装置、画像処理システム、及びビデオ会議システム
CN111050211B (zh) 视频处理方法、装置及存储介质
US20200106821A1 (en) Video processing apparatus, video conference system, and video processing method
US10834358B1 (en) Enhancing video quality based on metadata at a client device having more processing power in a system of client devices having different amounts of processing power
CN115205164B (zh) 图像处理模型的训练方法、视频处理方法、装置及设备
CN110766610A (zh) 一种超分辨率图像的重建方法及电子设备
JP2007150877A (ja) 通信端末およびその表示方法
JP7287118B2 (ja) 画像処理装置、プログラム、及び画像処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201023

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210616

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210803

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210908

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211207

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211220