JP5031016B2 - 画像処理装置、画像処理方法およびプログラム - Google Patents
画像処理装置、画像処理方法およびプログラム Download PDFInfo
- Publication number
- JP5031016B2 JP5031016B2 JP2009277481A JP2009277481A JP5031016B2 JP 5031016 B2 JP5031016 B2 JP 5031016B2 JP 2009277481 A JP2009277481 A JP 2009277481A JP 2009277481 A JP2009277481 A JP 2009277481A JP 5031016 B2 JP5031016 B2 JP 5031016B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- unit
- speaker
- conference
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Description
実施の形態1では、本発明の広角画像録画再生システムを会議の録画再生に適用した会議録画再生システムについて説明する。ここでは、まず、会議録画再生システムがどのように使用されるかの使用例について簡単に概説し、次に、会議録画再生システムを構成する要素(画像と音声の入力部に該当する会議画像送出装置、および、その画像と音声の録画再生部に該当する会議画像再生装置)を説明し、最後に処理流れについて説明する。
図1は、本発明を会議場面に設置した使用例を概説する説明図である。会議録画再生システム100は、広角画像と音声を入力する会議画像送出装置200と、会議画像送出装置200で入力された画像と音声を録画再生する会議画像再生装置300と、を有する。
図2は、実施の形態1の会議画像送出装置200の外観斜視図である。また、図3は、実施の形態1の会議画像送出装置200の正面図と平面図である。会議画像送出装置200は、鉛直方向を中心もしくは軸とした広角画像を入力するカメラ部201と、音声を入力するマイク部202と、を有する。ここで、広角画像とは少なくとも水平面を見渡す全周囲(360°)を含む画像をいう。
図4は、実施の形態1の会議画像送出装置200のカメラ部201の構成例を示した説明図である。カメラ部201は、双曲面ミラー211と、レンズ212と、絞り213と、光電変換素子であるCCD(Charge Coupled
Device)214と、を有する。
次に、マイク部202の内容について説明する。図2もしくは図3を用いて説明したように、マイク部202には、複数のマイクロフォン221が備わっている。以降においては、この複数のマイクロフォン221を、適宜マイクロフォンアレイと称することとする。マイクロフォン221は、圧電型、容量型(いわゆるコンデンサマイクロフォン)など様々な種類のものを使用することができる。後述するように、複数のマイクロフォンを用いることにより、音源方向(話者方向)を検知することができる。
次に、会議画像再生装置300の構成について説明する。図7は、実施の形態1の会議画像再生装置300の構成例を示した図である。会議画像再生装置300は、各種の制御および処理をおこなうCPU(Central Processing Unit)301と、SDRAM(Synchronous Dynamic Random Access Memory)302と、HDD(Hard Disk Drive)303と、マウス等のポインティングデバイス、キーボード、ボタン等に対する入力インターフェース(以下I/Fと称することとする)304と、電源305と、表示I/F306と、DVD(Digital Versatile Disc)−RAMドライブ等の大容量記録装置307と、会議画像送出装置200と接続するための外部I/F308と、を有し、バス309を介して接続されている。なお、表示I/F306はCRT等のディスプレイに接続される。
次に、広角会議録画再生システム100の機能的構成を説明しつつ、広角画像を矩形の出力画像となるように変形する画像処理や音源方向の検出処理について説明する。図8は、会議録画再生システム100の機能的構成の一例を示したブロック図である。
広角画像入力部801は、鉛直方向を中心もしくは軸とした広角画像を取り込み、その画像データを記録部804に送出する。広角画像の例としては図6にあげられたドーナツ型の画像があげられる。広角画像入力部801は、たとえば、図4に示した双曲面ミラー211と、レンズ212と、絞り213と、CCD214と、駆動処理部215と、前処理回路216によりその機能を実現できる。
音声入力部802は、音声を入力し電気信号(音声データ)に変換し、その音声データを音源方向検出部803と記録部804に送出する。音声入力部802は、マイクロフォン221(図2または図3参照)によりその機能を実現することができる。なお、マイクロフォン221は前述したように複数配置され、それぞれのマイクロフォン221からの音声データに基づいて音源方向が検出される。
s1(t)=s2(t−(l・cosθ)/v) ・・・(1)
記録部804は、画像入力部801から出力された広角画像の動画データ、音声入力部802から出力された音声データ、音源方向検出部803から出力された音源方向に関するデータを記録する。記録の方式は様々挙げられるが、たとえば動画データに関しては、MPEGに代表される動画符号化フォーマットなどの形式で記録する。また、音声データに関してはMPEGオーディオフォーマットを用いてもよく、PCMフォーマットを用いてもよい。
次に、画像変形部805およびこれに付随する機能部について説明する。画像変形部805は、ドーナツ形状(もしくは円形状の)広角画像を矩形の出力画像となるように変形する。一般に、広角の範囲を一時に撮影して得られる映像は、人間の眼で確認できる像の形状と異なり、大きな歪みが含まれている。したがって、記録部804に記録された会議を後に再生するには、変形処理が必要となる。
(u,v) :ドーナツ画像における座標
(u0,v0) :ドーナツ画像における双曲面ミラーの中心の座標
(θ,φ) :パノラマ画像における座標
r :(u0,v0)から(u,v)への画素単位の距離
rmax :ドーナツ画像における双曲面ミラーの画素単位の半径
θ :方位角
φ :仰角
ψ :カメラの光軸からの頂角
F :双曲面ミラーの焦点
F’ :双曲面ミラーと対をなす双曲面の焦点
(カメラの光学中心に一致する)
(i):点(u,v)に対応する極座標(r,θ)を、次式(6)を解くことにより求める。
(u,v)=(rcosθ+u0,rsinθ+v0) ・・・(6)
(ii):(6)式により算出されたrに対応する頂角ψを次式(7)により求める。
であり、ψmaxはドーナツ画像上の半径rmaxの位置および仰角φmaxに対応する頂角ψの値である。ψmaxの値は、(4)式にφmaxを代入することにより求めることができる。
(iii):(7)式により算出されたψに対応する仰角φを、(4)式により求める。
画像音声出力部808は、画像変形部805から出力された画像(動画データ)と、この画像が撮影(入力)された際に同時に録音(入力)された音声を対応づけて出力する。すなわち、画像と音声の同期をとって出力する。プロセッサ(たとえばCPU301)の処理速度によっては、音声と画像のタイムラグが生じるので、画像音声出力部808は、画像と音声の同期をとることにより会議を自然な感じで再現する。画像音声出力部808は、たとえば、図3に示した会議画像再生装置300のCPU301と、HDD303に格納された所定のプログラムによりその機能を実現することができる。
次に、会議録画再生システム100の処理流れについて説明する。図18は、会議録画再生システム100の処理流れの例を示した説明図である。会議録画再生システム100は、まず、録画開始ボタン(図示せず)が押下されることにより、録画を開始する(ステップS1801)。この開始動作以降、鉛直方向を中心もしくは軸とした広角画像(ドーナツ画像)をカメラ部201から順次入力し、また、音声をマイク部202から順次入力する(ステップS1802)。なお、マイク部202から入力された音声に関しては、前述したマイクの組を使って音源方向を随時検出しておく。
実施の形態2では、広域画像をパノラマ画像に変形してから録画する会議画像録画再生システムについて説明する。なお、実施の形態2では実施の形態1と同様の構成部分については同一の符号を付し、その説明を省略するものとする。以降では、会議録画再生システム1900の外観構成、ハードウェア構成、機能的構成、処理流れについて順に説明する。
図19は、実施の形態2の画像録画再生システムの外観構成の一例を示した図である。画像録画再生システム1900は、十字ボタン1901と、決定ボタン1902と、画像音声出力端子1903と、媒体挿入スロット1904と、を有する。実施の形態1の会議録画再生システム100は、画像と音声を取り込む会議画像送出装置200と、その動画を記録して加工再生する会議画像再生装置300とが別体となっていたが、実施の形態2の会議録画再生システム1900は、画像音声の入力、格納、加工、再生出力を一つの筐体でおこなう。
次に、会議録画再生システム1900のハードウェア構成について説明する。図20は、実施の形態2の会議画像録画再生システムのハードウェア構成の一例を示した説明図である。会議録画再生システム1900は、CPU301の他、RAM2001、ROM2002、操作部2003、出力I/F2004と、カメラ部2005と、マイク部2006と、リムーバブルメディア部2007と、を有する。なお、カメラ部2005は、図19に示した光学系を含んだカメラ部201を便宜的に示した表記であり、また、マイク部2006も、図19に示したマイクロフォン221を含んだマイク部202を便宜的に示した表記である。
次に、会議録画再生システム1900の機能的構成について説明する。図21は、会議録画再生システム1900の機能的構成の一例を示した説明図である。会議録画再生システム1900は、その機能的構成として、図8に説明した各機能部の他、広角画像展開部2101と画像抽出部2102を備える。
広角画像展開部2101は、ドーナツ画像をパノラマ画像に変形する。実施の形態1の会議録画再生システム100では、再生時に画像の変形を行っていたが(図8の画像変形部805参照)、実施の形態2の会議録画再生システム1900では、録画時に画像の変形をおこなう。換言すれば、会議録画再生システム1900では、記録部804への記録前に広角画像をパノラマ画像へ展開し、このパノラマ画像が記録される。展開処理については、式(4)〜式(8)を用いて計算すればよいのでその説明を省略する。
画像抽出部2102は、記録部804に記録されたパノラマ画像のうち音源方向に対応する所定の画像領域を切り出し(抽出し)、画像音声出力部808に出力する。たとえば、会議参加者A(図6参照)が発言中である場合には、音源方向データに基づき、図14の様に展開され記録された映像データを基に、参加者Aに該当する部分を抽出する。以降では、この切り出された画像を部分画像と称することとする。図22は、画像抽出の例を示した説明図である。図示したように画像抽出部2102は、参加者Aのみが映された部分画像データを生成する。
次に、会議録画再生システム1900の処理流れについて説明する。図24は、会議録画再生システム100の処理流れの例を示した説明図である。会議録画再生システム100は、まず、録画開始ボタン(図示せず)が押下されることにより、録画を開始する(ステップS2401)。この開始動作以降、鉛直方向を中心もしくは軸とした広角画像をカメラ部201から順次入力し、また、音声をマイク部202から順次入力する(ステップS2402)。なお、マイク部202から入力された音声に関しては、前述したマイクの組を使って音源方向を随時検出しておく。
実施の形態3では、会議録画再生システムのうち、カメラ部およびマイク部が実施の形態1または2とは異なった態様について説明する。図25は、実施の形態3のカメラ部を含んだ装置の外観構成の一例を示した説明図である。図から明らかなように、会議録画再生システム2500のカメラ部2501は、双曲面ミラーの代わりに円錐形状を有する鏡面体2502を有する。ドーナツ画像からパノラマ画像への変換式についての説明は省略するが、図4に示したレンズ212のように、適宜レンズを配することによりCCD214の表面上に焦点を合わせるようにする。なお、使用の態様によっては、放物面を有する鏡面体であってもよい。
実施の形態4では、汎用性のある会議画像送出装置および会議画像再生装置について説明する。ここで汎用性のあるとは、広角画像を取り込む鏡面体の構成やマイクロフォンの種類等により会議画像送出装置や会議画像再生装置が複数種類あっても、任意の組み合わせにより会議の録画ないし再生ができることをいう。なお、実施の形態4においても、実施の形態1〜3と同様の構成部分については、特に断らない限り同一の符号を付し、その説明を省略するものとする。
実施の形態5では、汎用性のある会議画像送出装置および会議画像再生装置の他の構成例について説明する。なお、実施の形態5においても、実施の形態1〜4と同様の構成部分については、特に断らない限り同一の符号を付し、その説明を省略するものとする。
200,2801,3201 会議画像送出装置
201,2005,2501,2600 カメラ部
202,2006,2701 マイク部
203,2032 台座
204 透明ガラス
211 双曲面ミラー
212 レンズ
213 絞り
221,2702 マイクロフォン
300 会議画像再生装置
307 大容量記録装置
801,2811,3211 広角画像入力部
802,2812,3212 音声入力部
803,3213 音源方向検出部
804,2813,2822,3222 記録部
805,2803,2823 画像変形部
806,3224 方向修正部
807,2824 領域固定部
808,2825,3223 画像音声出力部
809 話者位置判断部
810 領域決定部
1901 十字ボタン
1902 決定ボタン
1903 画像音声出力端子
1904 媒体挿入スロット
2003 操作部
2007 リムーバブルメディア部
2101,3214 広角画像展開部
2102,3215 画像抽出部
2500,2800,3200 会議録画再生システム
2502 鏡面体
2601 第1の反射鏡
2602 第2の反射鏡
2802,3202,3302 会議画像再生装置
2814 仰角設定部
2815,3216 データ送出部
2821,3221 データ入力部
3602 モード切替部
3603 方向指示操作部
3604 再生操作指示部
Claims (7)
- 広角画像からパノラマ画像を展開する広角画像展開部と、
前記パノラマ画像から、話者を含む画像を抽出する画像抽出部と、
前記話者を含む画像と、前記話者の音声を含む音情報と、を対応付けて記憶部に記憶させるデータ送出部と、
前記話者を含む画像と、前記話者の音声を含む音情報と、を対応付けて出力部に出力させる画像音声出力部と、を備え、
前記画像音声出力部は、話者が所定の大きさとなるように拡大または縮小させた話者を含む画像を、前記出力部に出力させることを特徴とする画像処理装置。 - 前記記憶部には、前記広角画像展開部で展開したパノラマ画像が記憶されることを特徴とする請求項1に記載の画像処理装置。
- 前記記憶部には、前記話者の音源方向が記憶されることを特徴とする請求項1に記載の画像処理装置。
- 前記画像抽出部は、前記話者の音源方向に基づいて、前記話者を含む画像を抽出することを特徴とする請求項3に記載の画像処理装置。
- 話者が所定の大きさとなるように拡大または縮小させた話者を含む画像を再生することを特徴とする請求項1に記載の画像処理装置。
- 広角画像からパノラマ画像を展開するステップと、
前記パノラマ画像から、話者を含む画像を抽出するステップと、
前記話者を含む画像と、前記話者の音声を含む音情報と、を対応付けて記憶部に記憶させるステップと、
前記話者を含む画像と、前記話者の音声を含む音情報と、を対応付けて出力部に出力させる画像音声出力ステップと、を含み、
前記画像音声出力ステップは、話者が所定の大きさとなるように拡大または縮小させた話者を含む画像を、前記出力部に出力させることを特徴とする画像処理方法。 - 広角画像からパノラマ画像を展開するステップと、
前記パノラマ画像から、話者を含む画像を抽出するステップと、
前記話者を含む画像と、前記話者の音声を含む音情報と、を対応付けて記憶部に記憶させるステップと、
前記話者を含む画像と、前記話者の音声を含む音情報と、を対応付けて出力部に出力させる画像音声出力ステップと、をコンピュータに実行させるためのプログラムであって、
前記画像音声出力ステップは、話者が所定の大きさとなるように拡大または縮小させた話者を含む画像を、前記出力部に出力させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009277481A JP5031016B2 (ja) | 2009-12-07 | 2009-12-07 | 画像処理装置、画像処理方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009277481A JP5031016B2 (ja) | 2009-12-07 | 2009-12-07 | 画像処理装置、画像処理方法およびプログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001203958A Division JP4439763B2 (ja) | 2001-07-04 | 2001-07-04 | 画像録画再生システムおよび画像録画再生方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010081644A JP2010081644A (ja) | 2010-04-08 |
JP5031016B2 true JP5031016B2 (ja) | 2012-09-19 |
Family
ID=42211456
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009277481A Expired - Lifetime JP5031016B2 (ja) | 2009-12-07 | 2009-12-07 | 画像処理装置、画像処理方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5031016B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106161985A (zh) * | 2016-07-05 | 2016-11-23 | 宁波菊风系统软件有限公司 | 一种浸入式视频会议的实现方法 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6464449B2 (ja) * | 2014-08-29 | 2019-02-06 | 本田技研工業株式会社 | 音源分離装置、及び音源分離方法 |
JP2017034313A (ja) | 2015-07-28 | 2017-02-09 | 株式会社リコー | 撮影装置、プログラム及び撮影方法 |
JP2017059902A (ja) | 2015-09-14 | 2017-03-23 | 株式会社リコー | 情報処理装置、プログラム、画像処理システム |
JP7017045B2 (ja) * | 2016-09-30 | 2022-02-08 | 株式会社リコー | 通信端末、表示方法、及びプログラム |
JP6919242B2 (ja) * | 2017-03-16 | 2021-08-18 | 株式会社リコー | 音声取得装置 |
JPWO2019187521A1 (ja) * | 2018-03-28 | 2020-04-30 | 株式会社村田製作所 | 音声情報送信装置、音声情報送信方法、音声情報送信プログラム、音声情報解析システム及び音声情報解析サーバ |
JP2021105688A (ja) * | 2019-12-27 | 2021-07-26 | 株式会社イトーキ | 会議支援装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63104085A (ja) * | 1986-10-22 | 1988-05-09 | 三洋電機株式会社 | デイスプレイ装置 |
JP2808553B2 (ja) * | 1987-04-23 | 1998-10-08 | キヤノン株式会社 | 画像処理装置 |
JPH11205772A (ja) * | 1998-01-16 | 1999-07-30 | Matsushita Joho System Kk | 全方位撮像画像伝送システム及び全方位撮像画像伝送方法 |
JPH11331827A (ja) * | 1998-05-12 | 1999-11-30 | Fujitsu Ltd | テレビカメラ装置 |
JP3494075B2 (ja) * | 1999-05-25 | 2004-02-03 | 三菱電機株式会社 | 移動体の自己位置標定装置 |
JP2001008232A (ja) * | 1999-06-25 | 2001-01-12 | Matsushita Electric Ind Co Ltd | 全方位映像出力方法と装置 |
US7015954B1 (en) * | 1999-08-09 | 2006-03-21 | Fuji Xerox Co., Ltd. | Automatic video system using multiple cameras |
JP2001148850A (ja) * | 1999-11-18 | 2001-05-29 | Canon Inc | 映像処理装置、映像処理方法、映像配信システム、記憶媒体 |
-
2009
- 2009-12-07 JP JP2009277481A patent/JP5031016B2/ja not_active Expired - Lifetime
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106161985A (zh) * | 2016-07-05 | 2016-11-23 | 宁波菊风系统软件有限公司 | 一种浸入式视频会议的实现方法 |
CN106161985B (zh) * | 2016-07-05 | 2019-08-27 | 宁波菊风系统软件有限公司 | 一种浸入式视频会议的实现方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2010081644A (ja) | 2010-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4439763B2 (ja) | 画像録画再生システムおよび画像録画再生方法 | |
JP5031016B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
JP4908543B2 (ja) | 会議画像再生システムおよび会議画像再生方法 | |
JP4474013B2 (ja) | 情報処理装置 | |
JP4451892B2 (ja) | 映像再生装置、映像再生方法、及び映像再生プログラム | |
US20190222950A1 (en) | Intelligent audio rendering for video recording | |
EP1377041A2 (en) | Integrated design for omni-directional camera and microphone array | |
EP3278163B1 (en) | Depth imaging system | |
JP2007295335A (ja) | カメラ装置および画像記録再生方法 | |
US10079996B2 (en) | Communication system, communication device, and communication method | |
CN104580992A (zh) | 一种控制方法及移动终端 | |
JP4414708B2 (ja) | 動画表示用パーソナルコンピュータ、データ表示システム、動画表示方法、動画表示プログラムおよび記録媒体 | |
TW201734948A (zh) | 用於在廣角圖像系統中生成相關的音頻和視覺信號的方法、系統及設備 | |
CN111163281A (zh) | 一种基于语音跟踪的全景视频录制方法及装置 | |
JP2019220848A (ja) | データ処理装置、データ処理方法及びプログラム | |
JP2009182979A (ja) | 会議画像再生装置および会議画像再生方法 | |
US20170215005A1 (en) | Audio refocusing methods and electronic devices utilizing the same | |
JP2003111041A (ja) | 画像処理装置、画像処理システム、画像処理方法、記憶媒体、及びプログラム | |
JP3954439B2 (ja) | 映像記録システム、プログラム及び記録媒体 | |
JP4373645B2 (ja) | 映像配信システム、プログラム及び記録媒体 | |
US20230292011A1 (en) | Information processing system, image-capturing device, and display method | |
KR101121030B1 (ko) | 촬상장치 | |
JP2007060026A (ja) | 映像処理装置及びオブジェクト特定方法 | |
JP6191333B2 (ja) | 情報処理装置、通信システムおよびプログラム | |
KR20100006029A (ko) | 원격 화상회의시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120206 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120228 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120528 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20120605 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120626 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120626 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5031016 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150706 Year of fee payment: 3 |
|
EXPY | Cancellation because of completion of term |