JP4862645B2 - Video conferencing equipment - Google Patents
Video conferencing equipment Download PDFInfo
- Publication number
- JP4862645B2 JP4862645B2 JP2006341175A JP2006341175A JP4862645B2 JP 4862645 B2 JP4862645 B2 JP 4862645B2 JP 2006341175 A JP2006341175 A JP 2006341175A JP 2006341175 A JP2006341175 A JP 2006341175A JP 4862645 B2 JP4862645 B2 JP 4862645B2
- Authority
- JP
- Japan
- Prior art keywords
- video
- sound
- data
- camera
- conference
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/141—Systems for two-way working between two video terminals, e.g. videophone
- H04N7/142—Constructional details of the terminal equipment, e.g. arrangements of the camera and the display
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/0007—Image acquisition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/698—Control of cameras or camera modules for achieving an enlarged field of view, e.g. panoramic image capture
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Studio Devices (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Description
この発明は、互いに離れた会議室間でビデオ会議を行う際に用いる映像や画像と音声とを通信するビデオ会議装置に関するものである。 The present invention relates to a video conferencing apparatus that communicates video, images, and audio used in a video conference between conference rooms separated from each other.
従来、互いに離れた複数地点間でビデオ会議を行う場合、それぞれの地点に特許文献1に示すようなビデオ会議装置(テレビ会議装置)を配置し、当該ビデオ会議装置を取り囲むように会議者が在席して会議を行う。
Conventionally, when a video conference is performed between a plurality of points distant from each other, a video conference device (video conference device) as shown in
特許文献1のビデオ会議装置では、各会議者に電波発生器付きマイクを装着させ、最も高レベルの音声を収音したマイクから電波を放射する。人物撮影用カメラは、この電波を受信することで話者方向を検出して、当該話者方向へカメラを向け、話者を中心とする映像を撮像する。この映像データと音声データとは符号化され、相手先のビデオ会議装置に送信される。
ビデオ会議を行う場合、上述のように話者等の会議者の映像だけでなく、離れた地点間で資料等を共通に参照したい場合がある。特許文献1の装置では、話者の映像を切り替えて取得することができるが、このままでは資料を映すことはできない。このため、特許文献1の構成を利用して資料を映すには、会議者が手差しでカメラの前に資料を翳せばよいが、資料を完全に固定することができないので、画像がブレてしまう。また、レンズによる湾曲の影響を受けて、資料をありのまま(元画像のまま)取り込むことができない。また、資料を共通で参照する別方法として、資料をデータ化して送信することも可能ではあるが、会議中に書き込みをして説明する等の直感的で、フレキシビリティに富んだ資料を提供することができない。
When a video conference is performed, there are cases where it is desired to refer not only to the video of a conference person such as a speaker as described above but also to materials in common between distant points. With the apparatus of
したがって、本発明の目的は、音声、映像とともに、フレキシビリティに富むような資料であっても、正確且つ明瞭に送信することができるビデオ会議装置を提供することにある。 Accordingly, an object of the present invention is to provide a video conferencing apparatus capable of accurately and clearly transmitting even a highly flexible material together with audio and video.
この発明は、所定領域を撮像するカメラと、該カメラの撮像した映像に基づいて映像データを生成する映像データ生成手段と、自装置周囲の音声を収音して収音音声データを生成する収音手段と、放音音声データを放音する放音手段と、前記収音手段および放音手段が設けられた筐体と、前記収音音声データと前記映像データとで通信データを形成し、当該通信データを外部に送信するとともに、外部からの通信データから放音音声データを取得して前記放音手段に与える通信手段と、前記カメラを前記筐体に対して一定に支持する支持手段と、を備えたビデオ会議装置であって、前記カメラは、会議者撮像領域と、前記筐体の近傍の前記カメラに近接する領域とを同時に撮像し、前記映像データ生成手段は、前記会議者撮像領域に対応する第1部分映像データから、前記収音音声データに対応する方位領域のみを切り出して、切り出した第1部分映像データを第1補整処理により補整し、前記カメラに近接する領域に対応する第2部分映像データを、前記第1補整処理と異なる第2補整処理により補整する。
This invention produces a camera for imaging a predetermined region, and the image data generation means for generating image data based on the video imaged in the camera, the picked-up sound data picked up ambient sounds own device Communication data is formed by sound collection means, sound emission means for emitting sound emission data, a housing provided with the sound collection means and sound emission means, and the sound collection sound data and the video data. A communication means for transmitting the communication data to the outside, acquiring sound emission sound data from the communication data from the outside, and providing the sound emission means to the sound emission means; and a support means for supporting the camera with respect to the casing. A video conferencing apparatus, wherein the camera simultaneously images a conference person imaging area and an area close to the camera in the vicinity of the housing, and the video data generating means Corresponds to the
この構成のビデオ会議装置は、会議者撮像領域に対応する第1部分映像データと、カメラに近接する資料が配置された領域に対応する第2部分映像データとが、一台のカメラで同時に取得される。そして、第1部分映像データは、収音音声データに対応する方位領域のみが切り出され、第1補整処理により適宜補整される。第2部分映像データは、対応する第2補整処理により適宜見やすいように補整される。 With this configuration, the video conferencing apparatus simultaneously acquires the first partial video data corresponding to the conference person imaging area and the second partial video data corresponding to the area where the material close to the camera is arranged by one camera. Is done. In the first partial video data, only the azimuth area corresponding to the collected sound data is cut out and appropriately corrected by the first correction processing. The second partial video data is adjusted so as to be easily viewable by the corresponding second correction processing.
これにより、会議者映像と資料等の静止画とが、同時に取得され、且つ、それぞれの撮影仕様に応じて補整される。この結果、相手先装置に対して、それぞれ適正に補整された会議者映像と資料画像とを同時に送信することもできる。 Thereby, a conference person image and a still image such as a document are acquired at the same time, and are corrected according to each shooting specification. As a result, it is also possible to simultaneously transmit the conference person video and the material image appropriately corrected to the destination apparatus.
この発明のビデオ会議装置は、通信データに用いる部分映像データを選択する選択手段を備える。ビデオ会議装置の映像データ生成手段は、選択手段により選択された部分映像データを通信手段に与える。 The video conference apparatus according to the present invention includes selection means for selecting partial video data used for communication data. The video data generation means of the video conference apparatus gives the partial video data selected by the selection means to the communication means.
この構成では、会議者映像と静止画とのうちの選択されたいずれか一方が送信される。これにより、経時変化の殆どない静止画を必要なときにのみ送信することができるので、通信系に余分な負荷を掛けることがない。 In this configuration, any one selected from the conference video and the still image is transmitted. As a result, a still image that hardly changes with time can be transmitted only when necessary, so that no extra load is applied to the communication system.
また、この発明のビデオ会議装置では、カメラに魚眼レンズを有し、該魚眼レンズにより撮像される領域の中心領域をカメラに近接する領域とし、少なくとも中心領域から外の周辺領域を会議者撮像領域とすることを特徴としている。 In the video conference apparatus of the present invention, the camera has a fish-eye lens, the center area of the area imaged by the fish-eye lens is an area close to the camera, and at least the peripheral area outside the center area is the conference person imaging area. It is characterized by that.
この構成のビデオ会議装置では、具体的なカメラの仕様として魚眼レンズを利用する。そして、魚眼レンズの中心に対応する領域をカメラが近接する領域とし、この領域に応じた補整処理により適宜補整を行う。会議者撮像領域は、態様の切り替えを行う場合は中心領域も使用することがあるが、周辺領域を使用することが主となる。したがって、会議者領域の映像に関しては、それぞれの場合に応じて、選択した領域に応じた補整処理により適宜補整を行う。これにより、カメラ近傍の近接領域の映像(画像)と会議者撮像領域の映像とを、魚眼レンズを介して撮像しても、それぞれの映像が適宜補整される。 In the video conferencing apparatus having this configuration, a fisheye lens is used as a specific camera specification. Then, an area corresponding to the center of the fisheye lens is set as an area close to the camera, and correction is appropriately performed by correction processing according to the area. As the conference person imaging area, the center area may be used when the mode is changed, but the peripheral area is mainly used. Therefore, the video in the conference area is appropriately corrected by the correction processing according to the selected area in each case. Thereby, even if the video (image) of the proximity region near the camera and the video of the conference person imaging region are imaged via the fisheye lens, the respective images are appropriately corrected.
また、この発明のビデオ会議装置の映像データ生成手段は、カメラと一体形成されている。また、この発明のビデオ会議装置の通信手段は、放音手段および収音手段とともに筐体に一体形成されている。また、この発明のビデオ会議装置の映像データ生成手段は、放音手段および収音手段とともに筐体に一体形成されている。これらにより、ビデオ会議装置がコンパクトに構成される。 The video data generating means of the video conference apparatus of the present invention is formed integrally with the camera. The communication unit of the video conferencing system of the present invention is integrally formed in the housing with a sound unit and sound pickup means release. The video data generating means of the video conferencing system of the present invention is integrally formed in the housing with a sound unit and sound pickup means release. As a result, the video conference apparatus is configured in a compact manner.
また、この発明のビデオ会議装置は映像データを再生するディスプレイモニタを備える。このビデオ会議装置の通信手段は、通信データに含まれる映像データを取得して、ディスプレイモニタに与える。 The video conference apparatus according to the present invention further includes a display monitor for reproducing video data. The communication means of this video conference apparatus acquires video data included in the communication data and gives it to the display monitor.
これにより、通信会議を行う各地点に本発明のビデオ会議装置を配置して接続するだけで、双方で会議者映像と資料とを簡単に共有することができる。 As a result, the conference video and materials can be easily shared by both parties simply by arranging and connecting the video conference apparatus of the present invention at each point where the communication conference is performed.
この発明によれば、簡単なカメラ方向の操作で、話者の映像は話者の映像に応じた補整処理で補整され、資料の画像は資料の画像に応じた補整処理で補整されるので、話者映像および資料画像を、ともに正確且つ明瞭に相手側装置に送信することができる。これにより、本装置を用いたビデオ会議では、より臨場感の有る、互いに分かりやすい会議を簡単に実現することができる。 According to the present invention, with a simple camera direction operation, the video of the speaker is corrected by the correction processing according to the video of the speaker, and the image of the material is corrected by the correction processing according to the image of the material. Both the speaker video and the material image can be transmitted to the counterpart device accurately and clearly. As a result, in the video conference using the present apparatus, it is possible to easily realize a conference that is more realistic and easy to understand.
本発明の第1の実施形態に係るビデオ会議装置について、図を参照して説明する。
図1、図2は本実施形態のビデオ会議装置の外観図であり、(A)が平面図、(B)が側面図である。図1、図2では、機構的に特徴のある放収音装置、カメラ、ステーの構成のみを示し、通信端末、放収音装置、およびカメラを電気的に接続するケーブルについては図示を省略する。また、図1は会議者撮影モード時の機構状態を示し、図(2)は資料撮影モード時の機構状態を示す。
図3は本実施形態のビデオ会議装置の主要構成を示すブロック図である。
A video conference apparatus according to a first embodiment of the present invention will be described with reference to the drawings.
1 and 2 are external views of the video conference apparatus according to the present embodiment, in which (A) is a plan view and (B) is a side view. 1 and 2 show only the structure of the sound emission / collection device, camera, and stay that are mechanically characteristic, and the communication terminals, the sound emission / collection device, and the cable that electrically connects the camera are not shown. . FIG. 1 shows the mechanism state in the conference shooting mode, and FIG. 2 shows the mechanism state in the document shooting mode.
FIG. 3 is a block diagram showing the main configuration of the video conference apparatus according to the present embodiment.
なお、図1、図2、図3およびこれ以降の本明細書で参照される図においては、マイクを代表または総称して「MC」で表し、スピーカを代表または総称して「SP」で表す。
本実施形態のビデオ会議装置は、平面視した形状が円盤状の放収音装置1と、撮像機能および映像データ生成機能を備えるカメラ2と、カメラ2を放収音装置1に対して所定位置に設置するステー3とを備える。また、図1、図2には図示していないが、放収音装置1とカメラ2とは電気的に接続され、さらにビデオ会議装置は、放収音装置1とカメラ2とに電気的に接続する通信端末を備える。
In FIG. 1, FIG. 2, FIG. 3, and the drawings referred to in this specification, the microphone is represented or generically represented by “MC”, and the speaker is represented or generically represented by “SP”. .
The video conference apparatus according to the present embodiment includes a sound emitting and collecting
通信端末5は、ネットワーク500を介して接続された相手先のビデオ会議装置の通信端末から受信した通信データを復調して、放音用音声信号、相手先装置ID、話者方位データを取得して、ケーブル接続された自装置側の放収音装置1に与える。また、通信端末5は、自装置側の放収音装置1から受信した収音音声信号および話者位置データと、カメラ2から受信した映像データとに基づいて通信データを生成する。通信端末5は、生成した通信データを、相手先ビデオ会議装置の通信端末へ送信する。また、通信端末5は、場合に応じて、放収音装置1とカメラ2との間での話者位置データの送受信を仲介する。
The
放収音装置1は円板状の筐体11を備える。具体的に、筐体11は、平面視した形状が円形であり、天面と底面との面積が垂直方向の途中部分の面積よりも狭く、側面視した形状が、高さ方向の一点から天面に向けて狭くなるとともに、前記一点から底面に向けて狭くなる形状からなる。すなわち、前記一点より上部側および下部側にそれぞれ傾斜面を有する形状からなる。筐体11の天面には、該天面の面積よりも狭く、所定深さからなる凹部110が形成されており、凹部110の平面視した中心と天面の中心とが、一致するように設定されている。
The sound emission and
16個のマイクMC1〜MC16は、凹部110の側面に沿った筐体11の天面側内部に設置されており、各マイクMC1〜MC16は放収音装置1を平面視した中心を回転中心として等角度ピッチ(この場合は約22.5°間隔)で配置されている。この際、マイクMC1がθ=0°方向となり、順にθが22.5°ずつ増加する方向に沿って各マイクMC1〜MC16が配置される。例えば、マイクMC5はθ=90°方向に配置され、マイクMC9はθ=180°方向に配置され、マイクMC13は、θ=270°方向に配置される。また、各マイクMC1〜MC16は、単一指向性を有し、それぞれが前記平面視した中心方向に強い指向性を有するように配置されている。例えば、マイクMC1はθ=180°方向を指向性の中心とし、マイクMC5はθ=270°方向を指向性の中心とし、マイクMC9はθ=0(360)°方向を指向性の中心とし、マイクMC13はθ=90°方向を指向性の中心とする。なお、マイクの個数はこれに限らず、仕様に応じて適宜設定すればよい。
The 16 microphones MC1 to MC16 are installed inside the top surface of the
4個のスピーカSP1〜SP4は、筐体11の下部側の傾斜面と放音面が一致するようにそれぞれ設置されており、各スピーカSP1〜SP4は放収音装置1を平面視した中心を回転中心として等角度ピッチ(この場合は約90°間隔)で配置されている。この際、スピーカSP1がマイクMC1と同じθ=0°方向に配置され、スピーカSP2がマイクMC5と同じθ=90°方向に配置され、スピーカSP3がマイクMC9と同じθ=180°方向に配置され、スピーカSP4がマイクMC13と同じθ=270°方向に配置される。また、各スピーカSP1〜SP4は、放音面の正面方向に強い指向性を有するものであり、スピーカSP1はθ=0°方向を中心に放音し、スピーカSP2はθ=90°方向を中心に放音し、スピーカSP3はθ=180°方向を中心に放音し、スピーカSP4はθ=270°方向を中心に放音する。
The four speakers SP1 to SP4 are respectively installed so that the inclined surface on the lower side of the
このように、スピーカSP1〜SP4を筐体11の下部側に配置し、マイクMC1〜MC16を筐体11の上部側に配置し、マイクMC1〜MC16の収音方向を筐体11の中心方向とすることで、各マイクMC1〜MC16は、スピーカSP1〜SP4からの回り込み音声を収音し難くなる。このため、後述する話者位置検出で、回り込み音声の影響を受け難くなり、より高精度に話者位置検出が行える。
As described above, the speakers SP1 to SP4 are arranged on the lower side of the
操作部111は、筐体11の上部側の傾斜面に設置されており、図示しないが、各種の操作釦および液晶表示パネルを備える。
入出力I/F102(図1,2では図示せず)は、筐体11の下部側の傾斜面で、スピーカSP1〜SP4が設置されていない位置に設置されており、音声データおよび各種制御データを通信可能な端子を備える。そして、入出力I/F102の端子と通信端末とをケーブル等で接続することで、放収音装置1と通信端末とで通信を行う。
The
The input / output I / F 102 (not shown in FIGS. 1 and 2) is an inclined surface on the lower side of the
放収音装置1は、このような構造上の構成とともに、図3に示すような機能的な構成を備える。
制御部101は、放収音装置1の設定、収音、放音等の全般制御を行うとともに、操作部111により入力された操作指示内容に基づく制御を放収音装置1の各部に与える。
The sound emission and
The
(1)放音
入出力I/F102は、通信端末5から受信した放音用音声信号S1〜S3をそれぞれチャンネルCH1〜CH3に出力する。なお、チャンネルの割り当ては、受信した放音用音声信号の数に応じて適宜設定すればよい。また、入出力I/F102は、通信端末5から相手先装置IDを受信して相手先装置ID毎にチャンネルCHを割り当てる。例えば、接続中の相手先装置が一台である場合、当該相手先装置からの音声データを放音用音声信号S1として、チャンネルCH1に割り当てる。また、接続中の相手先装置が二台である場合、二台の相手先装置からの音声データをそれぞれ放音用音声信号S1,S2として、チャンネルCH1,CH2に個別に割り当てる。同様に、接続中の相手先装置が三台である場合、三台の相手先装置からの音声データをそれぞれ放音用音声信号S1,S2,S3として、チャンネルCH1,CH2,CH3に個別に割り当てる。チャンネルCH1〜CH3は、エコーキャンセル部107を介して放音制御部103に接続される。
また、入出力I/F102は、通信端末5から相手先放収音装置での話者方位データPyを抽出し、チャンネル情報とともに放音制御部103に与える。
(1) Sound emission The input / output I /
Further, the input / output I /
放音制御部103は、放音用音声信号S1〜S3と、話者方位情報Pyとに基づいて、各スピーカSP1〜SP4に与えるスピーカ出力信号SPD1〜SPD4を生成する。
The sound
D/A−AMP104は各スピーカ出力信号SPD1〜SPD4をディジタル−アナログ変換し、一定の増幅率で増幅して、それぞれスピーカSP1〜SP4に与える。スピーカSP1〜SP4は、与えられたスピーカ出力信号SPD1〜SPD4を音声変換して放音する。
The D /
このような放音処理を行うことで、各スピーカSP1〜SP4から放音される音声が所定の遅延関係および振幅関係になるため、あたかも設定した仮想音源から放音されたような感覚を会議者に与えることができる。 By performing such sound emission processing, the sound emitted from the speakers SP1 to SP4 has a predetermined delay relationship and amplitude relationship, so that the conference person feels as if the sound is emitted from the set virtual sound source. Can be given to.
(2)収音
マイクMC1〜MC16は、会議者の発生音等の外部からの音声を収音して収音信号MS1〜MS16を生成する。各A/D−AMP105は、対応する収音信号MS1〜MS16を所定増幅率で増幅し、アナログ−ディジタル変換して収音制御部106に出力する。
(2) Sound Collection The microphones MC1 to MC16 collect sound from the outside such as the sound generated by the conference person and generate sound collection signals MS1 to MS16. Each A / D-
収音制御部106は取得した収音信号MS1〜MS16を、それぞれ異なる遅延制御パターンおよび振幅パターンで合成して、それぞれに異なる方向を指向性の中心方向とする収音ビーム信号を生成する。例えば、放収音装置1を中心として、全周囲360°を8分割した角度、すなわち、45°毎に指向性の中心方向がシフトする8本の収音ビーム信号を生成する。収音制御部106は、これら収音ビーム信号の振幅レベルを比較して、もっとも高い振幅レベルの収音ビーム信号MBSを選択して、エコーキャンセル部107に出力する。収音制御部106は、選択した収音ビーム信号に対応する話者方位を取得し、話者方位情報Pmを生成し、入出力I/F102に与える。
The sound
エコーキャンセル部107は、入力される収音ビーム信号MBSに対して、各放音用音声信号S1〜S3に基づく擬似回帰音信号を生成する適応型フィルタと、収音ビーム信号MBSから擬似回帰音信号を減算するポストプロセッサとからなる。エコーキャンセル回路は、適応型フィルタのフィルタ係数を逐次最適化しながら出力用収音ビーム信号MBSから擬似回帰音信号を減算することで、出力用収音ビーム信号MBSに含まれるスピーカSP1〜SP4からマイクMC1〜MC16への回り込み成分を除去する。この回り込み成分が除去された収音ビーム信号MBSは、入出力I/F102に出力される。
The
入出力I/F102は、エコーキャンセル部107で回帰音除去された収音ビーム信号MBSと、収音制御部106からの話者方位情報Pmとを関連付けして、通信端末5に出力する。
The input / output I /
カメラ2は、ステー3により、図1、図2に示すように、放収音装置1に対して固定された位置に設置される。この際、カメラ2は、ステー3により、水平方向(図1に示すカメラ2の向く方向)と垂直下方向(図2に示すカメラ2の向く方向)との間で回動可能に設置されている。
As shown in FIGS. 1 and 2, the
ステー3は、主体部31、カメラ支持部32、主体支持部33、放収音装置取付部34を備える。主体部31は、所定幅を有する直線状部材からなり主体支持部33により垂直方向に対して所定角の方向に延びる形状で設置される。主体部31の延びる方向の一方端には、ヒンジ203を介してカメラ支持部32が設置され、他方端には、放収音装置取付部34が設置されている。放収音装置取付部34は、筐体11の脚部12が装嵌する形状の開口部を有する平板からなり、例えば、主体部31と一体形成されている。
The
主体部31のカメラ支持部32側端部は、幅方向の両端壁のみが残り、幅方向の中央部が開口する形状からなる。この開口部は、カメラ支持部32に設置されたカメラ2が水平方向と垂直下方向との間で回動する際に、主体部31に接触しない形状からなる。
The end portion of the
ヒンジ203は、カメラ支持部32を主体部31に対して回動可能に設置させる構造をなす。また、ヒンジ203およびカメラ保持部32は、カメラ2およびカメラ支持部32が水平方向に向いた場合と垂直下方向に向いた場合とに、半固定される構造を有する。例えば、ヒンジ203を主体部31に固定し、ヒンジ203の水平方向の位置と垂直下方向の位置にそれぞれ凹部を形成する。カメラ支持部32のヒンジ側端部には、前記凹部に嵌る形状の凸部を設け、当該凸部をバネ等でカメラ支持部32内から付勢する形状を備えさせる。これにより、カメラ2は水平方向と垂直下方向との間で回動し、且つ水平方向と垂直下方向とで機構的状態を維持することが可能となる。
The
このヒンジ203およびカメラ支持部32からなる機構部は、スイッチ4として機能する。例えば、これら凹部および凸部にそれぞれ電極を設置し、電気的にこれらの導通、開放を検出する。この際、水平方向の凹部と、垂直下方向の凹部とで異なる信号が得られるように結線または検出信号を設定する。このような構造によりスイッチ4が形成され、当該スイッチ4の検出結果は、カメラ2に与えられる。これにより、カメラ2は、自身が水平方向を向いているのか、垂直下方向を向いているのかを識別して、映像を取得することができる。
The mechanism unit including the
カメラ2は、撮像部21と映像処理部22とを備える。撮像部21は、魚眼レンズを備え、カメラ2の正面方向を中心として、全方位に対して、無限距離から魚眼レンズの設置面までの領域を撮像する。撮像データは、映像処理部22に与えられる。
The
映像処理部22は、ステー3のスイッチ4(ヒンジ203およびカメラ支持部32)から検出したカメラ2の向く方向(以下、撮影方向と称する)を取得する。映像処理部22は、取得した撮影方向および通信端末5を介して放収音装置1からの話者方位データPmに基づいて、撮像データから必要部のみを抽出して画像補整し、映像データを生成する。生成された映像データは、通信端末5に与えられる。
The
次に、当該ビデオ会議装置の使用方法および映像処理部22での映像データ生成方法について、より具体的に説明する。なお、以下の説明では、自装置側の会議者が5名である場合について示すが、会議者数が特にこれに限るものではない。
Next, the usage method of the video conference apparatus and the video data generation method in the
図4は本実施形態のビデオ会議装置を配置して、ネットワーク接続された他地点とビデオ会議を行う状況を示す図であり、カメラ2が会議者601〜605を撮像している場合を示した図である。
図5は映像データ生成の説明に用いる説明図であり、(A)は魚眼レンズを介して撮像された映像(画像)を示し、(B)、(C)は会議者方位毎の画像補整概念を示す。
FIG. 4 is a diagram illustrating a situation in which the video conference apparatus according to the present embodiment is arranged and a video conference is performed with another point connected to the network, and the case where the
FIG. 5 is an explanatory diagram used for explaining video data generation. (A) shows a video (image) taken through a fisheye lens, and (B) and (C) show image correction concepts for each conference direction. Show.
図6は本実施形態のビデオ会議装置を配置して、ネットワーク接続された他地点とビデオ会議を行う状況を示す図であり、カメラ2が資料650を撮像している場合を示した図である。
図7は映像データ生成の説明に用いる説明図であり、(A)は魚眼レンズを介して撮像された映像(画像)を示し、(B)は資料撮像時の画像補整概念を示す。
FIG. 6 is a diagram illustrating a situation in which the video conference apparatus according to the present embodiment is arranged to perform a video conference with another point connected to the network, and is a diagram illustrating a case where the
FIGS. 7A and 7B are explanatory diagrams used for explaining video data generation. FIG. 7A shows a video (image) captured through a fisheye lens, and FIG. 7B shows a concept of image correction at the time of document imaging.
ビデオ会議を行う場合には、会議者601〜605は、長円形のテーブル700に対して長手方向の片端を除く位置に着席する。テーブル700上には、円形の放収音装置1とこれにステー3により固定されたカメラ2との一体部材が設置される。この際、カメラ2は、水平方向に向いた状態で、テーブル700の長手方向に平行な軸が魚眼レンズの中心軸と一致するように設置されている。テーブル700の下には、通信端末5が設置されている。通信端末5は、放収音装置1、カメラ2と電気的に接続し、且つネットワーク500に接続している。また、通信端末5は、ディスプレイ6に電気的に接続している。ディスプレイ6は、例えば液晶ディスプレイ等からなり、テーブル700の会議者601〜605が着席していない側の端部付近に設置される。この際、ディスプレイ6は、テーブル700方向に表示面が向くように設置されている。
When a video conference is performed, the
このような状態でビデオ会議が行われると、放収音装置1、カメラ2、通信端末5を含むビデオ会議装置は、二つのモードで会議の映像を相手先のビデオ会議装置に送信する。
When a video conference is performed in such a state, the video conference device including the sound emission and
(1)会議者撮影モード
会議者601〜605のいずれかが、カメラ2を水平方向にセットすると、スイッチ4からの検出信号により、カメラ2の映像処理部22は、会議者撮影モードが選択されたことを検出する。映像処理部22は、会議者撮影モードを検出すると、当該モードの選択信号を通信端末5に与える。
(1) Conference participant shooting mode When any of the
カメラ2の撮像部21は、魚眼レンズを通して、自装置側に在席する全会議者601〜605を撮像した撮像データを取得し、映像処理部22に出力する。ここで、撮像データは、魚眼レンズを通しているので、撮像領域が図5(A)のように円形になる。会議者撮影モードが選択されている場合、映像処理部22は、円形の撮像データに対して、円弧状に曲がる水平方向を方位角φで表し、垂直方向を仰角ψで表す座標系で取得する。すなわち、魚群レンズの正面方向で、レンズ軸と同じ高さがφ=0°、ψ=0°に設定される。さらに、当該座標から左方向に広がる方向でφが負方向に増加し、右方向に広がる方向でφが正方向に増加するように設定されている。したがって、カメラ2の魚眼レンズの最先端から、撮影方向に対して左方向で魚眼レンズの軸に垂直な方向がφ=−90°となり、カメラ2の魚眼レンズの最先端から、撮影方向に対して右方向で魚眼レンズの軸に垂直な方向がφ=+90°となる。また、当該座標から上方向に広がる方向でψが正方向に増加し、下方向に広がる方向でψが負方向に増加するように設定されている。したがって、カメラ2の魚眼レンズの最先端から、撮影方向に対して上方向で魚眼レンズの軸に垂直な方向がψ=+90°となり、カメラ2の魚眼レンズの最先端から、撮影方向に対して下方向で魚眼レンズの軸に垂直な方向がψ=−90°となる。
The
放収音装置1は、前述の処理により、発言中の会議者の音声を取得するとともに、会議者方位を検出して、収音音声データと話者方位情報θとを通信端末5に与える。例えば、図4に示す会議者601が発言すれば、放収音装置1は、会議者601の方位θ1を検出して、会議者601方向からの音声に基づく収音音声データと話者方位情報θ1とを通信端末5に与える。また、会議者605が発言すれば、放収音装置1は、会議者605の方位θ2を検出して、会議者605方向からの音声に基づく収音音声データと話者方位情報θ2を通信端末5に与える。通信端末5は、話者方位情報θをカメラ2の映像処理部22に与える。
The sound emission and
映像処理部22は、通信端末5からの話者方位情報θに基づいて、撮像データを補整する。映像処理部22は、話者方位情報θと、撮像データに設定された方位角φとの関係を予め記憶している。そして、映像処理部22は、話者方位情報θを受け付けると、対応する方位角φを読み出す。例えば、映像処理部22は、会議者601に対する話者方位情報θ1を受け付けると、対応する方位角φ=0°を読み出す。また、例えば、映像処理部22は会議者605に対する話者方位情報θ2を受け付けると、対応する方位角φ=−90°を読み出す。
The
映像処理部22は、読み出した方位角φを含む所定方位角幅からなる画像抽出方位角範囲を設定する。また、映像処理部22は、仰角ψ=0°を含む所定仰角幅からなる画像抽出仰角範囲を設定する。そして、映像処理部22は、設定した方位角範囲と仰角範囲とにより画像抽出領域を決定し、当該領域に対応する撮像データを画像データとして取得する。
The
例えば、映像処理部22は、方位角φ=0°を読み出すと、φ=0°を含み方位角φ1〜方位角φ2(φ1<0°<φ2)の範囲を方位角範囲に設定する。また、映像処理部22は、ψ=0°を含み仰角ψ1〜仰角ψ2(ψ1<ψ2)の範囲を仰角範囲に設定する。そして、映像処理部22は、方位角範囲φ1〜φ2、仰角範囲ψ1〜ψ2により画像抽出領域を設定して、画像データ621を取得する。また、例えば、映像処理部22は、方位角φ=−90°を読み出すと、φ=−90°を含み方位角φ3〜方位角φ4(φ3<−90°<φ4)の範囲を方位角範囲に設定する。また、映像処理部22は、ψ=0°を含み仰角ψ3〜仰角ψ4(ψ3<ψ4)の範囲を仰角範囲に設定する。そして、映像処理部22は、方位角範囲φ3〜φ4、仰角範囲ψ3〜ψ4により画像抽出領域を設定して、画像データ622を取得する。
For example, when the
映像処理部22は、取得した画像抽出領域毎に画像の補整変換を行う。具体的には、二つの角度方向であるφ方向とψ方向で定義される各画素を、直交二次元の平面座標(X−Y座標系)の画素に当てはめるように補整変換する。この際、映像処理部22は、φ−ψ座標系とX−Y座標系との変換処理テーブルを予め記憶しており、取得した各画素のφ−ψ座標に基づいて、X−Y座標を算出し、補整変換する。なお、映像処理部22は、予め座標変換演算式を記憶しており、当該座標変換演算式を用いて補整変換を行っても良い。
The
例えば、図5(B)に示すように、映像処理部22は、方位角範囲φ1〜φ2、仰角範囲ψ1〜ψ2で設定される画像データ621を、平面座標系であり水平方向をX軸として垂直方向をY軸とするx1〜x2,y1〜y2で設定される補整画像データ621’に変換する。この変換により、φ−ψ座標系で取得した会議者601の人物像611が、X−Y座標系(平面座標系)の補整人物像631に変換される。このようにX−Y座標系に変換することで、補整人物像631は、会議者601の自然体像に近いものとなる。
For example, as shown in FIG. 5B, the
また、例えば、図5(C)に示すように、映像処理部22は、方位角範囲φ3〜φ4、仰角範囲ψ3〜ψ4で設定される画像データ622を、平面座標系であり水平方向をX軸として垂直方向をY軸とするx3〜x4,y3〜y4で設定される補整画像データ622’に変換する。この変換により、φ−ψ座標系で取得した会議者605の人物像615が、X−Y座標系(平面座標系)の補整人物像635に変換される。このようにX−Y座標系に変換することで、補整人物像635は、会議者601の自然体像に近いものとなる。
Also, for example, as shown in FIG. 5C, the
映像処理部22は、このように自然体に近づいた補整人物像を含む補整画像データに時間情報を添付して映像データとして通信端末5に出力する。このような補整画像データの生成および出力は、逐次行われており、受け付けた話者方位情報θが変化すれば、この変化に応じて、補整画像データの中心方向も切り替わる。
The
通信端末5は、映像処理部22からの映像データと収音音声データと話者方位情報θとを関連付けして通信データを生成し、ネットワーク500を介して相手先のビデオ会議装置に送信する。これにより、相手先のビデオ会議装置の周囲に在席する会議者には、発言中の会議者の自然体に近い映像と当該会議者の発言とを提供することができる。
The
(2)資料撮影モード
会議者601〜605のいずれかが、図6に示すように、カメラ2を垂直下方向にセットすると、スイッチ4からの検出信号により、カメラ2の映像処理部22は、資料撮影モードが選択されたことを検出する。映像処理部22は、資料撮影モードを検出すると、当該モードの選択信号を通信端末5に与える。
(2) Document shooting mode When any of the
また、会議者601〜605のいずれかは、テーブル700におけるヒンジ203の垂直下方向位置を中心にして、資料650を載置する。この際、テーブル700上に資料載置用マーキングを予め行っておけば、資料650を容易に且つ適切に載置することができる。
In addition, any of the
カメラ2の撮像部21は、魚眼レンズを通して、テーブル700上に載置された資料650を撮像した撮像データを取得し、映像処理部22に出力する。ここで、撮像データは、魚眼レンズを通しているので、撮像領域が図7(A)のように円形になる。
The
資料撮影モードが選択されている場合、映像処理部22は、円形の撮像データに対して、撮像データの中心を原点とし、原点から放射方向に延びる距離rと、所定方向(図7では原点から撮像データに向かって右方向を0°方向)に対する角度ηとで表されるr−η座標系で取得する。映像処理部22は、取得した撮像データから、予め設定された範囲の画像データ680を切り出す。
When the document photographing mode is selected, the
映像処理部22は、r−η座標系の画像データ680をX−Y平面座標系の補整画像データ680’に変換することで補整する。この際、映像処理部22は、r−η座標系とX−Y座標系との中心座標を一致させた座標変換処理テーブルを予め記憶しており、取得した各画素のr−η座標に基づいてX−Y座標を算出し、補整変換する。なお、映像処理部22は、予め座標変換演算式を記憶しており、当該座標変換演算式を用いて補整変換を行っても良い。
The
この変換により、r−η座標系で取得した資料650の資料像660が、X−Y座標系(平面座標系)の補整資料像670に変換される。このようにX−Y座標系に変換することで、補整資料像670は、資料650の自然体像に近いものとなる。すなわち、文字が歪んでいない資料650の画像データを取得することができる。
By this conversion, the
通信端末5は、映像処理部22から取得した資料650の画像データを含む通信データを生成し、ネットワーク500を介して相手先のビデオ会議装置に送信する。これにより、相手先のビデオ会議装置の周囲に在席する会議者には、鮮明で見やすい資料の画像を提供することができる。なお、この際、通信端末5は、収音音声データを放収音装置1から取得していれば、資料650の画像データとともに収音音声データを含む通信データを生成し、送信するようにしてもよい。
The
以上のように、本実施形態の構成および処理を用いることで、会議者の映像と資料の画像とを、それぞれの仕様に適した状態で取得し、送信することができる。この際、カメラを水平方向と垂直下方向との二方向に可変させるだけで、会議者映像と資料画像とのそれぞれの仕様に応じた映像を容易に取得することができる。 As described above, by using the configuration and processing of the present embodiment, it is possible to acquire and transmit a conference person's video and material image in a state suitable for each specification. At this time, the video corresponding to the specifications of the conference video and the document image can be easily acquired by simply changing the camera in two directions, the horizontal direction and the vertical downward direction.
次に、第2の実施形態に係るビデオ会議装置について図を参照して説明する。
図8は、本実施形態のビデオ会議装置の内の放収音装置1とカメラ2と支持体7とからなる組み立て部材の外観図であり、(A)は平面図、(B)は側面図である。
図9は、本実施形態のビデオ会議装置を用いたビデオ会議装置の状況を示した図であり、(A)は平面図、(B)は側面図である。なお、図8、図9では、放収音装置1、カメラ2に接続されるケーブル類については、図示を省略している。
Next, a video conference apparatus according to the second embodiment will be described with reference to the drawings.
FIG. 8 is an external view of an assembly member including the sound emitting and collecting
FIG. 9 is a diagram illustrating a situation of a video conference apparatus using the video conference apparatus of the present embodiment, where (A) is a plan view and (B) is a side view. 8 and 9, the cables connected to the sound emission and
図10は、本実施形態のビデオ会議装置による映像データの生成を説明する図であり、(A)は撮像データを示す図、(B)は撮像データの中心部の画像補整の概念図、(C)は撮像データの周囲部の画像補整の概念図である。
本実施形態のビデオ会議装置は、放収音装置1および通信端末5の構成および処理は、第1の実施形態のビデオ会議装置と同じである。一方、本実施形態のビデオ会議装置は、カメラ2の設置構造すなわち支持体7の構造、およびカメラ2の映像処理部22での映像処理方法が、第1の実施形態と異なり、スイッチ4が省略されたものである。
10A and 10B are diagrams for explaining generation of video data by the video conferencing apparatus according to the present embodiment. FIG. 10A is a diagram illustrating imaging data, FIG. 10B is a conceptual diagram of image correction at the center of the imaging data, C) is a conceptual diagram of image correction around the image data.
In the video conference apparatus of the present embodiment, the configurations and processes of the sound emitting and collecting
図8に示すように、円板状の放収音装置1の周囲には、支持体7が配置されている。支持体7は、垂直方向に延びる四本の垂直支軸と、放収音装置1の上面から距離h1の位置に配置された二本の水平支軸と、放収音装置1の上面から距離h2(>h1)の位置に配置された四本の水平支軸とからなる。距離h1に配置される二本の水平支軸は、放収音装置1を平面視した時の略中心の位置で交わる構造からなり、四本の垂直支軸により距離h1に保持されている。距離h2に配置される水平支軸は、平面視して略正方形となるように組まれ、四本の垂直支軸により距離h2に保持されている。
As shown in FIG. 8, a
カメラ2は、距離h1にある二本の水平支軸の交点に設置されている。カメラ2は、撮像方向が垂直上向きになるように設置されている。
The
載置テーブル8は、距離h2にある四本の水平支軸により支持されており、載置テーブル8は、透過性の高いガラスやアクリル板等により形成されている。この際、平面視した状態で、載置テーブル8の中心とカメラ2の魚眼レンズの軸とが略一致するように、載置テーブル8とカメラ2が設置される。
The mounting table 8 is supported by four horizontal support shafts at a distance h2, and the mounting table 8 is formed of a highly transmissive glass, an acrylic plate, or the like. At this time, the mounting table 8 and the
載置テーブル8の上には、資料650が、印刷面を垂直下方向すなわち載置テーブル8に接する向きで置かれる。
On the mounting table 8, the
ここで、カメラ2の高さおよび載置テーブル8の高さ、すなわち、距離h1,h2は、図9に示すように、会議者601〜604の少なくとも顔が、カメラ2で撮影可能で、且つ、載置テーブル8を支持する水平支軸で隠れないように設定するとよい。
Here, the height of the
このような構成のビデオ会議装置を用いた場合、カメラ2の撮像部21で取得される撮像データは、図10(A)のようになる。すなわち、撮像データは、魚眼レンズを通して撮像されたものであるので、全撮像領域が円形の全領域画像データ610となり、その中心に資料650の資料像660が映され、その周辺部に各会議者601〜604の人物像641〜644が映される。
When the video conferencing apparatus having such a configuration is used, the imaging data acquired by the
映像処理部22は、円形の撮像データに対して、撮像データの中心を原点とし、原点から放射方向に延びる距離rと、所定方向(図10では原点から撮像データに向かって右方向を0°方向)に対する角度ηとで表されるr−η座標系で取得する。映像処理部22は、取得した撮像データから、予め設定された範囲の画像データ681を切り出す。
For the circular image data, the
映像処理部22は、r−η座標系の画像データ681をX−Y平面座標系の補整画像データ681’に変換することで補整する。この際、映像処理部22は、r−η座標系とX−Y座標系との中心座標を一致させた座標変換処理テーブルを予め記憶しており、取得した各画素のr−η座標に基づいてX−Y座標を算出し、補整変換する。なお、映像処理部22は、予め座標変換演算式を記憶しており、当該座標変換演算式を用いて補整変換を行っても良い。
The
この変換により、図10(B)に示すように、r−η座標系で取得した資料650の資料像660が、X−Y座標系(平面座標系)の補整資料像670に変換される。このようにX−Y座標系に変換することで、補整資料像670は、資料650の自然体像に近いものとなる。すなわち、文字が歪んでいない資料650の画像データを取得することができる。
By this conversion, as shown in FIG. 10B, the
また、映像処理部22は、全領域画像データ610から中心付近の画像データ681を取り除いた周辺部画像データ682を取得する。映像処理部22は、通信端末5を介して放収音装置1から取得した話者位置情報に基づいて、第1の実施形態と同様に、抽出する領域を設定する。すなわち、映像処理部22は、発言中の会議者の像を含む領域を抽出し、部分画像データ683を取得する。この際、映像処理部22は、部分画像データをr−η座標系で取得する。具体的には、図10(C)に示すように、映像処理部22は、話者方位情報に基づいて、該当する会議者の像を含む扇形状の四箇所の角部の座標を、(r10,η10),(r10,η20),(r20,η20),(r20,η10)に設定して取得する。
In addition, the
映像処理部22は、取得した部分画像データ683の補整変換を行う。具体的には、r−η座標系で定義される各画素を、直交二次元の平面座標(X−Y座標系)の画素に当てはめるように補整変換する。この際、映像処理部22は、r−η座標系とX−Y座標系との変換処理テーブルを予め記憶しており、取得した各画素のr−η座標に基づいて、X−Y座標を算出し、補整変換する。なお、映像処理部22は、予め座標変換演算式を記憶しており、当該座標変換演算式を用いて補整変換を行っても良い。
The
例えば、図10(C)に示すように、映像処理部22は、距離範囲r10〜r20、方位角範囲η10〜η20で設定される部分画像データ683を、平面座標系であり水平方向をX軸として垂直方向をY軸とするx10〜x20,y10〜y20で設定される補整画像データ683’に変換する。この変換により、r−η座標系で取得した会議者604の人物像644が、X−Y座標系(平面座標系)の補整人物像654に変換される。このようにX−Y座標系に変換することで、補整人物像654は、会議者604の自然体像に近いものとなる。
For example, as shown in FIG. 10C, the
映像処理部22は、取得した補整資料像670を含む補整画像データと補整人物像654を含む補整画像データとに時間情報を添付して、映像データとして通信端末5に出力する。このような補整画像データの生成および出力は、逐次行われており、受け付けた話者方位情報θが変化すれば、この変化に応じて、補整人物像を含む補整画像データのみが切り替わった映像データが出力される。
The
通信端末5は、映像処理部22からの映像データと収音音声データと話者方位情報θとを関連付けして通信データを生成し、ネットワーク500を介して相手先のビデオ会議装置に送信する。これにより、相手先のビデオ会議装置の周囲に在席する会議者には、発言中の会議者の自然体に近い映像と当該会議者の発言とともに、資料画像を同時に提供することができる。
The
このように、本実施形態の構成および処理を用いることで、発言中の会議者映像と資料画像とを同時に取得して送信するビデオ会議装置を比較的簡素な構造で実現することができる。 As described above, by using the configuration and processing of the present embodiment, a video conference apparatus that simultaneously acquires and transmits a conference participant's video and a material image that are speaking can be realized with a relatively simple structure.
なお、本実施形態では、会議者映像と資料画像とを同時に取得して送信する例を示したが、資料画像の取得は、定常的に行うのではなく、一時的に行って、このタイミングでのみ送信するようにしても良い。この場合、資料画像は、資料を取り替える時以外に変化することはないので、定常的に資料画像を送信する場合と比較しても、相手先に送信される情報内容が減ることはない。その一方で、資料画像を送信しない間は、資料画像のデータ量分だけ処理およびネットワーク負荷が軽くなるので、より高速に処理および送信を行うことができる。なお、資料画像取得のタイミングは、新たな資料を載置した際に操作部から、取得操作入力を行うようにしてもよく、画像解析部を設け、取得した画像が前の画像と異なる時を、新たな取得タイミングにしてもよい。 In the present embodiment, an example in which a conference person image and a document image are acquired and transmitted at the same time has been shown. However, acquisition of a document image is not performed regularly, but is performed temporarily and at this timing. You may make it transmit only. In this case, since the material image does not change except when the material is replaced, the content of information transmitted to the other party is not reduced even when compared with the case of constantly transmitting the material image. On the other hand, while the material image is not transmitted, the processing and the network load are reduced by the amount of data of the material image, so that the processing and transmission can be performed at higher speed. Note that the material image acquisition timing may be such that when the new material is placed, an acquisition operation input may be performed from the operation unit, an image analysis unit is provided, and the acquired image is different from the previous image. A new acquisition timing may be set.
また、前述の各実施形態では、カメラ内に映像処理部を備えた例を示したが、当該映像処理部をカメラと独立な装置で実現したり、放収音装置や、通信端末に装備してもよい。これにより、カメラがより簡素な構造となるので、前述の必要な領域の撮影が可能なレンズさえあれば、汎用の動画用カメラを用いることもできる。 In each of the above-described embodiments, an example in which a video processing unit is provided in the camera has been shown. However, the video processing unit can be realized by a device independent of the camera, or installed in a sound emitting and collecting device or a communication terminal. May be. Accordingly, since the camera has a simpler structure, a general-purpose video camera can be used as long as it has a lens capable of photographing the necessary area described above.
また、前述の説明では、通信端末を放収音装置と独立に設けた例を示したが、通信端末の有する機能を放収音装置に備えても良い。これにより、ビデオ会議装置の構成要素数が減少するので、より簡素で小型のビデオ会議装置を実現することができる。 In the above description, the example in which the communication terminal is provided independently of the sound emission and collection device has been described. However, the function of the communication terminal may be provided in the sound emission and collection device. As a result, the number of components of the video conference apparatus is reduced, so that a simpler and smaller video conference apparatus can be realized.
1−放収音装置、2−カメラ、3−ステー、4−スイッチ、5−通信端末、6−ディスプレイ、7−支持体、8−載置テーブル、11−筐体、12−脚部、21−撮像部、22−映像処理部、31−主体部、32−カメラ支持部、33−主体支持部、34−放収音装置取付部、102−入出力I/F、103−放音制御部、105−A/D−AMP、106−収音制御部、107−エコーキャンセル部、110−凹部、111−操作部、203−ヒンジ、500−ネットワーク、601〜605−会議者、610−全領域画像データ、611,615−人物像、621−補整画像データ、622−補整画像データ、631,635−補整人物像、641〜644−人物像、650−資料、654−補整人物像、660−資料像、670−補整資料像、680,681−補整画像データ、682−周辺部画像データ、683−部分画像データ、700−テーブル 1- Sound emitting and collecting device, 2-camera, 3-stay, 4-switch, 5-communication terminal, 6-display, 7-support, 8-mounting table, 11-housing, 12-leg, 21 -Imaging unit, 22-Video processing unit, 31- Main unit, 32-Camera support unit, 33- Main unit support unit, 34- Sound output device mounting unit, 102- Input / output I / F, 103- Sound output control unit , 105-A / D-AMP, 106-sound collection control unit, 107-echo cancellation unit, 110-recess, 111-operation unit, 203-hinge, 500-network, 601-605-conference, 610-all areas Image data, 611, 615-person image, 621-correction image data, 622-correction image data, 631,635-correction person image, 641-644-person image, 650-material, 654-correction image, 660-material Image, 670-Compensation Ryozo, 680,681- compensation image data, 682- periphery image data, 683- partial image data, 700- Table
Claims (7)
該カメラの撮像した映像に基づいて映像データを生成する映像データ生成手段と、
自装置周囲の音声を収音して収音音声データを生成する収音手段と、
放音音声データを放音する放音手段と、
前記収音手段および放音手段が設けられた筐体と、
前記収音音声データと前記映像データとで通信データを形成し、当該通信データを外部に送信するとともに、外部からの通信データから放音音声データを取得して前記放音手段に与える通信手段と、
前記カメラを前記筐体に対して一定に支持する支持手段と、
を備えたビデオ会議装置であって、
前記カメラは、会議者撮像領域と、前記筐体の近傍の前記カメラに近接する領域とを同時に撮像し、
前記映像データ生成手段は、
前記会議者撮像領域に対応する第1部分映像データから、前記収音音声データに対応する方位領域のみを切り出して、切り出した第1部分映像データを第1補整処理により補整し、
前記カメラに近接する領域に対応する第2部分映像データを、前記第1補整処理と異なる第2補整処理により補整する、ビデオ会議装置。 A camera for imaging a predetermined area;
Video data generating means for generating video data based on video captured by the camera;
Sound collecting means for collecting sound around the device and generating collected sound data ;
A sound emission means for emitting the emitted sound data ;
A housing provided with the sound collecting means and the sound emitting means ;
Communication means that forms communication data with the collected sound data and the video data, transmits the communication data to the outside, and obtains sound emission sound data from the communication data from the outside and gives the sound emission means to the sound emission means; ,
Support means for supporting the camera with respect to the housing;
A video conferencing apparatus comprising:
The camera simultaneously images a conference person imaging area and an area close to the camera in the vicinity of the housing,
The video data generation means includes
Only the azimuth area corresponding to the collected sound data is cut out from the first partial video data corresponding to the conference person imaging area, and the cut out first partial video data is corrected by the first correction processing,
A video conference apparatus that corrects second partial video data corresponding to an area close to the camera by a second correction process different from the first correction process.
前記映像データ生成手段は、選択手段により選択された部分映像データを前記通信手段に与える請求項1に記載のビデオ会議装置。 Comprising a selection means for selecting partial video data used for communication data;
The video conference apparatus according to claim 1 , wherein the video data generation unit provides the communication unit with the partial video data selected by the selection unit.
前記通信手段は、通信データに含まれる映像データを取得して、前記ディスプレイモニタに与える請求項1〜6のいずれかに記載のビデオ会議装置。 It has a display monitor that plays back video data,
It said communication means acquires image data included in the communication data, video conferencing apparatus according to any one of claims 1 to 6, applied to the display monitor.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006341175A JP4862645B2 (en) | 2006-12-19 | 2006-12-19 | Video conferencing equipment |
CNA2007800342882A CN101518049A (en) | 2006-12-19 | 2007-12-19 | Video conferencing device |
PCT/JP2007/074449 WO2008075726A1 (en) | 2006-12-19 | 2007-12-19 | Video conferencing device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006341175A JP4862645B2 (en) | 2006-12-19 | 2006-12-19 | Video conferencing equipment |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008154055A JP2008154055A (en) | 2008-07-03 |
JP4862645B2 true JP4862645B2 (en) | 2012-01-25 |
Family
ID=39536354
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006341175A Expired - Fee Related JP4862645B2 (en) | 2006-12-19 | 2006-12-19 | Video conferencing equipment |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP4862645B2 (en) |
CN (1) | CN101518049A (en) |
WO (1) | WO2008075726A1 (en) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5648953B2 (en) * | 2010-08-03 | 2015-01-07 | コクヨ株式会社 | Table system for video conference |
CN101969541A (en) * | 2010-10-28 | 2011-02-09 | 上海杰图软件技术有限公司 | Panoramic video communication system and method |
JP2013009304A (en) | 2011-05-20 | 2013-01-10 | Ricoh Co Ltd | Image input device, conference device, image processing control program, and recording medium |
CN104932665B (en) * | 2014-03-19 | 2018-07-06 | 联想(北京)有限公司 | A kind of information processing method and a kind of electronic equipment |
CN105100677A (en) * | 2014-05-21 | 2015-11-25 | 华为技术有限公司 | Method for presenting video conference, devices for presenting video conference and system for presenting video conference |
CN104320729A (en) * | 2014-10-09 | 2015-01-28 | 深圳市金立通信设备有限公司 | Pickup method |
CN104410778A (en) * | 2014-10-09 | 2015-03-11 | 深圳市金立通信设备有限公司 | Terminal |
CN104580992B (en) * | 2014-12-31 | 2018-01-23 | 广东欧珀移动通信有限公司 | A kind of control method and mobile terminal |
JP6450604B2 (en) * | 2015-01-28 | 2019-01-09 | オリンパス株式会社 | Image acquisition apparatus and image acquisition method |
CN104967777B (en) * | 2015-06-11 | 2018-03-27 | 广东欧珀移动通信有限公司 | One kind control camera image pickup method and terminal |
CN105163024A (en) * | 2015-08-27 | 2015-12-16 | 华为技术有限公司 | Method for obtaining target image and target tracking device |
CN107066039B (en) * | 2016-12-25 | 2020-02-18 | 重庆警蜂科技有限公司 | Portable multifunctional digital court trial terminal for patrol |
CN106791538B (en) * | 2016-12-25 | 2019-08-27 | 重庆警蜂科技有限公司 | Digital display circuit for circuit court |
CN108200515B (en) * | 2017-12-29 | 2021-01-22 | 苏州科达科技股份有限公司 | Multi-beam conference pickup system and method |
JP7135360B2 (en) | 2018-03-23 | 2022-09-13 | ヤマハ株式会社 | Light-emitting display switch and sound collecting device |
CN116264598A (en) * | 2021-12-14 | 2023-06-16 | 荣耀终端有限公司 | Multi-screen collaborative communication method, system, terminal and storage medium |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5436654A (en) * | 1994-02-07 | 1995-07-25 | Sony Electronics, Inc. | Lens tilt mechanism for video teleconferencing unit |
JPH07327217A (en) * | 1994-06-02 | 1995-12-12 | Canon Inc | Picture input device |
JPH11331827A (en) * | 1998-05-12 | 1999-11-30 | Fujitsu Ltd | Television camera |
JP2005311619A (en) * | 2004-04-20 | 2005-11-04 | Yakichiro Sakai | Communication system |
-
2006
- 2006-12-19 JP JP2006341175A patent/JP4862645B2/en not_active Expired - Fee Related
-
2007
- 2007-12-19 CN CNA2007800342882A patent/CN101518049A/en active Pending
- 2007-12-19 WO PCT/JP2007/074449 patent/WO2008075726A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
CN101518049A (en) | 2009-08-26 |
JP2008154055A (en) | 2008-07-03 |
WO2008075726A1 (en) | 2008-06-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4862645B2 (en) | Video conferencing equipment | |
CN109218651B (en) | Optimal view selection method in video conference | |
US7852369B2 (en) | Integrated design for omni-directional camera and microphone array | |
JP2007228070A (en) | Video conference apparatus | |
JP5323069B2 (en) | Microphone array for camera speakerphone | |
JP2007274463A (en) | Remote conference apparatus | |
US9648278B1 (en) | Communication system, communication apparatus and communication method | |
US8154588B2 (en) | Participant audio enhancement system | |
JP2017034502A (en) | Communication equipment, communication method, program, and communication system | |
CN102640517A (en) | Self steering directional loud speakers and a method of operation thereof | |
WO2008047804A1 (en) | Voice conference device and voice conference system | |
US10079996B2 (en) | Communication system, communication device, and communication method | |
JP2007274462A (en) | Video conference apparatus and video conference system | |
CN111343413A (en) | Video conference system and display method thereof | |
JP2008005122A (en) | System and method for two-way communication, and control program | |
US20230379587A1 (en) | Composite reception/emission apparatus | |
JP2009171486A (en) | Video conference system | |
JP2008005346A (en) | Sound reflecting device | |
US20230086490A1 (en) | Conferencing systems and methods for room intelligence | |
JP5151131B2 (en) | Video conferencing equipment | |
JP4951232B2 (en) | Audio signal transmitter / receiver | |
JP2009027246A (en) | Television conference apparatus | |
CN213213666U (en) | Video and audio communication equipment | |
JP2009021922A (en) | Video conference apparatus | |
JP2022101079A (en) | panel |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20091021 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110726 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110921 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20110921 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111011 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111024 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141118 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |