JP2002524936A - Automatic audio and image recording system - Google Patents

Automatic audio and image recording system

Info

Publication number
JP2002524936A
JP2002524936A JP2000568257A JP2000568257A JP2002524936A JP 2002524936 A JP2002524936 A JP 2002524936A JP 2000568257 A JP2000568257 A JP 2000568257A JP 2000568257 A JP2000568257 A JP 2000568257A JP 2002524936 A JP2002524936 A JP 2002524936A
Authority
JP
Japan
Prior art keywords
scene
analysis
remote
control
people
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP2000568257A
Other languages
Japanese (ja)
Other versions
JP2002524936A5 (en
Inventor
ヴィアレ,ジャン−エマニュエル
フェロー,ラファエル
コロベール,ミシェル
ベルニエ,オリヴィエ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Publication of JP2002524936A publication Critical patent/JP2002524936A/en
Publication of JP2002524936A5 publication Critical patent/JP2002524936A5/ja
Abandoned legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Studio Devices (AREA)
  • User Interface Of Digital Computer (AREA)
  • Selective Calling Equipment (AREA)
  • Closed-Circuit Television Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

(57)【要約】 本発明は特に、テレビ会議用の録音および録画自動システムに関し、このシステムは録画装置および録音装置(10)の制御手段(20)、制御手段(20)を操作して撮影されている場面を自動フレーミングする場面分析手段(40)を有する。本発明では、参加者の指示によって撮影されている場面にいる人々から1人または1グループを選択(30)し、選択された人またはグループに関して場面を分析する場面分析(40)によって提供される情報を基に自動フレーミング(30)するためにインテリジェントインターフェースが提供される。 (57) Abstract The present invention particularly relates to an automatic recording and recording system for a video conference, the system comprising: a recording device and control means (20) of the recording device (10); Scene analysis means (40) for automatically framing the scene being played. The present invention is provided by scene analysis (40), which selects (30) one or a group from the people in the scene that is being filmed at the direction of the participant and analyzes the scene with respect to the selected person or group. An intelligent interface is provided for automatic framing (30) based on the information.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】TECHNICAL FIELD OF THE INVENTION

本発明は、特にテレビ会議の録音および録画の自動システムに関する。 このようなシステムの必要性は、とりわけテレビ会議の分野において顕著にな
ってきているが、例えば複数の人の画像を記録する他の状況にも関係がある。 本発明は、これを用いて音声および画像が単数または複数の人々(テレビ分野
のカメラマンおよび音響技師)によってではなく、自動装置によって制御される
システムである。
The present invention relates in particular to video conferencing recording and automatic recording systems. The need for such a system is becoming more pronounced, especially in the field of video conferencing, but also relates to other situations, for example, recording images of multiple people. The present invention is a system in which audio and images are controlled by automated devices, rather than by one or more people (photographers and sound engineers in the television field).

【0002】[0002]

【従来の技術】[Prior art]

いずれにせよテレビ会議の場合、参加者はカメラによる録画を制御するリモー
トコントローラを備える、あるシステムを利用することがあるであろうが、これ
らのシステムは以下に見られるような欠点を有する。 特に、テレビ会議システムは録音および録画手段を備え、この記録手段は、方
向を変えられない、またはリモートコントローラを用いて方向を制御できない機
器(カメラおよびマイク)を有する。
In any event, in the case of video conferencing, participants may make use of certain systems with remote controls for controlling the recording by the cameras, but these systems have disadvantages as seen below. In particular, the teleconferencing system comprises audio and video recording means, which have equipment (cameras and microphones) that cannot change direction or cannot control direction using a remote controller.

【0003】 従来のテレビ会議システムでは、遠隔制御可能で、且つシリアル通信リンクを
介して遠隔的に調整可能な種々のカメラが用いられる。 リモートコントローラによって、カメラの姿勢および方位を連続的に走査し、
且つカメラのズームを連続的に変化させることが可能になった。1人の人または
1グループの人々が占める方向にカメラを方向付けるのは可能であるが、簡単で
はない。 空間の方向(2台のカメラでは6方向)はカメラで記憶できる。リモートコン
トローラのボタンを作動して、またはシリアルポートを操作して、カメラをこれ
らの方向のいずれかに向けることができる。この機能の利点は、連続するボタン
(姿勢、方位)を組み合わせて作業せずに、空間の一方向に直接到達できること
にある。こうして空間の予め記録された位置がテーブルの周りの座席に対応する
場合、リモートコントローラのユーザはある人から次の人へ順番に移動するだけ
でよい。
[0003] Conventional video conferencing systems use various cameras that are remotely controllable and can be remotely adjusted via a serial communication link. The remote controller continuously scans the camera's attitude and orientation,
In addition, the zoom of the camera can be changed continuously. Orienting the camera in the direction occupied by a person or group of people is possible, but not easy. The direction of the space (six directions for two cameras) can be stored by the cameras. By activating buttons on the remote control or operating the serial port, the camera can be pointed in either of these directions. The advantage of this function is that you can directly reach one direction of space without working by combining continuous buttons (posture, orientation). Thus, if the pre-recorded position of the space corresponds to a seat around the table, the user of the remote controller need only move from one person to the next in turn.

【0004】 音による位置設定(acoustic location)を基にしたシステムもあり、これに
よってカメラの方向付けは、場面の音声分析を基に制御される。 場面の音声分析は複数のマイクによって実施され、これらのマイクによって音
源または音声源の方向を決定することが可能になる。音声源の方向を識別して、
音声源を一つ一つ選択し、これを動的に追跡できる。テレビ会議システムを製造
販売するPicture Tel社のLime Light機能は、音による位置設定を基にしたもの
であり、これによって音源を検出して追跡し、カメラを動的に方向付けることが
可能になる。
[0004] Some systems are based on acoustic location, whereby the orientation of the camera is controlled based on a sound analysis of the scene. The audio analysis of the scene is performed by a plurality of microphones, which make it possible to determine the direction of the sound or sound source. Identify the direction of the audio source,
Audio sources can be selected one by one and tracked dynamically. Picture-tel's Lime Light feature, which manufactures and sells video conferencing systems, is based on sound-based positioning, which allows it to detect and track sound sources and dynamically orient the camera. .

【0005】 また、人々の視覚的位置設定(visual location)を基にしたシステムもある
。この視覚的位置設定は、カメラの画像出力の処理による分析を基にするもので
ある。 カメラの視野が十分に広く、システムが十分に精巧であれば、そこにいる全員
を検出できるであろう。音による位置設定と違って、視覚的位置設定は画像中の
顔の一貫性と、反射の無いこと(テレビ会議室および通常の録画室に鏡が無いこ
と)が有益である。以下の複数の技術を別々にまたは一緒に用いて、人々を検出
することができる:動きの検出、皮膚の色の検出、楕円形状の検出、顔全体の検
出(例えばニューラルネットワークを用いて)、例えば目、鼻等顔付きの検出。
[0005] Other systems are based on the visual location of people. This visual position setting is based on analysis by processing of image output of the camera. If the camera's field of view is wide enough and the system is sophisticated enough, it will be able to detect everyone there. Unlike sound location, visual location benefits the consistency of faces in the image and the absence of reflections (the absence of mirrors in videoconferencing and normal recording rooms). Several techniques can be used separately or together to detect people: motion detection, skin color detection, elliptical shape detection, whole face detection (eg using neural networks), For example, detection of faces with eyes, nose, etc.

【0006】 多数の顔検出システムがあり、自動録画装置能を組み合わせているものもある
。例えば、下記文献に記載されるシステムが挙げられる: P1−M. Collobert, R. Reraud, G. Le Tourneur, O. Bernier, J. E. Viall
et, Y. Mahieux, D. Collobert, LISTEN: a System for Locating and Tracking
Individual Speakers, 2nd Int. Conf. On Automatic Face and Gesture Recog
nition, Killington, USA, October 1996, pp 283-288、 P2−Hunke, Locating and Tracking human faces with neural network, Te
chnical Report CMU-CS-94-155, 1994、 P3−Yang, Wu, Waibel, Focus of attention in video conferencing, Tech
nical Report CMU-CS-96-150, 1996。
[0006] There are many face detection systems, some combining automatic recording device capabilities. Examples include systems described in the following literature: P1-M. Collobert, R. Reraud, G. Le Tourneur, O. Bernier, JE Viall.
et, Y. Mahieux, D. Collobert, LISTEN: a System for Locating and Tracking
Individual Speakers, 2 nd Int. Conf . On Automatic Face and Gesture Recog
nition, Killington, USA, October 1996, pp 283-288, P2-Hunke, Locating and Tracking human faces with neural network, Te
chnical Report CMU-CS-94-155, 1994, P3-Yang, Wu, Waibel, Focus of attention in video conferencing, Tech
nical Report CMU-CS-96-150, 1996.

【0007】[0007]

【発明が解決しようとする課題】[Problems to be solved by the invention]

しかし、ここに記載された全てのシステムのうち大多数が欠点を有するか、い
ずれにせよ下記に明らかにされる必要性には不十分である。 特に、リモートコントローラを用いて姿勢、方位および焦点距離を走査する機
能を有するシステムは以下の欠点を有する: 適切なフレームを得るために、ユーザはリモートコントローラの複数のボタン
(姿勢、方位および焦点距離)を続けて押して、望ましい結果を得なければなら
ない。この機能性は、非実用的で、遅く、操作エラーが起こりやすく、よってほ
とんど用いられない。このため、位置を変えている人または自然に動いている参
加者のグループに、カメラのフレームを周期的にまたは連続して合わせたい場合
、非実用的である。同様に、定期的に人を変えたい場合にも非実用的である。
However, the majority of all systems described herein have drawbacks, or in any case are not sufficient for the needs identified below. In particular, a system that has the capability to scan attitude, orientation and focal length using a remote controller has the following disadvantages: To obtain the appropriate frame, the user has to use multiple buttons on the remote control (posture, orientation and focal length). ) Must be pressed to get the desired result. This functionality is impractical, slow, prone to operational errors, and therefore rarely used. This is impractical when it is desired to periodically or continuously match the camera frame to a group of people who are changing positions or a participant moving naturally. Similarly, it is impractical to change people regularly.

【0008】 リモートコントローラを用いて空間の予め記録された方向にアクセスする機能
は、下記欠点を有する: 第1の欠点は、位置を予め記録しなくてはいけないことにある。このため、位
置を速やかに連続して変更することができない。 第2の欠点は、人々が実際に予め記録された位置を占め、動かないと仮定する
ことにある。実際には、例え椅子が床に固定されていたとしても、人々は動き、
フレームの中心にはほとんどいないか、フレームがある人に固定されていたら、
フレームの外に出てしまうことが分かる。この欠点は、人々が無意識に、空間の
予め記録された方向によって規定されたフレーム外に出てしまう、テレビ会議シ
ステムの場合に当てはまる。
The ability to access a pre-recorded direction of space using a remote controller has the following disadvantages: The first disadvantage is that the position must be pre-recorded. Therefore, the position cannot be changed quickly and continuously. A second drawback is in assuming that people actually occupy pre-recorded positions and do not move. In fact, even if the chair is fixed to the floor, people move,
If the frame is barely centered or fixed to a person,
It turns out that it goes out of the frame. This drawback applies in the case of videoconferencing systems, where people unknowingly fall outside the frames defined by the pre-recorded directions of the space.

【0009】 次の欠点は、この空間の方向にカメラを方向付ける機能が、必ずしも特定の焦
点距離と組み合わされているわけではないことにある。リモートコントローラの
ユーザは、リモートコントローラの調整ボタンを操作して、実際にある人が占め
る位置にフレームの大きさを合わせなければならない。これは、もしその人がフ
レームの外に出る傾向にあれば、カメラが指し示す空間の方向を変えずに、焦点
距離を短くしてこの人物をフレームの中に戻すことができるためである。しかし
、もはやフレームはその人物に固定されてはおらず、複数の人々がフレーム内に
いることもあり得る。 記憶された空間の方向のそれぞれと焦点距離を組み合わせ、記憶することは可
能であるが、これは一方では、ユーザが予め適当と思われる焦点距離を決めて、
もう一方でこれを記憶しなければならないことになる。さらに、この記憶された
焦点距離は固定され、このため非適応性であり、方向に関して多少変更可能なだ
けである。
A second disadvantage is that the ability to orient the camera in this spatial direction is not always combined with a specific focal length. The user of the remote controller must operate the adjustment button of the remote controller to adjust the size of the frame to the position actually occupied by a certain person. This is because if the person tends to go out of the frame, the focal length can be reduced and the person returned into the frame without changing the direction of the space pointed to by the camera. However, the frame is no longer fixed to that person, and there may be more than one person in the frame. It is possible to combine and store the focal lengths with each of the stored directions of space, but this, on the other hand, allows the user to pre-determine the focal length as deemed appropriate,
On the other hand, you have to remember this. Furthermore, this stored focal length is fixed, and therefore non-adaptive, and can only be changed slightly in direction.

【0010】 空間の予め決められた方向にアクセスするという機能は、一定の安定した状況
(遠隔監視)には適しているかもしれないが、特別な状況に合わせるようにする
ことはできない。カメラは空間の決められた方向を向くが、空間内の内容、つま
りその空間に人がいるのか、空なのか全く分からない。 他の、2番目の欠点は、カメラで記憶でき、リモートコントローラを利用しや
すい空間の方向数が6つに限られていることである。この欠点は一般に、これら
の方向をコンピュータに記憶し、ボタン数の多いリモートコントローラを用いて
克服できる。
The ability to access a predetermined direction of space may be suitable for certain stable situations (remote monitoring), but cannot be adapted to special situations. The camera faces a certain direction in the space, but has no idea what is in the space, that is, whether there is a person in the space or the sky. Another second disadvantage is that the number of directions in the space which can be stored by the camera and is easily accessible to the remote controller is limited to six. This disadvantage can generally be overcome by storing these directions in a computer and using a remote controller with a large number of buttons.

【0011】 音による位置設定は下記の欠点を有する: 人々の話す言葉に重なって、偽の音源(椅子、ドア、電気器具等の雑音)があ
るため、および壁から音源が多重反射するために、音による位置設定は不正確な
ことが多い。 さらに、言葉の音響活性度は本来断続的である(人が話すのを止めて聞く場合
)。 最後に、音による位置設定は音源の振幅(大きさ)に影響を受けやすい。
[0011] Sound localization has the following disadvantages: due to the presence of fake sound sources (noise in chairs, doors, appliances, etc.) overlapping with the spoken language of the people, and due to multiple reflections of the sound sources from walls. Position setting by sound is often inaccurate. Furthermore, the acoustic activity of words is inherently intermittent (when people stop speaking and listen). Finally, the position setting by sound is easily affected by the amplitude (magnitude) of the sound source.

【0012】 視覚的位置設定は下記欠点を有する: 視覚的位置設定の主な欠点は、アルゴリズムの複雑さと速度および強さ(robu
stness)に関する。それにも関わらず、本出願人が開発したシステムまたは本出
願人が上記に挙げた文献などの複数のシステムが、ワークステーションまたはパ
ーソナルコンピュータ(PC)のいずれかで操作可能である。 グループの人々の画像を自動的に記録する機能は、本出願人が実現したもので
あり、複雑ではあるが、実際に極めて有用なものである。フレームはテレビ会議
の参加者の数と位置に常に適合する。 しかし、実際には、他の全てのものより精巧で満足のいくものであっても、上
記に説明したように、参加者の誰かを自動的にフレーミングするように要求し、
全く簡単に全体フレームに戻ることができるようにすることが明らかに必要にな
ったため、十分ではない。
[0012] Visual positioning has the following disadvantages: The main disadvantages of visual positioning are the complexity and speed and strength of the algorithm (robu).
stness). Nevertheless, a plurality of systems, such as the system developed by the applicant or the documents cited above by the applicant, can be operated on either a workstation or a personal computer (PC). The ability to automatically record images of a group of people has been implemented by the applicant and is complex, but indeed extremely useful. The frame always fits the number and location of participants in the video conference. However, in practice, as described above, even if it is more elaborate and more pleasing than everything else, it requires that some of the participants be automatically framed,
It's not enough because it was obviously necessary to be able to return to the whole frame quite easily.

【0013】[0013]

【課題を解決するための手段】[Means for Solving the Problems]

この目的のため、本発明は、参加者に命令された時に、撮影されている場面の
人々から1人(または1グループの人々)を選択し、選択された人(またはグル
ープの人々)についての、場面の分析によって提供される情報を基に自動フレー
ミングを実施する、インテリジェントインターフェースを提案する。 本発明は、従って、特にテレビ会議用の録音および録画の自動システムに関し
、このシステムは録画装置および録音装置の制御手段、およびこの制御手段を操
作して撮影中の場面を自動的にフレーミングさせる場面分析手段を有する。 本発明のシステムは、撮影中の場面内の人々から1人の人または1グループの
人々を選択する手段、および選択された人またはグループの人々についての、場
面の分析手段によってもたらされた情報を基に自動フレーミングする手段を有す
る。
To this end, the present invention, when instructed by the participant, selects one (or a group of people) from the people in the scene being filmed and determines the selected person (or group of people). We propose an intelligent interface that performs automatic framing based on information provided by scene analysis. The present invention therefore relates to an automatic recording and recording system, in particular for video conferencing, comprising a recording device and control means for the recording device, and a scene for operating the control means to automatically frame the scene being shot. It has analysis means. The system of the present invention provides a means for selecting a person or group of people from the people in the scene being filmed, and information provided by the means for analyzing the scene about the selected person or group of people. A means for automatic framing based on the

【0014】 本発明は特に、テレビ会議用の録音および録画自動システムに関し、このシス
テムは録画装置および録音装置の制御手段、制御手段に位置信号を与える場面分
析手段、および撮影中の場面にいる人々から1人または1グループを選択する手
段を有し、選択手段がリモートコントロールを備える物理的インターフェースを
有し、このリモートコントロールが場面にいる人々の任意の1人または1グルー
プを選択して、この人またはグループの周りに自動的にフレーミングするか、又
は全ての人々を選択して場面の全体的なフレーミングすることができるようにす
ること、およびこのフレーミング手段が論理的インターフェースを有し、論理的
インターフェースがリモートコントロールで選択された人と場面分析からもたら
された位置情報との通信を確立し、撮影されている場面に関するこの人物または
グループの位置情報を制御手段に与えることができることを主に特徴とする。
The present invention particularly relates to an automatic recording and recording system for video conferencing, the system comprising a recording device and control means for the recording device, scene analysis means for providing a position signal to the control means, and people in the scene being photographed. Has a physical interface with a remote control, said remote control selecting any one or group of people in the scene, Automatically framing around a person or group, or selecting all people so that the entire framing of the scene can be performed, and the framing means has a logical interface, Interface derived from person selected by remote control and scene analysis It is characterized mainly in that communication with the position information is established, and the position information of this person or group regarding the scene being photographed can be given to the control means.

【0015】[0015]

【発明の実施の形態】BEST MODE FOR CARRYING OUT THE INVENTION

本発明の一実施例では、リモートコントロールは、制御信号を論理的インター
フェースに伝送できる装置を作動する汎用リモートコントローラである。 リモートコントローラで伝送される信号は赤外線信号でも電磁気信号でもよい
。 前記リモートコントローラからの制御信号は送受信器で受信および再伝送され
てもよい。前記リモートコントローラからの制御信号は、音声認識装置または身
体動作認識装置で受信および再伝送されてもよい。 リモートコントロールは、画像分析カメラのリモートコントローラで構成され
ていてもよく、前記リモートコントローラからの制御信号は、この分析カメラで
受信され、論理的インターフェースに再伝送される。
In one embodiment of the invention, the remote control is a general purpose remote controller operating a device capable of transmitting control signals to the logical interface. The signal transmitted by the remote controller may be an infrared signal or an electromagnetic signal. A control signal from the remote controller may be received and retransmitted at the transceiver. The control signal from the remote controller may be received and retransmitted by a voice recognition device or a body motion recognition device. The remote control may consist of a remote controller of the image analysis camera, from which the control signal is received and retransmitted to the logical interface.

【0016】 他の実施例では、リモートコントロールは汎用リモートコントローラであり、
前記リモートコントローラからの制御信号は分析カメラによって受信され、再伝
送される。 他の実施例では、リモートコントロールはグラフィックインターフェースを有
する。 この場合、リモートコントロールはさらにスクリーンを含み、ここに場面およ
び種々の選択可能な領域が表示される。 リモートコントロールは、識別された領域を選択するコンピュータ入出力周辺
機器を有する。
In another embodiment, the remote control is a general purpose remote controller,
Control signals from the remote controller are received by the analysis camera and retransmitted. In another embodiment, the remote control has a graphic interface. In this case, the remote control further includes a screen on which scenes and various selectable areas are displayed. The remote control has a computer input / output peripheral that selects the identified area.

【0017】 動作の一態様では、場面分析手段が局所分析信号(A)を受信し、選択手段に
よって局所的に撮影されている場面にいる1人の人または1グループの人々を選
択することが可能になり、且つ自動フレーミング手段が局所的に撮影されている
場面についての情報を用いるようにする。 動作の別の態様では、分析手段が遠隔システムから場面分析用の又は場面分析
に対応する信号(A’)を受信し、選択手段によって遠くから撮影されている場
面にいる1人の人または1グループの人々を選択することが可能になり、自動フ
レーミング手段によって遠くから撮影されている場面のフレーミングを制御する
ことが可能になり、制御信号が遠隔システムへ送信されるようになっている。
In one aspect of the operation, the scene analysis means receives the local analysis signal (A) and selects one person or a group of people in the scene being locally photographed by the selection means. It is possible, and the automatic framing means uses information about a scene that is locally photographed. In another aspect of the operation, the analyzing means receives a signal (A ') for scene analysis or corresponding to scene analysis from a remote system, and a person or one person in the scene being shot from a distance by the selecting means. A group of people can be selected, automatic framing means can control the framing of a scene being shot from a distance, and a control signal is transmitted to the remote system.

【0018】[0018]

【実施例】【Example】

本発明の他の利点は、指標として下記添付図面と共に与えられた説明を読めば
明らかになるであろうが、これに限定されるものではない。 図1は録音および録画の自動システムを概略図で示し、この図では場面50の
音を撮影および記録するためにオーディオビジュアルリソース10が備えられて
いる。
Other advantages of the present invention will become apparent from a reading of the description given in conjunction with the accompanying drawings below, by way of indication and not limitation. FIG. 1 schematically shows an automatic recording and recording system, in which an audiovisual resource 10 is provided for capturing and recording the sound of a scene 50.

【0019】 テレビ会議システムの場合、システムは、遠隔地にいる人々と通信したい単数
または複数の人々で構成されており、これらの人々を現場における参加者P1〜
Pnと呼ぶ。 オーディオビジュアルリソース10は、録音装置および録画装置から構成され
る。 録音装置は、例えば参加者の近くに配置された一連のマイクである。録画装置
は場面を撮影する一台またはそれ以上のカメラから構成される。
In the case of a videoconferencing system, the system is made up of one or more people who want to communicate with people in remote locations, and these people are referred to as participants P1
Called Pn. The audiovisual resource 10 includes a recording device and a recording device. The recording device is, for example, a series of microphones located near the participant. The recording device is composed of one or more cameras that shoot scenes.

【0020】 オーディオビジュアルリソース10は通常の制御装置20で制御され、制御装
置20はインターフェース30で入力として受信される情報に従って、録音装置
・録画装置(レコーダ)10に制御信号を出力することができる。これを以下に
詳細に示す。 本発明では、入力として受信される情報は、場面分析装置40および参加者に
よる選択を基にインターフェース30によって与えられる。 場面分析装置は、録画装置または録音録画装置と組み合わされた音声分析装置
または画面分析装置または音声画面分析装置でよい。
The audiovisual resource 10 is controlled by a normal control device 20, and the control device 20 can output a control signal to the recording device / recording device (recorder) 10 according to information received as an input at the interface 30. . This is described in detail below. In the present invention, the information received as input is provided by the interface 30 based on selections made by the scene analyzer 40 and participants. The scene analyzer may be a video recorder or an audio analyzer or a screen analyzer or an audio screen analyzer combined with a sound recorder.

【0021】 図示されている実施例では、この装置は既存の画面分析装置である。この目的
のために、固定された分析カメラ60(カメラは可動のものでもよい)が用いら
れ、このため観察される視覚的場面の分析をするのに用いられる必要な信号を与
えることが可能になる。 この結果場面分析装置は、この目的のため、カメラ60およびこのカメラによ
って供給される信号Aを処理する手段40を備える。これらの手段は、例えば、
既存の特殊な場面分析プログラムを備えるマイクロコンピュータまたはワークス
テーションで構成される。 より正確には、実用化される図の実施例では、視野に存在する人々の顔がニュ
ーラルネットワークによって検出され、前記プログラムが検出された顔を追跡す
るアルゴリズムを実施する。他の知られている方法を用いてもよい。 他の実施例では、場面を分析する装置40を可動式カメラと共に用いてもよい
In the embodiment shown, the device is an existing screen analyzer. For this purpose, a fixed analytical camera 60 (the camera may be mobile) is used, so that it is possible to provide the necessary signals used to make an analysis of the observed visual scene. Become. The resulting scene analyzer comprises for this purpose a camera 60 and means 40 for processing the signal A provided by the camera. These means, for example,
It consists of a microcomputer or workstation equipped with an existing special scene analysis program. More precisely, in the illustrated embodiment, the faces of the people present in the field of view are detected by a neural network, and the program implements an algorithm for tracking the detected faces. Other known methods may be used. In another embodiment, the scene analysis device 40 may be used with a movable camera.

【0022】 第3の実施例では、場面を分析する装置を複数の固定されたまたは可動式のカ
メラと共に用いても、これらで構成されていてもよい。 種々のレコーダ10が、本発明のインターフェース30から制御信号を受信す
る制御装置20によって制御される。 実際に実施された、図2の概略図に図示されている実施例は、画像を記録する
電動式カメラ11および音声を記録する音響アンテナ12を制御する装置20を
有する。 1組の人々および1人の人の録画および録音について下記に詳細に示す。これ
は本出願人の実際の実施例に一致する。
In a third embodiment, a scene analysis device may be used with or consist of a plurality of fixed or movable cameras. The various recorders 10 are controlled by a controller 20 that receives control signals from the interface 30 of the present invention. The embodiment illustrated in the schematic diagram of FIG. 2, which has been implemented in practice, has a device 20 for controlling a motorized camera 11 for recording images and an acoustic antenna 12 for recording sounds. A set of people and a single person's video recordings are detailed below. This is consistent with Applicants' actual working example.

【0023】 1グループの人々を録画および録音するのに同じ方法を用いることができる。
グループとは、全体の人々を小分けにした集団である。 実際に実施された好ましい実施例では、場面の分析は視覚的である。つまり人
々の位置は規定されるが、人々が話しているかどうかは無視される。 視聴覚的分析を必要とする他の実施例(従って音を含む)では、録音装置は視
聴覚情報を基に選択される。
The same method can be used to record and record a group of people.
A group is a group that subdivides the whole population. In the actually implemented preferred embodiment, the scene analysis is visual. That is, the location of the people is defined, but whether they are speaking is ignored. In other embodiments that require audiovisual analysis (and thus include sound), the recording device is selected based on the audiovisual information.

【0024】 システムのユーザが、インターフェース30を介して参加者全員P1〜Pnを
録画しようとする場合、制御装置20は、カメラ11の制約が許す限り録画する
という技術的規則に従い、カメラ11を制御して分析範囲にいる人々全員がフレ
ームに入れられるようにする。システムのユーザが、インターフェース30を介
して特定の1人を録画しようとする場合、制御装置20は、録画の規則に従い、
例えばその人が横方向の中心になり、例えば彼または彼女の目が画像の上からほ
ぼ3分の1のところにあるようにする。 一実施例では、選択された人のいずれかの側に単数または複数の人々が見える
場合、録画は、カメラと録画の規則に関する制約が許す限り、画像の中でこの人
を他の人から離すようにする。
When a user of the system intends to record all participants P 1 to Pn via the interface 30, the control device 20 controls the camera 11 according to a technical rule that recording is performed as long as the restrictions of the camera 11 allow. So that everyone in the analysis area is framed. If the user of the system intends to record a specific person via the interface 30, the control device 20 will follow the rules of recording,
For example, the person may be centered laterally, for example, with his or her eyes approximately one-third above the image. In one embodiment, if one or more people are visible on either side of the selected person, the recording will keep this person away from others in the image, as restrictions on the camera and recording rules allow. To do.

【0025】 ユーザがインターフェース30を介して参加者全員から録音しようとする場合
、装置20が録音を制御し、複数の参加者から音場を記録する。この音場は下記
種々の方法で得られる: 1)音響アンテナ12で形成される広い場から; 2)場面の分析を基に選択される、種々の録音装置(マイクまたは音響アンテ
ナ)により出力される音場を累積することによって。
If the user wishes to record from all participants via the interface 30, the device 20 controls the recording and records sound fields from multiple participants. This sound field can be obtained in various ways: 1) from a large field formed by the acoustic antenna 12; 2) output by various recording devices (microphones or acoustic antennas) selected based on an analysis of the scene. By accumulating the sound field.

【0026】 ユーザがインターフェース30を介して1人の人から録音しようとする場合、
装置20が録音を制御し、いろいろな人々から音場を記録する。この音場は下記
種々の方法で得られる: 1)音響アンテナ12の狭く、方向付け可能な場から。これは前記の実施例で
ある; 2)視覚情報または視聴覚情報から選択される、1つまたはそれ以上の録音装
置から。
If the user wants to record from one person via interface 30,
Device 20 controls the recording and records the sound field from various people. This sound field can be obtained in various ways: 1) from the narrow, steerable field of the acoustic antenna 12; This is the embodiment described above; 2) From one or more recording devices selected from visual or audiovisual information.

【0027】 インターフェース30によって、システムのユーザはその要求(参加者全員に
対する広角撮影、特定の人に対する狭い範囲の撮影)に従って録画および録音で
きるようになる。インターフェースによって出力される命令を送ることによって
、場面分析装置によって分析された視聴覚場面の関数として、録音装置および録
画装置の方向付けができる。 この目的のため、インターフェースは論理的インターフェース31および物理
的インターフェース32を有する。
The interface 30 allows the system user to record and record according to their requirements (wide-angle shooting for all participants, narrow-range shooting for a particular person). By sending the commands output by the interface, the recording device and the recording device can be oriented as a function of the audiovisual scene analyzed by the scene analysis device. For this purpose, the interface has a logical interface 31 and a physical interface 32.

【0028】 物理的インターフェース32は、図3〜7を参照して下記に説明される種々の
実施例によって構成できる。 論理的インターフェース31は、好ましい実施例に従って、場面分析信号40
を処理するためシステムにロードされたプログラムから構成される。この論理的
インターフェース31は、場面分析処理による出力である、場面にいる人々に関
する位置情報を回収し、この位置情報と物理的インターフェースを介して参加者
によって与えられる選択情報との通信を確立する。 この論理的インターフェース31はユニット40から受信した情報を解釈(つ
まりデコード)して位置制御信号を供給し、この制御信号を制御装置20で解釈
して、選択された人またはグループの望ましいフレーミングができる。 物理的インターフェース32の複数の実施例が下記に示される。
The physical interface 32 can be configured according to various embodiments described below with reference to FIGS. Logical interface 31 includes scene analysis signal 40 according to the preferred embodiment.
Consists of programs loaded into the system to process The logical interface 31 retrieves location information about the people in the scene, which is the output of the scene analysis process, and establishes communication between this location information and selection information provided by the participant via the physical interface. The logical interface 31 interprets (ie, decodes) the information received from the unit 40 and provides position control signals, which are interpreted by the controller 20 to provide the desired framing of the selected person or group. . Several embodiments of the physical interface 32 are shown below.

【0029】 第1の実施例は、図3に示されるようにマイクロプロセッサまたはワークステ
ーションPに取付けられたグラフィックインターフェース32Aを備える。 マウス320を用い、Eで表される「All」と名付けられたウィンドウをク
リックして、ユーザは場面にいる人々全員を録画および録音するように選択する
ことができる。マウスを用い、望ましい人P1〜pnまたはグループの人々の数
字を有するウィンドウをクリックして、ユーザは場面にいる1人を録画および録
音するように選択することができる。
The first embodiment comprises a graphic interface 32 A attached to a microprocessor or workstation P as shown in FIG. Using the mouse 320 and clicking on the window labeled "All", represented by E, the user can select to record and record all the people in the scene. Using the mouse and clicking on the window with the number of the desired person P1-pn or group of people, the user can choose to record and record one person in the scene.

【0030】 このグラフィックインターフェース32Aでは、人々への数字の割当が分析シ
ステムによって得られた人々の画像321と置き換えられる。この画像は、シス
テムのユーザによって確定された瞬間に得られるか、或いは会の最中に自動的に
更新される。 人々の画像321を有するグラフィックインターフェース32Aは、インター
フェースが、ユーザが選択する画像を表示できるため、ユーザにとってより人間
工学的である。 テレビ会議のスクリーンに、縮小したフォーマットでテレビ会議に出席する人
々の画像のオーバレイを用いた表示を提供することも可能である。
In this graphic interface 32 A, the assignment of numbers to people is replaced by an image 321 of people obtained by the analysis system. This image may be obtained at a moment determined by the user of the system or may be updated automatically during the meeting. Graphic interface 32A with images of people 321 is more ergonomic to the user because the interface can display the image that the user selects. It is also possible to provide a video conference screen with an overlay of images of people attending the video conference in a reduced format.

【0031】 他の実施例では、マウス320をタッチスクリーンおよび/または音声認識装
置Rと置き換えてもよい。 論理的インターフェース32について実施された他の実施例が図4で表される
。本実施例では、視覚的場面を分析するカメラ60のリモートコントローラ32
Bを使用して、システムのユーザが制御信号をカメラ60に送れるようにする。
このリモートコントローラは、使い易さおよび速度のため、適合され、使用され
た。 赤外線リモートコントローラ32Bは分析カメラ60と交信している(命令I
NST)。この分析カメラのリモートコントローラは、特に位置メモリに対応す
るボタンおよびカメラの待機位置に対応する「ホーム」ボタンHを含む複数のボ
タンを有する。
In another embodiment, mouse 320 may be replaced with a touch screen and / or voice recognition device R. Another embodiment implemented for logical interface 32 is illustrated in FIG. In this embodiment, the remote controller 32 of the camera 60 that analyzes a visual scene
B is used to allow a user of the system to send control signals to the camera 60.
This remote control was adapted and used for ease of use and speed. The infrared remote controller 32B is in communication with the analysis camera 60 (command I
NST). The remote control of the analysis camera has a plurality of buttons, including a button corresponding to a position memory and a “home” button H corresponding to a standby position of the camera.

【0032】 位置メモリは空間の方向を選択するために用いられるのではなく、ボタンが作
動されるという事実のみが用いられる。 位置メモリ内の位置は、カメラが待機位置にある時、システムによって予め初
期化される。実施例の1つでは、分析カメラが固定されるため、位置1〜6また
は「ホーム」ボタンHの作動はこの分析カメラ60の位置に全く影響しない。 このため、ユーザは例えば「ホーム」ボタンHを押すことによって、装置60
、40、30および20を介し、その場面にいる人々全員の録画および録音を作
動する。さらに、ユーザは位置を収容するメモリに対応するボタン1〜6の1つ
を押すことによって、装置60、40、30および20を介し、対応する人(こ
のバージョンでは最大で6人)の録画を作動する。
The location memory is not used to select the direction of space, only the fact that the buttons are activated. The position in the position memory is pre-initialized by the system when the camera is in the standby position. In one embodiment, the position of the analysis camera 60 is not affected at all by the activation of the positions 1 to 6 or the “home” button H, since the analysis camera is fixed. To this end, the user presses the “Home” button H,
, 40, 30 and 20 activate the recording of all the people in the scene. In addition, the user presses one of the buttons 1 to 6 corresponding to the memory containing the location, via the devices 60, 40, 30 and 20 to record the corresponding person (in this version up to 6). Operate.

【0033】 リモートコントローラが伝送中継器として分析カメラを用いても用いなくても
、他のリモートコントローラを使用してもよい。 例えば、分析カメラのリモートコントローラの代わりに汎用プログラミングを
有するリモートコントローラを用いて、ユーザが録画および録音を選択できるよ
うにすることも可能である。この実施例は、リモートコントローラ32Bがこの
場合、汎用リモートコントローラであること以外、図4の概略図に一致するため
図示されていない。
The remote controller may or may not use an analysis camera as a transmission repeater, and may use another remote controller. For example, a remote controller with general purpose programming can be used instead of the remote control of the analytical camera to allow the user to select recording and recording. This embodiment is not shown because it corresponds to the schematic diagram of FIG. 4, except that the remote controller 32B in this case is a general purpose remote controller.

【0034】 本発明のアプリケーションを実施するためハードウエアを製造する段階で、分
析カメラのいくつかのコード(位置メモリ、「ホーム」等)を汎用リモートコン
トローラに予め記録しなければならない。リモートコントローラ32Bが実際に
用いられる時、リモートコントローラによって送信される赤外線信号は、論理的
インターフェース31でデコードされ、分析される。 汎用リモートコントローラを用いて、一方では、利用不可能な分析カメラ60
の多少の制御が可能になり(汎用リモートコントロールは対応するコードを学習
しない)、他方では、ユーザの要求によりよく対応するように割り当てられたボ
タン、「+」および「−」ボタンを有し、彼または彼女がテレビのチャンネルで
慣れているように、ある人から次の人へと順番に移動することが可能になる。
At the stage of manufacturing hardware to implement the application of the present invention, some codes (location memory, “home”, etc.) of the analysis camera must be pre-recorded on a general-purpose remote controller. When the remote controller 32B is actually used, the infrared signal transmitted by the remote controller is decoded and analyzed by the logical interface 31. Using a universal remote control, on the one hand, the analysis camera 60 which is not available
(The general purpose remote control does not learn the corresponding code), on the other hand, has assigned buttons, "+" and "-" buttons, to better respond to user requests, It is possible to move from one person to the next in sequence, as he or she is accustomed to television channels.

【0035】 ここで、本発明の他の実施例に対応する図5を参照することができる。 リモートコントローラとインターフェース31との間の中継器として分析カメ
ラに依存しないため、且つユーザに幅広い制御パレットを供給するために、市販
の送受信装置70を使用してもよい。 この送受信装置70は、リモートコントローラ32Bが出力した赤外線信号I
NSTを取り込み、例えばインターフェース30に接続されたRS232通信ポ
ートを介して、論理的インターフェース31にコードを返す。
Reference can now be made to FIG. 5, which corresponds to another embodiment of the present invention. A commercially available transceiver 70 may be used because it does not rely on an analytical camera as a repeater between the remote controller and the interface 31 and to provide a wide range of control pallets to the user. The transmitting / receiving device 70 receives the infrared signal I output from the remote controller 32B.
It takes in the NST and returns a code to the logical interface 31 via, for example, an RS232 communication port connected to the interface 30.

【0036】 図6は、論理的インターフェース32が既存の音声認識装置80と組み合わさ
れた音声リモートコントロール32Bを有する実施例を示す。 図7は、論理的インターフェース32が既存の身体動作認識装置90と組み合
わされた身体動作リモートコントロール32Bを有する実施例を示す。 インターフェースの前記実施例によって、ユーザは、ユーザがいる部屋の中に
物理的に存在するレコーダで得られる録画および録音を選択できるようになる。
これは、図1の場面分析に用いられた信号A(局所、その場)によって表される
FIG. 6 shows an embodiment in which the logical interface 32 has a voice remote control 32 B combined with an existing voice recognition device 80. FIG. 7 shows an embodiment in which the logical interface 32 has a body movement remote control 32 B combined with an existing body movement recognition device 90. Said embodiment of the interface allows the user to select the recordings and recordings obtained on the recorder physically present in the room where the user is.
This is represented by the signal A (local, in-situ) used in the scene analysis of FIG.

【0037】 他の実施例では、前記のインターフェース31、32によって離れた部屋(ユ
ーザがいない)、例えば彼または彼女がテレビ会議によって参加している部屋に
物理的に存在する録画装置および録音装置を制御することが可能になる。 こうしてテレビ会議に参加しているユーザは、望ましい録画および録音を選択
し、得るであろう。この目的のため、場面分析用の信号A’(遠隔)または分析
に対応する信号(映像信号が与えられない遠隔システムによってすでに分析され
た信号)は、分析装置40の入力に印加される。 本実施例で、遠赤外線リモートコントローラまたはグラフィックインターフェ
ースで伝送される信号C’(およびグラフィックインターフェースを構成するの
に必要な信号)は、画像、音声およびテレビ会議の他の信号と共に伝送される。 本実施例では、局所(その場)の部屋と遠隔の部屋との間にレコーダ制御の矛
盾が起こり得るが、これはうまく処理しなくてはならない。
In another embodiment, the interfaces 31, 32 allow the recording and recording equipment physically present in a room (without a user), for example, the room in which he or she is participating in a video conference. It becomes possible to control. Thus, a user participating in a video conference will select and obtain the desired recording and recording. For this purpose, a signal A ′ (remote) for scene analysis or a signal corresponding to the analysis (signal already analyzed by a remote system to which no video signal is provided) is applied to the input of the analyzer 40. In this embodiment, the signal C '(and the signals required to configure the graphic interface) transmitted by the far-infrared remote controller or the graphic interface is transmitted together with the image, audio, and other signals of the video conference. In this embodiment, inconsistencies in recorder control between a local (in-situ) room and a remote room may occur, but this must be handled well.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 本発明の概略図を表す。FIG. 1 represents a schematic diagram of the invention.

【図2】 本発明のより詳細な図を表す。FIG. 2 represents a more detailed diagram of the invention.

【図3】 物理的インターフェースの特定の実施例を表す。FIG. 3 illustrates a particular embodiment of a physical interface.

【図4】 物理的インターフェースの他の実施例を表す。FIG. 4 illustrates another embodiment of a physical interface.

【図5】 物理的インターフェースの他の実施例を表す。FIG. 5 illustrates another embodiment of a physical interface.

【図6】 物理的インターフェースの他の実施例を表す。FIG. 6 illustrates another embodiment of a physical interface.

【図7】 物理的インターフェースの他の実施例を表す。FIG. 7 illustrates another embodiment of a physical interface.

【符号の説明】[Explanation of symbols]

10 録画装置および録音装置 20 制御手段 30 選択手段 40 場面分析手段 31 論理的インターフェース 32 物理的インターフェース 32A、32B リモートコントローラ 60 画像分析カメラ 70 送受信機 DESCRIPTION OF SYMBOLS 10 Recording device and recording device 20 Control means 30 Selection means 40 Scene analysis means 31 Logical interface 32 Physical interface 32A, 32B Remote controller 60 Image analysis camera 70 Transceiver

───────────────────────────────────────────────────── フロントページの続き (72)発明者 コロベール,ミシェル フランス国 22560 プルムール ボドゥ グウェラドゥル ヴラ 4 (72)発明者 ベルニエ,オリヴィエ フランス国 22300 ラニヨン リュ ケ ルヴェノ 50アー Fターム(参考) 5C054 AA02 AA05 CA04 CA08 CC02 CF05 CG05 EA01 EA07 FC12 FF02 FF03 FF07 GB01 HA25 5C064 AA02 AC04 AC06 AC08 AC12 AC18 ──────────────────────────────────────────────────続 き Continuing on the front page (72) Inventor Corobert, Michel, France 22560 Purmour Bodu Gueradre Vra 4 (72) Inventor, Bernier, Olivier, France 22300 Lanyon Lou Querveno 50a F-term (reference) 5C054 AA02 AA05 CA04 CA08 CC02 CF05 CG05 EA01 EA07 FC12 FF02 FF03 FF07 GB01 HA25 5C064 AA02 AC04 AC06 AC08 AC12 AC18

Claims (11)

【特許請求の範囲】[Claims] 【請求項1】 音声および画像自動記録システムで、録画装置および録音装
置(10)の制御手段(20)と、制御手段(20)に位置信号を供給する場面
分析手段(40)と、撮影中の場面にいる人々から1人または1グループを選択
する手段(30)とを有し、 前記選択手段がリモートコントロール(32A、32B)を備える物理的イン
ターフェース(32)を有し、このリモートコントロールにより場面にいる人々
の任意の1人または1グループを選択して、この人またはグループの周りに自動
的にフレーミングするか、又は全ての人々を選択して場面の全体的なフレーミン
グすることができ、 このフレーミング手段が論理的インターフェース(31)を有し、この論理的
インターフェースがリモートコントロール(32Aまたは32B)で選択された
人と場面分析からもたらされた位置情報との通信を確立し、撮影されている場面
に関するこの人物またはグループの位置情報を制御手段(20)に与えることが
できることを特徴とするシステム。
1. A sound and image automatic recording system, a control unit (20) of a recording device and a recording device (10), a scene analysis unit (40) for supplying a position signal to the control unit (20), Means (30) for selecting one or a group from the people in the scene, said selection means having a physical interface (32) with remote controls (32A, 32B), Selecting any one or a group of people in the scene to automatically frame around this person or group, or selecting all people to frame the entire scene; The framing means has a logical interface (31), which is a remote control (32A or 3A). Establishing communication between the person selected in B) and the position information resulting from the scene analysis and providing the position information of this person or group with respect to the scene being photographed to the control means (20). And the system.
【請求項2】 前記リモートコントロール(32B)が、制御信号を論理的
インターフェース(31)に伝送できる装置を作動する汎用リモートコントロー
ラであることを特徴とする請求項1に記載のシステム。
2. The system according to claim 1, wherein the remote control is a general-purpose remote controller operating a device capable of transmitting control signals to a logical interface.
【請求項3】 前記リモートコントローラ(32B)からの制御信号が、送
受信器(70)で受信および再伝送されることを特徴とする請求項2に記載のシ
ステム。
3. The system according to claim 2, wherein the control signal from the remote controller (32B) is received and retransmitted at a transceiver (70).
【請求項4】 前記リモートコントローラ(32B)からの制御信号が音声
認識装置(80)または身体動作認識装置(90)で受信および再伝送されるこ
とを特徴とする請求項2に記載のシステム。
4. The system according to claim 2, wherein the control signal from the remote controller (32B) is received and retransmitted by a voice recognition device (80) or a body motion recognition device (90).
【請求項5】 リモートコントロール(32B)が画像分析カメラ(60)
のリモートコントローラで構成され、前記リモートコントローラ(32)からの
制御信号が分析カメラ(60)で受信され、論理的インターフェース(31)に
再伝送されることを特徴とする請求項1に記載のシステム。
5. A remote control (32B) comprising an image analysis camera (60).
The system according to claim 1, characterized in that the control signal from the remote controller (32) is received by an analysis camera (60) and retransmitted to a logical interface (31). .
【請求項6】 リモートコントロール(32B)が汎用リモートコントロー
ラであり、前記リモートコントローラ(32B)からの制御信号が分析カメラ(
60)によって受信され、再伝送されることを特徴とする請求項1に記載のシス
テム。
6. A remote control (32B) is a general-purpose remote controller, and a control signal from the remote controller (32B) is transmitted to an analysis camera (32B).
The system of claim 1, wherein the system is received and retransmitted by (60).
【請求項7】 リモートコントロールがグラフィックインターフェース(3
2A)を有することを特徴とする請求項1に記載のシステム。
7. The remote control is a graphic interface (3).
The system of claim 1, comprising 2A).
【請求項8】 リモートコントロールがさらにスクリーン(321)を含み
、ここに場面および種々の選択可能な領域が表示されることを特徴とする請求項
7に記載のシステム。
8. The system according to claim 7, wherein the remote control further comprises a screen (321) in which scenes and various selectable areas are displayed.
【請求項9】 リモートコントロールが識別された領域を選択するコンピュ
ータ入出力周辺機器(320)を有することを特徴とする請求項7に記載のシス
テム。
9. The system according to claim 7, wherein the remote control comprises a computer input / output peripheral (320) for selecting the identified area.
【請求項10】 前記場面分析手段が局所分析信号(A)を受信し、選択手
段によって局所的に撮影されている場面にいる1人の人または1グループの人々
を選択することが可能になり、自動フレーミング手段が局所的に撮影されている
場面についての情報を用いることを特徴とする請求項1から9のいずれか1項に
記載のシステム。
10. The scene analysis means receives the local analysis signal (A), and it is possible to select one person or a group of people in a scene which is locally photographed by the selection means. 10. The system according to claim 1, wherein the automatic framing means uses information about the scene being locally photographed.
【請求項11】 前記分析手段が遠隔手段から場面分析用の或いは場面分析
に対応する信号(A’)を受信し、選択手段によって遠隔で撮影されている場面
にいる1人の人または1グループの人々を選択することが可能になり、自動フレ
ーミング手段によって遠隔で撮影されている場面のフレーミングを制御すること
が可能になり、制御信号が遠隔システムへ伝送されることを特徴とする請求項1
から11のいずれか1項に記載のシステム。
11. The analysis means receives a signal (A ') for scene analysis or corresponding to scene analysis from a remote means, and a person or a group in a scene which is remotely shot by the selection means. The framing of a scene being remotely shot by the automatic framing means can be controlled, and the control signal is transmitted to a remote system.
The system according to any one of claims 1 to 11.
JP2000568257A 1998-08-31 1999-08-26 Automatic audio and image recording system Abandoned JP2002524936A (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR98/10888 1998-08-31
FR9810888A FR2782877B1 (en) 1998-08-31 1998-08-31 AUTOMATIC SOUND AND IMAGE SYSTEM
PCT/FR1999/002047 WO2000013417A1 (en) 1998-08-31 1999-08-26 Automatic system for sound and image recording

Publications (2)

Publication Number Publication Date
JP2002524936A true JP2002524936A (en) 2002-08-06
JP2002524936A5 JP2002524936A5 (en) 2006-10-12

Family

ID=9530001

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000568257A Abandoned JP2002524936A (en) 1998-08-31 1999-08-26 Automatic audio and image recording system

Country Status (4)

Country Link
EP (1) EP1110398A1 (en)
JP (1) JP2002524936A (en)
FR (1) FR2782877B1 (en)
WO (1) WO2000013417A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011201406A (en) * 2010-03-25 2011-10-13 Denso It Laboratory Inc Outer-vehicle sound providing device, outer-vehicle sound providing method, and program

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010055058A1 (en) * 2000-06-08 2001-12-27 Rajko Milovanovic Method and system for video telephony
US6937266B2 (en) * 2001-06-14 2005-08-30 Microsoft Corporation Automated online broadcasting system and method using an omni-directional camera system for viewing meetings over a computer network

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2389865B1 (en) * 1977-05-06 1981-11-20 Realisa Electroniques Et
US4286289A (en) * 1979-10-31 1981-08-25 The United States Of America As Represented By The Secretary Of The Army Touch screen target designator
GB9119863D0 (en) * 1991-09-17 1991-10-30 Radamec Epo Ltd Pictorial based shot and recall method and equipment for remotely controlled camera systems
CA2148231C (en) * 1993-01-29 1999-01-12 Michael Haysom Bianchi Automatic tracking camera control system
US5745161A (en) * 1993-08-30 1998-04-28 Canon Kabushiki Kaisha Video conference system
CN1135823A (en) * 1993-10-20 1996-11-13 电视会议系统公司 Adaptive videoconferencing system
US5508734A (en) * 1994-07-27 1996-04-16 International Business Machines Corporation Method and apparatus for hemispheric imaging which emphasizes peripheral content
WO1996014587A2 (en) * 1994-11-04 1996-05-17 Telemedia A/S A method in an image recording system
US5805745A (en) * 1995-06-26 1998-09-08 Lucent Technologies Inc. Method for locating a subject's lips in a facial image

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011201406A (en) * 2010-03-25 2011-10-13 Denso It Laboratory Inc Outer-vehicle sound providing device, outer-vehicle sound providing method, and program

Also Published As

Publication number Publication date
WO2000013417A1 (en) 2000-03-09
EP1110398A1 (en) 2001-06-27
FR2782877B1 (en) 2000-10-13
FR2782877A1 (en) 2000-03-03

Similar Documents

Publication Publication Date Title
DE69522152T2 (en) Voice tracking video system
US7349008B2 (en) Automated camera management system and method for capturing presentations using videography rules
Cutler et al. Distributed meetings: A meeting capture and broadcasting system
US8169463B2 (en) Method and system for automatic camera control
US7559026B2 (en) Video conferencing system having focus control
JP3385591B2 (en) Display control method for video conference system
US6731334B1 (en) Automatic voice tracking camera system and method of operation
US5444476A (en) System and method for teleinteraction
US7969472B2 (en) Automatic camera steering control and video conferencing
US7515172B2 (en) Automated online broadcasting system and method using an omni-directional camera system for viewing meetings over a computer network
KR100960781B1 (en) Integrated design for omni-directional camera and microphone array
Rui et al. Automating lecture capture and broadcast: technology and videography
CA2200669C (en) System and method for controlling the field of view of a camera
US20070081080A1 (en) Presentation video control system
US7358985B2 (en) Systems and methods for computer-assisted meeting capture
US20040233273A1 (en) Method and apparatus for selection of signals in a teleconference
US20080180519A1 (en) Presentation control system
JPH07255044A (en) Animated electronic conference room and video conference system and method
US11750925B1 (en) Computer program product and method for auto-focusing a camera on an in-person attendee who is speaking into a microphone at a meeting
JPH1042264A (en) Video conference system
JP2002524936A (en) Automatic audio and image recording system
US20030052962A1 (en) Video communications device and associated method
Osawa et al. Distributed automatic camera control system tracking markers for distance education
NL2029537B1 (en) A system, method, and controller for providing an output video signal for recording and/or streaming of a presentation given by a presenter in front of an audience
US12075162B2 (en) Camera with plural selective fields of view

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060825

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060825

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20081024