KR20000037652A - Method for controlling camera using sound source tracking in video conference system - Google Patents

Method for controlling camera using sound source tracking in video conference system Download PDF

Info

Publication number
KR20000037652A
KR20000037652A KR1019980052285A KR19980052285A KR20000037652A KR 20000037652 A KR20000037652 A KR 20000037652A KR 1019980052285 A KR1019980052285 A KR 1019980052285A KR 19980052285 A KR19980052285 A KR 19980052285A KR 20000037652 A KR20000037652 A KR 20000037652A
Authority
KR
South Korea
Prior art keywords
sound source
camera
video
video conference
conference
Prior art date
Application number
KR1019980052285A
Other languages
Korean (ko)
Inventor
서현열
Original Assignee
전주범
대우전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 전주범, 대우전자 주식회사 filed Critical 전주범
Priority to KR1019980052285A priority Critical patent/KR20000037652A/en
Publication of KR20000037652A publication Critical patent/KR20000037652A/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/142Constructional details of the terminal equipment, e.g. arrangements of the camera and the display
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/326Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only for microphones

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)

Abstract

PURPOSE: A method for controlling camera using sound source tracking in a video conference system is provided to track sound source to point the camera to the source in the video conference system. CONSTITUTION: A method for controlling camera using sound source tracking in a video conference system includes four steps. at the first step(S100), a plurality of sound collector located in different positions collect voices of the participants. At the second step(S110), 3 positions for best sound quality are selected. At the(S120), the sound source is tracked using the voices received from the 3 positions. At the(S130), camera is positioned to the 3 sound source. The first step(S100) further uses microphones for tracking.

Description

영상회의 시스템에서의 음원 추적에 의한 카메라 제어 방법(A camera controlling method by voice tracking in a video conferencing system)A camera controlling method by voice tracking in a video conferencing system

본 발명은 영상회의 시스템에 관한 것으로서, 상세하게는 특정 위치에 구비된 다수개의 초지향성 마이크를 이용하여 회의자들의 음성을 수집하고, 음원을 추적하여 음원이 발생된 방향으로 카메라를 자동 이동시키는 영상회의 시스템에서의 음원 추적에 의한 카메라 제어 방법에 관한 것이다.The present invention relates to a videoconferencing system, and more particularly, a videoconferencing system, which collects the voices of the conferees using a plurality of super-directional microphones provided at a specific location, tracks the sound source, and automatically moves the camera in the direction in which the sound source is generated. It relates to a camera control method by sound source tracking in a system of.

일반적으로 영상회의란 시간과 장소에 제약을 받지 않고 영상, 음성, 문자, 그래픽, 이미지 등과 같은 멀티미디어 데이터를 이용하여 동일시간, 동일장소에서 회의하는 것과 같은 효과를 갖게 하는 회의 방식을 말한다.In general, video conferencing refers to a conference method that has an effect such as meeting at the same time and place using multimedia data such as video, audio, text, graphics, and images without being restricted by time and place.

이러한 영상회의 시스템으로는 대한민국 공개 특허 96-00143939호가 있다. 이에 의한 영상회의 시스템의 전체 구성도는 도 1과 같다.Such a video conferencing system includes Korean Patent Publication No. 96-00143939. The overall configuration diagram of the video conferencing system thereby is shown in FIG.

즉, 영상회의 시스템은 이를 위한 별도의 광통신망(12)을 구축하여 영상회의가 가능하도록 구성하며, 영상회의 시스템의 단말(TV회의 단말, TV회의실, 국제 회의실, 영상회의실)은 초소형 카메라, PC, 2-웨이 터미널, 스피커 등으로 구성하며, 센터에 코덱(CODEC)을 설치하여 원격지 회의가 가능하도록 구성한다.That is, the video conferencing system constructs a separate optical communication network 12 for the video conferencing, and the terminal (TV conferencing terminal, TV conference room, international conference room, video conference room) of the video conferencing system is a small camera and a PC. It consists of a 2-way terminal, a speaker, etc., and a codec is installed in the center to enable remote meetings.

도면에서 영상센터와 TV회의 단말 및 TV회의실간에는 O/F(Optical Fiber)로 연결되며, 통신망(12)과 각 센터(11, 13, 14)와는 O/R(Office Repeater)에 의하여 연결된다.In the drawing, the video center, the TV conference terminal, and the TV conference room are connected by optical fiber (O / F), and the communication network 12 and each center 11, 13, and 14 are connected by an O / R (Office Repeater).

도 2는 영상회의 시스템의 상세 구성도이며, 영상회의 시스템은 주제어장치부와 단말부로 구성된다.2 is a detailed configuration diagram of a video conference system, and the video conference system includes a main controller and a terminal unit.

주제어장치부는 영상회의 시스템의 메인시스템으로 전체 시스템을 제어하며, A/V스위치, 화면분할장치, 코덱(CODEC) 등으로 구성되며, A/V 스위치는 방송센터의 모든 A/V소스를 제어하며 타시스템과의 인터페이스도 수행한다.The main controller is the main system of the video conferencing system and controls the entire system. It consists of A / V switch, screen splitter and codec. The A / V switch controls all A / V sources in the broadcasting center. It also interfaces with other systems.

상기 주제어장치부는 A/V 스위치, 화면분할장치, 코덱(CODEC), 영상메인PC, 호스트컴퓨터, 영상회의 단말PC, 오디오믹서(audio mixer), VDA, ADA, CRT터미널, 프린터, 광전송장치 등을 포함하여 구성된다.The main controller comprises an A / V switch, a screen splitter, a codec, a video main PC, a host computer, a video conferencing terminal PC, an audio mixer, a VDA, an ADA, a CRT terminal, a printer, an optical transmission device, and the like. It is configured to include.

또 A/V 스위치는 영상회의 단말의 요청에 의한 영상 및 음성의 입출력을 자동전환하며, 그 용량은 IBS 빌딩내 영상회의 시스템 구축을 위한 확장성에 대응하도록 구성한다.In addition, the A / V switch automatically switches the input and output of video and audio at the request of the videoconferencing terminal, and its capacity is configured to correspond to the scalability for constructing the videoconferencing system in the IBS building.

화면분할장치는 영상회의 단말의 요청에 의하여 풀(full)화면, 4분할화면을 제공하여 자기 화면 및 상대방의 화면을 동시에 보면서 회의를 진행함으로써 실감나는 영상회의를 진행할 수 있도록 한다. 그리고 오디오 믹서는 단말에서 입력되는 마이크 신호를 합성하여 송출하며 다자간 회의시에 필요하다.The screen splitting apparatus provides a full screen and a 4-split screen at the request of a video conference terminal, so that a video conference can be performed realistically by conducting a conference while simultaneously viewing a screen of the self and the counterpart. The audio mixer synthesizes and transmits a microphone signal input from the terminal and is required for a multi-party conference.

코덱(CODEC)은 동화상 압축기술을 이용하여 영상신호 및 음성신호를 T1 라인으로 변환하여 전송하며, T1 라인으로 전송되어온 영상신호 및 음성신호를 복조하여 원격지와의 영상회의를 가능하도록 한다.A codec converts a video signal and an audio signal to a T1 line by using a moving picture compression technique, and demodulates a video signal and an audio signal transmitted through the T1 line to enable a video conference with a remote site.

영상메인PC는 영상회의 시스템의 중추적인 역할을 수행하는 장치로서, 주로 A/V 스위치, 화면분할장치, 코덱(CODEC) 등을 제어한다. 호스트컴퓨터는 전체 시스템을 통합 관리하여 각종 제어 PC들을 제어하고, 영상회의단말의 상태를 관리하고, 또한 각종 경보 및 보고 관리한다. 영상회의단말PC는 영상회의단말을 주로 관리하고, 영상회의단말의 요구데이터를 호스트컴퓨터로 전송한다.The video main PC is a device that plays a pivotal role in a video conferencing system, and mainly controls an A / V switch, a screen splitter, a codec, and the like. The host computer integrates and manages the entire system to control various control PCs, manage the status of the video conference terminal, and manage various alarms and reports. The video conferencing terminal PC mainly manages the video conferencing terminal, and transmits the request data of the video conferencing terminal to the host computer.

광전송장치(OTRX-10)는 베이스밴드(baseband) 영상 및 음성신호를 광신호로 상호변환하고, RS-232 제어신호를 광신호로 변환한다.The optical transmission device OTRX-10 converts baseband video and audio signals into optical signals and converts RS-232 control signals into optical signals.

VDA는 영상신호를 증폭 및 분배하고 1개의 입력신호를 6개의 출력으로 분배하고, ADA는 음성신호를 증폭 및 분배하고 1개의 입력신호를 6개의 출력으로 분배한다.The VDA amplifies and distributes the video signal, distributes one input signal to six outputs, and the ADA amplifies and distributes the audio signal, and distributes one input signal to six outputs.

CRT터미널은 호스트컴퓨터의 데이터 입력용 및 각종 단말 감시용으로 사용되며, 프린터는 각종 단말의 상태에 대한 정보를 프린트하고 온-라인으로 사용한다.The CRT terminal is used for data input and monitoring of various terminals of the host computer, and the printer prints information on the status of various terminals and uses them on-line.

그리고 TV회의단말부는 TV회의를 직접 운용하는 부분으로 PC를 이용하여 영상회의를 수행하며, PC모니터에 카메라 및 스피커를 실장하여 운용하며 별도의 키보드 대신에 마우스로 모든 동작을 조작한다. 또한 TV회의단말에서 CATV시스템, VRS(Video Response System), CCTV시스템 등과도 연동하여 서비스를 받을 수 있다.In addition, the TV conference terminal performs video conference using a PC as a part of directly operating a TV conference. The camera and speaker are mounted and operated on a PC monitor, and all operations are operated by a mouse instead of a separate keyboard. In addition, the TV conference terminal can receive services in conjunction with CATV system, VRS (Video Response System), CCTV system.

단말부는 도 3에 도시한 바와 같이 2-웨이 터미널(2-way terminal), PC, 영상캡처보드(image capture board), 카메라 및 부수장치, 마이크, 스피커, 광전송장치, 콘솔 등을 포함하여 구성된다.As shown in FIG. 3, the terminal unit includes a 2-way terminal, a PC, an image capture board, a camera and an auxiliary device, a microphone, a speaker, an optical transmission device, a console, and the like. .

2-웨이 터미널은 영상센터와 데이터 통신을 수행하며, 단말 카메라의 전원 온/오프를 제어하고, 상대방 호출시 멜로디를 출력하고, VRS 안내화 리스트를 다운로드하는 기능을 수행한다.The 2-way terminal performs data communication with the video center, controls the power on / off of the terminal camera, outputs melody when the other party calls, and downloads the VRS guided list.

PC는 2-웨이 터미널과 데이터 통신하며, 마우스를 이용하여 윈도우상에 표시된 모든 메뉴를 선택할 수 있으며, 모든 영상회의 관련 기능(회의 운용 및 CATV VRS 억세스 등)을 처리한다.The PC communicates with the 2-way terminal, selects all the menus displayed on the window using the mouse, and handles all video conference related functions (such as conference management and CATV VRS access).

영상캡처보드는 IBM 호환기종에서 사용 가능한 비디오 어댑터(video adapter)로서 영상신호 및 음성신호를 처리하고, 30 프레임/초의 영상화면이 입력되며, 영상 이미지를 저장할 수 있다.The video capture board is a video adapter that can be used with IBM compatible models, and can process video signals and audio signals, input 30 frames / sec video screen, and store video images.

카메라 및 부수장치는 CCD 칼라 카메라로서 선명한 화질을 제공할 수 있으며, AUTO IRIS 기능을 구비한다. 또한, 호출에 대한 응답을 위해 응답/취소키가 카메라와 실장되어 모니터 상단에 설치된다. 마이크는 음성입력장치로서 사용되고, 스피커는 음성출력장치로서 사용된다.The camera and accessories are CCD color cameras that can provide clear picture quality and have an AUTO IRIS function. In addition, a response / cancel key is mounted on the camera and installed on top of the monitor to answer the call. The microphone is used as a voice input device, and the speaker is used as a voice output device.

광전송장치(OTRX)는 베이스 밴드 A/V신호를 광신호로 상호변환하고, RS-232C 제어신호를 광신호로 변환한다. 그리고, 콘솔은 PC, 2-웨이 터미널 등을 실장하고 롤-어바우트형(rollabout type : 이동형)으로 제작된다.The optical transmission device OTRX converts a baseband A / V signal into an optical signal and converts an RS-232C control signal into an optical signal. The console is equipped with a PC, a 2-way terminal, and is manufactured in a roll-about type.

이러한 영상회의 시스템에서 호출자에 의한 영상회의 수행은 호출자가 PC의 전원을 켜서, 키보드를 이용한 키입력으로 영상회의 화면을 띄운 다음, 영상회의를 하고자하는 상대편 아이콘을 선택하면 화면에 카메라에 잡힌 호출자의 모습과 함께 대기 메시지가 나타난다. 만일 상대편의 응답이 있으면 상대편의 모습이 화면에 나타나며 영상회의를 수행할 수 있다.In the video conferencing system, a video conference is performed by the caller, when the caller turns on the PC, brings up the video conference screen by key input using a keyboard, selects the other party's icon to be video conference, A wait message appears with a picture. If there is a response from the other party, the other party's appearance is displayed on the screen and video conferencing can be performed.

만일 상대방의 응답이 없으면 부재 중이라는 메시지를 화면에 표시하고 영상회의를 계속할지의 여부를 묻고 회의를 계속하고자 하는 경우에는 처음으로 돌아가고 그렇지 않으면 종료한다.If there is no response from the other party, a message is displayed on the screen and asks whether or not to continue the video conference.

영상회의 수행 중에는 음성볼륨, 카메라, 화면색상 등을 조정하거나 편집기를 활용할 수 있다. 특히, 편집기를 이용하여 회의보고자료를 보고자하는 경우, 마우스를 이용하여 화면의 편집기를 지정하면, 화면이 2개로 분할되면서 좌측에는 상대방의 영상이 나타나고 우측에는 보고자료 편집기가 나타나며, 파일리스트에서 보고자하는 파일을 마우스로 지정하면 그 파일이 화면에 나타난다.During video conference, you can adjust voice volume, camera, screen color, etc. or use editor. In particular, if you want to see the conference report data using the editor, if you specify the editor of the screen using the mouse, the screen is divided into two, the video of the counterpart appears on the left side and the report data editor appears on the right side, If you specify a file with the mouse, the file will appear on the screen.

영상회의 수행 중 보고자료를 상대방에게 송신하고자 하는 경우, 편집기가 나와 있은 상태에서 자료전송란을 마우스를 이용하여 지정하면, 작은 윈도우와 그 안에 파일 리스트가 나타나고, 그 리스트내에서 전송하고자 하는 파일을 마우스로 지정하면 파일 전송이 이루어지면 화면에는 파일전송중 메세지가 나타난다. 그 전송이 완료되면 전송완료 메세지가 나타나고 전송이 끝난다. 회의가 종료되면 호스트에 종료데이터를 전송하고 영상회의는 종료된다.If you want to send the report data to the other party during the video conference, if you specify the data transmission column with the mouse while the editor is displayed, a small window and a file list appear in it, and the file to be transmitted in the list is displayed. If is set to, the file transfer message is displayed on the screen when the file is transferred. When the transmission is completed, a transmission completion message appears and the transmission ends. When the conference is over, the termination data is transmitted to the host, and the video conference is terminated.

한편, 호출자에 의하여 영상회의 요청이 오면, 피호출자에게 영상회의를 알리는 멜로디가 울린다. 만일 그 영상회의 소집에 응하고자 하는 경우, PC 모니터 위의 응답키를 누르면 멜로디가 멈춘다. 만일 영상회의 소집에 응하지 않을 경우 PC 모니터상에 취소키를 누르면 멜로디가 중지되고 영상회의는 이루어지지 않고 종료된다.On the other hand, when a video conference request is received by the caller, a melody that notifies the called party of the video conference rings. If you want to respond to the video conference, press the response key on the PC monitor to stop the melody. If the video conference is not called, pressing the Cancel key on the PC monitor stops the melody and ends the video conference.

영상회의 소집에 응하는 경우에는 피호출된 PC 전원의 상태를 검사하여 오프상태이면 단말장치의 PC, 카메라, 스피커 등의 전원을 온하고 영상회의 실행을 위한 실행파일을 자동 수행한다. 그리고 만일 PC를 사용 중이면 그 작업을 끝내고 영상회의 실행을 위한 명령어를 입력한다. 그러면 PC에 MS 윈도우즈 화면이 나타나고, 잠시 후 상대편의 모습이 나타나며 화상회의를 수행할 수 있다.In response to the video conference call, the state of the called PC power source is checked, and if it is in the off state, the PC, camera, speaker, etc. of the terminal device are turned on and the executable file for executing the video conference is automatically executed. If you are using a PC, finish the task and enter the command to run the video conference. This will bring up the MS Windows screen on your PC, and after a while you will be able to conduct video conferencing.

한편, 다자간 영상회의를 수행하고자 하는 경우, 먼저 PC를 켜고 키보드를 이용하여 영상회의 명령어를 누르면 화면에 MS 윈도우즈가 수행되면서 곧이어 영상회의 화면이 나타나고, 또한 자신의 모습이 화면에 나타난다.On the other hand, if you want to conduct multi-party video conferencing, first turn on the PC and press the video conferencing command using the keyboard, MS Windows is performed on the screen, the video conferencing screen immediately appears, and also his appearance appears on the screen.

화면에서 다자회의 아이콘을 마우스를 이용하여 지정하면 다시 작은 윈도우가 열리면서 다자회의 참석자 명단이 그 윈도우에 나타난다. 마우스를 이용하여 영상회의 참석자를 여러명 지정하면 잠시 대기 메시지가 나타나고, 화면에 4분할된 영상회의 참가자 모습이 나타남으로써 다자간 영상회의를 수행할 수 있다.If you designate the conference icon on the screen with the mouse, a small window will open again and the conference attendee list will appear in the window. If you specify a number of participants in the video conference using the mouse, a waiting message appears for a while, and the video conference participant can be displayed on the screen.

그리고 2자회의 중 제3자를 추가하고자 하는 경우, 화면에서 참가시키고자 하는 대상자의 아이콘을 마우스로 선택하면, 잠시 대기 메시지가 나타난 후, 상대방의 응답이 있으면 화면이 4분할되면서 참가자 모습이 나타나고 3자간 영상회의를 수행할 수 있다. 또한 3자회의에서 제4자를 추가시킬 때에도 위와 같은 절차를 반복 수행한다.If you want to add a third party during the two-party meeting, select the icon of the person you want to join with the mouse on the screen, and after the waiting message appears for a while, if there is a response from the other party, the screen will be divided into four parts and the participant will appear. You can conduct video conference. In addition, the same procedure is repeated when adding a fourth party in a three-party conference.

이와 같은 영상회의 시스템에서는 회의자를 촬영하는 카메라는 회의자의 정면 중앙에 위치하여 회의자를 촬영한다. 따라서 다자회의인 경우에는 대화자가 변경되면 카메라를 음성이 들리는 방향으로 움직여야하는 불편함이 있었다.In such a video conferencing system, a camera for photographing a meeting person is located at the front center of the meeting room to photograph the meeting person. Therefore, in the case of multi-party meetings, there was an inconvenience of moving the camera in the direction of voice when the dialog was changed.

이러한 문제점을 개선하기 위하여 화상회의를 진행하는 공간의 3지점에 음성을 수집하는 마이크를 설치하고, 각 마이크가 음성한 감지한 순간의 시간차를 구해서 음원(대화자)의 위치를 추적하는 삼각위치 추적방법을 이용하여 카메라를 음성이 들리는 방향으로 자동으로 움직여 주게 된다.In order to improve this problem, a triangular position tracking method is provided in which microphones are collected at three points in a video conference space, and the positions of sound sources (talkers) are obtained by obtaining the time difference between the detected moments of each microphone. Use to move the camera automatically in the direction of sound.

그러나 삼각위치 추적방법은 음성이 좁은 공간에서 초당 약 340m로 전송되므로 해상도가 많이 떨어져 음원의 위치파악에 실패하는 경우가 많은 문제점이 있다.However, in the triangular position tracking method, since voice is transmitted at about 340m per second in a narrow space, there are many problems in that the resolution of the sound source fails due to a large resolution.

본 발명은 상술한 종래의 문제점을 해결하기 위하여 안출된 것으로서, 특정 위치에 구비된 다수개의 초지향성 마이크를 이용하여 회의자들의 음성을 수집하고, 음원을 추적하여 음원이 발생된 방향으로 카메라를 자동 이동시키는 영상회의 시스템에서의 음원 추적에 의한 카메라 제어 방법을 제공하는데 그 목적이 있다.The present invention has been made to solve the above-mentioned conventional problems, by using a plurality of super-directional microphones provided in a specific position to collect the voices of the meeting people, to track the sound source to automatically rotate the camera in the direction in which the sound source is generated It is an object of the present invention to provide a camera control method by sound source tracking in a moving video conference system.

도 1은 일반적인 영상회의 시스템의 전체 구성도1 is an overall configuration diagram of a general video conferencing system

도 2는 영상회의 시스템의 상세 구성도2 is a detailed configuration diagram of a video conference system

도 3은 도 2의 단말의 구성도3 is a configuration diagram of a terminal of FIG.

도 4는 본 발명에서 채택된 영상회의 카메라 및 카메라 제어부의 구성도4 is a configuration diagram of a video conferencing camera and a camera controller adopted in the present invention.

도 5는 도 4의 음성 수집부를 구성하는 구성 요소의 배치 예시도FIG. 5 is a diagram illustrating arrangement of components constituting the voice collector of FIG. 4. FIG.

도 6은 본 발명의 실시예에 따른 카메라 제어 과정을 보인 흐름도6 is a flowchart illustrating a camera control process according to an embodiment of the present invention.

* 도면의 주요부분에 대한 부호의 설명 *Explanation of symbols on the main parts of the drawings

100 : 카메라 200 : 카메라 제어부100: camera 200: camera control unit

210 ; 마이크로프로세서 211 : 롬210; Microprocessor 211: ROM

220 : 음성 수집부 230 : 수신감도 측정부220: voice collector 230: reception sensitivity measurement unit

240 : 모터 구동부 250 : 모터240: motor drive unit 250: motor

상술한 목적을 달성하기 위하여 본 발명에 따른 음원 추적에 의한 카메라 제어 방법은 다수개의 초지향성 마이크를 이용하여 회의자의 음성을 수집하는 과정과, 수집된 음성 중 수신감도가 좋은 3개를 선택하는 과정과, 선택된 3개의 초지향성 마이크에서 수신된 신호의 크기를 이용하여 음원을 추적하는 과정과, 추적된 음원의 방향으로 카메라를 이동시키는 과정으로 이루어짐을 특징으로 한다.In order to achieve the above object, a camera control method using sound source tracking according to the present invention is a process of collecting a voice of a conference person using a plurality of super-directional microphones, and selecting three of the collected voices with good reception sensitivity. And tracking the sound source using the magnitudes of the signals received from the selected three superdirectional microphones, and moving the camera in the direction of the tracked sound source.

이하 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 대하여 상세하게 설명한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 4는 본 발명의 실시예에 따라 추적기능을 갖는 비디오 카메라 부분을 도시한 블럭도이다.4 is a block diagram illustrating a video camera portion having a tracking function according to an embodiment of the present invention.

도 4에 있어서, 대화자를 추적하기 위하여 본 발명에 따라 화상회의에 사용되는 카메라(100)는 마이크로프로세서(210), 음성 수집부(220), 수신감도 측정부(230), 모터 구동부(240), 모터(250)로 구성된 카메라 제어부(200)에 의해 움직임이 제어된다.In FIG. 4, the camera 100 used for video conferencing according to the present invention to track a talker includes a microprocessor 210, a voice collector 220, a reception sensitivity measurer 230, and a motor driver 240. The movement is controlled by the camera controller 200 formed of the motor 250.

음성 수집부(220)는 다수개의 초지향성 마이크로 구성되며, 초지향성 마이크는 회의 공간의 특정한 방향에 위치한다. 예를 들어 회의 공간의 좌, 우, 상, 하, 정면의 5곳에 설치될 수 있다. 초지향성 마이크는 일반 마이크와 달리 바로 앞에서 감지된 음성의 수신감도가 가장 큰 특성을 갖는다.The voice collector 220 is composed of a plurality of super-directional microphones, the super-directional microphone is located in a specific direction of the meeting space. For example, it can be installed in five places of the left, right, top, bottom, front of the meeting space. Unlike a general microphone, a super directional microphone has the greatest reception sensitivity of a voice sensed directly in front of it.

따라서 도 5에 나타낸 바와 같이 초지향성 마이크가 설치된 곳에서 음원의 위치가 도면과 같은 경우에는 위(2)와 좌측(3)에 위치한 마이크에서는 음성이 거의 검출되지 않고, 정면(1), 우측(4), 아래(5)에 위치한 마이크에서 음성이 검출된다.Therefore, as shown in FIG. 5, when the position of the sound source is as shown in the drawing, the microphone located at the upper (2) and the left (3) has almost no voice detected, and the front (1) and the right ( 4) Voice is detected from the microphone located below (5).

음성 수집부(220)는 수집된 음성을 수신감도 측정부(230)에 출력하고, 수신감도 측정부(230)의 다수개의 마이크에서 수신되는 음성의 감도를 측정하여 마이크로프로세서(210)에 출력한다.The voice collector 220 outputs the collected voice to the reception sensitivity measurement unit 230, measures the sensitivity of the voice received from the plurality of microphones of the reception sensitivity measurement unit 230, and outputs the sensitivity to the microprocessor 210. .

마이크로프로세서는 수신감도 측정부(230)에서 입력된 음성 감도(수신된 음성신호의 크기)를 근거로 내부 롬(211)에 저장된 소프트웨어에 따라 작동되어 카메라(100)의 이동방향을 결정하고, 카메라(100)의 이동에 필요한 제어신호를 모터 구동부(240)에 출력한다.The microprocessor operates according to the software stored in the internal ROM 211 based on the voice sensitivity (the size of the received voice signal) input from the reception sensitivity measuring unit 230 to determine the moving direction of the camera 100. The control signal necessary for the movement of the 100 is output to the motor driver 240.

모터 구동부(240)는 마이크로프로세서(210)의 제어신호에 대응하여 모터(250)를 구동시킨다. 모터(250)는 모터 구동부(240)에 의해 구동되어 카메라(100)를 직접적으로 이동시킨다.The motor driver 240 drives the motor 250 in response to a control signal of the microprocessor 210. The motor 250 is driven by the motor driver 240 to directly move the camera 100.

다음에, 상술한 구성부를 카메라 제어부에서 본 발명의 바람직한 실시예에 따른 음원 추적에 의한 카메라 제어 과정을 첨부한 도 6의 흐름도를 참조하여 상세히 설명한다.Next, the above-described configuration unit will be described in detail with reference to a flowchart of FIG. 6 attached to a camera control process by sound source tracking according to a preferred embodiment of the present invention.

처음에 영상회의가 시작되면 카메라는 회의자의 정면에 위치한다.The first time the videoconference starts, the camera is in front of the conference.

그러다 영상회의가 진행되면서 대화자가 변경되면, 음성 수집부(220)에 구비된 다수개(예: 5개)의 초지향성 마이크를 이용하여 음성을 수집한다(S100).Then, when the conversation is changed while the video conference is in progress, the voice is collected using a plurality of superdirectional microphones (for example, five) provided in the voice collector 220 (S100).

음성 수집부(220)에서 수집된 음성신호는 수신감도 측정부(230)에 보내지고, 수신감도 측정부(230)는 수신감도를 측정하여 마이크로 프로세서(210)에 출력한다. 그러면 마이크로프로세서(210)는 이를 근거로 롬(211)에 저장된 소프트웨어에 따라 다수개의 초지향성 마이크에서 수집된 음성 중에서 수신감도가 좋은 3개의 음성을 선택한다(S110).The voice signal collected by the voice collector 220 is sent to the reception sensitivity measurement unit 230, and the reception sensitivity measurement unit 230 measures the reception sensitivity and outputs the received sensitivity to the microprocessor 210. Then, the microprocessor 210 selects three voices having good reception sensitivity among the voices collected from the plurality of super-directional microphones according to the software stored in the ROM 211 based on this (S110).

이어서 선택된 3개의 음성신호의 크기를 이용하여 음원의 위치를 추적하여(S120), 음원의 위치가 결정되면 그 방향으로 카메라(100)를 이동시키기 위하여 모터 구동부(240)에 제어신호를 출력한다.Subsequently, the position of the sound source is tracked using the magnitudes of the three selected voice signals (S120). When the position of the sound source is determined, a control signal is output to the motor driver 240 to move the camera 100 in the direction.

모터 구동부(240)는 마이크로프로세서(210)의 제어신호에 의거하여 모터(250)를 구동함으로써 카메라(100)는 수조작없이 자동으로 대화자를 촬영할 수 있는 방향으로 움직이게 되는 것이다. 상기 단계 S100 내지 S130은 영상회의가 종료될 때까지 반복 수행되어 카메라(100)를 대화자가 변경될 때마다 새로운 대화자를 향하도록 제어하게 된다.The motor driver 240 drives the motor 250 based on the control signal of the microprocessor 210 so that the camera 100 automatically moves in the direction in which the dialog can be photographed without manual manipulation. Steps S100 to S130 are repeatedly performed until the video conference is completed to control the camera 100 to face the new talker whenever the talker changes.

이상에서 설명한 바와 같이 본 발명은 특정 위치에 구비된 다수개의 초지향성 마이크를 이용하여 회의자들의 음성을 수집하고, 수집된 음성 중 수신감도가 좋은 3지점의 음성을 선택하여 정확하게 음원(대화자)을 추적하고 카메라를 자동 이동시킴으로써 회의 진행 중에 발생되는 카메라 조작을 줄여 주어 회의자가 더욱 회의에 집중할 수 있도록 하는 효과가 있다.As described above, the present invention collects the voices of the conferees using a plurality of super-directional microphones provided at a specific location, and selects three points of voices having good reception sensitivity among the collected voices to accurately select a sound source (conversator). Tracking and auto-moving the camera reduces camera manipulation during the meeting, freeing the attendee to focus on the meeting.

본 발명은 특정의 실시예와 관련하여 도시 및 설명하였지만, 특허청구범위에 의해 나타난 발명의 사상 및 영역으로부터 벗어나지 않는 한도 내에서 다양한 개조 및 변화가 가능하다는 것을 당업계에서 통상의 지식을 가진 자라면 누구나 쉽게 알 수 있을 것이다.While the invention has been shown and described with respect to particular embodiments, it will be apparent to those skilled in the art that various modifications and variations can be made without departing from the spirit and scope of the invention as set forth in the claims. Anyone can see it easily.

Claims (2)

서로 다른 위치에 설치된 다수개의 음성수집 수단을 이용하여 회의자의 음성을 수집하는 과정과, 수집된 음성 중 수신감도가 좋은 3개 지점의 음성을 선택하는 과정과, 선택된 3개의 지점에서 수신된 음성신호의 크기를 이용하여 음원을 추적하는 과정과, 추적된 음원의 방향으로 카메라를 이동시키는 과정을 포함하는 것을 특징으로 하는 영상회의 시스템에서의 음원 추적에 의한 카메라 제어 방법.Collecting voices of a conference person using a plurality of voice collecting means installed at different locations, selecting voices of three points having good reception sensitivity among the collected voices, and voice signals received at the selected three points And controlling the sound source using the size of the sound source and moving the camera in the direction of the tracked sound source. 제1항에 있어서,The method of claim 1, 상기 음성을 수집하는 과정은 회의자의 좌, 우, 상, 하, 정면에 설치된 초지향성 마이크를 이용하여 수행하는 것을 특징으로 하는 영상회의 시스템에서의 음원 추적에 의한 카메라 제어 방법.The process of collecting the voice is a camera control method by the sound source tracking in a video conferencing system, characterized in that performed using a super-directional microphone installed on the left, right, top, bottom, front of the conference.
KR1019980052285A 1998-12-01 1998-12-01 Method for controlling camera using sound source tracking in video conference system KR20000037652A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019980052285A KR20000037652A (en) 1998-12-01 1998-12-01 Method for controlling camera using sound source tracking in video conference system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019980052285A KR20000037652A (en) 1998-12-01 1998-12-01 Method for controlling camera using sound source tracking in video conference system

Publications (1)

Publication Number Publication Date
KR20000037652A true KR20000037652A (en) 2000-07-05

Family

ID=19560790

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019980052285A KR20000037652A (en) 1998-12-01 1998-12-01 Method for controlling camera using sound source tracking in video conference system

Country Status (1)

Country Link
KR (1) KR20000037652A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100414858B1 (en) * 2000-07-31 2004-01-13 주식회사 나다텔 System for position tracking of speaker by using microphone array
KR100470437B1 (en) * 2003-02-18 2005-02-07 (주)조원정보 A method for detecting a sound source and for controlling a position in monitoring system
KR100754384B1 (en) * 2003-10-13 2007-08-31 삼성전자주식회사 Method and apparatus for robust speaker localization and camera control system employing the same
WO2019221369A1 (en) * 2018-05-14 2019-11-21 (주) 유프리즘 Video conference server capable of providing video conference by using plurality of terminals for video conference, and method for removing audio echo therefor
WO2019225836A1 (en) * 2018-05-23 2019-11-28 (주) 유프리즘 Video conference server capable of providing video conference by using plurality of video conference terminals, and camera tracking method therefor

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100414858B1 (en) * 2000-07-31 2004-01-13 주식회사 나다텔 System for position tracking of speaker by using microphone array
KR100470437B1 (en) * 2003-02-18 2005-02-07 (주)조원정보 A method for detecting a sound source and for controlling a position in monitoring system
KR100754384B1 (en) * 2003-10-13 2007-08-31 삼성전자주식회사 Method and apparatus for robust speaker localization and camera control system employing the same
WO2019221369A1 (en) * 2018-05-14 2019-11-21 (주) 유프리즘 Video conference server capable of providing video conference by using plurality of terminals for video conference, and method for removing audio echo therefor
WO2019225836A1 (en) * 2018-05-23 2019-11-28 (주) 유프리즘 Video conference server capable of providing video conference by using plurality of video conference terminals, and camera tracking method therefor

Similar Documents

Publication Publication Date Title
US6208373B1 (en) Method and apparatus for enabling a videoconferencing participant to appear focused on camera to corresponding users
US6950119B2 (en) Videoconference system, terminal equipment included therein and data delivery method
TWI390982B (en) Television conference system
US20110216153A1 (en) Digital conferencing for mobile devices
JPH07154763A (en) Desk-side video conference system
EP2338277A1 (en) A control system for a local telepresence videoconferencing system and a method for establishing a video conference call
US6219086B1 (en) Terminal apparatus
CN114827517A (en) Projection video conference system and video projection method
JP2004129071A (en) Two-way communication system
CN113905204B (en) Image display method, device, equipment and storage medium
KR101918676B1 (en) Videoconferencing Server for Providing Multi-Screen Videoconferencing by Using Plural Videoconferencing Terminals and Camera Tracking Method therefor
JPH04339484A (en) Remote conference device
JP2009017330A (en) Video conference system, video conference method, and video conference program
KR20000037652A (en) Method for controlling camera using sound source tracking in video conference system
JP2004007561A (en) Video conference system, terminal equipment included in the same system, and data distributing method
KR20000037653A (en) Method for controlling camera zooming in video conference system
KR100264035B1 (en) Method and device of perceiving a voice in a monitor
JPH02202275A (en) Video conference system
KR0143939B1 (en) Video conferencing system and method thereof
JPH077726A (en) Video transmission reception changeover device incorporating screen divider and private talking system
JP2006033657A (en) Chairman leadership type video conferencing system and method
JP3787568B2 (en) Display control apparatus and display control method
JPH02265346A (en) Multi-point remote conference system
JP2022180035A (en) Conference system, server, information processing apparatus, and program
KR20000037677A (en) Answering method during absence for video conference system

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application