KR20110025117A - 영상 통화 장치, 시스템 및 방법 - Google Patents

영상 통화 장치, 시스템 및 방법 Download PDF

Info

Publication number
KR20110025117A
KR20110025117A KR1020100084727A KR20100084727A KR20110025117A KR 20110025117 A KR20110025117 A KR 20110025117A KR 1020100084727 A KR1020100084727 A KR 1020100084727A KR 20100084727 A KR20100084727 A KR 20100084727A KR 20110025117 A KR20110025117 A KR 20110025117A
Authority
KR
South Korea
Prior art keywords
caller
display
image
microphone
camera
Prior art date
Application number
KR1020100084727A
Other languages
English (en)
Other versions
KR101446645B1 (ko
Inventor
류희섭
서영광
박승권
김창용
장종혁
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Publication of KR20110025117A publication Critical patent/KR20110025117A/ko
Application granted granted Critical
Publication of KR101446645B1 publication Critical patent/KR101446645B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/142Constructional details of the terminal equipment, e.g. arrangements of the camera and the display
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/147Communication arrangements, e.g. identifying the communication as a video-communication, intermediate storage of the signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/403Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers loud-speakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Telephone Function (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)

Abstract

본 발명은 제1 통화자 및 제2 통화자 사이의 영상 통화가 가능한 장치, 시스템 및 방법에 관한 것으로서, 본 발명의 장치는 제1 통화자의 영상을 캡쳐하는 영상 센서; 제2 통화자의 영상을 표시하는 디스플레이; 제1 통화자의 음성을 캡쳐하는 마이크로폰; 제2 통화자의 음성을 재생하는 스피커; 제1 통화자의 위치를 감지하는 감지부; 및 제1통화자의 원위치를 감지하도록 상기 감지부를 제어하고, 상기 제1통화자의 위치가 원위치에서 새로운 위치로 변경되었는지를 감지하도록 상기 감지부를 제어하고, 상기 감지된 제1통화자의 새로운 위치에 기초하여 조정되도록 상기 마이크로폰을 제어하는 제어부를 포함한다. 이에 따라 사용자는 고정된 위치에서만 영상통화가 가능한 것이 아니라, 사용자의 위치가 이동하는 경우에도 영상통화가 가능하게 된다.

Description

영상 통화 장치, 시스템 및 방법{APPARATUS, SYSTEM AND METHOD FOR VIDEO CALL}
본 발명의 장치, 시스템 및 방법은 영상 통화에 대한 것이고, 더욱 상세하게는 사용자의 위치에 기초한 영상 통화에 대한 것이다.
영상 회의는 사용자들 사이에서 인기있는 통신 방법이 되었다. 여기에서 사용된 것처럼, 영상 회의(video conference, video conferencing)란 용어는 영상 통화(video call, video calling)와 동의어이다. 영상 회의는 음성 및 영상 컴포넌트 양자를 포함한다. 이는, 당사자들 사이의 영상 통화는 사용자들 사이에 음성 및 영상 통신을 제공한다는 것이다. 하드웨어의 측면에서, 사용자는 한 명 이상의 당사자와 영상 통화를 동시에 수행하기 위하여, 단순히 디스플레이장치, 스피커(들), 영상 센서 및 마이크로폰(들)을 요구한다. 상기 디스플레이장치 그 자체는 어떤 디스플레이 타입도 가능하며, 텔레비전 TV, 컴퓨터 모니터 등을 포함하지만 이에 한정되지 않는다. 또한, 상기 영상 센서는 하나 이상의 영상 센싱 장치를 더 포함할 수 있다.
상기 영상 통화를 용이하게 하기 위하여, 상기 디스플레이장치가 한 명 이상의 통화 상대자들을 보여주는데 사용된다. 예를 들어, 두 명 사이에서의 영상 회의에 있어서, 각 당사자의 영상은 영상 센서들에 의해 각각 캡쳐되고, 각 당사자의 측면에 위치한 디스플레이장치가 다른 당사자의 영상을 보여주거나, 또는 통화 송신자 및 수신자 양자의 영상을 보여준다. 유사하게, 통화의 각 당사자는 그들 각각의 마이크로폰에 대고 말을 하고, 각 스피커들은 상기 대화를 재생하여 각 당사자가 상대방의 음성을 들을 수 있도록 한다.
그러나, 그런 영상 통화의 어느 당사자가 원위치에서 다른 위치로 이동하는 경우에는 문제가 발생한다. 예를 들어, 통화의 당사자가 영상 센서, 마이크로폰 및 스피커가 위치된 곳으로부터 멀리 이동하는 경우이다. 그런 경우, 영상 및 음성의 캡쳐 및 재생이 문제가 된다. 결과적으로, 영상 통화를 용이하도록 하는 개선된 방법이 요구되는 것이다.
본 발명의 예시적인 실시예들은 상기 문제점 및 상기에서 기재하지 않았던 문제점들을 극복한다. 또한, 본 발명은 상기 기재한 문제점을 극복하는 것이 요구되지 않고, 본 발명의 예시적 실시예들은 상기 기재한 어떤 문제점도 극복하지 않을 수 있다.
여기에서 사용된 것처럼, "영상"란 용어는 스틸 이미지(still image) 또는 영상 스트림을 포함할 수 있다. 상기 영상은 또한 방송 영상 또는 저장 장치로부터 검색된 영상일 수 있다. "디스플레이(즉, 명사)"또는 "디스플레이장치"란 용어는 텔레비전 TV, 컴퓨터 모니터 등을 포함한다. 부가적으로, "당사자", "사용자", "사람" 및 "통화자"란 용어는 여기에서 상호 교환하여 사용된다; 유사하게, "위치" 및 "지점"이란 용어 또한 여기에서 서로 교환하여 사용된다. 어느 예에서, 상기 지적한 상호 교환할 수 있는 용어들은 명확화의 측면에서 구별되게 사용될 수도 있다.
본 발명의 예시적인 실시예는 제1 통화자 및 제2 통화자 사이의 영상 통화를 가능하게 하는 영상 통화 장치를 제공하고, 상기 장치는 제1 통화자의 영상을 캡쳐하는 영상 센서; 제2 통화자의 영상을 표시하는 디스플레이; 제1 통화자의 음성을 캡쳐하는 마이크로폰; 제2 통화자의 음성을 재생하는 스피커; 제1 통화자의 위치를 감지하는 감지부; 및 제1통화자의 원위치를 감지하도록 상기 감지부를 제어하고, 상기 제1통화자의 위치가 원위치에서 새로운 위치로 변경되었는지를 감지하도록 상기 감지부를 제어하고, 상기 감지된 제1통화자의 새로운 위치에 기초하여 조정되도록 상기 마이크로폰을 제어하는 제어부를 포함한다. 본 발명의 예시적인 실시예에 따라, 제1통화자의 새로운 위치가 감지되면, 상기 제어부는 상기 감지된 제1 통화자의 새로운 위치에 기초하여 재조정되도록 상기 영상 센서를 더 제어할 수 있다.
본 발명의 예시적인 실시예에 따라, 제1통화자의 새로운 위치가 감지되면, 상기 제어부는 상기 감지된 제1 통화자의 새로운 위치에 기초하여 재조정되도록 상기 스피커를 더 제어할 수 있다.
본 발명의 예시적인 실시예에 따라, 상기 제어부는 윈도우에 제2 통화자의 영상을 표시하도록 상기 디스플레이를 제어할 수 있고, 제1 통화자의 새로운 위치가 감지되면, 상기 제어부는 상기 감지된 제1통화자의 새로운 위치에 기초하여 상기 윈도우를 상기 디스플레이 상의 다른 지점으로 이동시키도록 상기 디스플레이를 제어할 수 있다.
본 발명의 예시적인 실시예에 따라, 상기 디스플레이는 제1 통화자의 영상을 더 표시할 수 있다.
본 발명의 예시적인 실시예에 따라, 상기 제어부는 상기 디스플레이 상의 제1 지점의 제1 윈도우에 제1 통화자의 영상을 표시하고, 상기 디스플레이 상의 제2 지점의 제2 윈도우에 제2 통화자의 영상을 표시하도록 상기 디스플레이를 제어할 수 있고, 상기 제어부는 상기 감지된 제1통화자의 새로운 위치에 기초하여 상기 제1윈도우와 상기 제2윈도우 중 적어도 하나를 상기 디스플레이 상의 다른 지점으로 각각 이동하도록 상기 디스플레이를 제어할 수 있다. 즉, 제1통화자의 새로운 위치가 감지되면, 상기 제어부는 상기 제1 윈도를 상기 제1 지점에서 상기 감지된 제1 통화자의 새로운 위치에 대응한 새로운 제1 지점으로, 상기 제2 윈도우를 제2 지점에서 상기 감지된 제1 통화자의 새로운 위치에 대응한 새로운 제2 지점으로 이동시키도록 상기 디스플레이를 제어할 수 있다.
본 발명의 예시적인 실시예에 따라, 상기 감지부는 제1 통화자의 위치를 감지하기 위하여 상기 영상 센서 및 상기 마이크로폰 중 적어도 하나를 이용하여 제1 통화자의 위치를 결정할 수 있다.
본 발명의 예시적인 실시예에 따라, 상기 제어부는 영상 센서의 좌우 각(pan angle), 틸트 각(tilt angle) 및 줌 수치(zoom value) 중 적어도 하나를 변경시켜 상기 감지된 제1통화자의 새로운 위치에 기초하여 재조정되도록 상기 영상 센서를 제어할 수 있다.
본 발명의 예시적인 실시예에 따라, 상기 제어부는 마이크로폰의 방향을 변경시켜 상기 감지된 제1통화자의 새로운 위치에 기초하여 재조정되도록 상기 마이크로폰을 제어할 수 있다.
본 발명의 예시적인 실시예에 따라, 상기 제어부는 스피커의 방향을 변경시켜 상기 감지된 제1통화자의 새로운 위치에 기초하여 재조정되도록 상기 스피커를 제어할 수 있다.
본 발명의 예시적인 실시예에 따라, 상기 디스플레이가 배경 윈도우(background window)에서 배경 영상을 표시하면, 상기 제어부는 전경 윈도우(foreground window)에서 제2 통화자의 영상을 표시하도록 상기 디스플레이를 제어할 수 있고, 제1 통화자의 위치가 원위치에서 새로운 위치로 변경된 것이 감지되면, 상기 제어부는 배경 윈도우에 있는 배경 영상을 방해하지 않고, 상기 윈도우를 상기 감지된 제1통화자의 새로운 위치에 대응하는 디스플레이 상의 다른 지점으로 이동시키도록 상기 디스플레이를 제어할 수 있다. 상기 기재된 "영상"이란 용어의 정의를 유지하면서, 상기 가상 영상은 복수의 영상(예를 들어 비디오), 스틸 또는 단일 이미지일 수 있다. 게다가, 가상 영상(들)은 방송 신호를 통해 수신하거나 저장 장치로부터 검색될 수 있다.
본 발명의 예시적인 실시예는 제1 위치에 있는 복수의 통화자와 제2 위치의 적어도 한 명의 통화자 사이의 영상 통화 회의를 가능하게 하는 영상 통화 시스템을 제공하고, 상기 시스템은 제1 위치의 복수의 통화자 중 제1 당사자의 영상을 캡쳐하는 영상 센서; 제2 위치의 적어도 한 명의 통화자의 영상을 표시하는 디스플레이; 제2 위치의 적어도 한 명의 통화자의 음성을 재생하는 스피커; 제1 위치에서 현재 말하고 있는 당사자의 지점을 감지하는 감지부; 및 상기 제1 위치에서 복수의 통화자 중 현재 말하고 있는 제1 당사자 지점을 감지하고, 현재 말하고 있는 당사자가 상기 제1위치의 복수의 통화자 중 제2당사자이면 상기 제2당사자 지점을 감지하도록 상기 감지부를 제어하고, 상기 감지된 제2당사자 지점에 기초하여 재조정되도록 상기 마이크로폰을 제어하는 제어부를 포함한다.
본 발명의 예시적인 실시예는 제1 통화자 및 제2 통화자 사이의 영상 통화 이용 방법을 제공하고, 상기 방법은 제1 통화자의 영상을 캡쳐하는 단계; 제2 통화자의 영상을 표시하는 단계; 제1 통화자의 음성을 캡쳐하는 단계; 제2 통화자의 음성을 재생하는 단계; 및 미리 감지된 지점을 제1 통화자의 위치로 감지하는 단계; 및 상기 제1 통화자의 위치가 새로운 위치로 변경된 것으로 감지되면, 상기 감지된 제1 통화자의 새로운 위치에 기초하여 재조정되도록 상기 마이크로폰을 제어하는 단계를 포함한다.
본 발명의 예시적인 실시예에 따라, 제1 통화자가 새로운 위치로 변경된 것으로 감지되면, 상기 방법은 상기 감지된 제1통화자의 새로운 위치에 기초하여 재조정되도록 상기 영상 센서를 제어하는 단계를 더 포함한다.
본 발명의 예시적인 실시예에 따라, 제1 통화자가 새로운 위치로 변경된 것으로 감지되면, 상기 방법은 상기 감지된 제1통화자의 새로운 위치에 기초하여 재조정되도록 상기 스피커를 제어하는 단계를 더 포함한다.
본 발명의 예시적인 실시예에 따라, 상기 방법은 윈도우에 제2 통화자의 영상을 표시하는 단계를 더 포함하고, 제1 통화자가 원위치에서 새로운 위치로 변경된 것이 감지되면, 상기 감지된 제1통화자의 새로운 위치에 대응하도록 상기 윈도우를 상기 디스플레이 상의 다른 지점으로 이동시키는 단계를 더 포함한다.
본 발명의 예시적인 실시예에 따라, 상기 방법은 제1 통화자의 영상을 표시하는 단계를 더 포함한다.
본 발명의 예시적인 실시예에 따라, 상기 방법은 상기 디스플레이 상의 제1 지점의 제1 윈도우에 제1 통화자의 영상 및 상기 디스플레이 상의 제2 지점의 제2 윈도우에 제2 통화자의 영상을 표시하는 단계를 더 포함하고, 제1 통화자가 원위치에서 새로운 위치로 변경된 것이 감지되면, 상기 방법은 상기 감지된 제1통화자의 새로운 위치에 기초하여 상기 제1윈도우 및 제2윈도우 중 적어도 하나를 상기 디스플레이 상의 다른 지점으로 각각 이동시키는 단계를 더 포함한다. 즉, 제1통화자가 원위치에서 새로운 위치로 변경된 것이 감지되면, 상기 제1 윈도우를 제1 지점에서 상기 감지된 제1 통화자의 새로운 위치에 대응하는 새로운 제1 지점으로 이동하고, 상기 제2 윈도우를 제2 지점에서 상기 감지된 제1 통화자의 새로운 위치에 대응하는 새로운 제2 지점으로 이동하는 단계를 더 포함한다.
본 발명의 예시적인 실시예에 따라, 제1 통화자의 위치 감지는 영상 센서 및 마이크로폰 중 적어도 하나를 이용하여 수행될 수 있다.
본 발명의 예시적인 실시예에 따라, 상기 영상 센서의 제어는 상기 감지된 제1 통화자의 새로운 위치에 대응하도록 상기 영상 센서의 좌우 각, 틸트 각 및 줌 수치 중 적어도 하나를 변경시켜 수행될 수 있다.
본 발명의 예시적인 실시예에 따라, 상기 마이크로폰의 제어는 상기 감지된 제1통화자의 새로운 위치에 대응하도록 상기 마이크로폰의 방향을 변경시켜 수행될 수 있다.
본 발명의 예시적인 실시예에 따라, 상기 스피커의 제어는 상기 감지된 제1통화자의 새로운 위치에 대응하도록 상기 스피커의 방향을 변경시켜 수행될 수 있다.
본 발명의 예시적인 실시예에 따라, 상기 방법은 배경 영상을 표시하는 단계; 전경 윈도우에서 제2 통화자의 영상을 표시하는 단계 및 상기 제1 통화자의 위치가 원위치에서 새로운 위치로 변경된 것이 감지되면, 상기 윈도우를 배경 영상을 방해하지 않고, 상기 감지된 제1통화자의 새로운 위치에 대응하도록 상기 디스플레이 상의 다른 지점으로 이동시키는 단계를 더 포함할 수 있다.
본 발명의 예시적인 실시예에 따라, 제1통화자 및 제2통화자 사이의 영상 통화가 가능한 영상 통화 장치는 상기 제1통화자의 영상을 캡쳐하는 영상 센서; 상기 제2통화자의 영상을 표시하는 디스플레이; 상기 제1통화자의 위치를 감지하는 감지부; 및 윈도우에 상기 제2통화자의 영상을 표시하도록 상기 디스플레이를 제어하고, 상기 제1통화자의 원위치를 감지하도록 상기 감지부를 제어하고, 상기 제1통화자의 위치가 원위치에서 새로운 위치로 변경되었는지를 감지하도록 상기 감지부를 제어하고, 상기 윈도우를 상기 감지된 제1통화자의 새로운 위치에 대응하는 상기 디스플레이 상의 다른 지점으로 이동시키도록 상기 디스플레이를 제어하는 제어부를 포함할 수 있다.
본 발명의 예시적인 실시예에 따라, 상기 장치의 디스플레이는 제1통화자의 영상을 더 표시할 수 있다.
본 발명의 예시적인 실시예에 따라, 상기 제어부는 상기 디스플레이 상의 제1지점의 제1윈도우에 상기 제1통화자의 영상을 표시하고, 상기 디스플레이 상의 제2지점의 제2윈도우에 상기 제2통화자의 영상을 표시하도록 상기 디스플레이를 제어하고, 제1통화자의 위치가 새로운 위치로 변경된 것이 감지되면, 상기 제어부는 상기 감지된 제1통화자의 새로운 위치에 기초하여 상기 제1윈도우 및 제2윈도우 중 적어도 하나를 상기 디스플레이 상의 다른 지점으로 각각 이동시키도록 상기 디스플레이를 제어할 수 있다.
또한, 본 발명의 실시예에 따른 디스플레이장치는, 영상신호를 수신하는 영상수신부와; 상기 영상수신부에 수신되는 영상신호를 표시 가능하게 처리하는 신호처리부와; 상기 신호처리부에서 처리되는 영상신호에 기초하는 영상을 표시하는 디스플레이부와; 제1카메라 및 상기 제1카메라로부터 소정 거리 이격된 제2카메라를 포함하고, 기 설정된 대상의 화상을 촬상하는 카메라유닛과; 적어도 하나의 마이크를 포함하고, 상기 대상으로부터의 음성 데이터를 수집하는 마이크유닛과; 상기 카메라유닛 및 상기 마이크유닛에 의해 각각 수집되는 상기 대상의 화상 및 음성 데이터를 수신하며, 상기 제1카메라 및 상기 제2카메라 각각에 의한 상기 대상의 위치 정보에 기초하여 상기 마이크유닛에 대한 상기 대상의 위치 정보를 산출하고, 상기 산출 결과에 대응하여 상기 수신되는 상기 음성 데이터를 보정하는 제어부를 포함하는 것을 특징으로 한다.
여기서, 상기 마이크유닛에 대한 상기 대상의 위치 정보는, 상기 마이크유닛과 상기 대상 사이의 거리 및 상기 마이크유닛에 대한 상기 대상의 상대적 각도를 포함할 수 있다.
여기서, 상기 마이크유닛은 상호 이격되게 병렬적으로 배치된 복수의 마이크를 포함하며, 상기 제어부는 각각의 상기 마이크에 대한 상기 대상의 위치 정보를 산출하여, 상기 각각의 마이크로부터 수집되는 상기 음성 데이터를 개별적으로 보정할 수 있다.
여기서, 상기 마이크는 무지향성 마이크를 포함할 수 있다.
또는, 상기 마이크는 지향성의 단방향(unidirectional) 마이크를 포함할 수 있다.
또한, 상기 제1카메라 및 상기 제2카메라는 각각 스테레오스코픽(stereoscopic) 카메라를 포함할 수 있다.
여기서, 상기 제어부는, 상기 제1카메라 및 상기 제2카메라 각각으로부터 전달되는 영상 데이터로부터 상기 제1카메라 및 상기 제2카메라 각각에 대한 사용자의 상대적 각도를 산출하고, 상기 산출된 각각의 각도에 기초하여 상기 마이크유닛에 대한 상기 대상의 위치 정보를 산출할 수 있다.
또한, 외부와 네트워크로 통신 가능하게 접속된 통신부를 더 포함하며, 상기 신호처리부는, 상기 대상에 대한 상기 화상 데이터 및 상기 보정된 음성 데이터를 상기 통신부로 전송하며, 상기 통신부를 통해 수신되는 화상 데이터 및 음성 데이터를 상기 디스플레이부 및 상기 스피커를 통해 출력할 수 있다.
또한, 본 발명의 실시예에 따른 디스플레이장치의 제어방법은, 제1카메라 및 상기 제1카메라로부터 소정 거리 이격된 제2카메라를 포함하는 카메라유닛에 의해 기 설정된 대상의 화상을 촬상하는 단계와; 적어도 하나의 마이크를 포함하는 마이크유닛을 통해 상기 대상으로부터의 음성 데이터를 수집하는 단계와; 상기 제1카메라 및 상기 제2카메라 각각에 의한 상기 대상의 위치 정보에 기초하여 상기 마이크유닛에 대한 상기 대상의 위치 정보를 산출하고, 상기 산출 결과에 대응하여 상기 마이크유닛을 통해 수집되는 상기 음성 데이터를 보정하는 단계와; 상기 촬상되는 화상 데이터 및 상기 보정된 음성 데이터를 네트워크로 전송하는 단계를 포함하는 것을 특징으로 한다.
여기서, 상기 마이크유닛에 대한 상기 대상의 위치 정보는, 상기 마이크유닛과 상기 대상 사이의 거리 및 상기 마이크유닛에 대한 상기 대상의 상대적 각도를 포함할 수 있다.
여기서, 상기 마이크유닛은 상호 이격되게 병렬적으로 배치된 복수의 마이크를 포함하며, 상기 음성 데이터를 보정하는 단계는, 각각의 상기 마이크에 대한 상기 대상의 위치 정보를 산출하는 단계와; 상기 각각의 마이크로부터 수집되는 상기 음성 데이터를 개별적으로 보정하는 단계를 포함할 수 있다.
여기서, 상기 마이크는 무지향성 마이크를 포함할 수 있다.
또는, 상기 마이크는 지향성의 단방향 마이크를 포함할 수 있다.
또한, 상기 제1카메라 및 상기 제2카메라는 각각 스테레오스코픽 카메라를 포함할 수 있다.
여기서, 상기 음성 데이터를 보정하는 단계는, 상기 제1카메라 및 상기 제2카메라 각각으로부터 전달되는 영상 데이터로부터 상기 제1카메라 및 상기 제2카메라 각각에 대한 상기 대상의 상대적 각도를 산출하는 단계와; 각각의 상기 산출된 각도에 기초하여 상기 마이크유닛에 대한 상기 대상의 상대적 위치 정보를 산출하는 단계를 포함할 수 있다.
본 발명의 상기 및/또는 다른 측면이 도면들과 함께 예시적인 실시예들의 설명으로부터 명백해 질것이다.
도 1은 본 발명의 예시적인 실시예에 따른 영상 통화 장치의 예시도,
도 2는 본 발명의 예시적인 실시예에 따른 영상 통화 장치의 다른 예시도,
도 3은 본 발명의 예시적인 실시예에 따른 영상 통화 장치의 작동의 예시도,
도 4a는 본 발명의 예시적인 실시예에 따른 영상 통화 장치의 작동의 예시도,
도 4b는 본 발명의 예시적인 실시예에 따른 영상 통화 장치의 작동의 예시도,
도 5a는 본 발명의 예시적인 실시예에 따른 영상 통화 장치의 작동의 예시도,
도 5b는 본 발명의 예시적인 실시예에 따른 영상 통화 장치의 작동의 예시도,
도 6은 본 발명의 예시적인 실시예에 따른 영상 통화 장치의 작동의 예시도,
도 7는 본 발명의 예시적인 실시예에 따른 영상 통화 장치의 작동 방법의 예시도,
도 8은 본 발명의 다른 실시예에 따른 디스플레이장치의 사시도,
도 9는 도 8의 디스플레이장치의 구성 블록도,
도 10은 도 8의 디스플레이장치에서 마이크에 대한 사용자의 위치 정보를 산출하는 방법을 나타내는 개념도,
도 11은 도 8의 디스플레이장치의 제어방법을 나타내는 제어 흐름도이다.
여기에서부터, 본 발명의 예시적인 실시예들을 첨부된 도면을 참조하여 설명하고, 각 숫자들은 각 구성 요소들을 의미하고, 반복적인 설명은 배제한다.
본 발명의 예시적인 실시예에 따른 영상 통화 장치는 도 1에서 보여진다. 상기 장치(100)는 미리 감지된 지점에 대하여 사용자의 위치를 감지하는 감지부(110)를 포함한다. 상기 미리 감지된 지점은 디스플레이장치 상의 지점일 수 있고, 예를 들어, 참조 지점으로 사용될 수 있는 다른 지점일 수 있다. 상기 장치는 다른 통화자에게 전송하는 부호화된 패킷을 생성하는 전송 데이터 생성부(120), 다른 통화자로부터 수신한 패킷을 디코딩하는 출력 데이터 생성부(130), 상기 장치를 이용하는 통화자로부터 영상 및 음성 신호를 캡쳐하는 영상 및 음성 취득부(140), 다른 통화자에게 전송/다른 통화자로부터 수신한 영상 통화 데이터 전송 및 수신부(150), 영상 및 음성 신호를 출력하는 영상 및 음성 출력부(160), 및 상기 장치의 전반적인 작동을 제어하는 제어부(170)를 포함한다.
본 발명의 예시적인 실시예에 따라, 다른 통화자로 전송/다른 통화자로부터 수신한 영상통화 데이터 전송 및 수신부(150)는 영상 통화를 위한 적어도 두 명의 당사자들 사이의 어떠한 네트워크 통신도 이용할 수 있다. 상기 네트워크는 당사자들 사이의 연결이 되는 어떠한 타입도 가능하며, 예를 들어 LAN(local area network) 또는 인터넷일 수 있다. 또한, 여기에서 논의한 많은 실시예들이 두 명의 당사자들 사이의 통화를 설명하지만, 본 발명에서는 영상 통화가 가능한 곳에 위치한 당사자들의 숫자는 본 발명 하에서 두 명에 한정되지 않는다. 반대로, 당업자는 여기에 기재한 예시적인 실시예들이 복수의 통화자가 관련된 영상 통화에 동등하게 적용될 수 있음을 인식할 것이다.
상기 영상 및 음성 취득부는 예를 들어 상기 장치를 이용하는 통화자로부터 영상 및 음성 신호를 각각 캡쳐하는 카메라 및 마이크로폰을 포함할 수 있다. 예를 들어, 도 2는 영상 및 비디오 취득부(210), 디스플레이(220) 및 스피커들(230)를 포함하는 영상 통화 장치(200)의 예를 보여준다. 상기 영상 및 음성 취득부(210)는 영상 센서(211) 및 마이크로폰(212)을 포함할 수 있다.
상기 영상 센서(211)는 통화자의 영상을 수신할 수 있는 어떤 장치라도 가능하다. 예를 들어, 영상 센서(211)는 CCD(charge-coupled device) 카메라, CMOS(complementary metal-oxide-semiconductor) APS(active-pixel sensor) 카메라 등과 같은 전통적인 카메라일 수 있다. 또한, 영상 센서는 열감지 카메라(예를 들어, FLIR(Forward Looking InfraRed)) 등과 같은 비-전통적 타입의 카메라일 수 있다. 그러나, 본 발명은 상기 영상 센서 타입에 한정되지 않고, 상기에서 언급하였다시피, 통화자의 영상을 수신할 수 있는 어떤 장치라도 가능하다. 또한, 영상 센서(211)는 적어도 하나의 영상 센싱 장치를 포함할 수 있다. 예를 들어, 영상 센서(211)는 스테레오 카메라 또는 두 개 이상의 분리된 카메라일 수 있다.
마이크로폰(212)은 통화자의 음성 입력 신호를 수신할 수 있는 어떤 형태의 마이크로폰도 가능하다. 예를 들어, 방향성 마이크로폰 어레이(directional microphone array)가 음성 입력 신호에 기초하여 통화자의 위치를 정확하게 감지하는데 사용될 수 있다. 그러나, 본 발명은 단지 상기 타입의 마이크로폰에만 제한되는 것은 아니고, 상기에서 언급하였다시피, 통화자의 음성 입력 신호를 수신할 수 있는 어떤 장치라도 가능하다.
본 발명의 몇몇 예시적인 실시예들은 영상 및 음성 신호 모두를 이용하여 통화자의 위치를 감지하기 위해 영상 센서 및 마이크로폰 모두를 이용할 수 있으며, 본 발명의 다른 예시적인 실시예들은 영상 또는 음성 신호 중 어느 하나를 사용하여 통화자의 위치를 감지할 수 있다. 이는, 여기에서 기재한 것처럼 위치 감지 동작은 영상 센서 또는 마이크로폰, 또는 양자에 의해 수행될 수 있다. 그러므로, 상기 기재한 영상 센서는 통화자의 위치를 감지하는데 이용될 수 있거나 그렇지 않을 수도 있다. 뿐만 아니라, 상기 기재한 마이크로폰은 음성에 기초하여 통화자의 위치를 감지하는데 이용할 수 있거나 없을 수도 있다.
도 3은 본 발명의 예시적인 실시예에 따라 영상 통화 장치의 작동을 보여준다. 사용자는 처음에 영상 통화 장치(300)의 중심에 있는 원 위치(310)에 위치해 있다. 스피커 출력 신호들뿐만 아니라 영상 센서 및 마이크로폰 운영 초점 영역(microphone reception focus areas) (모두 "320"으로 표시)이 영상 통화 장치(300)의 중심에 대한 통화자의 위치에 초점을 맞추고 있다. 만약 통화자가 그의 위치를 새로운 위치(311)로 변경하면, 상기 영상 통화 장치(300)는 스피커 출력 신호뿐만 아니라 영상 센서 및 마이크로폰 운영 초점 영역(모두 "330"으로 표시)을 재조정하여 영상 통화 장치(300)의 중심에 대하여 통화자의 새로운 위치(311)로 초점을 맞추도록 한다. 따라서, 통화자는 그의 위치를 새로운 위치로 옮길 수 있고 다른 통화자와의 최적의 영상 통화 통신을 여전히 유지할 수 있다.
상기 감지된 통화자의 새로운 위치에 기초한 영상 센서의 재조정은 상기 감지된 제1 통화자의 새로운 위치에 기초하여 영상 센서의 좌우 각, 틸트 각 및 줌 수치 중 적어도 하나를 변경시킴으로써 성취될 수 있다. 상기 감지된 제1통화자의 새로운 위치에 기초하여 마이크로폰 및 스피커(들)의 재조정은 마이크로폰 및 스피커(들)의 방향을 각각 변경시킴으로써 성취될 수 있다. 당업자는 상기 마이크로폰 및/또는 스피커(들)의 방향에 있어서의 변경은 하드웨어 및/또는 소프트웨어를 통해 성취될 수 있음을 인식할 것이다.
또한, 본 발명의 어떤 예시적인 실시예들은 영상 센서, 마이크로폰 및 스피커들을 감지된 통화자의 새로운 위치에 기초하여 집합적으로 재조정된 것으로서 기재할 수 있으며, 본 발명은 상기 영상 통화 장치의 상기 세 가지 구성 요소들 모두를 재조정할 것을 요구하는 것은 아니다. 예를 들어, 다른 예시적인 실시예는 마이크로폰만 또는 스피커들만을 재조정할 수 있다. 뿐만 아니라, 다른 예시적인 실시예는 상기 구성요소들의 어떤 조합을 재조정할 수 있는데, 예를 들어 마이크로폰 및 스피커들, 또는 마이크로폰 및 영상 센서 등과 같은 조합을 재조정할 수 있다. 당업자는 본 발명의 범위 내에서 다양한 실시예들 및 조합들이 가능함을 인식할 것이다.
본 발명의 예시적인 실시예에 따르면, 영상 통화 장치의 디스플레이는 영상 통화의 당사자 일방 또는 쌍방을 표시할 수 있다. 도 4a는 통화 수신자(401) 및 송신자(402) 모두를 표시하는 윈도우들이 디스플레이(400)상에 표시됨으로써, 본 발명의 예시적인 실시예에 따른 영상 통화 장치의 작동의 예시를 보여준다. 그러나, 당업자는 통화하는 모든 당사자들을 위한 윈도우를 모두 표시할 필요가 없음을 인식할 것이다. 예를 들어, 디스플레이는 수신 당사자 또는 송신 당사자를 단순히 표시할 수 있다.
도 4b는 통화 수신자(401) 및 송신자(402) 양자는 디스플레이(400) 상의 전경 윈도우에 표시하는 반면, 선택된 프로그램(410)의 영상은 배경 윈도우에 표시되는 것에 의해, 본 발명의 다른 예시적 실시예를 보여준다. 상기 예시적인 실시예에 있어서, 선택된 프로그램(410)(즉, 배경 프로그램)은 영상 통화의 작동, 및 통화 수신자(401)와 송신자(402) 양자를 위한 윈도우의 표시에 의해 방해됨이 없이 운영된다. 다시, 본 발명은 상기 실시예에 제한되지 않으며, 당업자는 전경 윈도우 및 배경 윈도우의 표시는 다양한 방법으로, 공간적으로, 일시적으로 구성될 수 있다.
상기에서 언급한 바와 같이, 도 4b에서 상기 선택된 프로그램(410)의 표시된 "영상"은 스틸 이미지 또는 예를 들어 방송 영상 신호에서와 같은 영상 모음을 포함할 수 있다. 물론, 당업자는 통화 수신자(401) 및 송신자(402) 양자를 표시하는 윈도우들 도 4b에서 도시된 것과는 다른 위치에서 표시될 수 있음을 인식할 것이다. 또한, 상기 도 4a에서 언급한 것처럼, 통화의 모든 당사자들 모두를 위한 윈도우들을 표시할 필요는 없다.
도 5a는 본 발명의 예시적인 실시예에 따른 영상 통화 장치의 동작의 예시를 보여준다. 통화자(505)가 예를 들어 영상 및 음성 취득부(503)에 대하여 중심부에 대응한 위치에 앉아 있다면, 통화 수신자(501) 및 송신자(502) 양자를 표시하는 윈도우들은 예를 들어 디스플레이(506)의 중심축에 관하여, 송신자(505)의 위치에 최적인 위치에서 표시될 수 있다. 상기 언급한 바와 같이, 영상 센서 및 마이크로폰 운영 초점 영역(504), 뿐만 아니라 스피커 출력 신호(507)의 방향은 통화 송신자(505)의 위치에 대해 최적으로 향하게 된다.
그러나, 도 5b에서 보여지는 것처럼, 사용자가 새로운 위치로 이동하면, 통화 수신자(501) 및 송신자(502) 양자를 표시하는 윈도우들은 디스플레이(506)의 일 면으로 이동되어 송신자(505)의 새로운 위치에 기초하여 최적 위치를 유지하게 될 것이다. 물론, 위치가 "최적"이란 결정은 사용자의 선호도, 스크린의 크기 등에 의존할 수 있다. 예를 들어, 사용자는 통화 수신자(501) 및 송신자(502) 양자를 표시하는 윈도우들이 송신자(505)의 위치에서 변화의 방향에 반대되는 방향으로 이동되는 것을 선호할 수 있다(예를 들어, 윈도우(501, 502)가 우측으로 이동한 반면, 송신자(505)는 좌측으로 이동한다.)
대안으로, 통화 수신자(501) 및 송신자(502) 양자를 표시하는 윈도우들이 서로 다른 방향으로 이동할 수도 있다. 예를 들어, 통화 송신자(505)가 좌측으로 이동하는 경우, 송신자(505)는 그 자신을 표시하는 윈도우는 우측으로 이동하는 것을 선택할 수 있고, 반면에 통화 수신자(501)를 표시하는 윈도우는 좌측으로 이동하는 것을 선택할 수 있다. 그러므로, 본 발명의 예시적인 실시예에 따라, 통화 윈도우들(501, 502)의 구성 및 표시는 사용자의 선호도에 기초하여 조정될 수 있다.
상기 예시적인 실시예들은 통화 송신자 및 수신자 사이의 영상 통화를 설명한 것이다. 그러나, 본 발명의 다른 예시적인 실시예는 회의실 세팅에 적합한 장치를 포함한다. 예를 들어, 도 6은 디스플레이(601), 분포된 다수의 마이크로폰들(602), 및 중앙에 위치한 영상 센서(603)를 갖는 회의실-타입 시스템(600)을 보여준다. 스피커들(도면 미도시)은 디스플레이(601) 또는 다른 곳에 위치할 수도 있다. 상기 세팅에서, 어떤 사람이 그의 마이크로폰으로 말하기 시작하면, 상기 시스템은 사용되고 있는 마이크로폰이 어느 것인지를 감지할 수 있고, 상기 감지에 기초하여 상기 말하고 있는 사람을 통화자의 위치로 지정할 수 있다. 그 이후, 다른 사람이 다른 마이크로폰으로 말하기 시작하면, 상기 시스템은 말하고 있는 다른 사람의 위치를 통화자의 "새로운 위치"로 결정할 수 있고, 그리고 상기 장치를 새로운 위치에 초점을 맞추도록 재조정할 수 있다. 상기에서 언급한 바와 같이, 영상 센서(603), 마이크로폰들(602) 및 스피커들 중 적어도 하나는 통화자의 결정된 위치에 기초하여 재조정될 수 있다.
도 6에서 보여진 예시에 있어서, 통화자의 위치는 변하지 않고, 오히려 통화자의 신분이 변할 수도 있다. 그러므로, 상기 시스템은 어떤 스피커가 현재 재생되고 있는지를 결정하고, 현재 말하고 있는 사람의 위치에 기초하여 이미지 센서(들), 마이크로폰(들) 및 스피커(들) 중 적어도 하나를 재조정하여야만 한다. 상기에서 언급한 바와 같이, 영상 센서(603)는 적어도 하나의 영상 센싱 장치를 포함할 수 있다. 현재 말하는 사람의 위치는 예를 들어, 마이크로폰(들)에 의해 수신한 음성 신호, 및/또는 영상 센서로부터 수신한 영상에 기초하여 결정될 수 있다.
도 7은 본 발명의 예시적인 실시예에 따라 영상 통화 장치의 작동 방법의 예시를 보여준다. 처음에, 통화자의 원위치가 감지된다(S701). 그리고, 통화자의 위치가 변화된 것으로 감지되면(S702), 통화자의 새로운 위치가 감지된다(S703). 새로운 위치가 한번 감지되면, 영상 센서, 마이크로폰(들), 및 스피커(들) 중 적어도 하나가 재조정되어 상기 감지된 통화자의 새로운 위치에 초점을 맞추도록 한다(S704).
한편, 앞선 실시예에서 설명된 바와 같이 화상 통화를 수행함에 있어서, 통화자, 즉 사용자(U)의 위치를 감지하는 것은 중요하다. 예를 들면, 마이크로폰, 즉 마이크를 통해 수집되는 사용자(U)의 음성 데이터는, 사용자(U)의 위치에 따라서 각각 상이한 후처리가 적용된다. 이러한 후처리는 어쿠스틱 시그널 프로세싱(acoustic signal processing)이라고 하며, 복수 마이크가 있는 경우에 이들 마이크 사이의 간격과 각 마이크에 수집되는 음성의 시간 지연 등을 주요 패러미터(parameter)로 하여, 각 패러미터들을 이용하여 오류가 최소화되고 노이즈가 제거된 사용자(U)의 음성 데이터를 추출한다.
이러한 어쿠스틱 시그널 프로세싱은 설계 단계에서 다양한 패러미터가 적용될 수 있는 바, 그 구체적인 방법이 본 발명의 사상을 한정하지 않는다. 다만, 앞서 설명한 바와 같이, 사용자(U)의 위치에 따라서 음성 데이터의 후처리에 적용되는 패러미터 값이 달라지므로, 본 실시예에 따르면 사용자(U)의 현 위치 정보를 도출하고 이 도출 결과에 대응하여 상기한 후처리를 수행함으로써 이에 대응할 수 있다.
여기서, 사용자(U)의 위치 정보는 디스플레이장치를 기준으로 하여 좌우 방향에 대한 위치 뿐 아니라, 디스플레이장치에 대해 접근 또는 이격되는 방향에 대한 위치 정보도 포함한다.
이상의 관점을 반영한 본 발명의 실시예에 관해 도면을 참조하여 이하 설명한다. 도 8은 본 실시예에 따른 디스플레이장치(800)를 나타낸 사시도이며, 도 9는 디스플레이장치(800)의 구성 블록도이다.
본 실시예에 따르면, 디스플레이장치(800)는 화상 통화가 가능하게 마련된 TV로 구현되나, 디스플레이장치(800)의 구현 방식은 다양하게 결정될 수 있는 바, 이러한 실시예가 본 발명의 사상을 한정하지 않는다. 또한, 본 실시예에 따른 디스플레이장치(800)에서 앞선 실시예와 공통적인 구성에 관해서는 앞선 실시예를 응용하여 적용할 수 있는 바, 자세한 설명을 생략한다.
우선, 도면에 나타난 각 방향에 대해 설명한다. X 방향은 설치면에 평행한 디스플레이장치(800)의 가로 방향, Y 방향은 기 설정된 대상(U)을 향한 디스플레이장치(800)의 전방 방향, Z 방향은 설치면에 수직인 디스플레이장치(800)의 세로 방향을 의미한다. 즉, 디스플레이부(830)에 표시되는 영상은 X-Z 평면 상에 배치되며, 디스플레이부(830)에서 볼 때 Y 방향에 대상(U)이 위치한다. 이하, 각 도면 및 실시예에서는 이러한 방향 정의를 기초로 하여 설명한다. 여기서, X, Y, Z 방향의 반대방향은 각각 -X, -Y, -Z 방향으로 나타내고, X-Z 평면은 X 방향의 축 및 Z 방향의 축에 의해 형성되는 평면을 의미한다.
도 8 및 도 9에 도시된 바와 같이, 디스플레이장치(800)는 외부로부터 영상 데이터 및 음성 데이터가 포함된 신호를 수신하는 영상수신부(810)와, 영상수신부(810)에 수신되는 신호의 영상 데이터 및 음성 데이터를 각각 기 설정된 프로세스에 따라서 처리하는 신호처리부(820)와, 신호처리부(820)에서 처리되는 영상 데이터에 기초하는 영상을 표시하는 디스플레이부(830)와, 신호처리부(820)에서 처리되는 음성 데이터에 기초하는 음성을 출력하는 스피커(840)를 포함한다.
그리고, 디스플레이장치(800)는 한정되지 않는 타 장치(미도시)와 네트워크를 통해 통신 가능하게 접속된 통신부(850)와, 디스플레이장치(800) 전방의 기 설정된 대상(U)의 화상을 촬상하는 복수의 카메라(861, 862)와, 대상(U)으로부터의 음성 데이터를 수집하는 적어도 하나 이상의 마이크(870)와, 카메라(861, 862) 및 마이크(870)로부터 각각 수집되는 화상 데이터 및 음성 데이터를 수신하고 이 수신되는 데이터가 통신부(850)로 송신 가능하게 처리되도록 신호처리부(820)를 제어하는 제어부(880)를 포함한다.
본 실시예에 따른 디스플레이장치(800)는 화상 통화가 가능한 장치로서 상기한 대상(U)은 사용자(U)로 구현되지만, 이는 하나의 실시예에 불과하며 화상 데이터 및 음성 데이터를 수집하는 대상(U)이 사람으로 한정되지 않는다.
이러한 구성의 본 실시예에 따르면, 제어부(880)는 각 카메라(861, 862)로부터 수집되는 사용자(U)의 위치 정보에 기초하여 마이크(870)에 대한 사용자(U)의 위치 정보를 산출한다. 그리고, 제어부(880)는 이 산출된 마이크(870)에 대한 사용자(U)의 위치 정보에 따라서, 마이크(870)로부터 수집 및 수신되는 음성 데이터를 보정한다.
이로써, 디스플레이장치(800)는 사용자(U)의 좌우방향 및 접근/이격 방향 위치를 간단한 알고리즘에 의해 용이하게 산출할 수 있으며, 이 산출 결과에 대응하여 음성 데이터를 각기 상이하게 보정함으로써 사용자(U)의 현 위치에 대응하는 최적의 음성 데이터를 얻을 수 있다.
이하, 디스플레이장치(800)에 포함되는 각 구성요소들에 관해 설명한다.
영상수신부(810)는 영상신호를 수신하여 신호처리부(820)에 전달하며, 수신하는 영상신호의 규격 및 디스플레이장치(800)의 구현 형태에 대응하여 다양한 방식으로 구현될 수 있다.
예를 들면, 디스플레이장치(800)가 TV로 구현되는 경우, 영상수신부(810)는 방송국(미도시)으로부터 송출되는 RF(radio frequency)신호를 무선으로 수신하거나, 컴포지트(composite) 비디오, 컴포넌트(component) 비디오, 슈퍼 비디오(super video), SCART, HDMI(high definition multimedia interface) 규격 등에 의한 영상신호를 유선으로 수신할 수 있다. 영상수신부(810)는 영상신호가 방송신호인 경우, 이 방송신호를 채널 별로 튜닝하는 튜너(tuner)를 포함한다.
디스플레이장치(800)가 컴퓨터 모니터인 경우에 영상수신부(810)는 VGA방식에 따른 RGB신호를 전달 가능한 D-SUB나, DVI(digital video interactive) 규격에 따른 DVI-A(analog), DVI-I(integrated digital/analog), DVI-D(digital)나, HDMI 규격 등으로 구현될 수 있다. 또는, 영상수신부(810)는 디스플레이포트(DisplayPort), UDI(unified display interface), 또는 와이어리스(wireless) HD 등으로 구현될 수도 있다.
신호처리부(820)는 영상신호의 영상 데이터에 대해 기 설정된 다양한 영상처리 프로세스를 수행한다. 신호처리부(820)는 이러한 프로세스를 수행하여 영상신호를 디스플레이부(830)에 출력함으로써, 디스플레이부(830)에 영상이 표시되게 한다. 또한, 신호처리부(820)는 영상신호의 음성 데이터에 대해서 별도의 프로세스를 수행하는 바, 신호처리부(820)는 영상 데이터 및 음성 데이터를 처리하는 구성이 각각 별도로 분리될 수도 있다.
신호처리부(820)가 수행하는 영상처리 프로세스의 종류는 한정되지 않는 바, 예를 들면 다양한 영상 포맷에 대응하는 디코딩(decoding) 및 인코딩(encoding), 디인터레이싱(de-interlacing), 프레임 리프레시 레이트(frame refresh rate) 변환, 스케일링(scaling), 영상 화질 개선을 위한 노이즈 감소(noise reduction), 디테일 강화(detail enhancement), 라인 스캐닝(line scanning) 등을 포함할 수 있다. 신호처리부(820)는 이러한 각 프로세스를 독자적으로 수행할 수 있는 개별적 구성으로 구현되거나, 또는 여러 기능을 통합시킨 일체형 구성으로 구현될 수 있다.
또한, 신호처리부(820)는 디스플레이장치(800)가 화상통화를 구현할 수 있도록, 통신부(850)를 통해 수신되는 화상 데이터 및 음성 데이터를 디스플레이부(830) 및 스피커(840)로 각각 출력한다. 그리고, 신호처리부(820)는 제어부(880)로부터 전달되는 사용자(U)의 화상 데이터 및 음성 데이터를 처리하여 통신부(850)를 통해 외부로 전송한다.
본 실시예에서는, 신호처리부(820)가 영상수신부(810)로부터 수신되는 영상신호의 처리 및 통신부(850)를 통해 송수신되는 데이터의 처리를 함께 수행하는 것으로 표현하나, 이는 하나의 실시예에 불과할 뿐으로서 상기한 각 기능을 수행하는 구성이 별도로 마련될 수도 있는 바, 이러한 사항이 본 발명의 사상을 한정하지 않는다.
디스플레이부(830)는 그 구현 방식이 한정되지 않으나 예를 들면 액정 디스플레이 패널로 구현되며, 신호처리부(820)에 의해 처리되는 영상신호가 영상으로 표시된다. 디스플레이부(830)는 신호처리부(820)로부터 주사되는 복수의 수평 주사 라인 수직으로 배열됨으로써 X-Z 평면 상의 디스플레이 영역 상에 영상 프레임을 표시한다.
스피커(840)는 신호처리부(820)에 의해 처리되는 음성 데이터를 음성으로 출력한다.
통신부(850)는 디스플레이장치(800)가 네트워크를 통해 하나 이상의 외부의 장치(미도시)와 통신 가능하도록 접속시킨다. 통신부(850)는 기 지정된 통신 규격에 기초하여, 외부로부터 전송되는 화상 데이터 및 음성 데이터를 신호처리부(820) 및 제어부(880)에게 전달하며, 신호처리부(820) 및 제어부(880)로부터 전달되는 화상 데이터 및 음성 데이터를 네트워크 상의 접속된 장치(미도시)로 전송한다.
카메라(861, 862)는 디스플레이장치(800) 전방에 위치한 사용자(U)의 화상을 촬상하여 제어부(880)에 전달한다. 카메라(861, 862)는 스테레오스코픽(stereoscopic) 카메라 또는 3차원 화상 카메라로 구현됨으로써, 촬상된 화상 내에서 사용자(U)의 위치 정보를 취득할 수 있도록 마련된다. 즉, 카메라(861, 862)에 의해 촬상한 사용자(U)의 화상으로부터, X-Y 평면 상에서 카메라(861, 862)에 대한 사용자(U)의 상대적인 각도가 도출되는 것이 가능하다.
카메라(861, 862)는 상호간에 소정 거리 이격된 제1카메라(861) 및 제2카메라(862)를 포함한다. 본 실시예에서 카메라(861, 862)가 복수 개가 마련되고 각 카메라(861, 862) 사이가 이격되는 이유는, 사용자(U)의 위치 정보, 특히 사용자(U)가 카메라(861, 862)로부터 Y 방향으로 얼마나 이격되어 있는지 여부를 산출하기 위함이다. 만일, 카메라(861, 862)가 복수가 아니거나, 또는 복수의 카메라(861, 862)가 상호 이격되어 있지 않다면, 후술할 마이크(870)에 대한 사용자(U)의 위치 정보를 산출하기 곤란하다.
마이크(870)는 복수 개가 마련되며 상호 이격되게 병렬적으로 배치된다. 마이크(870)는 사용자(U)로부터의 음성 데이터를 수집하여 제어부(880)로 전달한다. 본 실시예에 따른 마이크(870)는 무지향성 마이크로 구현되어, 마이크(870)가 위치하는 소정 범위의 영역 내의 모든 방향에 대하여 균일한 감도로 음성 데이터를 수집한다. 무지향성 마이크는 주위 환경의 소리/음성을 대체적으로 균일하게 수집하므로 수집 환경의 현장감을 표현함에 있어서 적합한 바, 디스플레이장치(800)가 실내에 설치되는 경우에 적용될 수 있다.
그러나 본 발명의 실시예에 따른 마이크(870)의 구현 방식이 이에 한정되지 않는 바, 마이크(870)는 특정 방향으로부터의 음성을 수집 가능한 지향성의 단방향(unidirectional) 마이크로 구현되어, 마이크(870)에 의해 정의되는 영역 내의 사용자(U) 음성 데이터를 선별적으로 수집할 수도 있다.
무지향성 마이크와 단방향 마이크는 그 구현 특성에서 피드백 비율, 피드백 증가 특성, 음색의 변화 특성, 채널 분리 특성 등 다양한 점에서 상이한 특성을 나타내는 바, 디스플레이장치(800)의 설치 환경 또는 구조적 특성 등 다양한 요인을 고려하여 선택 적용될 수 있다.
본 실시예에서는 카메라(861, 862) 및 마이크(870)가 X 방향에 평행한 직선 상에 배치된 것으로 표현하나, 이는 하나의 실시예에 불과한 것으로서 본 발명의 사상을 한정하지 않는다. 다만, 이러한 예시는 본 발명의 실시예를 보다 간단하고 명확하기 나타내기 위해 채택된 것이며, 카메라(861, 862) 및 마이크(870)가 일직선 상에 배치되지 않은 경우에도, 본 실시예의 응용에 의해 본 발명의 사상이 구현될 수 있음을 밝힌다.
제어부(880)는 카메라(861, 862)를 통해 촬상되는 사용자(U)의 화상 데이터와, 마이크(870)를 통해 수집되는 사용자(U)의 음성 데이터를 수신하면, 이 화상 및 음성 데이터가 통신부(850)로 전송될 수 있도록 신호처리부(820)를 제어하여 처리한다. 이 때, 제어부(880)는 마이크(870)에 대한 사용자(U)의 위치 정보를 산출하고, 이 산출된 위치 정보에 대응하여 음성 데이터를 보정한다.
제어부(880)가 음성 데이터의 보정하는 구체적인 방법은 다양한 구성이 적용 가능하며, 예를 들면 제어부(880)는 사용자(U)의 현재 위치에 가장 근접한 마이크(870)를 통해 수집되는 음성 데이터에 대해 음성의 증폭 또는 노이즈의 필터링 강도를 상이하게 적용할 수도 있다. 그러나, 이는 적용 가능한 방법 중 어느 하나의 예시에 불과하는 바, 이러한 사항이 본 발명의 사상을 한정하지 않는다.
또한, 음성 데이터의 보정 방법은 마이크(870)가 무지향성 마이크로 구현되는 경우와 지향성 마이크로 구현되는 경우 각각에 따라서 상이할 수 있으나, 이는 디스플레이장치(800)의 설계 단계에서 다양한 변경 적용이 가능한 사항인 바, 본 발명의 사상을 한정하지 않는다.
이하, 제어부(880)가 카메라(861, 862)에 의한 사용자(U)의 위치 정보에 기초하여, 마이크(870)에 대한 사용자(U)의 상대적인 위치 정보를 산출하는 방법에 관해 도 10을 참조하여 설명한다. 도 10은 디스플레이장치(800)에서 마이크(870)에 대한 사용자(U)의 위치 정보를 산출하는 방법을 나타내는 개념도이다.
본 실시예는 마이크(870)가 복수 개 마련되나, 각 마이크(870)에 대해서는 동일한 원리가 적용되므로, 이하 실시예에서는 어느 하나의 마이크(870)에 대해서만 설명하고, 그 이외에 대해서는 이하 실시예의 적용이 가능하므로 자세한 설명을 생략한다.
도 10에는 X-Y 평면 상에서, 제1카메라(861), 제2카메라(862), 마이크(870) 및 사용자(U)의 위치 관계가 개략적으로 나타나 있다. 본 실시예에 따르면, 제1카메라(861), 제2카메라(862), 마이크(870)는 X 방향에 평행한 직선 BL1 상에 배치되어 있다. 직선 BL1 상에서, 제1카메라(861)는 점 P1, 제2카메라(862)는 점 P2, 마이크(870)는 점 Pm으로 나타나 있다. 그리고, 사용자(U)는 직선 BL1 상에서 Y 방향으로 직교하게 연장된 직선 BL2 상의 점 Pu로 나타나 있다.
여기서, 최종적으로 제어부(880)가 얻고자 하는 마이크(870)에 대한 사용자(U)의 위치 정보는, 마이크(870)와 사용자(U) 사이의 거리 및 마이크(870)에 대한 사용자(U)의 상대적 각도를 포함한다. 전자는 점 Pm 및 점 Pu 사이의 거리인 Rm이며, 후자는 점 Pm 및 점 Pu를 잇는 직선 및 직선 BL1 사이의 각도인 Dm이다.
거리 Rm 및 각도 Dm을 구하는 방법은 다음과 같다.
점 P1 및 점 P2 사이의 거리 a는 디스플레이장치(800)의 설계 단계에서 고정된 값이므로, 거리 a는 초기 상태에서 이미 지정되어 있는 값이다. 점 P1 및 점 P2 사이의 기준점을 Pr이라고 할 때, 점 Pr 및 점 P1 사이의 거리와, 점 Pr 및 점 P2 사이의 거리는 모두 a/2가 된다. 여기서, 점 Pr의 설정은 계산의 편의를 위하여 설정한 것이다.
또한, 점 Pr 및 점 Pm 사이의 거리 c도 디스플레이장치(800)의 설계 단계에서 고정된 값이므로, 초기 상태에서 이미 지정되어 있는 값이다.
직선 BL1 및 직선 BL2가 교차하는 점을 Px라 하고, 점 Pr 및 점 Px 사이의 거리를 L, 점 Px 및 점 Pu 사이의 거리를 H라고 한다.
제1카메라(861) 및 제2카메라(862) 각각에 의해 사용자(U)의 화상이 촬상되면, 제1카메라(861) 및 제2카메라(862)는 스테레오스코픽 카메라로 구현되므로 각 카메라(861, 862)에 대한 사용자(U)의 상대적 각도가 도출될 수 있다. 즉, 점 P1 및 점 Pu를 잇는 직선 및 직선 BL1 사이의 각도 D1와, 점 P2 및 점 Pu를 잇는 직선 및 직선 BL1 사이의 각도 D2가 도출된다.
여기서, 제1카메라(861) 및 제2카메라(862)는 거리 a만큼 이격되어 있으므로 각도 D1 및 각도 D2는 상이한 값을 가진다. 따라서, 도 10에 나타난 바와 같은 기하학적 형상에 대해 삼각함수를 적용함으로써, 다음과 같은 관계식을 도출할 수 있다. 이하 관계식은 공지된 수학적 법칙에 의해 도출되며, 그 도출 과정은 생략한다.
<수학식 1>
Figure pat00001
Figure pat00002
상기 수학식 1에서 "tan D1"은 각도 D1의 탄젠트 값을 의미한다. 이와 같이, 제1카메라(861) 및 제2카메라(862)가 사용자(U)의 화상을 촬상함에 의하여 각도 D1 및 D2가 도출되면, 이미 알고 있는 값인 a와, 도출된 각도 D1, D2를 상기 수학식 1에 적용함으로써 L과 H가 산출된다.
이와 같이 L과 H가 산출되면, 다음과 같은 관계식에 의해 거리 Rm 및 각도 Dm을 산출할 수 있다.
<수학식 2>
Figure pat00003
Figure pat00004
"sin Dm"은 각도 Dm의 사인값을 의미한다. 수학식 1에 의해 산출된 L 및 H 값과, 이미 알고 있는 값인 c를 상기 수학식 2에 적용함으로써, 마이크(870)에 대한 사용자(U)의 위치 정보인 거리 Rm 및 각도 Dm을 산출할 수 있다.
제어부(880)는 이러한 일련의 과정을 통해 마이크(870)에 대한 사용자(U)의 위치 정보를 산출하면, 이 산출 결과에 대응하여 마이크(870)로부터 수신되는 음성 데이터를 기 설정 프로세스에 따라서 보정한다. 마이크(870)가 복수 개인 경우에, 제어부(880)는 각각의 마이크(870)에 대해 상기와 같이 사용자(U)의 위치 정보를 산출하고, 각 마이크(870)로부터 수집되는 음성 데이터를 개별적으로 보정할 수 있다. 이와 같이 개별적으로 보정된 각 음성 데이터는 통신부(850)로 전송되기 이전에 종합되도록 처리된다.
이상 설명한 바와 같이, 본 실시예에 따른 디스플레이장치(800)는 두 개의 카메라(861, 862)에 의한 사용자(U)의 위치 정보에 기초하여, 마이크(870)에 대한 사용자(U)의 좌우방향 및 접근/이격 방향에 따른 상대적인 위치 정보를 산출할 수 있다. 그리고, 디스플레이장치(800)는 이 산출 결과에 대응하여 음성 데이터를 보정함으로써, 마이크(870)를 통해 수집되는 사용자(U)의 음성 데이터의 품질을 향상시킬 수 있다.
또한, 앞서 도 10에 나타난 바와 같은 배치관계 및 수학식은 본 발명의 사상을 구현하기 위한 하나의 예시에 불과한 바, 각 카메라(861, 862) 및 마이크(870)의 배치 관계와 사용자(U)의 위치에 따라서 그 구현 예시는 달라질 수 있다. 그러나, 그러한 경우에도, 앞서 설명한 본 실시예를 응용 변경하여 적용함으로써 본 발명의 사상을 구현할 수 있다.
이하, 본 실시예에 따른 디스플레이장치(800)의 제어방법에 관해 도 11을 참조하여 설명한다. 도 11은 이러한 과정을 나타낸 제어 흐름도이다.
도 11에 도시된 바와 같이, 디스플레이장치(800)에서 화상통화가 개시됨에 따라서, 제1카메라(861) 및 제2카메라(862)가 각각 사용자(U)의 화상을 촬상하고(S100), 마이크(870)를 통해 사용자(U)의 음성 데이터가 수집된다(S110).
제어부(880)는 제1카메라(861) 및 제2카메라(862) 각각으로부터 사용자(U)의 위치 정보를 도출한다(S120). 그리고, 제어부(880)는 상기 도출된 사용자(U)의 위치 정보에 기초하여, 마이크(870)에 대한 사용자(U)의 상대적 위치 정보를 산출한다(S130).
마이크(870)에 대한 사용자(U)의 위치 정보가 산출되면, 제어부(880)는 이 산출 정보에 대응하여 음성 데이터를 보정한다(S140). 제어부(880)는 사용자(U)의 제1카메라(861) 및 제2카메라(862)로부터 사용자(U)의 위치가 변화하는지 모니터링하며(S150), 사용자(U) 위치가 변화한 것으로 감지되면 상기한 프로세스를 반복하여 사용자(U)의 위치 정보를 산출한다.
제어부(880)는 화상 데이터 및 음성 데이터를 네트워크로 전송한다(S160). 이에 의하여, 디스플레이장치(800)를 통한 화상통화가 이루어진다.
앞선 예시적인 실시예들은 극히 예시적이고 본 발명을 제한하는 것으로 해석되지 않는다. 본 발명의 사상은 다른 타입의 방법들 및 장치들에 적용될 수 있다. 또한, 본 발명의 예시적인 실시예들의 설명은 예증되는 것으로 의도되며, 본 발명의 범위를 제한하지 않고, 많은 대안, 수정 및 변형이 당업자에게 명백할 것이다.
100 : 영상 통화 장치
110 : 감지부
120 : 전송 데이터 생성부
130 : 출력 데이터 생성부
140 : 영상 및 음성 취득부
150 : 영상 통화 데이터 전송 및 수신부
160 : 영상 및 음성 출력부
170 : 제어부

Claims (43)

  1. 제1 통화자와 제2 통화자 사이의 영상 통화가 가능한 영상 통화 장치에 있어서,
    상기 제1 통화자의 영상을 캡쳐하는 영상 센서;
    상기 제2 통화자의 영상을 표시하는 디스플레이;
    상기 제1 통화자의 음성을 캡쳐하는 마이크로폰;
    상기 제2 통화자의 음성을 재생하는 스피커;
    상기 제1 통화자의 위치를 감지하는 감지부; 및
    제1 통화자의 원위치를 감지하도록 상기 감지부를 제어하고, 상기 제1 통화자의 위치가 원위치에서 새로운 위치로 변경되었는지를 감지하도록 상기 감지부를 제어하고, 상기 감지된 제1 통화자의 새로운 위치에 기초하여 조정되도록 상기 마이크로폰을 제어하는 제어부를 포함하는 영상 통화 장치.
  2. 제1항에 있어서, 상기 제어부는 상기 감지된 제1 통화자의 새로운 위치에 기초하여 재조정되도록 상기 영상 센서를 제어하는 것인 영상 통화 장치.
  3. 제1항에 있어서, 상기 제어부는 상기 감지된 제1 통화자의 새로운 위치에 기초하여 재조정되도록 상기 스피커를 제어하는 것인 영상 통화 장치.
  4. 제1항에 있어서, 상기 제어부는 윈도우에 상기 제2 통화자의 영상을 표시하도록 상기 디스플레이를 제어하고,
    상기 감지된 제1 통화자의 새로운 위치에 기초하여 상기 윈도우를 상기 디스플레이 상의 다른 지점으로 이동하도록 상기 디스플레이를 제어하는 것인 영상 통화 장치
  5. 제1항에 있어서, 상기 디스플레이는 상기 제1 통화자의 영상을 더 표시하는 것인 영상 통화 장치.
  6. 제5항에 있어서, 상기 제어부는 상기 디스플레이 상의 제1 지점의 제1 윈도우에 상기 제1 통화자의 영상을 표시하고, 상기 디스플레이 상의 제2 지점의 제2 윈도우에 상기 제2 통화자의 영상을 표시하도록 상기 디스플레이를 제어하고,
    상기 제어부는 상기 감지된 제1 통화자의 새로운 위치에 기초하여 상기 제1 윈도우와 상기 제2 윈도우 중 적어도 하나를 상기 디스플레이 상의 다른 지점으로 각각 이동하도록 상기 디스플레이를 제어하는 것인 영상 통화 장치.
  7. 제1항에 있어서, 상기 감지부는 상기 제1 통화자의 위치를 감지하기 위해, 상기 영상 센서 및 마이크로폰 중 적어도 하나를 이용하여 상기 제1 통화자의 위치를 감지하는 것인 영상 통화 장치.
  8. 제2항에 있어서, 상기 제어부는 영상 센서의 좌우 각(pan angle), 틸트 각(tilt angle) 및 줌 수치 중 적어도 하나를 변경시켜 상기 감지된 제1 통화자의 새로운 위치에 기초하여 재조정되도록 상기 영상센서를 제어하는 것인 영상 통화 장치.
  9. 제1항에 있어서, 상기 제어부는 마이크로폰의 방향을 변경시켜 상기 감지된 제1 통화자의 새로운 위치에 기초하여 재조정되도록 상기 마이크로폰을 제어하는 것인 영상 통화 장치.
  10. 제3항에 있어서, 상기 제어부는 스피커의 방향을 변경시켜 상기 감지된 제1통화자의 새로운 위치에 기초하여 재조정되도록 상기 스피커를 제어하는 것인 영상 통화 장치
  11. 제1항에 있어서, 상기 디스플레이가 배경 영상을 표시하면, 상기 제어부는 전경 윈도우에 상기 제2 통화자의 영상을 표시하도록 상기 디스플레이를 제어하고,
    상기 제1 통화자의 위치가 상기 원위치에서 새로운 위치로 변경된 것이 감지되면, 상기 제어부는 배경 영상을 방해하지 않고, 상기 윈도우를 상기 감지된 제1통화자의 새로운 위치에 대응하는 상기 디스플레이 상의 다른 지점으로 이동시키도록 상기 디스플레이를 제어하는 것인 영상 통화 장치.
  12. 제1 위치의 복수의 통화자 및 제2 위치의 적어도 한 명의 통화자 사이의 영상 회의 통화를 가능하게 하는 영상 통화 시스템에 있어서,
    상기 제1 위치의 복수의 통화자 중 제1 당사자의 영상을 캡쳐하는 영상 센서;
    상기 제2 위치의 적어도 한 명의 통화자의 영상을 표시하는 디스플레이;
    상기 제1 위치의 제1 당사자의 음성을 캡쳐하는 마이크로폰;
    상기 제2 위치의 적어도 한 명의 통화자의 음성을 재생하는 스피커;
    상기 제1 위치에서 현재 말하고 있는 당사자의 지점을 감지하는 감지부; 및
    상기 제1 위치의 복수의 통화자 중 현재 말하고 있는 제1 당사자 지점을 감지하고, 현재 말하고 있는 당사자가 상기 제1 위치의 복수의 통화자 중 제2 당사자이면 상기 제2 당사자 지점을 감지하도록 상기 감지부를 제어하고, 상기 감지된 제2 당사자 지점에 기초하여 재조정되도록 상기 마이크로폰을 제어하는 것인 제어부를 포함하는 영상 통화 시스템.
  13. 제12항에 있어서, 상기 제어부는 상기 감지된 제2 당사자 지점에 기초하여 재조정되도록 상기 영상 센서를 제어하는 것인 영상 통화 시스템.
  14. 제12항에 있어서, 상기 제어부는 상기 감지된 제2 당사자 지점에 기초하여 재조정되도록 상기 스피커를 제어하는 것인 영상 통화 시스템.
  15. 제1 통화자 및 제2 통화자 사이의 영상 통화 이용 방법에 있어서,
    상기 제1 통화자의 영상을 캡쳐하는 단계;
    상기 제2 통화자의 영상을 표시하는 단계;
    상기 제1 통화자의 음성을 캡쳐하는 단계;
    상기 제2 통화자의 음성을 재생하는 단계;
    미리 감지된 지점을 상기 제1 통화자의 위치로 감지하는 단계; 및
    상기 제1 통화자의 위치가 새로운 위치로 변경된 것으로 감지되면, 상기 감지된 제1 통화자의 새로운 위치에 기초하여 재조정되도록 상기 마이크로폰을 제어하는 단계를 포함하는 방법.
  16. 제15항에 있어서, 상기 감지된 제1 통화자의 새로운 위치에 기초하여 재조정되도록 상기 영상 센서를 제어하는 단계를 더 포함하는 방법.
  17. 제15항에 있어서, 상기 감지된 제1 통화자의 새로운 위치에 기초하여 재조정되도록 상기 스피커를 제어하는 단계를 더 포함하는 방법.
  18. 제15항에 있어서, 윈도우에 상기 제2 통화자의 영상을 표시하는 단계를 더 포함하고,
    상기 윈도우를 상기 감지된 제1 통화자의 새로운 위치에 대응하도록 상기 디스플레이 상의 다른 지점으로 이동시키는 단계를 더 포함하는 방법.
  19. 제15항에 있어서, 상기 제1 통화자의 영상을 표시하는 단계를 더 포함하는 방법.
  20. 제19항에 있어서, 상기 디스플레이 상의 제1 지점의 제1 윈도우에 상기 제1통화자의 영상 및 상기 디스플레이 상의 제2 지점의 제2 윈도우에 상기 제2 통화자의 영상을 표시하는 단계를 더 포함하고,
    상기 감지된 제1 통화자의 새로운 위치에 기초하여 상기 제1 윈도우 및 제2 윈도우 중 적어도 하나를 상기 디스플레이 상의 다른 지점으로 각각 이동시키는 단계를 더 포함하는 방법.
  21. 제15항에 있어서, 상기 제1 통화자의 위치 감지는 영상 센서 및 마이크로폰 중 적어도 하나를 이용하여 수행되는 것인 방법.
  22. 제16항에 있어서, 상기 영상 센서의 제어는 상기 감지된 제1 통화자의 새로운 위치에 대응하도록 상기 영상 센서의 좌우 각, 틸트 각 및 줌 수치 중 적어도 하나를 변경시켜 수행되는 것인 방법.
  23. 제15항에 있어서, 상기 마이크로폰의 제어는 상기 감지된 제1 통화자의 새로운 위치에 대응하도록 상기 마이크로폰의 방향을 변경시켜 수행되는 것인 방법.
  24. 제17항에 있어서, 상기 스피커의 제어는 상기 감지된 제1 통화자의 위치에 대응하도록 상기 스피커의 방향을 변경시켜 수행되는 것인 방법.
  25. 제15항에 있어서,
    배경 영상을 표시하는 단계;
    전경 윈도우에 상기 제2 통화자의 영상을 표시하는 단계; 및
    상기 제1 통화자의 위치가 원위치에서 새로운 위치로 변경된 것으로 감지되면, 상기 윈도우를 배경 영상을 방해하지 않고 상기 감지된 제1 통화자의 새로운 위치에 대응하는 상기 디스플레이 상의 다른 지점으로 이동시키는 단계를 더 포함하는 방법.
  26. 제1 통화자 및 제2 통화자 사이의 영상 통화가 가능한 영상 통화 장치에 있어서,
    상기 제1 통화자의 영상을 캡쳐하는 영상 센서;
    상기 제2 통화자의 영상을 표시하는 디스플레이;
    상기 제1 통화자의 위치를 감지하는 감지부; 및
    윈도우에 상기 제2 통화자의 영상을 표시하도록 상기 디스플레이를 제어하고, 상기 제1통화자의 원위치를 감지하도록 상기 감지부를 제어하고, 상기 제1 통화자의 위치가 원위치에서 새로운 위치로 변경되었는지를 감지하도록 상기 감지부를 제어하고,
    상기 윈도우를 상기 감지된 제1 통화자의 새로운 위치에 대응하는 상기 디스플레이 상의 다른 지점으로 이동시키도록 상기 디스플레이를 제어하는 제어부를 포함하는 영상 통화 장치.
  27. 제26항에 있어서, 상기 디스플레이는 상기 제1통화자의 영상을 더 표시하는 것인 영상 통화 장치.
  28. 제27항에 있어서, 상기 제어부는 상기 디스플레이 상의 제1 지점의 제1 윈도우에 상기 제1 통화자의 영상을 표시하고, 상기 디스플레이 상의 제2 지점의 제2 윈도우에 상기 제2 통화자의 영상을 표시하도록 상기 디스플레이를 제어하고,
    상기 제어부는 상기 감지된 제1통화자의 새로운 위치에 기초하여, 상기 제1 윈도우와 상기 제2 윈도우 중 적어도 하나를 상기 디스플레이 상의 다른 지점으로 각각 이동시키도록 상기 디스플레이를 제어하는 하는 것인 영상 통화 장치.
  29. 디스플레이장치에 있어서,
    영상신호를 수신하는 영상수신부와;
    상기 영상수신부에 수신되는 영상신호를 표시 가능하게 처리하는 신호처리부와;
    상기 신호처리부에서 처리되는 영상신호에 기초하는 영상을 표시하는 디스플레이부와;
    제1카메라 및 상기 제1카메라로부터 소정 거리 이격된 제2카메라를 포함하고, 기 설정된 대상의 화상을 촬상하는 카메라유닛과;
    적어도 하나의 마이크를 포함하고, 상기 대상으로부터의 음성 데이터를 수집하는 마이크유닛과;
    상기 카메라유닛 및 상기 마이크유닛에 의해 각각 수집되는 상기 대상의 화상 및 음성 데이터를 수신하며, 상기 제1카메라 및 상기 제2카메라 각각에 의한 상기 대상의 위치 정보에 기초하여 상기 마이크유닛에 대한 상기 대상의 위치 정보를 산출하고, 상기 산출 결과에 대응하여 상기 수신되는 상기 음성 데이터를 보정하는 제어부를 포함하는 것을 특징으로 하는 디스플레이장치.
  30. 제29항에 있어서,
    상기 마이크유닛에 대한 상기 대상의 위치 정보는, 상기 마이크유닛과 상기 대상 사이의 거리 및 상기 마이크유닛에 대한 상기 대상의 상대적 각도를 포함하는 것을 특징으로 하는 디스플레이장치.
  31. 제30항에 있어서,
    상기 마이크유닛은 상호 이격되게 병렬적으로 배치된 복수의 마이크를 포함하며,
    상기 제어부는 각각의 상기 마이크에 대한 상기 대상의 위치 정보를 산출하여, 상기 각각의 마이크로부터 수집되는 상기 음성 데이터를 개별적으로 보정 가능한 것을 특징으로 하는 디스플레이장치.
  32. 제31항에 있어서,
    상기 마이크는 무지향성 마이크를 포함하는 것을 특징으로 하는 디스플레이장치.
  33. 제31항에 있어서,
    상기 마이크는 지향성의 단방향(unidirectional) 마이크를 포함하는 것을 특징으로 하는 디스플레이장치.
  34. 제29항에 있어서,
    상기 제1카메라 및 상기 제2카메라는 각각 스테레오스코픽(stereoscopic) 카메라를 포함하는 것을 특징으로 하는 디스플레이장치.
  35. 제34항에 있어서,
    상기 제어부는,
    상기 제1카메라 및 상기 제2카메라 각각으로부터 전달되는 영상 데이터로부터 상기 제1카메라 및 상기 제2카메라 각각에 대한 사용자의 상대적 각도를 산출하고, 상기 산출된 각각의 각도에 기초하여 상기 마이크유닛에 대한 상기 대상의 위치 정보를 산출하는 것을 특징으로 하는 디스플레이장치.
  36. 제29항에 있어서,
    외부와 네트워크로 통신 가능하게 접속된 통신부를 더 포함하며,
    상기 신호처리부는,
    상기 대상에 대한 상기 화상 데이터 및 상기 보정된 음성 데이터를 상기 통신부로 전송하며, 상기 통신부를 통해 수신되는 화상 데이터 및 음성 데이터를 상기 디스플레이부 및 상기 스피커를 통해 출력하는 것을 특징으로 하는 디스플레이장치.
  37. 디스플레이장치의 제어방법에 있어서,
    제1카메라 및 상기 제1카메라로부터 소정 거리 이격된 제2카메라를 포함하는 카메라유닛에 의해 기 설정된 대상의 화상을 촬상하는 단계와;
    적어도 하나의 마이크를 포함하는 마이크유닛을 통해 상기 대상으로부터의 음성 데이터를 수집하는 단계와;
    상기 제1카메라 및 상기 제2카메라 각각에 의한 상기 대상의 위치 정보에 기초하여 상기 마이크유닛에 대한 상기 대상의 위치 정보를 산출하고, 상기 산출 결과에 대응하여 상기 마이크유닛을 통해 수집되는 상기 음성 데이터를 보정하는 단계와;
    상기 촬상되는 화상 데이터 및 상기 보정된 음성 데이터를 네트워크로 전송하는 단계를 포함하는 것을 특징으로 하는 디스플레이장치의 제어방법.
  38. 제37항에 있어서,
    상기 마이크유닛에 대한 상기 대상의 위치 정보는, 상기 마이크유닛과 상기 대상 사이의 거리 및 상기 마이크유닛에 대한 상기 대상의 상대적 각도를 포함하는 것을 특징으로 하는 디스플레이장치의 제어방법.
  39. 제38항에 있어서,
    상기 마이크유닛은 상호 이격되게 병렬적으로 배치된 복수의 마이크를 포함하며,
    상기 음성 데이터를 보정하는 단계는,
    각각의 상기 마이크에 대한 상기 대상의 위치 정보를 산출하는 단계와;
    상기 각각의 마이크로부터 수집되는 상기 음성 데이터를 개별적으로 보정하는 단계를 포함하는 것을 특징으로 하는 디스플레이장치의 제어방법.
  40. 제39항에 있어서,
    상기 마이크는 무지향성 마이크를 포함하는 것을 특징으로 하는 디스플레이장치의 제어방법.
  41. 제39항에 있어서,
    상기 마이크는 지향성의 단방향 마이크를 포함하는 것을 특징으로 하는 디스플레이장치의 제어방법.
  42. 제37항에 있어서,
    상기 제1카메라 및 상기 제2카메라는 각각 스테레오스코픽 카메라를 포함하는 것을 특징으로 하는 디스플레이장치의 제어방법.
  43. 제42항에 있어서,
    상기 음성 데이터를 보정하는 단계는,
    상기 제1카메라 및 상기 제2카메라 각각으로부터 전달되는 영상 데이터로부터 상기 제1카메라 및 상기 제2카메라 각각에 대한 상기 대상의 상대적 각도를 산출하는 단계와;
    각각의 상기 산출된 각도에 기초하여 상기 마이크유닛에 대한 상기 대상의 상대적 위치 정보를 산출하는 단계를 포함하는 것을 특징으로 하는 디스플레이장치의 제어방법.
KR1020100084727A 2009-09-03 2010-08-31 영상 통화 장치, 시스템 및 방법 KR101446645B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020090083177 2009-09-03
KR20090083177 2009-09-03

Publications (2)

Publication Number Publication Date
KR20110025117A true KR20110025117A (ko) 2011-03-09
KR101446645B1 KR101446645B1 (ko) 2014-10-07

Family

ID=41667563

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100084727A KR101446645B1 (ko) 2009-09-03 2010-08-31 영상 통화 장치, 시스템 및 방법

Country Status (3)

Country Link
US (1) US8390665B2 (ko)
EP (1) EP2293559A3 (ko)
KR (1) KR101446645B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022255730A1 (ko) * 2021-06-04 2022-12-08 삼성전자(주) 전자장치 및 그 제어방법

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8749609B2 (en) * 2009-09-03 2014-06-10 Samsung Electronics Co., Ltd. Apparatus, system and method for video call
US20130028443A1 (en) 2011-07-28 2013-01-31 Apple Inc. Devices with enhanced audio
CN104412619B (zh) * 2012-07-13 2017-03-01 索尼公司 信息处理系统
EP2879402A4 (en) * 2012-07-27 2016-03-23 Sony Corp INFORMATION PROCESSING SYSTEM AND STORAGE MEDIUM
US9363476B2 (en) 2013-09-20 2016-06-07 Microsoft Technology Licensing, Llc Configuration of a touch screen display with conferencing
US20150085060A1 (en) * 2013-09-20 2015-03-26 Microsoft Corporation User experience for conferencing with a touch screen display
CN108174143B (zh) * 2016-12-07 2020-11-13 杭州海康威视数字技术股份有限公司 一种监控设备控制方法及装置
KR102386773B1 (ko) 2017-10-17 2022-04-15 삼성전자주식회사 다수 개의 스피커 및 마이크를 이용하여 오디오 신호를 생성하는 방법 및 그 전자 장치
KR20220103548A (ko) * 2021-01-15 2022-07-22 삼성전자주식회사 오디오 데이터를 처리하는 전자 장치 및 그 동작 방법

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05268599A (ja) * 1992-03-17 1993-10-15 Fujitsu Ltd テレビ会議システムにおける人物撮像カメラの自動制御方式
JP3382276B2 (ja) * 1993-01-07 2003-03-04 キヤノン株式会社 電子機器及びその制御方法
JPH09149391A (ja) 1995-11-17 1997-06-06 Kyocera Corp テレビ電話装置
JP2001296343A (ja) * 2000-04-11 2001-10-26 Nec Corp 音源方位設定装置及びそれを備えた撮像装置、送信システム
US6766035B1 (en) * 2000-05-03 2004-07-20 Koninklijke Philips Electronics N.V. Method and apparatus for adaptive position determination video conferencing and other applications
JP4378072B2 (ja) * 2001-09-07 2009-12-02 キヤノン株式会社 電子機器、撮像装置、携帯通信機器、映像の表示制御方法及びプログラム
JP2005311734A (ja) * 2004-04-22 2005-11-04 Nippon Telegr & Teleph Corp <Ntt> 撮像表示装置および撮像表示方法
JP4832869B2 (ja) * 2005-11-29 2011-12-07 京セラ株式会社 通信端末およびその表示方法
US7797383B2 (en) * 2006-06-21 2010-09-14 Cisco Technology, Inc. Techniques for managing multi-window video conference displays
JP2008259000A (ja) * 2007-04-06 2008-10-23 Sony Corp テレビ会議装置、制御方法、およびプログラム
US20080273078A1 (en) * 2007-05-01 2008-11-06 Scott Grasley Videoconferencing audio distribution
US20100085415A1 (en) * 2008-10-02 2010-04-08 Polycom, Inc Displaying dynamic caller identity during point-to-point and multipoint audio/videoconference
US8233026B2 (en) * 2008-12-23 2012-07-31 Apple Inc. Scalable video encoding in a multi-view camera system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022255730A1 (ko) * 2021-06-04 2022-12-08 삼성전자(주) 전자장치 및 그 제어방법

Also Published As

Publication number Publication date
US8390665B2 (en) 2013-03-05
US20110050840A1 (en) 2011-03-03
KR101446645B1 (ko) 2014-10-07
EP2293559A2 (en) 2011-03-09
EP2293559A3 (en) 2015-01-21

Similar Documents

Publication Publication Date Title
US8749609B2 (en) Apparatus, system and method for video call
KR101446645B1 (ko) 영상 통화 장치, 시스템 및 방법
US8115799B2 (en) Method and apparatus for obtaining acoustic source location information and a multimedia communication system
US10491809B2 (en) Optimal view selection method in a video conference
US20120083314A1 (en) Multimedia Telecommunication Apparatus With Motion Tracking
US10447970B1 (en) Stereoscopic audio to visual sound stage matching in a teleconference
EP2352290B1 (en) Method and apparatus for matching audio and video signals during a videoconference
JP4482330B2 (ja) ビデオ会議時に室内の遠隔にいる人の認識を与えるシステム及び方法
WO2016065913A1 (zh) 视频图像的处理方法、设备及系统
CN116208885A (zh) 具有增强音频的设备
US20050280701A1 (en) Method and system for associating positional audio to positional video
JP2011223549A (ja) 音声出力装置
US9602758B2 (en) Communication apparatus, conference system, computer-readable recording medium, and display control method
US11636571B1 (en) Adaptive dewarping of wide angle video frames
CN102202206A (zh) 通信设备
US11202148B1 (en) Smart audio with user input
JP6835205B2 (ja) 撮影収音装置、収音制御システム、撮影収音装置の制御方法、及び収音制御システムの制御方法
US10785445B2 (en) Audiovisual transmissions adjustments via omnidirectional cameras
JP2006339869A (ja) 映像信号と音響信号の統合装置
JPH09149391A (ja) テレビ電話装置
JP2012145638A (ja) 映像表示装置、映像表示方法
US20210110830A1 (en) Voice activity detection using audio and visual analysis
JP6565777B2 (ja) 通信装置、会議システム、プログラムおよび表示制御方法
US11227396B1 (en) Camera parameter control using face vectors for portal
JP2018518067A (ja) スマートテレビの外付装置用コネクタ

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170830

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20180830

Year of fee payment: 5