KR20000075601A - 카메라-기초 제스쳐 입력을 이용한 3차원 이미지 구축 시스템및 방법 - Google Patents

카메라-기초 제스쳐 입력을 이용한 3차원 이미지 구축 시스템및 방법 Download PDF

Info

Publication number
KR20000075601A
KR20000075601A KR1019997007662A KR19997007662A KR20000075601A KR 20000075601 A KR20000075601 A KR 20000075601A KR 1019997007662 A KR1019997007662 A KR 1019997007662A KR 19997007662 A KR19997007662 A KR 19997007662A KR 20000075601 A KR20000075601 A KR 20000075601A
Authority
KR
South Korea
Prior art keywords
system user
dimensional
user
image display
foot
Prior art date
Application number
KR1019997007662A
Other languages
English (en)
Other versions
KR100650296B1 (ko
Inventor
다미안룐스
Original Assignee
요트.게.아. 롤페즈
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 요트.게.아. 롤페즈, 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 요트.게.아. 롤페즈
Publication of KR20000075601A publication Critical patent/KR20000075601A/ko
Application granted granted Critical
Publication of KR100650296B1 publication Critical patent/KR100650296B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/017Gesture based interaction, e.g. based on a set of recognized hand gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/002Specific input/output arrangements not covered by G06F3/01 - G06F3/16
    • G06F3/005Input arrangements through a video camera
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • H04N23/611Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F2300/00Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game
    • A63F2300/10Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game characterized by input arrangements for converting player-generated signals into game device control signals
    • A63F2300/1087Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game characterized by input arrangements for converting player-generated signals into game device control signals comprising photodetecting means, e.g. a camera
    • A63F2300/1093Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game characterized by input arrangements for converting player-generated signals into game device control signals comprising photodetecting means, e.g. a camera using visible light
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F2300/00Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game
    • A63F2300/60Methods for processing data by generating or executing the game program
    • A63F2300/69Involving elements of the real world in the game world, e.g. measurement in live races, real video

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • User Interface Of Digital Computer (AREA)
  • Processing Or Creating Images (AREA)
  • Position Input By Displaying (AREA)

Abstract

시스템 사용자의 카메라-기초 제스쳐 입력을 이용한 3차원 이미지 구축 시스템및 방법에 있어서, 상기 시스템은 컴퓨터-판독 메모리, 시스템 사용자의 제스쳐와 시스템 사용자 주위의 상호작용 영역을 나타내는 비디오 신호를 생성하는 비디오 카메라, 비디오 이미지 디스플레이를 포함한다. 비디오 이미지 디스플레이는 시스템 사용자 전방에 위치한다. 상기 시스템은 또한 시스템 사용자의 신체와 주요 신체 부위의 3차원 위치를 판단하기 위해 컴퓨터-판독 메모리에 저장된 프로그램에 따라 비디오 신호를 처리하는 마이크로프로세서를 구비한다. 마이크로 프로세서는 시스템 사용자의 신체와 주요 신체 부위의 3차원 위치를 근거로 비디오 이미지 디스플레이상에 시스템 사용자와 상호작용 영역의 3차원 이미지를 구축한다. 그래픽 이미지 디스플레이는 상호작용 영역을 점유한 것처럼 중복되어 나타나는 3차원 그래픽 물체를 보여주고, 시스템 사용자의 움직임은 비디오 이미지 디스플레이상에 중복되어 3차원으로 디스플레이된 물체의 명확한 움직임을 유발시킨다.

Description

카메라-기초 제스쳐 입력을 이용한 3차원 이미지 구축 시스템 및 방법{SYSTEM AND METHOD FOR CONSTRUCTING THREE-DIMENSIONAL IMAGES CAMERA-BASED GESTURE INPUTS}
멀티미디어 및 가상 현실 어플리케이션은 사용자와 컴퓨터간에 흥미로운 상호작용을 제공한다. 그러나, 현재의 컴퓨터/사용자 인테페이스는 용이한 사용자 상호작용을 제공하지 못하므로 소비자가 멀티미디어및 가상 현실 어플리케이션을 받아들임에 있어 장벽을 제공하는 셈이다. 이상적으로, 컴퓨터/사용자 인터페이스는 직관적인 상호작용 포맷을 광범위한 상호작용 기능과 결합한다. 그러나 실질적으로, 이러한 두가지 특징은 서로 상충된다. 예를 들면, 컴퓨터 키보드는 광범위한 상호작용 기능을 제공하나 직관적이지는 않다. 반면, 텔레비젼 원격 제어는 직관적이기는 하나 제한된 상호작용 기능을 제공한다. 인스트루멘티드 보디 슈트(instrumented body suit)와 같은 보다 융통성 있는 인터페이스는 사용이 간편하지 않으며 비용도 많이든다.
컴퓨터/사용자 인터페이스 디자인의 다양한 방법들이 제안되었다. 그중 한가지는 시스템 사용자의 제스쳐를 측정하기 위해 비침입적 방법으로 비디오 카메라를 사용하여 시스템 사용자에게 디스플레이된 이미지를 제어하는 방법이다. 도1에 도시된 바와 같이, 인터페이스 시스템(10)은 사용자(14)가 앞에 서있는 푸른벽(12)을 구비하여, 사용자(14)의 2차원 실루엣 추출이 가능하도록 하며 실루엣을 크로마킹한다. 시스템(10)은 2차원 사용자 실루엣을 식별하고 비디오 신호를 생성하는 비디오 카메라(16)를 포함한다. 카메라의 마이크로프로세서(18)는 비디오 카메라(16)에 의해 관찰된 2차원 사용자 실루엣을 단지 2차원 형체로만 식별한다. 그러므로, 사용자(14)의 움직임은 실루엣의 이미지 좌표 변경의 측면에서 보면 마이크로프로세서(18)에 의해서만 이해된다고 할 수 있다. 마이크로프로세서(18)는 사용자(14)의 이미지를 텔레비전 디스플레이(20)상에 디스플레이한다. 텔레비전(20)상에 디스플레이된 이미지는 사용자의 이미지가 크로마키된 2차원 장면으로 구성된다. 사용자(14)는 예를 들면 손을 머리위로 올린 포즈와 같은 특정 포즈를 취하거나, 사용자 실루엣의 일부가 지정된 이미지 좌표 세트를 접촉하도록 움직여서 사용자(14)가 디스플레이된 물체를 접촉한 것처럼 나타나도록 함으로써 디스플레이된 장면과 상호작용할 수 있다.
도1의 인터페이스 시스템은 사용하기 쉽고 비용도 싼 멀티미디어및 가상 현실 어플리케이션과의 인터페이스를 제공한다. 그러나, 이러한 인터페이스 시스템은 단지 컴퓨터-디스플레이된 물체와의 2차원 상호작용을 허용할 뿐, 2차원 인터페이스 기능을 제한한다. 예를 들면, 도1의 2차원 시스템에서, 컴퓨터-디스플레이된 모든 물체는 사용자 실루엣을 둘러싼 윈도우에서 동일한 깊이에 있다.
도2에 도시한 바와 같이, 도1의 시스템에서 사용된 종래의 2차원 실루엣 추출 프로세스는 하드웨어 프로세스(점선 위)와, 컴퓨터 마이크로프로세서(18)에 의해 실행되는 소프트웨어 프로세스(점선 아래)를 포함한다. 하드웨어 프로세스는 아나로그 비디오 카메라 신호를 입력하는 단계22와, 아나로그 카메라 신호를 디지탈화해서 그레이 수준 바이너리 데이터 신호를 생성하는 단계24를 포함한다. 하드웨어 프로세스는 또한 비디오 카메라의 해상도를 (고저로) 조정하는 단계26과 카메라뷰를 대상 이미지, 즉, 사용자의 이미지의 창에 제한하는 단계28을 추가로 포함한다. 또한, 하드웨어 프로세스는 그레이 수준 바이너리 데이터 신호를 디지털 바이너리 데이터, 즉, 1 또는 0으로 변환하는 동적 임계 단계30을 포함한다. 단계 32에서 하드웨어 프로세스는 사용자 이미지의 모서리(실루엣)를 판단하고, 단계 34에서 에지 데이터를 근거로 화상 크기를 조정하여, 그에 따라 단계 26에서 해상도를 조정한다.
소프트웨어 프로세스는 단계 34의 에지 데이터로부터 배경을 감산하여 사용자 이미지의 윤곽만을 남기는 단계 36와 연관된다. 여기에서 "배경"이란 카메라에 의해 관찰된 공백 장면의 화상으로서 단계 38에 제공된다. 소프트웨어 프로세스는 또한 사용자 이미지의 모든 에지 데이터를 합하여 사용자 이미지 주위에 단일 윤곽을 제공한다. 소프트웨어 프로세스는 또한 사용자 이미지 윤곽이 사람, 동물등을 나타내는지를 판단하는 식별 단계42와, (x, y좌표로 표시된)사용자의 실루엣 특징, 예를 들면, 머리, 손, 발, 팔, 다리등을 식별하는 실루엣 특징 단계44를 포함한다. 단계46에서, 소프웨어 프로세스는 사용자 주위의 경계 박스를 산출하기 위해 윤곽식별데이터를 이용한다. 경계 박스 데이터는 사용자 주위의 카메라창의 크기를 제한하는 창 제한 단계28에 제공되어, 추출 프로세스의 속도를 높힌다.
Massachusetts Institute of Technology(MIT)의 Media Lab에 의해 제안된 다른 방법에서는, 카메라-기초 신체 동작과 시스템 사용자의 제스쳐를 이용한 컴퓨터-제작 그래픽 세계와 사용자의 상호작용이 가능하다. 이러한 시스템은 현재 가용한 종류중 가장 범용적인 방법이나, 다음과 같은 문제점을 가지고 있다. (1) 표준 그래픽 인터페이스(SGI) 플랫폼에 기초를 두고 있다 (2) 시스템 사용자 주위의 안내 조건들에 민감하다 (3) 3차원으로 사용자의 발을 추적하나 사용자 신체의 다른 부위들은 2차원 물체로 처리한다 (4) 단일 사용자에 제한된다 (5) 손가락과 같은 사용자 손의 세부사항을 보기에는 너무 조악(coarse)하다 (6) 아래에 설명된 "매직 미러" 상호대화형 비디오 환경(IVE) 패러다임에만 연관된다. 그러므로, 이 방법은 여러가지 문제점과 함께 종래의 2차원 방법과 동일한 문제점을 가진다.
Japanese Patent Abstract Publication No. 07-038873(JP 07-038873)에 개시된 또 다른 방법은 인간 이미지의 리얼 타임 인식 방법을 포함한다. JP 07-038873에서는 표정, 머리 회전, 손가락의 움직임, 신체의 회전을 검출하는 인간 신체에 대한 3차원 그래픽 제작을 설명한다. 그러나, JP 07-038873은 인간 신체의 그래픽 모델 제작에 국한된다. 또한, JP 07-038873은 주로 전자회의의 목적으로 사용자의 3차원 그래픽 애니메이션 사용에 촛점을 맞추고 있으며, 여기에서 사용자는 컴퓨터-제작 장면의 대상물을 제어할 수 없다. 결국, JP 07-038873은 로컬 사용자의 3차원 애니메이션에 대항하여, 전자회의용 원거리 사용자 3차원 애니메이션을 개시한 것이다.
마지막으로, International Patent Application (PCT) WO 96/21321 (PCT 96/21321)은 리얼 타임으로 이벤트(예: 축구 경기)의 3차원 시뮬레이션을 제작하거나, 카메라와 마이크로폰을 이용하여 CD ROM상에 저장하는 방법에 관한 것이다. 그러나, 이 시스템은 카메라에 의해 관찰된 이벤트의 3차원 장면들을 단지 재생하는 것에 지나지 않는다. 또한, PCT 96/21321에 설명된 시스템의 사용자는 3차원 장면 투시도를 변경할 수 있을 뿐 장면에 나타나는 물체들을 제어할 수는 없다.
불행히도, 상기 설명된 방법중 어느 것도 직관적 상호작용 포맷을 광범위한 상호작용 기능과 결합시키는 컴퓨터/사용자 인터페이스를 제공하지 못하였다.
본 발명의 목적은 2차원 인터페이스 시스템, MIT의 Media Lab에 의해 제안된 방법, 그리고 기타 상기 설명된 연관 기술에서 나타난 문제점들을 해결하는 것이다.
본 발명의 다른 목적은 컴퓨터 사용자들 주위의 3차원 공간을 물체가 점유하고 컴퓨터 사용자들이 일반적인 신체 움직임을 통해 물체와 상호작용하고 제어할 수 있도록 컴퓨터-제작 물체의 3차원 디스플레이를 제공하는 것이다.
본 발명의 또 다른 목적은 컴퓨터 사용자들이 일반적인 신체 움직임을 통해 상호작용하고 제어할 수 있는 3차원 디스플레이된 멀티미디어와 가상 현실 어플리케이션을 제공하는 것이다.
본 발명의 부가적인 목적과 잇점들은 후속되는 설명으로부터 보다 명확해 질것이며, 본 발명의 실시예에 의해 알게 될 것이다. 본 발명의 목적들과 잇점들은 첨부된 청구항에서 특히 지적된 구성요소와 조합에 의해 실현되고 획득될 것이다.
상기와 같은 본 발명의 목적을 달성하기 위한 본 발명의 시스템 사용자의 카메라-기초 제스쳐 입력을 이용한 3차원 이미지 구축 시스템은 컴퓨터-판독 메모리 수단; 시스템 사용자의 제스쳐와 시스템 사용자 주위의 상호작용 영역을 나타내는 비디오 신호를 생성하는 수단; 시스템 사용자 전방에 위치한 비디오 이미지 디스플레이 수단; 상기 컴퓨터-판독 메모리 수단에 저장된 프로그램에 따라 사용자 신체와 주요 신체 부위의 3차원 위치를 판단하는 비디오 신호 처리 수단을 구비한다. 상기 비디오 신호 처리 수단은 시스템 사용자의 신체와 신체 주요 부위의 3차원 위치에 기초하여 시스템 사용자와 상호작용영역의 3차원 이미지를 비디오 이미지 디스플레이 수단상에 구축하며, 상기 비디오 이미지 디스플레이 수단은 상호작용 영역을 점유하고 있는 것처럼 중복되어 나타나는 3차원 그래픽 물체를 디스플레이하고, 시스템 사용자의 움직임은 비디오 이미지 디스플레이 수단상에 중복되어 3차원으로 디스플레이된 물체의 명확한 움직임을 유발시킨다.
상기 본 발명의 목적을 달성하기 위한 본 발명의 컴퓨터-판독 메모리와 이 메모리에 저장된 프로그램을 이용하여 마이크로프로세서에 연결된 비디오 이미지 디스플레이를 구비한 컴퓨터 시스템의 사용자의 카메라-기초 제스쳐 입력을 이용한 3차원 이미지 구축 방법은 시스템 사용자의 제스쳐와 상기 시스템 사용자를 둘러싼 상호작용 영역을 나타내는 비디오 신호를 생성하는 단계; 시스템 사용자의 신체와 주요 신체 부위의 3차원 위치를 판단하기 위해 마이크로프로세서에서 비디오 신호를 처리하는 단계; 시스템 사용자의 신체와 주요 신체 부위의 3차원 위치를 기초로 비디오 이미지 디스플레이상에 시스템 사용자와 상호작용 영역의 3차원 이미지를 구축하기 위하여 마이크로프로세서를 사용하는 단계; 및 상호작용 영역을 점유한 것처럼 중복되어 나타난 3차원 그래픽 물체를 비디오 이미지 디스플레이상에 디스플레이하기 위하여 마이크로프로세서를 사용하는 단계를 포함한다. 여기에서, 시스템 사용자의 움직임은 비디오 이미지 디스플레이상에 중복되어 3차원으로 디스플레이된 물체의 명확한 움직임을 유발시킨다.
상기 본 발명의 목적을 달성하기 위한 본 발명의 컴퓨터-판독 메모리 장치에 저장된 명령을 이용하여 마이크로프로세서에 연결된 비디오 이미지 디스플레이를 가진 컴퓨터 시스템의 사용자의 카메라-기초 제스쳐 입력을 이용하여 3차원 이미지를 구축하는 프로그램을 저장하는 컴퓨터-판독 메모리 장치는, 시스템 사용자의 신체와 주요 신체 부위의 3차원 위치를 판단하기 위하여 시스템 사용자의 제스쳐를 나타내는 비디오 신호를 처리하는 명령; 시스템 사용자의 신체와 주요 신체 부위의 3차원 위치를 기초로 비디오 이미지 디스플레이상에 시스템 사용자와 상호작용 영역의 3차원 이미지를 구축하는 명령; 및 상호작용 영역을 점유한 것처럼 중복되어 나타난 3차원 그래픽 물체를 비디오 이미지 디스플레이상에 디스플레이하는 명령을 포함한다. 여기에서, 시스템 사용자의 움직임은 비디오 이미지 디스플레이상에 중복되어 3차원으로 디스플레이된 물체의 명확한 움직임을 유발시킨다.
상기 본 발명의 목적을 달성하기 위한 본 발명의 마이크로프로세서에 연결된 비디오 이미지 디스플레이를 가진 컴퓨터 시스템의 사용자의 카메라-기초 제스쳐 입력을 이용한 3차원 이미지를 구축하는 컴퓨터 프로그램은, 시스템 사용자의 신체와 주요 신체 부위의 3차원 위치를 판단하기 위하여 시스템 사용자의 제스쳐를 나타내는 비디오 신호를 처리하는 수단; 시스템 사용자의 신체와 주요 신체 부위의 3차원 위치를 기초로 비디오 이미지 디스플레이상에 시스템 사용자와 상호작용 영역의 3차원 이미지를 구축하는 수단; 및 상호작용 영역을 점유한 것처럼 중복되어 나타난 3차원 그래픽 물체를 비디오 이미지 디스플레이상에 디스플레이하는 수단을 포함한다. 여기에서, 시스템 사용자의 움직임은 비디오 이미지 디스플레이상에 중복되어 3차원으로 디스플레이된 물체의 명확한 움직임을 유발시킨다.
상기 전반적인 설명과 후속되는 상세한 설명은 예를 들어 설명한 것일 뿐 청구된 발명을 제한하지 않는다.
본 발명은 멀티미디어 및 가상 현실 어플리케이션에 관한 것이며, 특히, 카메라-기초 제스쳐 입력을 이용한 3차원 이미지 구축 시스템및 방법에 관한 것이다.
첨부된 도면은 본 발명의 몇가지 실시예를 도시한 것이며 발명의 설명과 함께 본 발명의 원리를 나타낸다.
도1은 사용자의 카메라-기초 실루엣을 이용하여 2차원 이미지를 구축하는 종래의 시스템을 도시한 블럭도.
도2는 사용자의 실루엣을 이용하여 2차원 이미지를 추출하는 종래의 소프트웨어 프로세스에 관련된 단계들을 도시한 공정흐름도.
도3은 본 발명의 일 실시예에 따른 사용자의 카메라-기초 제스쳐 입력을 이용한 3차원 이미지 구축 시스템의 블럭도.
도4는 본 발명의 다른 실시예에 따른 사용자의 카메라-기초 제스쳐 입력을 이용한 3차원 이미지 구축 시스템의 블럭도.
도5는 도3과 도4에 도시된 본 발명의 실시예들에 따라 상호작용 영역내 3차원 위치상에 사용자의 2차원 이미지 특징과 상호작용 영역을 맵핑하는 소프트웨어 프로세스에 연관된 단계를 도시한 공정흐름도.
도6은 도3에 도시된 본 발명의 실시예의 카메라-기초 제스쳐 입력을 이용한 3차원 이미지 구축 시스템및 방법을 이용한 3차원 축구 경기를 도시한 블럭도.
도7은 도6에 도시된 본 발명의 실시예의 카메라-기초 제스쳐 입력을 이용한 3차원 이미지 구축 시스템및 방법을 이용한 3차원 축구 경기에 대한 어플리케이션 프로그램에 연관된 단계를 도시한 공정흐름도.
도8은 신체 높이(H), 즉, 서있는 사람의 키에 대한 비율로서의 신체 부위의 길이를 보여주는 생물측정학적 데이터표.
이하 본 발명의 실시예에 대한 상세한 설명이 이루어질 것이며, 실시예들은 첨부된 도면에 도시되어 있다. 동일 또는 유사한 부분에 대해서는 도면에서 동일한 참조번호들이 사용된다.
바람직한 실시예에 따라, 본 발명은 시스템 사용자의 카메라-기초 제스쳐 입력을 이용한 3차원 이미지 구축 시스템및 방법을 포함한다. 상기 구축 시스템은 컴퓨터-판독 메모리 수단, 시스템 사용자의 제스쳐와 시스템 사용자 주위의 상호작용 영역을 나타내는 비디오 신호를 생성하는 수단, 비디오 이미지 디스플레이 수단을 포함한다. 비디오 이미지 디스플레이 수단은 시스템 사용자의 전방에 위치한다. 또한, 상기 시스템은 상기 컴퓨터-판독 메모리 수단에 저장된 프로그램에 따라 사용자 신체와 주요 신체부위의 3차원 위치를 판단하는 비디오 신호 처리 수단을 구비한다. 상기 비디오 신호 처리 수단은 시스템 사용자의 신체와 신체 주요 부위의 3차원 위치에 기초하여 시스템 사용자와 상호작용 영역의 3차원 이미지를 비디오 이미지 디스플레이 수단상에 구축하며, 상기 비디오 이미지 디스플레이 수단은 상호작용 영역을 점유하고 있는 것처럼 중복되어 나타나는 3차원 그래픽 물체를 디스플레이하고, 시스템 사용자들의 움직임은 비디오 이미지 디스플레이 수단상에 중복되어 3차원으로 디스플레이된 물체의 명확한 움직임을 유발시킨다.
다시 말하면, 본 발명은 시스템 사용자에 의한 컴퓨터 비전 상호작용을 기초로 한 자연스럽고 직관적인 컴퓨터/사용자 인터페이스에 관한 것이다. 여기에서 "컴퓨터 비전"이란 이미지 기기가 어떤 대상물을 관찰하였는가 하는 측면에서 비디오 이미지 기기로부터 수신된 정보를 해석하는 검퓨터의 사용을 의미한다. 컴퓨터 비전은 사용자 제스쳐, 신체 움직임, 머이 움직임, 눈 움직임등의 인식을 가능케 한다. 인식된 사용자 움직임은 멀티미디어와 가상 현실 어플리케이션과의 상호작용을 위해 사용된다. 특히, 본 발명은 시스템 사용자의 실루엣을 2차원 이미지 좌표로 취하여 상호작용 영역에서 시스템 사용자가 점유하는 3차원 이미지 좌표로 투사한다.
이러한 방법은 시스템 사용자에 대해 요구사항도 없고 비용도 많이 들지 않는다. 시스템 사용자가 커다란 스크린 디스플레이를 통해 상호작용하는 경우, 컴퓨터는 시스템 사용자가 검색하고 지정하는 장소등을 알고 있으며, 그에 따라 디스플레이상에 정보를 처리한다. 또한, 디스플레이 스크린 전방에 있는 시스템 사용자의 위치와 포즈는 추출되어 3차원 그래픽 모델과의 상호작용에 사용된다. 본 발명의 컴퓨터 비전 시스템에 제스쳐 해석을 추가하는 것은 컴퓨터와의 상호작용에 현실감을 부여하기 위함이다. 예를 들면, 직관적인 손 제스쳐를 컴퓨터 시스템과의 인터페이스로 사용할 수 있다.
종래의 SGI-기초 소프트웨어를 사용하는 대신에, 본 발명은 도3에 가장 잘 도시된 카메라-기초 사용자 인터페이스 시스템(50)을 이용한다. 시스템(50)은 비디오 카메라(56), 비디오 디스플레이 스크린(54), 필립스 단일 보드 이미지 프로세서(SBIP) 60을 가진 컴퓨터(58)을 구비한다. SBIP 60을 사용하면 앞에서 언급한 MIT의 Media Lab에 의해 제안된 방법에서 제기된 문제들(1)-(3)과 2차원 시스템에서 제기된 문제들을 해결할 있다. 컴퓨터(58)는 3차원 이미지 처리 소프트웨어에 부호화된 컴퓨터-판독 메모리(66)를 포함한다. SBIP 60은 시스템(50)이 시스템 사용자의 3차원 신체 움직임을 처리하도록 소프트웨어를 활용한다. 본 발명의 3차원 이미지처리 소프트웨어는 MIT Media Lab에 의해 제안된 방법에서 제기된 문제들 (4), (5)를 해결한다.
문제(6)을 해결하기 위해서, 본 발명은 MIT에 의해 제안된 "매직 미러" 패러다임이 아닌 몇개의 IVE 패러다임을 평가할 수 있는 상호대화형 비디오 환경(IVE)을 제공한다. 본 발명은 다음의 4가지 IVE 패러다임을 평가할 수 있다. (1) 디스플레이는 원거리 지역의 카메라 입력의 생생한 영상을 보여주며, 시스템 사용자의 비디오 카메라 입력은 디스플레이상의 생생한 영상과 합성된다 (이것은 MIT 방법에서 "미러"효과로 알려져 있다) (2) 디스플레이는 원거리 지역의 생생한 영상을 보여주며, 사용자의 카메라 입력은 디스플레이상의 생생한 영상과 합성되지 않는다 (이것은 "윈도우" 효과로 알려져 있다) (3) 디스플레이는 가상 현실에서와 같이 그래픽 이미지를 보여주며, 시스템 사용자의 카메라 입력은 디스플레이상의 그래픽 이미지와 합성된다 (4) 디스플레이는 그래픽 이미지를 보여주며, 시스템 사용자의 카메라 입력은 디스플레이상의 그래픽 이미지와 합성되지 않는다.
A. 실시예의 시스템 하드웨어의 상세한 설명
본 발명의 실시예로서, 카메라-기초 제스쳐 입력을 이용한 3차원 이미지 구축 시스템및 방법은 도3에 도시되어 있다. 특히, 시스템(50)은 컴퓨터(58)와 같은 비디오 신호 처리 수단을 구비하며, 컴퓨터(58)는 비디오 카메라(56)와 같은 비디오 신호 생성 수단에 전기적으로 연결된다. 컴퓨터(58)는 비디오 디스플레이 스크린(54)과 같은 비디오 이미지 디스플레이 수단에 전기적으로 연결된다. 바람직하게, 비디오 디스플레이 스크린(54)은 시스템 사용자(62)가 서있는 상호작용 영역(52) 전방에 위치한다. 비디오 카메라(56)는 사용자(62)와 상호작용 영역(52)의 이미지를 판독하여 이러한 이미지에 대응하는 비디오 신호를 생성하여 컴퓨터(58)에 제공한다.
바람직하게, 컴퓨터(58)는 IBM-호환 개인용 컴퓨터와 같은 전형적인 마이크로프로세서-기초 컴퓨팅 기기를 구비한다. 또한, 컴퓨터(58)는 비디오 카메라(56)로부터 비디오 신호를 수신하기 위해 마이크로프로세서(60)에 연결되는 직렬 포트(64), 소프트웨어 프로그램에 부호화된 일반적인 컴퓨터-판독 메모리(66)를 구비한다. 바람직하게, 마이크로프로세서(60)는 필립스 단일 보드 이미지 프로세서(SBIP)이다. SBIP(60)는 (아래에 설명된) 컴퓨터 메모리에 부호화되어 사용자(62)와 상호작용 영역(52)의 2차원 이미지 특징을 맵핑하며 상호작용 영역(52)내에서 시스템 사용자(62)의 3차원 위치를 산출하는 소프트웨어를 사용한다. 또한, 바람직하게, SBIP(60)은 컴퓨터-판독 메모리(66)에 영구히 부호화되거나, 예를 들면 플로피 디스크나 CD ROM과 같은 외부 컴퓨터-판독 메모리를 통해 일시적으로 부호화된 응용 프로그램을 사용한다. 또한, 컴퓨터(58)는 원격 제어와 같은 다른 상호작용 제어로부터 데이터를 수신하기 위해 SBIP(60)에 연결된 모드 제어 포트(68), 비디오 디스플레이 스크린(54)에 비디오 신호를 전송하는 비디오 프로세서 포트(70)을 구비한다. 컴퓨터-판독 메모리(66)에 부호화되며 SBIP(60)에 의해 사용된 소프트웨어는 시스템 사용자의 윤곽을 분리하고, 3차원 이미지 공간에서의 사용자의 신체와 손발의 위치를 판단하고, 신체와 손발의 위치에 대응하는 비디오 신호를 비디오 디스플레이 스크린(54)에 생성한다.
바람직하게, 디스플레이 스크린(54)은 3차원 그래픽 정보를 디스플레이하는 종래의 오디오/비주얼 모니터 시스템으로 구성된다. 본 발명에서 사용된 디스플레이 스크린(54)과 비디오 카메라(56)의 유형은 임의적이며 본 발명의 시스템의 의도된 어플리케이션을 근거로 선택한다.
본 발명의 실시예에 따른 카메라-기초 제스쳐 입력을 이용한 3차원 이미지 구축 시스템에서, 비디오 디스플레이 스크린(34)은 Retroscan RS125SW 스크린(y 방향 높이는 6피트, x방향 넓이는 8피트)을 가진 후면-투사 Ikegami TPP 1000/1500 프로젝터이며, 상호작용 영역(52)은 11피트(z 방향), 12피트 (x 방향) 영역으로 비디오 디스플레이 스크린(54) 전방에 있으며, 비디오 카메라(56)는 Sony NTSC 비디오 카메라이다.
본 발명의 다른 실시예에 따른 카메라-기초 제스쳐 입력을 이용한 3차원 이미지 구축 시스템및 방법이 도4에 도시된다. 다른 실시예(80)는 도3의 시스템과 마찬가지로 비디오 카메라(56), SBIP(60)와 컴퓨터-판독 메모리(66)를 가진 컴퓨터(58)를 포함한다. 그러나, 도4의 실시예는 CD ROM상에 부호화된 응용 프로그램을 판독할 수 있고 그러한 응용 프로그램을 SBIP(60)에 제공하는 콤팩트 디스크 판독기(84)를 구비한다. 또한, 이 실시예는 응용 프로그램의 특징을 제어할 원격 콘트롤러(86)을 구비한다. 또한, 도3에 도시된 실시예의 디스플레이 스크린과 달리, 도4의 실시예는 SBIP(60)으로부터 비디오 신호를 수신하고 SBIP(60)으로 정보를 전송하는 종래의 텔레비전 디스플레이(82)를 포함한다.
B. 실시예의 시스템 소프트웨어에 대한 설명
지금부터, 본 발명의 실시예에 따라서, 실시예에 사용되는 응용프로그램뿐만 아니라, 시스템 사용자와 상호작용 영역의 2차원 이미지 특징을 상호작용 영역내에서 3차원 위치로 맵핑하는 소프트웨어를 설명할 것이다. 설명의 편이를 위해, 소프트웨어와 응용프로그램은 단일 시스템 사용자와 관련하여 설명된다. 그러나, 본 발명의 카메라-기초 제스쳐 인식 기술은 각 사용자를 개인적으로 구별하고 그에 따라 각 사용자들과 상호작용하는 방법으로 다수의 사용자들에 대해 사용될 수 있다.
도5는 시스템 사용자(62)의 2차원 이미지 특징을 3차원 위치, 즉, 도3과 도4의 실시예에 따라 시스템 사용자(62)가 위치한 방으로 맵핑하는 소프트웨어 프로세스에 연관된 단계를 도시한 공정흐름도이다. 3차원 이미지처리 소프트웨어는 컴퓨터-판독 메모리(66)에 영구히 부호화되거나, 디스켓, CD ROM 또는 유사 메모리 저장 수단을 통해 메모리(66)에 일시적으로 부호화횐다. 도시한 바와 같이, 3차원 이미지처리 소프트웨어 프로세스는 도2의 2차원 추출 프로세스를 이용하여 이미지 공간 좌표(u,v)로 사용자의 2차원 머리, 손, 팔 특징을 추출하는 단계(100)를 포함한다. 좌표(u,v)는 비디오 카메라(56) 전방의 사용자의 2차원 x-y 평면에 대응한다. 또한, 3차원 이미지처리 프로세스는 방에 관련하여 비디오 카메라(36)의 방향과 위치를 3차원 좌표(x, y, z)로 판독하는 단계(102)를 포함한다. 사용자의 발이 바닥에 있다는 가정하에, 단계(14)에서 소프트웨어 프로세스는 카메라의 뷰 라인을 따라 2차원으로 추출된 사용자의 발 특징을, 방에 대한 카메라(36)의 (x, y, z)방향을 이용하여 사용자의 발의 3차원 좌표(x, y, z)로 투사한다. 단계(106)에서, 머리와 손이 발의 위치로부터 z 방향으로 약간 치우친다고 가정하고 방에 대한 카메라(36)의 (x,y,z) 방향을 이용하여, 소프트웨어 프로세스는 2차원으로 추출된 사용자 머리와 손 특징을 3차원 좌표(x, y, z)로 투사한다.
또한, 3차원 이미지 프로세스는 키(높이)로 인덱스되어 컴퓨터-판독 메모리(66)에 저장된 생물측정학적 데이타(단계110에 도시)에 액서스하기 위해 사용자의 측정된 키를 이용하는 단계(108)를 포함한다. 본 발명에서 사용가능한 생물측정학적 데이터 표의 일예는 도8에 도시된다. D. Chaffin & G. Andersson, Occupational Biomechanics, 2d ed(1991), L. Farkas, Anthropometry of the Head and Face, 2d 3d. (1994), N.A.S.A, Anthropometric Source Book, vols.1-3 (1978)에서 다른 생물측정학적 데이터를 이용할 수 있으므로 본 발명은 도8의 생물측정학적 표에 국한되지 않는다. 3차원 이미지처리 프로세스는 사용자의 어깨가 사용자 머리 정상으로부터 목이 끝나는 지점까지 y방향으로 0.182h의 거리만큼 치우쳤으며, 사용자 등의 중심에서 어깨뼈 끝까지의 어깨 넓이가 x방향으로 0.129h라고 가정한다. 여기에서, h는 사용자의 키이다. 이미지 프로세싱은 또한 사용자의 팔길이가 0.44h라고 가정하며, 0.44h보다 긴 팔길이가 비디오 카메라(56)에 의해 추출될 때까지 이 길이를 사용한다. 또한, 소프트웨어 프로세스는 단계(108)에서 산출된 가정 팔길이(0.44h)를 사용하여, 대응하는 발에서부터 z방향으로 치우친 각 팔의 치우침을 산출하는 단계(112)를 포함한다. 단계(112)에서, 각 팔의 z방향의 실제 길이는 원근의 원리를 이용하여 가정된 팔길이로부터 산출된다. 소프트웨어 프로세스는 사용자 머리, 손, 발의 3차원 위치를 응용 프로그램에 적용하는 단계(114)를 포함한다.
C. 실시예에 사용된 응용 프로그램의 예
본 발명은 카메라-기초 입력을 이용한 3차원 이미지 구축 시스템및 방법에 사용된 응용 프로그램의 아래 예들에 의해 명확해 진다. 응용 프로그램은 본 발명의 실시예들의 일예를 보여주기 위한 것으로서, 본 발명의 광범위한 특징 범위를 제한하지 않는다. 본 발명의 실시예들은 사용자들이 그래픽 컴퓨터-제작 물체를 3차원으로 조정할 수 있도록 사용자의 3차원 위치 산출을 요구하는 모든 응용프로그램에 사용될 수 있다. 응용 프로그램의 예로서 3차원 축구 비디오 게임, 홈쇼핑, 다수 사용자 상호작용을 위한 정보벽, 통신, 제스쳐-기초 원격 제어, 가정용 운동 연습등이 있다.
1. 3차원 축구 비디오 게임
도6은 도3의 실시예의 시스템및 방법을 이용한 3차원 축구 비디오 게임 응용을 도시한 블럭도이다. 축구 경기의 사용자(62)는 가상 축구 경기의 그래픽 이미지가 디스플레이되는 비디오 디스플레이 스크린(54) 전방에 서있다. 비디오 카메라(56)는 사용자(62)를 보며 SBIP(60)는 사용자(62)의 이미지를 추출하고 상기 설명한 바와 같은 사용자 머리, 손, 다리, 발등의 3차원 위치와 같은 사용자 신체 움직임을 식별함으로써 카메라(56)로 부터 수신된 데이터를 처리한다.
비디오 디스플레이 스크린(54)은 사용자(92)와 상호작용 영역(52)의 카메라 이미지를 디스플레이하고, 상호작용 영역(52)과 축구장의 그래픽 오버레이를 디스플레이한다. 스크린(54)은 상호작용 영역(52)의 한측을 향한 바닥상에 골 영역(96)의 그래픽 이미지를 디스플레이하며, 상호작용 영역(52) 중간의 바닥에 축구공(94)의 그래픽 이미지를 디스플레이한다. 바람직하게, 골 영역(96)과 축구공(94)은 바닥상에 있는 것처럼 조정되고 회전된 방법으로 디스플레이된다.
사용자가 그래픽 축구공(94)이 머무르는 상호작용 영역(52)의 일부에 접근하면, 사용자는 축구공(94)을 차는 것처럼 보인다. 본 발명의 시스템은 실제로 "차는" 동작에 대응하지는 않는다. 본 발명의 시스템은 사용자가 축구공(94)을 접근하는 방향과 사용자와 축구공(94)간의 근접성에 대응한다. 축구공(94)은 사용자가 "찬" 축구공(94)에 접근하는 방향과 속도에 좌우되는 속도로 이동한다. 이것은 사용자에 의한 "차는"효과를 시뮬레이션한다. 축구공(94)이 상호작용 영역(52)의 어느 한측, 예를 들면, 디스플레이 스크린(54)의 전방을 건드리면, 시뮬레이션된 후면벽 또는 디스플레이 스크린(54)의 양 사이드패널이 경기영역으로 되돌아간다. 가상 축구 경기의 목적은 골 영역(96)으로 축구공(94)을 넣는 것이다.
도7은 도3의 실시예의 카메라-기초 제스쳐 입력을 이용한 3차원 이미지 구축 시스템 및 방법을 이용한 3차원 축구 경기에 대한 응용 프로그램에 연관된 단계들을 도시한 공정흐름도이다. 도7에서, 가상 축구 경기 응용 프로그램은 단계(200)에서 시작하며, x, y좌표에서의 축구공 위치(f)를 (fx, fz) 좌표로 설정하는 단계(202)를 포함한다. 단계(204)에서, 사용자에 대한 비디오 카메라(56) 위치가 판단되며 사용자의 위치가 도5의 3차원 이미지처리 프로세스에 의해 3차원으로 추출된 이미지 데이터로부터 판독된다. 단계(204)는 축구 경기의 그래픽뷰(즉, 골영역(96)과 축구공(940))가 카메라뷰에 등록되도록 설정하고, 카메라(56)으로부터의 그래픽과 비디오를 루메이킹(두개의 비디오 스트림을 믹스하는 방법)해서 사용자에게 의미있는 그림을 획득한다. 가상 축구 경기 응용 프로그램은 또한 축구공(94)과 골 영역(96)을 디스플레이 스크린(54)의 검은 배경상에 이동시키는 단계(206)를 포함한다. 이때, 루메이커는 단계(204)에서 획득한 비디오를 디스플레이 스크린(54)의 검은 배경으로 입력하도록 설정되며, 루메이킹된 결과는 디스플레이 스크린(54)상에 디스플레이된다.
가상 축구 경기 응용 프로그램은 또한 x, z좌표에서의 사용자의 현재 발위치(p)를 (px, pz)로 측정하는 단계(208)를 포함한다. 단계(210)에서, 현재 발위치(p)와 축구공 위치(f)간의 차이의 절대값, 즉, ??p-f??이 소정의 변수(del)보다 작으면, 사용자의 발 속도(fv)는 k*(p-f)와 같다. 값"k"는 스프링 상수와 같은 스케일링 요소로 실험 결과 1.1이 바람직하다. 값"del"은 축구공으로부터의 발의 위치를 나타내며, 실험 결과 5인치가 바람직하다. 또한, 가상 축구 경기 응용 프로그램은 소정수 만큼, 예를 들어 20회, 반복하여 발 속도(fv)에 따라 공 위치(f)를 이동하는 단계(212)를 포함한다. 단계(212)에서, 발 속도(fv)는 축구공(94)의 속도를 줄이기 위해 1회 반복할 때마다 소정 변수(vdel)만큼 감소한다. 값"vdel"은 1회 반복시마다 10%씩 발 속도를 줄이도록 정해진다. 모든 소정값(k, del, vdel, 반복)은 축구공이 실제 축구공처럼 이동할 수 있도록 설정된다. 단계(212)에서, 축구공(94)가 "벽"을 치면, 즉, 벽으로 설정한 y, 또는 z좌표만큼 이동하면, 축구공(94)은 벽으로부터 튕겨져 나온다. 단계(212)에서, 축구공(94)이 골영역(96)으로 결정된 영역으로 들어가면, 벨 소리가 나며 축구공(94)은 최초 위치로 재설정된다.
2. 홈쇼핑 응용
홈쇼핑 응용 프로그램은 도4의 실시예에 사용될 수 있다. 홈쇼핑 응용 프로그램은 상기 3차원 축구 비디오 게임과 동일한 개념을 이용하나, 축구공이 사용자 제스쳐를 근거로 이동하는 것과 달리, 사용자가 입어보고자 할 때 옷들이 이동한다.
텔레비전 또는 컴퓨터 카타로그를 통한 홈쇼핑이 흔하지 않은 이유는 소비자들이 상품을 입었을 때 어떻게 보이는 지 판단하는것이 어렵기 때문이다. 본 발명의 실시예는 홈쇼핑에서의 이러한 문제들을 해결한다. 홈쇼핑 응용 프로그램은 텔레비전 방송 또는 CD ROM 카타로그를 통해여 판매할 상품들을(셔츠, 신발, 팬츠, 드레스, 모자등) 제안한다. 홈쇼핑 응용에서는 사용자는 텔레비전 앞에 서서 선택한 상품을 입은 자신을 보게 된다. 사용자가 이동하고 돌면, 본 발명의 실시예는 신체 움직임을 판단하고 이에 따른 상품의 컴퓨터-제작 그래픽 이미지를 변형한다. 홈쇼핑 응용에서는 상품의 자동 크기 생성이 가능하다.
3. 다수 사용자 상호작용을 위한 정보벽
정보벽 응용 프로그램은 도3의 실시예의 시스템과 방법을 이용한다. 정보벽은 다수의 사용자들이 상호작용할 수 있는 커다란 게시판과 유사한 디스플레이 스크린으로서 매우 직관적이고 상호작용적인 정보 시스템을 제공한다. 이러한 응용 프로그램은 쇼핑몰, 박물관, 도서관, 갤러리, 기타 유사한 환경에서 유용하다.
예를 들면, 쇼핑몰에서, 정보벽은 쇼핑하는 사람이 벽으로부터 일정 거리내에 서있기만해도 쇼핑몰로 입장할 수 있게한다. 그런 다음, 정보벽은 전방에 서있는 사람의 위치와 키에서 쇼핑몰의 전반적인 안내도를 디스플레이한다. 다수의 정보 아이콘들이 안내도 주위에 디스플레이되고 쇼핑하는 사람은 아이콘을 지적함으로써 선택할 수 있다. 아이콘을 지적하면, 정보벽은 특정 상점및 휴게실등의 위치와 같은 다양한 정보를 디스플레이한다. 또한, 정보벽은 광고의 형태도 지원한다. 예를 들면, 쇼핑하는 사람이 안내도상의 상점을 지적하면 상품및 그 상점의 서비스를 설명하는 간단한 비디오 시퀀스가 디스플레이된다. 또한, 정보벽은 쇼핑하는 사람이 걸을때 디스플레이된 내용이 동행하며 정확한 방향을 가리키도록 하여 쇼핑하는 사람이 원하는 곳으로 이동할 수 있도록 한다.
4. 통신 응용
본 발명의 실시예들은 또한 통신 응용에 사용될 수 있다. 현재, 대역폭 문제로 인해 비디오를 통한 소비자 통신은 방해를 받고있다. 본 발명에서는, 사용자는 실제적인 환경보다는 공용 가상 현실을 통해 통신할 수 있다. 사용자 실루엣의 영상만이 전송되어 가상 환경에서 보여진다. 가상 환경에서, 본 발명의 실시예는 사용자 실루엣을 추출한다. 이러한 방법은 컴퓨터-제작된 신체를 가진 사용자(정확한 위치와 포즈를 취한)를 보여줌으로써 훨씬 간단해 질 수 있으며, 머리 영역의 영상만이 전송된다.
다수 사용자 영상 회의 또한 본 발명에 의해 지원된다. 현재, 사용자는 화상회의의 사용자들에 대해 일일이 선택하고 확대(축소)해야 한다. 본 발명은 참가자들의 제스쳐에 의해 제어되는 카메라를 사용하는 화상회의의 일부로서 사용될 수 있다. 예를 들면, 참가자를 지적하면 카메라는 지적당한 참가자에 촛점이 맞추어지게 하거나, 손을 든 사람에게 카메라 촛점이 맞추어지도록 하는 등의 방법이 있다.
5. 제스쳐-기초 원격 제어
본 발명의 실시예들은 또한 현재 원격 제어 장치에 의해 제공되는 기능들을 대체하여 종합적인 가정 오락및 통신 시스템의 인프라구조의 일부로 사용될 수 있다. 예를 들면, 사용자 신체의 포즈및 제스쳐외에도 방안에서의 사용자의 위치를 본 발명에 의해 액서스할 수 있다. CD 플레이어를 지적하면 텔레비전상에 CD 플레이어에 대한 제어 사항들이 디스플레이되고, 텔레비전상으 메뉴 항목을 지적하여 선택할 수 있다.
방안에 텔레비전(또는 디스플레이)이 한대 이상 있는 경우, 사용자의 위치를 이용하여 어느 텔레비전이 사용될 것인지를 판단한다. 사용자가 한명 이상인 경우, 본 발명은 여러 사용자들로부터 발행된 명령을 분리하거나 서로 다른 명령어에 대한 권한 계층 구조를 구축한다.
또한, 종래의 원격 제어도 본 발명과 함께 사용될 수 있다. 이런 경우, 본 발명은 예를 들면 4개의 버튼만 가지도록 한다든지 하는 방법으로 원격 제어의 기능을 단순화한다. 본 발명을 적용하면, 사용자는 CD 플레이어에서(또는 가까이 서서) 원격 제어를 지적할 수 있으며, 원격 제어는 원거리 CD 플레이어로서의 기능을 한다. 또는, 사용자가 텔레비전앞에 앉아 있고 원격 제어는 채널 변경의 기능을 할 수 있다. 본 발명의 실시예가 원격 제어를 보유한 사용자에게만 대응하는 경우에는 원격 제어는 권한 계층 설정에 사용될 수 있다.
6. 가정용 운동 응용
본 발명의 실시예는 또한 사용자가 자신의 유명 트레이너를 구입하는 경우의 가정용 운동 CD ROM 프로그램 지원에 사용될 수 있다. 본 발명은 트레이너가 항상 사용자 방향으로 바라볼 수 있도록 방안에 있는 사용자의 위치에 대한 정보를 가정용 운동 프로그램에 제공한다. 본 발명은 또한 트레이너가 다른 운동 방법을 추천할 수 있도록 운동중에 사용자가 멈추어야 할 때를 판단한다. 또한 사용자가 운동하는 방법을 트레이너가 평가하고 유용한 정보를 제공할 수 있다.
가정용 운동 응용의 추가적인 특징은 사용자의 비디오 입력을 트레이너의 그래픽-제작 이미지와 결합하고 이둘을 텔레비전상에 디스플레이하는 것이다.(홈쇼핑 응용에서 사용자에게 옷이 디스플레이되는 방법과 유사하다) 이러한 특징은 사용자들이 자신들의 움직임을 직접 볼 수 있도록 하며, 트레이너들이 예를 들면, 다리를 높이 들어라등의 충고를 전하기 위해 사용자의 비디오 이미지중 일부를 지적 또는 터치할 수 있도록 한다.
본 발명의 카메라-기초 제스쳐 입력을 이용한 3차원 이미지 구축 시스템및 방법에서 본 발명의 범위와 정신을 벗어나지 않는 범위내에서 다양한 변형이 가능하다는 것은 통상의 지식을 가진 사람이라면 알 수 있을 것이다. 예를 들면, 본 발명의 시스템및 방법은 이미지와 사용자들의 3차원 구축을 요구하며 사용자와 3차원 이미지간 상호작용을 요구하는 응용 프로그램들에 사용될 수 있다. 또한, 도4의 CD 판독기(84)와 원격 콘트롤러(86)은 도3의 시스템과 함께 사용될 수 있다. 마지막으로, 본 발명의 실시예에 오디오 특징을 병합하여 시스템 사용자의 음성-인식 명령과 디스플레이 스크린에 사운드 효과를 제공할 수 있다.
본 원에 개시된 내용과 실시예를 고려하면 통상의 지식을 가진 사람에게 본 발명의 다른 실시예들도 명확할 것이다. 본문에 다루어진 예들은 후술하는 청구항에 의해 나타나는 본 발명의 진정한 범위와 정신을 가진 단지 예시일 뿐이다.

Claims (11)

  1. 시스템 사용자(62)의 카메라 기초 제스쳐 입력을 이용한 3 차원 이미지 구축 시스템에 있어서,
    컴퓨터-판독 메모리 수단(68),
    시스템 사용자(62)의 제스쳐와 시스템 사용자(62) 주위의 상호작용 영역(52)을 나타내는 비디오 신호(56)를 생성하는 수단,
    시스템 사용자(62) 전방에 위치한 비디오 이미지 디스플레이 수단(54, 82) 및,
    상기 컴퓨터-판독 메모리 수단(68)에 저장된 프로그램에 따라 시스템 사용자(62) 신체와 주요 신체 부위의 3차원 위치를 판단하는 비디오 신호 처리 수단(58)을 구비하며;
    상기 비디오 신호 처리 수단(58)은 시스템 사용자(62)의 신체와 신체 주요 부위의 3차원 위치에 기초하여 시스템 사용자(62)와 상호작용 영역(52)의 3차원 이미지를 비디오 이미지 디스플레이 수단(54, 82)상에 구축하며, 상기 비디오 이미지 디스플레이 수단(54, 82)은 상호작용 영역(52)을 점유하고 있는 것처럼 중복되어 나타나는 3차원 그래픽 물체를 디스플레이하고, 시스템 사용자(62)의 움직임은 비디오 이미지 디스플레이 수단(54, 82)상에 중복되어 3차원으로 디스플레이된 물체의 명확한 움직임을 유발시키는 것을 특징으로 하는 3차원 이미지 구축 시스템.
  2. 제1항에 있어서, 상기 비디오 신호 처리 수단은 시스템 사용자의 발의 2차원 위치(u,v)를 발의 3차원 좌표(x,y,z)로 투사하고(104); 시스템 사용자의 머리와 손이 발의 z위치로부터 이탈한다는 가정하에 시스템 사용자의 머리 또는 손을 3차원 좌표로 맵핑하고(106); 산출된 시스템 사용자의 머리 또는 손의 3차원 위치를 비디오 이미지 디스플레이 수단에 제공하는 것을 특징으로 하는 3차원 이미지 구축 시스템.
  3. 제2항에 있어서, 상기 비디오 신호 처리 수단은 생물측정학적 통계와 함께 시스템 사용자의 키(h)를 이용하여 시스템 사용자의 머리로부터의 어깨 이탈을 산출하고, 시스템 사용자의 팔길이를 산출하며(108, 110); 시스템 사용자의 대응하는 발로부터의 각 팔의 이탈을 산출하는(112) 것을 특징으로 하는 3차원 이미지 구축 시스템.
  4. 제1항 또는 제2항에 있어서, 상기 3차원 그래픽 물체는,
    설정 위치(f)를 가진 축구공(94) 및,
    비디오 이미지 디스플레이 수단상에 설정된 위치를 가진 골 영역(96)을 구비하며;
    비디오 신호 처리 수단이 시스템 사용자의 발 위치(p)를 축구공(94)의 설정 위치(f)와 비교하여 시스템 사용자의 발 속도(fv)를 산출하고, 산출된 발 속도(fv)에 따라 축구공(94)를 이동시키며 소정의 속도로 축구공(94)의 속도를 늦추고, 축구공(94)이 골 영역(96)에 들어가면 벨소리를 내는 것을 특징으로 하는 3차원 이미지 구축 시스템.
  5. 컴퓨터-판독 메모리(66)와, 이 메모리에 저장된 프로그램을 이용하여 마이크로프로세서(58)에 연결된 비디오 이미지 디스플레이(54, 82)를 구비한 컴퓨터 시스템의 사용자(62)의 카메라-기초 제스쳐 입력을 이용한 3차원 이미지 구축 방법에 있어서,
    시스템 사용자(62)의 제스쳐와 상기 시스템 사용자를 둘러싼 상호작용 영역(52)을 나타내는 비디오 신호를 생성하는 단계,
    시스템 사용자(62)의 신체와 주요 신체 부위의 3차원 위치를 판단하기 위해 마이크로프로세서(58)에서 비디오 신호를 처리하는 단계,
    시스템 사용자(62)의 신체와 주요 신체 부위의 3차원 위치를 기초로 비디오 이미지 디스플레이(54, 82)상에 시스템 사용자(62)와 상호작용 영역(52)의 3차원 이미지를 구축하기 위하여 마이크로프로세서(58)를 사용하는 단계 및,
    상호작용 영역을 점유한 것처럼 중복되어 나타난 3차원 그래픽 물체를 비디오 이미지 디스플레이(54, 82)상에 디스플레이하기 위하여 마이크로프로세서(58)를 사용하는 단계를 구비하며;
    상기 시스템 사용자(62)의 움직임은 비디오 이미지 디스플레이상에 중복되어 3차원으로 디스플레이된 물체의 명확한 움직임을 유발시키는 것을 특징으로 하는 3차원 이미지 구축 방법.
  6. 제5항에 있어서,
    시스템 사용자의 2차원 위치(u,v)를 발의 3차원 좌표(x,y,z)로 투사하는 단계(104),
    시스템 사용자의 머리와 손이 발의 z위치로부터 이탈한다는 가정하에 시스템 사용자의 머리및 손을 3차원 좌표로 맵핑하는 단계(106),
    생물측정학적 통계와 함께 시스템 사용자의 키(h)를 이용하여 시스템 사용자의 머리로부터의 어깨 이탈을 산출하고, 시스템 사용자의 팔길이를 산출하는 단계(108, 110),
    시스템 사용자의 대응하는 발로부터의 각 팔의 이탈을 산출하는 단계(112) 및,
    시스템 사용자의 산출된 머리, 손, 발의 3차원 위치를 비디오 이미지 디스플레이에 제공하는 단계를 포함하는 것을 특징으로 하는 3차원 이미지 구축 방법.
  7. 제6항에 있어서, 상기 3차원 그래픽 물체는 설정 위치(f)를 가진 축구공(94), 비디오 이미지 디스플레이상에 설정 위치를 가진 골 영역(96)을 구비하며;
    시스템 사용자의 발 속도(fv)를 산출하기 위하여 시스템 사용자의 발 위치(p)를 축구공의 설정 위치(f)와 비교하는 단계,
    산출된 발 속도(fv)에 따라 축구공(94)을 이동시키며, 소정의 속도로 축구공(94)의 속도를 늦추는 단계 및,
    축구공(94)이 골 영역(96)에 들어가면 벨소리를 내는 단계를 구비하는 것을 특징으로 하는 3차원 이미지 구축 방법.
  8. 컴퓨터-판독 메모리 장치(66)에 저장된 명령을 이용하여 마이크로프로세서(58)에 연결된 비디오 이미지 디스플레이(54, 82)를 가진 컴퓨터 시스템의 사용자(62)의 카메라-기초 제스쳐 입력을 이용한 3차원 이미지를 구축 컴퓨터 시스템에 있어서,
    상기 컴퓨터 시스템은, 시스템 사용자(62)의 신체와 주요 신체 부위의 3차원 위치를 판단하기 위하여 시스템 사용자의 제스쳐를 나타내는 비디오 신호를 처리하는 명령,
    시스템 사용자(62)의 신체와 주요 신체 부위의 3차원 위치를 기초로 비디오 이미지 디스플레이상(54, 82)에 시스템 사용자와 상호작용 영역의 3차원 이미지를 구축하는 명령 및,
    상호작용 영역(52)을 점유한 것처럼 중복되어 나타난 3차원 그래픽 물체를 비디오 이미지 디스플레이상에 디스플레이하는 명령으로 프로그래밍되며;
    상기 시스템 사용자의 움직임은 비디오 이미지 디스플레이상에 중복되어 3차원으로 디스플레이된 물체의 명확한 움직임을 유발시키는 것을 특징으로 하는 컴퓨터 시스템.
  9. 제8항에 있어서, 상기 3차원 이미지를 구축하는 명령은,
    시스템 사용자의 2차원 위치(u,v)를 발의 3차원 좌표(x,y,z)로 투사하는 명령,
    시스템 사용자의 머리와 손이 발의 z위치로부터 이탈한다는 가정하에 시스템 사용자의 머리 또는 손을 3차원 좌표로 맵핑하는 명령,
    시스템 사용자의 산출된 머리, 손, 발의 3차원 위치를 비디오 이미지 디스플레이(114)에 제공하는 명령을 포함하는 것을 특징으로 하는 컴퓨터 시스템.
  10. 제9항에 있어서, 상기 3차원 이미지를 구축하는 명령은 생물측정학적 통계와 함께 시스템 사용자의 키(h)를 이용하여 시스템 사용자의 머리로부터의 어깨 이탈을 산출하고 시스템 사용자의 팔길이를 산출하는 것을 특징으로 하는 컴퓨터 시스템.
  11. 제8항 또는 제9항에 있어서, 상기 3차원 그래픽 물체는 설정 위치(f)를 가진 축구공(94), 비디오 이미지 디스플레이상에 설정 위치를 가진 골 영역(96)을 구비하며;
    상기 컴퓨터-판독 메모리 장치는 시스템 사용자의 발 속도(fv)를 산출하기 위하여 시스템 사용자의 발 위치(p)를 축구공의 설정 위치(f)와 비교하는 명령,
    산출된 발 속도(fv)에 따라 축구공(94)을 이동시키는 명령,
    소정의 속도로 축구공(94)의 속도를 늦추는 명령 및,
    축구공(94)이 골 영역(96)에 들어가면 벨소리를 내는 명령을 부가로 포함하는 것을 특징으로 하는 컴퓨터 시스템.
KR1019997007662A 1997-12-23 1998-12-21 카메라-기반 제스쳐 입력들을 이용하여 3차원 이미지들을 구축하는 시스템 및 방법 KR100650296B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US08/996,677 US6195104B1 (en) 1997-12-23 1997-12-23 System and method for permitting three-dimensional navigation through a virtual reality environment using camera-based gesture inputs
US8/996,677 1997-12-23
US08/996,677 1997-12-23
PCT/IB1998/002092 WO1999034276A2 (en) 1997-12-23 1998-12-21 System and method for constructing three-dimensional images using camera-based gesture inputs

Publications (2)

Publication Number Publication Date
KR20000075601A true KR20000075601A (ko) 2000-12-26
KR100650296B1 KR100650296B1 (ko) 2006-11-28

Family

ID=25543180

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019997007662A KR100650296B1 (ko) 1997-12-23 1998-12-21 카메라-기반 제스쳐 입력들을 이용하여 3차원 이미지들을 구축하는 시스템 및 방법

Country Status (5)

Country Link
US (1) US6195104B1 (ko)
EP (1) EP0960368A2 (ko)
JP (2) JP2001517345A (ko)
KR (1) KR100650296B1 (ko)
WO (1) WO1999034276A2 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9317956B2 (en) 2011-11-14 2016-04-19 Electronics And Telecommunications Research Institute Apparatus and method for providing mixed reality contents for learning through story-based virtual experience
KR102128535B1 (ko) * 2019-11-19 2020-06-30 주식회사 오드래빗미디어 홀로그램을 제공하기 위한 시스템

Families Citing this family (215)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8352400B2 (en) 1991-12-23 2013-01-08 Hoffberg Steven M Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
US6947571B1 (en) 1999-05-19 2005-09-20 Digimarc Corporation Cell phones with optical capabilities, and related applications
US6610917B2 (en) 1998-05-15 2003-08-26 Lester F. Ludwig Activity indication, external source, and processing loop provisions for driven vibrating-element environments
US7904187B2 (en) 1999-02-01 2011-03-08 Hoffberg Steven M Internet appliance system and method
US6753857B1 (en) * 1999-04-16 2004-06-22 Nippon Telegraph And Telephone Corporation Method and system for 3-D shared virtual environment display communication virtual conference and programs therefor
US7261612B1 (en) 1999-08-30 2007-08-28 Digimarc Corporation Methods and systems for read-aloud books
US7760905B2 (en) 1999-06-29 2010-07-20 Digimarc Corporation Wireless mobile phone with content processing
US7406214B2 (en) 1999-05-19 2008-07-29 Digimarc Corporation Methods and devices employing optical sensors and/or steganography
US7224995B2 (en) * 1999-11-03 2007-05-29 Digimarc Corporation Data entry method and system
US8391851B2 (en) 1999-11-03 2013-03-05 Digimarc Corporation Gestural techniques with wireless mobile phone devices
JP2001160959A (ja) * 1999-12-02 2001-06-12 Canon Inc 仮想システムの制御装置及び方法並びに記憶媒体
US6507353B1 (en) 1999-12-10 2003-01-14 Godot Huard Influencing virtual actors in an interactive environment
TW559699B (en) * 2000-01-12 2003-11-01 Sony Corp Image display device and method
US7028269B1 (en) * 2000-01-20 2006-04-11 Koninklijke Philips Electronics N.V. Multi-modal video target acquisition and re-direction system and method
US20010031081A1 (en) * 2000-04-19 2001-10-18 The One Infinite Inc. Mirror to be formed using digital image processing and medium storing program for a computer to perform the processing
US6701357B1 (en) * 2000-04-19 2004-03-02 Toshiba America Information Systems, Inc. Server appliance
US6753879B1 (en) * 2000-07-03 2004-06-22 Intel Corporation Creating overlapping real and virtual images
US6531999B1 (en) 2000-07-13 2003-03-11 Koninklijke Philips Electronics N.V. Pointing direction calibration in video conferencing and other camera-based system applications
US7227526B2 (en) * 2000-07-24 2007-06-05 Gesturetek, Inc. Video-based image control system
DE50014953D1 (de) 2000-08-24 2008-03-20 Siemens Vdo Automotive Ag Verfahren und Navigationsgerät zum Abfragen von Zielinformation und zum Navigieren in einer Kartenansicht
US7007236B2 (en) * 2001-09-14 2006-02-28 Accenture Global Services Gmbh Lab window collaboration
DE10159610B4 (de) * 2001-12-05 2004-02-26 Siemens Ag System und Verfahren zur Erstellung einer Dokumentation von Arbeitsvorgängen, insbesondere im Umfeld Produktion, Montage, Service oder Wartung
US6990639B2 (en) 2002-02-07 2006-01-24 Microsoft Corporation System and process for controlling electronic components in a ubiquitous computing environment using multimodal integration
US7340077B2 (en) * 2002-02-15 2008-03-04 Canesta, Inc. Gesture recognition system using depth perceptive sensors
US10242255B2 (en) 2002-02-15 2019-03-26 Microsoft Technology Licensing, Llc Gesture recognition system using depth perceptive sensors
US9959463B2 (en) 2002-02-15 2018-05-01 Microsoft Technology Licensing, Llc Gesture recognition system using depth perceptive sensors
US7904826B2 (en) * 2002-03-29 2011-03-08 Microsoft Corporation Peek around user interface
US20030227453A1 (en) * 2002-04-09 2003-12-11 Klaus-Peter Beier Method, system and computer program product for automatically creating an animated 3-D scenario from human position and path data
US7161579B2 (en) * 2002-07-18 2007-01-09 Sony Computer Entertainment Inc. Hand-held computer interactive device
US8947347B2 (en) * 2003-08-27 2015-02-03 Sony Computer Entertainment Inc. Controlling actions in a video game unit
US7623115B2 (en) 2002-07-27 2009-11-24 Sony Computer Entertainment Inc. Method and apparatus for light input device
US8797260B2 (en) 2002-07-27 2014-08-05 Sony Computer Entertainment Inc. Inertially trackable hand-held controller
US7646372B2 (en) * 2003-09-15 2010-01-12 Sony Computer Entertainment Inc. Methods and systems for enabling direction detection when interfacing with a computer program
US7102615B2 (en) * 2002-07-27 2006-09-05 Sony Computer Entertainment Inc. Man-machine interface using a deformable device
US7883415B2 (en) 2003-09-15 2011-02-08 Sony Computer Entertainment Inc. Method and apparatus for adjusting a view of a scene being displayed according to tracked head motion
US8160269B2 (en) 2003-08-27 2012-04-17 Sony Computer Entertainment Inc. Methods and apparatuses for adjusting a listening area for capturing sounds
US7627139B2 (en) * 2002-07-27 2009-12-01 Sony Computer Entertainment Inc. Computer image and audio processing of intensity and input devices for interfacing with a computer program
US7803050B2 (en) * 2002-07-27 2010-09-28 Sony Computer Entertainment Inc. Tracking device with sound emitter for use in obtaining information for controlling game program execution
US9393487B2 (en) 2002-07-27 2016-07-19 Sony Interactive Entertainment Inc. Method for mapping movements of a hand-held controller to game commands
US8233642B2 (en) * 2003-08-27 2012-07-31 Sony Computer Entertainment Inc. Methods and apparatuses for capturing an audio signal based on a location of the signal
US8313380B2 (en) * 2002-07-27 2012-11-20 Sony Computer Entertainment America Llc Scheme for translating movements of a hand-held controller into inputs for a system
US8139793B2 (en) * 2003-08-27 2012-03-20 Sony Computer Entertainment Inc. Methods and apparatus for capturing audio signals based on a visual image
US9474968B2 (en) 2002-07-27 2016-10-25 Sony Interactive Entertainment America Llc Method and system for applying gearing effects to visual tracking
US9174119B2 (en) 2002-07-27 2015-11-03 Sony Computer Entertainement America, LLC Controller for providing inputs to control execution of a program when inputs are combined
US8570378B2 (en) 2002-07-27 2013-10-29 Sony Computer Entertainment Inc. Method and apparatus for tracking three-dimensional movements of an object using a depth sensing camera
US7850526B2 (en) * 2002-07-27 2010-12-14 Sony Computer Entertainment America Inc. System for tracking user manipulations within an environment
US7760248B2 (en) 2002-07-27 2010-07-20 Sony Computer Entertainment Inc. Selective sound source listening in conjunction with computer interactive processing
US7918733B2 (en) * 2002-07-27 2011-04-05 Sony Computer Entertainment America Inc. Multi-input game control mixer
US7854655B2 (en) * 2002-07-27 2010-12-21 Sony Computer Entertainment America Inc. Obtaining input for controlling execution of a game program
US8686939B2 (en) * 2002-07-27 2014-04-01 Sony Computer Entertainment Inc. System, method, and apparatus for three-dimensional input control
US9682319B2 (en) * 2002-07-31 2017-06-20 Sony Interactive Entertainment Inc. Combiner method for altering game gearing
US20090143141A1 (en) * 2002-08-06 2009-06-04 Igt Intelligent Multiplayer Gaming System With Multi-Touch Display
US9177387B2 (en) * 2003-02-11 2015-11-03 Sony Computer Entertainment Inc. Method and apparatus for real time motion capture
US7505862B2 (en) * 2003-03-07 2009-03-17 Salmon Technologies, Llc Apparatus and method for testing electronic systems
US8745541B2 (en) 2003-03-25 2014-06-03 Microsoft Corporation Architecture for controlling a computer using hand gestures
US7665041B2 (en) * 2003-03-25 2010-02-16 Microsoft Corporation Architecture for controlling a computer using hand gestures
JP2004334590A (ja) * 2003-05-08 2004-11-25 Denso Corp 操作入力装置
GB0310654D0 (en) * 2003-05-09 2003-06-11 Koninkl Philips Electronics Nv Mirror assembly with integrated display device
MXPA05004610A (es) * 2003-05-14 2005-06-08 Tbs Holding Ag Metodo y dispositivo para el reconocimiento de datos biometricos despues del registro de al menos dos direcciones.
US8072470B2 (en) 2003-05-29 2011-12-06 Sony Computer Entertainment Inc. System and method for providing a real-time three-dimensional interactive environment
US7038661B2 (en) * 2003-06-13 2006-05-02 Microsoft Corporation Pointing device and cursor for use in intelligent computing environments
US20070223732A1 (en) * 2003-08-27 2007-09-27 Mao Xiao D Methods and apparatuses for adjusting a visual image based on an audio signal
JP4425589B2 (ja) * 2003-09-03 2010-03-03 任天堂株式会社 画像生成プログラム、画像生成方法及び画像生成装置
US7874917B2 (en) * 2003-09-15 2011-01-25 Sony Computer Entertainment Inc. Methods and systems for enabling depth and direction detection when interfacing with a computer program
US8287373B2 (en) 2008-12-05 2012-10-16 Sony Computer Entertainment Inc. Control device for communicating visual information
US8323106B2 (en) 2008-05-30 2012-12-04 Sony Computer Entertainment America Llc Determination of controller three-dimensional location using image analysis and ultrasonic communication
US10279254B2 (en) * 2005-10-26 2019-05-07 Sony Interactive Entertainment Inc. Controller having visually trackable object for interfacing with a gaming system
US9573056B2 (en) * 2005-10-26 2017-02-21 Sony Interactive Entertainment Inc. Expandable control device via hardware attachment
US7663689B2 (en) * 2004-01-16 2010-02-16 Sony Computer Entertainment Inc. Method and apparatus for optimizing capture device settings through depth information
US8442331B2 (en) 2004-02-15 2013-05-14 Google Inc. Capturing text from rendered documents using supplemental information
US7707039B2 (en) 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
FI117308B (fi) * 2004-02-06 2006-08-31 Nokia Corp Eleohjausjärjestelmä
US7812860B2 (en) * 2004-04-01 2010-10-12 Exbiblio B.V. Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device
US20060122983A1 (en) * 2004-12-03 2006-06-08 King Martin T Locating electronic instances of documents based on rendered instances, document fragment digest generation, and digest based document fragment determination
US10635723B2 (en) 2004-02-15 2020-04-28 Google Llc Search engines and systems with handheld document data capture devices
US20060041605A1 (en) * 2004-04-01 2006-02-23 King Martin T Determining actions involving captured information and electronic content associated with rendered documents
US20060041484A1 (en) * 2004-04-01 2006-02-23 King Martin T Methods and systems for initiating application processes by data capture from rendered documents
US20060053097A1 (en) * 2004-04-01 2006-03-09 King Martin T Searching and accessing documents on private networks for use with captures from rendered documents
US20050215319A1 (en) * 2004-03-23 2005-09-29 Harmonix Music Systems, Inc. Method and apparatus for controlling a three-dimensional character in a three-dimensional gaming environment
US7990556B2 (en) 2004-12-03 2011-08-02 Google Inc. Association of a portable scanner with input/output and storage devices
US20080313172A1 (en) * 2004-12-03 2008-12-18 King Martin T Determining actions involving captured information and electronic content associated with rendered documents
US20060098900A1 (en) * 2004-09-27 2006-05-11 King Martin T Secure data gathering from rendered documents
US20060081714A1 (en) * 2004-08-23 2006-04-20 King Martin T Portable scanning device
US9143638B2 (en) 2004-04-01 2015-09-22 Google Inc. Data capture from rendered documents using handheld device
US9008447B2 (en) * 2004-04-01 2015-04-14 Google Inc. Method and system for character recognition
WO2008028674A2 (en) 2006-09-08 2008-03-13 Exbiblio B.V. Optical scanners, such as hand-held optical scanners
US20070300142A1 (en) * 2005-04-01 2007-12-27 King Martin T Contextual dynamic advertising based upon captured rendered text
US7894670B2 (en) 2004-04-01 2011-02-22 Exbiblio B.V. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US8081849B2 (en) * 2004-12-03 2011-12-20 Google Inc. Portable scanning and memory device
US8146156B2 (en) 2004-04-01 2012-03-27 Google Inc. Archive of text captures from rendered documents
US9116890B2 (en) 2004-04-01 2015-08-25 Google Inc. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US8713418B2 (en) * 2004-04-12 2014-04-29 Google Inc. Adding value to a rendered document
US8620083B2 (en) 2004-12-03 2013-12-31 Google Inc. Method and system for character recognition
US8489624B2 (en) * 2004-05-17 2013-07-16 Google, Inc. Processing techniques for text capture from a rendered document
US8874504B2 (en) 2004-12-03 2014-10-28 Google Inc. Processing techniques for visual capture data from a rendered document
US7593593B2 (en) * 2004-06-16 2009-09-22 Microsoft Corporation Method and system for reducing effects of undesired signals in an infrared imaging system
JP4005061B2 (ja) 2004-06-30 2007-11-07 株式会社ソニー・コンピュータエンタテインメント 情報処理装置、プログラム、および、情報処理装置におけるオブジェクト制御方法
JP4005060B2 (ja) 2004-06-30 2007-11-07 株式会社ソニー・コンピュータエンタテインメント 情報処理システム、プログラムおよびゲームキャラクタ移動制御方法
US8346620B2 (en) * 2004-07-19 2013-01-01 Google Inc. Automatic modification of web pages
US8560972B2 (en) 2004-08-10 2013-10-15 Microsoft Corporation Surface UI for gesture-based interaction
US8547401B2 (en) 2004-08-19 2013-10-01 Sony Computer Entertainment Inc. Portable augmented reality device and method
KR20060070280A (ko) 2004-12-20 2006-06-23 한국전자통신연구원 손 제스처 인식을 이용한 사용자 인터페이스 장치 및 그방법
CN101137996A (zh) 2005-01-07 2008-03-05 格斯图尔泰克股份有限公司 基于光流的倾斜传感器
WO2006074310A2 (en) * 2005-01-07 2006-07-13 Gesturetek, Inc. Creating 3d images of objects by illuminating with infrared patterns
US8144118B2 (en) * 2005-01-21 2012-03-27 Qualcomm Incorporated Motion-based tracking
US8009871B2 (en) 2005-02-08 2011-08-30 Microsoft Corporation Method and system to segment depth images and to detect shapes in three-dimensionally acquired data
US20080278487A1 (en) * 2005-04-07 2008-11-13 Nxp B.V. Method and Device for Three-Dimensional Rendering
TWI412392B (zh) * 2005-08-12 2013-10-21 Koninkl Philips Electronics Nv 互動式娛樂系統及其操作方法
US8549442B2 (en) 2005-12-12 2013-10-01 Sony Computer Entertainment Inc. Voice and video control of interactive electronically simulated environment
WO2008139251A2 (en) * 2006-04-14 2008-11-20 Patrick Levy Rosenthal Virtual video camera device with three-dimensional tracking and virtual object insertion
US20070265075A1 (en) * 2006-05-10 2007-11-15 Sony Computer Entertainment America Inc. Attachable structure for use with hand-held controller having tracking ability
US20110014981A1 (en) * 2006-05-08 2011-01-20 Sony Computer Entertainment Inc. Tracking device with sound emitter for use in obtaining information for controlling game program execution
US8180114B2 (en) * 2006-07-13 2012-05-15 Northrop Grumman Systems Corporation Gesture recognition interface system with vertical display
US7701439B2 (en) 2006-07-13 2010-04-20 Northrop Grumman Corporation Gesture recognition simulation system and method
US8972902B2 (en) * 2008-08-22 2015-03-03 Northrop Grumman Systems Corporation Compound gesture recognition
US8589824B2 (en) * 2006-07-13 2013-11-19 Northrop Grumman Systems Corporation Gesture recognition interface system
US9696808B2 (en) * 2006-07-13 2017-07-04 Northrop Grumman Systems Corporation Hand-gesture recognition method
US8234578B2 (en) * 2006-07-25 2012-07-31 Northrop Grumman Systems Corporatiom Networked gesture collaboration system
US7907117B2 (en) * 2006-08-08 2011-03-15 Microsoft Corporation Virtual controller for visual displays
US8432448B2 (en) * 2006-08-10 2013-04-30 Northrop Grumman Systems Corporation Stereo camera intrusion detection system
JP5013773B2 (ja) * 2006-08-18 2012-08-29 パナソニック株式会社 車載画像処理装置及びその視点変換情報生成方法
US8310656B2 (en) * 2006-09-28 2012-11-13 Sony Computer Entertainment America Llc Mapping movements of a hand-held controller to the two-dimensional image plane of a display screen
USRE48417E1 (en) 2006-09-28 2021-02-02 Sony Interactive Entertainment Inc. Object direction using video input combined with tilt angle information
US8781151B2 (en) 2006-09-28 2014-07-15 Sony Computer Entertainment Inc. Object detection using video input combined with tilt angle information
US20080147488A1 (en) * 2006-10-20 2008-06-19 Tunick James A System and method for monitoring viewer attention with respect to a display and determining associated charges
JP2010533006A (ja) * 2007-03-01 2010-10-21 ソニー コンピュータ エンタテインメント アメリカ リミテッド ライアビリテイ カンパニー 仮想世界とコミュニケーションを取るためのシステムおよび方法
US20080231926A1 (en) * 2007-03-19 2008-09-25 Klug Michael A Systems and Methods for Updating Dynamic Three-Dimensional Displays with User Input
US20080252596A1 (en) * 2007-04-10 2008-10-16 Matthew Bell Display Using a Three-Dimensional vision System
US20080295035A1 (en) * 2007-05-25 2008-11-27 Nokia Corporation Projection of visual elements and graphical elements in a 3D UI
AU2008299883B2 (en) 2007-09-14 2012-03-15 Facebook, Inc. Processing of gesture-based user interactions
US8638363B2 (en) 2009-02-18 2014-01-28 Google Inc. Automatically capturing information, such as capturing information using a document-aware device
US8139110B2 (en) * 2007-11-01 2012-03-20 Northrop Grumman Systems Corporation Calibration of a gesture recognition interface system
US9377874B2 (en) * 2007-11-02 2016-06-28 Northrop Grumman Systems Corporation Gesture recognition light and video image projector
US8159682B2 (en) 2007-11-12 2012-04-17 Intellectual Ventures Holding 67 Llc Lens system
US9171454B2 (en) * 2007-11-14 2015-10-27 Microsoft Technology Licensing, Llc Magic wand
US8065200B2 (en) 2007-11-26 2011-11-22 International Business Machines Corporation Virtual web store with product images
US8019661B2 (en) 2007-11-26 2011-09-13 International Business Machines Corporation Virtual web store with product images
US8542907B2 (en) * 2007-12-17 2013-09-24 Sony Computer Entertainment America Llc Dynamic three-dimensional object mapping for user-defined control device
JP5684577B2 (ja) * 2008-02-27 2015-03-11 ソニー コンピュータ エンタテインメント アメリカ リミテッド ライアビリテイ カンパニー シーンの深度データをキャプチャし、コンピュータのアクションを適用する方法
US8259163B2 (en) 2008-03-07 2012-09-04 Intellectual Ventures Holding 67 Llc Display with built in 3D sensing
US8253727B2 (en) 2008-03-14 2012-08-28 International Business Machines Corporation Creating a web store using manufacturing data
US8368753B2 (en) 2008-03-17 2013-02-05 Sony Computer Entertainment America Llc Controller with an integrated depth camera
US8233206B2 (en) * 2008-03-18 2012-07-31 Zebra Imaging, Inc. User interaction with holographic images
US8345920B2 (en) * 2008-06-20 2013-01-01 Northrop Grumman Systems Corporation Gesture recognition interface system with a light-diffusive screen
US8847739B2 (en) * 2008-08-04 2014-09-30 Microsoft Corporation Fusing RFID and vision for surface object tracking
US20100031202A1 (en) * 2008-08-04 2010-02-04 Microsoft Corporation User-defined gesture set for surface computing
WO2010023537A1 (en) * 2008-08-26 2010-03-04 Puredepth Limited Improvements in multi-layered displays
WO2010030822A1 (en) * 2008-09-10 2010-03-18 Oblong Industries, Inc. Gestural control of autonomous and semi-autonomous systems
EP2333652B1 (en) * 2008-09-29 2016-11-02 Panasonic Intellectual Property Corporation of America Method and apparatus for improving privacy of users of a display device for several users wherein each user has a private space allocated to him
US20100105479A1 (en) 2008-10-23 2010-04-29 Microsoft Corporation Determining orientation in an external reference frame
US8961313B2 (en) * 2009-05-29 2015-02-24 Sony Computer Entertainment America Llc Multi-positional three-dimensional controller
WO2010105245A2 (en) 2009-03-12 2010-09-16 Exbiblio B.V. Automatically providing content associated with captured information, such as information captured in real-time
US8447066B2 (en) 2009-03-12 2013-05-21 Google Inc. Performing actions based on capturing information from rendered documents, such as documents under copyright
US9250788B2 (en) * 2009-03-18 2016-02-02 IdentifyMine, Inc. Gesture handlers of a gesture engine
US8527657B2 (en) * 2009-03-20 2013-09-03 Sony Computer Entertainment America Llc Methods and systems for dynamically adjusting update rates in multi-player network gaming
US8342963B2 (en) * 2009-04-10 2013-01-01 Sony Computer Entertainment America Inc. Methods and systems for enabling control of artificial intelligence game characters
GB2470072B (en) 2009-05-08 2014-01-01 Sony Comp Entertainment Europe Entertainment device,system and method
US8393964B2 (en) 2009-05-08 2013-03-12 Sony Computer Entertainment America Llc Base station for position location
US8142288B2 (en) 2009-05-08 2012-03-27 Sony Computer Entertainment America Llc Base station movement detection and compensation
US9417700B2 (en) * 2009-05-21 2016-08-16 Edge3 Technologies Gesture recognition systems and related methods
US20110107216A1 (en) * 2009-11-03 2011-05-05 Qualcomm Incorporated Gesture-based user interface
US8843857B2 (en) 2009-11-19 2014-09-23 Microsoft Corporation Distance scalable no touch computing
US9081799B2 (en) 2009-12-04 2015-07-14 Google Inc. Using gestalt information to identify locations in printed information
US9323784B2 (en) 2009-12-09 2016-04-26 Google Inc. Image search using text-based elements within the contents of images
US9098873B2 (en) * 2010-04-01 2015-08-04 Microsoft Technology Licensing, Llc Motion-based interactive shopping environment
US9646340B2 (en) 2010-04-01 2017-05-09 Microsoft Technology Licensing, Llc Avatar-based virtual dressing room
US8396252B2 (en) 2010-05-20 2013-03-12 Edge 3 Technologies Systems and related methods for three dimensional gesture recognition in vehicles
JP2012000165A (ja) * 2010-06-14 2012-01-05 Sega Corp ビデオゲーム装置
US8296151B2 (en) * 2010-06-18 2012-10-23 Microsoft Corporation Compound gesture-speech commands
US8655093B2 (en) 2010-09-02 2014-02-18 Edge 3 Technologies, Inc. Method and apparatus for performing segmentation of an image
US8666144B2 (en) 2010-09-02 2014-03-04 Edge 3 Technologies, Inc. Method and apparatus for determining disparity of texture
US8582866B2 (en) 2011-02-10 2013-11-12 Edge 3 Technologies, Inc. Method and apparatus for disparity computation in stereo images
US8467599B2 (en) 2010-09-02 2013-06-18 Edge 3 Technologies, Inc. Method and apparatus for confusion learning
US9304592B2 (en) * 2010-11-12 2016-04-05 At&T Intellectual Property I, L.P. Electronic device control based on gestures
US8970589B2 (en) 2011-02-10 2015-03-03 Edge 3 Technologies, Inc. Near-touch interaction with a stereo camera grid structured tessellations
US9672609B1 (en) 2011-11-11 2017-06-06 Edge 3 Technologies, Inc. Method and apparatus for improved depth-map estimation
US8811938B2 (en) 2011-12-16 2014-08-19 Microsoft Corporation Providing a user interface experience based on inferred vehicle state
US9679215B2 (en) 2012-01-17 2017-06-13 Leap Motion, Inc. Systems and methods for machine control
US8638989B2 (en) 2012-01-17 2014-01-28 Leap Motion, Inc. Systems and methods for capturing motion in three-dimensional space
US9501152B2 (en) 2013-01-15 2016-11-22 Leap Motion, Inc. Free-space user interface and control using virtual constructs
US9070019B2 (en) 2012-01-17 2015-06-30 Leap Motion, Inc. Systems and methods for capturing motion in three-dimensional space
US8693731B2 (en) 2012-01-17 2014-04-08 Leap Motion, Inc. Enhanced contrast for object detection and characterization by optical imaging
US10691219B2 (en) 2012-01-17 2020-06-23 Ultrahaptics IP Two Limited Systems and methods for machine control
US11493998B2 (en) 2012-01-17 2022-11-08 Ultrahaptics IP Two Limited Systems and methods for machine control
JP6018707B2 (ja) 2012-06-21 2016-11-02 マイクロソフト コーポレーション デプスカメラを使用するアバター構築
CA2882453C (en) 2012-08-27 2021-07-20 Universite Du Quebec A Chicoutimi Method to determine physical properties of the ground, foot-worn sensor therefore, and method to advise a user of a risk of falling based thereon
US9285893B2 (en) 2012-11-08 2016-03-15 Leap Motion, Inc. Object detection and tracking with variable-field illumination devices
US10609285B2 (en) 2013-01-07 2020-03-31 Ultrahaptics IP Two Limited Power consumption in motion-capture systems
US9465461B2 (en) 2013-01-08 2016-10-11 Leap Motion, Inc. Object detection and tracking with audio and optical signals
US10042510B2 (en) 2013-01-15 2018-08-07 Leap Motion, Inc. Dynamic user interactions for display control and measuring degree of completeness of user gestures
US9459697B2 (en) 2013-01-15 2016-10-04 Leap Motion, Inc. Dynamic, free-space user interactions for machine control
US9702977B2 (en) 2013-03-15 2017-07-11 Leap Motion, Inc. Determining positional information of an object in space
US10721448B2 (en) 2013-03-15 2020-07-21 Edge 3 Technologies, Inc. Method and apparatus for adaptive exposure bracketing, segmentation and scene organization
US10620709B2 (en) 2013-04-05 2020-04-14 Ultrahaptics IP Two Limited Customized gesture interpretation
US9916009B2 (en) 2013-04-26 2018-03-13 Leap Motion, Inc. Non-tactile interface systems and methods
US9747696B2 (en) 2013-05-17 2017-08-29 Leap Motion, Inc. Systems and methods for providing normalized parameters of motions of objects in three-dimensional space
US10281987B1 (en) 2013-08-09 2019-05-07 Leap Motion, Inc. Systems and methods of free-space gestural interaction
US9721383B1 (en) 2013-08-29 2017-08-01 Leap Motion, Inc. Predictive information for free space gesture control and communication
US9632572B2 (en) 2013-10-03 2017-04-25 Leap Motion, Inc. Enhanced field of view to augment three-dimensional (3D) sensory space for free-space gesture interpretation
CN103593519B (zh) * 2013-10-31 2016-05-04 中国运载火箭技术研究院 一种基于试验设计的运载火箭总体参数优化方法
US9996638B1 (en) 2013-10-31 2018-06-12 Leap Motion, Inc. Predictive information for free space gesture control and communication
US9613262B2 (en) 2014-01-15 2017-04-04 Leap Motion, Inc. Object detection and tracking for providing a virtual device experience
CN204480228U (zh) 2014-08-08 2015-07-15 厉动公司 运动感测和成像设备
US20160092034A1 (en) * 2014-09-26 2016-03-31 Amazon Technologies, Inc. Kiosk Providing High Speed Data Transfer
US10237329B1 (en) 2014-09-26 2019-03-19 Amazon Technologies, Inc. Wirelessly preparing device for high speed data transfer
KR20170116437A (ko) * 2016-04-11 2017-10-19 전자부품연구원 스키 시뮬레이터에서 사용자 자세 인식 장치 및 그 방법
CN107024981B (zh) 2016-10-26 2020-03-20 阿里巴巴集团控股有限公司 基于虚拟现实的交互方法及装置
KR102395030B1 (ko) * 2017-06-09 2022-05-09 한국전자통신연구원 가상 콘텐츠 원격 제어 방법 및 이를 위한 장치
US10653957B2 (en) * 2017-12-06 2020-05-19 Universal City Studios Llc Interactive video game system
US11132479B1 (en) 2017-12-29 2021-09-28 II John Tyson Augmented reality system for component assembly and archival baseline clone
US11486697B1 (en) 2017-12-29 2022-11-01 II John Tyson Optical structural health monitoring
US11875012B2 (en) 2018-05-25 2024-01-16 Ultrahaptics IP Two Limited Throwable interface for augmented reality and virtual reality environments
US11938390B2 (en) 2019-06-21 2024-03-26 Matthew Moran Sports ball training or simulating device
US11040262B2 (en) 2019-06-21 2021-06-22 Matthew Moran Sports ball training or simulating device
WO2022146169A1 (en) * 2020-12-30 2022-07-07 Ringcentral, Inc., (A Delaware Corporation) System and method for noise cancellation

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3244798B2 (ja) * 1992-09-08 2002-01-07 株式会社東芝 動画像処理装置
JP2534617B2 (ja) 1993-07-23 1996-09-18 株式会社エイ・ティ・アール通信システム研究所 人物像の実時間認識合成方法
US5347306A (en) * 1993-12-17 1994-09-13 Mitsubishi Electric Research Laboratories, Inc. Animated electronic meeting place
US5714997A (en) 1995-01-06 1998-02-03 Anderson; David P. Virtual reality television system
US5594469A (en) * 1995-02-21 1997-01-14 Mitsubishi Electric Information Technology Center America Inc. Hand gesture machine control system
US6014472A (en) * 1995-11-14 2000-01-11 Sony Corporation Special effect device, image processing method, and shadow generating method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9317956B2 (en) 2011-11-14 2016-04-19 Electronics And Telecommunications Research Institute Apparatus and method for providing mixed reality contents for learning through story-based virtual experience
KR102128535B1 (ko) * 2019-11-19 2020-06-30 주식회사 오드래빗미디어 홀로그램을 제공하기 위한 시스템

Also Published As

Publication number Publication date
WO1999034276A2 (en) 1999-07-08
WO1999034276A3 (en) 1999-09-02
JP2001517345A (ja) 2001-10-02
JP2009037594A (ja) 2009-02-19
KR100650296B1 (ko) 2006-11-28
EP0960368A2 (en) 1999-12-01
US6195104B1 (en) 2001-02-27

Similar Documents

Publication Publication Date Title
KR100650296B1 (ko) 카메라-기반 제스쳐 입력들을 이용하여 3차원 이미지들을 구축하는 시스템 및 방법
US6181343B1 (en) System and method for permitting three-dimensional navigation through a virtual reality environment using camera-based gesture inputs
KR100963238B1 (ko) 개인화 및 협업을 위한 테이블탑-모바일 증강현실 시스템과증강현실을 이용한 상호작용방법
US9550124B2 (en) Projection of an interactive environment
US8072470B2 (en) System and method for providing a real-time three-dimensional interactive environment
Starner et al. The perceptive workbench: Computer-vision-based gesture tracking, object tracking, and 3D reconstruction for augmented desks
US11471775B2 (en) System and method for providing a computer-generated environment
WO2022259253A1 (en) System and method for providing interactive multi-user parallel real and virtual 3d environments
JP3341734B2 (ja) 映像表示装置
Balcisoy et al. Interaction between real and virtual humans in augmented reality
CN115624740A (zh) 一种虚拟现实设备及其控制方法、装置、系统及互动系统
Pinhanez Creating ubiquitous interactive games using everywhere displays projectors
KR100607046B1 (ko) 체감형 게임용 화상처리 방법 및 이를 이용한 게임 방법
KR102622709B1 (ko) 2차원 영상에 기초하여 3차원 가상객체를 포함하는 360도 영상을 생성하는 방법 및 장치
JP2001319108A (ja) リクレーション、ショッピング、ビジネスモデル
Klinker et al. Optically based direct manipulation for augmented reality
Peer et al. Art–A Perfect Testbed for Computer Vision Related Research
JP2000039949A (ja) 映像表示装置
Mukhaimar et al. Multi-person tracking for virtual reality surrounding awareness
Yonemoto et al. Projection Mapping of Animation by Object Recognition
von Tenspolde et al. Painting with the Watching Window: Design and Implementation of
CN114840088A (zh) 基于空间增强现实的实物交互象棋装置及交互方法
CN112245910A (zh) 一种基于Quest头显的建模、极限运动方法和系统
Orvalho Sketch-based Facial Modeling and Animation: an approach based on mobile devices

Legal Events

Date Code Title Description
A201 Request for examination
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
E902 Notification of reason for refusal
B701 Decision to grant
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee