KR20230025914A

KR20230025914A - 음성 및 텍스트 캡션들을 사용한 증강 현실 경험들

Info

Publication number: KR20230025914A
Application number: KR1020237002921A
Authority: KR
Inventors: 일테리스 캔버크; 신훈 강; 다니엘 모레노
Original assignee: 스냅 인코포레이티드
Priority date: 2020-06-29
Filing date: 2021-06-04
Publication date: 2023-02-23
Also published as: CN115917498A; US20240296633A1; US11995774B2; US20210407203A1; EP4172726A1; WO2022005693A1; WO2022005693A8

Abstract

포지션 검출 시스템 및 디스플레이 시스템을 포함하는 안경류 디바이스를 사용한 증강 현실 경험들이 제공된다. 안경류 디바이스는 사용자 입력, 데이터 입력 또는 음성 인식 시스템으로부터 텍스트를 획득한다. 안경류 디바이스는 디스플레이 시스템에 의해 디스플레이 상에서 안경류에 대해 미리 정의된 로케이션에 시각적 텍스트 그래픽을 제시한다. 안경류 디바이스는 사용자가 다양한 방식들로 시각적 텍스트 그래픽들을 조작할 수 있게 한다.

Description

음성 및 텍스트 캡션들을 사용한 증강 현실 경험들

[0001] 본 출원은 2020년 6월 29일에 출원된 미국 가출원 일련 번호 제63/045,537호 및 2020년 12월 18일에 출원된 미국 출원 일련 번호 제17/126,207호에 대해 우선권을 주장하며, 이들 출원들 둘 모두의 내용들은 인용에 의해 본원에 완전히 통합된다.

[0002] 본 개시내용에 제시된 예들은 증강 현실(AR) 분야 및 웨어러블 모바일 디바이스들, 이를테면 안경류 디바이스들에 관한 것이다. 더 구체적으로 그러나 제한 없이, 본 개시내용은 음성, 텍스트 캡처들 또는 둘 모두를 활용하는 증강 현실 경험들을 제공하기 위해 가상 이미지들과의 사용자 인터랙션을 설명한다.

[0003] 오늘날 이용 가능한 많은 타입들의 컴퓨터들 및 전자 디바이스들, 이를테면 모바일 디바이스들(예컨대, 스마트폰들, 태블릿들 및 랩톱들), 핸드헬드 디바이스들, 및 웨어러블 디바이스들(예컨대, 스마트 안경, 디지털 안경류, 헤드웨어, 헤드기어 및 머리-장착 디스플레이들)은 다양한 카메라들, 센서들, 무선 트랜시버들, 입력 시스템들(예컨대, 터치-감지 표면들, 포인터들), 주변 디바이스들, 디스플레이들 및 사용자가 디스플레이된 콘텐츠와 상호 작용할 수 있게 하는 그래픽 사용자 인터페이스(GUI)들을 포함한다.

[0004] 증강 현실(AR)은 물리적 환경의 실제 객체들을 객체들과 결합하여 이 결합을 사용자에게 디스플레이한다. 결합된 디스플레이는 특히 객체들이 실제 객체들 처럼 나타나고 행동할 때 객체들이 물리적 환경에 진정으로 존재한다는 인상을 준다.

[0005] 진보된 AR 기술들, 이를테면 컴퓨터 비전 및 객체 추적은 지각적으로 풍부하고 몰입적인 경험을 생성하는 데 사용될 수 있다. 컴퓨터 비전 알고리즘들은 디지털 이미지들 또는 비디오에 캡처된 데이터로부터 물리적 세계에 대한 3차원 데이터를 추출한다. 객체 인식 및 추적 알고리즘들은 디지털 이미지 또는 비디오에서 객체를 검출하고, 객체의 배향 또는 포즈를 추정하며, 그리고 시간에 따른 객체의 이동을 추적하기 위해 사용될 수 있다.

[0006] 설명된 다양한 예들의 특징들은 도면들을 참조하는 이하의 상세한 설명으로부터 용이하게 이해될 것이다. 상세한 설명에서 그리고 도면의 여러 도면들 전반에 걸쳐 각각의 엘리먼트에 대해 참조 부호가 사용된다. 복수의 유사한 엘리먼트들이 존재할 때, 소문자를 추가하여 특정 엘리먼트들을 지칭하면서, 유사한 엘리먼트들에 단일 참조 부호가 할당될 수 있다.
[0007] 도면들에 도시된 다양한 엘리먼트들은 달리 표시하지 않는 한 실척대로 도시되지는 않는다. 다양한 엘리먼트들의 치수들은 명확성을 위해 확대되거나 또는 축소될 수 있다. 여러 도면들은 하나 이상의 구현들을 묘사하며, 단지 예로서 제시되며 제한으로서 해석되지 않아야 한다. 도면들에는 이하의 도면들이 포함된다.
[0008] 도 1a는 증강 현실 생성 시스템에서 사용하기에 적합한 안경류 디바이스의 예시적인 하드웨어 구성의 측면도(우측)이다.
[0009] 도 1b는 우측 가시광 카메라 및 회로 보드를 묘사한, 도 1a의 안경류 디바이스의 우측 코너의 부분 사시 단면도이다.
[0010] 도 1c는 좌측 가시광 카메라를 도시하는, 도 1a의 안경류 디바이스의 예시적인 하드웨어 구성의 측면도(좌측)이다.
[0011] 도 1d는 좌측 가시광 카메라 및 회로 보드를 묘사한, 도 1c의 안경류 디바이스의 좌측 코너의 부분 사시 단면도이다.
[0012] 도 2a 및 도 2b는 증강 현실 생성 시스템에서 활용되는 안경류 디바이스의 예시적인 하드웨어 구성들의 배면도들이다.
[0013] 도 3은 3차원 장면, 좌측 가시광 카메라에 의해 캡처된 좌측 원시 이미지 및 우측 가시광 카메라에 의해 캡처된 우측 원시 이미지의 개략도이다.
[0014] 도 4는 다양한 네트워크들을 통해 연결된 서버 시스템 및 웨어러블 디바이스(예컨대, 안경류 디바이스)를 포함하는 예시적인 증강 현실 생성 시스템의 기능 블록도이다.
[0015] 도 5는 도 4의 증강 현실 생성 시스템의 모바일 디바이스에 대한 예시적인 하드웨어 구성의 개략도이다.
[0016] 도 6은 동시 로컬리제이션 및 매핑을 설명할 때 사용하기 위한 예시적인 환경에서의 사용자의 개략도이다.
[0017] 도 7은 시각적 텍스트 그래픽들을 생성하는 것 및 시각적 텍스트 그래픽을 디스플레이 상의 물리적 환경의 미리 정의된 로케이션에 제시하는 것을 수반하는 예시적인 방법의 단계들을 나열한 순서도이다.
[0018] 도 8은 디스플레이 상에 시각적 텍스트 그래픽들을 제시하는 것 및 사용자로부터의 입력에 응답하여 시각적 텍스트 그래픽의 속성들 중 하나 이상을 정의된 로케이션으로 변경하는 것을 포함하는 예시적인 방법의 단계들을 나열한 순서도이다.
[0019] 도 9는 사용자의 시선 방향, 사용자로부터의 다른 입력, 또는 이들의 조합에 응답하여 디스플레이의 미리 정의된 로케이션에 시각 텍스트 그래픽을 세팅하는 것을 포함하는 예시적인 방법의 단계들을 나열한 순서도이다.
[0020] 도 10a 및 도 10b는 시각적 텍스트 그래픽들을 사용하는 가상 증강 현실 경험의 사시도들이다.
[0021] 도 11a, 도 11b 및 도 11c는 시각적 텍스트 그래픽들을 사용하고 시각적 텍스트 그래픽의 속성들 중 하나 이상을 변경하는 가상 증강 현실 경험의 사시도들이다.
[0022] 도 12a 및 도 12b는 시각적 텍스트 그래픽들을 사용하고 사용자의 시선 방향, 사용자로부터의 입력 또는 이들의 조합에 응답하여 디스플레이의 미리 정의된 로케이션에 시각적 텍스트 그래픽을 세팅하는 가상 증강 현실 경험의 사시도들이다.
[0023] 도 13a 및 도 13b는 마이크폰를 포함하고 마이크폰을 통해 수신된 음성을 인식하도록 구성된 디바이스를 사용하는 가상 증강 현실 경험의 사시도들이며, 인식된 음성은 디스플레이 상에 시각적 텍스트 그래픽들로서 디스플레이되는 변환된 텍스트이다.

[0024] 시각적 텍스트 그래픽들 및 음성 인식을 사용한 증강 현실 경험들을 위한 시스템을 포함하는 예들을 참조하여 다양한 구현들 및 세부사항들이 설명된다. 안경류 디바이스는 음성을 텍스트로 변환하거나 또는 다른 방식으로 텍스트를 획득하는 기능을 포함한다. 텍스트는 키패드와 같은 사용자로부터 또는 원격 데이터 연결(즉, 인터넷 또는 브로드밴드 네트워크)을 통한 다른 사용자들로부터, 또는 안경류 디바이스 내의 음성 인식 모듈로부터 타이핑 액세서리를 사용하여 획득될 수 있다. 안경류 디바이스는 안경류를 통해 사용자에게 보이는, 안경류에 대해 미리 정의된 로케이션에 텍스트를 제시하는 기능을 포함할 수 있다. 예컨대, 안경류를 통해 보이는 이미지의 텍스트를 말하는 주체 근처에 위치한 캡션에 텍스트가 나타날 수 있다. 안경류 디바이스는 시선 방향 또는 손 제스처들을 변경함으로써 이미지에서 텍스트 또는 텍스트 캡션을 이동하는 기능을 포함할 수 있다. 안경류 디바이스는 안경류 디바이스에 의해 저장되거나 또는 송신될 텍스트 또는 텍스트 캡션을 포함하는 이미지를 캡처하는 기능을 포함할 수 있다.

[0025] 이하의 상세한 설명은 본 개시내용에 제시된 예들을 예시하는 시스템들, 방법들, 기법들, 명령 시퀀스들, 및 컴퓨팅 머신 프로그램 제품들을 포함한다. 개시된 청구대상 및 이의 관련 교시들의 완전한 이해를 제공하기 위한 다수의 세부사항들 및 예들이 포함된다. 그러나, 당업자는 이러한 세부사항들 없이 관련 교시들을 적용하는 방법을 이해할 수 있다. 개시된 청구대상의 양상들은 관련 교시들이 다양한 방식들로 적용되거나 실시될 수 있기 때문에 설명된 특정 디바이스들, 시스템들 및 방법으로 제한되지 않는다. 본원에서 사용되는 용어 및 명명법은 오직 특정 양상들을 설명하기 위한 목적이며, 제한으로 의도되지 않는다. 일반적으로, 잘 알려진 명령 인스턴스들, 프로토콜들, 구조들 및 기법들은 반드시 상세히 도시되지는 않는다.

[0026] 본원에서 사용되는 "커플링된” 또는 "연결된"이라는 용어들은 하나의 시스템 엘리먼트에 의해 생성되거나 공급되는 전기 또는 자기 신호들이 다른 커플링되거나 연결된 시스템 엘리먼트에 전달되게 하는 링크 등을 포함하여, 임의의 논리적, 광학적, 물리적 또는 전기적 연결부를 지칭한다. 달리 설명되지 않는 한, 커플링된 또는 연결된 엘리먼트들 또는 디바이스들은 반드시 서로 직접 연결되는 것은 아니며, 중간 컴포넌트들, 엘리먼트들 또는 통신 매체들에 의해 분리될 수 있으며, 이들 중 하나 이상은 전기 신호들을 수정, 조작 또는 반송할 수 있다. “상에”라는 용어는 엘리먼트에 의해 직접 지지되는 것 또는 엘리먼트에 통합되거나 그에 의해 지지되는 다른 엘리먼트를 통해 엘리먼트에 의해 간접적으로 지지되는 것을 의미한다.

[0027] "근접"이라는 용어는 객체 또는 사람 근처에, 이에 인접하게 또는 이 옆에 배치되거나; 또는 "말단"으로서 설명될 수 있는 아이템의 다른 부분들에 대해 더 근접한 아이템 또는 아이템의 부분을 설명하기 위해 사용된다. 예컨대, 객체에 가장 가까운 아이템의 끝은 근위 끝으로 지칭될 수 있는 반면에, 일반적으로 반대 끝은 말단 끝으로서 지칭될 수 있다.

[0028] 도면들 중 임의의 도면에 도시된 바와 같은, 카메라, 관성 측정 유닛 또는 이들 둘 모두를 통합한 안경류 디바이스, 다른 모바일 디바이스들, 연관된 컴포넌트들 및 임의의 다른 디바이스들의 배향들은 예시 및 논의 목적들을 위해 단지 예로서 주어진다. 동작 시에, 안경류 디바이스는 안경류 디바이스의 특정한 애플리케이션에 적합한 임의의 다른 방향으로, 예컨대, 위, 아래, 옆으로, 또는 임의의 다른 배향으로 배향될 수 있다. 또한, 본원에 사용되는 범위까지, 앞, 뒤, 내향, 외향, 쪽으로, 좌측, 우측, 측방향, 종방향, 위, 아래, 상부, 하부, 최상부, 최하부, 측면, 수평, 수직 및 대각과 같은 임의의 방향성 용어는 단지 예시의 방식으로 사용되며, 구성된 또는 본원에 달리 설명된 임의의 카메라 또는 관성 측정 유닛의 방향 또는 배향으로 제한되지 않는다.

[0029] 예들의 추가적인 목적들, 이점들 및 신규 특징들은 하기 설명에서 부분적으로 제시될 것이고, 부분적으로, 이하의 그리고 첨부된 도면들의 검토 시에 당업자들에게 자명해질 것이거나, 또는 예들의 생산 또는 동작에 의해 학습될 수 있다. 본 발명의 청구대상의 목적들 및 장점들은 특히 첨부된 청구항들에서 적시된 방법론들, 기구들 및 이들의 조합들에 의해 실현 및 달성될 수 있다.

[0030] 이제, 첨부된 도면들에서 예시되고 아래에서 논의되는 예들이 상세히 참조된다.

[0031] 도 1a는 터치-감지 입력 디바이스 또는 터치패드(181)를 포함하는 안경류 디바이스(100)의 예시적인 하드웨어 구성의 측면도(우측)이다. 도시된 바와 같이, 터치패드(181)는 이해하기 어려우며 용이하게 쉽게 보여지지 않는 경계를 가질 수 있으며; 대안적으로, 경계는 명백하게 보일 수 있거나, 또는 터치패드(181)의 로케이션 및 경계에 대한 피드백을 사용자에게 제공하는 상승된 또는 그렇지 않으면 촉각적인 에지를 포함할 수 있다. 다른 구현들에서, 안경류 디바이스(100)는 좌측에 터치패드를 포함할 수 있다.

[0032] 터치패드(181)의 표면은, 사용자가 메뉴 옵션들을 통해 내비게이팅하여 직관적인 방식으로 메뉴 옵션들을 선택할 수 있게 하도록, 이미지 디스플레이 상에서 안경류 디바이스에 의해 디스플레이되는 GUI와 함께 사용하기 위한 손가락 터치들, 탭들 및 제스처들 (예컨대, 이동 터치들)을 검출하도록 구성되며, 이는 사용자 경험을 향상시키고 단순화시킨다.

[0033] 터치패드(181) 상의 손가락 입력들의 검출은 여러 기능들을 가능하게 할 수 있다. 예컨대, 터치패드(181)의 임의의 위치를 터치하면, GUI가 이미지 디스플레이 상에 아이템을 디스플레이하거나 또는 강조할 수 있으며, 이는 광학 조립체들(180A, 180B) 중 적어도 하나에 투사될 수 있다. 터치패드(181) 상의 더블 태핑은 아이템 또는 아이콘을 선택할 수 있다. 특정 방향으로 (예컨대, 앞에서 뒤로, 뒤에서 앞으로, 위에서 아래로 또는 아래에서 위로) 손가락을 슬라이딩하거나 또는 스와이핑하면, 아이템들 또는 아이콘들이 특정 방향으로 슬라이딩되거나 또는 스크롤링되게 할 수 있으며; 예컨대, 다음 아이템, 아이콘, 비디오, 이미지, 페이지 또는 슬라이드로 이동되게 할 수 있다. 손가락을 다른 방향으로 슬라이딩하면, 반대 방향으로 슬라이딩 또는 스크롤링되게 할 수 있으며; 예컨대 이전 아이템, 아이콘, 비디오, 이미지, 페이지 또는 슬라이드로 이동되게 할 수 있다. 터치패드(181)는 안경류 디바이스(100)의 사실상 임의의 위치일 수 있다.

[0034] 일례에서, 터치패드(181) 상의 단일 탭의 식별된 손가락 제스처는 광학 조립체(180A, 180B)의 이미지 디스플레이 상에 제시된 이미지에서 그래픽 사용자 인터페이스 엘리먼트의 선택 또는 누름을 개시한다. 식별된 손가락 제스처에 기반하여 광학 조립체(180A, 180B)의 이미지 디스플레이 상에 제시된 이미지에 대한 조절은 추가적인 디스플레이 또는 실행을 위해 광학 조립체(180A, 180B)의 이미지 디스플레이 상의 그래픽 사용자 인터페이스 엘리먼트를 선택하거나 또는 제출하는 1차 액션(action)일 수 있다.

[0035] 도시된 바와 같이, 안경류 디바이스(100)는 우측 가시광 카메라(114B)를 포함한다. 본원에서 추가로 설명되는 바와 같이, 2개의 카메라들(114A, 114B)은 2개의 별개의 뷰포인트들로부터 스크린에 대한 이미지 정보를 캡처한다. 2개의 캡처된 이미지들은 3D 안경으로 보기 위해 3차원 디스플레이를 이미지 디스플레이에 투사하는 데 사용될 수 있다.

[0036] 안경류 디바이스(100)는 깊이 이미지들과 같은 이미지들을 제시하기 위한 이미지 디스플레이를 갖는 우측 광학 조립체(180B)를 포함한다. 도 1a 및 도 1b에 도시된 바와 같이, 안경류 디바이스(100)는 우측 가시광 카메라(114B)를 포함한다. 안경류 디바이스(100)는 스테레오 카메라와 같은 수동 타입의 3차원 카메라를 형성하는 다수의 가시광 카메라들(114A, 114B)을 포함할 수 있고, 이들 중 우측 가시광 카메라(114B)는 우측 코너(110B) 상에 로케이팅된다. 도 1c 및 도 1d에 도시된 바와 같이, 안경류 디바이스(100)는 또한 좌측 가시광 카메라(114A)를 포함한다.

[0037] 좌측 및 우측 가시광 카메라들(114A, 114B)은 가시광선 범위 파장에 민감하다. 가시광 카메라들(114A, 114B)의 각각은 3차원 깊이 이미지들의 생성을 가능하게 하기 위해 중첩하는 상이한 전방을 향하는 시야를 갖는데, 예컨대, 우측 가시광 카메라(114B)는 우측 시야(111B)를 묘사한다. 일반적으로, “시야”는, 공간 내의 특정 포지션 및 배향에서 카메라를 통해 가시적인 장면의 일부이다. 시야들(111A 및 111B)은 중첩하는 시야(304)(도 3)를 갖는다. 가시광 카메라가 이미지를 캡처할 때 시야(111A, 111B) 외측의 객체들 또는 객체 특징들은 원시 이미지(예컨대, 포토그래프 또는 사진)에 기록되지 않는다. 시야는 가시광 카메라(114A, 114B)의 이미지 센서가 주어진 장면의 캡처된 이미지 내의 주어진 장면의 전자기 방사를 픽업하는 각도 범위 또는 정도를 설명한다. 시야는 뷰 콘(view cone)의 각도 크기, 즉 시야각으로 표현될 수 있다. 시야각은 수평으로, 수직으로 또는 대각으로 측정될 수 있다.

[0038] 일례에서, 가시광 카메라들(114A, 114B)은 15° 내지 110°, 예컨대 24°의 시야각을 갖는 시야를 갖고, 480 x 480 픽셀들 이상의 해상도를 갖는다. "커버리지 각도"는 가시광 카메라들(114A, 114B) 또는 적외선 카메라(410)(도 2a 참조)의 렌즈가 효과적으로 이미징할 수 있는 각도 범위를 설명한다. 통상적으로, 카메라 렌즈는 가능하게는 일부 비네팅(vignetting)(예컨대, 중심과 비교하여 에지들 쪽의 이미지의 다크닝)을 포함하여, 필름 또는 카메라의 센서를 완전히 커버할 만큼 충분히 큰 이미지 원을 생성한다. 카메라 렌즈의 커버리지 각도가 센서를 채우지 않는 경우, 이미지 원은 가시적일 것이고, 통상적으로 에지를 향하는 강한 비네팅을 가지며, 뷰의 유효 각도는 커버리지 각도로 제한될 것이다.

[0039] 이러한 가시광 카메라들(114A, 114B)의 예들은 640p(예컨대, 총 0.3 메가픽셀의 경우 640 x 480 픽셀들), 720p, 1080p 또는 그 초과의 해상도들을 가능하게 하는 고해상도 CMOS(complementary metal-oxide-semiconductor) 이미지 센서 및 디지털 VGA 카메라(비디오 그래픽 어레이)를 포함한다. 가시광 카메라들(114A, 114B)의 다른 예들은 HD(high-definition) 정지 이미지들을 캡처하고 이들을 1642 x 1642개의 (또는 그 초과의) 픽셀들의 해상도로 저장할 수 있거나; 또는 높은 프레임 레이트(예컨대, 초당 30 내지 60개의 프레임들 또는 그 초과)로 HD(high-definition) 비디오를 기록하고 기록을 1216 x 1216개의 (또는 그 초과의) 픽셀들의 해상도로 저장할 수 있다.

[0040] 안경류 디바이스(100)는 메모리에의 저장을 위해 이미지 프로세서에 의해 디지털화되는, 가시광 카메라들(114A, 114B)로부터의 이미지 센서 데이터를 지오로케이션 데이터와 함께 캡처할 수 있다. 가시광 카메라들(114A, 114B)은 수평 포지션에 대한 X-축 및 수직 포지션에 대한 Y-축을 포함하는 2차원 좌표 시스템 상의 픽셀들의 매트릭스를 포함하는, 2차원 공간 도메인에서의 개개의 좌측 및 우측 원시 이미지들을 캡처한다. 각각의 픽셀은 색 속성 값(예컨대, 적색 픽셀 광 값, 녹색 픽셀 광 값, 또는 청색 픽셀 광 값); 및 포지션 속성(예컨대, X-축 좌표 및 Y-축 좌표)을 포함한다.

[0041] 3차원 투사로서 추후 디스플레이하기 위한 스테레오 이미지들을 캡처하기 위해, 이미지 프로세서(412)(도 4에 도시됨)는 가시광 카메라들(114A, 114B)에 커플링되어 시각 이미지 정보를 수신하고 저장할 수 있다. 이미지 프로세서(412) 또는 다른 프로세서는 가시광 카메라들(114A, 114B)의 동작을 제어하여, 인간의 양안 비전을 시뮬레이팅하는 스테레오 카메라의 역할을 하고, 각각의 이미지에 타임스탬프를 추가할 수 있다. 이미지들의 각각의 쌍 상의 타임스탬프는 3차원 투사의 부분으로서 이미지들의 동시 디스플레이를 허용한다. 3차원 투사들은 가상 현실(VR) 및 비디오 게이밍을 포함하여 다양한 콘텍스트들에서 바람직한 몰입형의 실감나는 경험을 생성한다.

[0042] 도 1b는 카메라 시스템의 우측 가시광 카메라(114B) 및 회로 보드를 묘사하는, 도 1a의 안경류 디바이스(100)의 우측 코너(110B)의 사시 단면도이다. 도 1c는 카메라 시스템의 좌측 가시광 카메라(114A)를 도시하는, 도 1a의 안경류 디바이스(100)의 예시적인 하드웨어 구성의 측면도(좌측)이다. 도 1d는 3차원 카메라의 좌측 가시광 카메라(114A) 및 회로 보드를 묘사하는, 도 1c의 안경류 디바이스의 좌측 코너의(110A)의 사시 단면도이다.

[0043] 좌측 가시광 카메라(114A)의 구성 및 배치는 연결부들 및 커플링이 좌측 측방향 측면(170A)에 있다는 점을 제외하고 우측 가시광 카메라(114B)와 실질적으로 유사하다. 도 1b의 예에 도시된 바와 같이, 안경류 디바이스(100)는 우측 가시광 카메라(114B) 및 가요성 PCB(printed circuit board)일 수 있는 회로 보드(140B)를 포함한다. 우측 힌지(126B)는 안경류 디바이스(100)의 우측 템플(125B)에 우측 코너(110B)를 연결한다. 일부 예들에서, 우측 가시광 카메라(114B), 가요성 PCB(140B), 또는 다른 전기 커넥터들 또는 접촉부들의 컴포넌트들은 우측 템플(125B) 또는 우측 힌지(126B) 상에 로케이팅될 수 있다.

[0044] 우측 코너(110B)는 코너 본체(190) 및 코너 캡을 포함하고, 코너 캡은 도 1b의 단면에서 생략된다. 우측 코너(110B) 내부에는 우측 가시광 카메라(114B)에 대한 제어기 회로들, 마이크로폰(들), (예컨대, Bluetooth™를 통한 무선 근거리 네트워크 통신을 위한) 저전력 무선 회로부, (예컨대, Wi-Fi 통한 무선 근거리 네트워크 통신을 위한) 고속 무선 회로부를 포함하는 다양한 상호연결된 회로 보드들, 예컨대, PCB들 또는 가요성 PCB들이 배치된다.

[0045] 우측 가시광 카메라(114B)는 가요성 PCB(140B)에 커플링되거나 배치되고, 프레임(105)에 형성된 개구(들)를 통해 조준되는 가시광 카메라 커버 렌즈에 의해 커버된다. 예컨대, 도 2a에 도시된 프레임(105)의 우측 테두리(107B)는 우측 코너(110B)에 연결되고 가시광 카메라 커버 렌즈를 위한 개구(들)를 포함한다. 프레임(105)은 사용자의 눈으로부터 멀리 바깥쪽을 향하도록 구성된 전방 측면을 포함한다. 가시광 카메라 커버 렌즈를 위한 개구는 프레임(105)의 전방 또는 외향 측면 상에 그리고 이를 통해 형성된다. 예에서, 우측 가시광 카메라(114B)는 안경류 디바이스(100)의 사용자의 우측 눈과 상관되는 시선 또는 시각을 갖는 (도 3에 도시된) 외향 시야(111B)를 갖는다. 가시광 카메라 커버 렌즈는 또한 우측 코너(110B)의 전방 측면 또는 외향 표면에 부착될 수 있고, 여기서 커버리지의 외향 각도를 갖지만 상이한 외측 방향을 향하는 개구가 형성된다. 커플링은 또한 개재 컴포넌트들을 통해 간접적일 수 있다.

[0046] 도 1b에 도시된 바와 같이, 가요성 PCB(140B)는 우측 코너(110B) 내부에 배치되고, 우측 코너(110B)에 하우징된 하나 이상의 다른 컴포넌트들에 커플링된다. 우측 코너(110B)의 회로 보드들 상에 형성된 것으로 도시되었지만, 우측 가시광 카메라(114B)는 좌측 코너(110A), 템플들(125A, 125B) 또는 프레임(105)의 회로 보드들 상에 형성될 수 있다.

[0047] 도 2a 및 도 2b는 2개의 상이한 타입들의 이미지 디스플레이들을 포함하는 안경류 디바이스(100)의 예시적인 하드웨어 구성들을 뒤에서 본 사시도들이다. 안경류 디바이스(100)는 사용자가 착용하도록 구성된 형태의 크기를 갖고 이러한 형태로 형상화되며; 안경의 형태가 본 예에 도시된다. 안경류 디바이스(100)는 다른 형태들을 취할 수 있고, 다른 타입들의 프레임워크들, 예컨대 헤드기어, 헤드셋 또는 헬멧을 통합할 수 있다.

[0048] 안경 예에서, 안경류 디바이스(100)는 사용자의 코에 의해 지지되도록 구성된 브리지( bridge)(106)를 통해 우측 테두리(107B)에 연결된 좌측 테두리(107A)를 포함하는 프레임(105)을 포함한다. 좌측 및 우측 테두리들(107A, 107B)은 렌즈 및 디스플레이 디바이스와 같은 개개의 광학 엘리먼트(180A, 180B)를 홀딩하는 개개의 애퍼처들(175A, 175B)을 포함한다. 본원에서 사용되는 바와 같이, 렌즈라는 용어는 빛이 수렴/발산하게 하는 또는 수렴 또는 발산이 거의 또는 전혀 없게 하는 만곡된 또는 평탄한 표면들을 갖는 유리 또는 플라스틱의 투명한 또는 반투명한 피스들을 포함하는 것으로 의미된다.

[0049] 2개의 광학 엘리먼트들(180A, 180B)을 갖는 것으로 도시되었지만, 안경류 디바이스(100)는 안경류 디바이스(100)의 애플리케이션 또는 의도된 사용자에 따라 단일 광학 엘리먼트와 같은 다른 배열들을 포함할 수 있다 (또는 임의의 광학 엘리먼트(180A, 180B)를 포함하지 않을 수 있다). 추가로 도시된 바와 같이, 안경류 디바이스(100)는 프레임(105)의 좌측 측방향 측면(170A)에 인접한 좌측 코너(110A) 및 프레임(105)의 우측 측방향 측면(170B)에 인접한 우측 코너(110B)를 포함한다. 코너들(110A, 110B)은 (예시된 바와 같이) 개개의 측면들(170A, 170B) 상에서 프레임(105)에 통합되거나, 또는 개개의 측면들(170A, 170B) 상에서 프레임(105)에 부착된 별개의 컴포넌트들로서 구현될 수 있다. 대안적으로, 코너들(110A, 110B)은 프레임(105)에 부착된 템플들(미도시)에 통합될 수 있다.

[0050] 일례에서, 광학 조립체(180A, 180B)의 이미지 디스플레이는 통합 이미지 디스플레이를 포함한다. 도 2a에 도시된 바와 같이, 각각의 광학 조립체(180A, 180B)는 LCD(liquid crystal display), OLED(organic light-emitting diode) 디스플레이 또는 임의의 다른 그러한 디스플레이와 같은 적합한 디스플레이 매트릭스(177)를 포함한다. 각각의 광학 조립체(180A, 180B)는 또한 렌즈들, 광학 코팅들, 프리즘들, 미러들, 도파관들, 광학 스트립들, 및 다른 광학 컴포넌트들을 임의의 조합으로 포함할 수 있는 광학 층 또는 층들(176)을 포함한다. (도 2a 및 본원에서 176A-N으로서 도시된) 광학 층들(176A, 176B, … 176N)은 적합한 크기 및 구성을 갖고 디스플레이 매트릭스로부터 광을 수신하기 위한 제1 표면 및 사용자의 눈에 광을 방출하기 위한 제2 표면을 포함하는 프리즘을 포함할 수 있다. 광학 층들(176A-N)의 프리즘은 좌측 및 우측 테두리들(107A, 107B)에 형성된 개개의 애퍼처들(175A, 175B)의 전부 또는 적어도 일부분에 걸쳐 연장되어, 사용자의 눈이 대응하는 좌측 및 우측 테두리들(107A, 107B)을 보고 있을 때 사용자가 프리즘의 제2 표면을 보도록 허용한다. 광학 층들(176A-N)의 프리즘의 제1 표면은 프레임(105)으로부터 위를 향하고, 디스플레이 매트릭스(177)는 디스플레이 매트릭스(177)에 의해 방출된 광자들 및 광이 제1 표면에 충돌하도록 프리즘 위에 놓인다. 프리즘은 광이 프리즘 내에서 굴절되고 광학 층들(176A-N)의 프리즘의 제2 표면에 의해 사용자의 눈을 향해 지향되도록 하는 크기를 가지고 형상화된다. 이와 관련하여, 광학 층들(176A-N)의 프리즘의 제2 표면은 눈의 중심을 향해 광을 지향하도록 볼록할 수 있다. 프리즘은 선택적으로 디스플레이 매트릭스(177)에 의해 투사된 이미지를 확대하도록 하는 크기를 가지고 형상화될 수 있으며, 광은 프리즘을 통해 이동하여 제2 표면으로부터 보이는 이미지는 디스플레이 매트릭스(177)로부터 방출된 이미지보다 하나 이상의 차원들에서 더 크다.

[0051] 일례에서, 광학 층들(176A-N)은 층을 불투명하게 만드는(렌즈를 닫거나 차단하는) 전압이 인가되지 않는 한 그리고 그 전압이 인가될 때까지 투명한 (렌즈를 개방된 상태로 유지하는) LCD 층을 포함할 수 있다. 안경류 디바이스(100) 상의 이미지 프로세서(412)는 능동 셔터 시스템을 생성하기 위해 LCD 층에 전압을 인가하는 프로그래밍을 실행할 수 있고, 이는 안경류 디바이스(100)가 3차원 투사로서 디스플레이될 때 시각적 콘텐츠를 보기에 적합하도록 만든다. 전압 또는 다른 타입의 입력에 응답하는 다른 타입들의 반응 층들을 포함하여, LCD와 다른 기술들이 능동 셔터 모드 동안 사용될 수 있다.

[0052] 다른 예에서, 광학 조립체(180A, 180B)의 이미지 디스플레이 디바이스는 도 2b에 도시된 바와 같이 투사 이미지 디스플레이를 포함한다. 각각의 광학 조립체(180A, 180B)는 스캐닝 미러 또는 검류계를 사용하는 3-색 레이저 프로젝터인 레이저 프로젝터(150)를 포함한다. 동작 동안, 레이저 프로젝터(150)와 같은 광원은 안경류 디바이스(100)의 템플들(125A, 125B) 중 하나에 또는 그 위에 배치된다. 이러한 예에서 광학 조립체(180B)는 각각의 광학 조립체(180A, 180B)의 렌즈의 폭에서 떨어져서 이를 가로질러 또는 렌즈의 전방 표면 및 후방 표면 사이의 렌즈의 깊이를 가로질러 이격되는 하나 이상의 광학 스트립들(155A, 155B, … 155N)(도 2b에서 155A-N로서 도시됨)을 포함한다.

[0053] 레이저 프로젝터(150)에 의해 투사된 광자들이 각각의 광학 조립체(180A, 180B)의 렌즈를 가로질러 이동함에 따라, 광자들은 광학 스트립들(155A-N)과 만난다. 특정 광자가 특정 광학 스트립을 만날 때, 그 광자는 사용자의 눈을 향해 재지향되거나 다음 광학 스트립으로 전달된다. 레이저 프로젝터(150)의 변조 및 광학 스트립들의 변조의 조합은 특정 광자들 또는 광 빔들을 제어할 수 있다. 일례에서, 프로세서는 기계적, 음향적 또는 전자기 신호들을 개시함으로써 광학 스트립들(155A-N)을 제어한다. 2개의 광학 조립체들(180A, 180B)을 갖는 것으로 도시되었지만, 안경류 디바이스(100)는 단일의 또는 3개의 광학 조립체들과 같은 다른 배열들을 포함할 수 있거나, 또는 각각의 광학 조립체(180A, 180B)는 안경류 디바이스(100)의 의도된 사용자 또는 애플리케이션에 따라 배열된 상이한 배열을 가질 수 있다.

[0054] 도 2a 및 도 2b에 추가로 도시된 바와 같이, 안경류 디바이스(100)는 프레임(105)의 좌측 측방향 측면(170A)에 인접한 좌측 코너(110A) 및 프레임(105)의 우측 측방향 측면(170B)에 인접한 우측 코너(110B)를 포함한다. 코너들(110A, 110B)은 (예시된 바와 같이) 개개의 측방향 측면들(170A, 170B) 상에서 프레임(105)에 통합되거나, 또는 개개의 측면들(170A, 170B) 상에서 프레임(105)에 부착된 별개의 컴포넌트들로서 구현될 수 있다. 대안적으로, 코너들(110A, 110B)은 프레임(105)에 부착된 템플들(125A, 125B)에 통합될 수 있다.

[0055] 다른 예에서, 도 2b에 도시된 안경류 디바이스(100)는 2개의 프로젝터들, 즉 좌측 프로젝터(150A)(미도시) 및 우측 프로젝터(150B)(프로젝터(150)로 도시됨)를 포함할 수 있다. 좌측 광학 조립체(180A)는 좌측 디스플레이 매트릭스(177A)(미도시), 또는 좌측 프로젝터(150A)로부터의 광과 상호작용하도록 구성된 좌측 세트의 광학 스트립들(155'A, 155'B, … 155'N)(155 프라임, A 내지 N, 미도시)을 포함할 수 있다. 유사하게, 우측 광학 조립체(180B)는 우측 디스플레이 매트릭스(177B)(미도시), 또는 우측 프로젝터(150B)로부터의 광과 상호작용하도록 구성된 우측 세트의 광학 스트립들(155''A, 155''B, … 155''N)(155 더블 프라임, A 내지 N, 미도시)을 포함할 수 있다. 이러한 예에서, 안경류 디바이스(100)는 좌측 디스플레이 및 우측 디스플레이를 포함한다.

[0056] 도 3은 3차원 장면(306), 좌측 가시광 카메라(114A)에 의해 캡처된 좌측 원시 이미지(302A) 및 우측 가시광 카메라(114B)에 의해 캡처된 우측 원시 이미지(302B)의 개략도이다. 좌측 시야(111A)는 도시된 바와 같이 우측 시야(111B)와 중첩할 수 있다. 중첩 시야(304)는 양 카메라들(114A, 114B)에 의해 캡처된 이미지의 해당 부분을 나타낸다. 시야를 지칭할 때 “중첩”이라는 용어는 생성된 원시 이미지들의 픽셀들의 매트릭스가 30 퍼센트(30%) 이상 중첩하는 것을 의미한다. '실질적으로 중첩하는 것'은 생성된 원시 이미지들 (또는 장면의 적외선 이미지)의 픽셀들의 매트릭스가 50 퍼센트 (50%) 이상 중첩하는 것을 의미한다. 본원에서 설명되는 바와 같이, 2개의 원시 이미지들(302A, 302B)은 타임스탬프를 포함하도록 프로세싱될 수 있으며, 이는 이미지들이 3차원 투사의 부분으로서 함께 디스플레이될 수 있게 한다.

[0057] 스테레오 이미지의 캡처를 위해, 도 3에 예시된 바와같이, 원시 적색, 녹색 및 청색(RGB) 이미지들의 쌍, 즉 좌측 카메라(114A)에 의해 캡처된 좌측 원시 이미지(302A) 및 우측 카메라(114B)에 의해 캡처된 우측 원시 이미지(302B)가 주어진 순간에 실제 장면(306)으로부터 캡처된다. 원시 이미지들(302A, 302B)의 쌍이 (예컨대, 이미지 프로세서(412))에 의해 프로세싱될 때, 깊이 이미지들이 생성된다. 생성된 깊이 이미지들은 안경류 디바이스의 광학 조립체(180A, 180B) 상에, 다른 디스플레이(예컨대, 모바일 디바이스(401) 상의 이미지 디스플레이(580)) 상에 또는 스크린 상에서 보여질 수 있다.

[0058] 생성된 깊이 이미지들은 3차원 공간 도메인에 있고, 수평 포지션(예컨대, 길이)에 대한 X-축, 수직 포지션(예컨대, 높이)에 대한 Y-축, 및 깊이(예컨대, 거리)에 대한 Z-축을 포함하는 3차원 로케이션 좌표 시스템 상에 정점들의 매트릭스를 포함할 수 있다. 각각의 정점은 색 속성(예컨대, 적색 픽셀 광 값, 녹색 픽셀 광 값, 및/또는 청색 픽셀 광 값); 포지션 속성(예컨대, X 로케이션 좌표, Y 로케이션 좌표, 및 Z 로케이션 좌표); 텍스처 속성; 반사 속성; 또는 이들의 조합을 포함할 수 있다. 텍스처 속성은 깊이 이미지의 정점들의 영역에서 색의 공간적 배열 또는 세기들과 같은 깊이 이미지의 인지된 텍스처를 정량화한다.

[0059] 일례에서, 인터랙티브 증강 현실 시스템(400)(도 4)은 안경류 디바이스(100)를 포함하며, 안경류 디바이스(100)는 프레임(105) 및 프레임(105)의 좌측 측방향 측면(170A)으로부터 연장되는 좌측 템플(110A) 및 프레임(105)의 우측 측방향 측면(170B)으로부터 연장되는 우측 템플(125B)을 포함한다. 안경류 디바이스(100)는 중첩 시야를 갖는 적어도 2개의 가시광 카메라들(114A, 114B)을 더 포함할 수 있다. 일례에서, 안경류 디바이스(100)는 도 3에 예시된 바와 같이 좌측 시야(111A)를 갖는 좌측 가시광 카메라(114A)를 포함한다. 좌측 카메라(114A)는 프레임(105) 또는 좌측 템플(110A)에 연결되어 장면(306)의 좌측으로부터 좌측 원시 이미지(302A)를 캡처한다. 안경류 디바이스(100)는 우측 시야(111B)를 갖는 우측 가시광 카메라(114B)를 더 포함한다. 우측 카메라(114B)는 프레임(105) 또는 우측 템플(125B)에 연결되어 장면(306)의 우측으로부터 우측 원시 이미지(302B)를 캡처한다.

[0060] 도 4는 인터넷과 같은 다양한 네트워크들(495)을 통해 연결된 웨어러블 디바이스(예컨대, 안경류 디바이스(100)), 모바일 디바이스(401) 및 서버 시스템(498)을 포함하는 예시적인 인터랙티브 증강 현실 시스템(400)의 기능 블록도이다. 인터랙티브 증강 현실 시스템(400)은 안경류 디바이스(100)와 모바일 디바이스(401) 사이의 저-전력 무선 연결(425) 및 고속 무선 연결(437)을 포함한다.

[0061] 도 4에 도시된 바와 같이, 안경류 디바이스(100)는 본원에서 설명되는 바와 같이 정지 이미지들, 비디오 이미지들 또는 정지 이미지들과 비디오 이미지들 둘 모두를 캡처하는 하나 이상의 가시광 카메라들(114A, 114B)을 포함한다. 카메라들(114A, 114B)은 고속 회로부(430)에 대한 직접 메모리 액세스(DMA)를 가질 수 있고, 스테레오 카메라로서 기능할 수 있다. 카메라들(114A, 114B)은 적색, 녹색 및 청색 (RGB) 이미지 장면의 텍스처 매핑 이미지들인 3차원(3D) 모델들로 렌더링될 수 있는 초기-깊이 이미지들을 캡처하는 데 사용될 수 있다. 디바이스(100)는 또한 디바이스(100)에 대한 객체들의 포지션을 추정하기 위해 적외선 신호들을 사용하는 깊이 센서(213)를 포함할 수 있다. 일부 예들에서 깊이 센서(213)는 하나 이상의 적외선 방출기(들)(215) 및 적외선 카메라(들)(410)를 포함한다.

[0062] 안경류 디바이스(100)는 각각의 광학 조립체(180A, 180B) (하나는 좌측 측면(170A)과 연관되고 하나는 우측 측면(170B)과 연관됨)의 2개의 이미지 디스플레이들을 더 포함한다. 안경류 디바이스(100)는 또한 이미지 디스플레이 드라이버(442), 이미지 프로세서(412), 저전력 회로부(420) 및 고속 회로부(430)를 포함한다. 각각의 광학 조립체(180A, 180B)의 이미지 디스플레이들은 정지 이미지들, 비디오 이미지들 또는 정지 및 비디오 이미지들을 포함하는 이미지들을 제시하기 위한 것이다. 이미지 디스플레이 드라이버(442)는 이미지들의 디스플레이를 제어하기 위해 각각의 광학 조립체(180A, 180B)의 이미지 디스플레이들에 커플링된다.

[0063] 안경류 디바이스(100)는 하나 이상의 스피커들(440)(예컨대, 하나는 안경류 디바이스의 좌측 측면과 연관되며 다른 것은 안경류 디바이스의 우측 측면과 연관됨)을 추가로 포함한다. 스피커들(440)은 안경류 디바이스(100)의 프레임(105), 템플들(125) 또는 코너들(110)에 통합될 수 있다. 하나 이상의 스피커들(440)은 저전력 회로부(420), 고속 회로부(430) 또는 이들 둘 모두의 제어 하에 오디오 프로세서(443)에 의해 구동된다. 스피커들(440)은 예컨대 비트 트랙을 포함하는 오디오 신호들을 제공하기 위한 것이다. 오디오 프로세서(443)는 사운드의 프리젠테이션을 제어하기 위해 스피커들(440)에 커플링된다.

[0064] 안경류 디바이스(100)에 대해 도 4에 도시된 컴포넌트들은 테두리들 또는 템플들에 로케이팅된, 하나 이상의 회로 보드들, 예컨대, PCB(printed circuit board) 또는 PCB(flexible printed circuit) 상에 로케이팅된다. 대안적으로 또는 추가적으로, 묘사된 컴포넌트들은 안경류 디바이스(100)의 코너들, 프레임들, 힌지들 또는 브리지에 로케이팅될 수 있다. 좌측 및 우측 가시광 카메라들(114A, 114B)은 디지털 카메라 엘리먼트들, 이를테면 CMOS(complementary metal-oxide-semiconductor) 이미지 센서, 전하-결합 디바이스, 렌즈, 또는 미지의 객체들을 갖는 장면들의 정지 이미지들 또는 비디오를 포함하여 데이터를 캡처하기 위해 사용될 수 있는 임의의 다른 개개의 가시적 또는 광 캡처 엘리먼트들을 포함할 수 있다.

[0065] 도 4에 도시된 바와 같이, 고속 회로부(430)는 고속 프로세서(432), 메모리(434) 및 고속 무선 회로부(436)를 포함한다. 예에서, 이미지 디스플레이 드라이버(442)는 고속 회로부(430)에 커플링되고, 각각의 광학 조립체(180A, 180B)의 좌측 및 우측 이미지 디스플레이들을 구동하기 위해 고속 프로세서(432)에 의해 동작된다. 고속 프로세서(432)는 안경류 디바이스(100)에 필요한 임의의 일반적인 컴퓨팅 시스템의 동작 및 고속 통신들을 관리할 수 있는 임의의 프로세서일 수 있다. 고속 프로세서(432)는 고속 무선 회로부(436)를 사용하여 WLAN(wireless local area network)으로의 고속 무선 연결부(437)를 통한 고속 데이터 전달들을 관리하는 데 필요한 프로세싱 자원들을 포함한다.

[0066] 일부 예들에서, 고속 프로세서(432)는 오퍼레이팅 시스템, 이를테면 LINUX 오퍼레이팅 시스템, 또는 안경류 디바이스(100)의 다른 그러한 오퍼레이팅 시스템을 실행하고, 오퍼레이팅 시스템은 실행을 위해 메모리(434)에 저장된다. 임의의 다른 책임들에 부가하여, 고속 프로세서(432)는 고속 무선 회로부(436)로의 데이터 전달들을 관리하는데 사용되는 안경류 디바이스(100)를 위한 소프트웨어 아키텍처를 실행한다. 일부 예들에서, 고속 무선 회로부(436)는 본원에서 또한 Wi-Fi로 지칭되는 IEEE(Institute of Electrical and Electronic Engineers) 802.11 통신 표준들을 구현하도록 구성된다. 다른 예들에서, 다른 고속 통신 표준들은 고속 무선 회로부(436)에 의해 구현될 수 있다.

[0067] 저-전력 회로부(420)는 저-전력 프로세서(422) 및 저-전력 무선 회로부(424)를 포함한다. 안경류 디바이스(100)의 저-전력 무선 회로부(424) 및 고속 무선 회로부(436)는 단거리 트랜시버들(Bluetooth™ 또는 BLE(Bluetooth Low-Energy)) 및 무선 와이드, 근거리 또는 광역 네트워크 트랜시버들(예컨대, 셀룰러 또는 Wi-Fi)을 포함할 수 있다. 저-전력 무선 연결부(425) 및 고속 무선 연결부(437)를 통해 통신하는 트랜시버들을 포함하는 모바일 디바이스(401)는 네트워크(495)의 다른 엘리먼트들과 마찬가지로 안경류 디바이스(100)의 아키텍처의 세부사항들을 사용하여 구현될 수 있다.

[0068] 메모리(434)는 무엇보다도 좌측 및 우측 가시광 카메라들(114A, 114B), 적외선 카메라(들)(410), 이미지 프로세서(412)에 의해 생성된 카메라 데이터 및 각각의 광학 조립체(180A, 180B)의 이미지 디스플레이들 상에서 이미지 디스플레이 드라이버(442)에 의한 디스플레이를 위해 생성된 이미지들을 포함하는 다양한 데이터 및 애플리케이션들을 저장할 수 있는 임의의 저장 디바이스를 포함한다. 메모리(434)가 고속 회로부(430)와 통합된 것으로 도시되었지만, 다른 예들에서, 메모리(434)는 안경류 디바이스(100)의 독립적인 스탠드얼론 엘리먼트일 수 있다. 이러한 특정 예들에서, 전기 라우팅 라인들은 고속 프로세서(432)를 포함하는 칩을 통해 이미지 프로세서(412) 또는 저전력 프로세서(422)로부터 메모리(434)로의 연결을 제공할 수 있다. 다른 예들에서, 고속 프로세서(432)는 메모리(434)를 수반하는 판독 또는 기록 동작이 필요할 때마다 저전력 프로세서(422)가 고속 프로세서(432)를 부팅하도록 메모리(434)의 어드레싱을 관리할 수 있다.

[0069] 도 4에 도시된 바와 같이, 안경류 디바이스(100)의 고속 프로세서(432)는 카메라 시스템(가시광 카메라들(114A, 114B)), 이미지 디스플레이 드라이버(442), 사용자 입력 디바이스(491) 및 메모리(434)에 커플링될 수 있다. 도 5에 도시된 바와 같이, 모바일 디바이스(401)의 CPU(530)는 카메라 시스템(570), 모바일 디스플레이 드라이버(582), 사용자 입력 층(591) 및 메모리(540A)에 커플링될 수 있다.

[0070] 서버 시스템(498)은 예컨대 프로세서, 메모리, 및 네트워크(495)를 통해 안경류 디바이스(100) 및 모바일 디바이스(401)와 통신하기 위한 네트워크 통신 인터페이스를 포함하는 서비스 또는 네트워크 컴퓨팅 시스템의 일부로서 하나 이상의 컴퓨팅 디바이스들일 수 있다.

[0071] 안경류 디바이스(100)의 출력 컴포넌트들은 도 2a 및 도 2b에 설명된 바와 같은 각각의 렌즈 또는 광학 조립체(180A, 180B)와 연관된 좌측 및 우측 이미지 디스플레이들(예컨대, LCD(liquid crystal display), PDP(plasma display panel), LED(light emitting diode) 디스플레이, 프로젝터 또는 도파관과 같은 디스플레이)과 같은 시각적 엘리먼트들을 포함한다. 안경류 디바이스(100)는 사용자-대면 표시기(예컨대, LED, 라우드스피커 또는 진동 액추에이터) 또는 외향 신호(예컨대, LED, 라우드스피커)를 포함할 수 있다. 각각의 광학 조립체(180A, 180B)의 이미지 디스플레이들은 이미지 디스플레이 드라이버(442)에 의해 구동된다. 일부 예시적인 구성들에서, 안경류 디바이스(100)의 출력 컴포넌트들은 추가 표시기들, 이를테면 가청 엘리먼트들(예컨대, 라우드스피커들), 촉각 컴포넌트들(예컨대, 햅틱 피드백을 생성하기 위한 진동 모터와 같은 액추에이터) 및 다른 신호 생성기들을 더 포함한다. 예컨대, 디바이스(100)는 사용자-대면 세트의 표시기들 및 외향 세트의 신호들을 포함할 수 있다. 사용자-대면 세트의 표시기들은 디바이스(100)의 사용자가 보거나 그렇지 않으면 감지하도록 구성된다. 예컨대, 디바이스(100)는 사용자가 볼 수 있도록 포지셔닝된 LED 디스플레이, 사용자가 들을 수 있는 사운드를 생성하도록 포지셔닝된 하나 이상의 스피커들, 또는 사용자가 느낄 수 있는 햅틱 피드백을 제공하기 위한 액추에이터를 포함할 수 있다. 외향 세트의 신호들은 디바이스(100) 근처의 관찰자가 보거나 또는 그렇지 않으면 감지하도록 구성된다. 유사하게, 디바이스(100)는 관찰자에 의해 감지하도록 구성되고 포지셔닝된 LED, 라우드스피커 또는 액추에이터를 포함할 수 있다.

[0072] 안경류 디바이스(100)의 입력 컴포넌트들은 알파뉴메릭 입력 컴포넌트들 (예컨대, 알파뉴메릭 입력을 수신하도록 구성된 터치 스크린 또는 터치패드, 포토-광학 키보드, 또는 다른 알파뉴메릭-구성 엘리먼트들), 포인터-기반 입력 컴포넌트들(예컨대, 마우스, 터치패드, 트랙볼, 조이스틱, 모션 센서 또는 다른 포인팅 기구들), 촉각 입력 컴포넌트들(예컨대, 터치들 또는 터치 제스처들의 로케이션, 힘 또는 로케이션 및 힘을 감지하는 버튼 스위치, 터치 스크린 또는 터치패드 또는 다른 촉각-구성 엘리먼트들), 및 오디오 입력 컴포넌트들(예컨대, 마이크로폰) 등을 포함할 수 있다. 모바일 디바이스(401) 및 서버 시스템(498)은 알파뉴메릭, 포인터-기반, 촉각, 오디오 및 다른 입력 컴포넌트들을 포함할 수 있다.

[0073] 일부 예들에서, 안경류 디바이스(100)는 관성 측정 유닛(472)으로 지칭되는 모션-감지 컴포넌트들의 집합을 포함한다. 모션-감지 컴포넌트들은 종종 마이크로칩의 일부가 될 정도로 충분히 작은 마이크로스코픽 이동 부분들을 갖는 MEMS(micro-electro-mechanical system)들일 수 있다. 일부 예시적인 구성들의 관성 측정 유닛(IMU)(472)은 가속도계, 자이로스코프 및 자력계를 포함한다. 가속도계는 3개의 직교 축들(x, y, z)에 대한 디바이스(100)의 선형 가속도(중력으로 인한 가속도를 포함함)를 감지한다. 자이로스코프는 3개의 회전축(피치, 롤, 요)에 대한 디바이스(100)의 각속도를 감지한다. 동시에, 가속도계 및 자이로스코프는 6개 축(x, y, z, 피치, 롤, 요)에 대한 디바이스에 대한 포지션, 배향 및 모션 데이터를 제공할 수 있다. 존재하는 경우 자력계는 자북에 대한 디바이스(100)의 헤딩을 감지한다. 디바이스(100)의 포지션은 로케이션 센서들, 이를테면 GPS 유닛(473), 상대적인 포지션 좌표들을 생성하기 위한 하나 이상의 트랜시버들, 고도 센서들 또는 기압계들, 및 다른 배향 센서들에 의해 결정될 수 있다. 이러한 포지셔닝 시스템 좌표들은 또한 저-전력 무선 회로부(424) 또는 고속 무선 회로부(436)를 통해 모바일 디바이스(401)로부터 무선 연결부들(425, 437)을 통해 수신될 수 있다.

[0074] IMU(472)는 컴포넌트들로부터의 원시 데이터를 수집하는 디지털 모션 프로세서 또는 프로그래밍을 포함하거나 또는 이와 협력할 수 있으며, 디바이스(100)의 포지션, 배향 및 모션에 대한 다수의 유용한 값들을 계산할 수 있다. 예컨대, 가속도계로부터 수집된 가속도 데이터는 각각의 축(x, y, z)에 대한 속도를 획득하도록 통합될 수 있으며; (선형 좌표들 (x, y, 및 z)에서) 디바이스(100)의 포지션을 획득하기 위해 다시 통합될 수 있다. (구형 좌표들로부터) 디바이스(100)의 포지션을 획득하기 위해 자이로스코프로부터의 각속도 데이터가 통합될 수 있다. 이들 유용한 값들을 계산하기 위한 프로그래밍은 메모리(434)에 저장될 수 있고, 안경류 디바이스(100)의 고속 프로세서(432)에 의해 실행될 수 있다.

[0075] 안경류 디바이스(100)는 추가 주변 센서들, 이를테면 생체 센서들, 특수 센서들, 또는 안경류 디바이스(100)와 통합된 디스플레이 엘리먼트들을 선택적으로 포함할 수 있다. 예컨대, 주변 디바이스 엘리먼트들은 출력 컴포넌트들, 모션 컴포넌트들, 포지션 컴포넌트들 또는 본원에 설명된 임의의 다른 이러한 엘리먼트들을 포함하는 임의의 I/O 컴포넌트들을 포함할 수 있다. 예컨대, 생체 센서들은 표현들(예컨대, 손 표현들, 얼굴 표현들, 음성 표현들, 신체 제스처들 또는 눈 추적)을 검출하는 것, 생체신호들 (예컨대, 혈압, 심박수, 체온, 땀 또는 뇌파)을 측정하는 것, 또는 사람을 식별(예컨대, 음성, 망막, 얼굴 특징들, 지문들 또는 전기 생체 신호들, 이를테면 뇌전도 데이터에 기반한 식별)하는 것 등을 수행하기 위한 컴포넌트들을 포함할 수 있다.

[0076] 모바일 디바이스(401)는 스마트폰, 태블릿, 랩톱 컴퓨터, 액세스 포인트, 또는 저전력 무선 연결부(425) 및 고속 무선 연결부(437) 둘 모두를 사용하여 안경류 디바이스(100)와 연결할 수 있는 임의의 다른 그러한 디바이스일 수 있다. 모바일 디바이스(401)는 서버 시스템(498) 및 네트워크(495)에 연결된다. 네트워크(495)는 유선 및 무선 연결들의 임의의 조합을 포함할 수 있다.

[0077] 도 4에 도시된 바와 같은 인터랙티브 증강 현실 시스템(400)은 네트워크를 통해 안경류 디바이스(100)에 커플링된 모바일 디바이스(401)와 같은 컴퓨팅 디바이스를 포함한다. 인터랙티브 증강 현실 시스템(400)은 명령들을 저장하기 위한 메모리 및 명령들을 실행하기 위한 프로세서를 포함한다. 프로세서(432)에 의한 인터랙티브 증강 현실 시스템(400)의 명령들의 실행은 모바일 디바이스(401)와 협력하도록 안경류 디바이스(100)를 구성한다. 인터랙티브 증강 현실 시스템(400)은 안경류 디바이스(100)의 메모리(434) 또는 모바일 디바이스(401)의 메모리 엘리먼트들(540A, 540B, 540C)(도 5)을 활용할 수 있다. 또한, 인터랙티브 증강 현실 시스템(400)은 안경류 디바이스(100)의 프로세서 엘리먼트들(432, 422) 또는 모바일 디바이스(401)의 CPU(central processing unit)(530)(도 5)를 활용할 수 있다. 더욱이, 인터랙티브 증강 현실 시스템(400)은 서버 시스템(498)의 메모리 및 프로세서 엘리먼트들을 추가로 활용할 수 있다. 이러한 양상에서, 인터랙티브 증강 현실 시스템(400)의 메모리 및 프로세싱 기능들은 안경류 디바이스(100), 모바일 디바이스(401) 및 서버 시스템(498)에 걸쳐 공유되거나 또는 분산될 수 있다.

[0078] 메모리(434)는 노래 파일들(482) 및 객체들(484)을 포함한다. 노래 파일들(482)은 템포(예컨대, 비트 트랙) 및 선택적으로 일련의 음표들 및 음표 값들을 포함한다. 음표는 특정 피치 또는 다른 음악 사운드를 나타내는 심볼이다. 음표 값은 템포에 대한 음표 재생 기간을 포함하며, 다른 특성들, 이를테면 다른 음표들에 대한 음의 강도, 강조, 조음 및 프레이징을 포함할 수 있다. 일부 구현들에서, 템포는 사용자가 노래를 재생하는 동안 사용하기 위한 특정 템포를 선택할 수 있게 하는 사용자 인터페이스와 함께 디폴트 값을 포함한다. 객체들(484)은 카메라들(114)에 의해 캡처된 이미지들에서 객체들 또는 특징들을 식별하기 위한 이미지 데이터를 포함한다. 객체들은 환경 내에서 안경류 디바이스(100)의 위치를 파악하는 데 사용하기 위한 알려진 그림들 또는 물리적 마커들과 같은 물리적 특징들일 수 있다.

[0079] 메모리(434)는, 프로세서(432)에 의한 실행을 위해, 포지션 검출 유틸리티(460), 마커 등록 유틸리티(462), 로컬리제이션 유틸리티(464), 가상 객체 렌더링 유틸리티(466), 물리 엔진(468) 및 예측 엔진(470)을 추가로 포함한다. 포지션 검출 유틸리티(460)는 예컨대 로컬리제이션 유틸리티(464)를 사용하여 환경 내의 포지션(로케이션 및 배향)을 결정하도록 프로세서(432)를 구성한다. 마커 등록 유틸리티(462)는 환경 내의 마커들을 등록하도록 프로세서(432)를 구성한다. 마커들은 안경류 디바이스(100)가 동작하고 있는 환경에 대해 또는 안경류 자체에 대해 프로세서(432)에 의해 특정 로케이션에 할당되거나 또는 환경 내의 알려진 로케이션을 갖는 미리 정의된 물리적 마커들일 수 있다. 로컬리제이션 유틸리티(464)는 안경류 디바이스(100)의 포지션, 안경류 디바이스에 의해 제시되는 객체들의 포지션 또는 이들의 조합을 결정하는 데 사용하기 위한 로컬리제이션 데이터를 획득하도록 프로세서(432)를 구성한다. 로케이션 데이터는 일련의 이미지들, IMU 유닛(472), GPS 유닛(473) 또는 이들의 조합으로부터 유도될 수 있다. 가상 객체 렌더링 유틸리티(466)는 이미지 디스플레이 드라이버(442) 및 이미지 프로세서(412)의 제어 하에서 이미지 디스플레이(180)에 의한 디스플레이를 위해 가상 이미지들을 렌더링하도록 프로세서(432)를 구성한다. 물리 엔진(468)은 중력 및 마찰과 같은 물리 법칙을 가상 단어, 예컨대 가상 게임 피스들 사이에 적용하도록 프로세서(432)를 구성한다. 예측 엔진(470)은 안경류 디바이스(100)의 현재 헤딩, IMU(472)와 같은 센서들로부터의 입력, 환경 이미지들, 또는 이들의 조합에 기반하여 안경류 디바이스(100)와 같은 객체의 예상되는 움직임을 예측하도록 프로세서(432)를 구성한다.

[0080] 도 5는 예시적인 모바일 디바이스(401)의 하이-레벨 기능 블록도이다. 모바일 디바이스(401)는 본원에 설명된 기능들의 전부 또는 서브세트를 수행하기 위해 CPU(530)에 의해 실행될 프로그래밍을 저장하는 플래시 메모리(540A)를 포함한다.

[0081] 모바일 디바이스(401)는 적어도 2개의 가시광 카메라들(중첩하는 시야들을 갖는 제1 및 제2 가시광 카메라들) 또는 실질적으로 중첩하는 시야들을 갖는 적어도 하나의 가시광 카메라 및 깊이 센서를 포함하는 카메라(570)를 포함할 수 있다. 플래시 메모리(540A)는 카메라(570)를 통해 생성되는 다수의 이미지들 또는 비디오를 더 포함할 수 있다.

[0082] 도시된 바와 같이, 모바일 디바이스(401)는 이미지 디스플레이(580), 이미지 디스플레이(580)를 제어하기 위한 모바일 디스플레이 드라이버(582), 및 디스플레이 제어기(584)를 포함한다. 도 5의 예에서, 이미지 디스플레이(580)는 이미지 디스플레이(580)에 의해 사용되는 스크린 최상부에 계층화되거나 또는 그렇지 않으면 스크린에 통합되는 사용자 입력 층(591)(예컨대, 터치스크린)을 포함한다.

[0083] 사용될 수 있는 터치스크린-타입의 모바일 디바이스들의 예들은 스마트 폰, PDA(personal digital assistant), 태블릿 컴퓨터, 랩톱 컴퓨터 또는 다른 휴대용 디바이스를 포함한다 (그러나, 이에 제한되지는 않음). 그러나, 터치스크린-타입 디바이스들의 구조 및 동작은 예로서 제공되며; 본원에 설명된 청구대상 기술은 이에 제한되는 것으로 의도되지 않는다. 따라서, 이러한 논의의 목적들을 위해, 도 5는 (터치, 멀티-터치 또는 제스처 등에 의한, 손에 의한, 스타일러스 또는 다른 도구에 의한) 입력을 수신하기 위한 터치스크린 입력 층(891) 및 콘텐츠를 디스플레이하기 위한 이미지 디스플레이(580)를 포함하는 사용자 인터페이스를 갖는 예시적인 모바일 디바이스(401)의 블록도 예시를 제공한다.

[0084] 도 5에 도시된 바와 같이, 모바일 디바이스(401)는 광역 무선 모바일 통신 네트워크를 통한 디지털 무선 통신들을 위해 WWAN 디지털 트랜시버(XCVR)들로서 도시된 적어도 하나의 디지털 트랜시버(XCVR)(510)를 포함한다. 모바일 디바이스(401)는 또한 이를테면 NFC, VLC, DECT, ZigBee, Bluetooth™ 또는 Wi-Fi를 통해 단거리 네트워크 통신을 위한 단거리 트랜시버(XCVR)(520)들과 같은 추가 디지털 또는 아날로그 트랜시버들을 포함한다. 예컨대, 단거리 XCVR들(520)은 IEEE 802.11 하의 Wi-Fi 표준들 중 하나와 같은 무선 로컬 영역 네트워크들에서 구현되는 하나 이상의 표준 통신 프로토콜들과 호환 가능한 타입의 임의의 이용 가능한 양방향 WLAN(wireless local area network) 트랜시버의 형태를 취할 수 있다.

[0085] 모바일 디바이스(401)의 포지셔닝을 위한 로케이션 좌표들을 생성하기 위해, 모바일 디바이스(401)는 GPS(global positioning system) 수신기를 포함할 수 있다. 대안적으로 또는 추가적으로 모바일 디바이스(401)는 포지셔닝을 위한 로케이션 좌표들을 생성하기 위해 근거리 XCVR들(520) 및 WWAN XCVR들(510) 중 하나 또는 둘 모두를 활용할 수 있다. 예컨대, 셀룰러 네트워크, Wi-Fi 또는 Bluetooth™ 기반 포지셔닝 시스템들은 특히 조합하여 사용될 때 매우 정확한 로케이션 좌표들을 생성할 수 있다. 이러한 로케이션 좌표들은 XCVR들(510, 520)을 사용하여 하나 이상의 네트워크 연결부들을 통해 안경류 디바이스에 송신될 수 있다.

[0086] 트랜시버들(510, 520)(즉, 네트워크 통신 인터페이스)은 현대식 모바일 네트워크들에 의해 활용되는 다양한 디지털 무선 통신 표준들 중 하나 이상을 준수한다. WWAN 트랜시버들(510)의 예들은, 예컨대 제한없이 3GPP(3rd Generation Partnership Project) 타입 2(또는 3GPP2) 및 때때로 “4G”로 지칭되는 LTE를 포함하는 3GPP 네트워크 기술들 및 CDMA(Code Division Multiple Access)에 따라 동작하도록 구성된 트랜시버들을 포함한다(그러나 이에 제한되지 않음). 예컨대, 트랜시버들(510, 520)은 디지털화된 오디오 신호들, 정지 이미지들 및 비디오 신호들, 디스플레이를 위한 웹 페이지 정보뿐만 아니라 웹 관련 입력들, 및 모바일 디바이스(401)로/로부터의 다양한 타입들의 모바일 메시지 통신들을 포함하는 정보의 양방향 무선 통신을 제공한다.

[0087] 모바일 디바이스(401)는 도 4의 CPU(530)로서 도시된 CPU(central processing unit)로서 기능하는 마이크로프로세서를 더 포함한다. 프로세서는 하나 이상의 프로세싱 기능들, 즉, 통상적으로 다양한 데이터 프로세싱 기능들을 수행하도록 구조화되고 배열된 엘리먼트들을 갖는 회로이다. 개별 로직 컴포넌트들이 사용될 수 있지만, 예들은 프로그램 가능 CPU를 형성하는 컴포넌트들을 활용한다. 예컨대, 마이크로프로세서는 CPU의 기능들을 수행하기 위해 전자 엘리먼트들을 통합하는 하나 이상의 IC(integrated circuit) 칩들을 포함한다. 예컨대, CPU(530)는 오늘날 모바일 디바이스들 및 다른 휴대용 전자 디바이스들에서 통상적으로 사용되는 바와 같이 ARM 아키텍처를 사용하여 RISC(Reduced Instruction Set Computing)와 같은 임의의 공지된 또는 이용 가능한 마이크로프로세서 아키텍처에 기반할 수 있다. 물론, 스마트폰, 랩톱 컴퓨터 및 태블릿에서 CPU(530) 또는 프로세서 하드웨어를 형성하기 위해 프로세서 회로부의 다른 배열들이 사용될 수 있다.

[0088] CPU(530)는 예컨대 CPU(530)에 의해 실행 가능한 프로그래밍 또는 명령들에 따라, 다양한 동작들을 수행하도록 모바일 디바이스(401)를 구성함으로써 모바일 디바이스(401)에 대한 프로그램 가능 호스트 제어기로서 역할을 한다. 예컨대, 이러한 동작들은 모바일 디바이스의 다양한 일반적인 동작들뿐만 아니라 모바일 디바이스 상의 애플리케이션들에 대한 프로그래밍과 관련된 동작들을 포함할 수 있다. 프로세서는 하드와이어드 로직을 사용하여 구성될 수 있지만, 모바일 디바이스들의 통상적인 프로세서들은 프로그래밍의 실행에 의해 구성된 일반적인 프로세싱 회로들이다.

[0089] 모바일 디바이스(401)는 프로그래밍 및 데이터를 저장하기 위한 메모리 또는 저장 시스템을 포함한다. 예에서, 메모리 시스템은 필요에 따라 플래시 메모리(540A), RAM(random access memory)(540B) 및 다른 메모리 컴포넌트들(540C)을 포함할 수 있다. RAM(540B)은 예컨대, 작동 데이터 프로세싱 메모리로서 CPU(530)에 의해 처리되는 명령들 및 데이터를 위한 단기 저장부로서 역할을 한다. 플래시 메모리(540A)는 전형적으로 장기 저장부를 제공한다.

[0090] 따라서, 모바일 디바이스(401)의 예에서, 플래시 메모리(540A)는 CPU(530)에 의한 실행을 위한 프로그래밍 또는 명령들을 저장하기 위해 사용된다. 디바이스의 타입에 따라, 모바일 디바이스(401)는 특정 애플리케이션들이 실행되게 하는 모바일 오퍼레이팅 시스템을 저장 및 실행한다. 모바일 오퍼레이팅 시스템들의 예들은 Google Android, (I-Phone 또는 iPad 디바이스들에 대한) Apple iOS, Windows Mobile, Amazon Fire OS, RIM BlackBerry OS 등을 포함한다.

[0091] 안경류 디바이스(100) 내의 프로세서(432)는 안경류 디바이스(100)를 둘러싼 환경의 지도를 구성하고, 매핑된 환경 내에서 안경류 디바이스의 로케이션을 결정하며, 그리고 매핑된 환경에서 하나 이상의 객체들에 대한 안경류 디바이스의 상대적 포지션을 결정할 수 있다. 프로세서(432)는 하나 이상의 센서들로부터 수신된 데이터에 적용된 SLAM(simultaneous localization and mapping) 알고리즘을 사용하여 지도를 구성하고 로케이션 및 포지션 정보를 결정할 수 있다. 증강 현실의 맥락에서, SLAM 알고리즘은 환경의 지도를 구성 및 업데이트하는 동시에 매핑된 환경 내에서 디바이스(또는 사용자)의 로케이션을 추적하고 업데이트하는 데 사용된다. 수학적 솔루션은 입자 필터들, 칼만 필터들, 확장 칼만 필터들 및 공분산 교차점(covariance intersection)과 같은 다양한 통계 방법들을 사용하여 근사화될 수 있다.

[0092] 센서 데이터는 카메라들(114A, 114B) 중 하나 또는 둘 모두로부터 수신된 이미지들, 레이저 거리 측정기로부터 수신된 거리(들), GPS 유닛(473)으로부터 또는 포지션 정보를 결정할 때 유용한 데이터를 제공하는 다른 센서들로부터 수신된 포지션 정보, 또는 이러한 센서 데이터 중 둘 이상의 조합을 포함한다.

[0093] 도 6은 자연스러운 특징 추적 (NFT; 예컨대 SLAM 알고리즘을 사용하는 추적 애플리케이션)에 유용한 엘리먼트들과 함께 예시적인 환경(600)을 묘사한다. 안경류 디바이스(100)의 사용자(602)는 (도 6에서는 내부 방인) 예시적인 물리적 환경(600)에 존재한다. 안경류 디바이스(100)의 프로세서(432)는 캡처된 이미지들을 사용하여 환경(600) 내의 하나 이상의 객체들(604)에 대한 자신의 포지션을 결정하고, 환경(600)에 대한 좌표 시스템(x, y, z)을 사용하여 환경(600)의 지도를 구성하며, 좌표 시스템 내에서 자신의 포지션을 결정한다. 추가적으로, 프로세서(432)는 단일 객체(604a)와 연관된 2개 이상의 로케이션 포인트들(예컨대, 3개의 로케이션 포인트들(606a, 606b, 및 606c))을 사용함으로써 또는 2개 이상의 객체들(604a, 604b, 604c)과 연관된 하나 이상의 로케이션 포인트들(606)을 사용함으로써 환경 내에서 안경류 디바이스(100)의 머리 포즈(롤, 피치 및 요)를 결정한다. 안경류 디바이스(100)의 프로세서(432)는 이미지 디스플레이들(180)을 통한 증강 현실 보기를 위해 환경(600) 내에 (도 6에 도시된 키와 같은) 가상 객체(408)를 포지셔닝할 수 있다.

[0094] 도 6을 다시 참조하면, 본원에서 설명된 인터랙티브 증강 현실 애플리케이션들을 구현하는 방법은 본 예에서 환경(600)의 가상 객체(들)(608)와 연관된 가상 마커(610a)를 포함한다. 이러한 예와 관련하여, 가상 객체는 환경에 있는 사람 또는 사람들을 포함한다. AR 시스템에서, 마커들은 매핑된 환경에서 사용자들, 디바이스들 및 객체들(가상 및 물리 객체) 및 물리적 사람 또는 사람들의 로케이션을 추적하고 업데이트하는 태스크로 디바이스들을 보조하기 위해 환경의 로케이션들에 등록된다. 마커들은 때때로 마커를 검출하는 태스크로 카메라들 및 다른 센서들을 보조하기 위해 밝은 색상의 벽에 장착된 상대적으로 어두운 객체(604a)와 같은 높은 콘트라스트 물리 객체에 등록된다. 마커들은 미리 할당될 수 있거나, 또는 환경에 진입할 때 안경류 디바이스(100)에 의해 할당될 수 있다.

[0095] 마커들은 정보로 인코딩되거나 또는 그렇지 않으면 정보에 링크될 수 있다. 마커는 포지션 정보, 물리적 코드(이를테면, 바코드 또는 QR 코드; 사용자에게 보이거나 또는 숨겨짐) 또는 이들의 조합을 포함할 수 있다. 마커와 연관된 데이터의 세트는 안경류 디바이스(100)의 메모리(434)에 저장된다. 데이터의 세트는 마커(610a), 마커의 포지션(로케이션 및 배향), 하나 이상의 가상 객체들 또는 이들의 조합에 대한 정보를 포함한다. 마커 포지션은 도 6에 도시된 대체로 직사각형인 마커(610a)의 코너와 같은 하나 이상의 마커 랜드마크들(616a)에 대한 3차원 좌표들을 포함할 수 있다. 마커 로케이션은 실세계 지리적 좌표들, 마커 좌표들의 시스템, 안경류 디바이스(100)의 포지션, 또는 다른 좌표 시스템에 대해 표현될 수 있다. 마커(610a)와 연관된 하나 이상의 객체들은 정지 이미지들, 비디오, 오디오, 촉각 피드백, 실행 가능 애플리케이션들, 인터랙티브 사용자 인터페이스들 및 경험들, 및 이러한 자료의 조합들 또는 시퀀스들을 포함하는 다양한 자료 중 임의의 자료를 포함할 수 있다. 메모리에 저장될 수 있고 마커(610a)가 할당된 마커와 마주치거나 연관될 때 리트리브될 수 있는 임의의 타입의 콘텐츠는 이러한 맥락에서 가상 객체로서 분류될 수 있다. 도 6에 도시된 키(608)는 예컨대 마커 로케이션에서 2D 또는 3D인 정지 이미지로서 디스플레이된 가상 객체이다.

[0096] 일례에서, 마커(610a)는 물리적 객체(604a)(예컨대, 도 6에 도시된 액자 미술작품) 근처에 로케이팅되고 이와 연관된 것으로 메모리에 등록될 수 있다. 다른 예에서, 마커는 안경류 디바이스(100)에 대한 특정 포지션인 것으로 메모리에 등록될 수 있다.

[0097] 도 7은 웨어러블 디바이스(예컨대, 안경류 디바이스)에 대해 본원에서 설명된 증강 현실 애플리케이션들을 구현하기 위한 방법을 도시하는 흐름도(700)이다. 본원에 설명된 바와 같이 단계들이 안경류 디바이스(100)를 참조하여 설명되지만, 다른 타입들의 디바이스들에 대해 설명된 단계들의 다른 구현들이 당업자에 의해 본원의 설명으로부터 이해될 것이다. 추가적으로, 도 7 및 다른 도면들에서 도시되고 본원에서 설명된 단계들 중 하나 이상이 생략되거나, 동시에 또는 직렬로 수행되거나, 또는 예시 및 설명된 것과 다른 순서로 수행되거나 또는 추가 단계들과 함께 수행될 수 있다는 것이 고려된다.

[0098] 블록(702)에서, 안경류 디바이스(100)는 안경류 디바이스(100) 근처의 물리적 환경(600)의 하나 이상의 입력 이미지들을 캡처한다. 프로세서(432)는 가시광선 카메라(들)(114)로부터 입력 이미지들을 연속적으로 수신하고 이들 이미지들을 프로세싱을 위해 메모리(434)에 저장할 수 있다. 추가적으로, 안경류 디바이스(100)는 다른 센서들로부터의 정보(예컨대, GPS 유닛(473)으로부터의 로케이션 정보, IMU(472)로부터의 배향 정보, 또는 레이저 거리 센서로부터의 거리 정보)를 캡처할 수 있다.

[0099] 블록(704)에서, 안경류 디바이스(100)는 사용자 입력, 데이터 입력 또는 음성 인식 시스템으로부터 텍스트를 획득한다. 텍스트는 다수의 방식들 중 하나 이상의 방식들로 입력될 수 있다. 입력은 안경류 디바이스와 연결된 스마트폰과 같은 모바일 디바이스 상의 키패드와 같은 사용자 입력 다바이스로부터 올 수 있다. 입력은 로컬 환경의 사람들 중 하나로부터 또는 원격 사용자로부터의 텍스트 메시지와 같은 모바일 통신으로부터 올 수 있다. 텍스트는 유리하게는 안경류 디바이스(100)의 음성 인식 모듈로부터 올 수 있으며, 이에 따라 사용자를 둘러싸는 물리적 환경에서 사용자(1001)로부터의 음성은 도 10a에 도시된 바와 같이 기록될 수 있다. 일 실시예에서, 디바이스(100)는 마이크폰을 포함하고, 음성 인식 모듈은 마이크폰으로부터 음성을 수신한다. 프로세서는 메모리(434)에 저장된 사운드 패턴과 사운드를 비교하고, 기존의 음성 인식 알고리즘을 사용하여 후보 사운드 패턴들을 식별하며, 음성 데이터베이스에서 특정 사람들과 연관된 알려진 음성 패턴들과 후보 음성 패턴들을 비교하며, 그리고 물리적 환경의 사람 또는 사람들에 대응하는 음성 패턴으로서 (임계치와 동일하거나 또는 임계치 내의) 매칭되는 음성 패턴들을 식별함으로써 환경에서 사운드를 식별할 수 있다. 음성은 지향성 청취 능력들 또는 음성 인식 능력들(1001)에 의해 사용자(1001)에 귀속될 수 있다. 음성 패턴이 사용자(1001)에게 귀속되었을 때, 안경류 디바이스는 음성 인식을 사용하여 그 사용자에게 음성 기록들을 귀속시키는 기능을 포함할 수 있다. 일 양상에서, 사용자 인식은 안경류 디바이스(100)의 동작에 대한 액세스를 제어하기 위한 보안 특징으로서 사용될 수 있다.

[0100] 블록(706)에서, 안경류 디바이스(100)는 물리적 환경의 미리 정의된 로케이션에 디스플레이하기 위한 시각적 텍스트 그래픽들을 획득한 텍스트로부터 생성한다. 시각적 텍스트 그래픽들은 도 10b에 도시된 캡션과 같은 임의의 형태의 그래픽일 수 있다. 텍스트는 임의의 타입의 그래픽 엘리먼트, 이를테면 이모티콘들뿐만 아니라 강조, 굵게, 기울임꼴, 밑줄 또는 워드 아트를 포함할 수 있다.

[0101] 블록(708)에서, 안경류 디바이스(100)는 디스플레이 시스템에 의해 디스플레이 상에 물리적 환경의 미리 정의된 로케이션에 시각적 텍스트 그래픽을 제시한다. 시각적 텍스트 그래픽은 물리적 환경에 있는 사람(1004) 근처에 디스플레이될 수 있으며, 여기서 텍스트는 음성 인식에 기반하여 귀속되거나, 또는 텍스트는 원하는 선호도에 따라 사용자에 의해 배치된다. 일단 사용자가 물리적 환경의 음성을 특정 사람에게 귀속시키면, 음성 패턴은 자동 식별을 가능하게 하기 위해 메모리에 저장될 수 있다.

[0102] 도 8은 웨어러블 디바이스(예컨대, 안경류 디바이스)에 대해 본원에서 설명된 증강 현실 애플리케이션들을 구현하기 위한 방법을 도시하는 흐름도(800)이다. 도 8에 도시된 단계들은 도 7에 도시된 단계들(702, 704, 706, 708)과 유사한 단계들(802, 804, 806, 808)을 포함한다. 도 8은 도 11a-c에 도시된 바와 같이 사용자로부터의 입력에 응답하여 시각적 텍스트 그래픽의 속성들 중 하나 이상을 정의된 로케이션으로 변경하는 추가 단계(810)를 포함한다.

[0103] 도 9는 웨어러블 디바이스(예컨대, 안경류 디바이스)에 대해 본원에서 설명된 증강 현실 애플리케이션들을 구현하기 위한 방법을 도시하는 흐름도(900)이다. 도 9에 도시된 단계들은 도 8에 도시된 단계들(802, 804, 806, 808, 및 810)과 유사한 단계들(902, 904, 906, 908, 910)을 포함한다. 도 9는 도 12a-b에 도시된 바와 같이 사용자의 시선 방향, 사용자로부터의 입력, 또는 이들 둘 모두에 응답하여 디스플레이의 미리 정의된 로케이션에 시각적 텍스트 그래픽을 세팅하는 추가 단계(912)를 포함한다.

[0104] 도 10a는 사용자(1001)가 앞서 설명된 안경류 디바이스(100)일 수 있는 안경류 디바이스(1002)를 착용하고 있는 그래픽 텍스트 디스플레이를 사용하는 가상 증강 현실 경험의 사시도이다. 도 7과 관련하여 앞서 설명된 방법 단계들에 따라, 안경 디바이스(1001)는 물리적 환경의 이미지를 캡처하도록 구성되며, 이는 단계(702)에 대응한다. 물리적 환경은 아파트일 수 있으며, 여기서 콘솔(1008), 테이블(1005), 화분에 심은 꽃(1006) 및 양탄자(1007)와 같은 아이템들이 물리적 환경에 존재한다. 안경류 디바이스는 사용자 입력, 데이터 입력 또는 음성 인식 시스템으로부터 텍스트를 획득할 수 있으며, 이는 단계(704)에 대응한다. 도 10a에서, 사용자(1001)는 엘리먼트(1004)에 의해 묘사된 바와 같이 단어 "Hello"를 말하고 있다. 일례에서, 안경류 디바이스(1002)는 음성 인식 모듈, 마이크폰 또는 이들 둘 모두를 사용하여 "Hello"라는 단어를 텍스트 형태로 획득한다. 일례에서, 마이크폰은 안경류 디바이스(1002)에 연결된 다른 디바이스(1003)에 로케이팅된다. 음성 인식 모듈은 전술한 바와 같이 물리적 환경의 다른 사람들 중에서 사용자(1001)를 식별하는 기능을 제공할 수 있다.

[0105] 도 10b는 안경류 디바이스(1002)를 착용한 사용자(1001)의 관점을 도시한다. 렌즈 및 디스플레이 디바이스는 사용자가 테이블(1005), 화분에 심은 꽃(1006), 양탄자(1007) 및 콘솔(1008)을 포함하여 물리적 환경을 볼 수 있게 한다. 이러한 뷰는 도 7에 도시된 방법을 사용하는 예를 도시하며, 여기서 안경류 디바이스(1002)는 획득된 텍스트로부터 시각적 텍스트 그래픽(1009)을 생성하고, 이후 디스플레이 시스템에 의해 디스플레이 상의 물리적 환경의 미리 정의된 로케이션에 시각적 텍스트 그래픽을 제시한다. 시각적 텍스트 그래픽(1009)은 물리적 환경의 배경 이미지에 대해 세팅될 수 있다. 일례에서, 시각적 텍스트 그래픽(1009)은 사용자의 방향에 의해 추가로 포지셔닝될 수 있고, 시각적 텍스트 그래픽(1009)의 속성들은 아래에서 설명되는 바와같이 변경될 수 있다.

[0106] 도 11a는 안경류 디바이스(1002)와 전자 통신하는 디바이스(1103)의 추가 세부사항을 도시한다. 일례에서, 디바이스(1103)는 사용자(1101)가 손에 쥘 수 있는 스마트폰이다. 디바이스는 시각적 텍스트 그래픽(1109)의 속성을 조작할 수 있는 입력들을 포함할 수 있다. 일례에서, 시각적 텍스트 그래픽(1109)의 폰트는 디바이스(1103)의 스크린 상에서 좌측 스와이프 또는 우측 스와이프함으로써 변경될 수 있다. 시각적 텍스트 그래픽(1109)은 도 11b에 도시된 바와 같이 굵은 글꼴을 포함할 수 있다. 디바이스(1103)를 스와이프한 후, 폰트는 도 11c에 도시된 바와 같이 다른 스타일(1110)로 변경될 수 있다. 사용자(1101)는 안경류 디바이스(1002)의 디스플레이에서 변경된 속성을 실시간으로 볼 수 있다. 이용 가능한 속성들은 예컨대 물리적 환경의 특성들에 기반하여 세팅되는 옵션들의 메뉴를 포함하여, 다수의 방식들로 배열될 수 있다. 예컨대, 디스플레이 디바이스에 의해 관찰되는 색들의 범위는 컬러 팔레트와 같은 모티프에 매칭될 수 있다. 이후, 사용자(1101)는 원하는 속성이 발견될 때까지 모티프 내의 속성 선택들을 통해 스와이프할 수 있다.

[0107] 도 12a는 사용자(1201)가 단독으로 또는 디바이스(1203)의 입력과 조합하여 시선을 바닥으로 향하게 함으로써 시각적 텍스트 그래픽(1210)을 세팅할 수 있을 때 그래픽 텍스트 디스플레이를 사용하는 가상 증강 현실 경험의 사시도이다. 그 시점에서, 시각적 텍스트 그래픽(1210)은 안경 디바이스(1202)의 디스플레이에 제 위치에 세팅될 것이다. 따라서, 안경류 디바이스(1202)를 통해 물리적 환경을 보는 사용자(1201)는 환경에서 원하는 로케이션에 세팅된 시각적 텍스트 그래픽(1201)을 볼 것이다. 이러한 경우에, 시각적 텍스트 그래픽은 도 12b에 도시된 바와 같이 테이블(1205), 식물(1206), 양탄자(1207) 및 콘솔(1208)에 대해 공간에 고정된다.

[0108] 도 13a는 시각적 텍스트 그래픽들과 음성을 사용하는 가상 증강 현실 경험의 사시도이다. 이러한 경우에, 사용자(1301)는 시각적 텍스트 그래픽들로서 디스플레이되도록 의도된 단어들을 말할 수 있다. 여기서, 물리적 환경은 테이블(1305), 식물(1306) 및 양탄자(1307)를 포함한다. 이러한 예에서, 사용자는 "My Flower"이라는 작품을 말하였다. 안경류 디바이스(1302)는 사용자(1301)의 음성(1304)을 인식하도록 구성된 마이크폰 및 음성 인식 모듈을 포함할 수 있다. 말한 음성은 메모리에 저장될 수 있는 텍스트로 변환된다.

[0109] 도 13b는 안경류 디바이스(1302)의 디스플레이(1300)를 통한 뷰를 도시하며, 여기서 텍스트 "My Flower"는 시각적 디스플레이 그래픽(1309)으로서 렌더링되었다. 사용자는 도 11a-c와 관련하여 앞서 도시된 바와같이 시각적 디스플레이 그래픽(1309)의 속성들을 변경할 수 있다. 사용자(1301)는 도 12a에 도시된 바와 같이 원하는 로케이션에 시각적 텍스트 그래픽(1309)을 세팅할 수 있다.

[0110] 안경류 디바이스(100), 모바일 디바이스(401) 및 서버 시스템(498)에 대해 본원에 설명된 기능 중 임의의 것은 본원에 설명되는 바와같이 하나 이상의 컴퓨터 소프트웨어 애플리케이션들 또는 프로그래밍 명령들의 세트들로 구현될 수 있다. 일부 예들에 따르면, "기능", "기능들", "애플리케이션", "애플리케이션들", "명령", "명령들” 또는 "프로그래밍"은 프로그램들에서 정의된 기능들을 실행하는 프로그램(들)이다. 다양한 방식들로 구성된 애플리케이션들 중 하나 이상을 개발하기 위해 객체 지향 프로그래밍 언어들(예컨대, Objective-C, Java 또는 C++) 또는 절차적 프로그래밍 언어들(예컨대, C 또는 어셈블리 언어)과 같은 다양한 프로그래밍 언어들이 이용될 수 있다. 특정 예에서, 제3자 애플리케이션(예컨대, 특정 플랫폼의 벤더 이외의 엔티티에 의해 ANDROID™ 또는 IOS™ SDK(software development kit)를 사용하여 개발된 애플리케이션)은 IOS™, ANDROID™, WINDOWS® Phone 또는 다른 모바일 오퍼레이팅 시스템들과 같은 모바일 오퍼레이팅 시스템 상에서 실행되는 모바일 소프트웨어를 포함할 수 있다. 이러한 예에서, 제3자 애플리케이션은 본원에 설명된 기능을 용이하게 하기 위해 오퍼레이팅 시스템에 의해 제공된 API 콜들을 인보크할 수 있다.

[0111] 따라서, 머신-판독가능 매체는 유형의 저장 매체의 많은 형태들을 취할 수 있다. 비-휘발성 저장 매체들은 예컨대, 도면들에 도시된 클라이언트 디바이스, 미디어 게이트웨이, 트랜스코더 등을 구현하는 데 사용될 수 있는 것과 같은 임의의 컴퓨터 디바이스들 등에 있는 저장 디바이스들 중 임의의 것과 같은 광학 또는 자기 디스크들을 포함한다. 휘발성 저장 매체들은 이러한 컴퓨터 플랫폼의 메인 메모리와 같은 동적 메모리를 포함한다. 유형의 송신 매체들은 컴퓨터 시스템 내의 버스를 포함하는 와이어들을 포함하는 동축 케이블들; 구리 와이어 및 광섬유들을 포함한다. 반송파 송신 매체들은 RF(radio frequency) 및 적외선(IR) 데이터 통신들 동안 생성되는 것들과 같은 전기 또는 전자기 신호들, 또는 음파 또는 광파의 형태를 취할 수 있다. 따라서, 컴퓨터-판독가능 매체들의 일반적인 형태들은, 예컨대 플로피 디스크, 가요성 디스크, 하드 디스크, 자기 테이프, 임의의 다른 자기 매체, CD-ROM, DVD 또는 DVD-ROM, 임의의 다른 광학 매체, 펀치 카드들, 페이퍼 테이프, 구멍들의 패턴들을 갖는 임의의 다른 물리적 저장 매체, RAM, PROM 및 EPROM, FLASH-EPROM, 임의의 다른 메모리 칩 또는 카트리지, 데이터 또는 명령들을 전달하는 반송파, 그러한 반송파를 전달하는 케이블들 또는 링크들, 또는 컴퓨터가 프로그래밍 코드 또는 데이터를 판독할 수 있는 임의의 다른 매체를 포함한다. 이러한 형태들의 컴퓨터 판독가능 매체들의 대부분은 실행을 위해 프로세서에 하나 이상의 명령들의 하나 이상의 시퀀스들을 반송하는 것과 관련될 수 있다.

[0112] 바로 위에 언급된 경우를 제외하고, 청구항들에 인용되든 아니든 무관하게, 언급되거나 예시된 어떤 것도 임의의 컴포넌트, 단계, 특징, 목적, 이익, 이점 또는 이의 균등물을 일반 대중에게 제공하도록 의도되거나 해석되어서는 안된다.

[0113] 본원에서 사용된 용어들 및 표현들은, 특정 의미들이 본원에 달리 제시된 경우를 제외하고는 그들 대응하는 개개의 탐구 및 연구 영역들과 관련하여 그러한 용어들 및 표현들에 부여된 바와 같은 일반적인 의미를 갖는다는 것이 이해될 것이다. 관계형 용어들, 이를테면 제1, 제2 등은 단지 하나의 엔티티 또는 액션을 다른 것으로부터 구별하기 위해 사용될 수 있고, 이러한 엔티티들 또는 액션들 간의 임의의 실제 이러한 관계 또는 순서를 반드시 요구하거나 암시하지는 않는다. 용어들 "포함하다", "포함하는", "구비하다" , “구비하는" , 또는 이의 임의의 다른 변형은 비-배타적인 포함을 커버하는 것으로 의도되어, 엘리먼트들 또는 단계들의 리스트를 포함하거나 구비하는 프로세스, 방법, 물품 또는 장치는 그러한 엘리먼트들 또는 단계들만을 구비하는 것이 아니라, 명시적으로 나열되지 않거나 또는 이러한 프로세스, 방법, 물품 또는 장치에 고유한 다른 엘리먼트들 또는 단계들을 구비할 수 있다. 단수형 엘리먼트는, 추가적인 제약들 없이, 엘리먼트를 포함하는 프로세스, 방법, 물품 또는 장치에서 추가적인 동일한 엘리먼트들의 존재를 배제하지 않는다.

[0114] 달리 언급되지 않는 한, 이하의 청구항들을 포함하여 본 명세서에 기재된 임의의 그리고 모든 측정치들, 값들, 등급들, 포지션들, 크기들, 사이즈들 및 다른 규격들은 정확한 것이 아니라 근사치이다. 이러한 수량들은, 이들이 관련되는 기능들 및 이들과 관련된 분야에서 통상적인 것과 일치하는 합리적인 범위를 갖도록 의도된다. 예컨대, 달리 명시적으로 언급되지 않는 한, 파라미터 값 등은 언급된 양 또는 범위으로부터 ± 10 %만큼 많이 달라질 수 있다.

[0115] 더욱이, 전술한 상세한 설명에서, 다양한 특징들은 본 개시내용을 간소화할 목적으로 다양한 예들에서 함께 그룹화된다는 것을 알 수 있다. 본 개시내용의 방법은 청구되는 예들이 각각의 청구항에 명시적으로 언급된 것보다 많은 특징들을 요구하려는 의도를 반영하는 것으로 해석되어서는 안 된다. 오히려, 하기의 청구항들이 반영하는 바와 같이, 보호될 청구대상은 임의의 단일의 개시된 예의 모든 특징들보다 적다. 따라서, 이에 의해, 하기의 청구항들은 상세한 설명에 통합되며, 각각의 청구항은 별개로 청구된 청구대상으로서 독자적으로 기재된다.

[0116] 전술한 것은 최상의 모드 및 다른 예들인 것으로 고려되는 것을 설명하지만, 본원에서 다양한 수정들이 이루어질 수 있고 본원에 개시된 청구대상은 다양한 형태들 및 예들로 구현될 수 있으며 이들은 다수의 애플리케이션들에 적용될 수 있고 그 일부만이 본원에서 설명되었음이 이해되어야 한다. 이하의 청구항들은 본 개념들의 진정한 범위 내에 있는 임의의 그리고 모든 수정들 및 변경들을 청구하도록 의도된다.

Claims

증강 현실 시스템으로서,
포지션 검출 시스템;
디스플레이 시스템;
음성 인식 시스템;
상기 포지션 검출 시스템, 상기 디스플레이 시스템, 프로세서 및 메모리를 포함하는 안경류 디바이스; 및
상기 메모리 내의 프로그래밍을 포함하고, 상기 프로세서에 의한 상기 프로그래밍의 실행은 기능들을 수행하도록 상기 안경류 디바이스를 구성하고,
상기 기능들은,
상기 이미지 캡처 시스템을 사용하여 상기 물리적 환경의 이미지를 캡처하는 기능;
사용자 입력, 데이터 입력 또는 상기 음성 인식 시스템으로부터 텍스트를 획득하는 기능;
상기 디스플레이 시스템을 사용하여, 상기 물리적 환경의 미리 정의된 로케이션에 디스플레이하기 위한 시각적 텍스트 그래픽들을 상기 획득한 텍스트로부터 생성하는 기능; 및
상기 디스플레이 시스템에 의해 상기 디스플레이 상에 상기 물리적 환경의 미리 정의된 로케이션에 상기 시각적 텍스트 그래픽을 제시하는 기능을 포함하는, 증강 현실 시스템.
제1 항에 있어서,
상기 프로세서에 의한 프로그래밍의 실행은 상기 미리 정의된 로케이션으로부터 상기 시각적 텍스트 그래픽을 이동시키도록, 상기 안경류 디바이스를 추가로 구성하는, 증강 현실 시스템.
제2 항에 있어서,
상기 시각적 텍스트 그래픽들을 이동시키는 것은 상기 사용자의 시선 방향에 응답하는, 증강 현실 시스템.
제2 항에 있어서,
상기 시각적 텍스트 그래픽들을 이동시키는 것은 상기 사용자의 손 제스처에 응답하는, 증강 현실 시스템.
제1 항에 있어서,
상기 시각적 텍스트 그래픽들은 캡션의 형태인, 증강 현실 시스템.
제1 항에 있어서,
마이크폰을 더 포함하며, 상기 음성 인식 시스템은 상기 마이크폰을 통해 수신된 음성을 인식하고 상기 수신된 음성을 텍스트로 변환하도록 구성되는, 증강 현실 시스템.
제1 항에 있어서,
상기 포지션 검출 시스템은 상기 이미지 캡처 시스템을 사용하여 이미지 또는 비디오 데이터의 프레임들의 시퀀스를 캡처하며, 상기 시각 텍스트 그래픽은 상기 캡처된 이미지 또는 상기 비디오 데이터의 프레임들의 시퀀스에 추가되며 상기 메모리에 저장되는, 증강 현실 시스템.
포지션 검출 시스템, 이미지 캡처 시스템, 음성 인식 시스템 및 디스플레이 시스템을 갖는 안경류 디바이스와 함께 사용하기 위한 증강 현실 방법으로서,
상기 이미지 캡처 시스템을 사용하여 상기 물리적 환경의 이미지를 캡처하는 단계;
사용자 입력, 데이터 입력 또는 상기 음성 인식 시스템으로부터 텍스트를 획득하는 단계;
상기 디스플레이 시스템을 사용하여, 상기 물리적 환경의 미리 정의된 로케이션에 디스플레이하기 위한 시각적 텍스트 그래픽들을 상기 획득한 텍스트로부터 생성하는 단계; 및
상기 디스플레이 시스템에 의해 상기 디스플레이 상에 상기 물리적 환경의 미리 정의된 로케이션에 상기 시각적 텍스트 그래픽을 제시하는 단계를 포함하는, 증강 현실 방법.
제8 항에 있어서,
상기 미리 정의된 로케이션으로부터 상기 시각적 텍스트 그래픽을 이동시키는 단계를 더 포함하는, 증강 현실 방법.
제9 항에 있어서,
상기 시각적 텍스트 그래픽들을 이동시키는 단계는 상기 사용자의 시선 방향에 응답하는, 증강 현실 방법.
제9 항에 있어서,
상기 시각적 텍스트 그래픽들을 이동시키는 단계는 상기 사용자의 손 제스처에 응답하는, 증강 현실 방법.
제8 항에 있어서,
상기 시각적 텍스트 그래픽은 캡션의 형태인, 증강 현실 방법.
제8 항에 있어서,
상기 안경류 디바이스는 마이크로폰을 더 포함하며, 상기 음성 인식 시스템은 상기 마이크폰을 통해 수신된 음성을 인식하고 상기 수신된 음성을 상기 텍스트로 변환하도록 구성되는, 증강 현실 방법.
제8 항에 있어서,
상기 디스플레이 시스템은 상기 안경류 디바이스에 의해 지원되는 시-스루 디스플레이를 포함하며,
상기 제시하는 단계는 상기 시-스루 디스플레이 상에 상기 시각적 텍스트 그래픽을 제시하는 단계를 포함하는, 증강 현실 방법.
프로그램 코드를 저장한 비-일시적 컴퓨터-판독 가능 매체로서,
상기 프로그램 코드는, 실행될 때, 전자 프로세서로 하여금,
카메라를 사용하여 비디오 데이터의 프레임들의 시퀀스들을 캡처하는 단계 - 비디오 데이터의 각각의 프레임은 복수의 픽셀들에 대한 깊이 정보를 포함하고, 상기 카메라는 프로세서, 메모리 및 시-스루 디스플레이를 포함하는 안경류 디바이스에 커플링됨 -;
상기 물리적 환경의 이미지를 캡처하는 단계;
사용자 입력, 데이터 입력 또는 음성 인식 시스템으로부터 텍스트를 획득하는 단계;
상기 디스플레이 시스템을 사용하여, 상기 물리적 환경의 미리 정의된 로케이션에 디스플레이하기 위한 시각적 텍스트 그래픽들을 상기 획득한 텍스트로부터 생성하는 단계; 및
상기 디스플레이 시스템에 의해 상기 디스플레이 상에 상기 물리적 환경의 미리 정의된 로케이션에 상기 시각적 텍스트 그래픽을 제시하는 단계를 수행하게 하도록, 동작하는, 비-일시적 컴퓨터-판독 가능 매체.
제15 항에 있어서,
상기 프로그램 코드는, 실행될 때, 전자 프로세서로 하여금 추가로, 상기 시-스루 디스플레이 상에 상기 시각적 텍스트 그래픽을 제시하는 단계를 수행하게 하도록 동작하는, 비-일시적 컴퓨터-판독 가능 매체.
제15 항에 있어서,
상기 프로그램 코드는, 실행될 때, 전자 프로세서로 하여금 추가로, 상기 미리 정의된 로케이션으로부터 상기 시각적 텍스트 그래픽을 이동시키는 단계를 수행하게 하도록 동작하는, 비-일시적 컴퓨터-판독 가능 매체.
제17 항에 있어서,
상기 시각적 텍스트 그래픽들을 이동시키는 단계는 상기 사용자의 시선 방향에 응답하는, 비-일시적 컴퓨터-판독 가능 매체.
제17 항에 있어서,
상기 시각적 텍스트 그래픽들을 이동시키는 단계는 상기 사용자의 손 제스처에 응답하는, 비-일시적 컴퓨터-판독 가능 매체.
제15 항에 있어서,
상기 프로그램 코드는, 실행될 때, 전자 프로세서로 하여금 추가로, 상기 음성 인식 시스템으로부터 텍스트를 획득하는 단계를 수행하게 하도록 동작하며,
상기 음성 인식 시스템은 상기 마이크폰을 통해 수신된 음성을 인식하고 상기 수신된 음성을 텍스트로 변환하도록 구성되는, 비-일시적 컴퓨터-판독 가능 매체.