KR20150004051A - 리모트 컨트롤러 및 멀티미디어 디바이스의 제어 방법 - Google Patents
리모트 컨트롤러 및 멀티미디어 디바이스의 제어 방법 Download PDFInfo
- Publication number
- KR20150004051A KR20150004051A KR20130076996A KR20130076996A KR20150004051A KR 20150004051 A KR20150004051 A KR 20150004051A KR 20130076996 A KR20130076996 A KR 20130076996A KR 20130076996 A KR20130076996 A KR 20130076996A KR 20150004051 A KR20150004051 A KR 20150004051A
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- voice
- remote controller
- unit
- multimedia device
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000004891 communication Methods 0.000 claims abstract description 77
- 238000012545 processing Methods 0.000 claims abstract description 58
- 230000005236 sound signal Effects 0.000 claims description 35
- 238000006243 chemical reaction Methods 0.000 claims description 19
- 239000000284 extract Substances 0.000 claims description 9
- 230000008569 process Effects 0.000 abstract description 23
- 230000006870 function Effects 0.000 description 63
- 238000010586 diagram Methods 0.000 description 32
- 230000033001 locomotion Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008054 signal transmission Effects 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008571 general function Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08C—TRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
- G08C17/00—Arrangements for transmitting signals characterised by the use of a wireless electrical link
- G08C17/02—Arrangements for transmitting signals characterised by the use of a wireless electrical link using a radio link
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42204—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
-
- G—PHYSICS
- G08—SIGNALLING
- G08C—TRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
- G08C2201/00—Transmission systems of control signals via wireless link
- G08C2201/30—User interface
- G08C2201/31—Voice input
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- General Physics & Mathematics (AREA)
- Selective Calling Equipment (AREA)
Abstract
리모트 컨트롤러 및 멀티미디어 디바이스의 제어 방법이 개시된다. 멀티미디어 디바이스 및 적어도 하나의 외부 디바이스를 제어하는 본 발명의 일 실시예에 의한 리모트 컨트롤러는, 사용자가 발화하는 음성을 수신하여 음성 신호로 변환하는 음성 입력부와, 상기 음성 신호를 처리하는 음성 처리부와, 상기 처리된 음성 신호로부터 제1 코드값을 검출하는 음성 인식부와, 상기 검출된 제1 코드값에 대응하는 제1 제어 신호를 제1 통신 규격에 따라 송신하되 복수 개의 방향을 향해 상기 제1 제어 신호를 각각 송신하는 통신부를 포함한다.
Description
본 발명은 리모트 컨트롤러 및 멀티미디어 디바이스의 제어 방법에 관한 것으로서, 보다 상세하게는 하나의 리모트 컨트롤러를 사용하여 멀티미디어 디바이스 및 외부 디바이스를 제어하는 기술에 관한 것이다.
전자 기술의 발달에 따라, 점차 더 많은 종류의 전자 장치가 개발되어 보급되고 있다. 최근 보급되는 전자 장치들은 사용자의 편의를 위해 리모트 컨트롤러의 신호를 수신할 수 있는 기능을 구비한다. 이에 따라, 사용자는 리모트 컨트롤러를 이용하여 TV, 오디오, DVD 플레이어, 에어컨, 선풍기 등의 각종 전자 장치들을 제어할 수 있다.
한편, 최근 개발되고 있는 멀티미디어 디바이스(예를 들어, TV 등)는 인터넷 네트워크와 연결되어 다양한 정보들을 수신하는 기능을 탑재하고 있다. 이러한 멀티미디어 디바이스 및 이에 연결된 전자 장치(예를 들어, STB, DB 플레이어, DVD 플레이어, PC 등)를 제어하기 위해서는 디바이스의 수만큼 리모트 컨트롤러가 필요한 문제가 있다.
물론, 하나의 리모트 컨트롤러를 사용하여 복수 개의 디바이스를 제어하기 위한 기술 논의도 이루어지고 있으나, 대부분 하나의 통신 규격으로 제한되는 문제가 있다. 또한, 리모트 컨트롤러를 사용하여 적외선 통신 방식에 의해 복수 개의 디바이스를 제어하는 경우, STB 등과 같은 디바이스가 TV와 다른 장소에 위치하는 경우 적외선 신호의 직진성으로 인하여 리모트 컨트롤러의 제어 신호가 디바이스에 도달하기 어려운 문제점도 존재한다.
본 발명의 일 실시예가 이루고자 하는 기술적 과제는, 음성 인식 기능을 탑재한 리모트 컨트롤러를 사용하여 복수 개의 디바이스를 제어하기 위한 솔루션을 제공하는 것이다.
또한, 본 발명의 일 실시예가 이루고자 하는 기술적 과제는, 사용자가 리모트 컨트롤러의 위치를 인식할 필요 없이 제어 명령을 발화하는 것만으로 복수 개의 디바이스를 제어할 수 있도록 하여 사용자 편의성을 극대화하기 위한 것이다.
또한, 본 발명의 일 실시예가 이루고자 하는 기술적 과제는, 음성 인식률을 향상시킬 수 있는 리모트 컨트롤러 및 멀티미디어 디바이스를 제공하고자 하는 것이다.
멀티미디어 디바이스 및 적어도 하나의 외부 디바이스를 제어하는 본 발명의 일 실시예에 의한 리모트 컨트롤러는, 사용자가 발화하는 음성을 수신하여 음성 신호로 변환하는 음성 입력부와, 상기 음성 신호를 처리하는 음성 처리부와, 상기 처리된 음성 신호로부터 제1 코드값을 검출하는 음성 인식부와, 상기 검출된 제1 코드값에 대응하는 제1 제어 신호를 제1 통신 규격에 따라 송신하되 복수 개의 방향을 향해 상기 제1 제어 신호를 각각 송신하는 통신부를 포함한다.
상기 음성 인식부는, 상기 처리된 음성 신호의 특징 정보를 추출하고, 상기 추출된 특징 정보에 기초하여 음성 신호를 텍스트로 변환하고, 상기 변환된 제1 텍스트에 매칭되는 제1 코드값을 검출하도록 설계될 수 있다.
텍스트에 매칭되는 코드값들을 상기 복수 개의 디바이스 별로 구분하여 저장하는 저장부를 더 포함할 수 있다.
상기 텍스트는 트리거 단어(trigger word), 디바이스 명, 그리고 기능 제어 단어를 포함할 수 있다.
상기 음성 인식부는, 상기 처리된 음성 신호의 특징 정보를 추출하고, 상기 추출된 특징 정보에 기초하여 텍스트 변환 가능 여부를 판단하도록 설계될 수 있다.
상기 통신부는, 상기 음성 인식부에서 텍스트 변환이 가능하지 않다고 판단된 경우, 상기 처리된 음성 신호를 제2 통신 규격에 따라 상기 멀티미디어 디바이스로 전송하도록 설계될 수 있다.
상기 통신부는 상기 제1 통신 규격에 따라 신호를 송신하는 IR 모듈 및 상기 제2 통신 규격에 따라 신호를 송수신하는 RF 모듈을 포함할 수 있다.
상기 통신부는 상기 처리된 음성 신호에 대응하는 제2 코드값을 상기 제2 통신 규격에 따라 상기 멀티미디어 디바이스로부터 수신하고, 상기 제2 코드값에 대응하는 제2 제어 신호를 상기 제1 통신 규격에 따라 송신하도록 설계될 수 있다.
멀티미디어 디바이스 및 적어도 하나의 외부 디바이스를 제어하는 본 발명의 일 실시예에 의한 리모트 컨트롤러의 제어 방법은, 사용자가 발화하는 음성을 수신하여 음성 신호로 변환하는 단계와, 상기 음성 신호를 처리하는 단계와, 상기 처리된 음성 신호로부터 제1 코드값을 검출하는 단계와, 상기 검출된 제1 코드값에 대응하는 제1 제어 신호를 제1 통신 규격에 따라 송신하는 단계를 포함하고, 상기 제1 제어 신호 송신 단계는, 복수 개의 방향을 향해 상기 제어 신호를 송신한다.
상기 코드값 검출 단계는, 상기 처리된 음성 신호의 특징 정보를 추출하는 단계와, 상기 추출된 특징 정보에 기초하여 음성 신호를 제1 텍스트로 변환하는 단계와, 상기 변환된 제1 텍스트에 매칭되는 제1 코드값을 검출하는 단계를 포함한다.
상기 리모트 컨트롤러의 제어 방법은 텍스트에 매칭되는 코드값들을 상기 복수 개의 디바이스 별로 구분하여 데이터베이스를 구축하는 단계를 더 포함한다.
상기 리모트 컨트롤러의 제어 방법은 상기 처리된 음성 신호의 특징 정보를 추출하고, 상기 추출된 특징 정보에 기초하여 텍스트 변환 가능 여부를 판단하는 단계와, 텍스트 변환이 가능하지 않다고 판단된 경우, 상기 처리된 음성 신호를 제2 통신 규격에 따라 상기 멀티미디어 디바이스로 전송하는 단계를 더 포함한다.
상기 리모트 컨트롤러의 제어 방법은 상기 처리된 음성 신호에 대응하는 제2 코드값을 상기 제2 통신 규격에 따라 상기 멀티미디어 디바이스로부터 수신하는 단계와, 상기 제2 코드값에 대응하는 제2 제어 신호를 상기 제1 통신 규격에 따라 송신하는 단계를 더 포함한다.
적어도 하나의 외부 디바이스와 연결된 본 발명의 일 실시예에 의한 멀티미디어 디바이스의 제어 방법은, 리모트 컨트롤러로부터 제1 음성 신호를 수신하는 단계와, 상기 수신된 제1 음성 신호를 처리하는 단계와, 상기 처리된 제1 음성 신호를 외부 서버로 전송하는 단계와, 상기 전송된 제1 음성 신호로부터 변환된 텍스트를 상기 외부 서버로부터 수신하는 단계와, 상기 수신된 텍스트에 매칭되는 코드값을 검출하는 단계와, 상기 검출된 코드값을 리모트 컨트롤러로 전송하는 단계를 포함한다.
상기 멀티미디어 디바이스의 제어 방법은 텍스트에 매칭되는 코드값들을 상기 적어도 하나의 디바이스 별로 구분하여 데이터베이스를 구축하는 단계를 포함한다.
상기 멀티미디어 디바이스의 제어 방법은 상기 전송된 제1 음성 신호에 대응하는 컨텐츠 정보를 상기 외부 서버로부터 수신하는 단계와, 상기 수신된 컨텐츠 정보를 포함하는 그래픽 사용자 인터페이스를 생성하는 단계와, 상기 생성된 그래픽 사용자 인터페이스를 디스플레이하는 단계를 더 포함한다.
상기 멀티미디어 디바이스의 제어 방법은 컨텐츠 신호를 수신하는 단계와, 상기 컨텐츠 신호를 제2 음성 신호와 영상 신호로 디멀티플렉싱하는 단계와, 상기 디멀티플렉싱된 제2 음성 신호와 영상 신호를 각각 처리하는 단계와, 상기 처리된 제2 음성 신호를 오디오 출력부를 통해 출력하고, 상기 처리된 영상 신호를 디스플레이부를 통해 출력하는 단계를 더 포함한다.
상기 제1 음성 신호 처리 단계는, 상기 제1 음성 신호와, 상기 제1 음성 신호가 수신되기 전 기설정된 시간 동안 상기 오디오 출력부를 통해 출력된 상기 제2 음성 신호를 비교하는 단계와, 상기 제1 음성 신호에서 상기 제2 음성 신호와 동일한 부분을 제거하는 단계를 포함한다.
본 발명의 일 실시예에 의하면, 음성 인식 기능을 탑재한 리모트 컨트롤러를 사용하여 복수 개의 디바이스를 제어할 수 있다.
또한, 본 발명의 일 실시예에 의하면, 사용자가 리모트 컨트롤러의 위치를 인식할 필요 없이 제어 명령을 발화하는 것만으로 복수 개의 디바이스를 제어할 수 있도록 하여 사용자 편의성을 극대화할 수 있다.
또한, 본 발명의 일 실시예에 의하면, 음성 인식률을 향상시킬 수 있는 리모트 컨트롤러 및 멀티미디어 디바이스를 제공할 수 있다.
도 1은 본 발명의 일 실시예에 따른 리모트 컨트롤러 및 이에 의해 제어되는 복수 개의 디바이스를 포함한 시스템을 개략적으로 도시한 도면이다.
도 2는 본 발명의 일 실시예에 따른 리모트 컨트롤러 및 이에 의해 제어되는 복수 개의 디바이스를 포함한 시스템을 개략적으로 도시한 도면이다.
도 3은 본 발명의 일 실시예에 따른 리모트 컨트롤러 및 이에 의해 제어되는 복수 개의 디바이스를 포함한 시스템을 개략적으로 도시한 도면이다.
도 4는 본 발명의 일 실시예에 따른 리모트 컨트롤러 및 이에 의해 제어되는 복수 개의 디바이스를 포함한 시스템을 개략적으로 도시한 도면이다.
도 5는 본 발명의 일 실시예에 따른 리모트 컨트롤러의 구성 모듈들을 도시한 블록도이다.
도 6은 본 발명의 일 실시예에 따른 리모트 컨트롤러가 저장하고 있는 코드값들의 데이터베이스의 일 예를 도시한 도면이다.
도 7은 본 발명의 일 실시예에 따른 리모트 컨트롤러가 저장하고 있는 코드값들의 데이터베이스의 다른 일 예를 도시한 도면이다.
도 8은 본 발명의 일 실시예에 따라 리모트 컨트롤러를 사용하여 디바이스를 제어하는 방법을 도시한 흐름도이다.
도 9는 본 발명의 일 실시예에 따른 멀티미디어 디바이스가 제공하는 그래픽 사용자 인터페이스를 도시한 도면이다.
도 10은 본 발명의 일 실시예에 따른 멀티미디어 디바이스가 제공하는 그래픽 사용자 인터페이스를 도시한 도면이다.
도 11은 본 발명의 일 실시예에 따른 멀티미디어 디바이스의 구성 모듈들을 설명하기 위한 블록도이다.
도 12는 도 11에 도시된 멀티미디어 디바이스의 제어부를 보다 상세히 도시한 블록도이다.
도 13은 본 발명의 일 실시예에 따른 제2 리모트 컨트롤러의 외관을 간략히 도시한 도면이다.
도 14는 도 13에 도시된 제2 리모트 컨트롤러의 구성요소들을 상세히 도시한 블록도이다.
도 15는 본 발명의 일 실시예에 따른 멀티미디어 디바이스의 구성 모듈들을 설명하기 위한 블록도이다.
도 16은 본 발명의 일 실시예에 따른 음성 인식 플로우를 설명하기 위한 도면이다.
도 17은 본 발명의 일 실시예에 따른 음성 인식 플로우를 설명하기 위한 도면이다.
도 18은 본 발명의 일 실시예에 따른 음성 인식 플로우를 설명하기 위한 도면이다.
도 19는 본 발명의 일 실시예에 따른 멀티미디어 디바이스의 제어부에서 컨텐츠 음성신호를 제거하는 플로우를 설명하기 위한 도면이다.
도 20은 복수 개의 리모트 컨트롤러가 존재하는 실시예를 설명하기 위한 도면이다.
도 2는 본 발명의 일 실시예에 따른 리모트 컨트롤러 및 이에 의해 제어되는 복수 개의 디바이스를 포함한 시스템을 개략적으로 도시한 도면이다.
도 3은 본 발명의 일 실시예에 따른 리모트 컨트롤러 및 이에 의해 제어되는 복수 개의 디바이스를 포함한 시스템을 개략적으로 도시한 도면이다.
도 4는 본 발명의 일 실시예에 따른 리모트 컨트롤러 및 이에 의해 제어되는 복수 개의 디바이스를 포함한 시스템을 개략적으로 도시한 도면이다.
도 5는 본 발명의 일 실시예에 따른 리모트 컨트롤러의 구성 모듈들을 도시한 블록도이다.
도 6은 본 발명의 일 실시예에 따른 리모트 컨트롤러가 저장하고 있는 코드값들의 데이터베이스의 일 예를 도시한 도면이다.
도 7은 본 발명의 일 실시예에 따른 리모트 컨트롤러가 저장하고 있는 코드값들의 데이터베이스의 다른 일 예를 도시한 도면이다.
도 8은 본 발명의 일 실시예에 따라 리모트 컨트롤러를 사용하여 디바이스를 제어하는 방법을 도시한 흐름도이다.
도 9는 본 발명의 일 실시예에 따른 멀티미디어 디바이스가 제공하는 그래픽 사용자 인터페이스를 도시한 도면이다.
도 10은 본 발명의 일 실시예에 따른 멀티미디어 디바이스가 제공하는 그래픽 사용자 인터페이스를 도시한 도면이다.
도 11은 본 발명의 일 실시예에 따른 멀티미디어 디바이스의 구성 모듈들을 설명하기 위한 블록도이다.
도 12는 도 11에 도시된 멀티미디어 디바이스의 제어부를 보다 상세히 도시한 블록도이다.
도 13은 본 발명의 일 실시예에 따른 제2 리모트 컨트롤러의 외관을 간략히 도시한 도면이다.
도 14는 도 13에 도시된 제2 리모트 컨트롤러의 구성요소들을 상세히 도시한 블록도이다.
도 15는 본 발명의 일 실시예에 따른 멀티미디어 디바이스의 구성 모듈들을 설명하기 위한 블록도이다.
도 16은 본 발명의 일 실시예에 따른 음성 인식 플로우를 설명하기 위한 도면이다.
도 17은 본 발명의 일 실시예에 따른 음성 인식 플로우를 설명하기 위한 도면이다.
도 18은 본 발명의 일 실시예에 따른 음성 인식 플로우를 설명하기 위한 도면이다.
도 19는 본 발명의 일 실시예에 따른 멀티미디어 디바이스의 제어부에서 컨텐츠 음성신호를 제거하는 플로우를 설명하기 위한 도면이다.
도 20은 복수 개의 리모트 컨트롤러가 존재하는 실시예를 설명하기 위한 도면이다.
이하에서는 도면을 참조하여 본 발명을 더욱 상세하게 설명한다.
이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 단순히 본 명세서 작성의 용이함을 고려하여 부여되는 것으로서, 상기 "모듈" 및 "부"는 서로 혼용되어 사용될 수도 있다.
한편, 본 명세서에서 기술되는 멀티미디어 디바이스는, 예컨대 방송 수신 기능에 컴퓨터 지원 기능을 추가한 지능형 네트워크 TV로서, 방송 수신 기능에 충실하면서도 인터넷 기능 등이 추가되어, 수기 방식의 입력 장치, 터치 스크린 또는 공간 리모콘 등보다 사용에 편리한 인터페이스를 갖출 수 있다. 그리고 유선 또는 무선 인터넷 기능의 지원으로 인터넷 및 컴퓨터에 접속되어, 이메일, 웹브라우징, 뱅킹 또는 게임 등의 기능도 수행 가능하다. 이러한 다양한 기능을 위해 표준화된 범용 OS가 사용될 수 있다.
나아가, 본 발명에서 기술되는 멀티미디어 디바이스는, 예를 들어 범용의 OS 커널 상에, 다양한 애플리케이션이 자유롭게 추가되거나 삭제 가능하므로, 사용자 친화적인 다양한 기능이 수행될 수 있다.
더욱이, 이하 첨부 도면들 및 첨부 도면들에 기재된 내용들을 참조하여 본 발명의 실시 예를 상세하게 설명하지만, 본 발명이 실시 예들에 의해 제한되거나 한정되는 것은 아니다.
본 명세서에서 사용되는 용어는 본 발명에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어를 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 관례 또는 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 그 의미를 기재할 것이다. 따라서 본 명세서에서 사용되는 용어는, 단순한 용어의 명칭이 아닌 그 용어가 가지는 실질적인 의미와 본 명세서의 전반에 걸친 내용을 토대로 해석되어야 함을 밝혀두고자 한다.
도 1은 본 발명의 일 실시예에 따른 리모트 컨트롤러 및 이에 의해 제어되는 복수 개의 디바이스를 포함한 시스템을 개략적으로 도시한 도면이다. 이하, 도 1을 참조하여, 본 발명의 일 실시예에 따른 리모트 컨트롤러 및 이에 의해 제어되는 복수 개의 디바이스를 포함한 시스템을 설명하면 다음과 같다.
도 1에 도시된 바와 같이, 본 발명의 일 실시예에 따른 리모트 컨트롤러(100)는 복수 개의 디바이스(200)를 제어할 수 있다. 리모트 컨트롤러(100)에 의해 제어되는 디바이스(200)로서 DVD 플레이어(210), BD(Blu-ray Disc) 플레이어(220), 및 사운드 바(230)를 예시하였으나, 이에 한정되지 않으며 그 밖에 임의의 전자 장치도 리모트 컨트롤러(100)에 의해 제어되는 디바이스(200)에 해당할 수 있다.
리모트 컨트롤러(100)는 음성 인식 기능을 탑재하고 있다. 리모트 컨트롤러(100)는 사용자가 발화하는 음성을 수신하고, 상기 수신된 음성을 인식하여 이와 매칭되는 IR 코드값을 검출한 후, 상기 검출된 IR 코드값에 대응하는 IR 신호를 송신하여 복수 개의 디바이스(200)를 제어할 수 있다. 리모트 컨트롤러(100)는 제1 통신 수단(예를 들어, 적외선 통신 등)으로 상기 IR 신호를 송신하는 것으로 가정한다. 상기 IR 코드값은 임의의 디바이스의 특정 기능에 각각 매칭되며, 복수 개의 디바이스(200) 별로 구분되어 리모트 컨트롤러(100) 내에 저장되어 있을 수 있다.
실시예에 따르면, 하나의 리모트 컨트롤러(100)를 사용하여 복수 개의 디바이스(200)를 제어할 수 있으며, 사용자는 리모트 컨트롤러(100)의 위치를 찾을 필요 없이 음성을 발화하는 것만으로 간편하게 디바이스(200)를 제어할 수 있다. 구체적인 제어 방법에 대해서는 후술하기로 한다.
도 2는 본 발명의 일 실시예에 따른 리모트 컨트롤러 및 이에 의해 제어되는 복수 개의 디바이스를 포함한 시스템을 개략적으로 도시한 도면이다. 이하, 도 2를 참조하여, 본 발명의 일 실시예에 따른 리모트 컨트롤러 및 이에 의해 제어되는 복수 개의 디바이스를 포함한 시스템을 설명하면 다음과 같다.
도 2에 도시된 바와 같이, 본 발명의 일 실시예에 따른 리모트 컨트롤러(100)는 멀티미디어 디바이스(300) 및 그 밖의 외부 디바이스(200)를 제어할 수 있다.
멀티미디어 디바이스(300)는 예컨대 방송 수신 기능에 컴퓨터 지원 기능을 추가한 지능형 네트워크 TV로서, 방송 수신 기능에 충실하면서도 인터넷 기능 등이 추가된 장치이다. 예를 들어, 멀티미디어 디바이스(300)는 네트워크 TV, 스마트 TV, HBBTV(Hybrid Brodacast Broadband Television), 인터넷 TV, 웹 TV, IPTV(Internet Protocol Television) 등에 해당한다.
외부 디바이스(200)는 멀티미디어 디바이스(300)를 제외한 임의의 전자 장치를 의미하며, 멀티미디어 디바이스(300)와 유/무선으로 연결된 전자 장치(예를 들어, DVD 플레이어, BD 플레이어, STB, 사운드 바, 냉장고 등)일 수도 있고, 멀티미디어 디바이스(300)와 무관하게 기능하는 전자 장치(에어컨, 세탁기 등)일 수도 있으며, 이에 제한을 두지 않는다. 물론, 외부 디바이스(200)가 에어컨, 세탁기 등의 전자 장치인 경우라도, 외부 디바이스(200)의 기능에 따라 멀티미디어 디바이스(300)와 유/무선으로 연결되어 사용될 수도 있다. 본 명세서에서는, 경우에 따라 멀티미디어 디바이스(300)와 외부 디바이스(200)를 구별하지 않고 디바이스라 통칭할 수도 있다.
리모트 컨트롤러(100)는 음성 인식 기능을 탑재하고 있다. 리모트 컨트롤러(100)는 사용자가 발화하는 음성을 수신하고, 상기 수신된 음성을 인식하여 이와 매칭되는 IR 코드값을 검출한 후, 상기 검출된 IR 코드값에 대응하는 IR 신호를 송신하여 복수 개의 디바이스(200, 300)를 제어할 수 있다. 리모트 컨트롤러(100)는 제1 통신 수단(예를 들어, 적외선 통신 등)으로 상기 IR 신호를 송신하는 것으로 가정한다. 상기 IR 코드값은 임의의 디바이스의 특정 기능에 각각 매칭되며, 복수 개의 디바이스(200, 300) 별로 구분되어 리모트 컨트롤러(100) 내에 저장되어 있을 수 있다.
리모트 컨트롤러(100)는 사용자로부터 수신된 음성 신호가 리모트 컨트롤러(100)에 탑재된 음성 인식 기능을 통해서 처리할 수 있는지 여부를 판단하고, 리모트 컨트롤러(100) 내에서 처리할 수 없는 경우, 상기 수신된 음성 신호를 멀티미디어 디바이스(300)로 전송한다. 즉, 사용자가 복잡한 자연어(예를 들어, “CSI 시즌 2의 15회 에피소드 검색” 등)를 발화하는 경우, 리모트 컨트롤러(100) 내에서 정확하게 음성 인식을 하는 것이 어렵기 때문에, 리모트 컨트롤러(100)는 수신된 음성 신호를 멀티미디어 디바이스(300)로 전송하도록 설계된다. 상기 음성 신호를 처리한다는 의미는, 음성 인식을 통해 음성 신호를 텍스트로 변환할 수 있다는 의미이다.
멀티미디어 디바이스(300)는 리모트 컨트롤러(100)로부터 음성 신호를 수신하여 소정의 절차에 따라 처리하고, 처리된 음성 신호를 인터넷 네트워크 등을 통해 연결된 서버(400)에 전송한다. 서버(400)는 복잡한 자연어를 포함하는 음성을 분석하여 처리할 수 있도록 설계된다.
멀티미디어 디바이스(300)는 서버(400)의 처리 결과를 수신하고, 수신된 처리 결과에 따라, 리모트 컨트롤러(100)로부터 수신한 상기 음성 신호에 대응하는 IR 코드값을 리모트 컨트롤러(100)에 전송한다. 멀티미디어 디바이스(300)와 리모트 컨트롤러(100)는 제2 통신 수단(예를 들어, 블루투스, WLAN, 지그비(zigbee) 등의 근거리 통신 수단)으로 데이터를 송수신하는 것으로 가정한다.
그리고, 리모트 컨트롤러(100)는 상기 수신된 IR 코드값에 대응하는 IR 신호를 송신하여 외부 디바이스(200)를 제어한다. 상기 IR 신호의 송신은 상술한 바와 같이 제1 통신 수단을 통해 이루어진다.
즉, 본 발명은 리모트 컨트롤러(100)를 사용하여 복수 개의 디바이스(200, 300)를 제어하는 방법으로서 두 가지 솔루션을 제안한다.
첫째, 사용자로부터 수신된 음성 신호가 리모트 컨트롤러(100) 내에서 음성 인식 처리가 가능한 경우, 리모트 컨트롤러(100)는 상기 수신된 음성 신호가 어떠한 디바이스의 어떠한 기능을 제어하려는 것인지 분석하고, 그 결과에 따라 IR 신호를 송신하여 특정 디바이스의 특정 기능을 제어한다. 이 경우, 상기 IR 신호는 제1 통신 수단으로 송신된다.
둘째, 사용자로부터 수신된 음성 신호가 리모트 컨트롤러(100) 내에서 음성 인식 처리가 가능하지 않은 경우, 상기 수신된 음성 신호를 멀티미디어 디바이스(300)로 전송하여 서버(400)를 통해 분석하고, 그 결과에 따른 IR 코드값을 멀티미디어 디바이스(300)로부터 수신하고, 수신된 IR 코드값에 대응하는 IR 신호를 송신하여 특정 디바이스의 특정 기능을 제어한다. 이 경우, 상기 IR 신호는 제1 통신 수단으로 송신되고, 리모트 컨트롤러(100)와 멀티미디어 디바이스(400) 간에는 제2 통신 수단으로 데이터를 송수신한다.
상기 두 번째 솔루션에서, 멀티미디어 디바이스(300) 내에 음성 인식 기능이 탑재된 경우, 상기 서버(400)를 통하지 않고 멀티미디어 디바이스(300) 내에서 음성 인식 과정이 수행될 수도 있다.
도 3은 본 발명의 일 실시예에 따른 리모트 컨트롤러 및 이에 의해 제어되는 복수 개의 디바이스를 포함한 시스템을 개략적으로 도시한 도면이다. 이하, 도 3을 참조하여, 본 발명의 일 실시예에 따른 리모트 컨트롤러 및 이에 의해 제어되는 복수 개의 디바이스를 포함한 시스템을 설명하면 다음과 같다.
도 3에 도시된 바와 같이, 본 발명의 일 실시예에 따른 리모트 컨트롤러(100)는 멀티미디어 디바이스(300) 및 그 밖의 외부 디바이스(200)를 제어할 수 있다. 리모트 컨트롤러(100)에 의해 제어되는 외부 디바이스(200)로서 DVD 플레이어(210), BD(Blu-ray Disc) 플레이어(220), 사운드 바(230), 및 에어컨(240)을 예시하였으나, 이에 한정되지 않는다.
리모트 컨트롤러(100)는 음성 인식 기능을 탑재하고 있다. 리모트 컨트롤러(100)는 사용자가 발화하는 음성을 수신하고, 상기 수신된 음성을 인식하여 이와 매칭되는 IR 코드값을 검출한 후, 상기 검출된 IR 코드값에 대응하는 IR 신호를 송신하여 복수 개의 디바이스(200, 300)를 제어할 수 있다.
리모트 컨트롤러(100)는 복수 개의 IR 신호 송신부(101)를 구비하고, 상기 복수 개의 IR 신호 송신부(101)를 통해 IR 신호를 복수 개의 방향으로 송신한다.
예를 들어, 사용자가 에어컨(240)을 제어하고자 하는 경우 에어컨(240)의 기능과 관련된 음성을 발화하고, 리모트 컨트롤러(100)는 사용자로부터 수신된 음성 신호에 대응하는 IR 신호를 송신한다. 이 경우, 상기 IR 신호는 복수 개의 IR 신호 송신부(101)를 통해 복수 개의 방향으로 송신된다. IR 신호는 직진성이 있으므로, 복수 개의 IR 신호 송신부(101) 중 특정 IR 신호 송신부(101)를 통해 송신된 IR 신호가 에어컨(240)에 수신되어 에어컨(240)이 제어된다.
종래의 리모트 컨트롤러의 경우, IR 신호의 직진성으로 인하여, 사용자가 리모트 컨트롤러를 손에 쥔 상태에서 제어하고자 하는 디바이스를 향하여 제어 신호를 송신해야만 하는 불편이 있었다.
실시예에 따르면, 사용자는 리모트 컨트롤러(100)가 어디 있는지 찾을 필요가 없으며, 임의의 디바이스를 제어하고자 하는 경우 음성을 발화하기만 하면, 리모트 컨트롤러(100)가 사용자의 음성 신호에 대응하는 IR 신호를 복수 개의 방향을 향해 송신함으로써 손쉽게 디바이스를 제어할 수 있다. 사용자는 제어하고자 하는 복수 개의 디바이스(200, 300)의 위치를 고려하여 리모트 컨트롤러(100)를 임의의 장소에 배치하기만 하면 된다.
도 4는 본 발명의 일 실시예에 따른 리모트 컨트롤러 및 이에 의해 제어되는 복수 개의 디바이스를 포함한 시스템을 개략적으로 도시한 도면이다. 이하, 도 4를 참조하여, 본 발명의 일 실시예에 따른 리모트 컨트롤러 및 이에 의해 제어되는 복수 개의 디바이스를 포함한 시스템을 설명하면 다음과 같다. 중복되는 내용은 도 1 내지 도 3을 참조할 수 있으며, 이에 대한 자세한 설명은 생략한다.
리모트 컨트롤러(100)는 멀티미디어 디바이스(300) 및 그 밖의 외부 디바이스(200)를 제어할 수 있다. 멀티미디어 디바이스(300)는 리모트 컨트롤러(100) 외에, 멀티미디어 디바이스(300)에 오리엔트된(oriented) 리모트 컨트롤러(500)에 의해서도 제어될 수 있다. 구별을 용이하게 하기 위하여, 위 두 개의 리모트 컨트롤러(100, 500)가 함께 언급되는 경우, 리모트 컨트롤러(100)는 제1 리모트 컨트롤러로, 리모트 컨트롤러(500)는 제2 리모트 컨트롤러로 칭하기로 한다. 다만, 본 명세서에서 특별히 지칭하지 않는 경우, 리모트 컨트롤러는 제1 리모트 컨트롤러(100)임을 명시해 둔다.
제1 리모트 컨트롤러(100)와 제2 리모트 컨트롤러(500)의 작동은 독립적으로 이루어진다.
외부 디바이스(200)(예를 들어, STB, BD 플레이어, PC 등)도 각각의 외부 디바이스(200)에 오리엔트된 별도의 리모트 컨트롤러가 존재할 수 있다.
다만, 본 발명의 일 실시예에 따르면, 하나의 제1 리모트 컨트롤러(100)를 사용하는 것만으로 복수 개의 디바이스(200, 300)를 제어할 수 있다.
도 5는 본 발명의 일 실시예에 따른 리모트 컨트롤러의 구성 모듈들을 도시한 블록도이다. 이하, 도 5를 참조하여, 본 발명의 일 실시예에 따른 리모트 컨트롤러의 구성 모듈들을 설명하면 다음과 같다. 다만, 도 5는 설명의 편의를 위한 실시예이며, 도 5에 도시된 구성모듈들 이외에 다른 구성 모듈을 포함하거나, 일부의 구성 모듈이 생략되는 형태도 본 발명의 권리범위에 속한다.
도 5에 도시된 바와 같이, 본 발명의 일 실시예에 따른 리모트 컨트롤러(100)는 음성 입력부(110), 음성 처리부(120), 제어부(130), 통신부(140), 저장부(150) 및 전원부(미도시)를 포함한다. 실시예에 따라, 리모트 컨트롤러(100)의 현 상태를 표시하는 디스플레이부를 더 포함할 수도 있다.
음성 입력부(110)는 사용자가 발화하는 음성을 수신한다. 음성 입력부(110)는 사용자의 음성을 센싱하여 전기적인 음성 신호로 변환하는 마이크로폰을 포함하여 이루어진다. 음성 입력부(110)는 복수 개 구비될 수도 있다.
상기 음성 신호는 음성 처리부(120)에서 소정의 처리 과정을 거친다. 음성 입력부(110)에서 입력된 음성에는 사용자의 음성뿐만 아니라 주변의 잡음이 포함된 경우가 대부분이므로, 음성 처리부(120)는, 추후 음성 인식 과정에서 음성 인식률을 높이기 위한 사전 처리 기능을 담당할 수 있다.
음성 처리부(120)는 잡음 제거부(122) 또는 선택부(124) 중 적어도 하나를 포함한다.
잡음 제거부(122)는 사용자의 음성 이외의 주변 잡음을 제거한다. 예를 들어, 잡음 제거부(122)는, 사용자의 음성 신호에서 에어컨 또는 냉장고의 소음과 같이 일정한 파형을 갖는 신호를 제거할 수 있다.
선택부(124)는 복수 개의 음성 입력부(110)를 통해 입력된 음성 신호들 중에서 사용자가 위치하는 특정 방향의 음성 입력부(110)에서 획득된 음성 신호만을 취할 수 있다. 예를 들어, 선택부(124)는, 복수 개의 음성 입력부(110)를 통해 입력된 음성 신호들 중에서 신호의 세기가 큰(즉, 음성의 소리 세기가 큰) 음성 신호만을 취할 수 있다.
제어부(130)는 리모트 컨트롤러(100)의 전반적인 동작을 제어한다. 제어부(130)는 음성 입력부(110), 음성 처리부(120), 통신부(140), 저장부(150) 등 리모트 컨트롤러(100)에 포함된 구성 모듈들의 동작을 제어할 수 있다.
제어부(130)는 음성 인식부(132)를 포함한다. 음성 처리부(120)에 의해 처리된 음성 신호는 음성 인식부(132)로 전달된다. 도 5에는 음성 인식부(132)가 제어부(130) 내에 포함된 것으로 도시하였으나, 실시예에 따라, 제어부(130)와 별개의 구성 모듈로 구현될 수도 있고, 음성 처리부(120) 내에 구현될 수도 있다.
음성 인식부(132)는 음성 처리부(120)에서 처리된 음성 신호에 포함된 사용자의 음성을 인식한다. 음성을 인식한다는 것은, 음성을 단순히 센싱하는 것이 아니라, 음성 신호를 분석하여 음성 신호를 텍스트로 변환하는 과정을 의미한다.
음성 인식부(132)는 상기 처리된 음성 신호의 파형을 추출하고, 이로부터 음성 신호의 특징 정보를 추출한다. 추출되는 특징 정보의 예로는, 입력되는 음성에 포함된 휴지(休止) 정보, 입력되는 음성의 음절의 개수 정보, 입력되는 음성의 진동수 정보, 입력되는 음성의 고저 정보 등일 수 있다.
음성 인식부(132)는 상기 추출된 특징 정보에 기초하여, 음성 신호를 텍스트로 변환한다. 그리고, 변환된 텍스트에 매칭되는 IR 코드값을 검출한다.
사용자가 TV의 채널을 한 단계 올리고자 하는 경우를 예로 들어 설명하면 다음과 같다.
사용자가 “TV 채널 업”이라는 음성을 발화하였다고 가정하자. 이러한 사용자의 음성은 사용자 주변의 잡음과 함께 음성 입력부(110)를 통해 입력되고, 음성 입력부(110)는 입력된 음성을 전기적인 음성 신호로 변환한다.
음성 처리부(120)는 상기 음성 신호에서 주변 잡음 신호를 제거하고, 소정의 처리 과정을 거친 음성 신호는 음성 인식부(132)로 전달된다.
음성 인식부(132)는 상기 처리된 음성 신호의 파형으로부터 특징 정보를 추출한다. 상기 음성 신호의 파형으로부터, “TV 채널 업”이라는 음성에는 두 군데에 휴지(休止) 부분이 존재한다는 휴지 정보, 세 개의 음절로 이루어진 것이라는 음절의 개수 정보, 음성의 고저 정보 또는 음성의 진동수 정보와 같은 특징 정보가 추출된다.
음성 인식부(132)는 상기 추출된 특징 정보로부터, 상기 음성 신호를 “TV 채널 업”이라는 텍스트로 변환한다. 그리고, 변환된 텍스트에 대응하는 IR 코드값을 검출한다. 상기 검출된 IR 코드값은 복수 개의 디바이스 중에서 TV를 특정하며, TV에서 구현되는 기능들 중에서 채널을 한 단계 올리는 채널 전환 기능을 특정한다.
사용자는, 음성 인식률을 높이기 위하여, 기설정된 메뉴얼에 따라, TV와 같은 “디바이스 명” 및 채널 업과 같은 “기능 제어 단어”를 순차적으로 발화할 수 있고, 디바이스 명과 기능 제어 단어 사이에는 일정한 휴지 부분을 삽입할 수 있다.
또는, 실시예에 따라, 리모트 컨트롤러(100)의 제어 모드가 TV 제어 모드로 설정되어 있는 경우에는, 사용자는 디바이스 명인 TV를 제외하고, 기능 제어 단어만을 발화할 수도 있다.
또한, 실시예에 따라, 사용자는 음성 발화를 시작할 때, 트리거 단어(trigger word)를 디바이스 명 앞에 발화할 수 있다. 예를 들어, 사용자는 “LG TV 채널 업”과 같이 미리 약속된 “LG”라는 트리거 단어를 제일 처음에 발화할 수 있으며, 리모트 컨트롤러(100)는 상기 트리거 단어가 인식된 경우, 음성 발화가 시작됨을 인지할 수 있다. 사용자는 트리거 단어와 디바이스 명 사이에 소정 간격의 휴지 부분을 삽입하는 것이 바람직하다. 이 경우, 음성 인식부(132)에 의해 변환된 텍스트에는, 트리거 단어, 디바이스 명, 그리고 기능 제어 단어가 포함될 수 있다. 리모트 컨트롤러(100)는 대기 전력 모드 상태로 대기 중에 있다가, 상기 트리거 단어가 인식되는 경우 전체 구성 모듈들에 전력을 공급하도록 설계될 수 있다.
통신부(140)는 무선 통신 프로토콜에 따라 임의의 디바이스들과 통신 가능하도록 설계된다. 통신부(140)는 멀티미디어 디바이스(300)와 데이터 통신이 이루어지도록 설계된 RF 모듈(142)와, 기타 외부 장치들(200)과 적외선 통신이 이루어지도록 설계된 IR 모듈(144)을 포함한다. 멀티미디어 디바이스(300)가 리모트 컨트롤러(100)의 제어 대상이 되는 경우에는, 멀티미디어 디바이스(300)와도 IR 모듈(144)을 통해 통신할 수도 있다. 실시예에 따라, 통신부(140)는 인터넷 네트워크 등을 통해 외부 서버 등과 데이터를 송수신하도록 설계될 수도 있다.
IR 모듈(144)은 상기 검출된 IR 코드값에 대응하는 IR 신호를 송신하여 멀티미디어 디바이스(300) 또는 외부 장치(200)를 제어한다. 예를 들어, IR 모듈(144)은 멀티미디어 디바이스(300)의 채널을 한 단계 올리는 IR 코드값에 대응하는 IR 신호를 송신하고, 멀티미디어 디바이스(300)는 상기 IR 신호를 수신하고, 이에 따라 채널 전환 기능을 수행한다. 상술한 IR 신호 송신부(101)는 IR 모듈(144)의 일부 구성에 해당한다.
저장부(150)는 제어부(130)의 각종 신호 처리를 위한 프로그램, 수신된 음성 신호를 텍스트로 변환하는데 필요한 프로그램, 알고리즘, 애플리케이션 등을 저장하고 있을 수 있다. 또한, 저장부(150)는 예를 들어 다양한 OS, 미들웨어 및 플랫폼을 저장하고 있다.
또한, 저장부(150)는 텍스트에 매칭되는 IR 코드값들에 대한 데이터베이스를 저장하고 있다.
도 6은 본 발명의 일 실시예에 따른 리모트 컨트롤러가 저장하고 있는 코드값들의 데이터베이스의 일 예를 도시한 도면이다.
리모트 컨트롤러(100)는 저장부(150)에 도 6에 도시된 데이터베이스가 구축되어 있도록 설계한다. 도 6에 도시된 바와 같이, 복수 개의 디바이스의 일 예인 TV의 각 기능에 대하여 IR 코드값이 매핑되어 있다. 또한, 도 6에 도시된 데이터베이스는 사용자의 요청에 따라, 또는 정기적으로 업데이트될 수도 있다.
도 7은 본 발명의 일 실시예에 따른 리모트 컨트롤러가 저장하고 있는 코드값들의 데이터베이스의 다른 일 예를 도시한 도면이다.
전술한 도 6과 달리, 도 7은 텍스트에 매칭되는 코드값들을 복수 개의 디바이스 별로 구분하여 데이터베이스를 구축하여, 서로 다른 메모리 어드레스에 저장하도록 설계한다. 즉, 제1 어드레스에는, STB의 기능들에 대한 IR 코드값을 저장하고, 제2 어드레스에는 BD(Blu-ray Disc) 플레이어의 기능들에 대한 IR 코드값을 저장한다.
따라서, 도 7과 같이 설계하는 경우, 특정 디바이스의 특정 기능에 액세스하는 속도를 높일 수 있는 장점이 있다.
다시 도 5를 참조하면, 음성 인식부(132)는 수신된 음성 신호를 인식할 수 있는지 여부를 판단할 수 있다. 즉, 음성 인식부(132)는 수신된 음성 신호로부터 특징 정보를 추출하고, 추출된 특징 정보에 기초하여 텍스트 변환이 가능한지 여부를 판단할 수 있다.
예를 들어, 음성 인식부(132)는 상기 추출된 특징 정보에 기초하여, 사용자의 음성에 포함된 음절의 개수가 일정 개수 이상인 경우, 음성 인식부(132)에서 텍스트 변환이 가능하지 않다고 판단할 수 있다.
사용자가 디바이스(200, 300)에서 구현되는 간단한 기능(예를 들어, 온/오프, 채널 전환, 재생/일시정지 기능 등)을 제어하기 위한 음성 이외에, “CSI 시즌 2의 15회 에피소드 검색”과 같이 복잡한 자연어를 발화하는 경우, 리모트 컨트롤러(100) 내에서 음성 신호를 정확히 분석하여 텍스트로 변환하는 것이 쉽지 않다. 리모트 컨트롤러(100)가 복잡한 음성 인식 기능을 수행할 수 있도록 설계되는 경우, 음성 인식부(132)와 저장부(150)의 구성이 매우 복잡해지고 방대한 용량을 필요로 하며 음성 인식 속도 면에서도 바람직하지 않을 수 있다.
따라서, 리모트 컨트롤러(100)는, 음성 인식부(132)에서 텍스트 변환이 가능하지 않다고 판단될 경우, 음성 신호를 통신부(140) 내의 RF 모듈(142)을 통해 멀티미디어 디바이스(300)로 전송하도록 설계된다. RF 모듈(142)은 근거리 통신 모듈로서, 블루투스, WLAN(Wireless LAN) 등의 통신 기술이 이용될 수 있다. 이에 대해서는 도 15 내지 도 19를 참조하여 자세히 후술하기로 한다.
음성 인식부(132)에서 텍스트 변환이 가능하다고 판단되는 경우, 상술한 바와 같이, 추출된 특징 정보에 기초하여 음성 신호를 텍스트로 변환하고, 변환된 텍스트에 매칭되는 IR 코드값을 검출한다. 즉, 처리된 음성 신호에서 특징 정보를 추출하는 과정과 텍스트 변환 과정의 사이에, 텍스트 변환 가능 여부를 판단하는 과정이 수행될 수 있다.
도 8은 본 발명의 일 실시예에 따라 리모트 컨트롤러를 사용하여 디바이스를 제어하는 방법을 도시한 흐름도이다. 이하, 도 8을 참조하여, 일 실시예에 따라 리모트 컨트롤러를 사용하여 디바이스를 제어하는 방법을 설명하면 다음과 같다.
도 8에 도시된 바와 같이, 리모트 컨트롤러(100) 내의 음성 인식부(110)는 사용자가 발화하는 음성을 수신하고 이를 전기적인 음성 신호로 변환한다(S601). 사용자가 음성을 발화하는 경우, 사용자의 음성 이외에 주변 잡음도 음성 인식부(110)를 통해 입력될 수 있다.
음성 입력부(110)는 상기 음성 신호를 음성 처리부(120)로 전달한다(S602). 음성 처리부(120)는 상기 전달된 음성 신호를 처리한다(S603). 예를 들어, 음성 처리부(120)는 상기 전달된 음성 신호에서 주변 잡음 신호를 제거하거나, 복수 개의 음성 입력부(110)를 통해 입력된 복수 개의 음성 신호 중에서 기설정된 조건에 따라 특정 음성 신호만을 취할 수 있다. 자세히 기술하지는 않았으나, 음성 처리부(120)는 음성 인식률을 높일 수 있는 기타 소정의 음성 신호 처리 과정을 수행할 수 있다.
음성 처리부(120)는 상기 처리된 음성 신호를 음성 인식부(132)로 전달한다(S604). 음성 인식부(132)는 상기 전달된 음성 신호를 분석하여 특정 IR 코드값을 검출한다.
구체적으로, 음성 인식부(132)는 상기 전달된 음성 신호의 파형을 분석하여 특징 정보를 추출한다(S605). 추출되는 특징 정보의 예로는, 입력되는 음성에 포함된 휴지(休止) 정보, 입력되는 음성의 음절의 개수 정보, 입력되는 음성의 진동수 정보, 입력되는 음성의 고저 정보 등일 수 있다.
음성 인식부(132)는 상기 추출된 특징 정보에 기초하여 음성 신호를 텍스트로 변환한다(S606). 그리고, 음성 인식부(132)는 저장부(150)에 저장된 IR 코드값들의 데이터베이스에 액세스하여, 상기 변환된 텍스트에 매칭되는 IR 코드값을 검출한다(S607).
도시하지는 않았으나, 실시예에 따라, 단계(S605) 후에, 추출된 특징 정보에 기초하여 텍스트 변환 가능 여부를 판단하는 단계가 추가되고, 판단 결과 텍스트 변환이 가능한 경우 단계(S607)가 수행되도록 설계하는 것도 본 발명의 권리범위에 속한다.
음성 인식부(132)는 상기 검출된 IR 코드값을 IR 모듈(144)로 전달한다(S608). IR 모듈(144)은 상기 IR 코드값에 대응하는 IR 신호를 송신하고(S609), 특정 디바이스(200, 300)가 상기 IR 신호를 수신하여, 특정 기능을 실행한다. 상기 IR 코드값은 특정 디바이스의 특정 기능에 매칭되는 값이므로, IR 모듈(144)이 송신하는 IR 신호에 의해 특정 디바이스만이 제어될 수 있다.
도 9는 본 발명의 일 실시예에 따른 멀티미디어 디바이스가 제공하는 그래픽 사용자 인터페이스를 도시한 도면이다. 상기 멀티미디어 디바이스(300)가 TV인 경우를 가정하여 설명한다.
사용자가 “TV 외부 입력”을 발화하고 리모트 컨트롤러(100)의 음성 인식을 통해 TV가 외부 입력 모드로 진입한 경우, 멀티미디어 디바이스(300)의 화면에 GUI(700)가 디스플레이될 수 있다. 또는, 사용자가 TV에 오리엔트된 제2 리모트 컨트롤러에 구비된 외부 입력 선택 버튼을 누른 경우, 멀티미디어 디바이스(300)의 GUI(700)가 디스플레이될 수 있다. 상기 GUI(700)는 후술하는 도 12의 GUI 생성부(330)에서 생성될 수 있다.
본 발명의 일 실시예에 따른 리모트 컨트롤러(100)는 사용자가 제어하고자 하는 디바이스 명인 “BD 플레이어”를 포함하여 발화하는 것에 의해 BD 플레이어를 제어할 수도 있고, 도 9에 도시된 멀티미디어 디바이스(300) 화면 상의 GUI(700)에서 BD 플레이어 제어 모드(710)를 선택하여 BD 플레이어 제어 모드에 진입한 후에, 리모트 컨트롤러(100)를 사용하여 기능 제어 단어를 발화하는 것에 의해 BD 플레이어를 제어할 수도 있다. 후자의 경우, BD 플레이어 제어 모드에 일단 진입된 후에는, 사용자가 디바이스 명인 “BD 플레이어”는 발화하지 않고 기능 제어 단어만을 발화함으로써 BD 플레이어를 제어하도록 설계될 수 있다.
도 10은 본 발명의 일 실시예에 따른 멀티미디어 디바이스가 제공하는 그래픽 사용자 인터페이스를 도시한 도면이다.
본 발명의 일 실시예에 따른 멀티미디어 디바이스(300)는 리모트 컨트롤러(100)에 의해 제어 가능한 디바이스 목록을 포함하는 GUI(800)를 화면 상에 디스플레이할 수 있다.
예를 들어, 리모트 컨트롤러(100)는 IR 모듈(144)을 통해 소정의 IR 신호를 송신하고, 이에 따라 복수 개의 디바이스로부터 응답 신호가 수신되는 경우, 상기 응답 신호에 기초하여 제어 가능한 디바이스 목록에 관한 정보를 RF 모듈(142)을 통해 멀티미디어 디바이스(300)로 전송할 수 있다. 그리고, 멀티미디어 디바이스(300)는 상기 제어 가능한 디바이스 목록에 관한 정보에 기초하여 GUI(800)를 생성하여 화면에 디스플레이할 수 있다. 상기 GUI(800)는 후술하는 도 12의 GUI 생성부(330)에서 생성될 수 있다.
사용자는, 자신이 제어하고자 하는 디바이스 명이 GUI(800)의 디바이스 목록에 포함되어 있지 않은 경우, 리모트 컨트롤러(100)의 위치를 재 조정할 수 있다.
도 11은 본 발명의 일 실시예에 따른 멀티미디어 디바이스의 구성 모듈들을 설명하기 위한 블록도이다. 이하, 도 11을 참조하여, 본 발명의 일 실시예에 따른 멀티미디어 디바이스의 구성 모듈들을 설명하면 다음과 같다. 다만, 도 11은 설명의 편의를 위한 실시예이며, 도 11에 도시된 구성모듈들 이외에 다른 구성 모듈을 포함하거나, 일부의 구성 모듈이 생략되는 형태도 본 발명의 권리범위에 속한다.
도 11에 도시된 바와 같이, 본 발명의 일실시예에 의한 멀티미디어 디바이스(300)는, 방송 수신 모듈(301), 복조부(302), 네트워크 인터페이스부(303), 외부장치 인터페이스부(304), 저장부(305), 제어부(306), 비디오 출력부(307), 오디오 출력부(308), 전원 공급부(309) 그리고 사용자 인터페이스(311) 등을 포함하여 이루어 진다. 상기 방송 수신 모듈(201)은, 예컨대 RF 튜너로 설계할 수도 있고 또는 STB 등 외부 디바이스로부터 방송 데이터를 수신하는 인터페이스로 설계 가능하다.
방송 수신 모듈(301)은, 예를 들어 ATSC(Advanced Television System Committee) 방식에 따른 단일 캐리어의 RF 방송 신호 또는 DVB(Digital Video Broadcasting) 방식에 따른 복수 캐리어의 RF 방송 신호를 수신할 수 있다.
복조부(302)는, 방송 수신 모듈(301)에서 변환된 디지털 IF 신호(DIF)를 수신하여 복조 동작을 수행한다.
예를 들어, 방송 수신 모듈(301)에서 출력되는 디지털 IF 신호가 ATSC 방식인경우, 복조부(302)는 예컨대, 8-VSB(8-Vestigal Side Band) 복조를 수행한다. 또한, 복조부(302)는 채널 복호화를 수행할 수도 있다.
외부장치 인터페이스부(304)는 외부 장치와 멀티미디어 디바이스(300)간 데이터 통신이 가능하게 하는 인터페이스이다. 외부장치 인터페이스부(304)는, DVD(Digital Versatile Disk), 블루레이(Blu ray), 게임기기, 카메라, 캠코더, 컴퓨터(노트북), STB 등과 같은 외부 장치와 유/무선으로 접속될 수 있다. 상기 외부 디바이스(200)는 외부장치 인터페이스부(304)를 통해 멀티미디어 디바이스(300)와 유/무선으로 연결될 수 있다. 외부장치 인터페이스부(304)는 연결된 외부 장치를 통하여 외부에서 입력되는 영상, 음성 또는 데이터 신호를 제어부(306)로 전달한다. 또한, 제어부(306)에서 처리된 영상, 음성 또는 데이터신호를, 외부 장치로 출력할 수 있다.
상기 외부장치 인터페이스부(304)는, 예를 들어 USB 단자, CVBS(Composite Video Banking Sync) 단자, 컴포넌트 단자, S-비디오 단자(아날로그), DVI(Digital Visual Interface) 단자, HDMI(High Definition Multimedia Interface) 단자, RGB 단자, D-SUB 단자 등을 포함할 수 있다. 외부장치 인터페이스부(304)는 무선 네트워크와의 접속을 위해, 예를 들어 블루투스(Bluetooth), WLAN(Wireless LAN)(Wi-Fi), Wibro(Wireless broadband), Wimax(World Interoperability for Microwave Access), HSDPA(High Speed Downlink Packet Access) 통신 규격 등이 이용될 수 있다.
네트워크 인터페이스부(303)는, 멀티미디어 디바이스(300)를 인터넷 망을 포함하는 유/무선 네트워크와 연결하기 위한 인터페이스를 제공한다. 네트워크 인터페이스부(303)는, 유선 네트워크와의 접속을 위해, 예를 들어 이더넷(Ethernet) 단자 등을 구비할 수 있으며, 무선 네트워크와의 접속을 위해, 예를 들어 WLAN(Wireless LAN)(Wi-Fi), Wibro(Wireless broadband), Wimax(World Interoperability for Microwave Access), HSDPA(High Speed Downlink Packet Access) 통신 규격 등이 이용될 수 있다.
네트워크 인터페이스부(303)는, 접속된 네트워크 또는 접속된 네트워크에 링크된 다른 네트워크를 통해, 다른 사용자 또는 다른 전자 기기와 데이터를 송신 또는 수신할 수 있다.
실시예에 따라, 리모트 컨트롤러(100)와 데이터를 송/수신하는 통신 모듈(예를 들어, RF 모듈)은 네트워크 인터페이스부(303), 외부장치 인터페이스부(304) 또는 사용자 인터페이스(311)에 포함되도록 설계될 수 있고, 리모트 컨트롤러(100)로부터 IR 신호를 수신하는 통신 모듈(예를 들어, IR 모듈)은 사용자 인터페이스(311) 내에 포함되도록 설계될 수 있다.
저장부(305)는, 제어부(306) 내의 각 신호 처리 및 제어를 위한 프로그램이 저장될 수도 있고, 신호 처리된 영상, 음성 또는 데이터 신호를 저장할 수도 있다. 또한, 저장부(305)는 외부장치 인터페이스부(304) 또는 네트워크 인터페이스부(303)로부터 입력되는 영상, 음성, 또는 데이터 신호의 임시 저장을 위한 기능을 수행할 수도 있다. 또한, 저장부(305)는, 예를 들어 다양한 OS, 미들웨어 및 플랫폼을 저장하고 있다.
사용자 인터페이스(311)는, 사용자가 입력한 신호를 제어부(306)로 전달하거나, 제어부(306)로부터의 신호를 외부 디바이스(예를 들어, 제2 리모트 컨트롤러(500))로 전송한다. 예를 들어, 사용자 인터페이스(311)는, RF(Radio Frequency) 통신 방식, 적외선(IR) 통신 방식 등 다양한 통신 방식에 따라, 제2 리모트 컨트롤러(500)로부터 전원 온/오프, 채널 선택, 화면 설정 등의 제어 신호를 수신하여 처리하거나, 제어부(306)로부터의 제어 신호를 제2 리모트 컨트롤러(500)로 송신하도록 설계되어 있다.
제어부(306)는, 방송 수신 모듈(301), 복조부(302), 네트워크 인터페이스부(303) 또는 외부장치 인터페이스부(304)를 통하여, 입력되는 스트림을 역다중화하거나, 역다중화된 신호들을 처리하여, 영상 또는 음성 출력을 위한 신호를 생성 및 출력할 수 있다. 상기 제어부(306)에 대해서는 도 12를 참조하여 보다 상세히 후술하도록 하겠다.
제어부(306)는 리모트 컨트롤러(100)로부터 수신된 음성 신호를 처리하고 서버(400)를 통해 분석 가능하도록 설계될 수 있다. 제어부(306)는 음성 처리부, 컨텐츠 음성신호 제거부, 음성 인식부를 포함할 수 있다. 이에 대해서는 후술하는 도 15의 멀티미디어 디바이스(900)에 관한 설명이 참조될 수 있다.
상기 비디오 출력부(307)는, 제어부(306)에서 처리된 영상 신호, 데이터 신호, OSD 신호 또는 외부장치 인터페이스부(304)에서 수신되는 영상 신호, 데이터 신호 등을 각각 R, G, B 신호로 변환하여 구동 신호를 생성한다. 상기 비디오 출력부(307)는, PDP, LCD, OLED, 플렉시블 디스플레이 (flexible display), 3차원 디스플레이(3D display) 등이 가능하다.
상기 오디오 출력부(308)는, 제어부(306)에서 음성 처리된 신호, 예를 들어, 스테레오 신호, 3.1채널 신호 또는 5.1채널 신호를 입력받아 음성으로 출력한다. 음성 출력부(308)는 다양한 형태의 스피커로 구현될 수 있다.
그리고, 전원 공급부(309)는, 멀티미디어 디바이스(300) 전반에 걸쳐 해당 전원을 공급한다. 특히, 시스템 온 칩(System On Chip, SOC)의 형태로 구현될 수 있는 제어부(306)와, 영상 표시를 위한 비디오 출력부(307) 및 오디오 출력을 위한 오디오 출력부(308)에 전원을 공급할 수 있다.
도 12는 도 11에 도시된 멀티미디어 디바이스의 제어부를 보다 상세히 도시한 블록도이다.
도 12에 도시된 바와 같이, 멀티미디어 디바이스(300)의 제어부(306)는, 역다중화부(310), 영상처리부(320), GUI 생성부(330), 믹서(340), 프레임 레이트 변환부(350) 그리고 포맷터(360) 등을 포함한다. 또한, 음성 처리부(미도시), 데이터 처리부(미도시)를 더 포함하도록 설계하는 것도 본 발명의 권리범위에 속한다.
상기 역다중화부(310)는, 입력되는 스트림을 역다중화한다. 예를 들어, MPEG-2 TS가 입력되는 경우 이를 역다중화하여, 각각 영상, 음성 및 데이터 신호로 분리할 수 있다.
영상 처리부(320)는, 역다중화된 영상 신호의 영상 처리를 수행할 수 있다. 이를 위해, 영상 처리부(320)는, 영상 디코더(322) 및 스케일러(324)를 구비할 수 있다. 상기 영상 디코더(322)는, 역다중화된 영상신호를 복호화하며, 상기 스케일러(324)는, 복호화된 영상신호의 해상도를 비디오 출력부에서 출력 가능하도록 스케일링(scaling)을 수행한다. 그리고, 영상 처리부(320)에서 복호화된 영상 신호는, 믹서(340)로 입력된다.
GUI 생성부(330)는, 사용자 입력에 따라 또는 자체적으로 GUI 신호를 생성한다. 따라서, 믹서(340)는, GUI 생성부(330)에서 생성된 GUI 신호와 영상처리부(320)에서 영상 처리된 복호화된 영상 신호를 믹싱할 수 있다. GUI 생성부(300)는 볼륨 제어 또는 화면 제어 등과 같이 환경 설정 정보를 포함하는 OSD(On Screen Display) 신호를 생성하는 OSD 생성부를 포함한다.
믹싱된 신호는 포맷터(360)에 제공된다. 복호화된 방송 영상 신호 또는 외부 입력 신호와 OSD 신호가 믹싱됨으로 인하여, 방송 영상 또는 외부 입력 영상 상에 OSD 가 오버레이 되어 표시될 수 있게 된다.
프레임 레이트 변환부(Frame Rate Conveter; FRC)(350)는, 입력되는 영상의 프레임 레이트를 변환할 수 있다. 예를 들어, 60Hz의 프레임 레이트를 120Hz 또는 240Hz로 변환한다. 60Hz의 프레임 레이트를 120Hz로 변환하는 경우, 제1 프레임과 제2 프레임 사이에, 동일한 제1 프레임을 삽입하거나, 제1 프레임과 제2 프레임으로부터 예측된 제3 프레임을 삽입하는 것이 가능하다. 60Hz의 프레임 레이트를 240Hz로 변환하는 경우, 동일한 프레임을 3개 더 삽입하거나, 예측된 프레임을 3개 삽입하는 것이 가능하다. 한편, 별도의 변환 없이 입력되는 프레임 레이트를 유지하는 것도 가능하다.
그리고, 포맷터(360)는, 프레임 레이트 변환부(350)의 출력 신호를 입력받아, 비디오 출력부에 적합하도록 신호의 포맷을 변경하여 출력한다. 예를 들어, R, G, B 데이터 신호를 출력할 수 있으며, 이러한 R, G, B 데이터 신호는, 낮은 전압 차분 신호(Low voltage differential signaling, LVDS) 또는 mini-LVDS로 출력될 수 있다.
도 13은 본 발명의 일 실시예에 따른 제2 리모트 컨트롤러의 외관을 간략히 도시한 도면이다. 이하, 도 13을 참조하여, 본 발명의 일 실시예에 따른 제2 리모트 컨트롤러의 외관을 설명하면 다음과 같다.
우선, 도 13의 (a)을 참조하면, 멀티미디어 디바이스(300)의 화면에 제2 리모트 컨트롤러(500)에 대응하는 포인터(P)가 표시되는 것을 예시한다.
사용자는 제2 리모트 컨트롤러(500)를 상하, 좌우(도 13의 (b)), 앞뒤(도 13의 (c))로 움직이거나 회전할 수 있다. 멀티미디어 디바이스(300)의 화면에 표시된 포인터(P)는 제2 리모트 컨트롤러(500)의 움직임에 대응한다. 이러한 제2 리모트 컨트롤러(500)는, 도면과 같이, 3D 공간상의 움직임에 따라 해당 포인터(P)가 이동되어 표시되므로, 공간 리모콘이라 명명할 수 있다.
도 13의 (b)는 사용자가 제2 리모트 컨트롤러(500)를 왼쪽으로 이동하면, 멀티미디어 디바이스(300)의 화면에 표시된 포인터(P)도 이에 대응하여 왼쪽으로 이동하는 것을 예시한다.
제2 리모트 컨트롤러(500)의 센서를 통하여 감지된 제2 리모트 컨트롤러(500)의 움직임에 관한 정보는 멀티미디어 디바이스(300)로 전송된다. 멀티미디어 디바이스(300)는 제2 리모트 컨트롤러(500)의 움직임에 관한 정보로부터 포인터(P)의 좌표를 산출할 수 있다. 멀티미디어 디바이스(300)는 산출한 좌표에 대응하도록 포인터(P)를 표시할 수 있다.
도 13의 (c)는, 제2 리모트 컨트롤러(500) 내의 특정 버튼을 누른 상태에서, 사용자가 제2 리모트 컨트롤러(500)를 멀티미디어 디바이스(300)에서 멀어지도록 이동하는 경우를 예시한다. 이에 의해, 포인터(P)에 대응하는 화면 내의 선택 영역이 줌인 되어 확대 표시될 수 있다. 이와 반대로, 사용자가 제2 리모트 컨트롤러(500)를 멀티미디어 디바이스(300)에 가까워지도록 이동하는 경우, 포인터(P)에 대응하는 화면 내의 선택 영역이 줌아웃 되어 축소 표시될 수 있다. 한편, 제2 리모트 컨트롤러(500)가 멀티미디어 디바이스(300)에서 멀어지는 경우, 선택 영역이 줌아웃 되고, 제2 리모트 컨트롤러(500)가 멀티미디어 디바이스(300)에 가까워지는 경우, 선택 영역이 줌인 될 수도 있다.
도 14는 도 13에 도시된 제2 리모트 컨트롤러의 구성요소들을 상세히 도시한 블록도이다.
도 14에 도시된 바와 같이, 제2 리모트 컨트롤러(510)는, 무선통신부(514), 사용자 입력부(515), 센서부(517), 출력부(516), 전원공급부(511), 저장부(512), 그리고 제어부(513) 등을 포함한다.
무선통신부(514)는 임의의 외부 장치와 통신 가능하도록 설계된다.
제2 리모트 컨트롤러(500)는 RF 통신규격에 따라 멀티미디어 디바이스(300)와 신호를 송수신할 수 있는 RF 모듈(514a)을 구비할 수 있다. 또한, 제2 리모트 컨트롤러(500)는 IR 통신규격에 따라 멀티미디어 디바이스(300)와 신호를 송수신할 수 있는 IR 모듈(514b)을 구비할 수 있다.
제2 리모트 컨트롤러(500)는 멀티미디어 디바이스(300)로 제2 리모트 컨트롤러(500)의 움직임 등에 관한 정보가 담긴 신호를 RF 모듈(514a)을 통하여 전송한다.
또한, 제2 리모트 컨트롤러(500)는 멀티미디어 디바이스(300)가 전송한 신호를 RF 모듈(514b)을 통하여 수신할 수 있다. 또한, 제2 리모트 컨트롤러(500)는 필요에 따라 IR 모듈(514b)을 통하여 멀티미디어 디바이스(300)로 전원 온/오프, 채널 변경, 볼륨 변경 등에 관한 명령을 전송할 수 있다.
사용자 입력부(515)는 키패드, 버튼, 터치 패드, 또는 터치 스크린 등으로 구성될 수 있다.
센서부(517)는 자이로 센서(517a) 또는 가속도 센서(517b)를 구비할 수 있다. 자이로 센서(517a)는 제2 리모트 컨트롤러(500)의 움직임에 관한 정보를 센싱할 수 있다. 일례로, 자이로 센서(517a)는 제2 리모트 컨트롤러(500)의 동작에 관한 정보를 x, y, z 축을 기준으로 센싱할 수 있다. 가속도 센서(517b)는 제2 리모트 컨트롤러(500)의 이동속도 등에 관한 정보를 센싱할 수 있다. 한편, 거리측정센서를 더 구비할 수 있으며, 이에 의해, 멀티미디어 디바이스(300)와의 거리를 센싱할 수 있다.
출력부(516)는 사용자 입력부(515)의 조작에 대응하거나 멀티미디어 디바이스(300)에서 전송한 신호에 대응하는 영상 또는 음성 신호를 출력할 수 있다. 일례로, 출력부(516)는 사용자 입력부(5155)가 조작되거나 무선 통신부(514)를 통하여 멀티미디어 디바이스(300)와 신호가 송수신 되면 점등되는 LED 모듈(516a1), 진동을 발생하는 진동 모듈(516b), 음향을 출력하는 음향 출력 모듈(516c), 또는 영상을 출력하는 디스플레이 모듈(516d)을 구비할 수 있다.
전원공급부(511)는 제2 리모트 컨트롤러(500)의 각 구성요소에 전원을 공급한다. 전원공급부(511)는 제2 리모트 컨트롤러(500)가 소정 시간 동안 움직이지 않은 경우 전원 공급을 중단함으로써 전원 낭비를 줄일 수 있다.
저장부(512)는 제2 리모트 컨트롤러(500)의 제어 또는 동작에 필요한 여러 종류의 프로그램, 애플리케이션 데이터 등이 저장될 수 있다. 그리고, 제어부(513)는 제2 리모트 컨트롤러(500)의 제어에 관련된 제반사항을 제어한다. 예를 들어, 상기 제어부(513)는, 사용자 입력부(515)의 소정 키 조작에 대응하는 신호 또는 센서부(517)에서 센싱한 제2 리모트 컨트롤러(500)의 움직임에 대응하는 신호를 무선 통신부(514)를 통하여 멀티미디어 디바이스(300)로 전송할 수 있다.
도 15는 본 발명의 일 실시예에 따른 멀티미디어 디바이스의 구성 모듈들을 설명하기 위한 블록도이다. 도 11에 도시된 멀티미디어 디바이스(300)의 설명을 참조하여, 도 15에 도시된 멀티미디어 디바이스(900)를 보충 해석하는 것도 가능하다.
도 15에 도시된 바와 같이, 본 발명의 일 실시예에 따른 멀티미디어 디바이스(900)는 제어부(910), 통신부(920), 오디오 출력부(930), 저장부(940)를 포함한다.
통신부(920)는 제1 통신 모듈(922)과 제2 통신 모듈(924)을 포함한다. 제1 통신 모듈(920)은 제1 통신 규격(예를 들어, 블루투스 통신 등)으로 데이터를 송수신하는 RF 모듈(922)이고, 제2 통신 모듈(924)은 제2 통신 규격(예를 들어, 적외선 통신 등)으로 데이터를 송수신하는 IR 모듈(924)이다.
RF 모듈(922)은 리모트 컨트롤러(100)로부터 음성 신호를 수신한다. 상기 음성 신호는 리모트 컨트롤러(100)의 음성 입력부(110)를 통해 획득된 음성 신호가 음성 처리부(120)를 통해 소정의 신호 처리 과정을 거친 후, RF 모듈(142)을 통해 멀티미디어 디바이스(900)로 전송된 음성 신호를 의미할 수 있다. RF 모듈(922)은 도 11에 도시된 멀티미디어 디바이스(300)에서 네트워크 인터페이스부(303), 외부장치 인터페이스부(304) 또는 사용자 인터페이스(311) 내에 포함되어 구현될 수 있다.
IR 모듈(924)은 리모트 컨트롤러(100)로부터 IR 신호를 수신한다. 상기 IR 신호는, 리모트 컨트롤러(100)의 음성 입력부(110)를 통해 획득된 음성 신호가 음성 처리부(120)를 통해 소정의 신호 처리 과정을 거치고, 음성 인식부(130)에서 특정 IR 코드값이 검출된 후, IR 모듈(144)을 통해 송신된 IR 신호를 의미할 수 있다. IR 모듈(924)은 도 11에 도시된 멀티미디어 디바이스(300)에서 사용자 인터페이스(311) 내에 포함되어 구현될 수 있다.
또한, 통신부(920)는 외부 서버(400)와 인터넷 네트워크 등을 통해 데이터를 송수신할 수 있도록 설계된다.
제어부(910)는 멀티미디어 디바이스(900)의 동작 전반을 제어한다. 특히, 제어부(910)는 IR 모듈(924)에서 수신된 IR 신호에 따라, 멀티미디어 디바이스(900)의 특정 기능이 실행되도록 제어한다. 멀티미디어 디바이스(900)의 특정 기능이란, 멀티미디어 디바이스(900)의 온/오프, 볼륨 업/다운, 채널 변경 등 멀티미디어 디바이스(900)에서 구현될 수 있는 전반적인 기능들을 포함할 수 있다.
제어부(910)는 RF 모듈(922)을 통해 리모트 컨트롤러(100)로부터 수신된 음성 신호를 소정의 절차에 따라 처리하고, 처리된 음성 신호를 인터넷 네트워크 등을 통해 연결된 서버(400)에 전송한다. RF 모듈(922)을 통해 리모트 컨트롤러(100)로부터 수신된 상기 음성 신호는, 상술한 바와 같이, 리모트 컨트롤러(100) 내에서 음성 인식이 가능하지 않다고 판단된 경우, 리모트 컨트롤러(100)의 RF 모듈(142)을 통해 멀티미디어 디바이스(900)로 전송된 음성 신호에 해당한다. 따라서, 리모트 컨트롤러(100) 자체에서 처리하기 어려운 복잡한 자연어를 포함한 음성 신호일 것이다. 상기 서버(400)는 복잡한 자연어를 포함하는 음성 신호를 처리하여 텍스트로 변환할 수 있도록 설계된다.
제어부(910)는 음성 처리부(912), 컨텐츠 음성신호 제거부(914), 음성 인식부(916)를 포함할 수 있다.
음성 처리부(912)는 방송 수신 모듈(미도시)에서 수신된 컨텐츠에 포함된 음성 신호를 처리한다. 음성 처리부(912)에서 처리된 컨텐츠 내 음성 신호는 오디오 출력부(930)를 통해 출력될 수 있다.
컨텐츠 음성신호 제거부(914)는 RF 모듈(922)을 통해 리모트 컨트롤러(100)로부터 수신된 상기 음성 신호에서, 상기 컨텐츠 내 음성 신호를 제거하도록 설계된다. 즉, 사용자가 멀티미디어 디바이스(900)를 통해 컨텐츠를 감상하는 중에 음성을 발화하는 경우, 리모트 컨트롤러(100)의 음성 입력부(110)를 통해 입력된 음성 신호에는 사용자의 음성 신호뿐만 아니라 오디오 출력부(930)를 통해 출력되고 있던 컨텐츠 내 음성 신호도 포함되어 있다. 멀티미디어 디바이스(900) 내 컨텐츠 음성신호 제거부(914)는 서버(400)를 통한 음성 인식률을 향상시키기 위하여, 리모트 컨트롤러(100)로부터 수신된 음성 신호에서 컨텐츠 내 음성 신호를 제거할 수 있다. 이에 대해서는 도 19를 참조하여 후술하기로 한다.
실시예에 따라, 멀티미디어 디바이스(900)가 서버(400)를 통하지 않고 자체에 음성 인식 기능을 탑재하고 있는 경우, 제어부(910) 내에 음성 인식부(916)가 구비될 수 있다. 음성 인식부(916)는 제어부(910) 내에 포함되도록 설계될 수도 있고, 제어부(910)와 별개의 모듈로 설계될 수도 있다.
멀티미디어 디바이스(900) 자체에 음성 인식 기능을 탑재하고 있는 경우의 음성 인식 플로우를 설명하면 다음과 같다.
음성 인식부(916)는 컨텐츠 음성신호 제거부(914)로부터 컨텐츠 내 음성 신호가 제거된 음성 신호를 전달받은 후, 음성 신호의 특징 정보를 추출하고, 추출된 특징 정보에 기초하여 음성 신호를 텍스트로 변환한 후, 변환된 텍스트에 매칭되는 IR 코드값을 검출할 수 있다.
RF 모듈(922)은 상기 검출된 IR 코드값을 리모트 컨트롤러(100)로 전송하고, 리모트 컨트롤러(100)는 수신된 IR 코드값에 대응하는 IR 신호를 IR 모듈(144)을 통해 송신하여 특정 디바이스의 특정 기능을 제어할 수 있다.
저장부(940)에는 텍스트에 매칭되는 IR 코드값에 대한 데이터베이스가 구축되어 있으며, 복수 개의 디바이스 별로 구분하여 데이터베이스를 구축하고 이를 서로 다른 메모리 어드레스에 저장하도록 설계할 수도 있다.
이하에서는, 멀티미디어 디바이스(900) 자체에 음성 인식 기능이 탑재되지 않고, 서버(400)를 통해 음성을 인식하는 플로우를 설명한다.
통신부(920)는 컨텐츠 음성신호 제거부(914)로부터 컨텐츠 내 음성 신호가 제거된 음성 신호를 전달받은 후, 상기 음성 신호를 서버(400)로 전송한다. 서버(400)는 상기 음성 신호를 수신하고, 수신된 음성 신호를 분석하여 텍스트로 변환한다. 이때, 실시예에 따라, 서버(400)는 변환된 텍스트 자체를 멀티미디어 디바이스(900)로 전송할 수도 있고, 변환된 텍스트에 매칭되는 IR 코드값을 검출하여 그 결과를 멀티미디어 디바이스(900)로 전송할 수도 있다.
서버(400)가 변환된 텍스트 자체를 멀티미디어 디바이스(900)로 전송하도록 설계된 경우, 멀티미디어 디바이스(900)는 텍스트를 수신한 후, 수신된 텍스트에 매칭되는 IR 코드값을 검출할 수 있다. 그리고, 상기 검출된 IR 코드값을 RF 모듈(920)을 통해 전송한다. 리모트 컨트롤러(100)는 RF 모듈(142)을 통해 상기 IR 코드값을 수신하고, 수신된 IR 코드값에 대응하는 IR 신호를 송신하여 특정 디바이스를 제어할 수 있다.
만일, 서버(400)가 변환된 텍스트에 매칭되는 IR 코드값을 검출하여 그 결과를 멀티미디어 디바이스(900)로 전송하도록 설계된 경우, 멀티미디어 디바이스(900)는 상기 수신된 IR 코드값을 RF 모듈(920)을 통해 리모트 컨트롤러(100)로 포워딩한다. 리모트 컨트롤러(100)는 RF 모듈(142)을 통해 상기 IR 코드값을 수신하고, 수신된 IR 코드값에 대응하는 IR 신호를 송신하여 특정 디바이스를 제어할 수 있다.
실시예에 따라, 서버(400)에서 변환된 텍스트가 특정 컨텐츠 검색 등에 관한 것인 경우, 서버(400)는 상기 텍스트와 관련된 컨텐츠 정보를 추출하여 멀티미디어 디바이스(900)로 전송하도록 설계된다. 멀티미디어 디바이스(900)는 상기 컨텐츠 정보를 수신한 후, 컨텐츠 정보를 포함하는 GUI를 생성하여 디스플레이할 수 있다. 상기 컨텐츠 정보를 포함하는 GUI는 제어부(910) 내의 GUI 생성부(미도시)에서 생성될 수 있으며, 비디오 출력부(미도시)를 통해 디스플레이될 수 있다.
도 16은 본 발명의 일 실시예에 따른 음성 인식 플로우를 설명하기 위한 도면이다.
도 16에 도시된 바와 같이, 리모트 컨트롤러(100)는 사용자가 발화하는 음성을 수신하고 이를 전기적인 음성 신호로 변환한다(S1001). 상기 음성 신호에는 사용자의 음성 신호 외에 주변 잡음 신호도 포함될 수 있다.
리모트 컨트롤러(100)는 상기 음성 신호에 대하여 제1 음성 처리를 수행한다(S1002). 상기 제1 음성 처리는 음성 인식률을 향상시키기 위한 것으로, 상술한 바와 같이, 음성 신호에서 주변 잡음 신호를 제거하거나 입력된 복수 개의 음성 신호 중에서 기설정된 조건에 따라 특정 음성 신호만을 취하는 형태 중 적어도 어느 하나의 처리 형태를 포함할 수 있다.
그 후, 리모트 컨트롤러(100)는 리모트 컨트롤러(100) 내에서 음성 인식이 가능하지 여부를 판단한다(S1003). 즉, 리모트 컨트롤러(100)는 제1 음성 처리가 완료된 음성 신호로부터 특징 정보를 추출하고, 추출된 특징 정보에 기초하여 텍스트 변환이 가능한지 여부를 판단한다. 예를 들어, 리모트 컨트롤러(100)는 상기 추출된 특징 정보에 기초하여, 사용자의 음성에 포함된 음절의 개수가 일정 개수 이상인 경우, 텍스트 변환이 가능하지 않다고 판단할 수 있다.
리모트 컨트롤러(100) 내에서 음성 인식이 가능하지 않다고 판단되는 경우, 상기 제1 음성 처리가 완료된 음성 신호를 멀티미디어 디바이스(900)로 전송한다(S1004). 물론, 멀티미디어 디바이스(900) 대신 멀티미디어 디바이스(300)를 포함하여 구현하는 것도 본 발명의 권리범위에 속한다.
멀티미디어 디바이스(900)는 리모트 컨트롤러(100)로부터 음성 신호를 수신하고, 수신된 음성 신호에 대하여 제2 음성 처리를 수행한다(S1005). 상기 제1 음성 처리는 음성 인식률을 향상시키기 위한 것으로, 상술한 바와 같이, 상기 수신된 음성 신호에 포함된 컨텐츠 내 음성 신호를 제거하는 처리 형태를 포함할 수 있다. 상기 수신된 음성 신호에 컨텐츠 내 음성 신호가 포함되어 있지 않은 경우, 컨텐츠 내 음성 신호 제거 과정은 생략될 수 있다.
멀티미디어 디바이스(900)는 제2 음성 처리가 완료된 음성 신호를 서버(400)로 전송한다(S1006).
서버(400)는 음성 신호를 텍스트로 변환하고 그 결과를 멀티미디어 디바이스(900)로 전송한다.
멀티미디어 디바이스(900)는 서버(400)로부터 텍스트를 수신하고, 상기 수신된 텍스트에 매칭되는 IR 코드값을 검출한다(S1009). 그리고, 검출된 IR 코드값을 리모트 컨트롤러(100)로 전송한다(S1010).
리모트 컨트롤러(100)는 멀티미디어 디바이스(900)로부터 상기 IR 코드값을 수신하고, 수신된 IR 코드값에 대응하는 IR 신호를 송신한다(S1011). 상기 IR 신호는 특정 디바이스의 특정 기능에 맵핑된 신호이므로, 특정 디바이스(200)가 상기 IR 신호를 수신하고, 그에 따라 특정 기능을 실행한다(S1012).
만일, 서버(400)로부터 전송된 상기 텍스트가 멀티미디어 디바이스(900)의 제어를 위한 것인 경우, 단계(S1009 내지 S1012)는 생략될 수 있다. 이 경우, 멀티미디어 디바이스(900)가 서버(400)로부터 수신된 텍스트에 매칭되는 제어 신호를 생성하고, 상기 제어 신호에 따라 멀티미디어 디바이스(900) 내의 특정 구성 모듈을 제어하도록 설계하는 것도 본 발명의 권리범위에 속한다.
도 17은 본 발명의 일 실시예에 따른 음성 인식 플로우를 설명하기 위한 도면이다. 도 17에서 단계(S1001 내지 S1007)는 도 16에서 설명한 바와 같으므로, 설명을 생략한다. 물론, 멀티미디어 디바이스(900) 대신 멀티미디어 디바이스(300)를 포함하여 구현하는 것도 본 발명의 권리범위에 속한다.
도 17에 도시된 바와 같이, 서버(400)는 변환된 텍스트에 매칭되는 IR 코드값을 검출한다(S1021). 도 16의 실시예에서는, 서버(400)에서 텍스트 변환이 이루어지고, 변환된 텍스트가 멀티미디어 디바이스(900)로 전송되어, 멀티미디어 디바이스(900)에서 텍스트에 매칭되는 IR 코드값이 검출되었다. 반면, 도 17의 실시예에서는, 서버(400)에서 텍스트에 매칭되는 IR 코드값 검출의 과정까지 수행된다. 그리고, 검출된 IR 코드값을 멀티미디어 디바이스(900)로 전송한다.
멀티미디어 디바이스(900)는 상기 IR 코드값을 수신하고, 이를 리모트 컨트롤러(100)로 포워딩한다(S1023).
리모트 컨트롤러(100)는 리모트 컨트롤러(100)로부터 상기 IR 코드값을 수신하고, 수신된 IR 코드값에 대응하는 IR 신호를 송신한다(S1024). 상기 IR 신호는 특정 디바이스의 특정 기능에 맵핑된 신호이므로, 특정 디바이스(200)가 상기 IR 신호를 수신하고, 그에 따라 특정 기능을 실행한다(S1025).
도 16의 실시예에 의할 경우, 텍스트에 매칭되는 IR 코드값들의 데이터베이스가 멀티미디어 디바이스(900) 내의 저장부에 저장되어 있다. 이 경우, 멀티미디어 디바이스(900)는 사용자의 선택에 의해 또는 주기적으로 서버(400)를 통해 상기 데이터베이스 내의 값들을 업데이트할 수 있다.
반면, 도 17의 실시예에 의할 경우, 텍스트에 매칭되는 IR 코드값들의 데이터베이스가 서버(400) 내의 저장부에 저장되어 있다. 이 경우, 멀티미디어 디바이스(900)는 도 16의 실시예에서와 달리 서버(400)를 통한 업데이트를 할 필요가 없으며, 단계(S1022)에서 해당 IR 코드값을 서버(400)로부터 전송받으면 족하다.
또한, 도 16 또는 도 17의 실시예에서, 단계(S1012 or S1025)에서 특정 기능이 실행된 이후, 외부 디바이스(200)는 자신의 현재 상태 정보를 멀티미디어 디바이스(900)로 전송하고, 멀티미디어 디바이스(900)는 상기 상태 정보를 수신하도록 설계될 수도 있다. 이 경우, 멀티미디어 디바이스(900)는 상기 수신된 상태 정보에 기초하여 GUI를 생성 및 디스플레이하며, 사용자는 상기 GUI를 통해 외부 디바이스(200)의 현재 상태를 알 수 있다. 예를 들어, 단계(S1012 or S1025)에서 실행된 특정 기능이 에어컨의 설정 온도를 낮추는 기능이었던 경우, 사용자는, 멀티미디어 디바이스(900)에 디스플레이된 GUI를 통해, 자신의 제어 명령이 에어컨에 제대로 전달되어 에어컨의 설정 온도가 낮춰졌음을 확인할 수 있다.
도 18은 본 발명의 일 실시예에 따른 음성 인식 플로우를 설명하기 위한 도면이다. 도 18에서 단계(S1001 내지 S1007)는 도 16에서 설명한 바와 같으므로, 설명을 생략한다. 물론, 멀티미디어 디바이스(900) 대신 멀티미디어 디바이스(300)를 포함하여 구현하는 것도 본 발명의 권리범위에 속한다.
도 18에 도시된 바와 같이, 서버(400)는 변환된 텍스트에 해당하는 컨텐츠 정보를 추출한다(S1031). 상기 추출된 컨텐츠 정보에는, 컨텐츠 명, 컨텐츠를 제공하는 출처(예를 들어, 방송국, 서비스 프로바이더 또는 컨텐츠 프로바이더 등), 컨텐츠와 관련된 인물 정보 등이 포함될 수 있다. 그리고, 상기 추출된 컨텐츠 정보를 멀티미디어 디바이스(900)로 전송한다.
멀티미디어 디바이스(900)는 상기 컨텐츠 정보를 수신하고, 수신된 컨텐츠 정보를 포함하는 GUI를 생성하여 디스플레이한다(S1033).
도 19는 본 발명의 일 실시예에 따른 멀티미디어 디바이스의 제어부에서 컨텐츠 음성신호를 제거하는 플로우를 설명하기 위한 도면이다. 물론, 멀티미디어 디바이스(900) 대신 멀티미디어 디바이스(300)를 포함하여 구현하는 것도 본 발명의 권리범위에 속한다.
도 19에 도시된 바와 같이, 멀티미디어 디바이스(900)는 음성 처리부(912)에서 컨텐츠 내 음성 신호를 처리하고(S1101), 이를 오디오 출력부(930)로 전달한다(S1102). 음성 처리부(912)에서 처리 완료된 음성 신호를 제1 음성 신호라 칭하기로 한다. 오디오 출력부(930)는 상기 제1 음성 신호를 출력한다(S1103).
이와 동시에, 리모트 컨트롤러(100)는 사용자가 발화하는 음성을 수신하고 이를 전기적인 음성 신호로 변환한다(S1104). 사용자는 오디오 출력부(930)에서 컨텐츠 내 음성 신호가 출력되는 중에 음성을 발화하였으므로, 리모트 컨트롤러(100)에 수신된 음성 신호에는 사용자의 음성 신호 외에 컨텐츠 내 음성 신호도 포함된다.
리모트 컨트롤러(100)는 상기 수신된 음성 신호를 멀티미디어 디바이스(900)로 전송하고(S1105), 멀티미디어 디바이스(900)는 RF 모듈(922)을 통해 멀티미디어 디바이스(900)로부터 수신된 음성 신호를 제어부(910) 내 컨텐츠 음성신호 제거부(914)로 전달한다(S1106). 상기 전달된 음성 신호를 제2 음성 신호라 칭하기로 한다.
음성 처리부(912)는 단계(S1104)에서 음성 신호가 수신되기 전 기설정된 시간 동안 오디오 출력부를 통해 출력된 제1 음성 신호 관련 정보를 컨텐츠 음성신호 제거부(914)로 전달한다. 단계(S1104)에서 음성 신호가 수신되는 시간과 컨텐츠 음성신호 제거부(914)에서 컨텐츠 내 제1 음성 신호를 제거를 시작하는 시간 사이에는 소정의 시간차가 존재하기 때문에, 단계(S1104)에서 음성 신호가 수신되기 전 기설정된 시간 동안 오디오 출력부를 통해 출력된 제1 음성 신호 관련 정보가 요구되는 것이다.
컨텐츠 음성신호 제거부(914)는 상기 제2 음성 신호와 상기 제1 음성 신호를 비교한다(S1108). 그리고, 비교 결과에 따라, 상기 제2 음성 신호에서 상기 제1 음성 신호와 동일한 부분을 제거한다(S1109). 즉, 상기 제2 음성 신호의 파형에서 상기 제1 음성 신호의 파형과 동일한 부분을 제거한다. 이로써, 멀티미디어 디바이스(900)는 사용자 본래의 음성 신호에 가까운 음성 신호를 획득할 수 있고, 도 16 내지 도 18의 실시예에 따라 상기 획득된 음성 신호를 서버(400)에 전송하여 음성 인식률을 향상시킬 수 있다.
도 20은 복수 개의 리모트 컨트롤러가 존재하는 실시예를 설명하기 위한 도면이다.
도 20에 도시된 바와 같이, 댁 내에 총 세 개의 리모트 컨트롤러(100A, 100B, 100C)가 존재하는 경우를 예로 들어 설명한다. 편의상, 리모트 컨트롤러(100A)를 1번 리모트 컨트롤러, 리모트 컨트롤러(100B)를 2번 리모트 컨트롤러, 리모트 컨트롤러(100C)를 3번 리모트 컨트롤러라 칭하기로 한다. 세 개의 리모트 컨트롤러(100A, 100B, 100C)를 통칭하고자 하는 경우에는 리모트 컨트롤러(100)라 칭하기로 한다.
리모트 컨트롤러(100)와 디바이스(200, 300) 사이에 장벽이 존재하는 경우, 리모트 컨트롤러(100)가 송신하는 IR 신호의 직진성으로 인하여, 디바이스(200, 300)에 상기 IR 신호가 제대로 전달되기 어렵다. 따라서, 필요에 따라, 사용자는 댁 내 거실과 방에 적어도 하나의 리모트 컨트롤러(100)를 각각 설치하여 사용할 수 있다.
도 20을 참조하면, 거실에는 멀티미디어 디바이스(300) 및 이에 연결된 DVD 플레이어(210)가 설치되어 있고, 첫 번째 방에는 에어컨(240)이 설치되어 있으며, 두 번째 방에는 사운드 바(230)가 설치되어 있다.
사용자가 거실에서 멀티미디어 디바이스(300)와 DVD 플레이어를 제어하고자 하는 경우에는 1번 리모트 컨트롤러(100A)를 사용하여 제어할 수 있다. 마찬가지로, 사용자가 첫 번째 방에서 에어컨(240)을 제어하고자 하는 경우에는 2번 리모트 컨트롤러(100B)를 사용하여 제어할 수 있고, 사용자가 두 번째 방에서 사운드 바(230)를 제어하고자 하는 경우에는 3번 리모트 컨트롤러(100C)를 사용하여 제어할 수 있다.
한편, 예를 들어, 사용자가 거실에서 첫 번째 방 안에 설치된 에어컨(240)을 제어하고자 하는 경우, 거실과 첫 번째 방은 벽에 의해 가로막혀 있기 때문에 1번 리모트 컨트롤러(100A)에서 송신되는 IR 신호로는 에어컨(240)을 제어할 수 없다.
이 경우, 1번 리모트 컨트롤러(100A)는 에어컨(240)의 특정 기능에 매칭되는 IR 코드값을 RF 모듈(142)을 통해 2번 및 3번 리모트 컨트롤러(100B, 100C)로 전송하고, 2번 및 3번 리모트 컨트롤러(100B, 100C)는 상기 IR 코드값을 수신하여 이에 대응하는 IR 신호를 송신한다. 에어컨(240)은 2번 리모트 컨트롤러(100B)에서 송신되는 IR 신호를 수신할 수 있고, 이에 따라 에어컨(240)의 특정 기능이 실행된다. 실시예에 따라, 1번 리모트 컨트롤러(100A)가 에어컨(240)과 2번 리모트 컨트롤러(100B)가 동일한 장소에 설치되어 있다는 정보를 미리 알고 있는 경우라면, 1번 리모트 컨트롤러(100A)는 상기 IR 코드값을 2번 리모트 컨트롤러(100B)에만 전송하도록 설계될 수도 있다.
설명의 편의를 위하여 각 도면을 나누어 설명하였으나, 각 도면에 서술되어 있는 실시예들을 병합하여 새로운 실시예를 구현하도록 설계하는 것도 가능하다. 그리고, 당업자의 필요에 따라, 이전에 설명된 실시예들을 실행하기 위한 프로그램이 기록되어 있는 컴퓨터에서 판독 가능한 기록 매체를 설계하는 것도 본 발명의 권리범위에 속한다.
본 발명에 따른 멀티미디어 디바이스 및 그 동작 방법은 상기한 바와 같이 설명된 실시 예들의 구성과 방법이 한정되게 적용될 수 있는 것이 아니라, 상기 실시 예들은 다양한 변형이 이루어질 수 있도록 각 실시 예들의 전부 또는 일부가 선택적으로 조합되어 구성될 수도 있다.
한편, 본 발명의 멀티미디어 디바이스의 동작방법은 디스플레이 장치에 구비된 프로세서가 읽을 수 있는 기록매체에 프로세서가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 프로세서가 읽을 수 있는 기록매체는 프로세서에 의해 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 프로세서가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한, 인터넷을 통한 전송 등과 같은 캐리어 웨이브의 형태로 구현되는 것도 포함한다. 또한, 프로세서가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 프로세서가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
또한, 이상에서는 본 발명의 바람직한 실시 예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시 예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해돼서는 안 될 것이다.
그리고, 당해 명세서에서는 물건 발명과 방법 발명이 모두 설명되고 있으며, 필요에 따라 양발명의 설명은 보충적으로 적용될 수가 있다.
100: 리모트 컨트롤러
200: 외부 디바이스
300, 900: 멀티미디어 디바이스
400: 서버
200: 외부 디바이스
300, 900: 멀티미디어 디바이스
400: 서버
Claims (18)
- 멀티미디어 디바이스 및 적어도 하나의 외부 디바이스를 제어하는 리모트 컨트롤러에 있어서,
사용자가 발화하는 음성을 수신하여 음성 신호로 변환하는 음성 입력부;
상기 음성 신호를 처리하는 음성 처리부;
상기 처리된 음성 신호로부터 제1 코드값을 검출하는 음성 인식부; 및
상기 검출된 제1 코드값에 대응하는 제1 제어 신호를 제1 통신 규격에 따라 송신하되, 복수 개의 방향을 향해 상기 제1 제어 신호를 각각 송신하는 통신부;를 포함하는 리모트 컨트롤러. - 제 1 항에 있어서,
상기 음성 인식부는, 상기 처리된 음성 신호의 특징 정보를 추출하고, 상기 추출된 특징 정보에 기초하여 음성 신호를 텍스트로 변환하고, 상기 변환된 제1 텍스트에 매칭되는 제1 코드값을 검출하도록 설계된 리모트 컨트롤러. - 제 1 항에 있어서,
텍스트에 매칭되는 코드값들을 상기 복수 개의 디바이스 별로 구분하여 저장하는 저장부를 더 포함하는 리모트 컨트롤러. - 제 1 항에 있어서,
상기 텍스트는 트리거 단어(trigger word), 디바이스 명, 그리고 기능 제어 단어를 포함하는 리모트 컨트롤러. - 제 1 항에 있어서,
상기 음성 인식부는, 상기 처리된 음성 신호의 특징 정보를 추출하고, 상기 추출된 특징 정보에 기초하여 텍스트 변환 가능 여부를 판단하도록 설계된 리모트 컨트롤러. - 제 5 항에 있어서,
상기 통신부는, 상기 음성 인식부에서 텍스트 변환이 가능하지 않다고 판단된 경우, 상기 처리된 음성 신호를 제2 통신 규격에 따라 상기 멀티미디어 디바이스로 전송하도록 설계된 리모트 컨트롤러. - 제 6 항에 있어서,
상기 통신부는 상기 제1 통신 규격에 따라 신호를 송신하는 IR 모듈 및 상기 제2 통신 규격에 따라 신호를 송수신하는 RF 모듈을 포함하는 리모트 컨트롤러. - 제 6 항에 있어서,
상기 통신부는 상기 처리된 음성 신호에 대응하는 제2 코드값을 상기 제2 통신 규격에 따라 상기 멀티미디어 디바이스로부터 수신하고, 상기 제2 코드값에 대응하는 제2 제어 신호를 상기 제1 통신 규격에 따라 송신하도록 설계된 리모트 컨트롤러. - 멀티미디어 디바이스 및 적어도 하나의 외부 디바이스를 제어하는 리모트 컨트롤러의 제어 방법에 있어서,
사용자가 발화하는 음성을 수신하여 음성 신호로 변환하는 단계;
상기 음성 신호를 처리하는 단계;
상기 처리된 음성 신호로부터 제1 코드값을 검출하는 단계;
상기 검출된 제1 코드값에 대응하는 제1 제어 신호를 제1 통신 규격에 따라 송신하는 단계;를 포함하고,
상기 제1 제어 신호 송신 단계는, 복수 개의 방향을 향해 상기 제어 신호를 송신하는 리모트 컨트롤러의 제어 방법. - 제 9 항에 있어서, 상기 코드값 검출 단계는,
상기 처리된 음성 신호의 특징 정보를 추출하는 단계;
상기 추출된 특징 정보에 기초하여 음성 신호를 제1 텍스트로 변환하는 단계; 및
상기 변환된 제1 텍스트에 매칭되는 제1 코드값을 검출하는 단계;를 포함하는 리모트 컨트롤러의 제어 방법. - 제 9 항에 있어서,
텍스트에 매칭되는 코드값들을 상기 복수 개의 디바이스 별로 구분하여 데이터베이스를 구축하는 단계;를 더 포함하는 리모트 컨트롤러의 제어 방법. - 제 9 항에 있어서,
상기 처리된 음성 신호의 특징 정보를 추출하고, 상기 추출된 특징 정보에 기초하여 텍스트 변환 가능 여부를 판단하는 단계; 및
텍스트 변환이 가능하지 않다고 판단된 경우, 상기 처리된 음성 신호를 제2 통신 규격에 따라 상기 멀티미디어 디바이스로 전송하는 단계;를 더 포함하는 리모트 컨트롤러의 제어 방법. - 제 12 항에 있어서,
상기 처리된 음성 신호에 대응하는 제2 코드값을 상기 제2 통신 규격에 따라 상기 멀티미디어 디바이스로부터 수신하는 단계; 및
상기 제2 코드값에 대응하는 제2 제어 신호를 상기 제1 통신 규격에 따라 송신하는 단계;를 더 포함하는 리모트 컨트롤러의 제어 방법. - 적어도 하나의 외부 디바이스와 연결된 멀티미디어 디바이스의 제어 방법에 있어서,
리모트 컨트롤러로부터 제1 음성 신호를 수신하는 단계;
상기 수신된 제1 음성 신호를 처리하는 단계;
상기 처리된 제1 음성 신호를 외부 서버로 전송하는 단계;
상기 전송된 제1 음성 신호로부터 변환된 텍스트를 상기 외부 서버로부터 수신하는 단계;
상기 수신된 텍스트에 매칭되는 코드값을 검출하는 단계;
상기 검출된 코드값을 리모트 컨트롤러로 전송하는 단계;를 포함하는 멀티미디어 디바이스의 제어 방법. - 제 14 항에 있어서,
텍스트에 매칭되는 코드값들을 상기 적어도 하나의 외부 디바이스 별로 구분하여 데이터베이스를 구축하는 단계;를 더 포함하는 멀티미디어 디바이스의 제어 방법. - 제 14 항에 있어서,
상기 전송된 제1 음성 신호에 대응하는 컨텐츠 정보를 상기 외부 서버로부터 수신하는 단계;
상기 수신된 컨텐츠 정보를 포함하는 그래픽 사용자 인터페이스를 생성하는 단계; 및
상기 생성된 그래픽 사용자 인터페이스를 디스플레이하는 단계;를 더 포함하는 멀티미디어 디바이스의 제어 방법. - 제 14 항에 있어서,
컨텐츠 신호를 수신하는 단계;
상기 컨텐츠 신호를 제2 음성 신호와 영상 신호로 디멀티플렉싱하는 단계;
상기 디멀티플렉싱된 제2 음성 신호와 영상 신호를 각각 처리하는 단계;
상기 처리된 제2 음성 신호를 오디오 출력부를 통해 출력하고, 상기 처리된 영상 신호를 디스플레이부를 통해 출력하는 단계;를 더 포함하는 멀티미디어 디바이스의 제어 방법. - 제 17 항에 있어서, 상기 제1 음성 신호 처리 단계는,
상기 제1 음성 신호와, 상기 제1 음성 신호가 수신되기 전 기설정된 시간 동안 상기 오디오 출력부를 통해 출력된 상기 제2 음성 신호를 비교하는 단계; 및
상기 제1 음성 신호에서 상기 제2 음성 신호와 동일한 부분을 제거하는 단계;를 포함하는 멀티미디어 디바이스의 제어 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20130076996A KR20150004051A (ko) | 2013-07-02 | 2013-07-02 | 리모트 컨트롤러 및 멀티미디어 디바이스의 제어 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20130076996A KR20150004051A (ko) | 2013-07-02 | 2013-07-02 | 리모트 컨트롤러 및 멀티미디어 디바이스의 제어 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20150004051A true KR20150004051A (ko) | 2015-01-12 |
Family
ID=52476436
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR20130076996A KR20150004051A (ko) | 2013-07-02 | 2013-07-02 | 리모트 컨트롤러 및 멀티미디어 디바이스의 제어 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20150004051A (ko) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160147556A (ko) * | 2015-06-15 | 2016-12-23 | 엘지전자 주식회사 | 영상표시장치의 동작 방법 |
KR20190034964A (ko) * | 2017-09-25 | 2019-04-03 | 현대자동차주식회사 | 음성 인식 제어 장치, 그를 포함한 시스템 및 그 방법 |
KR20190050224A (ko) * | 2017-11-02 | 2019-05-10 | 현대자동차주식회사 | 차량의 음성인식 장치 및 방법 |
KR20200109742A (ko) * | 2019-03-14 | 2020-09-23 | 주식회사 엘지유플러스 | 음성 인식을 위한 리모콘 및 그 장치를 이용한 음성 인식 방법 |
-
2013
- 2013-07-02 KR KR20130076996A patent/KR20150004051A/ko not_active Application Discontinuation
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160147556A (ko) * | 2015-06-15 | 2016-12-23 | 엘지전자 주식회사 | 영상표시장치의 동작 방법 |
KR20190034964A (ko) * | 2017-09-25 | 2019-04-03 | 현대자동차주식회사 | 음성 인식 제어 장치, 그를 포함한 시스템 및 그 방법 |
KR20190050224A (ko) * | 2017-11-02 | 2019-05-10 | 현대자동차주식회사 | 차량의 음성인식 장치 및 방법 |
KR20200109742A (ko) * | 2019-03-14 | 2020-09-23 | 주식회사 엘지유플러스 | 음성 인식을 위한 리모콘 및 그 장치를 이용한 음성 인식 방법 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6640502B2 (ja) | ディスプレイ装置、音声取得装置およびその音声認識方法 | |
KR101917182B1 (ko) | 영상처리장치, 음성취득장치, 그 음성인식방법 및 음성인식시스템 | |
US9552057B2 (en) | Electronic apparatus and method for controlling the same | |
US10678563B2 (en) | Display apparatus and method for controlling display apparatus | |
CN111417004B (zh) | 图像显示设备及其操作方法 | |
US10063802B2 (en) | Multimedia device and method for controlling external devices of the same | |
CN107636749A (zh) | 图像显示设备及其操作方法 | |
CN108513152A (zh) | 图像显示设备及其操作方法 | |
KR20150004051A (ko) | 리모트 컨트롤러 및 멀티미디어 디바이스의 제어 방법 | |
KR20220073723A (ko) | 디스플레이장치, 음성취득장치 및 그 음성인식방법 | |
EP4037323A1 (en) | Artificial intelligence server and operation method thereof | |
KR102017692B1 (ko) | 적어도 하나 이상의 전자 디바이스와 연결된 멀티미디어 디바이스 및 그 제어 방법 | |
KR101931938B1 (ko) | 리모트 컨트롤러 및 멀티미디어 디바이스의 제어 방법 | |
KR102114612B1 (ko) | 리모트 컨트롤러 및 멀티미디어 디바이스의 제어 방법 | |
KR102221294B1 (ko) | 멀티미디어 디바이스 및 이의 제어 방법 | |
EP3859517A1 (en) | Electronic apparatus and method of controlling the same | |
KR102224484B1 (ko) | 멀티미디어 디바이스 및 이의 제어 방법 | |
KR102265904B1 (ko) | 멀티미디어 디바이스 및 이의 제어 방법 | |
KR102262050B1 (ko) | 디스플레이장치, 음성취득장치 및 그 음성인식방법 | |
US11178466B2 (en) | Display device and control method therefor | |
KR102108065B1 (ko) | 멀티미디어 디바이스 및 이의 제어 방법 | |
KR20140130856A (ko) | 멀티미디어 디바이스 및 그 제어 방법 | |
KR102108064B1 (ko) | 멀티미디어 디바이스 및 이의 제어 방법 | |
KR20140137263A (ko) | 대화형 서버, 디스플레이 장치 및 제어 방법 | |
KR20210073305A (ko) | 전자장치 및 그 제어방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Withdrawal due to no request for examination |