KR100753780B1 - 음성 입력 디바이스 - Google Patents

음성 입력 디바이스 Download PDF

Info

Publication number
KR100753780B1
KR100753780B1 KR1020007009889A KR20007009889A KR100753780B1 KR 100753780 B1 KR100753780 B1 KR 100753780B1 KR 1020007009889 A KR1020007009889 A KR 1020007009889A KR 20007009889 A KR20007009889 A KR 20007009889A KR 100753780 B1 KR100753780 B1 KR 100753780B1
Authority
KR
South Korea
Prior art keywords
command
mode
attention
period
voice input
Prior art date
Application number
KR1020007009889A
Other languages
English (en)
Other versions
KR20010041676A (ko
Inventor
뷸빈센투스피.
카프홀쯔파울에이.피.
게르쯔루카스제이.에프.
Original Assignee
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 코닌클리케 필립스 일렉트로닉스 엔.브이.
Publication of KR20010041676A publication Critical patent/KR20010041676A/ko
Application granted granted Critical
Publication of KR100753780B1 publication Critical patent/KR100753780B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Selective Calling Equipment (AREA)
  • Details Of Television Systems (AREA)

Abstract

입력 디바이스(100)를 기초로 한 음성 입력은 오직 활성화 명령만을 인식하는 대기 모드 및 장치를 제어하기 위한 명령을 인식하는 동작 모드를 갖는다. 디바이스(100)가 음성 입력에서 활성화 명령을 인식했을 때, 이것은 동작 모드로 스위칭된다. 상기 디바이스는 명령이 인식되는 동안만 동작 모드 안에 있고, 만약 주어진 시간 기간 동안에 아무런 명령도 인식되지 않는다면 대기 모드로 되돌아간다. 본 발명에 따른 상기 디바이스는 사용자에게 디바이스의 모드 및 모드의 변경을 알리기 위해 청취 가능한 신호를 생성하는 신호 모듈(126)을 갖는다.
주의 기간, 음성 입력, 대기 모드, 동작 모드

Description

음성 입력 디바이스{Speech input device with attention span}
본 발명은 장치를 제어하는 디바이스에 관한 것으로서, 상기 디바이스는, 음성 입력을 수신하는 수신 유닛, 명령을 인식하기 위해 수신된 입력을 분석하는 분석 유닛과, 장치로의 명령을 송신하는 송신 유닛과, 디바이스가 장치의 실제 제어에 비작동적인 대기 모드로부터 디바이스가 장치의 실제 제어에 작동적인 동작 모드로 스위칭시키는 활성화 유닛(activation unit)을 구비한다.
본 발명은 더욱이 상기 디바이스를 구비한 리모트 컨트롤과 관련 있다.
본 발명은 더욱이 복수의 상기 디바이스를 구비하는 시스템에 관련 있다.
본 발명은 더욱이 장치를 제어하는 방법에 관련이 있으며, 상기 방법은 음성 입력을 수신하는 수신 단계와, 명령을 인식하기 위해 수신된 입력을 분석하는 분석 단계와, 명령의 인식 및 송신을 가능하게 하는 활성화 단계를 구비한다.
상기 디바이스는 Microsoft Agent API(Application Programing Interface)를 이용한 에이전트로서 이용될 수 있다. Microsoft사에서 입수 가능한 1997년 8월 출판된 자료 "Designing Characters for Microsoft Agent"에서는, 장치의 인테페이스의 부분으로서 어떻게 에이전트를 발전시키는 지를 설명한다. Microsoft Agent의 본문에서, 장치는 컴퓨터에서 실행되는 클라이언트 어플리케이션 프로그램이다. 에이전트는 사용자에게 다른 애니메이션 수단에 의한 캐릭터로서 디스플레이됨으로써, 실행 애니메이션이 에이전트의 실행 상태에 의존하여 선택된다. 에이전트는 마우스 및 키보드를 통한 명령은 물론, 음성 입력을 통해 명령을 수신할 수 있다. 이것을 실현하기 위해, 사용자는 소위, 푸시 투 토크 핫 키(push-to-talk hot key)를 누름으로써 에이전트를 청취 모드로 한다. 그리고 에이전트는 음성 입력에 민감해지고 사용자는 원하는 명령 및 명령들을 말한다. 시각화하기 위해서, 에이전트는 청취 상태로 들어가며 대응하는 청취 애니메이션은 스크린 상에 디스플레이 된다. 이 청취 상태에서, 에이전트는 음성 입력에서 명령을 인식하는 것을 시도한다. 만약 에이전트가 명령을 인식한다면, 이 명령은 에이전트가 가리키는 클라이언트 어플리케이션 프로그램을 실행하려고 송신한다.
본 발명의 목적은, 알려진 디바이스보다 사용자에게 더 친숙한, 서두에서 설명된 장치를 공급하는 것이다. 상기 목적은, 음성 입력을 수신하고, 활성화 명령(activation instruction)을 인식하기 위해 수신된 음성 입력을 분석하며, 활성화 명령을 인식함에 따라 대기 모드에 의해 동작 모드로 스위칭하도록 배열된 활성화 유닛을 특징으로 하는 디바이스에서 이루어진다. 사용자는 본 발명에 따른 디바이스를 활성화 명령을 말함으로써 동작 모드에 삽입할 수 있고, 사용자는 특정 키를 누를 필요가 없다. 이것은 디바이스가 특정 키를 필요로 하지 않다는 것을 의미한다. 더욱이 오직 음성 입력만이 요구되고, 사용자는 디바이스의 물리적인 조정을 필요로 하지 않으므로, 완벽한 핸드 프리(hand free)가 구현된다. 이것은 사용자가 장치를 제어하기 위한 부가된 다른 업무를 수행 중인 상태일 때 더욱 이점을 갖는다. 이러한 상황의 예는 자동차를 운전 중에 자동차용 라디오 혹은 자동차용 전화기를 이용하는 것이다. 본 발명에 따른 디바이스와 물리적인 접촉이 필요하지 않기 때문에, 사용자는 그에 의해 말해진 입력이 디바이스에 수신될 수 있는만큼 디바이스로부터 일정 거리 떨어질 수 있다.
본 발명에 따른 디바이스의 실시예는 청구항에 설명되어 있다. 만약 일정한 기간 동안 어떤 명령도 주어지지 않았다면, 디바이스는 자동적으로 동작 모드에서 대기 모드로 스위칭되므로, 사용자는 명시적으로 디바이스를 대기 모드로 스위칭시킬 필요가 없다. 대기 모드로의 자체적인 스위칭 때문에, 뜻하지 않게 동작 모드에 남아 있을 확율은 매우 작다. 디바이스는 진행중인 대화에서의 명령을 인식하거나 제어되는 장치를 실행과 관계없는 명령을 송신할 수 있기 때문에, 디바이스는 뜻하지 않게 동작 모드에 남아 있어서는 안 된다. 사용자가 활성화 명령을 말할 경우, 디바이스는 사용자에게 응용을 제어 할 수 있는 어떤 명령을 사용자가 말할 수 있는 주의 기간(attention period)을 제공한다. 상기 명령이 주의 기간동안 주어지지 않았을 때, 디바이스는 대기 단계로 돌아간다. 이런 메카니즘은 또한 디바이스 및 대응하는 장치로의 의도하지 않은 동작에 대한 안전책이다. 만약 대기 모드의 디바이스가 뜻하지 않게 대화중의 활성화 명령을 포착했다면, 이것은 오직 그 주의 기간 동안에만 작동적이고, 대기 모드로 다시 돌아간다. 이것은 장치의 의도되지 않은 제어의 확률을 감소시킨다.
본 발명에 따른 디바이스의 실시예는 청구항에 설명되어 있다.
디바이스는 동작 모드로 진입하여 음성 입력의 명령에 대하여 민감할 때, 청취가능한 신호에 의해 사용자를 인식한다. 이러한 인식 목적을 위해서, 시각적 신호의 경우 스크린 또는 시각적 신호를 디스플레이하는 디바이스 부분에 사용자의 지속적인 관심을 요구하기 때문에, 청취 가능한 신호가 시각적인 신호보다 우수하다. 그러므로, 시각적 신호가 인식되지 않은 상태에서, 특히 본의 아니게 동작 모드로 진입할 경우, 사용자가 알지 못하게 디바이스의 모드를 변경시키는 것을 막는다. 디스플레이 스크린 없이 동작을 완성할 수 있는 이 디바이스의 또 다른 이점은, 생산 단가를 절약할 수 있다는 것이다.
본 발명에 따른 디바이스의 실시예가 청구항에 나타나 있다. 주의 신호는 사용자에게 주의 기간동안 시간의 진행을 알리고, 사용자에게 다시 디바이스가 음성 입력을 통해 명령을 수신할 준비가 되어 있는 동작 모드에 있음을 인식시키는데 이용된다.
본 발명에 따른 디바이스의 실시예가 청구항에 나타나 있다. 종료 신호는 사용자에게 디바이스가 더 이상 동작 모드에 있지 않으며, 그러므로 더 이상 음성 입력의 명령에 민감하지 않다는 것을 인식시킨다. 이 디바이스는 대기 모드와 동작 모드 사이의 쉽고 간편한 스위칭 때문에, 사용자 친밀감 및 장치의 자유로운 제어를 허락한다. 활성화 명령을 인식함에 따라, 디바이스는 음성 입력의 명령에 디바이스가 민감한 동안 사용자에게 주의 기간 시작을 알리는 시작 신호를 생성한다. 디바이스는 인식된 명령을 실행을 위한 장치로 송신한다. 만약 미리 정해진 기간동안 어떤 명령도 주어지지 않고 인식되지 않았다면, 디바이스는 타임 아웃(time out)되고 종료 신호는 주의 기간의 종료를 나타낼 것이며, 디바이스는 음성 입력의 명령에 대하여 더 이상 민감하지 않을 것이다. 두 명령 사이의 시간의 기간의 길이는 미리 정해진 "타임 아웃" 기간보다 짧으며, 디바이스는 동작 모드에 남아있고 음성 입력의 송신된 명령을 준비할 것이다.
사용자가 리모트 컨트롤로 텔레비전 세트 및 하이-파이 세트를 제어하는 것은 잘 알려져 있다. 제어되는 장치의 기능은 리모트 컨트롤러의 대응하는 키 및 키의 조합을 눌러 활성화되거나 조정된다. 리모트 컨트롤러의 키를 누르면, 결과적으로 리모트 컨트롤에 의해 무선, 예를 들면, 적외선, 코딩된 신호가 송신된다. 이러한 신호는 장치에서 수신되고 대응하는 작동으로 변환된다. 예로는 하이-파이의 볼륨 셋팅을 조정하는 것 및 텔레비전 세트의 체널을 조정하는 것이다. 그러므로, 리모트 컨트롤의 키를 눌러 명령이 주어지고, 상기 명령은 개개의 리모트 컨트롤에 의해 제어되는 장치에 의해 실행된다.
리모트 컨트롤은 본 발명에 따른 장치가 유리하게 설치될 수 있다. 그러므로 명령의 일부는 음성 입력으로 주어진 리모트 컨트롤에 의해 지원된다. 리모트 컨트롤에 의해 지원되는 일부 명령은 음성 입력으로 주어질 수 있다. 동일한 명령이 지원되는 경우에, 이것은 리모트 컨트롤에 필요한 키의 수를 감소시킨다. 대안적으로, 새로운 명령이 본 발명에 따른 디바이스에 의해 지원될 때, 리모트 컨트롤은 키의 수를 증가할 필요없이 명령의 수의 증가를 지원할 수 있다. 더욱이, 리모트 컨트롤의 모든 명령은 본 발명에 따른 디바이스에 의해 지원될 수 있다. 그러므로 전혀 키를 갖지 않은 리모트 컨트롤을 갖는 것을 가능하게 한다.
제어되는 복수의 장치를 구비하는 시스템은 제어하기 위해 각각의 디바이스를 구비한다. 이러한 시스템에서는, 단일 디바이스를 그 동작 모드로 진입시키는 것 및 다른 디바이스들을 대기 모드로 이탈시키는 것을 용이하도록 하기 위해, 각각의 디바이스가 각각의 고유한 활성화 명령을 갖는 것이 유리하다. 사용자가 원하는 장치를 제어하는 디바이스의 활성화 명령을 단순히 말하고, 이어서 이 장치에 대한 명령을 말한다. 비록 어떤 명령은 현재 제어되는 장치에 대해 동일하다 하여도, 다른 장치들은 그 디바이스들이 대기 모드에 있고, 이러한 명령어를 인식 및 송신하지 않으므로, 응답하지 않는다. 이 시스템의 하나 이상의 디바이스들은 하나의 전체 디바이스에 집적될 수 있다. 이 전체 디바이스는 각각의 활성화 명령이 수신되고 인식된 후에 디바이스들 중의 하나의 업무를 수행한다.
제어되는 장치는 다양한 종류 중의 하나가 될 수 있다. 예를 들어, 텔레비전같은 단일 독립 장치이거나 컴퓨터에서 수행되는 어플리케이션 프로그램일 수 있다. 이를 위해, 본 발명에 따른 디바이스는 다른 실시예를 갖는다. 이것은 독립된 방식으로 동작되고 무선 링크를 통해 인식된 명령을 장치에 송신하는 리모트 컨트롤처럼 분리된 디바이스일 수 있다. 또한 이것은 컴퓨터에서 실행되는 소프트웨어 프로그램으로 수행되거나 어플리케이션 프로그램에 인터페이스 부분을 형성할 수 있다. 이 경우, 디바이스는 소프트웨어 프로토콜의 패러미터로서 제어된 어플리케이션 프로그램에 명령을 송신함으로써, 하나의 소프트웨어 컴포넌트는 일정 패러미터 셋을 갖는 다른 소프트웨어 컴포넌트를 호출한다. 더욱이, 디바이스는 예를 들면 전용 하드웨어 유닛과 같은 제어되는 장치에 집적될 수 있으므로, 단일 물리적 장치를 형성한다. 이 경우, 명령의 전송이 정확하지는 않지만 디바이스는 제어되는 장치를 직접 제어할 수 있다.
본 발명의 또 다른 목적은, 전문에서 상술된 것처럼, 알려진 방법보다 더욱 사용자에게 친숙한 방법을 제공하는 것이다. 본 발명의 목적은 음성 입력을 수신하고, 활성화 명령을 인식하기 위해 수신된 입력을 분석하며, 활성화 명령의 인식에 따라 명령의 인식 및 송신을 가능하게 하는 서브-단계들을 구비하는 활성화 단계를 특징으로 하는 방법으로 성취된다.
본 발명 및 부수적인 이점은 첨가된 예시적인 실시예 및 첨부된 구조도에 의해 설명될 것이다.
도 1은 본 발명에 따른 디바이스의 가장 중요한 요소의 구조도.
도 2는 본 발명에 따른 디바이스의 실시예에 대한 주요 단계의 플로우 차트를 도시한 도면.
도 3a는 본 발명에 따른 리모트 컨트롤의 상면도.
도 3b는 본 발명에 따른 리모트 컨트롤의 내부 측면도.
도 4는 본 발명에 따른 복수의 디바이스의 시스템을 도시한 도면
도 1은 본 발명에 따른 디바이스의 가장 중요한 요소를 도시하는 구조도이다. 디바이스(100)는 음성 입력으로 장치(101)를 원격적으로 제어한다. 상기 디바이스는 필립스의 팜 PC 니노(palm PC Nino)에서 실행된다. 팜 PC는 물리적으로 작은 크기의 컴퓨터이고, 그러므로 쉽게 손에 쥐고 윈도우 CE 오퍼레이션 시스템을 실행시킬 수 있다. 그러나, 디바이스는 또한 다른 알맞은 타입의 컴퓨터에서도 실행 될 수 있다. 디바이스는 작동 메모리(104)에 로드된 프로그램 명령을 실행시키는 프로세서(102)를 갖고 있다. 디바이스는 주변 장치와 통신하는 인터페이스(106)를 갖는다. 더욱이. 디바이스는 다양한 컴포넌트 사이의 명령을 교환하는 버스(108)를 갖는다. 디바이스의 부착물은 디바이스의 사용자로부터 음성을 수신하는 미이크로 폰(110) 및 사용자에게 오디오 신호를 생산하는 라우드 스피커(112)를 갖는다. 더욱이, 디바이스는 디바이스에 의해 제어되는 장치(101)에 적외선 신호의 형태의 명령을 송신하는 송신기(114)를 갖는다.
본 디바이스의 다양한 과제는 작동 메모리에 로드되는 프로그램 모듈에 의해 실행된다. 마이크로 폰(110)에 의해 획득된 음성 입력을 수신하기 위한 수신 모듈(116)이 있다. 음성 입력은 특정한 단어와 구를 인식하기 위한 분석 모듈(118)에서 분석된다. 디바이스의 대기 모드에서, 상기 분석 모듈은 음성 입력의 단어 "Nino"를 인식하는 것을 시도한다. 이 단어는 디바이스의 활성화 명령이고, 음성 입력에서 이것이 인식 됐을 때, 디바이스는 활성화 유닛(120)에 의해 동작 모드로 변경된다. 동작 모드에서, 분석 모듈은 장치(101)를 제어하는데 이용되는 명령의 미리 정의된 세트로부터 명령을 인식하는 것을 시도한다. 명령이 인식 됐을 때, 송신 모듈(122)은 적외선 신호로서 송신기(114)에 의해 보내질 명령을 준비한다. 더욱이, 디바이스는 명령을 인식한 후 또는 활성화 명령을 인식한 후에 경과된 시간을 측정하는 타이머 모듈(124)을 갖는다. 인식한 이후로부터 미리 정의된 기간 이상이 경과된 때, 디바이스는 동작 모드에서 대기 모드로 되돌아간다. 대안적으로, 디바이스는 특정한 대기 명령을 이용하여 동작 모드에서 대기 모드로 스위칭된다. 이러한 경우, 명령의 세트는 대기 명령을 포함한 동작 모드에서 인식되고, 음성 입력에서 입력됐을 때, 상기 준비 명령은 장치(101)로 전송되는 것이 아니고 결과적으로 대기 모드로 이동한다. 그러므로 이 대안에서, 사용자는 명백히 대기 모드로 스위칭할 수 있다.
음성 인식을 다루는 모듈은 음성 인식 소프트웨어 패키지(Vocom)를 기반으로 하여 실행된다. 디바이스(100)는 대기 모드와 장치로 관련 없는 명령을 보낼 확률을 감소시킬 동작 모드를 갖는다. 만약 디바이스가 오직 동작 모드만을 갖는다면, 명령은 뜻하지 않게 진행중인 대화를 인식할 가능성을 갖는다. 이렇게 인식된 명령은 장치(101)로 송신되고, 그것에 의해 실행된다. 대기 모드에서, 디바이스는 오직 활성화 명령을 인식할 때에만 민감히 반응하고 이미 말해진 명령에 대해서는 응답하지 않는다. 이것은 관련 없는 명령의 실행과 인식의 위험을 감소시킨다. 관련 없는 명령의 인식으로 인해 발생하는 에러는 명령이 잘못 삽입된 것처럼 보이기 때문에 또한, 삽입 에러로 알려져 있다.
본 발명에 따른 디바이스의 실시예는 사용자에게 디바이스의 모드 또는 모드의 변경을 알리는 신호를 생산하는 신호 모듈(126)을 갖는다. 만약 디바이스가 동작 모듈로 스위칭된다면, 신호 모듈은 "Yes?"인 문구의 시작 신호를 생성한다. 이 문구는 라우드 스피커(112)를 통해서 재생된다. 시작 신호는 장치를 제어하는 의도를 갖는 음성 입력의 명령에 대하여, 디바이스가 민감한 반응을 보이는 동안인 주의 기간의 시작을 나타낸다. 주의 기간보다 짧은 미리 정해진 기간 이후에 어떤 명령도 인식되지 않을 때, 신호 모듈은 주의 기간에서 사용자에게 경과된 시간을 알리는 주의 신호를 생성한다. 주의 신호는 문구 "Well?" 처럼 실행되고, 사용자에게 디바이스가 이직 음성 입력에서 명령을 기다리는 동작 모드 안에 있음을 나타낸다. 전체 주의 기간동안 어떤 명령도 인식되지 않았다면, 신호 모듈은 디바이스가 준비 모듈로 되돌아갔음을 나타내는 종료 신호를 생성한다. 종료 신호는 하품이나 흡사한 청취자에게 흥미를 잃게 만드는 소리로서 실행된다. 상술한 바에 대하여 대안적으로, 주의 스팬(attention span)의 실행은 주의 스팬 동안 두드러지지 않은 사운드의 생성에 의해 청취 가능하게 표시된다. 이 경우, 주의 스팬의 프로세스는 발생된 사운드의 변환에 의해 표시된다. 발생된 사운드는 그러므로 주의 스팬의 진행과 함께 일치되어 변환된다. 예를 들면, 사운드의 주파수는 주의 스팬의 끝으로 갈수록 점점 높아진다.
도 2는 본 발명에 따른 디바이스의 실시예의 주요 단계의 플로우 차트를 도시한다. 단계(202)에서 음성 입력은 분석되고 단계(204)에서 활성화 명령 "Nino"가 입력에서 인식 됐는지 결정한다. 만약 해당 경우가 아니라면, 제어는 단계(202)로 다른 음성 입력을 분석하려고 돌아간다. 만약 활성화 명령이 단계(204)에서 인식됐다면, 단계(205)에서는 시작 신호가 주어지고, 단계(206)는 디바이스의 주의 기간동안 시작된다. 디바이스는 그러므로 단계(208)에서 장치를 제어하도록 음성 입력에서 명령을 수신하고 인식하도록 실행된다. 만약 단계(210)에서 명령이 인식됐다면, 명령은 단계(212)에서 제어되는 장치로 송신된다. 디바이스는 음성 입력 안에서 명령을 더 수신하는 동작 모드에 남아있고, 그러므로 새로운 주의 기간은 단계(206)에서 시작된다. 단계(210)에서, 어떤 명령도 인식되지 않았다고 결정되면(이것은 또한 어떤 명령도 주어지지 않았기 때문이다.), 단계(214)에서 주의 기간의 제 1 부분이 이미 경과 됐는지를 결정한다. 만약 제 1 기간이 경과 됐다면, 그러므로 주의 기간은 단계(216)에서 주어지고 제어는 주의 기간의 남아있는 음성 입력의 분석을 위해 단계(208)로 이동된다. 만약 아직 어떤 명령도 인식되지 않고, 주의 신호가 주어졌다면, 모든 주의 기간이 경과됐는지가 단계(218)에서 결정된다. 만약 그렇지 않다면, 제어는 단계(208)로 돌아간다. 그러나, 만약 주의 기간이 경과 됐다면, 그때 단계(220)에서 종료신호가 주어지고 디바이스는 대기 모드로 스위칭된다. 더욱이, 실행은 활성화 신호가 음성 입력에서 다시 주어지는 지를 검사하는 단계(202)로 이어진다.
도 3a는 본 발명에 따른 리모트 컨트롤의 상면도를 도시하고, 도 3b는 본 발명에 따른 리모트 컨트롤의 내부 측면도를 도시한다. 상기 리모트 컨트롤은 도 1과 연결된 설명과 같은 디바이스(100)를 갖는다. 리모트 컨트롤은 더욱이 음성 입력을 수신하는 마이크로 폰(110)을 갖고 사용자에게 신호를 재생산하는 라우드 스피커를 갖는다. 사용자에 의해 말해지고 디바이스(100)에 의해 인식된 명령은 제어되는 장치에 적외선으로서 송신된다. 리모트 컨트롤은 제어되는 장치를 제어하기 위한 몇몇의 명령 키(304)를 갖는다. 이러한 경우, 키는 말해진 명령으로서 또한 주어질 수 있는 명령과 대응되거나 또는 키를 누름으로써 독점적으로 주어지는 명령과 대응한다. 본 발명에 다른 리모트 컨트롤의 실시예에서, 모든 명령은 음성 입력에서 디바이스(100)에 의해 인식될 수 있는 리모트 컨트롤에 의해 지원된다. 이 실시예에서, 어떤 명령 키도 리모트 컨트롤에서 필수적이지 않다.
도 4는 본 발명에 따른 복수의 디바이스로 된 시스템을 도시한다. 각각의 디바이스는 시스템에서의 개개의 장치를 제어한다. 디바이스(402)는 장치(404)를 제어하고, 디바이스(406)는 장치(408)를 제어하고, 디바이스(410)는 장치(412)를 제어한다. 제어 명령은 적외선 신호인 리모트 컨트롤에 의해 전송되고, 각각의 디바이스는 자신의 제어된 기구에 대하여 특별하게 코딩된 신호를 이용한다. 고유한 코딩 때문에, 신호가 각각의 장치에 도달할 동안 디바이스(402)에 의하여 송신된 적외선 신호(414)는 오직 장치(404)에만 효과를 갖는다. 본 발명에 따라, 각각의 디바이스는 고유한 활성화 명령, 예를 들면, 대기 모드를 동작 모드로 특정 디바이스를 스위칭시키는, 416에 의한 디바이스(402)의 부호화와 같은 것을 갖는다. 사용자는 원하는 장치를 제어하기 위해서 디바이스의 활성화 명령을 말할 수 있고 디바이스는 동작 모드로 스위칭된다. 사용자에 의해 말해진 뒤이은 명령은 오직 디바이스에 의해 인식되고, 이것과 관련된 장치의 제어에 의해 송신된다. 다른 디바이스는 대기 모드에 남아있고, 어떤 명령도 송신하지 않는다. 그러므로 하나 이상의 명령은 다른 디바이스에서 동일하며, 동작 모드에서 오직 하나의 디바이스를 스위칭하는 것이 용이하므로 장치를 제어하는데 문제가 없다.
대안은, 디바이스(402, 406 및 410)를 하나의 제어 디바이스에 결합하는 것이다. 이것은 그러므로 버스를 통해서 제어되는 장치에 연결된 것이고 장치의 고유한 활성화 명령이 인식됐을 때, 특정 장치가 어드레스된다.
다른 실시예에서, 본 발명의 장치는 디스플레이를 갖추었다. 이것은 아마도 제어된 디바이스의 디스플레이 일 것이다. 이 실시예에서, 주의 스팬의 시작은 아이콘 장치의 디스플레이에서 표시된다. 대안적으로, 아이콘은 디바이스를 표시하는데 사용되고, 디바이스가 대기 모드에서 동작 모드로 변환할 때, 이것은 장치를 변환시킨다. 아이콘은 또한 동작 모드에서 명령이 인식 된 것을 표시할 때 사용된다. 예를 들면, 사람을 애니메이션하는 경우에, 명령이 정확하게 인식 됐을 때, 사람은 고개를 끄덕인다. 주의 스팬의 진행은 아이콘의 크기를 변경함으로서 표시된다. 그러므로 아이콘은 주의 스팬 동안의 시간의 경과에 따라 줄어든다.

Claims (10)

  1. 장치를 제어하는 디바이스로서,
    음성 입력을 수신하는 수신 유닛과,
    명령을 인식하기 위해 상기 수신된 입력을 분석하는 분석 유닛과,
    상기 디바이스가 상기 장치의 실제 제어에 동작하지 않는 대기 모드로부터, 상기 디바이스가 상기 장치의 실제 제어에 동작하는 동작 모드로 상기 디바이스를 스위칭시키는 활성화 유닛(activation unit)을 포함하는, 상기 디바이스에 있어서,
    상기 활성화 유닛은, 음성 입력을 수신하고, 활성화 명령을 인식하기 위해 상기 수신된 음성 입력을 분석하며, 상기 활성화 명령을 인식함에 따라 상기 대기 모드에서 상기 동작 모드로 상기 디바이스를 스위칭시키고,
    상기 디바이스는, 상기 동작 모드로의 진입에 따라, 상기 디바이스가 상기 동작 모드에 있는 동안 주의 기간(attention period)의 시작을 나타내는, 청취 가능한 시작 신호를 발생하는, 디바이스.
  2. 제 1 항에 있어서,
    상기 동작 모드에서 미리 정해진 주의 기간 동안 어떤 명령이 인식 됐는지를 결정하고, 만약 상기 주의 기간 동안 아무런 명령도 인식되지 않았다면 상기 동작 모드를 이탈하여 상기 대기 모드로 진입하는, 디바이스.
  3. 삭제
  4. 제 1 항에 있어서,
    상기 동작 모드에서 미리 정해진 다른 기간동안 어떤 명령이 인식됐는지를 결정하고, 만약 상기 미리 정해진 다른 기간 동안 아무런 명령도 인식되지 않았다면, 상기 디바이스가 상기 동작 모드에 있는 상기 주의 기간의 진행을 나타내는, 청취 가능한 주의 신호를 발생하는, 디바이스.
  5. 제 1 항에 있어서,
    상기 동작 모드에서 미리 정해진 기간 동안 어떤 명령이 인식됐는지 결정하고, 만약 상기 미리 정해진 기간 동안 아무런 명령도 인식되지 않았다면, 상기 동작 모드를 이탈하여 상기 대기 모드로 진입하고, 이 경우 상기 주의 기간의 종료를 나타내는 청취 가능한 종료 신호를 발생하는, 디바이스.
  6. 제 1 항에 있어서,
    상기 동작 모드에 진입한 후에, 주의 기간을 나타내는 반복되는 청취 가능한 사운드를 발생하는, 디바이스.
  7. 제 1 항, 제 2 항, 제 4 항, 제 5 항, 또는 제 6 항 중 어느 한 항에 따른 디바이스를 포함하는 장치.
  8. 제 1 항, 제 2 항, 제 4 항, 제 5 항, 또는 제 6 항 중 어느 한 항에 따른 디바이스를 포함하는 리모트 컨트롤 디바이스.
  9. 각각이 제 1 항에서 청구되고, 각각이 개개의 장치를 제어하는 복수의 디바이스들을 포함하는 시스템으로서,
    각각의 디바이스는 자신의 고유한 활성화 명령을 인식하는, 시스템.
  10. 삭제
KR1020007009889A 1999-01-06 1999-09-03 음성 입력 디바이스 KR100753780B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP99200014 1999-01-06
EP99200014.1 1999-01-06

Publications (2)

Publication Number Publication Date
KR20010041676A KR20010041676A (ko) 2001-05-25
KR100753780B1 true KR100753780B1 (ko) 2007-08-31

Family

ID=8239782

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020007009889A KR100753780B1 (ko) 1999-01-06 1999-09-03 음성 입력 디바이스

Country Status (6)

Country Link
US (1) US6718307B1 (ko)
EP (1) EP1058876B1 (ko)
JP (2) JP4812941B2 (ko)
KR (1) KR100753780B1 (ko)
DE (1) DE69941686D1 (ko)
WO (1) WO2000041065A1 (ko)

Families Citing this family (84)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6415258B1 (en) * 1999-10-06 2002-07-02 Microsoft Corporation Background audio recovery system
US8374875B2 (en) 2000-01-31 2013-02-12 Intel Corporation Providing programming information in response to spoken requests
DE10021389A1 (de) * 2000-05-03 2001-11-08 Nokia Mobile Phones Ltd Verfahren zum Steuern eines Systems, insbesondere eines elektrischen und/oder elektronischen Systems mit zumindest einer Anwendungseinrichtung
KR20020033813A (ko) * 2000-07-21 2002-05-07 요트.게.아. 롤페즈 복수의 디바이스를 통한 음성 제어
CN1173498C (zh) * 2000-10-13 2004-10-27 国际商业机器公司 语音允许的蓝牙设备管理和访问装置及有关控制方法
GB0029573D0 (en) * 2000-12-02 2001-01-17 Hewlett Packard Co Activation of voice-controlled apparatus
EP1215658A3 (en) 2000-12-05 2002-08-14 Hewlett-Packard Company Visual activation of voice controlled apparatus
DE10163213A1 (de) * 2001-12-21 2003-07-10 Philips Intellectual Property Verfahren zum Betrieb eines Spracherkennungssystems
JP2003241797A (ja) * 2002-02-22 2003-08-29 Fujitsu Ltd 音声対話システム
WO2003085639A1 (en) * 2002-04-08 2003-10-16 Koninklijke Philips Electronics N.V. Controlling an apparatus based on speech
US20030234763A1 (en) * 2002-06-24 2003-12-25 Xerox Corporation System and method for audible feedback for touch screen displays
DE10251209A1 (de) * 2002-10-31 2004-05-19 Sennheiser Electronic Gmbh & Co. Kg Mikrofonsystem
US20060085199A1 (en) * 2004-10-19 2006-04-20 Yogendra Jain System and method for controlling the behavior of a device capable of speech recognition
US20060085183A1 (en) * 2004-10-19 2006-04-20 Yogendra Jain System and method for increasing recognition accuracy and modifying the behavior of a device in response to the detection of different levels of speech
US20060235698A1 (en) * 2005-04-13 2006-10-19 Cane David A Apparatus for controlling a home theater system by speech commands
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US7697827B2 (en) 2005-10-17 2010-04-13 Konicek Jeffrey C User-friendlier interfaces for a camera
JP2007324866A (ja) * 2006-05-31 2007-12-13 Funai Electric Co Ltd 電子機器及びテレビ受像機
FR2902948A1 (fr) * 2006-06-22 2007-12-28 Michael Attali Appareil d'emission d'ondes radioelectriques a faible portee
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US7769593B2 (en) * 2006-09-28 2010-08-03 Sri International Method and apparatus for active noise cancellation
US8224286B2 (en) 2007-03-30 2012-07-17 Savox Communications Oy Ab (Ltd) Radio communication device
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
JP4809454B2 (ja) * 2009-05-17 2011-11-09 株式会社半導体理工学研究センター 発話推定による回路起動方法及び回路起動装置
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US8995625B2 (en) * 2009-09-30 2015-03-31 T-Mobile Usa, Inc. Unified interface and routing module for handling audio input
US9111538B2 (en) * 2009-09-30 2015-08-18 T-Mobile Usa, Inc. Genius button secondary commands
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US9992745B2 (en) 2011-11-01 2018-06-05 Qualcomm Incorporated Extraction and analysis of buffered audio data using multiple codec rates each greater than a low-power processor rate
US9564131B2 (en) 2011-12-07 2017-02-07 Qualcomm Incorporated Low power integrated circuit to analyze a digitized audio stream
US9117449B2 (en) * 2012-04-26 2015-08-25 Nuance Communications, Inc. Embedded system for construction of small footprint speech recognition with user-definable constraints
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9142215B2 (en) * 2012-06-15 2015-09-22 Cypress Semiconductor Corporation Power-efficient voice activation
US9497515B2 (en) 2012-08-16 2016-11-15 Nuance Communications, Inc. User interface for entertainment systems
US9031848B2 (en) 2012-08-16 2015-05-12 Nuance Communications, Inc. User interface for searching a bundled service content data source
US8799959B2 (en) 2012-08-16 2014-08-05 Hoi L. Young User interface for entertainment systems
US9106957B2 (en) 2012-08-16 2015-08-11 Nuance Communications, Inc. Method and apparatus for searching data sources for entertainment systems
US9026448B2 (en) * 2012-08-16 2015-05-05 Nuance Communications, Inc. User interface for entertainment systems
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
CN103021411A (zh) * 2012-11-27 2013-04-03 威盛电子股份有限公司 语音控制装置和语音控制方法
US9265458B2 (en) 2012-12-04 2016-02-23 Sync-Think, Inc. Application of smooth pursuit cognitive testing paradigms to clinical drug development
US9047857B1 (en) * 2012-12-19 2015-06-02 Rawles Llc Voice commands for transitioning between device states
DE102013001219B4 (de) * 2013-01-25 2019-08-29 Inodyn Newmedia Gmbh Verfahren und System zur Sprachaktivierung eines Software-Agenten aus einem Standby-Modus
US9380976B2 (en) 2013-03-11 2016-07-05 Sync-Think, Inc. Optical neuroinformatics
US9892729B2 (en) 2013-05-07 2018-02-13 Qualcomm Incorporated Method and apparatus for controlling voice activation
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197737A1 (en) * 2013-06-08 2014-12-11 Apple Inc. Automatically adapting user interfaces for hands-free interaction
JP2015011170A (ja) * 2013-06-28 2015-01-19 株式会社ATR−Trek ローカルな音声認識を行なう音声認識クライアント装置
US20150074524A1 (en) * 2013-09-10 2015-03-12 Lenovo (Singapore) Pte. Ltd. Management of virtual assistant action items
WO2015094369A1 (en) * 2013-12-20 2015-06-25 Intel Corporation Transition from low power always listening mode to high power speech recognition mode
EP3089157B1 (en) 2013-12-26 2020-09-16 Panasonic Intellectual Property Management Co., Ltd. Voice recognition processing device, voice recognition processing method, and display device
JPWO2015098109A1 (ja) 2013-12-26 2017-03-23 パナソニックIpマネジメント株式会社 音声認識処理装置、音声認識処理方法、および表示装置
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
JP6543455B2 (ja) * 2014-10-22 2019-07-10 株式会社大林組 水中作業支援システム
RU2571891C1 (ru) * 2015-01-30 2015-12-27 Андрей Федорович Изнак Устройство для контроля внимания оператора в системах "человек-техника"
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10235353B1 (en) * 2017-09-15 2019-03-19 Dell Products Lp Natural language translation interface for networked devices
US10515637B1 (en) 2017-09-19 2019-12-24 Amazon Technologies, Inc. Dynamic speech processing

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4528687A (en) * 1981-10-22 1985-07-09 Nissan Motor Company, Limited Spoken-instruction controlled system for an automotive vehicle
JPH02181559A (ja) * 1989-01-05 1990-07-16 Toshiba Corp 電話装置
JPH0370243A (ja) * 1989-08-09 1991-03-26 Toshiba Corp 無線電話装置
US5267323A (en) * 1989-12-29 1993-11-30 Pioneer Electronic Corporation Voice-operated remote control system
GB2265232A (en) * 1992-05-12 1993-09-22 John Roger Clarke Power saving unit
WO1994003020A1 (en) * 1992-07-17 1994-02-03 Voice Powered Technology International, Inc. Voice operated remote control device
US5577164A (en) * 1994-01-28 1996-11-19 Canon Kabushiki Kaisha Incorrect voice command recognition prevention and recovery processing method and apparatus
US6070140A (en) * 1995-06-05 2000-05-30 Tran; Bao Q. Speech recognizer
JP3674990B2 (ja) * 1995-08-21 2005-07-27 セイコーエプソン株式会社 音声認識対話装置および音声認識対話処理方法
US6075575A (en) * 1995-10-02 2000-06-13 Starsight Telecast, Inc. Remote control device and method for using television schedule information
US6052666A (en) * 1995-11-06 2000-04-18 Thomson Multimedia S.A. Vocal identification of devices in a home environment
JP3726448B2 (ja) * 1997-03-12 2005-12-14 セイコーエプソン株式会社 認識対象音声検出方法およびその装置
JPH10319991A (ja) * 1997-05-20 1998-12-04 Sony Corp 電子機器の音声認識起動方法及び装置
US6188986B1 (en) * 1998-01-02 2001-02-13 Vos Systems, Inc. Voice activated switch method and apparatus
JPH11205430A (ja) * 1998-01-20 1999-07-30 Kobe Steel Ltd 音声ダイアル機能付き電話機
US6253184B1 (en) * 1998-12-14 2001-06-26 Jon Ruppert Interactive voice controlled copier apparatus

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Method for using voice detection to restore computing equipment in lower state to normal operation", IBM TDB, vol.41, no.1, pp445-446, 1998.01. *
>"Method for using voice detection to restore computing equipment in lower state to normal operation"(IBM TDB, vol.41, no. 1, pp.445-446, 1998. 01 *

Also Published As

Publication number Publication date
JP2011176879A (ja) 2011-09-08
US6718307B1 (en) 2004-04-06
WO2000041065A1 (en) 2000-07-13
EP1058876B1 (en) 2009-11-25
DE69941686D1 (de) 2010-01-07
JP4812941B2 (ja) 2011-11-09
EP1058876A1 (en) 2000-12-13
KR20010041676A (ko) 2001-05-25
JP5208246B2 (ja) 2013-06-12
JP2002534716A (ja) 2002-10-15

Similar Documents

Publication Publication Date Title
KR100753780B1 (ko) 음성 입력 디바이스
US11984119B2 (en) Electronic device and voice recognition method thereof
EP1868184B1 (en) Speech recognition system with user profiles management
KR20190051368A (ko) 전자 장치 및 전자 장치 간 음성으로 기능을 실행하는 방법
JP2006352869A (ja) 通信端末機及び通信端末機における通話内容送信方法
KR101713770B1 (ko) 차량용 음성 인식 시스템 및 그 음성 인식 방법
CN109743618B (zh) 音乐播放方法、终端和计算机可读存储介质
CN106531168A (zh) 一种语音识别方法及装置
KR100567828B1 (ko) 향상된 음성인식 장치 및 방법
JP7242248B2 (ja) 電子機器、その制御方法、およびそのプログラム
CN110660386A (zh) 一种语音寻找遥控器的方法及系统
CN109545231A (zh) 一种便携式控制智能设备的方法
CN102451557A (zh) 游戏声控操控装置及其实现方法
CN110839169B (zh) 一种智能设备遥控装置及基于其的控制方法
KR102494051B1 (ko) 전자 장치 및 이의 음성 인식 방법
KR102359163B1 (ko) 전자 장치 및 이의 음성 인식 방법
EP4198711A1 (en) System and method for time management in voice control applications
KR20060085381A (ko) 텔레매틱스 시스템의 음성인식 장치 및 방법
KR100594058B1 (ko) 통신단말기에서음성인식을통한알람기능구현방법
KR100606746B1 (ko) 이동통신 단말기 및 모닝콜 제공 방법
CN115802083A (zh) 控制方法、装置、分体电视及可读存储介质
CN112328201A (zh) 音频路径切换方法
CN113066493A (zh) 一种设备控制方法、系统及第一电子设备
KR20020081792A (ko) 텍스트/음성신호 전환장치
KR20080063668A (ko) 래스트 콜 자동 수행 블루투스 핸즈프리 및 블루투스핸즈프리를 이용한 래스트 콜 자동 수행 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
G170 Re-publication after modification of scope of protection [patent]
FPAY Annual fee payment

Payment date: 20120802

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20130801

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20150729

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20160819

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20170814

Year of fee payment: 11

LAPS Lapse due to unpaid annual fee