KR100719981B1 - 자연어 서버를 사용하는 가정용 엔터테인먼트 시스템 제어 - Google Patents

자연어 서버를 사용하는 가정용 엔터테인먼트 시스템 제어 Download PDF

Info

Publication number
KR100719981B1
KR100719981B1 KR1020047014915A KR20047014915A KR100719981B1 KR 100719981 B1 KR100719981 B1 KR 100719981B1 KR 1020047014915 A KR1020047014915 A KR 1020047014915A KR 20047014915 A KR20047014915 A KR 20047014915A KR 100719981 B1 KR100719981 B1 KR 100719981B1
Authority
KR
South Korea
Prior art keywords
natural language
devices
request
network
delete delete
Prior art date
Application number
KR1020047014915A
Other languages
English (en)
Other versions
KR20040105787A (ko
Inventor
스코트 데이비드 스미어스
글렌 데이비드 스톤
브루스 앨런 페어맨
Original Assignee
소니 일렉트로닉스 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 소니 일렉트로닉스 인코포레이티드 filed Critical 소니 일렉트로닉스 인코포레이티드
Publication of KR20040105787A publication Critical patent/KR20040105787A/ko
Application granted granted Critical
Publication of KR100719981B1 publication Critical patent/KR100719981B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Small-Scale Networks (AREA)

Abstract

표준 컴퓨터(42)는 텔레비전(34), DVD(36) 및 VCR(40)에 접속된다. 네트워크 인터페이스(30)는 인터넷(46)으로의 접속을 허용한다. 자연어 서버(32)는 그후 가정용 엔터테인먼트 디바이스들의 언어 제어를 허용하도록 인터넷(46)으로 접근될 수 있다. 이것은 어떠한 특정 하드웨어를 요구하지 않으면서도 표준 인터페이스들을 이용해서 인터넷을 통해서 접근이 허용되는 언어 확인을 허용한다.
인터페이스 회로, 자연어 서버, 자연어 요청

Description

자연어 서버를 사용하는 가정용 엔터테인먼트 시스템 제어{Controlling home entertainment systems using a natural language server}
본 발명은 디바이스들의 네트워크 내부의 디바이스들을 제어하는 분야에 관한 것이다. 보다 명확하게는, 본 발명은 음성 명령들을 통하여 디바이스들의 네트워크 내부의 디바이스들을 제어하는 분야에 관한 것이다.
IEEE 표준, "고성능 시리얼 버스를 위한 IEEE 1394-2000 표준" 2000년도에 추인된 초안은 비동시성 및 동시성의 두 형태 데이터 전송을 지원하는 비싸지 않은 고속 시리얼 버스 구조를 구현하기 위한 국제 표준이다. 동시성 데이터 전송들은 중요한 순간 사이의 시간 간격이 전송 및 수신 에플리케이션 모두에서 동일한 기간을 가질 수 있도록 발생하는 실시간 전송이다. 동시적으로 전송되는 데이터의 각각의 패킷은 패킷 고유의 시간 간격에서 전송된다. 동시적으로 데이터의 전송을 위한 이상적 에플리케이션의 예는 비디오 레코더 내지 텔레비전 세트일 수 있다. 비디오 레코더는 영상들 및 음성들을 기록하고 불연속 청크(chunk) 또는 패킷들로 데이터를 저장한다. 비디오 레코더는 텔레비전 세트에 의한 디스플레이를 위해서, 제한된 시간 간격을 넘어서 기록된 영상 및 음성을 표현하면서, 시간 간격 동안에 각각의 패킷을 전송한다. IEEE 1394-2000 시리얼 버스 구조는 에플리케이션들 사이에서 동 시적 데이터 전송을 위한 다수의 채널들을 제공한다. 6 비트 채널 수가 적당한 에플리케이션에 의해서 수신을 확인하기 위해서 데이터와 함께 제공된다. 이것은 다수의 에플리케이션들이 버스 구조 양단에 동시적 데이터를 동시에 전송하는 것을 허용한다. 동시적 전송들은 가능한 빨리 발생하며 소스에서 목적지로 상당량의 데이터를 전송하는 종래의 데이터 전송 동작들이다.
IEEE 1394-2000 표준은 디지털 디바이스들을 상호 접속하기 위한 고속 시리얼 버스를 제공하며 그것에 의해서 범용 I/O 접속을 제공한다. IEEE 1394-2000 표준은 에플리케이션들을 위한 디지털 인터페이스를 정의하며 그것에 의해서 에플리케이션이 데이터를 버스 양단에서 전송되기 전에 디지털 데이터를 아날로그 데이터로 변환할 필요를 없앤다. 따라서, 수신 에플리케이션은 버스로부터 아날로그 데이터가 아닌, 디지털 데이터를 수신하며, 그렇기 때문에 아날로그 데이터를 디지털 데이터로 변환시킬 필요가 없을 것이다. IEEE 1394-2000 표준에 의해서 요구되는 케이블은 상기 디바이스들을 접속하기 위해서 사용되는 다른 더 부피있는 케이블들에 비교해서 크기면에서 매우 얇다. 디바이스들은 버스가 활성일 동안에 IEEE 1394-2000 버스로부터 추가되거나 제거될 수 있다. 디바이스가 그렇게 추가되거나 제거되면 버스는 당시 존재하는 노드들 사이에서 데이터를 전송하기 위해서 자동적으로 자신을 재구성할 것이다. 노드는 버스 구조상에서 고유의 어드레스를 가진 논리적 엔티티(entity)로 고려된다. 각각의 노드는 구성(configuration) ROM, 제어 레지스터의 표준화된 세트 및 노드 자신의 어드레스 공간을 제공한다. 이러한 장점들 때문에 IEEE 1394-2000 표준은 오디오/비디오 디바이스들, 미디어 재생/기록 디 바이스들, 전산 디바이스들 및 디스플레이 디바이스들을 통합할 수 있는 특유의 네트워크 구조를 제공한다.
IEEE 1394-2000 표준은 도 1에서 도시되는 프로토콜을 정의한다. 상기 프로토콜은 거래 레이어(transaction layer)(12), 연계 레이어(link layer)(14) 및 물리적 레이어(physical layer)(16)에 연결된 시리얼 버스 관리 블록(10)을 포함한다. 물리적 레이어(16)는 디바이스 또는 에플리케이션과 IEEE 1394-2000 케이블 사이의 전기적 및 기계적 접속을 제공한다. 물리적 레이어(16)는 또한 IEEE 1394-2000 버스에 연결된 모든 디바이스들이 실질적인 데이터 전송 및 수신 뿐만 아니라 버스에 접근을 허용하는 것을 보장하도록 중재(arbitration)를 제공한다. 연계 레이어(14)는 비동시성 및 동시성 둘 모두의 데이터 패킷 운반을 위한 데이터 패킷 배달 서비스를 제공한다. 이것은 확인(acknowledgement) 프로토콜을 사용하여, 비동시성 데이터 운반을 지원하고, 적기(just-in-time) 데이터 배달을 위해서 실시간 보장된 대역폭 프로토콜을 제공하며, 동시성 데이터 전송을 지원한다. 거래 레이어(12)는 판독(read), 기록(write) 및 고정(lock)을 포함해서, 비동시성 데이터 전송을 완수하는데 필요한 명령들을 지원한다. 거래 레이어(12)는 또한 동시성 관리 데이터가 동시성 제어 비교-교환 레지스터들과 함께 판독 작동들을 경유해서 시리얼 버스 관리 블록(10)으로 전송되는 경로를 제공한다. 시리얼 버스 관리 블록(10)은 동시성 데이터 전송들을 관리하기 위해서 동시성 자원 관리자를 포함한다. 시리얼 버스 관리 블록(10)은 최적화 중재 타이밍, 버스 상의 모든 디바이스들에 대한 적절한 전력의 보증, 순환 마스터의 할당, 동시성 채널 및 대역폭 자원들의 할당, 및 오류의 기본적 통보의 형태로 시리얼 버스의 전체적 구조 제어를 또한 제공한다.
다양한 범위의 제품들이 IEEE 1394-2000 시리얼 버스 네트워크에 접속할 수 있는 능력을 통해 구현될 것이다. 상기 디바이스들은 매우 단순한 것에서부터 매우 복잡한 것까지 포함하는 능력 및 기능을 가질 수 있다. 특히, 다양한 오디오/비디오 디바이스들, 미디어 재생/기록 디바이스들 및 전산/디스플레이 디바이스들은 상기 디바이스들 사이에서 비동시성 및 동시성 데이터 전송들을 지원하는 IEEE 1394-2000 시리얼 버스 네트워크 구조를 통해서 함께 연결될 수 있다.
IEEE 1394-2000 케이블 환경은 각각의 노드의 물리적 접속에 대한 포트 및 노드들 사이에서의 케이블을 포함하며, 점대점(point-to-point) 연계 방식에 의해서 접속되는 노드들의 네트워크이다. IEEE 1394-2000 시리얼 버스의 케이블 환경을 위한 물리적 토폴로지는, 한정된 분기들을 가진, 다수의 포트들의 비-순환 네트워크이다. 케이블 환경에 대한 첫 번째 제한 요소는 노드들이 임의의 닫혀진 루프들을 형성하는 것 없이 함께 접속되어야 한다는 점이다.
IEEE 1394-2000 버스 구조 상에서의 각각의 노드는 16 비트 노드(ID)를 가진다. 노드 ID는 데이터 연계 레이어 상에서 데이터 전송을 위해서 사용되는 어드레스이다. 이것은 버스 구조 상에서 가능하다면 64K노드들까지에 대한 어드레스 공간을 허용한다. 노드 ID는 두 개의 더 작은 분야로 나뉘어진다. 더 높은 단위 10 비트들은 버스 ID를 지정하며 더 낮은 단위 6 비트들은 물리적 ID를 지정한다. 자신의 확인 연속버스 ID는 루트 노드에 의해서 할당되고 물리적 ID는 버스의 재설정 하자마자 연속하여 자가 확인 동안에 할당된다. 각각의 물리적 ID 분야는 하나의 IEEE 1394-2000 버스에서는 고유하지만, 물리적 ID 분야는 각각의 노드 자체에 대해서는 고정된 값이 아니다. 물리적 ID 분야는 버스 구조에서 노드의 위치에 대해서 고정된다. 디바이스가 IEEE 1394-2000 버스에서의 한 위치에서 동일한 IEEE 1394-2000 버스에서 다른 위치로 이동되면, 디바이스는 디바이스의 물리적 ID가 새로운 위치에 있을 때는 다른 값을 가지기 때문에 다른 노드 ID를 가질 것이다. 각각의 버스 ID 및 물리적 ID 분야 사이에서는 모든 논리적 "1" 값은 특정 목적들을 위해서 예약된다. 따라서, 이러한 어드레스 할당 구조는, 63개의 독립적으로 어드레스 할당가능한 노드들과 함께, 1023들까지를 제공한다.
각각의 IEEE 1394-2000 호환가능한 디바이스는 디바이스의 구조 판독 전용 메모리(ROM)에서 저장된 64 비트 수인 노드 고유 ID를 포함한다. 노드 고유 ID는 각각의 디바이스에 대해서 영속적이며 IEEE 1394-2000 버스 내부의 디바이스의 위치에 의존하지 않는다. 노드 고유 ID는 데이터 연계 레이어 상에서 데이터 전송들을 할당하기 위해서 사용되지 않는다.
버스로부터의 노드 제거 또는 버스로의 노드 추가 중 하나에 의해서 버스가 재구성될 때, 또는 버스에 부착된 디바이스가 전력이 꺼질 때 버스 재설정은 발생한다. 버스 재설정이 발생할 때, 모든 노드들은 모든 토폴로지(topology) 정보를 비우고 다음 단계를 시작하는 특정 상태로 가해진다. 버스 재설정 후에, 노드에 알려진 유일한 정보는 노드가 분기(branch) 노드, 종단(leaf) 노드 또는 고립 노드인지에 대한 것이다. 분기 노드는 하나 이상의 직접 접속된 인접 노드(neighbor)를 가진다. 종단 노드는 오직 하나의 인접 노드를 가진다. 고립 노드는 접속되지 않는다. 버스 재설정 후에, 트리 확인 과정이 수행된다. 트리 확인 과정 동안에, 일반적인 네트워크 토폴로지가 판단되고 트리로 번역된다. 네트워크에서의 하나의 노드가 루트 노드로 지명되고 모든 물리적 접속들은 루트 노드를 향하는 방향으로 관련된다. 각각의 포트로부터 접속이 있는지 및 상기 접속이 자식(child) 또는 부모(parent) 노드로의 접속인지 판단된다. 상기 방향은 각각의 접속된 포트를 부모 포트 또는 자식 포트 중의 하나로 분류하는 것에 의해서 설정된다. 부모 포트는 보고(reporting) 포트보다 루트에서 더 멀리 있는 노드에 접속된 포트이다. 이러한 관계로부터, 루트 노드는 IEEE 1394-2000 시리얼 버스 네트워크로 접속된 디바이스들의 물리적 토폴로지를 판단한다.
트리 확인 과정 후에, 자가 확인 과정이 수행된다. 자가 확인 과정 동안에, IEEE 1394-2000 시리얼 버스 네트워크에 접속된 각각의 노드는 고유의 물리적 ID를 ,순서대로, 선택하고 상기 물리적 ID 및 다른 관리 정보를 버스 상의 다른 노드들에 전송한다. 물리적 ID는 재설정 발생 이후에 노드가 자가 확인 정보를 송신할 기회를 가지기 전에 자가 확인 정보를 수신하는 상태로 통과하는 횟수의 총계와 같은 횟수이다. 상기 자가 확인 과정은 IEEE 1394-2000 시리얼 버스 네트워크에 접속된 노드가 상기 버스에 접속된 모든 노드들을 인지하는 것을 허용한다.
사용자가 음성 언어를 사용해서 컴퓨터 시스템과 인터페이스로 접속하는 것을 허용하는 음성 확인 시스템이 공지되어있다. 음성 확인 시스템은 사용자로부터 음성 입력을 수신하고, 입력을 해석하며, 그후 입력을 컴퓨터 시스템이 이해하는 형태로 번역한다.
음성 확인 시스템들은 보통 말하고 있는 사람(화자)의 청각(acoustic) 모델에 기초해서 발언(utterance) 또는 음성 단어들을 확인한다. 청각 모델들은 보통 음성의 샘플들에 기초해서 발생된다. 청각 모델이 특정한 화자보다는 많은 사람들로부터 획득된 음성의 샘플들에 기초해서 구성될 때, 이것은 화자-독립 모델(speaker-independent modeling)이라고 불린다. 화자-독립 모델이 그후 특정한 사람의 음성의 샘플들에 기초해서 상기 사람의 음성을 확인하기 위해서 수정될 때, 이것은 적응 모델(adaptive modeling)이라고 불린다. 모델이 특정한 사람의 음성에만 기초해서 구성될 때, 이것은 화자-의존 모델(speaker-dependent modeling)이라고 불린다.
화자-독립 모델은 일반적으로 많은 화자들이 특정한 화자들의 음성의 이전 샘플들을 얻지 않고서 동일한 확인 시스템으로 접속하는 것을 가능하게 한다. 화자-독립 모델과 비교할 때, 적응 모델 및 화자-의존 모델은 일반적으로 음성 확인 시스템이 화자의 음성을, 특히 화자가 강한 엑센트를 가지고, 비정상적인 채널 특질들을 생성하거나 어떤 다른 이유로 화자 독립 모델들에 의해서는 잘 모델링되지 않는 접속을 가지는 경우에, 더욱 정확하게 식별하는 것이 가능하게 한다.
발신자와 고객 서비스 에플리케이션 사이에서 전화 인터페이스를 제공하는 음성 확인 시스템들이 공지되어 있다. 예를 들면, 발신자는 특정 비행기에 대한 요금 및 비행 가능성에 관한 정보를 획득할 수 있고 비행 예약 직원의 도움을 요구할 필요 없이 음성 언어를 사용해서 티켓을 구입할 수 있다. 그러한 고객 서비스 에플리케이션들은 보통 다양한 분포의 발신자들에 의해서 및 다양한 배경음을 가지고 접근이 허용되도록 예정된다. 그러한 에플리케이션들에서, 발신자들이 고객 서비스 에플리케이션을 사용하기 전에 교육 세션에 참가하도록 요구하는 것은 부적절하다. 따라서, 그러한 고객 서비스 에플리케이션들을 위해서 사용된 청각 모델은 화자들에서의 변화를 설명할 수 있도록 일반화되어 있어야 한다. 이렇게, 화자-독립 모델이 고객 서비스 에플리케이션들을 위해서 사용된다. 화자-독립 모델을 사용하는 결과로 확인 시스템은 예상했던 것보다 덜 정확해지게 된다. 이것은 특히 강한 엑센트를 가진 화자들 및 비정상적 채널 특질을 생성하는 전화선을 가진 사람들에게 특히 적용되는 말이다.
자연어 해석기들은 다양한 에플리케이션들에 대해서 공지되어 있으며 사용된다. 일반적인 사용 방식으로는 자동화된 전화 시스템에 대한 것이 있다. 본 분야의 당업자들은 이러한 기술이 다양한 다른 용도에 적용될 수 있고 적용되었음을 이해할 것이다. 예를 들면, 현재 많은 다른 유용한 에플리케이션들 중에서, 여행 티켓들을 구입하며, 호텔 예약을 조정하며, 주식을 거래하며, 전화 번호 또는 구내 전화 번호를 찾기 위해서 그러한 시스템을 사용할 수 있다.
음성 확인 시스템과 함께 사용되는 자연어 해석기에 대해서, 확인 작동으로부터 초래되는 각각의 단어에 대한 음성 확인기의 최적의 판단이 자연어 해석기에 제공된다. 음성 확인기는 사용자의 음성 단어들을 "청취하고", 상기 단어들이 무엇인지 및 기계어 형태로 상기 단어들을 자연어 해석자에게 부여한다. 확인 동작의 부분으로서, 각각의 단어는 음성 확인자가 확인 정확성을 위하여 가지는, 각각의 그러한 단어와 관련된 신뢰도를 나타내는 단어 신뢰도 점수가 제공된다. 이렇게, 매우 다양한 사용자들의 음성 패턴들 또는 엑세트를 고려하는 것이 유용하게 고려된다. 점수는 확인 단계에서 각각의 단어와 관련되고 발생된다. 각각의 개별적인 단어에 대한 점수를 사용하는 것은 점수의 합이 화자가 전달하려 했던 의미에 관한 것은 아니기 때문에 전적으로 만족스러운 것은 아니다. 한개의 단어가 매우 낮은 단어 신뢰도 점수를 가지면, 사용자는 요청을 다시 입력할 것이 요구될 수 있다.
목소리 확인 기술들은 데이터를 현재 컴퓨터 시스템 상에서 사용자에 의해서 생성되는 문서(document)로 입력하기 위해서 사용된다. 예를 들면, 목소리 확인 에플리케이션 프로그램은 사용자가 사용자의 컴퓨터 시스템에 부착된 마이크로폰으로 입력될 단어들을 말하는 것에 의해서 기록된 문서로 텍스트를 입력하는 것이 가능한, Dragon Systems,Inc.로부터 사용가능하다. 에플리케이션은 음성 단어들을 해석하고 상기 단어들을 사용자의 컴퓨터 스크린상에 디스플레이되는 기록된 문서에서 나타나는 인쇄 문자들(typographical character)로 번역한다.
현재, 사용자가 자연어 또는 음성 명령들을 통해서 디바이스들의 네트워크에서 하나 이상의 디바이스들을 제어하는 것을 허용하는 방법 또는 시스템이 부족하다. 또한 사용자가 자연어 또는 음성 명령들을 통해서 디바이스들의 네트워크에서 하나 이상의 디바이스들로부터 정보를 획득하는 것을 허용하는 방법 또는 시스템이 또한 부족한다.
자연어 서버를 사용하는 자연어 및 음성 명령들을 통해서 가정용 엔터테인먼트를 제어하고 구성하는 방법 및 장치는 사용자가 디바이스들의 네트워크에서 자연 어 요청을 입력하는 것을 허용한다. 사용자의 요청이 입력될 때 상기 요청은 요청을 디지털화하고 저장하는 네트워크 인터페이스 유닛으로 그후 전송된다. 디바이스들의 사용자의 네트워크에 관한 정보 및 디지털화된 요청은 그후, 바람직하게는 인터넷을 통해서, 네트워크 인터페이스 유닛으로부터 자연어 서버로 전송된다. 자연어 서버는 그후 요청을 처리하고 디바이스들의 사용자의 네트워크에서 요청을 완수하기 위해서 필요한 명령들을 발생시킨다. 이러한 명령들은 그후 자연어 서버에서 네트워크 인터페이스 유닛으로 전송된다. 네트워크 인터페이스 유닛은 그후 명령들을 디바이스들의 네트워크 내부의 적절한 디바이스로 전송한다. 디바이스들의 네트워크 내부의 디바이스들은 그후 수신된 명령들을 사용자 요청을 완수하기 위해서 실행한다.
본 발명의 한 측면에서, 자연어 요청을 통해서 디바이스들의 네트워크를 제어하고 구성하는 방법은 사용자로부터 자연어 요청을 수신하는 단계, 자연어 요청을 저장하는 단계, 자연어 요청을 자연어 서버로 전송하는 단계, 디바이스들의 네트워크를 사용해서 자연어 요청을 완수하기 위해서 명령들을 발생시키는 단계 및 자연어 요청들을 완수하기 위해서 디바이스들의 네트워크 내부의 적절한 디바이스들에 명령들을 전송하는 단계를 포함한다. 상기 방법은 또한 자연어 서버에서 자연어 요청의 의도를 판단하는 단계를 포함한다. 자연어 요청을 자연어 서버로 전송하는 단계는 디바이스들의 네트워크의 구성에 관한 정보를 전송하는 단계를 포함한다. 자연어 요청을 자연어 서버로 전송하는 단계는 디바이스들의 네트워크 내부의 네트워크 인터페이스 유닛에 의해서 완수되며 상기 명령들을 디바이스들의 네트워 크 내부의 적절한 디바이스들에 전송하는 단계는 명령들을 네트워크 인터페이스 유닛으로 전송하는 단계 및 그후 명령들을 디바이스들의 네트워크 내부의 네트워크 인터페이스 유닛에서 적절한 디바이스들로 전송하는 단계를 포함한다. 자연어 요청은 바람직하게는 음성 요청 및 입력 디바이스를 사용해서 입력된 요청 중 선택된 요청이다. 자연어 요청은 바람직하게는 디바이스들의 네트워크에서 수행될 수 있도록 제어 동작 및 정보 중 하나를 선택해 요청한다. 자연어 서버는 바람직하게는 인터넷 접속을 통해서 접근이 허용된다. 자연어 서버는 대안적으로 디바이스들의 네트워크에서 포함된다. 바람직하게는 디바이스들의 네트워크는 실질적으로 IEEE 1394 표준의 버전을 따른다.
본 발명의 다른 측면에서, 사용자로부터 자연어 요청을 수신하기 위한 네트워크 인터페이스 유닛으로써, 네트워크 인터페이스 유닛은 사용자로부터 자연어 요청을 수신하기 위해서 디바이스들의 네트워크에서 하나 이상의 디바이스들과 통신하기 위해서 구성되는 제1 인터페이스 회로; 자연어 요청을 자연어 서버로 송신하기 위해서 및 디바이스들의 네트워크에서 자연어 요청을 실행하는 명령들을 자연어 서버로부터 재수신하기 위해서 자연어 서버와 통신하도록 구성된 제2 인터페이스 회로; 및 하나 이상의 디바이스와의 통신을 제어하는 제1 인터페이스 회로 및 자연어 서버와의 통신을 제어하는 제2 인터페이스 회로와 연결된 제어 회로를 포함하며, 상기 자연어 요청이 제1 인터페이스 회로에 의해서 수신될 때, 자연어 요청이 자연어 서버로 송신되고, 명령들이 자연어 서버로부터 재수신될 때, 명령들은 자연어 요청을 실행하기 위해서 제1 인터페이스 회로로부터 디바이스들의 네트워크로 송신된다. 디바이스들의 네트워크의 구성에 관한 정보는 또한 자연어 서버로 송신된다. 자연어 요청은 바람직하게는 음성 요청 및 입력 디바이스를 사용해서 입력된 요청 중 선택된 요청이다. 자연어 요청은 디바이스들의 네트워크에서 수행되는 제어 동작 및 정보 중 하나를 선택해 요청한다. 자연어 서버는 바람직하게는 디바이스들의 네트워크로부터 멀리 위치된다. 제2 인터페이스 회로는 바람직하게는 자연어 서버로 접근이 허용되는 인터넷 접속을 제공한다. 자연어 서버는 대안적으로 디바이스들의 네트워크에서 포함될 수 있다. 이런 대안적인 실시예에서, 제 1 및 제2 인터페이스 회로들은 하나의 인터페이스 회로로 통합된다. 바람직하게는 디바이스들의 네트워크는 실질적으로 IEEE 1394 표준의 버전을 따른다.
본 발명의 다른 측면에서, 자연어 요청을 수신하고 디바이스들의 네트워크에서 자연어 요청을 완수하기 위해서 명령들을 발생시키는 자연어 서버로써, 자연어 서버는 네트워크 인터페이스 유닛으로부터 자연어 요청을 수신하기 위해서 구성된 인터페이스 회로; 및 인터페이스 회로에 연결되며, 자연어 요청을 처리하기 위해서 및 디바이스들의 네트워크에서 자연어 요청을 실행하는 데 필요한 명령들을 발생시키기 위해서 구성되는 제어 회로를 포함하며, 명령들은 인터페이스 회로를 통해서 네트워크 인터페이스로 송신된다. 디바이스들의 네트워크의 구성에 관한 정보는 또한 네트워크 인터페이스 유닛으로부터 인터페이스 회로에 의해서 수신된다. 자연어 요청은 바람직하게는 음성 요청 및 입력 디바이스를 이용해서 입력된 요청중에서 선택된 요청이다. 자연어 요청은 바람직하게는 디바이스들의 네트워크에서 수행되는 제어 동작 및 정보중 하나를 선택해 요청한다. 자연어 서버는 바람직하게는 디 바이스들의 네트워크에서 멀리 위치된다. 인터페이스 회로는 바람직하게는 네트워크 인터페이스 유닛과 통신하기 위한 인터넷 접속을 제공한다. 자연어 서버는 대안적으로 디바이스들의 네트워크에서 포함된다. 바람직하게는 디바이스들의 네트워크는 IEEE 1394 표준의 버전을 실질적으로 따른다.
본 발명의 또 다른 측면에서, 디바이스들의 네트워크는 하나 이상의 디바이스들; 자연어 요청을 수신하기 위해서 구성되는 제1 인터페이스 회로, 및 제1 인터페이스 회로에 연결되며 자연어 요청을 처리하기 위해서 및 상기 하나 이상의 디바이스들에서 자연어 요청을 실행하는 데 필요한 명령을 발생시키기 위해서 구성되는 제 1 제어 회로를 포함하는 자연어 서버; 및 사용자로부터 자연어 요청을 수신하기 위해서 상기 하나 이상의 디바이스들과 통신하기 위해서 구성되는 제2 인터페이스 회로, 자연어 서버에 상기 자연어 요청을 전송하기 위해서 및 하나 이상의 디바이스들에서 자연어 요청을 실행할 명령들을 자연어 서버로부터 재수신하기위해서 상기 자연어 서버와 통신하도록 구성되는 제3 인터페이스, 및 상기 하나 이상의 디바이스들과의 통신을 제어하기 위해서 제2 인터페이스 회로 및 자연어 서버와의 통신을 제어하기 위해서 제3 인터페이스 회로에 연결되는 제어 유닛을 포함하는 네트워크 인터페이스 유닛을 포함하며, 자연어 요청이 제 1 제2 인터페이스 회로에 의해서 수신될 때, 자연어 요청이 자연어 서버로 송신되며, 또한 명령들이 자연어 서버로부터 재수신될 때, 명령들은 자연어 요청을 실행하기 위해서 제2 인터페이스 회로로부터 하나 이상의 디바이스들로 송신된다. 하나 이상의 디바이스들의 구성에 관한 정보는 또한 네트워크 인터페이스 유닛에서 자연어 서버로 전송된다. 자연어 요청은 바람직하게는 음성 요청 및 입력 디바이스를 사용해서 입력된 요청 중에 하나를 선택해 요청한다. 자연어 요청은 바람직하게는 하나 이상의 디바이스들에 의해서 수행되는 제어 동작 및 정보중에 선택해서 요청한다. 자연어 서버는 바람직하게는 하나 이상의 디바이스들로부터 멀리 위치된다. 제1 인터페이스 및 제3 인터페이스는 바람직하게는 인터넷 접속을 통해서 통신한다. 자연어 서버는 대안적으로 하나 이상의 디바이스들과 국소적으로 결합될 수 있다. 이러한 대안적인 실시예에서, 제 2 및 제3 인터페이스 회로들은 하나의 인터페이스 회로로 통합된다. 바람직하게는 하나 이상의 디바이스들 및 네트워크 인터페이스 회로는 IEEE 1394 표준의 버전을 실질적으로 따르는 네트워크에서 함께 연결된다.
도 1은 IEEE 1394-2000 표준의 프로토콜을 도시한 도면.
도 2는 네트워크 인터페이스 유닛, 디지털 텔레비전, 마이크로폰, 디지털 VCR, DVD 플레이어 및 개인용 컴퓨터를 포함하는 예시적인 디바이스들의 네트워크를 도시한 도면.
도 3a는 사용자의 디바이스들의 네트워크 내부의 독립형 디바이스로써 자연어서버를 포함하는, 본 발명의 대안적인 실시예에 따른 구성을 도시한 도면.
도 3b는 사용자의 디바이스들의 네트워크에서 통합형 디바이스로써 자연어 서버를 포함하는, 본 발명의 대안적인 실시예에 따른 구성을 도시한 도면.
도 4는 본 발명의 바람직한 실시예에 따른 네트워크 인터페이스 유닛의 내부 구성 부품의 블록도를 도시한 도면.
도 5는 본 발명의 바람직한 실시예에 따른 자연어 서버의 내부 구성 부품의 블록도를 도시한 도면.
도 6은 본 발명의 바람직한 실시예의 방법의 흐름도를 도시한 도면.
자연어 서버를 이용하여 음성 명령들 및 자연어를 통해서 가정용 엔터테인먼트 시스템들을 제어하고 구성하는 방법 및 장치는 사용자가 디바이스들의 네트워크에서 자연어 요청을 입력하는 것을 허용한다. 바람직하게는, 디바이스들의 네트워크는 IEEE 1394-2000 표준 프로토콜에 따라서 동작한다. 사용자의 요청은 바람직하게는 디바이스들의 네트워크에서 요청을 마이크로폰으로 말하는 것에 의해서 입력된다. 대안적으로, 사용자는 키보드 또는 다른 적절한 입력 디바이스를 이용하는 것과 같은, 다른 방법으로 자연어 요청을 입력한다. 입력되었을 경우에, 사용자의 요청은 그후 디바이스들의 네트워크 내부의, 네트워크 인터페이스 유닛으로 송신된다. 네트워크 인터페이스 유닛은 사용자의 요청을 수신할 때 유닛은 요청을 디지털화하고 저장한다. 네트워크 인터페이스 유닛은 그후 디지털화된 요청 및 디바이스들의 네트워크 내부의 디바이스들의 구성에 관한 정보를 자연어 서버로 송신한다.
바람직하게는, 자연어 서버는 인터넷 접속을 사용해서 네트워크 인터페이스 유닛에 의해서 접근이 허용되는 공유, 원거리 디바이스이다. 이것은 사용자가 사용자의 디바이스들의 네트워크에서 포함할 자연어 서버를 구입하는 비용을 절감하는 것을 허용한다. 대안적으로, 자연어 서버는 디바이스의 사용자의 네트워크에서, 독립형 디바이스 또는 디바이스들의 네트워크에서 디바이스들의 하나로의 통합된 형 태 중의 하나로써 포함된다.
자연어 서버는 네트워크 인터페이스 유닛으로부터 디지털화된 요청을 수신할 때, 자연어 서버는 그후 요청의 의도를 판단한다. 사용자의 요청은 제어 동작이 디바이스들의 네트워크 내부의 디바이스들에 관련되어 수행되도록 하는 요청들에 또는 정보에 대한 것일 수 있다.
자연어 서버가 요청의 의도를 판단할 경우에, 자연어 서버는 그후 사용자의 디바이스들의 네트워크에서 디바이스들을 가지고 요청을 완수하는 방법을 판단한다. 자연어 서버는 그후 사용자의 요청을 완수하는 데 필요한 명령들을 발생시킨다. 자연어 서버는 그후 발생된 명령들을 네트워크 인터페이스 유닛으로 재송신된다. 네트워크 인터페이스 유닛은 자연어 서버에 의해서 발생된 명령들을 수신할 때, 네트워크 인터페이스 유닛은 명령들을 디바이스들의 네트워크 내부의 적절한 디바이스들에 송신한다. 디바이스들은 그후 네트워크 인터페이스 유닛으로부터 수신된 명령들을 사용자의 요청을 완수하기 위해서 실행한다.
IEEE 1394-2000 케이블들(102, 104, 106, 108, 110)에 의해서 함께 접속된 네트워크 인터페이스 유닛(30), 디지털 텔레비전(34), 마이크로폰(38), 디지털 VCR(36), DVD 플레이어(40) 및 개인용 컴퓨터(PC)(42)를 포함하는 예시적인 디바이스들의 네트워크가 도 2에서 도시된다. IEEE 1394-2000 케이블(110)은 DVD 플레이어(40)에 PC(42)를 연결한다. PC(42)는 관련된 디스플레이(44)를 가진다. IEEE 1394-2000 케이블(106)은 디지털 VCR(36)을 마이크로폰(38)으로 연결한다. IEEE 1394-2000 케이블(104)은 디지털 VCR(36)을 디지털 텔레비전(34)으로 연결한다. IEEE 1394-2000 케이블(102)은 네트워크 인터페이스 유닛(30)으로 디지털 텔레비전(34)을 연결한다. 네트워크 인터페이스 유닛(30)은 인터넷 접속(46)을 통해서 자연어 서버(32)에 연결된다. 이하에서 설명되듯이, 본 발명의 자연어 서버(32)는 자연어 서버(32)가 많은 다른 디바이스들의 네트워크들 에 의해서 접근이 허용될 수 있도록, 바람직하게는 인터넷 접속을 통해서 디바이스들의 네트워크에 의해서 사용되며 접근이 허용된다. 대안적으로, 자연어 서버(32)는 독립형 디바이스 또는 디바이스들의 네트워크 내부의 디바이스에서 통합된 형태 중 하나로써, 디바이스들의 네트워크에서 위치된다. 또한 상기 설명되고 도 2에서 도시되었듯이, 마이크로폰(38)은 바람직하게는 독립형 디바이스이다. 대안적으로, 마이크로폰(38)은 디바이스들의 네트워크에서 다른 디바이스들 중 하나로 통합될 수 있다.
도 2에서 도시된 구성은 오직 예시적인 것이다. 디바이스들의 네트워크는 디바이스들 및 구성 부품들의 다른 많은 조합을 포함할 수 있다는 것은 명확하다. IEEE 1394-2000 네트워크 내부의 디바이스들은, 컴퓨터가 디바이스들중 하나인, 도 2에서 도시된 형태와 같은, IEEE 1394-2000 네트워크에서, 컴퓨터와 다른 디바이스들 사이에서는 실질적인 "마스터-슬래이브(master-slave)"가 아니라는 것을 의미하는, 자동적인 디바이스들이다. 많은 IEEE 1394-2000 네트워크 구성에서, 컴퓨터가 존재하지 않을 수 있다. 그러한 구성에서 조차도, 네트워크 내부의 디바이스들은 피어(peer) 기초상에서 서로 상호 작용할 수 있다. 데이터, 명령들 및 변수들은 IEEE 1394-2000 네트워크 내부의 모든 디바이스들 사이에서 적절하게 송신될 수 있다는 것을 확인될 수 있다.
본 발명의 바람직한 실시예에 따라서, 사용자는 "TV 채널 7을 시청하고 녹화하라"와 같은 요청을 언급한다. 언급된 요청은 마이크로폰(38)에 의해서 탐지되며 IEEE 1394-2000을 통해서 네트워크 인터페이스 유닛(30)으로 송신된다. 네트워크 인터페이스 유닛(30)은 그후 상기 요청을 디지털화하고 저장한다. 대안적으로, 사용자는 키보드 또는 다른 적절한 입력 디바이스들을 사용해서, 자연어 요청을 입력할 수 있다. 네트워크 인터페이스 유닛(30)은 요청을 저장할 경우에, 자연어 요청은 그후 인터넷 접속(46)을 통해서 자연어 서버(32)로 송신된다. 네트워크 인터페이스 유닛(30)은 또한 디바이스들의 네트워크의 구성에 관한 정보를 자연어 서버(32)로 전송한다. 상기 정보는 디바이스들의 형태 및 각각의 디바이스들의 제어 기능에 관한 정보뿐 만 아니라, 디바이스들의 네트워크 내부의 디바이스들의 구성에 관한 정보를 포함한다.
자연어 서버(32)는 네트워크 인터페이스 유닛(30)으로부터 디지털화된 요청 및 구성 정보를 수신할 때, 자연어 서버(32)는 그후 사용자의 의도를 판단하기 위해서 언어 확인 및 자연어 처리 기술들을 적절하게, 요청에 적용한다. 상기 "TV 채널 7을 시청하고 녹화하라"와 같은 예에서 볼때, 자연어 서버(2)는 사용자가 디지털 텔레비젼(34)를 켜고, 디지털 텔레비젼(34)를 채널 7로 조정하고, 디지털 VCR(36)을 켜고 디지털 텔레비전(34)가 채널(7)에 대응하는 스트림을 전송하는 IEEE 1394-2000 동시성 채널을 수신하기 위해서 디지털 VCR(36)을 설정하기를 원한다고 판단한다. 자연어 서버(32)는 그후 바람직하게는 디지털 텔레비젼(34)을 켜고, AVC 튜너 서브유닛을 사용해서 채널 7을 선택하고, 디지털 VCR(36)을 켜고, AVC 접속 및 관리 명령 세트를 이용해서 디지털 텔레비전(34)과 디지털 VCR(36) 사이의 논리 접속을 성립시키기 위해서 적절한 AVC 명령들을 디바이스들의 네트워크 내부의 디바이스들로 송신한다.
본 발명의 대안적인 실시예에서, 자연어 서버는 디바이스들의 네트워크에서, 도 3에서 도시된바와 같이, 독립형 디바이스들로써 또는 도 3b에서 도시된 바와 같이 네트워크에서 디바이스들 중 하나의 디바이스에서 위치된다. 도 3a에서 도시된 구성에서, 자연어 서버(50)는 IEEE 1394-2000 케이블(112)에 의해서 PC(42)로 연결된다. 상기 구성에서, 사용자의 요청이 디지털화되며 네트워크 인터페이스 유닛(30)에 의해서 기록된 경우에, 네트워크 인터페이스 유닛(30)은 그후 디지털화된 요청을 IEEE 1394-2000 시리얼 버스 네트워크를 통해서 자연어 서버(50)로 전송한다. 도 3b에서 도시된 구성에서, 자연어 서버(64)는 개인용 컴퓨터(62)에 내부에 있다. 상기 구성에서, 사용자의 요청이 네트워크 인터페이스 유닛(30)에 의해서 디지털화되거나 기록된 경우에, 네트워크 인터페이스 유닛(30)은 IEEE 1394-2000 시리얼 버스 네트워크을 통해서, 자연어 서버(64)를 포함하는, 개인용 컴퓨터(62)에 그후 디지털화된 요청을 전송한다. 본 분야의 당업자는 대안적으로, 자연어 서버 및 네트워크 인터페이스 유닛은 하나의 디바이스로 통합될 수 있음을 이해할 것이다.
네트워크 인터페이스 유닛(30)의 내부 구성 부품들의 블록도가 도 4에서 도시된다. 네트워크 인터페이스 유닛(30)은 처리기(70), 메인 메모리(76), 대량 기억 디바이스(74), IEEE 1394-2000 인터페이스 회로(78) 및 모뎀(72)을 포함하며, 상기 장치들은 종래의 양방향 시스템 버스(82)에 의해서 함께 연결된다. IEEE 1394-2000 인터페이스 회로(78)는 IEEE 1394-2000 시리얼 버스 상의 통신을 수신 및 송신하기 위해서 물리적 인터페이스 회로(80)를 포함한다. 모뎀(72)은 인터넷(46)을 통해서 통신들을 수신 및 송신하기 위해서 인터넷 접속으로 연결된다. 대량 기억 디바이스(74)는 하나의 자기적, 광학적 또는 자기-광학 저장 기술 또는 다른 가능한 대량 기억 기술을 이용해서 이동불능 및 이동가능한 매체 모두를 포함할 수 있다. 시스템 버스(82)는 메모리(74 및 76)의 일부분을 할당하기 위한 어드레스를 포함한다. 시스템 버스(82)는 또한 처리기(70), 메인 메모리(76), 대량 기억 디바이스(74), IEEE 1394-2000 인터페이스 회로(78) 및 모뎀(72) 사이에서 데이터를 전송하기 위해서 데이터 버스를 포함한다.
본 발명의 바람직한 실시예의 자연어 서버(32)의 내부 구성 부품들의 블록도가 도 5에서 도시된다. 자연어 서버(32)는 처리기(84), 메인 메모리(88), 대량 기억 디바이스(90) 및 모뎀(86)을 포함하고 있으며, 상기 장치들 모두는 종래의 양방향 시스템 버스(92)에 의해서 함께 연결된다. 모뎀(86)은 인터넷(46)을 통해서 통신들을 수신 및 송신하기 위한 인터넷 접속에 연결된다. 대량 기억 디바이스(90)는 하나 이상의 자기적, 광학적 또는 자기-광학적 저장 기술 또는 다른 가능한 대량 기억 기술을 사용해서 이동불능 및 이동가능한 매체 모두를 포함한다. 시스템 버스(92)는 메모리(88 및 90)의 일부분을 할당하기 위한 어드레스 버스를 포함한다. 시스템 버스(92)는 또한 처리기(84), 메인 메모리(88), 대량 기억 디바이스(90) 및 모뎀(86) 사이에서 데이터를 전송하기 위해서 데이터 버스를 포함한다.
본 발명의 방법의 흐름도는 도 6에서 도시된다. 과정은 단계(200)에서 시작된다. 과정은 자연어 요청 또는 명령이 사용자로부터 수신될 때까지 단계(202)에서 대기한다. 자연어 요청이 사용자로부터 수신될 경우에, 요청은 그후 단계(204)에서 기록된다. 기록된 요청은 그후 상기 설명되었듯이, 단계(206)에서, 네트워크의 구성에 관한 정보와 함께 자연어 서버에 전송된다. 바람직하게는, 상기 전송은 인터넷(46)을 통해서 네트워크 인터페이스 유닛(30)에서 자연어 서버(32)로 행해진다. 대안적으로, 상기 설명된 바와 같이, 자연어 서버(32)가 디바이스들의 네트워크의 일부분이라면, 전송은 디바이스들의 네트워크를 통해서 네트워크 인터페이스 유닛(30)에서 자연어 서버(32)로 행해진다.
자연어 서버는 사용자로부터 기록된 요청을 수신할 때, 자연어 서버는 그후 단계(208)에서, 사용자의 요청의 의도를 판단한다. 바람직하게는, 자연어 서버는 공지된 기술들을 사용해서 사용자의 요청의 의도를 판단한다. 사용자의 요청의 의도가 판단된 후에, 자연어 서버는 그후 단계(210)에서, 디바이스들의 발신 네트워크에서 사용가능한 디바이스들과 함께, 사용자의 요청을 완수하기 위해서 적절한 네트워크 명령들을 발생시킨다. 이런 발생된 명령들은 그후 단계(212)에서, 바람직하게는 네트워크 인터페이스 유닛으로부터 자연어 서버로 초기의 기록된 요청을 송신하는데 사용된 동일한 전송 매체를 통해서 자연어 서버로부터 네트워크 인터페이스 유닛으로 전송된다. 단계(214)에서, 네트워크 인터페이스 유닛은 자연어 서버로부터 적절한 명령들을 수신한 경우에, 네트워크 인터페이스 유닛은 그후 바람직하게는 명령들을 사용자의 요청을 실행하기 위해서 IEEEE 1394-2000 시리얼 버스 네 트워크를 통해서 적절한 디바이스들로 전송한다. 상기 과정은 그후 단계(216)에서 끝난다.
본 발명의 장치 및 방법을 사용하면서, 사용자는 자연어로, 음성 또는 키보드 또는 다른 입력 디바이스를 통해서 입력되어진 요청을 행할 수 있는 능력을 가진다. 사용자는 "지금 몇 시인가?"와 같은, 정보를 다른 것들 사이에서, 자연어로 요청할 수 있는 능력을 가진다. 사용자는 또한 상기 설명한 바와 같이, "채널 7을 시청하고 기록하라"와 같은, 디바이스들의 네트워크 내부의 디바이스들과 관련된 제어 동작을 요청할 수 있는 능력을 또한 가진다.
본 발명의 시스템의 동작의 다른 예로써, 사용자가 "지금 몇 시인가?"와 같은, 정보를 요청할 때, 마이크로폰(38)은 먼저 음성 요청을 수신하고, 요청을 디지털화하고, 그후 IEEE 1394-2000 시리얼 버스 네트워크를 통해서 요청을 네트워크 인터페이스 유닛(30)으로 송신한다. 네트워크 인터페이스 유닛(30)이 마이크로폰(38)으로부터 음성 요청을 수신할 때, 네트워크 인터페이스 유닛(30)이 요청을 저장한다. 네트워크 인터페이스 유닛(30)은 그후 디지털화된 요청 및 디바이스들의 네트워크에서의 디바이스들의 구조에 관한 정보를 자연어 서버(32)로 인터넷(46)을 통해서 전송한다. 자연어 서버(32)는 요청을 수신할 때, 자연어 서버(32)는 먼저 사용자로부터의 요청의 의도를 판단한다. 자연어 서버(32)가 사용자가 현재 시각을 물어본다고 판단한 경우에, 자연어 서버(32)는 그후 현재 시각이 사용자의 위치에서 몇시인지 판단한다. 자연어 서버(32)는 사용자에 의해서 요청된 정보를 획득하기 위해서 또는 대안적으로는 디바이스들의 사용자의 네트워크 내부의 자원들로부 터 정보를 획득하기 위해서 인터넷상에서 가능한 자원을 이용한다.
자연어 서버(32)는 사용자에 의해서 요청된 정보, 상기 예에서는, 현재 시각을 획득한 경우에, 자연어 서버(32)는 그후 사용자의 디바이스들의 네트워크로부터 획득된 정보를 사용자에게 통신할 수 있는 방법을 판단한다. 상기 예에서는, 현재 시각은 PC(42)와 관련된, 디스플레이(44) 또는 디지털 텔레비전(34) 중의 하나 상에서 디스플레이될 수 있다. 자연어 서버(32)가 디지털 텔레비전(34)이 현재 켜져있다고 판단한다면, 자연어 서버(32)가 현재 시각이 디지털 텔레비전(34)상에 표시되게 하는 명령들을 발생시킨다. 상기 명령들은 그후 자연어 서버(32)로부터 인터넷(46)을 통해서 네트워크 인터페이스 유닛(30)으로 전송된다.
네트워크 인터페이스 유닛(30)은 자연어 서버(32)로부터 명령들을 수신할 때, 네트워크 인터페이스 유닛(30)은 그후 IEEE 1394-2000 시리얼 버스 네트워크 내부의 적당한 디바이스들에 명령들을 전송한다. 상기 예에서, 네트워크 인터페이스 유닛(30)은 명령들을 디지털 텔레비전(34)으로 전송한다. 디지털 텔레비전(34)이 네트워크 인터페이스 유닛(30)으로부터 수신할 때, 디지털 텔레비전(34)이 그후 요청된 바와 같이, 사용자를 위한 현재 시각을 디스플레이될 것이다.
본 명세서에서 설명된 방법에서, 본 발명의 장치 및 방법을 사용하는 사용자는 디바이스들의 네트워크에서 자연어 요청을 입력할 능력을 가진다. 사용자의 요청은 그후 요청을 디지털화하고 저장하는 네트워크 인터페이스 유닛으로 전송된다. 네트워크 인터페이스 유닛은 그후 디지털화된 요청 및 디바이스들의 네트워크 내부의 디바이스들에 관한 정보를 자연어 서버로, 바람직하게는, 인터넷을 통해서, 전 송한다. 자연어 서버는 요청을 수신할 때, 자연어 서버가 요청의 의도를 판단한다. 자연어 서버가 요청의 의도를 판단한 경우에, 자연어 서버는 그후 사용자의 구조에서 디바이스들의 네트워크와 함께 요청을 완수할 방법을 판단한다. 자연어 서버는 그후 사용자의 요청을 완수하는데 필요한 명령들을 발생시킨다. 자연어 서버는 그후 명령들을 네트워크 인터페이스 유닛으로 송신한다. 네트워크 인터페이스 유닛이 명령들을 수신할 때, 네트워크 인터페이스 유닛은 그후 명령들을 디바이스들의 네트워크 내부의 적절한 디바이스들로 송신한다. 디바이스들은 그후 수신된 명령들을 사용자의 요청을 완수하기 위해서 실행한다.
본 발명은 본 발명의 구조 및 동작의 원리의 이해를 용이하게 하기 위해서 상세한 사항은 통합한 특정한 실시예들에 의해서 설명되었다. 특정 실시예들 및 실시예의 자세한 사항에 대한 참조는 첨부된 청구항의 범위를 국한시키는 것으로 의도되지 않는다. 본 분야의 당업자는 본 발명의 정신 및 범위를 벗어나는 것 없이 예시를 위해서 선택된 실시예에서 변형들이 행해질 수 있음을 이해할 것이다. 특히, 본 분야의 당업자들은 본 발명의 바람직한 실시예가 IEEE 1394-2000 시리얼 버스 구조로 사용되지만, 본 발명은 다른 적당한 버스 또는 네트워크 구조로도 구현될 수 있음을 이해해야한다.

Claims (38)

  1. 삭제
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 삭제
  7. 삭제
  8. 삭제
  9. 삭제
  10. 삭제
  11. 삭제
  12. 삭제
  13. 삭제
  14. 삭제
  15. 삭제
  16. 삭제
  17. 삭제
  18. 삭제
  19. 삭제
  20. 자연어 요청을 수신하고 디바이스들의 네트워크에서 상기 자연어 요청을 완수하기 위해서 명령들을 발생시키기 위한 자연어 서버에 있어서,
    a. 네트워크 인터페이스 유닛으로부터 상기 자연어 요청을 수신하도록 구성되는 인터페이스 회로; 및
    b. 상기 인터페이스 회로에 연결되고 상기 자연어 요청을 처리하도록 및 상기 디바이스들의 네트워크에서 상기 자연어 요청을 실행하는데 필요한 명령들을 발생시키도록 구성되는 제어 회로로써, 상기 명령들은 상기 인터페이스 회로를 통해서 상기 네트워크 인터페이스 유닛으로 전송되는 제어 회로를 포함하는 자연어 서버.
  21. 제20항에 있어서,
    상기 디바이스들의 네트워크의 구성에 관한 정보는 또한 상기 네트워크 인터페이스 유닛으로부터 상기 인터페이스 회로에 의해서 수신되는 자연어 서버.
  22. 제20항에 있어서,
    상기 자연어 요청은 음성 요청 및 입력 디바이스를 사용해서 입력된 요청중에서 선택된 요청인 자연어 서버.
  23. 제20항에 있어서,
    상기 자연어 요청은 상기 디바이스들의 네트워크에서 수행되는 제어 동작 및 정보중에서 선택된 하나를 요청하는 자연어 서버.
  24. 제20항에 있어서,
    상기 자연어 서버는 상기 디바이스들의 네트워크로부터 멀리 위치하는 자연어 서버.
  25. 제24항에 있어서,
    상기 인터페이스 회로는 상기 네트워크 인터페이스 유닛과 통신하기 위한 인터넷 접속을 제공하는 자연어 서버.
  26. 제20항에 있어서,
    상기 자연어 서버는 상기 디바이스들의 네트워크에 포함되는 자연어 서버.
  27. 제20항에 있어서,
    상기 디바이스들의 네트워크는 IEEE 1394 표준의 버전을 실질적으로 따르는 자연어 서버.
  28. 디바이스들의 네트워크 시스템에 있어서,
    a. 하나 이상의 디바이스들;
    b. 자연어 서버로써,
    I. 자연어 요청을 수신하도록 구성되는 제1 인터페이스, 및
    II. 상기 제1 인터페이스에 연결되며 상기 자연어 요청을 처리하도록 및 상기 하나 이상의 디바이스들에서 상기 자연어 요청을 실행하는 데 필요한 명령들을 발생하도록 구성되는 제1 제어 회로를 포함하는 자연어 서버; 및
    c. 네트워크 인터페이스 유닛으로써,
    I. 사용자로부터 상기 자연어 요청을 수신하기 위해서 상기 하나 이상의 디바이스들과 통신하도록 구성되는 제2 인터페이스;
    II. 상기 자연어 서버에 상기 자연어 요청을 전송하기 위해서 및 상기 하나 이상의 디바이스들에서 상기 자연어 요청을 실행할 상기 명령들을 상기 자연어 서버로부터 재수신하기 위해서 상기 자연어 서버와 통신하도록 구성되는 제3 인터페이스, 및
    III. 상기 하나 이상의 디바이스들과의 통신을 제어하기 위해서 상기 제2 인터페이스 및 상기 자연어 서버와의 상기 통신을 제어하기 위해서 상기 제3 인터페이스에 연결된 제어 회로로써, 상기 자연어 요청이 상기 제 1 제2 인터페이스에 의해서 수신될 때, 상기 자연어 요청이 상기 자연어 서버로 송신되며, 또한 상기 명령들이 상기 자연어 서버로부터 재수신될 때, 상기 명령들은 상기 자연어 요청을 실행하기 위해서 상기 제2 인터페이스로부터 상기 하나 이상의 디바이스들에 송신되는 제어 회로를 포함하는 네트워크 인터페이스 유닛을 포함하는 디바이스들의 네트워크 시스템.
  29. 제28항에 있어서,
    상기 하나 이상의 디바이스들의 구성에 관한 정보는 또한 상기 네트워크 인터페이스 유닛으로부터 상기 자연어 서버에 전송되는 디바이스들의 네트워크 시스템.
  30. 제28항에 있어서,
    상기 자연어 요청은 음성 요청 및 입력 디바이스를 이용해서 입력된 요청 중에서 선택된 요청인 디바이스들의 네트워크 시스템.
  31. 제28항에 있어서,
    상기 자연어 요청은 상기 하나 이상의 디바이스들에 의해서 수행되는 제어 동작 및 정보중에서 선택된 하나를 요청하는 디바이스들의 네트워크 시스템.
  32. 제28항에 있어서,
    상기 자연어 서버는 상기 하나 이상의 디바이스들로부터 멀리 위치하는 디바이스들의 네트워크 시스템.
  33. 제32항에 있어서,
    상기 제1 인터페이스 및 제3 인터페이스는 인터넷 접속을 통해서 통신하는 디바이스들의 네트워크 시스템.
  34. 제28항에 있어서,
    상기 자연어 서버는 상기 하나 이상의 디바이스들과 국소적으로 연결되는 디바이스들의 네트워크 시스템.
  35. 제34항에 있어서,
    상기 제2 및 제3 인터페이스는 단일 인터페이스 회로로 통합되는 디바이스들의 네트워크 시스템.
  36. 제28항에 있어서,
    상기 하나 이상의 디바이스들 및 상기 네트워크 인터페이스 회로는 IEEE 1394 표준의 버전을 실질적으로 따르는 네트워크에서 함께 연결되는 디바이스들의 네트워크 시스템.
  37. 삭제
  38. 삭제
KR1020047014915A 2002-03-27 2003-03-21 자연어 서버를 사용하는 가정용 엔터테인먼트 시스템 제어 KR100719981B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US10/112,244 US6895379B2 (en) 2002-03-27 2002-03-27 Method of and apparatus for configuring and controlling home entertainment systems through natural language and spoken commands using a natural language server
US10/112,244 2002-03-27
PCT/US2003/008695 WO2003083829A1 (en) 2002-03-27 2003-03-21 Controlling home entertainment systems using a natural language server

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020077002188A Division KR20070022399A (ko) 2002-03-27 2003-03-21 자연어 서버를 사용하는 가정용 엔터테인먼트 시스템 제어

Publications (2)

Publication Number Publication Date
KR20040105787A KR20040105787A (ko) 2004-12-16
KR100719981B1 true KR100719981B1 (ko) 2007-05-21

Family

ID=28453289

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020047014915A KR100719981B1 (ko) 2002-03-27 2003-03-21 자연어 서버를 사용하는 가정용 엔터테인먼트 시스템 제어

Country Status (5)

Country Link
US (1) US6895379B2 (ko)
EP (1) EP1488409A4 (ko)
JP (1) JP2005521962A (ko)
KR (1) KR100719981B1 (ko)
WO (1) WO2003083829A1 (ko)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5118280B2 (ja) * 1999-10-19 2013-01-16 ソニー エレクトロニクス インク 自然言語インターフェースコントロールシステム
US7047196B2 (en) * 2000-06-08 2006-05-16 Agiletv Corporation System and method of voice recognition near a wireline node of a network supporting cable television and/or video delivery
US8095370B2 (en) 2001-02-16 2012-01-10 Agiletv Corporation Dual compression voice recordation non-repudiation system
KR100434545B1 (ko) * 2002-03-15 2004-06-05 삼성전자주식회사 홈네트워크로 연결된 가전기기들을 제어하는 방법 및 장치
US7310807B2 (en) 2003-10-29 2007-12-18 Sbc Knowledge Ventures, L.P. System and method for local video distribution
US7734155B2 (en) * 2003-12-08 2010-06-08 Sony Corporation Multimedia home network computer
US8904458B2 (en) 2004-07-29 2014-12-02 At&T Intellectual Property I, L.P. System and method for pre-caching a first portion of a video file on a set-top box
US8584257B2 (en) 2004-08-10 2013-11-12 At&T Intellectual Property I, L.P. Method and interface for video content acquisition security on a set-top box
US8086261B2 (en) 2004-10-07 2011-12-27 At&T Intellectual Property I, L.P. System and method for providing digital network access and digital broadcast services using combined channels on a single physical medium to the customer premises
US7716714B2 (en) 2004-12-01 2010-05-11 At&T Intellectual Property I, L.P. System and method for recording television content at a set top box
US8434116B2 (en) 2004-12-01 2013-04-30 At&T Intellectual Property I, L.P. Device, system, and method for managing television tuners
US7474359B2 (en) 2004-12-06 2009-01-06 At&T Intellectual Properties I, L.P. System and method of displaying a video stream
US20060161953A1 (en) * 2005-01-20 2006-07-20 Sbc Knowledge Ventures, L.P. System and method of providing a combined content guide for an entertainment system
US7307574B2 (en) 2005-02-02 2007-12-11 Sbc Knowledge Ventures, Lp Remote control, apparatus, system and methods of using the same
US8214859B2 (en) 2005-02-14 2012-07-03 At&T Intellectual Property I, L.P. Automatic switching between high definition and standard definition IP television signals
FR2884943B1 (fr) * 2005-04-25 2007-07-27 Canon Europa Nv Naamlooze Venn Procede de gestion de commande au sein d'un reseau de communication, dispositif de controle, produit programme d'ordinateur et moyen de stockage correspondants
US8054849B2 (en) 2005-05-27 2011-11-08 At&T Intellectual Property I, L.P. System and method of managing video content streams
US8893199B2 (en) 2005-06-22 2014-11-18 At&T Intellectual Property I, L.P. System and method of managing video content delivery
US7908627B2 (en) 2005-06-22 2011-03-15 At&T Intellectual Property I, L.P. System and method to provide a unified video signal for diverse receiving platforms
US8365218B2 (en) 2005-06-24 2013-01-29 At&T Intellectual Property I, L.P. Networked television and method thereof
US8282476B2 (en) 2005-06-24 2012-10-09 At&T Intellectual Property I, L.P. Multimedia-based video game distribution
US8635659B2 (en) 2005-06-24 2014-01-21 At&T Intellectual Property I, L.P. Audio receiver modular card and method thereof
US8190688B2 (en) 2005-07-11 2012-05-29 At&T Intellectual Property I, Lp System and method of transmitting photographs from a set top box
US7873102B2 (en) 2005-07-27 2011-01-18 At&T Intellectual Property I, Lp Video quality testing by encoding aggregated clips
US20080115125A1 (en) * 2006-11-13 2008-05-15 Cingular Wireless Ii, Llc Optimizing static dictionary usage for signal compression and for hypertext transfer protocol compression in a wireless network
US20090018818A1 (en) * 2007-07-10 2009-01-15 Aibelive Co., Ltd. Operating device for natural language input
US7516068B1 (en) 2008-04-07 2009-04-07 International Business Machines Corporation Optimized collection of audio for speech recognition
EP2317730B1 (en) 2009-10-29 2015-08-12 Unify GmbH & Co. KG Method and system to automatically change or update the configuration or setting of a communication system
US9722811B2 (en) 2012-09-10 2017-08-01 Samsung Electronics Co., Ltd. System and method of controlling external apparatus connected with device
KR102177830B1 (ko) * 2012-09-10 2020-11-11 삼성전자주식회사 디바이스에 연결된 외부 기기를 제어하는 시스템 및 방법
KR102096590B1 (ko) * 2018-08-14 2020-04-06 주식회사 알티캐스트 Gui 음성제어 장치 및 방법
KR102175165B1 (ko) * 2019-12-10 2020-11-05 삼성전자주식회사 디바이스에 연결된 외부 기기를 제어하는 시스템 및 방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5086385A (en) * 1989-01-31 1992-02-04 Custom Command Systems Expandable home automation system
US6173279B1 (en) * 1998-04-09 2001-01-09 At&T Corp. Method of using a natural language interface to retrieve information from one or more data resources

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4641238A (en) 1984-12-10 1987-02-03 Itt Corporation Multiprocessor system employing dynamically programmable processing elements controlled by a master processor
US5809459A (en) 1996-05-21 1998-09-15 Motorola, Inc. Method and apparatus for speech excitation waveform coding using multiple error waveforms
US5960399A (en) * 1996-12-24 1999-09-28 Gte Internetworking Incorporated Client/server speech processor/recognizer
US6456974B1 (en) * 1997-01-06 2002-09-24 Texas Instruments Incorporated System and method for adding speech recognition capabilities to java
US6078886A (en) * 1997-04-14 2000-06-20 At&T Corporation System and method for providing remote automatic speech recognition services via a packet network
EP0911808B1 (en) * 1997-10-23 2002-05-08 Sony International (Europe) GmbH Speech interface in a home network environment
US6052439A (en) * 1997-12-31 2000-04-18 At&T Corp Network server platform telephone directory white-yellow page services
US6513006B2 (en) * 1999-08-26 2003-01-28 Matsushita Electronic Industrial Co., Ltd. Automatic control of household activity using speech recognition and natural language
JP2001319045A (ja) * 2000-05-11 2001-11-16 Matsushita Electric Works Ltd 音声マンマシンインタフェースを用いたホームエージェントシステム、及びプログラム記録媒体

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5086385A (en) * 1989-01-31 1992-02-04 Custom Command Systems Expandable home automation system
US6173279B1 (en) * 1998-04-09 2001-01-09 At&T Corp. Method of using a natural language interface to retrieve information from one or more data resources

Also Published As

Publication number Publication date
US20030187646A1 (en) 2003-10-02
US6895379B2 (en) 2005-05-17
WO2003083829A1 (en) 2003-10-09
EP1488409A1 (en) 2004-12-22
EP1488409A4 (en) 2005-12-07
KR20040105787A (ko) 2004-12-16
JP2005521962A (ja) 2005-07-21

Similar Documents

Publication Publication Date Title
KR100719981B1 (ko) 자연어 서버를 사용하는 가정용 엔터테인먼트 시스템 제어
EP2274870B1 (en) Open architecture based domain dependent real time multi-lingual communication service
KR100430953B1 (ko) 네트워크 협동 대화 서비스를 제공하기 위한 시스템 및 방법
US9484035B2 (en) System and method for distributed speech recognition
US9761241B2 (en) System and method for providing network coordinated conversational services
US7835821B2 (en) Robot server for controlling robot, system having the same for providing content, and method thereof
US7099825B1 (en) User mobility in a voice recognition environment
US20090187410A1 (en) System and method of providing speech processing in user interface
JP7353497B2 (ja) 能動的に対話の開始を提起するためのサーバ側処理方法及びサーバ、並びに能動的に対話の開始が提起できる音声インタラクションシステム
CN107566226A (zh) 一种控制智能家居的方法、装置和系统
CN109361527A (zh) 语音会议记录方法及系统
WO2019035371A1 (ja) 情報処理装置、情報処理方法及びプログラム
JP3519712B2 (ja) 電気機器遠隔制御システム、その方法、そのプログラム及びそのプログラムが記録された記録媒体
CN108111374B (zh) 同步设备列表的方法、装置、设备和计算机存储介质
JPWO2020070959A1 (ja) 通訳システム、サーバ装置、配信方法、および記録媒体
KR20070022399A (ko) 자연어 서버를 사용하는 가정용 엔터테인먼트 시스템 제어
WO1995016968A1 (fr) Procede et dispositif pour transformer un premier message vocal dans une premiere langue, en un second message dans une seconde langue predeterminee
US20090216894A1 (en) Relay apparatus for use in e-mail-based chat system
WO2002069568A1 (en) Group-independent message transfer method and system lending specified application module
US7756941B2 (en) Communication system having dominating node and dominated node
KR20170124838A (ko) 언어 학습을 위한 채팅 방법 및 채팅 시스템
JPH07321781A (ja) 通信システム及び端末装置
JP2020009337A (ja) 情報処理装置、ai制御方法およびai制御プログラム
Maarouf Unleash Text, Hand Written and Voice Chatting And transferring text files
JPH096694A (ja) データ送出装置

Legal Events

Date Code Title Description
A201 Request for examination
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
A107 Divisional application of patent
AMND Amendment
J201 Request for trial against refusal decision
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130425

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20140425

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20150428

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20160427

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20170428

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20180430

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20190426

Year of fee payment: 13