KR20180137041A

KR20180137041A - 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로

Info

Publication number: KR20180137041A
Application number: KR1020187036622A
Authority: KR
Inventors: 에릭 리우; 슈테판 제이 마르티; 승욱 김
Original assignee: 퀄컴 인코포레이티드
Priority date: 2011-12-07
Filing date: 2011-12-07
Publication date: 2018-12-26
Also published as: US9564131B2; US11810569B2; BR112014013832A8; CN104254884B; EP3748631B1; BR112014013832A2; US20150162002A1; IN2014CN04097A; US10381007B2; KR20200074260A; WO2013085507A1; CN104254884A; KR20220002750A; EP2788978A4; US11069360B2; EP3748631A2; US20210304770A1; JP2015501106A; EP2788978B1; US20190385612A1

Abstract

예시들은 오디오 스트림을 수신하고 디지털화하기 위해 저전력 집적 회로를 개시한다. 또한, 예시들은 디지털화된 오디오 스트림을 키워드와 비교하고 디지털화된 오디오 스트림을 메모리에 저장하기 위해 저전력 집적 회로를 제공한다. 게다가, 예시들은 또한 디지털화된 오디오 스트림에서 키워드를 인식하면, 저전력 집적 회로는 전력을 증가시키기 위한 신호를 프로세서에 송신하고 디지털화된 오디오 스트림을 분석한다.

Description

디지털화된 오디오 스트림을 분석하는 저전력 집적 회로 {LOW POWER INTEGRATED CIRCUIT TO ANALYZE A DIGITIZED AUDIO STREAM}

컴퓨팅 디바이스들은 오디오 명령들을 처리하고 응답들을 제공함으로써 사용자들에게 전문성을 높이고 있다. 사용자들은 이런 컴퓨팅 디바이스들을 제어하기 위해 사용될 수도 있는 오디오 명령들을 열거할 수 있다. 예를 들어, 사용자들은 특정 위치에 디렉션들을 제공하는 명령들과 같은 정보를 제공하기 위해 컴퓨팅 디바이스들에게 말할 수 있다.

첨부 도면들에서, 같은 번호들은 같은 컴포넌트들 또는 블록들을 지칭한다. 다음의 상세한 설명은 이 도면들을 참조한다.
도 1은 오디오 스트림을 분석하는 저전력 집적 회로 및 집적 회로에 의한 키워드의 검출에 응답하여 디지털화된 오디오 스트림을 분석하는 프로세서를 포함하는 일 예의 컴퓨팅 디바이스의 블록 다이어그램이다.
도 2는 오디오 스트림을 분석하고 오디오 스트림에서 키워드가 검출될 때 전력을 증가시키기 위한 신호를 프로세서로 송신하기 위한 일 예의 저전력 집적 회로의 블록 다이어그램이다.
도 3은 디지털화된 오디오 스트림을 분석하는 일 예의 컴퓨팅 디바이스 및 디지털화된 오디오 스트림으로부터 생성된 텍스트 스트림을 분석하기 위해 컴퓨팅 디바이스와 통신하는 서버의 블록 다이어그램이다.
도 4는 오디오 스트림을 수신하고 응답을 결정하기 위해 컴퓨팅 디바이스 상에서 수행되는 일 예의 방법의 플로우챠트이다.
도 5는 디지털화된 오디오 스트림을 압축하고 응답을 렌더링하기 위해 컴퓨팅 디바이스 상에서 수행되는 일 예의 방법의 플로우챠트이다.

오디오 정보 처리에서, 사용자는 보통 버튼을 누르고 및/또는 명령들을 열거함으로써 오디오를 처리하는 어플리케이션을 작동시킨다. 오디오 처리 어플리케이션을 론칭하면, 사용자는 부가적으로 컴퓨팅 디바이스가 수행하기를 원하는 명시적 명령들을 열거하여야 한다. 따라서, 사용자로부터의 스피치 명령들을 처리하는 것은 시간 소모적이고 반복적일 수 있다. 게다가, 사용자로부터의 명령들에 대해 연속적으로 모니터링하는 것은 더 많은 전력을 소모하여 배터리를 방전시킨다.

이러한 이슈들을 해결하기 위해, 본 명세서에 개시된 예시의 실시형태들은 저전력 집적 회로를 사용하여 사용자의 스피치의 더 완전한 분석을 위해 프로세서에 의존하면서, 오디오 스트림 (예를 들어, 사용자의 스피치) 에서 키워드의 발생에 대해 연속적으로 모니터링한다. 예를 들어, 본 명세서에 개시된 다양한 예들은 저전력 집적 회로에서 오디오 스트림을 수신하고, 오디오 스트림을 디지털화하고, 디지털화된 오디오 스트림을 분석하여 키워드를 인식하는 것을 제공한다. 디지털화된 오디오 스트림 내에서 키워드를 인식하면, 집적 회로는 전력을 증가시키기 위한 신호를 프로세서에 전송한다. 프로세서에 대한 전력을 증가시키면, 디지털화된 오디오 스트림이 취출되어 응답을 결정한다. 이것은 사용자가 특정 오디오 처리 어플리케이션을 론칭하는데 소모된 시간 량을 감소시키고 사용자의 스피치의 반복을 방지한다. 취출된 오디오 스트림으로부터의 응답의 결정은 사용자가 스피치 분석을 수행하기 위해 컴퓨팅 디바이스에 부가적인 명시적 명령들을 제공하는 것을 방지한다.

게다가, 본 명세서에 개시된 다양한 예들에서, 프로세서에 대한 전력을 증가시키면, 프로세서는 메모리로부터 디지털화된 오디오 스트림을 취출하고 디지털화된 오디오 스트림을 텍스트 스트림으로 변환한다. 텍스트 스트림으로 변환한 후, 프로세서는 텍스트 스트림 내의 텍스트에 기초하여 응답을 결정한다. 텍스트 스트림으로부터의 응답의 결정은 컴퓨팅 디바이스의 사용자가 컴퓨팅 디바이스에 명령하는 시간을 감소시킨다. 게다가, 프로세서는 오디오 스트림의 컨텍스트에 기초하여 적절한 응답을 또한 결정할 수도 있다. 또한, 컴퓨팅 디바이스는 사용자에게 응답을 충족시키기 위해 어플리케이션이 실행하여야 하는 것을 결정한다. 게다가, 프로세서에 대한 전력을 증가시킴으로써, 디지털화된 오디오 스트림 내에서 키워드를 인식하면, 컴퓨팅 디바이스는 또한 사용자의 스피치를 청취하는 동안 적은 전력을 소모한다.

일 실시형태에서, 컴퓨팅 디바이스는 서버로부터 또는 프로세서로부터 응답을 수신함으로써 응답을 또한 결정할 수도 있다. 추가 실시형태에서, 메모리는 소정의 시간 기간 동안 저장된 디지털화된 오디오 스트림을 유지한다. 이 실시형태에서, 프로세서는 시간 증분들에서 디지털화된 오디오 스트림을 취출할 수 있다. 예를 들어, 프로세서는 완전한 디지털화된 오디오 스트림을 취출할 수도 있고 또는 디지털화된 오디오 스트림의 짧은 시간 간격을 취출할 수도 있다. 디지털화된 오디오 스트림의 취출은 프로세서가 적절한 응답을 결정하기 위해 오디오 스트림의 컨텍스트를 분석하도록 한다.

이러한 방식으로, 본 명세서에 개시된 예시의 실시형태들은, 컴퓨팅 디바이스가 오디오 스트림의 컨텍스트에 기초하여 적절한 응답을 결정하기 때문에, 컴퓨팅 디바이스로의 반복적인 오디오 명령들을 방지함으로써 사용자 시간을 절약한다. 또한, 컴퓨팅 디바이스는 오디오 스트림을 수신하고 처리하는 동안 적은 전력을 소모한다.

이제 도면들을 참조하면, 도 1은 오디오 스트림 (102) 을 수신하는 저전력 집적 회로 (104), 및 메모리 (112) 에 디지털화된 오디오 스트림 (114) 을 제공하기 위해 오디오 스트림을 디지털화하는 디지털화 모듈 (106) 을 포함하는 일 예의 컴퓨팅 디바이스 (100) 의 블록 다이어그램이다. 또한, 저전력 집적 회로 (104) 는 디지털화된 오디오 스트림 (114) 을 키워드와 비교하는 키워드와의 비교 모듈 (108) 을 포함하고, 키워드의 인식에 기초하여, 전력 (122) 을 증가시키기 위해 프로세서 (118) 에 신호 (116) 를 송신한다. 또한, 프로세서는 디지털화된 오디오 스트림 (114) 을 분석하는 분석 모듈 (120) 을 더 포함한다. 컴퓨팅 디바이스 (100) 의 실시형태들은, 클라이언트 디바이스, 개인 컴퓨터, 데스크탑 컴퓨터, 랩탑, 이동 디바이스 또는 컴포넌트들 (104, 112, 및 118) 을 포함하기에 적절한 다른 컴퓨팅 디바이스를 포함한다.

오디오 스트림 (102) 은 컴퓨팅 디바이스 (100), 구체적으로 저전력 집적 회로 (104) 에 의해 수신된다. 오디오 스트림 (102) 은 디지털화된 오디오 스트림 (114) 을 제공하기 위해 디지털화되는 (106) 입력 아날로그 신호이다. 오디오 스트림 (102) 의 실시형태들은 또 다른 컴퓨팅 디바이스로부터의 오디오 또는 사용자로부터의 스피치를 포함한다. 예를 들어, 혼동할 수도 있는, 오디오 스트림들 (102) 을 수신하는 몇몇 컴퓨팅 디바이스들 (300) 이 있을 수도 있다. 이로써, 컴퓨팅 디바이스들은 오디오 스트림 (102) 을 수신하기 위해 하나의 디바이스를 중심점으로서 지정할 수도 있다. 본 실시형태에서, 저전력 집적 회로 (104) 는 하나 이상의 컴퓨팅 디바이스들의 중앙 유닛일 수도 있는 애드-혹 (ad-hoc) 네트워크의 부분으로서 동작한다.

예를 들어, 사용자는 뉴욕에서 캘리포니아 로스앤젤레스까지의 최단 경로를 다른 사람과 논의할 수도 있다. 본 예에서, 오디오 스트림은 뉴욕에서 로스앤젤레스까지의 최단 경로의 논의일 것이다. 추가 실시형태에서, 오디오 스트림 (102) 은 미리 결정된 시간 기간 동안 오디오를 포함할 수도 있다. 예를 들어, 오디오 스트림 (102) 은 저전력 집적 회로 (104) 에 의해 수신될 때 몇 초 또는 몇분을 포함할 수도 있다. 본 예에서, 저전력 집적 회로 (104) 는 오디오 스트림 (102) 을 다른 오디오 스트림들 (102) 과 구별할 수도 있다.

저전력 집적 회로 (104) 는 오디오 스트림 (102) 을 디지털화하는 모듈 (106) 및 디지털화된 오디오 스트림 (114) 을 키워드와 비교하는 모듈 (108) 을 포함한다. 저전력 집적 회로 (104) 는 다른 전자 컴포넌트들 사이의 상호 접속들을 형성하는 재료의 표면 상의 패터닝된 트레이스 (trace) 엘리먼트들을 갖는 전자 회로이다. 예를 들어, 저전력 집적 회로 (104) 는 프로세서 (118) 와 메모리 (112) 사이에서 접속들을 형성한다. 저전력 집적 회로 (104) 의 실시형태들은, 마이크로칩, 칩셋, 전자 회로, 칩, 마이크로프로세서, 반도체, 마이크로제어기, 또는 오디오 스트림 (102) 을 수신하고 신호 (116) 를 송신할 수 있는 다른 전자 회로를 포함한다. 저전력 집적 회로 (104) 는 오디오 스트림 (102) 을 연속적으로 모니터링하고, 디지털화 모듈 (106) 을 사용하여 오디오 스트림을 디지털화하고, 디지털화된 오디오 스트림을 메모리 (112) 에 저장할 수도 있다. 이로써, 저전력 집적 회로 (104) 의 추가 실시형태들은, 송신기, 수신기, 마이크로폰, 또는 오디오 스트림 (102) 을 수신하는 다른 적절한 컴포넌트를 포함한다.

오디오 스트림은 디지털화된 오디오 스트림 (114) 을 제공하기 위해 모듈 (106) 에서 디지털화된다 디지털화 모듈 (106) 은 오디오 스트림을 이산 시간 신호 표현으로 변환한다. 디지털화 모듈 (106) 의 실시형태들은, 저전력 집적 회로 (104) 와 함께 동작하는 아날로그 디지털 컨버터 (ADC), 디지털 변환 디바이스, 명령, 펌웨어 및/또는 소프트웨어를 포함한다. 예를 들어, 디지털화 모듈 (106) 은 아날로그 신호의 크기에 비례하여 입력 아날로그 전압을 디지털 숫자로 변환하는 전자 디바이스를 포함할 수도 있다.

오디오 스트림 (102) 이 모듈 (106) 에서 디지털화되면, 그것은 모듈 (108) 에서 키워드와 비교된다. 오디오 스트림 (102) 은, 전력 (122) 을 증가시키고 디지털화된 오디오 스트림 (114) 을 획득하여 모듈 (120) 에서 분석하기 위해 신호 (116) 에 대한 표시로서 프로세서 (118) 를 동작시키는 키워드에 대해 모듈 (108) 에서 비교된다. 108의 실시형태들은, 명령, 프로세스, 동작, 로직, 알고리즘, 테크닉, 논리 함수, 펌웨어 및/또는 소프트웨어를 포함한다. 키워드가 인식되면, 저전력 집적 회로 (104) 는 전력 (122) 을 증가시키기 위해 프로세서 (118) 로 신호 (116) 를 송신한다.

키워드의 실시형태들은, 디지털 신호, 아날로그 신호, 패턴, 데이터베이스, 커맨드들, 디렉션들, 명령들, 또는 모듈 (108) 에서 비교하는 다른 표현들을 포함한다. 예를 들어, 컴퓨팅 디바이스의 사용자는 친구와 쉬림프 (shrimp) 와 프라운 (prawn) 사이의 차이를 논의할 수도 있고, 이어서 대답을 식별하기 위해 웹 서치를 수행하기를 바랄 수도 있다. 이로써, 사용자는 키워드와의 비교 모듈 (108) 에 의한 키워드의 인식 및 분석 모듈 (120) 에 의한 이전 논의의 후속 분석을 트리거하기 위해 미리 결정된 키워드를 언급할 수도 있다.

키워드는, 예를 들어 구절, 단일 키워드, 또는 컴퓨팅 디바이스의 사용자에게 사적인 단일 키워드를 포함할 수도 있다. 이전의 예를 유지하는데 있어서, 키워드가 구절, "컴퓨터야, 무슨 생각하니?" 일 수도 있다. 이 예에 있어서, 구절은 저전력 집적 회로 (104) 로 하여금 프로세서 (118) 로 신호 (116) 를 전송하여 구절 이전 또는 이후에 오디오를 포함할 수도 있는 디지털화된 오디오 스트림 (114) 을 획득하게 한다. 따라서, 사용자는 명령을 반복할 필요가 없게 되는데, 이는 프로세서 (118) 가 디지털화된 오디오 스트림 (114) 을 분석하여 적절한 응답에 대한 오디오 스트림 (102) 의 컨텍스트를 결정하기 때문이다. 또한, 추가 예에서, 단일 키워드가 "샤잠 (Shazam)" 을 포함할 수도 있다. 이와 같이, 특정 예로서, 사용자가 단어 "샤잠" 을 말할 때, 회로 (104) 는 키워드를 검출하고 신호 (116) 를 송신하여 디지털화된 오디오 스트림 (114) 을 획득하고 그 스트림을 텍스트 스트림으로 변환하도록 프로세서 (118) 에 명령할 수도 있다. 텍스트 스트림이 텍스트 메시지를 사용자의 어머니에게 작성하는 명령이라고 상정하면, 적절한 응답이 텍스트 메시지를 작성하게 될 것이다. 따라서, 상기 기재된 바와 같이, 미리 결정된 키워드 (들) 을 사용하여, 저전력 집적 회로 (104) 는 컴퓨팅 디바이스의 사용자가 웹 서치를 수행하거나 디렉션들과 같은 추가 응답을 완성할 필요가 있을 때를 인식한다.

모듈 (108) 의 추가 실시형태에서, 디지털화된 오디오 스트림 (114) 내에서 인식되는 키워드가 없을 때, 저전력 집적 회로 (104) 는 모듈 (106) 에서 디지털화되고 메모리 (112) 에 저장되는 또 다른 오디오 스트림 (102) 에 대한 모니터링을 계속한다. 또한 추가 실시형태에서, 저전력 집적 회로 (104) 는 디지털화된 오디오 스트림 (114) 을 압축하고, 이 압축된 디지털화된 오디오 스트림은 모듈 (108) 에서 키워드와 비교함으로써 키워드를 인식하기 위해 사용된다.

메모리 (112) 는 디지털화된 오디오 스트림 (114) 을 저장 및/또는 유지한다. 메모리 (112) 의 실시형태들은, 메모리 버퍼, 캐시, 비휘발성 메모리, 휘발성 메모리, 랜덤 액세스 메모리 (RAM), 전기적 소거가능 프로그램가능 리드 온니 메모리 (EEPROM), 저장 드라이브, 컴팩 디스크 ROM (CDDROM), 또는 디지털화된 오디오 스트림 (114) 을 저장 및/또는 유지할 수 있는 다른 메모리를 포함할 수도 있다.

디지털화된 오디오 스트림 (114) 은 메모리 (112) 에 저장된다. 실시형태들은 메모리 (112) 에서의 배치 이전에 압축된 디지털화된 오디오 스트림을 획득하기 위해 디지털화 모듈 (106) 이후에 오디오 스트림 (102) 을 압축하는 저전력 집적 회로 (104) 를 포함할 수도 있다. 도 1은 메모리 (112) 에 저장된 디지털화된 오디오 스트림 (114) 을 도시하지만, 디지털화된 오디오 스트림은 또한 저전력 집적 회로 (104) 상의 메모리에 저장될 수도 있다. 추가 실시형태에서, 디지털화된 오디오 스트림 (114) 은 오디오 스트림 (102) 의 미리 결정된 시간 양을 포함한다. 본 실시형태에서, 오디오 스트림 (102) 이, 몇 초 또는 몇 분과 같이 미리 결정된 시간 기간 동안 수신되면, 이런 오디오 스트림 (102) 의 미리 결정된 시간 기간이 디지털화되고 획득 및/또는 취출을 위해 프로세서 (118) 에 대하여 메모리 (112) 에 저장된다. 또한, 본 실시형태에서, 또 다른 오디오 스트림 (102) 이 저전력 집적 회로 (104) 에 의해 수신되고 디지털화될 때, 메모리에서 이전의 디지털화된 오디오 스트림이 최신의 디지털화된 오디오 스트림 (114) 으로 교체된다. 따라서, 프로세서 (118) 는 가장 최신의 오디오 스트림 (102) 을 획득 및/또는 취출한다. 본 실시형태에서, 메모리는 가장 최신의 오디오 스트림 (102) 을 제공하기 위해 선입 선출 버퍼로서 동작한다.

디지털화된 오디오 스트림 (114) 내에서 키워드를 인식하면 신호 (116) 가 저전력 집적 회로 (104) 로부터 프로세서 (118) 로 송신된다. 신호 (116) 는 전력 (122) 을 증가시키고 메모리 (112) 로부터 디지털화된 오디오 스트림 (114) 을 분석하도록 프로세서 (118) 에 명령한다. 신호 (116) 의 실시형태들은, 통신, 송신, 전기 신호, 명령, 디지털 신호, 아날로그 신호 또는 프로세서 (118) 에 대한 전력 (122) 을 증가시키는 통신의 다른 유형을 포함한다. 신호 (116) 의 추가 실시형태는 디지털화된 오디오 스트림 (114) 내에서 키워드를 인식하면 프로세서 (118) 에 송신된 인터럽트 (interrupt) 를 포함한다.

프로세서 (118) 는 전력 (122) 을 증가시키기 위해 신호 (116) 를 수신하고 디지털화된 오디오 스트림 (114) 을 획득하여 모듈 (120) 에서 분석한다. 프로세서 (118) 의 실시형태들은, 중앙 처리 유닛 (CPU), 비주얼 처리 유닛 (VPU), 마이크로프로세서, 그래픽스 처리 유닛 (GPU) 또는 디지털화된 오디오 스트림 (114) 을 분석 (120) 하기에 적절한 다른 프로그램가능 디바이스를 포함할 수도 있다.

프로세서 (118) 가 메모리 (112) 로부터 디지털화된 오디오 스트림 (114) 을 획득하면, 프로세서는 모듈 (120) 에서 디지털화된 오디오 스트림 (114) 을 분석한다. 분석 모듈 (120) 의 실시형태들은, 프로세서 (118) 가 페치, 디코딩 및/또는 실행할 수도 있는, 명령, 프로세스, 동작, 로직, 알고리즘, 테크닉, 논리 함수, 펌웨어 및/또는 소프트웨어를 포함한다. 모듈 (120) 의 부가적인 실시형태들은, 오디오 스트림 (102) 의 컨텍스트에 기초하여 적절한 응답을 결정하기 위해 디지털화된 오디오 스트림 (114) 을 텍스트 스트림으로 변환하는 것을 포함한다. 모듈 (120) 의 추가 실시형태들은, 이후 도면들에서 보여지게 되는 바와 같이 컴퓨팅 디바이스 (100) 의 사용자에게 렌더링하기 위해 응답을 결정하는 것을 포함한다.

전력 (122) 은 전기적 포텐셜의 형태로 전기 에너지를 프로세서 (118) 에 공급한다. 특히, 전력 (122) 은, 저전력 집적 회로 (104) 로부터 신호 (116) 를 수신하면, 프로세서 (118) 에 대한 전기적 에너지를 증가시킨다. 프로세서 (118) 에 대한 전력 (122) 의 증가는, 프로세서 (118) 를 웨이크 (wake) 또는 트리거 (trigger) 하여 디지털화된 오디오 스트림 (114) 을 획득한다. 전력 (122) 의 실시형태들은, 전력 공급부, 전력 관리 디바이스, 배터리, 에너지 저장소, 일렉트로메커니컬 시스템, 태양열 발전, 전력 플러그 또는 프로세서 (118) 에 전력 (122) 을 전달할 수 있는 다른 디바이스를 포함한다. 추가 실시형태에서, 전력 (122) 은 컴퓨팅 디바이스 (100) 에 전기 에너지를 공급한다.

이제, 오디오 스트림 (202) 에서 키워드가 검출될 때, 오디오 스트림 (202) 을 분석하고 전력을 증가시키기 위한 신호 (216) 를 프로세서로 송신하는 일 예의 저전력 집적 회로 (204) 의 블록 다이어그램인, 도 2를 참조한다. 저전력 집적 회로 (204) 는 디지털화 회로 (206) 를 사용하여 디지털화된 오디오 스트림 (214) 을 생성하고 비교 회로 (208) 에 의해 키워드를 검출하는 회로 (210) 를 포함하고, 디지털화된 오디오 스트림 (214) 에서 키워드를 인식하면, 신호 (216) 를 송신한다.

오디오 스트림 (202) 은 저전력 집적 회로 (204) 에 의해 수신된다. 오디오 스트림 (202) 은 도 1의 오디오 스트림 (102) 에 대한 구조와 유사할 수도 있다.

저전력 집적 회로 (204) 는 오디오 스트림 (202) 을 디지털화하고 디지털화된 오디오 스트림 (214) 을 키워드와 비교하는 회로 (210) 를 포함한다. 저전력 집적 회로 (204) 는 상기 도 1에서와 같은 저전력 집적 회로 (104) 의 기능 및 구조와 유사할 수도 있다.

회로 (210) 는 디지털화 회로 (206) 및 비교 회로 (208) 를 포함한다. 회로 (210) 의 실시형태들은 로직, 아날로그 회로, 전자 회로, 디지털 회로, 또는 오디오 스트림 (202) 을 디지털화하고 디지털화된 오디오 스트림 (214) 을 키워드와 비교할 수 있는 다른 회로를 포함한다. 추가 실시형태들에서, 회로는 독립적으로 사용될 수도 있고 그리고/또는 회로 (206 및 208) 를 패치, 디코딩, 및/또는 실행하기 위해 저전력 집적 회로 (204) 와 함께 사용될 수도 있는 어플리케이션 및/또는 펌웨어를 포함한다.

오디오 스트림 (202) 은 회로 (206) 에 의해 수신되고 디지털화되어 디지털화된 오디오 스트림 (214) 을 생성한다. 디지털화 회로 (206) 는 오디오 스트림 (202) 에 대한 변환의 일 유형이다. 또한, 디지털화 회로 (206) 는 도 1과 관련하여 기재된 바와 같은 디지털화 모듈 (106) 의 기능과 유사할 수도 있다.

저전력 집적 회로 (204) 는 오디오 스트림 (202) 을 수신하여 회로 (206) 에서 디지털화하고 디지털화된 오디오 스트림 (214) 을 생성한다. 디지털화된 오디오 스트림 (214) 은 도 1과 관련하여 기재된 바와 같은 디지털화된 오디오 스트림 (114) 에 대한 구조와 유사할 수도 있다. 게다가, 도 2가 저전력 집적 회로 (204) 의 외측에 디지털화된 오디오 스트림 (214) 을 도시하지만, 디지털화된 오디오 스트림 (214) 은 또한 저전력 집적 회로 (204) 내에 위치될 수도 있다. 저전력 집적 회로 (204) 내에 위치된 디지털화된 오디오 스트림 (214) 은 회로 (208) 에서 키워드와 비교하기 위해 사용된다. 또 다른 실시형태에서, 디지털화된 오디오 스트림 (214) 은 메모리에 저장 및/또는 유지된다.

저전력 집적 회로 (204) 의 회로 (210) 에 포함된 회로 (208) 는, 디지털화된 오디오 스트림 (214) 을 키워드와 비교한다. 또한, 208은 디지털화된 오디오 스트림 (214) 내에서 키워드를 인식하는데 사용되어 프로세서에 대한 전력을 증가시키기 위한 신호 (216) 를 송신한다. 비교 회로 (208) 는 도 1과 관련하여 기재된 바와 같은 모듈 (108) 에 대한 기능과 유사할 수도 있다.

신호 (216) 는 비교 회로 (208) 에 의해 디지털화된 오디오 스트림 (214) 내의 키워드를 인식하면 전력을 증가시키도록 디바이스에 명령한다. 신호 (216) 는 도 1의 신호 (116) 에 대한 구조 및 기능과 유사할 수도 있다. 신호 (216) 의 실시형태는 전력을 증가시키고 메모리로부터 디지털화된 오디오 스트림 (214) 을 분석하도록 프로세서에 명령하는 것을 포함한다. 본 실시형태에서, 신호 (216) 는 디지털화된 오디오 스트림 (214) 을 획득하여 회로 (208) 에서 키워드 인식에 기초하여 응답을 분석하고 결정하도록 프로세서에 명령한다.

도 3은 디지털화된 오디오 스트림 (314) 을 분석하는 일 예의 컴퓨팅 디바이스 (300) 및 디지털화된 오디오 스트림 (314) 으로부터 생성된 텍스트 스트림 (324) 을 분석하기 위해 컴퓨팅 디바이스 (300) 와 통신하는 서버 (326) 의 블록 다이어그램이다. 컴퓨팅 디바이스 (300) 는 저전력 집적 회로 (304), 메모리 (312), 프로세서 (318), 출력 디바이스 (328) 및 서버 (326) 를 포함한다. 구체적으로, 도 3은 출력 디바이스 (328) 상의 컴퓨팅 디바이스의 사용자에게 응답을 렌더링하기 위해 서버 (326) 또는 프로세서 (318) 에 의해 처리된 텍스트 스트림 (324) 을 도시한다. 컴퓨팅 디바이스 (300) 는 도 1과 관련하여 기재된 바와 같은 컴퓨팅 디바이스 (100) 의 구조 및 기능과 유사할 수도 있다.

오디오 스트림 (302) 은 컴퓨팅 디바이스 (300), 구체적으로 저전력 집적 회로 (304) 에 의해 수신된다. 오디오 스트림 (302) 은, 도 1 및 도 2에서 오디오 스트림 (102 및 202) 에 대한 구조와 각각 유사할 수도 있다.

저전력 집적 회로 (304) 는 디지털화 모듈 (306) 및 분석 모듈 (308) 을 포함한다. 일 실시형태에서, 저전력 집적 회로 (304) 는 모듈 (306 및 308) 을 구비하는 회로를 포함한다. 저전력 집적 회로 (304) 는, 도 1 및 도 2와 관련하여 기재된 저전력 집적 회로 (104 및 204) 의 구조 및 기능과 각각 유사할 수도 있다.

컴퓨팅 디바이스 (300) 에 의해 일단 수신된 오디오 스트림 (302) 은 디지털화되어 (306) 디지털화된 오디오 스트림 (314) 을 생성한다. 디지털화 모듈 (306) 은 도 1 및 도 2에서의 디지털화 모듈 (106) 및 디지털화 회로 (206) 에 대한 구조 및 기능과 각각 유사할 수도 있다. 추가 실시형태에서, 오디오 스트림 (302) 이 모듈 (306) 에서 디지털화되면, 저전력 집적 회로 (304) 는 저장 및/또는 유지를 위해 디지털화된 오디오 스트림 (314) 을 메모리 (312) 에 송신한다.

오디오 스트림 (302) 이 디지털화되면, 저전력 집적회로는 모듈 (308) 에서 디지털화된 오디오 스트림 (314) 을 분석한다. 일 실시형태에서, 모듈 (308) 은 디지털화된 오디오 스트림 (314) 과 키워드를 비교한다. 본 실시형태에서, 308은 상기 도 1에서와 같은 비교 모듈 (108) 의 기능을 포함한다.

메모리 (312) 는 저전력 집적 회로 (304) 로부터 디지털화된 오디오 스트림 (314) 을 저장한다. 일 실시형태에서, 메모리 (312) 는 미리 결정된 시간 기간 동안 수신된 디지털화된 오디오 스트림 (314) 을 유지한다. 예를 들어, 오디오 스트림 (302) 은 몇 초의 미리 결정된 시간 동안 모니터링될 수도 있으며, 이로써 이런 오디오 스트림 (302) 의 몇 초가 모듈 (306) 에서 디지털화되고 메모리 (312) 로 전송된다. 이 예에서, 메모리 (312) 는 프로세서 (318) 에 의해 취출 및/또는 획득되는 몇 초의 디지털화된 오디오 스트림 (314) 을 저장하여, 신호 (316) 를 수신하면 분석한다. 또한, 이 예에서, 또 다른 몇 초의 오디오 스트림 (302) 이 수신되고 디지털화될 때, 이런 다른 디지털화된 오디오 스트림 (314) 이 이전의 디지털화된 오디오 스트림 (314) 을 교체한다. 이것은 메모리 (312) 가 획득 및/또는 취출을 위해 프로세서 (318) 에 대한 가장 최신의 오디오 스트림 (302) 을 유지하도록 한다. 메모리 (312) 는 도 1과 관련하여 기재된 바와 같은 메모리 (112) 의 구조 및 기능과 유사할 수도 있다.

오디오 스트림 (302) 은 디지털화되어 (306) 디지털화된 오디오 스트림 (314) 을 생성한다. 디지털화된 오디오 스트림 (314) 은 메모리 (312) 에 저장 및/또는 유지된다. 일 실시형태에서, 프로세서 (318) 는 디지털화된 오디오 스트림 (314) 을 획득하여, 신호 (316) 를 수신하면 모듈 (320) 에서 분석한다. 디지털화된 오디오 스트림 (314) 은 도 1 및 도 2와 관련하여 각각 기재된 바와 같은 디지털화된 오디오 스트림 (114 및 214) 의 구조 및 기능과 유사할 수도 있다.

신호 (316) 는 전력 (322) 을 증가시키기 위해 저전력 집적 회로 (304) 로부터 프로세서 (318) 로의 송신이다. 신호 (316) 의 일 실시형태에서, 부가적으로, 디지털화된 오디오 스트림 (314) 을 획득하여 모듈 (320) 에서 분석하도록 프로세서 (318) 에 명령한다. 신호 (316) 는 도 1 및 도 2와 관련하여 각각 기재된 바와 같은 신호 (116 및 216) 의 구조 및 기능과 유사할 수도 있다.

전력 (322) 은 프로세서 (318) 및/또는 컴퓨팅 디바이스 (300) 에 전기 에너지를 공급한다. 전력 (322) 은 도 1과 관련하여 기재된 바와 같은 전력 (122) 의 구조 및 기능과 유사할 수도 있다.

프로세서 (318) 는 분석 모듈 (320) 및 텍스트 스트림 (324) 을 포함한다. 구체적으로, 프로세서 (318) 는 전력 (322) 을 증가시키기 위해 신호 (316) 를 수신한다. 이 신호 (316) 를 수신하면, 프로세서 (318) 는 디지털화된 오디오 스트림 (314) 을 획득하여 모듈 (320) 에서 분석한다. 추가 실시형태에서, 프로세서 (318) 는 디지털화된 오디오 스트림 (314) 을 텍스트 스트림 (324) 으로 변환한다. 본 실시형태에서, 텍스트 스트림 (324) 내의 텍스트는 컴퓨팅 디바이스 (300) 에 대한 응답을 지시한다. 텍스트 스트림은 알파벳, 수치 세트, 알파 수치 세트로부터의 표현들 또는 심볼들의 유한 시퀀스의 문자열이다. 예를 들어, 디지털화된 오디오 스트림 (314) 은 이진 언어일 수도 있어서, 프로세서가 이진 표현의 바이트들을 단어로 번역한다. 추가 예에서, 디지털화된 오디오 스트림 (314) 은 단어들 및/또는 숫자들로 표현되는 언어일 수도 있어서, 프로세서 (318) 는 이 언어를 프로세서 (318) 가 이해하는 텍스트로 번역한다. 응답의 실시형태들은 웹 서치의 수행, 전화 번호 다이얼링, 어플리케이션의 오픈, 텍스트의 기록, 미디어의 스트리밍, 텍스트 메시지의 작성, 디렉션들의 리스트 작성 또는 디렉션들의 스피킹을 포함한다. 추가 실시형태에서, 프로세서 (318) 는 응답을 결정하여 컴퓨팅 디바이스 (300) 의 사용자에게 렌더링한다. 프로세서 (318) 는 도 1과 관련하여 기재된 바와 같은 프로세서 (118) 의 구조 및 기능과 유사할 수도 있다.

프로세서 (318) 는 모듈 (320) 에서 저장된 디지털화된 오디오 스트림 (314) 을 분석한다. 분석 모듈 (320) 의 실시형태들은 메모리 (312) 로부터 획득된 디지털화된 오디오 스트림 (314) 을 서버 (326) 로 송신하는 것을 포함한다. 모듈 (320) 의 다른 실시형태들은, 메모리 (312) 로부터 획득된 디지털화된 오디오 스트림 (314) 을 텍스트 스트림 (324) 으로 변환하고 텍스트 스트림 (324) 을 서버 (326) 로 송신하는 것을 포함한다. 모듈 (320) 의 다른 실시형태들은, 디지털화된 오디오 스트림 (314) 을 텍스트 스트림 (324) 으로 변환하여 오디오 스트림 (302) 의 컨텍스트를 분석함으로써 적절한 응답을 결정하는 것을 포함한다. 예를 들어, 디지털화된 오디오 스트림 (314) 은 모듈 (320) 에서 텍스트 스트림 (324) 으로 변환될 수도 있고, 프로세서 (318) 는 자연어 처리를 사용하여 텍스트 스트림 (324) 내의 텍스트를 분석하여 오디오 스트림 (302) 의 컨텍스트에 기초한 적절한 응답을 결정할 수도 있다.

텍스트 스트림 (324) 은 컴퓨팅 디바이스 (300) 에 대한 적절한 응답을 결정하기 위해 텍스트를 포함한다. 일 실시형태에서, 텍스트 스트림 (324) 은 프로세서에 의해 처리되어 출력 디바이스 (328) 상의 컴퓨팅 디바이스 (300) 의 사용자에게 렌더링하기에 적절한 응답을 결정한다. 또 다른 실시형태에서, 텍스트 스트림 (324) 은 서버 (326) 에 의해 처리되어 컴퓨팅 디바이스 (300) 로 송신되는 적절한 응답을 결정한다. 본 실시형태에서, 응답은 서버 (326) 로부터 컴퓨팅 디바이스 (300) 로 전송된다. 추가 실시형태에서, 컴퓨팅 디바이스 (300) 는 컴퓨팅 디바이스 (300) 의 사용자에게 응답을 렌더링한다. 예를 들어, 텍스트 스트림 (324) 은 엄마에게 텍스트 메시지를 전송하는 것을 논의하는 텍스트를 포함할 수도 있다. 이로써, 텍스트 스트림 (324) 내의 텍스트는 컴퓨팅 디바이스 (300) 가 엄마에게 텍스트 메시지를 작성함으로써 응답하게 한다.

서버 (326) 는 네크워크를 통해 서비스들을 제공하며, 예를 들어 웹 서버, 네트워크 서버, 근거리 통신망 (LAN) 서버, 파일 서버, 또는 텍스트 스트림 (324) 를 처리하여 컴퓨팅 디바이스 (300) 로 응답을 전송하기에 적합한 임의의 다른 컴퓨팅 디바이스를 포함할 수도 있다.

출력 디바이스 (328) 는 텍스트 스트림 (324) 내의 텍스트로부터 결정된 바와 같은 응답을 컴퓨팅 디바이스 (300) 의 사용자에게 렌더링한다. 출력 디바이스 (328) 의 실시형태들은 컴퓨팅 디바이스 (300) 의 사용자에게 응답을 렌더링하기 위해 디스플레이 디바이스, 스크린, 또는 스피커를 포함한다. 엄마 예에 대해 텍스트 메시지를 유지함에 있어서, 컴퓨팅 디바이스 (300) 의 사용자는 엄마에게 작성된 텍스트 메시지를 나타내는 디스플레이 및/또는 사용자에게 텍스트 메시지를 전달하는 스피커를 포함할 수도 있다.

이제, 오디오 스트림을 수신하고 응답을 결정하기 위해 컴퓨팅 디바이스 상에서 수행되는 일 예의 방법의 플로우 챠트인, 도 4로 돌아간다. 도 4는 도 1에서와 같이 컴퓨팅 디바이스 (100) 상에서 수행되는 것으로 기재되지만, 당업자에게 자명하게 되는 다른 적절한 컴포넌트들 상에서 또한 실행될 수도 있다. 예를 들어, 도 4는 메모리 (112) 와 같은 머신 판독가능 저장 매체 상에서 실행가능한 명령들의 형태로 구현될 수도 있다.

동작 (402) 에서, 저전력 집적 회로와 함께 동작하는 컴퓨팅 디바이스는 오디오 스트림을 수신한다. 일 실시형태에 있어서, 오디오 스트림은 미리 결정된 시간 양이다. 예를 들어, 오디오 스트림은 몇 초 또는 몇 밀리 초일 수도 있다. 본 실시형태에서, 컴퓨팅 디바이스는 연속적으로 오디오를 모니터링할 수도 있다. 추가 실시형태에서, 오디오 스트림은 사용자로부터의 스피치 또는 다른 컴퓨팅 디바이스로부터의 오디오 중 적어도 하나를 포함한다.

동작 (404) 에서, 컴퓨팅 디바이스와 함께 동작하는 저전력 집적 회로는, 동작 (402) 에서 수신된 오디오 스트림을 디지털화하여 디지털화된 오디오 스트림을 생성한다. 동작 (404) 의 실시형태들은, 저전력 집적 회로와 함께 동작하는 아날로그 디지털 컨버터 (ADC), 디지털 변환 디바이스, 명령, 펌웨어, 및/또는 소프트웨어의 사용을 포함한다. 동작 (404) 의 실시형태들은 디지털화된 오디오 스트림을 메모리에 송신하는 것을 포함한다. 404의 추가 실시형태들은, 동작 (402) 에서 수신된 오디오 스트림을 압축하는 것을 포함하고, 404의 또 다른 실시형태는 디지털화된 오디오 스트림을 압축하는 것을 포함한다.

동작 (406) 에서, 동작 (404) 에서 생성된 디지털화된 오디오 스트림이 메모리에 저장된다. 동작 (406) 의 실시형태들은 디지털화된 오디오 스트림을 저장 및/또는 유지하는 메모리를 포함한다. 동작 (406) 의 또 다른 실시형태에서, 동작 (402) 에서 미리 결정된 시간 양 동안 수신된 오디오 스트림이 동작 (404) 에서 디지털화되고, 이에 따라 동작 (402) 에서 또 다른 오디오 스트림이 수신되고 동작 (404) 에서 디지털화될 때, 이런 현재의 디지털화된 오디오 스트림이 이전에 디지털화된 오디오 스트림을 대체한다. 본 실시형태에서, 메모리는 현재 시간 이전의 시간의 미리 결정된 기간 동안 수신된 저장된 디지털화된 오디오 스트림을 유지한다.

동작 (408) 에서, 저전력 집적 회로는 동작 (404) 에서 생성된 디지털화된 오디오 스트림을 분석한다. 동작 (408) 의 실시형태들은 디지털화된 오디오 스트림을 처리하는 것을 포함하고, 다른 실시형태들은 디지털화된 오디오 스트림을 키워드와 비교하는 것을 포함한다. 동작 (408) 의 이런 실시형태들에서, 저전력 집적 회로는 키워드에 대해 디지털화된 오디오 스트림을 처리한다. 디지털화된 오디오 스트림 내에서 키워드를 인식하면, 방법은 동작 (410) 으로 이동하여 신호를 송신한다. 추가 실시형태에서, 저전력 집적 회로가 디지털화된 오디오 스트림 내에서 키워드를 인식하지 않는다면, 방법은 동작 (402) 으로 되돌아간다. 또한, 추가 실시형태에서는 컴퓨팅 디바이스의 사용자가 컴퓨팅 디바이스에 의해 응답을 바라는 것을 표시하는 아날로그 또는 디지털 표현과 디지털화된 오디오 스트림을 비교하는 것을 포함한다. 또한 추가 실시형태에서, 동작들 (402, 404, 406 및 408) 은 동시에 발생한다. 예를 들어, 컴퓨팅 디바이스가 동작 (408) 에서 디지털화된 오디오 스트림을 분석한다면, 집적 회로는 동작 (402) 에서 오디오 스트림을 수신하고, 동작 (404 및 406) 에서 이 오디오 스트림을 디지털화하고 저장하는 것을 포함한다.

동작 (410) 에서, 저전력 집적 회로는 전력을 증가시키기 위한 신호를 프로세서로 송신한다. 구체적으로, 디지털화된 오디오 스트림 내에서 키워드를 인식하면, 저전력 집적 회로는 전력을 증가시키기 위한 신호를 프로세서로 송신한다. 동작 (410) 의 실시형태에서, 프로세서는 프로세서 및/또는 컴퓨팅 디바이스로 전달된 전력 또는 전기 에너지를 증가시킨다.

동작 (412) 에서, 프로세서는 동작 (406) 에서 메모리로부터 저장된 디지털화된 오디오 스트림을 획득한다. 동작 (412) 의 일 실시형태에서, 메모리는 디지털화된 오디오 스트림을 프로세서로 송신하고, 동작 (412) 의 또 다른 실시형태에서, 프로세서는 메모리로부터 디지털화된 오디오 스트림을 취출한다.

동작 (414) 에서, 프로세서는 동작 (412) 에서 획득된 디지털화된 오디오 스트림을 텍스트 스트림으로 변환한다. 디지털화된 오디오 스트림을 텍스트 스트림으로 변환한 후, 프로세서가 텍스트 스트림 내의 텍스트를 분석하여 적절한 응답을 결정한다. 동작 (414) 의 실시형태들은 스피치 투 텍스트 (STT), 보이스 투 텍스트, 디지털 투 텍스트 또는 다른 유형의 텍스트 변환을 사용하는 것을 포함한다. 동작 (414) 의 추가 실시형태는 텍스트 스트림으로의 변환 후 자연어 처리을 사용하는 것을 포함한다. 본 실시형태에서, 컴퓨팅 디바이스는 텍스트 스트림 내의 텍스트를 처리하여 동작 (402) 에서 수신된 오디오 스트림의 컨텍스트에 기초하여 적절한 응답을 결정한다. 예를 들어, 408에서 디지털화된 오디오 스트림 내에서 키워드를 검출하면, 프로세서가 동작 (412) 에서 획득하고 디지털화된 오디오 스트림이 동작 (414) 에서 텍스트 스트림으로 변환된다. 추가 예에서, 오디오 스트림은 2 개의 위치 사이의 디렉션들에 관한 대화를 포함할 수도 있으며, 따라서 이런 디지털화된 오디오 스트림이 동작 (412) 에서 텍스트 스트림으로 변환되면, 프로세서가 텍스트 스트림 내의 텍스트를 분석함으로써 적절한 응답을 결정할 수 있다.

동작 (416) 에서, 프로세서는 동작 (414) 에서 생성된 텍스트 스트림에 기초하여 응답을 결정한다. 응답의 실시형태들은, 웹 서치의 수행, 전화 번호의 다이얼링, 어플리케이션의 오픈, 텍스트의 기록, 미디어의 스트리밍, 텍스트 메시지의 작성, 디렉션들의 리스트 작성 또는 디렉션들의 스피킹을 포함한다. 일 실시형태에서, 텍스트 스트림 내의 텍스트는 프로세서에 대한 적절한 응답을 표시한다. 추가 실시형태에서, 응답은 컴퓨팅 디바이스의 사용자에게 렌더링된다. 예를 들어, 텍스트 스트림은 중국에 도착하는 방법을 문의하는 스피치를 포함할 수도 있으며, 중국으로의 그런 디렉션들이 적절한 응답이 된다. 게다가, 본 예에서, 중국으로의 디렉션들을 리스트 작성 및/또는 스피킹하는 맵 디스플레이가 포함될 수도 있다.

이제, 디지털화된 오디오 스트림을 압축하고 컴퓨팅 디바이스의 사용자에게 응답을 렌더링하기 위해 컴퓨팅 디바이스 상에서 수행된 일 예의 방법의 플로우챠트인, 도 5를 참조한다. 도 5는 상기 도 3에서와 같이 컴퓨팅 디바이스 (300) 상에서 수행되는 것으로 기재되지만, 당업자에게 자명하게 되는 바와 같은 다른 적절한 컴포넌트들 상에서 또한 실행될 수도 있다. 예를 들어, 도 5는 메모리 (312) 와 같은 머신 판독가능 저장 매체 상에서 실행가능한 명령들의 형태로 구현될 수도 있다.

동작 (502) 에서, 컴퓨팅 디바이스는 디지털화된 오디오 스트림을 압축한다. 일 실시형태에서, 동작 (502) 은 도 4에서의 동작 (406) 이전의 동작 (404) 과 함께 수행된다. 예를 들어, 수신된 오디오 스트림을 디지털화하면, 컴퓨팅 디바이스와 함께 저전력 집적 회로 동작이 디지털화된 오디오 스트림을 압축하여 스트림의 데이터 바이트 크기를 감소시킬 수도 있다. 본 예에서, 디지털화된 오디오 스트림의 압축은 동작 (406) 에서 메모리에 저장되기 전에 발생한다. 추가 실시형태에서, 동작 (502) 은 도 4에서의 동작 (412) 에서 디지털화된 오디오 스트림을 수신하기 전에 수행된다. 예를 들어, 프로세서는 동작 (502) 을 수행하여 메모리로부터 디지털화된 오디오 스트림을 압축할 수도 있으며, 또 다른 예에서는, 프로세서가 디지털화된 오디오 스트림을 획득하기 전에 메모리가 디지털화된 오디오 스트림을 압축할 수도 있다. 또한, 동작 (502) 의 추가 실시형태에서, 압축된 디지털화된 오디오 스트림은 도 4의 동작 (408) 에서와 같이 키워드를 인식하기 위해 분석된다.

동작 (504) 에서, 컴퓨팅 디바이스는 컴퓨팅 디바이스의 사용자에게 응답을 렌더링한다. 동작 (504) 의 실시형태들은 도 4에서의 동작 (416) 동안 또는 이후에 발생하는 것을 포함한다. 예를 들어, 프로세서가 적절한 응답을 결정하면, 이 응답은 컴퓨팅 디바이스의 사용자에게 렌더링될 수도 있다. 추가 실시형태에서, 응답은 컴퓨팅 디바이스와 함께 동작하는, 디스플레이 스크린 또는 스피커와 같은 출력 장치 상에서 사용자에게 렌더링될 수도 있다. 예를 들어, 사용자가 쉬림프와 프라운 사이의 차이를 논의할 때, 프로세서는 웹 서치 어플리케이션을 론칭할 수도 있으며, 이에 따라 쉬림프와 프라운 사이의 차이에 대한 웹 서치를 수행한다. 수행된 웹 서치는 컴퓨팅 디바이스의 디스플레이 상에서 사용자에게 렌더링 될 수도 있다. 추가 예에서, 컴퓨팅 디바이스는 스피커를 통해 사용자에게 쉬림프와 프라운 사이의 차이들을 가청으로 열거한다. 이 실시형태들에서, 컴퓨팅 디바이스는 사용자가 컴퓨팅 디바이스에 명령하는 대신 응답을 결정하기 위해 오디오 스트림과 동작한다.

본 명세서에 상세하게 기재된 실시형태들은 키워드를 검출하기 위해 그리고 디지털화된 오디오 스트림 내에서 키워드의 인식에 기초하여 오디오 스트림을 디지털화하고, 전력을 증가시키기 위한 신호를 프로세서에 송신하며, 또한 응답을 결정하기 위해 디지털화된 오디오 스트림을 분석하는 것과 관련된다. 이러한 방식으로, 예시의 실시형태들은 컴퓨팅 디바이스의 전력 소모를 감소시키면서, 컴퓨팅 디바이스로의 반복적인 오디오 명령들을 방지함으로써 사용자 시간을 절약한다.

Claims

디지털화된 오디오 스트림을 분석하는 방법.