KR20180137041A - 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로 - Google Patents

디지털화된 오디오 스트림을 분석하는 저전력 집적 회로 Download PDF

Info

Publication number
KR20180137041A
KR20180137041A KR1020187036622A KR20187036622A KR20180137041A KR 20180137041 A KR20180137041 A KR 20180137041A KR 1020187036622 A KR1020187036622 A KR 1020187036622A KR 20187036622 A KR20187036622 A KR 20187036622A KR 20180137041 A KR20180137041 A KR 20180137041A
Authority
KR
South Korea
Prior art keywords
audio stream
digitized audio
processor
integrated circuit
digitized
Prior art date
Application number
KR1020187036622A
Other languages
English (en)
Inventor
에릭 리우
슈테판 제이 마르티
승욱 김
Original Assignee
퀄컴 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=48574720&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=KR20180137041(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by 퀄컴 인코포레이티드 filed Critical 퀄컴 인코포레이티드
Publication of KR20180137041A publication Critical patent/KR20180137041A/ko

Links

Images

Classifications

    • G10L15/265
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/3293Power saving characterised by the action undertaken by switching to a less power-consuming processor, e.g. sub-CPU
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/285Memory allocation or algorithm optimisation to reduce hardware requirements
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/50Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate

Abstract

예시들은 오디오 스트림을 수신하고 디지털화하기 위해 저전력 집적 회로를 개시한다. 또한, 예시들은 디지털화된 오디오 스트림을 키워드와 비교하고 디지털화된 오디오 스트림을 메모리에 저장하기 위해 저전력 집적 회로를 제공한다. 게다가, 예시들은 또한 디지털화된 오디오 스트림에서 키워드를 인식하면, 저전력 집적 회로는 전력을 증가시키기 위한 신호를 프로세서에 송신하고 디지털화된 오디오 스트림을 분석한다.

Description

디지털화된 오디오 스트림을 분석하는 저전력 집적 회로 {LOW POWER INTEGRATED CIRCUIT TO ANALYZE A DIGITIZED AUDIO STREAM}
컴퓨팅 디바이스들은 오디오 명령들을 처리하고 응답들을 제공함으로써 사용자들에게 전문성을 높이고 있다. 사용자들은 이런 컴퓨팅 디바이스들을 제어하기 위해 사용될 수도 있는 오디오 명령들을 열거할 수 있다. 예를 들어, 사용자들은 특정 위치에 디렉션들을 제공하는 명령들과 같은 정보를 제공하기 위해 컴퓨팅 디바이스들에게 말할 수 있다.
첨부 도면들에서, 같은 번호들은 같은 컴포넌트들 또는 블록들을 지칭한다. 다음의 상세한 설명은 이 도면들을 참조한다.
도 1은 오디오 스트림을 분석하는 저전력 집적 회로 및 집적 회로에 의한 키워드의 검출에 응답하여 디지털화된 오디오 스트림을 분석하는 프로세서를 포함하는 일 예의 컴퓨팅 디바이스의 블록 다이어그램이다.
도 2는 오디오 스트림을 분석하고 오디오 스트림에서 키워드가 검출될 때 전력을 증가시키기 위한 신호를 프로세서로 송신하기 위한 일 예의 저전력 집적 회로의 블록 다이어그램이다.
도 3은 디지털화된 오디오 스트림을 분석하는 일 예의 컴퓨팅 디바이스 및 디지털화된 오디오 스트림으로부터 생성된 텍스트 스트림을 분석하기 위해 컴퓨팅 디바이스와 통신하는 서버의 블록 다이어그램이다.
도 4는 오디오 스트림을 수신하고 응답을 결정하기 위해 컴퓨팅 디바이스 상에서 수행되는 일 예의 방법의 플로우챠트이다.
도 5는 디지털화된 오디오 스트림을 압축하고 응답을 렌더링하기 위해 컴퓨팅 디바이스 상에서 수행되는 일 예의 방법의 플로우챠트이다.
오디오 정보 처리에서, 사용자는 보통 버튼을 누르고 및/또는 명령들을 열거함으로써 오디오를 처리하는 어플리케이션을 작동시킨다. 오디오 처리 어플리케이션을 론칭하면, 사용자는 부가적으로 컴퓨팅 디바이스가 수행하기를 원하는 명시적 명령들을 열거하여야 한다. 따라서, 사용자로부터의 스피치 명령들을 처리하는 것은 시간 소모적이고 반복적일 수 있다. 게다가, 사용자로부터의 명령들에 대해 연속적으로 모니터링하는 것은 더 많은 전력을 소모하여 배터리를 방전시킨다.
이러한 이슈들을 해결하기 위해, 본 명세서에 개시된 예시의 실시형태들은 저전력 집적 회로를 사용하여 사용자의 스피치의 더 완전한 분석을 위해 프로세서에 의존하면서, 오디오 스트림 (예를 들어, 사용자의 스피치) 에서 키워드의 발생에 대해 연속적으로 모니터링한다. 예를 들어, 본 명세서에 개시된 다양한 예들은 저전력 집적 회로에서 오디오 스트림을 수신하고, 오디오 스트림을 디지털화하고, 디지털화된 오디오 스트림을 분석하여 키워드를 인식하는 것을 제공한다. 디지털화된 오디오 스트림 내에서 키워드를 인식하면, 집적 회로는 전력을 증가시키기 위한 신호를 프로세서에 전송한다. 프로세서에 대한 전력을 증가시키면, 디지털화된 오디오 스트림이 취출되어 응답을 결정한다. 이것은 사용자가 특정 오디오 처리 어플리케이션을 론칭하는데 소모된 시간 량을 감소시키고 사용자의 스피치의 반복을 방지한다. 취출된 오디오 스트림으로부터의 응답의 결정은 사용자가 스피치 분석을 수행하기 위해 컴퓨팅 디바이스에 부가적인 명시적 명령들을 제공하는 것을 방지한다.
게다가, 본 명세서에 개시된 다양한 예들에서, 프로세서에 대한 전력을 증가시키면, 프로세서는 메모리로부터 디지털화된 오디오 스트림을 취출하고 디지털화된 오디오 스트림을 텍스트 스트림으로 변환한다. 텍스트 스트림으로 변환한 후, 프로세서는 텍스트 스트림 내의 텍스트에 기초하여 응답을 결정한다. 텍스트 스트림으로부터의 응답의 결정은 컴퓨팅 디바이스의 사용자가 컴퓨팅 디바이스에 명령하는 시간을 감소시킨다. 게다가, 프로세서는 오디오 스트림의 컨텍스트에 기초하여 적절한 응답을 또한 결정할 수도 있다. 또한, 컴퓨팅 디바이스는 사용자에게 응답을 충족시키기 위해 어플리케이션이 실행하여야 하는 것을 결정한다. 게다가, 프로세서에 대한 전력을 증가시킴으로써, 디지털화된 오디오 스트림 내에서 키워드를 인식하면, 컴퓨팅 디바이스는 또한 사용자의 스피치를 청취하는 동안 적은 전력을 소모한다.
일 실시형태에서, 컴퓨팅 디바이스는 서버로부터 또는 프로세서로부터 응답을 수신함으로써 응답을 또한 결정할 수도 있다. 추가 실시형태에서, 메모리는 소정의 시간 기간 동안 저장된 디지털화된 오디오 스트림을 유지한다. 이 실시형태에서, 프로세서는 시간 증분들에서 디지털화된 오디오 스트림을 취출할 수 있다. 예를 들어, 프로세서는 완전한 디지털화된 오디오 스트림을 취출할 수도 있고 또는 디지털화된 오디오 스트림의 짧은 시간 간격을 취출할 수도 있다. 디지털화된 오디오 스트림의 취출은 프로세서가 적절한 응답을 결정하기 위해 오디오 스트림의 컨텍스트를 분석하도록 한다.
이러한 방식으로, 본 명세서에 개시된 예시의 실시형태들은, 컴퓨팅 디바이스가 오디오 스트림의 컨텍스트에 기초하여 적절한 응답을 결정하기 때문에, 컴퓨팅 디바이스로의 반복적인 오디오 명령들을 방지함으로써 사용자 시간을 절약한다. 또한, 컴퓨팅 디바이스는 오디오 스트림을 수신하고 처리하는 동안 적은 전력을 소모한다.
이제 도면들을 참조하면, 도 1은 오디오 스트림 (102) 을 수신하는 저전력 집적 회로 (104), 및 메모리 (112) 에 디지털화된 오디오 스트림 (114) 을 제공하기 위해 오디오 스트림을 디지털화하는 디지털화 모듈 (106) 을 포함하는 일 예의 컴퓨팅 디바이스 (100) 의 블록 다이어그램이다. 또한, 저전력 집적 회로 (104) 는 디지털화된 오디오 스트림 (114) 을 키워드와 비교하는 키워드와의 비교 모듈 (108) 을 포함하고, 키워드의 인식에 기초하여, 전력 (122) 을 증가시키기 위해 프로세서 (118) 에 신호 (116) 를 송신한다. 또한, 프로세서는 디지털화된 오디오 스트림 (114) 을 분석하는 분석 모듈 (120) 을 더 포함한다. 컴퓨팅 디바이스 (100) 의 실시형태들은, 클라이언트 디바이스, 개인 컴퓨터, 데스크탑 컴퓨터, 랩탑, 이동 디바이스 또는 컴포넌트들 (104, 112, 및 118) 을 포함하기에 적절한 다른 컴퓨팅 디바이스를 포함한다.
오디오 스트림 (102) 은 컴퓨팅 디바이스 (100), 구체적으로 저전력 집적 회로 (104) 에 의해 수신된다. 오디오 스트림 (102) 은 디지털화된 오디오 스트림 (114) 을 제공하기 위해 디지털화되는 (106) 입력 아날로그 신호이다. 오디오 스트림 (102) 의 실시형태들은 또 다른 컴퓨팅 디바이스로부터의 오디오 또는 사용자로부터의 스피치를 포함한다. 예를 들어, 혼동할 수도 있는, 오디오 스트림들 (102) 을 수신하는 몇몇 컴퓨팅 디바이스들 (300) 이 있을 수도 있다. 이로써, 컴퓨팅 디바이스들은 오디오 스트림 (102) 을 수신하기 위해 하나의 디바이스를 중심점으로서 지정할 수도 있다. 본 실시형태에서, 저전력 집적 회로 (104) 는 하나 이상의 컴퓨팅 디바이스들의 중앙 유닛일 수도 있는 애드-혹 (ad-hoc) 네트워크의 부분으로서 동작한다.
예를 들어, 사용자는 뉴욕에서 캘리포니아 로스앤젤레스까지의 최단 경로를 다른 사람과 논의할 수도 있다. 본 예에서, 오디오 스트림은 뉴욕에서 로스앤젤레스까지의 최단 경로의 논의일 것이다. 추가 실시형태에서, 오디오 스트림 (102) 은 미리 결정된 시간 기간 동안 오디오를 포함할 수도 있다. 예를 들어, 오디오 스트림 (102) 은 저전력 집적 회로 (104) 에 의해 수신될 때 몇 초 또는 몇분을 포함할 수도 있다. 본 예에서, 저전력 집적 회로 (104) 는 오디오 스트림 (102) 을 다른 오디오 스트림들 (102) 과 구별할 수도 있다.
저전력 집적 회로 (104) 는 오디오 스트림 (102) 을 디지털화하는 모듈 (106) 및 디지털화된 오디오 스트림 (114) 을 키워드와 비교하는 모듈 (108) 을 포함한다. 저전력 집적 회로 (104) 는 다른 전자 컴포넌트들 사이의 상호 접속들을 형성하는 재료의 표면 상의 패터닝된 트레이스 (trace) 엘리먼트들을 갖는 전자 회로이다. 예를 들어, 저전력 집적 회로 (104) 는 프로세서 (118) 와 메모리 (112) 사이에서 접속들을 형성한다. 저전력 집적 회로 (104) 의 실시형태들은, 마이크로칩, 칩셋, 전자 회로, 칩, 마이크로프로세서, 반도체, 마이크로제어기, 또는 오디오 스트림 (102) 을 수신하고 신호 (116) 를 송신할 수 있는 다른 전자 회로를 포함한다. 저전력 집적 회로 (104) 는 오디오 스트림 (102) 을 연속적으로 모니터링하고, 디지털화 모듈 (106) 을 사용하여 오디오 스트림을 디지털화하고, 디지털화된 오디오 스트림을 메모리 (112) 에 저장할 수도 있다. 이로써, 저전력 집적 회로 (104) 의 추가 실시형태들은, 송신기, 수신기, 마이크로폰, 또는 오디오 스트림 (102) 을 수신하는 다른 적절한 컴포넌트를 포함한다.
오디오 스트림은 디지털화된 오디오 스트림 (114) 을 제공하기 위해 모듈 (106) 에서 디지털화된다 디지털화 모듈 (106) 은 오디오 스트림을 이산 시간 신호 표현으로 변환한다. 디지털화 모듈 (106) 의 실시형태들은, 저전력 집적 회로 (104) 와 함께 동작하는 아날로그 디지털 컨버터 (ADC), 디지털 변환 디바이스, 명령, 펌웨어 및/또는 소프트웨어를 포함한다. 예를 들어, 디지털화 모듈 (106) 은 아날로그 신호의 크기에 비례하여 입력 아날로그 전압을 디지털 숫자로 변환하는 전자 디바이스를 포함할 수도 있다.
오디오 스트림 (102) 이 모듈 (106) 에서 디지털화되면, 그것은 모듈 (108) 에서 키워드와 비교된다. 오디오 스트림 (102) 은, 전력 (122) 을 증가시키고 디지털화된 오디오 스트림 (114) 을 획득하여 모듈 (120) 에서 분석하기 위해 신호 (116) 에 대한 표시로서 프로세서 (118) 를 동작시키는 키워드에 대해 모듈 (108) 에서 비교된다. 108의 실시형태들은, 명령, 프로세스, 동작, 로직, 알고리즘, 테크닉, 논리 함수, 펌웨어 및/또는 소프트웨어를 포함한다. 키워드가 인식되면, 저전력 집적 회로 (104) 는 전력 (122) 을 증가시키기 위해 프로세서 (118) 로 신호 (116) 를 송신한다.
키워드의 실시형태들은, 디지털 신호, 아날로그 신호, 패턴, 데이터베이스, 커맨드들, 디렉션들, 명령들, 또는 모듈 (108) 에서 비교하는 다른 표현들을 포함한다. 예를 들어, 컴퓨팅 디바이스의 사용자는 친구와 쉬림프 (shrimp) 와 프라운 (prawn) 사이의 차이를 논의할 수도 있고, 이어서 대답을 식별하기 위해 웹 서치를 수행하기를 바랄 수도 있다. 이로써, 사용자는 키워드와의 비교 모듈 (108) 에 의한 키워드의 인식 및 분석 모듈 (120) 에 의한 이전 논의의 후속 분석을 트리거하기 위해 미리 결정된 키워드를 언급할 수도 있다.
키워드는, 예를 들어 구절, 단일 키워드, 또는 컴퓨팅 디바이스의 사용자에게 사적인 단일 키워드를 포함할 수도 있다. 이전의 예를 유지하는데 있어서, 키워드가 구절, "컴퓨터야, 무슨 생각하니?" 일 수도 있다. 이 예에 있어서, 구절은 저전력 집적 회로 (104) 로 하여금 프로세서 (118) 로 신호 (116) 를 전송하여 구절 이전 또는 이후에 오디오를 포함할 수도 있는 디지털화된 오디오 스트림 (114) 을 획득하게 한다. 따라서, 사용자는 명령을 반복할 필요가 없게 되는데, 이는 프로세서 (118) 가 디지털화된 오디오 스트림 (114) 을 분석하여 적절한 응답에 대한 오디오 스트림 (102) 의 컨텍스트를 결정하기 때문이다. 또한, 추가 예에서, 단일 키워드가 "샤잠 (Shazam)" 을 포함할 수도 있다. 이와 같이, 특정 예로서, 사용자가 단어 "샤잠" 을 말할 때, 회로 (104) 는 키워드를 검출하고 신호 (116) 를 송신하여 디지털화된 오디오 스트림 (114) 을 획득하고 그 스트림을 텍스트 스트림으로 변환하도록 프로세서 (118) 에 명령할 수도 있다. 텍스트 스트림이 텍스트 메시지를 사용자의 어머니에게 작성하는 명령이라고 상정하면, 적절한 응답이 텍스트 메시지를 작성하게 될 것이다. 따라서, 상기 기재된 바와 같이, 미리 결정된 키워드 (들) 을 사용하여, 저전력 집적 회로 (104) 는 컴퓨팅 디바이스의 사용자가 웹 서치를 수행하거나 디렉션들과 같은 추가 응답을 완성할 필요가 있을 때를 인식한다.
모듈 (108) 의 추가 실시형태에서, 디지털화된 오디오 스트림 (114) 내에서 인식되는 키워드가 없을 때, 저전력 집적 회로 (104) 는 모듈 (106) 에서 디지털화되고 메모리 (112) 에 저장되는 또 다른 오디오 스트림 (102) 에 대한 모니터링을 계속한다. 또한 추가 실시형태에서, 저전력 집적 회로 (104) 는 디지털화된 오디오 스트림 (114) 을 압축하고, 이 압축된 디지털화된 오디오 스트림은 모듈 (108) 에서 키워드와 비교함으로써 키워드를 인식하기 위해 사용된다.
메모리 (112) 는 디지털화된 오디오 스트림 (114) 을 저장 및/또는 유지한다. 메모리 (112) 의 실시형태들은, 메모리 버퍼, 캐시, 비휘발성 메모리, 휘발성 메모리, 랜덤 액세스 메모리 (RAM), 전기적 소거가능 프로그램가능 리드 온니 메모리 (EEPROM), 저장 드라이브, 컴팩 디스크 ROM (CDDROM), 또는 디지털화된 오디오 스트림 (114) 을 저장 및/또는 유지할 수 있는 다른 메모리를 포함할 수도 있다.
디지털화된 오디오 스트림 (114) 은 메모리 (112) 에 저장된다. 실시형태들은 메모리 (112) 에서의 배치 이전에 압축된 디지털화된 오디오 스트림을 획득하기 위해 디지털화 모듈 (106) 이후에 오디오 스트림 (102) 을 압축하는 저전력 집적 회로 (104) 를 포함할 수도 있다. 도 1은 메모리 (112) 에 저장된 디지털화된 오디오 스트림 (114) 을 도시하지만, 디지털화된 오디오 스트림은 또한 저전력 집적 회로 (104) 상의 메모리에 저장될 수도 있다. 추가 실시형태에서, 디지털화된 오디오 스트림 (114) 은 오디오 스트림 (102) 의 미리 결정된 시간 양을 포함한다. 본 실시형태에서, 오디오 스트림 (102) 이, 몇 초 또는 몇 분과 같이 미리 결정된 시간 기간 동안 수신되면, 이런 오디오 스트림 (102) 의 미리 결정된 시간 기간이 디지털화되고 획득 및/또는 취출을 위해 프로세서 (118) 에 대하여 메모리 (112) 에 저장된다. 또한, 본 실시형태에서, 또 다른 오디오 스트림 (102) 이 저전력 집적 회로 (104) 에 의해 수신되고 디지털화될 때, 메모리에서 이전의 디지털화된 오디오 스트림이 최신의 디지털화된 오디오 스트림 (114) 으로 교체된다. 따라서, 프로세서 (118) 는 가장 최신의 오디오 스트림 (102) 을 획득 및/또는 취출한다. 본 실시형태에서, 메모리는 가장 최신의 오디오 스트림 (102) 을 제공하기 위해 선입 선출 버퍼로서 동작한다.
디지털화된 오디오 스트림 (114) 내에서 키워드를 인식하면 신호 (116) 가 저전력 집적 회로 (104) 로부터 프로세서 (118) 로 송신된다. 신호 (116) 는 전력 (122) 을 증가시키고 메모리 (112) 로부터 디지털화된 오디오 스트림 (114) 을 분석하도록 프로세서 (118) 에 명령한다. 신호 (116) 의 실시형태들은, 통신, 송신, 전기 신호, 명령, 디지털 신호, 아날로그 신호 또는 프로세서 (118) 에 대한 전력 (122) 을 증가시키는 통신의 다른 유형을 포함한다. 신호 (116) 의 추가 실시형태는 디지털화된 오디오 스트림 (114) 내에서 키워드를 인식하면 프로세서 (118) 에 송신된 인터럽트 (interrupt) 를 포함한다.
프로세서 (118) 는 전력 (122) 을 증가시키기 위해 신호 (116) 를 수신하고 디지털화된 오디오 스트림 (114) 을 획득하여 모듈 (120) 에서 분석한다. 프로세서 (118) 의 실시형태들은, 중앙 처리 유닛 (CPU), 비주얼 처리 유닛 (VPU), 마이크로프로세서, 그래픽스 처리 유닛 (GPU) 또는 디지털화된 오디오 스트림 (114) 을 분석 (120) 하기에 적절한 다른 프로그램가능 디바이스를 포함할 수도 있다.
프로세서 (118) 가 메모리 (112) 로부터 디지털화된 오디오 스트림 (114) 을 획득하면, 프로세서는 모듈 (120) 에서 디지털화된 오디오 스트림 (114) 을 분석한다. 분석 모듈 (120) 의 실시형태들은, 프로세서 (118) 가 페치, 디코딩 및/또는 실행할 수도 있는, 명령, 프로세스, 동작, 로직, 알고리즘, 테크닉, 논리 함수, 펌웨어 및/또는 소프트웨어를 포함한다. 모듈 (120) 의 부가적인 실시형태들은, 오디오 스트림 (102) 의 컨텍스트에 기초하여 적절한 응답을 결정하기 위해 디지털화된 오디오 스트림 (114) 을 텍스트 스트림으로 변환하는 것을 포함한다. 모듈 (120) 의 추가 실시형태들은, 이후 도면들에서 보여지게 되는 바와 같이 컴퓨팅 디바이스 (100) 의 사용자에게 렌더링하기 위해 응답을 결정하는 것을 포함한다.
전력 (122) 은 전기적 포텐셜의 형태로 전기 에너지를 프로세서 (118) 에 공급한다. 특히, 전력 (122) 은, 저전력 집적 회로 (104) 로부터 신호 (116) 를 수신하면, 프로세서 (118) 에 대한 전기적 에너지를 증가시킨다. 프로세서 (118) 에 대한 전력 (122) 의 증가는, 프로세서 (118) 를 웨이크 (wake) 또는 트리거 (trigger) 하여 디지털화된 오디오 스트림 (114) 을 획득한다. 전력 (122) 의 실시형태들은, 전력 공급부, 전력 관리 디바이스, 배터리, 에너지 저장소, 일렉트로메커니컬 시스템, 태양열 발전, 전력 플러그 또는 프로세서 (118) 에 전력 (122) 을 전달할 수 있는 다른 디바이스를 포함한다. 추가 실시형태에서, 전력 (122) 은 컴퓨팅 디바이스 (100) 에 전기 에너지를 공급한다.
이제, 오디오 스트림 (202) 에서 키워드가 검출될 때, 오디오 스트림 (202) 을 분석하고 전력을 증가시키기 위한 신호 (216) 를 프로세서로 송신하는 일 예의 저전력 집적 회로 (204) 의 블록 다이어그램인, 도 2를 참조한다. 저전력 집적 회로 (204) 는 디지털화 회로 (206) 를 사용하여 디지털화된 오디오 스트림 (214) 을 생성하고 비교 회로 (208) 에 의해 키워드를 검출하는 회로 (210) 를 포함하고, 디지털화된 오디오 스트림 (214) 에서 키워드를 인식하면, 신호 (216) 를 송신한다.
오디오 스트림 (202) 은 저전력 집적 회로 (204) 에 의해 수신된다. 오디오 스트림 (202) 은 도 1의 오디오 스트림 (102) 에 대한 구조와 유사할 수도 있다.
저전력 집적 회로 (204) 는 오디오 스트림 (202) 을 디지털화하고 디지털화된 오디오 스트림 (214) 을 키워드와 비교하는 회로 (210) 를 포함한다. 저전력 집적 회로 (204) 는 상기 도 1에서와 같은 저전력 집적 회로 (104) 의 기능 및 구조와 유사할 수도 있다.
회로 (210) 는 디지털화 회로 (206) 및 비교 회로 (208) 를 포함한다. 회로 (210) 의 실시형태들은 로직, 아날로그 회로, 전자 회로, 디지털 회로, 또는 오디오 스트림 (202) 을 디지털화하고 디지털화된 오디오 스트림 (214) 을 키워드와 비교할 수 있는 다른 회로를 포함한다. 추가 실시형태들에서, 회로는 독립적으로 사용될 수도 있고 그리고/또는 회로 (206 및 208) 를 패치, 디코딩, 및/또는 실행하기 위해 저전력 집적 회로 (204) 와 함께 사용될 수도 있는 어플리케이션 및/또는 펌웨어를 포함한다.
오디오 스트림 (202) 은 회로 (206) 에 의해 수신되고 디지털화되어 디지털화된 오디오 스트림 (214) 을 생성한다. 디지털화 회로 (206) 는 오디오 스트림 (202) 에 대한 변환의 일 유형이다. 또한, 디지털화 회로 (206) 는 도 1과 관련하여 기재된 바와 같은 디지털화 모듈 (106) 의 기능과 유사할 수도 있다.
저전력 집적 회로 (204) 는 오디오 스트림 (202) 을 수신하여 회로 (206) 에서 디지털화하고 디지털화된 오디오 스트림 (214) 을 생성한다. 디지털화된 오디오 스트림 (214) 은 도 1과 관련하여 기재된 바와 같은 디지털화된 오디오 스트림 (114) 에 대한 구조와 유사할 수도 있다. 게다가, 도 2가 저전력 집적 회로 (204) 의 외측에 디지털화된 오디오 스트림 (214) 을 도시하지만, 디지털화된 오디오 스트림 (214) 은 또한 저전력 집적 회로 (204) 내에 위치될 수도 있다. 저전력 집적 회로 (204) 내에 위치된 디지털화된 오디오 스트림 (214) 은 회로 (208) 에서 키워드와 비교하기 위해 사용된다. 또 다른 실시형태에서, 디지털화된 오디오 스트림 (214) 은 메모리에 저장 및/또는 유지된다.
저전력 집적 회로 (204) 의 회로 (210) 에 포함된 회로 (208) 는, 디지털화된 오디오 스트림 (214) 을 키워드와 비교한다. 또한, 208은 디지털화된 오디오 스트림 (214) 내에서 키워드를 인식하는데 사용되어 프로세서에 대한 전력을 증가시키기 위한 신호 (216) 를 송신한다. 비교 회로 (208) 는 도 1과 관련하여 기재된 바와 같은 모듈 (108) 에 대한 기능과 유사할 수도 있다.
신호 (216) 는 비교 회로 (208) 에 의해 디지털화된 오디오 스트림 (214) 내의 키워드를 인식하면 전력을 증가시키도록 디바이스에 명령한다. 신호 (216) 는 도 1의 신호 (116) 에 대한 구조 및 기능과 유사할 수도 있다. 신호 (216) 의 실시형태는 전력을 증가시키고 메모리로부터 디지털화된 오디오 스트림 (214) 을 분석하도록 프로세서에 명령하는 것을 포함한다. 본 실시형태에서, 신호 (216) 는 디지털화된 오디오 스트림 (214) 을 획득하여 회로 (208) 에서 키워드 인식에 기초하여 응답을 분석하고 결정하도록 프로세서에 명령한다.
도 3은 디지털화된 오디오 스트림 (314) 을 분석하는 일 예의 컴퓨팅 디바이스 (300) 및 디지털화된 오디오 스트림 (314) 으로부터 생성된 텍스트 스트림 (324) 을 분석하기 위해 컴퓨팅 디바이스 (300) 와 통신하는 서버 (326) 의 블록 다이어그램이다. 컴퓨팅 디바이스 (300) 는 저전력 집적 회로 (304), 메모리 (312), 프로세서 (318), 출력 디바이스 (328) 및 서버 (326) 를 포함한다. 구체적으로, 도 3은 출력 디바이스 (328) 상의 컴퓨팅 디바이스의 사용자에게 응답을 렌더링하기 위해 서버 (326) 또는 프로세서 (318) 에 의해 처리된 텍스트 스트림 (324) 을 도시한다. 컴퓨팅 디바이스 (300) 는 도 1과 관련하여 기재된 바와 같은 컴퓨팅 디바이스 (100) 의 구조 및 기능과 유사할 수도 있다.
오디오 스트림 (302) 은 컴퓨팅 디바이스 (300), 구체적으로 저전력 집적 회로 (304) 에 의해 수신된다. 오디오 스트림 (302) 은, 도 1 및 도 2에서 오디오 스트림 (102 및 202) 에 대한 구조와 각각 유사할 수도 있다.
저전력 집적 회로 (304) 는 디지털화 모듈 (306) 및 분석 모듈 (308) 을 포함한다. 일 실시형태에서, 저전력 집적 회로 (304) 는 모듈 (306 및 308) 을 구비하는 회로를 포함한다. 저전력 집적 회로 (304) 는, 도 1 및 도 2와 관련하여 기재된 저전력 집적 회로 (104 및 204) 의 구조 및 기능과 각각 유사할 수도 있다.
컴퓨팅 디바이스 (300) 에 의해 일단 수신된 오디오 스트림 (302) 은 디지털화되어 (306) 디지털화된 오디오 스트림 (314) 을 생성한다. 디지털화 모듈 (306) 은 도 1 및 도 2에서의 디지털화 모듈 (106) 및 디지털화 회로 (206) 에 대한 구조 및 기능과 각각 유사할 수도 있다. 추가 실시형태에서, 오디오 스트림 (302) 이 모듈 (306) 에서 디지털화되면, 저전력 집적 회로 (304) 는 저장 및/또는 유지를 위해 디지털화된 오디오 스트림 (314) 을 메모리 (312) 에 송신한다.
오디오 스트림 (302) 이 디지털화되면, 저전력 집적회로는 모듈 (308) 에서 디지털화된 오디오 스트림 (314) 을 분석한다. 일 실시형태에서, 모듈 (308) 은 디지털화된 오디오 스트림 (314) 과 키워드를 비교한다. 본 실시형태에서, 308은 상기 도 1에서와 같은 비교 모듈 (108) 의 기능을 포함한다.
메모리 (312) 는 저전력 집적 회로 (304) 로부터 디지털화된 오디오 스트림 (314) 을 저장한다. 일 실시형태에서, 메모리 (312) 는 미리 결정된 시간 기간 동안 수신된 디지털화된 오디오 스트림 (314) 을 유지한다. 예를 들어, 오디오 스트림 (302) 은 몇 초의 미리 결정된 시간 동안 모니터링될 수도 있으며, 이로써 이런 오디오 스트림 (302) 의 몇 초가 모듈 (306) 에서 디지털화되고 메모리 (312) 로 전송된다. 이 예에서, 메모리 (312) 는 프로세서 (318) 에 의해 취출 및/또는 획득되는 몇 초의 디지털화된 오디오 스트림 (314) 을 저장하여, 신호 (316) 를 수신하면 분석한다. 또한, 이 예에서, 또 다른 몇 초의 오디오 스트림 (302) 이 수신되고 디지털화될 때, 이런 다른 디지털화된 오디오 스트림 (314) 이 이전의 디지털화된 오디오 스트림 (314) 을 교체한다. 이것은 메모리 (312) 가 획득 및/또는 취출을 위해 프로세서 (318) 에 대한 가장 최신의 오디오 스트림 (302) 을 유지하도록 한다. 메모리 (312) 는 도 1과 관련하여 기재된 바와 같은 메모리 (112) 의 구조 및 기능과 유사할 수도 있다.
오디오 스트림 (302) 은 디지털화되어 (306) 디지털화된 오디오 스트림 (314) 을 생성한다. 디지털화된 오디오 스트림 (314) 은 메모리 (312) 에 저장 및/또는 유지된다. 일 실시형태에서, 프로세서 (318) 는 디지털화된 오디오 스트림 (314) 을 획득하여, 신호 (316) 를 수신하면 모듈 (320) 에서 분석한다. 디지털화된 오디오 스트림 (314) 은 도 1 및 도 2와 관련하여 각각 기재된 바와 같은 디지털화된 오디오 스트림 (114 및 214) 의 구조 및 기능과 유사할 수도 있다.
신호 (316) 는 전력 (322) 을 증가시키기 위해 저전력 집적 회로 (304) 로부터 프로세서 (318) 로의 송신이다. 신호 (316) 의 일 실시형태에서, 부가적으로, 디지털화된 오디오 스트림 (314) 을 획득하여 모듈 (320) 에서 분석하도록 프로세서 (318) 에 명령한다. 신호 (316) 는 도 1 및 도 2와 관련하여 각각 기재된 바와 같은 신호 (116 및 216) 의 구조 및 기능과 유사할 수도 있다.
전력 (322) 은 프로세서 (318) 및/또는 컴퓨팅 디바이스 (300) 에 전기 에너지를 공급한다. 전력 (322) 은 도 1과 관련하여 기재된 바와 같은 전력 (122) 의 구조 및 기능과 유사할 수도 있다.
프로세서 (318) 는 분석 모듈 (320) 및 텍스트 스트림 (324) 을 포함한다. 구체적으로, 프로세서 (318) 는 전력 (322) 을 증가시키기 위해 신호 (316) 를 수신한다. 이 신호 (316) 를 수신하면, 프로세서 (318) 는 디지털화된 오디오 스트림 (314) 을 획득하여 모듈 (320) 에서 분석한다. 추가 실시형태에서, 프로세서 (318) 는 디지털화된 오디오 스트림 (314) 을 텍스트 스트림 (324) 으로 변환한다. 본 실시형태에서, 텍스트 스트림 (324) 내의 텍스트는 컴퓨팅 디바이스 (300) 에 대한 응답을 지시한다. 텍스트 스트림은 알파벳, 수치 세트, 알파 수치 세트로부터의 표현들 또는 심볼들의 유한 시퀀스의 문자열이다. 예를 들어, 디지털화된 오디오 스트림 (314) 은 이진 언어일 수도 있어서, 프로세서가 이진 표현의 바이트들을 단어로 번역한다. 추가 예에서, 디지털화된 오디오 스트림 (314) 은 단어들 및/또는 숫자들로 표현되는 언어일 수도 있어서, 프로세서 (318) 는 이 언어를 프로세서 (318) 가 이해하는 텍스트로 번역한다. 응답의 실시형태들은 웹 서치의 수행, 전화 번호 다이얼링, 어플리케이션의 오픈, 텍스트의 기록, 미디어의 스트리밍, 텍스트 메시지의 작성, 디렉션들의 리스트 작성 또는 디렉션들의 스피킹을 포함한다. 추가 실시형태에서, 프로세서 (318) 는 응답을 결정하여 컴퓨팅 디바이스 (300) 의 사용자에게 렌더링한다. 프로세서 (318) 는 도 1과 관련하여 기재된 바와 같은 프로세서 (118) 의 구조 및 기능과 유사할 수도 있다.
프로세서 (318) 는 모듈 (320) 에서 저장된 디지털화된 오디오 스트림 (314) 을 분석한다. 분석 모듈 (320) 의 실시형태들은 메모리 (312) 로부터 획득된 디지털화된 오디오 스트림 (314) 을 서버 (326) 로 송신하는 것을 포함한다. 모듈 (320) 의 다른 실시형태들은, 메모리 (312) 로부터 획득된 디지털화된 오디오 스트림 (314) 을 텍스트 스트림 (324) 으로 변환하고 텍스트 스트림 (324) 을 서버 (326) 로 송신하는 것을 포함한다. 모듈 (320) 의 다른 실시형태들은, 디지털화된 오디오 스트림 (314) 을 텍스트 스트림 (324) 으로 변환하여 오디오 스트림 (302) 의 컨텍스트를 분석함으로써 적절한 응답을 결정하는 것을 포함한다. 예를 들어, 디지털화된 오디오 스트림 (314) 은 모듈 (320) 에서 텍스트 스트림 (324) 으로 변환될 수도 있고, 프로세서 (318) 는 자연어 처리를 사용하여 텍스트 스트림 (324) 내의 텍스트를 분석하여 오디오 스트림 (302) 의 컨텍스트에 기초한 적절한 응답을 결정할 수도 있다.
텍스트 스트림 (324) 은 컴퓨팅 디바이스 (300) 에 대한 적절한 응답을 결정하기 위해 텍스트를 포함한다. 일 실시형태에서, 텍스트 스트림 (324) 은 프로세서에 의해 처리되어 출력 디바이스 (328) 상의 컴퓨팅 디바이스 (300) 의 사용자에게 렌더링하기에 적절한 응답을 결정한다. 또 다른 실시형태에서, 텍스트 스트림 (324) 은 서버 (326) 에 의해 처리되어 컴퓨팅 디바이스 (300) 로 송신되는 적절한 응답을 결정한다. 본 실시형태에서, 응답은 서버 (326) 로부터 컴퓨팅 디바이스 (300) 로 전송된다. 추가 실시형태에서, 컴퓨팅 디바이스 (300) 는 컴퓨팅 디바이스 (300) 의 사용자에게 응답을 렌더링한다. 예를 들어, 텍스트 스트림 (324) 은 엄마에게 텍스트 메시지를 전송하는 것을 논의하는 텍스트를 포함할 수도 있다. 이로써, 텍스트 스트림 (324) 내의 텍스트는 컴퓨팅 디바이스 (300) 가 엄마에게 텍스트 메시지를 작성함으로써 응답하게 한다.
서버 (326) 는 네크워크를 통해 서비스들을 제공하며, 예를 들어 웹 서버, 네트워크 서버, 근거리 통신망 (LAN) 서버, 파일 서버, 또는 텍스트 스트림 (324) 를 처리하여 컴퓨팅 디바이스 (300) 로 응답을 전송하기에 적합한 임의의 다른 컴퓨팅 디바이스를 포함할 수도 있다.
출력 디바이스 (328) 는 텍스트 스트림 (324) 내의 텍스트로부터 결정된 바와 같은 응답을 컴퓨팅 디바이스 (300) 의 사용자에게 렌더링한다. 출력 디바이스 (328) 의 실시형태들은 컴퓨팅 디바이스 (300) 의 사용자에게 응답을 렌더링하기 위해 디스플레이 디바이스, 스크린, 또는 스피커를 포함한다. 엄마 예에 대해 텍스트 메시지를 유지함에 있어서, 컴퓨팅 디바이스 (300) 의 사용자는 엄마에게 작성된 텍스트 메시지를 나타내는 디스플레이 및/또는 사용자에게 텍스트 메시지를 전달하는 스피커를 포함할 수도 있다.
이제, 오디오 스트림을 수신하고 응답을 결정하기 위해 컴퓨팅 디바이스 상에서 수행되는 일 예의 방법의 플로우 챠트인, 도 4로 돌아간다. 도 4는 도 1에서와 같이 컴퓨팅 디바이스 (100) 상에서 수행되는 것으로 기재되지만, 당업자에게 자명하게 되는 다른 적절한 컴포넌트들 상에서 또한 실행될 수도 있다. 예를 들어, 도 4는 메모리 (112) 와 같은 머신 판독가능 저장 매체 상에서 실행가능한 명령들의 형태로 구현될 수도 있다.
동작 (402) 에서, 저전력 집적 회로와 함께 동작하는 컴퓨팅 디바이스는 오디오 스트림을 수신한다. 일 실시형태에 있어서, 오디오 스트림은 미리 결정된 시간 양이다. 예를 들어, 오디오 스트림은 몇 초 또는 몇 밀리 초일 수도 있다. 본 실시형태에서, 컴퓨팅 디바이스는 연속적으로 오디오를 모니터링할 수도 있다. 추가 실시형태에서, 오디오 스트림은 사용자로부터의 스피치 또는 다른 컴퓨팅 디바이스로부터의 오디오 중 적어도 하나를 포함한다.
동작 (404) 에서, 컴퓨팅 디바이스와 함께 동작하는 저전력 집적 회로는, 동작 (402) 에서 수신된 오디오 스트림을 디지털화하여 디지털화된 오디오 스트림을 생성한다. 동작 (404) 의 실시형태들은, 저전력 집적 회로와 함께 동작하는 아날로그 디지털 컨버터 (ADC), 디지털 변환 디바이스, 명령, 펌웨어, 및/또는 소프트웨어의 사용을 포함한다. 동작 (404) 의 실시형태들은 디지털화된 오디오 스트림을 메모리에 송신하는 것을 포함한다. 404의 추가 실시형태들은, 동작 (402) 에서 수신된 오디오 스트림을 압축하는 것을 포함하고, 404의 또 다른 실시형태는 디지털화된 오디오 스트림을 압축하는 것을 포함한다.
동작 (406) 에서, 동작 (404) 에서 생성된 디지털화된 오디오 스트림이 메모리에 저장된다. 동작 (406) 의 실시형태들은 디지털화된 오디오 스트림을 저장 및/또는 유지하는 메모리를 포함한다. 동작 (406) 의 또 다른 실시형태에서, 동작 (402) 에서 미리 결정된 시간 양 동안 수신된 오디오 스트림이 동작 (404) 에서 디지털화되고, 이에 따라 동작 (402) 에서 또 다른 오디오 스트림이 수신되고 동작 (404) 에서 디지털화될 때, 이런 현재의 디지털화된 오디오 스트림이 이전에 디지털화된 오디오 스트림을 대체한다. 본 실시형태에서, 메모리는 현재 시간 이전의 시간의 미리 결정된 기간 동안 수신된 저장된 디지털화된 오디오 스트림을 유지한다.
동작 (408) 에서, 저전력 집적 회로는 동작 (404) 에서 생성된 디지털화된 오디오 스트림을 분석한다. 동작 (408) 의 실시형태들은 디지털화된 오디오 스트림을 처리하는 것을 포함하고, 다른 실시형태들은 디지털화된 오디오 스트림을 키워드와 비교하는 것을 포함한다. 동작 (408) 의 이런 실시형태들에서, 저전력 집적 회로는 키워드에 대해 디지털화된 오디오 스트림을 처리한다. 디지털화된 오디오 스트림 내에서 키워드를 인식하면, 방법은 동작 (410) 으로 이동하여 신호를 송신한다. 추가 실시형태에서, 저전력 집적 회로가 디지털화된 오디오 스트림 내에서 키워드를 인식하지 않는다면, 방법은 동작 (402) 으로 되돌아간다. 또한, 추가 실시형태에서는 컴퓨팅 디바이스의 사용자가 컴퓨팅 디바이스에 의해 응답을 바라는 것을 표시하는 아날로그 또는 디지털 표현과 디지털화된 오디오 스트림을 비교하는 것을 포함한다. 또한 추가 실시형태에서, 동작들 (402, 404, 406 및 408) 은 동시에 발생한다. 예를 들어, 컴퓨팅 디바이스가 동작 (408) 에서 디지털화된 오디오 스트림을 분석한다면, 집적 회로는 동작 (402) 에서 오디오 스트림을 수신하고, 동작 (404 및 406) 에서 이 오디오 스트림을 디지털화하고 저장하는 것을 포함한다.
동작 (410) 에서, 저전력 집적 회로는 전력을 증가시키기 위한 신호를 프로세서로 송신한다. 구체적으로, 디지털화된 오디오 스트림 내에서 키워드를 인식하면, 저전력 집적 회로는 전력을 증가시키기 위한 신호를 프로세서로 송신한다. 동작 (410) 의 실시형태에서, 프로세서는 프로세서 및/또는 컴퓨팅 디바이스로 전달된 전력 또는 전기 에너지를 증가시킨다.
동작 (412) 에서, 프로세서는 동작 (406) 에서 메모리로부터 저장된 디지털화된 오디오 스트림을 획득한다. 동작 (412) 의 일 실시형태에서, 메모리는 디지털화된 오디오 스트림을 프로세서로 송신하고, 동작 (412) 의 또 다른 실시형태에서, 프로세서는 메모리로부터 디지털화된 오디오 스트림을 취출한다.
동작 (414) 에서, 프로세서는 동작 (412) 에서 획득된 디지털화된 오디오 스트림을 텍스트 스트림으로 변환한다. 디지털화된 오디오 스트림을 텍스트 스트림으로 변환한 후, 프로세서가 텍스트 스트림 내의 텍스트를 분석하여 적절한 응답을 결정한다. 동작 (414) 의 실시형태들은 스피치 투 텍스트 (STT), 보이스 투 텍스트, 디지털 투 텍스트 또는 다른 유형의 텍스트 변환을 사용하는 것을 포함한다. 동작 (414) 의 추가 실시형태는 텍스트 스트림으로의 변환 후 자연어 처리을 사용하는 것을 포함한다. 본 실시형태에서, 컴퓨팅 디바이스는 텍스트 스트림 내의 텍스트를 처리하여 동작 (402) 에서 수신된 오디오 스트림의 컨텍스트에 기초하여 적절한 응답을 결정한다. 예를 들어, 408에서 디지털화된 오디오 스트림 내에서 키워드를 검출하면, 프로세서가 동작 (412) 에서 획득하고 디지털화된 오디오 스트림이 동작 (414) 에서 텍스트 스트림으로 변환된다. 추가 예에서, 오디오 스트림은 2 개의 위치 사이의 디렉션들에 관한 대화를 포함할 수도 있으며, 따라서 이런 디지털화된 오디오 스트림이 동작 (412) 에서 텍스트 스트림으로 변환되면, 프로세서가 텍스트 스트림 내의 텍스트를 분석함으로써 적절한 응답을 결정할 수 있다.
동작 (416) 에서, 프로세서는 동작 (414) 에서 생성된 텍스트 스트림에 기초하여 응답을 결정한다. 응답의 실시형태들은, 웹 서치의 수행, 전화 번호의 다이얼링, 어플리케이션의 오픈, 텍스트의 기록, 미디어의 스트리밍, 텍스트 메시지의 작성, 디렉션들의 리스트 작성 또는 디렉션들의 스피킹을 포함한다. 일 실시형태에서, 텍스트 스트림 내의 텍스트는 프로세서에 대한 적절한 응답을 표시한다. 추가 실시형태에서, 응답은 컴퓨팅 디바이스의 사용자에게 렌더링된다. 예를 들어, 텍스트 스트림은 중국에 도착하는 방법을 문의하는 스피치를 포함할 수도 있으며, 중국으로의 그런 디렉션들이 적절한 응답이 된다. 게다가, 본 예에서, 중국으로의 디렉션들을 리스트 작성 및/또는 스피킹하는 맵 디스플레이가 포함될 수도 있다.
이제, 디지털화된 오디오 스트림을 압축하고 컴퓨팅 디바이스의 사용자에게 응답을 렌더링하기 위해 컴퓨팅 디바이스 상에서 수행된 일 예의 방법의 플로우챠트인, 도 5를 참조한다. 도 5는 상기 도 3에서와 같이 컴퓨팅 디바이스 (300) 상에서 수행되는 것으로 기재되지만, 당업자에게 자명하게 되는 바와 같은 다른 적절한 컴포넌트들 상에서 또한 실행될 수도 있다. 예를 들어, 도 5는 메모리 (312) 와 같은 머신 판독가능 저장 매체 상에서 실행가능한 명령들의 형태로 구현될 수도 있다.
동작 (502) 에서, 컴퓨팅 디바이스는 디지털화된 오디오 스트림을 압축한다. 일 실시형태에서, 동작 (502) 은 도 4에서의 동작 (406) 이전의 동작 (404) 과 함께 수행된다. 예를 들어, 수신된 오디오 스트림을 디지털화하면, 컴퓨팅 디바이스와 함께 저전력 집적 회로 동작이 디지털화된 오디오 스트림을 압축하여 스트림의 데이터 바이트 크기를 감소시킬 수도 있다. 본 예에서, 디지털화된 오디오 스트림의 압축은 동작 (406) 에서 메모리에 저장되기 전에 발생한다. 추가 실시형태에서, 동작 (502) 은 도 4에서의 동작 (412) 에서 디지털화된 오디오 스트림을 수신하기 전에 수행된다. 예를 들어, 프로세서는 동작 (502) 을 수행하여 메모리로부터 디지털화된 오디오 스트림을 압축할 수도 있으며, 또 다른 예에서는, 프로세서가 디지털화된 오디오 스트림을 획득하기 전에 메모리가 디지털화된 오디오 스트림을 압축할 수도 있다. 또한, 동작 (502) 의 추가 실시형태에서, 압축된 디지털화된 오디오 스트림은 도 4의 동작 (408) 에서와 같이 키워드를 인식하기 위해 분석된다.
동작 (504) 에서, 컴퓨팅 디바이스는 컴퓨팅 디바이스의 사용자에게 응답을 렌더링한다. 동작 (504) 의 실시형태들은 도 4에서의 동작 (416) 동안 또는 이후에 발생하는 것을 포함한다. 예를 들어, 프로세서가 적절한 응답을 결정하면, 이 응답은 컴퓨팅 디바이스의 사용자에게 렌더링될 수도 있다. 추가 실시형태에서, 응답은 컴퓨팅 디바이스와 함께 동작하는, 디스플레이 스크린 또는 스피커와 같은 출력 장치 상에서 사용자에게 렌더링될 수도 있다. 예를 들어, 사용자가 쉬림프와 프라운 사이의 차이를 논의할 때, 프로세서는 웹 서치 어플리케이션을 론칭할 수도 있으며, 이에 따라 쉬림프와 프라운 사이의 차이에 대한 웹 서치를 수행한다. 수행된 웹 서치는 컴퓨팅 디바이스의 디스플레이 상에서 사용자에게 렌더링 될 수도 있다. 추가 예에서, 컴퓨팅 디바이스는 스피커를 통해 사용자에게 쉬림프와 프라운 사이의 차이들을 가청으로 열거한다. 이 실시형태들에서, 컴퓨팅 디바이스는 사용자가 컴퓨팅 디바이스에 명령하는 대신 응답을 결정하기 위해 오디오 스트림과 동작한다.
본 명세서에 상세하게 기재된 실시형태들은 키워드를 검출하기 위해 그리고 디지털화된 오디오 스트림 내에서 키워드의 인식에 기초하여 오디오 스트림을 디지털화하고, 전력을 증가시키기 위한 신호를 프로세서에 송신하며, 또한 응답을 결정하기 위해 디지털화된 오디오 스트림을 분석하는 것과 관련된다. 이러한 방식으로, 예시의 실시형태들은 컴퓨팅 디바이스의 전력 소모를 감소시키면서, 컴퓨팅 디바이스로의 반복적인 오디오 명령들을 방지함으로써 사용자 시간을 절약한다.

Claims (1)

  1. 디지털화된 오디오 스트림을 분석하는 방법.
KR1020187036622A 2011-12-07 2011-12-07 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로 KR20180137041A (ko)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2011/063804 WO2013085507A1 (en) 2011-12-07 2011-12-07 Low power integrated circuit to analyze a digitized audio stream

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020147018606A Division KR20140106656A (ko) 2011-12-07 2011-12-07 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020207017179A Division KR20200074260A (ko) 2011-12-07 2011-12-07 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로

Publications (1)

Publication Number Publication Date
KR20180137041A true KR20180137041A (ko) 2018-12-26

Family

ID=48574720

Family Applications (5)

Application Number Title Priority Date Filing Date
KR1020187036622A KR20180137041A (ko) 2011-12-07 2011-12-07 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로
KR1020167007578A KR20160036104A (ko) 2011-12-07 2011-12-07 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로
KR1020147018606A KR20140106656A (ko) 2011-12-07 2011-12-07 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로
KR1020217042960A KR20220002750A (ko) 2011-12-07 2011-12-07 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로
KR1020207017179A KR20200074260A (ko) 2011-12-07 2011-12-07 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로

Family Applications After (4)

Application Number Title Priority Date Filing Date
KR1020167007578A KR20160036104A (ko) 2011-12-07 2011-12-07 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로
KR1020147018606A KR20140106656A (ko) 2011-12-07 2011-12-07 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로
KR1020217042960A KR20220002750A (ko) 2011-12-07 2011-12-07 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로
KR1020207017179A KR20200074260A (ko) 2011-12-07 2011-12-07 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로

Country Status (8)

Country Link
US (4) US9564131B2 (ko)
EP (2) EP2788978B1 (ko)
JP (1) JP2015501106A (ko)
KR (5) KR20180137041A (ko)
CN (1) CN104254884B (ko)
BR (1) BR112014013832B1 (ko)
IN (1) IN2014CN04097A (ko)
WO (1) WO2013085507A1 (ko)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9992745B2 (en) 2011-11-01 2018-06-05 Qualcomm Incorporated Extraction and analysis of buffered audio data using multiple codec rates each greater than a low-power processor rate
KR20180137041A (ko) 2011-12-07 2018-12-26 퀄컴 인코포레이티드 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로
US9704486B2 (en) 2012-12-11 2017-07-11 Amazon Technologies, Inc. Speech recognition power management
US9697831B2 (en) * 2013-06-26 2017-07-04 Cirrus Logic, Inc. Speech recognition
US20150074524A1 (en) * 2013-09-10 2015-03-12 Lenovo (Singapore) Pte. Ltd. Management of virtual assistant action items
US9245527B2 (en) 2013-10-11 2016-01-26 Apple Inc. Speech recognition wake-up of a handheld portable electronic device
US10079019B2 (en) 2013-11-12 2018-09-18 Apple Inc. Always-on audio control for mobile device
US9460735B2 (en) * 2013-12-28 2016-10-04 Intel Corporation Intelligent ancillary electronic device
US9653079B2 (en) * 2015-02-12 2017-05-16 Apple Inc. Clock switching in always-on component
US10452339B2 (en) 2015-06-05 2019-10-22 Apple Inc. Mechanism for retrieval of previously captured audio
CN105869654B (zh) * 2016-03-29 2020-12-04 阿里巴巴集团控股有限公司 音频消息的处理方法及装置
US10403279B2 (en) * 2016-12-21 2019-09-03 Avnera Corporation Low-power, always-listening, voice command detection and capture
US10276161B2 (en) * 2016-12-27 2019-04-30 Google Llc Contextual hotwords
US10319375B2 (en) 2016-12-28 2019-06-11 Amazon Technologies, Inc. Audio message extraction
US10121494B1 (en) * 2017-03-30 2018-11-06 Amazon Technologies, Inc. User presence detection
US11270198B2 (en) 2017-07-31 2022-03-08 Syntiant Microcontroller interface for audio signal processing
CN107895573B (zh) * 2017-11-15 2021-08-24 百度在线网络技术(北京)有限公司 用于识别信息的方法及装置
CN111742330B (zh) * 2017-12-28 2023-04-04 森田公司 始终开启的关键字检测器
KR20210052035A (ko) * 2019-10-31 2021-05-10 엘지전자 주식회사 저전력 음성 인식 장치 및 방법
US11269592B2 (en) * 2020-02-19 2022-03-08 Qualcomm Incorporated Systems and techniques for processing keywords in audio data
IT202000005875A1 (it) 2020-03-19 2021-09-19 Radio Dimensione Suono Spa Sistema e metodo di arricchimento automatico di informazioni per flussi audio
GB2605121A (en) * 2021-02-08 2022-09-28 Prevayl Innovations Ltd An electronics module for a wearable articel, a systemm, and a method of activation of an electronics module for a wearable article
IT202100017351A1 (it) 2021-07-01 2023-01-01 Artisti Riuniti S R L Sistema e dispositivo di condivisione di contenuti artistico-teatrali in formato digitale tra account geolocalizzati
US11915698B1 (en) * 2021-09-29 2024-02-27 Amazon Technologies, Inc. Sound source localization

Family Cites Families (98)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5278944A (en) 1992-07-15 1994-01-11 Kokusai Electric Co., Ltd. Speech coding circuit
JPH07121195A (ja) 1993-10-25 1995-05-12 Sony Corp 音声処理用ディジタルシグナルプロセッサ
JPH07244494A (ja) 1994-03-04 1995-09-19 Ricoh Co Ltd 音声認識装置
US6070140A (en) * 1995-06-05 2000-05-30 Tran; Bao Q. Speech recognizer
US5721938A (en) 1995-06-07 1998-02-24 Stuckey; Barbara K. Method and device for parsing and analyzing natural language sentences and text
JP3674990B2 (ja) * 1995-08-21 2005-07-27 セイコーエプソン株式会社 音声認識対話装置および音声認識対話処理方法
US5946050A (en) * 1996-10-04 1999-08-31 Samsung Electronics Co., Ltd. Keyword listening device
JP3726448B2 (ja) 1997-03-12 2005-12-14 セイコーエプソン株式会社 認識対象音声検出方法およびその装置
US6101473A (en) * 1997-08-08 2000-08-08 Board Of Trustees, Leland Stanford Jr., University Using speech recognition to access the internet, including access via a telephone
DE69819690T2 (de) * 1997-12-30 2004-08-12 Koninklijke Philips Electronics N.V. Spracherkennungsvorrichtung unter verwendung eines befehlslexikons
GB2342828A (en) 1998-10-13 2000-04-19 Nokia Mobile Phones Ltd Speech parameter compression; distributed speech recognition
KR100753780B1 (ko) * 1999-01-06 2007-08-31 코닌클리케 필립스 일렉트로닉스 엔.브이. 음성 입력 디바이스
US6408272B1 (en) * 1999-04-12 2002-06-18 General Magic, Inc. Distributed voice user interface
US6332120B1 (en) 1999-04-20 2001-12-18 Solana Technology Development Corporation Broadcast speech recognition system for keyword monitoring
US6393572B1 (en) 1999-04-28 2002-05-21 Philips Electronics North America Corporation Sleepmode activation in a slave device
JP2000315097A (ja) * 1999-04-30 2000-11-14 Canon Inc 電子機器、その制御方法、及び記録媒体
US6594630B1 (en) 1999-11-19 2003-07-15 Voice Signal Technologies, Inc. Voice-activated control for electrical device
US8108218B1 (en) 1999-12-13 2012-01-31 Avaya Inc. Methods and apparatus for voice recognition for call treatment modification on messaging
KR100340045B1 (ko) 1999-12-24 2002-06-12 오길록 저전력 음성 명령어 구동 휴대 정보단말 장치 및 그를 이용한 음성인식 방법
KR100447667B1 (ko) 2000-04-12 2004-09-08 이경목 음성 인식 기능을 갖는 컴퓨터와 학습용 인형들을 이용한 상호 대화 언어 학습 시스템
JP2002123283A (ja) 2000-10-12 2002-04-26 Nissan Motor Co Ltd 音声認識操作装置
US20020077830A1 (en) 2000-12-19 2002-06-20 Nokia Corporation Method for activating context sensitive speech recognition in a terminal
WO2002073600A1 (en) 2001-03-14 2002-09-19 International Business Machines Corporation Method and processor system for processing of an audio signal
US8266451B2 (en) 2001-08-31 2012-09-11 Gemalto Sa Voice activated smart card
US6987947B2 (en) 2001-10-30 2006-01-17 Unwired Technology Llc Multiple channel wireless communication system
US6895257B2 (en) * 2002-02-18 2005-05-17 Matsushita Electric Industrial Co., Ltd. Personalized agent for portable devices and cellular phone
KR100594140B1 (ko) 2002-04-13 2006-06-28 삼성전자주식회사 무선통신시스템의 패킷 데이터 서비스 방법
TWI225640B (en) * 2002-06-28 2004-12-21 Samsung Electronics Co Ltd Voice recognition device, observation probability calculating device, complex fast fourier transform calculation device and method, cache device, and method of controlling the cache device
JP2004226698A (ja) * 2003-01-23 2004-08-12 Yaskawa Electric Corp 音声認識装置
JP2004265217A (ja) * 2003-03-03 2004-09-24 Nec Corp 音声認識機能を有する移動通信端末とその端末を利用したキーワード検索方法
US20060206335A1 (en) 2003-03-17 2006-09-14 Eric Thelen Method for remote control of an audio device
JP2004294946A (ja) 2003-03-28 2004-10-21 Toshiba Corp 携帯型電子機器
JP4301896B2 (ja) 2003-08-22 2009-07-22 シャープ株式会社 信号分析装置、音声認識装置、プログラム、記録媒体、並びに電子機器
TWI222837B (en) 2003-10-14 2004-10-21 Design Technology Inc G Audio signal compression processing device to with reduced power consumption
TWI235358B (en) 2003-11-21 2005-07-01 Acer Inc Interactive speech method and system thereof
EP1562180B1 (en) 2004-02-06 2015-04-01 Nuance Communications, Inc. Speech dialogue system and method for controlling an electronic device
CN100365727C (zh) 2004-03-26 2008-01-30 胡红 一种无线感应音频播放器
US20060074658A1 (en) * 2004-10-01 2006-04-06 Siemens Information And Communication Mobile, Llc Systems and methods for hands-free voice-activated devices
WO2006084144A2 (en) 2005-02-03 2006-08-10 Voice Signal Technologies, Inc. Methods and apparatus for automatically extending the voice-recognizer vocabulary of mobile communications devices
US20090222270A2 (en) 2006-02-14 2009-09-03 Ivc Inc. Voice command interface device
JP2007219207A (ja) * 2006-02-17 2007-08-30 Fujitsu Ten Ltd 音声認識装置
JP2007255897A (ja) * 2006-03-20 2007-10-04 Clarion Co Ltd ナビゲーションシステム並びに装置、その制御方法及び制御プログラム
US7756708B2 (en) * 2006-04-03 2010-07-13 Google Inc. Automatic language model update
US8117268B2 (en) * 2006-04-05 2012-02-14 Jablokov Victor R Hosted voice recognition system for wireless devices
US20070254680A1 (en) 2006-05-01 2007-11-01 Shary Nassimi Wirefree intercom having low power system and process
KR100744301B1 (ko) * 2006-06-01 2007-07-30 삼성전자주식회사 음성 인식을 이용하여 동작 모드를 전환하는 휴대 단말기및 그 방법
US8207936B2 (en) 2006-06-30 2012-06-26 Sony Ericsson Mobile Communications Ab Voice remote control
EP1879000A1 (en) * 2006-07-10 2008-01-16 Harman Becker Automotive Systems GmbH Transmission of text messages by navigation systems
DE602006005830D1 (de) 2006-11-30 2009-04-30 Harman Becker Automotive Sys Interaktives Spracherkennungssystem
US8150044B2 (en) 2006-12-31 2012-04-03 Personics Holdings Inc. Method and device configured for sound signature detection
US9760146B2 (en) 2007-01-08 2017-09-12 Imagination Technologies Limited Conditional activation and deactivation of a microprocessor
US8254591B2 (en) 2007-02-01 2012-08-28 Personics Holdings Inc. Method and device for audio recording
US7818176B2 (en) 2007-02-06 2010-10-19 Voicebox Technologies, Inc. System and method for selecting and presenting advertisements based on natural language processing of voice-based input
US8996379B2 (en) * 2007-03-07 2015-03-31 Vlingo Corporation Speech recognition text entry for software applications
US7774626B2 (en) 2007-03-29 2010-08-10 Intel Corporation Method to control core duty cycles using low power modes
WO2008126355A1 (ja) * 2007-03-29 2008-10-23 Panasonic Corporation キーワード抽出装置
EP1978765A1 (en) 2007-04-02 2008-10-08 BRITISH TELECOMMUNICATIONS public limited company Power management scheme for mobile communication devices
WO2008124786A2 (en) 2007-04-09 2008-10-16 Personics Holdings Inc. Always on headwear recording system
JP2008309864A (ja) 2007-06-12 2008-12-25 Fujitsu Ten Ltd 音声認識装置および音声認識方法
CN101076099B (zh) 2007-06-14 2010-06-09 北京中星微电子有限公司 一种视频录制的控制方法、装置和同步控制单元
US20090055005A1 (en) 2007-08-23 2009-02-26 Horizon Semiconductors Ltd. Audio Processor
US8725520B2 (en) 2007-09-07 2014-05-13 Qualcomm Incorporated Power efficient batch-frame audio decoding apparatus, system and method
CN101483683A (zh) 2008-01-08 2009-07-15 宏达国际电子股份有限公司 手持装置及其语音识别方法
US8554551B2 (en) 2008-01-28 2013-10-08 Qualcomm Incorporated Systems, methods, and apparatus for context replacement by audio level
US8050932B2 (en) 2008-02-20 2011-11-01 Research In Motion Limited Apparatus, and associated method, for selecting speech COder operational rates
US20090234655A1 (en) 2008-03-13 2009-09-17 Jason Kwon Mobile electronic device with active speech recognition
KR20090107365A (ko) 2008-04-08 2009-10-13 엘지전자 주식회사 이동 단말기 및 그 메뉴 제어방법
US20090259865A1 (en) 2008-04-11 2009-10-15 Qualcomm Incorporated Power Management Using At Least One Of A Special Purpose Processor And Motion Sensing
JP5327838B2 (ja) * 2008-04-23 2013-10-30 Necインフロンティア株式会社 音声入力分散処理方法及び音声入力分散処理システム
US8244528B2 (en) * 2008-04-25 2012-08-14 Nokia Corporation Method and apparatus for voice activity determination
CA2665055C (en) 2008-05-23 2018-03-06 Accenture Global Services Gmbh Treatment processing of a plurality of streaming voice signals for determination of responsive action thereto
US8488799B2 (en) 2008-09-11 2013-07-16 Personics Holdings Inc. Method and system for sound monitoring over a network
JP2010136292A (ja) 2008-12-08 2010-06-17 Toshiba Corp 画像処理装置
US20120010890A1 (en) * 2008-12-30 2012-01-12 Raymond Clement Koverzin Power-optimized wireless communications device
JP4809454B2 (ja) 2009-05-17 2011-11-09 株式会社半導体理工学研究センター 発話推定による回路起動方法及び回路起動装置
US20110066431A1 (en) 2009-09-15 2011-03-17 Mediatek Inc. Hand-held input apparatus and input method for inputting data to a remote receiving device
JP2011071937A (ja) * 2009-09-28 2011-04-07 Kyocera Corp 電子機器
US20110099507A1 (en) 2009-10-28 2011-04-28 Google Inc. Displaying a collection of interactive elements that trigger actions directed to an item
CN102118886A (zh) 2010-01-04 2011-07-06 中国移动通信集团公司 一种语音信息的识别方法和设备
CN201752079U (zh) 2010-01-15 2011-02-23 硕呈科技股份有限公司 待命模式的电源变动唤醒装置
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
KR20110110434A (ko) 2010-04-01 2011-10-07 삼성전자주식회사 저전력 오디오 재생장치 및 방법
KR101733205B1 (ko) 2010-04-05 2017-05-08 삼성전자주식회사 오디오 디코딩 시스템 및 그것의 오디오 디코딩 방법
US9112989B2 (en) * 2010-04-08 2015-08-18 Qualcomm Incorporated System and method of smart audio logging for mobile devices
US8359020B2 (en) 2010-08-06 2013-01-22 Google Inc. Automatically monitoring for voice input based on context
CN101968791B (zh) 2010-08-10 2012-12-26 深圳市飘移网络技术有限公司 一种数据存储方法及装置
CN101938391A (zh) 2010-08-31 2011-01-05 中山大学 一种处理语音的方法、系统、遥控器、机顶盒、云服务器
US8606293B2 (en) 2010-10-05 2013-12-10 Qualcomm Incorporated Mobile device location estimation using environmental information
US9443511B2 (en) 2011-03-04 2016-09-13 Qualcomm Incorporated System and method for recognizing environmental sound
US8798995B1 (en) 2011-09-23 2014-08-05 Amazon Technologies, Inc. Key word determinations from voice data
US8924219B1 (en) 2011-09-30 2014-12-30 Google Inc. Multi hotword robust continuous voice command detection in mobile devices
US9992745B2 (en) * 2011-11-01 2018-06-05 Qualcomm Incorporated Extraction and analysis of buffered audio data using multiple codec rates each greater than a low-power processor rate
US9031847B2 (en) 2011-11-15 2015-05-12 Microsoft Technology Licensing, Llc Voice-controlled camera operations
US8666751B2 (en) * 2011-11-17 2014-03-04 Microsoft Corporation Audio pattern matching for device activation
KR20180137041A (ko) 2011-12-07 2018-12-26 퀄컴 인코포레이티드 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로
DE102013001219B4 (de) * 2013-01-25 2019-08-29 Inodyn Newmedia Gmbh Verfahren und System zur Sprachaktivierung eines Software-Agenten aus einem Standby-Modus
US10672387B2 (en) * 2017-01-11 2020-06-02 Google Llc Systems and methods for recognizing user speech
US10405082B2 (en) 2017-10-23 2019-09-03 Staton Techiya, Llc Automatic keyword pass-through system

Also Published As

Publication number Publication date
US9564131B2 (en) 2017-02-07
US11810569B2 (en) 2023-11-07
BR112014013832A8 (pt) 2017-06-13
CN104254884B (zh) 2017-10-24
EP3748631B1 (en) 2024-04-03
BR112014013832A2 (pt) 2017-06-13
US20150162002A1 (en) 2015-06-11
IN2014CN04097A (ko) 2015-07-10
US10381007B2 (en) 2019-08-13
KR20200074260A (ko) 2020-06-24
WO2013085507A1 (en) 2013-06-13
CN104254884A (zh) 2014-12-31
KR20220002750A (ko) 2022-01-06
EP2788978A4 (en) 2015-10-28
US11069360B2 (en) 2021-07-20
EP3748631A2 (en) 2020-12-09
US20210304770A1 (en) 2021-09-30
JP2015501106A (ja) 2015-01-08
EP2788978B1 (en) 2020-09-23
US20190385612A1 (en) 2019-12-19
KR20140106656A (ko) 2014-09-03
EP2788978A1 (en) 2014-10-15
US20170116992A1 (en) 2017-04-27
KR20160036104A (ko) 2016-04-01
EP3748631A3 (en) 2021-05-05
BR112014013832B1 (pt) 2021-05-25

Similar Documents

Publication Publication Date Title
US11810569B2 (en) Low power integrated circuit to analyze a digitized audio stream
US9613626B2 (en) Audio device for recognizing key phrases and method thereof
US10601599B2 (en) Voice command processing in low power devices
AU2014200407B2 (en) Method for Voice Activation of a Software Agent from Standby Mode
US20160125883A1 (en) Speech recognition client apparatus performing local speech recognition
CN103021411A (zh) 语音控制装置和语音控制方法
CN110675873B (zh) 智能设备的数据处理方法、装置、设备及存储介质
CN108055617B (zh) 一种麦克风的唤醒方法、装置、终端设备及存储介质
CN110992955A (zh) 一种智能设备的语音操作方法、装置、设备及存储介质
US20170256263A1 (en) Microphone apparatus
US20180268822A1 (en) Information processing system and information processing apparatus
CN109195016B (zh) 面向智能终端设备的视频弹幕的语音交互方法、终端系统及智能终端设备
JP6728507B2 (ja) デジタル化された音声ストリームを分析するための低電力集積回路
JP6833659B2 (ja) デジタル化された音声ストリームを分析するための低電力集積回路
CN113449197A (zh) 信息处理方法、装置、电子设备以及存储介质
CN111566730B (zh) 低功率设备中的语音命令处理
CN111028832B (zh) 麦克风静音模式控制方法、装置及存储介质和电子设备
CN110956964B (zh) 提供语音服务的方法、装置、存储介质和终端

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E90F Notification of reason for final refusal
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
X601 Decision of rejection after re-examination
A107 Divisional application of patent
J201 Request for trial against refusal decision
J301 Trial decision

Free format text: TRIAL NUMBER: 2020101001563; TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20200615

Effective date: 20201028