KR20200074260A - 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로 - Google Patents
디지털화된 오디오 스트림을 분석하는 저전력 집적 회로 Download PDFInfo
- Publication number
- KR20200074260A KR20200074260A KR1020207017179A KR20207017179A KR20200074260A KR 20200074260 A KR20200074260 A KR 20200074260A KR 1020207017179 A KR1020207017179 A KR 1020207017179A KR 20207017179 A KR20207017179 A KR 20207017179A KR 20200074260 A KR20200074260 A KR 20200074260A
- Authority
- KR
- South Korea
- Prior art keywords
- audio stream
- digitized audio
- processor
- digitized
- integrated circuit
- Prior art date
Links
- 238000000034 method Methods 0.000 claims description 14
- 230000004044 response Effects 0.000 description 35
- 230000009118 appropriate response Effects 0.000 description 16
- 230000006870 function Effects 0.000 description 12
- 238000012545 processing Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 5
- 241000238557 Decapoda Species 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000003252 repetitive effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000004146 energy storage Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 235000013619 trace mineral Nutrition 0.000 description 1
- 239000011573 trace mineral Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G10L15/265—
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3206—Monitoring of events, devices or parameters that trigger a change in power modality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3234—Power saving characterised by the action undertaken
- G06F1/3293—Power saving characterised by the action undertaken by switching to a less power-consuming processor, e.g. sub-CPU
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/285—Memory allocation or algorithm optimisation to reduce hardware requirements
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/50—Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Telephonic Communication Services (AREA)
- Circuits Of Receivers In General (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Power Sources (AREA)
- Telephone Function (AREA)
Abstract
예시들은 오디오 스트림을 수신하고 디지털화하기 위해 저전력 집적 회로를 개시한다. 또한, 예시들은 디지털화된 오디오 스트림을 키워드와 비교하고 디지털화된 오디오 스트림을 메모리에 저장하기 위해 저전력 집적 회로를 제공한다. 게다가, 예시들은 또한 디지털화된 오디오 스트림에서 키워드를 인식하면, 저전력 집적 회로는 전력을 증가시키기 위한 신호를 프로세서에 송신하고 디지털화된 오디오 스트림을 분석한다.
Description
컴퓨팅 디바이스들은 오디오 명령들을 처리하고 응답들을 제공함으로써 사용자들에게 전문성을 높이고 있다. 사용자들은 이런 컴퓨팅 디바이스들을 제어하기 위해 사용될 수도 있는 오디오 명령들을 열거할 수 있다. 예를 들어, 사용자들은 특정 위치에 디렉션들을 제공하는 명령들과 같은 정보를 제공하기 위해 컴퓨팅 디바이스들에게 말할 수 있다.
첨부 도면들에서, 같은 번호들은 같은 컴포넌트들 또는 블록들을 지칭한다. 다음의 상세한 설명은 이 도면들을 참조한다.
도 1은 오디오 스트림을 분석하는 저전력 집적 회로 및 집적 회로에 의한 키워드의 검출에 응답하여 디지털화된 오디오 스트림을 분석하는 프로세서를 포함하는 일 예의 컴퓨팅 디바이스의 블록 다이어그램이다.
도 2는 오디오 스트림을 분석하고 오디오 스트림에서 키워드가 검출될 때 전력을 증가시키기 위한 신호를 프로세서로 송신하기 위한 일 예의 저전력 집적 회로의 블록 다이어그램이다.
도 3은 디지털화된 오디오 스트림을 분석하는 일 예의 컴퓨팅 디바이스 및 디지털화된 오디오 스트림으로부터 생성된 텍스트 스트림을 분석하기 위해 컴퓨팅 디바이스와 통신하는 서버의 블록 다이어그램이다.
도 4는 오디오 스트림을 수신하고 응답을 결정하기 위해 컴퓨팅 디바이스 상에서 수행되는 일 예의 방법의 플로우챠트이다.
도 5는 디지털화된 오디오 스트림을 압축하고 응답을 렌더링하기 위해 컴퓨팅 디바이스 상에서 수행되는 일 예의 방법의 플로우챠트이다.
도 1은 오디오 스트림을 분석하는 저전력 집적 회로 및 집적 회로에 의한 키워드의 검출에 응답하여 디지털화된 오디오 스트림을 분석하는 프로세서를 포함하는 일 예의 컴퓨팅 디바이스의 블록 다이어그램이다.
도 2는 오디오 스트림을 분석하고 오디오 스트림에서 키워드가 검출될 때 전력을 증가시키기 위한 신호를 프로세서로 송신하기 위한 일 예의 저전력 집적 회로의 블록 다이어그램이다.
도 3은 디지털화된 오디오 스트림을 분석하는 일 예의 컴퓨팅 디바이스 및 디지털화된 오디오 스트림으로부터 생성된 텍스트 스트림을 분석하기 위해 컴퓨팅 디바이스와 통신하는 서버의 블록 다이어그램이다.
도 4는 오디오 스트림을 수신하고 응답을 결정하기 위해 컴퓨팅 디바이스 상에서 수행되는 일 예의 방법의 플로우챠트이다.
도 5는 디지털화된 오디오 스트림을 압축하고 응답을 렌더링하기 위해 컴퓨팅 디바이스 상에서 수행되는 일 예의 방법의 플로우챠트이다.
오디오 정보 처리에서, 사용자는 보통 버튼을 누르고 및/또는 명령들을 열거함으로써 오디오를 처리하는 어플리케이션을 작동시킨다. 오디오 처리 어플리케이션을 론칭하면, 사용자는 부가적으로 컴퓨팅 디바이스가 수행하기를 원하는 명시적 명령들을 열거하여야 한다. 따라서, 사용자로부터의 스피치 명령들을 처리하는 것은 시간 소모적이고 반복적일 수 있다. 게다가, 사용자로부터의 명령들에 대해 연속적으로 모니터링하는 것은 더 많은 전력을 소모하여 배터리를 방전시킨다.
이러한 이슈들을 해결하기 위해, 본 명세서에 개시된 예시의 실시형태들은 저전력 집적 회로를 사용하여 사용자의 스피치의 더 완전한 분석을 위해 프로세서에 의존하면서, 오디오 스트림 (예를 들어, 사용자의 스피치) 에서 키워드의 발생에 대해 연속적으로 모니터링한다. 예를 들어, 본 명세서에 개시된 다양한 예들은 저전력 집적 회로에서 오디오 스트림을 수신하고, 오디오 스트림을 디지털화하고, 디지털화된 오디오 스트림을 분석하여 키워드를 인식하는 것을 제공한다. 디지털화된 오디오 스트림 내에서 키워드를 인식하면, 집적 회로는 전력을 증가시키기 위한 신호를 프로세서에 전송한다. 프로세서에 대한 전력을 증가시키면, 디지털화된 오디오 스트림이 취출되어 응답을 결정한다. 이것은 사용자가 특정 오디오 처리 어플리케이션을 론칭하는데 소모된 시간 량을 감소시키고 사용자의 스피치의 반복을 방지한다. 취출된 오디오 스트림으로부터의 응답의 결정은 사용자가 스피치 분석을 수행하기 위해 컴퓨팅 디바이스에 부가적인 명시적 명령들을 제공하는 것을 방지한다.
게다가, 본 명세서에 개시된 다양한 예들에서, 프로세서에 대한 전력을 증가시키면, 프로세서는 메모리로부터 디지털화된 오디오 스트림을 취출하고 디지털화된 오디오 스트림을 텍스트 스트림으로 변환한다. 텍스트 스트림으로 변환한 후, 프로세서는 텍스트 스트림 내의 텍스트에 기초하여 응답을 결정한다. 텍스트 스트림으로부터의 응답의 결정은 컴퓨팅 디바이스의 사용자가 컴퓨팅 디바이스에 명령하는 시간을 감소시킨다. 게다가, 프로세서는 오디오 스트림의 컨텍스트에 기초하여 적절한 응답을 또한 결정할 수도 있다. 또한, 컴퓨팅 디바이스는 사용자에게 응답을 충족시키기 위해 어플리케이션이 실행하여야 하는 것을 결정한다. 게다가, 프로세서에 대한 전력을 증가시킴으로써, 디지털화된 오디오 스트림 내에서 키워드를 인식하면, 컴퓨팅 디바이스는 또한 사용자의 스피치를 청취하는 동안 적은 전력을 소모한다.
일 실시형태에서, 컴퓨팅 디바이스는 서버로부터 또는 프로세서로부터 응답을 수신함으로써 응답을 또한 결정할 수도 있다. 추가 실시형태에서, 메모리는 소정의 시간 기간 동안 저장된 디지털화된 오디오 스트림을 유지한다. 이 실시형태에서, 프로세서는 시간 증분들에서 디지털화된 오디오 스트림을 취출할 수 있다. 예를 들어, 프로세서는 완전한 디지털화된 오디오 스트림을 취출할 수도 있고 또는 디지털화된 오디오 스트림의 짧은 시간 간격을 취출할 수도 있다. 디지털화된 오디오 스트림의 취출은 프로세서가 적절한 응답을 결정하기 위해 오디오 스트림의 컨텍스트를 분석하도록 한다.
이러한 방식으로, 본 명세서에 개시된 예시의 실시형태들은, 컴퓨팅 디바이스가 오디오 스트림의 컨텍스트에 기초하여 적절한 응답을 결정하기 때문에, 컴퓨팅 디바이스로의 반복적인 오디오 명령들을 방지함으로써 사용자 시간을 절약한다. 또한, 컴퓨팅 디바이스는 오디오 스트림을 수신하고 처리하는 동안 적은 전력을 소모한다.
이제 도면들을 참조하면, 도 1은 오디오 스트림 (102) 을 수신하는 저전력 집적 회로 (104), 및 메모리 (112) 에 디지털화된 오디오 스트림 (114) 을 제공하기 위해 오디오 스트림을 디지털화하는 디지털화 모듈 (106) 을 포함하는 일 예의 컴퓨팅 디바이스 (100) 의 블록 다이어그램이다. 또한, 저전력 집적 회로 (104) 는 디지털화된 오디오 스트림 (114) 을 키워드와 비교하는 키워드와의 비교 모듈 (108) 을 포함하고, 키워드의 인식에 기초하여, 전력 (122) 을 증가시키기 위해 프로세서 (118) 에 신호 (116) 를 송신한다. 또한, 프로세서는 디지털화된 오디오 스트림 (114) 을 분석하는 분석 모듈 (120) 을 더 포함한다. 컴퓨팅 디바이스 (100) 의 실시형태들은, 클라이언트 디바이스, 개인 컴퓨터, 데스크탑 컴퓨터, 랩탑, 이동 디바이스 또는 컴포넌트들 (104, 112, 및 118) 을 포함하기에 적절한 다른 컴퓨팅 디바이스를 포함한다.
오디오 스트림 (102) 은 컴퓨팅 디바이스 (100), 구체적으로 저전력 집적 회로 (104) 에 의해 수신된다. 오디오 스트림 (102) 은 디지털화된 오디오 스트림 (114) 을 제공하기 위해 디지털화되는 (106) 입력 아날로그 신호이다. 오디오 스트림 (102) 의 실시형태들은 또 다른 컴퓨팅 디바이스로부터의 오디오 또는 사용자로부터의 스피치를 포함한다. 예를 들어, 혼동할 수도 있는, 오디오 스트림들 (102) 을 수신하는 몇몇 컴퓨팅 디바이스들 (300) 이 있을 수도 있다. 이로써, 컴퓨팅 디바이스들은 오디오 스트림 (102) 을 수신하기 위해 하나의 디바이스를 중심점으로서 지정할 수도 있다. 본 실시형태에서, 저전력 집적 회로 (104) 는 하나 이상의 컴퓨팅 디바이스들의 중앙 유닛일 수도 있는 애드-혹 (ad-hoc) 네트워크의 부분으로서 동작한다.
예를 들어, 사용자는 뉴욕에서 캘리포니아 로스앤젤레스까지의 최단 경로를 다른 사람과 논의할 수도 있다. 본 예에서, 오디오 스트림은 뉴욕에서 로스앤젤레스까지의 최단 경로의 논의일 것이다. 추가 실시형태에서, 오디오 스트림 (102) 은 미리 결정된 시간 기간 동안 오디오를 포함할 수도 있다. 예를 들어, 오디오 스트림 (102) 은 저전력 집적 회로 (104) 에 의해 수신될 때 몇 초 또는 몇분을 포함할 수도 있다. 본 예에서, 저전력 집적 회로 (104) 는 오디오 스트림 (102) 을 다른 오디오 스트림들 (102) 과 구별할 수도 있다.
저전력 집적 회로 (104) 는 오디오 스트림 (102) 을 디지털화하는 모듈 (106) 및 디지털화된 오디오 스트림 (114) 을 키워드와 비교하는 모듈 (108) 을 포함한다. 저전력 집적 회로 (104) 는 다른 전자 컴포넌트들 사이의 상호 접속들을 형성하는 재료의 표면 상의 패터닝된 트레이스 (trace) 엘리먼트들을 갖는 전자 회로이다. 예를 들어, 저전력 집적 회로 (104) 는 프로세서 (118) 와 메모리 (112) 사이에서 접속들을 형성한다. 저전력 집적 회로 (104) 의 실시형태들은, 마이크로칩, 칩셋, 전자 회로, 칩, 마이크로프로세서, 반도체, 마이크로제어기, 또는 오디오 스트림 (102) 을 수신하고 신호 (116) 를 송신할 수 있는 다른 전자 회로를 포함한다. 저전력 집적 회로 (104) 는 오디오 스트림 (102) 을 연속적으로 모니터링하고, 디지털화 모듈 (106) 을 사용하여 오디오 스트림을 디지털화하고, 디지털화된 오디오 스트림을 메모리 (112) 에 저장할 수도 있다. 이로써, 저전력 집적 회로 (104) 의 추가 실시형태들은, 송신기, 수신기, 마이크로폰, 또는 오디오 스트림 (102) 을 수신하는 다른 적절한 컴포넌트를 포함한다.
오디오 스트림은 디지털화된 오디오 스트림 (114) 을 제공하기 위해 모듈 (106) 에서 디지털화된다 디지털화 모듈 (106) 은 오디오 스트림을 이산 시간 신호 표현으로 변환한다. 디지털화 모듈 (106) 의 실시형태들은, 저전력 집적 회로 (104) 와 함께 동작하는 아날로그 디지털 컨버터 (ADC), 디지털 변환 디바이스, 명령, 펌웨어 및/또는 소프트웨어를 포함한다. 예를 들어, 디지털화 모듈 (106) 은 아날로그 신호의 크기에 비례하여 입력 아날로그 전압을 디지털 숫자로 변환하는 전자 디바이스를 포함할 수도 있다.
오디오 스트림 (102) 이 모듈 (106) 에서 디지털화되면, 그것은 모듈 (108) 에서 키워드와 비교된다. 오디오 스트림 (102) 은, 전력 (122) 을 증가시키고 디지털화된 오디오 스트림 (114) 을 획득하여 모듈 (120) 에서 분석하기 위해 신호 (116) 에 대한 표시로서 프로세서 (118) 를 동작시키는 키워드에 대해 모듈 (108) 에서 비교된다. 108의 실시형태들은, 명령, 프로세스, 동작, 로직, 알고리즘, 테크닉, 논리 함수, 펌웨어 및/또는 소프트웨어를 포함한다. 키워드가 인식되면, 저전력 집적 회로 (104) 는 전력 (122) 을 증가시키기 위해 프로세서 (118) 로 신호 (116) 를 송신한다.
키워드의 실시형태들은, 디지털 신호, 아날로그 신호, 패턴, 데이터베이스, 커맨드들, 디렉션들, 명령들, 또는 모듈 (108) 에서 비교하는 다른 표현들을 포함한다. 예를 들어, 컴퓨팅 디바이스의 사용자는 친구와 쉬림프 (shrimp) 와 프라운 (prawn) 사이의 차이를 논의할 수도 있고, 이어서 대답을 식별하기 위해 웹 서치를 수행하기를 바랄 수도 있다. 이로써, 사용자는 키워드와의 비교 모듈 (108) 에 의한 키워드의 인식 및 분석 모듈 (120) 에 의한 이전 논의의 후속 분석을 트리거하기 위해 미리 결정된 키워드를 언급할 수도 있다.
키워드는, 예를 들어 구절, 단일 키워드, 또는 컴퓨팅 디바이스의 사용자에게 사적인 단일 키워드를 포함할 수도 있다. 이전의 예를 유지하는데 있어서, 키워드가 구절, "컴퓨터야, 무슨 생각하니?" 일 수도 있다. 이 예에 있어서, 구절은 저전력 집적 회로 (104) 로 하여금 프로세서 (118) 로 신호 (116) 를 전송하여 구절 이전 또는 이후에 오디오를 포함할 수도 있는 디지털화된 오디오 스트림 (114) 을 획득하게 한다. 따라서, 사용자는 명령을 반복할 필요가 없게 되는데, 이는 프로세서 (118) 가 디지털화된 오디오 스트림 (114) 을 분석하여 적절한 응답에 대한 오디오 스트림 (102) 의 컨텍스트를 결정하기 때문이다. 또한, 추가 예에서, 단일 키워드가 "샤잠 (Shazam)" 을 포함할 수도 있다. 이와 같이, 특정 예로서, 사용자가 단어 "샤잠" 을 말할 때, 회로 (104) 는 키워드를 검출하고 신호 (116) 를 송신하여 디지털화된 오디오 스트림 (114) 을 획득하고 그 스트림을 텍스트 스트림으로 변환하도록 프로세서 (118) 에 명령할 수도 있다. 텍스트 스트림이 텍스트 메시지를 사용자의 어머니에게 작성하는 명령이라고 상정하면, 적절한 응답이 텍스트 메시지를 작성하게 될 것이다. 따라서, 상기 기재된 바와 같이, 미리 결정된 키워드 (들) 을 사용하여, 저전력 집적 회로 (104) 는 컴퓨팅 디바이스의 사용자가 웹 서치를 수행하거나 디렉션들과 같은 추가 응답을 완성할 필요가 있을 때를 인식한다.
모듈 (108) 의 추가 실시형태에서, 디지털화된 오디오 스트림 (114) 내에서 인식되는 키워드가 없을 때, 저전력 집적 회로 (104) 는 모듈 (106) 에서 디지털화되고 메모리 (112) 에 저장되는 또 다른 오디오 스트림 (102) 에 대한 모니터링을 계속한다. 또한 추가 실시형태에서, 저전력 집적 회로 (104) 는 디지털화된 오디오 스트림 (114) 을 압축하고, 이 압축된 디지털화된 오디오 스트림은 모듈 (108) 에서 키워드와 비교함으로써 키워드를 인식하기 위해 사용된다.
메모리 (112) 는 디지털화된 오디오 스트림 (114) 을 저장 및/또는 유지한다. 메모리 (112) 의 실시형태들은, 메모리 버퍼, 캐시, 비휘발성 메모리, 휘발성 메모리, 랜덤 액세스 메모리 (RAM), 전기적 소거가능 프로그램가능 리드 온니 메모리 (EEPROM), 저장 드라이브, 컴팩 디스크 ROM (CDDROM), 또는 디지털화된 오디오 스트림 (114) 을 저장 및/또는 유지할 수 있는 다른 메모리를 포함할 수도 있다.
디지털화된 오디오 스트림 (114) 은 메모리 (112) 에 저장된다. 실시형태들은 메모리 (112) 에서의 배치 이전에 압축된 디지털화된 오디오 스트림을 획득하기 위해 디지털화 모듈 (106) 이후에 오디오 스트림 (102) 을 압축하는 저전력 집적 회로 (104) 를 포함할 수도 있다. 도 1은 메모리 (112) 에 저장된 디지털화된 오디오 스트림 (114) 을 도시하지만, 디지털화된 오디오 스트림은 또한 저전력 집적 회로 (104) 상의 메모리에 저장될 수도 있다. 추가 실시형태에서, 디지털화된 오디오 스트림 (114) 은 오디오 스트림 (102) 의 미리 결정된 시간 양을 포함한다. 본 실시형태에서, 오디오 스트림 (102) 이, 몇 초 또는 몇 분과 같이 미리 결정된 시간 기간 동안 수신되면, 이런 오디오 스트림 (102) 의 미리 결정된 시간 기간이 디지털화되고 획득 및/또는 취출을 위해 프로세서 (118) 에 대하여 메모리 (112) 에 저장된다. 또한, 본 실시형태에서, 또 다른 오디오 스트림 (102) 이 저전력 집적 회로 (104) 에 의해 수신되고 디지털화될 때, 메모리에서 이전의 디지털화된 오디오 스트림이 최신의 디지털화된 오디오 스트림 (114) 으로 교체된다. 따라서, 프로세서 (118) 는 가장 최신의 오디오 스트림 (102) 을 획득 및/또는 취출한다. 본 실시형태에서, 메모리는 가장 최신의 오디오 스트림 (102) 을 제공하기 위해 선입 선출 버퍼로서 동작한다.
디지털화된 오디오 스트림 (114) 내에서 키워드를 인식하면 신호 (116) 가 저전력 집적 회로 (104) 로부터 프로세서 (118) 로 송신된다. 신호 (116) 는 전력 (122) 을 증가시키고 메모리 (112) 로부터 디지털화된 오디오 스트림 (114) 을 분석하도록 프로세서 (118) 에 명령한다. 신호 (116) 의 실시형태들은, 통신, 송신, 전기 신호, 명령, 디지털 신호, 아날로그 신호 또는 프로세서 (118) 에 대한 전력 (122) 을 증가시키는 통신의 다른 유형을 포함한다. 신호 (116) 의 추가 실시형태는 디지털화된 오디오 스트림 (114) 내에서 키워드를 인식하면 프로세서 (118) 에 송신된 인터럽트 (interrupt) 를 포함한다.
프로세서 (118) 는 전력 (122) 을 증가시키기 위해 신호 (116) 를 수신하고 디지털화된 오디오 스트림 (114) 을 획득하여 모듈 (120) 에서 분석한다. 프로세서 (118) 의 실시형태들은, 중앙 처리 유닛 (CPU), 비주얼 처리 유닛 (VPU), 마이크로프로세서, 그래픽스 처리 유닛 (GPU) 또는 디지털화된 오디오 스트림 (114) 을 분석 (120) 하기에 적절한 다른 프로그램가능 디바이스를 포함할 수도 있다.
프로세서 (118) 가 메모리 (112) 로부터 디지털화된 오디오 스트림 (114) 을 획득하면, 프로세서는 모듈 (120) 에서 디지털화된 오디오 스트림 (114) 을 분석한다. 분석 모듈 (120) 의 실시형태들은, 프로세서 (118) 가 페치, 디코딩 및/또는 실행할 수도 있는, 명령, 프로세스, 동작, 로직, 알고리즘, 테크닉, 논리 함수, 펌웨어 및/또는 소프트웨어를 포함한다. 모듈 (120) 의 부가적인 실시형태들은, 오디오 스트림 (102) 의 컨텍스트에 기초하여 적절한 응답을 결정하기 위해 디지털화된 오디오 스트림 (114) 을 텍스트 스트림으로 변환하는 것을 포함한다. 모듈 (120) 의 추가 실시형태들은, 이후 도면들에서 보여지게 되는 바와 같이 컴퓨팅 디바이스 (100) 의 사용자에게 렌더링하기 위해 응답을 결정하는 것을 포함한다.
전력 (122) 은 전기적 포텐셜의 형태로 전기 에너지를 프로세서 (118) 에 공급한다. 특히, 전력 (122) 은, 저전력 집적 회로 (104) 로부터 신호 (116) 를 수신하면, 프로세서 (118) 에 대한 전기적 에너지를 증가시킨다. 프로세서 (118) 에 대한 전력 (122) 의 증가는, 프로세서 (118) 를 웨이크 (wake) 또는 트리거 (trigger) 하여 디지털화된 오디오 스트림 (114) 을 획득한다. 전력 (122) 의 실시형태들은, 전력 공급부, 전력 관리 디바이스, 배터리, 에너지 저장소, 일렉트로메커니컬 시스템, 태양열 발전, 전력 플러그 또는 프로세서 (118) 에 전력 (122) 을 전달할 수 있는 다른 디바이스를 포함한다. 추가 실시형태에서, 전력 (122) 은 컴퓨팅 디바이스 (100) 에 전기 에너지를 공급한다.
이제, 오디오 스트림 (202) 에서 키워드가 검출될 때, 오디오 스트림 (202) 을 분석하고 전력을 증가시키기 위한 신호 (216) 를 프로세서로 송신하는 일 예의 저전력 집적 회로 (204) 의 블록 다이어그램인, 도 2를 참조한다. 저전력 집적 회로 (204) 는 디지털화 회로 (206) 를 사용하여 디지털화된 오디오 스트림 (214) 을 생성하고 비교 회로 (208) 에 의해 키워드를 검출하는 회로 (210) 를 포함하고, 디지털화된 오디오 스트림 (214) 에서 키워드를 인식하면, 신호 (216) 를 송신한다.
오디오 스트림 (202) 은 저전력 집적 회로 (204) 에 의해 수신된다. 오디오 스트림 (202) 은 도 1의 오디오 스트림 (102) 에 대한 구조와 유사할 수도 있다.
저전력 집적 회로 (204) 는 오디오 스트림 (202) 을 디지털화하고 디지털화된 오디오 스트림 (214) 을 키워드와 비교하는 회로 (210) 를 포함한다. 저전력 집적 회로 (204) 는 상기 도 1에서와 같은 저전력 집적 회로 (104) 의 기능 및 구조와 유사할 수도 있다.
회로 (210) 는 디지털화 회로 (206) 및 비교 회로 (208) 를 포함한다. 회로 (210) 의 실시형태들은 로직, 아날로그 회로, 전자 회로, 디지털 회로, 또는 오디오 스트림 (202) 을 디지털화하고 디지털화된 오디오 스트림 (214) 을 키워드와 비교할 수 있는 다른 회로를 포함한다. 추가 실시형태들에서, 회로는 독립적으로 사용될 수도 있고 그리고/또는 회로 (206 및 208) 를 패치, 디코딩, 및/또는 실행하기 위해 저전력 집적 회로 (204) 와 함께 사용될 수도 있는 어플리케이션 및/또는 펌웨어를 포함한다.
오디오 스트림 (202) 은 회로 (206) 에 의해 수신되고 디지털화되어 디지털화된 오디오 스트림 (214) 을 생성한다. 디지털화 회로 (206) 는 오디오 스트림 (202) 에 대한 변환의 일 유형이다. 또한, 디지털화 회로 (206) 는 도 1과 관련하여 기재된 바와 같은 디지털화 모듈 (106) 의 기능과 유사할 수도 있다.
저전력 집적 회로 (204) 는 오디오 스트림 (202) 을 수신하여 회로 (206) 에서 디지털화하고 디지털화된 오디오 스트림 (214) 을 생성한다. 디지털화된 오디오 스트림 (214) 은 도 1과 관련하여 기재된 바와 같은 디지털화된 오디오 스트림 (114) 에 대한 구조와 유사할 수도 있다. 게다가, 도 2가 저전력 집적 회로 (204) 의 외측에 디지털화된 오디오 스트림 (214) 을 도시하지만, 디지털화된 오디오 스트림 (214) 은 또한 저전력 집적 회로 (204) 내에 위치될 수도 있다. 저전력 집적 회로 (204) 내에 위치된 디지털화된 오디오 스트림 (214) 은 회로 (208) 에서 키워드와 비교하기 위해 사용된다. 또 다른 실시형태에서, 디지털화된 오디오 스트림 (214) 은 메모리에 저장 및/또는 유지된다.
저전력 집적 회로 (204) 의 회로 (210) 에 포함된 회로 (208) 는, 디지털화된 오디오 스트림 (214) 을 키워드와 비교한다. 또한, 208은 디지털화된 오디오 스트림 (214) 내에서 키워드를 인식하는데 사용되어 프로세서에 대한 전력을 증가시키기 위한 신호 (216) 를 송신한다. 비교 회로 (208) 는 도 1과 관련하여 기재된 바와 같은 모듈 (108) 에 대한 기능과 유사할 수도 있다.
신호 (216) 는 비교 회로 (208) 에 의해 디지털화된 오디오 스트림 (214) 내의 키워드를 인식하면 전력을 증가시키도록 디바이스에 명령한다. 신호 (216) 는 도 1의 신호 (116) 에 대한 구조 및 기능과 유사할 수도 있다. 신호 (216) 의 실시형태는 전력을 증가시키고 메모리로부터 디지털화된 오디오 스트림 (214) 을 분석하도록 프로세서에 명령하는 것을 포함한다. 본 실시형태에서, 신호 (216) 는 디지털화된 오디오 스트림 (214) 을 획득하여 회로 (208) 에서 키워드 인식에 기초하여 응답을 분석하고 결정하도록 프로세서에 명령한다.
도 3은 디지털화된 오디오 스트림 (314) 을 분석하는 일 예의 컴퓨팅 디바이스 (300) 및 디지털화된 오디오 스트림 (314) 으로부터 생성된 텍스트 스트림 (324) 을 분석하기 위해 컴퓨팅 디바이스 (300) 와 통신하는 서버 (326) 의 블록 다이어그램이다. 컴퓨팅 디바이스 (300) 는 저전력 집적 회로 (304), 메모리 (312), 프로세서 (318), 출력 디바이스 (328) 및 서버 (326) 를 포함한다. 구체적으로, 도 3은 출력 디바이스 (328) 상의 컴퓨팅 디바이스의 사용자에게 응답을 렌더링하기 위해 서버 (326) 또는 프로세서 (318) 에 의해 처리된 텍스트 스트림 (324) 을 도시한다. 컴퓨팅 디바이스 (300) 는 도 1과 관련하여 기재된 바와 같은 컴퓨팅 디바이스 (100) 의 구조 및 기능과 유사할 수도 있다.
오디오 스트림 (302) 은 컴퓨팅 디바이스 (300), 구체적으로 저전력 집적 회로 (304) 에 의해 수신된다. 오디오 스트림 (302) 은, 도 1 및 도 2에서 오디오 스트림 (102 및 202) 에 대한 구조와 각각 유사할 수도 있다.
저전력 집적 회로 (304) 는 디지털화 모듈 (306) 및 분석 모듈 (308) 을 포함한다. 일 실시형태에서, 저전력 집적 회로 (304) 는 모듈 (306 및 308) 을 구비하는 회로를 포함한다. 저전력 집적 회로 (304) 는, 도 1 및 도 2와 관련하여 기재된 저전력 집적 회로 (104 및 204) 의 구조 및 기능과 각각 유사할 수도 있다.
컴퓨팅 디바이스 (300) 에 의해 일단 수신된 오디오 스트림 (302) 은 디지털화되어 (306) 디지털화된 오디오 스트림 (314) 을 생성한다. 디지털화 모듈 (306) 은 도 1 및 도 2에서의 디지털화 모듈 (106) 및 디지털화 회로 (206) 에 대한 구조 및 기능과 각각 유사할 수도 있다. 추가 실시형태에서, 오디오 스트림 (302) 이 모듈 (306) 에서 디지털화되면, 저전력 집적 회로 (304) 는 저장 및/또는 유지를 위해 디지털화된 오디오 스트림 (314) 을 메모리 (312) 에 송신한다.
오디오 스트림 (302) 이 디지털화되면, 저전력 집적회로는 모듈 (308) 에서 디지털화된 오디오 스트림 (314) 을 분석한다. 일 실시형태에서, 모듈 (308) 은 디지털화된 오디오 스트림 (314) 과 키워드를 비교한다. 본 실시형태에서, 308은 상기 도 1에서와 같은 비교 모듈 (108) 의 기능을 포함한다.
메모리 (312) 는 저전력 집적 회로 (304) 로부터 디지털화된 오디오 스트림 (314) 을 저장한다. 일 실시형태에서, 메모리 (312) 는 미리 결정된 시간 기간 동안 수신된 디지털화된 오디오 스트림 (314) 을 유지한다. 예를 들어, 오디오 스트림 (302) 은 몇 초의 미리 결정된 시간 동안 모니터링될 수도 있으며, 이로써 이런 오디오 스트림 (302) 의 몇 초가 모듈 (306) 에서 디지털화되고 메모리 (312) 로 전송된다. 이 예에서, 메모리 (312) 는 프로세서 (318) 에 의해 취출 및/또는 획득되는 몇 초의 디지털화된 오디오 스트림 (314) 을 저장하여, 신호 (316) 를 수신하면 분석한다. 또한, 이 예에서, 또 다른 몇 초의 오디오 스트림 (302) 이 수신되고 디지털화될 때, 이런 다른 디지털화된 오디오 스트림 (314) 이 이전의 디지털화된 오디오 스트림 (314) 을 교체한다. 이것은 메모리 (312) 가 획득 및/또는 취출을 위해 프로세서 (318) 에 대한 가장 최신의 오디오 스트림 (302) 을 유지하도록 한다. 메모리 (312) 는 도 1과 관련하여 기재된 바와 같은 메모리 (112) 의 구조 및 기능과 유사할 수도 있다.
오디오 스트림 (302) 은 디지털화되어 (306) 디지털화된 오디오 스트림 (314) 을 생성한다. 디지털화된 오디오 스트림 (314) 은 메모리 (312) 에 저장 및/또는 유지된다. 일 실시형태에서, 프로세서 (318) 는 디지털화된 오디오 스트림 (314) 을 획득하여, 신호 (316) 를 수신하면 모듈 (320) 에서 분석한다. 디지털화된 오디오 스트림 (314) 은 도 1 및 도 2와 관련하여 각각 기재된 바와 같은 디지털화된 오디오 스트림 (114 및 214) 의 구조 및 기능과 유사할 수도 있다.
신호 (316) 는 전력 (322) 을 증가시키기 위해 저전력 집적 회로 (304) 로부터 프로세서 (318) 로의 송신이다. 신호 (316) 의 일 실시형태에서, 부가적으로, 디지털화된 오디오 스트림 (314) 을 획득하여 모듈 (320) 에서 분석하도록 프로세서 (318) 에 명령한다. 신호 (316) 는 도 1 및 도 2와 관련하여 각각 기재된 바와 같은 신호 (116 및 216) 의 구조 및 기능과 유사할 수도 있다.
전력 (322) 은 프로세서 (318) 및/또는 컴퓨팅 디바이스 (300) 에 전기 에너지를 공급한다. 전력 (322) 은 도 1과 관련하여 기재된 바와 같은 전력 (122) 의 구조 및 기능과 유사할 수도 있다.
프로세서 (318) 는 분석 모듈 (320) 및 텍스트 스트림 (324) 을 포함한다. 구체적으로, 프로세서 (318) 는 전력 (322) 을 증가시키기 위해 신호 (316) 를 수신한다. 이 신호 (316) 를 수신하면, 프로세서 (318) 는 디지털화된 오디오 스트림 (314) 을 획득하여 모듈 (320) 에서 분석한다. 추가 실시형태에서, 프로세서 (318) 는 디지털화된 오디오 스트림 (314) 을 텍스트 스트림 (324) 으로 변환한다. 본 실시형태에서, 텍스트 스트림 (324) 내의 텍스트는 컴퓨팅 디바이스 (300) 에 대한 응답을 지시한다. 텍스트 스트림은 알파벳, 수치 세트, 알파 수치 세트로부터의 표현들 또는 심볼들의 유한 시퀀스의 문자열이다. 예를 들어, 디지털화된 오디오 스트림 (314) 은 이진 언어일 수도 있어서, 프로세서가 이진 표현의 바이트들을 단어로 번역한다. 추가 예에서, 디지털화된 오디오 스트림 (314) 은 단어들 및/또는 숫자들로 표현되는 언어일 수도 있어서, 프로세서 (318) 는 이 언어를 프로세서 (318) 가 이해하는 텍스트로 번역한다. 응답의 실시형태들은 웹 서치의 수행, 전화 번호 다이얼링, 어플리케이션의 오픈, 텍스트의 기록, 미디어의 스트리밍, 텍스트 메시지의 작성, 디렉션들의 리스트 작성 또는 디렉션들의 스피킹을 포함한다. 추가 실시형태에서, 프로세서 (318) 는 응답을 결정하여 컴퓨팅 디바이스 (300) 의 사용자에게 렌더링한다. 프로세서 (318) 는 도 1과 관련하여 기재된 바와 같은 프로세서 (118) 의 구조 및 기능과 유사할 수도 있다.
프로세서 (318) 는 모듈 (320) 에서 저장된 디지털화된 오디오 스트림 (314) 을 분석한다. 분석 모듈 (320) 의 실시형태들은 메모리 (312) 로부터 획득된 디지털화된 오디오 스트림 (314) 을 서버 (326) 로 송신하는 것을 포함한다. 모듈 (320) 의 다른 실시형태들은, 메모리 (312) 로부터 획득된 디지털화된 오디오 스트림 (314) 을 텍스트 스트림 (324) 으로 변환하고 텍스트 스트림 (324) 을 서버 (326) 로 송신하는 것을 포함한다. 모듈 (320) 의 다른 실시형태들은, 디지털화된 오디오 스트림 (314) 을 텍스트 스트림 (324) 으로 변환하여 오디오 스트림 (302) 의 컨텍스트를 분석함으로써 적절한 응답을 결정하는 것을 포함한다. 예를 들어, 디지털화된 오디오 스트림 (314) 은 모듈 (320) 에서 텍스트 스트림 (324) 으로 변환될 수도 있고, 프로세서 (318) 는 자연어 처리를 사용하여 텍스트 스트림 (324) 내의 텍스트를 분석하여 오디오 스트림 (302) 의 컨텍스트에 기초한 적절한 응답을 결정할 수도 있다.
텍스트 스트림 (324) 은 컴퓨팅 디바이스 (300) 에 대한 적절한 응답을 결정하기 위해 텍스트를 포함한다. 일 실시형태에서, 텍스트 스트림 (324) 은 프로세서에 의해 처리되어 출력 디바이스 (328) 상의 컴퓨팅 디바이스 (300) 의 사용자에게 렌더링하기에 적절한 응답을 결정한다. 또 다른 실시형태에서, 텍스트 스트림 (324) 은 서버 (326) 에 의해 처리되어 컴퓨팅 디바이스 (300) 로 송신되는 적절한 응답을 결정한다. 본 실시형태에서, 응답은 서버 (326) 로부터 컴퓨팅 디바이스 (300) 로 전송된다. 추가 실시형태에서, 컴퓨팅 디바이스 (300) 는 컴퓨팅 디바이스 (300) 의 사용자에게 응답을 렌더링한다. 예를 들어, 텍스트 스트림 (324) 은 엄마에게 텍스트 메시지를 전송하는 것을 논의하는 텍스트를 포함할 수도 있다. 이로써, 텍스트 스트림 (324) 내의 텍스트는 컴퓨팅 디바이스 (300) 가 엄마에게 텍스트 메시지를 작성함으로써 응답하게 한다.
서버 (326) 는 네크워크를 통해 서비스들을 제공하며, 예를 들어 웹 서버, 네트워크 서버, 근거리 통신망 (LAN) 서버, 파일 서버, 또는 텍스트 스트림 (324) 를 처리하여 컴퓨팅 디바이스 (300) 로 응답을 전송하기에 적합한 임의의 다른 컴퓨팅 디바이스를 포함할 수도 있다.
출력 디바이스 (328) 는 텍스트 스트림 (324) 내의 텍스트로부터 결정된 바와 같은 응답을 컴퓨팅 디바이스 (300) 의 사용자에게 렌더링한다. 출력 디바이스 (328) 의 실시형태들은 컴퓨팅 디바이스 (300) 의 사용자에게 응답을 렌더링하기 위해 디스플레이 디바이스, 스크린, 또는 스피커를 포함한다. 엄마 예에 대해 텍스트 메시지를 유지함에 있어서, 컴퓨팅 디바이스 (300) 의 사용자는 엄마에게 작성된 텍스트 메시지를 나타내는 디스플레이 및/또는 사용자에게 텍스트 메시지를 전달하는 스피커를 포함할 수도 있다.
이제, 오디오 스트림을 수신하고 응답을 결정하기 위해 컴퓨팅 디바이스 상에서 수행되는 일 예의 방법의 플로우 챠트인, 도 4로 돌아간다. 도 4는 도 1에서와 같이 컴퓨팅 디바이스 (100) 상에서 수행되는 것으로 기재되지만, 당업자에게 자명하게 되는 다른 적절한 컴포넌트들 상에서 또한 실행될 수도 있다. 예를 들어, 도 4는 메모리 (112) 와 같은 머신 판독가능 저장 매체 상에서 실행가능한 명령들의 형태로 구현될 수도 있다.
동작 (402) 에서, 저전력 집적 회로와 함께 동작하는 컴퓨팅 디바이스는 오디오 스트림을 수신한다. 일 실시형태에 있어서, 오디오 스트림은 미리 결정된 시간 양이다. 예를 들어, 오디오 스트림은 몇 초 또는 몇 밀리 초일 수도 있다. 본 실시형태에서, 컴퓨팅 디바이스는 연속적으로 오디오를 모니터링할 수도 있다. 추가 실시형태에서, 오디오 스트림은 사용자로부터의 스피치 또는 다른 컴퓨팅 디바이스로부터의 오디오 중 적어도 하나를 포함한다.
동작 (404) 에서, 컴퓨팅 디바이스와 함께 동작하는 저전력 집적 회로는, 동작 (402) 에서 수신된 오디오 스트림을 디지털화하여 디지털화된 오디오 스트림을 생성한다. 동작 (404) 의 실시형태들은, 저전력 집적 회로와 함께 동작하는 아날로그 디지털 컨버터 (ADC), 디지털 변환 디바이스, 명령, 펌웨어, 및/또는 소프트웨어의 사용을 포함한다. 동작 (404) 의 실시형태들은 디지털화된 오디오 스트림을 메모리에 송신하는 것을 포함한다. 404의 추가 실시형태들은, 동작 (402) 에서 수신된 오디오 스트림을 압축하는 것을 포함하고, 404의 또 다른 실시형태는 디지털화된 오디오 스트림을 압축하는 것을 포함한다.
동작 (406) 에서, 동작 (404) 에서 생성된 디지털화된 오디오 스트림이 메모리에 저장된다. 동작 (406) 의 실시형태들은 디지털화된 오디오 스트림을 저장 및/또는 유지하는 메모리를 포함한다. 동작 (406) 의 또 다른 실시형태에서, 동작 (402) 에서 미리 결정된 시간 양 동안 수신된 오디오 스트림이 동작 (404) 에서 디지털화되고, 이에 따라 동작 (402) 에서 또 다른 오디오 스트림이 수신되고 동작 (404) 에서 디지털화될 때, 이런 현재의 디지털화된 오디오 스트림이 이전에 디지털화된 오디오 스트림을 대체한다. 본 실시형태에서, 메모리는 현재 시간 이전의 시간의 미리 결정된 기간 동안 수신된 저장된 디지털화된 오디오 스트림을 유지한다.
동작 (408) 에서, 저전력 집적 회로는 동작 (404) 에서 생성된 디지털화된 오디오 스트림을 분석한다. 동작 (408) 의 실시형태들은 디지털화된 오디오 스트림을 처리하는 것을 포함하고, 다른 실시형태들은 디지털화된 오디오 스트림을 키워드와 비교하는 것을 포함한다. 동작 (408) 의 이런 실시형태들에서, 저전력 집적 회로는 키워드에 대해 디지털화된 오디오 스트림을 처리한다. 디지털화된 오디오 스트림 내에서 키워드를 인식하면, 방법은 동작 (410) 으로 이동하여 신호를 송신한다. 추가 실시형태에서, 저전력 집적 회로가 디지털화된 오디오 스트림 내에서 키워드를 인식하지 않는다면, 방법은 동작 (402) 으로 되돌아간다. 또한, 추가 실시형태에서는 컴퓨팅 디바이스의 사용자가 컴퓨팅 디바이스에 의해 응답을 바라는 것을 표시하는 아날로그 또는 디지털 표현과 디지털화된 오디오 스트림을 비교하는 것을 포함한다. 또한 추가 실시형태에서, 동작들 (402, 404, 406 및 408) 은 동시에 발생한다. 예를 들어, 컴퓨팅 디바이스가 동작 (408) 에서 디지털화된 오디오 스트림을 분석한다면, 집적 회로는 동작 (402) 에서 오디오 스트림을 수신하고, 동작 (404 및 406) 에서 이 오디오 스트림을 디지털화하고 저장하는 것을 포함한다.
동작 (410) 에서, 저전력 집적 회로는 전력을 증가시키기 위한 신호를 프로세서로 송신한다. 구체적으로, 디지털화된 오디오 스트림 내에서 키워드를 인식하면, 저전력 집적 회로는 전력을 증가시키기 위한 신호를 프로세서로 송신한다. 동작 (410) 의 실시형태에서, 프로세서는 프로세서 및/또는 컴퓨팅 디바이스로 전달된 전력 또는 전기 에너지를 증가시킨다.
동작 (412) 에서, 프로세서는 동작 (406) 에서 메모리로부터 저장된 디지털화된 오디오 스트림을 획득한다. 동작 (412) 의 일 실시형태에서, 메모리는 디지털화된 오디오 스트림을 프로세서로 송신하고, 동작 (412) 의 또 다른 실시형태에서, 프로세서는 메모리로부터 디지털화된 오디오 스트림을 취출한다.
동작 (414) 에서, 프로세서는 동작 (412) 에서 획득된 디지털화된 오디오 스트림을 텍스트 스트림으로 변환한다. 디지털화된 오디오 스트림을 텍스트 스트림으로 변환한 후, 프로세서가 텍스트 스트림 내의 텍스트를 분석하여 적절한 응답을 결정한다. 동작 (414) 의 실시형태들은 스피치 투 텍스트 (STT), 보이스 투 텍스트, 디지털 투 텍스트 또는 다른 유형의 텍스트 변환을 사용하는 것을 포함한다. 동작 (414) 의 추가 실시형태는 텍스트 스트림으로의 변환 후 자연어 처리을 사용하는 것을 포함한다. 본 실시형태에서, 컴퓨팅 디바이스는 텍스트 스트림 내의 텍스트를 처리하여 동작 (402) 에서 수신된 오디오 스트림의 컨텍스트에 기초하여 적절한 응답을 결정한다. 예를 들어, 408에서 디지털화된 오디오 스트림 내에서 키워드를 검출하면, 프로세서가 동작 (412) 에서 획득하고 디지털화된 오디오 스트림이 동작 (414) 에서 텍스트 스트림으로 변환된다. 추가 예에서, 오디오 스트림은 2 개의 위치 사이의 디렉션들에 관한 대화를 포함할 수도 있으며, 따라서 이런 디지털화된 오디오 스트림이 동작 (412) 에서 텍스트 스트림으로 변환되면, 프로세서가 텍스트 스트림 내의 텍스트를 분석함으로써 적절한 응답을 결정할 수 있다.
동작 (416) 에서, 프로세서는 동작 (414) 에서 생성된 텍스트 스트림에 기초하여 응답을 결정한다. 응답의 실시형태들은, 웹 서치의 수행, 전화 번호의 다이얼링, 어플리케이션의 오픈, 텍스트의 기록, 미디어의 스트리밍, 텍스트 메시지의 작성, 디렉션들의 리스트 작성 또는 디렉션들의 스피킹을 포함한다. 일 실시형태에서, 텍스트 스트림 내의 텍스트는 프로세서에 대한 적절한 응답을 표시한다. 추가 실시형태에서, 응답은 컴퓨팅 디바이스의 사용자에게 렌더링된다. 예를 들어, 텍스트 스트림은 중국에 도착하는 방법을 문의하는 스피치를 포함할 수도 있으며, 중국으로의 그런 디렉션들이 적절한 응답이 된다. 게다가, 본 예에서, 중국으로의 디렉션들을 리스트 작성 및/또는 스피킹하는 맵 디스플레이가 포함될 수도 있다.
이제, 디지털화된 오디오 스트림을 압축하고 컴퓨팅 디바이스의 사용자에게 응답을 렌더링하기 위해 컴퓨팅 디바이스 상에서 수행된 일 예의 방법의 플로우챠트인, 도 5를 참조한다. 도 5는 상기 도 3에서와 같이 컴퓨팅 디바이스 (300) 상에서 수행되는 것으로 기재되지만, 당업자에게 자명하게 되는 바와 같은 다른 적절한 컴포넌트들 상에서 또한 실행될 수도 있다. 예를 들어, 도 5는 메모리 (312) 와 같은 머신 판독가능 저장 매체 상에서 실행가능한 명령들의 형태로 구현될 수도 있다.
동작 (502) 에서, 컴퓨팅 디바이스는 디지털화된 오디오 스트림을 압축한다. 일 실시형태에서, 동작 (502) 은 도 4에서의 동작 (406) 이전의 동작 (404) 과 함께 수행된다. 예를 들어, 수신된 오디오 스트림을 디지털화하면, 컴퓨팅 디바이스와 함께 저전력 집적 회로 동작이 디지털화된 오디오 스트림을 압축하여 스트림의 데이터 바이트 크기를 감소시킬 수도 있다. 본 예에서, 디지털화된 오디오 스트림의 압축은 동작 (406) 에서 메모리에 저장되기 전에 발생한다. 추가 실시형태에서, 동작 (502) 은 도 4에서의 동작 (412) 에서 디지털화된 오디오 스트림을 수신하기 전에 수행된다. 예를 들어, 프로세서는 동작 (502) 을 수행하여 메모리로부터 디지털화된 오디오 스트림을 압축할 수도 있으며, 또 다른 예에서는, 프로세서가 디지털화된 오디오 스트림을 획득하기 전에 메모리가 디지털화된 오디오 스트림을 압축할 수도 있다. 또한, 동작 (502) 의 추가 실시형태에서, 압축된 디지털화된 오디오 스트림은 도 4의 동작 (408) 에서와 같이 키워드를 인식하기 위해 분석된다.
동작 (504) 에서, 컴퓨팅 디바이스는 컴퓨팅 디바이스의 사용자에게 응답을 렌더링한다. 동작 (504) 의 실시형태들은 도 4에서의 동작 (416) 동안 또는 이후에 발생하는 것을 포함한다. 예를 들어, 프로세서가 적절한 응답을 결정하면, 이 응답은 컴퓨팅 디바이스의 사용자에게 렌더링될 수도 있다. 추가 실시형태에서, 응답은 컴퓨팅 디바이스와 함께 동작하는, 디스플레이 스크린 또는 스피커와 같은 출력 장치 상에서 사용자에게 렌더링될 수도 있다. 예를 들어, 사용자가 쉬림프와 프라운 사이의 차이를 논의할 때, 프로세서는 웹 서치 어플리케이션을 론칭할 수도 있으며, 이에 따라 쉬림프와 프라운 사이의 차이에 대한 웹 서치를 수행한다. 수행된 웹 서치는 컴퓨팅 디바이스의 디스플레이 상에서 사용자에게 렌더링 될 수도 있다. 추가 예에서, 컴퓨팅 디바이스는 스피커를 통해 사용자에게 쉬림프와 프라운 사이의 차이들을 가청으로 열거한다. 이 실시형태들에서, 컴퓨팅 디바이스는 사용자가 컴퓨팅 디바이스에 명령하는 대신 응답을 결정하기 위해 오디오 스트림과 동작한다.
본 명세서에 상세하게 기재된 실시형태들은 키워드를 검출하기 위해 그리고 디지털화된 오디오 스트림 내에서 키워드의 인식에 기초하여 오디오 스트림을 디지털화하고, 전력을 증가시키기 위한 신호를 프로세서에 송신하며, 또한 응답을 결정하기 위해 디지털화된 오디오 스트림을 분석하는 것과 관련된다. 이러한 방식으로, 예시의 실시형태들은 컴퓨팅 디바이스의 전력 소모를 감소시키면서, 컴퓨팅 디바이스로의 반복적인 오디오 명령들을 방지함으로써 사용자 시간을 절약한다.
Claims (1)
- 오디오 정보를 프로세싱하는 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020217042960A KR20220002750A (ko) | 2011-12-07 | 2011-12-07 | 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/US2011/063804 WO2013085507A1 (en) | 2011-12-07 | 2011-12-07 | Low power integrated circuit to analyze a digitized audio stream |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020187036622A Division KR20180137041A (ko) | 2011-12-07 | 2011-12-07 | 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217042960A Division KR20220002750A (ko) | 2011-12-07 | 2011-12-07 | 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20200074260A true KR20200074260A (ko) | 2020-06-24 |
Family
ID=48574720
Family Applications (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020167007578A KR20160036104A (ko) | 2011-12-07 | 2011-12-07 | 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로 |
KR1020187036622A KR20180137041A (ko) | 2011-12-07 | 2011-12-07 | 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로 |
KR1020147018606A KR20140106656A (ko) | 2011-12-07 | 2011-12-07 | 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로 |
KR1020207017179A KR20200074260A (ko) | 2011-12-07 | 2011-12-07 | 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로 |
KR1020217042960A KR20220002750A (ko) | 2011-12-07 | 2011-12-07 | 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로 |
Family Applications Before (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020167007578A KR20160036104A (ko) | 2011-12-07 | 2011-12-07 | 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로 |
KR1020187036622A KR20180137041A (ko) | 2011-12-07 | 2011-12-07 | 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로 |
KR1020147018606A KR20140106656A (ko) | 2011-12-07 | 2011-12-07 | 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217042960A KR20220002750A (ko) | 2011-12-07 | 2011-12-07 | 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로 |
Country Status (8)
Country | Link |
---|---|
US (4) | US9564131B2 (ko) |
EP (2) | EP3748631B1 (ko) |
JP (1) | JP2015501106A (ko) |
KR (5) | KR20160036104A (ko) |
CN (1) | CN104254884B (ko) |
BR (1) | BR112014013832B1 (ko) |
IN (1) | IN2014CN04097A (ko) |
WO (1) | WO2013085507A1 (ko) |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9992745B2 (en) | 2011-11-01 | 2018-06-05 | Qualcomm Incorporated | Extraction and analysis of buffered audio data using multiple codec rates each greater than a low-power processor rate |
KR20160036104A (ko) | 2011-12-07 | 2016-04-01 | 퀄컴 인코포레이티드 | 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로 |
US9704486B2 (en) | 2012-12-11 | 2017-07-11 | Amazon Technologies, Inc. | Speech recognition power management |
US9697831B2 (en) * | 2013-06-26 | 2017-07-04 | Cirrus Logic, Inc. | Speech recognition |
US20150074524A1 (en) * | 2013-09-10 | 2015-03-12 | Lenovo (Singapore) Pte. Ltd. | Management of virtual assistant action items |
US9245527B2 (en) | 2013-10-11 | 2016-01-26 | Apple Inc. | Speech recognition wake-up of a handheld portable electronic device |
US10079019B2 (en) | 2013-11-12 | 2018-09-18 | Apple Inc. | Always-on audio control for mobile device |
US9460735B2 (en) * | 2013-12-28 | 2016-10-04 | Intel Corporation | Intelligent ancillary electronic device |
US10031000B2 (en) | 2014-05-29 | 2018-07-24 | Apple Inc. | System on a chip with always-on processor |
US9653079B2 (en) * | 2015-02-12 | 2017-05-16 | Apple Inc. | Clock switching in always-on component |
US10452339B2 (en) | 2015-06-05 | 2019-10-22 | Apple Inc. | Mechanism for retrieval of previously captured audio |
CN105869654B (zh) * | 2016-03-29 | 2020-12-04 | 阿里巴巴集团控股有限公司 | 音频消息的处理方法及装置 |
US10403279B2 (en) * | 2016-12-21 | 2019-09-03 | Avnera Corporation | Low-power, always-listening, voice command detection and capture |
US10276161B2 (en) * | 2016-12-27 | 2019-04-30 | Google Llc | Contextual hotwords |
US10319375B2 (en) * | 2016-12-28 | 2019-06-11 | Amazon Technologies, Inc. | Audio message extraction |
US10121494B1 (en) * | 2017-03-30 | 2018-11-06 | Amazon Technologies, Inc. | User presence detection |
US11270198B2 (en) | 2017-07-31 | 2022-03-08 | Syntiant | Microcontroller interface for audio signal processing |
CN107895573B (zh) * | 2017-11-15 | 2021-08-24 | 百度在线网络技术(北京)有限公司 | 用于识别信息的方法及装置 |
EP4361894A1 (en) * | 2017-12-28 | 2024-05-01 | Syntiant | Always-on keyword detector |
KR20210052035A (ko) * | 2019-10-31 | 2021-05-10 | 엘지전자 주식회사 | 저전력 음성 인식 장치 및 방법 |
US11269592B2 (en) * | 2020-02-19 | 2022-03-08 | Qualcomm Incorporated | Systems and techniques for processing keywords in audio data |
IT202000005875A1 (it) | 2020-03-19 | 2021-09-19 | Radio Dimensione Suono Spa | Sistema e metodo di arricchimento automatico di informazioni per flussi audio |
GB2605121A (en) * | 2021-02-08 | 2022-09-28 | Prevayl Innovations Ltd | An electronics module for a wearable articel, a systemm, and a method of activation of an electronics module for a wearable article |
IT202100017351A1 (it) | 2021-07-01 | 2023-01-01 | Artisti Riuniti S R L | Sistema e dispositivo di condivisione di contenuti artistico-teatrali in formato digitale tra account geolocalizzati |
US11915698B1 (en) * | 2021-09-29 | 2024-02-27 | Amazon Technologies, Inc. | Sound source localization |
Family Cites Families (98)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5278944A (en) | 1992-07-15 | 1994-01-11 | Kokusai Electric Co., Ltd. | Speech coding circuit |
JPH07121195A (ja) | 1993-10-25 | 1995-05-12 | Sony Corp | 音声処理用ディジタルシグナルプロセッサ |
JPH07244494A (ja) | 1994-03-04 | 1995-09-19 | Ricoh Co Ltd | 音声認識装置 |
US6070140A (en) * | 1995-06-05 | 2000-05-30 | Tran; Bao Q. | Speech recognizer |
US5721938A (en) | 1995-06-07 | 1998-02-24 | Stuckey; Barbara K. | Method and device for parsing and analyzing natural language sentences and text |
JP3674990B2 (ja) * | 1995-08-21 | 2005-07-27 | セイコーエプソン株式会社 | 音声認識対話装置および音声認識対話処理方法 |
US5946050A (en) * | 1996-10-04 | 1999-08-31 | Samsung Electronics Co., Ltd. | Keyword listening device |
JP3726448B2 (ja) | 1997-03-12 | 2005-12-14 | セイコーエプソン株式会社 | 認識対象音声検出方法およびその装置 |
US6101473A (en) * | 1997-08-08 | 2000-08-08 | Board Of Trustees, Leland Stanford Jr., University | Using speech recognition to access the internet, including access via a telephone |
EP0962014B1 (en) * | 1997-12-30 | 2003-11-12 | Koninklijke Philips Electronics N.V. | Speech recognition device using a command lexicon |
GB2342828A (en) | 1998-10-13 | 2000-04-19 | Nokia Mobile Phones Ltd | Speech parameter compression; distributed speech recognition |
JP4812941B2 (ja) * | 1999-01-06 | 2011-11-09 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 注目期間を有する音声入力装置 |
US6408272B1 (en) * | 1999-04-12 | 2002-06-18 | General Magic, Inc. | Distributed voice user interface |
US6332120B1 (en) | 1999-04-20 | 2001-12-18 | Solana Technology Development Corporation | Broadcast speech recognition system for keyword monitoring |
US6393572B1 (en) | 1999-04-28 | 2002-05-21 | Philips Electronics North America Corporation | Sleepmode activation in a slave device |
JP2000315097A (ja) * | 1999-04-30 | 2000-11-14 | Canon Inc | 電子機器、その制御方法、及び記録媒体 |
US6594630B1 (en) | 1999-11-19 | 2003-07-15 | Voice Signal Technologies, Inc. | Voice-activated control for electrical device |
US8108218B1 (en) | 1999-12-13 | 2012-01-31 | Avaya Inc. | Methods and apparatus for voice recognition for call treatment modification on messaging |
KR100340045B1 (ko) | 1999-12-24 | 2002-06-12 | 오길록 | 저전력 음성 명령어 구동 휴대 정보단말 장치 및 그를 이용한 음성인식 방법 |
KR100447667B1 (ko) | 2000-04-12 | 2004-09-08 | 이경목 | 음성 인식 기능을 갖는 컴퓨터와 학습용 인형들을 이용한 상호 대화 언어 학습 시스템 |
JP2002123283A (ja) | 2000-10-12 | 2002-04-26 | Nissan Motor Co Ltd | 音声認識操作装置 |
US20020077830A1 (en) | 2000-12-19 | 2002-06-20 | Nokia Corporation | Method for activating context sensitive speech recognition in a terminal |
WO2002073600A1 (en) | 2001-03-14 | 2002-09-19 | International Business Machines Corporation | Method and processor system for processing of an audio signal |
US8266451B2 (en) | 2001-08-31 | 2012-09-11 | Gemalto Sa | Voice activated smart card |
US6987947B2 (en) | 2001-10-30 | 2006-01-17 | Unwired Technology Llc | Multiple channel wireless communication system |
US6895257B2 (en) * | 2002-02-18 | 2005-05-17 | Matsushita Electric Industrial Co., Ltd. | Personalized agent for portable devices and cellular phone |
KR100594140B1 (ko) | 2002-04-13 | 2006-06-28 | 삼성전자주식회사 | 무선통신시스템의 패킷 데이터 서비스 방법 |
TWI225640B (en) | 2002-06-28 | 2004-12-21 | Samsung Electronics Co Ltd | Voice recognition device, observation probability calculating device, complex fast fourier transform calculation device and method, cache device, and method of controlling the cache device |
JP2004226698A (ja) * | 2003-01-23 | 2004-08-12 | Yaskawa Electric Corp | 音声認識装置 |
JP2004265217A (ja) | 2003-03-03 | 2004-09-24 | Nec Corp | 音声認識機能を有する移動通信端末とその端末を利用したキーワード検索方法 |
KR20050110021A (ko) * | 2003-03-17 | 2005-11-22 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 디바이스의 원격 제어 방법 |
JP2004294946A (ja) | 2003-03-28 | 2004-10-21 | Toshiba Corp | 携帯型電子機器 |
JP4301896B2 (ja) | 2003-08-22 | 2009-07-22 | シャープ株式会社 | 信号分析装置、音声認識装置、プログラム、記録媒体、並びに電子機器 |
TWI222837B (en) | 2003-10-14 | 2004-10-21 | Design Technology Inc G | Audio signal compression processing device to with reduced power consumption |
TWI235358B (en) | 2003-11-21 | 2005-07-01 | Acer Inc | Interactive speech method and system thereof |
EP1562180B1 (en) | 2004-02-06 | 2015-04-01 | Nuance Communications, Inc. | Speech dialogue system and method for controlling an electronic device |
CN100365727C (zh) | 2004-03-26 | 2008-01-30 | 胡红 | 一种无线感应音频播放器 |
US20060074658A1 (en) * | 2004-10-01 | 2006-04-06 | Siemens Information And Communication Mobile, Llc | Systems and methods for hands-free voice-activated devices |
KR101221172B1 (ko) | 2005-02-03 | 2013-01-11 | 뉘앙스 커뮤니케이션즈, 인코포레이티드 | 이동 통신 장치의 음성 어휘를 자동으로 확장하는 방법 및장치 |
US20090222270A2 (en) | 2006-02-14 | 2009-09-03 | Ivc Inc. | Voice command interface device |
JP2007219207A (ja) * | 2006-02-17 | 2007-08-30 | Fujitsu Ten Ltd | 音声認識装置 |
JP2007255897A (ja) * | 2006-03-20 | 2007-10-04 | Clarion Co Ltd | ナビゲーションシステム並びに装置、その制御方法及び制御プログラム |
US7756708B2 (en) * | 2006-04-03 | 2010-07-13 | Google Inc. | Automatic language model update |
WO2007117626A2 (en) * | 2006-04-05 | 2007-10-18 | Yap, Inc. | Hosted voice recognition system for wireless devices |
US20070254680A1 (en) | 2006-05-01 | 2007-11-01 | Shary Nassimi | Wirefree intercom having low power system and process |
KR100744301B1 (ko) * | 2006-06-01 | 2007-07-30 | 삼성전자주식회사 | 음성 인식을 이용하여 동작 모드를 전환하는 휴대 단말기및 그 방법 |
US8207936B2 (en) | 2006-06-30 | 2012-06-26 | Sony Ericsson Mobile Communications Ab | Voice remote control |
EP1879000A1 (en) * | 2006-07-10 | 2008-01-16 | Harman Becker Automotive Systems GmbH | Transmission of text messages by navigation systems |
EP1939860B1 (en) | 2006-11-30 | 2009-03-18 | Harman Becker Automotive Systems GmbH | Interactive speech recognition system |
US8150044B2 (en) | 2006-12-31 | 2012-04-03 | Personics Holdings Inc. | Method and device configured for sound signature detection |
US9760146B2 (en) | 2007-01-08 | 2017-09-12 | Imagination Technologies Limited | Conditional activation and deactivation of a microprocessor |
WO2008095167A2 (en) | 2007-02-01 | 2008-08-07 | Personics Holdings Inc. | Method and device for audio recording |
US7818176B2 (en) | 2007-02-06 | 2010-10-19 | Voicebox Technologies, Inc. | System and method for selecting and presenting advertisements based on natural language processing of voice-based input |
US20080221884A1 (en) * | 2007-03-07 | 2008-09-11 | Cerra Joseph P | Mobile environment speech processing facility |
US7774626B2 (en) | 2007-03-29 | 2010-08-10 | Intel Corporation | Method to control core duty cycles using low power modes |
EP2045798B1 (en) * | 2007-03-29 | 2014-12-03 | Panasonic Intellectual Property Corporation of America | Keyword extracting device |
EP1978765A1 (en) | 2007-04-02 | 2008-10-08 | BRITISH TELECOMMUNICATIONS public limited company | Power management scheme for mobile communication devices |
WO2008124786A2 (en) | 2007-04-09 | 2008-10-16 | Personics Holdings Inc. | Always on headwear recording system |
JP2008309864A (ja) | 2007-06-12 | 2008-12-25 | Fujitsu Ten Ltd | 音声認識装置および音声認識方法 |
CN101076099B (zh) | 2007-06-14 | 2010-06-09 | 北京中星微电子有限公司 | 一种视频录制的控制方法、装置和同步控制单元 |
US20090055005A1 (en) | 2007-08-23 | 2009-02-26 | Horizon Semiconductors Ltd. | Audio Processor |
US8725520B2 (en) | 2007-09-07 | 2014-05-13 | Qualcomm Incorporated | Power efficient batch-frame audio decoding apparatus, system and method |
CN101483683A (zh) | 2008-01-08 | 2009-07-15 | 宏达国际电子股份有限公司 | 手持装置及其语音识别方法 |
US8483854B2 (en) | 2008-01-28 | 2013-07-09 | Qualcomm Incorporated | Systems, methods, and apparatus for context processing using multiple microphones |
US8050932B2 (en) | 2008-02-20 | 2011-11-01 | Research In Motion Limited | Apparatus, and associated method, for selecting speech COder operational rates |
US20090234655A1 (en) | 2008-03-13 | 2009-09-17 | Jason Kwon | Mobile electronic device with active speech recognition |
KR20090107365A (ko) | 2008-04-08 | 2009-10-13 | 엘지전자 주식회사 | 이동 단말기 및 그 메뉴 제어방법 |
US20090259865A1 (en) | 2008-04-11 | 2009-10-15 | Qualcomm Incorporated | Power Management Using At Least One Of A Special Purpose Processor And Motion Sensing |
JP5327838B2 (ja) * | 2008-04-23 | 2013-10-30 | Necインフロンティア株式会社 | 音声入力分散処理方法及び音声入力分散処理システム |
US8244528B2 (en) * | 2008-04-25 | 2012-08-14 | Nokia Corporation | Method and apparatus for voice activity determination |
CA2665055C (en) | 2008-05-23 | 2018-03-06 | Accenture Global Services Gmbh | Treatment processing of a plurality of streaming voice signals for determination of responsive action thereto |
US8488799B2 (en) | 2008-09-11 | 2013-07-16 | Personics Holdings Inc. | Method and system for sound monitoring over a network |
JP2010136292A (ja) | 2008-12-08 | 2010-06-17 | Toshiba Corp | 画像処理装置 |
WO2010078386A1 (en) | 2008-12-30 | 2010-07-08 | Raymond Koverzin | Power-optimized wireless communications device |
JP4809454B2 (ja) | 2009-05-17 | 2011-11-09 | 株式会社半導体理工学研究センター | 発話推定による回路起動方法及び回路起動装置 |
US20110066431A1 (en) | 2009-09-15 | 2011-03-17 | Mediatek Inc. | Hand-held input apparatus and input method for inputting data to a remote receiving device |
JP2011071937A (ja) * | 2009-09-28 | 2011-04-07 | Kyocera Corp | 電子機器 |
US20110099507A1 (en) | 2009-10-28 | 2011-04-28 | Google Inc. | Displaying a collection of interactive elements that trigger actions directed to an item |
CN102118886A (zh) | 2010-01-04 | 2011-07-06 | 中国移动通信集团公司 | 一种语音信息的识别方法和设备 |
CN201752079U (zh) | 2010-01-15 | 2011-02-23 | 硕呈科技股份有限公司 | 待命模式的电源变动唤醒装置 |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
KR20110110434A (ko) | 2010-04-01 | 2011-10-07 | 삼성전자주식회사 | 저전력 오디오 재생장치 및 방법 |
KR101733205B1 (ko) | 2010-04-05 | 2017-05-08 | 삼성전자주식회사 | 오디오 디코딩 시스템 및 그것의 오디오 디코딩 방법 |
US9112989B2 (en) * | 2010-04-08 | 2015-08-18 | Qualcomm Incorporated | System and method of smart audio logging for mobile devices |
US8359020B2 (en) | 2010-08-06 | 2013-01-22 | Google Inc. | Automatically monitoring for voice input based on context |
CN101968791B (zh) | 2010-08-10 | 2012-12-26 | 深圳市飘移网络技术有限公司 | 一种数据存储方法及装置 |
CN101938391A (zh) | 2010-08-31 | 2011-01-05 | 中山大学 | 一种处理语音的方法、系统、遥控器、机顶盒、云服务器 |
US8606293B2 (en) | 2010-10-05 | 2013-12-10 | Qualcomm Incorporated | Mobile device location estimation using environmental information |
US9443511B2 (en) | 2011-03-04 | 2016-09-13 | Qualcomm Incorporated | System and method for recognizing environmental sound |
US8798995B1 (en) | 2011-09-23 | 2014-08-05 | Amazon Technologies, Inc. | Key word determinations from voice data |
US8924219B1 (en) | 2011-09-30 | 2014-12-30 | Google Inc. | Multi hotword robust continuous voice command detection in mobile devices |
US9992745B2 (en) * | 2011-11-01 | 2018-06-05 | Qualcomm Incorporated | Extraction and analysis of buffered audio data using multiple codec rates each greater than a low-power processor rate |
US9031847B2 (en) | 2011-11-15 | 2015-05-12 | Microsoft Technology Licensing, Llc | Voice-controlled camera operations |
US8666751B2 (en) * | 2011-11-17 | 2014-03-04 | Microsoft Corporation | Audio pattern matching for device activation |
KR20160036104A (ko) | 2011-12-07 | 2016-04-01 | 퀄컴 인코포레이티드 | 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로 |
DE102013001219B4 (de) * | 2013-01-25 | 2019-08-29 | Inodyn Newmedia Gmbh | Verfahren und System zur Sprachaktivierung eines Software-Agenten aus einem Standby-Modus |
US10672387B2 (en) * | 2017-01-11 | 2020-06-02 | Google Llc | Systems and methods for recognizing user speech |
US10405082B2 (en) | 2017-10-23 | 2019-09-03 | Staton Techiya, Llc | Automatic keyword pass-through system |
-
2011
- 2011-12-07 KR KR1020167007578A patent/KR20160036104A/ko not_active Application Discontinuation
- 2011-12-07 EP EP20188767.6A patent/EP3748631B1/en active Active
- 2011-12-07 JP JP2014545864A patent/JP2015501106A/ja not_active Withdrawn
- 2011-12-07 US US14/363,783 patent/US9564131B2/en active Active
- 2011-12-07 KR KR1020187036622A patent/KR20180137041A/ko active Application Filing
- 2011-12-07 IN IN4097CHN2014 patent/IN2014CN04097A/en unknown
- 2011-12-07 CN CN201180076332.2A patent/CN104254884B/zh active Active
- 2011-12-07 KR KR1020147018606A patent/KR20140106656A/ko active Application Filing
- 2011-12-07 BR BR112014013832-0A patent/BR112014013832B1/pt active IP Right Grant
- 2011-12-07 KR KR1020207017179A patent/KR20200074260A/ko not_active Application Discontinuation
- 2011-12-07 WO PCT/US2011/063804 patent/WO2013085507A1/en active Application Filing
- 2011-12-07 EP EP11877053.6A patent/EP2788978B1/en active Active
- 2011-12-07 KR KR1020217042960A patent/KR20220002750A/ko not_active Application Discontinuation
-
2017
- 2017-01-06 US US15/400,817 patent/US10381007B2/en active Active
-
2019
- 2019-06-26 US US16/453,779 patent/US11069360B2/en active Active
-
2021
- 2021-06-14 US US17/347,434 patent/US11810569B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US9564131B2 (en) | 2017-02-07 |
EP3748631C0 (en) | 2024-04-03 |
IN2014CN04097A (ko) | 2015-07-10 |
EP3748631A2 (en) | 2020-12-09 |
KR20220002750A (ko) | 2022-01-06 |
US20170116992A1 (en) | 2017-04-27 |
EP2788978B1 (en) | 2020-09-23 |
EP2788978A1 (en) | 2014-10-15 |
BR112014013832B1 (pt) | 2021-05-25 |
US10381007B2 (en) | 2019-08-13 |
US20150162002A1 (en) | 2015-06-11 |
BR112014013832A2 (pt) | 2017-06-13 |
EP2788978A4 (en) | 2015-10-28 |
US20210304770A1 (en) | 2021-09-30 |
WO2013085507A1 (en) | 2013-06-13 |
KR20180137041A (ko) | 2018-12-26 |
EP3748631A3 (en) | 2021-05-05 |
KR20160036104A (ko) | 2016-04-01 |
US11069360B2 (en) | 2021-07-20 |
US11810569B2 (en) | 2023-11-07 |
KR20140106656A (ko) | 2014-09-03 |
US20190385612A1 (en) | 2019-12-19 |
CN104254884A (zh) | 2014-12-31 |
BR112014013832A8 (pt) | 2017-06-13 |
CN104254884B (zh) | 2017-10-24 |
JP2015501106A (ja) | 2015-01-08 |
EP3748631B1 (en) | 2024-04-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11810569B2 (en) | Low power integrated circuit to analyze a digitized audio stream | |
CN111566730B (zh) | 低功率设备中的语音命令处理 | |
US11244672B2 (en) | Speech recognition method and apparatus, and storage medium | |
US20170243585A1 (en) | System and method of analyzing audio data samples associated with speech recognition | |
US9613626B2 (en) | Audio device for recognizing key phrases and method thereof | |
US20160125883A1 (en) | Speech recognition client apparatus performing local speech recognition | |
US11348583B2 (en) | Data processing method and apparatus for intelligent device, and storage medium | |
JP2021196599A (ja) | 情報を出力するための方法および装置 | |
CN110992955A (zh) | 一种智能设备的语音操作方法、装置、设备及存储介质 | |
CN113963695A (zh) | 一种智能设备的唤醒方法、装置、设备及存储介质 | |
JP6728507B2 (ja) | デジタル化された音声ストリームを分析するための低電力集積回路 | |
JP6833659B2 (ja) | デジタル化された音声ストリームを分析するための低電力集積回路 | |
CN111028832B (zh) | 麦克风静音模式控制方法、装置及存储介质和电子设备 | |
CN118411988A (zh) | 语音交互方法及电子设备 | |
CN113038216A (zh) | 指令获得方法、电视机、服务器以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
E902 | Notification of reason for refusal | ||
E90F | Notification of reason for final refusal | ||
E601 | Decision to refuse application | ||
J201 | Request for trial against refusal decision | ||
J301 | Trial decision |
Free format text: TRIAL NUMBER: 2021101003317; TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20211228 Effective date: 20220303 |